Meta exec denies the company artificially boosted Llama 4’s benchmark scores

Cyber Security, ICT, Most Popular, Trends News

April 8, 2025

No Comments

By Karla T Vasquez

WhatsApp Group Join Now

Telegram Group Join Now

সোমবার একটি মেটা এক্সিকিউটিভ একটি গুজব অস্বীকার করেছে যে সংস্থাটি তার নতুন এআই মডেলগুলিকে মডেলগুলির দুর্বলতাগুলি গোপন করার সময় নির্দিষ্ট মানদণ্ডগুলিতে ভালভাবে উপস্থাপনের জন্য প্রশিক্ষণ দিয়েছে।

নির্বাহী, আহমদ আল-ডাহলে, মেটায় জেনারেটরি এআইয়ের ভিপি, এক্স এ একটি পোস্টে বলেছেন এটি “কেবল সত্য নয়” যে মেটা তার লামা 4 ম্যাভেরিক এবং লামা 4 স্কাউট মডেলগুলিকে “পরীক্ষার সেট” তে প্রশিক্ষণ দিয়েছে। এআই বেঞ্চমার্কগুলিতে, পরীক্ষার সেটগুলি কোনও মডেলের প্রশিক্ষণের পরে কার্যকারিতা মূল্যায়নের জন্য ব্যবহৃত ডেটা সংগ্রহ। একটি পরীক্ষার সেটে প্রশিক্ষণ কোনও মডেলের বেঞ্চমার্ক স্কোরকে বিভ্রান্ত করে ছড়িয়ে দিতে পারে, যা মডেলটিকে বাস্তবে তার চেয়ে বেশি সক্ষম করে তোলে।

সপ্তাহান্তে, একটি অসমর্থিত গুজব এই মেটা কৃত্রিমভাবে তার নতুন মডেলগুলির বেঞ্চমার্কের ফলাফলগুলি এক্স এবং রেডডিটের উপর প্রচারিত হতে শুরু করে। এই গুজবটি কোনও ব্যবহারকারীর কাছ থেকে একটি চীনা সোশ্যাল মিডিয়া সাইটে একটি পোস্ট থেকে উদ্ভূত হয়েছে বলে মনে হয় যে কোম্পানির মানদণ্ডের অনুশীলনগুলির প্রতিবাদে মেটা থেকে পদত্যাগ করেছেন বলে দাবি করেছেন।

যে ম্যাভেরিক এবং স্কাউট রিপোর্ট পারফর্ম খারাপ চালু নির্দিষ্ট কাজ গুজবটিকে আরও বাড়িয়ে তুলেছিল, যেমনটি বেঞ্চমার্ক এলএম অঙ্গনে আরও ভাল স্কোর অর্জনের জন্য ম্যাভেরিকের একটি পরীক্ষামূলক, অপ্রকাশিত সংস্করণ ব্যবহার করার সিদ্ধান্ত নিয়েছিল। এক্স এর গবেষকরা আছে স্টার্ক পর্যবেক্ষণ আচরণে পার্থক্য এলএম অ্যারেনায় হোস্ট করা মডেলের সাথে তুলনা করে সর্বজনীনভাবে ডাউনলোডযোগ্য ম্যাভেরিকের।

আল-ডাহলে স্বীকার করেছেন যে কিছু ব্যবহারকারী মডেলগুলি হোস্টিং বিভিন্ন ক্লাউড সরবরাহকারীদের জুড়ে ম্যাভেরিক এবং স্কাউট থেকে “মিশ্র গুণ” দেখছেন।

আল-ডাহলে বলেছিলেন, “যেহেতু আমরা মডেলগুলি প্রস্তুত হওয়ার সাথে সাথেই বাদ দিয়েছি, আমরা আশা করি যে সমস্ত জনসাধারণের বাস্তবায়ন ডায়াল করতে বেশ কয়েক দিন সময় লাগবে,” আল-ডাহলে বলেছিলেন। “আমরা আমাদের বাগ ফিক্স এবং অন বোর্ডিং অংশীদারদের মাধ্যমে কাজ চালিয়ে যাব।”