بنچمارک و هوش مصنوعی


نوشته و ویرایش شده توسط مجله ی دریای تکنولوژی

پژوهش تازه محققان دانشگاه پرینستون نقص‌های بسیاری را در بنچمارک‌های هوش مصنوعی و روشهای برسی آن‌ها نشان داده است که مانع می‌بشود در بازدید برنامه‌های کاربردی در دنیای واقعی سودمند باشند. محققان پافشاری دارند که این بنچمارک‌ها نسبت هزینه جواب‌دادن مدل هوش مصنوعی به دقت آن را در نظر نمی‌گیرند.

بر پایه گزارش VentureBeat، سنجش مدل‌های گوناگون هوش مصنوعی با بنچمارک‌های ثابت نمی‌تواند نتایج صحیحی در دنیای واقعی اراعه دهد. یکی از مسائل مهمی که محققان در پژوهش خود بر آن پافشاری می‌کنند، درنظرنگرفتن شیوه کنترل هزینه در مدل‌های هوش مصنوعی گوناگون است.

به‌طورکلی محققان هشدار خواهند داد که این خطاها علتمی‌بشود دقت هوش مصنوعی غلط تخمین زده بشود و درمورد قابلیت‌های هوش مصنوعی خوش‌بینی بیش‌ازحد باشد.

بنچمارک‌های گمراه‌کننده در برسی هوش مصنوعی

برای افزایش دقت، برخی سیستم‌های هوش مصنوعی چندین جواب تشکیل می‌کنند و از مکانیسم‌هایی مختلفی برای انتخاب بهترین جواب منفعت می‌برند. بعضی اوقات مثالبرداری از صدها یا هزاران جواب می‌تواند دقت هوش مصنوعی را افزایش دهد. درحالی‌که این رویکرد می‌تواند کارکرد را بهبود بخشد، هزینه محاسباتی قابل‌توجهی دارد. این هزینه‌ها در موارد تحقیقاتی که مقصد به حداکثررساندن دقت است، مشکل‌ساز نیست.

ادامه مطلب
سامسونگ و هواوی به گمان زیادً سال 2024 تلفنهای تاشو بین‌رده اراعه می‌کنند
آخرین مطالب

یقیناً در کاربردهای عمومی، بودجه هر خواست محدودیتی ندارد. یقیناً امکان پذیر در برخی موارد برای بالابردن رتبه‌بندی هوش مصنوعی خاصی، از مکانیسم‌های پرهزینه هوش مصنوعی برای افزایش دقت منفعت گیری بشود.

محققان می‌گویند باید بین برسی مدل‌ها با اهداف تحقیقاتی و مدل‌های کاربردی عمومی تفاوت قایل شد. در تحقیقات، دقت اهمیت دارد و هزینه‌های هوش مصنوعی تا حد بسیاری نادیده گرفته می‌بشود. بااین‌حال، زمان گسترش برنامه‌های کاربردی در دنیای واقعی، هزینه‌ها نقش مهمی در شیوه جواب‌دهی مدل هوش مصنوعی ایفا می‌کند.

برای نمونه، محققان مطالعه‌ای موردی روی بنچمارک NovelQA (معیاری برای پاسخگویی به سؤالات در متون زیاد طویل) انجام دادند. آن‌ها دریافتند امکان پذیر این معیار در برسی مدل‌های کاربردی عمومی گمراه‌کننده باشد.

ادامه مطلب
جوزپه پیاتسی، سیارک سرس را کشف کرد

از سویی، در یادگیری تسک‌های تازه، مدل‌های یادگیری ماشینی زیاد تر میانبرهایی اشکار می‌کنند که به آن‌ها اجازه می‌دهد در بنچمارک‌ها امتیاز خوبی کسب کنند. به‌عبارتی، این مدل‌ها راه‌هایی برای تقلب در آزمون‌های بنچمارک اشکار می‌کند و نتایجی اراعه می‌دهد که در دنیای واقعی صحیح نیست.

دسته بندی مطالب
مقالات کسب وکار

مقالات تکنولوژی

مقالات آموزشی

تندرستی و سلامتی