نوشته و ویرایش شده توسط مجله ی دریای تکنولوژی
در حوزه AI واژگان و واژگان بسیاری وجود دارد که برخی از آنها به مقدار بسیاری به یکدیگر نزدیک می باشند؛ به همین علت امکان پذیر نتوانید مفهوم آنها را درست تشخیص دهید. در این نوشته، متداولترین واژگانها و اصطلاحاتی را که در مطالب آشنایی با هوش مصنوعی منفعت گیری خواهد شد، بهترتیب حروف الفبای انگلیسی، ساده و مختصر تعریف کردیم؛ با خواندن این مقاله مفاهیم پایه و ابتدایی دنیای هوش مصنوعی را راحتتر فهمید میشوید.
A
AGI (هوش مصنوعی عمومی)
شرکتهای بهشدت به ایدهی هوش مصنوعی عمومی (AGI) علاقهمند می باشند اما هیچکدام نمی توانند بر سر تعریف آن به توافق برسند. این کلمه طبق معمولً به سیستمهای هوش مصنوعی فرضی اشاره میکند که میتوانند طیف وسیعی از ماموریت های پیچیده را با مقداری دخالت انسانی انجام بدهند. OpenAI، شرکت گسترشدهنده چتبات ChatGPT، یک قدم فراتر رفته و AGI را «سیستمهای زیاد خودمختار که در اکثر کارهای اقتصادی باارزش از انسانها بهتر عمل میکنند»، تعریف میکند اما اشکار نیست چه چیزی «سیستم زیاد خودمختار» و مهمتر از آن «کار اقتصادی باارزش» در نظر گرفته شده است. برخی صاحبنظران در صنعت هوش مصنوعی فکر میکنند در دهه آینده به AGI خواهیم رسید اما برخی دیگر اعتقاد دارند سیستمهای AGI در آینده زیاد دورتر تشکیل خواهند شد و احتمالا هم اصلاً تشکیل نشوند.
Agent (عامل)
اگر هوش مصنوعی مولد در نخستین سال پیدایش خود تا مدتی سپس با چتباتها تعریف میشد، احتمالا در مرحله بعدی با مفهوم «عامل» تعریف بشود؛ احتمالا این چنین تعریفی درست نباشد اما حداقل میتوانیم بگوییم شرکتهای فناوری روی این چنین اتفاقی شرط بستهاند.
احتمالا چتباتهایی همانند ChatGPT بتوانند دستور پخت غذا یا فهرستی از رستورانها را بهشدت اراعه دهند اما امیدواریم عاملهای هوش مصنوعی بتوانند از طرف شما مواد غذایی بخرند یا رستوران رزرو کنند؛ امکان پذیر هوش مصنوعی اینچنینی برای منفعت گیریهای شخصی و حرفهای دلنشین باشد اما وقتی که کاملاً جدا گانه عمل میکنند، گمان اشتباه نیز افزایش مییابد.
Algorithm (الگوریتم)
الگوریتم فرایندی مرحلهبهمرحله است که برای حل مشکل منفعت گیری میبشود. در این فرایند داده را داخل میکنید، با منفعت گیری از علتآن الگوریتم خروجی میگیرید. قرنها است انسانها از الگوریتمها برای حل مشکلات منفعت گیری میکنند. برخی تحلیلگران مالی همه عمر صرف ساختن الگوریتمهایی میکنند که میتوانند رویدادهای آینده پیشبینی کنند و برای کسب درآمد به آنها پشتیبانی میکند. جهان ما بر پایه این «الگوریتمهای متداول» عمل میکند اما اخیراً حرکتی بهسمت «یادگیری ماشین» شکل گرفته که برمبنای این ایدهها تشکیل شده است.
Alignment (همترازی)
برخی شرکتهای هوش مصنوعی برای جلوگیری از کنترل خارج شدن AI، روی از بین بردن مشکل همترازی متمرکز شدهاند. برخی دیگر از این شرکتها هم میخواهند یقین شوند AI بهطوری ساخته بشود که مطابق قیمتهای مهم انسانی عمل کند. مشکل این است که نه بر سر ماهیت این قیمتها توافق وجود دارد و نه بر سر اختیارات سیستمهای هوش مصنوعی.
Artificial intelligence (هوش مصنوعی)
هوش مصنوعی کلمه گستردهای است که بهقدری منفعت گیری شده که دیگر بخشی از معنی خود را از دست داده است. باوجوداین، هوش مصنوعی بهصورت تخصصی به فناوری خاصی اشاره دارد که هوش انسانی را مدلسازی میکند و میتواند مجموعهای از وظایفی را که امکان پذیر نیاز به دخالت انسانها داشته باشد، انجام دهد. دانشمند کامپیوتر «جان مککارتی» (John McCarthy)، این کلمه را در دهه ۱۹۵۰ ابداع کرد اما فناوری AI تا این قرن پیشرفت جدی نکرده می بود تا این که غولهای فناوری همانند گوگل، شرکت مادر فیسبوک، متا و مایکروسافت قوت محاسباتی گسترده را با مجموعههای عمیق دادههای کاربران ترکیب کردند. بااینکه AI میتواند قابلیتهای انسانی را در پردازش داده یا مکالمه نشان دهد، ماشینهای تجهیزبه آن تا این مدت «فهمیدن» نمیکنند چه کاری میکنند یا چه چیزی میگویند؛ آنها تا این مدت اساساً به الگوریتمها متکی می باشند.
B
Benchmarks (پنجمارکها)
باتوجهبه بازار روبهرشد خدمات AI، شرکتهای فناوری طبق معمولً به مجموعهای از معیارها (benchmarks) اشاره میکنند تا نشان دهند نرمافزار آنها از رقیب ها بهتر است اما تا این مدت هیچ آزمون جدا گانه و استانداردی وجود ندارد که شرکتهای هوش مصنوعی برای قیاس کارکرد نرمافزارهایشان از آن منفعت گیری کنند. برخی صاحبنظران حوزه AI میکوشند این مشکل را حل کنند. اکنون، شرکتها طبق معمولً خودشان معیارهای خود را طراحی میکنند تا نشان دهند سرویس آنها چه مقدار خوب به سؤالات درمورد جبر، فهمیدن نوشته و کدنویسی جواب میدهد.
چتباتها (Chatbots)
اگر پیش از ظهور هوش مصنوعی مولد چتباتها وجود داشتند، این رباتهای هوش مصنوعی پیش از پیدایش AI برای اراعه خدمات مشتری آنلاین منفعت گیری میشدند اما در عصر تازه چتباتهای AI میتوانند در موضوعات گوناگون گفتگوی پویایی با انسان داشته باشند؛ از موضوعات مرتبط با حقایق تاریخی گرفته تا دستورهای غذایی. به گمان زیادً در آینده چتباتها با اندوختهگذاری شرکتهایی همانند OpenAI و گوگل در مدلهای گسترش یافتهتر، مفیدتر و مکالمهمحورتر نیز خواهند شد و احتمالا طراحان آنها به مقصد دیرینه حوزه AI، ساخت دستیار شخصی مجازی همهکاره، نزدیک شوند.
C
Claude ( کلاد)
کلاد از معدود سرویسهایی است که واقعاً میتواند با کارکرد گسترش یافتهترین فناوری OpenAI رقابت کند. این چتبات را آنتروپیک (Anthropic)، استارتاپی که گروهی از کارمندان اسبق OpenAI تأسیس کردهاند، طراحی و تشکیل کردهاند که مقصد مهماش اهمیتدادن به گسترش ایمن هوش مصنوعی است. کلاد همانند ChatGPT میتواند بهشدت به طیف گستردهای از سؤالات کاربران جواب دهد اما آنتروپیک برخلاف OpenAI تا بحال از تشکیل برخی قابلیتهای AI همانند تشکیل عکس اجتناب کرده است. مطابق حرف های مسئولان شرکت، مقصد آنتروپیک ساخت محصولاتی است که عمدتاً برای منفعت گیری تجاری طراحی خواهد شد.
Computer vision (بینایی کامپیوتری)
بینایی کامپیوتری شاخهای از هوش مصنوعی است که به کامپیوترها اجازه میدهد اطلاعات بصری همانند تصاویر و ویدیوها را اسکن کرده و اشیا و افراد را شناسایی و طبقهبندی کنند. این سیستمها میتوانند به آنچه میبینند عکس العمل نشان دهند و عمل خاصی انجام بدهند یا پیشنهاد کنند. این فناوری برای ردیابی حیاتوحش بهمنظور حفاظت و هدایت وسایل نقلیه خودران منفعت گیری میبشود اما درمورد منفعت گیری از آن در عملیات نظامی و پلیسی نگرانیهایی وجود دارد؛ چون ثابت شده این چنین سیستمهایی رفتارهای نشاندهنده تعصب نژادی دارند و برای شناسایی یقین دقت کافی ندارند.
E
Emergent behaviors (رفتارهای درحال تکوین)
هنگامی مدلهای زبانی بزرگ به سطح خاصی میرسند، بعضی اوقات اغاز به نمایش توانمندیهایی میکنند که به نظر میرسد منبع پیدایش آنها اشکار نیست. نه انتظار این چنین توانمندیهای را وجود داریم نه مربیان آنها اشکار کردهاند از بین این چنین توانمندیهایی میتوان به تشکیل کدهای اجرایی کامپیوتری، تعریف داستانهای شگفت و شناسایی فیلمها از طریق رشته ایموجی بهجای سرنخ اشاره کرد.
F
Fine Tuning (فاین تیونینگ)
فاین تیونینگ را اصطلاحی تخصصی برای سفارشیسازی در نظر بگیرید. کاربر با پشتیبانی فاین تیونینگ مدل هوش مصنوعی موجودی را دریافت میکند و آن را با اطلاعات اضافی درمورد کاری خاص یا حوزهای اشکار آموزش میدهد. این کار میتواند به مدل پشتیبانی کند مطابق خواسته کاربر عمل کند؛ برای مثالً شرکتی که تجهیزات ورزشی میفروشد، امکان پذیر مدل AI را برای جوابگویی بهتر به سؤالات مرتبط با نگهداری صحیح از دوچرخه ثابت فاین تیون کند.
Frontier models (مدلهای پیشرفته)
مدلهای پیشرفته به تازه ترین و گسترش یافتهترین مدلهای AI حاضر در بازار اشاره دارند. اکنون، شرکتهای پشت این مدلها OpenAI، آنتروپیک، گوگل و متا می باشند. همه این شرکتها عضو گروهی به نام Frontier Model Forum می باشند که با همکاری دانشگاهیان و سیاستگذاران سیستمهای پیشرفته هوش مصنوعی را مسئولانه گسترش خواهند داد. انتظار میرود هزینه گسترش این مدلهای پیشرفته بهطور قابلتوجهی افزایش یابد و رقابت برای استارتاپها در روبه رو شرکتهای بزرگ فناوری سختتر بشود.
G
Gemini (جمینای)
گوگل که پیشتاز رقابت در حوزه هوش مصنوعی می بود، اکنون میکوشد همگام OpenAI بشود. جمینای چتبات پرچمدار گوگل است و خانواده مدلهای هوش مصنوعی آن نیز به همین نام شناخته خواهد شد. جمینای محور مهم کوششهای گوگل در عرصه هوش مصنوعی است. گسترش یافتهترین نسخه جمینای، اولترا (Ultra)، برای انجام ماموریت های پیچیده برنامهنویسی و استدلال ریاضی طراحی شده است؛ درست همانند گسترش یافتهترین نسخه فناوری OpenAI. گوگل قابلیتهای چندوجهی را در جمینی گنجانده؛ بهطوریکه برای مثالً این مدل AI میتواند عکس یک غذا را آنالیز کند و دستور پخت آن را بدهد.
Generative AI (هوش مصنوعی مولد)
کلمه هوش مصنوعی مولد به تشکیل محتوا (تصاویر، مقالات، آهنگها و آوازهای دریای) به سؤالات یا دستورات ساده اشاره دارد. این حوزه شامل مواردی همانند DALL-E از OpenAI میبشود که میتواند در چند ثانیه تصاویر پیچیده و دقیقی بسازد یا Suno که موسیقی را بر پایه توضیحات متنی تشکیل میکند. هوش مصنوعی مولد بعد از آموزش با حجم بسیاری از دادههای حاضر، اثری تازه خلق میکند؛ این چنین اتفاقی در برخی موارد تبدیل مطرح برخی دعاوی حقوقی از سوی صاحبان حقوق نشر شده است که ادعا میکنند آثار آنها بدون اجازه منفعت گیری شده است.
GPT (جیپیتی)
ترنسفورماتور ازپیشآموزشدیده مولد نوعی مدل زبانی بزرگ است. «ترنسفورماتور» به سیستمی حرف های میبشود که میتواند رشتههای ورودی را گرفته و آنها را بهطوری که عرصه محتوا و ترتیب کلمات قابلفهمیدن باشد، همزمان پردازش کند، نه جداگانه؛ این کار در ترجمه زبان اهمیت بسیاری دارد؛ برای مثالً اگر بهترتیب، نحو و معنی درست دقت نشود، امکان پذیر جمله «سگ او، پاپی، در آشپزخانه غذا خورد.» به معادل فرانسوی «پاپی در آشپزخانه سگ او را خورد» ترجمه بشود.
Grok (گروک)
در نگاه اول میتوانیم بهسادگی گروک را تلاشی غیرجدی برداشت کنیم. این چتبات که استارتاپ هوش مصنوعی ایلان ماسک (xAI) آن را ساخته و برای مشترکان در شبکه اجتماعی ایکس در دسترس است، بهخاطر جوابهای بیپروا و تشکیل تصاویر جنجالی با کمترین محدودیتهای اشکار، تیتر خبرها شده است اما xAI برای این چتبات میلیاردها دلار اندوخته جذب و تیمی بااستعداد راه اندازی داده و به حجم وسیعی از دادههای کاربران ایکس دسترسی دارد که میتواند از آنها برای ساخت محصولات هوش مصنوعی خود منفعت گیری کند؛ به همین علت گروک در زمان زیاد کوتاهی در جایگاه رقیبی واقعی برای چتباتهای بزرگتر خودش را نشان داده است.
H
Hallucination (توهم)
وقتی که سرویس هوش مصنوعی همانند (ChatGPT) چیزی بهظاهر قانعکننده اما کاملاً ساختگی تشکیل میکند، با اتفاق (توهم) مواجهیم. این اتفاق ناشی از نبوده است جواب صحیح برای آن سوال است؛ سیستم میداند جواب خوب باید چطور باشد و آن را بهجای حقیقت اراعه میکند. کارشناسان دلواپس ناتوانی هوش مصنوعی در گفتن «نمیدانم» زمان جواب می باشند؛ این چنین مشکلی میتواند تبدیل اشتباهات پرهزینه، سوءتفاهمهای خطرناک و افزایش اراعه اطلاعات نادرست بشود. برخی شرکتهای AI مدعی می باشند توانستهاند دقت سرویسهایشان را با مدلهای جدیدتر بهبود دهند؛ برای مثالً چتباتها را طوری بازطراحی کردهاند که قبل از جواب به خواستها، زمان بیشتری صرف استدلال کنند؛ یقیناً مشکل توهم AI هم چنان پابرجاست.
L
large language models (مدلهای زبانی بزرگ)
مدلهای زبانی بزرگ یا LLMs شبکههای عصبی زیاد بزرگ می باشند که با منفعت گیری از مقادیر بسیاری متن و داده، ازجمله کتابهای الکترونیکی، مقالات خبری و صفحات ویکیپدیا آموزش دیدهاند. مدلهای زبانی با میلیاردها پارامتر برای یادگیری، ستون فقرات فناوری پردازش زبان طبیعی می باشند که میتوانند متن را شناسایی، خلاصه، ترجمه، پیشبینی و تشکیل کنند.
Llama
متا اندوخته عظیمی صرف ساخت Llama کرده است، مدل زبانی Llama مجموعهای از مدلهای پیشرفته هوش مصنوعی محسوب میبشود که رایگان در دسترس گسترشدهندگان قرار دارد و گسترشدهندگانش میتوانند از آن منفعت گیری کنند. متا امیدوار است Llama به لطف این چنین رویکردی نهفقط مغز متفکر چتبات خود، Meta AI، باشد، بلکه به پایه و مبنا فهرست بلندبالایی از محصولات AI شرکتهای دیگر نیز تبدیل بشود؛ این چنین اتفاقی میتواند متا و Llama را در هسته اکوسیستم هوش مصنوعی قرار دهد.
M
Machine learning (یادگیری ماشینی)
یادگیری ماشینی فرایند بهبود تدریجی الگوریتمها (مجموعهای از دستورالعملها برای دستیابی به نتیجهای خاص) از طریق قراردادن آنها در معرض مقادیر بسیاری داده است. کامپیوتر با بازدید ورودیها و خروجیهای زیاد، میتواند بدون این که الزاماً آموزش اختصاصیای ببیند، «یاد بگیرد»؛ برای مثالً اپلیکیشن عکس (Photo) آیفون، ابتدا نمیداند چه شکلی هستید اما هنگامی بعد از مدتی در محیطهای گوناگون خودتان را بهگفتن چهره در عکسها برچسبگذاری میکنید (تگگذاری)، ماشین توانایی شناسایی شما را به دست میآورد.
Model collapse (فروپاشی مدل)
محققان دریافتهاند هنگامی مدلهای AI با دادههایی دربردارنده محتوای ایجادشده با هوش مصنوعی آموزش میبینند، درنهایت کارکرد مساعد نخواهند داشت (این نوشته باتوجهبه افزایش دیتاهای درحالگردش در فضای مجازی، بهصورت فزایندهای محتمل است).
به نظر برخی کارشناسان، اگر مدلهای هوش مصنوعی بیشازحد با محتوای ایجادشده با AI آموزش ببینند، گمان فروپاشی آنها نیز وجود دارد و شدیداً دلواپس این نوشته می باشند. نتایج پژوهشی که سال ۲۰۲۳ درمورد مبحث فروپاشی مدل انجام شد، نشان داد تصاویر انسانها ساخته AI، بعد از آموزش مجدد مدل با دادههایی که خودشان (حتی با مقادیر مقداری از این دادهها) تشکیل کردهاند، بهصورت فزایندهای تحریف شد.
Multimodal (چندمدلی)
شرکتهای هوش مصنوعی بهطور فزایندهای روی سیستمهای «چندمدلی» تمرکز میکنند که میتوانند مجموعهای از ورودیها، ازجمله متن، عکس و صدا را پردازش و به آنها جواب دهند؛ برای مثالً احتمالا بتوانید با چتباتی سخن بگویید کنید و از آن جواب بگیرید یا تصویری از قضیهای ریاضی را به چتبات نشان بدهید و راهحل بخواهید. منفعتمندی از سیستمهای چندمدلی نهفقط تنوع محصولات هوش مصنوعی را افزایش میدهد، بلکه حس واقعیتری از گفتگو با دستیار دیجیتال تشکیل میکند.
N
Natural language processing یا NLP (پردازش زبان طبیعی)
این فناوری شاخهای از AI است که به کامپیوترها پشتیبانی میکند گفتار و متن را درست همانند انسان، فهمیدن، پردازش و تشکیل کنند. فناوری پردازش زبان طبیعی برای استخراج دادهها از متن، ترجمه زبانها، تشخیص کلمات دستنویس و فهمیدن محتوا و معنی، بر الگوریتمهای یادگیری ماشین تکیه دارد؛ این فناوری زیربنایی دستیاران مجازی همانند سیری یا الکسا است که علتمیبشود بتوانند خواستها را فهمیدن کنند و به زبان طبیعی، درست همانند زبان انسان، جواب دهند.
فناوری پردازش زبان طبیعی میتواند احساسات را در متن تشخیص دهد؛ به همین علت اگر به سیری بگویید: «من ناراحتم.»، امکان پذیر نظر کند با دوستی تماس بگیرید. دیگر کاربردهای روزمره این فناوری، شامل فیلترکردن ایمیلهای اسپم، جستجوی وب، بازدید املایی و پیشبینی متن میبشود.
Neural networks (شبکههای عصبی)
این شبکهها نوعی هوش مصنوعی می باشند که در آن کامپیوتری با روشی تقریباً شبیه روش مغز انسان برای یادگیری از طریق آزمونوخطا یاد میگیرند؛ پیروزی یا ناکامی این شبکهها بر کوششها و سازگاریهای بعدی آنها تأثیر میگذارد؛ همان گونه که مغز کودک بر پایه آنچه به او آموخته میبشود، نقشهبرداری شبکههای عصبی را یاد میگیرد؛ این فرایند نیز میتواند شامل میلیونها بار تلاش برای دستیابی به توانایی باشد. علت نیاز مبرم پلتفرمهای AI به مقدار بسیاری توان پردازشی کامپیوتر نیز همین نوشته است.
O
Open Source (متنباز)
یکی از اختلافنظرهای کلیدی در صنعت هوش مصنوعی (و اختلافنظر بین افرادی که بهجستوجو تنظیم آن می باشند) اختلافنظر درمورد انتخاب مدلهای باز یا بسته است. باوجود این که برخی کلمه «باز» را بهمعنی بیقیدوشرط بودن به کار میبرند، این کلمه به ایده مدلهای متنباز اشاره دارد. مدلهای متنباز مدلهایی می باشند که گسترشدهندگانشان کد منبع خود را رایگان در دسترس عموم قرار خواهند داد تا همه بتوانند از این کد منفعت گیری یا آن را اصلاح کند. تعریف متنباز از سازمان غیرانتفاعی «Open Source Initiative» میآید، اشاره میکند. نرمافزاری که واقعاً متنباز است باید با شرایط خاصی برای توزیع و دسترسی مطابقت داشته باشد.
P
Parameters (پارامترها)
وقتی که شرکت هوش مصنوعی مدل جدیدی اراعه میکند، یکی از شاخصهای کلیدی که برای اختلاف محصولش به آن اشاره میکند، تعداد پارامترهای آن است. این کلمه به تعداد کل متغیرهایی اشاره میکند که مدل میانه فرایند آموزش به دست میآورد و نشاندهنده اندازه واقعی مدل زبانی بزرگ است؛ رقم های مرتبط با پارامترها زیاد حیرتانگیزند؛ برای مثالً مدل Llama از شرکت Meta در ۳ اندازه اراعه میبشود که بزرگترین آن تقریباً ۴۰۰ میلیارد پارامتر دارد.
Prompt (پرامپت)
توانایی منفعت گیری از ابزارهای هوش مصنوعی امروزی طبق معمولً با یک پرامپت اغاز میبشود. در اصل هر سوال یا خواست کاربر میتوانند مثالهایی از پرامپتها باشند. پرامپت میتواند شامل خواست از یک چتبات هوش مصنوعی برای خلاصهکردن یک سند، اراعه پیشنهادهایی برای بازسازی خانه یا سرودن شعر در توصیف عاشق مافین بلوبری شدن، باشد.
Prompt Engineering (مهندسی پرومپت)
دقیق و سودمند بودن جوابهای پلتفرم هوش مصنوعی تا حد بسیاری به کیفیت دستورات دادهشده بستگی دارد. مهندسان پرامپت میتوانند دستورالعملهای زبان طبیعی را برای تشکیل خروجیهای باکیفیت، با حداقل مصرف توان محاسباتی، بهینهسازی کنند.
R
Reasoning (استدلال)
سپتامبر ۲۰۲۴، OpenAI مدل جدیدی معارفه کرد که میتواند برخی ماموریت های استدلالی را درست همانند انسان انجام دهد؛ وظایفی همانند جواب به مسائل پیچیدهتر ریاضی و کدنویسی. اساساً سیستم AI بهروزرسانیشده قبل از جواب به کاربر، زمان بیشتری صرف محاسبهاش میکنند؛ بهاینترتیب میتواند مسائل چندمرحلهای را بهتر حل کند. گوگل و آنتروپیک نیز درحالگسترش تواناییهای استدلال با مدلهای پیشرفته AI خود می باشند.
S
Small Models (مدلهای کوچک)
بعد از سالها رقابت برای ساخت مدلهای بزرگتر، برخی کارشناسان حوزه AI به این نتیجه رسیدهاند که همیشه مدل بزرگتر بهتر نیست. OpenAI، گوگل، متا و دیگر شرکتها مدلهای کوچکتری انتشار کردهاند. محصولاتی که این شرکتها انتشار کردهاند، نرمافزارهایی فشردهتر و سریع تر از مدلهای زبان بزرگ پرچمدار خود، می باشند؛ احتمالا این چنین مدلهایی در حد و اندازه مدلهای بزرگتر نباشند اما میتوانند برای مشتریان گزینهای کارآمدتر و مقرونبهصرفهتر باشند.
Sentient AI (هوش مصنوعی دارای شعور)
اکثر پژوهشگران اعتقاد دارند سالها تا تحقق هوش مصنوعی آگاه و دارای شعور (هوشی که قادر به فهمیدن و تأمل بر دنیای اطراف خود باشد.) فاصله داریم. اگرچه AI میتواند برخی توانمندیهای انسانگونه را نشان دهد، ماشینها تا این مدت «نمیفهمند» چه میکنند یا چه میگویند؛ آنها فقط الگوها را در حجم عظیمی از اطلاعات تولیدشده توسط انسانها اشکار میکنند و فرمولهایی را برای تعیین نحوه جواب به دستورات به دست میآورند. این چنین امکان پذیر تشخیص وقتی که شعور هوش مصنوعی به حقیقت تبدیل میبشود، دشوار باشد؛ چون تا این مدت توافق گستردهای درمورد چیستی آگاهی وجود ندارد.
Synthetic Data (دادههای مصنوعی یا ساختگی)
برخی شرکتهای فناوری که با دادههای مصنوعی آزمایش میکنند، میکوشند دادههای زیاد تر برای گسترش مدلهای زبان بزرگ بیابند که چتباتهای هوش مصنوعی را قوت میبخشند. شرکتهای AI از سیستمهای AI خود برای تشکیل نوشتار و محتواهای دیگر منفعت گیری میکنند؛ در مرحله بعدی این دادهها برای آموزش مدلهای تازه منفعت گیری خواهند شد. مزیت منفعت گیری از این چنین روشی این است که از برخی نگرانیهای قانونی و اخلاقی درمورد منبع دادههای آموزش جلوگیری میکند اما احتمالا دراینبین ایرادی وجود داشته باشد؛ برخی کارشناسان دلواپساند این چنین اتفاقی میتواند به افت کارکرد سیستمهای AI منجر بشود. اتفاقای که به «فروپاشی مدل» معروف است.
T
Training data (داده آموزشی)
شرکتهای AI مقادیر عظیمی از دادهها را جمعآوری میکنند یا مجوز میگیرند تا مدلهای هوش مصنوعی را گسترش یا آموزش بدهند؛ مدلهایی که میتوانند در جواب به سوالهای کاربران، متن، تصاویر، موسیقی و دیگر محتواها را تشکیل کنند. این شرکتها طبق معمولً درمورد تعیین دقیق دادههای آموزشی که به آنها وابستهاند، اطلاعات مقداری اراعه خواهند داد اما دادههای مورداستفاده برای آموزش چتبات AI امکان پذیر شامل مقالات، کتابها، نظرات آنلاین و پستهای شبکههای اجتماعی باشد. مسئولان سونو (Sono)، شرکت فعال در حوزه ساخت موسیقی با AI، حرف هایاند نرمافزار شرکتشان با «دهها میلیون داده ثبتشده» آموزش داده شده است و امکان پذیر برخی از این آثار حق کپیرایت داشته باشند.
دسته بندی مطالب
مقالات کسب وکار