با تعامل بیشتر با راوی فیدیبو می‌توانید با لحن و صدای محبوب خود کتاب بشنوید


شلوغی زندگی روزمره امکان مطالعه کتاب را از تعداد بسیاری از افراد گرفته است، اما در این بین، کتاب‌های صوتی نور امیدی برای برگشت کتاب به زندگی پرمشغله امروزی می باشند. محصول «راوی» از فیدیبو یک قدم از کتاب صوتی فراتر رفته و قرار است با پشتیبانی هوش مصنوعی، همه کتاب‌ها را برای کاربران بخواند. مدیر پروژه راوی این محصول را از هر دو جنبه‌ مقداری و کیفی روبه‌گسترش دانست و خبرداد که او گفت و گو و دغدغه مهم آن‌ها افزایش کیفیت تلفظ‌ها و گسترش دایره لغات سیستم است.

«مهرزاد کریمی»‌،‌ مدیر پروژه راوی، درمورد علت شکل‌گیری این محصول و ریسک قیاس ناخودآگاه کیفیت آن با کتاب صوتی در ذهن مخاطب به دیجیاتو او گفت:‌ «در ابتدا باید به این مسئله مهم اشاره کنم که راوی بخشی از یک سیستم بزرگ‌تر تشکیل کتاب صوتی است. از ابتدای مسیر، ما فقطً به‌جستوجو گسترش یک سیستم متن به صوت نبودیم و با دقت به گره‌خوردن تکنولوژی به زندگی اقشار گوناگون جامعه و استقبال آشکار و چشم‌گیر از محتوای صوتی در حوزه کتاب، تصمیم به گسترش این ویژگی گرفتیم. ریسک آشکار قضیه هم قیاس ناخودآگاه آن با گویندگان صوتی حرفه‌ای می بود.»

ادامه مطلب
محققان یک قدم به درمان mRNA استنشاقی برای سرطان ریه نزدیک‌تر شدند

شما می‌توانید با راوی تعامل داشته باشید

کریمی در جواب به این سوال که راوی دقیقاً چیست و قرار است چه‌کار کند؟ او گفت:‌ «راوی یکی از اجزای سیستم بزرگ‌تر تشکیل محتوای صوتی است که با منفعت گیری از هوش مصنوعی گسترش داده شده. ماموریت یا مقصد مهم این زیرسیستم، تبدیل محتوای متنی به صوتی است که کنترل‌پذیری و توانایی تحول ویژگی‌های صوت تولیدی از مقصد‌های مهم و فرعی آن به حساب می اید. به‌طور کلی و مقداری فنی‌تر، راوی را می‌توانیم در دسته مدل‌های مولد یا Generative در ادبیات هوش مصنوعی قرار دیم.»

با تعامل زیاد تر با راوی فیدیبو می‌توانید با لحن
با تعامل زیاد تر با راوی فیدیبو می‌توانید با لحن و صدای محبوب خود کتاب بشنوید ۱۲

به باور او، راوی به کاربران اجازه خواهد داد که در کمترین زمان ممکن، از محتوای صوتی به‌جای متنی منفعت گیری کنند. کریمی از امکان تعامل با این سیستم خبر داد؛ آن‌هم به‌نحوی که امکان پیداکردن لحن موردعلاقه افراد وجود داشته باشد. او دراین‌باره او گفت:‌ «با اضافه‌شدن ویژگی‌ها در طول زمان، کاربران بستر تعامل با سیستم را اشکار خواهند کرد؛ به‌صورتی‌که می‌توانند محتوای صوتی موردنظر را با ویژگی‌های موردنظرشان گوش کنند (برای مثال، با صدای گوینده یا لحن موردعلاقه خودشان) که این بستر تعاملی با اهمیت ترین تفاوت با کتاب صوتی تولیدشده توسط گوینده انسان است.»

ادامه مطلب
باستان‌شناسان قدیمی‌ترین شواهد وجود انسان در اروپا را کشف کردند
آخرین مطالب

لایه اول جامعه مقصد راوی: افراد نابینا و کم‌بینا

سال‌ها است که فراهم‌کردن دسترسی عادی به محتویات فرهنگی و درسی برای افراد نابینا و کم‌بینا به دغدغه‌ای برای جامعه تبدیل شده است. کریمی دراین‌باره او گفت:‌ «کاربران نابینا یا کم‌بینا، در لایه اول، با اهمیت ترین کاربران این ویژگی شناخته خواهد شد و مسلماً گسترش یک‌سری ویژگی‌ها همانند توانایی جابه‌جایی بین متن و صوت و… برای این دسته از کاربران با وسواس بیشتری پیگیری خواهد شد.»

او در ادامه افزود:‌ «اکنون همه علاقه‌مندان به محتوای کتاب صوتی یا audiobookها می‌توانند از این ویژگی منفعت‌مند شوند. یقیناً با پیشرفت این سیستم در طول زمان و اضافه‌شدن ویژگی‌های متنوع‌تر، طیف گسترده‌تری از مخاطبین جذب خواهند شد.»

ادامه مطلب
اولین تصاویر از زیر پوسته دستگاه هوش مصنوعی Humane انتشار شد_دریای تکنولوژی

راوی، محصولی درحال گسترش مقداری و کیفی

مدیر پروژه راوی درمورد تصمیم‌های گوناگون برای نحوه رونمایی این محصول توضیحاتی داد:‌ «برای رونمایی از راوی دو نوع رویکرد وجود داشت. رویکرد اول چیزی همانند به مترجم گوگل می بود؛ این که این ابزار را برای محتوایی سبک‌تر و محدودتر و با تعداد محدودی کاراکتر متنی برای کاربران فعال کنیم و در طول زمان با یادگیری زیاد تر و جمع‌آوری بازخوردها، آن را به محتواهای بزرگ‌تر و گسترش یافتهتر همانند متن کتاب گره بزنیم.»

او معتقد است که رویکرد اول ریسک کمتری داشت و با این روش، زمان بیشتری برای گسترش سیستم مورد نظر صرف می‌شد، اما تصمیم‌گیرندگان پروژه راوی رویکرد دوم را انتخاب کردند: «رویکرد دوم چیزی همانند به ChatGPT می بود؛ رویکردی تهاجمی یا eager که بر پایه آن، نسخه یک محصول را به‌طور کامل در اختیار کاربر قرار می‌هیم. این رویکرد ریسک بیشتری دارد و علتمی‌بشود که کاربران با همه نقاط ضعف و قوت ورژن جاری آشنا شوند.»

او افزود:‌ «ما با ۱۵۹ کتاب که نسخه صوتی آن وجود نداشت، اغاز کردیم و همه محتوای آن را در اختیار کاربر قرار دادیم تا با همه ویژگی‌های این ورژن در مقیاس بزرگ و تنوع بالا آشنا بشود.»

ادامه مطلب
مشاهده تولد کهکشان‌ها برای اولین بار_دریای تکنولوژی

مدیر پروژه راوی از افزایش مقداری و کیفی این محصول در طول زمان خبر داد و او گفت: «با دقت به این که توانایی این چنین ویژگی در حوزه کتاب و در داخل وجود نداشت و مثالهای خارجی نیز با احتیاط بسیاری در حوزه کتاب داخل شده‌اند، تصمیم گرفتیم ویژگی‌ها را بعد از جمع‌آوری بازخورد کاربران به‌صورت دوره‌ای اضافه کنیم و تعداد کتاب‌ها را همراه با بهبود کیفیت و اعمال بازخورد کاربران افزایش دهیم.»

او باور دارد که حجم کار در این مقیاس و این تنوع از نظر فنی یک چالش بزرگ و فرایندی زمان‌بر است که این نوشته هم به‌مرور بهبود خواهد یافت.

مقصد ما تشکیل کتاب صوتی با امکان دخالت سلیقه کاربر است

به باور کریمی، از ابتدا مقصد‌گذاری آن‌ها بلندپروازانه و ایده‌آل‌گرایانه بوده است. او درمورد چشم‌انداز آینده این محصول او گفت:‌ «مقصد مهم ما تشکیل کتاب صوتی همراه با دخالت‌دادن سلیقه کاربر در این فرایند است. تنوع زبان، لحن، گوینده، موسیقی عرصه، اعمال بازخورد هم‌زمان کاربر و… همه و همه ازجمله ویژگی‌هایی است که به آن فکر کرده‌ و در سیستم درنظر گرفته‌ایم که در نسخه‌های آتی اضافه خواهند شد.»

ادامه مطلب
هوش مصنوعی ChatGPT ظاهراً به ابزاری برای ایجاد چت‌بات‌ها مجهز می‌شود
1706105171 953 با تعامل زیاد تر با راوی فیدیبو می‌توانید با لحن
با تعامل زیاد تر با راوی فیدیبو می‌توانید با لحن و صدای محبوب خود کتاب بشنوید ۱۳

او در ادامه افزود: «او گفت و گو و دغدغه مهم ما افزایش کیفیت تلفظ‌ها و گسترش دایره لغات سیستم بوده و خواهد می بود که مهم‌ترین چالش در تشکیل محتوا در این مقیاس و با این تنوع است. ویژگی‌هایی که به آن اشاره شد، طراحی شده‌اند و به‌مرور در اختیار کاربران قرار خواهند گرفت؛ از این بابت مطمعن کامل داشته باشید.»

درنهایت مدیر پروژه راوی در جواب به این سوال که آیا در ادامه به این محصول کاربردهای دیگر همانند امکان خلاصه‌سازی و ترجمه هم اضافه می‌بشود یا خیر، او گفت: «قطعاً با پشتیبانی مخاطبان بی‌نظیر فیدیبو، پیشرفت‌های حال‌حاضر تکنولوژی و شور و علاقه ما برای گسترش و پیشرفت فرهنگ کتابخوانی، همه این‌ها ممکن خواهد می بود. فکر می‌کنم با اهمیت ترین فاکتور، اراعه نظرات، پیشنهادها و انتقادات به هر صورتی و در هر مقیاسی از سوی همه مخاطبان است.»



منبع

0 0 رای ها
نظر دهی
اشتراک در
اطلاع از
guest

0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها