نوشته و ویرایش شده توسط مجله ی دریای تکنولوژی
بهنظر میرسد هوش مصنوعی در حوزه تشکیل محتوای صوتی، درحال ورود به عصر جدیدی است. نرمافزار شرکت ElevenLabs صداهای انسان و موسیقیهای تولیدشده توسط هوش مصنوعی اراعه میدهد. اکنون این AI، به کاربران امکان میدهد تا نمودهای صوتی را برای پادکستها، فیلمها یا بازیها نیز تشکیل کنند.
به نقل از TheVerge، این ابزار تازه میتواند تا ۲۲ ثانیه صدا را بر پایه خواستهای کاربر تشکیل کند که این صدا قابل ترکیب با پلتفرمهای صوتی و موسیقی شرکتهای دیگر است. این چنین بعد از پایان کار، این سرویس حداقل چهار نوع فایل صوتی قابل دانلود را در اختیار کاربران قرار میدهد.
ElevenLabs خبرداد که با پلتفرم Shutterstock برای ساخت یک پایگاه داده و آموزش این مدل هوش مصنوعی کار کرده است. Shutterstock قبلاً مجوز پایگاه داده محتوای خود را به تعداد بسیاری از شرکتهای فعال در AI ازجمله متا، OpenAI و گوگل داده است.
ویژگیهای نسخه پولی و رایگان سرویس هوش مصنوعی ElevenLabs
منفعت گیری از نمودهای صوتی سرویس هوش مصنوعی ElevenLabs رایگان است، اما کاربران اشتراکی میتوانند از کلیپهای صوتی تولیدشده با مجوزهای تجاری منفعت گیری کنند؛ درحالیکه کاربران رایگان باید گفتن «elevenlabs.io» را در گفتن محتوای خود قرار دهند. این چنین این کاربران، محدودیت کاراکتر در زمان نوشتن پرامپتها را دارند و مجاز به منفعت گیری از ۱۰,۰۰۰ کاراکتر در ماه می باشند.
در بازار سرویسهای مختلفی برای اراعه نمودهای صوتی به فیلمسازان و بازیسازان وجود دارد، اما بعضی اوقات اوقات این سرویسها گران یا در پخش صدا با مشکل روبه رو می باشند.
ElevenLabs در سایت خود میگوید که این مدل هوش مصنوعی را «برای تشکیل صداهای غنی، همهجانبه، سریع، مقرونبهصرفه و در مقیاس بزرگ» طراحی کرده است.
دیگر گسترشدهندگان AI نیز درحال گسترش این چنین سرویسی می باشند. شرکت Stability AI سال قبل سرویس Stable Audio را انتشار کرد که نمودهای صوتی تشکیل میکند. این چنین مدلهای AudioCraft شرکت متا نیز صداهای بعدعرصه طبیعی همانند صدای باد یا ترافیک تشکیل میکند.
دسته بندی مطالب
مقالات کسب وکار