Бұл өте әсерлі AI аудиокітап дауыстары жақсы ма, әлде жаман ба?

Мазмұны:

Бұл өте әсерлі AI аудиокітап дауыстары жақсы ма, әлде жаман ба?
Бұл өте әсерлі AI аудиокітап дауыстары жақсы ма, әлде жаман ба?
Anonim

Негізгі ұсыныстар

  • DeepZen мәтіннен таңқаларлық шынайы аудиокітаптар жасау үшін AI (жасанды интеллект) пайдаланады.
  • Технология құрылыс блоктарын қамтамасыз ету үшін нағыз адам дауысын актерлерді пайдаланады.
  • Amazon және Audible қазір компьютерде жасалған аудиокітаптарды қабылдамайды.
Image
Image

DeepZen - адам актерлерінің шынайы дауыстарына негізделген аудиокітаптарда қолданылатын компьютерлік дауыстарды жасайтын компания. Сапасы қорқынышты - бір уақытта бірнеше сағат тыңдауға жеткілікті. Мұндағы трюк мәтінді оқи алатын және контекстке негізделген дұрыс эмоционалды реакцияны шығара алатын AI (жасанды интеллект) құрамдас бөлігі болып табылады. Содан кейін ол сол эмоцияны дауысқа салады.

Бұл әсерлі және өте ыңғайлы. Бірақ біз шынымен біртекті аудиокітап тәжірибесін қалаймыз ба? Ал сол дауысты актерлер ше?

"Инди-баспагердің көзқарасы бойынша аудиокітап шығару құнын төмендететін кез келген нәрсе өте қызықты", - деді Рик Карлайл, Carlile Media тәуелсіз баспасының иесі Lifewire-ке электрондық пошта арқылы.

"Бірақ бұл тартымдылық өнім дәстүрлі әңгімелеумен бірдей сапада болады деп болжайды. Менің ойымша, біз әлі жүз пайыз жоқпыз. Мені қате түсінбеңіз, DeepZen таңғаларлық жақсы. Бұл орасан зор серпіліс және оны жасаушылар үлкен мақтау мен жетістікке лайық. Бірақ ол әлі кемел емес."

Дыбыс «жеткілікті жақсы»

DeepZen сапасын түсінудің ең жақсы жолы - үлгілерді тыңдау. Егер сіз олардың компьютерде жасалғанын білмесеңіз, тіпті түсінбеуіңіз мүмкін. Біраз уақытқа емес. DeepZen-тің AI-і мінсіз және ол әсер етуі тиіс эмоционалды ноталарды ешқашан қате түсінбейді делік.

Image
Image

Сол кезде де адам неғұрлым нюансты және жиі таңқаларлық интерпретацияларды ұсына алады. Актер компьютер ешқашан ескермейтін сөздерді күтпеген жерден бұрмалауы мүмкін. Ал шын мәнінде, AI интерпретациясы әлі кәсіби дауыс актері сияқты жақсы емес.

"Фильмдермен жұмыс істейтін және соңғы кездері аудио баяндау әлемінде жұмыс істейтін адам ретінде мен AI-ға таң қалдым, бұл машина түсіндіре алмайтын терең мағыналар бар екенін білемін, " кәсіби дауыс актер Пол Крам Lifewire электрондық поштасы арқылы айтты.

"Оны пайдаланатын белгісіз авторлар көбейе ме? Мен кепілдік беремін, себебі ол "жеткілікті жақсы"."

Жақсы болу, ыңғайлылық пен шығынды үнемдеумен бірге инди-баспагерлерді қызметке тарту үшін жеткілікті болуы мүмкін.

"Аудиокітаптар әр аяқталған аудио сағатына 500 долларға дейін (атақты адамдардың дауысы үшін әлдеқайда көп) тұрады және бұған басқару мен әкімшіге кететін уақыт шығыны кірмейді", - дейді Карлайл. "DeepZen сияқты провайдерге қолжазбаны жүктеп салу арқылы бұл шығынды екі есе азайту мүмкіндігі өте тартымды."

Сөйлесу қиындығы

Дыбыстық актерлерді жұмыстан шығару және DeepZen-ге қолжазбаларды жүктеп салу сияқты оңай емес. Қазіргі уақытта оңай аудиокітап AI сөйлеуіне бір кедергі бар және ол Amazon-дан.

Image
Image

"Қазіргі уақытта өзін-өзі шығарушының Audible және Amazon аудиокітаптарын тарату бағыты ACX адам жазбаған аудиокітаптарды қабылдамайды", - дейді Карлайл.

Неге? Сапасы. Бұл веб-сайттағы ЖҚС жазбасы:

"Мәтінді сөйлеуге немесе басқа автоматтандырылған жазбаларға рұқсат етілмейді. Дыбысты тыңдаушылар материалды, сондай-ақ оқиғаны орындау үшін аудиокітаптарды таңдайды. Бұл үмітті орындау үшін аудиокітапты адам жазып алуы керек."

Бұл DeepZen арқылы жасалған аудиокітаптар кем дегенде әзірге дайын емес дегенді білдіреді. Бұл таза болжам, бірақ DeepZen Amazon үшін өте жақсы сатып алу сияқты көрінеді, бұл қызметті сатуға және оны тек Дыбыстық кітаптар үшін сақтауға мүмкіндік береді. Тіпті олай болмаса да, компьютерде жасалған аудиокітаптардың сапасы осыншама жақсы болса, бұл ережеден ерекшелік жасамауға себеп жоқ сияқты.

Осылай жасалған аудиокітаптарды тыңдауға қуанышты боларсыз ба? Бұл орын алғанда, адамдардың көпшілігі тіпті күдіктенбейді. Кейбіреулер компьютерде жасалған дауыстардың жетілдірілуін қалауы мүмкін, өйткені олар кейде көңіл аударатын вокалдық тиктер мен әдеттерден бос болады. Технология сонымен қатар бейне ойындарға, теледидар мен радио жарнамаларына және дауыс актер жалдайтын кез келген басқа сценарийге жарамды.

DeepZen технологиясы сонымен қатар жұмыс сапары үшін ыңғайлы жазылған мақалалардан жаңалықтар подкасттарын автоматты түрде жасаудың тамаша тәсілі болар еді.

Ал сол дауыс берушілер ше? Кем дегенде бір мүмкіндік болады: олар DeepZen-ге барып жұмыс істей алады.

Ұсынылған: