„Опен еј-ај“ ги споделува раните резултати од тестот за функција која може гласно да чита зборови со убедлив човечки глас - нагласувајќи ја новата граница за вештачката интелигенција.
Компанијата споделува рани демо снимки и случаи на употреба од мал преглед на моделот текст претечен во говор, наречен „Војс Енгин“ (Voice Engine), кој досега го сподели со околу десет програмери, изјави портпаролот на копманија. „Опен еј-ај“ се одлучи против пошироко ширење на функцијата, за што ги информираше новинарите претходно овој месец.
Портпаролот на „Опен еј-ај“ рече дека компанијата одлучила да го намали објавувањето откако добила повратни информации од засегнатите страни како што се креаторите на политиките, експертите од индустријата, едукаторите и креативците. Компанијата првично планираше да ја објави алатката на околу 100 програмери преку процес на апликација, според претходниот брифинг за печатот.
„Признаваме дека генерирањето говор што личи на гласовите на луѓето има сериозни ризици, кои се особено на ум во изборна година“, напиша компанијата во блог пост во петокот. „Ние се ангажираме со американски и меѓународни партнери од целата влада, медиумите, забавата, образованието, граѓанското општество и пошироко за да се осигураме дека ги вклучуваме нивните повратни информации додека градиме нови алатки“.
Друга технологија за вештачка интелигенција веќе е искористена за лажни гласови во некои контексти. Во јануари, лажен, но реалистичен телефонски повик за кој се тврди дека е од претседателот Џо Бајден, ги охрабри луѓето во Њу Хемпшир да не гласаат на прелиминарните избори - настан што ги поттикна стравувањата за вештачка интелигенција пред критичните глобални избори.
За разлика од претходните напори на „Опен еј-ај“ за генерирање аудио содржина, „Војс Енгин“ може да создаде говор што звучи како поединечни луѓе, комплетен со нивната специфични интонации. Сè што му е потребно на софтверот се 15 секунди снимен звук на лице што зборува за да го рекреира својот глас.
За време на демонстрацијата на алатката, „Блумберг“ слушаше клип од главниот извршен директор на „Опен еј-ај“, Сем Алтман, кој накратко ја објаснува технологијата со глас што звучеше неразлично од неговиот вистински говор, но беше целосно генериран од вештачка интелигенција.
„Ако го имате правилното поставување на аудио, тоа е во основа глас од човечки калибар“, рече Џеф Харис, од „Опен еј-ај“. „Тоа е прилично импресивен технички квалитет“.
Еден од тековните партнери за развивачи на „Опен еј-ај“ што ја користи алатката, Институтот за невронауки Норман Принц во непрофитниот здравствен систем „Лајфспан“, користи технологија за да им помогне на пациентите да го вратат гласот. На пример, алатката се користела за враќање на гласот на млада пациентка која ја изгубила способноста да зборува јасно поради тумор на мозокот со реплицирање на нејзиниот говор од претходната снимка за училишен проект, се вели во блогот на компанијата.
Прилагодениот говорен модел на „Опен еј-ај“ исто така може да го преведе звукот што го генерира на различни јазици. Тоа го прави корисен за компаниите во аудио-бизнисот, како што е „Спотифај“. Компанијата веќе ја користеше технологијата во сопствената пилот-програма за да ги преведе подкастите на популарните домаќини како Лекс Фридман. „Опен еј-ај“ , исто така, промовираше и други корисни апликации на технологијата, како што е создавање на поширок опсег на гласови за едукативна содржина за деца.
Во програмата за тестирање, „Опен еј-ај“ бара од своите партнери да се согласат со нејзините политики за користење, да добијат согласност од оригиналниот звучник пред да го користат нивниот глас и да им откријат на слушателите дека гласовите што ги слушаат се генерирани од вештачка интелигенција. Компанијата исто така инсталира нечуен аудио воден жиг за да може да разликува дали дел од аудио е создаден од нејзината алатка.
Пред да одлучи дали да ја објави функцијата пошироко, „Опен еј-ај“ рече дека бара повратни информации од надворешни експерти. „Важно е луѓето ширум светот да разберат каде се движи оваа технологија, без разлика дали на крајот ние самите ја користиме нашироко или не“, се вели во блогот на компанијата.
„Опен еј-ај“ , исто така, напиша дека се надева дека прегледот на неговиот софтвер „ја мотивира потребата да се зајакне општествената отпорност“ против предизвиците што ги носат понапредните технологии за вештачка интелигенција. На пример, компанијата ги повика банките постепено да ја укинат гласовната автентикација како безбедносна мерка за пристап до банкарски сметки и до чувствителни информации. Исто така, бара јавно образование за лажни содржини со вештачка интелигенција и повеќе развој на техники за откривање дали аудио содржината е реална или генерирана од вештачка интелигенција.