Повеќе од две децении откако Џеј-Кеј Роулинг го запозна светот со универзум од магични суштества, забранети шуми и тинејџерски волшебници, Хари Потер повторно е во центарот на вниманието, иако во сосема друга сфера: истражување на вештачка интелигенција.
Сè поголем број истражувачи ги користат популарните книги за Хари Потер за да експериментираат со технологијата за генеративна вештачка интелигенција, наведувајќи го трајното влијание на книгите врз популарната култура и широкиот речник и сложените игри на зборови на нејзините страници. Оваа листа на студии и академски трудови во кои се споменува Хари Потер нуди преглед на најновите истражувања за вештачката интелигенција, а трудовите се обидуваат да одговорат на некои од најтешките прашања со кои се соочува технологијата.
Во неодамнешниот пример на кој можеби привлече најголемо внимание, Хари, Хермиона и Рон се ликовите во трудот со наслов „Кој е Хари Потер?“, кој фрла светлина врз новата техника која им помага на големите јазични модели селективно да заборават информации. Тоа е важно прашање за индустријата, бидејќи големите јазични модели, моделите што управуваат со чат-ботови со вештачка интелигенција, се изградени на огромни количини на податоци од веб кои вклучуваат материјали заштитени со авторски права и друга проблематична содржина. Ова доведе до тужби и јавни критики на некои компании за вештачка интелигенција.
Авторите на трудот, истражувачите на Мајкрософт, Марк Русинович и Ронен Елдан, рекоа дека покажале дека моделите со вештачка интелигенција може да се менуваат или уредуваат за да се отстранат сите сознанија за постоењето на книгите за Хари Потер, вклучително и ликови и заплети, без системот за вештачка интелигенција губење на севкупната способност за одлучување и аналитичка способност.
Дуото рече дека ги избрале книгите бидејќи се надалеку познати. „Верувавме дека ова ќе им олесни на луѓето од истражувачката заедница да го оценат моделот и самите да потврдат дека одредена содржина е навистина заборавена“, рече Русинович, главен технолошки директор на „Мајкрософт Азуре“ (Microsoft Azure). „Речиси секој може да излезе со барање за моделот што би можело да тестира дали „знае“ за книгите или не. Дури и луѓето кои не ги читале книгите знаат нешто за заплетот и ликовите“.
Во друга студија, истражувачите од Универзитетот во Вашингтон во Сиетл, Универзитетот во Калифорнија, Беркли и Институтот за вештачка интелигенција „Ален“ развија нов јазичен модел наречен „Сило“ кој може да ги отстрани податоците за да ги намали правните ризици. Сепак, перформансите на моделот значително опаѓаат ако моделот се обучува само за текстови со низок ризик, како што се книги без авторски права или владини документи, велат тие во трудот објавен претходно оваа година.
За да го истражат проблемот подлабоко, истражувачите ги користеа книгите за Хари Потер за да видат дали поединечни делови од текстот влијаат на перформансите на системот за вештачка интелигенција. Тие создадоа две групи на податоци, односно збирки на веб-страници и документи. Првата ги вклучуваше сите објавени книги освен првата книга за Хари Потер; втората ги вклучуваше сите книги освен втората и така натаму. „Кога книгите за Хари Потер се отстранети од базата на податоци, збунетоста се зголемува“, велат истражувачите, коментирајќи ја мерката за точност на моделот со вештачка интелигенција.
Студиите за вештачка интелигенција го цитираа Хари Потер најмалку една деценија, но стана почеста бидејќи академиците и технолозите се фокусираа на алатки за вештачка интелигенција кои можат да обработат и да одговорат на природниот јазик со релевантни одговори. „Изобилството на сцени, дијалози, емотивни моменти на Хари Потер го прави многу релевантен за специфичната област на обработка на природниот јазик“, рече Лејла Вехби, истражувач од Карнеги Мелон.
На „арХив“ (arXiv), складиште за научно истражување со отворен пристап, неодамнешните дела вклучуваат „Развој на напивки за машинско учење во Хогвортс“, „Големите јазични модели се среќаваат со Хари Потер“ и „Откривање правопис во фантастичната литература со помош на вештачка интелигенција базирана на трансформаторска архитектура“.
Дури и кога не е во центарот на истражувањето, Хари Потер е омилена литературна референца за истражувачите. Едно истражување, на пример, ги користеше списите на Роулинг за да ја тестира интелигенцијата на системите за вештачка интелигенција како оние што го напојуваа чат-ботот „ЧетГПТ“, тема што генерира многу жештина во последните дебати. Теренс Сејновски, кој раководи со компјутерската невробиолошка лабораторија на Институтот за биолошки студии „Салк“, во трудот тврди дека чет-ботите само ја рефлектираат интелигенцијата и предрасудите на нивните корисници, како „Огледалото на желбата“ во првата книга за Хари Потер, огледало кое ги покажува најдлабоките лични желби на оној што гледа во него.
„Хари Потер е популарен кај помладите истражувачи“, рече Вехби. „Би ги читале како деца или адолесценти, па би им паднало на памет при изборот на пишан или говорен текст.