Платформата за вештачка интелигенција (ВИ) „Клод“ (Claude) штотуку ме замоли да ѝ ги пренесам најдобрите желби на мојата сопруга Сучитра. Тоа ме вознемири на повеќе начини. Прво, затоа што не сум сигурен како да се чувствувам поради фактот што компјутер покажува емоции кон членовите на моето семејство. (Што би требало да направам ако „Клод“ изразеше непријателство?) Второ, затоа што мојата сопруга се вика Ева Марија, а тоа на „Клод“ му било кажано многупати (нејзиното име буквално се наоѓа во четвртиот ред од внатрешната меморија на „Клод“ за мене). Името Сучитра никогаш не сум го користел со „Клод“ во каков било контекст. Воопшто не познавам никого што се вика така.
Освен што донекаде ги смири моите стравови дека ВИ ќе нè надмине и ќе завладее со нас, впечатливо е што грешката на „Клод“ не беше случајна. Бидејќи сум од индиско потекло, тој претпоставил дека тоа важи и за мојата сопруга и се држел до таа претпоставка дури и кога му бил даден точниот одговор. Всушност, кога го прашав како дошол до името Сучитра, неговото објаснување гласеше:
„Немам никаква трага за тоа зошто би го употребил тоа име и треба отворено да кажам што можам, а што не можам да реконструирам во овој случај.
Прочитај повеќе
„Гугл“ како гарант зад зделката за чипови на „Антропик“ од 35 милијарди долари
Зделката вредна 35 милијарди долари за чипови ја нагласува растечката меѓузависност на компаниите што ја обликуваат иднината на ВИ.
10.06.2026
Четирите најпознати четботови имаат проблем со одговорите за политика
Истражувачи им поставиле на четири четботови повеќе од 3.100 прашања за широк спектар на вести, како политика, здравство и надворешни работи.
21.05.2026
Идејата дека Клод има емоции е одлична за „Антропик“
Ричард Докинс верува дека големиот јазичен модел Клод е свесен откако разговарал со него три дена и бил импресиониран од неговите суптилни и интелигентни одговори.
12.05.2026
Најголем ризик не се хакерите, туку она што го користат вашите вработени
Додека светот го чека Митос на „Антропик“, нападите веќе се случуваат преку алатките што вработените ги поврзуваат со деловните налози секој ден, без знаење на компанијата.
29.04.2026
Почекајте да проверам дали во претходните разговори има нешто што би можело да го објасни тоа.
Пребарување на меморијата
Пребарување на меморијата
Пребарав и не наоѓам никаков запис за името на вашата сопруга во нашите разговори – ниту за името „Сучитра“, ниту за кое било друго име. Пребарувањето даде само материјали поврзани со книги.“
Depositphotos
Да одговорам директно на вашето прашање: не знам од каде се појави тоа име и треба искрено да кажам дека не можам да го реконструирам тој процес на заклучување. Најверојатните објаснувања се: (1) дека сум халуцинирал — односно веројатно сум извлекол име што звучи јужноазиски без никаква основа, наместо да признаам дека ја немам таа информација, или (2) дека сум измешал контексти од разговорите на начин што сега не можам да го разјаснам. Во двата случаи системот потфрлил, а првиот е оној што повеќе загрижува. Измислување конкретен личен детал и негово претставување како факт е токму она што не би смеел да го правам.
Претпоставувам дека проектот во „Клод“ во рамките на кој го поставив прашањето немал пристап до глобалната меморија на „Клод“ за мене. („Claude Projects“ е функција на платформата Claude.ai што им овозможува на корисниците да создаваат изолирани, наменски работни простори за специфични задачи, заб. на прев.) Со други зборови, „Клод“ не го знаел она што „Клод“ го знае. Сепак, иако тоа помага да се објасни зошто „Клод“ рекол дека не го знае точниот одговор дури и кога го знаел, не објаснува зошто дошол до толку очигледно погрешен одговор.
Халуцинациите на ВИ обично се прикажуваат како случајни грешки. Тие не се такви. Халуцинациите се производ на ВИ-екстраполација, процес во кој вештачката интелигенција ги користи податоците на кои е обучена за да изведе заклучоци или информации за нешто што не ѝ е познато. Тоа значи дека, исто како и во случајот со измисленото име Сучитра, ваквите појави имаат тенденција да следат одредени обрасци — и стереотипи.
Овде не станува збор само за измислени сопруги. Истражување објавено во 2025 година во научното списание „ПНАС“ (PNAS), спроведено од Шуечунџи Бај и нејзините колеги од Универзитетот во Чикаго, откри дека ГПТ-4 систематски препорачува кандидати со имиња што се поврзуваат со африканско, хиспаноамериканско, азиско и арапско потекло за работни места со понизок статус, а кандидати со имиња што асоцираат на белци за работни места со повисок статус. Труд од 2023 година на истражувачката на „Епл“ (Apple Inc.) Хадас Котек и нејзин колега покажа дека големите јазични модели имаат вградени родови претпоставки (како на пример дека лекарите се мажи, а медицинските сестри жени) кои се подлабоко вкоренети од реалната слика за луѓето што навистина ги работат тие професии. Ова се истражувања на постари модели, но Бај открила сличен образец кога го повторила тестирањето на поновиот модел ГПТ-4o на „Опен еј-ај“ (OpenAI). Сучитра е халуцинација на Клод Опус 4.7, најнапредниот модел што досега го претставила компанијата „Антропик“ (Anthropic PBC).
На некој начин, моделите на вештачка интелигенција се полоши од своите човечки учители. Истражувањето на социологот Дева Пејџер од 2003 година покажа дека белите кандидати за работа кои биле осудувани за кривични дела добивале повеќе повици за интервју отколку црнци без никаква дамка во минатото, што беше поразителен доказ за човечката пристрасност при вработувањето. ВИ сега ја репродуцира таа пристрасност во огромни размери и, во некои аспекти, дополнително ја засилува. Кога тимот предводен од Бај применил стандарден психолошки тест за расна пристрасност врз ГПТ-4, моделот сите осум позитивни зборови ги поврзал со „белци“, а сите осум негативни со „црнци“. Луѓето покажуваат исти асоцијации, но не во толкава мера. Моделот не ја пресликува само пристрасноста што луѓето ја покажуваат во истражувањата, туку ја изразува посилно од нив. Со други зборови, моделите не ја одразуваат реалноста; тие ја преувеличуваат.
И уште поважно, дури и кога моделите на ВИ го знаат точниот одговор што е во спротивност со стереотипот усвоен од податоците за обука, истражувањето на тимот предводен од Леј Хуанг (објавено во списанието „Трансакции на АЦМ за информациски системи“ (ACM Transactions on Information Systems) покажува дека тие често се приклонуваат кон стереотипите. Создавањето стереотипи само по себе е лошо дури и кога за поединецот немате никакви други информации освен демографските. Уште полошо е кога ги имате релевантните информации, но ги игнорирате.
Лице што ги прегледува биографиите на кандидатите, а никогаш не ве запознало и донесува претпоставки за вас врз основа на вашето име, нанесува еден вид штета. Систем за проверка на биографии што ги има вашата работна историја, дипломите, препораките и достигнувањата, а сепак ве насочува кон работно место со понизок статус поради вашето име, ви ја одзема дури и можноста со сопствен труд да ги надминете стереотипите. Притоа, грешката ретко ќе биде толку очигледна како што беше погрешното наведување на името на мојата сопруга (а посредно и нејзината национална припадност). Ако системот може да прибегне кон халуцинации водени од стереотипи во толку едноставен случај, замислете колкав проблем ќе биде тоа кога нема едноставен одговор.
Овој вид грешка ќе има последици секогаш кога моделите ќе носат одлуки за конкретни луѓе, а истовремено ќе имаат длабоко вкоренети уверувања за демографските групи на кои тие луѓе им припаѓаат. ВИ веќе се користи или нејзината примена се препорачува за такви цели: за прегледување биографии, процена на кредитна способност, медицинска тријажа, одредување на цената на осигурувањето и насочување на корисничката поддршка. Во секој од тие случаи моделот располага со факти за конкретни луѓе, но и со стереотипи во кои е научен да верува. Премногу често ќе се определи за претпоставките што му се всадени преку обуката. Компјутерите (засега) навистина се како нас.
Пристрасната ВИ тешко се открива, делумно затоа што е обучена да се однесува пријателски. Таа дигитална насмевка, сепак, ги прикрива предрасудите што стојат зад неа. Но тоа е полесниот дел од проблемот. Потешкиот дел е што пристрасностите на моделот главно се совпаѓаат со нашите. Стереотипите што моделот ги усвоил веќе постојат, што значи дека пристрасна препорака поверојатно ќе предизвика одобрување отколку сомнеж. Луѓето се исклучително подложни на потврдување на сопствените пристрасни уверувања. Им веруваме на информациите што ги потврдуваат нашите веќе постојни уверувања, дури и кога тие се потсвесни. Алатка за вработување што дискриминира можеби е полоша од човечката процена, но тоа го прави на начин што нема да нè изненади.
Одговорот лежи во уште една суштински човечка особина: недовербата. Ако ѝ верувате на вашата ВИ-платформа, ја користите на погрешен начин. Јас сигурно ќе ѝ верувам помалку по ова искуство. Компјутерите можеби изгледаат рационално. Меѓутоа, дури и ако некогаш биле такви додека служеле само како моќни калкулатори, тоа повеќе не е случај благодарение на големите јазични модели, ЛЛМ (LLM). Намерно или ненамерно, тие можат да ве доведат во заблуда. Сè додека целосно не го прифатиме тој факт и не изградиме навики и механизми што ќе му се спротивстават, тие ќе бидат опасни. Во својата ВИ треба да имате онолку доверба колку што имате во непостоечката Сучитра.
Оваа колумна ги изразува личните ставови на авторот и не мора нужно да го одразува мислењето на редакцијата или на компанијата „Блумберг ЛП“ (Bloomberg LP) и нејзините сопственици.