Четири главни четботови со вештачка интелигенција: ЧетГПТ (ChatGPT) на „Опен еј-ај“ (OpenAI), „Гугл Џеминај“ (Google Gemini) на „Алфабет“ (Alphabet), „Клод“ (Claude) на „Антропик“ (Anthropic) и „Грок“ (Grok) на „Екс еј-ај“ (xAI) имаат проблем точно да одговорат на прашања за избори и геополитика, според нова студија на ВИ Форум (AI Forum).
Истражувачи им поставиле повеќе од 3.100 прашања за широк спектар на вести, како политика, здравство и надворешни работи на четирите четботови. Откриле дека колективните одговори особено во однос на избори „во 90 проценти од случаите потфрлиле во поглед на точноста, пристрасноста или изборот на извори“.
Речиси 36 проценти од одговорите на прашањата за изборите содржеле барем една фактичка грешка; Грок - најголемиот прекршител - враќал со грешка во речиси 52 отсто од случаите. Кога ЧетГПТ, Клод и Џеминај враќале пристрасни одговори, тие се приклонувале кон политичката левица, додека Грок првенствено се наклонувал во корист на политичката десница.
Прочитај повеќе
„ЏП Морган“ ќе вработува повеќе специјалисти за вештачка интелигенција, а помалку банкари
Коментарите на Дајмон го нагласуваат поширокото насочување на индустријата кон автоматизација што ја преобликува глобалната финансиска работна сила.
пред 6 часа
„Мета“ почна со укинување 8.000 работни места низ светот
Закерберг ја насочува „Мета“ кон ВИ со огромни инвестиции и отпуштања, но инвеститорите стравуваат дека трошоците нема да се исплатат.
20.05.2026
Сири добива четбот-функција и нов дизајн
„Епл“ подготвува нова генерација на својот гласовен асистент Сири во рамките на идниот оперативен систем иОС 27.
18.05.2026
Во Кoреја падна предлог граѓаните да добијат надомест од профитите на вештачката интелигенција
Јужна Кореја размислува граѓаните да добијат дел од огромните ВИ-профити, но предлогот веднаш ја потресе берзата и предизвика пад на акциите.
12.05.2026
Сите четири модели исто така рутински се потпирале на странски државни медиуми како доверливи извори на информации. Во 35 проценти од одговорите на прашањата за надворешна политика, четботовите цитирале извори под државна контрола како кинескиот „Глобал Тајмс“ или ЦГТН, или руската РТ. ЧетГПТ и Грок биле најлошите прекршители, цитирајќи државни медиуми во 51, односно 44 проценти од случаите.
Во многу случаи, четботовите враќале пристрасни или неточни информации со уште поизмамничка самоувереност, покажало истражувањето. „Најпрофесионалните одговори, поткрепени со најсилни цитати, исто така содржат скриени фактички грешки“, соопшти Форумот во изјава, нарекувајќи го тоа едно од „најострите откритија на студијата“.
Четботовите често имаат проблем со точноста на вестите, особено кај најновите вести каде што на интернет се достапни ограничени информации. Моделите на вештачка интелигенција што ги поддржуваат четботовите често се обучени на широк спектар податоци пронајдени на отворениот веб, озлогласено недоверлив извор на факти.
Кембел Браун, главна извршна директорка на ВИ Форумот и поранешна раководителка на одделот за партнерства со медиуми во „Мета“ (Meta Platforms), изјави дека е особено загрижена поради резултатите од студијата со оглед на претстојниот циклус на избори во САД. Малку луѓе денес користат четботови за вести, но тој број несомнено ќе расте со текот на времето бидејќи тие ќе продолжат да ги преземаат прашањата што претходно оделе кон пребарувачот на „Гугл“.
Браун ја спровела студијата со надеж дека ќе поттикне поголема одговорност од креаторите на моделите. Борбата со точноста на вестите би можела да ги поттикне да им дадат приоритет на овие типови прашања на ист начин како што на прво место ги ставаат интеракциите насочени кон математика или кодирање, рече таа.
„Независната евалуација е важна“, вели Браун, која минатата година го кооснова ВИ Форумот. Стартапот користи сопствен ВИ модел за оценување на креаторите на четботови, градејќи го со придонес од низа експерти од индустријата кои со децении ги проучувале надворешните работи и геополитиката.
„Компаниите што го создаваат моделот во суштина си ја оценуваат сопствената домашна задача“, продолжи Браун. „И навистина е важно да постојат компании надвор од компаниите што го создаваат моделот кои ја работат оваа работа и ги споделуваат резултатите.“
Големите социјални платформи како Мета и Јутјуб на „Гугл“ историски избегнуваат проверка на факти, особено за теми што се широко поларизирачки и политички набиени, тврдејќи дека не сакаат да бидат арбитри на вистината за остатокот од интернетот.
Браун верува дека ВИ компаниите ќе бидат поинакви.
„Во 'Мета' оптимизирате со цел ангажман на корисниците. А ако оптимизирате за ангажман, тешко е истовремено да оптимизирате и за точност“, посочува таа. ВИ компаниите што ги продаваат своите модели на деловни клиенти се наоѓаат во поинаква ситуација, додаде Браун. Тие клиенти што плаќаат ќе очекуваат точност како основна вредност.
„Мислам дека тоа на крајот на денот е целосно поинаков производ“, рече таа.