Кинескиот „Дипсик“ (DeepSeek) објави труд во кој претставува поефикасен пристап за развој на вештачка интелигенција (ВИ), илустрирајќи ги напорите на кинеската индустрија за ВИ да се натпреварува со компании како „Опен еј-ај“ (OpenAI), и покрај недостигот од слободен пристап до чиповите на „Енвидија“ (Nvidia Corp).
Документот, коавторство со основачот Лианг Венфенг, претставува рамка наречена Manifold-Constrained Hyper-Connections. Таа е дизајнирана да ја подобри скалабилноста, а воедно да ги намали компјутерските и енергетските барања за тренирање напредни ВИ-системи, наведуваат авторите.
Ваквите публикации од „Дипсик“ и во минатото навестувале издавање на големи модели. Стартапот со седиште во Хангжу ја изненади индустријата пред една година со моделот Р1 (R1), развиен со дел од трошоците на неговите ривали од Силициумската долина. Оттогаш, „Дипсик“ објави неколку помали платформи, но очекувањата растат за нивниот следен водечки систем, популарно наречен Р2 (R2), кој се очекува околу Пролетниот фестивал во февруари.
Прочитај повеќе
Борба на моделите: Кој води во светот на вештачката интелигенција?
Малку повеќе од две години по дебито на ЧетГПТ, сцената со вештачка интелигенција е значително поразвиена, а алатките базирани на вештачка интелигенција станаа вообичаени. Чија е најдобра?
13.02.2025
Австралија забрани користење на Дипсик на владини уреди и системи
Ова е една од првите земји што презедоа директни мерки против кинескиот стартап за вештачка интелигенција.
04.02.2025
„Дипсик“ ја заобиколил забраната за набавка на чипови од „Енвидија“?
Американските власти истражуваат дали „Дипсик“ купил напредни чипови од „Енвидија“ во Сингапур преку трети лица...
31.01.2025
Вештачката интелигенција е жедна за струја, ќе го промени ли тоа „Дипсик“?
„Дипсик“ го потресе енергетскиот пазар откако неговиот модел со вештачка интелигенција ги оспори долгогодишните процени за потрошувачката на енергија.
30.01.2025
Кинеските стартапи и понатаму работат под значајни ограничувања, бидејќи САД го спречуваат пристапот до најнапредните полупроводници неопходни за развој и работа на ВИ. Тие рестрикции ги принудија истражувачите да се насочат кон неконвенционални методи и архитектури.
Што вели Bloomberg Intelligence
Претстојниот модел Р2 на „Дипсик“ — кој би можел да биде лансиран во наредните неколку месеци — има потенцијал повторно да го наруши глобалниот ВИ-сектор, и покрај неодамнешните успеси на „Гугл“. Моделот Џеминај 3 (Gemini 3) на „Гугл“ во ноември го престигна „Опен еј-ај“ и се искачи во топ-3 на рангирањето на „Лајвбенч“ (LiveBench) за перформанси на големи јазични модели (LLM). Кинеските нискобуџетни модели, развиени по дел од трошокот на конкурентите, зазедоа две места во топ-15.
— Роберт Ли и Џасмин Лиу, аналитичари
„Дипсик“, познат по своите неконвенционални иновации, го објави најновиот труд оваа недела преку платформата со отворен код ХФ (Hugging Face). Трудот наведува 19 автори, при што името на Лианг се појавува последно.
Основачот, кој постојано ја насочува истражувачката агенда на „Дипсик“, го поттикнува својот тим повторно да размислува како се градат големи ВИ-системи.
Најновото истражување се занимава со предизвици како нестабилност при тренирање и ограничена скалабилност, при што се истакнува дека новиот метод вклучува „строга оптимизација на инфраструктурата за да се обезбеди ефикасност“. Тестовите се спроведени на модели со опсег од 3 до 27 милијарди параметри, надоврзувајќи се на истражувањето на „Бајтденс“ (ByteDance Ltd.) од 2024 година за архитектури со хипер-конекции.
Техниката има потенцијал „за еволуција на фундаменталните модели“, наведуваат авторите.