Кинескиот стартап „Дипсик“ (DeepSeek) - судејќи според нивната онлајн најава - започна мала револуција во производството на нови модели за учење за системите за вештачка интелигенција (AI). Нивниот нов модел – „Дипсик-Р1“ (DeepSeek-R1) односно „Дипсик-Р1 зеро“ (DeepSeek-R1 Zero) - е за 98 проценти поевтин од моделите што се развиваат на Запад, според извештајот што компанијата го објави онлајн. Се вели дека производството чини помалку од шест милиони долари, додека според извршниот директор на „Антропик“ (Anthropic), Дарио Амодеи, слични системи во странство чинат и до сто пати повеќе.
Според експертите, новиот модел е речиси на исто ниво со моделите „Опен еј-ај 40“ (OpenAI 40) и подобар од, да речеме, моделот кој го развива „Мета“. А она што е најнеобично е дека кодот на „Дипсик“ е отворен, што значи дека теоретски секој може да го присвои и да го дополни по сопствена желба. Зошто „Дипсик“ го направи ова сè уште не е јасно, но во голема мера ќе ја расипе неделата за „Опен еј-ај“и другите кои го кријат својот код и наплаќаат повеќе за користење на нивните капацитети.
По посетата на „Опен еј-ај“ и „Дипсик“ гледаме дека користењето на АПИ (API) и нивните можности е исто така многу поевтино кај кинескиот провајдер. Многу корисници на X напишаа и дека имаат преземено локални варијанти на „Дипсик“ (мини) на сопствените компјутери, кои не се баш од високата класа, но функционираат. Марк Андресен, еден од најпознатите инвеститори во Силициумската долина, рече:
Прочитај повеќе
Што е кинеската „Дипсик“ и зошто го тресе светот на вештачката интелигенција?
„Дипсик“е основана во 2023 година од Лианг Венфенг, шеф на квантниот хеџ фонд „Хај-флаер“ (High-Flyer), управуван од вештачката интелигенција.
27.01.2025
Пазарите во црвено: Што се крие зад потресот на берзите?
„Дипсик“ ја доведе во прашање оправданоста за високите вреднувања на компаниите кои произведуваат опрема за центри за податоци поврзани со вештачката интелигенција.
27.01.2025
Трамп повика на доминација на САД во вештачката интелигенција
Претседателот Доналд Трамп повика на зајакнување на доминацијата на САД во вештачката интелигенција со извршна наредба.
24.01.2025
Пристапот на САД кон вештачката интелигенција треба да ја разбуди и Европа
Пристапот на САД треба да биде „аларм за будење“ за Европа да се организира и да инвестира во овој сектор.
23.01.2025
Како Кинезите успеаја да направат толку успешен модел? Па, ако ја следиме нивната објава, тие на третата страница напишаа дека користеле само засилено учење, без надзор, за да го постигнат посакуваниот резултат. Многу едноставно, тоа значи дека програмерите не ги испитувале самите процеси на размислување во процесот на изнаоѓање решение. Традиционално, при развивање на нови ЛЛМ (LLM) модели, програмерите го „наградуваа/казнуваа“ секој чекор што му беше потребен на моделот за да дојде до решение. Така, луѓето го казнувале моделот доколку направил грешка во чекорите/процесот и го наградувале доколку чекорот бил точен, со што го водат до целта да се дојде до вистинското решение.
Иновативен (и пред се храбар) метод
Методот на „Дипсик“ беше подиректен: тие го наградија моделот само за точното решение/одговор, а самиот процес беше избран од моделот - со што се намали бројот на чекори што требаше да се надгледуваат. Но, фактот дека моделот бил 99,9 отсто изграден само со помош на засилено учење е непобитен напредок.
Во извештајот се наведува дека моделот има проблеми со подолги разговори, повеќе јазици и дека понекогаш одговорите не се читаат. Не зборуваат многу за халуцинации, но признаваат дека се случуваат. Затоа сега ќе го надополнат овој модел со еден вид хибриден метод, каде преку моделот ќе го решат проблемот со замислувањето и пронаоѓањето на вистинските решенија - кога самиот модел не може да го направи тоа.
Како го добија компјутерскиот капацитет?
Една недела по лансирањето на новиот модел, кој веќе има значително влијание врз акциите на технолошките компании ширум светот, се‘ уште има многу непознати. „Волстрит џурнал“ подетално ја разгледа нивната проценка дека целиот процес чинел само 6 милиони долари.
„‚Дипсик‘ во технички извештај соопшти дека користела повеќе од 2.000 чипови на ‚Енвидија‘ за да го обучи својот В3 (V3) модел, во споредба со десетици илјади чипови за обука на модели со слична големина. Некои американски експерти за вештачка интелигенција неодамна се сомневаа дали ‚Хај-Флаер‘ (High-Flyer) и ‚Дипсик‘ имаат пристап до компјутерска моќ над она што е официјално наведено“, напиша весникот.
И самиот стартап „Дипсик“, според „МиТ тек ривју“ (MiT Tech Review) има: „Кинескиот медиум ‚36Kр‘ проценува дека компанијата има повеќе од десет илјади модерни чипови ‚Енвидија‘ на залиха, додека Дилан Пател, основач на консултантската компанија за истражување ‚Еј-ај семи анализис‘ (AI SemiAnalysis), проценува дека имаат најмалку 50.000“. Сите овие чипови, вклучувајќи го и Х100 (H100) на „Енвидија“, наводно биле купени пред навистина да стапат на сила санкциите.
Така, трошоците за развој на нов модел веројатно се многу повисоки, но кинеските компании не сакаат да ги обелоденат своите инвестиции во моќни чипови, бидејќи тоа може да го загрози дополнителниот прилив на приходи, кој и онака е веќе ограничен за нив.
Ограничувањата бараат адаптација
„Контролите на извозот во суштина ги принудија кинеските компании да влезат во агол каде што треба да бидат многу поефикасни со нивните ограничени компјутерски ресурси“, вели Мет Шихан, истражувач на вештачка интелигенција во Карнеги фондацијата за меѓународен мир. „Најверојатно ќе видиме голема консолидација во иднина, поттикната од недостиг од компјутерска моќ. Тоа е многу важна изјава. Основачот на „Дипсик“, Лианг Венфенг, даде слично мислење кога им зборуваше на кинеските медиуми за решението коешто го бараат.
А што засега се знае за новиот „Спутник“. Цената е веројатно многу повисока отколку што признава „Дипсик“, но нивното решение е револуционерно, пробивајќи го невидливиот ѕид на бавното машинско учење и што е најважно, го прави ова решение достапно за целиот свет.
„Спутник“ беше катализатор
„Иако останува да се види дали ‚Дипсик‘ ќе се покаже како остварлива и поевтина алтернатива на долг рок, првичните грижи се фокусираат на тоа дали ценовната моќ на американските технолошки гиганти е под закана и дали нивните огромни инвестиции во вештачката интелигенција треба да се преоценат“, изјави за „Блумберг“ Јун Ронг Јеап од „ИГ Азија“ (IG Asia).
Корисниците на новиот модел, исто така, забележаа дека тој одбива да одговори на чувствителни политички прашања за Кина и лидерот Шји Џјинпинг. Во некои случаи, производот дава одговори во согласност со официјалната пропаганда на Пекинг, наместо да ја вклучи перспективата на владините критичари, како што тоа го прави „ЧетГпт“. На пример, нема да добиете вистински одговори на прашањата за плоштадот Тјенанмен на „Дипсик“. Но, имајќи предвид дека тоа е решение со отворен код, ова може да се поправи и прилагоди на локалната средина во секое време.
Што значи ова за сите инвестиции?
Истата недела кога „Дипсик“ го претстави својот нов модел, САД го започнаа проектот „Старгејт“ (Stargate) - кој ќе обезбеди 500 милијарди долари за развој на нови центри за податоци и развојни центри за вештачка интелигенција. Ако го следиме развојот на вештачката интелигенција, таа сега ќе оди само во рајот. „Спутник“ полета во вселената во 1957 година - и само 12 години подоцна слетавме на Месечината. Ако мислевме дека спроведувањето на вештачката интелигенција во полн капацитет ќе потрае уште многу години, кинеските програмери го скратија тоа време. Мислата најдобро ја изрази Џим Фан, еден од попознатите истражувачи на „Енвидија“:
„Многу експерти се во паника за тоа како ‚Дипсик‘ може да успее со толку мал буџет. Јас на тоа гледам поинаку - со огромна насмевка на моето лице. Зошто не сме среќни за подобрувањата во законот за скалирање? ‚Дипсик‘ е недвосмислен доказ дека е можно да создадеме зголемување на капацитетот на интелигенција по десет пати помала цена, што значи дека ќе добиеме десет пати помоќна вештачка интелигенција со компјутерот што го имаме денес или го градиме за утре!“
Сите инвестиции во градењето капацитети ќе бидат уште попотребни, бидејќи многу земји, па дури и ЕУ, сега ќе можат да градат свои модели на вештачка интелигенција и да ги приспособат на нивните потреби за дел од трошоците за развој. Денешниот „Спутник“ ја започна трката, но оној со најголем капацитет и енергија да го напојува ќе биде победник.