„Дипсик“ (DeepSeek) соработува со Универзитетот Цингхуа за да го намали времето потребно за обука на неговите модели со вештачка интелигенција, со крајна цел да ги намали и оперативните трошоци. Кинескиот стартап што го потресе пазарот во јануари со својот прифатлив модел за заклучоци, заедно со истражувачите од Пекинг, подготви научен труд во кој опишува нов пристап за зајакнување на учењето, со кој има цел да ја зголеми ефективноста на моделите.
Новиот пристап се очекува да им помогне на моделите со вештачка интелигенција подобро да ги следат човечките преференции бидејќи добиваат награди за поточни и поразбирливи одговори, напишаа истражувачите. Засиленото учење веќе се покажа како ефикасно во забрзување на задачите во тесно насочени наредби. Сепак, останува предизвик извршувањето поопшти задачи - и токму тој проблем тимот на „Дипсик“ има цел да го реши со пристапот што го нарекува „самопринципиелно приспособување на критиките“. Според статијата, стратегијата ги надминала постојните методи и модели во различни тестови и постигнала подобри резултати со помалку компјутерски ресурси.
„Дипсик“ ги нарекува своите нови модели Дипсик-ГРМ (DeepSeek-GRM) - скратено за „општо моделирање награди“ - и планира да ги објави како решение со отворен код, соопшти компанијата. Други развивачи на вештачка интелигенција, вклучувајќи ги и кинескиот технолошки гигант „Алибаба“ (Alibaba Group) и „Опен еј-ај“ (OpenAI) со седиште во Сан Франциско, исто така работат на подобрување на способностите на моделите за заклучување и самокорекција во реално време додека ги извршуваат задачите.
Прочитај повеќе

Лама 4 - нови моќни модели на вештачка интелигенција од „Мета“
За Лама 4 компанијата вели дека се изградени врз основа на најнапредните големи јазични модели во светот.
08.04.2025

Ни најнапредната ВИ не може да замени некои професии, тврди Бил Гејтс
Гејтс предупредува дека многу професии ќе исчезнат, но некои остануваат незаменливи
30.03.2025

Иднината на вештачката интелигенција се сели на Блискиот Исток
Владите на земјите од Персискиот Залив исклучително ја поддржуваат дигиталната трансформација.
31.03.2025

Кога вештачката интелигенција станува сојузник на животот
Вештачката интелигенција со години е присутна во медицината, каде што се користи за автоматизирање на дијагностиката и за подобрување на третманот.
27.03.2025

Маск, „Мајкрософт“ и „Блекрок“ влегуваат во проект за ВИ тежок 30 милијарди долари
„Мајкрософт“, кој вложи околу 13 милијарди долари во „Опен еј-ај“, сè повеќе развива ВИ надвор од тоа партнерство.
24.03.2025

Пробив на вештачката интелигенција во Кина: „Ент“ развива модели без „Енвидија“
Кинеските компании се обидуваат да користат локални алтернативи за најнапредните полупроводници.
24.03.2025
„Мета“ од Менло Парк, Калифорнија, во текот на викендот го претстави своето најново семејство на модели со вештачка интелигенција, Лама 4 (Llama 4), кои се првите што ја користат архитектурата „Мешавина на експерти“ - МоЕ („Mixture of Experts“ - MoE). Моделите на „Дипсик“ главно се засновани токму на таа архитектура за поефикасно користење на ресурсите, а „Мета“ ги спореди своите модели со стартапот од Хангжу. „Дипсик“ сè уште не откри кога ќе го објави својот следен модел.