„Мајкрософт“ (Microsoft) го претстави Битнет б1.58 (BitNet b1.58), нова верзија на голем јазичен модел со отворен код (LLM), оптимизиран за ефикасност во однос на големината. Во индустрија во која долго време доминираат сè поголеми модели за вештачка интелигенција (ВИ), Битнет навестува нов облик на ривалство - да се направи повеќе со помалку.
Битнет б1.58 користи комбинација од тернарна квантизација на тежинските коефициенти (-1, 0, +1) и осумбитна квантизација на активациите, што значително ги намалува пресметковните барања на моделот. Наместо вообичаените 16-битни или 32-битни записи со подвижен збир, Битнет користи подобро компресирани репрезентации, што овозможува ефикасно функционирање дури и на основен хардвер.
Прочитај повеќе

„Алибаба“ го претстави Квен 3 и го засили темпото во вештачката интелигенција
„Алибаба“ ја загрева трката за вештачка интелигенција со новата генерација модели Квен 3 со отворен код, кои може да се натпреваруваат со водечките играчи.
29.04.2025

Поранешен директор на „Гугл“: Компаниите влегуваат во ВИ на погрешен начин
Во интервју за „Блумберг Адрија“, Брет Сентклер зборува за најчестите грешки што ги прават компаниите со вештачката интелигенција.
28.04.2025

Престанете да му пишувате „благодарам“ на ЧетГПТ, тоа чини милиони
Секое пишување „благодарам“ или „молам“ на четботот чини дополнителни ресурси.
23.04.2025

На Македонија ѝ треба помош од ВИ за креирање стратегија за ВИ
Национална стратегија за ВИ нема, но преку Националната ИКТ-стратегија МДТ ја препознава вештачката интелигенција како клучна компонента за идниот дигитален развој на земјата.
17.04.2025
„Учењето на големи јазични модели користејќи тежински коефициенти со ниска резолуција е важен пристап за постигнување поголема ефикасност како при учењето така и при извршувањето“, напиша истражувачкиот тим на „Мајкрософт“ на својата страница на ХФ (Hugging Face). „Нашата работа докажува дека еднобитни-двобитни модели можат да постигнат споредливи перформанси со модели со висок степен на прецизност“.
Со околу две милијарди параметри, тренирани на четири трилиони текстуални единици, Битнет б1.58 постигнува конкурентни резултати со значително помала потрошувачка на меморија и енергија. Според податоците на „Мајкрософт“, Битнет троши до 96 проценти помалку енергија отколку традиционалните модели од истиот тип.
Предизвик за етаблираните гиганти
Потегот на „Мајкрософт“ се разликува од општоприфатената стратегија на највлијателните компании за вештачка интелигенција. ГПТ 4 на „Опен еј-ај“ (OpenAI), Џеминај 1.5 на „Гугл“ и Лама 3 (Llama 3) на „Мета“ стануваат сè поголеми и покомплексни, со што се зголемуваат и барањата за моќни центри за податоци и високи оперативни трошоци. Во споредба со нив, Битнет работи на процесори со скромни барања за меморија. Тестовите покажуваат дека на лаптоп со чип M2 од „Епл“ (Apple) може да работи веќе со 0,4 гигабајти РАМ, што е само дел од барањата на вообичаените модели.
Развојното опкружување, наречено bitnet.cpp, е дизајнирано за максимална оптимизација на процесорските перформанси. Според „Мајкрософт“, моделот постигнува и до 6,17 пати поголема брзина од стандардните x86 процесори и троши 82 процента помалку енергија при работа во споредба со моделите FP16.
Оваа насоченост кон енергетска ефикасност доаѓа во време кога се засилуваат критиките во врска со еколошкиот отпечаток на вештачката интелигенција. На пример, за тренирање на ГПТ 3 беа потрошени повеќе од 1.287 мегават-часа електрична енергија - што одговара на годишната потрошувачка на повеќе стотици домаќинства. Отпечатокот на Битнет е дизајниран така што е неспоредливо помал.
Depositphotos
Нова можност за пазарите во развој
За пазарите во развој Битнет нуди повеќе од технолошка новина, претставувајќи поместување кон поширока достапност на вештачката интелигенција. Во региони каде што пристапот до врвна компјутерска инфраструктура е ограничен, можноста за работа на напредни модели на локално достапна опрема може силно да го забрза развојот на решенија за ВИ.
Бидејќи моделот Битнет е со отворен код и е објавен под МИТ-лиценца, на програмерите и истражувачите им овозможува целосна слобода за приспособување, без ограничувања од лиценци или високи трошоци.
„Ваквата достапност е клучна за демократизација на вештачката интелигенција“, посочува Линас Белипнас, експерт за вештачка интелигенција, кој пишуваше за Битнет на Линкдин. „Сега повеќе не ви е потребен суперкомпјутер за работа со големи јазични модели“.
Пошироко значење
Битнет не е без ограничувања. Неговата лесна архитектура потешко управува со комплексни логички прашања и креативни задачи во споредба со посложените модели. „Мајкрософт“ признава дека Битнет б1.58 е првенствено истражувачки модел, наменет за докажување дека екстремната квантизација е можна, а не нужно совршена замена за сите видови задачи. И покрај тоа, стратегиските последици се јасни: со засилената регулација на вештачката интелигенција и сè поголемите трошоци за работа, ефикасните модели наскоро би можеле да станат нова норма.