"DeepSeek": OpenAI-dən daha ucuz, daha səmərəli və açıq mənbəli Sİ inqilabı

Texno

27.01.2025 / 13:35

"DeepSeek": OpenAI-dən daha ucuz, daha səmərəli və açıq mənbəli Sİ inqilabı

63838

Çinin "DeepSeek" adlı Süni İntellekt (Sİ) startapı tərəfindən hazırlanmış geniş dil modeli "DeepSeek-R1" "OpenAI"nin "o1" modelinə rəqib olaraq alimlərin marağına səbəb olub.

Valyuta.az-ın məlumatına görə, bu model həm əlçatan qiyməti, həm də tədqiqatçılar üçün açıq olması ilə diqqət çəkir. "DeepSeek-R1", insan düşüncəsinə bənzər bir proseslə mərhələ-mərhələ cavablar yaratmaq qabiliyyətinə malikdir. Bu, modeli əvvəlki dil modellərindən daha funksional edir və onun elmi problemlərin həllində daha yararlı olmasını təmin edir.

20 yanvarda yayımlanan ilkin testlər göstərib ki, "R1" modeli kimya, riyaziyyat və kodlaşdırma kimi sahələrdə müəyyən tapşırıqlarda "OpenAI"nin "o1" modeli ilə eyni səviyyədə performans göstərir. Xüsusilə "o1" 2023-cü ilin sentyabrında buraxıldıqda alimləri heyran etmişdi.

"Bu, tamamilə gözlənilməz və heyrətamizdir" - deyə, Böyük Britaniyada yerləşən "DAIR.AI" süni intellekt məsləhət şirkətinin həmtəsisçisi Elvis Saravia "X" platformasında bildirib.

Açıq modelin üstünlükləri

"R1"in fərqləndirici xüsusiyyətlərindən biri də onun “açıq-çəki” modeli kimi təqdim edilməsidir. "DeepSeek" startapı "MIT" lisenziyası altında yayımladığı bu modeli tədqiqatçılara öyrənmək və inkişaf etdirmək üçün təqdim edib. Lakin təlim məlumatlarının açıqlanmaması səbəbindən model tamamilə açıq mənbəli hesab edilmir.

"DeepSeek"in bu yanaşması haqqında danışan Almaniyanın Erlangen şəhərində yerləşən Maks Plank İşıq Elmləri İnstitutunun Süni Alim Laboratoriyasının rəhbəri Mario Krenn bildirib: "DeepSeek-in açıqlığı olduqca diqqətəlayiqdir."

O, əlavə edib ki, "OpenAI"nin "o1" və sonuncu "o3" modelləri, eləcə də digər analoji sistemlər "mahiyyətcə qara qutu" olaraq qalır.

Modelin sərfəliliyi də diqqət çəkir.

"DeepSeek", "R1" interfeysindən istifadənin xərclərinin "o1" modelindən təxminən otuz dəfə ucuz olduğunu açıqlayıb. Şirkət, həmçinin məhdud hesablama gücünə malik tədqiqatçılar üçün "R1"in kiçik, "distillə edilmiş" versiyalarını təqdim edib. Mario Krenn bu mövzuda bildirib: "o1 ilə 300 funt sterlinqdən çox xərc tələb edən bir eksperiment, R1 ilə cəmi 10 dollara başa gəldi. Bu dramatik fərq modelin gələcəkdə daha geniş yayılmasına təsir göstərəcək."

Çin modellərinin inkişafı

"R1", Çində geniş dil modellərinin sürətli inkişafının bir hissəsidir. Bu yaxınlarda "hedc fondu" əsasında yaradılan "DeepSeek", dekabr ayında təqdim etdiyi "V3" adlı çatbotla tanınıb. "V3" məhdud büdcə ilə hazırlanmasına baxmayaraq əsas rəqiblərini geridə qoyub. Mütəxəssislər təxmin edir ki, "DeepSeek"in "R1" modelinin təlimi üçün təxminən 6 milyon dollar xərclənib. "Meta"nın "Llama 3.1" modelinin təlimi üçün 60 milyon dollardan çox büdcə ayrılıb və 11 dəfə çox hesablama resursları istifadə edilib.

"DeepSeek"in uğuru, ABŞ-ın Çin şirkətlərinə süni intellekt prosessorları üçün yüksək keyfiyyətli çiplərin ixracını məhdudlaşdırdığı bir şəraitdə əldə olunub. Sietldə yerləşən süni intellekt tədqiqatçısı Fransua Şolle bu barədə deyib: "Bu modelin Çindən gəlməsi, resursların səmərəli istifadəsinin hesablama gücündən daha vacib olduğunu göstərir."

Texnologiya eksperti Alvin Vanq Qreylin isə qeyd edib ki, bu nailiyyət ABŞ-ın süni intellekt sahəsində üstünlüyünün xeyli daraldığını göstərir. O, iki ölkənin süni intellekt sahəsində əməkdaşlıq etməli olduğunu vurğulayaraq bildirib: "Hazırkı nəticəsiz yarış yanaşmasını davam etdirmək əvəzinə, inkişaf etmiş süni intellekt texnologiyasının birgə qurulması məqsədəuyğun olardı".

Valyuta.az

© Materiallardan istifadə edərkən hiperlinklə istinad olunmalıdır.
Mətndə səhv varsa, onu qeyd edib ctrl + enter düyməsini basaraq bizə göndərin.