Alibaba’dan DeepSeek’e karşı ‘daha iyi’ yapay zeka modeli

Şirketin WeChat hesabından yapılan açıklamada, “Qwen 2.5-Max” ismi verilen versiyonunun, Microsoft takviyeli OpenAI’ın “GPT-4o”, Facebook’un çatı şirketi Meta’nın geliştirdiği Llama 3.1 üzere modellerin yanı sıra DeepSeek’in V3 modelinden daha yeterli performans gösterdiği aktarıldı.
Çinli şirket DeepSeek, geliştirdiği düşük maliyetli Büyük Lisan Modeli (LLM) ile ABD’li şirketlerin hakim olduğu dalda sarsıntıya yol açmıştı.
Alibaba’nın modelin yeni versiyonunu, Çin’de tatil olan Bahar Bayramı’nın birinci gününde piyasaya sürmesi, DeepSeek’in muvaffakiyetinin sırf Amerikan şirketlerini değil Çin’deki bölüm devlerini de yapay zeka modellerini geliştirme baskısı altında bıraktığını gösteriyor.
Şirket paylaşımında Qwen 2.5-Max’ın bilgi süreç, programlama, bütünleşik kapasitelerin kapsamlı değerlendirmesi ve insan tercihlerine ahenk testlerinde açık kaynaklı muadillerinden daha başarılı olduğu, Amazon dayanaklı Claude-3.5-Sonnet’e yakın performans gösterdiği aktarıldı.
Çinli şirket DeepSeek’in düşük bir bütçeyle geliştirdiği “DeepSeek V3” isimli modelin, ABD’de büyük yatırımlarla geliştirilen muadillerinden daha düzgün performans sergilemesi Amerikan teknoloji şirketlerinin paylarının kıymet kaybetmesine yol açmıştı.
AA