Alibaba, Qwen2.5-Max ile yapay zekâ dünyasında çığır açıyor: GPT-4’ü geçti
21 okunma

Alibaba, Qwen2.5-Max ile yapay zekâ dünyasında çığır açıyor: GPT-4’ü geçti

ABONE OL
29/01/2025 15:48
Alibaba, Qwen2.5-Max ile yapay zekâ dünyasında çığır açıyor: GPT-4’ü geçti
0

BEĞENDİM

ABONE OL

Alibaba, yeni yapay zekâ modeli Qwen2.5-Max’i duyurdu. Yapay zekâ dünyasında dikkat çeken bu model, girdiği testlerde DeepSeek V3 ve GPT-4 gibi rakiplerini geride bırakarak önemli bir başarıya imza attı. Çinli teknoloji devi Alibaba, Qwen2.5-Max ile AI alanındaki iddialı yolculuğunu sürdürüyor.

QWEN2.5-MAX’İN TEST SONUÇLARI VE PERFORMANSI

Qwen2.5-Max, Arena-Hard testinde birinci, LiveBench testinde ise tüm rakiplerini geride bırakarak üstün performans sergiledi. MMLU-Pro testinde üçüncülük, GPQA-Diamond ve LiveCodeBench testlerinde ise ikinci sırada yer aldı. Bu sonuçlar, modelin insan benzeri düşünme yeteneğiyle ön plana çıktığını gösteriyor.

ÇİNLİ YAPAY ZEKÂ GİRİŞİMİ DEEPSEEK VE GPT-4’E KARŞI BAŞARI

Alibaba, Qwen2.5-Max’in DeepSeek-V3, GPT-4 ve Llama-3.1-405B gibi rakip modelleri geride bırakmasının ardından, Çin’deki tatil dönemine denk gelen bu duyuruyu gerçekleştirdi. Qwen2.5-Max, insan tercihlerine yönelik yapılan Arena-Hard testinde, rakiplerinden daha iyi sonuçlar alarak bu alandaki üstünlüğünü kanıtladı.

QWEN2.5-MAX: GERÇEK KULLANIMDA NE SUNUYOR?

Alibaba, Qwen2.5-Max’i Owen Chat arayüzü üzerinden kullanıcılara sunmuş durumda. Yeni yapay zekâ modelinin gerçek kullanımda sunduğu performansı ise zamanla kullanıcılar tarafından yapılacak testler ortaya koyacak.Alibaba, yeni yapay zekâ modeli Qwen2.5-Max’i duyurdu. Yapay zekâ dünyasında dikkat çeken bu model, girdiği testlerde DeepSeek V3 ve GPT-4 gibi rakiplerini geride bırakarak önemli bir başarıya imza attı. Çinli teknoloji devi Alibaba, Qwen2.5-Max ile AI alanındaki iddialı yolculuğunu sürdürüyor.

QWEN2.5-MAX’İN TEST SONUÇLARI VE PERFORMANSI

Qwen2.5-Max, Arena-Hard testinde birinci, LiveBench testinde ise tüm rakiplerini geride bırakarak üstün performans sergiledi. MMLU-Pro testinde üçüncülük, GPQA-Diamond ve LiveCodeBench testlerinde ise ikinci sırada yer aldı. Bu sonuçlar, modelin insan benzeri düşünme yeteneğiyle ön plana çıktığını gösteriyor.

En az 10 karakter gerekli


HIZLI YORUM YAP

SON DAKİKA HABERLERİ

GÜNDEM

6 saat önce

İmamoğlu’ndan ‘ön seçim’ açıklaması : Yol haritası için tarih verdi

SPOR

1 gün önce

Oğuz Çetin hastaneye kaldırıldı!

GÜNDEM

2 gün önce

Kılıçdaroğlu cephesinden beklenen açıklama geldi: ‘Genel Başkanımız ifade vermeyecek, Erdoğan dinlensin’

GÜNDEM

3 gün önce

CHP’ye ‘kurultay’ soruşturması… Kemal Kılıçdaroğlu kararını verdi: İfadeye gidecek mi?

SPOR

3 gün önce

UEFA Şampiyonlar Ligi’nde play-off heyecanı başlıyor!

SPOR

3 gün önce

Fenerbahçe’li futbolcular C. Alanyaspor galibiyetinin ardından açıklamalarda bulundu

GÜNDEM

6 gün önce

Microsoft Edge, yapay zeka ile “korkutucu” yazılımları engelleyecek

GÜNDEM

6 gün önce

Çok konuşulacak ‘Ankara’ kulisi… AKP’de ‘İmamoğlu’ paniği: ‘Cumhurbaşkanı’na gittiler’ iddiası

GÜNDEM

7 gün önce

Ekrem İmamoğlu’na iddianameye Özgür Özel’den ilk tepki: ‘El mi yaman, bey mi yaman göreceğiz!’

EKONOMİ

8 gün önce

Enflasyon ve vergiler maaşları cebe girmeden eritti: Toplam kayıp dudak uçuklattı!

GENEL

8 gün önce

Spotify, tarihinde ilk kez yıllık kâr açıkladı

GÜNDEM

8 gün önce

Teğmenlerin TSK’dan ihraç kararında gerekçe açıklandı

GÜNDEM

9 gün önce

Bilmediğiniz yol tariflerini almanızı sağlayan gizli Google Haritalar özelliği

SPOR

10 gün önce

Volkan Demirel’in Bodrum FK macerası kısa sürdü: 19 takımlı Süper Lig’de Volkan Demirel sezon başından beri görevinden ayrılan 20. teknik adam oldu

GÜNDEM

10 gün önce

NATO: Almanya askeri harcamalarını artırmalı

GÜNDEM

11 gün önce

Barolar Birliği’nden teğmen ihraçları açıklaması

GÜNDEM

11 gün önce

Zafer Partisi’nden Ümit Özdağ için dilek balonu eylemi

GÜNDEM

12 gün önce

Depodaki ürünü çürümeden satılsın isteyen üretici ‘Erdoğan’ın patates talimatı’ açıklamasıyla umutlandı

GÜNDEM

12 gün önce

Teğmenlere ihraç: Özgür Özel’den ilk açıklama!

GÜNDEM

14 gün önce

Bilgisayarınız size yalan mı söylüyor? Meğer çöp kutusunu boşaltmak yetmiyormuş

ethereum
Ethereum (ETH) $ 2,722.22 4.42%
bitcoin
Bitcoin (BTC) $ 96,699.91 0.90%
official-trump
Official Trump (TRUMP) $ 15.54 1.09%
tether
Tether (USDT) $ 1.00 0.04%
bnb
BNB (BNB) $ 711.89 12.92%
xrp
XRP (XRP) $ 2.47 2.39%
tron
TRON (TRX) $ 0.240208 1.08%
litecoin
Litecoin (LTC) $ 122.96 4.62%
matic-network
Polygon (MATIC) $ 0.32362 5.07%
melania-meme
Melania Meme (MELANIA) $ 1.42 1.39%
dogecoin
Dogecoin (DOGE) $ 0.262247 3.74%
solana
Solana (SOL) $ 195.76 0.05%