شرکت چینی علیبابا از نسخه جدید مدل هوش مصنوعی خود با نام Qwen2.5-Max پرده برداشت. این مدل با ارائه قابلیتهای چشمگیر، پا را از رقبا فراتر گذاشته و حتی از DeepSeek-V3 پیشی گرفته است.
علیبابا در بیانیهای اعلام کرد که مدل Qwen2.5-Max در آزمونهای معتبری همچون Arena-Hard، LiveCodeBench و GPQA-Diamond، عملکردی به مراتب بهتر از DeepSeek V3 داشته است. در سایر آزمونها نیز این مدل تقریبا همسطح با DeepSeek ظاهر شده و در برخی موارد حتی از GPT-4o و Llama-3.1-405B نیز فراتر رفته است.
به نظر میرسد در دنیای هوش مصنوعی، شاهد تحولات جدیدی هستیم. مدلهای جدیدی که توسط علیبابا و DeepSeek توسعه یافتهاند، نشان میدهند که برای دستیابی به کارایی بالا، نیازی به سرمایهگذاریهای هنگفت نیست. با بهینهسازی معماری هوش مصنوعی، میتوان مدلهایی کمهزینه و در عین حال کارآمد ایجاد کرد.