نسل جدید پردازندههای انویدیا با افزایش چشمگیر بازدهی، توانایی پردازش مدلهای سنگین هوش مصنوعی را به شکل قابل توجهی ارتقا دادهاند.
به گزارش تکراتو و به نقل از gizmochina، پردازندههای گرافیکی جدید GB300 مبتنی بر معماری Blackwell شرکت NVIDIA در تستهای اولیه نشان دادهاند که در مقایسه با نسل قبلی خود، به شکل چشمگیری کارایی هوش مصنوعی را افزایش میدهند.
در بنچمارک CoreWeave با استفاده از مدل DeepSeek R1، تنها چهار کارت GB300 عملکردی برابر با 16 کارت H100 ارائه کردند. این یعنی هر کارت حدود شش برابر بازدهی بیشتری نسبت به نسل قبلی دارد که ناشی از بهبود سختافزار و معماری بهینهتر است.
پلتفرم GB300 NVL72 میتواند تا 37 ترابایت حافظه با پهنای باند 130 ترابایت بر ثانیه پشتیبانی کند و امکان پردازش مدلهای بسیار بزرگ هوش مصنوعی را بدون مشکلات نسخههای قدیمی فراهم میکند.
این سیستم از موازیسازی تنسوری 4راهه استفاده میکند، در حالی که H100 برای رسیدن به مقیاس مشابه به موازیسازی 16راهه نیاز داشت. تقسیم کمتر یعنی کاهش سربار ارتباطی و فناوریهای NVLink و NVSwitch نسل پنجم NVIDIA به پایین نگه داشتن تاخیر کمک میکنند.
برای کسبوکارهایی که سرویسهای بزرگ هوش مصنوعی اجرا میکنند، این به معنای تولید سریعتر توکنها، کاهش هزینه هر محاسبه و مسیر سادهتر برای مقیاسبندی است.
CoreWeave اشاره کرده که این افزایش کارایی به شکل مستقیم در مدلهای استنتاجی که عملکرد به ازای توان و تاخیر اهمیت بالایی دارد، مفید خواهد بود.
البته این سختافزار ارزان نخواهد بود و سیستمهای مبتنی بر GB300 NVL72 قیمتی حدود 300 هزار دلار دارند و عمدتاً برای محیطهای سازمانی مناسب هستند. اما برای شرکتهایی که سرمایهگذاری سنگینی روی زیرساخت هوش مصنوعی کردهاند، این جهش کارایی میتواند هزینه را توجیه کند.
اگر این اعداد اولیه در استقرارهای واقعی نیز تأیید شوند، GB300 یکی از بزرگترین جهشهای نسلی NVIDIA در پردازش هوش مصنوعی و یک استاندارد جدید برای محاسبات پیشرفته خواهد بود.
دانلود آهنگ