logo logo

موضوع وبلاگ، اخبار و مجله نسل بعدی برای شما برای شروع به اشتراک گذاری داستان های خود از امروز!

اخبار کوتاه

دیپ سیک معماری جدید هوش مصنوعی برای آموزش بهینه مدل‌ها معرفی کرد‌

خانه » دیپ سیک معماری جدید هوش مصنوعی برای آموزش بهینه مدل‌ها معرفی کرد

avatar
Author

نویسنده


  • 2026-01-01

دیپ سیک (DeepSeek) با روش جدید mHC تلاش می‌کند آموزش مدل‌های بزرگ ابزار هوش مصنوعی را پایدارتر، کارآمدتر و کم‌هزینه‌تر کند.

قیمت روز گوشی های بازار ایرانقیمت روز گوشی های بازار ایران

به گزارش تکراتو و به نقل از gizmochina، آموزش مدل‌های بزرگ هوش مصنوعی یکی از بزرگ‌ترین چالش‌های محاسبات مدرن است و نه تنها به دلیل پیچیدگی، بلکه به دلیل هزینه، مصرف انرژی و منابع هدررفته دشوار شده است.

پژوهشی جدید از دیپ سیک روش تازه‌ای پیشنهاد می‌دهد که می‌تواند فشارهای ناشی از این مسائل را کاهش دهد.

همکاری تازه سامسونگ برای تقویت هوش مصنوعی اگزینوس 2600

این روش که manifold-constrained hyperconnection یا mHC نام دارد، تمرکز خود را بر آسان‌تر و قابل اعتمادتر کردن آموزش مدل‌های بزرگ هوش مصنوعی قرار داده است.

هدف این است که ناپایداری در طول آموزش کاهش یابد، مشکلی که معمولاً شرکت‌ها را مجبور می‌کند آموزش‌های پرهزینه را از ابتدا تکرار کنند.

به زبان ساده، بسیاری از مدل‌های پیشرفته هوش مصنوعی در میانه آموزش دچار خطا می‌شوند و در این صورت هفته‌ها تلاش، مقدار زیادی برق و هزاران ساعت پردازش GPU هدر می‌رود. رویکرد دیپ سیک با پیش‌بینی رفتار مدل حتی در هنگام بزرگ شدن، سعی دارد از این شکست‌ها جلوگیری کند.

چین قوانین سختگیرانه برای جلوگیری از خودکشی و خشونت ناشی از هوش مصنوعی تدوین کرد

این موضوع اهمیت زیادی دارد، زیرا آموزش هوش مصنوعی امروز مصرف انرژی بسیار بالایی دارد. اگرچه mHC باعث کاهش مصرف انرژی خود GPUها نمی‌شود، اما با جلوگیری از نیاز به تکرار آموزش‌ها، از هدررفت انرژی جلوگیری می‌کند.

مزیت دیگر این روش، بهبود کارایی در مقیاس بزرگ است. وقتی آموزش پایدارتر باشد، شرکت‌ها نیازی ندارند تنها با روش‌های پرمصرف مانند اضافه کردن GPUهای بیشتر، حافظه بیشتر یا طولانی‌تر کردن زمان آموزش، مشکل را حل کنند. این کار می‌تواند مصرف کلی انرژی در طول فرایند آموزش را کاهش دهد.

پلتفرم عینک هوشمند لوموس با تمرکز بر هوش مصنوعی توسط شارژ معرفی شد

پژوهش دیپ سیک مدعی حل فوری کمبود سخت‌افزار یا چالش‌های انرژی نیست، بلکه یک بهبود مهم و آرام محسوب می‌شود: استفاده بهینه‌تر از منابع موجود. با گذر زمان، چنین تکنیک‌هایی می‌توانند به توسعه‌دهندگان هوش مصنوعی کمک کنند مدل‌های قدرتمندتری با ساعت‌های پردازش کمتر و مصرف انرژی پایین‌تر آموزش دهند.

با رشد مدل‌های زبانی و افزایش اندازه آن‌ها، کاهش ناکارآمدی می‌تواند به اندازه افزایش عملکرد اهمیت پیدا کند و اینجاست که معماری جدید دیپ سیک می‌تواند تفاوت واقعی ایجاد کند.

منبع


0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest
0 نظرات
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها

اشتراک گذاری

لینک های مفید