دولت چین چطور دیپ سیک را خلق کرد؟
در دنیایی که هوش مصنوعی آینده را رقم میزند، چین با دیپسیک بیانیهای قدرتمند و جسورانه ارائه داده که کارشناسان هوش مصنوعی را با پیشرفتهای سریع و دستاوردهای انقلابی خود مبهوت کرده است. دیپسیک یک استارتاپ است که مدلهای زبانی عظیم پیشرفتهای را توسعه داده و اکنون قادر است با ابزارهای برتر هوش مصنوعی غولهای
در دنیایی که هوش مصنوعی آینده را رقم میزند، چین با دیپسیک بیانیهای قدرتمند و جسورانه ارائه داده که کارشناسان هوش مصنوعی را با پیشرفتهای سریع و دستاوردهای انقلابی خود مبهوت کرده است. دیپسیک یک استارتاپ است که مدلهای زبانی عظیم پیشرفتهای را توسعه داده و اکنون قادر است با ابزارهای برتر هوش مصنوعی غولهای فناوری ایالات متحده رقابت کند. آنچه دیپسیک را از بقیه متمایز میکند، توانایی آن در دستیابی به عملکردی چشمگیر با کسری از هزینه و قدرت محاسباتی مورد نیاز معمول است.
ظهور دیپسیک
در ۲۰ ژانویه، دیپسیک مستقر در هانگژو، مدل استدلالی دیپسیک‑R1 را معرفی کرد؛ مدلی متنباز که قادر است مسائل علمی پیچیده را در سطحی قابل مقایسه با پیشرفتهترین مدل زبانی اوپنایآی (o1) حل کند. اندکی پس از آن، دیپسیک مدل تولید تصویر Janus‑Pro‑7B را عرضه کرد که رقیب DALL‑E 3 اوپنایآی و Stable Diffusion از Stability AI است.
برای بسیاری، عملکرد دیپسیک‑R1 تحولی غیرمنتظره بود، اما کارشناسان داخلی چین آن را نتیجه طبیعی سیاستهای متمرکز چین بر هوش مصنوعی میدانستند. چین از دیرباز هوش مصنوعی را به عنوان یک بخش استراتژیک در اولویت قرار داده و با تأمین بودجههای سنگین دولتی، ابتکارات استعداد پرور و همکاریهای نزدیک میان صنعت و دانشگاه، زمینه را برای چنین دستاوردهایی فراهم نموده است.
دولت چین چطور دیپ سیک را خلق کرد؟
در ادامه نگاهی به عوامل موثر در خلق دیپ سیک داریم.
حمایت هدفمند دولت چین از پروژههایی مثل دیپ سیک
بلندپروازیهای چین در حوزه هوش مصنوعی در سال ۲۰۱۷ با تعیین هدف تبدیل شدن به رهبر جهانی هوش مصنوعی تا سال ۲۰۳۰ اعلام شد. هدف چین این است که تا سال ۲۰۲۵ به پیشرفتهای عمدهای در هوش مصنوعی دست یابد که او را در سطح یا حتی بالاتر از سایر ابرقدرتهای فناوری قرار دهد.
برای حمایت از این مأموریت، چین سرمایهگذاریهای قابل توجهی در حوزه آموزش هوش مصنوعی انجام داده است. تا سال ۲۰۲۲، بیش از ۴۴۰ دانشگاه مجوز ارائه برنامههای تخصصی در زمینه هوش مصنوعی دریافت کردند. به گزارش مرکز امنیت و فناوریهای نوظهور (CSET) دانشگاه جورجتاون، در آن سال چین تقریباً نیمی از پژوهشگران برتر هوش مصنوعی جهان را تأمین کرده بود، در حالی که سهم ایالات متحده تنها ۱۸ درصد بود.
به احتمال زیاد، دیپسیک از این ابتکارات حمایتشده توسط دولت بهرهمند شده است؛ از جمله دریافت کمکهای تحقیقاتی، بورسیههای تحصیلی و همکاریهای نزدیک بین دانشگاه و صنعت. برای مثال، گفته شده است که این شرکت از بنیاد ملی علوم طبیعی چین، که پروژههای تحقیقاتی هوش مصنوعی را حمایت میکند، بودجه دریافت کرده است.
علاوه بر این، دیپسیک با دانشگاههای چینگهوا و پکن در پروژههای تحقیقاتی مشترک همکاری نموده تا با ایجاد تعامل میان دانشگاه و صنعت، مرزهای توسعه هوش مصنوعی را به چالش بکشد. آزمایشگاه ملی مهندسی فناوری و کاربردهای یادگیری عمیق، به رهبری بادو، نقش کلیدی در تربیت استعدادهای هوش مصنوعی ایفا کرده است.
استعدادهای جوان دیپسیک
یکی دیگر از دلایل موفقیت دیپسیک نیروی کار شاخص آن است. بسیاری از اعضای تیم این شرکت جوان بوده و از برتری فزاینده فناوری چین الهام گرفتهاند. بنیانگذار دیپسیک، لیانگ ونفنگ، ۳۹ ساله و فارغالتحصیل دانشگاه ژجیانگ است. پیش از راهاندازی دیپسیک در سال ۲۰۲۳، او در تأسیس صندوق سرمایهگذاری High‑Flyer نقش داشت.
این متخصصان جوان هوش مصنوعی در محیطی رشد یافتهاند که شاهد رشد چین به عنوان یک ابرقدرت فناوری بودهاند. سیاستهای ملی که اکوسیستم توسعه هوش مصنوعی را تقویت میکنند، امکان جذب استعدادهای برتر و تأمین مالی گسترده را برای دیپسیک و نمونههای دیگر شبیه آن فراهم نموده است.
رشد و کارآمدی همزمان با محدودیت
یکی از جنبههای برجسته دستاوردهای دیپسیک، توانایی آن در توسعه مدلهای پیشرفته هوش مصنوعی است، حتی در شرایطی که محدودیتهای ایالات متحده بر تراشههای پردازشی پیشرفته اعمال میشود.
سال ۲۰۲۲، دولت ایالات متحده کنترلهای صادراتی را اعمال کرده که دسترسی چین به تراشههای پیشرفته هوش مصنوعی را محدود میکند و این موضوع آموزش مدلهای بزرگ را برای شرکتهای چینی دشوار میسازد.
چین و محققانش چه کردند؟ به گفته محقق هوش مصنوعی، چانگ شو، در دانشگاه سیدنی، دیپسیک با بهینهسازی معماری آموزشی خود و بهرهگیری از ترکیبی از تراشههای قدیمی Nvidia A100 و جایگزینهای تولید داخل، این محدودیتها را پشت سر گذاشته است. علاوه بر این، یک مطالعه موردی از آکادمی علوم چین نشان میدهد که این شرکت با استفاده از تکنیکهای نوآورانه فشردهسازی داده، بار محاسباتی را کاهش داده. در نتیجه این اقدامات چین حتی با منابع محدود نیز به کارایی مطلوب دست یافته است. از
با این حال، دیپسیک رویکردی منحصر به فرد در نوآوری اتخاذ کرده و بر کارایی در شرایط محدود تمرکز دارد. این شرکت اعلام کرده است که دیپسیک‑V3 را با استفاده از حدود ۲,۰۰۰ تراشه Nvidia H800 آموزش داده است، در حالی که برای مدل Llama 3.1 405B متا بیش از ۱۶,۰۰۰ تراشه H100 به کار رفته است. استفاده از سختافزار قدیمیتر و کمقدرتتر به طرز چشمگیری هزینههای دیپ را کاهش داده است.
نوآوریهای تکنولوژیکی
دیپسیک از چندین تکنیک پیشرفته برای افزایش کارایی مدلهای خود استفاده میکند:
- معماری Mixture-of-Experts (MoE): این روش یادگیری ماشین، سرعت آموزش مدل را افزایش داده و در عین حال نیاز به منابع محاسباتی کمتری دارد.
- Multi-Head Latent Attention: این تکنیک به مدل امکان میدهد تا با حافظهای کمتر، دادههای بیشتری را ذخیره کند و عملکرد را بهینه سازد.
با بهرهگیری از این نوآوریها، دیپسیک علیرغم کمبود سختافزار، توانسته با غولهای هوش مصنوعی سیلیکون ولی رقابت کند.
چالشها و جنجالهای پیش روی دیپ سیک
اخیراً گزارشهایی منتشر شده است که اوپنایآی در حال بررسی این موضوع است که آیا دیپسیک مدلهای خود را با استفاده از خروجیهای تولیدشده توسط اوپنایآی آموزش داده است یا خیر. در حالی که اوپنایآی هماکنون درگیر دعاوی حقوقی مرتبط با مسائل مالکیت معنوی است، دیپسیک سکوت کرده است.
با این وجود، کارشناسان هوش مصنوعی معتقدند که حتی اگر از دادههای مصنوعی اوپنایآی استفاده شده باشد، این امر اهمیت موفقیتهای دیپسیک را کاهش نمیدهد. پژوهشگران در Hugging Face در حال تلاش برای بازتولید دیپسیک‑R1 هستند تا به زودی مشخص شود آیا دادههای اوپنایآی برای موفقیت این مدل استفاده شده یا نه.
دیپ سیک؛ نقشه راه آینده یا یک دروغ بزرگ؟
موفقیت دیپسیک نشان میدهد که میتوان مدلهای هوش مصنوعی با کارایی بالا را بدون نیاز به منابع مالی و محاسباتی عظیم سیلیکون ولی توسعه داد. همانطور که چین به رشد ادامه میدهد، انتظار میرود دستاوردهای انقلابی بیشتری ظهور کنند و غولهای سنتی تکنولوژی را به چالش بکشند.
نظر شما چیست؟ دیپ سیک پدیده هوش مصنوعی و یک محصول انقلابی است یا یک دروغ و توهم که چین برای قدرتمایی ارائه کرده است؟
نوشته شده بر اساس گزارش Nature
به مدت محدود
آموزش مجازی مدیریت عالی حرفه ای کسب و کار Post DBA + مدرک معتبر قابل ترجمه رسمی با مهر دادگستری و وزارت امور خارجه | آموزش مجازی مدیریت عالی و حرفه ای کسب و کار DBA + مدرک معتبر قابل ترجمه رسمی با مهر دادگستری و وزارت امور خارجه | آموزش مجازی مدیریت کسب و کار MBA + مدرک معتبر قابل ترجمه رسمی با مهر دادگستری و وزارت امور خارجه |
مدیریت حرفه ای کافی شاپ | حقوقدان خبره | سرآشپز حرفه ای |
آموزش مجازی تعمیرات موبایل | آموزش مجازی ICDL مهارت های رایانه کار درجه یک و دو | آموزش مجازی کارشناس معاملات املاک_ مشاور املاک |
برچسب ها :
ناموجود- نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
- نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
- نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.
ارسال نظر شما
مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : ۰