21 بهمن 1403

وقتی انحصار غولهای فناوری همیشگی نیست

دیپسیک یک انقلاب خاموش در صنعت هوش مصنوعی است. این مدل ثابت کرد که محدودیت ها می توانند محرک نوآوری باشند و انحصار شرکتهای بزرگ همیشگی نیست.

در دنیایی که هوش مصنوعی مرزهای نوآوری را با شتابی بیسابقه جابهجا میکند، شناخت بازیگران پیشروی این عرصه برای درک آینده فناوری ضروری است. دیپ‌سیک (DeepSeek) به عنوان یکی از پیشگامان حوزه مدلهای زبانی و سیستم های هوشمند، با رویکردی منحصربه‌فرد در توسعه راهکارهای مبتنی بر یادگیری عمیق، توجه جامعه علمی جهان را به خود جلب کرده است. پایگاه خبری داتیکا در سلسله گفتگوهای تخصصی، به سراغ متخصصانی رفته که قلب تپنده این فناوری را از نزدیک لمس کردهاند تا از چشم اندازهای پنهان، چالشهای مهندسی و آرمان های اخلاقی پشت پرده پیشرفتهای اخیر دیپ‌سیک پرده بردارد.

به گزارش داتیکا، این مصاحبه تلاشی است برای واکاوی تأثیرات انقلابی این فناوری بر صنایع مختلف، بررسی ملاحظات مسئولیت پذیری در توسعه سیستم های هوش مصنوعی و ترسیم افقهای پیشِروی بشریت در همزیستی با ماشین های هوشمند. خانم دکتر زهرا رضایی، عضو هیئت علمی دانشگاه و متخصص هوش مصنوعی در این گفتگو با تشریح تجربیات عملی خود، پنجرهایی به دنیای پیچیده آموزش مدلهای بزرگ مقیاس و مدیریت ریسکهای نوظهور در این حوزه میگشاید.

اخیراً نام «دیپسیک» به عنوان یک مدل هوش مصنوعی چینی سر زبانها افتاده است. به نظر شما چه عواملی باعث موفقیت ناگهانی این استارتاپ شد؟

موفقیت دیپسیک ترکیبی از چند عامل کلیدی است. اولاً، این شرکت رویکردی کمهزینه را در توسعه مدلهای خود پیش گرفت. برخلاف شرکتهای آمریکایی مانند OpenAI که هزینه های توسعه شان به میلیاردها دلار میرسد، دیپسیک مدعی است مدل DeepSeek خود را با تنها ۵.۶ میلیون دلار آموزش داده است . این کاهش هزینه از طریق بهینه سازی الگوریتم ها، استفاده از تراشه های ارزان قیمت، و معماری نوآورانه ای مانند ترکیبی از متخصصان» محقق شد که تنها بخش های مرتبط شبکه را برای هر درخواست فعال می کند البته باید این نکته را در نظر گرفت که «این برآورد تقریبی ۶ میلیون دلاری فقط هزینه‌های مربوط به آموزش مدل با استفاده از پردازنده‌های گرافیکی (GPU) را در نظر می‌گیرد. اما این عدد خیلی از هزینه‌های مهم دیگه رو نادیده می‌گیره، مثلاً پولی که برای تحقیق و توسعه خرج شده، یا هزینه‌هایی که برای زیرساخت‌ها و چیزهای ضروری دیگه پرداخت شده. ثانیاً، دیپسیک از نیروی انسانی جوان و خلاق بهره برد. تیم توسعه دهنده آن کمتر از ۱۴۰ نفر است که بیشترشان فارغ التحصیلان دانشگاههای برتر چین هستند و تحت سیاست های دولتی برای پرورش استعدادهای داخلی تربیت شده اند که طبق اظهارنظر های خود شرکت سن مدیران آنها زیر ۳۵ سال است. این موضوع نشان میدهد که سرمایه گذاری در آموزش و همکاری بین صنعت و دانشگاه چقدر حیاتی است.

تفاوت اصلی دیپ‌سیک با مدل های غربی مانند ChatGPT چیست؟

تفاوت در رویکرد فنی و فلسفه توسعه است. دیپ‌سیک مدل های خود را به صورت متن باز ارائه میکند که امکان مشارکت جامعه توسعه دهندگان جهانی را فراهم میسازد . در مقابل، OpenAI مدل های خود را با محدودیت های مجوزی منتشر میکند. از نظر فنی، دیپ‌سیک از معماری MoE استفاده میکند که مصرف انرژی و منابع محاسباتی را تا ۲۰ برابر کاهش میدهد . همچنین، تمرکز آن بر حوزه های تخصصی مانند حل مسائل ریاضی و کدنویسی، عملکردش را در برخی زمینه ها از ChatGPT برتر کرده است .

از سوی دیگر، دیپ‌سیک از داده های مصنوعی (Synthetic Data) برای آموزش مدل هایش استفاده میکند که هزینه و زمان توسعه را کاهش میدهد و نگرانی های اخلاقی حول حریم خصوصی داده ها را کم می کند . البته این روش هنوز جای بحث دارد، زیرا برخی معتقدند داده های مصنوعی ممکن است تنوع و دقت مدل را محدود کنند.

تأثیر دیپسیک بر بازارهای جهانی چگونه بوده است؟

تأثیر آن شوک آور بود. تنها در یک روز، ارزش بازار انویدیا—تأمین کننده اصلی تراشه های هوش مصنوعی—حدود ۶۰۰ میلیارد دلار کاهش یافت . این اتفاق به دلیل نگرانی سرمایه گذاران از کاهش وابستگی چین به تراشههای پیشرفته آمریکایی رخ داد. دیپ‌سیک نشان داد که با تراشه های سطح پایینتر مانند H800 انویدیا یا حتی سخت افزارهای داخلی چین مانند Huawei Ascend نیز میتوان مدل های قدرتمند ساخت. علاوه بر این، موفقیت تحریم های آمریکا نیز زیر سوال رفت. واشنگتن تصور می کرد با ممنوعیت صادرات تراشه های پیشرفته، پیشرفت چین را متوقف میکند، اما دیپ‌سیک ثابت کرد که نوآوری در الگوریتمها و معماری و البته با دور زدن تحریم میتواند جایگزین هایی برای منابع مالی و سختافزاری ایجاد کرد .

نگرانی های امنیتی و اخلاقی حول دیپسیک چیست؟

دو نگرانی عمده وجود دارد. اولاً، حریم خصوصی داده ها: گزارش ها حاکی از آن است که دیپ‌سیک آدرسهای IP و اطلاعات دستگاه کاربران را ذخیره میکند، که ممکن است با استانداردهای اروپایی مانند GDPR در تضاد باشد . برخی کشورها مانند ایتالیا و استرالیا هشدارهایی درباره استفاده از این مدل صادر کردهاند . ثانیاً، سانسور محتوای حساس: دیپسیک مانند دیگر مدل های چینی، در پاسخ به سوالات مرتبط با مسائل سیاسی حساس (مانند تایوان…) خودسانسوری می کند . این موضوع اعتبار آن را به عنوان یک ابزار بیطرف زیر سوال می برد.

آینده رقابت بین چین و آمریکا در حوزه هوش مصنوعی را چگونه میبینید؟

این رقابت به تغییر پارادایم منجر خواهد شد. چین با مدل هایی مانند دیپ‌سیک نشان داده که میتواند با هزینه کمتر و منابع محدود، به نتایج قابل رقابت برسد. این امر شرکت های آمریکایی را مجبور میکند تا استراتژیهای خود را بازبینی کنند—مثلاً کاهش هزینه ها یا تمرکز بر نوآوری های معماری . از طرفی، استقلال فناوری چین در حال افزایش است. این کشور دیگر به طور کامل به تراشه های آمریکایی وابسته نیست و با توسعه زیرساختهای داخلی، مسیر خود را برای تبدیل شدن به ابرقدرت هوش مصنوعی هموار میکند . اما چالش اصلی، مقیاسپذیری مدلهای کم هزینه در بلندمدت و تطابق با استانداردهای اخلاقی جهانی خواهد بود.

سخن پایانی:

دیپسیک یک انقلاب خاموش در صنعت هوش مصنوعی است. این مدل ثابت کرد که محدودیت ها می توانند محرک نوآوری باشند و انحصار شرکتهای بزرگ همیشگی نیست.