اما واقعیت پشت پرده، سحر و جادو یا نقشهای پنهان از سوی «دستهای پشت پرده» نبود. این اتفاق، حاصل یک تلاقی تکنولوژیک، رقابت شدید استراتژیک و یک ریسک بزرگ تجاری بود. در ادامه، ماجرا را از دیدگاه مهندسی و بیزینس بررسی میکنیم تا ببینیم چطور کلید این انفجار ناگهانی سالها قبل خورده بود.
هیچکدام از این هوشهای مصنوعی بدون یک مقاله علمی که در سال ۲۰۱۷ منتشر شد، وجود خارجی نداشتند. طنز ماجرا اینجاست که این مقاله را OpenAI یا مایکروسافت ننوشتند، بلکه دانشمندان گوگل آن را با عنوان "Attention Is All You Need" منتشر کردند.
معماری ترنسفورمر (Transformer) (همان حرف T در GPT) انقلابی در پردازش زبان طبیعی (NLP) ایجاد کرد. پیش از آن، مدلهای یادگیری ماشین (مثل RNNها) متون را کلمه به کلمه و به ترتیب پردازش میکردند که بسیار کند بود و حافظه کوتاهمدتی داشت. ترنسفورمرها مفهوم «مکانیزم توجه» (Attention Mechanism) را معرفی کردند که به مدل اجازه میداد تمام کلمات یک متن را همزمان ببیند، ارتباط بین آنها را درک کند و به شدت موازیسازی (Parallelization) شود.
واقعیت فنی: از سال ۲۰۱۷ تا ۲۰۲۲، تمام شرکتهای بزرگ فناوری (گوگل، متا، مایکروسافت، بیدو و...) زیرساختهای خود را بر اساس این معماری چیدند. یعنی همه فرمول اصلی را در دست داشتند و روی آن کار میکردند.
این سوال پیش میآید: اگر گوگل خودش مخترع ترنسفورمر بود، چرا بقیه را شگفتزده نکرد؟ پاسخ در «ملاحظات برند و امنیت» نهفته است.
OpenAI در آن زمان یک شرکت نسبتاً کوچکتر و چابکتر بود (هرچند از حمایتهای مایکروسافت بهره میبرد). آنها چیزی برای از دست دادن نداشتند. سام آلتمن و تیمش تصمیم گرفتند یک واسط کاربری ساده (Chat Interface) روی مدل GPT-3.5 که از قبل توسعه داده بودند بگذارند و آن را به عنوان یک «پیشنمایش تحقیقاتی رایگان» در نوامبر ۲۰۲۲ عرضه کنند.
این یک حرکت نبوغآمیز در حوزه محصول (Product Management) بود، نه لزوماً یک جهش ناگهانی در علم. آنها متوجه شدند که مردم تشنه تعامل مستقیم با هوش مصنوعی هستند. استقبال ۵ میلیونی در چند روز اول، حتی خود OpenAI را هم شوکه کرد.
وقتی ChatGPT منفجر شد، پاردایم صنعت تکنولوژی در یک شب تغییر کرد. برای غولهای فناوری، این دیگر بحث «تحقیق و توسعه» نبود، بحث بقا بود.
به عنوان یک مهندس، اگر بخواهم فاکتورهای فنی که این آمادگی همگانی را ممکن کرد جمعبندی کنم، به این ۳ مورد میرسم:
هیچ «دست پنهانی» در کار نبود؛ بلکه یک انبار باروت بزرگ از کدهای آماده، دیتای موازی، سختافزارهای گرانقیمت و مدلهای آزمایشگاهی وجود داشت که غولهای فناوری از ترسِ ریسکِ برند، روی آن نشسته بودند. جرقه OpenAI با ChatGPT، این انبار باروت را منفجر کرد. شرکتها مجبور شدند فورا ماسک محافظهکاری را بردارند و محصولاتی را که سالها در آزمایشگاههای مخفیشان در حال توسعه و تست بود، به بازار پرتاب کنند. این یک مسابقه تسلیحاتی تکنولوژیک بود که تازه آغاز شده است.
0 نظر
هنوز نظری برای این مقاله ثبت نشده است.