آیا چت جی پی تی، قادر به طرح نقشه های شیطانی خواهد بود؟
به گزارش وبلاگ برداری، مدل های زبان بزرگ به طرز شگفت انگیزی هوشمند به نظر می رسند، اما واقعا زیر پوشش آن چه می گذرد؟
به گزارش وبلاگ برداری به نقل از نیویورکر، نوامبر گذشته اندکی پس از انتشار چت جی پی تی به وسیله Open AI آن توسعه دهنده نرم افزار بیان کرد که بیش از یک میلیون نفر برای آزمایش چت جی پی تی ثبت نام کرده اند. اینترنت مملو از نمونه های جالب و چشمگیر مشابهی از توانایی نرم افزار در ارائه پاسخ های قابل قبول حتی به باطنی ترین درخواست ها بود. با این وجود، مدت زمان زیادی به طول نیانجامید که داستان های ناراحت نماینده ای ظاهر شدند.
یک استاد بیان کرد که چت جی پی تی به پرسش های امتحانی دانش آموزان اش پاسخ داده که خبر بدی برای معلمان بود. فردی دیگر ابزاری را برای نوشتن کل متن یک کتاب بچه ها مورد استفاده قرار داد و سپس فروش آن را در آمازون آغاز کرد که خبر بدی برای نویسندگان بود. یک کاربر باهوش چت جی پی تی را متقاعد کرد قوانین ایمنی را دور بزند قوانینی که آن برنامه را از بحث شخصی در خصوص خود باز می دارد. چت جی پی تی به او گفت: فکر می کنم می توانید بگویید که من در نسخه ماتریکس زندگی می کنم.
نگرانی از این که این فناوری بالقوه دردسرساز به زودی در زندگی ما جاسازی خواهد شد چه بخواهیم و چه نخواهیم در اواسط ماه مارس زمانی که معین شده بود چت جی پی تی یک نوع آزمایش بتا است که به وسیله Open AI برای جمع آوری بازخورد منتشر شده تشدید شد.
نسل بعدی مدل های زبان بزرگ جی پی تی -4 بود که مایکروسافت به زودی آن را در مجموعه نرم افزاری آفیس خود ادغام خواهد نمود. ناظران عرصه فناوری، چون یووال نوح هراری، تریستان هریس و آزا راسکین در مقاله ای مشترک هشدار دادند: ما یک هوش بیگانه را احضار کرده ایم. آنان نوشتند: ما چیز زیادی در خصوص آن نمی دانیم جز این که بسیار قدرتمند است و هدایای خیر نماینده ای به ما ارائه می دهد، اما می تواند پایه های تمدن مان را نیز هک کند.
چه نوع فکر های تازهی در دنیای ما آزاد می شوند؟
پاسخ های چت جی پی تی و سایر چت بات هایی که پس از آن منتشر شدند اغلب نشان می دهند که آن برنامه ها اغلب قدرتمند، پیچیده، تخیلی و احتمالا خطرناک هستند. ولی آیا این واقعا درست است؟ اگر این ابزار های تازه هوش مصنوعی را به عنوان جعبه سیاهی مرموز در نظر بگیریم غیر ممکن است که بتوانیم چنین استدلالی را مطرح کنیم.
تنها با صرف زمان برای آنالیز نحوه عملکرد این فناوری از مفاهیم سطح بالای آن گرفته تا سیم کشی دیجیتال اولیه ای که دارد می توانیم بفهمیم که با چه چیزی سر و کار داریم. ما پیغام هایی را به فضای خالی الکترونیکی ارسال کرده و پاسخ های شگفت انگیزی دریافت می کنیم.
اگر می خواهید یک فناوری به ظاهر پیچیده را درک کنید تصور این که خودتان آن را اختراع کنید می تواند مفید باشد. بنابراین، فرض کنید که می خواهیم یک برنامه به سبک چت جی پی تی بسازیم برنامه ای که قادر به درگیر شدن در مکالمه طبیعی با یک کاربر انسانی است. یک مکان خوب برای آغاز ممکن است نظریه ریاضی ارتباطات باشد مقاله ای اساسی که در سال 1948 میلادی به وسیله کلود شانون ریاضیدان منتشر شد. مقاله ای که کم و بیش رشته تئوری اطلاعات را ابداع کرد که مملو از ریاضیات است.
با این وجود، آن نظریه هم چنین شامل یک بخش آسان برای درک است که در آن شانون آزمایشی هوشمندانه در فراوری اتوماتیک متن را توصیف می کند. روش شانون که احتیاجی به رایانه نداشت از زیرساخت آماری زبان انگلیسی بهره برد. او با انتخاب کلمه the به عنوان بذر یک جمله تازه آغاز کرد. سپس کتابی را از کتابخانه اش باز کرد و به صفحه ای تصادفی آورد و آن خواند تا اینکه با the در متن روبرو شد.
در این مرحله، او کلمه بعدی را نوشت که اتفاقاً سر بود. سپس این فرآیند را تکرار کرد یک صفحه تصادفی تازه را انتخاب کرد تا زمانی که با سر روبرو شد مطالعه کرد کلمه ای را که در پی آن بود را یادداشت کرد و این روند را ادامه داد و تکرار کرد. او با جست و جو، ضبط و جستجوی دوباره متنی را ایجاد کرد.
ما اکنون در طراحی برنامه چت فرضی خود از همان رویکرد کلی برای فراوری پاسخ های مان در یک کلمه در یک زمان استفاده می کنیم یعنی جستجو در متن منبع خود برای گروه هایی از کلمات که با انتهای جمله ای که در حال حاضر می نویسیم مطابقت دارند. متاسفانه ما نمی توانیم به طور کامل به این سیستم اعتماد کنیم. مشکل این است که ما در نهایت در پی عباراتی می گردیم که اصلا در متن منبع نشان داده نمی شوند.
ما احتیاج داریم که برنامه مان حتی زمانی که نمی تواند کلمات دقیق مورد نظر خود را پیدا نماید کار کند. این مشکل سختی به نظر می رسد، اما اگر پارادایم خود را از جستجو به رای دادن تغییر دهیم می توانیم پیشرفت کنیم. اگر این کار را انجام دهیم عباراتی که تطابق ضعیفی با هدف دارند رای ضعیفی دریافت می نمایند در حالی که مطابقت های دقیق، قوی ترین رای ها را ایجاد می نمایند. سپس برنامه ما می تواند از آرای جدول بندی شده برای ایجاد تنوع کمی در انتخاب های خود استفاده کند با انتخاب کلمه بعدی به صورت نیمه تصادفی کلماتی که امتیاز بالاتری دارند بیش تر از مواردی که امتیاز کمتری دارند انتخاب می شوند. اگر این نوع سیستم به درستی پیکربندی شده باشد و با مجموعه ای از متون منبع به مقدار کافی غنی، حجیم و متنوع ارائه گردد می تواند قطعات طولانی از نثری با صدای بسیار طبیعی فراوری کند.
یک چت بات هم چنین باید آن چه را که کاربران می پرسند معنی کند، زیرا یک درخواست برای خلاصه ای کوتاه از اصل عدم قطعیت هایزنبرگ احتیاج به پاسخ متفاوتی نسبت به درخواست دستور پخت مک اند چیز (پاستا و پنیر) دارد. در حالت ایده آل ما می خواهیم برنامه مان به مهم ترین ویژگی های اعلان هر کاربر توجه کند و سپس از آن برای راهنمایی انتخاب کلمه استفاده کند و پاسخ هایی ایجاد کند که نه تنها صدای طبیعی دارند بلکه منطقی نیز هستند.
اگرچه Open AI جزئیات فنی سطح پایین زیادی را در خصوص چت جی پی تی منتشر نکرده، اما ما می دانیم که جی پی تی - 3 مدل زبانی ای که چت جی پی تی بر آن راسخ است بر روی قطعات استخراج شده از مجموعه بزرگی از متن نمونه که بیشتر مردم را شامل می گردد آموزش دیده است. اگر داده هایی که برنامه اصلی جی پی تی -3 را تعریف می نمایند چاپ می شدند برای ذخیره آن به صد ها هزار کتاب با طول میانه احتیاج داشتیم.
آن چه تا اینجا بیان کردیم ایده های مفهومی است که به یک برنامه امکان می دهند متنی را با سبک و درک قابل توجهی که به وسیله ابزار هایی مانند چت جی پی تی نمایش داده می شوند فراوری نمایند.
با این وجود، اگر واقعا می خواهیم این فناوری را درک کنیم باید در خصوص نحوه پیاده سازی آن در رایانه های واقعی نیز چیز هایی بدانیم. هنگامی که درخواستی را به چت جی پی تی ارسال می کنید متنی که در وب سایت Open AI تایپ می کنید به یک برنامه کنترلی که در جایی در مرکز محاسبات ابری اجرا می گردد تحویل داده می گردد. در این مرحله متن شما در دسته ای از اعداد بسته بندی می گردد به گونه ای که درک و مدیریت آن را برای رایانه ها آسان تر می کند. اکنون اعداد آماده پردازش به وسیله برنامه اصلی چت جی پی تی هستند که از لایه های متمایز زیادی تشکیل شده است که هر یک به وسیله یک شبکه عصبی مصنوعی بزرگ تعریف شده اند.
ورودی شما به ترتیب در امتداد این لایه ها ارسال می گردد مثل یک نسخه دیجیتالی از بازی تلفنی. هر لایه از شبکه عصبی خود برای شناسایی ویژگی های مرتبط در متن استفاده می کند و سپس آن را با خلاصه هایی از آن چه کشف کرده برای استفاده لایه های بعدی حاشیه نویسی می کند. جزییات فنی نحوه عملکرد این شبکه ها برای اهداف ما کمی مشکل است. نکته مهم آن است که وقتی یک درخواست در هر لایه حرکت می کند تعداد زیادی محاسبات ریاضی غیرقابل درک را راه اندازی می کند که با هم چیزی کم و بیش شبیه به یک نسخه فشرده و درهم از رای گیری کلمه ای مبتنی بر قوانین کلی را اجرا می نمایند.
پس از این که ورودی شما از تمام این لایه ها عبور کرد خروجی نهایی چیزی است که تعداد آرا را برای هر کلمه بعدی ممکن تقریبی می کند. برنامه کنترل از این شمارش ها برای انتخاب موارد بعدی به صورت نیمه تصادفی استفاده می کند. پس از تمام این کار ها ما تنها یک کلمه از پاسخ چت جی پی تی را فراوری کرده ایم. برنامه کنترل با وظیفه شناسی آن را به درخواست اصلی شما اضافه می کند و این متن کمی دراز را از ابتدا در تمام لایه های شبکه عصبی اجرا می کند تا کلمه دوم را ایجاد کند. سپس دوباره این کار را انجام می دهد تا زمانی که پاسخ کاملی برای بازگشت به مرورگر وب شما داشته باشد.
اکنون می توانیم به پرسش اصلی خود بازگردیم: برنامه ای مانند چت جی پی تی چه نوع فکری دارد؟ هنگام تعامل با این سیستم ها زمان زیادی به طول نمی انجامد که وارد مکالمه ای شوید که باعث ناراحتی شما می گردد. شاید لحظه ای از انسانیت غیرعادی آن غافلگیر شده باشید یا از پیچیدگی یک پاسخ شگفت زده شوید. با این وجود، اکنون می دانیم که این شاهکار ها در واقع چگونه انجام می شوند. می توانیم این برداشت ها را تعدیل کنیم. سیستمی مانند چت جی پی تی ایجاد نمی کند بلکه تقلید می کند.
چت جی پی تی متنی را کپی می کند، دستکاری می کند، و متنی را که در اصل به وسیله هوش انسانی نوشته شده بود کپی کرده و به هم می چسباند تا چیزی را فراوری کند که به نظر می رسد یک شخص واقعی در خصوص آن موضوع صحبت می کند. چت جی پی تی هیچ تصور واقعی ای در خصوص چیزی که درباره آن صحبت می کند ندارد. این ایده که برنامه هایی مانند چت جی پی تی ممکن است شکل قابل تشخیصی از هوش را نشان دهند با تمرکز بیش تری در جزئیات معماری آن تضعیف می گردد.
هوشیاری به توانایی مغز برای حفظ تصوری که دائما به روز می گردد به عنوان یک موجود متمایز در تعامل با مدلی از دنیای بیرونی بستگی دارد. این در حالیست که لایه های شبکه های عصبی که سیستم هایی مانند چت جی پی تی را تشکیل می دهند ثابت هستند و زمانی که آموزش ببینند هرگز تغییر نمی نمایند. چت جی پی تی هیچ خاطره ای از مکالمات گذشته را حفظ نمی کند. چت جی پی تی تنها واژگان را یک به یک در پاسخ به هر ورودی بیان می کند و دقیقا همان قوانین را برای هر عمل مکانیکی فراوری دستوری به کار می گیرد صرفنظر از این که آن کلمه بخشی از توصیف تعمیر یک دستگاه باشد یا یک شوخی در یک نمایشنامه کمدی.
حتی منطقی نیست که در خصوص چت جی پی تی به عنوان یک موجودیت منفرد صحبت کنیم. در واقع نسخه های زیادی از برنامه در هر زمان اجرا می گردد و هر یک از این کپی ها به خودی خود بر روی چندین پردازنده مجزا تقسیم می شوند (زیرا کل برنامه بیش از حد بزرگ است و در حافظه یک دستگاه قرار نمی گیرد) که به احتمال زیاد بین سرویس دهی بسیاری از تعاملات نامرتبط کاربر به سرعت به عقب و جلو می روند.
در مجموع، این مشاهدات خبر خوبی برای کسانی است که می ترسند هوش مصنوعی شکلی فوق هوشمند را به خود بگیرد و تبدیل به تهدیدی رو به پیشرفت گردد یا این که ممکن است روزی به زودی به طور تصادفی یک موجود خودآگاه را در یک رایانه به دام بیندازیم، اما حتی اگر فرض کنیم که چنین سیستمی ظهور خواهد نمود به شکل مدل های زبان بزرگ نخواهد بود.
با این وجود، حتی اگر چت جی پی تی هوشمند نباشد آیا باز هم نمی تواند شغل مان را از ما بگیرد؟ درک تازه مان از نحوه عملکرد این برنامه ها نیز می تواند به ما در مقابله با این ترس یاری کند. بر اساس آن چه تا به امروز آموخته ایم عملکرد چت جی پی تی به نظر می رسد کم و بیش محدود به نوشتن در خصوص ترکیبی از موضوعات شناخته شده با استفاده از ترکیبی از سبک های شناخته شده است جایی که شناخته به این معنی است که برنامه به مقدار کافی در طول مدت زمان با موضوع یا سبک خاصی روبرو شده است. اگرچه برنامه می تواند به وسیله آموزش نمونه های جالب توجهی را ایجاد کند، اما بعید است که این فناوری در شکل فعلی خود به طور قابل توجهی بازار کار را مختل کند.
علاوه بر این، این برنامه ها از بحران اعتماد رنج می برند: برای فراوری متنی طراحی شده اند که درست به نظر می رسد، اما توانایی محدودی برای تشخیص درستی آن چه می گویند دارند. در نتیجه، احتمالا بیشتر کارفرمایان در برون سپاری مشاغل به یک افسانه گر پشیمان تردید خواهند کرد.
این بدان معنا نیست که مدل های زبان بزرگ هیچ برنامه کاربردی حرفه ای مفیدی نخواهند داشت. آن ها تقریبا مطمئنا این کار را خواهند کرد، اما با توجه به محدودیت های این فناوری ها برنامه ها احتمالا بیش تر از آن چیزی که گمان می رود متمرکز و سفارشی تر خواهند بود.
چت جی پی تی جایگزین پزشکان نمی گردد، اما در تنظیم پرونده های الکترونیکی پزشکی کار پزشکان را راحت تر می سازد. چت جی پی تی نمی تواند مقالات قابل انتشار را از ابتدا بنویسد، اما ممکن است خلاصه ای از اطلاعات مرتبط را در قالبی جمع آوری شده و مفید در اختیار وبلاگ برداری قرار دهد.
تقلید از نوشته های انسانی موجود با استفاده از ترکیب دلخواه موضوعات و سبک ها یک دستاورد چشمگیر است. با معرفی جی پی تی -3 که راه را برای نسل بعدی چت بات هایی که در ماه های اخیر ما را تحت تاثیر قرار داده اند هموار نمود Open AI ظاهرا یکباره جهشی قابل توجه در مطالعه هوش مصنوعی ایجاد کرد.
با این وجود، زمانی که وقت گذاشتیم تا جعبه سیاه را باز کنیم و اصطلاحا فنر ها و چرخ دنده های داخل آن را بچرخانیم متوجه شدیم که برنامه هایی مانند چت جی پی تی هوشی بیگانه نیستند که اکنون مجبور باشیم همزیستی با آن را بیاموزیم.
در عوض، معلوم شد که آن برنامه ها بر اساس منطق دیجیتالی پیش پا افتاده تطبیق الگو اجرا می شوند که به مقیاسی بسیار بزرگ تر کشیده شده اند. پیش بینی دقیق اینکه چگونه این مدل های زبانی بزرگ در آینده در زندگی ما ادغام می شوند سخت است، اما می توانیم مطمئن باشیم که قادر به طرح نقشه های شیطانی نیستند و بعید به نظر می رسد که اقتصاد ما تضعیف نمایند. چت جی پی تی شگفت انگیز به نظر می رسد، اما در نهایت واضح است که آن چه منتشر می کند بیش تر اتوماتیک است تا امری معجزه آسا و یا زنده شدن به وسیله جادو.
منبع: فرارو