پدیدهای به نام ChatGPT !
پدیده! همانطور که از لقبش پیداست معجزهای نوظهور در دنیای هوشمصنوعی را میخواهیم باهم مورد بررسی قرار دهیم. این روزها در سرتاسر دنیای تکنولوژی حرف از یک چیز است، ChatGPT! این فناوری به عنوان یک تغییر بالقوه در دنیای هوشمصنوعی مورد استقبال بسیار زیادی قرار گرفته است. توانایی بالای این چتبات در زمینه نوشتن، مهارت در کارهای بسیار پیچیدهتر از ورژنهای قبلی، نحوه پاسخگویی به سوالات به طرز خیرهکننده، سهولت کار با آن و... همگی باعث شدهاند تا این چتبات حرفهای تمامی کارشناسان حوزه تکنولوژی را تحت تأثیر قرار دهد.
پدیده چتبات هوشمصنوعی ChatGPT چیست و آیا میتواند جایگزینی انسان شود؟
پدیده ChatGPT یک نمونه بینظیر از چتباتهای مبتنی بر دیالوگ هوشمصنوعی(dialogue-based AI chatbot)، یا بهتر است بگوییم گفتگوی شبه انسانی است که قادر به درک زبان طبیعی انسان و نوشتن متون با جزئیات دقیق و چشمگیر است. در حال حاضر این آخرین تکامل از خانواده هوشمصنوعیهای تولید متن(text generating) یا همان GPT(Generative Pre-Trained Transformer)هاست.
سازنده ChatGPT کدام شرکت است؟
این چتبات جدید مبتنی بر هوشمصنوعی، آخرین نسخه ارائه شده از رباتهای گفتگو کننده توسط شرکت OpenAI(این کمپانی یک مجموعه تحقیقاتی خصوصی واقع در سانفرانسیسکو-کالیفرنیاست که توسط ایلان ماسک تأسیس شده و فعالیت آن تحقیق، توسعه و تولید در زمینه هوش مصنوعیست) است.
ایلان ماسک در اواخر سال 2015 این استارتآپ را با دیگر سرمایهگذاران دره سیلیکون(به انگلیسیSilicon Valley، یک مرکز بینالمللی نوآوری در تکنولوژیست که در خلیج سانفرانسیسکو جنوبی در ایالت کالیفرنیا واقع شده است)، تأسیس کرد که از جمله این سرمایهگذاران میتوان به Sam Altman(یکی از سرمایهگذاران مشهور در حوزه فناوری و مدیرعامل شرکت OpenAI) اشاره کرد. ماسک در آن زمان وبلاگی را متنی را در فضای مجازی با عنوان "هوشمصنوعی را به روشی که به نفع بشریت است ارتقا دهید" منتشر کرد که نظر بسیاری از افراد را برانگیخت. شرکت OpenAI به عنوان یک موسسه غیرانتفاعی(non-profit) و متنباز(open source) فعالیت خود را آغاز کرد و همچنان نیز به همین روال در حال ادامه روند خود است.
نحوه عملکرد ChatGPT چگونه است؟
همانطور که از نام آن پیداست، ChatGPT یک مدل زبان مولد(generative) مبتنی بر معماری مبدل(transformer)هاست. این مدلها قادر به پردازش حجم زیادی از متون و یادگیری زبان طبیعی به صورت کاملاً موثر، هستند. این سیستم که بر پایه هوشمصنوعی بوده و توسط یادگیری ماشینی آموزش دیده و در حال ارتقا است، برای ارائه اطلاعات و پاسخ به سوالات از طریق یک رابط مکالمه(conversational interface)، طراحی شده است. هوشمصنوعی این چتبات از طریق کار بر روی حجم عظیمی از اطلاعات و متنهای مختلف گرفته شده از اینترنت آموزش دیده است. مدل GPT-3 دارای 175 میلیارد پارامتر یادگیری است که آن را به بزرگترین مدل زبانی تبدیل میکند که تا کنون آموزش دیده است. این مدل بر روی مجموعه بسیار بزرگی از اسناد برای یادگیری کار کرده است، مجموعهای که شامل 8میلیون سند و بیش از 10میلیارد کلمه بود. با بررسی این متون، هوشمصنوعی پردازش زبان طبیعی و تولید متنهای منسجم و زیبا را یاد میگیرد. هنگامی که مدل به خوبی آموزش داده شد، میتوان از GPT برای انجام طیف وسیعی از وظایف بهره گرفت؛ همچنین برای تقویت آموزش از یادگیری تقویتی براساس بازخوردهای انسان نیز استفاده میشود. در نهایت تیم توسعهدهنده تنظیمات نهایی را به صورت دقیق انجام میدهند تا برای بهرهبرداری آماده شود.
مربیان هوشمصنوعی مکالماتی را ارائه کردند که در آن به جای هر دو طرف کاربر و دستیار هوشمصنوعی صحبت کردند. علاوه بر این پیشنهاداتی که ارائه میشد نیز مورد توجه آنها واقع شد تا در نهایت مجموعه جدیدی از ترکیب InstructGPT و یک مجموعه داده(dataset) جدید برای شکلگیری یک قالب گفتگوی حرفهای و کارآمدتر ایجاد شود. اولین چیزی که برای یادگیری تقویتی(reinforcement learning) مورد نیاز بود، جمعآوری دادههای مقایسهای بود که شامل دو یا چند پاسخ مختلف مدل به سوالات و رتبهبندی آنها براساس کیفیت میشد. بنابراین، برای جمعآوری دادهها، چند مکالمهای که مربیان با ChatGPT انجام داده بودند را به صورت تصادفی انتخاب کردند؛ به این ترتیب آنها پایانهای مختلفی از مربیان را آزمایش و رتبهبندی نمودند. به این روش مدل پاداش یا reward model گفته میشود. همچنین آموزشها در پلتفرم Microsoft Azure بر روی یک ابر کامپیوتر(supercomputer) نیز انجام شد. در نهایت، برای استفاده از GPT در یک چت، ورودی به شکل متن ارائه میشود؛ این ورودی میتواند یه صورت یک سوال یا یک جمله متنی باشد و با توجه به این ورودی GPT یک پاسخ مناسب و منسجم ایجاد میکند.
به گفته شرکت OpenAI، هوشمصنوعی جدید به کار رفته در این چتبات با تمرکز بر راحتی استفاده کاربران ایجاد شده است. از جمله ویژگیهای بسیار جالب آن میتوان به مواردی مانند: پاسخدهی مناسب به سوالات پشت سرهم، پذیرفتن اشتباهات، رد درخواستهای نامناسب و به چالش کشیدن موقعیتهای نادرست اشاره کرد.
منظور از اینکه ChatGPT را transformer-based مینامند چیست؟
تبدیل یا transformation نوعی پردازش داده است که بر روی زنجیرهای از اِلمانها، مانند کلمات موجود در یک جمله یا حروف یک کلمه انجام میشود. مبدلها(transformers) مدلهای یادگیری ماشینی هستند که به طور خاص برای پردازش توالی عناصر(elements) با استفاده از تبدیل، طراحی شدهاند. معماری مبدلها مبتنی بر استفاده از تکنیکی به نام توجه(attention) است که به مدل اجازه میدهد تا در زمان پردازش دنباله به بخشهای مختلف توالی ورودی در زمانهای مختلف توجه داشته باشد. این موضوع به مبدلها اجازه میدهد تا اطلاعات را به طور موثرتری پردازش کنند و وظایف پردازش زبان طبیعی را با دقت بیشتری انجام دهند. همانطور که پیشتر گفته شد، GPT یک مدل زبان مولد براساس معماری مبدلهاست؛ اما این موضوع به چه معناست؟ این بدان معناست که مدل برای پردازش توالی عناصر، مانند کلمات در یک جمله، با استفاده از تبدیل و توجه(transformation and attention) طراحی شده است. همانطور که گفته شد این معماری برای پردازش زبان طبیعی بسیار موثر است و شیوه برخورد با بسیاری از وظایف NLP(Natural Language Processing) را متحول کرده است.
چتبات ChatGPT سودمند برای کاربران یا سازندگان؟
در سال 2019 سَم آلتمن در مصاحبهای به این نکته اشاره کرد که آنها به قولی که به سرمایهگذاران خود دادهاند عمل خواهند کرد و هوشمصنوعی را موظف میکنند تا خودش راههایی برای درآمدزایی پیدا کند. در آن زمان مخاطبان، این موضوع را به شوخی میگرفتند؛ اما با نگاه کردن به نحوه عملکرد و روند پیشرفت سیستم، محقق گشتن این موضوع نزدیکتر از چیزی که فکر میکنیم به نظر میرسد.