

برنامههای نرمافزار هوش مصنوعی بهطور تکاندهندهای در مکالمه، برنده شدن در بازیهای رومیزی و تولید آثار هنری مهارت پیدا میکنند – اما در مورد ایجاد برنامههای نرمافزاری چطور؟ در مقالهای که اخیراً منتشر شده است، محققان Google DeepMind میگویند که برنامه AlphaCode آنها میتواند با میانگین کدنویسهای انسانی در مسابقات برنامهنویسی استاندارد همگام شود.
محققان در شماره این هفته مجله Science گزارش دادند: «این نتیجه اولین بار است که یک سیستم هوش مصنوعی به صورت رقابتی در یک مسابقه برنامه نویسی عمل می کند.
هنوز نیازی به زنگ خطر در مورد Skynet نیست: سیستم تولید کد DeepMind در ارزیابی های شبیه سازی شده مسابقات برنامه نویسی اخیر در پلتفرم Codeforces رتبه متوسطی را در بین 54.3 درصد برتر کسب کرده است – یک میانگین بسیار “متوسط”.
“برنامه نویسی رقابتی یک چالش بسیار دشوار است، و شکاف بزرگی بین جایی که در حال حاضر هستیم (حل حدود 30٪ مسائل در 10 ارسال) و بهترین برنامه نویسان (حل بیش از 90٪ مسائل در یک ارسال) وجود دارد.” DeepMind Yujia Li، یکی از نویسندگان اصلی مقاله Science، در ایمیلی به brooztechnology گفت. “مشکلات باقی مانده نیز به طور قابل توجهی دشوارتر از مشکلاتی هستند که ما در حال حاضر حل می کنیم.”
با این حال، این آزمایش به مرز جدیدی در برنامه های کاربردی هوش مصنوعی اشاره می کند. مایکروسافت همچنین در حال بررسی مرزها با یک برنامه ارائه کد به نام Copilot است که از طریق GitHub در دسترس است. آمازون ابزار نرم افزاری مشابهی به نام CodeWhisperer دارد.
Oren Etzioni، مدیر عامل موسسه آلن برای هوش مصنوعی در سیاتل و مدیر ارشد فناوری AI2 انکوباتور، به brooztechnology گفت که تحقیقات جدید منتشر شده بر وضعیت DeepMind به عنوان یک بازیگر اصلی در کاربرد ابزارهای AI معروف به مدلهای زبان بزرگ یا LLM تاکید میکند.
اتزیونی در ایمیلی گفت: «این یک یادآوری قابل توجه است که OpenAI و مایکروسافت انحصار دستاوردهای چشمگیر LLM را ندارند. به دور از آن، AlphaCode از GPT-3 و Github Copilot مایکروسافت بهتر عمل می کند.

شاید AlphaCode بسیار قابل توجه باشد چگونه برنامه ها همانطور که برای چقدر خوب آن را برنامه ریزی می کند. شاید شگفتانگیزترین چیزی که در مورد سیستم وجود دارد این است که AlphaCode انجام نمیدهد: AlphaCode هیچ دانش داخلی صریحی در مورد ساختار کدهای کامپیوتری ندارد. در عوض، AlphaCode برای نوشتن کد به یک رویکرد صرفاً «داده محور» متکی است و ساختار برنامههای رایانهای را با مشاهده تعداد زیادی از کدهای موجود میآموزد. زیکو کولتر، دانشمند کامپیوتر در دانشگاه کارنگی ملون، در تفسیر علمی درباره این مطالعه.
AlphaCode از یک مدل زبان بزرگ برای ساخت کد در پاسخ به توضیحات مشکلات زبان طبیعی استفاده می کند. این نرم افزار از مجموعه داده های عظیمی از مشکلات و راه حل های برنامه نویسی، به علاوه مجموعه ای از کدهای بدون ساختار GitHub بهره می برد. AlphaCode هزاران راهحل پیشنهادی برای مشکل در دست تولید میکند، آن راهحلها را فیلتر میکند تا راهحلهایی را که معتبر نیستند کنار بگذارد، راهحلهای باقیمانده را در گروههایی گروهبندی میکند، و سپس یک نمونه از هر گروه را برای ارسال انتخاب میکند.
کولتر گفت: «ممکن است تعجب آور به نظر برسد که این روش شانسی برای تولید کد صحیح دارد.
کولتر گفت رویکرد AlphaCode می تواند با روش های ساختارمندتر زبان ماشین برای بهبود عملکرد سیستم یکپارچه شود.
او نوشت: «اگر روشهای ترکیبی ML که یادگیری مبتنی بر داده را با دانش مهندسی ترکیب میکنند، میتوانند در این وظایف بهتر عمل کنند، اجازه دهید آنها را امتحان کنند. “AlphaCode تاس انداخت.”
لی به brooztechnology گفت که DeepMind به اصلاح AlphaCode ادامه میدهد. او در ایمیل خود نوشت: “اگرچه AlphaCode یک گام قابل توجه از 0٪ تا 30٪ است، اما هنوز کار زیادی برای انجام وجود دارد.”
اتزیونی موافقت کرد که “جای زیادی” در تلاش برای ایجاد نرم افزار تولید کد وجود دارد. او گفت: “من انتظار دارم تکرار و بهبود سریع باشد.”
“ما فقط 10 ثانیه با “بیگ بنگ” مولد هوش مصنوعی فاصله داریم. اتزیونی گفت: محصولات بسیار چشمگیرتر برای طیف وسیع تری از داده ها، هم متنی و هم ساختاری، به زودی عرضه می شوند. ما دیوانه وار در حال تلاش هستیم تا بفهمیم این فناوری تا کجا پیش می رود.
همانطور که کار پیشرفت می کند، AlphaCode می تواند جرقه بحث های طولانی مدت در مورد وعده و خطرات بالقوه هوش مصنوعی شود، درست همانطور که برنامه AlphaGo DeepMind زمانی که تسلط ماشینی بر بازی قدیمی Go را نشان داد. و برنامه نویسی تنها زمینه ای نیست که پیشرفت سریع هوش مصنوعی باعث بحث و جدل می شود:
- یک برنامه OpenAI به نام ChatGPT به دلیل توانایی آن در پاسخگویی به درخواستهای اطلاعات با پاسخهای دقیق و اسنادی که میتواند از مقالات ترم گرفته تا استعفا نامه از این دنیا.
- برنامههای تولید هنر مبتنی بر هوش مصنوعی مانند Lensa، DALL-E، و Stable Diffusion بحثهایی را برانگیختهاند که آیا چنین برنامههایی از میلیونها اثر هنری آرشیو شدهای که دست بشر خلق کردهاند یا نه و آیا میتوانند بازارهای آینده را برای معیشت از بین ببرند یا خیر. هنرمندان تنفس
- رباتها اخیراً بازیکنان انسانی را در بازیهای استراتژی مطابقت دادهاند که بر خلاف چکرز یا شطرنج، ارزیابی اطلاعات ناقص بازیکنان حریف را انجام میدهند. برنامه DeepNash شرکت DeepMind بر روی بازی تخته Stratego تمرکز دارد، در حالی که برنامه Meta’s Cicero بر روی یک بازی تسلط بر جهان به نام Diplomacy تمرکز دارد. چنین پیشرفتی جای تعجب دارد که آیا می توان از هوش مصنوعی برای مشاوره به برنامه ریزان زندگی واقعی (یا کلاهبرداران) استفاده کرد.
وقتی از لی پرسیدیم که آیا DeepMind در مورد چیزی که ایجاد می کند نگرانی دارد، او پاسخ متفکرانه ای داد:
هوش مصنوعی این پتانسیل را دارد که به بزرگترین چالش های بشریت کمک کند، اما باید مسئولانه و ایمن ساخته شود و به نفع همه استفاده شود. مفید یا مضر بودن آن برای ما و جامعه بستگی به این دارد که چگونه از آن استفاده کنیم، چگونه از آن استفاده کنیم و برای چه تصمیمی بگیریم.
در DeepMind، ما یک رویکرد متفکرانه برای توسعه هوش مصنوعی داریم – ما از بررسی دقیق کار خود دعوت می کنیم و قبل از در نظر گرفتن پیامدها و کاهش خطرات، فناوری را منتشر نمی کنیم. با هدایت ارزشهای ما، فرهنگ پیشگامی مسئولانه حول حکمرانی مسئولانه، تحقیقات مسئولانه و تأثیر مسئولانه متمرکز شده است (اصول عملکرد ما را میتوانید در اینجا مشاهده کنید).
علاوه بر لی، نویسندگان اصلی مقاله تحقیقاتی علوم، “تولید کد در سطح رقابت با آلفا کد” شامل دیوید چوی، جونیونگ چانگ، نیت کوشمن، جولیان شریتویزر، رمی لبلند، تام اکلس، جیمز کیلینگ، فلیکس گیمنو، آگوستین هستند. دال لاگو، توماس هوبرت، پیتر چوی و سیپرین دی ماسون دآتوم. سیزده محقق دیگر به عنوان نویسندگان مشترک فهرست شده اند. نسخه پیش چاپ مقاله و مواد تکمیلی از طریق ArXiv در دسترس است.