آزمایش تورینگ چیست؟

امروزه کامپیوترها دقیقاً همان چیزی هستند که از یک ماشین چندمنظوره انتظار داریم. اگر چه بشر در دنیای محاسبات مسیر زیادی را طی کرده است اما هنوز علوم کامپیوتر و هوش مصنوعی در تلاش است تا به یکی از نقاط عطف مهم یعنی رسیدن به سطح هوش انسانی دست یابد. گفتن این جمله آن آسان است، اما برای ارزیابی این هدف مهم، آزمایشی در دهه ۱۹۵۰ میلادی وجود داشته که برای طراحی هوش ماشین به کار می­ رفته است. آزمایش تورینگ همان آزمایشی است که تا امروز به عنوان بهترین استاندارد، به دانشمندان کمک می­ کند تا ماشین­ های شان را بر اساس آن ارزیابی کرده و از قوانین آن به عنوان الگوی قضاوت استفاده کنند. قبل از این که ببینیم آزمایش تورینگ چیست، بهتر است نگاهی به تاریخچه آن بیندازیم.

تاریخچه

این سوال که آیا می­ توان ماشینی ساخت که قادر به فکر کردن باشد، برای اولین بار به ذهن یک فیلسوف رسید و نه یک دانشمند. رنه دکارت، اولین کسی بود که این سوال را بدون هیچ پیش زمینه علمی دقیق از خود پرسید. دکارت در فکر یک اتوماتا (Automata یا ماشین خودکار) بود که بتواند نسبت به تعاملات انسانی واکنش نشان دهد. دکارت همچنین ادعا می­ کرد که چنین ماشینی هرگز قادر نخواهد بود تا با حجم قابل توجهی از اطلاعات ارتباط برقرار کند. این همان چیزی است که دکارت نمی­ توانست پیش ­بینی کند. برخلاف تورینگ که معتقد بود ماشین­ های آینده قادر خواهند بود بر چنین ناکارآمدی غلبه کنند.

عبارت «هوش مصنوعی» حدود ده سال قبل تر از آغاز فعالیت رسمی هوش مصنوعی به صورت پراکنده استفاده می ­شد. این عبارت در میان اعضای باشگاه Ratio مرسوم بود. این باشگاه متشکل از اعضاء و دانشمندانی در زمینه سایبری و الکترونیک آن زمان بود. یکی از اعضای آن باشگاه به نام آلن تورینگ (Alan Turing) مبتکر آزمایشی بود که به افتخارش به نام آزمایش (تست) تورینگ نامگذاری شد. آلن تورینگ در اواخر سال ۱۹۴۱ مفهومی به نام «هوش مصنوعی» را طرح و بررسی کرد. او همچنین، برای اولین بار مفهومی به نام «هوش کامپیوتر» را ابداع و مطرح کرد. وی در یکی از گزارش های تاریخی خود، این سوال را مطرح کرد که آیا یک ماشین می تواند رفتار هوشمندانه از خود نشان دهد یا خیر. صورت های مختلفی از آزمایش تورینگ وجود دارد که می توان به وسیله آن هوش یک ماشین را سنجید.

«بازی تقلید (Imitation Game)» و «تفسیر استاندارد (Standard Interpretation)»

سه استاندارد پذیرفته شده در مورد آزمایش تورینگ وجود دارد. دو مورد اول مطابق استاندارد «ماشین و هوش محاسباتی» است که توسط خود تورینگ ایجاد شده بود. سومین مورد که یک موضوع نسبتاً داغ بوده و همچنان به طور گسترده مورد بحث است، تحت عنوان «تفسیر استاندارد» شناخته می شود. تردیدهایی در مورد تفسیر استاندارد به عنوان یک نوع مشروع از آزمایش تورینگ وجود دارد که می ­تواند ناشی از برداشت نادرست از مقاله تورینگ باشد. هر کدام از این اختلافات مزایا و معایبی دارد.

مقاله منتشر شده اصلی (متعلق به تورینگ) که مبنایی برای آزمایش تورینگ است، یک بازی ساده شامل سه بازیکن را ترسیم می­ کند. بیایید اسم بازیکنان را به ترتیب A و B و C بنامیم. در این بازی فرض کنیم که بازیکن A یک مرد، بازیکن B یک زن و بازیکن C که نقش بازپرس را ایفاء می­ کند، هر جنسیتی داشته باشد. حال دو بازیکن A و B را به صورت جدا از هم و ناشناس پشت صفحه نمایش قرار می­ دهیم. بازیکن C با استفاده از پرسش سوالات متعدد سعی می ­کند جنسیت هر کدام از بازیکنان A و B را حدس بزند. در این موقعیت، بازیکن A سعی می­کند تا بازپرس یعنی بازیکن C را فریب بدهد. این در حالی است که بازیکن B سعی می کند بازپرس را برای گرفتن تصمیم درست راهنمایی­ کند. در این جا تورینگ این سوال را می­ پرسد که اگر یک ماشین در جایگاه بازیکن A قرار گیرد، آیا موفق خواهد شد که بازپرس را فریب دهد؟ آیا ماشین می­ تواند به تنهایی فکر کند؟ نسخه دوم بازی توسط تورینگ در مقاله وی مربوط در سال ۱۹۵۰ منتشر شد. در هر حال در بازی تقلید، نقش بازیکن A توسط کامپیوتر و نقش بازیکن B توسط یک مرد یا زن ایفاء می ­شود.

حالا به نکته کلیدی آزمایش تورینگ می­ پردازیم. هدف این آزمایش، فریب بازپرس یا به عبارتی بازیکن C نیست؛ بلکه هدف، سنجش میزان توانایی یک ماشین در ایفای نقش یک انسان است. در «تفسیر استاندارد» هم به طور مشابه نقش بازیکن A را یک کامپیوتر و نقش بازیکن B را یک انسان بازی می کند. اما این بار بر خلاف آزمایش قبلی، وظیفه بازپرس شناسایی بازیکن مرد و زن نیست. بلکه وظیفه او شناسایی کامپیوتر از انسان است. در آزمایش «تفسیر استاندارد» بازپرس قادر نخواهد بود بین انسان و کامپیوتر تمیز قائل شود. در این آزمایش، ضعف هایی مربوط به مدت زمان وجود دارد. به طور خلاصه، اگر چه آزمایش تورینگ ضعف ­ها و محدودیت­ های خود را دارد، اما می­ توان آن را یکی از برجسته ­ترین آزمایش هایی دانست که تاکنون از آن برای سنجش هوش کامپیوترها استفاده شده است.