"मुझे रोबोटों के नियंत्रण लेने की चिंता नहीं है," एआई विशेषज्ञ माइकल वूल्ड्रिज कहते हैं। वह बड़ी टेक्नोलॉजी के वास्तविक जोखिमों—और कभी-कभार होने वाले लाभों—के बारे में बात करते हैं।

"मुझे रोबोटों के नियंत्रण लेने की चिंता नहीं है," एआई विशेषज्ञ माइकल वूल्ड्रिज कहते हैं। वह बड़ी टेक्नोलॉजी के वास्तविक जोखिमों—और कभी-कभार होने वाले लाभों—के बारे में बात करते हैं।

माइकल वूल्ड्रिज उस शिक्षक की तरह हैं जिसकी आप कामना करते हैं: उनसे बात करना आसान है, कठिन विचारों को सरल शब्दों में समझाने में माहिर हैं, न तो बहुत बौद्धिक हैं और न ही कूल बनने की कोशिश करते हैं, और अपने काम के प्रति वास्तव में उत्साहित हैं। वे कहते हैं, "मुझे यह देखना बहुत पसंद है जब किसी के मन में रोशनी जलती है, जब वे कुछ ऐसा समझ लेते हैं जो वे पहले नहीं समझते थे।" "मुझे यह अविश्वसनीय रूप से संतोषजनक लगता है।"

वे एक सामान्य व्यक्ति की तरह लगते हैं, जो कि, 500 से अधिक वैज्ञानिक पेपर और 10 किताबें लिख चुके ऑक्सफोर्ड प्रोफेसर के रूप में, वे स्पष्ट रूप से नहीं हैं। आमतौर पर, उनका पसंदीदा काम कृत्रिम बुद्धिमत्ता पर लेडीबर्ड्स एक्सपर्ट बुक्स—क्लासिक बच्चों की श्रृंखला का एक अपडेट—में उनका योगदान है। "मुझे इस पर बहुत गर्व है," वे अपनी बुकशेल्फ़ से मुझे एक प्रति देते हुए कहते हैं। हम एक धूप भरे वसंत के दिन ऑक्सफोर्ड विश्वविद्यालय के कुछ हद तक सामान्य कंप्यूटिंग विभाग में उनके अध्ययन कक्ष में हैं। हो सकता है कि यह परिसर का माहौल हो, लेकिन हमारी बातचीत लगभग एक सेमिनार की तरह लगती है।

वूल्ड्रिज एक कुशल सार्वजनिक वक्ता हैं, विशेष रूप से कृत्रिम बुद्धिमत्ता पर—एक ऐसा क्षेत्र जिसमें वे 30 वर्षों से अधिक समय से काम कर रहे हैं, लेकिन फिर भी वे इसे संदेह की एक स्वस्थ खुराक के साथ देखते हैं। रॉयल इंस्टीट्यूशन के लिए 2023 के अपने क्रिसमस व्याख्यानों में, जिसका शीर्षक था द ट्रुथ अबाउट एआई, उन्होंने एक रोबोटिक कुत्ता लाया और अपने स्कूल जाने वाले दर्शकों से वोट करने को कहा कि क्या वे इसे बेसबॉल के बल्ले से मारेंगे। और सुदृढीकरण सीखने को समझाने के लिए, उन्होंने 80 के दशक की क्लासिक फिल्म वारगेम्स को फिर से बनाया, जहाँ एक युवा मैथ्यू ब्रोडरिक अमेरिकी सैन्य कंप्यूटर को अपने साथ टिक-टैक-टो खेलने के लिए कहकर परमाणु आपदा को रोकता है (जब तक उसे एहसास नहीं होता कि जीतने का कोई वास्तविक तरीका नहीं है)। वूल्ड्रिज कहते हैं, "उस समय मैथ्यू ब्रोडरिक लंदन में थे। हमने उन्हें क्रिसमस व्याख्यान में लाने की कोशिश की, लेकिन वे नहीं आ सके।" "इसलिए हमने अपने कंप्यूटर का नाम उनके सम्मान में ब्रोडरिक रखा।"

वारगेम्स वास्तव में वूल्ड्रिज की नवीनतम पुस्तक, लाइफ लेसन्स फ्रॉम गेम थ्योरी: द आर्ट ऑफ थिंकिंग स्ट्रैटेजिकली इन अ कॉम्प्लेक्स वर्ल्ड के विषय के काफी करीब है। वे कहते हैं कि वे अपने छात्रों को यह विषय 15 वर्षों से अधिक समय से पढ़ा रहे हैं। अब हमारी बारी है। वूल्ड्रिज की किताब में कोई गणित नहीं है; इसके बजाय, वे गेम थ्योरी को 21 आसानी से समझ में आने वाले परिदृश्यों में बदल देते हैं, जिसमें अटलांटिक कॉड मछली पकड़ने से लेकर पेप्सी बनाम कोका-कोला और ईश्वर के अस्तित्व तक सब कुछ शामिल है।

वूल्ड्रिज कहते हैं, "यह आश्चर्यजनक है कि कितनी वैश्विक घटनाओं को गेम थ्योरी के अपेक्षाकृत कम संख्या में मॉडलों द्वारा समझाया जा सकता है।" सबसे सरल में से एक "चिकन" का खेल है, जिसे वे अपनी पुस्तक में जेम्स डीन की फिल्म रेबेल विदाउट अ कॉज के एक दृश्य का उपयोग करके चित्रित करते हैं (वे स्वीकार करते हैं कि उनके किसी भी छात्र ने इसके बारे में नहीं सुना था)। दो किशोर अपनी कारों को एक चट्टान की ओर ले जाते हैं; जो पहले कूदता है वह "चिकन" है और हार जाता है। यदि वे दोनों एक ही समय पर कूदते हैं, तो यह ड्रॉ होता है; यदि कोई नहीं कूदता, तो आप बुरी तरह हार जाते हैं (स्पॉइलर अलर्ट: फिल्म में ऐसा ही होता है)।

यहाँ सिद्धांत का पाठ नैश संतुलन के बारे में है (हम विवरण में नहीं जाएंगे)—लेकिन व्यवहार में, हम इस खेल को हर समय वास्तविक जीवन में होते हुए देखते हैं। क्यूबा मिसाइल संकट एक प्रमुख उदाहरण हुआ करता था, लेकिन एक और अभी सामने आ रहा है: अमेरिका-ईरान संघर्ष। वूल्ड्रिज कहते हैं, "आपके पास दो पक्ष हैं जो एक-दूसरे के खिलाफ लगातार बढ़ती धमकियां दे रहे हैं; किसी को किसी बिंदु पर पीछे हटना होगा।" "खतरा यह है कि यदि कोई पीछे नहीं हटता, तो आप वापसी के बिंदु को पार कर जाते हैं और सभी के लिए सबसे खराब स्थिति प्राप्त करते हैं।"

क्या इससे बाहर निकलने का कोई रास्ता है? "ठीक है, खेल बदलने का एक तरीका यह है कि कोई तीसरा पक्ष आगे आए और एक पक्ष को अलग तरीके से कार्य करने के लिए प्रोत्साहन प्रदान करे।" दूसरा विकल्प अपने प्रतिद्वंद्वी के साथ संवाद करके खेल को दरकिनार करना है। क्यूबा मिसाइल संकट के दौरान ऐसा ही हुआ था, लेकिन यहाँ इसकी संभावना कम लगती है। "हालांकि, मुझे कहना होगा, ईरान इसे और अधिक चतुराई से खेल रहा है, इस अर्थ में कि अमेरिकी पक्ष बहुत, बहुत अप्रत्याशित है। अब, अप्रत्याशित होना भी एक क्लासिक गेम थ्योरी रणनीति है, लेकिन यह दूसरे पक्ष के लिए यह जानना बहुत मुश्किल बना देता है कि कैसे प्रतिक्रिया देनी है। यदि आप वास्तव में एक तर्कहीन खिलाड़ी के खिलाफ हैं, तो गेम थ्योरी एक बात कहती है कि आप सबसे खराब स्थिति के खिलाफ अपने दांव को हेज करते हैं।"

वूल्ड्रिज जोर देकर कहते हैं कि यह केवल युद्ध या खेलों के बारे में नहीं है। अपनी पुस्तक में, वे गेम थ्योरी को "एक गणितीय सिद्धांत के रूप में परिभाषित करते हैं जिसका उद्देश्य उन स्थितियों को समझना है जहाँ स्वार्थी पक्ष एक-दूसरे के साथ बातचीत करते हैं।" उनका तर्क है कि यह सभी प्रकार की स्थितियों पर लागू हो सकता है: सामाजिक, राजनीतिक और दार्शनिक।

पूर्ण स्क्रीन में छवि देखें
वास्तव में उत्साही … 2023 में वूल्ड्रिज। फोटोग्राफ: पॉल विल्किंसन

उदाहरण के लिए, "शून्य-योग खेल" का विचार एक सामान्य शब्द बन गया है (आंशिक रूप से वारगेम्स के लिए धन्यवाद), भले ही इसे व्यापक रूप से गलत समझा जाता है। वूल्ड्रिज बताते हैं, शून्य-योग खेल केवल वह नहीं है जहाँ एक पक्ष वह प्राप्त करता है जो दूसरा खोता है; यह वह है जहाँ लक्ष्य अपने प्रतिद्वंद्वी को यथासंभव बुरी तरह हराना है। इसलिए, तकनीकी रूप से, शतरंज एक शून्य-योग खेल नहीं है क्योंकि आप केवल जीतने की कोशिश कर रहे हैं, न कि अपने प्रतिद्वंद्वी को नष्ट या अपमानित करने की। इसका एक सामाजिक और राजनीतिक पक्ष है। "यह शून्य-योग मानसिकता बहुत हानिकारक है। यह एक बहुत ही पुरुष प्रवृत्ति है," वे कहते हैं। "और सबूत बताते हैं कि न केवल आप जीवन में उतना अच्छा नहीं करते जितना आप कर सकते थे, बल्कि आप वास्तव में अधिक दुखी होते हैं। आपको लगता है कि आपके अपने मामलों पर आपका कम नियंत्रण है। गेम थ्योरी से प्रमुख सबक में से एक यह है कि वास्तव में, हमारी अधिकांश बातचीत शून्य-योग नहीं होती है।"

यह प्रतिकूल विश्वदृष्टि लोकलुभावन राजनीति को संचालित करती है – "प्रवासी आपकी नौकरियां लेने आ रहे हैं" के अर्थ में। आप हार रहे हैं क्योंकि दूसरे जीत रहे हैं। वूल्ड्रिज के पसंदीदा खेलों में से एक हमें इसके विपरीत सोचने के लिए प्रोत्साहित करता है: अज्ञानता का पर्दा, जिसे 1971 में दार्शनिक जॉन रॉल्स ने बनाया था। विचार यह है कि आप समाज को अपनी इच्छानुसार डिजाइन कर सकते हैं, लेकिन बाद में, आपको इसमें बेतरतीब ढंग से रखा जाएगा। वूल्ड्रिज इसे "एक सुंदर विचार प्रयोग … यह सामाजिक रूप से अच्छे परिणाम को प्रोत्साहित करता है, लेकिन लोग अभी भी अपने स्वयं के स्वार्थ का पालन कर रहे हैं" कहते हैं। वे आगे कहते हैं कि बिल क्लिंटन और बराक ओबामा दोनों इसके प्रशंसक थे।

यह तुरंत स्पष्ट नहीं है कि गेम थ्योरी एआई के साथ कैसे फिट बैठती है, लेकिन आजकल, यह इसका एक बड़ा हिस्सा है, वूल्ड्रिज बताते हैं, विशेष रूप से उनकी रुचि के मुख्य क्षेत्र में: मल्टी-एजेंट सिस्टम – प्रोग्राम जो एक-दूसरे के साथ बातचीत करते हैं और आपकी ओर से कार्य करते हैं। "इसलिए यदि मैं आपके साथ एक बैठक आयोजित करना चाहता हूँ, तो मैं आपको क्यों फोन करूं? मेरा सिरी सीधे आपके सिरी से बात क्यों नहीं करता?" इस प्रकार की बातचीत हमारे ऑनलाइन जीवन में निर्मित होती है। उदाहरण के लिए, ईबे जैसी ऑनलाइन नीलामी, जहाँ आप अंतिम क्षण में विजेता बोली लगाने की कोशिश कर रहे हैं। "यदि मेरा एजेंट आपके एजेंट के साथ बातचीत करने वाला है, और मेरी प्राथमिकताएं जरूरी नहीं कि आपकी प्राथमिकताओं से मेल खाती हों, तो जो सिद्धांत बताता है कि आपको उन बातचीत के बारे में कैसे सोचना चाहिए, वह गेम थ्योरी है।"

पूर्ण स्क्रीन में छवि देखें
एक टैंडी TRS-80 पीसी, वूल्ड्रिज की पहली मशीन। फोटोग्राफ: फोटोलॉजी1971/अलामी

जब वूल्ड्रिज ने शुरुआत की, तो एआई लगभग एक अमूर्त अवधारणा थी। वे शौकिया उत्साह के माध्यम से कंप्यूटिंग में आए। ग्रामीण हियरफोर्डशायर में, स्थानीय साइडर कंपनी में एक मध्यम प्रबंधक के बेटे के रूप में बड़े होते हुए, यह एक बड़ी बात थी जब उनके स्थानीय इलेक्ट्रॉनिक्स की दुकान के पास लगभग 1980 में बिक्री के लिए एक होम कंप्यूटर था। "यह हास्यास्पद लग रहा था क्योंकि मुझे लगता था कि कंप्यूटर करोड़ों पाउंड की चीजें हैं।" दुकान के मालिकों ने कृपया उन्हें इसे आज़माने दिया (यह एक टैंडी TRS-80 था)। "मैं सप्ताह दर सप्ताह वापस जाता था और खुद को प्रोग्राम करना सिखाता था। मैं सचमुच दुकान की खिड़की में कंप्यूटर पर बैठा होता था।" उन्होंने आगे पढ़ाई की...स्नातक के रूप में कंप्यूटिंग का अध्ययन करने के बाद, मैंने 1989 में एआई में पीएचडी शुरू की, फिर जेनेट (जॉइंट एकेडमिक नेटवर्क) के साथ इंटर्नशिप की, जो मूल रूप से प्रारंभिक इंटरनेट का यूके हिस्सा था। तब से प्रौद्योगिकी अविश्वसनीय रूप से आगे बढ़ चुकी है, लेकिन जैसा कि वूल्ड्रिज कहते हैं, "वर्तमान एआई क्रांति को चलाने वाली मुख्य तकनीकों का आविष्कार 80 के दशक के मध्य तक हो चुका था।" वे कृत्रिम तंत्रिका नेटवर्क के अग्रणी जेफ्री हिंटन का उल्लेख करते हैं – वह तंत्र जो अब मशीन लर्निंग को शक्ति प्रदान करता है। "1980 के दशक में एआई क्रांति के रास्ते में एकमात्र बाधा, वास्तव में, यह थी कि कंप्यूटर पर्याप्त शक्तिशाली नहीं थे और हमारे पास पर्याप्त डेटा नहीं था।"

प्रभावित करने वालों की अगली पीढ़ी इस बात से सहमत होगी कि वे जो कुछ भी कहते हैं, करते हैं और देखते हैं, उसका उपयोग एआई के लिए किया जाएगा।

जब बात आती है, तो वूल्ड्रिज कहते हैं, 2020 में GPT-3 की सफलता काफी हद तक "एक शर्त पर आधारित थी जो OpenAI ने लगाई थी कि यदि वे वही काम करते हैं, केवल 10 गुना बड़ा, तो यह परिणाम देगा। उस समय बहुत से लोग, जिनमें मैं भी शामिल था, इसके बारे में बहुत संशय में थे। मैं एक वैज्ञानिक हूँ; मैं वैज्ञानिक विकास के माध्यम से प्रगति देखना चाहूंगा, न कि केवल उस पर अधिक कंप्यूटर शक्ति फेंककर। लेकिन यह पता चला कि, वास्तव में, यह एक बहुत ही सफल शर्त थी।" क्या इससे पता चलता है कि OpenAI के बॉस सैम ऑल्टमैन और उनके साथी वे तकनीकी प्रतिभा नहीं हैं जो लोग सोचते हैं? "मैं सैम ऑल्टमैन से कभी नहीं मिला; मुझे नहीं पता," वे कूटनीतिक रूप से कहते हैं। "उन्होंने स्पष्ट रूप से कुछ उल्लेखनीय दिया है।"

प्रतिभा हों या न हों, ये एआई अग्रणी अपनी सीमाओं तक पहुँच रहे होंगे। कुछ साल पहले, ऑल्टमैन और गूगल डीपमाइंड के डेमिस हस्साबिस जैसे लोगों ने कुछ वर्षों के भीतर AGI – मानव-स्तरीय कृत्रिम सामान्य बुद्धिमत्ता – प्राप्त करने की उम्मीद की थी। वूल्ड्रिज कहते हैं, "मैं व्यक्तिगत रूप से सोचता हूँ कि वे अति-आशावादी हैं।" आप ChatGPT से लैटिन में क्वांटम यांत्रिकी के बारे में बात कर सकते हैं, वे बताते हैं, "लेकिन साथ ही, हमारे पास ऐसा एआई नहीं है जो आपके घर में आ सके, जिसे उसने पहले कभी नहीं देखा हो, रसोई का पता लगा सके और डिनर टेबल साफ कर सके" – कुछ ऐसा जो न्यूनतम मजदूरी पर काम करने वाला मानव कर्मचारी कर सकता है।

"सीमाएं कंप्यूटर शक्ति और डेटा हैं जिन्हें आप उस पर फेंकने में सक्षम हैं। और डेटा अब एक वास्तविक बाधा है।" वे कहते हैं, संपूर्ण विकिपीडिया GPT-3 के प्रशिक्षण डेटा का केवल 3% था। "अगली बार आपको 10 गुना अधिक डेटा कहाँ से मिलेगा?" इस कारण से डेटा एक मूल्यवान संसाधन बन रहा है, और कुछ संगठनों के पास इसका एक संभावित खजाना है। "एनएचएस मनुष्यों के बारे में भारी मात्रा में डेटा पर बैठा है। यह सबसे मूल्यवान प्रकार का डेटा है जिसकी कल्पना की जा सकती है।" निजी निगम इसके लिए बहुत कुछ देंगे, वे कहते हैं, "लेकिन मुझे संदेह है कि जिसने भी ऐसे सौदे पर हस्ताक्षर किए, वह जीवन भर इसका पछतावा करेगा।" वे एक डायस्टोपियन भविष्य परिदृश्य की कल्पना करते हैं जहाँ "आप केवल एनएचएस तक पहुँच प्राप्त कर सकते हैं यदि आप पहनने योग्य तकनीक से जुड़ने के लिए सहमत हैं जो आपकी नियमित रूप से निगरानी करती है … मुझे लगता है कि हम बहुत जल्दी एक ऐसी दुनिया में जा रहे हैं जहाँ ऑनलाइन प्रभावित करने वालों की अगली पीढ़ी मूल रूप से अपने सभी जीवन के अनुभवों, वे जो कुछ भी कहते हैं और करते हैं और देखते हैं, को एआई के लिए डेटा प्रदान करने के लिए काटा जाने के लिए सहमत होगी।"

एक अकादमिक दृष्टिकोण से, वूल्ड्रिज उस तरीके से नाराज हैं जिससे सिलिकॉन वैली एआई क्षेत्र पर हावी हो गई है, संसाधनों ("GPT-3 को प्रशिक्षित करने के लिए 20,000-विषम एआई सुपरकंप्यूटरों की आवश्यकता थी; पूरे ऑक्सफोर्ड विश्वविद्यालय में शायद कुछ सौ हैं") और सार्वजनिक चर्चा दोनों के मामले में। वे कहते हैं, "हमने देखा है कि कथा सिलिकॉन वैली द्वारा चुरा ली गई है, जो एआई के एक संस्करण [लाभ-संचालित, नौकरी-प्रतिस्थापन और लगभग पूरी तरह से बड़े भाषा मॉडल पर केंद्रित] को बढ़ावा दे रही है जिसे बनाने या बढ़ावा देने में निश्चित रूप से मेरी और मेरे बहुत से सहयोगियों की कोई दिलचस्पी नहीं है।" "यह एक तरह से निराशाजनक है, एक ऐसे व्यक्ति के रूप में जिसने बेहतर दुनिया बनाने और लोगों के जीवन को बेहतर बनाने के लिए एआई बनाने में अपना करियर बिताया है।"वे आगे कहते हैं: "यदि आप बड़ी तस्वीर देखते हैं, तो एआई लाभों की एक विशाल श्रृंखला प्रदान करता है जो अक्सर किसी का ध्यान नहीं जाता क्योंकि बड़े भाषा मॉडल सारा ध्यान खींच लेते हैं।" वे ऑक्सफोर्ड में एक टीम का उल्लेख करते हैं जो एक एआई-संचालित उपकरण विकसित कर रही है जो एक साधारण अल्ट्रासाउंड से हृदय स्कैन का विश्लेषण कर सकता है, जो मोबाइल फोन के माध्यम से आपके जीपी को भेजा जाता है। "यह उस तरह की महंगी देखभाल है जो एनएचएस प्रदान करने के लिए संघर्ष करता है, अचानक बहुत कम लागत पर उपलब्ध है।"

2025 में, वूल्ड्रिज ने जनता को वैज्ञानिक विचारों को समझाने में अपने कौशल के लिए रॉयल सोसाइटी का प्रतिष्ठित फैराडे पुरस्कार जीता। फरवरी में उनके व्याख्यान का शीर्षक था दिस इज़ नॉट द एआई वी वेयर प्रॉमिस्ड। उस समय के आसपास, उन्होंने सुझाव दिया कि एआई का "हिंडनबर्ग क्षण" हो सकता है – हिंडनबर्ग दुर्घटना ने रातोंरात एयरशिप उद्योग को नष्ट कर दिया। वे कहते हैं, "यह पूरी तरह से संभव है कि हम इसी तरह की एआई-संबंधित आपदा देख सकते हैं।" "कंप्यूटर प्रोग्राम सभी प्रकार के तरीकों से विफल होते हैं, और हम पूरी तरह से एक कंप्यूटिंग नेटवर्क पर निर्भर हैं जहाँ एआई तेजी से एम्बेडेड हो रहा है।" हालांकि, जब अस्तित्वगत जोखिमों की बात आती है, तो वे आगे कहते हैं, "एआई उन चीजों की मेरी सूची में उच्च नहीं है जो मुझे रात में जगाए रखती हैं।" "मैं रोबोट के कब्जे के बारे में चिंता नहीं करता। कम से कम, यह मेरे शीर्ष पांच में नहीं है।" हालांकि, यह तथ्य कि वे परमाणु युद्ध को एक बड़ा खतरा मानते हैं, वास्तव में आश्वस्त करने वाला नहीं है।

पूर्ण स्क्रीन में छवि देखें
भविष्य पर विचार करते हुए … माइकल वूल्ड्रिज। फोटोग्राफ: फिलिपा जेम्स/द गार्जियन

यदि वे कर सकते, तो वे एआई विकास को धीमा कर देंगे, "बस इतना कि हमारे पास यह समझने के लिए अधिक समय हो कि क्या हो रहा है।" वे बताते हैं कि यह एक क्लासिक "कैदी की दुविधा" है, जो गेम थ्योरी में एक प्रमुख विचार है। मानक परिदृश्य में, दो कैदियों को अलग-अलग यह तय करना होता है कि उस अपराध को कबूल करना है या चुप रहना है जो उन्होंने एक साथ किया था। यदि एक कबूल करता है और दूसरा नहीं करता, तो केवल कबूल करने वाला मुक्त होता है। यदि दोनों कबूल करते हैं, तो वे प्रत्येक छोटी सजा काटते हैं। यदि दोनों चुप रहते हैं, तो वे और भी छोटी सजा काटते हैं। इसलिए वे बेहतर होंगे यदि दोनों चुप रहने के लिए सहमत हों, लेकिन कोई नहीं जानता कि दूसरा क्या करेगा। प्रतिकूल रूप से, गेम थ्योरी कहता है कि सबसे चतुर कदम कबूल करना है।

उसी तर्क से, एआई कंपनियां आगे बढ़ने की होड़ में बंद हैं। उनकी प्रतिस्पर्धा अधिक खर्च, संसाधनों और ऊर्जा-भूखे डेटा केंद्रों की ओर ले जाती है, जिसका मानवता के लिए कोई शुद्ध लाभ नहीं है। लेकिन हम यहाँ हैं। "हमारे पास एआई का पीछा करने वाली बहुत कम संख्या में बहुत अमीर कंपनियां हैं, जबकि साथ ही यह कह रही हैं कि वे डरती हैं कि कुछ बुरी तरह गलत हो जाएगा। तो वे अभी भी इसका पीछा क्यों कर रही हैं? क्य