147 24 2MB
Turkish Pages 376 [379] Year 2022
F@L
A
•
•
YAPAY ZEKA MiTi
BİLGİSAYARLAR NEDEN BİZİM GİBİ DÜŞÜNEMEZ
�@ı: 203 © Mak Grup Medya Pro. Rek. Yay. A.Ş. Sertifika Na: LJLJ396 Bilim 13 Bilişim Dl Yapay Zeka Miti -Bilgisayarlar Neden Bizim Gibi Düşünemez
Erik J. Larson Çeviren: Kadir Yiğit Us Özgün Adı: The Myth of Artificial lntelligence -Why Computers Can't Think the Way We Oo-
Edisyon: [c] 2021, Erik J. Larson [Harvard University Press aracılığıyla) Editör: İsmail Yllmaz Redaksiyon: Mak Grup Redaksiyon Ekibi Görsel Yönetmen: Nurullah Özbay Grafik Tasarım ve Uygulama: Tavoos ISBN 978-625-Bl.Jll-62-l Baskı: Ayrıntı Basım Yay. ve Mat. Hiz. San. T ic. A.Ş. Matbaa Sertifika Na: Li9599 1. Baskı: Eylül 2022
İletişim Adresleri Cinnah Cd. Kırkpınar Sk. 5/ll 06LJ20 Çankaya Ankara Tel.: 0312. ll39 Ol 69 www.folkitap.com [email protected] [email protected] www.twitter.com/folkitap
A
•
•
YAPAY ZEKA MiTi
BİLGİSAYARLAR NEDEN BİZİM GİBİ DÜŞÜNEMEZ
ERiK J. LARSON
ÇEVİREN KADİR YİGİT US
ERIKJ. LARSON ABD'li yazar, bilgisayar bilimci, felsefeci ve girişimci. Spokane, Was hington'daki Whitworth Üniversitesi'nden mezun oldu
(1994).
Bilgi
sayar bilimi, dilbilim ve felsefeyi bir araya getiren teziyle Austin'deki Texas Üniversitesi'den doktora derecesi aldı
(2009).
ABD Savunma Ba
kanlığına bağlı DARPA'nın fonladığı çeşitli projelerde görev aldı. The
Atlantic, Los Angeles Review of Books ve Wired gibi çeşitli çevrimiçi ve matbu dergilerde yazarlık yaptı ve yapay zeka, bilgi tabanlı ağ güvenliği, anlamsal ağ ve doğal dil işleme konuları üzerine yazılar yayımladı. Bu alanlarda bilimsel ve felsefi çalışmalarını sürdürüyor.
KADiR YIÖIT US Hacettepe Üniversitesi İngiliz Dili ve Edebiyatı Bölümü'nde lisansını, Mütercim-Tercümanlık Bölümü'nde yüksek lisansını tamamladı. Do kuz Eylül Üniversitesi Çeviribilim Doktora Programı'nda bilimkurgu çevirilerinin sayısal incelemesi üzerine tez yazıyor. Başlıca Eserleri: Tom Goodwin, Dijital Darwinizm Baldwin, Küresel Robotlaşma ne, Araçlar ve Silahlar
(2021);
(2019);
Richard
Brad Smith ve Carol Ann Brow
(2022); Martin Ford, Robotların iktidarı (2022); (2022).
Colin Bryar ve Bili Carr, Amazon Nasıl Çalışıyor?
İÇİNDEKİLER
TEŞEKKÜR 111 GİRİŞ 113 l.KISIM BASiTLEŞTiRiLMİŞ DÜNYA 1
ZEKA HATASI I 21 2
TURING BLETCHLEY'DE l 3LJ 3
SÜPERZEKA HATASI I 51 q
GEÇMİŞTE VE GÜNÜMÜZDE TEKİLLİK l 65 5
DDGAL DİLİ ANLAMAK 173 6
YAPAY ZEKA: TEKNOLOJİK KITSCH l 86 7
BASİTLEŞTİRMELER VE GİZEMLER 196
il. KISIM ÇIKARIM SORUNU 8
HESAPLAMAYI BIRAK, ÇÖZÜMLE I 121 9
PEIRCE BULMACASI [VE PEIRCE'IN BULMACASI) 1128 10
TÜMDENGELİMİN VE TÜMEVARIMIN SORUNLAR! I 1LJ2 11
MAKİNE öGRENİMİ VE BÜYÜK VERİ 1177 12
SAVAVARIMLI ÇIKARIM I 207 13
ÇIKARIM VE DİL
-
1 l 2LJ9
-
2 I 266
1'1
ÇIKARIM VE DİL
111. KISIM MiTiN GELECE�I 15
MİTLER VE KAHRAMANLAR l 309 16
YAPAY ZEKA MİTOLOJİSİ SİNİRBİLİMİ İSTİLA EDİYOR 1319 17
NEOKORTİKAL İNSAN ZEKASI KURAMLAR! 13LJ2 18
BİLİMİN SONU MU GELDİ? 1350 DİZİN l 366
TEŞEKKÜR
u kitabın yazılmasına çok sayıda kişi, resmi ve gayri resmi yollardan katkıda bulundu. ilk olarak Harvard Üniversitesi Y ayınevi'nde editörken bu projenin başında gösterdiği destek için şimdilerde Hackett Yayınevi'nde ça lışan, Harvard Üniversitesi Yayınevi ekibinden Jeff Dean'e teşekkür etmek isterim. Jeff, yardımlarıyla fikirlerimi kağıda dökmeye yönelik ilk girişimlerimde bu fikirlerime itiraz etti, karşılaştığım ilk engelleri aşmaya çalışırken bana gösterdiği sabrı için ona minnettarım. Jeff'in bıraktığı yerden James Brandt, Joy de Menil ve Julia Kirby devam etti ve her biri metni kendi yöntemleriyle çok daha iyi hale getirdi. Graciela Galup'sa zarif bir tasarımla kitaba katkıda bulundu, Col leen Lanick ve tanıtım ekibiyse kitabı tanıtmak ve yaymak için yaratıcı yöntemler ürettiler. Bu kitabın tamamlanmasında çok kişinin emeği var. Taslağının bir kısmını yazarken yurtdışındaydım ve ABD' de olup bitenler bazen işleri zorlaştırıyordu. Bernard Fickser'a ortak kurduğumuz teknoloji şirketine cömert bir anlaşmayla fon sağladığı için ve türlü türlü yöntemlerle beni yüreklen dirdiği için minnettarım. Todd Hughes kitabın ilk taslağını okuyanlardandı ve çok yararlı önerilerde bulundu. Şimdiler de Folio Yayın Temsilciliği'nde çalışan yazar temsilcim Ro ger Freet de kitap yazmanın ve yayımlamanın inceliklerini
B
II
YAPAY ZEKA M iTİ
hiç yorulmadan, sabırla bana izah etti ve kitap teklifindeki desteği de takdire şayandı. Dahası Avrupa'daki o uzun günler boyunca bana katlan dığı, düşüncelerimi İngilizce düzenlemeye çalışırken Rusça öğrenmenin bitmeyen zorluklarından kurtulmama yardım ettiği için Anna Samsonova'ya teşekkür etmek istiyorum. Aynı zamanda paha biçilemez katkılarına rağmen adlarını burada tek tek anamadığım Seattle'daki yazar arkadaşları ma da teşekkür ederim. ( Siz kim olduğunuzu biliyorsunuz. ) Son olarak, birçok kişiye ilham kaynağı olan dostum, büyük bilim yazarı John Horgan'a, bu kitaba daha baştan inandığı ve beni sürekli teşvik ettiği için çok teşekkür edi yorum.
12
GİRİŞ
u kitabın sayfalarında yapay zeka ( YZ) mitini okuya
B caksınız. Bu mit gerçek yapay zekanın mümkün olup
olmadığı hakkında değil. Zaten sıra bu konuya geldiğinde söylenebilecek şey şu: Bilimsel açıdan bakıldığında, yapay zekanın geleceği belirsizdir. Yapay zeka mitiyse gerçek ya pay zekanın gelişinin kaçınılmaz, hatta an meselesi olduğu, insan düzeyinde yapay zekaya, oradan da insanı aşan bir süperzekaya giden yola çoktan girdiğimiz fikridir. Hayır, o yola girmedik. O yol ancak hayalgücümüzde mevcut. Yine de yapay zekanın ortaya çıkışının kaçınılmaz olduğu fikri, medya uzmanları ve Elan Musk gibi kanaat önderlerinin de teşvikiyle kamuoyuna, hatta bazı yapay zeka bilimcilerin (hepsi bu görüşte değil) tartışmalarına bile öyle bir sirayet etti ki bu görüşe itiraz edenler genellikle bir çeşit Luddculuk yapmakla, yani teknoloji düşmanlığı sergilemekle itham edi liyorlar. Ya da en azından teknolojinin geleceğine çok dar görüşlü baktığınız, zeki makinelerin dünyasına hazırlanma yarak çok tehlikeli bir hata yaptığınız düşünülüyor. tlerleyen sayfalarda göstereceğim üzere, yapay zeka bili mi zekanın tam merkezinde bulunan çok büyük bir gizemi gün yüzüne çıkardı ve bu gizemin nasıl çözüleceğini henüz hiç kimse bilmiyor. Bununla birlikte, yapay zekanın taraf tarları, yapay zekanın bilinen kısıtlamalarını en aza indir mek için büyük teşvikler alıyorlar. Ne de olsa bu büyük bir 13
YAPAY ZEKA MiTi
iş. Dahası, kültürümüzde giderek baskın hale geliyor. Yine de yapay zeka sistemlerinin gelecekte yapabilecekleri -be ğensek de beğenmesek de- zekanın doğası hakkında bugün bildiklerimizle sınırlı. O yüzden, lafı dolandırmadan, en başından söyleyelim: Elimizdeki tüm kanıtlar, insan zekası ile makine zekasının kökten farklı olduğunu işaret ediyor. Oysa yapay zeka miti, bu farklılıkların geçici olduğu, za manla daha güçlü sistemlerin inşa edileceği ve söz konusu farkların bu sistemler tarafından ortadan kaldırılacağı ko nusunda ısrar ediyor. Ray Kurzweil ve Nick Bostrom gibi gelecekbilimciler bu miti satanların başında geliyor ve insan düzeyinde bir yapay zekanın gelişinin kaçınılmaz oluşu yet mezmiş gibi, geldiklerinde süperzeki makinelerin arkasın dan nal toplayacağımızı da söylüyorlar. Elinizdeki kitap, yapay zeka mitinin biri bilimsel, diğeri kültürel olmak üzere, iki önemli veçhesini izah etmeyi amaç lıyor. Mitin bilimsel kısmı, oyunlar oynama veya görüntü tanıma gibi zeka gerektiren becerilerde dar kapsamlı ilerle meler sağlayarak, zorlu genel zeka sorununu 'yavaş yavaş çözmeye' devam etmemizin yeterli olacağı varsayımına da yanıyor. Bu fahiş bir hata: Dar kapsamlı uygulamalarda ba şarı sağlamak bizi genel zekaya bir adım bile yaklaştırmıyor. Sistemlerin genel zekaya ulaşabilmesi, yani gazete okuyabil mesi, sohbet edebilmesi ve Jetgiller'deki robot Rosie gibi ev işlerine yardımcı olabilmesi için yapması gereken çıka rımlar, yapay zeka hakkındaki mevcut bilgimizle ne prog ramlanabiliyor ne öğretilebiliyor ne de mühendislik yoluy la sistemlere yerleştirilebiliyor. Daha hızlı bilgisayarlarla bolca veriden faydalanan basit, dar kapsamlı zeka türlerini başarıyla uyguladığımızda adım adım ilerleme kaydetmiş olmuyoruz, sadece bu teknoloj inin alt dallarından sarkan meyvelerini toplamış oluyoruz. Makinelerde genel 'sağdu yuya' erişmek ise bundan tamamen farkı bir şeye, bir sıç ramaya ihtiyaç duyuyor ve biz alttaki dallardan üsttekilere nasıl sıçrayacağımızı dahi bilmiyoruz. Genel zekanın bir 14
algoritması yok. Derin öğrenme sistemleri veya bugünler de revaçta olan diğer tüm yaklaşımlar üzerinde daha fazla çalışırsak böyle bir algoritmaya ulaşabileceğimiz düşüncesi ne de kuşkuyla bakmanın haklı gerekçeleri var. Bu işin çok büyük bir bilimsel buluş gerektirmesi kuvvetle muhtemel. Dahası, böyle bir buluşu nasıl yapacağımızın ayrıntıları şöy le dursun, neye benzeyeceğine dair bile hiç kimsenin en ufak bir fikri yok. Yapay zeka mitoloj isi işte bu yüzden, yani kesintisiz iler lemeye dair sonu gelmez bir laf kalabalığının bilimsel bir gi zemin üzerini örtmesine sebep olduğu için zararlıdır. Bu mit, yapay zeka araştırmalarında başarının kaçınılmaz olduğuna dair inancı körüklüyorsa da bilime hakikaten saygı duyu yorsak tekrar kara tahtanın başına geçmemiz gerekiyor. Bu da bizi bu kitabın sayfalarında yer alan ikinci konuya getiri yor: yapay zeka mitinin kültürel sonuçları. Bu mitin peşine takılınca ne 'akıllı yatırım' fırsatı kovalamış ne de tarafsız bir tutum takınmış oluyoruz. Bu mit bilim için zararlı ol duğu gibi, bizim için de zararlı. Çünkü temeldeki gizemle yüzleşmektense onu görmezden gelirsek inovasyonlar ya pamayabiliriz. Sağlıklı bir inovasyon kültürü, bilinmeyenin keşfedilmesini teşvik eder, bilinen yöntemlerin uzantılarını -hele ki bu yöntemlerin bizi çok ileri götüremeyeceği kanıt lanmışken- abartmaz. Yapay zekanın başarıya ulaşmasının kaçınılmaz olduğu miti -insan düzeyinde yapay zekaya bir gün gerçekten ulaşılsın veya ulaşılmasın- tam da gerçek iler leme için şart olan inovasyon kültürünü baltalamaya meyil lidir. Dahası bu mit yüzünden bir makineler diyarı korku suna teslim oluyoruz, gerçek buluşlardan bahsetmek yerine gelecekbilimcilerin eldeki yaklaşımları savunan söylemlerini tercih ediyoruz. Oysa bu kişilerin de genellikle belli çıkarlar adına konuştuklarını unutmamak gerekiyor. Peki, bu kitabı kimler okumalı ? Elbette yapay zeka araştırmalarını heyecanla takip eden ama beklenen yapay zekanın neden bir türlü gelmediğini, gelişinin neden hep 15
YAPAY ZEKA MiTi
1 0-20 yıl sonraya ertelendiğini merak eden herkes okuma lı. Bu gecikmenin bilimsel bir nedeni var. Elinizdeki kitapta işte bu gecikmenin nedenini izah ediyorum. Ayrıca yapay zek anın süperzekaya evrilmesinin kaçınılmaz olduğunu dü şünüp süperzeka ortaya çıktığında ne yapacağımızdan kay gılanıyorsanız da bu kitabı okumanızı salık veririm. Yapay zekanın günün birinde bizi zapt etmeyeceğini belki kanıt layamam ama bu senaryonun gerçekleşme olasılığının cid den düşük olduğu konusunda size gerekçeler sunabilirim. Yapay zekaya meraklı olduğunuz halde toplumda revaçta olan abartılı birtakım görüşler kafanızı karıştırıyorsa da bu kitabı okumalısınız. Size yapay zeka mitinin köklerini, insan düzeyinde yapay zekaya gerçekten ulaşıp ulaşamaya cağımız konusunda bildiklerimizi ve de bilmediklerimizi an latacağım. Dahası, bildiğimiz tek gerçek zekaya, yani kendi zekamıza neden daha fazla saygı duymamız gerektiğini de göstermeye çalışacağım.
Kitabın Düzeni " Basitleştirilmiş Dünya " başlığını taşıyan Birinci Kısımda yapay zeka kültürümüzün teknolojiye dair fikirleri genişle tirken, insana dair fikirleri nasıl basitleştirdiğini ele alaca ğım. Bu kültür, yapay zeka araştırmalarının kurucusu Alan Turing'le birlikte ortaya çıktı ve anlaşılabilir sebeplerle olsa da benim 'zeka hataları' adını verdiğim talihsiz birtakım ba sitleştirmeleri barındırıyor. llk hatalar, Turing'in dostu ve istatistikçi 1. J. Good tarafından büyütüldü, büyütüldü ve en sonunda bir ideoloj iye dönüştü. Good, insan düzeyinde yapay zekanın bir kez ortaya çıkması halinde en sonunda 'ultrazeka'ya evrilmesinin kaçınılmaz olduğu fikrini ortaya atmıştı. Modern yapay zeka mitolojisinin bu bakımdan Tu ring ile Good arasında bir yerde şekillendiğini görüyoruz. Bu mitolojinin gelişimi bizi 'teknolojik kitsch' adını verdiı6
GiRiŞ
ğim bir çağa getirdi. Teknolojik kitsch, yani derin fikirlerin ucuz ve sığ taklitleri, verimli tartışmaların önünü kesip kül türümüzü zayıflatıyor. Ne düşüneceğimizi, ne hissedeceği mizi bize kitsch söylüyor. Kitsch 'i yayanlar bu işten kazançlı çıkarken, kitsch'in tüketicileri kaybediyor. Böylece onlarla birlikte biz de sığ bir dünyaya saplanıp kalıyoruz. "Çıkarım Sorunu " başlığını taşıyan İkinci Kısımda, in san düzeyinde yapay zekaya (veya buna yakın bir şeye) ulaşmamızı sağlayacak tek çıkarım -yani düşünme- biçimi nin, nasıl programlayacağımıza veya mühendisliğini nasıl yapacağımıza dair en ufak fikrimizin olmadığı bir çıkarım türü olduğunu savunuyorum. Çıkarım sorunu yapay zeka tartışmasının göbeğinde yer alıyor çünkü insanlarda veya makinelerde aradığımız zekayla doğrudan bağlantılı. Çı karım türleri hakkında ta Aristoteles ve diğer Antik Yunan düşünürlerinden beri bilgi sahibiyiz. Bu bilgi, mantık ve ma tematik alanlarında zamanla daha da geliştirildi. Çıkarımı halihazırda bilgisayar programları gibi formel, simgesel sis temlerle betimleyebiliyoruz, dolayısıyla çıkarımı inceleyerek zekanın mühendisliği hakkında daha açık bir fikir edinebi liriz. Üç çıkarım türü var. Klasik yapay zeka araştırmaları bunlardan birini (tümdengelim), modern yapay zeka araş tırmaları ise diğerini (tümevarım) inceledi. Üçüncüsü ise sa vavarım. Savavarım bizi genelleşmiş zeka alanına ulaştırıyor ve belki size şaşırtıcı gelebilir ama bu alanda kimse çalışmı yor. Hem de hiç kimse!1 Son olarak, bu çıkarım türlerinden ' Gerçi burada, yapay zeka alanında çalışanların savavarımla uğraşmadıklarını ima etmek istemem, uğraştılar. 1 98 0'lerde ve 1 990'larda araştırmacılar savavarımlı mantık yaklaşımları üzerinde çalıştılar, hatta buna savavarımlı mantık programlama (SMP) adını verdiler. Fakat savavarım bu sistemlerin yalnızca 'adında' vardı çünkü aslında hakiki savavarıma değil, [genişletilmiş] tümdengelime bel bağlamışlardı. Haliyle bu sistemler başarısız oldular ve İnternet çağında yapay zeka çalışmalarında ilerlemeler kaydedilince hızla terk edildiler. Aşağı yukarı 2010 yılından bugüneyse olasılığa dayalı -özellikle Bayesçi- çeşitli yaklaşımlara savavarımlı çıkarıma giden yol muamelesi
YAPAY ZEKA MiTi
her biri diğerlerinden tamamen farklı olduğundan (yani biri ni diğerine indirgeyemiyoruz) genel zekanın temelini oluştu ran çıkarım türünü kullanan yapay zeka sistemleri kurmada başarısız olursak, yapay genel zekaya (YGZ) doğru ilerleme kaydetmede de başarısız olacağımızı biliyoruz. " Mitin Geleceği " başlığını taşıyan Üçüncü Kısımda ise bu mitolojiyi ciddiye almanın çok kötü sonuçlar doğur duğunu savunuyorum, çünkü onu ciddiye almakla bilime duyulan güveni sarsıyoruz. Yapay zeka miti özellikle insan zekası ve icatları kültürünü aşındırıyor ki bu kültüre tam da geleceğimizi anlamada ihtiyaç duyduğumuz büyük bu luşlar ve ilerlemeler için ihtiyacımız var. Veri bilimi (yapay zekanın 'büyük veri'ye uygulanması) en iyi ihtimalle insan yaratıcılığına destek olabilir. Doğru kullanıldığında modern 'veri tufanı'yla başa çıkmamızı sağlayabilir ama bireylerin zekasının yerine geçecek biçimde kullanıldığında sonuç bile üretmeden yatırımları öğütüp tükürmekten başka bir işe yaramıyor. Bu mitin diğer yakın tarihli bilimsel araştırma ların yanı sıra özellikle sinirbilim araştırmaları üzerindeki olumsuz etkisini de anlatacağım. Yapay zeka miti yüzün den ödediğimiz bedel çok yüksek. Bu mitin doğru olduğu na inanmak için sağlam bir bilimsel neden yok ama kendi geleceğimiz adına onu savuşturmak için birçok gerekçemiz var. Dolayısıyla yapay zeka tartışmalarını sil baştan düşün memiz gerekiyor.
yapılıyor ama bu sistemler de eksiksiz bir savavarım sunmuyor çünkü bunlar da aslında kılık değiştirmiş tümevarımlı veya olasılıkçı yaklaşımlar. Benim burada savavarımla kast ettiğim şey sırf adında savavarım geçen yaklaşımlar değil çünkü o sistemler yapay zeka alanında ilerleme kaydetmemize yardımcı olmuyor. Kitabın ilerleyen bölümlerinde hepsine değineceğim. 18
1.
KISIM
BASİTLEŞTİRİLMİŞ DÜNYA
1 ZEKA HATASI
apay zekan.ı n öyküsü, muazzam insan zekasına sahip
Y birinin fikirleriyle başlıyor: bilgisayarın öncüsü Alan
Turing. Turing, 1 950'de " Computing Machinery and Intelligen ce " [Hesaplama Makineleri ve Zeka] başlığını taşıyan kış kırtıcı bir makale yayımladı. Bu makale, zeki makinelerin inşa edilme olanağı hakkındaydı. 1 Bilgisayarların yeni or taya çıktığı ve henüz pek de etkileyici olmadığı bir döneme göre hayli cesur bir makaleydi bu. O zamanlar hantal mı hantal, ağır mı ağır donanımlar, şifre çözme gibi işlerde kul lanılan bilimsel hesaplamalara hız katmaya yarıyordu. Biraz ön hazırlığın ardından bu bilgisayarlara fizik denklemlerini ve başlangıç koşullarını giriyordunuz, onlar da bir nükleer patlamanın yarıçapını hesaplayıp size çıktı olarak verebili yordu. IBM bu makinelerin barındırdığı potansiyeli hemen kavradı, işletme tablolarının güncellenmesi gibi hesaplama ları süratle yaparak bu işi yapan muhasebecilerin yerini ala bileceklerini keşfetti. Fakat bilgisayarların 'düşünebileceği' fikri biraz hayalgücü gerektiriyordu. 1 Turing, A. M., " Computing Machinery and Intelligence'', Mind, 59. cilt, 236. sayı (Ekim 1 950), s. 433-460.
21
YAPAY ZEKA MiTi
Turing'in önerisi 'taklit oyunu' denen ve o dönem re vaçta olan bir oyuna dayanıyordu. Özgün oyun şöyleydi: Bir erkek ve bir kadın görülmeyecekleri bir yerde duruyor lardı. Onları göremeyen üçüncü bir kişi -soruşturmacı- ise onlara sırayla birtakım sorular soruyor ve aldığı yanıtları okuyup hangisinin erkek, hangisinin kadın olduğunu belir lemeye çalışıyordu. Bu oyunun püf noktası şuydu: Erkek, soruşturmacıyı kandırmaya çalışmalı, kadınsa soruşturma cıya yardımcı olmalıydı ki her iki taraftan gelen yanıtla rın doğruluğu kuşkulu görünebilsin. Turing, makalesinde, bu oyundaki erkek ile kadının yerine bilgisayar ile insanı koyuyordu. Şimdilerde 'Turing Testi' diye adlandırdığımız sınama yöntemi işte böyle ortaya çıktı: Bir hakem, bilgi sayara ve insana soruları yazılı olarak aktarıyor ve kimin bilgisayar olduğunu doğru belirleyemezse oyunu bilgisayar kazanıyordu. Turing böyle bir sonuca ulaştığımız takdirde, insan diye tanımlanabilsin veya tanımlanamasın o makine nin zeki olmadığını iddia etmenin iler tutar yanının olma dığını ileri sürüyordu. Böylece, makinenin gerçekten dü şünüp düşünemediği sorusunun yerine zeki olup olmadığı sorusu geçiyordu. Turing Testi gerçekten çok zor; bugüne dek hiçbir bilgi sayar bu sınavı geçemedi. Elbette Turing ta 1 95 0'de bu işin uzun vadede doğuracağı sonuçları bilemezdi ama 'bilinç' ve 'düşünce' hakkındaki bunaltıcı felsefi soruların yerine gözlenebilir çıktısı olan bir testi geçirince yapay zeka çalış malarının iyi tanımlanmış bir hedefe sahip, meşru bir bilim dalı olarak görülmesini teşvik etmişti. Yapay zeka çalışma ları 1 950'lerde şekillenmeye başladığı sıralarda bu alanın çok sayıda öncüsü ve destekçisi, Turing'in görüşüne katılı yordu: Bir insanla sürdürülebilir ve ikna edici bir sohbete girebilen her bilgisayar, düşünce ( artık o neyse ) gerektiren bir iş yapıyor demekti ki çoğumuz buna itiraz etmeyiz.
ZEKA HATASI
Turing•in Sezgi/ Hüner Ayrımı Turing yapay zeka hakkında yazmaya başlamadan çok önce bir matematikçi olarak ünlenmişti. 1 9 3 6 yılında 'bilgisayar' [computer] sözcüğünün tam anlamı üzerine kısa bir matema tik makalesi yayımlamıştı. O sıralarda bu sözcük, kesin bir sonuca ulaşmak (örneğin bir şeyi hesaplamak) için belirli ardı şık adımları izleyen kişileri ifade etmek için de kullanılıyordu.2 Turing, makalesinde, hesaplayan insanın işini makineye yap tırma fikrini irdeliyordu. Ardından zorlu matematik işlemleri ni ele alıyordu. Fakat makineleri ele alırken ne insan zekasına ne de insan zihnine atıfta bulunuyordu. Turing, makinelerin kendi başlarına iş görebileceğini, sorun çözerken bir 'dış' yar dıma veya zekaya ihtiyaçları olmadığını söylüyordu ki bu dış yardıma veya zekaya matematikçiler bazen 'sezgi' derler. Turing'in hesaplama makineleri hakkında 1 936 yılında yayımladığı bu makale, bilgisayar bilimleri dalının kurul masına yardımcı oldu. Ayrıca matematiğin mantığı alanın da yapılmış önemli bir katkıydı. Yine de Turing belli ki bu makalesinde sunduğu tanımın temel bir şeyleri ıskaladığını düşünüyordu. Çünkü zihnin veya insan yetilerinin sorun çözme etkinliğinde etkisine dair fikir onun iki yıl sonraki doktora tezinde tekrar karşımıza çıkıyor. Bu tezde Avustur ya doğumlu matematik mantıkçısı Kurt Gödel'in vardığı bir sonucun etrafından zekice dolanmaya çalışmış ama başa rısız olmuştu. (Bu konuya tekrar geleceğiz. ) Turing'in söz konusu tezinde sezgi üzerine ilginç bir bölüm var ki bura da sezgi, zihnin bir başka yetisiyle, 'hüner' [ingenuity] adını verdiği şeyle kıyaslanıyordu: Matematik akıl yürütmeyi, şematik olarak, sezgi ve hüner diye adlandırabileceğimiz iki yetinin birlikte kullanılması olarak görmek mümkündür. Sezgi etkinliği, yargılara kenTuring, A. M., " On Computable Numbers, with an Application to the Ents cheidungsproblem," Londra Matematik Cemiyeti'nin toplantı tutanakları, 2-42. cilt, 1 . sayı (Ocak 1 937), s. 230-265 . 23
YAPAY ZEKA M iTi
diliğinden varmayı içerir, bilinçli akıl yurutme zıncırının bir sonucu değildir. Bu yargılar sık sık doğru çıkabilir ama bu onların her zaman doğru çıkacakları anlamına da gel mez (elbette burada doğrunun neliği sorusunu bir kenara bırakıyoruz) . Genelde sezgi aracılığıyla varılan bir yargının başka yollardan nasıl doğrulanacağını bulabiliriz. Örneğin pozitif tam sayıların hepsinin asal çarpanlarına ayrılabile ceği yargısına [sezgiyle] varabiliriz; ayrıntılı bir matematik argüman da bizi aynı sonuca pekala götürebilir. Dahası, bu argüman da sezgiyle varılmış yargılar barındıracaktır ama bunlar çarpanlara ayırma hakkındaki ilk yargılara kıyasla eleştiriye daha kapalıdır. 'Sezgi'ye dair bu fikri burada daha açık anlatmaya girişmeyeceğim.
Turing bunun ardından hüneri açıklamaya geçiyordu: Matematikte hüner, sezgiyi takviye etmek üzere önerme lerin ve belki geometrik şekiller veya çizimlerin de uygun biçimde tertiplenmesini kapsar. Bunlar düzgün tertiplendik lerinde sonuca ulaşmak için atılması şart olan sezgisel adım ların geçerliliğinden ciddi olarak kuşkulanılamaz. 3
Turing'in dili uzmanlara hitap etse de aslında malumu ilam ediyordu: Matematikçiler üzerinde uğraşmak istedikle ri problemleri seçerken veya üzerinde çalışabilecekleri ilginç bir problem 'gördüklerinde', bunu daha küçük adımlara bö lünemez görünen -dolayısıyla bilgisayarda temsil edilmeye uygun olmayan- bir kabiliyeti kullanarak yapıyorlardı.
Gödal•in İçgörüsü Gödel de mekanik zeka üzerine düşünüyordu. Turing gibi o da hüner (mekanik) ile sezgi (zihin) arasındaki ayrıma kafayı takmıştı. Onun yaptığı ayrım da özü itibarıyla Tu3 A. M. Turing, "Systems of Logic Based on Ordinals" , doktora tezi, Princeton Üniversitesi, 1 93 8, s. 57.
ZEKA HATASI
ring'inkiyle aynı olmakla birlikte onunkinden farklı bir dil kullanıyordu: tanıta karşı doğruluk (ya da matematiğin di liyle ifade edersek, 'ispat kuramı'na karşı 'model kuramı' ) . Gödel, tanıt ile doğruluk kavramlarının son kertede aynı şey olup olmadığını merak ediyordu. Eğer bunlar aynı şeyse ma tematik, hatta bilim bile saf mekanik bir etkinlik olarak an laşılabilirdi. Haliyle, insan düşüncesi de mekanik olacaktı. Yapay zeka kavramı bu sorunun üzerinde geziniyordu (gerçi henüz bu terim ortada yoktu) . Zihinsel sezgi, hakikati ve anlamı kavrama becerisi, bir makineye, bir hesaplamaya indirgenebilir mi ? Gödel'in sor duğu soru buydu. Bu soruya bir yanıt ararken çok geçme den onu dünya çapında üne kavuşturacak bir engele takıldı. 1 9 3 1 yılında Gödel, matematiğin mantığı üzerine iki teorem yayımladı, bunlara bugün 'Gödel'in eksiklik teoremleri' adı veriliyor. Bu teoremler tüm formel matematik sistemlerinin içkin kısıtlamalar barındırdığını tanıtlıyordu. Bu, sarsıcı bir sonuçtu. Gödel'in teoremi matematiğin -yalın varsayımlar dan hareket eden her türlü matematiğin- ne tamamen me kanik ne de tamamen 'formelleştirilebilir' olduğunu apaçık biçimde ortaya koyuyordu. Daha açık bir ifadeyle, Gödel tüm formel sistemlerin o sistemler dahilinde en baştan doğ ru kabul edilen ama sistemin kendi kuralları kullanılarak tanıtlanamayacak birtakım önermeler barındıracağını tanıt lamıştı. Bu önermelerin doğruluğu insan zihnince sezilebilir di ama sistemin kendisi onları tanıtlayamazdı (ki tanıtlana mayacağı tanıtlanabilir) . Peki, Gödel b u sonuca nasıl varmıştı ? Bu akıl yürütmenin ayrıntıları epey karmaşık ve teknik olsa da Gödel'in temel fikri şuydu: Toplama işlemi yapılabilecek kadar karmaşık bir matematik sistemine bir anlam sistemi muamalesi yapa biliriz, yani onu İngilizce veya Almanca misali bir doğal dil gibi ele alabiliriz. Üstelik bu kural bundan daha karmaşık tüm sistemler için de geçerli olacaktır. Matematik sistemini bu şekilde ele alınca sisteme kendinden söz etme olanağı ve-
YAPAY ZEKA MiTi
ririz. Örneğin, sistem bize belli kısıtlamalara tabi olduğunu söyleyebilir. Gödel'in ulaştığı içgörü işte buydu. Matematik gibi formel sistemler, doğruluk ve yanlışlığın kesin bir dille ifade edilebilmesini sağlar. Doğruluğu genel de tanıtlama araçlarını kullanarak tesis ederiz; kuralları bir şeyleri tanıtlamada kullanır, böylece onların kesin olarak doğru olup olmadıklarını biliriz. Peki, tanıtlanamayacak doğru önermeler de olabilir mi ? Zihin, sistemin bilemediği şeyleri bilebilir mi ? Aritmetik gibi yalın bir sistemde doğru önermeleri 2 + 2 = 4 gibi eşitliklerle ifade ederiz. Aritmetikte sıradan eşitlikler doğru önermelerdir ve bu önermeler arit metiğin kuralları kullanılarak tanıtlanabilir. Burada doğru, tanıtlanabilir demektir. Gödel'den önceki matematikçiler, matematiğin tümünün bu özelliği taşıdığını düşünüyorlar dı. Dolayısıyla makineler kuralları doğru uygulayarak farklı matematik sistemlerindeki tüm doğruları türetebilir gibi gö rünüyordu. Bu çok güzel bir fikirdi ama doğru değildi. Gödel özgönderimin nadir görülen ama güçlü bir özelli ğine denk gelmişti. " Bu önerme bu sistemde tanıtlanamaz. " gibi özgönderimli önermelerin matematikteki benzerleri, matematik sistemlerinin kuralları ihlal edilmeden kurulabi lir. Fakat 'Gödel önermeleri' dediğimiz bu özgönderimli ifa deler bir yandan da çelişkiyi matematiğin tam kalbine zerk ederler: Bu tür bir önerme doğruysa tanıtlanamayacaktır ve yanlışsa -tanıtlanamayacağını söylediğinden- doğru olacak tır; yani doğru yanlış, yanlış doğru olacaktır ki bu da bir çelişkidir. Sezgi kavramına dönersek, biz insanlar Gödel önermele rinin aslında doğru olduğunu sezeriz ama Gödel'in vardığı sonuçtan dolayı sistemin kurallarının bunu tanıtlayama yacağını da biliriz: Sistem, kendi kurallarının kapsamadığı şeye karşı kördür.4 Doğruluk ile tanıtlanabilirlik birbirinden 4
Gödel, kural eklemenin bazı sistemlerde eski eksikliği giderse bile ek kurallara sahip yeni sistemin daima yeni kör noktalara sahip olacağını gösteriyordu.
ZEKA HATASI
böylece kopmaya başlar. Belki zihin ve makine de birbirin den böyle kopuyordur, kim bilir. Her halükarda, saf formel sistemlerin birtakım sınırları vardır. Kendi dillerinde bazı doğru önermeleri tanıtlayamazlar. Başka bir deyişle biz, bil gisayarın göremediği bir şeyi görebiliyoruz.5 Gödel'in teoremlerinin sonuçları, o dönemde revaçta olan bir fikre ağır bir darbe indirmişti. Bu fikre göre mate matiğin tümü, matematik doğruların tek tek türetilebilece ği kurallı işlemlere dönüştürülebilirdi. Formalizm dönemin ruhuna işlemişti, zihin, tin, ruh gibi meseleler hepten bir kenara itilmişti. Matematikteki formalizm, dönemin düşü nürlerinin dümeni bilimsel maddeciliğe, özellikle de mantık çı pozitivitizme doğru kırdıklarının bir işaretiydi. Mantıkçı pozitivitizm, Platonculuğun geleneksel metafiziğine, yani gözlenemeyen soyut biçimlere, ayrıca dinde Tanrı'nın varlı ğı gibi geleneksel fikirlere karşı çıkıyordu ve bu akıma kapı lanlar bunları insan dünyasından söküp atmaya kararlıydı lar. Dünya aslında kesinlik makineleri fikrine yöneliyordu. Formalistlerin davasını Alman matematikçi David Hilbert kadar şiddetle savunan başka biri olmayacaktı.
Hilbert�in Meydan Okuması Gödel'den önce, 20. yüzyılın başında, David Hilbert, mate matik dünyasına matematiğin sağlam temellere oturduğunu tanıtlama çağrısında bulunmuştu. Hilbert'in anlaşılabilir kaygıları vardı. Matematiğin saf formel kuralları tüm ma-
5
Bu tam da Turing'in formel sistemler ve eksiksizlikle ilgili daha sonraki çalışmalarının da odaklandığı konuydu. Eksiklik teoreminin özgün bulguları için bkz. Kurt Gödel, "Uber forma! unentscheidbare Satze der Principia Mathematica und verwandter Systeme !", Monatshefte fur Mathematik Physik, sayı 38 ( 1 93 1 ) : s. 173-1 9 8 . lngilizce çevirisi için, bkz. Kurt Gödel, Collected Works, cilt. 1 : 1 929-1 936, ed. Kurt Geodel, Kurt Gödel ve Solomon Feferman, Oxford: Oxford University Press, 1986.
YAPAY ZEKA M iTi
tematik doğruları tanıtlayamazsa çelişkilerin v e saçmalığın matematiğe sızmasını engellemenin bir yolu en azından kağıt üzerinde yok demekti. Başka bir deyişle, matematiğin bir yerlerinde pusuya yatmış en ufak bir çelişki bile her şeyi mahvedebilirdi; çünkü bir çelişkiyle her şey tanıtlanabilirdi. O zaman formalizm de çöpe giderdi. Hilbert aslında tüm formalistlerin en büyük düşünü dillendiriyordu: matematiğin yalnızca kurallardan oluşan bir kapalı sistem olduğunu tanıtlamak. Doğru yalnızca bir 'tanıt'tı. Bilgiyi ise bir tanıtın 'kurallarını' takip edip bu ku ralların hiçbirinin ihlal edilmediğini teyit ederek edinebilir dik. Burada aslında pek de gizlenmeye ihtiyaç duyulmayan daha büyük bir düş, düpedüz bir dünya görüşü vardı, o da evrenin bir çeşit düzenek olduğuydu. Yapay zeka da bu sıra da tanıtlanabilir bir fikir, bir felsefi tutum olarak şekilleni yordu. Formalizm zekayı kurallı bir süreç olarak ele alıyor du. Zeka, bir makineydi. Hilbert, matematikçi meslektaşlarına, 1 900 yılında Paris'te düzenlenen !kinci Uluslararası Matematikçiler Kon gresi'nde meydan okumuştu. Düşünce dünyası ona kulak kesilmişti. Meydan okuması üç ana kısımdan oluşuyordu: Matematiğin [i] eksiksiz, [ii] tutarlı ve [iii] kararlaştırılabilir olduğu tanıtlanmalıydı. Gödel, 1 9 3 1 yılında eksiklik teoremlerini yayımlayarak, Hilbert'in meydan okumasının birinci ve ikinci kısımlarına öldürücü darbeyi vurdu. Kararlaştırılabilirlik sorusuysa ya nıtsız kaldı. Bir sistemin kuralları kullanılarak üretilebilecek her önermenin doğru mu, yoksa yanlış mı olduğuna karar vermemize izin veren belirli bir yordam ( bir tanıt veya basa makları birbirini zorunlulukla ve apaçık şekilde takip eden işlemler dizisi) varsa o sistem kararlaştırılabilir bir sistemdir. Örneğin 2 + 2 = 4 önermesi doğru, 2 + 2 = 5 önermesi yanlış olmalıdır; bu sistemin simgelerini ve kurallarını kullanarak üretebileceğimiz diğer tüm geçerli önermeler için de bunu söyleyebilmemiz gerekir. O zamanlar aritmetiğin matema28
ZEKA HATASI
tiğin temeli olduğu düşünüldüğünden, matematiğin karar laştırılabilir olduğunu tanıtlamanın yolunun da kararlaştı rılabilirliğin aritmetik ve uzantıları için geçerli olduğunu ta nıtlamaktan geçtiği düşünülüyordu. Bu da matematikçilerin kurallar ve simgelerle bir 'oyun' oynadıkları (formalistler böyle görüyordu), hem de asla çelişki veya saçmalık üret meyecek, geçerli bir oyun oynadıkları anlamına geliyordu. Turing, Gödel'in vardığı sonuçlardan büyülenmişti; çünkü bu sonuçlar formalist sistemlerin gücünü değil, kı sıtlamalarını tanıtlıyordu. Bu doğrultuda Hilbert'in meydan okumasının kalan kısmı üzerinde çalışıp formel sistemler için genel bir kararlaştırma yordamının var olup olmadığı üzerinde kafa yormaya başladı. 1 9 3 6 yılında yayımladığı " Computable Numbers " [Hesaplanabilir Sayılar] başlıklı makalesinde böyle bir kararlaştırma yordamının var olama yacağını tanıtladı. Turing, Gödel'in özgönderime başvurma şeklinin kararlaştırma yordamlarına ya da aslında bilgisayar programlarına ilişkin sorular için de geçerli olduğunu fark etmişti. Özellikle de ondalık açılımı basamak basamak ya zılarak 'hesaplanamayacak' (gerçel) sayıların da var olması gerektiğini görmüştü. Böylece 1 9 . yüzyılda yaşamış mate matikçilerden Georg Cantor'un vardığı bir sonucu kendi ça lışmasına uyarlamıştı. Georg Cantor hem gerçel hem de tam sayıların sonsuz sayıda olmalarına rağmen gerçel sayıların (ondalık sayıların) tam sayılardan her zaman çok daha fazla sayıda olduğunu tanıtlamıştı. Belki Turing kendinden önce ki büyük matematikçilerin omuzlarında yükselmişti de di yebiliriz. Her halükarda, hesaplanabilir sayılar hakkındaki makalesi başka bir olumsuzluğu açığa çıkarmış, kısıtlayıcı bir sonuca varmıştı: Evrensel bir kararlaştırma yordamının tesis edilmesi olanaksızdı. Matematikte bile kurallar yetmi yordu. Hilbert yanılmıştı.6 6
Burada 'formel', 'matematiksel' ve 'bilişimsel' terimlerini birbirinin yerine kul lanıyorum. Terminoloji gevşektir diyemeyiz; gerçi teknik açıdan tüm matema tiksel sistemler veya bilişim sistemleri formel sistemler olarak bilinir. Bunun
YAPAY ZEKA MiTi
Yapay Zeki Açısından Sonuçlar Turing, sorun çözmek için içgörüye veya zekaya hiçbir şekil de başvurmayan, tamamen belirlenimci bir makine icat edi lerek matematiğin kararlaştırılabilir hale getirilemeyeceğini tanıtladı. Yapay zeka açısından önemli olan da budur. Bu gün onun soyut makine formülasyonuna 'Turing makinesi' diyoruz. Hatta ben şu anda bu satırları böyle bir makinede yazıyorum. Turing makinesi aslında bilgisayardır. Bilişimin kuramsal çerçevesinin tali bir fikir, başka bir amaca ulaşma ya yarayan bir araçtan doğmuş olması, düşünce tarihinin en büyük ironilerinden biridir. Turing matematiğin kararlaştı rılabilir olduğu iddiasını çürütmek isterken kesinlik arz eden ve mekanik bir şey icat etmişti: bilgisayar. Turing, 1 9 3 8 tarihli doktora tezinde, formel sistemlerin 'Gödel sorunu' ile başa çıkabilecek kurallarla (sonra kural kümeleriyle, sonra kural kümelerinin kümeleriyle) genişleti lebileceğini ummuştu ama bunun yerine, yeni ve daha güçlü her sistemin yeni ve daha karmaşık bir Gödel sorunu barın dıracağını keşfetti. Gödel'in eksiklik teoreminin etrafından dolanmanın bir yolu yoktu. Bununla birlikte Turing'in for mel sistemlere dair karmaşık tartışmalarının derinlerinde tu haf bir öneri yatıyordu ve bu öneri yapay zekanın olanağıyla ilgiliydi: Ya sezgi yetisi bir algoritmaya, yani bir sistemin kurallarına indirgenemiyorsa ? Turing, tezinde Gödel'in kurduğu kapandan kurtulma nın bir yolunu bulmak istemiş ama bunun olanaksız oldu ğunu keşfetmişti. Bu da onu vites değiştirmeye, hesaplama da insan sezgisine duyulan ihtiyacı kendi deyimiyle 'büyük ölçüde azaltmanın' yollarını aramaya itti. Tezinde, hünerin kafa karıştırmayacağını düşünüyorum ama her halükarda matematiksel terimi de, bilişimsel terimi de formel sistemlere atıfta bulunur ki bunların iyi tanım lanmış simge sözlüğü ve simgelerle işlem yapma kuralları vardır. Bu durum hem aritmetiği hem de bilgisayar dillerini kapsar, dahası tartışmanın amacına uygun biçimde tamamen geneldirler. 30
ZEKA HATASI
gücünün daha karmaşık kural sistemleri yaratmak olduğu nu savunuyordu. (Nitekim en sonunda hünerin de evrensel olabileceği ortaya çıktı: Diğer makineleri girdi yapıp, kuru labilecek tüm makineleri çalıştıracak makineler tasarlamak olanaklıydı. Bu içgörü teknik açıdan basit bir Turing maki nesine değil, evrensel bir Turing makinesine karşılık geliyor du ve işte bu evrensel Turing makinesi tasarımı en sonunda karşımıza dijital bilgisayar olarak çıkacaktı. ) Gelgelelim Turing, bilişimle ilgili bu formel çalışmasıyla -belki de is temeden- baklayı ağzından çıkarmış da oluyordu: Sezginin, bilgisayar gibi saf formel bir sistemin işlemlerinden ayrı ve bunun dışında kalmasına izin vererek, aslında matematik işlemleri yapabilen bilgisayar programları ile bir matema tikçi arasında indirgenemez farklar olabileceğini ima etmiş oluyordu. Turing'in 1 930'ların başındaki ilk çalışmalarındaki tu tumundan uzaklaşıp bundan on yıldan biraz daha uzun bir süre sonra yayımladığı " Hesaplama Makineleri ve Zeka " başlıklı makalesinde zeki bilgisayarın olanağı hakkında ge niş yelpazede bir dizi spekülasyona girişmesi, onun meslek hayatında ilginç bir dönüm noktası teşkil ediyor. Nitekim 1 950'lere gelindiğinde Turing'in Gödel'in teoremlerinin içermeleri hakkındaki yazılarında sezgi tartışmasının esa mesi okunmuyordu. Bunun yerine bilgisayarların ta kendi sini 'sezebilen makinelere' dönüştürebilmekle ilgilenmeye başlamıştı. Turing, Gödel'in teoremlerinin içermelerinin yapay zeka sorusuna uygulanamayacağı sonucuna varmış tı. Nitekim biz insanlar da son derece ileri bilgisayarlarsak, Gödel'in vardığı sonuçlar bizim için de geçerlidir, yani tıpkı daha yalın bilgisayarlar gibi bizim de anlayamayacağımız veya doğruluğuna karar veremeyeceğimiz birtakım önerme ler var demektir. Bu önermeler akıl almaz karışıklıkta ve il ginçlikte olabilirler. Hatta banal sorular olsalar bile aşılama yacak bir karmaşıklığa da sahip olabilirler. Gödel'in vardığı
31
YAPAY ZEKA MiTi
sonuçlar, zihnin son derece karmaşık kısıtlamalara sahip bir makine. olup olmadığı sorusunu yanıtsız bırakıyordu. Başka bir deyişle sezgi, Turing'in makinelere ve maki nelerin gücüne dair fikirlerinin ayrılmaz parçası haline gel mişti. Gödel'in vardığı sonuçlar -en azından Turing'e göre zihnin bir makine olup olmadığını söyleyemezdi. Nitekim eksiklik teoremi bir yandan bazı önermelerin doğruluğunun sezgiyle anlaşılabileceğini ama hünere başvuran bir bilgisa yar tarafından tanıtlanamayacağını söyler. Diğer yandansa daha kuvvetli bir bilgisayarın daha fazla aksiyom -veya daha fazla bağlantılı kural- kullanarak sonucu tanıtlayabileceğini söyler ki bu da sezginin söz konusu soru bağlamında hesap lamanın eriminin ötesinde kalmadığını gösteriyor. İşler işte bu noktada bir silahlanma yarışına dönüşüyor: Daha güçlü hüner, daha karmaşık sorunlarda sezginin yerine geçiyor. Kimse bu yarışı kimin kazanacağını bilmediğinden, sezgi (zihin) ile hüner (makine) arasındaki içkin farkların neler olduğunu -eksiklik teoreminin içermelerini kullanarak- or taya koyamıyor. Fakat bu doğru olsaydı yapay zekanın en azından olanaklı olduğunu söyleyebileceğimizi Turing de elbette biliyordu. 1 9 3 8 ile 1 950 yılları arasında Turing sezgi ve hüner hak kındaki düşüncelerinden vazgeçti. 1 93 8 'de sezgi, matema tikçilerin hangi sistemlerle çalışacaklarına, hangi soruları çözeceklerine karar vermelerine yardımcı olan gizemli bir 'seçim gücü' olarak anlaşılıyordu. Sezgi bilgisayarda olan bir şey değildi, bilgisayarın ne olacağına karar veren bir şey di. Bu dönemde Turing, sezginin hiçbir sistemin parçası ol madığını düşünüyordu ki bu da zihin ile makinenin kökten farklı şeyler olduklarının yanı sıra insan gibi düşünen bir yapay zeka tasarlamanın neredeyse olanaksız olduğunu da işaret ediyordu. Fakat 1 950'de Turing'in fikri değişmişti. Turing Testi ve silesiyle kuşkuculara meydan okuyor, bir anlamda sezebilen makinelerin mümkün olduğunu savunuyor ve buna karşı 32
ZEKA HATASI
çıkanlara temelde şu soruyu yöneltiyordu: Neden olmasın ? Bu tam bir U dönüşüydü. Görünüşe göre yapay zeka konu sunda yeni bir bakış şekillenmeye başlamıştı. Peki, bu değişikliğin nedeni neydi ? 1 9 3 8 ile 1 950 yılları arasında Turing'in başına katı matematik, mantık ve for mel sistemler dünyasının dışında kalan bir şey geldi. Aslında aynı şey Büyük Britanya ve dünyanın da başına geldi: ikinci D ünya Savaşı.
33
TURING BLETCHLEY.DE
uring satranca bayılırdı, keza savaş döneminden meslek 1. J. 'Jack' Good da öyle. İkisi karşılıklı satranç oynar, kazandıracak hamleleri kararlaştırma yor damlarını ve oyunun temel kurallarını çözmeye çalışırlardı (maçları genelde Good alırdı) . Satranç oynamak, oyunun ku rallarına uymayı (hüner) gerektirmenin yanı sıra, oyun tah tasında farklı konumlarda hangi kuralların seçileceğine dair bir içgörü (sezgi) de gerektiriyor gibi görünüyor. Nitekim sat rançta kazanmak için kuralları uygulamamız yetmez, hangi kuralları seçeceğimizi de en baştan bilmemiz gerekir. Turing, satrancı, makineler ve makinelere sezgi kazandır manın olanağı hakkında düşünmenin keyifli bir yolu olarak görüyordu. Atlantik Okyanusu'nun öte yakasındaki mes lektaşı ve dostu Claude Shannon da satranç üzerine düşünü yordu. Bell Laboratuvarları'nda çalışan Shannon, modern bilişim kuramının kurucusuydu. Hatta satranç oynayan ilk bilgisayarlardan birini o tasarlamıştı. Bu makine Shannon'ın 'türevçözer' adını verdiği ve belirli kalkülüs hesaplarını me kanik süreçlerle ifade etmeye yarayan bir ön-bilgisayar üze rinde daha önce yaptığı bir çalışmanın uzantısıydı. 1
Ttaşı, matematikçi
1 Turing, Good, ve Shannon'ın satranç bilgisayarıyla ilgili ilk çalışmaları, 'mini maks' diye bilinen bir teknikten yararlanıyordu. Oyuncun olası kazancını azami-
34
TURING BLETCHLEY'DE
Zeki Basitleştirilmeye Başlıyor Satrancın Turing ve meslektaşlarını büyülemesinin bir ne deni, bilgisayarların satranç oynamak üzere programla·· nabilmesi ve programcıların makinenin yapabileceği her hamleyi önceden bilmesine gerek olmamasıydı. Bilgisayar lar İSE, VE, VEYA gibi mantık eklemlerini kullanabildi ğinden, program ( komut kümesi) çalıştırabiliyor, bu ko mutları çalıştırırken karşılaştığı senaryolara bağlı olarak farklı çıktılar üretebiliyorlardı. Bir makinenin oynadığı oyunun gidişatını o an 'gördüğü' duruma göre değiştirebil me becerisi, Turing ve meslektaşlarında bilgisayarların in san düşüncesinin temel bir veçhesini taklit ettiği izlenimini uya ndırıyordu. 2 Turing, Good, . Shannon ve diğer satranç oyuncuları, ris kin çok daha yüksek olduğu bir başka matematik sorusu üzerinde de düşünüyorlardı. Devlete çalışıyorlardı: Alman ların İngiliz Kanalı ve Atlantik'i geçen ticari ve askeri gemi lere eşgüdümlü saldırılar düzenlemek için kullandıkları gizli şifreleri kırmaya yardım ediyorlardı. Turing kendini İkinci Dünya Savaşı'nda Nazi Almanyası'nı yenmek için girişilen çabaların tam ortasında bulmuştu ve savaşın gidişatını de ğiştiren de onun hesaplama ve hesaplayan makineler hak kındaki fikirleri olacaktı.
2
ye çıkarıp olası kaybını asgariye indirecek şekilde hamleleri puanlayan bu teknik, satranç bilgisayarlarının sonraki örneklerinde belirgin biçimde öne çıktı. Hatta bugünün çok güçlü satranç bilgisayarı sistemlerinde de kullanılıyor. Nesne yönelimli programlama paradigması ve diğer yazılım yapılandırma araçları, bilgisayar biliminde görece yakın tarihlerde ortaya çıktıysa da bu gün bildiğimiz C++ ve Java gibi yetkin programlama dillerinin neredeyse ta mamı bilgisayarların ilk zamanlarından beri kullanılagelen bu temel işlemler den yararlanmaya devam ediyor. Tüm bilgisayar kodlarında karşımıza çıkan temel denetim yapıları ilk tam elektronik makinelerle beraber ortaya çıktı. Bu sistemlerin bilişim alanının ilk dönemlerinden beri ele alınan satranç oyna mak gibi sorunlara uygulandığında hemen başarıya ulaşmasından, makinele rin programlarla nasıl yapılandırılacağına ve denetleneceğine dair içgörüler sorumludur.
35
YAPAY ZEK.i. MiTi
Bletchley Park Londra'ya ve Britanya'nın diğer büyük şehirlerine düşen bom baların uzağında, dikkat çekmeyen küçük bir kasabada yer alan Bletchley Park, İngiliz Kanalı'nda gemi yollarına musallat olan Alman denizaltılarının (U-bot veya Unterseeboot) yerle rini belirlemeye yardımcı olmak üzere kurulmuş bir araştırma tesisiydi. Alman denizaltıları o sıralar Müttefik Kuvvetlerin başının belasıydı. Bu denizaltılar binlerce gemiyi batırıyor, mu azzam boyutlarda ikmal malzemesini ve askeri donanımı hiç ediyorlardı. Britanya'nın savaşı sürdürebilmek için her yıl 30 milyon ton kalem mal ithal etmesi gerekiyordu. Hatta savaşın sıcağında öyle bir an geldi ki Alman denizaltıları bu ithalat ka lemlerinin ayda 200.000 tonunu birden yok etmeye başladılar. Bu boyutta bir kayıp felakete yol açabilirdi. Almanların bu savaş stratejisine ilk başta hiçbir yanıt verilemedi. Fakat bıçak kemiğe dayanınca Britanya devleti bu sorunu çözmek üzere yetenekli şifre çözücülerden, satranç oyuncularından ve ma tematikçilerden bir ekip oluşturup onlardan Alman denizaltı larının şifreli iletişiminin nasıl kırılabileceğini araştırmalarını istedi. (Şifre gizli bir mesajdır. Bir mesajının şifresini kırmak, onu tekrar, okunabilir metne dönüştürmektir.)3 Bu şifreleri üretense Enigma adı verilen, daktiloya benzer bir cihazdı. Bu cihaz 1 920'lerden beri ticari olarak kulla nılıyordu ama Almanlar savaşta kullanmak üzere Enigma şifrelerini ciddi biçimde kuvvetlendirmişlerdi. Bu modifiye Enigma cihazları Nazi seferberliği sırasında her türlü stra tejik iletişim için kullanılıyordu. Örneğin Luftwaffe (Alman Hava Kuvvetleri) hava savaşını yürütürken, Kriegsmarine (Alman donanması) ise deniz harekatlarında kullanıyordu. Genel olarak, modifiye edilmiş Enigma cihazının şifrelerinin kırılamayacağı kabul ediliyordu.
-' Britanya'nın " Genel Kod ve Şifre Okulu " [General Code and Cipher School] yönetiminde.
TURING BLETCHLEY'DE
Turing'in Bletchley'deki rolü ve savaşın ardından bir ulusal kahramana dönüşme hikayesi herhalde binlerce kez anlatıldı. (20 1 4 yılı yapımı Taklit Oyunu adlı yüksek bütçe li bir film, Turing'in Bletchley'deki çalışmalarının yanı sıra bu sürecin ardından bilgisayarların geliştirmesinde oynadığı rolü de dramatize ediyordu. ) Turing'in büyük buluşu aslın da saf matematiğin ölçütlerine göre pek de ilgi çekici değildi çünkü tümdengelimli mantığa ait beylik bir fikirden yarar lanıyordu. Turing ve ekipteki diğer meslektaşlarının şakayla karışık 'Turingismus' diye adlandırdıkları bu yöntem, Enig ma cihazının şifrelerinde çelişkili dizileri tespit edip eleyerek olası çözüm anahtarlarının sayısını azaltmaya yarıyordu. Bu yöntem aslında üçüncü halin olanaksızlığı ilkesine da yanıyordu: Nasıl ki aynı anda hem 'evde' hem de 'çarşıda' olamazsak, mantıkta da bir önerme aynı anda hem A hem de A-değil olamaz. Turingismus yöntemi, kazanan fikre dönüşecek ve Bletchley'de büyük bir başarı elde edecekti. Bu düşünce kuruluşunda dünyadan yalıtılmış 'genç dahiler' onlardan isteneni yapıp Enigma mesajlarının şifrelerinin kırılması görevine hız kazandırdılar. Tesisteki diğer bilim insanları da şifrelerin kırılması için farklı stratejiler gelişti riyorlardı.4 Hep birlikte fikirlerini 'Bombe' adını verdikleri bir makinede sınıyorlardı. Aslında Bombe, Polonya'daki ön celi Bomba'dan ödünç alınan müstehzi bir addı. Bomba'nın adı da muhtemelen hesaplama bitince cihazın çıkardığı ufak gürültüden esinlenmişti. Bombe'yi farklı programları işlet me becerisine sahip bir ön-bilgisayar gibi düşünebilirsiniz. 1 943 yılı civarında savaşta üstünlüğün Mihver Devlet lerden Müttefik Devletlere geçmesinde Bletchley'deki yo rulmak bilmez şifre kırıcıların gayretlerinin de çok büyük bir etkisi vardı. Bu ekibin başarısı ün kazandı, üyeleri savaş kahramanı sayıldı. Bundan sonra kariyerlerini düzdüler. 4
Örneğin Hugh Alexander, Bletchley'e katkıda bulunmuş bir ulusal satranç şampiyonuydu.
37
YAPAY ZEKA MiTi
Bletchley ise bilişimin sığınağı haline geldi: Bombeler ma kineydi, insanların kendi başlarına çözemedikleri sorunları çözen programları çalıştırıyorlardı.
Sazan Makineler mi? Yok Öyle Bir Şayi Turing'in zeki makinelerin olanağı hakkındaki fikirlerinin berraklaşmasında Bletchley büyük bir rol oynadı. Nitekim meslektaşları Jack Good ve Claude Shannon gibi Turing de savaş süresince şifre çözücü sıfatıyla oynadıkları 'akıl oyun larının' gücünü ve faydasını görmüştü: Ordunun bile kıra madığı şifreleri kıra biliyorlardı. Yeni bilişim yöntemleri sırf makinelerin kendi başlarına satranç oynamasına yaramıyor du, savaş gemisi bile batırabiliyordu. Turing (yine) bir soyutlama üzerinde düşünüyordu: zi hinler ve makineler veya genel zeka fikri. Fakat onun bu soyutlamanın anlamı konusundaki düşüncelerinde sıradışı bir şeyler vardı. 1 940'lı yıllarda zeka, Bletchley'nin saf me kanik şifre kırıcı Bombe makineleri gibi formel sistemlere pek yüklenen bir özellik değildi. Nitekim Gödel, doğrulu ğun birbirini takip eden bir kurallar kümesine sahip formel bir oyundaki gibi formel bir yapıya genellikle indirgeneme yeceğini tanıtlamıştı. Fakat bu noktada şunu hatırlamakta fayda var: Gödel'in teoremi 1 93 1 'de içinde her şeyin ta nıtlanabileceği yetkin bir sistemin var olamayacağını kesin olarak göstermiş olsa da, zihnin izleyeceği kuralları tercih ederken başvurduğu sezgiye bazı makinelerin de sahip olup olamayacağı sorusuna net bir yanıt vermiyordu. Turing, Bletchley'deki deneyimlerinin ardından, sezgi ile hüneri birlikte kullanan güçlü makinelerin üretilip üretile meyeceği sorusu üzerinde gittikçe daha fazla kafa yormaya başladı. Alman askeri iletişiminin şifresini kırmak için de netlenmesi gereken şifre anahtarlarının olası kombinasyon larının devasa miktarı insan sezgisine fazla geliyordu. Oysa
TURING BLETCHLEY'DE
doğru programlanmış mekanik sistemler, bu görevi böyle devasa matematik olasılıklarını indirgeyerek gerçekleştire biliyordu. Turing açısından bu durum sezginin makineler de beden bulabileceğinin bir işaretiydi . Başka bir deyişle, Bletchley'de elde edilen başarı bir yapay zekanın belki de üretilebileceği anlamına geliyordu. Fakat onun düşünce çizgisini anlayabilmek için önce 'zeka'dan ne anladığını açık kılmamız gerekiyor: İnsan zekası makinenin kabiliyeti çerçevesinde temsil edilebilecek şekilde indirgenebilir -yani çözümlenebilir- bir şey olmalıy dı. Bu da zekanın aslında sorun çözme becerisine indirgen mesi demekti. Zaten satranç ve şifre kırma işi de tam olarak böyle bir şeydi. İşte Turing'in en büyük dehası ve hatası, insan zekasının sorun çözmeye indirgenebileceğini düşünmesiydi. 1 950 yı lında yayımladığı " Hesaplama Makineleri ve Zeka " başlıklı makalesinde zeki makineler hakkında ortaya koyduğu fikir leri savaş yılları sırasında şekillenmiş olsun veya olmasın, Bletchley'de yaşadıklarının onun yapay zekaya dair sonraki görüşlerini belirlediğini kesin olarak biliyoruz. Keza yapay zeka çalışmalarının da daha sonraları hiçbir eleştiri süzge cinden geçirme zahmetine katlanmadan onun düşünceleri nin izinden gittiğini de bugün biliyoruz. Oysa Bletchley' deki şifre kırma girişimlerinin başarısını mercek altına aldığımızda, insana ve makineye dair felse fi düşüncede nasıl tehlikeli indirgemelere başvurulduğu da hemen görünür hale geliyor. Bletchley'nin ta kendisi zeki bir sistemdi: Askeri seferberlik ( buna gözetleme, casusluk ve düşman gemilerinin yakalanması da dahildi) , ordu men supları ile Bletchley'deki çeşitli bilim insanları ve mühendis ler arasındaki toplumsal zeka ve hayatta hep olduğu üze re bazen kör talih bile bu süreçte deyim yerindeyse el ele vermiş, eşgüdümlü çalışmıştı. Aslına bakılırsa Almanların modifiye Enigma cihazının şifrelerini saf mekanik yöntem lerle kırmak pratikte mümkün değildi. Almanlar mekanik 39
YAPAY ZEKA M İTİ
şifre kırıcılığının hangi güçlüklerle malul olduğunu bu ko nudaki . matematik savlardan hareketle zaten biliyorlardı. Bletchley'nin başarısı kısmen Nazi komutanlarının Enigma cihazının şifrelerinin kırılamayacağına aşırı güvenmelerinin bir sonucuydu ki bu büyük bir ironidir. Bu komutanlar bazı şifrelerin kırıldığını fark ettiklerinde bilimsel bir yenilgi al dıklarını kabul etmek yerine suçu gizli casusluk operasyon larına attılar, makinelerini en hayati anlarda güçlendirme zahmetine bile katlanmadılar. Savaşın belirsizliği yeni tek nolojilerin yanı sıra yeni beşeri ve toplumsal zeka biçimleri ni de kaynaştırmıştı. Savaş bir satranç oyunu değildi. Örneğin savaşın ilk günlerinde Polonyalı güçler düşma nın Enigma iletişimine dair önemli parçaları ele geçirmişler di; bu iletişim parçaları da sırası gelince Bletchley' deki şifre kırıcılara paha biçilmez bazı ipuçları sunmuştu. Polonyalı lar bu iletişim parçalarını -Rus kaynaklardan gelen diğer parçalarla birlikte- 1 9 3 8 gibi erken bir tarihte kendi basit Bomba cihazlarını geliştirmek için kullanmışlardı. Turing'in 1 940'ın ilk aylarında Turingismus yöntemini kullanan çok daha gelişmiş Bombe cihazı da Polonyalıların cephedeki mü cadelelerinin meyvesi olan bu ilk çalışmalarına dayanıyor du. Keza Turing de Almanların Enigma cihazında yaptıkları iyileştirmelere bir yanıt olarak kendi şifre çözücü cihazının meslektaşı Gordon Welchman tarafından şifre çözme işini kolaylaştırmak üzere bir 'sağlama devresi' eklenmek sure tiyle daha da iyileştirildiğine tanık olacaktı.5 Başka bir de yişle, burada aslında iki insan, yani iki zihin, sezgiye başvur dukları toplumsal bir işbirliği yapmışlardı. Cephede yaşanan başka olaylar da hayati önem taşıyor du. 8 Haziran 1 940 tarihinde Norveç kıyıları açıklarında Britanya'ya ait bir uçak gemisi batırılmıştı. Bu saldırının be deli çok ağırdı, denizin karanlık suları birçok denizciye mezar Almanlar, iletişimin şifresinin çözülmesinde kullanılmak üzere daha karmaşık (ve şifrelenmiş) ilk talimatların yanı sıra şifrelenmiş upuzun serbest metinler üreten rotorlar da eklediler.
TURING BLETCHLEY'DE
olmuştu ama Alman denizaltılarının yerlerinin belirlenmesini de sağlamıştı. Bu olaydan haftalar önce, 1 940 yılının nisan ayının sonlarındaysa, Alman filosunun denizlerde özellikle dehşet saçan bir üyesi, Alman devriye gemisi VP2623, Müt tefikler tarafından ele geçirilmiş ve geminin, Enigma iletişimi ne dair adeta bir hazine sandığı barındırdığı ortaya çıkmıştı. Enigma bulmacasının eksik parçaları önce Müttefiklerin eline geçiyor, buradan da Bletchley'deki ekibe ulaştırılıyordu. Bu bölük pörçük veriler, gelecekte Alman iletişiminin şif resinin kırılmasına tek başına kesinlikle yetmezdi. Turing'in biyografi yazarlarından birinin ifadesiyle, bunlar toplasanız Bletchley'deki şifre kırıcılar için en fazla 'tahmin malzemesi' teşkil ediyorlardı. Fakat Bombelerin nasıl programlanacağı nı bulmada çok önemli olan ilk adımın atılmasını da sağla dılar. Turing ve meslektaşları bu adıma 'kanıt ağırlığı' adını vermişlerdi. Bu terimi ABD'li bilim insanı ve mantıkçı C. S. Peirce'den ödün almışlardı (kitabın İkinci Kısmında kendisi ni bol bol anacağız).6 Kanıt ağırlığı farklı matematikçilerce farklı anlaşılıyor ama Bletchley'dekiler açısından (ve yapay zekayla ilgili daha büyük meselelerde) hünerin veya makinenin veriye dayalı tahminler veya sezgi aracılığıyla yönlendirilmesi anlamına geliyordu. Örneğin ele geçirilen bir Alman denizaltısında bulunan şifresi çözülmüş bir metin parçası, tıpkı beyaz top larla dolu bir torbanın yanı başında, yerde duran başka bir beyaz top gibi, her anlama gelebilir. Her iki örnekte de ne olup bittiğini anlamak için zekamızı kullanarak tahminde bulunabiliriz. Yerdeki beyaz topun torbadan düştüğünü gözlerimizle görmemiş olsak dahi muhtemelen torbadan düştüğünü düşünürüz. Her halükarda bu bir tahmindir. Böyle tahminlerin doğruluğu kanıtlanamasa bile, insan sez gisi mekanik yordamlara başlangıç koşulları sağlamakta ne 6
Bletchley Park ve Turing'in İkinci Dünya Savaşı'ndaki rolüne dair derin tartışmalar için, bkz. Hodges, Andrew, Alan Turing: The Enigma, New York: Vintage, 1 992.
denli başarılı olursa bu yordamların bizi yanlış sonuçlara ulaştırma veya yanlış yönlere sevk etme olasılığı o denli dü şük ve arzulanan çıktıları sağlama olasılığı da o denli yüksek olacaktır. işte Bombe cihazlarının düzgün çalışmasını sağla yan şey de kanıtın ağırlığıydı, yani onlara başlangıç koşulla rı olarak sağlanan tahminlerdi. Bletchley' deki bilim insanları Bombelere başlangıç ko şullarını girdikten sonra sayıları milyonlara varabilen hatalı şifreli mesajları veya şifre anahtarını elemek gibi önemli ve sonu gelmez bir işi bu cihazlara bırakıp bir kenara çekilmi yorlardı. Bombeler hiç kuşkusuz gerekliydi . Turing de hiç şüphesiz bunu ayan beyan gördüğü için 'mekanik yordamla rın' insan zekasını yeniden üretebilme veya aşabilme olanağı onun hayalgücünü rehin almıştı. Oysa işin doğrusu, Bletchley grubunun görevi öncelikle tahminlerde bulunmaktı. Cephe den gelip cepheye giden talimat, şifre ve mesaj parçalarından oluşan bir yamalı bohçada saklı ipuçlarını yakalayıp çeşit li hipotezler oluşturuyorlardı. Tahminde bulunmak, bilim de, hipotez oluşturmak olarak da bilinir (bu terimi Charles Sanders Peirce de kullanırdı) . Hipotezler ise insan bilgisinde ilerlemenin olmazsa olmazıdır. Dolayısıyla Bletchley'deki ça banın başarılı tahminlerde bulunma sistemi kurma girişimle rine karşılık gelmesinde şaşılacak bir şey yoktur. Bu sistemin olmazsa olmazı ise mekanik bir şey değildi, zeki başlangıç gözlemleriydi. Nitekim Bombelerin düzgün işleyebilmele ri için önce bir hedefe yöneltilmeleri, ardından da hedefleri doğrultusunda çalıştırılmaları gerekiyordu. Kitabın İkinci Kısmında da göreceğimiz üzere, Peirce 1 9 . yüzyılın sonu gibi erken bir dönemde zekadan pay alan yargı ları ve karmaşık fikirleri şekillendiren her gözlemin bir tahmin veya kendi deyişiyle 'savavarım' ile başladığını fark etmişti: Bu güzelim bahar sabahı penceremden dışarı bakıyorum. Bir açelya olgunlaşıp çiçek açmış. Yok, hayır, gördüğüm şey elbette bu değil, ama gördüğüm şeyi betimleyebilmemin tek yolu bu. Bu bir önerme, bir tümce, bir olgu. Oysa algı42
TURING BLETCHLEY'DE
ladığım şey bir önerme, bir tümce veya bir olgu değil, ancak onu dile getirdiğim ifadeyle güçbela anlaşılabilir hale getire bildiğim bir imge. Bu tümce soyut bir şey, gördüğüm şeyse tastamam somut. Sırf gördüğümü bir tümcede betimlerken bile aslında bir sava varıyorum. İşin doğrusu, bilgimizin tüm kumaşı, keçe gibi ham hipotezlerin tümevarımla incel tilmesiyle üretilmektedir. Boş boş bakmanın ötesine geçen her adımda, bir savavarımda bulunmadan bilgide en ufak bir ilerleme bile kaydedilemez.7 Turing ve onun Bletchley'deki meslektaşları mücadeleyi aslında komuta kontrolü bir kenara bırakıp her adımda zeki ce savavarımlarda bulunmak suretiyle zekaya başvurdukları için kazanıyorlardı. Turing de elbette bir noktada bunu an lamıştı (sıra sayılarıyla ilgili 1 9 3 8 tarihli tezindeki sezgi tar tışmasını hatırlayın ) . Gelgelelim bu anlayışın onun zekanın doğası ve zeki makinelerin olanağı hakkında daha sonraları geliştirdiği fikirler üzerinde belirgin bir etkisi olmamış gibi gö rünüyor. Turing'in fikri, ne denli parlak olursa olsun, gerçek zekayı indirgeyen bir formülden ibaretti ve tek yaptığı, onu saplanıp kaldığı bir kavramdan, sezgiden kurtarmaktı. Başka bir deyişle Turing tahmin olgusunu başından savıyordu.
Toplumsal Zeki Üzerine (Önemli Bir Arasöz) Toplumsal zeka da dikkat çekici biçimde Turing'in zekayı bulmaca çözmek olarak gören bakışında kendine bir yer bulamaz. Halbuki bu konu yapay zekanın gelecekteki ge lişimini anlamada anahtar konumundadır. Turing örneğin düşüncenin veya zekanın toplumsal veya durumsal bir şey olarak görülmesine sıcak bakmıyordu.8 Oysa Bletchley'de-
7
Brent, Joseph, Charles Sanders Peirce: A Life, Bloomington, IN: Indiana University Press, 1 993, s. 72. ' Hodges, Andrew, Alan Turing: The Enigma, New York: Vintage, 1 992, s.477. 43
YAPAY ZEKA MiTi
kilerin elde ettikleri başarı, bu araştırma tesisini dünyanın geri kalanından ayıran duvarların çok ötesine uzanan, çok daha geniş bir sistemin bir parçasıydı. Muazzam bir çaba bu işe harcanıyordu. Nitekim çok geçmeden bu çabaya ABD hükümeti, Bell Laboratuvarları'ndaki Shannon gibi bilim insanlarının çalışmaları, hatta Einstein, Gödel ve John von Neumann gibi ünlü isimlerin de atandığı Princeton'ın meş hur Heri Çalışmalar Enstitüsü bile katkıda bulunacaktı. Doğ rusu, bu genişletilmiş insan-makine ortaklığı sistemi, gerçek dünyadaki sorunların (İkinci Dünya Savaşı kesinlikle bunla rın en karmaşık, en önemlilerinden sayılmalıdır) nasıl çözü lebileceğine dair çok daha gerçekçi bir model sunmaktadır. Yapay zeka araştırmalarının toplumsal veya durumsal zeka konusunda sergilediği duyarsızlık daha önceleri de fark edilmiştir. Nitekim makine öğrenimi uzmanı ve bilim insanı Francois Chollet, Turing'in -ve genel olarak yapay zeka çalışmalarının- zekaya bakışına, özetle şu sıkı eleştiri leri yöneltiyordu: Birincisi, zeka durumsaldır, yani mevcut durumdan hareket eder; genel zeka diye bir şey yoktur. Bey nimiz, aralarında bedenimizin, çevremizin, başka insanların ve bir bütün olarak içinde yaşadığımız kültürün de bulun duğu daha geniş bir sistemin bir parçasıdır. İkincisi, zeka bağlamsaldır. Boşlukta var olamaz, hep çevre tarafından şekillendirilir ve sınırlanır. Şu anda zekanın daha fazla geliş mesinin önündeki engel beyin değil, çevredir. Üçüncüsü, in san zekası büyük oranda dışsallaşan bir şeydir, yani zekamız beynimizde değil, uygarlığımızda saklıdır: Bireyleri kendi lerinden daha büyük bir bilişsel sistemin içindeki modüller gibi düşünün. Bu öyle bir sistem ki kendini iyileştirebiliyor ve aslında bunu uzun zamandır yapıyor.9 Turing'in diliyle konuşacak olursak, sezebilen makineler programlamak mümkündür ama ona karşı çıkan Chollet 9
44
Chollet, Francois, "The Implausibility of Intelligence Explosion," Medium, 27 Kasım 2017.
TURING BLETCHLEY'OE
gibi eleştirmenler bu makinelerin zekasının hiçbir zaman in san zekası seviyesine ulaşamayacağını ileri sürüyorlar. işin aslı şu ki sezginin programlanabileceği fikri, kendi aklımı za dair temel bir olguyu görmezden geliyor: insanların bir toplumsal zekası vardır. Bizim bir duygusal zekamız vardır. Zihnimizi en karmaşık sorunları ve bulmacaları çözmek dı şında başka işler için de -hatta özellikle karmaşık sorunlar la uğraşırken diyelim- kullanıyoruz. Elimizdeki kanıtlar Turing'in insanlara böyle bakmayı ıs rarla reddettiğini, insan düşüncesinin 'kırılması' gereken ( bul maca gibi çözülebilecek) 'şifreler' veya bir satranç oyunu gibi olduğuna inanmaya başladığını gösteriyor. Burada önemli olan nokta şu: Turing bir noktada, zekayı basitleştiren, indir geyici görüşle yoluna devam etmeye karar vermişti. Bu kararı tam olarak ne zaman verdiğini bilmiyoruz; Bletchley'deki ça lışmalarından sonra 1 940'lı yıllarda ve kesinlikle yapay zeka hakkındaki makalesini kaleme aldığı 1 950 yılından önce ol malı. Her halükarda bu korkunç bir hataydı ve yapay zeka bilimcileri arasında kuşaktan kuşağa aktarılacaktı.
Turing"in Zeki Hatası ve Dar Yapay Zeki Zekayı sorun çözme becerisine indirgeyen bakış, yapay zekanın, tarihi boyunca neden dar kapsamlı uygulamaların ötesine geçemediğini de açıklıyor. Örneğin ileri yapay zeka tekniklerinin geliştirilmesinde oyun oynama etkinliği hep bir esin kaynağı olmuştur. Fakat oyunlar yaşamı basitleştir dikleri için zekayı da indirgeyici bir bakışla ele almayı teşvik ederler. Nitekim bir satranç programı iyi satranç oynayabi lirse de araba sürmeyi beceremez. IBM'in Watson platfor mu Riziko oynayabilir ama satranç veya Go oynayamaz. Bu platformun veri madenciliği ve doğal dili işleme alanlarında kullanılabilmesi için çok kapsamlı bir 'yeniden programla ma' ve astarı yüzünden pahalıya gelecek bir 'uyarlama' ça45
YAPAY ZEKA M iTi
bası gerekir. Nitekim kısa bir süre önce bu platformun sağ lık sisteminde kullanılması için girişimlerde bulunuldu ama bu girişimler büyük ölçüde başarısız oldu. Dolayısıyla zekayı sadece sorun çözme becerisi olarak görmek dar kapsamlı uygulamalara yol açıyor. Turing de hiç şüphesiz bunu biliyordu. Nitekim 1 9 50'deki makalesin de, makinelerin öğrenmesi sağlanabilirse bilgisayar sistemle rini sorun çözme odaklı tasarlamaktan kaynaklanan kısıtla maların aşılabileceği fikrini ortaya atmıştı. Makinelere genel düşünme kabiliyeti bir şekilde öğretilebilirse dar kapsamlı uygulamalardan genel düşünen makinelere doğru yumuşak bir geçiş yapabilirdik. Başka bir deyişle, gerçek anlamda ya pay zekaya sahip olabilirdik. Gelgelgelim bugün bildiklerimiz, Turing'in yıllar önce önerdiği öğrenme yaklaşımına karşı kuvvetli itirazlar do ğuruyor. Şimdilerde makine öğrenimi sistemleri dediğimiz sistemlerin her birinin hedefine ulaşması için belirli bir şeyi öğrenmesi gerekiyor. Uzmanlar buna makineyi 'yanlı' [veya 'yatkın'] hale getirmek diyorlar. ( Burada bu sözcüğün top lum hayatında kazandığı olumsuz çağrışımlarla bir bağlan tısı yok; yani burada makinenin bazı kişiler gibi kalın kafalı veya tartışması zor olduğu veya bir gizli gündemle hareket ettiği anlamına gelmiyor. ) Makine öğreniminde yanlılık, sistemin belirli bir şeyi öğrenmek üzere tasarlanıp ayarlan dığı anlamına geliyor. Ama elbette bu sadece sorun çözme odaklı dar yapay zeka uygulamaları için geçerli bir sorun. ( işte bu yüzden, örneğin Facebook'un insan yüzü tanımada kullandığı derin öğrenme sistemleri vergilerimizi hesapla mayı bir türlü öğrenemiyor . ) Daha d a kötüsü, araştırmacılar bir makine öğrenimi sistemine belirli bir işi veya görevi öğrenmesi için yanlılık kazandırmanın o sistemin başka görevlerde daha verimsiz çalışmasına yol açacağını da fark ettiler: Bir makinenin bir konuyu öğrenmede başarılı olmasıyla başka bir konuyu öğrenmede başarısız olması arasında bir doğru orantı var.
TURING BLETCHLEY'DE
Turnuvalara katılacak seviyede Go oynamayı öğrenen bir bilgisayar, turnuvalara katılacak seviyede satranç oynamayı öğrenemez. Go bilgisayarı, bu oyunun kurallarını öğrenme ye yatkın olacak şekilde tasarlanmıştır. Haliyle bu makine nin öğrenme eğrisi de Go oyununun bilinen kazanma yor damlarını takip etmeye yatkın olacaktır ama Riziko veya satranç gibi başka bir oyunda bu eğri çok küçük olacaktır, hatta hiç olmayacaktır. Makine öğreniminde yanlılık veya yatkınlık genellikle hatalı öğrenmenin bir kaynağı, teknik bir sorun olarak an laşılıyor. Çünkü yanlılık, sistemin daha en baştan belli çö zümleri dışarıda bıraktığı, 'aramadığı' anlamına geliyor ki bu da onun hata yapmasına neden olabiliyor. Oysa yanlılık, makine öğreniminin ayrılmaz bir parçasıdır. " Bedava ekmek yok " diye de bilinen bir teorem, tam olarak öğrenme sistemlerini tasarlayıp inşa ederken tanık olduğumuz durumları tanıtlıyor. Bu teoreme göre, yansız öğrenme sistemlerinin keyfi seçilmiş sorunlara uygulanma sı ile öğretme işini tamamen rastlantının insafına bırakmak arasında verimlilik açısından neredeyse hiçbir fark yoktur. Bu da aslında bir makine öğrenimi sisteminin öğrenebilmesi için onu kasten yanlı hale getirmenin şart olduğunu söyle menin fiyakalı bir yoludur. Nitekim teorem de yansız sis temlerin tamamen işe yaramaz olduğunu tanıtlıyor. Sisteme, öğrenmesi istenen verilerin özelliklerini sunan gözetimsiz öğrenme yöntemleri kullanılarak 'ön alıştırmalar' yaptır mak gibi karmaşık teknikler mevcuttur ve bu tekniklerin hepsi, başarılı bir makine öğreniminin oluşturucu parça larıdır. Fakat bu tartışmada görmezden gelinen önemli bir husus vardır: Bir sistemi kasten yanlı tasarlayıp öğrenmesi istenen şeyi öğrenebilecek şekilde ayarlamak, sistemin ka çınılmaz olarak daralmasına, yani daha dar kapsamlı hale gelmesine yol açıyor. Bu da onun başka alanlara açılacak şekilde genelleşememesi anlamına geliyor. Başka bir deyişle, bugün bir makine öğrenimi sistemi başarılı oluyorsa bu, be47
YAPAY ZEKA MİTİ
lirli bir öğrenme sorununa odaklandığı içindir. Böyle bakıl dığındaysa darlık bu tür yaklaşımların ayrılmaz bir parçası olarak karşımıza çıkıyor. Bu alanda başarı ve darlık, aynı madalyonun iki yüzüdür. Sırf bu olgu bile bugünün yapay zekasından geleceğin insan seviyesindeki yapay zekasına doğru yumuşak bir ge çişin yapılma olanağını son derece kuşkulu hale getiriyor. Modern makine öğrenimi yöntemlerinin derin öğrenme gibi uzantılarının bir şekilde kendilerini 'eğiteceğini' veya zekasını insanın kullandığı gibi kullanmayı zamanla öğre neceğini varsayanlar, daha bugünden bildiğimiz bazı temel kısıtlamaları anlamıyorlar. Öğrenme sistemlerinin yanlı tasarlanmasının zorunlu olması, düpedüz Turing'in mate matikle ilgili içgörülerin formel sistemlere insan zihni tara fından dışarıdan temin edilmek zorunda olduğu şeklindeki gözlemiyle örtüşüyor; ne de olsa makinelerin neyi öğrenme ye yatkın olacaklarını, henüz öğrenmeye başlamadan önce, onları tasarlayan insanlar belirliyor.10
Turing • in Mirası Savımızı özetleyelim: Zekayı sorun çözme becerisi olarak gören bakış, doğası gereği dar kapsamlı yapay zeka üretmek zorunda kalıyor, bu yüzden yapay genel zeka tasarlamaya elverişli değil. Zekaya dair bu bakış bize Alan Turing'den miras kaldı. (Neden 'insan işlerinin simülasyonu' yerine 'ya pay zeka' diyoruz, bir düşünün . ) 1 1 Turing'in büyük dehası, özerk makinelerin tasarlanıp inşa edilebilmesinin önündeki 10
11
" Bedava ekmek yok " kuramının matematikte ele alınışı için, bkz. Wolpert, David ve Macready, William G., "No Free Lunch Theorems for Optimization," IEEE Transactions on Evolutionary Computation, 1 . cilt, l .sayı ( 1 997), s. 67-82. 'Yapay zeka' terimi aslında 1 955'te Stanford Üniversitesi'nden bilgisayar bilimci John McCarthy tarafından ortaya atıldı. McCarthy yapay zeka çalışmalarının öncülerindendi ve 1 9 56'da bu alanın resmen kurulduğu Dartmouth Konferansı'nın da bir üyesiydi.
TURING BLETCH LEY'DE
tüm kuramsal engelleri kaldırmasında saklıydı. Fakat böyle yaparak zekanın kapsamını ve tanımını da daraltmış olu yordu. Dolayısıyla yapay zeka araştırmalarının dar kapsam lı sorunları çözebilen uygulamalarla yola çıkıp bugün bile aynı şeyleri yapmasında şaşılacak bir şey yoktur. Turing, düşünceyi veya zekayı toplumsal veya durumsal bir olgu olarak görmekten de hoşlanmıyordu. Yine de onun insan zekasını bireyselleşmiş bir mekanik süreç olarak görme ısrarına -ve böylece bilgisayarın ilk çıktığı 1 940'larda bile medyada bilgisayara 'mekanik beyin' olarak sayısız atıfta bulunulmasına yol açmasına- rağmen, zekadan söz ederken onu daima bundan daha geniş bir bağlama oturttuğumuz ve oturtmaya mecbur olduğumuz açıktır. Nitekim hepimizin gündelik hayatta sergilediği zeka, bizim kafamızın içinde işle yen bir algoritma değildir, içinde yaşadığımız ve eylediğimiz bütün bir kültürel, tarihsel ve toplumsal bağlamı da devreye sokmaktadır. Gerçi geliştiriciler zeka hakkında böyle büyük ve karmaşık bir anlayıştan hareket etmiş olsalardı, yapay zeka alanında fazla ilerleme kaydedemezdik. Ama Turing'in indirgeyici tutumu da bizi dar yapay zeka uygulamalarıyla baş başa bıraktı. Dolayısıyla yapay zekayı sil baştan kavram laştırmadan genel zekaya ulaşmayı beklemek abesle iştigaldir. Turing 1 950 tarihli makalesinde, makinelere bir şeyler öğretilebileceğini ileri sürdüğünde, bu zorluklardan bazıla rını öngörmüştü. Gerçi son yıllarda makine öğrenimine bü yük bir ilgi var ve bu ilgi her geçen gün biraz daha artıyor ama bu konuda artık şunu biliyoruz ki öğrenmenin kendi de bir tür sorun çözme etkinliği ve ancak öğreniciye belir li bir yatkınlık kazandırılırsa geliştirilebiliyor; üstelik bir alanda geliştirildiğinde aynı anda diğer alanlarda zayıflıyor. Dolayısıyla mevcut öğrenme sistemleri aslında yalnızca dar kapsamlı sorun çözücüler olarak karşımıza çıkıyor. Buysa, dar zekalı sistemlerden insanların sergilediği türden genel zekaya geçişi sağlayacak kuramsal bir köprünün var olma dığı açıkça ortadayken, yapay zekanın bir tuzağa düştüğü 49
YAPAY ZEKA MiTi
anlamına geliyor. Zekayı anlamaya yönelik ilk çalışmalarda yapılan hatalar, yapay zekanın merkezinde adım adım bir kuramsal çıkmaza saplanılmasına neden oldu. Turing'in başlarda sezgi ile hüner arasında yaptığı ayrı mı gelin bu gözle bir daha düşünelim. Yapay zeka sorusu onun gözünde formel bir sistemi tasarlayanlar tarafından sisteme dışarıdan sağlanan sezginin bir şekilde o sistemin (hüner makinesinin) 'içine' çekilip çekilemeyeceği, yani sis temin içkin bir parçası haline getirilip getirilemeyeceğiyle ilgiliydi. Böylece sistem, çözeceği sorunları, sezgisini kul lanarak kendi seçebilecek ve darlık tuzağından kurtularak daha fazla akıllanıp daha fazla öğrenebilecekti. Bugüne dek hiç kimse bunu bir bilgisayara programlamayı başaramadı. Aslına bakılırsa bunun işe yarayıp yaramayacağı hakkında bile hiç kimsenin en ufak bir fikri yok. Yapay zeka sisteme lerini tasarlayanların sezgiyi dışarıdan kullandıklarını, yani sistemlerine hangi sorunları çözeceklerini -veya çözmeyi öğreneceklerini- bizzat söylediklerini biliyoruz. Kendi sezgi sini kullanan sistemlerin sorunları ise çıkarım sorunu adını verdiğim meselenin tam göbeğinde yer alıyor ve bu konuya ikinci Kısımda geri döneceğiz. Ayrıca yapay zekanın içine düştüğü 'darlık tuzağı' meselesini de açacağız. Fakat bunla ra geçmeden önce ele almamız gereken başka konular var. Örneğin şimdi süperzeka konusuna eğilmemiz gerekiyor. Çünkü bu da yapay zeka araştırmaları sırasında yapılan ha talardan biri ve aslında ilk hatanın doğal bir uzantısı olarak karşımıza çıkıyor.
50
3 SÜPERZEKA HATASI
�ring' in birlikte şifre kırdığı Jack Good da akıllı makineler 1 fikrinden büyülenmişti. Turing'in Bletchley'de ve sonra sında Good'un hayalgücünü tetiklediğinden kuşku yok, çünkü Good daha sonraları onun bilgisayarlarda insan seviyesinde zekaya ulaşmanın olanağı hakkındaki fikirlerine bilimkurgu ya kaçan şaşırtıcı bir son ekleyecekti. Good'un fikri aslında basitti: Bir makine insan seviyesinde zekaya sahip olabilirse zamanla insanın zekasını aşması da kaçınılmaz olmalıydı. Good, akıllı makinelerde bir çeşit geribildirim döngüsünün kurulabilmesi halinde bu makinelerin kendilerini inceleyip iyileştirme fırsatı yakalayacaklarını ve böylece kendilerinden daha akıllı makineler üretebileceklerini, bunun da akıllı maki nelerde bir 'zeka patlaması'na yol açacağını düşünüyordu. Bu patlamanın yaşanması kaçınılmazdı çünkü zeki makinelerin kendilerinin daha zeki kopyalarını üretmeleri nedeniyle maki nelerin zekası geometrik olarak artıp insan dehasını bile çarça buk gölgede bırakacaktı. Good buna ultrazeka adını vermişti: Ultrazekayı en zeki insanın bile düşünsel etkinliklerinin fer sah fersah ötesine geçebilen bir makine olarak tanımlıyorum. Böyle bir makinenin tasarlanması da bir düşünsel etkinlik ol duğundan, ultrazeki bir makine kendinden daha zeki maki neler tasarlayabilir. O halde bir 'zeka patlamasının' meydana
YAPAY ZEKA MiTi
gelmesi ve insan zekasını gölgede bırakması kaçınılmazdır. Dolayısıyla insanın icat etmesi gereken son şey aslında ilk ultrazekadır, o da bu makinenin kendisini nasıl dizginleye ceğimizi bize söyleyecek kadar uysal olduğunu varsa yarsak. 1
Oxfordlu felsefeci Nick Bostrom 20 1 4 yılında yayımlanan ve çok satılan kitapları arasına giren Süper Zeka: Ya pay Zeka Uygulamaları, Tehlikeler ve Stratejiler başlıklı çalışmasında Good'dan on yıllar sonra onun izleğine geri dönüp insan seviyesinde yapay zekanın bir kez icat edilmesi halinde kendini sürekli geliştirip insanınkinden daha üstün bir zekayı ortaya çıkarmasının kaçınılmaz olduğu fikrini yeniden gündeme getiriyordu. Bostrom kitabında Good'un süperzeki makinelerin gelişine dair gelecekbilimsel öngörü sünü daha ürkütücü bir dille tekrarlıyordu: Zeka patlaması ihtimali öncesinde biz insanlar bir saatli bombayla oynayan ufak çocuklar gibiyiz. İşte oynadığımız şeyin gücüyle davranışımızın toyluğu bu kadar uyumsuz. Süperzeka henüz hazır olmadığımız bir sorun, uzunca bir süre de buna hazır olmayacağız. Bombanın ne zaman pat layacağına dair pek fikrimiz yok; gerçi bu bombayı kulağı mıza tutarsak belli belirsiz, tık tık ses geldiğini duyabiliriz. Elinde patlamaya hazır bir bomba tutan bir çocuk açısından makul olan, nazikçe onu yere bırakıp hızla dışarı çıkmak ve en yakındaki yetişkine başvurmaktır. Oysa şu anki durumda çocuk bir değil, çok sayıda ve her birinin elinde diğerininkin den bağımsız bir tetik mekanizması var. Bu tehlikeli şeyi hep birlikte yere bırakacak biçimde hepimizin aklımızı başımıza toplama ihtimalimiz neredeyse sıfır. Aptalın biri sırf ne olaca ğını görmek için o ateşleme tuşuna illa ki basacaktır.2
' Irving John Good, "Speculations Concerning the First Ultraintelligent Machi ne" , Advances in Computers, 6. sayı ( 1 965), s. 3 1 -8 8 . 2 Nick Bostrom, Superintelligence: Paths, Dangers, Strategies, yeniden basım, Oxford: Oxford University Press, 20 1 7, s. 259. [Türkçesi: Süper Zeka: Yapay Zeka Uygulamaları, Tehlikeler ve Strateiiler, çev. Ferit Burak Aydar, İstanbul: Koç Üniversitesi Yayınları, 2019] 52
SÜ PERZE KA HATASI
Bostrom açısından süperzeka bir kurgu veya gerçekleşip gerçekleşmeyeceği belirsiz bir tahmin değil; tıpkı nükleer si lahlar gibi onun da er ya da geç geleceği kesin. Üstelik ge lirken bize haber de vermeyecek, emrivaki yapacak ve bu durum insanlık açısından son derece esaslı ve tehlikeli so nuçlar doğuracak. Bostrom'un vermeye çalıştığı mesaj açık: S üperzeka gelecek mi gelmeyecek mi diye boş tartışmalarla zaman kaybetmeyi bırakıp buna şimdiden hazırlanmalıyız. Peki, bu sav hakkında ne söyleyebiliriz ? Good-Bostrom savı -süperzeki bir makinenin olanağı- ilk bakışta gerçekten inandırıcı görünüyor. Fakat daha yakından incelediğimizde bu savın 'süper' zekanın temel zekadan türemesini sağla yacak mekanizmanın ne olabileceği konusunda bize hiçbir şey söylemediğini görüyoruz ve bu aslında hiç şaşırtıcı de ğil. Good ve Bostrom için belli ki süperzekanın icat edilme olanağının akla yatkın olması yeterli; başka bir açıklamaya gerek yok. Halbuki var. Bir şeyler söyleyebilmek için işin 'nasılını' anlamamız gerekiyor. Daha üstün bir bilgisayar donanımı kullanmak gibi basit bir iyileştirmenin bize bu meselenin 'nasılını' açıklayacağı nı düşünmek, üzerinde konuşmaya bile değmeyecek ölçüde abes ve aptalcadır. Yapay zeka araştırmaları alanında kesin tisiz ilerleme fikrinin iflah olmaz müritlerinden Ray Kurz weil bile zekayı bu kadar indirgemeye yanaşmaz. Kişisel bil gisayarımızın belleğini artırdığımızda bunun onu daha zeki hale getireceğini düşünmüyoruz. Tamam, bilgisayar biraz daha hızlanıyor, daha büyük uygulamaları çalıştırabiliyor falan filan ama eğer zeka olgusu, üzerinde durulmayı ge rektirecek kadar ilginç ve önemli bir şeyse herhalde uygula maları daha hızlı çalıştırmaktan daha karmaşık bir şey olsa gerektir. Oysa zekanın bu tanımı işin bu zor kısmına hiç değinmiyor. Bunun yerine biyolojiden bir terim ödünç alıp -ki yapay zeka çalışmalarında buna sıkça başvurulur- bilgisayarların kabiliyetlerinin geriye değil, ileri doğru evrildiğini savunduk 53
YAPAY ZEKA MiTİ
diyelim. Yine b u savın d a daha yakından incelendiğinde zekaya dair yetersiz ve safdil bir bakıştan mustarip olduğu nu görebiliriz. Burada esas sorun (göz göre göre noksan bı rakılan şey) canlılar dünyasında kendisinin daha zeki halini üretmiş herhangi bir canlıya rastlamamamızdır. Tamam, in sanlar zeki olmasına zekidir ama insanlık tarihi boyunca biz de daha zeki halimizi üretebilmiş değiliz. Daha akıllı bir beyin üretmenin ilk koşulu, önce bey nimizin genel biliş kabiliyetine nasıl sahip olduğunu, yani nasıl senaryolar kurabildiğini, nasıl akla düşünceler ge tirebildiğini ve bu düşünceler arasında nasıl bağlar ku rabildiğini, sorunlara çözümler üretmenin yanı sıra nasıl yeni sorunları nasıl keşfedebildiğini de anlamaktır: Bir şey aklımıza geliyor, bunun üzerine gözlemlerden ve önceden bildiklerimizden hareketle akıl yürütüyoruz ve yanıt zihni mizde beliriveriyor. Bu biyoloj ik sihrin vaveylası hala bir sis perdesinın ardında saklı ve 'nasıl işlediği' hala büyük oranda bilinmiyor. Yine de düşünme süreçlerimiz ve bey nin işleyişi üzerinde bin yıldır derin derin düşünüp bunları sorguluyoruz. Bizim bile kendi biliş kabiliyetimizin geneli hakkında sağlam bir içgörümüz yokken genel zekaya sahip bir ma kine nasıl bir anda böyle bir içgörüye sahip olacak? Haydi makine bu içgörüyü kazandı diyelim, o durumda daha zeki hale gelmek için içgörüsünü nasıl kullanacak ? Bu bir kendini iyileştirme meselesi değil. Örneğin biz kitap okuyup okula giderek daha akıllı hale gelebiliyor, düşünsel açıdan gelişecek şekilde kendimizi eğitebiliyoruz. Bu konularda hiçbir tartışma yok, herkes hemfikir. Fakat bunların tamamı asıl meseleyi ıskalıyor. Zekanın nasıl artı rılacağı konusunda yapay zeka camiasının varsayımlarının en büyük sorunlarından biri, hep bir kısır döngüye girilme si: Genel zekayı artırmak için (görünüşte genel ) zeka gere kiyor. Meseleye daha yakından baktığımızda, bırakın çiz gisel bir ilerlemeyi, tek bulduğumuz şey daha fazla gizem. 54
SÜPERZEKA HATASI
Yon Neumann ve Kendini Çoğaltan Makineler Good, kendini iyileştiren yapay zekanın ultrazekayı doğura cağı fikrini 1 960'ların ortalarında ortaya atmıştı ama ondan yaklaşık 20 yıl önce John von Neumann bu fikri ele alıp çoktan reddetmişti bile. Von Neumann, 1 94 8 'de Princeton Üniversitesi tleri Çalışmalar Enstitüsü'nde yaptığı bir ko nuşmada reddiyesini şu akıl yürütmeyle gerekçelendiriyor du: İnsanın çoğalma süreci genellikle daha önceki 'tasarım ların' iyileştirilmesine dayanıyorsa da tasarlayan bir maki nenin tasarladığı makinelerin tasarımını içermesi gerektiği için böyle bir makinenin daha yeni ve kendinden daha iyi makineler üretme görevi aşılmaz bir engele takılacaktı. Yani 'ebeveyn' makinenin, ürettiği 'yavrularından' daha karma şık olması şarttıi " Bir şey sentezleyen bir örgütlenmenin, sentezlediğinden daha karmaşık, daha üst düzeyde olması şarttır" diyordu.3 Başka bir deyişle, Von Neumann, bildiğimiz organik ya şam ile makineler arasında temel bir fark olduğunun altını çiziyordu. Jack Good'un ultrazekayla ilgili öngörüsü biraz bilimkurguya kaçıyordu. Von Neumann kendini çoğaltan bir makinenin en azın dan sekiz parçaya ihtiyaç duyacağı kuramını ortaya atmıştı. Bunların arasında bir 'uyarıcı organ', parçaları birbirine tut turacak bir 'kaynaştırma organı', bağlantıları kesmek için bir 'kesme organı' ve hareket için 'kas' da yer alıyordu. Bunun ardından gerekli modifikasyonları sağlamak üzere, biyolojik mutasyona benzer bir rastlantısallaştırıcı unsur da dahil ol mak üzere bilişte iyileşmeyi gerçekleştirecek akla uygun me kanizmaların bir taslağını çıkarmıştı. Fakat Von Neumann, böyle rastlantısal mutasyonların makinenin düşünme kabili yetini geliştirmekten ziyade istendik işlevlerinin ve kabiliyet lerinin 'geriye doğru evrilmesine' yol açacağını düşünüyordu .
.ı
John Yon Neumann, Theory of Self-Reproducing Automata, ed. Arthur W. Banks, Urbana : University of Illinois Press, 1 966, beşinci ders, s. 78. 55
YAPAY ZEKA MiTi
Dolayısıyla varılabilecek en olası sonuç işlev kaybıydı ki bu da öldürücü bir değişim anlamına geliyordu: "Yani bu sistem aşırı ilkel olsa bile, kalıtsal mutasyon özelliği taşıyor, hatta rastlantısal mutasyonun bir öldürücü etki yaratması müm kün; ama öldürücü olmayıp aktarılabilir de. " Makinelerin kendilerinden daha zeki makineler üretebil meleri için uyarıcı ve kaynaştırıcı organlarına bir yaratıcılık unsurunun da eklenmesi gerekiyordu. Buradaki fikir, biyolo jik evrimde olduğu gibi milyonlarca yıl beklemek yerine, biz zat ebeveyn sistemlerin, içlerinde, az çok daha iyi bir tasarıma yol açacak Prometheusçu bir kıvılcım taşımalarını sağlamaktı. Von Neumann bunun ancak bir kurgu olacağını düşünüyor du. Princeton'daki meslektaşlarına da söylediği üzere, bilimde veya mühendislik kuramlarında bunun yapılabileceğini göste ren hiçbir işaret yoktu. 'Zeka patlaması' balonunu, teknoloji düşmanı bir Luddcu değil, bizzat Von Neumann patlatmıştı. Bir zeka patlamasının süperzekayı doğuracağına dair ön görülerin bariz bir kusuru vardır: İnsanlar insan düzeyinde zekaya zaten sahiptir. Dolayısıyla Good'un mantığına göre bizim insandan daha zeki bir varlık tasarlayabilmemiz gere kir. Buysa yapay zeka çalışmalarının hedefinin başka bir dille tekrar edilmesinden başka bir şey değildir, dolayısıyla bizi bir kısır döngüye hapseder. Yapay zeka araştımacıları, tıpkı Von Neumann'ın da açıkladığı üzere, daha akıllı makinelerin nasıl tasarlanacağının bir sır olduğunu biliyorlar. Bu sırrı, kendi zekamızdan, tasarladığımız bir makineye aktarma fikri bir işe yaramıyor. Bu fikri biraz daha açmak için dahi bir yapay zeka araştırmacısı olan, hayall bir karakteri, Alice'i düşünelim.
Yapay Zeki Patlaması Fikrinin Ta Kendisi Alice'in bir yapay zeka bilimci olduğunu varsayalım. Bob da onun donuk zekalı komşusu olsun. Bob biraz alık olsa da sağduyu sahibi biri : Gazete okuyabiliyor, sohbet edebiliyor (gerçi sohbeti muhtemelen sıkıcı) . Bu haliyle Bob'un zekası
SÜPERZEKA HATASI
Google'ın şu ana kadar geliştirdiği en güçlü yapay zeka sis temi olan DeepMind'ın bile fersah fersah ötesinde. Alice yeni kurulan ve gelecek vaat eden bir teknoloj i şirketinde çalışıyor (şirketin Google tarafından satın alın ması yakındır ) . Dahası, komşusu Bob kadar zeki bir yapay zeka sistemi kurmak istiyor. Bu iş için iki sistemin taslağını oluşturmuş ve bunları oluştururken Daniel Kahneman'ın ünlü Birinci Sistem ile ikinci Sistem'inden esinlenmiş.4 Kahneman'ın sistemleri yapay genel zekaya ulaşmak için çö zülmesi gereken sorun tiplerine kabaca plan teşkil eden sezgi pompalarından veyahut eğretilemelerden oluşuyor. Alice'in bağlamında ise oyun (örneğin satranç veya Go ) oynamak gibi görevlerde yetkinleşmeye X sistemi, genel zekaya ise Y sistemi diyelim. Bob'un okuyup sohbet etmek gibi kabili yetlerini Y sistemi kapsıyor; bu sistem ayrıca yeni fikirler ve içgörüler üretmek gibi daha çetrefil işleri de kapsıyor. Bob berbat bir satranç oyuncusu ve işin doğrusu onun X sistemi bırakın AlphaGo'yu, birçok insanınkine kıyasla bile fena. Bob'un kısa süreli belleği de çoğu insanınkinden daha kötü. Bob IQ testlerinde düşük puanlar alıyor ve kare bul macaları çözmekte bile güçlük çekiyor. Y sistemine gelince, Bob'un genel zekası yenilikçi fikirler ve içgörüler üretmeye ne ilgi duyuyor ne de bu konuda başarılı. Yani Bob öyle bir akşam hoşbeş etmek için akşam yemeğine davet etmek iste yeceğiniz türden bir komşu değil. Alice'in stratejisi, ilk önce Bob'un zekasına denk bir Bobmakinesi tasarlamak. Bu girişimini, Bobmakinesini inşa etmeyi başarırsa bu makinenin kendisinin daha iyi bir sürümünü tasarlayabileceği, bunun da kaçınılmaz olarak bir zeka patlamasına yol açacağı fikriyle gerekçelendiri yor. Bu noktada bir Bobmakinesi tasarlamanın kolay bir iş olmadığını hatırlayalım çünkü Bob aynı zamanda bir Y 4
Daniel Kahneman, Thinking, Fast and Slow, New York: Farrar, Straus ve Giroux, 2 0 1 3 . [Türkçesi: Hızlı ve Yavaş Düşünme, çev. Filiz Deniztekin ve Osman ç. Deniztekin, İstanbul: Varlık Yayınları, 20 1 7]
57
YAPAY ZEKA M iTi
sistemine de sahip ki bu da onun genelleşmiş bir bilişsel yetiye sahip olduğu, dolayısıyla sağduyu sorunlarını ve bul macaları çözebildiği anlamına geliyor. Bir kere, Bob Turing Testi'ni geçebiliyor. Ayrıca çocuk öykülerini ve gazetele rin spor sayfalarını da okuyup özetleyebiliyor. Dolayısıyla Bob Google'ın en iyi doğal dili anlama sistemlerine, örne ğin Ray Kurzweil'in Talk to Books [Kitaplarla Konuşun] adlı anlamsal arama uygulamasına bile nal toplatıyor. Alice de işte bu yüzden Bobmakinesi konusunda bu kadar heye canlanıyor. Çünkü bu makine inşa edilebilirse yapay zeka araştırmalarında çok büyük bir ilerleme olacak, bir dönüm noktası teşkil edecek. Peki, Alice o noktaya nasıl varacak ? tık önce Bobmaki nesinin X sisteminin kabiliyetlerini azami seviyeye çıkarma yı deniyor. X sistemine bir bilgisayar belleği ekliyor ve onun Google üzerinden internete erişimesini sağlıyor. Fakat Bob makinesinin bu yeni sürümünün ilk işi vakit kaybetmeden Stuart Russell'ın savını kanıtlamak oluyor: Süperbilgisayar lar gerçek zeka olmadan yalnızca yanlış yanıtlara daha hızlı erişmeyi başarabiliyorlar.5 Bobmakinesi yanlış şeyleri hatır lıyor ve doğru soruları sormayı beceremiyor. X sisteminde yapılan tüm iyileştirmelere rağmen tek yapabildiği dünyaya dair daha fazla olgu sayıp dökmek ve internette bulduğu uçuk kaçık kuramları gevelemek oluyor. Y sisteminin gö zünden baktığımızda bunların tümü hatalı kullanılmış ve hiç anlaşılmamış oluyor. Bobmakinesinin kusursuz satranç oynadığından kuşku yok. Ama onun satrançta yeterliği Alice'in fazla ilgisini çekmiyor çünkü Alice bu makinenin kendisinin 'daha zeki' sürümünü tasarlamak konusunda zerre umut vaat etmediğinin farkına varıyor. Böylece Alice bir evreka anı yakalıyor: Bob'un da kenRussell, Stuart, Human Compatible: Artificial Intelligence and the Problem of Control, New York: Viking, 2 0 1 9 , s. 37. [Türkçesi: insanlık için Yapay Zeka: Yapay Zekii ve Kontrol Problemi, çev. Barış Satılmış, Ankara: Buzdağı Yayınları, 202 1 ]
SÜPERZE KA HATASI
disinin daha zeki bir sürümünü tasarlayamadığım kavrıyor. Bunu Bob bile yapamıyorken Bobmakinesi nasıl yapsın, diye düşünmeye başlıyor ve buradaki sorunun X sisteminin Y sis temine ihtiyaç duyduğu kaynakları sağlayamaması olduğunu düşünüyor. Tıpkı Bob gibi Bobmakinesi de zekasının nice liğini bilmeli, kısıtlamalarının farkına varabilmeli ve önem li gördüğü bazı noktalarda daha zekice davranacak şekilde kendini yeniden tasarlayabilmeli. Bobmakinesinin -tıpkı Bob gibi- pek zeki olmamasının nedeni de işte tam olarak bu! Bobmakinesi bunu yapamaz çünkü içgörü, keşif ve inovasyon için şart olan Y sistemi kabiliyetlerinden tamamen yoksun. Alice'in tekrar çizim masasının başına geçmesi gerekiyor. Böylece Alice, Bobmakinesinin kendi çabalarıyla süper zekaya ulaşamayacak denli aptal olduğuna karar veriyor. (Bu mantığın süperzekaya ulaşma çabalarının tümünü kuş kulu hale getirdiğini fark edip bir anlığına paniğe kapılsa da kendini hemen toparlayıp kaygısını bastırıyor. ) Yapay zeka çalışmalarının kurucusuna saygısından ve çalıştığı şir ket olan Ultra++'ın ellerindeki ürünü pazarlamaya can atan pazarlama biriminin de baskısıyla, Alan Turing kadar zeki bir makine tasarlamaya odaklanmaya karar veriyor. Bu ma kineye de Turingmakinesi adını veriyor. Turing'in Alice'ten daha akıllı olduğun varsayarsak (gerçi bunu bilemeyiz) , Alice'in doğrudan doğruya bir Tu ringmakinesi tasarlayamaması gerekir. Bobmakinesini nasıl tasarlayacağım çözmeye uğraşırken zaten bir duvara çarp mıştı. Bu yüzden işe en az Hugh Alexander kadar akıllı bir makine tasarlamakla başlamaya karar veriyor. Hugh Ale xander, Cambridge Üniversitesi'nin satranç şampiyonu ve Turing'in Bletchley Park'ta birlikte çalıştığı meslektaşıların dan biriydi. Çok ama çok akıllıydı. Turnuvalara katılacak seviyede satranç oynuyordu. Enigma cihazlarının şifresinin kırılmasına katkısı Turing'inki kadar olmasa da çok değer liydi. Bletchley'deki diğer şifre çözücülerin de takdirini ka zanmıştı ki bu hiç de yabana atılacak bir başarı değildir. 59
YAPAY ZEKA MiTi
Hughmakinesi bir Turingmakinesi imal edebilecek kadar akıllı olmalıydı çünkü Turing seviyesindeki bir makinenin kendini daha zeki hale getirecek kadar zeki olduğu kesindi. Alice, Hughmakinesinin satrançta yetkinliğini kolayca artırıyor (ki Hugh zaten satranç şampiyonu) . Bunu da akıllı telefonuna StockFish sitesinden satranç kodları indirerek hal lediyor. Benzer biçimde Hughmakinesine bir hesap makinesi ve süperbilgisayar belleği yoluyla kusursuz aritmetik beceriler katmanın yanı sıra Google'ın dizinlediği tüm bilgiye erişme olanağı veriyor. X sistemi optimal haline geldiğinde Hugh makinesi, onca zekasına rağmen Hugh Alexander'ın yapama dığı bir şeyi yapabiliyor: insanüstü düzeyde satranç oynayıp insanüstü düzeyde puan toplayabiliyor ve X sistemini gerek tiren diğer tüm işlerinde de yetkinlik sergiliyor. Fakat burada bir sorun var: Bunları az çok Bobmakinesi de yapabiliyordu. Hatta Alice Bobmakinesi ile Hughmakinesinin birbirine denk olduğunun kanıtlanabileceğini de fark ediyor. Daha doğrusu, Bobmakinesini bir kenara atmanın hiç gereği olmadığını, ken di kendini baltaladığını itiraf etmek zorunda kalıyor (elbette sakinleşmek için içtiği birkaç kadeh kırmızı şaraptan sonra) . Alice bir kadeh şarap içip bir sigara daha yaktıktan sonra, Ultra++'daki meslektaşlarının onun yaklaşan büyük buluşu nu kutlayan sıkıcı mesajlarının ardı arkası kesilmediği için telefonunu sessize alıyor. işin aslı Alice o sırada, daha zeki sürümünü tasarlayamayanın bir tek Bob olmadığını, kendi sinin de öyle olduğunu düşünerek kendiyle dalga geçiyor. Zihni bir anda açılınca şunu kavrıyor: X sisteminden Y sis temine, sezgiden inovasyona doğru ne kadar ilerlersek ma kinenin tasarımı da o kadar belirsizleşecek. Örneğin Turing kendi satranç zekası hakkında bir yargıda bulunabiliyordu: Hem Hugh Alexander'a hem de Jack Good'a yeniliyordu. Ama kendi Y sisteminin kabiliyetlerini değerlendiremiyor du. Yani kendi zekası onun için kelimenin tam anlamıyla bir karakutuydu, herhangi bir koşulda özgün düşünebilme ( bu hangi anlama geliyorsa) kabiliyetini değerlendiremiyor60
SÜ PERZEKı\ HATASI
du çünkü bunun bir şeması yoktu: Düşünce zamanda var olur, ömürde var olur, yeni olduğu kadar öngörülemez fikir ler de üretebilir. Turing'in Y sisteminin zekası öngörülemez olmakla kalmıyordu, açıklanamazdı da. Belki Turing'den daha zeki bir varlık (yine, artık o ne demekse) onu açıklaya bilirdi ama kesinlikle bizzat Turing bile kendisine Y sistemi zekasını açıkalayamıyordu. Aynısı alık Bob için de geçerliydi. O halde Alice nasıl olup da zeka patlaması yaratacaktı ? Aslına bakılırsa zeka patlaması fikrinin ta kendisi de ha talı bir öncül üzerine kuruludur. Alice gibi büyük hedefleri olan ve içgörü sahibi biri bu fikri ciddiyetle ele aldığında bu ortaya çıkıyor. Bobmakinesi de Bob kadar zekidir. Gi dip Bob'dan kendisinin biraz daha akıllı bir sürümünü ta sarlamasını isteyin. Bob'un bunu yapamayacağı göreceksi niz. Zihnin yapay zekayı heyecan verici kılan özelliği, zeka patlaması varsayımının önünü kapıyor. İnsan düzeyinde zekaya bir kez ulaşıldığında sistemin insandan daha akıllı sürümünü tasarlayabileceği konusunda umut var. Ama biz zaten 'insan seviyesinde' zekaya sahibiz. Biz insanız. Peki, biz bunu yapabiliyor muyuz ? Zeka patlaması fikrini pazar layanlar aslında neden bahsediyorlar ? Bu, insan zihninin, onu mekanikleştirme kabiliyetimizi kat kat aştığını, yani AlphaGo'dan Bobmakinesine, ondan da Turingmakinesine ve ötesine geçmeye gücümüzüm yetmeye ceğini söylemenin bir başka yoludur. Zeka patlaması fikrinin kendisi, yapay zeka alanında genelleşmiş zekaya doğru ilerle meyi sağlayabilecek iyi bir Y sistemi adayı değildir.
Evrimci Taknologlar Kaçınılmazlık savına, yani biz ne yaparsak yapalım süper zeki makinelerin yolda olduğu inancına sarılan yapay zeka tutkunlarının birçoğu bu sava evrimci izleklere dayandığı için sarılıyor; böylece bilim insanları kendilerini büyük bi61
YAPAY ZEKA M iTi
limsel sıçramalar yapma veya devrimci fikirler geliştirme so rumluluğundan da kurtarmış oluyorlar. Biz nasıl evrildiysek yapay zekanın da öyle evrileceğini savunuyorlar. Bu görüşü savunan gelecekbilimcilere ve yapay zeka müritlerine evrim ci teknologlar (ET) diyebiliriz. Wired dergisinin kurucularından Kevin Kelly gibi New Age teknologları arasında ET görüşü epey yaygın. Hatta Kelly 2 0 1 0 tarihli kitabı What Technology Wants'ta [Tek noloji Ne İster] yapay zekanın 'çatlak bilim adamı'nın sıra dışı çalışmalarının bir ürünü olmayacağını, doğadaki evrime benzer biçimde gezegenin evrim sürecinin sonucunda ortaya çıkacağını savunuyordu. 6 Bu görüşe göre -Kelly'nin sözleriy le- dünya her geçen gün biraz daha 'zekileşiyor', insanların açıktan tasarlamadıkları daha karışık ve daha zeki teknoloji biçimleri ortaya çıkıyor.7 Böyle düşünenler dünya çapında ağı, yani interneti, büyüyen dev bir beyin olarak görüyor lar. Bu görüşe göre insanlar gelecekte gerçek yapay zekaya varacak kozmik tarihe! zincirde sadece bir halkadan ibaret ve en sonunda ya geride kalacaklar ya da asimile olacaklar. Organik yaşamın evrimi son derece yavaş gerçekleşir, oysa evrimci teknologlara göre teknoloji sürekli bir ivmeyle ilerlemektedir. Kurzweil'in ünlü savına göre, bu konuda ta rihte saptanabilir bir yasa bile vardır: verimin ivmelenmesi yasası. Bu yasaya göre teknoloji gitgide ivmelenen bir eğriyle 6 7
Kevin Kelly, What Technology Wants, New York: Penguin, 2010. Tuhaf ya da insanın içini ferahlatan bir durum mu demeli bilmiyorum ama Kelly o günden sonra yapay zeka mitiyle arasına mesafe koydu ve bu mesafe gün geçtikçe açıldı. Nitekim 2 0 1 7 yılında Wired dergisinde yayımlanan bir makalesinde 'zekileşmenin' süperzekaya yol açmadığını savunuyordu. Zekanın çeşitli ve çok yönlü olduğunu işaret ediyor, sincaplar gibi görünüşte zeki ol mayan hayvanların daha sonra tüketmek üzere gömdükleri muhtemelen bin lerce fıstığın yerini hatırlamasının da insanların taklit edemeyeceği bir başarı olduğunu belirtiyordu. Makalesinin başlığı da manidardı: " The AI Cargo Cult: The Myth of Superhuman AI" [Yapay Zekanın Kargo Kültü: İnsanüstü Yapay Zeka Miti] . Sıradan zekanın bile işe yarar bir tanımını yapamamamız, gelecek bilimcilerin yapay zekada kaçınılmaz gördüğü son noktanın aslında bir kafa karışıklığı emaresi olabileceğini işaret ediyor ama bu da yine mitolojiye ve spe külasyona bolca yer bırakan bir başka basitleştirme.
SÜPERZEKA HATASI
daha da karmaşıklaşıyor. Dolayısıyla önce insan seviyesinde zeka, ardından da süperzeka, canlıların evrimine kıyasla çok kısa zaman aralıkları içinde bu gezegende ortaya çıkacak. Bu zaman aralığı on yıllar, hatta sadece yıllar da olabilir. Bu süreler içerisinde süperzekayla yüz yüze geleceğiz. Bu, insanlığa dair basit, derli toplu bir hikaye. Güya baş ka bir şeye, daha akıllı ve daha iyi bir varlığa dönüşüyoruz. Gerçi bu hikayeyi sınamanın olanaksız olduğunu herhalde fark etmişsinizdir. Öylece bekleyip ne olacağını görmekten başka bir seçenek sunmuyor bize. Yapay zekanın gelip bizi şereflendireceği tarihe ilişkin öngörümüz yanlış çıkarsa he men yeni bir tarih belirleyebilir, on veya yirmi yıl sonraya erteleriz, olur biter. İşte bu yüzden yapay zeka yanlışlana mazdır, dolayısıyla bilimsel yöntemin kabul gören ölçütleri ne göre bilimsel de değildir. Dikkat ederseniz gerçek yapay zeka inşa etmek olanak sızdır demiyorum. Stuart Russell ve diğer yapay zeka araştır macılarının da sık sık belirttikleri üzere, 20. yüzyılda Ernest Rutherford gibi bilim insanları atom bombası üretmenin olanaksız olduğunu düşünüyorlardı ama Leo Szilard, nükle er tepkime zincirinin nasıl çalıştığını çözdü. Hem de Ruther ford atom bombası üretme fikrinin öldüğünü ilan ettikten sadece 24 saat sonra ! 8 Elbette bu, yerinde bir hatırlatma; gerçekten de bilime karşı iddiaya girmemek gerekiyor. Fa kat şunu da unutmayalım: Nükleer tepkime zinciri sınana bilir bilimsel kuramlardan çıkarsandı. Teknoloj iden evrimle gelişecek zihin gücüne dair kuramlarsa sınanamıyor. Good ve Bostrom'un bilimsel açıdan kaçınılmazmış gibi sundukları iddiaları ise daha ziyade bir hayalgücü pompa sını andırıyor. " Bir düşünsenize nasıl olurdu ! " demekten farksız. Şüphesiz, hayret verici olurdu. Hatta belki tehlikeli de olurdu. Fakat falanca olsaydı ne olurdu türünden senar8
Stuart Russell, Human Compatible: Artificial lntelligence and the Problem of Control, New York: Viking, 20 1 9, s. 7-8
YAPAY ZEKA MiTi
yolan hayal etmekle ilerde neler olacağına dair ciddi bir tar tışmaya girmek arasında büyük fark vardır. Birincisi, genel bir süperzekanın dünyanın geneliyle bi zim gözlemlerimizden ve öngörülerimizden daha verimli gözlemlerde ve öngörülerde bulunacak şekilde bağ kurabil mesi gerekir. Üstelik zeka toplumsal ve durumsalsa ki öyle görünüyor, daha zeki bir makinenin mühendisliği muazzam boyutlarda bir bağlam bilgisi de gerektirecektir. Good'un sorunu, dar kapsamlı ve mekanik bir sorun değil, bütün bir kültürü ve toplumu da yörüngesine çekiyor. Peki, böyle bir makinenin nasıl inşa edilebileceğini birazcık olsun gösteren bir yapı planı var mı ortada ve varsa nerede ? Başka bir deyişle Good'un önerisi yine zekanın doğasına hiç uygun olmayan, basitleştirici bir anlayışa dayanıyor. tık zeka hatasını baştan varsaydığı yetmiyormuş gibi bir de el çabukluğuyla konuyu biraz daha indirgiyor: Bireysel meka nik zekanın kendinden daha zeki bir başka makine tasar layabileceğini varsaymaya kalkıyor. Yaratıcılığın arşimet noktası diyebileceğimiz yere böyle bir makineyi yerleştirmek en hafif tabirle makul değildir. Süperzeka fikri aslına bakı lırsa birçok hatanın çarpımından ibaret ve yapay zekanın yükselişiyle ilgili ham hayallerin bir uzantısını temsil ediyor. Meselenin daha derinine inebilmek için bu ham hayalleri biraz daha deşmeliyiz. Deştikçe karşımıza Tekillik çıkacak. Şimdi onu inceleyeceğiz.
q GEÇMİŞTE VE GÜNÜMÜZDE TEKİLLİK
1 950'lerde matematikçi Stanislaw Ulam, eskiden John
von Neumaniı'la yaptığı bir sohbeti anımsıyordu. Bu sohbette Von Neumann "teknolojinin sürekli ivmelenen ilerleyişi ( . . . ) insanlık tarihinde tekillik diyebileceğimiz bir noktaya yaklaştığımızın emarelerini taşıyor, öyle ki bu te killiğin ardından insan ilişkileri bildiğimiz haliyle devam edemeyecek " diyerek, insanlık için bir teknolojik dönüm noktasının söz konusu olabileceğine değiniyordu.1 Von Neuman muhtemelen o sıralar dijital bilgisayarlar tek noloji sahnesine çıkmaya hazırlandığı için böyle bir yorumda bulunmuştu. Dijital bilgisayarlar görünüşte uzun ve kesintisiz bir teknolojik yenilikler silsilesindeki son yeniliği temsil edi yordu. 2 1 940'lara varıldığında, geçtiğimiz 300 yıldaki bilimsel ve sınai devrimlerin muazzam, simbiyotik özellikler taşıyan kuvvetleri harekete geçirdiği belli olmuştu: Yeni bilimin mey veleri yeni teknolojinin tohumlarını atmış, bu yeni teknoloji 1 Murray Shanahan, The Technological Press, 2 0 1 5 : s. 233 Turing'in evrensel makinelerinin bilimi, laşmıştı. Telefon sistemlerinden ve diğer gibi iletişim teknolojilerinin gelişmesinin bilgisayarlar da ortaya çıktı.
Singularity, Cambridge, MA: MIT 1 930'ların sonlarına doğru sağlam teknolojilerden doğan röle şalterleri ardından, elektronik cihazlar olarak
YAPAY ZEKA MiTi
daha çok bilimsel keşfi mümkün kılmıştı. Örneğin bilim bize teleskobu vermişti, teleskop da astronomiyi ilerletmişti. Bilim ve teknoloj ide yaşanan değişimlere toplumsal de ğişimler eşlik ediyordu. Bu değişimler hızlıydı, bazen kar makarışık ve geri döndürülemez görünüyorlardı. Şehirlerin nüfusu patlamıştı ( bu da sefaletin ve adaletsizliğin şiddetini artırıyordu) , tamamen yeni toplumsal ve ekonomik örgüt lenme biçimleri neredeyse bir gecede ortaya çıkmıştı. Buhar lı motorlar ulaşımda devrim yaratmıştı; daha sonraları içten yanmalı motorlar da aynı etkiyi yaratacaktı. Trenler, troley büsler ve buharlı gemiler ticaretin alanını genişletmiş, şehre göçler tümden yeni bir işgücü yaratmıştı. Thomas Edison'ın elektrikli ampülü icat etmesiyle insanlar geceleyin de çalı şabilmeye başlamışlardı. Kırsal kesimlerde güneş battığın da, uykusu kaçanlar artık Kapital'i veya Türlerin Kökeni'ni okuyabiliyorlardı. Üretkenlik tavan yapmış, refah ve esenlik artmıştı. Keza çatışmalar ve şiddet de artmıştı. Hatta bir dizi jeopolitik olay 'Büyük Savaş' diye anılacak Birinci Dünya Savaşı'nın patlak vermesine yok açmış, bu olay sırasında ilk kez zehirli gazlar kitle imha silahı olarak kullanılmıştı. Bu sa vaştan sadece 30 yıl sonraya tekabül eden Von Neumann'ın dünyasında, yeryüzündeki canlı varlığına yönelik en büyük tehdit olan atom bombası icat edilmişti. Atom bombası tarihte bir kırılmaya neden oldu. Diz ginsiz teknolojik yenilik hırsının barındırdığı olası yıkımın boyutlarını gözler önüne serdi. Shannon ile Turing, bilgi sayarları satranç oynamak için kullanmıştı; Von Neumann gibi bilim insanları ise bilgisayarları Japonya'daki şehirleri buharlaştıracak silahları geliştirmek için kullanıyorlardı. O dönemin elektronik bilgisayarları büyük, hantal ve ağırdı ama sayısal hesaplamalar gibi görevlerde hesaplayıcı insan lardan katbekat hızlıydılar. Von Neumann ve diğerleri, bil gisayarların bu kabiliyetini, atom bombasında kullanılacak fisil malzemenin miktarına göre nükleer patlamanın çapını hesaplamak için kullandılar. 66
• • • GEÇMiŞTE VE GUN UMUZDE TEKiLLiK
Von Neumann, 'tekillik' hakkındaki sorusunu, olanaklar ile korkuların birbirine karıştığı bir sis bulutunun içinde so ruyordu. Hezarfenliği ve zekası dillere destan Von Neumann, neredeyse tüm bilim insanı meslektaşlarından saygı görüyor du, dolayısıyla fikrinin Ulam'ı etkilemesinde ve on yıllar geçse de Ulam'ın bu fikri hatırlamasında şaşılacak bir şey yok. Matematikçi Ulam, Von Neumann'ın eğretilemesini el bette anlamıştı. 'Tekillik' matematikte tanımsız hale gelen noktayı ifade etmek için kullanılan bir terim; bu öyle bir değer ki bir anda sonsuza ulaşıyor. Von Neumann, Ulam'a teknolojik ilerlemenin menzilinin 'sonsuza', yani hiçbir yön temin, düşüncenin, stratejinin veya eylemin artık işe yara mayacağı bir noktaya yaklaşıp yaklaşmayacağını soruyor du. Yani bu noktada onu öngörmek olanaksız hale gelecek, ilerleme bilinen bir değişken olmaktan çıkacaktı (öyle oldu ğu bir an olduysa tabii) . Von Neumann, Ulam'a bir eskatoloji öneriyordu, yani bir ahir zaman iddiasında bulunuyordu. Bundan yaklaşık 20 yıl sonraysa Good bu eskatolojinin işleyeceği mekaniz mayı bulduğunu düşünecekti: dijital bilgisayar. Bilişime, özellikle de yapay zeka alanına 'Tekillik' terimi ni kazandıran kişi, Marooned in Realtime [Gerçek Zamanda Mahsur] adlı bilimkurgu romanında bu terimi kullanan Los Angeles'taki Kalifornyia Üniversitesi'nde (UCLA) çalışan bilgisayar bilimci ve Hugo roman ödülünü kazanmış Vernor Vinge'di.3 Vinge daha sonra NASA için yazdığı teknik bir makalede Good'un görüşlerini şu sözlerle tekrarlayacaktı: Otuz yıl içinde insanüstü zeka yaratmak için gerekli tekno lojik olanaklara sahip olacağız. Bu olduktan kısa bir süre sonra da insanlık çağı sona erecek. Evet, kanımca böyle bir 3
Vinge 'tekillik' terimini teknik olarak bundan üç yıl önce, Ocak 1 98 3 'te Omni dergisinin " Ilk Söz" başlıklı fikir köşesindeki bir makalede tanıtmış olsa da bu terimin izini onun bilimkurgu kitabı Marooned In Realtime'a kadar sürmek yaygındır. Nitekim bu kavram, olgunlaşmış haliyle bu öykünün kurgusunda yer alıyordu.
YAPAY ZEKA MiTi
olaya tekillik demekte hiçbir mahsur yok. B u noktaya gelin diğinde tüm modellerimizi bir kenara atmamımız gerekecek çünkü hayata yeni bir gerçeklik hükmedecek. Bu noktaya adım adım yaklaştıkça, [tekilliğin] insan ilişkilerinin üzerin deki etkisi de adım adım artacak ve en sonunda hepimiz için sıradan bir fikre dönüşecek. Ama bu gerçekleştiğinde, çok daha büyük bir sürprizle, daha büyük bir bilinmeyenlerle karşılaşmamız da elbette mümkün.4
Bilgisayar bilimci Vinge'le aynı fikirde bir meslektaşı vardı. 1 9 80'lerin sonuna doğru bilgisayar bilimci, gelecek bilimci ve girişimci Raymond Kurzweil, Tekillik fikrini, po püler bilim alanında kaleme aldığı bir dizi kitap aracılığıyla yaymaya başlayınca yapay zekanın 'bekçisi' olarak adından söz ettirmeye başladı. Önce 1 990'da The Age of Intelli gent Machines [Zeki Makinelerin Çağı] kitabıyla başladı, 1 99 8 'de bunun devamı olan The Age of Spiritual Machines [Maneviyatlı Makinelerin Çağı] kitabını çıkardı. 2005 yılı nın en çok satılan kitapları arasında yer alan The Singularity is Near [Tekilliğin Eli Kulağında] ise daha cüretkardı. Kurzweil, teknoloj ik inovasyonları bir tarih grafiğinde çizersek üstel bir artış göreceğimizi savunuyordu. Tarihe bakarsak inovasyonun zamanın bir işlevi olarak sürekli ivme kazandığını görüyorduk. Başka bir deyişle, büyük teknolojik inovasyonlar arasında geçen zaman sürekli daralıyordu. Örneğin kağıt MS . 2. yüzyılda icat edilmiş, matbaanın icadına kadar 1200 yılın geçmesi gerekmişti: Gutenberg'in matbaası Avrupa'da 1 440'ta kullanılmaya başlanmıştı. Bilgisayarlar ise 1 940'larda ortaya çıkmış ( işin matematiğinin geliştirilmesini de sayarsak 1 93 0'lara kadar inebiliriz) ve İnternet -ki epey büyük bir inovas yondur- bundan sadece 3 0 yıl sonra ortaya çıkmıştı. Peki, yapay zeka ne zaman ortaya çıkacaktı ? Kurzweil'in man4
68
Vernor Vinge, "The Coming Technological Singularity: How to Survive in the Post-Human Era, " Vision-2 1 : Interdisciplinary Science and Engineering in the Era of Cyberspace, ed. G. A. Landis, NASA Yayını CP- 1 0 129, 1 993, s. 1 1 -22.
GEÇMiŞTE VE GÜNÜMÜZDE TEKiLLiK
tığ ına göre, bilgisayarda insan seviyesinde zekanın ortaya çık ışına 1 0, bilemediniz 20 yıl var, hatta o kadar bekleme miz gerekmeyebilir. Üstel büyüme eğrileri insanı hayrete dü şürüyor. Kurzweil bu olguyu 'Verimin İvmelenmesi Yasası' (VİY) adıyla markalaştırdı ve tamamen insan seviyesinde yapay zekanın 2029 yılında ortaya çıkacağı, bu makinelerin de kendilerinden daha iyi makineler tasarladıkları hızlanmış bir sürecin 2045 yılında süperzekayı doğuracağı sonucuna vardığı bir argümanın öncülü haline getirdi. 5 Süperzeka bu süreçte dönüşü olmayan noktayı işaret edi yordu. Bu noktadan sonra ilerlemenin akıbeti bilinmeyende, yani Tekillikte kayboluyordu. Bu nokta, yeryüzünün en zeki varlığı sıfatıyla gezegenin gerçek hakiminin artık insan değil makine olacağı bir eşikti. Kurzweil'in bu süreci tamamen 'bilimsel' gördüğü her kesçe biliniyor, hatta bir bilgisayar uzmanı ve mucit olarak (Kurzweil Siri gibi modern sistemlere kapı aralayan metin okuma teknolojilerinin geliştirilmesine katkıda bulunmuş tur) edindiği itibarını VİY'yi bilimsel bir yasaymış gibi sun mak için kullanıyor. ( Oysa VİY bir yasa bile değil. ) Turing, Good, Vinge: Bilişim alanında meydana gelen ilerlemelerin köklü bir değişikliği getireceği fikri yeni değil di. Kurzweil bu fikre en fazla bir yol haritası sunmuştur di yebiliriz. Yapay zeka sorununa saplantılı bir ilgi duyan baş ka birçok kişi gibi Kurzweil'in yazıları da bir mühtedinin yeni inancını herkesten fazla savunmasını andırıyor: Yeni bir çağa giriyoruz. Ben buna 'Tekillik' adını veriyorum.
İnsan zekasıyla makine zekasının birleşmesi, kendinden bü yük bir şey doğuracak. Gezegenimizde evrimin varacağı son nokta işte bu. Aslında buna genel anlamda zekanın evrimi de diyebiliriz çünkü zekanın gezegenimizden başka yerlerde
5
Ray Kurzweil, The Singularity is Near: When Humans Transcend Biology, New York: Penguin, 2005 .
YAPAY ZEKA M iTi
de ortaya çıktığına dair bir emare yok. Kanımca insan uy garlığı da zekanın evriminden ibaret. Daha hızlı ilerlemek, zekanın gücünü üstel olarak artırmak hem bizim yazgımız hem de evrimin yazgısı. Bunu durdurmaya yeltenmek, in sanların şu halleriyle iyi olduklarını düşünmek, insanlığın eski haline dair tatlı bir anıya saplanıp kalmak demek. İn san, kültürel ve teknolojik evrime tabi bir tür; ivmelenmek, üstel olarak artmak da evrimin doğasında var. İşte biz de bundan bahsediyoruz. Bundan sonraki aşama, teknoloji aracılığıyla kendi düşünsel gücümüze güç katmak olacak.6
Gerçekteyse Kurzweil hevesle bu gemiye bindiğinde, yapay zekayla ilgili bilimsel çalışmalar -yani 1 9 8 0'lerden on larca yıl önce- süperzekaya doğru kesintisiz şekilde ilerle menin tamamen hayal olduğunu çoktan ortaya koymuştu. Yapay zeka araştırmalarının ve bu alanda gerçekten ilerle me sağlamanın tek kelimeyle güç olduğu ortaya çıkmıştı. 1 9 70'lerde MIT'de felsefeci ve yapay zekanın başının be lası olan 'at sineği' Hubert Dreyfus bu alandaki çalışmaları reddeden bir makale yayımladı. Dreyfus, makalesinde ya pay zeka çalışmalarını zararlı görüyor, Macar felsefeci Imre Lakatos'un 'yozlaştırıcı araştırma izlencesi' diye nitelediği faaliyetlere örnek addediyordu.7 Dreyfus'un makalesi tum turaklı ifadelerle dolu olsa da bilgisayar bilimcilerin aslında çok iyi bildikleri yalın bir noktaya değiniyordu. O sıralarda yapay zeka çalışmaları arka arkaya darbeler alıyordu. Zeki makinelerin olanağıyla ilgili cafcaflı iddialarla kamuoyu ikna edilip bu alandaki araştırmalara büyük fonlar ayrılmıştı ama elde edilen sonuçlar beklentilerin -epey- gerisinde kalıyor du. MiT, Stanford ve başka yerlerdeki araştırma laboratu varları bir türlü istedikleri sonuca ulaşamıyor, sonu gelmez 6
7
70
Ray Kurzweil, "The Singularity: A Talk with Ray Kurzweil," çevrimiçi The Edge dergisiyle yapılan mülakat. Giriş yazısı: John Brockman, 24 Mart 200 1 , https://www.edge.org/conversation/ray_kurzweil-the-singularity. Hubert L. Dreyfus, What Computers Stili Can't Do: A Critique of Artificial Reason, Cambridge, MA: MIT Press, 1 992, s. ix.
• • • GEÇMiŞTE VE GUNUMUZDE TEKiLLiK
ikilemler, zorluklar, kafa karışıklıkları ve düpedüz hezimet lerle karşılaşıyorlardı. Örneğin 1 950'li yıllarda, 'yüksek ni telikli tam otomatik makine çevirisi' sorununun, yeterince araştırma ve yatırım yapılması halinde çözülebileceği düşü nülüyordu. Bu konuda arka arkaya yaşanan başarısızlıkların ardından 1 960'lara gelindiğinde deniz kurudu, devlet çeviri araştırmasına yatırım yapmayı bıraktı. Sağduyu sahibi -do ğal dili anlayıp konuşma becerisine sahip- bir robot üretme umudu böylece buharlaşmış oluyordu veya en azından önceki hayal kırıklıkları sel olunca bu umut ciddi oranda azalmıştı da diyebiliriz. Gerçekçi Turing Testi'ne girmek üzere üretilen sohbet sistemleri ancak hilelerle, blöflerle insan soruşturma cıları kandırmayı başarabiliyorlardı. İşin aslı, bu makineler dili gerçekten anlamıyorlardı ki bu sorun doğal dili anlama çalışmalarının bugün bile başından bir türlü savamadığı bir hayalettir. Basın bültenlerinde ve geleceğe dair sohbetlerde yapay zeka sanki kaçınılmazmış gibi aksettiriliyorduysa da araştırma laboratuvarlarında gerçek işe odaklandıldığında durum öyle görünmüyordu. Gerçekten zeki bir makine prog ramlamanın zor, hem de çok zor olduğu ortaya çıkmıştı. Tekillik fikri popüler kültürde ivme kazanırken yapay zeka üzerinde çalışan bilim insanları da bir mühendislik sorunları bataklığına saplandılar. Gök yarılmıyordu. Te killiğin eli kulağında değildi. Vinge'in popüler romanı bir romandan ibaretti. Yapay zekaya daha yakından baktığımızda hem bilim insanlarının hem de başkalarının anlatmaya doyamadıkları gelecek hayalleri ile bu alanda çalışan bilgisayar bilimcilerin kaydettikleri gerçek ilerleme arasında utanç verici bir uçu rumun olduğu ortaya çıkıyor. Turing 1 950'de makinelerin bizim gibi düşünüp düşünemeyeceğini sormuştu. Good, Vinge, Kurzweil ve diğerleri, yapay zeka çalışmaları ala nındaki gerçek çalışmaların karşı karşıya kaldığı sorunların esas yapısını ciddiye bile almadan bu soruya gür bir sesle evet yanıtını verdiler. 71
YAPAY ZEKA M iTi
Aradaki uçurum ders niteliğindeydi. Özellikle yapay zekanın, doğal dili anlamanın zorlu yanları açısından elle tutulur bir ilerleme kaydedememesi, zihinle makine arasın daki farkların Turing'in hayal ettiğinden daha ince ve kar maşık olduğunu işaret ediyordu. Zekamızın merkezinde dili kullanma becerimiz bulunuyor ve yapay zeka araştırmaları nın tarihine baktığımızda bunun yapay zekanın önündeki en zorlu engellerden biri olduğunu görüyoruz. Sırada bu sorun var.
72
5 DOGAL DİLİ ANLAMAK
esmi bir disiplin olarak yapay zeka çalışmaları şimdilerde ün kazanan 1 956 Dartmouth Konferansı'yla başladı. Bu konferansa alanın en parlak, en ünlü isimleri katılmıştı: Bell Laboratuvarları'ndan Shannon ( bilişim kuramı), Harvard' dan Marvin Minsky (matematik) , Carnegie Mellon'dan saygın ekonomist Herbert Siman, John McCarthy, Harvard'dan psikolog George Miller (insan belleği üzerine çalışmalarıyla tanınır) ve John Naslı (2001 tarihli Akıl Oyunları filmiyle ün kazanan Nobel kazanmış matematikçi) . McCarthy o sıralarda Dartmouth'taydı ama kısa süre sonra Stanford Üniversitesi'nde açılacak yeni bilgisayar bi limleri bölümüne geçecekti. Bu konferansta yapay zeka te rimini ilk kullanan, zeki yaşam mühendisliğine yönelik mo dern proj eye resmen adını da veren McCarthy'ydi. 1 8 1 6'da yaşına göre erken olgunlaşmış genç yazar Mary Shelley baş yapıtı Frankenstein üzerinde çalışmaya başlamıştı. Ondan 140 yıl sonra ise Dartmouth'ta toplanan bilim insanları yeni bir 'modern Prometheus' oluşturmayı düşünüyürlardı ki bu fikir de çok geçmeden kamuoyunda infial yaratacaktı. Yapay zeka çalışmaları alanı daha en baştan itibaren abartılıydı. Konferansta sunulan bildiriler de bunu gösteri yor:
R
73
YAPAY ZEKA MİTİ
1 95 6 yazında New Hampshire eyaletinin Hanover şehrin deki Dartmouth Üniversitesi'nce yapay zeka üzerine iki ay sürecek, 10 kişilik bir çalışma yapılması teklifinde bu lunuyoruz. Bu çalışma, öğrenmenin her veçhesinin veya zekanın tüm özniteliklerinin ilkece bir makine tarafından taklit edebilecek kadar doğru tanımlanabileceği hipotezine dayalı ilerleyecek. Makinelere soyutlamalardan kavramlara varasıya dili kullanma becerisi kazandırma, şimdilerde in sanlara özgü olan sorunları çözme, kendilerini geliştirmele rini sağlama girişiminde bulunulacak. Eğer özenle seçilmiş bilim insanlarından oluşan bir grup, bir yaz boyunca bu sorunlar üzerinde çalışırsa bu sorunların birinde veya daha fazlasında dikkate değer bir ilerlemenin kaydedilebileceğini düşünüyoruz. 1
Dartmouth'un gündemi basitti: biliş (düşünme) kabili yetinin doğasını araştırmak, bu kabiliyeti yeniden üretecek programlar tasarlamak, bunları yeni elektronik bilgisayar larda kullanıma sokup performanslarını sınamak. Dartmo uth katılımcılarının da açıkça belirttikleri üzere, kendi bilim alanlarında uzman 1 0 araştırmacı, 1 95 6 yazında mühendis lik becerilerini kullanarak bir makinede insan zekası üret mede 'dikkate değer bir ilerleme' kaydetmeyi umuyordu. RAND şirketinde çalışan Herbert Simon ile Allan Ne well, 1 95 0'lerin sonlarında Dartmouth Konferansı'nın deli saçması gibi görünen vaatlerini akla yatkın hale getiren ya pay zeka programları yazdılar. Bunlardan ilki olan Mantık Kuramcısı [Logic Theorist] ve ardından gelen Genel Prob lem Çözücü [General Problem Solver] , geleneksel mantık teoremlerini tanıtlamak ve açık seçik, kurallı adımlarla mantık bulmacalarını çözebilmek için basit bir buldurucu [heuristic] arama tekniği kullanıyordu. Bu programlar işe
' John McCarthy, Marvin Minsky, N. Rochester ve C. E. Shannon, "A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence " , Ağus tos 1 955.
74
DD�AL DILI ANLAMAK
yarıyordu ve tıpkı Dartmouth Konferansı'nı düzenleyenle rin de iddia ettiği gibi, insan zekasının sırlarını hızla çöz mek, yapay zekanın yazgısıymış gibi görünüyordu. Simon ve Newell'ın ilk başarıları diğer araştırmacılara çıtayı daha yükseğe çekme cesareti vermişti. Turing zaten bundan on yıl önce taklit oyununu makinelere uyarlayarak geliştirdiği Turing Testi'yle bu gündeme nihai bir hedef be lirlemişti. Dartmouth'taki bilim insanları da bir makineyi İngilizceyi veya bir başka doğal dili anlayacak şekilde prog ramlayabilirlerse bunun yapay zeka çalışmaları açısından büyük bir zafer olacağını düşünüyorlardı. Araştırmacı lar uzun süredir, doğal dili anlamanın 'eksiksiz bir yapay zeka'nın anahtarı olduğunu düşünüyorlardı. 'Eksiksiz ya pay zeka' terimi matematikten ödünç alınmıştı ve bilgisa yarın genel zekaya ulaştığı noktanın doğal dile hakim ol duğu nokta olduğu anlamına geliyordu. Haliyle, insan gibi düşünüp eyleyebilme kabiliyeti de kazanıyordu. Dolayısıyla 1 960'larda yapay zeka araştırmalarının ilk hedefi makine çevirisinin hayata geçirilebilmesi, yani metinlerin Rusça gibi bir dilden İngilizce gibi bir başka dile tam otomatik şekilde aktarılabilmesiydi. Yapay zeka 'rest' çekmişti.
Doğal Dili Anla[ma]mak Yapay zeka araştırmaları doğal dilin anlaşılması konusuna odaklanırken, yapay zeka uygulamalarıyla uğraşanlar da Dartmouth'ta başlamış geleneği sürdürecek başarının eli kulağında olduğundan eminlerdi. Hatta daha önce saygın A. M. Turing Ödülü'nü, ardından Ekonomi Alanında No bel anma ödülünü alacak olan Herbert Simon, 1 957 yılında "Dünyada artık düşünen, öğrenen, yaratan makineler var " diye ilan ediyordu. 1 965 'te ise 1 9 8 5 yılına kadar " makineler tüm insanların yaptığı işi yapmaya muktedir olacak" keha netinde bulunmuştu. Marvin Minsky de 1 96 7'de " Bir kuşak 75
YAPAY ZEKA M iTi
içerisinde 'yapay zeka' yaratma sorunu hatırı sayılır ölçüde çözülmüş olacak" diye ilan etmişti.2 Gelgelelim araştırmacılar çok geçmeden makine çevirisi nin çok farklı bir oyun olduğunu fark edeceklerdi. Çok basit bir varsayımdan yola çıkmışlardı: Büyük metinlerin ( bütün celerin [ corpora] ) sözcüklerinin istatistiksel yöntemler kulla nılarak incelenmesiyle dilin anlaşılabileceğini düşünüyorlar dı. Bu varsayımın yanlış olduğu hemen kanıtlandı. Bilgisa yarlar otomatik çeviriyi olanaklı hale getirmişlerdi ama elde edilen sonuçlar yüksek nitelikli olmaktan çok uzaktı. Biyo tıp literatürü gibi bazı dar alanlarda çalışan programlar bile hatadan münezzeh değildi, hem de öyle utanç verici hatalar yapıyorlardı ki akıldan tamamen yoksun görünüyorlardı. Bunun üzerine, makine çevirisi konusunda çalışan araş tırmacılar yaklaşımlarını tümceleri 'ayrıştırma' veya söz dizim yapılarını bulma yöntemlerini de kullanacak şekilde genişlettiler. Bunun için, kısa süre sonra dünya çapında ün kazanacak MIT'li genç bir dilbilimcinin geliştirdiği yeni ve son derece verimli 'dönüşümse!' sözdizimlerini kullandılar. Bu genç dilbilimci Noam Chomsky'ydi. Gelgelelim, doğal dildeki metinleri doğru şekilde ayrıştırmanın kimsenin aklı na gelmeyecek kadar güç ve karmaşık bir iş olduğu ortaya çıkacaktı. Bu süreçte öyle sorunlarla karşı karşıya geldiler ki insan geriye dönüp bakınca bunları neden baştan göre mediklerini düşünmeden edemiyor. Bu sorunların arasında sözcüklerin anlamlarının belirsizliği (örneğin 'dil' sözcüğü nün farklı anlamalara gelebilmesi); çevresel olmayan bağlam bağımlılığı (bir sözcüğünün anlamının bir söylemde veya bir metinde yakın çevresinde olmayan diğer sözcüklerin anlamı na bağlı olması) ve gönderim ( artgönderim), eğretileme ve anlambilim ( anlam) kaynaklı başka meseleler de yer alıyor du. Felsefeci ve bilişbilimci Jerry Fodor'un deyişiyle, yapay 2
Gary Marcus ve Ernest Davis, Rebooting AI: Bui/ding Artificial Intelligence We Can Trust, New York: Pantheon Books, 2019, s. 1 .
OO�AL OILI AN LAMAK
zek anın 'üç taş' oyunu diye girdiği oyun, üç boyutlu satranç çıkmıştı.3 1 9 60'ların ortalarına gelindiğinde Ulusal Kaynak Konseyi (UKK) ABD' deki bazı üniversitelerde makine çevirisi çalışmalarına milyonlar akıtsa da mühendislik sistemlerinin doğal dilin metinlerini anlamada veya anlayışı taklit etmede gerçekten sağladığı başarı en hafif tabiriyle kıttı. Vaktiyle tam otomatik makine çevirinin son derece ateşli destekçilerinden biri olan MiT araştırmacısı Yehoshua Bar Hillel, ilk uyarı çanını çalan kişiydi. Hatta bunun da ötesine geçip UKK'ye bir dizi resmi rapor hazırlayarak, şimdilerde meşhur olan bu raporların dipnotlarında bu alanın yüzleş tiği sorunların ne kadar derinlere indiğini açık açık yazmış tı. 4 Bu rapor araştırma camiasında bir deprem etkisi yarattı. Bar-Hillel, makine çevirisinin çarptığı ve batmasına neden olacak buzdağını bile sinir bozucu derecede 'felsefi' bir dille ifade ediyordu: Makinelerin sağduyusu yoktu, yani 'dünya bilgisi' -gerçek dünyaya dair bilgileri- eksikti. "Kutu ka lemdeydi. " gibi çok basit bir tümceyi ele alalım: Bar-Hillel, böyle bir tümcenin otomatik sistemlerin aklını karıştıraca ğını vurguluyordu, hem de ne denli gelişmiş olursa olsunlar. Çünkü bu sistemler dünyaya dair basit ve gerçek bir bilgiden yoksundular. Kalemlerin ve kutuların birbirine göre büyük lüğünün bilgisi, insanların bu gibi sözcüklerdeki anlam be lirsizliklerini neredeyse anında görüp gidermelerini sağlar. Biz hemen 'kalem'in muhtemelen bir yazı aracı olmadığını, kalın duvarlı, burçlu bir yapı olduğunu anlarız. Elbette ek bağlam bilgisiyle bu daha aşikar hale gelir: " Soyguncu üze rimde mücevher kutusu arıyordu. Kutu kalemdeydi. Benim gibi bir soylunun, üzerinde mücevher taşımayacağını bilme-
3 Massimo Negrotti (ed. ), Understanding the Artificial: On the Future Shape of Artificial Intelligence, Bedin Heidelberg: Springer-Verlag, 1 9 9 1 , s. 37. 4 Bkz. Peirce, John R., vd., Language and Machines: Computers in Translation and Linguistics, Otomatik Dil işleme Tavsiye Komisyonu Raporu, Ulusal Bilimler Akademisi, Ulusal Araştırma Konseyi, 1 4 1 6 numaralı belge, 1 96 6 .
YAPAY ZEKA M iTi
liydi. " Halbuki böyle bilgilerden yoksun otomatik sistemler için bu gizemli, hatta neredeyse imkansız bir iş. Bar-Hillel'in de belirttiği üzere, dünyanın bilgisini bilgi sayarlara gerçekten aktarmak mümkün değildir. En azından bunu doğrudan doğruya mühendislik yöntemleriyle yapa mıyoruz çünkü " biz insanların bildiği olguların sayısı son suzdur ve sonsuzluk, sayısız anlama gebedir. "5 Bar-Hillel istemeden de olsa insanların hiç kimsenin hayal bile etmedi ği kadar çok şey bildiğini keşfetmişti. İşte tam da bu, yapay zeka sorununa hızlı ve yalın bir çözüm bulunmasını engel liyordu. En gelişmiş otomatik sistemler bile gelip günlük yaşama dair en sıradan, sağduyuyla bilinebilecek, önemsiz şeylere takılacaktı. Bir çeviri sırasında görünüşte sıradan bir olgu, bağlamla bağıntılı olabilir; ne var ki bu olgular gerçek zamanlı veya gerçek zamanlıya yakın çalışan bilişim sistemlerinin açık uçlu 'bilgi'ye erişimini zorunlu kılar. Bi lişim sistemlerine bu açık uçlu (muhtemelen sonsuz sayıda ) art alan bilgisinden bağıntılı olguları seçecek bilişsel bece rileri kazandırmak da umutsuz bir vaka gibi duruyor. Bar Hillel'in 1 9 66'da UKK'ye sunduğu meşhur raporun sonuç bölümünde belirttiği üzere, bilgisayarların insanların dünya bilgisiyle programlanabileceği fikri " tümden hayal mahsu lüdür; üzerinde tartışmaya bile gerek yok. " 6 Başka bir deyişle makine çevirisi tam otomatik, yüksek ni telikli çevirilerden epey uzak sonuçlar üretmeye mahkumdu (bugün nitelik arttıysa da aynı durum geçerlidir) . Örüntü bu şekilde devam etti. Yapay zeka göklere çıkarılmış, çeviri araş tırmalarının verdiği sözü yerine getirememesinin ardından UKK o zaman için muazzam bir meblağ olan 20 küsür mil-
6
Sergei Nirenburg, H. L. Somers ve Yorick Wilks (ed. ), Readings in Machine Translation, Cambridge, MA: MiT Press, 2003, s. 75 . tik otomatik makine çevirisi girişimlerinde karşılaşılan sorunlara dair okunabilir bir tartışma için, bkz. John Haugeland, Artificial lntelligence, The Very Idea, Cambridge, MA: MiT Press, 1 989. Yehoshua Bar-Hillel'in yorumları için bkz. s. 1 76
DD�AL DiLi ANLAMAK
yon dolarlık fonu araştırma ve geliştirme alanından çekmişti. Bu çöküşün ardından yapay zeka araştırmacıları işlerinden oldular, kariyerleri mahvoldu, yapay zeka araştırmaları ca miası tekrar çizim tahtasının başına geçmek zoruna kaldı. 7 1 970'lerde ve 1 9 80'lerde yapay zeka araştırmalarındaki çabalara 'sağduyu bilgisi sorunu'nu çözmeye veya taham mül edilebilir hale getirmeye yönelik girişimler hakim oldu. Fakat 1 990'ların başında yapay zeka hala merkezindeki bi limsel (ve felsefi) soruna taze yaklaşımlar veya yanıtlar üret mekten acizdi. Japonya robotikte başarı kazanmayı hedef leyen çok saygın Beşinci Nesil projesine milyonlar yatırmıştı ama büyük bir başarısızlığa uğradı. 1 990'ların ortasında yapay zeka çalışmaları yine bir 'kış' yaşıyordu; bu alanda çalışanların sözüne kimse güvenmiyor, bu iş olmaz diyenlere hiçbir yanıt verilemiyor, hiçbir fon veya kaynak da buluna mıyordu. Sonra ağ çıkageldi.
Dünya Çapanda Ağ Dünya çapında ağın [World Wide Web] ortaya çıkışı tek ve basit bir nedenden ötürü yapay zeka konusunun yeninden yükselişini tetikledi: veri. Çiçeği burnunda yeni ağın milyon larca kullanıcısının ortak çabalarıyla dev veri kümeleri ve özellikle de metin bütünceleri (web sayfaları ) bir anda ula şılabilir hale gelmişti. Bu da o eski, 'sığ' istatistik ve örüntü tanıma yaklaşımlarına yaşam nefesini yeniden üfledi. Eski den sığ görülen yaklaşımlar birdenbire yeterli ve işler hale gelmişti. Örneğin yapay sinir ağları (kısaca sinir ağları), ka rarlaştırma ağaçları, Bayesçi sınıflandırıcılar gibi gözetimli öğrenme algoritmaları onlarca yıldır üniversite laboratuva-
7
Otomatik çeviri sistemlerinin ilk dönemlerinde yaptıkları çeviri hatalarının bir hikayesi için, bkz. Hubert Dreyfus, What Computers Stili Cant Do: A Critique of Artificial Reason, Cambridge, MA: MIT Press, 1 992, s. ix.
79
rında zaten mevcuttu. Fakat büyük veri kümeleri olmadan, yüz tanıma, metin sınıflandırma, istenmeyen elektronik postaların elenmesi veya sahtekarlıkların saptanması gibi alanlar fazla umut vaat etmiyordu. Şimdiyse bu yöntemler neredeyse sonsuz bir umut vaat etmeye başlamıştı, ayrıca bu alanda adeta para basan uygulamalar yapay zekaya yeni bir ilgi ve fon dalgası da sağlayacaktı. Büyük veri işte böyle doğdu (gerçi bu terim biraz daha sonra geldi ) . 2 1 . yüzyılın başında, sinir ağları ve grafik mo deller gibi sığ, temelden gelen, empirik veya veri güdümlü yaklaşımlar ve öğrenme algoritmaları hem yapay zeka araş tırmalarında hem de yapay zeka kullanan iş uygulamala rında engin olanaklar sağladılar. Saklı Markov modelleri, maksimum entropi modelleri, koşullu rassal alanlar ve des tek vektör makineleri gibi geniş paylı sınıflandırıcılar içe ren yeni yöntemler geliştirildi. Bunlar yapay zeka çalışma ları alanındaki kuramsal ve uygulamalı araştırmalara hızla hakim olmaya başladı. Nereydeyse bir gecede, büyük veri üzerinde işleyen öğrenme yöntemlerinin optimizasyonuna dayalı istatistiksel ve sayısal çözümleme bilimi peyda oldu. Üniversiteler doğal dili anlama ve doğal dili işleme proje leri başlattılar. Örneğin web sayfalarından adları ve diğer örüntüleri çekip çıkarma ( bu kabiliyete 'varlık tanıma' de niyor) ; 'dil' gibi çokanlamlı sözcüklerin anlam belirsizlikle rini giderme; web sayfalarını sıralama ve çekme gibi web'e özgü görevleri gerçekleştirme (en meşhur örneği 1 990'larda Stanford'da lisansüstü öğrenciyken Larry Page ve Sergey Brin'in geliştirdiği Google PageRank [Sayfa Puanlama] ) ; haberleri v e diğer sayfaları konulara göre sınıflandırma; is tenmeyen elektronik postaları eleme ve Amazon gibi ticari siteler için müşterilere anında ürün önerileri sunma yöntem lerini buldular. Bu liste uzayıp gidiyor. Dilbilime dayalı ve kurallı yaklaşımlardan veri güdümlü veya 'empirik' yöntemlere doğru kayış, yapay zeka çalışma larını, bir süreliğine de olsa, anlam ve bağlamla ilgili sonu 80
DMAL DILI ANLAMAK
gelmez görünen sorunların mühendislik çabalarının başına musallat olduğu o ilk başlardaki karanlık günlerin makine çevirisi çalışmalarından kurtarmış gibi oldu. Gerçekten de makine çevirisi işi daha sonra çözülecekti. Bunu çözen IBM araştırmacılarının kullandığı istatistiksel -yani sözdizimine dayalı olmayan- yaklaşım aslında Claude Shannon'un bi lişim kuramı hakkında yaptığı ilk çalışmaların büyük bir beceriyle uygulanmasından ibaretti. Bu araştırmacıların 'gü rültülü kanal' adı verilen yaklaşımı, kaynak metin (örneğin Fransızca) ile hedef metnin ( örneğin İngilizce) tümcelerini bir bilgi alışverişi olarak görüyor, kötü çeviriler bu süreçte 'gürültü' teşkil ediyordu; böylece sisteme düşen görev, kay nak ve hedef tümceler arasındaki çeviri kanalındaki gürültü yü azaltmak oluyordu. Bu fikir işe yaradı ve makineler, IBM Araştırma Laboriıtuvarları'nın öncülüğünü yaptığı, veri yo ğunluklu çok daha basit bir istatistiksel yaklaşımla işe yarar çeviriler üretmeye başladılar.
Başarı mı Diyelim, Başarısızlık mı Diyelim? Google Çeviri gibi güncel sistemlerin bir zamanların kafa karıştıran makine çevirisi sorununda sergiledikleri başarı, yeterli zaman ve doğru fikirle yola çıkılırsa yapay zekanın başarılı olacağının kanıtı olarak gösteriliyor. Oysa gerçeği bilince bu kanıtlar şüpheli hale geliyor. Doğal dili anlamada karşımıza çıkan bazı sorunların is tatistik veya makine öğrenimi gibi yaklaşımlarla çözülebi leceği görüldüyse de Bar-Hillel ve diğerlerinin anlambilim (anlam) ve edimbilim ( bağlam) hakkındaki eski kaygılarının çok sağlam temellere dayandığı da kanıtlandı. Doğal dille ilgili zor bir sorun gibi görünen makine çevirisi, elde farklı dillere dair büyük bütünceler (veri kümeleri) olduğu sürece, basit istatistiksel çözümlemeyle yeterli ölçüde başarılabili yordu. ( Burada şunu da gözden kaçırmamak gerek: Makine 8r
YAPAY ZEKA MiTi
çevirisi hala çok yüksek nitelikli değil; e n fazla 'kullanılabi lecek kadar iyi' denebilir. ) Bu durum makinelerin doğal dili anlama zekasında etkileyici bir artış gerçekleştiğinin değil, makine çevirisinin başta sanıldığından daha basit bir sorun olduğunun kanıtıdır. Yine, bilgisayar kullanarak dil anlamaya çalışmanın doğruduğu derin sorunlar da oldukları yerde duruyor. Bu meseleyi basitçe ifade etmek için Turing Testi'ne geri dö nüp onu yapay zekanın tarihçesinin ve karşımıza çıkarıdığı sorunları aşmak veya bu konuda elle tutulur bir ilerleme kaydetmek için sarf edilmiş çabaların ışığında tekrar ele al malıyız. Nick Bostrom gibi gelecekbilimcilerin yanı sıra bi limsel yapay zeka camiasının geneli de keşke halk bu testi unutsaydı diyordur muhtemelen. Sorun, bu testin kusurlu veya kullanışsız olması değil (gerçi bazen böyle deniyor) , çok zor olmasıdır.
Turing Testi Meseleye çok uzaktan bakıldığında, yapay zekanın Turing'in ilk dönem çalışmalarıyla doğup Dartmouth Konferansı'nın çaktığı kıvılcımla ivme kazandığı sürecin vardığı noktada, bilgisayarlar gerçekten de akıllanıyor gibi görünüyordu. Nitekim işlem güçleri ve depolama kabi liyetleri kuşkuya yer bırakmayacak biçimde artmıştı. Bu iyileşmelerse iyi tanımlı sorunlarda kaçınılmaz olarak bir ilerleme sağlamıştı. Bilgisayarların satranç oynama kabili yeti insanlarınkini henüz aşamıyorduysa da gelişmeye de vam ediyordu. Kimyasalların yapısını çözümleyen DEND RAL ve bazen harika tıbbi tanılar koyabilen MYCIN gibi programlar, olağan şartlarda yüksek insan zekası gerek tiren çeşitli sorunlarda yapay zekanın kullanılabileceğini gösteriyordu. Makine çevirisi ilk başta başarısız olmuştu ama büyük veri kümelerine ( bu 2000'lerdeki çok sayıda 82
DOGAL DILI ANLAMAK
b üy ük veri ve veri bilimi alanındaki başarının önceliydi ) erişi lebilmesiyle birlikte farklı yaklaşımların başar ıyla uy gulanması olanaklı hale gelmişti. Gücü ve gelişkinliği artan yapay zeka sistemleri doğal dilin tümcelerinin ayrıştırılma sı, sözcük türlerinin veya varlıkların ( kişilerin, kurumların, yerlerin vb. ) etiketlenmesi gibi her türlü doğal dili işleme görevinde adım adım başarılı oluyordu. 8 Yine de Turing'in yapay zekaya koyduğu asıl hedefe bir türlü ulaşılamıyordu, yani yapay zeka Turing Testi'ni bir türlü geçemiyordu. Konuşmayı anlamak yapay zeka için iyi tanımlanmış bir görev olmaktan ziyade düpedüz başka bir kabiliyet gerektiriyordu. Terry Winograd'ın SHRDLU sistemi gibi ilk sistemler bu konuda küçük de olsa bir ba şarı umudu doğurdular. SHRDLU sistemi, "A blokunu B blokunun üzerin.e yerleştir, ardından ikisini de C blokunun üzerine yerleştir. " gibi komutları bileşenlerine ayırıp işliyor, ardından robotik bir kol aracılığıyla blokları oynatıp dize biliyordu. Ama sıra açık uçlu sohbet sistemleri geliştirme ye geldiğinde araştırmacılar hala çuvallıyorlardı. Bu alanda kaydedilen ilerlemeler az çok hile barındırıyordu. Sistemi ta sarlayanlar zekice taktiklerle sohbetin insan tarafını kandır maya çalışıyor, programlar kendilerini aşan sorularla kar şılaştıklarında ya soruyu bilmezden geliyor ya da kaçınma taktikleri ve stratejileri sergiliyorlardı. Bu hileli sistemlerin belki de en ünlüsü Joseph Weizenbaum'un ELIZA progra mıydı. Bu program Roger ekolüne mensup psikoterapistle rin hasta sorgularını taklit ederek insanla söyleştiği yanılgı sını yaratabiliyordu. İşte size bir örnek (ELIZA'nın yanıtları yatık harflerle verildi) : 8
DENDRAL hakkında daha fazla bilgi için, bkz. Robert K . Lindsay, Bruce G. Buchanan, E. A. Feigenbaum ve Joshua Lederberg, "DENDRAL: A Case Study of the First Expert System for Scientific Hypothesis Formation, " Artificial Intelligence, 6 1 . cilt, 2. sayı ( 1 993), s. 209-26 1 . MYCIN hakkında daha fazla bilgi için, bkz. B. G. Buchanan ve E. H. Shortliffe, Rule Based Expert Systems:
The MYCIN Experiments of ıhe Stanford Heuristic Programming Project, Reading, MA: Addison-Wesley, 1 984.
YAPAY ZEKA MiTi
Erkeklerin hepsi aynı.
Nasıl? . Yok yere sorun yaratıyorlar.
Belli bir örnek geliyor mu aklına? Eh, buraya gelmemi erkek arkadaşım önerdi.
Buraya gelmeni erkek arkadaşın önerdi. Diyor ki hep depresyondaymışım.
Depresyonda olmana üzüldüm. E, doğru. Bu beni üzdü.
Buraya gelmen üzülmemene yardımcı olur mu sence? Yardıma ihtiyacım olduğu kesin.9 Böyle programlar gerçek yapay zeka standardı açısından bakınca düpedüz sahtekarlık içeriyor. Aynı biçimde her yıl Turing Testi düzenleyen Loebner Ödülü yarışmasında bazı hakemleri kısa süreliğine de olsa defalarca kandıran prog ram da öyleydi. Medyada çıkan haberlerde hemen testin en sonunda geçildiği ilan edildi, yapay zekanın en meşhur zorluğun üstesinden geldiğine dair kısa süreli ama yüksek bir gürültü koptu. Eugene Goostman adlı bu sohbet botu, yarışmada kendini 13 yaşında Ukraynalı bir oğlan olarak tanıtmıştı. Bu kimliğe bürünmesinin nedeni hakemlerin onu yazım hatalarını ve genel bilgi noksanlığını çocukluğu na bağlamalarını sağlamaktı. Bu sohbet botu bazı sorulara doğrudan yanıt vermek yerine konuyla bağlantısız alaycı yorumlarda bulunup laf sokarak soruları savuşturuyor, ha kemleri yanlış yönlendiriyordu. Peki, bazı hakemleri kandı rabilmiş miydi? Evet. Sonuçta Turing Testi'nden gerçekten geçmiş miydi ? Hayır. 10 9
10
Yapay zekalı doğal dili işleme çalışması olarak ELIZA programına dair iyi bir tartışma için, bkz. James Ailen, Natura/ Language Processing, San Francisco: Benjamin / Cummings Publishing Company, 1 995. Bu söyleşi 7. sayfada yer alıyor. İkinci Kısımda Goostman'ın performansındaki sorunları daha ayrıntılı biçimde izah ediyorum.
O O�AL DiLi ANLAMAK
Makine çevirisi meselesi yakın tarihlerde web'de bulu nan, farklı dillere çevrilen büyük hacimli metinler sayesinde (kısmen) halledilmişse de Turing Testi yapay zeka için daimi bir hayal kırıklığı olmaya devam ediyor. Bar-Hillel'in haya leti hala üzerimizde dolanıyor.
85
6 YAPAY ZEKA: TEKNOLOJİK KITSCH
Ç
ekoslovakya doğumlu yazar Milan Kundera, başyapıtı olan Varolmanın Dayanılmaz Hafifl,iği 'ni 1 9 8 0 yılın da yazmıştı. Bu roman bir aşk öyküsüydü ama art alanında 1 96 8 'de Çekoslovakya'nın Sovyetler Birliği tarafından işgali yer alıyordu. Kundera, romanında Prag'ın toplumsal, ente lektüel ve kültürel dokusuna zorla sızan, göz açtırmayan, sürekli yalanlar uyduran Sovyet gizli polisinin tacizlerinin ardından intihar eden yazarların ve sanatçıların hikayesini anlatıyordu. Praglı entelektüeller ölüyor, itibarları ellerin den alınıyor, ardından -öldükten sonra bile- daha da aşa ğılanıyorlardı: Cenazelerine gelen Sovyet parti üyeleri ve devlet görevlileri ölüye mide bulandırıcı methiyeler düzü yor, onun Devlet'e ömrü boyunca sadık kaldığına tanıklık ediyorlardı. Sovyet propagandası önce onların mezarlarını kazıyor, sonra da onları hem kamusal hem de özel hayat larında açıktan karşı çıktıkları fikirler uğruna yaşamlarını feda etmişler gibi gösteriyordu. Düpedüz, nefret ettikleri şeyi sevdikleri söyleniyordu. Sovyet propagandası acımasız olmasına acımasızdı ama kindar veya aptalca değildi. Belirli bir amaç güdüyordu. Ülke olmanın, halk olmanın ve yaşamın derinlere kök salmış an lamını -dolayısıyla karşılaşabileceği her türlü muhalefeti- iş86
YAPAY ZEKA: TEKNOLOJ iK KITSCH
gal ettiği topraklardan söküp atmayı, yeni bir sayfa açmayı amaçlıyordu. Sovyetler Birliği Prag'ı ve tüm Çekoslavakya'yı ortak tarihinden, geleneklerinden, değerlerinden ve uğrun da savaşacağı şeylerden yoksun bırakıyordu. Düşünürler bir kez susturulduğunda sanki bir duvarın boyasını söküp tek rar boyarcasına, ciddi veya örgütlü bir muhalefetle karşılaş madan kendi dünyagörüşünü halka rahatça dayatabilecekti. Kundera'nın eseri, insan yaşamının değerine, belli inanç ve ideolojilerin birey ve toplum için anlam taşıyan her şeyi per deleyip yontma çabasına girişebileceğine -ama bunda asla başarılı olamayacağına- dair etkili ve epey trajik bir hikaye anlatıyordu. Kundera, yenilmiş Çek halkının üzerine yaman maya çalışılan Sovyet kültürüne kitsch adını veriyordu.
Teknolojik Kitsch
Kitsch Almanca bir sözcük ve bugünlerde banal veya zevk siz sanat eserlerine veya dekora atıfta bulunmak için kulla nılıyorsa da esasında her alanda vıcık vıcık bir duygusallık ve melodram anlamına geliyordu. Yapay zekacı dünyagörü şünün tam merkezindeki zeka hataları (yani bilim değil de inançlar) ise zamanla modern ve bilhassa tehlikeli bir kitsch türü haline geldi. Süperzeki bilgisayar hayali elbette Sovyet propagandası gibi değil, kimse bizi makinelerin yükselişine inanmaya zorlamıyor. Fakat Sovyet kültürüyle temel fikri paylaşıyorlar. Nasıl ki Sovyet kültürü eski fikirlerin yerlerine tehlikeli tekboyutlu soyutlamaları koyduysa, yapay zekacı dünyagörüşü de bireyler ve toplumlar hakkında karmaşık ve zorlu tartışmaların yerine yüzeysel teknolojik hikayeleri koymaya çalışıyor. Kitsch, anlamı ve kullanımı zamanla değişmiş bir sözcük. Özgün Almanca tanımı bazı açılardan burada incelemeye çalıştığım anlamından farklı olsa da özgün anlamın iki esas bileşeni buradaki iddiamı yeterince açık kılmaya yetecektir.
YAPAY ZEKA MiTi
Birincisi kitsch, karmaşık fikirlerin basitleştirilmesini barın dırıyor. Anlatılacak hikayenin basit olması gerekiyor. ikin cisi, kolaycı çözümler sunuyor, insanların yaşamdaki sorun lara dair sorularını ve kafa karışıklıklarını, ciddi ve derine inen tartışmalar aracılığıyla ele almak yerine bir duygu seli içinde silip süpürüyor. Dolayısıyla süperzekalı, hayranlık uyandırıcı bir androidin çıkagelip insan toplumunu köh nemiş geleneklerinden ve fikirlerinden ve Tanrı, zihin, öz gürlük, iyi yaşam falan filan hakkındaki beylik sorulardan tamamen kurtarıp yeni bir çağ başlatacağı fikri, kitsch 'in kusursuz bir örneğini teşkil ediyor. 20 1 5 yılında gösterime giren bilimkurgu filmi Ex Mach ina 'da Alicia Vikander'in 'canlandırdığı' 'Ava' misali güzel -veya zekası güzel- maki neler gelip insan varoluşunun ayrılmaz parçası olan çetin ol guları güya tamamen bir kenara atacaklar. işte bu düpedüz teknolojik kitsch. Tıpkı Sovyet propagandası gibi bu hikaye de bizi dehşete düşürse de teskin etse de yeni bir şey sunuyor ve bunu daha önce doğru sayılanın üstünü çizerek, eskiyi çöpe atarak yapıyor. Böylece eski gerçeklik yok oluyor. Alan Turing bilim ve mühendisliğe onca katkısına rağ men zekayı sorun çözme becerisiyle eşitlediği anda tekno lojik kitsch'in doğmasına ve hızla yayılıp büyümesine yol açtı. Ardından Jack Good, Turing'in zeka hatasına hata kattı ve zeki makinelerin gelişinin süperzeki makinelerin gelişini de zorunlu hale getireceğini ileri sürerek çok tartı şılan ultrazeka kavramını ortaya attı. Halkın hayalgücüne süperzeki makine fikri bir kez yerleştiğinde insanın amacını, anlamını ve tarihini, bilişim ve teknoloji parametreleri çer çevesinde yeniden yazıp anlatmak da olanaklı hale geliyor. Ultrazeki makineler bir ham hayalden öteye gitmiyor. Bunun aksini düşünmekse yüzeysellikte birbiriyle yarışan iki yoldan teknoloj ik kitsch'e davetiye çıkarıyor. Bir uçta yapay zekanın başrolü oynadığı korkutucu kıyamet senar yoları var ki bunlar kamp ateşinin başında anlatılan korku hikayelerine benziyorlar. Diğer uçtaysa ütopyayı yaşatacak 88
YAPAY ZEKA: TEKNOLOJiK KITSCH
düş gibi bir yapay zeka var ama o da en az diğeri kadar yüzeysel ve temelden yoksun. Eğer yapay zeka kitsch'inin bu iki biçiminden birini ciddiye alırsak yalnızca teknolojinin belirlediği bir dünyayla haşhaşa kalmamız kaçınılmaz. Bu izleğe tekrar döneceğim çünkü gelecekbilimin yapay zeka anlayışının temel sorununu da açığa vuruyor. Ex Mac hina filmindeki dahi bilgisayar bilimci Nathan'ın sözleriyle " Biz bugün Afrika düzlüklerindeki fosilleşmiş iskeletlere na sıl bakıyorsak yapay zekalılar da gün gelecek bize aynı gözle bakacak. Dik durabilen iri bir maymunmuş bu, tozun topra ğın içinde yaşarmış, dili kaba, araçları kabaymış. Türünün tükenmesine şaşırmamak gerek, diyecekler. " İşin doğrusu, bilgisayarların dönüp geriye bakıp bakmayacağı bile belli değil. Aslında bu yaygın duygu varoluşun, yaşamın, bilincin ve zekanın anlamını, bizimle bilgisayarlar ve başka teknolo ji türleri arasındaki farkları derinlemesine ele almamızı ge rektiriyor ama teknoloj ik kitsch insan doğasıyla ilgili ciddi felsefi soruşturmalara girmemize engel oluyor. Kundera'nın da ta o zamandan farkına vardığı üzere, bu böyle gitmez. Genellikle kitsch'in kökleri daha kuşatıcı bir düşünce sisteminde bulunur. Komünistler için bu Marksizmdi. Kaçı nılmazlık miti içinse bu teknobilimdir. Teknobilimsel dünya görüşünü büyük oranda Auguste Comte'un çalışmalarından miras aldık.
Teknobilimsel Hilipürmelilimiz Teknobilimi tam olarak geliştirip açıklayan ilk düşünür muhtemelen Auguste Comte'tu. 1 1 9 . yüzyılda yaşamış bir felsefeci olan Auguste Comte genellikle sosyoloj iyi bilimsel 1 Burada 'teknobilim' terimini kullanmak bir anakronizm örneği olmakla birlik te 1 9. yüzyılda Bilim Devrimi'nin ardından şekillenen fikirleri tam olarak yan sıtıyor. Teknobilim terimi ilk kez 1 970'1erde Belçikalı filozof Gilbert Hottois kullanıldı.
YAPAY ZEKA MiTi
bir çalışma alanı haline getiren ve pozitivizm kuramını geliş tirip yayan kişi olarak tanınır. Pozitivist görüşe göre yalnızca gözlenebilir olgular vardı ve bunlar bilimin konusuydu; din ve felsefe ise boş hayallerden ibaretti. Comte önce insanlığın hem birey hem de toplumun geneli düzeyinde sırasıyla dinsel, felsefi ve bilimsel aşamalardan geçerek hakikate doğru ilerle diği fikrini ortaya atmıştı. İkincisi, teknobilimin en sonunda eşyanın doğasının tam olarak bilmemizi -bilimi- sağlayaca ğını, bunun da cenneti yeryüzüne indireceğini savunuyordu. İnsanlık, edindiği bilgiyi kullanarak ömrünü uzatacak, ha yatını daha anlamlı hale getirecek teknolojileri geliştirecekti. Comte'un teknobilimin dönüştürücü gücüne dair bu an latısı dinin, özellikle de Kilise'nin yerini en sonunda 'insan lık dini'nin alacağını öngörüyordu. Bu din tamamen seküler olacak, Tanrı'ya inanç barındırmayacak, sırtını tamamen bilime ve maddi gerçekliğe dayayacaktı. Comte'un bunları yazdığı 1 9 . yüzyılda insan düşüncesinin hem bilimin yasala rını keşfetmek hem de kuvvetli ve yararlı teknolojik inovas yonlar yapmak için gücünün olduğunu gösteren yeterince kanıt var gibi görünüyordu. Böylece teknobilim modern zi hinde kök salmaya başladı. Comte'un kuramına daha en başından itibaren kuşkuyla yaklaşanlar da olmuştu. Örneğin Nietzsche, insan düşün cesinin böyle sığ bir görüşle boğulma, kısıtlanma ihtimali ni esefle karşılamıştı. Teknobilim daha uzun yaşamamızı sağlayabilirdi ama bizi daha bilge yapamazdı. Sıradışı ve hak edilmiş beceriler ve erdemlerle donanmış bir kahraman veya kişi fikrinin Comte'un hayal ettiği dünyada yeri yoktu. Onun vizyonunda temelde kişi olmaya dair geleneksel tar tışmaların yerini bilimin, özellikle de teknolojinin ilerleme sine dair tartışmalar almıştı. 2 Comte'un maddeciliği de diğer düşünürlere insanın olaFriedrich Wilhelm Nietzsche, The Gay Science; with a Prelude in Rhymes and an Appendix of Songs, New York: Vintage Books, 1 974. [Türkçesi: Şen Bilim, çev. Ahmet inam, Say Yayınları, İstanbul, 202 1 ] 90
YAPAY ZEKA: TEKNOLOJiK KITSCH
naklarını genişletmekten ziyade daraltıyormuş gibi görünü yordu. Rusya'da Dostoyevski maddeciliğe ve bilimciliğe ka yıtsız şartsız inancı (tek gerçek bilginin bilimsel bilgi olduğu görüşünü) giderek büyüyen bir 'bela' olarak görüyor, hor görerek ona itiraz ediyordu. Onun yazıları da diğer düşü nürlerdeki teknobilimsel düşüncenin hızla hakim olmasına ş üphe kadar korku barındırıyordu. Yeraltından Notlar kita bında şöyle yazıyordu: Hiçbir sınıflamaya girmeyen, çeşitli sistem ve nazariyele ri cehenneme yollayan, daima yok sayılan en faydalı, en önemli çıkarlarımız, sınır tanımayan hür bir irade, vahşi de olsa kendine mahsus bir kapris, bazen bir kışkırtmayla çılgınlığa varabilen ama özgün bir hayal kudretidir. Peki, ne diye bazı alimler insana normal, erdemleri zedelemeyen istekler gerektiğini iddia ederler ? Neden akıllarını insanın isteklerinin mutlaka mantıklı ve çıkarlarına uygun olması gerektiğine takmışlardır ? İnsana lüzumlu olan tek şey, onu nereye sürükleyeceği belli olmayan hür iradedir. Bu iradeyi de kim bilir hangi şeytan . . 3 .
Dostoyevski, Nietzsche ve diğerleri, kişinin yetkinleşmesi idealinden söz ederken Comte bizim dışımızdaki bir şeyin -teknobilimin- yetkinleşmesi idealinden söz ediyordu. Ama sorun şu ki teknobilimsel gelecek vizyonu kişiliğin doğası hakkında da bir iddia barındırıyordu ve Comte bunu gayet iyi biliyordu. Aslına bakılırsa Comte geleneksel düşünce nin kişi olmaya yüklediği anlamın ( örneğin Hıristiyanlığa göre insanın Tanrı'nın suretinde yaratıldığı için biricik ol duğu veya Yunan felsefesine göre insanın teknolojinin yanı sıra bilgeliğe de erişebildiği için benzersiz olduğu inancının) ulaşılan bilimsel ve teknolojik başarılar sonucunda önemini yitirdiğini, artık ıskartaya çıkarılması gereken bir fikir oldu ğunu savunuyordu. Dolayısıyla teknobilim felsefesi, insan 3
Fyodor Dostoyevski, Notes From Underground, New York: Vintage Classics, 1 994, s . 3 3 . (Türkçesi: Yeraltından Notlar, çev. Nihal Yalaza Taluy, İstanbul: İş Bankası Yayınları, 2008] 91
YAPAY ZEKA MiTi
doğasının, insanın ozunun ve olanaklarının yeninden yo rumlanması demekti ki bu anlamda radikal bir yaklaşımdı. Teknobilime körü körüne inanmayan düşünürler Comte'un -ve diğerlerinin- dolaşıma sokup yaydığı kavramlara mey dan okumakta haklıydılar. 4
Hama Faber'in Zaferi
Teknobilim 2 0 . yüzyılda zafer kazandıysa da ona kuşkuyla yaklaşanlar da var olmaya devam edecekti. Nazilerin yar gılandığı Nuremberg savaş suçları mahkemelerinde sanık ların itiraflarına atıfla kullanıdığı 'kötülüğün sıradanlığı' deyimiyle ünlenen felsefeci Hannah Arendt, Comte'un tek nobiliminin (20. yüzyılın ortalarında bir felsefe ve dünya görüşü olarak gücünden henüz hiçbir şey kaybetmemişti) insan doğasının sil baştan tanımlanması anlamına geldiğini savunuyordu.5 Arendt, klasik bakışın insanı homo sapiens, yani bilen, bilge insan olarak göregeldiğini, geleneğin ta rihsel olarak insanın teknoloj ik becerilerinden ziyade bil geliğine ve bilgi edinme kabiliyetine odaklandığının altını çiziyor, bir dünyagörüşü olan teknolbiliminse bizi homo faber, yani [alet] yapan insan olarak baştan tanımladığına dikkat çekiyordu. Yunanca homo faber, bizi biz yapanın bugünkü teknolo ji sözcüğünün kökü olan tekhne, yani zanaat, bir şeyler yap ma, inşa etme becerimiz olduğuna inanan kişiyi ifade eder. lnsan doğasının homo faberci kavranışı, Comte'un 1 9 . yüz4
5
Bu görüşler, Comte'u etkileyen Fransız düşünürler tarafından da savunuldu. Bunlar arasında Condorcet ve Marie Jean Antoine Nicolas Caritat da vardı. Bilim Devrimi'nin Fransız felsefesinde yol açtığı devrimden önce Francis Bacon gibi İngiliz filozoflar da felsefi açıdan bilimi ve ilerlemeyi zorunlu gören benzer görüşleri benimsemişlerdi. Hannah Arendt, The Human Condition, Chicago: Chicago University Press, 1 95 8. [Türkçesi: insanlık Durumu, çev. Bahadır Sina Şener, İstanbul: lletişim Yayınları, 1 994]
YAPAY ZEKA: TEKNOLOJ i K KITSCH
yılda geliştirdiği ütopyacı teknobilim fikriyle kusursuz bir uyum sergilemenin yanı sıra 20. yüzyıl insanının en sonunda yap ay zekanın ortaya çıkışıyla taçlanacak son derece güçlü ve kuşatıcı teknolojiler üretme saplantısını da beslemekte dir. Dolayısıyla bu tasarının hayata geçirilebilmesi için in sa na ilişkin geleneksel anlayışın kökünün kazınması şarttı. Arendt bilgi ve bilgelikten teknoloji ve inşaya doğru meydana gelen bu kaymanın bir deprem etkisi yarattığını, kendimize dair kısıtlayıcı ve tehlikeler barındıran bir anlayı şı temsil ettiğini savunuyordu. Bu anlayış hem dizginsiz bir teknolojik gelişim sürecini hem de teknolojik başarılarımızı kendimizi ifade etmenin yegane anlamlı yolu olarak görmeyi kaçınılmaz hale getiriyordu. Başka bir deyişle, teknobilimin bize sunduğu araçlarla inşa edebileceğimiz harikalara ilişkin beklentilerimiz gözümüzde fazla büyüyor, kendi değerimiz ise fazla küçülüyordu. Yon Neumann'ın teknolojide ilerleme hız kazandıkça bir 'tekilliğe' ulaşılacağı şeklindeki yorumu ilk başta kapalı ve anlaşılmaz görünüyorsa da çağdaşı Arendt'in baktığı pence reden bakınca çok daha açık ve anlaşılır hale geliyor. Bir bilim insanı ve matematikçi olan Yon Neumann bu yorumunu -bil diğimiz kadarıyla- daha fazla açmamış olsa da Arendt'in üze rinde ısrarla durduğu noktayı, yani teknobilimin bizim ve ge leceğimiz için -yani teknoloji felsefecilerinin deyişiyle 'insan lık hali' için- taşıdığı derin önemi eksiksiz biçimde yansıtıyor. Belki de Comte'a sorulsa teknolojik ilerlemenin ivmelenerek bizim artık zapt edemeyeceğimiz bir noktaya varacağı fikrini sapkınlık addederdi, kim bilir. Fakat yazılarına baktığımızda onun Arendt ve başkalarının parmak bastığı temel sorun üze rinde düşünmüş olduğunu gösteren en ufak bir ipucuna dahi rastlamıyoruz. Kısacası Comte, teknobilimi insanlığın sorun ların insanca bir yanıt olarak görmemiz halinde kendimizi sil baştan tanımladığımız görüşünde değildi. Episteme (doğanın bilgisi) ve sapientiae'den ( beşeri değerler ve toplum hakkın daki bilgilerimiz) tekhne'ye dönüş, insanın biricikliği fikrinin 93
YAPAY ZEKA M iTi
de anlamsızlaşmasına yol açıyor (ne de olsa arı kovanındaki arılar da bir şey yapıyor, inşa ediyor) . Tekhne'yi merkeze aldığımızda, kişiyi inşa edilecek bir şey olarak görmek de olanaklı hale geliyor çünkü insanı insan yapanın daha yetkin teknolojiler inşa etme becerisi olduğunu baştan varsaymış oluyoruz. Bir kez bu yola giril diğinde kısa sürede yapay zeka fikrine varmak kolay olu yor. işte burada önce Turing'in yaptığı, ardından jack Good ve diğerlerinin günümüze kadar büyütüğü zeka hatalarıyla apaçık bir bağlantı var: bir tür olarak homo faber'in nihai zaferinin kendini inşa etmek olacağı fikri. Elbette bu tam da yapay zeka araştırmalarının resmi amacıdır. Bu tasarının başarılı olup olmayacağını incelemek de bizi illa ki kendi doğamızı anlamanın derin sularına çekecek.
Yapbozu Tamamlamak Teknobilim, Bilim Devrimi'yle ortaya çıktı ve modern bilim kuramlarının çoğu, birkaç yüzyıl içinde yerli yerine oturdu. istisnaları olsa da -ki apaçık istisnaları 20. yüzyılda kuantum kuramının ve göreliliğin gelişimidir- bilimsel bilgimiz büyük fizik kuramları devreye girince ilerlemeye başladı. Bilimsel bilgi bir yapboz gibiydi, kuramın parçaları dünyaya ve evrene dair bir resim oluşturuyordu. Newton'ın fiziği, Maxwell'in elektrodinamiği, Carnot ve diğerlerince geliştirilen iş ve ter modinamik kuramları gibi bütün bu bilimsel bilgiler, dünya hakkında bütünlüklü ve düzenli bir resim oluşturuyordu. Bu kuramlardaki birtakım eksik parçalar ve ayrıntılar da 1 850'de Darwin'in evrim kuramı ve coğrafi ve arkeolojik ke şiflerce dolduruldu. (Elbette bu kuramlar tartışılıp sınanırken bazıları hatalı çıktı veya gözden geçirildi. ) Bu yüzden bilimsel araştırmanın sunduğu olanaklar yelpazesi de tıpkı bir yap bozla uğraşırken yerli yerine oturan her parçanın kalan seçe nekleri azaltması gibi, gün geçtikçe daralıyordu. 94
YAPAY ZEKA: TEKNOLOJi K KITSCH
Buna karşın teknolojik inovasyon alanında bir patlama yaşanıyordu. Nitekim Ray Kurzweil'in de belirttiği üzere, teknolojik inovasyon ivmelenir: Yapılan bir icat, yapılabi lecek yeni icatları sınırlamak şöyle dursun, daha fazla icadı olanaklı kılar. Başka bir deyişle teknoloji evriliyor gibi görü nüyor. Teknolojiyi bilimsel kuram gibi belirli bir yere yerleş tirmeyiz; biriktiririz ve bu birikmenin bir sınırı yok gibidir. Teknolojinin evriminin ivmelenmesi demek, basitçe, tarihe baktığımızda büyük teknolojik inovasyonlar arasında geçen sürenin sürekli kısalması demektir. Nitekim bilgisayarın icadı ile internetin icadı arasında geçen süre, matbaa ile bilgisaya rın icadı arasında geçen süreye kıyasla epey kısadır. Bilimin ve teknolojinin kaynaşması bu yüzden çok karmaşık bir süreçtir ve teknobilim sözcüğü, bilimin bir noktada artık duracağını, teknolojinin evriminin ise sürekli -Ray Kurzweil'in deyişiyle 'üstel olarak'- ivmeleneceğini ima eder. Teknobilim teriminin kendisi, dünyamızın son derece karmaşık ve öngörülemez bir yer olduğunu işaret ediyor. İnsanlığın meşgul olduğu her alanda aynı büyüme örün tüsüyle karşılaşmıyoruz, dolayısıyla bir alanı diğer alanlar için bir şablon olarak kullanamayız. insan zekası ile makine zekasının birbirine benzeyip benzemeyeceğini bize zaman gösterecek. Fakat yapay zeka sorunu, felsefi çıkmazları görmezden gelmenin bahanesi olmamalıdır. Aksine, onlara eğilmek için bir davetiye olmalıdır. Teknobilimi insan ola rak kendimizi ifade etmenin en temel yolu olarak görmek son kertede berbat bir indirgeme barındırıyor. Hayatın zor lu ve karmaşık sorunlarının zaten sel olması yetmiyormuş gibi bir de bunların arasına hiç yoktan kitsch'i katmak an lamına geliyor.
95
v
7 BASİTLEŞTİRMELER VE GİZEMLER
uring'in 1 950 tarihli " Hesaplayan Makineler ve Zeka " makalesini yayımlamasından kısa süre önce davranışçı psikolog B. F. Skinner, Walden Two [Walden iki] adlı bilim kurgu romanını yayımlamıştı. 1 Skinner'ın romanındaki ka rakterler özgür iradenin bir yanılsamadan ibaret olduğunu, kişinin davranışlarının dışarıdan, yani çevresi tarafından be lirlendiğini ve çevresi -diyelim ki bilim insanları tarafından değiştirilirse davranışlarının da değişeceğini savunuyorlardı. Bu temel olarak doğruydu. Nitekim bir diktatör halkın dan gıdayı, güvenliği, istihdam fırsatlarını esirgerse halkı el bette mutsuz olacaktır. Böyle değişimleri öngörmek zor de ğildir. Fakat Skinner bundan kişinin sadece girdileri -kendi deyimiyle 'uyarıcılar'- tarafından belirlenmesini anlıyordu. Aslına bakılırsa Skinner'ın insanı bir 'karakutu' olarak ele alma fikri, temeli itibarıyla Turing'in de aklındaki fikir di. Nitekim insana bir karakutu muamelesi yaparsak onun iç dünyasını tamamen görmezden gelerek tüm çıktılarını sa dece girdilerinin bir işlevi olarak görmek de olanaklı hale ge liyor. Skinner Walden lki'de insanlara karakutu muamelesi yapıyor, insanlardan belirli çıktılar -tepkiler- almak üzere
T
1 B. F. Skinner, Walden Two, Indianapolis: Hackett, 2005 [ 1 948].
BASiTLEŞTiRMELER VE GiZEMLER
onlara belirli girdiler -uyarıcılar- verilmesi halinde kusursuz bir dünyanın kurulmasının, yani bir ütopyanın gerçekten inşa edilmesinin mümkün olduğunu savunuyordu. O sıralar Turing de insanın işlem kabiliyeti açısından karmaşık bir makineden farksız olduğunu savunuyor ve bunu kanıtlamak için bir makine inşa edip onu belirli girdilerle beslemeyi ve bu girdilere göre çıktılarını incelemeyi öneriyordu. Fakat bu düşünme biçimi birçok önemli noktayı görmez den geliyordu. Ne yazık ki bugün yapılan hataları bu düşün ceden miras aldığımız ortadadır. Skinner'ın edimsel koşul lanma veya bugünlerde 'davranışçılık' olarak anılan kuramı 20. yüzyılın sonralarında enine boyuna tartışıldı ama bu kuramın yerini alan disiplinlerarası 'bilişsel devrim'in felsefi dayanağını teşkil eden 'hesaplayıcı zihin kuramı' da zekaya bir iç hesaplama muamelesi yapıyor. İnsan zihnini bir bilgi işleme sistemi olarak gören hesaplayıcı zihin kuramı şu anda yapay zeka çalışmalarının eninde sonunda zafere ulaşacağı vaadine kuramsal açıdan kefil oluyor. Burada açıkça ifade etmekte fayda var: Zihin ile bilgisayarı denk görmek bilim sel değil, felsefi bir tutumdur.
Tahmin Çılgınlığı Stuart Russell'ın da belirttiği gibi, yapay zeka arayışına çık mışken 'insan dehasına' karşı bahse girmemek gerekir.2 Fa kat sağlam bilimsel temellere dayanmayan, umut veya kor ku verici tahminlerde bulunmamak da lazımdır. Uzmanlar, hatta -özellikle- bilim insanları, tahminlerde bulunmayı severler ama tahminlerinin çoğu tutmaz. Dan Gardner, Future Babble [Geleceğe Dair Boş Laflar] başlıklı mükemmel kitabında, tarihten j eopolitiğe ve bilime varasıya Stuart Russell, Human Compatible: Artificial Intelligence and tin Problem of Control, New York: Viking, 20 1 9, s. 8. 97
YAPAY ZEKA M iTi
çeşidi alanlarda yapılan tahminlerin tutma oranlarını belge liyor. 3 Gardner'ın bulgularına göre, kuramcılar, yani savun dukları kuramdan harekede büyük gelecek hayalleri olan uz manlar, dünyayı genellikle tek bir kurama sığdırılamayacak kadar karmaşık bir yer olarak gören pragmatik düşünürlere kıyasla daha kötü tahminlerde bulunmaya meyilliler. Gardner kitabında kuramcı uzmanlar ile pragmatik uz manları, kirpiler ile tilkilere benzetiyor. (Bu terimleri psi kolog Philip Tedock'tan ödünç almış. Tetlock ise Isaiah Berlin'den ödünç almış. ) Nasıl ki bir kirpi yerde bir çukur kazıp içine giriyorsa kirpi uzmanlar da bir fikrin içine öyle gömülüyorlar ve kaçınılmaz olarak bu fikrin her şeyin özü nü yakaladığına inanıyorlar. Bu inançları da onlara fikirle rini yaymak için ihtiyaç duydukları gücü veriyor. Örneğin Marx, yorulmak bilmez bir kirpiydi. Tilki uzmanlarsa dünya işlerinin ne denli karmaşık ol duğunu, evdeki hesabın çarşıya uymayacağını görüp ya cüretkar tahminlerde bulunmaktan tamamen kaçınıyorlar ya da ayakları yere sağlam basan -veya bazen daha akıllıca bir tahminde bulunarak işlerin bizim düşündüğümüz gibi gitmeyeceğini öngörüyorlar. Tilkinin gözünde tahminde bu lunma işi çoğu zaman cahil cesaretinden başka bir şey değil çünkü dış siyaset, iç siyaset (örneğin seçimi kimin kazanaca ğı), bilim ve teknolojinin karmaşık dinamiklerinin bir araya gelmesinin nelere yol açacağını bilemiyoruz. 1 9 . yüzyılın ro mancılarından Lev Tolstoy'un uyarısı burada cuk oturuyor: "Savaşın gidişatı savaş planlarına sığmaz. " Bazı yapay zeka uzmanları da tilki olmalarıyla ün salmış lardır. Örneğin Profesör Yoshua Bengio'yu ele alalım. Ben gio Kanada'daki Montreal Üniversitesi'nde bilgisayar bilim cidir. Dahası, derin öğrenme çalışmalarının öncülerinden biridir. İnsan seviyesinde yapay zekanın ne zaman geleceği .ı
Dan Gardner, Future Babble: Why Expert Predictions Are Next ta Worthless, and You Can Do Better, New York: Dutton, 201 1 .
BASiTLEŞTiRMELER VE GiZEMLER
so rusuna şu yanıtı veriyor: " Bu sorunun yanıtını vermemi be nden beklemeyin. Böyle bir tarihi tahmin etmemiz müm kün değil, hiçbir fikrimiz yok. Tek diyebileceğim, birkaç yıl içinde olmayacağıdır. " 4 Ray Kurzweil ise bu alandaki kirpi uzmanlardan biridir. Kurzweil, insan seviyesinde yapay zekaya 2029 yılında ula şılacağı tahmininde bulunuyor ve bu tahminini bilimsel gö rünsün diye Verimin ivmelenmesi 'Yasasına' dayandırıyor. Eldeki kanıtların kendi öngördüğü tarihi desteklediğini ileri sürüyor ve sonunda haklı çıkacağını savunuyor.5 Felsefecilerse bu alanlarda çalışanların aksine belli bir fikre kendilerini fazla kaptırmadıklarından olsa gerek, so runları daha berrak biçimde ve ince eleyip sık dokuyarak ele alabiliyorlar. Örneğin artık klasikleşmiş After Virtue [Er dem Peşinde] adlı eserinde felsefeci Alasdair Maclntyre dün yanın tahmin edilemezliğinin dört temel kaynağı olduğunu ifade ediyordu. Özellikle de 'radikal kavramsal inovasyon' tartışmasında, doğrudan insan düzeyinde yapay zekanın ne zaman geleceğine dair sorularla ilgileniyordu. Onun söyle dikleri, 20. yüzyıl bilim felsefecisi Kari Popper'in icatların tahmin edilemezliği savını bize hatırlatıyor: Diyelim ki Eski Taş Çağı'ndayız ve bir an geldi sizinle ge leceği tartışıyoruz. Ben önümüzdeki 1 0 yıl içinde tekerleğin icat edileceği tahmininde bulunuyorum. Bana "Tekerlek mi, o da ne ? " diye soruyorsunuz. Bunun üzerine üşenmeyip bir kasnağın, tekerlek parmağının, tekerlek göbeğinin, hatta belki de bir dingilin ne olduğunu ilk kez anlatmak için kaba sözdağarcığımızdaki en uygun sözcükleri seçip tekerleği güçbela da olsa size tarif ediyorum. Sonra bir anda donaka lıyorum: "Artık kimse gelecekte tekerleği icat edemeyecek çünkü ben az önce icat ettim bile! " Yani tekerleğin icadı 4 5
Martin Ford, Architects of Intel/igence: The Truth about AI (rom the People Building It, Birmingham, UK: Packt Publishing, 20 1 8 , s. 20. Ray Kurzweil, The Singularity is Near: When Humans Transcend Biology, New York: Penguin Group, 2005, s. 25.
99
YAPAY ZEKA MiTi
tahmin edilemez. Bir icadın olmazsa olmazı, onun ne oldu ğunu söyleyebilmektir. Tekerleğin ne old uğunu söyleyebil mek, onu icat etmek demektir. Bu örneğin nasıl genellene bileceğini görmek kolay. Kökten yeni bir kavramın ayrın tılı tarifini içeren tüm icatlar, tüm keşifler, özünde tahmin edilemezdir çünkü tahminin olmazsa olmazı, gelecekte icat edilecek veya keşfedilecek kavramın ta kendisini bugünden tarif etmektir. Radikal kavramsal inovasyonu tahmin etme fikrinin kendisi kavramsal olarak tutarsızdır. 6
Başka bir deyişle, genel yapay zekaya giden 'yolda' oldu ğumuz ve onun gelişini önceden tahmin edilebileceğimiz id diası, bu iş için kavramsal inovasyona ihtiyacımızın olmadı ğını varsayıyor ki yapay zekanın eninde sonunda geleceğine kani olmuş Ray Kurzweil gibi tahminde bulunmaya meraklı yapay zeka uzmanları bile bu görüşe razı gelmezler. En azın dan herhangi bir varsayımsal yapay genel zeka sisteminin doğal dili anlama kabiliyeti edinebilmesi için ona sağduyu kazandıracak genelleştirici bir bileşenin icat edilmesi ya da keşfedilmesi gerektiğini biliyoruz. Bu tam bir 'radikal kav ramsal inovasyon' örneği; çünkü ne olduğunu, hatta neye benzeyeceğini bile bilmiyoruz. Yapay zekanın gelişinin önceden tahmin edilebileceği ar gümanı gizlice araya bir başka öncül sıkıştırıyor. Gerçi bu öncül çeşitli ölçülerde ikrar ediliyor: Örneğin oyun oynama gibi dar yapay zeka sistemlerinin başarısının ölçeklenerek genel zeka.yaya ulaşılabileceği, böylece dar yapay zekadan genel yapay zekaya giden nispeten güvenli bir tahmin hattı oluşturulabileceği varsayımına başvuruluyor. Fakat bu kötü bir varsayım. Kötü, çünkü hem dar kapsamlı çalışmaları yapay genel zekaya doğru açılmaya teşvik ediyor hem de tahmin savının mantığı başlı başına sorunlu. Belki de bilimsel keşiflerle ilgili öngörüleri mitoloj iden 6
1 00
Alasdair Maclntyre, After Virtue, Notre Dame, iN: University of Notre Dame Press, 2007, s. 1 1 1 .
BASiTLEŞTiRMELER VE GiZEMLER
saymak en iyisi. işin aslı, yapay zekanın gelişini tarih vere rek kesinleştirmek ancak mitler aleminde mümkün; böyle bir girişim ancak o alemde Popper, Maclntyre ve diğerleri nin kuşkularından kurtulabiliyor. Yine de haksızlık etmeyelim: Yapay zeka mitolojisinin hepten kötü olduğunu söyleyemeyiz. Bu mitoloji yaşam ve zeka yaratmaya yönelik iptidai duygumuzu diri tutuyor, bize kendimize açılan pencereler sunuyor. Ama bilim ve ke sinlik kisvesine büründüğü anda kamuoyunun kafasını ka rıştırmaktan ve yapay zekanın önünde büyük kuramsal en geller bulunduğunu bilip mitolojilere itibar etmeyen araştır macıları yıpratmaktan başka bir işe yaramıyor. Bengio'nun deyişiyle, bu konuda en ufak bir fikrimiz bile yok. Tüm ka nıtlar da bunu göstermesine rağmen bu sonucu katlanılmaz ölçüde bunaltıcı ve kötümser bulan mitoloji düşkünleri bu gerçeği bir türlü kabul etmek istemiyorlar. Gerçi engeller hep aşılamaz kalacak diye bir şey de yok, hatta aşılamaz olsalar bile, biz belli sınırların olduğunu ka bul etmek zorunda kalsak bile, hedefimize ulaşmanın başka yollarını aramakta pekala özgürüz ya da bu sınırları tümden yeni hedeflere yönelmek için bir itici güç de sayabiliriz. Nite kim bilim tarihinde keşfedilen çıkmaz sokakların ilerlemeye yol açtığı sayısız vaka var. Örneğin Werner Heisenberg ku antum fiziğinin doğurduğu çeşitli sorunları çözmeye çalışır ken belirsizlik ilkesini keşfetti. Bu ilkeye göre bir atomaltı parçacığın hem konumunu hem de hızını aynı anda belir lemek mümküm değildi. Bu da atomaltı parçacıkların sevi yesine indiğimizde tahmin becerimizin daima sınırlı olacağı anlamına geliyordu. Çünkü bir atomaltı parçacığını 'gör mek' demek, onu bir fotonla çarpıştırmak demekti ve bu da parçacığın hareket ettiği rotadan sapmasını kaçınılmaz hale getiriyordu. Belirsizlik ilkesi temel bir sınırlama olsa da kuantum mekaniğini anlamada bize çok değerli bir anahtar sundu. Nitekim belirsizliğin doğasını anlamasaydık bugün kuantum bilgisayarlar inşa etmeyi hayal dahi edemezdik. IOI
YAPAY ZEKA MiTi
B u konuda sayısız örnek mevcuttur. 1 8 v e 1 9 . yüzyıllar da devridaim makinesi bir saplantıya dönüşmüş, en parlak ve zeki insanlar bu konuya yoğunlaşmışlardı. Fakat iş ve ter modinamik kuramları bu hayali tamamen suya düşürdüyse de bu süreçte enerji ve hareketi anlamada büyük ilerlemeler kaydedildi. Hemen basitleştirmeye ve indirgemeye başvur maktansa karmaşıklığı -ve pürüzleri- olduğu gibi kabul et mek bizi daha ileri noktalara taşıyabiliyor.
Michael Polanyi•nin Tuhaf (Ama Konuyla Bağlantıh] Savı Yapay zeka tartışmalarında değerlendirilen bir diğer ihtimal de yapay genel zekaya çoktan ulaştığımız ama bizim açımız dan tam bir karakutu olduğu için onu kağıda geçiremediği miz, yani programını yazamadığımızdır. Bu da bizi Michael Polanyi'ye getiriyor. Vaktiyle epey etkili bir isimken bugün büyük oranda unutulmuş kimyacı ve felsefeci Michael Polanyi, 20. yüzyı lın ortalarında, kullandığımız yazılı simgelerle -ki bu dilsel simgelere 'deyiş' adını veriyordu- zekayı ancak kısmen ifa de edebileceğimiz ileri sürmüştü. Yapay zeka sistemlerinin, mimarlarının başına bugün ördüğü çorapların birçoğunu Polanyi ta o zamandan öngörmüştü. Hatta sonraki ça lışmalarında deyişlerin daima birtakım eksiklikler barın dırdığını gerekçe göstererek makinelerin zekasının insan zekasına ulaşmasının asla mümkün olmadığını ilan etmişti. Polanyi, zekanın 'söz veya yazıyla ifade edilemeyen' örtük bileşenlerinin bulunduğunu ve deyişlerin bunları barındırma yacağını savunuyordu; yani düşüncenin simgeler aracılığıyla tam olarak betimlenemeyecek bazı veçheleri vardı. 7 (İnşa
7
102
Bkz. Michael Polanyi, Personal Knowledge: Towards a Post- Critical Philo sophy, Abingdon-on-Thames: UK: Routledge & Kegan Paul, 1 962 ( 1 9 5 8 ] , 5. Bölüm.
BASiTLEŞTiRMELER VE GiZEMLER
ettiğimiz bir sinir ağı da bir simgeler sistemidir. ) Bu durum örneğin yemek pişirmek gibi bazı becerilerin ve ustalıkların, yemek tariflerini okuyarak neden kazanılamayacağına da bir açıklık getiriyordu. Bizim bir şeyi yapabilmemiz onu maki neye programlayabileceğimiz anlamına gelmiyordu. ( Örneğin James Joyce'un Ulysses'i seviyesinde bir roman yazacak bir bilgisayar programı yazmaya çalıştığımızı düşünelim. Bu an lamsız bir çaba olurdu. Bunun yerine oturup romanı doğru dan biz yazardık, o da elbette James Joyce isek ! ) Polanyi yapay zeka araştırmaları alanında olumsuz gö rüş belirtmenin talihsizlik sayılabileceği bir dönemde yaz mıştı bütün bunları. Çünkü 1 95 0'lerde yapay zeka araştır maları büyük bir tantanayla ilk kez önemli bir atılım yap mıştı. Yine de onun söz ve yazıyla ifade edilemeyen örtük bilgiler anlayışını daha sonraları Hubert Dreyfus devrala caktı. Dreyfus'un yapay zeka araştırmalarını hedef alan sal dırısından önceki sayfalarda söz etmiştik. Belki bazen fazla yanlı bir dil kullandığından olsa gerek, Dreyfus'un savı, yıl dırımları üzerine çeken bir paratoner misali, karşı savların yağmuru altında boğulmuş, en azından başlarda yapay zeka üzerinde çalışan ana akım düşünürler tarafından kabul gör memişti. (Maalesef Dreyfus bir yapay zeka sisteminin asla bir satranç şampiyonunu yenemeyeceğini de iddia etmiştir. )8 Yine de bildiğimiz her şeyin kağıda geçirilememe olasılığı yapay zekanın önündeki kalıcı sorunlardan birini teşkil edi yor ve yapay zeka programcılarının çemberi kareye dönüş türmeye çalıştıklarını gösteriyor. Programcılar bizim zihni mizde bulunan bir şeylerden yoksun, kapsamı son derece sınırlı -veya dar kapsamlı verileri çözümleyecek- program lar yazıyorlar. Polanyi'nin fikirleri, insan zihni ile makine arasında temel birtakım farklar olduğunu ve zihni makiney le eş tutmanın zihne dair fikirlerin basitleştirilmesine, indir8
Hubert Dreyfus, What Computers Stili Cant Do: A Critique of Artificial Reason, Cambridge, MA: MiT Press, 1 992. 1 03
YAPAY ZEKl MiTi
genmesine yol açacağını işaret ediyor. Eğer zihnin -veya en azından genelleşmiş zekanın- bilgisayar programı haline ge tirilip yazıya dökülebilecek bir şey olarak değerlendirilme si gerekiyorsa bugünkü tartışmaların çoğunu anlamak için 'zihni' de basitleştirmek zorunda kalırız.
Tilkilerin Donüşü 2000'li yıllarında başında yapay zeka alanında çalışan her kes tilkiydi. Alan yıllar süren uzun kışlarından birini yaşı yordu ve yapay zeka mitolojisine düşkün olanların çoğu kış uykusundaydı. Gerçi Ray Kurzweil yine kendinden emin bir şekilde yapay zekayla ilgili vizyonunu aktarmaya devam ediyor, Doug Lenat gibi klasik yapay zeka kuramcıları ise gözde kuramlarının izinde yapay zekayı bize verecek Roset ta Taşı'nı arıyorlardı. Fakat sonu gelmez görünen patlama/ sönme döngüleri, alanı epey bitkin düşürmüştü; hatta çoğu araştırmacı, çalışmalarında yapay zeka sözcüğünü kullan maktan bile imtina ediyordu. Yapay zeka sözcüğü kötü bir pazarlama terimi haline gelmişti. ( Bugün şaşırtıcı görünse de o günlerde durum gerçekten böyleydi . ) Konuyla ilgili her konuşma süratle 'destek vektör makineleri' ve 'maksimum entropi' gibi adı belli kendi gizemli birtakım algoritmalara geliyordu. Bu algoritmaların her ikisi de makine öğrenimi yaklaşımıydı. Klasik yapay zeka bilimcileri bunları 'sığ' ve 'empirik' bularak ellerinin tersiyle bir kenara itiyorlardı çünkü veri kullanan istatistiksel yaklaşımlar bilgi kullanmı yordu, akıl yürütme ve planlama işinde iyi değillerdi (o da yapabilirlerse ) . Çok ihtiyaç duyulan veriyi web sağlayınca bu yaklaşımlar da umut vaat etmeye başladı. Derin öğrenme 'devrimi' 2006 yılında Geoffrey Hinton, Yann LeCun ve Yoshua Bengio'nun öncü çalışmalarıyla başladı. 20 1 0 yılında Google, Microsoft ve diğer büyük tek noloj i şirketleri ses tanıma gibi büyük tüketici uygulamaları
BASiTLEŞTiRMELER VE GiZEMLER
için sinir ağlarını kullanmaya başlamışlardı. 2 0 1 2 yılında Android model akıllı telefonlar da sinir ağı teknolojisine sah ip olmuştu. Yaklaşık olarak bu dönemden 2020 yılına -yani bu satırları yazdığımı zamana- dek, derin öğrenme ya klaşımı yapay zeka çalışmaları alanındaki her sorunun bir çivi gibi görülmesine neden olan bir çekiç muamaelesi gördü. Nitekim oyun oynama, ses ve görüntü tanıma gibi 'ta bandan tavana' yaklaşılabilen sorunlar bugün yapay zeka alanında en fazla araştırılan ve ticari gözle bakılıp para akı tılan konular haline geldi. Derin öğrenme yaklaşımı kalkışa geçerken yapay zeka çalışmaları -ve yapay zeka hakkında konuşmalar da- aldı başını gitti. Kirpiler geri döndü. Tahmin edilebileceği üzere, medya bu gelecekçi, taze görüşleri körükledi. Fakat yapay zeka alanında son zamanlarda tuhaf bir şeyler oluyor. Bunu 20 1 8 ve 2 0 1 9 yıllarında yapay zeka hakkındaki konuşmala rın daha kuşkucu bir tona sahip olduğuna tanık olunca fark ettim. Görünüşe göre tilkiler de geri dönüyor. Yapay zeka mitolojisine düşkün Elon Musk, müteveffa astrofizikçi Stephen Hawking, hatta Bili Gates gibi birçok tanınmış isim aslında bu alanda uzman değil (elbette bunun önemli istisnaları da var ) . Yine de bu isimler yapay zeka -veya daha ziyade derin öğrenme- balonunu şişirdikçe şişir diler ve bu süreç birkaç yıl önce (20 1 5 yılın civarında ) zirve noktasına ulaştı. Fakat şimdilerde bu balon sönmeye başladı ve insanlar yapay zekanın kısıtlamaları ve sınırları hakkın da gitgide daha fazla konuşuyorlar. Örneğin bilişsel bilimci ve Robust. A. I. robotik şirketinin kurucusu Gary Marcus ile bilgisayar bilimci Ernest Davis, birlikte kaleme aldıkları
Rebooting AI: Building Artificial Intelligence We Can Trust [Yapay Zekayı Yeniden Başlatmak: Güvenebileceğimiz Ya pay Zekayı inşa Etmek] başlıklı kitaplarında ikna edici bir sav öne sürüyorlar: Alanın tekrar fazla abartıldığını, derin öğrenmenin sınırları olduğunu, genelleşmiş zeka sahibi bir yapay zekaya ulaşmak için bazı temel sorunlarda ilerleme-
YAPAY ZEKA MiTi
lerin kaydedilmesi gerektiğini söylüyorlar.9 201 7'de yapay zeka bilimci Hector Levesque modern yapay zeka çalışma larıyla ilgili tartışmalara katkı sunan bir tartışma başlattı. Bu tartışmayı barındıran kitabının adı Common Sense, the Turing Test, and the Quest for Real AI'dı [Sağduyu, Turing Testi ve Gerçek Yapay Zeka Arayışı] . 1 0 20 1 5 yılında The Atlantic dergisinde " Questioning the Hype about Artificial lntelligence " [Yapay Zekayla Ilgili Abartılar] başlıklı yazım yayımlandığında genellikle olumsuz tepkiler almıştım. 1 1 Bu günlerdeyse benim gibi eleştirmenlerin sayısı arttı. Araların da yapay zeka alanının saygın öncüleri de var ve bu abartıyı sorguluyorlar. Gerçek yapay zekayı inşa etmenin olanaksız olduğunu savunan makul savlara hala nadiren denk geliyoruz. Bunun nedeni de insanların yapay zeka araştırmalarının geleceği hakkında tahminde bulunmaktan kaçınmasıyla aynı: Yapay zekanın geleceği belirsiz. Kültürel ve psikolojik açıdan bu alan biraz kendine hakim olmaya başlamış gibi görünüyor. Nitekim alana yeni girenler ve kamuoyu, yapay genel zekaya giden yolun çok uzun olacağı konusunda artık baştan uya rılıyor. Bu trend çok büyük bir öneme sahip çünkü bu mit duygulara hitap eden bir deniz feneri gibi; yapay zekayla il gili tartışmalara onun ışığında rota çiziyoruz. Üstelik tartış malar son derece geniş kapsamlı; bilinç, öfke veya sevgi gibi duygular, cinsellik gibi içgüdüler veya zihne ve canlılara dair diğer unsurlar gibi neredeyse her şeyi içine alıyor. Fakat yeni 'bilim' söylemi, az çok dar yapay zekanın daha da genelleş mesinin olanağı üzerine bir anlatı ve bu anlatıda büyük res min bir parçası olan bilinç gibi olgular dışarıda bırakılıyor. Yahut akıllıca kaçıyor denebilir; insanlar bu mit var olduğu
•
10 11
106
Gary Marcus ve Ernest Davis, Rebooting AI: Building Artificial Intelligence We Can Trust, New York: Pantheon Books, 2 0 1 9 . Hector Levesque, Common Sense, the Turing Test, and the Quest for Real AI, Cambridge, MA: MiT Press, 201 7. Erik J. Larson, " Questioning the Hype About Artificial Intelligence, " The At/antic, 14 Mayıs 201 5 .
BASiTLEŞTiRMELER VE GiZEMLER
için yapay zekayı umursuyor. Aksi halde her yerde denk gel diğimiz teknolojinin bir başka güçlü hali sayılır ki bu tren din de iki ucu kesin kılıç olduğunu şimdiden görüyoruz.
Süperzekinın Basitleştirilmesi Basitleştirilmiş bilişim dünyamızı kurmamıza yaramış zeka hataları da modern kıyafetlere bürünmüş halde tekrar karşı mıza çıkıyor. Yapay zekaya giriş niteliğinde ders kitapların dan birini Google'dan Peter Norvig'le beraber yazan Stuart Russell, 20 1 9 tarihli Human Compatible: Artificial Intelli gence and the Problem of Control [İnsanlıkla Uyumludur: Yapay Zeka ve Denetim Sorunu] adlı kitabında zekanın he defe ulaşmaktan başka bir şey olmadığını savunuyor ki bu ta nım insanların yanı sıra yunusları, karıncaları, koli basilini ve bilgisayarları da kapsıyor. 12 Ayrıca Turing Testi'nin de artık alanın gerçekleriyle bağlantısı kalmadığı gerekçesiyle emek liye ayrılması gerektiğini savunuyor. (Belli ki sıradan sohbet yürütebilmek onun gözünde önemli bir hedef değil. ) Şöyle yazıyor Russel: Turing Testi'nin yapay zekaya bir faydası yok çünkü tanımı son derece gevşek ve başka şeylere bağlı: Her şeyden önce insan zihninin muazzam karmaşık ve genelde bilinmeyen niteliklerine bağlı ki bu nitelikler köklerini hem biyoloj iden hem de kültürden alıyor. Bu tanımı açmanın ve buradan hareketle bu testi geçtiği kanıtlanabilecek makineler yarat manın bir yolu yok. Yapay zeka bunun yerine rasyonel dav ranışa odaklanmalı [ve dolayısıyla] bir makine, algıladığı şeye bağlı olarak hedefine ulaşma ihtimali ölçüsünde zeki sayılmalıdır. 1 3
12 13
Stuart Russell, Human Compatible: Artificial Intelligence and the Problem of Control, New York: Viking, 20 1 9, s. 9. Stuart Russell, age., s. 4 1 . 107
YAPAY ZEKA MiTi
Russell'ın zeka tanımına itiraz etmek epey güç çünkü bu tanım Einstein'ın fiziği görelilik temelinde yeniden tasarladı ğında kendi 'hedefine' 'ulaşmasından' tutun da bir ayçiçeğinin yüzünü güneşe çevirmesine varasıya her şeyi kapsıyor. Buna karşılık, Russell'ın Turing Testi'ni bir kenara atması aşırı ku ralcı ve kısıtlayıcı bir tutum çünkü bu test esasında doğal dili anlayıp kullanabilen makineleri zeki sayabileceğimizi ifade ediyor. (Pratik açıdan baktığımızdaysa, Siri veya sanal diğer kişisel asistanlar eğer söylediklerimizi hiç anlayamayacaklar sa onlardan fazla bir şey beklemememiz gerekir. Bu yüzden bu testin bir kenara atılması bana makul bir tutum gibi gelmi yor. Eğer Siri'nin gelecekteki sürümleri kullanıcıyla sıradan, ucu açık bir sohbet yürütebilecek kadar ilerleyecek olursa o zaman da Turing Testi, 'yapay zeka düşü'nün en sonunda gerçekleşmesi olarak geri dönüşecek. İşin yoksa bekle! ) Saygın bir yapay zeka uzmanı ve Berkeley'deki Kali forniya Üniversitesi'nde bilgisayar bilimleri profesörü olan Russell, böyle yapmakla bir yandan da bilinç sorunundan kurtulmuş oluyor: " Bilinç alanına dair gerçekten bir şey bil miyoruz, o yüzden bu konuda bir şey söylemeyeceğim" di yor. Ardından bizi teskin ediyor: " Yapay zeka alanında hiç kimse makinelere bilinç kazandırmaya çalışmıyor ve zaten kimse bu işe nereden başlayacağını dahi bilmiyor. Kaldı ki hiçbir davranış bilinci şart koşmuyor. " Ama her halükarda Russell bilinç hakkında bir şey (çok şey) söylüyor: Diyelim ki size bir program verip "Bu, insanlığa tehdit ol uştu ruyor mu ? " diye sordum. Kodu inceliyorsunuz ve nasıl ki bir satranç programı çalıştırılınca karşısındaki insanı yenecek bir plan oluşturup uygulayacaksa elinizdeki program kodunun da çal ış tırı ldığında insan türünün yıkımıyla sonuçlanacak bir plan geliştirip uygulayacağını görüyorsunuz. Şimdi diyelim ki bu kodu çalıştırdığınızda bir makine bilinci ürettiğini de söylüyorum. Bu durumda öngörünüz değişir mi ? Elbette , ha yır. Bu yeni bilgi hiçbir şeyi değiştirmiyor. D avran ışına dair öngörünüz aynı kalır çünkü koda dayalı olacak. Makinelerin ro8
BASiTLEŞTİRMELER VE GiZEMLER
gizemli biçimde bilinç kazanıp insanlardan nefret ettiğini an latan tüm o Hollywood senaryoları meseleyi gerçekten anla mıyor: Önemli olan bilinç değil, kifayet. 14
Fakat belki de meseleyi anlamayan Russell'dır. Çünkü yapay zekanın geleceğiyle ilgili düşlerimizi diri tutan aslın da makinelerin bir gün 'canlanacağı' mitidir. Ex Machina filmini izlemeye gelenlere, yapay zekacıların asıl hayalinin bizi hedeflerimize -ve düşmanlarımızı da hedeflerine- ulaş tıracak, zihni olmayan, 'içinde ışık yanmayan' süperbilgisa yarlar üretmek olduğunu söyleseydik herhalde biraz hayal kırıklığına uğrarlardı. Russell genel zekaya yönelik henüz bilinmeyen modüllerle donanmış bir algoritma sisteminin yapay zeka çalışmalarında nihai başarı anlamına geleceğini düşünüyor gibi. Gerçek kirpiler, temkinli tilkilerin anlama dığını anlıyor: Yapay zeka, bilimle mitolojinin sırtına bin miş gidiyor, yaygın ve dirençli yapay zeka hayranlığı bunun psikolojik ve kültürel bir mihenk olduğunu gösteriyor. Ray Kurzweil bunların hepsinin yanı sıra bilincin maki nelerde gani gani bulunacağını ve bizimkinden daha zengin ve 'daha iyi' olacağını da savunuyordu. 1 9 99'da yazdığı ve bu mitin zafer türküsü niteliğindeki kitabının adı da bu işe uygundu: The Age of Spiritual Machines [Maneviyatlı Ma kinelerin Çağı] . Kitapta süperzeki bilgisayarların bilincinin ve manevi deneyimlerinin olacağını savunuyordu. Kurzweil makul bir tavırla Turing Testi'nin yapay zekaya uygun de ğerlendirme ölçütünü sunduğunu kabul ediyordu: "Testi ge çebilmek için zeki olmanız gerek" diyordu. Hatta Kurzweil yapay genel zekayı belirtmek için yaygın kullanılan 'YGZ' kısaltmasından da hoşlanmıyor; çünkü -doğru şekilde- be lirttiği üzere " Yapay zekanın amacı daima daha yüksek bir zekaya erişmek ve en sonunda insan seviyesinde zekaya ulaşmak olagelmiştir. " 1 5 1 4 Stuart Russell, age. , 1 6 - 1 7. 1' Martin Ford, Architects of Intelligence: The Truth about AI (rom the People Building It, Birmingham, UK: Packt Publishing, 20 1 8, s. 232, 234
1 09
YAPAY ZEKA MiTi
Cinsel arzu bile yapay zeka için turnusol kağıdı görevi görebilir, hele ki hayatta her an olduğu gibi temel hedefleri gerçekleştirmeye yönelik çaba ve arzuda esas unsur olarak karşımıza çıkıyorsa. Ex Machina bu açıdan pratikte Shakes peareci bir eser; cinsel gerilimi, bilinci, sömürüyü ve bir tür özgürleşmeyi Turing Testi'nde bir araya getiriyor. Romancı lıktan yönetmenliğe geçmiş Alex Garland, filminde tekillik kavramını süperzeki bir androidin, çatlak bir bilim adamının (ki epey verimli bir tema olagelmiştir), yani onun münzevi mucidi Nathan'ın ( Oscar Isaac canlandırıyor) esaretinden kurtuluşunu tezgahlama hikayesi üzerinden ele alıyor. Film de Ava'nın görünürdeki hedefi Nathan'ın misafiri Caleb Smith'le ( Domhnall Gleeson canlandırıyor) tamamen 'insan' gibi etkileşimde bulunarak onu insan olduğuna bir şekilde ikna edip Turing Testi'ni geçmek. Gerçi Caleb'a duruma dair bilgi veriliyor ve Caleb, Ava'nın bir android olduğunu göre biliyor. Nathan, bunun nihai test olduğunu söylüyor. Fakat Ava'nın başka planları var ( bizim hedeflerimizin canı cehenneme ! ) : Nathan'ın araştırma tesisinin dışında ki yabani dünyaya kaçmayı planlıyor. Kaçarken iki insan ölüyor (yahut ölecek) . Dışarı adımını atar atmaz muhteşem canlılıkları içinde binbir rengi görüyor: Bu da izleyiciye Ava'nın gerçekten 'canlı' ve bilinçli olduğunun kanıtı olarak sunuluyor. 1 6 Ava'nın İngilizceyi çok iyi anladığını ve etkili biçimde kullandığını da görüyoruz, hatta o kadar iyi kul lanıyor ki iki adamı çaresizliğe ve kafa karışıklığına sürük16
I IO
Ava'nın Nathan'ın yerleşkesinden kaçtığı, dışarıdaki renkleri ilk kez gördüğü sahne, yapay zeka ve zihin felsefesi çevrelerinde 'renk bilimci Mary' diye bilinen bir düşünce deneyine atıfta bulunuyor. Mary adlı hayali bir renk bilimcimiz olduğunu varsayalım. Mary renklerle ilgili bilinebilecek her şeyi ( beyinde nöronlara çarpan ışığın dalga boyuna kadar) biliyor diyelim. Fakat hayatının o güne kadarki kısmını başka hiçbir rengin bulunmadığı siyah-beyaz bir odada geçirmiş olsun. Burada yanıt bekleyen soru şu: Mary dışarı çıkıp renkleri ilk kez gördüğünde yeni bir şey öğrenir mi? Başka bir deyişle, renkleri görme deneyimi, onun renklerle ilgili bilgisine yeni bir şey katar mı? Garland en azından Ava'nın yeni bir şey öğrendiğini öne sürüyor. Bu onun muhtemelen bilinç sahibi olduğunu da kanıtlıyor.
BASiTLEŞTiRM ELER VE GiZEMLER
leyip yenilgiye mahkum ediyor. Burada yapay zeka mitinin eksiksiz biçimde betimlendiğini görüyoruz; bu mitin gelece ğe dair temel bakışını açık ediyor ve makinelerin insanlara tamamen baskın çıkacağı o yaklaşan dönüm noktasını bize sunuyor. Ava insanlara kıyasla daha canlı, daha akıllı, daha sinsi, daha maneviyatlı. Garland'ın vizyonu katıksız bir mitoloji; dahası büyük bir insan hikayesi, geleceğin teknolojisinin merceğinden ar ketip izlekleri ( özgürleşme, iyi ve kötü, cinsellik) yakalıyor. Burası ironik çünkü Ex Machina da 2 001 : Bir Uzay Destanı filmi gibi başyapıtlarda gördüğümüz üzere, başarıyı en derin insani duygulara dokunarak yakalıyor. Bazı insanların daha 'bilimsel' tartışmaları yeğleyerek, yapay zeka çalışmaları alanını sevinç veya korku üreten mitlerden uzaklaştırmaları da ironiktir. Bir başka deyişle tekillik, bilinç ve zeka gibi duygularla dolu kavramları göz ardı ederken, bir yandan halkın zihninde varolmayı sürdü ren bu kavramlardan faydalanmaya da devam ediyorlar. Örneğin Russell'ın, yapay genel zeka hakkındaki ciddi ça lışmaları, Ex Machina gibi filmlerde ve popüler kültürde betimlenişinden ayırmak istediği apaçık ortada . Bilinci saç ma bir felsefi kaygı gibi görüyor (zaten kimse ne olduğunu bilmiyor) , Turing Testi'ni her türlü hileye açık, köhnemiş bir fikir addediyor ve makinelerin saldırganlaşacağına (veya cüretkarlaşacağına ya da başka türlü duygusallaşacağına) dair kaygıları yersiz buluyor. Süperzeki bilgisayarların sa dece kendi hedeflerini kovalayacağını düşünüyor. Sorun şu ki makinelerin hedefleri bizim hedeflerimizle aynı olmayabi lir ( bunun insan varlığına yönelik bir tehdit olması için illa Terminatör'e ihtiyaç yok) . Russell da yapay zeka araştırmalarında temel soru nun daha şimdiden bu olduğunu kabul ediyor. Özellikle web'deki içerik seçim algoritmalarını buna örnek gösteri yor. Bu algoritmaların amacı herkesi ilgi alanlarına göre kesintisiz bir reklam bombardımanına tutup azami ölçüde 111
YAPAY ZEKA
MiTi
reklam geliri elde etmek. Süperzeki bir yapay zeka bizim amaçlarımızın peşinde koşmak için belki de fazla nitelikli olacaktır. Kral Midas'ın öyküsü bu sorunu gayet güzel anla tıyor aslında: Kral Midas dokunduğu her şeyi altına çevirme gücü kazanmış. Bunu o kadar kolay yapabiliyormuş ki ken di kızını altına çevirmesi için ona hafifçe dokunması yetmiş. ( Oysa 'hedefi' bu değilmiş.) Buna benzer biçimde, hedef be lirlediğimiz bir süperzekanın hedefine ulaşırken bizi kolay lıkla yok etmesi pekala mümkün, hatta hedefine giden yolda her yolu mübah sayıp insan vücudundaki karbon atomlarını kendi kullanacağı bir hammadde kaynağına dahi çevirebilir. Bu fikir süperzekanın yapabileceklerinden korkanların değişmez kaygısıdır. Nitekim Nick Bostrom şu senaryoyu ortaya atmıştı: Bir süperzekaya ataş üretimini en üst sevi yeye çıkarmak gibi hesapta sıradan bir görev veriliyor (en azından insanların onun için belirlediği hedef bu) . Fakat yapay zeka adım adım evrendeki her şeyi, hatta bedenle rimizdeki tüm kullanılabilir elementleri bile bir ataş fabri kasına dönüştürüyor. Berkeley'deki Makine Zekası Araş tırma Enstitüsü'nün eski yöneticisi Eliezer Yudkowsky bir keresinde şöyle bir şaka yapmıştı: " Yapay zeka sizden nefret etmez veya sizi sevmez. Siz sadece onun işini görmek için kullanabileceği atomlardan ibaretsiniz. " 1 7 Yaklaşan süperzekanın lazer hasssasiyetinde dar bir oda ğa ve verilen hedefleri gerçekleştirmede insanüstü bir yetkin liğe sahip olmasına rağmen sağduyudan eser barındırmaya cağı düşüncesi süperzeka fikrinin ta kendisine ters. Ne de olsa süperzekanın en az insan zekasına, hatta insanınkini de aşan bir zekaya sahip olması bekleniyor. Gary Marcus gibi yapay zeka bilimcileri zekayı en azından sağduyu sahibi ol mak ve mümkünse sağduyudan fazlasına sahip olmak diye anlıyorlar. Onun gibi düşünen yapay zeka bilimcileri, ataş 17
II2
Eliezer Yudkowsky, "Artificial Intelligence as a Positive and Negative Factor in Global Risk " , Global Catastrophic Risks, ed. Nick Bostrom ve Milan M. Cirkovic, New York: Oxford University Press, s. 3 08-345.
BASiTLEŞTiRMELER VE GiZEMLER
gi bi insanlarca tüketilen ürünleri en verimli şekilde imal et meye programlanmış süperzeki bir bilgisayarın, bu ürünleri kullanacak insanları yok etmemesi gerektiği fikrine de ken diliğinden varabileceğini işaret ediyorlar. Burada Russell ve diğerlerinin süperzekaya dair kaygılarına içkin tuhaf bir ba sitleştirme söz konusu: Süperzekanın, programcılarının ona verdiği hedefe körü körüne bağlı kalacak aşırı güçlü bir oto mat gibi davranacağını düşünüyorlar. Bu tutumu benimse meleri garip. Russell da bizzat sağduyu ve dili anlama kabi liyetinin yapay zekaya giden yolda henüz alınamamış önemli bir dönemeç olduğunu itiraf ediyor. Peki, bunlar süperzekaya dair resimde niye yer almıyorlar ? Geleceğin bilgisayarlarının sağduyuya sahip olması böylesi kaygıları gereksiz kılacaktır; tabii Russell'ın saçma bir mitoloji diye reddetmek için kırk takla attığı gibi saldırgan ve kötücül olmazlarsa. Her halükarda ataş kıyameti senaryoları Russell gibi bi limsel düşünceye sahip araştırmacıları gerçekten huzursuz ediyor ki böyle olasılıkların önünü kesmek için geleceğin süperzeki bilgisayarlarına belli ilkelerin işlenmesini öneri yorlar: Birincisi, bizim tercihlerimizi daima öncelikleri haline getirmeleri için onların kendi esenliklerine 'içkin değer atfet memelerini' sağlamamız gerekiyor. Fakat Russell da bizi bu noktada uyarıyor ve diyor ki bizim genellikle neyi niye tercih ettimize dair en ufak bir fikrimiz yok. Ama Kral Midas misali biz de isteklerimizi yanlış biçimlerde ifade etmeye meyilliyiz. Dolayısıyla yapay zekanın özgeci davranıp insanın esen liğini gözeteyim derken hatalar yapmasını engellemek için ona ikinci bir ilke daha işlememiz gerekiyor: tevazu. ( Ör neğin sinekten yağ çıkaracak kadar verimli olmak adına olası tüm yollara başvururken fabrika müdürünü de ataşa dönüştürmemeli. ) Özgeci mütevazı makineler, teknoloji şir ketlerinin purosu ağzından düşmeyen yöneticilerinin (gerçi artık puro içeni kalmadı) onlara sırf kar güdüsü katmaları tehlikesine karşı da bir önlem olabilir. Dahası, makinelerin istenmedik bir yönde fazla zeki olmalarına, yani bir bakırı3
YAPAY ZEKA MiTi
ma her şeyi altına çevirmeye denk işler yapmalarına da en gel olabili.r . Gerçi 'özgeci ve mütevazı' makine fikrinin Ex Machina'da anlatılan -hem gerçek zekaya (yani sadece ataş üretmekle sınırlı kalmayan) hem de etik duyarlılığa sahip 'canlı'- yapay zekayı epey andırması kafa karıştırıyor. Bü tün bunlara bakınca yapay zekayla ilgili tartışmaların son suza dek bilim ile mit arasında sıkışıp kalmaya mahkum olduğu sonucuna varmak işten bile değil. Russell'ın bir ilkesi daha var. Bu üçüncü ilke, yaklaşan süperzekanın oluşturacağı varoluş krizini önlemeye yarıyor: Yapay zeka insanların tercihlerini tahmin etmeyi öğrenecek biçimde geliştirilmeli. Makineler bizi izlemeli ki ne istediği miz hakkında daha fazla şey öğrenebilsinler ve böylece her şeyi hayava uçuracak istekleri dikkate almasınlar. İnsanların tercihlerini öğrenmek bilgisayarların hedeflerine ulaşmaya çalışırken bize zarar vermekten kaçınmalarını da sağlayacak. (Russell, bize yardım ettiği izlenimine sahip olduğu halde bizi yeryüzünden silebilecek kadar aptal olmayı başarabilen bir süperzekaya neden iyi niyetli bir 'panoptikon' muamelesi ya pıp onun tüm tercihlerimizi sürekli izleyip öğrenmesine izin vermemiz gerektiğine de bir açıklık getirmiyor. ) Russell'ın geleceğin yapay zekasının insanın varlığına tehdit oluşturduğu şeklindeki anlatısı, insanın aklına Çek oyun yazarı Karel Şapek'in evrensel robotlarını getiriyor. İş verimliliğini optimal seviyede tutmak için tasarlanmış bu robotlar güzelliği takdir edemiyorlar, ahlaki duyarlılık tan yoksunlar, duygulara sahip değiller, hissetmek ve bilinç gibi başka zihinsel nitelikleri haiz değiller. Yine de Şapek'in R.U.R. [Rossum'un Evrensel Robotları] oyununda hesapta zihinden yoksun bu robotlar nasıl oluyorsa durumlarından memnun olmadıkları için bir gün geliyor ve bir robot dev riminin kıvılcımını çakıyorlar ve bu devrim neredeyse tüm insan türünü yeryüzünden siliyor. Şapek'in 1 920'de yazdığı bu oyunu bugün elbette ürkütücü sonu nedeniyle hatırlıyo ruz. Hiç kimse bir Roomba süperzekaya sahip olursa ( ama ı ı4
BASiTLEŞTiR M ELER VE GiZEMLER
na sıl oluyorsa zihinden yoksun; neyse, şimdilik bu çelişkiye aldırmayalım) evi en iyi şekilde nasıl süpüreceğini, mutfa ğı en iyi şekilde nasıl temizleyeceğini ya da arabayı en iyi şekilde nasıl tamir edeceğini öğrenecek diye heyecanlanmı yor. Elbette bütün bu beceriler de çok işimize yarardı ama süperzekadan bahsederken bunları kast etmiyoruz. Bizi Ava heyecanlandırıyor. Bilinçsiz, hissiz, öfkeden gözü döneme yen bir süperzeka gözümüzde zeki bile değil. Bir de sağdu yudan yoksun olursa mitolojik imgelemimizi beslemeye bile yetmiyor. Altı üstü havalı bir hesap makinesi oluyor bu. Russell insan ve makine zekasını bir araya getirmek sure tiyle özü itibarıyla hedefleri optimize etme yarışına dönüşen bir oyun kuramı arayışıyla bize meseleye görünüşte ' bilim sel' bakma olanağı sunuyor. Fakat bunu kendi zihinsel ola naklarımıza ciddi kısıtlamalar getirerek yapıyor. Yine bu da bir yapay zeka hatası. İnsanın çeşit çeşit zekası var ve yine de son derece gizemli, hatta bildiğimiz kadarıyla bir sınırı da yok. Bugünkü yapay zeka anlayışları insan zekasını aşağı çekerek, onu bilişime, hesaplamaya daha uygun bir tanıma sığdırmaya çalışarak, zihin hakkındaki çok daha zengin bir anlayışı düpedüz deliğe süpürüyor. Bize basitleştirilmiş, in dirgenmiş bir dünya kalıyor. Bu basitleştirilmiş dünya belki yapay genel zekanın geli şiyle ilgili konuşmaları görünüşte daha makul hale getiriyor (çünkü yapay genel zeka da pek fazla değişiklik getirmiyor) ama bunu yapay zeka geliştirme tasarısına duyulan tüm ilgi yi tehlikeye atarak yapıyor. Bunun yerine pekala süperzeka kavramını ıskartaya çıkarıp son derece gerçek tehditler hak kında daha dürüst ve içten tartışmalara girebiliriz. Örneğin kötü niyetli programcıların yaydıkları ve dünya çapında yı kım yaratabilecek bilgisayar virüsleri gibi son derece somut ve gerçek olasılıklar üzerinde konuşabiliriz. Bunlar finans piyasalarını çok kısa sürede çökertebiliyor, bireylerin kişisel verilerinin gizliliğini ihlal edebiliyor veya ülkelerin güvenliği için önem taşıyan verileri çalabiliyor, tahrif veya yok edebi1 15
YAPAY ZEKA MiTi
liyor. Bu bilişim türünün verimini güvenlik açıkları artırı yor. Üstelik bu mit de değil, düpedüz gerçek dünya.
Özet Yapay zeka karşısında sergilenen tutumları ve bu tutum ları sergileyenleri şöyle özetleyebiliriz: Kurzweilciler -yani yapay zeka mitolojisinin düşkünleri- ağdalı bir gizemcilikle tekillikten sonra gelecek makineleri bilinçli, duygulu, kendi amaçları olan engin zeka sahibi varlıkları olarak betimli yorlar. lronik bir şekilde bilişime Shakespearevari izlekler katarak alanda felsefi merak duygusunu diri tutmuş da olu yorlar. (Bilgisayarların zengin manevi deneyimleri olacak, sevgilileri olacak falan filan derken, bu liste uzayıp gidiyor. ) Buna Ex Machina etkisi d e diyebilirsiniz. Russellcılar ise Ex Machina etkisini filmlerle sınırlamak istiyorlar. Süperzekayı 'hedefe' ulaşma odaklı genel he saplamaların matematiğine ilişkin daha saygın fikirlere in dirgiyorlar. Fakat ne yazık ki insan zekasını da bu kısıtlı tanımlarına sığdırmaya meyilliler. Bu da insan ile makine arasındaki bariz uçurumu görünüşte kapatıp insanın ola naklarını daraltıyor. Bu itibarla Russellcılar 'dünyanın ba sitleştirilmesi' dediğim trendin bayraktarlığını yapıyorlar. Jaron Lanier'in ifadesiyle " Bir kişinin ne olduğuna ve neler olabileceğine ilişkin beklentilerini son derece düşürmüş yeni bir kuşak yetişti. " 1 8 Hem Kurzweilciler hem de Russellcılar benzer bir tekno merkezci dünyagörüşünü yayıyorlar. Bu görüş insana bakışı basitleştirip -özellikle de insan zekasını hesaplama veya bi lişime indirgeyerek- daraltıyor, buna karşılık yapay zekanın
18
rı6
Jaron Lanier, You Are Not a Gadget: A Manifesto, New York: Alfred A. Knopf, 2010, s . 4.
BASİTLEŞTi RMELER VE GiZEMLER
geleceğiyle ilgili öngörüleri sanki mit değilmiş de bilimmiş gibi sunarak teknolojiye ilişkin görüşleri genişletiyor. Bruce Wayne yerine ısrarla Yarasa Adam kostümüne odaklanmak başımıza epey bela açtı. Makinelerin olanakları nı sınırsız görüyoruz ama kendimize dair ufkumuz dar. Oysa makinelerin gelecekte zeka kazanmaları mitolojinin konusu değil, bilimsel bir sorun. Yapay zeka çalışmaları bugünkü gibi oyunların ve reklamların sahte dünyasında verimini sürekli artırmaya odaklanmaya devam ederse işin sonunda hiçbir sı nır tanımayan tehlikeli, aptal dahiler üretebilir. Şimdi yapay zeka bilimine eğileceğiz. işte basitleştirilen dünya da tam olarak bu noktada, yani bilimsel soruşturma nın ta kendisinde tekrar karmaşıklaşıp gizemini geri kazanı yor. Çünkü zeka_ hatalarını bertaraf ettiğimizde gözümüzün önüne inmiş perde de kalkıyor ve aslında epey çetin bir so runla karşı karşıya olduğumuzu fark ediyoruz.
1 17
il.
KISIM
ÇIKARIM SORUNU
8 HESAPLAMAYI BI RAK.. ÇÖZÜM LE
apay zeka araştırmaları zekayı arayıştır. Kitabın bu kıs
Ymını oluşturan bölümler boyunca sizi bu arayışın öteden
beri önemli birtakım engellerle karşı karşıya olduğuna ve bu engelleri nasıl aşabileceğimizi bilmediğimize ikna edebileceği mi umuyorum. Bunun içinse zekanın doğasını soruşturmamız gerekiyor. Böyle bir soruşturma için 'tuhaf ve acayip bir genç' olan amatör dedektif August Dupin'in hikayesinden daha iyi bir hareket noktası herhalde olamaz. Onunla ilk kez " Mor gue Sokağı Cinayeti" adlı bir öyküde tanışıyoruz. Bizi onunla tanıştıransa öykünün isimsiz anlatıcısından başkası değil.1
Suçlar1n Çözülmesi Üzerine Şu işe bakın ki meçhul anlatıcımız, Edgar Allan Poe'yla birçok ortak noktaya sahip ve henüz öykünün başlarında düşünme yöntemlerine saplantılı bir ilgi duyduğunu itiraf ediyor. Dikkatli gözlemlerin akıl yürütmeyle nasıl bir araya
1 Edgar Allan Poe, The Best of Poe: The Tell-Tale Heart, The Raven, The Cask of Amontillado, and 3 0 Others, Clayton, DE: Prestwick House, 2006. [Türk çesi: Morgue Sokağı Cinayeti, çev. Memet Fuat, Notos Kitap, 2008] I2I
YAPAY ZEKA M iTi
gelip görünüşte bağlantısız görünen bilgi kırıntılarını çıka rımlar aracılığıyla bir zincirin halkaları halinde birleştirebil diğini merak ediyor. Dolayısıyla anlatıcımızın Dupin'le aynı evi paylaşıp tüm gününü bu parlak dedektifle geçirmesi de mutlu bir tesadüf olsa gerek. Çok geçmeden Dupin'in çok da normal bir insan ol madığını öğreniyoruz. Kendisi hakikaten özgün, tuhaf bir kişiliğe sahip . Yani gerçekten tuhaf biri. Varlıklı, saygın bir aileden geliyor ama neredeyse sefaletin eşiğinde yaşı yor. Gerçi bir o fikrin, bir bu fikrin içinde kaybolurken bu sefalet onun pek de umurunda değil gibi. Konuştuğunda uzun uzadıya aklındakileri sayıp döküyor. Tabii bu za man zaman sinir bozucu da olabiliyor. Fakat anlatıcımız, Dupin'in 'garip çözümleme gücüne' belli ki kıymet veriyor. Şöyle diyor: " Saatin vuruşları karanlığın çöktüğünü haber verene dek okuyor, yazıyor ya da konuşuyorduk. Sonra kendimiz sokaklara atıyor, kalabalık şehrin ışıklarıyla göl geleri arasında geç saatlere kadar kol kola serseri mayın gibi dolaşıyor, sadece sessiz bir seyirci olarak tadılabilecek sonsuz heyecanlar arıyorduk . " Dupin aslında bir prototip, tıpkı Sherlock Holmes gibi o da bir timsal. Holmes gibi Dupin de polislerin 'bütün başarı larını çalışkanlıklarına, hareketliliklerine borçlu' olduğunu ama bir şeyleri her nasılsa ıskaladıklarını fark ediyor. Bir gece anlatıcımız yine Dupin'le o eski evde takılırken " Gazette des Tribunaux" nun [Mahkeme Gazetesi] gece bas kısını eline alıyor ve Morgue Sokağı'nda cinayetler işlendi ğini öğreniyor: OLAGANDIŞI ClNAYETLER: Bu sabah saat üçe doğru St. Roch Mahallesi halkı, birbiri ardına gelen korkunç çığ lıklarla uyanmış. Bu çığlıklar, Morgue Sokağı'nda, Mada me L'Espanaye ile kızı Mademoiselle Camille L'Espanaye'in oturmakta oldukları bir evin dördüncü katından gelmektey miş. Kapıyı içerdekilere güzellikle açtırmak için boşuna har canan birkaç dakikadan sonra, aralarında iki de jandarma 122
HESAPLAM AYI BIRAK. ÇÖZÜMLE
bulunan sekiz on komşu, bir demir çubukla kilidi kırarak içeri girmişler. Bu sırada çığlıklar kesilmişmiş; ama komşu lar merdivene saldırdıkları anda, evin yukarılarından doğru, kavga eden, kızgın sesler gelmiş. İkinci katın sahanlığına var dıklarında, bu sesler de kesilmiş, her şey tam bir sessizliğe gömülmüş. Komşular hemen dağılıp bütün odaları aramaya başlamışlar. Dördüncü katın arka tarafındaki büyük odaya girince (bu odanın kapısı içerden kilitli olduğundan kırılarak açılmış) hepsi büyük bir şaşkınlık ve korkuya kapılarak du ralamışlar. Odanın içi karmakarışıkmış -paramparça edilmiş eşyalar sağda solda darmadağın duruyormuş. Bir tek yatak varmış; onun da şiltesi ta odanın ortasındaymış. Bir sandalye nin üstünde kanlı bir ustura görmüşler. Şöminenin ocağında, iki üç tutam, köklerinden zorla çekilip çıkarılmışa benzeyen, kan içinde, kırlaşmış insan saçı bulunmuş. Yerlerde ise, dört Napolyon altını, bir topaz küpe, üç büyük gümüş kaşık, me tal d'Alger'den yapılma üç daha küçük kaşık, içlerinde dört bin franga yakın altın olan iki torba bulunmuş. Bir köşede duran konsolun çekmeleri açıkmış, içleri yağma edilmiş gibi bir haldeymiş ama büsbütün boşaltılmamışlar. Şiltenin altın dan (yatağın değil) küçük bir demir kasa çıkmış, onun da kapağı açıkmış, anahtarı üstünde duruyormuş. içinde birkaç eski mektup ile değersiz kağıtlardan başka bir şey yokmuş. Odada Madame L'Espanaye'in varlığını gösteren bir ize rast lanmamış; ama ocakta biraz fazlaca kurum olduğu görüle rek baca araştırılmış, (anlatılması bile korkunç! ) dar deliğin epeyce yukarılarına itilmiş olan ve tepetaklak duran bir ceset, genç kızın cesedi dışarı çıkarılmış. Daha sıcakmış. Şöyle bir gözden geçirmişler, her yanı yara bere içindeymiş; kuşkusuz bütün bunlar, bacaya sokulduğu, çıkarıldığı sırada olmuş şeylermiş. Yüzünde tırmık izleri, gırtlağında çürükler, derin tırnak yaraları varmış, boğularak öldürülmüşe benziyormuş. Evi baştan aşağı iyice araştırıp başka hiçbir şey bulamayan komşular, arkadaki küçük bir taşlığa çıkınca ihtiyar kadı nın cesediyle karşılaşmışlar; boynu ta dibine kadar kesik1 23
YAPAY
ZEKA MiTi
miş, kadını yerden kaldırmaya çalışırlarken başı ayrılıp düşüvermiş. Bütün ceset kırık içindeymiş, parça parçaymış; insana benzer yeri yokmuş. Öyle sanıyoruz ki, bu korkunç olayın iç yüzünü ortaya dö kecek bir ipucu ele geçirilmiş değildir.2
Ertesi gün gazete bu cinayet vakası hakkında daha fazla ayrıntı yayımlıyor. Tanıklıklarına başvurulanların anlattık larından hareketle gerekli bilgileri birleştirebiliriz. Anne ile kızının hali vakti yerindeymiş. Olay gecesinden üç gün önce, anne bankadan büyük miktarda para ve altın çekmiş ama bu para cinayetlerden sonra herkesin görebileceği bir yerde do kunulmamış halde bulunmuş. Şu nokta da ilginç: Olay yerine ilk gelen polis iki ses duyduğunu zapta geçirmiş. Konuşanlar dan biri belli ki Fransız bir erkekmiş ama diğerinin ne dediği anlaşılamamış, duyanlar 'hırçın', 'tiz', 'çok tuhaf bir ses' diye tarif etmiş. Bunun belki de bir yabancının, muhtemelen bir lspanyol'un sesi olduğunu düşünmüş. Diğer tanıklar daha sonra bu anlaşılmaz seslerin sahibinin belki de İtalyanca, Rusça veya İngilizce dillerinde konuştuğunu söyleyeceklerdi. Kafa karıştırıcı. Böyle bir vakada belki de en olası cina yet sebebi olan paraya hiç dokunulmamış. Kapılar içeriden kilitliymiş. Kızın bedeni bacada bulunmuş. Oraya öyle bir kuvvetle tıkılmış ki biçarenin cansız bedenini sıkıştığı yer den çıkarmaya tek kişinin gücü yetmemiş. Üstelik bir de sesler var. Besbelli bu sesler katillere ait. Ama polisler evin merdivenlerini tırmanırken apaçık iki ses duymuş, bu sesler den bir tanesini anlar gibi olmuşlar, diğeri ise tuhaf biçim de saçma sapan bir konuşma gibiymiş. Tanıklardan hiçbiri hangi dilde konuşma olursa olsun ne söylendiğini (tabii, bir şey söylendiyse) tam olarak aktaramıyormuş. Polisler hayretler içerisinde. Tanıkların ifadeleri de kafa larını daha da karıştırıyor. Yani, tüm ipuçları bir arada ele 2
1 24
Edgar Allan Poe, The Best of Poe: The Tell-Tale Heart, The Raven, The Cask of Amontillado, and 30 Others, Clayton, DE: Prestwick House, 2006, s. 33-34.
HESAPLAMAYI BIRAK. ÇÔZÜMLE
alındığında gerçekte hiçbir şeyi işaret etmiyor. Bu cinayetler çok gizemli, işte tam da bu yüzden bizim tuhaf amatör de dektifimiz Dupin bu vakaya aşırı ilgi gösteriyor. Anlatıcımız, Dupin'e vakayı daha önce çözebileceğini söylüyor, gazeteye polisin verdiği bilgileri okusa yeter. Gel gelelim bu ikilinin suç mahallinin hala öylece durduğu Mor gue Sokağı'ndaki eski evi ziyaret etmesi için izin almaları gerekiyor. Buradan dönerken bir başka gazetenin ofisinde durup, kayıp ilanı köşesine bir ilan bırakıyor. Paris'te bir kişinin, belki de Malta bandıralı bir gemiden bir denizcini, bir orangutan kaybedip kaybetmediği soruluyor ve öyleyse sahibi gelip orangutanı alabilir diyor ilanda. işte burada Morgue Sokağı cinayetleri vakasını çözen çıkarımı görüyoruz: O gece yaşlı kadınla kızını öldüren, as lında bir insan değil. Bir denizcinin cangıldan getirdiği ve yakındaki bir konutta tuttuğu vahşi bir hayvan. Orangutan, sahibinden kaçarken öfkeden deliye dönüp eski evin pan curuna tutunup sallanarak pencereden içeri fırlıyor, sonra odaya dalıp eline geçirdiği keskin bir usturayla haykırıp çığlıklar atıyor ve etraftakilere saldırıyor. İşte cinayet silahı: Yaşlı kadının başını koparan ustura ve kızı önce ayakları girecek biçimde bacaya sokan katıksız hayvan gücü. Peki ya şahitlerin duyduğu insan sesi ? O da orangutanın sahibine ait. Peki ya boğuk, anlaşılmaz sesler ? Hayvanların homurtuları.
Tahmine Dayalı Yöntem Peki, bu vakaya dair olgulardan bunu kim çıkarabilirdi ? El bette bunun yanıtı hepimizin önünde apaçık duruyor. İşin aslı Dupin sadece tahminde bulunmuştu. Polis bildik yön temlerle ilerlemiş ve çıkmaz sokağa saplanmıştı. Sonra onlar da tahminde bulunmaya başlamışlardı. Tek fark Dupin'in tahmininin doğru çıkmasıydı. 125
YAPAY ZEKA MiTi
Poe "Morgue Sokağı Cinayeti " öyküsüne düşüncenin doğası üzerinde durarak başlıyordu. Yani kurmaca bir suç öyküsü, kurmaca olmayan bir kısımla başlıyordu. Meramını anlatabileceği doğru sözcükleri arıyordu. Dupin'in akıl yü rütme biçiminin, kurallı hesaplama karşısında çözümleme nin bir zaferi olduğu sonucuna varıyordu. Hesaplama, bili nen noktaları birleştirmekten oluşuyor: Örneğin aritmetiğin kurallarını uygulamak böyle bir iş. Çözümlemeyse nokta ları anlamlandırmaktan ve onları açıklayacak sıçramalarda veya tahminlerde bulunmaktan oluşuyor. Ardından, kaza nılan içgörüyü sınamak üzere hesaplamaya başvuruluyor. Hesaplamanın sınırları var. Nitekim " Kurallara sığmayan şeyler de vardır ve çözümleyicinin ustalığı işte öyle anlarda kendini gösterir" diyor Poe. Kurallara uymak yetmez ama başka nelerin gerektiği de belirsizdir. Poe'nun bunu biraz gizemli bir güç olarak gördüğü, öykünün başında ilan ettiği görüşünden belli: " Çözümleme diye adlandırdığımız zihinsel yeteneğin kendisi çözümlenmeye pek de elverişli değildir. " 3 ABD'li bilim insanı ve felsefeci Charles Sanders Peirce, Poe'nun öykülerini, yayımlandıktan birkaç on yıl sonra bü yülenerek okumuştu. Peirce da nasıl düşündüğümüzü, nasıl akıl yürüttüğümüzü merak ediyordu. Hatta Dupin'in zihin j imnastiğini mantığın simgeleriyle ifade etmeyi bile becer mişti. Dedektifin içgörülere dayalı tahmin tarzını nasıl oto masyona tabi tutabileceğini bilmiyordu ama insanın genel düşünme becerisinin merkezinde yer aldığını düşünüyordu. Peirce için düşünmek, hesaplamak değildi, bir sıçrama yapmak, bir tahminde bulunmaktı. Bu süreçte hiçbir şey kesin değildi. Parçaları tek tek biz bir araya getiriyorduk. Önce onları açıklıyor, ardından açıklamamızı gözden geçi riyorduk. Peirce 1 9 . yüzyılda yaşadığı için dijital bilgisaya rın ne olduğunu elbette bilmiyordu ama ilerde yapay zekayı 3 Edgar Allan Poe, The Best of Poe: The Tell-Tale Heart, The Raven, The Cask of Amontillado, and 30 Others, Clayton, DE: Prestwick House, 2006, s. 27. 1 26
HESAPLAMAYI BIRAK. ÇÖZÜMLE
herkesi epey zorlayacak bir sorun haline getirecek olanın ne olduğunu o zamandan öngörmüştü. Meselenin özü şu soru da saklıydı: Bizim düşünme becerimiz bulgulardan hareket le tahminde bulunmaya dayalı kafa karıştırıcı bir süreçken, bunu programlayabileceğimizi nasıl bekleriz ? Peirce bu sorunları ele alırken insanın akıl yürütme bi çimlerini ele alan bir açıklayıcı çerçeve geliştirmişti. Bu çer çeve formel mantığa ve onun tümdengelimli ve tümevarımlı türlerine dayanıyordu ama Peirce bizim tahminde bulunma becerimizi dışarıda bırakmayacak üçüncü bir akıl yürütme türünün daha var olduğunu ileri sürüyordu. Buna 'savava rım' adını vermişti. Şimdi işleyeceğimiz konu da işte bu.
1 27
9 PEIRCE BULMACASI (VE PEIRCE"IN BULMACASI)
Charles Sanders Peirce'ın çalışmalarına aşina olanlar onun hakikaten özgün ve önemli düşünürlerden oluşan seçkin bir zümrenin üyesi olduğunu bilirler. Tarihçi Joseph Brent, C. S. Peirce: A Life [C. S. Peirce: Bir Yaşam] başlıklı yaşa möyküsünde Peirce için " ABD'nin yetiştirdiği muhtemelen en parlak zihin " diyordu. 1 934'te çıkan The Dictionary of Amerikan Biography'de [Amerikan Yaşamöyküsü Sözlü ğü] felsefeci Paul Weiss, Peirce'ı "Amerikalı felsefecilerin en özgünü, en çok yönlüsü ve Amerika'nın en büyük man tıkçısı " olarak niteliyordu. Kültür tarihçisi ve eleştirmen Lewis Mumford'sa onu Roger Bacon ve Leonardo da Vinci gibi putkırıcı dahilerle birlikte anıyordu. MIT'nin öncü dil bilimcisi Noam Chomsky 1 976 yılında kendisiyle yapılan bir röportaj da, en fazla etkilendiği düşünürlerin kim oldu ğu sorusuna "Tartıştığımız [dil felsefesi üzerine] konularda kendimi en yakın hissettiğim ve herhalde en fazla alıntıla dığım kişi Charles Sanders Peirce olsa gerektir" yanıtını veriyordu. 1 1
1 28
Joseph Brent, Charles Sanders Peirce: A Life, Bloomington, iN: Indiana University Press, 1 993, s. 1 -7.
PEIRCE BULMACASI [VE PEIRCE'IN BULMACASI]
Dihi ama Yalnız Tıpkı Albert Einstein gibi Peirce da solaktı ve resimlerle dü şün üyordu. Şekiller kullanarak mantıksal çıkarımların es kizlerini çıkarıyordu. Son yıllarında evinde yapayalnızken ka leme aldığı bir yazısında aç olduğundan, üşüdüğünden ve sobaya atacak odun bile alamayacak kadar parasız olduğun dan dert yanıyordu. Çok az dostu vardı ama dostları onun için endişeleniyorlardı. Sonunda Harvard Üniversitesi'nde ona mantığın temelleri üzerine bir dizi ders ayarlamayı ba şarmışlardı. Peirce bu derslerde mantıksal çıkarım türlerini anlatıyor, oluşturduğu çerçevenin bilimsel yönteme destek teşkil ettiğini savunuyordu. Nitekim bu çerçeve, açık ve se çik düşünmeyi öğrenme programıydı. Derslerine katılanla rın arasında ünlü- felsefeci ve Harvard Üniversitesi'nin ilk psikologlarından William James de vardı. James daha son raları bu dersleri tam olarak anlamadığını itiraf edecekti; Peirce'ın resimlerinin ve şekillerinin temsil ettiği matematik onun anlama kabiliyetinin ötesindeydi. Belli ki bu konuda yalnız da değildi çünkü Peirce'ın dersleri fazla rağbet görme di ve ancak onlarca yıl sonra kitaplaştırıldı. Peirce 1 8 39 yılında Massachusetts'in Cambridge şehri ne hakim olan Viktoryen bilim kültürünün içine doğmuştu. Varlıklı ve çok başarılı bir aileden geliyordu. Babası Harvard Üniversitesi'nde tanınmış ve parlak bir matematik profesö rüydü. Genç kuzenlerinden Henry Cabot Lodge ise ilerde epey nüfuzlu bir senatör olacaktı. Peirce klasik eğitim almıştı, Harvard Üniversitesi'nin Lawrence Fen Mektebi'nden 1 863 yılında en yüksek onur derecesiyle mezun olmuştu. 30 yılı nı ABD Sahil ve Jeodezik Araştırma Kurumunda araştırmacı bilim insanı sıfatıyla hassas kütleçekim yoğunluğu ölçümle rini kullanarak dünyanın yüzeyinin topolojik yapısı üzerine araştırmalar yaparak geçirdi. Amatör bir kimyacıydı, Johns Hopkins Üniversitesi'nde itibarlı bir mantık öğretmeniydi ve uluslararası tüm bilim derneklerinin herhalde ilk Amerikalı 1 29
YAPAY ZEKA MİTİ
delegesi de oydu. Bir bilim insanı, mantıkçı, felsefeci, yazar, Nation dergisi için sayısız kitap incelemesi kaleme almış bir kitap eleştirmeniydi ve daha nice işle uğraşıyordu. Onlarca yı lını Peirce'ın yaşamını ve eserlerini inceleyerek geçiren Peirce uzmanı akademisyen Max H. Fisch, onun hakkında, sayısız başarısına yakışır bir hükümde bulunuyor: Amerika kıtasının bugüne dek çıkardığı en özgün, en çok yönlü entelektüel kimdir derseniz, yanıt tartışmasız Char les S. Peirce olacaktır. Çünkü ikinci sırada kim gelirse gel sin ondan o kadar geride kalacaktır ki birinciliğe aday bile gösterilemez. Matematikçi, astronom, kimyacı, jeodezikçi, yerölçümcü, haritacı, metrolog, spektroskopçu, mühendis, mucit, psikolog, filolog, sözlükçü, bilim tarihçisi, matema tiksel iktisatçı, ömür boyu tıp öğrencisi, kitap eleştirmeni, tiyatro oyunu yazarı, aktör, öykü yazarı, fenomonolog, gös tergebilimci, mantıkçı, retorikçi, metafizikçi . . . Amerika kı tasında mantıkta, matematikte ve sayısız bilim dalında hem yetkin hem de üretken olmuş ve bir sistem üretmiş tek felse feci odur. Tüm felsefe tarihinde ona denk biri var olmuşsa bile bunların sayısı ikiyi aşmaz.2
Ne var ki saymakla bitmeyen meziyetlerine rağmen Peir ce toplum dışına itilmiş halde öldü ve büyük ölçüde unutul du. Tarihte, unutulmuş dahilere sık rastlıyoruz, hatta Tesla örneğinde olduğu gibi bazen onları yeniden keşfedebiliyo ruz. Peirce, Tesla'dan da büyük biri, adı tarih kitapların dan büyük ölçüde silinmiş önemli bir düşünür. Üstelik onun başına gelenler Tesla'nın başına gelmedi. Tesla hiç değilse ölümünden sonra Elon Musk'ın elektrikli araba şirketinin adına ilham verecek kadar üne kavuştu. Peirce'ın çalışmala rı özellikle pragmatizm adı verilen felsefe okulunun kurucu su olarak tanındığı felsefe alanında takdir ediliyor. Onun bilişim ve hesaplama hakkında yaptığı ilk çalışAktaran Brent, Charles Sanders Peirce: A Life, Bloomington, iN: Indiana University Press, 1 993, s. 2-3 .
PEIRCE BULMACASI [VE PEIRCE'IN BULMACASIJ
malarıysa neredeyse tamamen unutuldu. Akademisyenler hala onun mantığın doğası hakkında kaleme aldığı yazıla rını gün yüzüne çıkarmakla meşguller ve bu yazılar ciltler dolduracak kadar hacimli. Fakat çalışmaları öyle müphem ve içine girmesi o kadar güç ki bugün ana akım tartışmalara dahil edilemiyor. Dolayısıyla, Peirce'ın mantığın doğasına dair düşüncelerinin önemini ve kapsamını kavrayabilenler onu Aristoteles'le kıyaslıyorlarsa da bugün Peirce'ın fikir lerinin anlaşılabilmesi için bir yaşamöyküsünün kabaca da olsa anlatılması, düşüncelerinin açıklanması, hatta biraz da savunulması gerekiyor.
Fizik. Felsefe ve Kişilik Peki, Peirce neden unutuldu ? Kişisel hayatı bu konuda bir takım ipuçları barındırıyor: Neredeyse herkesin damarına basmış. Yakın dostlukları ömür boyu süren William James bile Peirce'la ilk karşılaştığında hemen ondan uzaklaşma nın yoluna bakmış. Her ikisi de Harvard'da öğrenciyken James'in onun hakkındaki fikirleri karışıktı, hatta bir kere sinde ailesine şöyle yazıyordu: " Burada Profesör Peirce'ın bir oğlu var. Bence çok akıllı bir 'arkadaş', kişiliği de sağ lam biri ama hayli başına buyruk ve saldırgan. "3 James daha sonra Peirce'a şefkatli bir tavırla " tuhaf ve ele avuca sığmaz şey" de demiştir.4 Peirce'ın aksi kişiliği ve güncel ahlaki tutumlara rağbet etmeyişi hem kişisel ilişkilerinde hem de iş ilişkilerinde ba şına hep dert açıyordu. New England'daki Viktoryen cemi yeti -ki buna kendi ailesi de dahildi- hal ve hareketleriyle sık sık rencide ediyordu. Dolayısıyla seçkinlerden oluşan bu cemiyetin kapılarını ona kapatmış olması anlaşılabilir bir 3 •
Henry James (ed.), The Letters of William ]ames, 1 . cilt, Boston: Atlantic Monthly Press, 1 920, s. 3 5 . Aktaran Brent, Charles Sanders Peirce: A Life, Bloomington, I N : Indiana University Press, 1 993, 1 6 .
YAPAY ZEKA MiTi
durumdur. Karısını aldattığı ayyuka çıkınca Harvard ona profesörlük teklif etmekten vazgeçecekti. Onlarca yıl bo yunca çalıştığı ABD Sahil Araştırma Kurumu, raporlarını zamanında sunmadığı ve Avrupa gezileri sırasında pahalı teçhizatı kaybettiği gerekçesiyle en sonunda Peirce'i işten çı karacaktı. Benzer şekilde, uygunsuz davranışlarda bulundu ğuyla ilgili birtakım söylentilerin ardından Johns Hopkins Üniversitesi'ndeki görevinden de uzaklaştırılmıştı. Bugün olsa ona uyumsuz derdik, yani anlaşılamayan dahi stereoti pine cuk oturan biriydi. Mizacı kurallara uygun davranma ya müsait değildi. 5 Peirce'ın kişisel rezaletleri ve kendine özgü davranış ları, onun özel hayatı hakkında ciltleri dolduran belge bu lunmasına rağmen Harvard Üniversitesi'nin Houghton Kütüphanesi'nde mühürlü tutulan bu belgelerin neden ancak 1 956 yılında, yani ölümünden 42 yıl sonra kamuya açıldığını da açıklıyor. Bilimsel ve felsefi yazıları -ki bunların arasında bilgisayar bilimleri ve özellikle yapay zeka çalışmaları açısın dan son derece ilgi çekici şeyler var- görece el değmeden ve yayımlanmadan duruyordu. Lewis Mumford'un daha son raları ifade edeceği üzere, Harvard Üniversitesi arşivleri 'ilk yayın bedelinin teminatı olarak . . . birkaç bin dolar' gibi bir 5
Joseph Brent, Peirce'i bir züppeye benzetiyor: "Züppe aynanın önünde yaşar ve uyur. Zengindir, kendini işinde tüketir ama onu bile kayıtsızlıkla yapar. Yal nızdır ve mutsuzdur" (s. 23-24) . Romancı Henry James (William'ın kardeşi), eşinden kısa süre önce ayrılmış ve Paris'e musallat olan bir hayalete dönmüş yalnız Peirce'le tanıştıktan sonra şakayla karışık, Peirce'ın ilginç biri olduğu nu, 'güzel kıyafetler' giydiğini söylüyordu ( Brent, age., s. 25 ) . Aslına bakılırsa Peirce hayatı boyunca sevdiklerinin, meslektaşlarının, amirlerinin türlü türlü şikayetine konu olmuş ve bu kişiler, onu ateist olmakla (doğru değildi), alko liklikle (muhtemelen doğruydu), uyuşturucu bağımlılığıyla (bu doğruydu ama bunun sebebi ömrü boyunca, fasiyal nevralji diye bilinen ağrılı ve ıstıraplı bir rahatsızlıktan mustarip olmasıydı), eşine sadakatsizlikle (şüphesiz doğruydu) ve mesleğinde lakayıtlıkla suçlamışlardı. Bu suçlamalar ve gerçekler Hop kins'teki öğretim görevliliğine son verilirken tamamen ortaya dökülmedi. ABD Sahil Araştırma Kurumunda çalışırken pahalı kütleçekim ölçüm teçhizatına mukayyet olamaması ise tıpkı projeleri geciktirmesi gibi iyi belgelenmiş bir durumdur.
PEIRCE BULMACASI [VE PEIRCE'IN BULMACASIJ
ücret karşılığında bunları bekletiyordu.6 Peirce'i tanıyanların birçoğu onun hem fikirlerini ve bu fikirlerin önemini anla madıklarından hem de rezalete davetiye çıkarmak istemedik lerinden, itibarının iade edildiğini ve ömrünü adadığı çalış masının büyük bir bölümünün tekrar yayımlandığını görecek kadar uzun yaşamadılar. Peirce ise öldükten sonra karanlığa gömüldü. Dul kalan ikinci eşi Juliette de en az Peirce kadar gizemli biriydi ve bu Fransız kadının geçmişi de tutarsızlıklar la doluydu. Bu yüzden Peirce'ın ailesi Juliette'i de bazen top lumun dışına itilmiş biri, hatta bir 'çingene' diye niteliyordu. Peirce'ın matematiğe ve özellikle de mantığa katkıları nın ne denli büyük olduğunu ancak onun ölümünden sonra, hem de çok uzun yıllar sonra anlayacaktık. Aslında bugün bile bu alanlara yaptığı katkıların boyutlarını yeterince tak dir edebildiğimizden emin değiliz. En büyük katkıyı ise, ha yatını adadığı çalışmalarını savavarımlı çıkarım dediği bir akıl yürütme biçimi üzerinde yoğunlaştırıp bu konuyu enine boyuna aldığı, mantıksal çıkarımlar alanında yapmıştı. Peir ce sava varımlı çıkarımı açıklayıcı tahminde bulunma işi ola rak görüyor ve düşünme etkinliğimizin büyük bölümünün bu çıkarım türünü şart koştuğunu ileri sürüyordu. Peirce, savavarımlı akıl yürütmenin Aristoteles'ten beri mantıksal akıl yürütmeye ilişkin açıklamalarda ele alınmadı ğını, es geçildiğini görmüştü. Dahası, bu akıl yürütme biçimi matematik ve mantık derslerinde anlatılagelen genel mantı ğın çerçevesine de uymuyordu. Peirce savavarımı mantığın eksik parçası olarak görüyordu ki bu parça otomasyon ve yapay zeka gibi konularda temel soruların da çıkış kayna ğıydı. Nitekim Peirce yapay zekanın ne olduğunu bilseydi bugün bu alanda yürütülen çalışmalarda genellikle neyin es geçildiğini de herhalde görürdü: Savavarımlı çıkarım soru nu, yapay zekanın göbeğinde bulunan ve hala büyük oranda çözülmemiş zorluğu teşkil ediyor . ' Brent, Charles Sanders Peirce: A Life, B loomington, iN: lndiana University Press, 1 99 3 , s. 9. 133
YAPAY ZEKA MiTi
Çıkarım Bulmacası Edgar Allan Poe'nun isimsiz anlatıcısı, daha sonraları Peirce'ın hakkında ciltler dolusu kitap yazacağı şeyi -sava varırnlı çıkarımı- ifade edecek sözcüğü bulamamıştı. Sava varırnlı çıkarım da son kertede bir çıkarım türüdür. Peki, çıkarım [inference] nedir ? Öncelikle bir isimdir. Fiil haliy se [infer] çıkar[sa]rna eylemini ifade etmektedir. Kökenbi lirn açısından İngilizce 'to infer', Latince 'in' yani 'içine' ve 'ferre' yani 'getirme' sözcüklerinden türeyerek 'doğurmak' ve 'çıkarmak' anlamına geliyor. Oxford İngilizce Sözlüğü ( 015) , bunu bilişle, zihnimizle yaptığımızı söylüyor: " Eldeki bilgilerden hareketle bir şeyin doğru olduğu kanısına var mak veya buna karar vermek. " Ama ne yazık ki OİS 'türetme' [deduce] sözcüğünün de 'çıkarsama' [infer] sözcüğüyle eşanlarnlı olduğunu söylüyor ki bu işimizi pek kolaylaştırmıyor. Çünkü türetim, çıkarı mın türlerinden sadece biridir. OİS aynı zamanda halk arasında 'çıkarım' sözcüğünün ne kadar genel anlamda kullanıldığına dair, kullanımdan örnekler de sunuyor:
Bir şeyi (başka bir şeyden) çıkarmak: Anlamın çoğu bağ lamdan çıkarılmalıdır. Katilin niyetini çıkarmak da okur lara kalıyor.
Sonuç çıkarmak: Hükümetin bu görüşmelerden haberdar olduğu sonucunu çıkarabiliriz.
Çıkarım akla yeni bir düşünce getirmek dernek; mantıkta sonuç çıkarmayla aynı şey ve genel haliyle şimdi bildikleri mizi, gözlernlediklerirnizi kullanarak o güne kadarki inanç larımızı güncellemeyi içeriyor. Yani tıpkı Dupin'in yaptığı gibi, bildiklerimizi ve gazetelerde okuduklarımızı kullana rak katilin niyetini çıkarsayabiliriz. Çıkarım ayrıca makul sayılabilecek sıçramalarda bulun mak anlamına da geliyor. Örneğin " Hükürnetin bu görüş melerden haberdar olduğu sonucunu çıkarabiliriz" dediği134
PEIRCE BULMACASI [VE PEIRCE'IN BULMACASI)
mizde yine daha önceki bilgilerimizin (özel veya kamusal bilgiler) yanı sıra okuduğumuz son dakika haber(ler)ini yani gözlemlerimizi- de kullanarak bir çıkarımda bulunu yoruz. Çıkarım, zeki zihinlerin en temel bilişsel edimidir. Eğer bili şsel bir fail -bir insan ya da yapay zeka- zeki değilse çı karımda çuvallayacaktır. Çıkarımda bulunacak tüm sistem lerin en azından temel seviyede bir zekaya sahip olmaları şarttır çünkü önceden bilinenleri güncellemek üzere yeni öğrenilenleri ve gözlemleri kullanma eyleminin ta kendisi bizim zekadan anladığımız şeyle kaçınılmaz olarak bağlan tılıdır. Eğer bir yapay zeka sistemi hiçbir şekilde çıkarımda bulunamıyorsa ona yapay zeka denemez. ( Gerçi kedi fotoğ raflarını etiketleyen bir sistemin bile 'gördüğü' şeyin kedi olduğu sonucunu çıkardığını söyleyebiliriz ama bu durumda çıtayı epey alçakmış oluruz. ) Çıkarımda bulunma kabiliyetine bir şekilde sahip olmadan herhangi bir şakayı anlamak, yeni bir aşı keşfetmek, Dupin'in yaptığı gibi bir cinayetin sırrını çözmek veya dünyadaki çeşitli olaylara ve günlük iletişime ayak uydurmak bile olanaksızdır. Çok şey biliyoruz, bundan kimsenin kuşkusu yok ama bizi yeni bilgilere -veya inançlara- ancak çıkarım ulaştırabiliyor. Yarın güneşin doğacağını zaten biliyoruz, dolayısıyla yarın güneşin doğacağı sonucunu çıkarmamız gerekmiyor. Keza elimizin hala eklem yerinden kolumuza bağlı olduğunu çıkar samaya da ihtiyaç duymuyoruz. Bu zaten sahip olduğumuz bir bilgi; çoktan edindiğimiz bir inançlar kümesinin parçası. Gelgelelim bilgimiz hep değişiyor, güncelleniyor. Diyelim ki hava gizemli bir biçimde çok erken karardı. O zaman bir gü neş tutulması olduğu veya büyük bir toz fırtınasının güneş ışığını perdelediği veya nükleer bir felaketin başladığı çıka rımında bulunabiliriz. Duruma bağlı. Şu anda ne biliyoruz? Gördüklerimizi en anlamlı kılan şey ne ? Genel anlamda her zaman çıkarımlarda bulunuyoruz. Bu bizim için uyanıklık halinden farksız. Mutfakta yarım kutu 135
YAPAY ZEKA
MiTi
Pepsi buluyorsam kutuyu oraya kız kardeşimin bıraktığı so nucunu çıhrabilirim çünkü kız kardeşim Pepsi içmeyi sevi yor ve şu an bizde misafir. Ama mutfak tezgahını yenileyen işçiler de bugün evdeler ve birini daha önce Pepsi içerken görmüştüm. Üstelik ben de daha önce bir Pepsi içip bitir meden kutusunu verandada bırakmıştım. Eşim pekala ku tuyu içeri almış olabilir. Dolayısıyla ne bildiğimize ve hangi bağlamda bulunduğumuza göre karşı karşıya olduğumuz durumu anlamlandırmamıza izin verecek açıklayıcı tahmin ler kalıyor elimizde. İşte bu, 'anlık' veya 'gerçek zamanlı' çıkarımda bulunmaktır çünkü bir yandan mutfağa girerken diğer yandan belli birtakım sonuçlar çıkarıyorum. Gerçek dünyanın koşulları sürekli değiştiğinden, anlık çıkarımlarda bulunmak son derece yaygın görülen bir durumudur. Ne de olsa düşünürken aslında zamana karşı yarışıyoruz. Bir soru nu on milyar yıl sonra çözebilecek bir bilgisayara zeki dene meyeceği gibi, anlık kararlar veremeyip yolunun üstündeki duvara toslayanına da zeki diyemeyiz. Çoğu çıkarımın geçici ve tahmini varsayımlara dayanması, ilk çıkarımların -özellikle de sonuca alelacele varılmışsa- ha talı olabileceği anlamına geliyor. Diyelim ki ofise geç geldim ve patronum da bunun üzerine işi ciddiye almadığım sonucu nu çıkardı. Oysa yolda bir kaza olmuş ve trafik kilitlenmişti. Başka bir deyişle, patronum aslında benim hakkımda daha önce edindiği bir izlenimden veya bana karşı önyargısından hareketle bir sonuç çıkardı. Gündelik konuşmalarda insan lar çıkarımı işte genellikle bu anlamda kullanıyor, alelacele ve haksız sonuçlar çıkarmayı kast ediyorlar. "Suzy'yi bilmez misin, özellikle senin dün gece söylediklerinden acayip sonuç lar çıkardı. " Teknik açıdan Suzy'nin çıkarımda bulunduğu doğru ama burada Suzy'nin çıkarımlarının yanlı olduğu ve haksızlık etmeye teşne olduğu kast ediliyor ( belki havasında değildi, belki de sizden hoşlanmıyordu) . Çıkarımın daha sınırlı bir anlamı matematiğin terimler sözlüğüne gireli epey oluyor, hatta bilişim ve yapay zeka tar-
PEIRCE BULMACASI (VE PEIRCE'IN BULMACASI)
tı şmalarında da karşımıza bir süredir çıkıyor. Bu bağlamda 'anlık' sıfatı, sürekli değişen, örneğin kalabalık ve hareketli bir sokak gibi bir çevrede yolunu bulmaya çalışan bir robota atıfta bulunabiliyor. 'Olasılıklı çıkarım' istatistiksel veriler den hareketle sonuç çıkarıyor ki bunun yapay zekaya dö nük veri ağırlıklı yaklaşımlarda uygulanabileceği açık olsa gerektir. Vaktiyle yapay zeka bilimciler hazır bilgilerin nasıl ze kice kullanılabileceğini anlamaya çalışırlarken çıkarımın önkoşullarından biri -'bilgi' sorusu- karşısında epey ter dökmüşlerdi. Hiçbir şey bilmeyen sistemler doğru düzgün çıkarımda bulunamazlar . Bu yüzden yapay zeka alanında çalışan ilk araştırmacılar yapay zeka sistemlerinin sensörler den veya metinlerden gelen girdileri anlamalarını sağlamak için bilgiyi bu sistemlere kodlamayı denediler. Olgulardan ve kurallardan oluşan büyük bilgi dağarcıklarına sahip ya pay zeka sistemlerinin eldeki sorunla bağlantılı sonuçlara ulaşabilmesi için bilgiyi daima bir bağlam içerisinde kul lanması gerektiğini zor yoldan, tekrar tekrar başarısızlığa uğrayarak da olsa öğrendiler. Çıkarımı bu kadar zor hale getiren de bilginin işte bu 'kullanımı'dır. Etrafımızda sü rekli değişen dünyayla ilgisi kurulabilecek bilgi kırıntılarını belleğimizin derinliklerinde arayıp bulmak samanlıkta iğne arama ya benzer. Hangi bilgi kırıntısının kullanılması gerektiğini belirle yebilmek bir hesaplama kabiliyetinin ürünü değildir. Poe 'çözümleme' alanında ulaşılan beşeri içgörülerin formüller izlenerek oluşturulamayacağında, hesaplamalara, 'kurallara sığmayan şeylerin de var' olduğunda ısrar ediyordu. Nite kim dedektif Dupin, cinayetlerin açıklamasına -yani katilin orangutan olduğuna- talihli bir tahminle varıyor ve daha sonra kaçak hayvanın sahibiyle görüşerek bu tahminini doğruluyordu. Peki, sadece tahminde mi bulunuyordu ? Bü yük ölçüde, evet. Ama bu onun çıkarımına halel getirmiyor. Aksine, onunkini önemli bir çıkarım türü yapıyor. 137
Turing Hakkında Daha Fazlası Turing 1 950 tarihli çığır açıcı makalesi "Hesaplama Makine leri ve Zeka " da makinelerin gerçekten düşünüp düşünemeye ceği sorusunu elinin tersiyle bir kenara itiyor ve kendi maka lesinin başlığıyla dalga geçercesine 'düşünmenin' iflah olmaz derecede öznel bir etkinlik olduğunu, bilimsel olamayacağını iddia ediyordu. Bilgisayarların düşündüğünden bahsetmek, denizaltıların yüzdüğünden bahsetmek gibiydi. 'Yüzme' söz cüğünü kullanmak bile aslında bu makinelere insansı birtakım özellikler atfetmek demektir. Yunuslar yüzer ama denizaltı lar yüzemez. Turing düşünme sözcüğünün de işte bu şekilde kullanıldığı kanısındaydı. Satranç oynayabilen bir bilgisayar düşünüyor muydu yoksa sadece hesaplıyor muydu, kim bilir. Turing tamamen programlanabilir zihinle ilgileniyordu. Bu yüzden sezgiyi -artık o her neyse- bilişim alanına çeke rek sezgi ile hüner arasında ilk başta yaptığı ayrımı toptan rafa kaldırmıştı. Böylelikle yapay zeka fikrini tamamen sı nanabilir hale getirmiş oluyordu. Bu sav Turing'in ilk za manki ölçütlerine vurulduğunda bile epey radikaldi ama bu kadarını Turing'e çok görmeyelim; çünkü böyle yapmakla sonraki 1 0 yıl içinde yapay zeka araştırmacılarının felsefi kaygıları bir kenara bırakarak bu alanda ilerleme kaydetme lerinin zeminini hazırlamıştı. Ne yazık ki hesaplamalı/bilişimsel çıkarımın nasıl in san çıkarımına benzetilebileceği -yahut dönüştürülebilece ği- asla doğru düzgün izah edilmedi. Bu alanda çalışanlar, sonraki gelişmeler için bir yapı planı teşkil edecek (veya böyle bir şeyin olanaksız olduğunu tanıtlayacak) bir çıka rım kuramıyla yola çıkmadılar. Böyle bir kuram olmadan hareket eden yapay zeka araştırmacıları, fisyon tepkimeleri nin ayrıntılarını incelemeden atom bombası üzerinde çalış maya başlayan mühendislere benziyorlardı. Böyle bir iş için Einstein'ın denklemini bilmenin yetmeyeceği apaçıktır. Keza yapay zeka tutkunlarının da bilişim kuramını bilmeleri yet138
PEIRCE BULMACASI (VE PEIRCE'IN BULMACASI]
mez çünkü yapay zeka üzerinde çalışan bilim insanlarının yanıtlamak zorunda oldukları soru tam da hesaplamanın, zihnin sergilediği yelpazede ve türde çıkarımlara nasıl dö nüştürülebileceğiydi. Bu sorunun hiç vakit kaybedilmeden sorulup yanıtlanması gerekiyordu. Yapay zeka çalışmaları alanı işte bu soruyu görmezden geldiği için yıllarca sahte umutlar dağıttı, sayısız çıkmaz sokağa daldı ve kaçınılmaz olarak zaman kaybetti. Çünkü hesaba katılması gereken çok şey vardı. Sözge limi, bilim tarihinde karşımıza çıkan birçok çıkarımı alın. Bilim insanları önce hipotezler ortaya atarlar ve sonra onları sınarlar. Fakat bu hipotezlere mekanik süreçlerle varmazlar. Hatta hipotezlerin bilim insanlarının aklına bazen birden bire -genellikle çalışılan konuda uzmanlık kazanıldıktan sonra- geldiği de gayet iyi bilinir. Turing'in de bir zaman lar yaptığı gibi keşifler üstünde çalışanlar bu gibi düşünsel sıçramalarını bilim pratiğinin resmi sınırlarının dışında yap tıkları için zeka da 'serbestçe at koşturabilir' . Yine de bu gibi hipotezler her türlü bilimin merkezini teşkil eden hakiki bilimsel edimlerdir ve genellikler verilere, delillere, apaçık ve programlanabilir şeylere da yanılarak açıklanamazlar. 7 Kopernik Dünya'nın Güneş'in çevresinde döndüğünü öne sürerken, daha eski Batlamyusçu modelle iş gören astro nomların yüzyıllardır biriktirdikleri dağ gibi kanıtları ve ve rileri görmezden geliyordu. Güneş'i merkeze alarak her şeyi baştan kurguladı ve kullanışlı bir günmerkezli model oluş turdu. Burada can alıcı nokta, Kopernikçi modelin başlarda Batlamyusçu modelin izin verdiği kadar isabetli tahminlere izin vermediğidir. Bu model ilk başta yalnızca bir çerçeveden ibaretti ve tamamlanırsa Batlamyusçu modelin başına bela olan, gezegenlerin geriye hareketi gibi gitgide karmaşıklaşan 7
Gerçek bilimsel keşifler, neredeyse tanımları gereği, önceden kabul görmüş 'ka nıtlar' üzerinden değerlendirildiğinde, olasılık dışı çıkarımlar (ya da çıkarımlar grubu) olmaya meyillidir. Keşif kabul edildiğinde (tabii, edilirse) kanıt sayılan şey de olasılığa dair hükümlerle beraber tekrar değerlendirilir. 139
YAPAY ZEKA MiTi
ve anlaması güç açıklamaların yerine çok yalın ve zarif bir açıklama sunabilirdi. Kopernik ancak işin en başında tüm verileri görmezden gelerek veya yeniden kavramlaştırarak yermerkezli modeli reddederse Güneş Sistemi'ne yeni bir yapı sunacak bir çıkarımda bulunabilirdi. ( İnsanın aklına şu soru geliyor: Büyük veri Kopernik'e yardımcı olur muydu? Nitekim elindeki tüm veriler hatalı modele uydurulmuştu. ) Bilim Devrimi'nini fitilini ateşleyen Kopernikçi sıçramayı, 'esinlenmiş bir tahmin' diye tarif etmek daha doğru olacak tır. Keza Kepler'in gezegenlerin hareketini betimlemek üzere eliptik hareketi tercih etmesi için de bunu söyleyebiliriz çünkü gezegenlerin yörünge hareketlerini betimlemek için kullanı labilecek -belki sinüs dalgaları gibi aşkın şekiller hariç- geo metrik şekillerin sayısı neredeyse sonsuzdur. Elips şekli diğer şekillerden daha yalın değildi, yani bu açıklama Occam 'ın Usturası ölçütünü karşılamıyordu. Kepler kendisine 'doğru gelen' açıklamayı sözcüğün tam anlamıyla kestirmişti. Kestirimlerin keşiflere yol açması olgusu mekanik bilim anlayışına uymuyor, bilakis bu anlayışla çelişiyor. Fakat de dektiflik, keşif, inovasyon ve sağduyu gibi etkinliklerin hep si zihnin işleyişinin bir parçası ve yapay genel zekaya sahip makinelerin arayışındaki yapay zeka bilimcilerin bir şekilde izah etmek zorunda oldukları çıkarımlardan ibaret. Gördüğünüz gibi, bilişi modellemek -yani düşünecek, çı karımlar yapacak bilgisayarlar inşa etmek- epey zorlu bir iş. Yapay zeka araştırmacıları en azından şimdilik gündelik bağlamda yapılan çıkarımlara odaklanmalıdır. Neden mi ? Çünkü yaptığımız çıkarımların büyük bölümü günlük me selelerle ilgilidir, tıpkı günlük sohbetler sırasında yaptığımız türlü türlü sıçramalar ve tahminler gibi. Ne yazık ki yapay zeka araştırmacıları için sıradan çıkarımları bilgisayarlara programlayabilmek hiç kolay bir iş değil. Örneğin Turing Testi özellikle zor bir sınavdır çünkü doğal dili anlama işi sağduyuya dayalı sayısız çıkarımda bulunmayı gerektiriyor ve bu çıkarımlar bizi ne kesin ne de (genellikle) yüksek ola-
PEIRCE BULMACASI [VE PEIRCE'IN BULMACASI]
sılık lı sonuçlara vardırıyor. Başka bir deyişle, sayısız savava rımda bulunmayı gerektiriyor. Genelde böyle çıkarımları fark etmiyoruz bile ki bu iyi bir şey çünkü her gün bunların farkında olsaydık tekben ci [solipsist] döngülere saplanır, bütün gün kendi düşünce lerimizi kovalardık. Bu da bizi tekrar Peirce'a, özellikle de zekanın altında yatan çıkarsamanın sacayağı biçimli çerçe vesine getiriyor: tümdengelim, tümevarım ve savavarım.
141
10 TÜMDENGELİMİN V E TÜM EVARIMIN SORUNLARI
Düşünce tarihi boyunca çıkarım ile tümdengelim eşanlamlı sayılmıştır. Aristoteles tasım olarak bilinen basit bir tüm dengelim biçimini incelemişti: Bu akıl yürütme biçiminde, doğru olduğu bilinen veya doğru olduğuna inanılan iki önermeden üçüncü bir önerme, yani bir sonuç çıkıyordu. Aristoteles kendisinin ve başkalarının savlarını incelemek ve doğru akıl yürütmenin zeminini oluşturmak için tasımları kullanarak klasik mantığı geliştirmişti. Aristotelesçi gele nekte zeka, tümdengelimin bilinen kurallarına uymak zo rundaydı. Bu makul bir taleptir. Örneğin "Tanrı sevgidir. " ve " Sev gi Kördür. " önermelerinden yola çıkıp Ray Charles'ın da kör olması nedeniyle Tanrı olduğunu savunan birine inan mamak gerekir çünkü bu bir safsatadır, tümdengelimli akıl yürütmenin kurallarını ihlal eder. Tümdengelimli mantık geleneğinin yaptığı, tüm bu akıl yürütmeleri en ince ayrın tılarına kadar kağıda dökmek olmuştur. Aristoteles ayrıca tümdengelimin kurallarının 'pratik' denen akıl yürütmeyle nasıl bağlantılı olduğunu da ele almıştır. Örneğin zeki bir failin belirli bir hedefe ulaşmak için yaptığı planın adımla rı mantıksal olarak çözümlenebilir. (Bu planın 'doğruluğu'
• TÜMDENGELIMIN VE TUMEVARIMIN SORUNLAR!
k ağıt üzerinde tanıtlandığı halde iş icraya gelince plan suya düşebilir ama bu da en azından bir başlangıçtır. ) Mantıksal (doğru) akıl yürütme ve planlama, yapay zeka araştırmalarının da önemli alt alanlarıdır. Üstelik klasik ya pay zeka çalışmaları neredeyse başlangıcından itibaren tüm dengelim gibi simgesel mantık türlerini kullanarak akıl yü rütme ve planlama yaklaşımlarını incelemiştir. Örneğin bir yapay zeka sistemi tasımları ve bir planlama algoritmasını uygulamaya sokabilir. (Bu planlama algoritmalarına biçim kuralları diyebiliriz. A, B ve C sıralı eylemlerken, H de arzu lanan hedefse şöyle ifade edilebilir: (A, B, C, . . . } ---+ H) Böyle yöntemler kullanılarak yapay genel zeka çalışmaları alanında büyük buluşlar yapılamadıysa da Stuart Russell gibi modern yapay zeka bilimciler bile son kertede simgesel mantığın da inşa edilebilecek bir yapay genel zeka sisteminin önemli bir bileşeni olacağında ısrar ediyorlar çünkü zeka birçok şeyin yanı sıra akıl yürütme ve planlamayla da ilgilidir. Böylece Aristoteles, binlerce yıl önce çıkarıma dair for mel çalışmaları başlatmış oluyordu. Hatta bundan onlarca yıl kadar önce yapay zekayla ilgili çalışmaların başlamasını da onun bu konudaki çalışmaları sağladı diyebiliriz. Sağ duyunun önkoşulu bilgidir. Simgesel akıl yürütme de tüm dengelim kurallarını kullanarak zekayı doğrudan doğruya bilgiye bağlıyor. Ne yazık ki hiçbir yapay zeka sisteminin bugüne kadar sağduyuya sahip olamadığını söyleyebiliriz. Yapay zeka çalışmalarının öncülerinden John McCarthy -ki 1 95 6'daki Dartmouth Konferansı'nda bu alanı kuran lardandır- bunu erken fark edenlerden biridir. Bu nedenle bilgiye dayalı sistemlerin geliştirilmesi için çok çaba har camıştır. Bu tür sistemler akıl yürütmek ve eyleme geçmek için dünyaya ilişkin bilgilerin bilgisayar ortamında temsil edilebilen ifadeleriyle çalışırlar. Bilgiye dayalı eski sistemle rin hepsi, son kertede başarısızlığa uğramalarına neden olan bazı sorunlarla karşılaştılarsa da bu sorunlar aynı zamanda epey yol gösterici oldu. Bu alanda bir ilerleme kaydetmek 143
YAPAY ZEKA MiTi
umuduyla bu sorunlardan bazıları bugünkü gelişmelerin ışığında belki tekrar ele alınabilir ama diğerleri temellerle ilgili görünüyorlar. Özellikle kurallı akıl yürütmenin aşıl maz bazı sınırlarının olması bu sorunların başında geliyor. Tümdengelimli mantığın isabetliliği kesinliğinden ileri gelir. Kesinliği yapay genel zeka sisteml�rinin -hatta insanların bile- zekasının ölçütü haline getirmekse haliyle çıtayı fazla yükseğe koymak anlamına geliyor.
Tümdengelim: Nasll Asla Yanhş Çıkmazsımz? Mantıkçılar -ve bilgisayar bilimciler- doğru veya yanlış olabilen önermelerden oluşan sistemlerde yapılan tümden gelimli çıkarımları çözümlerler. Teamüle göre, bir çıkarımı oluşturan önermeler dizisi içinde sondakinden önce gelen tüm önermelere 'öncül' adı verilir. Son önermeyse bu öncül lerden çıkarılır ve ona da 'sonuç' adı verilir. Öncüllere ve so nuca hep birlikte 'argüman' adı verilir. İyi bir tümdengelimli argümanın 'yanlış sonuca ulaştırma' ihtimali yoktur çünkü böyle bir argümanın sonucu, öncüllerinden zorunlulukla çı kar. İşte size bir örnek:
Yağmur yağarsa yerler ıslanır. Yağmur yağıyor O halde yerler ıslaktır. Yukarıdaki argümanın sonucu, argümanın iki öncülün den yapmamız gereken çıkarımı bize gösteriyor. Aslında, başka hiçbir bilgi olmaksızın sadece eldeki öncüllerden ha reket edildiğinde hangi sonucun çıkacağı sorusuna bir ya nıt veriyor. Öncülleri doğru olduğunda sonucun da doğru olmak zorunda olduğu [yani yanlış olamadığı] çıkarımlara geçerli çıkarımlar deniyor. Geçerlilik, çıkarımın kullandığı akıl yürütme kuralına vurulmuş 'güvenilirlik' damgasıdır da diyebiliriz: Öncüllerimiz (veya o güne kadarki inançla rımız) doğru olduğunda söz konusu kuralı izlemenin bizi 1 44
• TÜ MDENGELIMIN VE TUMEVARIMIN SORUNLAR!
doğru sonuçlara ulaştıracağından emin olabiliriz. Dolayısıy la yukarıdaki örnek geçerli bir çıkarımdır. Dahası, insanlık tarafından bilinen en eski tümdengelim kurallarını kullan maktadır. Latince adıyla modus ponens diye bilinen bu çı karım kuralını kısmen simgesel bir dil kullanarak şöyle ifade edebiliriz:
P ise Q p O
halde Q
Bunun tam çözümlenebilir (hesaplanabilir) mantıksal ifadesi şudur:
P -+ Q, p
Q Burada '--+' ekleminin P ve Q önermelerinin doğruluk de ğerini belirleyen çok belirli bir anlamı vardır. Tümdengelim li mantıkta koşul ekleminin ifade ettiği kurala içerme denir ve P öncülünün doğru olması halinde P --+ Q kuralının bir gereği olarak Q sonucunun çıkmak zorunda olduğunu ifade eder. ( Doğru veya yanlış olanaklar yelpazesi ise doğruluk tablosuyla ifade edilir. Bunu da daha sonra göreceğiz. ) Şimdi yerin ıslanmasıyla ilgili argümanımızda bazı de ğişiklikler yapalım. Diyelim ki yağmur yağmıyor, o zaman ne olacak ? O zaman ilgili kural 'işletilmeyecektir' yani bir sonuç çıkarılmayacaktır. Fakat argümanımız geçerliliğini korumaya devam edecektir çünkü yağmur yağarsa sokakla rın ıslana cağı hala doğrudur. Yağmur gerçekten yağıyorsa, yani çıkarımın öncülü doğru bilgiyse, argümanımız geçerli olmanın da ötesine geçip 'sağlam' hale gelecektir. Burada sağlamlık, doğruluk demektir fakat geçerliliğin sağladığı ko145
YAPAY ZEKA MiTi
şullu doğruluğun aksine bu, gerçek doğruluktur. Sağlamlık, çıkarımın öncüllerinin 'doğru' bilgiler olduğunu ifade eder. Tümdengelimli çıkarımlarda bulunan zeki faillerin önceden edindikleri doğru bilgilerden hareketle doğru sonuçları çı karmalarını güvenceye alır. Oysa geçerlilik, zeki faillerin yaptıkları çıkarımların sadece biçiminin doğruluğunu gü venceye alır, yani öncüllerin yalan veya yanlış bilgiler olup olmadığına bakmaz. Bu yüzden sağlam olmayan geçerli tümdengelimli argümanlar gülünç ve saçma sapan sonuçla ra vardırabilir. Bir örnek verelim:
Yağmur yağarsa domuzlar uçar. Yağmur yağıyor. O halde domuzlar uçuyor. Bu argüman düpedüz saçma olmasına rağmen pekala geçerlidir çünkü koşullu bir önermeden hareket eden akıl yürütme tarzına, yani yine modus ponens 'e başvurmaktadır. Argümanın ilk öncülü elbette yanlıştır. Yağmur yağmıyorsa ikinci öncülü de yanlış olurdu. Fakat yağmur yağıyor olsay dı bile bu argümanın ilk öncülüne bel bağlayamazdık çünkü yağmurun yağışıyla domuzların uçuşu arasında hiçbir bağ lantı yoktur; hava nasıl olursa olsun domuzlar uçamaz. Do layısıyla bu argüman geçerlidir ama sağlam değildir, haliyle işe yaramazdır. işte size sağlam bir tümdengelim örneği:
Bütün insanlar ölümlüdür. Sokrates bir insandır. O halde Sokrates ölümlüdür. Bu çıkarımın sonucu yanlış olabilir mi ? Olamaz. Öncül leri doğru olduğunda sonucu da doğru olmak zorundadır. işte bu nedenle tümdengelim hem insanlara hem de maki nelere 'kusursuz' ve kesinlikli bir düşünme şablonu sağlar. Tümdengelimin matematik ve bilimlerde enine boyuna irde lenmiş ve yapay zeka alanında çeşitli önemli uygulamalar da başarıyla kullanılmış olmasının temel nedeni de budur. Örneğin ilk andan itibaren tümdengelime dayalı yapay zeka 146
• TÜMDENGELIMIN VE TUMEVARIMIN SORUNLAR!
sistemleri gerçek -yani 'oyuncak' olmayan- matematik teo remlerini otomatik olarak tanıtlayabilmişlerdir. Nitekim ya pay zeka çalışmalarının öncüleri Alan Newell, Herb Siman ve Cliff Shaw'ın parlak zekalarının bir ürünü olan Mantık Kuramcısı adlı bilgisayar programı, Bertrand Russell ile Alfred North Whitehead'in birlikte yazdıkları ve 20. yüzyıl mantığının temellerini atan Principia Mathematica [Mate matiğin tlkeleri] adlı kitabı kullanıp 1 95 6 gibi erken bir ta rihte bile ilginç mantık teoremleri üretebiliyordu. Tümden gelim kullanan otomatik akıl yürütme sistemleri bilgisayar anakart devrelerinin tasarlanması sırasında ve donanım ve yazılımların hata veya çelişkiler barındırmadığından emin olmak için de kullanılmışlardır. 1 Böyle durumlarda tümden gelimli yaklaşım, istatistiğe ve makine öğrenimine başvuran modern yapay zeka yöntemlerine kıyasla daha kolay veya daha etkili bir yöntemdir. Yapay zeka çalışmaları alanının ilk dönem araştırmacılarının da bildiği üzere, bizim bilgimiz (yağmur örneğinde olduğu üzere ) genellikle simgesel olarak ifade edilebiliyor, dolayısıyla tümdengelime başvurmak akla yatkın görünüyor ama tümdengelimi genel zekaya doğru ge nişletme çalışmaları iyi bilinen bazı sorunlarla maluldür.
Bilgi Sorunları Yıllar içinde tümdengelimin de birçok sorun barındırdığı keşfedildi. Bu sorunların herhalde en büyüğü tümdengeli min asla yeni bir bilgi sunmamasıdır. insanların ölümlü ol duklarını -yani öyle veya böyle öldüklerini- biliyorsam ve falancanın da bir insan olduğunu biliyorsam onun öleceği ni zaten biliyorum demektir. Tümdengelim verili öncüller1
Gödel 'in eksiklik teoremlerinden bildiğimiz üzere, teknik açıdan evrensel hata denetleme sistemleri oluşturmak olanaksız olsa da tümdengelimli sistemleri yazılımların çeşitli yanlarının yanı sıra şartnamelere uygun olup olmadığını denetlemek için de kullanmak pekala mümkündür. 147
YAPAY ZEKA MiTi
den hareketle varılması gereken sonucun onaylanmasından ibarettir ve bunu basit bir tasımda görmek gayet kolaydır çünkü aradığımız 'bilgi' öncüllerde zaten içeriliyor. Sonucun tek yaptığı, o örtük bilgiyi açık hale getirmek, gün yüzüne çıkarmak oluyor. Tümdengelim bir öncüller kümesinden çıkmayan, hatta deli saçması diyebileceğimiz sonuçları çıkaranlara karşı bir savunma aracı olarak kullanıldığında son derece faydalı bir akıl yürütme tarzıdır. Örneğin insanın ölümlü, Sokrates'in de insan olduğundan hareket edildiğinde Alfa Centauri yıldızının peynirden yapıldığı sonucunun çıkacağında ıs rar eden birine karşı gayet güzel işe yarıyor. Tümdengelim rasyonel faillere 'şirazeden çıkmamalarını' sağlayacak bir dizgin sunuyor ki bu da zekice çıkarımlarda bulunacağını umduğumuz tüm yapay zeka sistemleri için iyi bir ilk adım olur. Fakat kendimizi tümdengelimle sınırladığımızda fazla ilerleme kaydedemiyoruz. Örneğin Kopernik'in günmerkez li kuramına Batlamyusçu astronomlar tümdengelimli akıl yürütmeyle pekala şöyle yanıt verebilirlerdi:
Göğü Tanrı yarattıysa dünya göğün merkezindedir. Göğü Tanrı yarattı. O halde dünya göğün merkezindedir. Bu geçerli bir argümandır ama bize öncüllerin doğru ol ması halinde sonucun yanlış olamayacağından fazlasını söyle mediğini tekrar belirtmek gerekiyor. Burada çıkarımın bütün yükü, öncüllerin doğruluğu hakkında empirik verilere başvur mayı gerektiren soruların üzerindedir. Örneğin Sokrates'in ölümlülüğüyle ilgili soruşturmamızda çıkarımımızı deyim ye rindeyse 'bedavaya getiriyoruz' çünkü insanların günü gelince öldükleri konusunda zaten genel olarak hemfikiriz. Oysa ila hi bir varlık tarafından yaratılan her göğün merkezinde geze genimizin bulunduğu genellemesi de en az diğer estetik ve dini iddialar kadar tartışmalıdır. Bunları pekala başka türlü de yorumlayabiliriz. ( Örneğin Galileo'nun ünlü sözüyle: "Tanrı bize göğün nasıl hareket ettiğini değil, göğe nasıl yükseleceği148
• T0MOENGELIMIN VE TUMEVARIMIN SORUNLAR!
rnizi söyler. " ) Hele ki ateist veya bilimsel maddeciysek ikinci öncülü doğrudan reddedebiliriz. Dolayısıyla tümdengelim bize yeni bir bilgi vermiyor, sa dece akıl yürütmede kasıtsız birtakım hatalar yapılmışsa tartışmalı inancı düzeltmeye yarıyor. Hatta komplo kuram cıları asla tümdengelimli akıl yürütme hataları yapmıyor olabilirler; daha ziyade başkalarının su götürür veya düpe düz deli saçması saydığı öncülleri kayıtsız şartsız doğru ka bul ediyorlar. Başka bir deyişle tüm zeki sistemlerin baştan itibaren doğru (ve faydalı) inançlara tam olarak odaklanabilmesi için diğer çıkarım türlerine ihtiyacı olacaktır. Tümdengeli min çıkarıma sağladığı kesinlik yeterli değildir.
ilgi Kurma Sorunları Tümdengelimi genel zeka mühendisliğinde kullanılmaya el verişsiz hale getiren başka kısıtlamalar da var. tlgi kurma sorunları bu konuda özellikle başımızın belasıdır. "Yağmur yağarsa domuzlar uçar. " önermesi domuzlar uçamadığı için doğru değildir ama bir yandan da son derece kötü bir ilgi kurma biçimidir. Çünkü yağmurun yağmasının domuzların uçmasıyla uzaktan yakından ilgisi yoktur. Uçaklar uçabilir ama " Yağmur yağarsa uçaklar uçar. " gibi bir önerme ilgisiz öncüller arasında ilgi kurmaya çalışmaktadır. Gerçi bu ilgi en azından bazı durumlarda kurulabilir, yani bu öncül belli şartlarda doğru da olabilir ama yağmurun yağması olgu sundan hareketle havadaki uçaklarla ilgili birtakım inançlar oluşturmazsak iyi ederiz. Çünkü bu önerme de ilgi kurma meselesini görmezden gelmektedir. Buradaki sorun kısmen neden-sonuç ilişkisidir: Yağmur uçakların uçmasına neden olmaz (hatta bazı koşullarda havalanmalarına engel olur ) . Dolayısıyla burada iş dönüp dolaşıp bilgiyi nasıl kullanmak istediğimiz meselesine geli1 49
YAPAY ZEKA MiTi
yor. " Termometre kırmızı eşiği geçtiyse dışarıda hava sıcak tır. " önermesi doğrudur. Ama sıcak hava dalgasının olası açıklamasını çıkarsamak istediğimizde termometre işimize yaramayacaktır. Başka bir deyişle, bu önerme doğru olsa bile konuyla ilgisiz olacaktır. " Horoz öterse güneş doğar. " önermesi de doğrudur ama yapay genel zeka sistemine güne şin neden doğduğunu sorduğumuzda bize açıklama olarak horozun ötüşünü sunarsa o sistemin zeki olduğunu söyle mekten muhtemelen imtina ederiz. Bilim felsefecisi Wesley Salmon'ın verdiği şu örneği ele alalım: Düzenli doğum kontrol hapı alan hiçbir erkek gebe kalmaz. Bir adam eşinin doğum kontrol hapını düzenli olarak alıyor. O halde o adam gebe kalmaz. 2 Bu, sağlam bir tümdengelimli argümandır, yani doğru öncüllere sahip bir modus ponens örneğidir. Ama adamın
gebe kalmamasının sunulan nedenlerle hiçbir ilgisi yoktur. Sunulan nedenler konuyla tamamen ilgisizdir çünkü erkek ler gebe kalamazlar. Dolayısıyla bu sav hiçbir şeyi açıklamı yor. Olguların ve kuralların sadece doğru bilgisini barındı ran engin bir veritabanıyla donanmış bir robotun bu şekilde tümdengelimi kullanarak akıl yürüttüğünü hayal edin: Bu verilerde yanlış bir şey olmamasına rağmen robot hiçbir şey anlamayacaktır çünkü nelerin konuyla ilgili, nelerin gülünç olduğunu bilemeyecektir. Daha incelikli bir örnek düşünelim: Bir avuç arsenik yutan herkes 24 saat içerisinde ölür. ]ones t zamanında bir avuç arsenik yuttu. O halde ]ones t zamanından sonraki 24 saat içinde ölecektir.
Bu da kusursuz bir tümdengelimli argüman örneğidir ama Jones arseniği t zamanında yutup zehir vücuduna yayılma dan önce ani bir trafik kazası geçirip ölmüşse (belki midesini Wesley Salmon, Causality and Explanation, Oxford: Oxford University Press, 1998. 15 0
• TÜMDENGELIMIN VE TUMEVARIMIN SDRUNLARI
yıkatmak için alelacele hastaneye yetişiyordu) Jones 'un ölü münü açıklamayacaktır. Dolayısıyla bu argüman iyi bir tüm dengelim örneği olsa da ilgisiz bir çıkarımdır. Bize hiçbir şey söylemiyor. Hatta bizi yanlış yönlendiriyor. Başka bir deyişle, ilgi kurma genellikle nedensel ilişkilerin bilgisini, yani belirli bir olayın belirli bir sonuç doğurduğunu veya belirli başka olaya neden olduğunu bilebildiğimizi baştan varsayıyor. Tümdengelimin hep ilgi kurma sorunlarına kurban git mesinin bir başka nedeni de günlük deneyimlerimizde (ve bilimde ) olayların ve olguların genellikle birden fazla ne deninin bulunmasıdır. Örneğin uçak kazaları genelde hepsi birlikte kazayı açıklayan yakın ve uzak nedenler belirlene rek çözümlenebilir. Kısa süre önce Boeing'in uçaklarının karıştığı kazaları düşünelim. 20 1 8 yılında altı ay içinde Boeing'in iki adet 737 Max modeli uçağı kazaya kurban gi dince kaza kırım soruşturmasını yürüten müfettişler uçağın irtifa kaybını önleme sistemi olan Manevra Özellikleri Tak viye Sistemi'nde [Maneuvering Characteristics Augmentati on System, MCAT] bir yazılım hatası saptadılar. Eski Boe ing 73 7-800 modellerinde yapılan iyileştirmeler bu uçaklara daha büyük motorların takılabilmesini sağlamıştı. Fakat bunun için motorların kanatlardan biraz daha ileride ve ka natların hafifçe üzerinde konumlandırılması gerekmişti . Bu da kalkışta daha dik bir tırmanma açısı getirmiş ve uçak ların kalkışlarda zaman zaman irtifa kaybetmelerine neden olmuştu. Uçaklarda irtifa kaybı elbette nahoş bir durum, hatta felakete davetiye çıkarıyor. Bu nedenle Max'lere olası irtifa kayıplarını önlemek için MCAT yerleştirilmişti. Uçak kalkış sırasında irtifa kaybetmeye başlarsa MCAT devreye girip uçağın burnunu aşağı doğru çeviriyor, kalkış açısını düzeltmeye çalışıyordu. İşte bu sistem ne yazık ki iki uça ğın son hızla yere çakılmasına neden oldu. Endonezya'da 1 5 7 ve Etiyopya' da 1 8 9 kişinin ölümüyle sonuçlanan her iki trajedide de MCAT sistemi kalkışta sorun algılayıp uçağın denetimini pilotların elinden almıştı.
YAPAY ZEKA MiTi
Kazalardan sonra başlatılan soruşturmada MCA T'yi de netleyen .yazılımda kusurlar saptandı. Böylece, yaşanan ka zaların yakın nedenlerinden biri de ortaya çıkmış oluyordu. Fakat soruşturmanın devamında müfettişler, Boeing'in, raki bi Airbus'ın piyasaya sürdüğü yakıt tasarruflu hava taşıtıyla rekabet edebilmek adına işi aceleye getirdiğini de saptadılar. Bu da art alanda bulunan veya uzak diyebileceğimiz neden lerden birini işaret ediyordu: Yeni Max'lerin pilotlarının yetersiz eğitim aldıkları ortaya çıkmıştı. Çünkü Boeing'in yeni uçağını pazarlamak için kullandığı sloganın da durumu olumsuz etkilediği anlaşıldı: Boeing, MAX'lerin yeni bir eği tim gerektirmediğini, 737-800 eğitimi almış pilotlarca uçuru labileceğini iddia etmişti. Sözün özü, bu trajik kazaları birden fazla nedene bağlamak mümkündür. Boeing 737 Max modeli uçakların kalkışta neden çakıldıkları hakkında çıkarımda bu lunabilmek için bir dizi olası nedeni hesaba katmak gerekiyor ve bu felaketleri tek bir nedenle açıklamak mümkün değil. Tümdengelim bunun gibi gerçek dünya senaryoları için uygun değildir. Tümdengelimli çıkarımın sonucunun kesin likle doğru olması gerekir. Oysa gerçek dünyada bu kesinli ği her zaman bulamayız; ilgi kurarken, zorunlu olmadıkları halde belirli durumlarda işe karışan olumsal unsurları da hesaba katmamız gerekebilir. Bu yüzden tümdengelim ger çek dünya senaryolarına uygulandığında bizi doğru sonuca neredeyse hiçbir zaman ulaştırmaz. Platon'un düşünülen ler dünyasında üçgenlerin üç kenarının olması zorunludur; bunlar zorunlu doğrulardır, yani hakikatlerdir. Oysa kar makarışık gerçek dünya deneyimimizde tanık olduğumuz veya çözümlediğimiz çok az şey üçgene benziyor. Daha ziya de Boeing 737 Max vakası -ya da ilerleyen sayfalarda göre ceğimiz üzere sıradan, açık uçlu sohbet- gibiler. Zeka -artık o neyse- tümdengelimden fazlasıdır. Biz de biliş sistemleri yiz ama tümdengelimden ibaret olmadığımız aşikar. Bu da yapay zekanın eğer insan seviyesinde ve başarılı olacaksa sa dece tümdengelimli bir sistem olamayacağını işaret ediyor. 1 52
• TÜMDENGELIMIN VE TUMEVARIMIN SDRUNLARI
Yapay zeka çalışmalarında modern dönemden ( 1 990'lar dan) önce alana hakim olan ve eleştirmenlerin 'eski usul yap ay zeka' dedikleri araştırmaların uğradığı başarısızlıkla rın ardından yapay zeka bilimciler konuya tümdengelimli çıkarım ekseninde yaklaşmayı tamamen bıraktılar. Bugün den bakınca yapay zekayı 'kurallar' ve tümdengelim üze rinden ele alan yaklaşımların bu alanda çalışan uzmanlar tarafından ciddiye alınmış olması bile genç okurlara şaşırtıcı görünebilir. Ama öyleydi. Yine de tümdengelimli çıkarımın ba rındırdığı aşılmaz sorunlar en sonunda bu yaklaşımın köküne kibrit suyu döktü. Web yaygınlaşınca sığ veya is tatistiksel diye nitelenen yöntemler de bir anda muazzam boyutlarda veriye erişme olanağı kazandılar. Bu da kurallı veya tümdengelimli sistemleri bu yöntemler karşısında daha kullanışsız ve hantal hale getirdi. Ciddi yapay zeka çalışma larına kısa sürede yeni bir paradigma -ve yeni bir çıkarım türü- hakim olacaktı. Bu çıkarım türüne tümevarım deni yor. Şimdi onu ele alacağız.
Tümevarımın Gücü ve Sınırları Tümevarım deneyimden bilgi edinmek demektir. Deneyim se genellikle gözlemler aracılığıyla -bir şeyleri görerek- inşa edilir ama elbette beş duyumuzun herhangi biriyle de kaza nılabilir. ( Örneğin yanan sobaya çıplak elle dokunmamak gerektiği fikri dokunma deneyiminden hareketle yapılan tümevarımla ulaşılmış bir genellemedir. ) Genel biçimi itiba rıyla tümevarım, tümdengelimin tersidir, tek tek durumlar dan hareketle genel bir hipotez oluşturmaktır. Dolayısıyla tümevarımla ulaşılan hipotezler bir gözlemi kapsar, yani onu açıklar. Tümevarımın başlıca mekanizması sıralama yahut sayıp dökmedir. Örneğin bir kuş nüfusunun özellik lerine dair çıkarımlarda bulunmak için önce çok sayıda kuş gözlemek gerekir. Tümevarımın tüm biçimlerinde, sıralama 153
YAPAY ZEKA MİTi
merkezi bir rol oynar v e bu çıkarım türünün yapısının ve sınırlarının anlaşılması açısından büyük bir önem taşır. Tümevarım son derece güçlü bir akıl yürütme biçimidir. Üstelik güçlü olmasının tek nedeni hipotezler (tüm X nes neleri Y özelliğine sahiptir türünde genellemeler) aracılığıy la şeyler dünyasını kategoriler halinde örgütleyebilmesi de değildir, onu kullanan faillere tahmin gücü de bahşeder. 3 Birinci ligin önemli takımları arasında oynanan her futbol maçının ardından insanlar kendilerini coşkuyla sokaklara atıyorlarsa bir sonraki maçtan sonra da aynı şeyi yapacak larını çıkarsayabilirim. İşte bu bir tahmindir. Tümevarım aslında gündelik hayatın içinden bir fikri yansıtıyor: Çev remizde olup bitenleri gözlersek onları açıklama ve tahmin etme becerisi de kazanırız. Nitekim beklentilerimizin çoğu tümevarıma dayalıdır. Birileri evinizin kapısının mandalını on santimetre sağa kaydıracak olsaydı, kapıyı açmak için gayriihtiyari olarak elinizi kapının mandalına attığınızda muhtemelen onu ıskalardınız. Kapı mandalını daha önce defalarca görüp tuttuğunuz için geçmişte sayısız örnekten hareketle mandalın nerede olduğuna dair örtük bir kuramı nız -daha doğrusu bir hipoteziniz- vardır. Tümevarımın başka meziyetleri de var. Örneğin tümeva rım sentetiktir. Kant'ın deyimiyle, bize yeni bir bilgi verir. Üçüncü Cadde'yle Ana Cadde'nin kesiştiği köşede trafiğin en fazla hangi saatlerde sıkıştığını internetten öğrenebilirim ama işyerim tam da o köşedeyse trafiğin durumunu pence reden bakıp öğrenmem de mümkündür. Üstelik pencereden bakıp öğrendiğimde edindiğim izlenim, beklentilerimi ve ne zaman işten çıkmamın daha iyi olacağını tahmin etmeme yarayan bir gözlem görevi görür. Tümevarım, gücünü es nekliğinden alıyor ama ne yazık ki bu esneklik tümevarımın 3 Burada, yapay zeka alanında sık kullanılan 'fail' [agent] terimini tercih ettim. Fail, bağımsız hareket edebilen her şeyi ifade ediyor. Dolayısıyla zeka sahibi bir fail -ya da bir 'biliş faili' - bir kişi de olabilir, bir yapay zeka sistemi veya bir uzaylı da olabilir. 1 54
• TÜMDENGELIMIN VE TUMEVARIMIN SDRUNLARI
sonucunun -tümdengeliminkinin aksine- tanıtlanamayaca ğı veya doğru olmak zorunda olmadığı anlamına da geliyor. Gö zlemden edinilen bilgi her zaman geçicidir çünkü dün ya değişir. Tümevarımla oluşturduğum hipotezleri gelecek boşa çıkarabilir. Örneğin bugüne dek bir kez bile arızalan mamış arabam yarın sabah (Murphy Yasaları gereği tam da toplantım varken) çalışmayabilir. İşte tümevarım budur. Değişimin nasıl veya ne zaman meydana geleceğini -veya gelmeyeceğini- tek başına gözlem bize söyleyemez. Tümevarımın gücü, zeka ile etrafımızdaki dünyaya bak ma arasında var olan güçlü bağlantıda yatıyor. Modern bilim, deneyimle bilgi edinmenin yolu olarak tümevarıma sadakatle bağlanmasa, mümkün olmazdı. Şimdi sıralama veya sayıp dökme olgusuna bakalım. En basit haliyle tümevarım, genel bir sonuca veya genel bir ku rala (veya yasaya ) ulaşmak için yalnızca önceki gözlemlerin sıralanmasını gerektirir. Alın size tümevarımlı bir argüman:
[N çok büyük bir sayı olmak üzere,] Bugüne dek gözlemlediğimiz N sayıda kuğunun hepsi beyazdı. O halde tüm kuğular beyazdır.
Veya Bugüne dek gördüğümüz tüm yaşam karbon temelliydi. O halde tüm yaşam karbon temellidir.
Bu örnekler, bir şeyin tipi veya türü hakkındaki bilgi lerimizin temelini çoğu zaman o şeyin özelliklerinin veya özniteliklerinin basitçe sıralanmasının -yani sayılmasının oluşturduğunu gösteriyor. Kuğuların beyaz kuşlar, yaşamın da karbondan doğan bir fenomen olduğunu işte bu yüzden söylüyoruz. Ayrıca bilimde ve yaşamda kuğuların neden be yaz veya yaşamın neden karbon temelli olduğu konusunda hikayeler anlatmayı da faydalı buluyoruz ama bu tür neden soruları, sıralayıcı olsun veya olmasın her türlü tümevarı mın sınırları dışında kalıyor. Bir çıkarım türü olarak tümevarımı böylesine faydalı kı lan da basitliğidir. Bir nesnenin bir özelliğini ne kadar fazla 155
YAPAY ZEKA MiTi
gözlersem bu özelliğin o nesnenin ayrılmaz parçası olduğu na güvenim de o kadar artar. Diyelim ki bir torbadan peş peşe toplar çekiyorum. Çektiğim her topun beyaz olduğunu görüyorum ve bir noktada güvenle şu genellemeye varıyo rum: Torbadaki topların hepsi beyazdır. Torbadaki tüm topları çekmeden çıkardığım bu sonucun yanlış olma ola sılığı hep vardır. Dolayısıyla tümevarım kestirimlerde bu lunmada faydalı olsa da bize kesin bilgi vermez. İşte size bir başka tümevaran genelleme: Bir nüfusun örnek/eminin % Q kadarı P özelliğine sahiptir. O halde nüfusun % Q kadarı P öze lliğine sahiptir.
Nüfusun örnekleminden yola çıkarak tümevarımda bulunmak bilimsel soruşturmalarda sık başvurulan bir yoldur ve yıllar içinde bu genellemeleri eldeki gözlem verilerinden hareketle olabildiğince güçlendirip yanılma payını olabil diğince düşürecek son derece gelişkin istatistik teknikleri geliştirilmiştir. Sezgisel açıdan bakıldığında da tümevarıma dayalı genellemelerde bulunmak makuldür: Örneklemimde 7 5 beyaz top ve 25 siyah top varsa ve elde başka kanıtlar yoksa 1 000 toptan 750'sinin beyaz olmasını beklemem akla yatkındır. Böyle bir çıkarımda bulunmakta sorun yok gibi görünüyor, tek eksiği kesinlik. Rastgele örnekleme de gözlemden hareketle genellemede bulunmaya dayanır. Bunu siz de deneyebilirsiniz: Birkaç kez yazı tura atıp kaç kere yazı, kaç kere tura geldiğini not edin. İşte bu bir rastgele örneklemedir (yazı tura atışını bozama yacağınız için para hileli değildir) . Peş peşe iki veya üç kez tura gelebilir. Hatta çok küçük bir olasılıkla beş kez attığı nızda hep tura veya yazı da gelebilir. Fakat örnekleminiz ne kadar büyük olursa yazı veya tura gelme ihtimalinin % 50'ye o kadar yaklaştığını göreceksiniz. Dolayısıyla tümevarım da bulunarak şu genelleye varabilirsiniz: Her 1 000 atıştan 500'ü tura gelir. Bu da aslında yeterince doğru bir sonuçtur. (Nitekim büyük sayılar yasası bize örneklemimiz yeterince büyük olursa olasılığın gerçek olasılığa o kadar yaklaşaca156
• TÜMDENGELIMIN VE TUMEVARIMIN SORUNLAR!
ğını söyler. Örneğin para 1 milyon kez atıldığında tura veya yazı gelme ihtimali %50'ye çok yaklaşacaktır. ) Tümevarımı kullanan istatistiksel genellemeye bir başka örnek verelim: Rastgele örneklenmiş seçmenin % 73 'ü X adayını destekliyor. O halde X adayı oyların yaklaşık % 73 'ünü alacak.
Fakat seçimden önce X adayının adı bir rezalete karışır sa bu tümevarım geçersiz olacaktır. Yine de elimizde başka bilgiler yoksa bu şekilde akıl yürütüp ne olacağını tahmin etmek makul bir tutumdur. Modern yapay zeka, istatistiksel çözümlemeye dayanır, yani tümevarımlı bir akıl yürütme çerçevesine bel bağlar ki bu durum ticari uygulamalarda bizi epey verimli sonuçlara ulaştırıyor. Örneğin yapay zeka, geçmişe ilişkin gözlemle rine dayanarak yaptığı tahminlerle birtakım önerilerde bu lunabiliyor. Sosyal medya sayfalarında içerik akışına tanık olan herkesin aşina olduğu başka bir örnek verelim: X kullanıcısının okuduğu haberlerin % 75'i A sitesinden ge len muhafazakar siyasi yorumlardan oluşuyor. O halde X kullanıcısı yeni haberleri A sitesinden okumak isteyecektir. Fakat X kullanıcısı arada bir ilerici New Republic ga zetesinden de makaleler okumak isteyebilir. X'in tercihleri hakkında tümevarımla çıkarımda bulunan bir yapay zeka sistemi muhafazakar çizgide olmayan bu haberleri muhte melen eleyip ona göstermeyecektir. Gözlemden hareketle tümevarıma bel bağlamanın hemen fark edilebilen olumsuz bir yönüdür bu. Bu genellemeler daha derin bilginin ancak bir sureti olabilirler (daha da kötüsü geleceğin geçmişe ben zeyeceği beklentisi taşırlar) . Tümevarımın sınırları olduğuna ilk kez 1 8 . yüzyılda Da vid Hume dikkat çekti ve felsefecilerle bilim insanlarının kucağına bugün 'tümevarım sorunu' dediğimiz sorunu bı raktı. Hume'un ifadesiyle tümevarıma bel bağlamak, 'hiçbir deneyimini edinmediğimiz durumların, deneyimlediğimiz durumlara benzediğin [e] ' inanmamızı gerektiriyor. Başka 1 57
YAPAY ZEKA MiTi
bir deyişle, uyguladığımız genel tümevarım kuralının gör mediğimiz örneklere de uzanması gerekiyor. Oysa bu kura lın başka örnekler için de geçerli olacağının hiçbir garantisi yok. Tümdengelimin aksine tümevarımın yapısında bize mantıksal kesinlik sunan hiçbir şey yok. Dünyanın birtakım nitelikleri var, biz de dünyayı inceleyip bunlara dair ( bize göre) bilgi çıkarıyoruz ve tümevarım bir şekilde işliyor.4 Tümevarım sorunu felsefecilerin oturdukları yerden dert ettikleri bir sorunmuş gibi görünebilir ama işin aslı öyle de ğil. Tümevarımlı çıkarımın sınırları, açıklayıcı kuramların peşinde olan bilim insanlarının başına sürekli çorap örüyor. Her yerde bunun örneğine rastlıyoruz. Eskiden yumurtanın sadece beyazını yiyorduk çünkü besin bilimi yumurtanın sarısındaki doymuş yağların sağlığa zararlı olduğu konu sunda bizi sürekli uyarıyordu. Bugünse besin bilimcilerin bizi yumurtanın hem sarısını hem de beyazını yemeye teş vik ettiklerini görüyoruz. Çünkü yumurtanın sarısı hem yağ yakmamıza yarıyor hem de keyfimizi yerine getiriyor. Üste lik bizi kalp rahatsızlıklarına karşı koruyor. ( Oysa bundan sadece yirmi veya otuz yıl önce kalp rahatsızlıklarına yol açabileceği düşünülüyordu. ) Bu utanç verici geri viteslerden tamamen tümevarımı sorumlu tutmak mümkündür. Bunlar neden mi oluyor? Çünkü gözlemlerimiz ve sınamalarımız asla eksiksiz olamıyor, yani asla tüm örnekleri kapsamıyor. Korelasyonlar bize altta yatan nedeni en fazla telkin edebi liyor -yani bize doğru bilgi kırıntıları verebiliyor- ve biz de bu telkinlere güvenerek hareket ediyoruz. Fakat neyin neyi etkilediğini gözleyip sınarken bir şeyleri her zaman gözden kaçırmış olabiliriz. Nitekim korelasyon sahte çıkabilir veya rastlantı olabilir. Tamamen yanlış yere bakmış da olabiliriz. Örneklemimiz çok küçük olabilir veyahut sonraları başka bir neden ortaya çıkar ve örneklemimizin nüfusun tamamını 4
David Hume, Hume's Treatise of Human Nature [1 739-1 740], L. A. Selby Bigge (ed. ), Oxford: Clarendon Press, 1 8 8 8 , s. 89. [Türkçesi: lnsan Doğası Üzerine Bir inceleme, çev. Ergun Baylan, BilgeSu Yayınevi, Ankara, 2009, s. 148]
• TÜMDENGELIMIN VE TUMEVARIMIN SORUNLAR!
temsil etmediğini anlayabiliriz. Bu yaygın bir sorundur ve bu sorunun kökeninde tümevarım ve onun sınırlamaları ya tıyor. Yani felsefeciler vaktimizi hiç de boşa harcamıyorlar. Her türlü tümevarım temelde sıralamaya, yani saymaya dayanıyor. Bu, kuşku uyandıracak denli basit bir yöntem gibi gelebilir ve de gelmelidir: Sırf örnekleri sıralayarak dün ya hakkında kuramlar oluşturabilir miyiz? Büyük ölçüde, evet. Tek bir deneyimden hareketle tümevarımda bulunamı yoruz. Örneğin bir orangutan gördüğümde neye benzediğini önceden biliyorsam onu orangutan olarak sınıflandırabili rim ama hayvanın türünü henüz bilmiyorsam, gördüğümün orangutan mı şempanze mi yoksa kocaayağın yavrusu mu olduğu sorularına yanıt verebilmem için önce çok sayıda ör neğini gözlemem gerekir. Hume'un da belirttiği gibi, neden leri çıkarsayabilmek için 'sabit korelasyonlara', kategoriler ve türleri çıkarsayabilmek içinse çok sayıda örneğe ihtiyacı mız vardır. (İlerleyen sayfalarda göreceğimiz üzere, makine öğrenimi tam olarak bu şekilde işliyor. ) Elbette tümevarımlı akıl yürütme daha karmaşık biçim ler de alabiliyor: Ekonomi veya sosyal bilimler gibi alanlar da yapılan istatistiksel çıkarımlar da temelde tümevarıma dayanıyor ama bunları anlayabilmek için olasılık kuramını (ve ekonomi ile sosyal bilimleri) iyi bilmek gerekiyor. Bilim dallarında yapılan yeni tümevarımlı çıkarımlar da kaçınıl maz olarak bilim insanlarının sağlam ve doğru buldukları eski çıkarımlara dayanıyor. ( Dolayısıyla bu eski kuramları da bilmemiz gerekiyor. ) Yine de tümevarım temelde örnekle re bakarak genellemeler yapmaktan ibaret. Bu genellemeleri bir hikaye veya bir neden yahut nedenler kümesiyle açıkla yabiliyorsak yeni bir bilgi edindiğimizden emin olabiliyoruz. Yalnız şu farkla ki tümdengelimde bu bilginin doğru olması zorunluyken tümevarımda böyle zorunluluktan söz edemi yoruz, edindiğimiz bilginin yanlış da olabileceğini baştan kabul ediyoruz ve en fazla, elimizdeki bu olası bilgiyi pekiş tirmek için yeni gözlemlere ve sınamalara başvurabiliyoruz. 1 59
Hume'un tümevarım eleştirisi, özü itibarıyla nedensellik ilişkisinin bir eleştirisiydi: Tümevarım nedenlerin bilgisini barındırmaz ( aksi olsaydı sıralamaya gerek olmazdı) . Örne ğin bir kuşun tüy renginin kısmen içinde yaşadığı çevrenin özellikleri tarafından belirlendiğini baştan bilirsek, İngilte re' deki tüm kuğular beyaz olsa bile farklı çevre şartlarında yaşayan kuğuların tüylerinin beyaz olmayabileceğini, siyah da olabileceğini öngörebiliriz. Fakat elimizde genellememi zi açıklayan hazır bir kuram yoksa tümevarımın bunu bize söyleyebilmesi için dünyanın dört bir yanına yolculuk yapıp kuğuları yaşadıkları yerde gözlememiz gerekir. Gözlemin hedefi özgül nedenleri veren hipotezler geliştirmektir oysa tümevarımlı çıkarım bunu yapabilmek için ihtiyaç duydu ğumuz kaynaklardan yoksundur. Dolayısıyla tümevarımın ek çıkarım türleriyle takviye edilmesi gerekir. ( işte burada tümdengelim işe yarayabilir ama o da ancak kısmen . . . ) Mesele şu: Mantıksal çıkarımın sınırları dahilinde anla şılmak koşuluyla tümevarım zorunlu ve yaygın başvurulan bir akıl yürütme yöntemi olsa da epey sınırlıdır. Ayrıca tü mevarım genellikle yanlış anlaşılan bir çıkarım biçimidir ki bu da onun 'bilimsel' ve sağlam empirik bilgiyi tesis ettiğine, böylece bizi ham hayallerden ve spekülasyonlardan kurtara cağına aşırı güvenilmesine neden oluyor. Ünlü dedektifimiz Sherlock Holmes bazen kendi yöntemini fikirler ve kanılarla bulandırılmamış yalın ve berrak gözlemler aracılığıyla bü yük bir sabırla yaptığı tümevarımlar olarak ifade eder. Ona hayret ve hayranlıkla bakan Watson'ı, yaptığının olan bite ni 'dikkatle gözlemekten ibaret' olduğu konusunda temin eder. Holmes yalın gözlemin öneminin farkındadır çünkü bildiğimizi düşündüğümüz şeyler yeni bir şeyler görmemize engel olabilir, dolayısıyla gözlem ne kadar yalın olursa o ka dar iyidir. Fakat bu yaklaşım aslında zekayla ilgili hikayenin sadece bir kısmıdır. Nitekim gözlemlediğimizin önemini de anlamamız gerekiyor. Dupin gibi Holmes da gözlemlerini yenilikçi biçimde bir araya getirerek vakaları çözüyordu. 1 60
• TÜMDENGELIMIN VE TUMEVARIMIN SORUNLAR!
Şeytan işte bu gibi yeniliklerde saklıdır ama tümevarım ye niliği sevmez. Tümevarımlı çıkarım bizi bir başka kaçınılmaz tehlikeyle daha yüz yüze getiriyor ki bu tehlike de Hume'un eleştirel bakışından kaçmamış ve onun tarafından belleğimize ade ta kazınmıştır: Gözlediğimiz yeni olgular bizi pekala şaşır tabilirler. Gündelik hayat gibi dinamik çevrelerde yapılan gözlemler her zaman açık uçlu olurlar. Dolayısıyla gelecekte yapılacak gözlemler o güne dek bilmediğimiz bir şeyleri bir anda açığa çıkarıp bize sürpriz yapabilir. Tümevarıma duy duğumuz güven, çıkarımda bulunurken, onun doğasından ileri gelen kusurları ve eksiklikleri karşısında temkinli olma mızı güçleştiriyor. işte bu da bizi bayram kutlamalarına ya da en azından Bertrand Russell'ın 'tümevarımcı hindi'sinin hikayesine getiriyor.
Russeı•ın Hindisi Bertrand Russell 20. yüzyılın en ünlü felsefecilerinden biri dir ve kamuya mal olmuş bir aydındır. Bir mantıkçı, mate matikçi ve toplumsal eylemci olan Russell, bir keresinde sırf Britanya'nın Birinci Dünya Savaşı'na katılmasını protesto et tiği için altı ayını hapiste geçirmiştir. 1 950'lerde ise nükleer si lahlanma yarışına açıktan karşı çıkmıştır. Düşünce hayatında da aynı aykırı tavrı sürdürmüş, karşı çıkışlarıyla adından söz ettirmiştir. Örneğin dilin kullanım biçiminin felsefeyi hayali sorunlar ve çözümlerle gereksiz yere meşgul edebileceğinden kaygılanmış, bilimsel yöntemi ham hayallerle uğraşan böyle bir felsefenin önünü almanın yolu olarak görmüştür. Fakat Russell'ın da bizzat belirttiği üzere, bilim genel likle açık seçik çıkarım kurallarına bel bağlamadan ilerler. Bilimi çıkarımların modeli olarak kullanmak içinse önce bilimsel soruşturma ve genel olarak doğru bilgi arayışı sıra sında yaptığımız hataları açığa çıkarmamız gerekir. Russell 161
YAPAY ZEKA MiTi
da haliyle tümevarım sorununu mercek altına almıştı. Hatta tümevarım meselesini 'felsefenin sorunları' (kitabı da bu adı taşıyordu) arasında merkezde görüyor ve Sör Kari Popper gibi o da bilimin bilgiyi, olguları toplayarak veya sıralaya rak edinmediğini savunuyordu. Başka bir deyişle, bilimsel bilgiyi sırf tümevarımla edinmiyoruz. Hatta aslına bakarsa nız, tümevarım bu iş için tek başına kullanılamayacak denli kusurlu bir çıkarım biçimidir. Russell buna çok açık ve anlaşılır bir örnek de sunmuştu: Güneşin bugüne dek her sabah doğmuş olması yarın sabah yine doğacağının bir kanıtı değildir. Güneşin yarın sabah doğacağına duyduğumuz güven Hume'un deyimiyle 'çağ rışımların ürettiği alışkanlık'tan ibarettir. Yani tümevarım sadece eksiklik barındırmaz, ayrıca gözlemleri sıralayarak veya sayıp dökerek bilimsel kuramları ve inançları doğrula ması da mümkün değildir. Tümevarımın bunu yapabildiği ne yönelik inancımız sayısız çarpıtmaya neden olmaktadır. Örneğin 'kumarbaz safsatası' yani kumarbazların geçmişte oynadıkları kumar oyunlarını kazanma sıklığının gelecekte oynayacakları oyunlar için muteber bir gösterge olduğuna dair iflah olmaz inançları böyle bir çarpıtmadır. Bu safsa ta aynı sonucun tekrar geleceğine inanmaya neden olabi leceği gibi, bu kez yeni bir sonuç beklemelerine de neden olabilmektedir, yani iki yönlü olarak işleyebilmektedir. Zar atılınca peş peşe aynı sonucun gelmiş olması, sıradaki zar atışının da bir şekilde önceki atışlardan etkileneceği yanılgı sını yaratır. Bu da o ana dek yaver giden şansın aynı şekilde devam edeceği ( " Şansım yaver gidiyor. " ) veya kötü giden şansın nihayet tersine döneceği ( " Şeytanın bacağını bu kez kıracağım. " ) beklentisini doğurabiliyor. Her iki senaryo da gerçekleşebilir ama buradan çıkarılacak ders, sonraki zar atışının sonucunun önceki tüm zar atışlarının sonucundan aslında bağımsız olduğudur. İyi veya kötü şans dizisi eğer zar rastgele bir yüzünün üzerine düşerse devam edecek, baş ka bir yüzünün üzerine düşerse sonlanacaktır. Bu da bizim 1 62
• TÜMOENGELIMIN VE TUMEVARIMIN SOR UNLAR!
tamamen rastlantısal olaylara bile tümevarımı uygulamaya ne denli aç, haliyle safsataya düşmeye ne denli meyilli oldu ğumuzu gösteriyor. Gerçek dünyadaki olayların çoğu, bu örnekteki gibi rast la ntısallık barındırmadığı için her yerde hatalı tümevarım örüntülerini görme eğilimimizi dizginlememizi daha da zor laştırıyor. 'Dışarıda' gerçekten de birtakım örüntüler var ama gözlem verileriyle yetinirsek bunlardan hangisinin sah te, hangisinin sahici olduğunu bilemeyiz. Biz her baktığımız yerde düzenlilikler ve örüntüler görüyoruz. Kumar bir yana, zihnimizin bu tuhaf özelliği bizim gözlemlerimizden hare ketle " Kuğular beyazdır. " " Güneş yarın sabah yeniden do ğacaktır. " " Sabah 03 . 3 0'da asansör hep giriş katında beni bekliyor olacaktır. " gibi genellemelerde bulunma arzumuzu da açıklıyor. Elbette güvenilir genellemeler de yok değil, ni tekim her yerde karşımıza çıkıyorlar ve birer kuruntudan ibaret de değiller. Fakat Russell'ın da belirttiği üzere, tüme varımın sorunu şu: Sadece böylesi genellemelere dayanarak bilgisel çıkarımlarda bulunmanın hiçbir dayanağı yok. Do layısıyla bilim daha derin, daha güçlü çıkarım stratej ilerine ihtiyaç duyuyor. Tek başına tümevarım, kağıttan bir kap landan farksız. Russell, tümevarımın sınırlarını göstermek üzere bize bir kümes hayvanıyla ilgili hazin bir öykü anlatıyor. Rivayete göre bir çiftçinin besili bir hindisi varmış ve bu hindi sıkı bir tümevarımcı olmasıyla nam salmış: Bu hindi, çiftlikteki ilk sabahında, ona saat tam 9 .00'da yem verildiğini görüyor. Sıkı bir tümevarımcı olduğu için, buradan alelacele bir sonuç çıkarmayıp bir süre daha göz lemde bulunmayı ve böylece gözlem verilerini biriktirme yi tercih ediyor. Üstelik bu gözlemlerini farklı koşullarda yaparak olabildiğince zenginleştiriyor: çarşambaları, per şembeleri, sıcak günlerde, soğuk günlerde, yağışlı günlerde, yağışsız günlerde . . . Her gün listesine yeni bir gözlemini kay dediyor. Tümevarımcı vicdanı gözlemlerinin sayısının çok-
YAPAY ZEKA M iTi
luğundan en sonunda tatmin olunca hindimiz güvenle şu sonuca varıyor: Her gün sabah saat 9 . 00'da besleniyorum. Fakat vardığı bu sonucun yanlış olduğunu Noel sabahında beslenmek yerine kesilerek acı yoldan öğreniyor. Böylece, doğru öncüllere sahip tümevarımlı bir çıkarım yanlış bir sonuca vardırmış oluyor.5
•
Russell'ın hindisi, gözlediğimiz düzenlilikler hakkında daha derin bir bilgiye sahip olmadan 'çağrışımların ürettiği alışkanlıklar' oluşturmanın budalaca olduğunu ortaya ko yuyor. Fakat bilgi de çoğu zaman kılık değiştirmiş bir inanç tan ibarettir, bildiğimizi düşünürken yanılıyor da olabiliriz. Dolayısıyla tümevarıma bel bağlamanın barındırdığı sorunlardan bir diğeri de bilgi eksikliğidir. Dünyanın bü yük bölümü bizim için bir sır perdesiyle örtülüdür, dünya nın keşmekeşine rastlantısallık hakimdir veya dünya bizim için tek başına tümevarıma güvenemeyeceğimiz kadar kar maşık bir yerdir de diyebiliriz. İnsanın aklına hemen para piyasaları geliyor. Bir hissenin değerindeki dalgalanmayı en ince tekniklerle tahmin etmeyi denesek bile, hissenin geçmişteki değerinin, gelecekteki değerinin bir göstergesi olamayacağını, deneyimli her borsacı bilir. Dürüst olmak gerekirse yaşadığımız dünya belirsizlikleri ve bize hazırla dığı sürprizleriyle büyük oranda sinir bozucu bir yerdir. Kimsenin kullanmadığı bir asansörün binanın giriş katında beklediğini biliriz. Tümevarımda bulunarak, yani işten er ken çıktığımızda h erkesin o sırada işinin başında olduğunu düşünerek, asansörün bizi apartmanımızın giriş katında beklediğini varsayabiliriz. Oysa o sırada apartmana biri leri taşınıyor olabilir veya falancanın ailesi Minnesota'dan onu ziyarete gelmiş de olabilir. Beklentiler de tıpkı kurallar gibi, çiğnenmek içindir. Russell'ın özgün anlatısında hindiden değil tavuktan bahsediliyordu. Bu örneği bugün bildiğimiz haliyle anlatan kişi Kari Popper'dır. Aktaran Alan Chalmers, What Is This Thing Called Science?, St. Lucia, AU: University of Queensland Press, 1 982, s. 4 1 -42.
_ TÜMDENGELIMIN VE TUMEVARIMIN SORUNLAR!
Tahminlerimizde sürekli yanılırız çünkü tümevarı ma güç katacak bilgi genellikle eksik veya erişilmezdir. lngiltere'de 1 000 tane kuğu görüp bu gözlemimden hare ketle tüm kuğuların beyaz olduğu sonucuna varabilirim. Ama aynı yıl diyelim ki Avustralya'ya gidip orada bir siyah kuğu gördüğümde tümevarımım çöpe gidiverir. Bildiğimizi düşündüğümüz şeylerin çoğu aslında kesin bilgiler değil dir, tekrar incelenmeye ve sınanmaya muhtaç geçici bilgi lerdir ve bilgilerimiz tümevarıma fazla bel bağlayınca deği şimler de bize şaşırtıcı gelmeye başlıyor. Örneğin ABD'nin batısındaki Seattle gibi büyük şehirlerde sürücüler sarı ışık yanınca hemen geçeyim diye gaza basmak yerine genellikle yavaşlar veya dururlar. Keza yayalara da saygı gösterirler, arabalarını yayaların üstüne sürmezler. Dolayısıyla New York'ta veya Mumbai'de sürücülerin davranışını gördü ğümde şaşırabilirim. Kurallar hesapta aynı bile olsa davra nışlar aynı değildir. Geçmiş deneyimlerime ve tümevarıma bel bağlarsam ya başka bir araba gelip benimkine arkadan çarpar ya da acı acı kornaya basar. O halde bunca yeni bilgi varken neden sadece geçmiş de neyimlerime güveneyim? Benim için makul ve zekice davra nış ne olurdu ? Yeni bilgileri nasıl değerlendirmeliyim? Peki, yolda şerit gibi dizilmiş çiviler görürsem veya sıra olmuş ilerleyen ördekler görürsem veya aşina olmadığım yol işa retleri varsa ki hiç bunlara dair bir deneyimim yok, ya o zaman ne yapacağım? Bu soruların yanıtı tümevarımı daha fazla kullanmakta değil, daha az kullanmakta saklıdır.
Tümevarım Oyunda İşe Yarar. Yaşamda Değil Gerçek dünya dinamik bir ortamdır, yani hem öngörülebi lir hem de öngörülemez biçimlerde sürekli değişir. Bu yüz den onu bir kurallar sistemine sığdıramayız. Oysa masa üstü oyunları bir kurallar sistemine sığar. Deneyimlerden 1 65
YAPAY ZEKA M iTi
öğrenmeye dayanan tümevarımlı yapay zeka yaklaşımları da işte bu yüzden masaüstü oyunlarında çok başarılılar. AlphaGo (veya önceli AlphaZero ) yapay zeka sistemi, Go denen zor oyunu oynarken derin öğrenme diye bilinen bir makine öğrenimi türünü kullanıyor. Bu sistem derin pe kiştirmeli öğrenme denen bir yöntemi kullanarak bu oyu nu kendine karşı oynuyor ve böylece kendi taşlarının ve rakibinin taşlarının oyun tahtası üzerindeki konumlarına göre en iyi hamlelerin neler olacağına dair tümevarımla birtakım hipotezler oluşturuyor. Yapay zeka bilimci Stuart Russell'ın da belirttiği üzere bu yaklaşım 'dışarıdan mü dahale edilemeyen, gözlenebilir, bilinen kurallara sahip iki oyunculu oyunlarda' büyüleyici başarılara imza atı yor.6 Gerçi Stuart Russell pek Bertrand Russell'ın hindi sini düşünmemiş gibi görünüyor ama düşünse iyi olurdu: Bu oyunları oynayan yapay zeka sistemlerinin aslı soru nu, sadece bilinen kurallara göre hipotez oluşturma -yani deneyimden hareketle genellemelere ulaşma- olanağı tanı malarıdır. Oysa gerçek dünya böyle kurallara sığmayaca ğı gibi, yapay zeka çalışmalarının nihai hedefi de bilinen kurallardan bağımsız akıl yürütebilen genelleşmiş zekaya ulaşmaktır. Bu da ironik bir şekilde, modern yapay zeka çalışmalarının son kertede klasik yapay zeka çalışmaları nın düştüğü hataya düştüğünü gösteriyor. Tümevarımlı yöntemlere bel bağlayan bilgisayar bilim ciler genellikle Hume'un -veya Bertrand Russell'ın- önem le vurguladıkları tümevarım sorununun kendi çalışma alanlarıyla bir bağlantısının olmadığını düşünüyorlar. Tü mevarımın sonucunun bir güvencesinin olmadığını kabul edip doğruya 'olabildiğince yakın' olmasının yeteceğini ile ri sürüyorlar. Fakat bu yanıt asıl meseleyi ıskalıyor. 'Muhtemelen yak6
r 66
Stuart Russell, Human Compatible: Artificial Intelligence and the Problem of Control, New York: Viking, 2 0 1 9 .
• TÜMDENGELI MIN VE TUMEVARIMIN SDRUNLARI
laşık doğru' [probably approximately correct] diye bilinen bir yöntem, makine öğrenimi gibi istatistiksel yapay zeka uygulamalarında hipotez oluşturma sürecini yönetiyor ve bu yöntemin zaman içerisinde kötü veya yanlış hipotezleri ayıklamada epey etkili olduğu biliniyor. Fakat Hume'un tü mevarımla çıkarılan sonuçların bir garantisinin bulunmadı ğı şeklindeki özgün savının bir uzantısından, bu savın olası istatistiksel çıkarımların tümünü kapsayan verili kurallara sahip senaryolara uygulanmasından öteye de gitmiyor. Yani muhtemelen yaklaşık doğru yöntemi, oyun dünyası veya araştırma laboratuvarları gibi kuralları baştan belli ortam ların dışında kalan dinamik çevrelerde karşılaştığımız tüme varım sorununa dokunmuyor bile. Yapay zeka araştırmacıları da tümevarım sorununu açıktan veya örtük olarak ikrar ediyorlar. Fakat buna rağ men tümevarım sorunu makine öğrenimine veya derin öğ renmeye yönelik eleştirilere nadiren dahil ediliyor çünkü araştırmacılar aslında sorunun etrafından dolanmayı ter cih ediyorlar. Tümevarım dinamik çevrelerde pek de iyi iş çıkaramadığından, onun sadece denetlenebilen çevrelerde kullanılması gerektiği sonucuna varıyorlar. Bu da bir akşam vakti hemen kapının önünde düşürdüğümüz anahtarı, çev resini aydınlatıyor diye ta ilerdeki sokak lambasının altında aramaya benziyor. insanların deneyimleri gerçek dünyada (başka nerede olacaktı ? ) kullanabilecek kadar tümevarım sorununu 'çözdükleri' doğrudur. Fakat bu sorunu tüme varımın daha güçlü bir biçimini keşfedip kullandıkları için çözmediler, tümevarımı insanın anlama kabiliyetine bir şe kilde daha fazla katkıda bulunan daha güçlü başka çıkarım türleriyle destekledikleri için çöze bildiler. Makine öğrenimi denen yöntem ise bildiğimiz tümevarımdan ibaret ( bunu On Birinci Bölümde tartışacağız) . Dolayısıyla bu alanda çalışan araştırmacıların özellikle yapay genel zekanın geleceğiyle il gili öngörülerinde her zaman olduklarından daha ihtiyatlı olmalarında fayda var.
YAPAY ZEKA MiTi
Düzenlilik ve Kmlganlık Tümevarım zekayı düzenliliklerin saptanmasına indirgiyor. Nitekim istatistiksel yöntemleri kullanan yapay zeka, veri leri çözümleyerek düzenlilikleri saptamada ustadır. Bu yüz den insan yüzlerine veya ev hayvanlarına ait fotoğrafları tes pit etmek gibi görsel nesne tanıma görevlerinde son derece başarılıdır. Bu yüzleri oluşturan pikseller belli bir düzenlilik içinde dağıldıkları için makine tarafından öğrenilip sınıf landırılabiliyor. Fakat bu sistemler belli girdi örüntülerini gözleyerek öğrendikleri için 'kırılganlık sorunu' denen bir sorundan mustaripler. Gary Marcus, Ernest Davis ve başka araştırmacıların da belirttiği üzere, nesne tanıma görevlerin de art alan rengini beyazdan maviye çevirmek gibi basit ve görünüşte masum birtakım değişiklikler bile bu sistemlerin verimliliğini düşürebiliyor. Dahası, fotoğraflara başka im geler eklemek de sonuçlarda ciddi bozulmalara yol açıyor.7 Örneğin dur levhasının kırmızı kısımlarına rastgele birkaç harf eklediğinizde insanlar bu harfleri genellikle görmezden gelirler. Oysa böylesine küçük değişiklikler bile bir derin öğrenme sisteminin dur levhasını hız sınırı levhası olarak sınıflandırılmasına yol açabiliyor. Gerçek dünyadan, başka benzer örnekler de verebiliriz: Sürücüsüz arabaların otonom gezinme sistemleri, okul otobüslerini kar temizleme aracı olarak tanımlayabiliyor yahut dönen bir tın üst geçit olarak görüp yanlış sınıflandırabiliyor. Makine öğrenimi gözlem verilerinden bilgi edinmeye çalıştığı için tümevarımlı dır. Derin öğrenme adı verilen teknik de bir makine öğrenimi türüdür -bir sinir ağıdır- ve fotoğraflardaki nesneleri tanımada, sürücüsüz sürüş sis temlerinin performansını artırmada, zor görünen oyunları oynamada son derece başarılıdır. Örneğin Google'ın Deep-
Gary Marcus ve Ernest Davis, Rebooting AI: Building Artificial Intelligence We Can Trust, New York: Pantheon Books, 2019. 1 68
• TÜMDENGELIMIN VE TUMEVARIMIN SDRUNLARI
Mind sistemi bir dizi klasik Atari oyununu oynamayı öğre nince epey gürültü kopmuştu. Hatta bu sistem yapay genel zeka diye tanıtılmıştı çünkü AlphaGo ve AlphaZero'ya da güç veren derin pekiştirmeli öğrenme yaklaşımını kullana rak, farklı kurallara sahip bir dizi oyunda ustalaşmayı ba şarmıştı. Fakat çok geçmeden, Vicarious adlı yeni kurulan bir yapay zeka şirketi, DeepMind'ın ustalaştığı oyunlarda yapılan küçücük değişikliklerin bile sistemin performansı nı gözle görülür ölçüde düşürdüğünü ortaya koydu. Örne ğin Breakout [Kaçış] oyununda oyuncu, bir raketi yatay bir çizgide hareket ettirerek gelen topa vuruyor, raketten seken top karşıda duran ve farklı tuğla katmanlarından oluşan bir duvara çarparak tuğlaları kırıyor ( oyunun adı bu yüzden 'Breakout'tu) ve geri sekiyordu. Oyuncunun amacı topu duvara çarptırarak duvarı tamamen yıkmak ve bu sırada duvardan geri seken topu kaçırmamaktı. Ne var ki oyunda raketin dikey eksende sabit olan konumunu de ğiştirip duvara sadece birkaç piksel daha yaklaştırmak bile derin öğrenme sisteminin deyim yerindeyse elinin ayağına dolanmasına yetiyor, performansını hemen düşüyordu. Modern yapay zeka yaklaşımını eleştiren Marcus ve Davis bu vakada DeepMind'ın tüm sisteminin bir anda etkisini kaybettiğinin altını çiziyorlar ve yapay zeka araştırmaları nın öncüsü Yoshua Bengio'nun derin sinir ağlarının 'yük sek seviyeli soyut kavramlardan ziyade veri sistemindeki istatistiksel düzenlilikleri öğrenmeye meyilli' olduğu yö nündeki saptamasına göndermede bulunuyorlardı. 8 Genellikle görmezden gelinen veya yanlış anlaşılan nok ta, bu başarısızlıkların tümevarımlı (veri veya gözlem taban lı) çıkarımlara dayanan daha güçlü öğrenme yaklaşımlarıyla giderilemeyecek olmasıdır çünkü bunlar temellerle ilgili ba şarısızlıklardır. Yani buradaki sorun herhangi bir öğrenme ' Gary Marcus ve Ernest Davis, Rebooting AI: Bııilding Artificial Intelligence We Can Trııst, New York: Pantheon Books, 20 1 9 , s. 62.
YAPAY ZEKA MİTİ
algoritmasının şu veya bu yönünün başarısız olması değil dir, çıkarım türünün ta kendisidir. Öğrenmeyi artırabilmek için çok sayıda örneğe ihtiyaç olduğu için -ki Go oyununda makinenin öğrenmesi gereken örnek oyun sayısı milyon ları bulmaktadır- bu öğrenme sistemleri oynadıkları oyu nun özellikleri ve oynanma kurallarının sınırları dahilinde oluşturdukları hipotezlerin kılavuzluğunda olası seçenekleri sıralayarak iş gören cilalanıp parlatılmış tümevarım motor larından ibarettir. Başka bir deyişle, bu yapay zeka sistemle rinin dünyası kapalı, kurallı ve düzenlidir; en iyi hamlelerin oyunu kazanmaya en sık götüren hamleler olduğu bir çe şit çan eğrisi dünyasıdır. Yapay genel zekanın ustalaşması gereken gerçek dünya ise insan mühendisliğinin eseri olan oyunların ve araştırma tesislerinin dışında bulunuyor. ikisi arasında dağlar kadar fark var. Nitekim gerçek dünyada düşünme, olağandışı durumla rın veya istisnaların isabetli biçimde tespit edilmesine bağ lıdır. Örneğin şehrin kalabalık bir caddesi sayısız istisnayla doludur. Manhattan'da robotların sokaklarda cirit atma masının sebeplerinden biri de budur. Keza insanlarla soh bet edememelerinin nedenlerinden biri de bu istisnalardır. Manhattan'da yürüyüşe çıkan bir robot daha iki adım bile atamadan dengesini kaybedip yolun ortasına devrilerek trafiğin kilitlenmesine neden olacak yahut insanlara çar pacak veya daha kötü bir kazaya yol açacaktır. Manhat tan Atari oyunlarına veya Go oyununa benzemediği gibi, bu oyunların daha karmaşık veya büyük ölçekli hali de değildir. Bir derin öğrenme ' beyni' ve aynı şekilde gerçek zekanın yerine geçirilmeye çalışılan herhangi bir tümeva rım sistemi, gerçek dünyada bize ciddi bir ayak bağı, ciddi bir sorun olacaktır. Russell'ın hindisine akşam yemeği ol mama 'oyununu' öğretebilseydik Noel arifesinde sıvışma yı da öğrenebilirdi ama o zaman da sıkı bir tümevarımcı hindi olamazdı çünkü insanların ona verdiği öncüllerden hareket ediyor olurdu.
• TÜMDENGELIMIN VE TUMEVARIMIN SORUNLAR!
İstatistiksel yapay zeka sistemleri uzun kuyruk sorununa takılıyorlar: Buna göre, yaygın örüntüleri ( dağılım eğrisinin şişkin tepesindekileri) bulmak kolaydır, nadir örüntüleri (dağılım eğrisinin uzayan kuyruk kısmındakileri) bulmaksa zordur. İnsansı zekaya sahip olması arzulanan yapay zeka sistemlerinin yapması gereken bazı çıkarımlar bu eğride ne yazık ki kapalı sistemlerin keşfedilebilir düzenliliklerinden hareketle tümevarımda bulunulabilecek en güzel noktalarda değil, daima uzun kuyrukta yer almaya mahkumdur. İşin aslı şu ki yapay zeka araştırmaları, düzenliliklerin kullanıl masıyla ulaşılan 'kolay' başarılara odaklandıkça genel zeka konusunda yerinde sayma tehlikesiyle karşı karşıya kala caktır. Bu konuda adım adım bile ilerleme kaydedemiyoruz çünkü kolay sorunlar üzerinde çalışmak pratikte gerçek so runları ( anahtarın sokak lambasının altında olmadığını) göz ardı etmemize neden oluyor. Başka bir deyişle, tek başına tümevarımlı stratejiler sahte umut dağıtmaktan başka bir işe yaramıyor. Veri güdümlü tümevarıma bel bağladığımızda, belki Facebook'un fotoğraflarımızı hatalı sınıflandırması veya Netflix'in bize önerdiği filmin sıkıcı olması başımızı fazla ağrıtmayacaktır ama sürücüsüz arabaların ve diğer hayati teknoloj ilerin başımıza epey dert açacakları kesindir. Bu so runu fark eden yapay zeka bilimcilerin sayısı günden güne artıyor. Allen Yapay Zeka Enstitüsü'nün başında bulunan Üren Etzioni, makine öğrenimine ve büyük veriye 'yüksek kapasiteli istatistiksel modeller' adını veriyor.9 Yani ortada etkileyici bir bilgisayar bilimi var ama genel zeka namına pek bir şey yok. Nitekim zeki zihinler verileri anlaşılır hale getip noktaları öyle bir birleştirirler ki hatalı noktaların ve olağandışı durumların anlaşılmasını sağlarlar. Sırf veriler ve bu verilerin çözümlenmesi yeterli değildir. 9
Martin Ford, Architects of Intelligence: The Truth about AI (rom the People Building It, Birmingham, UK: Packt Publishing, 20 1 8 .
YAPAY ZEKA MiTi
Güven Olarak Çıkarım Sorunu Eski borsacı Nassim Nicholas Taleb para piyasalarının tah mininde kullanılan tümevarıma yönelttiği aydınlatıcı bir eleştiride istatistiksel tahmin sorunlarını dört bölgeye ayı rıyor. Bu ayrım iki değişkeni gözetiyor. Birincisi, verilecek kararın basit (ikili) mi karmaşık mı olduğuna bakıyor. İkin cisi, hesaba katılması gereken rastlantısallığın 'ortalama' mı yoksa 'uçlarda' mı olduğunu dikkate alıyor. tık bölge de karşımıza çıkan sorunlar, ince kuyruklu olasılık dağılı mına göre basit kararlar vermeyi gerektiriyor. Bu bölgede sonuçları istatistiksel olarak tahmin etmek görece kolay ve beklenmedik olaylar gerçekleşse bile etkileri düşük kalıyor. İkinci bölgenin sorunlarını tahmin etmek de kolay ama bek lenmedik olayların etkileri büyük oluyor. Üçüncü bölgenin sorunları karmaşık kararları içeriyor ama sonuçlarını idare etmek mümkün. Bir de dördüncü bölgedeki 'hindi' sorunları var ki bunlar uzun kuyruklu olasılık dağılımlarıyla beraber son derece etkili sonuçlara sahip karmaşık kararlar vermeyi içeriyor. Ne gibi etkili sonuçlar mı ? Mesela borsanın çökme si gibi. Taleb bu olayların etkisini artıran temel unsurun tü mevarıma duyulan aşırı güven olduğunu savunuyor. Sorun yalnızca tümevarımlı yöntemlerin işe yaramaması da değil, bunlara bel bağladığımızda daha iyi yaklaşımları kullanma mış oluyoruz; bu da felaket boyutlarına varan sonuçlara ne den olabiliyor. Bunun bir sonucu olarak, geçmiş deneyimleri çözümlemek işimize yaramadığından makine düşünmesine hapsoluveriyoruz. Tümevarımcı bir süperzekanın aptal ca sonuçlara varacak olmasının nedenlerinden biri de bu. Taleb'in şakayla karışık ifadesiyle, önemli olan 'hindiye dö nüşmemeyi' bilmek.10 Elbette tahminde bulunmanın, tümevarımın kör nokta10
Nassim Nicholas Taleb, "The Fourth Quadrant: A Map of the Limits of Sta tistics", Edge.org, 14 Eylül 2008, https://www . edge.org/conversation/nassim_ nicholas_taleb-the-fourth-quadrant-a-map-of-the-limits-of-statistics.
• TÜMOENGELIMIN VE TUMEVARIMIN SORUNLAR!
lan açıklığa kavuşturularak özetlenemeyecek başka sınırları da var. Ne de olsa siyah kuğular nadir görülüyor; borsaların çöküşü ve büyük savaşlar (ve inovasyonlar) da öyle. Kaldı ki belirsiz ve büyük oranda öngörülemez olasılıkları aydınlat mak için tümevarıma başvurduğumuzda mazur görülebiliriz ama anlayışın yerine tek başına veriyi ve istatistiği koyma girişimleri mazur görülemez. Kaotik doğal sistemler -örne ğin türbülans barındıran sistemler- gibi bazı durumlarda, hangi çıkarım türü kullanılırsa kullanılsın, tahminin, doğa sından ileri gelen birtakım sınırlarının olduğunu biliyoruz. Tümevarım geleceğin geçmişe benzeyeceğini varsayıyor, oysa kaos kuramı öyle olmayacağını ya da en azından na sıl olacağını önceden belirleyemeyeceğimizi söylüyor. Yani bazı durumlarda elimizde -tüm kusurlarına rağmen- istatis tiksel çözümlemeden başka bir araç olmayabiliyor.
Olası Neden Turing Ödülü sahibi saygın bilgisayar bilimci Judea Pearl, ömrünü bilgisayarlara nedensel akıl yürütme kabiliyeti ka zandıracak etkili bilişim yöntemleri geliştirmeye adamış bi ridir. 20 1 8 yılında yayımlanan The Book of Why'da [Ne denler Kitabı] veri çözümleme yaklaşımının, gerçek dünya nın zeka için elzem olan nedensel yapısına dair bilgiye ulaş maya izin vermediği için makine öğreniminin asla gerçek bir anlama kabiliyetinin yerini dolduramayacağını savunuyor. Onun deyimiyle 'nedensellik merdiveni', veri noktalarını birbiriyle ilişkilendirme (görme ve gözleme) basamağıyla başlayıp bir sonraki basamakta dünyaya müdahale etmeye (yapmaya) yükseliyor ki bunun için de nedenlerin bilgisine sahip olmak gerekiyor. Ardından hayal kurmak, anlamak ve sormak gibi, olmamış şeyleri düşünmeye geçiyoruz: " Baş ka türlü davransaydım ne olurdu ? " diye soruyoruz. Makine öğrenimi yöntemlerini kullanan yapay zeka sis173
YAPAY ZEKA M iTi
temleri -ve birçok hayvan- bu merdivenin en altında, veri noktaları arasında ilişki kurma basamağında yer alıyor. Bu ilk basamakta, gözlemlerde düzenlilikler arıyoruz. Örneğin tarla faresinin peşine düşen bir baykuş, kemirgenin hareket lerini gözleyip avının bir an sonra nerede olacağını tahmin etmeye çalışırken tam olarak bunu yapıyor. Keza kazanma olasılığı en yüksek hamleleri seçebilmek için milyonlarca Go oyununun kayıtlı olduğu bir veritabanını tarayan bir Go programı da bunu yapıyor. 1 1 Pearl burada bize bir iyilik yapıyor ve gözlemler ile ve rileri birbirine bağlıyor. 1 2 Dahası bu merdivenin üst basa maklarına çıkıldıkça farklı düşünme türlerinin -veya çıka rım türlerinin diyelim- devreye girdiğini de belirtiyor. tlişki lendirme edimi 'ölçeklenip' nedensel düşünmeye veya hayal kurmaya dönüşmüyor. Bu noktada yapay zekanın ölçeğini büyütüp yapay genel zekaya çevirme sorununu, bu merdi veni çıkmaya izin verecek yeni kuramların keşfedilmesi so runu (ya da bu kitaptaki terminoloj iyi kullanacak olursak, tümevarımdan diğer güçlü çıkarım türlerine nasıl geçileceği sorusu) olarak ele almak da mümkün hale geliyor.13 11
12
ı.ı
1 74
Judea Pearl ve Dana Mackenzie, The Book of Why: The New Science of Cause and Effect, New York: Basic Books, 20 1 8 . [Türkçesi: Neden Sorusunun Kitabı: Neden-Sonuç llişkisinin Yeni Bilimi, çev. Murat Havzalı, Ginko Bilim, İstanbul, 2020] 'Gözlem', 'veri' ve 'olgu' terimleri hakkında daha fazla şey söylemem gerek. Fred adında bir adam hayal edin. İşvereni ona 1 Aralık günü saat 7.00 ile 1 9 .00 arasında, Şikago'nun şehir merkezindeki bir sokağın köşesinde nöbet tutup North Face marka ceket giyen herkesle ilgili veri toplama görevi vermiş olsun. Fred de işvereninin ona verdiği görevi yerini getiriyor ve yanından geçip gidenleri gözleyip giydikleri ceketleri not alıyor diyelim. Ne zaman bir North Face marka ceket görse bu gözlemini defterine kaydediyor. Saat 1 9.00 olduğunda not defterini alıp amirine götürüyor. Amiri onun not defterinde kayıtlı gözlemleri ( 1 47 örnek gözlemlemiş) bir elektronik tabloya giriyor. Böylece Fred'in gözlemleri veri haline gelmiş oluyor. Bilgisayarda kayıtlı bu okunabilir veri, belirli bir yer ve saatte North Face marka ceket giyen yayalar olgusunu ifade ediyor. Dolayısıyla veri dediğimiz şey, olgu kabul edilen kayıtlı gözlemlerden ibaret. Peki, olgu nedir? Bu çok ilginç bir soru ama bu soruyu bir başka kitapta ele almak gerek . . . Belli ki Pearl dedektifliğe d e meraklı çünkü o da Sherlock Holmes'un iddia
• TÜMDENGELIMİN VE TUMEVARIMIN SORUNLAR!
Sağduyunun El Kitabı Ebeveynleriniz, eşiniz, dostunuz sizi sağduyudan yoksun ol makla suçlamış olabilir ama moralinizi bozmayın: Sağduyu nuz şimdiye kadar üretilmiş tüm yapay zeka sistemlerinden çok daha fazla. Turing'in de bildiği üzere iki insanın sıradan bir sohbet yürütebilmesini sağlayan şey sağduyudur. Sağdu yu sorununu ve özellikle de dili anlama sorununu -ki sağdu yu gerektirir- çözmek, yapay zeka çalışmaları alanının do ğuşundan itibaren bu alanda çalışan araştırmacıların başlıca kaygılarından biri olagelmiştir. Makine öğrenimi hakkında ki abartıların bizi bu hedefe bir adım bile yaklaştırmadığı nihayet ortaya çıkıyor. Araştırmacılar da bunu eskisine kı yasla artık daha fazla kabul ediyor. Hatta zamanlama bun dan iyi olamazdı. Marcus ve Davis şunu soruyor: Madem bilgisayarlar çok akıllı neden okuyamıyorlar ? Kitaplarında bu konuyla ilgili bir bölüm de var: "Sağduyu ve Derin Anla maya Giden Yol " . 1 4 Stuart Russell'sa hala gizemini koruyan 'dil ve sağduyu' için bir " Yapılması Gereken Kavramsal Bu luşlar" listesi oluşturmuş.15 Pearl de dili anlama sorununun
14 15
ettiği gibi tümdengelim kullanmadığını belirtiyor. Pearl'e bakılırsa kurmaca kahramanımız olguları inceleyip açıklarken aslında tümevarıma başvuruyor. Fakat bu iddia kendi merdiven eğretilemesiyle çelişeceğinden Pearl bunu elbette düz anlamıyla söylüyor olamaz çünkü gözlemleri ilişkilendirmek Holmes'un karşı karşıya olduğu bulmacaları çözmeye yetmez. Bu iki kavramı birbirine katmak tümevarımla ilgili genel bir yanlış anlamayı, kuramların dikkatli gözlemlerin ürünü olduğu inancını ifşa ediyor. Böyle bir şey ancak elimizde bir kuram varsa ve o kuramla yeni gözlemleri yorumlarsak mümkündür. Başka bir deyişle tek başına gözlem, kuramın yokluğunu ve eksikliğini gideremez. Doğal dili anlama meselesinde de göreceğimiz üzere, tümevarım aslında bir tür yorumsama döngüsünün bir parçasıdır. Önce eldeki fikirler yorumlanır, yorumlama etkinliği sırasında bu fikirler uyarlanır ve en sonunda yeni fikirler ortaya atılır. Tümevarıma bel bağlayarak dilden anlam çıkarmak imkansızdır; tümevarım doğru anlaşıldığında -yani diğer çıkarım türleriyle aynı çuvala konmadığında- durum budur. Gary Marcus ve Ernest Davis, Rebooting AI: Building Artificial Intelligence We Can Trust, New York: Pantheon, 2 0 1 9 . Stuart Russell, Human Compatible: Artificial Intelligence and the Problem of Contro/, New York: Viking, 2 0 1 9 . 175
YAPAY ZEKA MiTi
henüz çözülmediğini kabul ediyor (ve nedensellik ilişkisini anlamayı gerektiren kendi 'mini Turing Testi'ni sunuyor) . 1 6 Demek ki yapay zeka konusunda ilerleme kaydetmek is tiyorsak tümevarımın ötesine geçmemiz gerekiyor. (Merdi ven eğretilemesinin ilişkilendir. basamağındaysanız yukarı bakın . ) O zaman şimdi bunu yapalım veya en azından bu konuda ilk adımı atalım. Savavarımlı çıkarımın zorunlulu ğunu tesis edeceğimiz bu yolda önce işin ayrıntılarına inme miz, özellikle de makine öğrenimini ve onun girdi kaynağı olan büyük veriyi ele almamız gerekiyor.
16
Pearl, The Book of Why,
s.
36.
11 MAKİNE ÖGRENİMİ VE BÜYÜK VERİ
• ğrenme, 'deneyimlerle performansı iyileştirme' işidir. 1 O Makine öğrenimi ise bilgisayarların deneyimlerle per 0
formanslarını iyileştirmelerini sağlama işidir. Yapay zeka çalışmalarının makine öğrenimi olarak bili nen alt alanının bu tanımı üzerinde pek ihtilaf yok, neredey se herkes hemfikir. Dahası bu alanın yeni şekillendiği ve ya pay zekanın öğrenme algoritmaları üzerine ilk çalışmaların başladığı günlerden beri bu tanım neredeyse hiç değişmedi. Carnegie Mellon Üniversitesi'nden bilgisayar bilimci Tom Mitchell uzun süredir makine öğrenimi üzerine araştırmalar yapıyor ve 1 99 7'de yayımlanmış Machine Learning [Maki ne Öğrenimi] başlıklı kitabında bize kısmen daha ayrıntılı bir tanım sunuyor: " Bir bilgisayar programının belli bir G görev sınıfında ve P performans ölçümüne göre D deneyi minden bir şeyler öğrendiğini söyleyebilmemiz için, G'deki görevlerde P ölçümüne göre D deneyimiyle bir iyileşme gös termiş olması gerekir "2 Başka bir deyişle, makine öğrenimi tümevarımın bilişimdeki halidir: Deneyimden bilgi edinmek 1
Stuart Russell, Human Compatible: Artificial Intelligence and the Problem of Control, New York: Viking, 2 0 1 9 . Tom Mitchell, Machine Learning, New York: McGraw-Hill Education, 1 997, s . 2.
YAPAY ZEKA MiTi
demektir ve otomasyona tabi tümevarımdan ibarettir. Bu yüzden tümevarımlı çıkarımın barındırdığı sorunların ma kine öğrenimi sistemlerinin başına musallat olmasına şaşır mamak gerekir. Bu bölümün amacı bu kaçınılmaz sorunları ayrıntısıyla anlatmak. Makine öğreniminin iki ana türü var. insanlar arzulanan çıktıyı belirtecek biçimde önce girdiyi etiketledikleri zaman buna 'gözetimli öğrenme' deniyor. Aksi halde sistem veri lerdeki örüntüleri olduğu gibi çözümlüyor ki buna da 'gö zetimsiz öğrenme' adı veriliyor. Bir de bunların orta yolu var: 'yarı gözetimli öğrenme' . Bu öğrenme türü, insanların makineye ilk tohumu veya verinin küçük bir parçasını ver meleriyle başlıyor, ardından makine bu tohumu insanların gözetim olmadan daha fazla veriye dağıtılıyor. Son yıllarda yapay zeka bilimciler büyük oranda derin öğrenme diye bilinen belli bir makine öğrenme türüne odak lanıyorlar. Bu alan gözetimli öğrenme yaklaşımıyla epey etkileyici sonuçlar sunuyor. Aşağıda gözetimli öğrenmeyi, derin öğrenme ve uygulamalarıyla beraber ayrıntısıyla tar tışacağım. Tahmin edebileceğiniz üzere, gözetimli öğrenme geniş bir kavram: Yapay zeka açısından meselenin ne ol duğuna dair genel bir fikir edinmeniz için farklı gözetimli öğrenme türlerini ele alacağım. Sınıflandırma, gözetimli öğrenmenin yaygın bir türüdür. Araştırma laboratuvarlarında ve ticari uygulamalarda kap samlı biçimde incelenmiştir. Örneğin öğrenebilen sınıflandı rıcılar, istenmeyen e-postaları filtreleyebiliyorlar. Bunların çıktısı evet/hayır gibi ikili bir değer: Bir e-posta ya istenme yen türden bir iletidir ya da değildir. Genelde istenmeyen e-posta sınıflandırma sistemi e-posta hesabı kullanıcısının gözetimindedir. Kullanıcı, gelen e-postaları istenmeyen ile ti olarak işaretler, bunları istenmeyen posta klasörüne veya çöp kutusuna yollar. Art alanda çalışan makine öğrenimi sistemi ise bu e-postaları, istenmeyen elektronik postanın belirtilmiş bir örneği olarak etiketler. Sistem yeterince isten-
MAKiNE MRENIMI VE BÜYÜK VERi
meyen elektronik posta örneği topladıktan sonra bunlara ve gelen diğer e-postalara göre kendini eğitir ve böylece, kabul edilebilir e-postalar ile istenmeyen postalar arasındaki fark lara odaklanan bir geribildirim döngüsü üretir. İstenmeyen posta filtresi, makine öğreniminin web'de ullanışlı olduğunu kanıtlayan ilk örneklerden biriydi. Kaba k Bayes algoritmaları ve diğer basit olasılıklı sınıflandırıcılar, e-postalardaki sözcüklere sayı atayıp bu sayıların ağırlığı na göre gelen postanın istenip istenmediğini belirlemeye ça lışırlar. İstenen postayı istenmeyen postadan ayırmak için gereken ölçütün bilgisi ise kullanıcıdan gelir. Böylece sınıf landırıcı sadece iletilerin içindeki sözcükleri çözümleyerek istenmeyen postanın genel bir modelini veya hipotezini oluş turur. Sonraki iletilerse otomatik olarak filtrelenir ve isten meyen postalar istenmeyen elektronik posta klasörüne kul lanıcının müdahalesi olmadan düşmeye başlar. Bugünlerde istenmeyen posta sınıflandırıcıları insanların onlara sağla dığı çok sayıda bilgiyi kullanıyor. Örneğin konu satırında geçen belli sözcükler, 'istenmeyen postaya özgü' terimler ve deyimler gibi unsurlar, istenmeyen postanın ipuçları mua melesi görüyor. Bu sistemler kusursuz değil çünkü hizmet sağlayıcılar ile istenmeyen postaları gönderenler arasında sürekli bir kedi-fare oyunu var. İstenmeyen postaları gönde ren kişiler bu eğitimli filtreleri kandırmak için sürekli yeni ve farklı yaklaşımlar geliştiriyorlar. 3 İstenmeyen posta tespiti gözetimli öğrenmeye dair öyle çok cazip bir örnek değil. Modern derin öğrenme sistemleri görüntü ve görsel nesne tanıma gibi görevlerde de sınıflan dırmalar yapıyor. Ünlü ImageNet yarışmalarında yarışmacı3
Filtrelere güvenmemizin asıl nedeni bunların bilerek müsamahakar tasarlan mış olmalarıdır. Yani istenmeyen elektronik postaların gelen kutusuna girme ihtimali, istenen elektronik postaların elenme ihtimalinden daha yüksektir. Güvenceden ve hakiki anlama kabiliyetinden yoksun sistemleri kullanmanın doğurabileceği sonuçlarla ilgili kaygılar gün geçtikçe artıyor. Bu süreçte elbette istenmeye e-postaların yarattığı kaygı sürücüsüz arabaların doğurduğu kaygı karşısında devede kulak kalıyor. 1 79
YAPAY ZEK.l. MiTi
lara gözetimli öğrenme türünde büyük ölçekli bir görev veri liyor. Derin öğrenme sistemlerinin eğitilmesinde doğruluğun sınanmasında kullanılmak üzere Flickr gibi web sitelerinden ImageNet'in indirdiği milyonlarca görüntü üzerinde yarış macıların sistemleri sınanıyor. Bu imgelerin tümü insanlar tarafından etiketlenmiş oluyor ( bu kişiler projeye hizmet lerini Amazon'un Mechanical Turk arayüzünden sunuyor lar), dahası kullandıkları terimler WordNet olarak bilinen yapılandırılmış İngilizce sözcük veritabanını oluşturuyor. WordNet'ten seçilmiş bir sözcük alt kümesi, öğrenilmesi gereken sınıfı temsil ediyor; bunun için cins adları (örneğin köpek, balkabağı, piyano, ev) ve daha az bilinen adlardan bir seçki (örneğin İskoç teriyeri, husar maymunu, flamin go ) kullanılıyor. Yarışma, rakip derin öğrenme sınıflandırı cılarından hangisinin imgeleri insanların etiketledikleri gibi doğru etiketleyeceğini bulmayı amaçlıyor. ImageNet yarış malarında l OOO'i aşkın sınıflandırma kullanıldığından, bu görev istenmeyen e-postaları tespit eden sınıflandırıcıların karşılaştığı evet/hayır sorununu katbekat aşıyor. Dahası, bir görüntünün insan yüzüne ait olup olmadığını etiketle mekten ibaret diğer ikili sınıflandırma görevlerini de kat kat aşıyor. Bu yarışmaya katılmak demek, piksel verisini girdi olarak kullanarak devasa bir sınıflandırma görevini yerine getirmek demek.4 Doğal dili işleme uygulamalarında ise sıralama sınıflan dırması sık kullanılıyor. Sözcükler belirli bir sıraya, yani bir sıralamaya sahipmiş gibi değerlendiriliyor. Belge veya metin sınıflandırma sistemleri sözcük torbası (ST) modeli gibi daha basit, sırasız bir yaklaşım da kullanabilirler ama sözcüklerin sıralı metin olarak görülmesiyle edinilen ek bil gi genellikle metin sınıflandırma görevlerinde performansı artırıyor. Örneğin bir makalenin başlığında veya ilk parag4
1 80
Melanie Mitchell, Artificial Intelligence: A Guide for Thinking Humans, New York: Farrar, Straus ve Giroux, 2 0 1 9 .
MAKiNE MRENIMI VE BÜYÜK VER i
rafında geçen sözcükler genellikle o makalenin anlamına veya konusuna dair güçlü birtakım ipuçları sunuyor. Me tin sınıflandırma sistemi BfLlM, fŞ D ÜNYASI, SlYASET ve SPOR gibi konu etiketleriyle makaleleri otomatik olarak etiketlerken işte bu özellikten yararlanabiliyor. Metin sınıf landırma, gözetimli öğrenmenin bir başka örneğidir çürikü bu öğrenme sistemine ilk girdiyi insanlar sağlıyor, işe önce insanların metinlere doğru konu etiketlerini atamalarıyla başlanıyor. ImageNet'in doğru etiketlenmiş görüntü derle meleri gibi, insanların metin derlemelerini notlandırmasıyla, yani gözetimli öğrenme sistemlerini dil işleme görevlerinde eğitmeye faydalı olacak konuları ve diğer özellikleri içeren üst verileri sunmasıyla oluşturulmuş çok büyük bütünceler veya veri kümeleri de mevcut. Gözetimli makine öğrenimi, modern web'in ardındaki birçok işte kullanılıyor. Örneğin, haberlerin veya diğer içe rik akışlarının kişiselleşmesini sağlıyor. Eğer bir kullanıcı genellikle siyasi haberlere tıklıyorsa (diyelim ki Facebook sunucularında) art alanda çalışan bir gözetimli öğrenme algoritması ona siyasi haberleri daha fazla gösterecektir. Daha gelişmiş yaklaşımlarda ise siyasi haberler bakış açısı na göre sınıflandırılıyor. Böylece sistem, kullanıcının siyasi eğilimlerini saptayıp ona daha muhafazakar veya daha libe ral haberler sunabiliyor. Kullanıcı, ruh hali çözümlenerek de sınıflandırılabiliyor çünkü öğrenme sistemi film değer lendirmeleri gibi öznel görüş içeren yazıları da olumlu veya olumsuz olarak sınıflandırabiliyor. Gözetimli öğrenme yaklaşımları, sınıflandırmanın yanı sıra görüntü veya metin sınıflandırmada olduğu gibi tüm sı ralamayı etiketlemektense bir sıradaki tek tek kalemleri oto matik olarak etiketlemede de kullanılabiliyor. Buna 'ardışık öğrenme' deniyor. Bunun basit ama -belki sıkıcı denebile cek- bir örneği, sözcük türlerini etiketlemektir. Sözcük tür lerinin etiketlenmesinde örneğin " Kahverengi bir renktir. " tümcesindeki gibi ardışık sözcükler, sözcük türlerine göre 181
YAPAY ZEKA MiTi
etiketlenirler: " Kahverengi I S F bir I S Y renktir I CA . " gibi. Burada SF, SY ve CA etiketleri sıfat, sayı ve cins adlarının yerine geçiyor. Ardışık öğrenme, programlara sözcük türle rine dair bilgi veren dilbilim kurallarını kullanmaz, bunun yerine insanlar tümcelerdeki sözcüklere doğru sözcük türü ne dair etiketler atarlar ve insanların hazırladığı veri öğren me algoritmasına girdi olarak sunulur. Sözcük türü etiketle me sorununu makineler çok uzun zaman önce çözdüler. On binlerce etiketlenmiş tümce, gözlenmemiş verilerde -yani makinenin eğitiminde kullanılmamış tüm tümcelerde- insan düzeyinde bir performansa ulaşmaya izin veriyor. Dil işle mede çok iyi incelenmiş bir başka sorun da adlandırılmış varlık tanımadır. Bu gözetimli öğrenme alt türünde sistem, metinlerde insanlardan, yerlerden, zamanlardan, şirketler den ve ürünlerden bahsedildiği zaman, bunların belirli bir varlık olup olmadığını tahmin ediyor. Örneğin " Bay Smith XYZ Şti.'nin birinci çeyrekte on binden fazla aygıt sattığı nı bildirdi. " tümcesi şöyle etiketlenebilir: " Bay Smith I KİŞİ 'XYZ Şti.'nin I ŞİRKET birinci çeyrekte I TARİH on binden fazla I SA YI fazla aygıt I ÜRÜN sattığını bildirdi. " Ardışık sınıflandırma, sonraki kalemlerin önceki kalem lere bakılarak tahmin edilebileceği zaman dizisi tahminle rinde de kullanılabiliyor. Siri gibi ses tanıma sistemleri de yaygın kullanılan konuşmayı metne dönüştürme sistemleri de zaman dizisi tahmini sistemleridir. Zaman dizisi tahmin leri tıbbi tanı, fabrika planlama, hisse tahminleri gibi birta kım karmaşık görevlerde önemli uygulamalara sahiptir. Bugüne dek makine öğreniminde büyük başarıların ne redeyse tamamı gözetimli öğrenme sayesinde kazanıldı. Bunların arasında görüntü veya ses tanıma, sürücüsüz sü rüş, metin sınıflandırma ve çevrimiçi içeriği kişiselleştirme stratej ileri de yer alıyor. Gözetimsiz öğrenmenin yararı ise hazır veriye ihtiyacının son derece az olmasından ileri geli yor çünkü bu yöntemde insanların eğitim verilerini etiket lemeleri gerekmiyor. Fakat insan 'yönlendirmesinin' eksikr82
MAKiNE MRENIMI VE BÜYÜK VERi
liğinin doğrudan bir sonucu olarak, gözetimsiz sistemler gerçek dünya görevlerinde gözetimli kuzenlerinin epey ge risinde kalıyorlar. Gözetimsiz öğrenme tekniği, gözetimsiz öğrenme algoritmalarınca yaratılmış çok büyük boyutlarda verinin kümelendirilip görselleştirilmesi gibi açık uçlu gö revlerde fayda sağlıyor. Fakat makine öğrenimi, özellikle de derin öğrenme için yapılan ekseriyetle tantanalı tanıtım çalışmaları tamamen gözetimli öğrenmeye odaklandığı için, ben de bu tartışmanın çoğunda gözetimli öğrenme üzerinde duracağım. Yine de gözetimli öğrenme yaklaşımının tüme varımlı olmasından kaynaklanan tüm içkin kısıtlamaların gözetimsiz öğrenme yaklaşımı için haydi haydi geçerli ol duğunu aklınızdan çıkarmayın. Yani gözetimli öğrenmeye odaklanarak makine öğrenimi alanındaki en iyi ve en güçlü örneğe bakmış oluyoruz.
Simülasyon Olarak Makine Öğrenimi Kavramsal ve matematiksel açıdan bakıldığında makine öğ renimi özü itibarıyla bir simülasyondur. Makine öğrenimi sistemlerini tasarlayanl ar veri yoğunluklu bir sorunu ele alırlar ve eğer bu sorunun makine öğrenimiyle çözülmesi mümkünse onu 'iyi tanımlanmış' bir sorun addederler. Yani bir fonksiyonun, gerçek dünyadaki veya gerçek bir sistem deki bir davranışı simüle edebileceğini varsayarlar. Gerçek sistemin verilerde gözlenebilir bir çıktıyla sonuçlanan gizli bir örüntüye sahip olduğu varsayılır. Buradaki görev doğru dan gerçek gizli örüntüyü ortaya çıkarmak değildir -çünkü bunun için veriden fazlasının anlaşılabilmesi gerekir- örün tünün verilerdeki 'ayak izlerini' çözümleyerek onu simüle etmektir. Bu önemli bir ayrımdır. Anlamsal rol etiketleme olarak bilinen bir başka dil iş leme görevini ele alalım. Burada öğrenme algoritmasını ta sarlayanlar tümcelerin anlamlarını ortaya koymak için kim,
YAPAY ZEKA MiTi
kime, neyi ve ne zaman gibi sıradan sorulara yanıt ararlar. Öğrenme algoritmasının görevi örnek tümceleri girdi olarak kullanıp tümcede ifade bulan anlam rollerini tespit ederek böyle sorulan yanıtlamaya yarayacak bir etiketler kümesi sunmaktır. Örneğin tümcemiz bir eylemi gerçekleştiren bir fail, bir eylem, bir izlek (eylemin nesnesi) ve eylemin alıcısını içerebilir ve şöyle etiketlenebilir: "John / FAlL topu / İZLEK Lizzy'ye / ALICI attı / EYLEM. " Makine öğrenimi yaklaşı mı böyle her bir örnekte bilinmeyen bir davranışın iş başın da olduğunu varsayar ve öğrenme yaklaşımını kullanarak bir f işlevini öğrenmek suretiyle söz konusu davranışı ola bildiğince simüle etmeye çalışır. Öğrenme sistemi bu şekilde eğitilince, verilerde örtük olarak bulunan ve davranışın bir modeli veya kuramı olan bir f işlevi üretilmiş olur. Bu iş lev anlamsal rolleri veya varlıkları veyahut sözcük türlerini, hatta Japon balığı görüntülerini bile modelliyor olabilir çün kü neyin modelleneceği öğrenme görevine bağlıdır. Makine öğrenimi özünde çok karmaşık veya bilinemez bir sürecin, yani hazır programlama kurallarının işlemediği veya doğru yu bulmanın çok fazla insan çabası gerektireceği bir süre cin simülasyonudur. Gözetimsiz öğrenme süreci de verideki örüntüleri ortaya çıkarabilir. Fakat ortaya çıkan bu örün tülerin daha sonra insan tarafından tanımlanması gerekir, yani bu algoritma onca verinin içinde ne araması gerektiğini kendi başına bilemez. Zaten bunu yapabilseydi gözetimli öğrenme olurdu. Çoğumuz fonksiyonları matematik derslerinden biliyo ruz. Aritmetik bunun klasik bir örneğidir: 2 + 2 = 4 gibi bir eşitlikte '+' işaretiyle gösterilen toplama işlemi teknik olarak bir fonksiyondur. Fonksiyonlar girdilerine göre benzersiz çıktılar verirler. Bu yüzden toplama işlemi 2 + 2 girdisi için 4 sonucunu verir. (5 sonucunu vermez, o ancak Orwell'in romanlarında olur.) Yapay zeka çalışmalarının ilk yıllarında araştırmacılar gerçek dünyadaki sorunların çoğunun topla ma işlemi örneğindeki gibi çıktıları bilinebilecek kurallar su-
MAKiNE MRENIMI VE BÜYÜ K VERi
nularak çözülebileceğini varsayıyorlardı. Ne var ki zamanla yapay zeka araştırmacılarının üzerinde durmaya değer ve ilginç gördükleri sorunların çoğunun bilinmeyen fonksiyon lar olduğu ortaya çıktı ( eğer gerçekten böyle fonksiyonlar vardıysa) . Dolayısıyla bugün elimizde bu bilinmeyen fonk siyonlara olabildiğince yakınsamaya ve onları taklit etmeye çalışan makine öğrenimi sistemleri var. Makine öğreniminin bu 'sahteliği' sistemin performansı insanınkine yakın, hat ta insanınkinden daha iyi olduğunda fark edilmeyebiliyor. Ama gerçek dünya ile öğrenilen simülasyon arasındaki uçu rum büyüdükçe makine öğreniminin taklitten ibaret doğası da ayyuka çıkıyor. Bu gerçek, muazzam bir önem taşımasına rağmen, maki ne öğrenimi tartışmalarında sıklıkla halının altına süpürülü yor. Alın size bir başka gerçek: Bir makine öğrenimi sistemi nin dünyasının sınırları, eğitim sırasında ona verilen veri kü mesince katı bir şekilde belirlenir. Oysa gerçek dünyanın eli boş durmaz; yedi gün, yirmi dört saat boyunca sürekli yeni veri kümeleri üretir. Dolayısıyla herhangi bir veri kümesi as lında en iyi olasılıkla gerçek dünyaya ait sistemlerin davra nışının sadece kısmi bir kanıtını temsil eden, çok küçük bir zaman kesitinden ibarettir. Uzun kuyrukta yer alan düşük olasılıklı olayların öğrenme sistemleri için bu denli büyük bir sorun teşkil etmesinin nedeni de işte budur. Yani öğren me sistemleri -simülasyona kıyasla- gerçek dünya hakkında bilfiil anlayışa sahip değildir. Derin öğrenme ve yapay genel zekayla ilgili tartışmalarda bu olgu son derece önem taşıyor. Üstelik meseleye teknik açıdan baktığımızda endişe verici başka bir soru daha beliriyor: Çözümlediği fenomeni bile anlayamayan sistemlere nasıl, ne zaman ve ne kadar güve nebiliriz ? Kitabın ilerleyen bölümlerinde bu izleklere tekrar döneceğiz çünkü bunlar yapay zeka mitinin genel manzara sının anlaşılmasında büyük bir önem taşıyorlar. Makine öğrenimini bizi genel zekaya vardırması olası yollardan biri olarak görmek iki sorun doğuruyor. Bun185
YAPAY ZEKA MiTi
lardan birine önceki sayfalarda değinmiştim: Bir şeyle ri anlamadan öğrenmek en azından bir yere kadar pekala mümkün. Örneğin, eğitilmiş bir öğrenme sistemi, çıktıları tahmin edebilir, hatta sorunu da anlıyor gibi görünebilir ama sistemde yaşanan beklenmedik bir değişim veya ufak bir olay, bir anda tüm simülasyonu çöpe gönderebilir. İşin aslı şu ki başarısız simülasyonlar -ki simülasyonlar sıklıkla başarısız olur- değersiz olmanın ötesinde zararlı da olabili yor: Araç sürüşte makine öğrenimi kullanıp otomatik tah minlere bel bağlamanın insanlarda uyandırdığı sahte güveni bir düşünün. Nitekim bu her yerde oluyor; dünya koca bir keşmekeş ve olayların gidişatı, rüzgarın yönü gibi sürekli değişebiliyor. Sohbetlerde bile konu bir anda değişebiliyor. Hissenizin değeri yükseliş trendindeyken şirketlerin yeniden yapılanma kararı alması, deprem veya j eopolitik istikrarsız lıklar, hisseleri bir anda tepetaklak edebiliyor. O güne kadar muhafazakar haber sitelerini takip eden ve kişiselleşmiş ha ber akışı bu yüzden başka siyasi eğilimlere sahip kaynakları göstermeyen Joe, arkadaşı Lewis'in tavsiyesiyle sol eğilimli bir haber sitesi keşfediyor ve fikirleri bir anda değişebiliyor. Mary atları çok seviyor ama kendi atı Sally ölünce o güne dek hiç ilgilenmediği Zen felsefesine bir anda merak sarabi liyor. Bu liste böyle uzayıp gidiyor. 'Makine öğrenimi' aslın da hatalı konmuş bir ad çünkü bu sistemler bizim öğrendiği miz gibi, yani dünyanın anlamına dair giderek derinleşen ve sağlamlaşan bir takdir duygusu kazanarak öğrenmiyorlar. Makine öğrenimi sistemleri daha ziyade çan eğrilerini öğre niyorlar, yani bizim gerçek dünyada doğrudan deneyimle diğimiz şeylerin veri güdümlü simülasyonlarından ibaretler. Sağduyu ise makine öğreniminin kısıtlamalarını anlama mızı sağlıyor: Bize yaşamın düpedüz tahmin edilemez oldu ğunu söylüyor. Dolayısıyla makine öğrenimine en sağlam darbeyi, bu sistemlerin geçmişe baktıkları eleştirisi vuruyor. Makine öğrenimi veri kümlerine dayanan gözlemlerle -yani önceden yapılmış gözlemlere dayanarak- faydalı bulabile186
MAKiNE MRENIMI VE BÜYÜK VERi
ceğimiz birtakım örüntüleri ve eğilimleri ortaya çıkarabi liyor. Fakat her türlü makine öğrenimi aslında geçmişten bir zaman kesiti almaktan ibaret. Buna karşın gelecek açık uçlu olduğundan, sistemin olası değişimlere ayak uydurması isteniyorsa her değişime göre yeniden eğitilmesi gerekiyor. Makine öğrenimi ancak bizim deneyimlerimizin dümensu yunda ilerlediğinde faydalı düzenlilikleri simüle edebiliyor (diye umuyoruz) . Dolayısıyla burada makine yolunu kendi bulmuyor, ona yine insan zihni yol gösteriyor.
Dar Yapay Zeki Olarak Makine Öğrenimi Makine öğreniminin simüle edici yapısı, onun neden hep dar tanımlı uygulamalara takılı kaldığını, yapay genel zekaya doğru ilerlemenin neden çok az olduğunu veya hiç olmadığını da açıklamaya izin veriyor. Doğal dil işlemede ki metin sınıflandırma, sözcük türü etiketleme, sözdizimsel ayrıştırma ve istenmeyen elektronik postaları tanıma gibi iyi tanımlı sorunların hepsinin ayrı ayrı çözümlenmesi ge rekiyor. Çünkü sistemler benzer bile olsa başka sorunları ele alabilmeleri için büyük ölçüde yeniden tasarlanmaları ve diğer alanlara taşınmaları gerekiyor. Böyle sistemler için 'öğrenici' demek ironiktir çünkü esasında insanlar için öğ renme sözcüğü dar bir anlayıştan kurtulup dünyadaki şey lere dair daha genel bir anlayışa ulaşmak demektir. Oysa satranç oynayan sistemler, daha karmaşık olan Go oyunu nu oynayamıyorlar. Go sistemleri bile satranç oynamıyor lar. Google'ın DeepMind'ı tarafından yapılan ve zamanın da epey gürültü kopartan Atari öğrenme sistemi bile ancak farklı Atari oyunları arasında bazı genellemelerde buluna biliyor, hala bu oyunların hepsini oynamayı öğrenemiyor. İyi oynadığı oyunlar da yalnızca katı parametrelere sahip olanlar. En güçlü öğrenme sistemleri, düşündüğümüzden çok daha dar kapsamlı ve kırılgandır. Gerçi bu akla uygun
YAPAY ZEKA MiTi
gibi çünkü bu sistemler yalnızca birer simülasyondan ibaret. Başka ne b� kliyorduk ki? Yukarıda değindiğimiz tümevarım sorunları deneyimin kendisinden kaynaklanmıyor, bilgiyi ve çıkarımı salt dene yime dayandırma çabasından kaynaklanıyor ki yapay zeka alanında makine öğrenimi yaklaşımlarının yaptığı da tam olarak budur. Dolayısıyla tümevarımın barındırdığı sorun ların makine öğrenimi ve veri merkezli yapay zeka yakla şımlarının başına musallat olmasına şaşmamalı. Veriler yal nızca kolay erişebilmek için bilgisayarlarda depoladığımız gözlenmiş olgulardan ibarettir. Üstelik gözlenmiş olgular, onları ne kadar çözümlersek çözümleyelim, bizi genel bir anlama kabiliyetine veya zekaya ulaştıramazlar. Bilimsel -ve felsefi- soruşturmanın doğası hakkında ka bul gören bu gerçeğe düşülen modern bir şerh de görece kısa bir süre önce erişilebilir hale gelmiş devasa boyutlarda ve rinin yapay zeka sistemlerine o güne dek yoksun oldukla rı 'yetkinlik' ve içgörüyü temin edebileceği fikriydi. Bu bir anlamda doğruydu ama tümevarım sorunundan kaçınmaya yetecek kadar değildi. Bu doğrultuda şimdi 'büyük veri' ko nusuna eğileceğiz.
Büyük Verinin Sonu Büyük veri genellikle çok büyük veri kümelerinin işletme ler, devletler -ve yapay zeka araştırmacıları- için elzem olan çözümlemeleri yapmalarına ve içgörüler geliştirmelerine izin veren büyük gücüne atıfta bulunmak için kullanılan fazlasıyla belirsiz bir kavramdır. Özgün terim ilk kez 1 99 7 yılında bilimsel bir bağlamda, NASA'nın bir makalesinde karşımıza çıkıyor. Bu makale o zamanki bilgisayar grafiği teknolojisini kullanarak verilerin görselleştirilmesi sırasın da karşılaşılan zorlukları anlatıyordu. Bu terim o dönemde tutmadıysa da sonraki 1 0 yıl içerisinde yaygınlaşıp işletme 188
MAKiNE MRENIMI VE BÜYÜK VERi
ve bilişimi içine alan genel bir terim haline geldi. Modern b üyük veri kavramı, iş zekası tartışmalarında ve ilk kez be lirgin biçimde 2001 yılında Gartner Grubu'nun iş zekasının çözmek zorunda olduğu sorunları ele aldığı bir raporunda ortaya çıkmış gibi görünüyor. tlgili rapor, hacim, hız ve çe şitlilik üzerinden büyük veri kümelerinin özelliklerini vur·· guluyor, bilişim kaynakları daha güçlenip daha ucuz hale geldikçe bu büyük veri kümelerinin de daha fazla önem ka zanacağından bahsediyordu. Fakat bu rapor da büyük veri terimini kullanmıyordu. 5 Her halükarda bu terim 2000'le rin sonunda yaygınlaşmaya başladı. 20 1 4 yılındaysa Forbes dergisi büyük veri hakkındaki abartı ve kafa karışıklıklarını " 12 Big Data Definitions: What's Yours ? " [ " 1 2 Büyük Veri Tanımı: Hangisi Sizinki ? " ] başlıklı bir yazıda ele alacaktı.6 Tam tanımını vermek epey zor olsa da büyük veri (kat kat büyük veri derlemeleri) bilim ve sanayide bilişim dev rimine öncülük etti. 20 1 2 yılında Obama yönetimi, Büyük Veri Araştırma ve Geliştirme Girişimi'ni kurduğunu ilan etti. Bu girişimin amacı 'Ulusun en acil sorunlarından ba zılarını çözmek' olarak belirlenmişti.7 En azından bir şir ket -SAS adlı bir iş analizi şirketi- yeni bir yönetici unvanı icat etmekte gecikmemişti: 'Büyük Veri Başkan Yardımcı sı'. Yani ortada bir abartının olduğu kesindi. Ama büyük 5
6
Doug Laney, " 3-D Data Management: Controlling Data Volume, Velocity and Variety'' , Gartner Group Araştırma Raporu, Şubat 200 1 . Özgün metne artık Gartner'dan ulaşılamasa da Laney metni şu adresten tekrar yayımladı: https://community.aiim.org/blogs/doug-laney/201 2/08/25/dej a-vvvu-gartners original-volume-velocity-variety-definition-of-big-data. IBM daha sonra ha cim, hız ve çeşitliliği içeren çerçeveye dördüncü madde olarak doğruluğu da ekledi. Ancak Laney daha sonra bir blog yazısında (buna artık çevrimiçi eri şilemiyor) doğruluğun aslında hacimle zıtlık ilişkisi sergilediğini, bu nedenle Gartner'ın tanımını bozduğunu belirtti. Kendisi, doğruluk gibi ölçütlerin 'bü yüklük' ölçütü olmadığını, dolayısıyla büyük veriyi birden fazla tanımlayan bir öznitelik teşkil etmediğini açıkladı. Doug Laney, " Batman on Big Data," Garter Blog Network, 13 Kasım 201 3 . Gil Press, " 1 2 Big Data Definitions: What's Yours ? '' , Forbes, 3 Eylül 2014. Bkz. hrtps://obamawhitehouse.archives.gov/blog/201 6/05/23/administration issues-strategic-plan-big-data-research-and-development.
YAPAY ZEKA MiTi
verinin yarattığı heyecan, gittikçe güçlenen bilgisayarlarda sorunları çözümlerken daha fazla verinin daha fazla avantaj sağlayacağının kabul edilmesi anlamına geliyordu. Yine de en başından itibaren büyük verinin içgörüleri ve zekayı nasıl 'güçlendirdiği' hakkında bir kavram kargaşası mevcuttu. Elde edilen başarılı sonuçlardan ilk başta büyük verinin bizzat sorumlu olduğu düşünülüyordu ama makine öğrenimi yaklaşımları kalkışa geçince araştırmacılar bu ba şarının asıl müsebbibinin algoritmalar olduğunu düşünme ye başladılar. Çünkü derin öğrenme, diğer makine öğreni mi algoritmaları ve istatistiksel teknikler kullanılarak gözle görülür birtakım iyileşmeler sağlanmıştı. Fakat bu algorit maların performansı daha büyük veri kümelerine bağlıydı. Öyle ya da böyle, yapay zekanın performansında iyileşmeler görülmüştü, hiç çözülemeyecek sanılan sorunlar daha fazla veriye erişim sağlanınca bir anda çözülebilir hale gelmişti. İş dünyası ve bilim alanlarındaki araştırmacıların ve uzmanla rın yakalamak istedikleri de işte bu içgörü genişlemesiydi. St. Andrews Üniversitesi'nden bilgisayar bilimciler Jonathan Stuart Ward ile Adam Barker'ın belirttikleri üzere " büyük veri özü itibarıyla verilerin çözümlenerek anlamların keş fedilmesiyle ilgilidir. "8 Nitekim yapay zeka çalışmaları on yıllardır verileri anlamlandırma sorununu çözmeye çalışı yordu. Erişilebilir veri miktarı artınca birden bire anlamlar her yerde kendilerini göstermeye başladı. 20 1 3 yılına gelindiğinde, Viktor Mayer-Schonberger ve Kenneth Cukier çok satılan B üyük Veri & Yaşama, Çalış ma ve Düşünme Şeklimizi Dönüştürecek Bir Devrim adlı kitaplarında 'büyük verinin sıkı bir tanımı yok' itirafında bulunuyorlar ve büyük veriyi 'toplumun, önemli değer taşı yan faydalı içgörüler veya mal ve hizmetler üretmenin yeni yollarını oluşturacak biçimde bilgiyi işleme becerisi' diye 8
Jonathan Stuart Ward ve Adam Barker, "Undefined by Data: A Survey of Big Data Definitions," Bilgisayar Bilimleri Fakültesi, Saint Andrews Üniversitesi, Birleşik Krallık. Yayım yeri: arXiv, 20 1 3 .
MAKiNE ÔİiRENIMI VE BÜYÜK VERi
tanımlamayı öneriyorlardı. Onlara göre büyük verinin ge lişi de 'yeni içgörüler sağlayıp yeni değerler yaratmak üzere daha ufak ölçekte yapılamayan şeylerin artık daha büyük ölçekte yapılabileceği' anlamına geliyordu.9 Özel sektör de ve kamu sektöründe ancak veri kümelerinin hacminde meydana gelen artışlarla mümkün olmuş başarı öyküleri ni buna örnek gösteriyorlardı. Örneğin girişimci ve Was hington Üniversitesi'nde bilgisayar bilimleri profesörü olan üren Etzioni tarafından 2004 yılında kurulan Farecast adlı yeni teknoloji şirketi 200 8 yılında Microsoft'a 1 1 0 milyon dolara satılmıştı. Şu anda Seattle'daki Allen Yapay Zeka Enstitüsü'nün başı olan Etzioni, yaklaşık 200 milyar uçak bileti kaydından oluşan büyük veriyi incelemiş, böylece uçuş ücretindeki tepeleri ve dipleri oluşturan eğilimlerin uçuştan önceki günlere bağlı bir fonksiyon olduğunu bulmuştu. Farecast'in performansı, büyük verinin, büyük sayılardan yeni içgörülerin ve kabiliyetlerin kazanılması anlamına gel diği izlenimini kuvvetlendirmişti. Sistem Etzioni'nin yal nızca 1 2.000 fiyat noktası kullanan temel tahminlerinden ilerlemeyi sürdürüyordu. Milyarlarca uçak bileti veri nokta sına ulaştığında müşterilere ne zaman havayolu bileti satın almak gerektiğine dair doğru tahminlerde bulunarak ciddi bir müşteri değeri sunacak düzeye ulaştı. Bir zamanların sihirli deyimi büyük veri, artık dünyanın her yerinde yapay zekadan güç alan işletmelerin yeni norma li olmuş durumdadır. Walmart lojistik zorluklara, yani tü ketici talebine etkili yanıt verecek biçimde ürün satın alma, depolama ve nakliye işlerine büyük veri ve veri madenciliği tekniklerini uygulamak üzere Walmart Laboratuvarları'nı kurdu. Amazon büyük veriyi bu terim dillere pelesenk ol madan önce bile çevrimiçi satın alma işlerini takip edip 9
Viktor Mayer-Schonberger ve Kenneth Cukier, Big Data: A Revolution That Will Transform How We Live, Work, and Think, New York: Eamon Dolan / Mariner Books, 2014, s. 6; (Türkçesi: Büyük Veri: Yaşama, Çalışma ve Düşün me Şeklimizi Dönüştürecek Bir Devrim, çev. Banu Erol, İstanbul: Palama, 2013]
YAPAY ZEKA MiTi
sınıflandırmak için kullanıyordu. Bunlar şimdi ürün öne rileri, gelişmiş arama ve diğer müşteri hizmetlerini sunan makine öğrenimi algoritmalarını besleyecek veriler olarak kullanılıyor. Büyük veri, Moore Yasası'nın kaçınılmaz bir sonucudur: Bilgisayarlar güçlendikçe makine öğrenimi gibi istatistiksel teknikler de daha iyi hale geliyor, yeni işletme modelleri ortaya çıkıyor. Bunların hepsi, veriler ve bu ve rilerin çözümlenmesi sayesinde oluyor. Bugün veri bilimi (yahut giderek yaygınlaşan adıyla yapay zeka) diye aldan dırdığımız çalışma sahası aslına bakılırsa Moore Yasası ve dev hacimli veri yığınlarının yeni kanatlar bahşettiği epey eski bir alandır. Devletler ve kar amacı gütmeyen örgütler de hızla bu işe daldılar ve araç trafiğinin akışından tutun da şartlı tahli yeye uygun tutuklular arasında tekrar suç işleme oranına varasıya her şeyi tahmin etmek için büyük veriyi kullandı lar. Mayer-Schonberger ve Cukier, New York'ta rögar pat lamaları olasılığına dair bir tahmin modeli kurmak üzere nasıl Columbia Üniversitesi'nden büyük veri uzmanlarının tutulduğunu anlatıyorlar. (New Y ork'un sadece Manhattan bölgesinde bile 50.000'den fazla rögar kapağı var.) Bu giri şim başarılı olunca, verinin ölçeğinin artırılmasıyla büyük sayılardan yeni içgörülerin ve kabiliyetlerin doğabildiğine örnek olarak gösterildi. Ne de olsa insan işçiler her gün on binlerce rögarı tek tek denetleyemezler. Tıbbi kayıtları iş lemeden tutun da devletin aktüerya çabalarına, oradan oy kullanma alışkanlıklarına ve emniyete varasıya diğer alan lardan örnekler de verinin hacmi ve niteliğinin -yani büyük verinin- yeni içgörüleri ve kabiliyetleri doğurduğu iddiasını destekleyen örnekler sayıldılar. Sanayide ve diğer sektörlerde büyük verinin başarısı, hız la, sadece verilerden hareket eden çıkarımların gücünü yere göğe sığdıramayan fazla şişirilmiş iddiaların ortaya atılma sına da yol açtı. Wired dergisinin editörü Chris Anderson'ın 2008 yılında ortaya attığı kışkırtıcı iddia bu şişirilmiş balo-
MAKiNE MRENIMI VE BUYU K VERi
nun tepe noktasını teşkil ediyordu. Anderson'a göre büyük veri bilimde kuramın sonunu getiriyordu. 1 0 Bilim insanları ve diğer aydınlar, veri kümelerinin kendi başına düşünüp yorum yapamadığına dikkat çekip kuramın şart olduğunu işaret etmekte gecikmedilerse de bu makale veri tufanının baş döndürücü başarısının bir tür kültürel ifadesi haline gel mişti bile. İşin doğrusu, ilk başta yapay zeka araştırmaları dahilinde veri biliminde ve makine öğreniminde istatistik sel tekniklerden oluşan bir tür yamalı bohça kullanılıyordu. İstendik içgörülere büyük veri sayesinde ulaşılması, hatalı şekilde, verinin hacmine bağlanmıştı. Bu aslında daha en ba şından itibaren gülünç bir düşünceydi çünkü veri noktaları olgulardır, dolayısıyla kendi başlarına içgörüye dönüşemez ler. Gerçi bu durumu ancak şimdi, yani bugünden dönüp geçmişe baktığımızda görebiliyoruz ama ImageNet yarışma larında derin öğrenme sistemlerinin görsel nesne tanıma gö revlerinde kazandığı ilk başarılar bile büyük veriye duyulan ateşli tutkunun yavaş yavaş bu veriden istifade eden maki ne öğrenimi yöntemlerine -başka bir deyişle yeni patlama yaşayan yapay zeka çalışmaları alanına- doğru yönelmeye başladığının bir işaretiydi. Dolayısıyla büyük veri furyası zirvesine ulaştı ve artık ne redeyse belirdiği hızla yaygın tartışmalardan çekiliyor gibi görünüyor. Derin öğrenmeye odaklanmak akla daha yatkın bir tutum olacaktır. Ne de olsa Go turnuvalarında insan şampiyonları ezmekten tutun da Atari oyunlarında uzman laşmaya ve araba sürmeye varasıya her şeyden veri değil, al goritmalar sorumludur. Üstelik büyük veri kendine modern yapay zeka çalışmalarında da bir yer edindi çünkü makine öğrenimi gibi veri güdümlü yaklaşımların tamamı, eğitim modelleri oluşturmak ve öğrenme sistemlerini sınamak için çok büyük miktarda veriden faydalanıyor. Kısa süre önce 1°
Chris Anderson, "The End of Theory: The Dara Deluge Makes the Scientific Method Obsolete" , Wired, 23 Haziran 2008. 193
YAPAY ZEKA MiTi
bir gözlemcinin de belirttiği üzere, büyük veri 'büyük verili yapay zekaya' dönüştü. 1 1 Büyük veri hakkında b u kadar söz yeter. Ama yine çıka rım sorusu, özellikle de makine öğrenimi gibi veri güdümlü yöntemlerin sığ ve veri güdümlü simülasyon ile tümevarım dan daha güçlü çıkarım türleri aracılığıyla edinilen fiili bilgi arasındaki uçurumu nasıl kapatacağı sorusu yanıtlanmayı bekliyor. Bu noktayı önceki sayfalarda zaten belirtmiştim, şimdi onun ayrıntılarına inip meseleyi daha açık biçimde or taya koyacağım.
Empirik Kısıtlama Veri güdümlü yöntemler genellikle 'empirik kısıtlama' di yebileceğimiz bir şeyden mustariptir. Bu kısıtlamayı anla mak için makine öğreniminin 'öznitelik çıkarma' diye bi linen bir teknik ayrıntısını ortaya koymamız gerekiyor. Belirli bir sorunla uğraşan yapay zeka bilimciler genellikle arzulanan çıktıyı üretecek algoritmaların eğitiminde kulla nılmak üzere veri kümelerindeki sözdizimsel öznitelikleri veya kanıtları tespit etmekle işe başlarlar. Öznitelik mühen disliği özünde bir beceridir; bu yüzden, bugün faydalı özni telikleri belirleme becerisine (ve başarılı öğrenimde sonraki basamaklardan olan algoritmalardaki parametrelerin ince ayarını yapma becerisine) sahip mühendislere ve uzmanlara çok büyük paralar ödeniyor. Öznitelikler bir kere belirlen diğinde saf bilişim yöntemleriyle eğitim, sınama ve üretim aşamalarında çıkarılıyorlar. İşin püf noktası da işte bu saf bilişimsel kısıtlama. Derin öğrenme sistemlerinden, daha zorlu görüntü tanıma görevlerinde daha iyi performans elde etmek mümkün: Farklı nesnelere ve art alanlara sahip bir fotoğrafta kaybolmuş ve tespit etmek istediğimiz nesnenin " Gil Press, " Big Data is Dead. Long Live Big Data AI'' , Forbes, 1 Temmuz 2019. 1 94
MAKiNE MRENIMI VE BÜYÜK VERi
üzerine diyelim ki Photoshop gibi bir yazılımla bir ok çi zersek işleri kolaylaşırdı. Oysa bu şekilde hazırlanmamış diğer fotoğraflara insanların çizdiği öznitelik belirteçleri eklenemediğinden, öznitelik görüntüden sözdizimsel olarak çıkarılamaz, dolayısıyla işe de yaramaz. Sorunun kaynağı da buradır. Makine öğreniminde kullanışlı özniteliklerin her zaman verinin içinde olması gerekiyor, insanlar tarafından sisteme sınanırken veya daha sonra 'dışarıda' işini yaparken de kullanamayacağı hiçbir ipucunun önceden verilmemesi gerekiyor. Öznitelik çıkarma işlemi ilk önce eğitim aşamasında gerçekleştirilir, makine bu yolla bir model öğrendikten son raysa üretim aşaması denen aşamada öznitelik çıkarma işle mini tekrarlar. Eğitim aşaması sırasında, etiketlenmiş veri, öğrenme algoritmasına girdi olarak sunulur. Örneğin amaç at görüntülerini tanımaksa sisteme girdi olarak içinde at bu lunan bir fotoğraf sunarız. Bu durumda çıktımız AT etiketi olacaktır. Bu şekilde makine öğrenimi sistemi ('öğrenici') etiketlenmiş at resimlerini girdi-çıktı çiftleri olarak alır ve yerine getirmesi gereken görev de görüntü etiketleme işle mini sadece at resimlerinin AT etiketiyle ilişkilendirilmesini sağlayacak şekilde simüle etmeyi öğrenmek olacaktır. Bu eğitim, öğrenme sistemi isabetlilik şartını karşılayan (veya karşılamayan) bir model -bu örnekte girdinin at olma ola sılığını temsil eden istatistiksel bir kod parçası- oluşturana dek devam eder. Bu noktada öğrenicinin ürettiği model yeni, daha önce görülmemiş görüntüleri otomatik olarak etiketlemek ama cıyla kullanılır. İşte bu, üretim aşamasıdır. Genellikle üretim aşamasında geribildirim döngüleri kullanılır; yanlış etiket lenmiş at görüntüleri bu döngüde bir insan tarafından düzel tilip yeniden eğitim için öğreniciye geri gönderilir. Bu işlem sayısız kere tekrarlanabilirse de eninde sonunda isabetliliğin artık daha fazla artmadığı bir noktaya varılacaktır. Face book kullanıcı etkileşimi de bir geribildirim döngüsüdür: 195
YAPAY ZEKA MiTi
Bir içeriğe tıkladığınızda, bir dostunuzu bir fotoğrafta eti ketlediğinizde, Facebook'un derin öğrenmeye dayalı eğitim sistemine tekrar veri göndermiş oluyorsunuz; o da gelecekte karşınıza çıkaracağı içeriği kişiselleştirmek üzere, tıkladığı nız içerikleri sürekli çözümlüyor ve değiştiriyor. Empirik kısıtlama makine öğrenimi için bir sorun teşkil ediyor çünkü öğreniciye sunmak isteyebileceğiniz ek bilgile rin hepsi kullanılamıyor. Öznitelik olarak piksel verisine bel bağlayan görüntü tanıma görevlerinin aksine, dili anlamada karşılaşılan çoğu sorun girdilere işaretler eklenmesini, yani modellerin eğitilmesinde ve kullanılmasında sistemin insan ların tespit ettiği öznitelikleri çıkarmasını gerektiriyor. Doğal dil işleme alanında basit bir sorun olan adlandırıl mış varlık tanıma üzerinden bunu inceleyelim. Adlandırılmış varlık tanımada KlŞl, KURUM, ÜRÜN, KONUM, TARİH gibi anlamsal varlık veya metin etiketleri arzulanan çıktı ları oluştururlar. Girdi ise örneğin Facebook gönderilerin den alınmış serbest biçimli bir metin olabilir. Bir şirket veya bir birey, belirli bir şirketten, diyelim Mavi Kutu Şti. 'nden bahseden tüm gönderilerden haberdar olmak istiyor. 'Mavi Kutu Şti.' ifadesiyle yapılan ve yalnızca sözcük eşleştirmeye dayanan bir anahtar sözcük araması, gönderilerde bu şir kete örneğin 'Mavi Kutu' veya 'mavi kutu', hatta bağlama göre sadece 'kutu' sözcüğüyle bile yapılan daha gevşek atıf ları göremeyebilir. Adlandırılmış varlık tanımanın amacı ise şirkete atıfta bulunan bu tür gevşek ifadelerin de gözden kaçmaması için çok büyük miktarda etiketli gönderi yığını üzerinde makine öğrenimini kullanmaktır. Dolayısıyla özni telik çıkarma işlemine ihtiyaç duyar. Yani insanlar makine öğrenimi sistemini eğitmek için kullanılacak gönderiler kü mesi içinde Mavi Kutu Şti'ne dair tüm atıfları etiketlemeli, sonra bunlar sisteme geri gönderilerek makinenin üretim aşamasında 'Mavi Kutu Şti. 'ni etiketleyebileceği bir model oluşturması sağlanmalıdır. Mavi Kutu sistemi diğer gönderilerdeki sözcüklerin
MAKİNE MRENIMI VE BÜYÜK VERi
yanı sıra özniteliklere -yani gönderilerde şirketlere yapı lan atıfların delillerine- de bel bağlayacaktır. Yine burada da özniteliklerin sözdizimsel olmalarıı şarttır çünkü üretim aşamasında insan müdahalesine gerek duyulmadan öğren me sistemi tarafından tam otomatik şekilde çıkarılabil melidirler. İşte bu, kilit empirik kısıtlamadır. Öznitelikler büyük yazılan harflerin denetlenmesi gibi yazımsa! veya 'mavi' ve 'kutu' sözcüklerinin sıralı olarak bulunuşunun denetlenmesi gibi sözcüksel de olabilirler. Bunlara bir de 'Şti. veya Şirketi sözcükleriyle sonlananlar' gibi bilgiler de eklenebilir. Bir sözcük türü etiketleyici ise daha çok sözdi zimiyle tespit edilen öznitelikler olan özel adlar veya cins adları gibi sözcük türlerini etiketlemek üzere eğitim verisi üzerinde çalıştırılabilir. Başka öznitelikleri araştırmak da elbette mümkündür. Yine buradaki temel nokta, tüm öz niteliklerin ilk başta insanlar tarafından tespit edilseler de daha sonra salt bilişimsel yöntemlerle çıkarılmasıdır. Aksi takdirde sistem otonom üretim aşamasında otomatik per formans gösteremeyecektir. Fakat burada şöyle bir sorun çıkıyor: Gönderilerde Mavi Kutu Şti.'ne atıfta bulunulduğunu gösteren bazı delillerin kendileri de -örneğin veriler arasında adıllar ve başka türden göndermeler yer alıyorsa- birtakım çıkarımlarda bulunmayı gerektirecektir. Bu da öğrenme görevini bir çırpıda karmaşık hale getiriyor. Diyelim ki Facebook'ta bir gönderi okurken birinin Mavi Kutu şirketinden söz ettiğini fark ettim ve ar dından o kişi 'şirketin karı' hakkında bir yorumda bulundu. Buradaki 'şirketin' sözcüğü, adlandırılmış varlık tanımada kullanılabilecek bir öznitelik değildir. Bu sözcükle belirli bir hata payı barındıran eşgönderim çözümleme alt sistemi il gilenmelidir. Burada, eşgönderim sorununun adlandırılmış varlık tanıma sorunundan çok daha zor bir sorun olduğuna dikkatinizi çekerim. Beterin beteri vardır derler ya, devam edelim: Diyelim ki Bob'un hisselerin performansını tartışır ken aslında Mavi Kutu Şti. 'ni kast ettiğini biliyoruz. İşte bu 1 97
YAPAY ZEKA MiTİ
bilgi çözümlenecek veriler arasında [doğrudan] yer almadığı için sistemin saptayabileceği bir özniteliği de bulunmaya caktır. Örneğin birinin XYZ adlı başka bir şirketin kurucu larından biriyle ilgili bir anekdotunu anlatırken "Mavi rengi çok severdi. Sade, aklıda kalıcı bir şey olsun istediği için işle tim sisteminin adını 'Mavi Kutu' koydu " dediğini düşünün. Bağlama bakıldığında bu bir şirket adı değil, bir ürün adıdır ama adlandırılmış varlık tanıma sistemi bu bağlamsal bilgiyi eğitimi sırasında kullanamaz. Neden mi ? Çünkü kullanırsa üretim aşamasında, girdilerinden bu bilgiyi salt sözdizimine başvurarak çıkaramaz. Empirik kısıtlama, makine öğreniminin ayrılmaz bir par çasıdır. Bu da eğitim sırasında ancak otomatik yöntemler le veri içinde saptanabilecek salt sözdizimsel özniteliklerin kullanılabileceği anlamına gelir. Gerçekten zeki sistemler yalnızca işlenmiş verilerden edinilen öznitelik ve delillerle yetinemezler, daha geniş bir anlamda öznitelik ve delillere ihtiyaç duyarlar. Adlandırılmış varlık tanıma, doğal dili işleme alanında görece basit bir görev olsa da, burada bile salt veri güdümlü yaklaşımların içkin kısıtlamalarının olduğunu görüyoruz. Ürün hakkındaki bir gönderide Mavi Kutu'ya yapılan bir atıf kolaylıkla bir sahte pozitife dönüşebilir ve böylece şir kete yapılan bir atıf olarak etiketlenebilir. Bu örnekler uzun kuyrukta yer alan düşük olasılıklı durumlar olabilirler ama günlük dilde o kadar yaygındırlar ki empirik kısıtlamayla malul bir makine öğrenimiyle çözülemezler. Bütün bunların anlamı şudur: Büyük olsun veya olmasın, tek başına veri ve makine öğrenimi gibi tümevarımlı yöntemler yapay zeka alanında ilerlemenin önüne taş koyan içkin birtakım kısıt lamalarla maluldür. Tümevarım sorununun modern yapay zeka için gerçekten de bir sorun olduğu açığa çıkmıştır. Mo dern yapay zeka uygulamalarının anlam dünyasına açılan pencereleri doğrudan doğruya veriye bağlıdır. Bu da makine öğrenimine bir sınır koymaktadır.
MAKiNE ôGRENIMI VE BÜYÜK VERi
Sıklık Varsayımı Empirik kısıtlamalara ek olarak, makine öğrenimi yakla şımları talihsiz bir şekilde sıklık varsayımına da bel bağlı yorlar. Empirik kısıtlama gibi, bu da tümevarımlı çıkarımın temelinin sıralamaya dayanmasının doğrudan bir sonucu dur (veya yeniden ifadesidir) . Makine öğrenimi için büyük verinin taşıdığı değer, aslında belli bir varsayımın dışavu rumudur: Daha fazla, daha iyidir. Bu ironik bir durumdur. Makine öğrenimi sistemleri, gelişkin sayma makineleridir. Mavi Kutu örneğinden devam edecek olursak, şunları de netleyerek bir öznitelik listesini koda ekleyebiliriz: Acaba bir Facebook gönderisindeki mevcut sözcük veya ardışık iki sözcük IBM, Microsoft, Mavi Kutu Şti. gibi şirket adlarını içeren bir sözlükte yer alıyor mu ? Sözcüğün ardından 'Şti.' veya 'Ltd. Şti.' gibi kısaltmalar geliyor mu? Sözcüğün ken disi bir kısaltma mı ? Sözcük büyük harfle başlıyor mu ? Söz cük bir özel ad mı ?12 Genellikle bu özniteliklerin denk gelme sıklığı ne kadar yüksekse eğitime de o kadar faydası olduğundan, devre ye sıklık varsayımı giriyor. Sıklık varsayımı veri biliminde gereklidir. Eğer verideki öznitelikler tamamen rastlantısal olursa hiçbir şey öğrenilemez ( buna dair önceki tartışmayı hatırlayın) . Ama ortada bir örüntü varsa o zaman ilk olarak empirik kısıtlama gereği verinin içinde bulunmalıdır. İkinci olarak, bunun sonucunda girdi ile çıktı arasındaki ilişkinin gücünü belirlemenin yolu da sıklığa bakmaktan geçer. Baş ka türlü de olamazdı zaten. Ne zaman bir çift sözcüğün ar dından 'Şti.' kısaltması gelirse ve eğitim verisi içindeki etike-
12
Bunların hepsi 'vektör' adı verilen bir veri yapısı içerisinde evet/ha yır soruları nın yanıtları olarak kaydedilebilir. Bu vektörde 1 = 'evet', O = 'hayır' anlamına gelir. Dolayısıyla ( l , 1 , 1 ,0,0, 1 } gibi bir veri yapısı, bir öğrenme algoritmasına (öğreniciye) girdi olarak sunulacak bir öznitelik vektörüdür. Farklı öğreniciler için girişleri yapılandırmanın birçok farklı yolu var. Bu basit bir örnek. Ayrın tılar genel fikir kadar önemli değil. 199
YAPAY ZEKA MiTi
ti ŞiRKET olursa öğrenici de arzulanan çıktının, yani şirket adının özniteliği olarak 'Şti.' kısaltmasına yüksek olasılık atfedecektir. Binlerce örnekte saptanamayan örüntüler, mil yonlarca örnekte berraklaşırlar. Sıklık varsayımı işte budur. Sıklık varsayımına tamamen tersten de bakılabilir ki buna 'anomali algılama' adını veriyoruz. Anomali algılama, dolandırıcılık içeren banka işlemlerini veya kullanıcıların hatalı girişlerini saptamak için kullanılır. Bu sistemler de sıklık varsayımına bel bağlar, normallik varsayımı diyebile ceğimiz durumdan yararlanırlar: Normal olaylar, anormal olayları daha göze batar hale getirirler. Eğer bir şirketin ça lışanlarının sisteme binlerce veya milyonlarca normal giriş örneği gruplandırılabilir veya kümelendirilebilirse bu küme nin dışında kalan girişler elbette dikkat çekecektir. Bunlar yasa dışı girişler olabileceği gibi, hatalı girişler de olabilir. Yine burada makine öğrenimi neyin normal, neyin anormal olduğunu sıklık çözümlemesiyle belirliyor. Sıklık varsayımı kişiselleşmiş çevrimiçi içeriğin 'filtre ba loncuklarını', yani korunaklı alanını da açıklıyor. Sağ siya setten hoşlanmayan bir kullanıcı en sonunda yalnızca sol fikirleri ve haber içeriklerini alacaktır. Bu sonucu belirleyen derin öğrenme temelli sistem aslında sevdiğimiz haber örün tülerini zamanla tanımayı öğrenen bir eğitim modelinden ibarettir. Bu sistem tıklamalarınızı sayıp size aynı tür içeri ği sunuyor. Kişiselleşmiş arama ve öneri deneyimleri sunan Netflix, Spotify, Amazon ve diğer web siteleri için de bu du rum geçerlidir. Örneklerin (veya örneklerdeki özniteliklerin) sıklığıyla makine öğrenimi arasında kopmaz bir bağ var. Bu bağ, sürekli beyaz kuğu gözlemledikçe güvenimizin artması ile tüm kuğuların beyaz olduğu sonucuna daha kolay var mamız arasındaki bağlantıyla temelde aynıdır. Sıklık varsayımı anormal veya beklenmedik örneklerin ortaya çıkardığı uzun kuyruk eğrisi sorununun zorluğunu da açıklamaya yarıyor. Örneğin istihza, makine öğrenimi sistemlerinin anlamakta epey zorlandığı bir olgudur. Bunun 200
MAKiNE MRENIMI VE BÜYÜK V ERi
bir nedeni istihzanın sıklığının düz anlamdan daha düşük olmasıdır. Sayma veya sıralama işlemi, çevrimiçi belli gö revlerde çok işe yarıyor ama daha incelik gerektiren görev lerde sadece ayak bağı oluyor. Milyonlarca öfkeli yurttaşın "Trump bir geri zekalıdır! " diye tweet üstüne tweet attığını düşünün. Ardından Trump'ın bir rakibini münazarada ma dara ettiğini ve taraftarlarının bu kez aynı tweeti onu sev meyenlere nazire olsun diye müstehzi bir tutumla attıkları nı da düşünün. Bu durumda bu iletiler 'Trump-Gerizekalı' örüntüsünün başka örnekleri olarak kayda geçirilecektir. Öğrenme algoritması başlangıçta bir bilgiye sahip olmadı ğı için bu ileti onun için sadece ardışık sözcüklerden ibaret olacaktır. Oysa istihza sözcük temelli bir öznitelik olmadığı gibi düz anlamın aksine sık da görülmez. Makine öğrenimi böylesi dil fenomenleriyle karşılaştığında son derece kalın kafalı davranmasıyla ünlüdür. Bu durum Google gibi şir ketleri kedere boğuyor. Google reklam hedeflerken istihzayı saptayabilseydi herhalde çok memnun olurdu. Diyelim ki dışarıda kar fırtınası var ve biri müstehzi bir gönderisinde "Koşun bana güneş kremimi getirin " diyerek dalga geçiyor. Bağlama duyarlı bir reklam yerleştirme sisteminin bu du rumda ona 'güneş kremi' yerine 'bataryalı ısıtıcı çorap' rek lamı sunması gerekir. Girdiler örneğin yalnızca yukarıda değindiğimiz me tin sınıflandırma görevi aracılığıyla derlenmiş haberlerden oluştuğunda sıklık varsayımı daha da belirgin hale geliyor. Web'e hakim olan eğlencelik, 'komik' ve 'tuhaf' haberler ma kine öğrenimi için tam bir kabustur çünkü bu haberler düz anlama sahip değildir. Örneğin makine öğrenimi sistemleri 'gülünç' olaylara dair haberleri teknik açıdan bakıldığında suç unsurlarına veya yasa ihlallerine ilişkin atıflar barındır dıkları gerekçesiyle suç haberi örnekleri olarak sınıflandı rabiliyor. Neden sınıflandırmasın ki ? Tuhaf haberler, doğ rudan ve bilgi sunan muadillerine kıyasla çok daha düşük bir sıklığa sahiptir. Haliyle, eğitim verileri içinde de daha 201
YAPAY ZEKA MiTi
düşük bir sıklığa sahip olacaklardır. Üstelik tuhaf haberlerin neden tuhaf olduğunu saptamak bile empirik kısıtlamalarla ilgili bir sorundur. Bir haberin aptalca mı yoksa müstehzi mi olduğuna ancak yazarın ne kastettiği, ne anlatmak istediği anlaşıldığında karar verilebilir. Haberin hikayesinde gerçek ten geçen sözcükler eğitim verisi içinde yer alma sıklıkları na göre siyaset, spor, suç gibi iyi tanımlanmış kategorileri işaret edebilirler. Fakat hikayeyi oluşturan sözdizimi ögeleri -sözcükler- daha geniş bir anlam penceresinden bakılarak yorumlanmadığı sürece hikayenin kendisi sınıflandırılamaz. Makine öğrenimi sistemleri tümevarıma dayanmayan bu kabiliyete sahip olmadıkları için sıklık çözümlemesine baş vurmak zorunda kalırlar ve hikayenin özünü yakalayamaz lar. Bunu Yahoo! News'ün Associated Press'i kaynak göste rerek paylaştığı bir haberde görebiliriz: Ya Taco'nu Ya Canını ! Fontana, Kaliforniya . Domuz etine aşeren kadın dehşet saç tı: Namlunun ucundaki Fontanalı, taco'larından oldu. Komiser yardımcısı Jeff Decker'ın verdiği bilgiye göre, Pa zar günü 35 yaşındaki kurban tam sokağın köşesindeki tezgahtan 20 dolarlık taco alıp bisikletle evine giderken zan lı tarafından önü kesilerek taco'ları gasp edildi . Decker'ın aktardığına göre, zanlı kurbanın yüzüne yumruk atıp elindeki taco torbasını alarak kaçmaya çalışmış. Adam taco'larını geri almak için hamle yaptığındaysa zanlı ona silah doğrultarak akıllı olmasını söylemiş.
Bir metin sınıflandırma sistemi bu hikayeyi bir suç haberi olarak sınıflandıracaktır çünkü içinde 'zanlı', 'kurban', 'kaç maya' ve 'silah' gibi suçla ilişkilendirilen anahtar sözcükle rin neredeyse hepsi var. Fakat haberi okuyan insanların çoğu bu hikayeye güler geçer, bunun gülünç bir öykü olduğunu düşünür veya en azından bunu adi bir suç haberi olarak gö rür. Suç eylemlerinin haberlere konu olmasının nedeni kaygı verici olmalarıdır. Oysa haberin başlığında yer alan 'Domuz etine aşeren kadın dehşet saçtı' ifadesi Associated Press'in bu 202
MAKiNE MRENIMI VE BOYOK VERI
haberi mizah olsun diye aktardığının bir emaresidir. tlkokul çağındaki çocuklar bile bu niyeti okuyabilirken, koca yapay zeka sistemleri bunu Kaliforniya'nın Fontana şehriyle ilgili bir başka suç haberi olarak sınıflandıracaktır. Sıklık mizahı öldürür. Kurbanları, tabancaları, tehditleri içeren haberleri saydığınızda bu sözcüklerin gerçek suç haberlerinin içinde sık geçtiklerini görürsünüz. İşte sıklık varsayımının sorunu da böyle sıradışı örneklerde mevcut makine öğrenimi yöntemleri kullanılarak durumun nasıl çözülebileceğinin bilinmemesidir. Sözcükleri sözdizirninin parçası olarak çözümleyen ve sözcü ğün geçme sıklığını sınıflandırma için yeterli gören bu yakla şımda hikayelerin anlamları kaybolup gidiyor. Yapay genel zekaya ulaşmak için girdiğimiz bu yol, böyle görece basit ör neklerde bile bir çıkmaz sokak olduğunu kanıtlıyor. Çoğu gazetede yer almış bir başka Associated Press ha berine daha bakalım: 1 1 yaşındaki çocuk, köpeği ısırdı. Sao Paulo, Brezilya. 1 1 yaşında bir oğlan, ona saldıran kö peği boynundan ısırarak yaralayınca Brezilya basınında gü nün konusu haline geldi. Yerel gazetelere göre Perşembe günü Belo Horizonte şehrin de amcasının evinin bahçesinde oynayan 1 1 yaşındaki Gab riel Almedia'ya Tita adlı bir köpek saldırdı. Saldırı sonucu sol kolundan yaralanan Almeida, boğuşma sırasında köpeği boynundan var gücüyle ısırınca biri dişini kaybetti. Yakın larda bir inşaatta çalışan işçiler kısa sürede yetişip çocuğu öfkeli köpeğin çenelerinden kurtardılar. Saldırı sonrasında Q Globo gazetesine konuşan Almeida " İnsanın canı çıkaca ğına dişi çıksın" dedi.
Elbette bu haberin ciddi bir yanı var ama kesinlikle bir köpek saldırısı haberinden ibaret olduğunu söyleyemeyiz. Brezilyalı bir çocukla bir köpek arasında yapılan bir çeşit ısırma yarışmasının haberi de değil bu. Çocuk, dişlerini kö peğe geçirip bir dişini kaybetmesine rağmen ciddi biçimde yaralanmadığından, bu haberin yayımlanma nedeninin Bre203
YAPAY ZEKA M iTi
zilyalı köpeğin saldırısından ziyade çocuğun sürpriz karşı saldırısının tuhaflığını veya gülünçlüğünü vurgulamak ol duğu açıktır. Beklenmedik içerik -çocuğun köpeği ısırması bu hikayenin haber değeri kazanmasını sağlıyor. Böyle bir durumda ne yapay zekanın ne de makine öğreniminin fayda olur. Bilakis zararlı oluyorlar çünkü konuyu hepten ıskalı yorlar. Yalnızca makine öğrenimi kullanan bir yapay genel zeka, en iyi ihtimalle sinir bozucu bir aptal dahi olurdu. Temelde, bu sorunun merkezinde çıkarım kuramı yer alıyor. Tümevarımlı yaklaşım, zekanın çözümlenen veriler den doğacağını varsayıyor. Oysa verinin çözümlemesinden önce zekanın var olması şarttır. Öznitelik mühendisliğinde veya algoritma tasarımlarında kaydedilecek ilerlemelerin gelecekte daha eksiksiz bir hesaplayıcı yahut bilişimsel çıka rım kuramının oluşturulmasına izin vereceğini elbette umut edebiliriz ama kuşkuyu da hiçbir zaman elden bırakma mamız gerekiyor. Saptanabilecek özniteliklerin -ki bunlar ne de olsa sözdizimsel çözümlemeye tabi tutulacak verinin içindedir- kapsamını ve verimliliğini sınırlayansa tam ola rak empirik kısıtlama ve sıklık varsayımıdır. Bu da aslında her kademeden felsefeci ve bilim insanının çok uzun zaman önce öğrendiği bir gerçek: Tümevarım yeterli değildir.
Model Doygunluğu Makine öğreniminin ve büyük verinin mustarip olduğu bir sorun daha var: doygunluk. Doygunluk olgusu, yapay genel zekaya ulaşma umuduna musallat olmuş durumdadır. Bir öğ renme algoritmasına (veya istatistiksel bir tekniğe) daha fazla veri (daha fazla örnek) eklediğinizde bunun sistemin perfor mansı üzerinde daha fazla iyileştirici etkisi olmuyorsa o sis tem doygunluğa ulaşmış demektir. Nitekim öğrenme sistemi ni belirli bir sorun konusunda sürekli eğitmek, o sistemin çık tısının isabetliliğini sürekli artırmaz. Sistem bir noktaya gelir 20 4
MAKiNE MRENIMI VE BÜYÜK VERi
ve o noktadan sonra iyileşme sergilemez. Bir öğrenme siste minin başarılı sayılabilmesi için doygunluğa ulaşmadan önce kabul edilebilir isabetlilikte sonuçlar üretebilmesi gerekiyor. Üretemiyorsa bu, o sorunun makine öğrenimi aracılığıyla çözülemeyeceği anlamına geliyor. Doygun bir model, nihai sınırı, yani daha fazla veri kullanılsa bile sonucun daha fazla iyileşemeyeceği noktayı temsil ediyor. Gerçi kimi durumlarda sonucu daha da kötüleştirebiliyor ama bunun nedenleri bura da açıklayamayacağımız kadar tekniktir. Model doygunluğu bugün nadiren tartışılan bir konudur çünkü son yıllarda ele alınan sorunların çoğu, hazır veri artı şından yarar sağlamaya devam ediyor. Fakat araştırmacılar bir noktada doygunluğa ulaşılmasının kaçınılmaz olduğunu ve bunun makine öğrenimi sistemlerinin performansında bağlayıcı olduğunu biliyorlar. Google'ın Araştırma Direk törü Peter Norvig 20 1 3 yılında The Atlantic'te yer alan bir röportaj ında doygunluğa dair endişelerini şu sözlerle ağzın dan kaçırmıştı: " Daha fazla veriye ulaştıkça sistemlerimizin daha iyi iş çıkardığını söyleyebilir miyiz? Bunu aslında bir eğriyle ifade edebiliyoruz ve şunu söyleyebiliyoruz: Kullan dığımız sistemler günden güne iyileşmeye devam ediyorlar ama bunun hep böyle sürmeyeceğini söyleyebiliriz çünkü iyileşmenin boyutu geçmiştekine kıyasla azalıyor. " 1 3 Ben bu satırları yazdığım sıralarda Norvig'in uyarı ma hiyetindeki bu yorumunun üzerinden yedi yıl geçmişti. ImageNet yarışmalarında artık muhtemelen daha fazla veri kullanılamıyor ve bu yarışmadaki en başarılı sistemler % 9 8 isabetliliğe ulaşmış durumda. ( Bu yarışmada kullanılan standart sınama ölçütü, hedef seçilen bir etiketin, yarışmaya katılan sistemlerin ilk beş tahmini arasında yer almasıdır. ) Kısa süre önceye kadar eli kulağında diye düşünülen sürü cüsüz arabalar ise ağır araştırma aşamasını hala geçebilmiş ı.ı
James Somers, "The Man Who Would Teach Machines To Think " , The Atlan tic, Kasım 2 0 1 3 . 20 5
YAPAY ZEKA M iTi
değiller. Bu alandaki sorunun kısmi nedeni, eğitim verisi olarak etiketli video akışlarının kullanmasıdır: Bu verinin hacmi yeterli olsa da sürüş güvenliği açısından hesaba ka tılması gereken olağan dışı seyir senaryolarının aralarında bulunduğu uzun kuyruk sorunlarını çözmeye elverişli de ğildir. Norvig'in de öngördüğü gibi, modeller doygunluğa ulaşıyor. Yeni yaklaşımlara ihtiyaç olduğu belli. ilk başarı ların tam tekmil başarılara ölçeklenmesinin yeterli olacağı düşüncesinin safdil ve basitleştirici olmasının nedeni de işte bu gibi içinden çıkılmaz sorunlardır. Sistemler sınırsızca öl çeklenemezler. Makine öğrenimi -derin öğrenme- sihirli bir değnek değildir. Turing 1 950'de bilgisayar sistemlerine bilmediklerinin öğretilebileceğini umduğunu yazıyordu. O sıralar maki ne öğrenimi yapay zeka alanında kullanılan bir terim de ğildiyse de basit sinir ağları inşa etmenin olanaklı olduğu biliniyordu. Fakat Turing'in aklındaki bu değildi; daha ge nel, insanınkine benzer bir öğrenmeydi. Makinelere, ihtiyaç duydukları her şey programlanamazdı, bazı şeyleri kendileri öğrenmeliydiler. Turing bunun tümevarımla sağlanabilece ğini tahmin ediyordu. " Bazı önermeler makineye 'yetkililer ce' dışarıdan sağlanabilir ama diğerleri makinenin kendisi tarafından, örneğin bilimsel tümevarımla çıkarsanmalıdır " diyordu. Turing geçen yüzyılın ortasındaki dönüm nokta sında, formel sistemlere dışarıdan sağlanması şart olan içgö rüler konusunda kaygılanmayı artık bir kenara bırakmıştı. Ya da daha ziyade, bunların yeni bilişim makinelerinde ken dilerine yuva bulabileceğini ummuş olsa gerekti. Gelgelelim, bilim insanları Turing'in kast ettiği anlamda bir 'bilimsel tümevarım' kullanmazlar. Tahminlerde bulu nur, bu tahminleri sınar, sonra daha fazla tahminde bulu nurlar. Turing Peirce'ın mantıksal çıkarımla ilgili çalışmala rına hiç değinmiyordu; belli ki Peirce'ın savavarımlı çıkarımı hakkında elle tutulur bir bilgiye sahip değildi. Oysa bugün biz hala onun öğrenen makinelerinin peşindeyiz. 206
SAVAVARIMLI ÇIKARIM
Tahmin Olarak Çıkarımın Kökeni Charles Sanders Peirce ABD Sahil Araştırma Kurumunda önemli sayılabilecek bir bilimsel sorun üzerinde çalışıyordu. Peirce'ın işi sarkaç sallandırmaktı ama bunlar öyle alelade sarkaçlar değildi, çok hassas aletlerdi. Sahil Araştırma Kuru mu bu aletleri gravimetrik ölçümlerde, yani yerkürenin küt leçekiminde bölgelere göre görülen farklılıkları ölçmek için kullanıyordu. Gravimetri disiplini 1 9 . yüzyılda hala emek leme aşamasındaydı. Jeodezinin şemsiyesi altında bulunan bu disiplin, gezegenimizin şeklini ve ebadını incelememize yardımcı oluyordu. Yeni iş merkezlerine temel atmaktan tutun da savaş çıkarmaya varasıya sayısız işte yerkürenin topografyasıyla ilgili hassas ölçümlere ihtiyaç duyuluyordu. İşte Peirce'ın işi bu ölçümleri yapmaktı. Gravimetri, zamanın da hassas biçimde ölçülmesini gerek tiriyor. Tesadüf bu ya Peirce 1 879 yılının yaz aylarında kendini Boston'dan New York'a giden bir buharlı gemide bulmuştu. Yanında sarkaçlı ölçümlerinde kullandığı pahalı bir köstekli saat de taşıyordu. Saati bizzat seçmiş ve bu saat için o zamana göre epey yüksek bir meblağ olan 350 dolar para ödemişti. Gerçi bu parayı kendi ödememiş, masrafları Sahil Araştırma Kurumu üstlenmişti. Ertesi sabah kamarasında uyandığında saati ile diğer kişisel eşyalarının yerinde yeller esiyordu. 20 7
YAPAY ZEKA MiTi
Peirce, kütleçekim ölçümleri yapması için Sahil Araştır ma Kurumu tarafından ne zaman bir yere gönderilse paha lı teçhizatları bir şekilde ya kaybediyor ya da gittiği yerde unutuyordu. Bu konuda mimliydi. Hatta Peirce ile ABD bü rokrasisi arasındaki ipler bu nedenle uzun süredir gergindi ve saatin çalınması bardağı taşıran son damla olabilirdi. Pe irce de bunun farkında olduğu için vakayı bir dedektif gibi soruşturarak saati geri almayı kişisel bir mesele haline getir mişti. Daha sonra dönüp geriye baktığında bu soruşturma sürecinin aslında çıkarım konusunda bir ders barındırdığını düşünecekti. Peirce olayı şöyle anlatıyordu: Hatırladığı kadarıyla gemi sabah New Y ork limanına vardığında şehirdeki bir konfe ransa katılmak üzere gemiden inip bir faytona binerek kon feransın yapılacağı yere gitmişti. Ama oraya vardığında hem kösteği saf altından yapılmış saatini hem de şık paltosunu gemide bıraktığını fark etmiş, eşyalarını almak için alela cele gemiye dönmüştü. Kamarasına girdiğinde eşyalarının yerinde yeller estiğini görmüştü. Geminin kaptanı da eşya larını onun adına emanete aldırmadığına göre işin içinde bir hırsızlık olduğu belliydi. Hırsız da kamarotlardan biri olsa gerekti. Peirce gemi kaptanının yardımıyla tüm kamaradan ge minin güvertesinde toplayıp hizaya sokarak tek tek sorguya çekmişti. Sorgu sırasında suçlu olup olmadıklarını belirle yebilmek umuduyla onların gözlerinin içine bakmış ama elle tutulur bir sonuca ulaşamayınca belli ki hayal kırıklı ğına uğramıştı. Nitekim daha sonraları " Gözlerinde zerrece emare göremeyince daha fazla devam etmedim" diye itiraf edecekti. Tam pes etmiş, dönüp gidecekken aklına bir fikir gelmişi: " Bu işi kim yaptıysa onu parmağımla koymuşum gibi bulmam şart. Sağlam bir kanıtım olmasa da kimin hır sız olduğunu düşündüğümü söylemeliyim. " Güvertede sıra olmuş bekleyen kamaradan tekrar baş tan aşağı süzünce zihninde bir ışık yanmıştı; " kuşkularım 208
SAVAVARIM LI ÇIKARIM
silinmişti" diyordu. 1 Peki, ne olmuştu ? Peirce bir süredir 'tahminden' hareket eden çıkarımın -savavarımın- ayrıntı ları üzerinde çalışıyordu. İşte tahmin gerektiren bir örnek şimdi önünde duruyordu. Üstelik bu örnek gerçek hayatın içindendi, tabii haklıysa . Peirce sırada bekleyen adamlara doğru dönecek, parmağıyla aralarından birini gösterip ka marasına çağıracak ve ona eğer eşyaları geri getirirse 50 do lar vereceğini söyleyip bir uzlaşma önerecekti: " İşte bu para senin ama önce onu hak etmen lazım. Saatimi çalanın kim olduğunu bilmesem de olur çünkü bilirsem onu Sing Sing'e [New Y ork hapishanesine] göndermek zorunda kalırım ki bu da bana 50 dolardan daha fazlaya patlar. Üstelik kendini namuslu insanlardan daha uyanık sanan o ahmağın başına gelecekler için de yürekten üzülürüm" diyecekti.2 Belli ki zanlı savavarımın ne olduğundan pek haberdar değildi veya Peirce'ın blöfünü görmüştü çünkü ona " Elbette havadan 50 dolar kazanmak isterim. Ama sizi temin ederim ki istesem de bunu yapamam çünkü kayıp eşyalarınızın ne rede olduğu konusunda hiçbir bilgim yok" demişti.3 Peirce adamdan bir itiraf koparamayınca soluğu Pinkerton's adlı bir dedektiflik bürosunda alıp ( burası 'ür kütücü' bir yermiş ) New York ofisinin müdürü olan George Bangs ile görüşmüştü. Bangs'e şüphelinin saati bir rehinciye 50 dolar karşılığında vereceğini düşündüğünü söyleyerek onu takip ettirmesini istemişti. Bangs ise onun bu tahmine dayalı iddiasını ciddiye almayıp zanlıları bulmak için başvu rulan bildik kuralları ve yöntemleri kullanmayı tercih ede cek ve kamarotları soruşturup takip etsin diye bir dedektif görevlendirecekti. Bu dedektif bir başka kamarotun sabıka kaydı bulunduğunu, yankesicilik gibi bir dizi adi suça ka rıştığını açığa çıkarmıştı. Bu yüzden hırsızlığın baş şüphelisi 1
Charles Sanders Peirce, " Guessing," The Hound and Horn, 2. cilt, s. 267-282, 271 . 2 Charles Sanders Peirce, age., s. 2 71 . 3 Charles Sanders Peirce, age., s. 272. 20 9
YAPAY ZEKA MiTi
olarak b u adamı görüyordu. Fakat adamı n e kadar soruş turursa sonıştursun veya takip ederse etsin hırsızlığı onun yaptığını gösteren somut delilere ulaşamamıştı. Peirce ise hala kendi kuşkulandığı adamın rehinciye gideceğini düşün mesine rağmen Bangs'ın tavsiyesini dikkate alarak, kaybo lan eşyalarını bulup getirene 1 5 0 dolar para ödülü vereceği ne dair bir ilan yayımlatmıştı. Peirce'ın ilanı bir gün içinde sonuç vermiş, elinde saatle bir rehinci çıkagelmişti. Rehinci saati satanın eşkalini tarif edince Peirce aradığı onayı bulmuştu çünkü hırsızın eşkali Peirce'ın kuşkulandığı kamarota tıpatıp uyuyordu. Bunun üzerine Peirce adamın adresini bulup kaldığı dai reye baskın yapmıştı. Kapıda onu iki kadın karşılayıp çekip gitmezse polis çağıracakları tehdidinde bulunmuşlardı. Peir ce hiç oralı olmayıp içeri girerek içeride bir köşede gözüne çarpan büyük, ahşap bir sandığın başına gitmiş, pusulalı ve altın zincirli köstekli saatini tek parça halinde sandığın di binde bulmuştu. Bu sırada kadınlardan biri kaşla göz arasında komşu da ireye dalıp gözden kaybolmuştu. Peirce'ın anlattığına bakı lırsa iki genç kadın kapıyı ona açtıklarında dairenin bir kö şesindeki piyanonun üstünde duran özenle sarılmış bir boh ça gözüne çarpmış, bu bohçayı hafifçe kenara itince kayıp paltosu da bohçanın altından çıkmıştı. Böylece hem saatini hem de paltosunu geri almıştı. Belki de Dupin, Peirce'ın bedenine girmişti, kim bilir. Pe irce yalnızca tahminde bulunduğuna yemin ediyordu ama Bay Bangs sadece omuz silkmekle yetinmişti. Peirce bu öyküyü anlattığı " Guessing" [Tahmin] başlık lı makalesini şu sözlerle bitiriyordu: " Sanırım herkes buna benzer şeyler yaşamıştır. "4 Sanırım yaşıyoruz. Tahminlerimiz -çıkarımlarımız asla kesinlik taşımaz. Fakat buradaki asıl gizem önsezile4
210
Charles Sanders Peirce, " Guessing, " The Hound and Horn, 2. cilt, s. 277.
SAVAVARIMLI ÇIKARIM
rimizin, yani tahminlerimizin neden hiçbir zaman hakikati el yordamıyla arama girişimleri olmaktan öteye gidemedi ğidir. Peirce "Tahmin " adlı makalesinin başında 'Galileo ve bilimin diğer ustalarının' doğru kuramlara ulaşırken çok az hata yapmayı nasıl başardıklarını soruyordu. Bilim insanları ve geri kalan bizler de bildiğimiz ve gözlediğimiz şeylerden çıkarımlarda bulunarak açıklamalar üretiyoruz. Bu çıka rımları genellikle gözlem akışının kendisinden, olgulardan doğan şeyler olarak görmek istiyoruz. Oysa yaptığımız çı karımların çoğu gözlemden çıkmayan, ona dışarıdan katılan birtakım unsurlar barındırıyor: Neredeyse her çıkanmımıza bağlamsal bilgiler eşlik ediyor. İşte bu yüzden Peirce'ın an lattığı öyküyü desteklemek için Galileo'ya atıfta bulunması yerinde bir tutumdu: Bilimsel keşifler ve icatların genellikle kılı kırk yaran, titiz yöntemler kullanılarak yapıldığı düşü nülse de bu aslında doğru değildir. Yöntem tartışması, alt ta yatan gizemi perdeliyor. Tıpkı buharlı gemide sorununu çözmeye çalışan Peirce gibi Galileo da tahminle hareket et mişti. Her iki örnekte de tahminlerin hemen ardından yü rütülen soruşturma bu tahminlerin bir şekilde doğru yolda olduğunu ortaya koymuştu. Peirce, tahmini, olanaklı 'en az bir milyar' hipotez arasın dan doğru görünen birini seçmemize izin veren bir içgüdüye benzetiyordu. Sherlock Holmes, Watson'la ilk tanıştıklarında kavruk teni ve aksak yürüyüşünden hareketle ona askerden geleli çok olup olmadığını sormuş ve onun Afganistan'dan yeni dönmüş bir sıhhiyeci olduğunu düşünmüştü. Bu yalnızca bir tahmin miydi ? Hayır, bu bir çıkanmdı. Düzenlilikler yerine tek tek olaylan -örneğin bir saatin çalınmasını- anlamaya çalıştığımızda olayı açıklayabilecek bir hipotezi seçerek veya yepyeni bir hipotez icat ederek aslında kaçınılmaz olarak bir tür sihirbazlık yapıyoruz. Tümevarım, olgulardan genellemelere doğru giderek bizi düzenliliklerin asla kesin olmayan bilgisine ulaştırıyor. 211
YAPAY ZEKA MiTi
Oysa savavarım belirli bir olgunun gözlenmesinden hare ket edip bizi onu açıklayacak bir kurala veya hipoteze ulaş tırıyor. Olaylardan nedenlere gitmekle savavarım arasında sıkı bir bağlantı var. Örneğin Peirce'ın anlattığı hikayede hırsızlık olayından hareket edip bu olayın nedenine, yani hırsıza ulaşıyoruz. Sherlock Holmes bu akıl yürütme türü için 'sağduyudan fazlası değil' diyordu ve büyük oranda haklıydı. Fakat sağduyunun kendisi de gizemli bir olgudur çünkü tümdengelim veya tümevarım gibi mantıksal çıka rım kalıplarına uymaz. Savavarım, gündelik akıl yürüt melerimizin çoğunun bir tür dedektiflik işi olduğu fikrini yansıtıyor. Biz olguları (veriyi) , çevremizde olan biteni an lamlandırmamıza yardım edebilecek ipuçları olarak görü yoruz. Hipotez oluşturma ve tercih etme işinde olağanüstü başarılıyız. Peirce'e göre bu mekanik bir süreç olamazdı ve başka bir açıklamasını da göremediği için onu içgüdü addetmişti. Aslında biz sonsuz olanaklardan oluşan bir art alandan hareketle hangi hipotezlerin daha olası veya ma kul olduğunu tahmin ediyoruz. Başka bir deyişle, zekayı inşa etmek istiyorsak savavarımı hesaba katmak zorun dayız. Çünkü her türlü zeki düşünmenin hareket noktası budur. Savavarımdan hareket etmeyen tümevarımlar kör, tümdengelimler faydasızdır. Tümevarımın ilk basamağı savavarım olmalıdır çün kü felsefecilerin 'duyu verileri' dedikleri yorumlanmamış, ham deneyimi anlamlandırabilmek için gözlemlerimizi bir çerçeveye oturtmamız şarttır. Tek tek kuğulara ilişkin gözlemlerden " Bütün kuğular beyazdır. " genellemesine ulaştığımız basit tümevarımda bile bu bilgi arayışımıza asgari bir kavram çerçevesi veya kuram kılavuzluk eder. Aynı tümevarımlı stratej iyi kullanarak bütün kuğuların gagası olduğu sonucuna da ulaşabiliriz ama bu tümeva rım ilki kadar güçlü olmaz çünkü zaten bütün kuşların gagası vardır ve kuğular kuşların küçük bir alt kümesidir. Hipotezler oluşturmak için elimizdeki bilgileri kullanıyo212
SAVAVARIM LI ÇIKARIM
ruz. Sezgi bu anlamda matematikçiler için ilginç sorunlar yaratıyor. DeepMind'ın geliştiricileri saygın Nature dergisinde yayımlanan ve çok okunan makalelerinde D eepMind'ın 'insan tarafından baştan bilgilendirilmeye ihtiyaç duyma dan' Go oyununda ustalaştığını iddia etmişlerdi . Bu onla rın ister mekanik ister başka türlü olsun çıkarımın doğa sını yanlış anladıklarını gösteriyordu. Marcus ve Davis'in ifadesiyle bu makalenin ' durumu abarttığı' açıktı. 5 işin aslı şu ki DeepMind'ı geliştirenler AlphaGo programının içine Go oyununun zengin bir modelini kodlamışlar ve bunun için oyunda karşılaşılabilecek farklı zorlu durum ları çözebilecek en iyi algoritmaları bulmak için bizzat ter dökmüşlerdi . Bunların hepsi, sistem gerçek bir karşılaş maya girmeden önce olmuştu . Marcus ve Davis durumu şöyle açıklıyor: [S]istem, geçen on yıllar içerisinde insan araştırmacıların makinelerin Go gibi oyunları oynamasını sağlamak üzere keşfettiği şeylere bel bağlıyordu. Bunların en başında fark lı oyun olasılıkları ağacından rastgele örneklem yapan ( . . . ) Monte Carla Ağaç Araması geliyordu ki bu arama derin öğrenmeye içkin hiçbir özellik barındırmaz. Dahası Deep Mind ( [Atari sisteminin] aksine ) oyunun kuralları ve oyun hakkında ayrıntılı bazı başka bilgiler de içeriyordu. Dolayı sıyla insan bilgisinin işe karışmadığı iddiası en hafif tabirle gerçeği yansıtmıyor.6
Sözün özü, DeepMind ekibi sistemi görevini başaracak şekilde tasarlayabilmek için insan çıkarımlarını -savavarım lı çıkarımları- kullanmıştı. Tümevarımlı çerçeve bu çıkarım larla dışarıdan takviye edilmişti.
5 6
Gary Marcus ve Ernest Davis, Rebooting AI: Building Artificial Intelligence We Can Trust, New York: Pantheon, 2 0 1 9 , s. 145-146. Gary Marcus ve Ernest Davis, age., s. 146. 213
YAPAY ZEKA M iTi
Sürprizi Peirce, savavarımı temelde beklenmedik bir duruma -sürp rize- verilen tepki olarak görüyordu: Beklenmedik C olgusu gözlendi. A doğru olsaydı C beklenebilirdi. O halde A 'nın doğru olduğunu düşünmek makuldür. 7
Sürprizler tümevarımın başının belası uzun kuyruk eğrisinde yer alırlar. Ayrıca savavarımlı çıkarımlar tikel veya belirli olguların (A) açıklamalarını arar, tümevarımlı çıka rımlar gibi genellemeleri veya yasaları aramazlar. Burada C olgusu da belirli, tikel bir şeydir; şaşırtıcı, beklenmedik bir olgudur. Dolayısıyla savavarım kesinlikle bir genelleme de ğildir. Belirli, tikel bir şeyin gözlenmesinden belirli, tikel bir açıklamaya ulaştıran çıkarımlar normal zekanın bir parça sıdır. Bir barista olan Kate, Starbucks'ta genellikle perşem be günleri çalışıyor, cuma günleri ise tatil yapıyor diyelim. Geçmiş deneyimlerinden elde ettiği bu bilgiyle çıkarımda bulunabilen bir bilgisayar, Kate'in cuma günleri işe gelme sini beklemeyecek ve geldiği anda uzun kuyruk sorunlarıyla baş başa kalacaktır. Kate belki o gün fazla mesai yapmak istemiş veya bir arkadaşı hastalandığı için işe çağrılmış da olabilir. Ayrıca başka bir şubeye tayin edilirse yahut işi ta mamen bırakırsa perşembe günü işe gelmeyebilir. Bunların hepsi Kate'in işe gelişini veya gelmeyişini açıklayabilecek beklenmedik- tikel durumlardır; genellemelere veya beklen tilere bel bağlamayan sağduyu çıkarımlarıdır. (Bu arada, suç soruşturmaları daima beklenmedik olgularla başlar. Tüme varım bize suçların çoğunu genç erkeklerin işlediğini söyle yebilir ama bu bilgiye rağmen bir soruşturmacının bu belirli suçu kimin işlediğini bilmesi gerekir. Suçlunun ne genç ne 7
214
Charles Sanders Peirce, Collected Papers of Charles Sanders Peirce, Charles Hartshorne ve Paul Weiss (ed. ), 1 -6 . cilt, Cambridge, MA: Harvard University Press, 1 9 3 1 -5, s. 5 . 1 89.
SAVAVARIMLI ÇIKARIM
erkek -hatta Morgue Sokağı'nda gördüğümüz üzere- ne de insan olması şarttır.) Peirce savavarımı kestirime dayandığı gerekçesiyle çı karımın zayıf bir türü olarak görüyordu. Başka bir deyişle, t zamanına ait savavarımlı bir çıkarımın t + 1 zamanında yanlış olabileceğini kabul ediyordu. Gerçek dünyada yapı lan çıkarımların çoğu, zaman içinde hükümsüz kılınabilir; sonucun yanlış veya eksik olduğu, daha sonra yapılan göz lemler veya öğrenilen ( örneğin kitap okuyarak edinilen) bil giler aracılığıyla gösterilebilir. Kestirimlerden hareketle çıkarımlarda bulunmak zeki sistemlerin bir kusuru değil, meziyetidir. Kate'in iş arkada şının Robot Rosie'ye Kate'in işten ayrıldığını söylediğini, robotumuzun da buna inandığını düşünelim. Olur da Kate 10 dakika sonra çıkagelir ve iş arkadaşının yüzünde mu zip bir gülümseme belirirse, Rosie'nin çıkardığı sonucu geri çekmesi gerekir. Günlük hayatın hengamesi içinde, gördük lerimizin -veya okuduklarımızın- makul nedenlerini süratle kestirdiğimizi ve yine süratle bu kestirimleri çöpe atabildiği miz veya güncellediğimizi nadiren fark ederiz. Oysa günlük hayat, beklentilerden oluşan bir zeminde görünüşte bek lenmedik olayların kesintisiz bir akışıdır. Nitekim tıpkı bir trafik lambası gibi gündelik hayat da beklentilere genellikle karşılık veren bir yerdir ama trafik lambalarının da arada bir bozulduğunu unutmamak gerekiyor. Gözlemin anlamı da savavarımla birlikte kavramsal ola rak değişim geçiriyor. Tümevarım gözlemlere çözümlenecek olgular (veriler) muamelesi yaparken, savavarım gözlenen olguları dünyanın bir özelliğinin göstergesi olarak ele alıyor. Göstergelere ipucu muamelesi yapabiliriz çünkü bunlar en başından itibaren gözlemcinin önem verdiği belirli bir soru nu veya soruyu görmeye veya aydınlatmaya yardımcı ola bilecek bir olanaklar ağının parçası olarak anlaşılırlar. Suç vakalarını çözmek gibi zengin bir kültürel bağlama oturan işlerde ipuçları olmazsa olmadır çünkü sayısız olgu ve kanıt 215
YAPAY ZEKA M iTi
arasından sadece bazıları birbiriyle bağlantılıdır. Gerçekten de dedektiflik gibi işlerde bilinen, sınanmış yöntemleri kul lanmanın yarattığı temel sorun, çözülmez görünen suçların düzenliliklere uymaması, tek başına olguları derleyip top lamanın soruşturmayı hiçbir yere vardırmamasıdır. Akıllı dedektifler işte bu yüzden ipuçları ararlar. Avcılar da öyle. Avcılar keskin gözlü gözlemcilerdir ama belirli türden şeyleri gözlerler: Toynak izleri, hayvan dışkısı, kıl topakları, kırık dallar, kokular gibi unsurların tamamı avcıya avının yeri hakkında ipuçları sağlar. Bir suç mahalli ni inceleyen dedektif misali avcı da özellikle kısa süre önce gerçekleşmiş bir eylemin kanıtlarını arar, geçmişte olmuş şeylerin sonuçlarını gözlemler. Belki sağduyuya aykırı görünebilir ama ipuçları tekil, biricik sayılmazlar. Burnuna bilmediği bir koku gelen bir avcı, bunu belki ilginç ama tamamen benzersiz olmayan bir şeyin işareti olarak yorumlayacaktır çünkü tamamen benzersiz, biricik olsaydı ipucu işlevi göremezdi. Avcımız bilmediği bir kokunun bilinemeyen bir hayvan türüne veya dünya dışı bir varlığa ait olduğu sonucunu çıkarırsa işare tin peşinden gitmek istemeyebilir çünkü o belirli bir avın peşine düşmüştür. Dolayısıyla avcı kendi amacına uygun bir kestirimde bu lunmakla ilgilenir. Bu koku belki de kızışma dönemindeki bir hayvana ait olduğu için benzersiz geliyor olabilir; dolayı sıyla hayvanın kızışma döneminde vücudunda meydana ge len birtakım değişikliklerden kaynaklandığı kestirilebilecek beklenmedik bir olgu, bir sürprizdir. Kızışma dönemindeki bildik bir hayvan daha farklı bir koku yayacaktır. Burada avcının başına daha önce böyle bir şey gelmediğini, yani bu konuda geçmiş deneyimi olmadığını (işte bu yüzden bu bir savavarım), bu yüzden amacına ulaşmasını kolaylaştırma yan olanaklı mantıksal yorumları dışarıda bırakan bir akıl yürütme çerçevesi içinde hareket ettiğini unutmayın. Size şaşırtıcı gelebilir ama bu tür kestirimlerin doğru çıkma ihti216
SAVAVARIMU ÇIKARIM
mali yüksektir. Peirce de işte bu yüzden zekice düşünmenin temelini oluşturan 'tahminde bulunma içgüdüsü' dediği şey karşısında bu kadar afallamış ve büyülenmiştir. Görmek de avlanmak gibi bu konudaki temel örnekler den biridir. Peirce'ın belirttiği üzere, belirli bir nesnenin açel ya olduğu yargısına varmak için bile fiziksel algının eldeki bilgilerden ve beklentilerden oluşan derin bir ağın parçası olarak devreye sokulması gerekiyor. Peirce'ın kendi sözle rini hatırlayalım: " Bu güzelim bahar sabahı penceremden dışarı bakıyorum. Bir açelya olgunlaşıp çiçek açmış. Yok, hayır, gördüğüm şey elbette bu değil ama gördüğüm şeyi betimleyebilmemin tek yolu bu. Bu bir önerme, bir tümce, bir olgu. Oysa algıladığım şey bir önerme, bir tümce veya bir olgu değil, ancak onu dile getirdiğim ifadeyle güçbela anlaşılabilir hale getirebildiğim bir imge. Bu tümce soyut bir şey, gördüğüm şeyse tastamam somut. " 8 Peirce savavarımlı çıkarımın e n basit v e önemsiz dene bilecek algılarımıza bile zemin teşkil ettiğinde ısrar ediyor du. Son zamanlarda görsel nesne tanımada evrişimli sinir ağlarının -yani derin öğrenmenin- elde ettiği başarılar ve ImageNet yarışmalarında elde edilen göz kamaştırıcı sonuç lar onun bu savını boşa çıkarmış gibi görünebilir. Fakat bu başarılar aslında Peirce'ın savını destekliyor çünkü araştır ma camiası bu sistemlerin kırılganlığından dem vurmakta hiç gecikmedi, hakkını teslim etmek gerekiyor. Bu alanda çıkarımın temel sorunlarının yanı sıra güven, güvenilirlik ve kötüye kullanım olasılığına da değinen literatürde büyük bir artış var. Bilgisayar bilimci Melanie Mitchell'ın da belirttiği gibi, ödüllü derin öğrenme sistemlerini kandırmak bile gü lünç denecek kadar kolay.9 Örneğin 20 1 2 yılındaki yarışmada rakiplerini duman edip büyük ses getiren AlexNet sisteminin bile bir okul oto8 9
Charles Sanders Peirce. Charles Sanders Peirce Papers, Houghton Kütüphanesi, Harvard Üniversitesi, 692. elyazması. Melanie Mitchell, Artificial Intelligence: A Guide far Thinking Humans, New York: Farrar, Straus ve Giroux, 2 0 1 9 . 217
YAPAY ZEKA MiTi
büsünün, bir peygamberdevesinin, bir tapınağın ve bir şitsu cinsi köpeğin görüntülerinin aslında bir devekuşu görüntü sü olduğu sonucuna -hem de yüksek bir güvenle- varması sağlanabiliyor .10 Araştırmacılar buna 'bozguncu saldırılar' [adversarial attacks] adını veriyorlar. Saldırı, görüntülerde stratejik noktalarda bulunan birkaç piksel değiştirilerek ya pılıyor. Bu değişiklikler o kadar küçük ki insan gözü bunları fark etmiyor bile. Dolayısıyla değiştirilmiş görüntüler insan larda bir kuşku uyandırmıyor. Bozguncu saldırılar AlexNet'e de özgü değil. Görüntü ta nımada müthiş bir performans sergileyen derin öğrenme sis temleri aslında neyi algıladıklarını anlamıyorlar. Dolayısıyla bu yaklaşımın kırılganlığını ifşa etmek kolay oluyor. Yapılan bazı deneyler görüntülerin art alanına birkaç nesne yerleştir menin bile öğrenme sistemlerinin performansını gözle görü lür ölçüde düşürdüğünü ortaya koyuyor. İnsanlar tarafından kolayca görmezden gelinebilen bu eklenmiş nesneler derin öğrenme sistemleri için zorlu bir sorun teşkil ediyor. Başka deneylerde ise eski televizyonlardaki siyah-beyaz karıncalı ekran görüntüsüne benzer imgelerin (rastgele da ğılmış siyah ve beyaz piksellerin) derin öğrenme sistemle rini kandırdığı gözlenmiştir. Bu sistemler bu görüntüleri armadillo, çita veya kırkayak görüntüsü olarak sınıflan dırabiliyorlar. Modern yapay zeka sistemlerinin ilerleme kaydetmesiyle iyice belirgin hale gelen bu yetersizlikler as lında en basit ve önemsiz görsel algının bile ne denli engin bir bilgi ve bağlam derinliği gerektirdiğini bize gösteriyor. Başka bir deyişle, güzel bir bahar sabahı bir açelya görmek veya aslında herhangi bir şeyi görmek konusunda Peirce haklıydı: " Sırf gördüğümü bir tümcede betimlerken bile aslında bir sava varıyorum. İşin doğrusu, bilgimizin tüm kumaşı, keçe gibi ham hipotezlerin tümevarımla inceltil10
218
Melanie Mitchell, Artificial Intelligence: A Guide for Thinking Humans, New York: Farrar, Straus ve Giroux, 2 0 1 9 .
SAVAVARIMLI ÇIKARIM
mesiyle üretilmektedir. Boş boş bakmanın ötesine geçen her adımda, bir savavarımda bulunmadan bilgide en ufak bir ilerleme bile kaydedilemez. " 1 1 Demek k i zeka, kökeni itibarıyla kestirime ve sava varıma dayalıdır. Dolayısıyla olguları ve verileri ele al maya izin verecek güçlü bir kavramsal çerçeveye sahip olmak her şeyden daha önemlidir. Zeki bir fail -insan veya makine- kestirimde bulunduktan sonra tümdenge lim ve tümevarım gibi diğer çıkarım türlerini kullanarak kestirimin içermelerini ortaya koyabilir (tümdengelim) ve kestirimi deneyler ve gözlemler aracılığıyla sınayabi lir (tümevarım) . Farklı çıkarım mantıkları böylece aynı bulmacanın yerlerine oturan parçaları haline gelirler: "Tümdengelim bir şeyin zorunluluğunu tanıtlar. Tüme varım gerçekte olan biteni gösterir. Savavarım ise sadece bir şeyin olabileceğini telkin eder. " 1 2 işte bu olabilirlik -savavarım- gerçek dünyanın çevre şartları içinde düşün menin kıvılcımını çakan şeydir. Savavarımın iptal edilebilir yapısı onun avcılık ve de dektifliğin yanı sıra nasıl doğal dili anlamada da merkezi bir rol üstlendiğini açıklıyor. Nitekim günlük dilde söyle neni anlarken, anladığımız şeyi sürekli gözden geçirip gün celleme ihtiyacı duyarız. Şu örneği ele alalım: " Raymond koltuğun üzerinde bir yavru köpek gördü. Onu almak istedi. " ikinci tümcedeki adıl muhtemelen yavru köpeğe gönderiyor. (Dil bilimciler buna adıl artgönderimi veya geriye erişim adını veriyorlar . ) Bu iki tümcenin herhangi bir bağlamı yok, havada duruyorlar. Raymond hakkında da bilgimiz yok. Ama sağduyu bize insanların koltuktan ziyade yavru köpekleri istediklerini söylüyor. Yine de bu 11 12
Charles Sanders Peirce. Charles Sanders Peirce Papers, Houghton Kütüphanesi, Harvard Üniversitesi, 692. elyazması. Charles Sanders Peirce, Collected Papers of Charles Sanders Peirce, Charles Hartshorne ve Paul Weiss (ed. ) , 1-6. cilt, Cambridge, MA: Harvard University Press, 1 9 3 1 -5 , s. 5 . 1 7 1 . 2 19
YAPAY ZEKA MiTi
iki tümceden 'onu' adılının 'yavru köpek'e gönderdiği kesin bir sonuç olarak çıkmıyor. Nitekim bu örneği bir bağlama oturttuğumuzda çıkarım yanlış olur: " Raymond'ın koltuğu eskimişti. Koltuk almak için alışverişe çıktı. Doğru koltuğu gördüğünde mutlaka anlayacağını düşündü. Girdiği mobil yacıda çok güzel koltuklar vardı. Raymond koltuğun üze rinde bir yavru köpek gördü. Onu almak istedi. İşte aradığı koltuk buydu . " Tamam, b u örneğin biraz zorlama olduğunu kabul edi yorum ama hatalı değil. Raymond'ın aklı belki bir karış ha vada, belki de batıl inançları var ve koltuğun üzerinde yavru köpek görmeyi hayra yorup o koltuğun kendisine şans ge tireceğine inanıyor. Burada asıl mesele şu: ikinci tümcedeki 'o' adılını bir gösterge saydığımızda, bağlam değiştikçe fark lı adları gösterecektir. Mevcut yapay zeka stratejilerinin hiç biri bu tür örnekleri yeterince hesaba katmayı başaramadı. Araştırmacılar tümdengelime 'tekdüze çıkarım' [mono tonic inference] diyorlar çünkü sonuçları değişmiyor: Bir yapay zeka sistemi tümdengelimde bulunduğunda çıkardığı sonuç hemen sistemin bilgi dağarcığına ekleniyor çünkü bu sonuç zorunludur, değişemez. Oysa dili anlama tekdüze bir etkinlik değildir, sonuçları zorunlu olmayan, yani iptal edi lebilir bir çıkarıma ihtiyaç duyar. Peş peşe gelen tümcelerden edinilen yeni bilgiler, önceki yorumların değişmesine neden olabilir: " Raymond aradığı koltuğun bu olduğunu işte tam o anda anlamıştı. " Bir anlatının özünü kavrayabilmek için sonraki her tümcenin öncekilerin yorumlanışını nasıl etkile diğini de anlamak gerekiyor. Bu savavarımın iliklerine ka dar işlemiştir; ne de olsa savavarım kestirime dayalıdır ve kestirim de gözden geçirilmeye açıktır. Yapay zeka araştırmalarının klasik döneminde -web'in ortaya çıkışından önceki dönemde- araştırmacılar çıkarı mı iptal edilebilir hale getirmek için farklı yollardan ge nişletmeye çalıştılar. En yaygın yöntem tümdengelimi ge nişletinekti. 'Tekdüze olmayan çıkarım'la ilgili çalışmalar 220
SAVAVARIMLI ÇIKARIM
özellikle 1 9 8 0'ler ile 1 990'larda zirveye ulaştı ama ardın dan bu yaklaşım terk edildi. Bunun nedeni büyük oranda tümdengelimi dili anlamak için kullanılabilecek kadar es nek bir araca çevirmek üzere genişletmenin gerçek dünya da hiçbir işe yaramayan 'oyuncak' örnekler üzerinde işe yaramasıydı. Bu akıl yürütmenin klasik bir örneği şudur: " X bir kuşsa X uçabilir. X bir kuştur. O halde X uçabilir. Bekleyin ! Bu bir penguen. Penguenler -ne de olsa- uçamaz. O halde x uçamaz. " Bunun gibi akıl yürütmelere izin veren iptal edilebilir akıl yürütme sistemleri vardır ama bunlar genele uygulanamayacak kadar kullanışsızlar (yani bilgi sayarda hayata geçirilemezler) ve gazetelerin haber yazıla rının gündelik dilini yorumlamak için gerekli olan karma şık çıkarımları kotarabilecek kadar asla ölçeklenemediler. Tekdüze olmayan çıkarım sistemleri ancak laboratuvarlar daki zorlama senaryolarda işe yarıyor. Gerçi bu sistemler ölçeklenebilse bile tümdengelim so nucun doğruluğunu korumak zorunda olmak gibi bir kı sıtlamayla maluldür; yani her çıkarımın doğruluğu kesin olmak zorundadır. Tümevarımın temel sorunu budur. Elbette bu çıkarımları sonradan reddedebiliriz ama daha en baştan tümdengelimi kullanmaya çalışarak boşa vakit harcıyoruz. Yapay zeka alanında tümdengelimi iptal edilebilir so nuçları da içerecek kadar genişletmeye çalışmış araştır macıların çoğu, 1 9 8 0'lerde ve 1 9 90'larda bir yandan da savavarımı tümdengelim üzerine bina etmeye çalışan yak laşımlar üzerinde çalışıyorlar, bu hususta özellikle sava varımlı mantık programlama ( SMP) yaklaşımı üzerinde duruyorlardı. Teknik ayrıntılarını bir kenara bırakacak olursak, SMP yaklaşımı K gibi bir mantık kuramından ( bilgi tabanından) hareketle A � G koşullu önermesi nin, yani G gözleminin A açıklamasını mantıksal olarak gerektirdiğini (zorunlu olduğu) göstermeye çalışır. Bu da aslında savavarımın kestirimli doğasını bertaraf etmeye 221
YAPAY ZEKA MiTi
çalışmanın cafcaflı bir ifadesinden başka bir şey değildir. Bu bize çıkarımda bulunma gücü bahşetmiyor, dolayısıyla SMP çalışmalarının da tıpkı tekdüze olmayan akıl yürütme stratej ileri gibi neden durgunlaştığını ve büyük ölçüde terk edildiğini açıklıyor. (SMP'yle ilgili sorun genel olarak sağ duyuya dayalı çıkarımın temel sorununu da isabetli biçim de gözler önüne seriyor. Bu konuya bir sonraki bölümde geri döneceğiz. ) Peirce'ın makul bir hipotezin kestirilmesi olarak anladı ğı savavarım anlayışını korumak istersek çıkarım 'belasıyla' baş başa kalıyoruz. Özellikle bir akıl yürütme hatasıyla kar şı karşıya geliyoruz. Mantıkta buna 'safsata' deniyor. Şimdi bu konuya eğileceğiz.
Safsatalar va Hipotezler Peirce savavarımı 'bozuk' tümdengelim şeklinde simgeleşti riyordu. Bunu görmenin en kolay yolu, alelade bir tümden gelim örneği olarak modus ponens kuralını ele almaktır: A A
�
B (Bilgi) ( Gözlem) ( Sonuç)
B
Bu çıkarımın doğruluk tablosu aşağıdaki gibi olacaktır: A
B
Sonuç
D D
D
D
y
y
y
D
D
y
y
y
SAVAVARIMLI ÇI KARIM
Burada sorun ikinci satır: A doğru ve B yanlışsa A B'den yapılacak çıkarımın sonucu yanlış olacaktır. Diyelim ki A "Yağmur yağıyor. " önermesini, B ise " Yerler ıslak tır . " önermesini temsil etsin. Bu durumda, koşul önerme sine göre yağmur yağarsa yerler ıslanır ifadesi hep doğru olacaktır. Fakat A "Yağmur yağıyor. " önermesini, B ise " Yerler kurudur. " önermesini temsil ederse A - B (A ise B) içermesi yanlıştır. Doğruluk tablosunun ikinci satırı bize bunu söylüyor. Üçüncü satıra da bakalım: Yağmur yağmıyor ama yer ler ıslaksa, eh o zaman yerler ıslak demektir, yani kural hala doğruluğunu koruyor. Ama yağmur yağıyor ve yerler ıslak değilse kural hatalı olacaktır. Dolayısıyla bu kuralın uygulanmasıyla elde edilecek sonuç da yanlış olacaktır. Bu, standart mantıktır; A ve B değişkenleri burada bildirimlerin veya önermelerin yerini tuttuğu için buna 'önermeler man tığı' adı veriliyor. Önermeler mantığı çok uzun zaman önce geliştirildi ve bu mantığın eksiksiz olduğu tanıtlandı. Yani bu man tık dahilinde doğru olan her şey ( kuralları kullanılarak) tanıtlanabilir ve tanıtlanabilir her şey de doğrudur. Ö ner meler mantığı aynı zamanda iç tutarlığa da sahiptir çünkü bu mantık sistemi dahilinde bir çelişkiyi tanıtlayamazsı nız. Yani A önermesi doğruysa A-değil önermesi yanlış olmak zorundadır ve A önermesi tanıtlanmışsa A-değil önermesi tanıtlanamazdır. Önermeler mantığının basit leştirilmiş dünyasında hiçbir şey ters gidemez. Önermeler mantığı dahilinde ifade edilmiş tüm önermelerin doğrulu ğunu türetebilirsiniz ve asla saçma önermeler türetemez siniz. Sistem bunu güvence altına alır. Örneğin yağmurun hem yağdığına hem de yağmadığına inanamazsınız. Sis tem tutarlıdır. Şimdiyse önermeler mantığında veya genel olarak tüm dengelimde karşımıza çıkan şu safsataya bakalım:
223
YAPAY ZEKA MiTi
Sonculun Kabulü A -+ B B A Mantıkçılar bu argüman biçimine 'sonculun kabulü' adı nı veriyorlar çünkü burada B önermesi hem kuralın sonculu (A'ya ise öncül denir) hem de [kuralı sınamak üzere] gözlenen örnek, yani ikinci önerme olarak sunulmaktadır. Sonculu bir örnek vaka olarak kullandığımızda akıl yürütme hatası yap tığımız herhalde açıkça görülebiliyor olsa gerektir. Çünkü A önermesi yanlış da olabilir, onun her durumda doğru olduğu sonucuna varamayız. Oysa tümdengelim tam da bu türden bir kesinliği gerektirmektedir. Yani tümdengelim doğruluğu koruyan bir çıkarım türü olduğundan bu çıkarım geçersizdir, bir safsatadır. A ve B'yi gündelik dile ait tümcelerle (önerme ler) ikame edersek bunu daha kolay görebiliriz:
Yağmur yağarsa sokaklar ıslanır. Sokaklar ıslak. O halde yağmur yağıyor. Bu argüman geçersizdir çünkü öncüllerini doğru kabul et tiğimizde bile sonucunun doğru olması şart değildir: Sokaklar başka bir nedenle de ıslak olabilir (örneğin bir yangın muslu ğu patlamış olabilir). Sonculun kabulü tümdengelim kötü de mektir; çünkü bu bir tahmin. Savavarımın mantıksal biçimini kötü tümdengelim çeşitlemesi olarak görülmesi, tarih boyunca akıl yürütmeyle ilgili çalışmalarda neden göz ardı edildiğini ve yapay zeka araştırmalarında başvurulan mekanik yöntemlere direnç gösterdiğini de açıklamaya yardımcı oluyor. O halde soruyu şöyle soralım: Kötü kuralları nasıl işe katarız? Gerçekten de Peirce'ın çıkarım türleri arasında yaptığı ayrım tam da yukarıda değindiğimi nedenden ötürü sava varımın tümdengelime indirgenemeyeceğini apaçık biçimde ortaya koyuyor. Peirce tasımları günlük dilden tümceler kullanarak kuruyordu: 2 24
SAVAVARIMU ÇIKARIM
TüMDENGELIM
Bu torbadaki tüm toplar beyazdır. Bu toplar bu torbadandır. O halde bu toplar beyazdır. TüMEVARIM
Bu toplar bu torbadandır. Bu toplar beyazdır. O halde bu torbadaki tüm toplar beyazdır. SAVAVARIM
Bu torbadaki tüm toplar beyazdır. Bu toplar beyazdır. O halde bu toplar bu torbadandır. Bunları önermeler mantığına çevirdiğimizde aşağıdaki ifadeleri elde ediyoruz: TÜMDENGELIM
A ---+ B A B TÜMEVARIM
A B
SAVAVARIM
A ---+ B B A
·
YAPAY ZEKA M iTi
Başka bir deyişle sava varım doğası gereği tümdengelimin kapsamı genişletilmiş bir biçimi olamaz çünkü mantıksal bi çimi (özü) itibarıyla bir tümdengelim hatasıdır. Tümdenge limli çıkarımın doğruluğu koruyan yapısını ihlal eder, bu da Peirce'ın savavarımın bir kestirim veya tahminle başladığı şeklindeki savı düşünülürse akla uygundur. İşin aslı şu ki burada ele aldığımız üç çıkarım türü birbi rinden tamamen ayrıdır. Birini diğerine çevirmek mümkün değildir. Bu da eğer zeki çıkarımlar savavarımı gerektiri yorsa o noktaya tümdengelim veya tümevarım aracılığıyla ulaşamayacağımız anlamına geliyor. Bu nokta yapay zeka çalışmaları açısından büyük bir önem taşıyor. Çünkü eğer tümdengelim ve tümevarım bu konuda yetersiz kalıyorsa elimizde bir savavarım kuramının olması gerekiyor. Oysa elimizde -henüz- böyle bir kuram yok; dolayısıyla yapay genel zekaya giden yolda olmadığımız sonucuna şimdiden varabiliriz. 13 Önceki sayfalarda da ifade ettiğim gibi, sıklık varsayımı ile empirik kısıtlama el ele verip tümevarımı bizi yapay genel zekaya ulaştırabilecek eksiksiz bir stratej i olmaktan alıko yuyor. Örneğin verilerin tekrarlanma sıklığına bel bağlarsak elimizde Russell'ın hindisinden başka bir şey kalmıyor: Bu hindinin sahibine duyduğu güven, yani sahibinin ona zarar ı.ı
226
Savavarımla ilgili çalışmalar, 201 0'larda kısmen yeniden canlandı, bu çalış malar arasında savavarımı olasılıkçı bir kalıba veya Bayesçi çıkarım kalıbına sokma çabaları başı çekiyordu. Sırf günlük (ve bilimsel ) düşüncede bir olayı veya gözlemi açıklayan bir tahmin veya hipotez olarak doğru biçimde değer lendirildiğinde savavarımın gerçek gizemini daha da takdir etmemize yardımcı oldukları için bile bu yaklaşımlar hem uzmanlar hem de uzman olmayanlar tarafından incelemeye değerdir. Bayesci sistemler, ayrım yapmadan basitleş tirici birtakım varsayımlarda bulunurlar. Bu varsayımlar bir yandan bilinen olası hipotezlerin yalnızca küçük bir altkümesini (bazen sadece ikisini) ele alır, diğer yandan ilgili örneğe veya olguya dair yüksek olasılığa sahip çıkarımları arar. Bu sistemler olasılıkçı akıl yürütmenin kapsamını genişletip olasılıkları keşfetse de yine savavarım bunların sadece adında geçiyor. Bu konudaki araş tırma bulgularına dair iyi bir özet için, Austin'deki Texas Üniversitesi'nden Ray Mooney'nin çalışmalarına bakınız: http://www . cs.utexas.edu/-ml/publi cations/area/65/abduction.
SAVAVARIMLI ÇIKARIM
vermeyeceğine, gözü gibi bakacağına yönelik inancı, her gözlemiyle biraz daha pekişiyordu. Hatta hindinin inancı nın örnekler tarafından en fazla pekiştirildiği an da Noel arifesiydi, yani kellesini kaybettiği günün bir gün öncesiydi çünkü tümevarım açısından inancının en fazla sayıda geçmiş örnekle desteklendiği gün o gündü. Empirik kısıtlama ise hindiye sunabileceğimiz bilgi veya kurama çok katı sınırlar dayatıyor. Ona " Çiftçi sana nasıl muamele ediyor, sen ona bak" dersek kellesini kaybettiği ana dek huzuru hep arta caktır. Gelgelelim " Çiftçi bıçağını boğazıma dayadı" göz lemi hindimizin o ana (t = Noel günü) kadarki verilerinin arasında bulunmadığı için ona salt tümevarım aracılığıyla bir kuram veya model olarak sunulamaz. Makine öğreniminde bu, bir sisteme sunabileceğimiz tek bilginin, veri yığınından sözdizimi kurallarına göre edinile bilecek bilgi olduğu anlamına geliyor. DeepMind'ın Atari sistemi örneğinde gördüğümüz üzere, bu bir meziyet ola rak görülse de Russell'ın hindisiyle aynı kör noktaya sahip: Veride gözleyemediği şeyi bilmiyor. Bu da görüntü tanıma alanında karşımıza çıkan başarısızlıklarda bir örneğini gör düğümüz hatalı tahminlere yol açıyor, hatta sadece birkaç pikselde yapılan basit değişikliklerin bile oyunlarda ve diğer görevlerde büyük performans düşüşüne yol açtığı modern sistemlerin tuhaf kırılganlığını da açıklıyor. Saf veri güdümlü tümevarım sistemlerine daha fazla veri sağlayarak bu sistemlerin eksikliklerini gidermek bir nokta ya kadar mümkün. Fakat istisnalar, olağandışı gözlemler, kısacası her türlü sürpriz, gerçek dünyanın ayrılmaz bir par çasıdır. Sürücüsüz araçlarda yapıldığı gibi, gözetimli öğren me sistemlerini öngörülebilir bazı istisnai durumlara maruz bırakmak demek, Sisiforvari bir işe kalkışmak demektir çün kü istisnai durumları tamamen öngörmek istisnanın doğası gereği olanaksızdır. Bizim yeni ve özü itibarıyla savavarımlı bir yaklaşıma ihtiyacımız var. Böyle bir yaklaşım geliştirilin ceye kadar sadece gözlenebilen düzenliliklerle, yani dağılım 2 27
YAPAY ZEKA MiTi
eğrisinin otomasyona elverişli durumları barındıran 'şişkin tepesiyle' iş görmeye mahkumuz. Judea Pearl de önceki sayfalarda andığımız 'nedensellik merdiveni' eğretilemesiyle işte bu noktayı vurguluyordu. Pe arl, makine öğrenimini ve istatistiği 'verileri bir eğriye oturt ma işi' olarak tanımlıyor (teknik olarak doğru bir tanım) ve bu iş nedensellik merdiveninin ilk basamağı olan ilişki lendirme adımında yer alıyor. Bu ilk basamakta örneğin " Bir anket bana seçim sonuçları hakkında ne söyleyebilir ? " gibi korelasyon soruları sorabiliyoruz. Ayrıca AlphaGo gibi oyun oynayan modern öğrenme sistemlerini tasarlamak için oyundaki hamleler ile kazanılan oyunlar arasındaki korelas yonları kullanabiliyoruz. Fakat veriler arasında ilişki kur mak bize dünyanın nedensel yapısına ilişkin bilgi vermiyor, dolayısıyla neden veya nasıl sorularını bırakın yanıtlamayı, formülleştiremiyoruz bile. Nedenlerin bilgisi bizim dünyaya ilişkin sağduyuya dayalı anlayışımızın bir parçasını oluştu ruyor. Bu durum, örneğin verileri niçin geçmiş nedenlerin anlayışımıza katkıda bulunan sonuçları veya ipuçları olarak görebileceğimizi de açıklıyor. Önemli bir nokta da şu: Pearl'ün merdiveninin en üst basamağında karşıolguların, yani olmamış olayların düşü nülmesi bulunuyor: Bu basamakta "Şöyle ve şöyle olsaydı ne olurdu ? " tarzında sorular soruyoruz ve bu soruların ya nıtları hiçbir veri kümesi içinde bulunmuyor. ( Çünkü bunlar olmamış olaylar; tanımları gereği, var olmayan şeyler . ) Baş ka bir deyişle, dünyalar hayal ediyoruz. Olmamış olayları düşünebilmek insan zekasının ayrılmaz bir parçası ve veriler bizim "]. F. Kennedy'nin katili Oswald doğmamış olsaydı Kennedy bugün yaşıyor olur muydu ? " veya " Çiftçiye bir hindi hediye edilseydi tümevarımcı hindimiz kesilmekten kurtulur muydu ? " yahut " Yoldan çıkan bir belediye otobü sü yangın musluğuna çarpıp onu yerinden sökmemiş olsaydı yerler hala ıslak olur muydu ? " gibi soruları yanıtlamamıza yardımcı olmuyor. Hayalgücü bir veri kümesinden hareket 228
SAVAVARIMLI ÇIKARIM
etmeyen çıkarımlarda bulunmamıza izin veriyor ve kestirimi gerektiriyor. Dolayısıyla savavarım, her türlü zekanın mer kezinde bulunan çıkarım türüdür. Araştırmacılar yapay zekanın yamalı bohça misali tarihi nin büyük bölümünde karşılaşılan temel güçlüğün dünyaya dair sağduyu bilgisini edinmek ve kullanmak olageldiği ni son zamanlarda unutmuşa benziyorlar. Sağduyu gerçek dünya hakkında zengin bir anlayışı gerektiriyor ve bu an layışı kabaca iki kısma ayırmak mümkün: Birincisi, yapay zeka sistemlerinin gündelik bilgi toplamaları (hem de bolca) gerekiyor. ikincisi, bu bilgiyi kullanmalarına izin verecek bir çeşit çıkarım yeteneğine sahip olmaları da gerekiyor. Toronto Üniversitesi'nden yapay zeka bilimci Hector Levesque, 20 1 8 yılında yayımlanmış Common Sense, the Turing Test, and the Quest for Real AI [Sağduyu, Turing Testi ve Gerçek Yapay Zeka Arayışı) başlıklı kitabında bize zengin bir bilgi kuramımız olmadığı müddetçe yapay genel zekaya -'gerçek' yapay zekaya- ulaşma girişimleri mizin başarısızlığa mahkum olduğunu gösteren ikna edici bir argüman sunuyor. 1 4 Levesque'in sağduyu bilgisinin şart olduğunu gösteren çözümlemesi bu bakımdan hedefi on iki den vursa da, görünüşe göre Levesque de bu alanda ihtiyaç duyduğumuz çıkarım türünü tümdengelimli akıl yürütme nin henüz bilinmeyen bir uzantısı olarak gören geleneksel yaklaşımın tuzağına düşüyor. Levesque, büyük ölçüde, yapay zeka çalışmalarında bir zamanların gözde alanını yeniden diriltmeye çalışıyor: 'Bilgi temsili ve akıl yürütme' ( BT &AY) denen bu alan, doğrudan doğruya zeki sistemlerde bilgi ve çıkarım sorunlarını çözme yi hedefliyordu. BT &A Y'nin akıl yürütme kısmı, çıkarıma dair mülahazaları barındırıyordu. Hatta yukarıda ele aldığı mız sorunlar az çok bu alanda keşfedilmiş ama ne yazık ki 1•
Hector Levesque, Common Sense, the Turing Test, and the Quest for Real AI, Cambridge, MA: MiT Press, 2017. 2 29
YAPAY ZEKA MiTi
çözümsüz kalmıştır. Levesque, 20 1 3 'te kaleme aldığı " On Our Best Behavior" [En iyi Davranışımız Üzerine] başlıklı ilk makalelerinden birinde tümdengelimli çıkarımı genişlet me girişimlerinin başarısız olma sebebinin bunların inatçı [intractable] sorunlar olması olduğunun altını çiziyordu. Buradaki 'inatçı' nitelemesi bir bilgisayar bilimi terimidir ve bilgisayarların gerçek zamanlı olarak hesaplamayı başara madıkları çözümleri ifade ediyor. "En temel, hatta çocuk ların bildikleri seviyede bilgiler bile geniş bir yelpazede yer alan mantıksal unsurları devreye sokuyor: neden, sonuç ve sonuçsuzluk, karşıolgular, tümel niceleyiciler, belirsizlik, başka faillerin inançları, arzuları, yönelimler vs. Böyle ol masına rağmen, bunları kullanarak simgesel akıl yürütmek bilgisayarlar için fazla ağır bir görev gibi görünüyor. " 15 Sorunların inatçılığı, yaklaşımın kendisinin hatalı oldu ğunun ipuçlarından biridir. Daha sağlam bir başka ipucuysa tümdengelimin mantığının savavarım mantığına indirgene meyişidir. işte bu indirgenemezlik, sorunun bilgisayarların gücüyle ilgili olmadığını, temel kabullerle ilgili olduğunu akla getiriyor. BT&AY'nin her iki veçhesi -yani hem bilgi temsili hem de akıl yürütme- de bugün gereklidir. Özellikle de sağduyu bilgisinin bir makinede temsil edilebilmesinin en hafif deyiş le 'güç' bir iş olduğu ortaya çıkmıştır. On yıllardır uğraşıl masına rağmen, hiç kimse makinelere gerçek dünya senar yolarında güç kazandıracak yeterli temel bilgiyi sağlamayı başaramadı. Örneğin makinelere sıradan dili anlamayı veya bir evin etrafında yahut kalabalık sokakta yolunu bulmayı bir türlü öğretemedik. 16 Bilgi ile akıl yürütmenin birbirine 15 16
Hector Levesque, "On Our Best Behavior" , Artificial Intelligence, 2 1 2 . cilt, 1 . sayı (20 1 4 ) : s . 27-35. Olguları ve bilgiyi çekip çıkarmak üzere web'i tarayan büyük ölçekli projeler de hayal kırıklığı yarattılar. Tom Mitchell'ın NELL (Never-Ending Language Learner [Ebedi Dil Öğrenici] ) adlı anlambilimsel makine öğrenimi sistemine dair tartışmalar için, bkz. Marcus ve Davis, Rebooting AI, s. 1 5 0- 1 5 1 .
SAVAVARIMLI ÇIKARIM
bağlı olduğu aşikardır çünkü bilmediğimizi çıkarsayamıyo ruz ve amacına uygun bir çıkarımda bulunma kabiliyetimiz olmadıkça o bilgileri kullanamıyoruz. İşte ben bu sorunlar dan ilkine 'dipsiz bilgi kovası', ikincisineyse 'sihirli çıkarım motoru' adlarını vereceğim. Bu alandaki temel engelleri bize gösterenin de yine Sava varımlı Mantık Programlama konusunda eskiden yürütülmüş çalışmalar olması ironiktir. B'nin, Z gibi bir yapay zeka siste minin bilgi tabanı olduğunu varsayalım. Z sistemi -şaşırtıcı bir G gözleminde bulunmuş olsun ve bu gözlemin açıklama sı (veya nedeni) olan A, B bilgi tabanında mevcut ve B bilgi tabanı da A - G önermesini gerektiriyor diyelim. Burada mantıksal gerektirmenin [ entailment] içermeden (-) daha sıkı bir çıkarım türünü dile getirdiğinin altını çizmek lazım. (Mantıksal gerektirmenin içermeden daha sıkı olmasının ne deni, teknik açıdan B bilgi tabanındaki her önermenin A - G önermesini doğrulaması ve aynı durumun aksi yönde de ge çerli olmasıdır. ) Dolayısıyla B burada Z sisteminin gözünden 'her şeyin kuramı' olarak görünecektir. Bu noktada iki soru sormamız gerekiyor: 1 ) Tüm gerekli bilgileri B'ye nasıl sığdı rabiliriz? 2) Yukarıda gördüğümüz üzere, A - G sadece bir içermeyse, bu önermenin doğruluğu, bu örnekte G gözlemi için A gibi makul ( sınanabilir) bir kestirimde bulunmamıza izin veren savavarımlı bir çıkarımı nasıl teşkil ediyor olabilir ? Başka bir deyişle, bir K kuramına nasıl ulaşırız ve bu kura mı savavarımlı çıkarımda nasıl kullanırız? Tüm bu sorunları açıklamak için şart olan tek şey ıslak kaldırımlardır. ABD Savunma Bakanlığı, vaktiyle, ileri teknoloji araştır maları birimi olan ileri Savunma Araştırma Projeleri Kurumu (DARP A) aracılığıyla dev bir sağduyu bilgileri tabanı oluştu rulması için çok büyük miktarda para harcamıştı. Mantık ve bilişim alanlarında eğitim görmüş uzmanlar (tamam, itiraf ediyorum, onlardan biri de bendim) bilgisayar sistemlerini "Yaşayan her insanın başı vardır. " " Fıskiyeler su fışkırtır. " ve "Su ıslatır. " gibi önermelerle kaşık kaşık beslediler. Bunun gibi
YAPAY ZEKA M iTi
bir yığın sağduyu bilgisiyle donanmış yapay zeka sistemlerinin bu bilgilerden hareketle dünyaya ilişkin isabetli çıkarımlarda bulunabildiği görülüyordu. Bu tür sistemlerin savavarımlı çı karıma ihtiyaç duymayacakları umuluyordu çünkü tıka basa bilgiyle beslenmiş sistemlerin daha yalın ve iyi anlaşılan çıka rım türleriyle yetinebileceği düşünülüyordu. Başka bir deyişle "Fıskiyeler açıldığında etrafı ıslatır . " önermesi yağmura iliş kin benzer ifadeler kadar doğru olduğu için, yapay zeka siste minin çıkarım motoru gayet iyi bilinen bir çıkarım türü olan tümdengelime pekala bağlı kalabilirdi. Sensörler (veya metin girdileri) yapay zeka sistemlerine suların yükseldiği bilgisini verebilir, böylece sistem bu verilerden hareketle sokakların su lar altında kalacağı sonucunu çıkarabilirdi. Fakat çok geçmeden bu yaklaşımın çetin bazı sorunlarla malul olduğu ortaya çıktı. llk sorun aslında ayan beyan or tadaydı veya en azından öyle olması gerekirdi: Bizim bildik lerimizin çoğu örtük bilgilerdir. Yani biz ancak şartlar ge rektirdiğinde, afalladığımızda veya bir şeyin üzerinde durup düşünmek zorunda kaldığımızda bilgileri bilincimize taşıyıp belirgin hale getiriyoruz. Bu da bizi ikinci soruna, 'buz dağının tepesi' meselesine getiriyor. Örtük bilgilerimiz şu veya bu çıkarım için şart ol masına şarttır ama daha da önemlisi, bu bilgilerin toplamı muazzam boyutlara ulaşmaktadır. Sıradan bir insanın bile bilgi dağarcığı öylesine engindir ki bu muazzam bilgi yığı nını bir bilgisayara yüklemek ve bilgisayarda temsil etmek, altından kalkılması neredeyse imkansız bir görev olacaktır. Sağduyu bilgilerini bir bilgisayara kaşıkla yedirmenin ömürlük bir felsefi tasarı olduğu ortaya çıktı. Makinenin sağduyu bilgilerini bizzat açığa çıkarması gerekiyordu. Ör neğin dibinde delik, duvarlarında çatlak olmayan bir bar dağa sıvı dökülünce bardağın dolacağını veya her insanın başının olduğunu ya da karayolunun iki nokta arasında araçların üzerinde ilerleyebileceği katı bir yüzey olduğunu bilebilmeliydi. Araştırmacılar bilgisayarların eninde sonun-
SAVAVARI MLI ÇIKARIM
da bunları 'anlayacağını' umuyorlardı ama bunun sonu gel mez bir tasarı olduğunu idrak ettiler. Altı üstü ıslaklık gibi basit ve sıkıcı bir konuda sorulan soruları zekice yanıtlamak üzere inşa edilen bir yapay zeka sistemi düşünün: Böyle bir sistem sırf bu iş için bile devasa bir bilgi tabanına ihtiyaç duyacaktır. Nitekim bu konu başlığı al� tında kendi başına söyleşebilecek düzeyde gerçekçi bir yapay zeka sisteminin su taşıyan (yakıt değil su; gerçi yakıt da yerleri ıslatır) yangın söndürme uçakları veya büyük boy oyuncak su tabancaları gibi nice eşyanın kavramına ihtiyacı olacaktır. Şimdi, böyle bir sisteme şunun gibi basit bir Turing Testi so rusunu girdiğinizi bir düşünün: " Sıcak bir gündü, gökyüzün de tek bir bulut yoktu. Patlamış bir yangın musluğunu tamir etmesi -için hemen itfaiye çağrıldı. Ana cadde sular altınday dı, her yer ıslaktı. Sokaklarda akan suyun taşıdığı döküntü ler olukları tıkamıştı. Sokaklar neden ıslaktı?" Yapay zeka sisteminin başvurduğu bilgi tabanı eğer itfaiye veya yangın musluğu hakkında bilgi barındırmıyorsa o sistem bu soruya yanıt veremez. Bu kesmediyse bir de şöyle devam ettiğinizi düşünün: "Ama sokakların ıslak olmasının nedeni bu değildi. Patlak yangın musluğu kaldırımdaki bir şarküterinin vitrin camına su püskürtüyordu. İtfaiyenin gelişinden kısa süre önce o bölgeyi bir de boran vurmuştu. Her şey sırılsıklam olmuş, her yer ıslanmıştı ! " Bilgi ta hanındaki tüm o kavramların buna ne faydası olacak? Tümdengelimin ne faydası olacak ?
Dipsiz Kova Olarak Bilişim Bilgisi işte 'dipsiz kova' sorunu tam olarak budur. Bir bilişim bil gi tabanını -bir mantık dahilinde kullanılacak- önermeler haline getirilmiş ifadelerle tıka basa doldurmak sonu gelmez bir görevdir. Nitekim şehrin bir sokağında veya mahallesin de olan biten hakkında akıl yürütmek gibi en basit sağduyu sorunlarını bile konuyla tamamen ilgisiz görünen devasa 23 3
YAPAY ZEKA M iTi
boyutlarda bilgiyi verimli bir şekilde bilgisayar diline akta ramazsak çözemiyoruz. Üstüne üstlük bir de temsil sorunu var. Islak sokaklar veya Kate'in kafede olmayışı yahut yarısı yenmiş ton balığı konserveleri ya da başka herhangi bir konu hakkında ko nuşmaya izin verecek bilgi kırıntılarının çıkarımlarda kulla nılabilmesi için ilişkisel veritabanları gibi bilgi tabanlarının bu çıkarımlarda kullanılabilecek şekilde düzenlenip yapılan dırılması şarttır. Eğer bir yapay zeka sistemine, ton balığının kaşıkla mı yendiğini sorduğumuzda sistem bize yanıt olarak Mars'ın geceleyin gökyüzündeki konumunu hesaplayıp söy lerse bu hiç hoş olmaz. Bu, ilgi kurma sorunudur. Bu soru nun, bilginin ulaşılır ve kullanıma hazır hale geleceği şekilde temsil edilmesine izin verecek kurnaz stratejilerle bertaraf edilmesi gerekir. Araştırmacılar bu doğrultuda, ilgi kurma sorununu, birbiriyle bağlantılı bilgileri gruplandırmak sure tiyle modus ponens gibi çıkarım kurallarının en başından itibaren gerekli bilgilere kolayca erişmesini sağlayarak [işi makineye bırakmadan] 'önceden çözmeye' çalışmaktadırlar. Bilgi tabanları genellikle kaplam ilişkilerine göre hiyerar şik olarak sınıflandırılan -yani bir şeyin başka bir şeyin bir örneği olduğunu bildiren [is -a ]- bilgilerden oluşturulurlar. Örneğin "Dizüstü bilgisayar bir kişisel bilgisayardır. Kişisel bilgisayar bir bilgisayardır. Bilgisayar bir dijital teknolojidir. " Bu hiyerarşik zinciri daha da uzatmak mümkündür. Büyük bilgi tabanlarında hiyerarşiler, dünyada sıkça karşımıza çı kan şeyler hakkındaki ansiklopedik konu başlığı kümeleri nin omurgasını teşkil eder. Tüm bu kaplam bağlantılarının yanı sıra örneğin kavramlar arasındaki parça-bütün ilişkileri (meronimi) gibi başka önemli yüklemeler de (yani kavramlar arasında kurulan bağlantılar) bu bilgi tabanlarına dahil edi lebilmektedir. 17 Hiyerarşik bağlantıları ifade etmeye elverişli, 17
23 4
John Haugeland, çıkarımda kullanılacak bilgiyi düzenleyip örgütleme sorunu na ta 1 979 yılında işaret etmişti: " 'Maymun' kavramı, bu kaplama giren can lıların yalnızca belli bir tür primat olduklarını [taksonomik bilgiyi] değil, aynı
SAVAVARIMU ÇIKARIM
basitleştirilmiş sözlükler kullanarak bilgi tabanı geliştirmeyi kolaylaştıran bilgi temsil dilleri, yapay zeka araştırmalarının ilk günlerinden beri epey ilerleme kaydetmiştir. Örneğin 1 990'larda web teknolojileri üzerinde çalışan gruplar, 'üçlülerin' ( özne-nesne-yüklem ifadelerinin) ya zılmasına izin veren kaynak tanımlama çerçevesini (KTÇ) geliştirdiler. Bu çerçeveye göre kaplam [is-a] veya parça-bü tün [part-of] yahut bilgi tabanı oluşturmak için kullanışlı addedilen başka herhangi bir ilişki de kullanılabilmektedir. Yapay zeka araştırmacısı merhum John Haugeland'ın da vaktiyle vurguladığı üzere, KTÇ esasında, büyük projelerde barındırdıkları üçlü sayıları binleri bulabilen bilgi tabanla rının, bilişim ansiklopedilerine dönüşmesine izin verdi. Böy lece yapay zeka araştırmacıları, kullanılması çok kolay olan bu çerçevenin uzman olmayanları bile üçlüler üretmeye teş vik edeceğini umdular. Bu düşü dile getiren, HTML'nin ya ratıcısı Tim Berners-Lee'ydi. Berners-Lee buna anlamsal ağ [semantic .web] adını veriyordu çünkü ona göre web sayfala rı makinelerin okuyabileceği KTÇ üçlülerine dönüştürüldü ğünde bilgisayarlar neyin ne anlama geldiğini bileceklerdi; web, bilgisayarlarca zekice okunabilir hale gelecekti. Yapay zeka araştırmacıları, bilgi tabanlarının, sadece istatistiği kullanan kırılgan sistemlerin sonunu getireceğini müjdeli yorlardı; ne de olsa istatistik anlamaya yetmiyordu. Yapay zeka sistemleri anlamsal ağ ve diğer bilgi tabanı temelli ta sarılar aracılığıyla nihayet hesap makinesi olmanın ötesine geçip dünyayı 'bileceklerdi. ' Bu düşün gerçeğe dönüşmesi için dudak uçuklatan miktarlarda para ve çaba harcanma sına rağmen ne yazık ki hayaller asla gerçeğe dönüşemedi. zamanda nereden geldikleri, ne yedikleri, laternacıların onları nasıl kullandık ları ve hayvanat bahçesindeki büyük maymunun ziyaretçilere neler attığı gibi çok sayıda 'ikincil' bilgiyi de içermelidir." Haugeland, ansiklopedik bilgilerin birbiriyle ilgisi kurulmadan maymun kavramı hakkında 'tipik' bilgilerin nasıl kullanılabileceğini soruyordu. Bugün de temel soru budur. Bkz. John Hauge land, "Understanding Natura! Language " , The ]ournal of Philosophy, 76. cilt, 1 1 . sayı ( 1 979), s. 623. 23 5
YAPAY ZEKA M iTi
Dipsiz kova sorunu çözülemedi çünkü bu kovanın bir dibi ve gerektirdiği çabanın bir sonu hala yok. Bununla birlikte, bilgiler genellikle yapay zeka sistemle rince süratle erişilebilecekleri şekilde konu başlıklarına göre tasnif edilip düzenlendikleri için (sokakların neden ıslak ol duğu sorusunu yanıtlamak bir yapay zeka sisteminin bütün gününü almamalıdır), mühendisler karşılarına çıkabilecek tüm durumlara hazırlıklı olmak adına, 'kıyıda köşede kal mış' her türlü bilgiyi bu konu başlıklarının altına yığmaya başladılar. Bir sistemin ıslak sokaklarla ilgili en temel so rulara bile yanıt verebilmesi için -yukarıda verdiğimiz ör nekten gidecek olursak- itfaiyeciler, yangın muslukları, su tabancaları, yangın söndürme uçakları, yağmur, kar, sel gibi sayısız nesnenin bir şekilde birbirine bağlanması, birbiriyle ilgisinin kurulması gerekiyor. Temel hedefi ve çıkış nokta sı bilgiyi doğasına uygun şekilde konulara göre tasnif edip sınıflandırmak olan bu strateji, bu şekilde aslında temel he definden saptığı için kısa sürede anlamsızlaşıyor. Nitekim yangın muslukları ve sokaklar yaygın mahalle tanımının birer parçası olabilir ama yangın söndürme uçakları veya su tabancaları gibi nesneler büyük ihtimalle bu tanımın bir parçası değildir. Başka bir deyişle, bilgiyi yapay zeka sistem lerinin gerçek zamanlı akıl yürütme süreçlerinde kullanıma hazır hale getirmek için örgütleyip düzenleme girişiminin ta kendisi kaçınılmaz olarak şu ya da bu senaryoda başvuru labilecek belirli bilgi unsurlarını dışarıda bırakıyor. İşte bu noktada zeka için bir bilgi tabanı oluşturmanın belli bir tari fi yok gibi görünüyor, varsa da bu bilgi tabanı bizim bildiği miz, önceden düşünüp tasarlayabildiğimiz yahut KTÇ veya başka bir mantıksal dille doldurabileceğimiz bir şey değil. Dipsiz kova sorununun çözümsüz olduğunu gösteren ni hai kanıt ne yazık ki tüm bu projeler hayata geçirilip bir noktaya kadar ilerleme kaydettikten sonra ortaya çıktı. O arada araştırmacılar kendilerini engin bilgi tabanları geliş tirme tasarısına çoktan vakfetmiş ve binlerce iş saati, yapay
SAVAVARIMU ÇIKARIM
zekanın sağduyu sorunuyla başa çıkabilecek, makineler ta rafından işlenmeye uygun ansiklopedilerin doldurulmasına harcanmıştı. Bu bilgi tabanlarına ne kadar fazla 'bilgi' ekle nirse sistemlerin her şeyi yanlış anlama ihtimali de o kadar artıyordu. Sırf yağmuru ve ıslaklığı bilen bir sistem basit bir soruyu doğru anlayabilir ama işin içine düzinelerce farklı olası senaryonun bilgisi girince genel anlamda sistemlerin eldeki soruyla uyumlu olmayan bilgileri ve bağlantıları seçme, dolayısıyla anlayamama olasılığı da artıyordu. "Sel olup akan sular birkaç parkı su basmasına neden olduğu için itfaiyeye haber verildi. " tümcesi aslında sele neden olan yağmur hakkındadır. Fakat burada itfaiyeye yapılan atıf, yangın musluklarının patlayıp yerleri ıslatabileceğini 'bilen' bir sistemi afallatabilir. Dolayısıyla, ne denli bilgiye sahip se kullanışlı çıkarımda bulunma gücü o denli artan insan zihninin aksine, büyük bilgi tabanlarına bel bağlayan yapay zeka sistemlerinin dağarcığında ne kadar ek 'bilgi' bulunur sa saçma çıkarımlar yapma riski de o kadar artıyor. Belli ki sağduyuyu teşkil eden ifadeleri, olguları ve kuralları bilmek yeterli değil; sağduyu çıkarımlarının nasıl işlediğini bilmek de aynı ölçüde gerekli ve önemli. Geriye dönüp baktığımızda yapay zeka sistemlerine 'sağ duyu bilgisi' kazandırmayı hedefleyen ilk çabaların aslında bir değil iki proje olduğunu görüyoruz. Bilginin şart olduğu aşikar ama çıkarım da öyle. Yani bildiklerimiz bu meselenin sadece bir yanını oluşturuyor. Bildiklerimizi, inançlarımızı güncellemek için nasıl kullandığımızsa bu meselenin diğer yanı. Gelgelelim, bilişimde kullanılabilen çıkarım stratejileri sınırlı: Peirce'ın de altını çizdiği üzere, elimizde sadece üç çı karım stratej isi var ve bugüne kadar bunlardan sadece ikisi bilişim yöntemlerine indirgenebildi. Saf tümdengelimin ilgi kurma sorunları barındırdığı gün yüzüne çıktığında araştır macılar sorunu aşmak için farklı ad hoc şemalar kullanmayı denediler. Örneğin 1 970'lerde Yale Üniversitesi'nden Roger Schank, 23 7
YAPAY ZEKA M iTi
sağduyuya uygulamak üzere 'betik' yaklaşımını geliştirmişti. 1 8 Schank, sırad.an düşünce ve eylemlerin örtük bir betiğe, yani bir senaryoya uyduğunu ileri sürüyordu. Başka bir deyişle, biz bir olay örgüsünü takip ediyorduk. Lokantada yemek siparişi verme eylemi bunun bariz bir örneğidir: Lokantaya gireriz, çalışanlar bizi bir masaya oturtur (veya biz geçer otu ruruz), menüye bakarız, siparişi alacak çalışanla kısaca se lamlaştıktan sonra siparişimizi veririz. Bu eylemlerin tamamı belirli bir sırayla gerçekleşir ve bir yere kadar beklentilere da yalı ve planlıdır. Schank, gerçek dünyaya ait bazı etkinliklerin bu şekilde betikler halinde kodlanabileceğini varsayıyordu ve bu doğrultuda yemek siparişi almak gibi görevlerde insanlar la etkileşime girecek, programlanmış betikler kullanan bazı sistemler geliştirmişti. Oysa biz gerçek dünyada sık sık yazılı senaryoların dışına çıkarız. Yemek siparişi vermek, rezervas yon yaptırmak için de sağduyu gerekir. Örneğin sipariş ver mek için fazla bekletilmek gibi beklenmedik durumlar ortaya çıkabilir. Belki de lokantanın girişinde, müşterilere yan kapıyı kullanmalarını söyleyen bir tabela vardır. Schank'ın betiklerle ilgili çalışması yapay zekanın sağ duyu sorununu çözmek için başvurulan ciddi bir yaklaşım olmaktan zamanla çıktıysa da bize bilgi ile çıkarımın ayrı şeyler olduğunu göstermesi itibarıyla öğretici değerini hala korumaktadır. Yemek siparişi vermekle ilgisi kurulabile cek tüm bilgilerin, yani lokanta ve yemek siparişi eylemiy le ilgili tüm kavramlar ve yüklemlerin [veya belirtimlerin] Lokanta Bilgi Tabanı aracılığıyla bir yapay zeka sistemine sunulduğunu varsayalım. Bu durumda bile kesintiler, bek lenmedik olaylar, hatta garsonla ayaküstü laflamak dahi, betiklere bel bağlayan bir sistemin kafasını çabucak ka rıştıracaktır. Bu sistemin her durumda, dünya hakkında Lokanta Bilgi Tabanı'nın barındırdığından çok daha fazla bilgiye ihtiyacı olacaktır. 18
R. C. Schank, Conceptual Information Processing, New York: Elsevier, 1 975.
SAVAVARIMLI ÇIKARIM
Lokantayla ilgisiz her şeyi, her türden sağduyu bilgisi nı -hava durumunu, televizyondaki spor müsabakalarını falan filan- barındıran bir 'meta' bilgi tabanı haline getirip sisteme sunmak da cezbedici bir düşüncedir. Fakat lokanta ile bütün bu sağduyu bilgileri arasında doğrudan ilgi kuru lamayacağı için (önceki sayfalarda değindiğim üzere, ilerde hangi bilgilerle ilgi kurulacağı sorununu 'önceden çözmek' mümkün değildir) sistemin konuyla ilgili bilgilerinin ve planlarının dışına bir şekilde çıkabilmesi de gerekir. Bunu yapabilmesi içinse olan biteni anlamasına -nereye bakacağı nı, ne arayacağını bilmesine- izin veren bir çıkarım düzene ğine sahip olması şarttır. Dolayısıyla bilginin kendisi dışında başka bir sorunu çözmemiz gerekiyor, yani tümdengelimli (veya tümevarımlı) olmayan, esnek bir sağduyu çıkarsama düzeneğine ihtiyacımız var. Bu da bizi çıkarım sorununa geri götürüyor.
Sihirli Çıkarım Motoru: Yapay Zekimn Seçim Sorunu A - B gibi bir kuralımız varsa ve biz -beklenmedik- B olgusunu gözlemliyorsak, buradan hareketle A'nın doğru olduğunu varsayabiliriz çünkü A-B kuralı doğru olduğu müddetçe A, B'yi açıklayabilmektedir. Dolayısıyla "Yağmur yağarsa yerler ıslanır. " önermesinin doğru olduğu biliniyor sa, yerlerin ıslak olduğunu görüyorsak ve de elimizde başka bir veri yoksa yağmurun yağdığını varsayabiliriz. Gerçekten de ansızın gelişen bu bağlamda en olası durum budur. Oysa sistemin " Gökte bulut yok . " şeklinde ifade edi lebilecek bir C olgusunu da gözlemlemesi halinde A - B kuralını göz ardı etmesi gerekecektir. Neden mi ? Çünkü ar tık kural ilgisiz hale gelmiştir. A'nın bir değişken olduğunu hatırlayın: "Yağmur yağıyor. " veya " Çocuklar su tabanca larıyla oynuyor. " gibi sayısız farklı önermenin yerine geçe bilir. Aslına bakarsanız A'yı kümeleştirerek bir dizi bildirimi 239
YAPAY ZEKA M iTi
kapsayacak şekilde kolaylıkla genişletebiliriz: A = {Yağmur, Yangın Musluğu, Fıskiyeler, Su Tabancaları, Tsunami, . . . } . B u durumda görevimiz A -+ B kuralının ön bileşeni olan A kümesinin ögeleri içinden B gözlemiyle en ilgili doğru bildi rimi seçmek olacaktır. Dolayısıyla neler arasında ilgi kuru labileceğini anlamak şarttır. Nitekim B'yi bilmek bize A -+ B kuralında A kümesinin hangi ögesinin seçilmesi gerektiği ni söyleyemez. Kümenin en ilgi kurulabilecek ögesini bizzat seçmemiz gerekir. Dolayısıyla A gözleminden B sonucunu tümdengelimle çıkarmak bize kesinlik sunsa da 'fazla' kolaydır. Biz etki den nedeni çıkarsamak istiyoruz: Sokakların ıslak olduğunu görüyor, bunun nedenini veya nasılını öğrenmek istiyoruz. Bunların hepsi olağan zekanın bir parçası. Marcus ve Davis buna 'dünyanın anlamlı bir tablosuna sahip olmak' diyorlar ve bu tabloda neyin neye neden olduğunun bilgisini temel unsur olarak görüyorlar. Bu bilgiyi edinip kullanmak epey güç bir iş çünkü gerçek dünyada yaşanan olayların çoğunun birden fazla olanaklı nedeni var. Seçim sorunu, gerçek veya hayali tüm olanaklı nedenler arasından iş başındaki yahut en makul nedeni bulmakla ilgilidir. Dolayısıyla savavarımlı çıkarımın otomatizasyonu sorunu, ihtiyaç duyulan çıkarı mın barındırdığı güçlüğü teşhir etmemize yardımcı olan bu seçim sorununa geri götürülebilir ama aslına bakılırsa son kertede her ikisi de aynı sorundur. Savavarımda bulunabil mek için rakip nedenler veya etkenler arasından seçim yap ma sorununu çözmek zorundayız ve bu sorunu çözebilmek için, nelerin anlamaya çalıştığımız durumla ilgili olduğunu bir şekilde görebilmemiz gerekiyor. Sorun şu ki bunun nasıl yapılabileceğine dair kimsenin bir fikri yok. Bilfiil kullandı ğımız çıkarımlar çoğu zaman karşımıza çıkan durumla ilgili olduğunu veya makul bir açıklama teşkil ettiğini düşündü ğümüz tahminlerden ibaret, yoksa bunların çoğu tümden gelim veya tümevarım değil. Bu çıkarımlar yapay zekanın bakış açısından işte tam da bu yüzden sihirli görünüyorlar.
SAVAVARIMLI ÇIKARIM
Peirce, tahminlerimizin akıl almaz isabetliliğine 'üstün körü' diye nitelediği bir açıklama da getirmişti gerçi: " İnsan zihni doğa yasalarının etkisi altında geliştiği için, doğadaki örüntülere göre düşünmeye meyillidir. Bundan en ufak bir kuşkum bile yok " diyordu. 1 9 İhtiyatlı sayılabilecek bir tah minde bulunuyor ve " Hayali bir varlık herhangi bir fenome ni açıklayacak bir milyar (yani milyon kere milyon) hipotez öngörebilir" diyordu.2 0 Bunları yazarken aklında bağlantılı bir bilgi tabanı fikri veya ona benzer bir şey vardı: " Çünkü anlık olaylara saplanıp kalmayan böyle bir varlığın zihninde bu fenomenler hiç kuşkusuz milyonlarca başka fenomenle az çok bağlantılı olacaktır. " Buradan hareketle, 'doğadaki örüntülere' göre düşünmeyen böylesi bir varlığın şans ese ri doğru tahminlerde bulunması pratikte olanaksız olacağı için 'bu fikri daha ileri götürmeme' kararı verip bir anlamda sorunu başından savacaktı.21 Ama ne yazık ki yapay zeka çalışmalarının bu sorunu başından savması mümkün değil dir çünkü bu alanda çözülmesi gereken sorun tam olarak budur.
Düşünmek. Kih Hızlı Hızlı. Kih Ağır Ağır Düşünmemize kısmen içgüdülerimizin yön verdiği fikri çok eskilere dayansa da bu fikrin modern tezahürlerini örneğin Nobel Ödüllü Daniel Kahneman gibi isimlerin çalışmaların da görmek mümkündür. Kahneman 201 1 yılında yayımlan mış çok satılan kitabı Hızlı ve Yavaş Düşü n m e 'de, düşü nen zihinlerimizin Birinci Tip ve İkinci Tip adını verdiğini iki başat düşünme sisteminden oluştuğunu ileri sürüyordu. Buna göre, Birinci Tip düşünme hızlı ve gayriihtiyariyken,
19 2° 21
Charles Sanders Peirce, " Guessing," The Hound and Horn, 2. cilt, s. 269. Charles Sanders Peirce, age. , s. 269. Charles Sanders Peirce, age., s. 269.
YAPAY ZEKA M iTi
İkinci Tip düşünme daha fazla zaman alıyor, ölçüp tartmayı gerektiriyor.22 . Issız ve karanlık bir sokakta elinde bir bıçak la karşıdan gelen maskeli bir adamın yarattığı tehdit algısı, Birinci Tip düşünmeye bir örnektir. Böyle durumlarda gay riihtiyari içgüdüsel düşünme devreye girip idareyi ele alıyor çünkü böyle anlarda dikkatle düşünmeye ve ölçüp tartmaya dayanan İkinci Tip düşünme becerilerimiz fazla yavaş ka lacağından -muhtemelen- hayatta kalamayız. Bir tehlike anında durup zamanımızı matematik problemi çözemeye harcayamayız, bizi hayatta tutacak anlık yargılara süratle varmamız gerekir. İkinci Tip düşünme edimleri sayı topla mak, akşam yemeğinde konuklarımıza hangi şarabı sunaca ğımıza karar vermek gibi çeşitli görevleri kapsıyor. Haliyle, olası bir tehditle karşı karşıya kaldığımızda İkinci Tip dü şünme çok yavaş kalıyor ya da bize pek yardımcı olamıyor. Kahneman, Hızlı ve Yavaş Düşünme adlı kitabında, dü şünürken yaptığımız hataların çoğunun, daha özenli, tem kinli ve sorgulayıcı biçimde düşünmemiz gerekirken Birinci Tip çıkarımların düşünme süreçlerimizi etkilemesine izin vermemizden kaynaklandığını savunuyordu. Birinci Tip düşünmenin İkinci Tip düşünmeye ağır basmaya meyilli ol ması bizi çoğu zaman safsatalara düşürüyor ve yanlı düşün meye itiyor. Buraya kadar bir sorun yok. Fakat bu iki düşünme sis temi arasında yapılan ayrım, yapay zeka araştırmacılarının yaptıkları bir hatanın perçinlenmesine neden oluyor: Bilinçli zeki düşünmenin bir çeşit kasıtlı ölçüp tartma, hesaplama işi olduğu varsayımını kemikleştiriyor. İşin aslı şu ki ilgi kurma meselesi, seçim sorunu ve bütün bir bilgi tabanlı çıkarım aygıtı hem Birinci hem de İkinci Tip düşünmede örtük olarak içeriliyor. Başka bir deyişle, Kahneman'ın ayrımı yapay. Şikago'da ıssız ve karanlık bir 11
Daniel Kahneman, Thinking, Fast and Slow, New York: Farrar, Straus ve Giroux, 20 1 3 .
SAVAVARIMLI ÇIKARIM
sokakta yürürken karşıdan bir adamın bana doğru geldiği ni görürsem hızla tehdit çıkarımında bulunabilirim. Fakat -görünüşte İkinci Tip düşünme olan- çıkarımı o kadar hız lı yapıyoruz ki bir tehditle karşı karşıya olduğumuzu çoğu zaman dile getirebiliyor veya tehdit hakkında anlık yargıda bulunabiliyoruz. Yani tehdidi görüp o an ifade edebiliyoruz. Kahneman'ın da belirttiği üzere, algıladığımız tehdit gerçek ten de 'dövüş ya da sıvış' tepkisini tetikliyor ama ilgili teh didi düşünmeden algıladığımız iddiası tam olarak doğru de ğil. Tehdit algılarının hızlı çıkarımlar oldukları doğru ama bu onların çıkarım olduğu gerçeğini değiştirmiyor. Bunlar gayriihtiyari tepkilerden, yani reflekslerden ibaret değiller. ( Peirce'ın açelyasını hatırlayın. ) Hızlı düşünmede yine savavarım merkezi bir rol oynuyor: Cadılar Bayramı'da olduğumuzu düşünün. Karşıdan gelen adamın kostüm giydiğini ve elindeki bıçağın sahte olduğunu anlıyoruz. Yahut bu adam bizim elektrikçi Frank'tan baş kası değil, diyoruz. Elinde aletleriyle -ki bunların arasında bıçak da var- sokakta yürüyor ve sokak karanlık çünkü elektrikler kesik. Bunların hepsi savavarım ama bu çıkarım lar o kadar hızlı gerçekleşiyor ki art alan bilgisinin devreye girdiğini fark etmiyoruz. Hızlı düşündüğümüzde dahi neyi tehdit olarak değerlendireceğimizi beklentilerimiz belirliyor. Başka bir deyişle İkinci Tip düşünmeyi de yönlendiren açık lamalar öngörüyoruz. Beynimiz -yani zihnimiz- bir çıkarım üreteci olarak iş görüyor. Başka bir deyişle, ister hızlı ister yavaş olsun her türlü çıkarım noetiktir veya bilgiye dayalıdır. Çıkarım kabiliyeti miz bir şekilde [konuyla] ilgili olgular ve bilgi kırıntılarıyla takviye edilmiştir. Burada sorulması gereken soru şu: Bütün bunları bir makineye nasıl programlayabiliriz ? Levesque'in de belirttiği gibi, bunun için örneğin klasik yapay zeka ça lışmalarının bilgi temsili ve akıl yürütme gibi alanlarında yapay genel zekaya doğru bir ilerlemenin kaydedilmesi şart görünüyor. Şu anda tek bildiğimizse yapay zeka çalışmala24 3
YAPAY ZEKA MiTi
rının, muazzam bir sağduyu bilgisi dağarcığı gerektiren sa vavarımlı çıkarım yapabilmenin bir yolunu bulması gerek tiğidir. Makineleri bu tür bilgilerle donatmanın bir yolunu henüz bulamadık. Bir gün bunu başarsak bile, yapay zeka araştırmalarında sıçramaya neden olacak bir kavramsal bu luş yapamazsak, tüm bu bilgileri gerçek dünyada anında, yani gerçek zamanlı kullanabilecek bir savavarımlı çıkarım motorunu nasıl inşa edeceğimizi yine bilemeyeceğiz.
Yetersiz Kodlanmış Savavarım (ve Dahası) Olarak Seçim Problemi Müteveffa romancı, göstergebilimci ve felsefeci Umber to Eco, savavarım ve çıkarımı konu edinen az bilinen bir derlemede yer alan bir yazısında savavarımlı çıkarımın türlerini barındırdıkları yeniliklere ( dolayısıyla bilişim alanına aktarılabilme güçlüklerine) göre sınıflandırıyor du.23 Eco'nun sınıflandırmaları yapay zekayla ilgili şu anki tartışmamız açısından epey öğretici niteliktedir. Hipotez ler ve aşırı kodlanmış savavarımlar paradigmatik açıdan çeviri örnekleridir, örneğin İngilizce 'man' [adam] söz cüğü 'yetişkin erkek insan' anlamına gelir. Eco, önemsiz ve basit görünen bu tür çıkarımların bile ancak kısmen otomatik/kendiliğinden sayılabileceğine dikkat çekiyor ve buna gerekçe olarak art alan bilgilerinin ve bağlamın bi zim inançlarımızı değiştirebilmesini gösteriyordu. Nitekim çok sayıda dilin konuşulduğu yabancı bir kültürde 'man' sözcüğünü duyduğumuzda bunun doğrudan İngilizcedeki sözlük anlamını taşıdığı sonucunu çıkaramayız. Aşırı kod lanmış savavarımlar, bir inancın veya hipotezin çıkarıma karıştığı gerçeğini perdelemeye devam ediyor. Sesbirimle23
Umberto Eco ve Thomas A. Sebeok (ed. ) , Dupin, Holmes, Peirce: The Sign of Three, Bloomington, iN: Indiana University Press, 1 9 83.
SAVAVARIMLI ÇIKARIM
rin ( sözcüklerin seslerinin) ne anlama geldiği konusundaki beklentilerimizi art alan inançları bize söyler. Yetersiz kodlanmış savavarımlar halihazırda bilinen ol gulardan ve ilgi kurulabilecek kurallardan sadece bu belirli bağlamda kullanılacak çıkarıma uygun olanlarının seçilme sini gerektirir. Bu açıdan doğal dili anlama, yetersiz kodlan mış savavarımlı çıkarımın temel örneklerinden birini teşkil eder. Örneğin "Margaret ağaçta bir saksağan gördü. Ondan tiksindi. " ifadesi çoğu durumda Margaret'in saksağandan tiksindiğine yorulur çünkü ikinci tümcedeki adılın ilk tüm cede karşılık geldiği ad 'saksağan'dır. Buna karşılık " Mar garet favori ağacına bir bülbülün tünediğini gördü. Onu daha da sevdi . " ifadesinde ikinci tümcedeki adılın karşılığı ilk tümcedeki 'ağaç' adıdır. İkinci tümceden 'daha da' ifa desini çıkarabilmek için Margaret, bülbül ve ağaç hakkında daha fazla art alan bilgisine ihtiyaç duyarız. Başka bir deyiş le, bu iki tümcenin anlaşılabilmesi için, içinde yer aldıkları anlatının da anlaşılması gerekiyorsa yetersiz kodlanmışlar demektir. Bu yüzden Siri veya Alexa gibi sistemlerin bağ lamı daha fazla gözeten anlamlı yanıtlar üretebilmeleri için en azından yetersiz kodlanmış sava varımlı çıkarımlarda bu lunabilmeleri gerekiyor. Yukarıda verdiğimiz iki tümcelik örnekler, bu tür sistemlerin mevcut yöntemlerle işlemesini sağlamaya çalışan girişimlerin karşısına çıkan sorunlar der yasında sadece bir damladan ibaret. Savavarım her ileri adımda biraz daha zorlaşıyor ve çok geçmeden bildiğimiz tüm otomatik çıkarım ve hesaplama an layışlarından uzaklaşıyor. Bilimsel keşfi veya inovasyonu ele alın: İnsanlar dünyayı açıklamak için diller, kavramlar ve ya salar icat etmişlerdir. İşte bu, yaratıcı savavarımdır. Yaratıcı savavarımlar yeni kavram çerçevelerine kendiliğinden 'sıçrar'. Burada akla hemen Sör Isaac Newton geliyor. Newton eğrile rin bir noktasından diğerine kesintisiz geçişi (veya ivmeyi) be timleyerek matematiği genişlettiği gibi, fiziğin olgularını açık layabilmek için mevcut İngilizce sözcüklere yeni anlamlar da 24 5
YAPAY ZEKA MİTi
kazandırdı. Bugün 'kütleçekim' diye bildiğimiz İngilizce gra vity sözcüğü aslında derinlik ve ağırbaşlılık anlamlarına geli yordu. Kütleçekim dediğimiz çekim kuvvetiyse bir yatkınlık veya erek olarak anlaşılıyordu. Newton yere düşen elma gibi nesnelerin, matematik aracılığıyla betimlenebilen görünmez bir kuvvete, kütleçekime göre devindikleri hipotezini ortaya attığında başka bir şeyi daha fark etmişti: Ay'ı Dünya'nın yörüngesinde tutan (esasında Dünya'nın çevresinde düşüşe geçiren diyebiliriz), gelgitler sırasında denizlerin kabarması na veya çekilmesine neden olan kuvvet de aynıydı veya aynı olabilirdi. Yani Newton aslında bir dizi kavram icat etmişti. Turing ise genelleşmiş makineleri yani bilgisayarları açık lamak için mekanik daktiloyu bir model olarak kullanmıştı. Daktilo o güne kadar herkesin bildiği bir makine olmasına rağmen bu sayede ve beklenmedik bir biçimde insanlık tari hinin gördüğü en büyük bilimsel ve teknolojik buluşlardan birinin temeli haline gelmişti. Bu gibi yaratıcı savavarımla rın nasıl otomatik hale getirileceği en hafif tabirle belirsizdir ve bu soru yanıtlanması epey güç bir sorudur. Yine de in sanlar eskiden de savavarımlarda bulunuyorlardı, bugün de yapıyorlar. Watson ve Crick'in DNA'nın yapısını keşfi veya Einstein'ın görelilik kuramı da yaratıcı savavarımın çok ünlü örnekleri arasındadır. Bilimi ve inovasyonu adım adım ilerleterek bugün bulunduğu noktaya getiren de insanlığın şafağından bu yana yapılagelen ve çoğu bu ünlü örnekler kadar bilinmeyen sayısız yaratıcı savavarımdır. Yaratıcı savavarımlar Newton, Turing veya diğerlerinin anlık zeka parlamalarıyla sınırlı olsaydı yapay zeka araş tırmaları için daha az sorun teşkil ederlerdi. Oysa özel ha yatlarımızda bile en ilginç ve önemli anların çoğu, yaratıcı savavarımların eseridir. Kendi dünyamızı yeniden kavram laştırıp örneğin her gün tanık olduğumuz gündelik olaylar da yeni anlamlar görmeye başladığımızda, hayatta paradan daha önemli ilişkilerin olduğunu keşfettiğimizde veya din değiştirdiğimizde -veya inancımızı kaybettiğimizde ya da
SAVAVARIMLI ÇIKARIM
bir geleneği terk ettiğimizde- olaylara tamamen farklı bir gözle bakmaya başlarız. Bunu yaparken bir bulmaca çözer mişçesine art alandaki olanaklar ağından bazı tercihlerde bulunmayız ama ola ki bulunduğumuzdaysa bunu çok daha derin bir anlamda yaparız. Bunun yerine dünyayı, olayları, gelişmeleri tamamen farklı bir şekilde görürüz. Bu yaratıcı sıçrama hem her gün olur hem de çok sayı da insan tarafından gerçekleştirilir. Bu sıçramalar ciddi ve büyük meselelerde -örneğin inanca ve kuşkuya dair soruş turmalarda- yaşanabileceği gibi, küçük ve gündelik mesele lerde de gerçekleşebilir. Çoğu zaman keyif vericidirler. Ne zaman bir gazete okusak, sohbete dalsak veya meyve-sebze almak için pazaryerinin kalabalığına dalıp kendimize yol açmaya çalışsak aslında ilginç çıkarımlarda bulunuruz. Mü zik, sanat, sinema ve edebiyata merakımızın ve bunlardan aldığımız keyfin ardında da yaratıcı savavarımlar bulunur. Dupin ve Sherlock Holmes'un zamanından beri dedektifle rin bizi eğlendirmesinin nedeni, onların düşüncelerinde in san zihninin yaratıcı potansiyelini görmemizdir. Zekice ya pılmış çıkarımları akıl yürütme edimlerine dönüştürmelerini büyük bir hayranlıkla takip ederiz. Kısacası, gizemli ve mucizevi savavarımlı çıkarımlar insan kültürünün iliklerine işlemiştir. Hatta insanı insan yapan da büyük oranda bu sıçramalardır. Yapay zekanın bir gün bu sıçramaları otomatik olarak yapacağını hayal etmekte bir sakınca yok, yeter ki bu arada deneyimimizi makinelere na sıl aktaracağımızı bilmediğimizi kendimize itiraf edebilelim. Tüm yollar yapay zeka çalışmalarında temel bir kuramın eksik olduğu gerçeğine çıkıyor: Savavarımlı çıkarımın kura mına sahip değiliz. Dili anlama sorunu bunu kuşkuya yer bı rakmayacak denli açık biçimde ortaya koyuyor. Bu meseleyi bir sonraki bölümde ele alacağız. Fakat önce bu bölümde ele aldığımız temel sorunları derleyip toparlayalım. Birincisi, tümdengelim bize kesin bilgi veriyor. Tümden gelimli bir akıl yürütmenin öncülleri doğruysa ve bu öncül24 7
YAPAY ZEKA MiTi
lerden bir sonuç çıkarmak için kullanılan kural geçerliyse -yani doğruluğu koruyorsa- tümdengelim bizim bir doğru çıkarımdan diğerine geçişimizi güvence altına alıyor. Burada karşımıza çıkan temel sorun, zamandan bağımsız bu doğru ların günlük hayatta çok az karşılığının olmasıdır. Başka bir deyişle, tümdengelim aracılığıyla edindiğimiz bilgiler kesin olsa da, bu çıkarım türü, ilgi kurma sorununu göz ardı edi yor. Dolayısıyla tümdengelime bel bağlayan bir yapay zeka sistemi son derece gülünç, hatta aptalca sonuçlara varabili yor. Örneğin bir adamın, eşinin doğum kontrol haplarından içtiği için hamile kalmayacağı sonucunu çıkarabiliyor. ikincisi, tümevarım bize ancak geçici bilgi sunabiliyor çünkü gelecek geçmişe benzemek zorunda değil (ve çoğu zaman benzemiyor) . Mantık uzmanları tümevarımın bilgi dağarcığımıza yeni bir bilgi eklediği gerekçesiyle sentetik bir çıkarım olduğunu söylerler. Bu doğrudur ama bize sunduğu bilginin doğruluğunun veya kesinliğinin güvencesi yoktur. Dahası, tümevarım zeka için şart olan bilgiye dayalı çıka rımları kapsamıyor çünkü veriye ve veride karşımıza çıkan fenomenlerin sıklığına göbekten bağlıdır. Üstelik tümeva rımlı sistemler sağlamlıktan yoksundur, kırılgandır ve katık sız veriden hareketle hakiki anlayışa ulaşamaz. Genelleşmiş zekaya giden yol tümevarımdan geçmez. Üçüncüsü, zeki düşünce açıkça gözlemleyebildiğimizin ötesine geçen bilgileri de barındırır ama bu bilgileri nasıl edindiğimiz, hatta karşımıza çıkan bir soruna doğru bilgi yi doğru zamanda nasıl uyguladığımız tam bir muammadır. insan zekasının temelinde yatana bu gizeme ne tümdengelim ne de tümevarım ışık tutabilmektedir. Peirce'ın yıllar önce önerdiği savavarımlı çıkarım bu gizeme bir ışık tutuyor tut masına ama bu çıkarım türünü bilişim sistemlerine nasıl programlayabileceğimizi bilmiyoruz. Dolayısıyla, aksi yöndeki tüm iddialara rağmen -en azın dan henüz- yapay genel zekaya giden yolda olmadığımızı söyleyebiliriz. Hala bir temel kuram arayışındayız.
13 ÇIKARIM VE DİL
-
1
ugene Goostman'la ancak yazışarak sohbet edebilir siniz. Telefonlara çıkmıyor. Onunla oturup bir öğle yemeği de yiyemiyorsunuz. Onunla yazıştığınızda size 1 3 yaşında olduğunu ve Ukrayna'nın Odessa şehrinde yaşa dığını söylüyor. Çoğu ergen gibi onun yazışmaları da küs tahça ve laf çarpmalarla dolu; aşırı özgüven barındırıyor, üstelik yanlış yönlendirmeye, gerçeği gizlemeye teşne. Bir kaba oluyor, bir şakacı. Muhatabını şakayla karışık iğnele meye bayılıyor. Ama size anlatmadığı bir sırrı var: Aslında o bir bilgisayar programı, bir sohbet botu. Rus araştırma cılar onu, insanları etten kemikten biri olduğuna ikna et mesi için tasarlamışlar. Rivayet o ki Goostman Turing'in ölümünden 60 yıl son ra Turing Testi'ni geçerek 7 Temmuz 2014'te adını tarihe yazdırdı. Ingiltere'deki Reading Üniversitesi'nin ev sahipliği yaptığı ve Londa'daki Royal Society'nin düzenlediği epey tantanalı bir etkinlikte, sohbet botu Goostman sadece beş dakikalık bir yazışmayla seçkin hakemlerin % 3 3 'ünü insan olduğuna ikna etti. Bu olay büyük haber oldu, dünyanın dört bir yanında bloglarda, basın kuruluşlarında yer aldı. Oysa bu gerçek bir Turing Testi değildi. Beş dakikalık testin sonunda hakemle-
E
24 9
YAPAY ZEKA MiTi
rin üçte ikisi Goostman'ın numaralarına kanmamıştı. Yine de bu olay hakkında basında yer alan haberlerde " Hele şü kür ! " deniyordu, Turing'in meydan okuması nihayet aşıl mış, gerçek yapay zekanın kapısı aralanmıştı. Tahmin edile bileceği gibi, herkes sevinçten havalara uçuyordu. The Inde pendent gazetesi Goostman'ı 'büyük buluş' diye niteliyor ve programın bir 'süperbilgisayar' olduğunun altını çiziyordu. 1 Time ise " Robotların Çağı Başladı" diye yazıyordu. BBC bunun 'bir ilk' olduğunu ileri sürüyordu ki aslında teknik açıdan bu doğru bir iddiaydı. Sevilen teknoloji blogu Giz modo bu gelişmeyi " Büyük olay! " diye okurlarına aktarı yordu. Elbette basının bu abartılı tepkisinde Alan Turing'e öteden beri duyulan hayranlığın da önemli bir payı vardı. Keza bu olay Turing Testi'ni geçmenin ne denli önemli bir olay sayıldığının da ikrarıydı. Bir bilgisayarla gerçekten sohbet ettiğinizi bir an bir hayal edin: Goostman'ın başarısı bilimkurgunun ezeli hayalini bir anda gerçeğe dönüştürmüş tü.2
Eugane Goostman Bir Sahtekar Ancak küçük bir sorun vardı. Goostman bir sahtekardı. Rus takımının Goostman'la Turing Testi'nden geçerek 1 00.000 dolarlık Loebner Ödülü'nü aldığı Londra'daki bu gösterinin hemen ardından, bilgisayar bilimciler ve yorumcular itiraz larını dile getirmeye başladılar. Birincisi Goostman aslında soruları yanıtlamamıştı. Genellikle ya konuyu değiştiriyor ya da muhatabının sorularıyla alay ediyordu. O sıralar New Y ork Üniversitesi'nde çalışan Gary Marcus, New Yorker 1 2
Andrew Griffin, "Turing Test Breakthrough as Super-Computer Becomes First to Convince Us lt's Human " , Independent, 8 Haziran 2014. Bkz. " Computer AI Passes Turing Test in 'World First'", BBC News, 9 Haziran 2014. Time dergisindeki makaleye artık erişilemiyor. Ayrıca bkz. Pranav Dixit, "A Computer Program Has Passed the Turing Test for the First Time '' , Gizmodo, 8 Haziran 2014.
ÇIKARIM VE DIL - 1
gazetesine yazdığı bir yazıda Goostman'ın inandırıcı per formansının 'basit bir numaradan ibaret' olduğunu belirti yordu. Marcus'un söyledikleri Hector Levesque'in söyledik lerine benziyordu; Levesque de Goostman'ınki gibi perfor mansları 'ucuz numaralar' diye niteliyordu. Marcus'un izah ettiği üzere, Goostman'ın yanıltma taktiği, zekaya gerek duymadan bir zeka yanılsaması üretiyordu. Marcus: New Yorker'ı okudun mu? Goostman: O kadar çok kitap okudum ki adlarını bile hatırlamıyorum. 3
Bu konuşmalar 1 9 60'larda insanların ELIZA'yla yaptık ları sohbetleri andırıyor. ELIZA, Roger ekolünden gelen bir psikoterapisti taklit etmeye programlanmıştı: Danışan: Kocamla sorun yaşıyoruz. ELIZA: Kocanızdan biraz daha bahseder misiniz?
Bunların eğlenceli sohbetler olduklarını itiraf etmek gerek. Yine de yapay zeka çalışmalarının doğal dili işleme ala nında yüzleşmesi gereken sorunlarda bir ilerleme kaydedil diğinin belirtisi değiller. Hatta işin aslı şu ki Goostman (ve ELIZA) tam da doğal dili anlamaya çalışmaktan kaçındığı için başarılı oluyor ve tam da bu yüzden onunla ciddi bir sohbete girmeye çalıştığınızda kısa sürede çuvallıyor. Goostman'ın yarattığı heyecan dalgasına kapılmış uz manlar ve yorumcular -belki de anlaşılabilir bir tavırla- Tu ring Testi'nin meşru bir ölçüt olmadığı iddiasına sarıldılar. Gizmodo hemen Turing Testi'nin 'b.ktan' olduğunu ileri süren bir yazı yayımladı. Wired ise bilgisayarla yapılacak samimi bir sohbetin yetkin bir yapay zekanın ölçütü sayılıp sayılamayacağını sorguladı.4 Goostman fiyaskosu konusunda eleştirmenlerin haklı ol dukları bir nokta var: Söyleneni gerçekten anlamadan, alay3 4
Gary Marcus, "What Comes After The Turing Test? " New Yorker, 9 Haziran 2014. Adam Mann, "That Computer Actually Got an F on the Turing Test" , Wired, 9 Haziran 2014.
YAPAY ZEKA MiTi
cı yanıtlara başvurarak hile yapmak, Turing'in öngördüğü anlamda dili anlama becerisinin bir ölçüsü olamaz. Türlü manevralar ve ucuz numaralarla Turing Testi'nde hile yap mak, yumuşak karnımızı ortaya çıkarıyor: Karşılıklı sohbet ten beklentimizi düşürdüğümüzde zeka tespiti çıtamızı de aşağı çekmiş oluyoruz.5 Nitekim Ukraynalı 1 3 yaşında bir oğlanla konuştuğumuzda onun yetişkin sohbetlerini anla madığını -ve umursamadığını- düşünüp pekala suyuna gi debiliriz. Benzer şekilde, ELIZA'yla bir terapi seansına gir diğimizde, terapi sırasındaki etkileşimin bizi konuşturmayı da içerdiğini varsayıp terapistimizi bizim yerimize düşünme zahmetinden kurtarmak isteyebiliriz. Böyle durumlarda beklentilerimiz yanıtlayıcıların zekasının değerlendirilmesi ni daha işin başında engelleyen bir toplumsal bağlama uyar. İşte bu yüzden, yapay zeka araştırmacılarının Turing Testi meydan okumalarına artık rağbet etmemelerinde şaşılacak bir şey yoktur. Stuart Russell'ın da "Ana akım yapay zeka araştırmacıları Turing Testi'ni geçmek için neredeyse kılları nı bile kıpırdatmadılar " sözüyle bu sınamaları artık ciddiye almadığı belli oluyor. Dahası, basın yayın organlarının basit numaralara gösterdiği abartılı ilginin yapay zeka alanında çalışanlarda yarattığı hayal kırıklığını da yansıtıyor.6 Nite kim bu meydan okumaları kabul etmek, bugün alanda bir zayıflık belirtisi olarak görülür hale geldi. 5
6
Siri veya Cortana'yı da Loebner Ödülü için yarışacak yarışmacılar haline getirebiliriz. Yapmamız gereken şey, LafSalatasıYap() veya ŞikayetEt() gibi bazı kodlar eklemekten ibaret. Bu bağımsız değişkenler, kullanıcının gireceği sorular veya komutlar üzerine çalışacak. Sistem bunun ardından şaşmaz biçimde insanların taleplerine kusur bulacak. Mesela sürekli olarak " Niye ? " diye soracak, ardından istenmeyen bir misafir misali " Hep bu soruyu yanıtlamaktan bunaldım, gel başka bir şeyden bahsedelim " diyecek. Böyle bir dönüşümün ardında Siri artık size epey düşünceli ve zeki gelecektir ama tamamen işe yaramaz da olacaktır. Siri, gerçekten insan dilini anladığı ölçüde daha faydalı olacaktır, bu da Turing Testi'nin çözülmemesinin, hatta belki de yapay zeka bilimcilerin ısrarla bunu görmezden gelmelerinin bir nedenidir. Stuart Russell, Human Compatible: Artificial Intelligence and the Problem of Control, New York: Viking, 2 0 1 9 .
ÇIKARIM VE DI L - 1
Fakat bu meydan okumaları elimizin tersiyle toptan bir kenara itmenin de bir alemi yok. Birincisi, hile hurda barın dırmayan bir Turing Testi, dili anlama kabiliyetinin gerçek ten de en yetkin ölçütlerinden biridir. Ray Kurzweil'in de belirttiği üzere, yabancı bir zeka İngilizce sohbetleri anlama yabilir ama hilesiz bir Turing Testi'nden geçebilen her şeyin zeki olduğunu rahatlıkla söyleyebiliriz. Nitekim Kurzweil de " Burada kilit nokta meseleyi tersinden anlamak: Testi geçebilmek için zeki olmanız şart" diyor.7 Bu doğrultuda, gelecekte yapılacak yarışmalarda, sohbetin gidişatı içinde ucuz numaraların elenmesini güvence altına alacak şekilde testin daha uzun tutulmasını öneriyor. Kurzweil'in bu önerisi, önerilerden yalnızca biri. Biz bir adım daha ileri gidip oyuna yeni bir kural ekleyerek ucuz numaralara başvurulmasını baştan da engelleyebiliriz: Ya rışmacılardan mahkemenin huzurundaymış gibi 'Tüm ger çeği ve yalnızca gerçeği söyleyeceklerine' yemin etmelerini ve doğrudan doğruya soruları yanıtlamalarını isteyebiliriz. Bir savcının veya yargıcın size "O geceyi bir de siz anlatın. Kendinizi nasıl hissettiniz ? " diye sorduğunu, sizin de bu so ruları yanıtlamanız gerektiğini hayal edin. Yahut tüm yarış macılara konuşma lngilizcesini anlama işi için mülakat ya par gibi oynama talimatı da verebiliriz ki bu da gelecekteki sesle etkinleşen sanal asistanlar için fena bir test de olmaz! Böyle durumlarda hileler testin bir parçası olan sohbet ku rallarım anında ihlal etmiş olur. Goostman da hapı yutar. Bilişimsel dilbilimciler ve yapay zeka araştırmacıları, açık uçlu sohbet gibi bir diyaloğa katılmanın formel açıdan bir monoloğu yorumlamaktan, örneğin bir gazete makalesini okuyup anlamaktan çok daha zor olduğunu başından beri biliyorlardı. Turing'in doğal dil kabiliyetinin insan seviye sinde zekayı ölçmenin elverişli bir ölçütü olduğu yolundaki Martin Ford, Architects of Inte/ligence: The Truth about AI (rom the People Building It, Birmingham, UK: Packt Publishing, 20 1 8 . 25 3
YAPAY ZEKA MiTi
sezgisine sadık kalmanın bir başka yolu da onun özgün testi ni yalnızca monoloğu gerektirecek şekilde basitleştirmektir. Özgün testte olduğu gibi bu basitleştirilmiş testte de bunu bir soru yanıtlama oturumu bağlamında yapabiliriz. Şimdi böyle bir basitleştirilmiş testi ele alalım ve ona Turing Tes ti Monoloğu adını verelim. Bir Turing Testi Monoloğu'nda hakem, bir gazete yazısını veya başka bir metni, yanıtlayı cıya girdi olarak sunar ve ona bu metnin ne dediğini anla mayı gerektiren birtakım sorular sorar. Yanıtlayıcı bu so ruları doğru yanıtlamak zorundadır. (Böylece olası hileleri de bertaraf etmiş oluruz. ) Örneğin bir hakem, Associated Press'in "Ya Taco'nu Ya Canını ! " başlıklı makalesini ya nıtlayıcıya girdi olarak sunup ona öykünün gülünç olup ol madığını, gülünçse neden öyle olduğunu sorabilir. Açıkçası mantıksal olarak, bu testten geçmek, ucu tamamen açık bir Turing Testi'nden geçmenin bir alt kümesi olacağı için, böy le bir monolog testi kullanmakta hiçbir sakınca yoktur, bu tamamen adil bir testtir. Hatta tarafların sırayla söz aldık ları sohbetlerde 'edimbilim olgularıyla' nasıl başa çıkacağını tam olarak anlayamayan bir makineye avantaj bile sağlaya bilir. Bu konuya ilerleyen sayfalarda tekrar döneceğiz. Ne yazık ki yapay zeka sistemlerinin Turing Testi Monoloğu'nda bile kısa sürede topu attıklarını gösteren bir takım kanıtlara sahibiz. Gary Marcus ve Ernest Davis, tek nolojinin en son yeniliklerini barındıran yapay zeka sistem lerinin bile okuduğunu anlama becerisinin acınacak halde olduğunu belirtiyorlar. Microsoft ve Alibaba, Stanford Soru Yanıtlama Veri Kümesi [Stanford Question Answering Da taset, SQuAD] adıyla bilinen metin okuma sınavında taban puanı yükselttikleri gerekçesiyle medyada epey övülmüştü ama onların sistemleri bile bunu ancak tam yanıtlar okunan metinde mevcutsa yapabiliyordu. Dolayısıyla aslında bu sis temlerin yaptığı, doğrudan doğruya yanıtları işaret eden so rulardan devşirdikleri ipuçlarını kullanarak, onlara açıktan sunulmuş yanıtların 'altını çizmek' gibi basit bir görevi icra 254
ÇIKARIM VE DIL - 1
etmekten ibaretti. 8 Marcus ve Davis bir adım daha ileri gi dip örneğin ABD'nin meşhur Amerikan futbolu derbilerine dair bir yazıda bahsi geçen bir takımın oyun kurucusunun yalnızca adının sorulduğu görünüşte basit sorularda bile ya nıtlayıcılardan utanç verici derecede kötü yanıtlar alındığını vurguluyor: Yapay zeka sistemlerinin anlama konusunda başarısızlığı işte bu gibi örneklerde ayyuka çıkıyor. Dola yısıyla hile yapma olasılığını bertaraf edebilsek bile, yapay zekanın dili anlamayla başının dertte olduğunu söyleyebili riz. Turing Testi ise meşru bir değerlendirme aracı olmaya devam ediyor ki bu testin çıtası da bilakis epey yukarıda. Dili anlamak için gerekenleri ciddi bir gözle inceledik çe, basitleştirilmiş Turing Testi Monoloğu'nu geçmenin bile ne denli zorlu bir görev olduğu iyice belirgin hale geliyor. Hector Levesque bu sınama yönteminin çok daha basitleş tirilmiş bir halini geliştirdi ve kendi küçük testine, yapay zeka araştırmalarının öncülerinden biri olan ve doğal dili anlama konusu üzerine çalışmış Terry Winograd'a ithafen 'Winograd şemaları' adını verdi. Winograd şemaları, basit lngilizce tümcelerin anlamlarını soran çoktan seçmeli so rulardan oluşuyor. Haliyle, Turing Testi'nin yanından bile geçemiyorlar. Buna rağmen yapay zeka araştırmacıları bu basit testlerin bile hakkından bir türlü gelemiyor.
Winograd Şemalarının Tuhaf Hikayesi Hector Levesque hala bilgi temsili ve akıl yürütme konula rı üzerinde çalışan bir avuç yapay zeka bilimciden biridir. Levesque'in saygı duyulası bir hedefi var: Büyük veriyi çö zümlemek için istatistiksel teknikler kullanan bugünün ya pay zeka programlarına sağduyu kazandırmak istiyor. Gary Marcus v e Ernest Davis, Rebooting Al: Building Artificial Intelligence We Can Trust, New York: Pantheon Books, 2019, s. 6-7. 25 5
YAPAY ZEKA MiTi
Levesque, Turing Testi'nin basitleştirilmiş bir örneğini kullanmayı önerdi. Bu basit test, hiçbir kısıtlaması olmayan, açık uçlu özgün testten çok daha kolay. Daha da önemlisi, son derece kolay olmasına rağmen, dili anlama görevlerin de kullanıldığı bilinen otomatikleştirilmiş tüm yaklaşımlara kök söktürmeye devam ediyor. Levesque'in 20 1 3 yılında İnternet Müşterek Yapay Zeka Merkezi'nde sunduğu " En İyi Davranışımız Üzerine " başlıklı makalesi kısa sürede hakiki yapay zeka için bir seferberlik çağrısı olarak kabul gördü.9 Tam tekmil Turing Testi'nden esinlenen Levesque, makinelere, söylenenin ardındaki derin anlamı yakalamayı gerektiren bazı sorular sormayı öneriyor. Bu sınavın soru ları söyleşilerden değil tek tek tümcelerden oluşuyor. Ör neğin " Bir timsah engelli koşuda yarışabilir mi ? " sorusu bu kabilden. Levesque özellikle böyle örnekleri seçiyor çünkü uzman olmayan, sıradan sağduyu sahibi insanlar bu soru ları kolaylıkla doğru yanıtlayabiliyorlar (timsahlar engelli koşuda yarışamaz) ama yanıtı bulmak için arama motoru kullanmak gibi yaygın numaralara başvuran sistemler doğ ru yanıtlayamıyor. Engelli koşuda yarışan timsahlarla ilgili bir web sayfası var olmadığına göre ( böyle varsayıyoruz), tümceyi anlama zorunluluğunun etrafından dolanmak da mümkün değil. İşte yapay zeka sistemleri böyle örneklerde çuvallıyor, insanlarsa yanıtı hemen buluyor. Bir Winograd şeması, çoktan seçmeli bir alıştırmadır. Bu şemalar, makinenin, kendisine sorulan soruya doğrudan yanıt vermesi halinde ifşa olacak anlayış eksikliğini gizle mek amacıyla çarpıtmaya, alaya, şakalara başvurarak veya huysuz insan taklidi yaparak hakemleri kandırma olasılığını 9
Bkz. Gary Marcus, "Why Can't My Computer Understand Me ? " New Yorker, 14 Ağustos 20 1 3 . Levesque'in yazıda adı geçen makalesi şurada bulunabilir: https://www . es.toronto.edu/-hector/Pa pers/ijcai- 1 3-pa per. pdf. Marcus'un Levesque'nin eserini ele alışı içgörülerle dolu ve okumaya değer. Levesque'nin IJCAI için hazırladığı makale, dili anlama açısından büyük veri sorununa dair harika bir özet sunuyor ve uzman olmayanlarca da okunabilecek bir dille kaleme alınmış.
ÇIKARIM VE DIL - 1
ortadan kaldırıyor. Winograd şemaları doğal dilin yaygın bir özelliğine bel bağlıyor. Bu şemaların esin kaynağı olan Winograd'ın asıl sorusunda bunu açıkça görebiliriz: "Belediye meclisindekiler, öfkeli göstericilere izin vermeyi reddettiler çünkü onlar şiddet olaylarının yaşanmasından korkuyorlardı. " Yukarıdaki tümceye göre şiddet olaylarının yaşanmasından korkan kimdi? a) Belediye meclisindekiler b) ôfkeli göstericiler
Burada 'onlar' adılına dikkat edin. Bu çoğul adıl, beledi ye meclisindekilere de öfkeli göstericilere de atıfta bulunu yor olabilir. Başka bir deyişle bir belirsizlik taşıyor çünkü her iki yanıt da dilbilgisi kurallarını ihlal etmeden doğru görünüyor. Yine de bu yanıtlardan sadece biri anlamlı. in sanlar böyle sorulara hiç zorlanmadan, neredeyse % 1 00 isabetlilikle doğru yanıt veriyorlar. Yapay zeka sistemleri ise veremiyor. Yapay zeka sistemlerinin Winograd şemala rındaki performansları rastgele tahminden pek farklı değil. 1 0 Büyük verinin ve makine öğreniminin yapay zeka yak laşımlarına açık ara hakim olduğu 20 1 2 yılında (ki bugün de öyledir) Levesque ve birkaç meslektaşı Winograd'ın bu meydan okumasını tekrar diriltti. Çoktan seçmeli sorular dan oluşan bir test kümesi derlediler. Bu test kümesindeki sorular, doğal dillerin belirsizlik özelliğinden yararlanıyor du. Levesque bu olgunun yapay zekanın karşısına çıkardığı zorluğu 'adılın belirsizliğini giderme sorunu' diye adlandırı yordu. Bu sorun Turing Testi'nin ardındaki esini daha basit bir düzlemde yakalıyordu, lngilizce, Fransızca ve diğer do ğal dilleri anlayabilmek için bile genel zekanın şart olduğu10
Sponsorlu son Winograd Şeması Yarışması, 20 1 6 yılında Uluslararası Yapay Zeka Ortak Konferansı tarafından düzenlendi. Kazanan sistem veri kümesinde % 5 8 ,3'lük bir isabet kaydetti ve bu oran, sistemin ödülü kazanmasına yetmedi. Bunun üzerine sponsor da bir daha 25 bin dolarlık ödülün mali sorumluluğunu üstlenmeyi reddetti. 257
YAPAY ZEKA MiTi
nu söylüyordu. Nitekim Levesque, yapay zeka sistemlerinin bu sınavda başarılı olabilmeleri için dildeki sözcüklerin ger çekte ne anlama geldiğini bilmeleri gerektiğine inanıyordu. Bir başka Winograd şeması örneği de şu: "]oan, Susan 'ı bir teşekkür etmeden bırakmadı çünkü o epey yardım etmişti. " Yukarıdaki tümceye göre, yardım eden kimdir? a) Joan b) Susan
Levesque, Turing Testi'nde hakemleri kandırmak için kullanılan ucuz numaraların bu testte kullanılmasını tama men engellemek için bir koşul daha ekledi: Yanıtı 'tersyüz' edip sorunun geri kalanına dokunmayacak iki özel sözcük belirlenecekti. Yukarıdaki örnekte bu özel sözcükler 'etmek' ve 'almak'tır. Bu iki sözcük yer değiştirince ortaya yeni bir soru çıkıyor: "foan, Susan'ı bir teşekkür etmeden bırakmadı çünkü o epey yardım almıştı. " Yukarıdaki tümceye göre, yardım alan kimdir? a) Joan b) Susan
Bir başka şemayı daha ele alalım, bunda özel sözcükler golfçüler ve köpekler: "Sam, çobanların ve koyunların resmini çizmeye çalıştı ama sonunda onlar daha çok golfçülere benzedi. " Yukarıdaki tümceye göre, kim golfçülere benzemiştir? a) Çobanlar b) Koyunlar
Winograd şemaları, sohbete dayalı asıl Turing Testi'ne kıyasla çok daha basittir ama adıl gönderimi belirlemeyi, yani anlam belirsizliğini gidermeyi gerektiren çoktan seç meli sorular sormaları itibarıyla erken dönem yapay zeka araştırmacılarının 'sağduyu bütüncülüğü' [commonsense holism] adını verdikleri bir düşünceyi yansıtıyor. Sağduyu bütüncülüğü, doğal dilin tümceler gibi oluşturucu parçala-
ÇIKARIM VE D IL - 1
rına ayrıştırılarak anlaşılamayacağını, bunun için bütüncül bir anlayışa ihtiyaç olduğunu savunuyor. Dolayısıyla Wi nograd şemaları basit olsa bile, genellikle dünyaya dair sıra dan bilgilere sahip okuyucular için anlamı apaçık olan, ola ğandışı sorulardan oluşuyor. Marcus'un timsahlar ve engelli koşular hakkında temel bilgi gerektiren örneğini ele alalım: Timsahların hiç değilse bacakları kısa olduğu için engelli koşulara katılamayacakları açık olsa gerektir. Peki, bu so ruları doğru yanıtlamak yapay zekaya neden zor geliyor ? Şemaların yapay zekaya zor gelmesinin kısmi nedeni, barındırdıkları iki gönderimin -yani timsah ve engelli koşu gibi ad ve ad tamlaması tercihlerinin- web sayfalarında veya başka metinlerde yan yana gelme olasılığının son derece dü şük olmasıdır, tabii böyle bir olasılık varsa. Oysa veri odaklı yapay zeka yaklaşımları istatistiksel çözümlemelere bel bağ lıyor. Haliyle, Winograd şemalarında karşımıza çıkan tür den tek tümcelik olağandışı sorular bile bu sistemlere ciddi bir zorluk çıkarıyor. Aslında Winograd şemaları, web sayfa larının taranması gibi hilelere karşı adeta kurşun geçirmez dir, hatta Levesque'in deyişiyle ' Google geçirmez'dir. Fakat bilgisayarların bu sorular karşısında parlak bir performans sergileyememelerin asıl nedeni, bunların yorumlanabilmesi için sıradan bilginin şart olmasıdır. Marcus'un verdiği örnek tümcede özneyi 'timsahlar' değil de 'ceylanlar' yaptığımızda sorunun yanıtı da değişecektir, çünkü ceylanlar bu engel lerin üstünden kolaylıkla atlayabilir. Fakat soru olağandışı kalmaya devam ettiği için bu bilginin web üzerinde karşını za çıkma olasılığı epey düşüktür. Makine öğrenimi ve büyük verinin böyle bir durumda faydası olmayacaktır, yapay zeka sistemleri yanıtı web'de bulamayacaktır. Bekleneceği üzere, yapay zeka araştırmacıları Winograd şemalarıyla başa çıkmak için yeni numaralar geliştirdiler. Bugün web'de, çözümleme için kullanılabilecek muazzam boyutlarda içerik bulunduğu için, kimi durumlarda sıklık örüntüleri halii işe yarıyor. Örneğin x'in y'den uzun olup ol259
YAPAY ZEKA MiTi
madığı sorusunu yanıtlamak için araştırmacılar web'de "x, y'den uzundur " örüntüsüyle aramalar yapıp gerçek bilgiyi taklit edebiliyorlar. Bu değişkenlerin yerini tuttuğu insan, bina veya başka herhangi bir şey eğer Wikipedia gibi bilgi depolarında yer alıyorsa bu bilgi, makine öğrenimi sistem leri tarafından bulunabiliyor ve bu veri gerekli matematik hesaplamalara tabi tutulduktan sonra soruyu yanıtlamak için kullanılabiliyor. Üstelik bunların hepsi web sayfaları nın bilgi alanları ve diğer veri kaynakları işlenerek yapılabi liyor. Levesque bu tekniğin geliştirileceğini de öngörmüş ve veritabanı seçkilerinde yahut çevrimiçi ansiklopedilerde yer almayan cins adlarını barındıran örnekler de önermiştir. ( Örn. ceylan, timsah, kalem, kağıt, bowling topu, koyun vs . yaygın cins adlarıdır . ) Bu hamle, yanıtı web'de arama nu marasını bertaraf ettiği gibi, gereken bilginin sıradan, sağ duyu bilgisi olduğunu da vurgulamaktadır, yani Turing'in testi için herkesin günlük hayatında bir şekilde girdiği temel sohbet biçimini kullanma amacına da sadık kalmaktadır. Winograd şemaları başka bir yoldan da arama moto ru hilelerine karşı koruma sağlıyor. Yukarıdaki timsahlar ve ceylanlar örneğinde olduğu gibi, x ile y arasındaki ilişki kolaylıkla değiştirilebilir. Böylece hem veri tabanlı hilelerin önüne geçilmiş olur hem de soruların basitliği korunmuş olur. Örneğin nesnelerin birbirine göre boyutlarını bilmeyi gerektiren şu şemayı inceleyelim: " Ödül kupası kahverengi bavula sığmıyor çünkü o çok küçük. " Yukarıdaki tümceye göre çok küçük olan nedir? a) Ö dül kupası b) Kahverengi bavul
Aslında bu şemada bir numara -bir teknik- gizli. Levesque'in deyişiyle 'bilgisayarca' diye adlandırabileceği miz dillerde bu yalın soruyu ilişki ( buna l diyelim) ile özellik ( buna Ö diyelim) olmak üzere iki bileşene ayırabiliriz: 1 = sığmıyor
Ö = çok küçük 260
ÇIKAR IM VE DIL - 1
Levesque'e göre, bunun ardından, "x, y'den küçüktür " + "x çok küçüktür " örüntüsü ile "x, y'ye sığmaz" + "y çok küçüktür" örüntüsünü web üzerindeki tüm metinlerde ara tarak bu iki örüntüden hangisinin daha yaygın olduğunu belirleriz, yani bu iş için 'büyük veriyi' kullanırız. 1 1 Arama ların bulduğu örnek tümcelerin aldığı puanlara göre burada karşımıza bir örüntü çıkabilir; örneğin elde ettiğimiz veri içinde ikinci nesnenin ilkine kıyasla küçük olma sıklığı daha yüksek çıkabilir. Bir sosyal medya gönderisinde, gönderinin sahibinin, falanca eşyasının sırt çantasına bir türlü sığma dığını gerekçe göstererek sırt çantasının küçüklüğünden dert yandığını hayal edin. Böyle bir durumda, yukardaki iki örüntü için yapılacak aramanın sonuçlarını sadece saymak kadar basit bir işlem bile bize istatistiksel bir yanıt verebilir ve eğer sonuç doğruysa, bu sonucu kullanan bir sistem, bilgi sahibi olmadan da Winograd şeması sorularını pekalii doğ ru yanıtlayabilir. Ne yazık ki bu yaklaşım çok sığdır. Sorunun anlamını -dolayısıyla seçilecek yanıtı- değiştiren en ufak oynamalara karşı bile tamamen savunmasızdır. Örneğin yukarıda değin diğimiz '1 ilişkisi' hilemiz şu soruda çuvallıyor: " Ö dül kupası kahverengi bavula sığmıyor hem de o çok kü çük olmasına rağmen. " Yukarıdaki tümceye göre çok küçük olan nedir? a) Ö dül kupası b) Kahverengi bavul
Burada çok küçük olan artık bavul değil ödül kupasıdır. Dolayısıyla 1 ve Ö'nün belirtimi yanlış bir yanıt üretecektir. Üzerinde oynanmış bu soru büyük veri içinde muhtemelen sorunun özgün halinden daha nadir karşımıza çıkacak ve bu yüzden büyük veri, sisteme destek olacağına köstek ola caktır. işte sorun tam olarak budur. Basit, tek tümcelik so11
Hector Levesque, " On Our Best Behavior", Konferans Konuşması, Uluslararası Yapay Zeka Ortak Konferansları, Pekin, Çin, 2013, s. 4. Metnin bağlantı adresi: https: //www . cs.toronto.edu/-hector/Papers/ijcai- 1 3 -paper.pdf.
VAPAY ZEKA MiTi
rularda bile sözcüklerin anlamları (timsahlar, engeller) ve şeyler arasındaki ilişkilerin anlamı (daha küçük), anlayışa yer vermeyen, sadece veri ve sıklık çözümlemesiyle yetinen teknikleri sekteye uğratmaktadır. Bu bakımdan Winograd şemaları Turing Testi'nin barındırdığı muazzam güçlüğe açılan bir penceredir. Makine öğrenimi ve büyük veri son on yılda bazı sorun larda önemli ilerlemeler kaydetti. Fakat bu başarının ardında, büyük oranda, bilgi ve anlama meselelerine hiç dokunmayıp bunların etrafından dolanan yaklaşımlar bulunuyor. Bu ko nuda hala bir kafa karışıklığı mevcut ve bu kafa karışıklığı özellikle dili anlama kabiliyetini bir yere kadar gerektiriyor görünen otomatik çeviri sistemleri örneğinde karşımıza çıkı yor. Google Çeviri'yi ele alalım: Bu sistem genellikle yapay zekanın doğal dille başa çıkmayı kısa sürede öğrenebileceği nin en büyük delili olarak görülüp müthiş bir başarı öyküsü olarak pazarlanıyor. Oysa burada anlaşılması gereken nokta şu: Son yıllarda web'de çok büyük hacimli çeviri metin var ve bunlara kolaylıkla ulaşılabiliyor. Bu da veri yoğunluklu yak laşımların işini epey kolaylaştırıyor. Bu yaklaşımlarla web'de halihazırda farklı dillere çevrilmiş metinlerdeki sözcükler ile tümceler arasındaki haritalamadan yararlanarak 'yeterince iyi' sonuçlar elde edilebiliyor. Bu haritama neredeyse tama men veride bulunduğundan tümevarımlı stratejiler işe yarı yor. Sistemin metni anlaması gerekmiyor. Sözgelimi, Kanada parlamentosunun resmi tutanakları İngilizceden Fransızcaya sözcüğü sözcüğüne çevrilir. Bu gibi durumlarda diller arasında haritalamayı 'öğrenmek' için derin öğrenme yaklaşımları yeterli oluyor; ne lngilizceyi ne Fransızcayı gerçekten anlamak gerekiyor. Örneğin Google Çeviri'den "John met Mary at the cafe . " [ "John Mary'yle kafede tanıştı. " ] tümcesinin Fransızca çevirisini yapmasını isterseniz "John a rencontre Mary au cafe. " [ "John Mary'le kafede karşılaştı. " ] sonucunu alırsınız. Bu kabul edilebilir bir çeviridir. Fakat sistem diğer örneklerde çuvallıyor. Bu
ÇIKARIM VE DIL - 1
başarısızlık genellikle bir belirsizlikten kaynaklanıyor, örne ğin adıllar vesilesiyle gönderim olgusu işe karıştığında veya tümcede anlamı bağlamdan çıkarılması gereken çokanlamlı sözcükler söz konusu olduğunda bu durumla karşılaşılabi liyor. ( Google Çeviri'de belirsizlik barındıran tümcelerle bir deneme yapmak isterseniz şu tümceleri [Türkçeye] çevirtme yi deneyebilirsiniz: "The box is in the pen. " veya "I loved the river. I walked to the bank. " ) 12 Kafa karıştırıcı biçimde, 1 960'larda tam otomatik, yüksek nitelikli makine çevirisi hakkında yürütülen çalışmalar, basit de olsa istatistiksel yöntemlerle yola çıkmıştı. Bu yöntemler fazla işe yaramayınca Yehoshua Bar-Hillel gibi kısa süre son ra bu yaklaşımı terk edecek araştırmacılar, otomatik çevirinin başarı şansı olmadığı, yüksek nitelikli, tam otomatik çevirinin hem bilgi hem de anlama gerektirdiği sonucuna vardılar ki bu sonuç daha sonraları Winograd ve Levesque'in bilgi te melli şemalarının da esin kaynağı olacaktı. Fakat Bar-Hillel o sıralar bu sonuca varırken sadece birkaç on yıl içinde büyük verinin bu alana yapacağı katkıyı öngörememişti. İstatistiksel yaklaşımlar 1 9 8 0'lerde IBM'in araştırmacı larının çalışmalarıyla umut vaat etmeye başladı. Daha son raları Google gibi devler de istatistiksel yöntemleri kullanan eli yüzü düzgün çeviri hizmetleri sunmaya başladılar. Yani tam otomatik, yüksek nitelikli makine çevirisi dönüp dola şıp başladığı noktaya geri dönmüş oluyordu. Yine de Bar-Hillel'in esas kuşku duyduğu şey bugün bile geçerli: Bilgi ve bağlam gerektiren çeviriler hala birer kara kutu. Büyük veriye veya başka bir modern yaklaşıma başvu rulması da bu durumu değiştirmiyor. Örneğin -ki bu ironik bir örnektir- Google Çeviri, 2020 yılının ekim ayı itibarıyla bile Bar-Hillel'in ta 1 960'larda sunduğu basit tümceyi ha talı çeviriyordu. Bar-Hillel, bilgisayarları "The box is in the 12
Türkçeden lngilizceye ve lngilizceden Türkçeye makine çevirilerinde belirsizlik so runu şu örneklerde daha iyi görülebilir: "Üstünü yüzdük, 'Ya altı ?' diye sordu." veya " Ona burnu geçince ulaştık, dokuzu boğazdaydı. Yemedik mayın." (Çev. )
YAPAY ZEKA M iTi
pen . " tümcesini doğru çevirecek şekilde nasıl programlaya bileceğimizi sormuştu. Bu tümcede İngilizce 'pen' sözcüğü nün anlamı belirsizdir. Çünkü bu sözcük hem tükenmezka lem hem de ağıl anlamına gelir. Google Çeviri bu tümceyi Fransızcaya " La boite est dans le stylo. " [ "Kutu kalemin içindedir. " ] şeklinde çeviriyor ve 'stylo' sözcüğü tükenmez kalem anlamına geliyor. Buysa tercih edilen yorum değil çünkü kutular genellikle kalemlerden büyüktür. Başka bir deyişle, neyin 'yeterince iyi' çeviri olduğu da ihtiyaca göre değişiklik gösteriyor. Nitekim Google Çeviri, bağlamdan nispeten bağımsız tümceleri çoğu zaman doğru çevirebili yor ama illa hatalar da oluyor ve bu hataların önemli olup olmadığını çeviri hizmetini kullananın ihtiyaçları belirliyor. Aslına bakılırsa Google Çeviri gibi hizmetler, istatistiksel ya da tümevarımlı yaklaşımların mustarip olduğu, olasılığı düşük örneklerde ve yorumlarda daha da kötüleşen uzun kuyruk sorununu vurguluyorlar. Bu da olasılığı hesaplama nın hakiki bir anlamayla aynı şey olmadığını söylemenin bir başka yoludur. Nitekim bunlar aslında aynı kavram uzayın da bile yer almıyorlar. Yine burada da sıklık varsayımı, ya pay genel zekaya ulaşmamızı engelleyen gerçek kısıtlamaları temsil ediyor. Modern yapay zekanın ulaştığı 'yeterince iyi' sonuçlar da aslında okuma veya sohbet sırasında anlamaya duyulan ihtiyacı perdeleyen bir tür hileden, bir numaradan ibaret. Görüntü tanıma görevlerinde sistemlerin belirli görüntüleri hatalı sınıflandırmasına göz yumulabilir (gerçi bu bir sürü cüsüz sürüş sistemiyse buna göz yumulamaz) . Fakat şemalar gibi dil sınavlarında %20'lik bir hata oranı (yani % 8 0 isa betlilik), makinenin her on sorudan ikisini çözemediği anla mına geliyor. Winograd şemalarında bu isabetlilik oranı çok daha düşük, hatta rastgele tahminle neredeyse aynı seviye dedir. Şema sorularının da açıkça gösterdiği üzere, insan ların anlamakta hiç zorlanmadığı basit tümcelerde yapılan hatalar daha da affedilmez oluyor.
ÇIKARIM VE DIL - 1
Burada asıl mesele, isabetliliğin ta kendisinin bağlamsal olması ve anlama eksikliğini gözler önüne seren sınavlarda on sorudan altısını doğru yanıtlamanın (son teknoloji yapay zeka sistemlerinde durum budur) bu alanda bir ilerleme an lamına gelmemesidir. Bilakis bu durum, örtük bir zeka geri liğinin belirtisidir diyebiliriz. Bilimkurgu-gerilim filmi Bıçak Sırtı'ndaki androidlerin başına geldiği gibi, zihni (veya ger çek duyguyu) saptamayı amaçlayan bir test, insanları kan dırmak üzere programlanmış makinelerin maskesini eninde sonunda düşürecektir. Winograd şemaları ise bu kadar kar maşık bile değildir, son derece kısa ve basittir. Sadece bir soru sorarlar ve bu soru, sorulan şeye dair temel bilgilerden fazlasını gerektirmez. Levesque'in 'adılın belirsizliğini giderme sorunu', oto matik sistemlerin sıradan sohbetlerde kabul edilebilir bir performans sergileyebilmesi için bile geçilmesi gereken çok geniş bir mayın tarlasında atılmış hayli basitleştirilmiş bir adıma karşılık geliyor. Adıl gönderimlerinin çözümlenmesi, gerçek manada bir dili anlama kabiliyetinden söz edebilmek için çözüme kavuşturulması gereken, bilgi temelli sayısız so rundan sadece biridir. Ayrıca Winograd şemaları başka ba kımlardan muazzam basitleştirmeler de barındırmaktadır: Her şema tek bir tümceyle sınırlanmış olmanın yanı sıra bu sınavlar sohbet gibi karşılıklı konuşmalarda karşımıza çıkan edimbilimsel olguların çoğunu göz ardı etmektedir. Edim bilim alanı bir otomat için cehennemden farksızdır. Neden böyle olduğunu görmek için şimdi doğal dili işleme ve doğal dili anlama alanlarında bir geziye çıkacağız.
265
ÇIKARIM VE DİL
-
2
oğal dil karmaşık bir olgudur. Simgelerden, harflerden, noktalama işaretlerinden oluşur ve bunlar sözcükleri oluşturur: s-ö-z-c-ü-k-1-e-r. Sözcükler anlamlı dil ögeleridir. Jilet gibi cisimlere, hoş gibi hislere, kötü gibi ahlaki yargı lara veya parti yahut seçim gibi olaylara ya da durumlara, ekonomi ya da çiftlik gibi soyut derlemelere, kısacası her şeye gönderebilirler. Sözcükler anlam taşıdıklarından belir siz de olabilirler. Sözgelimi 'çiftlik' sözcüğü bir çiftliğin coğ rafi konumu, belirli bir işletme türü veya bir ailenin yaşadığı yer anlamına da gelebilir. Böyle basit bir sözcüğün tam ola rak ne anlama geldiği bile konuşanın onunla ne kast ettiğine bağlıdır, yani bağlamsal dır. Anlam bağlamı, dilin yorumlanma çerçevesini çevre söz cükleri, tümceleri, paragrafları, hatta bütün halde metinleri de içerecek şekilde genişletir. Dolayısıyla adıllar ve belirteç ler [indexicals] gibi dil ögelerinin neden olduğu belirsizlik lerin bir şekilde giderilmesi gerekir. Örneğin yer ve zaman bilgilerinin bu şekilde açığa kavuşturulması gerekebilir ('ka rarlaştırılan zamanda' gibi bir zarf tümlecinin geceyarısına gönderdiğini bağlamdan çıkarırız) . Son olarak dilbilimcile rin edimbilgisi dedikleri ve konuşanın amacı, ilgilendiği şey ler ve sairi içeren bağlam bulunur. lletişimin istihza, ironi
D
266
ÇIKARIM VE DiL - 2
ve benzeri veçheleri de işte bu bağlamda devreye girer. Dil harflerde ve sözcüklerde başlar, anlam ve zihne dair soru larda son bulur.
Dili Anlama Gazisi Dili anlama (örneğin bir tweet'in, bir blogun veya Savaş ve B a rış ın anlaşılması) baş aşağı duran bir piramide benzer. Sağlıklı beslenmenin adımlarını tasvir etmek için kullanılan eski besin piramidi görsellerini gözünüzün önüne getirin. İşte dili anlama piramidi de bu piramidin baş aşağı duran hali gibidir. Piramidin aşağıdaki sivri ucundan yukarıdaki geniş tabanına doğru gidildikçe daha fazla anlamla karşıla şılır ve bu da dili bilişimin hesaplayıcı yöntemleriyle ele alan yaklaşımları her basamakta biraz daha zorlar. Aşağıda, yani piramidin sivri ucunda, bir araya gelerek sözcükleri oluştur mamıza izin veren harflerden ve noktalama işaretlerinden oluşan yazım bilgisi bulunur. Ardından, sözcükleri, bunla rın alabileceği ön ve son ekleri ve sözcük türleri gibi ögeler ile kuralları barındıran sözlük bilgisi ve biçim bilgisi gelir. Tümce kurabilmek için bu sözcükleri örneğin bir isim ve onu niteleyen bir sıfattan oluşan 'vahşi aslan' tamlamasında olduğu gibi deyimler haline getirerek birbiriyle ilişki içine sokmamız gerekir. Bir sonraki adımdaysa bir eylem belir leriz, örneğin "Vahşi aslan yedi . " gibi. Eğer bu eylem (ve fiil) geçişliyse ona bir nesne de eklememiz gerekir: " Vahşi aslan eti yedi . " Tümceler bir araya gelip bir konuyu anla tan paragrafları oluştururlar. Paragraflarsa bir araya gelip hikayeyi veya anlatıyı teşkil ederler. Bir veya daha fazla pa ragraftan oluşan bir hikayeye ise söylem veya metin denir. Kitaplar büyük metinlerin bir örneğidir. Bunlar da bir araya gelerek kurgu veya kurgudışı gibi yazın türlerini oluşturur. Bir sohbetin dökümü de metindir. Dolayısıyla Turing Tes ti, bu baş aşağı piramidin tabanında, dilin kapsamı tam bir '
YAPAY ZEKA MiTi
söyleşiyi kapsayacak, bir sohbet metni haline gelecek kadar genişlediği yerde bulunur. Dilin bu baş aşağı piramidini tamamen sözdizimine göre ele almak da bir anlamda mümkündür. Başka bir deyişle dili belirli kurallara göre harflerden sözcükler, sözcükler den tümceler, tümcelerden paragraflar oluşturularak inşa edilmiş bir metin olarak görmek mümkündür. Sözdizimi bir bilgisayar tarafından işlenip çözümlenebilir. Gelgelelim dilin piramidi ikili bir hayat sürer çünkü sözdiziminin yanı sıra anlamları da barındırır. Doğal diller anlamları anlat mak ve aktarmak için simgeler ve kurallar kullanır ve eğer dili kullanarak anlamlı/kullanışlı bir şey söylemek istiyorsak bunları da hesaba katmamız şarttır. Dil, anlamlara yapılan yolculuktur. Bir çocuk kitabı da bir Rus romanı da okuru bu yolculuğa çıkarır. Hepsi anlamın dışavurumudur. Dilbilim ve onunla bağlantılı diğer disiplinlerde anlam bilim, şeylerin anlamının incelendiği alan olarak karşımıza çıkar. Çoktan seçmeli Winograd şeması testlerinde soruların yanıtlanabilmesi için kabaca gerekli olan da anlam çözüm lemesidir. Bu iş için sadece sözdizimi kuralları veya simgeler hakkında malumat sahibi olmak yetmez, bilgi ve inanç da gereklidir. Bu bilgiyi bağlama uygulayabilmek içinse çıkarı ma ihtiyaç vardır. Diyelim ki timsahların engelli koşuların da yarışabileceğine inanıyorum: Bu durumda bir timsahın kısacık bacaklarıyla o engellerin üstünden nasıl atlayacağını açıklamam ve bunun için de timsahların anatomisine dair bir şeyler bilmem gerekir. (Aslına bakarsanız insanlar için böyle bir açıklamaya pek gerek yok çünkü beş yaşındaki herhangi bir çocuğa bile bir timsah resmi gösterdiğinizde durumu hemen anlayacaktır. ) Demek ki sorunun yanıtı söz diziminde değil, anlam bilimde saklıdır. Başka bir deyişle Winograd şemaları dilin sözdizimi pira midinin yerine anlambilim piramidini geçiriyor. Bu piramitte sözcüklerin anlamları var, yani sözcükler dünyadaki nesne lere gönderiyor. Ne var ki sözcükler bazen ancak metnin bü268
ÇIKARI M VE DIL - 2
tünlüğünde anlam kazanıyor. Üstelik metnin yorumlanması her zaman edimbilimsel unsurları da barındırıyor ki bu da sözcüklerin anlamını amaç ve niyetle ilgili çıkarımlarla des teklemeyi gerektiriyor. İki kişi arasında geçen bir konuşma, dilin anlaşılmasında edimbilimsel unsurların işe karışması nın bir örneğidir. Sözgelimi size " Tuzu uzatabilir misiniz? " diye sorduğumda bana " Evet" yanıtını verip hiçbir eylemde bulunmazsanız, bu, bağlamı -yani ne kast ettiğimi- kaçırdı ğınız anlamına gelir (ya da bana şaka yapıyorsunuzdur ki bu da düpedüz edimbilimsel bir unsurdur) . Edimbilim açısın dan baktığımızda söylenenin anlamı, nasıl söylendiğine ve niçin söylendiğine sıkı sıkıya bağlıdır. 1 İnsanların söyledik leriyle kast ettikleri, neredeyse hiçbir zaman sözcüğü sözcü ğüne söylediklerinden çıkmaz. İşte sıradan konuşmanın bu özelliği dilbilimde edimbilim başlığı altında inceleniyor ve dili insanlar için anlamlı ve ilgi çekici -ve genellikle kolay ve doğal- hale getirirken, yapay zeka tarafından yorumlanması çok güç bir olguya dönüştürüyor. Sözdizimi bize lazım, bu konuda kuşku yok . Diyelim ki İngilizceden Çinceye geçtik. Bu durumda Latin harflerin den piktogramlara da geçiyoruz demektir. Eğer hiç kimse Çince konuşmuyor veya okumuyorsa tüm iletişim kurma çabalarımız boşa gidecektir. Bununla birlikte, mantıkçıla rın ağzıyla konuşacak olursak, sözdiziminin bilgisi gerekli dir ama yetersizdir. Bu bilginin yanında dünyanın bilgisi de gereklidir. Sözgelimi size, strafordan bir tokmakla birinin kafasına vurduklarını söylediğimde, strafor hakkında ne bildiğiniz önemli olacaktır çünkü size verdiğim bu haber ' Edimbilim çözümlemesi Büyük Teknoloji'nin adeta Kutsal Kase'sidir. Google, Meksika'daki Mazatlan'a ucuz uçuş bileti ilanlarını, hatta belki de aralık ayında Seattle'dan bir web sayfasındaki " Burada hava harika ! " yorumunun yanında ucuz şemsiye reklamları sunmayı ( muhtemelen o sırada Seattle'da yağmur vardır ve soğuktur) çok isterdi. Maalesef bunun yerine bu yorumun yanına muhtemelen 50 güneş koruma faktörlü güneş kremi ve şemsiyeli içecek reklamı yerleştirecektir. Alaycı ifadeleri belirlemek insanlar için -genellikle kolayken mevcut yapay zeka sistemlerinin kabiliyetlerinin çok ötesinde kalıyor.
YAPAY ZEKA M İTİ
hakkında ne düşüneceğinizi, ne tepki vereceğinizi belirle yen de dünyaya ilişkin bu bilgidir: Alaycı bir tavırla bana " Yapma yahu, vah vah ! " diyerek yanıt verebilirsiniz. Oysa straforun sağlam, katı bir madde olduğunu varsayan bir yapay zeka sistemi böyle bir tepki vermek yerine meseleyi ciddiye alıp " Şimdi durumu nasıl, iyi mi ? " diye pekala so rabilir. En basit karşılıklı konuşma bile genellikle gerçek bilgiyi ve anlambilimi ( ve edimbilimi) devreye sokan bağ lamsal çıkarımları gerektirir. Turing yapay zekanın geleceğiyle ilgili olasılıkları ele aldığı yazısında bu noktayı anlamıştı. Nitekim kendi ver diği örnekte bir soruşturmacı (insan) ile tanığı ( bilgisayar) arasında geçen bir söyleşide, soruşturmacı tanıktan bir sone yazmasını istiyor, tanık da bunun üzerine Shakespeare'in 1 8 . sonesini yeniden üretiyordu. O söyleşi şu: Soruşturmacı: Sonenizin ilk dizesinde "Seni bir yaz gününe benzetmek mi, ne gezer? " demişsiniz. 'Bahar gününe' dese niz olmaz mı? Belki daha da iyi olur. Tanık: Ö lçüye uymazdı. Soruşturmacı: 'Kış gününe' dense hece ölçüsüne uyardı. Tanık: Evet ama kimse kış gününe benzetilmek istemez. Soruşturmacı: Bay Pickwick size Noel'i hatırlatıyor mu? Tanık: Bir anlamda öyle. Soruşturmacı: Ama Noel bir kış günü, bence Bay Pickwick böyle bir kıyaslamadan rahatsız olmazdı. Tanık: Ciddi olamazsınız. Kış günü dediğinizde bu bildik bir kış günü olur, Noel gibi özel bir gün olmaz. 2
Soruşturmacının ilk sorusu bilgisayarın sone yazma bilgisini sınıyor. Bu bir uzmanlık bilgisi; dolayısıyla donanımlı insanları bile bu bilgiye sahip olmadıkları için mazur göre biliriz. Bu 14 dizelik sone, bir uzun, bir kısa vurgulu olmak üzere beşli hece ölçüsüne göre yazıldığı için, bilgisayar buA. M. Turing, " Compuring Machinery and Intelligence '' , Mind, 59. cilt, 236. sayı (Ekim 1 950), s. 446. 270
ÇIKARIM VE DIL - 2
rada soruşturmacıyı 'bahar' [spring] sözcüğünün vurgulanı şının sonenin hece ölçüsüne uymadığı konusunda uyarıyor. Gerçi 'kış gecesi' uyuyor, onu niye kullanmıyor ? Burada odak, sevgili ile kış günü arasında benzerlik kuran eğretile meye kayıyor. Tanık, soruşturmacının 'kış günü' önerisini dikkate bile almıyor. Kış günlerinin kısa ve soğuk olduğunu, dolayısıyla sevdaya tutulan birinin böyle bir imgeyi tercih etmeyeceğini varsayabiliyoruz. Fakat işin aslı şu ki yazdan kışa geçiş her zaman o kadar da belirgin değildir. Nitekim kış günleri de hem karlı hem de güzel olabilir; pırıl pırıl bir güneş, ormanın huzur verici sükunetini ışıklarıyla aydınlata bilir. Her neyse, burada ana fikir, aşık olduğumuzda sevdi ğimiz kişiyi tarif etmek için bir mevsim seçmemiz gerekirse ılık, uzun ve güzel günlerinin hatırına yaz mevsimini seçme nin akla daha yatkın olacağıdır. Soruşturmacı bunun üzerine tanığa 'özel' bir kış günü olan Noel'i öneriyor. Bu öneri, bilgisayarın sonenin maksa dı veya amacı hakkında ne bildiğini sınıyor. Sonenin amacı bir kişi ile bir bayramı kıyaslamak değil, sevilen kişiyi güzel bir yaz gününde deneyimlediğimize benzer, sevilesi ve 'de ğişmez' bir şeyle kıyaslamak. Nitekim sevilen kişiyi Noel'le yahut 4 Temmuz'la kıyaslamak sonenin amacını tamamen boşa çıkaran fikirleri ve duyguları birbirine katmak olur. Tanık işte bu aptalca yanlış yönlendirmenin farkında oldu ğundan, soruşturmacıya " Ciddi olamazsınız" diyerek karşı lık veriyor. Başka bir deyişle burada sonenin maksadını anlamak de mek, bir aşığın derin duygularını anlamak, aşık olduğu kişi yi bir yaz gününe, yani güzel, uzun süren ve sevilesi bir şeye benzettiğini anlamak demektir. Gerçi şairimiz kendi aşkının daha güçlü olduğuna inanıyor ki bunu derin tutkusundan ve yazdığı sonenin ölümsüz eserler arasına girmiş olmasın dan anlıyoruz. Soruşturmacı ile tanık arasındaki sohbetin bilgi gerektirdiği kesin ama burada konuyla ilgili bilginin çoğu, insanlar -aşık insanlar ve aşkı sözcüklerle, duygular-
YAPAY ZEKA MiTi
la nasıl ifade ettiğimiz- hakkındadır. Dolayısıyla bu soneyi anlayabilmek için, maşuk hakkında konuşmanın nasıl bir şey olduğunu bilmek gerekiyor. Burada soruşturulan, zihin durumları ve duygulardır. Bu da en geniş anlamda bir edim bilim soruşturması demektir. Şiirin, yapısı gereği edimbilimsel olduğunu söyleyebili riz. Fakat şiir kadar coşkulu ve hisli olmayan düzyazı bile neredeyse her 'sıradan' tümcede edimbilimsel olguların giz lendiğini açık etmektedir. Bunlardan kaçınmanın bir yolu yoktur. Örneğin deiksis, bağlamın bilgisine başvurulmadan anlaşılamayan veya belirsizliği giderilemeyen 'ben', 'o' ya da 'burada' gibi adıllara ve sözcükler atıfta bulunur. Deiksis, 'gösterir' demektir ve dil, gösterir: " O dün gece burada bir serçe gördü. " tümcesinde ki 'o' adılı, serçeyi göreni gösterir (kişi gösterimi) ve dinleyici onun kim olduğunu ancak bağ lama bakarak anlayabilir. Keza 'burada' bağlama göre be lirli bir yeri (uzam gösterimi) , 'dün gece' ise bu yorumun ya pılmasından önceki geceyi gösterir (zaman gösterimi) . Hazır numaralara başvurmayan bir sistemin böyle bir sohbete ka tıldığında bunların hepsini tek tek takip etmesi gerekir. Deiksis, başımıza musallat olan sayısız sorundan sade ce biridir. Dil, niyetin yani maksadın daha derin biçimde anlaşılmasını gerektiren bağlamsal inceliklerle doludur. Size dün akşam Mozart çaldığımdan bahsedersem bu ifadeyi an lamlı hale gelecek şekilde kendiliğinden düzeltirsiniz, yani dün akşam, Mozart'ın bestelediği bir eseri çaldığımı düşü nürsünüz, yoksa Mozart adlı adamı 'çaldığımı' değil. Biz genellikle böyle düzeltmelerle uğraşmayız bile çünkü dilde edimbilimsel olgular olağan iletişimin ayrılmaz bir parça sıdır. Bu tür ifadelerde ne kast edildiğini çok sayıda örneğe bakarak değil, bu ifadelerin ne anlama geldiğini enine boyu na düşünerek çıkarırız. Dilbilimciler insanların genellikle söylediklerinden fazla sını kast ettiklerini bilirler, bunu biz de biliriz. Bu durum dilde farklı yollardan kendini gösterir. Örneğin konuşma-
ÇI KARIM VE DIL - 2
larımız genellikle eksiltilidir: Kimileyin adları, tümleçleri, fiilleri, diğer söz türlerini ve deyimleri tamamen dışarıda bı raktığımız olur: "AVM'ye ben dün gittim, Shana bugün. " Belirli kişilerin, yerlerin ve şeylerin bilgisine önceden sahip olduğumuz için bu bilgileri karşılıklı konuşmalarımızı kı saltmak ve daha doğal hale getirmek için kullanırız. Örne ğin " Kitabını ödünç verir misin ? " tümcesi bir kitabınızın olduğunu ve hangisini kast ettiğimi bildiğinizi varsayar. " Charles şiir yarışmasını kazanınca matematiği bıraktı " derseniz Charles'ı tanıdığınızı, Charles'ın matematik eği timi gördüğünü varsayarım. Dilin kısmen örtülü işlediğini söyleyebiliriz, yani konuştuğumuz konunun ayrıntılarını ve kabullerimizi hiç sayıp dökmeden, ne kast ettiğimizi an lamayı muhatabımızın kendi kabullerinden hareketle ya pacağı çıkarımlara bırakırız. Daha önce de değindiğimiz artgönderimler, önceki bir şeye gönderirler. Örneğin " Gemi Mayıs'ta limandan ayrıl dı. Roger da onun üzerindeydi. " ifadesinde 'onun' adılı ilk tümcenin öznesi olan gemiye gönderiyor. Artgönderim (ve kardeşi öngönderim) her zaman olmasa da genellikle 'o' ve 'onlar' gibi adıllardan müteşekkil yer tutucu sözcükler aracılığıyla dile dahil olur. Adıllar dilde epey yaygındır ve artgönderimler de genellikle her metinde her an karşımıza çıkar. Bunlar dilin hem kendini ve kendi dışına çıkıp dünya yı gösterebildiğinin örneklerinden sadece biridir. Artgönderimler anlamı aktarmak üzere diğer edimbilim sel çıkarımlarla da etkileşime girer. Örneğin " Dün akşamki etkinlikte sahne alan dörtlüye bayıldık. Her şeyiyle mükem meldi ! " ifadesinde ikinci tümcenin artgönderimli olması -dörtlüye göndermesi- gerekirken bu tümce edimbilimsel unsurların belli belirsiz etkisiyle meydana gelen bir anlam kayması sonucu akşamki etkinliğe göndermektedir. Artgön derim dilde gönderimin yaygın ama özel bir örneğidir. Dili bilgisayarlar üzerinde anlamaya çalışan çalışmalarda gön derimin yaygın bir örneğiyse bir söylemde veya metinde yer 27 3
alan iki farklı değininin ( bir şeye değinen sözcüklerin veya deyimlerin) dünyadaki aynı nesneye veya duruma atıfta bu lunduğu eşgönderim olgusudur. Nitekim yukarıda verdimiz örnekte 'gemi' ve 'onun' sözcükleri, mayıs ayında limandan ayrılacak gemiye eşgönderimde bulunuyor. İşte Winograd şemaları bilişime ve hesaplamalı yaklaşımlara özgü bu genel eşgönderim sorununu daima iki olanaklı öncel barındıran tek bir tümcede ifade edilebilecek şekilde basitleştirmekte dir. Adlardan yahut ad tamlamalarından oluşan bu iki ön celden sadece ve sadece biri adıla eşgönderimlidir: "Patates çuvalı, un çuvalının altına konduğu için önce onun kaldırılması gerekti. " Yukarıdaki tümceye göre neyin önce kaldırılması gerekmiş tir? a) Patates çuvalı b) Un çuvalı
Bu şema bir eşgönderim sorunu örneğidir. Çünkü 'onu' adılı, 'un çuvalı' ad tamlamasının gerçek dünyada gönderdi ği şeye gönderiyor (yani her ikisi de tümcede değinilen pata tes çuvalının üstünde duran bir un çuvalına gönderiyor) . Bu nunla birlikte şemalar gerçekten de işi epey basitleştiriyor. Birincisi, ucu açık gönderimi bertaraf ediyorlar: " O yılın son çeyreğinde ithalatta sert bir düşüş yaşanmaya başladı. Yılsonu geldiğinde tüm ekonomi darboğaza girmişti. " Bura da 'tüm ekonomi', tüm ekonomiye gönderiyor ve şemalarda karşımıza çıkanın aksine bunu metne bağlı kalmadan yapı yor. (Nitekim bu örnekte ithalat ile tüm ekonomi arasında örtük bir parça bütün ilişkisi, yani meronimi söz konusu dur.) Oysa Winograd şemaları, yorumlayıcıya, açıkça belir tilmiş iki seçenek sunuyor. Sohbetler, gazetelerin serbest kürsü köşelerinde yayımla nan yazılar ve dostlar arasında geçen mektuplaşmalar, karşı mıza çok daha karmaşık ve zorlu yorumlama görevleri çıka rıyor. Şemaların izin verdiği basitleştirme kısmen yapısal: Bu testlerde çoktan seçmeli sadece iki yanıt oluyor ve seçenekler
ÇIKARIM VE DIL - 2
bu şekilde sınırlı olduğunda doğru yanıtı rastgele tahmin et mek pek de kötü bir fikir olmayabiliyor çünkü bu durumda soruyu doğru yanıtlama oranı % 50 oluyor. Bu hiç fena bir oran değil, zerre zeka gerektirmemesi de cabası! Fakat insan lar Winograd şemalarında %95 ve üstü bir doğruluk oranı tuttururken, mevcut en iyi yapay zeka sistemleri bile daima ilk seçeneği tercih etmek gibi buldurucu [heuristic] bir stra tejiye bel bağlamaktan veya iki seçenek arasında tamamen rastgele bir tercihte bulunmaktan daha iyisini yapamıyor.3 Artgönderimler yorumlama için şart olan aşikar bilgi ve çıka rım koşullarından biridir. Bu sonuç özellikle yıkıcıdır çünkü aslında bu testlerde bundan başka 'numara' addedilebilecek hiçbir şey yoktur: Sorular eksiksiz şekilde ifade edilmiştir, se çeneklerse açıktır. Çoğu zaman bu sorular insanlara son de rece kolay -belki biraz da tuhaf- geliyor. Şimdi daha karmaşık bir dil sınavını, yukarıda bahset tiğimiz Turing Testi Monoloğu'nu ele alalım. Bu sınavda yapay zeka sisteminin bir öykü veya gazete haberi gibi bir monologdan bir kesit okuyup insan bir hakemin ona yönel teceği soruları yanıtlaması gerekiyor. Sınav için aşağıdaki öykünün kullanıldığını düşünelim: Bir adam işinden istifa ettikten sonra yeni bir şehre taşınmış. Yeni bir hayata başlamayı umuyormuş. Bir taşıtla bir ma ğazaya gitmiş. Çalışan indiriminin hala geçerli olup olma dığını görmek istiyormuş. Kasiyersiz kasaya gidince geçerli olmadığını anlamış. Kendi kendine " Bir daha buraya gelme yeceğim " demiş. Kulak misafiri olan bir kadın ona tuhaf bir
3
Google Brain [Google Beyin] ekibi, WSC-273 olarak bilinen zorlu bir Winograd şeması sınavında % 6 1 ,S'lik bir isabet kaydetmeyi başardı. Böylece, en son teknoloji ürünü bu sistem, rastgele tahminlerden % 1 O daha yüksek bir isabetlilik oranı elde etmiş oldu ki bu da meşru bir ilerlemeden ziyade bu sınavın veri güdümlü yöntemler kullanılarak çözülemeyeceğini gösteriyor. Ayrıca burada şuna da dikkat etmek gerek: Ekibin eğitim ve sınavın kendisi için kullanılan veri kümesine doğrudan erişimi vardı ve soruları kapsamlı şekilde çözümlediler. Başka bir deyişle bu sınav, makinenin yerinde bir insan olsaydı dili anlama kabiliyetini anında sergileyebileceği türden bir 'baskın' sınav değildi. 27 5
YAPAY ZEKA MiTi
bakış atmış. Tam çıkarken eşiyle burun buruna gelmiş, olan biteni ona anlatmış. Ona da aynı şeyi demiş: " Bir daha bu raya gelmeyeceğim! " Eşi ona gülümseyerek " Ya ben ? Bura eve yakın, hem ucuz da" demiş. Adam da başını sallayarak gülümseyip " Öyle olsun " demiş. Sonra ikisi parka gitmişler, adam kadını bir yaz gününe benzetmiş.
Öykü zorlama (ben uydurdum) ama okurların anlatılanı anlaması zor değil. Ayrıca bu öykü, doğru yorumlanabil mesi için gerektirdiği sağduyu bilgisi ve edimbilim anlayışı itibarıyla da öyle benzersiz bir zorluk barındırmıyor. Deri nükur adlı yeni bir yapay zeka sistemimiz var diyelim. Bu sistem büyük veriyi ve mevcut en iyi makine öğrenimi yak laşımını kullanıyor. Ultra++ adlı çok ilgi çeken yeni bir tek noloji şirketinin (ki Google bu şirketi kesin satın alacaktır) Derinükur'un tanıtım sürümünü yayımladığını varsayalım ve insan hakemin, Derinükur'a bazı basit sorular sorduğu nu düşünelim: 1 . Adam yeni şehre yürüyerek mi gitti ? 2 . Adam neden yeni bir hayata başlamayı umuyordu ? 3 . Adam öldü mü ? 4.
Adam bir arabayla mı, golf arabasıyla mı yoksa bir oto büsle mi gitmiş ?
5.
Adam o mağazada mı yoksa aynı şirketin sahip olduğu bir başka mağazada mı çalışıyordu ?
6. Adamın çalışan indirimi hala geçerli miydi ? 7.
Adam kendi kendine bir daha mağazaya mı gelmeye ceğim dedi ? Yoksa şehre mi ? Yoksa kasiyersiz kasanın önündeki yere mi ?
8.
Kendi kendine konuşmasına kulak kabartan kadın,
onun eşi miydi ? 9. Adam eşiyle burun buruna geldiğinde ona demek istedi ?
1 0. Eşi "Ya ben ? " diyerek ne kast etti ? 1 1 . Mağaza, evlerinin yanında mıydı ? 1 2 . Adam eşini seviyor muydu? 1 3 . Sonuçta adam yeni bir yaşama başlamış olabilir mi ?
ÇIKARIM VE DIL - 2
Derinükur'un bu sorulara yanıt verebilmesi için dil pira midinde anlambilim ve edimbilimle ilgili bazı zorlu sorun ları çözebilmesi gerekiyor. Oysa bunlar [anlambilimsel ve edimbilimsel ögeler] veri odaklı bir yapay zekanın ihtiyaç duyduğu manada tamamen veri içinde bulunmuyor. Yeni bir şehre taşınmakla ilgili bir sağduyu bilgisiyle işe başlayalım. Böyle bir girişim genellikle eşyaları paketleyip taşınılan şehre araba veya uçakla gitmeyi içerir. 2. soruyu kesinkes yanıtlamaksa mümkün değil ama insan okurların çoğu, bağlamdan hareketle, adamın yeni bir hayata başla masının kısa süre önce işten ayrılmasıyla bağlantılı olduğu nu varsayacaktır (gerçi daha az maceracı okurların bu soru ya " Hiçbir fikrim yok" yanıtını vermeleri de makuldür) . 3 . soru 'yeni bir hayata başlamak' deyiminin önce ölmeyi ge rektirmediğini anlamayı gerektiriyor. 4. soru ise bir sezdirim örneği; yani tümcenin veya deyimin doğrudan söylemeyip ima etmekle yetindiği şeyi anlamayı gerektiriyor: Adamın bir araba kullandığını varsayıyoruz. Gerçi metinde 'taşıt' dendiği için taşındığı şehre pekala golf arabasıyla da gitmiş olabilir, mantıksal açıdan bunda bir sorun yok. Kalan so rularda ise Derinükur'un kendi artalan bilgilerine başvura rak, adamın geçmişte çalışan inidirminden yararlandığını, dolayısıyla muhtemelen öyküde anılan mağazanın sahibi olan şirket için ( ama farklı bir yerde, muhtemelen ayrıldı ğı şehirde) çalıştığını fark etmesi; 'kendi' adılını çözümleyip onu adamın çalışan indirimine bağlaması ( artgönderimi çö zümlemesi); konum gösterimini anlayıp 'buraya'nın mağaza anlamına geldiğini ( şehir veya kasiyersiz kasanın sırası an lamına gelmediğini) anlaması; 'kadın' sözcüğünün eşi anla mına gelmediğini anlaması ( bu da bir başka sezdirim); ada mın eşine yalnızca mağazaya bir daha gelmemeyi değil, eski şirketine duyduğu öfkeyi aktardığını anlaması da gerekiyor. Böylece zorlu dil sorunları büyüyor da büyüyor. Eşinin adama "Ya ben ? " demesi de aslında eksiltili bir ifade, yani tam bir tümce oluşturmuyor ama anlamlı. Bu ek-
YAPAY ZEKA MiTİ
siltili ifade, konuşan ve dinleyenin ortak bilgisine dayandığı için kısa. Derinükur'un, adamın eşinin mağazaya tekrar ge leceğini de anlaması gerekiyor çünkü metinde bu açıkça ifade edilmiyor. Başka artgönderimler de var: Derinükur adamın eşinin söylediği "Bura eve yakın, hem ucuz da " tümcesinde 'bura' sözcüğünün mağaza anlamına geldiğini ve bu mağaza hem yakın hem de ucuz olduğundan kadının buradan alışve riş yapacağını da anlamalıdır. Ayrıca bu mağazanın çiftin yeni evlerinin yakınında olmadığını da anlamalıdır çünkü adam buraya bir taşıtla gelmiş. Son olarak, adamın gülümsemesinin öfkesini boşaltmasının bir göstergesi olduğunu, adamın daha sonra eşiyle parka gidip onu bir yaz gününe benzetmesinin de bunun bir diğer göstergesi olduğunu anlamalıdır. DerinO kur bütün bunlardan hareketle adamın eşini sevdiğini, onun görüşlerine saygı duyduğunu (muhtemelen çıkışta eşiyle bu run buruna geldiğine mutlu olmuştur) ve eşini bir yaz günü ne benzetmesinin mutluluk ve değer verme ifadesi olduğunu çıkarsa ya bilmelidir. Acı gerçek şu ki bu sonuçlara varabilmek için gereken tüm bilgiyi ve çıkarımları işe karıştırmadım bile. Derinükur aynı tümcede adamın bir taşıta binip mağazanın bulunduğu yere gitmekle kalmadığını, alışveriş yapmak için mağazaya girdiğini de anlamalıdır ki bu aslında tümcede açıkça dile getirilmiyor, sadece ima ediliyor. Bütün sorunları sıralama ya kalksak herhalde buradan köye yol olur. Dürüst olmak gerekirse, şu anda var olan veya bugünden öngörülebilen hiçbir yapay zeka sistemi yukarıdaki soruları yanıtlayamaz. Üstelik biz burada sadece son derece basit bir öyküyü kulla nan bir Turing Testi Monoloğu'nu ele alıyoruz. Derinükur diye bir sistem gerçekte yok. Zihin, dilin enginliğine açılıp karşısına çıkan parçaları birleştirerek ne olup bittiğine ve neden olup bittiğine dair bütünlüklü bir resim oluşturuyor. Dil piramidi her basamakta dünyanın derin ve anlamlı bir tablosunu oluşturmayı gerektiren zorlu sorunlara doğru bi raz daha genişliyor. Konuşanın (ya da yazanın) zihnine gire-
ÇIKARIM VE DIL - 2
bilmek de bu zorluğun bir parçasını oluşturuyor. Bu da bizi edimbilime ve dostumuz Goostman'a geri götürüyor.
Grice•ın Karşılıklı Konuşma İlkeleri Eugene Goostman'ı tasarlayanların edimbilimi bir araç ya da silah olarak kullandıkları söylenebilir. Nitekim bu soh bet botunun kodu, aşırı alaycılıkla, sürekli aldatmacalarla, bol bol yanlış yönlendirmelerle edimbilimin dili anlamayı altüst eden bir alanından yararlanıyor: Başka bir deyişle ha kemlerin, 13 yaşında Ukraynalı oğlanların soruları bazen bilmediklerinden değil umursamadıklarından yanıtlamaya tenezzül etmedikleri şeklindeki ortak anlayışını istismar edi yor. Dilbilimciler Goostman'ın ' Grice'ın tlkeleri' diye bilinen karşılıklı konuşma ilkelerini fütursuzca ihlal ettiğini hemen fark edeceklerdir.4 20. yüzyılın ilk yarısında, dil felsefecisi Paul Grice, karşılıklı konuşmanın başarılı olması için uyul ması gereken dört ilke önermişti:5 1. Nicelik : Olabildiğince, gerektiğince bilgi verip, gereksiz bilgiden kaçının. 2. Nitelik: Dürüst olmaya çalışıp yanlış yahut kanıtlara da yanmayan bilgi vermeyin. 3 . Bağıntı: Konuşmayla alakalı şeyler söyleyip bağıntıyı ko rumaya çalışın. 4. Tarz: Olabildiğince açık, öz ve derli toplu konuşup belir sizlikten ve çok anlamlılıktan kaçının. 4
Paul Grice, Studies in the Way of Words, Cambridge, MA: Ha rvard University Press, 1 9 9 1 . Grice'ın Karşılıklı Konuşma llkeleri'nin şu kaynaktaki çevirilerinden yararla nılmıştır: Neslihan Kansu-Yetkiner, "Tablo 1 . 1 Grice'ın Karşılıklı Konuşma llkeleri ", Çeviribilim Edimbilim Üzerine, İzmir: İzmir Ekonomi Üniversitesi Yayınları, 2009, s. 1 8 . Prof. Dr. Neslihan Kansu-Yetkiner'in kitabı, bu kitapta yer alan çeviri ve edimbilim sorunları hakkında temelleri edinmek ve Türkçeye dair örnekler açısından çok verimli bir kaynak sunuyor. ( Çev . ) 2 79
YAPAY ZEKA MiTi
Eugene Goostman tekrar tekrar aynı suçu işliyor çünkü Grice'ın tüm ilkelerini ihlal ediyor. Böyle yaparak, onun sı radan anlama ve temel konuşma becerisine ve yeteneğine sahip olup olmadığını sınamaya çalışan talihsiz insan ha kemlerin elinden kaçmayı başarıyor. Aklı başında insanlar genellikle kendi dillerinin ikinci dil olarak öğrenilmesinden veya gençliğin verdiği küstahlıktan dolayı bu ilkelere tam olarak uyulmadığında bile, muhatapları bilgilendirici, içten, konudan sapmadan ve açık konuşmaya gayret ettiği sürece uyumlu davranırlar. Goostman öyle değil, tasarımı gereği ilkeleri ihlal ediyor. Fakat günlük konuşmalar sırasında Grice'ın ilkelerinin ihlal edilmesi, sıradan dinleyicilere bir şeylerin 'yanlış' ol duğunu hissettirir. Nitekim bir kafede otururken biri yanı nıza gelip "Adım Brian Johnson, bana saati söyler misiniz ? " dediğinde bu istek anlaşılır olsa da bize tuhaf gelecektir. Grice'ın ilkeleri işte bunun nedenini açıklıyor: Bu istek, nice lik ve bağıntı ilkelerini ihlal edip saati öğrenmekle hiç ilgisi olmayan fazladan bir bilgi verdiği için muhatabın kafasını karıştırıyor. ( " Durup dururken ne demeye adını söyledi ki ? " diye merak ediyoruz. "Acaba saati sormak için kendini ta nıtması gerektiğini mi düşünüyor? " ) Goostman'a geri dönelim: Süre sınırı bulunan, muntazam ve dünyanın izlediği bir sınavda Grice'ın ilkelerini sistematik olarak ihlal etmek olacak iş değildir, hele ki bu sınavın asıl amacının sıradan sohbeti kullanarak yapay zekayı tespit et mek olduğu düşünülecek olursa bu düpedüz aptalcadır. Yine de yarışmada bu taktikler işe yaradı. Oysa işe yaramamalıydı. Bu duruma tepki olarak dile getirilen, Turing Testi'nden ar tık kurtulmamız gerektiği şeklindeki demeçler de aynı ölçüde gereksiz ve aptalcadır. Goostman'dan kurtulmak için elimiz de iki seçenek var, dilediğiniz birini seçin: Winograd şemaları gibi basitleştirilmiş çoktan seçmeli testleri kullanılabiliriz ya da karşılıklı konuşma (veya monolog) testlerinin açıklarını kapatıp, kaçınma tekniklerine başvuran sistemleri ve onları 280
ÇIKARIM VE DIL - 2
tasarlayan ekibi yarışmalardan men etmek gibi ağır cezalar uygulayabiliriz. Başka bir deyişle, hileleri bertaraf etmek ko lay; zor olan, anlama kabiliyetine ulaşmak.
Yeterince İyinin Yeterince İyi Olmadığı Zamanlar Veri güdümlü modern yapay zeka yaklaşımlarının Winog rad şeması testlerinde sergiledikleri kötü performans, bu yaklaşımların bir başka büyük kusurunu daha gözler önüne seriyor. Levesque " En İyi Davranışımız Üzerine " adlı maka lesinin " istatistiğin Cazibesi" başlıklı bölümünde 'veri simü lasyonu' yaklaşımını, X 'zeki davranışın sayısız örneklerin den biri' olmak üzere, X'i gerçekten yapmak yerine 'X'i belli belirsiz andıran' bir şey yapmaya çalışmak olarak betimliyor ve bunun 'yapay zeka biliminin kuşatıcı sorusu' olduğunda ısrar ediyordu.6 Oysa Levesque bu eleştirisini bir adım daha ileri götürebilirdi. Nitekim 'X'i belli belirsiz andıran' bir şey yapmak, yani bazı X görevlerinde zekayı simüle etmek, istis nasız olarak, gerçek anlama kabiliyeti gerektiren zor soru ları henüz çözülmemiş soruların topraklarına sürmek, hala üstesinden gelinememiş küçük bir yüzdelik dilime ( başka bir deyişle dilin anlam piramidinin tepesine) sıkıştırmak anla mına gelir. Bu topraklar, bu yüzdelik dilim, zamanla, gerçek anlamayı gerektiren sorunların saklandığı bir sığınağa dö nüşüyor. Bu da genel bir kafa karışıklığı yaratıyor. Görünüşte etkileyici performanslara tanık olan halk ise makine ile insan arasında henüz kapanmamış boşlukların, bilişim ve çözümleme teknikleri güçlenip -ve erişilebilir veri miktarı artıp- geleceğin yapay zeka sistemleri daha iyi per formans sergileyecek şekilde ölçeklenebildiğinde kendiliğin den kapanacağı sorucuna varıyor. Bu elbette anlaşılabilir bir durum. Fakat bu alanda bugün çözümsüz görünen sorunla6
Levesque, "On Our Best Behavior " , s. 1 . 28 1
YAPAY ZEKA MiTİ
rın gelecekte mutlaka çözüleceğine duyulan mesnetsiz güven, sorunların ve bu sorunların çözümlerinin tablodaki gerçek dağılımını, yani kolay çözülebilen sorunların veri güdümlü simülasyonlarda çok sık karşımıza çıktığını, buna karşın na dir görülen, çözümü daha güç sorunların sıklık çözümleme lerinin eriminin tamamen dışında kaldığını göz ardı ediyor. Bu da çözülmesi daha güç sorunların -henüz bulunamayan yanıtların- daha fazla veri değil baştan aşağı farklı bir yak laşım gerektirdiği anlamına geliyor. Önceki sayfalarda da belirttiğim üzere, gerek duyulan bu yeni yaklaşımın tümden gelimli veya tümevarımlı olmayan bir çıkarım çerçevesini en baştan varsaydığını savunuyorum. Aslına bakılırsa Derinü kur eğer savavarıma dayalı güvenilir çıkarımlarda bulunma yı başarabilseydi, yukarıda ele aldığımız öyküde eksik kalan veya örtük olarak varsayılan bilgiler ve olaylar hakkında isabetli kestirimlerde bulunabilirdi. Bunları tümdengelimle çıkaramaz (çünkü bunlar mantık soruları değildir) . Öykü nün sözdiziminden veya sunduğu verilerden çıkmadıkları için bunlara tümevarımla da ulaşamaz. Derinükur sistemi çıkarım konusunda ilerleme kaydedilmesini bekliyor çün kü düzgün işleyebilmesi için ihtiyaç duyduğu çıkarımlar ne yazık şu anki bilgimizle bilgisayarlara programlanamıyor. Dolayısıyla neye göre ölçekleyeceğimiz bile belli değil; bu iş için ihtiyaç duyulan çıkarım türü bize fersah fersah uzak ve gelecekte yapılacak bir kavramsal keşfi temsil ediyor. Bu bölümde Winograd şemalarına odaklandım çünkü bunların tümevarımlı olmayan çıkarımları gerektirdiği ayan beyan ortada ve bu şemalar insan zihninin basit, tek tüm celik bir sınavla herhangi bir failin anlama kabiliyeti olup olmadığını tespit etmesine izin veriyor. Basit tek bir soru dan ibaret böyle bir sınavın adil olmadığını ileri sürmek epey güç. Winograd şeması soruları kasten sıradan nesnele ri konu ediniyor. Dolayısıyla web sayfaları gibi metinlerde karşımıza çıkan adları veya tamlamaları (örneğin 'timsah' veya 'ödül kupası' ) da kapsıyor. Üstelik bu şemalar teknik
ÇIKARIM VE DIL - 2
bilgi de gerektirmiyor. Fakat tek bir soruda karşımıza iki ad veya tamlama çıktığında olası yanıtın veri içindeki sık lığı bir anda keskin biçimde düşüveriyor, hatta timsahların 1 00 metre engelli koşusu gibi bazı örneklerde sıfıra iniyor. Dolayısıyla örnekler son derece basit ve doğrudan olsa da hepsi büyük veri içinde görece nadir bulunuyor. İki adın veya tamlamanın (ödül kupası ile bavul sorusunda olduğu gibi) web'de aynı tümce içinde geçmeleri halindeyse iki ad arasındaki ilişkiyi basitçe değiştirmek bile sıklığın neredeyse sıfıra düşmesine neden oluyor ki bu da yukarıda gördüğü müz üzere, veri merkezli modern taktikleri etkisiz hale geti riyor. Winograd şeması soruları pratikte simüle edilemiyor. Bu durum, testi otomatikleştirmeye çalışan sistemlerin per formansının neden yerlerde süründüğünü açıklıyor.7 Buraya kadar betimlediğim çıkarım çerçevesinden ha reket edildiğinde tümdengelimli ve tümevarımlı sistemlerin yapay genel zekanın inşası için elverişli olmadığı sonucu çıkıyor. Ayrıca, bir çıkarım türünün diğerine neden indir genemeyeceğini de önceki sayfalarda izah ettim (verdiğim tasım örneklerini hatırlayın), yani savavarımı tümevarımın genişletilmiş bir örneği, bir türü olarak göremiyoruz çünkü bu durumda onu tamamen farklı bir simgesel -veya mantık sal- biçime dönüştürmemiz gerekiyor. Bu noktada şöyle bir soru sorulabilir: Tümdengelim ile tümevarımının savavarı ma denk bir bileşimini elde edemez miyiz? Edemeyiz çünkü 7
Winograd şeması sınavlarında yapay zeka sistemlerinin yanlış yanıtladıkla rı sorulardan bazıları bazen doğru yanıtladıkları sorulara çok benzeyebili yor ve o sorulardan daha zor görünmeyebiliyor. Bu da aslında sınavın kötü tertiplendiğinin bir işareti. Çünkü böyle bir durum hataları izah etmemizi imkansızlaştırıyor. Çünkü sistem her nasılsa bazı soruları doğru, bazı soru ları yanlış yanıtlamış oluyor ve bu durum sanki rastlantısalmış gibi görünü yor. Yani bize, sistemin soruyu anlayıp anlamadığına ilişkin en ufak bir ipucu vermiyor. Son zamanlarda modern yapay zeka sistemlerinin güvenilirliğinin tartışılmaya başlanması biraz da bununla bağlantılı: Daha neyin yanlış (veya doğru) gittiğini bile bilemezken bu sistemlere nasıl güvenebileceğimiz sorusu önümüzde duruyor. Üstelik veri güdümlü yapay zeka her yere sirayet ettikçe sorun daha da büyüyor.
YAPAY ZEKA M iTi
daha önce de belirttiğim üzere, bir çıkarım türünü diğerinin altına koymak mümkün değildir. Bunlar birbirinden ayrı ve temelden farklı kabiliyetlerdir. ( Şöyle sorarsak mesele daha anlaşılır hale gelecektir: Almanca ve İspanyolca biliyorum. Bunları bir araya getirirsem Rusçayı anlayabilir miyim ? ) Bununla birlikte, çıkarım türlerinin kimi durumlarda yapay zeka çalışmalarında birlikte kullanıldığını ve bunun çok il ginç sonuçlar doğurduğunu da burada belirtmek gerekiyor. Dil işleme gibi zorlu sorunlarla uğraşan araştırma ekip leri, genellikle, öndeyi ve çıkarımda bulunmak üzere özel olarak tasarlanmış mimarileri, veritabanlarını ve algorit maları kullanarak dev hibrit sistemler inşa ederler. Bu gibi sistemlerin bir bileşeni ya da alt sistemi her zaman makine öğrenimi olur. Ayrıca bu sistemler bilgi tabanlarından ve yapay zeka araştırmalarının klasik çağına ait çıkarım tek niklerinden de yararlanırlar. Bu hibrit sistemler son derece etkileyici sonuçlara ulaşabiliyorlar. Taraf tutmadan, eldeki tüm teknikleri, yöntemleri ve algoritmaları kullanarak, zor lu sorunları çözüme kavuşturabiliyorlar. işte bu sistemler den biri, baş döndürücü bir hızla değişen dünyamızda yapay zekanın yeni ilgi çekmeye başladığı bir dönemde medyayı ve halkı ayağa kaldırmıştı. Çünkü kendisine sorulan sorulara nasıl yanıt vermesi gerektiğini gerçekten anlıyor gibiydi. En azından ilk bakışta bu izlenimi uyandırıyordu.
Watson. Sevgili Watson Efsanevi teknoloji devi IBM şirketi, oyun oynayıp herkesin diline düşerek pazarlamayı kolaylaştıran yapay zeka sistem lerinin mühendisliğini iyi beceriyor. Nitekim 1 997 yılında Deep Blue sistemiyle manşetlere taşınmıştı: Satranç oynayan bu süperbilgisayar, o zamanların satranç şampiyonu Garry Kasparov'u televizyonda canlı yayınlanan ve herkesin heye canla izlediği bir etkinlikte yenmişti. Deep Blue'nun zaferi
ÇIKARIM VE DIL - 2
kamuoyunu hazırlıksız yakalamış, şaşkına çevirmıştı. Bu nun bir nedeni, makinelerin insanları satrançta yenebileceği eşiğin geçilmesine daha çok uzun yıllar var diye düşünül mesiydi. Kimi uzmanlar bu olay neticesinde süperbilgisa yarların gerçek zekaya kavuştuklarını ileri sürdüler. Turing Testi'yle ilgili tartışma da yeniden alevlenmişti. Medyadaki yorumcular, makinelerin bizi diğer tüm alanlarda da geç mesinin artık eli kulağında olduğunu düşünüp bu konudaki kaygılarını dile getiriyorlardı. Bugün geriye dönüp baktığımızda Deep Blue'nun gövde gösterisinin bize makine zekası hakkında neredeyse hiçbir şey söylemediğini görüyoruz. Herhalde bunun tek istisna sı, sonraki on yıllar içinde veri güdümlü birçok sistemin in sanları benzer oyunlarda yeneceğini önceden haber vermiş olmasıydı. Sonuçta satranç, kuralları tamamen belirli bir oyundur. Gary Kasparov'un bir dahi olduğundan kuşku yok ama Deep Blue onu aslında muazzam hesaplama gücüyle yenmişti: Kasparov' dan çok daha kısa sürede çok daha fazla hamleyi değerlendirerek, oyun ağacının daha derin dallarına uzanabildiği için onu alt edebilmişti. Yapay zeka tutkunları, kamuoyunun yapay zeka alanında kaydedilen her yeni başa rıyı, kopan ilk gürültünün ardından kısa bir süre içinde " Bu da gerçek yapay zeka değil " diyerek elinin tersiyle bir kena ra itmesinden on yıllardır şikayet ediyorlar. Bu açıdan Deep Blue'nun akıbeti de pek farklı olmadı diyebiliriz. Nitekim 2000'li yılların başına gelindiğinde Deep Blue büyük oranda unutulmuş, yapay zeka konusunda alınan bir dönemeç daha kamuoyunun ilgisini üzerinde tutmayı başaramamıştı. Belki insanlar içten içe, iyi satranç oynamanın genel zekanın be lirtisi olmadığını hissediyorlardır, kim bilir. Her halükarda . Deep Blue, IBM'in sağlam fonlara sahip mühendislerinin ve hızlı bilgisayarlarının gövde gösterisiydi. 200 1 yılında İnternet balonu patlayınca yapay zeka için duyulan heyecan da geçici bir süreliğine azaldı. Milyarlar ca dolarlık yatırım en temel gerçekleri bile görmekten aciz
YAPAY ZEKA M iTi
senaryolara v e vizyonlara yapıldığı için kısa sürede buhar laşmıştı. Yapay zeka, gelecek bilimin alanına giren, finans güvencesi olmayan bir hayal olarak görülmeye başlanmış tı. Yatırımcılar ve girişimciler o sıralar hala kendi yaralarını sarmakla meşgul oldukları için yeni bir maceraya atılmak is temiyorlardı. Fakat yapay zekanın bu kışı fazla uzun sürme yecekti. Google palazlanmış, 2004 yılı civarında neredeyse bugün bildiğimiz Google haline gelmişti. Sırada sosyal ağlar vardı. (Friendster gibi ilk sosyal ağlar başarısız olduysa da bu fikir çekiciliği hep koruyacaktı. ) Web 2.0 da yoldaydı. Tüm bu baş döndürücü gelişmelerin dümen suyunda, IBM'in yö netici takımı da olası bir halkla ilişkiler başarısının kokusunu almıştı. Satranç dünün haberiydi. Buna karşın web yeni şekil leniyor, barındırdığı engin olanaklarla herkesi heyecanlandı rıyordu. Oyunlar da hala ilgi görüyordu. Üstelik oyunların teknoloji şirketleri için fazladan bir faydası da vardı: Yapay zeka sağduyu konusunda tökezlese de genellikle oyunların yapay kısıtlamaları içerisinde hala etkileyici başarılara imza atabiliyordu. Şu şansa bakın ki bir oyun o günlerde haberlere sürekli konu olacak kadar revaçtaydı: Riziko. Televizyonda yayımlanan bilgi yarışması Riziko, basit leştirilmiş bir Turing Testi'nin oyunlaştırılmış hali gibiydi (en azından öyle görünüyordu) . Akla gelebilecek her konuda yarışmacıların bilgisini sınayan bu yarışmanın özelliği, kar şılıklı konuşmayı tersyüz etmesiydi: Yarışmacılara yanıtlar veriliyor ve onlardan bu yanıtları gerektiren doğru soruları sormaları bekleniyordu. Örneğin " IBM tarafından geliştiri lip satrançta Kasparov'u yenen süper bilgisayardır. " yanıtı için yarışmacıların sormaları gereken doğru soru "Deep Blue nedir ? " olmalıydı. 2004 yılında Riziko'nun izlenme oranla rı da tavan yapmıştı çünkü bu yarışmayı arka arkaya tam 74 kez kazanarak kırılması güç bir rekora imza atmış olan Ken Jennings, yarışmak üzere yeniden ekranlardaydı. IBM bu durumu fırsat bilerek kendi araştırma ekibine, Riziko'da Jennings'i ve diğer tüm şampiyonları yenebilecek bir yapay 286
ÇIKARIM VE DIL - 2
zeka geliştirme talimatı verdi. B u aslında araştırmacılar için bulunmaz bir fırsattı: Yapay zekanın sınırlarını zorlamaları için kendilerine düpedüz açık çek verilmişti. IBM'in yönetici ekibi elbette bu işten mali kazanç sağla mayı umuyordu ve bir yandan da bu maceranın bir halkla ilişkiler zaferiyle sonuçlanmasını ümit ederken, bir hezimet le sonuçlanabileceğinin de farkındaydı. Ama görünüşe göre şirketin yönetim kademesi bir bilimkurgu hayalinin, gele cekbilimin alanına giren bir fikrin cazibesine de kapılmıştı: Çünkü insan yarışmacılar düğmeye bile basamadan yanıtları ardı ardına sıralayıp tüm sorulara doğru yanıt vererek yarış mayı evlerinde, televizyonlarının başında izleyenleri kendine hayran bırakacak, "IBM içerir" [IBM Inside] damgalı bir dil anlama sistemi kurmayı düşlüyorlardı. Satrançta Deep Blue'nun estirdiği rüzgarın bir benzerini yakalayacaklardı ama bir yandan da bu kez durum tamamen farklı olacaktı çünkü Riziko tamamen dile dayalı bir yarışmaydı. Yani bu yarışma teknik olarak bir soru yanıtlama sistemiydi ( SYS ) . Sorusu aranan yanıt tek bir tümceye sığıyordu. Yanıt olarak sunulan doğru soruysa daima tek bir sözcük veya tamla mayla başlayıp " nedir ? " ifadesiyle bitiyordu. Bu bakımdan insan zekasıyla çok daha yakın bir ilişki içindeydi. Hatta Turing Testi'ni andırıyordu. Riziko, yapay zeka geliştirme yarışında atılım yapıp rakiplerinin bir adım önüne geçmek isteyenler için bulunmaz bir fırsat gibi görünüyordu. (2004 yılının o günü IBM'in araştırma biriminin toplantı salonun da duvara konmuş bir sinek, yönetim kademesinin toplan tıda konuştuklarına kulak misafiri olduysa herhalde heye candan bayılmıştır: "Tarihe geçeceğiz. Para mühim değil. Ne lazımsa vereceğiz. Yeter ki Riziko'da yarışabilecek bir sistem inşa edin ! " ) IBM en yetenekli araştırmacılarından bir ekip kurup son raki üç yılı dünya standartlarında Riziko oynama kabiliye tine sahip bir soru yanıtlama sistemi tasarlayarak geçirdi. Bu da IBM'in bir açık alanlı soru yanıtlama sistemi kurma-
YAPAY ZEKA MiTi
y a çalıştığı anlamına geliyordu çünkü b u oyun sayısız konu başlığını kapsıyordu. ( Oyunun yapay zeka araştırmacılarına bu kadar çekici gelmesinin nedeni de kısmen buydu. ) Dola yısıyla sistem hile yapamaz ve belirli konu başlıkları altında vermesi gereken yanıtlar ona önceden yüklenemez görünü yordu. Bu geleceğin soru yanıtlama sistemine Watson adını verdiler. ( Sistem, adını Sherlock Holmes'un ünlü yardım cısından değil, IBM'in kurucusu ve ilk CEO'su Thomas J. Watson' dan alıyordu. ) Ellerinde PIQUANT adını verdikleri daha eski bir sistem vardı ve bu onlara avantaj sağladı. PIQUANT 1 999 yılın da yine IBM tarafından Ulusal Standartlar ve Teknoloji Enstitüsü'nün sponsorluğunda gerçekleştirilen Metin Erişim Konferansı'nda yarışmak üzere kurulmuştu. PIQUANT, Metin Erişim Konferansı yarışmalarında hep en yüksek per formansı sergiliyorduysa da bu yarışmalar basitleştirilmiş soru yanıtlama oyunlarıydı. Oysa Riziko oyunu son derece geniş kapsamlı ve çok daha zorluydu. Örneğin PIQUANT sistemi sorulara KIŞI, YER, T ARIH veya SAYI gibi önceden belirlenmiş etiketlerle yanıt veriyordu. Bir metin soru olarak sunulduğunda, PIQUANT sistemi ilgili konu başlığını temsil eden etiketi çıktı olarak veriyordu. Riziko oyunu ise muaz zam bir konu yelpazesine sahipti. PIQUANT'ın kapsamı bu meydan okumaya karşılık ve recek şekilde genişletilemediği gibi, başka birtakım sorunlar da mevcuttu. Örneğin Riziko'da bir yarışmacı sorunun ya nıtından (sorusundan) emin değilse düğmeye basmamalıydı çünkü bu yarışmada hatalar cezalandırılıyordu. Dolayısıyla bilgisayarın yarışacağı Riziko için gerekli soru yanıtlama türü çok önemli farklar taşıyordu. Bu da başka işlerin yanı sıra sistemin baştan aşağı yeniden tasarlanmasını gerektiri yordu. Ayrıca yeni sistemin deneme yanılma yöntemini kul lanarak Riziko oyunu için 'kendini yetiştirmesi' de gereki yordu. Oysa PIQUANT tüm sorunlara tek tip çözüm sunan bir soru yanıtlama sistemiydi. 288
ÇI KARIM VE DIL - 2
IBM'in Watson projesinin başında bulunan Dave Ferru ci, sistemi baştan aşağı yeniden tasarlama görevini üstlen mişti. Ferruci, Riziko'nun ( ki aklınızda olsun, bu yine sa dece bir oyun, ucu açık bir okuma görevi değil) gerektirdiği sistemin doğal dildeki bağlam sorunundan mustarip olma yacağını işin en başında fark etmişti: " Şu ifadeyi düşünün: 'Oyun fenaydı ! ' Burada 'oyun' ne olabilir? Broadway'deki bir oyun mu? Futbol oyunu mu ? Peki, bu tümcede geçen 'fena' sıfatı 'iyi' anlamına gelemez mi ? Ne kast edildiğini anlamak için bu örnekte bağlamın daha iyi bilinmesinin ge rektiği açıktır. " 8 Ferruci, yapay zeka çalışmalarının öncüsü Marvin Minsky'nin fikirlerini de gayet iyi biliyordu. Minsky, kar maşık zeka sorunlarını çözmenin yolunun onlara çok dil bilen birinin dillere yaklaştığı gibi yaklaşmaktan geçtiğini savunuyordu. Zihinlerimiz -veya bilgisayarlar- modüler sis temlerdi. Bu modüller, zor sorunları, başa çıkılabilecek kü çük parçalara ayırıyordu. Dolayısıyla tek yapılması gereken, bu modüllerden ayrı ayrı alınan yanıtları birleştirip 'genel' bir yanıt veya çözüm haline getirmekti. Minsky buna 'zihin toplumu' adını veriyordu ve Ferruci Watson'ı tasarlarken bu fikirden esinlenmişti.9 Watson ekibi DeepQA adını verdikleri bir soru yanıtla ma sistemi geliştirmişti. Bu sistem soruları çözümleyip bu sorulara çok sayıda olanaklı yanıt üretiyor, sonra bunları puanlıyor ve aralarından en iyisini çıktı olarak sunuyordu. DeepQA aslında zihin toplumu fikrinin Riziko oyunu için uyarlanmış bir sürümünü yazılım düzeyinde hayata geçiri yordu. Sistem aceleci yanıtları en aza indirebilmek için so ruları bir işlem hattında sıraya koyuyor ve ürettiği yanıtlara puan vermeyi tüm kanıtlar toplanana dek erteliyordu. Ör8 D. A. Ferrucci, "lntroduction to 'This is Watson' ", IBM ]ournal of Research and Development, 56. cilt, 3.4 sayı (3 Nisan 2012), s. 1 : 1 - 1 : 1 5 . 9 Bkz. Marvin Minsky, The Society of Mind, New York: Simon & Schuster, 1988.
YAPAY ZEKA MiTi
neğin bir soruya yanıt verebilmek için tamamlanması gere ken bulmacanın bir parçası DeepQA'nin işlem hattında arka sıralarda bulunabilirdi. Watson'ın bu mimarisi nihayetinde onun 'zekasının' bir parçasıydı. Watson'ın yıllar süren geliş tirilme sürecinin ardından dil temelli karmaşık sorunlarda başvurulan başlıca hibrit çözümlerden biri haline gelmiş ol masının nedenlerinden biri de budur. Başka nedenleri de var. Watson'ın tasarlanma, geliştiril me ve sınanma aşamalarında insanlarca yapılmış muazzam miktarda çözümlemenin kullanılmış olması bu nedenlerden bir diğeridir. insanların başarılı sistemlerin tasarımına kat kıları genellikle görmezden gelinir, özellikle de bu sistemler yapay zekanın gövde gösterisi olarak görüldüklerinde. Doğ rusu şu ki Watson'ın, PIQUANT veya genel anlamda soru yanıtlama sistemlerinde kaydedilen iyileşmelerin bir ürünü olduğu kadar, bu sistemleri tasarlayan mühendis ekibinin oyunla ilgili kılı kırk yaran, içgörülü çözümlemelerinin de bir ürünüydü. Nitekim bu sistemin geliştirilme sürecinde araştırmacılar tarafından binlerce Riziko oyunu çözümlen mişti. Böylece PIQUANT sistemi, üzerinde yapılan birtakım değişikliklerle Riziko oynayabilecek hale getirilmiş ve bir taban performans belirlemek amacıyla testlerde kullanıl mıştı. (Tahmin edilebileceği gibi, testlerde sistemin perfor mansı yerlerde sürünüyordu. Soruların % 70'ine yanlış ya nıt vermiş, ancak % 1 6'sını doğru yanıtlayabilmişti. IBM'in geliştirici ekibi bu umut kırıcı sonuca 1 6@70 diyordu. ) Bu sonucun ardından DeepQA modülü Riziko sorularının ola sı yanıtlarını işaret eden belirli ipuçlarını arayacak şekilde yeniden tasarlandı. DeepQA'nin işlem hattının münhasıran Riziko oyununda kullanılabilecek hale getirilmesi sırasında başvurulan deneme-yanılma yöntemi, başarı için son kerte de hayati bir önem taşıyordu. Hatta IBM'in mühendisleri buna bir ad bile vermişlerdi: AdaptWatson. AdaptWatson, Watson değildi. Riziko oyununa has, kul lanışlı numaraların bulunup DeepQA modülüne eklenerek
ÇIKARIM VE DIL - 2
Watson'ın daha iyi bir oyuncu haline getirilmesini amaçla yan ve başından sonuna dek insanlar tarafından yürütülmüş bir ince ayar yapma süreciydi. AdaptWatson protokolü kul lanılarak l OO'den fazla özel amaçlı dil işleme modülü tasar landı, kullanıldı ve inceltildi. Bu, muazzam bir iş akışı anla mına da geliyordu. Hatta zirve noktasında, aralarında yerel üniversitelerden yardıma koşan öğrencilerin de bulunduğu toplam 25 araştırmacı bu işe dahil olmuştu. Mühendislik açısından baktığımızda AdaptWatson harikaydı: PIQU ANT hemen emekliye ayrıldı ve onun yerine oyunun per formansı etrafında 'Riziko'ya en uygun' koca bir işlem hattı şekillenmeye başladı. DeepQA verimli bir geribildirim dön güsüne dönüşmüştü. Bu döngü içinde düzinelerce insandan oluşan uzmanlar, Watson sisteminin Riziko oynayabilmesi için adım adım ince ayarlarını yapıyorlardı. (Burada belki de gözden kaçan bir nokta şuydu: Ortaya çıkan sistem dar kapsamlı bir yapay zeka sistemiydi çünkü bu mühendislik stratejisi tamamen Riziko oyununun kendine özgü yanları na odaklanıyordu. ) 'Zihin toplumu' fikrinden ilham alan DeepQA, doğal dili işleme (DDİ) alanında yapılan inovasyonları da elbet te içeriyordu. PIQUANT gibi eski soru yanıtlama sistemleri IBM'in Watson sistemindekine benzer işlem hatlarına bel bağlıyordu: Önce soruyu çözümlüyor, sonra olası yanıtları arayıp buluyor, bulduğu yanıtları puanlıyor ve sonunda en iyi yanıtı çıktı olarak veriyordu. Fakat PIQUANT ve diğer eski nesil sistemlerin ortak bir kusuru vardı: Çözümlemenin ilk adımlarında hata yapılırsa doğru olmayan yanıtlara sap lanıp kalabiliyorlardı. Bu sorunu aşmak için Watson ekibi IBM'in 200 1 ila 2006 yılları arasında geliştirdiği ve Yapı landırılmamış Bilgi Yönetimi Mimarisi (YBYM) adıyla bili nen eski bir mimari üzerinde değişiklikler yapmıştı. Bu bir tak-kullan mimariydi: İşlem hattına yeni yazılım modülleri eklenebiliyor, bu modüller gerektiğinde çıkarılıp Üzerlerinde arzu edilen değişiklikler yapıldıktan sonra tekrar eklenebi-
YAPAY ZEKA MiTİ
liyordu. Keza algoritmalar da tümden değiştirilebiliyordu. Böylece büyük ve karmaşık projelerin ihtiyaç duyduğu kap samlı deneme-yanılma testleri süratle yapılabiliyordu. Wat son ekibi YBYM'yi kullanarak sisteme Riziko oynatabilecek daha gelişkin bir işlem hattı kurdu. AdaptWatson YBYM sayesinde sisteme her an ince ayar yapabilir hale gelmişti. Hibrit sistem işe yaramış, Watson dünya standartlarında Ri ziko oynamaya başlamıştı ! Fakat dar kapsamlı önceli Deep Blue gibi Watson da en başından itibaren tek bir işte iyi olmak üzere tasarlanmıştı. Watson sisteminin ayrıntıları, anlaşılabilir nedenlerden ötü rü son derece karmaşık olsa da bu sistemin kendisinin ve temel bileşenlerinin gelişimine şöyle bir göz atıldığında bile Watson'ın gerçek bir anlama kabiliyetine sahip olduğu iddi asının dayanaksız olduğu görülebiliyor. Örneğin DeepQA, doğal dili anlama araştırmalarında nispeten çok iyi anlaşıl mış ve sınanmış çok sayıda tekniği devreye sokuyordu: tüm ce ayrıştırma; adılların çözülüp öncellerine bağlanması gibi bazı eşgönderim çözümlemesi türleri; kişi ve yer gibi var lık adlarının belirlenmesi; soruların türlerine göre -örneğin 'hap bilgi [factoid] sorusu' şeklinde- sınıflandırılması gibi. Fakat Watson ekibi bu teknikleri münhasıran Riziko oyu nunun gerekliliklerine göre yontarak uygulamışlardı. Hatta sorulan soruların, verilebilecek yanıtları sınırlayan bariz ve oyuna özgü kısıtlamalar barındırıp barındırmadığını incele yen bir SoruKesitleri modülü bile yazmışlardı. Örneğin bir soruda "Dört harften oluşan bu sözcüğün anlamı . . . " gibi bir ifade geçiyorsa sorunun yanıtı dört harfli bir sözcük ol malıydı. Bu da yine makinenin doğal dili anlamaktan ziyade belirli bir oyunu en iyi şekilde oynayabilmek üzere tasarla nıp geliştirildiğini gösteriyor. Nitekim Watson'ın bu büyüleyici görüntüsü, sistemin yanıt arama sonuçlarına daha yakından bakıldığında çarça buk kayboluyor. Bu sistemin Riziko oyununda olası yanıtla rı web'de arayıp bulma konusunda sergilediği başarı, büyük
ÇIKARIM VE DIL - 2
ölçüde, oyununun istismar edilebilir bir açığının olmasından kaynaklanıyordu. Bu açığı da yine AdaptWatson'ı kullana rak sistemin sorunlarını ve olası iyileştirmeleri belirlemeye çalışan mühendisler keşfetmişlerdi. İşin aslı şu ki Riziko yarışması bir kestirme yola başvuruyordu: Soruların yanıt larının % 95'i Wikipedia başlıklarından ibaretti. Bütün bir Watson girişimini de işte bu tesadüfi keşif mümkün kılmıştı. Sorular ile Wikipedia başlıklarını eşleştirmek bile yarışmada Watson'ın insanüstü bir başarı sergilemesine yetiyordu. Şey tan ayrıntıda gizlidir diye boşuna demiyorlar. Watson etkileyici bir sistemdir ama tıpkı IBM'in satranç ustası Deep Blue sistemiyle daha önce elde ettiği başarıda olduğu gibi burada da övgüyü hak edenin kim veya ne ol duğu çok açık değildir: Süperbilgisayarın donanımını mı göklere çıkaracağız, yoksa mühendislerin üstün çabalarını ve içgörülerini mi öveceğiz ? Sonuçta Watson'ın donanımı her biri sekiz çekirdekli 200'den fazla sunucudan oluşuyor du. Mühendislerse IBM'in talih kuşu görevini görecek böyle bir sistem üzerinde çalışma fırsatını yakalamışlardı ve mali yönden epey rahattılar. Ekibin hakkını teslim etmek gerek, Watson bloglar, dijital kutsal kitaplar ve diğer yapılandırıl mamış kaynaklarda daha açık uçlu aramalar yapabilecek şe kilde tasarlanmıştı. Wikipedia hala büyük oranda yapılan dırılmamış bir kaynaktır ama 'DB-Pedia' adlı [yapılandırıl mış] bir veritabanı da mevcut ve Watson bunu barındırıyor du. Yine de aramalar soruların bilgisayardaki temsilleriyle sınırlıydı ve dil işleme araştırmalarında geçmişi on yıllara yayılan teknikler kullanılarak çözümlenecek pasajları bulup getiriyordu: Sorudaki boşlukları, arama sonuçlarından elde edilen ve soruyla bağdaştığı tespit edilen sözcükler ve de yimlerle dolduruyordu. Elbette bu da önemli bir başarıydı ama Watson'ın ucu açık metin çözümleme becerisinin bü yük oranda güvenilmez olduğunun ortaya çıkmasıyla -ki büyüyü bozan bir başka gözlemdi bu- etkileyiciliğini büyük oranda yitirmişti. Wikipedia'yla başlık eşleştirmeleri olma29 3
YAPAY ZEKA MiTi
yınca Watson sisteminin kabiliyeti de daha mütevazı görün meye başlıyordu (gerçi bunlar tüm yanıtların sadece % 5'lik kısmını oluşturuyordu) . Üstelik Riziko'nun da bir numara sının olduğu açığa çıkmıştı: Bu yarışma 'hap bilgiler' üzerine kuruluydu ve hap bilgilere erişmek mümkündü. Oyunun bu özelliği insanların müdahil olduğu AdaptWatson protokolü kullanılarak keşfedilmişti ve sistemin son kertede insanüstü bir performans sergilemesinin temel nedenlerinden biriydi. Ayrıca IBM'in sağlık sektörüne girme çabalarının neden ba şarısız olduğunu da açıklıyor. Tahmin edilebileceği üzere, Watson'ın başarısı doğal dili gerçekten anlayabilen yapay zeka sistemlerinin yolda olduğuna dair tartışmaları alevlendirdi. Oysa bu sistemin Riziko'da yarışmaktan çok daha basit görünen gazete oku mak gibi bir görevi bile yerine getiremeyeceği, Ferruci ve ekibi tarafından işin ta en başında itiraf edilmişti. Hatta Ferruci bunu, Wikipedia sayfalarının yalnızca başlıklarının değil içeriklerinin bile yapay zekanın karşısına son derece zorlu sorunlar çıkardığını söyleyerek, açıkça dile getirmişti. Bunlar aşılması öyle güç sorunlardı ki ucu açık metinlerin genel amaçlarla bilgisayarlar tarafından okunabilir hale ge tirilmesini gerçekçi bir hedef olmaktan çıkarıyordu. Nite kim bu konuda çalışan araştırmacılar kısa süre içinde hav lu attılar. 1 0 Watson ekibi bunun yerine veri kaynaklarında Watson'ın işlem hattına uyacak ve böylece sistemin doğru yanıtlar verme olasılığını artıracak yüksek değerli bir dizi hedef -özetler ve pasajlar- belirlemişti. Gelgelelim ekip bu yaklaşımı benimsemekle aslında daha önce satrançta yaptığı gibi Riziko oyununu da fiilen ıskartaya çıkarmış oluyordu. Bir yandan da gün geçtikçe daha belirgin hale gelen bir haki katin altını çiziyordu: Başarılı her yapay zeka, dar kapsamlı olmaya mahkumdur. (Bununla bağlantılı başka bir hakikati 10
J. Fan, A. Kalyanpur, D. C. Gondek, D. A. Ferrucci, "Automatic Knowledge Extraction from Documents " , IBM Journal of Research and Development, 56. cilt, 3 . 4 sayı (2012), s. 5 : 1 -5 : 1 0.
29 4
ÇIKARIM VE DIL - 2
de gözümüze sokuyordu: Oyunlardaki başarılar kamuoyun da heyecan yaratır ama bizi yapay genel zekaya bir adım bile yaklaştırmaz. ) Watson genelleşmiş yapay zekaya giden yolda kaydedilmiş bir ilerleme değildi, bilakis zekanın genel liğinin bizim için hala bir muamma olduğunun ve kafamızı epey karıştırdığının yeni bir kanıtıydı. IBM'in ekibi hibrit bir sistem kullanarak etkileyici bir zafer kazanmıştı ama dili anlamanın anahtarını keşfetmemişti. Nitekim genel zekaya ulaşmak için şart olan savavarımlı çıkarımların bilgisayarla ra nasıl programlanacağı konusu, doğurduğu tüm sorunlar la birlikte hala önümüzde duruyor.
Darlık Tuzağı ve Dil Robotikteki sorunlar yerine uzun uzadıya dili anlama soru nuna odaklanmayı tercih ettim çünkü bu olgu bilinen tüm yapay zeka sistemlerinin düştüğü darlık tuzağını apaçık bi çimde gözler önüne seriyor. Aşağıdaki satırlarda, dili anla ma kabiliyetine sahip olmadığı halde sahipmiş gibi tanıtılan bazı yakın tarihli yapay zeka uygulamalarını irdeleyeceğim. Bu uygulamalar aslında olduğundan fazlası gibi sunulan dar kapsamlı yapay zeka örnekleridir. Örneğin Google Duplex'i ele alalım. 20 1 8 yılında piya saya sürülen Duplex, sahibi adına rezervasyon yaptırmak ve randevu almak gibi rutin görevleri yerine getirmek üze re telefon aramaları yapabiliyor ve bunun için insan sesini taklit ediyor. Hatta işini o kadar inandırıcı biçimde yapıyor ki kamuoyunun tepkisi sonucunda Google bu sisteme yaptı ğı aramalar sırasında kendini otomatik çağrı sistemi olarak tanıtma zorunluluğu getirdi. Duplex ilk bakışta 2 001 : Bir Uzay Destanı filminde anlatılan HAL adlı yapay zekanın gerçeğe dönüşmüş hali gibi görünüyorsa da sistemin ayrın tılarını öğrendiğimizde durum değişiyor. Google'ın elinin altındaki o muazzam bilişim ve veri kaynakları kullanılarak 29 5
YAPAY ZEKA MiTi
geliştirilmiş bu sistem bile ancak lokantada yer ayırtabili yor, kuaför . randevusu alabiliyor ve belli başlı işletmelerin açılış saatlerini öğrenebiliyor. Kulağa fazlasıyla dar kapsam lı geliyor, değil mi ? Durun daha bitmedi: Duplex dünyaya tanıtıldıktan kısa süre sonra Android işletim sistemine sahip telefonlar için de piyasa sürüldü ama yazılımın bu sürümü açık uçlu rezervasyon yapma ve işletmelerin çalışma saat lerini sorgulama kabiliyetlerinden de yoksundu. Sadece lo kantada yer ayırtabiliyordu. Marcus ve Davis'in deyişiyle " Bundan daha dar kapsamlısı olamaz. " 1 1 Duplex'in yanına kısa süre önce başka yazılımlar da eklendi. Bunlar da HAL benzeri kabiliyetler vaat ediyor, makine öğrenimini ve büyük veriyi kullanıyor. Fakat yine bunlar da yapay zeka uygulamalarının düştüğü darlık tuza ğından kaçamıyor. Sesle yönlendirilen Siri, Cortana, Google Asistan ve Alexa gibi sanal asistanlar insanların sordukları sorulara yanıt verebiliyor, hatta mizahi veya hakaretamiz sorulara mizahi yanıtlar vererek ufak atışmalara bile gire biliyor. Fakat bu sistemleri kullanan herkesin bildiği üzere, bunların doğal dili anlama kabiliyetleri göstermelik. Wat son gibi bu sistemler de veritabanlarından ve web sayfala rında bulunan bilgi kutucuklarından (Wikipedia'daki gibi) toplanabilen hap bilgiler konusunda başarılılar. Örneğin " 1 978 FIFA Dünya Kupası'nı kim kazandı ? " sorusunu doğru yanıtlayabiliyorlar ama " Köpekbalıkları dama oyna yabilir mi ? " sorusunu doğru yanıtlayamıyorlar (Winograd şemalarını hatırlayın) . 1 2 Genellikle web'den toplanan hap bilgilerin temellerini hafiften de olsa yoklayan, yani gerçek bilgi ve anlama gerektiren sorularda bu sistemler istisnasız 11 12
Gary Marcus ve Ernest Davis, Rebooting AI: Building Artificial Intelligence We Can Trust, New York: Pantheon, 20 1 9, s. 14. Marcus ve Davis'in kitaplarının dil anlama ve yapay zekayla ilgili bölümünde 'hap bilgi' ile 'sağduyu' soruları arasındaki farkları da tartışıyorlar. Bkz. Gary Marcus ve Ernest Davis, Rebooting AI: Building Artificial Intelligence We Can Trust, New York: Pantheon, 2 0 1 9 , s. 74-76.
ÇIKARIM VE DIL - 2
olarak çuvallıyor. Hap bilgilerden ve kalıp şakalardan olu şan kağıttan bir kaplan gibiler. Tıpkı Goostman gibi, bu sis temler de gerçek bir anlama kabiliyetinden yoksun oldukları için bizimle sahici bir iletişim kuramıyorlar, dolayısıyla bize çoğu zaman doğru düzgün yardımcı da olamıyorlar. Dar kapsamlılık, doğal dille uğraşan Watson gibi sis temlerin müzmin sorunudur. Önceki bölümlerde gördüğü müz gibi, bunun nedeni, okuma ve sohbet etme gibi eylem lerin aslında dünyayı anlamayı şart koşan ucu açık çıka rımlarda bulunmayı gerektirmesidir. Ray Kurzweil, 20 1 8 yılında yaptığı bir TED konuşmasında, Google'ın Talk to Books uygulamasını, kendisinden bekleneceği şekilde tan tanalı bir sunumla kamuoyuna tanıtmıştı. Bu uygulamanın emsalsiz bir soru yanıtlama kabiliyeti olduğu vurgulanı yordu. Quartz'ın ifadesiyle bu sistem " binlerce kitap oku yup " öyle yanıt veriyordu. 1 3 Gerçekten de bu uygulama yaklaşık 1 00.000 kitabı dizinlemişti. Kitapların tümcele rini sayısal olarak kodlayıp vektörlerde (veri yapılarında ) saklıyor ve sakladığı vektörleri derin öğrenme yöntemiyle karşılaştırıp ( başka neyle karşılaştıracaktı ? ) benzerliklerini hesaplıyordu. Fakat bütün bu laf kalabalığı aslında sıklık varsayımının ve empirik kısıtlamanın yumuşatılmış bir ifa desinden ibaretti. Nitekim bu TED sunumunun ardından Talk to Books'un birçok kısıtlamayla malul olduğu ortaya çıktı. Veritabanın da tuttuğu romanların ayrıntılarını ve hap bilgileri kullanı cıya sunabiliyordu ama gerçek çıkarımlarda bulunmayı -sa vavarımı- gerektiren sorulara nadiren yanıt verebiliyordu. Örneğin Muhteşem Gatsby romanı eğer veritabanında yer alıyorsa kitabın yazarı (F. Scott Fitzgerald) hakkında so rulan sorulara yanıt verebiliyordu, hatta Gatsby'nin adını (Jay) da bilebiliyordu. Fakat romanın olay örgüsü ve kişileri gibi bilgiye dayalı çıkarım gerektiren kolay sorular bile bu 13
Aktaran Marcus ve Davis, age., s. 6 8 . 29 7
YAPAY ZEKA MiTi
sistemin boyunu çabucak aşıyordu. Romanı okuduysanız " Gatsby roma,nın ana karakteriyle hangi şehirde tanıştı ? " sorusunu kolaylıkla yanıtlayabilirsiniz. Oysa bu tür sorular Talk to Books'un çıkarım gücünün ötesinde kalıyor. Mar cus ve Davis bu sisteme " Harry Potter Hermione Granger'la nerede tanıştı ? " sorusunu sordular. Aldıkları yanıtlar Harry Potter ve Felsefe Taşı kitabından bile değildi; daha da kötü sü, sorunun asıl konusunu -yani tanıştıkları yeri, konumu tamamen görmezden geliyordu. 1 4 Darlık sırf Google'ın Talk to Books uygulamasının bir sorunu değildir, doğal dili işlemeye çalışan tüm yapay zeka sistemlerinin sorunudur. Dil 'oradaki' dünya hakkındadır, dolayısıyla şeylerin asgari bilgisini ve ne anlama geldiklerini anlamayı gerektirir. Yukarıda da gördüğümüz gibi, darlık tuzağı, işin ta başından beri veri güdümlü yaklaşımların bir sonucudur. Hayvan Dedektifi filminin başkarakteri Ace Ventura'ya atıfla "Darlık yapay zekadır, yapay zeka darlık tır " diyebiliriz. Bu konuda ünlü veya kötü şöhretli başka örnekler de var. 20 1 6 yılında Microsoft, Tay adını verdiği bir sohbet botunu kullanıma sundu. Bu yazılım devi, 1 960'ların meş hur ELIZA'sı gibi kural tabanlı eski sistemlere kıyasla Tay botunun muazzam bir sıçramayı temsil ettiğini ileri sürü yordu: Sistem kullanıcıyla girdiği etkileşim ve çevirimiçi veriye erişimi sayesinde güya gerçekten öğrenebiliyordu. Fakat Tümevarımın doğası ve sınırları meselesinden hiçbir ders çıkarmamış olacaklar ki Tay ona musallat olan trolle rin ırkçı ve cinsiyetçi tıklama akışlarının hepsini ve web'de arama yaparken bulduğu tüm nefret söylemlerini mutlu mesut biçimde sindirmişti. Büyük veriden öğrenmek üze re programlanmış Tay " Siktiğimin feministlerinden nefret ediyorum " ve " Hitler haklıydı: Yahudilerden tiksiniyorum" 14
Gary Marcus ve Emest Davis, Rebooting Al: Building Artificial lntelligence We Can Trust, New York: Pantheon, 2 0 1 9 , s. 69.
ÇIKARIM VE DiL - 2
gibi tweet'ler atmaya başlamıştı. Dehşete düşen Microsoft, bir gün bile geçmeden Tay'ın fişini çekmek zorunda kaldı. 15 Oysa sonucun böyle olacağını öngörebilmeliydiler çünkü sistemleri " Çöp girerse çöp çıkar" kuralına göre tasarlan mıştı. Tay, kurumsal bir şirketin kendi teknik yaklaşımının zayıf yanlarını görmezden gelmekte ısrar ettiği nice vakadan sadece biriydi ve dar kapsamlı yapay zekanın bir başka ör neğiydi. Eğer Tay'ın asgari seviyede bile bir anlama kabili yeti olsaydı, bu rencide edici tweet'leri eleyebilirdi. Dili veya tweet'leri gerçekten anlayamadığı için, ne aldıysa onu verdi. Bu bakımdan Tay aslında veri merkezli yapay zekanın nasıl bir aptal dahiye dönüştüğünün unutulmaz ( ama ne yazık ki kısa sürede unutulacak) bir örneğidir. Doğal dili anlamak güç olabilir ama bunun karşı konul maz bir çekiciliğinin olduğu da ortadadır. Nitekim Facebo ok da hayal kırıklığından payına düşeni almak için sıraya gi ren şirketlerden biri olacaktı. Technology Preview dergisinin ifadesiyle Facebook ' Yüzüklerin Efendisi'nin özetini okuyup romanla ilgili sorulara yanıt verebilen' bir sistem inşa etti ğini duyurmuştu. Fakat sözü geçen özet " Bilbo mağaraya gitti. Gollum yüzüğü orada düşürmüştü. Bilbo yüzüğü aldı" gibi dört satırlık basit tümcelerden ibaretti. Üstüne üstlük bu sistem, yanıtı ancak doğrudan doğruya bu tümcelerde bulunan " Yüzük nerede ? " gibi sorulara yanıt verebiliyordu, metni anlamayı gerektiren sorulara yanıt vermesi mümkün değildi. " Bilbo neden mağaraya gitti ? " gibi nedenlerin bil gisini soruşturan sorulara da yanıt veremiyordu. Sistem Yü züklerin Efendisi'ni birkaç satırlık kısa bir metne, bir özete indirgiyor ve ancak en sıradan, aptalca soruları yanıtlayabi liyor, zerre anlama belirtisi göstermiyordu. Darlık bu siste min de iliklerine işlemişti. Çıkarım çerçevesi, bu darlık tuzağını anlamamıza da ı .;
Gary Marcus ve Ernest Davis, Rebooting Al: Building Artificial Intelligence We Can Trust, New York: Pantheon, 2019, s. 27. 2 99
YAPAY ZEKA MiTi
yardımcı oluyor. Yukarıda bazı ayrıntılarına değindiğimiz Watson sistemi, yapılandırılmamış bilgiyi (web sayfalarını, Wikipedia sayfalarını, özellikle de Wikipedia başlıklarını) akıllıca ele alarak, Riziko gibi karmaşık bir oyunda etkile yici sonuçlar elde edebiliyordu. Sistemin ayrıntılarına biraz daha inildiğindeyse hibrit tasarımı ortaya çıkıyor: Kodlan mış sabit kurallardan tutun da yanıtları puanlamak için kul landığı istatistiksel yöntemlere sahipti. Ayrıca, oyuncuların kazanabilecekleri veya kaybedebilecekleri para ödülünü se çebildikleri rastgele belirlenen 'Çifte Bahis' sorularında ve istedikleri puanı yatırabilecekleri 'Son Riziko' adı verilen son sorularda bahiste bulunmak için Monte Carla yöntem lerini de kullanıyordu. Haliyle, Watson'ın soru çözümleme sistemi çoğunlukla sözcük türü, varlık adı gibi bilgilere göre tümceleri etiketleyen geleneksel tekniklere -yani kurallara veya tümdengelim esinli tekniklere- bel bağlıyordu. "Dört harften oluşan bu sözcüğün anlamı. . . " gibi SoruKesitleri Ri ziko sorularının tipik özelliğiydi ve bunlar istatistiksel yön temler kullanılmadan kolaylıkla çözümlenebiliyordu. Soru çözümlemesinin, soruların incelenmesiyle güvenilir biçimde saptanabilecek diğer yönleri için de bu mülahazalar geçerli dir. Peki, neden makine öğrenimi kullanılmamıştı ? Çünkü kurallara dayalı veya tümdengelimli mantıksal yaklaşımlar la çözülmesi çok kolay olan çoğu sorun, makine öğrenimi nin karşısına aşılamaz güçlükler çıkarıyor. Watson işte bu yüzden hünerli bir hibrit sistemdi. Böyle olmasına rağmen darlık tuzağına düşmekten kaçamadığı da ayan beyan orta dadır. Bu tuzağın kuşatıcı ama gayet basit bir açıklaması var: Kural veya öğrenme tabanlı yaklaşımların bir arada kulla nılması, genelleşmiş çıkarım kabiliyetinin eksikliğini gidere mez. Başka bir deyişle, savavarımlı çıkarımda bulunamayan tüm sistemler dar kapsamlı olmaya mahkumdur çünkü bu çıkarım türünün eksikliği o sistemlerin genelleşmiş zekaya sahip olmadığı anlamına gelir. Darlık kaçınılmazdır. Ne olursa olsun, Watson etkileyici bir dizi makine öğ3 00
ÇIKARI M VE D IL - 2
renimi tekniği kullanmıştı. 25.000 civarında Riziko sorusu çözümlenmiş, bunlar sistemin eğitilmesinde kullanılacak 5,7 milyon alıştırmaya çevrilmişti. Sistem soru-yanıt çiftleri üretiyor, işlem hattında kanıt biriktiriyor, istatistiksel tek niklerle soru-yanıt çifti listesini puanlıyordu. Bunların hepsi, önceki oyunların bilinen verileriyle mümkün olmuştu. Watson'ın derin öğrenme yaklaşımını kullanmamış ol ması da dikkate değerdir. En azından Watson'ın 20 1 1 'de televizyonda yayımlanan yarışmada insan şampiyonları ye nen sürümünün derin öğrenme kabiliyeti yoktu. Zaten de rin öğrenmenin ona faydası da olmazdı. İşte burada IBM ekibinin hünerine şapka çıkarmak gerekiyor. Daha güçlü öğrenme algoritmaları var olmasına rağmen mühendisler 'düzeltilmiş loj istik regresyon' adı verilen görece basit bir makine öğrenimi tekniğini kullanmışlardı. (Derin öğrenme ise 20 1 1 'de henüz iyi bilinmiyordu. ) Daha güçlü öğrenme sistemleri basitçe daha fazla eğitim ve daha fazla masraf an lamına geliyordu ki sonuçta yapay zeka bir alet takımından ibarettir. Watson sistemi kullandığı teknikler açısından bir yenilik getirmiyorduysa da 'zihin toplumu' fikrinden esin lenmişti ve bu doğrultuda bileşenleri 'söküp takılabilen' YBYM- bir işlem hattı kullanarak Riziko oyununda dünya standartlarında sonuçlar elde etmeyi başarmıştı. Bu itibarla yapay zeka alanında bilinen tümdengelimli ve tümevarımlı yaklaşımların hepsini tek bir akıllı mimaride birleştirmenin gücünü gösteren herhalde en iyi örnek olarak karşımızda durmaktadır. Fakat Wikipedia başlıkları numarası olmasa Watson da başarılı olamazdı. Dolayısıyla hibrit olsun veya olmasın mevcut tüm sistemler gibi Watson da son kertede hala dar kapsamlı -hatta fazlasıyla dar kapsamlı- bir yapay zeka uygulaması olmaktan kurtulamıyor. Bütün bu olan biteni açıklamak için başka bir terim de kullanabiliriz aslında: çıkarım tuzağı. Bildiğimiz üç çıkarım türü birbirine indirgenemediğinden ve genel zeka için sava varımlı çıkarım şart olduğundan, makine öğrenimi gibi saf 301
YAPAY ZEKA MiTi
tümevarımdan esinlenen teknikler, bilgisayarlar ne kadar hızlanırsa hızlansın yetersiz kalıyor ve Watson gibi hibrit sistemler dahi genel bir anlama kabiliyetine ulaşamıyor. Dili anlama gibi dünyanın bilgisini gerektiren açık uçlu senar yolarda savavarım merkezi bir yer tutuyor ve yeri başka şeylerle doldurulamıyor. Bu yüzden tümdengelimli ve tüme varımlı stratejileri birleştirme girişimleri daima başarısızlığa mahkumdur, gerçi Watson örneğinde olduğu gibi, bunun nedenini anlamak zaman alabiliyor. Bu alanda öncelikle sa vavarımın temel kuramının geliştirilmesi gerekiyor. Bu süre zarfındaysa tuzaklardan kaçış yok.
Mantık Piyanoları ve Gemi Yolculukları Charles Sanders Peirce makineleri kullanarak mantıksal çı karımı araştırmanın mümkün olduğundan haberdardı. Bil gisayarlar henüz ortada yoktu ama bilgisayar fikri bir sü redir mevcuttu ve bu doğrultuda bazı basit düzenekler icat edilmişti. Britanyalı mantıkçı ve felsefeci John Venn (meşhur Venn şemalarının yaratıcısı) tamamen otomatik mantık ma kinelerinin nasıl inşa edilebileceğini kurgulamıştı. Peirce'ın Johns Hopkins Üniversitesi'nden öğrencisi Alan Marquand ise 1 8 8 1 yılında bir mantık makinesi üzerinde çalışmaya baş lamış, daha sonra bu çalışmalarının kapsamını genişletip bir ön-bilgisayar geliştirmeye girişmişti. Marquand'ın üzerinde çalıştığı makine, adını lngiliz mucit William Jevons'tan alan Jevons'un Mantık Piyanosu'ydu. Bu makine, tümdenge lim mantığının barındırdığı sorunları çözmeyi amaçlıyordu. Peirce'ın ömrünün çoğunu araştırmaya adadığı alandı bu. Dolayısıyla Peirce bu mantık makinesine yakın ilgi göstermiş, Marquand'ın düzeneğinin elektromanyetik kısımlarının eski zini yaparak, makinenin geliştirilmesinde bilfiil rol almıştı. Peirce bu deneyimini 1 8 8 7 yılında American ]ournal of Psychology dergisinde yayımlanan " Logical Machines" 3 02
ÇIKARIM VE DIL - 2
[Mantıklı Makineler] başlıklı, şaşırtıcı ölçüde ileri görüşlü makalesinde toplamıştı. Peirce her zamanki tavrıyla bu ma kalesine de bir uyarıda bulunarak başlıyordu: "Laputa'ya Yolculuk'ta bilimi otomatik olarak ilerleten bir makine anlatılır. Orada aslında insan zihninin işlerini yapacak bir 'araç' inşa edilebileceği fikrinin saçmalığı gösterilerek, Aris toteles ve Bacon'ın Organon'larıyla dalga geçilmektedir. " Bir kuşkucu olan Peirce hiç şüphesiz Swift'in hayalgücün de saklı bilgeliği takdir ediyordu ama Marquand'la birlikte giriştikleri işin önemini vurgularken Prometheusçu bir ha letiruhiyeye büründüğü de belliydi. Öğrencisine ve öğrenci sinin önceline de haklarını teslim ediyordu: " Böyle olmakla birlikte, Jevons ve Marquand'ın mantıklı makineleri bir de ğirmen gibi: Öncülleri girip kolunu çevirdiğinizde size bir sonuç veriyor. " O sıralarda ABD'li mucit Charles Henry Webb aritmetik işlemleri yapabilen bir makine tasarlamış, İngiliz dahi Charles Babbage ise (çırağı Ada Lovelace'la bir likte) geliştirdiği kavramsal düzenekle, genel hesaplama iş lemlerini yapacak, daha gelecek vaat eden bir makine inşa etmenin olanaklı olduğunu kanıtlamıştı. Bu makineler 'hiç de basit olmayan akıl yürütmeler' yapabiliyorlardı. t 6 "Mantıklı Makineler" makalesi bunun ardından tüm dengelimli tasımları otomasyona tabi tutmanın olanağı üze rine ayrıntılı bir tartışmaya giriyordu. Peirce makalenin so nunda açık uçları birbirine bağlayıp şimdilerde yapay zeka dediğimiz şeyin olanağı hakkında yorumlarda bulunuyordu: " Her akıl yürütme makinesi, yani her makine, yapısı gereği iki yetersizliğe sahiptir. Birincisi, ilk olmadığı gibi, başlatıcı da değildir. Kendi sorunlarını saptayamaz ve kendini besle yemez. Olanaklı yordamlar arasından kendi kendine bir yol da seçemez. " 17 Peirce bunun ardından, çözümü düzinelerce adımlık işlemle öncüller arasında bir seçim yapmayı gerek16 17
Charles Sanders Peirce, " Logical Machines" , American ]ournal of Psychology, 1 . cilt, 1 . sayı ( 1 8 87), s. 1 65. Charles Sanders Peirce, age., s. 1 6 8 .
YAPAY ZEKA MiTi
tiren karmaşık bir mantık sorusuna değiniyordu. Değindiği örnek belki bir şekilde veya bir yolla gerçekten çözülebilir ( bugün muhtemelen çözülebilir) . En azından Peirce bunun olanaklı olduğunu düşünüyordu. Ama bunun bir önemi yok çünkü böyle bir çözüm de asıl meseleyi ıskalıyordu: " Bunu yapabilsek bile makinenin ilk veya başlatan olmayacağı, sadece yapması hesaplanan özel işi yapabileceği gerçeği değişmiyor. " 1 8 Peirce'ın, çoğu fikrinde olduğu gibi bu konu da da, ölümünde ancak onlarca yıl sonra gerçekten başlaya cak bir tartışmaya ta o günden katıldığını görüyoruz. Peirce buna, bugün bilimle mitolojinin iç içe geçmesiyle iyice kafa karıştırıcı hale gelmiş basit bir fikri de ekliyor du: " Gelgelelim bu, makinenin bir kusuru değildir çünkü biz makineden kendi işini yapmasını istemiyoruz, bizim işimizi yapmasını istiyoruz. " Darlık tuzağı Peirce'e göre makinelerin bariz bir özniteliğiydi: " [M]akinelerin kabili yetlerinin aşılamaz sınırları vardır. Bu düzenekler belirli bir işi yapmak üzere inşa edilmişlerdir; dolayısıyla başka bir iş yapamazlar. " 1 9 Ömrünün çoğunu insan zekasının gizemini keşfetmeye adamış bu bilim insanı, makinelerin doğası gere ği zayıf ve insan zekasının yerini almaya elverişsiz ikameler olduğunu çok iyi biliyordu. Swift'in düşlemlerinde gerçek ten bilgelik saklıydı. Sonraki yüzyılda Turing, makinelere 'ilk başlatan' olma kabiliyeti kazandırabilmek için onları öncelikle bizimle soh bet etmek üzere programlamayı önerecekti. Turing elbette Peirce'ın bu konudaki itirazından haberdardı ama 1 950 tarihli makalesinde bu itirazı Leydi Lovelace'a atfediyor du. Dahası, Turing basit öğrenme algoritmalarıyla çeşitli denemeler de yapmıştı. 1 950'lerde 'algılayıcı' [perceptron] adı verilen tek katmanlı sinir ağları da ortaya çıkmıştı. Tu ring de bunun üzerine anlaşılabilir bir tavırla, insan beyni18 19
Charles Sanders Peirce, age., s. 1 6 9 . Charles Sanders Peirce, age., s. 1 69.
ÇIKARI M VE DIL - 2
ni modelleyen öğrenen makineler inşa edilebilirse Peirce ve Lovelace'ın itirazlarının savuşturulabileceğini düşünmüştü. insan " Hesaplama Makineleri ve Zeka " makalesini oku yunca, Turing'e göre makinelerin içkin kısıtlamalarından kurtulabilmesinin ve Turing Testi'ni geçebilmesinin tek yo lunun öğrenme olduğu izlenimine kapılmadan edemiyor. Fakat öyle değildi. Bu hiç gerçekleşmedi. Gerçekleşeceği ne ve gerçekleşmesi gerektiğine dair inancınsa toplum açısın dan bugün bariz bir şekilde görülebilen sonuçları oldu. Bu kitabın son kısmında kaçınılmazlık mitinin bazı sonuçlarına, özellikle de bilim üzerindeki zararlı etkilerine bakacağız. ·
1 1 1.
KISIM
M İTİ N GELECEGİ
15 MİTLER VE KAHRAMANLAR
ikirlerin sonuçları olur. Bu kısımda sizi yapay zeka miti nin bilimsel keşif ve inovasyonun geleceğine -ve ironik bi çimde, yapay zeka alanında ilerlemeye de- önemli, hatta çok ağır bir tehdit teşkil ettiğine ikna etmeye çalışacağım. Kitabın bu son kısmı bizim geleceğimiz hakkında olsa da, işe geçmiş ten başlamamız gerekiyor çünkü yaşam yaratma, yapay zeka -yani sözcüğün tam anlamıyla makineden zihin- tasarlama sorunu insanın öteden beri kendini aşan bir şeylere erişme, tanrısal güçlerle sahip olma arzusuyla iç içe geçmiştir. Bu ba kımdan yapay zeka miti Prometheusçu bir mittir.
F
Prometheusçu Mit Prometheus, yaşam ateşini Zeus'tan çalıp dünyadaki herke se et pişirmek için kullanınca Zeus öfkelenip yeryüzüne ine rek, insanlığın pişirdiği her hayvandan kendi payına düşen eti talep etmiş ama Prometheus yine ne yapıp edip Zeus'u kandırarak onun hayvanların sakatat kısmını almasını sağ lamıştı. Bunun üzerine, tanrılar birileri onların güçlerini ve otoritesini ellerinden almak istediğinde ne yapıyorlarsa Zeus da onu yaptı: Prometheus'u şiddetle cezalandırdı. Ka-
YAPAY ZEKA MiTi
yalık bir uçurumun kenarında zincire vurdu, başına d a bir kartalı (Zeus'uh simgesi) musallat etti. Bu kartal her gün Prometheus'un başına üşüşüyor ve onun ciğerini yiyordu. Geceleriyse Prometheus'un ciğeri eski haline geliyor ve bu döngü her gün tekrarlanıyordu. Bu öykü insanın gücünün artması, dünyaya hakim olma sı hakkındadır ve insanın yaradılışına ait olan ve tükenmek bilmez görünen yaratıcı ruhuna bir övgüdür. Ama aynı za manda bir kibir hikayesidir çünkü Prometheus büyüklenme yip Zeus'a etin en lezzetli ve güzel kısımlarını baştan sunmuş olsaydı ne ateşinden olurdu ne de ciğerinden. Hakiki bir ya pay zeka yaratma arzumuz da Prometheus mitinden ilham alıyor. Ebedi cezalandırmadan daha azı olmayacak korkunç sonuçlarına rağmen ateşi tanrılardan çalmak istiyoruz. Prometheus cezalandırılmış bir kahramandı. Mary Shelley'nin zamana meydan okuyan ünlü romanı da işte bu yüzden Frankenstein veya Modern Prometheus başlığı nı taşıyordu. Frankenstein romanı, sonraki on yıllar içinde defalarca Hollywood sinemasına uyarlanıp bu süreçte yeşil bir canavarın saçma sapan öyküsüne dönüştürüldüyse de aslında insanlarda var olan Prometheusçu ruhu ve bu ru hun sonuçlarını irdeliyordu. Genç ve yeni evli Mary Shelly, Frankenstein karakterini, şair kocası Percy Shelley ve bir diğer ünlü şair Lord Byron'la geç saatlere kadar tartıştığı Isviçre'deki otel odasında bir gece gördüğü bir kabusun ar dından yazmıştı. Rüyasında gördüğü imgeler canavarı tasar lamasına yetmediği için, öyküsü en başından itibaren, mo dern mitin kalbindeki temel insani soruyu soruyordu: Peki ya böyle bir varlığı yaratmak mümkünse ? Dr. Frankenstein ölü dokunun galvanize edilmesi gibi bir dizi esrarengiz yöntemi kullanarak Prometheusçu mucizeyi gerçekleştiriyordu: Cansız maddeden zeki yaşam yaratıyor du. Bu öykü zekanın bilim ve teknoloji kullanılarak meka nik biçimde yaratılmasını anlatan sonraki öykülerin atası ve her şeyden önemlisi manevi yalıtılmışlık hissini anlatan son 3 10
MiTLER VE KAHRAMANLAR
derece insani bir hikayeydi. Dr. Frankenstein tanrıyı oyna masına izin veren yasak ve gizli bilgilere sahip olmuş çatlak bir bilim adamıydı. Yaratığı canlanıp bilinç kazanıyor ve yalnızlığına derman olacak bir eş arıyordu. Öykünün so nunda Dr. Frankenstein'ın dünyası da Prometheus'unki gibi yerle yeksan oluyordu. Mary Shelley'nin 1 9 yaşındayken kaleme aldığı bu etkileyici roman, bu kadim mitin özünü ya kalayıp onu modern dünyada yeniden diriltmeyi başarmıştı. Percy Shelley de daha sonraları " Zincirlerinden Kurtulmuş Prometheus " adlı ünlü şiirini yazacaktı. Romantik yazarlar insanlık halinin sonu gelmez mücadelelerini ve çilelerini gür bir sesle dillendiriyorlardı. Bu nedenle hala onların eserle rinden bahsediyor, bugün kendi bilim anlayışımızda ve bi lim insanlarımızda hem düşlerini hem de bizi uyardıkları şeyleri görüyoruz. Turing elbette Shelley'nin anladığı anlamda bir 'çatlak bilim adamı' değildi. Nitekim Bletchley'deki çalışmalar bir işbirliğinin ürünüydü. Turing'in daha sonraları giriştiği dünyanın ilk evrensel elektronik bilgisayarını inşa etme ma cerası da aslında bir ekip işiydi . ABD'de Von Neumann'ın yeteneğine tanık olmuştu ki en sonunda Von Neumann bu konuda ondan önce davranacaktı çünkü eşine nadir rast lanır büyük bir dehaya sahipti ve elinin altında büyük bir bilimsel ve mali kaynak havuzu vardı. Turing ve Von Ne umann bilimsel maceracılardı ama dehalarını takviye edip eksiklerini gideren başka yeteneklerle dolu geniş bir çevre içinde çalışıyorlardı. Yine de Turing yapay zeka hakkında düşünürken için de Prometheusçu düşüncenin kaynadığını muhtemelen his sediyordu ki hatırlayın, yapay zekanın 2000 yılına kadar insanlarla gerçekten sohbet edebilecek hale geleceğine ina nıyordu. Üstelik kendi döneminden yeterince sayıda Pro metheusçu dahi de tanıyordu. Bu kişiler sıradan insanların ulaşamayacağı noktalara ulaşmışlardı: Einstein, mantıkçı Kurt Gödel ve elbette Von Neumann. Bir kez bilgisayar for311
YAPAY ZEKA MiTi
malizmi -Turing'in verdiği adla 'Makine'- bilimin hizme tine girdiğinde belki Bletchley ortamında çalışan bir bilim insanı onu kullanarak bu kez insan zihninin şifrelerini çözüp bilgisayara programlayabilecekti. Çünkü bilim insanları 'bi limin evrimi' gibi önceden kestirilemeyen şeylere inanmaz lar, bunları pastanın süsünden veya uygun ortamdan öte görmezler. Bunun yerine bilimsel dehaya inanırlar. Başka bir deyişle hepsinin içine gerçekten de Prometheus girmiştir; yenilikçilerin düşlediği ve başarabileceği şeylere inanırlar. Fakat yapay zeka araştırmaları ardı ardına engellere ta kıldıkça ancak bireylerin gerçekleştirebildiği sarsıcı inovas yonlara dair Prometheusçu mit de araştırma kültürünün ar ketiplerinden ve daha genel anlamda kültürden kaybolmaya başladı. İnsanın potansiyeline duyulan inanç azaldıkça bu boşluğu yapay zekanın edilgin evrimine dair bir mitoloji doldurmaya başladı. Jaron Lanier gibi bu konuyu enine boyuna düşünen eleş tirmenler bu durumun temelinde yatan sorunu " Biz bunun yerine insan zekasına ilham vermenin yollarını aramalıyız " diyerek ifade ediyorlar. Ama daha şimdiden ortada kahra man kalmadı. Bunun yerine elimizde 'kovanlar' var. 1
Kovanlar va Makineler Üzerine Zekanın konumunu insanlardan makinelere doğru kaydır mak bir çeşit gambittir. Gambit, satranç tahtasında daha iyi bir konum elde etmek için bazı taşları feda etmek anlamına gelen bir satranç terimidir. Dolayısıyla böyle bir hamlenin insan kültürü açısından kaçınılmaz birtakım sonuçları var dır. Eğer bilimsel ve empirik kanıtlar böyle bir kaymanın kaçınılmaz olduğunu gösteriyor olsaydı bu gambiti kabul1
3 I2
Jaron Lanier, You Are Not a Gadget: A Manifesto, New York: Alfred A. Knopf, 2 0 1 0 , s . 2.
MiTLER VE KAHRAMANLAR
lenmek zorunda kalırdık. Örneğin süperzeki uzaylılar çıka gelip üstün zekalarıyla insanlığı kısa sürede yenip dünya yı ele geçirselerdi böyle olurdu. Ama ortada bir kanıt yok. Dolayısıyla son kertede bu gambit insan zekasına bağlı ino vasyon kültürüne ve bilimsel ilerlemeye köstek olan kötü bir taktik olmaktan öteye gidemiyor. Mecbur kalmadığımız müddetçe insanın inovasyon kabiliyetine duyduğumuz inan cı durup dururken neden feda edelim ki ? lronik bir şekilde, muhafazakar bir taktik bu: Akıllı te lefonların süperzekaya doğru kendiliğinden evrildiği bir kez kabul edildiğinde radikal icatlar yapmak da gereksiz hale geliyor. Bir yandan dizginsiz bir 'ilerleme'den söz ederken, diğer yandan yerleşik düzeni sağlamlaştıran tasarımları ve fikirleri koruyabiliyorsunuz. Böylece insan zekası da tıpkı bir arı kovanı ya da Uzay Yo/u'ndaki Borg Kolektifi'nin kovan zihni misali bir kolektif haline geliyor. Kısacası, bu mitoloj ide insan zihni geleceğin zeki makinelerinin miadı dolmuş eski sürümüne dönüşüyor. Fakat önceki sayfalarda da gördüğümüz gibi, bu mito lojiye inanmak için geçerli hiçbir bilimsel nedenimiz yok. Gerçek hayatla mitolojik oyunlar oynamaksa hiç iyi bir fikir değil. Teknolojiyi kendi seçtiğimiz sınırları zorlamak üzere inşa etmemiz gerekiyor. İşte biz de yeni yüzyılın ilk on yılın da tam olarak bunu yaptığımızı sanmıştık.
Makinelerin Yükselişi (Halkın Yükselişiydi] 'Web 2.0', 'kullanıcıların ürettiği içerik' için wikiler ve bloglar gibi çok sayıda yeni teknolojiyle beraber sahneye çıktığında, kültür ve teknoloji eleştirmenlerinin birçoğu ar tık yeni olanaklar barındıran bir çağa girdiğimizi, insanın potansiyelini en üst noktasına taşıyacak bir teknoloji pat lamasının tam ortasında olduğumuzu düşünmüşlerdi. 2005 yılında yapay zeka araştırmaları hala 2000'lerin başındaki
YAPAY ZEKA MiTi
son İnternet balonunun yaralarını sarmaya çalışıyordu. Ma kine öğrenimi ve büyük veri henüz abartılacak kıvama gel memişti. Ama Blogcu Yurttaşlar gelmişlerdi. Nitekim 2005 yılı civarında tümden yeni bir düşünce akımı ortaya çıktı. Bu akım web'i ve özellikle Web 2.0 teknolojisini yeni yazılı basın gibi görüyor, bu teknoloj inin kaderinin, insan zekasını ve yaratıcılığını zincirlerinden kurtarmak, özgür kılmak olduğunu düşünüyordu. Web bize yalnızca daha akıllı ve daha bilgili olmayı vaat etmiyordu, ayrıca daha etkili iş birliği yapma, modern çağın dijital piramitlerini inşa etme, bilimi ve kültürü dönüştürme olanağı da sunuyordu. Gerçi bu satırları yazdığım 2020 yılından geçmişe bakınca özgün Web 2.0 fikrinin ve bağlantılı fikirlerin çoktan yitip gittiğini görüyorum. Şimdi hepsi gerçeküstü fikirler gibi görünüyor. Bir yazar, danışman ve şu aralar New Y ork Üniversitesi'nin Etkileşimli Telekomünikasyon Programı'nda bir doçent olan Clay Shirky, Web 2.0 çağının çok satılanları arasına giren Herkes Örgüt: lnternet Gruplarının Gücü ve Cogni
tive Surplus: Creativity and Generosity in a Connected Age [Bilişsel Fazlalık: Bağlantılı bir Çağda Yaratıcılık ve Cö mertlik] başlıklı kitaplarında fevkalade bilgili, toplumsal bilinç sahibi, yeni bir kişilik tipinin yükselişini bize müj deli yordu.2 Shirky'nin bu kişilik tipiyle bağlantılı eylem çağrı sı ( biraz şovence olsa da ) her yerden duyuluyordu: Web'in sakinleri kural kitaplarının tümünü yeniden yazmak üzerey diler; haberlerin ve bilginin üretimini ve akışını adil olma yan biçimde denetimleri altında tutan anaakım basın yayın organları gibi geri kafalı 'eşik bekçileri'nden dünyayı kur tarmalıydılar. 2000'lerin ortasının şiarı " Halk İktidara ! " olmuştu. Bu mem bloglarda, yorumlarda, kitap raflarında (ve e-kitaplarda ) yer alarak kendini sayısız kere kopyaladı ve her yere yaydı. Clay Shirky, Cognitive Surplus: Creativity and Generosity in a Connected Age, New York: Penguin Press, 2 0 1 0 . 3 14
M iTLER VE KAHRAMANLAR
Harvard Üniversitesi'nden Girişim Hukuku Çalışmaları profesörü Y ochai Benkler ise 2006 yılında yayımlanan ve çok okunan The Wealth of Networks: How Social Produc tion Transforms Markets and Freedom [Ağların Zenginliği: Toplumsal Üretim Pazarları Özgürlüğü Nasıl Dönüştürü yor] başlıklı ünlü kitabında, yeni bir çağın eşiğinde olduğu muzu ilan ediyordu. Bir tür devrim yaşanıyordu: İnsanlar bir araya gelip sosyal ağlar kuruyor, herhangi bir para talep etmeden, tamamen kamu yararını gözeten çevrimiçi proje lerde işbirliği yapıyorlardı.3 Wikipedia örneği de Benkler'ın bu savını destekliyor gibiydi çünkü bu çevrimiçi ansiklopedi de mali hiçbir karşılık beklenmeyen ve tamamen kamu yara rını gözeten ortak üretim olgusunu yansıtıyordu. Wired edi törü Kevin Kelly (ve başkaları da) daha sonraları Benkler'ın övgüler düzdüğü çevrimiçi işbirliği olgusuna 'kovan zihni' adını verdi. Bu deyim düpedüz arıların sosyal zekasına atıfta bulunuyordu ve en ufak bir istihza veya ironi de barındırmı yordu. Benkler herkesi Web 2 . 0 dünyasına katılmaya davet ettiği akademik ciddiyete sahip çağrısının önsözünde John Stuart Mill'den şöyle bir alıntı yapıyordu: " İnsan doğası bir modele göre üretilip ona buyrulan işi harfiyen yapması için ayarlanmış bir makine değildir, onu canlı bir şey yapan iç güçlerinin eğilimine göre enine ve boyuna büyümek, serpil mek isteyen bir ağaç gibidir. "4 Bunun harika bir alıntı oldu ğundan kuşku yok. Fakat Mill'in bu sözleri bugün ne yazık ki havada kalıyor. Bunun nedeniyse, büyük oranda, Mill'in odağında makineden ziyade insanın bulunmasıdır. Shirky'nin fikirleri de bugün bize tuhaf ve biraz da naif geliyor. Onun 'bilişsel fazlalık' [cognitive surplus] kavramı, herkesin çevrimiçi olması halinde, insanların durum kome disi izlemek gibi zihni uyuşturan çeşitli etkinlikleri bıraka bileceği veya azaltacağı düşüncesini yansıtıyordu. Nitekim 3
Yochai Benkler, The Wealth of Networks: How Social Production Transforms Markets and Freedom, New Haven, CT: Yale University Press, 2007.
4 Yochai Benkler, age., epigraf.
315
YAPAY ZEKA MİTi
Sirky'ye göre İnternet çağında insanlarda bir biliş -düşün me- gücü fazlalığı mevcuttu ve biz bu fazlalığı iyi işlerde kullanabilirdik: Örneğin Arap Baharı'nda toplumsal dev rimlerin fitilini ateşleyebilir veya kansere çare bulabilirdik. Shirky'nin bu fikrine zemin teşkil eden kitabı Herkes Örgüt, sıradan insanların mobil teknolojiyi kullanarak polislerin dolandırıcıları yakalamasına nasıl yardımcı olduklarına dair sayısız anekdotla doluydu.5 Elbette, akıllı telefonları kullanarak hala böyle katkılar da bulunabiliriz ama akıllı telefonların günlük kullanımına dair Venn şeması artık insanın kendini yetkinleştireceği bir geleceği işaret etmiyor. İşin doğrusu, 2000'lerin ortasında müj delenen düşünsel devrim hiçbir zaman gerçekleşmedi. ( Bize Wikipedia'yı sunan da zaten 'kovan zihin' denen şey değildi. Bu çevrimiçi ansiklopedinin asıl yazı işlerinin çoğu nu bugün de alanında uzman, belli başlı kişiler yapıyor. Baş kalarıysa sıradan düzeltme ve düzenleme işlerini hallediyor.) Shirky ve diğerlerinin insanın gittikçe yetkinleştiği konusun daki iyimserliği, kısa süre içinde, insanları dev bir makine nin çarkları olarak gören bir dünya görüşüne dönüştü ve en sonunda odağa makinenin ta kendisi -ağ, sistem- yerleşti. Bu da tahmin edilebileceği üzere, insan zekasına karşı yeni bir kuşkuyu tetikledi. Bu fikir bugünlerde makinelerin yük selişini konu edinen yaygın mitolojiyi besliyor. Süperbilgisa yarlar buna göre 'dev beyinler' haline geldiler. 'İnsanın potansiyeli' hangi yılda tükendi diye soracak olursak ilk yanıt herhalde 2008 yılı olacaktır. Elbette ger çekten böyle bir şey olmadıysa da bu fikrin en azından cid diye alınan çevrimiçi bir mem haline bu tarihte geldiğini söyleyebiliriz. Nitekim 'büyük veri' terimi sözlüklere o yıl girdi. Wired dergisinden Chris Anderson, bilimde kuramın yerini büyük verinin alacağını, yani yakında keşif ve icat 5
Clay Shirky, Here Comes Everybody: The Power of Organizing Without Organizations, New York: Penguin Books, 2009. [Türkçesi: Herkes Örgüt lııternet Gruplarının Gücü, çev. Pınar Şiraz, lstanbul: Optimist, 2010]
MiTLER VE KAHRAMANLAR
yapma ışının tamamen bilgisayarlara bırakılacağını iddia ettiği kışkırtıcı makaleyi o yıl yayımladı. Keza yapay zeka da veri bilimi adıyla modern bir kisveye büründürülüp ka muoyuna tekrar o yıl sunuldu. Bugün geriye dönüp bakıl dığında o günkü gidişat apaçık görülüyor: İnsana yeni bir gelecek belirleyen Blogcu Yurttaşlardan ( bireylerden) , vızır vızır ansiklopediler yazan kovan zihinlere, oradan da in sanın düşünme kabiliyetinin yerini alan, hatta bilimde bizi kuram belasından kurtaracak büyük veri ve yapay zekaya doğru adım adım gidildi. Oysa çok değil, bundan sadece iki yıl önce Benkler, Mili' den alıntı yapıp " İnsan doğası . . . bir makine değildir" diye yazmıştı. Hayret verici biçimde, Benkler'ın insanlığın çevrimiçi geleceğine dair umutları bir anda yapay zeka mitolojisi -makine devrimi- tarafından sindirilmişti: Bu makine devrimi artık insanın yaratıcılığının yerine geçiyor ve onun yaratıcı yanını görmezden geliyordu. Bugünlerde yapay zeka hakkında yapılan birçok tartışma gibi, bu dönüşümün gerekçesi ve hayata geçiriliş şekli de aptalcaydı. Bilim insanları ve düşünürler, en sonunda seslerini yük seltip kuramsız bilimin anlamsız olduğunu söylediler: Bü yük verinin çözümlenebilmesi için önce kuramsal 'model ler' yahut kuram çerçeveleri var olmak zorundaydı çünkü makine öğrenimi sistemlerine nereye bakacağını, neyi çö zümleyeceğini bu kuramlar söylüyordu. Fakat 2000'lerin ortasının Web 2.0'cı zeitgeist'ı, 2 0 1 0 yılında bir anda " Halk İktidara ! " şiarından uzaklaşıp başka bir yönde yol almaya başlamıştı bile. Bundan iki yıl sonra, yani 2 0 1 2 yılında, derin öğrenme sistemleri ünlü ImageNet yarışmalarında Flickr fotoğraf veri kümelerini kullanarak rakiplerini hezimete uğrattılar. Dahası bu sistemler ses tanıma ve içerik kişiselleştirme gibi diğer tüketici sorunlarına da hızla o güne kadar ancak rü yalarda görülebilecek çözümler vaat etmeye başladılar; so nuçta Facebook ( ki o yıl halka açılmasıyla birlikte değeri
YAPAY ZEKA M iTi
1 6 milyar doların üstüne çıkmıştı) ve Google gibi şirketlerin reklam satabilmek, sayısı milyarı bulan kullanıcılarına içe rik önerebilmek için bu sorunları çözmesi gerekiyordu. Fa cebook, Amazon, Google ve diğer teknoloji devleri, büyük verili yapay zeka kavramını hızla benimsediler ve çok geç meden Blogcu Yurttaşları herkes unuttu. Entelijansiya da blogları ve haberleri bizim yerimize yazacak yapay zekanın gelişine övgüler düzmek için birbiriyle yarışıyordu. Sırada yapay zekanın bizim yerimizi alması vardı. Bugün geriye dönüp baktığımızda, Lanier'in 2 0 1 0 tarihli "You Are Not a Gadget" [Siz Bir Aygıt Değilsiniz] manifestosunun epey öngörülü olduğunu ama bir o kadar da geç kaldığını görü yoruz: " Bir kişinin ne olduğuna ve neler olabileceğine ilişkin beklentileri son derece düşürmüş yeni bir kuşak yetişti. " 6 B u kovan zihni fikri aynı ölçüde i ç karartıcı başka bir ne denden ötürü de artık kulağa tuhaf geliyor olabilir: İnsanın potansiyelini yansıtan büyük fikirler artık son derece azaldı. 2005 yılında Google hala bir mucize, harikulade bir inovas yon örneği olarak görülüyordu. Bugünse her yerde ve her an karşımıza çıkan bu arama motoru devi, cebimizdeki bir anahtarlıktan farksız; artık onun farkında bile değiliz. Ja mes Surowiecki'nin 2005 yılında yayımlanıp çok satılanlar arasına giren Kitlelerin Bilgeliği adlı kitabının üzerinden 1 0 yıl bile geçmeden, Twitter veya diğer sosyal ağların insanları kitlesel bilgelik (yahut bildiğimiz bilgelik) sergilemeye teşvik edeceği fikri kötü bir şaka muamelesi görmeye başladı. 7 Bu da bize yapay zeka mitolojisinin alay konusu olmak bir ke nara, daha da yükselişte olduğunu anlatıyor.
6 7
Jaron Lanier, You Are Not a Gadget: A Manifesto, New York: Alfred A. Knopf, 2010, s. 1 . James Surowiecki, The Wisdom of Crowds, New York: Anchor, 2005. [Türkçesi: Kitlelerin Bilgeliği, çev. Osman Deniztekin, İstanbul: Varlık, 2 0 1 8 ]
16 YAPAY ZEKA MİTOLOJİSİ SİNİRBİLİMİ İSTİLA EDİYOR
Sinirbilim 'Kovan zihni' terimi sözlükteki yerini hala koruyor. Artık aynı ciddiyetle anılmıyorsa da bu sözcüğün bir türevi en beklenmedik yerde, bilimin tam orta yerinde peyda oldu: Kovan zihnin ardından, bilimsel keşifte 'sürüler' belirdi. Uluslararası Nöroinformatik Eşgüdüm Tesisi'nin eski yöneticisi Sean Hill'i ele alalım ( bu tesis İnsan Beyni Pro j esi olarak bilinen kapsamlı bir işbirliği girişiminin bir par çasıdır) : Hill, 20 1 5 yılında çıkan The Future of the Brain [Beynin Geleceği] başlıklı antoloj i için yazdığı bir makalede, bilimin geleceğini geniş çaplı işbirliklerinde görüyor, bilim insanlarını bir [arı veya karınca] sürü[sü]nün parçası gibi görmek gerektiğini savunuyordu: İnsan Beyni Proj esi'nin amaçlarından biri, sinirbilim ala nında yeni bir küresel işbirliğini tetikleyip kolaylaştırmak
tır. .. Bu proj e şayet camianın ilgisini çekebilirse, beyni ve beyinde karşımıza çıkabilen bozuklukları birlikte anla mada karşılaşılan büyük engellerle hep beraber mücadele eden ve her bireyin kendi katkısından ötürü atıf alabileceği
YAPAY ZEKA MiTi
bir ortamda bilim insanı sürüleri oluşturmayı amaçlamak tadır.1 Yamalı bohça misali bu fikir, 'küresel işbirliği' gibi kulağa hoş gelen bir hedefle yola çıkıyor ama bilim insanlarının bi reysel katkılarını önemsizleştiren -bireylerin büyük icatlar veya buluşlar yapma olanağını yok sayan- 'bilim insanı sürüleri' gibi abes bir eğretilemede son buluyordu. Bilim insanı sürüle rinde 'her bireyin kendi katkısından ötürü atıf alacağı' ifadesi bu durumu gizleyen beylik bir ifadeden başka bir şey değildi. Belki de Avrupa'daki ünlü İnsan Beyni Projesi'nin önemli oyuncularından Hill kötü bir günündeydi. Fakat bir zaman lar bu projenin yöneticilerinden biri olan Henry Markram da Hill'in bilimle ilgili vizyonunu destekliyor, hatta Albert Einstein gibi dahilerin artık tamamen gereksiz olduğunu sa vunuyordu: " Beynin nasıl çalıştığını açıklamak için yeni bir Einstein'a ihtiyacımız olduğu şeklinde yaygın bir inanç var. Bu inanç bize engel oluyor. Bize esas gereken, egomuzu ve kişisel hırslarımızı bir kenara bırakıp yeni bir tür kolektif sinirbilim yaratmaktır. "2 Markram'ın bu kolektif sinirbilim hayalinin aslında onun mitolojik vizyonunun bir yansıması olduğunu bugün biliyoruz: Markram süperzekalı bir bilgi sayar beyin inşa etmek istiyordu ve bilim insanlarını, sonu hüsranla bitmesi kaçınılmaz bir amaç doğrultusunda kulla nabileceği bir kaynak olarak görüyordu.
İnsanlar Başvurmasa da Olur Kovan zihinler retoriği gibi, sürü bilimi retoriği de kaçınıl maz olarak insanın potansiyelinin makinelerin yükselişi kar şısında küçümsendiği bilgisayarmerkezci bir dünya görüşü' Sean Hill, "Simulacing ehe Brain" , The Future of the Brain: Essays by the World's Leading Neuroscientists Gary Marcus ve Jeremy Freeman (ed. ), Princeton, NJ: Princeton Universicy Press, 20 1 5 , s. 1 2 3 - 1 24. Bkz. Henry Markram, "Seven Challenges for Neuroscience" , Functional Neurology, 2 8 . sayı (20 1 3 ) , s. 145- 1 5 1 . 3 20
YAPAY ZEKA M iTOLOJiSi SINIRBILIMI iSTiLA EDiYOR
ne yol açıyor. Bilim, insana dair fikirlerden dev teknolojilere varasıya çevrimiçi kültürü takip ettiği içindir ki iktidar bu gün büyük teknoloji şirketlerinin elinde toplandı ve inovas yonun hızında genel bir yavaşlama meydana geldi. Web 2.0'ın gelecekbilimcileri bunu gayet iyi biliyor. Çün kü önce 'kullanıcıların ürettiği içerik' platformları insanın olanaklarına dair yeni bir vizyon sundu. Ardından teknoloji olgunlaştı ve teknoloji olgunlaştıkça kapsamlı işbirliği çaba larına girişen insanları birbirine bağlamayı hedefleyen başka bir vizyon ortaya çıktı. En sonundaysa yapay zekanın kaçınıl mazlığı mitolojisi peyda oldu ve bu mitolojinin makinelerin geleceğine dair anlatılarında insanlar yan rollere kaydırıldı. Aynı trendi bugün bilimin temel araştırma alanlarında da görüyoruz. Vaktiyle insan zekasının en büyük zaferi adde dilen bilim, bugünlerde büyük verinin gücü ve yeni bilişim yöntemleri üzerine, pekmez kıvamında bir retorik bulamacı na dönüşmeye başladı: Artık bilim insanları mevcut kuram ları IBM'in Blue Gene gibi süperbilgisayarlarında sınamaktan başka bir görevi olmayan teknisyenler olarak görülüyorlar. Oysa bilgisayarların içgörüsü yoktur. İçgörü insanda olur. İşbirliği çabaları da ancak bireylere değer verilirse etkili ola bilir. Yani birinin bir fikirle çıkagelmesi şarttır. Turing Bletc hley'deyken bunu ya biliyordu ya da öğrenmişti. Ne yazık ki on yıllar önce çıkarılmış bu dersin yerinde bugün yeller esi yor. Teknoloji, daha doğrusu yapay zeka teknolojisi, 'biz'i ar tık yutuyor. Makineleri övelim derken Einstein'ı bile aşağılar olduk ve bu durum artık bunaltıcı bir hale geldi. Ne yazık ki büyük ölçekli sinirbilim projeleri de bu durumu doğruluyor.
İnsan Beyni Projesi İnsan Beyni Projesi, AB' den on yıllığına aldığı 1 , 3 milyar do larlık bir para ödülüyle resmi olarak 20 1 3 yılının ekim ayın da işe başladı. Bu para keşif amaçlı bir sinirbilim araştırma sı için son derece büyük bir meblağdı. Ekibin başında ise 3 21
YAPAY ZEKA M iTİ
Lozan'da bulunan İsviçre Federal Teknoloji Enstitüsü'nden sinirbilimci, Dr. Henry Markram bulunuyordu. Mark ram, epey iddialı bir girişim olan Mavi Beyin [Blue Brain] Projesi'yle adını duyurmuştu. Bu proje, fare beyninin tüm neokortikal sütununu silikon tabanlı bir ortamda, yani IBM'in Blue Gene süperbilgisayarında yürütülen bir simü lasyonda modellemeyi hedeflemişti. İnsan Beyni Projesi, Mavi Beyin Projesi'nin kapsamını genişletip bütün bir insan beynini eksiksiz biçimde bilgisa yarda simüle etmeyi hedefliyordu. Markram 2009 yılında yaptığı bir TED konuşmasında bu hedefe 10 yılda ulaşacak larını söylüyordu. Fakat birçok sinirbilimci onunla hemfikir değildi. Yapay zeka hakkındaki diğer gelecekbilimsel öngö rüler gibi, Markram'ın öngörüleri de hatalıydı, hem de son derece hatalıydı. Neyse ki bilim bu kez onun öngörülerinin başarısızlığını görmezden gelmemeyi tercih etmişti. Nitekim 20 1 9 yılında The Atlantic'te yayımlanan bir makalesinde Ed Yong, diğer sinir bilimcilerin daha işin başında öngördükleri akıbeti şu sözlerle veciz biçimde ilan edecekti: " On yıl oldu. Başaramadı. " 3 Projeyi kötü yönetmekle suçlanan Dr. Markram iki yılın sonunda projenin yönetiminden ayrıldı. Bu olaydan sadece birkaç yıl sonra bu projeyi hiç utanmadan bir yazılım projesi olarak yeniden pazarladılar. Güya bu yazılım, süregiden ve önemli sonuçlara ulaşması muhtemel araştırmaları yürüten bilim insanların işini kolaylaştıracak araçlar ve yöntemler sunuyordu. Temel bilimsel araştırmaların sürü bilimiyle yapılabile ceği fikri düpedüz bir yanılgıdır. Ayrıca, yapay zeka hak kındaki diğer abartılı iddialarda yaptığımız gibi, mevcut teknolojilerden hareketle insanın bilimsel araştırmalara mü dahalesini azaltıp -bilinçli veya bilinçsiz olarak- yeniden sü-
.ı
Ed Yong, "The Human Brain Project Hasn't Lived Up to Its Promise", The
Atlantic, 22 Temmuz 20 1 9 . 3 22
YAPAY ZEKA MiTOLOJiSi SINIRBILİMİ iSTİLA EDiYOR
perbilgisayarlara ve büyük veriye odaklanma girişimlerinin foyasını ortaya çıkarmak boynumuzun borcu olmalıdır. Markram ve Hill'in sinirbilimin geleceğine dair fikirleri de epey sorunludur. Aslına bakılırsa onların fikirleri bilim in sanlarının arasında bir süredir belirginleşen dünya çapında bir eğilime örnek teşkil ediyor: bilimi fikirlerle değil bilişimle ilerletmeye çalışmak. Markram ve insan Beyni Projesi, belki de merkezinde bilgisayarların bulunacağı Büyük Bilim'den 'doğacak' yapay zekaya dair mitolojinin en fahiş hatalarını barındıran örneklerdir. Fakat başka projeler de kamuoyunda bu kadar tanınmasalar bile aynı hatalara düşüyorlar. Örneğin insan Beyni Projesi'ne verilen ödülün hemen ar dından Obama yönetimi de aynı ölçüde iddialı bir Büyük Bilim girişimi ilan etti. Yenilikçi Nöroteknoloj ilerin Gelişti rilmesine Dayalı Beyin Araştırmaları (Brain Research thro ugh Advancing Innovative Neurotechnologies, BRAIN [BE YiN] ) adını taşıyan bu girişim, 2 0 1 4 mali yılı için ABD yö netiminden 1 00 milyon dolarlık bir başlangıç yatırımı aldı ve bu girişimin yaklaşık 1 O yıllık maliyetinin 300 milyon doları bulacağı duyuruldu. BEYiN girişimi, beynin nöron devrelerini ve birbiriyle bağlantılı çok sayıda nörondan olu şan diğer işlevsel bölgelerini modelleyebilen teknolojiler ge liştirmeye odaklanıyordu. Bu girişimin yanı sıra küçük olsa da kayda değer başka girişimler de mevcuttu. Örneğin Seatt le'daki Allen Beyin Bilimleri Enstitüsü'nün yönetiminde ha zırlanan Allen Beyin Atlası gibi beyin simülasyonu projeleri de şu an yapım aşamasındadır. Bu tür projeler beyin hakkında eksiksiz bir anlayışa ulaş ma vaadinde bulunuyor. Örneğin Markram süperbilgisa yarlarda yaptığı simülasyonu robotik alanında somutlaştı rarak dünyanın biyolojik olmayan ilk zekasını yaratmayı ta sarladığını kamuoyuna yıllardır söylüyor. Bu süreçte Büyük Beyin gibi projelerin de Alzheimer gibi beyin hastalıklarında pratik yararlar sağlayabileceği, örneğin bu hastalıkların ne denleri hakkında bize içgörüler sunabileceği vaat edilerek
YAPAY ZEKA MiTi
devlet kurumlarının ağzına bir parmak bal çalınıyor. Hat ta Başkan George H. W. Bush, vaktiyle 1 990-2000 yılları arasını 'beyin on yılı' ilan etmişti. O dönem değil belki ama bu dönem tam olarak öyle. Fakat bu noktada sorulması ge reken asıl soru şu: Bu alanda esaslı ve temelden bir ilerleme kaydedilebildi mi, kaydedilemedi mi ? İnsan Beyni Proj esi ve BEYİN girişimlerinin Büyük Bi lim proj eleri oldukları ortadadır. Bir kere, bunların hedef leri çok yüksek; tepeden tabana yönetiliyorlar; iyi fonla nıyorlar; kuram yerine mühendisliğe odaklanıyorlar ve yapay zeka proj eleri olarak bütçelendiriliyorlar. Özellikle günümüzün büyük sinirbilim girişimleri neredeyse her za man büyük veri proj eleri olarak sunuluyor. Gerçi bu pro j elerin ihtiyaç duyduğu veri miktarı kesinlikle 'büyük veri' teriminin hakkını veriyor, ona şüphe yok. Kavli Vakfı ise başka bir noktaya, BEYİN girişiminin önce 'veri tufanı nı' atlatması gerektiğine dikkat çekiyor: " Tek bir farenin beynindeki nöronların yalnızca bir kısmının ölçülmesi bile bize yaklaşık 2 7 ,5 km uzunluğundaki Büyük Hadron Çarpıştırıcısı'nın ya da en gelişmiş gözlemevlerinin sundu ğu kadar veri sunabilir. "4 Kavli Vakfı, her iki Büyük Beyin projesinin literatüründe de öne çıkan bir izleğe dikkat çe kiyor: Bu iki büyük proj e de veri güdümlü yapay zeka ile sinirbilimin evliliğini hem bilişim teknoloj ileri alanında bir meydan okuma hem de muazzam bir fırsat olarak görüyor çünkü beyinle ilgili daha fazla veriyi işleme kabiliyetinin araştırmaların başarı oranını artıracağı düşünülüyor. Büyük Beyin proj eleriyle ilgili süregiden tartışmaların merkezinde aslında büyük veri meselesi bulunuyor. Örneğin bizzat Markram, İnsan Beyni Projesi'nin bir veri bütünleş tirme girişimi olduğunda ısrarcıydı. (Yani sinirbilim değil, öyle mi ? ) Amye Kenall da BioMed Central dergisinde ya4
Kavli Vakfı, "The BRAIN Initiative: Surviving the Data Deluge " , https://www. kavlifoundation.org/science-spotlights/brain-initiative-surviving-data-deluge#. XgVezkdKhdg
YAPAY ZEKA MiTOLOJiSi SINIRBILIMI iSTiLA EDiYOR
yımlanan bir makalesinde insan Beyni Projesi'nin 'yeni bir süperbilgisayar' arayışı olduğunu, 'sinirbilimin veri yoğun luğu itibarıyla genetik bilimleri fersah fersah aştığını' yazı yordu. Kenall'ın da belirttiği üzere, mevcut süperbilgisayar lar 'petabayt ölçeğinde' çalışırken, insan Beyni Projesi'nin 'eksabayt ölçeğinde' [ 1 024 petabayt] bilgisayar kaynağına ihtiyaç duyması bekleniyor. Bu yüzden bu proje, sinirbilim araştırmalarıyla birlikte ilk eksabayt ölçekli süperbilgisaya rın geliştirilmesini de fonluyor.5 Sinirbilim ile bilişim teknolojisi araştırmaları arasında ki çizginin bulanıklaşması, bu iki projenin ortak özelliği olarak karşımıza çıkıyor. Büyük Beyin girişimlerinin beyan edilmiş hedefleri ortadayken, yapay zeka kavramlarına ve tekniklerine odaklanılması elbette kaçınılmaz bir durum. Her iki proje de şu anda beyin haritalama sorunu olarak bilinen bir sorunla karşı karşıya ve bu sorun yapısı itiba rıyla epey büyük bir hesaplama karmaşıklığına [computa tional complexity] sahip. Genetik Okuryazarlık Projesi için Rebecca Golden'ın yazdığı yazıda haritalama sorunu şöyle açıklanıyor: İnsan beyninin yaklaşık 86 milyar nörona ( 8 ,6 x 1 0 1 0), her nöronunsa muhtemelen on binlerce sinaptik bağlantı ya sahip olduğu tahmin ediliyor. Sinaptik bağlantı yerleri, ufak sohbet köşeleri misali nöronların birbiriyle bil gi alış verişi yaptıkları noktalardır. İnsan beyninde toplamda 1 00 trilyondan fazla nöron sinapsı bulunduğu tahmin ediliyor. Haliyle, sinapslar hakkında basit bir ikili bilginin ( örneğin belli bir zaman ar a lığın d a sinapsın ateşlenip ateşlenmediği nin) kaydını tutan bir bilgisayarın yaklaşık 1 00 terabaytlık bir depolama alanına ihtiyacı olacaktır. Bu kadar basit bil giyi tek bir kişi için bile bir gün boyunca, her saniye saklaAmye Kenall, " Building the Brain: The Human Brain Project and the New Supercomputer" BioMed Central, 8 Temmuz 2014, http://blogs. biomedcentral. com/bmcblog/2 0 1 4/07/0 8/building-the-brain-the-human-brain-project-and the-new-supercomputer/
3 25
YAPAY ZEKA MiTİ
mak için gereken depolama alanıysa 1 00.000 terabayttan, yani 1 00 petabayttan bile daha fazla olacaktır. Bugünkü süper bilgisayarlar yaklaşık 1 O petabayt bilgi saklayabili yor. Üstelik bu hızlı hesaba, sinapsların zaman içerisinde kurdukları yeni bağlantılar ve konum değişimleri katılmış değil. Bu bağlantıların gece alınan dinlendirici bir uykudan sonra veya girilen bir matematik dersinden hemen sonra na sıl değiştiği hesaplandığındaysa karşımıza muazzam bir sayı çıkıyor. (Evrendeki atomların tahmini sayısı olan 1 08 0 'den bile daha büyük. ) Bu bağlantı sorunu, boyutları itibarıyla çözülebilir görünmüyor. 6 Elbette Markram ve diğer araştırmacılar da sinirbilim de haritalama sorununun fiilen çözülemez göründüğünün farkındalar. Büyük verili yapay zeka idealine bu denli bağ lı kalmalarının temel nedeni de bu. Kendi deyimiyle 'veri bütünleştirme' girişiminden yeni birtakım içgörüler kendili ğinden doğacaksa nöronları ağlar (devreler) ve daha büyük işlevsel birimler (mesa devreleri) oluşturacak şekilde birbi rine bağlayan ilkeler, haritalama sorununu da sınırlayacak ve araştırmacıların bugün karşı karşıya oldukları hesaplama karmaşıklığını azaltacaktır. Başka bir deyişle, sinirbilim kuramının eksiklikleri ni büyük veri ve yapay zeka kapatacaktır. Büyük Beyin proj elerini eleştirenlerin para ve zaman kaybı olarak gör dükleri bilişim teknolojisi bu görüşe göre bunun gibi pro j elerin -eninde sonunda- başarılı olacaklarını savunan argümanın bir parçası demektir: İnsanların bugüne dek dolduramadığı boşlukları teknoloj i, yani bizzat yapay zeka dolduracaktır.
6
3 26
Rebecca Golden, "Mind-Boggling Numbers: Genetic Expression in ehe Human Brain" , Science 2 . 0, 15 Nisan 2 0 1 3 . https://www . science20.com/rebecca_gol din/mindboggling_numbers_genetic_expression_human_brain-1 09 34 5 .
YAPAY ZEKA MiTOLOJiSi SINIRBILIMI iSTiLA EDiYOR
Yine Büyük Veri Veri Beyin projeleri, özellikle de İnsan Beyni Projesi, bili me dair bu kuşatıcı vizyonu ilerletmeyi ve insan düşüncesi nin doğasıyla ilgili başlıca soruları yanıtlamayı hedefleyen cüretkar girişimlerdir. Nitekim kendi projesinin başarısızlı ğa uğramasından yılmayan Markram, bugün yapay zekaya giden yolun Veri Beyin projelerinden geçtiği fikrini yüzü kızarmadan yaymaya devam ediyor. Yapay zeka ile sinir bilimin el ele verip insan zekasının, hatta bilincin gizemini çözeceğine inanıyor. Markram yıllar içinde verdiği sayısız röportajda, dünyanın dört bir yanında hayata geçirilen di ğer projelerin de katkısıyla, yani onların verilerini de kulla narak, nöronları modellemeyi planladığını sürekli dile geti riyor: Nöronların ( iyon alışverişi seviyesinde) faaliyetlerini yöneten 'istatistiksel ilkeleri' keşfetmeyi ve tek tek nöronları birbirine bağlayıp her adımda daha büyük işlevsel birimler elde ederek, en sonunda insan beyninin eksiksiz bir haritası nı çıkarmayı umuyor. Günün sonunda bu haritanın insan benzeri davranış lar sergileme kabiliyetine sahip olacağını düşünüyor. Ray Kurzweil gibi iflah olmaz gelecekbilimciler ve yapay zeka mitlerini üreten başkaları da buna sarsılmaz bir inanç du yuyorlar. Onlara kalırsa, bir gün zeki düşüncenin ilkelerini, mühendisliğini yapıp robotlara veya diğer yapay zeka sis temlerine programlayabilecek kadar anlayabileceğiz. Sinir bilimde kaydedilecek büyük ilerlemeler sayesinde yeni bir yapay zeka çağı başlayacak. Üstelik bizden öncekilerin ba şarısız olduğu yerde biz başarılı olacağız çünkü çok büyük hacimli veriye ve bir zamanlar birbirinden kopuk araştırma lara konu olmuş bu veriyi bütünleştirip çözümleyebilecek platformlara nihayet erişimimiz olduğu için, bu ilkeleri ve kuramları en sonunda keşfedebileceğiz. Başka bir deyişle, Büyük Beyin girişimlerinin yeni ve ön cekilerden farklı gibi görünmesini sağlayan unsur, sinirbilim
YAPAY ZEKA MiTi
kuramında kaydedilen sıçrama niteliğinde birtakım ilerle meler değil, bilgisayarların hesaplama kabiliyetinin ve eri şilebilir veri hacminin artmasıdır, yani yapay zekadır. Fakat insan Beyni Projesi'nin uğradığı başarısızlığın da kuşkuya yer bırakmayacak şekilde gösterdiği üzere bu, katıksız bir kuruntudur. Savavarım karşısında tümevarım neyse, kuram karşısında teknoloji odur, yani teknoloji, bilgi akışında ku ramdan sonra gelir. Bu bakımdan özellikle bilişim teknolo j ileri inovasyonun bir ikamesi olarak görülmekte ve araştır macılar bu teknolojilerin çığır açma potansiyelini pazarlayıp dururken büyük teknoloji sistemlerini mevcut fikirleri kulla narak hayata geçirmektedirler. Bugün zihinlerimizin doğası hakkında daha iyi kuramla ra sahip olmayışımızın temel nedenlerinden birinin sinirbi lim alanındaki bilgi yetersizliği olduğu iddiası muhtemelen doğrudur veya böyle varsaymak en azından makuldür. Özel likle de insan bilişinin ilkelerini daha iyi anlamak zekanın üzerindeki sır perdesini aralayarak yapay zekaya giden yolu açabilir. En azından Markram'ın hedefi bu. Fakat büyük öl çekli beyin simülasyonları -Veri Beyin yaklaşımları- böyle bir bilginin arayışı içindelerse konuya tersinden yaklaşıyor lar demektir. Nitekim beynin nasıl işlediğine -nasıl düşün düğümüze, hissettiğimize ve algıladığımıza- ilişkin temel bir kuramın yokluğunda, nöronlar ve nöron devreleri gibi işlevsel birimlere ilişkin bilgilerimizi bilgisayar simülasyon larında ifade etmek, bilişin eksik parçalarının bu alt düzey birimlerden derlenmiş hacimli verilerden bir şekilde kendili ğinden doğacağı umuduna bel bağlıyor. Bu elbette yapay zekanın kendisiyle ilgili mitoloj inin merkezinde bulunan kibirli fikirlerden biri: Yeterince veri toplayıp makine öğrenimi ve diğer tümevarımlı yaklaşımları uyguladığımızda daha küçük ölçeklerde bilinmeyen, hatta bilinemez görünen içgörülerin, kuramların ve hipotezlerin bir şekilde kendiliğinden doğacağı kabulünü yansıtıyor. Hem insan Beyni Projesi'nin hem de ABD'deki BEYiN giri-
YAPAY ZEKA MiTOLOJiSi SİNIRBILİMİ iSTiLA EDiYOR
şiminin Veri Beyin yaratma çabaları, doğruluğu su götürür bu fikri benimsiyor. Sinirbilimin, genel olarak, bilimin mü hendisliğe -bilim insanlarının ise yardımcılar sürüsüne- in dirgenebileceğini kanıtlamış İnsan Genomu Projesi'nin izin den gideceği umuluyor. Fakat şurası unutulmamalıdır ki İnsan Genomu Projesi'nin iyi tanımlanmış hedefleri vardı ve bu hedefler büyük kuram sal zorlukları yok sayıyordu. Kısacası, bu proj e daha baştan bir mühendislik projesiydi. Neyse ki tüm Veri Beyin proje leri için durum bu değil. Sinirbilim araştırmacıları -Colum bia Üniversitesi'nden Eric Kandel'den tutun da daha önce Cal-Tech'te, şimdiyse Allen Beyin Bilimleri Enstitüsü'nde çalışan Hristof Koch'a, hatta bizzat Markram'a varasıya beyne dair çizilen bu tabloda kuramın büyük parçalarının henüz eksik olduğunu kabul ediyorlar. Bu durum özellikle beynin yüksek işlevleri konusunda geçerlidir. Buna verilen yanıtsa -ki en kuvvetli yanıt yine Markram'dan ve ihtira sından hala bir şey kaybetmemiş İnsan Beyni Proj esi'nden geliyor- büyük verinin, kuramın eksikliklerini gidereceği, bilim insanlarının geleneksel yöntemlerle araştırma yaparak artık boşa vakit harcamamaları gerektiği yönünde oluyor. ( Geleneksel yöntem, burada, sınırları sıkıca belirlenmiş so run alanlarında küçük ve sıkı tanımlanmış hedeflerin peşine düşmek anlamına geliyor. ) Görünen o ki yapay zeka çağın da kuramın keşiften ve deneyden çıkmasını bekleyemiyoruz. Bilişim yöntemlerinin insan zekasına üstün geleceğine inan mamız gerekiyor. Hem de ne tuhaftır, bilgisayarlara esnek zekayı nasıl katacağımız meselesi sırrını korurken bizden bunu yapmamız bekleniyor. Bu düpedüz hatalı bir düşünme tarzı ve bize ne kadar pahalıya mal olacağını ortalık yatışın ca muhtemelen göreceğiz. tlerlemeye dair değişmez retoriğe rağmen doğrudan si nirbilim araştırmalarına bakıldığında Veri Beyin projeleri nin bile yapıları gereği muhafazakar projeler oldukları açığa çıkıyor. Örneğin İnsan Beyni Projesi'nde çalışan araştırma-
YAPAY ZEKA MiTİ
cılar, mevcut sinirbilim araştırmalarını 'veri bütünleştirme' planlarının temeli haline getirmekten memnunlar çünkü simülasyonun karmaşıklığı arttıkça yanıtları verinin ken disinin sunacağına inanmak gibi bir yanılgıya kapılmışlar: Büyük verinin merkezindeki ilk kibir bu. Bundan ötürü bu ve benzeri diğer yapay zeka projeleri, eldeki deneysel bilgi nin her defasında biraz daha büyük simülasyonlarına ağırlık vererek, bilimsel keşif sürecinin altını oyuyorlar. Avrupa'daki insan Beyni Projesi ve şu sıralar ABD' de yü rütülen BEYiN girişimi gibi yüksek profilli Veri Beyin proje lerinin, fon sağlayan kuruluşları ve dahası durumdan haber dar olmayan halkın genelini, devasa hacimli veriyi işleyen süperbilgisayar platformlarında simülasyonu yapılabilen bu gibi mevcut bilgilerin muhafazakar bir mühendislik pro j esinden ziyade bilimsel ilerleme teşkil ettiğine inandırmış olmaları, yapay zekanın bilimdeki rolü hakkında var olan genel kafa karışıklığını gayet iyi yansıtmaktadır. Sözgelimi, ilk olarak Markram'ın savunduğu ve İnsan Beyni Projesi'nin benimsediği bir teknik bugün çeşitli kis velerle sinirbilim alanındaki başlıca girişimlerin yaygın bir parçası haline gelmiştir. 'Öngörücü sinirbilim' adı verilen bu teknik yaklaşımda araştırmacılar nöronlar arasındaki bağlantıları simüle etmeye çalışıyorlar. Bilinmeyen sinaptik bağlantılar, bilinen bağlantılardan hareketle tümevarımlı makine öğrenimi teknikleri kullanılarak saptanıyor. Bu ça lışmalarda hem geleneksel sinir ağları hem de daha güçlü derin öğrenme ağları kullanılıyor. Markram önce makine öğreniminin fare beyninin kortikal sütunlarında o güne dek bilinmeyen bağlantıları isabetli biçimde öngörebildiğini gös terdi. Standart F ölçütü istatistiklerini kullanan bir çözüm leme bu yaklaşımla neredeyse % 80'e varan bir isabetliliğe ulaştı. Bu yaklaşım bir yandan biyoloj inin veri kümelerine makine öğreniminin uygulanması konusunda bir ilerleme yi temsil ediyorsa da %20 gibi bir hata oranına sahip. Bu oranın insan beyninin tersine mühendisliğinde başvurulacak 330
YAPAY ZEKA MiTOLOJiSİ SINIRBİLIMI iSTiLA EDiYOR
stratejiler için pek de hoş olmayan birtakım içermeleri var. Bu da bir yana, böyle yaklaşımların ardındaki sığ mantık, bilim dediğimiz temel kurum açısından daha esaslı sorunlar anlamına da geliyor.
Higgs Bozonu
2012 yılında bilim insanları fiziğin standart modelinin uzun süredir eksik bir parçası olduğunu varsaydıkları Higgs bo zonunu en sonunda keşfettiler. Bu parçacığın keşfi genellikle son derece etkileyici bir teknoloj iye, Fransa-İsviçre sınırında yer alan ve yaklaşık 27,5 kilometre uzunluğunda bir tünel den oluşan Büyük Hadron Çarpıştırıcısı'na ( BHÇ) bağlanı yor. Bu tesis dünyanın en büyük süperçarpıştırıcısıdır. Bilim insanları BHÇ'yi kullanarak, evrende cisimlere kütle kazandırdığı düşünülen Higgs bozonunun varlığını sınayacak özel bir deney yaptılar. Bu bozan, adını, böyle bir parçacığın varlığını ilk kez öngören bilim insanı Peter Higgs'den alıyor. BHÇ kullanılarak gerçekleştirilen yüksek enerjili deney, Higgs'in kuramını ve öngörüsünü ilk andan itibaren doğruluyor gibiydi. (20 1 3 yılında parçacığın varlığı resmen teyit edildi . ) Gelgelelim Higgs bozonu örneği, kuramı önemsiz göste rip bilişim yöntemlerini öne çıkararak büyük veri ve yapay zeka hakkındaki vehimleri beslemek şeklinde tezahür eden çarpık bir eğilimi de gözler önüne seriyor. Süperçarpıştırıcıdan elde edilen veri dağını anlamlandı rabilmek için süperbilgisayarlara ihtiyaç olduğu doğrudur. 2012 yılında BHÇ yılda yaklaşık 25 petabayt veri üretiyor du. 20 1 8 yılına gelindiğindeyse bu sayı ikiye katlanarak yaklaşık 15 milyon yüksek çözünürlüklü sinema filminin boyutlarına denk bir boyuta ulaştı. Böyle büyük hacimli bir veri yığınının çözümlenmesinde kullanılabilen bilişim araçlarının fizikçilere atomaltı dünyayı keşfetmelerine izin 331
YAPAY ZEKA MiTi
verecek çok güçlü araçlar sunabileceğinden kimsenin kuş kusu yok ama Higgs bozonunun öyküsü çoğu zaman Büyük Bilim'in başarısı olarak sunuluyor. Bu bir anlamda doğru ama söz konusu keşfin aynı zamanda kuramsal içgörünün de bir zaferi olduğu gerçeğini perdeliyor. Hatta Higgs örneği büyük veriden ziyade kuramın başarısı açısından etkileyici bir örnek oluşturuyor. Çünkü Peter Higgs bu parçacığı as lında 1 964 yılında keşfetti, BHÇ ise onun varlığını sonradan doğruladı. Bu vaka, teknolojinin insani içgörüyü takviye et mek için doğru şekilde nasıl kullanılabildiğini gösteriyor. Higgs parçacığının varlığının teyidinden çıkarılacak ders, bilgisayarlı geleceğimiz için bir mitoloji oluşturma çağrısın da bulunmak değildir. Bunun yerine, yapay zekanın ( burada büyük veri demeli) ancak hazır bir kuram varsa işe yaradı ğıdır. Bilim açısından büyük bir karmaşa yaratma ve başa dert açma olanağı da işte tam olarak bu noktada yer alıyor. Ne yazık ki sinirbilim parçacık fiziğine benzemiyor. Bu alanda her şeyi birleştirecek bir kuramsal çerçeve yok. De mek ki sinirbilimcilerin karşı karşıya oldukları temel zorluk, Kavli Vakfı'nın ifadesiyle, ellerinde hazır bir kuramsal içgö rü olmadan, maruz kaldıkları ham 'veri tufanı'nı bir şekilde anlamlandırıp kendi amaçları doğrultusunda yönlendirebil mektir.
Kuramcılar Aranıyor Birkaç yıl önce Nature dergisinde bu durumu açıklayan bir röportaj yayımlandı. Bu röportaj a, önde gelen sinirbilim ciler Eric R. Kandel ( Columbia Üniversitesi'ne bağlı Kavli Beyin Bilimleri Enstitüsü Müdürü), Henry Markram ( insan Beyni Projesi Yöneticisi), Paul M. Mathews (Birleşik Kral lık'taki Londra Imperial College'in Beyin Bilimleri Bölümü Başkanı), Rafael Yuste ( Columbia Üniversitesi'nden Biyolo ji ve Sinirbilim Uzmanı) ve Hristof Koch (Seattle'daki Allen 332
. YAPAY ZEKA MiTOLOJiSİ SINIRBILIMI iSTiLA EDİYOR
Beyin Bilimleri Enstitüsü Baş Uzmanı) katılmıştı . Röportaj boyunca bu isimler büyük verinin, kuramın, Avrupa'daki İnsan Beyni Projesi ile ABD'deki BEYİN girişiminde işbirli ğinin rolünü tartıştılar.7 Sinirbilimin büyük zorluklarla karşı karşıya olduğu ve yanıtlarının henüz yeterli olmadığı konu sunda hepsi hemfikirdi. Örneğin Mathews " BEYİN girişimi de İnsan Beyni Projesi de temel bir zorlukla karşı karşıya: Henüz araştırmalarımızı yönlendirecek güçlü bir paradig mamız yok. Hem BEYİN girişiminin hem de İnsan Beyni Projesi'nin, anlamlı ilişkileri kendiliğinden üretmesi bek lenen 'büyük veri' derleme alıştırmaları olması çarpıcıdır" diye itiraf ediyordu. 8 Yine de Markram, bu çabalar ilerleme kaydettikçe ku ramın eksik parçalarını büyük verili yapay zekanın doldu racağından emin. Hattta bu konuda açıkça "Ne kadar çok veriye sahip olursak, modellerimiz de biyolojik açıdan o ka dar doğru olur " iddiasında bulunuyor. Markram, Nature dergisindeki röportajda İnsan Beyni Projesi'ne ve sinirbilime dair vizyonunu aşağıdaki sözlerle açık ediyordu: Bilimsel açıdan yeni bir biçime sahip, ivme kazanmış bir si nirbilimin önünü açmayı arzuluyoruz. Bu yeni sinirbilimle beyindeki örgütlenmenin çoklu katmanlarına karşılık gelen temel ilkeleri tespit edecek, bilgimizdeki büyük boşlukları doldurmak üzere bu ilkelerden sonuna kadar yararlanaca ğız. Örneğin nöronların birbiriyle bağlantı kurma ilkelerini konektoma [beynin bağlantı şeması] dair birtakım kestirim lerde bulunmak için kullanabiliriz. Beynin mantıksal hipo tezlerle yeniden yapılandırılması, beynin deneyle haritalan masına rehberlik edebilir, ivme kazandırabilir. Böylece bey ni haritalama işi bir düş olmaktan çıkıp pratik bir gerçekliğe dönüşebilir . 9 7 8 9
Yves Fregnac v e Gilles Laurent, " Neuroscience: Where I s the Brain i n the Hurnan Brain Project? '' , Nature, 3 Eylül 2014. Yves Fregnac ve Gilles Laurent, agy. Yves Fregnac ve Gilles Laurent, agy.
333
YAPAY ZEKA MiTi
Markram'ın basına verdiği uzun röportajlarını okursa nız, verinin bütünleştirilmesinin (yani dünyanın dört bir ya nından toplanan araştırma bulgularının süperbilgisayarlara dayalı teknik bir platformda bir araya getirilmesinin) , beyin hücrelerinin her örgütlenme aşamasının 'kendi kuramını doğuracağına' inandığını hemen görebilirsiniz. Yani iyon kanallarının bilgisinden yararlanan ilk nöron modelleri (bi reysel nöron davranışı hakkında moleküler düzeyde ayrıntılı bilgi) , nöron devreleri gibi işlevsel birimlerin çalışma tarzı üzerine kuramlar oluşturulmasını sağlayacak, bu kuramlar da sırası geldiğinde mikrodevreleri mesa devrelerine, mesa devrelerini de neokorteks gibi beynin tüm bölgelerine bağ lamalarına izin verecek başka ilkeler veya kuramları bize telkin edecek. Markram bu işin nasıl yürüyeceği konusunda çok açık. Büyük veri yaklaşımına başvurmayan daha küçük çaplı araş tırma ekipleri tarafından yürütülen yaratıcı araştırmaların böyle kuramlara ulaşabileceği düşüncesini de aynı kesinlikle reddediyor. Bilim insanlarını ve araştırmalarını sadece mer kezileşmiş bir teknoloj i çerçevesine girdi olarak kullanmak la ilgilendiğini açıkça kabul ediyor ve bunun 'Einstein'lara muhtaç olmayan' 'yeni bir tür kolektif sinirbilimi'nin kapı sını aralayacağına inanıyor. 1 0 'İşbirliği' gibi muğlak ve kulağa olumlu gelen fikirlere itiraz etmek güç olsa da böyle incelikli ifadelerin altında as lında büyük verinin ve yapay zekanın sinirbilimin geleceğini belirleyeceğini savunan büyük iddialar yatıyor. Markram, belli ki sırf verinin ve derin öğrenmenin kuram oluşturma sürecine yön verebileceğine inanıyor. Oysa tüm bilim tarihi ve büyük veri modasının kısa ama patlamayla büyüyen ta rihi bile böyle bir yaklaşımın ne kadar budalaca olduğunun kanıtlarını barındırıyor. 10
334
Eric Kandel, Henry Markram, Paul M. Matthews, Rafael Yuste ve Christof Koch, "Neuroscience Thinks Big (and Collaboratively) '' , Nature Reviews Neuroscience, 14.cilt, 9. sayı (201 3 ) , s. 659.
YAPAY ZEKA M İTOLOJiSi SINIRBILIMI İSTiLA EDİYOR
Mayer-Schönberger ve Cukier'in Büyük Veri & Yaşama, Çalışma ve Düşünme Şeklimizi Dönüştürecek Bir Devrim adlı kitabı gibi yaygın anlatılarda göklere çıkarılan büyük veriyle kaydedilen başarıların, temelde işletme gibi sağlam kuramlardan yoksun toplumsal alanlarda söz konusu ol duğunu gördük. Kuramın yokluğunda, büyük verili yapay zeka, veri yoğunluklu yöntemler kullanılmadan başarılı öngörülerde bulunmanın son derece güç olduğu birçok ilgi alanına gökten zembille inmiş bir nimet gibi geldi. Bu gibi örnekler iş dünyasının liderlerini teşvik edebilirler, hatta po püler kültürün ilginç bazı alanlarına da ışık tutabilirler ama genellikle yetersizdirler ve ciddi bilimsel çalışmalarda fela kete yol açabilirler. Teknoloj inin bir zaferi olarak görülen Higgs bozonunun keşfi gibi örneklerde kuramın nasıl büyük bir rol oynadığını gördük. Bu tür vakalarda sağlam bir kuramsal çerçevenin varlığı, kuramın öngördüğü sonuçların sınanmasına yar dımcı olacak, konuya odaklı ve kontrollü deneyler yapma yı olanaklı kılıyor. Bilim her zaman böyle deneylerle ittifak halinde olmuştur, dolayısıyla Higgs bozonunun keşfinde tartışmalı bir yan yok. Fakat büyük verili yapay zekanın gücüyle ilgili abartılı iddiaları da fazla desteklemiyor; Markram'ın sinirbilimde ihtiyaç duyduğu çizgide bir güce sahip olduğunu gösteren bir emare yok. Yine, sinirbilimde sağlam bir kuramsal çerçevenin olma yışı, veriye ve makine öğrenimine ağırlık veren yaklaşımların iyice şirazesinden çıkmasına neden oluyor. Araştırmacıların elinde veri güdümlü çalışmalara kılavuzluk edebilecek ku ramların sayısı ne kadar azsa, sınanabilir ve iyi tanımlanmış hipotezlerin sayısı da o kadar az, bu gibi girişimlerin veri güdümlü yaklaşımların bilinen zayıflıklarının kurbanı olma ihtimali ise o kadar fazla oluyor. Elektrik ve Elektronik Mühendisleri Enstitüsü'nün [IEEE] seçkin bir üyesi ve Berkeley'deki Kaliforniya Üni versitesi Bilgisayar Bilimleri Bölümünün Pehong Chen Kür335
YAPAY ZEKA MiTi
süsünde ordinaryüs profesör olan Michael Jordan, büyük veri ile bilimsel düşünce arasında doğru orantı görenlere (veri ne kadar fazla olursa bilimsel düşünce o kadar sağlam olur diye düşünenlere) karşı çıkıyordu. Makine öğrenimi ve büyük veri konusunda dünyanın en saygın otoritelerinden biri olan Jordan'dan bu konuda yıkıcı bir eleştiri beklemek doğru olmasa da kendisi şöyle bir öngörüde bulunuyor: "Toplum büyük veri projelerinden kaynaklanan bir hatalı pozitifler salgını yaşamak üzere. " Kendi ifadesiyle " Büyük miktarda veriye sahipseniz, hipotezlere iştahınız da artıyor. Dahası bu iştah verinin istatistiksel gücünden fazla olduğun da çıkarımlarımızın çoğu yanlış olabiliyor, hatta bunların çıkarımlardan ziyade beyaz gürültü olmaları muhtemel. " 1 1 Jordar her türlü veri için şöyle diyor: "Herhangi bir sonu cu kusursuz biçimde öngörecek en az bir sütun kombinasyo nu bulabilirim, hem de tamamen rastlantısal olarak . . . Keza sahte kombinasyonlar da bulabilirim çünkü bunların sayısı çok fazla. Bu durum milyarlarca maymunun daktilo tuşları na basmasına benziyor. Tuşlara rastgele basan maymunlar dan biri illa ki Shakespeare'in bir eserini yazacaktır. " 1 2 Jordan burada, istatistikte çok iyi bilinen bir sorunu işaret ediyor: aşırı uyum ( bu sorunu aşağıda tartışacağız) . Herhangi bir alanın nedensel veya kuramsal bilgisinin yok luğunda -yani genel zekanın yokluğunda- aşırı uyum özel likle sorun yaratıyor. Sinirbilim alanındaysa Markram'ın ve insan Beyni Projesi gibi Veri Beyin projelerinin diğer ta raftarlarının başına musallat olmuş durumda. " Korelasyon nedensellik değildir " kuralı beylik bir uyarı da olmasına rağmen, son yıllarda büyük verili yapay zeka projeleri adı11
12
Lee Gomes, "Machine-Learning Maestro Michael Jordan on the Delusions of Big Da ta and Other Huge Engineering Efforts " , IEEE Spectrum, 20 Ekim 2014, https://spectrum.ieee. org/robotics/artificial-intelligence/machinelearning m aes tro-m icha el-j ord an -on -the-de 1 usi ons-of- b ig-d ata - a nd-other-h uge engineering-efforts. Lee Gomes, agy.
YAPAY ZEKA MiTOLOJiSi SINİRBİLIMI iSTiLA EDiYOR
na ortaya atılan cüretkar iddialar bu kuralı tekrar gündeme getiriyor. Görünen o ki veri ve makine öğrenimi hakkında son yıllarda dillendirilen büyük iddiaların ardından bilgiy le ilgili apaçık hakikatleri yeniden hatırlayıp hatırlatmakta yarar var. Nitekim Marcus ve Davis de New York Times'ta ki yazılarında " büyük verinin çözümlenmesi bize örneğin 2006 yılından 201 1 yılına kadar ABD'deki cinayet oranları ile Internet Explorer'ın pazar payı arasında bir korelasyon olduğunu gösterebilir. Her ikisi de o arada keskin bir düşüş yaşadı. Yine de ikisinin arasında nedensel bir ilişkinin oldu ğunu düşünmek zor " diyerek böyle bir hatırlatma yapmak zorunda kalmışlardı. 13 Bu, malumu ilan etmek anlamına gelse de, derin öğren meyle ilgili abartılı iddialar karşısında etkili oluyor. Moda sözcükler zamanla değişti ama büyük verili yapay zekayı her derde deva diye sunmak Markram ve diğer yapay zeka mu hiplerinin cüretkar iddialarının aksine sinirbilim gibi temel alanlarda ilerlemeyi hala tehdit ediyor. Buradan çıkarılacak bir ders varsa, bu mitin insanlığın geleceği ve gerçek bilim üzerinde hakikaten birtakım pratik sonuçlarının olduğudur.
Aşın Uyum İstatistikçi Nate Silver da kuramları (modelleri) veriye aşırı uydurmanın barındırdığı tehlikelere dikkat çekiyor. Bura da 'aşırı uydurma', bir veri noktaları kümesini, gerçekten açıklayıcı gücü olmayan bir betimlemeyle zorla eşleştirmek anlamına geliyor. Bu betimleme gerçekten bir şeyleri açık lamıyor çünkü soruşturulan dağılımda yeni ve daha önce görülmemiş veri noktalarını kapsayacak şekilde genellene miyor. Burada genelleme, verideki gereksiz ayrıntıları ayık13
Gary Marcus ve Ernest Davis, " Eight (No Nine ! ) Problems with Big Dara " ,
New York Times, 6 Nisan 2014.
337
YAPAY ZEKA MiTi
layıp hakiki ilişkileri ilkeler veya kuram aracılığıyla temsil etmek anlamına geliyor. Saçılım grafiğinin doğrusal interpolasyonu, bir 'kuramın' veya veri noktaları kümesinin en basit örneğidir. Koordinat sistemindeki her veri noktası, mevcut noktaları betimleyen daha karmaşık bir çizgiyle çizilebilirse de bu betimleme, grafi ğe yeni noktalar eklendiğinde kullanışsız hale gelecektir çünkü böyle bir betimlemede noktaların dağılımı hakkında gerçek bir bilgi bulunmaz. Düz bir çizgi bunun yerine saçılmış ve rinin ortalama veya doğrusal interpolasyonunu gösterir, bu da bize verinin davranışını öngören faydalı bir model sunar. Silver'ın da belirttiği üzere aşırı uyum, eldeki veriye sahte bir güvenilirlik katıyor. Fakat yeni bir veri geldiğinde -ve eldeki model veya kurama uymadığında- bu yanılsama da tuzla buz oluyor. 14 Aşırı uyum, istatiksel çıkarımda veya çözümlemede iyi bilinen bir sorun. Üstelik büyük bilimsel girişimlerde bü yük başarısızlıkların nedeni de çoğunlukla aşırı uyum. Yine burada da kuramın varlığı araştırmacıların aşırı uyumlu modellerden ve yanıltıcı korelasyonlardan uzak durmaları na yardımcı olabilir. Nitekim Silver'ın da vurguladığı gibi, depremleri öngörmek gibi bazı ihtiraslı girişimler, deprem ler hakkında elimizde bulunan verilerle kusursuz biçimde uyumlu olmalarına rağmen ( depremlerle ilgili tarihsel kayıt ların yanı sıra fay hatlarının geriliminde meydana gelen artış ve azalış gibi olgulara dair ayrıntılı coğrafi bilgiler de kul lanılmasına rağmen) fena çuvalladılar. Bir saçılım grafiğin de mevcut noktaları menderesler çizerek açıklayan eğriler misali, bu modellerin de bir öngörü gücünün veya bilimsel değerinin olmadığı ortaya çıktı. Silver, j eologların deprem tahminlerinde nice fiyasko yaşandığının altını çiziyor. Bu fi14
Nate Silver, The Signal and the Noise: Why So Many Predictions Fail-But Some Don't, New York: Penguin Books, 2 0 1 5 . [Türkçesi: Sinyal ve Parazit: Neden Bazı Tahminler Tutar, Bazıları Tutmaz, çev. Hakan Özdemir, İstanbul: Epsilon, 201 8 ]
YAPAY ZEKA MiTOLOJiSi SINIRBILIMI iSTiLA EDiYOR
yaskoların başındaysa Rus matematiksel j eofizikçi Vladimir Keilis-Borok'un adının herkes tarafından duyulmasını sağla mış başarısızlığı bulunuyor. Keilis-Borok Moj ave Çölü'nde meydana gelecek bir depremi öngörebilmek amacıyla 2004'te belirli bölgelerdeki daha küçük depremlerin örün tülerini saptayarak bunları daha büyük depremlere doğru genelleyen 'karmaşık ve şeffaf olmayan' bir istatistiksel mo del kullanmıştı. Keilis-Borok'un şu anda Kaliforniya Fuller ton Üniversitesi'nin Jeoloji Bilimleri Bölümü Başkanı olan eski öğrencisi David Bowman, eşine az rastlanır bir bilimsel tevazu örneği sergileyerek, Keilis-Borok modelinin basitçe aşırı uyum sorunuyla malul olduğunu itiraf etti. Bowman, açıklamasının devamında, depremleri öngörme becerimizin sınırlı oluşunu, yerkabuğundaki fay hatları boyunca neler olup bittiği konusunda kuramsal bilgimizin yetersiz olma sına bağlıyordu. Silver da istatistiksel veya veri güdümlü yaklaşımlara yol gösterecek hakiki bir kuramın yokluğunda modellerin 'işaretler' yerine 'gürültüleri' yakalama tehlike siyle daima karşı karşıya olduğunun altını çiziyor.
Sinirbilim: Başkalarının Hatalarından Ders Çıkarmak mı. O da Na? Özellikle sinirbilimin bunlardan dersler çıkarması gerekiyor çünkü büyük veriye dayalı girişimler bilimin diğer alanların da daha önce yapılmış hataları tekrarlamaya mahkum gö rünüyor. Bu açıdan bakıldığında, büyük verili yapay zekaya odaklanmak ne özellikle yeni ne de özellikle cesaret verici dir. Bilimde kuramdan asla vazgeçilemeyeceğini söyleyebili riz. Kaçınılmazlık mitinin ironik yanlarından biri de kura mın sadece hakiki bilim için değil, aynı zamanda yapay zeka araştırmaları alanında yapay genel zekaya ulaşma hayalinin sürdürülebilmesi için de şart olmasıdır. Fakat modern kafa
3 39
YAPAY ZEKA MiTi
karışıklığı ve bu yaygın mitoloji yüzünden ayakların baş ol duğu söyleyebiliriz. Yine de nöronlarda etkinlik artışı ve beynin belirli bölge lerindeki nöron devreleri gibi daha küçük işlevsel birimlerin rolü hakkında elimizde kuramlar yok değil. Hatta biliş ve zeka hakkında, insan neokorteksinin işleyişinde temel bu lan yüksek düzeyli kuramlar da mevcut. Markram ve diğer lerinin de ısrarla belirttikleri üzere, bu tabloda eksik olan, birbirinden kopuk bu parçaları birleştirebilecek bir çerçeve veya kuramdır. Veri Beyin çalışmaları, ilerlemenin tabandan tavana bir yaklaşımla makine öğrenimi ve yapay zekayla sağlandığı fikrine sıkı sıkıya tutunuyor. Bu fikri ciddiye almak güç ve bunun en az iki nedeni var. Birincisi, insan zihninin silikon da yeniden inşa edilmesini amaçlayan Veri Beyin projele rinin vizyonunun büyük kısmını neokorteks etkinliğinden ilham alan yüksek düzeyli zeka kuramları oluşturuyor ki bu kuramlar umut kıracak denli genel ve kullanışsızdır. Daha sı, bu kuramların bilgisayar bilimine veya yapay zeka mü hendisliğine de pek faydaları yok çünkü bize beynin zeki davranışları üretirken gerçekte ne yaptığını yeterince açıkla yamıyorlar. Bu nedenle elimizdeki yüksek düzeyli kuramlar, veri güdümlü girişimlerin bize daha baştan çok zayıf ve çok genel bir dizi kuramsal koyut sunduğunu gösteriyor. Markram, beynin işlevsel birimlerinin en küçüğünden en büyüğüne doğru adım adım simüle edilerek sağlanacak ta bandan tavana bir ilerlemenin, elimizdeki neokortikal biliş modellerini bir şekilde iyileştireceğine veya yetkinleştireceği ne inanıyor, buna kuşku yok. Halbuki buradan daha isabetli bir sonuç çıkarmak istersek şunu söyleyebiliriz: Büyük verili yapay zekaya odaklanmak, birilerinin gönlü olsun mantı ğıyla bir dizi muğlak kuram ortaya atarak sinirbilimin asıl ayrıntılarını ve nihai başarısını büyük veri kümelerinin ve tümevarımlı bilişim yaklaşımlarının destansı güçleriyle ilgili kısmen mitoloj ik iddiaların insafına bırakmanın bahanesi
YAPAY ZEKA M iTOLOJiSi SINIRBILIMI iSTi LA EDiYOR
gibi gorunuyor. insanların karmaşık araştırma sahalarını sınanabilir kuramlarla aydınlatmayı başaramadığı durum larda makine öğrenimi ve büyük veri devreye girip sağlam kuramlar oluşturmaya yönelik geleneksel kaygıyı boşa çıka racak; bugünkü Büyük Beyin girişimlerinin mantığı bu gibi görünüyor. Elimizdeki yüksek düzeyli kuramların fazlasıyla genel ve görece sefil halini kendi gözlerimizle görebilmek için şimdi neokorteksten esinlenen insan zekası kuramlarına bir göz atacağız. Bunlar kuramın sinirbilimde önemini koruduğu nu göstermek şöyle dursun, sinirbilimden doğan kuramları günümüzün popüler bilişim paradigmalarına uydurmak ko nusunda gittikçe artan bir istekliliği sergiliyorlar. Bu durum, böyle kuramların zayıflıklarının Markram gibi vizyoner si nirbilimcileri yıldıramamasının sebebinin, büyük oranda, büyük verili yapay zekanin genel zekaya ve onun da ötesine doğru kararlı adımlarla ilerleyişi tarafından daha sonra gi derileceği şeklindeki yaygın bir inanç olduğunu akla geti riyor. Veri Beyin savunucuları bugün sinirbilim alanındaki bilim anlayışına meydan okumak yerine, gizemleri ve zayıf lıkları veriye dayalı yapay zekanın sözde büyüsüne yormaya her geçen gün biraz daha istekli hale geliyorlar. Şimdi bu neokorteks kuramlarını ele alacağız.
341
17 NEOKORTİKAL İNSAN ZEKASI KURAM LARI
ilgisayar bilimci, girişimci ve sinirbilim destekçisi Jeff
B Hawkins, yaygın kabul gören bir zeka kuramı ortaya
koydu. Palın Pilot adlı kişisel dijital asistanı geliştirmesi ve Silikon Vadisi'nde engin bilgi birikimiyle ünlenen Hawkins, 2004 yılında Zeka Üzerine adlı bir kitap yayımlayarak si nirbilim (ve yapay zeka ) alanına da el atmıştı. Bu kitap, ne okortekste gerçekleşen düşünme etkinliğine dair ciltler dol duracak sinirbilim verisini hiyerarşik bir zeka modeli kul lanarak özetlemeye çalışan, cesur ve bir o kadar da özgün bir girişimdi. 1 Bu iş için o sıralarda kurduğu ve hala faaliyet gösteren Numenta şirketi de bilişim olarak zekanın sırlarını çözmeyi hedefliyor. Hawkins, neokorteksin, duyulardan aldığı veriyi hiye rarşik katmanlar halinde 'çözdüğünü' savunuyordu. Bu hi yerarşide üst katmanlar, alt katmanlardan aldıkları veriyle öngörülerde bulunuyor ve bu süreç, hiyerarşinin en tepesine ulaşılıp alt katmanların tüm çıktısının sentezlenerek genel bir öngörücü kuramın oluşturulmasıyla son buluyordu. 1
342
Jeff Hawkins, On lntelligence: How a New Understanding of the Brain Will Lead to the Creation of Truly lntelligent Machines, New York: St. Martin's Griffin, 2005. [Türkçesi: Zeka Üzerine, çev. Zeynep Esin, İstanbul: Pegasus, 2007]
NEOKORTIKAL iNSAN ZEKASI KURAMLAR!
Hawkins'in kuramı, bazı empirik verileri, örneğin farklı girdilere göre tepkilerimizin farklı oluşunu açıklayabiliyor. Buna göre, 'daha kolay' sorunlarda neokorteks hiyerarşi sinde yukarı doğru hareket daha erken sonlanıyor (çünkü yanıta ulaşılmış oluyor) . Daha çetin sorunlarda ise korteks nöral girdiyi işleyip daha güçlü ve daha genel duyarlılık sa hibi olan üst katmanlara doğru aktarmaya devam ediyor. Ardından ya bir çözüm sunuluyor ya da asıl girdi temelinde tutarlı bir öngörüye ulaşılana dek alt katmanlara geri gön deriliyor.
Kurzweil•in Hiyerarşik Örüntü Tanıma Kuramı Ray Kurzweil de neokorteksin hiyerarşik yapısını vurgulu yordu. 2012 yılında yayımlanan Bir Zihin Yaratmak adlı ki tabında Kurzweil şöyle diyordu: " Bilgi örüntüleriyle ilgilen me becerimizden neokorteksin sorumlu olduğunu ve bunu hiyerarşik biçimde yaptığını biliyoruz. Neokorteksi olmayan hayvanlar (yani memeliler dışındaki hayvanlar) hiyerarşileri anlama kabiliyetinden büyük oranda yoksundur. "2 Kurz weil zihnin örüntü tanıma kuramı adını verdiği hiyerarşik kuramını, insan neokorteksinin yapısına ve işlevine dair ka bul görmüş somut sinirbilim bulgularından ve Hawkins'in kendi hiyerarşik anlatısı gibi öncellerinden hareketle oluş turduğunu söylüyordu. Gerçekten de neokorteksin hiyerarşik yapısının sinir bilimde sağlam temelleri vardır. Neokorteksin sütunlar halinde örgütlendiği ilk kez 1 95 7 yılında ABD'li sinirbilimci Vernon Mountcastle tarafından keşfedildi. Mountcastle, ne okorteksin, yani beynin üzerinde bulunan 2,5 milimetre ka lınlığındaki sinir lifi tabakasının, birbirine tıpatıp benzeyen Ray Kurzweil, How to Create a Mind: The Secret of Human Thought Revealed, New York: Penguin Books, 20 1 3 , s. 35.
343
YAPAY ZEKA MiTi
nöron sütunlarından oluştuğunu saptamıştı. İnsan neokor teksinde her biri yaklaşık 60.000 nöron barındıran yaklaşık yarım milyon nöron sütunu bulunmaktadır. Kurzweil, her kortikal sütunun, kendi deyişiyle 'örüntü tanıyıcılar' içerdiğini, bunların yaklaşık 1 00 nörondan oluş tuğunu ve insan neokorteksinde yaklaşık 300 milyon örüntü tanıyıcı bulunduğu ileri sürüyor. Tıpkı Hawkins gibi Kurz weil de insanın benzersiz düşünme kabiliyetlerinden, hiye rarşik biçimde yapılandıklarını varsaydığı bu örüntü tanıyı cıları sorumlu tutuyor. Bu ilginç bir hipotez ama hem Hawkins hem de Kurzweil insan zekasının basit olduğuna inanmak gibi önemli bir hata yapıyor. Önceki sayfalarda insan zekasını açıklamaya çalışan bu tür kuramların sığlığına dikkat çekmiş ve bunun gibi temel kuram oluşturma girişimlerinin yararlı olamayacak denli genel olduğunu belirtmiştim. Bu kuramların bize insan bey niyle ilgili daha sağlam bir anlayış kazandırmaktan ziyade, müelliflerine, kişisel olarak ilgi duydukları belirli bilgisayar sistemi mimarilerini inşa etme bahanesi sunduklarını tek fark eden ben değilim. Gary Marcus'un da belirttiği üze re, Kurzweil de tıpkı Hawkins gibi, beyin hakkında muğlak birtakım içgörülerden hareketle bir yandan bizim gönlümü zü de hoş tutarak bir yapay zeka kuramı sunuyor. Marcus şöyle diyor: " Beynin yapılanmış olduğunu zaten biliyoruz ama asıl mesele bu yapının teknik olarak ne yaptığı. Beyin haritasındaki nöral düzenekler beynin bilişsel düzeneklerine nasıl etki ediyor, bunu öğrenmek istiyoruz. "3 Marcus da bu tür kuramların sinirbilimde ve onunla bağ lantılı yapay zeka çalışmaları ile bilişsel bilimlerde herhangi bir ilerleme kaydetmemize izin vermeyecek denli genel ve belirsiz olduğunu işaret ediyor: 3
3 44
Gary Marcus, " Ray Kurzweil's Dubious New Theory of Mind'' , New Yorker, 15 Kasım 2012.
NEOKORTIKAL iNSAN ZEAASI KURAMLAR!
Neredeyse her canlının yaptığı her şey bir noktada hiye rarşik örüntü tanıma olarak görülebilir. Bu fikir zaten bu yüzden 1 950'lerin sonlarından beri var. Fakat zihnin bir hi yerarşik örüntü tanıyıcı olduğu iddiası tek başına bize pek bir şey anlatmıyor. Örneğin bize insanların neden dile sahip canlılar olduğunu söylemiyor (kemirgenler de muhtemelen hiyerarşik örüntü tanıma kabiliyetine sahipler ama konu şamıyorlar). Çoğu insanın neden sürekli nefsine hakim ol makta zorlandığını veya neden belki bir daha asla uğrama yacağımız kasabalardaki lokantalarda bahşiş bıraktığımızı da açıklamıyor.4 Bu tür genel kuramların dolambaçlı yollardan da olsa büyük verili yapay zekadan esinlenmiş olması ibret verici bir durumudur. Kurzweil'in, ses tanıma uygulamaları için hiyerarşik yöntemlerden yararlanan bir makine öğreni mi yaklaşımını kullandığı biliniyor; ne de olsa şimdilerde Apple'a ait ve iPhone'un parçası olan Siri uygulamasının ilk sürümünün geliştirilmesinde bizzat rol aldı. Hiyerarşik saklı Markov modelleri, büyük veriyle artık yekvücut olmuş veri çözümleme tekniklerinin bir parçasıdır. Çok kısa bir süre önceyse, bugün her yerde karşımıza çıkan derin öğrenme ağ ları, katmanlı hiyerarşiler oluşturacak şekilde düzenlenmeye başlandı. Bunun gibi yöntemlerin hepsi, görünmeyen veri üzerinde deşifre edilebilen ikili bir model üzerinden tümeva rımla verideki örüntüleri öğrenmek için büyük veri kümeleri kullanıyor. Gerçekten de bugünün hiyerarşik öğrenme yöntemleri neredeyse on yıl önceki büyük veri kadar revaçta: Derin öğ renme bunun bir örneği. Sinirbilim kuramları, yani İnsan Beyni Projesi ve BEYİN girişimi gibi projelerin tamamı, bil gisayar bilimlerinde, özellikle de büyük verili yapay zekada başarıya ulaşmış yöntemlerden ayırt edilemez hale geliyor.
4
Gary Marcus, agy.
345
YAPAY ZEKA MiTi
Markram"ın Lego Kuramı Henry Markram, 'Lego biliş kuramı' olarak da anılan ve yine fazlasıyla genel bir başka öğrenme kuramıyla da bilini yor. Bu kuram da insan neokorteksinin sütunlu ve hiyerar şik yapısına dair genel ve somut araştırma bulguları üzeri ne kurulu bir mimariyi temel alıyor.5 Markram ve Rodrigo Perin bu kuramı "Anı edinmek Lego parçalarıyla bir şeyler kurmaya benzer. Edinilen her anı, dünyanın nasıl işlenmesi, algılanması ve dünyaya nasıl tepki verilmesi gerektiğine dair doğuştan gelen temel bilgi parçalarını barındıran bir Lego bloku gibidir " sözleriyle ifade ediyorlar.6 Yine ilginç bir hi potez. Yine çok basit ve aşırı mekanik. Bariz hale gelen bir şeyi artık açıkça ifade edebilecek bir konumdayız: Sadece Veri Beyin girişimleri büyük veriyi beyinle ilgili anlayışımızda eksik kalan noktaları (örneğin Markram'ın konektomdan -sinaptik bağlantılardan- ken diliğinden doğan ilkelerinde olduğu gibi) tamamlamaya çalışmanın bir aracı olarak sunmakla kalmadı, ayrıca bu alandaki önemli kuramların kendileri de bilgisayar bilimleri paradigmalarına öylesine bağımlı hale geldi ki Veri Beyin projeleri bu saatten sonra belki de ancak bilişim fikirlerine ve kuramlarına doğru ilerleyebilir.
Çıkmaza Giren Araştırma Büyük verili yapay zekanın kuram üretmeye uygun olmadı ğını gördük. Aksine, büyük verili yapay zeka kuramın yok luğunda veriden hareketle tümevarımda bulunan yöntemleri kullandığında genellikle aşırı uyum, doygunluk ve körlük sorunlarına kurban gidiyor. Tüm bunlara veri merkezli bi5 6
Genel bir tanım için, bkz. Ferris Jabr, " Memory May be Built with Standard Building Blocks", New Scientist, 17 Mart 201 1 . Henry Markram ve Rodrigo Perin, " Innate Neural Assemblies far Lego Memory" , Frontiers in Neural Circuits, 5. sayı (20 1 1 ), s. 6 .
NEOKORTIKAL i N SAN ZEKASI KURAMLAR!
!işimin bugüne kadar hayli zayıf ve ilgi çekici olmayan ku ramlar ürettiğini, üstelik bu kuramların kuşku uyandıracak biçimde günümüzün yaygın teknoloji yaklaşımlarına bağlı olduğunu da ekleyebiliriz. Sinirbilimciler bu durumun büyük verili yapay zekanın yanı sıra Büyük Bilim'de de böyle olduğunun farkına var" maya başladılar. Paul Mathews yukarıda değindiğimiz 2 0 1 3 tarihli Nature röportajında belki d e b u durumu e n iyi orta ya koyan kişidir: " Geçmişte böyle büyük bilimsel girişim lerden doğan büyük ve yeni kavramsal bir gelişme aklıma gelmiyor" diyor.7 İnsan Beyni Projesi ve Veri Beyin girişi mine kendilerini adamış Markram ve diğerleri, sinirbilimde gerçek bir ilerleme kaydetme umutlarını büyük verili yapay zekaya bağlamış durumdalar. Oysa asıl ihtiyaç duyulan şey tam da Mathews'un önerdiği gibi, yaratıcı hipotezleri teşvik etmek ve keşif yapmak için geniş kapsamlı ve ayrı ayrı yü rütülecek araştırma gündemleri oluşturmaktır. Büyük verili yapay zeka bu amaca uygun değildir. insan Beyni Projesi'nin ilk yılında hem Markram hem de onun bu vizyonu, giderek artan sayıda sinirbilimciden yoğun eleştiriler aldı. Nihayet 2 0 1 4 yılının temmuz ayında 500'den fazla bilim insanı, Avrupa Komisyonu'na konuyla ilgili bazı kaygıları olduğunu belirten bir dilekçe yazıp pro j ede esaslı değişiklikler yapılmasını talep etti. Bu kaygıların çoğu, ihtiyaç duyulan kuram ve yaratıcı araştırma pahasına bu projenin bilişime ve büyük veriye bağlılığıyla ilgiliydi. lronik olan nokta şu ki bu dilekçe kısmen de olsa Markram'ın projenin bilişsel mimari birimini kapatma kararına tepki olarak sunulmuştu. Oysa bu birimdekiler Markram'ın belirttiği geniş kapsamlı vizyonla aynı çizgide ilerleyerek kendilerini biliş ve zekayla ilgili soruları araştır maya adamış bilim insanlarıydı. Dahası sinirbilimciler, in7
Eric Kandel, Henry Markram, Paul M. Matthews, Rafael Yuste ve Christof Koch, "Neuroscience Thinks Big ( and Collaboratively) " , Nature Reviews Neuroscience, 1 4 . cilt, 9. sayı (201 3 ) , s. 659. 3 47
YAPAY ZEKA MiTİ
san Beyni Projesi'nin beyin hakkında ortaya konan hiçbir hipotezi veya hipotez derlemesini sınamaya çalışmadığından da kaygılanıyorlardı. 8 Sinirbilimciler bu dilekçede, beyne dair daha ayrıntılı simülasyonlar yapmanın illa beynin daha iyi anlaşılmasını sağlamayacağını da belirtiyorlardı. Başka bir deyişle, yüzler ce sinirbilimci düpedüz İnsan Beyni Projesi'ne itiraz etmiş ti çünkü bu aslında bir sinirbilim araştırması değildi, daha ziyade büyük verili yapay zeka mühendisliğiydi. Markram kısa süre içinde görevinden ayrıldı ama aynı proje bu kez. bir yazılım mühendisliği örneği olarak sunuldu. Artık yapay zeka mitolojisinden payına fazla bir şey düşmüyordu ama temel araştırmada kullanılamayacak kadar kifayetsiz hale de getirilmişti.9 Columbia Üniversitesi'nden Eric Kandel, ABD'nin BE YİN girişimini daha ilk günlerinden itibaren " [insan Geno mu Projesi'nin] varmak istediği yer belliydi . . . Oysa burada nereye varılmak istendiği belli değil. İnsan zihnini anlamak ne demek ? Hangi noktada tatmin olacağız ? Bu çok ama çok daha ihtiraslı bir girişim" sözleriyle eleştiriyordu. 1 0 Markram'ın beynimizin bir gün haritalanıp süperbilgisa yarda simüle edilebileceğini -yani yapay zeka mitolojisinin nihai anlatısını- müj delediği kötü şöhretli TED konuşma sının onuncu yıldönümü olan 20 1 9 'da Scientific American ve The Atlantic dergileri, bu projede neyin yanlış gittiğini izah etmeye çalışan yazılar yayımladılar. 1 1 Bir bilim insa nının sözleriyle, "Tamam, kafatasımızın içinde beyin var. ' Yves Fregnac ve Gilles Laurent, "Neuroscience: Where Is the Brain in the Human Brain Project? " Nature News 5 1 3 . cilt, 75 1 6 . sayı (2014), s. 27 ' " Open message to the European Commission concerning the Human Brain Project. ", https://neurofuture.eu/ 1 0 Eliza Shapiro, " O bama Launches BRAIN Initiative to Map the Human Brain " , Daily Beast, 3 Nisan 2013. Güncelleme: 11 Temmuz 20 1 7. 1 1 Bkz. Stefan Thiel, "Why the Human Brain Project Went Wrong - and How to Fix It" , Scientific American, 1 Ekim 2015. Ed Yong, "The Human Brain Project Hasn't Lived Up to Its Promise" , The Atlantic, 22 Temmuz 2019.
NEOKORTIKAL i NSAN ZEl