AlphaGo

AlphaGo Google DeepMind tarafından geliştirilen Go oyununu oynayan bir program. Ekim 2015'te, 19x19'luk tahtada profesyonel bir go oyuncusunu avantaj verilmeden yenen ilk bilgisayar programı oldu.[1][2] Bu galibiyetten sonra Mart ayında Lee Sedol ile 5 maç üzerinden yapılan oyunu da 4'e karşı 1 yenerek, dan-9 seviyesinde bir go oyuncusunu avantajsız yenen ilk bilgisayar programı oldu [3].

Tarihi ve Karşılaşmalar

Go satranç gibi diğer oyunlara nazan bilgisayarların yenmesinin çok daha zor olduğu bir oyun, çünkü brute-force arama gibi yöntemlerin uygulanması zor.[1][4]

IBM'in Deep Blue Garry Kasparov'u 1997'de yendiğinden beri, yapay zekanın amatör Go oyuncularının seviyesine çıkması yirmi yıl sürdü.[1][2][5]

AlphaGo diğer Go programlarının yanında kayda değer bir ilerleme göstererek 500 maçta, Crazy Stone ve Zen dahil,[6] programların bir tanesi hariç hepsini yendi.[7] Ekim 2015'te AlphaGo Avrupa Go şampiyonu Fan Hui'yi (dan-2) yendi.[2] Bu, tam boyutlu bir tahtada profesyonel bir oyuncuyu yendiği ilk maçtı.[8] AlphaGo'nun donanımı 170 GPU ve 1,200 CPU içeriyor.[9]

Algoritma

AlphaGo'nun algoritması makine öğrenimi ve ağaç sıralaması karışımı bir teknik kullanmakta ve bunun yanında hem insan hem de bilgisayar oyuncuların maçlarıyla yoğun bir eğitimden geçirilmiştir.

Başlangıçta, sistemin yapay sinir ağları insan oyuncu uzmanlığı ile yüklendi. AlphaGo ilk aşamada uzman oyuncuların tarihi oyunlarını taklit etmek üzere eğitildi. Bunun için yaklaşık 30 milyon hamle içeren bir veritabanı kullanıldı.[10] Sistem belirli bir uzmanlık derecesine ulaştıktan sonra, aynı sistemi kullanan diğer bilgisayarlara karşı tekrar tekrar oynatıldı ve pekiştirmeli öğrenme yaparak oyununu geliştirdi.[1] Rakibinin vaktini "saygısızca" harcamamak için, sistem kazanma ihtimalinin bir eşik değerin altında olduğunu hesaplarsa otomatik olarak pes edecek şekilde programlandı. Lee'ye karşı oynadığı oyunda bu eşik değeri 20%'ydi.[11]

Kaynakça

  1. "Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning". Google Research Blog. 27 Ocak 2016. 1 Şubat 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 31 Ocak 2016.
  2. "Google achieves AI 'breakthrough' by beating Go champion". BBC News. 27 Ocak 2016. 30 Ocak 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 31 Ocak 2016.
  3. "Match 1 - Google DeepMind Challenge Match: Lee Sedol vs AlphaGo". 8 Mart 2016. 29 Mart 2017 tarihinde kaynağından arşivlendi. Erişim tarihi: 14 Aralık 2016.
  4. Schraudolph, Nicol N.; Terrence, Peter Dayan; Sejnowski, J., Temporal Difference Learning of Position Evaluation in the Game of Go (PDF), 28 Mart 2017 tarihinde kaynağından (PDF) arşivlendi, erişim tarihi: 31 Ocak 2016
  5. "Computer scores big win against humans in ancient game of Go". CNN. 28 Ocak 2016. 5 Şubat 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Ocak 2016.
  6. "Artificial intelligence breakthrough as Google's software beats grandmaster of Go, the 'most complex game ever devised'". Daily Mail. 27 Ocak 2016. 31 Ocak 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 29 Ocak 2016.
  7. "Google AlphaGo AI clean sweeps European Go champion". ZDNet. 28 Ocak 2016. 29 Ocak 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Ocak 2016.
  8. "Première défaite d'un professionnel du go contre une intelligence artificielle". Le Monde (Fransızca). 27 Ocak 2016. 29 Ocak 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 31 Ocak 2016.
  9. "Arşivlenmiş kopya". 1 Şubat 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 31 Ocak 2016.
  10. Metz, Cade (27 Ocak 2016). "In Major AI Breakthrough, Google System Secretly Beats Top Player at the Ancient Game of Go". WIRED (İngilizce). 8 Ekim 2017 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Aralık 2017.
  11. Metz, Cade (13 Mart 2016). "Go Grandmaster Lee Sedol Grabs Consolation Win Against Google's AI". WIRED. 17 Kasım 2017 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Aralık 2016.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.