Google бўлинмаси DeepMind томонидан го ўйини учун ишлаб чиқилган AlphaGo Zero алгортимининг янги версияси одам томонидан ўйналган партияни таҳлил қилмасдан туриб, мустақил ўрганишга қодир, деб ёзади Meduza.
AlphaGo’нинг янги версиясига го ўйинининг фақат бошланғич қоидалари киритилган, муваффақиятли стратегияни эса дастур ўз-ўзи билан ўйинларни моделлаштириш орқали танлайди. Юришнинг омадли вариантлари алгоритмда қолади.
Уч кунлик мустақил ўрганишдан кейин AlphaGo Zero дунёдаги энг яхши го ўйинчисини ютиб чиққан AlphaGo версияси устидан ғалаба қозонди. 40 кундан сўнг у 90 фоиз ҳолатларда одам билан ўйналган партиялар асосида ўрганадиган асл AlphaGo’нинг энг мукаммал версияларидан устун келди.
DeepMind компаниясидагилар айтишича, бундай қадам орқали улар сунъий интеллектни инсон ақли чекловларидан халос қилган. Улар энг мукаммал го ўйинчисини яратдик, деб ҳисобламоқда. Энди профессионаллар дастур амалга ошираётган юришлардан илҳомланиб, янги стратегияларни ўрганиши мумкин, дейишди улар.
Изоҳ (0)