Google bo‘linmasi DeepMind tomonidan go o‘yini uchun ishlab chiqilgan AlphaGo Zero algortimining yangi versiyasi odam tomonidan o‘ynalgan partiyani tahlil qilmasdan turib, mustaqil o‘rganishga qodir, deb yozadi Meduza.
AlphaGo’ning yangi versiyasiga go o‘yinining faqat boshlang‘ich qoidalari kiritilgan, muvaffaqiyatli strategiyani esa dastur o‘z-o‘zi bilan o‘yinlarni modellashtirish orqali tanlaydi. Yurishning omadli variantlari algoritmda qoladi.
Uch kunlik mustaqil o‘rganishdan keyin AlphaGo Zero dunyodagi eng yaxshi go o‘yinchisini yutib chiqqan AlphaGo versiyasi ustidan g‘alaba qozondi. 40 kundan so‘ng u 90 foiz holatlarda odam bilan o‘ynalgan partiyalar asosida o‘rganadigan asl AlphaGo’ning eng mukammal versiyalaridan ustun keldi.
DeepMind kompaniyasidagilar aytishicha, bunday qadam orqali ular sun’iy intellektni inson aqli cheklovlaridan xalos qilgan. Ular eng mukammal go o‘yinchisini yaratdik, deb hisoblamoqda. Endi professionallar dastur amalga oshirayotgan yurishlardan ilhomlanib, yangi strategiyalarni o‘rganishi mumkin, deyishdi ular.
Izoh (0)