Про це повідомляє НВ.
Як зазначають журналісти Science Alert, програмі потрібно лише чотири години, щоб освоїти всі шахові знання людства.
Після того, як алгоритм AlphaZero ознайомили тільки з правилами шахів, без стратегії, всього за чотири години він освоїв гру в так, що зміг обіграти найбільш рейтингову шахову програму – Stockfish. У серії 100 ігор проти Stockfish, AlphaZero виграв 25 ігор, граючи білими і три гри, граючи чорними. Решта партій завершилися внічию, перемог у Stockfish не було.
«Тепер ми знаємо, хто наш новий король. Це, безсумнівно, буде революціонізувати гру, але необхідно думати про те, як це може бути застосовано поза шахами», – зізнався дослідник шахів Девід Kремелі, голова сайту Chessable.
Алгоритм AlphaZero був створений на базі напрацювань за програмами AlphaGo і AlphaGo Zero, які раніше стали абсолютними чемпіонами в грі. AlphaZero розглядає менше позицій, ніж її попередниці. У звіті заявлено, що вона оцінює 80 тисяч позицій в секунду в порівнянні з 70 мільйонами в секунду у Stockfish.
На відміну від попередніх програм від DeepMind, AlphaZero створювався як алгоритм, здатний навчитися відразу декільком завданням-іграм, а не однієї. Для цього алгоритм не вчили перемагати, а давали тільки базові знання про правила гри. AlphaZero потім грав сам із собою і самостійно виробляв тактику.
«Я завжди задавався питанням, як це було б, якби більш розвинені види висадилися на Землі і показали нам, як вони грають в шахи. Тепер я це побачив», – сказав гросмейстер Пітер Хайне Нільсен, коментуючи результати AlphaZero.
ІА "Вголос": НОВИНИ