AlphaZero — SI, який незабаром переможе з людьми в DOTA і StarCraft

0
579

AlphaZero — це штучний інтелект, створений DeepMind, відділенням Alphabet в Лондоні. Ця система може навчитися грати в ігри, знаючи лише основні правила. Поки що це ігри, в яких «сильні сторони» обох сторін відразу видно в повній мірі. Так само, як у шахах, Shogi чи Go. Написавши «вчитися самостійно» — ми маємо на увазі лише основну інформацію про правила гри. Коли АльфаЗеро вчиться грати зі своїм суперником або з собою. Він робить висновки та отримує знання про найкращі кроки та рішення в швидких темпах. Дослідження на цю тему було опубліковано в науковому журналі Science.

Дослідження AlphaZero очолювали команда Девіда Сілвера з DeepMind. Стаття в науці супроводжувалася коментарем Мюррея Кемпбелла, дослідника AI в IBM, співзасновника Deep Blue.

AlphaZero - SI, який незабаром переможе з людьми в DOTA і StarCraft

Та сама компанія — DeepMind створила AlphaGo, комп’ютерну програму для відтворення Go, що працює на нейронних мережах DeepMind. У жовтні 2015 року він переміг європейського чемпіона Фан Хуі. Уперше штучний інтелект переміг професійного гравця Go. AlphaGo потребувала людської допомоги, щоб пройти курс навчання та вдосконалення, який триватиме кілька місяців. AlphaZero навчився грати в «Go» всього за три дні. І він легко переміг AlphaGo. «Ця робота закрила десятиріччя у дослідженнях з штучного інтелекту», пише Кемпбелл, який був членом команди, яка розробляла IBM Deep Blue. Це суперкомп’ютер, який в 1997 році переміг Гаррі Каспарова, тодішнього чемпіона світу з шахів. «Вчені штучного інтелекту повинні шукати нове покоління ігор, щоб дати їм більше проблем».

AlphaZero - SI, який незабаром переможе з людьми в DOTA і StarCraft

AlphaZero може зламати будь-яку гру, яка містить всю інформацію для прийняття рішень. А як щодо іншого? Де не всі відомості, необхідні для того, щоб визначити наступний крок видно? Як приклад такої гри ви можете дати покер, де гравець бачить лише свої карти. Інші приклади в статті включають в себе багатокористувацькі ігри, такі як StarCraft II або Dota. Дослідники кажуть, що вони можуть бути викликом, але не надовго. «AlphaZero вже переміг найкращих гравців в Dota 2, хоча це була обмежена версія гри,» StarCraft «може бути трохи складніше, але я думаю, що обидві ігри можуть виграти ІС через два-три роки».

AlphaZero - SI, який незабаром переможе з людьми в DOTA і StarCraft

Ми знаємо, що при вирішенні реальних проблем в житті ми рідко володіємо всією інформацією, необхідною для їх вирішення. Ось чому штучний інтелект, який опануватиме будь-яку гру з недосконалою інформацією, можна використовувати практично в будь-якій галузі — у фінансовому моделюванні, водіння та навіть у війні. AlphaZero — це система навчання, яка підкреслює, як випливає з назви, що він навчається, граючи в грі багаторазово та на основі накопиченого досвіду. Це схоже на те, як люди вчаться. Система також використовувала метод пошуку, відомий як «Пошук по дереву Монте-Карло» (скорочено як MCTS). Комбінація обох технологій дозволяє системі навчитися вдосконалювати гру. Дослідники дали тестовій системі високу потужність.

НОВОСТИ ПАРТНЕРОВ

БОЛЬШЕ НОВОСТЕЙ