Kitas Deep Mind pergalė: po šachmatų ir dirbtinio intelekto nedideliam StarCraft

2017 lapkričio, ty šiek tiek daugiau nei prieš metus, mes rašė, kad PG yra dar negali įveikti profesinius žaidėjų StarCraft. Tačiau mažiau nei metus, ir tai barjeras pasirodė kurių turi būti imtasi. Praėjusį mėnesį Londono komanda iš Didžiosios Britanijos padalinio dirbtinio intelekto tyrimų DeepMind tyliai gulėjo naują kertinį akmenį į žmonių ir kompiuterių konfrontacijos. Ketvirtadienį, ji atidarė šį pasiekimą trijų valandų atšakų "YouTube", kurioje žmonės ir robotai kovoja už gyvenimą ir mirtį.

Kitas Deep Mind pergalė: po šachmatų ir dirbtinio intelekto nedideliam StarCraft

DeepMind nugalėjo žmones Starcraft

Transliacija DeepMind parodė, kad jos robotas su dirbtiniu intelektu AlphaStar laimi profesionalų žaidėją į sudėtingas realaus laiko strategijos (RTS) StarCraft II. Čempionų Humanity, 25-metų Grzegorz Komints iš Lenkijos, skrido su 5 rezultatas: 0. Atrodo, kad už mašiną mokymosi strategijas atskleista, nežinoma specialistų, kurie konkuruoja dėl milijonų dolerių aukso puodus, kurie išduodami kasmet viename iš pelningiausių už e-sporto žaidimų pasaulyje programinės įrangos.

Kitas Deep Mind pergalė: po šachmatų ir dirbtinio intelekto nedideliam StarCraft

"Tai buvo ne taip, kaip bet kokį Starcraft vieną, kurioje aš žaidžiau," sakė Komints, žinoma pagal profesinio Mana slapyvardį.

feat DeepMind yra sunkiausia per ilgą įvykių grandinę, kad kompiuteriai užkraunami geriausias pasaulio žmonių į žaidimą ir kas laimi. Šaškės sumažėjo 1994 metais, šachmatais 1997, AlphaGo laimėjo pirmąjį žaidimą 2016 m. Robotas StarCraft - galingiausias žaidėjas dirbtinio intelekto pasaulyje; ir laukė jo atvykstant. AlphaStar pasirodė maždaug prieš šešerius metus į mašina mokymo istorijoje. Nors AlphaGo apsvaiginimo pergalė buvo 2016 - pirmieji ekspertai manė, kad šis momentas ateis bent dešimt metų - pergalę AlphaStar atrodo daugiau ar mažiau atvyko į grafiką. Iki dabar aišku, kad pakanka duomenų kiekis ir skaičiavimo galios mašinų mokymosi gali susidoroti su sudėtingomis, tačiau konkrečių problemų.

Marc Riedl, docentas Georgia Institute of Technology rasiu jaudinanti naujiena Ketvirtadienis, bet ne įspūdingas. "Mes jau pasiekė tą tašką, todėl buvo tik laiko klausimas. Tam tikra prasme, laimėti žmones žaidimai tapo nuobodu. "

Vaizdo žaidimai kaip StarCraft matematiškai sudėtingesnis nei šachmatai ar eiti. Galiojančių pozicijų pirmosios apeliacinės tarybos yra vienetas, 170 nuliai, ir lygiavertė StarCraft apskaičiuota kaip 1 iki 270 nulių, ne mažiau. Kūrimas ir valdymas karinių vienetų StarCraft reikalauja žaidėjų pasirinkimą ir atlikti daug kitų veiksmų, taip pat sprendimų priėmimą be galimybės pamatyti savo varžovams kiekvieną žingsnį.

DeepMind predolel šiuos kietas kliūtis su galingų TPU žetonų pagalba, kad "Google" išrado padidinti mašina mokymo galią. Bendrovė pritaikė algoritmai sukurtus teksto pagal nustatant veiksmų mūšio lauke, kad sukelti pergalę užduotį gydymą. AlphaStar apmokyti StarCraft nuo įrašų pusė milijono žmonių tarpusavio žaidimų, tada grojo nuolat vystosi su klonų save virtualioje lygoje, kuri yra skaitmeninių evoliucijos natūra. Dauguma botai yra įvesta šioje lygoje, kaupti patirtį, 200 metų žaidimo atitikmuo. AlphaStar, kuris įveikti Mana, nėra visagalė. Šiuo metu robotas gali žaisti tik už vieną iš trijų rasių prieinama StarCraft. Be to nežmoniškai ilgą patirtį žaidime, DeepMind pat skirtingai suvokia šį žaidimą. Jis mato viską, kas vyksta žaidime, odnvoremenno o mana teko judėti žemėlapyje matyti, kas vyksta. AlphaStar taip pat turi didesnį valdymo tikslumą ir nukreipimo vienetų nei asmens, kuris valdo kompiuterinę pelę, kompiuteris ne iš reakcijos ir mažesnis nei profesinės Gamer metu.

Nepaisant šių trūkumų, Riedel ir kiti ekspertai palankiai įvertino visą DeepMind darbą. "Tai buvo labai įspūdinga", sakė Tango Jie, mokslininkas nepriklausomo tyrimų instituto PG OpenAI, dirba žinučių, kad vaidina Dota 2 pelningiausia e-sporto žaidimas visame pasaulyje. Tokie triukai su video gali turėti potencialiai naudingų šalutinių poveikių. Algoritmai ir kodas, kuris OpenAI naudojami Dota vystymosi per pastaruosius metus, su daugiau ar mažiau pavykusių buvo pritaikyti, kad robotai daugiau apsukrus rankas.

Nepaisant to, AlphaStar iliustruoja dabartinės nišą sistemų, mašinų mokymosi apribojimus, sako Julianas Togelius, profesorius Niujorko universitete ir autorius neseniai knygą apie žaidimus ir dirbtinio intelekto. Skirtingai nuo savo žmogaus priešininkas, naujas čempionas DeepMind negali žaisti visu pajėgumu dėl skirtingų žaidimo žemėlapius ar skirtingų rasių užsieniečių žaidimo be ilgo papildomo mokymo. Be to, jis negali žaisti šaškėmis, šachmatais, arba ankstesnės versijos Starcraft. Tai nesugebėjimas dirbti net nenuostabu, yra daug lauktų AI programų, tokių kaip autonomines transporto priemonių ar robotų, pritaikytų mokslininkų problema vadinama bendrą dirbtinį intelektą (AGI, OUI). Daugiau reikšmingas mūšis tarp žmogaus ir mašinos gali būti Decathlon Rūšiuoti, su stalo žaidimai, vaizdo žaidimų ir baigiasi Dungeons & Dragons.

Apribojimai labai specializuota dirbtinį intelektą, atrodė akivaizdu, kai mana grojo demonstravimo žaidimą prieš AlphaStar, kuri buvo riboto žiūrint žemėlapius nuo asmens tipo, vieno kvadratinio metu. DeepMind duomenys parodė, kad jis yra beveik taip pat gerai, kaip vieną, tačiau mana penkių žaidimų.

Nauja valtis greitai surinkti armija pakankamai galinga, kad sutraiškyti jo oponentas-žmogaus, tačiau mana naudojamas protingas manevrai ir pralaimėjimo patirtį, išlaikyti Ai jėgas. Vėlavimas davė jam laiko surinkti savo kariuomenę ir laimėti.

Norėdami daugiau sužinoti įdomių naujienų, prašome apsilankyti pas mus Zen.