Vaadake, kuidas see AI politseinik sõidab AI jeepiga



Sebastian Schuchmanni nimeline masinõppe arendaja töötas hiljuti välja närvivõrkude paari. Alguses olid nad nagu õed-vennad, õppides teed võõras uues maailmas koos ainult üksteisega ettevõtte jaoks. Siis sundis ta neid võitlema oma YouTube'i tellijate lõbustamiseks.

Võrgud, mida videomängude maailmas esindati politseiristleja ja rohelise džiipina, loodi Unity3D-s. Shuchmann ütles vastusena oma YouTube'i lehel olevale videole:

Unity kuttidel on masinõppe raamistik nimega ML-Agents, mida ma kasutan enamiku oma asjade jaoks. See rakendab selliseid algoritme nagu PPO (see on sama asi, mida OpenAI kasutab). Praegu liigutan rohkem oma treeninguid pilves, et tootmise aega kiirendada. Kuid muidugi tuleb see maksta.

Iga närvivõrk ehitati selleks, et kasutada konkreetse ülesande täitmiseks tugevdusõpet. Sel juhul peab politseiauto peatama Jeepi valge joone ületamise. Kui see õnnestub, siis premeeritakse teda, kui ebaõnnestub, siis karistatakse. Jeepi puhul kehtib ebasoodne olukord.

Arvatavasti ei puhka meelt pärast selle vaatamist – autod enamasti eksivad ja lähevad ringidesse aeg-ajalt lühikese liikumissuunaga, mis on mõistlik. Kuid see on suurepärane näide sellest, kuidas tugevdusõpe töötab. Praeguse AI-paradigma kohaselt masinad joonistavad asjad läbi jõhkra jõu. Video alguses istuvad autod seal lihtsalt liikumatult, hiljem mängivad nad peaaegu mängu.

Piisava ajavaru korral näitasid need autod tõenäoliselt üliinimlikku taktikat, kuna nad jätkasid oma võrgu optimeerimist eesmärgi saavutamiseks. Mõned AI eksperdid kardavad, et selline „avatud” õppimisolukord võib lõppeda viimsepäeva stsenaariumiga.

Kuid praegu on see lihtsalt väga lahe viis saada ülevaade sellest, kuidas masinad tänapäeva masinõppe süsteeme kasutades mõtlevad. Shuchmanni teisi videoid saate vaadata siit.

Külastage meie tehisintellekti jaotist, et saada rohkem uudiseid ja analüüse AI maailmast.