Съдържание
Чрез сънуване на повтарящи се ситуации роботите подобряват 10 пъти ефективността си
Сънуват ли роботите електронни овце? Рано е да се каже. Но подразделението на Google за изкуствен интелект – DeepMind, съобщи, че е постигнало напредък в обучението на роботи чрез метод на дълбока осъзнатост. Въпросният се доближава до човешкия сън. От компанията използват резултатите от последни неврофизични проучвания, според които сънищата подобряват консолидацията на паметта.
Подобен процес се случва и при роботите, които след обучението по „сънуване“ успяват да увеличат десетократно скоростта, с която играят видеоигри. Игрите Starcraft II и Labyrinth са обучителната среда на изкуствения интелект. Сънуващите роботи вече се справят с 87% от ефективността на професионални играчи, съобщават от DeepMind.
Паметта и съня
Проучванията показват, че наученото през деня се пресъздава от мозъка в отделни и объркано свързани епизоди по време на сън. Заедно с това човешките сънищата са предимно негативни, застрашаващи сигурността или просто неприятни. През призмата на неврофизиката обаче това има смисъл: негативните емоции съдействат за невронните връзки, които се формират и затвърждават спомените от работната памет.
DeepMind използва модела и пресъздава негативно и предизвикващо съдържание от видеоигрите в сънищата на изкуствения интелект. В „сънищата“ на роботите се възпроизвеждат части от игрите, които са особено трудни и объркващи. Те трябва да ги повтарят, докато постигнат по-добра експертност.
Компютърът ми по-умен ли е от мен?
Може да си задавате въпроса защо са им на роботите такива обучения, след като човек обикновено губи, ако играе срещу машина. Разлика е именно в това, че едните роботи се обучават, а другите се програмират. Съвременният изкуствен интелект не просто получава база данни. Той се учи да разпознава модели на действие и различните резултати, постигнати от различни действия. Това разбира се отнема доста повече време, а целта е разработването на робот с подобен на човешкия интелект.
На какво играят роботите
Labyrinth е игрова среда, в която роботите навигират през лабиринт и трябва да събират ябълки. Всяка ябълка носи определен брой точки. Впоследствие – по време на съня – роботът се връща към вече изиграна част, в която е получавал възнаграждение, като по този начин се научава да го очаква, докато я повтаря. Оказало се, че предпочитанията са към по-трудните ситуации. Тях изкуственият интелект повтаря, докато ги овладее напълно.