Группа исследователей из Эдинбургского и Чжэцзянского университетов разработала универсальный способ, позволяющий роботам быстро вырабатывать новые приспособительные реакции.
Их методика извлекает и объединяет навыки из глубоких нейронных сетей (DNN), сочетая их с помощью отдельной генеративной нейросети (GNN).
Авторы назвали свою систему мультиэкспертной архитектурой обучения (MELA) и подчёркивают, что «как целое, она больше, чем сумма её частей». В тестах MELA смогла самостоятельно изучить новые функции, которые ни одна из DNN не способна освоить в одиночку.
К примеру, четвероногий робот с одной DNN научился бегать рысью, а другой — медленно передвигаться по скользкому полу. Сочетание их DNN позволило третьему роботы быстро двигаться по скользким поверхностям.
По мере того, как MELA узнавала больше о своих составных частях и их способностях, она научилась использовать их вместе путем проб и ошибок способами, которым ее не учили.
Например, MELA научилась применять элементы сценария «подъём после падения» для балансировки при движении по разным покрытиям и стабилизации при выходе из строя одного из двигателей.
Исследователи предполагают, что их работа предлагает новую парадигму машинного обучения. В ней людям почти не нужно вмешиваться, когда робот сталкивается с новыми задачами.
«Во время работы MELA постоянно смешивает несколько DNN и динамически синтезирует новую DNN для выработки адаптивного поведения в ответ на меняющиеся ситуации», – пояснил ведущий разработчик проекта Чуанью Ян.