Именно так подумали исследователи Университета Джона Хопкинса и протестировали теорию. Они обучали робота по имени Спот с помощью позитивного подкрепления – обычно так дрессируют собак.
Система вознаграждения робота работала так же, как и у животных. Но если собаки получают за хорошо выполненную работу вкусную еду, то робот зарабатывает баллы. С помощью позитивного подкрепления Спот за несколько дней изучил то, что обычно занимает месяц.
Подробности – в статье ученых под названием «Хороший робот!».