📕 Обучение с подкреплением для реальных задач. Инженерный подход [2023] Фил Уиндер
📘 Reinforcement Learning: Industrial Applications of Intelligent Agents [2021] Phil Winder, Ph.D.
💾 Скачать книги
💡 Обучение с подкреплением (англ. reinforcement learning) — один из способов машинного обучения, в ходе которого испытуемая система (агент) обучается, взаимодействуя с некоторой средой. С точки зрения кибернетики, является одним из видов кибернетического эксперимента. Откликом среды (а не специальной системы управления подкреплением, как это происходит в обучении с учителем) на принятые решения являются сигналы подкрепления, поэтому такое обучение является частным случаем обучения с учителем, но учителем является среда или её модель. Также нужно иметь в виду, что некоторые правила подкрепления базируются на неявных учителях, например, в случае искусственной нейронной среды, на одновременной активности формальных нейронов, из-за чего их можно отнести к обучению без учителя.
#ИИ #искусственный_интеллект #AI #аналитика #машинное_обучение
😊 Для тех, кто захочет пожертвовать на покупку новых книг и админу на кофе с печеньем:
ЮMoney: 410012169999048
Карта ВТБ: 4272290768112195
Карта Сбербанк: 2202200638175206