Обложка канала

Physics.Math.Code

60543 @physics_lib

Сообщество физиков, математиков и разработчиков. Книги, видеоуроки, статьи.

Physics.Math.Code

4 года назад
Открыть в
📕 Обучение с подкреплением для реальных задач. Инженерный подход [2023] Фил Уиндер 📘 Reinforcement Learning: Industrial Applications of Intelligent Agents [2021] Phil Winder, Ph.D. 💾 Скачать книги 💡 Обучение с подкреплением (англ. reinforcement learning) — один из способов машинного обучения, в ходе которого испытуемая система (агент) обучается, взаимодействуя с некоторой средой. С точки зрения кибернетики, является одним из видов кибернетического эксперимента. Откликом среды (а не специальной системы управления подкреплением, как это происходит в обучении с учителем) на принятые решения являются сигналы подкрепления, поэтому такое обучение является частным случаем обучения с учителем, но учителем является среда или её модель. Также нужно иметь в виду, что некоторые правила подкрепления базируются на неявных учителях, например, в случае искусственной нейронной среды, на одновременной активности формальных нейронов, из-за чего их можно отнести к обучению без учителя. #ИИ #искусственный_интеллект #AI #аналитика #машинное_обучение 😊 Для тех, кто захочет пожертвовать на покупку новых книг и админу на кофе с печеньем: ЮMoney: 410012169999048 Карта ВТБ: 4272290768112195 Карта Сбербанк: 2202200638175206