ОблоТка канала

Physics.Math.Code

60543 @physics_lib

БообщСство Ρ„ΠΈΠ·ΠΈΠΊΠΎΠ², ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊΠΎΠ² ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΎΠ². Книги, Π²ΠΈΠ΄Π΅ΠΎΡƒΡ€ΠΎΠΊΠΈ, ΡΡ‚Π°Ρ‚ΡŒΠΈ.

Physics.Math.Code

3 Π³ΠΎΠ΄Π° Π½Π°Π·Π°Π΄
ΠžΡ‚ΠΊΡ€Ρ‹Ρ‚ΡŒ Π²
πŸ“˜ Алгоритмы принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ [2023] ΠšΠΎΡ…Π΅Π½Π΄Π΅Ρ€Ρ„Π΅Ρ€, Π£ΠΈΠ»Π΅Ρ€, Рэй Книга прСдставляСт собой Π²Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² Ρ‚Π΅ΠΎΡ€ΠΈΡŽ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π² условиях нСопрСдСлСнности, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ Ρ„ΠΎΡ€ΠΌΡƒΠ»ΠΈΡ€ΠΎΠ²ΠΊΠΈ основных матСматичСских Π·Π°Π΄Π°Ρ‡ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΈΡ… Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ. РассмотрСны соврСмСнныС ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ сниТСния Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ Π½Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ ΠΈ поиска ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Ρ… стратСгий Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… сцСнариях – ΠΎΡ‚ простых рСгуляторов Π΄ΠΎ стохастичСских ΠΌΠ½ΠΎΠ³ΠΎΠ°Π³Π΅Π½Ρ‚Π½Ρ‹Ρ… систСм. ОсновноС Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ удСляСтся ΠΏΠ»Π°Π½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ с ΠΏΠΎΠ΄ΠΊΡ€Π΅ΠΏΠ»Π΅Π½ΠΈΠ΅ΠΌ, хотя Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΠ· прСдставлСнных ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² основаны Π½Π° элСмСнтах обучСния с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ. Алгоритмы Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Ρ‹ Π½Π° языкС программирования Julia. ИзданиС ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½ΠΎ спСциалистам Π² области искусствСнного ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚Π° ΠΈ систСм принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½ΠΎ студСнтам ΠΈ аспирантам. πŸ“— Algorithms for Decision Making [2022] Mykel J. Kochenderfer; Tim A Wheeler; Kyle H Wray The book first addresses the problem of reasoning about uncertainty and objectives in simple decisions at a single point in time, and then turns to sequential decision problems in stochastic environments where the outcomes of our actions are uncertain. It goes on to address model uncertainty, when we do not start with a known model and must learn how to act through interaction with the environment; state uncertainty, in which we do not know the current state of the environment due to imperfect perceptual information; and decision contexts involving multiple agents. The book focuses primarily on planning and reinforcement learning, although some of the techniques presented draw on elements of supervised learning and optimization. Algorithms are implemented in the Julia programming language. Figures, examples, and exercises convey the intuition behind the various approaches presented.