Top.Mail.Ru
Москва Москва, ул. Малая Никитская 12, стр.12, метро Баррикадная, метро Тверская
ПН – ВС 11:00 – 21:00
+7 (495) 229-75-47
Адрес:
Москва, ул. Малая Никитская 12, стр.12, метро Баррикадная, метро Тверская
ПН – ВС 11:00 – 21:00
Екатеринбург Екатеринбург, ул. Бориса
Ельцина, д. 3
ПН – ВС 10:00 – 21:00
+7 (343) 361-68-07
Адрес:
Екатеринбург, ул. Бориса
Ельцина, д. 3;
ПН – ВС 10:00 – 21:00
Заказать звонок
Пиотровский
Книги
ВСЕ КАТЕГОРИИ
Все книги
Non-Fiction
Все книги категории
Все книги жанра

Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи

Аннотация

Глубокое обучение с подкреплением (Reinforcement Learning) — самое популярное и перспективное направление искусственного интеллекта. Практическое изучение RL на Python поможет освоить не только базовые, но и передовые алгоритмы глубокого обучения с подкреплением. Вы начнете с основных принципов обучения с подкреплением, OpenAI Gym и TensorFlow, познакомьтесь с марковскими цепями, методом Монте-Карло и динамическим программированием, так что «страшные» аббревиатуры DQN, DRQN, A3C, PPO и TRPO вскоре перестанут вас пугать. Вы узнаете об агентах, которые учатся на человеческих предпочтениях, DQfD, HER и многих других последних достижениях RL. Прочитав книгу, вы приобретете знания и опыт, необходимые для реализации обучения с подкреплением и глубокого обучения с подкреплением в реальных проектах, и войдете в мир искусственного интеллекта.

Характеристики

Год выпуска
2020
Переплет
твердый
Тираж
1200
Формат
70x100/16
Количество страниц
320
Товара нет в наличии
Похожие товары

Характеристики

Год выпуска
2020
Переплет
твердый
Тираж
1200
Формат
70x100/16
Количество страниц
320

Аннотация

Глубокое обучение с подкреплением (Reinforcement Learning) — самое популярное и перспективное направление искусственного интеллекта. Практическое изучение RL на Python поможет освоить не только базовые, но и передовые алгоритмы глубокого обучения с подкреплением. Вы начнете с основных принципов обучения с подкреплением, OpenAI Gym и TensorFlow, познакомьтесь с марковскими цепями, методом Монте-Карло и динамическим программированием, так что «страшные» аббревиатуры DQN, DRQN, A3C, PPO и TRPO вскоре перестанут вас пугать. Вы узнаете об агентах, которые учатся на человеческих предпочтениях, DQfD, HER и многих других последних достижениях RL. Прочитав книгу, вы приобретете знания и опыт, необходимые для реализации обучения с подкреплением и глубокого обучения с подкреплением в реальных проектах, и войдете в мир искусственного интеллекта.
Заказать звонок
Пожалуйста, укажите Имя
Введите корректный номер телефона