обновлено
24.02.2020
02:30

Метки новостей

• Catherine . • Collection . • Exodus . • Англия . • Южная Корея
Новости по метке:

reinforcement

Switch-версия XCOM 2 Collection получила возрастной рейтинг

2018-го пошаговая стратегия получила комплект с подзаголовком Collection, куда вошли расширение War of the Chosen и DLC Resistance Warrior Pack, Reinforcement Pack и Tactical Legacy Pack.Catherine: Full Body, в свою очередь, это улучшенная и дополненная версия головоломки Catherine (2011), которая...ИГРОМАНИЯ. Новые игры, видео обзоры игр, даты выхода игр, компьютерные игры, игры для PS3, игры для Xbox

[Из песочницы] Deep Reinforcement Learning: как научить пауков ходить

Сегодня я расскажу, как я применил алгоритмы глубинного обучения с подкреплением для управления роботом. Лучшие публикации за сутки / Хабрахабр

ИИ, пытающийся избежать проблем, научился сложному поведению(2)

Будучи помещенным в постоянно меняющийся окружающий мир, ИИ пришлось обучиться сложному поведению, чтобы избегать новых ощущений. Лучшие публикации за сутки / Хабрахабр

[Перевод] Никогда больше не игнорируйте обучение с подкреплением(2)

Привет, Хабр! Представляю вашему вниманию перевод статьи «Don’t Ever Ignore Reinforcement Learning Again» автора Michel Kana, Ph.D. Обучение с учителем и обучение без учителя — это ещё не все. Все это...Лучшие публикации за сутки / Хабрахабр

[Перевод] «Глубокое обучение с подкреплением. AlphaGo и другие технологии»: анонс книги(2)

Всем привет! У нас доступна для предзаказа одна из лучших книг по обучению с подкреплением, в оригинале именуемая "Deep Reinforcement Learning Hands-on" под авторством Максима Лапаня. Вот как будет выглядеть обложка русского перевода: Чтобы вы могли оценить краткое содержание книги...Лучшие публикации за сутки / Хабрахабр

Рубрика «Читаем статьи за вас». Январь — Июнь 2019(2)

Institute, London, 2019) Uncovering and Mitigating Algorithmic Bias through Learned Latent Structure (Massachusetts Institute of Technology, Harvard University, 2019) Deep reinforcement learning from human preferences (OpenAI, DeepMind, 2017) Exploring Randomly Wired Neural Networks for Image Recognition (Facebook AI Research, 2019)...Лучшие публикации за сутки / Хабрахабр

PDDM — Новый Model-Based Reinforcement Learning алгоритм с улучшенным планировщиком(2)

Обучение с подкреплением (Reinforcement Learning) делится на два больших класса: Model-Free и Model-Based. Лучшие публикации за сутки / Хабрахабр

Пишем письмо-отказ: особенности структуры и стиля | Изучаем Английский Язык | Яндекс Дзен(4)

Supporting sentences. Здесь автор объясняет причину отказа. Обратите внимание, что обычно в письмах-отказах, написанных как обвинение, причина, как правило, выражается вначале. Positive reinforcement in the ending. В принципе, о позитивном настрое я уже говорила в предыдущей статье о письме. Это в какой-то мере перекликается...АдыгеяНатПресс

Книга «Глубокое обучение с подкреплением на Python. OpenAI Gym и TensorFlow для профи»(2)

Глубокое обучение с подкреплением (Reinforcement Learning) - самое популярное и перспективное направление искусственного интеллекта. Лучшие публикации за сутки / Хабрахабр

[Из песочницы] Как я учил змейку играть в себя с помощью Q-Network(2)

Обучение с подкреплением В машинном обучении RL(Reinforcement Learning) достаточно сильно отличается от других направлений. Лучшие публикации за сутки / Хабрахабр

[Перевод] Бег с протезами: некстген симуляция движения человека с помощью мышц, костей и нейросети(2)

Сеульского университета опубликовали исследование о симуляции движения двуногих персонажей на основе работы суставов и мышечных сокращений, использующей нейросеть с Deep Reinforcement Learning.Лучшие публикации за сутки / Хабрахабр

GRAITEC объявляет о выпуске нового программного комплекса Graitec Advance Suite 2020 - пресс-релиз на pr.adcontext.net(2)

и проектировать стены-диафрагмы, группы стен-диафрагм, железобетонные плиты с автоматической генерацией арматурных стержней и сеток благодаря новому модулю Advance BIM Designers Reinforcement Wall. Кроме того, новейшая версия Advance Design содержит множество новых функций и улучшений, которые ускоряют моделирование и облегчают анализ...PR - это жизнь

[Перевод] Глубокое обучение с подкреплением: пинг-понг по сырым пикселям

Это давно назревшая статья об обучении с подкреплением Reinforcement Learning (RL).Лучшие публикации за сутки / Хабрахабр

Интуитивный RL (Reinforcement Learning): введение в Advantage-Actor-Critic (A2C)

Люди учатся лучше всего через истории. Это история о модели Actor Advantage Critic (A2C). Лучшие публикации за сутки / Хабрахабр

[Перевод] Обзор AI & ML решений в 2018 году и прогнозы на 2019 год: Часть 2 — Инструменты и библиотеки, AutoML, RL, этика в AI(4)

в машинном зрении на 2019 год Часть 2 — Инструменты и библиотеки — Тренды в AutoML на 2019 год — Reinforcement Learning — Тренды в Reinforcement Learning на 2019 год — AI для хороших мальчиков – движение к “этичному” AI...Лучшие публикации за сутки / Хабрахабр

Что не так с обучением с подкреплением (Reinforcement Learning)?(2)

Еще в начале 2018 года вышла статья Deep Reinforcement Learning Doesn't Work Yet ("Обучение с подкреплением пока не работает"). Основная претензия которой сводилась к тому, что современные алгоритмы обучения...Лучшие публикации за сутки / Хабрахабр

[Перевод] Обучение с подкреплением на языке Python(2)

В последней публикации уходящего года мы хотели упомянуть о Reinforcement Learning - теме, книгу на которую мы уже переводим.Лучшие публикации за сутки / Хабрахабр

Доказан редкий механизм эволюции(2)

Доказан редкий механизм эволюции

В новой работе ученые изучили гибридную зону двух видов обезьян-ревунов в Мексике - черных ревунов и колумбийских ревунов, которые разошлись около три миллиона лет назад и лишь в последние 10 тысяч лет стали снова контактировать. Хроника мировых событий

Доказан редкий механизм эволюции(2)

Ученые Мичиганского университета (США) наблюдали в дикой природе доказательство существования редкой формы естественного отбора, который способствует усилению (англ. reinforcement) репродуктивной изоляции двух близкородственных видов. Постсовет.RU

Можно ли обучить с подкреплением агента для торговли на рынке акций? Реализация на языке R(2)

R, я призываю пользователей и программистов R приблизиться к идеям, изложенным в этом материале. Это перевод моей англоязычной статьи: Can Reinforcement Learning Trade Stock? Implementation in R. Хочу предупредить код-хантеров, что в этой заметке есть только код нейронной сети, адаптированной...Лучшие публикации за сутки / Хабрахабр

14.12.2018(Crtl →)