化学系エンジニアがAIを学ぶ

PyTorchでディープラーニング、強化学習を学び、主に化学工学の問題に取り組みます

強化学習

OpenAI Gym 基本的な使い方のメモ

強化学習

はじめにすぐに使い方を忘れてネットで調べているので、基本的な使い方をメモしておく。ObservationWrapperの使用例も記載する。基本的な使い方 CartPole 環境の構築(環境インスタンス生成) import gym env = gym.make("CartPole-v0") 環境の初期化。観測…

深層強化学習の簡単な例〜Double DQN適用〜

PyTorch ディープラーニング強化学習

はじめに以前の記事で簡単な問題を対象にDQN、Experience Replayを適用してみたが、今回はさらにDouble DQNを追加してみる。なお下記サイトを参考にした。 Let’s make a DQN: Double Learning and Prioritized Experience Replay – ヤロミル https://www.re…

深層強化学習(Deep Q Network, DQN)の簡単な例〜Experience Replay追加〜

PyTorch ディープラーニング強化学習

はじめに前回の記事でOpenAI Gymを使わず非常に簡単な問題を対象にDQNを適用してみたが、"Experience Replay"を入れていなかった。今回は前回の問題にExperience Replayを追加してみる。なおこれを実施するにあたり、下記サイトを参考にした。第15回 CartP…

深層強化学習(Deep Q Network, DQN)の簡単な例

ディープラーニング強化学習 PyTorch

はじめに DQNを学ぼうとして色々と調べたが、どこもかしこもOpenAI Gymを使っていて、まずそれの扱いから考えないといけないのでつらい。ここではOpenAI Gymを使わず、非常に簡単な問題を対象にDQNを適用してみることとする。Python、PyTorchを用いる。また…

反応器計算におけるQ学習2

強化学習

はじめに以前の記事で管型反応器において所望の反応率を得るという問題について強化学習（Q学習）を適用したが、今回は反応率に応じて目的成分の選択率が変化するという条件で、収率を最大化する問題を対象とする。管型反応器の例題対象とする問題は下記…

反応器計算におけるQ学習

強化学習

はじめに簡単な例として、管型反応器において反応温度を調節して所望の反応率を得るという問題について強化学習（Q学習）を適用してみる。管型反応器の例題対象とする問題は下記の通り。成分Aを反応して生成物Bを得る管型反応器がある反応器は連続運転…

スキナー箱のQ学習

強化学習

はじめにネズミがボタンを押して餌を得るという問題について強化学習（Q学習）を適用してみる。本記事の内容に関して下記書籍を参考にした。牧野浩二、西崎博光, 『Pythonによる深層強化学習入門』, オーム社 (2018) ネズミの学習問題対象とする問題は下…