mi-reinforcement-learning/a00036_source.html

 #ifndef SRC_APPLICATION_GRIDWORLDVALUEITERATION_HPP_

 #define SRC_APPLICATION_GRIDWORLDVALUEITERATION_HPP_


 #include <vector>

 #include <string>


 #include <application/Application.hpp>


 #include <types/Gridworld.hpp>

 #include <types/MatrixTypes.hpp>

 #include <types/Action2D.hpp>

 #include <types/Position2D.hpp>


 namespace mic {

 namespace application {


 class GridworldValueIteration: public mic::application::Application {

 public:

     GridworldValueIteration(std::string node_name_ = "application");


     virtual ~GridworldValueIteration();


 protected:

     virtual void initializePropertyDependentVariables();


     virtual void initialize(int argc, char* argv[]);


     virtual bool performSingleStep();


 private:


     mic::environments::Gridworld grid_env;


     mic::types::MatrixXf state_value_table;


     mic::configuration::Property<float> step_reward;


     mic::configuration::Property<float> discount_rate;


     mic::configuration::Property<float> move_noise;


     mic::configuration::Property<std::string> statistics_filename;


     float running_delta;


     std::string streamStateActionTable();


     float computeQValueFromValues(mic::types::Position2D pos_, mic::types::NESWAction ac_);


     float computeBestValue(mic::types::Position2D pos_);


 };


 } /* namespace application */

 } /* namespace mic */


 #endif /* SRC_APPLICATION_GRIDWORLDVALUEITERATION_HPP_ */

mic::application::GridworldValueIteration::~GridworldValueIteration
virtual ~GridworldValueIteration()
Definition: GridworldValueIteration.cpp:57

mic::application::GridworldValueIteration::grid_env
mic::environments::Gridworld grid_env
The gridworld object.
Definition: GridworldValueIteration.hpp:79

mic::environments::Gridworld
Class emulating the gridworld environment.
Definition: Gridworld.hpp:50

mic::application::GridworldValueIteration::GridworldValueIteration
GridworldValueIteration(std::string node_name_="application")
Definition: GridworldValueIteration.cpp:40

mic::application::GridworldValueIteration::state_value_table
mic::types::MatrixXf state_value_table
Matrix storing values for all states (gridworld w * h). ROW MAJOR(!).
Definition: GridworldValueIteration.hpp:82

mic::application::GridworldValueIteration::running_delta
float running_delta
Definition: GridworldValueIteration.hpp:105

mic::application::GridworldValueIteration::discount_rate
mic::configuration::Property< float > discount_rate
Definition: GridworldValueIteration.hpp:92

mic::application::GridworldValueIteration::move_noise
mic::configuration::Property< float > move_noise
Definition: GridworldValueIteration.hpp:97

mic::application::GridworldValueIteration::streamStateActionTable
std::string streamStateActionTable()
Definition: GridworldValueIteration.cpp:81

mic::application::GridworldValueIteration::initializePropertyDependentVariables
virtual void initializePropertyDependentVariables()
Definition: GridworldValueIteration.cpp:66

Gridworld.hpp

mic::application::GridworldValueIteration::computeQValueFromValues
float computeQValueFromValues(mic::types::Position2D pos_, mic::types::NESWAction ac_)
Definition: GridworldValueIteration.cpp:99

mic::application::GridworldValueIteration::statistics_filename
mic::configuration::Property< std::string > statistics_filename
Property: name of the file to which the statistics will be exported.
Definition: GridworldValueIteration.hpp:100

mic::application::GridworldValueIteration
Class responsible for solving the gridworld problem by applying the reinforcement learning value iter...
Definition: GridworldValueIteration.hpp:45

mic::application::GridworldValueIteration::performSingleStep
virtual bool performSingleStep()
Definition: GridworldValueIteration.cpp:173

mic::application::GridworldValueIteration::initialize
virtual void initialize(int argc, char *argv[])
Definition: GridworldValueIteration.cpp:62

mic::application::GridworldValueIteration::computeBestValue
float computeBestValue(mic::types::Position2D pos_)
Definition: GridworldValueIteration.cpp:147

mic::application::GridworldValueIteration::step_reward
mic::configuration::Property< float > step_reward
Definition: GridworldValueIteration.hpp:87