Utilizing Observed Information for No-Communication Multi-Agent Reinforcement Learning toward Cooperation in Dynamic Environment

Fumito Uwano,Keiki Takadama

Utilizing Observed Information for No-Communication Multi-Agent Reinforcement Learning toward Cooperation in Dynamic Environment

2019

Fumito Uwano
Keiki Takadama

This paper proposes a multi-agent reinforcement learning method without communication toward dynamic environments, called profit minimizing reinforcement learning with oblivion of memory (PMRL-OM)....

Keywords:

Reinforcement learning
Human–computer interaction
Computer science
Multi-agent system
Memory management

Correction
Source
Cite
Save
Machine Reading By IdeaReader

References

Citations