강화학습과 몬테카를로 트리 탐색을 적용한 인공지능 인수분해 게임 에이전트에 관한 연구

원병선,김종락,한석원

강화학습과 몬테카를로 트리 탐색을 적용한 인공지능 인수분해 게임 에이전트에 관한 연구

2020

본 논문에서는 수학적 개념인 인수분해를 이용하여 만든 수학 게임인 인수분해 게임을 소개 및 분석하였다. 또한, 인수분해 게임은 게임 보드 크기 n과 게임 값 p를 조절함으로써 게임의 상태 및 행동의 불확실성을 조절할 수 있다는 장점이 있다. 특히, 만일 n의 값이 커질 경우, 경우의 수가 기하급수적으로 증가함으로 인해 승리 전략이 불확실하다. 이를 강화학습 관점으로 보면 상태와 행동의 불확실성을 의미한다. 따라서 n을 6이하로 설정함으로써 불확실성을 조절한 인수분해 게임 에이전트를 만들었다. 본 논문에서는 강화학습 알고리즘인 Q-learning, Double DQN, 몬테카를로 트리 탐색을 인수분해 게임에 적용해보고, 승률 및 분석을 통하여 학습 진행됨을 보였다. 본 논문에서는 무작위 정책 에이전트와 강화학습을 적용한 인수분해 게임 에이전트와의 대결을 통해 학습 진행에 따른 승률 변화를 관찰하였다.

Correction
Source
Cite
Save
Machine Reading By IdeaReader

References

Citations