본문 바로가기
AI/Reinforcement Learning

[Reinforcement Learning-0] Intro

by 노마드공학자 2021. 8. 26.
강화학습(Reinforcement Learning)

 

출처 : TCP school

 

강화학습과 딥러닝을 동일한 개념으로 보시는 분들이 많은것 같습니다.

 

하지만, 강화학습과 심층학습은 서로 다른 각자의 두개길로 걸어왔고, 최근에 두개를 접목하여 극대화된 시너지를 얻게되어 "심층강화학습" 이라는 이상적인 지점을 찾아내었을 뿐입니다.

 

즉, 각자의 연구영역은 기존에는 고유의 분야였지만, 둘을 통합해보니 더욱 좋은 솔루션을 제공하기에 사용하는것입니다.

 

개인적으로는 혹자가 저에게 "딥러닝과 강화학습의 차이는 무엇이냐?" 라고 한다면,

 

딥러닝 : 무수한 데이터들 속에서 질서를 찾아내고 목표값에 대한 손실함수가 최소화되는 방향으로 학습을 진행하는것

강화학습 : 상태(state)에 대한 행동(action)에 따른 보상(Reward)을 극대화 하는 방향으로 학습을 진행하는것

 

이라고 대답할 것 같습니다! (물론 제가 생각한 정의이기에, 보편적인 정의는 아닙니다.)

 

이 둘의 장점을 잘 섞어 심층강화학습을 통해 나온것이, 바로 그 유명한 알파고죠 (Deep Q Learning)

출처 : UNIST news center

 

저는 본업은 전기화학 분야 연구원이지만

여러 딥러닝 모델들을 접목해보기 위해 개인적으로 공부를 하던중 정리를 해나가고자 글을 쓰고있습니다..

 

감사합니다.

댓글