본문 바로가기

딥러닝26

[Reinforcement Learning-1] Thompson sampling model 톰슨 샘플링 톰슨 샘플링 모델은 강화학습의 가장 기본적인 모델입니다. 강화학습을 이해하기 위한 기본적인 선형대수, 확률론은 배제하고 진행해보겠습니다! Beta Distribution 톰슨 샘플링 모델은 Beta Distribution을 활용합니다. Beta Distribution이란, Gaussian Distribution처럼 특정 사건에 대한 분포 표를 의미합니다. 독특하게 인자가 두개인대요 Beta(a,b)로써 a와 b는 각각의 반대의 사건을 의미하며, 극단적으로는 b=1-a로 볼수 있습니다. 톰슨모델은 위의 그림처럼 그려지게 됩니다. a가 커질수록 분포가 오른쪽으로 움직이고, b가 커질수록 분포가 왼쪽으로 움직이는것을 확인하실 수 있는데 여기서 a와 b를 개발자가 원하는 확률을 넣게되면, 해당 사건.. 2021. 8. 26.
[Google colab-3] GPU 백엔드에 연결할 수 없음(사용량 초과) -지난글 https://limitsinx.tistory.com/66 2021. 7. 20.
[Microsoft AzureML - 9] 학습 데이터 CSV로 Export하기 ※ 이전글 [Microsoft AzureML - 0] Intro https://limitsinx.tistory.com/113 [Microsoft AzureML - 1] 개발 환경 세팅 https://limitsinx.tistory.com/114 [Microsoft AzureML - 2] 학습할 데이터 불러오기 https://limitsinx.tistory.com/115 [Microsoft AzureML - 3] 데이터 전처리(Data pre-processing) - I https://limitsinx.tistory.com/116 [Microsoft AzureML - 4] 데이터 전처리(Data pre-processing) - II https://limitsinx.tistory.com/117 [Micros.. 2021. 6. 25.
[Microsoft AzureML - 6] 여러 학습모델 동시에 성능비교 ※ 이전글 [Microsoft AzureML - 0] Intro https://limitsinx.tistory.com/113 [Microsoft AzureML - 1] 개발 환경 세팅 https://limitsinx.tistory.com/114 [Microsoft AzureML - 2] 학습할 데이터 불러오기 https://limitsinx.tistory.com/115 [Microsoft AzureML - 3] 데이터 전처리(Data pre-processing) - I https://limitsinx.tistory.com/116 [Microsoft AzureML - 4] 데이터 전처리(Data pre-processing) - II https://limitsinx.tistory.com/117 [Micros.. 2021. 6. 22.
[Microsoft AzureML - 4] 데이터 전처리(Data pre-processing) - II ※ 이전글 [Microsoft AzureML - 0] Intro https://limitsinx.tistory.com/113 [Microsoft AzureML - 1] 개발 환경 세팅 https://limitsinx.tistory.com/114 [Microsoft AzureML - 2] 학습할 데이터 불러오기 https://limitsinx.tistory.com/115 [Microsoft AzureML - 3] 데이터 전처리(Data pre-processing) - I https://limitsinx.tistory.com/116 이전 데이터전처리-1 글에서 정리한바와 같은 방식으로 유효인자를 찾아, 자동차의 가격예측을 위해 직접적인 영향을 주는 인자는 "horsepower,city-mpg,engine-s.. 2021. 6. 20.