Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 딥러닝
- model free
- Gradient descent
- 강화학습
- 애쉬브라운
- kbpf
- MB
- 벨만 방정식
- 다이내믹 프로그래밍
- 자연어처리
- 페미니즘
- 폴댄스
- 양성평등
- 머신러닝
- 독서
- NLP
- 딥뉴럴넷
- 리처드소처
- CS224N
- ai
- MDP
- Linear Regression
- 파이썬과 케라스로 배우는 강화학습
- cost function
- 취미
- tensorflow
- Richard Socher
- 행복
- 파이썬
- 인공지능
Archives
- Today
- Total
목록Reinforcement Learning (1)
Ordinary day
강화학습(Reinforcement Learning)기계학습이 다루는 문제 의 하나로, 어떤 환경 안에서 정의된 에이전트(액터)가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 행동 순서를 선택하는 방법 이라고 위키에서 정의를 했는데..쉽게 말하면 경험을 통해 배우고, 보상 혹은 벌(?) 무튼 일종의 피드백을 줌으로써 훈련시키는 데에서 기본 아이디어를 얻어 만든 알고리즘이다.강화학습 알고리즘은 게임, 로보틱스, E-커머스, 주식시장 등 여러 분야에서 활용할 수 있는 알고리즘으로 사실 굉장히 오래 전(1970년대)에 등장한 알고리즘인데 그 당시에는(몇 년 전까지만 하더라도) 크게 주목받지 못했다.그러다가 최근 딥마인드에서 관련 연구가 진행되고, 알파고에 이 강화학습 알고리즘이 ..
Study/ML 이론
2017. 4. 10. 00:49