모형의 파라미터는 모형의 학습 과정에서 결정된다. 그렇다면 파라미터에 영향을 미치는 하이퍼파라미터는? 그건 사람이 결정해야 할 문제다. 이걸 잘 정하는 것, 혹은 …
https://deepmind.com/blog/understanding-agent-cooperation/ 최근에 인공지능에 승부욕이 있다느니 혹은 공격성을 보였다느니 하는 식으로 소개된 딥마인드의 연구다. 사실 연구의 핵심은 두 행위자들을 강화학습으로 훈련시켜서 …
Nondifferentiable Log
https://deepmind.com/blog/understanding-agent-cooperation/ 최근에 인공지능에 승부욕이 있다느니 혹은 공격성을 보였다느니 하는 식으로 소개된 딥마인드의 연구다. 사실 연구의 핵심은 두 행위자들을 강화학습으로 훈련시켜서 …