
[ Build Reasoning Model ] What is Reinforcement Learning?
LLM/HuggingFace-Learn
2025. 7. 24. 15:48
HuggingFace LLM CourseIntroduction to Reinforcement Learning and its Role in LLMsWhat is Reinforcement Learning?현실 세계의 예시만약 내가 강아지에게 "앉아"를 훈련시킨다면?강아지에게 앉으라고 말함강아지가 앉음 -> 보상강아지가 앉지 않음 -> 알려주거나 다시 시도함이를 반복하며 강아지는 앉아를 배우게 된다.Reinforcement Learning에서는Feedback을 reward라고 부름강아지 대신 Language Model을 훈련 (Reinforcement Learning에서 이것을 agent라고 부름)나(피드백 주는 사람) 대신 environment를 가짐RL을 key piece들로 나누면AgentLearner위..