Reinforcement Learning Human Feedback

reinforcement-learning

Graph

title: Reinforcement Learning Human Feedback

Backlinks

Complex LLM Systems
- Instruction Tuned LLM (often trained on base llm with rlhf)
  - Reinforcement Learning Human Feedback