List of works - Yixuan Tan - Paulina

List of works by Yixuan Tan

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

scientific paper by DeepSeek Research introducing reinforcement learning techniques in the reasoning capabilities of large language models

Paulina is supported by:

About Paulina

Help