Reinforcement Learning in Factored MDPs: Oracle-Efficient Algorithms and Tighter Regret Bounds for the Non-Episodic Setting

Image
Description	scholarly article by Ziping Xu & Ambuj Tewari published November 2020 in Advances in Neural Information Processing Systems 33
Author/s
Publication date	November 2020
Language	English
Country of origin
Wikipedia link
Access work	https://proceedings.neurips.cc/paper/2020/file/d3b1fb02964aa64e257f9f26a31f72cf-Paper.pdf
Copyright status
Missing/wrong data?	Edit Wikidata item

Paulina is supported by:

About Paulina

Help