Search Results for author: Andy Su

PoBRL: Optimizing Multi-Document Summarization by Blending Reinforcement Learning Policies

We propose a novel reinforcement learning based framework PoBRL for solving multi-document summarization.

Paper
Add Code

Delusional bias is a fundamental source of error in approximate Q-learning.

Paper
Code

Cannot find the paper you are looking for? You can Submit a new open access paper.