Perseus

Introduced by Zheng et al. in Long-Document Cross-Lingual Summarization

Perseus is a dataset for Cross-Lingual Summarization (CLS) which collects about 94K Chinese scientific documents paired with English summaries. The average length of documents in Perseus is more than two thousand tokens.

Source: Long-Document Cross-Lingual Summarization

Homepage

Benchmarks

Add a new result Link an existing benchmark

No benchmarks yet. Start a new benchmark or link an existing one.

Papers

Paper	Code	Results	Date	Stars

Dataset Loaders

Add Remove

No data loaders found. You can submit your data loader here.

Tasks

Machine Translation

Similar Datasets

OPUS-MT

WikiLingua

Source: https://arxiv.org/pdf/2212.00586v1.pdf.

Usage

License

Unknown

Modalities

Images

Languages

English
Chinese

Perseus

Benchmarks Edit Add a new result Link an existing benchmark

Papers

Dataset Loaders Edit Add Remove

Tasks Edit