Question 1

What is the Leipzig Corpora Collection dataset?

Accepted Answer

Leipzig Corpora Collection is a text corpora-focused dataset in Multi-Lingual distributed in Text format.

Question 2

Is Leipzig Corpora Collection a benchmark?

Accepted Answer

Leipzig Corpora Collection is a dataset for training or evaluation; it isn't tracked as a standard LLM benchmark in our catalog.

Question 3

Where can I download Leipzig Corpora Collection?

Accepted Answer

Leipzig Corpora Collection is available at its source: https://wortschatz.uni-leipzig.de/en/download/.

Leipzig Corpora Collection

Details