Question 1

What is the Guttenberg Book Corpus dataset?

Accepted Answer

Guttenberg Book Corpus is a text corpora dataset in Multi-Lingual from Guttenberg with 60 records in Text format.

Question 2

Is Guttenberg Book Corpus a benchmark?

Accepted Answer

Guttenberg Book Corpus is a dataset for training or evaluation; it isn't tracked as a standard LLM benchmark in our catalog.

Question 3

Where can I download Guttenberg Book Corpus?

Accepted Answer

Guttenberg Book Corpus is available at its source: http://www.gutenberg.org/wiki/Gutenberg:Offline_Catalogs.

Guttenberg Book Corpus

Details