Question 1

What is the ArxivPapers dataset?

Accepted Answer

Dataset is a corpus of over 100,000 scientific papers related to machine learning.

Question 2

Is ArxivPapers a benchmark?

Accepted Answer

ArxivPapers is a dataset for training or evaluation; it isn't tracked as a standard LLM benchmark in our catalog.

Question 3

Where can I download ArxivPapers?

Accepted Answer

ArxivPapers is available at its source: https://colab.research.google.com/github/paperswithcode/axcell/blob/master/notebooks/datasets.ipynb?authuser=1#scrollTo=Qf9sdQWqwQFf.

ArxivPapers

About ArxivPapers

Details

Related Text Corpora datasets

FAQ