linux-cn/archive
General NLPZHBenchmark
Created by linux-cn at 2024, the linux-cn/archive is a General NLP benchmark dataset in ZH in Parquet format.
📊 This dataset is used as an LLM benchmark. See model leaderboards →
About linux-cn/archive
Linux 中国原创文章/译文数据集
这个数据集为 Linux 中国原创技术文章 + 翻译技术文章的数据集,提供了文章标题、内容等多个字段。
Dataset Details
Dataset Structure
id:文章ID
title: 文章标题
author: 文章作者
fromurl: 文章源地址(仅翻译类文章有)
summary: 总结
excerpt: 摘要
pic: 头图(缩略图版)
largepic:头图(大图版)
titl...
Details
- Task
- General NLP
- Language
- ZH
- Format
- Parquet
- Rows / instances
- N/A
- Creator
- linux-cn
- Year
- 2024