基于众包标注系统的文言文语言理解测评基准及数据集

C-CLUE是一个基于众包标注系统构建的文言文语言理解测评基准及数据集,由天津大学数据库课题组贡献。本次开源了由系统标注结果获取的近2万个实体以及4千多个关系,并处理分割成为训练集、校验集、测试集等文件, 可供自然语言处理中命名实体识别和关系抽取任务直接使用。该基准及数据集能够为基于史书的历史知识图谱构建提供数据支持,以通过高度关联化数据的方式构造及展现数字人文内容。

Data and Resources

Additional Info

Field Value
Source https://github.com/jizijing/C-CLUE
Author Xin Wang, Haofen Wang, Zijing Ji, Yuxin Shen, Qingyan Guo, Yang Sun, Guanzhong Liu, Zijun Wang, Yining Sun, Tian Yu
Maintainer Zijing Ji
Last Updated Kasım 1, 2024, 01:56 (UTC)
Created Kasım 21, 2021, 13:28 (UTC)