基于众包标注系统的文言文语言理解测评基准及数据集

C-CLUE是一个基于众包标注系统构建的文言文语言理解测评基准及数据集,由天津大学数据库课题组贡献。本次开源了由系统标注结果获取的近2万个实体以及4千多个关系,并处理分割成为训练集、校验集、测试集等文件, 可供自然语言处理中命名实体识别和关系抽取任务直接使用。该基准及数据集能够为基于史书的历史知识图谱构建提供数据支持,以通过高度关联化数据的方式构造及展现数字人文内容。

Daten und Ressourcen

Zusätzliche Informationen

Feld Wert
Quelle https://github.com/jizijing/C-CLUE
Autor Xin Wang, Haofen Wang, Zijing Ji, Yuxin Shen, Qingyan Guo, Yang Sun, Guanzhong Liu, Zijun Wang, Yining Sun, Tian Yu
Verantwortlicher Zijing Ji
Zuletzt aktualisiert November 1, 2024, 01:56 (UTC)
Erstellt November 21, 2021, 13:28 (UTC)