Yidu-S4K:医渡云结构化4K数据集

【使用说明】

1、本数据集是根据真实的病历分布由医渡云医学人工编辑而成;

2、本数据集只可以用于自然语言处理的学术科研,不可用于商业目的。

————————————————

Yidu-S4K 数据集源自CCKS 2019 评测任务一,即“面向中文电子病历的命名实体识别”的数据集,包括两个子任务:

1)医疗命名实体识别:由于国内没有公开可获得的面向中文电子病历医疗实体识别数据集,本年度保留了医疗命名实体识别任务,对2017年度数据集做了修订,并随任务一同发布。本子任务的数据集包括训练集和测试集。

2)医疗实体及属性抽取(跨院迁移):在医疗实体识别的基础上,对预定义实体属性进行抽取。本任务为迁移学习任务,即在只提供目标场景少量标注数据的情况下,通过其他场景的标注数据及非标注数据进行目标场景的识别任务。本子任务的数据集包括训练集(非目标场景和目标场景的标注数据、各个场景的非标注数据)和测试集(目标场景的标注数据)。

Data and Resources

Additional Info

Mező Érték
Szerző 医渡云
Karbantartó 焦增涛
Verzió 1.1
Last Updated november 9, 2020, 03:55 (UTC)
Created november 9, 2020, 03:55 (UTC)
官方网站 https://www.yiducloud.com.cn