-
新冠开放知识图谱.事件
从第一例出发到封城到各地响应等,重大事件脉络,以及相关时间等,和新冠百科、新冠科研、新冠临床、新冠防控、新冠英雄等均有关联, 并对新闻中的一些内容进行相关语义标注。 支持对新型冠状病毒的事件在时间上的正向和反向索引。并提供事件本身发展脉络的枚举。 支持查证事件的溯源。后期会加入对事件的存真鉴伪等高级特性。 -
新冠开放知识图谱.科研
简介更新: 1.病毒分类图谱 v2.0,根据最新 ncbi 网站内容更新了病毒族系相关的科研基础数据,包括了所有病毒的 lineage 分类信息。 2.新冠基本信息图谱 v1.0, 从新冠病毒的基因蛋白,宿主等相关信息出发构图。 3.抗病毒药物图谱 v1.0,依据 drugbank... -
IEPile
IEPile:大规模信息提取语料库 这是论文 IEPile: Unearthing Large-Scale Schema-Based Information Extraction Corpus 的官方仓库... -
Lord of the mysteries
《诡秘之主》是阅文集团白金作家爱潜水的乌贼所著的西方玄幻类小说,融汇了克苏鲁风格、西方魔幻元素、第一次工业革命时代风情和蒸汽朋克情怀。这是一个蒸汽与机械的世界,这是一段“愚者”的传说。 该作品曾获得第四届橙瓜网络文学奖年度十大作品,最具潜力十大游戏IP。 2021年9月16日,《诡秘之主》被列入“中国网络文学影响力榜:海外影响力榜”。... -
Fights Break Firmament《斗破苍穹》知识图谱
基于《斗破苍穹》小说构建的人物、势力、异火知识图谱 -
水稻表型知识图谱及其可视化系统的构建与实现
中国是世界上水稻产量最大、消费最多的国家,水稻的培育及研究是中国粮食安全战略的重要内容。水稻表型组学研究是植物生物学的研究热点,水稻表型数据的高通量、高维、海量的数据特征对数据的快速检索和知识的有效提取提出了更高的技术要求。 本项目,我们构建了一个水稻表型知识图谱。我们来自国家水稻数据中心(http://www.ricedata.cn)... -
RJUA-QADatasets: 蚂蚁-仁济泌尿专科QA数据集
数据集概况 本数据集为基于医疗泌尿专科知识构造的QA推理数据集,由蚂蚁集团医疗大模型团队(AntGroup Medical LLM)与上海交通大学医学院附属仁济医院泌尿科(Department of Urology, Shanghai Jiao Tong University School of Medicine Affiliated Renji... -
浙江大学校史人物关系数据库
浙江大学在长期的办学过程中,以严谨的“求是精神”作为学风培养了大批优秀... -
GuwenEE:细粒度古汉语事件抽取数据集
面向古汉语领域事件抽取的数据集,原始数据是从《二十四史》中按篇随机选取而来,包含语料950条,事件Schema72个,包含事件1826个。 -
国内外TOP250电影作品知识图谱
我们基于国内外优秀影视作品,构建了一个关于其类型、主演、导演、上映时间的知识图谱。本项目运用了数据爬虫技术、深度抽取技术、知识图谱构建技术等关键技术,并在图谱上进一步实现了搜索、问答、挖掘等简单的应用。 -
希腊神话人物知识图谱
基于百度百科及其他开放域数据作为语料来源,将神话人物名字作为主题关键词,通过爬虫爬取结构化数据作为知识图谱基本数据,并进行语义抽取构建了希腊神话人物关系的核心数据 在上述基础上,我们对数据进行半结构化,实体消歧(指爬虫的过程中选取希腊神话故事的人物),实体互补(指利用实体的亲属关系值的内容进行实体补充) 利用知识图谱实现了简单的知识问答 -
基于cnScheme的外国文学研究领域知识图谱
基于开放域数据CNKI的12833 篇研究文献作为语料来源,将文献中的关键词作为主题关键词,作者作为研究人员。通过爬虫爬取结构化数据作为知识图谱基本数据,结合爬取一些自然语言数据与半结构化数据,并进行语义抽取构建了外国文学研究领域的核心数据 在上述基础上,我们进行了实体对齐与部分的实体消歧,比如译名的对齐:列夫·托尔斯泰 和 托尔斯泰... -
医疗因果实体关系抽取数据集CMedCausal
本数据集来源于CHIP2022医疗因果实体关系抽取学术评测任务:http://cips-chip.org.cn/2022/eval2 , 包括2,000段训练数据,2,000段测试数据。本数据集由阿里巴巴夸克医疗事业部和阿里云天池联合提供。 -
医疗对话临床发现阴阳性判别数据集MDCFNPC
本数据集来源于CHIP2021医疗对话临床发现阴阳性判别学术评测任务:http://cips-chip.org.cn/2021/eval1 , 数据集包括6,000段训练数据,4,000段测试数据。 本数据集由阿里夸克医疗事业部和阿里云天池平台联合提供。 -
新冠疫情相似句对判定数据集
新冠疫情相似句对判定数据集来自天池大赛:https://tianchi.aliyun.com/competition/entrance/231776/information -
中药说明书实体识别数据集TCM-NER
本数据集来源于天池中医药实体识别大赛:https://tianchi.aliyun.com/competition/entrance/531824/information。 数据来自中药药品说明书,通过挖掘中药说明书构建中药合理用药的知识图谱,将为中医规范诊疗奠定较好基础。抽取中药药品说明书中的关键信息可以帮助扩充中医药药品知识库。 -
中医文献问题生成数据集TCM-QG
本数据集来自天池中医药问题生成大赛:https://tianchi.aliyun.com/competition/entrance/531826/information 。中医文献问题生成数据集包含3500篇语料,每篇文档由人工标注产生1~4对(问题, 答案)对。 -
中文糖尿病科研文献实体关系数据集DiaKG
瑞金糖尿病知识图谱数据集,来源天池比赛:https://tianchi.aliyun.com/competition/entrance/231687/introduction -
IREE:投资领域细颗粒度风险事件抽取数据集
A Dataset for Chinese Event Extraction in Investment Research 更新 20220703 论文已录用 20220604 双盲审稿暂时隐去作者及机构信息 背景介绍 目前,中文数据集主要来源于百度的千言数据集评测LUGE、中文信息学会主办的CCKS、中国计算机学会主办的CCF-... -
新冠多跳问答数据集
我们精心挑选了OpenKG-COVID19发布的知识图谱中的7个子图谱来构建关于新冠多跳问答数据集。我们对这些个子图谱进行了数据清洗,以及构建了有意义的多跳关系问题。这些知识包含了新冠肺炎疫情期间人们更关注以及日常生活中更容易问到的话题。