63 datasetov nájdených

Formáty: JSON

Výsledky filtrovania
  • 基于cnScheme的外国文学研究领域知识图谱

    基于开放域数据CNKI的12833 篇研究文献作为语料来源,将文献中的关键词作为主题关键词,作者作为研究人员。通过爬虫爬取结构化数据作为知识图谱基本数据,结合爬取一些自然语言数据与半结构化数据,并进行语义抽取构建了外国文学研究领域的核心数据 在上述基础上,我们进行了实体对齐与部分的实体消歧,比如译名的对齐:列夫·托尔斯泰 和 托尔斯泰...
  • 医疗因果实体关系抽取数据集CMedCausal

    本数据集来源于CHIP2022医疗因果实体关系抽取学术评测任务:http://cips-chip.org.cn/2022/eval2 , 包括2,000段训练数据,2,000段测试数据。本数据集由阿里巴巴夸克医疗事业部和阿里云天池联合提供。
  • 医疗对话临床发现阴阳性判别数据集MDCFNPC

    本数据集来源于CHIP2021医疗对话临床发现阴阳性判别学术评测任务:http://cips-chip.org.cn/2021/eval1 , 数据集包括6,000段训练数据,4,000段测试数据。 本数据集由阿里夸克医疗事业部和阿里云天池平台联合提供。
  • 新冠疫情相似句对判定数据集

    新冠疫情相似句对判定数据集来自天池大赛:https://tianchi.aliyun.com/competition/entrance/231776/information
  • 中药说明书实体识别数据集TCM-NER

    本数据集来源于天池中医药实体识别大赛:https://tianchi.aliyun.com/competition/entrance/531824/information。 数据来自中药药品说明书,通过挖掘中药说明书构建中药合理用药的知识图谱,将为中医规范诊疗奠定较好基础。抽取中药药品说明书中的关键信息可以帮助扩充中医药药品知识库。
  • 中医文献问题生成数据集TCM-QG

    本数据集来自天池中医药问题生成大赛:https://tianchi.aliyun.com/competition/entrance/531826/information 。中医文献问题生成数据集包含3500篇语料,每篇文档由人工标注产生1~4对(问题, 答案)对。
  • 中文糖尿病科研文献实体关系数据集DiaKG

    瑞金糖尿病知识图谱数据集,来源天池比赛:https://tianchi.aliyun.com/competition/entrance/231687/introduction
  • IREE:投资领域细颗粒度风险事件抽取数据集

    A Dataset for Chinese Event Extraction in Investment Research 更新 20220703 论文已录用 20220604 双盲审稿暂时隐去作者及机构信息 背景介绍 目前,中文数据集主要来源于百度的千言数据集评测LUGE、中文信息学会主办的CCKS、中国计算机学会主办的CCF-...
  • 新冠多跳问答数据集

    我们精心挑选了OpenKG-COVID19发布的知识图谱中的7个子图谱来构建关于新冠多跳问答数据集。我们对这些个子图谱进行了数据清洗,以及构建了有意义的多跳关系问题。这些知识包含了新冠肺炎疫情期间人们更关注以及日常生活中更容易问到的话题。
  • 魔兽世界人物信息知识图谱

    《魔兽世界》(英语:World of Warcraft,缩写作...
  • 明代历史知识图谱

    项目设计并实现了明代历史知识图谱,涵盖了明代历史的重要人物、历史事件、历史地名、著作等若干实体,并实现了知识图谱的可视化展示。
  • 英雄联盟职业和难度图谱

    本项目聚焦于构建英雄和其角色的实体关系知识图谱。其中实体包括英雄、角色;关系包括英雄与角色的关系(属于某一阵营)、英雄与英雄的关系(兄弟姐妹等)。并提供Database-free的图谱可视化界面和一个简单的智能问答系统。
  • 中国近代历史人物知识图谱

    中国近代历史涌现了大量的杰出人物和事迹,史料文献丰富,构成了一个庞大的知识体系。本项目旨在收集挖掘中国近代历史人物信息,构建人物及其相关实体的知识图谱,为历史资料的检索和研究工作提供帮助。...
  • The Lord of The Rings

    ⼩说《魔戒》(The Lord of the Rings)中的⼈物、家族、种族的知识图谱
  • 周深歌曲关系知识图谱

       周深,1992年9月29日出生于湖南邵阳 ,长于贵州贵阳 ,中国内地男歌手,2016年6月毕业于乌克兰利沃夫国立立谢科音乐科学院美声专业 。其声线独特,爱岗敬业,多次受邀在央视中秋晚会、央视七夕晚会、央视节目...
  • FR2KG:大规模金融研报知识图谱

    大规模金融研报知识图谱数据集FR2KG 知识图谱模式包含10个实体类型,19个关系类型和6种属性 知识图谱包含17,799实体,26,798关系三元组,1,328属性三元组 引用 Wang, W.G., et al.: Data set and evaluation of automated construction of financial...
  • 多模态实体链接数据集 MELBench

    1. 摘要 多模态实体链接是多模态数据处理的基础任务之一,旨在将多模态数据中的实体链接到知识图谱中,在多模态数据理解、多模态知识图谱、多模态问答中具有广泛应用意义。然而,目前开源和能重现的多模态实体链接数据集还很少,一定程度上制约着相关工作的研究。 东南大学团队发布的多模态实体链接数据集MELBench包含3个任务:Weibo-...
  • 火影忍者人物关系图谱

    《火影忍者》是日本漫画家岸本齐史的代表作,作品于1999年开始在《周刊少年JUMP》上连载,于2014年11月10日发售的JUMP第50号完结。作品设定在一个忍者的世界,故事通过主人公漩涡鸣人的视角,围绕鸣人的奋斗、成长,鸣人的伙伴们,以及这个忍者世界的各种争斗和阴谋展开。...
  • 宝可梦数据集

    宝可梦游戏以及动画中的人物,地点以及宝可梦的数据集。其中部分利用网络爬虫构建,relation中的关系则使用中文bert进行抽取得到。
Prístup do tohto zoznamu je možný aj cez API rozhranie API (viď. dokumentácia API Dokumenty API).