212 datasetov nájdených

Licencie: Creative Commons Attribution

Výsledky filtrovania
  • 医学术语库

    包含医学数据库,ICD,LOINC,Snomed等
  • KZSL -知识驱动的零样本学习开放资源

    语义信息的提出为零样本学习(Zero-shot Learning,...
  • 多模态实体链接数据集 MELBench

    1. 摘要 多模态实体链接是多模态数据处理的基础任务之一,旨在将多模态数据中的实体链接到知识图谱中,在多模态数据理解、多模态知识图谱、多模态问答中具有广泛应用意义。然而,目前开源和能重现的多模态实体链接数据集还很少,一定程度上制约着相关工作的研究。 东南大学团队发布的多模态实体链接数据集MELBench包含3个任务:Weibo-...
  • MOOPer数据集

      本数据集由CCKS2021论文“MOOPer:A Large-scale Dataset of Practice-oriented Online Learning” 发布。本文档对数据集内数据字段含义进行详细介绍,其他信息可参考原文获取。 点击此处下载MOOPer数据集 什么是MOOPer?...
  • RCWI-Dataset

    中文相对复杂词汇识别数据集
  • Benchmark of Incoherent Ontologies

    关于不协调本体处理工具的测试数据集
  • SGSum体育赛事摘要

    SGSum(Sports Game Summarization)数据集是一个大规模人工清洗的中文体育赛事摘要数据集。本数据集来源于新浪体育在线(http://match.sports.sina.com.cn/index.html)...
  • DiaKG: 糖尿病知识图谱数据集

    【使用说明】 1、本数据集来源于公开发表的41篇糖尿病指南和共识,涵盖了近年来最广泛的研究内容和热点领域,是构建糖尿病知识库的权威资源; 2、本数据集只可以用于自然语言处理的学术科研,不可用于商业目的。...
  • 网络通信行业知识图谱

    包含网络协议、通信转发、网络设备等方面知识
  • 企业知识图谱

    企业知识图谱包括企业实体及其企业相关的实体描述,如财务、股票、合同、专利、信用、纳税等实体,可以为政府、监管机构、金融机构、企业和投资者提供服务。
  • 2020年中国排名前一百大学知识图谱

    本项目是根据2020年校友会发布的中国前一百大学排行榜来获取中国百强大学的相关信息。提取的主要信息包括有大学的中文英文名称,大学的缩写,大学所属的类型,大学的主管部门和创办时间等等。...
  • NBA球员信息知识图谱

    本项目主要是通过爬取1990年到2019年的的球员赛季表现,进行适当的数据处理和分析,从而构建了关于NBA球员表现的知识图谱。
  • 宝可梦对战手册

    《宝可梦》(英文名POKEMON)最早是一款由Game Freak和Creatures株式会社开发的一款角色扮演游戏,由于其有趣的世界设定和丰富的对战系统大受欢迎,逐渐衍生出了宝可梦系列游戏、动画、漫画等诸多作品。...
  • 菜谱知识图谱

    项目设计并实现了菜谱领域的知识图谱,经过数据采集、清洗、存储构造知识图谱,并基于知识图谱实现了简单的可视化与问答系统。
  • 火影忍者人物关系图谱

    《火影忍者》是日本漫画家岸本齐史的代表作,作品于1999年开始在《周刊少年JUMP》上连载,于2014年11月10日发售的JUMP第50号完结。作品设定在一个忍者的世界,故事通过主人公漩涡鸣人的视角,围绕鸣人的奋斗、成长,鸣人的伙伴们,以及这个忍者世界的各种争斗和阴谋展开。...
  • Bilibili知名up主知识图谱

    Bilibili,全称为哔哩哔哩弹幕网,亦称哔哩哔哩、bilibili弹幕网,或简称为B站,是一个以ACG相关內容起家的弹幕视频分享网站,其前身为视频分享网站Mikufans,该网站由网友“bishi”(徐逸)于2009年6月26日创建。Mikufans建站的初衷是为用户提供一个稳定的弹幕视频分享网站,网站于2010年1月24日改为现名。...
  • 中国主要城市信息知识图谱及其知识问答

    本图谱是基于对中国各个主要城市的地理位置接壤关系和城市属性构建的关联图谱,用户可以根据图谱对各个城市的关联关系和属性信息进行了解。我们通过使用neo4j构建图谱,并基于此实现了一个知识问答和搜索功能,并提供了可视化界面对图谱和信息进行查看。
  • 宝可梦数据集

    宝可梦游戏以及动画中的人物,地点以及宝可梦的数据集。其中部分利用网络爬虫构建,relation中的关系则使用中文bert进行抽取得到。
  • 数地搜搜:事理驱动的全网实时事件数据库分析引擎

    数地搜搜,事理驱动下的全网实时事件数据库分析引擎,通过挖掘因果原子事件,以全网数千家网页新闻为数据源,经过事件去重、事件聚类、事件提取、事件实体链接等技术,形成以因果事件为核心的大规模实时事件数据库。通过结合数据、融合推理的方式,实现对特定事件的综合分析。
  • 10万中文人物关系图谱数据集

    近十万的人物关系数据,涉及人物71,243个,大类关系102个,小类关系266条。可以支撑包括知识问答、多跳推理、图谱可视化、未知关系推理、数据回标、特征增强、人物推荐、人物建模等多种应用尝试和科学研究工作。
Prístup do tohto zoznamu je možný aj cez API rozhranie API (viď. dokumentácia API Dokumenty API).