找到38个数据集

授权: Creative Commons Attribution 格式: JSON

过滤结果
  • 著名github仓库知识图谱

    浙江大学知识图谱课程作业 详情请关注 https://github.com/FoggyDawn/GitHubRepository-KG 本数据集拓展了cnSchema,在此基础上收集了著名的github仓库,并利用规则和大模型抽取了关系
  • 计算机科学领域学术论文引用与知识图谱 (CS-ArXiv-Citation-KG)

    数据集简介 本项目构建了一个面向计算机科学(特别是人工智能领域)的学术知识图谱。数据源基于 ArXiv 公开论文数据,通过 Semantic Scholar API 获取引用关系,并结合大语言模型(LLM)从非结构化文本中进行深层知识抽取。 构建方法 数据获取:采用“滚雪球”式递归爬取策略(BFS)。以经典论文(如 Attention Is All...
  • 2023年QS世界大学排名前50名介绍

    2023年QS世界大学排名前50名介绍
  • 基于众包标注系统的文言文语言理解测评基准及数据集

    C-CLUE是一个基于众包标注系统构建的文言文语言理解测评基准及数据集,由天津大学数据库课题组贡献。本次开源了由系统标注结果获取的近2万个实体以及4千多个关系,并处理分割成为训练集、校验集、测试集等文件,...
  • 网易云音乐知识图谱和音乐推荐系统

    我们构造的网易云音乐图谱中包含歌曲(music)、演唱者(artist)、专辑(alnum)、歌单(playlist)四类实体和相应的属性(name、lyric等),以及歌曲之间的相似关系(similarTo)、...
  • Fights Break Firmament《斗破苍穹》知识图谱

    基于《斗破苍穹》小说构建的人物、势力、异火知识图谱
  • 水稻表型知识图谱及其可视化系统的构建与实现

    中国是世界上水稻产量最大、消费最多的国家,水稻的培育及研究是中国粮食安全战略的重要内容。水稻表型组学研究是植物生物学的研究热点,水稻表型数据的高通量、高维、海量的数据特征对数据的快速检索和知识的有效提取提出了更高的技术要求。 本项目,我们构建了一个水稻表型知识图谱。我们来自国家水稻数据中心(http://www.ricedata.cn)...
  • RJUA-QADatasets: 蚂蚁-仁济泌尿专科QA数据集

    数据集概况 本数据集为基于医疗泌尿专科知识构造的QA推理数据集,由蚂蚁集团医疗大模型团队(AntGroup Medical LLM)与上海交通大学医学院附属仁济医院泌尿科(Department of Urology, Shanghai Jiao Tong University School of Medicine Affiliated Renji...
  • 浙江大学校史人物关系数据库

    浙江大学在长期的办学过程中,以严谨的“求是精神”作为学风培养了大批优秀...
  • GuwenEE:细粒度古汉语事件抽取数据集

    面向古汉语领域事件抽取的数据集,原始数据是从《二十四史》中按篇随机选取而来,包含语料950条,事件Schema72个,包含事件1826个。
  • 国内外TOP250电影作品知识图谱

    我们基于国内外优秀影视作品,构建了一个关于其类型、主演、导演、上映时间的知识图谱。本项目运用了数据爬虫技术、深度抽取技术、知识图谱构建技术等关键技术,并在图谱上进一步实现了搜索、问答、挖掘等简单的应用。
  • 希腊神话人物知识图谱

    基于百度百科及其他开放域数据作为语料来源,将神话人物名字作为主题关键词,通过爬虫爬取结构化数据作为知识图谱基本数据,并进行语义抽取构建了希腊神话人物关系的核心数据 在上述基础上,我们对数据进行半结构化,实体消歧(指爬虫的过程中选取希腊神话故事的人物),实体互补(指利用实体的亲属关系值的内容进行实体补充) 利用知识图谱实现了简单的知识问答
  • 基于cnScheme的外国文学研究领域知识图谱

    基于开放域数据CNKI的12833 篇研究文献作为语料来源,将文献中的关键词作为主题关键词,作者作为研究人员。通过爬虫爬取结构化数据作为知识图谱基本数据,结合爬取一些自然语言数据与半结构化数据,并进行语义抽取构建了外国文学研究领域的核心数据 在上述基础上,我们进行了实体对齐与部分的实体消歧,比如译名的对齐:列夫·托尔斯泰 和 托尔斯泰...
  • IREE:投资领域细颗粒度风险事件抽取数据集

    A Dataset for Chinese Event Extraction in Investment Research 更新 20220703 论文已录用 20220604 双盲审稿暂时隐去作者及机构信息 背景介绍 目前,中文数据集主要来源于百度的千言数据集评测LUGE、中文信息学会主办的CCKS、中国计算机学会主办的CCF-...
  • 新冠多跳问答数据集

    我们精心挑选了OpenKG-COVID19发布的知识图谱中的7个子图谱来构建关于新冠多跳问答数据集。我们对这些个子图谱进行了数据清洗,以及构建了有意义的多跳关系问题。这些知识包含了新冠肺炎疫情期间人们更关注以及日常生活中更容易问到的话题。
  • 魔兽世界人物信息知识图谱

    《魔兽世界》(英语:World of Warcraft,缩写作...
  • 明代历史知识图谱

    项目设计并实现了明代历史知识图谱,涵盖了明代历史的重要人物、历史事件、历史地名、著作等若干实体,并实现了知识图谱的可视化展示。
  • The Lord of The Rings

    ⼩说《魔戒》(The Lord of the Rings)中的⼈物、家族、种族的知识图谱
  • 周深歌曲关系知识图谱

       周深,1992年9月29日出生于湖南邵阳 ,长于贵州贵阳 ,中国内地男歌手,2016年6月毕业于乌克兰利沃夫国立立谢科音乐科学院美声专业 。其声线独特,爱岗敬业,多次受邀在央视中秋晚会、央视七夕晚会、央视节目...
您也可以使用应用程式界面 (看 API文献)注册.