-
著名github仓库知识图谱
浙江大学知识图谱课程作业 详情请关注 https://github.com/FoggyDawn/GitHubRepository-KG 本数据集拓展了cnSchema,在此基础上收集了著名的github仓库,并利用规则和大模型抽取了关系 -
甄嬛传
本项目围绕电视剧《甄嬛传》人物,以中文 Wikipedia 为数据源,依次完成知识图谱数据预处理、文本知识抽取及问答功能实现,预处理阶段通过定向抓取角色信息、三重过滤去重、多格式转换,生成 108 条有效实体及 775 条 SPO 三元组并构建向量索引;知识抽取基于大模型采用 “上下文增强 — 联合抽取 — 后处理对齐”... -
NOTAMkg.cn/dataset
本项目基于现有航行通告数据,构建航行通告事件要素实体与对应关系的知识图谱 -
中文多模态命名实体识别数据集
Wukong-CMNER,一个多模态NER数据集包含图像和文本的语料库。有55423个注释我们语料库中的图像-文本对。本数据是由华为发布的Wukong数据集标注得到,感谢华为公司允许对数据进行标注。 -
周杰伦歌曲知识图谱及在线查询系统
周杰伦(Jay... -
国内外TOP250电影作品知识图谱
我们基于国内外优秀影视作品,构建了一个关于其类型、主演、导演、上映时间的知识图谱。本项目运用了数据爬虫技术、深度抽取技术、知识图谱构建技术等关键技术,并在图谱上进一步实现了搜索、问答、挖掘等简单的应用。 -
陈奕迅音乐作品知识图谱
2022年年末,陈奕迅的歌迷们终于盼来了在香港红馆举行的陈奕迅《FEAR AND DREAMS》演唱会,在此背景下,我们构建了陈奕迅音乐作品知识图谱,以便对陈奕迅演唱的作品进行更加深入的了解和分析。... -
郑渊洁相关
There is no description for this dataset
-
浙江省文化站基础信息
来自于浙江省数据开放平台,并利用ChatGPT对文化站的交通消息进行了格式化与抽取。 -
喜羊羊与灰太狼知识图谱
本项目以动画《喜羊羊与灰太狼》为例,构建其中角色的人物关系知识图谱。项目任务一共分为四个部分:1)数据爬取与预处理 2)命名实体识别 3)实体关系抽取 4)可视化与知识问答。 -
鸟类百科知识图谱
本项目的知识基于中国环境与发展国际合作委员会生物多样性工作组补全的《中国鸟类野外手册》 的电子版,以CHM 文件格式存储。该格式是微软于 1998 年推出的基于 HTML 文件特性的帮助文件系统,可以理解为HTML的打包文件。将CHM文件抽取出来,就能得到其中的HTML文本。... -
周深歌曲关系知识图谱
周深,1992年9月29日出生于湖南邵阳 ,长于贵州贵阳 ,中国内地男歌手,2016年6月毕业于乌克兰利沃夫国立立谢科音乐科学院美声专业 。其声线独特,爱岗敬业,多次受邀在央视中秋晚会、央视七夕晚会、央视节目... -
KZSL -知识驱动的零样本学习开放资源
语义信息的提出为零样本学习(Zero-shot Learning,... -
MOOPer数据集
本数据集由CCKS2021论文“MOOPer:A Large-scale Dataset of Practice-oriented Online Learning” 发布。本文档对数据集内数据字段含义进行详细介绍,其他信息可参考原文获取。 点击此处下载MOOPer数据集 什么是MOOPer?... -
网络通信行业知识图谱
包含网络协议、通信转发、网络设备等方面知识 -
基金知识图谱
There is no description for this dataset
-
军事主题分类表(中英文)
There is no description for this dataset
-
家电控制语义知识图谱
智能家居环境下,各类家电控制语义知识图谱 -
大规模1.4亿中文知识图谱开源下载
知识图谱可视化:https://www.ownthink.com 本次ownthink开源了史上最大规模的中文知识图谱,数据是以(实体、属性、值),(实体、关系、实体)混合的形式组织,数据格式采用csv格式。 使用方式见GitHub: https://github.com/ownthink/KnowledgeGraphData 下载方式:... -
13万中文简称知识三元组
136081条中文简称知识三元组,涉及高校、商品名称、公司简称等多个领域,来自公开网络文本简称抽取、人工整理等多个渠道,可用于简称抽取评测、实体链接、搜索查询扩展、句子改写等多个场景。格式为:中国经理管理大学,简称,中经大。