-
ElementKG 2.0:开源化学知识图谱
ElementKG 2.0模拟化学家的认知逻辑闭环,以“元素-官能团-分子-反应-实验”为主线,构建覆盖化学反应全过程的统一知识表达框架。数据集旨在重构目前化学数据的组织维度,为面向自驱动化学实验室的智能体提供知识底座,促进计算化学与湿实验的衔接。ElementKG 2.0涵盖超过100万条化学反应与实验流程,超过1000万个化学物质。 -
InstructProteinKG:指令蛋白质知识图谱
InstructProteinKG是一套面向蛋白序列—文本对齐与指令学习的蛋白知识图谱,主要由 UniProtKB/Swiss-Prot 的高质量结构化注释抽取得到,以“(Protein, relation, Annotation)”三元组组织蛋白与注释实体的关联,覆盖 GO 三大分支(BP/MF/CC) 以及 InterPro 的... -
TTKG-Math:数学模板定理知识图谱
TTG-Math(Template-Theorems Graph for Math)是一套面向数学推理的“模板—定理”图谱/知识库:它借鉴人类解题的联想机制,将具体数学题抽象为可复用的问题模板与分步的解法模板,并把每一步所需的关键定理/规则与模板建立显式链接,从而在遇到新题时能先做“问题蒸馏”得到模板表征,再在图中检索最相关的模板与定理作为上下文输入给... -
MolSafeKG:化学安全知识图谱
MolSafeKG 汇总了三种主要类型的信息:分子实体、结构特征以及安全性标注。分子实体的集合包含了从权威来源中精选出的 83,925 种独特的化合物。对于结构特征,我们编码了丰富的化学子结构信息,包括来自元素周期表的 117 种化学元素、149 种分类为 13 类的官能团以及从 ChEMBL 数据库中提取的 434... -
PorousKG:多孔材料知识图谱
PorousKG 数据集主要面向多孔材料领域的知识抽取与知识图谱构建,核心语料来源于 32,000 余篇多孔材料相关的全文学术文献,并融合 剑桥结构数据库(CSD) 中的金属—有机框架(MOF)结构数据,以及 量子计算优化的 QMOF 数据库等权威结构化资源,形成“文献证据 + 结构数据 +... -
AAKG:氨基酸知识图谱
AAKG(Amino Acid Knowledge Graph)是面向蛋白质工程的氨基酸知识图谱,基于 AAontology 汇聚并结构化刻画 20 种天然氨基酸的多维理化属性与内在关联:在图谱中同时建模氨基酸实体与属性实体(如极性、体积等),并通过 rdftype... -
ProteinKG65:多模态蛋白质知识图谱
ProteinKG65 是一个多模态蛋白知识图谱数据集,将蛋白实体与 GO 术语实体对齐到对应的蛋白序列与文本描述。数据规模约 61.4 万实体、562 万三元组,以 Protein–GO 注释关系为主,并包含 GO–GO 关系,覆盖 GO 的三大分支(MF/CC/BP)。为缓解长尾分布,数据将部分高频关系细化扩展至 65 类,并提供... -
ElementKG 1.0:化学元素知识图谱
ElementKG 数据集面向材料与化学领域的元素知识建模与推理需求,系统化汇聚了元素的结构化先验知识,包括元素的基础属性(如原子序数、原子量、价态/电负性等)、周期表层级关系(族/周期/类别等)以及元素间可解释的关联与约束关系。数据以可计算的知识图谱形式组织,支持元素表示学习、组成/性质预测、材料设计与分子生成等任务中的知识增强... -
国内行政区划知识数据
国内省市县乡村之间的行政区划数据。由于数据庞大,请自行到网盘提取。 提取码:2oc9 -
天气语义数据
提供语义化的气象数据,外链到相关疾病、健康等数据。 -
IEPile
IEPile:大规模信息提取语料库 这是论文 IEPile: Unearthing Large-Scale Schema-Based Information Extraction Corpus 的官方仓库... -
基于知识图谱的多模态类比推理数据集
ICLR2023“Multimodal Analogical Reasoning over Knowledge Graph”提出的数据集,包含一个多模态知识图谱数据集MarKG和一个多模态类比推理数据集MARS,用来评估模型的多模态类比推理能力。 -
浙江大学—大规模细粒度中文概念图谱OpenConcepts
OpenConcepts 介绍 OpenConcepts (http://openconcepts.openkg.cn/)... -
KZSL -知识驱动的零样本学习开放资源
语义信息的提出为零样本学习(Zero-shot Learning,... -
KG4OpenKG
从OpenKG.CN获取的KG4OpenKG数据集。截止日期为2018.11.22。 -
douban-movie-kg
豆瓣电影的知识图谱,展示导演、编剧、演员与电影的关系 -
基于limes的中文知识图谱融合实战演练教程
Limes使用教程和数据集 -
基于CNSchema的城市知识图谱(交通数据)
原始数据来源: 2016年度SODA大赛 数据集简介 这是基于CNSchema的城市知识图谱,目前的数据只涉及交通,包括公交车、地铁、出租车。 其中,有公交站点、地铁站点的静态数据,还有基于事件流的动态数据,例如,公交车进出站、地铁刷卡出行、出租车到达某一地理点 -
空气质量语义描述
将空气质量等传感器数据离散化,增加上下文语义描述,外链到气象、相关疾病、健康等数据。本数据集提供实时流式数据API,可获取实时动态的语义化空气质量数据。 -
OpenStreetMap和Wikidata的实体链接数据集(部分国外区域)
LinkedGeoData(链接地理数据)是为数据/语义网添加空间维度的努力。链接地理数据使用OpenStreetMap(开放街道地图)项目收集的信息,并根据链接数据原则将其作为RDF知识库提供。它将这些数据与链接开放数据计划中的其他知识库相互联系。Wikidata(维基数据)是人人可编辑的知识库(knowledge...