-
TTG-Math:面向数学推理领域的知识图谱
TTG-Math(Template-Theorems Graph for Math)是一套面向数学推理的“模板—定理”图谱/知识库:它借鉴人类解题的联想机制,将具体数学题抽象为可复用的问题模板与分步的解法模板,并把每一步所需的关键定理/规则与模板建立显式链接,从而在遇到新题时能先做“问题蒸馏”得到模板表征,再在图中检索最相关的模板与定理作为上下文输入给... -
MolSafeKG:面向化学领域的知识图谱
MolSafeKG 汇总了三种主要类型的信息:分子实体、结构特征以及安全性标注。分子实体的集合包含了从权威来源中精选出的 83,925 种独特的化合物。对于结构特征,我们编码了丰富的化学子结构信息,包括来自元素周期表的 117 种化学元素、149 种分类为 13 类的官能团以及从 ChEMBL 数据库中提取的 434... -
PorousKG:面向多孔材料领域的知识图谱
PorousKG 数据集主要面向多孔材料领域的知识抽取与知识图谱构建,核心语料来源于 32,000 余篇多孔材料相关的全文学术文献,并融合 剑桥结构数据库(CSD) 中的金属—有机框架(MOF)结构数据,以及 量子计算优化的 QMOF 数据库等权威结构化资源,形成“文献证据 + 结构数据 +... -
ProteinKG65:多模态蛋白知识图谱
ProteinKG65 是一个多模态蛋白知识图谱数据集,将蛋白实体与 GO 术语实体对齐到对应的蛋白序列与文本描述。数据规模约 61.4 万实体、562 万三元组,以 Protein–GO 注释关系为主,并包含 GO–GO 关系,覆盖 GO 的三大分支(MF/CC/BP)。为缓解长尾分布,数据将部分高频关系细化扩展至 65 类,并提供... -
87万通用领域实体概念描述三元组
87万实体概念描述知识库,基于开放文本挖掘而成,格式为[实体/概念,描述体,置信度],...