cv_research_paper_kg.json
Knowledge Graph Importer
1. 介绍
本项目旨在构建一个面向科研领域的开放知识图谱(OpenKG for Research Papers),以 arXiv 上计算机视觉(CV)方向的 1343 篇论文为数据源,用于探索科研方向与论文间的关系。
数据格式示例
json
{
"nodes": [
{"id": "p1", "label": "Paper", "schema": "paper", "properties": {"title": "Example"}},
{"id": "a1", "label": "Author", "schema": "author", "properties": {"name": "Alice"}},
{"id": "cs.AI", "label": "Field", "schema": "field", "properties": {"name": "AI"}}
],
"edges": [
{"src": "a1", "dst": "p1", "type": "AUTHOR_OF"},
{"src": "p1", "dst": "cs.AI", "type": "BELONGS_TO"}
]
}
2. Installation
1) 准备环境
- 安装 Neo4j Desktop,新建空的本地实例,把 URI, 用户名和密码填入 build_knowledge_map.py 的配置区域
2) 安装依赖
- python 3.9
bash
pip install neo4j
3) 配置连接
- 在 build_knowledge_map.py 顶部设置
NEO4J_URI、NEO4J_USER、NEO4J_PASSWORD。 - 如需调整批量大小或数据路径,修改
BATCH_SIZE与JSON_PATH。
4) 运行导入
bash
python build_knowledge_map.py
- 脚本会创建唯一约束,分批 upsert 节点与边,并输出跳过的未知标签/关系与统计。
5) 在 Neo4j Desktop 中查看知识图谱
3. 可做的拓展
- 搜索细分领域:基于
Field/Subfield节点添加全文索引或 embedding 相似度搜索,支持按照子领域检索论文与方法。 - 论文推荐:
- 利用
AUTHOR_OF、BELONGS_TO等关系构建协同过滤/路径特征,结合 Neo4j GDS 算法(例如 Personalized PageRank、Node2Vec)生成候选。 - 按用户偏好的主题或作者聚合得分,返回个性化论文列表。
该资源暂时没有视图
其他信息
| 域 | 价值 |
|---|---|
| Data last updated | 2026年1月30日 |
| Metadata last updated | 2026年1月30日 |
| 创建的 | 2026年1月30日 |
| 格式 | JSON |
| 授权 | Creative Commons CCZero |
| Datastore active | False |
| Has views | False |
| Id | 6295737d-f7e5-4c08-bc78-fd4efbe4d651 |
| Mimetype | application/json |
| Package id | 7308ba4b-e941-44cf-8547-2633542b1c4e |
| Position | 0 |
| Size | 5 MiB |
| State | active |
| Url type | upload |