甄嬛传

本项目围绕电视剧《甄嬛传》人物,以中文 Wikipedia 为数据源,依次完成知识图谱数据预处理、文本知识抽取及问答功能实现,预处理阶段通过定向抓取角色信息、三重过滤去重、多格式转换,生成 108 条有效实体及 775 条 SPO 三元组并构建向量索引;知识抽取基于大模型采用 “上下文增强 — 联合抽取 — 后处理对齐” 架构,约束实体生成、完成非人生物归一化并扩展高阶语义关系;问答功能依托 RAG 思路,融合向量索引、语义检索与 Qwen2.5-7B-Instruct 大模型,实现低幻觉、可追溯的自然语言问答,整体模块化设计兼具可复用性与可扩展性。

数据与资源

其他信息

价值
作者 雷俊驰、林方芊、周文浩
维护者 雷俊驰、林方芊、周文浩
最近更新 二月 12, 2026, 14:30 (UTC)
创建的 二月 12, 2026, 13:57 (UTC)