数据集 活动流 数据集 甄嬛传 本项目围绕电视剧《甄嬛传》人物,以中文 Wikipedia 为数据源,依次完成知识图谱数据预处理、文本知识抽取及问答功能实现,预处理阶段通过定向抓取角色信息、三重过滤去重、多格式转换,生成 108 条有效实体及 775 条 SPO 三元组并构建向量索引;知识抽取基于大模型采用 “上下文增强 — 联合抽取 — 后处理对齐”... ZIP CSV