孙燕姿音乐知识图谱及问答系统

孙燕姿(Stefanie Sun),1978年7月23日出生于新加坡,祖籍广东省潮州市,华语流行乐女歌手、音乐制作人,毕业于南洋理工大学,有《遇见》、《天黑黑》、《我怀念的》、《开始懂了》等诸多代表作品,获得过台湾金曲奖最佳国语女歌手奖、新加坡金曲奖最受欢迎女歌手奖、MTV亚洲奖新加坡地区最受欢迎歌手奖、全球华语歌曲排行榜最受欢迎女歌手奖、中国歌曲排行榜港台地区最受欢迎女歌手奖等诸多荣誉。 本项目旨在构建一个垂直领域的孙燕姿音乐知识图谱,整理孙燕姿歌曲的作词人、作曲人、所属专辑等信息,并基于此开发智能问答系统。首先,从互联网中爬取孙燕姿歌曲的目录与非结构化文本等信息。随后,引入 LLM 进行实体抽取,从网页长文本中精准抽取出作词、作曲、所属专辑等结构化元数据,并对缺失信息进行补全。处理后的数据被清洗并转化为标准的三元组格式,最终导入Neo4j图数据库中,实现孙燕姿音乐知识网络的可视化与持久化存储。在应用层面,项目基于孙燕姿音乐的图谱结构构建了检索增强生成(RAG)问答系统。该系统能够解析用户的自然语言提问,从图数据库中检索相关的子图知识作为上下文,从而引导LLM生成回答,实现静态图谱数据向动态智能交互的转化。

数据与资源

其他信息

价值
作者 刘欣雨,闫政,康雨航
维护者 刘欣雨,闫政,康雨航
最近更新 二月 12, 2026, 11:34 (UTC)
创建的 二月 12, 2026, 11:17 (UTC)