中文医疗段落检索数据集KUAKE-IR

受疫情催化影响,人们通过互联网获取医疗信息的诉求相比往年更加强烈,搜索质量的高低将直接影响用户获取信息的有效性。因此在AI时代,如何通过构建智能搜索能力提升线上用户的满意度成为了众多医疗AI厂商的重要研究课题。本数据集由阿里巴巴搜索事业部和阿里夸克平台联合发布,目标是旨在推动医疗搜索领域的技术发展。

本数据集包含100W语料库,训练集、验证集和测试集的数量分别为10W、1K和1K。

Daten und Ressourcen

Zusätzliche Informationen

Feld Wert
Quelle https://tianchi.aliyun.com/dataset/dataDetail?dataId=95414
Autor 阿里云天池
Verantwortlicher 阿里云天池
Zuletzt aktualisiert Oktober 9, 2022, 02:57 (UTC)
Erstellt Oktober 9, 2022, 02:57 (UTC)