中文医疗段落检索数据集KUAKE-IR

受疫情催化影响,人们通过互联网获取医疗信息的诉求相比往年更加强烈,搜索质量的高低将直接影响用户获取信息的有效性。因此在AI时代,如何通过构建智能搜索能力提升线上用户的满意度成为了众多医疗AI厂商的重要研究课题。本数据集由阿里巴巴搜索事业部和阿里夸克平台联合发布,目标是旨在推动医疗搜索领域的技术发展。

本数据集包含100W语料库,训练集、验证集和测试集的数量分别为10W、1K和1K。

Data and Resources

Additional Info

Field Value
Source https://tianchi.aliyun.com/dataset/dataDetail?dataId=95414
Author 阿里云天池
Maintainer 阿里云天池
Last Updated اکتبر 9, 2022, 02:57 (UTC)
Created اکتبر 9, 2022, 02:57 (UTC)