BTC2019数据集: Billion Triple Challenge 2019 Dataset

BTC数据集是从2018/12/12到2019/01/11使用LDspider进行大规模RDF爬取的数据,数据以四元组的形式存储,第四个元素编码相关联的三元组从web文档解析的位置。数据集包含了2,155,856,033个四元组, 从394个付费级域中的2,641,253个RDF文档中收集。把数据合并到一个RDF图中会产生256,059,356个不同的三元组,这些数组 (四元组或三元组)包含了38,156个不同的谓词和120,037个不同类的实例。

Podaci i Resursi

Dodatne informacije

Polje Vrijednost
Izvor https://zenodo.org/record/2634588#.XS07WJMzZTY
Zadnja izmjena 1. studenoga 2024, 1:48 (UTC+00:00)
Kreirаno 17. srpnja 2019, 3:48 (UTC+00:00)