从Common Crawl.爬取的html-rdfa格式数据
plist文件,里面存有多个数据文件的压缩包地址,GZIP格式压缩,共计47GB
Oraindik ez dira baliabide honentzako bistak existitzen
Informazio gehigarria
| Eremua | Balorea |
|---|---|
| Datuen azken eguneratzea | 2018(e)ko apirilaren 10(a) |
| Metadatuen azken eguneratzea | 2018(e)ko apirilaren 10(a) |
| Sortuta | 2018(e)ko apirilaren 10(a) |
| Formatua | ezezaguna |
| Lizentzia | Creative Commons Attribution |
| Datastore active | False |
| Has views | False |
| Id | 0ac0dbca-24d0-4e8c-ab2d-42c663fe29c4 |
| Package id | 6ef09fcf-7a7f-42ee-b1d1-9784d53b81d8 |
| Position | 0 |
| State | active |