从Common Crawl.爬取的html-rdfa格式数据
plist文件,里面存有多个数据文件的压缩包地址,GZIP格式压缩,共计47GB
ለዚህ የመረጃ ምንጭ የተፈጠረ እይታ ገና የለም።
ተጭማሪ መረጃ
መስክ | ዋጋ |
---|---|
መረጃው መጨረሻ የተሻሻለው | 10 ኤፕሪል 2018 |
ልዕለ-መረጃ ለመጨረሻ ጊዜ የተሻሻለው | 10 ኤፕሪል 2018 |
ተፈጥሯል | 10 ኤፕሪል 2018 |
ቅርጸት | ያልታወቀ |
ፈቃድ | Creative Commons Attribution |
Datastore active | False |
Has views | False |
Id | 0ac0dbca-24d0-4e8c-ab2d-42c663fe29c4 |
Package id | 6ef09fcf-7a7f-42ee-b1d1-9784d53b81d8 |
Position | 0 |
State | active |