2012年10月31日 星期三

Linked Open Data cloud diagram

Linked Open Data cloud diagram 是將網路上現存相連的Linked Data資料集以網路雲圖加以表示的產物,從最早2007年時在資料雲圖中只有12個相連的資料集,到2011年時已經有各種領域共 295個資料集互相連結,成長速度十分快速。


2007年時的資料雲圖

2011年時的資料雲圖 連結

在最新版的資料雲圖中以顏色將不同領域的資料集做區分,共分為:多媒體、地理、出版品、用戶生成內容 、政府、跨領域、生命科學這七大分類。

部分資料集介紹:

多媒體:   

    MusicBrainz:MusicBrainz是線上的音樂百科全書,像是音樂界的維基百科,提供任何使用者編輯關於音樂的資料。


    NewYorkTimes:將紐約時報中的訊息作為RDF發佈,使其在網路上可以被存取。

地理:
    GeoName:為地理領域中最多被連結的資料集,透過從其他資料集和網路資源中取得的資訊,加上Google Map API的功能,可以幫助使用者很快速的了解目標地點和周圍地理特徵。

    LinkedGeoData:LinkedGeoData使用OpenStreetMap計劃所收集到的資訊,並作為一個RDF知識資源公布在網路上,供其他做串連。

出版品:
    DPLB:DPLB是一個關於科學論文的書目資料集,可以從作者或各種書本資訊查詢書籍資料,亦提供一個RKB Explorer讓使用者可以用SPARQL查詢資料。

    CiteSeer:也是一個關於學術論文的知識庫,並且主要集中在電腦和資訊科學領域。料集

用戶生成內容:
    Flickr Wreppr:將DBpedia從維基百科中提取出的RDF連結延伸Tag到Flickr發佈的相片上。

政府:
    Ordnance Survey:為英國政府全國地形測量局所發佈的資料集,涵蓋的範圍包含英格蘭、蘇格蘭和威爾斯。

跨領域:
    DBpedia:目前最大的資料集,以維基百科的資料加以結構化,幾乎和所有的Linked Data互相串連,目前Linked Data資料雲的中心樞紐。

    Freebase:為一個巨大的線上協作知識庫,提供程式工程師以API、RDF終端方式存取知識庫內的資料,freebase是在2008年國際語意網研討會上發佈將知識庫中的topic生成RDF的服務,使freebase的資料可以做為Linked Data被串連和存取。

生命科學:
    Uniport:一個提供蛋白質序列和功能訊息的資料集,包含了大量的蛋白質功能研究文獻,也提供以RDF方式供網路上其他資源使用。

沒有留言:

張貼留言