03/19

可能是我理解錯誤,畢竟這次來的講者跟我們差不多年紀而已,還缺乏經驗

對不懂 NLP (自然語言) 或者 semantic web (語意網) 的人來說,並沒有搔到癢處

大家都沒辦法 catch 到這個東西為何重要、以及他要解的問題是什麼

只能感受到他很想教 RDF 跟 SPARQL 這兩樣東西

(預設大家都對這主題很熟、很有興趣是大忌,不過這又是題外話了)

 

我大四的時候就稍微接觸過 semantic web,最後整個專題只能算是勉強交差(苦笑)

玩過的結論是:這東西真的很不親切

所謂的不親切不是它很艱澀難懂

而是語意網的研究往往具有「封閉性」,這樣的特性帶給研究語意網的人非常大的限制

(這個詞可能不恰當,先暫時這樣用)

 

雖然他對於這些限制隻字未提,我也自作主張地認為在場的人都很想問

但若說我親身體會過這種困境,想必是更有說服力了

問題就在「該由誰來定義 semantic web 的 schema」以及「誰要作苦工把文件格式轉換成 RDF 檔」

該由誰來定義 semantic web 的 RDF schema?

所有現實中的實體(包括人)都可以被定義成一個獨一無二的 Identifier

而所謂 ontology 可以想成是一個知識體系的架構,每個名詞以及他們之間的關係都要被定義成 RDF schema

W3C 官方已經定了不少,有針對日期事件的 schema、也有針對出版物的 schema

也有一些非官方的,比如 FOAF(Friend of a friend)用來敘述你的朋友還有什麼朋友(用在人際關係)

問題來了,誰都可以定嗎?理論上是的!

所以可能某單位定義了 Tim Berners Lee,但另一個單位硬是要定義同一個人叫 Tim-Berners Lee

(這人似乎是 web2.0 之父,也是這次講者的老闆,上述例子只差一條橫線)

諸如此類的差別實在多到數不清

 

又比如 e-mail 我硬要叫他 email ,這些同義字都只能選擇一個

即使不同的名稱,可以用敘述句把他們連結起來,告訴電腦「這是同一個」

但是把 HTML 轉成 RDF 格式的人,究竟有什麼理由要這樣作?我就是爽這樣叫他另一個名字,不行嗎?

就算那個人佛心來著,願意讓名稱被「統一」

但是他又有什麼管道可以知道這個「東西」已經被定義好了?

千萬個 concept 被定出來,絕對有 overlap、noise,結果還是一團亂

(目前看來顯然還沒有這個煩惱,因為願意耗費青春去訂 concept 的研究人員並不多)

 

誰要作苦工把文件格式轉換成 RDF 檔?

這個問題被講者假設已經完全處理好了(偏偏應該是最大的問題,對研究語意網的人來說)

 

在我看來 W3C (或者說 Tim Berners Lee 以及他的團隊)的終極目標

是人人都把 HTML 這類原本給人看的文件,自願用「人力」轉成 XML 甚至是 RDF 格式(給機器看)

(為什麼一定要用人力?因為中間的 semantic gap 目前用機器還無解!)

最終整個地球上的文件彼此都可以相連,而且是具有「邏輯」,可以一個連一個、推導到全世界所有 concept

然而人們又有什麼理由要把自己的文章轉成艱澀(對一般人來說)的 RDF 檔?

(除了「完成語意網」這樣的「願景」之外)

No! nothing can motivate people to do that!

 

結果就是只有研究醫學相關語意的人會去訂醫學的 ontology 以及轉換所有 RDF 文件

研究什麼領域的就做什麼領域的苦工,開放的資料量少得可憐

跟現在什麼都要 crowdsourcing 或者研究資料都從網路 crawl 下來的方式完全相反

 

要做 google 或者雅虎奇摩知識+這種包山包海的回答,我賭它再十年都辦不到

但這不表示 semantic 的東西完全無用

如同上述所說,專門領域(domain-specific)的研究是有人在做的

專有名詞不容易混淆、而且也較少有模糊的現象,就適合作這類事情

 

http://www.ask.com 以及 http://www.answers.com/

都是已經有點歷史、比較大的 semantic search engine(雖然還沒有非常好用)

(話說多媒體事件的 ontology 也有人在訂 :p)

 

回到主題,Tim Berners Lee 在 2001年就提出 semantic web

而 RDF 與 SPARQL 這些東西我一年前就知道了,結果再次遇到卻沒有進展

沒看到這些東西能有什麼嶄新的希望(?)以及可能性,著實令人失望...

或許他們已經有不少努力的成果,只是還沒有公開給大家知道(?)

 

延伸閱讀:個人化搜尋: 搜尋引擎的下一步, Semantic Web 的前一步

http://mmdays.wordpress.com/2007/08/04/personlized-search/

arrow
arrow
    全站熱搜

    LeavedCorn 發表在 痞客邦 留言(1) 人氣()