close

  中新社西寧12月2日電(羅雲鵬)“搜索引擎是文化與歷史傳承的新載體,對一國的文化安全意義重大,‘雲藏’是全球首個藏文智能搜索引擎,建成後對藏文信息安全、國內外涉藏輿情監測以及重要輿情分析將提供可靠的參數和依據”。2日,青海省海南藏族自治州藏語委辦主任、“雲藏”引擎開發負責人才洛告訴中新社記者。
  “雲藏”一詞是藏文的音譯詞,有兩層含義,其一為“上師”或“老師”,意為有求必應、有問必答;其二是將其分為單字,有“全面抓取、提取”之意。“雲藏”搜索引擎是青海省少數民族事業“十二五”規劃中藏文信息化建設的重要組成部分,於2013年4月啟動系統平臺項目建設,研發團隊現有100餘名工作人員,由藏文信息錄入組、分詞標註組和技術組3個小組組成,團隊中藏族比例達84%,該搜索引擎預計將於2015年年底建設完成,2016年7月正式開通。
  “目前,中國國內如百度、搜狗等主要的搜索引擎中沒有藏文搜索功能,但國外搜索引擎反而支持藏文的簡單搜索,如谷歌英文版、中文版,雅虎英文版、中文版以及微軟的bing搜索引擎等”,才洛說,“由於數據索引庫在國外,檢索到的信息準確性和內容有受制性,對應出自國內的真實和有效的信息不能被及時檢索,提供的有關藏文化知識準確度不高、信息量不夠”。
  據瞭解,“雲藏”藏文搜索引擎系統平臺建設項目,是一個集搜索引擎、藏文百科、自動問答為一體的大型藏文門戶系統工程,將開闢新聞、網頁、圖片、視頻、百科、文庫、知道7個板塊,“任何搜索引擎中,數據庫的建設是最為繁瑣艱巨的工作。尤其對於藏文搜索引擎來說是一項從零開始的浩大工程”。才洛介紹,“雲藏”搜索引擎覆蓋了文化、衛生、教育、科技、宗教、人物等諸多方面,截至目前,已錄入歷史、文學、宗教、醫學、自然以及各類詞典等25類資料,共錄入12.7萬條詞條,字數達1197.7萬字。
  “‘雲藏’建成後,該系統的藏文搜索正確識別率將達95%,不僅能滿足藏文網民個性化的檢索需求,還將推動藏文信息全方位融入互聯網世界。”才洛說,“未來使用藏文的網民輸入一個詞彙,就會有對應的百科知識,如果詞條內容空缺,系統會提示網民自主添加,後臺審核通過即可錄入數據庫,這種方式,將使數據庫不斷地豐富、擴充”。
  目前已知的藏文網頁超過6700萬個,初步估算,“雲藏”運行初期,青、藏、甘、川、滇五省區的藏文用戶數量約為120萬,隨著搜索引擎產品的推廣和宣傳,用戶量將達200萬。(完)  (原標題:青海“雲藏”打造全球首個藏文智能搜索引擎)
arrow
arrow
    全站熱搜

    gk23gkifpt 發表在 痞客邦 留言(0) 人氣()