華北電力大學 控制與計算機工程學院 102206
摘要:在網絡社區中由于標簽的標注過程具有隨意性和多樣性,一個標簽通常有幾種含義, 導致標簽的準確率較低,因此在網絡協作標注過程中標簽的一詞多義和同義是首先需要解決的問題。本文提出了一個基于上下文的標簽消歧算法,大概方法是利用Wikipedia的通用信息來拓展標簽的語義,然后提取圖像的上下文信息并比較其與各個Wikipedia條目的相關程度。相似度最高的Wikipedia條目被選取來代表這個標簽的真正含義。通過實驗證明,此算法可以取得較高的準確性。
參考文獻
[1] Mika P. Ontologies are us: A Unified Model of Social Networks and Semantics [J]. Journal of Web Semantics, 2007, 5 (1): 5 -15.
[2] Gernmell J, Shepitsen A, Mobasher B, eta.l Personalizing Navigation in Folksonomies Using Hierarchical Tag Clustering[C]. In : Proceedings of Data Wareh ousing and Knowledge Discovery. Berlin: Springer-Verlag, 2008: 196- 205.
[3] Reyn Nakamoto, Shinsuke Nakajima, Jun Miyazaki, Shunsuke Uemura. Tag-Based Contextual Collaborative Filtering. IAENG International Journal of Computer Science, 34:2, IJCS_34_2_08
[4] Carson Liao, Liang-Chi Hsieh, Winston Hsu: Context Search and Recommendation for Large-Scale Community-Sharing Photos: Department of Computer Science and Information Engineering,National Taiwan University, Taipei, Taiwan
作者簡介
程文剛(1977— ),男,博士,副教授,碩導,主要研究領域為網絡多媒體搜索與挖掘,圖像/視頻處理,智能軟件;
湯莊園(1982— ),男,碩士研究生,主要研究領域為網絡多媒體搜索與挖掘;