<p id="nxp5x"><big id="nxp5x"><noframes id="nxp5x">

    <var id="nxp5x"><video id="nxp5x"></video></var>

          <em id="nxp5x"></em>

              首 頁 本刊概況 出 版 人 發行統計 在線訂閱 歡迎投稿 市場分析 1 組織交流 1 關于我們
             
            1
               通信短波
            1
               新品之窗
            1
               優秀論文
            1
               通信趨勢
            1
               特別企劃
            1
               運營商動態
            1
               技術前沿
            1
               市場聚焦
            1
               通信視點
            1
               信息化論壇
            1
            當前位置:首頁 > 優秀論文
            一種基于賦權向量距離的檢索技術
            作者:王鵬 史辰方
            來源:本站原創
            更新時間:2012/11/19 11:39:00
            正文:

                               (北京航空航天大學計算機學院,北京,100191)
            摘  要:本文針對混合類型元素組成的向量,即包含值域離散型、值域連續型元素的向量,提出了一種基于數據驅動的屬性權重計算方法。根據查詢向量的取值確定搜索空間范圍,并統計搜索空間內屬性取值分布情況,動態的統計出各個屬性在搜索中的區分度大小,進而計算出各屬性在相似度計算時所占權重值,并將權重值引入到基于向量距離的檢索中。本文利用服裝數據庫對檢索方法進行評估,實驗結果表明基于數據驅動的權重計算方法很好地分析出屬性區分度,使檢索結果更加符合用戶預期,取得較好的結果。
            關  鍵  詞:數據驅動;權重計算;搜索空間;向量距離
            Similarity Search Method Based on Weighted Vector Distance
            Wang Peng , Shi Chenfang
             (School of Computer Science and Engineering, Beijing University of Aeronautics and Astronautics, Beijing 100191, China)
            Abstract:In this paper, a new property data-driven based weight calculation method is proposed, which is applicable to vectors consisting both categorical and continuous attributes. According to the query vector, a corresponding search space is specified. In this space, data distribution is analyzed dynamically, thus to gain the discrimination degree and then the weight of each attribute. To evaluating our method, we experiment with an actual database containing several attributes of clothes. Experiments show our method improve the accuracy and the results can better fit users’ expectations.
            Key words:Similarity search; data-driven; weighted vector distance; search space

             

             


            參考文獻
            Shyam Boriah, Varun Chandola, Vipin Kumar. Similarity Measures for Catogerical Data: A Comparative Evaluation(J). In Proceedings of the eighth SIAM International Conference on Data Mining.2008,243-254.
            Rui Yang,Panos Kalnis,Anthony K. H.Tung+. Similarity Evaluation on Tree-structured Data(J). 2005 ACM SIGMOD.2005,754-765.
            Christopher D.Manning,Prabhakar Raghavan,Hinrich Schutze. Introduction to Information Retrieval(M).北京:人民郵電出版社,2011, 12。
            Jiawei Han, Micheline Kamber. Data Mining Conceptes and Techniques,Second Edition(M).北京:機械工業出版社,2011, 10。

            作者簡介:
            王鵬(1988-),男,漢族,北京航空航天大學計算機學院碩士研究生,主要從事互聯網應用、信息檢索技術方面的研究,信息檢索。                                     

             
             
               
            《通信市場》 中國·北京·復興路49號通信市場(100036) 點擊查看具體位置
            電話:86-10-6820 7724, 6820 7726
            京ICP備05037146號-8
            建議使用 Microsoft IE4.0 以上版本 800*600瀏覽 如果您有什么建議和意見請與管理員聯系
            欧美成人观看免费全部欧美老妇0