<p id="nxp5x"><big id="nxp5x"><noframes id="nxp5x">

    <var id="nxp5x"><video id="nxp5x"></video></var>

          <em id="nxp5x"></em>

              首 頁 本刊概況 出 版 人 發行統計 在線訂閱 歡迎投稿 市場分析 1 組織交流 1 關于我們
             
            1
               通信短波
            1
               新品之窗
            1
               優秀論文
            1
               通信趨勢
            1
               特別企劃
            1
               運營商動態
            1
               技術前沿
            1
               市場聚焦
            1
               通信視點
            1
               信息化論壇
            1
            當前位置:首頁 > 優秀論文
            新聞視頻圖像中的模式識別技術研究
            作者:左雷 桂小渝 李士安(空軍工程設計研究局)
            來源:本站原創
            更新時間:2010/3/1 14:03:00
            正文:

            1、引言

            隨著信息、計算機和網絡技術的快速發展,大量的圖像和視頻的存儲與傳輸已經成為可能,如何對這些海量的數據進行有效地組織、表達、存儲、管理、查詢、檢索是對傳統數據庫技術提出的嚴峻挑戰。以文字為對象的傳統數據庫技術無法滿足多媒體數據的要求,它沒有對圖像及視頻數據的自動和有效的描述,大量信息將被淹沒在數據庫中,無法在需要時被檢索出來。視頻數據作為一種動態、直觀、形象的數字媒體,越來越多地出現在各類信息服務和應用場合。從過去的發展來看,視頻數據的獲得、處理、傳輸和存儲得到了較快的發展,但是視頻檢索和視頻內容的抽象、理解仍處于初始階段。近年來,基于內容的視頻分析受到了人們的重視并進行了廣泛研究,傳統的檢索視頻和圖像的方法受到了質疑和挑戰。

            新聞視頻作為視頻數據中有代表性的一種媒體,廣泛地受到人們的關注,它可以為我們提供大量內容豐富、直觀、形象生動的新聞節目。但隨著人們生活節奏的加快和電視新聞數據量的急劇增加,目前的電視技術已無法滿足人們的需要,在目前的條件下觀眾往往處于被動地位,電視臺放什么觀眾就看什么,而且必須嚴格按照電視制定的時間表來觀看,這便導致了這樣的矛盾:有些觀眾對電視臺播放的某些新聞不感興趣,而感興趣的新聞播出的時間又與自己的工作時間相沖突而無法觀看。為了解決這些矛盾,近年來國內外的一些學者開始探討新聞視頻的分析、檢索和瀏覽,以方便不同觀眾不受時間限制地、基于內容地選擇觀看自己喜愛的電視新聞節目。

            幀是視頻數據的最小單元,是一幅靜止的畫面。鏡頭是由幀組成的視頻數據的基本單位,是攝像頭的一次連續的動作,只能拍攝相鄰地點連續發生的事情。場景由內容相近的鏡頭組成,從不同的角度描述同一個事件。而視頻則由許多場景組成,敘述一個完整的故事;趦热莸囊曨l分析,是一種從幀中獲得的主要內容逐步建立視頻內容的自底向上的分析方法。首先進行視頻分割,其次對分割結果進行特征提取,通過對提取出的特征進行聚類檢索、場景變化檢測、語義分析等不同應用,用戶最終就可以方便地查詢或者瀏覽視頻內容。在新聞視頻分析的關鍵技術中,涉及到許多圖像模式識別技術,主要包括人臉檢測與識別、主持人鏡頭的檢測與識別及字幕探測等。

            2、人臉探測與識別

            新聞視頻中大部分新聞內容都與人物,特別是重要人物的活動、行為相關,其中的人物信息往往對理解視頻內容起到重要作用。重要人物的出現本身代表著某一重要活動或事件,通過對其進行探測與標識,可以輔助戰爭決策人員快速掌握與戰爭有關的國際動態與趨勢,從而進行正確、有效的戰爭決策,并減少分析、決策的時間。

            人臉探測與識別技術研究最早可追溯到19世紀法國人Galton[1]的工作,F代研究始于20世紀60年代末70年代初,并隨著科學技術而發展。自90年代以來一直是研究熱點,各種算法層出不窮。人臉檢測與識別可分為人臉檢測、人臉特征提取和人臉識別3個階段,整個流程如圖1所示。即對像集中的圖像逐幅進行檢測,判斷其中是否存在人臉,如果人臉存在,則對其進行精確定位,并進行人臉識別,通過特征提取,獲得人臉信息,進行身份驗證。

             圖1 人臉檢測與識別流程

            2.1 人臉檢測與定位

            人臉檢測就是從各種不同圖像中確定人臉的存在,并且確定人臉的數量、尺寸、位置和位姿,實質是使人臉與背景(非人臉)分離,它是完成自動人臉識別的第一步,是人臉識別的基礎[2]。人臉檢測方法可分為基于知識的和基于統計的兩大類[3]。

            基于知識的方法利用人的先驗知識建立若干規則,將人臉檢測問題轉化為基于面部特征不變量的假設/驗證問題。利用人臉的橢圓形輪廓特性,文獻[4]提取邊緣特征,并根據廣義Hough變換提取橢圓形狀信息,進行人臉檢測。文獻[5]提出了一種基于知識的快速人臉檢測方法,采用符合人臉生理結構特征的人臉鑲嵌圖模型,建立較為完備的知識庫,并采用多級檢測的步驟加快檢測速度;谥R的方法需要利用人臉的幾何和灰度等方面的特征整理出各種檢測規則,建立規則庫,這種規則庫還需要在實用中不斷修改和完善。

            基于統計的方法將人臉圖像看作一個高維矢量,在高維空間中對分布信號進行檢測;谔卣骺臻g的方法將圖像變換至某一個特征空間,再根據圖像在此空間中規律區分人臉和非人臉。主分量分析先進行K-L變換,得到特征值從大到小排序的特征臉[6] 。這樣既有效降低了維數,又保留了所需要的識別信息;谀0迤ヅ涞姆椒ㄍㄟ^與已建立的若干模板,進行匹配比較檢測人臉的存在問題。文獻[7]的基于多模板匹配的單人臉檢測效果較好。此外還有基于神經網絡和基于支持向量機等方法;诮y計的方法較適合對正面人臉圖像進行檢測,但圖像中人臉尺度及位姿發生變化,特別是旋轉變化,會使檢測難度加大,準確率相應降低。

            2.2 人臉的特征提取與識別

            人臉特征的提取與識別可看成是一個對3D物體的2D投影進行匹配的問題。人臉是個非剛性模型,在不同情況下可能存在形變(如表情、位姿等),從而造成模式的改變。此外,環境因素對人臉特征的提取與識別的效率影響很大。人臉特征提取與識別的方法可分為基于局部特征的識別和基于整體特征的識別。

            基于局部特征的方法是從臉部器官的形狀及其相互位置關系為出發點,提取與識別人臉特征。局部模板匹配是一種較為常用的方法。文獻[8]采用可變形模板技術,建立眼睛模型,根據能量函數調整模板參數達到最佳匹配,以實現人臉識別目標。文獻[9]受人臉側面輪廓的啟發,使用一種簡單而有效的灰度投影方法進行人臉特征提取與識別,并運用于三維人臉識別。由于灰度投影法的特性,可將其與模板匹配方法結合,提高識別的效果。

            基于整體特征的方法從整體上對人臉進行特征提取,進而識別人臉。此類方法較多,它是目前人臉識別領域的一種主流方法。K-L 變換是種常用的正交變換,將其用于人臉識別取得了較好的效果[10]。它根據一組人臉圖像構造主分量子空間,由于主元具有人臉的形狀,也稱特征臉。將測試圖像投影到主分量子空間上,得到了一組投影系數,與各個已知的人臉圖像進行比較識別,取得了較好的識別效果。文獻[11]使用一種基于動態鏈接結構的彈性匹配法來定位人臉,并根據人臉數據庫進行匹配識別。

            人工神經網絡目前正越來越被頻繁地應用于人臉識別,大部分的人臉識別神經網絡都采用多層感知器和BP(Back propagation) 學習算法[12]。該法具有較強的適應能力和魯棒性,可以有效地運用與多人臉、不同尺寸、不同姿態、不同膚色、不同光照條件和復雜背景的情況,是一種有效的人臉識別方法。而且通過適當增加訓練樣本的數量和類型,可以進一步提高識別性能。

            利用人臉的某種穩定的不變性特征也可進行人臉識別。奇異值具有穩定性、不變性(旋轉、平移、轉置不變性),可用于描述人臉。因此將人臉圖像看作一個數值矩陣,用奇異值分解提取奇異值,構成奇異值向量用于人臉識別[13]。

            2.3 人臉檢測與識別技術近期發展

            隱馬爾可夫模型采用概率統計的方法描述時變信號。文獻[14]提出了基于離散馬爾可夫模型和奇異值特征的人臉檢測方法,其實質是將奇異值特征轉化為向量序列,再利用HMM 對其進行識別,取得較好的效果。

            支持向量機方法是統計學理論中最年輕的部分之一,其主要理論在19921995年間才基本完成,目前仍在不斷發展之中,十分適合用于研究人臉識別兩類模式的小樣本問題[15]。

            當前,國內外很多研究者都致力于研究具有不變性的人臉識別系統,其中重要的方法是利用人臉的三維特征進行識別[16,17] 。這種方法能較好地解決二維人臉識別存在的問題(如受表情、光照和人臉位姿等影響較大),發展空間較大。

            目前還有一種重要方法是首先建立三維人臉模型,再利用模板匹配的方法進行識別。文獻[18]首先建立三維人臉網格模型,再利用PCA 方法降維,形成三維特征臉,再進行分類識別。文獻[19]通過建立三維可變形模板提取眼睛的精確特征,此方法建模效果直接影響到識別準確性,建模越復雜,識別正確性越高,但計算復雜性就越大。

            3、主持人鏡頭識別

            過去對新聞視頻的研究多是從新聞視頻處理的角度去分析,目的是為了實現對視頻資料的快速瀏覽與檢索。在新聞視頻分析和新聞視頻數據庫的研究中,一個重要的問題就是將新聞按場景進行分割,從而使整段新聞視頻分解為一個個新聞場景(新聞故事),以便組織和檢索。在新聞視頻中,主持人鏡頭是新聞場景的重要結構特征,它的出現往往表示一個新聞故事的結束和新的故事的開始,故可以作為新聞場景分割的邊界。因而對主持人鏡頭的檢測已成為新聞節目內容分析的重要手段。

            文獻[20]中提出一種基于模板匹配的方法,該方法需要多次掃描視頻序列,而且相似度測量的算法復雜度較高,因此實時性并不理想。文獻[21]提出了一種綜合視頻、語音和同步文本的方法來分析新聞視頻,對于主持人鏡頭的檢測主要采用語音信息進行定位,最后再利用同步文本信息輔助定位,但該方法的局限性較大。

            針對上述缺陷,文獻[22]提出一種階段模板匹配的方法。將新聞視頻的檢測過程分為兩個匹配階段,在第1階段中采用通用模板進行推廣的GHTgeneral Hough transform,推廣的廣義Hough變換)匹配,當檢測到第1個口播幀時,將其作為當前視頻序列的專用模板,并進入第2階段。在第2階段中采用專用模板進行基于彩色直方圖交運算的匹配color histogram intersection,簡稱CHI,由于CHI的算法復雜性遠低于GHT,從而大大減少了匹配時間,提高了算法的實時性。通用模板作為先驗知識集成在新聞視頻分析系統中,與具體被檢測視頻序列無關,在每次檢測時不需要更改。專用模板與當前被檢測視頻序列相關,每次檢測時需要通過通用模板的匹配找到當前有效的專用模板。

            文獻[23]通過分析新聞視頻口播幀具有的一些規則,由計算機系統完全獨立地對新聞視頻進行分析并自動檢測出口播幀。規則如下:1、新聞視頻中的口播幀出現的頻率高于其他圖像幀出現的頻率,口播幀的分布比其它圖像幀的分布要分散得多,而且它貫穿于新聞視頻的始末,一般地說,每隔一段時間就會有口播幀出現,這一規則可以從一些視覺特征上體現出來。2、新聞視頻中的口播幀每次出現都會持續一定時間,絕不會一閃而過,而其它的視頻圖象幀則不一定具有這一規則。3、新聞視頻中的口播幀在視覺特征上基本保持不變,這一規則為識別口播幀提供了可能。4、口播幀出現的同時,音頻流中一定有新聞播音員的話音信號。5、口播幀圖像的固定區域內一定有人臉出現。

            文獻[24]提出了一種綜合視頻、語音和同步文本的方法來分析新聞視頻,對于主持人鏡頭的檢測主要采用語音信息進行定位,最后再利用同步文本信息輔助定位,但該方法的局限性較大。文獻[25]通過分析人臉的膚色特征,構造標準模板來進行匹配,但該方法只確定了五種標準模板,很難適應所有類型的新聞節目,所以其通用性受到很大限制。

            文獻[26]提出了一種基于主色特征識別的新聞視頻口播幀方法,該方法首先提取口播幀的主色特征模板,然后利用該模板對新聞視頻的幀序列進行掃描匹配,并由計算機自動對口播幀進行檢測和標識。

            文獻[27]中采用利用人臉檢測濾除不存在大尺度人臉的候選鏡頭類,然后根據鏡頭時間序列規則得到真正的主持人鏡頭。該方法實時性好,但由于人臉檢測準確率不高,規則通用性差,因此檢測精確度較低。

            文獻[28]提出了一種半屏幕主顏色直方圖跟蹤方法。該方法在鏡頭分割的基礎上,利用主持人鏡頭在新聞節目中頻繁出現的統計特性,把所有可能為主持人的鏡頭列出,在這過程中采用的左右半屏幕檢測,可以消除背景變化及小窗口的出現對檢測結果的影響。然后根據主顏色直方圖信息逐個進行匹配,加以確定。最后利用新聞節目中主持人鏡頭出現的時間特征對候選鏡頭自動分類,以得到真正的主持人鏡頭。

            4、主題字幕探測識別

            新聞視頻中的字幕有助于人對新聞視頻語義內容的理解,是新聞視頻語義信息獲取的一條重要途徑。從新聞視頻中探測出來的字幕不僅僅可以用于新聞視頻內容的檢索,而且對新聞視頻的分類與索引都具有非常重要的作用。當前的字幕探測方法大體上可以分為基于區域、基于邊緣、基于紋理、基于連通分支等多種。

            當前的字幕區域探測方法大體上可以分為基于區域、基于邊緣、基于紋理、基于連通分支等多種;趨^域是指根據顏色或者區域能量進行區域聚類,然后根據字幕出現的特征來探測字幕區域;谶吘壍奶綔y主要是根據邊緣檢測的結果,根據一定規則進行邊緣聚類得到字幕區域。Bertini[29]等利用視頻序列前后幀差提取英文字幕信息;Lienhart[30]基于分裂/合并算法來對視頻幀中的文字進行分割;Hua[31]提出了一種基于邊緣的文本探測方法,但該方法難以消除出現的一些虛假區域;王辰等[32]提出了一種五階段的字幕探測方法,該方法通過邊緣的聚類以及規則的制定來達到文本串探測的目的,但算法受閾值影響比較大;胡宏斌等[33]提出的文字探測方法主要針對視頻幀中的固定區域來進行,有可能漏掉有價值的字幕信息。

            視頻流中的標題字幕幀重復率高以及背景的多變性是應用多幀信息融合來提高文本塊質量的依據。文獻[34]提出了多幀融合的字幕探測方法,需要對字幕區域進行分割,根據視頻流中文本背景的多變性和文本內容不變性的特點,通過利用不同背景信息之間的差異來剔除冗余信息。由于中文字幕的漢字與漢字之間沒有明顯的間隙,因此這種基于字幕分割的多幀融合方法只適用于英文字幕,對中文字幕的探測則不太適用。

            文獻[35] 采用支持向量機的方法,首先將原始圖像幀分割為N×N的子塊,提取每個子塊的灰度特征,然后使用預先訓練好的SVM 分類機進行字幕子塊和非字幕子塊的分類,最后結合金字塔模型和后期處理過程,實現視頻圖像字幕區域的自動定位提取,實驗表明文中方法取得了良好的效果。

            文獻[36]首先分析了新聞字幕的特征,包括位置特征和顏色特征等,然后采用灰度變換、邊緣檢測、字幕區域探測、字幕區域合并與過濾以及二值化等步驟,在灰度變換以及邊緣提取的基礎上進行水平與垂直掃描,獲取候選的字幕區域,然后通過設定一系列簡單規則得到最終的字幕區域。整個算法具有簡單、高效、閾值設定不敏感的特點,對大多數新聞視頻中的字幕都具有較好的效果。算法主要針對水平字幕進行檢測,對垂直字幕的檢測還有待進一步改進。

            文獻[37] 在分析視頻字幕特點的基礎上,首先進行文字事件檢測,然后進行邊緣檢測、閾值計算和邊緣尺寸限制,最后依據文字像素密度范圍進一步濾去非文字區域的視頻字幕。文章提出疊加水平和垂直方向邊緣的方法來加強了檢測到的文字的邊緣,對邊緣進行尺寸限制過濾掉了不符合文字尺寸的邊緣,進一步,提出像素密度 的概念(把一個像素及其確定鄰域內灰度的和稱為像素密度),并指出文字區域的像素密度應在某一閾值范圍之內 。通過像素密度濾去了非文字區域,應用投影法最終確定視頻字幕所在區域,這些方法的結合保證了字幕探測算法的正確率和魯棒性。

            文獻[38]提出支持向量機的小波特征域視頻字幕提取方法,該方法首先對視頻圖像進行分割,采用Harr小波,提取他們在小波變換域中的統計特征,然后用支持向量機分類器對這些特征進行分類,以此來實現字幕的自動檢測與提取。實驗顯示該算法對包含大小字幕的視頻圖像都能給出較好的識別結果,具有不錯的魯棒性及較好的推廣能力,缺點在于對識別區域的邊界定位有些粗糙。

            5、結束語

            新聞視頻分析與檢索技術涉及到多個學科和技術領域,需要研究的問題還很多,本文主要探討了新聞視頻圖像中的模式識別技術,對人臉探測與識別、播音員鏡頭探測與識別及字幕探測與識別進行了詳細介紹,雖然已經有許多方法去完成上述模式識別技術,但由于各種理論和相關技術的限制,效果好的、魯棒性強的方法還很難實現,因此仍有許多問題有待下一步去學習、解決和深入研究。

            參考文獻

            [1] Galton S F. Personal identification and description-I [J ]. Nature ,1888 ,21 :173 - 177.

            [2]章毓晉. 中國圖像工程及當前的幾個研究熱點[J]. 計算機輔助設計與圖形學學報, 2002 ,14 (6) : 489 - 500.

            [3] 周杰, 盧春雨, 張長水等. 人臉自動識別方法綜述[ J ]. 電子學報,2000,28 (4) :102 - 106.

            [4] Wang J G, Tam T N. A new face detection method based on shape information[J]. Pattern Recognition Letters,2000,21 (6/7) : 463 - 471.

            [5] 姜軍, 張桂林.一種基于知識的快速人臉檢測方法[J]. 中國圖像圖形學報,2002,7(1):6-10.

            [6] 邊肇祺, 張學工. 模式識別(2) [M] . 北京:清華大學出版社,2000.1 - 50.

            [7] 梁路宏, 艾海舟, 何克忠. 基于多模板匹配的單人臉檢測[J]. 中國圖像圖形學報,1999,4 (10) : 825-830.

            [8] Yuwen W, Hong L, Hongbin Z. A new method of detecting human eyelids based on deformable templates[A]. 2004 IEEE International Conference on Systems, Man and Cybernetics[C]. 2004 : 604-609.

            [9] Li T, Asari V. A novel technique for the extraction of depth information by gradient analysis on grayscale images[A]. Proc of 33rd Applied Imagery Pattern Recognition Workshop[C]. 2004 :  223-228.

            [10] Bai-Bo Z, Chang-Shui Z. Lower bounds estimation to KL transform in face representation and recognition[A]. Proc of 2002 International Conference on Machine Learning and Cybernetics[C]. 2002 : 1314-1318.

            [11] Takat sugu H, Yoshio I, Masahiko Y. Parallelization between face localization and person identification[A]. Proc of Sixth IEEE International Conference on Automatic Face and Gesture Recognition[C]. 2004 : 183-188.

            [12] Ping W, Wei-Qing X, Xiao-Quan W. A design and complement for face recognition[A]. Proc of 2004 International Conference on Machine Learning and Cybernetics[C].2004 : 3666-3669.

            [13] Yuan T, Tieniu T, Yunhong W. Do singular values contains adequate information for face recognition[J ]. Pattern Recognition ,2003,36(3) : 649-655.

            [14] 李士進, 楊靜宇, 陸建峰. 基于奇異值特征和隱馬爾可夫模型的人臉檢測[J]. 中國圖像圖形學報, 2001, 6(7) : 681-688.

            [15] Hyungkeun J, Kyunghee L, Sungbum P. Eye and face detection using SVM[A]. Proc of the 2004 Intelligent Sensors. Sensor Networks and Information Processing Conference[C]. 2004 :  577-580.

            [16] Yuxiao H, Dalong J, Shuicheng Y, et al. Automatic 3D reconstruction for face recognition [A]. Proc of Sixth IEEE International Conference on Automatic Face and Gesture Recognition[C] . 2004 : 843-848.

            [17] Dalong J, Yuxiao H, Shuicheng Y, et al. Efficient 3D reconstruction for face recognition[J]. Pattern Recognition,2005,38 (6) : 787-798.

            [18] Chenghua X, Yunhong W, Tieniu T, et al. Face recognition using 3D eigenfaces[A]. 生物識別研究新進展(2)[C]. 北京:清華大學出版社,2003 : 3-10.

            [19] 黃萬軍, 尹寶才, 陳通波等. 基于三維可變形模板的眼睛特征提取[J]. 計算機研究與發展,2002,39 (4) : 495-501.

            [20] Hanjalic, A., Lagendijk, R.L., Biemond, J. Semi-Automatic news analysis. indexing and classification system based on topics preselection. In: Yeung, M.M. , Yeo, B.L. , Bouman, C. A. eds. SPIE. San Jo se, CA: SPIE, 1999. 3656: 86-97.

            [21] Huang, Q., Liu, Z., Rosenberg,A. Automated semantic structure reconstruction and representation generation for broadcast new s. In: Yeung, M. M., Yeo, B. L. , Bouman, C. A. eds. SPIE. San Jo se, CA: SPIE, 1999. 3656: 50-62.

            [22] 馬宇飛, 白雪生等. 新聞視頻中口播幀檢測方法的研究[J]. 軟件學報,2001, 12(3) : 377-382.

            [23] 于俊清, 湯旸, 閆冬, 周洞汝. 基于規則分析的新聞視頻口播幀檢測. 計算機工程與應用, 2004.6 : 84-86.

            [24] YAriki, Y Saito. Extraction of TV News Articles Based on Scene Cut Detection Using DCT Clustering[A]. Proc of the Int’l Conf on Image Processing[C]. 1996 : 847-850.

            [25] B Gunsel, A M Ferman, A M Tekalp. Video Indexing Through Integration of Syntactic and Semantic Features[A]. Proc of the IEEE Workshop on Application of Computer Vision[C], 1996 : 90-95.

            [26] 于俊清, 湯旸, 周向東. 基于主色特征識別的新聞視頻口播幀. 計算機工程與科學,2004,26(8) : 28-31.

            [27] Shearer K,Dorai C,Venkatesh S. Incorporating domain knowledge with video and voicedata analysis in news broadcasts[C]. In:Proceedings of the 1st International Workshop on Multimedia Data Mining MDM/KDD 2000,Boston,2000 : 46-53.

            [28] 李默, 李弼程, 鄧子健. 新聞視頻主持人鏡頭的半屏幕檢測算法. 計算機工程與應用,2005,15 : 183-185

            [29] Bertini M, Bimbo A.D., Pala P.. Content-based indexing and retrieval of TV news. Pattern Recognition Letters, 2001,22 : 503-516.

            [30] R. Lienhart and F. Suber. Automatuc Text Recognition for Video Indexing. SPIE conference on image and video processing, Jan 1996.

            [31] Xian-Sheng Hua, Xiang-Rong Chen, Liu Wenyin, Hong-Jiang zhang. Automatic location of text in video frames. Proc. of ACM Multimedia 2001 Workshops: MIR2001, 24-27, Ottawa, Canada, October 5, 2001.

            [32] 王辰, 老松楊, 胡曉峰. 視頻中的文字探測. 小型微型計算機系統, 2002,234):478-481.

            [33] 胡宏斌, 徐俊,, 周洞汝等. 基于COM技術的視頻流文字探測. 計算機工程,2001,27(6) : 95-97.

            [34] Xian-Sheng Hua, Pei Yin, Hong-Jiang Zhang. Efficient video text recognition using multiple frame integration. International Conference on Image Processing (ICIP2002), Rochester, New York, Sep. 22-25, 2002.

            [35] 莊越挺,劉駿偉,吳飛,潘云鶴,張引. 基于支持向量機的視頻字幕自動定位與提取. 計算機輔助設計與圖形學學報,2002,14(8) : 750-753.

            [36] 謝毓湘,欒悉道,吳玲達,老松楊. 新聞視頻幀中的字幕探測. 計算機工程, 2004,30(20) : 167-169.

            [37] 蔡波,周洞汝,胡宏斌. 數字視頻中字幕檢測及提取的研究和實現. 計算機輔助設計與圖形學學報,2003,15(7) : 898-903.

            [38] 彭培華,曲波,陳榮勝. 基于支持向量機的小波域視頻字幕檢測與提取. 華南理工大學學報(自然科學版), 2004,32 : 63-66.

             

            第一作者簡介

            左雷(1963-  男,高級工程師,空軍工程設計研究局計算機應用研究室主任。主要研究方向:計算機網絡、多媒體設計、企業信息管理。09937

             
             
               
            《通信市場》 中國·北京·復興路49號通信市場(100036) 點擊查看具體位置
            電話:86-10-6820 7724, 6820 7726
            京ICP備05037146號-8
            建議使用 Microsoft IE4.0 以上版本 800*600瀏覽 如果您有什么建議和意見請與管理員聯系
            欧美成人观看免费全部欧美老妇0