摘 要: 通過研究智能視頻監控系統中所涉及視頻處理的技術與算法,在總結與分析的基礎上本文設計了一種基于自組織特征映射網絡的二次行為分析模型。由于進行的兩次行為分析采用了不同的方法,因此在一定程度上提高了視頻監控系統對異常行為判斷的正確率。本文在介紹模型基本框架的基礎上,重點探討了模型中各個視頻處理模塊的實現技術。
關鍵詞: 智能視頻監控, 行為分析, 自組織映射, 神經網絡, 異常判斷
中圖分類號:TP399 文獻標識碼:A 文章編號:
A Module of Double Behavior Analysis Based on Self-Organizing Feature Map
Chen Hongchuan, Zhan Yinwei
(Visual Information lab, Computer Faculty, Guangdong University of Technology, Guangzhou, 510006)
Abstract: Through the study of technology and algorithms about the video processing in intelligent video surveillance system, a module of double behavior analysis based on self-organizing feature map is designed on this paper. Because using different methods between the two behavior analysises, we have improved the accuracy of judging abnormal behavior to some degree. After describing the architecture of this module, we also discuss the detail technology we used in the module.
Key words: video surveillance, activity analysis, SOFM, neural network, abnormal judge
0 引言
智能視頻監控技術是計算機視覺領域近年來新興的一個研究方向。它的主要研究目標是利用計算機視覺技術、圖像視頻處理技術和人工智能技術,在不需要人為干預的情況下,對監控視頻的內容進行描述、理解和分析,并能根據分析的結果對視頻監控系統進行控制,從而使視頻監控系統具有較高層次的智能化水平。
通過研究智能視頻監控系統中所涉及視頻處理的技術與算法,在總結與分析的基礎上本文設計了一種基于自組織特征映射網絡的二次行為分析模型。由于進行的兩次行為分析采用了不同的方法,因此在一定程度上提高了視頻監控系統對異常行為判斷的正確率。本文在介紹模型基本框架的基礎上,重點探討了模型中各個主要視頻處理模塊的實現技術。
1 智能視頻監控系統整體模型介紹
設計智能視頻監控的目的主要是為了能夠對監控視頻中的目標行為進行實時監控和分析,并對出現的異常行為發出異常預警。本文所設計的基于自組織特征映射網絡的二次行為分析模型如圖1所示。本系統模型可以處理的數據流包括視頻文件及監控攝像頭。目前在Windows平臺上對視頻數據進行處理的方法主要有兩種:基于VFW的視頻捕捉和基于DirectShow的視頻捕捉。系統首先通過目標檢測獲取了運動目標本身的圖像特征,然后通過目標跟蹤得到了運動目標在視頻圖像中的坐標位置,也即是運動目標的運動軌跡。在得到運動軌跡后通過計算也就可以得到目標行為的其它運動特征如速度、加速度等。在第一次進行行為分析時采用運動目標的流向量來表示目標的行為,利用自組織特征映射網絡進行行為分析,一旦發現異常行為馬上發現異常警報。對正常的目標行為繼續進行二次行為分析:將運動目標的整條軌跡作為自組織特征映射網絡的輸入進行行為分析,一旦發現異常行為則發出異常警報。這樣一來既保證了分析的實時性,又保證了運動的連續性,因此一旦程度上提高了系統對異常行為判斷的正確率。

圖1 智能視頻監控系統模型
2 目標檢測與跟蹤
運動目標檢測就是檢測監視場景中是否存在與背景相對運動的前景目標,也即就是檢測監視的場景圖像是否有出現變化,如果有變化則說明有目標出現,否則認為沒有目標出現。當發現有運動目標出現時,就把這個目標從視頻序列圖像中分割提取出來,為下一步的目標跟蹤提供數據。通常目標檢測算法有幀差法、背景差法、光流法及運動能量法[1]。幀差法算法具有復雜度低、速度快、實時性好的優點,但當運動目標速度過快時可能會被誤認為是兩個運動目標,當運動目標速度過低時則運動目標可能被忽略。背景差法不會出現這種缺點,但是實際監控中較難獲得一個“純凈”的背景圖像,且背景圖像較易受光照等因素的影響而變得不穩定。
目標跟蹤主要是針對一段視頻序列,實現對運動目標O的實時跟蹤,記錄目標的運動軌跡
,為后面的目標行為分析提供依據。通常目標跟蹤方法有基于模型的跟蹤、基于區域塊的跟蹤、基于活動輪廓的跟蹤及基于特征的跟蹤[1]。
3 自組織特征映射神經網絡
自組織特征映射(Self-Organizing Feature Map,簡稱SOFM)神經網絡是芬蘭赫爾辛基大學神經網絡專家T. Kohonen教授于1982年提出來的。SOFM網絡模仿了動物和人大腦皮層中具有自組織信息處理的特征,是一種無監督的學習方式,它可以根據樣本自身的規律,自動提取樣本內在的重要統計特征[4][5]。
3.1 自組織特征映射網絡模型
自組織特征映射網絡模型如圖2所示,網絡由輸入層和輸出層(競爭層)組成,輸入層接受信號輸入,輸出層是二維網格,自組織映射網絡信號的輸出,二維平面中每個節點都和輸入層的源節點相連,輸出層各神經元在學習中進行競爭選擇,獲勝神經元不但加強自身,而且帶動周圍的鄰近神經元相應得到加強,同時抑制周圍較遠的神經元,神經元依次建立輸入—輸出之間的拓撲映射關系,輸出神經元之間的聯系是由它們在網格上相互位置確定的,其聯系正是模擬了人腦神經元之間的側抑制功能。自組織映射神經網絡可以將任意維數的輸入信號模式轉變為一維或者二維的離散映射,并且以拓撲有序的方式自適應實現這個變化,從功能上講,它能將單個神經元變化規則和一層神經元的群體變化規則聯系在一起,網絡經過學習后,輸出層神經元之間的連接權向量的空間分布能夠正確反映輸入模式空間的分布情
況[3]。
自組織映射神經網絡通過學習訓練后,如果訓練充分且達到收斂,則自組織映射網絡將具有如下功能:
a)自組織映射通過尋找最優參考向量集合對輸入模式進行聚類。
b)拓撲排序。自組織映射算法得到的映射是拓撲有序的,輸出層上神經元位置對應于模式的特征和特定區域。
c)密度匹配。映射反映了輸入分布的統計變化。在輸入空間中那些以高概率產生樣本的區域在輸出空間中被映射到較大的區域。
d)特征選擇。對于非線性分布輸入空間的數據,自組織映射可以選擇最好的特征會計集合來近似潛在的概率分布。所以自組織映射神經網絡具有提取非線性數據內在特征的功能。
e)降維與可視化功能。

圖2 SOFM網絡模型