北京航空航天大學 計算機學院 北京市 100191
摘要:本文介紹了一種基于梯度能量角共生矩陣的圖像分類方法。此方法利用梯度角共生矩陣從圖像表現中提取的參數,結合人臉檢測算法構建的決策樹,能快速地將圖像分類為建筑、風景、人物三類。實驗結果表明,該方法具有了較高的分類正確率本文介紹了一種基于梯度能量角共生矩陣的圖像分類方法。此方法利用梯度角共生矩陣從圖像表現中提取的參數,結合人臉檢測算法構建的決策樹,能快速地將圖像分類為建筑、風景、人物三類。實驗結果表明,該方法具有了較高的分類正確率。
關鍵詞:圖像分類;梯度能量角共生矩陣;決策樹
A Decision Tree Based Image Classification Method Using Gradient Magnitude based Angle Cooccurrence Matrix
ZHANG-Yue
School of Computer Science and Engineering, Beihang University,
Beijing, China, 100191
Abstract:In this paper, we introduced an image classification method based on Gradient Magnitude based Angular Co-occurrence Matrix (GMACM). This algorithm used the parameters abstracted from the GMACM, combined with the face recognition technology, to construct a simple decision tree. The decision tree can classify three classes of images: building, landscape and person. The experiment results also show that this algorithm can obtain high accuracy in classification.
Key words:Image Classification, Gradient Magnitude based Angular Cooccurrence Matrix, Decision Tree
1 引言
紋理特征用于刻畫物體表面的粗糙程度,描述具有某種有規律出現的圖像模式,是圖像特征中比較能反映圖像內容的重要特征。通過十幾年的研究,研究者在紋理特征分析方面取得了很大進步,產生了許多用于分析圖像紋理的研究方法,如小波變換、灰度共生矩陣(GLCM)[1]、馬爾可夫隨機場(MRF)模型[2]、同步自回歸模型(SAR)[3]、Gabor濾波[4][5]等。在眾多研究方法之中,灰度共生矩陣是一種應用比較廣泛的紋理分析方法,它利用相鄰像素的灰度進行統計,得到圖像在亮度空間上的紋理特征。這種方法比較簡單,計算復雜度也比較低,但是受光照影響比較明顯。
利用共生矩陣的思想,文獻[6]提出了基于梯度能量角共生矩陣的模型(GMACM),該模型將梯度能量作為考慮因素,通過定義三種彩色圖像的梯度來解決灰度共生矩陣不能處理彩色圖像的問題,并且利用彩色圖像的梯度來降低圖像亮度變化對紋理特征影響,從而改進了灰度共生矩陣的缺點。在分類過程中,文獻[6]將整個共生矩陣作為一個向量,使用svm進行分類,向量維度較高。針對此問題,本文根據GMACM的圖像表現提取出6個參數,并以人臉檢測算法作為輔助建立了一個簡單的決策樹,以此對圖像進行分類,極大減少了向量維度。
2 梯度能量角的共生矩陣(GMACM)
2.1 GMACM的定義
在共生矩陣的思想的基礎上,文獻[6]提出了梯度能量角共生矩陣(GMACM)。
設G(x, y) = (M, θ) 是原始圖像的梯度圖,其大小為w*h,則GMACM的定義如下:
其中紅色部分表示歸一化后能量和最大,綠色次之,藍色最差,其中黑色表示歸一化后為0。
由圖1可以看出:對于建筑圖像,GMACM圖像的主對角線分布有零星的亮點;對于風景圖像,GMACM圖像的主對角線存在明亮的線條;對于人物圖像,GMACM圖像的主對角線為一條淺色的亮線。
文獻[6]中的實驗結果發現,三種梯度的GMACM中,基于歐式梯度的GMACM相對具有較好的分類效果以及提取速度,也成為了實際研究應用中首選的圖像特征。本文亦使用基于歐式梯度的GMACM來對圖像進行分類研究。
3 GMACM的圖像分類
3.1 GMACM參數的提取
傳統的GMACM的大小由用戶給定的角度決定,角度大小會決定矩陣信息量的大小,在文獻[6]的實驗過程中,角度值一般取180。此時矩陣的大小為180*180,將其使用svm進行分類時,向量維度較高。為了方便GMACM的研究,本文對GMACM進行了少數參數的提取。
由上節中介紹可知,三種圖像的GMACM特點非常鮮明,因此可以提取出如下參數。
3.1.1 圖像整體平均亮度
圖像整體亮度差距明顯,其中風景圖像最亮,人物圖像次之,而建筑圖像最差。設原始圖像的經過歸一化的GMACM圖像為w階方陣G,則圖像整體平均亮度avg_bright的定義如下:


對于圖像中的非直線紋理,相鄰點對的梯度并不完全相等,但應具有相近的梯度。GMACM主對角帶的寬度表現了圖像中紋理的雜亂程度,若在圖像中梯度相近但不相等的點對越多,則GMACM圖像的主對角線應較寬,反之較窄。因此主對角帶的寬度可以較好地作為一個參數進行圖片的分類判斷。
一幅GMACM圖像的主對角帶寬度的大小取決于閾值的設定。不同的閾值設定會對三種圖像此參數的差異產生影響。不失一般性,本文中針對對角帶寬度引入兩個閾值,一個閾值為50,即上述的mid_width_th;另一個閾值設為0,記為mid_width。
3.1.4 主對角線“占空比”
雖然圖片整體平均亮度和主對角線平均亮度兩個參數可以在一定程度上表現共生矩陣圖像的明暗程度,但這兩個參數的取值大小可能受到某些亮點的影響。
GMACM圖像的主對角線可以視為波,長度為180,幅值為256。因此,對圖像對角線可以波引入類似占空比的概念:主對角線上像素值小于某一閾值的像素個數占主對角線像素個數的比率。設原始圖像的經過歸一化的GMACM圖像為w階方陣G,則圖像主對角線占空比lper的定義如下:
圖3圖像分類決策樹示意圖
其中人臉檢測方法采用目前比較成熟的OpenCV提供的haar級聯分類方法。
3.2 GMACM分類結果
上節由GMACM圖像中提取出多個參數,本節通過對少量的圖像集進行參數的提取以及觀察研究,提出一種簡單的基于決策樹的分類方法。
使用上節中提出的決策樹方法對300幅圖像進行分類,三種圖像的分類情況如下表所示:
表1 300幅圖像的GMACM分類結果表
應分類 |
實際分類 |
建筑 |
風景 |
人物 |
正確率 |
建筑 |
81 |
0 |
19 |
0.81 |
風景 |
6 |
90 |
4 |
0.90 |
人物 |
12 |
6 |
82 |
0.82 |
由上表可以看到,此種簡單的分類方法使三種圖像的分類正確率均大于80%,其中風景圖像分類正確率達到90%,分類效果很好。此部分數據說明本文提出的決策樹分類方法具有可研究性,需要擴大樣本空間進行進一步研究。
新選取建筑、風景、人物圖像各500幅,共1500幅圖像作為測試圖像。每幅圖像寬高分辨率均大于256像素,且總像素值大于90000,使用上節中提出的決策樹方法進行分類,分類結果如下:
表2 1500幅圖像的GMACM分類結果表
應分類 |
實際分類 |
建筑 |
風景 |
人物 |
正確率 |
建筑 |
380 |
5 |
115 |
0.76 |
風景 |
100 |
332 |
128 |
0.664 |
人物 |
99 |
27 |
374 |
0.748 |
由上表中可以看到,與之前的分類結果相比,對于這些圖像分類正確率均有所下降。三種圖像的分類正確率均大于65%,其中對于建筑和人物圖像均有較好的識別正確率均大于70%,效果較好,但對于風景圖像效果較差,僅有66.4%。
經過對樣本的分析發現,本文提出的分類方法對具有如下特點的風景圖像誤判率較高:主要由藍天、湖面等紋理信息較少的元素組成。此類圖像的紋理信息不是非常豐富,其中的大量的平滑部分會使梯度角對向某些角度集中,使得GMACM圖像變暗,丟失了風景圖像的GMACM圖像的特點,從而降低了圖像分類的正確率。
由于此種類型的風景圖像的GMACM圖像特點已經弱化,因此無法單純地從修改分類方法來提高分類的正確率,應該對GMACM的提取過程進行改進。
4 結論
GMACM圖像作為一種新型的圖像特征,對建筑、風景、人物三類圖像均有較好的表現特點。本文針對GMACM的表現特點提取出6個參數,并結合haar的級聯分類方法構造簡單的決策樹,對建筑、風景、人物圖像進行分類,降低了傳統分類方法的向量維度,取得了較好的效果。
對于藍天、湖面等紋理信息較少的元素占主要部分的圖像,本文基于的決策樹的分類方法不能得到很好的分類效果。此部分改進需要對GMACM圖像的定義進行改進,使此類的風景圖像的GMACM圖像特點更加鮮明。
此外,本文提到的圖像分類算法并沒有將圖像的分辨率納入考量,對于不同分辨率圖像的分類效果沒有進一步研究,此部分工作也為下一步工作的重點。
參考文獻 (References)
[6] Rui Zhang, Baolin Yin and Qiyang Zhao, An Efficient Color Image Classification Method Using Gradient Magnitude Based Angle Cooccurrence Matrix, Proceedings of International Conference on Image Processing 2010, pp.1073-1076, Sep 2010.
作者簡介:
張悅,北京人,在讀碩士研究生。目前就讀于北京航空航天大學計算機學院,在軟件開發國家重點實驗室學習。