優(yōu)勝從選擇開始,我們是您最好的選擇!—— 中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測 我要投稿 合法期刊查詢

基于信息熵的CT圖像目標自動提取實驗研究以恐龍蛋殼化石切片CT圖像為例

作者:陳春玉 黃映聰 王強 黎廣榮 何月順來源:《液晶與顯示》日期:2022-09-14人氣:642

CT(Computed Tomography)技術應用范圍十分廣泛,主要應用于醫(yī)學診斷領域,其次應用于工業(yè)無損檢測、工程檢測、安全檢查以及探測地球內部結構等方面1。近年來,隨著圖像技術的發(fā)展以及各種功能軟件的開發(fā),其應用范圍還在不斷拓寬。傳統(tǒng)的圖像分割方法依賴于人工處理,需要花費大量時間和精力。由于圖像的多變性和各種突發(fā)情況的發(fā)生(設備、人工、環(huán)境等),從圖像中自動分離目標與背景非常具有挑戰(zhàn)性,因此這一難題引起國內外學者的廣泛研究。目前圖像分割方法包括基于閾值分割2-3、基于像素值分割4以及基于神經(jīng)網(wǎng)絡分割5-6的方法等。

在醫(yī)學領域,翟偉明等7提出了一個動態(tài)自適應的體素生長的算法,對肺部CT圖像進行三維分割,解決了肺部分割時左右肺難以區(qū)分的問題;宋紅等8提出一種基于動態(tài)自適應區(qū)域生長的算法進行腫瘤分割,成功提取出人體肝臟CT圖像中的腫瘤區(qū)域;張麗娟等9也提出區(qū)域生長與全卷積神經(jīng)網(wǎng)絡相結合的方法對肝臟CT圖像進行交互式分割。近年來,一些學者也開始對CT圖像的自動分割方法進行一些探索。Reboucas等10提出了專門用于分割復雜物體的三維自適應清晰主動輪廓法,它是一種在胸部CT掃描中自動分割肺部的新技術。Men等11基于深度反卷積神經(jīng)網(wǎng)絡算法對鼻咽癌CT圖像進行目標自動分割,但需要仔細的人工審查和大量的編輯;Athertya等12提出了一種基于模糊特征點的輪廓自動初始化方法,該方法在脊柱CT圖像醫(yī)學圖像分割中有較大的適用性,在模擬高斯噪聲的情況下具有良好的魯棒性;Vania等13將卷積神經(jīng)網(wǎng)絡和全卷積網(wǎng)絡結合,利用類冗余作為軟約束從CT圖像中分割脊柱,顯著提高了分割結果的準確性和系統(tǒng)處理時間。而在古生物恐龍蛋殼化石的顯微結構研究領域,CT圖像智能處理技術尚處在探索階段。古生物學家處理的數(shù)據(jù)量隨著各種技術的進步也在迅速增加,但海量古生物方面的數(shù)據(jù)依然需要依賴人進行手動處理,并且雖然在古生物學的研究中使用了眾多數(shù)字化手段,如CT掃描等,但如何在這些數(shù)據(jù)中找到所需要的信息依然是一項充滿挑戰(zhàn)的工作14。

由于在處理大量恐龍蛋殼化石CT圖像方面可借鑒的經(jīng)驗過于稀少,而手動分割導致分離工作難度較大、效率較低,為了達到自動分離恐龍蛋殼化石CT圖像目標與背景的目的,本文提出了一種基于信息熵的CT圖像目標與背景自動分離提取方法。實驗結果表明,使用該方法取得了理想的分離效果,目標提取有效率高達98.89%,并且處理時間也大幅縮短,提高了古生物恐龍蛋殼化石CT圖像處理效率。該方法能精確地提取出恐龍蛋殼氣孔與邊界,為后續(xù)重建恐龍蛋三維立體結構提供了可靠的基礎,也為其他目標為方解石的古生物CT圖像自動分離提取提供了新的技術解決方案。

2 數(shù)據(jù)與方法

2.1 圖像數(shù)據(jù)集

本文選取廣東河源晚白堊世地層發(fā)現(xiàn)的一類蜂窩蛋類(恐龍蛋的一種類型)進行了蛋殼結構的計算機斷層掃描,采用的設備為GEphoenix vtomex m 180 kV/300 kV,測試電壓為70 kV,測試電流為130 μA,得到了3 329張16位的恐龍蛋殼原始切片CT圖像樣品數(shù)據(jù),空間分辨率為3.896 μm/像素,圖像保存為tif格式。由于樣品數(shù)據(jù)頭部和尾部CT圖像的目標區(qū)域太小(目標區(qū)域像元比率小于3%),為提高處理速度,僅選取切片樣號483~2 599作為樣本數(shù)據(jù)集。圖1展示了樣本數(shù)據(jù)集里隨機選取的前、中、后3段的原始圖像,分別為切片樣號704,1 668,2 595,每個切片目標范圍大小不一,其中亮度值高且呈現(xiàn)較明亮的區(qū)域為目標區(qū)域,其余為背景區(qū)域。

圖1  原始圖像示例。(a)切片704;(b)切片1 668;(c)切片2 595。

Fig.1  Raw images.(a) Slice 704;(b) Slice 1 668;(c) Slice 2 595.


2.2 信息熵

信息熵(Imformation Entropy)最早是由Shannon借鑒熱力學中熵的概念在1948年提出的,它描述了信息來源的不確定性,本質上是對不確定信息的數(shù)學化度量,其大小描述了信息的有序程度及包含的信息量。將信息熵引入到圖像中可以度量圖像信息量,評判圖像信息有序與豐富程度15-16。CT圖像由大量不同灰度級的像素構成,在CT圖像處理過程中,熵一般度量圖像像素亮度值的均勻程度,CT圖像的信息熵清晰地反映了其信息量的多少,它與圖像灰度變化的不確定性程度密切相關15

假設一張CT圖像的灰度級分布范圍為[0,n],t∈[0,n],t代表灰度級,pt)代表概率;各灰度級像素出現(xiàn)的概率為p0p1pn,各灰度級像素具有的信息量則分別為-log2p0,-log2p1,…,-log2pn。其中Ht)值越高,圖像所含信息量越大,圖像灰度變化的不確定性程度越大,圖像也就越混亂16-18。圖像的信息熵計算公式如式(1)所示:



(1)

2.3 信息熵參數(shù)提取

由于CT圖像是16位的,所以需要將其轉換為8位,以便進行后續(xù)圖像處理。首先從訓練數(shù)據(jù)集里的前、中、后三段中隨機選取3張CT圖像切片,分別為切片編號704,1 668,2 595,通過 Adobe Photoshop軟件進行人工手動分離CT圖像目標與背景,獲得分離后的圖像(圖2);然后計算所選分離后圖像各自的信息熵,分別是0.65,0.54,0.43(表1)。從圖2可以看到,圖2(b)所含信息量相較而言更大,更具代表性,因此最后選取中間圖像切片(樣號1 668)的信息熵0.54作為本文方法的信息熵參數(shù)初始經(jīng)驗值。最后計算切片樣號704和樣號2 595的信息熵值與樣號1 668的信息熵值0.54的誤差都為20%,因此,后續(xù)進行CT圖像的自動分離時,設置信息熵的誤差范圍為20%。

圖2  手動分離后的圖像。(a)切片704;(b)切片1 668;(c)切片2 595。

Fig.2  Images after manual separation.(a) Slice 704;(b)Slice 1 668;(c)Slice 2 595.


表1  信息熵參數(shù)訓練結果
Tab.1  Training results of information entropy parameters
樣號分割閾值信息熵
7041520.65
1 668900.54
2 5951400.43

2.4 分割算法步驟

本文主要針對CT圖像來分離目標與背景從而提取目標,通過信息熵的方法使分離得到的目標在完整性和邊緣細節(jié)保留方面都得到了較好的效果。具體分割算法步驟和流程如圖3所示。

圖3  目標智能提取技術流程示意圖

Fig.3  Schematic diagram of intelligent target extraction technology


步驟1:將轉換后的8位圖像進行信息熵計算,再訓練信息熵參數(shù)。

步驟2:統(tǒng)計灰度圖像的亮度直方圖。用lambda函數(shù)根據(jù)亮度值進行排序,輸出hisR1(根據(jù)像素亮度值從小到大排序)、hisR2(根據(jù)像素亮度值統(tǒng)計個數(shù)從大到小排序)兩個列表。

步驟3:把hisR2統(tǒng)計結果中像素亮度值統(tǒng)計個數(shù)最多時的亮度值作為分割閾值,根據(jù)該閾值分離原始灰度圖像的目標與背景,輸出分割閾值。

步驟4:分割單個圖像目標與背景。創(chuàng)建一個大小與原圖像一樣的空白圖像矩陣,根據(jù)輸入的閾值對原圖像進行分離,若像素亮度值大于閾值,則認為是圖像的目標,則將該像素對應的位置輸出到新圖像并將亮度值賦值為255,遍歷原灰度圖像的所有像素值,輸出新圖像。

步驟5:計算分離后圖像的信息熵值。將信息熵0.54這個樣本參數(shù)值作為處理訓練數(shù)據(jù)集中第一張CT圖像的輸入值,得到一個新的信息熵值,然后將新信息熵值作為下一個圖像運算的參考值,由此循環(huán)運算直到最后一張圖像運行結束。

步驟6:設置信息熵誤差范圍為20%,判斷誤差是否不大于20%,若是說明分離的結果是可靠的,則結束分離并輸出當前信息熵;若不是則回到步驟5,直到誤差在20%以下。

步驟7:對訓練數(shù)據(jù)集里所有圖像遍歷進行自動分割,最后輸出分割后的圖像文件以及表格文件。

3 實驗結果與分析

本文實驗環(huán)境為Windows10系統(tǒng)下安裝的PyCharm開發(fā)環(huán)境,通過Python編程語言實現(xiàn)自動分離實驗,分割對象為數(shù)量較多的恐龍蛋殼化石切片CT圖像。上述算法運行后最終的結果包括兩部分:分割后的圖像和輸出的表格。其中圖像內容可以明顯提取出目標和邊緣,而表格內容包括CT圖像的樣號、分割閾值以及信息熵值。

3.1 分離效果定量分析

本研究為了符合恐龍蛋殼化石CT圖像數(shù)據(jù)的特點,將樣本數(shù)據(jù)集樣號483~2 599的切片CT圖像作為測試集。鑒于信息熵已用于CT圖像目標與背景的自動分離與提取中,本文也給出了該方法對恐龍蛋殼化石切片CT圖像的自動分離結果,包括訓練集和測試集中2 117張切片CT圖像的分割閾值和信息熵。由于通過以上方法獲得的從483~2 599的每個樣號都有一個分割閾值和信息熵值,導致數(shù)據(jù)量很大。通過觀察輸出的結果表格,發(fā)現(xiàn)信息熵的范圍和分割閾值的范圍都并不寬泛,因此將其分拆成兩個部分,即信息熵結果的頻次統(tǒng)計(表2)和分割閾值的頻次統(tǒng)計(表3)。從表2表3中發(fā)現(xiàn),樣本數(shù)據(jù)集中CT圖像的信息熵值范圍在0.43~0.65之間,最大信息熵值為0.6,出現(xiàn)頻次有236次;分割閾值范圍是66~188,最大分割閾值為97,出現(xiàn)頻次有98次。其中分割閾值范圍即為CT圖像目標的亮度值范圍,由于恐龍蛋殼是由方解石構成的,故所提取的目標即為方解石。

表2  信息熵結果頻次分布
Tab.2  Frequency distribution of information entropy results
信息熵頻次信息熵頻次信息熵頻次
0.4330.51260.59217
0.44140.52540.6236
0.45290.53450.61223
0.46200.54990.62186
0.47260.551290.63124
0.48180.561560.6476
0.49170.571760.6515
0.5260.58202總計2 117

表3  分割閾值結果頻次分布
Tab.3  Frequency distribution of segmentation threshold results
分割閾值頻次分割閾值頻次分割閾值頻次分割閾值頻次
66294481211514831
67295771221614932
68196851231315020
70297981241615117
7169873125815211
72399881261315315
731100591272015411
744101441281915516
752102571291215610
765103561301715711
77910441131515813
783105251322315910
793106261331516012
804107431341116114
816108321351616210
82110919136101635
83611029137101644
84511116138251655
851011223139251663
86811317140301693
871211420141281701
881611523142261742
891411618143261752
901711722144401781
912011821145361862
922911913146311881
93361201514734總計2 117

根據(jù)表2、表3進行的信息熵與分割閾值統(tǒng)計,獲得圖4圖5兩個直方圖。如圖4所示,樣本數(shù)據(jù)集CT圖像的信息熵分布范圍在0.43~0.65之間,只有一個峰,其中信息熵峰值為0.6;同時信息熵在0.43~0.51之間分布比較均勻但很少且起伏不大,而其他主要集中分布在0.51~0.65之間且大致呈正態(tài)分布,說明樣本數(shù)據(jù)集分割后CT圖像的信息熵主要集中在0.6左右。而在圖5中,CT圖像分割閾值范圍在66~188之間,且有兩個峰,一個是94~104,另一個是138~150,但主要集中在前一個峰,其中分割閾值最高峰值為97,說明樣本數(shù)據(jù)集中CT圖像的分割閾值大部分都集中在97左右。

圖4  信息熵統(tǒng)計直方圖

Fig.4  Information entropy statistical histogram


圖5  分割閾值統(tǒng)計直方圖

Fig.5  Segmentation threshold statistical histogram


3.2 分離效果定性分析

由于進行自動分離的CT圖像數(shù)量較多,因此本文僅從樣本數(shù)據(jù)集原始圖像與自動分離后圖像的前、中、后3段各自隨機選取3張進行分離效果分析。前段選取的是切片520,668,770;中段選取的是切片1 526,1 655,1 731;后段選取的是切片2 322,2 481,2 576。圖6、78給出了CT圖像樣本數(shù)據(jù)集中前、中、后段選取切片各自的原始圖像及自動分離圖像。圖中左邊列(a)、(b)、(c)為原始圖像,右邊列(d)、(e)、(f)為自動分離目標與背景后提取的目標圖像,即去除了背景后的參考標準圖像。

圖6  前段原始圖像與分離后圖像。(a)、(b)、(c)原圖像;(d)、(e)、(f)分離后圖像。

Fig.6  The first segment of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f)Separated image.


圖7  中段原始圖像與分離后圖像。(a)、(b)、(c)原圖像;(d)、(e)、(f)分離后圖像。

Fig.7  The middle part of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f) Separated image.


圖8  后段原始圖像與分離后圖像。(a)、(b)、(c)原圖像;(d)、(e)、(f)分離后圖像。

Fig.8  The last part of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f) Separated image.


原始圖像僅以肉眼無法對目標進行有效提取,且存在很大的主觀性,導致誤差過大;而且從原始圖像中并不能清晰辨認目標邊緣輪廓,也不能分辨哪些是氣孔哪些是目標,這對我們的目標分離提取工作帶來了很大的困難(圖67、8的左邊列原始圖像)。從圖67、8的右邊列分離后的圖像可以看出,自動分離提取目標的結果與手動分離的結果(圖2)相差并不大。本文方法用于自動分離提取目標時獲得了較好的效果,在將目標從背景中正確提取出來的同時保留了完整的目標輪廓,邊緣也十分清晰,并且還可以從圖中分辨出氣孔,為構建恐龍蛋殼三維立體結構提供了基礎。

根據(jù)信息熵理論可知,圖像所含內容越多就越混亂,信息熵值就越高。由表2可知,樣本數(shù)據(jù)集分割后CT圖像的最大信息熵為0.60,而在表4中也可以看出,前、中、后3段信息熵均較高,但中段信息熵均值為0.60,是前、中、后3段圖像里最高的,這與最大信息熵值相同,這說明在樣本數(shù)據(jù)集中段位置的CT圖像相較其他位置的信息熵更高一些,其內容相對來說也更多。而從圖6、78也可看出,中段圖像相較于前、后兩段而言,它所含信息量更多。上述方法用于CT圖像的目標與背景自動分離和提取目標時均獲得了較好的效果,這證明了信息熵用于恐龍蛋殼化石切片CT圖像目標與背景分離提取是可行且有效的。

表4  不同位置分離后圖像結果
Tab.4  Image results after different positions separation
位置樣號分割閾值信息熵信息熵均值
前段5201410.560.59
6681470.61
7701010.60
中段1 5261040.600.60
1 655950.59
1 7311250.60
后段2 3221080.530.51
2 4811400.53
2 5761440.47

4 討論

關于CT圖像分割處理的研究多集中在醫(yī)學領域上,如研究內臟器官和其他病變位置7-810-11,以及研究脊柱12-13,19等,這些方法中有些方法相對而言更復雜并且不能處理大量的樣本。如宋紅等8提出的基于動態(tài)自適應區(qū)域生長分割腫瘤的算法,需要對圖像先預分割而獲得感興趣區(qū)域,然后再提取腫瘤區(qū)域。此外,Chu等19提出了一個基于學習的統(tǒng)一隨機森林回歸和分類方法,解決了從CT圖像中全自動定位和分割脊柱三維椎體的問題,該方法可以完全自動化,但也需要先用隨機森林回歸方法定義脊柱感興趣區(qū)域。兩者在進行提取目標之前都有先獲得感興趣區(qū)域這一步,而本研究并不需要如此,直接就可以通過信息熵與分割閾值進行自動分離并提取目標,方法更加簡便快速。

與目前廣泛使用的醫(yī)學CT圖像分割方法相比,在恐龍蛋殼化石的CT圖像研究上可借鑒的對象和參考的實例較少。由于恐龍蛋殼化石不同于人體組織或者動物組織,其成分屬于不同的物質類型,兩者的CT圖像信號特征差異較大,因此不能完全照搬前人在醫(yī)學領域的CT圖像分割方法,并且醫(yī)學圖像中物體或結構的分割通常比其他類型的圖像更為復雜。所以針對恐龍蛋殼化石CT圖像,需要選擇一種針對性強且運算效率更高的方法。本實驗采用信息熵作為提取目標的一個參數(shù),在信息熵誤差范圍設置為20%的情況下,經(jīng)過多次嘗試,分割閾值與信息熵的選定使分離效果明顯,達到了大量CT圖像的目標與背景自動分離的研究目標。實驗證明本文方法是十分有效的,該方法不僅能清晰分離出目標,而且實現(xiàn)了自動化處理,大幅提高了操作效率,同時提供了類似CT圖像處理情況中使用該信息熵范圍直接作為處理的參數(shù)。

由于在評價不同方法時使用的數(shù)據(jù)集以及處理的對象復雜程度不同,直接比較不同的方法是困難的,不能簡單地認為哪一個更好。但值得注意的是,本研究方法可以處理大量CT圖像樣本數(shù)據(jù)并且效果都不錯,不需要過多的人機交互,真正實現(xiàn)了自動化、智能化??傊狙芯康闹饕暙I是提出了一種CT圖像在新領域的處理方法。該方法可用于研究類似恐龍蛋殼化石一樣由方解石構成的其他物體CT圖像的分類處理,以該信息熵范圍參數(shù)來進行自動分離并提取目標,為快速重構物體三維空間結構奠定了數(shù)據(jù)基礎。

5 結論

針對大量恐龍蛋殼化石CT圖像手動分割步驟繁瑣、分割精度不高、處理時間長、誤差較大等問題,在閾值分割的基礎上,提出了一種基于信息熵的自動分離CT圖像方法。利用手動分割CT圖像獲取到的信息熵值作為自動分離圖像的參數(shù),通過閾值分割和信息熵的方法進行大量圖像目標與背景的自動分離研究,并進行了廣泛的測試與實驗,其中所獲分割閾值范圍為66~188,信息熵值范圍為0.43~0.65。實驗結果表明,所設計的方法在CT圖像數(shù)量較多時,在自動分離圖像目標與背景上可取得很好的效果,其有效分離率高達98.89%,并且該方法能在正確提取目標的同時還能保留完整目標與邊緣細節(jié),還可以對恐龍蛋殼中保存的氣孔與蛋殼邊界進行有效且精確地提取,提高了操作效率。但是,本研究僅探討了如何處理大量恐龍蛋殼CT圖像的方法,對于恐龍蛋殼本身以及如何重建恐龍蛋的三維立體結構的研究仍有不足,這是作者需要進一步研究的方向。


關鍵字:優(yōu)秀論文

網(wǎng)絡客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號中州期刊聯(lián)盟 ICP備案號:豫ICP備2020036848

【免責聲明】:中州期刊聯(lián)盟所提供的信息資源如有侵權、違規(guī),請及時告知。

版權所有:中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)

關注”中州期刊聯(lián)盟”公眾號
了解論文寫作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院單位發(fā)核心?

掃描關注公眾號

論文發(fā)表不再有疑惑

論文寫作全系列課程

掃碼了解更多

輕松寫核心期刊論文

在線留言