基于信息熵的CT圖像目標自動提取實驗研究以恐龍蛋殼化石切片CT圖像為例
CT(Computed Tomography)技術應用范圍十分廣泛,主要應用于醫(yī)學診斷領域,其次應用于工業(yè)無損檢測、工程檢測、安全檢查以及探測地球內部結構等方面[
在醫(yī)學領域,翟偉明等[
由于在處理大量恐龍蛋殼化石CT圖像方面可借鑒的經(jīng)驗過于稀少,而手動分割導致分離工作難度較大、效率較低,為了達到自動分離恐龍蛋殼化石CT圖像目標與背景的目的,本文提出了一種基于信息熵的CT圖像目標與背景自動分離提取方法。實驗結果表明,使用該方法取得了理想的分離效果,目標提取有效率高達98.89%,并且處理時間也大幅縮短,提高了古生物恐龍蛋殼化石CT圖像處理效率。該方法能精確地提取出恐龍蛋殼氣孔與邊界,為后續(xù)重建恐龍蛋三維立體結構提供了可靠的基礎,也為其他目標為方解石的古生物CT圖像自動分離提取提供了新的技術解決方案。
2 數(shù)據(jù)與方法
2.1 圖像數(shù)據(jù)集
本文選取廣東河源晚白堊世地層發(fā)現(xiàn)的一類蜂窩蛋類(恐龍蛋的一種類型)進行了蛋殼結構的計算機斷層掃描,采用的設備為GEphoenix vtomex m 180 kV/300 kV,測試電壓為70 kV,測試電流為130 μA,得到了3 329張16位的恐龍蛋殼原始切片CT圖像樣品數(shù)據(jù),空間分辨率為3.896 μm/像素,圖像保存為tif格式。由于樣品數(shù)據(jù)頭部和尾部CT圖像的目標區(qū)域太小(目標區(qū)域像元比率小于3%),為提高處理速度,僅選取切片樣號483~2 599作為樣本數(shù)據(jù)集。
圖1 原始圖像示例。(a)切片704;(b)切片1 668;(c)切片2 595。
Fig.1 Raw images.(a) Slice 704;(b) Slice 1 668;(c) Slice 2 595.
2.2 信息熵
信息熵(Imformation Entropy)最早是由Shannon借鑒熱力學中熵的概念在1948年提出的,它描述了信息來源的不確定性,本質上是對不確定信息的數(shù)學化度量,其大小描述了信息的有序程度及包含的信息量。將信息熵引入到圖像中可以度量圖像信息量,評判圖像信息有序與豐富程度[
假設一張CT圖像的灰度級分布范圍為[0,n],t∈[0,n],t代表灰度級,p(t)代表概率;各灰度級像素出現(xiàn)的概率為p0,p1…pn,各灰度級像素具有的信息量則分別為-log2p0,-log2p1,…,-log2pn。其中H(t)值越高,圖像所含信息量越大,圖像灰度變化的不確定性程度越大,圖像也就越混亂[
(1) |
2.3 信息熵參數(shù)提取
由于CT圖像是16位的,所以需要將其轉換為8位,以便進行后續(xù)圖像處理。首先從訓練數(shù)據(jù)集里的前、中、后三段中隨機選取3張CT圖像切片,分別為切片編號704,1 668,2 595,通過 Adobe Photoshop軟件進行人工手動分離CT圖像目標與背景,獲得分離后的圖像(
圖2 手動分離后的圖像。(a)切片704;(b)切片1 668;(c)切片2 595。
Fig.2 Images after manual separation.(a) Slice 704;(b)Slice 1 668;(c)Slice 2 595.
樣號 | 分割閾值 | 信息熵 |
---|---|---|
704 | 152 | 0.65 |
1 668 | 90 | 0.54 |
2 595 | 140 | 0.43 |
2.4 分割算法步驟
本文主要針對CT圖像來分離目標與背景從而提取目標,通過信息熵的方法使分離得到的目標在完整性和邊緣細節(jié)保留方面都得到了較好的效果。具體分割算法步驟和流程如
圖3 目標智能提取技術流程示意圖
Fig.3 Schematic diagram of intelligent target extraction technology
步驟1:將轉換后的8位圖像進行信息熵計算,再訓練信息熵參數(shù)。
步驟2:統(tǒng)計灰度圖像的亮度直方圖。用lambda函數(shù)根據(jù)亮度值進行排序,輸出hisR1(根據(jù)像素亮度值從小到大排序)、hisR2(根據(jù)像素亮度值統(tǒng)計個數(shù)從大到小排序)兩個列表。
步驟3:把hisR2統(tǒng)計結果中像素亮度值統(tǒng)計個數(shù)最多時的亮度值作為分割閾值,根據(jù)該閾值分離原始灰度圖像的目標與背景,輸出分割閾值。
步驟4:分割單個圖像目標與背景。創(chuàng)建一個大小與原圖像一樣的空白圖像矩陣,根據(jù)輸入的閾值對原圖像進行分離,若像素亮度值大于閾值,則認為是圖像的目標,則將該像素對應的位置輸出到新圖像并將亮度值賦值為255,遍歷原灰度圖像的所有像素值,輸出新圖像。
步驟5:計算分離后圖像的信息熵值。將信息熵0.54這個樣本參數(shù)值作為處理訓練數(shù)據(jù)集中第一張CT圖像的輸入值,得到一個新的信息熵值,然后將新信息熵值作為下一個圖像運算的參考值,由此循環(huán)運算直到最后一張圖像運行結束。
步驟6:設置信息熵誤差范圍為20%,判斷誤差是否不大于20%,若是說明分離的結果是可靠的,則結束分離并輸出當前信息熵;若不是則回到步驟5,直到誤差在20%以下。
步驟7:對訓練數(shù)據(jù)集里所有圖像遍歷進行自動分割,最后輸出分割后的圖像文件以及表格文件。
3 實驗結果與分析
本文實驗環(huán)境為Windows10系統(tǒng)下安裝的PyCharm開發(fā)環(huán)境,通過Python編程語言實現(xiàn)自動分離實驗,分割對象為數(shù)量較多的恐龍蛋殼化石切片CT圖像。上述算法運行后最終的結果包括兩部分:分割后的圖像和輸出的表格。其中圖像內容可以明顯提取出目標和邊緣,而表格內容包括CT圖像的樣號、分割閾值以及信息熵值。
3.1 分離效果定量分析
本研究為了符合恐龍蛋殼化石CT圖像數(shù)據(jù)的特點,將樣本數(shù)據(jù)集樣號483~2 599的切片CT圖像作為測試集。鑒于信息熵已用于CT圖像目標與背景的自動分離與提取中,本文也給出了該方法對恐龍蛋殼化石切片CT圖像的自動分離結果,包括訓練集和測試集中2 117張切片CT圖像的分割閾值和信息熵。由于通過以上方法獲得的從483~2 599的每個樣號都有一個分割閾值和信息熵值,導致數(shù)據(jù)量很大。通過觀察輸出的結果表格,發(fā)現(xiàn)信息熵的范圍和分割閾值的范圍都并不寬泛,因此將其分拆成兩個部分,即信息熵結果的頻次統(tǒng)計(
信息熵 | 頻次 | 信息熵 | 頻次 | 信息熵 | 頻次 |
---|---|---|---|---|---|
0.43 | 3 | 0.51 | 26 | 0.59 | 217 |
0.44 | 14 | 0.52 | 54 | 0.6 | 236 |
0.45 | 29 | 0.53 | 45 | 0.61 | 223 |
0.46 | 20 | 0.54 | 99 | 0.62 | 186 |
0.47 | 26 | 0.55 | 129 | 0.63 | 124 |
0.48 | 18 | 0.56 | 156 | 0.64 | 76 |
0.49 | 17 | 0.57 | 176 | 0.65 | 15 |
0.5 | 26 | 0.58 | 202 | 總計 | 2 117 |
分割閾值 | 頻次 | 分割閾值 | 頻次 | 分割閾值 | 頻次 | 分割閾值 | 頻次 |
---|---|---|---|---|---|---|---|
66 | 2 | 94 | 48 | 121 | 15 | 148 | 31 |
67 | 2 | 95 | 77 | 122 | 16 | 149 | 32 |
68 | 1 | 96 | 85 | 123 | 13 | 150 | 20 |
70 | 2 | 97 | 98 | 124 | 16 | 151 | 17 |
71 | 6 | 98 | 73 | 125 | 8 | 152 | 11 |
72 | 3 | 99 | 88 | 126 | 13 | 153 | 15 |
73 | 1 | 100 | 59 | 127 | 20 | 154 | 11 |
74 | 4 | 101 | 44 | 128 | 19 | 155 | 16 |
75 | 2 | 102 | 57 | 129 | 12 | 156 | 10 |
76 | 5 | 103 | 56 | 130 | 17 | 157 | 11 |
77 | 9 | 104 | 41 | 131 | 5 | 158 | 13 |
78 | 3 | 105 | 25 | 132 | 23 | 159 | 10 |
79 | 3 | 106 | 26 | 133 | 15 | 160 | 12 |
80 | 4 | 107 | 43 | 134 | 11 | 161 | 14 |
81 | 6 | 108 | 32 | 135 | 16 | 162 | 10 |
82 | 1 | 109 | 19 | 136 | 10 | 163 | 5 |
83 | 6 | 110 | 29 | 137 | 10 | 164 | 4 |
84 | 5 | 111 | 16 | 138 | 25 | 165 | 5 |
85 | 10 | 112 | 23 | 139 | 25 | 166 | 3 |
86 | 8 | 113 | 17 | 140 | 30 | 169 | 3 |
87 | 12 | 114 | 20 | 141 | 28 | 170 | 1 |
88 | 16 | 115 | 23 | 142 | 26 | 174 | 2 |
89 | 14 | 116 | 18 | 143 | 26 | 175 | 2 |
90 | 17 | 117 | 22 | 144 | 40 | 178 | 1 |
91 | 20 | 118 | 21 | 145 | 36 | 186 | 2 |
92 | 29 | 119 | 13 | 146 | 31 | 188 | 1 |
93 | 36 | 120 | 15 | 147 | 34 | 總計 | 2 117 |
根據(jù)
圖4 信息熵統(tǒng)計直方圖
Fig.4 Information entropy statistical histogram
圖5 分割閾值統(tǒng)計直方圖
Fig.5 Segmentation threshold statistical histogram
3.2 分離效果定性分析
由于進行自動分離的CT圖像數(shù)量較多,因此本文僅從樣本數(shù)據(jù)集原始圖像與自動分離后圖像的前、中、后3段各自隨機選取3張進行分離效果分析。前段選取的是切片520,668,770;中段選取的是切片1 526,1 655,1 731;后段選取的是切片2 322,2 481,2 576。圖
圖6 前段原始圖像與分離后圖像。(a)、(b)、(c)原圖像;(d)、(e)、(f)分離后圖像。
Fig.6 The first segment of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f)Separated image.
圖7 中段原始圖像與分離后圖像。(a)、(b)、(c)原圖像;(d)、(e)、(f)分離后圖像。
Fig.7 The middle part of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f) Separated image.
圖8 后段原始圖像與分離后圖像。(a)、(b)、(c)原圖像;(d)、(e)、(f)分離后圖像。
Fig.8 The last part of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f) Separated image.
原始圖像僅以肉眼無法對目標進行有效提取,且存在很大的主觀性,導致誤差過大;而且從原始圖像中并不能清晰辨認目標邊緣輪廓,也不能分辨哪些是氣孔哪些是目標,這對我們的目標分離提取工作帶來了很大的困難(圖
根據(jù)信息熵理論可知,圖像所含內容越多就越混亂,信息熵值就越高。由
位置 | 樣號 | 分割閾值 | 信息熵 | 信息熵均值 |
---|---|---|---|---|
前段 | 520 | 141 | 0.56 | 0.59 |
668 | 147 | 0.61 | ||
770 | 101 | 0.60 | ||
中段 | 1 526 | 104 | 0.60 | 0.60 |
1 655 | 95 | 0.59 | ||
1 731 | 125 | 0.60 | ||
后段 | 2 322 | 108 | 0.53 | 0.51 |
2 481 | 140 | 0.53 | ||
2 576 | 144 | 0.47 |
4 討論
關于CT圖像分割處理的研究多集中在醫(yī)學領域上,如研究內臟器官和其他病變位置[
與目前廣泛使用的醫(yī)學CT圖像分割方法相比,在恐龍蛋殼化石的CT圖像研究上可借鑒的對象和參考的實例較少。由于恐龍蛋殼化石不同于人體組織或者動物組織,其成分屬于不同的物質類型,兩者的CT圖像信號特征差異較大,因此不能完全照搬前人在醫(yī)學領域的CT圖像分割方法,并且醫(yī)學圖像中物體或結構的分割通常比其他類型的圖像更為復雜。所以針對恐龍蛋殼化石CT圖像,需要選擇一種針對性強且運算效率更高的方法。本實驗采用信息熵作為提取目標的一個參數(shù),在信息熵誤差范圍設置為20%的情況下,經(jīng)過多次嘗試,分割閾值與信息熵的選定使分離效果明顯,達到了大量CT圖像的目標與背景自動分離的研究目標。實驗證明本文方法是十分有效的,該方法不僅能清晰分離出目標,而且實現(xiàn)了自動化處理,大幅提高了操作效率,同時提供了類似CT圖像處理情況中使用該信息熵范圍直接作為處理的參數(shù)。
由于在評價不同方法時使用的數(shù)據(jù)集以及處理的對象復雜程度不同,直接比較不同的方法是困難的,不能簡單地認為哪一個更好。但值得注意的是,本研究方法可以處理大量CT圖像樣本數(shù)據(jù)并且效果都不錯,不需要過多的人機交互,真正實現(xiàn)了自動化、智能化??傊狙芯康闹饕暙I是提出了一種CT圖像在新領域的處理方法。該方法可用于研究類似恐龍蛋殼化石一樣由方解石構成的其他物體CT圖像的分類處理,以該信息熵范圍參數(shù)來進行自動分離并提取目標,為快速重構物體三維空間結構奠定了數(shù)據(jù)基礎。
5 結論
針對大量恐龍蛋殼化石CT圖像手動分割步驟繁瑣、分割精度不高、處理時間長、誤差較大等問題,在閾值分割的基礎上,提出了一種基于信息熵的自動分離CT圖像方法。利用手動分割CT圖像獲取到的信息熵值作為自動分離圖像的參數(shù),通過閾值分割和信息熵的方法進行大量圖像目標與背景的自動分離研究,并進行了廣泛的測試與實驗,其中所獲分割閾值范圍為66~188,信息熵值范圍為0.43~0.65。實驗結果表明,所設計的方法在CT圖像數(shù)量較多時,在自動分離圖像目標與背景上可取得很好的效果,其有效分離率高達98.89%,并且該方法能在正確提取目標的同時還能保留完整目標與邊緣細節(jié),還可以對恐龍蛋殼中保存的氣孔與蛋殼邊界進行有效且精確地提取,提高了操作效率。但是,本研究僅探討了如何處理大量恐龍蛋殼CT圖像的方法,對于恐龍蛋殼本身以及如何重建恐龍蛋的三維立體結構的研究仍有不足,這是作者需要進一步研究的方向。
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 官方認定!CSSCI南大核心首批191家“青年學者友好期刊名單”
- 2023JCR影響因子正式公布!
- 國內核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學者
- 我用了一個很復雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- 重磅!CSSCI來源期刊(2023-2024版)最新期刊目錄看點分析!全網(wǎng)首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應該熟知的10個知識點。
- 注意,最新期刊論文格式標準已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學術論文編寫規(guī)則
- 盤點那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了