基于信息熵的CT圖像目標(biāo)自動(dòng)提取實(shí)驗(yàn)研究以恐龍蛋殼化石切片CT圖像為例
CT(Computed Tomography)技術(shù)應(yīng)用范圍十分廣泛,主要應(yīng)用于醫(yī)學(xué)診斷領(lǐng)域,其次應(yīng)用于工業(yè)無(wú)損檢測(cè)、工程檢測(cè)、安全檢查以及探測(cè)地球內(nèi)部結(jié)構(gòu)等方面[
在醫(yī)學(xué)領(lǐng)域,翟偉明等[
由于在處理大量恐龍蛋殼化石CT圖像方面可借鑒的經(jīng)驗(yàn)過(guò)于稀少,而手動(dòng)分割導(dǎo)致分離工作難度較大、效率較低,為了達(dá)到自動(dòng)分離恐龍蛋殼化石CT圖像目標(biāo)與背景的目的,本文提出了一種基于信息熵的CT圖像目標(biāo)與背景自動(dòng)分離提取方法。實(shí)驗(yàn)結(jié)果表明,使用該方法取得了理想的分離效果,目標(biāo)提取有效率高達(dá)98.89%,并且處理時(shí)間也大幅縮短,提高了古生物恐龍蛋殼化石CT圖像處理效率。該方法能精確地提取出恐龍蛋殼氣孔與邊界,為后續(xù)重建恐龍蛋三維立體結(jié)構(gòu)提供了可靠的基礎(chǔ),也為其他目標(biāo)為方解石的古生物CT圖像自動(dòng)分離提取提供了新的技術(shù)解決方案。
2 數(shù)據(jù)與方法
2.1 圖像數(shù)據(jù)集
本文選取廣東河源晚白堊世地層發(fā)現(xiàn)的一類蜂窩蛋類(恐龍蛋的一種類型)進(jìn)行了蛋殼結(jié)構(gòu)的計(jì)算機(jī)斷層掃描,采用的設(shè)備為GEphoenix vtomex m 180 kV/300 kV,測(cè)試電壓為70 kV,測(cè)試電流為130 μA,得到了3 329張16位的恐龍蛋殼原始切片CT圖像樣品數(shù)據(jù),空間分辨率為3.896 μm/像素,圖像保存為tif格式。由于樣品數(shù)據(jù)頭部和尾部CT圖像的目標(biāo)區(qū)域太?。繕?biāo)區(qū)域像元比率小于3%),為提高處理速度,僅選取切片樣號(hào)483~2 599作為樣本數(shù)據(jù)集。
圖1 原始圖像示例。(a)切片704;(b)切片1 668;(c)切片2 595。
Fig.1 Raw images.(a) Slice 704;(b) Slice 1 668;(c) Slice 2 595.
2.2 信息熵
信息熵(Imformation Entropy)最早是由Shannon借鑒熱力學(xué)中熵的概念在1948年提出的,它描述了信息來(lái)源的不確定性,本質(zhì)上是對(duì)不確定信息的數(shù)學(xué)化度量,其大小描述了信息的有序程度及包含的信息量。將信息熵引入到圖像中可以度量圖像信息量,評(píng)判圖像信息有序與豐富程度[
假設(shè)一張CT圖像的灰度級(jí)分布范圍為[0,n],t∈[0,n],t代表灰度級(jí),p(t)代表概率;各灰度級(jí)像素出現(xiàn)的概率為p0,p1…pn,各灰度級(jí)像素具有的信息量則分別為-log2p0,-log2p1,…,-log2pn。其中H(t)值越高,圖像所含信息量越大,圖像灰度變化的不確定性程度越大,圖像也就越混亂[
(1) |
2.3 信息熵參數(shù)提取
由于CT圖像是16位的,所以需要將其轉(zhuǎn)換為8位,以便進(jìn)行后續(xù)圖像處理。首先從訓(xùn)練數(shù)據(jù)集里的前、中、后三段中隨機(jī)選取3張CT圖像切片,分別為切片編號(hào)704,1 668,2 595,通過(guò) Adobe Photoshop軟件進(jìn)行人工手動(dòng)分離CT圖像目標(biāo)與背景,獲得分離后的圖像(
圖2 手動(dòng)分離后的圖像。(a)切片704;(b)切片1 668;(c)切片2 595。
Fig.2 Images after manual separation.(a) Slice 704;(b)Slice 1 668;(c)Slice 2 595.
樣號(hào) | 分割閾值 | 信息熵 |
---|---|---|
704 | 152 | 0.65 |
1 668 | 90 | 0.54 |
2 595 | 140 | 0.43 |
2.4 分割算法步驟
本文主要針對(duì)CT圖像來(lái)分離目標(biāo)與背景從而提取目標(biāo),通過(guò)信息熵的方法使分離得到的目標(biāo)在完整性和邊緣細(xì)節(jié)保留方面都得到了較好的效果。具體分割算法步驟和流程如
圖3 目標(biāo)智能提取技術(shù)流程示意圖
Fig.3 Schematic diagram of intelligent target extraction technology
步驟1:將轉(zhuǎn)換后的8位圖像進(jìn)行信息熵計(jì)算,再訓(xùn)練信息熵參數(shù)。
步驟2:統(tǒng)計(jì)灰度圖像的亮度直方圖。用lambda函數(shù)根據(jù)亮度值進(jìn)行排序,輸出hisR1(根據(jù)像素亮度值從小到大排序)、hisR2(根據(jù)像素亮度值統(tǒng)計(jì)個(gè)數(shù)從大到小排序)兩個(gè)列表。
步驟3:把hisR2統(tǒng)計(jì)結(jié)果中像素亮度值統(tǒng)計(jì)個(gè)數(shù)最多時(shí)的亮度值作為分割閾值,根據(jù)該閾值分離原始灰度圖像的目標(biāo)與背景,輸出分割閾值。
步驟4:分割單個(gè)圖像目標(biāo)與背景。創(chuàng)建一個(gè)大小與原圖像一樣的空白圖像矩陣,根據(jù)輸入的閾值對(duì)原圖像進(jìn)行分離,若像素亮度值大于閾值,則認(rèn)為是圖像的目標(biāo),則將該像素對(duì)應(yīng)的位置輸出到新圖像并將亮度值賦值為255,遍歷原灰度圖像的所有像素值,輸出新圖像。
步驟5:計(jì)算分離后圖像的信息熵值。將信息熵0.54這個(gè)樣本參數(shù)值作為處理訓(xùn)練數(shù)據(jù)集中第一張CT圖像的輸入值,得到一個(gè)新的信息熵值,然后將新信息熵值作為下一個(gè)圖像運(yùn)算的參考值,由此循環(huán)運(yùn)算直到最后一張圖像運(yùn)行結(jié)束。
步驟6:設(shè)置信息熵誤差范圍為20%,判斷誤差是否不大于20%,若是說(shuō)明分離的結(jié)果是可靠的,則結(jié)束分離并輸出當(dāng)前信息熵;若不是則回到步驟5,直到誤差在20%以下。
步驟7:對(duì)訓(xùn)練數(shù)據(jù)集里所有圖像遍歷進(jìn)行自動(dòng)分割,最后輸出分割后的圖像文件以及表格文件。
3 實(shí)驗(yàn)結(jié)果與分析
本文實(shí)驗(yàn)環(huán)境為Windows10系統(tǒng)下安裝的PyCharm開(kāi)發(fā)環(huán)境,通過(guò)Python編程語(yǔ)言實(shí)現(xiàn)自動(dòng)分離實(shí)驗(yàn),分割對(duì)象為數(shù)量較多的恐龍蛋殼化石切片CT圖像。上述算法運(yùn)行后最終的結(jié)果包括兩部分:分割后的圖像和輸出的表格。其中圖像內(nèi)容可以明顯提取出目標(biāo)和邊緣,而表格內(nèi)容包括CT圖像的樣號(hào)、分割閾值以及信息熵值。
3.1 分離效果定量分析
本研究為了符合恐龍蛋殼化石CT圖像數(shù)據(jù)的特點(diǎn),將樣本數(shù)據(jù)集樣號(hào)483~2 599的切片CT圖像作為測(cè)試集。鑒于信息熵已用于CT圖像目標(biāo)與背景的自動(dòng)分離與提取中,本文也給出了該方法對(duì)恐龍蛋殼化石切片CT圖像的自動(dòng)分離結(jié)果,包括訓(xùn)練集和測(cè)試集中2 117張切片CT圖像的分割閾值和信息熵。由于通過(guò)以上方法獲得的從483~2 599的每個(gè)樣號(hào)都有一個(gè)分割閾值和信息熵值,導(dǎo)致數(shù)據(jù)量很大。通過(guò)觀察輸出的結(jié)果表格,發(fā)現(xiàn)信息熵的范圍和分割閾值的范圍都并不寬泛,因此將其分拆成兩個(gè)部分,即信息熵結(jié)果的頻次統(tǒng)計(jì)(
信息熵 | 頻次 | 信息熵 | 頻次 | 信息熵 | 頻次 |
---|---|---|---|---|---|
0.43 | 3 | 0.51 | 26 | 0.59 | 217 |
0.44 | 14 | 0.52 | 54 | 0.6 | 236 |
0.45 | 29 | 0.53 | 45 | 0.61 | 223 |
0.46 | 20 | 0.54 | 99 | 0.62 | 186 |
0.47 | 26 | 0.55 | 129 | 0.63 | 124 |
0.48 | 18 | 0.56 | 156 | 0.64 | 76 |
0.49 | 17 | 0.57 | 176 | 0.65 | 15 |
0.5 | 26 | 0.58 | 202 | 總計(jì) | 2 117 |
分割閾值 | 頻次 | 分割閾值 | 頻次 | 分割閾值 | 頻次 | 分割閾值 | 頻次 |
---|---|---|---|---|---|---|---|
66 | 2 | 94 | 48 | 121 | 15 | 148 | 31 |
67 | 2 | 95 | 77 | 122 | 16 | 149 | 32 |
68 | 1 | 96 | 85 | 123 | 13 | 150 | 20 |
70 | 2 | 97 | 98 | 124 | 16 | 151 | 17 |
71 | 6 | 98 | 73 | 125 | 8 | 152 | 11 |
72 | 3 | 99 | 88 | 126 | 13 | 153 | 15 |
73 | 1 | 100 | 59 | 127 | 20 | 154 | 11 |
74 | 4 | 101 | 44 | 128 | 19 | 155 | 16 |
75 | 2 | 102 | 57 | 129 | 12 | 156 | 10 |
76 | 5 | 103 | 56 | 130 | 17 | 157 | 11 |
77 | 9 | 104 | 41 | 131 | 5 | 158 | 13 |
78 | 3 | 105 | 25 | 132 | 23 | 159 | 10 |
79 | 3 | 106 | 26 | 133 | 15 | 160 | 12 |
80 | 4 | 107 | 43 | 134 | 11 | 161 | 14 |
81 | 6 | 108 | 32 | 135 | 16 | 162 | 10 |
82 | 1 | 109 | 19 | 136 | 10 | 163 | 5 |
83 | 6 | 110 | 29 | 137 | 10 | 164 | 4 |
84 | 5 | 111 | 16 | 138 | 25 | 165 | 5 |
85 | 10 | 112 | 23 | 139 | 25 | 166 | 3 |
86 | 8 | 113 | 17 | 140 | 30 | 169 | 3 |
87 | 12 | 114 | 20 | 141 | 28 | 170 | 1 |
88 | 16 | 115 | 23 | 142 | 26 | 174 | 2 |
89 | 14 | 116 | 18 | 143 | 26 | 175 | 2 |
90 | 17 | 117 | 22 | 144 | 40 | 178 | 1 |
91 | 20 | 118 | 21 | 145 | 36 | 186 | 2 |
92 | 29 | 119 | 13 | 146 | 31 | 188 | 1 |
93 | 36 | 120 | 15 | 147 | 34 | 總計(jì) | 2 117 |
根據(jù)
圖4 信息熵統(tǒng)計(jì)直方圖
Fig.4 Information entropy statistical histogram
圖5 分割閾值統(tǒng)計(jì)直方圖
Fig.5 Segmentation threshold statistical histogram
3.2 分離效果定性分析
由于進(jìn)行自動(dòng)分離的CT圖像數(shù)量較多,因此本文僅從樣本數(shù)據(jù)集原始圖像與自動(dòng)分離后圖像的前、中、后3段各自隨機(jī)選取3張進(jìn)行分離效果分析。前段選取的是切片520,668,770;中段選取的是切片1 526,1 655,1 731;后段選取的是切片2 322,2 481,2 576。圖
圖6 前段原始圖像與分離后圖像。(a)、(b)、(c)原圖像;(d)、(e)、(f)分離后圖像。
Fig.6 The first segment of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f)Separated image.
圖7 中段原始圖像與分離后圖像。(a)、(b)、(c)原圖像;(d)、(e)、(f)分離后圖像。
Fig.7 The middle part of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f) Separated image.
圖8 后段原始圖像與分離后圖像。(a)、(b)、(c)原圖像;(d)、(e)、(f)分離后圖像。
Fig.8 The last part of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f) Separated image.
原始圖像僅以肉眼無(wú)法對(duì)目標(biāo)進(jìn)行有效提取,且存在很大的主觀性,導(dǎo)致誤差過(guò)大;而且從原始圖像中并不能清晰辨認(rèn)目標(biāo)邊緣輪廓,也不能分辨哪些是氣孔哪些是目標(biāo),這對(duì)我們的目標(biāo)分離提取工作帶來(lái)了很大的困難(圖
根據(jù)信息熵理論可知,圖像所含內(nèi)容越多就越混亂,信息熵值就越高。由
位置 | 樣號(hào) | 分割閾值 | 信息熵 | 信息熵均值 |
---|---|---|---|---|
前段 | 520 | 141 | 0.56 | 0.59 |
668 | 147 | 0.61 | ||
770 | 101 | 0.60 | ||
中段 | 1 526 | 104 | 0.60 | 0.60 |
1 655 | 95 | 0.59 | ||
1 731 | 125 | 0.60 | ||
后段 | 2 322 | 108 | 0.53 | 0.51 |
2 481 | 140 | 0.53 | ||
2 576 | 144 | 0.47 |
4 討論
關(guān)于CT圖像分割處理的研究多集中在醫(yī)學(xué)領(lǐng)域上,如研究?jī)?nèi)臟器官和其他病變位置[
與目前廣泛使用的醫(yī)學(xué)CT圖像分割方法相比,在恐龍蛋殼化石的CT圖像研究上可借鑒的對(duì)象和參考的實(shí)例較少。由于恐龍蛋殼化石不同于人體組織或者動(dòng)物組織,其成分屬于不同的物質(zhì)類型,兩者的CT圖像信號(hào)特征差異較大,因此不能完全照搬前人在醫(yī)學(xué)領(lǐng)域的CT圖像分割方法,并且醫(yī)學(xué)圖像中物體或結(jié)構(gòu)的分割通常比其他類型的圖像更為復(fù)雜。所以針對(duì)恐龍蛋殼化石CT圖像,需要選擇一種針對(duì)性強(qiáng)且運(yùn)算效率更高的方法。本實(shí)驗(yàn)采用信息熵作為提取目標(biāo)的一個(gè)參數(shù),在信息熵誤差范圍設(shè)置為20%的情況下,經(jīng)過(guò)多次嘗試,分割閾值與信息熵的選定使分離效果明顯,達(dá)到了大量CT圖像的目標(biāo)與背景自動(dòng)分離的研究目標(biāo)。實(shí)驗(yàn)證明本文方法是十分有效的,該方法不僅能清晰分離出目標(biāo),而且實(shí)現(xiàn)了自動(dòng)化處理,大幅提高了操作效率,同時(shí)提供了類似CT圖像處理情況中使用該信息熵范圍直接作為處理的參數(shù)。
由于在評(píng)價(jià)不同方法時(shí)使用的數(shù)據(jù)集以及處理的對(duì)象復(fù)雜程度不同,直接比較不同的方法是困難的,不能簡(jiǎn)單地認(rèn)為哪一個(gè)更好。但值得注意的是,本研究方法可以處理大量CT圖像樣本數(shù)據(jù)并且效果都不錯(cuò),不需要過(guò)多的人機(jī)交互,真正實(shí)現(xiàn)了自動(dòng)化、智能化??傊?,本研究的主要貢獻(xiàn)是提出了一種CT圖像在新領(lǐng)域的處理方法。該方法可用于研究類似恐龍蛋殼化石一樣由方解石構(gòu)成的其他物體CT圖像的分類處理,以該信息熵范圍參數(shù)來(lái)進(jìn)行自動(dòng)分離并提取目標(biāo),為快速重構(gòu)物體三維空間結(jié)構(gòu)奠定了數(shù)據(jù)基礎(chǔ)。
5 結(jié)論
針對(duì)大量恐龍蛋殼化石CT圖像手動(dòng)分割步驟繁瑣、分割精度不高、處理時(shí)間長(zhǎng)、誤差較大等問(wèn)題,在閾值分割的基礎(chǔ)上,提出了一種基于信息熵的自動(dòng)分離CT圖像方法。利用手動(dòng)分割CT圖像獲取到的信息熵值作為自動(dòng)分離圖像的參數(shù),通過(guò)閾值分割和信息熵的方法進(jìn)行大量圖像目標(biāo)與背景的自動(dòng)分離研究,并進(jìn)行了廣泛的測(cè)試與實(shí)驗(yàn),其中所獲分割閾值范圍為66~188,信息熵值范圍為0.43~0.65。實(shí)驗(yàn)結(jié)果表明,所設(shè)計(jì)的方法在CT圖像數(shù)量較多時(shí),在自動(dòng)分離圖像目標(biāo)與背景上可取得很好的效果,其有效分離率高達(dá)98.89%,并且該方法能在正確提取目標(biāo)的同時(shí)還能保留完整目標(biāo)與邊緣細(xì)節(jié),還可以對(duì)恐龍蛋殼中保存的氣孔與蛋殼邊界進(jìn)行有效且精確地提取,提高了操作效率。但是,本研究?jī)H探討了如何處理大量恐龍蛋殼CT圖像的方法,對(duì)于恐龍蛋殼本身以及如何重建恐龍蛋的三維立體結(jié)構(gòu)的研究仍有不足,這是作者需要進(jìn)一步研究的方向。
欄目分類
- 1網(wǎng)絡(luò)直播現(xiàn)狀及前景探究
- 2淺析電影《我的父親母親》視聽(tīng)語(yǔ)言特色——影視文學(xué)
- 3中美貿(mào)易戰(zhàn)的發(fā)展和應(yīng)對(duì)
- 4論微信傳播的特點(diǎn)
- 5企業(yè)如何進(jìn)行危機(jī)公關(guān)——以三星Galaxy note7爆炸門事件為例
- 6淺析網(wǎng)絡(luò)暴力的社會(huì)危害及防治對(duì)策
- 7聚酮類化合物研究進(jìn)展
- 8淺析《極限挑戰(zhàn)》的節(jié)目特色及啟示
- 9《楚門的世界》的多重隱喻解讀
- 10體育產(chǎn)業(yè)發(fā)展中存在的問(wèn)題及建議
- 游戲教學(xué)法在網(wǎng)球教學(xué)中的應(yīng)用
- 心理素質(zhì)在網(wǎng)球比賽中的作用
- 綠色科技視角下企業(yè)環(huán)境績(jī)效指標(biāo)體系構(gòu)建
- 節(jié)約型基礎(chǔ)上的綠色財(cái)政稅收政策研究
- 財(cái)政投資項(xiàng)目竣工決算存在的問(wèn)題及對(duì)策
- 基于精細(xì)化管理視域探析公立醫(yī)院成本管控優(yōu)化策略
- 農(nóng)村信用社在金融市場(chǎng)中的營(yíng)銷技巧探究
- 實(shí)現(xiàn)我國(guó)糧食增產(chǎn)增收的財(cái)稅政策分析
- 離子色譜法同時(shí)測(cè)定卷煙紙中幾種金屬離子的含量
- IC厭氧反應(yīng)器處理造紙廢水效率的時(shí)間分布特征研究
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 2023JCR影響因子正式公布!
- 國(guó)內(nèi)核心期刊分級(jí)情況概覽及說(shuō)明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個(gè)很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問(wèn)題”。
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個(gè)知識(shí)點(diǎn)。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點(diǎn)那些評(píng)職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認(rèn)可省市級(jí)黨報(bào)?是否有什么說(shuō)據(jù)?還有哪些機(jī)構(gòu)認(rèn)可黨報(bào)?
- 《農(nóng)業(yè)經(jīng)濟(jì)》論文投稿解析,難度指數(shù)四顆星,附好發(fā)選題!