zhen365
zhen365
发布于 2024-01-23 / 170 阅读
0
0

NeuCom | An image segmentation method of a modified SPCNN based on human visual system in ...

An image segmentation method of a modified SPCNN based on human visual system in medical images-aegdzlyf.png

论文:An image segmentation method of a modified SPCNN based on human visual system in medical images - ScienceDirect

摘要

本文提出了一种基于人类视觉系统(HVS)的改进型简化脉冲耦合神经网络(MSPCNN)图像分割方法用于医学图像处理。该方法根据PCNN和HVS特性成功确定了MSPCNN的刺激输入。为了实现这一目标,本文尝试通过引入邻近激发矩阵Q基于新型MSPCNN(NMSPCNN)计算强度分布范围来推导出中央神经元激发的亚强度范围,从而揭示亚强度范围参数 Sint 如何生成更接近HVS的刺激输入 Sio_{ij}。此外,本文尝试将上述刺激输入应用于MSPCNN以提取更适合医学图像的病灶。相比流行的PCNN模型,MSPCNN由于其参数设置方法具有更高的分割准确率更低的计算复杂度。最终,与最先进的方法相比,所提出的优秀方法在性能上表现更优,其综合评价指标OEM在MIAS数据集上为0.8784,在DDSM数据集上为0.8606,在胆结石数据集上为0.8585。

引入

1994年,Johnson 基于源于生物启发神经网络的Eckhorn的皮层模型,提出了一种脉冲耦合神经网络(PCNN)以解释神经元活动的同步动态特性。在过去十年中,由于其能使相邻神经元同步脉冲的能力,该领域发展迅速。为了提高分割精度并降低计算复杂度,已经提出了许多改进的PCNN模型。其中,具有代表性的简化模型包括多通道PCNN模型、尖峰皮层模型(SCM)和简化的PCNN模型。PCNN在图像处理领域的多个方面有广泛应用,例如图像分割、图像增强、目标识别和图像融合。其中,PCNN在图像分割方面的应用具有巨大潜力,因为它具有一些显著特性,包括神经元放电同步、同步脉冲释放、自动生成波形以及非线性调制。这些特性保证了相较于现有的视觉模型,PCNN总能获得更好的分割效果。然而,大多数现行的PCNN分割方法仍然需要手动或半自动设置参数,目前只有Berg等人、Ma等人和Chen等人等几种自动参数设置方法。

视觉注意力是HVS的关键机制之一,它可以轻松的在不同视觉区域之间产生更为显著的差异,并在同一区域的不同像素间产生较小的差异。然而,大多数主流PCNN模型仅使用简单的图像灰度强度作为刺激输入,无法满足HVS的处理要求。因此,考虑HVS视觉注意力机制的输入刺激将在后续研究中发挥重要作用。

根据上述实际分析,本文提出了一种基于改进型SPCNN(MSPCNN)的新型分割方法,该方法采用HVS刺激输入,旨在获得良好的医学图像分割效果。其中,定义了刺激输入 Sio_{ij},表示中心兴奋神经元及其邻域兴奋矩阵Q的亚强度范围。亚强度范围参数 Sint 源于内部活动在迭代过程中的值以及基于新型改进型SPCNN(NMSPCNN)的前一次迭代的动态阈值。邻域点火矩阵Q能够直观地对中心兴奋神经元的邻居产生直接影响。此外,MSPCNN的新结构仅包含三个简化参数α、β和V以及一个已知变量S′。这些参数由MSPCNN的动态特性自动设定,模拟了新皮质中初级视觉区域V1的感受野。

本文贡献:(1)提出临近点火矩阵 Q,用于确定中心点火神经元的临近影响;(2)所提出的 NMSPCNN 方法降低了对中心神经元亚强度范围的计算复杂度;(3)通过对 NMSPCNN 中内部活动、动态阈值和临近点火矩阵的性质推导,最终确定了中心神经元点火的亚强度范围表达式;(4)MSPCNN的输入刺激 Sio_{ij} 由原始图像像素强度参数 Sori_{ij} 以及基于HVS的中心神经元点火亚强度范围参数 Sint_{ij} 定义。(5) 所提出的接收 HSV 输入刺激的MSPCNN方法相较于其他最先进的方法表现更优。

相关工作

当PCNN通过脉冲耦合的突触机制进行调制时,它在复杂现实环境下的图像处理,特别是在医学图像处理方面具有巨大的潜力。PCNN的动态特性,包括内部活动和动态阈值,以及从图像属性值获得的静态特性,可以通过设置PCNN参数直接建立与图像分割的重要关系。在过去几十年中,有几种有效的图像处理方法,它们更注重对PCNN动态特性和静态特性的具体应用。因此,在接下来的段落中,本文将提供一个简短的概述,以推导PCNN和医学图像分割方法。

基于动态特性的新型PCNN图像处理方法通过调节内部活动和动态阈值,简化了计算复杂性,并利用经验或自动参数值直接确定每个分割区域的亚强度范围。例如,Zhan等人提出了一种特征关联模型,该模型明显减少了设置参数的数量,并通过网络的突触机制增加馈入和链接波的频率以整合空间和时间信息,从而降低了计算复杂性。与之前的PCNN模型相比,这种特征关联PCNN在图像处理性能上更优。Yang等人提出了一种异构SPCNN模型,通过三种具有不同结构和参数的SPCNN细胞模拟视觉区域的感受野。这种方法能够根据图像的灰度强度将测试图像容易地分割成多个区域,并且简化后的PCNN模型的参数可以根据特性自动设置。

基于PCNN静态特性的图像处理方法已经变得普遍,其关键步骤是如何设置合适的刺激输入和模型参数(例如Otsu阈值法、显著性估计值或基于HVS的适宜值)。陈等人提出了一个简化的PCNN模型(SPCNN)以在复杂环境中识别对象。该模型参数采用如Otsu阈值法等图像属性值。显然,由于参数设置方法,SPCNN的神经元倾向于同步激发,并实现特定对象分割。郭等人提出了一种基于显著性驱动的改进简化的PCNN模型(SM-ISPCNN)以更好地模拟HVS。显著性刺激提供了一个滑动窗口,以便合理利用物体和背景的分布情况。其中,模型的刺激输入是根据在各种复杂环境(如自然图像和医学图像)中分割出的对象的显著性特征确定的。

SPCNN

基础模型

PCNN是一种仅包含单层的人工神经网络,无需任何训练。网络中的神经元与图像像素之间具有一一对应关系。与其他PCNN模型相比,源于Zhan等人的SCM模型的Chen等人提出的SPCNN模型在图像分割中发挥着重要作用,其动力学方程表示为:

\begin{equation} F_{ij}(n)=S_{ij} \end{equation}
\begin{equation} L_{ij}(n)=V_L\sum_{kl}W_{ijkl}Y_{kl}(n-1) \end{equation}
\begin{equation} U_{ij}(n)=e^{-\alpha_f}U_{ij}(n-1)+F_{ij}(1+\beta V_L\sum_{kl}W_{ijkl}Y_{kl}(n-1)) \end{equation}
\begin{equation} Y_{ij}(n)= \left\{\begin{matrix} 1,&if\quad U_{ij}(n)\ge E_{ij}(n)\\ 0,&else \end{matrix}\right. \end{equation}
\begin{equation} E_{ij}(n)=e^{-\alpha_e}E_{ij}(n-1)+V_{E}Y_{ij}(n) \end{equation}

其中:

\begin{equation} W_{ijkl} = \begin{bmatrix} 0.5 & 1 & 0.5 \\ 1 & 0 & 1 \\ 0.5 & 1 & 0.5 \end{bmatrix} \end{equation}
\begin{equation} \alpha_f=\log{(\frac{1}{\sigma(S)})} \end{equation}
\begin{equation} \beta=\frac{(S_{max}/S')-1}{6V_L} \end{equation}
\begin{equation} V_E=e^{-\alpha_f}+1+6\beta V_L \end{equation}
\begin{equation} \alpha_e=\ln{\left(\frac{V_E/S'}{\frac{1-e^{-3\alpha_f}}{1-e^{-\alpha_f}}+6\beta V_{L}e^{-\alpha_f}}\right)} \end{equation}

对于SPCNN,位于 (i,j) 位置的神经元 N_{ij} 包含两种输入:简化的前馈输入 F_{ij}(n),代表输入刺激 S_{ij};链接输入 L_{ij}(n),代表八个相邻输出的乘积、突触权重 W_{ijkl} 和加权因子 V_L。其中, S_{ij} 表示原始图像的归一化像素强度。上述输入通过链接强度 \beta 调制形成内部活动 U_{ij}(n)。此外,还包括由衰减因子 e^{-\alpha_f} 调制的前一时刻内部活动。当内部活动 U_{ij}(n) 大于动态阈值 E_{ij}(n) 时,神经元 N_{ij} 将触发(Y_{ij}(n)=1),动态阈值会突然增加一个加权因子 V_E。若内部活动 U_{ij}(n) 小于动态阈值 E_{ij}(n),神经元 N_{ij} 不会触发(Y_{ij}(n)=0),动态阈值则会通过衰减因子 e^{-\alpha_e} 减少。其中,\alpha_f\alpha_e 分别表示内部活动 U_{ij}(n) 和动态阈值 E_{ij}(n) 的衰减因子。显然,SPCNN具有五个重要参数 \beta\alpha_f\alpha_eV_LV_E,这些参数可以自动设置以对复杂场景中的物体进行分割。

亚强度范围

The segmentation results of the SPCNN from mdb 5 and 10 of the MIAS database-mchxqzqr.png

为了更好地理解SPCNN的动态特性,其正常的分割步骤如图1所示,每一步迭代的分割结果的亚强度范围则在图2中展示。在图1中,SPCNN的分割结果包括来自Mammographic Image Analysis Society数据库(MIAS) 的原始图像(a)和(i),输出的二值图像(b)至(g)以及(j)至(o),最终的分割图像(h)和(p)。图1(a)和(i)中神经元放电的亚强度范围分别由图2(a)和(b)给出。每个神经元在第二次迭代后只触发一次。最终的分割结果需要在第一个有效脉冲周期内进行四次迭代。值得注意的是,SPCNN比之前的PCNN模型具有有限的分割步骤,并且能够在每次迭代时自动选择合适的阈值以实现区域分割。

The sub-intensity range of the SPCNN-vshjgppr.png

Modified SPCNN model

对于采用SPCNN的医学图像,可以在第三次迭代时将其划分为目标区域和背景区域,并在后续迭代中进一步形成分割结果。然而,它仍需要计算五个关键参数,并且容易在高强度区域产生不理想的分割结果。因此,本文提出了MSPCNN模型,以进一步降低计算复杂性和提高图像分割精度。MSPCNN模型将SPCNN的五个关键参数调整为三个。其中,参数 \alpha_f\alpha_e 合并为一个参数 \alpha,并根据PA-PCNN方法移除了参数 V_L。参数 \beta 仅通过与SPCNN方程进行比较进行了微调。参数 V_E 改为了参数 V。上述调整的三个参数中只包含一个已知变量 S',表示归一化的Otsu阈值。

参数 \alpha

SPCNN 中的 \alpha_f\alpha_e 分别表示内部活动和动态阈值的衰减因子。MSPCNN 中的上述两个参数被合并为一个 \alpha,即:

\begin{equation} \alpha=\alpha_e=\alpha_f=\log{(\frac{1}{S'})} \end{equation}

在上式中,参数 S'表示归一化的OTSU阈值。S'\alpha 的分布范围分别为 0\le S'\le 10< \alpha\le+\infty。显然,参数 \alpha 的增大伴随着参数 S' 的减小。

参数 \beta

为了深入理解神经元放电条件,本文分别重置了常数突触权重 W_{ijkl} 和参数 \beta。在MSPCNN中,每个神经元可能受到其四个相邻神经元的影响,而不是SPCNN中的八个,因此参数 W_{ijkl} 也被改写为

\begin{equation} W_{ijkl} = \begin{bmatrix} 0 & 1 & 0 \\ 1 & 0 & 1 \\ 0 & 1 & 0 \end{bmatrix} \end{equation}

与 SPCNN 相比,MSPCNN 中的恒定突触权重 W_{ijkl} 由于计算复杂度更低以及对医学图像实现更平滑的分割边界,因此被改编为连接四个相邻神经元而非八个。鉴于大多数图像中 S_{max}\approx 1V_L=1,本文将 \beta 的值重新设置为

\begin{equation} \beta=\frac{1-S'}{4s'} \end{equation}

参数 V

在 SPCNN 中 \beta V_L 通常作为一个整体因素考虑,同时参数 V_L 的值为 1。因此,可以去掉参数,将连接输入重写为:

\begin{equation} L_{ij}(n)=\beta\sum_{kl}W_{ijkl}Y_{kl}(n-1) \end{equation}

由于SPCNN中参数 V_E 具有较高的计算复杂度,我们可以将 V_E 重置为仅包含归一化Otsu阈值 S'V。可以采用Chen等人文献中的数学公式如下:

\begin{equation} \left\{\begin{matrix} Us_{high}(1+l)\le E(1+l-1) \\ Us_{low}(1+l+1)>E(1+l) \end{matrix}\right. \end{equation}

根据上式,在 (1+l) 次迭代中未点火像素的最大内部活动值将小于在 (1+l-1) 次迭代中的动态阈值 E(1+l-1),而在 (1+l+1) 次迭代中激发像素的最小内部活动值将大于在 (1+l) 次迭代中的动态阈值 E(1+l)。这保证了在 (1+l+1) 次迭代中有激发像素的一个亚强度范围。随后,将 Y(0)U(0)E(0)的初始值设为 0。若一幅正常图像在SPCNN的第二次迭代而非第三次迭代中达到第一段,可以将参数 l 设为 0,点火神经元将会满足条件:

\begin{equation} \left\{\begin{matrix} U_{high}(1)\le E(0) \\ U_{low}(2)>E(1) \end{matrix}\right. \end{equation}

然而,在正常情况下,U(1) 大于 0 且 E(0) 被设置为 0,这遵循了上式中的第一个触发条件。因此,为了在第二次迭代中获得第一个图象片段,本文重置点火条件为:

\begin{equation} U_{low}(2)>E(1) \end{equation}

U_{low}(2) 又可以被表示为:

\begin{equation} U_{low}(2)=S_{low}(1+e^{-\alpha}+4\beta)=S_{low}M(2) \end{equation}

又由于 E(1)=V,上式可以重写为:

\begin{equation} S_{low}M(2)>V \end{equation}

此外,归一化大津阈值 S' 总是大于 S_{low},代入上式表示为:

\begin{equation} S'M(2)>V \end{equation}

因此,在上式的最大值限制下可以获得 V 的唯一值

\begin{equation} V=S'M(2) \end{equation}

据上述推导,参数 V 可以简化为:

\begin{equation} V=1+S'^{2} \end{equation}

为进一步提高图像分割精度,本文在公式中添加了一个小的偏移量(-S'^8),最终参数 V 的表达式为:

\begin{equation} V=1+S'^2-S'^8 \end{equation}

相比于SPCNN,MSPCNN在基础模型中具有相同的表达式,但参数设置方法不同。

基于人眼视觉系统(HVS)的中央神经元放电的亚强度范围

在MSPCNN中,每次迭代时中心神经元的亚强度范围直接影响最终图像分割结果。上一次迭代时,中心神经元容易受到其四个方向相邻神经元的影响。此外,对HVS的良好模拟能在医疗图像中获取更显著的病灶。因此,基于HVS研究中心神经元激发的子强度范围具有重要意义。

NMSPCNN

为精细观察受邻近神经元影响的中心神经元的亚强度范围,本文采用了一种新的 MSPCNN 模型(NMSPCNN),该模型与上述MSPCNN相比简化了参数表达。其通用公式可表示为

\begin{equation} F_{ij}(n)=S_{ij} \end{equation}
\begin{equation} L_{ij}(n)=\sum_{kl}W_{ijkl}Y_{kl}(n-1) \end{equation}
\begin{equation} U_{ij}(n)=F_{ij}(n)(1+\beta L_{ij}(n))=S_{ij}(1+\beta\sum_{kl}W_{ijkl}Y_{kl}(n-1)) \end{equation}
\begin{equation} Y_{ij}(n)= \left\{\begin{matrix} 1,&if\quad U_{ij}(n)> E_{ij}(n)\\ 0,&else \end{matrix}\right. \end{equation}
\begin{equation} E_{ij}(n)=e^{-\alpha}E_{ij}(n-1)+VY_{ij}(n) \end{equation}

其中

\begin{equation} V=\frac{1}{S'} \end{equation}
\begin{equation} \beta=\frac{1-S'}{4S'} \end{equation}
\begin{equation} \alpha=\log{(\frac{1}{S'})} \end{equation}
\begin{equation} W_{ijkl} = \begin{bmatrix} 0 & 1 & 0 \\ 1 & 0 & 1 \\ 0 & 1 & 0 \end{bmatrix} \end{equation}

与上述MSPCNN相比,NMSPCNN在合理计算中心神经元放电的子强度范围方面有三个明显变化。首先,参数 V 被改为 \frac{1}{S'} 以确定更合适的神经元子强度范围。其次,链接输入 L_{ij}(n) 和内部活动 U_{ij}(n) 分别被重新定义,以便简化计算。第三,由于上述两次迭代中未激发神经元的存在,NMSPCNN中的第二次和第三次迭代合并为第二次迭代,而第四次迭代被定义为新的第三次迭代,依此类推。

邻域点火矩阵

邻域点火矩阵 Q 由邻近点火神经元的数量定义。在当前迭代中点火的神经元受到前一迭代其邻近神经元的影响。在一个脉冲点火周期内,神经元的点火状态容易受到邻近点火神经元的影响而发生变化。邻近点火神经元数量越多,矩阵 Q 中相应的参数值越大(即,位置 (i,j) 处的神经元 N_{ij} 在前一迭代有四个激发神经元,则矩阵 Q 中位置 (i,j) 处的相应参数值可以确定为 4)。邻域点火矩阵 Q 的方程可表示为:

\begin{equation} Q_{(i,j)}(n)=Y_{(i+1,j)}(n-1)+Y_{(i-1,j)}(n-1)+Y_{(i,j+1)}(n-1)+Y_{(i,j-1)}(n-1) \end{equation}

在前一次迭代中无临近点火神经元的中心神经元亚强度范围

由于NMSPCNN中,内部活动 U_{ij}(1) 总是大于动态阈值 E_{ij}(0),所有神经元在第一轮迭代时都会点火。随后,内部活动 U_{ij}(2) 始终小于动态阈值 E_{ij}(1),这表明在第二轮迭代(将第二轮和第三轮迭代合并到第二轮)中无法获取邻域点火矩阵。因此,可以在第二轮迭代后获得有效的邻近点火值并确定邻域点火矩阵 Q。在第三轮迭代后可以计算出中心激发神经元的亚强度范围。最后,从下图可以看出前一轮迭代中零邻近点火神经元与本轮迭代中中心点火神经元之间的对应关系。

The relation between zero neighboring firing neuron and central firing neuron-adqnkswv.png

在上图(a)和(b)中,标记为5的神经元表示中心神经元,标记为1、2、3和4的神经元表示邻近神经元。在图3(a)中,相邻神经元在前一次迭代时不点火,其对应的邻域点火矩阵为 0。在图 3(b) 中,中心神经元在迭代时点火,并且仅取决于其对应的像素强度,而不是相邻的神经元。显然,中心神经元点火的亚强度范围仅由它们的像素强度决定。

根据上述描述和分析,基于公式(16)的内部活动 U(4)_{zero},在没有相邻神经元点火的情况下,总是在第四次迭代中产生中心神经元放电的亚强度范围。

\begin{equation} \left\{\begin{matrix} Us_{high}(3)\le E_{ij}(2) \\ Us_{low}(4)>E_{ij}(3) \end{matrix}\right. \end{equation}

看不下去了,下述公式++26

基于 HVS 的输入刺激 Sio_{ij}

韦伯-费希纳定律是一条遵循人类视觉特性的数学法则,其表达式如下:

\begin{equation} Sio_{ij}=k\ln{Sover_{ij}}+g \end{equation}

其中,Sio_{ij}Sover_{ij} 分别表示视觉图像的人类主观感知程度客观像素强度。参数 kg 是调节客观像素强度的常数因子。本文将参数 k 设置为1,并消去参数 g,以便将参数 Sio_{ij} 的变化聚焦于参数 Sover_{ij} 上。为了满足人类视觉特性,本文将参数 Sover_{ij} 定义为

\begin{equation} Sover_{ij}=1+Sori_{ij}+Sint_{ij} \end{equation}

其中,Sio_{ij}表示原始图像的归一化像素强度。Sint_{ij} 定义为根据公式(60)所确定的下限

\begin{equation} Sint_{ij}=\frac{4S'^{M-1}}{Q_{ij}+(4-Q_{ij}S')} \end{equation}

在(63)中,参数M被设置为4,这是基于(43)中中央神经元子强度范围的最小迭代次数。同时,在第三次迭代时获得邻域点火矩阵 Q。上述数学方程式进一步表示为

\begin{equation} Sint_{ij}=\frac{4S'^3}{Q_{ij}+(4-Q_{ij})S'} \end{equation}

显然,Sover_{ij} 包括参数Sori_{ij}Sint_{ij},可以被重写为

\begin{equation} Sover_{ij}=1+Sori_{ij}+\frac{4S'^3}{Q_{ij}+(4-Q_{ij})S'} \end{equation}

最后,基于韦伯-费希纳定律的参数 Sori_{ij} 表示为

\begin{equation} Sio_{ij}=\ln{\left[1+Sori_{ij}+\frac{4S'^3}{Q_{ij}+(4-Q_{ij})S'}\right]} \end{equation}

根据上式,本文进一步计算参数 Sori_{ij} 的归一化数值,以获取贴近人类视觉特征的输入刺激用于MSPCNN。

所提方法的关键步骤

本文提出的方法实现如下图所示。相应的伪代码见算法1。首先将亚强度范围参数 Sint_{ij}、归一化的原始图像强度 Sori_{ij} 和1合并为一个参数 Sover_{ij},并基于(64)至(66)计算其自然对数。另外,输入图像的静态属性(包括归一化的Otsu阈值 S')以及MSPCNN的动态属性(包括内部活动 U_{ij} 和动态阈值 E_{ij})共同决定了参数 \alpha\betaV 的合适取值。上述参数可通过(12)、(14)和(24)分别简便地计算得出。

The flowchart of the proposed method-yeezhxeq.png

所述方法的实现步骤如下:(1)从实验数据库中选择一幅原始医学图像,计算该原始图像的归一化OTSU阈值 S',并设置相关参数值。(2)根据NMSPCNN计算邻域点火矩阵 Q。(3)计算亚强度参数 Sint_{ij} 和原始强度参数 Sori_{ij}。(4)计算人类主观感知参数 Sio_{ij}。(5)将参数 Sio_{ij} 作为 MSPCNN的刺激输入。(6) 采用MSPCNN算法实现病灶精细化分割 。(7) 获取最终的分割结果。

The segmentation steps of the proposed method for medical images-lxkugtye.png

实验和分析

在本部分中,实验图像来自Mammographic Image Analysis Society(MIAS)数据库、Digital Database for Screening Mammography(DDSM)以及中国甘肃省人民医院的含结石胆囊超声图像的专业数据库。其中,来自MIAS的乳腺X线数据库包含322幅乳腺X线图像,其中有64幅包含不同大小和形状的数字化乳腺肿瘤图像。来自DDSM的乳腺X线数据库包含2620幅乳腺X线图像,其中有914幅包含恶性肿瘤图像。来自甘肃省人民医院的胆石数据库包含240幅含结石胆囊超声图像。同时,它们还包含了省级放射学专家对手术上述医学图像的手动勾画结果以及医生临床诊断的临床表现。来自MIAS和胆石的测试图像分辨率为1024×1024像素和512×512像素,分别。来自DDSM的测试图像提供了多种分辨率下的合理图像信息。每幅图像具有256个灰度级。实验在MATLAB R2014a环境下运行,搭载Intel(R) Core(TM) i7-7700HQ处理器,频率为2.80 GHz,8 G DDR3内存。

分割评估指标

对于研究实验结果的评估,本文采用了几种关键指标来评价所提方法的分割精度和信息完整性,这些指标的取值范围均为 [0,1]。其中,UM这一指标表示分割区域的均匀性,并被定义为

\begin{equation} UM=1-\frac{1}{C}\sum_{i}\left\{\sum_{(x,y)\in R_j}\left[f(x,y)-\frac{1}{A_i}\sum_{(x,y)\in R_j}f(x,y)\right]^2\right\} \end{equation}

其中,C代表整幅图像归一化后的最大强度值。对于已分割的图像,R_j表示第 j 个区域,A 表示第 j 个区域的面积,n 表示分割出的区域总数,i 表示灰度级的数量(在二值图像中,i 设置为 2)。显然,UM 值越大,说明分割效果越好。随后,指标 Mean 表示测试图像中分割区域的平均像素强度,而 STD 指标则表示目标区域强度的标准差。上述两个指标的测试结果值越大,说明其评估结果越好。

为了获得合理实验结果,引入以下TP、FP、TN和FN的定义:

TP:医生标注区域为病灶且分割测试区域也为病灶。

TN:医生标注区域非病灶且分割测试区域也非病灶。

FP:医生标注区域非病灶但分割测试区域为病灶。

FN:医生标注区域为病灶但分割测试 0 区域非病灶。

根据上述定义,区域重叠(OV)可表示为

\begin{equation} OV=\frac{|S\cap M|}{|M|}=\frac{TP}{TP+FP} \end{equation}

其中,S 表示通过计算机辅助方法得到的分割区域的像素集合。M 表示医生手动分割区域的像素集合。|S\cap M| 表示上述两个区域的交集。另外,敏感度(SEN)这一指标的计算公式为

\begin{equation} SEN=\frac{|S\cap M|}{S}=\frac{TP}{TP+FN} \end{equation}

基于方法论的OV和SEN指标被用于判断所提方法分割出的区域与专家相互绘制区域之间的相似度。后续实验中发现,若OV和SEN在测试中产生较大值,则相应的分割结果将具有较高的分割精确率。

为了对本文方法进行最终评估,将上述五个指标合并为一个综合评估指标OEM。在OEM中,UM、Mean和(1-STD)这三个指标的权重均设为1/6,以验证图像分割信息的完整性。同时,OV和SEN这两个指标的权重则设定为1/4,用以评价图像分割精度。最后,综合评估指标OEM的表达式为:

\begin{equation} OEM=\frac{1}{6}UM+\frac{1}{6}Mean+\frac{1}{6}(1-VAR)+\frac{1}{4}OV+\frac{1}{4}SEN \end{equation}

评估结果与分析

为验证所提方法的分割结果的稳健性和有效性,实验中将采用包括NSCM、SPCNN、PA-PCNN和Otsu在内的最新方法作为比较算法。此外,上述方法将通过与专业医师的手动勾画分割结果进行对比,以评估最终的分割性能。实验分为三组。第一组给出了来自MIAS数据库的实验结果,如图6和7所示。第二组展示了来自DDSM数据库的实验结果,如图8和9所示。第三组展示了来自甘肃省人民医院胆结石数据库的实验结果,如图10和11所示。此外,整体评价指标OEM的评估结果也在图12中展示。

The experimental results of the lesions in mammograms from MIAS-qeyomexr.pngThe evaluation results of the lesions for abnormal mammograms from MIAS-byykqqup.jpgThe experimental results of the lesions in mammograms from DDSM-zlcxyloc.pngThe evaluation results of the lesions for abnormal mammograms from DDSM-wndegfvx.jpgThe experimental results of the lesions for gallstones-rnztpegw.pngThe evaluation results of the lesions for gallstones-gkwmvpix.jpgThe overall evaluation results of gallstones and mammograms-nsuzqnry.png

在图6、8和10中,每一行代表一张图像的实验结果。列(a)中的图像为原始图像。列(b)中的图像表示原始图像的感兴趣区域(ROI)。列(c)、(d)、(e)、(f)和(g)中的图像分别为所提出的算法、Otsu、PA-PCNN、SPCNN和NSCM的实验结果。列(h)中的图像为省级放射学专家提供的真实标准。

图7(a)、(b)、(c)、(d)和(e)分别表示UM、MEAN、STD、OV、SE这五个指标的评估结果。我们在图7(f)中展示了实验方法对所有测试图像各项指标的平均值计算结果。图7(f)给出了异常乳腺X线照片测试图像的最终结果。所提方法的OV指标具有明显的0.98优势,表明我们方法得到的分割区域与省级放射科专家的手工绘制区域更为接近。所提方法得到的0.9904的UM值具有合理的优越性,对于分割区域有更好的均匀性。我们的方法得到的0.0346的STD值比大多数方法(除NSCM外)显示出更好的实验结果,这意味着我们方法得到的目标区域像素强度差异更小。提出的0.7493的MEAN值相较于其他方法(除PA-PCNN外)带来了对比性的评估结果。0.73的SE值为我们的方法提供了合理的测试结果。尽管我们的实验值在Otsu和SPCNN方法上较低,但在其他指标的测试值上明显高于上述两种比较算法。因此,在MIAS数据集上的异常乳腺X线照片处理方面,我们提出的方法比其他实验方法表现更优。

图9(a)、(b)、(c)、(d)和(e)分别是DDSM数据库的UM、MEAN、STD、OV、SE五种指标的实验结果。另外,我们还从以上五个指标中获取了整体评估结果,如图9(f)所示。其中,OV为0.9973,STD为0.0506,MEAN为0.6646的表现优于其他方法。UM为0.9869与其他实验结果相比有细微差别。因此,与最先进的方法相比,我们的方法展现出了更大的优势。

图11(a)、(b)、(c)、(d)和(e)分别是UM、MEAN、STD、OV、SE五种指标的测试结果。此外,我们在图11(f)展示了对比方法各项指标的平均值,针对胆结石数据。其中,由于我们的方法与手动绘制方法之间的差异较小,OV为0.9287的优势显著。虽然我们的方法在UM(0.951)、MEAN(0.8873)、STD(0.079)这三个指标上并非最优,但与Otsu、PA-PCNN和SPCNN相比(除NSCM外),这三个指标的平均值更高。而我们的方法在SE上的值为0.6655,大于NSCM。因此,对于胆结石而言,我们的方法优于其他流行的方法。

在图12中,根据(70)将上述五个指标综合为一个总体指标OEM。在此,所提出的方法在总体评估指标OEM上显示出更好的评估结果,包括MIAS的0.8784、DDSM的0.8606以及胆结石的0.8585。其他几种分割方法在五个评价指标的评价值上几乎相当。显然,我们提出的方法比其他方法表现更优。

结论

本论文提出了一种基于HVS的MSPCNN医学图像分割方法。该MSPCNN模型保留了基本PCNN的主要特性,仅设置了与Otsu阈值S′相关的三个参数α、β、V。同时,从基于NMSPCNN的邻域激发矩阵Q中导出的子强度范围参数Sintij,以及原始图像强度参数Soriij,合理地确定了主观感知水平参数Sioij作为MSPCNN的输入刺激。在实验分析中,我们采用五种评价指标、四种对比算法以及来自高级数据集的相关医学图像,表明该方法对HVS有良好的刺激性。分割结果展示出所提方法的有效性和鲁棒性,在总体评价指标OEM中,MIAS得分为0.8784,DDSM得分为0.8606,胆结石得分为0.8585。未来将进一步计划在图像处理领域的其他方面进行深入研究,例如图像质量评价和图像增强。


评论