基于深度学习技术的ECG自动分类算法研究论文

2020年2月25日19:18:31基于深度学习技术的ECG自动分类算法研究论文已关闭评论

基于深度学习技术的ECG自动分类算法研究论文

心血管疾病是导致死亡率较高的疾病之一,而心电图(Electrocardiogram, ECG)作为一种有效的非侵入式诊断工具,通常被用于筛查和诊断心血管疾病。 然而,由于动态心电图数据量大,以及医学专家人员有限,因此造成医生诊断 任务非常繁重。使用计算机辅助心电图分析工具可以大大减轻医生的工作量, 并提高心血管疾病的筛查和诊断效率。本文旨在结合心电数据的时间序列特征, 建立基于深度学习技术的心电数据自动分类模型,本文主要研究内容如下:

  • 针对ECG中存在噪声,导致特征提取困难等问题,本文采用小波变 换算法对ECG信号进行降噪处理。论文根据ECG数据的特性,采用Daubechies6

(db6)小波函数将ECG信号分解为8层,在此基础上,根据噪声系数,设定 合理的阈值进行降噪处理,最后重构阈值处理后的各层小波,得到降噪后的ECG 信号。实验结果表明,小波变换有很好的降噪效果。

  • 针对传统机器学习算法严重依赖手动提取特征的问题,本文对深度学 习技术中的卷积神经网络模型进行优化改进,设计了一个高效的卷积神经网络 E-CNN (Efficient convolutional neural network)用于单导联 ECG 自动分类。 E-CNN能够从同一输入中提取ECG数据的多级特征,可以高效的获得ECG数 据的内部结构特征表示。实验结果表明,E-CNN在ECG分类中获得了良好的 分类性能。
  • 针对二维结构的多导联心电图,本文提出了一个多通道卷积神经网络 MC-CNN (Multi-channel convolutional neural network)。MC-CNN 模型将多导

联ECG数据中的每个导联输入到不同通道中自动提取特征,MC-CNN模型多 通道的设计不仅保证了导联之间数据的独立性,还能够使每个导联找到适合自 己的滤波器,进而提取高质量的ECG特征。实验结果表明,MC-CNN模型在 多导联心电图自动分类方面具有很大的优势。

本文结合心电数据的特点,设计了两种基于深度学习技术的心电自动分类 模型E-CNN和MC-CNN,分别在MIT-BIH心律不齐数据集和PTB心肌梗塞数 据集上进行了验证。实验表明,本文提出的模型不仅解决了手动提取特征的问 题,还能够提取高质量的ECG特征,都获得了不错的ECG自动分类结果。

关键词:ECG小波变换 ,深度学习 ,卷积神经网络

Abstract

Cardiovascular disease is one of the diseases leading to higher mortality, and Electrocardiogram (ECG) is an effective non-invasive diagnostic tool commonly used to screen and diagnose cardiovascular disease. However, due to the large amount of dynamic electrocardiogram data and the limited number of medical experts, the diagnosis of doctors is very arduous. The use of computer-assisted ECG analysis tools can greatly reduce the workload of doctors and improve the efficiency of screening and diagnosis of cardiovascular disease. This paper aims to establish an automatic classification model of ECG data based on deep learning technology combined with the time series characteristics of ECG data. The main research contents of this paper are as follows:

  • For the problem of noise in ECG, which leads to difficulty in feature extraction, this paper uses wavelet transform algorithm to reduce the noise of ECG signal. According to the characteristics of ECG data, the Dauchechies6 (db6) wavelet function is used to decompose the ECG signal into eight layers. Based on this, the reasonable threshold is set according to the noise figure for noise reduction. Finally, the threshold wavelets are processed. Structure, get the ECG signal after noise reduction. The experimental results show that the wavelet transform has a good noise reduction effect.
  • Aiming at the problem that traditional machine learning algorithms rely heavily on manual extraction of features, this paper optimizes and improves the convolutional neural network model in deep learning technology, and designs an efficient convolutional neural network E-CNN (Efficient convolutional neural network) for single Lead ECG is automatically classified. E-CNN can extract multi-level features of ECG data from the same input, and can efficiently obtain internal structural feature representation of ECG data. The experimental results show that E-CNN has good classification performance in ECG classification.

For the multi-lead ECG of two-dimensional structure, this paper proposes a multi-channel convolutional neural network (MC-CNN). The MC-CNN model automatically imports each lead in the multi-lead ECG data into different channels. The multi-channel design of the MC-CNN model not only ensures the independence of the data between the leads, but also enables each The lead finds a filter that suits you and extracts high quality ECG features. The experimental results show that the MC-CNN model has great advantages in the automatic classification of multi-lead ECG.

Based on the characteristics of ECG data, two ECG automatic classification models E-CNN and MC-CNN based on deep learning technology were designed and validated on MIT-BIH arrhythmia dataset and PTB myocardial infarction dataset.. Experiments show that the proposed model not only solves the problem of manual extraction of features, but also extracts high-quality ECG features, and has obtained good ECG automatic classification results.

Key Words: ECG, Wavelet transform, Deep learning, Convolutional neural network

1绪论

1绪论

1.1课题研究背景与意义

心血管疾病是全世界死亡的主要原因⑴。在中国,目前约有2.9亿患有心血 管疾病,且心血管疾病的患病率还不断在上升。常见的心血管疾病包括高血压, 心房颤动,心肌梗塞,心绞痛和心律不齐。大多数心血管疾病是慢性病,患者 的生命体征与健康人的生命体征不同,紧急情况的发生率很高。理想的方法是 为让患者长期住院并提供全天候医疗监测,但普通病人无法承担医院长期监管 的高额费用,并且这样也会浪费医疗资源。因此,我们希望找到一种简单易用 的方法来监测患者的心脏状况。

目前,心电图(Electrocardiogram, ECG)在世界范围内通常用于检查和诊断

心血管疾病。ECG是记录心脏产生的电活动[2],通过测量心脏产生的电活动来 检测心脏的异常,它是一种有效的非侵入性诊断心脏病的工具,适用于各种生 物医学应用,如测量心率,检查心跳节律,诊断心脏异常,情绪识别和生物识 别。对个体ECG搏动的特征形状,形态特征和光谱的研究可以为ECG模式的 自动识别提供有意义的相关临床信息,因此,ECG是诊断心血管疾病的重要依 据。

由于ECG信号的形态和时间特征在不同身体环境下不同患者身上会有明 显的差异[3],有时不同的患者对于相同的疾病具有不同的ECG形态,并且有时 两种不同的疾病可能会具有大致相同的ECG特性。这些问题给ECG的自动分 类造成了一些困难。同时,为了检测心跳的异常,医生必须通过分析每个心跳 的波形来判断患者是否患有心血管疾病。因此,分析长期ECG记录的过程,特 别是临床监测或可穿戴的在线医疗监护,对于医生来说诊断过程花费时间长, 效率低,并且严重依赖于个人经验和医生的水平,因此造成医生诊断任务非常 繁重。随着人工智能技术的发展,使用计算机辅助心电图自动分类可以减轻医 生的工作量,提高工作效率。

近年来,一些研究人员一直致力于心电信号智能处理的研究,并己取得了 较大的进步,但检测精度和检测速度有待提高。使用计算机辅助ECG分析对减 轻医生的工作量、提高工作效率有着非常重要的意义。本文主要基于深度学习 技术并结合心电数据的特点,建立基于深度学习的心电数据自动分析模型,为

心血管疾病的临床自动诊断提供新的思路和新的依据。

1.2国内外研究现状

ECG自动分类系统可分为四个步骤(如图1.1所示),(1) ECG信号预处 理;(2)心跳分割;(3)特征提取;(4)分类。这四个步骤的最终目标是识别 心跳类型。

本小节将主要介绍以下三个部分的研究现状,即:ECG信号的预处理,ECG 信号的特征提取,ECG信号分类的研究现状。

1.2.1心电信号预处理的研究现状

ECG信号是用身体表面上的电极测量并收集的,在收集ECG时,会收集 到各种噪声,例如电力线干扰,基线漂移,肌电噪声,电极运动伪影等[4],这 些无用的信号给ECG自动诊断带来了负面影响。为了正确分析ECG数据,需 要对ECG信号进行预处理,而ECG信号的预处理旨在通过滤波或信号去除伪 像信号,以减少这些无用信号造成的负面影响。

张东辉[5]提出了一种基于离散小波变换的基线漂移校正和去噪方法,利用 Symlet小波函数将心电信号分解为6层,用经验贝叶斯后验中值的小波收缩方 法来减少高频噪声,实验结果发现使用离散小波变换可以获得良好的去噪结果。 MAMneimneh等人^提出了一种自适应卡尔曼滤波器用于实时去除基线漂移, 卡尔曼滤波器能够同时模拟ECG信号和基线漂移,实验结果表明了其提出的方 法失真最小。但由于卡尔曼滤波器的适应性和收敛因子,该方法无法消除高频 变化下的基线漂移。Gordan Cornelia等人W使用小波变换来过滤和分析ECG噪
声,dbl小波、db6小波、sym2小波和coifl小波用于将ECG信号分解成三层, 通过小波阈值处理,消除ECG信号所有相关噪声,实验结果发现使用db6小波 获得的效果最佳。Sayadi和Shamsollahi等人[8]提出了一种新的改进小波变换, 称为多自适应仿生小波变换(Multiadaptive Bionic Wavelet Transform, MABWT),MABWT能够在各种噪声变化下消除ECG信号的噪声,通过使用 MABWT方案,ECG基线的低通噪声干扰效应将作为间接任务被删除,该算法 已被证明优于基于小波的基线漂移消除方法。其他方法也为降噪提供了不错的 结果,如Sameni等人^提出使用非线性贝叶斯滤波器来降低ECG信号噪声。 虽然这些滤波方法目前都有其自身的缺点,但它们基本上可以满足心电信号不 同应用的要求。

1.2.2心电信号特征提取的研究现状

分类算法不能直接处理ECG信号,因为带有噪声的心电信号会影响模型的 特征提取,而提取特征的质量直接影响后续分类检测的结果。如果可以更好地 提取ECG的特征,则将提高模型的分类性能,如果不能有效地提取ECG中的 特征,则将影响分类器的分类性能,所以提取高质量的特征是很有必要的。特 征提取方法可以分为线性方法和非线性方法。

一般来说,线性方法是传统的方法,它是基于时间和频率分析技术线 性特征提取方法包括从RR间期中提取ECG特征_、离散小波变换(Discrete wavelet transform,DWT) [12]、主成分分析法(Principal Component Analysis, PCA) [13]、线性判别分析法(Linear Discriminant Analysis,LDA) [14]等。一些 研究者还提出在应用小波变换后,重用减少特征空间的方法,例如Wang等人[15] 和 Polat 等人[16]采用主成分分析法(Principal Component Analysis,PCA)来减 少由小波系数形成的特征,并且还验证了他们的试验结果有着明显的提高。文 献[16]中使用离散小波变换提取ECG特征,其首先将心电信号分解成频率子带。 然后用主成分分析,线性判别分析和独立分量分析从特定子带提取DWT系数 集合,以减少数据维度。

非线性方法基于最近的混沌和模糊逻辑概念[17]。这些方法只有少数心血管 疾病检测系统在使用,如分形特征(用于描述信号的分形特性)期望最大 化聚类(在统计模型中估计参数)、高阶统计等。例如Sufi F等人@提出的算法 使用期望最大化聚类提取ECG特征,并将50个MIT-BIH心电数据作为输入, 实验结果表明所提出的方法可以成功地检测出心脏异常(例如,心室颤动/颤动, 室性早搏,心房颤动等),这种针对压缩ECG包的创新数据挖掘技术可以直接 从压缩的ECG中更快地识别心脏异常,从而有助于构建有效的远程心脏病学诊 断系统。ECG信号本质上是非线性和非静止的,因此MartisR,]等人使用非 线性动态高阶统计(High-Order Statistics,HOS)技术捕获ECG信号的细微变 化,此研究工作分析了五种类型的节拍:正常,右束支传导阻滞(RightBundle Branch Block,RBBB),左束支传导阻滞(Left Bundle Branch Block,LBBB), 心房早收缩(Atrial Premature Contraction,APC )和心室早搏(Ventricular Premature Contraction,VPC)。提取的双谱特征用主成分分析方法来减少特征维 数。实验结果获得了的准确度是93.48%,平均灵敏度和特异性分别为99.27% 和 98.31%。

1.2.3心电信号自动分类算法的研究现状

一旦从心电数据中提取到特征,就可以使用来自机器学习和数据挖掘领域 的人工智能算法对这些数据构建模型,用于心电分析和分类。其中最常用的算 法有:支持向量机(Support Vector Machines,SVM) [21],人工神经网络(Artificial Neural Networks,ANN) [22]和线性判别(Linear Discriminant,LD) [23],以及具 有 Logistic 回归的储层计算(Logistic Regression,RC) [24]。SVM 是 ECG 分类方 最常用的分类器之一,如Chazal等人^在模拟层次结构中使用SVM来解决 MIT-BIH数据库不平衡问题,并交替每个类别的目标函数(加权SVM),实验 结果表明其方法获得了不错的结果。许多基于ANN的方法也被提出,如Gliler 和Obeyli等人[25]使用组合神经网络从更复杂的交叉验证形式中获得更通用的方 法。线性判别式是Chazal等人^提出的方案,该研究者声称选择线性判别做分 类器是因为它的简单性以及不想强调分类器,而是强调所提出的特征,LD可以 轻松克服训练集的不平衡问题。通过实际系统中使用的各种分类算法表明,对 于从ECG信号中提取的特征进行分类,这些传统的机器学习方法有许多缺点, 例如,需要手动设计特征提取器以从原始ECG信号中提取预测特征,然后将其 馈送到分类器中,该过程耗时且费力,并且在单独的数据集上进行验证时容易 过度拟合。

随着深度学习在计算机视觉中的成功,大量研究者提出了几种随着深度学 习架构来解决自然语言处理(Natural language processing,NLP)任务[26],如机 器翻译[27],学习单词嵌入[28]和文件分类[29],DNN还对语音识别社区产生了巨大 影响™。有趣的是,我们应该注意到NLP和语音识别任务之间的内在相似性是 由于数据的顺序方面,这也是ECG数据的主要特征之一。最近,一些研究者们 努力开发深度神经网络,尤其是用于端到端时间序列分类的卷积神经网络。例 如,实时一维卷积神经网络(1-DCNN)用于基于单导联心电图数据的心律不 齐分类[31],它实现了良好的性能并且计算复杂度低。Rajpurkar等开发了一种基 于34层卷积神经网络的算法用监护仪生成的单导联心电数据来检测各种心 律不齐。研究者表示他们提出的算法检测性能效果比普通心脏病专家的诊断效 果要好。此外,TahsinReasat等人修改CNN架构,使用三个导联ECG信号来 检测下壁心肌梗塞[33]。Yi Zheng等人提出了一种多通道卷积神经网络,用于多 导联ECG信号检测心律不齐,实验结果显示精度达到94.67%[34]。自动识别心 电图的结果只能作为医生诊断的辅助,最终的临床诊断需要由医生手动完成。

1.3论文主要研究内容

本文在计算机辅助心电图智能分析的背景下,采用深度学习技术,对深度 学习技术中经典的卷积神经网络模型进行优化改进,实现了 ECG自动分类。本 文的研究内容如下几个部分:

  • 采用小波变换对ECG数据去噪

针对ECG中存在噪声,导致特征提取困难等问题,本文采用小波变换算法 对ECG信号进行降噪处理。论文根据ECG数据的特性,采用Daubechies6(db6) 小波函数将ECG信号分解为八层,并在此基础上根据噪声系数设定合理阈值进 行降噪处理,最后将阈值处理后的各层小波进行重构,得到降噪后的ECG信号。 实验结果表明,小波变换有很好的降噪效果。

  • 修改传统二维CNN构建一维CNN模型

针对传统机器学习算法严重依赖手工提取特征的问题,本文对深度学习技 术中的卷积神经网络模型进行优化和改进,设计了一个高效的卷积神经网络 E-CNN用于单导联ECG自动分类。E-CNN模型能够从同一输入中提取ECG数 据的多级特征,可以高效的获得ECG数据的内部结构特征表示。通过在 MIT-BIH心律不齐数据集上的实验结果表明,E-CNN在ECG分类中获得了良 好的分类性能。

(3)构建多通道卷积神经网络

多导联ECG数据是同时生产的ECG数据,同时彼此相互独立。因此针对 多导联心电图特殊的二维结构,本文提出了一个多通道卷积神经网络 (Multi-channel convolutional neural network,MC-CNN)模型。MC-CNN 模型

将多导联ECG数据中的每个导联输入到不同通道中自动提取特征,MC-CNN 模型多通道的设计不仅保证了导联之间数据的独立性,还能够使每个导联找到 适合自己的滤波器,进而提取高质量的ECG特征。通过在PTB心肌梗塞数据 集上的实验结果表明,MC-CNN模型在多导联ECG自动分类中有很大的优势。

本文结合心电数据的特点,设计了两种基于深度学习技术的心电自动分类 模型E-CNN和MC-CNN,它们在MIT-BIH心律不齐数据集和PTB心肌梗塞数 据集上进行了验证。实验结果表明,本文提出的模型不仅解决了手动提取特征 的问题,还能够提取高质量的ECG特征,都获得了不错的ECG自动分类结果。

1.4论文结构安排

第一章介绍了本文的研究背景,总结了国内外心电数据自动分类方法的研 究现状,确定了本文的主要内容,并介绍了全文的结构。

第二章介绍心电图的基础知识,包括生成机理和心电图波形组成。然后介 绍了最常见的心电图标准数据库,并确定了麻省理工学院心律失常数据库和德 国计量研究所提供的PTB心肌梗塞数据库作为该实验的主要数据来源和评估标 准。同时还介绍了深度学习技术,深层学习和浅层学习的理论,以及深度学习 网络模型。

第三章主要介绍了心电信号的预处理,包括心电图存在的主要噪声干扰, 肌电干扰、基线漂移、工频干扰、电极接触噪声,还介绍了一种离散小波变换 滤波器方法,并阐述了小波滤波算法原理,最后分析了滤波效果。

第四章针对单导联ECG数据,本文对深度学习模型中的CNN模型进行优 化改进,把二维CNN (2-DCNN)优化修改成1-DCNN,然后基于MIT-BIH 数据库的心律不齐检测设计了 E-CNN模型,最后用实验结果验证了 E-CNN模 型在ECG分类中的有效性。

第五章介绍多导联心电图自动分类算法,首先,对于多导联ECG数据,本 文提出了一个MC-CNN模型,用于心肌梗塞的自动分类检测,并使用Adam优 化器和平衡交叉熵对MC-CNN模型进行了优化。通过在PTB心肌梗塞数据集 上的实验结果表明,MC-CNN模型在多导联ECG自动分类中有很大的优势。

第六章是总结和展望,总结了本文的主要研究工作,并且展望了今后的研 究工作。

2心电自动分类的相关技术理论

对心电图进行自动分类,首先要了解心电图,心电图的理论知识为ECG自 动分类提供了理论依据。传统的机器学习方法采用手动提取ECG特征,这个过 程耗时又费力,严重影响算法的实际应用。因此,为了克服传统机器学习方法 的缺点,本文使用深度学习技术。深度学习技术可以自动提取ECG特征并分类, 从而省去了手工提取特征的环节。、

2.1心电图的基础知识 2.1.1心电信号产生的机理

心脏的生物电变化通过心脏周围的组织细胞和体液反映在人体皮肤表面, 并通过心电图器去收集和跟踪。在ECG信号的正常搏动的情况下,心脏被去极 化以触发其收缩,每个心动周期中的窦房结产生的兴奋以某种方式和时间依次 传递到心房和心室。心电图反映了心脏兴奋的产生、传导和恢复过程。心脏电 活动由两个过程组成,既去极过程和复极化过程,该过程由一系列重复的 P-QRS-T波组成,频率约为1Hz,心电图中的大多数临床有用信息源于其特征

所定义的间隔和幅度。当心脏产生电刺激时,大量的正离子进入膜内,并且心 肌细胞的内部相对于外部变为阳性极,结果,膜电位失去其原始的正常偏振态, 并急剧上升而成为去极化。如果总是处于外负内正的话,心脏将始终处于收缩 状态,这与心脏的功能不一致。因此,外负内正的膜电位必须变回原始状态, 即外正内负的状态,变为外正内负的这个过程就叫膜的复极化,以促进心脏的 下一次收缩。心电图记录了去极化到心肌细胞复极化的过程,客观地反映了心 脏各部位的生理健康状况,它是心血管疾病临床诊断的重要依据,尤其是心律 不齐,对诊断及其后续治疗极为重要。

电极是附着在体表上的实际导电垫。任何一对电极都可以测量两个连接位 置之间的电势差,例如一对形成了的导联。通常,连接到身体的10个电极用于 形成12个ECG导联,每个导联测量特定位置的电势差。导联分为三种类型: 肢体、增强肢体和胸部。12导联ECG总共有三个肢体导联和三个增强肢体导 联,其布置为冠状平面中的轮辐(垂直)(I、II、III、aVR、aVL、aVF),以及 位于垂直横向平面(水平)上的六个胸导联(VI、V2、V3、V4、V5、V6), 具体如图2.1所示。12个导联相对独立,但它们相互之间也具有一定的数据相 关性。其中,加压肢体导联仅作为标准肢体导联的补充。在12个导联中,I、II、 VI、V2、V3、V4、V5、V6 这 8 个导联称为主导联,III、aVR、aVL、aVF 这 4个导联称为辅导联,辅导联也可以由主导联组合而成,八个主要导联是线性 相关的,可以相互合成。

2.1.2心电图波形组成

如图2.2所示,ECG中的完整心跳表示一个完整的心脏周期。在一个典型 的心电图周期中,其特征波形包括:P波、QRS波(Q波、R波、S波)、T波 和U波(心电图中发生的机率为50%-75%)。表2.1显示了各波正常时间宽度 参考范围,每个波段反映心脏不同部位的生理健康状况。在下文中,结合ECG 各波形和心脏电活动之间的对应关系,对ECG图进行详细的解读。

  • P 波

别名心房去极化波,它与心房活动的情况有关。P波形圆钝,振幅小,不 同导联的形状不同,在II导联和VF导联上表现明显。P波的时间宽度通常在

  1. 08s和11s之间,电压(高度)通常在0.22mV和0.25mV之间。
  • PR间期

PR间期是从P波的开始到QRS复合波群的开始,反映了从窦房结到房室 (Atrioventricular,AV)所经过的时间。短于120毫秒的PR间期表明电脉冲绕 过AV节点,如Wolf-Parkinson-White综合征。在PR间期期间诊断出一次性房

室传导阻滞,持续时间超过200ms。PR段通常是完全平坦的,但在心包炎中可 能会下降。如果从心房到心室的传导受到阻碍,则会相应地延长PR间期的时 间宽度。

QT intervaf

图2.2 —个心跳周期

  • QRS复合波

QRS波群由三种不同的波组成,包括Q波,R波和S波。与心房相比,心 室具有较大的肌肉质量,因此QRS复合波通常具有比P波大得多的幅度。正常 人的ECG波群持续时间约为0.10s。在正常心电图中,Q波首先出现,它的特 点是波形下降,振幅小。R波第二出现,波形的幅度相对较大,波形相对较高, 这是QRS波群中最大的波形。S波最后出现,其波形向下,幅度较小但大于Q 波。另外,QRS波群是ECG信号的能量集中区域,但每个波的幅度也有很大差异。如果QRS波群时间宽度超过120毫秒,则表明心脏传导系统被破坏,例 如左束枝传导阻滞、右束枝传导阻滞或心室心跳过速等心室节律。

  • ST 段

ST段连接QRS波群和T波,代表心室去极化的周期。此时,心电信号的 电位基准线是零电位,但可能随着心肌梗塞或缺血而降低或升高。ST段抑郁症 也可由左室肥厚或地高辛引起,ST段抬高可能是因为心包炎,Bmgada综合征 引起,或者也可能属于是正常的变异(J点抬高)。然而,在心血管疾病如心源 性猝死的情况下,即使远离基线,ST段也会显示出明显的波动。

  • T 波

T波代表心室的复极化。除了导联aVR和导联VI之外,它通常在所有导 联中都是正向的,负向T波可能是心肌缺血,左心室肥大,高颅内压或代谢异 常的征兆,而峰值T波可能是高钾血症或非常早期心肌梗塞的征兆。

  • QT 段

QT间期是从QRS波群到T波,可接受的时间宽度随心率而变化,因此必 须通过除以RR间隔的平方根来校正QT。QT间期延长是导致室性快速性心律 不齐和猝死的重要因素。QT段很长可能是由遗传综合征的出现,或作为某些药 物的副作用导致的,在严重的高钙血症中可以看到异常短的QT,时间长度通常 在0.43s到0.44s之间。

⑺U波

U波是出现在T波后,振幅相对较低,如果U波非常突出,怀疑是低钾血 症,高钙血症或甲状腺功能亢进。假设U波是由室间隔的复极化引起的。它通 常具有低振幅,甚至更常见的是完全不存在。

2.2常用的标准心电数据库

在十九世纪60-70年代,心电图数据库没有统一的标准,给心电图自动分 析算法的研究带来了很多不必要的麻烦。然而,ECG自动分类算法性能的判断 需要统一的ECG数据库。最近几年,标准心电数据库成为了国内外医疗机构及 相关公司关注的焦点,各种ECG数据库可公开用以评估ECG信号分类研究中 所提出的方法。以下ECG数据库被广泛用于ECG信号分析中的不同目的:

2.2.1四大标准心电数据库

目前有四个国际公认的标准数据库:MIT-BIH数据库,AHA数据库,QT 数据库和CSE数据库[35]。四个国际公认的标准数据库对比如表2.2所示。

MIT-BIH心律失常数据库(以下简称MIT-BIH数据库)是1975年至1979

年间由美国波士顿医院的47名实验者收集的ECG数据。47名实验对象包括25 名男性和22名女性,其中男性年龄为32-89岁,女性年龄为23-89岁(所有记 录均从同一男性受试者身上收集了两份记录)。MIT-BIH数据库有48个心电图 数据。每组的数据长度约为30分钟,采样率为360Hz,数字分辨率为11位, 在10mV范围内,有650000个采样点,每个记录标记QRS波的位置。每一次 心跳都对应于疾病的类型注释,每组数据包含两个ECG导联,并且在大多数记 录中,主要导联(导联X)是导联II (胸部电极)的修改。另一个导联(导联 Y)通常是导联VI的修改,但在某些记录中,这种导联已知为V2, V5或V4。 通常,导联X用于检测心跳,因为QRS波群在此导联中更为突出。Y有利于 室上性异位搏动和室性异位搏动类型的心律不齐分类。MIT-BIH数据库包括15 种疾病,如室性早搏和房颤,以及心律不齐等。MIT-BIH使用自定义格式保存 文件长度和存储空间。

QT ECG数据库主要是从现有的ECG数据库中选择的ECG记录,其中包 括MIT-BIH ST数据库的6个记录、MIT-BIH心律不齐数据库的15个记录、 MIT-BIH室上性心律不齐数据库的13个记录、MIT-BIH室上性心动过速数据 库的4个记录、MIT-BIH长期数据库、33个欧洲心脏病学会的ST-T数据库记 录、10个MIT-BIH正常窦性心律不齐数据库记录和波士顿贝斯以色列女执事 医疗中心的24个猝死记录。QT数据库涵盖了共105个双导联ECG记录,这些 记录被选择用于防止重要的基线波动或其他伪影,其中所有ECG信号以250个 样本/秒进行釆样。

美国心脏协会使用AHA (American Heart Association)数据库作为室性心律失常检测器的评估,其由美国心脏协会在资助华盛顿大学的资助下产生。AHA 数据库的采样频率为250Hz,其中包括155个ECG记录,每个记录最长可达3 小时。创建AHA数据库主要是为了评估室性心律不齐分类器的性能,然而, 该数据库不区分正常窦性心律与室上性异位搏动。

欧盟建立 CSE (Common Standards for Electrocardiography)通用数据库的目 的是统一 ECG数据的采集、编码和交换,减少不同心电自动分析程序之间的不 同,同时为心电信号的自动分析和诊断提供评价依据。CSE数据库包含1000 个短期心电图记录,其中包含12或15个导联。数据库的数据采样频率是记录 长度,适用于静态心电图测量分析程序的开发。

2.2.2 PTB心电数据库

联邦物理技术研究所(Physikalisch-Technische Bundesanstalt,PTB)成立

于1887年,是世界著名的测量和测试研究所,隶属于德国联邦经济和劳动部。 德国计量研究所提供的数字PTB ECG数据库旨在为ECG算法分析提供研究, 验证和教学服务。数据由柏林本杰明富兰克林医学科学院的心脏病专家收集, 收集290名受试者的PTB心电图诊断数据库(受试者的诊断分类统计数据见表 2.3 中)。

PTB心电诊断数据库中从每个受试者中采集1到5个ECG数据,每个记录 持续大约2分钟。每个ECG记录是根据16位的采样精度和1000Hz的采样率 进行量化,每个采样值为2个字节。每个记录由15个同时测量的信号组成,即 3 个 Frank 导联(vx,vy,vz)和传统的 12 个导联(i,ii,iii,avr,avl,avf, vl, v2, v3, v4, v5, v6)〇

2.3深度学习技术

机器学习不仅为人类的生活带来了便利,还驱动了当前许多研究领域的发 展。随着大数据时代的到来,大数据让机器学习模型变得越来越有吸引力。为 了从大数据中获取有价值的知识和信息,然后根据人类的需求并做出适当的决 策,机器学习技术被认为是一种强有力的解决方案。作为机器学习最热门的子 领域,深度学习己成为了大数据和智能分析检测模型之间的桥梁。

2.3.1深层学习和浅层学习

传统的机器学习方法通常包括以下关键组成部分:手工设计特征,特征提 取/选择和模型训练。但是,手动设计复杂领域的特征需要大量的人工实验室去 在线更新,这可能会阻碍最终整个系统的表现。而且,传统机器学习模型通常 有一层隐藏层或没有隐藏层,这都是浅层机器学习,如支持向量机(Support Vector Machines,SVM)、最大熵方法(如LR、逻辑回归)和Boosting等。这 些模型不能够有效的利用大数据,因此,在这个时期浅层人工神经网络比较沉 寂。而深度学习技术不用手动提取特征,它通过构建具有多层非线性变换的深 度神经网络自动的从输入数据中去学习数据的内部结构特征表示[36]。直观地说, 一层操作可以被视为从输入值到输出值的转换。因此,每一层网络都可以从输 入数据中学习到新特征表示。而多层的堆叠结构能够使深度学习网络模型从简 单的原始输入概念中学习更复杂的概念。

深度学习技术有很多优点,首先,深度学习技术可以提高模型的计算能力。 随着图形处理器单元(GPU)和更好的软件基础架构(如Tensorflow)的出现, 不仅降低了硬件成本,还加快了网络的连接,这都大大减少了深度学习算法所 需的运行时间。例如,根据Raina等人可知,学习具有1亿个自由参数的四层 深度置信网络(DeepBeliefNetworks,DBN)所需的时间可以从几周减少到大 约一天[37]。其次,深度学习技术可以增加网络训练的数据量。无可置疑,随着 大数据时代的到来。人们的日常生活几乎是无法通过计算机和传感器记录的, 通过互联网连接并存储在云中。正如Yin等人所说的那样,在工业信息学和电 子学等工业相关应用中,每年产生近1000万字节,并且在未来十年内,数据的 增长量预计可以增加到20倍[38]。像CHEN等研究人员预测到2020年将有300 亿台设备连接起来。因此,大量数据可以降低深度学习背后的复杂性,提高深 度学习模型的泛化能力。无人监督的预训练方法是深度学习获得的第一次重大突破,其中Hinton提出用受限玻尔兹曼机(Restricted Boltzmann Machine, RBM)

一层一层的对网络进行训练,然后利用误差反向传播算法(Back Propagation, BP)对网络模型进行微调,这已经被证明对多层神经网络的训练是有效的[39]。 这些优势都促进了深度学习的研究。

2.3.2深度网络模型的学习过程

从模式识别的早期开始,研究人员的目标是用自动学习数据特征的多层网 络代替手工设计特征的网络,但直到20世纪80年代中期,神经网络模型才被 广泛了解。深度神经网络被认为是复杂的机器学习模型[4G],这些网络旨在学习 数据的层次表示。多层深度网络模型结构可以使用随机梯度下降算法进行模型 训练,而梯度下降优化算法通常使用反向传播去计算损失函数的梯度来调整神 经元的权重。反向传播是一种称为自动微分通用技术的特例,它是一种用于人 工神经网络的方法。反向传播也是“损失向后传播”,损失在输出端计算并在整 个网络层中向后分布。反向传播的过程只不过是导数链规则的实际应用,可以 重复应用反向传播算法以从模型输入传播到模型输出的所有模块。使用反向传 播算法计算梯度要求模型的内部参数是相对统一化的,在20世纪70年代和80 年代,几个不同的研究团体发现了反向传播算法不仅可以做到内部参数是相对 统一化,并且还证明此方法的有效性。

深层神经网络由L层组成,每层都被认为是输入域的表示[41]。层^包含多 个神经元,其中i e 1...L,它们是计算每层输出元素的小单位。层M魯其先前一 层^^的输出用作下一层的输入,并应用非线性激活函数(例如tanh函数)来 计算其输出。这些非线性变换的行为由每层的一组参数&控制,在深度神经网 络中,这些参数称为权重,它将来自前一层的输入连接到当前层的输出。因此, 给定输入X,神经网络执行以下计算来预测输出类别:

= /l-i(^L-1^/l-2(^L-2/"v/i(^1^)))                                       (2.1)

其中久是^层使用的非线性函数,该过程也称为前向传播[42]

在训练期间,深层神经网络呈现大量已知输入输出(例如数据集D)。首先, 权重随机初始化,然后使用模型的前向传播:输入x的输出用激活函数/去计 算,并输出每个类别的概率,然后使用损失函数计算模型的预测损失。最后,梯 度下降算法用于更新反向传播中权重。因此,通过迭代采用前向传递然后反向 传播,以最小化训练数据损失的方式来更新模型的参数。结果证明,深度学习
模型非常适合于发现高维数据中的复杂结构,因此适用于许多领域的学科。深 度学习模型不仅在图像识别和语音识别中获得令人惊讶的结果[43],而且它还在 预测潜在药物成分方面超越其他机器学习算法。

相信深度学习很快将会在很多领域获得成功,因为它不需要手动提取特征, 让模型自动学习数据特征,这不仅提高了模型精度,而且还节省了繁琐的步骤。 目前深度神经网络还在不断的开发和研究新学习算法和架构,这只会加速深度 学习的进展。 2.4深度学习网络模型

传统的机器学习技术在处理原始数据方面受到限制。而深度学习技术不用 手动提取特征,它通过构建具有多层非线性变换的深度神经网络自动的从输入 数据中去学习数据的内部结构特征表示。深度学习技术经过多年的发展,在许 多领域取得了重大的成就,而且针对特定的问题,越来越多的算法被提出,发 展到目前为止,深度神经网络形成了不同的模型,其中应用最广泛的模型就是 卷积神经网络模型。

2.4.1全连接神经网络

全连接神经网络(Fully Connected Neural Network,FCNN)是深度学习模

型中最简单、最传统的网络,因为^层中的神经元与~4层中的每个神经元相连 接,其中ie[l,L],这些连接由神经网络中的权重构成。将输入的时间序列X 应用非线性变换的一般形式可以在以下等式中看出:

A = /(〇) + b)           (2.2)

0)是一组权重,长度和维数与X相同,b是偏差项,4是神经元经过非线性变换 的输出,/是激活函数。

对于ECG检测,最后一层通常是一个判别层,它将前一层的输出作为输入, 并给出数据集中类别的概率分布。用于ECG检测的大多数深度学习方法将在全 连接层用softmax作为激活函数,并且神经元的数量等于数据集类别的数量。 softmax函数的定义如下:

eA*〇)j+bj

其中fy表示在数据集k个类别中x等于类y的概率。每个类y的权重集%•(和对应的偏差与层中的每个先前激活相关联。

使用最小化损失函数的优化算法自动学习等式2.2和2.3中的权重参数。为 了估计某一给定权重值的误差,应定义一个量化该误差的可微分损失函数。在 深度神经网络中,分类任务最常用的损失函数是分类交叉熵,定义如下:

KX^-Y^YjlogYj            (2.4)

i表示对输入时间序列x进行分类时的损失。同样,对整个训练集进行分类时 的平均损失可使用以下公式定义:

_=试=1队)                  (2.5)

用Q表示网络要学习的一组权重(在这种情况下,权重来自等式2.2和2.3)。 为了最小化损失函数,使用梯度下降法学习权重0,该方法使用以下公式定义:

⑴                               (2-6)

用a表示优化算法的学习率。通过减去偏导数,模型实际上是自动调整参数0), 以便在非线性分类器的情况下达到y的局部最小值。需要注意的是,当偏导数 不能直接计算某一参数0)时,采用了导数链规则,这实际上是反向传播算法的 主要思想[44]

对^^层和^层而言,层的任何节点都连接到第〇层的所有节点,如图2.3 所示。也就是说,当第〖馮的每个节点执行计算时,激活函数的输入是层所 有节点的加权。完全连接是一种很好的模式,但是当网络非常大时,训练速度 非常慢。

2.4.2卷积神经网络

在处理深度学习任务时,通常建议在原始输入上训练和运行模型,而不是 像传统机器学习方法手动提取特征,这样做是因为对原始输入训练过的网络可 以学会自己提取这些特征,与手动提取特征相比,它还可以在网络改进时进一 步优化特征提取。因此,如果输入一个1920X1080像素的图像,则将输入层的 神经元个数大约需要六百万个,再加上隐藏层,整个网络将拥有大量神经元。 并且网络必须对这些参数进行优化,因此训练过程可能会消耗大量存储空间和 时间。为了解决这个计算问题,多伦多大学的LeCun教授和他的同事们在1989 年一起合作提出了 卷积神经网络(Convolutional Neural Networks,CNN)。CNN 隐藏层中的每个神经元仅与前一层中的少量神经元相连接(局部连接),其主要 用来减少网络的参数量。

自AlexNet在2012年赢得ImageNet竞赛以来[25],CNN在不同领域已经有 了很多成功的应用[4Q],例如在图像识别上达到人类水平[26],以及不同的自然语 言处理任务[27]。卷积神经网络的设计主要是用于处理出现在多个阵列中的数据, 例如由三个颜色通道的二维矩阵组成的彩色图像。许多数据模式釆用多个数组 的形式,如信号、语言序列等使用1-D矩阵,图像或音频谱图使用2-D矩阵, 和视频或体积图像使用3-D矩阵。CNN背后有三个关键概念:既局部连接,权 重共享,降采样。

典型的CNN架构由一系列阶段构成,如图2.4所示,前几个阶段包括两种 类型的层:卷积层和池化层。卷积层中的神经元值在特征图中获得,其中每个 神经元通过卷积核连接到前一层的特征平面。然后,局部加权和输出结果通过 非线性激活函数,如ReLU。首先,在诸如图像的像素矩阵中,矩阵中的像素 值是高度相关的,因此,检测的局部模式很容易被创建。其次,对于矩阵中的 位置,图像和其它像素值的局部统计是不变的。因此通过检测像素矩阵中的不 同部分的相同大小的像素块来共享相同的权重。

尽管卷积层主要是对前一层的输出进行局部连接来提取特征[6Q-62]。由于所 形成的特征的相对位置可以稍微变化,所以池化层主要是将语义相似的特征组 合成一个,并可以通过粗粒化每个特征的位置来完成对像素块的检测。目前主流的方法最大池化(Max-pooling)和均值池化(Mean-pooling),Max-pooling

是取局部接受域中值最大的点[47],Mean-pooling是对局部接受域中的所有值求 平均[48]。堆叠两个或三个阶段的卷积、非线性激活函数和池化层之后,然后是 完全连接层。CNN网络通过反向传播算法逐渐的对所有滤波器组中的权重进行 训练[49]。深层神经网络是一种复合层次结构,通过合成底层神经网络可以获得 更高层次的特征[36]

2.5本章小结

本章首先介绍了 ECG信号的基础知识,包括生成机理、ECG波形组成。 然后介绍了最常见的心电图标准数据库,并确定了麻省理工学院心律失常数据 库和德国计量研究所提供的数字PTB ECG数据库用作该实验的主要数据来源 和评价标准。还介绍了深度学习技术,深层学习和浅层学习的理论,以及深度 学习网络模型。

3心电信号的预处理

在记录心电图时,也会记录下心电图伴随的各种噪声,这些噪声给ECG的 自动分类带来了困难。为了正确分析ECG数据,对ECG信号进行预处理,从 ECG彳目号中去除伪像柄号是很必要的。本文米用小波变换对ECG进行去噪, 因为小波变换可以同时提供心电信号的时域和频域信息,非常适合处理非平稳

信号。

3.1心电信号的干扰

ECG信号是人体心脏表面的电活动。它通常很弱并且是毫伏级别。它容易 受到外界的干扰,振幅为10|iV-5mV,频率范围为0.05Hz-100Hz,对环境非常

敏感。由电极直接收集和记录的ECG信号经常受到各种噪声干扰。如果这些原 始信号直接用于ECG分类,则由于存在的各种噪声,分类的准确性将降低。因 此,在处理ECG信号之前,通常需要在执行后续分类之前对原始信号执行滤波 操作。ECG信号中有以下主要几种噪声源:

3.1.1工频干扰

工频干扰主要是由电源系统电源产生的电磁场和心电图仪与人体形成的回 路引起的。工频干扰的最高幅度可达到ECG信号最大幅度的50%。工频干扰 是ECG信号中常见的干扰类型,工频干扰频率约为50Hz,干扰幅度随时都可 能会发生改变,这种干扰是很难彻底消除的,因此它针对的是电源频率。消除 干扰不仅需要对硬件电路进行过滤,还需要使用软件进行过滤。图3.1显示了 带有工频干扰噪声的心电图[5Q]

3.1.2基线漂移

基线漂移是指ECG基线随时间由电极到皮肤极化期间电压的变化、电极运 动、呼吸运动或身体运动引起的。在各种噪声中,基线漂移信号具有最大的影 响。基线漂移的频率大约为〇.〇5Hz-2Hz,其幅度可达到心电图的15%[51]。基线 漂移是一种低频干扰,频率范围通常小于1Hz,且大部分都集中在0.1Hz。它可 以被视为与施加到ECG的呼吸频率相同的正弦分量。基线漂移通常出现在ST 段和Q波附近,因此消除基线漂移噪声是很有必要的。产生基线漂移的原因有 很多,其中肢体运动,患者呼吸运动和采集期间电极活动的变化可能导致基线 漂移。图3.2显示了具有基线漂移噪声的心电图。

肌电干扰是无法控制的震颤,特别是在残疾人,儿童,老年人受试者中很 常见,由于他们在测量心电期间担心心电图程序所表现出的肌肉紧张。人体表 皮内部和外部存在30nw的电势差,在人类进行运动时这种内外皮肤电势差会 逐渐改变。例如,当皮肤被拉伸时,皮肤电位为25mv,降低的5mv电势差就 是因为存在的肌电干扰引起的变化。大量不规则的高频电干扰通常会在当患者 受到外界刺激时产生。肌电干扰频率范围通常在2到500Hz之间,波形通常变 化速度快,波形极不规则,持续时间约为50ms,光谱特性接近白噪声。图3.3 显示了具有肌电噪声的心电图[5()]

图3.3含肌电干扰的心电图

3.1.4电极接触噪声

由于测量电极和人体皮肤之间的接触,产生瞬态干扰现象,这被称为电极 接触噪声。因为人体在ECG测量的过程中是变化的,所以导致了电极和人体的 一直接触和分离。这种噪声的幅度一般是采集装置最大输出的电压值,经常在 一秒后开始衰减,表3.1显示了各类噪声典型的参数。

3.2基于小波变换的ECG噪声处理

ECG信号中的一个心跳周期由P-QRS-T波组成。当记录ECG信号时,记 录多种噪声,例如:基线漂移,电力线干扰,运动伪影,这些噪声可能使临床 诊断非常困难,为了正确分析ECG,必须对ECG信号进行去噪,从信号中去 除噪声的过程称为去噪。由于相关噪声源的非静态特性及其与所需ECG信号的 频谱重叠,传统去噪方法的效果不能产生令人满意的结果。小波变换可以同时 提供ECG信号时域和频域的信息,非常适合处理处理像ECG这样的非平稳信 号,在信号处理领域它通常被誉为“显微镜”。事实上,傅立叶变换可以看作是 连续小波变换的一种特殊情况,其主要的区别在于小波变换在时间和频率上都 是局部化的,而标准的傅立叶变换只在频率上局部化。小波变换大致分为三类: 连续,离散和多分辨率,小波变换中的离散小波变换(Discrete wavelet transform, DWT)可以提供良好的时间和频率分辨率,并能够以不同的比例或分辨率解读 ECG中隐藏的复杂性。因此本文采用DWT滤波器来实现对ECG噪声的滤除。

3.2.1离散小波变换理论

小波变换是小波函数IKO与信号的卷积,正交二元离散小波与缩放函 数cp〇〇相关联,缩放函数可以与信号进行卷积以产生近似系数&离散小波变 换公式可以写成:

= £1尤(0小%71(0办        (3.1)

其中:T被称为尺度和位置指数(m,n)的小波系数。

通过选择正交小波基(PwJt),标度m和位置n处的信号的近似系数可以表 示为:

Sm,n — f—〇〇Xt)(pmnt)dt (3.2)

离散输入信号具有有限长度W,其是2的整数次幂:Af = 2'因此,可以 研究的标度范围是0〈m〈M。信号的离散近似可以表示为:

x〇(t) = xM{t) + ^=1 dm{t)               (3.3)

其中M的平均信号近似值为:

^m(0 ^M,nVM,niP)             (3.4)

有限长度信号对应于标度指数m的细节信号近似被定义为:

dm{t) — TiU=Q Tmncpmn(J:)                 (3.5)

特定尺度的信号近似是较低尺度的近似和细节的组合:

尤m⑴=x7n-l(0 _ 心⑴            (3.6)

如果选择标度m=3,信号近似则由下式给出表明:

^3(0 = ^〇(0 - di(0 - d2{t) - d3(t)                                        (3.7)

原始信号在每个步骤连续剥离的高频信息(包含在<(〇内),这被称为使用小 波变换信号的多分辨率分析。

3.2.2小波去噪算法的关键问题分析

  1. 小波函数的选取

大量的小波函数提供了丰富的空间,在该空间中搜索小波,该小波将非常 有效地表示在各种各样应用中的信号。有几种小波基函数,MATLAB数据分析 平台提供了八种,常用的小波函数有Biorthogonal小波,Coiflet小波,Haar小 波,Symmlet小波,Daubechies小波等。对于小波函数的选择没有一个通用的 标准,很大程度上取决于应用。Haar小波算法具有易于计算和易于理解的优点。 在实验中,daubechies6 (db6)小波函数用于分析MIT-BIHECG数据库。因为 db6小波的缩放函数类似于ECG的形状。

  1. 小波分解的层数

小波信号分解具有迭代过程,ECG信号在时间和频率上被分解成更精细的 分辨率信号。确定小波分解层数的数量是计算效率和滤波效果之间的平衡[52]。 首先,从“母”小波和与该小波相关联的缩放函数创建两个对称滤波器,这些滤 波器将提供正交基,在每个迭代步骤中划分信号频谱并产生高频和低频信号。 在下一个迭代步骤之前,这些信号被抽取。图3.4显示了 ECG信号的小波分解 过程,其中D框表示由低通滤波器(Low Pass Filter,LPF)获得的低频分量, 并且S框表示由对称高通滤波器获得的高频分量(High Pass Filter,HPF)。本 文处理的数据来自MIT-BIH ECG数据库,此数据库的采样率是360Hz,根据奈 奎斯特采样定理,ECG的最高频率是180Hz[52],使用db6小波函数将其分解为 8层。

3.2.3滤波效果分析

小波分解重构去噪方法主要根据小波变化的特点对原始信号进行分解,并 将ECG信号逐步分解为高频信息和低频信息。低频信息也称为尺度系数,是 ECG信号中变化缓慢的部分,在原始信号中和轮廓部分相对应[53]。高频信息也 称为小波系数,是ECG信号变化快的部分,在原始信号中和细节部分相对应[52]。 假如在分解之前或分解时,噪声和有效信号占用的频带是确定的,那么可以选 择频带来消除噪声,或者可以将信号占用的频带直接用于重建,并且重建图像 是去噪彳目号。

图3.5显示了 ECG信号的细节,使用db6小波将ECG信号分解为八层。 层1和层2的细节系数包含大部分高频噪声,而层8的近似系数包括基线漂移。 基于此,我们将层1和层2的细节系数(即高频系数)设置为0和8层近似系 数(低频系数)设置为0。在3到7层中,小波阈值被应用于小波系数上进行 噪声过滤处理。在上述步骤处理后,通过小波逐步对每个尺度的小波系数进行小波重构,重建后,我们可以得到噪声去除后的ECG信号。降噪后的ECG如 图3.6所示,通过与原始信号和信噪比进行比较,可以清楚地观察到获得了良 好的结果。图3.5 db6小波对ECG分解8层图

3.3本章小结

本章首先介绍了四种类型的噪声,包括肌电干扰、基线漂移、工频干扰和

电极接触噪声。小波变换中的离散小波变换可以为ECG提供良好的时间和频率 分辨率,并且可以解释不同尺度或分辨率下ECG隐藏的复杂性。因此本文采用 DWT滤波器来实现对ECG噪声的滤除。首先,使用Daubechies6 (db6)小波 将ECG信号分解为八层,其次,根据噪声系数设定合理阈值进行降噪处理,最 后,将阈值处理后的各层小波进行重构,得到降噪后的ECG信号。实验结果表 明,小波变换有很好的降噪效果。

4基于单导联心电数据的自动分类算法E-CNN

神经网络模型的训练需要大量的数据集,当输入数据量增加时,模型需要 增加神经元的个数来提高分类精度。而全连接神经网络会随着输入数据维度的 增加以及隐藏层神经元数量的增加,导致网络参数增加,进而影响网络模型的 训练速度。因此,本文选用卷积神经网络,它局部连接的方式和参数共享的特 点,减少模型的参数量,加快了模型的训练速度。一个导联的ECG数据相当于 1-D时间序列,因此,本文对深度学习技术中的卷积神经网络模型进行优化改 进,设计了一个有效的卷积神经网络E-CNN用于单导联ECG自动分类。E-CNN 模型能够从同一输入中提取ECG数据的多级特征,可以高效的获得ECG数据 的内部结构特征表示,从而提高模型的分类精度。

  • 一维卷积神经网络模型

CNN是一种经典的、被广泛应用的深度学习网络结构,它的局部连接、权 重共享和池化操作能够有效地降低网络的复杂性,减少模型训练的参数量。CNN 模型具有很强的鲁棒性和容错性,对平移、失真、缩放具有一定的不变性,易 于训练和优化网络结构。基于CNN模型自带的这些优越特性,它在信号和信息 处理等各种任务中都要优于全连接神经网络[54]

通常CNN被设计成二维结构用于图像识别,对于一维ECG时间序列信号, 需要对二维卷积核进行调整。在卷积层里,卷积核均由大小为lxX的一维卷积 核组成,并与上一层的输出进行卷积,池化层的滤波器也相应的改成1-D的, 通常是1X2。

  • 1-D卷积层

1-D卷积层是执行1-D卷积和激活的层,它的功能是从输入中提取特征。 与2-D图像类似,1-DECG的局部变化高度相关,表明可以通过卷积层检测 到显着特征。输入的特征图与1-D卷积核进行卷积,并通过非线性激活函数以 生成输出的特征图。此外,激活函数是把非线性引入到特征图里面。假设第Z 层是1-D卷积层,并且<是它的第y个1-D特征映射的输出,则计算操作可以 描述为:

其中,*表示1-D卷积运算,每个内核与输入特征图进行卷积运算以生成更高 级别的表示;%是相应的参数偏置;•表示X;与前一层输出之间的连通性;/(〇 是产生非线性的激活函数,这里采用Leaky ReLU函数,它被称为深度学习结构的有效激活功能,是ReLU的一个改进版本来解决这个问题,可以加速训练 过程,它的函数公式如下:

其中a是固定的一个常量,Leaky ReLU激活函数通过保留负轴上的一些值来 校正数据的分布,这样负轴上的信息值就会避免全部的丢失。

  • 1-D池化层

1-D池化层也称为1-D子采样层,因为它通常通过特定因子对输入要素图 进行子采样。目的是降低输入时间序列的分辨率,并使其对先前学习的特征的 小变化具有鲁棒性。因此,池化层可以通过汇聚特征来增强失真的不变性。最 简单但最流行的方法是计算不同位置的每个邻域的平均值有或没有重叠。通常 通过将输入特征映射分成等长(大于1)子序列来构造邻域。另一种广泛使用 的方法是Max-pooling,这是计算邻域中的最大值。一些研究声称[55], Max-pooling优于像素分类的Mean-pooling,并且通过选择提高泛化性能的优异 不变特征,还可以带来更快的收敛速度。因此,为了进一步提高性能,在本论 文中采用Max-pooling策略,1-D最大值池可以表示为:

(4.3)

其中是池化的窗口大小,5*是池化的步长,n是特征映射的兀素索引。函 数max (■)用于计算合并窗口的最大值。在本论文中,所有池化层的= 5。换 句话说,采用非重叠池化。

4.2基于E-CNN模型的心律不齐自动分类 4.2.1数据预处理

使用MIT-BIH心律失常数据集进行ECG自动分类检测,MIT-BIH数据集 中的ECG节拍根据AAMI标准分为五种标签,即N (正常或者束支传导阻滞心 拍)、S (室上性异常心拍)、V(心室异常心拍)、F (融合心拍)、Q (未分类的心拍) 五大类。本文使用II导联上的ECG数据。在ECG数据馈送到模型之前,本文
使用db6小波变换对ECG数据去噪,然后再用Z分数归一化对每个分段进行归 一化以解决振幅缩放的问题,以消除偏移的影响。最后,将每组数据以R峰为 中间点,向两端共取360个采样点作为一个数据样本。

4.2.2 E-CNN模型结构

根据MIT-BIH心律不齐数据集,本文优化和改进了深度学习技术中的卷积 神经网络模型,设计了一个有效的卷积神经网络E-CNN用于单导联ECG自动 分类。E-CNN能够从同一输入中提取ECG数据的多级特征,可以高效的获得 ECG数据的内部结构特征表示。E-CNN的基本结构如图4.1所示,E-CNN模型 由三个卷积层组成,卷积层之后是批量归一化层(BatchNormalization,BN)、 “Leaky Relu”激活函数和最大池化层(Max-pooling)。由于前三个卷积层被 设计用于学习每个导联之间的特征,因此每个卷积层具有尺寸为1 XK的N个 滤波器。每个卷积层使用了不同大小的滤波器,这使得E-CNN模型能够以多个 空间分辨率查看ECG信号,能够从同一输入中提取多级ECG特征,可以高效 的获得ECG数据的内部结构特征表示。E-CNN模型滤波器大小从1到5变化, 每层的pooling采用尺度为1X2的最大池化操作,步长均为2,具体结构如表 4.1所示。在通过多个卷积层和池化层提取特征图之后,所有特征图用两个全连 接层(Fully Connected, FC)连接,并且,每个全连接层之后都有一个BN层。最后使用softmax逻辑回归(softmax regression)输出五个类别。

输出

五种分类
图4.1 E-CNN的结构图

从结构图中可以明显看到除了输出层之外,每个层之后都使用了 BN层。 全连接和卷积层的输出一般是一个对称,非稀疏的一个分布,在训练期间导致后 一层的输入数据分布的变化,该问题的解决方案是基于训练样本与目标样本的 比率来校正训练样本。在非线性映射(激活函数)之前使用的BN可用于归一 化每个输入信号的均值和方差,以产生更稳定的分布。同时,在E-CNN模型中 使用Leaky ReLU作为激活函数,Leaky ReLU活函数不仅不会导致“dying Relu”的问题和过度拟合现象,还会加速模型收敛速度。

4.3实验与结果分析 4.3.1实验平台与评价指标

在机器学习方法中,通常使用精确度(Acc)、灵敏度(Sen)和特异度(Spec)

来评估算法的性能,基于表4.2的混淆矩阵,具体定义如下所示

  • Acc表示算法检测到患病样本和无病样本总数占总样本数量的比率, 该算法检测出样本真实情况的能力越强,Acc就越高。

A         TP + TN

A = __________________

~ TP + FN + FP + TN

(2 ) Sen表示该算法对该疾病的检测能力,本算法检测此类疾病的能力 越强,Sen就越高。

TP

Sen =------- (4.5)

TP + FN

  • Spec表示该算法检测无病样本的能力,本算法检测无病的能力越强, Spec就越高。

TN

Spec =------ (4.6)

FP + TN

其中 TP (true positive )、FP (false positive )、FN (false negative )、TN (true negative )

分别是属于该类且被分类器分为该类的样本数,不属于该类但被归类为此类的 样本数,属于该类但被归类为不属于该类的样本数,不属于该类,并被归类为 该类的样本数。 4.3.2结果与分析

在这项工作中执行了批量大小为10的标准反向传播算法。正则化,动量和 学习速率参数分别设置为0.2,3xl0_4和0.7,相应地调整这些参数可以使模型 获得最佳性能。这些参数的功能如下:

  1. 正规化:防止数据过度拟合。
  2. 动量:控制网络在训练期间学习的速度。 C)学习率:控制模型的学习速度。

Predicate label

这项工作采用10倍交叉验证策略,将心电数据分成10份,9份作为训练 数据,1个作为测试数据,交叉验证重复10次试验,每次试验都会得出相应的 评估结果精确率、灵敏度、特异度。最后,将10个结果的平均值用作算法整体 性能的估计值。

原始的心电数据有噪声,所以本文先使用db6小波变换滤波器对ECG信号 去噪,获得去噪后的数据。原始数据和去噪后的心电数据的混淆矩阵分别列于 图4.2和图4.3中。从表4.3中可以观察到,在原始数据上的实验结果中,大约 93.56%的ECG心跳被正确地归类为健康的标签。同样,对于心律不齐,总共 98.60%的ECG心跳被正确地归类为心律不齐。类似地,98.84%的心电图节拍 被正确分类为正常ECG心跳,95.62%被正确地分类为心律不齐。E-CNN模型 对原始心电图数据的准确度、灵敏度和特异性分别达到了 95.21%,98.40%和 93.56%。此外,E-CNN模型在去噪后的ECG数据上准确度获得了 96.59%,灵 敏度和特异性分别达到了 98.84%和95.62%。此外,还表明去噪后的ECG数据 在E-CNN模型上获得较好的表现。

为了验证E-CNN的有效性,与Acharya等人[56]提出的CNN模型进行对比 (见表4.3 )。在Acharya等人提出的方法中,首先是以R峰为检测中心,将ECG 信号分割成360个采样点,同时使用db6小波滤波器进行去噪,Z分数归一化 方法对每个样本数据进行归一化处理。网络结构有8层,既3个卷积层,3个 池化层以及2个全连接层。在原始数据和去噪后的数据上的准确率分别是 93.47%和94.03%。对于本文提出的E-CNN模型,在原始数据和去噪数据上对 应的分类准确率分别是95.21%和96.59%,表明去噪后的效果较好。对比可知, 不管是在原始数据上的试验结果,还是在去噪数据上的实验结果,E-CNN模型 取得的结果均优于Acharya等人提出的CNN模型结果,也验证了本文算法的有 效性。

尽管如此,本文在原始ECG数据和去噪后的ECG数据上都取得了不错的结果。 因此,这也证明了本文提出的方法对噪声具有鲁棒性。

4.4本章小结

本章主要对深度学习模型中的CNN模型进行优化修改,设计了一个高效的 一维卷积神经网络模型E-CNN,用于单导联ECG自动分类。E-CNN模型的每 个卷积层由不同大小的滤波器组成,能够从同一输入中提取ECG数据的多级特 征,可以高效的获得ECG数据的内部结构特征表示。通过在MIT-BIH心律不 齐数据集上的实验结果表明,E-CNN在ECG分类中获得了良好的分类性能。 E-CNN模型在原始数据和去噪数据上的分类准确率分别达到了 95.21 %和 96.59%。与其他一维CNN结构相比,本章设计的E-CNN在ECG分类中有较 好的表现性能。

5基于多导联心电数据的自动分类算法MC-CNN

多导联ECG数据是同时在时刻不同位置生成的数据,具有一定的相关性, 但数据之间彼此独立。如果将多导联心电数据输入到单通道卷积神经网络中, 则无论如何对卷积核进行设计,都只能实现对部分导联数据的卷积融合。本文 提出了一个多通道卷积神经网络模型,通过将每个导联输入到不同的通道,每 个通道使用不同的滤波器,经过训练,使每个导联都能够找到适合自己的滤波 器自动提取ECG特征,进而提高模型的分类性能。同时还釆用Adam优化器和 平衡交叉熵对模型进行优化,最后在PTB心肌梗塞数据集上进行了验证。

5.1多通道卷积神经网络

传统的二维卷积神经网络通常在行和列方向上执行卷积计算,这应用在图 像是非常合理的。当应用于多导联ECG数据时,那么不同导联(列方向)在相 同时间段内(行方向)内的ECG数据就会进行卷积,如下面的图5.1所示,由 于导联中的数据是时间相关的,因此使用卷积计算是合理的。但是两个不同导 联之间是相互独立的,使用卷积计算是不合理的,要执行卷积计算,最佳做法 是使用不同导联的不同组合。但是,导联之间的数据是独立的,无论如何设计 卷积核,都只能实现部分导联组合的卷积计算。

本文希望通过数据集的训练,每个导联都可以找到最合适的滤波器。因此, 本文基于传统CNN模型,设计了一种多通道卷积神经网络模型(Multi-channel convolutional neural network,MC-CNN),如图 5.2 所示。MC-CNN 模型通过使

每个ECG导联输入到不同的通道中,每个通道使用不同的滤波器(这意味着每 个ECG导联相互独立),经过训练,使每个导联都能够找到适合自己的滤波器 自动提取ECG特征。最后,将每个通道学习的特征展平,并将所有特征输入到

完全连接层以进行分类。MC-CNN模型每个通道的卷积单元由多个卷积/池化 特征面组成,这些特征面由多个卷积单元学习。

设输入样本x =         ,其中&是ECG信号第/个时刻的值,n是时

间序列X的长度。这里设卷积核的大小为1x K,卷积计算过程如下所示:

& 卜 /㈨+K!:xd)                                  以1)

这里/if是第丨层第Z个神经元的输出,¥2:^表示第丨-1层第i + n _ 1个 神经元的输出,wg表示第!层的第fc个卷积核的参数权值,〜表示第Z层第7' 个神经元的参数偏置,/(■)是激活函数。

通道

5.2基于MC-CNN模型的心肌梗塞自动分类 5.2.1数据预处理

3个Frank导联(vx,vy,vz)。因为数据集中有大多数患者患有前壁心肌梗死 (Anterior Myocardial Infarction,AMI),其包括前壁心肌梗死,前间隔心肌梗 死和前侧壁心肌梗死。因此,本文专注于检测AMI。该数据库提供47个前壁 MI,77个前间壁MI和43个前侧壁MI记录。(17+27+16) =60个受试者的 (47+77+43) =167个AMI记录。本文提出的算法适用于移动监控应用,而非 专业医学研究。因此,我们选择相关的导联而不是使用所有12个导联来降低算 法复杂度。由AMI引起ECG信号的变化在四个导联中更为显着,即v2, v3, v5,aVL[57],因此在本文工作中,使用这四个导联的ECG数据。

首先,对数据集重新采样(从1000Hz降采样到500Hz)。其次,本文以500 个样本(1秒)点为单位分割每个ECG导联U2, v3, v5, aVL)的数据。随 后,在数据馈送到模型之前使用Z分数归一化对每个分段进行归一化以解决振 幅缩放的问题,以消除偏移的影响。最后,本文将数据集分别分为38536个AMI 样本和18640个健康样本,具体的ECG数据统计如表5.1所示。将心电数据分成10个部分,9个部分为训练数据,剩余1个部分用作测试数据,交叉验证重 复10次,最后将10次结果的平均值作为算法整体性能的估计图5.3是实 验流程图。5.2.2 MC-CNN模型结构

图5.4 MC-CNN模型的结构图

MC-CNN模型结构如图5.4所示。MC-CNN首先将多导联ECG数据(即

导联v2, v3, v5和aVL)分离为单导联ECG数据,然后将每个导联的ECG数据输入到不同的通道去提取ECG特征,最后用两个全连接将每个通道的ECG 特征融合起来以进行分类。MC-CNN模型多通道的设计不仅保证了导联之间数 据的独立性,还能够使每个导联找到适合自己的滤波器,进而提取高质量的ECG 特征。

每个通道的结构设计是相同的,表5.2显示了通道的详细结构设计。每个 通道的维数为1X500,卷积层C1共有6个卷积核(2个1X1、2个1X3、2个 1X5);卷积层C2共有12个卷积核(3个1X1、3个1X3、3个1X5);卷积 层C3釆用16个卷积核(4个1X1、4个1X3、4个1X5),步长均为1。每层 的pooling采用尺度为1X2的最大池化操作,步长均为2,程序中的padding 都设置为SAME。在完全连接层F1中,设置30个神经元,并且与C3层的64 个特征图(16X4)进行全连接。在完全连接层F2中,设置20个神经元,并与 F1层的所有神经元进行全连接。然后使用Softmax函数进行二分类输出,如下 公式所示:

Hylx)=€^ryE[1,k]                                                                   (5.2)

其中x表示上层神经元的输出,Z表示最后一层中第一个y神经元的输入。 P(y|x)表示由模型预测的输入x属于类别y的后验概率。

5.2.3 MC-CNN模型优化

(1)平衡交叉熵

在训练模型的时候,数据集样本类别不均衡,为了解决此问题,本文使用 新的损失函数:平衡交叉熵,该损失函数基于标准交叉熵损失进行修改,可以 很好地解决类别不平衡问题。因为为特定任务选择适当的损失函数很重要。最 基本的交叉熵(CrossEntropy,CE)损失函数如下面的公式所示:

L(p,q) =- pjo勵                               (5.3)

其中P是样本的真实概率分布,q是预测的概率分布。平衡交叉熵损失的方程 式定义如下:

L(p,q) =~ a^^Pilogqt                               (5.4)

其中,平衡交叉熵为类别1引入加权因子cce [0,1]。如果此类中的样本数远大 于类别-1中的样本数,贝Ucc将取〇到〇. 5,增加样本权重-1可以解决数据类别 不平衡的问题。要计算整个模型的损失,我们只需要计算所有数据样本的平均 损失:

H^)=^Nn=iL^nfqn)                                  (5.5)

  • Adam优化器

模型训练过程是通过反向传播完成的。随机梯度下降(Stochastic Gradient Descent,SGD)优化算法在深度学习模型的反向传播训练中具有重要的实际意 义。传统的SGD算法在训练期间通常需要特殊的调整技术和大容量存储,这不 仅耗时、费力,并且难以为深度学习模型设置最佳超参数。

为了在训练期间简单微调初始超参数,本文采用Adam (Adaptive Moment Estimation)优化器Adam优化器是通过计算每个参数梯度的一阶矩估计和 二阶矩估计来为不同参数设计自适应学习率。Adam使用与SGD不同的等式更 新模型参数,Adam的参数更新等式如下:

(x)t =          - a~^~e (5.6)

其中恥,朽分别是mt,的校正,可以近似为期望的无偏估计。

(5.7)

其中仏和心是指数衰减率,是梯度的指数移动平均值,它是参数梯度的一阶

矩估计。R是方形梯度,它是参数梯度的二阶矩估计。7^和1^更新如下:

gt = Vefm                             (5.9)

mt =              + (1 - ^)gt                     (5.10)

= Pi^t-i + (i - Pi)g2t                                                           (5.ii)

其中/(e)是目标函数,仏是/(0)相对于0的梯度。本论文将上述参数分别设置 为:a = 0.001,^ = 0.9,02 = 0.999,e=10_8

5.3实验与结果分析 5.3.1参数设置

卷积神经网络参数的选择直接影响算法的分类性能,尤其是学习速率和动

量系数这两个参数的设置,影响算法的最终精度。该MC-CNN模型通过反向传 播技术训练,超参数设置如下:正则化a),学习速率和动量参数分别设置为 0.2, 3 xl(T3和0.7。它们防止数据的过拟合,有助于数据的收敛,并在训练期 间控制学习的速度。此外,通过等式(5.12)和等式(5.13)更新偏差和权重。

为了验证MC-CNN的有效性,本文将MC-CNN与不同结构CNN进行比较。 我们必须提前设定一定的条件,比较才有意义。因此,无论参数如何调整,都 必须保证网络的层数和每层神经元的数量是相同的。本文设置了四个单通道的 CNN,分别记录为CNN-A,CNN-B,CNN-C和CNN-D,具体参数如表5.3。

(1) CNN-A是单通道CNN,卷积核是1-D的。来自不同导联的ECG数 据被迫使用相同的卷积核。CNN-A网络具有三个卷积层,两个池化层和两个完 全连接层。每个卷积层都有3个不同尺度的卷积核,分别为1x1、1x3、1x5, 每个卷积层卷积核的数量分别为6, 12和16。

  • CNN-B是单通道CNN,卷积核是2-D的,并且仅有部分ECG导联 数据存在卷积融合计算。CNN-B网络有三个卷积层,两个池化层和两个完全连 接层。每个卷积层都有3个不同尺度的卷积核,分别为2x1、2x3、2x5,每个 卷积层卷积核的数量分别为6, 12和16。
  • CNN-C是单通道CNN,卷积核是2-D的,并且仅有部分ECG导联 数据存在卷积融合计算。CNN-C网络有三个卷积层,两个池化层和两个完全连 接层。每个卷积层都有3个不同尺度的卷积核,分别为3x1、3x3、3x5,每个 卷积层卷积核的数量分别为6, 12和16。
  • CNN-D是单通道CNN,卷积核是二维的,一次性对所有ECG导联 数据执行卷积融合计算。CNN-D网络有三个卷积层,两个池化层和两个全连接 层。每个卷积层都有3个不同尺度的卷积核,分别为4x1、4x3、4x5,每个卷 积层卷积核的数量分别为6, 12和16。

CNN-A,CNN-B,CNN-C和CNN-D这些模型中的池化大小为1x2。两个 全连接层中的神经元数量分别为30和20。

5.3.2结果与分析

表5.4和图5.5列出了 MC-CNN与四种基本CNN模型之间的性能比较。在 基于CNN设计的四种单通道模型中,CNN-A模型的不同导联数据在同一特征 面上强制使用相同的滤波器,精确度为90.59%。CNN-B模型和CNN-C模型仅 有部分导联数据存在卷积融合计算,精确度分别为91.52%和92.48%。CNN-D 模型对所有导联数据进行卷积融合计算,精确度为95.92%。结果验证了本文采

用的MC-CNN模型更适合对多导联心电数据分类。

表5.4不同模型的分类结果

5.4本章小结

本章主要针对二维结构的多导联心电图,提出了一个多通道卷积神经网络 模型MC-CNN。MC-CNN模型通过将每个导联输入到不同的通道中,每个通道 使用不同的滤波器,经过训练,使每个导联都能够找到适合自己的滤波器自动 提取ECG特征。MC-CNN模型多通道的设计不仅保证了导联之间数据的独立 性,还能够使每个导联找到适合自己的滤波器,进而提取高质量的ECG特征。 同时使用Adam优化器和平衡交叉熵对模型进行了优化。在PTB心肌梗塞数据 集上进行了验证,MC-CNN模型的分类精确度达到了 96.65%。与其他单通道 CNN模型相比,实验结果表明MC-CNN模型更加适合多导联心电数据的自动 分类。与其传统机器学习方法相比,MC-CNN模型不需要手动设置特征提取器, 可以实现端到端的心电图自动分类检测。

6总结与展望

6.1研究工作总结

心血管疾病现在已经成为威胁人们生活的首要原因。心电图是记录心脏电 信号的过程,它可以反映出心脏兴奋的产生、传导和恢复过程中的生物电位变 化,全面反映了人类心脏的健康状况,被广泛应用于心血管疾病的自动分类检 测。为了防止心脏病的发生,有效地检测和识别ECG是特别重要的。使用计算 机辅助心电图分析工具可以减少医生的工作量并提高工作效率。目前,对心电 图自动分类算法的研究较多,其中深度学习技术不用手动设置特征提取器,并 通过构建具有多层非线性变换的深度神经网络,自动从输入数据中去学习数据 的内部结构特征表示。经过多年的发展,深度学习技术已在许多领域取得了重 大成就,而且针对具体的问题,越来越多的算法已经被提出,发展到目前为止, 深度神经网络形成了不同的模型。本文对深度学习技术中经典的卷积神经网络 模型进行优化和改进,并设计了 ECG自动分类模型。本文研究内容可归纳如下。

  1. 针对ECG中存在噪声,导致特征提取困难等问题,本文采用小波变换 算法对ECG信号进行降噪处理。论文根据ECG数据的特性,釆用Daubechies6

(db6)小波函数将ECG信号分解为八层,并在此基础上,基于噪声系数设定 合理的阈值进行降噪处理,最后重构阈值处理后的各层小波,得到降噪后的ECG 信号。实验结果表明,小波变换有很好的降噪效果。

  1. 针对传统机器学习算法严重依赖手动提取特征的问题,本文对深度学习 技术中的卷积神经网络模型进行优化改进,设计了一个有效的卷积神经网络 E-CNN用于单导联ECG自动分类。E-CNN模型能够从同一输入中提取ECG数 据的多级特征,可以高效的获得ECG数据的内部结构特征表示。通过在 MIT-BIH心律不齐数据集上的实验结果表明,E-CNN在ECG分类中具有良好 的分类性能。
  2. 临床检测一般使用多个导联的ECG数据,多导联ECG数据是相互独立 的,但又是同一时刻产生的心电数据。因此针对多导联心电图这种特殊的二维 结构,本文还提出了一个MC-CNN模型。MC-CNN首先将多导联ECG数据分 离为单导联ECG数据,然后再将每个导联的ECG数据输入到不同通道中提取 特征。MC-CNN模型多通道的设计不仅保证了导联之间数据的独立性,还能够 使每个导联找到适合自己的滤波器,进而提取高质量的ECG特征。实验结果表 明,MC-CNN模型在多导联ECG自动分类中有很大的优势。

6.2研究工作展望

本文主要对深度学习技术中的卷积神经网络模型进行优化和改进,设计了 ECG自动分类模型。通过实验结果表明,模型分类精确度达到了可用水平。但 是,为了进一步改进和完善研究内容,还需要进一步研究的工作如下:

  1. 本文在PTB心肌梗塞数据库上只实现了正异常心电图二分类,其不能 满足各种ECG疾病类型的分类。在未来的研究中,针对临床的多种ECG疾病 进行研究。
  2. 本文在心电标准数据库上的实验结果取得了良好的分类准确率,在未来 的研究中,应主动与公司合作,将分类算法移植到临床ECG自动分析装置上。

参考文献

  • Kishore S P, Blank E, Heller D J, et al. Modernizing the world health organization list of essential medicines for preventing and controlling cardiovascular diseases[J]. Journal of the American College of Cardiology, 2018, 71(5): 564〜
  • 朱晓平.读懂心电图报告:明明白白你的心[J].家庭医生,2004:62〜
  • Banerjee S, Mitra M. Application of Cross Wavelet transform for ECG pattern analysis and classification^]. IEEE Transactions on Instrumentation & Measurement, 2014, 63(2): 326〜
  • Wang J, Ye Y, Xiang P, et al. Parallel-type fractional zero-phase filtering for ECG signal denoisingfJ]. Biomedical Signal Processing & Control, 2015, 18: 36^41.
  • Zhang D . Wavelet Approach for ECG Baseline Wander Correction and Noise ReductionfC]. In: Proceedings of the International Conference of the Engineering in Medicine & Biology Society. IEEE, 2006.
  • Mneimneh M A , Yaz E E , Johnson M T , et al. An adaptive kalman filter for removing baseline wandering in ECG signals[J]. Computers in Cardiology, 2006, 33:253〜
  • Thakor N V, Zhu Y S. Applications of adaptive filtering to ECG analysis: noise cancellation and arrhythmia detectionfJ]. IEEE transactions on bio-medical engineering, 1991, 38(8): 785 〜
  • Sayadi O, Shamsollahi M B. Multiadaptive bionic wavelet transform: application to ECG denoising and baseline wandering reductionfJ]. Eurasip Journal on Advances in Signal Processing, 2007: 1 〜
  • Sameni R, Shamsollahi M B, Jutten C, et al. A nonlinear bayesian filtering framework for ECG denoisingfJ]. IEEE Transactions on Biomedical Engineering, 2007, 54(12): 2172^ 2185.
  • Faust O , Acharya U. R , Krishnan S M , et al. Analysis of cardiac signals using spatial filling index and time-frequency domain [J]. BioMedical Engineering OnLine, 2004, 3(1):1 〜
  • Tateno K 5 Glass L . Automatic detection of atrial fibrillation using the coefficient of variation and density histograms of RR and ARR intervals [J]. Medical & Biological Engineering & Computing, 2001,39(6):664〜
  • Jenny N Z N , Faust O , Yu W . Automated Classification of Normal and Premature Ventricular Contractions in Electrocardiogram SignalsfJ]. Journal of Medical Imaging and Health Informatics,2014, 4(6):886〜
  • Faust O , Martis R J , Min L 5 et al. Cardiac Arrhythmia Classification Using Electrocardiogram [J]. Journal of Medical Imaging and Health Informatics, 2013, 3(3):448 〜
  • Giri D , Acharya U R , Martis R J , et al. Automated diagnosis of Coronary Artery Disease

affected patients using LDA, PC A, ICA and Discrete Wavelet TransformfJ]. Knowledge-Based Systems, 2013, 37:274〜282.

  • Wang J S, Chiang W C, Hsu Y L, et al. ECG arrhythmia classification using a probabilistic neural network with a feature reduction methodfJ]. Neurocomputing, 2013, 116: 38^45.
  • Polat K, Gune§ S. Detection of ECG arrhythmia using a differential expert system approach based on principal component analysis and least square support vector machine [J]. Applied Mathematics & Computation, 2007, 186(1): 898〜
  • Martis R J , Acharya U R , Prasad H , et al. Application of higher order statistics for atrial arrhythmia classification[J]. Biomedical Signal Processing & Control, 2013, 8(6):888〜
  • Wang Y . A short-time multi-fractal approach for arrhythmia detection based on fuzzy neural network[J]. IEEE Trans.on Biomed.eng,2001, 48(9):989〜
  • Sufi F , Khalil I . Diagnosis of cardiovascular abnormalities from compressed ECG: a data mining-based approach.[J]. IEEE Transactions on Information Technology in Biomedicine, 2011, 15(1):33 〜
  • Martis R J , Acharya U R , Mandana K M , et al. Cardiac decision making using higher order spectra[J]. Biomedical Signal Processing & Control,2013, 8(2): 193〜
  • Zhang Z , Luo X . Heartbeat classification using decision level fusionfJ]. Biomedical Engineering Letters,2014, 4(4):388〜
  • Zaunseder, Martnez, Llamedo. Optimization of ECG classification by means of feature selection.[J]. IEEE transactions on bio-medical engineering, 2011, 58(8):2168^2177.
  • Chazal P D , O"Dwyer M , Reilly R B . Automatic classification of heartbeats using ECG morphology and heartbeat interval features [J]. IEEE Transactions on Biomedical Engineering, 2004, 51(7): 1196〜
  • Moran M E , Soriano M C , Fischer I , et al. Electrocardiogram Classification Using Reservoir Computing With Logistic RegressionfJ]. IEEE Journal of Biomedical and Health Informatics, 2014, 19(3):892〜
  • Giiler I, iibeyli E D. ECG beat classifier designed by combined neural network modelfJ]. Pattern Recognition, 2005, 38(2): 199〜
  • Tsujii J , Henderson J , Marius Pa§ca. Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning[J]. Clinical Transplants, 2012, 66(2): 17〜
  • Sutskever I, Vinyals O, Le Q V. Sequence to sequence learning with neural networks [J], 2014: 3104〜
  • Mikolov T, Sutskever I, Chen K, et al. Distributed representations ofwords and phrases and their compositionality[J]. Advances in Neural Information Processing Systems, 2013, 26: 3111 〜
  • Goldberg Y. A primer on neural network models for natural language processingfEB]. 2015. https://arxiv.Org/pdf/l00726vl .pdf.
  • Sainath T N, Mohamed A R, Kingsbury B, et al. Deep convolutional neural networks for

47

LVCSRfC]. In: Proceeding of the IEEE International Conference on Acoustics, 2013: 8614 〜8618.

  • Kiranyaz S , Ince T , Gabbouj M . Real-Time Patient-Specific ECG Classification by ID Convolutional Neural NetworksfJ]. IEEE transactions on bio-medical engineering, 2015, 63(3):664〜
  • Rajpurkar P , Hannun A Y , Haghpanahi M , et al. Cardiologist-level arrhythmia detection with convolutional neural networksfEB]. 2017. https://arxiv.org/pdf/1707.01836.pdf.
  • Reasat T, Shahnaz C. Detection of inferior myocardial infarction using shallow convolutional neural networksfEB]. 2017, https://arxiv.org/pdf/1710.01115.pdf.
  • Ge Y , Liu Q , Chen E , et al. Exploiting Multi-Channels Deep Convolutional Neural Networks for Multivariate Time Series[J]. Frontiers of Computer Science,2016, 10(1):96〜 112.
  • 基于深度神经网络的心电图自动分类方法研究与实现[D].[硕士学位论文].山东:山 东大学,
  • 深度学习与SVM相融合的新闻分类技术研究[D].[硕士学位论文].河北:华北理工大 学,
  • Raina R, Madhavan A, Ng A Y. Large-scale deep unsupervised learning using graphics processorsfC]. In: Proceedings of the 26th Annual International Conference on Machine Learning,IGML 2009, Montreal,Quebec,Canada: ACM Press,2009: 1 〜
  • Shen Y, Li X, Gao H, et al. Data-based techniques focused on modern industry: an overviewfJ]. IEEE Transactions on Industrial Electronics, 2015, 62(1): 657^667.
  • Hinton G E. Learning multiple layers of representation[J]. Trends in Cognitive Sciences, 2007, 11(10): 428〜
  • LecunY,Bengio Y, Hinton G. Deep learning[J]. Nature,2015, 521(7553): 436〜
  • Papernot N, Mcdaniel P. Deep k-nearest neighbors: towards confident, interpretable and robust deep learningfEB]. 2018. https://arxiv.org/pdf/1803.04765.pdf.
  • Demarse T B, Pan L, Sankaraleengam A, et al. Feed-forward propagation of temporal and rate information between cortical populations during coherent activation in engineeredln vitro networksfJ]. Frontiers in Neural Circuits, 2016: 10^32.
  • 胡静.基于深度学习的高光谱图像超分辨处理方法研究[D].[博士学位论文].西安: 西安电子科技大学,
  • Koehn P. Neural machine translation[EB]. 2017. https://arxiv.org/pdf/1709.07809.pdf.
  • Hinton G E, Srivastava N, Krizhevsky A, et al. Improving neural networks by preventing co-adaptation of feature detectors [J]. Computer Science, 2012, 3(4): 212^223.
  • Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition [EB]. 2014. https://arxiv.org/pdf/1409.1556.pdf.
  • Song Z, Liu Y, Song R, et al. A sparsity-based stochastic pooling mechanism for deep convolutional neural networksfJ]. Neural Networks,2018, 105: 340〜
  • Boureau Y L, Roux N L, Bach F, et al. Ask the locals: multi-way local pooling for image

48recognition[C]. In: Proceedings of the IEEE International Conference on Computer Vision. 2011: 2651 〜2658.

  • Xie X, Wei T, Fong L L, et al. CuMF SGD: parallelized stochastic gradient descent for matrix factorization on GPUsfC]. In: Proceedings of the 26th International Symposium, 2017: 79〜
  • 基于心电图分析的心律失常分类[D].[硕士学位论文].北京:北京交通大学,2011.
  • 心电信号实时检测算法与应用研究[D].[硕士学位论文].武汉:华中科技大学,
  • 赵毅.基于小波分析和神经网络的异常心电信号分类研究[D].[硕士学位论文].太原: 太原理工大学,2015.
  • 王楠楠.基于小波去噪的代数熏建算法研究[D].[硕士学位论文].河北:燕山大学, 2011.
  • 卷积神经网络研究综述[J].计算机学报,2017, 40(6): 1229〜
  • Nagi J, Ducatelle F, Caro GAD, et al. Max-pooling convolutional neural networks for vision-based hand gesture recognition[C]. In: Proceedings of the IEEE International Conference on Signal & Image Processing Applications, 2011, 82〜
  • Acharya U R, Oh S L, Hagiwara Y, et al. A deep convolutional neural network model to classify heartbeats[J]. Computers in Biology & Medicine, 2017, 89: 389〜
  • Thygesen K, Alpert J S, Jaffe A S, et al. Third universal definition of myocardial infarction[J]. Circulation,2012, 113(2): 2020〜
  • 陈建新,西广成,王伟等.数据挖掘分类算法在冠心病临床应用的比较m.北京生物 医学工程,2008, 27(3): 249〜
  • Kingma D P, Ba J. Adam: A method for stochastic optimization[EB]. 2014. https:// arxiv.org/pdf/1412.6980v8 .pdf.
  • Sharma L N, Tripathy R K, Dandapat S. Multiscale energy and eigenspace approach to detection and localization of myocardial infarction [J]. IEEE Transactions on Biomedical Engineering, 2015, 62(7): 18Z7〜
  • Li S, Yanping L, Kaitao Y, et al. ECG analysis using multiple instance learning for myocardial infarction detection[J]. IEEE Trans Biomed Eng, 2012, 59(12): 3348〜
  • Reasat T, Shahnaz C. Detection of inferior myocardial infarction using shallow convolutional neural networksfEB]. 2017. https://arxiv.org/pdf/1710.01115.pdf.