CN116110574B

CN116110574B - 一种基于神经网络实现的眼科智能问诊方法和装置

Info

Publication number: CN116110574B
Application number: CN202310395603.5A
Authority: CN
Inventors: 肖璇; 高翔; 陈婷; 苏婷; 李雪杰
Original assignee: Renmin Hospital of Wuhan University
Current assignee: Renmin Hospital of Wuhan University
Priority date: 2023-04-14
Filing date: 2023-04-14
Publication date: 2023-06-20
Anticipated expiration: 2043-04-14
Also published as: US11955240B1; CN116110574A

Abstract

本发明涉及一种基于神经网络实现的眼科智能问诊方法和装置，该方法包括：将病患的问诊语音纠偏滤波和语音分帧成问诊语音帧序列，利用音素识别和音素转码生成问诊语音帧序列对应的问诊文本，从问诊文本中提取出眼科描述病症；对待诊断病患的眼部图集进行灰度滤波、初级图片分割和尺寸均衡化操作，得到标准眼球图组；从标准眼球图组中提取出眼白特征、瞳孔特征以及血管特征，对眼白特征、瞳孔特征以及血管特征进行病变特征分析，得到眼科观察病症，并根据眼科观察病症和眼科描述病症生成问诊结果。本发明可以提高眼科智能问诊的精确度。

Description

一种基于神经网络实现的眼科智能问诊方法和装置

技术领域

本发明涉及人工智能技术领域，尤其涉及一种基于神经网络实现的眼科智能问诊方法和装置。

背景技术

根据世界卫生组织资料显示，包括屈光不正在内的眼科疾病已经成为继肿瘤和心脑血管畸变之后第三大威胁人类健康以及生存质量的疾病，随着眼科病患的数量增多，眼科医生的工作负担也逐渐加重，而基于神经网络的智能问诊系统则可以辅助医生确定病症，提高问诊效率。

现有的基于神经网络的眼科问诊方法多为基于简单的眼部图片识别分类的问诊方法，例如，通过对患者眼部图片进行特征提取，根据提取到的特征进行病灶定位，并识别出病灶的类型，实际应用中，基于简单的眼部图片识别分类的问诊方法要想获得较高的病症识别率需要大量的不同特征的眼部图片进行训练，而每个患者的病灶位置、病症大小的区别会大幅降低病症的识别率，可能导致进行眼科智能问诊时的精确度较低。

发明内容

本发明提供一种基于神经网络实现的眼科智能问诊方法和装置，其主要目的在于解决进行眼科智能问诊时的精确度较低的问题。

为实现上述目的，本发明提供的一种基于神经网络实现的眼科智能问诊方法，包括：

获取待诊断病患的问诊语音，对所述问诊语音进行纠偏滤波，得到滤波语音，将所述滤波语音分帧成问诊语音帧序列，对所述语音帧进行语音特征提取，得到问诊语音特征序列，其中，所述将所述滤波语音分帧成问诊语音帧序列，包括：

按照预设的分帧窗长对所述滤波语音进行初级分帧，得到分帧语音序列；利用如下的主瓣加窗算法对所述分帧语音序列进行加窗处理，得到加窗

语音序列：

；

其中，H(w)是指所述加窗语音序列中第w个加窗语音的频率值，A(w)是指所述分帧语音序列中第w个分帧语音的频率值，π是圆周率符号，N是指所述主瓣加窗算法对应的语音窗长度，e是欧拉数符号，j是虚数符号；

计算出所述加窗语音序列的平均过零率和短时语音能量，根据所述平均过零率和所述短时语音能量对所述加窗语音序列进行端点检测，得到问诊语音帧序列；

对所述语音特征序列进行音素识别，得到问诊音素序列，将所述音素序列自注意力转码成问诊文本，依次对所述问诊文本进行文本分词和向量化操作，得到问诊文本特征，对所述问诊文本特征进行语义识别，得到眼科描述病症；

获取所述待诊断病患的眼部图集，从所述眼部图集中筛选出清晰眼部图组，对所述清晰眼部图组进行灰度滤波操作，得到滤波眼部图组，并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作，得到标准眼球图组；

对所述标准眼球图组进行次级图片分割操作，得到眼白图组、瞳孔图组以及血管图组，从所述眼白图组中提取出眼白特征，从所述瞳孔图组中提取出瞳孔特征，从所述血管图组中提取出血管特征；

对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析，得到眼科观察病症，并根据所述眼科观察病症和所述眼科描述病症生成问诊结果。

可选地，所述对所述问诊语音进行纠偏滤波，得到滤波语音，包括：

对所述问诊语音进行列信号转化，得到问诊列信号，根据所述问诊列信号生成所述问诊语音的时间序列；

根据所述问诊列信号和所述时间序列生成所述问诊语音的语音趋势项，并根据所述语音趋势项对所述问诊列信号进行语音纠偏，得到纠偏语音；

对所述纠偏语音进行除噪滤波，得到滤波语音。

可选地，所述对所述语音帧进行语音特征提取，得到问诊语音特征序列，包括：

对所述问诊语音特征序列进行快速离散傅里叶变换，得到问诊语音频谱序列；

对所述问诊语音频谱序列进行梅尔滤波，得到问诊梅尔频谱序列；

对所述问诊梅尔频谱序列进行对数逆变换，得到问诊语音特征序列。

可选地，所述对所述语音特征序列进行音素识别，得到问诊音素序列，包括：

为所述语音特征序列添加位置特征，得到语音特征编码；

生成所述语音特征编码的多头语音编码向量集，并利用自注意力机制计算出所述多头语音编码向量集对应的语素注意力特征；

对所述语素注意力特征进行注意力解码，得到问诊音素序列。

可选地，所述将所述音素序列自注意力转码成问诊文本，包括：

利用预先训练的自注意力模型对所述音素序列进行初级解码，得到问诊候选词集序列；

根据所述问诊候选词集序列生成候选词序列，逐个选取所述候选词序列中的候选词作为目标候选词，利用预先训练的语义网络生成所述目标候选词对应后接词集；

根据所述后接词集和所述问诊候选词集序列中位于所述目标候选词之后的问诊候选词集对所述候选词序列进行更新，直至所述目标候选词为所述候选词序列中的最后一个候选词时，将所述候选词序列中的各个候选词拼接成问诊文本。

可选地，所述从所述眼部图集中筛选出清晰眼部图组，包括：

对所述眼部图集中的各眼部图片进行灰度化操作，得到初级眼部灰度图集；

逐个选取所述初级眼部灰度图集中的初级眼部灰度图片作为目标眼部灰度图片，利用如下的灰度阶度算法计算出所述目标眼部灰度图片的眼部清晰度值：

；

其中，Q是指所述眼部清晰度值，I是所述目标眼部灰度图片的图片像素长度，R是所述目标眼部灰度图片的图片像素宽度，i是指所述目标眼部灰度图片中的横向第i个像素，r是指所述目标眼部灰度图片中的纵向第r个像素，

是指所述灰度阶度算法的采样框长，G是灰度符号,G_(i，r)是指所述目标眼部灰度图片中坐标点为（i，r）的像素的灰度值；

判断所述目标眼部灰度图片的眼部清晰度值是否大于预设的清晰度阈值；

若否，则返回所述逐个选取所述初级眼部灰度图集中的初级眼部灰度图片作为目标眼部灰度图片的步骤；

若是，则将所述目标眼部灰度图片添加到预设的清晰眼部图组中。

可选地，所述对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作，得到标准眼球图组，包括：

逐个选取所述滤波眼部图组中的滤波眼部图片作为目标滤波眼部图片，对所述目标滤波眼部图片进行边缘侵蚀操作，得到初级眼部边缘；

利用分水岭算法从所述初级眼部边缘中提取出初级眼球边缘，根据所述初级眼球边缘生成眼球掩膜，利用所述眼球掩膜对所述目标滤波眼部图片进行初级分割，得到初级眼球图片；

对所述初级眼球图片进行倾斜矫正和尺寸拉伸操作，得到矫正眼球图片；

生成所述矫正眼球图片的灰度直方图，利用所述灰度直方图对所述矫正眼球图片进行灰度均衡操作，得到标准眼球图片，并将所有的标准眼球图片汇集成标准眼球图组。

可选地，所述对所述标准眼球图组进行次级图片分割操作，得到眼白图组、瞳孔图组以及血管图组，包括：

逐个选取所述标准眼球图组中的标准眼球图片作为目标眼球图片，对所述目标眼球图片进行次级边缘侵蚀，得到次级眼球边缘图片；

对所述次级眼球边缘图片进行圆形拟合，得到瞳孔边缘图片；

根据所述瞳孔边缘图片对所述目标眼球图片进行图片分割，得到标准眼白图片和标准瞳孔图片；

利用所述瞳孔边缘图片对所述次级眼球边缘图片进行掩膜操作，得到初级血管图片，对所述初级血管图片进行各向异性滤波，得到标准血管图；

将所有的标准眼白图片汇集成眼白图组，将所有的标准瞳孔图片汇集成瞳孔图组，将所有的标准血管图片汇集成血管图组。

可选地，所述对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析，得到眼科观察病症，包括：

从所述眼白特征中识别出眼白病症语义，从所述瞳孔特征中识别出瞳孔病症语义，从所述血管特征中识别出血管病症语义；

将所述眼白病症语义、所述瞳孔病症语义以及所述血管病症语义汇集成眼部病症语义集；

对所述眼部病症语义集中的各眼部病症语义进行特征编码，得到病症语义特征编码；

利用预先训练的病症分析模型生成所述病症语义特征编码对应的多头病症语义向量集，利用所述病症分析模型的多头注意力机制计算出所述多头病症语义向量集对应的标准病症语义向量；

依次对所述标准病症语义向量进行归一化和特征解码操作，得到眼科观察病症。

为了解决上述问题，本发明还提供一种基于神经网络实现的眼科智能问诊装置，所述装置包括：

语音分帧模块，用于获取待诊断病患的问诊语音，对所述问诊语音进行纠偏滤波，得到滤波语音，以及将所述滤波语音分帧成问诊语音帧序列，对所述语音帧进行语音特征提取，得到问诊语音特征序列；

语音问诊模块，用于对所述语音特征序列进行音素识别，得到问诊音素序列，将所述音素序列自注意力转码成问诊文本，依次对所述问诊文本进行文本分词和向量化操作，得到问诊文本特征，对所述问诊文本特征进行语义识别，得到眼科描述病症；

图像均衡模块，用于获取所述待诊断病患的眼部图集，从所述眼部图集中筛选出清晰眼部图组，对所述清晰眼部图组进行灰度滤波操作，得到滤波眼部图组，并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作，得到标准眼球图组；

特征提取模块，用于对所述标准眼球图组进行次级图片分割操作，得到眼白图组、瞳孔图组以及血管图组，从所述眼白图组中提取出眼白特征，从所述瞳孔图组中提取出瞳孔特征，从所述血管图组中提取出血管特征；

结果生成模块，用于对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析，得到眼科观察病症，并根据所述眼科观察病症和所述眼科描述病症生成问诊结果。

本发明实施例通过对所述问诊语音进行纠偏滤波，得到滤波语音，可以减少问诊语音中的噪音趋势，保留更多的语音细节，通过将所述滤波语音分帧成问诊语音帧序列，可以方便对每帧语音进行单独音素分析，提高音素分析的准确性，通过对所述语音帧进行语音特征提取，得到问诊语音特征序列，可以保留多维语音特征，从而提高后续音素分析的准确性，通过对所述语音特征序列进行音素识别，得到问诊音素序列，将所述音素序列自注意力转码成问诊文本，可以将语音转化成文本，方便计算机进行语义理解，从而进行眼科病症诊断，通过依次对所述问诊文本进行文本分词和向量化操作，得到问诊文本特征，对所述问诊文本特征进行语义识别，得到眼科描述病症，可以根据待诊断病患的描述性语音进行初步的病症确定，从而提高眼科智能问诊的准确性，通过获取所述待诊断病患的眼部图集，从所述眼部图集中筛选出清晰眼部图组，可以选取眼部细节特征更多的眼部图片进行图片处理，通过对所述清晰眼部图组进行灰度滤波操作，得到滤波眼部图组，并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作，得到标准眼球图组，可以增强眼部图片的细节特征，同时方便后续进行特征对比，提高特征识别的准确率。

通过对所述标准眼球图组进行次级图片分割操作，得到眼白图组、瞳孔图组以及血管图组，从所述眼白图组中提取出眼白特征，从所述瞳孔图组中提取出瞳孔特征，从所述血管图组中提取出血管特征，可以分别对眼白、瞳孔以及血管进行病症分析，从而确保后续眼科观察病症的准确性，通过对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析，得到眼科观察病症，并根据所述眼科观察病症和所述眼科描述病症生成问诊结果，可以根据所述待诊断病患的病症问答分析和病区照片分析生成问诊结果，从而防止了因为缺乏病例基础数据或实时病症数据导致的问诊结果模糊的情况，提高了眼科智能问诊的准确率。因此本发明提出的基于神经网络实现的眼科智能问诊方法和装置，可以解决进行眼科智能问诊时的精确度较低的问题。

附图说明

图1为本发明一实施例提供的基于神经网络实现的眼科智能问诊方法的流程示意图；

图2为本发明一实施例提供的提取问诊语音特征序列的流程示意图；

图3为本发明一实施例提供的生成标准眼球图组的流程示意图；

图4为本发明一实施例提供的基于神经网络实现的眼科智能问诊装置的功能模块图；

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本申请实施例提供一种基于神经网络实现的眼科智能问诊方法。所述基于神经网络实现的眼科智能问诊方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之，所述基于神经网络实现的眼科智能问诊方法可以由安装在终端设备或服务端设备的软件或硬件来执行，所述软件可以是区块链平台。所述服务端包括但不限于：单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

参照图1所示，为本发明一实施例提供的基于神经网络实现的眼科智能问诊方法的流程示意图。在本实施例中，所述基于神经网络实现的眼科智能问诊方法包括：

S1、获取待诊断病患的问诊语音，对所述问诊语音进行纠偏滤波，得到滤波语音，将所述滤波语音分帧成问诊语音帧序列，对所述语音帧进行语音特征提取，得到问诊语音特征序列。

本发明实施例中，所述待诊断病患是指需要进行眼科智能问诊的病患，所述问诊语义是指根据设定的问诊问题而进行回答的患者的答复语音，例如所述待诊断病患的过往病史以及自觉症状等。

本发明实施例中，所述对所述问诊语音进行纠偏滤波，得到滤波语音，包括：

对所述纠偏语音进行除噪滤波，得到滤波语音。

详细地，可以利用matlab对所述问诊语音进行列信号转化，得到问诊列信号，并从所述问诊列信号中提取出语音时长，根据所述语音时长和所述问诊列信号的采样频率计算出所述问诊语音的时间序列。

详细地，可以利用最小二乘法根据所述问诊列信号和所述时间序列生成所述问诊语音的语音趋势项，所述根据所述语音趋势项对所述问诊列信号进行语音纠偏，得到纠偏语音是指将所述问诊列信号中的语音趋势项删除，得到纠偏语音，可以利用filterDesigner滤波器对对所述纠偏语音进行除噪滤波，得到滤波语音。

具体地，所述将所述滤波语音分帧成问诊语音帧序列，包括：

按照预设的分帧窗长对所述滤波语音进行初级分帧，得到分帧语音序列；

利用如下的主瓣加窗算法对所述分帧语音序列进行加窗处理，得到加窗语音序列：

；

计算出所述加窗语音序列的平均过零率和短时语音能量，根据所述平均过零率和所述短时语音能量对所述加窗语音序列进行端点检测，得到问诊语音帧序列。

本发明实施例中，通过利用所述主瓣加窗算法对所述分帧语音序列进行加窗处理，得到加窗语音序列，可以使得分帧语音序列中的旁瓣语音相互抵消，使得语音能量集中在主瓣，从而保留语音特征细节。

具体地，所述平均过零率是指短时间信号通过零值的次数，所述短时语音能量是指短时间中的语音信号的能量特征变化。

详细地，参照图2所示，所述对所述语音帧进行语音特征提取，得到问诊语音特征序列，包括：

S21、对所述问诊语音特征序列进行快速离散傅里叶变换，得到问诊语音频谱序列；

S22、对所述问诊语音频谱序列进行梅尔滤波，得到问诊梅尔频谱序列；

S23、对所述问诊梅尔频谱序列进行对数逆变换，得到问诊语音特征序列。

详细地，所述快速离散傅里叶变换（fast Fourier transform，简称DFT），基本思想是把原始的多点序列，依次分解成一系列的短序列，充分利用快速离散傅里叶变换计算式中指数因子所具有的对称性质和周期性质，进而求出这些短序列相应的快速离散傅里叶变换并进行适当组合，达到删除重复计算，减少乘法运算和简化结构的目的。

具体地，可以利用MATLAB或python的梅尔滤波器对所述问诊语音频谱序列进行梅尔滤波，得到问诊梅尔频谱序列，可以利用离散余弦变换(Discrete Cosine Transform，简称DCT) 对所述问诊梅尔频谱序列进行对数逆变换，得到问诊语音特征序列。

本发明实施例中，通过对所述问诊语音进行纠偏滤波，得到滤波语音，可以减少问诊语音中的噪音趋势，保留更多的语音细节，通过将所述滤波语音分帧成问诊语音帧序列，可以方便对每帧语音进行单独音素分析，提高音素分析的准确性，通过对所述语音帧进行语音特征提取，得到问诊语音特征序列，可以保留多维语音特征，从而提高后续音素分析的准确性。

S2、对所述语音特征序列进行音素识别，得到问诊音素序列，将所述音素序列自注意力转码成问诊文本，依次对所述问诊文本进行文本分词和向量化操作，得到问诊文本特征，对所述问诊文本特征进行语义识别，得到眼科描述病症。

本发明实施例中，所述对所述语音特征序列进行音素识别，得到问诊音素序列，包括：

为所述语音特征序列添加位置特征，得到语音特征编码；

具体地，所述位置特征是指所述语音特征序列中处于不同位置的语音特征的位置特征，所述生成所述语音特征编码的多头语音编码向量集是指生成所述语音特征编码对应的querry向量，key向量以及value向量。

详细地，所述利用自注意力机制计算出所述多头语音编码向量集对应的语素注意力特征是指将所述多头语音编码向量集中的各向量进行矩阵计算，并进行归一化操作，得到语素注意力特征，所述对所述语素注意力特征进行注意力解码，得到问诊音素序列是指利用多个位置前馈网络、残差网络层以及归一化层对所述语素注意力特征进行解码，得到问诊音素序列。

本发明实施例中，所述将所述音素序列自注意力转码成问诊文本，包括：

详细地，所述自注意力模型可以是以多个标注的音素训练集训练得到的transformer模型，所述语义网络可以是经过大量连续文本训练后的时序神经网络。

具体地，所述根据所述后接词集和所述问诊候选词集序列中位于所述目标候选词之后的问诊候选词集对所述候选词序列进行更新是指将所述后接词集和所述所述问诊候选词集序列中位于所述目标候选词之后的问诊候选词集融合成标准候选词集，并选取所述标准候选词集中正确率最大的候选词对所述候选词序列中位于所述目标候选词之后的候选词进行替换，得到更新后的候选词序列。

具体地，可以利用双向最大匹配算法对所述问诊文本进行文本分词，得到问诊文本词集，筛除所述问诊文本词集中的停用词，得到标准问诊词集，利用独热编码或word2vec算法对所述标准问诊词集进行向量化操作，得到问诊文本特征。

详细地，可以利用大量经过病症标注后的问诊句子特征集训练后的自注意力模型对所述对所述问诊文本特征进行语义识别，得到眼科描述病症。

本发明实施例中，通过对所述语音特征序列进行音素识别，得到问诊音素序列，将所述音素序列自注意力转码成问诊文本，可以将语音转化成文本，方便计算机进行语义理解，从而进行眼科病症诊断，通过依次对所述问诊文本进行文本分词和向量化操作，得到问诊文本特征，对所述问诊文本特征进行语义识别，得到眼科描述病症，可以根据待诊断病患的描述性语音进行初步的病症确定，从而提高眼科智能问诊的准确性。

S3、获取所述待诊断病患的眼部图集，从所述眼部图集中筛选出清晰眼部图组，对所述清晰眼部图组进行灰度滤波操作，得到滤波眼部图组，并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作，得到标准眼球图组。

本发明实施例中，所述眼部图集是指对所述待诊断病患的眼部进行近距离拍摄得到的图片，所述清晰眼部图组是指由所述眼部图集中多张较为清晰的眼部图片组成的图组。

本发明实施例中，所述从所述眼部图集中筛选出清晰眼部图组，包括：

；

本发明实施例中，通过利用所述灰度阶度算法计算出所述目标眼部灰度图片的眼部清晰度值，可以根据所述目标眼部灰度图片中各区域中灰度变化的幅度值判断该目标眼部灰度图片整体的清晰度，从而提高清晰度计算的准确性。

详细地，可以利用高斯滤波算法或中值滤波算范对对所述清晰眼部图组进行灰度滤波操作，得到滤波眼部图组。

具体地，参照图3所示，所述对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作，得到标准眼球图组，包括：

S31、逐个选取所述滤波眼部图组中的滤波眼部图片作为目标滤波眼部图片，对所述目标滤波眼部图片进行边缘侵蚀操作，得到初级眼部边缘；

S32、利用分水岭算法从所述初级眼部边缘中提取出初级眼球边缘，根据所述初级眼球边缘生成眼球掩膜，利用所述眼球掩膜对所述目标滤波眼部图片进行初级分割，得到初级眼球图片；

S33、对所述初级眼球图片进行倾斜矫正和尺寸拉伸操作，得到矫正眼球图片；

S34、生成所述矫正眼球图片的灰度直方图，利用所述灰度直方图对所述矫正眼球图片进行灰度均衡操作，得到标准眼球图片，并将所有的标准眼球图片汇集成标准眼球图组。

本发明实施例中，可以利用canny算子或sobel算子对所述目标滤波眼部图片进行边缘侵蚀操作，得到初级眼部边缘，可以利用hough算法对所述初级眼球图片进行倾斜矫正，所述尺寸拉伸是指将所述初级眼球图片的图片大小等比例放大到预设的图片尺寸。

本发明实施例中，通过获取所述待诊断病患的眼部图集，从所述眼部图集中筛选出清晰眼部图组，可以选取眼部细节特征更多的眼部图片进行图片处理，通过对所述清晰眼部图组进行灰度滤波操作，得到滤波眼部图组，并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作，得到标准眼球图组，可以增强眼部图片的细节特征，同时方便后续进行特征对比，提高特征识别的准确率。

S4、对所述标准眼球图组进行次级图片分割操作，得到眼白图组、瞳孔图组以及血管图组，从所述眼白图组中提取出眼白特征，从所述瞳孔图组中提取出瞳孔特征，从所述血管图组中提取出血管特征。

本发明实施例中，所述对所述标准眼球图组进行次级图片分割操作，得到眼白图组、瞳孔图组以及血管图组，包括：

详细地，所述对所述目标眼球图片进行次级边缘侵蚀，得到次级眼球边缘图片的方法与上述步骤S3中的所述对所述目标滤波眼部图片进行边缘侵蚀操作，得到初级眼部边缘的方法一致，这里不再赘述。

详细地，可以利用最小二乘法对所述次级眼球边缘图片进行圆形拟合，得到瞳孔边缘图片，所述各向异性滤波（Anisotropic Filtering，简称AF），可以将纹理特征和图片角度等因素进行关联并滤波，保留更多的纹理特征。

详细地，所述从所述眼白图组中提取出眼白特征，从所述瞳孔图组中提取出瞳孔特征，从所述血管图组中提取出血管特征是指利用预先训练的卷积神经网络分别对眼白图组中的各眼白图片进行特征降维、对瞳孔图组中的各瞳孔图片进行特征降维以及对血管图组中的各血管图片进行特征降维，从而方便后续的特征识别，降低计算维度。

本发明实施例中，通过对所述标准眼球图组进行次级图片分割操作，得到眼白图组、瞳孔图组以及血管图组，从所述眼白图组中提取出眼白特征，从所述瞳孔图组中提取出瞳孔特征，从所述血管图组中提取出血管特征，可以分别对眼白、瞳孔以及血管进行病症分析，从而确保后续眼科观察病症的准确性。

S5、对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析，得到眼科观察病症，并根据所述眼科观察病症和所述眼科描述病症生成问诊结果。

本发明实施例中，所述对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析，得到眼科观察病症，包括：

详细地，所述病症分析模型可以是经过大量标注后的病症语义训练后的支持向量机模型，可以利用softmax函数对所述标准病症语义向量进行归一化，可以利用多层感知机（Multilayer Perceptron）对所述标准病症语义向量进行特征解码操作，得到眼科观察病症。

详细地，所述根据所述眼科观察病症和所述眼科描述病症生成问诊结果是指将所述眼科观察病症和所述标准眼球图组生成观察病症结果，将所述眼科描述病症和所述问诊文本生成描述病症结果，并将所述观察病症结果和所述描述病症结果拼接成问诊结果，所述问诊结果可以反馈给眼科医生，从而辅助眼科医生进行病症决断。

本发明实施例中，通过对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析，得到眼科观察病症，并根据所述眼科观察病症和所述眼科描述病症生成问诊结果，可以根据所述待诊断病患的病症问答分析和病区照片分析生成问诊结果，从而防止了因为缺乏病例基础数据或实时病症数据导致的问诊结果模糊的情况，提高了眼科智能问诊的准确率。

所述基于神经网络实现的眼科智能问诊装置100可以实现上述基于神经网络实现的眼科智能问诊方法，且所述基于神经网络实现的眼科智能问诊装置100可以安装于电子设备中。根据实现的功能，所述基于神经网络实现的眼科智能问诊装置100可以包括语音分帧模块101、语音问诊模块102、图像均衡模块103、特征提取模块104及结果生成模块105。本发明所述模块也可以称之为单元，是指一种能够被电子设备处理器所执行，并且能够完成固定功能的一系列计算机程序段，其存储在电子设备的存储器中。

在本实施例中，关于各模块/单元的功能如下：

所述语音分帧模块101，用于获取待诊断病患的问诊语音，对所述问诊语音进行纠偏滤波，得到滤波语音，将所述滤波语音分帧成问诊语音帧序列，对所述语音帧进行语音特征提取，得到问诊语音特征序列，其中，所述将所述滤波语音分帧成问诊语音帧序列，包括：按照预设的分帧窗长对所述滤波语音进行初级分帧，得到分帧语音序列；利用如下的主瓣加窗算法对所述分帧语音序列进行加窗处理，得到加窗语音序列：

；

其中，H(w)是指所述加窗语音序列中第w个加窗语音的频率值，A(w)是指所述分帧语音序列中第w个分帧语音的频率值，π是圆周率符号，N是指所述主瓣加窗算法对应的语音窗长度，e是欧拉数符号，j是虚数符号；计算出所述加窗语音序列的平均过零率和短时语音能量，根据所述平均过零率和所述短时语音能量对所述加窗语音序列进行端点检测，得到问诊语音帧序列；

所述语音问诊模块102，用于对所述语音特征序列进行音素识别，得到问诊音素序列，将所述音素序列自注意力转码成问诊文本，依次对所述问诊文本进行文本分词和向量化操作，得到问诊文本特征，对所述问诊文本特征进行语义识别，得到眼科描述病症；

所述图像均衡模块103，用于获取所述待诊断病患的眼部图集，从所述眼部图集中筛选出清晰眼部图组，对所述清晰眼部图组进行灰度滤波操作，得到滤波眼部图组，并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作，得到标准眼球图组；

所述特征提取模块104，用于对所述标准眼球图组进行次级图片分割操作，得到眼白图组、瞳孔图组以及血管图组，从所述眼白图组中提取出眼白特征，从所述瞳孔图组中提取出瞳孔特征，从所述血管图组中提取出血管特征；

所述结果生成模块105，用于对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析，得到眼科观察病症，并根据所述眼科观察病症和所述眼科描述病症生成问诊结果。

详细地，本发明实施例中所述基于神经网络实现的眼科智能问诊装置100中所述的各模块在使用时采用与上述图1至图3中所述的基于神经网络实现的眼科智能问诊方法一样的技术手段，并能够产生相同的技术效果，这里不再赘述。

最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种基于神经网络实现的眼科智能问诊方法，其特征在于，所述方法包括：

S1：获取待诊断病患的问诊语音，对所述问诊语音进行纠偏滤波，得到滤波语音，将所述滤波语音分帧成问诊语音帧序列，对所述语音帧进行语音特征提取，得到问诊语音特征序列，其中，所述将所述滤波语音分帧成问诊语音帧序列，包括：

S11：按照预设的分帧窗长对所述滤波语音进行初级分帧，得到分帧语音序列；

S12：利用如下的主瓣加窗算法对所述分帧语音序列进行加窗处理，得到加窗语音序列：

；

S13：计算出所述加窗语音序列的平均过零率和短时语音能量，根据所述平均过零率和所述短时语音能量对所述加窗语音序列进行端点检测，得到问诊语音帧序列；

S2：对所述语音特征序列进行音素识别，得到问诊音素序列，将所述音素序列自注意力转码成问诊文本，依次对所述问诊文本进行文本分词和向量化操作，得到问诊文本特征，对所述问诊文本特征进行语义识别，得到眼科描述病症；

S3：获取所述待诊断病患的眼部图集，从所述眼部图集中筛选出清晰眼部图组，对所述清晰眼部图组进行灰度滤波操作，得到滤波眼部图组，并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作，得到标准眼球图组；

S4：对所述标准眼球图组进行次级图片分割操作，得到眼白图组、瞳孔图组以及血管图组，从所述眼白图组中提取出眼白特征，从所述瞳孔图组中提取出瞳孔特征，从所述血管图组中提取出血管特征；

S5：对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析，得到眼科观察病症，并根据所述眼科观察病症和所述眼科描述病症生成问诊结果；

所述对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析，得到眼科观察病症，包括：

依次对所述标准病症语义向量进行归一化和特征解码操作，得到眼科观察病症；

所述病症分析模型是经过标注后的病症语义训练得到的支持向量机模型，利用softmax函数对所述标准病症语义向量进行归一化，利用多层感知机对所述标准病症语义向量进行特征解码操作得到眼科观察病症；

所述根据所述眼科观察病症和所述眼科描述病症生成问诊结果是指将所述眼科观察病症和所述标准眼球图组生成观察病症结果，将所述眼科描述病症和所述问诊文本生成描述病症结果，并将所述观察病症结果和所述描述病症结果拼接成问诊结果。

2.如权利要求1所述的眼科智能问诊方法，其特征在于，所述对所述问诊语音进行纠偏滤波，得到滤波语音，包括：

对所述纠偏语音进行除噪滤波，得到滤波语音。

3.如权利要求1所述的眼科智能问诊方法，其特征在于，所述对所述语音帧进行语音特征提取，得到问诊语音特征序列，包括：

4.如权利要求1所述的眼科智能问诊方法，其特征在于，所述对所述语音特征序列进行音素识别，得到问诊音素序列，包括：

为所述语音特征序列添加位置特征，得到语音特征编码；

5.如权利要求1所述的眼科智能问诊方法，其特征在于，所述将所述音素序列自注意力转码成问诊文本，包括：

6.如权利要求1所述的眼科智能问诊方法，其特征在于，所述从所述眼部图集中筛选出清晰眼部图组，包括：

；

7.如权利要求1所述的眼科智能问诊方法，其特征在于，所述对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作，得到标准眼球图组，包括：

8.如权利要求1所述的眼科智能问诊方法，其特征在于，所述对所述标准眼球图组进行次级图片分割操作，得到眼白图组、瞳孔图组以及血管图组，包括：

9.一种用于实现权利要求1-8任一项所述眼科智能问诊方法的问诊装置，其特征在于，所述装置包括：