CN116110574B - 一种基于神经网络实现的眼科智能问诊方法和装置 - Google Patents

一种基于神经网络实现的眼科智能问诊方法和装置 Download PDF

Info

Publication number
CN116110574B
CN116110574B CN202310395603.5A CN202310395603A CN116110574B CN 116110574 B CN116110574 B CN 116110574B CN 202310395603 A CN202310395603 A CN 202310395603A CN 116110574 B CN116110574 B CN 116110574B
Authority
CN
China
Prior art keywords
voice
eye
inquiry
sequence
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310395603.5A
Other languages
English (en)
Other versions
CN116110574A (zh
Inventor
肖璇
高翔
陈婷
苏婷
李雪杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renmin Hospital of Wuhan University
Original Assignee
Renmin Hospital of Wuhan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renmin Hospital of Wuhan University filed Critical Renmin Hospital of Wuhan University
Priority to CN202310395603.5A priority Critical patent/CN116110574B/zh
Publication of CN116110574A publication Critical patent/CN116110574A/zh
Application granted granted Critical
Publication of CN116110574B publication Critical patent/CN116110574B/zh
Priority to US18/465,977 priority patent/US11955240B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B3/00Apparatus for testing the eyes; Instruments for examining the eyes
    • A61B3/0016Operational features thereof
    • A61B3/0025Operational features thereof characterised by electronic signal processing, e.g. eye models
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B3/00Apparatus for testing the eyes; Instruments for examining the eyes
    • A61B3/10Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions
    • A61B3/14Arrangements specially adapted for eye photography
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4803Speech analysis specially adapted for diagnostic purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration by the use of local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration by the use of histogram techniques
    • G06T5/70
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/70Labelling scene content, e.g. deriving syntactic or semantic representations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • G10L15/05Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H80/00ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30041Eye; Retina; Ophthalmic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30101Blood vessel; Artery; Vein; Vascular
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明涉及一种基于神经网络实现的眼科智能问诊方法和装置,该方法包括:将病患的问诊语音纠偏滤波和语音分帧成问诊语音帧序列,利用音素识别和音素转码生成问诊语音帧序列对应的问诊文本,从问诊文本中提取出眼科描述病症;对待诊断病患的眼部图集进行灰度滤波、初级图片分割和尺寸均衡化操作,得到标准眼球图组;从标准眼球图组中提取出眼白特征、瞳孔特征以及血管特征,对眼白特征、瞳孔特征以及血管特征进行病变特征分析,得到眼科观察病症,并根据眼科观察病症和眼科描述病症生成问诊结果。本发明可以提高眼科智能问诊的精确度。

Description

一种基于神经网络实现的眼科智能问诊方法和装置
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于神经网络实现的眼科智能问诊方法和装置。
背景技术
根据世界卫生组织资料显示,包括屈光不正在内的眼科疾病已经成为继肿瘤和心脑血管畸变之后第三大威胁人类健康以及生存质量的疾病,随着眼科病患的数量增多,眼科医生的工作负担也逐渐加重,而基于神经网络的智能问诊系统则可以辅助医生确定病症,提高问诊效率。
现有的基于神经网络的眼科问诊方法多为基于简单的眼部图片识别分类的问诊方法,例如,通过对患者眼部图片进行特征提取,根据提取到的特征进行病灶定位,并识别出病灶的类型,实际应用中,基于简单的眼部图片识别分类的问诊方法要想获得较高的病症识别率需要大量的不同特征的眼部图片进行训练,而每个患者的病灶位置、病症大小的区别会大幅降低病症的识别率,可能导致进行眼科智能问诊时的精确度较低。
发明内容
本发明提供一种基于神经网络实现的眼科智能问诊方法和装置,其主要目的在于解决进行眼科智能问诊时的精确度较低的问题。
为实现上述目的,本发明提供的一种基于神经网络实现的眼科智能问诊方法,包括:
获取待诊断病患的问诊语音,对所述问诊语音进行纠偏滤波,得到滤波语音,将所述滤波语音分帧成问诊语音帧序列,对所述语音帧进行语音特征提取,得到问诊语音特征序列,其中,所述将所述滤波语音分帧成问诊语音帧序列,包括:
按照预设的分帧窗长对所述滤波语音进行初级分帧,得到分帧语音序列;利用如下的主瓣加窗算法对所述分帧语音序列进行加窗处理,得到加窗
语音序列:
Figure SMS_1
其中,H(w)是指所述加窗语音序列中第w个加窗语音的频率值,A(w)是指所述分帧语音序列中第w个分帧语音的频率值,π是圆周率符号,N是指所述主瓣加窗算法对应的语音窗长度,e是欧拉数符号,j是虚数符号;
计算出所述加窗语音序列的平均过零率和短时语音能量,根据所述平均过零率和所述短时语音能量对所述加窗语音序列进行端点检测,得到问诊语音帧序列;
对所述语音特征序列进行音素识别,得到问诊音素序列,将所述音素序列自注意力转码成问诊文本,依次对所述问诊文本进行文本分词和向量化操作,得到问诊文本特征,对所述问诊文本特征进行语义识别,得到眼科描述病症;
获取所述待诊断病患的眼部图集,从所述眼部图集中筛选出清晰眼部图组,对所述清晰眼部图组进行灰度滤波操作,得到滤波眼部图组,并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作,得到标准眼球图组;
对所述标准眼球图组进行次级图片分割操作,得到眼白图组、瞳孔图组以及血管图组,从所述眼白图组中提取出眼白特征,从所述瞳孔图组中提取出瞳孔特征,从所述血管图组中提取出血管特征;
对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析,得到眼科观察病症,并根据所述眼科观察病症和所述眼科描述病症生成问诊结果。
可选地,所述对所述问诊语音进行纠偏滤波,得到滤波语音,包括:
对所述问诊语音进行列信号转化,得到问诊列信号,根据所述问诊列信号生成所述问诊语音的时间序列;
根据所述问诊列信号和所述时间序列生成所述问诊语音的语音趋势项,并根据所述语音趋势项对所述问诊列信号进行语音纠偏,得到纠偏语音;
对所述纠偏语音进行除噪滤波,得到滤波语音。
可选地,所述对所述语音帧进行语音特征提取,得到问诊语音特征序列,包括:
对所述问诊语音特征序列进行快速离散傅里叶变换,得到问诊语音频谱序列;
对所述问诊语音频谱序列进行梅尔滤波,得到问诊梅尔频谱序列;
对所述问诊梅尔频谱序列进行对数逆变换,得到问诊语音特征序列。
可选地,所述对所述语音特征序列进行音素识别,得到问诊音素序列,包括:
为所述语音特征序列添加位置特征,得到语音特征编码;
生成所述语音特征编码的多头语音编码向量集,并利用自注意力机制计算出所述多头语音编码向量集对应的语素注意力特征;
对所述语素注意力特征进行注意力解码,得到问诊音素序列。
可选地,所述将所述音素序列自注意力转码成问诊文本,包括:
利用预先训练的自注意力模型对所述音素序列进行初级解码,得到问诊候选词集序列;
根据所述问诊候选词集序列生成候选词序列,逐个选取所述候选词序列中的候选词作为目标候选词,利用预先训练的语义网络生成所述目标候选词对应后接词集;
根据所述后接词集和所述问诊候选词集序列中位于所述目标候选词之后的问诊候选词集对所述候选词序列进行更新,直至所述目标候选词为所述候选词序列中的最后一个候选词时,将所述候选词序列中的各个候选词拼接成问诊文本。
可选地,所述从所述眼部图集中筛选出清晰眼部图组,包括:
对所述眼部图集中的各眼部图片进行灰度化操作,得到初级眼部灰度图集;
逐个选取所述初级眼部灰度图集中的初级眼部灰度图片作为目标眼部灰度图片,利用如下的灰度阶度算法计算出所述目标眼部灰度图片的眼部清晰度值:
Figure SMS_2
其中,Q是指所述眼部清晰度值,I是所述目标眼部灰度图片的图片像素长度,R是所述目标眼部灰度图片的图片像素宽度,i是指所述目标眼部灰度图片中的横向第i个像素,r是指所述目标眼部灰度图片中的纵向第r个像素,
Figure SMS_3
是指所述灰度阶度算法的采样框长,G是灰度符号,G(i,r) 是指所述目标眼部灰度图片中坐标点为(i,r)的像素的灰度值;
判断所述目标眼部灰度图片的眼部清晰度值是否大于预设的清晰度阈值;
若否,则返回所述逐个选取所述初级眼部灰度图集中的初级眼部灰度图片作为目标眼部灰度图片的步骤;
若是,则将所述目标眼部灰度图片添加到预设的清晰眼部图组中。
可选地,所述对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作,得到标准眼球图组,包括:
逐个选取所述滤波眼部图组中的滤波眼部图片作为目标滤波眼部图片,对所述目标滤波眼部图片进行边缘侵蚀操作,得到初级眼部边缘;
利用分水岭算法从所述初级眼部边缘中提取出初级眼球边缘,根据所述初级眼球边缘生成眼球掩膜,利用所述眼球掩膜对所述目标滤波眼部图片进行初级分割,得到初级眼球图片;
对所述初级眼球图片进行倾斜矫正和尺寸拉伸操作,得到矫正眼球图片;
生成所述矫正眼球图片的灰度直方图,利用所述灰度直方图对所述矫正眼球图片进行灰度均衡操作,得到标准眼球图片,并将所有的标准眼球图片汇集成标准眼球图组。
可选地,所述对所述标准眼球图组进行次级图片分割操作,得到眼白图组、瞳孔图组以及血管图组,包括:
逐个选取所述标准眼球图组中的标准眼球图片作为目标眼球图片,对所述目标眼球图片进行次级边缘侵蚀,得到次级眼球边缘图片;
对所述次级眼球边缘图片进行圆形拟合,得到瞳孔边缘图片;
根据所述瞳孔边缘图片对所述目标眼球图片进行图片分割,得到标准眼白图片和标准瞳孔图片;
利用所述瞳孔边缘图片对所述次级眼球边缘图片进行掩膜操作,得到初级血管图片,对所述初级血管图片进行各向异性滤波,得到标准血管图;
将所有的标准眼白图片汇集成眼白图组,将所有的标准瞳孔图片汇集成瞳孔图组,将所有的标准血管图片汇集成血管图组。
可选地,所述对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析,得到眼科观察病症,包括:
从所述眼白特征中识别出眼白病症语义,从所述瞳孔特征中识别出瞳孔病症语义,从所述血管特征中识别出血管病症语义;
将所述眼白病症语义、所述瞳孔病症语义以及所述血管病症语义汇集成眼部病症语义集;
对所述眼部病症语义集中的各眼部病症语义进行特征编码,得到病症语义特征编码;
利用预先训练的病症分析模型生成所述病症语义特征编码对应的多头病症语义向量集,利用所述病症分析模型的多头注意力机制计算出所述多头病症语义向量集对应的标准病症语义向量;
依次对所述标准病症语义向量进行归一化和特征解码操作,得到眼科观察病症。
为了解决上述问题,本发明还提供一种基于神经网络实现的眼科智能问诊装置,所述装置包括:
语音分帧模块,用于获取待诊断病患的问诊语音,对所述问诊语音进行纠偏滤波,得到滤波语音,以及将所述滤波语音分帧成问诊语音帧序列,对所述语音帧进行语音特征提取,得到问诊语音特征序列;
语音问诊模块,用于对所述语音特征序列进行音素识别,得到问诊音素序列,将所述音素序列自注意力转码成问诊文本,依次对所述问诊文本进行文本分词和向量化操作,得到问诊文本特征,对所述问诊文本特征进行语义识别,得到眼科描述病症;
图像均衡模块,用于获取所述待诊断病患的眼部图集,从所述眼部图集中筛选出清晰眼部图组,对所述清晰眼部图组进行灰度滤波操作,得到滤波眼部图组,并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作,得到标准眼球图组;
特征提取模块,用于对所述标准眼球图组进行次级图片分割操作,得到眼白图组、瞳孔图组以及血管图组,从所述眼白图组中提取出眼白特征,从所述瞳孔图组中提取出瞳孔特征,从所述血管图组中提取出血管特征;
结果生成模块,用于对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析,得到眼科观察病症,并根据所述眼科观察病症和所述眼科描述病症生成问诊结果。
本发明实施例通过对所述问诊语音进行纠偏滤波,得到滤波语音,可以减少问诊语音中的噪音趋势,保留更多的语音细节,通过将所述滤波语音分帧成问诊语音帧序列,可以方便对每帧语音进行单独音素分析,提高音素分析的准确性,通过对所述语音帧进行语音特征提取,得到问诊语音特征序列,可以保留多维语音特征,从而提高后续音素分析的准确性,通过对所述语音特征序列进行音素识别,得到问诊音素序列,将所述音素序列自注意力转码成问诊文本,可以将语音转化成文本,方便计算机进行语义理解,从而进行眼科病症诊断,通过依次对所述问诊文本进行文本分词和向量化操作,得到问诊文本特征,对所述问诊文本特征进行语义识别,得到眼科描述病症,可以根据待诊断病患的描述性语音进行初步的病症确定,从而提高眼科智能问诊的准确性,通过获取所述待诊断病患的眼部图集,从所述眼部图集中筛选出清晰眼部图组,可以选取眼部细节特征更多的眼部图片进行图片处理,通过对所述清晰眼部图组进行灰度滤波操作,得到滤波眼部图组,并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作,得到标准眼球图组,可以增强眼部图片的细节特征,同时方便后续进行特征对比,提高特征识别的准确率。
通过对所述标准眼球图组进行次级图片分割操作,得到眼白图组、瞳孔图组以及血管图组,从所述眼白图组中提取出眼白特征,从所述瞳孔图组中提取出瞳孔特征,从所述血管图组中提取出血管特征,可以分别对眼白、瞳孔以及血管进行病症分析,从而确保后续眼科观察病症的准确性,通过对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析,得到眼科观察病症,并根据所述眼科观察病症和所述眼科描述病症生成问诊结果,可以根据所述待诊断病患的病症问答分析和病区照片分析生成问诊结果,从而防止了因为缺乏病例基础数据或实时病症数据导致的问诊结果模糊的情况,提高了眼科智能问诊的准确率。因此本发明提出的基于神经网络实现的眼科智能问诊方法和装置,可以解决进行眼科智能问诊时的精确度较低的问题。
附图说明
图1为本发明一实施例提供的基于神经网络实现的眼科智能问诊方法的流程示意图;
图2为本发明一实施例提供的提取问诊语音特征序列的流程示意图;
图3为本发明一实施例提供的生成标准眼球图组的流程示意图;
图4为本发明一实施例提供的基于神经网络实现的眼科智能问诊装置的功能模块图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于神经网络实现的眼科智能问诊方法。所述基于神经网络实现的眼科智能问诊方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于神经网络实现的眼科智能问诊方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参照图1所示,为本发明一实施例提供的基于神经网络实现的眼科智能问诊方法的流程示意图。在本实施例中,所述基于神经网络实现的眼科智能问诊方法包括:
S1、获取待诊断病患的问诊语音,对所述问诊语音进行纠偏滤波,得到滤波语音,将所述滤波语音分帧成问诊语音帧序列,对所述语音帧进行语音特征提取,得到问诊语音特征序列。
本发明实施例中,所述待诊断病患是指需要进行眼科智能问诊的病患,所述问诊语义是指根据设定的问诊问题而进行回答的患者的答复语音,例如所述待诊断病患的过往病史以及自觉症状等。
本发明实施例中,所述对所述问诊语音进行纠偏滤波,得到滤波语音,包括:
对所述问诊语音进行列信号转化,得到问诊列信号,根据所述问诊列信号生成所述问诊语音的时间序列;
根据所述问诊列信号和所述时间序列生成所述问诊语音的语音趋势项,并根据所述语音趋势项对所述问诊列信号进行语音纠偏,得到纠偏语音;
对所述纠偏语音进行除噪滤波,得到滤波语音。
详细地,可以利用matlab对所述问诊语音进行列信号转化,得到问诊列信号,并从所述问诊列信号中提取出语音时长,根据所述语音时长和所述问诊列信号的采样频率计算出所述问诊语音的时间序列。
详细地,可以利用最小二乘法根据所述问诊列信号和所述时间序列生成所述问诊语音的语音趋势项,所述根据所述语音趋势项对所述问诊列信号进行语音纠偏,得到纠偏语音是指将所述问诊列信号中的语音趋势项删除,得到纠偏语音,可以利用filterDesigner滤波器对对所述纠偏语音进行除噪滤波,得到滤波语音。
具体地,所述将所述滤波语音分帧成问诊语音帧序列,包括:
按照预设的分帧窗长对所述滤波语音进行初级分帧,得到分帧语音序列;
利用如下的主瓣加窗算法对所述分帧语音序列进行加窗处理,得到加窗语音序列:
Figure SMS_4
其中,H(w)是指所述加窗语音序列中第w个加窗语音的频率值,A(w)是指所述分帧语音序列中第w个分帧语音的频率值,π是圆周率符号,N是指所述主瓣加窗算法对应的语音窗长度,e是欧拉数符号,j是虚数符号;
计算出所述加窗语音序列的平均过零率和短时语音能量,根据所述平均过零率和所述短时语音能量对所述加窗语音序列进行端点检测,得到问诊语音帧序列。
本发明实施例中,通过利用所述主瓣加窗算法对所述分帧语音序列进行加窗处理,得到加窗语音序列,可以使得分帧语音序列中的旁瓣语音相互抵消,使得语音能量集中在主瓣,从而保留语音特征细节。
具体地,所述平均过零率是指短时间信号通过零值的次数,所述短时语音能量是指短时间中的语音信号的能量特征变化。
详细地,参照图2所示,所述对所述语音帧进行语音特征提取,得到问诊语音特征序列,包括:
S21、对所述问诊语音特征序列进行快速离散傅里叶变换,得到问诊语音频谱序列;
S22、对所述问诊语音频谱序列进行梅尔滤波,得到问诊梅尔频谱序列;
S23、对所述问诊梅尔频谱序列进行对数逆变换,得到问诊语音特征序列。
详细地,所述快速离散傅里叶变换(fast Fourier transform,简称DFT),基本思想是把原始的多点序列,依次分解成一系列的短序列,充分利用快速离散傅里叶变换计算式中指数因子所具有的对称性质和周期性质,进而求出这些短序列相应的快速离散傅里叶变换并进行适当组合,达到删除重复计算,减少乘法运算和简化结构的目的。
具体地,可以利用MATLAB或python的梅尔滤波器对所述问诊语音频谱序列进行梅尔滤波,得到问诊梅尔频谱序列,可以利用离散余弦变换(Discrete Cosine Transform,简称DCT) 对所述问诊梅尔频谱序列进行对数逆变换,得到问诊语音特征序列。
本发明实施例中,通过对所述问诊语音进行纠偏滤波,得到滤波语音,可以减少问诊语音中的噪音趋势,保留更多的语音细节,通过将所述滤波语音分帧成问诊语音帧序列,可以方便对每帧语音进行单独音素分析,提高音素分析的准确性,通过对所述语音帧进行语音特征提取,得到问诊语音特征序列,可以保留多维语音特征,从而提高后续音素分析的准确性。
S2、对所述语音特征序列进行音素识别,得到问诊音素序列,将所述音素序列自注意力转码成问诊文本,依次对所述问诊文本进行文本分词和向量化操作,得到问诊文本特征,对所述问诊文本特征进行语义识别,得到眼科描述病症。
本发明实施例中,所述对所述语音特征序列进行音素识别,得到问诊音素序列,包括:
为所述语音特征序列添加位置特征,得到语音特征编码;
生成所述语音特征编码的多头语音编码向量集,并利用自注意力机制计算出所述多头语音编码向量集对应的语素注意力特征;
对所述语素注意力特征进行注意力解码,得到问诊音素序列。
具体地,所述位置特征是指所述语音特征序列中处于不同位置的语音特征的位置特征,所述生成所述语音特征编码的多头语音编码向量集是指生成所述语音特征编码对应的querry向量,key向量以及value向量。
详细地,所述利用自注意力机制计算出所述多头语音编码向量集对应的语素注意力特征是指将所述多头语音编码向量集中的各向量进行矩阵计算,并进行归一化操作,得到语素注意力特征,所述对所述语素注意力特征进行注意力解码,得到问诊音素序列是指利用多个位置前馈网络、残差网络层以及归一化层对所述语素注意力特征进行解码,得到问诊音素序列。
本发明实施例中,所述将所述音素序列自注意力转码成问诊文本,包括:
利用预先训练的自注意力模型对所述音素序列进行初级解码,得到问诊候选词集序列;
根据所述问诊候选词集序列生成候选词序列,逐个选取所述候选词序列中的候选词作为目标候选词,利用预先训练的语义网络生成所述目标候选词对应后接词集;
根据所述后接词集和所述问诊候选词集序列中位于所述目标候选词之后的问诊候选词集对所述候选词序列进行更新,直至所述目标候选词为所述候选词序列中的最后一个候选词时,将所述候选词序列中的各个候选词拼接成问诊文本。
详细地,所述自注意力模型可以是以多个标注的音素训练集训练得到的transformer模型,所述语义网络可以是经过大量连续文本训练后的时序神经网络。
具体地,所述根据所述后接词集和所述问诊候选词集序列中位于所述目标候选词之后的问诊候选词集对所述候选词序列进行更新是指将所述后接词集和所述所述问诊候选词集序列中位于所述目标候选词之后的问诊候选词集融合成标准候选词集,并选取所述标准候选词集中正确率最大的候选词对所述候选词序列中位于所述目标候选词之后的候选词进行替换,得到更新后的候选词序列。
具体地,可以利用双向最大匹配算法对所述问诊文本进行文本分词,得到问诊文本词集,筛除所述问诊文本词集中的停用词,得到标准问诊词集,利用独热编码或word2vec算法对所述标准问诊词集进行向量化操作,得到问诊文本特征。
详细地,可以利用大量经过病症标注后的问诊句子特征集训练后的自注意力模型对所述对所述问诊文本特征进行语义识别,得到眼科描述病症。
本发明实施例中,通过对所述语音特征序列进行音素识别,得到问诊音素序列,将所述音素序列自注意力转码成问诊文本,可以将语音转化成文本,方便计算机进行语义理解,从而进行眼科病症诊断,通过依次对所述问诊文本进行文本分词和向量化操作,得到问诊文本特征,对所述问诊文本特征进行语义识别,得到眼科描述病症,可以根据待诊断病患的描述性语音进行初步的病症确定,从而提高眼科智能问诊的准确性。
S3、获取所述待诊断病患的眼部图集,从所述眼部图集中筛选出清晰眼部图组,对所述清晰眼部图组进行灰度滤波操作,得到滤波眼部图组,并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作,得到标准眼球图组。
本发明实施例中,所述眼部图集是指对所述待诊断病患的眼部进行近距离拍摄得到的图片,所述清晰眼部图组是指由所述眼部图集中多张较为清晰的眼部图片组成的图组。
本发明实施例中,所述从所述眼部图集中筛选出清晰眼部图组,包括:
对所述眼部图集中的各眼部图片进行灰度化操作,得到初级眼部灰度图集;
逐个选取所述初级眼部灰度图集中的初级眼部灰度图片作为目标眼部灰度图片,利用如下的灰度阶度算法计算出所述目标眼部灰度图片的眼部清晰度值:
Figure SMS_5
其中,Q是指所述眼部清晰度值,I是所述目标眼部灰度图片的图片像素长度,R是所述目标眼部灰度图片的图片像素宽度,i是指所述目标眼部灰度图片中的横向第i个像素,r是指所述目标眼部灰度图片中的纵向第r个像素,
Figure SMS_6
是指所述灰度阶度算法的采样框长,G是灰度符号,G(i,r) 是指所述目标眼部灰度图片中坐标点为(i,r)的像素的灰度值;
判断所述目标眼部灰度图片的眼部清晰度值是否大于预设的清晰度阈值;
若否,则返回所述逐个选取所述初级眼部灰度图集中的初级眼部灰度图片作为目标眼部灰度图片的步骤;
若是,则将所述目标眼部灰度图片添加到预设的清晰眼部图组中。
本发明实施例中,通过利用所述灰度阶度算法计算出所述目标眼部灰度图片的眼部清晰度值,可以根据所述目标眼部灰度图片中各区域中灰度变化的幅度值判断该目标眼部灰度图片整体的清晰度,从而提高清晰度计算的准确性。
详细地,可以利用高斯滤波算法或中值滤波算范对对所述清晰眼部图组进行灰度滤波操作,得到滤波眼部图组。
具体地,参照图3所示,所述对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作,得到标准眼球图组,包括:
S31、逐个选取所述滤波眼部图组中的滤波眼部图片作为目标滤波眼部图片,对所述目标滤波眼部图片进行边缘侵蚀操作,得到初级眼部边缘;
S32、利用分水岭算法从所述初级眼部边缘中提取出初级眼球边缘,根据所述初级眼球边缘生成眼球掩膜,利用所述眼球掩膜对所述目标滤波眼部图片进行初级分割,得到初级眼球图片;
S33、对所述初级眼球图片进行倾斜矫正和尺寸拉伸操作,得到矫正眼球图片;
S34、生成所述矫正眼球图片的灰度直方图,利用所述灰度直方图对所述矫正眼球图片进行灰度均衡操作,得到标准眼球图片,并将所有的标准眼球图片汇集成标准眼球图组。
本发明实施例中,可以利用canny算子或sobel算子对所述目标滤波眼部图片进行边缘侵蚀操作,得到初级眼部边缘,可以利用hough算法对所述初级眼球图片进行倾斜矫正,所述尺寸拉伸是指将所述初级眼球图片的图片大小等比例放大到预设的图片尺寸。
本发明实施例中,通过获取所述待诊断病患的眼部图集,从所述眼部图集中筛选出清晰眼部图组,可以选取眼部细节特征更多的眼部图片进行图片处理,通过对所述清晰眼部图组进行灰度滤波操作,得到滤波眼部图组,并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作,得到标准眼球图组,可以增强眼部图片的细节特征,同时方便后续进行特征对比,提高特征识别的准确率。
S4、对所述标准眼球图组进行次级图片分割操作,得到眼白图组、瞳孔图组以及血管图组,从所述眼白图组中提取出眼白特征,从所述瞳孔图组中提取出瞳孔特征,从所述血管图组中提取出血管特征。
本发明实施例中,所述对所述标准眼球图组进行次级图片分割操作,得到眼白图组、瞳孔图组以及血管图组,包括:
逐个选取所述标准眼球图组中的标准眼球图片作为目标眼球图片,对所述目标眼球图片进行次级边缘侵蚀,得到次级眼球边缘图片;
对所述次级眼球边缘图片进行圆形拟合,得到瞳孔边缘图片;
根据所述瞳孔边缘图片对所述目标眼球图片进行图片分割,得到标准眼白图片和标准瞳孔图片;
利用所述瞳孔边缘图片对所述次级眼球边缘图片进行掩膜操作,得到初级血管图片,对所述初级血管图片进行各向异性滤波,得到标准血管图;
将所有的标准眼白图片汇集成眼白图组,将所有的标准瞳孔图片汇集成瞳孔图组,将所有的标准血管图片汇集成血管图组。
详细地,所述对所述目标眼球图片进行次级边缘侵蚀,得到次级眼球边缘图片的方法与上述步骤S3中的所述对所述目标滤波眼部图片进行边缘侵蚀操作,得到初级眼部边缘的方法一致,这里不再赘述。
详细地,可以利用最小二乘法对所述次级眼球边缘图片进行圆形拟合,得到瞳孔边缘图片,所述各向异性滤波(Anisotropic Filtering,简称AF),可以将纹理特征和图片角度等因素进行关联并滤波,保留更多的纹理特征。
详细地,所述从所述眼白图组中提取出眼白特征,从所述瞳孔图组中提取出瞳孔特征,从所述血管图组中提取出血管特征是指利用预先训练的卷积神经网络分别对眼白图组中的各眼白图片进行特征降维、对瞳孔图组中的各瞳孔图片进行特征降维以及对血管图组中的各血管图片进行特征降维,从而方便后续的特征识别,降低计算维度。
本发明实施例中,通过对所述标准眼球图组进行次级图片分割操作,得到眼白图组、瞳孔图组以及血管图组,从所述眼白图组中提取出眼白特征,从所述瞳孔图组中提取出瞳孔特征,从所述血管图组中提取出血管特征,可以分别对眼白、瞳孔以及血管进行病症分析,从而确保后续眼科观察病症的准确性。
S5、对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析,得到眼科观察病症,并根据所述眼科观察病症和所述眼科描述病症生成问诊结果。
本发明实施例中,所述对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析,得到眼科观察病症,包括:
从所述眼白特征中识别出眼白病症语义,从所述瞳孔特征中识别出瞳孔病症语义,从所述血管特征中识别出血管病症语义;
将所述眼白病症语义、所述瞳孔病症语义以及所述血管病症语义汇集成眼部病症语义集;
对所述眼部病症语义集中的各眼部病症语义进行特征编码,得到病症语义特征编码;
利用预先训练的病症分析模型生成所述病症语义特征编码对应的多头病症语义向量集,利用所述病症分析模型的多头注意力机制计算出所述多头病症语义向量集对应的标准病症语义向量;
依次对所述标准病症语义向量进行归一化和特征解码操作,得到眼科观察病症。
详细地,所述病症分析模型可以是经过大量标注后的病症语义训练后的支持向量机模型,可以利用softmax函数对所述标准病症语义向量进行归一化,可以利用多层感知机(Multilayer Perceptron)对所述标准病症语义向量进行特征解码操作,得到眼科观察病症。
详细地,所述根据所述眼科观察病症和所述眼科描述病症生成问诊结果是指将所述眼科观察病症和所述标准眼球图组生成观察病症结果,将所述眼科描述病症和所述问诊文本生成描述病症结果,并将所述观察病症结果和所述描述病症结果拼接成问诊结果,所述问诊结果可以反馈给眼科医生,从而辅助眼科医生进行病症决断。
本发明实施例中,通过对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析,得到眼科观察病症,并根据所述眼科观察病症和所述眼科描述病症生成问诊结果,可以根据所述待诊断病患的病症问答分析和病区照片分析生成问诊结果,从而防止了因为缺乏病例基础数据或实时病症数据导致的问诊结果模糊的情况,提高了眼科智能问诊的准确率。
本发明实施例通过对所述问诊语音进行纠偏滤波,得到滤波语音,可以减少问诊语音中的噪音趋势,保留更多的语音细节,通过将所述滤波语音分帧成问诊语音帧序列,可以方便对每帧语音进行单独音素分析,提高音素分析的准确性,通过对所述语音帧进行语音特征提取,得到问诊语音特征序列,可以保留多维语音特征,从而提高后续音素分析的准确性,通过对所述语音特征序列进行音素识别,得到问诊音素序列,将所述音素序列自注意力转码成问诊文本,可以将语音转化成文本,方便计算机进行语义理解,从而进行眼科病症诊断,通过依次对所述问诊文本进行文本分词和向量化操作,得到问诊文本特征,对所述问诊文本特征进行语义识别,得到眼科描述病症,可以根据待诊断病患的描述性语音进行初步的病症确定,从而提高眼科智能问诊的准确性,通过获取所述待诊断病患的眼部图集,从所述眼部图集中筛选出清晰眼部图组,可以选取眼部细节特征更多的眼部图片进行图片处理,通过对所述清晰眼部图组进行灰度滤波操作,得到滤波眼部图组,并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作,得到标准眼球图组,可以增强眼部图片的细节特征,同时方便后续进行特征对比,提高特征识别的准确率。
本发明实施例中,通过对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析,得到眼科观察病症,并根据所述眼科观察病症和所述眼科描述病症生成问诊结果,可以根据所述待诊断病患的病症问答分析和病区照片分析生成问诊结果,从而防止了因为缺乏病例基础数据或实时病症数据导致的问诊结果模糊的情况,提高了眼科智能问诊的准确率。
本发明实施例通过对所述问诊语音进行纠偏滤波,得到滤波语音,可以减少问诊语音中的噪音趋势,保留更多的语音细节,通过将所述滤波语音分帧成问诊语音帧序列,可以方便对每帧语音进行单独音素分析,提高音素分析的准确性,通过对所述语音帧进行语音特征提取,得到问诊语音特征序列,可以保留多维语音特征,从而提高后续音素分析的准确性,通过对所述语音特征序列进行音素识别,得到问诊音素序列,将所述音素序列自注意力转码成问诊文本,可以将语音转化成文本,方便计算机进行语义理解,从而进行眼科病症诊断,通过依次对所述问诊文本进行文本分词和向量化操作,得到问诊文本特征,对所述问诊文本特征进行语义识别,得到眼科描述病症,可以根据待诊断病患的描述性语音进行初步的病症确定,从而提高眼科智能问诊的准确性,通过获取所述待诊断病患的眼部图集,从所述眼部图集中筛选出清晰眼部图组,可以选取眼部细节特征更多的眼部图片进行图片处理,通过对所述清晰眼部图组进行灰度滤波操作,得到滤波眼部图组,并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作,得到标准眼球图组,可以增强眼部图片的细节特征,同时方便后续进行特征对比,提高特征识别的准确率。
所述基于神经网络实现的眼科智能问诊装置100可以实现上述基于神经网络实现的眼科智能问诊方法,且所述基于神经网络实现的眼科智能问诊装置100可以安装于电子设备中。根据实现的功能,所述基于神经网络实现的眼科智能问诊装置100可以包括语音分帧模块101、语音问诊模块102、图像均衡模块103、特征提取模块104及结果生成模块105。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述语音分帧模块101,用于获取待诊断病患的问诊语音,对所述问诊语音进行纠偏滤波,得到滤波语音,将所述滤波语音分帧成问诊语音帧序列,对所述语音帧进行语音特征提取,得到问诊语音特征序列,其中,所述将所述滤波语音分帧成问诊语音帧序列,包括:按照预设的分帧窗长对所述滤波语音进行初级分帧,得到分帧语音序列;利用如下的主瓣加窗算法对所述分帧语音序列进行加窗处理,得到加窗语音序列:
Figure SMS_7
其中,H(w)是指所述加窗语音序列中第w个加窗语音的频率值,A(w)是指所述分帧语音序列中第w个分帧语音的频率值,π是圆周率符号,N是指所述主瓣加窗算法对应的语音窗长度,e是欧拉数符号,j是虚数符号;计算出所述加窗语音序列的平均过零率和短时语音能量,根据所述平均过零率和所述短时语音能量对所述加窗语音序列进行端点检测,得到问诊语音帧序列;
所述语音问诊模块102,用于对所述语音特征序列进行音素识别,得到问诊音素序列,将所述音素序列自注意力转码成问诊文本,依次对所述问诊文本进行文本分词和向量化操作,得到问诊文本特征,对所述问诊文本特征进行语义识别,得到眼科描述病症;
所述图像均衡模块103,用于获取所述待诊断病患的眼部图集,从所述眼部图集中筛选出清晰眼部图组,对所述清晰眼部图组进行灰度滤波操作,得到滤波眼部图组,并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作,得到标准眼球图组;
所述特征提取模块104,用于对所述标准眼球图组进行次级图片分割操作,得到眼白图组、瞳孔图组以及血管图组,从所述眼白图组中提取出眼白特征,从所述瞳孔图组中提取出瞳孔特征,从所述血管图组中提取出血管特征;
所述结果生成模块105,用于对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析,得到眼科观察病症,并根据所述眼科观察病症和所述眼科描述病症生成问诊结果。
详细地,本发明实施例中所述基于神经网络实现的眼科智能问诊装置100中所述的各模块在使用时采用与上述图1至图3中所述的基于神经网络实现的眼科智能问诊方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (9)

1.一种基于神经网络实现的眼科智能问诊方法,其特征在于,所述方法包括:
S1:获取待诊断病患的问诊语音,对所述问诊语音进行纠偏滤波,得到滤波语音,将所述滤波语音分帧成问诊语音帧序列,对所述语音帧进行语音特征提取,得到问诊语音特征序列,其中,所述将所述滤波语音分帧成问诊语音帧序列,包括:
S11:按照预设的分帧窗长对所述滤波语音进行初级分帧,得到分帧语音序列;
S12:利用如下的主瓣加窗算法对所述分帧语音序列进行加窗处理,得到加窗语音序列:
Figure QLYQS_1
其中,H(w)是指所述加窗语音序列中第w个加窗语音的频率值,A(w)是指所述分帧语音序列中第w个分帧语音的频率值,π是圆周率符号,N是指所述主瓣加窗算法对应的语音窗长度,e是欧拉数符号,j是虚数符号;
S13:计算出所述加窗语音序列的平均过零率和短时语音能量,根据所述平均过零率和所述短时语音能量对所述加窗语音序列进行端点检测,得到问诊语音帧序列;
S2:对所述语音特征序列进行音素识别,得到问诊音素序列,将所述音素序列自注意力转码成问诊文本,依次对所述问诊文本进行文本分词和向量化操作,得到问诊文本特征,对所述问诊文本特征进行语义识别,得到眼科描述病症;
S3:获取所述待诊断病患的眼部图集,从所述眼部图集中筛选出清晰眼部图组,对所述清晰眼部图组进行灰度滤波操作,得到滤波眼部图组,并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作,得到标准眼球图组;
S4:对所述标准眼球图组进行次级图片分割操作,得到眼白图组、瞳孔图组以及血管图组,从所述眼白图组中提取出眼白特征,从所述瞳孔图组中提取出瞳孔特征,从所述血管图组中提取出血管特征;
S5:对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析,得到眼科观察病症,并根据所述眼科观察病症和所述眼科描述病症生成问诊结果;
所述对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析,得到眼科观察病症,包括:
从所述眼白特征中识别出眼白病症语义,从所述瞳孔特征中识别出瞳孔病症语义,从所述血管特征中识别出血管病症语义;
将所述眼白病症语义、所述瞳孔病症语义以及所述血管病症语义汇集成眼部病症语义集;
对所述眼部病症语义集中的各眼部病症语义进行特征编码,得到病症语义特征编码;
利用预先训练的病症分析模型生成所述病症语义特征编码对应的多头病症语义向量集,利用所述病症分析模型的多头注意力机制计算出所述多头病症语义向量集对应的标准病症语义向量;
依次对所述标准病症语义向量进行归一化和特征解码操作,得到眼科观察病症;
所述病症分析模型是经过标注后的病症语义训练得到的支持向量机模型,利用softmax函数对所述标准病症语义向量进行归一化,利用多层感知机对所述标准病症语义向量进行特征解码操作得到眼科观察病症;
所述根据所述眼科观察病症和所述眼科描述病症生成问诊结果是指将所述眼科观察病症和所述标准眼球图组生成观察病症结果,将所述眼科描述病症和所述问诊文本生成描述病症结果,并将所述观察病症结果和所述描述病症结果拼接成问诊结果。
2.如权利要求1所述的眼科智能问诊方法,其特征在于,所述对所述问诊语音进行纠偏滤波,得到滤波语音,包括:
对所述问诊语音进行列信号转化,得到问诊列信号,根据所述问诊列信号生成所述问诊语音的时间序列;
根据所述问诊列信号和所述时间序列生成所述问诊语音的语音趋势项,并根据所述语音趋势项对所述问诊列信号进行语音纠偏,得到纠偏语音;
对所述纠偏语音进行除噪滤波,得到滤波语音。
3.如权利要求1所述的眼科智能问诊方法,其特征在于,所述对所述语音帧进行语音特征提取,得到问诊语音特征序列,包括:
对所述问诊语音特征序列进行快速离散傅里叶变换,得到问诊语音频谱序列;
对所述问诊语音频谱序列进行梅尔滤波,得到问诊梅尔频谱序列;
对所述问诊梅尔频谱序列进行对数逆变换,得到问诊语音特征序列。
4.如权利要求1所述的眼科智能问诊方法,其特征在于,所述对所述语音特征序列进行音素识别,得到问诊音素序列,包括:
为所述语音特征序列添加位置特征,得到语音特征编码;
生成所述语音特征编码的多头语音编码向量集,并利用自注意力机制计算出所述多头语音编码向量集对应的语素注意力特征;
对所述语素注意力特征进行注意力解码,得到问诊音素序列。
5.如权利要求1所述的眼科智能问诊方法,其特征在于,所述将所述音素序列自注意力转码成问诊文本,包括:
利用预先训练的自注意力模型对所述音素序列进行初级解码,得到问诊候选词集序列;
根据所述问诊候选词集序列生成候选词序列,逐个选取所述候选词序列中的候选词作为目标候选词,利用预先训练的语义网络生成所述目标候选词对应后接词集;
根据所述后接词集和所述问诊候选词集序列中位于所述目标候选词之后的问诊候选词集对所述候选词序列进行更新,直至所述目标候选词为所述候选词序列中的最后一个候选词时,将所述候选词序列中的各个候选词拼接成问诊文本。
6.如权利要求1所述的眼科智能问诊方法,其特征在于,所述从所述眼部图集中筛选出清晰眼部图组,包括:
对所述眼部图集中的各眼部图片进行灰度化操作,得到初级眼部灰度图集;
逐个选取所述初级眼部灰度图集中的初级眼部灰度图片作为目标眼部灰度图片,利用如下的灰度阶度算法计算出所述目标眼部灰度图片的眼部清晰度值:
Figure QLYQS_2
其中,Q是指所述眼部清晰度值,I是所述目标眼部灰度图片的图片像素长度,R是所述目标眼部灰度图片的图片像素宽度,i是指所述目标眼部灰度图片中的横向第i个像素,r是指所述目标眼部灰度图片中的纵向第r个像素,
Figure QLYQS_3
是指所述灰度阶度算法的采样框长,G是灰度符号,G(i,r) 是指所述目标眼部灰度图片中坐标点为(i,r)的像素的灰度值;
判断所述目标眼部灰度图片的眼部清晰度值是否大于预设的清晰度阈值;
若否,则返回所述逐个选取所述初级眼部灰度图集中的初级眼部灰度图片作为目标眼部灰度图片的步骤;
若是,则将所述目标眼部灰度图片添加到预设的清晰眼部图组中。
7.如权利要求1所述的眼科智能问诊方法,其特征在于,所述对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作,得到标准眼球图组,包括:
逐个选取所述滤波眼部图组中的滤波眼部图片作为目标滤波眼部图片,对所述目标滤波眼部图片进行边缘侵蚀操作,得到初级眼部边缘;
利用分水岭算法从所述初级眼部边缘中提取出初级眼球边缘,根据所述初级眼球边缘生成眼球掩膜,利用所述眼球掩膜对所述目标滤波眼部图片进行初级分割,得到初级眼球图片;
对所述初级眼球图片进行倾斜矫正和尺寸拉伸操作,得到矫正眼球图片;
生成所述矫正眼球图片的灰度直方图,利用所述灰度直方图对所述矫正眼球图片进行灰度均衡操作,得到标准眼球图片,并将所有的标准眼球图片汇集成标准眼球图组。
8.如权利要求1所述的眼科智能问诊方法,其特征在于,所述对所述标准眼球图组进行次级图片分割操作,得到眼白图组、瞳孔图组以及血管图组,包括:
逐个选取所述标准眼球图组中的标准眼球图片作为目标眼球图片,对所述目标眼球图片进行次级边缘侵蚀,得到次级眼球边缘图片;
对所述次级眼球边缘图片进行圆形拟合,得到瞳孔边缘图片;
根据所述瞳孔边缘图片对所述目标眼球图片进行图片分割,得到标准眼白图片和标准瞳孔图片;
利用所述瞳孔边缘图片对所述次级眼球边缘图片进行掩膜操作,得到初级血管图片,对所述初级血管图片进行各向异性滤波,得到标准血管图;
将所有的标准眼白图片汇集成眼白图组,将所有的标准瞳孔图片汇集成瞳孔图组,将所有的标准血管图片汇集成血管图组。
9.一种用于实现权利要求1-8任一项所述眼科智能问诊方法的问诊装置,其特征在于,所述装置包括:
语音分帧模块,用于获取待诊断病患的问诊语音,对所述问诊语音进行纠偏滤波,得到滤波语音,以及将所述滤波语音分帧成问诊语音帧序列,对所述语音帧进行语音特征提取,得到问诊语音特征序列;
语音问诊模块,用于对所述语音特征序列进行音素识别,得到问诊音素序列,将所述音素序列自注意力转码成问诊文本,依次对所述问诊文本进行文本分词和向量化操作,得到问诊文本特征,对所述问诊文本特征进行语义识别,得到眼科描述病症;
图像均衡模块,用于获取所述待诊断病患的眼部图集,从所述眼部图集中筛选出清晰眼部图组,对所述清晰眼部图组进行灰度滤波操作,得到滤波眼部图组,并对所述滤波眼部图组中的各滤波眼部图片进行初级图片分割和尺寸均衡化操作,得到标准眼球图组;
特征提取模块,用于对所述标准眼球图组进行次级图片分割操作,得到眼白图组、瞳孔图组以及血管图组,从所述眼白图组中提取出眼白特征,从所述瞳孔图组中提取出瞳孔特征,从所述血管图组中提取出血管特征;
结果生成模块,用于对所述眼白特征、所述瞳孔特征以及所述血管特征进行病变特征分析,得到眼科观察病症,并根据所述眼科观察病症和所述眼科描述病症生成问诊结果。
CN202310395603.5A 2023-04-14 2023-04-14 一种基于神经网络实现的眼科智能问诊方法和装置 Active CN116110574B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202310395603.5A CN116110574B (zh) 2023-04-14 2023-04-14 一种基于神经网络实现的眼科智能问诊方法和装置
US18/465,977 US11955240B1 (en) 2023-04-14 2023-09-12 Neural-network-based-implemented ophthalmologic intelligent consultation method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310395603.5A CN116110574B (zh) 2023-04-14 2023-04-14 一种基于神经网络实现的眼科智能问诊方法和装置

Publications (2)

Publication Number Publication Date
CN116110574A CN116110574A (zh) 2023-05-12
CN116110574B true CN116110574B (zh) 2023-06-20

Family

ID=86254705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310395603.5A Active CN116110574B (zh) 2023-04-14 2023-04-14 一种基于神经网络实现的眼科智能问诊方法和装置

Country Status (2)

Country Link
US (1) US11955240B1 (zh)
CN (1) CN116110574B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007125151A (ja) * 2005-11-02 2007-05-24 Konica Minolta Holdings Inc 診断システム及び診断装置
CN104637031A (zh) * 2013-11-12 2015-05-20 华为终端有限公司 眼部图像处理方法和装置
CN108091393A (zh) * 2017-12-31 2018-05-29 徐建 机器人医生的疾病诊断治疗方法
EP3449810A1 (en) * 2017-09-05 2019-03-06 Nidek Co., Ltd. Ophthalmological image processing program
WO2019180742A1 (en) * 2018-03-21 2019-09-26 Artificial Learning Systems India Private Limited System and method for retinal fundus image semantic segmentation
US10430946B1 (en) * 2019-03-14 2019-10-01 Inception Institute of Artificial Intelligence, Ltd. Medical image segmentation and severity grading using neural network architectures with semi-supervised learning techniques
CN111667490A (zh) * 2020-05-07 2020-09-15 清华大学深圳国际研究生院 一种眼底图片视杯视盘分割方法
CN112233087A (zh) * 2020-10-14 2021-01-15 武汉楚精灵医疗科技有限公司 一种基于人工智能的眼科超声疾病诊断方法和系统
CN112513999A (zh) * 2017-10-13 2021-03-16 人工智能技术公司 眼科疾病和病症的基于深度学习的诊断和转诊
CN114140437A (zh) * 2021-12-03 2022-03-04 杭州电子科技大学 一种基于深度学习的眼底硬渗出物分割方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008039252A2 (en) * 2006-05-15 2008-04-03 Retica Systems, Inc. Multimodal ocular biometric system
WO2008091401A2 (en) * 2006-09-15 2008-07-31 Retica Systems, Inc Multimodal ocular biometric system and methods
US20080198328A1 (en) * 2007-02-16 2008-08-21 Seriani Joseph S System and method self enabling customers to obtain refraction specifications for, and purchase of, previous or new fitted eyeglasses
US9131837B2 (en) * 2010-06-25 2015-09-15 Annidis Corporation Method and apparatus for imaging the choroid
US10332639B2 (en) * 2017-05-02 2019-06-25 James Paul Smurro Cognitive collaboration with neurosynaptic imaging networks, augmented medical intelligence and cybernetic workflow streams
EP3439730A4 (en) * 2016-04-06 2019-12-25 Mupharma Pty Ltd SOUND WAVE-MEDIATED NON-INVASIVE MEDICINE DELIVERY
JP6815798B2 (ja) * 2016-09-09 2021-01-20 株式会社トプコン 眼科撮影装置及び眼科画像処理装置
RU2016138608A (ru) * 2016-09-29 2018-03-30 Мэджик Лип, Инк. Нейронная сеть для сегментации изображения глаза и оценки качества изображения
CN108198620B (zh) * 2018-01-12 2022-03-22 洛阳飞来石软件开发有限公司 一种基于深度学习的皮肤疾病智能辅助诊断系统
CN110335266B (zh) * 2019-07-04 2023-04-07 五邑大学 一种智能中医目诊图像处理方法及装置
CN113539242A (zh) * 2020-12-23 2021-10-22 腾讯科技(深圳)有限公司 语音识别方法、装置、计算机设备及存储介质
CN113488200B (zh) * 2021-07-26 2023-07-25 平安科技(深圳)有限公司 智能问诊的方法、装置、计算机设备及存储介质
CN113707301A (zh) * 2021-08-30 2021-11-26 康键信息技术(深圳)有限公司 基于人工智能的远程问诊方法、装置、设备及介质
CN113962311A (zh) * 2021-10-27 2022-01-21 厦门大学 知识数据和人工智能驱动的眼科多病种识别系统
CN114388145A (zh) * 2021-12-29 2022-04-22 阿里健康科技(杭州)有限公司 一种在线问诊方法和装置
CN114582008A (zh) * 2022-03-03 2022-06-03 北方工业大学 一种基于双波段的活体虹膜检测方法
CN115512698B (zh) * 2022-06-13 2023-05-26 南方电网数字电网研究院有限公司 一种语音语义分析方法
CN114996463B (zh) * 2022-07-18 2022-11-01 武汉大学人民医院(湖北省人民医院) 一种病例的智能分类方法和装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007125151A (ja) * 2005-11-02 2007-05-24 Konica Minolta Holdings Inc 診断システム及び診断装置
CN104637031A (zh) * 2013-11-12 2015-05-20 华为终端有限公司 眼部图像处理方法和装置
EP3449810A1 (en) * 2017-09-05 2019-03-06 Nidek Co., Ltd. Ophthalmological image processing program
CN112513999A (zh) * 2017-10-13 2021-03-16 人工智能技术公司 眼科疾病和病症的基于深度学习的诊断和转诊
CN108091393A (zh) * 2017-12-31 2018-05-29 徐建 机器人医生的疾病诊断治疗方法
WO2019180742A1 (en) * 2018-03-21 2019-09-26 Artificial Learning Systems India Private Limited System and method for retinal fundus image semantic segmentation
US10430946B1 (en) * 2019-03-14 2019-10-01 Inception Institute of Artificial Intelligence, Ltd. Medical image segmentation and severity grading using neural network architectures with semi-supervised learning techniques
CN111667490A (zh) * 2020-05-07 2020-09-15 清华大学深圳国际研究生院 一种眼底图片视杯视盘分割方法
CN112233087A (zh) * 2020-10-14 2021-01-15 武汉楚精灵医疗科技有限公司 一种基于人工智能的眼科超声疾病诊断方法和系统
CN114140437A (zh) * 2021-12-03 2022-03-04 杭州电子科技大学 一种基于深度学习的眼底硬渗出物分割方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于人工智能网络问诊平台的初步分析与应用;高铭烩;刘玉渟;张月;刘明明;;无线互联科技(09);47-48 *
新冠肺炎疫情期间眼科互联网人工智能诊疗服务开展效果分析;吴晓航;陈睛晶;刘臻臻;晏丕松;胡伟玲;吴子健;林怀德;王延东;吴雁凌;陈茗菲;张草贤;郑永欣;柳夏林;林晓峰;刘奕志;林浩添;;中国数字医学(09);12-17 *

Also Published As

Publication number Publication date
US11955240B1 (en) 2024-04-09
CN116110574A (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
CN105160318B (zh) 基于面部表情的测谎方法及系统
CN105917353B (zh) 用于生物认证的特征提取及匹配以及模板更新
He et al. Toward accurate and fast iris segmentation for iris biometrics
CN111582150B (zh) 一种人脸质量评估的方法、装置和计算机存储介质
CN110033756B (zh) 语种识别方法、装置、电子设备及存储介质
CN110751636B (zh) 一种基于改进型编解码网络的眼底图像视网膜动脉硬化检测方法
CN113537005B (zh) 一种基于姿态估计的线上考试学生行为分析方法
JP2002269564A (ja) ダゥベシス・ウェーブレット変換を用いたアイリス認識方法
WO2021136368A1 (zh) 钼靶图像中胸大肌区域自动检测方法及装置
Wang et al. ScleraSegNet: An attention assisted U-Net model for accurate sclera segmentation
CN114066884A (zh) 视网膜血管分割方法及装置、电子设备和存储介质
CN110610480B (zh) 基于Attention机制的MCASPP神经网络眼底图像视杯视盘分割模型
CN116110574B (zh) 一种基于神经网络实现的眼科智能问诊方法和装置
WO2022252107A1 (zh) 一种基于眼部图像的疾病检测系统及方法
CN111507124A (zh) 基于深度学习的非接触式视频测谎方法及系统
CN115661185A (zh) 一种眼底图像血管分割方法及系统
Abdel-Latif et al. Achieving Information Security by multi-Modal Iris-Retina Biometric Approach Using Improved Mask R-CNN
KAMIL et al. An Improved Iris Segmentation using Pupil Candidate Bank for Non-Cooperative Iris Recognition
CN111598144A (zh) 图像识别模型的训练方法和装置
CN111222374A (zh) 测谎数据处理方法、装置、计算机设备和存储介质
Raoof Security of iris recognition and voice recognition techniques
Costache et al. Identifying persons from iris image
CN114283486B (zh) 图像处理、模型训练、识别方法、装置、设备及存储介质
CN110543894A (zh) 一种医学影像处理方法
CN116309593B (zh) 基于数学模型的肝脏穿刺活检b超图像处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20230512

Assignee: Hubei Yunyihui Medical Technology Co.,Ltd.

Assignor: RENMIN HOSPITAL OF WUHAN University (HUBEI GENERAL Hospital)

Contract record no.: X2024980000802

Denomination of invention: A neural network-based intelligent ophthalmic consultation method and device

Granted publication date: 20230620

License type: Common License

Record date: 20240119

Application publication date: 20230512

Assignee: Hubei yapunodi Technology Development Co.,Ltd.

Assignor: RENMIN HOSPITAL OF WUHAN University (HUBEI GENERAL Hospital)

Contract record no.: X2024980000793

Denomination of invention: A neural network-based intelligent ophthalmic consultation method and device

Granted publication date: 20230620

License type: Common License

Record date: 20240119

EE01 Entry into force of recordation of patent licensing contract