CN111599463B - 基于声音认知模型的智能辅助诊断系统 - Google Patents

基于声音认知模型的智能辅助诊断系统 Download PDF

Info

Publication number
CN111599463B
CN111599463B CN202010386208.7A CN202010386208A CN111599463B CN 111599463 B CN111599463 B CN 111599463B CN 202010386208 A CN202010386208 A CN 202010386208A CN 111599463 B CN111599463 B CN 111599463B
Authority
CN
China
Prior art keywords
sound
model
module
text
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010386208.7A
Other languages
English (en)
Other versions
CN111599463A (zh
Inventor
杜小军
杜跃天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuzheng Intelligent Technology Beijing Co ltd
Original Assignee
Wuzheng Intelligent Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuzheng Intelligent Technology Beijing Co ltd filed Critical Wuzheng Intelligent Technology Beijing Co ltd
Priority to CN202010386208.7A priority Critical patent/CN111599463B/zh
Publication of CN111599463A publication Critical patent/CN111599463A/zh
Application granted granted Critical
Publication of CN111599463B publication Critical patent/CN111599463B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Signal Processing (AREA)
  • Primary Health Care (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明提出了一种基于声音认知模型的智能辅助诊断系统。包括:文本特征提取模块,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;声音认知模型建立模块,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;辅助诊断模块,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。本发明通过空间向量模型结合词向量的方法,来建立语义认知模型,以此开展疾病智能筛查和智能辅助诊断,提高诊断的准确度。

Description

基于声音认知模型的智能辅助诊断系统
技术领域
本发明涉及人工智能领域,尤其涉及一种基于声音认知模型的智能辅助诊断系统。
背景技术
人如其声,声音不仅可以帮助辨别身份,还可以协助检查身体健康状态,提前洞悉身体所患的疾病,声音的变化已经成为其他器官的疾病报警信号。例如,说话时常出现声音沙哑的现象,并且这种现象正在不断严重化,同时还会伴随着间歇性呼吸困难。这一系列的问题说明我们的咽喉部位出现了问题,吸烟严重者可能是喉癌的前兆。
数年来,人们对异常声音事件检测进行了一定的研究,国内外研究人员也在异常声音识别研究领域做了许多尝试,例如,为了同时识别短暂音频和较长音频事件,有人提出了一种用于监控应用的音频事件检测的新方法,有人通过分析音频流来识别车辆在道路行驶过程中的危险情况,比如轮胎打滑或者车祸,从而达到检测道路交通事故的目的,他们的音频事件检测方法主要分为两个部分:首先提取一组能够表征异常声音事件的判别性特征向量,然后利用这些特征表示采用词袋方法来检测短暂异常声音事件和较长异常声音事件。目前来看,这些都是基于声音音频或者音频流来进行监测或者筛查,智能认知的效果有限。所以亟需一种基于声音认知模型的智能辅助诊断系统能够精确对声音进行识别,实现对疾病的辅助诊断功能。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
有鉴于此,本发明提出了一种基于声音认知模型的智能辅助诊断系统,旨在解决现有技术无法利用空间向量模型结合分词向量来对声音进行精确认知的技术问题。
本发明的技术方案是这样实现的:
一方面,本发明提供了一种基于声音认知模型的智能辅助诊断系统,所述基于声音认知模型的智能辅助诊断系统包括:
文本特征提取模块,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;
声音认知模型建立模块,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;
辅助诊断模块,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。
在以上技术方案的基础上,优选的,文本特征提取模块包括自然语言预处理模块,用于对人体生理现象声音数据以及对应的疾病信息进行自然语言预处理,并从处理后的数据中提取出人体生理现象声音数据的文本特征以及疾病信息的文本特征,所述人体生理现象声音数据包括:呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音以及放屁声音;生理现象声音数据的文本特征包括:咳声紧闷、咳声清脆、咳声如狗叫、咳声有力而重浊、咳声无力、咳声低微、咳声嘶哑、咳声阵作以及咳声连续;疾病信息的文本特征包括:白喉病、肺热病以及外感风热。
在以上技术方案的基础上,优选的,文本特征提取模块还包括分词模块,用于通过加权算法在词频以及类别上对人体生理现象声音数据的文本特征以及疾病信息的文本特征进行权重标注,获取标注后的数据,将标注后的数据进行融合,形成人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词。
在以上技术方案的基础上,优选的,声音认知模型建立模块包括相似度计算模块,用于建立相似度算法以及空间向量模型,通过相似度算法计算人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词之间的相似度大小,根据该空间向量模型以及相似度大小生成声音认知模型。
在以上技术方案的基础上,优选的,相似度计算模块包括相似度算法单元,所述相似度算法为:
Figure BDA0002484046460000031
其中,Wik表示相似度,ik表示反向运动,Ci,i=1,2,...m表示所有的类别,并具有C1和c,n1表示Ci中的文本数,nik表示类别Ci中包含K个特征项的文本分词数,Nc表位类别总数,nck表示含有第K个特征项的类别数,tf表示特征项在文本中出现次数的权重,N是文本集中的文本数。
在以上技术方案的基础上,优选的,辅助诊断模块包括报告生成模块,用于获取待诊断声音特征,从中提取待诊断声音文本特征信息,通过声音认知模型对该待诊断声音文本特征信息进行诊断,获取待诊断声音文本特征信息对应的疾病文本特征分词,并生成诊断报告单。
更进一步优选的,所述基于认知云系统的血压监护设备包括:
文本特征提取单元,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;
声音认知模型建立单元,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;
辅助诊断单元,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。
本发明的一种基于声音认知模型的智能辅助诊断系统相对于现有技术具有以下有益效果:
(1)通过利用分词加权算法,以此形成声音的特征文本分词或者短句与疾病概念和疾病征兆描述文本分词或者短语矩阵,构建适合于两种不同概念声音以及与之对应疾病的特征文本分词或者短句的提取单元,以提高分类的准确性;
(2)通过利用空间向量模型,结合分词向量的方法来建立声音与疾病关系语义相似度认知模型即声音认知模型,能够精确对待诊断声音的文本特征描述进行诊断,及时给出相对应建议,提高用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明基于声音认知模型的智能辅助诊断系统第一实施例的结构框图;
图2为本发明基于声音认知模型的智能辅助诊断系统的第二实施例结构框图;
图3为本发明基于声音认知模型的智能辅助诊断系统的第三实施例结构框图;
图4为本发明基于声音认知模型的智能辅助诊断系统的第四实施例结构框图;
图5为本发明基于声音认知模型的智能辅助诊断系统结构框图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,图1为本发明基于声音认知模型的智能辅助诊断系统第一实施例的结构框图。其中,所述基于声音认知模型的智能辅助诊断系统包括:文本特征提取模块10、声音认知模型建立模块20、辅助诊断模块30。
文本特征提取模块10,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;
声音认知模型建立模块20,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;
辅助诊断模块30,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。
进一步地,如图2所示,基于上述各实施例提出本发明基于声音认知模型的智能辅助诊断系统的第二实施例结构框图,在本实施例中,文本特征提取模块10还包括:
自然语言预处理模块101,用于对人体生理现象声音数据以及对应的疾病信息进行自然语言预处理,并从处理后的数据中提取出人体生理现象声音数据的文本特征以及疾病信息的文本特征,所述人体生理现象声音数据包括:呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音以及放屁声音;生理现象声音数据的文本特征包括:咳声紧闷、咳声清脆、咳声如狗叫、咳声有力而重浊、咳声无力、咳声低微、咳声嘶哑、咳声阵作以及咳声连续;疾病信息的文本特征包括:白喉病、肺热病以及外感风热;
分词模块102,用于通过加权算法在词频以及类别上对人体生理现象声音数据的文本特征以及疾病信息的文本特征进行权重标注,获取标注后的数据,将标注后的数据进行融合,形成人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词;
需要说明的是,系统首先对人体生理现象声音的每一个类别(包括呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音、放屁声音等)进行自然语言预处理,提取出能够反映出该类声音特征的文本分词或者短语(例如咳嗽声音类特征有:咳声紧闷、咳声清脆、咳声如狗叫、咳声有力而重浊、咳声无力、咳声低微、咳声嘶哑、咳声阵作,咳声连续等),提取该特征分词或者短语对应的疾病以及该疾病的征兆描述分词或者短语(比如,咳嗽声音如狗叫,且喉间有白膜,不易剥去,一般可以判定为白喉病等)。
应当理解的是,然后系统通过分词或者短句的加权算法,分别在频域(词频,分词或者短句向量)、类域(类别,空间向量)维度上进行权重标注,并对频域(词频,分词或者短句向量)、类域(类别,空间向量)维度上提取到的信息进行融合,以此形成声音的特征文本分词或者短句与疾病概念和疾病征兆描述文本分词或者短语矩阵,构建适合于两种不同概念声音以及与之对应疾病的特征文本分词或者短句的提取单元,以提高分类的准确性。
进一步地,如图3所示,基于上述各实施例提出本发明基于声音认知模型的智能辅助诊断系统的第三实施例结构框图,在本实施例中,声音认知模型建立模块20还包括:
相似度计算模块201,用于建立相似度算法以及空间向量模型,通过相似度算法计算人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词之间的相似度大小,根据该空间向量模型以及相似度大小生成声音认知模型。
相似度计算模块201包括相似度算法单元201',所述相似度算法为:
Figure BDA0002484046460000061
其中,Wik表示相似度,ik表示反向运动,Ci,i=1,2,…m表示所有的类别,并具有C1和c,n1表示Ci中的文本数,nik表示类别Ci中包含K个特征项的文本分词数,Nc表位类别总数,nck表示含有第K个特征项的类别数,tf表示特征项在文本中出现次数的权重,N是文本集中的文本数。
应当理解的是,系统会利用空间向量模型,结合分词向量的方法来建立声音与疾病关系语义相似度(两个概念之间的特征相似度计算)认知模型,并进行分类,从而完成声音特征的文本认知(包括正常声音和异常声音特征文本以及与之对应疾病的特征文本)建模。
应当理解的是,用类别词描述的方法,对声音和与之对应疾病文本数据进行预处理,提取相应的特征。具体来说,两个概念之间的相似度大小,与两者之间的相同属性的数量有关。相同属性,拥有共同连接的节点多的概念相似度大。人体生理现象声音的每一个类别(包括呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音、放屁声音等)以及与每一类别声音对应的疾病特征,可以利用特征项在类别中出现的总频数权重替代以特征项在全部文本中出现的次数权重,为使其更好地区分类别信息,公式如下:
Figure BDA0002484046460000071
其中,Wik表示相似度,ik表示反向运动即求解结果,Ci,i=1,2,…m表示所有的类别,并具有C1和c,n1表示Ci中的文本数,nik表示类别Ci中包含K个特征项的文本分词数,Nc表位类别总数,nck表示含有第K个特征项的类别数,tf表示特征项在文本中出现次数的权重,N是文本集中的文本数,nk是包含特征项tk的文本数。
应当理解的是,经预处理后的特征文本数据集(主要是分词或者短句),运用词袋模型表示。将所有分词和短语装进一个袋子里,不考虑其词法和语序的问题,即每个分词和短语都是独立的。例句:Jane wants to go to Shenzhen;Bob wants to go to Shanghai。上面2个例句,就可以构成一个词袋,袋子里包括Jane、wants、to、go、Shenzhen、Bob、Shanghai。假设建立一个数组(或词典)用于映射匹配:[Jane,wants,to,go,Shenzhen,Bob,Shanghai],那么上面两个例句就可以用以下两个向量表示,对应的下标与映射数组的下标相匹配,其值为该词语出现的次数:
[1,1,2,1,1,0,0]和[0,1,2,1,0,1,1]。这两个词频向量就是词袋模型,可以很明显的看到语序关系已经完全丢失;
应当理解的是,通过分词或者短句的加权算法,分别在频域(词频,分词或者短句向量)、类域(类别,空间向量)维度上进行权重标注,并对频域(词频,分词或者短句向量)、类域(类别,空间向量)维度上提取到的信息进行融合,以此形成声音的特征文本分词或者短句与疾病概念和疾病征兆描述文本分词或者短语矩阵,构建适合于两种不同概念声音以及与之对应疾病的特征文本分词或者短句的提取单元,以提高分类的准确性。
应当理解的是,根据得到的分词或者短句向量的相似性修改得到的词袋模型的特征词的权重,得到新的文本表示模型。
应当理解的是,对于得到空间向量模型的TFIDF权重矩阵,在该特征词矩阵中,每个特征对应特征空间中的一维,矩阵的行数表示所有待分类的文本数,将每个文本表示成矩阵中的一行,每一列代表一个特征词。这个矩阵中会有很多特征词的TFIDF权重值为零,这些为零的特征权重影响分类的效果。本实施例中考虑使用词向量,提出了对于TFIDF权重为零的特征词,运用词向量查找它的相似词,用这些TFIDF值不为零的相似词的权重值来近似表示这个TFIDF值为零的特征词。具体的实施如下:对于得到的空间向量模型,其对应的TFIDF权重矩阵,其某一行中的某个特征词t,如果它的特征权重Wt为零,可采用:
特征权重Wt用特征词t的相近词t1,t2,t3,...tn的权重Wt1,Wt2,Wt3,...,Wtn来近似表示Wt,至于相似词n的数量可通过控制特征词的相似性阈值m的大小来控制,公式如下:
Figure BDA0002484046460000081
其中,S(t,tn)为特征词t和tn的相似度。
特征权重Wt用特征词t的相近词t1,t2,t3,...tn中最相近词的权重Wi来近似表示Wt,公式如下:Wt=WiS(t,i);其中,S(t,i)为特征词t和特征词i的相似度。
应当理解的是,一类声音系统下以及与之对应疾病的具体特征分词文本描述可能很多。就算是一个具体声音下以及与之对应疾病的特征也可能很多。所以,在声音分类或声音特征分词概率设计上,还可以采取特征权重在不同声音类型特征分词或者短语上与疾病文本特征分词或者短语进行加权和建模的方式进行,这样效果会更好一些。具体讲:根据各个疾病权重,计算患病概率。举例:假设:用户自诉声音文本特征分词或者短语符合疾病征兆文本特征分词或者短语:“共同标签1”,“甲标签1”,”丙标签5”,计算患病概率的步骤如下所示:首先计算各个疾病权重。疾病甲权重为1+5=6;疾病乙权重为1;疾病丙权重为1+50=51;总权重:6+1+50=58;然后根据各个疾病权重,计算患病概率。疾病甲概率:6/58=10.3%;疾病乙概率:1/58=1.7%;疾病丙概率:51/58=87.9%。
进一步地,如图4所示,基于上述各实施例提出本发明基于声音认知模型的智能辅助诊断系统的第四实施例结构框图,在本实施例中,辅助诊断模块30还包括:
报告生成模块301,用于获取待诊断声音特征,从中提取待诊断声音文本特征信息,通过声音认知模型对该待诊断声音文本特征信息进行诊断,获取待诊断声音文本特征信息对应的疾病文本特征分词,并生成诊断报告单。
本地数据更新模块302,用于将诊断报告单中待诊断声音文本特征信息以及对应的疾病文本特征分词存放入本地数据库中,对本地数据库中数据进行更新。
应当理解的是,系统会根据用户自诉声音文本描述,系统选择符合该描述特征的声音类别特征,并启动认知模型,通过分析用户的声音特征,计算与之对应的疾病分词或者短句的特征相关度和相似度,进行疾病智能辅助诊断,或者智能评估和预测。
应当理解的是,系统最后对新的声音认知辅助诊断过程进行考察,将当前声音及辅助诊断的解决结果补充为新知识,并将其存入数据库中,为数据挖掘库增加新的记录,并根据评估和预测结果进一步调整声音特征文本的认知模型和策略,从而实现机器自主学习和增量学习。
应当理解的是,当这种基于声音认知模型辅助诊断用户越来越多时,系统积累的经验和案例也就会越多,这样基于声音特征文本的认知能力的策略和模型就更接近完美。认知系统越学智能性就越好,就会越接近声音特征文本的认知特点,效果就会越好。
需要说明的是,以上仅为举例说明,并不对本申请的技术方案构成任何限定。
通过上述描述不难发现,本实施例提出了一种基于声音认知模型的智能辅助诊断系统,包括:文本特征提取模块,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;声音认知模型建立模块,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;辅助诊断模块,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。本实施例通过空间向量模型结合词向量的方法,来建立语义认知模型,以此开展疾病智能筛查和智能辅助诊断,提高诊断的准确度。
此外,本发明实施例还提出一种基于声音认知模型的智能辅助诊断设备。如图5所示,该基于声音认知模型的智能辅助诊断设备包括:文本特征提取单元10、声音认知模型建立单元20、辅助诊断单元30。
文本特征提取单元10,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;
声音认知模型建立单元20,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;
辅助诊断单元30,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。
此外,需要说明的是,以上所描述的装置实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于声音认知模型的智能辅助诊断系统,此处不再赘述。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于声音认知模型的智能辅助诊断系统,其特征在于,所述基于声音认知模型的智能辅助诊断系统包括:
文本特征提取模块,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;
文本特征提取模块还包括分词模块,用于通过加权算法在词频以及类别上对人体生理现象声音数据的文本特征以及疾病信息的文本特征进行权重标注,获取标注后的数据,将标注后的数据进行融合,形成人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词;
声音认知模型建立模块,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;
声音认知模型建立模块包括相似度计算模块,用于建立相似度算法以及空间向量模型,通过相似度算法计算人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词之间的相似度大小,根据该空间向量模型以及相似度大小生成声音认知模型;
对于得到的空间向量模型,其对应的TFIDF权重矩阵,其某一行中的某个特征词
Figure QLYQS_1
,如果它的特征权重/>
Figure QLYQS_2
为零,采用:
特征权重
Figure QLYQS_4
用特征词/>
Figure QLYQS_6
的相近词/>
Figure QLYQS_8
的权重/>
Figure QLYQS_10
来近似表示
Figure QLYQS_11
,至于相似词/>
Figure QLYQS_12
的数量通过控制特征词的相似性阈值/>
Figure QLYQS_13
的大小来控制,公式如下:
Figure QLYQS_3
,其中,/>
Figure QLYQS_5
为特征词/>
Figure QLYQS_7
和/>
Figure QLYQS_9
的相似度;
或者特征权重
Figure QLYQS_15
用特征词/>
Figure QLYQS_17
的相近词/>
Figure QLYQS_18
中最相近词的权重/>
Figure QLYQS_19
来近似表示
Figure QLYQS_20
,公式如下:/>
Figure QLYQS_21
;其中,/>
Figure QLYQS_22
为特征词/>
Figure QLYQS_14
和特征词/>
Figure QLYQS_16
的相似度;
辅助诊断模块,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。
2.如权利要求1所述的基于声音认知模型的智能辅助诊断系统,其特征在于:文本特征提取模块包括自然语言预处理模块,用于对人体生理现象声音数据以及对应的疾病信息进行自然语言预处理,并从处理后的数据中提取出人体生理现象声音数据的文本特征以及疾病信息的文本特征,所述人体生理现象声音数据包括:呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音以及放屁声音;生理现象声音数据的文本特征包括:咳声紧闷、咳声清脆、咳声如狗叫、咳声有力而重浊、咳声无力、咳声低微、咳声嘶哑、咳声阵作以及咳声连续;疾病信息的文本特征包括:白喉病、肺热病以及外感风热。
3.如权利要求1所述的基于声音认知模型的智能辅助诊断系统,其特征在于:辅助诊断模块包括报告生成模块,用于获取待诊断声音特征,从中提取待诊断声音文本特征信息,通过声音认知模型对该待诊断声音文本特征信息进行诊断,获取待诊断声音文本特征信息对应的疾病文本特征分词,并生成诊断报告单。
4.如权利要求3所述的基于声音认知模型的智能辅助诊断系统,其特征在于:辅助诊断模块还包括本地数据更新模块,用于将诊断报告单中待诊断声音文本特征信息以及对应的疾病文本特征分词存放入本地数据库中,对本地数据库中数据进行更新。
5.一种基于声音认知模型的智能辅助诊断设备,其特征在于,所述基于声音认知模型的智能辅助诊断设备包括:
文本特征提取单元,用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息,提取该人体生理现象声音数据的文本特征,并形成分词矩阵;
文本特征提取单元还包括分词模块,用于通过加权算法在词频以及类别上对人体生理现象声音数据的文本特征以及疾病信息的文本特征进行权重标注,获取标注后的数据,将标注后的数据进行融合,形成人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词;
声音认知模型建立单元,用于建立空间向量模型,利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息,根据该声音特征信息以及对应的疾病特征信息生成声音认知模型;
声音认知模型建立单元包括相似度计算模块,用于建立相似度算法以及空间向量模型,通过相似度算法计算人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词之间的相似度大小,根据该空间向量模型以及相似度大小生成声音认知模型;
对于得到的空间向量模型,其对应的TFIDF权重矩阵,其某一行中的某个特征词
Figure QLYQS_23
,如果它的特征权重/>
Figure QLYQS_24
为零,采用:
特征权重
Figure QLYQS_26
用特征词/>
Figure QLYQS_28
的相近词/>
Figure QLYQS_30
的权重/>
Figure QLYQS_32
来近似表示
Figure QLYQS_33
,至于相似词/>
Figure QLYQS_34
的数量通过控制特征词的相似性阈值/>
Figure QLYQS_35
的大小来控制,公式如下:
Figure QLYQS_25
,其中,/>
Figure QLYQS_27
为特征词/>
Figure QLYQS_29
和/>
Figure QLYQS_31
的相似度;
或者特征权重
Figure QLYQS_38
用特征词/>
Figure QLYQS_39
的相近词/>
Figure QLYQS_40
中最相近词的权重/>
Figure QLYQS_41
来近似表示
Figure QLYQS_42
,公式如下:/>
Figure QLYQS_43
;其中,/>
Figure QLYQS_44
为特征词/>
Figure QLYQS_36
和特征词/>
Figure QLYQS_37
的相似度;
辅助诊断单元,用于获取待诊断声音特征,通过声音认知模型对该待诊断声音特征进行诊断,并将对应诊断结果存储至本地数据库中。
CN202010386208.7A 2020-05-09 2020-05-09 基于声音认知模型的智能辅助诊断系统 Active CN111599463B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010386208.7A CN111599463B (zh) 2020-05-09 2020-05-09 基于声音认知模型的智能辅助诊断系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010386208.7A CN111599463B (zh) 2020-05-09 2020-05-09 基于声音认知模型的智能辅助诊断系统

Publications (2)

Publication Number Publication Date
CN111599463A CN111599463A (zh) 2020-08-28
CN111599463B true CN111599463B (zh) 2023-07-14

Family

ID=72182638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010386208.7A Active CN111599463B (zh) 2020-05-09 2020-05-09 基于声音认知模型的智能辅助诊断系统

Country Status (1)

Country Link
CN (1) CN111599463B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112037818A (zh) * 2020-08-30 2020-12-04 北京嘀嘀无限科技发展有限公司 异常情况确定方法和正向匹配式生成方法
CN112017774B (zh) * 2020-08-31 2023-10-03 吾征智能技术(北京)有限公司 一种基于口臭伴随症状的疾病预测模型的构建方法及系统
CN112133390B (zh) * 2020-09-17 2024-03-22 吾征智能技术(北京)有限公司 一种基于电子病历的肝病认知系统
CN112133391B (zh) * 2020-09-17 2024-01-26 吾征智能技术(北京)有限公司 一种基于人体异常眉毛的疾病认知系统
CN112364070B (zh) * 2020-09-30 2024-03-22 北京仿真中心 一种工业领域人的数字孪生服务方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009065715A (ja) * 2008-12-10 2009-03-26 Victor Co Of Japan Ltd 動画像符号化装置、動画像符号化方法、動画像復号装置、動画像復号方法
JP2010039997A (ja) * 2008-08-08 2010-02-18 Ricoh Co Ltd 情報検索装置、情報検索方法、プログラム、および記録媒体
WO2011100480A1 (en) * 2010-02-10 2011-08-18 Brian Lamb Automatic motion tracking, event detection and video image capture and tagging

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653840B (zh) * 2015-12-21 2019-01-04 青岛中科慧康科技有限公司 基于词句分布表示的相似病例推荐系统及相应的方法
JP6818424B2 (ja) * 2016-04-13 2021-01-20 キヤノン株式会社 診断支援装置、情報処理方法、診断支援システム及びプログラム
CN107622797B (zh) * 2017-09-26 2020-07-28 李涵之 一种基于声音的身体状况确定系统及方法
CN107863147B (zh) * 2017-10-24 2021-03-16 清华大学 基于深度卷积神经网络的医疗诊断的方法
CN108766581A (zh) * 2018-05-07 2018-11-06 上海市公共卫生临床中心 健康医疗数据的关键信息挖掘方法及辅助诊断系统
US20200057807A1 (en) * 2018-08-20 2020-02-20 Nirveda Cognition, Inc. Systems and methods providing a cognitive augmented memory network
CN109344250B (zh) * 2018-09-07 2021-11-19 北京大学 基于医保数据的单病种诊断信息快速结构化方法
CN109471950B (zh) * 2018-11-19 2022-04-01 北京交通大学 腹部超声文本数据的结构化知识网络的构建方法
CN109697286A (zh) * 2018-12-18 2019-04-30 众安信息技术服务有限公司 一种基于词向量的诊断标准化方法及装置
CN110619036B (zh) * 2019-08-25 2023-07-18 南京理工大学 基于改进tf-idf算法的全文检索系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010039997A (ja) * 2008-08-08 2010-02-18 Ricoh Co Ltd 情報検索装置、情報検索方法、プログラム、および記録媒体
JP2009065715A (ja) * 2008-12-10 2009-03-26 Victor Co Of Japan Ltd 動画像符号化装置、動画像符号化方法、動画像復号装置、動画像復号方法
WO2011100480A1 (en) * 2010-02-10 2011-08-18 Brian Lamb Automatic motion tracking, event detection and video image capture and tagging

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
结合语义扩展度和词汇链的关键词提取算法;刘端阳;王良芳;;计算机科学(第12期);全文 *

Also Published As

Publication number Publication date
CN111599463A (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
CN111599463B (zh) 基于声音认知模型的智能辅助诊断系统
CN111192680B (zh) 一种基于深度学习和集成分类的智能辅助诊断方法
CN108416065B (zh) 基于层级神经网络的图像-句子描述生成系统及方法
CN108536754A (zh) 基于blstm和注意力机制的电子病历实体关系抽取方法
CN110297908A (zh) 诊疗方案预测方法及装置
Krajewski et al. Applying multiple classifiers and non-linear dynamics features for detecting sleepiness from speech
CN108899050A (zh) 基于多模态情绪识别系统的语音信号分析子系统
CN108877801A (zh) 基于多模态情绪识别系统的多轮对话语义理解子系统
CN109189925A (zh) 基于点互信息的词向量模型和基于cnn的文本分类方法
CN110825881A (zh) 一种建立电力知识图谱的方法
CN108805088A (zh) 基于多模态情绪识别系统的生理信号分析子系统
CN110991190B (zh) 一种文档主题增强系统、文本情绪预测系统和方法
CN110059185A (zh) 一种医学文档专业词汇自动化标注方法
CN111329494B (zh) 抑郁症参考数据的获取方法及装置
CN111858940A (zh) 一种基于多头注意力的法律案例相似度计算方法及系统
CN109841231A (zh) 一种针对汉语普通话的早期ad言语辅助筛查系统
CN112885334A (zh) 基于多模态特征的疾病认知系统、设备、存储介质
CN107437090A (zh) 基于语音、表情与心电信号的三模态连续情感预测方法
Carofilis et al. Improvement of accent classification models through Grad-Transfer from Spectrograms and Gradient-weighted Class Activation Mapping
Ding et al. Automatic recognition of student emotions based on deep neural network and its application in depression detection
CN113488165B (zh) 基于知识图谱的文本匹配方法、装置、设备以及存储介质
Srivastava et al. Hierarchical capsule based neural network architecture for sequence labeling
CN115545021A (zh) 一种基于深度学习的临床术语识别方法与装置
CN113643781B (zh) 基于时序预警信号的健康干预方案个性化推荐方法及系统
CN114496231A (zh) 基于知识图谱的体质识别方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant