CN111599463B

CN111599463B - 基于声音认知模型的智能辅助诊断系统

Info

Publication number: CN111599463B
Application number: CN202010386208.7A
Authority: CN
Inventors: 杜小军; 杜跃天
Original assignee: Wuzheng Intelligent Technology Beijing Co ltd
Current assignee: Wuzheng Intelligent Technology Beijing Co ltd
Priority date: 2020-05-09
Filing date: 2020-05-09
Publication date: 2023-07-14
Anticipated expiration: 2040-05-09
Also published as: CN111599463A

Abstract

本发明提出了一种基于声音认知模型的智能辅助诊断系统。包括：文本特征提取模块，用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息，提取该人体生理现象声音数据的文本特征，并形成分词矩阵；声音认知模型建立模块，用于建立空间向量模型，利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息，根据该声音特征信息以及对应的疾病特征信息生成声音认知模型；辅助诊断模块，用于获取待诊断声音特征，通过声音认知模型对该待诊断声音特征进行诊断，并将对应诊断结果存储至本地数据库中。本发明通过空间向量模型结合词向量的方法，来建立语义认知模型，以此开展疾病智能筛查和智能辅助诊断，提高诊断的准确度。

Description

基于声音认知模型的智能辅助诊断系统

技术领域

本发明涉及人工智能领域，尤其涉及一种基于声音认知模型的智能辅助诊断系统。

背景技术

人如其声，声音不仅可以帮助辨别身份，还可以协助检查身体健康状态，提前洞悉身体所患的疾病，声音的变化已经成为其他器官的疾病报警信号。例如，说话时常出现声音沙哑的现象，并且这种现象正在不断严重化，同时还会伴随着间歇性呼吸困难。这一系列的问题说明我们的咽喉部位出现了问题，吸烟严重者可能是喉癌的前兆。

数年来，人们对异常声音事件检测进行了一定的研究，国内外研究人员也在异常声音识别研究领域做了许多尝试，例如，为了同时识别短暂音频和较长音频事件，有人提出了一种用于监控应用的音频事件检测的新方法，有人通过分析音频流来识别车辆在道路行驶过程中的危险情况，比如轮胎打滑或者车祸，从而达到检测道路交通事故的目的，他们的音频事件检测方法主要分为两个部分：首先提取一组能够表征异常声音事件的判别性特征向量，然后利用这些特征表示采用词袋方法来检测短暂异常声音事件和较长异常声音事件。目前来看，这些都是基于声音音频或者音频流来进行监测或者筛查，智能认知的效果有限。所以亟需一种基于声音认知模型的智能辅助诊断系统能够精确对声音进行识别，实现对疾病的辅助诊断功能。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

有鉴于此，本发明提出了一种基于声音认知模型的智能辅助诊断系统，旨在解决现有技术无法利用空间向量模型结合分词向量来对声音进行精确认知的技术问题。

本发明的技术方案是这样实现的：

一方面，本发明提供了一种基于声音认知模型的智能辅助诊断系统，所述基于声音认知模型的智能辅助诊断系统包括：

文本特征提取模块，用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息，提取该人体生理现象声音数据的文本特征，并形成分词矩阵；

声音认知模型建立模块，用于建立空间向量模型，利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息，根据该声音特征信息以及对应的疾病特征信息生成声音认知模型；

辅助诊断模块，用于获取待诊断声音特征，通过声音认知模型对该待诊断声音特征进行诊断，并将对应诊断结果存储至本地数据库中。

在以上技术方案的基础上，优选的，文本特征提取模块包括自然语言预处理模块，用于对人体生理现象声音数据以及对应的疾病信息进行自然语言预处理，并从处理后的数据中提取出人体生理现象声音数据的文本特征以及疾病信息的文本特征，所述人体生理现象声音数据包括：呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音以及放屁声音；生理现象声音数据的文本特征包括：咳声紧闷、咳声清脆、咳声如狗叫、咳声有力而重浊、咳声无力、咳声低微、咳声嘶哑、咳声阵作以及咳声连续；疾病信息的文本特征包括：白喉病、肺热病以及外感风热。

在以上技术方案的基础上，优选的，文本特征提取模块还包括分词模块，用于通过加权算法在词频以及类别上对人体生理现象声音数据的文本特征以及疾病信息的文本特征进行权重标注，获取标注后的数据，将标注后的数据进行融合，形成人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词。

在以上技术方案的基础上，优选的，声音认知模型建立模块包括相似度计算模块，用于建立相似度算法以及空间向量模型，通过相似度算法计算人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词之间的相似度大小，根据该空间向量模型以及相似度大小生成声音认知模型。

在以上技术方案的基础上，优选的，相似度计算模块包括相似度算法单元，所述相似度算法为：

其中，W_ik表示相似度，ik表示反向运动，C_i,i＝1,2,...m表示所有的类别，并具有C₁和c，n₁表示C_i中的文本数，n_ik表示类别C_i中包含K个特征项的文本分词数，N_c表位类别总数，n_ck表示含有第K个特征项的类别数，tf表示特征项在文本中出现次数的权重，N是文本集中的文本数。

在以上技术方案的基础上，优选的，辅助诊断模块包括报告生成模块，用于获取待诊断声音特征，从中提取待诊断声音文本特征信息，通过声音认知模型对该待诊断声音文本特征信息进行诊断，获取待诊断声音文本特征信息对应的疾病文本特征分词，并生成诊断报告单。

更进一步优选的，所述基于认知云系统的血压监护设备包括：

文本特征提取单元，用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息，提取该人体生理现象声音数据的文本特征，并形成分词矩阵；

声音认知模型建立单元，用于建立空间向量模型，利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息，根据该声音特征信息以及对应的疾病特征信息生成声音认知模型；

辅助诊断单元，用于获取待诊断声音特征，通过声音认知模型对该待诊断声音特征进行诊断，并将对应诊断结果存储至本地数据库中。

本发明的一种基于声音认知模型的智能辅助诊断系统相对于现有技术具有以下有益效果：

(1)通过利用分词加权算法，以此形成声音的特征文本分词或者短句与疾病概念和疾病征兆描述文本分词或者短语矩阵，构建适合于两种不同概念声音以及与之对应疾病的特征文本分词或者短句的提取单元，以提高分类的准确性；

(2)通过利用空间向量模型，结合分词向量的方法来建立声音与疾病关系语义相似度认知模型即声音认知模型，能够精确对待诊断声音的文本特征描述进行诊断，及时给出相对应建议，提高用户体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明基于声音认知模型的智能辅助诊断系统第一实施例的结构框图；

图2为本发明基于声音认知模型的智能辅助诊断系统的第二实施例结构框图；

图3为本发明基于声音认知模型的智能辅助诊断系统的第三实施例结构框图；

图4为本发明基于声音认知模型的智能辅助诊断系统的第四实施例结构框图；

图5为本发明基于声音认知模型的智能辅助诊断系统结构框图。

具体实施方式

下面将结合本发明实施方式，对本发明实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式仅仅是本发明一部分实施方式，而不是全部的实施方式。基于本发明中的实施方式，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。

如图1所示，图1为本发明基于声音认知模型的智能辅助诊断系统第一实施例的结构框图。其中，所述基于声音认知模型的智能辅助诊断系统包括：文本特征提取模块10、声音认知模型建立模块20、辅助诊断模块30。

文本特征提取模块10，用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息，提取该人体生理现象声音数据的文本特征，并形成分词矩阵；

声音认知模型建立模块20，用于建立空间向量模型，利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息，根据该声音特征信息以及对应的疾病特征信息生成声音认知模型；

辅助诊断模块30，用于获取待诊断声音特征，通过声音认知模型对该待诊断声音特征进行诊断，并将对应诊断结果存储至本地数据库中。

进一步地，如图2所示，基于上述各实施例提出本发明基于声音认知模型的智能辅助诊断系统的第二实施例结构框图，在本实施例中，文本特征提取模块10还包括：

自然语言预处理模块101，用于对人体生理现象声音数据以及对应的疾病信息进行自然语言预处理，并从处理后的数据中提取出人体生理现象声音数据的文本特征以及疾病信息的文本特征，所述人体生理现象声音数据包括：呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音以及放屁声音；生理现象声音数据的文本特征包括：咳声紧闷、咳声清脆、咳声如狗叫、咳声有力而重浊、咳声无力、咳声低微、咳声嘶哑、咳声阵作以及咳声连续；疾病信息的文本特征包括：白喉病、肺热病以及外感风热；

分词模块102，用于通过加权算法在词频以及类别上对人体生理现象声音数据的文本特征以及疾病信息的文本特征进行权重标注，获取标注后的数据，将标注后的数据进行融合，形成人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词；

需要说明的是，系统首先对人体生理现象声音的每一个类别(包括呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音、放屁声音等)进行自然语言预处理，提取出能够反映出该类声音特征的文本分词或者短语(例如咳嗽声音类特征有：咳声紧闷、咳声清脆、咳声如狗叫、咳声有力而重浊、咳声无力、咳声低微、咳声嘶哑、咳声阵作，咳声连续等)，提取该特征分词或者短语对应的疾病以及该疾病的征兆描述分词或者短语(比如，咳嗽声音如狗叫，且喉间有白膜，不易剥去，一般可以判定为白喉病等)。

应当理解的是，然后系统通过分词或者短句的加权算法，分别在频域(词频，分词或者短句向量)、类域(类别，空间向量)维度上进行权重标注，并对频域(词频，分词或者短句向量)、类域(类别，空间向量)维度上提取到的信息进行融合，以此形成声音的特征文本分词或者短句与疾病概念和疾病征兆描述文本分词或者短语矩阵，构建适合于两种不同概念声音以及与之对应疾病的特征文本分词或者短句的提取单元，以提高分类的准确性。

进一步地，如图3所示，基于上述各实施例提出本发明基于声音认知模型的智能辅助诊断系统的第三实施例结构框图，在本实施例中，声音认知模型建立模块20还包括：

相似度计算模块201，用于建立相似度算法以及空间向量模型，通过相似度算法计算人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词之间的相似度大小，根据该空间向量模型以及相似度大小生成声音认知模型。

相似度计算模块201包括相似度算法单元201'，所述相似度算法为：

其中，W_ik表示相似度，ik表示反向运动，C_i,i＝1,2,…m表示所有的类别，并具有C₁和c，n₁表示C_i中的文本数，n_ik表示类别C_i中包含K个特征项的文本分词数，N_c表位类别总数，n_ck表示含有第K个特征项的类别数，tf表示特征项在文本中出现次数的权重，N是文本集中的文本数。

应当理解的是，系统会利用空间向量模型，结合分词向量的方法来建立声音与疾病关系语义相似度(两个概念之间的特征相似度计算)认知模型，并进行分类，从而完成声音特征的文本认知(包括正常声音和异常声音特征文本以及与之对应疾病的特征文本)建模。

应当理解的是，用类别词描述的方法，对声音和与之对应疾病文本数据进行预处理，提取相应的特征。具体来说，两个概念之间的相似度大小，与两者之间的相同属性的数量有关。相同属性，拥有共同连接的节点多的概念相似度大。人体生理现象声音的每一个类别(包括呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音、放屁声音等)以及与每一类别声音对应的疾病特征，可以利用特征项在类别中出现的总频数权重替代以特征项在全部文本中出现的次数权重，为使其更好地区分类别信息，公式如下：

其中，W_ik表示相似度，ik表示反向运动即求解结果，C_i,i＝1,2,…m表示所有的类别，并具有C₁和c，n₁表示C_i中的文本数，n_ik表示类别C_i中包含K个特征项的文本分词数，N_c表位类别总数，n_ck表示含有第K个特征项的类别数，tf表示特征项在文本中出现次数的权重，N是文本集中的文本数，n_k是包含特征项tk的文本数。

应当理解的是，经预处理后的特征文本数据集(主要是分词或者短句)，运用词袋模型表示。将所有分词和短语装进一个袋子里，不考虑其词法和语序的问题，即每个分词和短语都是独立的。例句:Jane wants to go to Shenzhen；Bob wants to go to Shanghai。上面2个例句，就可以构成一个词袋，袋子里包括Jane、wants、to、go、Shenzhen、Bob、Shanghai。假设建立一个数组(或词典)用于映射匹配：[Jane,wants,to,go,Shenzhen,Bob,Shanghai]，那么上面两个例句就可以用以下两个向量表示，对应的下标与映射数组的下标相匹配，其值为该词语出现的次数：

[1,1,2,1,1,0,0]和[0,1,2,1,0,1,1]。这两个词频向量就是词袋模型，可以很明显的看到语序关系已经完全丢失；

应当理解的是，通过分词或者短句的加权算法，分别在频域(词频，分词或者短句向量)、类域(类别，空间向量)维度上进行权重标注，并对频域(词频，分词或者短句向量)、类域(类别，空间向量)维度上提取到的信息进行融合，以此形成声音的特征文本分词或者短句与疾病概念和疾病征兆描述文本分词或者短语矩阵，构建适合于两种不同概念声音以及与之对应疾病的特征文本分词或者短句的提取单元，以提高分类的准确性。

应当理解的是，根据得到的分词或者短句向量的相似性修改得到的词袋模型的特征词的权重，得到新的文本表示模型。

应当理解的是，对于得到空间向量模型的TFIDF权重矩阵，在该特征词矩阵中，每个特征对应特征空间中的一维，矩阵的行数表示所有待分类的文本数，将每个文本表示成矩阵中的一行，每一列代表一个特征词。这个矩阵中会有很多特征词的TFIDF权重值为零，这些为零的特征权重影响分类的效果。本实施例中考虑使用词向量，提出了对于TFIDF权重为零的特征词，运用词向量查找它的相似词，用这些TFIDF值不为零的相似词的权重值来近似表示这个TFIDF值为零的特征词。具体的实施如下：对于得到的空间向量模型，其对应的TFIDF权重矩阵，其某一行中的某个特征词t，如果它的特征权重W_t为零，可采用：

特征权重W_t用特征词t的相近词t₁,t₂,t₃,...t_n的权重W_t1,W_t2,W_t3,...,W_tn来近似表示W_t，至于相似词n的数量可通过控制特征词的相似性阈值m的大小来控制，公式如下：

其中，S_(t,tn)为特征词t和t_n的相似度。

特征权重W_t用特征词t的相近词t₁,t₂,t₃,...t_n中最相近词的权重W_i来近似表示W_t，公式如下：W_t＝W_iS_(t,i)；其中，S_(t,i)为特征词t和特征词i的相似度。

应当理解的是，一类声音系统下以及与之对应疾病的具体特征分词文本描述可能很多。就算是一个具体声音下以及与之对应疾病的特征也可能很多。所以，在声音分类或声音特征分词概率设计上，还可以采取特征权重在不同声音类型特征分词或者短语上与疾病文本特征分词或者短语进行加权和建模的方式进行，这样效果会更好一些。具体讲：根据各个疾病权重，计算患病概率。举例：假设：用户自诉声音文本特征分词或者短语符合疾病征兆文本特征分词或者短语：“共同标签1”，“甲标签1”，”丙标签5”，计算患病概率的步骤如下所示：首先计算各个疾病权重。疾病甲权重为1+5＝6；疾病乙权重为1；疾病丙权重为1+50＝51；总权重：6+1+50＝58；然后根据各个疾病权重，计算患病概率。疾病甲概率：6/58＝10.3％；疾病乙概率：1/58＝1.7％；疾病丙概率：51/58＝87.9％。

进一步地，如图4所示，基于上述各实施例提出本发明基于声音认知模型的智能辅助诊断系统的第四实施例结构框图，在本实施例中，辅助诊断模块30还包括：

报告生成模块301，用于获取待诊断声音特征，从中提取待诊断声音文本特征信息，通过声音认知模型对该待诊断声音文本特征信息进行诊断，获取待诊断声音文本特征信息对应的疾病文本特征分词，并生成诊断报告单。

本地数据更新模块302，用于将诊断报告单中待诊断声音文本特征信息以及对应的疾病文本特征分词存放入本地数据库中，对本地数据库中数据进行更新。

应当理解的是，系统会根据用户自诉声音文本描述，系统选择符合该描述特征的声音类别特征，并启动认知模型，通过分析用户的声音特征，计算与之对应的疾病分词或者短句的特征相关度和相似度，进行疾病智能辅助诊断，或者智能评估和预测。

应当理解的是，系统最后对新的声音认知辅助诊断过程进行考察，将当前声音及辅助诊断的解决结果补充为新知识，并将其存入数据库中，为数据挖掘库增加新的记录，并根据评估和预测结果进一步调整声音特征文本的认知模型和策略，从而实现机器自主学习和增量学习。

应当理解的是，当这种基于声音认知模型辅助诊断用户越来越多时，系统积累的经验和案例也就会越多，这样基于声音特征文本的认知能力的策略和模型就更接近完美。认知系统越学智能性就越好，就会越接近声音特征文本的认知特点，效果就会越好。

需要说明的是，以上仅为举例说明，并不对本申请的技术方案构成任何限定。

通过上述描述不难发现，本实施例提出了一种基于声音认知模型的智能辅助诊断系统，包括：文本特征提取模块，用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息，提取该人体生理现象声音数据的文本特征，并形成分词矩阵；声音认知模型建立模块，用于建立空间向量模型，利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息，根据该声音特征信息以及对应的疾病特征信息生成声音认知模型；辅助诊断模块，用于获取待诊断声音特征，通过声音认知模型对该待诊断声音特征进行诊断，并将对应诊断结果存储至本地数据库中。本实施例通过空间向量模型结合词向量的方法，来建立语义认知模型，以此开展疾病智能筛查和智能辅助诊断，提高诊断的准确度。

此外，本发明实施例还提出一种基于声音认知模型的智能辅助诊断设备。如图5所示，该基于声音认知模型的智能辅助诊断设备包括：文本特征提取单元10、声音认知模型建立单元20、辅助诊断单元30。

文本特征提取单元10，用于从本地数据库中提取人体生理现象声音数据以及对应的疾病信息，提取该人体生理现象声音数据的文本特征，并形成分词矩阵；

声音认知模型建立单元20，用于建立空间向量模型，利用该空间向量模型与分词矩阵生成声音特征信息以及对应的疾病特征信息，根据该声音特征信息以及对应的疾病特征信息生成声音认知模型；

辅助诊断单元30，用于获取待诊断声音特征，通过声音认知模型对该待诊断声音特征进行诊断，并将对应诊断结果存储至本地数据库中。

此外，需要说明的是，以上所描述的装置实施例仅仅是示意性的，并不对本发明的保护范围构成限定，在实际应用中，本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的，此处不做限制。

另外，未在本实施例中详尽描述的技术细节，可参见本发明任意实施例所提供的基于声音认知模型的智能辅助诊断系统，此处不再赘述。

以上所述仅为本发明的较佳实施方式而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于声音认知模型的智能辅助诊断系统，其特征在于，所述基于声音认知模型的智能辅助诊断系统包括：

文本特征提取模块还包括分词模块，用于通过加权算法在词频以及类别上对人体生理现象声音数据的文本特征以及疾病信息的文本特征进行权重标注，获取标注后的数据，将标注后的数据进行融合，形成人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词；

声音认知模型建立模块包括相似度计算模块，用于建立相似度算法以及空间向量模型，通过相似度算法计算人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词之间的相似度大小，根据该空间向量模型以及相似度大小生成声音认知模型；

对于得到的空间向量模型，其对应的TFIDF权重矩阵，其某一行中的某个特征词

，如果它的特征权重/>

为零，采用：

特征权重

用特征词/>

的相近词/>

的权重/>

来近似表示

，至于相似词/>

的数量通过控制特征词的相似性阈值/>

的大小来控制，公式如下：

，其中，/>

为特征词/>

和/>

的相似度；

或者特征权重

用特征词/>

的相近词/>

中最相近词的权重/>

来近似表示

，公式如下：/>

；其中，/>

为特征词/>

和特征词/>

的相似度；

2.如权利要求1所述的基于声音认知模型的智能辅助诊断系统，其特征在于：文本特征提取模块包括自然语言预处理模块，用于对人体生理现象声音数据以及对应的疾病信息进行自然语言预处理，并从处理后的数据中提取出人体生理现象声音数据的文本特征以及疾病信息的文本特征，所述人体生理现象声音数据包括：呼吸声音、说话声音、咳嗽声音、哭闹声音、打鼾声音、耳鸣声音、呻吟声音、打嗝声音以及放屁声音；生理现象声音数据的文本特征包括：咳声紧闷、咳声清脆、咳声如狗叫、咳声有力而重浊、咳声无力、咳声低微、咳声嘶哑、咳声阵作以及咳声连续；疾病信息的文本特征包括：白喉病、肺热病以及外感风热。

3.如权利要求1所述的基于声音认知模型的智能辅助诊断系统，其特征在于：辅助诊断模块包括报告生成模块，用于获取待诊断声音特征，从中提取待诊断声音文本特征信息，通过声音认知模型对该待诊断声音文本特征信息进行诊断，获取待诊断声音文本特征信息对应的疾病文本特征分词，并生成诊断报告单。

4.如权利要求3所述的基于声音认知模型的智能辅助诊断系统，其特征在于：辅助诊断模块还包括本地数据更新模块，用于将诊断报告单中待诊断声音文本特征信息以及对应的疾病文本特征分词存放入本地数据库中，对本地数据库中数据进行更新。

5.一种基于声音认知模型的智能辅助诊断设备，其特征在于，所述基于声音认知模型的智能辅助诊断设备包括：

文本特征提取单元还包括分词模块，用于通过加权算法在词频以及类别上对人体生理现象声音数据的文本特征以及疾病信息的文本特征进行权重标注，获取标注后的数据，将标注后的数据进行融合，形成人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词；

声音认知模型建立单元包括相似度计算模块，用于建立相似度算法以及空间向量模型，通过相似度算法计算人体生理现象声音数据的文本特征分词以及疾病信息的文本特征分词之间的相似度大小，根据该空间向量模型以及相似度大小生成声音认知模型；