CN116383766A

CN116383766A - 基于多模态数据的辅诊方法、装置、设备及存储介质

Info

Publication number: CN116383766A
Application number: CN202310403656.7A
Authority: CN
Inventors: 姚海申
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2023-04-12
Filing date: 2023-04-12
Publication date: 2023-07-04

Abstract

本发明涉及数字医疗领域的人工智能技术，揭露了一种基于多模态数据的辅诊方法，包括：利用预设的多个神经网络构建多模态特征提取模型及多模态特征融合模型，利用多模态特征提取模型对问诊数据集合中的文本数据、图像数据及结构化数据进行特征提取，得到多模态特征集合，利用多模态特征融合模型对多模态特征集合中的特征进行特征融合及特征加权处理，得到特征加权结果，基于特征加权结果对文本数据进行可视化加权处理，得到辅诊结果。本发明还涉及区块链技术，所述辅诊结果可存储在区块链的节点中。本发明还提出一种基于多模态数据的辅诊装置、电子设备以及可读存储介质。本发明可以提高辅诊结果的准确率。

Description

基于多模态数据的辅诊方法、装置、设备及存储介质

技术领域

本发明涉及数字医疗及人工智能技术领域，尤其涉及一种基于多模态数据的辅诊方法、装置、电子设备及可读存储介质。

背景技术

随着计算力和数据量的大幅度提升，人工智能技术获得进一步的发展，应用人工智能解决医疗领域问题已成为了热点，例如，通过人工智能分析患者和医生的对话，从而辅助医生进行诊断的辅诊系统。

现有技术中，通过文本识别模型分析问诊过程的对话，并给出辅诊结果，主要有以下缺陷：1、由于患者表述不清楚，且有大量的图像数据、结构化数据未进行利用，导致辅诊结果不准确；2、仅给出诊断结果，未能展示得出诊断结果的依据有哪些，使得辅诊结果不够直观。

发明内容

本发明提供一种基于多模态数据的辅诊方法、装置、电子设备及可读存储介质，其主要目的在于可以提高辅诊结果的准确率。

为实现上述目的，本发明提供的一种基于多模态数据的辅诊方法，包括：

获取问诊数据集合，其中，所述问诊数据集合包括文本数据、图像数据及结构化数据；

利用预设的多个神经网络构建多模态特征提取模型及多模态特征融合模型；

利用所述多模态特征提取模型对所述问诊数据集合中的文本数据、图像数据及结构化数据进行特征提取，得到多模态特征集合；

利用所述多模态特征融合模型对所述多模态特征集合中的特征进行特征融合及特征加权处理，得到特征加权结果；

基于所述特征加权结果对所述文本数据进行可视化加权处理，得到辅诊结果。

可选地，所述预设的多个神经网络包括第一Bi-GRU网络、第二Bi-GRU网络、ResNet网络及DNN网络。

可选地，所述利用预设的多个神经网络构建多模态特征提取模型及多模态特征融合模型，包括：

在所述ResNet网络后添加一个全连接层，得到图像特征提取网络；

将所述第一Bi-GRU网络作为文本特征提取网络，以及将所述DNN网络作为结构特征提取网络；

将所述文本特征提取网络、所述图像特征提取网络及所述结构特征提取网络并联，得到所述多模态特征提取模型；

在所述第二Bi-GRU网络后添加一个注意力机制层，得到所述多模态特征融合模型，并将所述多模态特征提取模型及所述多模态特征融合模型进行串联。

可选地，所述利用所述多模态特征提取模型对所述问诊数据集合中的文本数据、图像数据及结构化数据进行特征提取，得到多模态特征集合，包括：

利用所述多模态特征提取模型中的文本特征提取网络对所述文本数据进行特征编码，得到文本特征；

利用所述多模态特征提取模型中的图像特征提取网络对所述图像数据进行特征编码及特征标准化处理，得到图像特征；

利用所述多模态特征提取模型中的结构特征提取网络对所述结构数据进行特征编码及特征标准化处理，得到结构特征；

汇总所述文本特征、所述图像特征及所述结构特征，得到所述多模态特征集合。

可选地，所述利用所述多模态特征提取模型中的图像特征提取网络对所述图像数据进行特征编码及特征标准化处理，得到图像特征，包括：

利用所述ResNet网络对所述图像数据进行特征编码，得到编码图像特征；

判断所述编码图像特征的特征个数是否满足预设的特征阈值；

若所述编码图像特征的特征个数大于等于所述特征阈值，则基于所述特征阈值对所述编码图像特征进行截断处理，将截断后的特征作为原始图像特征；

若所述编码图像特征的特征个数小于所述特征阈值，则基于所述特征阈值对所述编码图像特征进行填充处理，将填充后的特征作为原始图像特征；

利用所述全连接层对所述原始图像特征进行预设维度的特征映射，得到所述图像特征。

可选地，所述利用所述多模态特征融合模型对所述多模态特征集合中的特征进行特征融合及特征加权处理，得到特征加权结果，包括：

利用所述多模态特征融合模型中的第二Bi-GRU网络对所述多模态特征集合中的特征进行特征编码，得到融合特征；

利用所述多模态特征融合模型中的注意力机制层对所述融合特征进行特征加权处理，得到所述特征加权结果。

可选地，所述基于所述特征加权结果对所述文本数据进行可视化加权处理，得到辅诊结果，包括：

对所述文本数据中的每句话进行时间顺序排列，得到对话序列；

基于所述特征加权结果对所述对话序列中的相关词语进行加粗处理，得到标准对话序列；

基于所述特征加权结果构建所述对话序列的特征权重柱状图，汇总所述特征加权结果、特征权重柱状图及所述标准对话序列得到辅诊结果。

为了解决上述问题，本发明还提供一种基于多模态数据的辅诊装置，所述装置包括：

多模态模型构建模块，用于获取问诊数据集合，其中，所述问诊数据集合包括文本数据、图像数据及结构化数据，利用预设的多个神经网络构建多模态特征提取模型及多模态特征融合模型；

特征提取模块，用于利用所述多模态特征提取模型对所述问诊数据集合中的文本数据、图像数据及结构化数据进行特征提取，得到多模态特征集合；

特征融合模块，用于利用所述多模态特征融合模型对所述多模态特征集合中的特征进行特征融合及特征加权处理，得到特征加权结果；

可视化展示模块，用于基于所述特征加权结果对所述文本数据进行可视化加权处理，得到辅诊结果。

为了解决上述问题，本发明还提供一种电子设备，所述电子设备包括：

存储器，存储至少一个计算机程序；及

处理器，执行所述存储器中存储的计算机程序以实现上述所述的基于多模态数据的辅诊方法。

为了解决上述问题，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一个计算机程序，所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的基于多模态数据的辅诊方法。

本发明通过利用预设的多个神经网络构建多模态特征提取模型及多模态特征融合模型，利用多模态特征提取模型对问诊数据集合中的文本数据、图像数据及结构化数据进行特征提取，再利用多模态特征融合模型对多模态特征集合中的特征进行特征融合及特征加权处理，得到特征加权结果，由于针对不同类型数据选用不同的神经网络进行特征提取，并将不同类型数据进行融合，能够更好的利用不同类型的数据，提高辅诊结果的准确率。同时，基于特征加权结果对文本数据进行可视化加权处理，能够有效的展示特征加权结果是根据文本数据中哪句话、哪些关键词给出的，可以更加直观的表示辅诊结果。因此本发明提出的基于多模态数据的辅诊方法、装置、电子设备及计算机可读存储介质，可以提高辅诊结果的准确率。

附图说明

图1为本发明一实施例提供的基于多模态数据的辅诊方法的流程示意图；

图2为本发明一实施例提供的基于多模态数据的辅诊装置的功能模块图；

图3为本发明一实施例提供的实现所述基于多模态数据的辅诊方法的电子设备的结构示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例提供一种基于多模态数据的辅诊方法。所述基于多模态数据的辅诊方法的执行主体包括但不限于服务端、终端等能够被配置为执行本发明实施例提供的该方法的电子设备中的至少一种。换言之，所述基于多模态数据的辅诊方法可以由安装在终端设备或服务端设备的软件或硬件来执行，所述软件可以是区块链平台。所述服务端包括但不限于：单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

参照图1所示，为本发明一实施例提供的基于多模态数据的辅诊方法的流程示意图。在本实施例中，所述基于多模态数据的辅诊方法包括以下步骤S1-S5：

S1、获取问诊数据集合，其中，所述问诊数据集合包括文本数据、图像数据及结构化数据。

本发明实施例中，所述问诊数据集合可以为互联网线上问诊系统中患者和医生的对话沟通数据，包含文本数据(患者和医生的对话文本)、图像数据(患者发送的问诊病情图像)及结构化数据(患者根据互联网线上问诊系统提供的模板所填写的性别、年龄等)。

S2、利用预设的多个神经网络构建多模态特征提取模型及多模态特征融合模型。

本发明实施例中，所述预设的多个神经网络包括第一Bi-GRU网络、第二Bi-GRU网络、ResNet网络及DNN网络。

其中，Bi-GRU(Bi-directionalGated Recurrent Unit，双向门控循环单元结构)网络可以同时处理双向的时间顺序信息，Bi-GRU对序列分别采用前向和反向计算得到两个不同的隐藏层状态，再将两个向量相加得到最终的结果，从而充分利用序列信息，有利于特征提取；ResNet(残差神经网络)网络通过堆叠多个子网络，可以解决网络退化问题，提高网络特征提取的准确率；DNN(Deep Neural Networks，深度神经网络)包括输入层、隐藏层及输出层，从输入层开始，一层层地向后计算，一直到运算到输出层，同时每层的结点与下一层所有结点都有运算关系，从而更好的分离数据的特征。

详细地，所述利用预设的多个神经网络构建多模态特征提取模型及多模态特征融合模型，包括：

本发明一可选实施例中，利用不同的神经网络来对不同类型的数据进行特征提取，可以提高数据特征提取的准确率，从而准确识别多模态数据中的关键信息，提高数据分析的准确率。

S3、利用所述多模态特征提取模型对所述问诊数据集合中的文本数据、图像数据及结构化数据进行特征提取，得到多模态特征集合。

详细地，所述利用所述多模态特征提取模型对所述问诊数据集合中的文本数据、图像数据及结构化数据进行特征提取，得到多模态特征集合，包括：

本发明实施例中，以医疗领域为例，问诊会话是一种时序信息，对于一次问诊对话U＝{u1,u2,…ui…,un}，其中ui表示第i句对话，对于每句话ui＝{w1,w2,…wi…,wm}，wi表示第i个词，n表示文本会话数据的数量，m表示每句话的词语数量，将ui输入给Bi-GRU网络后，获取得到ui的句子表示si，则si的大小为m*d(即词个数*隐层大小)，对U每句话编码后便可得到文本特征{s1,s2,…,sn}。

详细地，所述利用所述多模态特征提取模型中的图像特征提取网络对所述图像数据进行特征编码及特征标准化处理，得到图像特征，包括：

本发明一可选实施例中，对于图像数据，使用ResNet网络获取输入图像并输出编码图像特征，设ResNet网络输出特征个数为k，维度为q，则编码图像特征大小为k*q，对于k如果其大于m(预设的特征阈值)，则截断为m；如果小于m，则进行填充，填充到大小为m，得到原始图像特征(大小为m*q)，再将原始图像特征输入到一个大小为q*d的全连接层，将ResNet网络输出的特征矩阵映射为m*d，从统一特征维度。

本发明一可选实施例中，对于结构图像，使用DNN模型对结构化数据进行编码，结构化数据可以包含用户的性别、年龄、身高、体重、PMI等。同时DNN最后一层输出大小设置为d，以统一输出的特征大小；设DNN输入特征个数为x，同样的，对于x如果其大于m，则截断为m，如果小于m，则进行填充，填充到大小为m，最终DNN输出结构特征大小为x*d。

S4、利用所述多模态特征融合模型对所述多模态特征集合中的特征进行特征融合及特征加权处理，得到特征加权结果。

详细地，所述利用所述多模态特征融合模型对所述多模态特征集合中的特征进行特征融合及特征加权处理，得到特征加权结果，包括：

本发明一可选实施例中，ht为第二Bi-GRU网络输出的第t个融合特征向量，经过注意力机制层后得到初始的状态向量st，然后再和权重系数θt对应相乘，累加求和得出最终的输出向量y，即特征加权结果。

本发明实施例中，在医疗领域的问诊过程中，前后对话具有较强的语义联系，为了保持语义能够随着对话的进行得到很好地传递，使用时序模型第一Bi-GRU对整个对话进行表示，以将前面的对话状态传递下去，更好的捕获上文的语义状态，在对话文本特征后，通过第二Bi-GRU网络对图像特征和结构化特征进行特征融合，让模型学习到图像和结构化特征，最后通过注意力机制对每类特征进行加权，从而让模型学习到图像和结构化特征对最终诊断的重要性，提高辅诊的准确性。

S5、基于所述特征加权结果对所述文本数据进行可视化加权处理，得到辅诊结果。

详细地，所述基于所述特征加权结果对所述文本数据进行可视化加权处理，得到辅诊结果，包括：

本发明一可选实施例中，例如，对于问诊数据集合得到的特征加权结果包括{“皮炎”：“36.16％”，“皮疹”：“28.12％”，“湿疹”：“19.07％”；“丘疹性荨麻疹”：“8.35％”，“荨麻疹”：“1.38％”}，对文本数据中的每句话进行时间顺序排列，得到对话序列，其中每一行是一句话，并在每句话的最左侧构建柱状图代表每句话的重要性，颜色越深、柱状图越长表示这句话重要性越大，同时对重要性较大的句子中的相关词语进行标注，如“湖北武汉市用户：宝宝屁股长很多红疙瘩”句中的“屁股”、“红疙瘩”等。通过可视化加权处理，给出的辅诊结果中包含是根据医患对话的哪些话语、哪些关键词给出的当前诊断，可以直观的表示辅诊结果，进一步提高了辅诊结果的准确性。

本发明通过利用预设的多个神经网络构建多模态特征提取模型及多模态特征融合模型，利用多模态特征提取模型对问诊数据集合中的文本数据、图像数据及结构化数据进行特征提取，再利用多模态特征融合模型对多模态特征集合中的特征进行特征融合及特征加权处理，得到特征加权结果，由于针对不同类型数据选用不同的神经网络进行特征提取，并将不同类型数据进行融合，能够更好的利用不同类型的数据，提高辅诊结果的准确率。同时，基于特征加权结果对文本数据进行可视化加权处理，能够有效的展示特征加权结果是根据文本数据中哪句话、哪些关键词给出的，可以更加直观的表示辅诊结果。因此本发明提出的基于多模态数据的辅诊方法，可以提高辅诊结果的准确率。

如图2所示，是本发明一实施例提供的基于多模态数据的辅诊装置的功能模块图。

本发明所述基于多模态数据的辅诊装置100可以安装于电子设备中。根据实现的功能，所述基于多模态数据的辅诊装置100可以包括多模态模型构建模块101、特征提取模块102、特征融合模块103及可视化展示模块104。本发明所述模块也可以称之为单元，是指一种能够被电子设备处理器所执行，并且能够完成固定功能的一系列计算机程序段，其存储在电子设备的存储器中。

在本实施例中，关于各模块/单元的功能如下：

所述多模态模型构建模块101，用于获取问诊数据集合，其中，所述问诊数据集合包括文本数据、图像数据及结构化数据，利用预设的多个神经网络构建多模态特征提取模型及多模态特征融合模型；

所述特征提取模块102，用于利用所述多模态特征提取模型对所述问诊数据集合中的文本数据、图像数据及结构化数据进行特征提取，得到多模态特征集合；

所述特征融合模块103，用于利用所述多模态特征融合模型对所述多模态特征集合中的特征进行特征融合及特征加权处理，得到特征加权结果；

所述可视化展示模块104，用于基于所述特征加权结果对所述文本数据进行可视化加权处理，得到辅诊结果。

详细地，所述基于多模态数据的辅诊装置100各模块的具体实施方式如下：

步骤一、获取问诊数据集合，其中，所述问诊数据集合包括文本数据、图像数据及结构化数据。

步骤二、利用预设的多个神经网络构建多模态特征提取模型及多模态特征融合模型。

步骤三、利用所述多模态特征提取模型对所述问诊数据集合中的文本数据、图像数据及结构化数据进行特征提取，得到多模态特征集合。

步骤四、利用所述多模态特征融合模型对所述多模态特征集合中的特征进行特征融合及特征加权处理，得到特征加权结果。

步骤五、基于所述特征加权结果对所述文本数据进行可视化加权处理，得到辅诊结果。

本发明通过利用预设的多个神经网络构建多模态特征提取模型及多模态特征融合模型，利用多模态特征提取模型对问诊数据集合中的文本数据、图像数据及结构化数据进行特征提取，再利用多模态特征融合模型对多模态特征集合中的特征进行特征融合及特征加权处理，得到特征加权结果，由于针对不同类型数据选用不同的神经网络进行特征提取，并将不同类型数据进行融合，能够更好的利用不同类型的数据，提高辅诊结果的准确率。同时，基于特征加权结果对文本数据进行可视化加权处理，能够有效的展示特征加权结果是根据文本数据中哪句话、哪些关键词给出的，可以更加直观的表示辅诊结果。因此本发明提出的基于多模态数据的辅诊装置，可以提高辅诊结果的准确率。

如图3所示，是本发明一实施例提供的实现所述基于多模态数据的辅诊方法的电子设备的结构示意图。

所述电子设备可以包括处理器10、存储器11、通信接口12和总线13，还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序，如基于多模态数据的辅诊程序。

其中，所述存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如：SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元，例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备，例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card，SMC)、安全数字(SecureDigital，SD)卡、闪存卡(Flash Card)等。进一步地，所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据，例如基于多模态数据的辅诊程序的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

所述处理器10在一些实施例中可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(Central Processing Unit，CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit)，利用各种接口和线路连接整个电子设备的各个部件，通过运行或执行存储在所述存储器11内的程序或者模块(例如基于多模态数据的辅诊程序等)，以及调用存储在所述存储器11内的数据，以执行电子设备的各种功能和处理数据。

所述通信接口12用于上述电子设备与其他设备之间的通信，包括网络接口和用户接口。可选地，所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等)，通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard))，可选地，用户接口还可以是标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。

所述总线13可以是外设部件互连标准(Peripheral Component Interconnect，简称PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture，简称EISA)总线等。该总线13可以分为地址总线、数据总线、控制总线等。所述总线13被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。

图3仅示出了具有部件的电子设备，本领域技术人员可以理解的是，图3示出的结构并不构成对所述电子设备的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

例如，尽管未示出，所述电子设备还可以包括给各个部件供电的电源(比如电池)，优选地，电源可以通过电源管理装置与所述至少一个处理器10逻辑相连，从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等，在此不再赘述。

进一步地，所述电子设备还可以包括网络接口，可选地，所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等)，通常用于在该电子设备与其他电子设备之间建立通信连接。

可选地，该电子设备还可以包括用户接口，用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard))，可选地，用户接口还可以是标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。

应该了解，所述实施例仅为说明之用，在专利申请范围上并不受此结构的限制。

所述电子设备中的所述存储器11存储的基于多模态数据的辅诊程序是多个指令的组合，在所述处理器10中运行时，可以实现：

具体地，所述处理器10对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述，在此不赘述。

进一步地，所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的，也可以是非易失性的。例如，所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)。

本发明还提供一种计算机可读存储介质，所述可读存储介质存储有计算机程序，所述计算机程序在被电子设备的处理器所执行时，可以实现：

在本发明所提供的几个实施例中，应该理解到，所揭露的设备，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。

因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。

本发明实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种基于多模态数据的辅诊方法，其特征在于，所述方法包括：

2.如权利要求1所述的基于多模态数据的辅诊方法，其特征在于，所述预设的多个神经网络包括第一Bi-GRU网络、第二Bi-GRU网络、ResNet网络及DNN网络。

3.如权利要求2中所述的基于多模态数据的辅诊方法，其特征在于，所述利用预设的多个神经网络构建多模态特征提取模型及多模态特征融合模型，包括：

4.如权利要求3所述的基于多模态数据的辅诊方法，其特征在于，所述利用所述多模态特征提取模型对所述问诊数据集合中的文本数据、图像数据及结构化数据进行特征提取，得到多模态特征集合，包括：

5.如权利要求4所述的基于多模态数据的辅诊方法，其特征在于，所述利用所述多模态特征提取模型中的图像特征提取网络对所述图像数据进行特征编码及特征标准化处理，得到图像特征，包括：

6.如权利要求3所述的基于多模态数据的辅诊方法，其特征在于，所述利用所述多模态特征融合模型对所述多模态特征集合中的特征进行特征融合及特征加权处理，得到特征加权结果，包括：

7.如权利要求1所述的基于多模态数据的辅诊方法，其特征在于，所述基于所述特征加权结果对所述文本数据进行可视化加权处理，得到辅诊结果，包括：

8.一种基于多模态数据的辅诊装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的基于多模态数据的辅诊方法。

10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的基于多模态数据的辅诊方法。