CN110660395A

CN110660395A - 一种基于语音识别的安全报告生成方法和装置

Info

Publication number: CN110660395A
Application number: CN201910787297.3A
Authority: CN
Inventors: 夏超
Original assignee: Tianjin Xinkai Life Technology Co Ltd; Tianjin Happy Life Technology Co Ltd
Current assignee: Tianjin Xinkai Life Technology Co Ltd; Tianjin Happy Life Technology Co Ltd
Priority date: 2019-08-26
Filing date: 2019-08-26
Publication date: 2020-01-07
Anticipated expiration: 2039-08-26
Also published as: CN110660395B

Abstract

本发明公开了一种基于语音识别的安全报告生成方法和装置，该方法包括：分段获取的语音转换指令；提取所述语音转换指令中的语音信息，并根据所述语音信息生成文本文件；根据报告提交格式要求构建格式转换文件，并利用所述格式转换文件对所述文本文件进行格式转换。本发明通过分段获取语音信息，可以生成分段的节点文本信息，从而可以灵活地适应报告提交要求，提高数据格式转换效率；另一方面，通过将语音信息与数据结构转换进行结合，提高报告生成效率，增强报告生成过程中数据转换的灵活性。

Description

一种基于语音识别的安全报告生成方法和装置

技术领域

本发明涉及文件格式转换技术领域，尤其涉及一种基于语音识别的安全报告生成方法和装置。

背景技术

语音识别技术的目的是将人类的语音转换成计算机可识别的词汇，其原理为：对语音输入进行特征提取形成声学模型，然后在特定的语音数据库中对声学模型进行搜索，形成文本输出。语音数据库是一个存放声学模型与文本一一对应的数据库。

随着人工智能和机器学习的发展，语音识别在社交、智能家居、智能车载等行业内有了广范的应用。然而，在临床医疗行业内语音识别技术的应用范围还比较有限。目前，在搜集个例安全报告方面，要求提交的报告需按照E2B(R3)要求的格式进行提交，然而，目前还无法通过语音识别的方式将文本自动转换成符合E2B(R3)要求的格式，导致数据搜集的效率低下。

发明内容

本发明提供一种基于语音识别的安全报告生成方法和装置，以解决现有技术中由于无法通过语音识别的方式将文本自动转换成符合E2B(R3)要求的格式，导致数据搜集的效率低下的技术问题。

第一方面，本发明实施例提供了一种基于语音识别的安全报告生成方法，包括：

分段获取语音转换指令；

提取所述语音转换指令中的语音信息，并根据所述语音信息生成文本文件；

根据报告提交格式要求构建格式转换文件，并利用所述格式转换文件对所述文本文件进行格式转换。

第二方面，本发明实施例提供了一种基于语音识别的安全报告生成装置，包括：

获取模块，用于分段获取语音转换指令；

语音识别模块，用于提取所述语音转换指令中的语音信息，并根据所述语音信息生成文本文件；

格式转换模块，用于根据报告提交格式要求构建格式转换文件，并利用所述格式转换文件对所述文本文件进行格式转换。

第三方面，本发明实施例提供了一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现如上述第一方面中任一所述的基于语音识别的安全报告生成方法。

第四方面，本发明实施例提供了一种电子设备，包括：处理器、存储器和总线；所述存储器用于存储计算机程序，所述处理器与所述存储器通过所述总线连接，当所述电子设备运行时，所述处理器执行所述存储器的所述计算机程序，以使所述处理器执行如上述第一方面中任一所述的基于语音识别的安全报告生成方法。

本发明实施例提供的基于语音识别的安全报告生成方法和装置至少包括以下有益效果：

本发明通过语音识别技术获取报告生成数据，可以通过客户端实现，提高报告录入者操作便捷性，避免用户手动录入，丰富数据收集形式和数据收集范围。通过引入语音识别技术，可以维护医药行业的语音数据库，提高药品信息语音识别的准确性。通过将语音识别技术与json数据结构转换进行结合，提高报告生成效率，增强报告生成过程中数据转换的灵活性。

附图说明

为了更清楚地说明本发明实施例或现有的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的基于语音识别的安全报告生成方法的流程示意图；

图2为本发明一实施例提供的基于语音识别的安全报告生成方法中提取所述语音转换指令中的语音信息，并对所述语音信息分段进行语音识别的流程示意图；

图3为本发明一实施例提供的基于语音识别的安全报告生成方法中进行格式转换的流程示意图；

图4为本发明一实施例提供的基于语音识别的安全报告生成方法中格式校验的流程示意图；

图5为本发明一实施例提供的基于语音识别的安全报告生成装置的结构示意框图；

图6为本发明一实施例提供的基于语音识别的安全报告生成装置中格式转换模块的结构示意框图；

图7为适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合具体实施例及相应的附图对本发明的技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

json(JavaScript Object Notation,JS对象简谱)是一种轻量级的数据交换格式，json简洁和清晰的层次结构使得其成为理想的数据交换语言，易于开发人员阅读和编写，同时也易于机器解析和生成，并有效地提升网络传输效率。本发明将语音识别生成的文本通过json数据结构存储，可以直接将报告录入数据转换成报告提交要求的格式标准，可以充分满足医药行业中药物临床试验期间安全性数据快速报告生成的要求。本说明书实施例中根据现阶段我国发布的“关于《药物临床试验期间安全性数据快速报告标准和程序》的通知”，提供一种报告生成方法，可以将多段语音转换成符合通知中规定的文件格式，从而生成E2B(R3)所述格式的报告进行提交。

如图1所示，本发明实施例提供了一种基于语音识别的安全报告生成方法，在一个具体实施例中，该方法可以用于医药行业药物临床试验期间安全性报告提交系统，包括：

步骤S101：分段获取语音转换指令。

具体地，分别获取与不同报告节点对应的分段语音信息，以生成语音转换指令，所述分段语音信息包括：患者信息语音、报告者信息语音、药品信息语音和不良反应信息语音等其中的任意一段、或任意两段、或任意三段、或任意四段语音，当然，实际应用中可以根据使用场景的需要增加或减少分段语音的数量。在本实施例中，在获取语音转换指令时，也可以同时获取语音上传者的身份文本信息，所述身份文本信息至少包括上传人的姓名、联系方式和信息上传时间等中的至少一种，且可以根据实际数据的需要修改身份文本信息的内容，其目的是能够准确通过身份文本信息定位到具体的某个用户。需要说明的是，本说明书一下各步骤及相关实施例中仅以四段语音信息为例，但并不表明本申请的保护范围仅限于该说明书例举的实施例。

作为一种具体实施方式，本步骤中的语音转换指令可以是来自于客户端的输入信息，客户端可以是应用于手机等支持语音输入的移动设备中的应用程序，该应用程序作为报告上传系统的数据采集模块，能够支持客户端用户采用网络通信协议与服务端进行通信。本例中客户端用户采用智能手机应用程序进行语音输入，基于编程语言JavaScript进行开发，在客户端中用户首先通过身份账号进行注册登录，然后采用语音输入的方式快速收集药品不良反应信息，避免了手动数据。客户端的应用程序中可以包含四个语音录入端口，分别用于收集四段语音信息：患者信息、报告者信息、药品信息和不良反应信息。当用户分别输入这四段语音信息之后，客户端的应用程序将这四段信息采用mp3等音频格式存储在用户手机的储存卡中。

步骤S102：提取所述语音转换指令中的语音信息，并根据所述语音信息生成文本文件。

在一个实施例中，服务端接收来自客户端的语音转换指令文件后进行数据处理，解析语音转换指令文件，提取语音信息，即步骤S101中收集的四段语音信息：患者信息、报告者信息、药品信息和不良反应信息，将包含这四段语音信息的mp3文件交给语音识别模块分别进行语音识别处理，生成每段语音信息的节点文本信息保存到报告准备数据库中，并根据每段语音信息的节点文本信息生成文本文件。本实施例中的文本文件可以是json结构的文本文件，因此可以将四段语音信息识别得到的四段节点文本信息进行汇总合成一个json结构的文本文件。当然，在其他实施例中，根据所述语音信息生成文本文件的过程还可以为其他形式，并不仅限于上述的情形。

步骤S103：根据报告提交格式要求构建格式转换文件，并利用所述格式转换文件对所述文本文件进行格式转换。

例如，可以根据药物临床试验期间安全性数据快速报告的要求将json结构的文本文件按照E2B(R3)国际标准进行数据转换，得到个例安全报告。

本实施例通过语音识别技术获取报告生成数据，可以通过客户端实现，提高报告录入者操作便捷性，避免用户手动录入，丰富数据收集形式和数据收集范围。通过引入语音识别技术，可以维护医药行业的语音数据库，提高药品信息语音识别的准确性。通过将语音识别技术与json数据结构转换进行结合，提高报告生成效率，增强报告生成过程中数据转换的灵活性。同时通过将患者信息、报告者信息、药品信息和不良反应信息分段录入，使得分段进行语音识别时可以分别引入不同的语音数据库，如患者信息和报告者信息可以引用姓名数字语音数据库，该语言数据库中可以包含姓名、数字等常用语的声学模型和对应的文本信息、药品信息可以药品信息语音数据库，该语音数据库中可以包含药品词等常用语的声学模型和对应的文本信息、不良反应信息可以症状信息语音数据库，该语音数据库中可以包含症状词等常用语的声学模型和对应的文本信息，从而有助于提高语音识别的准确性，特别是对安全性要求最高的药品信息。当对药品信息进行语音识别时，由于药品信息是单独通过语音录入接口输入，在进行识别时只需要选择对应的药品语音数据库进行语音识别即可。比如：“剂型”这一专业术语，是指药品的物理存在形式，而在药品语音数据库中会存放包含“剂型”这一短语的声波的声学模型和与其对应的文本信息。如果没有这样的包含药品，症状的语音库，市面上的语音识别系统可能会把这段声波识别成“记性，急性”等等。

在一个实施例中，基于语音识别的安全报告生成方法还包括：获取语音转换指令上传者的身份文本信息，所述身份文本信息至少包括上传者的姓名、联系方式以及信息上传时间中的一种。

具体地，当客户端向服务端发送语音转换指令时，客户端的应用程序将自动获取语音上传者的信息，这些信息来自于用户注册登录客户端时录入的文本信息，以及用户在客户端进行操作时产生的操作日志文本信息，具体可以包括：上传人的姓名、联系方式、上传时间等文本信息。客户端向服务端发送语音转换指令时，把上述语音上传者的文本信息和四个mp3格式的语音信息打包，通过HTTPS协议加密上传至服务端。服务端接收来自客户端的数据后，首先提取非语音信息，即语音上传者的文本信息，将上传人的姓名、联系方式、上传时间等文本信息作为E2B(R3)国际标准的个例安全报告中的报告者信息节点的补充信息保存到报告准备数据库中。

作为一种具体的实施方式，如图2所示，上述步骤S102中提取所述语音转换指令中的语音信息，并根据所述语音信息生成文本文件，包括：

提取所述语音转换指令中的语音信息，并对所述语音信息分段进行语音识别，以获得所述语音信息对应的节点文本信息；

将分段的节点文本信息汇总，以生成文本文件。

其中，提取所述语音转换指令中的语音信息，并对所述语音信息分段进行语音识别，包括：

步骤S201：对一段语音转换指令中语音信息的声波进行特征提取，形成声学模型，即关键字数组(key数组)；

步骤S202：遍历所述声学模型(key数组)，将所述声学模型与语音数据库进行比对，以在所述语音数据库中获取与所述声学模型匹配的字典关键字(字典key)。

步骤S203：获取所述字典关键字对应的文本信息，以生成该段转换指令对应的节点文本信息。

具体地，本实施例采用字典数据结构的形式对每一段语音信息进行识别，分别获得每一段语音的文本信息。以识别患者信息的语音为例描述语音识别的过程如下：

i.对包含患者信息的mp3语音信息文件中的所有声波进行特征提取，形成多个声学模型：key数组。

ii.引入语音数据库(例如可以是姓名数字语音数据库)并解析为一个声学模型与文本一一对应的字典数据结构：dict<key,text>。

iii.利用上述字典数据结构遍历声学模型key数组，如果当前key与语音数据库中字典key相同，则记录当前字典key所对应的text文本，并保存到内存中。当遍历完成时，拼接所有声学模型key数组匹配到的文本信息，形成患者信息json数据格式的节点文本信息，并保存到报告准备数据库中。

与上述患者信息的语音识别过程同理，依次将引入的语音数据库替换为报告者信息语音数据库、药品信息语音数据库、症状信息语音数据库，然后重复上述过程依次可以得到报告者信息、药品信息、不良反应信息的json数据格式的节点文本信息，并保存至报告准备数据库中。

本实施例通过分别对每一段语音信息引入对应的语音数据库进行语音识别，可以提高语音识别的准确性，减少语音输入的个例安全报告的数据内容的误差。

作为一种具体的实施方式，上述步骤S103中根据报告提交格式要求对文本文件(例如该文本文件具有json结构)进行格式转换的步骤具体包括格式转换和格式校验，其中图3示出的是基于语音识别的安全报告生成方法中根据报告提交格式要求对json结构的文本文件进行格式转换的流程，通过以下步骤实现：

步骤S301：将所述json结构的文本文件转换成普通XML文件。

具体地，把json文件转换成普通XML文件。json是一种key-value格式的文件，而XML文件格式中value被key标签包围，如:{drugName:”药品名称”}这样的json格式则对应<drugName>药品名称</drugName>这样的XML格式，按照此规则，即可把上述语音信息生成的json结构的文本文件转化成普通XML格式文件。

步骤S302：根据报告提交格式要求构建格式转换文件。

本例中，具体地表现为构建如何把普通XML文件转换成符合E2B(R3)格式的XSL文件。该XSL文件中包含了如何把一个XML文件转化成另外一种XML文件的代码逻辑。如：源XML中药品名称的字段为：<drugName>药品名称</drugName>，而目标XML中药品名称字段应该为：<drugName2>药品名称</drugName2>。那么该XSL文件可以编写:<drugName2><xsl:valueof select＝”drugName”></drugName2>。其中select的值”drugName”为源XML文档中的节点。

步骤S303：利用所述格式转换文件对普通XML文件进行格式转换，以获得符合报告提交格式要求的格式文件。

具体地，通过上述构建的XSL文件把普通XML文件转成符合E2B(R3)格式的XML文件。

图4示出的是基于语音识别的安全报告生成方法中格式校验的流程，通过以下方式实现：

步骤S401：构建格式校验文件。

本例中，具体地表现为：构建校验E2B(R3)格式的XSD文件(必须包含患者名称，必须包含药品名称)。该XSD文件需按照E2B标准编写，最后形成的文件大致如下：

<！—患者姓名属性必须填写-->

<xs:attribute name＝"patientName"use＝"required">

<！—药品名称属性必须填写-->

<xs:attribute name＝"drugName"use＝"required">

步骤S402：利用该XSD文件可以校验一个XML文件是否符合E2B(R3)标准规范，即校验所述XML格式文件中的节点文本信息与报告提交格式要求的节点是否一致。如果所述XML格式文件中的节点文本信息与报告提交格式要求的节点一致，则：

步骤S403：将所述XML格式文件保存至安全报告数据库。

如果所述XML格式文件中的节点文本信息与报告提交格式要求的节点不一致，则：

步骤S404：安全报告生成失败。

本实施通过将语音信息生成的json结构文件进行数据格式转换，可以是语音输入的报告符合E2B(R3)标准规范，提高报告上传的通过率。

作为一种具体的实施方式，上述步骤S303中利用所述格式转换文件对普通XML文件进行格式转换，以获得符合报告提交格式要求的XML格式文件步骤后，还可以包括以下步骤：

判断语音转换指令中提取的语音信息是否为空，如果语音转换指令中提取的语音信息为空，则用非语音信息(上传者的身份文本信息)的节点文本信息填充该段语音信息的节点文本信息；如果语音转换指令中提取的语音信息不为空，则生成该段语音信息的节点文本信息，并用该段语音信息的节点文本信息覆盖非语音信息的节点文本信息。

在实际应用中，由于使用客户端进行语音输入的用户可能并不是该客户端的注册登录用户，此时语音输入的报告者信息和客户端自动上传的语音上传者的身份文本信息是不一致的，由于个例安全报告的提交仅需要语音输入者的信息，因此语音信息的节点文本信息会覆盖非语音信息的节点文本信息。当使用客户端进行语音输入的用户为该客户端的注册登录用户，此时用户可以无需另外输入报告者信息语音，在进行分段语音识别时，语音转换指令中提取的报告者语音信息就为空，此时可以直接使用客户端自动上传的语音上传者的身份文本信息对报告者语音的节点文本信息进行填充。

本实施例中，通过对语音转换指令中提取的语音信息进行判断，可以进一步提高语音输入信息的准确性和完整性，能够使信息录入者有选择地进行语音信息录入，并进行分段录入管理，避免因一大段语音录入后发现错误需要全部重新录入，从而提高语音信息录入的便捷性和灵活性。

基于与本发明方法上述各个实施例相同的构思，下面对本发明实施例提供的基于语音识别的安全报告生成装置进行介绍，下文描述的基于语音识别的安全报告生成装置与上文描述的基于语音识别的安全报告生成方法可相互对应参照。

请参考图5，本发明实施例提供了一种基于语音识别的安全报告生成装置，用于实现上述任一实施例中描述的基于语音识别的安全报告生成方法，如附图5所示的基于语音识别的安全报告生成装置包括：获取模块501、语音识别模块502和格式转换模块503。

其中，获取模块501，用于根据报告节点分段获取语音转换指令；语音识别模块502，用于提取所述语音转换指令中的语音信息，并根据所述语音信息生成文本文件；格式转换模块503，用于根据报告提交格式要求构建格式转换文件，并利用所述格式转换文件对所述文本文件进行格式转换。

请参考图6，本发明实施例提供了一种基于语音识别的安全报告生成装置，用于实现如图3和图4所示的任一实施例中描述的基于语音识别的安全报告生成方法，如附图6所示的基于语音识别的安全报告生成装置，在图5中所示的格式转换模块503，在本实施例中格式转换模块包括：转换单元601和校验单元602。

在本实施例中，转换单元601，用于实现如图3所示的根据报告提交格式要求构建格式转换文件的流程；校验单元602，用于实现如图4所示的构建格式校验文件的流程。

图7为适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-AccessMemory，RAM)，也可能还包括非易失性存储器(non-volatilememory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(IndustryStandardArchitecture，工业标准体系结构)总线、PCI(Peripheral ComponentInterconnect，外设部件互连标准)总线或EISA(Extended IndustryStandardArchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存储计算机程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

在一种可能实现的方式中，处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，也可从其它设备上获取相应的计算机程序，以在逻辑层面上形成采购发货信息交互录入系统。处理器，执行存储器所存放的程序，以通过执行的程序实现本发明任一实施例中提供的基于语音识别的安全报告生成方法。

上述如本发明图5或6所示实施例提供的基于语音识别的安全报告生成装置执行图1-4任一所示实施例的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(CentralProcessingUnit，CPU)、网络处理器(NetworkProcessor，NP)等；还可以是数字信号处理器(DigitalSignalProcessor，DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit，ASIC)、现场可编程门阵列(Field－ProgrammableGateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者是任何常规的处理器等。

结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

本发明实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的电子设备执行时，能够使该电子设备执行本发明任一实施例中提供的基于语音识别的安全报告生成方法。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元或模块分别描述。当然，在实施本发明时可以把各单元或模块的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、系统、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本发明的实施例可提供为方法、系统或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本发明中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的实施例而已，并不用于限制本发明。对于本领域技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的权利要求范围之内。

Claims

1.一种基于语音识别的安全报告生成方法，其特征在于，包括：

分段获取语音转换指令；

2.根据权利要求1所述的基于语音识别的安全报告生成方法，其特征在于，所述分段获取语音转换指令步骤中，分别获取与不同报告节点对应的分段语音信息，以生成所述语音转换指令，所述分段语音信息至少包括患者信息、报告者信息、药品信息以及不良反应信息中的一种。

3.根据权利要求1所述的基于语音识别的安全报告生成方法，其特征在于，所述提取所述语音转换指令中的语音信息，并根据所述语音信息生成文本文件，包括：

提取所述语音转换指令中的所述语音信息，并对所述语音信息进行语音识别，以获得所述语音信息对应的节点文本信息；

将分段的所述节点文本信息汇总，以生成所述文本文件。

4.根据权利要求3所述的基于语音识别的安全报告生成方法，其特征在于，所述提取所述语音转换指令中的所述语音信息，并对所述语音信息进行语音识别，以获得所述语音信息对应的节点文本信息，包括：

对所述语音转换指令中的所述语音信息的声波进行特征提取，形成声学模型；

将所述声学模型与语音数据库进行比对，以在所述语音数据库中获取与所述声学模型匹配的字典关键字；

获取所述字典关键字对应的文本信息，以生成所述语音转换指令对应的节点文本信息。

5.根据权利要求1所述的基于语音识别的安全报告生成方法，其特征在于，所述文本文件为json格式的文件；

所述根据报告提交格式要求构建格式转换文件，并利用所述格式转换文件对所述文本文件进行格式转换，包括：

将所述json结构的文件转换成普通XML文件；

根据报告提交格式要求构建所述格式转换文件；

利用所述格式转换文件对所述普通XML文件进行格式转换，以获得符合报告提交格式要求的格式文件。

6.根据权利要求5所述的基于语音识别的安全报告生成方法，其特征在于，所述利用所述格式转换文件对所述普通XML文件进行格式转换，以获得符合报告提交格式要求的格式文件步骤后，还包括：

构建格式校验文件；

校验所述符合报告提交格式要求的格式文件中的节点文本信息与报告提交格式要求的节点文本信息是否一致；

如果所述符合报告提交格式要求的格式文件中的节点文本信息与报告提交格式要求的节点一致，则将所述符合报告提交格式要求的格式文件保存至安全报告数据库。

7.根据权利要求1～6任一项所述的基于语音识别的安全报告生成方法，其特征在于，还包括：

获取所述语音转换指令的上传者的身份文本信息，所述身份文本信息至少包括上传者的姓名、联系方式以及信息上传时间中的一种。

8.一种基于语音识别的安全报告生成装置，其特征在于，包括：

获取模块，用于分段获取语音转换指令；

9.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1至7中任一项所述的基于语音识别的安全报告生成方法。

10.一种电子设备，包括：处理器、存储器和总线；所述存储器用于存储计算机程序，所述处理器与所述存储器通过所述总线连接，当所述电子设备运行时，所述处理器执行所述存储器的所述计算机程序，以使所述处理器执行如权利要求1至7中任一项所述的基于语音识别的安全报告生成方法。