CN112732869A

CN112732869A - 车载语音信息管理方法、装置、计算机设备和存储介质

Info

Publication number: CN112732869A
Application number: CN202011630381.3A
Authority: CN
Inventors: 于兴文
Original assignee: Dilu Technology Co Ltd
Current assignee: Dilu Technology Co Ltd
Priority date: 2020-12-31
Filing date: 2020-12-31
Publication date: 2021-04-30
Anticipated expiration: 2040-12-31
Also published as: CN112732869B

Abstract

本申请涉及一种车载语音信息管理方法、装置、计算机设备和存储介质。该方法包括：获取车辆内部的语音接收器采集的语音信息；采用语音识别技术将语音信息转化为自然语言信息；采用声纹识别技术对语音信息进行声纹识别，确定语音信息中的声音主体；采用自然语言处理技术对自然语言信息进行挖掘，获得关键信息点；将语音信息、自然语言信息、声音主体、时间信息和关键信息点结构化形式存储在数据库中，实现对车内语音信息进行关键且精准的提取，辅助用户进行日常工作生活的有效记录管理，结构化信息有助于提升车载语音系统的独特性与智能性，使数据资源得到有效的利用，提升车载语音系统的智能性。

Description

车载语音信息管理方法、装置、计算机设备和存储介质

技术领域

本申请涉及智能汽车技术领域，特别是涉及一种车载语音信息管理方法、装置、计算机设备和存储介质。

背景技术

随着智能汽车技术领域的不断发展，己经成为世界车辆工程领域研究的热点和汽车工业增长的新动力，智能汽车较为成熟的和可预期的功能和系统主要是包括智能驾驶系统、生活服务系统、安全防护系统、位置服务系统以及用车服务系统等。

而目前对于智能汽车的生活服务系统中的车载语音系统，目前通常根据用户发出的指令，进行语音信息识别与语义理解，执行相关操作，并对用户进行反馈，整个过程是一个由用户发起的单方面输入过程，并未对这些语音信息进行有效的结构化存储，也未对语音信息的关键信息点进行挖掘、分析，未从多人会话的角度对语音信息进行管理，导致数据资源的浪费。

发明内容

基于此，有必要针对上述技术问题，提供一种能够解决数据资源的浪费的车载语音信息管理方法、装置、计算机设备和存储介质。

一种车载语音信息管理方法，所述方法包括：

获取车辆内部的语音接收器采集的语音信息；

采用语音识别技术将所述语音信息转化为自然语言信息；

采用声纹识别技术对所述语音信息进行声纹识别，确定所述语音信息中的声音主体；

采用自然语言处理技术对所述自然语言信息进行挖掘，获得关键信息点；

将所述语音信息、所述自然语言信息、所述声音主体、时间信息和所述关键信息点结构化形式存储在数据库中。

在其中一个实施例中，所述方法还包括：

根据获取到的主题分析条件，从所述数据库中提取对应的待分析自然语言信息；

通过lasertagger算法对所述待分析自然语言信息进行抽取式摘要提取，获得文本摘要；

将所述主题分析条件、所述文本摘要与所述待分析自然语言信息存储至数据库中。

在其中一个实施例中，所述方法还包括：

通过语言模型将所述待分析自然语言信息进行转化，获得向量特征；

基于密度聚类算法对所述向量特征进行无监督聚类，获得聚类结果；

将所述聚类结果与所述主题分析条件存储至数据库中。

在其中一个实施例中，所述方法还包括：

对所述聚类结果的各类簇中的待分析自然语言信息进行关键词数量分析，确定各所述类簇中的关键词数量；

对各所述类簇中摘要包含的语句条数进行分析，确定各所述类簇中摘要包含的语句条数；

根据所述关键词数量和所述摘要包含的语句条数，对各所述类簇进行排序，获得各所述类簇的排序结果；

根据各所述类簇的排序结果对各所述类簇进行重要性标记。

在其中一个实施例中，所述对所述聚类结果的各类簇中的待分析自然语言信息进行关键词数量分析，确定各所述类簇中的关键词数量的步骤，包括：

对所述聚类结果的各类簇中的待分析自然语言信息进行关键词分析，获得各所述类簇的关键词结果；

根据各所述类簇的关键词结果进数量分析，获得各所述类簇中的关键词数量。

在其中一个实施例中，所述主题分析条件包括以下任意一种以上：

主题分析的时间；

主题分析的时间和声音主体。

在其中一个实施例中，所述采用自然语言处理技术对所述自然语言信息进行挖掘，获得关键信息点的步骤，包括：

采用ELECTRA+NN语言模型对所述自然语言信息进行自然语言意图识别，获得意图信息与情绪信息；

采用ELECTRA+CRF语言模型对所述自然语言信息进行命名实体识别，获得命名实体信息；

采用语义角色标注算法与依存句法对所述自然语言信息进行结构变换，获得关键词和关键短语；

将所述意图信息、情绪信息、命名实体信息、关键词和关键短语作为关键信息点。

一种车载语音信息管理装置，所述装置包括：

语音信息获取模块，用于获取车辆内部的语音接收器采集的语音信息；

转化模块，用于采用语音识别技术将所述语音信息转化为自然语言信息；

声纹识别模块，用于采用声纹识别技术对所述语音信息进行声纹识别，确定所述语音信息中的声音主体；

信息挖掘模块，用于采用自然语言处理技术对所述自然语言信息进行挖掘，获得关键信息点；

存储模块，用于将所述语音信息、所述自然语言信息、所述声音主体、时间信息和所述关键信息点结构化形式存储在数据库中。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现所述方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现所述的方法的步骤。

上述车载语音信息管理方法、装置、计算机设备和存储介质，通过获取车辆内部的语音接收器采集的语音信息；采用语音识别技术将语音信息转化为自然语言信息；采用声纹识别技术对语音信息进行声纹识别，确定语音信息中的声音主体；采用自然语言处理技术对自然语言信息进行挖掘，获得关键信息点；将语音信息、自然语言信息、声音主体、时间信息和关键信息点结构化形式存储在数据库中，实现对车内语音信息进行关键且精准的提取，辅助用户进行日常工作生活的有效记录管理，结构化信息有助于提升车载语音系统的独特性与智能性，使数据资源得到有效的利用，提升车载语音系统的智能性。

附图说明

图1为一个实施例中车载语音信息管理方法的应用环境图；

图2为一个实施例中车载语音信息管理方法的流程示意图；

图3为一个实施例中车载语音信息管理装置的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的车载语音信息管理方法，可以独立应用于车辆102中。也可以应用于如图1所示的应用环境中，其中，车辆102通过网络与服务器104通过网络进行通信。可以是服务器104获取车辆102内部的语音接收器采集的语音信息；服务器104采用语音识别技术将语音信息转化为自然语言信息；服务器104采用声纹识别技术对语音信息进行声纹识别，确定语音信息中的声音主体；服务器104采用自然语言处理技术对自然语言信息进行挖掘，获得关键信息点；服务器104将语音信息、自然语言信息、声音主体、时间信息和关键信息点结构化形式存储在数据库中。其中，车辆102可以但不限于是各种类型的汽车，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种车载语音信息管理方法，以应用于服务器为例进行说明，包括以下步骤：

步骤S220，获取车辆内部的语音接收器采集的语音信息。

其中，车辆内部安装了语音信息接收器，起到语音输入功能，输入时保留语音的音色与自然语言信息，支持迅速、准确的接收车辆内部的语音信息。

步骤S240，采用语音识别技术将语音信息转化为自然语言信息。

其中，语音识别技术是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。自然语言信息是通过语音识别技术对语音信息转化为自然语言的文本数据。

步骤S260，采用声纹识别技术对语音信息进行声纹识别，确定语音信息中的声音主体。

其中，采用声纹识别技术对语音信息进行声纹识别，确定出该语音信息是谁说的，为该语音信息标记出对应说话人的标识，如：采用声纹识别技术对语音信息进行声纹识别，识别出是A说的，则确定出该语音信息中的声音主体为A，然后标记该语音信息是A说的。

步骤S280，采用自然语言处理技术对自然语言信息进行挖掘，获得关键信息点。

在一个实施例中，采用自然语言处理技术对自然语言信息进行挖掘，获得关键信息点的步骤，包括：采用ELECTRA+NN语言模型对自然语言信息进行自然语言意图识别，获得意图信息与情绪信息；采用ELECTRA+CRF语言模型对自然语言信息进行命名实体识别，获得命名实体信息；采用语义角色标注算法与依存句法对自然语言信息进行结构变换，获得关键词和关键短语；将意图信息、情绪信息、命名实体信息、关键词和关键短语作为关键信息点。

其中，ELECTRA+NN语言模型是用于对自然语言信息进行自然语言意图识别的模型，ELECTRA的全称是Efficiently Learning an Encoder that Classifies TokenReplacements Accurately，ELECTRA是在bert模型结构的基础上引入对抗生成网络，对语言模型训练方式进行了改进。该模型可以在同等模型大小情况下实现较bert更快的训练速度及更高的模型精度。NN为全连接解码层，作为模型输出的解码器被构建。

ELECTRA+CRF语言模型是用于对自然语言信息进行命名实体识别的模型，CRF为条件随机场，作为模型输出的解码器被构建。

步骤S300，将语音信息、自然语言信息、声音主体、时间信息和关键信息点结构化形式存储在数据库中。

其中，结构化形式存储是指以在一个文件内存储层次化的数据存储方式，如以表格化的存储格式，即语音信息作为一列，自然语言信息作为一列，声音主体作为一列，时间信息作为一列，关键信息点中的意图信息、情绪信息、命名实体信息、关键词和关键短语各作为一列，语音信息、自然语言信息、声音主体、时间信息和关键信息点存在对应关系。

上述车载语音信息管理方法，通过获取车辆内部的语音接收器采集的语音信息；采用语音识别技术将语音信息转化为自然语言信息；采用声纹识别技术对语音信息进行声纹识别，确定语音信息中的声音主体；采用自然语言处理技术对自然语言信息进行挖掘，获得关键信息点；将语音信息、自然语言信息、声音主体、时间信息和关键信息点结构化形式存储在数据库中，实现对车内语音信息进行关键且精准的提取，辅助用户进行日常工作生活的有效记录管理，结构化信息有助于提升车载语音系统的独特性与智能性，使数据资源得到有效的利用，提升车载语音系统的智能性。

在一个实施例中，该车载语音信息管理方法还包括：根据获取到的主题分析条件，从数据库中提取对应的待分析自然语言信息；通过lasertagger算法对待分析自然语言信息进行抽取式摘要提取，获得文本摘要；将主题分析条件、文本摘要与待分析自然语言信息存储至数据库中。

其中，主题分析条件包括以下任意一种以上：主题分析的时间；主题分析的时间和声音主体，如：主题分析条件为主题分析的时间时，则根据该时间，从数据库中提取出该时间内的自然语言信息作为待分析自然语言信息；如：主题分析条件为主题分析的时间和声音主体时，则从数据库中提取出该声音主体在该时间内所说的自然语言信息作为待分析自然语言信息。lasertagger算法是基于文本编辑的生成算法。将主题分析条件、文本摘要与待分析自然语言信息存储至数据库中，并将主题分析条件与文本摘要与待分析自然语言信息关联，当通过该主题分析条件进行索引时，获得对应的文本摘要与待分析自然语言信息。

在一个实施例中，该车载语音信息管理方法还包括：通过语言模型将待分析自然语言信息进行转化，获得向量特征；基于密度聚类算法对向量特征进行无监督聚类，获得聚类结果；将主题分析条件、聚类结果与主题分析条件进行关联存储至数据库中。

其中，将主题分析条件与聚类结果存储至数据库中，当通过该主题分析条件进行索引时，获得对应的聚类结果。

在一个实施例中，该车载语音信息管理方法还包括：对聚类结果的各类簇中的待分析自然语言信息进行关键词数量分析，确定各类簇中的关键词数量；对各类簇中摘要包含的语句条数进行分析，确定各类簇中摘要包含的语句条数；根据关键词数量和摘要包含的语句条数，对各类簇进行排序，获得各类簇的排序结果；根据各类簇的排序结果对各类簇进行重要性标记。

在一个实施例中，对聚类结果的各类簇中的待分析自然语言信息进行关键词数量分析，确定各类簇中的关键词数量的步骤，包括：对聚类结果的各类簇中的待分析自然语言信息进行关键词分析，获得各类簇的关键词结果；根据各类簇的关键词结果进数量分析，获得各类簇中的关键词数量。

应该理解的是，虽然图2的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图3所示，提供了一种车载语音信息管理装置，包括：语音信息获取模块310、转化模块320、声纹识别模块330、信息挖掘模块340和存储模块350。

语音信息获取模块310，用于获取车辆内部的语音接收器采集的语音信息。

转化模块320，用于采用语音识别技术将语音信息转化为自然语言信息。

声纹识别模块330，用于采用声纹识别技术对语音信息进行声纹识别，确定语音信息中的声音主体。

信息挖掘模块340，用于采用自然语言处理技术对自然语言信息进行挖掘，获得关键信息点。

存储模块350，用于将语音信息、自然语言信息、声音主体、时间信息和关键信息点结构化形式存储在数据库中。

在一个实施例中，该车载语音信息管理装置还包括文本摘要模块，用于根据获取到的主题分析条件，从数据库中提取对应的待分析自然语言信息；通过lasertagger算法对待分析自然语言信息进行抽取式摘要提取，获得文本摘要；将主题分析条件、文本摘要与待分析自然语言信息存储至数据库中。

在一个实施例中，该车载语音信息管理装置还包括聚类模块，用于通过语言模型将待分析自然语言信息进行转化，获得向量特征；基于密度聚类算法对向量特征进行无监督聚类，获得聚类结果；将聚类结果与主题分析条件存储至数据库中。

在一个实施例中，该车载语音信息管理装置还包括排序模块，用于对聚类结果的各类簇中的待分析自然语言信息进行关键词数量分析，确定各类簇中的关键词数量；对各类簇中摘要包含的语句条数进行分析，确定各类簇中摘要包含的语句条数；根据关键词数量和摘要包含的语句条数，对各类簇进行排序，获得各类簇的排序结果；根据各类簇的排序结果对各类簇进行重要性标记。

在一个实施例中，排序模块还用于：对聚类结果的各类簇中的待分析自然语言信息进行关键词分析，获得各类簇的关键词结果；根据各类簇的关键词结果进数量分析，获得各类簇中的关键词数量。

在一个实施例中，＝主题分析条件包括以下任意一种以上：主题分析的时间；主题分析的时间和声音主体。

在一个实施例中，信息挖掘模块340还用于：采用ELECTRA+NN语言模型对自然语言信息进行自然语言意图识别，获得意图信息与情绪信息；采用ELECTRA+CRF语言模型对自然语言信息进行命名实体识别，获得命名实体信息；采用语义角色标注算法与依存句法对自然语言信息进行结构变换，获得关键词和关键短语；将意图信息、情绪信息、命名实体信息、关键词和关键短语作为关键信息点。

关于车载语音信息管理装置的具体限定可以参见上文中对于车载语音信息管理方法的限定，在此不再赘述。上述车载语音信息管理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时实现上述的车载语音信息管理方法的步骤。

在一个实施例中，提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述的车载语音信息管理方法的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成的，算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种车载语音信息管理方法，其特征在于，所述方法包括：

获取车辆内部的语音接收器采集的语音信息；

采用语音识别技术将所述语音信息转化为自然语言信息；

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

将所述聚类结果与所述主题分析条件存储至数据库中。

4.据权利要求3述的方法，其特征在于，所述方法还包括：

根据各所述类簇的排序结果对各所述类簇进行重要性标记。

5.根据权利要求4所述的方法，其特征在于，所述对所述聚类结果的各类簇中的待分析自然语言信息进行关键词数量分析，确定各所述类簇中的关键词数量的步骤，包括：

6.根据权利要求2所述的方法，其特征在于，所述主题分析条件包括以下任意一种以上：

主题分析的时间；

主题分析的时间和声音主体。

7.根据权利要求1所述的方法，其特征在于，所述采用自然语言处理技术对所述自然语言信息进行挖掘，获得关键信息点的步骤，包括：

8.一种车载语音信息管理装置，其特征在于，所述装置包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。