CN109215636A

CN109215636A - 一种语音信息的分类方法及系统

Info

Publication number: CN109215636A
Application number: CN201811326948.0A
Authority: CN
Inventors: 魏誉荧
Original assignee: Guangdong Genius Technology Co Ltd
Current assignee: Guangdong Genius Technology Co Ltd
Priority date: 2018-11-08
Filing date: 2018-11-08
Publication date: 2019-01-15
Anticipated expiration: 2038-11-08
Also published as: CN109215636B

Abstract

本发明属于语音处理技术领域，公开了一种语音信息的分类方法及系统，其方法包括：建立包含多个语义槽序列的语义槽序列库，每个所述语义槽序列分别对应一个分组；获取待分类语音信息；对所述待分类语音信息进行处理，得到所述待分类语音信息对应的待分类语义槽序列；当所述语义槽序列库中包含与所述待分类语义槽序列匹配的语义槽序列时，将所述待分类语音信息划分到所述匹配的语义槽序列的分组中。本发明通过匹配的语义槽序列对待分类语音信息进行分类，通过语义槽序列对语音信息进行分类，可将意图相同的语音信息划分到同一类，不仅不会因主观原因影响分类的准确性，而且相比人工分类，速率较高。

Description

一种语音信息的分类方法及系统

技术领域

本发明属于语音处理技术领域，特别涉及一种语音信息的分类方法及系统。

背景技术

随着智能终端及网络技术的迅速发展，人们越来越习惯地使用智能终端完成各种需求。同时随着语音交互的互联网技术的逐渐兴起，语音交互技术已经被广泛地应用于各种智能终端产品中。

在一些智能终端产品中，当接收到大量有用的语音信息后，经常需要对这些大量的语音信息进行存储，并进行分类处理，以便用户后续能快速准确地查找到所需的语音信息。目前，对语音信息的分类还是依靠人工进行，即依靠用户对每一个有用的语音信息进行分类，此种方式不仅工作效率较低，而且分类准确率不高。

发明内容

本发明的目的是提供一种语音信息的分类方法及系统，实现对语音信息进行快速准确的分类的目的。

本发明提供的技术方案如下：

一方面，提供一种语音信息的分类方法，包括：

建立包含多个语义槽序列的语义槽序列库，每个所述语义槽序列分别对应一个分组；

获取待分类语音信息；

对所述待分类语音信息进行处理，得到所述待分类语音信息对应的待分类语义槽序列；

当所述语义槽序列库中包含与所述待分类语义槽序列匹配的语义槽序列时，将所述待分类语音信息划分到所述匹配的语义槽序列的分组中。

优选地，所述对所述待分类语音信息进行处理，得到所述待分类语音信息对应的待分类语义槽序列之后还包括：

当所述语义槽序列库中不包含与所述待分类语义槽序列匹配的语义槽序列时，则将所述待分类语义槽序列存储在所述语义槽序列库中，并以所述待分类语义槽序列为标签建立所述待分类语义槽序列的分组。

优选地，所述对所述待分类语音信息进行处理，得到所述待分类语音信息对应的待分类语义槽序列具体包括：

建立音频库，所述音频库包括若干词语的音频及音频对应的语义；

将所述待分类语音信息与所述音频库中的音频进行匹配，找出与所述待分类语音信息中的各个词语分别匹配的音频作为目标音频；

根据所述目标音频的语义，生成目标音频对应的语义槽；

将所述语义槽按照所述目标音频在所述待分类语音信息中的顺序生成语义槽序列。

优选地，所述根据所述目标音频的语义，生成目标音频对应的语义槽具体包括：

根据所述目标音频的语义，将语义相同或相近的目标音频合并生成一个语义槽；

将其余的目标音频分别生成各自对应的语义槽。

优选地，所述建立音频库，所述音频库包括若干词语各自对应的音频及音频对应的语义具体包括：

收集大量语料信息，对所述语料信息进行分词处理，得到所述语料信息中包含的词语；

获取所述词语对应的音频和对应的语义，并建立所述音频与所述语义之间的关系；

根据所述词语对应的音频和音频对应的语义，建立所述音频库。

另一方面，还提供一种语音信息的分类系统，包括：

语义槽序列库建立模块，用于建立包含多个语义槽序列的语义槽序列库，每个所述语义槽序列分别对应一个分组；

语音信息获取模块，用于获取待分类语音信息；

待分类语义槽序列生成模块，用于对所述待分类语音信息进行处理，得到所述待分类语音信息对应的待分类语义槽序列；

语音信息分类模块，用于当所述语义槽序列库中包含与所述待分类语义槽序列匹配的语义槽序列时，将所述待分类语音信息划分到所述匹配的语义槽序列的分组中。

优选地，还包括：

分组建立模块，用于当所述语义槽序列库中不包含与所述待分类语义槽序列匹配的语义槽序列时，则将所述待分类语义槽序列存储在所述语义槽序列库中，并以所述待分类语义槽序列为标签建立所述待分类语义槽序列的分组。

优选地，所述待分类语义槽序列生成模块包括：

音频库建立单元，用于建立音频库，所述音频库包括若干词语的音频及音频对应的语义；

目标音频查找单元，用于将所述待分类语音信息与所述音频库中的音频进行匹配，找出与所述待分类语音信息中的各个词语分别匹配的音频作为目标音频；

语义槽生成单元，用于根据所述目标音频的语义，生成目标音频对应的语义槽；

语义槽序列生成单元，用于将所述语义槽按照所述目标音频在所述待分类语音信息中的顺序生成语义槽序列。

优选地，所述语义槽生成单元还用于根据所述目标音频的语义，将语义相同或相近的目标音频合并生成一个语义槽，将其余的目标音频分别生成各自对应的语义槽。

优选地，所述音频库建立单元包括：

词语获取子单元，用于收集大量语料信息，对所述语料信息进行分词处理，得到所述语料信息中包含的词语；

音频及语义获取子单元，用于获取所述词语对应的音频和对应的语义，并建立所述音频与所述语义之间的关系；

音频库建立子单元，用于根据所述词语对应的音频和音频对应的语义，建立所述音频库。

与现有技术相比，本发明提供的一种语音信息的分类方法及系统具有以下有益效果：

1、本发明先建立语义槽序列库，然后将待分类语音信息转换为对应的待分类语义槽序列，最后通过将待分类语义槽序列与语义槽序列库中的语义槽序列进行匹配，找到匹配的语义槽序列，并根据匹配的语义槽序列对待分类语音信息进行分类，通过语义槽序列对语音信息进行分类，可将意图相同的语音信息划分到同一类，不仅不会因主观原因影响分类的准确性，而且相比人工分类，速率较高。

2、在一优选实施例中，通过建立新的分组，可以不断完善语义槽序列库，以便对所有的语音内容进行分类存储。

3、在一优选实施例中，通过将语义相同或相近的音频合并生成一个语义槽，可简化语义槽序列，便于在语义槽序列库中查找匹配的语义槽序列，提高查找效率。

附图说明

下面将以明确易懂的方式，结合附图说明优选实施方式，对一种语音信息的分类方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。

图1是本发明一种语音信息的分类方法的第一实施例的流程示意图；

图2是本发明一种语音信息的分类方法的第二实施例的流程示意图；

图3是本发明一种语音信息的分类方法的第三实施例的流程示意图一；

图4是本发明一种语音信息的分类方法的第三实施例的流程示意图二；

图5是本发明一种语音信息的分类方法的第四实施例的流程示意图；

图6是本发明一种语音信息的分类方法的第五实施例的流程示意图；

图7是本发明一种语音信息的分类系统的一个实施例的结构示意框图；

图8是本发明一种语音信息的分类系统的另一个实施例的结构示意框图。

附图标号说明

100、语义槽序列库建立模块； 200、语音信息获取模块；

300、待分类语义槽序列生成模块； 310、音频库建立单元；

311、词语获取子单元； 312、音频及语义获取子单元；

313、音频库建立子单元； 320、目标音频查找单元；

330、语义槽生成单元； 340、语义槽序列生成单元；

400、语音信息分类模块； 500、分组建立模块。

具体实施方式

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对照附图说明本发明的具体实施方式。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，并获得其他的实施方式。

为使图面简洁，各图中只示意性地表示出了与本发明相关的部分，它们并不代表其作为产品的实际结构。另外，以使图面简洁便于理解，在有些图中具有相同结构或功能的部件，仅示意性地绘示了其中的一个，或仅标出了其中的一个。在本文中，“一个”不仅表示“仅此一个”，也可以表示“多于一个”的情形。

根据本发明提供的第一实施例，如图1所示，一种语音信息的分类方法，包括：

S100建立包含多个语义槽序列的语义槽序列库，每个所述语义槽序列分别对应一个分组；

具体地，语义槽是指包括具有相似语义的词语等的集合。如“春天”语义槽中包括“春天、春季、早春、晚春、阳春”等；查询语义槽包括“查询、查下、看下、问下、搜寻、搜索、查找、寻找”等；“时间”语义槽包括“昨天、今天、明天、去年、明年、今年、2018年”等；“城市”语义槽包括“北京、上海、广州、深圳”等；“天气”语义槽包括“天气、气候、气温、气象、天色”等。

语义槽序列是指将多个语义槽按一定的顺序排列，如将查询语义槽、城市语义槽、时间语义槽和天气语义槽按一定顺序排列后得到的语义槽序列为{查询}{城市}{时间}{天气}。

建立一个包含多个不同语义槽序列的语义槽序列库，每个语义槽序列对应一个分组，即以每个语义槽序列为标签分别建立一个分组。语义槽序列库中的语义槽序列可通过机器学习得到，也可通过人工得到。

S200获取待分类语音信息；

具体地，待分类语音信息可以是用户实时输入的语音，例如用户与智能产品进行语音交互时输入的信息。待分类语音信息还可以是从网上下载下来的音频或事先录制好的音频。

S300对所述待分类语音信息进行处理，得到所述待分类语音信息对应的待分类语义槽序列；

具体地，获取到待分类语音信息后，对待分类语音信息进行处理，得到待分类语音信息对应的待分类语义槽序列。

对待分类语音信息的处理，可以是先将待分类语音信息识别为文本信息，然后对识别后的文本信息进行分词，得到多个词语，然后根据词语的语义生成待分类语音信息对应的待分类语义槽序列。

对待分类语音信息的处理，还可以是直接对待分类语音信息的音频进行分词，得到多个音频片段，然后根据音频片段的语义生成待分类语音信息对应的待分类语义槽序列。

S400当所述语义槽序列库中包含与所述待分类语义槽序列匹配的语义槽序列时，将所述待分类语音信息划分到所述匹配的语义槽序列的分组中。

具体地，得到待分类语音信息对应的待分类语义槽序列后，将待分类语义槽与语义槽序列库中的语义槽序列进行匹配，找到匹配的语义槽序列，然后将待分类语音信息划分到匹配的语义槽序列对应的分组中，以对待分类语音信息进行分类。

当在语义槽序列库未找到与待分类语义槽序列匹配的语义槽序列时，可将该待分类语音信息保存在待分类分组中，待分类分组中存储全部未找到对应分组的语音信息。当然除了将待分类语音信息存储在待分类分组中，还可以对待分类语音信息进行其他处理。

本发明先建立语义槽序列库，然后将待分类语音信息转换为对应的待分类语义槽序列，最后通过将待分类语义槽序列与语义槽序列库中的语义槽序列进行匹配，找到匹配的语义槽序列，并根据匹配的语义槽序列对待分类语音信息进行分类，通过语义槽序列对语音信息进行分类，可将意图相同的语音信息划分到同一类，不仅不会因主观原因影响分类的准确性，而且相比人工分类，速率较高。

根据本发明提供的第二实施例，如图2所示，一种语音信息的分类方法，包括：

S200获取待分类语音信息；

S400当所述语义槽序列库中包含与所述待分类语义槽序列匹配的语义槽序列时，将所述待分类语音信息划分到所述匹配的语义槽序列的分组中；

S500当所述语义槽序列库中不包含与所述待分类语义槽序列匹配的语义槽序列时，则将所述待分类语义槽序列存储在所述语义槽序列库中，并以所述待分类语义槽序列为标签建立所述待分类语义槽序列的分组。

具体地，当将待分类语义槽序列与语义槽序列库中的语义槽序列进行匹配，未找到匹配的语义槽序列时，可将该待分类语义槽序列存储在语义槽序列库中，并以该待分类语义槽序列为标签建立一个新的分组，以便下次获取到相类似的语音信息时，将该语音信息划分到该新建立的分组中，通过不断完善分组的建立，可对语音信息进行更好的分类。

本实施例中，通过建立新的分组，可以不断完善语义槽序列库，以便对所有的语音内容进行分类存储。

根据本发明提供的第三实施例，如图3所示，一种语音信息的分类方法，包括：

S200获取待分类语音信息；

S310建立音频库，所述音频库包括若干词语的音频及音频对应的语义；

具体地，建立一个包含若干词语的音频的音频库，词语可通过网络获取，如获取百科里面的大量词语，然后获取这些大量词语的音频，由于不同地方的人口音不同，因此一个词语可对应多个音频，并尽可能地搜集同一词语不同地方的音频，使得建立的音频库尽量完整。在音频库中，同一词语对应的多个音频都对应同一个语义。

S320将所述待分类语音信息与所述音频库中的音频进行匹配，找出与所述待分类语音信息中的各个词语分别匹配的音频作为目标音频；

具体地，将待分类语音信息与音频库中的音频进行匹配，待分类语音信息一般是由多个字词组成，当音频库中的某一个音频与待分类语音信息中的某一段音频匹配时，则将音频库中的该音频作为目标音频，通过此种方式，找出待分类语音信息中各个词语(各段音频)的目标音频，目标音频分别对应待分类语音信息中的一个片段。

S330根据所述目标音频的语义，生成目标音频对应的语义槽；

具体地，得到待分类语音信息中各个片段对应的目标音频后，根据该目标音频的语义，生成目标音频对应的语义槽。

例如，目标音频为“北京”对应的音频，该目标音频对应的语义就是北京，根据北京，可得到北京对应的语义槽为“城市”。

S340将所述语义槽按照所述目标音频在所述待分类语音信息中的顺序生成语义槽序列；

具体地，得到目标音频对应的语义槽后，将语义槽按照目标音频在待分类语音信息中的顺序生成语义槽序列。

例如，待分类语音信息为“查询明天北京的天气”，将该待分类语音信息与音频库中的音频进行匹配后，得到的目标音频分别为“查询”、“明天”、“北京”、“天气”。这些目标音频对应的语义槽分别为{查询}、{时间}、{地点}、{天气}，根据目标音频在待分类语音信息中的顺序生成的语义槽序列为{查询}{时间}{城市}{天气}。

如图4所示，优选地，S340将所述语义槽按照所述目标音频在所述待分类语音信息中的顺序生成语义槽序列之后还包括：

根据本发明提供的第四实施例，如图5所示，一种语音信息的分类方法，包括：

S200获取待分类语音信息；

S331根据所述目标音频的语义，将语义相同或相近的目标音频合并生成一个语义槽；

具体地，当目标音频中有语义相同或相近的目标音频时，将语义相同或相近的目标音频合并生成一个语义槽。例如两个目标音频的语义分别为北京和上海，则将北京和上海生成一个语义槽{城市}。

S332将其余的目标音频分别生成各自对应的语义槽；

具体地，将语义相同或相近的目标音频合并生成一个语义槽后，将剩余的目标音频分别生成各自对应的语义槽。

例如，待分类语音信息为“查询明天和后天北京和上海的天气”，将该待分类语音信息与音频库中的音频进行匹配后，得到的目标音频分别为“查询”、“明天”、“后天”、“北京”、“上海”、“天气”。

将语义相近的目标音频“明天”和“后天”合并生成一个语义槽{时间}，将语义相近的目标音频“北京”和“上海”合并生成一个语义槽{城市}，剩余的目标音频“查询”生成的语义槽为{查询}，“天气”生成的语义槽为{天气}。根据目标音频在待分类语音信息中的顺序将上述语义槽排序生成的语义槽序列为{查询}{时间}{城市}{天气}。

通过将语义相同或相近的音频合并生成一个语义槽，可简化语义槽序列，便于在语义槽序列库中查找匹配的语义槽序列，提高查找效率。

根据本发明提供的第五实施例，如图6所示，一种语音信息的分类方法，包括：

S200获取待分类语音信息；

S311收集大量语料信息，对所述语料信息进行分词处理，得到所述语料信息中包含的词语；

具体地，音频库中的音频对应的词语可以是通过百科等获取，还可以是通过获取大量语料信息，如在论文库中获取的文章等，然后对语料信息进行分词处理，得到语音信息中包含的词语。

S312获取所述词语对应的音频和对应的语义，并建立所述音频与所述语义之间的关系；

具体地，得到大量词语后，然后获取这些词语的音频及对应的语义，同一词语可对应多个音频，然后建立音频与语义之间的关系；同一词语对应的多个音频仅对应一个语义。

S313根据所述词语对应的音频和音频对应的语义，建立所述音频库；

具体地，得到大量词语的音频及对应的语义后，将该大量的音频建立成音频库，且音频库中的音频具有对应的语义。

S330根据所述目标音频的语义，生成目标音频对应的语义槽；

根据本发明提供的第六实施例，如图7所示，一种语音信息的分类系统，包括：

语义槽序列库建立模块100，用于建立包含多个语义槽序列的语义槽序列库，每个所述语义槽序列分别对应一个分组；

语音信息获取模块200，用于获取待分类语音信息；

待分类语义槽序列生成模块300，用于对所述待分类语音信息进行处理，得到所述待分类语音信息对应的待分类语义槽序列；

语音信息分类模块400，用于当所述语义槽序列库中包含与所述待分类语义槽序列匹配的语义槽序列时，将所述待分类语音信息划分到所述匹配的语义槽序列的分组中。

根据本发明提供的第七实施例，如图8所示，一种语音信息的分类系统，包括：

语音信息获取模块200，用于获取待分类语音信息；

优选地，还包括：

分组建立模块500，用于当所述语义槽序列库中不包含与所述待分类语义槽序列匹配的语义槽序列时，则将所述待分类语义槽序列存储在所述语义槽序列库中，并以所述待分类语义槽序列为标签建立所述待分类语义槽序列的分组。

通过建立新的分组，可以不断完善语义槽序列库，以便对所有的语音内容进行分类存储。

优选地，待分类语义槽序列生成模块300包括：

音频库建立单元310，用于建立音频库，所述音频库包括若干词语的音频及音频对应的语义；

目标音频查找单元320，用于将所述待分类语音信息与所述音频库中的音频进行匹配，找出与所述待分类语音信息中的各个词语分别匹配的音频作为目标音频；

语义槽生成单元330，用于根据所述目标音频的语义，生成目标音频对应的语义槽；

语义槽序列生成单元340，用于将所述语义槽按照所述目标音频在所述待分类语音信息中的顺序生成语义槽序列。

优选地，所述语义槽生成单元330还用于根据所述目标音频的语义，将语义相同或相近的目标音频合并生成一个语义槽，将其余的目标音频分别生成各自对应的语义槽。

具体地，具体地，当目标音频中有语义相同或相近的目标音频时，将语义相同或相近的目标音频合并生成一个语义槽。例如两个目标音频的语义分别为北京和上海，则将北京和上海生成一个语义槽{城市}。

将语义相同或相近的目标音频合并生成一个语义槽后，将剩余的目标音频分别生成各自对应的语义槽。

优选地，所述音频库建立单元310包括：

词语获取子单元311，用于收集大量语料信息，对所述语料信息进行分词处理，得到所述语料信息中包含的词语；

音频及语义获取子单元312，用于获取所述词语对应的音频和对应的语义，并建立所述音频与所述语义之间的关系；

音频库建立子单元313，用于根据所述词语对应的音频和音频对应的语义，建立所述音频库。

具体地，得到大量词语的音频及对应的语义后，将该大量的音频建立成音频库，且音频库中的音频分别具有对应的语义。

应当说明的是，上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种语音信息的分类方法，其特征在于，包括：

获取待分类语音信息；

2.根据权利要求1所述的一种语音信息的分类方法，其特征在于，所述对所述待分类语音信息进行处理，得到所述待分类语音信息对应的待分类语义槽序列之后还包括：

3.根据权利要求1或2所述的一种语音信息的分类方法，其特征在于，所述对所述待分类语音信息进行处理，得到所述待分类语音信息对应的待分类语义槽序列具体包括：

根据所述目标音频的语义，生成目标音频对应的语义槽；

4.根据权利要求3所述的一种语音信息的分类方法，其特征在于，所述根据所述目标音频的语义，生成目标音频对应的语义槽具体包括：

将其余的目标音频分别生成各自对应的语义槽。

5.根据权利要求3所述的一种语音信息的分类方法，其特征在于，所述建立音频库，所述音频库包括若干词语各自对应的音频及音频对应的语义具体包括：

6.一种语音信息的分类系统，其特征在于，包括：

语音信息获取模块，用于获取待分类语音信息；

7.根据权利要求6所述的一种语音信息的分类系统，其特征在于，还包括：

8.根据权利要求6或7所述的一种语音信息的分类系统，其特征在于，所述待分类语义槽序列生成模块包括：

9.根据权利要求8所述的一种语音信息的分类系统，其特征在于，

所述语义槽生成单元还用于根据所述目标音频的语义，将语义相同或相近的目标音频合并生成一个语义槽，将其余的目标音频分别生成各自对应的语义槽。

10.根据权利要求8所述的一种语音信息的分类系统，其特征在于，所述音频库建立单元包括：