具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有技术语音识别速度慢的问题,本发明实施例提供一种语音识别方法和装置。
实施例一:
如图1所示,本发明实施例提供的语音识别方法,包括:
步骤101,获取用户输入的语音信息对应的文字信息。
为了使本发明实施例提供的语音识别方法适用范围更广,能够识别出不同地域、不同口音的用户语音信息,在本实施例中,步骤101可以采用非特定人语音识别技术对用户输入的语音信息进行识别、解析,获取该语音信息对应的文字信息。
步骤102,采用预设的目标信息数据库和负载库对文字信息进行分词处理,获取目标信息数据库对应的目标信息。
在本实施例中,步骤102中预设的目标信息数据库用于存储待进行语音识别的信息,可以包括:地理位置信息、歌曲名称信息或天气信息;该目标信息数据库还可以存储待进行语音识别的其他信息,在此不再一一赘述。该目标信息数据库可以用于存储广义范围的目标信息,为了减小冗余量,节省存储空间,提高语音识别的速度,本发明实施例可以优选的将目标信息数据库设置为存储具体应用领域的相应的目标信息;例如:如果本发明实施例提供的语音识别方法应用在导航领域中,目标信息数据库具体用于存储地理位置信息或目的地名称信息;如果本发明实施例提供的语音识别方法应用在影音娱乐领域中,目标信息数据库具体用于存储视频名称信息或歌曲名称信息;如果本发明实施例提供的语音识别方法应用在资讯领域中,目标信息数据库具体用于存储资讯名称信息。
在本实施例中,步骤102中负载库用于存储除具有实质含义的词语外的信息。具体的,可以采用统计的方法预先设置负载库,该负载库中可以包括人们日常使用的口语词,例如:“我想去”、“请问”、“怎么”、“我想要”、“可不可以”等等,此处不再对负载库中包含的除具有实质含义的词语外的信息进行一一赘述。
在本实施例中,步骤102采用预设的目标信息数据库和负载库对文字信息进行分词处理,具体可以将步骤101获取的文字信息与目标信息数据库和负载库中包含的信息进行匹配;获取与目标信息数据库中的信息完全匹配的匹配信息;将匹配信息从文字信息中分割出来,得到目标信息数据库对应的目标信息。还可以通过其他方式对文字信息进行分词处理,在此不再一一赘述。
步骤103,根据该目标信息确定语音信息的内容。
可选的,为了使本发明实施例提供的语音识别方法可以适用于多个领域如导航、影音娱乐领域等,可以将目标信息数据库和负载库设置为广义范围;优选的,为了提高语音识别的速度,可以将目标信息数据库设置和负载库设置为具体领域,并在进行语音识别之前,首先根据用户指示确定语音识别的应用领域,根据该领域对应的目标信息数据库和负载库进行语音识别。
本发明实施例提供的语音识别方法,采用目标信息数据库和负载库对文字信息进行分词,获取目标信息数据库对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的根据目标信息数据库确定对应的目标信息,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。
实施例二:
如图2所示,本发明实施例提供的语音识别方法,包括:
步骤201,获取用户输入的语音信息对应的文字信息;具体信息与图1所示的步骤101相似,在此不再一一赘述。
步骤202,将文字信息中分别与目标信息数据库和负载库中包含的信息进行匹配。
在本实施例中,步骤202可以将文字信息中的字按照先后顺序分别与目标信息数据库和负载库中包含的信息进行匹配;也可以将文字信息中的字按照从后往前的顺序分别与目标信息数据库和负载库中包含的信息进行匹配;还可以通过其他方式分别与目标信息数据库和负载库中的信息进行匹配,在此不再一一赘述。可选的,为了缩小匹配范围、提高匹配速度,步骤202还可以包括:将文字信息中的字按照出现顺序分别与目标信息数据库和负载库中包含的信息进行匹配;如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合;将文字信息中第一匹配信息后的字按照出现顺序与关联信息集合中的信息进行匹配。其中,句式库用于存储由负载库中的信息组成的句式。
在本实施例中,根据预设句式库获取第一匹配信息的关联信息集合的具体过程可以包括:根据第一匹配信息查找句式库,从该句式库中获取第一匹配信息对应的句式集合;根据该句式集合获取相应的关联信息集合。还可以通过其他方式根据预设的句式库获取第一匹配信息的关联信息集合,在此不再一一赘述。
在本实施例中,句式库中存储的句式可以是广义范围的句式,具体的,可以从日常生活和工作中能够接触到的信息中获取句式并形成句式库,例如:可以从每天的新闻报道的信息中提取句式,形成句式库。由于语音识别技术一般是在特定领域中使用的,例如:应用在导航、影音娱乐等领域,为了减小冗余量,节省存储空间,提高语音识别的速度,本发明实施例可以优选的将句式库中存储的句式设置为狭义范围的句式,例如:如果本发明提供的语音识别方法应用在导航领域中,句式库可以具体用于存储导航相关的句式,并且负载库用于存储句式库中的信息。句式库不限于上述设置方式,本领域技术人员公知的是,对于该语音识别技术所应用的每个行业领域,所属行业的技术人员均可以根据其行业特点进行合理设置其句式。
在本实施例中,步骤202中预设的目标信息数据库用于存储待进行语音识别的信息,可以包括:地理位置信息、歌曲名称信息或天气信息;该目标信息数据库还可以存储待进行语音识别的其他信息,在此不再一一赘述。该目标信息数据库可以用于存储广义范围的目标信息,为了减小冗余量,节省存储空间,提高语音识别的速度,本发明实施例可以优选的将目标信息数据库设置为存储具体应用领域的相应的目标信息;例如:如果本发明实施例提供的语音识别方法应用在导航领域中,目标信息数据库具体用于存储地理位置信息或目的地名称信息;如果本发明实施例提供的语音识别方法应用在影音娱乐领域中,目标信息数据库具体用于存储视频名称信息或歌曲名称信息;如果本发明实施例提供的语音识别方法应用在资讯领域中,目标信息数据库具体用于存储资讯名称信息。
在本实施例中,步骤202中负载库用于存储除具有实质含义的词语外的信息。可以采用统计的方法预先设置负载库,该负载库中可以包括人们日常使用的口语词,例如:“我想去”、“请问”、“怎么”、“我想要”、“可不可以”等等,此处不对负载库中包含的除具有实质含义的词语外的信息进行一一赘述。
特别的,步骤202可以包括:获取目标信息数据库和负载库中包含的信息的使用频率;根据该使用频率将目标信息数据库和负载库中包含的信息进行排列;将文字信息分别与排列后的信息依次进行匹配。通过上述过程将分词处理过程与用户使用频率联系起来,可以增加识别结果和用户意图之间的对应概率。
步骤203,获取与目标信息数据库中的信息完全匹配的匹配信息。
在本实施例中,通过步骤203获取的匹配信息,可以为一个,也可以为多个,在此不作限制。
步骤204,将匹配信息从文字信息中分割出来,得到目标信息数据库对应的目标信息。
步骤205,根据目标信息确定语音信息的内容;与图1所示的步骤103相似,再次不再一一赘述。
在本实施例中,通过句式库首先确定关联信息集合后再进行匹配,可以使匹配信息后的字无需对整个负载库和目标信息数据库进行匹配,从而缩小匹配范围,提高匹配速度和准确率。
在本实施例中,通过句式库确定关联信息集合并匹配后,可以直接获取对应的目标信息后,根据该目标信息确定语音信息的内容;为了更准确的确定语音信息的内容,也可以在获取对应的目标信息后,根据该目标信息和相应的句式确定语音信息的内容。
可选的,为了使本发明实施例提供的语音识别方法可以适用于多个领域如导航、影音娱乐领域等,可以将目标信息数据库和负载库设置为广义范围;优选的,为了提高语音识别的速度,可以将目标信息数据库设置和负载库设置为具体领域,并在进行语音识别之前,首先根据用户指示确定语音识别的应用领域,根据该领域对应的目标信息数据库和负载库进行语音识别。
本发明实施例提供的语音识别方法,采用目标信息数据库和负载库对文字信息进行分词,获取目标信息数据库对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的根据目标信息数据库确定对应的目标信息,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。
实施例三:
如图3所示,本发明实施例提供的语音识别方法,包括:
步骤301至步骤302,获取语音信息对应的文字信息包含的词语,并获取对应的目标信息;具体过程与图1所示的步骤101至步骤102相似,在此不再一一赘述。
步骤303,如果获取到至少两条目标信息,获取目标信息之间的连接词语。
步骤304,根据目标信息和连接词语确定语音信息的内容。
可选的,为了使本发明实施例提供的语音识别方法可以适用于多个领域如导航、影音娱乐领域等,可以将目标信息数据库和负载库设置为广义范围;优选的,为了提高语音识别的速度,可以将目标信息数据库设置和负载库设置为具体领域,并在进行语音识别之前,首先根据用户指示确定语音识别的应用领域,根据该领域对应的目标信息数据库和负载库进行语音识别。
本发明实施例提供的语音识别方法,采用目标信息数据库和负载库对文字信息进行分词,获取目标信息数据库对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的根据目标信息数据库确定对应的目标信息,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。
实施例四:
如图4所示,本发明实施例提供的语音识别方法,包括:
步骤401,获取对应的文字信息;具体过程与图1所示的步骤101相似,在此不再一一赘述。
步骤402,采用预设的词典和负载库对文字信息进行分词处理,获取词典对应的目标词语。
在本实施例中,词典用于存储待进行语音识别的词语,该词典中存储的目标词语可以是广义范围的词语,具体地,可以从日常生活和工作能够接触到的信息中获取目标词语并形成词典,例如:可以从每天新闻报道的信息中提取词语,形成词典;词典中存储的目标词语也可以是狭义范围的词语,具体地,可以从目标信息数据库中存储的信息获取目标词语并形成词典。需要说明的是,不论是广义范围的词语还是狭义范围的词语,词典中的目标词语均是唯一的,各个目标词语之间不重复。
由于语音识别技术一般是在特定领域中使用的,例如:应用在导航、点歌或者查找联系人等领域,为了减小词典中目标词语的冗余量,节省存储空间,提高语音识别的速度,本发明实施例优选地将词典中的目标词语设置为根据目标信息数据库设置的狭义范围词语,但不限于上述设置方式,本领域技术人员公知的是,对于该识别技术所应用的每个行业领域,所属行业的技术人员均可根据其行业特点,进行合理设置其目标信息数据库。
在本实施例中,步骤402中负载库用于存储除具有实质含义的词语外的信息。可以采用统计的方法预先设置负载库,该负载库中可以包括人们日常使用的口语词,例如:“我想去”、“请问”、“怎么”、“我想要”、“可不可以”等等,此处不对负载库中包含的语音信息中除具有实质含义的词语外的信息进行一一赘述。
特别的,采用预设的词典和负载库对文字信息进行分词处理,可以为根据词典和负载库包含的信息的使用频率依次对文字信息进行分词处理,从而增加识别结果和用户意图之间的对应概率。
步骤403,根据目标词语查找目标信息数据库,从该目标信息数据库中获取与目标词语匹配度最高的目标信息。
在本实施例中,步骤403可以通过两种方法从目标信息数据库中获取与目标词语匹配度最高的目标信息,下面对这两种方法进行分别介绍:
1、权重系数判决法
在本实施例中,如果词典还用于存储目标词语中包含的词语对应的权重等级n以及权重等级范围N,n、N均为整数,N≥2,n∈[1,N],第n级的目标词语在文字信息中的重要性要比第n+1级的目标词语在文字信息中的重要性大,当然,其重要性与权重等级n的关系也可以相反,本领域技术人员可以自己根据需要定义,本实施方式按照前者进行示例,则步骤403之前,还包括根据词典获取目标词语包含的每个词语对应的权重等级的步骤。
具体地,可以预先设置词典中词语的权重等级范围N,以及每个词语的权重等级n,例如可以将词典包含的目标词语的权重等级范围设置为3,其中,权重等级为1最高,权重等级为3最低,然后按照目标词语的专有性以及广泛性设置每个目标词语的权重等级,如,目标词语是地名时,权重等级设置为3,目标词语是非地理位置的专有指代名词(如小肥羊)时,权重等级设置为1,当然,领域技术人员可根据其他设置规则对上述目标词语进行权重等级划分,此处并不对每种情况进行一一赘述。在步骤402获取词典对应的目标词语之后,根据词典获取目标词语包含的每个词语对应的权重等级。
在本实施例中,步骤403从该目标信息数据库中获取与目标词语匹配度最高的目标信息的过程可以包括:首先根据目标词语查找目标信息数据库,从目标信息数据库中获取与目标词语包含的任意一个或多个词语匹配的信息组成的信息集合;然后根据目标词语包含的每个词语对应的权重等级,对信息集合中的每条信息分别进行处理,获取每条信息的权重系数;最后从信息集合中选取权重系数最高的信息为目标信息。
2、嵌套查找法
在本实施例中,步骤403从该目标信息数据库中获取与目标词语匹配度最高的目标信息的过程可以包括:首先对获取的目标词语包含的词语进行排序;然后按照排序结果,从目标词语包含的词语中获取第一个待查找词语,从目标信息数据库中获取与第一个待查找词语匹配的信息;从目标词语包含的词语中获取第二个待查找词语,从与第一个待查找词语匹配的信息组成的信息集合中获取与第二个待查找词语匹配的信息;以此类推,从目标词语包含的词语中获取最后一个待查找词语,从与最后一个待查找词语相邻的上一个词语匹配的信息组成的信息集合中获取与最后一个待查找词语匹配的目标信息。其中,对获取的目标词语包含的词语进行排序,可以将词语按照在文字信息中出现的先后顺序进行排序,优选地,为了提高查找速度,可以先获取目标词语包含的词语中的关键词,然后将目标词语包含的词语按照关键词、后辅助词和前辅助词的顺序进行排序。
在本实施例中,预设的目标信息数据库用于存储待进行语音识别的信息,包括:地理位置信息、歌曲名称信息或天气信息;该目标信息数据库还可以存储待进行语音识别的其他信息,在此不再一一赘述。该目标信息数据库可以用于存储广义范围的目标信息,为了减小冗余量,节省存储空间,提高语音识别的速度,本发明实施例可以优选的将目标信息数据库设置为存储具体应用领域的相应的目标信息;例如:如果本发明实施例提供的语音识别方法应用在导航领域中,目标信息数据库具体用于存储地理位置信息或目的地名称信息;如果本发明实施例提供的语音识别方法应用在影音娱乐领域中,目标信息数据库具体用于存储视频名称信息或歌曲名称信息;如果本发明实施例提供的语音识别方法应用在资讯领域中,目标信息数据库具体用于存储资讯名称信息。
步骤404,根据目标信息确定语音信息的内容。
在本实施例中,步骤402获取词典对应的目标词语的过程,可以与图1所示的步骤102获取目标信息数据库对应的目标信息的过程相似,在此不再一一赘述。该过程也可以包括:将文字信息分别与词典和负载库中包含的信息进行匹配;获取与词典中的词语完全匹配的匹配信息;将匹配信息从文字信息中分割出来,得到词典对应的目标词语。为了提高语音识别的速度,将文字信息分别与词典和负载库中包含的信息进行匹配,可以包括:将文字信息中的字按照出现顺序分别与词典和负载库中包含的信息进行匹配;如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合,句式库用于存储由负载库中的信息组成的句式;将文字信息中第一匹配信息后的字按照出现顺序与关联信息集合中的信息进行匹配。还可以通过其他方式获取词典对应的目标词语,在此不再一一赘述。
在本实施例中,如果通过步骤403获取到至少两条目标信息,可以获取目标信息之间的连接词语,从而可以根据目标信息和该连接词语更准确的确定语音信息的内容。
本发明实施例提供的语音识别方法,采用词典和负载库对文字信息进行分词,获取词典对应的目标词语并获取与目标词语匹配度最高的目标信息,进而根据目标信息确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的根据句式库确定对应的目标词语,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。
实施例五:
如图5所示,本发明实施例提供的语音识别方法,该方法与图1所示的语音识别方法相似,区别在于,步骤501为,获取用户输入的语音信息对应的拼音。
相应的,步骤502具体为,采用预设的目标信息数据库和负载库对拼音进行分词处理,获取分词后的词语拼音串。
步骤503具体为,根据词语拼音串从目标数据库中获取对应的目标信息。
在本实施例中,步骤502获取分词后的词语拼音串的过程,可以与图1所示的步骤102的过程相似,在此不再一一赘述。该过程也可以包括:将拼音分别与目标信息数据库和负载库中包含的信息进行匹配;获取与目标信息数据库或负载库中的词语完全匹配的匹配拼音;将匹配拼音从拼音中分割出来,得到词语拼音串。为了提高语音识别的速度,将拼音分别与目标信息数据库和负载库中包含的信息进行匹配,可以包括:将拼音按照出现顺序分别与目标信息数据库和负载库中包含的信息进行匹配;如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合,句式库用于存储由负载库中的信息组成的句式;将拼音中第一匹配信息后的拼音串按照出现顺序与关联信息集合中的信息进行匹配。还可以通过其他方式获取分词后的词语拼音串,在此不再一一赘述。
特别的,采用预设的目标信息数据库和负载库对拼音进行分词处理,可以为根据词典和负载库包含的信息的使用频率依次对文字信息进行分词处理,从而增加识别结果和用户意图之间的对应概率。
在本实施例中,步骤503根据词语拼音串从目标数据库中获取对应的目标信息的过程可以包括:首先从词语拼音串包含的拼音中获取与目标信息数据库对应的目标拼音串;然后从目标信息数据库中查找目标拼音串对应的目标信息。步骤503还可以通过其他方式根据词语拼音串从目标信息数据库中获取对应的目标信息,在此不再一一赘述。
本发明实施例提供的语音识别方法,采用目标信息数据库和负载库对拼音进行分词,获取对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的从目标信息数据库中获取对应的目标信息,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。
实施例六:
如图6所示,本发明实施例七提供的语音识别方法,该方法与图4所示的语音识别方法相似,区别在于,步骤601为,获取用户输入的语音信息对应的拼音。
步骤602具体为,采用预设的词典和负载库对拼音进行分词处理,获取分词后的词语拼音串。
步骤603具体为,根据词语拼音串从词典中获取对应的待识别的目标词语。
在本实施例中,步骤602获取分词后的词语拼音串的过程,可以与图4所示的步骤402的过程相似,在此不再一一赘述。该过程也可以包括:将拼音分别与词库和负载库中包含的信息进行匹配;获取与词库或负载库中的词语完全匹配的匹配拼音;将匹配拼音从拼音中分割出来,得到词语拼音串。为了提高语音识别的速度,将拼音分别与词库和负载库中包含的信息进行匹配,可以包括:将拼音按照出现顺序分别与词库和负载库中包含的信息进行匹配;如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合,句式库用于存储由负载库中的信息组成的句式;将拼音中第一匹配信息后的拼音串按照出现顺序与关联信息集合中的信息进行匹配。还可以通过其他方式获取分词后的词语拼音串,在此不再一一赘述。
特别的,采用预设的词典和负载库对拼音进行分词处理,可以为根据词典和负载库包含的信息的使用频率依次对文字信息进行分词处理,从而增加识别结果和用户意图之间的对应概率。
在本实施例中,步骤603根据词语拼音串从词典中获取对应的待识别的目标词语的过程可以包括:首先从词语拼音串包含的拼音中获取与词典对应的目标拼音串;然后从词典中查找目标拼音串对应的目标词语。步骤603还可以通过其他方式根据词语拼音串从词典中获取对应的待识别的目标词语,在此不再一一赘述。
本发明实施例提供的语音识别方法,采用词典和负载库对拼音进行分词,获取对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定拼音中无实质含义的信息,从而可以更准确的确定对应的目标词语,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。
实施例七:
如图7所示,本发明实施例提供的语音识别装置,包括:
文字获取单元701,用于获取用户输入的语音信息对应的文字信息。
为了使本发明实施例提供的语音识别方法适用范围更广,能够识别出不同地域、不同口音的用户语音信息,在本实施例中,文字获取单元701可以采用非特定人语音识别技术对用户输入的语音信息进行识别、解析,获取该语音信息对应的文字信息。
分词单元702,用于采用预设的目标信息数据库和负载库对文字信息进行分词处理,获取目标信息数据库对应的目标信息;目标信息数据库用于存储待进行语音识别的信息;负载库用于存储除具有实质含义的词语外的信息。
在本实施例中,分词单元702中预设的目标信息数据库用于存储待进行语音识别的信息,可以包括:地理位置信息、歌曲名称信息或天气信息;该目标信息数据库还可以存储待进行语音识别的其他信息,在此不再一一赘述。该目标信息数据库可以用于存储广义范围的目标信息,为了减小冗余量,节省存储空间,提高语音识别的速度,本发明实施例可以优选的将目标信息数据库设置为存储具体应用领域的相应的目标信息;例如:如果本发明实施例提供的语音识别方法应用在导航领域中,目标信息数据库具体用于存储地理位置信息或目的地名称信息;如果本发明实施例提供的语音识别方法应用在影音娱乐领域中,目标信息数据库具体用于存储视频名称信息或歌曲名称信息;如果本发明实施例提供的语音识别方法应用在资讯领域中,目标信息数据库具体用于存储资讯名称信息。
在本实施例中,分词单元702中负载库用于存储除具有实质含义的词语外的信息。具体的,可以采用统计的方法预先设置负载库,该负载库中可以包括人们日常使用的口语词,例如:“我想去”、“请问”、“怎么”、“我想要”、“可不可以”等等,此处不再对负载库中包含的除具有实质含义的词语外的信息进行一一赘述。
在本实施例中,分词单元702采用预设的目标信息数据库和负载库对文字信息进行分词处理,具体可以将文字获取单元701获取的文字信息与目标信息数据库和负载库中包含的信息进行匹配;获取与目标信息数据库中的信息完全匹配的匹配信息;将匹配信息从文字信息中分割出来,得到目标信息数据库对应的目标信息。还可以通过其他方式对文字信息进行分词处理,在此不再一一赘述。
内容确定单元703,用于根据目标信息确定语音信息的内容。
进一步的,如图8所示,本实施例中分词单元702,包括:
匹配模块7021,用于将文字信息分别与目标信息数据库和负载库中包含的信息进行匹配。
在本实施例中,匹配模块7021可以将文字信息中的字按照先后顺序分别与目标信息数据库和负载库中包含的信息进行匹配;也可以将文字信息中的字按照从后往前的顺序分别与目标信息数据库和负载库中包含的信息进行匹配;还可以通过其他方式分别与目标信息数据库和负载库中的信息进行匹配,在此不再一一赘述。可选的,为了缩小匹配范围、提高匹配速度,匹配模块7021还可以包括:第一匹配子模块,用于将文字信息中的字按照出现顺序分别与目标信息数据库和负载库中包含的信息进行匹配;集合获取子模块,用于如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合,句式库用于存储由负载库中的信息组成的句式;第二匹配子模块,用于将文字信息中第一匹配信息后的字按照出现顺序与关联信息集合中的信息进行匹配。其中,句式库用于存储由负载库中的信息组成的句式。
在本实施例中,根据预设句式库获取第一匹配信息的关联信息集合的具体过程可以包括:根据第一匹配信息查找句式库,从该句式库中获取第一匹配信息对应的句式集合;根据该句式集合获取相应的关联信息集合。还可以通过其他方式根据预设的句式库获取第一匹配信息的关联信息集合,在此不再一一赘述。
在本实施例中,句式库中存储的句式可以是广义范围的句式,具体的,可以从日常生活和工作中能够接触到的信息中获取句式并形成句式库,例如:可以从每天的新闻报道的信息中提取句式,形成句式库。由于语音识别技术一般是在特定领域中使用的,例如:应用在导航、影音娱乐等领域,为了减小冗余量,节省存储空间,提高语音识别的速度,本发明实施例可以优选的将句式库中存储的句式设置为狭义范围的句式,例如:如果本发明提供的语音识别方法应用在导航领域中,句式库可以具体用于存储导航相关的句式,并且负载库用于存储句式库中的信息。句式库不限于上述设置方式,本领域技术人员公知的是,对于该语音识别技术所应用的每个行业领域,所属行业的技术人员均可以根据其行业特点进行合理设置其句式。
特别的,该匹配模块,还可以包括:频率获取子模块,用于获取目标信息数据库和负载库中包含的信息的使用频率;频率排列子模块,用于根据使用频率将目标信息数据库和负载库中包含的信息进行排列;频率匹配子模块,用于将文字信息分别与排列后的信息依次进行匹配。通过上述过程将分词处理过程与使用频率联系起来,可以增加识别结果和用户意图之间的对应概率。
匹配信息获取模块7022,用于获取与目标信息数据库中的信息完全匹配的匹配信息。
在本实施例中,通过匹配信息获取模块7022获取的匹配信息,可以为一个,也可以为多个,在此不作限制。
分割模块7023,用于将匹配信息从文字信息中分割出来,得到目标信息数据库对应的目标信息。
在本实施例中,通过句式库首先确定关联信息集合后再进行匹配,可以使匹配信息后的字无需对整个负载库和目标信息数据库进行匹配,从而缩小匹配范围,提高匹配速度和准确率。
在本实施例中,通过句式库确定关联信息集合并匹配后,可以直接获取对应的目标信息后,根据该目标信息确定语音信息的内容;为了更准确的确定语音信息的内容,也可以在获取对应的目标信息后,根据该目标信息和相应的句式确定语音信息的内容。
进一步的,如图9所示,本实施例提供的语音识别装置,还可以包括:连接词语获取单元704,用于如果获取到至少两条目标信息,获取目标信息之间的连接词语。
此时,内容确定单元703,具体用于根据目标信息和连接词语确定语音信息的内容。
可选的,为了使本发明实施例提供的语音识别装置可以适用于多个领域如导航、影音娱乐领域等,可以将目标信息数据库和负载库设置为广义范围;优选的,为了提高语音识别的速度,可以将目标信息数据库设置和负载库设置为具体领域,并在进行语音识别之前,首先根据用户指示确定语音识别的应用领域,根据该领域对应的目标信息数据库和负载库进行语音识别。
本发明实施例提供的语音识别装置,采用目标信息数据库和负载库对文字信息进行分词,获取目标信息数据库对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的根据目标信息数据库确定对应的目标信息,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。
实施例八:
如图10所示,本发明实施例提供的语音识别装置,包括:
文字获取单元1001,用于获取用户输入的语音信息对应的文字信息;该装置与图7所示的文字获取单元701相似,在此不再一一赘述。
分词单元1002,用于采用预设的词典和负载库对文字信息进行分词处理,获取所词典对应的目标词语;词典用于存储待进行语音识别的词语;负载库用于存储除具有实质含义的词语外的信息。
在本实施例中,词典用于存储待进行语音识别的词语,该词典中存储的目标词语可以是广义范围的词语,具体地,可以从日常生活和工作能够接触到的信息中获取目标词语并形成词典,例如:可以从每天新闻报道的信息中提取词语,形成词典;词典中存储的目标词语也可以是狭义范围的词语,具体地,可以从目标信息数据库中存储的信息获取目标词语并形成词典。需要说明的是,不论是广义范围的词语还是狭义范围的词语,词典中的目标词语均是唯一的,各个目标词语之间不重复。
由于语音识别技术一般是在特定领域中使用的,例如:应用在导航、点歌或者查找联系人等领域,为了减小词典中目标词语的冗余量,节省存储空间,提高语音识别的速度,本发明实施例优选地将词典中的目标词语设置为根据目标信息数据库设置的狭义范围词语,但不限于上述设置方式,本领域技术人员公知的是,对于该识别技术所应用的每个行业领域,所属行业的技术人员均可根据其行业特点,进行合理设置其目标信息数据库。
在本实施例中,分词单元1002中负载库用于存储除具有实质含义的词语外的信息。可以采用统计的方法预先设置负载库,该负载库中可以包括人们日常使用的口语词,例如:“我想去”、“请问”、“怎么”、“我想要”、“可不可以”等等,此处不对负载库中包含的语音信息中除具有实质含义的词语外的信息进行一一赘述。
特别的,采用预设的词典和负载库对文字信息进行分词处理,可以为根据词典和负载库包含的信息的使用频率依次对文字信息进行分词处理,从而增加识别结果和用户意图之间的对应概率。
目标信息获取单元1003,用于根据目标词语查找目标信息数据库,从目标信息数据库中获取与目标词语匹配度最高的目标信息,目标信息数据库用于存储待进行语音识别的信息。
在本实施例中,目标信息获取单元1003可以通过两种方法从目标信息数据库中获取与目标词语匹配度最高的目标信息,下面对这两种方法进行分别介绍:
1、权重系数判决法
在本实施例中,如果词典还用于存储目标词语中包含的词语对应的权重等级n以及权重等级范围N,n、N均为整数,N≥2,n∈[1,N],第n级的目标词语在文字信息中的重要性要比第n+1级的目标词语在文字信息中的重要性大,当然,其重要性与权重等级n的关系也可以相反,本领域技术人员可以自己根据需要定义,本实施方式按照前者进行示例,则目标信息获取单元1003之前,还包括根据词典获取目标词语包含的每个词语对应的权重等级的步骤。
具体地,可以预先设置词典中词语的权重等级范围N,以及每个词语的权重等级n,例如可以将词典包含的目标词语的权重等级范围设置为3,其中,权重等级为1最高,权重等级为3最低,然后按照目标词语的专有性以及广泛性设置每个目标词语的权重等级,如,目标词语是地名时,权重等级设置为3,目标词语是非地理位置的专有指代名词(如小肥羊)时,权重等级设置为1,当然,领域技术人员可根据其他设置规则对上述目标词语进行权重等级划分,此处并不对每种情况进行一一赘述。在分词单元1002获取词典对应的目标词语之后,,根据词典获取目标词语包含的每个词语对应的权重等级。
在本实施例中,目标信息获取单元1003从该目标信息数据库中获取与目标词语匹配度最高的目标信息的过程可以包括:首先根据目标词语查找目标信息数据库,从目标信息数据库中获取与目标词语包含的任意一个或多个词语匹配的信息组成的信息集合;然后根据目标词语包含的每个词语对应的权重等级,对信息集合中的每条信息分别进行处理,获取每条信息的权重系数;最后从信息集合中选取权重系数最高的信息为目标信息。
此时,语音识别装置,除包括上述模块外,还可以包括:权重获取模块,用于如果词典还用于存储目标词语中包含的词语对应的权重等级n以及权重等级范围N,根据词典获取目标词语包含的每个词语对应的权重等级,其中,n、N均为整数,N≥2,n∈[1,N],第n级的目标词语在文字信息中的重要性要比第n+1级的目标词语在文字信息中的重要性大;目标信息获取模块,包括:集合获取子模块,用于根据目标词语查找目标信息数据库,从目标信息数据库中获取与目标词语包含的任意一个或多个词语匹配的信息组成的信息集合;系数获取子模块,用于根据目标词语包含的每个词语对应的权重等级,对信息集合中的每条信息分别进行处理,获取每条信息的权重系数;目标信息选取子模块,用于从信息集合中选取权重系数最高的信息为目标信息。
2、嵌套查找法
在本实施例中,目标信息获取单元1003从该目标信息数据库中获取与目标词语匹配度最高的目标信息的过程可以包括:首先对获取的目标词语包含的词语进行排序;然后按照排序结果,从目标词语包含的词语中获取第一个待查找词语,从目标信息数据库中获取与第一个待查找词语匹配的信息;从目标词语包含的词语中获取第二个待查找词语,从与第一个待查找词语匹配的信息组成的信息集合中获取与第二个待查找词语匹配的信息;以此类推,从目标词语包含的词语中获取最后一个待查找词语,从与最后一个待查找词语相邻的上一个词语匹配的信息组成的信息集合中获取与最后一个待查找词语匹配的目标信息。其中,对获取的目标词语包含的词语进行排序,可以将词语按照在文字信息中出现的先后顺序进行排序,优选地,为了提高查找速度,可以先获取目标词语包含的词语中的关键词,然后将目标词语包含的词语按照关键词、后辅助词和前辅助词的顺序进行排序。
在本实施例中,预设的目标信息数据库用于存储待进行语音识别的信息,包括:地理位置信息、歌曲名称信息或天气信息;该目标信息数据库还可以存储待进行语音识别的其他信息,在此不再一一赘述。该目标信息数据库可以用于存储广义范围的目标信息,为了减小冗余量,节省存储空间,提高语音识别的速度,本发明实施例可以优选的将目标信息数据库设置为存储具体应用领域的相应的目标信息;例如:如果本发明实施例提供的语音识别方法应用在导航领域中,目标信息数据库具体用于存储地理位置信息或目的地名称信息;如果本发明实施例提供的语音识别方法应用在影音娱乐领域中,目标信息数据库具体用于存储视频名称信息或歌曲名称信息;如果本发明实施例提供的语音识别方法应用在资讯领域中,目标信息数据库具体用于存储资讯名称信息。
内容确定单元1004,用于根据目标信息确定语音信息的内容。
在本实施例中,分词单元1002获取词典对应的目标词语的过程,可以与图7所示的分词单元701获取目标信息数据库对应的目标信息的过程相似,在此不再一一赘述。该过程也可以包括:将文字信息分别与词典和负载库中包含的信息进行匹配;获取与词典中的词语完全匹配的匹配信息;将匹配信息从文字信息中分割出来,得到词典对应的目标词语。为了提高语音识别的速度,将文字信息分别与词典和负载库中包含的信息进行匹配,可以包括:将文字信息中的字按照出现顺序分别与词典和负载库中包含的信息进行匹配;如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合,句式库用于存储由负载库中的信息组成的句式;将文字信息中第一匹配信息后的字按照出现顺序与关联信息集合中的信息进行匹配。还可以通过其他方式获取词典对应的目标词语,在此不再一一赘述。
在本实施例中,如果通过目标信息获取单元1003获取到至少两条目标信息,可以获取目标信息之间的连接词语,从而可以根据目标信息和该连接词语更准确的确定语音信息的内容。
本发明实施例提供的语音识别装置,采用词典和负载库对文字信息进行分词,获取词典对应的目标词语并获取与目标词语匹配度最高的目标信息,进而根据目标信息确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的根据句式库确定对应的目标词语,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。
实施例九:
如图11所示,本发明实施例提供的语音识别装置,该装置与图7所示的语音识别装置相似,区别在于,拼音获取单元1101,用于获取用户输入的语音信息对应的拼音。
相应的,分词单元1102,用于采用预设的目标信息数据库和负载库对拼音进行分词处理,获取分词后的词语拼音串;目标信息数据库用于存储待进行语音识别的信息;负载库用于存储除具有实质含义的词语外的信息;
目标信息获取单元1103,用于根据词语拼音串从目标信息数据库中获取对应的目标信息。
内容确定单元1104,用于根据目标信息确定语音信息的内容。
在本实施例中,分词单元1102获取分词后的词语拼音串的过程,可以与图7所示的分词单元702的过程相似,在此不再一一赘述。该过程也可以包括:将拼音分别与目标信息数据库和负载库中包含的信息进行匹配;获取与目标信息数据库或负载库中的词语完全匹配的匹配拼音;将匹配拼音从拼音中分割出来,得到词语拼音串。为了提高语音识别的速度,将拼音分别与目标信息数据库和负载库中包含的信息进行匹配,可以包括:将拼音按照出现顺序分别与目标信息数据库和负载库中包含的信息进行匹配;如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合,句式库用于存储由负载库中的信息组成的句式;将拼音中第一匹配信息后的拼音串按照出现顺序与关联信息集合中的信息进行匹配。还可以通过其他方式获取分词后的词语拼音串,在此不再一一赘述。
特别的,采用预设的目标信息数据库和负载库对拼音进行分词处理,可以为根据词典和负载库包含的信息的使用频率依次对文字信息进行分词处理,从而增加识别结果和用户意图之间的对应概率。
在本实施例中,目标信息获取单元1103根据词语拼音串从目标数据库中获取对应的目标信息的过程可以包括:首先从词语拼音串包含的拼音中获取与目标信息数据库对应的目标拼音串;然后从目标信息数据库中查找目标拼音串对应的目标信息。目标信息获取单元1103还可以通过其他方式根据词语拼音串从目标信息数据库中获取对应的目标信息,在此不再一一赘述。
本发明实施例提供的语音识别装置,采用目标信息数据库和负载库对拼音进行分词,获取对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定文字信息中无实质含义的信息,从而可以更准确的从目标信息数据库中获取对应的目标信息,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。
实施例十:
如图12所示,本发明实施例提供的语音识别装置,该装置与图10所示的语音识别装置相似,区别在于,拼音获取单元1201,用于获取用户输入的语音信息对应的拼音。
分词单元1202,用于采用预设的词典和负载库对拼音进行分词处理,获取分词后的词语拼音串;词典用于存储待进行语音识别的词语;负载库用于存储除具有实质含义的词语外的信息。
目标词语获取单元1203,用于根据词语拼音串从词典中获取对应的目标词语。
目标信息获取单元1204,用于根据目标词语查找目标信息数据库,从目标信息数据库中获取与目标词语匹配度最高的目标信息;目标信息数据库用于存储待进行语音识别的信息。
内容确定单元1205,用于根据目标信息确定语音信息的内容。
在本实施例中,分词单元1202获取分词后的词语拼音串的过程,可以与图10所示的分词单元1002的过程相似,在此不再一一赘述。该过程也可以包括:将拼音分别与词库和负载库中包含的信息进行匹配;获取与词库或负载库中的词语完全匹配的匹配拼音;将匹配拼音从拼音中分割出来,得到词语拼音串。为了提高语音识别的速度,将拼音分别与词库和负载库中包含的信息进行匹配,可以包括:将拼音按照出现顺序分别与词库和负载库中包含的信息进行匹配;如果查找到完全匹配的第一匹配信息,根据预设句式库获取第一匹配信息的关联信息集合,句式库用于存储由负载库中的信息组成的句式;将拼音中第一匹配信息后的拼音串按照出现顺序与关联信息集合中的信息进行匹配。还可以通过其他方式获取分词后的词语拼音串,在此不再一一赘述。
特别的,采用预设的词典和负载库对拼音进行分词处理,可以为根据词典和负载库包含的信息的使用频率依次对文字信息进行分词处理,从而增加识别结果和用户意图之间的对应概率。
在本实施例中,目标词语获取单元1203根据词语拼音串从词典中获取对应的待识别的目标词语的过程可以包括:首先从词语拼音串包含的拼音中获取与词典对应的目标拼音串;然后从词典中查找目标拼音串对应的目标词语。目标词语获取单元1203还可以通过其他方式根据词语拼音串从词典中获取对应的待识别的目标词语,在此不再一一赘述。
本发明实施例提供的语音识别装置,采用词典和负载库对拼音进行分词,获取对应的目标信息并确定语音信息的内容;由于可以将不同事物的相同表述形式统一存储在负载库中,并通过目标信息数据库存储待进行语音识别的信息,因此无需将不同事物的所有表述形式均存储到语音识别系统的文本库中,减少了数据库的规模,便于进行查找,提高了语音识别的速度;并且由于可以通过负载库存储除具有实质含义的词语外的信息,如口语化词语等,因此可以通过负载库确定拼音中无实质含义的信息,从而可以更准确的确定对应的目标词语,进而提高语音识别的准确率。本发明实施例提供的技术方案解决了现有技术采用文本库的方式存储文本内容,文本库的规模庞大,语音识别速度慢的问题。
本发明实施例提供的语音识别方法和装置可以应用在如导航、点歌以及联系人查询等信息服务系统中。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。