CN109101475A

CN109101475A - 出行语音识别方法、系统和计算机设备

Info

Publication number: CN109101475A
Application number: CN201710469290.8A
Authority: CN
Inventors: 李秀林
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2017-06-20
Filing date: 2017-06-20
Publication date: 2018-12-28
Anticipated expiration: 2037-06-20
Also published as: CN109101475B

Abstract

本发明实施例提供了一种出行语音识别方法和系统，涉及语音识别领域，其中，出行语音识别方法包括：接收并分析语音数据，得到对应于语音数据的多个识别文本以及对应于每个识别文本的得分值；在数据库中查找与地点信息匹配的信息点，根据匹配结果确定对应于每个识别文本的第一权重；确定对应于每个识别文本的目的地信息和出发地信息，计算推荐路线的距离信息，确定距离信息对应的第二权重；根据每个识别文本的得分值、第一权重以及第二权重，确定对应于每个识别文本的子分值；输出得分最高的子分值对应的识别文本。通过本发明实施例的技术方案，通过识别文本处理语音数据，得到得分最高的语音数据对应的识别文本，优化用户的出行路径，提高了用户的出行体验。

Description

出行语音识别方法、系统和计算机设备

技术领域

本发明实施例涉及语音识别技术领域，具体而言，涉及一种出行语音识别方法、一种出行语音识别系统、一种计算机设备以及一种计算机可读存储介质。

背景技术

目前的语音识别系统，主要采用的是wfst(Weighted Finite State Transducer)方案，这个方案的优势是可以把声学模型、语言模型、发音词典等知识进行综合利用，来达到较好的识别效果，在具体应用上，往往通过收集领域的语音数据进行标注来提升声学模型，利用领域文本语料优化语言模型和发音词典，来实现某个领域的识别效果提升，例如，在出行领域，可以把信息点数据、或者将信息点数据嵌入模板句作为训练语言模型的数据，从而使得语言模型能够较好地与信息点联系起来。

但是，即使在这种情况下，因为信息点数量庞大，语音识别的效果，也还有待进一步提高，其中的一种优化方案是利用不同地区的信息点，更新语言模型，从而减少信息点之间的混淆发生概率，如何合理划分不同的区域，是否需要做区域之间的重叠，这些问题都需要详细设计才能较好地解决，即使能够较好地解决，也会涉及到多个模型之间的切换导致系统复杂度较高的问题。

因此，如何优化出行语音识别系统，进而提高出行语音识别方法的效率与准确性已经成为亟待解决的问题。

发明内容

本发明实施例旨在至少解决现有技术或相关技术中存在的技术问题之一。

为此，本发明实施例的一个目的在于提出了一种出行语音识别方法。

本发明实施例的另一个目的在于提出了一种出行语音识别系统。

本发明实施例的再一个目的在于提出了一种计算机设备。

本发明实施例的再一个目的在于提出了一种计算机可读存储介质。

为实现上述目的，根据本发明实施例的第一方面，提出了一种出行语音识别方法，包括：接收并分析语音数据，得到对应于语音数据的多个识别文本以及对应于每个识别文本的得分值；提取每个识别文本中的至少一个地点信息；在数据库中查找与每个地点信息匹配的信息点，根据匹配结果确定对应于每个识别文本的第一权重；确定对应于每个识别文本的至少一个地点信息的类别，根据类别确定每个识别文本的第二权重；根据每个识别文本的得分值、第一权重以及第二权重，确定对应于每个识别文本的子分值；获取子分值中得分最高的第一子分值，输出第一子分值对应的识别文本。

根据本发明实施例的技术方案的出行语音识别方法，通过分析语音数据，得到对应于语音数据的多个识别文本以及对应于每个识别文本的得分值，有利于系统对语音数据进行处理，以及降低了系统对语音数据的误判断概率，同时，结合与识别文本中地点信息匹配的信息点，信息点的第一权重，以及根据地点信息的类别确定的第二权重，最终根据每个识别文本的得分值、第一权重以及第二权重得出对应的子分值，通过选择得分最高的子分值对应的识别文本作为最终识别结果，提高了系统对地点信息识别的可靠性。

其中，识别文本包括主语、谓语、宾语以及状语，其中主语和状语可省略，例如：“我要去数字山谷”，或“去数字山谷”，或“我从西直门去数字山谷”。

另外，根据本发明实施例上述技术方案的出行语音识别方法，还可以具有如下附加的技术特征：

根据本发明实施例的一个技术方案，在数据库中查找与每个地点信息匹配的信息点，根据匹配结果得到对应于每个识别文本的第一权重，具体包括：若在数据库中查找到与地点信息一致的信息点，则将识别文本的第一权重设为1；若在数据库中未查找到与地点信息一致的信息点，则确定信息点与地点信息的匹配度；将匹配度不高于第一匹配阈值的地点信息对应的第一权重设为0；确定匹配度高于第一匹配阈值的地点信息，匹配度高于第一匹配阈值的地点信息对应的第一权重由匹配度大小确定，其中，匹配度与第一权重呈正比关系。

根据本发明实施例的技术方案的出行语音识别方法，通过将识别文本中的地点信息与数据库中的信息点进行匹配，在地点信息被数据库完全记录的情况下，即在数据库中能找到与地点信息完全一致的信息点，此时认为当前识别文本的第一权重为1，在数据库中找不到与当前识别文本的地点信息相同的信息点时，根据在数据库中对信息点的匹配度确定第一权重的具体数值，通过进行第一权重的判断，增强最终得出的识别结果的准确性，提高用户体验。

具体地，根据识别文本中的地点信息，将N个疑似信息点在数据库中进行检索，根据匹配程度，进行加权，例如，对于“数字山谷”这一疑似信息点，数据库中有“数字山谷”这个信息点，完全匹配，加权值就取满值1，又例如，对于“中关村大街”的疑似信息点，在数据库中，如果没有单独的“中关村大街”作为信息点，但是有“中关村大街1号”等很多相似的更详细的信息点，假设最相近的是“中关村大街1号”，可以根据匹配长度占比加权，5/7＝0.71，也可以根据情况，对这个权重进行调整，此时，每个疑似信息点的得分为f(识别得分，信息点检索加权值)，f为检索加权函数，最简单的加权是两者相乘，即识别得分乘以信息点检索加权值。

此外，还可以设置第一匹配阈值，例如，匹配度低于或为第一匹配阈值的地点信息对应的第一权重设为0，从而排除掉部分偏离很大的结果，另外，如果疑似信息点是当前用户曾经使用过的地址(即完全匹配)，或者疑似信息点与当前用户曾经使用过的地址匹配度比较高，也可以给予较高的权重。

根据本发明实施例的一个技术方案，确定对应于每个识别文本的至少一个地点信息的类别，具体包括：判断识别文本的至少一个地点信息前是否包含出发地信息；若所有地点信息前均不包含出发地信息，则确定接收语音数据的定位信息，将定位信息作为出发地；若在至少一个地点信息前包含出发地信息，则在数据库中查询与地点信息匹配的第一信息点；将第一信息点的位置确定为出发地；或若在至少一个地点信息前包含出发地信息，则在数据库中查询与地点信息的匹配值超过第二匹配阈值的多个第二信息点；分别获取每个第二信息点的位置，根据每个第二信息点的位置，确定多个第二信息点的平均位置；将平均位置确定为出发地。

根据本发明实施例的技术方案的出行语音识别方法，通过对识别文本进行是否包含出发地信息的判断，在不包含出发地信息的情况下，直接将终端定位得到的定位信息作为出发地，此外，在识别文本包含出发地信息的情况下，在数据库中对地点信息进行匹配，若能在数据库中找到完全匹配的第一信息点，则直接将该信息点(即第一信息点)的位置作为出发地，若找到多个信息点，则对匹配分数超过第二匹配阈值的第二信息点的位置进行平均处理，将处理后的平均位置作为出发地的位置，提高识别文本中出发地对应的位置的确定效率以及识别准确度。

其中，出发地信息包括但不限于文字信息，例如：从、由。

例如，如果用户的语音数据中，没有涉及到出发地，可以直接利用GPS对当前位置进行定位，将定位结果作为出发地信息。

例如，对于“我从数字山谷去西直门”这一识别文本而言，由于在“数字山谷”前出现了出发地信息“从”，因此确定“数字山谷”这一疑似信息点，同时在数据库中有“数字山谷”这个信息点，完全匹配，则将“数字山谷”作为第一信息点，并将第一信息点的位置确定为出发地。

此外，通过确定多个第二信息点的平均位置，将平均位置确定为出发地信息对应的位置，提高了确定识别文本中出发地信息对应的位置的准确性。

例如，对于“中关村大街”的疑似信息点，在数据库中，如果没有单独的“中关村大街”作为信息点，但是有“中关村大街1号”等很多相似的更详细的信息点，假设最相近的是“中关村大街1号”，可以根据匹配长度占比加权，5/7＝0.71，依次类推，多个相似的第二信息点对应的多个位置，将多个位置的平均位置确定为出发地信息对应的位置。

根据本发明实施例的一个技术方案，确定对应于每个所述识别文本的至少一个所述地点信息的类别，具体包括：判断所述识别文本的至少一个所述地点信息前是否包含目的地信息；若所有所述地点信息前均不包含所述目的地信息，则发出用于提醒用户提供补充信息的提示信息；若在至少一个所述地点信息前包含所述目的地信息，则在所述数据库中查询与所述地点信息匹配的第三信息点；将所述第三信息点的位置确定为目的地；或若在至少一个所述地点信息前包含所述目的地信息，则在所述数据库中查询与所述地点信息的匹配值超过第三匹配阈值的多个第四信息点；分别获取每个第四信息点的位置，根据每个所述第四信息点的位置，确定所述多个第四信息点的平均位置；将所述平均位置确定为目的地。

根据本发明实施例的技术方案的出行语音识别方法，通过对地点信息前进行是否包含目的地信息的判断，在不包含目的地信息的情况下，向外发出提示信息，例如，警报音或提示文字，以使用户对目的地信息进行补充，此外，在地点信息前包含目的地信息的情况下，在数据库中对地点信息进行匹配，若能在数据库中找到完全匹配的第三信息点，则直接将该第三信息点作为目的地，若找到多个信息点，则对匹配分数超过第三匹配阈值的第四信息点的位置进行平均处理，将处理后的平均位置作为目的地，从而提高识别文本中目的地的确定效率以及识别准确度。

其中，目的地信息包括但不限于文字信息，例如：去、到、往。

例如，对于“我从西直门去数字山谷”这一识别文本而言，由于在“数字山谷”前出现了目的地信息“去”，因此确定“数字山谷”这一疑似信息点，数据库中有“数字山谷”这个信息点，完全匹配，则将“数字山谷”作为第三信息点，并将第三信息点的位置确定为目的地。

此外，通过确定多个第四信息点的平均位置，将平均位置确定为目的地，提高了确定识别文本中目的地的准确性。

例如，对于“中关村大街”的疑似信息点，在数据库中，如果没有单独的“中关村大街”作为信息点，但是有“中关村大街1号”等很多相似的更详细的信息点，假设最相近的是“中关村大街1号”，可以根据匹配长度占比加权，5/7＝0.71，依次类推，多个相似的第四信息点对应的多个位置，将多个位置的平均位置确定为目的地信息对应的位置。

根据本发明实施例的一个技术方案，确定每个识别文本的第二权重具体包括：确定每个识别文本中，由出发地至目的地的距离信息；根据距离信息，确定与距离信息对应的至少一种出行方式；确定在统计时间内，每种出行方式对应于距离信息的出行次数；根据每种出行方式的出行次数以及在统计时间内统计的总次数，确定每种出行方式的使用概率，将使用概率作为第二权重。

根据本发明实施例的技术方案的出行语音识别方法，通过根据距离信息，达到对应的交通方式在出行数据中的概率，将概率作为第二权重，优化用户的出行路径，提高了用户的出行体验。

例如，步行方式或自行车方式可以考虑直线距离或者步行导航距离，汽车方式可以选择汽车导航距离，如果选择火车、飞机或者轮船等其他方式，也可以选择适当的距离计算方式。

例如，以语音叫车为例，主要使用汽车作为出行工具，则采用汽车导航距离计算方法，具体地，根据出行数据库中不同交通出行方式下的出行距离的统计分布，计算其加权概率值，利用上一步得到的距离信息，计算当前出行距离在出行数据库中使用本类型交通工具情况下的概率分布，作为加权值或者进一步变换后作为加权值，例如，以语音叫车为例，出行数据库中包含汽车出行距离分布的概率分布数据，利用疑似信息点所获得的距离，计算其概率值即可，此时，每个疑似信息点的得分可以是：g(信息点检索加权后得分，p(dist(出发地位置，目的地位置)，出行距离统计概率分布))，其中dist为距离计算函数，p为当前距离在出行数据库中的概率函数，g为距离加权函数。

根据本发明实施例的一个技术方案，还包括：将每个信息点的名称与位置进行关联，将关联结果保存至数据库中。

根据本发明实施例的技术方案的出行语音识别方法，通过将多个信息点中的每个信息点的名称与位置进行关联，将关联结果保存至数据库中，不断的扩大数据库中的数据，提高了数据库中的信息数据与语音信息的匹配度，提高了数据库的工作效率。

根据本发明实施例的第二方面的技术方案，提出了一种出行语音识别系统，包括：得分单元，用于接收并分析语音数据，得到对应于语音数据的多个识别文本以及对应于每个识别文本的得分值；提取单元，用于提取每个识别文本中的至少一个地点信息；第一权重分配单元，用于在数据库中查找与，每个地点信息匹配的信息点，根据匹配结果得到对应于每个识别文本的第一权重；第二权重分配单元，用于确定对应于每个所述识别文本的至少一个所述地点信息的类别，根据所述类别确定所述距离信息对应的第二权重；子分值单元，用于根据每个识别文本的得分值、第一权重以及第二权重，确定对应于每个识别文本的子分值；输出单元，用于获取所述子分值中得分最高的第一子分值，输出第一子分值对应的识别文本。

根据本发明实施例的技术方案的出行语音识别系统，通过分析语音数据，得到对应于语音数据的多个识别文本以及对应于每个识别文本的得分值，有利于系统对语音数据进行处理，以及降低了系统对语音数据的误判断概率，同时，结合与识别文本中地点信息匹配的信息点，信息点的第一权重，以及根据地点信息的类别确定的第二权重，最终根据每个识别文本的得分值、第一权重以及第二权重得出对应的子分值，通过选择得分最高的子分值对应的识别文本作为最终识别结果，提高了系统对地点信息识别的可靠性。

另外，根据本发明实施例上述技术方案的出行语音识别系统，还可以具有如下附加的技术特征：

根据本发明实施例的一个技术方案，第一权重分配单元具体用于：若在数据库中查找到与地点信息一致的信息点，则将识别文本的第一权重设为1；若在数据库中未查找到与地点信息一致的信息点，则确定信息点与地点信息的匹配度；将匹配度不高于第一匹配阈值的地点信息对应的第一权重设为0；确定匹配度高于第一匹配阈值的地点信息，匹配度高于第一匹配阈值的地点信息对应的第一权重由匹配度大小确定，其中，匹配度与第一权重呈正比关系。

根据本发明实施例的技术方案的出行语音识别系统，通过将识别文本中的地点信息与数据库中的信息点进行匹配，在地点信息被数据库完全记录的情况下，即在数据库中能找到与地点信息完全一致的信息点，此时认为当前识别文本的第一权重为1，在数据库中找不到与当前识别文本的地点信息相同的信息点时，根据在数据库中对信息点的匹配度确定第一权重的具体数值，通过进行第一权重的判断，增强最终得出的识别结果的准确性，提高用户体验。

根据本发明实施例的一个技术方案，第二权重分配单元具体包括：出发确定单元，用于判断识别文本的至少一个地点信息前是否包含出发地信息；出发确定单元，还用于：若所有地点信息前均不包含出发地信息，则确定接收语音数据的定位信息，将定位信息作为出发地；若在至少一个地点信息前包含出发地信息，则在数据库中查询与地点信息匹配的第一信息点；将第一信息点的位置确定为出发地；或若在至少一个地点信息前包含出发地信息，则在数据库中查询与地点信息的匹配值超过第二匹配阈值的多个第二信息点；分别获取每个第二信息点的位置，根据每个第二信息点的位置，确定多个第二信息点的平均位置；将平均位置确定为出发地。

在该技术方案中，通过对识别文本进行是否包含出发地信息的判断，在不包含出发地信息的情况下，直接将终端定位得到的定位信息作为出发地，此外，在识别文本包含出发地信息的情况下，在数据库中对地点信息进行匹配，若能在数据库中找到完全匹配的第一信息点，则直接将该信息点(即第一信息点)的位置作为出发地，若找到多个信息点，则对匹配分数超过第二匹配阈值的第二信息点的位置进行平均处理，将处理后的平均位置作为出发地的位置，提高识别文本中出发地对应的位置的确定效率以及识别准确度。

其中，出发地信息包括但不限于文字信息，例如：从、由。

本发明实施例根据本发明实施例的一个技术方案，所述第二权重分配单元，具体包括：目的确定单元，用于判断所述识别文本的至少一个所述地点信息前是否包含目的地信息；所述目的确定单元还用于：若所有所述地点信息前均不包含所述目的地信息时，则发出用于提醒用户提供补充信息的提示信息；若在至少一个所述地点信息前包含所述目的地信息，则在所述数据库中查询与所述地点信息匹配的第三信息点；将所述第三信息点的位置确定为目的地；或若在至少一个所述地点信息前包含所述目的地信息，则在所述数据库中查询与所述地点信息的匹配值超过第三匹配阈值的多个第四信息点；分别获取每个第四信息点的位置，根据每个所述第四信息点的位置，确定所述多个第四信息点的平均位置；将所述平均位置确定为目的地。

根据本发明实施例的技术方案的出行语音识别系统，通过对地点信息前进行是否包含目的地信息的判断，在不包含目的地信息的情况下，向外发出提示信息，例如，警报音或提示文字，以使用户对目的地信息进行补充，此外，在地点信息前包含目的地信息的情况下，在数据库中对地点信息进行匹配，若能在数据库中找到完全匹配的第三信息点，则直接将该第三信息点作为目的地，若找到多个信息点，则对匹配分数超过第三匹配阈值的第四信息点的位置进行平均处理，将处理后的平均位置作为目的地，从而提高识别文本中目的地的确定效率以及识别准确度。

根据本发明实施例的一个技术方案，所述第二权重分配单元具体包括：距离确定单元，用于确定每个所述识别文本中，由所述出发地至所述目的地的距离信息；概率确定单元，用于：根据所述距离信息，确定与所述距离信息对应的至少一种出行方式；确定在统计时间内，每种出行方式对应于所述距离信息的出行次数；根据每种所述出行方式的出行次数以及在所述统计时间内统计的总次数，确定每种所述出行方式的使用概率，将所述使用概率作为所述第二权重。

根据本发明实施例的技术方案的出行语音识别系统，距离确定单元先确定从出发地到目的地的距离信息，概率确定单元根据距离信息，达到对应的交通方式在出行数据中的概率，将概率作为第二权重，优化用户的出行路径，提高了用户的出行体验。

例如，步行方式或自行车方式可以考虑直线距离或者步行导航距离，

其中，汽车方式可以选择汽车导航距离，如果选择火车、飞机或者轮船等其他方式，也可以选择适当的距离计算方式。

根据本发明实施例的一个技术方案，还包括：关联单元，用于将每个信息点的名称与位置进行关联，将关联结果保存至数据库中。

根据本发明实施例的技术方案的出行语音识别系统，关联单元通过将每个信息点的名称与位置进行关联，将关联结果保存至数据库中，不断的扩大数据库中的数据，提高了数据库中的信息数据与语音信息的匹配度，提高了数据库的工作效率。

本发明实施例第三方面的技术方案提出了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时执行上述任一项的出行语音识别方法。

在该技术方案中，执行上述任一项的出行语音识别方法的计算机程序存储在存储器上，处理器执行计算机程序时，可结合与识别文本中地点信息匹配的信息点，信息点的第一权重，以及根据地点信息的类别确定的第二权重，最终根据每个识别文本的得分值、第一权重以及第二权重得出对应的子分值，通过选择得分最高的子分值对应的识别文本作为最终识别结果，提高了系统对地点信息识别的可靠性。

本发明实施例第四方面的技术方案提出了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述任一项的出行语音识别方法。

在该技术方案中，处理器实现如上所述的出行语音识别方法需要通过计算机程序，这种计算机程序需要存储在计算机可读取介质中。这种计算机可读取介质保证了计算机程序能够被处理器执行，从而结合与识别文本中地点信息匹配的信息点，信息点的第一权重，以及根据地点信息的类别确定的第二权重，最终根据每个识别文本的得分值、第一权重以及第二权重得出对应的子分值，通过选择得分最高的子分值对应的识别文本作为最终识别结果，提高了系统对地点信息识别的可靠性。

本发明实施例的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明实施例的实践了解到。

附图说明

本发明实施例的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1示出了根据本发明实施例的一个实施例的出行语音识别方法的示意流程图；

图2示出了根据本发明实施例的一个实施例的出行语音识别方法的示意流程图；

图3示出了根据本发明实施例的一个实施例的出行语音识别系统的示意框图；

图4示出了根据本发明实施例的一个实施例的计算机设备的示意框图。

具体实施方式

为了能够更清楚地理解本发明实施例的上述目的、特征和优点，下面结合附图和具体实施方式对本发明实施例进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明实施例，但是，本发明实施例还可以采用其他不同于在此描述的其他方式来实施，因此，本发明实施例的保护范围并不受下面公开的具体实施例的限制。

下面参照图1描述根据本发明实施例一些实施例的出行语音识别方法。

如图1所示，提出了一种出行语音识别方法，包括：步骤S102,接收并分析语音数据，得到对应于语音数据的多个识别文本以及对应于每个识别文本的得分值；步骤S104,提取每个识别文本中的至少一个地点信息；步骤S106,在数据库中查找与每个地点信息匹配的信息点，根据匹配结果确定对应于每个识别文本的第一权重；步骤S108,确定对应于每个识别文本的至少一个地点信息的类别，根据类别确定每个识别文本的第二权重；步骤S110,根据每个识别文本的得分值、第一权重以及第二权重，确定对应于每个识别文本的子分值；步骤S112,获取子分值中得分最高的第一子分值，输出第一子分值对应的识别文本。

根据本发明实施例的出行语音识别方法，通过分析语音数据，得到对应于语音数据的多个识别文本以及对应于每个识别文本的得分值，有利于系统对语音数据进行处理，以及降低了系统对语音数据的误判断概率，同时，结合与识别文本中地点信息匹配的信息点，信息点的第一权重，以及根据地点信息的类别确定的第二权重，最终根据每个识别文本的得分值、第一权重以及第二权重得出对应的子分值，通过选择得分最高的子分值对应的识别文本作为最终识别结果，提高了系统对地点信息识别的可靠性。

根据本发明实施例的一个实施例，步骤S106，在数据库中查找与每个地点信息匹配的信息点，根据匹配结果得到对应于每个识别文本的第一权重，具体包括：若在数据库中查找到与地点信息一致的信息点，则将识别文本的第一权重设为1；若在数据库中未查找到与地点信息一致的信息点，则确定信息点与地点信息的匹配度；将匹配度不高于第一匹配阈值的地点信息对应的第一权重设为0；确定匹配度高于第一匹配阈值的地点信息，匹配度高于第一匹配阈值的地点信息对应的第一权重由匹配度大小确定，其中，匹配度与第一权重呈正比关系。

根据本发明实施例的出行语音识别方法，通过将识别文本中的地点信息与数据库中的信息点进行匹配，在地点信息被数据库完全记录的情况下，即在数据库中能找到与地点信息完全一致的信息点，此时认为当前识别文本的第一权重为1，在数据库中找不到与当前识别文本的地点信息相同的信息点时，根据在数据库中对信息点的匹配度确定第一权重的具体数值，通过进行第一权重的判断，增强最终得出的识别结果的准确性，提高用户体验。

根据本发明实施例的一个实施例，确定对应于每个识别文本的至少一个地点信息的类别，具体包括：判断识别文本的至少一个地点信息前是否包含出发地信息；若所有地点信息前均不包含出发地信息，则确定接收语音数据的定位信息，将定位信息作为出发地；若在至少一个地点信息前包含出发地信息，则在数据库中查询与地点信息匹配的第一信息点；将第一信息点的位置确定为出发地；或若在至少一个地点信息前包含出发地信息，则在数据库中查询与地点信息的匹配值超过第二匹配阈值的多个第二信息点；分别获取每个第二信息点的位置，根据每个第二信息点的位置，确定多个第二信息点的平均位置；将平均位置确定为出发地。

根据本发明实施例的出行语音识别方法，通过对识别文本进行是否包含出发地信息的判断，在不包含出发地信息的情况下，直接将终端定位得到的定位信息作为出发地，此外，在识别文本包含出发地信息的情况下，在数据库中对地点信息进行匹配，若能在数据库中找到完全匹配的第一信息点，则直接将该信息点(即第一信息点)的位置作为出发地，若找到多个信息点，则对匹配分数超过第二匹配阈值的第二信息点的位置进行平均处理，将处理后的平均位置作为出发地的位置，提高识别文本中出发地对应的位置的确定效率以及识别准确度。

其中，出发地信息包括但不限于文字信息，例如：从、由。

根据本发明实施例的一个实施例，步骤S108中，确定对应于每个所述识别文本的至少一个所述地点信息的类别，具体包括：判断所述识别文本的至少一个所述地点信息前是否包含目的地信息；若所有所述地点信息前均不包含所述目的地信息，则发出用于提醒用户提供补充信息的提示信息；若在至少一个所述地点信息前包含所述目的地信息，则在所述数据库中查询与所述地点信息匹配的第三信息点；将所述第三信息点的位置确定为目的地；或若在至少一个所述地点信息前包含所述目的地信息，则在所述数据库中查询与所述地点信息的匹配值超过第三匹配阈值的多个第四信息点；分别获取每个第四信息点的位置，根据每个所述第四信息点的位置，确定所述多个第四信息点的平均位置；将所述平均位置确定为目的地。

根据本发明实施例的出行语音识别方法，通过对地点信息前进行是否包含目的地信息的判断，在不包含目的地信息的情况下，向外发出提示信息，例如，警报音或提示文字，以使用户对目的地信息进行补充，此外，在地点信息前包含目的地信息的情况下，在数据库中对地点信息进行匹配，若能在数据库中找到完全匹配的第三信息点，则直接将该第三信息点作为目的地，若找到多个信息点，则对匹配分数超过第三匹配阈值的第四信息点的位置进行平均处理，将处理后的平均位置作为目的地，从而提高识别文本中目的地的确定效率以及识别准确度。

根据本发明实施例的一个实施例，步骤S108中，确定每个识别文本的第二权重具体包括：确定每个识别文本中，由出发地至目的地的距离信息；根据距离信息，确定与距离信息对应的至少一种出行方式；确定在统计时间内，每种出行方式对应于距离信息的出行次数；根据每种出行方式的出行次数以及在统计时间内统计的总次数，确定每种出行方式的使用概率，将使用概率作为第二权重。

根据本发明实施例的出行语音识别方法，通过根据距离信息，达到对应的交通方式在出行数据中的概率，将概率作为第二权重，优化用户的出行路径，提高了用户的出行体验。

根据本发明实施例的一个实施例，还包括：将每个信息点的名称与位置进行关联，将关联结果保存至数据库中。

根据本发明实施例的出行语音识别方法，通过将多个信息点中的每个信息点的名称与位置进行关联，将关联结果保存至数据库中，不断的扩大数据库中的数据，提高了数据库中的信息数据与语音信息的匹配度，提高了数据库的工作效率。

图2示出了根据本发明实施例的一个实施例的出行语音识别方法的示意流程图。

具体实施例：

与常规技术一样，首先会利用领域文本对语言模型、发音词典进行优化，利用领域语音对声学模型进行优化，保留得分最高的N条候选路径对应的识别结果及得分值，而不是仅仅保留一个识别结果，即(结果result 1，得分score 1),(结果result 2,得分score2)……，将识别结果进行文本解析，提取出疑似信息点的片段，得到N个疑似信息点，将N个疑似信息点在信息点的数据库中进行检索，根据匹配程度，进行加权，此时，每个疑似信息点的得分为f(识别得分，信息点检索加权值)，f为检索加权函数，最简单的加权是两者相乘，即“识别得分×信息点检索加权值”，距离计算，涉及到出发地和目的地，根据两者的GPS位置信息计算距离，如果用户的语音中，没有涉及到出发地，可以直接利用GPS对当前位置进行定位，将定位结果作为出发地信息，如果疑似信息点能够与信息点数据库中的某条数据完全匹配，则直接提取其GPS位置信息；否则，可以选择匹配度超过某个门限值的前M个信息点，计算其平均GPS位置，有了出发地和目的地的GPS位置信息，就可以计算其距离，根据出行方式，可以选择距离计算的方式，距离加权，根据出行数据库中不同出行方式下的出行距离的统计分布，计算其加权概率值，利用上一步得到的距离信息，计算当前出行距离在出行数据库中使用本类型出行工具情况下的概率分布，作为加权值或者进一步变换后作为加权值，此时，每个疑似信息点的得分可以是：g(信息点检索加权后得分，p(dist(出发地位置，目的地位置)，出行距离统计概率分布))，其中dist为距离计算函数，p为当前距离在出行数据库中的概率函数，g为距离加权函数。

最后，从N个结果的最终得分中，选择得分最高的一个，作为识别的最终结果。

图3示出了根据本发明实施例的一个实施例的出行语音识别系统200的示意框图。

如图3所示，根据本发明实施例的第二方面的实施例，提出了一种出行语音识别系统200，包括：得分单元202，用于接收并分析语音数据，得到对应于语音数据的多个识别文本以及对应于每个识别文本的得分值；提取单元204，用于提取每个识别文本中的至少一个地点信息；第一权重分配单元206，用于在数据库中查找与，每个地点信息匹配的信息点，根据匹配结果得到对应于每个识别文本的第一权重；第二权重分配单元208，用于确定对应于每个所述识别文本的至少一个所述地点信息的类别，根据所述类别确定所述距离信息对应的第二权重；子分值单元210，用于根据每个识别文本的得分值、第一权重以及第二权重，确定对应于每个识别文本的子分值；输出单元212，用于获取所述子分值中得分最高的第一子分值，输出第一子分值对应的识别文本。

根据本发明实施例的出行语音识别系统200，得分单元202通过分析语音数据，得到对应于语音数据的多个识别文本以及对应于每个识别文本的得分值，有利于系统对语音数据进行处理，以及降低了系统对语音数据的误判断概率，同时，结合与识别文本中地点信息匹配的信息点，第一权重分配单元206得到信息点的第一权重，以及第二权重分配单元208根据地点信息的类别确定的第二权重，根据每个识别文本的得分值、第一权重以及第二权重得出对应的子分值，通过选择得分最高的子分值对应的识别文本作为最终识别结果，提高了系统对地点信息识别的可靠性。

本发明实施例根据本发明实施例的一个实施例，第一权重分配单元206具体用于：若在数据库中查找到与地点信息一致的信息点，则将识别文本的第一权重设为1；若在数据库中未查找到与地点信息一致的信息点，则确定信息点与地点信息的匹配度；将匹配度不高于第一匹配阈值的地点信息对应的第一权重设为0；确定匹配度高于第一匹配阈值的地点信息，匹配度高于第一匹配阈值的地点信息对应的第一权重由匹配度大小确定，其中，匹配度与第一权重呈正比关系。

根据本发明实施例的出行语音识别系统200，第一权重分配单元206通过将识别文本中的地点信息与数据库中的信息点进行匹配，在地点信息被数据库完全记录的情况下，即在数据库中能找到与地点信息完全一致的信息点，此时认为当前识别文本的第一权重为满值，即为1，在数据库中找不到与当前识别文本的地点信息相同的信息点时，根据在数据库中对信息点的匹配度确定第一权重的具体数值，通过进行第一权重的判断，增强最终得出的识别结果的准确性，提高用户体验。

根据本发明实施例的一个实施例，第二权重分配单元208具体包括：出发确定单元2082，用于判断识别文本的至少一个地点信息前是否包含出发地信息；出发确定单元2082，还用于：若所有地点信息前均不包含出发地信息，则确定接收语音数据的定位信息，将定位信息作为出发地；若在至少一个地点信息前包含出发地信息，则在数据库中查询与地点信息匹配的第一信息点；将第一信息点的位置确定为出发地；或若在至少一个地点信息前包含出发地信息，则在数据库中查询与地点信息的匹配值超过第二匹配阈值的多个第二信息点；分别获取每个第二信息点的位置，根据每个第二信息点的位置，确定多个第二信息点的平均位置；将平均位置确定为出发地。

根据本发明实施例的出行语音识别系统200，通过对识别文本进行是否包含出发地信息的判断，在不包含出发地信息的情况下，直接将终端定位得到的定位信息作为出发地，此外，在识别文本包含出发地信息的情况下，在数据库中对地点信息进行匹配，若能在数据库中找到完全匹配的第一信息点，则直接将该信息点(即第一信息点)的位置作为出发地，若找到多个信息点，则对匹配分数超过第二匹配阈值的第二信息点的位置进行平均处理，将处理后的平均位置作为出发地的位置，提高识别文本中出发地对应的位置的确定效率以及识别准确度。

其中，出发地信息包括但不限于文字信息，例如：从、由。

根据本发明实施例的一个实施例，第二权重分配单元208，具体包括：目的确定单元2084，用于判断所述识别文本的至少一个所述地点信息前是否包含目的地信息；目的确定单元2084还用于：若所有所述地点信息前均不包含所述目的地信息时，则发出用于提醒用户提供补充信息的提示信息；若在至少一个所述地点信息前包含所述目的地信息，则在所述数据库中查询与所述地点信息匹配的第三信息点；将所述第三信息点的位置确定为目的地；或若在至少一个所述地点信息前包含所述目的地信息，则在所述数据库中查询与所述地点信息的匹配值超过第三匹配阈值的多个第四信息点；分别获取每个第四信息点的位置，根据每个所述第四信息点的位置，确定所述多个第四信息点的平均位置；将所述平均位置确定为目的地。

根据本发明实施例的出行语音识别系统200，目的确定单元2084通过对地点信息前进行是否包含目的地信息的判断，在不包含目的地信息的情况下，向外发出提示信息，例如，警报音或提示文字，以使用户对目的地信息进行补充，此外，在地点信息前包含目的地信息的情况下，在数据库中对地点信息进行匹配，若能在数据库中找到完全匹配的第三信息点，则直接将该第三信息点作为目的地，若找到多个信息点，则对匹配分数超过第三匹配阈值的第四信息点的位置进行平均处理，将处理后的平均位置作为目的地，从而提高识别文本中目的地的确定效率以及识别准确度。

根据本发明实施例的一个实施例，第二权重分配单元208具体包括：距离确定单元2086，用于确定每个所述识别文本中，由所述出发地至所述目的地的距离信息；概率确定单元2088，用于：根据所述距离信息，确定与所述距离信息对应的至少一种出行方式；确定在统计时间内，每种出行方式对应于所述距离信息的出行次数；根据每种所述出行方式的出行次数以及在所述统计时间内统计的总次数，确定每种所述出行方式的使用概率，将所述使用概率作为所述第二权重。

根据本发明实施例的出行语音识别系统200，距离确定单元2086先确定从出发地到目的地的距离信息，再通过概率确定单元2088根据距离信息，达到对应的交通方式在出行数据中的概率，将概率作为第二权重，优化用户的出行路径，提高了用户的出行体验。

例如，以语音叫车为例，主要使用汽车作为出行工具，则采用汽车导航距离计算方法，具体地，根据出行数据库中不同交通出行方式下的出行距离的统计分布，计算其加权概率值，利用上一步得到的距离信息，计算当前出行距离在出行数据库中使用本类型交通工具情况下的概率分布，作为加权值或者进一步变换后作为加权值，例如，以语音叫车为例，出行数据库中包含汽车出行距离分布的概率分布数据，利用疑似信息点所获得的距离，计算其概率值即可，此时，每个疑似信息点的得分可以是：g(信息点检索加权后得分，p(dist(出发地位置，目的地位置)，出行距离统计概率分布))，其中dist为距离计算函数，p为当前距离在出行数据库中的概率函数，g为距离加权函数。根据本发明实施例的一个实施例，还包括：关联单元2090，用于将每个信息点的名称与位置进行关联，将关联结果保存至数据库中。

根据本发明实施例的出行语音识别系统200，关联单元2090通过将每个信息点的名称与位置进行关联，将关联结果保存至数据库中，不断的扩大数据库中的数据，提高了数据库中的信息数据与语音信息的匹配度，提高了数据库的工作效率。

图4示出了根据本发明实施例的一个实施例的计算机设备1的示意框图。

如图4所示，计算机设备1，包括：

存储器12，存储器12用于存储计算机程序；

处理器14，处理器14用于执行在存储器中存储的计算机程序；

处理器14执行计算机程序时执行如本发明实施例一个实施例的出行语音识别方法中任一步骤或步骤组合。

在该实施例中，执行上述任一项的压缩机冷却方法的计算机程序存储在存储器上，处理器执行计算机程序时，可结合与识别文本中地点信息匹配的信息点，信息点的第一权重，以及根据地点信息的类别确定的第二权重，最终根据每个识别文本的得分值、第一权重以及第二权重得出对应的子分值，通过选择得分最高的子分值对应的识别文本作为最终识别结果，提高了系统对地点信息识别的可靠性。

其中，处理器14可以是通用处理器，例如中央处理器(Central Processing Unit，CPU)，还可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)，或者是被配置成实施本发明实施例实施例的一个或多个集成电路。存储器12，用于存储程序代码，并将该程序代码传输给处理器14。存储器12可以包括易失性存储器(Volatile Memory)，例如随机存取存储器(RandomAccess Memory，RAM)；存储器12也可以包括非易失性存储器(Non-Volatile Memory)，例如只读存储器(Read-Only Memory，ROM)、快闪存储器(Flash Memory)、硬盘(Hard DiskDrive，HDD)或固态硬盘(Solid-State Drive，SSD)；存储器12还可以包括上述种类的存储器的组合。

以上结合附图详细说明了本发明实施例的技术方案，通过本发明实施例的技术方案，通过识别文本处理语音数据，保留语音识别生成的多个识别结果，结合语音信息中的距离信息的分析，优化用户的出行路径，提高了用户的出行体验。

在本说明书的描述中，术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明实施例的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或实例。而且，描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上仅为本发明实施例的优选实施例而已，并不用于限制本发明实施例，对于本领域的技术人员来说，本发明实施例可以有各种更改和变化。凡在本发明实施例的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明实施例的保护范围之内。

Claims

1.一种出行语音识别方法，其特征在于，包括：

接收并分析语音数据，得到对应于所述语音数据的多个识别文本以及对应于每个所述识别文本的得分值；

提取每个所述识别文本中的至少一个地点信息；

在数据库中查找与每个所述地点信息匹配的信息点，根据匹配结果确定对应于每个所述识别文本的第一权重；

确定对应于每个所述识别文本的至少一个所述地点信息的类别，根据所述类别确定每个所述识别文本的第二权重；

根据每个所述识别文本的所述得分值、所述第一权重以及所述第二权重，确定对应于每个所述识别文本的子分值；

获取所述子分值中得分最高的第一子分值，输出所述第一子分值对应的识别文本。

2.根据权利要求1所述的出行语音识别方法，其特征在于，所述在数据库中查找与每个所述地点信息匹配的信息点，根据匹配结果得到对应于每个所述识别文本的第一权重，具体包括：

若在所述数据库中查找到与所述地点信息一致的信息点，则将所述识别文本的第一权重设为1；

若在所述数据库中未查找到与所述地点信息一致的信息点，则确定所述信息点与所述地点信息的匹配度；

将所述匹配度不高于第一匹配阈值的地点信息对应的所述第一权重设为0；

确定所述匹配度高于所述第一匹配阈值的地点信息，所述匹配度高于所述第一匹配阈值的地点信息对应的所述第一权重由所述匹配度大小确定，

其中，所述匹配度与所述第一权重呈正比关系。

3.根据权利要求1所述的出行语音识别方法，其特征在于，所述确定对应于每个所述识别文本的至少一个所述地点信息的类别，具体包括：

判断所述识别文本的至少一个所述地点信息前是否包含出发地信息；

若所有所述地点信息前均不包含所述出发地信息，则确定接收所述语音数据的定位信息，将所述定位信息作为出发地；

若在至少一个所述地点信息前包含所述出发地信息，则在所述数据库中查询与所述地点信息匹配的第一信息点；将所述第一信息点的位置确定为出发地；或

若在至少一个所述地点信息前包含所述出发地信息，则在所述数据库中查询与所述地点信息的匹配值超过第二匹配阈值的多个第二信息点；分别获取每个第二信息点的位置，根据每个所述第二信息点的位置，确定所述多个第二信息点的平均位置；将所述平均位置确定为出发地。

4.根据权利要求3所述的出行语音识别方法，其特征在于，所述确定对应于每个所述识别文本的至少一个所述地点信息的类别，具体包括：

判断所述识别文本的至少一个所述地点信息前是否包含目的地信息；

若所有所述地点信息前均不包含所述目的地信息，则发出用于提醒用户提供补充信息的提示信息；或

若在至少一个所述地点信息前包含所述目的地信息，则在所述数据库中查询与所述地点信息匹配的第三信息点；将所述第三信息点的位置确定为目的地；或

若在至少一个所述地点信息前包含所述目的地信息，则在所述数据库中查询与所述地点信息的匹配值超过第三匹配阈值的多个第四信息点；分别获取每个第四信息点的位置，根据每个所述第四信息点的位置，确定所述多个第四信息点的平均位置；将所述平均位置确定为目的地。

5.根据权利要求4所述的出行语音识别方法，其特征在于，所述确定每个所述识别文本的第二权重具体包括：

确定每个所述识别文本中，由所述出发地至所述目的地的距离信息；

根据所述距离信息，确定与所述距离信息对应的至少一种出行方式；

确定在统计时间内，每种出行方式对应于所述距离信息的出行次数；

根据每种所述出行方式的出行次数以及在所述统计时间内统计的总次数，确定每种所述出行方式的使用概率，将所述使用概率作为所述第二权重。

6.根据权利要求1至5中任一项所述的出行语音识别方法，其特征在于，还包括：

将每个所述信息点的名称与位置进行关联，并将关联结果保存至所述数据库中。

7.一种出行语音识别系统，其特征在于，包括：

得分单元，用于接收并分析语音数据，得到对应于所述语音数据的多个识别文本以及对应于每个所述识别文本的得分值；

提取单元，用于提取每个所述识别文本中的至少一个地点信息；

第一权重分配单元，用于在数据库中查找与每个所述地点信息匹配的信息点，根据匹配结果得到对应于每个所述识别文本的第一权重；

第二权重分配单元，用于确定对应于每个所述识别文本的至少一个所述地点信息的类别，根据所述类别确定所述距离信息对应的第二权重；

子分值单元，用于根据每个所述识别文本的所述得分值、所述第一权重以及所述第二权重，确定对应于每个所述识别文本的子分值；

输出单元，用于获取所述子分值中得分最高的第一子分值，输出第一子分值对应的识别文本。

8.根据权利要求7所述的出行语音识别系统，其特征在于，所述第一权重分配单元具体用于：

其中，所述匹配度与所述第一权重呈正比关系。

9.根据权利要求8所述的出行语音识别系统，其特征在于，所述第二权重分配单元具体包括：

出发确定单元，用于判断所述识别文本的至少一个所述地点信息前是否包含出发地信息；

所述出发确定单元，还用于：

10.根据权利要求9所述的出行语音识别系统，其特征在于，所述第二权重分配单元，具体包括：

目的确定单元，用于判断所述识别文本的至少一个所述地点信息前是否包含目的地信息；

所述目的确定单元还用于：

若所有所述地点信息前均不包含所述目的地信息时，则发出用于提醒用户提供补充信息的提示信息；

11.根据权利要求10所述的出行语音识别系统，其特征在于，所述第二权重分配单元具体包括：

距离确定单元，用于确定每个所述识别文本中，由所述出发地至所述目的地的距离信息；

概率确定单元，用于：

12.根据权利要求7至11中任一项所述的出行语音识别系统，其特征在于，还包括：

关联单元，用于将每个所述信息点的名称与位置进行关联，将关联结果保存至所述数据库中。

13.一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的出行语音识别方法。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的出行语音识别方法。