CN108733650A

CN108733650A - 个性化词获取方法及装置

Info

Publication number: CN108733650A
Application number: CN201810456332.9A
Authority: CN
Inventors: 许丽; 潘嘉; 王智国; 胡国平
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2018-05-14
Filing date: 2018-05-14
Publication date: 2018-11-02
Anticipated expiration: 2038-05-14
Also published as: CN108733650B

Abstract

本发明实施例提供一种个性化词获取方法及装置，属于计算机应用技术领域。该方法包括：获取识别文本及识别文本对应的用户确认文本；若识别文本与用户确认文本之间在内容上存在差异，且识别文本与用户确认文本之间满足第一预设规则，则根据识别文本与用户确认文本之间在内容上的差异，获取个性化词。由于用户在对识别文本进行确认的过程中可将自身用词习惯融入用户确认文本，并基于识别文本和用户之间的差异来获取个性化词，从而获取到的个性化词能够涵盖用户的用词习惯。

Description

个性化词获取方法及装置

技术领域

本发明实施例涉及计算机应用技术领域，更具体地，涉及一种个性化词获取方法及装置。

背景技术

随着人工智能技术的飞速发展，智能设备在人们的生活工作中扮演着越来越重要的角色，语音交互作为最方便自然的人机交互方式深受用户的喜爱，语音交互顺利进行的前提是语音数据的正确识别。由于用户在讲话时通常会带有自己的常用词汇，从而实际在对语音数据进行语音识别时，需要基于个性化词库进行识别。在相关技术中，个性化词通常是由用户手动添加或者基于用户确定的使用领域进行添加，从而导致个性化词比较局限。

发明内容

为了解决上述问题，本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的个性化词获取方法及装置。

根据本发明实施例的第一方面，提供了一个性化词获取方法，该方法包括：

获取识别文本及识别文本对应的用户确认文本，识别文本是对语音数据进行语音识别后得到的；

若识别文本与用户确认文本之间在内容上存在差异，且识别文本与用户确认文本之间满足第一预设规则，则根据识别文本与用户确认文本之间在内容上的差异，获取个性化词。

本发明实施例提供的方法，通过获取识别文本及识别文本对应的用户确认文本，若识别文本与用户确认文本之间在内容上存在差异，且识别文本与用户确认文本之间满足第一预设规则，则根据识别文本与用户确认文本之间在内容上的差异，获取个性化词。由于用户在对识别文本进行确认的过程中可将自身用词习惯融入用户确认文本，并基于识别文本和用户之间的差异来获取个性化词，从而获取到的个性化词能够涵盖用户的用词习惯。另外，在将获取到的个性化词添加至个性化词库后，可提高后续基于个性化词库进行语音识别时的识别率以及用户体验。

根据本发明实施例的第二方面，提供了一种个性化词获取装置，该装置包括：

文本获取模块，用于获取识别文本及识别文本对应的用户确认文本，识别文本是对语音数据进行语音识别后得到的；

个性化词获取模块，用于当识别文本与用户确认文本之间在内容上存在差异，且识别文本与用户确认文本之间满足第一预设规则时，则根据识别文本与用户确认文本之间在内容上的差异，获取个性化词。

根据本发明实施例的第三方面，提供了一种个性化词获取设备，包括：

至少一个处理器；以及

与处理器通信连接的至少一个存储器，其中：

存储器存储有可被处理器执行的程序指令，处理器调用程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的个性化词获取方法。

根据本发明实施例的第四方面，提供了一种非暂态计算机可读存储介质，非暂态计算机可读存储介质存储计算机指令，计算机指令使计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的个性化词获取方法。

应当理解的是，以上的一般描述和后文的细节描述是示例性和解释性的，并不能限制本发明实施例。

附图说明

图1是本发明实施例提供的一种个性化词获取方法的流程示意图；

图2是本发明实施例提供的一种个性化词获取方法的流程示意图；

图3是本发明实施例提供的一种个性化词获取方法的流程示意图；

图4是本发明实施例提供的一种个性化词获取装置的框图；

图5是本发明实施例提供的一种个性化词获取设备的框图。

具体实施方式

下面结合附图和实施例，对本发明实施例的具体实施方式作进一步详细描述。以下实施例用于说明本发明实施例，但不用来限制本发明实施例的范围。

用户在讲话时通常会带有自己的常用词汇，如人名、地名、特殊词汇及所属专业领域的词汇等，从而在对语音数据进行语音识别时，需要基于个性化词库进行识别。相关技术在个性化词库中添加个性化词时，通常通过如下两种方式添加个性化词。第一种是提供几个使用领域让用户选择，当用户选择某一领域后，将该领域的词汇作为个性化词。第二种是由用户手动添加个性化词。无论是基于用户确定的使用领域进行添加还是手动添加，添加的个性化词通常比较局限，用户在使用个性化词库进行语音识别时仍然有很多词汇不能识别正确，识别率较低且用户体验较差。针对上述情形，本发明实施例提供了一种个性化词获取方法。参见图1，该方法包括：

101，获取识别文本及识别文本对应的用户确认文本，识别文本是对语音数据进行语音识别后得到的。

其中，语音数据可以是用户在讲话时采集得到的，如用户在聊天时采集到的语音数据。通过对语音数据进行语音识别，可得到识别文本。在得到识别文本后，可将识别文本展示给用户，从而使得用户在内容上对识别文本进行确认，进而得到用户对识别文本进行确认后并上传的用户确认文本。其中，用户对识别文本的确认过程可以为对识别文本的修改过程或者仅对识别文本进行确认。具体地，若识别文本中存在内容需要修改，如针对识别错误的修改、增删内容的修改或者用户需要对表达方式进行修改，则用户可通过确认过程修改识别文本，以得到用户确认文本。若识别文本中的内容不需要被修改，则识别文本可不经过修改而直接被确认为用户确认文本。

102，若识别文本与用户确认文本之间在内容上存在差异，且识别文本与用户确认文本之间满足第一预设规则，则根据识别文本与用户确认文本之间在内容上的差异，获取个性化词。

其中，可通过字符串比对的方式确定识别文本与用户确认文本之间是否在内容上存在差异，本发明实施例对此不作具体限定。若确定识别文本与用户确认文本之间在内容上存在差异，可再判断识别文本与用户确认文本之间是否满足第一预设规则。需要说明的是，若识别文本与用户确认文本之间不能同时满足在内容上存在差异，以及第一预设规则这两个条件，则不执行后续获取个性化词的过程。其中，第一预设规则用于判断用户确认文本中是否可能会包含个性化词。

例如，若识别文本为“合肥今天天气不错的呀”，而用户确认文本为“我想去公园散步”，则识别文本与用户确认文本之间在内容上虽然存在差异，但用户确认文本是基于更改后的用户意图对识别文本进行了重新修正，改变了识别文本的本身表达内容，也即两者之间并不满足第一预设规则，用户确认文本中不包含个性化词。

基于上述实施例的内容，作为一种可选实施例，本发明实施例提供了两种判定规则，以用于判定用户确认文本中是否可能会包含个性化词。相应地，第一预设规则为识别文本与用户确认文本中相同的字数大于第一预设阈值；和/或，识别文本与用户确认文本之间的编辑距离大于0且小于第二预设阈值。

对于上述第一种判定规则，由于用户在对识别文本进行基于个性化词的修改时，通常都不会修改太多的内容，如仅删除或增加部分字词，在此前提下，识别文本与用户确认文本之间不同的字数并不会太多。因此，可判定识别文本与用户确认文本中相同的字数是否大于第一预设阈值，并依据判定结果来确定是否进行了基于个性化词的修改。具体地，如果两者相同的字数大于第一预设阈值，则可认为用户确认文本并没有在识别文本的基础上修改太多内容，从而可认为用户对识别文本进行了基于个性化词的修改。反之，则可认为用户未对识别文本进行基于个性化词的修改。其中，第一预设阈值的取值可根据需求进行设置，如取值为2，本发明实施例对此不作具体限定。

例如，以识别文本为“合肥今天天气不错的呀”，用户确认文本为“合肥今天天气不错呀”，第一预设阈值为2为例，二者相同的字数为9个且大于第一预设阈值2，从而可确定用户对识别文本进行了基于个性化词的修改。再例如，以识别文本为“合肥今天天气不错的呀”，用户确认文本为“我想去公园散步”为例，用户确认文本与识别文本中相同的字数为0且小于第一预设阈值2，从而可确定用户未对识别文本进行基于个性化词的修改。

对于上述第二种判定规则，编辑距离指的是一个字符串转换成另一个字符串所需的最少编辑操作次数。编辑距离越小，则表示两个字符串相似度越大。识别文本与用户确认文本之间的编辑距离，指的是识别文本转换成用户确认文本所需的最少编辑次数。在计算编辑距离时，可计算识别文本对应的句向量与用户确认文本对应的句向量之间的欧式距离，并作为编辑距离。当识别文本与用户确认文本之间的编辑距离较大时，如大于第二预设阈值，则可确定识别文本与用户确认文本之间相似度不高，也即用户确认文本在识别文本的基础上进行了较大的修改。而基于个性化词的修改通常只会增加或删除部分字词，也即若用户确认文本是经由识别文本进行基于个性化词的修改后得到的，则识别文本与用户确认文本之间相似度较高。相应地，识别文本与用户确认文本之间的编辑距离会较小，如小于第二预设阈值。

由上述说明可知，若识别文本与用户确认文本之间的编辑距离大于0且小于第二预设阈值，则可确定用户确认文本是经由识别文本进行基于个性化词的修改后得到的。反之，则可确定用户确认文本不是经由识别文本进行基于个性化词的修改后得到的。例如，若用户更改了自身意图，并修改了识别文本的本身表达内容，则识别文本与用户确认文本之间的相似度会较低，从而编辑距离可能会大于第二预设阈值。因此，可确定用户确认文本不是经由识别文本进行基于个性化词的修改后得到的。

需要说明的是，第一预设规则可包括上述两种判定规则中的一种，也可以同时包含上述两种判定规则，本发明实施例对此不作具体限定。当第一预设规则同时包含上述两种判定规则时，也即在识别文本与用户确认文本中相同的字数大于第一预设阈值，且识别文本与用户确认文本之间的编辑距离大于0且小于第二预设阈值时，则确定用户确认文本是经由识别文本基于个性化词的修改后得到的。

本发明实施例提供的方法，通过将第一预设规则设置为识别文本与用户确认文本中相同的字数大于第一预设阈值；和/或，识别文本与用户确认文本之间的编辑距离大于0且小于第二预设阈值。由于可依据第一预设规则确定用户确认文本是否是对识别文本进行基于个性化词的修改后得到的，从而可保证后续获取个性化词的准确性。

基于上述实施例的内容，作为一种可选实施例，本发明实施例不对根据识别文本与用户确认文本之间在内容上的差异，获取个性化词的方式作具体限定，参见图2，包括但不限于：

201，分别对识别文本及用户确认文本进行分词，得到识别文本对应的第一分词序列及用户确认文本对应的第二分词序列。

其中，可基于词典分词算法或基于统计的机器学习算法对识别文本及用户确认文本进行分词，本发明实施例对此不作具体限定。

202按照分词顺序逐一比较第一分词序列及第二分词序列中的每一分词，确定个性化词，个性化词为第二分词序列中在内容上与第一分词序列中分词之间具有差异的分词。

例如，以识别文本为“他的名字是张叁”，用户确认文本为“他的名字是张三”为例。对识别文本进行分词后得到的第一分词序列为“他|的|名字|是|张叁”，对用户确认文本进行分词后得到的第二分词序列为“他|的|名字|是|张三”。在该示例中，按照分词顺序依次比较第一分词序列及第二分词序列中的每一分词，即可确定第一分词序列与第二分词序列之间具有差异的分词分别为“张叁”及“张三”，从而可将第二分词序列中的“张三”作为个性化词。

本发明实施例提供的方法，通过分别对识别文本及用户确认文本进行分词，得到识别文本对应的第一分词序列及用户确认文本对应的第二分词序列。按照分词顺序逐一比较第一分词序列及第二分词序列中的每一分词，确定第二分词序列中在内容上与第一分词序列中分词之间具有差异的分词为个性化词。由于可将用户确认文本与识别文本之间具有差异的分词作为个性化词，可保证后续获取个性化词的准确性。

在上述实施例中，将第二分词序列中在内容上与第一分词序列中分词之间具有差异的分词作为个性化词，可能会得到一些满足上述条件，但实际并非个性化词的词。针对该情形，基于上述实施例的内容，作为一种可选实施例，在根据识别文本与用户确认文本之间在内容上的差异，获取个性化词之后，本发明实施例还提供了一种筛选个性化词的方式，包括但不限于：基于第二预设规则对个性化词进行筛选，第二预设规则包括以下筛选方式中的至少一种，筛选方式分别为位于句首或句尾的词、删除停用词、删除数字词及删除词中总字数为0的词。

其中，位于句首或句尾的词，可能是由用户对识别文本进行内容补充后得到的。例如，识别文本为“我想订一张去合肥的机票”，用户确认文本为“今天我想订一张去合肥的机票”。虽然那识别文本与用户确认文本之间内容存在差异，也可能同时满足第一预设规则，但位于句首的词“今天”是用户补充的订票日期，并非个性化词，从而可将位于用户确认文本句首的词进行删除。同理，若识别文本为“我想去上海”，而用户确认文本为“我想去上海迪斯尼”，两者之间在内容上存在差异。但用户确认文本同样是对识别文本进行信息补充，从而可删除位于句尾的词。

停用词指的是在语音识别中容易识别错误的常用词语。例如，代词“你”、“您”，“你们”在语音识别时容易被混淆，用户在对识别文本进行修改得到用户确认文本后，这些修改的代词并非为个性化词。同理，代词还可包括“我”、“我们”、“他”以及“他们”。在判定上述实施例中获取到的个性化词是否为停用词时，可将上述实施例中获取到的个性化词与停用词表进行比对。如果上述实施例中获取到的个性化词中存在个性化词出现在停用词表中，即可作为停用词删除。其中，停用词表可通过预先收集大量数据统计得到。

数字词指的是仅包含数字的词，若个性化词中包含部分数字，则该个性化词不为数字词。对于仅包含数字的个性化词，可相应删除。

总字数为0的词主要是出现在如下情形，用户在对识别文本进行确认时，删除了识别文本中的某个词，而在用户确认文本中相应被删掉词的位置上内容是为空。此时，根据识别文本与用户确认文本之间在内容上的差异所获取到的个性化词，其内容也为空。由于内容为空的词不能作为个性化词，从而可删除总字数为0的词。

本发明实施例提供的方法，由于可基于第二预设规则对个性化词进行筛选，从而可保证获取到的个性化词的准确性。

除了基于识别文本与用户确认文本之间在内容上的差异，来获取个性化词之外，实际实施过程中，用户经常使用的一些个性化词可能并未经由用户确认而体现在用户确认文本中，从而导致这些个性化词无法获取。针对该情形，基于上述实施例的内容，作为一种可选实施例，在根据识别文本与用户确认文本之间在内容上的差异，获取个性化词之后，本发明实施例还提供了一种个性化词的扩展方式，包括但不限于：基于个性化词在用户确认文本中的上下文信息，对个性化词进行扩展；和/或，若个性化词为专有名词，则基于名词属性对个性化词进行扩展。

对于上述第一种扩展方式，以用户确认文本为“A|B|C|D|E”为例，个性化词为C，从而可基于用户确认文本中的上下文信息，并结合用户确认文本本身的语义将BC、CD及BCD作为扩展后的个性化词。

对于上述第二种扩展方式，专有名词指的是人名、地名及技术用语等，名词属性指的是名词本身所包含的信息，本发明实施例对此不作具体限定。以专有名词为人名为例，名词属性可以包括姓氏及名字。若专有名词为地名，则名词属性可以包括该地名的不同别称。

以个性化词为人名“蒋雅芬”为例，该人名中的名字为“雅芬”，该人名中的姓氏为“蒋”。若个性化词为“蒋雅芬”，则可将去掉“蒋”后的“雅芬”也作为个性化词，也即基于名字将个性化词“蒋雅芬”扩展为“雅芬”。另外，还可基于姓氏以及用户的称呼习惯将“蒋雅芬”扩展为“小蒋”等。另外，在进行个性化词扩展之前，可通过命名体识别方法判断当前个性化词是否为人名，本发明实施例对此不作具体限定。

需要说明的是，上述两种扩展方式可择一执行，也可以同时执行，本发明实施例对此不作具体限定。

本发明实施例提供的方法，通过对获取到的个性化词进行扩展，从而能够更好地覆盖用户的用语习惯，获取到更多的个性化词。

由上述实施例的内容可知，个性化词可添加至个性化词库中以用于后续的语音识别。基于上述实施例的内容，作为一种可选实施例，在根据识别文本与用户确认文本之间在内容上的差异，获取个性化词之后，还可将个性化词添加至个性化词库。

其中，初始的个性化词库可以为空，或者由用户手动上传的个性化词语及通讯录人名添加至初始的个性化词库中，或者根据用户选择的领域在初始的个性化词库中添加领域词，本发明实施例对此不作具体限定。相较于相关技术中在个性化词库中添加个性化词的方式，结合上述实施例提供的获取个性化词的方式，本发明实施例在个性化词库中添加个性化词时，个性化词库中的个性化词不会局限，能更好地覆盖用户的用语习惯。

经由上述实施例中的过程不断获取个性化词，个性化词库中的个性化词会越来越多。考虑到个性化词库的规模不断扩大，容易出现误触发。其中，误触发指的是在对语音数据进行识别时，由于个性化词中相同含义的个性化词较多，从而在对某一词语对应的语音数据进行语音识别时，可能会有两个以上的个性化词可作为识别结果，而这些识别结果中有些识别结果是不太符合用户预期的，但却作为了最终的识别结果。针对上述情形，基于上述实施例的内容，作为一种实施例，在将个性化词添加至个性化词库之后，还提供了一种对个性化词库进行删减的方式，包括但不限于：基于个性化词库中每一个性化词在语音识别时的使用频率，对个性化词库中的个性化词进行删减。

具体地，可按照预设的删减周期对个性化词库进行删减。对于任一删减周期，可将个性化词库中的每一个性化词按照在该删减周期内的使用频率进行从大到小排序，从而将排在后面的预设数量个性化词作为使用频率较低的个性化词，并同时从个性化词库中删除掉。

本发明实施例提供的方法，由于可基于个性化词库中每一个性化词在语音识别时的使用频率，对个性化词库中的个性化词进行删减，从而可控制个性化词库的规模，并可减少误触发出现的次数。另外，还可提高后续基于个性化词库对语音数据进行语音识别时的准确率。

由上述实施例的内容可知，个性化词库可用于语音识别。基于上述实施例的内容，作为一种可选实施例，本发明实施例还提供了一种基于个性化词库进行语音识别的方法。参见图3，该方法包括：

301，基于个性化词库对目标语音数据进行语音识别，得到若干个包含个性化词的待选目标识别文本。

由于个性化词库中可能包含含义相近但内容不同的个性化词，从而在基于个性化词库对目标语音数据进行语音识别，可能会得到若干个包含个性化词的待选目标识别文本。其中，目标语音数据即为待识别的语音数据，“若干个”指的是一个或多个。在基于个性化词库对目标语音数据进行语音识别时，若仅得到一个包含个性化词的待选目标识别文本时，则可直接将该待选目标识别文本作为目标识别文本。本发明实施例主要针对多个待选目标识别文本的情形。

302，基于每一待选目标识别文本中包含的个性化词所对应的激励权重，计算每一待选目标识别文本作为目标识别文本的可能性分值，并选取可能性分值最大的待选目标识别文本作为目标识别文本。

为了便于在得到多个待选目标识别文本时从中选取目标识别文本，可预先为个性化词库中每一个性化词设置对应的激励权重。其中，激励权重可用于指示语音识别时个性化词被选中作为识别结果的可能性，权重值越大则对应可能性越高。在计算每一待选目标识别文本作为目标识别文本的可能性分值时，可将每一待选目标识别文本中包含的个性化词所对应的激励权重进行叠加，从而将叠加结果作为可能性分值。通过将每一待选目标识别文本对应的可能性分值进行排序，可从中选取可能性分值最大的待选目标识别文本作为目标识别文本。

需要说明的是，在执行上述实施例中的步骤101之前，若个性化词库中已存在个性化词(如初始化个性化词库时已经在个性化词库中添加了个性化词)，同样可依据个性化词库对语音数据进行语音识别，以得到步骤101中的识别文本，本发明实施例对此不作具体限定。

本发明实施例提供的方法，通过基于个性化词库对目标语音数据进行语音识别，得到若干个包含个性化词的待选目标识别文本。基于每一待选目标识别文本中包含的个性化词所对应的激励权重，计算每一待选目标识别文本作为目标识别文本的可能性分值，并选取可能性分值最大的待选目标识别文本作为目标识别文本。由于在得到多个待选目标识别文本时，可基于个性化词对应的激励权重，选取可能性分值最大的待选目标识别文本作为目标识别文本，从而可提高语音识别的准确率。

由于用户的用语习惯随着时间推移可能会发生改变，从而个性化词库中个性化词的激励权重也需要相应改变以与用户的用语习惯同步。针对上述需求，基于上述实施例的内容，作为一种可选实施例，本发明实施例还提供了一种激励权重的更新方法，该方法包括：根据个性化词库中每一个性化词的语言模型分值、每一个性化词在语音识别时被识别错误的总次数、以及每一个性化词在语音识别时被误触发的总次数，更新个性化词库中每一个性化词所对应的激励权重。

其中，对于任一个性化词，该个性化词在语音识别时被识别错误的总次数，指的是在语音识别时，该个性化词为正确识别结果，本应当识别为该个性化词，但却识别错误的总次数。例如，以该个性化词为“张三”为例，个性化词“张三”作为正确识别结果，在100次语音识别过程中却均识别为了“张叁”，也即100次均识别错误，从而该个性化词“张三”在语音识别时被识别错误的总次数100次。

对于任一个性化词，该个性化词在语音识别时被误触发的总次数，指的是在语音识别时，本应当正确识别结果为其它个性化词，但却识别成了该个性化词的总次数。例如，以该个性化词为“张三”为例，在100次语音识别过程中本应当正确识别结果为“张叁”，但却均错误识别成了“张三”，从而该个性化词“张三”在语音识别时被误触发的总次数100次。

具体地，对于个性化词库中的任一个性化词，上述更新过程可通过如下公式表示：

W＝a*|LMS|+b*HE+c*HFT；

在上述公式中，LMS为该个性化词的语言模型得分，HE为该个性化词在语音识别时被识别错误的总次数，HFT为该个性化词在语音识别时被误触发的总次数。其中，若该个性化词在加入至个性化词库后还未用于语音识别中，则HE的初始值可设置为1，在后续每次语音识别的过程中若该个性化词被识别错误，则HE的值加1。同理，若该个性化词在加入至个性化词库后还未用于语音识别中，则HFT的初始值可设置为1，在后续每次语音识别的过程中若该个性化词被误触发，则HFT的值加1。另外，权重a、b、c的取值根据需求或经验进行设置，本发明实施例对此不作具体限定。

在更新个性化词库中个性化词的激励权重时，更新时机可以为在一次语音识别结束后，或者在一次语音识别开始前，本发明实施例不对更新时机作具体限定。优选地，可以在个性化词库中添加个性化词后，对个性化词库中个性化词的激励权重进行更新。

本发明实施例提供的方法，通过根据个性化词库中每一个性化词的语言模型分值、每一个性化词在语音识别时被识别错误的总次数、以及每一个性化词在语音识别时被误触发的总次数，更新个性化词库中每一个性化词所对应的激励权重。由于可依据个性化词库中每一个性化词在语音识别过程中的使用情况，不断更新了个性化词的激励权重，从而能够保证个性化词库中个性化词的激励权重值与用户当前的用语习惯保持一致，进而提高语音识别时的准确率。

需要说明的是，上述所有可选实施例，可以采用任意结合形成本发明的可选实施例，在此不再一一赘述。

基于上述实施例的内容，本发明实施例还提供一种个性化词获取装置，该装置用于执行上述方法实施例所提供的个性化词获取方法。参见图4，包括：

文本获取模块401，用于获取识别文本及识别文本对应的用户确认文本，识别文本是对语音数据进行语音识别后得到的；

个性化词获取模块402，用于当识别文本与用户确认文本之间在内容上存在差异，且识别文本与用户确认文本之间满足第一预设规则时，则根据识别文本与用户确认文本之间在内容上的差异，获取个性化词。

作为一种可选实施例，第一预设规则为识别文本与用户确认文本中相同的字数大于第一预设阈值；和/或，识别文本与用户确认文本之间的编辑距离大于0且小于第二预设阈值。

作为一种可选实施例，个性化词获取模块402，用于分别对识别文本及用户确认文本进行分词，得到识别文本对应的第一分词序列及用户确认文本对应的第二分词序列；按照分词顺序逐一比较第一分词序列及第二分词序列中的每一分词，确定个性化词，个性化词为第二分词序列中在内容上与第一分词序列中分词之间具有差异的分词。

作为一种可选实施例，该装置还包括：

筛选模块，用于基于第二预设规则对个性化词进行筛选，第二预设规则包括以下筛选方式中的至少一种，筛选方式分别为删除位于句首或句尾的词、删除停用词、删除数字词及删除词中总字数为0的词。

作为一种可选实施例，该装置还包括：

扩展模块，用于基于个性化词在用户确认文本中的上下文信息，对个性化词进行扩展；和/或，若个性化词为专有名词，则基于名词属性对个性化词进行扩展。

作为一种可选实施例，该装置还包括：

添加模块，用于将个性化词添加至个性化词库，个性化词库用于语音识别。

作为一种可选实施例，该装置还包括：

删减模块，用于基于个性化词库中每一个性化词在语音识别时的使用频率，对个性化词库中的个性化词进行删减。

作为一种可选实施例，该装置还包括：

语音识别模块，用于基于个性化词库对目标语音数据进行语音识别，得到若干个包含个性化词的待选目标识别文本；

选取模块，用于基于每一待选目标识别文本中包含的个性化词所对应的激励权重，计算每一待选目标识别文本作为目标识别文本的可能性分值，并选取可能性分值最大的待选目标识别文本作为目标识别文本。

作为一种可选实施例，该装置还包括：

更新模块，用于根据个性化词库中每一个性化词的语言模型分值、每一个性化词在语音识别时被识别错误的总次数、以及每一个性化词在语音识别时被误触发的总次数，更新个性化词库中每一个性化词所对应的激励权重。

本发明实施例提供的装置，通过获取识别文本及识别文本对应的用户确认文本，若识别文本与用户确认文本之间在内容上存在差异，且识别文本与用户确认文本之间满足第一预设规则，则根据识别文本与用户确认文本之间在内容上的差异，获取个性化词。由于用户在对识别文本进行确认的过程中可将自身用词习惯融入用户确认文本，并基于识别文本和用户之间的差异来获取个性化词，从而获取到的个性化词能够涵盖用户的用词习惯。另外，在将获取到的个性化词添加至个性化词库后，可提高后续基于个性化词库进行语音识别时的识别率以及用户体验。

其次，通过将第一预设规则设置为识别文本与用户确认文本中相同的字数大于第一预设阈值；和/或，识别文本与用户确认文本之间的编辑距离大于0且小于第二预设阈值。由于可依据第一预设规则确定用户确认文本是否是对识别文本进行基于个性化词的修改后得到的，从而可保证后续获取个性化词的准确性。

再次，通过分别对识别文本及用户确认文本进行分词，得到识别文本对应的第一分词序列及用户确认文本对应的第二分词序列。按照分词顺序逐一比较第一分词序列及第二分词序列中的每一分词，确定第二分词序列中在内容上与第一分词序列中分词之间具有差异的分词为个性化词。由于可将用户确认文本与识别文本之间具有差异的分词作为个性化词，可保证后续获取个性化词的准确性。

从次，由于可基于第二预设规则对个性化词进行筛选，从而可保证获取到的个性化词的准确性。

另外，通过对获取到的个性化词进行扩展，从而能够更好地覆盖用户的用语习惯，获取到更多的个性化词。

最后，由于可基于个性化词库中每一个性化词在语音识别时的使用频率，对个性化词库中的个性化词进行删减，从而可控制个性化词库的规模，并可减少误触发出现的次数。另外，还可提高后续基于个性化词库对语音数据进行语音识别时的准确率。

除此之外，通过基于个性化词库对目标语音数据进行语音识别，得到若干个包含个性化词的待选目标识别文本。基于每一待选目标识别文本中包含的个性化词所对应的激励权重，计算每一待选目标识别文本作为目标识别文本的可能性分值，并选取可能性分值最大的待选目标识别文本作为目标识别文本。由于在得到多个待选目标识别文本时，可基于个性化词对应的激励权重，选取可能性分值最大的待选目标识别文本作为目标识别文本，从而可提高语音识别的准确率。

值得一提的是，通过根据个性化词库中每一个性化词的语言模型分值、每一个性化词在语音识别时被识别错误的总次数、以及每一个性化词在语音识别时被误触发的总次数，更新个性化词库中每一个性化词所对应的激励权重。由于可依据个性化词库中每一个性化词在语音识别过程中的使用情况，不断更新了个性化词的激励权重，从而能够保证个性化词库中个性化词的激励权重值与用户当前的用语习惯保持一致，进而提高语音识别时的准确率。

本发明实施例提供一种个性化词获取设备，包括：至少一个处理器；以及与处理器通信连接的至少一个存储器，其中：

图5是本发明实施例提供的个性化词获取设备的结构框图，参照图5，个性化词获取设备，包括：处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和总线540，其中，处理器510，通信接口520，存储器530通过总线540完成相互间的通信。通信接口520可以用于服务器与输入面板显示设备之间的信息传输。处理器510可以调用存储器530中的逻辑指令，以执行如下方法：获取识别文本及识别文本对应的用户确认文本，识别文本是对语音数据进行语音识别后得到的；若识别文本与用户确认文本之间在内容上存在差异，且识别文本与用户确认文本之间满足第一预设规则，则根据识别文本与用户确认文本之间在内容上的差异，获取个性化词。

本发明实施例公开一种计算机程序产品，计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，计算机程序包括程序指令，当程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的方法，例如包括：获取识别文本及识别文本对应的用户确认文本，识别文本是对语音数据进行语音识别后得到的；若识别文本与用户确认文本之间在内容上存在差异，且识别文本与用户确认文本之间满足第一预设规则，则根据识别文本与用户确认文本之间在内容上的差异，获取个性化词。

本发明实施例提供一种非暂态计算机可读存储介质，非暂态计算机可读存储介质存储计算机指令，计算机指令使计算机执行上述各方法实施例所提供的方法，例如包括：获取识别文本及识别文本对应的用户确认文本，识别文本是对语音数据进行语音识别后得到的；若识别文本与用户确认文本之间在内容上存在差异，且识别文本与用户确认文本之间满足第一预设规则，则根据识别文本与用户确认文本之间在内容上的差异，获取个性化词。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种个性化词获取方法，其特征在于，包括：

获取识别文本及所述识别文本对应的用户确认文本，所述识别文本是对语音数据进行语音识别后得到的；

若所述识别文本与所述用户确认文本之间在内容上存在差异，且所述识别文本与所述用户确认文本之间满足第一预设规则，则根据所述识别文本与所述用户确认文本之间在内容上的差异，获取个性化词。

2.根据权利要求1所述的方法，其特征在于，所述第一预设规则为所述识别文本与所述用户确认文本中相同的字数大于第一预设阈值；和/或，所述识别文本与所述用户确认文本之间的编辑距离大于0且小于第二预设阈值。

3.根据权利要求1所述的方法，其特征在于，所述根据所述识别文本与所述用户确认文本之间在内容上的差异，获取个性化词，包括：

分别对所述识别文本及所述用户确认文本进行分词，得到所述识别文本对应的第一分词序列及所述用户确认文本对应的第二分词序列；

按照分词顺序逐一比较所述第一分词序列及所述第二分词序列中的每一分词，确定所述个性化词，所述个性化词为所述第二分词序列中在内容上与所述第一分词序列中分词之间具有差异的分词。

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述根据所述识别文本与所述用户确认文本之间在内容上的差异，获取个性化词之后，还包括：

基于第二预设规则对所述个性化词进行筛选，所述第二预设规则包括以下筛选方式中的至少一种，所述筛选方式分别为删除位于句首或句尾的词、删除停用词、删除数字词及删除词中总字数为0的词。

5.根据权利要求1至3中任一项所述的方法，其特征在于，所述根据所述识别文本与所述用户确认文本之间在内容上的差异，获取个性化词之后，还包括：

基于所述个性化词在所述用户确认文本中的上下文信息，对所述个性化词进行扩展；和/或，

若所述个性化词为专有名词，则基于名词属性对所述个性化词进行扩展。

6.根据权利要求1至3中任一项所述的方法，其特征在于，所述根据所述识别文本与所述用户确认文本之间在内容上的差异，获取个性化词之后，还包括：

将所述个性化词添加至个性化词库，所述个性化词库用于语音识别。

7.根据权利要求6中所述的方法，其特征在于，所述将所述个性化词添加至个性化词库之后，还包括：

基于所述个性化词库中每一个性化词在语音识别时的使用频率，对所述个性化词库中的个性化词进行删减。

8.根据权利要求6中所述的方法，其特征在于，所述将所述个性化词添加至个性化词库之后，还包括：

基于所述个性化词库对所述目标语音数据进行语音识别，得到若干个包含个性化词的待选目标识别文本；

基于每一待选目标识别文本中包含的个性化词所对应的激励权重，计算每一待选目标识别文本作为所述目标识别文本的可能性分值，并选取可能性分值最大的待选目标识别文本作为所述目标识别文本。

9.根据权利要求8中所述的方法，其特征在于，所述基于每一待选目标识别文本中包含的个性化词所对应的激励权重，计算每一待选目标识别文本作为语音识别结果的可能性分值之前，还包括：

根据所述个性化词库中每一个性化词的语言模型分值、每一个性化词在语音识别时被识别错误的总次数、以及每一个性化词在语音识别时被误触发的总次数，更新所述个性化词库中每一个性化词所对应的激励权重。

10.一种个性化词获取装置，其特征在于，包括：

文本获取模块，用于获取识别文本及所述识别文本对应的用户确认文本，所述识别文本是对语音数据进行语音识别后得到的；

个性化词获取模块，用于当所述识别文本与所述用户确认文本之间在内容上存在差异，且所述识别文本与所述用户确认文本之间满足第一预设规则时，则根据所述识别文本与所述用户确认文本之间在内容上的差异，获取个性化词。

11.一种个性化词获取设备，其特征在于，包括：

至少一个处理器；以及

与所述处理器通信连接的至少一个存储器，其中：

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行如权利要求1至9任一所述的方法。

12.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如权利要求1至9任一项所述的方法。