CN107622769A - 号码修改方法及装置、存储介质、电子设备 - Google Patents
号码修改方法及装置、存储介质、电子设备 Download PDFInfo
- Publication number
- CN107622769A CN107622769A CN201710749358.8A CN201710749358A CN107622769A CN 107622769 A CN107622769 A CN 107622769A CN 201710749358 A CN201710749358 A CN 201710749358A CN 107622769 A CN107622769 A CN 107622769A
- Authority
- CN
- China
- Prior art keywords
- modification
- speech data
- history
- feature
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000002715 modification method Methods 0.000 title abstract 2
- 230000004048 modification Effects 0.000 claims abstract description 260
- 238000012986 modification Methods 0.000 claims abstract description 260
- 238000000034 method Methods 0.000 claims abstract description 34
- 230000008859 change Effects 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 9
- 230000007246 mechanism Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000008439 repair process Effects 0.000 claims description 3
- 239000010410 layer Substances 0.000 description 24
- 238000005516 engineering process Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000011524 similarity measure Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本公开提供一种号码修改方法及装置、存储介质、电子设备。所述方法包括:获取用户输入的号码修改语音数据,所述号码修改语音数据用于对原号码进行号码修改;提取号码修改特征,所述号码修改特征包括所述原号码的特征和所述号码修改语音数据的特征;基于所述号码修改特征,通过预先构建的号码修改模型进行号码修改,获得修改后号码。如此方案,有助于提高号码修改的灵活性,解决了现有技术鲁棒性、可扩展性差的问题,提升了用户体验。
Description
技术领域
本公开涉及语音识别领域,具体地,涉及一种号码修改方法及装置、存储介质、电子设备。
背景技术
随着人工智能技术的不断突破,以及各种智能终端的日益普及,人机交互在人们日常工作、生活中出现的频率越来越高。语音作为最方便、最快捷的交互方式之一,拥有广阔的应用场景,例如,手机、智能家居、机器人、车载设备等场景。
当用户输入的语音数据中包含号码时,相较于文字的语音识别,号码的语音识别可利用的信息较少,识别效果受用户所处的当前环境、发音习惯等因素的影响较大,识别结果出错的概率较高,导致通过语音方式输入号码时,经常需要进行号码修改。
目前的号码修改大多是基于正则表达式实现的,例如,正则表达式可以为“把XXX改为YYY”,如果用户修改号码时输入的语音数据与正则表达式相符,就可以利用YYY替换掉XXX。如此方案,需要用户按照预先设定好的正则表达式进行语音输入,否则难以完成号码修改,用户体验较差,且方案的鲁棒性、可扩展性也较差。
发明内容
本公开的主要目的是提供一种号码修改方法及装置、存储介质、电子设备,有助于提高号码修改的灵活性。
为了实现上述目的,本公开提供一种号码修改方法,所述方法包括:
获取用户输入的号码修改语音数据,所述号码修改语音数据用于对原号码进行号码修改;
提取号码修改特征,所述号码修改特征包括所述原号码的特征和所述号码修改语音数据的特征;
基于所述号码修改特征,通过预先构建的号码修改模型进行号码修改,获得修改后号码。
可选地,所述获取用户输入的号码修改语音数据,包括:
接收用户输入的语音数据,判断所述语音数据是否用于进行号码修改;
如果所述语音数据用于进行号码修改,则判断所述语音数据中是否包含用于确定原号码的信息,所述用于确定原号码的信息为:直接指定所述原号码的信息、或者通过语义理解确定所述原号码的信息、或者符合预设规则的号码信息;
如果所述语音数据中包含用于确定原号码的信息,则将所述语音数据确定为号码修改语音数据。
可选地,所述号码修改特征还包括:
用户输入所述原号码时的打断位置信息;和/或,
所述号码修改语音数据中包含的号码的能量信息;和/或,
用于进行本轮号码修改的号码修改语音数据与用于进行上轮号码修改的号码修改语音数据之间的相似度。
可选地,构建所述号码修改模型的方式为:
采集历史修改数据,每条历史修改数据包括历史原号码、历史号码修改语音数据、以及历史修改后号码的对应关系;
提取每条历史修改数据对应的历史号码修改特征,所述历史号码修改特征包括所述历史原号码的特征和所述历史号码修改语音数据的特征;
确定所述号码修改模型的拓扑结构;
利用所述历史号码修改特征以及所述拓扑结构,训练所述号码修改模型,直至所述号码修改模型输出的修改后号码与所述对应关系中的历史修改后号码之间满足预设条件为止。
可选地,所述拓扑结构为基于Attention机制的编码器-解码器结构。
可选地,在所述获得修改后号码后,所述方法还包括:
计算所述原号码与所述修改后号码之间的相似度;
判断所述相似度是否低于预设值;
如果所述相似度低于所述预设值,则向用户发出提示信息。
本公开提供一种号码修改装置,所述装置包括:
语音数据获取模块,用于获取用户输入的号码修改语音数据,所述号码修改语音数据用于对原号码进行号码修改;
特征提取模块,用于提取号码修改特征,所述号码修改特征包括所述原号码的特征和所述号码修改语音数据的特征;
号码获得模块,用于基于所述号码修改特征,通过预先构建的号码修改模型进行号码修改,获得修改后号码。
可选地,所述语音数据获取模块,用于接收用户输入的语音数据,判断所述语音数据是否用于进行号码修改;如果所述语音数据用于进行号码修改,则判断所述语音数据中是否包含用于确定原号码的信息,所述用于确定原号码的信息为:直接指定所述原号码的信息、或者通过语义理解确定所述原号码的信息、或者符合预设规则的号码信息;如果所述语音数据中包含用于确定原号码的信息,则将所述语音数据确定为号码修改语音数据。
可选地,所述特征提取模块提取的号码修改特征还包括:
用户输入所述原号码时的打断位置信息;和/或,
所述号码修改语音数据中包含的号码的能量信息;和/或,
用于进行本轮号码修改的号码修改语音数据与用于进行上轮号码修改的号码修改语音数据之间的相似度。
可选地,所述装置还包括:
历史修改数据采集模块,用于采集历史修改数据,每条历史修改数据包括历史原号码、历史号码修改语音数据、以及历史修改后号码的对应关系;
所述特征提取模块,用于提取每条历史修改数据对应的历史号码修改特征,所述历史号码修改特征包括所述历史原号码的特征和所述历史号码修改语音数据的特征;
拓扑结构确定模块,用于确定所述号码修改模型的拓扑结构;
模块训练模块,用于利用所述历史号码修改特征以及所述拓扑结构,训练所述号码修改模型,直至所述号码修改模型输出的修改后号码与所述对应关系中的历史修改后号码之间满足预设条件为止。
可选地,所述拓扑结构为基于Attention机制的编码器-解码器结构。
可选地,所述装置还包括:
相似度计算模块,用于在获得所述修改后号码后,计算所述原号码与所述修改后号码之间的相似度;
判断模块,用于判断所述相似度是否低于预设值;
提示模块,用于在所述相似度低于所述预设值时,向用户发出提示信息。
本公开提供一种存储介质,其中存储有多条指令,所述指令由处理器加载,执行上述号码修改方法的步骤。
本公开提供一种电子设备,所述电子设备包括;
上述的存储介质;以及
处理器,用于执行所述存储介质中的指令。
本公开方案,可以预先构建号码修改模型,故在用户输入号码修改语音数据后,可以提取号码修改特征作为模型输入,经模型处理得到修改后号码。如此方案,在用户输入号码修改语音数据时,可以随意的说,无需如现有技术一样必须按照预设正则表达式输入,有助于提高号码修改的灵活性,解决了现有技术鲁棒性、可扩展性差的问题,提升了用户体验。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1为本公开方案号码修改方法实施例1的流程示意图;
图2为本公开方案中获取号码修改语音数据的流程示意图;
图3为本公开方案号码修改方法实施例2的流程示意图;
图4为本公开方案中构建号码修改模型的流程示意图;
图5为本公开方案中号码修改模型的结构示意图;
图6为本公开方案号码修改装置的构成示意图;
图7为本公开方案用于号码修改的电子设备的结构示意图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
参见图1,示出了本公开号码修改方法实施例1的流程示意图。可以包括以下步骤:
S101,获取用户输入的号码修改语音数据,所述号码修改语音数据用于对原号码进行号码修改。
本公开方案中,在需要进行号码修改时,可以获取用户输入的号码修改语音数据,通过语音方式进行号码修改。
作为一种示例,用户输入的号码可以为标识用户身份的号码,例如,电话号码、身份证号码、护照号码等;用户输入的号码可以为其他号码,例如,车次号码、航班号码、日期、时间等,本公开方案对号码的具体形式可不做限定。
作为一种示例,本公开方案中的原号码,可以是通过语音方式输入后,由设备识别并保存;或者,也可以是通过手动方式输入后,由设备保存,本公开方案对原号码的输入方式可不做具体限定。
作为一种示例,本公开提供如下获取号码修改语音数据的方案,具体可参见图2所示流程图。可以包括以下步骤:
S201,接收用户输入的语音数据,判断所述语音数据是否用于进行号码修改。
S202,如果所述语音数据用于进行号码修改,则判断所述语音数据中是否包含用于确定原号码的信息,所述用于确定原号码的信息为:直接指定所述原号码的信息、或者通过语义理解确定所述原号码的信息、或者符合预设规则的号码信息。
S203,如果所述语音数据中包含用于确定原号码的信息,则将所述语音数据确定为号码修改语音数据。
对于用户输入的语音数据,至少可以执行以下两个判断过程,以确定该语音数据是否为号码修改语音数据。
(1)识别语音数据表示的意图
也即,判断语音数据是否用于进行号码修改。
作为一种示例,可以对语音数据进行语音识别以及语义理解,以此识别用户输入语音数据的意图。举例来说,设备保存用户输入的手机号码后,又采集到用户输入的语音数据“再添加一个号码138XXXXXXXX”,根据语义理解可知,用户输入该语音数据的意图并非修改之前保存的手机号码,即,该语音数据不是用于进行号码修改。
作为一种示例,可以根据预设操作,识别用户输入语音数据的意图。举例来说,预设操作可以为用户触发了表示号码修改的按键,即,用户触发表示号码修改的按键后,再进行语音输入,便可判定用户语音输入的意图是进行号码修改。或者,预设操作可以为用户输入了表示号码修改的标识,如标识可以为“1”,即,用户输入表示号码修改的标识后,再进行语音输入,便可判定用户语音输入的意图是进行号码修改。本公开方案对预设操作的具体形式可不做限定。
(2)识别修改对象
也即,判断语音数据中是否包含用于确定原号码的信息。
作为一种示例,用于确定原号码的信息可以是:直接指定原号码的信息。举例来说,设备保存用户输入的手机号码后,又采集到用户输入的语音数据“把手机号码中的138改成183”,据此可将包含138的手机号码确定为原号码。
作为一种示例,用于确定原号码的信息可以是:通过语义理解确定原号码的信息。举例来说,设备保存用户输入的手机号码后,又采集到用户输入的语音数据“把空格后面的号码都删掉”,据此可将包含空格的手机号码确定为原号码。
作为一种示例,用于确定原号码的信息可以是:符合预设规则的号码信息。结合实际应用,可以设置不同的预设规则,本公开方案对此可不做具体限定,下面对预设规则进行举例说明。
通常,从用户输入原号码,到确定需要进行原号码修改,中间间隔的时间都不会太长,故预设规则可以体现为未超出有效修改时间,例如,有效修改时间可以为2min。举例来说,设备保存用户输入的手机号码后,又采集到用户输入的语音数据“不是583是593”,若手机号码中包含583,且手机号码的存储时长未超出有效修改时间,则可将包含583的手机号码确定为原号码。
如果一个账号下保存了多个相同类型的号码,例如,一个购票系统的账号下保存了多个身份证号码,对于录入时间较早的号码来说,可能在以往的购票过程中已经被使用过,即这种号码的准确性较高,此时最有可能需要修改的就是最近录入的号码,故预设规则可以体现为同类型号码中最近录入的号码。举例来说,设备先后保存的两个手机号码中都包含583,若用户输入语音数据“不是583是593”,此时可将最近保存的包含583的手机号码确定为原号码。
如果用户在一段时间内输入了多组号码,例如,输入了购票日期、车次、身份证号码等,考虑到输入的号码越长,出错的概率就越高,故预设规则可以体现为最长的号码。举例来说,先后输入的车次和身份证号码中都包含583,若用户输入语音数据“不是583是593”,此时可将最长的包含583的身份证号码确定为原号码。
至此,结合上述两个判断过程,便可获取到用于修改原号码的号码修改语音数据,进而基于该号码修改语音数据进行后续处理,实现本公开灵活进行号码修改的目的。
S102,提取号码修改特征,所述号码修改特征包括所述原号码的特征和所述号码修改语音数据的特征。
本公开方案中,原号码的特征可以体现为原号码的词向量,号码修改语音数据的特征可以体现为号码修改语音数据的句子向量。作为一种示例,可以通过Google的word2vec技术实现原号码和号码修改语音数据的向量化,本公开方案对此可不做具体限定。
作为一种示例,为了提高号码修改的准确性,本公开方案可以基于多维的号码修改特征进行号码修改,也就是说,除了原号码的词向量、号码修改语音数据的句子向量之外,号码修改特征还可以体现为以下信息中的至少一种:
(1)用户输入原号码时的打断位置信息
在全双工的语音交互过程中,用户以语音方式输入原号码的同时,设备便会实时进行语音识别以及语义理解,输出识别结果,若在完整输入原号码之前,用户发现已输入的部分有误,便可打断重新进行原号码输入,即开始输入号码修改语音数据。
举例来说,用户想要输入的原号码为13812345678,若随着用户语音输入“138”,设备实时输出识别结果“183”时,用户发现此时的识别结果有误,则可进行打断,不再继续输入后面的数字,而是开始输入号码修改语音数据。
针对于此,需要修改的号码通常位于打断位置之前,故本公开方案可以将打断位置信息作为号码修改特征,用于限定需要进行号码修改的位置。
作为一种示例,可以对用户语音数据进行分帧处理,打断位置信息可以体现为打断位置对应的数据帧的序号。同样可通过word2vec技术对数据帧的序号进行向量化处理,本公开方案对此可不做具体限定。
(2)号码修改语音数据中包含的号码的能量信息
通常,利用VAD(英文:Voice Activity Detection,中文:语音活动检测)的能量信息可以判断用户强调的重点。结合本公开方案的号码修改场景,用户强调的重点往往放在需要修改的错误号码以及正确号码上,例如,号码修改语音数据为“不是583是593”,此时用户着重强调的是“8”和“9”,针对于此,可以获得号码“583”和“593”的能量信息作为号码修改特征。
可以理解地,在实际应用过程中,还可以获取号码修改语音数据中每个字符的能量信息作为号码修改特征,也即,除号码的能量信息之外,还可以连同号码修改语音数据中其他字符的能量信息,一并作为号码修改特征,本公开方案对此可不做具体限定,
作为一种示例,可以通过word2vec技术对能量信息进行向量化处理,本公开方案对此可不做具体限定。
(3)用于进行本轮号码修改的号码修改语音数据与用于进行上轮号码修改的号码修改语音数据之间的相似度
在实际应用过程中,可能存在一次修改不成功的情况,考虑到各轮修改之间具有一定的相关性,本公开方案还可将用于进行本轮号码修改的号码修改语音数据、用于进行上轮号码修改的号码修改语音数据之间的相似度,作为号码修改特征。
作为一种示例,可以通过word2vec技术对号码修改语音数据进行向量化处理,再进行相似度计算,本公开方案对此可不做具体限定。
S103,基于所述号码修改特征,通过预先构建的号码修改模型进行号码修改,获得修改后号码。
本公开方案可以预先利用历史修改数据,构建号码修改模型,故在获得号码修改特征之后,可将其作为号码修改模型的输入,经模型处理得到修改后号码。如此方案,在用户输入号码修改语音数据时,可以随意的说,无需如现有技术一样必须按照预设正则表达式输入,有助于提高号码修改的灵活性,解决了现有技术鲁棒性、可扩展性差的问题,提升了用户体验。
参见图3,示出了本公开号码修改方法实施例2的流程示意图。可以包括以下步骤:
S301,获取用户输入的号码修改语音数据,所述号码修改语音数据用于对原号码进行号码修改。
S302,提取号码修改特征,所述号码修改特征包括所述原号码的特征和所述号码修改语音数据的特征。
S303,基于所述号码修改特征,通过预先构建的号码修改模型进行号码修改,获得修改后号码。
S301~S303的实现过程,可参见上文S101~S103处所做介绍,此处不再赘述。
S304,计算所述原号码与所述修改后号码之间的相似度。
S305,判断所述相似度是否低于预设值。
S306,如果所述相似度低于所述预设值,则向用户发出提示信息。
号码纠错通常指的是对原号码进行增删改操作,修改后号码与原号码之间一般存在较强的联系,因此,还可以在获得修改后号码后,计算修改后号码与原号码之间的相似度。如果二者的相似度不低于预设值,则可向用户展示修改后号码;如果二者的相似度低于预设值,则可判定本次修改可信度较低,可以向用户发出提示信息。例如,可以发出本次修改可信度低的警告;或者,可以提示用户重新输入号码修改语音数据,进行下一轮号码修改,本公开方案对提示信息的内容可不做具体限定。
作为一种示例,可以通过word2vec技术对修改后号码、原号码进行向量化处理,再进行相似度计算,本公开方案对此可不做具体限定。
下面对本公开方案中构建号码修改模型的过程进行解释说明。具体可参见图4所示流程图,可以包括以下步骤:
S401,采集历史修改数据,每条历史修改数据包括历史原号码、历史号码修改语音数据、以及历史修改后号码的对应关系。
可以采集大量的历史修改数据,且每条历史修改数据可具体体现为:历史原号码、历史号码修改语音数据、历史修改后号码,三者的对应关系。
作为一种示例,可以在实际应用场景中采集历史修改数据,或者,也可以通过人为方式构建历史修改数据,本公开方案对此可不做具体限定。
S402,提取每条历史修改数据对应的历史号码修改特征,所述历史号码修改特征包括所述历史原号码的特征和所述历史号码修改语音数据的特征。
本步骤的实现过程,可参照上文S102处所做介绍,此处不再赘述。
S403,确定所述号码修改模型的拓扑结构。
本公开方案中,拓扑结构可以为编码器-解码器、RNN(英文:Recurrent NeuralNetworks,中文:循环神经网络)、DNN(英文:Deep Neural Networks,中文:深度神经网络)等。
作为一种示例,编码器、解码器可以为通用的长短时记忆循环神经网络结构,包含输入层、隐层及输出层。其中,隐层可以有一层或者多层,隐层节点之间存在双向连接,多层网络相当于单层网络的叠加,高层网络可以利用底层网络的输出作为输入。
S404,利用所述历史号码修改特征以及所述拓扑结构,训练所述号码修改模型,直至所述号码修改模型输出的修改后号码与所述对应关系中的历史修改后号码之间满足预设条件为止。
综上,获得历史号码修改特征、拓扑结构后,便可训练得到本公开方案中的号码修改模型,其中,模型的输入为号码修改特征,输出为修改后号码。可以理解地,本公开方案可以将历史原号码、历史号码修改语音数据对应的历史修改后号码作为模型训练的约束条件,即要求模型对历史原号码进行号码纠错后输出的修改后号码,与对应关系中的历史修改后号码之间需要满足预设条件。作为一种示例,预设条件可以为二者完全相同;或者,二者的相似度不低于指定阈值,本公开方案对此可不做具体限定。
作为一种示例,为了进一步提高本公开方案号码修改的效果,号码修改模型的拓扑结构可以为基于Attention机制的编码器-解码器结构,也即在构建号码修改模型时,将所述历史号码修改特征输入所述编码器后,可以对所述编码器的输出进行Attention系数线性加权,然后再输入到所述解码器进行模型训练,得到所述号码模型。
下面结合图5所示号码修改模型的结构示意图,对本公开方案中模型训练的过程进行解释说明。
假设输入向量X{X1,X2,…,Xi,…,XT}表示一条历史修改数据的历史号码修改特征。作为一种示例,X1表示原号码的特征、X2表示号码修改语音数据的特征、X3表示打断位置信息、X4表示号码的能量信息、X5表示相邻两轮号码修改语音数据的相似度。
1.将特征Xi从输入层输入到编码器Encoder中,经由Encoder的第一个隐层进行特征变换。作为一种示例,第一个隐层可以为双向LSTM(英文:Long Short-Term Memory,中文:长短期记忆)网络,特征变换可体现为以下公式:
其中,Hi为编码器的第一个隐层输出的特征;表示特征在编码器中经过双向LSTM网络时的变换,具体变换过程可参照相关技术实现,此处不做详述。
如上文所做介绍,隐层可以有多层,高层网络可以利用底层网络的输出作为输入,继续进行特征变换,此处不再举例说明。
2.对Encoder最后一层的输出进行一组Attention系数线性加权,可体现为以下公式:
其中,Cj表示经Attention系数线性加权后的特征;aji为Attention系数,表示在第j个输出时刻,模型对第i时刻Encoder输出的关注程度。
3.将经过Attention系数线性加权的特征输入到解码器Decoder之中,经由Decoder的第一个隐层进行特征变换。作为一种示例,第一个隐层可以为单向LSTM网络,特征变换可体现为以下公式:
其中,Yj表示解码器的第一个隐层输出的特征;表示特征在解码器中经过单向LSTM网络时的变换,具体变换过程可参照相关技术实现,此处不做详述。
可以理解地,如果解码器只包括一个隐层,则经隐层进行特征变化后,即可得到修改后号码。如果解码器包括多个隐层,高层网络则可利用底层网络的输出作为输入,继续进行特征变换,最终得到修改后号码,此处亦不再举例说明。
由上文公式3可知,采用Attention机制实现的端到端号码修改,能够使得单向LSTM隐层特征在解码的不同时刻,拥有不同的权重,整个模型动态地在原号码和修改后号码中做出权衡。
参见图6,示出了本公开号码修改装置的构成示意图。所述装置可以包括:
语音数据获取模块501,用于获取用户输入的号码修改语音数据,所述号码修改语音数据用于对原号码进行号码修改;
特征提取模块502,用于提取号码修改特征,所述号码修改特征包括所述原号码的特征和所述号码修改语音数据的特征;
号码获得模块503,用于基于所述号码修改特征,通过预先构建的号码修改模型进行号码修改,获得修改后号码。
可选地,所述语音数据获取模块,用于接收用户输入的语音数据,判断所述语音数据是否用于进行号码修改;如果所述语音数据用于进行号码修改,则判断所述语音数据中是否包含用于确定原号码的信息,所述用于确定原号码的信息为:直接指定所述原号码的信息、或者通过语义理解确定所述原号码的信息、或者符合预设规则的号码信息;如果所述语音数据中包含用于确定原号码的信息,则将所述语音数据确定为号码修改语音数据。
可选地,所述特征提取模块提取的号码修改特征还包括:
用户输入所述原号码时的打断位置信息;和/或,
所述号码修改语音数据中包含的号码的能量信息;和/或,
用于进行本轮号码修改的号码修改语音数据与用于进行上轮号码修改的号码修改语音数据之间的相似度。
可选地,所述装置还包括:
历史修改数据采集模块,用于采集历史修改数据,每条历史修改数据包括历史原号码、历史号码修改语音数据、以及历史修改后号码的对应关系;
所述特征提取模块,用于提取每条历史修改数据对应的历史号码修改特征,所述历史号码修改特征包括所述历史原号码的特征和所述历史号码修改语音数据的特征;
拓扑结构确定模块,用于确定所述号码修改模型的拓扑结构;
模块训练模块,用于利用所述历史号码修改特征以及所述拓扑结构,训练所述号码修改模型,直至所述号码修改模型输出的修改后号码与所述对应关系中的历史修改后号码之间满足预设条件为止。
可选地,所述拓扑结构为基于Attention机制的编码器-解码器结构。
可选地,所述装置还包括:
相似度计算模块,用于在获得所述修改后号码后,计算所述原号码与所述修改后号码之间的相似度;
判断模块,用于判断所述相似度是否低于预设值;
提示模块,用于在所述相似度低于所述预设值时,向用户发出提示信息。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
参见图7,示出了本公开用于进行号码修改的电子设备600的结构示意图。参照图7,电子设备600包括处理组件601,其进一步包括一个或多个处理器,以及由存储介质602所代表的存储设备资源,用于存储可由处理组件601的执行的指令,例如应用程序。存储介质602中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件601被配置为执行指令,以执行上述号码修改方法。
电子设备600还可以包括一个电源组件603,被配置为执行电子设备600的电源管理;一个有线或无线网络接口606,被配置为将电子设备600连接到网络;和一个输入输出(I/O)接口605。电子设备600可以操作基于存储在存储介质602的操作系统,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
Claims (13)
1.一种号码修改方法,其特征在于,所述方法包括:
获取用户输入的号码修改语音数据,所述号码修改语音数据用于对原号码进行号码修改;
提取号码修改特征,所述号码修改特征包括所述原号码的特征和所述号码修改语音数据的特征;
基于所述号码修改特征,通过预先构建的号码修改模型进行号码修改,获得修改后号码。
2.根据权利要求1所述的方法,其特征在于,所述获取用户输入的号码修改语音数据,包括:
接收用户输入的语音数据,判断所述语音数据是否用于进行号码修改;
如果所述语音数据用于进行号码修改,则判断所述语音数据中是否包含用于确定原号码的信息,所述用于确定原号码的信息为:直接指定所述原号码的信息、或者通过语义理解确定所述原号码的信息、或者符合预设规则的号码信息;
如果所述语音数据中包含用于确定原号码的信息,则将所述语音数据确定为号码修改语音数据。
3.根据权利要求1所述的方法,其特征在于,所述号码修改特征还包括:
用户输入所述原号码时的打断位置信息;和/或,
所述号码修改语音数据中包含的号码的能量信息;和/或,
用于进行本轮号码修改的号码修改语音数据与用于进行上轮号码修改的号码修改语音数据之间的相似度。
4.根据权利要求1所述的方法,其特征在于,构建所述号码修改模型的方式为:
采集历史修改数据,每条历史修改数据包括历史原号码、历史号码修改语音数据、以及历史修改后号码的对应关系;
提取每条历史修改数据对应的历史号码修改特征,所述历史号码修改特征包括所述历史原号码的特征和所述历史号码修改语音数据的特征;
确定所述号码修改模型的拓扑结构;
利用所述历史号码修改特征以及所述拓扑结构,训练所述号码修改模型,直至所述号码修改模型输出的修改后号码与所述对应关系中的历史修改后号码之间满足预设条件为止。
5.根据权利要求4所述的方法,其特征在于,所述拓扑结构为基于Attention机制的编码器-解码器结构。
6.根据权利要求1至5任一项所述的方法,其特征在于,在所述获得修改后号码后,所述方法还包括:
计算所述原号码与所述修改后号码之间的相似度;
判断所述相似度是否低于预设值;
如果所述相似度低于所述预设值,则向用户发出提示信息。
7.一种号码修改装置,其特征在于,所述装置包括:
语音数据获取模块,用于获取用户输入的号码修改语音数据,所述号码修改语音数据用于对原号码进行号码修改;
特征提取模块,用于提取号码修改特征,所述号码修改特征包括所述原号码的特征和所述号码修改语音数据的特征;
号码获得模块,用于基于所述号码修改特征,通过预先构建的号码修改模型进行号码修改,获得修改后号码。
8.根据权利要求7所述的装置,其特征在于,
所述语音数据获取模块,用于接收用户输入的语音数据,判断所述语音数据是否用于进行号码修改;如果所述语音数据用于进行号码修改,则判断所述语音数据中是否包含用于确定原号码的信息,所述用于确定原号码的信息为:直接指定所述原号码的信息、或者通过语义理解确定所述原号码的信息、或者符合预设规则的号码信息;如果所述语音数据中包含用于确定原号码的信息,则将所述语音数据确定为号码修改语音数据。
9.根据权利要求7所述的装置,其特征在于,所述特征提取模块提取的号码修改特征还包括:
用户输入所述原号码时的打断位置信息;和/或,
所述号码修改语音数据中包含的号码的能量信息;和/或,
用于进行本轮号码修改的号码修改语音数据与用于进行上轮号码修改的号码修改语音数据之间的相似度。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
历史修改数据采集模块,用于采集历史修改数据,每条历史修改数据包括历史原号码、历史号码修改语音数据、以及历史修改后号码的对应关系;
所述特征提取模块,用于提取每条历史修改数据对应的历史号码修改特征,所述历史号码修改特征包括所述历史原号码的特征和所述历史号码修改语音数据的特征;
拓扑结构确定模块,用于确定所述号码修改模型的拓扑结构;
模块训练模块,用于利用所述历史号码修改特征以及所述拓扑结构,训练所述号码修改模型,直至所述号码修改模型输出的修改后号码与所述对应关系中的历史修改后号码之间满足预设条件为止。
11.根据权利要求7至10任一项所述的装置,其特征在于,所述装置还包括:
相似度计算模块,用于在获得所述修改后号码后,计算所述原号码与所述修改后号码之间的相似度;
判断模块,用于判断所述相似度是否低于预设值;
提示模块,用于在所述相似度低于所述预设值时,向用户发出提示信息。
12.一种存储介质,其中存储有多条指令,其特征在于,所述指令由处理器加载,执行权利要求1至6任一项所述方法的步骤。
13.一种电子设备,其特征在于,所述电子设备包括;
权利要求12所述的存储介质;以及
处理器,用于执行所述存储介质中的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710749358.8A CN107622769B (zh) | 2017-08-28 | 2017-08-28 | 号码修改方法及装置、存储介质、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710749358.8A CN107622769B (zh) | 2017-08-28 | 2017-08-28 | 号码修改方法及装置、存储介质、电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107622769A true CN107622769A (zh) | 2018-01-23 |
CN107622769B CN107622769B (zh) | 2021-04-06 |
Family
ID=61088173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710749358.8A Active CN107622769B (zh) | 2017-08-28 | 2017-08-28 | 号码修改方法及装置、存储介质、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107622769B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110136185A (zh) * | 2019-05-23 | 2019-08-16 | 中国科学技术大学 | 一种单目深度估计方法及系统 |
CN111554296A (zh) * | 2020-04-27 | 2020-08-18 | 中国银行股份有限公司 | 一种客户信息修改方法、装置、服务器及存储介质 |
CN113593539A (zh) * | 2020-04-30 | 2021-11-02 | 阿里巴巴集团控股有限公司 | 流式端到端语音识别方法、装置及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110184737A1 (en) * | 2010-01-28 | 2011-07-28 | Honda Motor Co., Ltd. | Speech recognition apparatus, speech recognition method, and speech recognition robot |
US20120232904A1 (en) * | 2011-03-10 | 2012-09-13 | Samsung Electronics Co., Ltd. | Method and apparatus for correcting a word in speech input text |
CN105206267A (zh) * | 2015-09-09 | 2015-12-30 | 中国科学院计算技术研究所 | 一种融合非确定性反馈的语音识别错误修正方法及系统 |
CN105282332A (zh) * | 2015-09-24 | 2016-01-27 | 百度在线网络技术(北京)有限公司 | 语音拨号方法及装置 |
CN105869632A (zh) * | 2015-01-22 | 2016-08-17 | 北京三星通信技术研究有限公司 | 基于语音识别的文本修订方法和装置 |
-
2017
- 2017-08-28 CN CN201710749358.8A patent/CN107622769B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110184737A1 (en) * | 2010-01-28 | 2011-07-28 | Honda Motor Co., Ltd. | Speech recognition apparatus, speech recognition method, and speech recognition robot |
US20120232904A1 (en) * | 2011-03-10 | 2012-09-13 | Samsung Electronics Co., Ltd. | Method and apparatus for correcting a word in speech input text |
CN105869632A (zh) * | 2015-01-22 | 2016-08-17 | 北京三星通信技术研究有限公司 | 基于语音识别的文本修订方法和装置 |
CN105206267A (zh) * | 2015-09-09 | 2015-12-30 | 中国科学院计算技术研究所 | 一种融合非确定性反馈的语音识别错误修正方法及系统 |
CN105282332A (zh) * | 2015-09-24 | 2016-01-27 | 百度在线网络技术(北京)有限公司 | 语音拨号方法及装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110136185A (zh) * | 2019-05-23 | 2019-08-16 | 中国科学技术大学 | 一种单目深度估计方法及系统 |
CN110136185B (zh) * | 2019-05-23 | 2022-09-06 | 中国科学技术大学 | 一种单目深度估计方法及系统 |
CN111554296A (zh) * | 2020-04-27 | 2020-08-18 | 中国银行股份有限公司 | 一种客户信息修改方法、装置、服务器及存储介质 |
CN111554296B (zh) * | 2020-04-27 | 2023-11-10 | 中国银行股份有限公司 | 一种客户信息修改方法、装置、服务器及存储介质 |
CN113593539A (zh) * | 2020-04-30 | 2021-11-02 | 阿里巴巴集团控股有限公司 | 流式端到端语音识别方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN107622769B (zh) | 2021-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107665708B (zh) | 智能语音交互方法及系统 | |
CN110287479B (zh) | 命名实体识别方法、电子装置及存储介质 | |
CN103903619B (zh) | 一种提高语音识别准确率的方法及系统 | |
CN107578771B (zh) | 语音识别方法及装置、存储介质、电子设备 | |
CN108320738A (zh) | 语音数据处理方法及装置、存储介质、电子设备 | |
CN110489755A (zh) | 文本生成方法和装置 | |
CN110428820B (zh) | 一种中英文混合语音识别方法及装置 | |
CN106653021A (zh) | 语音唤醒的控制方法、装置及终端 | |
CN108564954A (zh) | 深度神经网络模型、电子装置、身份验证方法和存储介质 | |
CN108897732B (zh) | 语句类型识别方法和装置、存储介质及电子装置 | |
CN110808032B (zh) | 一种语音识别方法、装置、计算机设备及存储介质 | |
CN108549658A (zh) | 一种基于语法分析树上注意力机制的深度学习视频问答方法及系统 | |
CN108320734A (zh) | 语音信号处理方法及装置、存储介质、电子设备 | |
CN107239440A (zh) | 一种垃圾文本识别方法和装置 | |
WO2013143252A1 (zh) | 一种基于上下文场景的输入候选词提示方法及系统 | |
CN110060693A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN107622769A (zh) | 号码修改方法及装置、存储介质、电子设备 | |
CN109492221A (zh) | 一种基于语义分析的信息回复方法及可穿戴设备 | |
CN107316635A (zh) | 语音识别方法及装置、存储介质、电子设备 | |
CN107731226A (zh) | 基于语音识别的控制方法、装置及电子设备 | |
CN108345612A (zh) | 一种问题处理方法和装置、一种用于问题处理的装置 | |
CN106909573A (zh) | 一种评价问答对质量的方法和装置 | |
CN107862058A (zh) | 用于生成信息的方法和装置 | |
CN109933773A (zh) | 一种多重语义语句解析系统及方法 | |
CN108595609A (zh) | 基于人物ip的机器人回复生成方法、系统、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |