CN104991892A - 语音翻译方法和装置 - Google Patents
语音翻译方法和装置 Download PDFInfo
- Publication number
- CN104991892A CN104991892A CN201510401147.6A CN201510401147A CN104991892A CN 104991892 A CN104991892 A CN 104991892A CN 201510401147 A CN201510401147 A CN 201510401147A CN 104991892 A CN104991892 A CN 104991892A
- Authority
- CN
- China
- Prior art keywords
- translation
- voice
- word
- translated
- languages
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
本发明提出一种语音翻译方法和装置,该语音翻译方法包括:接收用户通过语音搜索界面输入的语音翻译请求,所述语音翻译请求中包括待翻译的语音和所述待翻译的语音的目的翻译语种;将所述待翻译的语音转化为文字,并对转化的文字进行意图识别,获得所述待翻译的语音的意图;调用所述意图所属类别的翻译库将所述转化的文字翻译成所述目的翻译语种的文字;通过翻译界面展示所述目的翻译语种的文字。本发明接收用户输入的待翻译的语音之后,获得待翻译的语音的意图,然后调用上述意图所属类别的翻译库将待翻译的语音转化的文字翻译成目的翻译语种的文字,从而提高了翻译的准确率,提升了用户体验。
Description
技术领域
本发明涉及语音交互技术领域,尤其涉及一种语音翻译方法和装置。
背景技术
在语言不通的情况下,用户具有天然的语音搜索需求,希望以对话场景的形式,将一种语言转换成另一种语言,实现更为自然的跨语种沟通方式。
以旅游场景为例,目前出境游人次约为1.35亿,自由行占比70%,韩国、日本、英语类国家约为1亿人次左右,在出境游时,用户最大的痛点为:出境游语言不通,特别是自由行用户,没有固定的行程,大多数都要靠“问”,语言不通是巨大的障碍。
现有技术中,用户通过语音输入某种文字时,搜索引擎会识别用户输入的内容,将其转换为文本进行搜索,如果触发了翻译类别,则会给出翻译特型结果。
但是,现有的线上的翻译特型结果一般都是直接调用市面上已有的翻译产品的接口,更多是字和/或短语翻译的拼凑,更适合短小的文字语句翻译,不适合大段翻译,特别在一些特定场景下翻译的句子的准确率较低。
发明内容
本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种语音翻译方法。该方法中,接收用户输入的待翻译的语音之后,获得待翻译的语音的意图,然后调用上述意图所属类别的翻译库将待翻译的语音转化的文字翻译成目的翻译语种的文字,从而提高了翻译的准确率,提升了用户体验。
本发明的第二个目的在于提出一种语音翻译装置。
为了实现上述目的,本发明第一方面实施例的语音翻译方法,包括:接收用户通过语音搜索界面输入的语音翻译请求,所述语音翻译请求中包括待翻译的语音和所述待翻译的语音的目的翻译语种;将所述待翻译的语音转化为文字,并对转化的文字进行意图识别,获得所述待翻译的语音的意图;调用所述意图所属类别的翻译库将所述转化的文字翻译成所述目的翻译语种的文字;通过翻译界面展示所述目的翻译语种的文字。
本发明实施例的语音翻译方法,接收用户通过语音搜索界面输入的语音翻译请求之后,将上述语音翻译请求中包括的待翻译的语音转化为文字,并对转化的文字进行意图识别,获得上述待翻译的语音的意图,然后调用上述意图所属类别的翻译库将上述转化的文字翻译成上述语音翻译请求中的目的翻译语种的文字,最后通过翻译界面展示上述目的翻译语种的文字,从而可以实现提高翻译的准确率,提升用户体验。
为了实现上述目的,本发明第二方面实施例的语音翻译装置,包括:接收模块,用于接收用户通过语音搜索界面输入的语音翻译请求,所述语音翻译请求中包括待翻译的语音和所述待翻译的语音的目的翻译语种;语音识别模块,用于将所述接收模块接收的所述待翻译的语音转化为文字,并对转化的文字进行意图识别,获得所述待翻译的语音的意图;翻译模块,用于调用所述意图所属类别的翻译库将所述语音识别模块转化的文字翻译成所述目的翻译语种的文字;展示模块,用于通过翻译界面展示所述目的翻译语种的文字。
本发明实施例的语音翻译装置,接收模块接收用户通过语音搜索界面输入的语音翻译请求之后,语音识别模块将上述语音翻译请求中包括的待翻译的语音转化为文字,并对转化的文字进行意图识别,获得上述待翻译的语音的意图,然后翻译模块调用上述意图所属类别的翻译库将上述转化的文字翻译成上述语音翻译请求中的目的翻译语种的文字,最后展示模块通过翻译界面展示上述目的翻译语种的文字,从而可以实现提高翻译的准确率,提升用户体验。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明语音翻译方法一个实施例的流程图;
图2为本发明语音翻译方法中翻译界面一个实施例的示意图;
图3为本发明语音翻译方法另一个实施例的流程图;
图4为本发明语音翻译方法另一个实施例的流程图;
图5为本发明语音翻译方法中翻译界面另一个实施例的示意图;
图6为本发明语音翻译装置一个实施例的结构示意图;
图7为本发明语音翻译装置另一个实施例的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1为本发明语音翻译方法一个实施例的流程图,如图1所示,该语音翻译方法可以包括:
步骤101,接收用户通过语音搜索界面输入的语音翻译请求,上述语音翻译请求中包括待翻译的语音和上述待翻译的语音的目的翻译语种。
本实施例中,用户需要翻译时,可以直接在搜索引擎的语音搜索界面中输入语音翻译请求,举例来说,用户可以直接在语音搜索界面中输入语音“去明洞怎么走的韩文翻译”,其中,“去明洞怎么走”即为待翻译的语音,而“韩文”即为上述待翻译的语音的目的翻译语种。
步骤102,将上述待翻译的语音转化为文字,并对转化的文字进行意图识别,获得上述待翻译的语音的意图。
具体地,搜索引擎接收到上述语音翻译请求之后,将上述语音翻译请求中的待翻译的语音转化为文字,并对转化的文字进行意图识别,获得上述待翻译的语音的意图。
上例中,用户输入的待翻译的语音转化的文字为“去明洞怎么走”,对转化的文字进行意图识别,可以获得“去明洞怎么走”的意图为询问到旅游地点“明洞”的路线。
步骤103,调用上述意图所属类别的翻译库将上述转化的文字翻译成上述目的翻译语种的文字。
举例来说,上例中,“去明洞怎么走”的意图为询问到旅游地点“明洞”的路线,因此可以确定“去明洞怎么走”的意图所属的类别为旅游类,所以可以调用旅游类翻译库,将待翻译的语音转化的文字“去明洞怎么走”翻译成韩语的文字。
其中,上述旅游类翻译库的建立过程可以为:接入旅游类垂直网站中旅游常用语的英语、韩语和日语等语种的标准翻译,结合翻译类产品,建立旅游类翻译库。上述旅游类翻译库中可以包括旅游垂直网站提供的常用旅游用语、搜索推荐联想输入(sug)的纠错和/或景点数据库引导等。
以上以旅游类翻译库的建立过程为例对翻译库的建立过程进行了说明,其他类别翻译库的建立过程与之类似,在此不再赘述。
步骤104,通过翻译界面展示上述目的翻译语种的文字。
本实施例中,翻译界面的一个示例可以如图2所示,图2为本发明语音翻译方法中翻译界面一个实施例的示意图,图2中,21所指方框中的文字即为“去明洞怎么走”翻译成韩语的文字。
上述语音翻译方法中,接收用户通过语音搜索界面输入的语音翻译请求之后,将上述语音翻译请求中包括的待翻译的语音转化为文字,并对转化的文字进行意图识别,获得上述待翻译的语音的意图,然后调用上述意图所属类别的翻译库将上述转化的文字翻译成上述语音翻译请求中的目的翻译语种的文字,最后通过翻译界面展示上述目的翻译语种的文字,从而可以实现提高翻译的准确率,提升用户体验。
图3为本发明语音翻译方法另一个实施例的流程图,本实施例中,上述翻译界面还可以包括上述待翻译的语音的源语种至目的翻译语种的第一图标,参见图2,图2中,22所指的图标即为第一图标,这里以源语种为中文,目的翻译语种为韩文为例进行说明。
如图3所示,步骤104之后,还可以包括:
步骤301,在接收对上述第一图标的第一操作信息之后,接收上述用户再次输入的待翻译的语音,并重新执行步骤102~步骤104。
具体地,上述第一操作信息可以为点击操作,也可以为长按操作,本实施例对第一操作信息的具体操作形式不作限定。
这里,用户再次输入的待翻译的语音与用户上次输入的待翻译的语音(即用户在步骤101中输入的待翻译的语音)不同。
在接收到对第一图标的第一操作信息之后,搜索引擎接收上述用户再次输入的待翻译的语音,然后重新执行步骤102~步骤104,将用户再次输入的待翻译的语音翻译为目的翻译语种的文字。
举例来说,用户在韩国旅游,想知道“去明洞怎么走”的韩文翻译,于是按照本发明图1所示实施例提供的方法,获得了“去明洞怎么走”的韩文翻译,然后用户将翻译界面上展示的韩文拿给在韩国懂韩语的另一用户看,如果另一用户表示不明白翻译界面上所展示的韩文的意思,那么该用户可以点击翻译界面上的第一图标,再次输入待翻译的语音,这时,用户再次输入的待翻译的语音可以为“我怎么去明洞”,请求将“我怎么去明洞”翻译为韩文,这里,用户再次输入的待翻译的语音与用户上次输入的待翻译的语音不同,但意图是基本相同的,这时搜索引擎可以再次执行步骤102~步骤104,将用户再次输入的待翻译的语音翻译为目的翻译语种的文字。
图4为本发明语音翻译方法另一个实施例的流程图,本实施例中,上述翻译界面还包括上述目的翻译语种至上述待翻译的语音的源语种的第二图标,参见图2,图2中,23所指的图标即为第二图标,这里同样以源语种为中文,目的翻译语种为韩文为例进行说明。
如图4所示,步骤104之后,还可以包括:
步骤401,在接收对第二图标的第二操作信息之后,接收除上述用户之外的另一用户输入的属于上述目的翻译语种的语音。
其中,上述第二操作信息可以为点击操作,也可以为长按操作,本实施例对第二操作信息的具体操作形式不作限定。
其中,另一用户输入的语音可以为用户输入的待翻译的语音所包含问题的答案。
步骤402,将上述另一用户输入的语音转化为文字,并对转化的文字进行意图识别,获得上述另一用户输入的语音的意图。
步骤403,调用上述意图所属类别的翻译库将上述转化的文字翻译成上述源语种的文字。
步骤404,通过翻译界面展示上述源语种的文字。
举例来说,用户在韩国旅游,想知道“去明洞怎么走”的韩文翻译,于是按照本发明图1所示实施例提供的方法,获得了“去明洞怎么走”的韩文翻译,然后用户将翻译界面上展示的韩文拿给在韩国懂韩语的另一用户看,如果另一用户明白了翻译界面上所展示的韩文的意思,那么另一用户可以点击翻译界面上的第二图标,然后通过韩语输入去明洞的具体行走路线,接收到另一用户输入的语音之后,搜索引擎可以执行步骤402~步骤403,将另一用户输入的韩语语音翻译成中文的文字,然后在翻译界面展示上述中文的文字,如图5所示,图5为本发明语音翻译方法中翻译界面另一个实施例的示意图,图5中,51所指方框中的内容即为另一用户输入的语音所转化的韩语文字,52所指方框中的内容即为上述转化的韩语文字翻译成的中文文字。
可以理解的是,图4所示实施例可以与图3所示实施例结合,也就是说,通过图3所示实施例,当再次翻译的目的翻译语种的文字能够被懂上述目的翻译语种的另一用户理解时,另一用户同样可以通过图4所示实施例提供的方法给出用户输入的待翻译的语音所包含问题的答案。
从图3和图4所示实施例可以看出,本发明提供的语音翻译方法可以实现以对话流的形式引导用户进行不同语种的交流,使两个语言不通的用户可以进行通畅便捷的沟通和无障碍的交流,大大提升了用户体验。
进一步地,如图2和图5所示,上述翻译界面中还可以包括上述语音翻译请求转化的文字,参见图2,图2中,25所指方框中的文字即为用户输入的语音翻译请求“‘去明洞怎么走’的韩文翻译”所转化的文字。
本发明提供的语音翻译方法还可以包括:当上述语音翻译请求转化的文字中包括实体名称时,接收上述用户对上述实体名称的第三操作信息;根据上述第三操作信息发起对被操作的实体名称的搜索。
具体地,上述实体名称可以为景点、建筑物、人名和/或艺术品等的名称。其中,上述第三操作信息可以为点击操作或长按操作等,本实施例对第三操作信息的具体操作形式不作限定。
举例来说,参见图2,“‘去明洞怎么走’的韩文翻译”所转化的文字中包括实体名称“明洞”,这是一旅游景点的名称,接收到用户对所转化的文字中“明洞”的第三操作信息之后,搜索引擎可以发起对“明洞”的搜索,并跳转到景点查询界面展示“明洞”的相关搜索结果。
另外,如图2所示,上述翻译界面中还可以包括上述实体名称关联的引导问题选项;图2中,24所指方框中的内容即为实体名称关联的引导问题选项,由于图2中的实体名称为明洞,因此24所指方框中的内容为明洞关联的引导问题选项。
本发明提供的语音翻译方法还可以包括:接收用户对上述实体名称关联的引导问题选项的第四操作信息;根据上述第四操作信息,发起对被操作的引导问题选项的搜索。
其中,上述第四操作信息可以为点击操作或长按操作等,本实施例对第四操作信息的具体操作形式不作限定。
举例来说,接收到用户对“最近的公交车站”这一引导问题选项的第四操作信息之后,搜索引擎可以发起对“最近的公交车站”的搜索,并可以跳转到搜索结果页展示距离明洞最近的公交车站的搜索结果。
也就是说,本发明实施例提供的语音翻译方法可以根据用户输入的内容推荐用户下一步可能会询问的问题,从而可以使用户在获得精确的翻译的同时还可以了解其他扩展信息。
图6为本发明语音翻译装置一个实施例的结构示意图,本实施例中的语音翻译装置可以作为搜索引擎,或搜索引擎的一部分实现本发明图1所示实施例的流程,如图6所示,该语音翻译装置可以包括:接收模块61、语音识别模块62、翻译模块63和展示模块64;
其中,接收模块61,用于接收用户通过语音搜索界面输入的语音翻译请求,上述语音翻译请求中包括待翻译的语音和上述待翻译的语音的目的翻译语种;本实施例中,用户需要翻译时,可以直接在搜索引擎的语音搜索界面中输入语音翻译请求,举例来说,用户可以直接在语音搜索界面中输入语音“去明洞怎么走的韩文翻译”,其中,“去明洞怎么走”即为待翻译的语音,而“韩文”即为上述待翻译的语音的目的翻译语种。
语音识别模块62,用于将接收模块61接收的上述待翻译的语音转化为文字,并对转化的文字进行意图识别,获得上述待翻译的语音的意图;具体地,接收模块61接收到上述语音翻译请求之后,语音识别模块62将上述语音翻译请求中的待翻译的语音转化为文字,并对转化的文字进行意图识别,获得上述待翻译的语音的意图。
上例中,用户输入的待翻译的语音转化的文字为“去明洞怎么走”,语音识别模块62对转化的文字进行意图识别,可以获得“去明洞怎么走”的意图为询问到旅游地点“明洞”的路线。
翻译模块63,用于调用上述意图所属类别的翻译库将语音识别模块62转化的文字翻译成上述目的翻译语种的文字;举例来说,上例中,“去明洞怎么走”的意图为询问到旅游地点“明洞”的路线,因此可以确定“去明洞怎么走”的意图所属的类别为旅游类,所以翻译模块63可以调用旅游类翻译库,将待翻译的语音转化的文字“去明洞怎么走”翻译成韩语的文字。
其中,上述旅游类翻译库的建立过程可以为:接入旅游类垂直网站中旅游常用语的英语、韩语和日语等语种的标准翻译,结合翻译类产品,建立旅游类翻译库。上述旅游类翻译库中可以包括旅游垂直网站提供的常用旅游用语、搜索推荐联想输入(sug)的纠错和/或景点数据库引导等。
以上以旅游类翻译库的建立过程为例对翻译库的建立过程进行了说明,其他类别翻译库的建立过程与之类似,在此不再赘述。
展示模块64,用于通过翻译界面展示上述目的翻译语种的文字。本实施例中,翻译界面的一个示例可以如图2所示,图2中,21所指方框中的文字即为“去明洞怎么走”翻译成韩语的文字。
上述语音翻译装置中,接收模块61接收用户通过语音搜索界面输入的语音翻译请求之后,语音识别模块62将上述语音翻译请求中包括的待翻译的语音转化为文字,并对转化的文字进行意图识别,获得上述待翻译的语音的意图,然后翻译模块63调用上述意图所属类别的翻译库将上述转化的文字翻译成上述语音翻译请求中的目的翻译语种的文字,最后展示模块64通过翻译界面展示上述目的翻译语种的文字,从而可以实现提高翻译的准确率,提升用户体验。
进一步地,上述翻译界面还可以包括上述待翻译的语音的源语种至所述目的翻译语种的第一图标,参见图2,图2中,22所指的图标即为第一图标,这里以源语种为中文,目的翻译语种为韩文为例进行说明。
这时,接收模块61,还用于在展示模块64通过翻译界面展示上述目的翻译语种的文字之后,接收对上述第一图标的第一操作信息,以及接收上述用户再次输入的待翻译的语音,其中,上述用户再次输入的待翻译的语音与上述用户上次输入的待翻译的语音不同。具体地,上述第一操作信息可以为点击操作,也可以为长按操作,本实施例对第一操作信息的具体操作形式不作限定。
在接收模块61接收到对第一图标的第一操作信息之后,接收模块61接收上述用户再次输入的待翻译的语音,然后语音识别模块62、翻译模块63和展示模块64重新将用户再次输入的待翻译的语音翻译为目的翻译语种的文字。
举例来说,用户在韩国旅游,想知道“去明洞怎么走”的韩文翻译,于是按照本发明图1所示实施例提供的方法,获得了“去明洞怎么走”的韩文翻译,然后用户将翻译界面上展示的韩文拿给在韩国懂韩语的另一用户看,如果另一用户表示不明白翻译界面上所展示的韩文的意思,那么该用户可以点击翻译界面上的第一图标,再次输入待翻译的语音,这时,用户再次输入的待翻译的语音可以为“我怎么去明洞”,请求将“我怎么去明洞”翻译为韩文,这里,用户再次输入的待翻译的语音与用户上次输入的待翻译的语音不同,但意图是基本相同的,接收模块61接收到用户再次输入的待翻译的语音之后,语音识别模块62、翻译模块63和展示模块64可以各自执行各自的功能,将用户再次输入的待翻译的语音翻译为目的翻译语种的文字。
进一步地,上述翻译界面还可以包括上述目的翻译语种至上述待翻译的语音的源语种的第二图标;参见图2,图2中,23所指的图标即为第二图标,这里同样以源语种为中文,目的翻译语种为韩文为例进行说明。
接收模块61,还用于在展示模块64通过翻译界面展示上述目的翻译语种的文字之后,接收对上述第二图标的第二操作信息,以及接收除上述用户之外的另一用户输入的属于上述目的翻译语种的语音,另一用户输入的语音包括上述用户输入的待翻译的语音所包含问题的答案;其中,上述第二操作信息可以为点击操作,也可以为长按操作,本实施例对第二操作信息的具体操作形式不作限定。
语音识别模块62,还用于将接收模块61接收的另一用户输入的语音转化为文字,并对转化的文字进行意图识别,获得另一用户输入的语音的意图。
翻译模块63,还用于调用上述意图所属类别的翻译库将语音识别模块62转化的文字翻译成上述源语种的文字。
展示模块64,还用于通过翻译界面展示上述源语种的文字。
举例来说,用户在韩国旅游,想知道“去明洞怎么走”的韩文翻译,于是按照本发明图1所示实施例提供的方法,获得了“去明洞怎么走”的韩文翻译,然后用户将翻译界面上展示的韩文拿给在韩国懂韩语的另一用户看,如果另一用户明白了翻译界面上所展示的韩文的意思,那么另一用户可以点击翻译界面上的第二图标,然后通过韩语输入去明洞的具体行走路线,接收模块61接收到另一用户输入的语音之后,语音识别模块62和翻译模块63可以各自执行各自的功能,将另一用户输入的韩语语音翻译成中文的文字,然后展示模块64在翻译界面展示上述中文的文字,如图5所示,图5中,51所指方框中的内容即为另一用户输入的语音所转化的韩语文字,52所指方框中的内容即为上述转化的韩语文字翻译成的中文文字。
也就是说,上述语音翻译装置可以实现以对话流的形式引导用户进行不同语种的交流,使两个语言不通的用户可以进行通畅便捷的沟通和无障碍的交流,大大提升了用户体验。
图7为本发明语音翻译装置另一个实施例的结构示意图,与图6所示的语音翻译装置相比,不同之处在于,图7所示的语音翻译装置中,上述翻译界面还可以包括上述语音翻译请求转化的文字;参见图2,图2中,25所指方框中的文字即为用户输入的语音翻译请求“‘去明洞怎么走’的韩文翻译”所转化的文字。
接收模块61,还用于当上述语音翻译请求转化的文字中包括实体名称时,接收上述用户对上述实体名称的第三操作信息;具体地,上述实体名称可以为景点、建筑物、人名和/或艺术品等的名称。其中,上述第三操作信息可以为点击操作或长按操作等,本实施例对第三操作信息的具体操作形式不作限定。
上述语音翻译装置还可以包括:
搜索模块65,用于根据接收模块61接收的第三操作信息发起对被操作的实体名称的搜索。
举例来说,参见图2,“‘去明洞怎么走’的韩文翻译”所转化的文字中包括实体名称“明洞”,这是一旅游景点的名称,接收模块61接收到用户对所转化的文字中“明洞”的第三操作信息之后,搜索模块65可以发起对“明洞”的搜索,并跳转到景点查询界面展示“明洞”的相关搜索结果。
另外,上述翻译界面还可以包括上述实体名称关联的引导问题选项;图2中,24所指方框中的内容即为实体名称关联的引导问题选项,由于图2中的实体名称为明洞,因此24所指方框中的内容为明洞关联的引导问题选项。
接收模块61,还用于接收上述用户对上述实体名称关联的引导问题选项的第四操作信息;其中,上述第四操作信息可以为点击操作或长按操作等,本实施例对第四操作信息的具体操作形式不作限定。
搜索模块65,还用于根据接收模块61接收的第四操作信息,发起对被操作的引导问题选项的搜索。
举例来说,接收模块61接收到用户对“最近的公交车站”这一引导问题选项的第四操作信息之后,搜索模块65可以发起对“最近的公交车站”的搜索,并可以跳转到搜索结果页展示距离明洞最近的公交车站的搜索结果。
也就是说,本发明实施例提供的语音翻译装置可以根据用户输入的内容推荐用户下一步可能会询问的问题,从而可以使用户在获得精确的翻译的同时还可以了解其他扩展信息。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(Programmable Gate Array;以下简称:PGA),现场可编程门阵列(Field ProgrammableGate Array;以下简称:FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种语音翻译方法,其特征在于,包括:
接收用户通过语音搜索界面输入的语音翻译请求,所述语音翻译请求中包括待翻译的语音和所述待翻译的语音的目的翻译语种;
将所述待翻译的语音转化为文字,并对转化的文字进行意图识别,获得所述待翻译的语音的意图;
调用所述意图所属类别的翻译库将所述转化的文字翻译成所述目的翻译语种的文字;
通过翻译界面展示所述目的翻译语种的文字。
2.根据权利要求1所述的方法,其特征在于,所述翻译界面还包括所述待翻译的语音的源语种至所述目的翻译语种的第一图标;
所述通过翻译界面展示所述目的翻译语种的文字之后,还包括:
在接收对所述第一图标的第一操作信息之后,接收所述用户再次输入的待翻译的语音,其中,所述用户再次输入的待翻译的语音与所述用户上次输入的待翻译的语音不同,并重新执行所述将所述待翻译的语音转化为文字的步骤及其后续步骤。
3.根据权利要求1或2所述的方法,其特征在于,所述翻译界面还包括所述目的翻译语种至所述待翻译的语音的源语种的第二图标;
所述通过翻译界面展示所述目的翻译语种的文字之后,还包括:
在接收对所述第二图标的第二操作信息之后,接收除所述用户之外的另一用户输入的属于所述目的翻译语种的语音,所述另一用户输入的语音包括所述用户输入的待翻译的语音所包含问题的答案;
将所述另一用户输入的语音转化为文字,并对转化的文字进行意图识别,获得所述另一用户输入的语音的意图;
调用所述意图所属类别的翻译库将所述转化的文字翻译成所述源语种的文字;
通过翻译界面展示所述源语种的文字。
4.根据权利要求1所述的方法,其特征在于,所述翻译界面还包括所述语音翻译请求转化的文字;
所述方法还包括:
当所述语音翻译请求转化的文字中包括实体名称时,接收所述用户对所述实体名称的第三操作信息;
根据所述第三操作信息发起对被操作的实体名称的搜索。
5.根据权利要求4所述的方法,其特征在于,所述翻译界面还包括所述实体名称关联的引导问题选项;
所述方法还包括:
接收所述用户对所述实体名称关联的引导问题选项的第四操作信息;
根据所述第四操作信息,发起对被操作的引导问题选项的搜索。
6.一种语音翻译装置,其特征在于,包括:
接收模块,用于接收用户通过语音搜索界面输入的语音翻译请求,所述语音翻译请求中包括待翻译的语音和所述待翻译的语音的目的翻译语种;
语音识别模块,用于将所述接收模块接收的所述待翻译的语音转化为文字,并对转化的文字进行意图识别,获得所述待翻译的语音的意图;
翻译模块,用于调用所述意图所属类别的翻译库将所述语音识别模块转化的文字翻译成所述目的翻译语种的文字;
展示模块,用于通过翻译界面展示所述目的翻译语种的文字。
7.根据权利要求6所述的装置,其特征在于,所述翻译界面还包括所述待翻译的语音的源语种至所述目的翻译语种的第一图标;
所述接收模块,还用于在所述展示模块通过翻译界面展示所述目的翻译语种的文字之后,接收对所述第一图标的第一操作信息,以及接收所述用户再次输入的待翻译的语音,其中,所述用户再次输入的待翻译的语音与所述用户上次输入的待翻译的语音不同。
8.根据权利要求6或7所述的装置,其特征在于,所述翻译界面还包括所述目的翻译语种至所述待翻译的语音的源语种的第二图标;
所述接收模块,还用于在所述展示模块通过翻译界面展示所述目的翻译语种的文字之后,接收对所述第二图标的第二操作信息,以及接收除所述用户之外的另一用户输入的属于所述目的翻译语种的语音,所述另一用户输入的语音包括所述用户输入的待翻译的语音所包含问题的答案;
所述语音识别模块,还用于将所述接收模块接收的另一用户输入的语音转化为文字,并对转化的文字进行意图识别,获得所述另一用户输入的语音的意图;
所述翻译模块,还用于调用所述意图所属类别的翻译库将所述语音识别模块转化的文字翻译成所述源语种的文字;
所述展示模块,还用于通过翻译界面展示所述源语种的文字。
9.根据权利要求6所述的装置,其特征在于,所述翻译界面还包括所述语音翻译请求转化的文字;
所述接收模块,还用于当所述语音翻译请求转化的文字中包括实体名称时,接收所述用户对所述实体名称的第三操作信息;
所述语音翻译装置还包括:
搜索模块,用于根据所述接收模块接收的第三操作信息发起对被操作的实体名称的搜索。
10.根据权利要求9所述的装置,其特征在于,所述翻译界面还包括所述实体名称关联的引导问题选项;
所述接收模块,还用于接收所述用户对所述实体名称关联的引导问题选项的第四操作信息;
所述搜索模块,还用于根据所述接收模块接收的第四操作信息,发起对被操作的引导问题选项的搜索。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510401147.6A CN104991892B (zh) | 2015-07-09 | 2015-07-09 | 语音翻译方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510401147.6A CN104991892B (zh) | 2015-07-09 | 2015-07-09 | 语音翻译方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104991892A true CN104991892A (zh) | 2015-10-21 |
CN104991892B CN104991892B (zh) | 2018-10-23 |
Family
ID=54303708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510401147.6A Active CN104991892B (zh) | 2015-07-09 | 2015-07-09 | 语音翻译方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104991892B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105912534A (zh) * | 2016-05-09 | 2016-08-31 | 珠海市魅族科技有限公司 | 一种翻译方法和装置 |
CN106486125A (zh) * | 2016-09-29 | 2017-03-08 | 安徽声讯信息技术有限公司 | 一种基于语音识别技术的同声传译系统 |
CN107220242A (zh) * | 2017-04-19 | 2017-09-29 | 广东小天才科技有限公司 | 一种基于翻译笔的翻译方法、装置及系统 |
CN107273365A (zh) * | 2017-05-17 | 2017-10-20 | 百度在线网络技术(北京)有限公司 | 内容分发的显示方法、装置和计算机设备 |
CN107273364A (zh) * | 2017-05-15 | 2017-10-20 | 百度在线网络技术(北京)有限公司 | 一种语音翻译方法和装置 |
CN107590137A (zh) * | 2017-08-07 | 2018-01-16 | 北京小米移动软件有限公司 | 翻译方法、装置及计算机可读存储介质 |
CN107833577A (zh) * | 2017-11-29 | 2018-03-23 | 宋晓成 | 一种语音实时多语言翻译记录方法 |
CN107993646A (zh) * | 2016-10-25 | 2018-05-04 | 北京分音塔科技有限公司 | 一种实现实时语音互译的方法 |
CN110427455A (zh) * | 2019-06-24 | 2019-11-08 | 卓尔智联(武汉)研究院有限公司 | 一种客服服务方法、装置和存储介质 |
CN110462730A (zh) * | 2018-03-07 | 2019-11-15 | 谷歌有限责任公司 | 促进以多种语言与自动化助理的端到端沟通 |
WO2021016345A1 (en) * | 2019-07-23 | 2021-01-28 | Dalce Reginald | Intent-based language translation |
US11354521B2 (en) | 2018-03-07 | 2022-06-07 | Google Llc | Facilitating communications with automated assistants in multiple languages |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101025735A (zh) * | 2006-02-20 | 2007-08-29 | 株式会社东芝 | 用于通过不同语言之间的翻译来支持交流的装置和方法 |
CN101114283A (zh) * | 2006-07-28 | 2008-01-30 | 陈修志 | 旅游机 |
CN101211335A (zh) * | 2006-12-27 | 2008-07-02 | 乐金电子(中国)研究开发中心有限公司 | 具有翻译功能的移动通信终端、翻译系统和翻译方法 |
CN101266600A (zh) * | 2008-05-07 | 2008-09-17 | 陈光火 | 多媒体多语言互动同步翻译方法 |
CN101281518A (zh) * | 2007-03-28 | 2008-10-08 | 株式会社东芝 | 语音翻译装置和方法 |
CN101655876A (zh) * | 2009-09-17 | 2010-02-24 | 广东国笔科技股份有限公司 | 一种基于语义分析的智能检索系统及方法 |
CN103246643A (zh) * | 2012-02-10 | 2013-08-14 | 株式会社东芝 | 语音翻译装置和语音翻译方法 |
CN103744843A (zh) * | 2013-12-25 | 2014-04-23 | 北京百度网讯科技有限公司 | 一种在线语音翻译方法及装置 |
KR20140049922A (ko) * | 2012-10-18 | 2014-04-28 | 한국전자통신연구원 | 사용자 정보를 이용한 다국어 자동통역기의 언어인식 장치 |
-
2015
- 2015-07-09 CN CN201510401147.6A patent/CN104991892B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101025735A (zh) * | 2006-02-20 | 2007-08-29 | 株式会社东芝 | 用于通过不同语言之间的翻译来支持交流的装置和方法 |
CN101114283A (zh) * | 2006-07-28 | 2008-01-30 | 陈修志 | 旅游机 |
CN101211335A (zh) * | 2006-12-27 | 2008-07-02 | 乐金电子(中国)研究开发中心有限公司 | 具有翻译功能的移动通信终端、翻译系统和翻译方法 |
CN101281518A (zh) * | 2007-03-28 | 2008-10-08 | 株式会社东芝 | 语音翻译装置和方法 |
CN101266600A (zh) * | 2008-05-07 | 2008-09-17 | 陈光火 | 多媒体多语言互动同步翻译方法 |
CN101655876A (zh) * | 2009-09-17 | 2010-02-24 | 广东国笔科技股份有限公司 | 一种基于语义分析的智能检索系统及方法 |
CN103246643A (zh) * | 2012-02-10 | 2013-08-14 | 株式会社东芝 | 语音翻译装置和语音翻译方法 |
KR20140049922A (ko) * | 2012-10-18 | 2014-04-28 | 한국전자통신연구원 | 사용자 정보를 이용한 다국어 자동통역기의 언어인식 장치 |
CN103744843A (zh) * | 2013-12-25 | 2014-04-23 | 北京百度网讯科技有限公司 | 一种在线语音翻译方法及装置 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105912534A (zh) * | 2016-05-09 | 2016-08-31 | 珠海市魅族科技有限公司 | 一种翻译方法和装置 |
CN106486125A (zh) * | 2016-09-29 | 2017-03-08 | 安徽声讯信息技术有限公司 | 一种基于语音识别技术的同声传译系统 |
CN107993646A (zh) * | 2016-10-25 | 2018-05-04 | 北京分音塔科技有限公司 | 一种实现实时语音互译的方法 |
CN107220242A (zh) * | 2017-04-19 | 2017-09-29 | 广东小天才科技有限公司 | 一种基于翻译笔的翻译方法、装置及系统 |
CN107273364A (zh) * | 2017-05-15 | 2017-10-20 | 百度在线网络技术(北京)有限公司 | 一种语音翻译方法和装置 |
CN107273365A (zh) * | 2017-05-17 | 2017-10-20 | 百度在线网络技术(北京)有限公司 | 内容分发的显示方法、装置和计算机设备 |
CN107590137A (zh) * | 2017-08-07 | 2018-01-16 | 北京小米移动软件有限公司 | 翻译方法、装置及计算机可读存储介质 |
CN107833577A (zh) * | 2017-11-29 | 2018-03-23 | 宋晓成 | 一种语音实时多语言翻译记录方法 |
US10984784B2 (en) | 2018-03-07 | 2021-04-20 | Google Llc | Facilitating end-to-end communications with automated assistants in multiple languages |
CN110462730A (zh) * | 2018-03-07 | 2019-11-15 | 谷歌有限责任公司 | 促进以多种语言与自动化助理的端到端沟通 |
CN110462730B (zh) * | 2018-03-07 | 2021-03-30 | 谷歌有限责任公司 | 促进以多种语言与自动化助理的端到端沟通 |
US11354521B2 (en) | 2018-03-07 | 2022-06-07 | Google Llc | Facilitating communications with automated assistants in multiple languages |
US11915692B2 (en) | 2018-03-07 | 2024-02-27 | Google Llc | Facilitating end-to-end communications with automated assistants in multiple languages |
US11942082B2 (en) | 2018-03-07 | 2024-03-26 | Google Llc | Facilitating communications with automated assistants in multiple languages |
CN110427455A (zh) * | 2019-06-24 | 2019-11-08 | 卓尔智联(武汉)研究院有限公司 | 一种客服服务方法、装置和存储介质 |
WO2021016345A1 (en) * | 2019-07-23 | 2021-01-28 | Dalce Reginald | Intent-based language translation |
Also Published As
Publication number | Publication date |
---|---|
CN104991892B (zh) | 2018-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104991892A (zh) | 语音翻译方法和装置 | |
WO2020215554A1 (zh) | 语音识别方法、装置、设备及计算机可读存储介质 | |
CN110428818B (zh) | 低资源多语言的语音识别模型、语音识别方法 | |
US11328708B2 (en) | Speech error-correction method, device and storage medium | |
JP6362603B2 (ja) | テキストを修正するための方法、システム、およびコンピュータ・プログラム | |
CN108305634A (zh) | 解码方法、解码器及存储介质 | |
CN105869640B (zh) | 识别针对当前页面中的实体的语音控制指令的方法和装置 | |
KR20180005850A (ko) | 자동 통역 방법 및 장치, 및 기계 번역 방법 및 장치 | |
US20140324424A1 (en) | Method for providing a supplementary voice recognition service and apparatus applied to same | |
CN105931644A (zh) | 一种语音识别方法及移动终端 | |
CN106683662A (zh) | 一种语音识别方法和装置 | |
CN103268313A (zh) | 一种自然语言的语义解析方法及装置 | |
KR20220004224A (ko) | 음성 인식을 위한 컨텍스트 바이어싱 | |
JP6675788B2 (ja) | 検索結果表示装置、検索結果表示方法、及びプログラム | |
US20190057082A1 (en) | Semantic disambiguation method, device, server and storage medium | |
CN111369974B (zh) | 一种方言发音标注方法、语言识别方法及相关装置 | |
CN109616096A (zh) | 多语种语音解码图的构建方法、装置、服务器和介质 | |
CN109785829B (zh) | 一种基于语音控制的客服辅助方法和系统 | |
CN103914539A (zh) | 信息查询方法和装置 | |
US20190237071A1 (en) | Voice recognition method, device and server | |
CN112818680B (zh) | 语料的处理方法、装置、电子设备及计算机可读存储介质 | |
CN110517668A (zh) | 一种中英文混合语音识别系统及方法 | |
CN111613215A (zh) | 一种语音识别的方法及其装置 | |
KR20220127361A (ko) | 비디오 번역 방법 및 장치, 저장 매체 및 전자 디바이스 | |
US11893813B2 (en) | Electronic device and control method therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |