CN110059313B - 翻译处理方法和装置 - Google Patents

翻译处理方法和装置 Download PDF

Info

Publication number
CN110059313B
CN110059313B CN201910266420.7A CN201910266420A CN110059313B CN 110059313 B CN110059313 B CN 110059313B CN 201910266420 A CN201910266420 A CN 201910266420A CN 110059313 B CN110059313 B CN 110059313B
Authority
CN
China
Prior art keywords
document
information
target
explained
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910266420.7A
Other languages
English (en)
Other versions
CN110059313A (zh
Inventor
何中军
熊皓
王京涛
张传强
李芝
吴华
王海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910266420.7A priority Critical patent/CN110059313B/zh
Publication of CN110059313A publication Critical patent/CN110059313A/zh
Application granted granted Critical
Publication of CN110059313B publication Critical patent/CN110059313B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本申请提出一种翻译处理方法和装置,其中,方法包括:通过根据第二用户使用的目标语言对第一用户的原始语言文档进行翻译生成目标文档,并将目标文档显示给第二用户;在第一用户对原始语言文档进行讲解的过程中,获取已讲解文档片段的语音信息,并对语音信息进行语义解析,获取已讲解文档片段的语义信息;根据已讲解文档片段的语义信息确定是否对目标文档中未讲解文档片段的翻译内容进行调整。由此,通过实时对已讲解文档片段的语音信息进行解析,获取已讲解文档片段的语义信息来更新未讲解文档片段的翻译内容,提升用户使用体验。

Description

翻译处理方法和装置
技术领域
本申请涉及数据处理技术领域,尤其涉及一种翻译处理方法和装置。
背景技术
目前,在一些国际会议中,演讲者除了现场演讲之外,还会投放对应的演讲稿,帮助听众能够更好的理解演讲内容。相关技术中,直接使用翻译引擎对演讲稿离线进行翻译。
然而,上述方式中,现有的文件翻译都是提前将演讲稿翻译好,演讲稿的翻译内容并不会随着演讲者演讲内容动态调整,所以会出现一些术语翻译前后不一致的情况。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请提出一种翻译处理方法和装置,用于解决现有技术中演讲稿的翻译内容并不会随着演讲者演讲内容动态调整,出现一些术语翻译前后不一致的情况,导致用户理解错误等技术问题,通过实时对已讲解文档片段的语音信息进行解析,实时调整未讲解文档片段的翻译内容,动态的调整术语翻译信息,做到全部讲解内容的术语一致性,给用户提供良好的用户体验。
为达上述目的,本申请第一方面实施例提出了一种翻译处理方法,包括:
根据第二用户使用的目标语言对第一用户的原始语言文档进行翻译生成目标文档,并将所述目标文档显示给所述第二用户;
在所述第一用户对所述原始语言文档进行讲解的过程中,获取已讲解文档片段的语音信息,并对所述语音信息进行语义解析,获取所述已讲解文档片段的语义信息;
根据所述已讲解文档片段的语义信息确定是否对所述目标文档中未讲解文档片段的翻译内容进行调整。
本实施例的翻译处理方法,通过根据第二用户使用的目标语言对第一用户的原始语言文档进行翻译生成目标文档,并将目标文档显示给第二用户,在第一用户对原始语言文档进行讲解的过程中,获取已讲解文档片段的语音信息,并对语音信息进行语义解析,获取已讲解文档片段的语义信息,最后根据已讲解文档片段的语义信息确定是否对目标文档中未讲解文档片段的翻译内容进行调整。由此,通过实时对已讲解文档片段的语音信息进行解析,获取已讲解文档片段的语义信息来更新未讲解文档片段的翻译内容,从而提高翻译的准确性,提升用户使用体验。
为达上述目的,本申请第二方面实施例提出了一种翻译处理装置,包括:
生成显示模块,用于根据第二用户使用的目标语言对第一用户的原始语言文档进行翻译生成目标文档,并将所述目标文档显示给所述第二用户;
获取模块,用于在所述第一用户对所述原始语言文档进行讲解的过程中,获取已讲解文档片段的语音信息;
解析模块,用于对所述语音信息进行语义解析,获取所述已讲解文档片段的语义信息;
处理模块,用于根据所述已讲解文档片段的语义信息确定是否对所述目标文档中未讲解文档片段的翻译内容进行调整。
本实施例的翻译处理装置,通过根据第二用户使用的目标语言对第一用户的原始语言文档进行翻译生成目标文档,并将目标文档显示给第二用户,在第一用户对原始语言文档进行讲解的过程中,获取已讲解文档片段的语音信息,并对语音信息进行语义解析,获取已讲解文档片段的语义信息,最后根据已讲解文档片段的语义信息确定是否对目标文档中未讲解文档片段的翻译内容进行调整。由此,通过实时对已讲解文档片段的语音信息进行解析,获取已讲解文档片段的语义信息来更新未讲解文档片段的翻译内容,从而提高翻译的准确性,提升用户使用体验。
为达上述目的,本申请第三方面实施例提出了一种计算机设备,包括:处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如第一方面实施例所述的翻译处理方法。
为达上述目的,本申请第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例所述的翻译处理方法。
为达上述目的,本申请第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,实现如第一方面实施例所述的翻译处理方法。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例所提供的一种翻译处理方法的流程示意图;
图2为本申请实施例所提供的另一种翻译处理方法的流程示意图;
图3为本申请实施例所提供的一种翻译处理方法的示例图;
图4为本申请实施例所提供的文本翻译引擎的结构示意图;
图5为本申请实施例所提供的语音翻译引擎的结构示意图;
图6为本申请实施例所提供的一种翻译处理装置的结构示意图;
图7为本申请实施例所提供的另一种翻译处理装置的结构示意图;
图8为本申请实施例所提供的又一种翻译处理装置的结构示意图;以及
图9为本申请实施例所提供的计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的翻译处理方法和装置。
图1为本申请实施例所提供的一种翻译处理方法的流程示意图。
如图1所示,该翻译处理方法可以包括以下步骤:
步骤101,根据第二用户使用的目标语言对第一用户的原始语言文档进行翻译生成目标文档,并将目标文档显示给第二用户。
在实际应用中,在讲解的过程中,通过投放对应的文档,帮助用户能够更好的理解讲解内容,基于背景技术的描述,现有技术中,通过提前将文档进行翻译提供给用户,翻译好的内容不能够随着讲解内容进行动态调整,比如会出现术语不一致等问题,导致用户理解错误,不能够正确理解讲解内容等问题。
针对上述问题,本申请提出一种翻译处理方法,通过实时对已讲解文档片段的语音信息进行解析,实时调整未讲解文档片段的翻译内容,动态的调整术语翻译信息,做到全部讲解内容的术语一致性,给用户提供良好的用户体验。
具体地,本申请中第二用户为听众,第一用户为讲解者,其中,第一用户和第二用户都可以为一个或者多个。
还可以理解的是,不同的第二用户使用的目标语言可以是一样的也可以是不一样的,比如第二用户A使用的目标语言为德语,将第一用户的原始语言文档进行翻译成德语的目标文档显示给第二用户,再比如第二用户A使用的目标语言为日语,将第一用户的原始语言文档进行翻译成日语的目标文档显示给第二用户。
需要说明的是,第一用户的原始语言文档中的原始语言与第二用户使用的目标语言一致,则不需要进行翻译,直接将将原始语言文档显示给第二用户。
步骤102,在第一用户对原始语言文档进行讲解的过程中,获取已讲解文档片段的语音信息,并对语音信息进行语义解析,获取已讲解文档片段的语义信息。
具体地,第一用户对原始语言文档进行讲解的过程中,可以实时获取已讲解文档片段的语音信息,比如通过相关语音收集设备实时收集已讲解文档片段的语音信息。
进一步地,对语音信息进行语义解析,获取已讲解文档片段的语义信息,可以理解的是,对语音信息进行解析的方式有很多种,作为一种示例,将语音信息输入预设的语音解析模型中直接对语音信息进行解析,其中,预设的语音解析模型是预先通过大量的语音信息样本进行训练生成的;作为另一种示例,实时获取已讲解语句语音,并对语句语音进行语义解析生成语句语义信息,将多个语句语义信息进行相加处理生成已讲解文档片段的语义信息。
步骤103,根据已讲解文档片段的语义信息确定是否对目标文档中未讲解文档片段的翻译内容进行调整。
具体地,已讲解文档片段的语义信息与已经翻译的目标文档中的未讲解文档片段的语义信息一致,或者已讲解文档片段的语义信息与已经翻译的目标文档中的未讲解文档片段的语义信息不一致。
因此,在已讲解文档片段的语义信息与已经翻译的目标文档中的未讲解文档片段的语义信息不一致的情况下,动态的调整未讲解文档片段的翻译内容,做到全部讲解内容的术语一致性,给用户提供良好的用户体验。
本实施例的翻译处理方法,通过根据第二用户使用的目标语言对第一用户的原始语言文档进行翻译生成目标文档,并将目标文档显示给第二用户,在第一用户对原始语言文档进行讲解的过程中,获取已讲解文档片段的语音信息,并对语音信息进行语义解析,获取已讲解文档片段的语义信息,最后根据已讲解文档片段的语义信息确定是否对目标文档中未讲解文档片段的翻译内容进行调整。由此,通过实时对已讲解文档片段的语音信息进行解析,获取已讲解文档片段的语义信息来更新未讲解文档片段的翻译内容,从而提高翻译的准确性,提升用户使用体验。
基于上述实施例的描述,可以针对第一用户讲解内容进行实时语音翻译和语音合成,具体如图2所示,包括:
步骤201,将语音信息转换为文本信息。
步骤202,根据第二用户使用的目标语言对文本信息进行翻译生成翻译文本信息。
步骤203,对翻译文本信息进行处理生成目标语音信息。
具体地,将已讲解文档片段的语音信息进行语音文本转换生成文本信息,并根据第二用户使用的目标语言对文本信息进行翻译生成翻译文本信息,也就是第二用户能够读懂的语言的翻译文本信息,最后对翻译文本信息进行处理生成目标语音信息,也就是说该目标语音信息是第二用户能够听懂的。
为了进一步提高语音翻译的准确性,实时获取已讲解语句语音,根据目标文档的翻译内容对翻译文本信息进行调整生成目标文本信息,也就是说集合未讲解文档片段的翻译内容对翻译文本信息进行调整提高目标文本信息的准确性,最后对目标文本信息进行处理生成目标语音信息。
由此,利用目标文档的翻译内容来辅助同声传译提高翻译质量,相当于提前获得了讲解内容,能够从一定程度上进行全局的讲解内容进行分析。
为了本领域人员更加清楚上述过程,下面结合具体例子进行详细说明,比如当第一用户讲解原始语言文档中的第一页内容时,能够获取更多的第一用户的语音信息,进而修改全局的语义信息,在翻译第二页的内容时可以对一些信息进行调整。
具体地,如图3所示,文本翻译引擎主要负责原始语言文档的翻译工作,具体结构如图4所示,采用端到端Encoder-Decoder神经网络模型框架进行搭建,和传统的标准框架不同,增加了两个全局信息multi-headattention模块,其中,一个来自提前获取的原始语言文档的内容,另外一个是实时更新的multi-headattention模块,其中的内容来自于翻动原始语言文档中的下页之前所接收到的第一用户语音讲解内容。其中,图4中的PPTMemory内容为用户提供的原始语言文档的语义信息;SpeechMemory为当前翻页之前所接收到语音信息转化为文本后的语义累加信息。
具体地,加入当前语音文本对应的语义信息为∑e1,e2,..,en,其中n为当前已经识别的第n个词,而e则为其对应的语义表示,将SpeechMemory的值设置为∑e1,e2,..,en,取当前所有词的语义相加结果作为接收到语音信息的语义信息。
由此,采用了上述两个额外的multi-headattention模块,文本翻译引擎能根据当前已讲解内容实时调整下一页的翻译结果,做到更准确的文本翻译,为用户提供更好的用户体验。
图3中的语音翻译引擎主要是对第一用户的语音信号进行语音识别,然后进行多语种翻译,并将翻译的文本实时进行语音合成,推送对应的语音信号给对应的观众,其具体结构如图5所示,采用端到端Encoder-Decoder框架进行设计,并且额外增加一个来自于原始语言文档的内容,新增的PPTMemory可以提供额外的演讲内容全局信息,更好的辅助当前语音识别后文本的翻译,进而提升整体的翻译质量。
需要说明的是,翻译引擎不局限于特定的网络结构,上述图4和图5是为了解释方便和易于理解采用了转换的结构进行描述,如果采用RNN模型,也可以类似的加入额外的全局内存信息进行语义建模。
由此,纯自动化解决方案,可以节省人力成本,采用多模态输入后,利用原始语言文档的输入信息,能够提高语音翻译的准确率,采用实时语音翻译的结果后,能够实时更新目标文档翻译的全局语义信息,确保术语等全局信息翻译更一致。
为了实现上述实施例,本申请还提出一种翻译处理装置。
图6为本申请实施例所提供的一种翻译处理装置的结构示意图。
如图6所示,该翻译处理装置可以包括:生成显示模块610、获取模块620解析模块630、和处理模块640。其中,
生成显示模块610,用于根据第二用户使用的目标语言对第一用户的原始语言文档进行翻译生成目标文档,并将目标文档显示给第二用户。
获取模块620,用于在第一用户对原始语言文档进行讲解的过程中,获取已讲解文档片段的语音信息。
解析模块630,用于对语音信息进行语义解析,获取已讲解文档片段的语义信息。
处理模块640,用于根据已讲解文档片段的语义信息确定是否对目标文档中未讲解文档片段的翻译内容进行调整。
在本申请实施例一种可能的实现方式中,解析模块630,具体用于:实时获取已讲解语句语音,并对语句语音进行语义解析生成语句语义信息;将多个语句语义信息进行相加处理生成已讲解文档片段的语义信息。。
在本申请实施例一种可能的实现方式中,处理模块640,具体用于:判断已讲解文档片段的语义信息与目标文档中未讲解文档片段的语义信息是否一致;若已讲解文档片段的语义信息与目标文档中未讲解文档片段的语义信息不一致,则对目标文档中未讲解文档片段的翻译内容进行调整。
在本申请实施例一种可能的实现方式中,如图7所示,在图6的基础上还包括:转换模块650、翻译模块660和生成模块670。
其中,转换模块650,用于将语音信息转换为文本信息。
翻译模块660,用于根据第二用户使用的目标语言对文本信息进行翻译生成翻译文本信息。
生成模块670,用于对翻译文本信息进行处理生成目标语音信息。
在本申请实施例一种可能的实现方式中,如图8所示,在图7的基础上还包括:调整模块680,用于根据目标文档的翻译内容对翻译文本信息进行调整生成目标文本信息。
生成模块670,具体用于:对目标文本信息进行处理生成目标语音信息。
需要说明的是,前述对翻译处理方法实施例的解释说明也适用于该实施例的翻译处理装置,其实现原理类似,此处不再赘述。
本申请实施例的翻译处理装置,通过根据第二用户使用的目标语言对第一用户的原始语言文档进行翻译生成目标文档,并将目标文档显示给第二用户,在第一用户对原始语言文档进行讲解的过程中,获取已讲解文档片段的语音信息,并对语音信息进行语义解析,获取已讲解文档片段的语义信息,最后根据已讲解文档片段的语义信息确定是否对目标文档中未讲解文档片段的翻译内容进行调整。由此,通过实时对已讲解文档片段的语音信息进行解析,获取已讲解文档片段的语义信息来更新未讲解文档片段的翻译内容,从而提高翻译的准确性,提升用户使用体验。
通过为了实现上述实施例,本申请还提出一种计算机设备,包括:处理器和存储器。其中,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于实现如前述实施例所述的翻译处理方法。
图9为本申请实施例所提供的计算机设备的结构示意图,示出了适于用来实现本申请实施方式的示例性计算机设备90的框图。图9显示的计算机设备90仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图9所示,计算机设备90以通用计算机设备的形式表现。计算机设备90的组件可以包括但不限于:一个或者多个处理器或者处理单元906,系统存储器910,连接不同系统组件(包括系统存储器910和处理单元906)的总线908。
总线908表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备90典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备90访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器910可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)911和/或高速缓存存储器912。计算机设备90可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统913可以用于读写不可移动的、非易失性磁介质(图9未显示,通常称为“硬盘驱动器”)。尽管图9中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc ReadOnly Memory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线908相连。系统存储器910可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。
具有一组(至少一个)程序模块9140的程序/实用工具914,可以存储在例如系统存储器910中,这样的程序模块9140包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块9140通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备90也可以与一个或多个外部设备10(例如键盘、指向设备、显示器100等)通信,还可与一个或者多个使得用户能与该终端设备90交互的设备通信,和/或与使得该计算机设备90能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口902进行。并且,计算机设备90还可以通过网络适配器900与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图9所示,网络适配器900通过总线908与计算机设备90的其它模块通信。应当明白,尽管图9中未示出,可以结合计算机设备90使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元906通过运行存储在系统存储器910中的程序,从而执行各种功能应用以及翻译处理,例如实现前述实施例中提及的翻译处理方法。
为了实现上述实施例,本申请还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现如前述实施例所述的翻译处理方法。
为了实现上述实施例,本申请还提出一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,实现如前述实施例所述的翻译处理方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (12)

1.一种翻译处理方法,其特征在于,包括以下步骤:
根据第二用户使用的目标语言对第一用户的原始语言文档进行翻译生成目标文档,并将所述目标文档显示给所述第二用户;
在所述第一用户对所述原始语言文档进行讲解的过程中,获取已讲解文档片段的语音信息,并对所述语音信息进行语义解析,获取所述已讲解文档片段的语义信息;
根据所述已讲解文档片段的语义信息确定是否对所述目标文档中未讲解文档片段的翻译内容进行调整。
2.如权利要求1所述的方法,其特征在于,所述对所述语音信息进行语义解析,包括:
实时获取已讲解语句语音,并对所述语句语音进行语义解析生成语句语义信息;
将多个所述语句语义信息进行相加处理生成所述已讲解文档片段的语义信息。
3.如权利要求1所述的方法,其特征在于,所述根据所述已讲解文档片段的语义信息确定是否对所述目标文档中未讲解文档片段的翻译内容进行调整,包括:
判断所述已讲解文档片段的语义信息与所述目标文档中未讲解文档片段的语义信息是否一致;
若所述已讲解文档片段的语义信息与所述目标文档中未讲解文档片段的语义信息不一致,则对所述目标文档中未讲解文档片段的翻译内容进行调整。
4.如权利要求1所述的方法,其特征在于,还包括:
将所述语音信息转换为文本信息;
根据第二用户使用的目标语言对所述文本信息进行翻译生成翻译文本信息;
对所述翻译文本信息进行处理生成目标语音信息。
5.如权利要求4所述的方法,其特征在于,还包括:
根据所述目标文档的翻译内容对所述翻译文本信息进行调整生成目标文本信息;
对所述翻译文本信息进行处理生成目标语音信息,包括:
对所述目标文本信息进行处理生成所述目标语音信息。
6.一种翻译处理装置,其特征在于,包括:
生成显示模块,用于根据第二用户使用的目标语言对第一用户的原始语言文档进行翻译生成目标文档,并将所述目标文档显示给所述第二用户;
获取模块,用于在所述第一用户对所述原始语言文档进行讲解的过程中,获取已讲解文档片段的语音信息;
解析模块,用于对所述语音信息进行语义解析,获取所述已讲解文档片段的语义信息;
处理模块,用于根据所述已讲解文档片段的语义信息确定是否对所述目标文档中未讲解文档片段的翻译内容进行调整。
7.如权利要求6所述的装置,其特征在于,所述解析模块,具体用于:
实时获取已讲解语句语音,并对所述语句语音进行语义解析生成语句语义信息;
将多个所述语句语义信息进行相加处理生成所述已讲解文档片段的语义信息。
8.如权利要求6所述的装置,其特征在于,所述处理模块,具体用于:
判断所述已讲解文档片段的语义信息与所述目标文档中未讲解文档片段的语义信息是否一致;
若所述已讲解文档片段的语义信息与所述目标文档中未讲解文档片段的语义信息不一致,则对所述目标文档中未讲解文档片段的翻译内容进行调整。
9.如权利要求6所述的装置,其特征在于,还包括:
转换模块,用于将所述语音信息转换为文本信息;
翻译模块,用于根据第二用户使用的目标语言对所述文本信息进行翻译生成翻译文本信息;
生成模块,用于对所述翻译文本信息进行处理生成目标语音信息。
10.如权利要求9所述的装置,其特征在于,还包括:
调整模块,用于根据所述目标文档的翻译内容对所述翻译文本信息进行调整生成目标文本信息;
所述生成模块,具体用于:
对所述目标文本信息进行处理生成所述目标语音信息。
11.一种计算机设备,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-5中任一项所述的翻译处理方法。
12.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一项所述的翻译处理方法。
CN201910266420.7A 2019-04-03 2019-04-03 翻译处理方法和装置 Active CN110059313B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910266420.7A CN110059313B (zh) 2019-04-03 2019-04-03 翻译处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910266420.7A CN110059313B (zh) 2019-04-03 2019-04-03 翻译处理方法和装置

Publications (2)

Publication Number Publication Date
CN110059313A CN110059313A (zh) 2019-07-26
CN110059313B true CN110059313B (zh) 2021-02-12

Family

ID=67318239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910266420.7A Active CN110059313B (zh) 2019-04-03 2019-04-03 翻译处理方法和装置

Country Status (1)

Country Link
CN (1) CN110059313B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111382577B (zh) * 2020-03-11 2023-05-02 北京字节跳动网络技术有限公司 文档翻译方法、装置、电子设备、及存储介质
CN112528012B (zh) * 2020-11-27 2023-08-29 北京百度网讯科技有限公司 生成文档记录的方法、装置、电子设备、及存储介质
CN112711954B (zh) * 2020-12-31 2024-03-22 维沃软件技术有限公司 翻译方法、装置、电子设备和存储介质
CN114239613B (zh) * 2022-02-23 2022-08-02 阿里巴巴达摩院(杭州)科技有限公司 实时语音翻译方法、装置、设备及存储介质
CN116911323B (zh) * 2023-09-13 2024-03-26 深圳市微克科技股份有限公司 一种智能穿戴设备的实时翻译方法、系统及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107844470A (zh) * 2016-09-18 2018-03-27 腾讯科技(深圳)有限公司 一种语音数据处理方法及其设备
CN107992485A (zh) * 2017-11-27 2018-05-04 北京搜狗科技发展有限公司 一种同声传译方法及装置
CN108615527A (zh) * 2018-05-10 2018-10-02 腾讯科技(深圳)有限公司 基于同声传译的数据处理方法、装置和存储介质
CN108628859A (zh) * 2018-04-25 2018-10-09 合肥上城信息技术有限公司 一种实时语音翻译系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9734820B2 (en) * 2013-11-14 2017-08-15 Nuance Communications, Inc. System and method for translating real-time speech using segmentation based on conjunction locations
GB2558062A (en) * 2016-11-18 2018-07-04 Lionbridge Tech Inc Collection strategies that facilitate arranging portions of documents into content collections

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107844470A (zh) * 2016-09-18 2018-03-27 腾讯科技(深圳)有限公司 一种语音数据处理方法及其设备
CN107992485A (zh) * 2017-11-27 2018-05-04 北京搜狗科技发展有限公司 一种同声传译方法及装置
CN108628859A (zh) * 2018-04-25 2018-10-09 合肥上城信息技术有限公司 一种实时语音翻译系统
CN108615527A (zh) * 2018-05-10 2018-10-02 腾讯科技(深圳)有限公司 基于同声传译的数据处理方法、装置和存储介质

Also Published As

Publication number Publication date
CN110059313A (zh) 2019-07-26

Similar Documents

Publication Publication Date Title
CN110059313B (zh) 翻译处理方法和装置
KR102401942B1 (ko) 번역품질 평가 방법 및 장치
US20180366107A1 (en) Method and device for training acoustic model, computer device and storage medium
CN101630448B (zh) 语言学习客户端及系统
JP6362603B2 (ja) テキストを修正するための方法、システム、およびコンピュータ・プログラム
CN110175335B (zh) 翻译模型的训练方法和装置
EP2966601A1 (en) Comprehension assistance system, comprehension assistance server, comprehension assistance method, and computer-readable recording medium
CN110211570B (zh) 同声传译处理方法、装置及设备
CN109102824B (zh) 基于人机交互的语音纠错方法和装置
CN109256133A (zh) 一种语音交互方法、装置、设备及存储介质
CN111522971A (zh) 一种直播教学中辅助用户听课的方法及装置
EP4322029A1 (en) Method and apparatus for generating video corpus, and related device
KR20220127361A (ko) 비디오 번역 방법 및 장치, 저장 매체 및 전자 디바이스
CN113035199A (zh) 音频处理方法、装置、设备及可读存储介质
CN109858005B (zh) 基于语音识别的文档更新方法、装置、设备及存储介质
CN110853627B (zh) 用于语音标注的方法及系统
CN113225612A (zh) 字幕生成方法、装置、计算机可读存储介质及电子设备
KR20180039371A (ko) 자동 통역 시스템
CN109657127B (zh) 一种答案获取方法、装置、服务器及存储介质
CN112542163B (zh) 智能语音交互方法、设备及存储介质
CN115983294A (zh) 翻译模型的训练方法、翻译方法及设备
US20230352009A1 (en) Streaming punctuation for long-form dictation
CN112233661B (zh) 基于语音识别的影视内容字幕生成方法、系统及设备
MXPA04004142A (es) Soporte de pronunciacion dinamica para entrenamiento de reconocimiento de los idiomas japones y chino.
CN111652005A (zh) 汉语与乌尔都语同步互译系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant