CN106649288A - 基于人工智能的翻译方法和装置 - Google Patents
基于人工智能的翻译方法和装置 Download PDFInfo
- Publication number
- CN106649288A CN106649288A CN201611138600.XA CN201611138600A CN106649288A CN 106649288 A CN106649288 A CN 106649288A CN 201611138600 A CN201611138600 A CN 201611138600A CN 106649288 A CN106649288 A CN 106649288A
- Authority
- CN
- China
- Prior art keywords
- language
- candidate
- word
- translation
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/49—Data-driven translation using very large corpora, e.g. the web
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本发明提出一种基于人工智能的翻译方法和装置,其中,方法包括:通过获取用户输入的从源语言翻译至目标语言的待翻译文本,其中,待翻译文本中包括目标语言词语,以及源语言词语,在确定翻译源语言词语的各候选词语之后,根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。由于用户可以在不确定翻译是否准确时,通过输入确定准确的目标语言词语,以及输入一部分不确定翻译是否准确的源语言词语,解决现有技术中翻译方式不灵活的技术问题。
Description
技术领域
本发明涉及语言处理技术领域,尤其涉及一种基于人工智能的翻译方法和装置。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。
在现有技术中对,语言进行翻译时,只能由翻译软件将整个句子从源语言翻译为目标语言。但由于目前的翻译软件还不能够做到完全准确的翻译,因此,需要用户针对翻译软件所翻译的文本进行改动,尤其是在翻译软件所翻译的文本采用的句式与用户所需要的句式不同时,用户所需进行的改动就更多。同时,整句翻译的方式,还可能会损失掉用户想要由目标语言表达的内容,翻译的准确度也不高,因此,现有技术中的翻译方法,不仅翻译方式不够灵活,不能够满足用户的翻译需求,而且翻译的准确度也不高。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于人工智能的翻译方法和装置,以实现提高翻译准确度,增加翻译方式的灵活性,以满足用户的翻译需求。
本发明的第二个目的在于提出一种基于人工智能的翻译装置。
本发明的第三个目的在于提出另一种基于人工智能的翻译装置。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种基于人工智能的翻译方法,包括:
获取用户输入的从源语言翻译至目标语言的待翻译文本,所述待翻译文本中包括目标语言词语,以及源语言词语;
将所述待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译所述源语言词语的各候选词语,以及所述各候选词语的置信度;
利用所述各候选词语分别替换所述待翻译文本中对应的源语言词语,与所述目标语言词语组合,得到各候选译文;
将所述候选译文输入预先训练的所述目标语言的语言模型,预测所述候选译文采用所述候选词语翻译后,形成通顺文本的语言概率;
根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。
本发明实施例的基于人工智能的翻译方法,通过获取用户输入的从源语言翻译至目标语言的待翻译文本,其中,待翻译文本中包括目标语言词语,以及源语言词语,将待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译源语言词语的各候选词语,以及各候选词语的置信度,将各候选词语分别与目标语言词语组合,得到各候选译文,进而将候选译文输入预先训练的目标语言的语言模型,预测候选译文采用该候选词语后,形成通顺文本的语言概率,根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。由于用户可以在不确定翻译是否准确时,通过输入确定准确的目标语言词语,以及输入一部分不确定翻译是否准确的源语言词语,解决现有技术中翻译方式不灵活的技术问题。
为达上述目的,本发明第二方面实施例提出了一种基于人工智能的翻译装置,包括:
获取模块,用于获取用户输入的从源语言翻译至目标语言的待翻译文本,所述待翻译文本中包括目标语言词语,以及源语言词语;
翻译模块,用于将所述待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译所述源语言词语的各候选词语,以及所述各候选词语的置信度;
组合模块,用于利用所述各候选词语分别替换所述待翻译文本中对应的源语言词语,与所述目标语言词语组合,得到各候选译文;
预测模块,用于将所述候选译文输入预先训练的所述目标语言的语言模型,预测所述候选译文采用所述候选词语翻译后,形成通顺文本的语言概率;
推荐模块,用于根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。
本发明实施例的基于人工智能的翻译装置,通过获取用户输入的从源语言翻译至目标语言的待翻译文本,其中,待翻译文本中包括目标语言词语,以及源语言词语,将待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译源语言词语的各候选词语,以及各候选词语的置信度,将各候选词语分别与目标语言词语组合,得到各候选译文,进而将候选译文输入预先训练的目标语言的语言模型,预测候选译文采用该候选词语后,形成通顺文本的语言概率,根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。由于用户可以在不确定翻译是否准确时,通过输入确定准确的目标语言词语,以及输入一部分不确定翻译是否准确的源语言词语,解决现有技术中翻译方式不灵活的技术问题。
为达上述目的,本发明第三方面实施例提出了另一种基于人工智能的翻译装置,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为:
获取用户输入的从源语言翻译至目标语言的待翻译文本,所述待翻译文本中包括目标语言词语,以及源语言词语;
将所述待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译所述源语言词语的各候选词语,以及所述各候选词语的置信度;
利用所述各候选词语分别替换所述待翻译文本中对应的源语言词语,与所述目标语言词语组合,得到各候选译文;
将所述候选译文输入预先训练的所述目标语言的语言模型,预测所述候选译文采用所述候选词语翻译后,形成通顺文本的语言概率;
根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。
为了实现上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器的处理器被执行时,使得服务器能够执行一种基于人工智能的翻译方法,所述方法包括:
获取用户输入的从源语言翻译至目标语言的待翻译文本,所述待翻译文本中包括目标语言词语,以及源语言词语;
将所述待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译所述源语言词语的各候选词语,以及所述各候选词语的置信度;
利用所述各候选词语分别替换所述待翻译文本中对应的源语言词语,与所述目标语言词语组合,得到各候选译文;
将所述候选译文输入预先训练的所述目标语言的语言模型,预测所述候选译文采用所述候选词语翻译后,形成通顺文本的语言概率;
根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。
为了实现上述目的,本发明第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于人工智能的翻译方法,所述方法包括:
获取用户输入的从源语言翻译至目标语言的待翻译文本,所述待翻译文本中包括目标语言词语,以及源语言词语;
将所述待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译所述源语言词语的各候选词语,以及所述各候选词语的置信度;
利用所述各候选词语分别替换所述待翻译文本中对应的源语言词语,与所述目标语言词语组合,得到各候选译文;
将所述候选译文输入预先训练的所述目标语言的语言模型,预测所述候选译文采用所述候选词语翻译后,形成通顺文本的语言概率;
根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例所提供的一种基于人工智能的翻译方法的流程示意图;
图2为本发明实施例提供的另一种基于人工智能的翻译方法的流程示意图;
图3为中英语料的示意图;
图4为目标词语的显示示意图之一;
图5为目标词语的显示示意图之二;
图6为本发明实施例提供的一种基于人工智能的翻译装置的结构示意图;
图7为本发明实施例提供的另一种基于人工智能的翻译装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的基于人工智能的翻译方法和装置。
图1为本发明实施例所提供的一种基于人工智能的翻译方法的流程示意图。
如图1所示,该基于人工智能的翻译方法包括以下步骤:
步骤101,获取用户输入的从源语言翻译至目标语言的待翻译文本。
其中,待翻译文本中包括目标语言词语,以及源语言词语。
从源语言翻译至目标语言的过程中,用户在不确定译文的情况下,可以输入包括至少一段目标语言词语以及至少一段源语言词语的待翻译文本,其中,源语言词语是用户不确定如何进行翻译,等待推荐目标词语的词语;目标语言词语是用户已确定翻译方式,无需进行推荐的词语。
步骤102,将待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译源语言词语的各候选词语,以及各候选词语的置信度。
具体地,预先利用所述目标语言和所述源语言的双语料库,对所述翻译模型进行训练,以确定具有语义对应关系的源语言词语和目标语言词语,以及所述目标语言词语准确翻译所述源语言词语的置信度。从而将待翻译文本输入预先训练的目标语言和源语言的翻译模型之后,便可以确定用于翻译源语言词语的各候选词语,以及各候选词语的置信度。
其中,置信度是根据在双语料库中,采用该目标语言词语翻译该源语言词语的次数,占翻译源语言词语的总次数之比。
步骤103,利用各候选词语分别替换待翻译文本中对应的源语言词语,与目标语言词语组合,得到各候选译文。
一般来说,候选词语为多个,针对每一个候选词语,替换待翻译文本中对应的源语言词语,从而使得该候选词语与目标语言词语进行组合,构成一段候选译文。这段候选译文中仅包含目标语言。
步骤104,将候选译文输入预先训练的目标语言的语言模型,预测候选译文采用候选词语翻译后,形成通顺文本的语言概率。
具体地,预先利用所述目标语言的语料库,对所述目标语言的语言模型进行训练,其中,这里的目标语言的语料库是根据所述目标语言的学术会议、期刊和/或论文进行构建的。从而,使得语言模型学习到目标语言的语料,将各候选译文分别输入预先训练的所述目标语言的语言模型之后,便可以预测出候选译文采用该候选词语翻译后,形成通顺文本的语言概率。
其中,语言模型为n-gram语言模型,n-gram语言模型是大词语连续语音识别中常用的一种语言模型,另外本实施例中所采用的语言模型还可以是神经网络语言模型RNN-LM(Recurrent Neural Network Language Model)。
步骤105,根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。
具体地,针对每一个候选词语,将采用候选词语进行翻译的候选译文的语言概率,和该候选词语的置信度进行加权求和,得到所述候选词语的总概率,依据所述总概率对各候选词语进行排序,从各候选词语中选择目标词语进行推荐。
一般来说,所推荐的目标词语的个数为至少两个,可以将所选择的至少两个目标词语,按照总概率由大到小的顺序依次显示在对应源语言词语的下方,并且,在每一个目标词语旁以进度条形式指示目标词语的总概率。
本实施例中,通过获取用户输入的从源语言翻译至目标语言的待翻译文本,其中,待翻译文本中包括目标语言词语,以及源语言词语,将待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译源语言词语的各候选词语,以及各候选词语的置信度,将各候选词语分别与目标语言词语组合,得到各候选译文,进而将候选译文输入预先训练的目标语言的语言模型,预测候选译文采用该候选词语后,形成通顺文本的语言概率,根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。由于用户可以在不确定翻译是否准确时,通过输入确定准确的目标语言词语,以及输入一部分不确定翻译是否准确的源语言词语,解决现有技术中翻译方式不灵活的技术问题。
为了清楚说明上一实施例,本实施例提供了另一种基于人工智能的翻译方法,用于在英语和中文之间进行翻译的应用场景中,也就是说,本实施例中的源语言具体为中文,目标语言具体为英语,图2为本发明实施例提供的另一种基于人工智能的翻译方法的流程示意图,如图2所示,该基于人工智能的翻译方法可以包括以下步骤:
步骤201,获取用户输入的待翻译文本。
用户采用英文进行写作的过程中,若存在不确定用法的单词时,可以在多段英文词语中插入中文词语,从而待翻译文本中不仅包括多段英文词语,还会包含中文词语。
例如:“提出”这个词在英文中具有多种表达方式,若在一句话中,用户不确定具体采用哪一种表达方式,用户可以输入“This paper提出an optimized algorithm”,从而寻求“提出”这个词的最佳译文。
步骤202,将待翻译文本输入预先训练的中英的翻译模型,确定英文的各候选词语,以及各候选词语的置信度。
具体地,翻译模型预先经过了训练,在训练过程中,通过对双语语料进行分词处理,以及对齐之后,可以从中抽取出每一个中文词语对应翻译至的英文词语,图3为中英语料的示意图,在图3中,通过连线确定中文词语对应的英文词语,由于在双语语料库中存在大量的这种双语语料,从而针对一个中文词语,可以查询到对应的多个英文词语,将这多个英文词语作为候选词语,并由此可以计算出每一个英文词语用于翻译这个中文词语的概率,即每一个候选词语的置信度。
例如:在公式中,O(e,f)表示英文词语e用于翻译中文词语f的次数,e’表示用于翻译中文词语f的英文词语集合,表示英文词语集合中的各词语e’翻译中文词语f的总次数。在前述公式中,P(e|f)表示英文词语e用于翻译中文词语f的置信度。
步骤203,将英文的候选词语结合待翻译文本中的英文上下文,生成候选译文,利用预先训练的所述目标语言的语言模型,预测候选译文采用候选词语后形成通顺文本的语言概率。
其中,语言模型的作用是预测一个句子符合语言表达习惯的流利程度。
例如:针对待翻译文本“This paper提出an optimized algorithm”,上一步骤中,可以获得“提出”的候选词语为“describes”和“introduces”,从而生成的候选译文可以是“This paper introduces”,以及“This paper describes”。将生成的候选译文利用语言模型进行预测,其中,ei表示候选译文中的第i个词语,e1,e2,……,ei-1表示ei的英文上下文,具体为候选译文中的ei之前出现的英文词语。
利用这个语言模型计算出P(introduces|This paper)和P(describes|Thispaper),作为一种可能的结果,P(introduces|This paper)>P(describes|This paper),表示“This paper”后面是“introduces”的概率要大于“describes”。
步骤204,根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择出目标词语。
具体地,根据公式S(E)=α×LM(E)+β×P(e|f),计算候选词语的总概率,其中,权重参数α和β,可以根据实际需要在满足α+β=1的条件下,参考最小错误率的方式进行调节。
步骤205,向用户端推荐目标词语。
具体地,可以在用户端显示如图4所示的样式,将所选择的至少两个目标词语,按照所述总概率由大到小的顺序依次显示在对应源语言词语的下方;其中,在每一个目标词语旁以进度条形式指示所述目标词语的总概率,从而便于用户参考。
本实施例中仅列举了待翻译文本中包含一段源语言词语的情况,作为一种可能的应用场景,用户所输入的待翻译文本中可以包括多段源语言词语,从而需要针对每一个源语言词语执行输入翻译模型,确定候选词语及其置信度,并计算全部源语言词语的候选词语组合所得到的候选词语组合的总置信度其中,i’表示源语言词语的排序,ei’表示第i’个源语言词语fi’对应的目标语言词语。进而,将候选词语组合结合上下文生成候选译文预测候选译文的语言概率,最终根据总置信度和语言概率计算总概率,并依据总概率,推荐总概率排序在前的若干个候选词语组合中的各目标词语。
例如:用户输入“This paper提出a新方法”,包含两段源语言词语,分别为“提出”和“新方法”,参考前述方法得到总概率如下:
S(This paper proposes a novel method)=α×LM(This paper proposes anovel method)+β×(P(proposes|提出)+P(novel method|新方法));
其中,P(proposes|提出)和P(novel method|新方法)表示分别对应两段源语言词语的候选词语“proposes”、“novel method”及其置信度,LM(This paper proposes anovel method)表示“proposes”、“novel method”构成的候选词语组合翻译的候选译文的语言概率,S(This paper proposes a novel method)为候选词语组合的总概率。依据总概率排序,选择出若干个候选词语组合中的各目标词语,采用图5所提供的方式进行推荐。
本实施例中,通过获取用户输入的从源语言翻译至目标语言的待翻译文本,其中,待翻译文本中包括目标语言词语,以及源语言词语,将待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译源语言词语的各候选词语,以及各候选词语的置信度,将各候选词语分别与目标语言词语组合,得到各候选译文,进而将候选译文输入预先训练的目标语言的语言模型,预测候选译文采用该候选词语后,形成通顺文本的语言概率,根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。由于用户可以在不确定翻译是否准确时,通过输入确定准确的目标语言词语,以及输入一部分不确定翻译是否准确的源语言词语,解决现有技术中翻译方式不灵活的技术问题。
为了实现上述实施例,本发明还提出一种基于人工智能的翻译装置,图6为本发明实施例提供的一种基于人工智能的翻译装置的结构示意图。
如图6所示,该基于人工智能的翻译装置包括:获取模块51、翻译模块52、组合模块53、预测模块54和推荐模块55。
获取模块51,用于获取用户输入的从源语言翻译至目标语言的待翻译文本,所述待翻译文本中包括目标语言词语,以及源语言词语。
翻译模块52,用于将所述待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译所述源语言词语的各候选词语,以及所述各候选词语的置信度。
组合模块53,用于利用所述各候选词语分别替换所述待翻译文本中对应的源语言词语,与所述目标语言词语组合,得到各候选译文。
预测模块54,用于将所述候选译文输入预先训练的所述目标语言的语言模型,预测所述候选译文采用所述候选词语翻译后,形成通顺文本的语言概率。
推荐模块55,用于根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。
需要说明的是,前述对方法实施例的解释说明也适用于该实施例的装置,此处不再赘述。
基于上述实施例,本发明实施例还提供了另一种基于人工智能的翻译装置的可能的实现方式,图7为本发明实施例提供的另一种基于人工智能的翻译装置的结构示意图,在上一实施例的基础上,推荐模块55,包括:计算单元551和推荐单元552。
计算单元551,用于针对每一个候选词语,将所述候选词语翻译得到的候选译文的语言概率和所述候选词语的置信度进行加权求和,得到所述候选词语的总概率。
推荐单元552,用于依据所述总概率对各候选词语进行排序,从各候选词语中选择目标词语进行推荐。
进一步地,在本发明实施例的一种可能的实现方式中,目标词语的个数为至少两个。
基于此,推荐单元552,具体用于:将所选择的至少两个目标词语,按照所述总概率由大到小的顺序依次显示在对应源语言词语的下方;其中,在每一个目标词语旁以进度条形式指示所述目标词语的总概率。
进一步地,在本发明实施例的一种可能的实现方式中,基于人工智能的翻译装置还包括:翻译模型训练模块56和语言模型训练模块57。
翻译模型训练模块56,用于利用所述目标语言和所述源语言的双语料库,对所述翻译模型进行训练,以确定具有语义对应关系的源语言词语和目标语言词语,以及所述目标语言词语准确翻译所述源语言词语的置信度。其中,置信度是根据在所述双语料库中,采用所述目标语言词语翻译所述源语言词语的次数,占翻译所述源语言词语的总次数之比。
语言模型训练模块57,用于利用所述目标语言的语料库,对所述目标语言的语言模型进行训练;所述语料库是根据所述目标语言的学术会议、期刊和/或论文进行构建的。
其中,语言模型为n-gram语言模型或神经网络语言模型。
本发明实施例中,通过获取用户输入的从源语言翻译至目标语言的待翻译文本,其中,待翻译文本中包括目标语言词语,以及源语言词语,将待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译源语言词语的各候选词语,以及各候选词语的置信度,将各候选词语分别与目标语言词语组合,得到各候选译文,进而将候选译文输入预先训练的目标语言的语言模型,预测候选译文采用该候选词语后,形成通顺文本的语言概率,根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。由于用户可以在不确定翻译是否准确时,通过输入确定准确的目标语言词语,以及输入一部分不确定翻译是否准确的源语言词语,解决现有技术中翻译方式不灵活的技术问题。
为了实现上述实施例,本发明还提出另一种基于人工智能的翻译装置,包括:处理器,以及用于存储所述处理器可执行指令的存储器。
其中,处理器被配置为:
获取用户输入的从源语言翻译至目标语言的待翻译文本,所述待翻译文本中包括目标语言词语,以及源语言词语;
将所述待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译所述源语言词语的各候选词语,以及所述各候选词语的置信度;
利用所述各候选词语分别替换所述待翻译文本中对应的源语言词语,与所述目标语言词语组合,得到各候选译文;
将所述候选译文输入预先训练的所述目标语言的语言模型,预测所述候选译文采用所述候选词语翻译后,形成通顺文本的语言概率;
根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器的处理器被执行时,使得服务器能够执行一种基于人工智能的翻译方法,所述方法包括:获取用户输入的从源语言翻译至目标语言的待翻译文本,所述待翻译文本中包括目标语言词语,以及源语言词语;
将所述待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译所述源语言词语的各候选词语,以及所述各候选词语的置信度;
利用所述各候选词语分别替换所述待翻译文本中对应的源语言词语,与所述目标语言词语组合,得到各候选译文;
将所述候选译文输入预先训练的所述目标语言的语言模型,预测所述候选译文采用所述候选词语翻译后,形成通顺文本的语言概率;
根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。
为了实现上述实施例,本发明还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种基于人工智能的翻译方法,所述方法包括:
获取用户输入的从源语言翻译至目标语言的待翻译文本,所述待翻译文本中包括目标语言词语,以及源语言词语;
将所述待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译所述源语言词语的各候选词语,以及所述各候选词语的置信度;
利用所述各候选词语分别替换所述待翻译文本中对应的源语言词语,与所述目标语言词语组合,得到各候选译文;
将所述候选译文输入预先训练的所述目标语言的语言模型,预测所述候选译文采用所述候选词语翻译后,形成通顺文本的语言概率;
根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (14)
1.一种基于人工智能的翻译方法,其特征在于,包括以下步骤:
获取用户输入的从源语言翻译至目标语言的待翻译文本,所述待翻译文本中包括目标语言词语,以及源语言词语;
将所述待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译所述源语言词语的各候选词语,以及所述各候选词语的置信度;
利用所述各候选词语分别替换所述待翻译文本中对应的源语言词语,与所述目标语言词语组合,得到各候选译文;
将所述候选译文输入预先训练的所述目标语言的语言模型,预测所述候选译文采用所述候选词语翻译后,形成通顺文本的语言概率;
根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。
2.根据权利要求1所述的基于人工智能的翻译方法,其特征在于,所述根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐,包括:
针对每一个候选词语,将所述候选词语翻译得到的候选译文的语言概率和所述候选词语的置信度进行加权求和,得到所述候选词语的总概率;
依据所述总概率对各候选词语进行排序,从各候选词语中选择目标词语进行推荐。
3.根据权利要求2所述的基于人工智能的翻译方法,其特征在于,所述目标词语的个数为至少两个;所述选择目标词语进行推荐,包括:
将所选择的至少两个目标词语,按照所述总概率由大到小的顺序依次显示在对应源语言词语的下方;其中,在每一个目标词语旁,以进度条形式指示所述目标词语的总概率。
4.根据权利要求1-3任一项所述的基于人工智能的翻译方法,其特征在于,所述将所述待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译所述源语言词语的各候选词语,以及所述各候选词语的置信度之前,还包括:
利用所述目标语言和所述源语言的双语料库,对所述翻译模型进行训练,以确定具有语义对应关系的源语言词语和目标语言词语,以及所述目标语言词语准确翻译所述源语言词语的置信度。
5.根据权利要求4所述的基于人工智能的翻译方法,其特征在于,所述置信度是根据在所述双语料库中,采用所述目标语言词语翻译所述源语言词语的次数,占翻译所述源语言词语的总次数之比。
6.根据权利要求1-3任一项所述的基于人工智能的翻译方法,其特征在于,所述将所述候选译文输入预先训练的所述目标语言的语言模型,预测所述候选译文采用所述候选词语翻译后,形成通顺文本的语言概率之前,还包括:
利用所述目标语言的语料库,对所述目标语言的语言模型进行训练;所述语料库是根据所述目标语言的学术会议、期刊和/或论文进行构建的。
7.根据权利要求6所述的基于人工智能的翻译方法,其特征在于,所述语言模型为n-gram语言模型或神经网络语言模型。
8.一种基于人工智能的翻译装置,其特征在于,包括:
获取模块,用于获取用户输入的从源语言翻译至目标语言的待翻译文本,所述待翻译文本中包括目标语言词语,以及源语言词语;
翻译模块,用于将所述待翻译文本输入预先训练的目标语言和源语言的翻译模型,确定翻译所述源语言词语的各候选词语,以及所述各候选词语的置信度;
组合模块,用于利用所述各候选词语分别替换所述待翻译文本中对应的源语言词语,与所述目标语言词语组合,得到各候选译文;
预测模块,用于将所述候选译文输入预先训练的所述目标语言的语言模型,预测所述候选译文采用所述候选词语翻译后,形成通顺文本的语言概率;
推荐模块,用于根据采用候选词语翻译得到的候选译文的语言概率,以及候选词语的置信度,从各候选词语中选择目标词语进行推荐。
9.根据权利要求8所述的基于人工智能的翻译装置,其特征在于,所述推荐模块,包括:
计算单元,用于针对每一个候选词语,将所述候选词语翻译得到的候选译文的语言概率和所述候选词语的置信度进行加权求和,得到所述候选词语的总概率;
推荐单元,用于依据所述总概率对各候选词语进行排序,从各候选词语中选择目标词语进行推荐。
10.根据权利要求9所述的基于人工智能的翻译装置,其特征在于,所述目标词语的个数为至少两个;所述推荐单元,具体用于:
将所选择的至少两个目标词语,按照所述总概率由大到小的顺序依次显示在对应源语言词语的下方;其中,在每一个目标词语旁,以进度条形式指示所述目标词语的总概率。
11.根据权利要求8-10任一项所述的基于人工智能的翻译装置,其特征在于,所述装置,还包括:
翻译模型训练模块,用于利用所述目标语言和所述源语言的双语料库,对所述翻译模型进行训练,以确定具有语义对应关系的源语言词语和目标语言词语,以及所述目标语言词语准确翻译所述源语言词语的置信度。
12.根据权利要求11所述的基于人工智能的翻译装置,其特征在于,所述置信度是根据在所述双语料库中,采用所述目标语言词语翻译所述源语言词语的次数,占翻译所述源语言词语的总次数之比。
13.根据权利要求8-10任一项所述的基于人工智能的翻译装置,其特征在于,所述装置,还包括:
语言模型训练模块,用于利用所述目标语言的语料库,对所述目标语言的语言模型进行训练;所述语料库是根据所述目标语言的学术会议、期刊和/或论文进行构建的。
14.根据权利要求13所述的基于人工智能的翻译装置,其特征在于,所述语言模型为n-gram语言模型或神经网络语言模型。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611138600.XA CN106649288B (zh) | 2016-12-12 | 2016-12-12 | 基于人工智能的翻译方法和装置 |
US15/832,013 US10467349B2 (en) | 2016-12-12 | 2017-12-05 | Method and apparatus for translating based on artificial intelligence |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611138600.XA CN106649288B (zh) | 2016-12-12 | 2016-12-12 | 基于人工智能的翻译方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106649288A true CN106649288A (zh) | 2017-05-10 |
CN106649288B CN106649288B (zh) | 2020-06-23 |
Family
ID=58824590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611138600.XA Active CN106649288B (zh) | 2016-12-12 | 2016-12-12 | 基于人工智能的翻译方法和装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10467349B2 (zh) |
CN (1) | CN106649288B (zh) |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107193807A (zh) * | 2017-05-12 | 2017-09-22 | 北京百度网讯科技有限公司 | 基于人工智能的语言转换处理方法、装置及终端 |
CN108132932A (zh) * | 2017-12-27 | 2018-06-08 | 苏州大学 | 带有复制机制的神经机器翻译方法 |
CN109165389A (zh) * | 2018-07-23 | 2019-01-08 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN109558600A (zh) * | 2018-11-14 | 2019-04-02 | 北京字节跳动网络技术有限公司 | 翻译处理方法及装置 |
CN109558604A (zh) * | 2018-12-17 | 2019-04-02 | 北京百度网讯科技有限公司 | 一种机器翻译方法、装置、电子设备及存储介质 |
CN109558601A (zh) * | 2018-11-15 | 2019-04-02 | 苏州征之魂专利技术服务有限公司 | 一种专利数据俄文翻译方法 |
CN109558570A (zh) * | 2017-09-25 | 2019-04-02 | 三星电子株式会社 | 句生成方法和设备 |
CN109635305A (zh) * | 2018-12-17 | 2019-04-16 | 北京百度网讯科技有限公司 | 语音翻译方法及装置、设备及存储介质 |
CN109977430A (zh) * | 2019-04-04 | 2019-07-05 | 科大讯飞股份有限公司 | 一种文本翻译方法、装置及设备 |
CN110175335A (zh) * | 2019-05-08 | 2019-08-27 | 北京百度网讯科技有限公司 | 翻译模型的训练方法和装置 |
CN110245358A (zh) * | 2018-03-09 | 2019-09-17 | 北京搜狗科技发展有限公司 | 一种机器翻译方法及相关装置 |
CN110471597A (zh) * | 2019-07-25 | 2019-11-19 | 北京明略软件系统有限公司 | 一种数据标注方法和装置、计算机可读存储介质 |
CN110532573A (zh) * | 2018-12-29 | 2019-12-03 | 苏州七星天专利运营管理有限责任公司 | 一种翻译方法和系统 |
CN110765766A (zh) * | 2019-10-25 | 2020-02-07 | 北京中献电子技术开发有限公司 | 一种面向神经网络机器翻译的德文词法分析方法及系统 |
CN110852113A (zh) * | 2019-10-10 | 2020-02-28 | 林原 | 翻译方法、装置、设备及存储介质 |
CN110909552A (zh) * | 2018-09-14 | 2020-03-24 | 阿里巴巴集团控股有限公司 | 翻译方法及装置 |
CN111368556A (zh) * | 2020-03-05 | 2020-07-03 | 深圳市腾讯计算机系统有限公司 | 翻译模型的性能确定方法、置信度确定方法及装置 |
CN111460836A (zh) * | 2019-01-18 | 2020-07-28 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN111507112A (zh) * | 2019-01-31 | 2020-08-07 | 搜狗(杭州)智能科技有限公司 | 一种翻译方法、装置和用于翻译的装置 |
CN111507113A (zh) * | 2020-03-18 | 2020-08-07 | 北京捷通华声科技股份有限公司 | 一种机器辅助人工翻译的方法和装置 |
CN111931517A (zh) * | 2020-08-26 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 文本翻译方法、装置、电子设备以及存储介质 |
WO2021077559A1 (zh) * | 2019-10-25 | 2021-04-29 | 北京小米智能科技有限公司 | 信息处理方法、装置及存储介质 |
CN114139560A (zh) * | 2021-12-03 | 2022-03-04 | 山东诗语翻译有限公司 | 基于人工智能翻译系统 |
WO2022237639A1 (zh) * | 2021-05-14 | 2022-11-17 | 阿里巴巴(中国)有限公司 | 数据处理方法、装置、电子设备和存储介质 |
CN116306705A (zh) * | 2023-05-18 | 2023-06-23 | 山东省科学院海洋仪器仪表研究所 | 一种多语言的智能语音翻译交互平台 |
WO2024045779A1 (zh) * | 2022-08-30 | 2024-03-07 | 腾讯科技(深圳)有限公司 | 文本翻译、文本翻译模型的获取方法、装置、设备及介质 |
CN111460836B (zh) * | 2019-01-18 | 2024-04-19 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
CN108984540A (zh) * | 2018-07-23 | 2018-12-11 | 传神语联网网络科技股份有限公司 | 一种辅助翻译的方法及辅助翻译系统 |
CN109472028B (zh) * | 2018-10-31 | 2023-12-15 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
US10831475B2 (en) * | 2019-04-09 | 2020-11-10 | International Business Machines Corporation | Portability analyzer |
CN110196910B (zh) * | 2019-05-30 | 2022-02-15 | 珠海天燕科技有限公司 | 一种语料分类的方法及装置 |
CN112364658A (zh) * | 2019-07-24 | 2021-02-12 | 阿里巴巴集团控股有限公司 | 翻译以及语音识别方法、装置、设备 |
CN110543644B (zh) * | 2019-09-04 | 2023-08-29 | 语联网(武汉)信息技术有限公司 | 包含术语翻译的机器翻译方法、装置与电子设备 |
CN111079449B (zh) * | 2019-12-19 | 2023-04-11 | 北京百度网讯科技有限公司 | 平行语料数据的获取方法、装置、电子设备和存储介质 |
CN111382748B (zh) * | 2020-02-28 | 2024-03-19 | 北京小米松果电子有限公司 | 图像翻译方法、装置及存储介质 |
CN111797621A (zh) * | 2020-06-04 | 2020-10-20 | 语联网(武汉)信息技术有限公司 | 一种术语替换方法及系统 |
CN111680528B (zh) * | 2020-06-09 | 2023-06-30 | 合肥讯飞数码科技有限公司 | 一种翻译模型压缩方法、装置、设备及存储介质 |
CN111968646B (zh) * | 2020-08-25 | 2023-10-13 | 腾讯科技(深圳)有限公司 | 一种语音识别方法及装置 |
US20220093088A1 (en) * | 2020-09-24 | 2022-03-24 | Apple Inc. | Contextual sentence embeddings for natural language processing applications |
US20220108083A1 (en) * | 2020-10-07 | 2022-04-07 | Andrzej Zydron | Inter-Language Vector Space: Effective assessment of cross-language semantic similarity of words using word-embeddings, transformation matrices and disk based indexes. |
CN112560510B (zh) * | 2020-12-10 | 2023-12-01 | 科大讯飞股份有限公司 | 翻译模型训练方法、装置、设备及存储介质 |
CN112633017B (zh) * | 2020-12-24 | 2023-07-25 | 北京百度网讯科技有限公司 | 翻译模型训练、翻译处理方法、装置、设备和存储介质 |
CN113360742A (zh) * | 2021-05-19 | 2021-09-07 | 维沃移动通信有限公司 | 推荐信息确定方法、装置及电子设备 |
CN113360127B (zh) * | 2021-05-31 | 2023-05-23 | 富途网络科技(深圳)有限公司 | 音频播放方法以及电子设备 |
US11900073B2 (en) * | 2021-09-07 | 2024-02-13 | Lilt, Inc. | Partial execution of translation in browser |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7107204B1 (en) * | 2000-04-24 | 2006-09-12 | Microsoft Corporation | Computer-aided writing system and method with cross-language writing wizard |
CN101206643A (zh) * | 2006-12-21 | 2008-06-25 | 中国科学院计算技术研究所 | 一种融合了句型模板和统计机器翻译技术的翻译方法 |
CN102968411A (zh) * | 2012-10-24 | 2013-03-13 | 橙译中科信息技术(北京)有限公司 | 多语机器翻译智能辅助处理方法和系统 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7249012B2 (en) * | 2002-11-20 | 2007-07-24 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among phrases |
US7698124B2 (en) * | 2004-11-04 | 2010-04-13 | Microsoft Corporaiton | Machine translation system incorporating syntactic dependency treelets into a statistical framework |
US7827026B2 (en) * | 2004-12-21 | 2010-11-02 | Xerox Corporation | Bilingual authoring assistant for the “tip of the tongue” problem |
US8626486B2 (en) * | 2006-09-05 | 2014-01-07 | Google Inc. | Automatic spelling correction for machine translation |
GB2444084A (en) * | 2006-11-23 | 2008-05-28 | Sharp Kk | Selecting examples in an example based machine translation system |
US8185377B2 (en) * | 2007-08-11 | 2012-05-22 | Microsoft Corporation | Diagnostic evaluation of machine translators |
KR101301535B1 (ko) * | 2009-12-02 | 2013-09-04 | 한국전자통신연구원 | 하이브리드 번역 장치 및 그 방법 |
US8914277B1 (en) * | 2011-09-20 | 2014-12-16 | Nuance Communications, Inc. | Speech and language translation of an utterance |
US9183197B2 (en) * | 2012-12-14 | 2015-11-10 | Microsoft Technology Licensing, Llc | Language processing resources for automated mobile language translation |
US9235567B2 (en) * | 2013-01-14 | 2016-01-12 | Xerox Corporation | Multi-domain machine translation model adaptation |
US10185713B1 (en) * | 2015-09-28 | 2019-01-22 | Amazon Technologies, Inc. | Optimized statistical machine translation system with rapid adaptation capability |
-
2016
- 2016-12-12 CN CN201611138600.XA patent/CN106649288B/zh active Active
-
2017
- 2017-12-05 US US15/832,013 patent/US10467349B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7107204B1 (en) * | 2000-04-24 | 2006-09-12 | Microsoft Corporation | Computer-aided writing system and method with cross-language writing wizard |
CN101206643A (zh) * | 2006-12-21 | 2008-06-25 | 中国科学院计算技术研究所 | 一种融合了句型模板和统计机器翻译技术的翻译方法 |
CN102968411A (zh) * | 2012-10-24 | 2013-03-13 | 橙译中科信息技术(北京)有限公司 | 多语机器翻译智能辅助处理方法和系统 |
Cited By (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107193807A (zh) * | 2017-05-12 | 2017-09-22 | 北京百度网讯科技有限公司 | 基于人工智能的语言转换处理方法、装置及终端 |
US10664666B2 (en) | 2017-05-12 | 2020-05-26 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Language conversion method and device based on artificial intelligence and terminal |
CN109558570B (zh) * | 2017-09-25 | 2024-01-23 | 三星电子株式会社 | 句生成方法和设备 |
CN109558570A (zh) * | 2017-09-25 | 2019-04-02 | 三星电子株式会社 | 句生成方法和设备 |
CN108132932B (zh) * | 2017-12-27 | 2021-07-20 | 苏州大学 | 带有复制机制的神经机器翻译方法 |
CN108132932A (zh) * | 2017-12-27 | 2018-06-08 | 苏州大学 | 带有复制机制的神经机器翻译方法 |
CN110245358A (zh) * | 2018-03-09 | 2019-09-17 | 北京搜狗科技发展有限公司 | 一种机器翻译方法及相关装置 |
CN110245358B (zh) * | 2018-03-09 | 2024-02-02 | 北京搜狗科技发展有限公司 | 一种机器翻译方法及相关装置 |
CN109165389A (zh) * | 2018-07-23 | 2019-01-08 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN110909552B (zh) * | 2018-09-14 | 2023-05-30 | 阿里巴巴集团控股有限公司 | 翻译方法及装置 |
CN110909552A (zh) * | 2018-09-14 | 2020-03-24 | 阿里巴巴集团控股有限公司 | 翻译方法及装置 |
CN109558600A (zh) * | 2018-11-14 | 2019-04-02 | 北京字节跳动网络技术有限公司 | 翻译处理方法及装置 |
CN109558600B (zh) * | 2018-11-14 | 2023-06-30 | 抖音视界有限公司 | 翻译处理方法及装置 |
CN109558601A (zh) * | 2018-11-15 | 2019-04-02 | 苏州征之魂专利技术服务有限公司 | 一种专利数据俄文翻译方法 |
CN109635305A (zh) * | 2018-12-17 | 2019-04-16 | 北京百度网讯科技有限公司 | 语音翻译方法及装置、设备及存储介质 |
CN109558604A (zh) * | 2018-12-17 | 2019-04-02 | 北京百度网讯科技有限公司 | 一种机器翻译方法、装置、电子设备及存储介质 |
CN109635305B (zh) * | 2018-12-17 | 2022-07-12 | 北京百度网讯科技有限公司 | 语音翻译方法及装置、设备及存储介质 |
CN109558604B (zh) * | 2018-12-17 | 2022-06-14 | 北京百度网讯科技有限公司 | 一种机器翻译方法、装置、电子设备及存储介质 |
CN110532573B (zh) * | 2018-12-29 | 2022-10-11 | 苏州七星天专利运营管理有限责任公司 | 一种翻译方法和系统 |
CN110532573A (zh) * | 2018-12-29 | 2019-12-03 | 苏州七星天专利运营管理有限责任公司 | 一种翻译方法和系统 |
WO2020134705A1 (zh) * | 2018-12-29 | 2020-07-02 | 苏州七星天专利运营管理有限责任公司 | 一种翻译方法和系统 |
CN115455988A (zh) * | 2018-12-29 | 2022-12-09 | 苏州七星天专利运营管理有限责任公司 | 一种高风险语句的处理方法和系统 |
CN111460836A (zh) * | 2019-01-18 | 2020-07-28 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN111460836B (zh) * | 2019-01-18 | 2024-04-19 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN111507112A (zh) * | 2019-01-31 | 2020-08-07 | 搜狗(杭州)智能科技有限公司 | 一种翻译方法、装置和用于翻译的装置 |
CN111507112B (zh) * | 2019-01-31 | 2024-02-02 | 北京搜狗科技发展有限公司 | 一种翻译方法、装置和用于翻译的装置 |
CN109977430A (zh) * | 2019-04-04 | 2019-07-05 | 科大讯飞股份有限公司 | 一种文本翻译方法、装置及设备 |
CN109977430B (zh) * | 2019-04-04 | 2023-06-02 | 科大讯飞股份有限公司 | 一种文本翻译方法、装置及设备 |
CN110175335A (zh) * | 2019-05-08 | 2019-08-27 | 北京百度网讯科技有限公司 | 翻译模型的训练方法和装置 |
CN110175335B (zh) * | 2019-05-08 | 2023-05-09 | 北京百度网讯科技有限公司 | 翻译模型的训练方法和装置 |
CN110471597A (zh) * | 2019-07-25 | 2019-11-19 | 北京明略软件系统有限公司 | 一种数据标注方法和装置、计算机可读存储介质 |
CN110852113A (zh) * | 2019-10-10 | 2020-02-28 | 林原 | 翻译方法、装置、设备及存储介质 |
US11461561B2 (en) | 2019-10-25 | 2022-10-04 | Beijing Xiaomi Intelligent Technology Co., Ltd. | Method and device for information processing, and storage medium |
CN110765766B (zh) * | 2019-10-25 | 2022-05-17 | 北京中献电子技术开发有限公司 | 一种面向神经网络机器翻译的德文词法分析方法及系统 |
CN110765766A (zh) * | 2019-10-25 | 2020-02-07 | 北京中献电子技术开发有限公司 | 一种面向神经网络机器翻译的德文词法分析方法及系统 |
WO2021077559A1 (zh) * | 2019-10-25 | 2021-04-29 | 北京小米智能科技有限公司 | 信息处理方法、装置及存储介质 |
CN111368556B (zh) * | 2020-03-05 | 2024-03-26 | 深圳市腾讯计算机系统有限公司 | 翻译模型的性能确定方法、置信度确定方法及装置 |
CN111368556A (zh) * | 2020-03-05 | 2020-07-03 | 深圳市腾讯计算机系统有限公司 | 翻译模型的性能确定方法、置信度确定方法及装置 |
CN111507113A (zh) * | 2020-03-18 | 2020-08-07 | 北京捷通华声科技股份有限公司 | 一种机器辅助人工翻译的方法和装置 |
CN111931517A (zh) * | 2020-08-26 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 文本翻译方法、装置、电子设备以及存储介质 |
CN111931517B (zh) * | 2020-08-26 | 2023-12-12 | 腾讯科技(深圳)有限公司 | 文本翻译方法、装置、电子设备以及存储介质 |
WO2022237639A1 (zh) * | 2021-05-14 | 2022-11-17 | 阿里巴巴(中国)有限公司 | 数据处理方法、装置、电子设备和存储介质 |
CN114139560A (zh) * | 2021-12-03 | 2022-03-04 | 山东诗语翻译有限公司 | 基于人工智能翻译系统 |
WO2024045779A1 (zh) * | 2022-08-30 | 2024-03-07 | 腾讯科技(深圳)有限公司 | 文本翻译、文本翻译模型的获取方法、装置、设备及介质 |
CN116306705B (zh) * | 2023-05-18 | 2023-08-15 | 山东省科学院海洋仪器仪表研究所 | 一种多语言的智能语音翻译交互平台 |
CN116306705A (zh) * | 2023-05-18 | 2023-06-23 | 山东省科学院海洋仪器仪表研究所 | 一种多语言的智能语音翻译交互平台 |
Also Published As
Publication number | Publication date |
---|---|
US10467349B2 (en) | 2019-11-05 |
CN106649288B (zh) | 2020-06-23 |
US20180165278A1 (en) | 2018-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106649288A (zh) | 基于人工智能的翻译方法和装置 | |
Lazaridou et al. | Multimodal word meaning induction from minimal exposure to natural text | |
Rudkowsky et al. | More than bags of words: Sentiment analysis with word embeddings | |
CN108604227B (zh) | 用于神经临床释义生成的系统和方法 | |
Diependaele et al. | Fast phonology and the bimodal interactive activation model | |
Giorgi et al. | End-to-end named entity recognition and relation extraction using pre-trained language models | |
CN108153864A (zh) | 基于神经网络生成文本摘要的方法 | |
US20160217129A1 (en) | Method and Apparatus for Determining Semantic Matching Degree | |
CN105894088A (zh) | 基于深度学习及分布式语义特征医学信息抽取系统及方法 | |
CN107832310A (zh) | 基于seq2seq模型的结构化论点生成方法及系统 | |
CN107193807A (zh) | 基于人工智能的语言转换处理方法、装置及终端 | |
Charbonnier et al. | Predicting word concreteness and imagery | |
Booth et al. | Expectations on hierarchical scales of discourse: Multifractality predicts both short-and long-range effects of violating gender expectations in text reading | |
Santesteban et al. | The effects of word order on subject–verb and object–verb agreement: Evidence from Basque | |
Ehara et al. | Assessing Translation Ability through Vocabulary Ability Assessment. | |
CN110399472A (zh) | 面试提问提示方法、装置、计算机设备及存储介质 | |
Jean et al. | Neural machine translation for cross-lingual pronoun prediction | |
Wiggins et al. | Natural language processing of radiology text reports: interactive text classification | |
Li et al. | Exploring recurrent neural networks to detect named entities from biomedical text | |
Blinova et al. | A hybrid model of complexity estimation: Evidence from Russian legal texts | |
Yu et al. | Representing and predicting student navigational pathways in online college courses | |
Park et al. | LSTM encoder-decoder with adversarial network for text generation from keyword | |
Ziegler et al. | Modelling word recognition and reading aloud | |
Simianer et al. | Measuring immediate adaptation performance for neural machine translation | |
Bentz et al. | Towards a computational model of grammaticalization and lexical diversity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |