CN104978310B - 基于各种意思类别的翻译结果的提供方法及系统 - Google Patents

基于各种意思类别的翻译结果的提供方法及系统 Download PDF

Info

Publication number
CN104978310B
CN104978310B CN201510028718.6A CN201510028718A CN104978310B CN 104978310 B CN104978310 B CN 104978310B CN 201510028718 A CN201510028718 A CN 201510028718A CN 104978310 B CN104978310 B CN 104978310B
Authority
CN
China
Prior art keywords
sentence
translation
original text
classification
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510028718.6A
Other languages
English (en)
Other versions
CN104978310A (zh
Inventor
申中挥
朴珍伊
金锺焕
权京熙
金俊锡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Publication of CN104978310A publication Critical patent/CN104978310A/zh
Application granted granted Critical
Publication of CN104978310B publication Critical patent/CN104978310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种基于各种意思类别的翻译结果提供方法及系统。在通过计算机实施的翻译结果提供方法中,包括以下步骤:生成将以源语言写成的原文翻译成目标语言的译文的步骤;和将所述译文作为翻译结果提供,并将所述译文按句子的意思类别分类提供的步骤。

Description

基于各种意思类别的翻译结果的提供方法及系统
技术领域
本发明的实施例涉及一种使用计算机来生成原文的译文的机器翻译技术。
背景技术
随着近来国家之间的交流增加和信息通信网的扩大,越来越需要机器翻译装置来将第一语言,即源语言(source language)的句子翻译成第二语言,即目标语言(targetlanguage)的句子。这种机器翻译装置,目标在于经过对输入的原文进行语素分析、句法分析、转换及生成等一般步骤,来翻译成其他语言的文章。
现有的机器翻译方式,根据对文章的分析程度可分为直接法(direct method)、转换法(transfer method)、枢轴法(pivot method)等。在这里,直接法是通过源语言和目标语言之间的直接对应进行的翻译,转换法是分别对源语言和目标语言定义两种形态的中间表述并通过分析、转换、生成步骤进行的翻译,枢轴法是对源语言和目标语言定义一个中立表述并大致上通过分析步骤和生成步骤两个步骤来进行的翻译。
另一方面,进入90年代后公布的机器翻译方式中,有基于规则的机器翻译、基于统计的机器翻译、将基于规则的机器翻译和基于统计的机器翻译结合的混合机器翻译等,其使用从之前翻译的过程中获得的知识或翻译样本,或其统计来进行翻译。
作为基于统计方法的机器翻译技术的例子,韩国公开专利第10-2010-0037813号(公开日2010年4月12日)中公开了将语言信息反映至以双语平行语料库(bilingualparallel corpus)的分析为基础的统计机器翻译中的机器翻译装置及机器翻译方法。
图1示出了概率翻译候选样本。以往的机器翻译装置,如图1所示,以原文的翻译候选的单词/短语/规则(word/phrase/rule)为基础测定分数(score),结合相关候选以排列句子总分数的方法来生成译文。
图2示出了找出将德语原文进行英语翻译的正确路径的样本,以所示样本的方法,使用相关候选来按照概率高低顺序排列展示。
如上所述,以往的机器翻译技术只不过是考虑对原文的翻译是否正确的方法。
发明内容
(一)要解决的技术问题
提供一种翻译结果提供方法和系统,将作为原文译文的对译的候选句子生成为完整形态的句子。
提供一种翻译结果提供方法和系统,在译文的候选句子的生成过程中生成与意思分类相符的候选句子。
提供一种翻译结果提供方法和系统,生成与用户的目的和个性相符的意思类别的译文。
(二)技术方案
提供一种翻译结果提供方法,在通过计算机实施的翻译结果提供方法中,包括以下步骤:生成将以源语言写成的原文翻译成目标语言的译文的步骤;和将所述译文作为翻译结果提供,并将所述译文按句子的意思类别(semantic category)分类提供的步骤。
根据一个方面,其特征在于,所述意思类别,包括文体、句型、时态中的至少一个来作为用于将句子分类的标准。
根据另一个方面,其特征在于,所述生成步骤,将所述原文被翻译成的候选句子,按照以机器翻译模型测定的分数的顺序排列,提取分数高的排名前列的多个句子,所述提供步骤,作为翻译结果显示所述多个句子,并将所述多个句子中分数最高的句子与其余句子区别显示。
根据又一个方面,其特征在于,所述提供步骤,当所述原文被翻译成的候选句子有多个时,将所述候选句子按照意思类别进行区别显示。
根据又一个方面,其特征在于,进一步包括以下步骤:接收用户选择的翻译结果的意思类别的步骤,其中,所述提供步骤,显示所述原文被翻译成的候选句子中被分类至所述用户选中的意思类别中的句子。
根据又一个方面,其特征在于,进一步包括以下步骤:分析写原文的用户的句子个性的步骤,其中,所述提供步骤,显示所述原文被翻译成的候选句子中被分类至与所述用户的句子个性对应的意思类别中的句子。
根据又一个方面,进一步包括以下步骤:将所述原文的意思类别进行分类的步骤,其中,所述提供步骤,显示所述原文被翻译成的候选句子中被分类至与所述原文相同或相似的意思类别中的句子。
提供一种翻译结果提供系统,包括:加载有至少一个程序的存储器,和至少一个处理器,其中,所述至少一个处理器,根据所述程序的控制,处理以下过程:生成将以源语言写成的原文翻译成目标语言的译文的过程;和将所述译文作为翻译结果提供,并将所述译文按句子的意思类别分类提供的过程。
提供一种计算机可读存储介质,其作为包括控制计算机系统提供翻译结果的指令(instruction)的介质,所述指令,依照包括以下步骤的方法来控制所述计算机系统:生成将以源语言写成的原文翻译成目标语言的译文的步骤;和将所述译文作为翻译结果提供,并将所述译文按句子的意思类别分类提供的步骤。
提供一种文件分配系统,作为分配在用户终端中安装的应用的文件的文件分配系统,包括:文件传送单元,其根据所述用户终端的请求传送所述文件,其中,所述应用,包括以下模块:控制用户终端来将以源语言写成的原文传送至机器翻译服务器的模块;和控制用户终端来显示在所述机器翻译服务器中提供的将所述原文翻译成目标语言的译文的模块,其中,在所述机器翻译服务器中,将所述译文按照句子的意思类别进行分类来提供至所述用户终端。
(三)有益效果
提供一种翻译结果提供方法和系统,将作为原文译文的对译的候选句子生成为完整形态的句子。
提供一种翻译结果提供方法和系统,在译文的候选句子的生成过程中生成与意思分类相符的候选句子。
提供一种翻译结果提供方法和系统,生成与用户的目的和个性相符的意思类别的译文。
附图说明
图1和图2是用于说明现有机器翻译方法的示意图。
图3是概括性地示出根据本发明一个实施例的用户终端和机器翻译系统之间的关系的图。
图4是示出根据本发明一个实施例的机器翻译系统的内部结构的框图。
图5是示出用于构建基于统计的机器翻译的翻译概率表过程的流程图。
图6是示出用于构建基于统计的机器翻译的语言模型过程的流程图。
图7和图8是用于说明使用翻译模型和语言模型来选择译文的过程的图。
图9至图12是示例性地示出根据本发明一个实施例显示根据意思类别进行分类的翻译候选句子的服务画面的图。
附图说明标记
300:机器翻译系统
301:用户终端
410:译文生成单元
420:结果提供单元
具体实施方式
下面,参照附图详细说明本发明的实施例。
本实施例涉及使用计算机自动生成原文的译文的机器翻译的技术。
图3是概括性地示出根据本发明一个实施例的用户终端和机器翻译系统之间的关系的图。图3示出了用户终端301和机器翻译系统300。在图3中,箭头表示用户终端301和机器翻译系统300之间可使用有线/无线网路进行收发数据。
机械翻译系统300,起到将用户输入的源语言的句子(以下简称原文)翻译成目标语言的句子(以下简称译文)并提供翻译结果的翻译引擎的作用。特别是,机器翻译系统300,将原文的译文的候选句子按照分数顺序排列并提取至少一个(N个)之后,将提取出的候选句子按照意思分类,并提供翻译结果。
用户终端301,可以表示能够安装及运行与机器翻译系统300相关的web/移动站点的连接或服务专用应用的所有终端装置,如个人计算机(PC)、智能手机(smart phone)、平板电脑(tablet)、便携式计算机(laptop computer)、数字多媒体广播终端(DMB)、便携式多媒体播放器(PMP,Portable Multimedia Player)、导航(navigation)终端等。此时,用户终端301可以在web/移动站点或专用应用的控制下执行服务画面构成、数据输入、数据收发、数据存储等整体服务的操作。此外,用户终端301可包括:输入装置,用于向机器翻译系统300输入原文;输出装置,用于输出机械翻译系统300中提供的翻译结果,此时,作为输入装置,可以使用键盘、鼠标、扫描仪、麦克风等,作为输出装置可以使用显示器、打印机、扬声器等。
图4是示出根据本发明一个实施例的机器翻译系统的内部结构的框图。如图4所示,机器翻译系统可以包括由译文生成单元410和结果提供单元420构成的处理器400、存储器401、网络接口402。此外,机器翻译系统可包括与用于从原文自动生成译文的多种翻译模型关联的数据库系统。例如,作为用于机器翻译的翻译模型,可以使用基于规则的机器翻译模型403、基于统计的机器翻译模型404、将基于规则方式的和基于统计方式混合的混合型机器翻译模型405等。
存储器401可存储有程序,该程序包括与机器翻译例行程序对应的指令,用来生成原文对应的译文的候选句子并将候选句子的意思类别分类。将在下文中描述的机器翻译系统中执行的过程,可由存储器401中存储的程序来运行。例如,存储器401可以是硬盘、固态硬盘(SSD)、安全数字存储卡(SD卡)以及其他存储介质。
网络接口402可将机器翻译系统连接至网络,用于进行与使用基于意思类别的机器翻译服务的多个用户终端的通信。
处理器400是根据存储器401中存储的程序的指令来进行处理的装置,可包括CPU等微处理器。处理器400的详细结构如下。
译文生成单元410可应用预先对原文定义的机器翻译模型(基于规则的机器翻译模型、基于统计的机器翻译模型、混合型机器翻译模型)来生成译文。此时,译文生成单元410,在生成原文的译文的过程中,可以将译文的候选句子生成为各种意思类别的句子。也就是说,译文生成单元410,可将原文中被翻译出来的译文的候选句子按照分数顺序排列并提取N个句子,并按照提取出的候选句子具有的意思类别来进行分类。此时,意思类别可以表示文体、句型、时态、语言规范等用于将句子性质分类的所有标准。例如,意思类别可根据文体区分成书面语体、口语体,可根据句型区分成陈述句、劝诱句、命令句、敬语、谦语等,可根据时态区分成过去时、现在时、未来时等,可根据语言规范区分成普通话、方言等。
结果提供单元420提供原文的译文,可将意思相似的几个候选句子包含在翻译结果中进行提供。此时,所谓候选句子,不仅包括单纯地提供意思相似的单词的候选,还包括具有完整句子形态的意思相似的单词替换形成的完整句子,而且还包括单词和结构本身完全不同的完整句子。作为提供翻译结果的一个例子,结果提供单元420,可将译文的候选句子按照意思类别进行区别显示。作为另一个例子,结果提供单元420,可在译文的候选句子中,筛选出按照用户的目的,即按照用户选择的意思类别进行分类的候选句子进行显示。作为又一个例子,结果提供单元420,可在译文的候选句子中,筛选出按照与用户的个性(personality)相符的意思类别进行分类的候选句子进行显示。此时,用户个性,可根据因特网上分散的用户信息来进行分析,例如,可分析用户经常使用的服务种类或经常使用的文体等来推测用户可能会使用的句子的意思类别。再如另一个例子,结果提供单元420,将用户输入的原文的意思类别自动分类,来筛选出原文的翻译候选句子中与原文的意思类别相同或相似的句子来进行显示。
根据上述结构,本发明的机器翻译系统,在翻译候选句子的生成过程中,如下表1的样本所示,将与意思分类相符的句子生成或后续处理来进行提供。
[表1]
因此,机器翻译系统可以在机器翻译的候选句子的生成过程中,根据候选句子的意思类别进行分类,由此可以提供与用户的目的和个性相符的译文。例如,对于新闻报道原文生成报道形式的书面语句,或者生成社交网站(SNS,短信或帖子等)上的对话中符合的口语体句子等,可以生成各种意思类别的译文。
根据机器翻译实施的意思类别化方法,具体说明如下。
基于规则的机器翻译模型
一般的基于规则的机器翻译方式,可以使用源语言和目标语言的语言信息来生成翻译规则,可对应这种翻译规则来生成原文的译文。
[表2]
对表2的样本进行基于规则的译文生成过程如下。
一般化:[主语][动词过去时][宾语1][宾语2]。
更改顺序:[主语][宾语2][宾语1][动词过去时]
应用语言特点:[主语][宾语2][宾语1][动词过去时]
应用翻译规则:([我][水][一杯][喝了])
因此,机器翻译系统可在按照各种意思类别生成规则后,生成与意思类别相符的翻译句子。换句话说,可向一般的基于规则的翻译方式的翻译规则中添加根据意思类别的翻译规则。
对表2的译文,可将根据意思类别的翻译规则应用语尾变化,也可以对整个句子应用,其结果展示如下。
<样本>
未来时规则:(我打算喝一杯水)
口语体规则:(我喝杯水)
对话体规则:(我喝水)
省略(缩略)规则:(喝水)
如上所述,可在应用根据意思类别的翻译规则来生成多个候选句子后,将生成的候选句子以适当的意思类别进行分类。
<样本>
(我打算喝一杯水)→分类为未来时
(我喝杯水)→分类为口语体
(我喝水)→分类为对话体
(喝水)→分类为缩略语
候选句子可以以统计方法或规则方法来进行分类。
首先,句子分类的统计方法,是以统计来估算句子具有何种意思并分类的方式。例如,可以估算为,“ (我吃过饭了)”在概率上接近书面语体,“(我吃了)”在概率上接近口语体。
接下来,句子分类的规则方法,是对句子的构成要素进行意思分析之后,应用相关规则,来赋予句子的意思分类的方式。例如,以“”结束的话,将其分类为口语体,以“”结束的话,将其分类为书面语体等,从简单的规则,到根据意思分析的具有复杂度的各种规则,可以任意扩大。
基于统计的机器翻译模型
一般的基于统计的机器翻译模型,可包括翻译模型(translation model)构建过程、语言模型(language model)构建过程、及使用翻译模型和语言模型的译文选择过程。
首先,机器翻译系统可以使用互不相同的两种语言的翻译对数据来构建翻译概率表。
图5是示出用于构建基于统计的机器翻译的翻译概率表过程的流程图。例如,如图5所示,机器翻译系统可从两个语言的大容量翻译对数据501来估算单词之间的翻译概率之后502,根据估算的单词概率来决定短语(phrase)区段503。此外,机器翻译系统,可对决定出的短语区段,从短语候选数据504中提取短语505来构建包括翻译概率表的翻译模型506。
此外,机器翻译系统可以按照各个语言使用相关语言的大容量数据来构建语言模型,并构建句子的自然度的相关概率列表。
图6是示出了用于构建基于统计的机器翻译的语言模型的过程的流程图。例如,如图6所示,机器翻译系统可从特定语言构成的句子的大容量数据601中估算各单词列中相关单词列的概率602并存储,由此构建表示句子自然度概率列表的语言模型603。
然后,机器翻译系统可以使用双语翻译模型和单一语言的语言模型来选择译文。
图7是用于说明使用翻译模型和语言模型来选择译文的过程的图。例如,如图7所示,机器翻译系统通过解码器(decoder),使用从双语语料库(bilingual corpus)构建的翻译模型和从单语语料库(monolingual corpus)构建的翻译模型,来从原文译文的几个候选中选出最佳候选。图8示出了德语原文的英语译文的选择过程,图8中进行阴影处理的列的结合句子,表示翻译模型中的短语概率和语言模型中的单词列概率同时较高的句子列。
上述基于统计的翻译方式,可应用于本发明中提出的候选句子生成技术中。
例如,机器翻译系统应用基于统计的机器翻译的译文选择方式,将原文翻译成的译文的候选句子按照分数顺序排列以后,从高分顺序提取N个候选句子。并且,机器翻译系统,可将提取的N个候选句子分类成合适的意思类别。此时,候选句子的意思类别可按照统计方法或规则方法来进行分类。这与上述说明的基于规则的机器翻译的方式相同。
因此,机器翻译系统,可以额外地对各种意思类别构建与各意思类别相符的语言模型,并将其应用至机器翻译中,由此引导使原文的译文成为从概率上符合意思类别的翻译。对意思类别构建的语言模型,起到通过记有大量句子的语料库来生成从概率上较为自然的句子的作用,此时,选择性地构建语言模型来使其符合特定意思类别,来估算意思类别的概率。例如,当构建推特(Twitter)的大容量语料库来制成概率表时,推特风格的句子被选中的概率就会变高。
混合型机器翻译模型
一般的混合型机器翻译方式,是将前述的基于规则的机器翻译方式和基于统计的机器翻译方式适当应用的方式。在混合机器翻译方式中也一样,可以在生成原文的几个翻译候选句子之后,将翻译候选句子分类成合适的意思类别。
在机器翻译方式中,由于可以进行基于规则的和基于统计的混合,因此可以进行将翻译候选句子按照意思分类选择的方式或基于规则与基于统计的混合。
总之,所有方法(基于规则、基于统计、混合)的机器翻译系统,都可以在生成原文的译文的过程中生成多种意思类别的几个翻译候选句子。
根据本发明的机器翻译系统,提供原文的译文时,可在提供的翻译结果中包括意思相同的或相似的几个候选句子。例如,机器翻译系统,可以将原文翻译成的译文的候选句子按照分数排列,提取N个句子,在翻译结果中将其中分数最高的最佳句子与其余候选句子进行区别显示。此时,机器翻译系统,可在提供的翻译结果中以完整句子的形式包括除了最佳句子意外的其他候选句子。
图9示例性地示出了将韩语翻译成英语的翻译结果画面900。机器翻译系统,当输入以韩语写成的原文“(没关系)”910时,作为翻译结果可以显示翻译成英语的译文920、930,此时,作为对原文“(没关系)”910的翻译结果,可将分数最高的最佳句子“That's all right.”920和与“That's all right.”意思相似的几个候选句子即"No problem."、"Never mind."、"It doesn't matter."等930区别显示。
图10示例性地示出了将英语翻译成韩国语的翻译结果画面1000。机器翻译系统,当输入以英语写成的原文“I'm just looking around(我只是随便看看).”1010时,作为检索结果,可显示翻译成韩国语的译文1020、1030,此时,作为对原文“I'm just looking around.”1010的翻译结果,可将分数最高的最佳句子“ (我只是随便看看)”1020和与“(我只是随便看看)”意思相同或相似的候选句子,即" (我要随便看看)"、"(我在随便看看)"、"(我随便看看)"等1030区别显示。
特别是,根据本发明的机器翻译系统,可将翻译结果中包含的句子按照意思类别进行区别显示。此时,意思类别可以表示文体(书面语体、口语体等)、句型(陈述句、劝诱句、命令句、敬语、谦语等)、时态(过去时、现在时、未来时等)、语言规范(普通话、方言等)等用于将句子性质分类的所有标准。例如,如图11所示,可与翻译结果中包含的句子1120、1130相邻显示各句子所属的意思类别1140。
作为另一例子,根据本发明的机器翻译系统,可将与用户选择的意思类别相符的候选句子作为翻译结果显示。此时,机器翻译系统,可在几个翻译候选句子中只显示与用户选中的意思类别对应的句子,也可以显示几个翻译候选句子,但将用户选中的意思类别的候选句子与其他候选句子区别显示。例如,如图12所示,在翻译结果画面1200的特定位置上,可提供指定用户想要接受提供的译文的意思类别的菜单环境1250。由此,机器检索系统,可通过菜单环境1250接收用户选择的意思类别,然后筛选被分类至该意思类别中的候选句子进行显示。除了上述方式以外,当输入原文时,可显示请求选择意思类别的弹出窗口,或者通过翻译机的环境设置等来提供意思类别选择路径,以便可进行预先设置。
进一步,本发明的机器翻译系统,使得用户无需一一选择特定意思类别也可以根据用户个性来预测用户想要接收的译文的意思类别并进行自动设置。此时,用户个性,可以根据因特网上的用户信息来进行分析,例如可分析用户经常使用的服务(例如新闻报道、社区论坛、博客、短信等)或经常使用的文体等来设置与用户个性相符的句子的意思类别。也就是说,可以分析用户较喜欢的句子个性,在显示翻译结果时自动反映用户的句子个性。
此外,根据本发明的机器翻译系统,当用户输入原文时,可将原文的文体或句型等意思类别进行自动分类,由此可将对原文生成的翻译候选句子中与原文意思类别相同或相近的句子进行区别显示。例如,如果原文的意思类别为口语体而被分类为敬语时,那么,可在翻译候选句子中,将被分类为与原文的文体和句型相同的口语体的敬语句子作为翻译结果显示。
上述机器翻译方法,可基于通过图3至图12进行说明的机器翻译系统的详细内容,以两个以上的操作构成。
本发明的实施例的各方法,可以被记录在以通过各种计算机系统运行的程序指令(instruction)形式实施的计算机可读介质中。
在根据本实施例的机器翻译方法中,与原文输入及译文输出相关的程序,可以被构成为基于PC的程序或专门用于移动终端的应用。本实施例中的机器翻译应用,可是独立地运行的程序,或者为特定应用(例如检索程序等)的应用程序嵌入式(in-app),可在所述特定应用上进行操作。
此外,根据本发明的实施例的方法,与提供翻译服务的服务器系统相关的应用可控制用户终端来运行。作为一个例子,这种应用,可包括以下模块:接收用户输入的原文或接收对想要接收提供的译文的意思类别的选择,并传送至服务器系统的模块;及将从服务器系统接收到的译文进行输出的模块。此外,此类应用,可以通过文件分配系统提供的文件来安装至用户终端中。作为一个例子,文件分配系统可包括根据用户终端的请求传送所述文件的文件传送单元(未图示)。
如上所述,本发明的实施例,可以以完整形式的句子来提供原文的译文的对译的候选句子,可将翻译结果中包含的译文的句子按照意思类别进行分类显示,特别是,可以筛选与用户的目的或个性相符的意思类别的译文来提供。
上面所述的装置,可以由硬件组件、软件组件和/或硬件组件和软件组件的组合来构成。例如,在实施例中描述的装置及其组件,例如处理器、控制器、算术逻辑单元(ALU,arithmetic logic unit)、数字信号处理器(digital signal processor)、微型计算机、现场可编程门阵列(FPGA,field programmable gate array)、可编程逻辑单元(PLU,programmable logic unit)、微处理器或可以执行响应指令(instruction)的任何其他设备,可使用一个或多个通用或专用计算机来实施。处理装置可执行操作系统(OS)和在所述操作系统上执行的一个或多个软件应用程序。此外,处理装置可响应软件的执行来访问、存储、操作、处理和生成数据。为便于理解,处理装置在某些情况下被描述为使用一个,但本技术领域的技术人员可以知道,处理装置还可包括多个处理元件(processing element)和/或多个类型的处理元件。例如,处理装置可包括多个处理器或一个处理器与一个控制器。此外,并行处理器(parallel processor)之类的其他处理配置(processing configuration)也是可行的。
软件可包括计算机程序(computer program)、代码(code)、指令(instruction)或这些中的一个或多个的组合,可将处理装置构建成可根据所需进行操作,或独立地或结合地(collectively)命令处理装置。软件和/或数据,为使用处理装置来解释或向处理装置提供指令或数据,可被永久性地或暂时性地具体化在任何类型的机器、组件(component)、物理装置、虚拟装置(virtual equipment)、计算机存储介质或装置、传送的信号波(signalwave)中。软件被分布在网络连接的计算机系统上,以便以分布方式存储和执行。软件和数据可被存储在一个或多个计算机可读介质上。
根据实施例的方法,可被记录在以可由各种计算机装置执行的程序指令形态实施的计算机可读介质中。所述计算机可读介质还可包括独立的或组合的程序指令、数据文件、数据结构等。记录在所述介质中的程序指令可以是专门为本发明实施例设计构建的,也可以是为计算机软件技术人员熟知而应用的。计算机可读介质的例子包括:磁介质(magneticmedia),如硬盘、软盘和磁带;光学介质(optical media),如CD ROM、DVD;磁光介质(magneto-optical media),如光盘(floptical disk);和专门配置为存储和执行程序指令的硬件装置,如只读存储器(ROM)、随机存取存储器(RAM)、闪存等存储等。程序指令的例子,既包括由编译器产生的机器代码,,也包括可使用解释器等由计算机执行的高级语言代码。所述硬件装置可配置为作为一个以上软件模块运行以执行实施例的操作,反之亦然。
如上所示,本发明虽然已参照有限的实施例和附图进行了说明,但本发明所属领域的技术人员均可以从此记载中进行各种修改和变更。例如,所述技术可按照与所述方法不同的顺序来执行,和/或所述的系统、结构、装置、电路等组件可以以与所述方法不同的形态结合或组合,也可被代替或替换为其他组件或同等物来达成适当的结果。
由此,其他实施、其他实施例及权利要求书的等同物均属于后附的权利要求书的范围。

Claims (8)

1.一种通过计算机实施的翻译结果提供方法,包括以下步骤:
生成将以源语言写成的原文翻译成目标语言的译文的步骤;和
将所述译文作为翻译结果提供,并将所述译文按句子的意思类别分类提供的步骤;
根据因特网上分散的用户信息,分析写所述原文的用户个性,推测与用户个性对应的意思类别的步骤,
其中,所述提供步骤,显示所述原文被翻译成的候选句子中被分类至与所述用户的句子个性对应的意思类别中的句子,
所述生成步骤,将所述原文被翻译成的候选句子,按照以机器翻译模型测定的分数的顺序排列,提取分数高的排名前列的多个句子,所述提供步骤,作为翻译结果显示所述多个句子,并将所述多个句子中分数最高的句子配置在第一区域,其余句子配置在与第一区域区分开的第二区域,由此将所述多个句子中分数最高的句子与其余句子区别显示。
2.根据权利要求1所述的翻译结果提供方法,其特征在于,所述意思类别,包括文体、句型、时态中的至少一个来作为用于将句子分类的标准。
3.根据权利要求1所述的翻译结果提供方法,其特征在于,所述提供步骤,当所述原文被翻译成的候选句子有多个时,将所述候选句子按照意思类别进行区别显示。
4.一种翻译结果提供系统,包括:
加载有至少一个程序的存储器,和
至少一个处理器;
其中,所述至少一个处理器,根据所述程序的控制,处理以下过程:
生成将以源语言写成的原文翻译成目标语言的译文的过程,和
将所述译文作为翻译结果提供,并将所述译文按句子的意思类别分类提供的过程,以及根据因特网上分散的用户信息,分析写所述原文的用户个性,推测与用户个性对应的意思类别的过程,
其中,所述提供过程,显示所述原文被翻译成的候选句子中被分类至与所述用户的句子个性对应的意思类别中的句子,
所述生成过程,将所述原文被翻译成的候选句子,按照以机器翻译模型测定的分数的顺序排列,提取分数高的排名前列的多个句子,所述提供过程,作为翻译结果显示所述多个句子,并将所述多个句子中分数最高的句子配置在第一区域,其余句子配置在与第一区域区分开的第二区域,由此将所述多个句子中分数最高的句子与其余句子区别显示。
5.根据权利要求4所述的翻译结果提供系统,其特征在于,所述意思类别,包括文体、句型、时态中的至少一个来作为用于将句子分类的标准。
6.根据权利要求4所述的翻译结果提供系统,其特征在于,所述提供过程,当所述原文被翻译成的候选句子有多个时,将所述候选句子按照意思类别进行区别显示。
7.一种计算机可读存储介质,其作为包括控制计算机系统提供翻译结果的指令的介质,所述指令,依照包括以下步骤的方法来控制所述计算机系统:
生成将以源语言写成的原文翻译成目标语言的译文的步骤;和
将所述译文作为翻译结果提供,并将所述译文按句子的意思类别分类提供的步骤;
根据因特网上分散的用户信息,分析写所述原文的用户个性,推测与用户个性对应的意思类别的步骤,
其中,所述提供步骤,显示所述原文被翻译成的候选句子中被分类至与所述用户的句子个性对应的意思类别中的句子,
所述生成步骤,将所述原文被翻译成的候选句子,按照以机器翻译模型测定的分数的顺序排列,提取分数高的排名前列的多个句子,所述提供步骤,作为翻译结果显示所述多个句子,并将所述多个句子中分数最高的句子配置在第一区域,其余句子配置在与第一区域区分开的第二区域,由此将所述多个句子中分数最高的句子与其余句子区别显示。
8.一种文件分配系统,其作为分配在用户终端中安装的应用的文件的文件分配系统,包括:
文件传送单元,其根据所述用户终端的请求传送所述文件,
其中,所述应用,包括以下模块:
控制用户终端来将以源语言写成的原文传送至机器翻译服务器的模块;和
控制用户终端来显示在所述机器翻译服务器中提供的将所述原文翻译成目标语言的译文的模块,
其中,在所述机器翻译服务器中,将所述译文按照句子的意思类别进行分类来提供至所述用户终端,
所述机器翻译服务器根据因特网上分散的用户信息,分析写所述原文的用户个性,推测与用户个性对应的意思类别,显示所述原文被翻译成的候选句子中被分类至与所述用户的句子个性对应的意思类别中的句子,将所述原文被翻译成的候选句子,按照以机器翻译模型测定的分数的顺序排列,提取分数高的排名前列的多个句子作为翻译结果显示,并将所述多个句子中分数最高的句子配置在第一区域,其余句子配置在与第一区域区分开的第二区域,由此将所述多个句子中分数最高的句子与其余句子区别显示。
CN201510028718.6A 2014-04-08 2015-01-20 基于各种意思类别的翻译结果的提供方法及系统 Active CN104978310B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2014-0041887 2014-04-08
KR1020140041887A KR101864361B1 (ko) 2014-04-08 2014-04-08 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템

Publications (2)

Publication Number Publication Date
CN104978310A CN104978310A (zh) 2015-10-14
CN104978310B true CN104978310B (zh) 2018-05-18

Family

ID=54209896

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510028718.6A Active CN104978310B (zh) 2014-04-08 2015-01-20 基于各种意思类别的翻译结果的提供方法及系统

Country Status (5)

Country Link
US (2) US9760569B2 (zh)
JP (1) JP6333745B2 (zh)
KR (1) KR101864361B1 (zh)
CN (1) CN104978310B (zh)
TW (1) TWI629601B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577399B (zh) * 2013-11-05 2018-01-23 北京百度网讯科技有限公司 双语语料库的数据扩充方法和装置
KR101864361B1 (ko) * 2014-04-08 2018-06-04 네이버 주식회사 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템
CN104731776B (zh) * 2015-03-27 2017-12-26 百度在线网络技术(北京)有限公司 翻译信息的提供方法及系统
US9678954B1 (en) * 2015-10-29 2017-06-13 Google Inc. Techniques for providing lexicon data for translation of a single word speech input
KR102578982B1 (ko) 2015-11-30 2023-09-18 삼성전자주식회사 번역 서비스를 제공하는 방법 및 이를 위한 전자 장치
JP6655788B2 (ja) * 2016-02-01 2020-02-26 パナソニックIpマネジメント株式会社 対訳コーパス作成方法、該装置および該プログラムならびに機械翻訳システム
US10121474B2 (en) * 2016-02-17 2018-11-06 Microsoft Technology Licensing, Llc Contextual note taking
US10318640B2 (en) * 2016-06-24 2019-06-11 Facebook, Inc. Identifying risky translations
KR102565275B1 (ko) * 2016-08-10 2023-08-09 삼성전자주식회사 병렬 처리에 기초한 번역 방법 및 장치
KR101950213B1 (ko) * 2017-02-03 2019-02-22 네이버 주식회사 회화 관련 컨텐츠를 제공하는 방법 및 시스템
KR102438132B1 (ko) * 2017-09-20 2022-08-31 삼성전자주식회사 전자 장치 및 그의 제어 방법
US10769386B2 (en) * 2017-12-05 2020-09-08 Sap Se Terminology proposal engine for determining target language equivalents
KR102206486B1 (ko) * 2018-06-29 2021-01-25 네이버 주식회사 입력 어플리케이션을 이용한 번역 서비스 제공 방법 및 이를 이용하는 단말장치
CN109697292B (zh) * 2018-12-17 2023-04-21 北京百度网讯科技有限公司 一种机器翻译方法、装置、电子设备和介质
KR102545666B1 (ko) 2018-12-18 2023-06-21 삼성전자주식회사 페르소나에 기반하여 문장을 제공하는 방법 및 이를 지원하는 전자 장치
US11341340B2 (en) * 2019-10-01 2022-05-24 Google Llc Neural machine translation adaptation
US11861313B2 (en) * 2020-02-02 2024-01-02 International Business Machines Corporation Multi-level linguistic alignment in specific user targeted messaging
KR102260396B1 (ko) 2020-09-09 2021-06-03 주식회사 트위그팜 범용 신경망 기계번역기를 활용한 하이브리드 번역 시스템
WO2024106689A1 (ko) * 2022-11-16 2024-05-23 삼성전자주식회사 전자 장치 및 기계 번역 방법

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0417065A (ja) * 1990-05-11 1992-01-21 Hitachi Ltd 翻訳支援装置
JPH05128150A (ja) * 1991-10-30 1993-05-25 Ricoh Co Ltd 機械翻訳装置
JPH0844746A (ja) * 1994-07-27 1996-02-16 Nec Corp 翻訳変換学習装置
CN1869976A (zh) * 2005-05-25 2006-11-29 株式会社东芝 通过执行不同语言之间的翻译来支持交流的装置和方法
CN1955953A (zh) * 2005-10-27 2007-05-02 株式会社东芝 根据单词之间的语义关系优化翻译的装置和方法
CN101256558A (zh) * 2007-02-26 2008-09-03 株式会社东芝 用于将语音由源语言翻译成目标语言的装置和方法
JP2012185654A (ja) * 2011-03-04 2012-09-27 Fujitsu Ltd 翻訳装置、翻訳プログラムおよび翻訳方法
CN102789451A (zh) * 2011-05-16 2012-11-21 北京百度网讯科技有限公司 一种个性化的机器翻译系统、方法及训练翻译模型的方法
CN103268315A (zh) * 2012-12-31 2013-08-28 威盛电子股份有限公司 自然语言对话方法及其系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0589166A (ja) * 1991-09-27 1993-04-09 Kobe Nippon Dekin Software Kk 機械翻訳装置
JPH06348751A (ja) * 1992-11-09 1994-12-22 Ricoh Co Ltd 言語変換装置
JPH06295309A (ja) * 1993-04-06 1994-10-21 Ricoh Co Ltd 機械翻訳装置及び言語解析装置並びにディジタル複写装置
JP2004038406A (ja) * 2002-07-01 2004-02-05 Advanced Telecommunication Research Institute International 複数個の翻訳結果から最良訳を選択する方法、最良訳を選択するための回帰木データを生成する方法、最良訳選択型の機械翻訳プログラム、回帰木生成プログラム、および回帰木データを記憶した記憶媒体
JP5128150B2 (ja) 2007-03-07 2013-01-23 三菱レイヨン株式会社 メタクリル酸メチルの回収方法
US8548791B2 (en) * 2007-08-29 2013-10-01 Microsoft Corporation Validation of the consistency of automatic terminology translation
KR20100037813A (ko) 2008-10-02 2010-04-12 삼성전자주식회사 통계적 자동 번역 장치 및 방법
JP5317061B2 (ja) * 2009-07-30 2013-10-16 独立行政法人情報通信研究機構 単語間の意味的関係の有無についての、複数言語での同時分類器及びそのためのコンピュータプログラム。
KR20120035244A (ko) * 2010-10-05 2012-04-16 에스케이플래닛 주식회사 다양한 문체 제공이 가능한 자동 번역 장치 및 방법
TW201222282A (en) * 2010-11-23 2012-06-01 Inventec Corp Real time translation method for mobile device
TWI456415B (zh) * 2010-12-16 2014-10-11 Inventec Corp 翻譯查詢與翻譯轉換系統及其方法
US9063931B2 (en) * 2011-02-16 2015-06-23 Ming-Yuan Wu Multiple language translation system
US20150199335A1 (en) * 2014-01-10 2015-07-16 Electronics And Telecommunications Research Institute Method and apparatus for representing user language characteristics in mpeg user description system
KR20150093482A (ko) * 2014-02-07 2015-08-18 한국전자통신연구원 화자 분할 기반 다자간 자동 통번역 운용 시스템 및 방법과 이를 지원하는 장치
KR101864361B1 (ko) * 2014-04-08 2018-06-04 네이버 주식회사 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0417065A (ja) * 1990-05-11 1992-01-21 Hitachi Ltd 翻訳支援装置
JPH05128150A (ja) * 1991-10-30 1993-05-25 Ricoh Co Ltd 機械翻訳装置
JPH0844746A (ja) * 1994-07-27 1996-02-16 Nec Corp 翻訳変換学習装置
CN1869976A (zh) * 2005-05-25 2006-11-29 株式会社东芝 通过执行不同语言之间的翻译来支持交流的装置和方法
CN1955953A (zh) * 2005-10-27 2007-05-02 株式会社东芝 根据单词之间的语义关系优化翻译的装置和方法
CN101256558A (zh) * 2007-02-26 2008-09-03 株式会社东芝 用于将语音由源语言翻译成目标语言的装置和方法
JP2012185654A (ja) * 2011-03-04 2012-09-27 Fujitsu Ltd 翻訳装置、翻訳プログラムおよび翻訳方法
CN102789451A (zh) * 2011-05-16 2012-11-21 北京百度网讯科技有限公司 一种个性化的机器翻译系统、方法及训练翻译模型的方法
CN103268315A (zh) * 2012-12-31 2013-08-28 威盛电子股份有限公司 自然语言对话方法及其系统

Also Published As

Publication number Publication date
CN104978310A (zh) 2015-10-14
KR20150116675A (ko) 2015-10-16
US20150286634A1 (en) 2015-10-08
KR101864361B1 (ko) 2018-06-04
JP6333745B2 (ja) 2018-05-30
US9760569B2 (en) 2017-09-12
US9971769B2 (en) 2018-05-15
TW201539209A (zh) 2015-10-16
JP2015201169A (ja) 2015-11-12
TWI629601B (zh) 2018-07-11
US20170337189A1 (en) 2017-11-23

Similar Documents

Publication Publication Date Title
CN104978310B (zh) 基于各种意思类别的翻译结果的提供方法及系统
US10664660B2 (en) Method and device for extracting entity relation based on deep learning, and server
US20240119072A1 (en) Apparatus and method for automated and assisted patent claim mapping and expense planning
Hirschberg et al. Advances in natural language processing
US8903707B2 (en) Predicting pronouns of dropped pronoun style languages for natural language translation
US20110289407A1 (en) Font recommendation engine
CN106407344B (zh) 一种生成搜索引擎优化标签的方法和系统
US20120290509A1 (en) Training Statistical Dialog Managers in Spoken Dialog Systems With Web Data
CN105787001A (zh) 跨语言信息检索
CN114424257A (zh) 使用机器学习对表格数据进行自动描绘和提取
KR102188564B1 (ko) 어체 변환이 가능한 기계 번역 방법 및 시스템
WO2012158571A2 (en) Training statistical dialog managers in spoken dialog systems with web data
US20220129623A1 (en) Performance characteristics of cartridge artifacts over text pattern constructs
KR101916781B1 (ko) 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템
CN110888940B (zh) 文本信息提取方法、装置、计算机设备及存储介质
Fu Natural Language Processing in Urban Planning: A Research Agenda
US11120204B2 (en) Comment-based article augmentation
JP2022187507A (ja) 技術調査支援装置、技術調査支援方法、および技術調査支援プログラム
Hucka et al. Escalating model sizes and complexities call for standardized forms of representation
Vázquez-González et al. Creating a corpus of historical documents for emotions identification
Osesina et al. A data-intensive approach to named entity recognition combining contextual and intrinsic indicators
Adrian et al. Semantic views of homogeneous unstructured data
Bruggmann Visualization and interactive exploration of spatio-temporal and thematic information in digital text archives
CN115905854A (zh) 语言模型的训练方法、装置和计算机设备
CN117910484A (zh) 术语翻译方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant