CN1838113A - 翻译处理方法、文档翻译装置和程序 - Google Patents

翻译处理方法、文档翻译装置和程序 Download PDF

Info

Publication number
CN1838113A
CN1838113A CNA2005101026029A CN200510102602A CN1838113A CN 1838113 A CN1838113 A CN 1838113A CN A2005101026029 A CNA2005101026029 A CN A2005101026029A CN 200510102602 A CN200510102602 A CN 200510102602A CN 1838113 A CN1838113 A CN 1838113A
Authority
CN
China
Prior art keywords
translation
note
document
type
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005101026029A
Other languages
English (en)
Inventor
长尾隆
馆野昌一
田中圭
中村浩太郎
榊原正义
彭新宇
斋藤照花
小山俊哉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of CN1838113A publication Critical patent/CN1838113A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

翻译处理方法、文档翻译装置和程序。提供了一种翻译处理方法,其包括:登记具有对应翻译规则的注释的类型;识别要处理的文档;从所识别的文档中提取添加给文本元素的注释的类型;识别所提取的添加给所述文本元素的注释的类型;以及,根据所登记的与所识别的所提取的注释的类型相对应的翻译规则来翻译所述文本元素。

Description

翻译处理方法、文档翻译装置和程序
技术领域
本发明涉及提高机器翻译质量的方法。
背景技术
作为全球电子通信的重大进步的结果,使得对从一种语言到另一种语言的机器翻译的需求正在不断增加。机器翻译是这样进行的:通过使用计算机对字符进行分析并且应用字典数据或预定的算法、将字符(词语)用另一种字符(词语)代替、从而将特定的语言翻译成其他语言。如果文本不是以计算机可读格式存储的,换句话说,如果文本中不包含字符信息,那么在翻译处理之前,需要进行通过扫描装置读取印刷文本的OCR处理,以进行字符识别处理,并且提取字符信息。
机器翻译的一个优点是,能够在短时间内翻译大量文档;缺点是,经过翻译的文档的质量通常具有相对较低的标准。这一缺点的一个原因是,机器翻译处理使用诸如字典数据或算法的规则,并且这些规则不能根据所要翻译的文档的类型(例如,商业文档或科技文档)而灵活适用。结果,某些翻译出的词语未表达出原意。因此,为了提高机器翻译文本的质量,需要人们对翻译出的文本进行检查,并且将不适当的翻译词语替换成适当的词语。已经有了几种用于帮助人们校正机器翻译文本的技术。已知提供了这样一种技术:将原文中特定词语的译文显示在原文的行与行之间。已知还提供了这样一种技术:列出原文中的特定词语和它们的译文。
按照上述技术,能够在屏幕上与机器翻译文本相对照着来显示原始文本,从而使得人们能够更容易地改写机器翻译文本。不过,存在这样的问题:人们必须针对每个不适当的译文手工地输入适当的译文。这一问题降低了执行机器翻译的优势。
发明内容
鉴于上述情况提出了本发明。
为了解决以上所提出的问题,本发明提供了一种翻译处理方法,其包括如下步骤:将具有对应翻译规则的注释的类型登记在表格中;识别要处理的文档;从所识别的文档中提取出添加给文本元素的注释;识别所提取的添加给文本元素的注释的类型;并且根据所登记的与所识别的提取注释相对应的翻译规则来翻译文本元素。
附图说明
下面将根据附图对本发明的实施例进行详细说明,其中:
图1示出了根据本发明的一个实施例的文档翻译装置1的结构。
图2是用于说明在文档翻译装置1中执行的处理的流程图。
图3a示出了作为翻译对象的原始文本的一个示例。
图3b示出了在翻译处理期间的文本的一个示例。
图3c示出了在进行编辑处理期间的文本的一个示例。
图3d示出了经过编辑的文本的一个示例。
图4示出了注释类型与编辑方法之间的对应关系。
图5示出了指定字符、要使用的字典和要使用的字典的优先顺序之间的对应关系的表。
具体实施方式
接下来参照附图详细说明本发明的优选实施例。图1示出了根据本发明的一个实施例的文档翻译装置1的功能结构。如图所示,文档翻译装置1包括:控制单元10;存储器11;输入单元12;操作单元13;显示单元14;输出单元15。控制单元10具有用于使CPU控制文档翻译装置1中的各个单元的处理器。而且,控制单元10具有文档结构分析单元101、注释识别单元102、字符识别单元103和翻译处理单元104。文档结构分析单元101使用预定的算法对通过输入单元12扫描得到的作为图像数据的文档进行版面分析,并且确定文档的版面结构。更具体地,文档结构分析单元101确定在该文档中是否既包含词语又包含符号(比如插图、格线或备注(下文中称为注释)之类的附加信息)。如果在该文档中包含注释,则将包含字符部分的区域和包含注释部分的区域分开。
注释识别单元102对所分离并提取的字符以外的区域的图像数据进行预定的分析处理,以确定注释的类型和添加有注释的部分(即,形成文本的元素,例如词语和术语)。所提取出的注释的类型包括多个项目,例如批注标签、流动边框、下划线、高亮显示、引出线和注解(插在原始文本行间的词语)。将与注释的类型和添加有注释的部分相关的信息存储在存储器11中。字符识别单元103对由文档结构分析单元101分离并提取出的区域进行字符识别处理并且提取出字符信息(词汇符号),以将它们存储在存储器11中。翻译处理单元104使用存储在存储器11中的字典数据和预定的算法来替代由字符识别单元103提取的字符信息,以进行翻译处理,通过这一翻译处理,将文档的语言翻译成用户指定的语言。将经过翻译的文本数据以及原文中的词语与译文中的词语之间的关系存储在存储器11中。
对于添加有注释的文档的图像数据,使用了文档结构分析单元101、注释识别单元102、字符识别单元103和翻译处理单元104来对有注释的部分和字符部分进行翻译处理;其中,实现了对与注释类型相关的信息、与原文中添加有注释的词语相关的信息和与针对各个注释所翻译的词语相关的信息进行提取的功能。下面将给出在控制单元10中进行的处理的具体内容。在控制单元10中实现的各个单元的功能可以通过各个独立的处理器来实现,或者可以通过运行多个软件应用的一个处理器来实现。
存储器11是诸如RAM、ROM和硬盘之类的存储装置,该存储器存储有在控制单元10中进行上述处理时使用的字典数据库DB或其他参考数据。如图1所示,数据库DB存储有可在翻译处理中使用的多种字典数据111~115。数据库DB还存储有翻译规则表Tr(稍后将详细描述),该翻译规则表存储着与编辑方法相对应的注释类型。数据库DB还存储有字典表Tp(稍后将详细描述),该字典表Tp存储着指定词语与在翻译该词语的过程中要使用的字典的优选顺序之间的对应关系。
输入单元12例如指扫描仪装置,其将印刷在纸张上的文档扫描为数字图像数据并且将该数据提供给控制单元10和存储器11二者。操作单元13b指诸如键盘或鼠标的输入装置;在文档翻译装置1的用户指定要翻译的文档、在字典表Tp和翻译规则表Tr中写入信息、指定要进行编辑的部分或输入任何其它必要的信息时,使用该操作单元。输入指令或信息被提供给控制单元10。显示单元14包括用于绘图的处理器(未示出)和诸如液晶显示器之类的显示装置(未示出);在从控制单元10给出指令时,显示单元在屏幕上为用户显示原文、进行翻译的文档或各种类型的信息。用户参照显示单元14的显示画面并且通过输入单元12输入指令,以使文档翻译装置1执行各种处理。输出单元15是用于将经过编辑的原稿打印在纸张上的打印机、用于向打印装置提供进行了附加信息编辑处理之后获得的文本数据的通信接口,或者用于将文本数据存储在诸如闪存或CD-ROM的存储介质中的存储装置。
接下来将参照图2~5来说明文档翻译装置1的一个操作示例。应该注意:在图4中所示的翻译规则表Tr和图5中所示的字典表Tp中预先存储必要信息。
图2是表示特征信息的登记处理的流程图。如图所示,用户输入预定指令来指定原始语言和要翻译的语言的类型,将用户想要进行翻译的文档(在下文中,将把这种文档称为翻译对象文档)放置在扫描仪装置上,并且对该文档进行扫描以获得图像数据(步骤S10)。在下面的说明中,将针对将英文文本翻译成日文的情况给出实例。图3a示出了构成翻译对象的原始文本的一个示例。再次参照图2,通过分析所获得的图像数据的文档结构识别出包含字符的区域(步骤S11),并且在字符识别处理之后提取字符信息(步骤S12)。然后,对所提取的字符信息进行翻译处理(步骤S13),并且将翻译结果输出给显示单元14(步骤S14)。应该注意:翻译处理中使用的字典数据是预先设定的。具体来说,选择了英日字典111,该字典是标准字典。在图3b中示出了经过翻译的文本的一个示例。控制单元10在显示单元14的显示屏上显示了诸如“翻译已完成,如果存在任何编辑对象部分,请指定该部分。”的消息,从而要求用户对这样的部分进行确认。
再次参照图2,用户参阅显示画面来校对是否有错译或任何进行了不适当翻译处理的部分。当发现了错译时,用户对所错译的部分添加与用户期望的编辑方法相对应的注释(步骤S15)。参照图3c,将详细示出该处理。在该图中,给出了这样一个示例:用户总共发现了五处不适当的翻译处理:“big-endian(訳語なし)”、“little-endian(訳語なし)”、“骨形成タンパク質”、“武勇殊勲章”和“通訳”。“big-endian”和“little-endian”是计算机技术术语,因此,在翻译处理中使用的英日字典111中未包含有适当的翻译。出于这一原因,对该文本添加了“无适当词语”一词。“骨形成タンパク質”、“武勇殊勲章”和“通訳”分别是“BMP”、“CGM”和“解釈”的错译。当发现错译时,作为编辑对象部分,用户利用鼠标或键盘将预定的注释添加到译文中。
更加具体地讲,如图4所示,添加了与用户期望的编辑方法相对应的注释。例如,当用户希望将“big-endian”和“little-endian”保持原样时,因为它们是计算机技术术语并且通常采用原始语言(即,用户希望将“big-endian(訳語なし)”编辑为“big-endian”并且将“little-endian(訳語なし)”编辑为“little-endian”),则对这些词语添加流动边框作为注释。在原文中,“骨形成タンパク質”对应于“BMP”,因此,如果用户认为直接采用原文是最好的(即,将“骨形成タンパク質”编辑为“BMP”),则进行诸如对“骨形成タンパク質”加下划线的注释处理。对于“通訳”,如果用户期望采用包含在英日字典111中的多个备选词之中的给予了次优选顺序的定义,则使所翻译的“通訳”高亮显示。对于“武勇殊勲章”,当用户选择适用于该文档的领域的字典并且希望采用记录在该字典中的翻译(比如“CGM(Computer GraphicMetafile)”)时,则添加引出线和指定该文档的领域的词语(在该情况下,是“图像处理”)作为注释。也可以将该注释显示在翻译文的周围,如附图3c的显示画面所示,从而使得用户能够记住应用的对应部分。通过检查图4中所示的对应关系,用户能够确定与所期望的编辑方法相对应的标注的类型。
再次参照图2,当用户输入预定的指令来确定编辑对象部分及其注释并且完成了对期望编辑对象部分添加期望注释的处理时,生成与图3c中所示的添加有注释的文本相对应的图像数据并且启动用于该图像数据的编辑处理(重译处理)(步骤S20)。然后,在文档结构分析单元101中对图像数据进行文档结构分析,并且分离和提取字符信息和注释(步骤S21)。在步骤S21之后,注释识别单元102针对各个注释,确定添加有注释的译文部分和注释的类型(步骤S22)。应该注意:添加注释(附图3b的示例中的“图像处理”),执行字符识别处理,以确定这些字符。
然后处理过程进入步骤S23,在该步骤中,查询翻译规则表Tr并且确定与所识别的注释类型相应的编辑方法。在这个步骤中,当在该表中将一附注识别为注释时,文档结构分析单元查询字典表Tp,以确定与包含在该附注中的字符相对应的字典和使用各个字典的优先顺序。图5示出了字典表Tp的存储内容。如该图所示,字典表Tp记录有与指定词语相对应的可用字典及其优先顺序。例如,如果添加了附注“图像处理”,该词语包括有登记在字典表Tp中的指定词“图像”;因此,按照英日字典111、日英字典112和图像处理术语字典113的顺序使用字典。换句话说,为了翻译作为附注对象的词语(在图3c的示例中为“武勇殊勳章”;指的是原文中的CGM),则排除了在先使用的英日字典111作为备选对象。也排除了在优先顺序中处于下一位的“日英字典112”,因为这个字典仅用于日英翻译。因此,确定出通过对编辑对象词语(CGM)应用图像处理术语字典113(该字典在优选顺序中处于第三位)来进行翻译处理。结果,选择了记录在图像处理术语字典113中的“CGM(Computer GraphicMetafile)”作为“CGM”的译文。
再次参照图2,当确定了编辑方法时,进行与该编辑方法相对应的编辑处理(重译处理)(步骤S24)。图3d示出了如下的文本:在该文本中,根据对应的编辑方法对上述的编辑对象部分(共计五个)分别进行编辑。然后控制单元10在显示单元14的显示屏上显示诸如“编辑(重译)处理已完成。要增加任何编辑对象部分,请再次选定它们”的消息,从而促使用户检查编辑结果。在确定编辑结果不令人满意或者在文本的另一个部分找到了另一处错译的情况下,用户输入预定的指令。响应于该指令,处理返回到图2的步骤S15,以再次接受编辑对象部分的指定。当对编辑后的内容满意时,用户输入预定的指令,以终止翻译处理。以预定的方式输出所接受的译文(步骤S25)。
如上所述,通过使用文档翻译装置1,用户对经翻译的文档进行确认,并且通过使用注释来指定所要编辑的部分和编辑方法来校正错译部分。这样,能够在短时间内获得高质量的译文,而不会为用户增加额外的负担。
<改进>
本发明不限于上述的实施例,而是可以以多种方式加以改进。下面将给出这些改进。在上述实施例中,文档翻译装置1使用了标准字典(英日字典111)来进行翻译处理(暂时翻译处理),并且用户在检查翻译结果之后指定编辑对象部分;在另一实施例中,还将注释添加在原始文本上,并且可以在注释的基础上进行翻译处理。即,由扫描仪读取带有附加注释的原始文本,并且对注释的类型和添加有注释的部分进行识别,以便在查询翻译规则表Tr和字典表Tp之后确定翻译方法(原文是否是优选的、要使用哪个字典和优先顺序)。在该实施例中,省略了一次翻译处理;因此,在用户能够在检查了原始文本之后预知可能发生错译的部分的情况下,本实施例更加有效。
在将注释添加给暂时翻译的文本时,也可以将包括该文本的文档打印在例如纸张上,以使用户能够将注释写在纸上。在这种情况下,需要重新扫描带有注释的文档,以获取该文档的图像数据。
此外,在上述实施例中,在指定了每个编辑对象部分之后进行编辑(重译)处理;然而,也可以在每次将注释添加到编辑对象部分上时进行编辑处理。
显然,文档的内容、注释的类型、附注的具体词汇和所使用的字典并不局限于上述情况。
为了解决以上所提出的问题,本发明提供了一种翻译处理方法,其包括:对具有对应翻译规则的注释的类型进行登记;识别要处理的文档;从所识别的文档中提取添加给文本元素的注释;识别添加给该文本元素的注释的类型;并且根据所登记的与所识别的所提取的注释的类型相对应的翻译规则对所述文本元素进行翻译。根据本发明的实施例,用户指定作为编辑对象的部分,以使得在进行翻译时能够对该部分应用期望的翻译规则,从而提高了翻译质量。
在其他实施例中,本发明的翻译处理方法,其中将具有对应的翻译规则的注释的类型登记在表中。
在一实施例中,所述翻译规则包括指定在翻译处理中使用的字典,或者根据字典的优先顺序使用字典。
在一实施例中,本发明提供了一种文档翻译装置,其包括:存储器,其将具有对应翻译规则的注释的类型存储在表中;识别部分,其识别要处理的文档;提取部分,其从在识别部分中识别的文档中提取注释的类型和字符信息;注释识别部分,其识别要对其添加在提取部分步骤提取的注释的文本元素;翻译规则确定部分,其通过查询所述表来确定与所述注释类型相对应的翻译规则;以及,翻译执行部分,其通过应用在翻译规则确定部分确定的翻译规则来对在注释识别部分中识别的文本元素进行翻译。
在一实施例中,本发明提供了一种计算机可读程序,其使计算机用作:存储器,其存储具有对应翻译规则的注释的类型;识别部分,其识别待处理的文档;提取部分,其从由识别部所识别的文档中提取要添加给文本元素的注释;注释识别部分,其识别由提取部分提取的添加给文本元素的注释的类型;以及,翻译执行部分,其根据与由注释识别部分所识别的注释的类型相对应的翻译规则来翻译文本元素。
出于例举和说明的目的提供了对本发明的实施例的上述说明。并非试图穷举或将本发明限制于所公开的精确形式。显然,对本领域技术人员来说,多种修改和变化是显见的。选择和描述这些实施例是为了最明晰地解释说明本发明的原理及其实际应用,从而使得本领域的其它技术人员能够针对各种实施例并且通过适用于预期特定用途的各种修改理解本发明。本发明的范围由所附的权利要求及其等同物来限定。
通过引用将于2005年3月25日提交的日本特开2005-90203号公报的全部内容(包括说明书、权利要求、附图和摘要)并入本文。

Claims (13)

1、一种翻译处理方法,包括:
登记具有对应翻译规则的注释的类型;
识别要处理的文档;
从所识别的文档中提取添加给文本元素的注释;
识别所提取的添加给文本元素的注释的类型;以及
根据所登记的与所识别的所提取的注释的类型相对应的翻译规则来翻译所述文本元素。
2、根据权利要求1所述的翻译处理方法,其中将所述注释类型与对应的翻译规则登记在表中。
3、根据权利要求1所述的翻译处理方法,其中所述翻译规则包括指定在翻译处理中使用的字典。
4、根据权利要求3所述的翻译处理方法,其中根据所述字典的优先级来使用所述字典。
5、一种文档翻译装置,包括:
存储器,其存储具有对应翻译规则的注释的类型;
识别部分,其识别要处理的文档;
提取部分,其从由所述识别部分识别的文档中提取添加给文本元素的注释;
注释识别部分,其识别由所述提取部分提取的添加给所述文本元素的注释的类型;以及
翻译执行部分,其根据与由注释识别部分识别的注释的类型相对应的翻译规则来翻译所述文本元素。
6、根据权利要求5所述的文档翻译装置,其中将所述注释与对应的翻译规则登记在表中。
7、根据权利要求5所述的文档翻译装置,其中所述翻译规则包括指定在翻译处理中使用的字典。
8、根据权利要求7所述的文档翻译装置,其中根据所述字典的优先级来使用所述字典。
9、一种计算机可读程序,其使计算机用作:
存储器,其存储具有对应翻译规则的注释的类型;
识别部分,其识别要处理的文档;
提取部分,其从由所述识别部分识别的文档中提取添加给文本元素的注释;
注释识别部分,其识别由所述提取部分提取的添加给文本元素的注释的类型;以及
翻译执行部分,其根据与由注释识别部分识别的注释的类型相对应的翻译规则来翻译所述文本元素。
10、根据权利要求9所述的计算机可读程序,其中将所述注释与对应的翻译规则登记在表中。
11、根据权利要求9所述的计算机可读程序,其中所述翻译规则包括指定在翻译处理中使用的字典。
12、根据权利要求11所述的计算机可读程序,其中根据所述字典的优先级来使用所述字典。
13、一种翻译处理方法,其包括以下步骤:
将具有对应翻译规则的注释的类型登记在表中;
识别要处理的文档;
从在所述识别步骤识别的文档中提取注释类型和字符信息;
识别添加有在所述提取步骤提取的注释的文本元素;
通过查询所述表来确定与所述注释类型相对应的翻译规则;
通过应用所述翻译规则确定步骤中确定的翻译规则,来对在所述注释识别步骤中识别的文本元素进行翻译。
CNA2005101026029A 2005-03-25 2005-09-06 翻译处理方法、文档翻译装置和程序 Pending CN1838113A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005090203 2005-03-25
JP2005090203A JP2006276915A (ja) 2005-03-25 2005-03-25 翻訳処理方法、文書翻訳装置およびプログラム

Publications (1)

Publication Number Publication Date
CN1838113A true CN1838113A (zh) 2006-09-27

Family

ID=37015511

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005101026029A Pending CN1838113A (zh) 2005-03-25 2005-09-06 翻译处理方法、文档翻译装置和程序

Country Status (3)

Country Link
US (1) US20060217956A1 (zh)
JP (1) JP2006276915A (zh)
CN (1) CN1838113A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102495835A (zh) * 2011-10-21 2012-06-13 传神联合(北京)信息技术有限公司 标签保护方法
CN101620680B (zh) * 2008-07-03 2014-06-25 三星电子株式会社 字符图像的识别和翻译方法以及装置

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9015573B2 (en) 2003-03-28 2015-04-21 Abbyy Development Llc Object recognition and describing structure of graphical objects
US9224040B2 (en) 2003-03-28 2015-12-29 Abbyy Development Llc Method for object recognition and describing structure of graphical objects
US20070172130A1 (en) * 2006-01-25 2007-07-26 Konstantin Zuev Structural description of a document, a method of describing the structure of graphical objects and methods of object recognition.
JP4626356B2 (ja) * 2005-03-25 2011-02-09 富士ゼロックス株式会社 付加情報を含む電子文書を編集する方法、装置およびプログラム
RU2006101908A (ru) * 2006-01-25 2010-04-27 Аби Софтвер Лтд. (Cy) Структурное описание документа, способ описания структуры графических объектов и способы их распознавания (варианты)
US8571262B2 (en) * 2006-01-25 2013-10-29 Abbyy Development Llc Methods of object search and recognition
US8233714B2 (en) 2006-08-01 2012-07-31 Abbyy Software Ltd. Method and system for creating flexible structure descriptions
US7987416B2 (en) * 2007-11-14 2011-07-26 Sap Ag Systems and methods for modular information extraction
US9418061B2 (en) * 2007-12-14 2016-08-16 International Business Machines Corporation Prioritized incremental asynchronous machine translation of structured documents
JP2010055235A (ja) * 2008-08-27 2010-03-11 Fujitsu Ltd 翻訳支援プログラム、及び該システム
JP5204244B2 (ja) 2008-11-27 2013-06-05 インターナショナル・ビジネス・マシーンズ・コーポレーション 誤訳の検出を支援する装置及び方法
US9460082B2 (en) * 2012-05-14 2016-10-04 International Business Machines Corporation Management of language usage to facilitate effective communication
US9317500B2 (en) * 2012-05-30 2016-04-19 Audible, Inc. Synchronizing translated digital content
US9588675B2 (en) 2013-03-15 2017-03-07 Google Inc. Document scale and position optimization
CN104125548B (zh) * 2013-04-27 2017-12-22 中国移动通信集团公司 一种对通话语言进行翻译的方法、设备和系统
CN103500158A (zh) * 2013-10-08 2014-01-08 北京百度网讯科技有限公司 批注电子文档的方法和装置
JP2016062452A (ja) * 2014-09-19 2016-04-25 富士ゼロックス株式会社 情報処理装置およびプログラム
JP6303979B2 (ja) * 2014-10-29 2018-04-04 株式会社リコー 情報処理システム、情報処理装置、情報処理方法およびプログラム
JP6250013B2 (ja) * 2014-11-26 2017-12-20 ネイバー コーポレーションNAVER Corporation コンテンツ参加翻訳装置、及びそれを利用したコンテンツ参加翻訳方法
US9881003B2 (en) * 2015-09-23 2018-01-30 Google Llc Automatic translation of digital graphic novels
US20200210530A1 (en) * 2018-12-28 2020-07-02 Anshuman Mishra Systems, methods, and storage media for automatically translating content using a hybrid language
US11074400B2 (en) * 2019-09-30 2021-07-27 Dropbox, Inc. Collaborative in-line content item annotations

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4623985A (en) * 1980-04-15 1986-11-18 Sharp Kabushiki Kaisha Language translator with circuitry for detecting and holding words not stored in dictionary ROM
JPH0664585B2 (ja) * 1984-12-25 1994-08-22 株式会社東芝 翻訳編集装置
JPS61184685A (ja) * 1985-02-12 1986-08-18 Hitachi Ltd 翻訳情報追加方法
US5349368A (en) * 1986-10-24 1994-09-20 Kabushiki Kaisha Toshiba Machine translation method and apparatus
USRE35464E (en) * 1986-11-28 1997-02-25 Sharp Kabushiki Kaisha Apparatus and method for translating sentences containing punctuation marks
US5111398A (en) * 1988-11-21 1992-05-05 Xerox Corporation Processing natural language text using autonomous punctuational structure
JPH02140868A (ja) * 1988-11-22 1990-05-30 Toshiba Corp 機械翻訳システム
JP2758952B2 (ja) * 1989-12-28 1998-05-28 富士通株式会社 日本語文書読取翻訳システムの修正時における表示方式
JP3176059B2 (ja) * 1990-11-15 2001-06-11 キヤノン株式会社 翻訳装置
JP2765665B2 (ja) * 1991-08-01 1998-06-18 富士通株式会社 タイポグラフィカル情報付き文書の翻訳装置
US5528491A (en) * 1992-08-31 1996-06-18 Language Engineering Corporation Apparatus and method for automated natural language translation
US6278967B1 (en) * 1992-08-31 2001-08-21 Logovista Corporation Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
EP0658259B1 (en) * 1992-09-04 2000-03-01 Caterpillar Inc. Integrated authoring and translation system
US5303151A (en) * 1993-02-26 1994-04-12 Microsoft Corporation Method and system for translating documents using translation handles
JPH08101837A (ja) * 1994-09-30 1996-04-16 Toshiba Corp 機械翻訳装置における翻訳規則学習方法
JPH09259126A (ja) * 1996-03-21 1997-10-03 Sharp Corp データ処理装置
US6470306B1 (en) * 1996-04-23 2002-10-22 Logovista Corporation Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
US5692073A (en) * 1996-05-03 1997-11-25 Xerox Corporation Formless forms and paper web using a reference-based mark extraction technique
US5848386A (en) * 1996-05-28 1998-12-08 Ricoh Company, Ltd. Method and system for translating documents using different translation resources for different portions of the documents
US6122606A (en) * 1996-12-10 2000-09-19 Johnson; William J. System and method for enhancing human communications
US5970455A (en) * 1997-03-20 1999-10-19 Xerox Corporation System for capturing and retrieving audio data and corresponding hand-written notes
JP3272288B2 (ja) * 1997-12-24 2002-04-08 日本アイ・ビー・エム株式会社 機械翻訳装置および機械翻訳方法
AU2001249777A1 (en) * 2000-03-31 2001-10-15 Amikai, Inc. Method and apparatus for providing multilingual translation over a network
US20020169592A1 (en) * 2001-05-11 2002-11-14 Aityan Sergey Khachatur Open environment for real-time multilingual communication
US6900819B2 (en) * 2001-09-14 2005-05-31 Fuji Xerox Co., Ltd. Systems and methods for automatic emphasis of freeform annotations
EP1550033A2 (en) * 2002-09-30 2005-07-06 Ning-Ping Chan Pointer initiated instant bilingual annotation on textual information in an electronic document
WO2004049196A2 (en) * 2002-11-22 2004-06-10 Transclick, Inc. System and method for speech translation using remote devices
KR100652007B1 (ko) * 2002-12-18 2006-12-01 가부시키가이샤 리코 번역 지원 시스템 및 그 프로그램
JP3987533B2 (ja) * 2003-03-14 2007-10-10 富士通株式会社 翻訳支援装置
US7369986B2 (en) * 2003-08-21 2008-05-06 International Business Machines Corporation Method, apparatus, and program for transliteration of documents in various Indian languages
US7451188B2 (en) * 2005-01-07 2008-11-11 At&T Corp System and method for text translations and annotation in an instant messaging session

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101620680B (zh) * 2008-07-03 2014-06-25 三星电子株式会社 字符图像的识别和翻译方法以及装置
CN102495835A (zh) * 2011-10-21 2012-06-13 传神联合(北京)信息技术有限公司 标签保护方法

Also Published As

Publication number Publication date
JP2006276915A (ja) 2006-10-12
US20060217956A1 (en) 2006-09-28

Similar Documents

Publication Publication Date Title
CN1838113A (zh) 翻译处理方法、文档翻译装置和程序
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
CN1841364A (zh) 文件翻译方法和文件翻译装置
CN100454293C (zh) 文档编辑方法和文档编辑设备
JP2836159B2 (ja) 同時通訳向き音声認識システムおよびその音声認識方法
CN100351839C (zh) 文档检索·阅览方法以及文档检索·阅览装置
CN1838114A (zh) 翻译处理方法、文档处理装置和存储程序的存储介质
JP2010515167A (ja) 文書保存システム
US20140059076A1 (en) Method and system for converting audio text files originating from audio files to searchable text and for processing the searchable text
US7359896B2 (en) Information retrieving system, information retrieving method, and information retrieving program
Ramel et al. AGORA: the interactive document image analysis tool of the BVH project
CN1838714A (zh) 文档处理设备
CN101833545A (zh) 数字资源加工过程中的数据标引方法
JP2007310501A (ja) 情報処理装置、その制御方法、及びプログラム
JP2003186889A (ja) 文書に注釈付けし、文書イメージから要約を生成する方法及び装置
Ramel et al. Interactive layout analysis, content extraction, and transcription of historical printed books using Pattern Redundancy Analysis
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
CN110941947A (zh) 一种文档编辑的方法、装置、计算机存储介质及终端
CN115272649A (zh) 分子结构图的图像识别、检索、录入方法及系统、介质
RU2571379C2 (ru) Интеллектуальная обработка электронного документа
JP2017091024A (ja) 入力支援装置
Gribomont OCR with Google Vision API and Tesseract
JP2009146196A (ja) 翻訳支援システム、翻訳支援方法および翻訳支援用プログラム
Hast et al. TexT-Text Extractor Tool for Handwritten Document Transcription and Annotation
JPH08161350A (ja) 電子ファイリング方法および装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication