CN1950820A - 嵌入式翻译文档方法和系统 - Google Patents

嵌入式翻译文档方法和系统 Download PDF

Info

Publication number
CN1950820A
CN1950820A CNA2005800134861A CN200580013486A CN1950820A CN 1950820 A CN1950820 A CN 1950820A CN A2005800134861 A CNA2005800134861 A CN A2005800134861A CN 200580013486 A CN200580013486 A CN 200580013486A CN 1950820 A CN1950820 A CN 1950820A
Authority
CN
China
Prior art keywords
text
layer
translation
visible
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800134861A
Other languages
English (en)
Inventor
Y·M·尼曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MELINGO Ltd
Original Assignee
MELINGO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MELINGO Ltd filed Critical MELINGO Ltd
Publication of CN1950820A publication Critical patent/CN1950820A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

公开一种用于数字且计算机可读的文档的模型,该文档包括对文档中的显性文本中出现的词和短语的嵌入式翻译的隐藏层。隐藏层包含将这些词和短语从文档的原始语言或显性语言到任何给定语言或多种给定语言的翻译。当用户使用操作方式主动请求查看隐藏层中的嵌入式翻译时,它们变成显性的。翻译由计算机程序自动插入或由翻译人员人工插入。文件的格式在缺省情况下将呈示原始文本,而在特定用户激活下将呈示翻译。嵌入式翻译还可被搜索引擎使用,以便除了原始语言外还对以嵌入式翻译层中出现的语言的文档的内容索引。

Description

嵌入式翻译文档方法和系统
相关申请的交叉引用
本申请要求2004年3月2日提交的美国临时专利申请序列号60/548889的权益。
技术领域
本发明涉及用于计算化语言翻译的系统和方法。
背景技术
从一种语言至另一种语言的计算化翻译正在是增长中的技术发展领域。但是,提供全版机器翻译的引擎,如Babelfish(http://babelfish.altavista.com/)和Systran(http://www.systransoft.com/)仍无法生成准确且可靠的结果。语义歧义是机器翻译的一个障碍,词法歧义是另一个障碍,以及再一些障碍是人类语言的特殊本质和复杂性以及语言理解对真实世界知识的依赖所导致的。有大量证据显示完全自动且高质量的机器翻译是不可能的,这开始于Y.Bar Hillel所著“自动翻译语言的现状”(Y.Bar Hillel,″The Present Status of AutomaticTranslation of Languages,″Advances in Computers VI,pp.91-163(1960)),其中在原理上说明了高质量的机器翻译是无法实现的,而更近的时间,例如Alan K.Melby所著“计算机翻译为什么不能更像人?”(Alan K.Melby,″Why Can′t a Computer Translate More Like a Person?″Translation,Theory and Technology,1995 Barker Lecture(http://www.ttt.org/theory/barker.html)(1995))。
机器翻译产生的一些结果可能得到与文本的源语言相差甚远的含义。通常,查看翻译成另一种语言的整个版面的用户并未意识到与原文本缺乏一致性或完全无法理解所翻译成的文本的含义,如图1所示。图1图示Babelfish翻译的一段文本的屏幕截图,翻译引擎使其含义模糊不清。因此,因为任何给定语言中常见的固有歧义,只有目标语言的机器翻译文档往往令人误解或完全不可理解。
字典查询产品,如“Babylon”和Quickdic(在如下网址提供:http://www.forest.impress.co.jp/article/1999/04/08/quickdic.html)和Dr.Mouse(在如下网址提供http://www.jp.jp.joshin.jp/products/justsystem/drmouse/),以及基于服务器的程序,如POPjisyo(http://www.popjisyo.com/)和Todd David Rudick的Rikai(http://www.rikai.com/)均不是翻译引擎,但是提供类似于印刷的字典的单语或双语字典定义,只是使用计算机界面并采用完全或部分下载到用户的客户端的词典。字典查询与翻译在许多方面相差很大,包括无法在不同上下文(上下文相关性)中对相同的输入词提供不同的翻译,以及无法将屈折形式、而不仅仅是基本形式翻译成目标语言中的对应屈折形式。
虽然在词和短语识别方面(如Rubin等人的美国专利号6,393,433公开的)或上下文指示符(context indicator)方面(如Rosenschein等人的美国专利号6,341,306和6,519,631中公开的)已经有一些尝试,但是它们只提供语言翻译系统中需要的一些功能特征。在技术发展触及类型更广泛的用户以及通过企业内部网和因特网在他们之间共享信息的渐趋多样性的全球化社会中,语言屏障仍然是障碍。因此,令人期待服务器的搜索系统中的计算机化语言翻译,它在不弃用原文本的情况下生成含有上下文相关翻译的单独文件。这种系统允许用户得到来自搜索引擎的搜索结果的一些部分的上下文相关翻译,同时仍能够看到原文本,由此可以更好地知道可从各种链接得到什么信息,即便是使用外语链接和描述的,同时无需将翻译软件加载到用户的计算机。
发明内容
本发明是一种支持数字且计算机可读的信息的系统和方法,该数字且计算机可读的信息包含该信息的显性文本中出现的词和短语的嵌入式翻译的隐藏层。隐藏层包含这些词和短语从文档的源语言或显性语言到任何给定语言或多种给定语言的翻译。当用户根据给定词或短语使用鼠标动作、按键组合、屏幕上的触摸或任何其他操作方式主动请求查看隐藏层中的嵌入式翻译时,它们变成显性的。翻译由计算机程序自动插入或由翻译人员人工插入。文件的格式在缺省情况下将呈示原文本,而在特定用户激活下将呈示翻译。嵌入式翻译还可被搜索引擎使用,以便除了源语言外还对以嵌入式翻译层中出现的语言的文档的内容索引。
附图说明
图1是使用现有技术的机器翻译的屏幕截图;
图2是演示本发明方法的示意图;
图3是Window中具有HTML文本的本发明实施例的一个示范屏幕截图;
图4A是HTML文件的程序段;
图4B是图4A的程序段的翻译;
图5是根据本发明的示范过程的流程图;
图6是根据本发明的示范HTML工具提示(tooltip)文件的程序段;
图7是根据本发明的示范HTML工具提示文件的程序段;
图8是根据本发明的示范RTF文件的程序段;以及
图9是根据本发明的Microsoft Word中的RTF文件的示范屏幕截图。
具体实施方式
本发明的嵌入式翻译文档(ETD)涉及创建含有翻译的子层的数字信息,数字信息包括如Web页面或字处理器文档的电子文档。该文档的可见层中的每个词或一些情况中的短语在该隐藏层中具有与之相关联的恰当翻译。为了查看该翻译,文档的读者具有随意使用的操作方式或选择器,用于响应该读者对可见文本层的一部分的选择,以便在可见层的对应部分上方展示不可见层的一部分,包括但不限于,在所述可见部分上悬停、单击或双击,用电子笔触摸它、使用触摸敏感显示屏通过手指触摸它或使用游戏杆指向它。
可以由计算机程序自动创建或通过人工编辑(下文将对此予以论述)来创建ETD。ETD包括其中出现的词从源语言到任何其他目标语言或多种语言的翻译。当用户使用上述操作方式的其中之一请求该翻译时,例如在小弹出式窗口中、在屏幕底部或在任何其他位置和通过显示器(例如CRT显示器、LCD、TV等)的任何熟知或常规使用的方式显示该翻译。应该注意,可以使用音频系统来实施本发明,该音频系统单独或结合可视显示器提供所翻译的部分的音频表达。图2中图示了ETD模型,图2是演示显示层202和隐藏层204的示意图。显示层的翻译、即隐藏层204仅在用户请求它时显示;否则显示源文档而不显示翻译。显示层202的原文本可以是任何文本文档,如HTML、DOC、PDF或其他文档文件类型。
因为翻译已经作为底层204存在于页面中,所以无需安装和调用任何附加专用翻译程序来显示该翻译;使用诸如HTML文件中的工具提示功能或数据文件本身中的脚本的现有功能实现该显示。也无需任何因特网连接,并且当通过例如电子邮件发送页面时,页面中包含了翻译。不像诸如“Babylon”(http://www.babylon.com/)的可单击词典那样,并不一定需要客户端应用来调用ETD的原文本中出现的词的翻译。但是,可设想本发明的其他实施例,以使该模型可以使用客户端应用程序来实施。
翻译以仅在用户请求时才使之可被用户获取的方式在ETD中出现;除非用户激活翻译,否则它们保持隐藏不可见。仅在用户激活时,通过操作方式每个给定词的嵌入式翻译才是显示装置上给出并显示的翻译,如图3所示。图3图示Window中具有HTML文本的本发明实施例的屏幕截图300,其中法语302作为显示文本,而英语304作为隐藏的翻译语言。在图3中,隐藏的翻译语言304浮动于原法语的显示文本302之上。该模型300允许用户阅读以其源语言的页面,并接收该页面中出现的任何词的即时翻译。不像试图将整个页面从其源语言翻译成另一种语言的自动机器翻译服务(MT)那样,在ETD中,源语言的文本保持完整,而仅作为隐藏层基于每个词或每个短语添加翻译。对于知道一些源语言的文本的人,即使是非常有限的,该产品和方法也提供了更可信的方式来全面地理解文档的文本。
ETD给予用户对源语言和目标语言的访问权;因此在读者知道一些源语言的情况中,他或她可以使用此知识理解文本的主要部分,并仅在需要时参考嵌入式翻译。ETD的另一个好处是,它们不限于就每个给定的源语言词提供单一目标语言翻译。换言之,可以在翻译中保留某一数量的歧义。例如,考虑具有英语的原文本的文档,其中出现如下句子:“the inspectors are looking for arms.”在具有西班牙翻译层的ETD文档中,词“arms”将被翻译成“brazos,armas”。因此,该句子的读者将能够推断出在该上下文中“armas”是恰当的翻译,其中相比之下,机器翻译的文档非常可能在此情况中不恰当地选择错误的翻译“brazos”、即人体意义上的手臂,而留给读者无法理解的西班牙翻译文本。
作为ETD如何考虑上下文的另一个说明,词“world wide web”是英语中熟知的一个短语。在含有法语翻译层的ETD文档中,“worldwide web”可能被翻译成“internet”。因此,读者将能够认识到上下文中该三个词通常组成具有含义“internet”的短语,而相比之下,常规机器翻译非常可能不恰当地将每个词分开翻译,从“world”翻译成“monde”,即地球意义上的世界,将“wide”翻译成“au loin”或“gross”,即厚度意义上的宽,以及将“web”翻译成“enchainement”,即蜘蛛意义上的蜘蛛网。
ETD考虑上下文的另一种方式是翻译形式的合成。可以将英语复数名词、如“books”翻译成相应的西班牙复数形式“libros”,但是仅在词“books”的上下文说明该词是复数形式的名词,而非第三人称一般现在时变形中的动词,如该上下文中“he books”。
创建ETD的方法可以由计算机程序自动实施或通过人工编辑来实施。
用于创建ETD的计算机程序包括如下过程(作为包含文本的数字文件格式的专用情况,以HTML文件格式描述该示范实施例):
1.接收使用源语言的输入文件。
2.分析输入文件,并在其中识别是词而非格式标记、指令或数字的字符串。例如,图4A是HTML文件的程序段,读作<HR align=leftwidth=570>和<UL>Ne me quitte pas<BR>。在图4A中,“<HRalign=left width=570>”设置文本的布局。仅需要翻译法语的词“Ne mequitte pas”,英语含义为“Do not leave me”。
3.将每个词发送到双语词典并接收它的翻译。例如,图4a的HTML文件将“Ne”发送到将它与“ne...pas”相关联的双语词典,并将其翻译成“not”;将“me”直接翻译成“me”;将“quitte”翻译成“leave”;并且将“pas”与“ne...pas”相关联,并将其翻译成“not”。
4.如图4b所示,在HTML文件中词或短语的旁边插入该词或短语的目标语言翻译,其中使用在该页面的缺省显示中使该翻译不可见但关联到原词、并在它被用户触发的情况下可供显示的格式。
5.将该页面与其底层不可见翻译一起保存。(未示出)。
虽然上文的描述是如何使用HTML文件格式创建ETD的一个示例,但是图5中一般性地图示了用于创建ETD的示范过程的如下流程图。在读取步骤401中,系统400读取采用其源语言的文档。然后在分析步骤402分析该文档。在分析步骤402中,单独提取文档的每个实义词。在步骤403中,系统400判断所提取的词是否采用源语言。如果发现未采用源语言,则系统400返回到分析步骤402,并提取下一个实义词。如果发现采用源语言,则在上下文检查步骤404,系统400检查当前词的左边和右边的词。如果当前词和该当前词左边或右边的词的其中之一或二者构成一个短语,则系统400将它们一起发送到双语词典,以便通过短语翻译步骤405翻译。如果当前词不是短语的一部分,则系统将其发送到双语词典,以便通过词翻译步骤406翻译。一旦完成短语翻译步骤405或词翻译步骤406的其中之一,系统400前进到嵌入步骤407。在嵌入步骤407中,将翻译的词或短语嵌入在嵌入式文档中,并将其与源文档中的当前词相关联。完成步骤408判断当前词是否是源文档中的最后一个词。如果不是,则返回到分析步骤402,并从分析步骤402重复这些步骤。如果当前词是源文档中的最后一个词,则系统400执行保存步骤409,其中保存该嵌入式文档。
创建ETD的人工过程遵循图5所述的相同步骤,它使用人工翻译而非计算机词典/翻译程序,并使用文本编辑程序来插入翻译,而非自动插入。还可以采用上文的任何组合。例如,可以执行与人工文本编辑组合的计算机翻译或在人工翻译之后自动插入。
要理解的是在不背离本发明范围的前提下可以利用创建ETD的其他过程。可以采用任何格式表示ETD,包括HTML文档、字处理器文档和PDF文件。ETD模型200不限于特定文件格式,相反,它适用于其中启用底层的用于显示文本的任何文件。因此除了HTML及其扩充外,ETD模型可应用于任何常规方式熟知的字处理器格式,如Microsoft Word Doc、Word Perfect、AppleWorks、RTF、PDF文档等。可以通过用于这些格式的各自常规查看器来查看ETD表示,这些格式包括但不限于用于HTML文件的Microsoft Internet Explorer和Netscape Mozilla、用于RTF文件的Microsoft Word以及用于PDF文件的Adobe Acrobat Reader。
在图6-9中示出三个应用示例。图6示出使用内置HTML工具提示类特征的示范应用,在此情况中使用的是“span”的“title”属性。其特征是HTML文档源数据的示例,上述HTML文档源数据包含使用HTML工具提示的底层翻译。在该示例中,当鼠标悬停在显示的法语词“s′oublier”上时,“span”标记将使该词的英语翻译弹出,其中包含该词的词法翻译“(to)forget itself,(to)forget himself”。
图7示出同样以HTML格式、但是使用Java脚本功能的另一个示范表示。其特征是HTML文档源数据的示例,上述HTML文档源数据包含使用弹出Java脚本功能的底层翻译。并不使用HTML“span”标记,该示例示出如何使用Java脚本功能(在此情况中为“ShowPopupText”和“ClosePopupText”)以便创建页面。缺省情况下显示源英语文本“love”,当读者将鼠标悬停在该英语文本上时(从而触发了“ShowPopupText”功能),显示西班牙的弹出翻译“amor”。
图8示出使用伪超链接标记的RTF格式的示范表示。其特征是RTF文档源数据的示例,上述RTF文档源数据包含使用RTF文件的现有超链接功能的底层翻译。翻译作为伪超链接输入,这些伪超链接链接到虚书签,但是将翻译显示为超链接屏幕提示。当鼠标悬停在源语言词上时,该翻译将会显示。出于说明目的,该词以阴影显示。
图9是图8中示出的RTF文件在通过Microsoft Word查看时的示范屏幕截图。它说明将如何在Microsoft Word应用程序上显示相同的表示。在图9中,鼠标正悬停在词“we”上,而以“nosotros”为翻译。
ETD模型可以具有许多不同的实施。它可以用于词至词的翻译,从而允许用户提出文档中所含的词的翻译,如上文论述。它还可以用于翻译短语,并且包括先进的词法功能,如源语言的词法分析(例如短语识别)和目标语言的词法生成(例如语法形式)。例如,可以将源语言的过去时的动词翻译成目标语言的过去时的动词。
ETD模型还可以应用于跨语言搜索应用中。可以使用英语关键字搜索包含英语翻译的隐藏层的法语文档。例如,说英语的用户可以搜索Google搜索引擎(http://www.google.com/)以查找仅在法语文档中出现的信息。如果这些文档包含隐藏的英语翻译,则用户可以使用英语关键字获取信息。还可以针对ETD处理Google动态创建的结果页面,这样用户可以将鼠标悬停在这些结果并查看对于他或她来说这些结果是否相关。
上文描述和附图应仅视为实现本发明特征和优点的示范实施例的说明。
在不背离本发明精神和范围的前提下,可以对特定过程条件和结构进行修改和替代。因此,本发明不应视为由前文描述和附图限定,而仅由所附权利要求的范围限定。

Claims (19)

1.一种结构数据文件,包括:
包含第一语言的文本的可见层;
不可见层,在所述可见层下面并包含所述第一语言的多个部分的以一种或多种第二语言的上下文相关翻译;以及
不可见标记,将所述可见层的多个部分链接到所述不可见层的对应部分,由此允许通过所述文件的用户触发而展示所述不可见层的一部分,其中当显示所述可见层时,所述可见文本的翻译是可见的。
2.如权利要求1所述的结构数据文件,其特征在于,所述数据文件是基于服务器的。
3.如权利要求1所述的结构数据文件,其特征在于,所述第一语言的至少一些部分包含多于一个词的短语。
4.如权利要求3所述的结构数据文件,其特征在于,所述不可见层的所述部分被直接展示在所述可见层的对应部分上方。
5.如权利要求3所述的结构数据文件,其特征在于,所述不可见层的所述部分被展示在不覆盖所述可见层的对应部分的位置。
6.如权利要求1所述的结构数据文件,其特征在于,所述结构数据文件链接到至少第二结构数据文件。
7.如权利要求6所述的结构数据文件,其特征在于,所述结构数据文件是搜索引擎结果列表,并且所述第二结构数据文件是许多列出的结果的其中之一。
8.一种数据结构系统,包括:
处理器;
用于显示以第一语言的可见文本层的部件;
不可见文本层,包含所述可见文本层的以第二语言的翻译,其中所述翻译是所述第一语言的词法分析;
标记部件,用于将所述不可见文本层链接到所述可见文本层,其中所述不可见文本层与所述可见文本层具有部分对部分的对应关系;以及
响应所述可见文本层的一部分的用户选择来显示所述不可见文本层的对应部分的装置。
9.如权利要求8所述的数据结构系统,其特征在于,所述系统是基于服务器的。
10.如权利要求8所述的数据结构系统,其特征在于,所述系统是搜索引擎。
11.如权利要求8所述的数据结构系统,其特征在于,所述可见文本层的所述部分包含至少两个词。
12.一种使用处理器的翻译方法,包括如下步骤:
接收包含以第一语言编写的文本的数据文件;
通过服务器中的处理器将所述文本逐个部分地翻译成一种或多种第二语言,其中每一部分均包含至少一个词;
将所述翻译插入到所述数据文件中;以及
提供许多标记,所述标记将可见层文本的多个部分链接到所述不可见层上的对应翻译。
13.一种人工翻译方法,包括如下步骤:
接收包含以第一语言编写的文本的数据文件;
将所述文本逐个部分地翻译成第二语言,其中每一部分均包含至少一个词;
将一系列的翻译插入到所述数据文件中;以及
提供许多标记,所述标记将可见层文本的多个部分链接到所述不可见层上的对应翻译。
14.如权利要求13所述的方法,其特征在于,翻译所述文本的所述步骤包括在词法上分析每一部分。
15.如权利要求13所述的方法,其特征在于,翻译所述文本的所述步骤包括在词法上生成每一翻译。
16.一种翻译系统,包括:
服务器,提供至少第一和第二语言之间的翻译;
与所述服务器通信的处理器;
数据结构文件,包括:
包含所述第一语言的第一文本的可见层;
不可见层,在所述可见层下面并包含所述第一文本的多个部分的以所述一种或多种第二语言的翻译;以及
标记,将所述可见层的多个部分链接到所述不可见层的多个部分;
选择器,用于供用户在文本的所述可见层上选择文本的一部分,并跟随标记从文本的所述部分来定位所述不可见层的对应部分;以及
显示装置,用于响应对文本的所述部分的所述选择,在所述显示装置上显示文本的所述不可见层的所述部分。
17.一种搜索引擎,包括:
数据结构文件,包括:
包含所述第一语言的第一文本的可见层;
不可见层,在所述可见层下面并包含所述第一文本的多个部分的以所述一种或多种第二语言的翻译;以及
标记,将所述可见层的多个部分链接到所述不可见层的多个部分;
选择器,用于供用户在文本的所述可见层上选择文本的一部分,并跟随标记从文本的所述部分来定位所述不可见层的对应部分;以及
显示装置,用于响应对文本的所述部分的所述选择,在所述显示装置上显示文本的所述不可见层的所述部分。
18.如权利要求17所述的搜索引擎,其特征在于,在词法上生成所述翻译。
19.一种具有搜索浏览器的个人计算机,包括:
处理器;
数据结构文件,包括:
包含第一语言的可见搜索结果的可见层;
不可见层,在所述可见搜索结果下面并包含所述可见搜索结果的多个部分的以所述第二语言的翻译;以及
标记,将所述可见搜索结果的多个部分链接到所述不可见层的多个部分;
操作部件,用于在所述可见搜索结果上选择文本的一部分;
显示装置,用于显示链接到所述可见搜索结果的所述选择的部分的文本的所述不可见层的一部分。
CNA2005800134861A 2004-03-02 2005-03-02 嵌入式翻译文档方法和系统 Pending CN1950820A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US54888904P 2004-03-02 2004-03-02
US60/548,889 2004-03-02

Publications (1)

Publication Number Publication Date
CN1950820A true CN1950820A (zh) 2007-04-18

Family

ID=34919416

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800134861A Pending CN1950820A (zh) 2004-03-02 2005-03-02 嵌入式翻译文档方法和系统

Country Status (3)

Country Link
US (1) US20050197826A1 (zh)
CN (1) CN1950820A (zh)
WO (1) WO2005086021A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021048659A1 (en) * 2019-09-11 2021-03-18 International Business Machines Corporation Translation of multi-format embedded files
CN112633016A (zh) * 2019-09-20 2021-04-09 联想企业解决方案(新加坡)有限公司 支持第二语言的方法,装置和产品

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2006219600A1 (en) * 2005-03-03 2006-09-08 Barend Petrus Wolvaardt Language information system
US8219907B2 (en) * 2005-03-08 2012-07-10 Microsoft Corporation Resource authoring with re-usability score and suggested re-usable data
US20060206797A1 (en) * 2005-03-08 2006-09-14 Microsoft Corporation Authorizing implementing application localization rules
AU2011205054B2 (en) * 2005-12-05 2014-05-22 Microsoft Technology Licensing, Llc Flexible display translation
US7822596B2 (en) 2005-12-05 2010-10-26 Microsoft Corporation Flexible display translation
US8959476B2 (en) * 2006-01-11 2015-02-17 Microsoft Technology Licensing, Llc Centralized context menus and tooltips
US20070240057A1 (en) * 2006-04-11 2007-10-11 Microsoft Corporation User interface element for displaying contextual information
US7801721B2 (en) * 2006-10-02 2010-09-21 Google Inc. Displaying original text in a user interface with translated text
US20080172219A1 (en) * 2007-01-17 2008-07-17 Novell, Inc. Foreign language translator in a document editor
US7983897B2 (en) 2007-02-14 2011-07-19 Google Inc. Machine translation feedback
US20080294652A1 (en) * 2007-05-21 2008-11-27 Microsoft Corporation Personalized Identification Of System Resources
JP5186154B2 (ja) * 2007-08-21 2013-04-17 インターナショナル・ビジネス・マシーンズ・コーポレーション プログラムが表示するメッセージの修正を支援する技術
US8527260B2 (en) * 2007-09-06 2013-09-03 International Business Machines Corporation User-configurable translations for electronic documents
US20090094105A1 (en) * 2007-10-08 2009-04-09 Microsoft Corporation Content embedded tooltip advertising
US9418061B2 (en) * 2007-12-14 2016-08-16 International Business Machines Corporation Prioritized incremental asynchronous machine translation of structured documents
CA2803861C (en) * 2010-06-25 2016-01-12 Rakuten, Inc. Machine translation system and method of machine translation
WO2012174703A1 (en) 2011-06-20 2012-12-27 Microsoft Corporation Hover translation of search result captions
WO2013086666A1 (en) * 2011-12-12 2013-06-20 Google Inc. Techniques for assisting a human translator in translating a document including at least one tag
TWI530803B (zh) * 2011-12-20 2016-04-21 揚明光學股份有限公司 電子裝置及其詞彙資訊顯示方法
US9070303B2 (en) 2012-06-01 2015-06-30 Microsoft Technology Licensing, Llc Language learning opportunities and general search engines
JP2014059766A (ja) * 2012-09-18 2014-04-03 Sharp Corp 画像処理装置、画像形成装置、プログラム、記録媒体
US9400848B2 (en) * 2012-09-26 2016-07-26 Google Inc. Techniques for context-based grouping of messages for translation
US10649619B2 (en) * 2013-02-21 2020-05-12 Oath Inc. System and method of using context in selecting a response to user device interaction

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6244877A (ja) * 1985-08-22 1987-02-26 Toshiba Corp 機械翻訳装置
GB9209346D0 (en) * 1992-04-30 1992-06-17 Sharp Kk Machine translation system
JP3220560B2 (ja) * 1992-05-26 2001-10-22 シャープ株式会社 機械翻訳装置
EP0658259B1 (en) * 1992-09-04 2000-03-01 Caterpillar Inc. Integrated authoring and translation system
US5303151A (en) * 1993-02-26 1994-04-12 Microsoft Corporation Method and system for translating documents using translation handles
CA2138830A1 (en) * 1994-03-03 1995-09-04 Jamie Joanne Marschner Real-time administration-translation arrangement
US5697789A (en) * 1994-11-22 1997-12-16 Softrade International, Inc. Method and system for aiding foreign language instruction
JP3952216B2 (ja) * 1995-11-27 2007-08-01 富士通株式会社 翻訳装置及び辞書検索装置
IL121457A (en) * 1997-08-03 2004-06-01 Guru Internat Inc Computerized dictionary and thesaurus applications
JP3959180B2 (ja) * 1998-08-24 2007-08-15 東芝ソリューション株式会社 通信翻訳装置
US6122614A (en) * 1998-11-20 2000-09-19 Custom Speech Usa, Inc. System and method for automating transcription services
US6282507B1 (en) * 1999-01-29 2001-08-28 Sony Corporation Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6223150B1 (en) * 1999-01-29 2001-04-24 Sony Corporation Method and apparatus for parsing in a spoken language translation system
US6243669B1 (en) * 1999-01-29 2001-06-05 Sony Corporation Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US20040153509A1 (en) * 1999-06-30 2004-08-05 Alcorn Robert L. Internet-based education support system, method and medium with modular text-editing component for use in a web-based application
US6393389B1 (en) * 1999-09-23 2002-05-21 Xerox Corporation Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
AU2001249777A1 (en) * 2000-03-31 2001-10-15 Amikai, Inc. Method and apparatus for providing multilingual translation over a network
WO2001082111A2 (en) * 2000-04-24 2001-11-01 Microsoft Corporation Computer-aided reading system and method with cross-language reading wizard
US6604101B1 (en) * 2000-06-28 2003-08-05 Qnaturally Systems, Inc. Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network
US7099809B2 (en) * 2000-05-04 2006-08-29 Dov Dori Modeling system
WO2002086737A1 (en) * 2001-04-20 2002-10-31 Wordsniffer, Inc. Method and apparatus for integrated, user-directed web site text translation
US6772110B2 (en) * 2001-06-28 2004-08-03 Microsoft Corporation Method and system for converting and plugging user interface terms
US6714934B1 (en) * 2001-07-31 2004-03-30 Logika Corporation Method and system for creating vertical search engines
US7047502B2 (en) * 2001-09-24 2006-05-16 Ask Jeeves, Inc. Methods and apparatus for mouse-over preview of contextually relevant information
US20030163801A1 (en) * 2001-10-31 2003-08-28 Metacyber.Net Computer-based method for defining a patch in computer source code including conditional compilation cell groups
US7669198B2 (en) * 2004-11-18 2010-02-23 International Business Machines Corporation On-demand translator for localized operating systems

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021048659A1 (en) * 2019-09-11 2021-03-18 International Business Machines Corporation Translation of multi-format embedded files
GB2601463A (en) * 2019-09-11 2022-06-01 Ibm Translation of multi-format embedded files
US11373048B2 (en) 2019-09-11 2022-06-28 International Business Machines Corporation Translation of multi-format embedded files
CN112633016A (zh) * 2019-09-20 2021-04-09 联想企业解决方案(新加坡)有限公司 支持第二语言的方法,装置和产品

Also Published As

Publication number Publication date
US20050197826A1 (en) 2005-09-08
WO2005086021A3 (en) 2006-05-26
WO2005086021A2 (en) 2005-09-15

Similar Documents

Publication Publication Date Title
CN1950820A (zh) 嵌入式翻译文档方法和系统
US20010029455A1 (en) Method and apparatus for providing multilingual translation over a network
Harper et al. Web accessibility guidelines: A lesson from the evolving Web
KR20070117554A (ko) 내장식 번역 향상 검색
US5963205A (en) Automatic index creation for a word processor
US5708825A (en) Automatic summary page creation and hyperlink generation
TWI417747B (zh) 增強多國語言資料查詢
US20050160065A1 (en) System and method for enhancing resource accessibility
US20090024385A1 (en) Semantic parser
EP1544746A2 (en) Creation of normalized summaries using common domain models for input text analysis and output text generation
US20080172218A1 (en) Web Page Translation Device and Web Page Translation Method
US9817821B2 (en) Translation and dictionary selection by context
Curto et al. Question generation based on lexico-syntactic patterns learned from the web
EP2044529A1 (en) Reuse of available source data and localizations
CN113383340A (zh) 专利文献撰写装置、方法、计算机程序、计算机可读记录介质、服务器及系统
TW200422874A (en) Graphical feedback for semantic interpretation of text and images
Chisholm et al. Techniques for web content accessibility guidelines 1.0
Bolin et al. Naming page elements in end-user web automation
GB2368167A (en) Knowledge management software system
Šostaka et al. The Semi-Algorithmic Approach to Formation of Latvian Information and Communication Technology Terms.
Dombrowski et al. Language Is Not a Default Setting: Countering DH’s English Problem
EP1912164A2 (en) Content enhancement system and method and applications thereof
JP5361708B2 (ja) 多言語データクエリ
Vasuki et al. English to Tamil machine translation system using parallel corpus
Gustafsson Japanese Translation of Technical Terms in Debian

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20070418