CN101137983A - 嵌入式翻译增强的搜索 - Google Patents

嵌入式翻译增强的搜索 Download PDF

Info

Publication number
CN101137983A
CN101137983A CNA2006800073326A CN200680007332A CN101137983A CN 101137983 A CN101137983 A CN 101137983A CN A2006800073326 A CNA2006800073326 A CN A2006800073326A CN 200680007332 A CN200680007332 A CN 200680007332A CN 101137983 A CN101137983 A CN 101137983A
Authority
CN
China
Prior art keywords
translation
layer
visible
text
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800073326A
Other languages
English (en)
Inventor
Y·M·尼曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MELINGO Ltd
Original Assignee
MELINGO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MELINGO Ltd filed Critical MELINGO Ltd
Publication of CN101137983A publication Critical patent/CN101137983A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

用于搜索引擎或内容预订系统的模型,该模型包括搜索结果页面中出现的词和短语的嵌入式翻译的隐藏层,以及将嵌入式翻译的隐藏层自动插入到链接到结果页面或从结果页面链接来的所有内容。该隐藏层包含搜索结果中的所有词和短语从文档的原语言到任何一种或多种给定语言的翻译。当用户使用任何激活方法主动请求逐个给定词或短语地查看嵌入式翻译时,处于搜索结果的隐藏层中的嵌入式翻译变成显现。由计算机程序插入翻译,其中该计算机程序由辞典、词态规则和用于词态解疑的上下文规则构成。将依附于多语言内容和多语言用户的能力添加到Web内容或企业内容的搜索引擎。

Description

嵌入式翻译增强的搜索
技术领域
本发明涉及语言翻译领域,具体来说涉及具有对搜索结果页面中出现的词和短语的隐藏翻译的搜索引擎或内容预订系统。
背景技术
随着因特网在全球的普及,因特网用户搜索查找非其母语的内容的情况越来越常见。相同的现象出现在企业内容中,这常常包括多种语言的文档、以及其用户是不同语言的读讲者。
搜索查找因特网上与用户相关的内容成为普通且日常的活动。可以通过主动查询Web搜索引擎或企业搜索引擎来完成搜索查找内容,即通过输入查询字符串、扫描结果并跟随链接来尝试搜索感兴趣的内容;或可以向以推送模式向用户提供内容的内容提供商预订来完成搜索查找内容,例如用户可以使用RSS阅读器、从所选的信息源和感兴趣的区域接收RSS供给(feed),扫描RSS结果并跟随链路到达感兴趣的内容。
在此多语种搜索的情况中,最好的是提供完全翻译成用户的母语的搜索结果或预订项目。但是,基于软件或计算机的引擎提供整页机器翻译(例如Babelfish(http://babelfish.altavista.com/)和Systran(http://www.systransoft.com/))仍无法得到精确且可靠的结果。语义的歧义性是机器翻译的一个障碍,词态的歧义性是另一个障碍,再一些障碍是人类语言的特性和复杂性所致,例如习语或对最近流行的短语的引述、以及语言理解对真实世界知识的依赖性。有大量证据显示完全自动且高质量的机器翻译是不现实的(最初为Bar Hillel在1950年代的工作,其中阐述高质量的机器翻译在理论上是不可能实现的(Y. Bar Hillel(1960),“The Present Status of AutomaticTranslation of Languages”(自动语言翻译的现状)登载于Advances inComputers,VI,91-163),较近年代,参阅例如Alan K.Melby(1995)“Why Can′t a Computer Translate More Like a Person?”(为什么计算机无法更像人?)登载于Translation,Theory and Technology,1995Barker Lecture,http://www.ttt.org/theory/barker.html)。
机器翻译产生的一些结果可以具有与本文的原语言相去甚远的含义。通常,查看翻译成另一种语言的整页的用户并不知道与原文缺乏一致性,或完全无法理解所翻译的本文的含义,如图1所示。图1是Babelfish执行的机器翻译的截图。
因此,需要有一种搜索引擎或内容预订系统,该系统在不脱离原文的情况下产生包含搜索结果或预订项目的内容的上下文敏感翻译的单独文件。这种系统允许用户具有对来自搜索引擎的搜索结果或来自内容预订系统的预订项目的一部分的上下文敏感翻译。该翻译显示为使用户仍将能够看到原文。由此,用户能够较好地了解可从多个不同链接得到什么信息,即使是使用外国语言链接和描述的,而无需在用户的计算机上加载翻译软件。
发明内容
利用一种搜索引擎或内容预订系统来克服上面提到的缺陷,该系统包括搜索结果页面中出现的词和短语的嵌入式翻译的隐藏层、以及将嵌入式翻译的隐藏层自动插入到链接到结果页面或从结果页面链接来的所有内容。该隐藏层包含搜索结果中的所有词和短语从文档的原语言或显现的语言到任何一种或多种给定语言的翻译。当用户使用鼠标动作、组合键、屏幕上触摸或任何其他激活方法主动请求逐个给定词或短语地查看嵌入式翻译时,处于搜索结果的隐藏层中的嵌入式翻译变成显现(即被显示)。由计算机程序自动插入翻译,其中该计算机程序由辞典、词态规则和用于词态解疑的上下文规则构成。因此,将依附于多语言内容和多语言用户的能力添加到搜索引擎,而无论是Web内容还是企业内容。
附图说明
图1是现有技术的机器翻译的截图;
图2是根据本发明的页面的图形表示;
图3是根据本发明实施例的信息检索系统的图形表示;
图4是根据本发明另一个实施例的信息检索系统的图形表示;
图5是根据本发明的结果页面的截图;
图6是具有根据本发明的RSS阅读器的Web网站的截图;
图7是说明本发明的流程的流程图;
图8是根据本发明实施例的HTML文档源数据的示例;
图9是根据本发明另一个实施例的HTML文档源数据的示例;
图10是根据本发明另一个实施例的RTF文档源数据的示例;
图11是本发明的另一个实施例的截图。
具体实施方式
在嵌入式翻译增强的搜索(ETES)中,搜索引擎或RSS供给摘要的最初结果和链接到这些结果或从这些结果链接的所有页面都以其原语言和原格式显示给用户,但是包含翻译子层。该文档的可见层中的每个词(或有时短语)在此隐藏层中具有与之关联的对应翻译。要查看此翻译,文档的读者具有随意使用的操作部件,该操作部件响应读者选择可见文本层的一部分而将不可见层的一部分显露在可见层的对应部分上。该层以多种方式激活,包括/但不限于在可见部分上悬停、单击或双击鼠标、利用电子笔触摸它、使用触摸敏感显示屏通过手指触摸它、使用语音命令(语音激活)或使用游戏杆指向它。
ETES采用计算机程序,该计算机程序为其中出现的词创建从原语言到任何其他一种或多种语言的翻译。但是,ETES可以作为硬件组件(例如逻辑/存储器半导体装置)的一部分来实施。因为对ETES的输入是连续文本,并且一次不是一个词,所以翻译可以包含优于简单词典查询结果的如下改进:
1.在词态上分析输入的词;即识别所有词尾变化,而不仅仅识别词头(例如可以将如“Hablo”(I speak)的西班牙语词尾变化翻译成英语,而不仅仅是如“Hablar”的词头)。
2.在词态上将输入的词解疑;例如作为名词的“will”接收来自作为助动词的“will”的不同翻译。
3.在词态上合成翻译的词,例如将“house”翻译成西班牙语为“casas”。
当用户使用上文描述的操作方式之一请求翻译时,翻译则被显示在例如小弹出窗口中、屏幕底部或任何其他显示位置和方式。
因为翻译作为底层已经在搜索结果中,所以无需安装和/或调用任何附加专用翻译程序来显示翻译;以及无需用户执行任何附加动作,例如将该页面提交到任何形式的翻译引擎。图2中示出服务器服务的页面的图形表示。缺省情况下,搜索服务器服务的页面20以不附带翻译的方式出现,仅当用户请求它时才显示翻译22;否则显示不附带翻译的原始搜索结果。用于显示的方式使用例如HTML文件的工具提示功能的现有功能或数据文件本身中出现的脚本。不同于例如“Babylon(http://www.babylon.com/)”的可单击的词典,无需任何客户端应用来调用ETES的原文中出现的词的翻译。
有必要着重描述一下ETES和诸如Babylon、Gurunet或iFinger的常规词典应用之间的差异。需要在每次用户希望查看词的翻译时一次次地再激活这些应用。当激活时,本地应用发送要翻译的特定词或短语(词典数据在客户端上或Web服务器上,但是应用是本地的)。相比之下,ETES服务器将创建含有搜索结果中已包含的翻译层的页面。
还有必要阐述ETES与专用服务之间的区别,其中用户通过输入URL或复制和粘贴文本来主动提交页面,并且服务将弹出提示添加到输入的URL或文本。这些提示不具体地附着于每个词,而是将一个辞典或词典的小子集添加到返回的页面。
此类服务可以参阅:
http://www.popjisyo.com/WebHint/Portal.aspx
http://www.rikai.com/perl/Home.pl
相比之下,ETES不是将局部提示添加到文本的专用服务;它是具有搜索功能且其中自动翻译是该搜索服务的一部分的应用。用户无需执行任何主动请求;从输入搜索查询的瞬间,所有搜索结果包括至用户的语言的完整逐词翻译。而且因为上面的网站是基于小子集辞典的,所以它们不含有处理连续文本的上述优点:与ETES不同,弹出框不与上下文相关,且相同词总是具有相同弹出框;它们不含有词的词态翻译;所以它们与针对每个特定文本的嵌入式翻译层的概念相去甚远。
现在转到图3,其中是使用ETES的示范信息检索系统的图形表示,将查询30发送到服务器31。自动对结果32处理一次来进行翻译,包括在返回到客户端35之前嵌入隐藏的翻译层34。
图4是使用逐个词翻译应用的的另一个示范信息检索系统的图形表示,例如使用客户端词典程序的搜索和词典查询。在此示例中,使用客户端应用45多次检索翻译数据44。将查询40发送到服务器41。对结果处理多次以请求使用客户端应用35的逐个词的翻译。
通常被翻译的语言是用户的母语,因为搜索引擎的偏好中定义了它。因此用户无需为每个词或每个页面定义要翻译到的语言。搜索结果页面包含翻译到用户一次定义的语言的嵌入式翻译,每个搜索结果页面附有包含嵌入式翻译的链接。
例如,图5是搜索服务器显示的结果页面的截图。用户将鼠标悬停在词“syntax”上,因此将此词至西班牙语的翻译从嵌入式层带到前台。除了具有嵌入式翻译层外,每个搜索结果还具有至与原页面完全相同的相同页面版本的备选链接。
图6中示出ETES的另一个示范实施方式。图6是具有RSS阅读器的Web的截图。存在范围RSS阅读器可用,如http://news.bbc.co.Uk/2/hi/help/3223484.stm中进一步论述的。屏幕的左边栏中显示的是用户选择的RSS供给中包含的项目的标题。屏幕的右边框中显示的是从上方链接到第二项目的文章(“Rice allays CIAprison rowfears”)。RSS供给经过嵌入式翻译,从而当鼠标悬停在该文章上的任何词上时,它的翻译就被显示。在图6中,用户做出的鼠标悬停动作之后,显示英语词“concession”附随它的西班牙语翻译。
仅当用户逐个给定词地激活嵌入式翻译时,才将翻译带出并显示翻译(参见图5和图6)。该模型允许用户以其原语言阅读页面,并获取页面中出现的任何词的即时翻译。不同于自动机器翻译服务(MT)(自动机器翻译服务尝试将整个页面从其原语言翻译成另一种语言),在ETES模型中,原语言的文本保持不变,而仅作为隐藏层基于逐个词或基于逐个短语添加翻译。确信对于拥有原语言文本的某些知识的人,即使知识非常有限,该方法仍提供更可信的方式来充分地使用非他或她的母语的搜索结果。
ETES给予用户对原语言和目标语言的访问;因此在读者拥有原语言的某些知识的情况中,他或她可以使用该知识来理解文本的主要部分,并仅在需要时才参考嵌入式翻译。ETES优于MT的一个附加优点是,它不局限于提供逐个给定的源语言词地提供单个目标语言翻译。换言之,可以在翻译中保留某个数量的歧义性。例如,考虑原文是英语的文档,其中出现如下句子:“the inspectors are lookingfor arms”。在具有西班牙语翻译层的ETES文档中,词arms将翻译为“brazos、armas”。因此,该句子的阅读者将能够在该上下文中推论出“armas”是适合的翻译。相比之下,机器翻译的文档非常可能不适合地选择错误的翻译,在本例中选择了“brazos”(即身体意义上的手臂),而留给阅读者的是完全无法理解的西班牙语翻译文本。
创建ETES的方法
由搜索服务提供商应用的计算机程序来自动实现创建ETES的方法。
用于创建ETES的计算机程序应该包含如下过程(在本示例中参照HTML文件格式,作为包含文本的数字文件格式的专有情况):
1.从搜索引擎接收搜索结果缓存数据(buffer)或从搜索结果链接的页面;或从RSS供给接收XML内容或链接到XML内容/从XML内容链接的页面
2.对输入的缓存数据进行分析,并识别其中是词的字符串(非格式标记、指令或数字)。
示例:
<HR align=left width=570>
<UL>Ne me quitte pas<BR>
仅词“Ne me quitte pas”(意思是“不要离开我”)需要翻译。
3.将每个词及其上下文发送到双语词典,并接收它的翻译。
例如:西班牙语:amo la musica=英语:I love
西班牙语:El amo de la case=英语:owner,landlord
4.使用将使该翻译在此页面的缺省显示中不可见但是与原词关联并在用户触发它的情况下可供显示的格式,将词或短语的目标语言翻译插入到此词或短语的旁边。
示例:
<span title=″The″>El</span>
<span title=″owner,landlord″>amo</span>
<span title=″of″>de<lspan>
<span title=″the″>la<lspan>
<span title=″house″>casa<lspan>
5.将该页面附带它的底层不可见翻译发送到用户。
图7是图示其中创建嵌入式翻译的示例ETES过程的流程图。在步骤70中,用户从搜索引擎或RSS阅读器接收源语言的HTML缓存数据。在步骤71,分析输入的缓存数据并提取下一个内容词。在步骤72,应用确定该词是否为源语言形式。如果不是,则返回到步骤71以分析输入的缓存数据,并提取下一个内容词。如果是的话,应用检查与该内容词相邻的词以确定它是否是短语的一部分,如图步骤73所示。如果是的话,则将整个短语发送到短语翻译引擎74。如果不是的话,则将当前词发送到词翻译引擎75。然后在步骤76将翻译的词嵌入并将其与原语言的当前词关联。如果不是文档结尾,则应用返回以分析输入的缓存数据并提取下一个内容词。如果是文档结尾,则它将整个嵌入的文档发送到用户,如图步骤78所示。
ETES和不同的文件格式
搜索引擎和RSS供给不只返回HTML文档。ETES能以多种其他格式来显示,例如字处理器文档和PDF文件。ETES模型并不局限于特定文件格式,而是它适用于用来显示文本的任何文件,并且可以将ETES模型作为搜索引擎的结果来包含,此情况下启用了底层。因此,除了HTML及其扩充外,ETES模型可应用于任何常规技术中公知的字处理器格式,例如Microsoft Word Doc、Word Perfect、AppleWorks、RTF、PDF文档等。ETES显示可以通过这些格式的相应常规查看器来查看,包括但不限于查看HTML文件的MicrosoftInternet Explorer和Netscape Mozilla、查看RTF文件的MicrosoftWord、查看PDF文件的Adobe Acrobat Reader。
图8-11中示出显示的三个示例。在这些列示的每个列示中,唯一地对源文档中的每个词赋予各自的翻译。图8示出使用内置HTML工具提示型特征(本例中为“span”标记的“title”属性)的列示,即HTML文档源数据包含使用HTML工具提示的底层翻译。
图9示出另一个列示,它同样采用HTML格式但是使用Java脚本功能,即包含使用弹出Java脚本功能的底层翻译的HTML文档源数据。
图10示出采用RTF格式的列示,它使用伪超链接标记,即包含使用RTF文件的现有超链接功能的底层翻译的RTF文档源数据。该翻译作为伪超链接输入,链接到伪书签,但是作为超链接屏幕提示显示该翻译。翻译将在鼠标悬停在原语言词上时显示。为了演示目的,对词着色。
图11示出将如何在Microsoft Word应用上显示相同的列示。
利用交叉语言搜索的实现
ETES模型还可以应用于交叉语言搜索中。可以使用法语关键字搜索包含具有至法语的翻译的隐藏层的英语语言的文档。例如说法语的用户可以搜索Google(www.google.com)搜索引擎以查询仅在英语文档中出现的信息。如果这些文档包含至法语的隐藏翻译,则他或她可以使用法语关键字获取信息。由于用户的语言偏好,将查询翻译成英语,自动处理Google动态创建的英语结果页面来得到ETES;这样用户可以将鼠标悬停在结果上,并查找它们是否是他或她所相关的。如果结果是相关的,他或她可以使用至该结果的链接,该链接将自动包含嵌入式翻译。
商业意义
用户依赖搜索引擎来查找结果或依赖RRS阅读器来等待通知新闻,并且还翻译它们,这意味着巨大商机。实际上,搜索用户无需离开搜索引擎即可发现相关结果,但是在他或她浏览因特网的同时持续从服务器获取服务。此翻译特征还向用户提供浏览新闻的同时仍可以使用相同RSS阅读器。因为由服务器提供具有嵌入式翻译层的结果,所以这些页面可以包含例如搜索引擎或RSS阅读器提供的广告的标题;而且,来自具有嵌入式翻译的页面的链接也可以包含嵌入式翻译,由此用户在他或她Web浏览期间将保留搜索引擎或RSS阅读器;这样对于搜索引擎或RSS阅读器来说,本发明的商业意义是非常高的,并且构成与这些产品迄今运作的方式的不同。
上文描述和附图仅视为实现本发明的特征和优点的示范实施例的说明。可以在不背离本发明的精神和范围的前提下进行对特定过程条件和结构的修改和替换。因此,本发明不应视为由前面描述和附图来限定,而是仅由所附权利要求的范围来限定。

Claims (26)

1.一种产生搜索结果的搜索引擎,包括:
可见层,所述可见层包含原语言的文本;
不可见层,所述不可见层位于所述可见层下面且包含以一种或多种第二语言对所述第一语言的多个部分的翻译;以及
关联,所述关联将所述可见层的多个部分连接到所述不可见层的对应部分,从而允许由所述搜索引擎的用户触发而使所述不可见层的部分显露,其中当显示所述可见层时,所述可见文本的翻译是可见的。
2.如权利要求1所述的搜索引擎,其特征在于,所述层次化的搜索结果由搜索服务提供商服务器产生。
3.如权利要求1所述的搜索引擎,其特征在于,所述不可见层包含对包括至少一个词的所述第一语言的多个部分的翻译。
4.如权利要求1所述的搜索引擎,其特征在于,至少一些翻译是上下文敏感的。
5.如权利要求1所述的搜索引擎,其特征在于,至少一些翻译包含对词尾的词态翻译。
6.如权利要求1所述的搜索引擎,其特征在于,所述不可见层的所述部分直接被显露在所述可见层的对应部分上方。
7.如权利要求1所述的搜索引擎,其特征在于,所述不可见层的所述部分直接显露在不覆盖所述可见层的对应部分的位置。
8.如权利要求1所述的搜索引擎,其特征在于,搜索结果页面包含至多个版本的搜索结果项目的链接,所述多个版本的搜索结果项目包括含有原语言的文本的可见层、位于所述可见层下方且包含以一种或多种第二语言对所述第一语言的多个部分的翻译的不可见层、以及将所述可见层的多个部分连接到所述不可见层的对应部分的关联,从而允许由所述搜索引擎的用户触发而使所述不可见层的一部分显露,其中当显示所述可见层时,所述可见文本的翻译是可见的。
9.如权利要求1所述的搜索引擎,其特征在于,所述用户仅选择包含所述不可见层的结果。
10.一种内容预订系统,包括:
可见层,所述可见层包含原语言的多个标题,  其中所述多个标题对应于用户选择的内容;
不可见层,所述不可见层位于所述可见层下方且包含以一种或多种第二语言对所述第一语言的多个部分的上下文敏感翻译;以及
链接,所述链接将所述可见层的多个部分连接到所述不可见层的对应部分,从而允许当由所述内容预订系统的用户触发时使所述不可见层的一部分显露,其中当显示所述可见层时,所述可见文本的翻译是可见的。
11.如权利要求10所述的内容预订系统,其特征在于,所述标题链接到文章,所述文章包括含有原语言的文本的可见层、位于所述可见层下方且包含以一种或多种第二语言对所述第一语言的多个部分的翻译的不可见层、以及将所述可见层的多个部分连接到所述不可见层的对应部分的关联,从而允许当由所述搜索引擎的用户触发时使使所述不可见层的一部分显露,其中当显示所述可见层时,所述可见文本的翻译是可见的。
12.如权利要求10所述的内容预订系统,其特征在于,至少一些翻译是上下文敏感的。
13.如权利要求10所述的内容预订系统,其特征在于,至少一些翻译包含对词尾的词态翻译。
14.如权利要求10所述的内容预订系统,其特征在于,所述不可见层包含对包括至少一个词的所述第一语言的多个部分的翻译。
15.一种搜索方法,包括如下步骤:
检索包括以第一语言书写的文本的多个搜索结果;
通过服务器中的处理器将所述文本逐个部分地翻译成一种或多种第二语言,其中每个部分包含至少一个词;
将所述翻译插入到数据文件中;以及
将来自可见层的文本的多个部分链接到所述数据文件中的对应翻译,所述可见层显示作为所述第一语言书写的文本的所述搜索结果,其中所述数据文件是不可见的。
16.如权利要求15所述的方法,其特征在于,所述翻译所述文本的步骤包括在词态上分析每个部分。
16.如权利要求15所述的方法,其特征在于,所述检索步骤由用户激活的搜索启动。
17.如权利要求15所述的方法,其特征在于,所述检索步骤由内容预订系统启动。
18.如权利要求15所述的方法,其特征在于,所述检索步骤由RSS系统启动。
19.如权利要求15所述的方法,其特征在于,翻译的文本的多个部分是超链接。
20.如权利要求15所述的方法,其特征在于,翻译的文本的多个部分是Web内容。
21.如权利要求15所述的方法,还包括使所述数据文件中的翻译的用户选择的部分可见的步骤。
22.一种翻译系统,包括:
服务器,所述服务器提供包含第一语言的多个超链接的页面;以及
处理器,所述处理器与所述服务器通信,其中所述页面包括:
可见层,所述可见层包含所述第一语言的第一文本,  其中所述第一文本描述所述多个超链接;
不可见层,所述不可见层位于所述可见层下方且包含以一种或多种第二语言对所述第一文本的多个部分的翻译;以及
多个关联,所述关联将所述可见层的多个部分链接到所述不可见层的对应部分;
选择器,所述选择器供用户用于选择文本的所述可见层上的文本的一部分;以及
显示装置,用于显示与文本的所述可见层上的文本的所述部分对应的所述不可见层的一部分。
23.如权利要求22所述的翻译系统,其特征在于,所述页面包含与来自用户激活的搜索的搜索结果关联的超链接。
24.如权利要求22所述的翻译系统,其特征在于,所述页面由RSS阅读器提供。
25.如权利要求22所述的翻译系统,其特征在于,所述页面由RSS供给提供。
CNA2006800073326A 2005-01-10 2006-01-10 嵌入式翻译增强的搜索 Pending CN101137983A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US64211505P 2005-01-10 2005-01-10
US60/642,115 2005-01-10

Publications (1)

Publication Number Publication Date
CN101137983A true CN101137983A (zh) 2008-03-05

Family

ID=36282767

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800073326A Pending CN101137983A (zh) 2005-01-10 2006-01-10 嵌入式翻译增强的搜索

Country Status (6)

Country Link
US (1) US20060173829A1 (zh)
EP (1) EP1842143A2 (zh)
JP (1) JP2008527524A (zh)
KR (1) KR20070117554A (zh)
CN (1) CN101137983A (zh)
WO (1) WO2006072882A2 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104054047A (zh) * 2012-01-16 2014-09-17 夏普株式会社 图像处理装置、图像形成装置、程序以及记录介质
CN105005569A (zh) * 2014-04-24 2015-10-28 吕海港 一种具有中英双语对照标题的rss订阅系统和方法
CN105393244A (zh) * 2013-09-27 2016-03-09 夏普株式会社 信息处理装置和控制程序
WO2017050149A1 (zh) * 2015-09-22 2017-03-30 阿里巴巴集团控股有限公司 信息搜索方法和装置
CN109196496A (zh) * 2016-05-31 2019-01-11 微软技术许可有限责任公司 未知词预测器和内容整合的翻译器
WO2021048659A1 (en) * 2019-09-11 2021-03-18 International Business Machines Corporation Translation of multi-format embedded files

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060218485A1 (en) * 2005-03-25 2006-09-28 Daniel Blumenthal Process for automatic data annotation, selection, and utilization
US20080086689A1 (en) * 2006-10-09 2008-04-10 Qmind, Inc. Multimedia content production, publication, and player apparatus, system and method
US20090132349A1 (en) * 2006-10-09 2009-05-21 Splashcast Corp. Targeted-demographic rich-media content, branding, and syndicated user-node distribution
US20080189257A1 (en) * 2007-02-01 2008-08-07 Microsoft Corporation World-wide classified listing search with translation
US7720856B2 (en) * 2007-04-09 2010-05-18 Sap Ag Cross-language searching
US20090037378A1 (en) * 2007-08-02 2009-02-05 Rockwell Automation Technologies, Inc. Automatic generation of forms based on activity
CN101868797B (zh) * 2007-09-21 2013-05-01 谷歌公司 跨语言搜索
US7974832B2 (en) * 2007-12-12 2011-07-05 Microsoft Corporation Web translation provider
US8312032B2 (en) 2008-07-10 2012-11-13 Google Inc. Dictionary suggestions for partial user entries
US20100204979A1 (en) * 2009-02-06 2010-08-12 Inventec Corporation System and method for magnifiedly displaying real-time translated word
WO2010105383A1 (en) * 2009-03-18 2010-09-23 Google Inc. Web translation with display replacement
KR101148786B1 (ko) 2009-10-12 2012-05-24 한국과학기술원 사용자 제스쳐를 이용한 외국어 번역 방법 및 장치, 이를 이용한 모바일 기기
US9135349B2 (en) 2010-01-12 2015-09-15 Maverick Multimedia, Inc. Automatic technical language extension engine
US8965751B2 (en) 2010-11-01 2015-02-24 Microsoft Corporation Providing multi-lingual translation for third party content feed applications
WO2012174703A1 (en) 2011-06-20 2012-12-27 Microsoft Corporation Hover translation of search result captions
JP5824978B2 (ja) * 2011-08-31 2015-12-02 ブラザー工業株式会社 画像形成装置、画像形成システム、画像形成プログラム
US9342615B2 (en) * 2011-12-07 2016-05-17 Google Inc. Reducing redirects
US9070303B2 (en) 2012-06-01 2015-06-30 Microsoft Technology Licensing, Llc Language learning opportunities and general search engines
CN103678284A (zh) * 2012-08-31 2014-03-26 上海斐讯数据通信技术有限公司 页面文字翻译方法及装置
US9519641B2 (en) * 2012-09-18 2016-12-13 Abbyy Development Llc Photography recognition translation
US9087046B2 (en) * 2012-09-18 2015-07-21 Abbyy Development Llc Swiping action for displaying a translation of a textual image
US20140164422A1 (en) * 2012-12-07 2014-06-12 Verizon Argentina SRL Relational approach to systems based on a request and response model
KR101494549B1 (ko) * 2013-10-14 2015-02-23 손재화 Rss 기반 콘텐츠의 내용에 나오는 단어를 제공하는 장치 및 그 방법
KR101438356B1 (ko) * 2013-10-15 2014-09-11 손재화 Rss 기반 콘텐츠의 내용에 나오는 단어를 단말기만으로 제공하는 장치 및 그 방법
KR101506437B1 (ko) * 2013-10-30 2015-03-27 손재화 Rss 기반 콘텐츠의 내용에 나오는 단어와 상기 단어에 대한 사용자 인터페이스를 제공하는 장치 및 그 방법
KR101552509B1 (ko) * 2015-05-07 2015-09-22 주식회사 탑코믹스 웹툰의 다국어 지원 시스템
CN112633016A (zh) * 2019-09-20 2021-04-09 联想企业解决方案(新加坡)有限公司 支持第二语言的方法,装置和产品
CN113591494B (zh) * 2021-06-30 2024-06-07 中山大学 一种基于多粒度语义对齐的多语言通用翻译方法

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9209346D0 (en) * 1992-04-30 1992-06-17 Sharp Kk Machine translation system
JP3220560B2 (ja) * 1992-05-26 2001-10-22 シャープ株式会社 機械翻訳装置
JPH08501166A (ja) * 1992-09-04 1996-02-06 キャタピラー インコーポレイテッド 総合オーサリング及び翻訳システム
US5303151A (en) * 1993-02-26 1994-04-12 Microsoft Corporation Method and system for translating documents using translation handles
CA2138830A1 (en) * 1994-03-03 1995-09-04 Jamie Joanne Marschner Real-time administration-translation arrangement
US5697789A (en) * 1994-11-22 1997-12-16 Softrade International, Inc. Method and system for aiding foreign language instruction
JP3952216B2 (ja) * 1995-11-27 2007-08-01 富士通株式会社 翻訳装置及び辞書検索装置
US5956740A (en) * 1996-10-23 1999-09-21 Iti, Inc. Document searching system for multilingual documents
EP0849938A3 (en) * 1996-12-20 1999-02-24 Hitachi, Ltd. A magnetic recording/reproducing apparatus and the same equiped with an image sensor
IL121457A (en) * 1997-08-03 2004-06-01 Guru Internat Inc Computerized dictionary and thesaurus applications
JP3959180B2 (ja) * 1998-08-24 2007-08-15 東芝ソリューション株式会社 通信翻訳装置
US6122614A (en) * 1998-11-20 2000-09-19 Custom Speech Usa, Inc. System and method for automating transcription services
US6223150B1 (en) * 1999-01-29 2001-04-24 Sony Corporation Method and apparatus for parsing in a spoken language translation system
US6282507B1 (en) * 1999-01-29 2001-08-28 Sony Corporation Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6243669B1 (en) * 1999-01-29 2001-06-05 Sony Corporation Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US20040153509A1 (en) * 1999-06-30 2004-08-05 Alcorn Robert L. Internet-based education support system, method and medium with modular text-editing component for use in a web-based application
US6393389B1 (en) * 1999-09-23 2002-05-21 Xerox Corporation Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
US7315809B2 (en) * 2000-04-24 2008-01-01 Microsoft Corporation Computer-aided reading system and method with cross-language reading wizard
US7099809B2 (en) * 2000-05-04 2006-08-29 Dov Dori Modeling system
WO2002086737A1 (en) * 2001-04-20 2002-10-31 Wordsniffer, Inc. Method and apparatus for integrated, user-directed web site text translation
US6772110B2 (en) * 2001-06-28 2004-08-03 Microsoft Corporation Method and system for converting and plugging user interface terms
US6714934B1 (en) * 2001-07-31 2004-03-30 Logika Corporation Method and system for creating vertical search engines
US7047502B2 (en) * 2001-09-24 2006-05-16 Ask Jeeves, Inc. Methods and apparatus for mouse-over preview of contextually relevant information
US20030163801A1 (en) * 2001-10-31 2003-08-28 Metacyber.Net Computer-based method for defining a patch in computer source code including conditional compilation cell groups
US7669198B2 (en) * 2004-11-18 2010-02-23 International Business Machines Corporation On-demand translator for localized operating systems

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104054047B (zh) * 2012-01-16 2016-12-14 夏普株式会社 图像处理装置以及图像形成装置
CN104054047A (zh) * 2012-01-16 2014-09-17 夏普株式会社 图像处理装置、图像形成装置、程序以及记录介质
CN108829644A (zh) * 2013-09-27 2018-11-16 夏普株式会社 信息处理装置、记录介质以及显示翻译结果的方法
CN105393244A (zh) * 2013-09-27 2016-03-09 夏普株式会社 信息处理装置和控制程序
US10068359B2 (en) 2013-09-27 2018-09-04 Sharp Kabushiki Kaisha Information processing device
CN109101467A (zh) * 2013-09-27 2018-12-28 夏普株式会社 信息处理装置、记录介质以及信息处理装置的动作方法
CN105393244B (zh) * 2013-09-27 2019-10-15 夏普株式会社 信息处理装置
CN105005569A (zh) * 2014-04-24 2015-10-28 吕海港 一种具有中英双语对照标题的rss订阅系统和方法
WO2017050149A1 (zh) * 2015-09-22 2017-03-30 阿里巴巴集团控股有限公司 信息搜索方法和装置
CN109196496A (zh) * 2016-05-31 2019-01-11 微软技术许可有限责任公司 未知词预测器和内容整合的翻译器
CN109196496B (zh) * 2016-05-31 2023-01-06 微软技术许可有限责任公司 未知词预测器和内容整合的翻译器
WO2021048659A1 (en) * 2019-09-11 2021-03-18 International Business Machines Corporation Translation of multi-format embedded files
GB2601463A (en) * 2019-09-11 2022-06-01 Ibm Translation of multi-format embedded files
US11373048B2 (en) 2019-09-11 2022-06-28 International Business Machines Corporation Translation of multi-format embedded files

Also Published As

Publication number Publication date
US20060173829A1 (en) 2006-08-03
WO2006072882A2 (en) 2006-07-13
WO2006072882A3 (en) 2006-08-24
KR20070117554A (ko) 2007-12-12
EP1842143A2 (en) 2007-10-10
JP2008527524A (ja) 2008-07-24

Similar Documents

Publication Publication Date Title
CN101137983A (zh) 嵌入式翻译增强的搜索
US9477656B1 (en) Cross-lingual indexing and information retrieval
US7516154B2 (en) Cross language advertising
JP5264892B2 (ja) 多言語情報検索
Sinha et al. AnglaHindi: an English to Hindi machine-aided translation system
US20050197826A1 (en) Embedded translation document method and system
US20060100849A1 (en) Pointer initiated instant bilingual annotation on textual information in an electronic document
US8595208B2 (en) Hover translation of search result captions
JP2005182823A (ja) 縮小されたテキスト本文を生成する方法
JP2003529845A (ja) ネットワーク経由の多言語翻訳を提供する方法と装置
JPH11250105A (ja) 多言語情報検索方法およびシステム
WO2001082119A2 (en) Computer-aided writing system and method with cross-language writing wizard
US20040268256A1 (en) Program, character inputting and editing method, apparatus and storage medium
US20080172218A1 (en) Web Page Translation Device and Web Page Translation Method
CN101796508A (zh) 歧义敏感自然语言处理系统中的共指消解
Sezer TS corpus project: An online Turkish dictionary and TS DIY corpus
Thelwall Creating and using web corpora
Hutchins Commercial systems
Tompa et al. Hypertext by link-resolving components
JP2011181109A (ja) 情報検索支援プログラム、情報検索支援機能を有するコンピュータ、サーバー・コンピュータ、プログラム格納媒体
WO2001095151A1 (fr) Dispositif de transfert de donnees
Hanumanthappa et al. A detailed study on Indian languages text mining
Schiller Aspects of cohesion in web site translation: A translator's perspective
Goyal Development of a Hindi to Punjabi machine translation system
Seethalakshmi et al. Language independent information retrieval from web

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20080305