CN101055573A - 世界通多国翻译系统 - Google Patents

世界通多国翻译系统 Download PDF

Info

Publication number
CN101055573A
CN101055573A CN 200610034884 CN200610034884A CN101055573A CN 101055573 A CN101055573 A CN 101055573A CN 200610034884 CN200610034884 CN 200610034884 CN 200610034884 A CN200610034884 A CN 200610034884A CN 101055573 A CN101055573 A CN 101055573A
Authority
CN
China
Prior art keywords
server
translation
webpage
url
web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200610034884
Other languages
English (en)
Inventor
李钢
刘智美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 200610034884 priority Critical patent/CN101055573A/zh
Publication of CN101055573A publication Critical patent/CN101055573A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)

Abstract

本发明是一种多国即时在线翻译系统,即时在线网页翻译技术(以下简称在线翻译)是一种新型的基于服务器的即时网页翻译技术,该技术利用WEB服务器截获客户提交的URL请求,并将URL转交给后台翻译服务器,翻译服务器首先获取URL内容,并将其进行翻译处理,之后再将翻译结果通过WEB服务器转发给客户。

Description

世界通多国翻译系统
技术领域
目前,即时网页翻译技术主要可分为以下两种实现手段:
1)在客户端计算机上安装WEB浏览器插件,这种方式实现网页的翻译有以下弊端:
1.软件的升级更新不便,不能及时通知用户
因为安装软件时需要复制大量的语种翻译引擎及语种语料库到客户端计算机,所以软件中的任何一个语种翻译引擎、语种语料库做了调整(哪怕是少量),都会需要制作更新包。在软件的不断升级和完善过程中,这个过程的重复频率越高时,维护成本也会越高。另外,软件升级更新时并不能及时通知用户进行更新。
2.不能全面兼容所有WEB浏览器,开发者不能把工作重点有效的放在翻译技术上
随着INTERNET的不断深入我们的生活,相应的WEB浏览器也越来越多,而不同的WEB浏览器中实现插件的方法也不尽相同(甚至有的浏览器不支持插件)。因此,这将导致开发者为了使软件能兼容各种浏览器,而疲于研究各种浏览器的插件开发,不能有效的专注于翻译技术的研究和拓展。
3.不利于知识产权以及核心技术的保护
因为大量的语种翻译引擎以及语种语料库被复制到客户端计算机中,这些都是翻译软件的具体实现和基本数据,而语种语料库则更可能是明文的(即没有采取任何加密手段)。这样一来,核心技术和知识产权的危险性将会大大增加。
2)安装WEB浏览器插件,插件采用在线的语种语料库翻译网页内容。
这种方式同样存在第1)种方式中的前两种弊端,但增强了知识产权和核心技术的保护,而这种方式有一个致命的缺陷:因为采用了在线语种语料库,所以在翻译过程中,需要不停的向服务器发送请求,此时当用户的网络不稳定或者网络状况不好的时候,翻译速度将不堪忍受,或者干脆不能翻译。
技术背景
在线翻译由三个重要因素来决定她的可行性:
1.服务器以及相关设施。这是在线翻译的基础、在线翻译的运行平台。在线翻译必须借助服务器以及服务器软件之间的协同合作来完成网页(当然,不仅仅是网页)的翻译。
2.服务器之间如何实现协同合作。目前,国际上已经有相当成熟的方案:如远程调用(RPC)、WEBSERVICE、DCOM、CORBA等等。
3.翻译技术。这是最核心的内容,该部分内容除了实现必须的语种翻译功能外,还需要实现分布式校正、录入等功能。
发明内容
1.服务器的架设(硬件的安装与调试):
所需的硬件设备:企业级专业服务器、千兆交换机、路由器、硬件防火墙以及100-1000M带宽光纤接入。
通过接入光纤经过路由器、硬件防火墙和千兆交换机,最后到WEB服务器,首先将服务器接通,之后在服务器上安装好WINDOWS2000 SERVER操作系统,设置好网络,并安装IIS5.0或者IIS6.0,这样就架设好了WEB服务器。再从千兆交换机中连接上另一台服务器,该服务器安装好操作系统后,配置好网络以及DCOM,作为后台翻译服务器,该服务器上还需要安装SQL SERVER 2000。另外,从交换机中再引出交换机或者工作终端计算机,并安装好操作系统,用做分布式校正和录入。
2.服务器之间的协同合作:
在翻译服务器上配置好DCOM后,该服务器即可支持远程计算机的分布式计算请求。WEB服务器架设好之后,将网站对外开放之后,客户即可通过我们的网站来享受翻译服务。当客户点击网站的链接之后,我们的WEB服务器即可收到客户的URL请求,服务器接受到URL请求之后,即通过DCOM调用将URL转发给后台翻译服务器,并一直等待后台翻译服务器的回应。翻译服务器发送回翻译结果后,WEB服务器直接将翻译服务器传送过来的内容发送到客户端。至此,服务器之间即完成一次协同合作。
3.网页内容的翻译及分布式校正和录入:
翻译服务器的工作可以分为以下步骤:
a.收到WEB服务器转发来的URL请求后,翻译服务器立即通过SQL SERVER2000对已经预存的网页进行查询,如果网页已经预存,则取出翻译后预存的内容直接发送给WEB服务器。
b.SQL SERVER 2000中没有预存URL所指定的网页,翻译服务器则立即向INTERNET请求该URL网页内容,并同时分析URL,加载相应的翻译引擎和语料库。
c.接收到网页内容后,服务器立即把内容传给翻译引擎,并另外开辟一块缓冲区,供翻译引擎存放翻译结果。
d.翻译引擎首先向相应的工作终端发送开始翻译的消息级别的回调消息。之后,根据网页内容开始解析网页结构,修改网页中所有链接,使网页中的每一个链接都变成通过WEB服务器中转的URL地址;并提取网页中的文本,根据语料库中的资料配合一定的匹配算法对文本进行翻译。当遇到不可识别的文本时,立即记录该文本,同时向相应的工作终端计算机发送一个警告级别的回调消息,通知工作终端更新语料库,翻译引擎一直等待工作终端作出更新回应(考虑到效率,也可以不等待)。
e.翻译引擎处理完所有链接并将文本全部翻译完毕之后,将翻译结果存入服务器指定的缓冲区,并通知服务器翻译任务结束。另外,同样需要给工作终端发送翻译结束的消息级别的回调消息。
f.服务器接到翻译引擎的翻译结束通知后,将缓冲区的内容提交给SQLSERVER 2000进行预存,并将内容立即转发给WEB服务器。至此,翻译服务器完成一个翻译任务。
另:工作终端计算机在每次启动操作系统之后,必须通过DCOM向翻译服务器注册一个相应的语种回调服务。这样,翻译服务器每受理一次翻译任务,即会向注册过相应语种回调的工作终端计算机发送一次回调消息。工作终端可以不理会消息级别的回调消息,但遇到警告级别的回调消息时,工作终端必须立即作出响应,并同时更新语料库。(图1)
附图说明
a.收到WEB服务器转发来的URL请求后,翻译服务器立即通过SQL SERVER2000对已经预存的网页进行查询,如果网页已经预存,则取出翻译后预存的内容直接发送给WEB服务器。
b.SQL SERVER 2000中没有预存URL所指定的网页,翻译服务器则立即向INTERNET请求该URL网页内容,并同时分析URL,加载相应的翻译引擎和语料库。
c.接收到网页内容后,服务器立即把内容传给翻译引擎,并另外开辟一块缓冲区,供翻译引擎存放翻译结果。
d.翻译引擎首先向相应的工作终端发送开始翻译的消息级别的回调消息。之后,根据网页内容开始解析网页结构,修改网页中所有链接,使网页中的每一个链接都变成通过WEB服务器中转的URL地址;并提取网页中的文本,根据语料库中的资料配合一定的匹配算法对文本进行翻译。当遇到不可识别的文本时,立即记录该文本,同时向相应的工作终端计算机发送一个警告级别的回调消息,通知工作终端更新语料库,翻译引擎一直等待工作终端作出更新回应(考虑到效率,也可以不等待)。
e.翻译引擎处理完所有链接并将文本全部翻译完毕之后,将翻译结果存入服务器指定的缓冲区,并通知服务器翻译任务结束。另外,同样需要给工作终端发送翻译结束的消息级别的回调消息。
f.服务器接到翻译引擎的翻译结束通知后,将缓冲区的内容提交给SQLSERVER 2000进行预存,并将内容立即转发给WEB服务器。至此,翻译服务器完成一个翻译任务。
具体实施方式
首先,通过接入光纤经过路由器、硬件防火墙和千兆交换机,最后到WEB服务器,首先将服务器接通,之后在服务器上安装好WINDOWS2000 SERVER操作系统,设置好网络,并安装IIS5.0或者IIS6.0,这样就架设好了WEB服务器。再从千兆交换机中连接上另一台服务器,该服务器安装好操作系统后,配置好网络以及DCOM,作为后台翻译服务器,该服务器上还需要安装SQL SERVER 2000。另外,从交换机中再引出交换机或者工作终端计算机,并安装好操作系统,用做分布式校正和录入。
接着,在翻译服务器上配置好DCOM后,该服务器即可支持远程计算机的分布式计算请求。WEB服务器架设好之后,将网站对外开放,客户即可通过我们的网站来享受翻译服务。
当客户点击网站的链接之后,我们的WEB服务器即可收到客户的URL请求,服务器接受到URL请求之后,即通过DCOM调用将URL转发给后台翻译服务器,并一直等待后台翻译服务器的回应。翻译服务器发送回翻译结果后,WEB服务器直接将翻译服务器传送过来的内容发送到客户端。
收到WEB服务器转发来的URL请求后,翻译服务器立即通过SQL SERVER 2000对已经预存的网页进行查询,如果网页已经预存,则取出翻译后预存的内容直接发送给WEB服务器。
SQL SERVER 2000中没有预存URL所指定的网页,翻译服务器则立即向INTERNET请求该URL网页内容,并同时分析URL,加载相应的翻译引擎和语料库。
接收到网页内容后,服务器立即把内容传给翻译引擎,并另外开辟一块缓冲区,供翻译引擎存放翻译结果。
翻译引擎首先向相应的工作终端发送开始翻译的消息级别的回调消息。之后,根据网页内容开始解析网页结构,修改网页中所有链接,使网页中的每一个链接都变成通过WEB服务器中转的URL地址;并提取网页中的文本,根据语料库中的资料配合一定的匹配算法对文本进行翻译。当遇到不可识别的文本时,立即记录该文本,同时向相应的工作终端计算机发送一个警告级别的回调消息,通知工作终端更新语料库,翻译引擎一直等待工作终端作出更新回应(考虑到效率,也可以不等待)。
翻译引擎处理完所有链接并将文本全部翻译完毕之后,将翻译结果存入服务器指定的缓冲区,并通知服务器翻译任务结束。另外,同样需要给工作终端发送翻译结束的消息级别的回调消息。
服务器接到翻译引擎的翻译结束通知后,将缓冲区的内容提交给SQL SERVER2000进行预存,并将内容立即转发给WEB服务器。至此,翻译服务器完成一个翻译任务。

Claims (1)

  1. 一、一种新型的即时在线网页翻译技术,其特征是利用服务器(或服务器集群)架设大型的服务型网站,利用WEB服务器截获用户的URL请求,WEB服务器再将URL转发给后台翻译服务器,翻译服务器采用网页预存、翻译引擎、预料库、工作终端计算机的语种回调、分布式校正和录入等技术将翻译后的网页转发给WEB服务器,再由WEB服务器发送给用户。其技术实现过程如下:
    按特定的算法根据URL计算得出关键字,并根据关键字查询服务器中是否有该网页的预存内容。若有,则翻译任务结束。否则,继续下面的步骤。
    从INTERNET获取原始的网页内容,并提交给翻译引擎,翻译引擎根据预料库中的资料对网页内容进行翻译。在翻译过程中,翻译引擎会根据翻译的语种以及翻译时遇到的意外情况给相应的工作终端发送回调消息。一直循环该过程直到翻译结束。
    工作终端收到回调消息后,根据消息类别来作出响应。如果是警告级别的消息,工作终端必须检查翻译内容并进行确认,或修改翻译内容,或向语料库中增加新语料资料。
    翻译引擎翻译结束后,立即将翻译结果发送给服务器,服务器再转发给WEB服务器。
CN 200610034884 2006-04-10 2006-04-10 世界通多国翻译系统 Pending CN101055573A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200610034884 CN101055573A (zh) 2006-04-10 2006-04-10 世界通多国翻译系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200610034884 CN101055573A (zh) 2006-04-10 2006-04-10 世界通多国翻译系统

Publications (1)

Publication Number Publication Date
CN101055573A true CN101055573A (zh) 2007-10-17

Family

ID=38795412

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200610034884 Pending CN101055573A (zh) 2006-04-10 2006-04-10 世界通多国翻译系统

Country Status (1)

Country Link
CN (1) CN101055573A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102323935A (zh) * 2011-08-31 2012-01-18 中兴通讯股份有限公司 中间服务器、移动浏览方法及系统
CN102694834A (zh) * 2011-03-25 2012-09-26 株式会社野村综合研究所 数据生成支援系统
CN102707967A (zh) * 2012-04-03 2012-10-03 陈俊 一种运行第三方应用程序的方法、设备及系统
CN104025079A (zh) * 2011-09-09 2014-09-03 谷歌公司 用于翻译网页的用户接口
CN106202066A (zh) * 2016-07-05 2016-12-07 腾讯科技(深圳)有限公司 网站的翻译方法和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102694834A (zh) * 2011-03-25 2012-09-26 株式会社野村综合研究所 数据生成支援系统
CN102323935A (zh) * 2011-08-31 2012-01-18 中兴通讯股份有限公司 中间服务器、移动浏览方法及系统
CN104025079A (zh) * 2011-09-09 2014-09-03 谷歌公司 用于翻译网页的用户接口
CN102707967A (zh) * 2012-04-03 2012-10-03 陈俊 一种运行第三方应用程序的方法、设备及系统
CN106202066A (zh) * 2016-07-05 2016-12-07 腾讯科技(深圳)有限公司 网站的翻译方法和装置

Similar Documents

Publication Publication Date Title
EP3229148B1 (en) Website access method and device, and website system
US9588854B2 (en) Systems and methods for a secondary website with mirrored content for automatic failover
US7133933B2 (en) Content synchronization frameworks using dynamic attributes and file bundles for connected devices
US20080071922A1 (en) Methods, systems, and computer program products to transparently dispatch requests to remote resources in a multiple application server environment
CN1352775A (zh) 选择超高速缓冲存储器
CN102193933A (zh) 一种网页编辑方法及系统
CN1121216A (zh) 在一个分布式文件系统中高效高速缓存的系统与方法
CN101055573A (zh) 世界通多国翻译系统
CN101086731A (zh) 基于服务器的多国即时在线翻译系统
CN1991757A (zh) 实现软件升级的方法
CN1909552A (zh) 一种信息访问方法和系统
US6532492B1 (en) Methods, systems and computer program products for cache management using admittance control
WO2012155581A1 (zh) 中间服务器、移动浏览方法及系统
US20240303293A1 (en) System and method for delivering application metadata
WO2011145046A2 (en) Smart database caching
CN111416862A (zh) 一种基于ipv6 ipv4的cdn平台访问方法及系统
JP2000330992A (ja) 多国言語対応wwwサーバシステム及びその処理方法
US20060089965A1 (en) Dynamic linkage of an application server and a Web server
CN1863193A (zh) 实现网络安全装置安全策略的方法
US6236661B1 (en) Accelerating access to wide area network information
CN112527376A (zh) 基于反向代理服务实现DevOps自动化的方法
CN100362788C (zh) 一种网络服务器以及网络服务器与浏览器的数据交互方法
CN102148869B (zh) Java应用程序向本地传递信息的方法及设备
CN115695580B (zh) 资源获取方法、装置、设备及存储介质
WO2022135410A1 (zh) 加载源文件的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication