CN1099087C - 因特网万维网页面的国际支持方法和系统 - Google Patents

因特网万维网页面的国际支持方法和系统 Download PDF

Info

Publication number
CN1099087C
CN1099087C CN98124201A CN98124201A CN1099087C CN 1099087 C CN1099087 C CN 1099087C CN 98124201 A CN98124201 A CN 98124201A CN 98124201 A CN98124201 A CN 98124201A CN 1099087 C CN1099087 C CN 1099087C
Authority
CN
China
Prior art keywords
foreign language
data
language data
character
local site
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN98124201A
Other languages
English (en)
Other versions
CN1218933A (zh
Inventor
哈特米·约瑟夫·阿姆罗
约翰·保尔·道桑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Inc
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1218933A publication Critical patent/CN1218933A/zh
Application granted granted Critical
Publication of CN1099087C publication Critical patent/CN1099087C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/328Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the presentation layer [OSI layer 6]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/40Network security protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/329Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

用于把从远程网点传输到当地网点的外国语言数据动态转换为支持外国语言数据的数据的方法和系统。起初,在远程网点的外国语言数据被扫描,并使各个外国语言字符与外国语言数据相关联。然后,与外国语言数据相关联的每一外国语言字符被映射到能够作为数据被传输到另一网点的字符表中的一个位置。然后该表和映射信息作为数据被传输到当地网点。包含在表中的字符在当地网点按顺序自动转换为外国语言数据。最后,外国语言数据在当地网点被显示。

Description

因特网万维网页面的国际支持方法和系统
本发明涉及改进的信息检索方法和系统。具体地,本发明涉及与图形用户界面相关使用的改进的信息检索方法和系统。本发明具体涉及基于因特网的信息检索方法和系统。更具体来说,本发明涉及用于基于因特网的信息检索系统的符号和字符集支持。再具体来说,本发明涉及用于基于因特网的信息检索系统的国际语言支持。
诸如远程网络这样的计算机化的信息源的发展允许数据处理系统的用户与其它服务器和网络连接,并从而检索以前在电子介质中不能获得的大量的电子信息。这种电子信息正在越来越多地代替传统的信息传送手段,诸如报纸、杂志、甚至是电视。
在通信中,能够彼此区别开的计算机网络集通过“网关”结合在一起,网关处理数据的传输和从发送网络到接收网络使用的协议的消息转换,必要时使用包。网关是用来连接不同的网络(即使用不同通信协议的网络)的装置,使得电子信息能够从一个网络传送到另一网络。网关传输电子信息,把这种信息转换为与第二个网络使用的协议兼容的形式以便于传输和递送。
近年来通常使用的一种远程网络是因特网。“因特网”这一术语是“网际网”的缩写,并通常是指使用计算机联网技术中所熟知的TCP/IP协议组网络和网关集合。TCP/IP是“传输控制协议/接口程序”的首字母缩略词,这是由国防部开发的用于计算机之间通信的软件协议。因特网可描述为由执行允许用户交互并共享网络上的信息的联网协议的计算机互连的地理上分布的远程计算机网络系统。因为这种广泛使用的信息共享,诸如因特网这种远程网络已经非常全面地发展为“开放”系统,对于该系统,开发者能够基本上没有限制地为执行特定的操作或服务设计软件应用程序。
在数据处理网络之间传输的电子信息通常以超文本提供,这是一种文本、图象、声音和动作以复杂的非顺序相关网链接在一起的方式表示信息的比喻,这允许用户通过相关的标题而不论标题提供的顺序如何而进行“浏览”或“漫游”。取决于超文本文件的意向,这些链接常常由超文本文件的作者和用户两者建立。例如,在链接中行驶到数据处理系统中的图形用户界面内显示的一篇文章中的词“铁”时,就可能把用户指令到化学元素周期表(即由词“铁”链接),或指令到关于铁在欧洲黑暗年代(Dark Ages)武器中的使用的资料。术语“超文本”是在1960年代创造的用于描述作为由计算机提供的文件,这表达了作为与书籍、胶片和语言的线性格式相反的思维的非线性结构。
另一方面,最近引入的术语“超媒体”几乎与“超文本”是同意词,但是侧重于诸如动画、记录的声音和视频等超文本的非文本成分。超媒体是图象、声音、视频、或它们的任何组合的集成为信息存储与检索基本相关系统。超媒体以及超文本,特别是按可由用户控制选择的交互格式,围绕着提供与人类思维平行的工作和学习环境的想法被构成。这就是说,允许用户在标题之间而不是象字母表那样顺序地从一个到下一个的运动之间建立相关。超媒体以及超文本以这样的方式被链接,即它允许用户在搜索信息期间从一个主题跳到另一个相关的主题。超链信息包含在超媒体和超文本文件中,这些文件允许用户只要“点击”(即使用鼠标或其它指点装置)超链接的标题就能够移回到“原件”或查阅网点。
典型的采用超文本和超媒体规范的联网系统遵循客户/服务器结构。“客户”是使用与之不相关的另一类或组的服务的类或组的成员。这样,在计算中,客户是请求由另一程序提供的服务的进程(即粗略来说是程序或任务)。客户进程使用请求到的服务而无需“知道”有关其它程序或服务本身的任何工作细节。在客户/服务器体系结构中,特别是联网系统,客户通常是访问由另一计算机(即服务器)提供的共享网络资源的一计算机。
用户对新闻的请求可被客户应用程序传送到服务器。服务器一般是可通过诸如因特网等远程网络访问的一远程计算机系统。服务器扫描并搜索原始(例如未处理的)信息源(例如新闻线供应或新闻组)。基于用户的这种请求,服务器作为对客户进程的响应提供过滤的电子信息。在第一计算机系统中客户进程可能是主动的,在第二计算机系统中服务器进程可能是主动的,彼此通过通信介质通信,这样提供了分布的功能性并允许多个客户利用服务器的信息收集能力。
客户和服务器利用由超文本传输协议(HTTP)提供的功能性彼此通信。万维网(WWW)或简称“web”包含遵守这一标准(即HTTP)的服务器,这些服务器可通过计算机或数据处理系统网址访问至客户,诸如通用资源定位器(URL)。网址可称为通用资源定位器网址。例如,可通过通信介质提供通信。具体地,客户和服务器可以通过串行线路因特网协议(SLIP)或用于高容量通信的TCP/IP连接彼此连接。客户内主动是称为“浏览器”的第一进程,该进程建立与服务器的连接并向用户提供信息。服务器本身执行对应的服务器软件,该软件把信息以HTTP响应的形式提供给用户。HTTP响应对应于由超文本标记语言(HTML)构成的“web网页”,或其它服务器产生的数据。每一web网页也可简称为“页”。
客户和服务器一般通过图形用户界面对用户显示浏览器和其它远程网络数据。图形用户界面是一种显示格式,它使用户通过指点屏幕上的图形表示(图标)和菜单项列表能够选择命令,启动程序,并看见文件列表和其它选项。一般使用键盘或鼠标能够激活选择。因特网服务一般通过指定唯一的网址(即通用资源定位器)被访问。通用资源定位器地址有两个基本成分,即所要使用的协议和对象路径名。例如通用资源定位器地址“http://www.uspto.gov”(即美国专利商标局的主页),规定了超文本传输协议(“http”)和服务器的路径名(“www.uspto.gov”)。服务器名与唯一的数字值(TCP/IP地址)相关联。
过去十年个人计算机的发展加速了web和因特网趋向日常应用。在过去几年中售出的几乎每一台计算机就某观点来说都已经或将要与因特网服务供应商“联网”。全球大约两千万到三千万人经常使用某种形式的因特网服务。万维网本身的图形部分通常存储了两千二百多万“页”内容,每个月增加一百多万新的网页。
诸如因特网“搜索引擎”这样的免费的或相对价廉的计算机软件应用使得人们容易查找个人能够获得所关心的题目的信息的网点。人们可以键入题目或关键字并产生一个网点列表(即web网点)。这样,随着由成千上万的公司、大学、政府机构、博物馆及市政当局发布“主页”,因特网能够成为非常宝贵的资源。只要很少的练习,即使一个新用户也能够浏览成百万个web网页或成千的新闻组,不仅是对于一般关心的题目,而且可以访问精确的数据位。因特网访问和相关的应用市场正在迅速扩展,并正在比预期更快地成长,大约每三个月规模倍增。
与因特网相关的一个问题是一种特定语言的web网点或web网页和操另一语言的用户之间存在的二歧(dichotomy)问题。由于因特网已经真正成为国际通信媒体,并随着时间的推移越发如此,故所产生的语言混乱在信息通过因特网向全球传播中造成了问题。例如,在约旦以阿拉伯文显示的新闻web网页并不能成功地在美国显示,因为美国人的浏览器可能并不支持阿拉伯文的显示。当地语言支持(NLS)必须植入到浏览器软件本身。当前大部分浏览器的编程并不提供对许多全球流行语言的NLS支持。
当前可用来直接支持国际性web网页语言的技术是要改变浏览器本身,但这是一个昂贵和困难的过程,特别是对于一般的计算机用户,或在远程网点作为图形数据(例如MPEG)显示外国语言,然后在当地网点翻译并显示这一图形数据。这种情形下,用户不能以其它功能使用这一数据。例如,用户不能按web网页上所显示文本数据同样的方式,向诸如字处理程序等其它应用程序“复制”或“粘贴”这种图形数据。此外,这种图形格式存储困难并且速度慢。
根据以上所述,能够理解现在需要一种方法和系统,它们能够使标准的浏览器显示分布在万维网上的外文数据,而无需对浏览器软件本身作大的改变或提供另外昂贵的硬件和软件以支持这种浏览器软件。根据这里所提供的技术透露,通过提供与加密数据直接相关的加密-解密方法和系统,可以实现这种进步。
于是,本发明的一个目的是要提供一种改进的信息检索方法和系统。
本发明的另一目的是要提供与图形用户界面相关而使用的信息检索方法和系统。
本发明的另一目的是要提供基于因特网的信息检索方法和系统。
本发明的又一目的是要提供对基于因特网的信息检索系统的符号和字符集支持。
本发明的再一个目的是要提供对基于因特网的信息检索系统的国际性语言支持。
以上和其它目的是如现在所说明的那样实现的。透露了计算机网络中一种方法和系统,用于把从远程网点传输到当地网点的外国语言数据动态转换为支持外国语言数据的数据,使得支持外国语言数据的数据能够在当地网点显示。起初,在远程网点的外国语言数据被扫描,并使各个外国语言字符与外国语言数据相关联。
然后,与外国语言数据相关联的每一外国语言字符被映射到能够作为数据被传输到另一网点的字符表中的一个位置。然后该表和映射信息作为数据被传输到当地网点。包含在表中的字符在当地网点按顺序自动转换为外国语言数据。最后,外国语言数据在当地网点被显示。
该表包含了一个加密/解密表。然后外国语言文本数据和加密的数据都传输到当地浏览器。表包含了数据中所有唯一的字符或符号及它们相关的密钥数值的映射。待加密的数据是作为密钥序列被加密的。此后,在当地网点(即当地浏览器)显示期间,发生表查找,表查找包括读取密钥序列(即加密的数据)和显示出与该密钥相关的“人工”字型。
可作为本发明特征的新颖特点在所附权利要求书中列出。然而,通过阅读时连同附图参照以下对示例性实施例的详细说明,将对本发明本身及其使用的优选方式、其它的目的和优点有很好的理解,附图中:
图1是可用来实现本发明的方法和系统的数据处理系统的图示;
图2示出表示可用来实现本发明的方法和系统的个人计算机系统中被选择的组件的框图;
图3示出表示可用来实现本发明的方法和系统的客户/服务器体系结构的框图;
图4示出表示可用来实现本发明的方法和系统的客户/服务器体系结构的详细框图。
图5是表示可根据本发明的方法和系统而实现的计算机网络的图示;
图6表示包含在可用来实现本发明的方法和系统的图形用户界面窗口内的超文本文件;
图7示出表示根据本发明的一个优选实施例对web网页提供国际支持的方法的操作流程图。
现在参照附图,具体是参照图1,其中示出本发明能够根据本发明的一优选实施例实现的数据处理系统的图示。图中示出包括系统单元12、视频显示终端14、具有字母数字和其它键的字母数字输入装置(即键盘16)、及鼠标18的个人计算机10。诸如跟踪球或记录笔等附加的输入装置(未示出)也可包含在个人计算机10中。计算机10可以使用任何适当的计算机实现,诸如位于纽约州Armonk市的国际商业机器公司的产品IBM AptivaTM计算机,“Aptiva”是国际商业机器公司的注册商标。
虽然图示的实施例涉及的是个人计算机,但是本发明的优选实施例可以由其它类型的数据处理系统实现,诸如智能工作站或小型计算机。计算机10最好还包括驻留在机器可读介质内的图形用户界面,以便指令计算机10的操作。计算机10还能够使用任何适当的计算机来实现,诸如位于纽约州Armonk市的国际商业机器公司的产品IBM RISC/6000计算机,“IBMRISC/6000”是国际商业机器公司的商标,并也可称为“RS/6000”。
现参见图2,它示出图1的可实现本发明的优选实施例的个人计算机10被选组件的框图。图1的个人计算机10最好包括如图2中所示的系统总线20。系统总线20用于使个人计算机10中的各种组件之间相互连接并建立通信。微处理器或中央处理器(CPU)22连接到系统总线20并还具有数字协处理器24与之连接。直接内存访问(“DMA”)控制器26也连接到系统总线20,并在在大量的输入/输出(“I/O”)传输期间允许各种装置占用来自CPU22的周期。只读存储器(“ROM”)28和随机存取存储器(“RAM”)30也连接到系统总线20。ROM28被映射到微处理器22的从640K到1兆字节范围的地址空间中。CMOS RAM32附加在系统总线20上并包含系统设置信息。任何适当的机器可读介质可以保存图1的计算机10的图形用户界面,诸如RAM30、ROM28、软磁盘、磁带或光盘。
与系统总线20连接的还有存储器控制器34、总线控制器36、及中断控制器38,它们作用是协助对通过各种外围设备、适配器、及装置的数据流的控制。图1的系统单元12还包含诸如图2中所示的各种I/O控制器:键盘和鼠标控制器40、视频控制器42,并行控制器44,串行控制器46、及软盘控制器48。键盘和鼠标控制器40对键盘50和鼠标52提供硬件接口。视频控制器42对视频显示终端54提供硬件接口。并行控制器44对诸如打印机56等装置提供硬件接口。串行控制器46对诸如调制解调器58等提供硬件接口。软盘控制器48对软盘单元60等提供硬件接口。其它的技术也可以同CPU22一同使用,诸如触摸屏技术或人类语音控制。
主存储器70连接到系统总线20,并包含控制程序71。控制程序71驻留在主存储器70内并包含当在CPU22上被执行时进行图7的逻辑流程图所示的操作的指令。计算机程序产品也称为程序产品。控制程序71能够支持包括例如HTTP-顺从性web“浏览器”的数个因特网访问工具。已知的浏览器软件应用程序包括:Netscape Navigator(“Netscape”),Mosaic,等等。特别是Netscape提供了在HTTP下规定的功能。“Netscape”是Netscape公司的商标。Mosaic牌的浏览器可从在伊利诺伊州Urbana-Champaign市的国家超计算应用中心(NCSA)获得。本发明是要与任何这些已知的或开发中的web浏览器一起工作,以便对以三维图形显示的web网页提供网络导航帮助。
控制程序71还能够支持其它远程网络服务,诸如文件传送协议(FTP)服务,这使得通过诸如因特网这样的远程网络的文件传送和共享变得容易。控制程序71还能够支持诸如远程终端访问(Telnet)这样的远程网络服务,这允许用户能够登录到与网络连接的计算机上。此外,控制程序71另外还能够支持计算机联网技术中所熟知的诸如简单邮件传送协议(SMTP)或e-mail,及网络新闻传送协议(NNTP)或“Usenet”的服务。
重要的是要注意,虽然已经在全功能计算机系统范围内对本发明进行了(并将继续)说明,但是业内专业人员能够理解,本发明能够作为各种形式的程序产品分发,并且不论用来实际进行分发的信号承载介质的具体类型如何,本发明同样地适用。信号承载介质的例子包括:可记录型介质,诸如软盘、硬盘驱动器、音频CD及CD-ROM,以及传输型介质,诸如数字和模拟通信链接。图2还示出用于控制CD系统33的CD控制器31。CD系统33可以运行音频CD或CD-ROM,这两者在数字电子介质技术中都是熟知的。CD系统33是利用光检测由CD上的数字记录所产生的音频和数据信号的声音或数据重放系统。
还可以向系统总线20添加扩展卡,诸如提供对硬盘单元64的硬件接口的盘控制器62。提供了空插口66,以便其它外围设备、适配器、及装置可以添加到图1的系统单元12。还可以向系统总线20另外连接网卡67,以便把系统单元12按客户/服务器体系结构连接到其它数据处理系统网络,或连接到由通信设备连接的计算机和相关装置的群组。
业内专业人员能够理解,图2中所示的硬件能够就具体应用而变化。例如可以采用其它外围装置,诸如:光盘介质,音频适配器,或芯片编程装置,诸如PAL或EPROM编程装置等,添加到已经示出的硬件或代替它们。注意,如何或所有的以上的组件和相关的硬件可在各个实施例中采用。然而,应能够理解的是,上述系统的任何配置可以根据具体的实现方式用于各种目的。
在图3、图4和图5中,相同的部件由相同的标号标出。图3示出表示能够根据本发明的方法和系统采用的客户/服务器体系结构的框图。图3中,用户对新闻的请求91由客户应用程序92送到服务器88。服务器88可以是一个通过诸如因特网等远程网络可访问的远程计算机系统。服务器88对原始(例如未处理的)信息源(例如新闻馈送或新闻组)进行扫描和查询,基于这些用户的请求,作为服务器的响应93向客户进程提交所提取的电子信息。在第一计算机系统中客户进程可能是主动的,在第二计算机系统中服务器进程可能是主动的并与第一计算机系统通过通信媒体通信,这样提供了分布化的功能并允许多个客户利用服务器的信息采集能力。
图4示出根据本发明的方法和系统可采用的客户/服务器体系结构的详细框图。虽然客户和服务器是可在两个计算机系统内运行的进程,这些进程是从在运行期在计算机系统(例如工作站)中解释和执行的高级程序语言(例如PERL)产生的,但是业内专业人员能够理解,它们可以在各种或被编程的或专用的硬件装置中实现。
客户92和服务器88使用由HTTP提供的功能通信。第一进程是在客户内主动的,即建立与服务器88的通信并向用户提供信息的浏览器72。这种浏览器在计算机网络专业内称为“web浏览器”。根据本发明的优选实施例可采用任何数目的商业上可获得或公开可获得浏览器。例如,可从在伊利诺伊州Urbana-Champaign市的国家超计算应用中心(NCSA)获得的Mosaic牌浏览器能够用于本发明的优选实施例。其它的浏览器,诸如NetscapeTM,Netscruiser,或Lynx牌浏览器,或其它可获得并提供HTTP下所规定功能的浏览器都可用于本发明。
服务器88执行以HTTP响应90的形式向客户提供信息的对应的服务器软件。HTTP响应90与可使用超文本标记语言(HTML)或由服务器88产生的其它数据表示的web“网页”对应。例如,在Mosaic牌浏览器之下,除了由服务器88提供的HTML功能94之外,还提供了公共网关交错(CGI)96,这允许客户程序指令服务器88开始执行包含在服务器88内规定的程序。这可能包含扫描服务器中收到的用于向用户控制的客户机提供的信息的搜索引擎。使用这一接口和HTTP响应90,服务器可以在完成时将执行的结果通知客户。公共网关交错(CGI)96是“网关”的一种形式,这是用来连接不同网络(即使用不同通信协议的网络)、使得电子信息能够从一个网络向另一网络传送的装置。网关传送电子信息,把这种信息转换为与第二个网络使用的协议兼容的形式,以便于传输和递送。
为了控制这一服务器驻留进程的执行参数,客户机可以指令填写从浏览器来的一定的“表”。这是由诸如这里所述Mosaic牌浏览器等某些浏览器提供的“填表”功能(即表98)提供的。此功能允许用户通过客户应用程序规定服务器使应用程序发挥功能的名词(例如用户感兴趣的情节/题目类型中所包含的名词或关键字)。
图5是表示可根据本发明的方法和系统实现的计算机网络80的图示。计算机网络80表示一远程网络,具体是因特网,这是基于前面所讨论的客户-服务器模式的熟知的计算机网络。在概念上,因特网包含可由通常是个人计算机用户的客户92进行访问的服务器88的巨型网,用户通过某些提供因特网接入提供商84(例如Internet America)或联机服务供应商86(例如America On-line,Prodigy,Compuserve等)访问。每一客户92可以运行浏览器,即一种已知的用于通过接入提供商84访问服务器88的软件工具。每一服务器88操纵支持文挡和页面的形式的文件的web网点。到服务器88的网络通路由具有已知句法用于定义网络集的通用资源定位器标识。
图6表示可根据本发明的方法和系统采用的包含在图形用户界面窗口104内的超文本文件123一例。窗口104显示出由诸如HTML等标记语言构造的超文本文挡123的一部分。滚动条116内的升降块120的大小和位置对应于当前可看到的在超文本文文挡123中相对的页面的大小和位置。超文本文挡123可从包含在诸如因特网等远程网络内的数据处理系统访问。
业内专业人员将能够理解,这种超文本文挡可在远程服务器以外文显示。虽然超文本文挡123是以英文书写表示,但是这种超文本文挡能够以外文字符显示。然而,如这里所述,这种外文字符不能没有困难地传送到不支持这种外文字符的浏览器和远程网点。于是,本发明提供了一种加密方法,用于把这种外文字符转换为在通常不支持这种外文字符显示的浏览器中能够被显示的字型。
在图6的例子中,鉴于超文本网点123包含太多要同时观看的页面这一事实,用户能够使鼠标光标定位在滚动条116的向上箭头106或向下箭头108并单击指点装置(例如鼠标),以便使超文本文挡123适当地向上或向下滚动。垂直滚动条118包括用于分别向左或右滚动超文本文挡123的箭头部分112和箭头部分110。可选箭头部分114也允许用户向右滚动文挡。这样,包含窗口104和超文本文挡1 23的图形用户界面是一种能够使用户通过指点屏幕上的图形表示(即图标)和菜单项列表而选择命令、启动程序、及观看文件列表和其它选项的计算机显示格式。一般可使用键盘或鼠标激活选择。
超文本文挡123包含由图形用户界面提供在屏幕上的对周围文本突显的特定的串文本124。串文本124是以不同的格式提供的。在图6的例子中,串文本124提供为 IBM。串文本124不同的字型格式指出该文本被超链接而跳到另一文本。当用户使用鼠标或其它指点装置在文本串124上“单击”时,图形用户界面把当前观看的超文本文挡123移动到另一被超链接的文挡。业内专业人员将能够理解,这种串文本能够包含在外国网点通过外文字符编译的超文本文挡内。于是,根据这里所叙述的方法和系统,这种串文本(即也称为“链”)也可以从外文远程网点被转换,并在通常不支持这种外文字符显示的当地网点的浏览器内显示。
图7示出表示根据本发明的一个优选实施例,为web网页提供国际支持的方法的操作140的流程图。业内专业人员将能够理解,图7示出导致所需结果的自含的步骤序列。这些步骤是那些需要对物理量进行物理操作的步骤。通常,虽然不是必要的,这些量采取可被存储、传送、组合、比较、及其它操作的电或磁信号的形式。业内专业人员已经证明,把这些信号称为位、数值、元素、符号、字符、项、数等通常是方便的。然而应当记住,所有这些或类似的名称都是与适当的物理量相关联的,并只不过是加到这些量上的方便的标号。
进而,所进行的操作常常是指诸如加法或比较等通常与人类操作者所进行的智力操作相关联的项目。在这里叙述的形成本发明部分的任何操作中,大部分情形并不需要也不希望人类操作者的能力;这些操作是机器操作。用来执行本发明优选实施例操作的有用的机器,包括诸如通用数字计算机或其它类似装置的数据处理系统。在任何情形下都应当明白,操作计算机中的方法操作与计算方法本身之间的区别。本发明涉及在处理电或其它(例如机械、化学)物理信号以产生其它所需物理信号中,用于操作诸如图1和图2所示的计算机10的计算机的方法步骤。
这样,如框141所示,开始图7中所述的进程。如框142所述,进程具体使用HTML标记启动并在诸如这里所述的客户/服务器网络的客户/服务器网络中操作。业内专业人员能够理解,虽然本发明的优选实施例描述了HTML,但也可以采用其它标记语言。因此HTML并不是本发明必要的特征。HTML标记是标识文挡中的元素的代码,诸如标题或段落,用于格式化、索引、和链接文挡中的信息。一个HTML标记一般用文字通过包含一个或多个数字或文字的一对角括号表示。通常一对角括号是后置的,表示元素开始和结束的位置。
如框144所示,在客户/服务器网络内远程网点处,外文web网页每次被扫描一个字符,然后如框146所示,每一字符被转换为表示显示在远程网点的语言符号或字符的“人工”位映射字型。位映射字符是特定尺寸和样式的字符集,其中每一字符被图形化描述为唯一的位映射(即点的图案)。位映射是计算机存储器中以各个位的集合的形式表示信息的数据结构。
被扫描的外文web网页的体可以包含外国语言文本字符。业内专业人员自然明白,这种外国语言文本数据可以包含非外国语言脚本(例如,阿拉伯文脚本,俄文西里尔字符等)的符号或字符,诸如数学和/或科学符号。这里所述的方法和系统是要包含比外国语言文本更多的内容,并能够处理任何潜在的符号/字符集。
如框148所示,然后对被扫描的字符集序列进行编译,使得每一字符被置于与适当的“人工”字型相关的表内的一个位置。编译的字符序列这样排布在加密/解密表中。如框150所示,所得的序列(即表)与人工位映射字型一同打包并发送到位于当地网点的浏览器。加密/解密表和加密的数据(即人工位映射字型)两者都发送到浏览器。这一表包含所有唯一字符或符号及它们相关的键值的映象。
待加密的数据被加密为密钥序列。在浏览器端显示期间,表查找包括读取密钥序列(即加密数据)和显示与该密钥相关的“人工”字型。如框152所示,浏览器对位映射字型解包,并如框154所示进行表查找,如框156所示指示浏览器把位映射字型序列转换回的原来的外国语言字符,如框158所示,在新的浏览器窗口上作为位映射字型显示。
业内专业人员明白,如这里所述,这里出现了一种提供对外文字符进行加密的伪加密方法和系统。这种加密转换为位映射字型,这些字型由通常并不支持这种外国语言字符显示的浏览器显示。解密数据仅显示在浏览器中而并不改变浏览器内的当前背景。
例如,阿拉伯字符可以被解密并显示在当前“英语”语言背景的浏览器中。当前“英语”语言背景的例子在NetscapeTM中是明显的。NetscapeTM浏览器包含“Options”菜单,进而还包含“General Preferences”菜单。在“General Preferences”中有“语言”设置。尽管是英语语言设置,该浏览器却仍然能够使用这里所述的方法和系统显示阿拉伯字符。
业内专业人员还能够理解,这里所述的方法和系统是与所有标准无关的。显示的主页可以提供其自身的标准,且浏览器不需要知道这些标准。而且,这一方法和系统可以支持一个以上的语言,包括“人工”语言。这一方法和系统也可以支持数学公式和符号,如同这些公式和符号是外文或“未知”的字符,这只是由于加密能够按定义进行。这里所述的方法和系统并不提供完全的NLS支持,但是却提出了提供直接与加密数据连接的加密/解密技术。
虽然已经参照优选实施例对本发明具体进行了展示和说明,但是业内专业人员能够理解,在不背离本发明的实质和范围的情形下其中可以在形式和细节上作出各种变化。与这里所述的方法和系统相关的因特网的应用并不是本发明必要的特征。例如,本发明除可用于因特网之外还可用于其它通信网络,包括所谓“内联网”(即属于特定机构内部的网络)。如同这里所述,因特网只是根据本发明的优选实施例可被采用的远程网络的一个例子。因而可以注意到,这些修改可以在不背离所附权利要求书中定义的本发明的实质或范围的情形下作出。

Claims (10)

1.一种用于在计算机网络中把从远程网点传输到当地网点的外国语言数据动态转换为支持所述外国语言数据的数据的方法,该方法使得支持所述外国语言数据的数据能够在所述当地网点显示,该方法的特征在于包括以下步骤:
(a)在所述远程网点处扫描外国语言数据内的每一外国语言字符;
(b)把与所述外国语言数据相关联的每一被扫描外国语言字符映射到能够作为数据被传输到另一网点的表中的一个规定位置;
(c)把所述映射数据和所述表作为数据传输到与所述外国语言数据相关的当地网点;
(d)随后把所述映射数据和包含在所述表中的所述字符在所述当地网点自动转换为外国语言数据;以及
(e)在所述当地网点显示所述外国语言数据。
2.权利要求1的方法,其特征在于,所述步骤(b)还包括以下步骤:
把与所述外国语言数据相关联的每一被扫描外国语言字符映射到能够作为数据被传输到另一网点的表中的一个规定位置,其中所述规定位置对应于位映射字型数据。
3.权利要求2的方法,其特征在于,所述步骤(d)还包括以下步骤:
随后把所述映射数据和包含在所述表中的所述字符在所述当地网点自动转换为外国语言数据,其中所述外国语言数据包括可以在所述当地网点显示的位映射数据。
4.权利要求3的方法,其特征在于,所述步骤(a)还包括以下步骤:
响应编程标记的启动,在所述远程网点处扫描外国语言数据内的每一外国语言字符,其中外国语言字符与所述外国语言数据相关联。
5.权利要求4的方法,其特征在于,所述步骤(e)还包括以下步骤:
在所述当地网点的浏览器内显示所述外国语言数据。
6.一种在计算机网络中用于把从远程网点传输到当地网点的外国语言数据动态转换为支持所述外国语言数据的数据的系统,该系统使得支持所述外国语言数据的数据能够在所述当地网点显示,所述系统的特征在于包括:
用于在所述远程网点处扫描外国语言数据内的每一外国语言字符的装置;
用于把与所述外国语言数据相关联的每一被扫描外国语言字符映射到能够作为数据被传输到另一网点的表中的一个规定位置的装置;
用于把所述映射数据和所述表作为数据传输到与所述外国语言数据相关的当地网点的装置;
用于随后把所述映射数据和包含在所述表中的所述字符在所述当地网点自动转换为外国语言数据的装置;以及
用于在所述当地网点显示所述外国语言数据的装置。
7.权利要求6的系统,其特征在于,所述用于映射的装置还包括:
用于把与所述外国语言数据相关联的每一被扫描外国语言字符映射到能够作为数据被传输到另一网点的表中的一个规定位置的装置,其中所述规定的位置对应于位映射字型数据。
8.权利要求7的方法,其特征在于,所述用于转换的装置还包括:
用于随后把所述映射数据和包含在所述表中的所述字符在所述当地网点自动转换为外国语言数据的装置,其中所述外国语言数据包括可以在所述当地网点显示的位映射数据。
9.权利要求8的方法,其特征在于,所述用于扫描的装置还包括:
用于响应编程标记的启动、在所述远程网点处扫描外国语言数据内的每一外国语言字符的装置,其中外国语言字符与所述外国语言数据相关联。
10.权利要求9的方法,其特征在于,所述用于显示的装置还包括:
用于在所述当地网点的浏览器内显示所述外国语言数据的装置。
CN98124201A 1997-11-14 1998-11-11 因特网万维网页面的国际支持方法和系统 Expired - Lifetime CN1099087C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US971017 1992-11-02
US971,017 1997-11-14
US08/971,017 US6324500B1 (en) 1997-11-14 1997-11-14 Method and system for the international support of internet web pages

Publications (2)

Publication Number Publication Date
CN1218933A CN1218933A (zh) 1999-06-09
CN1099087C true CN1099087C (zh) 2003-01-15

Family

ID=25517824

Family Applications (1)

Application Number Title Priority Date Filing Date
CN98124201A Expired - Lifetime CN1099087C (zh) 1997-11-14 1998-11-11 因特网万维网页面的国际支持方法和系统

Country Status (5)

Country Link
US (1) US6324500B1 (zh)
JP (1) JPH11184856A (zh)
KR (1) KR100310760B1 (zh)
CN (1) CN1099087C (zh)
TW (1) TW552527B (zh)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6738827B1 (en) * 1998-09-29 2004-05-18 Eli Abir Method and system for alternate internet resource identifiers and addresses
US6493735B1 (en) * 1998-12-15 2002-12-10 International Business Machines Corporation Method system and computer program product for storing bi-directional language data in a text string object for display on non-bidirectional operating systems
EP1069549A4 (en) * 1999-02-08 2002-07-24 Polytech Co Ltd SYSTEM FOR TRANSMITTING INFORMATION IN THE FORM OF CHARACTERS
US7064757B1 (en) * 1999-05-07 2006-06-20 Apple Computer, Inc. Automatic synthesis of font tables for character layout
US7607085B1 (en) * 1999-05-11 2009-10-20 Microsoft Corporation Client side localizations on the world wide web
US6701023B1 (en) * 1999-09-28 2004-03-02 Adobe Systems Incorporated Reducing appearance differences between coded and noncoded units of text
US6415249B1 (en) * 2000-03-01 2002-07-02 International Business Machines Corporation Method and system for using machine translation with content language specification
US6865716B1 (en) 2000-05-05 2005-03-08 Aspect Communication Corporation Method and apparatus for dynamic localization of documents
KR100373899B1 (ko) * 2000-05-23 2003-02-26 주식회사 시스메타 암호화된 데이터 처리 방법 및 시스템
US7155672B1 (en) 2000-05-23 2006-12-26 Spyglass, Inc. Method and system for dynamic font subsetting
KR20000072109A (ko) * 2000-07-31 2000-12-05 강성재 전자 상거래에서의 다국어 지원 방법 및 그 웹 서버
KR20000072108A (ko) * 2000-07-31 2000-12-05 강성재 언어 번역기를 이용한 인터넷상에서의 다국어 지원 방법및 그 웹 서버
JP2002062889A (ja) * 2000-08-14 2002-02-28 Pioneer Electronic Corp 音声合成方法
KR20020016382A (ko) * 2000-08-25 2002-03-04 오춘영 인터넷에서의 다국어가 지원되는 지식 관리 방법
US20050144240A1 (en) * 2000-09-13 2005-06-30 Janko Mrsic-Flogel Data communications
US6993568B1 (en) * 2000-11-01 2006-01-31 Microsoft Corporation System and method for providing language localization for server-based applications with scripts
KR100747556B1 (ko) * 2000-11-22 2007-08-08 엘지전자 주식회사 정보통신 인프라 시스템 및 그의 마스터 운영 방법
US7340389B2 (en) * 2001-02-16 2008-03-04 Microsoft Corporation Multilanguage UI with localized resources
US7120900B2 (en) * 2001-04-19 2006-10-10 International Business Machines Bi-directional display
US20020174196A1 (en) * 2001-04-30 2002-11-21 Donohoe J. Douglas Methods and systems for creating a multilingual web application
US7996207B2 (en) * 2001-06-26 2011-08-09 International Business Machines Corporation Bidirectional domain names
US10810355B1 (en) 2001-07-16 2020-10-20 Clantech, Inc. Allowing operating system access to non-standard fonts in a network document
US8522127B2 (en) 2001-07-16 2013-08-27 Robert G. Adamson, III Allowing operating system access to non-standard fonts in a network document
KR20040037548A (ko) * 2002-10-29 2004-05-07 주식회사 커리어매치 서로 다른 언어간의 이력정보 변환시스템 및 방법
CN1951074B (zh) * 2004-04-30 2012-05-23 捷讯研究有限公司 处理安全消息的系统和方法
JP4466459B2 (ja) 2005-04-28 2010-05-26 ソニー株式会社 文字情報生成装置及び方法、文字情報表示装置及び方法、デジタル映画上映方法及びシステム、並びに、字幕生成装置
US20070024626A1 (en) * 2005-07-29 2007-02-01 Microsoft Corporation Large character set handling in limited devices
US20070136470A1 (en) * 2005-12-08 2007-06-14 Microsoft Corporation Delivery of localized resource over a network
US9237148B2 (en) * 2007-08-20 2016-01-12 Blackberry Limited System and method for displaying a security encoding indicator associated with a message attachment
US7698688B2 (en) * 2008-03-28 2010-04-13 International Business Machines Corporation Method for automating an internationalization test in a multilingual web application
US8175388B1 (en) 2009-01-30 2012-05-08 Adobe Systems Incorporated Recognizing text at multiple orientations
CN101853245B (zh) * 2010-05-31 2011-06-08 深圳市开立科技有限公司 在中文操作系统环境下的俄文字符编辑和显示方法及装置
US8683006B2 (en) 2010-07-17 2014-03-25 Adobe Systems Incorporated Method and systems for serving fonts during web browsing sessions
CN105808713B (zh) * 2016-03-07 2017-09-29 威海微法信息科技有限责任公司 将线性结构信息加工为非线性结构的方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5295261A (en) * 1990-07-27 1994-03-15 Pacific Bell Corporation Hybrid database structure linking navigational fields having a hierarchial database structure to informational fields having a relational database structure
US5500905A (en) * 1991-06-12 1996-03-19 Microelectronics And Computer Technology Corporation Pattern recognition neural network with saccade-like operation
US5644758A (en) * 1994-12-13 1997-07-01 Microsoft Corporation Bitmap block transfer image conversion

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4684926A (en) * 1984-05-14 1987-08-04 Yong Min Wang Universal system of encoding chinese characters and its keyboard
JPH0616235B2 (ja) 1984-11-28 1994-03-02 富士通株式会社 外国語文字データ同時出力制御方式
GB8629908D0 (en) * 1986-12-15 1987-01-28 Kemano Ltd Words & characters computer input device
JPH0468638A (ja) 1990-07-04 1992-03-04 Ricoh Co Ltd 文書処理装置
JP3236015B2 (ja) 1990-10-09 2001-12-04 キヤノン株式会社 情報処理装置及び方法
US5586198A (en) * 1993-08-24 1996-12-17 Lakritz; David Method and apparatus for identifying characters in ideographic alphabet
WO1997012328A1 (en) * 1995-09-25 1997-04-03 Adobe Systems Incorporated Optimum access to electronic documents
JP3474037B2 (ja) * 1995-10-12 2003-12-08 シャープ株式会社 文字パターン生成装置
US5884014A (en) * 1996-05-23 1999-03-16 Xerox Corporation Fontless structured document image representations for efficient rendering
JP3754153B2 (ja) * 1996-11-11 2006-03-08 ヒューレット・パッカード・カンパニー ネットワークにおける文書表示システム
US5892843A (en) * 1997-01-21 1999-04-06 Matsushita Electric Industrial Co., Ltd. Title, caption and photo extraction from scanned document images

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5295261A (en) * 1990-07-27 1994-03-15 Pacific Bell Corporation Hybrid database structure linking navigational fields having a hierarchial database structure to informational fields having a relational database structure
US5500905A (en) * 1991-06-12 1996-03-19 Microelectronics And Computer Technology Corporation Pattern recognition neural network with saccade-like operation
US5644758A (en) * 1994-12-13 1997-07-01 Microsoft Corporation Bitmap block transfer image conversion

Also Published As

Publication number Publication date
TW552527B (en) 2003-09-11
US6324500B1 (en) 2001-11-27
JPH11184856A (ja) 1999-07-09
CN1218933A (zh) 1999-06-09
KR100310760B1 (ko) 2001-12-17
KR19990044850A (ko) 1999-06-25

Similar Documents

Publication Publication Date Title
CN1099087C (zh) 因特网万维网页面的国际支持方法和系统
JP4543119B2 (ja) ドキュメントの作成を援助する方法およびシステム
CN1122928C (zh) 统一资源定位器的并行选择方法及其系统
CN1128415C (zh) 基于请求者类型的网页的定制方法和系统
US6044385A (en) Method and system for efficiently managing the manipulation of large documents displayed within a computer screen
US6405192B1 (en) Navigation assistant-method and apparatus for providing user configured complementary information for data browsing in a viewer context
US5870767A (en) Method and system for rendering hyper-link information in a printable medium from a graphical user interface
US6275854B1 (en) Method and apparatus for detecting actual viewing of electronic advertisements
US6131110A (en) System and method for predicting user interest in unaccessed site by counting the number of links to the unaccessed sites in previously accessed sites
CN1257473C (zh) Html文档中增加可访问性的主动alt标记的方法和系统
US6279036B1 (en) Method and apparatus for detecting actual viewing or electronic advertisements
US5877757A (en) Method and system for providing user help information in network applications
US7168034B2 (en) Method for promoting contextual information to display pages containing hyperlinks
US6317782B1 (en) Method and apparatus for detecting actual viewing of electronic advertisements and transmitting the detected information
US20040199497A1 (en) System and Methodology for Extraction and Aggregation of Data from Dynamic Content
WO2001077838A1 (en) Dynamic integration of web sites
TWI317487B (en) System, method, and computer readable medium for annotating a displayed received document without changing the received document content
US6008814A (en) Method and system for providing network navigation aids
US7111236B1 (en) Method and apparatus for visually indicating the location of links within a web page
CN1236139A (zh) 使用过程指令语言实现基于标签的显示语言的方法和设备
Barry The hypertext markup language (HTML) and the World-Wide Web: Raising ASCII text to a new level of usability
US20020150867A1 (en) System and method for generating a directory structure in an on-line web environment
CN1155904C (zh) 突出显示特别感兴趣的万维网文档的系统和方法
Davies et al. The biologist and the World Wide Web Andreas D Baxevanis*, Wojciech Makalowskit, BF Francis Ouellette t and Herve Rbcipon
Ng et al. World Wide Web Based Distance Learning

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: NEW ANST COMMUNICATION CO.,LTD.

Free format text: FORMER OWNER: INTERNATIONAL BUSINESS MACHINE CORP.

Effective date: 20090911

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20090911

Address after: Massachusetts, USA

Patentee after: Nuance Communications Inc

Address before: American New York

Patentee before: International Business Machines Corp.

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20030115