背景技术
万维网是由互联网提供的快速发展的信息领域。万维网(“网络”)确保搜索工具能够快速搜索和检索相关信息。在本说明书的上下文中,搜索引擎呈现出强大的优势,因为它能够帮助用户使用关键词、句子或查询条件(query)从网络搜索和检索特定信息。
现在可用的搜索工具很多,用户可以从中选择一个进行搜索。然而,搜索工具不都一样。因为搜索工具使用专用的特殊算法对其各自数据库中的信息或网站进行索引,所以搜索工具各不相同。重要的是要知道各种搜索工具之间的不同之处,因为每种搜索工具执行常规的信息搜索和检索任务时的方式不同。因此,即使输入同样的短语/查询条件,不同搜索引擎得到的搜索结果也不同。
搜索工具的种类大致分为五种:字典类、搜索引擎类、超级引擎类、元数据引擎类和特殊搜索引擎类。
Yahoo、Magellan和Look Smart等搜索工具属于字典类搜索工具。这些网络字典中都是自己开发数据库,数据库中包含它们选择的网站。因此,当用户使用诸如Yahoo的字典进行搜索时,他实际上是在搜索由Yahoo支持的数据库,并且浏览数据库中的内容。
Infoseek、WeCrawler和Lycos等搜索引擎使用诸如“Web Crawlers”、“Spiders”或“robots”之类的软件程序在网络中搜索并进行索引,并将不同网站的内容分类,将分类存入该搜索引擎自己的数据库中。Web Crawl程序是一套自主程度不同的软件代理程序的子程序,执行用户下达的任务。这些代理通常由一个历史链接列表开始,诸如服务器列表和最受欢迎或最佳网站,并受这些网页上链接的引导去发现更多的链接并将链接加入其数据库。
一类更为复杂的搜索引擎包括超级引擎,它使用的软件与“WebCrawlers”、“spiders”或“robots”相似。然而,它们与普通搜索引擎的不同之处在于它们不仅对标题中出现的关键词进行索引,而且对网站所有内容中出现的关键词进行索引。超级引擎的例子有Excite、OpenText、Hot Bot和Alta Vista。
元搜索引擎查询其它搜索引擎并将搜索到的所有结果结合在一起。实际上,使用元搜索引擎的用户是利用其数据库所包括的全部搜索引擎进行搜索。元搜索引擎的例子有Dogpile和Savvy Search。
特殊搜索引擎是另一类搜索引擎,迎合对特殊领域的信息有需求的用户。特殊搜索引擎的例子有Deja News和Infospace。
由此可见,这些搜索引擎中的每一种都各具特色,它们执行搜索的方式以及实现获取网站可用资源这一基本目标的工作方式不同。大多数搜索引擎允许用户敲入几个单词,然后在其数据库中搜索。每种搜索引擎处理近似拼写、多变体和截断的方式都不同。
然而,大多数搜索引擎有其局限性,因为它们仅迎合英语群体的需要,并仅有助于搜索和检索一种语言的文档。多数搜索引擎需要输入英文并搜索仅提供英语信息的网站。换句话说,多数搜索工具主要迎合讲英语的互联网用户的需要。这使得这些搜索工具对不讲英语的用户来说几乎无用,而这部分用户占整个互联网用户的75%。因为非英语用户群体无法有效地输入英文短语或查询条件,所以他们不能搜索网站。因此,这一大部分用户群体无法从搜索工具和英语的网络文档中受益。这是所有的现有搜索引擎都没有指出的严重缺陷。
同样,非英语的互联网用户也创建非英语网站。而面向英语的搜索引擎无法查询这类丰富的信息源。结果,与非英语群体不能利用英语资源一样,英语人群也不能利用其它语言的资源。
例如,当准备需要“shrimp caviare”的中国豆腐菜时,在诸如altavista.com的超级引擎上进行搜索,以确认世界何地提供“shrimp caviare”。使用altavista.com在“所有语言”下进行搜索时,在“英文”或“中文”设置中,显示没有匹配的结果。然后,在中文搜索引擎china.com上查询英文名词“shrimp caviare”时,也没有匹配结果。随后,用中文输入名词“虾酱”查找其中文同义词。找到“虾子”(表示“虾卵”)为中文同义词。然后,用这个单词在china.com上执行搜索,出现了二十四个结果。
陈宁萍(Chan Ning Ping)等的发明“用于翻译查找条件、并对计算机网络上多语信息进行搜索和提取的方法和系统”在2003年8月5日被授予美国专利权(6,604,101)。该专利公开了一种方法,将用户以源语言(sourcelanguage)(也称为用户语言或主体语言)输入的查询条件(query)翻译成目标语言(target language)(也称为客体语言),并且搜索和检索符合条件的目标语言网络文档,再将这些网络文档翻译成源语言。根据该发明,用户首先通过诸如键盘之类的设备输入源语言查询条件。然后,位于后台(backend)的服务器处理该查询条件,从输入的查询条件中提取实义词(content word)。下一步,由位于服务器上的方言控制器进行操作,对提取出的实义词进行方言标准化。在此过程中,可能提示用户输入更多信息以进行精确查询,或者在最初的查询条件不能满足方言标准化需要时,也提示用户输入更多信息。下一步,进行搜索前的翻译,由翻译器将方言标准化的词翻译成目标语言。翻译过程之后,将翻译后的词输入目标语言的搜索引擎。得到与经过翻译的词相同的目标语言的搜索结果。然后以网站名称(URL)的形式显示满足搜索条件的结果。因此,得到的所有目标语言的结果显示在用户的计算机屏幕上。可以根据用户需求将这些结果的全部或部分翻译成源语言。Chan的该专利使得用户以母语输入查询条件,并将目标网站的全部翻译返回给用户,帮助用户进行网络搜索。在很多情况下,对于对目标语言有基础了解的用户,无需对整个文档进行翻译。而就一些关键词、短语或句子进行即时注释就已经足够满足用户要求了。
相应地,希望提供一种系统和方法,使用户能够输入一个与待搜索的文档中使用的原始语言不同的搜索条目(search entry),利用标注或标注泡对搜索结果中每条匹配短语或匹配对象自动加亮,标注或标注泡中包含一个基于人工智能的对匹配短语或匹配对象进行的双语注释。
进一步,希望提供一种系统和方法,使得远端用户能够输入一个与待搜索的网站使用的原始语言不同的搜索条目,利用标注或标注泡对搜索结果中每条匹配短语或匹配对象自动加亮,标注或标注泡中包含一个基于人工智能的对匹配短语或匹配对象进行的双语注释。
再进一步,希望提供一种系统和方法,使得远端用户能够输入一个与网络搜索引擎中使用的语言不同的搜索条目,利用标注或标注泡对搜索结果中每条匹配短语或匹配对象自动加亮,标注或标注泡中包含一个基于人工智能的对匹配短语或匹配对象进行的双语注释。
具体实施方式
参考附图,结合最佳方式和优选实施例对本发明进行详细说明。最常用的形式是,本发明包括一个计算机可读的程序存储介质,具体表现为计算机可执行的指令程序,执行向用户提供一个以上注释标注所需的步骤,每个标注与搜索结果中包含的一个客体语言匹配短语或匹配对象相关,由该搜索程序或搜索引擎返回用户通过输入一个主体语言条目进行搜索的结果。在本申请文件的上下文中,“主体语言”指除了待搜索文档使用的原始语言之外,用户输入条目或查询条件的语言。相应地,“客体语言”指除了主体语言以外,待搜索文档中使用的原始语言。为了说明清楚,主体语言称为“搜索者语言”,客体语言称为“被搜索者语言”。
图1是一个根据本发明一优选实施例的计算机环境方框图。计算机环境包括计算机平台101,计算机平台101包括硬件单元102和操作系统103。硬件单元102包括至少一个中央处理单元(CPU)104、一个存储应用程序的只读随机存储器(通常称为ROM)105、一个应用程序操作所用的读/写随机存储器(通常称为RAM)106和一个输入/输出(I/O)接口107。各种外围设备与计算机平台101连接,例如数据存储设备108和终端109。跨语言搜索和halo(下文称为TSH)应用程序100与诸如Word、Word Perfect和Microsoft Excel等的数据处理应用程序110相配合。本领域普通技术人员容易理解,无需进行本质修改,本发明也可在其它系统中实现。
广义而言,如图2所示,根据本发明的系统和方法执行四个步骤:对用户输入的原始查询条件进行方言处理(步骤111),在搜索前将原始查询条件翻译为客体语言(步骤112),对翻译后的查询条件进行搜索(步骤113)和利用注释标注对搜索结果进行加亮(步骤114)。
图3是说明本发明一优选实施例的示意框图。TSH应用程序100结合在支持可搜索文档的数据处理应用程序中。用户打开一个文档125,通过显示在用户屏幕124上的用户图形界面(GUI)120执行搜索。用户利用语言设置工具121选择一种客体语言,例如,文档中使用的语言,并选择一种主体语言,例如,用户输入查询条件的语言。语言设置工具121可以是一个下拉列表或多个超链接的图标,每个图标代表一种选项。通常,用户从中选择一个选项。然而,系统可设置为使用户能够同时选择两个以上选项。在出厂时预先设置缺省的源或客体语言,但是用户也可以重新设置。缺省语言也可以是用户最后一次使用的语言。在其它情况下,当用户激活TSH应用程序时,无需每次设置语言。方言处理模块111b是一个功能强大的程序,可以鉴别、分析并将不常用的查询条件转换为常用的查询条件或标准化的查询条件,该不常用的查询条件有俚语、方言短语、少年用语(teen-language)或医学、化学和植物学等的专用术语。例如,它可以将auto、automobile和vehicle等联系起来,并通过统计抽象和模糊逻辑对输入进行标准化。假设用户选择简体中文作为主体语言,英语作为客体语言,然后从查询条件输入窗口122输入“吊车”作为其原始搜索查询条件。方言处理模块111b将原始查询条件“吊车”映射为更常用的同义词“起重机”。然后,翻译器112b将“起重机”翻译为“crane”或“cranes”,作为搜索模块113b的搜索查询条件。翻译器112b可以从多种变体或同义词中优化搜索查询条件,变体或同义词包括由于常用而失去明显含义的品牌名称或商标(例如Xerox、Kleenex等)。然后,显示模块114b利用一个闪烁的标注126对在文档中找到的每个匹配术语加亮,标注的内容包括原始查询条件“吊车”及其同义词“起重机”。标注注释在双语模式下,不仅显示主体语言的查询条件,同时显示翻译为客体语言的查询条件及其变体(同义词/替代词)。
图4是一个说明图3的操作示例的示意框图。在此例中,用户输入的是在中文中不常用的表示自行车的术语“单车”。方言处理模块将它翻译成中文最常用的表达方式“自行车”。翻译模块将“自行车”翻译成“bicycle”,作为搜索模块的查询条件。在很多方案中,方言处理模块和翻译模块可以结合为一个模块。
方言处理是非常重要的步骤,因为经常遇到单词具有多个不同方言变体的情况。英语本身就由多种方言变体构成,有英国英语、美国英语、加拿大英语、澳大利亚英语、印度英语和非洲英语等。英国英语和美国英语的方言变体的很典型例子有centre与center、lorry与truck、queue与line,以及petrol与gasoline等。在其它很多语言中也可找到类似情况。例如,中文中一个特定单词的方言变体有四十五种之多。这种情况进一步确认了方言变体是经常性的而非例外的事实,因此,唯一的解决方法就是将查询条件或单词标准化为常见的单词。
特别是,在本发明中,需要对识别出的关键词赋予恰当的含义,所以方言处理的重要性更不能低估。否则,一个不恰当的方言处理将导致翻译错误,并在后续的搜索和检索信息的步骤中破坏整个搜索过程。
在本发明一优选实施例中,如果方言处理模块无法识别单词,并因此而不能执行方言标准化,查询条件提示器将提示用户输入更多的查询条件,或要求用户从一套表达方式中选择,以便帮助用户阐明或突出其查询条件。在这种情况下,用户可以向查询输入工具提交其它查询条件。这种查询条件可以是一个标准术语或非标准术语。例如,单词“auto”的不同变体包括automobile,并且允许用户输入transportation vehicle作为方言标准化步骤的一部分。
图5是增加翻译后的方言处理(或翻译后的查询条件优化)的扩展方案的示意框图。方言处理包括两部分:翻译前的处理130和翻译后的处理140,翻译前的处理130将主体语言的所有不常用的查询条件改变为一个标准的查询条件,翻译后的处理140选择一种最佳和最相关的翻译作为翻译后的查询语言,并识别一个以上翻译后的查询条件的同义词作为搜索查询条件。搜索引擎可以同时或顺序执行搜索。在同时搜索的情况下,如果翻译后的查询条件是“bicycle”,搜索模块执行基于典型布尔“或”功能的“bicycle或bike或cycle或tandem”搜索,只要其中一个变量为真,搜索结果为真。在一个自动的顺序搜索情况下,搜索顺序应由每个同义词或替代词的使用频率确定。例如,假设在语言统计中,“taxi”比“cab”更常用,那么,如果翻译后的查询条件为“taxi”,那么搜索引擎首先搜索“taxi”,然后搜索“cab”。可根据用户命令执行顺序搜索。例如,标注内容可包括翻译后的客体语言查询条件及其变体同义词或替代词。如图6所示,每个同义词或替代词都有超链接。当用户在其中任何一个上移动鼠标指针时,在屏幕上自动弹出消息,例如“点击下划线进行新搜索”。当用户点击其中一个同义词或替代词时,搜索模块对点击的查询条件执行搜索。因为在一些情况下,翻译模块翻译的查询条件对于特定用户来说不是最佳选择,需要用户的参与,所以该功能是很有用的。
参考图3,用户界面包括一个标注设置工具123,用户可以设置参数构建标注并设置标注的风格,标注通常为标注泡,用于显示注释消息。注释消息可包括原始条目的多种主体语言同义词,以及翻译后的查询条件的多种客体语言同义词。参数包括但不局限于风格、形状、字体和字号、以及背景颜色。与语言设置121类似,标注设置123可以是下拉列表或多个具有超链接的图标,每个图标代表一个选项。在一种方案中,语言设置121和标注设置123结合在一个GUI 120中。在另一种方案中,语言设置121和标注设置123以一种方便的方式与显示的标注关联,例如,它们通常处于隐藏状态,但是,用户可通过标注上点击右键来访问它们。在用户修改这些设置之前,它们处于缺省状态,或用户最后一次使用时的状态。
本发明中使用的标注或标注泡是计算机屏幕显示的动态生成的可视提示。可视提示可以是透明的、半透明的或不透明的。虽然用户可以预先设置其风格、形状、字体和字号以及背景颜色,显示的内容由显示模块114b根据搜索模块113b的输出确定,可选地,也可根据翻译模块112b的输出确认。在双语模式下,标注中的注释内容包括标准化的主体语言查询条件及其客体语言的翻译。优选地,标准化的主体语言查询条件及其客体语言的翻译位于不同的行。如果用户从语言设置121中同时选择两种主体语言,注释内容将以三种语言显示。用户可以从语言设置121中同时选择多种主体语言,并获得对其输入的原始查询条件进行的多语注释。虽然标注或标注泡的大小可以固定,优选地,其大小根据显示的内容可调。在此,术语“可调”指弹性、灵活、按比例缩放、自动调整,以适合所显示的内容。例如,当查询条件及其翻译非常短时,标注或标注泡相对较小;否则,标注或标注泡相对较大。
图7示出了一种位于匹配短语或匹配对象(奥克兰港)的右上方的一个rounded矩形注释标注的示意图,其中使用的字体是“Time New Roman”。图8示出了一种位于匹配结果坐下方的云朵形状的注释标注,其中使用的字体是“Courier New”。
标注和“标注泡”之间的不同之处在于前者具有一个主体和一个尾部,但是后者只有一个主体。尾部的用处在于它可作为注释标注和需要注释的文本信息之间的引用桥梁。虽然在本发明中,优选地,在多个实施例中使用标注,但是,使用其它诸如正方形、矩形、圆形、标注泡、或“风筝”形状的可视提示框来显示返回的注释消息也不偏离本发明的主旨和范围。
图9是根据上述优选实施例的一种方案的方法170流程图。方法170包括如下步骤:
步骤171:用户输入选定的主体语言的原始条目(例如“特大吊车”的中文意思是超级巨大的吊车);
步骤172:方言处理模块通过应用一套统计、逻辑、语言规则和/或语法规则对用户的原始条目进行标准化(例如,将“特大吊车”改为中文意思为起重机的“起重机”);
步骤173:检查标准化是否成功;
步骤178:如果步骤173的检查结果为否,提示用户修改其输入条目;
步骤174:如果步骤173的检查结果为是,翻译器将标准化的条目翻译为选定的客体语言,作为一个查询条件(例如,将“起重机”翻译为CRANE或CRANES);
步骤175:使用该查询条件搜索目标文档;
步骤176:利用标注对所有目标文档中的匹配短语或匹配对象加亮,标注的内容包括标准化的主体语言条目(例如“起重机”)、原始的主体语言条目(“吊车”)、客体语言查询条件(crane)和/或其它帮助阅读的信息。
在图6所示的方案中,翻译后的查询条件的同义词/替代词在标注中显示为超链接,方法170进一步包括以下步骤:
步骤177:当用户点击任何一个超链接的同义词/替代词时,将点击的同义词/替代词作为一条查询条件执行新的搜索。
图10是根据上述优选实施例的另一方案的方法180流程图。方法180包括如下步骤:
步骤181:用户用选定的主体语言输入查询条目(例如,在中文口语中“的士”指出租车);
步骤182:方言处理模块通过应用一套统计、逻辑、语言规则和/或语法规则对用户的原始条目进行标准化(例如,将“的士”修改为“出租车”);
步骤183:自动检查标准化是否成功;
步骤188:如果步骤183的检查结果为否,提示用户修改其输入条目;
步骤184:如果步骤183的检查结果为是,翻译器将标准化的条目翻译为选定的客体语言,作为一个查询条件(例如,将“出租车”翻译为TAXI);
步骤185:识别一个以上客体语言条目的替代词(例如taxi、cab、yellowcab或minicab);
步骤186:对查询条件和所有识别出的替代词进行布尔搜索;
步骤187:利用标注对所有目标文档中的匹配短语或匹配对象加亮,标注的内容包括标准化的主体语言条目、原始的主体语言条目、和/或客体语言查询条件或其翻译。
图11是根据本发明另一优选实施例的基于互联网的网络示意框图,它是本发明在网站内容管理领域的应用。TSH应用程序在支持网站202的后台服务器201上运行。用户(搜索者)203通过互联网204访问网站202。网站202包括GUI 220,在GUI 220上,用户203从多个选项中选择一种主体语言,并输入用于搜索网站的主体语言原始条目。用户还可以设置用于加亮网站中匹配短语或对象的标注或标注泡。
图12是进一步说明图11的优选实施例的示意框图。GUI 220包括一个语言设置工具221、一个标注设置工具223和一个查询条件输入工具222,语言设置工具221既可以是下拉列表,也可以是多个具有超链接的图标,每个图标对应一个选项,用户在标注设置工具223设置多个标注(或标注泡)的参数,用于加亮该特定网站的匹配短语或对象,用户在查询条件输入工具222中用选定的主体语言输入原始条目并点击“go”以开始搜索过程。方言处理模块211应用一套统计、逻辑、语言规则和/或语法规则,将原始条目标准化或修改为一个主体语言中更为常用的条目。如果标准化失败,服务器向用户返回提示信息,提示用户修改原始条目。翻译模块212将标准化的条目翻译成客体语言(例如,网站使用的语言)。然后,使用翻译后的条目作为搜索查询条件执行搜索操作。显示控制214负责发送信号对在网站页面225中找到的匹配短语或匹配对象加亮。本发明中使用的加亮方式是一个可视提示,诸如包括注释消息的标注226或标注泡。在优选实施例中,可视提示可设置为闪烁或闪光的标注。
图13是根据图11和图12的优选实施例的方法流程图。该方法包括如下步骤:
步骤251:用户(搜索者)通过在其浏览器中输入网站域名(URL)访问服务器(被搜索者)支持的网站;
步骤252:从语言设置工具中选择一种主体语言;
步骤253:用主体语言输入一个原始条目;
步骤254:服务器标准化该原始条目;
步骤255:将标准化的条目翻译为客体语言;
步骤256:使用翻译后的条目作为一个查询条件,搜索存储在服务器数据库中的网站文件;
步骤257:向用户计算机屏幕返回搜索结果;和
步骤258:根据服务器端的显示控制214发来的信号,用标注注释加亮每个匹配短语或匹配对象。
可选地,如果服务器由于某种原因不能进行标准化,该方法可包括一个提示用户修改其原始条目的步骤。例如,当输入的单词超过服务器数据库的范围,或者输入的字符过于泛泛以至于不能进行有意义的搜索时。
如图5、图6和图9所示,该方法进一步包括一个翻译后的方言处理(也称为优化步骤)。翻译后的方言处理步骤包括如下子步骤:
优化翻译后的条目;
识别一个以上该优化条目的替代词;
如图6所示,以超链接的形式在注释标注中显示查询条件替代词;和
如果用户点击任何超链接的替代词,将执行一个新的搜索。
或者,如图5和图10所示,该方法可包括一个不同的翻译后方言处理的步骤。这种不同的翻译后的方言处理步骤包括如下子步骤:
优化翻译后的条目;
识别一个以上该优化条目的替代词;和
对优化条目和所有识别出的替代词进行布尔搜索。
图14是根据本发明另一优选实施例的基于互联网的网络示意框图,它是本发明在网络搜索引擎领域的应用。TSH应用程序在后台服务器301上运行,该后台服务器301通过其网站302支持跨语言网络搜索引擎。用户303通过互联网304访问网站302。网站302包括GUI 320,在GUI 320上,用户303从多个选项中选择一种主体语言,并输入用于搜索互联网信息的主体语言原始查询条件。用户还可以设置用于加亮网站中匹配短语或对象的标注(或标注泡)。
图15是进一步说明图14的优选实施例的示意框图。GUI 320包括一个语言设置工具321、一个标注设置工具323和一个查询条件输入工具322,语言设置工具321既可以是下拉列表,也可以是多个具有超链接的图标,每个图标对应一种选项,用户在标注设置工具323设置多个标注(或标注泡)的参数,用于加亮返回的搜索列表中匹配短语或对象,用户在查询条件输入工具322中用选定的主体语言输入原始条目并点击“go”以开始搜索过程。方言处理模块311应用一套统计、逻辑、语言规则和/或语法规则,将原始条目标准化或修改为一个主体语言中更为常用的条目。如果标准化失败,服务器向用户返回提示信息,提示用户修改原始条目。翻译模块312将标准化的条目翻译成客体语言(例如,网站使用的语言)。然后,搜索引擎313使用翻译后的条目作为搜索查询条件执行搜索操作。显示控制314负责发送信号对在返回的搜索结果324的列表中找到的匹配短语或匹配对象加亮。本发明中使用的加亮方式是一个可视提示,诸如包括注释消息的标注326或标注泡。在优选实施例中,可视提示可设置为闪烁或闪光的标注。
图16是根据图14和图15的优选实施例的方法流程图。该方法包括如下步骤:
步骤351:用户通过在其浏览器中输入网站域名(URL)访问搜索引擎的主页;
步骤352:从语言设置工具中选择一种主体语言(例如,简体中文);
步骤353:用主体语言输入一个原始条目(例如,跨语言的检索系统或方法);
步骤354:后台服务器标准化该原始条目(例如,将“跨语言的搜索系统和方法”修改为“跨语言搜索”);
步骤355:将标准化的条目翻译为客体语言(例如,将“跨语言搜索”翻译成“cross-language search”);
步骤356:使用翻译后的条目作为一个查询条件,搜索互联网信息;
步骤357:向用户计算机屏幕返回搜索结果,根据服务器端的显示控制314发来的信号,用闪烁的标注注释加亮每条匹配短语或匹配对象。
可选地,如果服务器由于某种原因不能进行标准化,该方法可包括一个提示用户修改其原始条目的步骤。例如,当输入的单词超过服务器数据库的范围,或者输入的字符过于泛泛以至于不能进行有意义的搜索时。
如图5、图6和图9所示,该方法进一步包括一个翻译后的方言处理(也称为优化步骤)。翻译后的方言处理步骤包括如下子步骤:
优化翻译后的条目;
识别一个以上该优化条目的替代词;
如图6所示,以超链接的形式在注释标注中显示查询条件替代词;和
如果用户点击任何超链接的替代词,执行一个新的搜索。
或者,如图5和图10所示,该方法可包括一个不同的翻译后方言处理的步骤。这种不同的翻译后的方言处理步骤包括如下子步骤:
优化翻译后的条目;
识别一个以上该优化条目的替代词;和
对优化条目和所有识别出的替代词进行布尔搜索。
上述发明可在法律、科学、商业、新闻、后勤、专利和教育等诸多领域内应用。上述发明也可以应用于搜索引擎和数据库、电子出版和日译英、日译中、日译韩和英译西等。
虽然在此说明书中参考优选实施例对本发明进行了说明,本领域普通技术人员仍容易理解,其它应用程序也可以替代本文提出的应用程序,而不偏离本发明的精神和范围。
相应地,本发明仅受权利要求书的限制。