CN101131703A - 利用声调标记搜索中文字符的方法和实现该方法的系统 - Google Patents

利用声调标记搜索中文字符的方法和实现该方法的系统 Download PDF

Info

Publication number
CN101131703A
CN101131703A CNA2007101433819A CN200710143381A CN101131703A CN 101131703 A CN101131703 A CN 101131703A CN A2007101433819 A CNA2007101433819 A CN A2007101433819A CN 200710143381 A CN200710143381 A CN 200710143381A CN 101131703 A CN101131703 A CN 101131703A
Authority
CN
China
Prior art keywords
result page
keyword
tone
retrieval
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007101433819A
Other languages
English (en)
Inventor
金度妍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NHN Corp
Original Assignee
NHN Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NHN Corp filed Critical NHN Corp
Publication of CN101131703A publication Critical patent/CN101131703A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种利用声调标记搜索中文字符的方法和用于实现该方法的系统。所述方法包括:确认是否对通过用户终端输入的搜索词的独立字符进行搜索;以及在搜索独立字符的步骤中,根据所述搜索词的发音,向所述用户终端提供不同的检索结果。

Description

利用声调标记搜索中文字符的方法和实现该方法的系统
相关申请的交叉参考
本专利申请要求2006年8月25日提交到韩国知识产权局的韩国专利中请No.10-2006-0081281的权利,该韩国专利申请的公开内容通过引用并入此处。
技术领域
本发明涉及一种利用声调标记搜索中文字符的方法和使用该方法的系统,特别涉及一种通过识别包括声调标记的搜索词来针对每个声调标记搜索中文字符并显示针对每个声调标记的检索结果的方法,和用于实现该方法的系统。
背景技术
声调标记是在连续讲话时与音节相对应的语言音高水平的变化,而声调标记有时会与重音符号相混淆。与声调标记相反,重音符号表示在文字中预定位置上存在的高声调标记。
通过这种声调的不同来区分含意的语言被称为声调语言。中文是声调语言的代表,而且普通话有四个声调,称为第一声调(
Figure A20071014338100081
ma)、第二声调(ma)、第三声调(
Figure A20071014338100083
ma)和第四声调(
Figure A20071014338100084
ma)。通常将拼音罗马拼写(PinyinRomanization)和韦德-盖尔斯罗马拼写(Wade-Giles Romanization)用于中文罗马拼写。
在采用传统技术的中文字典中,直接输入中文字符,或者忽略声调标记来输入拼音。但是,根据传统技术,即使当用户只想要搜索第一声调的字符,也要从全部被输入的第一声调、第二声调、第三声调和第四声调中搜索需要的字符,并且由于针对所需字符存在大量的检索结果,所以将检索结果页分类为多个页,因此其存在下述问题,即用户需要对属于多个检索结果页的全部字符进行搜索。
图1是示出采用罗马拼写在中文字典中搜索拼音字符的示例的示意图。具体而言,图1是示出用搜索词111“feng”搜索与第三声调相对应的字符的示意图。
网页110显示了搜索词111的检索结果页。根据网页110,当存在大量检索结果时,可以展示预定数量的检索结果,并且可以利用允许进一步显示的功能112向用户展示其余的检索结果。
在这种情况下,由于在采用传统技术的中文字典中,字符按照第一声调、第二声调、第三声调和第四声调的顺序显示,因此需要利用进一步显示的功能112,移动至另一网页120即另一搜索页,以便搜索与三声调相对应的字符。
网页120是检索结果的第一页121,并且显示了整个页的一部分,对于没有同时展示在用户显示器上的检索结果,利用滚动条122可以确认到整个页的最后的检索结果。在这种情况下,用户需要移动至网页130来获得所需检索结果。
网页130是检索结果的第二页131,并且滚动条132被用于搜索所需要的字符,在检索到一个第三声调字符133后,在第三声调字符中搜索所需要的其余字符。在这种情况下,当无法在网页130中的第三声调字符中找到需要的字符时,用户需要移动至另一页。
如上所述,忽略声调符号的拼音搜索具有下述问题,即使当需要的搜索结果展示于一个网页时,也需要确认从第一声调到第四声调的全部字符,而且为了获得所需搜索结果,用户需要移动至多个检索结果页,并且对检索结果进行确认。
发明内容
本发明提供了一种利用声调标记搜索中文字符的方法和使用该方法的系统,当输入关于中文字符的搜索词时,将数字关键词识别为包括在所述搜索词中的拼音关键词的声调标记,并且将关于所述声调标记的检索结果作为唯一的对所述拼音关键词进行检索的结果进行展示,因此所述方法可以轻松、快速地获得需要的搜索结果。
本发明还提供了一种利用声调标记搜索中文字符的方法和使用该方法的系统,对于没有数字关键词的搜索词,将每个声调标记的检索结果页和包括在所述搜索词中的拼音关键词的检索结果一起显示,并且与所述拼音关键词的检索结果一起附加地显示出连接到每个声调标记的结果页的链接,因此所述方法可以轻松、快速地获得需要的搜索结果。
本发明还提供了一种利用声调标记搜索中文字符的方法和使用该方法的系统,所述方法在对包括中文在内的全部声调语言的拼音字符的搜索中,利用数字关键词和链接可以确认每个声调标记的检索结果。
根据本发明的一个实施例,提供了一种用于搜索中文字符的方法,该方法包括:确认是否对通过用户终端输入的搜索词的独立字符进行搜索;和,在搜索独立字符的步骤中,根据所述搜索词的发音向所述用户终端提供不同的检索结果。
根据本发明的一个方面,搜索独立字符的步骤包括:搜索基于拼音罗马拼写或韦德-盖尔斯罗马拼写的独立拼音字符;搜索单个韩语音节;和搜索单个中文字符。
根据本发明的另一方面,确认是否对通过用户终端输入的搜索词的独立字符进行搜索的步骤为:在分析所述搜索词之后提取关键词时,确认是否对所述搜索词的独立字符进行搜索,所述关键词包括所述独立拼音字符、所述单个韩语音节和所述单个中文字符。
根据本发明的另一方面,向用户终端提供不同检索结果的步骤包括:当搜索词由拼音关键词和数字关键词的组合组成时,将所述数字关键词识别为所述拼音关键词的声调标记;生成所述拼音关键词关于所述声调标记的检索结果页;和,向所述用户终端传送所述拼音关键词的检索结果页。
根据本发明的另一实施例,提供了一种在声调语言中搜索字符的方法,该方法包括:确认是否对通过用户终端输入的搜索词的独立字符进行搜索;作为对所述独立字符进行搜索的结果,确认所述搜索词是否包括拼音关键词;和,根据所述拼音关键词或者所述拼音关键词的声调标记生成至少一个检索结果页,并且向所述用户终端提供所生成的至少一个检索结果页。
根据本发明的另一实施例,提供了一种用于搜索中文字符的系统,该系统包括:独立字符搜索确认部分,其被配置为确认是否对通过用户终端输入的搜索词的独立字符进行搜索;和检索结果提供部分,其被配置为在搜索独立字符的步骤中根据所述搜索词的表达方式向所述用户终端提供不同的检索结果。
附图说明
通过下述结合附图的详细说明,本发明的上述和/或其它方面和优点会变得清楚明白而且更易理解。所述附图为:
图1是示出传统技术中采用拼音罗马拼写在中文字典中搜索拼音字符的示例的示意图;
图2是示出根据本发明第一实施例用于搜索中文字符的系统的示意图;
图3是示出根据本发明第一实施例用于搜索中文字符的方法的流程图;
图4是示出根据本发明第一实施例用于提供搜索词的检索结果的方法的流程图,所述搜索词包括拼音关键词和数字关键词;
图5是示出搜索词的检索结果页的示例的示意图,所述搜索词包括拼音关键词和数字关键词;
图6是示出根据本发明第一实施例用于提供搜索词的搜索结果的方法的流程图,所述搜索词包括拼音关键词;
图7是示出根据包括拼音关键词的搜索词生成的检索结果页的示意图;
图8是示出根据本发明第二实施例用于搜索中文字符的系统的内部结构的结构图;
图9是示出根据本发明第三实施例用于搜索声调语言的方法的流程图;和
图10是示出根据本发明第四实施例用于搜索声调语言的系统的内部结构的结构图。
具体实施方式
现在对本发明的示例性实施例进行详细介绍,在附图中对本发明的示例进行了显示,其中相同的附图标记始终对应于相同的组成部分。为了解释本发明,下面参考附图对示例性实施例进行说明。
图2是示出根据本发明第一实施例的用于搜索中文字符的系统200的示意图。
用于搜索中文字符的系统200从用户终端201接收搜索词,从搜索词中提取关键词,并且利用关键词向用户终端201提供检索结果。
当搜索词是包括数字的数字关键词和包括独立拼音字符的拼音关键词的组合202时,用于搜索中文字符的系统200通过第一搜索页203接收搜索词,将数字识别为独立拼音字符的声调标记,相对于声调标记搜索独立拼音字符的检索结果,生成检索结果页204,并且将检索结果页204传送给用户终端201,由此处理用户终端201对搜索词的请求。
此外,当搜索词是包括独立拼音字符的拼音关键词205时,用于搜索中文字符的系统200通过第二搜索页206接收检索结果,并且生成独立拼音检索结果页207。在这种情况下,用于搜索中文字符的系统200生成关于独立字符每个声调标记的声调标记结果页208、209、210和211,并且在独立拼音检索结果页207上建立链接,由此处理用户终端201的请求。
如上所述,通过利用独立拼音字符的声调标记搜索中文字符来显示声调标记的检索结果,由此可以获得需要的搜索结果。通过参考附图3到7对利用声调标记搜索中文字符的方法进行说明。
图3是示出根据本发明第一实施例的用于搜索中文字符的方法的流程图。
在操作S301中,用于搜索中文字符的系统确认是否对通过用户终端输入的搜索词的独立字符进行搜索,其中所述系统可以显示关于中文字符的检索结果。在这种情况下,搜索独立字符的步骤可以对应于下述步骤:1)搜索基于拼音罗马拼写或韦德-盖尔斯罗马拼写的独立拼音字符;2)搜索单个韩语音节;和3)搜索单个中文字符。在操作S301中,当在分析搜索词后提取包括独立拼音字符、单个韩语音节和单个中文字符的关键词时,用于搜索中文字符的系统200确认是否对搜索词的独立字符进行搜索。
在操作S302中,用于搜索中文字符的系统根据搜索独立字符的步骤中的搜索词的表达方式,向用户终端提供不同的检索结果。搜索词可以唯一地包括独立拼音字符,或者可以包括表示独立拼音字符的数字和独立拼音字符的声调标记。而且,搜索词可以包括由单个韩语音节和单个中文字符组成的关键词。
也就是说,用于搜索中文字符的系统根据包括在搜索词中的关键词的类型和结构生成不同的检索结果页,并且传送拼音关键词关于声调标记的检索页,由此显示搜索中文字符步骤的结果。通过参考附图4到7,详细说明操作S302中对不同检索结果页的显示。
此外,在操作S302中,当搜索词对应于包括单个韩语音节的关键词时,用于搜索中文字符的系统可以向用户终端提供利用单个韩语音节的发音进行检索的结果页,生成由与简体字(简体中文)和繁体字(传统中文)的关键词相对应的检索结果组成的检索结果页,并且可以向用户终端提供所生成的检索结果页。
而且,用于搜索中文字符的系统可以执行另一操作(未示出),该操作通过使用中文字典和本国语字典生成关于搜索词的检索结果页,并且向用户终端提供所生成的检索结果页。
图4是示出根据本发明第一实施例的用于提供搜索词检索结果的方法的流程图,搜索词包括拼音关键词和数字关键词。如图4所示,操作S401至S404可以包括在图3的操作S302中执行。
在操作S401中,用于搜索中文字符的系统确认搜索词是否由拼音关键词和数字关键词的组合组成,当搜索词由拼音关键词和数字关键词的组合组成时执行操作S402,而当搜索词不是由拼音关键词和数字关键词的组合组成时终止操作S302。在这种情况下,当搜索词不是由拼音关键词和数字关键词的组合组成时,用于搜索中文字符的系统不会立即终止操作S420,而且可以执行对由单个韩语音节或单个中文字符组成的关键词的搜索。
在操作S402中,用于搜索中文字符的系统将数字关键词识别为拼音关键词的声调标记。所述声调标记可以表示在中文中使用的四个声调:第一声调、第二声调、第三声调和第四声调,并且当所述数字关键词包括数字1到4时,分别将数字1到4识别为第一声调、第二声调、第三声调和第四声调。
在操作S403中,用于搜索中文字符的系统生成拼音关键词关于声调标记的检索结果页。在这种情况下,拼音关键词可以包括基于拼音罗马拼写或韦德-盖尔斯罗马拼写的独立拼音字符。此外,用于搜索中文字符的系统生成与用户输入的声调标记之外的其它声调标记相关的每个声调标记的结果页、以及检索结果页的整个结果页,并在拼音关键词的检索结果页上建立链接,由此向用户提供附加的信息。
在操作S404中,用于搜索中文字符的系统向用户终端传送检索结果页。如上所述,由于检索结果页包括与声调标记相关的检索结果,因此无需确认对应于四个声调的全部检索结果,利用声调标记的检索结果,用户就可以轻松、快速地获得需要的检索结果。
图5是示出搜索词501检索结果页的示例的示意图,其中搜索词501包括拼音关键词和数字关键词。
网页500是用于搜索中文字典的互联网页面的一部分,并显示出利用中文字典检索到的关于搜索词501的检索结果页,其中搜索词501包括拼音关键词和数字关键词。在这种情况下,用于搜索中文字符的系统从搜索词501中提取拼音关键词和数字关键词,将数字关键词识别为拼音关键词的声调标记,由此生成拼音关键词关于声调标记的检索结果页。
网页500是所述检索结果页的一个示例,并通过使用拼音关键词“feng”和数字关键词“3”显示出关于第三声调的“feng”的检索结果页。此外,网页500可以包括与拼音关键词的每个声调标记的结果页相连的链接503,由此提供了当用户错误地输入声调标记时能够轻松地搜索其它声调标记检索结果的功能。
图6是示出根据本发明第一实施例的用于提供搜索词检索结果的方法的流程图,其中所述搜索词包括拼音关键词。如图6所示,操作S601至S606可以包括在图3的操作S302中执行。
在操作S601中,用于搜索中文字符的系统确认搜索词是否是拼音关键词,当搜索词是拼音关键词时执行操作S602,而当搜索词不是拼音关键词时终止操作S302。在这种情况下,如图2至图4所述,当所述搜索词不是拼音关键词时,用于搜索中文字符的系统可以执行对以下关键词的搜索,所述关键词与拼音关键词和数字关键词的组合、单个韩语音节和单个中文字符相关。
在操作S602中,用于搜索中文字符的系统生成拼音关键词的检索结果页。在这种情况下,拼音关键词可以包括基于拼音罗马拼写或韦德-盖尔斯罗马拼写的独立拼音字符。
在操作S603中,用于搜索中文字符的系统生成每个声调标记的结果页,作为针对每个声调标记对拼音关键词进行搜索的结果。根据中文中使用的四个声调:第一声调、第二声调、第三声调和第四声调,每个声调的结果页可以包括单独的检索结果。
在操作S604中,用于搜索中文字符的系统在检索结果页上建立关于每个声调标记结果页的链接。即,用于搜索中文字符的系统在结果页上分别建立连接到关于第一声调的声调标记结果页的链接、连接到关于第二声调的声调标记结果页的链接、连接到关于第三声调的声调标记结果页的链接和连接到关于第四声调的声调标记结果页的链接,并且当用户知道与拼音关键词相关的待搜索字符的声调标记时,用户可以通过链接快速地移动至包括所需检索结果的网页,由此轻松、快速地获得所需检索结果。
在操作S605中,用于搜索中文字符的系统在关于四个声调的每个声调标记的每个检索结果页之间建立链接。即,用于搜索中文字符的系统在每个结果页之间、在关于第一声调的声调标记结果页和关于第二声调的声调标记结果页之间、在关于第三声调的声调标记结果页和关于第四声调的声调标记结果页之间等类似页面之间建立链接。在用户没有找到所需检索结果时,当用户想要搜索关于第一、第二和第四声调的每个声调标记的检索结果时,可以使用所述建立链接的步骤。
在操作S606中,用于搜索中文字符的系统将已建立链接的检索结果页传送到用户终端。利用所传送的检索结果页和所述建立链接的步骤,用户可以轻松、快速地获得所需检索结果。
图7是示出生成关于包括拼音关键词的搜索词的检索结果页的示意图。
根据用于搜索中文字符的系统,网页701显示了包括拼音关键词的“feng”711的检索结果页的一部分。在这种情况下,用于搜索中文字符的系统提取拼音关键词“feng”711,并显示关于拼音关键词“feng”711的检索结果。
网页710显示关于拼音关键词的全部检索结果712,即网页710显示关于四个声调的全部检索结果。在这种情况下,用于搜索中文字符的系统生成拼音关键词的每个声调标记的结果页,并在网页710上建立连接到拼音关键词每个声调标记的每个结果页的链接。因此,当用户知道待搜索的拼音关键词的声调标记时,用户可以通过所述链接快速地移动至与所述声调标记相关的结果页。
网页720是关于拼音关键词第三声调的每个声调标记的结果页,并且用户可以通过第三声调713和721的链接快速地移动至网页720,由此找到第三声调713和721的检索结果722。
如上所述,当输入关于中文字符的搜索词时,由于将数字关键词识别为包括在搜索词中的拼音关键词的声调标记,因此可以轻松、快速地获得所需搜索结果,并且排他地显示关于声调标记的检索结果,作为对拼音关键词进行检索的结果。
此外,通过向用户提供连接到每个声调标记结果页的链接和包括在搜索词中的拼音关键词的检索结果,对于没有数字关键词的搜索词,用户可以快速地获得所需要的检索结果。
图8是示出根据本发明第二实施例的用于搜索中文字符的系统800的内部结构的框图。如图8所示,用于搜索中文字符的系统800包括独立字符搜索确认部分810和检索结果提供部分820。
独立字符搜索确认部分810确认是否对通过用户终端输入的搜索词的独立字符进行搜索。在这种情况下,搜索独立字符的步骤可以对应于下述步骤:1)搜索基于拼音罗马拼写或韦德-盖尔斯罗马拼写的独立拼音字符;2)搜索单个韩语音节;和3)搜索单个中文字符。当在分析搜索词之后提取关键词时,独立字符搜索确认部分810确认是否对所述搜索词的独立字符进行搜索,所述关键词包括独立拼音字符、单个韩语音节和单个中文字符。
检索结果提供部分820根据与搜索独立字符的步骤相关的所述搜索词的表达方式,向用户终端提供不同的检索结果。在这种情况下,如820a所示,检索结果提供部分820可以包括声调标记识别部分821a、检索结果页生成部分822a和检索结果页传送部分823a。此外,如820b所示,检索结果提供部分820可以包括检索结果页生成部分821b、声调标记结果页生成部分822b、链接建立部分823b和检索结果页传送部分824b。
当搜索词由拼音关键词和数字关键词的组合组成时,声调标记识别部分821a将所述数字关键词识别为所述拼音关键词的声调标记。在这种情况下,所述声调标记可以表示中文中使用的四个声调:第一声调、第二声调、第三声调和第四声调,并且当所述数字关键词包括数字1到4时,分别将数字1到4识别为第一声调、第二声调、第三声调和第四声调。
检索结果页生成部分822a生成拼音关键词关于声调标记的检索结果页。所述拼音关键词可以包括基于拼音罗马拼写或韦德-盖尔斯罗马拼写的独立拼音字符。
检索结果页传送部分823a向用户终端传送检索结果页。
如上所述,根据本发明的用于搜索中文字符的系统,由于同时输入了通过用户终端输入的独立拼音字符的声调标记,并且仅从与所述声调标记相关的检索结果而不是从全部检索结果中搜索需要的检索结果,因此用户可以轻松、快速地找到所需检索结果。
当所述搜索词是拼音关键词时,检索结果页生成部分821b检索拼音关键词关于声调标记的结果页。在这种情况下,检索结果页生成部分821b提取所述搜索词的关键词,并仅在所述关键词是拼音关键词时运行。即,通过限定于搜索词是拼音关键词时的情况,检索结果提供部分820可以运行系统820a的内部结构。
声调标记结果页生成部分822b生成每个声调标记的结果页,作为针对每个声调标记对所述拼音关键词进行搜索的结果。
链接建立部分823b在所述检索结果页上建立连接到针对每个声调标记的每个结果页的链接。在这种情况下,所述声调标记可以表示在中文字符中使用的四个声调,并且链接建立部分823b可以在针对每个声调标记的每个结果页之间建立链接。
检索结果页传送部分824b向用户终端传送其中已建立链接的检索结果页。
如上所述,通过向用户提供连接到每个声调标记结果页的链接和包括在所述搜索词中的拼音关键词的检索结果,对于没有数字关键词的搜索词,用户可以快速地获得所需要的检索结果。
图9是示出根据本发明第三实施例的用于在声调语言中搜索字符的方法的流程图。
在操作S901中,用于在声调语言中搜索字符的方法确认是否对通过用户终端输入的搜索词的独立字符进行搜索,用于搜索声调语言的系统提供所述声调语言的检索结果。在这种情况下,对所述独立字符的搜索可以包括对下述关键词的搜索,所述关键词包括声调语言的独立拼音字符。
在操作S902中,用于在声调语言中搜索字符的方法确认在对所述独立拼音字符的搜索中搜索词是否包括拼音关键词。在这种情况下,拼音关键词可以包括声调语言的独立字符,所述独立字符按照声调标记具有不同的含义。所述声调标记包括声调语言所用的多个声调标记。例如,泰语具有五个声调:平声调、低声调、下降声调、高声调和上升声调,并且字的含义根据泰语的五个声调发生变化。平声调的“maa”表示“来”[动词]、低声调的“maa”表示“马”[名词],而高声调的“maa”表示“狗”[名词]。
在操作S903中,用于在声调语言中搜索字符的方法根据拼音关键词或者声音关键词的声调标记生成至少一个检索结果页,并且向用户终端提供所生成的检索结果页。
操作S903可以包括如下步骤:当搜索词由拼音关键词和数字关键词的组合组成时将数字关键词识别为拼音关键词的声调标记(未示出),生成拼音关键词关于声调标记的检索结果页(未示出),并且向用户终端传送所述拼音关键词的检索结果页(未示出)。
此外,当所述搜索词由拼音关键词和数字关键词的组合组成时,将数字关键词识别为拼音关键词的声调标记的步骤可以与将下述声调标记识别为拼音关键词的声调标记相对应,其中所述声调标记对应于包含在数字关键词中的数字。
操作S903可以包括如下步骤:生成所述拼音关键词的检索结果页,生成每个声调标记的结果页作为针对每个声调标记对所述拼音关键词进行搜索的结果,在所述拼音关键词的检索结果页上建立连接到每个声调标记的结果页的链接,并且向用户终端传送已建立所述链接的所述拼音关键词的检索结果页。
如上所述,对于包括中文字符在内的全部声调语言的字符,利用所述链接通过所述数字关键词可以识别针对每个声调标记的检索结果。
图10是示出根据本发明第四实施例的用于在声调语言中搜索字符的系统1000的内部结构的框图。如图10所示,用于在声调语言中搜索字符的系统1000可以包括独立字符搜索确认部分1010、拼音关键词确认部分1020和检索结果页处理部分1030。
独立字符搜索确认部分1010确认是否对通过用户终端输入的搜索词的独立字符进行搜索。在这种情况下,搜索独立字符的步骤可以包括搜索包括声调语言独立拼音字符的搜索词。
拼音关键词确认部分1020在搜索所述独立字符的步骤中,确认所述搜索词是否包括拼音关键词。在这种情况下,所述拼音关键词可以包括声调语言的独立字符,所述独立字符按照声调标记具有不同的含义,并且所述声调标记可以包括所述声调语言中使用的多个声调标记。
检索结果页处理部分1030根据拼音关键词或者拼音关键词的声调标记生成至少一个检索结果页,并且向用户终端提供所生成的至少一个检索结果页。在这种情况下,如1030a所示,检索结果页处理部分1030可以包括声调标记识别部分1031a、检索结果页生成部分1032a和检索结果页传送部分1033a。
当搜索词由拼音关键词和数字关键词的组合组成时,声调标记识别部分1031a将所述数字关键词识别为所述拼音关键词的声调标记。例如,当多个声调标记表示泰语中使用的平声调、低声调、下降声调、高声调和上升声调时,声调标记识别部分1031a可以将数字1到5分配给所述多个声调标记中的每一个声调标记,并且可以将对应于所述数字的声调识别为所述拼音关键词的声调标记。
检索结果页生成部分1032a生成所述拼音关键词关于声调标记的检索结果页。
检索结果页传送部分1033a向用户终端传送所述检索结果页。
如上所述,在用于搜索声调语言的字符的系统中,由于同时输入了通过用户终端输入的独立拼音字符的多个声调标记,并且仅从与所述声调标记相关的检索结果而不是从全部检索结果中搜索需要的检索结果,因此用户可以轻松、快速地找到所需检索结果。
当所述搜索词是拼音关键词时,检索结果页生成部分1031b生成所述拼音关键词的检索结果页。在这种情况下,通过限定于搜索词是拼音关键词时的情况,检索结果页处理部分1030可以运行系统1030b的内部结构。
声调标记结果页生成部分1032b生成所述拼音关键词的每个声调标记的结果页,即所述拼音关键词的每个声调标记的结果页。
链接建立部分1033b在所述检索结果页上建立连接到每个声调标记的结果页的链接。例如,当声调标记表示泰语中使用的平声调、低声调、下降声调、高声调和上升声调时,链接建立部分1033b可以在每个声调标记的结果页之间建立链接。
检索结果页传送部分1034b向用户终端传送已建立所述链接的所述拼音关键词的检索结果页。如上所述,用于在声调语言中搜索字符的系统1000对于包括中文字符在内的全部声调语言的字符,利用所述链接通过所述数字关键词可以识别针对每个声调标记的检索结果。
根据本发明上述实施例的用于搜索中文字符的方法可以记录在计算机可读介质中,所述介质包括由计算机实现的执行不同操作的程序指令。所述介质也可以包括单独的或者与所述程序指令相结合的数据文件、数据结构等类似的介质。计算机可读介质的例子包括:磁介质,例如硬盘、软盘和磁带;光介质,例如CD ROM盘和DVD;磁光介质,例如光盘;以及被特别配置为存储和执行程序指令的硬件设备,例如只读存储器(ROM)、随机存取存储器(RAM)、闪存等类似的设备。所述介质也可以是例如光线或金属线、波导等传输介质,所述传输介质包括传输指定了程序指令、数据结构等的信号的载波。程序指令的例子包括诸如由编译器生成的机器代码,和包含高级代码的文件,所述高级编码可以由使用解释器的计算机来执行。所述硬件设备可以被配置来充当用于执行本发明上述实施例中操作的一个或多个软件模块。
根据本发明,当输入关于中文字符的搜索词时,由于将数字关键词识别为包括在所述搜索词中的拼音关键词的声调标记,因此可以轻松、快速地获得所需要的搜索结果,并且排他地展示关于所述声调标记的检索结果,作为对所述拼音关键词的检索结果。
此外,根据本发明,对于没有数字关键词的搜索词,将每个声调标记的检索结果页和包括在所述搜索词中的拼音关键词的检索结果一起进行显示,因此可以轻松、快速地获得所需要的搜索结果,并且与所述拼音关键词的检索结果一起,另外显示出连接到每个声调标记结果页的链接。
而且,根据本发明,在对包括中文在内的全部声调语言的拼音字符的搜索中,利用数字关键词和链接可以确认每个声调标记的检索结果。
虽然对本发明的几个示例性实施例进行了说明和描述,但是本发明不限于所述示例性实施例。本领域技术人员可以理解,在不背离本发明的原则和精神的前提下可以对这些示例性实施例进行修改,本发明的保护范围由权利要求和其等同替换所定义。
如在本申请中的使用,规定术语“部分”和“系统”为与计算机相关的实体:硬件、硬件和软件的结合、软件或者执行中的软件。例如,部分可以但不限于是处理器上运行的进程、处理器、硬盘驱动器、(光和/或磁存储介质的)多存储驱动器、对象、过程、过程的线程、程序和/或计算机。通过示例,服务器上的应用程序和服务器都可以是模块。一个或多个部分可以存在于进程和/或过程的线程中,而且可以将模块或部分布置于一个计算机上和/或分布在两个或者多个计算机之间。
如在此处的使用,术语“台式”、“PC”、“本地计算机”和类似术语表示根据本发明的系统(和方法)运行于其上的计算机。在图示的实施例中,这些是个人计算机,例如便携式计算机和台式计算机;但是在其它实施例中,可以是其它类型的计算设备(例如,工作站、主机、个人数字助理或者PDA、音乐或者MP3播放器以及类似设备)。
由此,对新发明的几个实施例进行了说明和描述。从前面的描述可以明显地看出,此处所举例子的具体细节不会限制本发明的某些方面,因此可以预计,对于本领域技术人员来说存在其它改进和应用或者其等同替换。在前面说明书中使用的词“具有”、“包括”和相似的词,其含义为“可选的”或者“可以包括”而不是“必需的”。然而,在考虑了说明书和附图后,目前结构的改变、改进、变化和其它使用以及应用对本领域技术人员来说是清楚的。所有这些改变、改进、变化和其它使用以及应用,在不背离本发明的原则和精神的前提下,都仅由下述权利要求所限定的本发明所覆盖。
此处,在对本发明的说明书中使用的术语,仅为了描述具体实施例而不是对本发明的限制。如同在本发明实施例的描述和附加权利要求中的使用,规定单数形式“a”、“an”和“the”同时也包括复数形式,除非文中内容有其它的明确表示。
除非有其它定义,此处使用的全部技术和科学术语所具有的含义,与本发明所属领域的普通技术人员通常的理解相同。此处提及的全部出版物、专利申请文件、专利和其它参考资料以引用的方式完整地并入。
可以进一步理解,在本说明书中使用的名词“包括”,其说明了状态特征、整体、步骤、操作、元件和/或部分的存在,但是不排除存在或者附加一个或多个其它状态特征、整体、步骤、操作、元件、部分和/或其组合。可以理解,除在附图中描述的倾向以外,相关名词也包括对所述设备不同的倾向。
而且,可以理解,虽然术语“第一”和“第二”在此处用于描述不同的特征、元件、范围、层和/或区域,但是这些名词不应限制所述特征、元件、范围、层和/或区域。这些名词仅仅用于对一个特征、元件、范围、层或区域和另一个特征、元件、范围、层或区域进行区分。因此,下面讨论的第一特征、元件、范围、层或区域可以称为第二特征、元件、范围、层或区域,而不会背离本发明的教义,并且相似地,第二特征、元件、范围、层或区域可以称为第一特征、元件、范围、层或区域。
同时可以理解,当一个元件与另一元件被称为“相连”或“连接”时,其可以直接与另一元件相连或连接,或者存在中间元件。相反,当一个元件与另一元件被称为“直接相连”或“直接连接”时,则不存在中间元件。此外,如此处使用的词“多个”表示至少两个元件。另外,同样的数字始终表示同样的元件。
因此,对新发明的几个实施例进行了说明和描述。从前面的描述可以明显地看出,此处所举例子的具体细节不会限制本发明的某些方面,因此可以预计,对于本领域技术人员来说存在其它改进和应用或者其等同替换。在前面说明书中使用的词“具有”、“包括”和相似的词,其含义为“可选的”或者“可以包括”而不是“必需的”。然而,在考虑了说明书和附图后,目前结构的改变、改进、变化和其它使用以及应用对本领域技术人员来说是清楚的。所有这些改变、改进、变化和其它使用以及应用,在不背离本发明的原则和精神的前提下,都被仅由下述权利要求所限定的本发明所覆盖。本公开文件的保护范围不限于此处所示的实施例,但是其符合与权利要求一致的全部保护范围,其中,除非特别地说明,单数元件并不表示“一个和仅一个”而是“一个或多个”。对于在整个公开文件中所描述的不同实施例,作为本领域普通技术人员已知和以后所知的,其元件的全部结构和功能的等同替换以引用的方式明确地并入此处,并且规定所述等同替换被权利要求所包含。而且,无论是否在权利要求中对公开内容进行了明确地陈述,不会规定将此处公开的内容用于公众。不会根据35U.S.C.112节第六段的条款来解释权利要求项,除非用短语“用于...的装置”对所述权利要求项进行明确陈述,或者在方法权利要求的情况下用短语“用于...的步骤”对所述权利要求项进行陈述。

Claims (26)

1.一种搜索中文字符的方法,包括:
确认是否对通过用户终端输入的搜索词的独立字符进行搜索;和
在搜索独立字符的步骤中,根据所述搜索词的发音向所述用户终端提供不同的检索结果。
2.根据权利要求1所述的方法,其中所述搜索独立字符的步骤包括下列步骤中的任意一个:
搜索基于拼音罗马拼写或韦德-盖尔斯罗马拼写的独立拼音字符;
搜索单个韩语音节;和
搜索单个中文字符。
3.根据权利要求2所述的方法,其中,所述确认是否对通过用户终端输入的搜索词的独立字符进行搜索的步骤为:在分析搜索词之后提取关键词时,确认是否对所述搜索词的独立字符进行搜索,所述关键词包括所述独立拼音字符、所述单个韩语音节和所述单个中文字符中的任意一个。
4.根据权利要求1所述的方法,其中,向所述用户终端提供不同检索结果的步骤包括:
当搜索词由拼音关键词和数字关键词的组合组成时,将所述数字关键词识别为所述拼音关键词的声调标记;
生成所述拼音关键词关于所述声调标记的检索结果页;和
向所述用户终端传送所述拼音关键词的检索结果页。
5.根据权利要求4所述的方法,其中,所述声调标记包括在中文中使用的四个声调:第一声调、第二声调、第三声调和第四声调,并且所述当搜索词包括拼音关键词和数字关键词时将所述数字关键词识别为所述拼音关键词的声调标记的步骤为:当所述数字关键词包括数字1到4中任意一个时,分别将数字1到4识别为第一声调、第二声调、第三声调和第四声调。
6.根据权利要求4所述的方法,其中,所述拼音关键词包括基于拼音罗马拼写或韦德-盖尔斯罗马拼写的独立拼音字符。
7.根据权利要求1所述的方法,其中,向所述用户终端提供不同检索结果的步骤包括:
当所述搜索词是拼音关键词时,生成所述拼音关键词的检索结果页;
生成每个声调标记的结果页,作为针对每个声调标记对所述拼音关键词进行搜索的结果;
在所述拼音关键词的检索结果页上,建立连接到所述每个声调标记的结果页的链接;
向所述用户终端传送其中已建立所述链接的拼音关键词的检索结果页。
8.根据权利要求7所述的方法,其中所述声调标记包括四个声调:第一声调、第二声调、第三声调和第四声调,并且向所述用户终端提供不同检索结果的步骤进一步包括:在每个结果页上针对四个声调建立所述链接。
9.根据权利要求1所述的方法,其中,向所述用户终端提供不同检索结果的步骤为:当所述搜索词是包括单个韩语音节的关键词时,向所述用户终端提供利用所述单个韩语音节的发音进行检索的检索结果页。
10.根据权利要求1所述的方法,其中,向所述用户终端提供不同检索结果的步骤为:当所述搜索词是包括单个中文字符的关键词时,生成由与简体字(简体中文)和繁体字(传统中文)的关键词相对应的检索结果组成的检索结果页,并且向所述用户终端提供所生成的检索结果页。
11.根据权利要求1所述的方法,进一步包括:
通过使用中文字典和本国语字典生成关于所述搜索词的检索结果页,并且向所述用户终端提供所生成的检索结果页。
12.一种在声调语言中搜索字符的方法,包括:
确认是否对通过用户终端输入的搜索词的独立字符进行搜索;
作为对所述独立字符进行搜索的结果,确认所述搜索词是否包括拼音关键词;和
根据所述拼音关键词或者所述拼音关键词的声调标记生成至少一个检索结果页,并且向所述用户终端提供所生成的至少一个检索结果页。
13.根据权利要求12所述的方法,其中所述拼音关键词包括声调语言的独立字符,所述声调语言的独立字符按照声调标记具有不同的含义,并且所述声调标记包括所述声调语言使用的多个声调标记。
14.根据权利要求13所述的方法,其中,根据所述拼音关键词或者所述拼音关键词的声调标记生成至少一个检索结果页的步骤、以及向所述用户终端提供所生成的至少一个检索结果页的步骤,包括:
当所述搜索词为所述拼音关键词和数字关键词的组合时,将所述数字关键词识别为所述拼音关键词的声调标记;
生成所述拼音关键词关于所述声调标记的检索结果页;和
向所述用户终端传送所述拼音关键词的检索结果页。
15.根据权利要求14所述的方法,其中,当所述搜索词为所述拼音关键词和数字关键词的组合时将所述数字关键词识别为所述拼音关键词的声调标记的步骤为:将与包含在所述数字关键词中的数字相对应的声调标记识别为所述拼音关键词的声调标记。
16.根据权利要求13所述的方法,其中,根据所述拼音关键词或者所述拼音关键词的声调标记生成至少一个检索结果页的步骤、以及向所述用户终端提供所生成的至少一个检索结果页的步骤,包括:
当所述搜索词是拼音关键词时,生成所述拼音关键词的检索结果页;
生成每个声调标记的结果页,作为针对每个声调标记对所述拼音关键词进行搜索的结果;
在所述拼音关键词的检索结果页上,建立连接到所述每个声调标记的结果页的链接;
向所述用户终端传送其中已建立所述链接的所述拼音关键词的检索结果页。
17.一种计算机可读的存储介质,其存储用于执行权利要求1所述方法的程序。
18.一种计算机可读的存储介质,其存储用于执行权利要求12所述方法的程序。
19.一种用于搜索中文字符的系统,包括:
独立字符搜索确认部分,其被配置为确认是否对通过用户终端输入的搜索词的独立字符进行搜索;和
检索结果提供部分,其被配置为在搜索独立字符的步骤中根据所述搜索词的表达方式向所述用户终端提供不同的检索结果。
20.根据权利要求19所述的系统,其中,所述搜索独立字符的步骤包括下列步骤中的任意一个:
搜索基于拼音罗马拼写或韦德-盖尔斯罗马拼写的独立拼音字符;
搜索单个韩语音节;和
搜索单个中文字符,
其中,所述独立字符搜索确认部分在分析搜索词之后提取关键词时确认是否对所述搜索词的独立字符进行搜索,所述关键词包括所述拼音字符的独立字符、所述单个韩语音节和所述单个中文字符中的任意一个。
21.根据权利要求19所述的系统,其中,所述检索结果提供部分包括:
声调标记识别部分,其被配置为在所述搜索词由拼音关键词和数字关键词的组合组成时,将所述数字关键词识别为所述拼音关键词的声调标记;
检索结果页生成部分,其被配置为生成所述拼音关键词关于所述声调标记的检索结果页;和
检索结果页传送部分,其被配置为向所述用户终端传送所述检索结果页。
22.根据权利要求19所述的系统,其中,所述检索结果提供部分包括:
检索结果页生成部分,其被配置为在所述搜索词是拼音关键词时,生成关于所述拼音关键词的检索结果页;
拼音结果页生成部分,其被配置为生成针对每个拼音的结果页,其中通过针对每个拼音字符搜索拼音关键词生成所述针对每个拼音字符的结果页;
链接建立部分,其被配置为在所述检索结果页上建立连接到针对每个声调标记的每个结果页的链接;和
检索结果页传送部分,其被配置为向所述用户终端传送其中已建立所述链接的检索结果页。
23.一种用于在声调语言中搜索字符的系统,包括:
独立字符搜索确认部分,其被配置为确认是否对通过用户终端输入的搜索词的独立字符进行搜索;
拼音关键词确认部分,其被配置为作为对所述独立字符进行搜索的结果,确认所述搜索词是否包括拼音关键词;和
检索结果页处理部分,其被配置为根据所述拼音关键词或者所述拼音关键词的声调标记生成至少一个检索结果页,并且向所述用户终端提供所生成的至少一个检索结果页。
24.根据权利要求23所述的系统,其中所述拼音关键词包括声调语言的独立字符,所述声调语言的独立字符按照声调标记具有不同的含义,并且所述声调标记包括所述声调语言使用的多个声调标记。
25.根据权利要求23所述的系统,其中所述检索结果页处理部分包括:
声调标记识别部分,其被配置为在所述搜索词为拼音关键词和数字关键词的组合时,将所述数字关键词识别为所述拼音关键词的声调标记;
检索结果页生成部分,其被配置为生成所述拼音关键词关于所述声调标记的检索结果页;和
检索结果页传送部分,其被配置为向所述用户终端传送所述拼音关键词的检索结果页。
26.根据权利要求23所述的系统,其中所述检索结果页处理部分包括:
检索结果页生成部分,其被配置为在所述搜索词是拼音关键词时,生成所述拼音关键词的检索结果页;
声调标记结果页生成部分,其被配置为生成每个声调标记的结果页,所述每个声调标记的结果页与所述拼音关键词的检索结果页相对应;
链接建立部分,其被配置为在所述检索结果页上建立连接到所述每个声调标记的每个结果页的链接;和
检索结果页传送部分,其被配置为向所述用户终端传送其中已建立所述链接的检索结果页。
CNA2007101433819A 2006-08-25 2007-08-22 利用声调标记搜索中文字符的方法和实现该方法的系统 Pending CN101131703A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020060081281A KR100837750B1 (ko) 2006-08-25 2006-08-25 성조를 이용하여 중국어를 검색하는 방법 및 상기 방법을수행하는 시스템
KR1020060081281 2006-08-25

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201110115493XA Division CN102176209A (zh) 2006-08-25 2007-08-22 利用声调标记搜索中文字符的方法和实现该方法的系统

Publications (1)

Publication Number Publication Date
CN101131703A true CN101131703A (zh) 2008-02-27

Family

ID=39128970

Family Applications (2)

Application Number Title Priority Date Filing Date
CNA2007101433819A Pending CN101131703A (zh) 2006-08-25 2007-08-22 利用声调标记搜索中文字符的方法和实现该方法的系统
CN201110115493XA Pending CN102176209A (zh) 2006-08-25 2007-08-22 利用声调标记搜索中文字符的方法和实现该方法的系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201110115493XA Pending CN102176209A (zh) 2006-08-25 2007-08-22 利用声调标记搜索中文字符的方法和实现该方法的系统

Country Status (4)

Country Link
US (1) US8271265B2 (zh)
JP (2) JP2008052742A (zh)
KR (1) KR100837750B1 (zh)
CN (2) CN101131703A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107621892A (zh) * 2017-10-18 2018-01-23 北京百度网讯科技有限公司 用于获取信息的方法及装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286094A (zh) 2007-04-10 2008-10-15 谷歌股份有限公司 多模式输入法编辑器
KR100978581B1 (ko) * 2008-05-08 2010-08-27 엔에이치엔(주) 웹 페이지 열람 중에 편리하게 사전 서비스를 제공하기위한 방법 및 시스템
JP5741542B2 (ja) * 2012-09-20 2015-07-01 カシオ計算機株式会社 情報表示制御装置、情報表示制御方法、およびプログラム
CN104182402A (zh) * 2013-05-22 2014-12-03 腾讯科技(深圳)有限公司 浏览器界面地址栏输入控制方法及系统
CN103578467B (zh) * 2013-10-18 2017-01-18 威盛电子股份有限公司 声学模型的建立方法、语音辨识方法及其电子装置
CN104537079B (zh) * 2014-12-31 2017-11-28 徐祖华 易通汉字字词新查法
JP6036911B2 (ja) * 2015-04-27 2016-11-30 カシオ計算機株式会社 情報表示制御装置、情報表示制御方法、およびプログラム
KR101888243B1 (ko) * 2016-06-10 2018-08-13 주식회사 케이이십일 중국한자의 성조 표기 방법 및 성조 표기 시스템

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63118862A (ja) 1986-11-06 1988-05-23 Nec Corp 中文入力装置における文字選択方式
JPH05216887A (ja) * 1991-10-14 1993-08-27 Omron Corp 中国語の発音表記/漢字変換装置および方法
JPH07200600A (ja) 1993-12-28 1995-08-04 Nec Corp 電子中日辞典作成検索装置
US6014615A (en) * 1994-08-16 2000-01-11 International Business Machines Corporaiton System and method for processing morphological and syntactical analyses of inputted Chinese language phrases
JPH08185396A (ja) * 1994-12-29 1996-07-16 Nec Corp 中国語漢字検索方式
US5787231A (en) * 1995-02-02 1998-07-28 International Business Machines Corporation Method and system for improving pronunciation in a voice control system
US5893133A (en) 1995-08-16 1999-04-06 International Business Machines Corporation Keyboard for a system and method for processing Chinese language text
US5864805A (en) * 1996-12-20 1999-01-26 International Business Machines Corporation Method and apparatus for error correction in a continuous dictation system
US5832478A (en) * 1997-03-13 1998-11-03 The United States Of America As Represented By The National Security Agency Method of searching an on-line dictionary using syllables and syllable count
US6401060B1 (en) * 1998-06-25 2002-06-04 Microsoft Corporation Method for typographical detection and replacement in Japanese text
JP2001014304A (ja) 1999-06-30 2001-01-19 Toshiba Corp 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体
US7403888B1 (en) * 1999-11-05 2008-07-22 Microsoft Corporation Language input user interface
US20020152258A1 (en) * 2000-06-28 2002-10-17 Hongyi Zhou Method and system of intelligent information processing in a network
JP3871644B2 (ja) 2000-06-28 2007-01-24 ヤフー! インコーポレイテッド ネットワークにおけるインテリジェントな情報処理方法およびシステム
US20020180806A1 (en) * 2001-06-04 2002-12-05 Inventec Appliances Corp. System and method for upgrading input and inquiry efficiency
US7061403B2 (en) * 2002-07-03 2006-06-13 Research In Motion Limited Apparatus and method for input of ideographic Korean syllables from reduced keyboard
US7359850B2 (en) * 2003-09-26 2008-04-15 Chai David T Spelling and encoding method for ideographic symbols
JP4363167B2 (ja) * 2003-11-26 2009-11-11 カシオ計算機株式会社 電子辞書装置及びプログラム
US7478033B2 (en) * 2004-03-16 2009-01-13 Google Inc. Systems and methods for translating Chinese pinyin to Chinese characters
KR20050092999A (ko) * 2004-03-17 2005-09-23 샤프전자(주) 전자사전에서의 한자검색방법
JP4498023B2 (ja) * 2004-06-15 2010-07-07 キヤノン株式会社 X線ct装置
US20060048055A1 (en) * 2004-08-25 2006-03-02 Jun Wu Fault-tolerant romanized input method for non-roman characters
JP4939739B2 (ja) * 2004-10-05 2012-05-30 パナソニック株式会社 携帯情報端末及び表示制御プログラム
US20060106769A1 (en) * 2004-11-12 2006-05-18 Gibbs Kevin A Method and system for autocompletion for languages having ideographs and phonetic characters
US7516062B2 (en) * 2005-04-19 2009-04-07 International Business Machines Corporation Language converter with enhanced search capability
JP4058057B2 (ja) * 2005-04-26 2008-03-05 株式会社東芝 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム
US8438142B2 (en) * 2005-05-04 2013-05-07 Google Inc. Suggesting and refining user input based on original user input
US7574348B2 (en) * 2005-07-08 2009-08-11 Microsoft Corporation Processing collocation mistakes in documents
JP4314221B2 (ja) * 2005-07-28 2009-08-12 株式会社東芝 構造化文書記憶装置、構造化文書検索装置、構造化文書システム、方法およびプログラム
US20070106499A1 (en) * 2005-08-09 2007-05-10 Kathleen Dahlgren Natural language search system
US7590626B2 (en) * 2006-10-30 2009-09-15 Microsoft Corporation Distributional similarity-based models for query correction
US8024319B2 (en) * 2007-01-25 2011-09-20 Microsoft Corporation Finite-state model for processing web queries
KR101300839B1 (ko) * 2007-12-18 2013-09-10 삼성전자주식회사 음성 검색어 확장 방법 및 시스템

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107621892A (zh) * 2017-10-18 2018-01-23 北京百度网讯科技有限公司 用于获取信息的方法及装置

Also Published As

Publication number Publication date
JP5688941B2 (ja) 2015-03-25
US8271265B2 (en) 2012-09-18
JP2011003218A (ja) 2011-01-06
KR100837750B1 (ko) 2008-06-13
JP2008052742A (ja) 2008-03-06
KR20080018712A (ko) 2008-02-28
CN102176209A (zh) 2011-09-07
US20080052064A1 (en) 2008-02-28

Similar Documents

Publication Publication Date Title
CN101131703A (zh) 利用声调标记搜索中文字符的方法和实现该方法的系统
US8731901B2 (en) Context aware back-transliteration and translation of names and common phrases using web resources
CN102144228B (zh) 根据输入字符序列的资源定位符建议
CN100452023C (zh) 提供与原始电子文档一起传送的临时词典的系统和方法
CN101840406B (zh) 地名搜索装置和系统
Goldenberg et al. Exploring language with Logo
CN101743544A (zh) 跨语言信息检索
CN101622616A (zh) 共享语言模型
Sezer TS corpus project: An online Turkish dictionary and TS DIY corpus
KR20080085165A (ko) 입력 데이터 확장 시스템 및 방법, 및 와일드카드 삽입 및입력 데이터 확장 시스템
JP2010134922A (ja) 類似語決定方法およびシステム
CN101470701A (zh) 支持基于有限状态机的语义规则的文本分析器及其方法
Scherrer et al. New developments in tagging pre-modern orthodox Slavic texts
CN1975716A (zh) 中英翻译方法和系统
JP5851130B2 (ja) 日本語のための音声キー
Kumolalo et al. Development of a syllabicator for Yorùbá language
UzZaman et al. A comprehensive Roman (English)-to-Bangla transliteration scheme
Gutkin et al. Extensions to Brahmic script processing within the Nisaba library: new scripts, languages and utilities
Vikas Language Technology Development in India
TWI345158B (en) Computer-readable storage media, computer programming product, electronic device, automatic searching method of electric note and system thereof
Vijayanand et al. Named entity recognition and transliteration for Telugu language
Sastre XML-Based Representation Formats of Local Grammars for the NL
Seretan Bridging Collocational and Syntactic Analysis
Kiraz Towards a Syriac Semantic Web from the Perspective of 2020
Mogla et al. Transliteration from English to Telugu Using Phrase-Based Machine Translation for General Domain English Words

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20080227