CN101013342A - 基于中文网络词语库的中文在线输入法 - Google Patents
基于中文网络词语库的中文在线输入法 Download PDFInfo
- Publication number
- CN101013342A CN101013342A CN 200710017265 CN200710017265A CN101013342A CN 101013342 A CN101013342 A CN 101013342A CN 200710017265 CN200710017265 CN 200710017265 CN 200710017265 A CN200710017265 A CN 200710017265A CN 101013342 A CN101013342 A CN 101013342A
- Authority
- CN
- China
- Prior art keywords
- chinese
- word
- online
- input
- input method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明是用于电脑、手机等各种信息工具的中文在线输入方法,在互联网上的服务器中为用户提供一个包括10亿个左右词语的中文网络词语库,在中文在线输入法的中文输入状态,输入词语的编码字符串后,就会对中文网络词语库进行在线检索,并返回相应的搜索结果,提示相应的候选词语列表,再单击某一数字键就可以实现所选择词语的输入。
Description
本发明是用于电脑、手机等各种信息工具的中文在线输入方法。
目前,绝大多数用户在电脑上输入中文时,使用的都是传统汉字输入法,基于电脑硬盘内存中的字词库,以单字和词组输入为主。在传统汉字输入法的中文输入状态,输入一个字词的编码字符串后,就会对用户电脑硬盘内存中的中文本地字词库进行检索,返回并提示相应的中文字词候选列表,由用户单击数字键来选择输入相应的候选字词。
传统汉字输入法的字词库中的字词数量只有10万个左右,其中只包括了常用词组,对于非常用的字词,短语,句子,段落是不能直接检索输入的,只能依次输入相应的单字或词组组合而成,这是由传统汉字输入法的设计思路所决定的。
随着互联网的普及,很多原来由电脑本地进行的应用可以借助互联网来进行优化和完善,这对于文字输入也是完全适用的。通过在互联网上的服务器上提供一个超过10亿个词语的“中文网络词语库”,并将传统汉字输入法软件改进为一个可以进行在线检索中文网络词语库的客户端软件,即:“中文在线输入法软件”,然后就可以通过中文在线输入法来对中文网络词语库进行在线检索,实现中文在线输入。
本发明就是针对传统汉字输入法设计的不合理,在互联网上的服务器中为用户提供一个包括10亿个左右词语的中文网络词语库,并通过中文在线输入法软件对中文网络词语库进行在线检索,实现词语的在线检索和选择输入。
本发明包括9个方面的改进,以下为本发明具体内容:
一,在互联网上为用户提供一个用于中文输入的“中文网络词语库”。
传统汉字输入法都是在用户电脑硬盘内存中为用户提供一个中文本地字词库。在汉字输入状态,输入一个字词编码字符串后,就会对用户电脑硬盘内存中的中文本地字词库进行检索,返回并提示相应的中文字词候选列表,由用户选择输入相应字词。
和传统的汉字输入法不同,中文在线输入法除了在电脑硬盘内存中为用户提供一个中文本地字词库之外,还会在互联网上的服务器中为用户提供一个可以进行“在线检索”的中文网络词语库。
不同中文在线输入服务商提供的中文网络词语库是不同的。例如:微软拼音和搜狗拼音提供的中文网络词语库肯定是不同的。
在互联网上将会有多个中文在线输入服务商为广大中文电脑用户提供的多个中文网络词语库,电脑用户可以根据需要,通过在中文在线输入法软件中进行自定义设置,选择其中一个或多个中文网络词语库进行中文词语的在线检索输入。
二,中文网络词语库中的词语数据除了词组之外,还包括短语,句子,段落,文章。
传统汉字输入法的中文本地字词库中,除了一万个左右的单字外,就是10万个左右的词组,其中的双字词数量最多,其次是三字词,四字词,超过四个汉字的多字词数量是很少的。
中文在线输入法的中文网络词语库中,其词语类型主要包括:词组、短语、句子、段落、文章。词组、短语、句子、段落、文章虽然都是由多个汉字组成的,但是它们之间有着明显的区别。一般情况下,词组比短语的汉字个数少;短语比句子的汉字个数少;句子比段落的汉字个数少;段落比文章的汉字个数少。句子,文章包括的汉字个数可能会超过100个、甚至成千上万个,这对于传统汉字输入法来说是不可想象的。
传统汉字输入法是以单字和词组的输入模式为主的,是“字词输入法”;中文在线输入法的输入模式是以词组、短语、句子、段落、文章为主的,是“词语输入法”。从“字词输入法”到“词语输入法”,是中文输入技术的一次重要变革。
三,中文网络词语库中的词语数量可以是10亿个左右,并且可以无限扩展。
传统汉字输入法都是在用户电脑硬盘内存中为用户提供一个中文本地字词库,用于对编码字符串的本地检索。受制于用户电脑的硬盘容量,中文本地字词库的数量肯定是有限的,大多数的汉字输入法,所提供的中文本地字词库的字词数量都是10万个左右,只有少数的传统汉字输入法,所提供的中文本地字词库的字词数量达到了100万左右。
中文网络词语库因为存储在互联网上的服务器中,因此中文网络词语库的词语数量是不受限制的,根据需要可以进行无限扩展,可以是1亿,10亿,100亿,甚至超过1000亿。大多数的中文网络词语库,其词语数量都会超过10亿个。
从10万个字词的中文本地字词库到10亿个词语的中文网络词语库,数量增加了1万倍,这就为中文输入技术的变革提供了坚实的基础。
四,互联网上的中文网络词语库设计可以参考电脑硬盘内存中的中文本地字词库设计。
电脑硬盘内存中的中文本地字词库设计技术已经非常成熟,一般都可以在1万个字词到100万个字词之间进行扩展或缩减,而不会对用户的操作体验产生大的影响。
中文网络词语库可以看作是在不改变中文本地字词库结构设计的基础上,将词语数量由10万个左右扩展到10亿个左右。但因为用户电脑的硬盘内存中无法存储包括10亿个左右词语的中文本地词语库,而将其放置到互联网上的专用服务器中。
但是,对中文本地字词库的本地检索和对中文网络词语库的在线检索,肯定有很多的不同,所以,必须根据中文网络词语库在线检索的特性,对中文网络词语库的数据结果和检索方法进行针对性的改进设计,使其在返回的候选词语列表更加准确、合理、完善。
五,在传统汉字输入法的基础上,增加中文在线输入功能,为电脑用户提供集成传统汉字输入功能和中文在线输入功能的中文在线输入法软件。
目前,传统汉字输入法的技术已经非常成熟,几乎所有的中文电脑用户都在使用基于中文本地字词库的传统汉字输入法,所以,提供中文在线输入功能的中文在线输入法软件设计,必须考虑对传统汉字输入法的兼容性。
中文在线输入法的优势在于对由多个单字组成的中文词语的输入,而传统汉字输入法对单字和常用词组的输入则要明显要优于中文在线输入法,所以,只有集成了传统汉字输入功能和中文在线输入功能的中文在线输入法,才能为用户提供完美的中文输入体验。
六,在中文在线输入法的中文输入状态,输入由多于两个汉字组成的词语的编码字符串后,不仅会对电脑硬盘内存中的中文本地字词库进行本地检索,还会对互联网上的中文网络词语库进行在线检索,并返回相应的检索结果,提示相应的候选词语列表,单击某一数字键后,就会输入所选择的候选词语。
在中文在线输入法的中文输入状态,输入单字或双字词的编码字符串后,只会对电脑硬盘内存中的中文本地字词库进行本地检索,而不会对互联网上的中文网络词语库进行在线检索。
例如:通过紫光在线输入法输入“ke”或“keji”后,都只会对电脑硬盘内存中的中文本地字词库进行本地检索,并提示相应的候选字词列表,通过数字键选择某一个候选字词后,就实现相应候选字词的输入。
在中文在线输入法的中文输入状态,输入由多于两个汉字组成的词语的编码字符串后,不仅会对电脑硬盘内存中的中文本地字词库进行本地检索,还会对互联网上的中文网络词语库进行在线检索。
例如:通过紫光在线输入法输入“xujinglei”后,不仅会对电脑硬盘内存中的中文本地字词库进行本地检索,还会对互联网上的中文网络词语库进行在线检索,并提示相应的候选字词列表,通过到单击数字键“1”选择候选字词“徐静蕾”后,就实现“徐静蕾”的输入。
传统汉字输入法是以单字和词组输入为主的,多个候选字词一般都是在一个提示行中显示的。而中文在线输入法的部分候选词语的汉字个数可能会超过100个,甚至是成千上万个,一个提示行显示肯定是不够的,所以,中文在线输入法的提示区域肯定会变得更大,并会根据提示内容的变化进行自适应调整。
七,在中文在线输入法的中文输入状态,输入包括“在线检索符”的编码字符串后,就只会对互联网上的中文网络词语库进行在线检索,并返回相应的检索结果,提示相应的候选词语列表。
“在线检索符”可以是电脑键盘上的任意符号键,例如:“;”、“/”、“、”等。
“在线检索符”可以是编码字符串的“前缀”,也可以是编码字符串的“后缀”,还可以位于编码字符串中间的任意位置。只要是包括“在线检索符”的编码字符串,就会只对互联网上的中文网络词语库进行在线检索,而不会对电脑硬盘内存中的中文本地字词库进行本地检索。
例如:通过微软在线输入法依次输入“xjl和在线检索符“;”后,就会对互联网上的中文网络词语库进行在线检索(而不会对电脑硬盘内存中的中文本地字词库进行本地检索),并提示相应的候选字词列表,通过数字键“1”选择候选字词“徐静蕾”后,就实现相应候选字词“徐静蕾”的输入。
再例如:通过微软在线输入法输入包括在线检索符的编码字符串“;xjl”或“x;jl”后,就会对互联网上的中文网络词语库进行在线检索(而不会对电脑硬盘内存中的中文本地字词库进行本地检索),并提示相应的候选字词列表,通过数字键“1”选择候选字词“徐静蕾”后,就实现相应候选字词“徐静蕾”的输入。
八,在文字聊天时,可以切换到中文在线输入法的对话输入状态,输入词语的编码字符串后,就会对互联网上的中文网络词语库的对话子词语库进行在线检索,并返回相应的检索结果,提示相应的候选词语列表。
目前,即时通讯已经成为一种最重要、最普及的网络应用,而即时通讯的一个核心应用就是文字聊天。显然,文字聊天时所输入的词语和文档编辑时所输入的词语是有极大不同的,所以,为了使文字聊天时的中文输入更加合理、高效,就必须为电脑用户提供专用的文字聊天输入模式,以区别于通用的文档编辑输入模式。
中文网络词语库可以包括数量众多的子词语库,其中之一就是“对话子词语库”,在中文在线输入法的对话输入状态,输入编码字符串后就会对“对话子词语库”进行在线检索,返回的检索结果大都是一些对话过程中经常用到的“经典短语、经典句子、经典段落”。
在通过即时通讯软件进行文字聊天时,可以自动或手动切换到中文在线输入法的对话输入状态,输入词语的编码字符串后,就会对互联网上中文网络词语库中的对话子词语库进行在线检索,并返回相应的检索结果,提示相应的即候选词语列表,通过数字键对候选词语进行选择后,就会输入所选择的相应词语。
将即时通讯软件(例如:QQ,MSN)和中文在线输入法软件集成在一起,就会使用户通过即时通讯软件进行文字聊天时,自动切换到中文在线输入法的对话输入状态,然后就可以自然、高效的输入文字聊天是经常用到的经典“短语、句子、段落”,这样,可以明显的提升用户的文字聊天体验。
九,中文在线输入法不仅可以进行文字的输入,还可以在文字的输入过程中,对相关的资料进行即时在线搜索。
在文字的输入过程中,可能会频繁的对相关资料进行在线搜索。例如:在输入编辑一个人物的新闻时,可能对在线搜索这个人物的相关资料;在输入编辑一个研究课题的论文时,可能需要对相关的资料进行在线搜索。而目前在文字输入过程中对资料的在线搜索,都是通过通用的搜索引擎(例如:百度、google)来进行的,而不是中文在线输入法。
通过中文在线输入法,就可以将“词语的在线输入”和“资料的在线搜索”完美的集成在一起。例如:在输入编辑关于康德的论文时,输入“康德出生于”对应的拼音编码字符串“kangdechushengyu”后,就会提示10个左右的和“康德出生于”相关的候选“段落”,这时既可以通过候选段落了解“康德”的生平资料,也可以直接通过相应数字键,输入其中的某一个候选段落。
中文在线输入法也可以看作是一种针对中文输入而设计的专用在线搜索服务。
从最初的文字手写方式,到目前的键盘输入方式,都是对所思所想的机械对应记录,并没有对人的所思所想进行帮助,补充,完善。而中文在线输入法,则会在记录所思所想的过程中,对所思所想进行帮助,补充,完善。
“语言即思维,语言即存在”,语言有四种主要的应用方式,即“听说读写”。中文在线输入法,是对人类“写”方式和“说”方式的一次重要变革。
中文在线输入法的设计不仅可以应用于中文,通过针对性改进,还可以应用于日文,韩文等非字母文字,以及英文、法文、德文等字母文字。本发明人即将提交的下一个专利申请文件,就是对英文的在线输入法设计。
一个完美的中文在线输入法,除了本发明所述的设计框架外,还需要很多的设计细节相配合。在本发明人提交专利申请文件后,将会在
http://www.neweasyppc.com网站中陆续公布中文在线输入法的更多设计细节,更多具体应用。本发明不仅适用于电脑,还适用于手机等其他的信息设备。
Claims (10)
1,本发明是一种中文在线输入方法,其主要特征在于在互联网上的服务器中为用户提供一个包括10亿个左右词语的中文网络词语库,在中文在线输入法的中文输入状态,输入词语的编码字符串后,就会对中文网络词语库进行在线检索,并返回相应的搜索结果,提示相应的候选词语列表,再单击某一数字键,就可以实现所选择词语的输入。
2,如权利要求1所述的中文在线输入法,其主要特征在于在互联网上为用户提供一个用于中文输入的“中文网络词语库”;
不同中文在线输入服务商提供的中文网络词语库是不同的;
在互联网上将会有多个中文在线输入服务商为广大中文电脑用户提供的多个中文网络词语库,电脑用户可以根据需要,通过在中文在线输入法软件中进行自定义设置,选择其中一个或多个中文网络词语库进行中文词语的在线检索输入。
3,如权利要求1所述的中文在线输入法,其主要特征在于中文网络词语库中的词语数据除了词组之外,还包括短语,句子,段落,文章。
4,如权利要求1所述的中文在线输入法,其主要特征在于中文网络词语库中的词语数量可以是10亿个左右,并且可以无限扩展。
5,如权利要求1所述的中文在线输入法,其主要特征在于互联网上的中文网络词语库设计可以参考电脑硬盘内存中的中文本地字词库设计;
必须根据中文网络词语库在线检索的特性,对中文网络词语库的数据结果和检索方法进行针对性的改进设计,使其在返回的候选词语列表更加准确、合理、完善。
6,如权利要求1所述的中文在线输入法,其主要特征在于在传统汉字输入法的基础上,增加中文在线输入功能,为电脑用户提供集成传统汉字输入功能和中文在线输入功能的中文在线输入法软件。
7,如权利要求1所述的中文在线输入法,其主要特征在于在中文在线输入法的中文输入状态,输入由多于两个汉字组成的词语的编码字符串后,不仅会对电脑硬盘内存中的中文本地字词库进行本地检索,还会对互联网上的中文网络词语库进行在线检索,并返回相应的检索结果,提示相应的候选词语列表,单击某一数字键后,就会输入所选择的候选词语;
在中文在线输入法的中文输入状态,输入单字或双字词的编码字符串后,只会对电脑硬盘内存中的中文本地字词库进行本地检索,而不会对互联网上的中文网络词语库进行在线检索。
8,如权利要求1所述的中文在线输入法,其主要特征在于在中文在线输入法的中文输入状态,输入包括“在线检索符”的编码字符串后,就只会对互联网上的中文网络词语库进行在线检索,并返回相应的检索结果,提示相应的候选词语列表;
“在线检索符”可以是电脑键盘上的任意符号键;
“在线检索符”可以是编码字符串的“前缀”,也可以是编码字符串的“后缀”,还可以位于编码字符串中间的任意位置;只要是包括“在线检索符”的编码字符串,就会只对互联网上的中文网络词语库进行在线检索,而不会对电脑硬盘内存中的中文本地字词库进行本地检索。
9,如权利要求1所述的中文在线输入法,其主要特征在于在文字聊天时,可以切换到中文在线输入法的对话输入状态,输入词语的编码字符串后,就会对互联网上的中文网络词语库的对话子词语库进行在线检索,并返回相应的检索结果,提示相应的候选词语列表;
中文网络词语库可以包括数量众多的子词语库,其中之一就是“对话子词语库”,在中文在线输入法的对话输入状态,输入编码字符串后就会对“对话子词语库”进行在线检索,返回的检索结果大都是一些对话过程中经常用到的“经典短语、经典句子、经典段落”;
在通过即时通讯软件进行文字聊天时,可以自动或手动切换到中文在线输入法的对话输入状态,输入词语的编码字符串后,就会对互联网上中文网络词语库中的对话子词语库进行在线检索,并返回相应的检索结果,提示相应的即候选词语列表,通过数字键对候选词语进行选择后,就会输入所选择的相应词语;
将即时通讯软件和中文在线输入法软件集成在一起,就会使用户通过即时通讯软件进行文字聊天时,自动切换到中文在线输入法的对话输入状态,然后就可以自然、高效的输入文字聊天是经常用到的经典“短语、句子、段落”。
10,如权利要求1所述的中文在线输入法,其主要特征在于中文在线输入法不仅可以进行文字的输入,还可以在文字的输入过程中,对相关的资料进行在线搜索;
通过中文在线输入法,就可以将“词语的在线输入”和“资料的在线搜索”集成在一起;中文在线输入法也可以看作是一种针对中文输入而设计的专用在线搜索服务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200710017265 CN101013342A (zh) | 2007-01-22 | 2007-01-22 | 基于中文网络词语库的中文在线输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200710017265 CN101013342A (zh) | 2007-01-22 | 2007-01-22 | 基于中文网络词语库的中文在线输入法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101013342A true CN101013342A (zh) | 2007-08-08 |
Family
ID=38700890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200710017265 Pending CN101013342A (zh) | 2007-01-22 | 2007-01-22 | 基于中文网络词语库的中文在线输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101013342A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008092400A1 (fr) * | 2007-01-25 | 2008-08-07 | Beijing Sogou Technology Development Co., Ltd. | Procédé simplifié de recherche d'informations, système correspondant et système de saisie de caractères |
CN102063194A (zh) * | 2010-04-16 | 2011-05-18 | 百度在线网络技术(北京)有限公司 | 用于供用户进行文字输入的方法、设备、服务器和系统 |
CN102063452A (zh) * | 2010-05-31 | 2011-05-18 | 百度在线网络技术(北京)有限公司 | 用于供用户进行文字输入的方法、设备、服务器和系统 |
CN102214011A (zh) * | 2010-04-09 | 2011-10-12 | 北京搜狗科技发展有限公司 | 一种发起输入法远程计算请求的方法及装置 |
WO2011127788A1 (zh) * | 2010-04-16 | 2011-10-20 | 百度在线网络技术(北京)有限公司 | 用于供用户进行文字输入的方法、设备、服务器及系统 |
CN102419643A (zh) * | 2011-10-26 | 2012-04-18 | 南京华设科技有限公司 | 基于云的远程文字录入方法及系统 |
CN102841686A (zh) * | 2011-06-22 | 2012-12-26 | 王圣军 | 中一汉字图形检索输入法 |
CN103019407A (zh) * | 2012-11-22 | 2013-04-03 | 百度国际科技(深圳)有限公司 | 输入法应用方法、自动问答处理方法及电子设备、服务器 |
US8738644B2 (en) | 2008-07-01 | 2014-05-27 | Htc Corporation | Single-tap input remote server access |
CN104424163A (zh) * | 2013-08-29 | 2015-03-18 | 北大方正集团有限公司 | 文字处理方法和系统 |
CN106125955A (zh) * | 2016-06-23 | 2016-11-16 | 百度在线网络技术(北京)有限公司 | 一种用于在输入法应用中提供热词的方法和装置 |
CN109144285A (zh) * | 2017-06-16 | 2019-01-04 | 北京搜狗科技发展有限公司 | 一种输入方法和装置 |
CN112000877A (zh) * | 2020-07-15 | 2020-11-27 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和介质 |
-
2007
- 2007-01-22 CN CN 200710017265 patent/CN101013342A/zh active Pending
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008092400A1 (fr) * | 2007-01-25 | 2008-08-07 | Beijing Sogou Technology Development Co., Ltd. | Procédé simplifié de recherche d'informations, système correspondant et système de saisie de caractères |
US8738644B2 (en) | 2008-07-01 | 2014-05-27 | Htc Corporation | Single-tap input remote server access |
CN102214011B (zh) * | 2010-04-09 | 2015-09-09 | 北京搜狗科技发展有限公司 | 一种发起输入法远程计算请求的方法及装置 |
CN102214011A (zh) * | 2010-04-09 | 2011-10-12 | 北京搜狗科技发展有限公司 | 一种发起输入法远程计算请求的方法及装置 |
WO2011127788A1 (zh) * | 2010-04-16 | 2011-10-20 | 百度在线网络技术(北京)有限公司 | 用于供用户进行文字输入的方法、设备、服务器及系统 |
CN102063194A (zh) * | 2010-04-16 | 2011-05-18 | 百度在线网络技术(北京)有限公司 | 用于供用户进行文字输入的方法、设备、服务器和系统 |
CN102063452A (zh) * | 2010-05-31 | 2011-05-18 | 百度在线网络技术(北京)有限公司 | 用于供用户进行文字输入的方法、设备、服务器和系统 |
CN102841686A (zh) * | 2011-06-22 | 2012-12-26 | 王圣军 | 中一汉字图形检索输入法 |
CN102419643A (zh) * | 2011-10-26 | 2012-04-18 | 南京华设科技有限公司 | 基于云的远程文字录入方法及系统 |
CN102419643B (zh) * | 2011-10-26 | 2014-07-23 | 南京华设科技股份有限公司 | 基于云的远程文字录入方法及系统 |
CN103019407A (zh) * | 2012-11-22 | 2013-04-03 | 百度国际科技(深圳)有限公司 | 输入法应用方法、自动问答处理方法及电子设备、服务器 |
CN104424163A (zh) * | 2013-08-29 | 2015-03-18 | 北大方正集团有限公司 | 文字处理方法和系统 |
CN104424163B (zh) * | 2013-08-29 | 2017-09-22 | 北大方正集团有限公司 | 文字处理方法和系统 |
CN106125955A (zh) * | 2016-06-23 | 2016-11-16 | 百度在线网络技术(北京)有限公司 | 一种用于在输入法应用中提供热词的方法和装置 |
CN106125955B (zh) * | 2016-06-23 | 2019-05-07 | 百度在线网络技术(北京)有限公司 | 一种用于在输入法应用中提供热词的方法和装置 |
CN109144285A (zh) * | 2017-06-16 | 2019-01-04 | 北京搜狗科技发展有限公司 | 一种输入方法和装置 |
CN112000877A (zh) * | 2020-07-15 | 2020-11-27 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101013342A (zh) | 基于中文网络词语库的中文在线输入法 | |
CN102866782B (zh) | 一种提高整句生成效率的输入法和输入法系统 | |
Han et al. | Lexical normalisation of short text messages: Makn sens a# twitter | |
US7769804B2 (en) | Server side search with multi-word word wheeling and wildcard expansion | |
US8731901B2 (en) | Context aware back-transliteration and translation of names and common phrases using web resources | |
CN101816000B (zh) | 用于部分输入的搜索查询的自动完成和自动输入法校正 | |
US7983902B2 (en) | Domain dictionary creation by detection of new topic words using divergence value comparison | |
CN107704102B (zh) | 一种文本输入方法及装置 | |
ERYİǦİT et al. | Social media text normalization for Turkish | |
JP5605583B2 (ja) | 検索方法、類似度計算方法、類似度計算及び同一文書照合システムと、そのプログラム | |
CN101556508A (zh) | 一种输入法中候选词的生成方法、装置、系统及设备 | |
CN101199122A (zh) | 使用语言模块扩展通配符 | |
CN103970798A (zh) | 数据的搜索和匹配 | |
WO2009026850A1 (en) | Domain dictionary creation | |
US20070164782A1 (en) | Multi-word word wheeling | |
Khan et al. | RNN-LSTM-GRU based language transformation | |
Younes et al. | A quantitative view of Tunisian dialect electronic writing | |
CN101470701A (zh) | 支持基于有限状态机的语义规则的文本分析器及其方法 | |
Trost et al. | The language component of the FASTY text prediction system | |
Khoury | Microtext normalization using probably-phonetically-similar word discovery | |
Ismail et al. | Developing an automated Bangla parts of speech tagged dictionary | |
Huang et al. | A pragmatic approach for classical Chinese word segmentation | |
Huang et al. | Classical Chinese sentence segmentation | |
Hajič | Linguistics meets exact sciences | |
CN101493732A (zh) | 一种用于印欧语系的语言输入系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20070808 |