CN111158497A - 一种输入法的常用词词库识别方法 - Google Patents
一种输入法的常用词词库识别方法 Download PDFInfo
- Publication number
- CN111158497A CN111158497A CN201911122083.0A CN201911122083A CN111158497A CN 111158497 A CN111158497 A CN 111158497A CN 201911122083 A CN201911122083 A CN 201911122083A CN 111158497 A CN111158497 A CN 111158497A
- Authority
- CN
- China
- Prior art keywords
- input
- words
- common
- word
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000010225 co-occurrence analysis Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
- G06F3/0236—Character input methods using selection techniques to select from displayed items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
- G06F3/0237—Character input methods using prediction or retrieval techniques
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种输入法的常用词词库识别方法,其特征在于,接收对输入法应用的按键的按压操作;根据所述按压操作,在用户终端获取预设的常用词,接收输入的字符;通过输入法应用的候选词条展示与所述输入的字符相匹配的词语,根据所述服务器反馈的输入习惯数据和所述按键的键值输出字符供用户选择,大大提高了输入效率,缩短了输入时间,令用户的使用更为方便,提升了用户体验。输入字符匹配的词语中屏蔽了与敏感词匹配的词语,能有效地保护用户的个人隐私信息,且依然具有联想推荐功能,保证输入效率。
Description
技术领域
本发明属于声音定位的技术领域,具体涉及一种输入法的常用词词库识别方法。
背景技术
随着科学技术的发展,用户对于互联网中输入法的要求也越来越高。目前,通常的输入法是根据曾经输入过的词的输入频率来对待输入的词进行排序和提示输入。但是该种输入方法的不足之处在于,当用户当前输入的文档中出现一个使用频率较低的词,但该词在当前文档中使用频率却很高时,用户需要多次输入该词,且在多次输入的过程中都需要在输入提示区中不停向后翻查才能在排列顺序很后的位置找到该词,该方案输入法的提示效率很低,且需要大量的查找时间,给用户的输入带来了很多不便,影响了用户体验。
在传统的智能手机输入系统中常常具有联想推荐功能,即当用户输入字符时,输入法会根据用户输入的字符在候选词库中查找与该字符匹配的用户常用词语,例如输入拼音或拼音首字母,输入法便可以向用户推荐跟该拼音或拼音首字母匹配的用户常用词语。但是这种联想推荐功能往往会泄露用户的隐私及个人信息,若用户不想泄露其隐私信息,只能选择关闭输入法的联想推荐功能,又会降低其输入效率。
发明内容
本发明所要解决的技术问题是提供一种输入法的常用词词库识别方法,实现对输入法常用词的只能识别功能。
本发明采用的技术方案是,一种输入法的常用词词库识别方法,其特征在于,接收对输入法应用的按键的按压操作;根据所述按压操作,在用户终端获取预设的常用词,接收输入的字符;通过输入法应用的候选词条展示与所述输入的字符相匹配的词语,根据所述服务器反馈的输入习惯数据和所述按键的键值输出字符供用户选择,所述获取常用词的具体步骤为:
步骤1:获取第一词汇集常用词汇;
步骤2:获取第二词汇集网络热词;
步骤3:根据共现分析结果将所述网络热词归类于相应的所述常用词汇中以生成第三词汇集。
步骤4:检测用户是否已在当前文档中输入字符;在用户已在当前文档中输入字符时,检测所述当前文档中是否存在将当前输入的字符作为首字符的候选词;在当前文档中已存在将当前输入的字符作为首字符的候选词时,将检测到的所述候选词排列在输入提示区的首页后,显示所述输入提示区。
输入法应用的候选词条中不包括与所述敏感词相匹配的词语。
候选词显示方法为:
当预设的常用词库中未存储有所述候选词时,将检测到的所述候选词排列在输入提示区的首页后,检测所述常用词库中是否存储有其他将输入的所述字符作为首字符的常用词;当所述常用词库中存储有其他将输入的所述字符作为首字符的常用词时,将检测到的所述常用词按照权重排列在所述候选词之后,显示所述输入提示区;当所述常用词库中未存储有其他将输入的所述字符作为首字符的常用词时,将所述常用词库中的所有词按照权重排列在所述候选词之后,显示所述输入提示区。
用于将检测到的多个所述候选词按照预设的排序规则顺次排列在输入提示区的首页,预设的排序规则为按照出现频率排序。
用户可设置隐私应用,并根据所述隐私应用获取所述隐私应用中的常用词语,将所述常用词语确定为所述敏感词;设置隐私空间,在所述隐私空间中存入特定词语,将所述特定词语确定为所述敏感词。
接收终端发送的指纹;根据所述指纹,查询与所述指纹对应的输入习惯数据,其中,所述服务器中预存指纹与输入习惯数据的对应关系;将查询到的输入习惯数据发送至终端。
本发明的有益效果是,在检测到用户已在当前文档中输入字符时,检测所述当前文档中是否存在将当前输入的字符作为首字符的候选词;在当前文档中已存在将当前输入的字符作为首字符的候选词时,将检测到的所述候选词排列在输入提示区的首页后,显示所述输入提示区。本方案通过检索当前正在输入的文档中的候选词,并将其纳入输入提示区的首页提示用户进行输入,使得在用户当前输入的文档中出现使用频率较低的词,但该词在当前文档中使用频率却很高的情况下,大大提高了输入效率,缩短了输入时间,令用户的使用更为方便,提升了用户体验。输入字符匹配的词语中屏蔽了与敏感词匹配的词语,能有效地保护用户的个人隐私信息,且依然具有联想推荐功能,保证输入效率。
具体实施方式
下面结合具体实施方式对本发明作进一步的详细说明,但本发明并不局限于该具体实施方式。
一种输入法的常用词词库识别方法,其特征在于,接收对输入法应用的按键的按压操作;根据所述按压操作,在用户终端获取预设的常用词,接收输入的字符;通过输入法应用的候选词条展示与所述输入的字符相匹配的词语,根据所述服务器反馈的输入习惯数据和所述按键的键值输出字符供用户选择,所述获取常用词的具体步骤为:步骤1:获取第一词汇集常用词汇;
步骤2:获取第二词汇集网络热词;
步骤3:根据共现分析结果将所述网络热词归类于相应的所述常用词汇中以生成第三词汇集。
步骤4:检测用户是否已在当前文档中输入字符;在用户已在当前文档中输入字符时,检测所述当前文档中是否存在将当前输入的字符作为首字符的候选词;在当前文档中已存在将当前输入的字符作为首字符的候选词时,将检测到的所述候选词排列在输入提示区的首页后,显示所述输入提示区。
输入法应用的候选词条中不包括与所述敏感词相匹配的词语。
候选词显示方法为:
当预设的常用词库中未存储有所述候选词时,将检测到的所述候选词排列在输入提示区的首页后,检测所述常用词库中是否存储有其他将输入的所述字符作为首字符的常用词;当所述常用词库中存储有其他将输入的所述字符作为首字符的常用词时,将检测到的所述常用词按照权重排列在所述候选词之后,显示所述输入提示区;当所述常用词库中未存储有其他将输入的所述字符作为首字符的常用词时,将所述常用词库中的所有词按照权重排列在所述候选词之后,显示所述输入提示区。
用于将检测到的多个所述候选词按照预设的排序规则顺次排列在输入提示区的首页,预设的排序规则为按照出现频率排序。
用户可设置隐私应用,并根据所述隐私应用获取所述隐私应用中的常用词语,将所述常用词语确定为所述敏感词;设置隐私空间,在所述隐私空间中存入特定词语,将所述特定词语确定为所述敏感词。
接收终端发送的指纹;根据所述指纹,查询与所述指纹对应的输入习惯数据,其中,所述服务器中预存指纹与输入习惯数据的对应关系;将查询到的输入习惯数据发送至终端。
在当前文档中已存在将当前输入的字符作为首字符的候选词时,检测预设的常用词库中是否存储有所述候选词。
当在检测到当前文档中已存在将当前输入的字符作为首字符的候选词时,还可以结合常用词库中的词汇来提升此处输入的提示效果;此时,首先对于预设的常用词库中是否存储有所述候选词进行检测。所述预设的常用词库由系统设定或者用户自定义存储,可以包含系统根据大量用户使用习惯后汇总的常用的词汇,也可以包含用户自定义扩展的生僻词汇、英语词汇,亦可以是用户在使用过程中根据自身的使用情况添加进入的词汇等等。当预设的常用词库中存储有所述候选词时,提升所述候选词在所述常用词库中的权重,使得检测到的所述候选词排列在输入提示区的首页后,显示所述输入提示区。所述权重是指在预设所述常用词库时已经自动设定,且后期可以根据用户的使用情况进行修正。在该实施例的一个方面,当检测到预设的常用词库中存储有所述候选词时,可以通过提升所述候选词在所述常用词库中的权重的手段,来使检测到的所述候选词排列在输入提示区的首页后,显示所述输入提示区。对于所述候选词在所述常用词库中权重的提升,可以是临时性的,也可以是永久的,也即,用户可以自主选择或者令系统根据预设的设定规则,将此次权重的提升结果在此次提示后取消使得所述候选词的权重恢复原值,或者在此次权重的提升结果在此次提示后继续保持。可理解的,在该实施例的另一方面,也可以当检测到预设的常用词库中存储有所述候选词时,直接将检测到的所述候选词排列在输入提示区的首页后,显示所述输入提示区,而不需要通过提升所述候选词在所述常用词库中的权重的方式。当然,也可以在将检测到的所述候选词排列在输入提示区的首页后,继续检测所述常用词库中是否存储有其他将输入的所述字符作为首字符的常用词;当所述常用词库中存储有其他将输入的所述字符作为首字符的常用词时,将检测到的所述常用词按照权重/使用频率排列在所述候选词之后;并且,进一步地,还可以将对所述常用词库中的所有词汇按照权重/使用频率顺次排列在所述输入提示区中的最后,并显示所述输入提示区。当所述常用词库中未存储有其他将输入的所述字符作为首字符的常用词时,则将所述常用词库中的所有词按照权重/使用频率排列在所述候选词之后,显示所述输入提示区。
本方案通过检索当前正在输入的文档中的候选词,并将其纳入输入提示区的首页提示用户进行输入,使得在用户当前输入的文档中出现使用频率较低的词,但该词在当前文档中使用频率却很高的情况下,大大提高了输入效率,缩短了输入时间,令用户的使用更为方便,提升了用户体验。输入字符匹配的词语中屏蔽了与敏感词匹配的词语,能有效地保护用户的个人隐私信息,且依然具有联想推荐功能,保证输入效率。
Claims (6)
1.一种输入法的常用词词库识别方法,其特征在于,接收对输入法应用的按键的按压操作;根据所述按压操作,在用户终端获取预设的常用词,并接受终端发送的指纹信息,接收输入的字符;通过输入法应用的候选词条展示与所述输入的字符相匹配的词语,根据所述服务器反馈的输入习惯数据和所述按键的键值输出字符供用户选择,所述获取常用词的具体步骤为:
步骤1:获取第一词汇集常用词汇;
步骤2:获取第二词汇集网络热词;
步骤3:根据共现分析结果将所述网络热词归类于相应的所述常用词汇中以生成第三词汇集。
步骤4:检测用户是否已在当前文档中输入字符;在用户已在当前文档中输入字符时,检测所述当前文档中是否存在将当前输入的字符作为首字符的候选词;在当前文档中已存在将当前输入的字符作为首字符的候选词时,将检测到的所述候选词排列在输入提示区的首页后,显示所述输入提示区。
2.根据权利要求1所述的一种输入法的常用词词库识别方法,其特征在于,所述输入法应用的候选词条中不包括与所述敏感词相匹配的词语。
3.根据权利要求1所述的一种输入法的常用词词库识别方法,其特征在于,所述候选词显示方法为:
当预设的常用词库中未存储有所述候选词时,将检测到的所述候选词排列在输入提示区的首页后,检测所述常用词库中是否存储有其他将输入的所述字符作为首字符的常用词;当所述常用词库中存储有其他将输入的所述字符作为首字符的常用词时,将检测到的所述常用词按照权重排列在所述候选词之后,显示所述输入提示区;当所述常用词库中未存储有其他将输入的所述字符作为首字符的常用词时,将所述常用词库中的所有词按照权重排列在所述候选词之后,显示所述输入提示区。
4.根据权利要求1所述的一种输入法的常用词词库识别方法,其特征在于,用于将检测到的多个所述候选词按照预设的排序规则顺次排列在输入提示区的首页,预设的排序规则为按照出现频率排序。
5.根据权利要求1所述的一种输入法的常用词词库识别方法,其特征在于,用户可设置隐私应用,并根据所述隐私应用获取所述隐私应用中的常用词语,将所述常用词语确定为所述敏感词;设置隐私空间,在所述隐私空间中存入特定词语,将所述特定词语确定为所述敏感词。
6.根据权利要求1所述的一种输入法的常用词词库识别方法,其特征在于,所述接收终端发送的指纹;根据所述指纹,查询与所述指纹对应的输入习惯数据,其中,所述服务器中预存指纹与输入习惯数据的对应关系;将查询到的输入习惯数据发送至终端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911122083.0A CN111158497A (zh) | 2019-11-15 | 2019-11-15 | 一种输入法的常用词词库识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911122083.0A CN111158497A (zh) | 2019-11-15 | 2019-11-15 | 一种输入法的常用词词库识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111158497A true CN111158497A (zh) | 2020-05-15 |
Family
ID=70555975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911122083.0A Pending CN111158497A (zh) | 2019-11-15 | 2019-11-15 | 一种输入法的常用词词库识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111158497A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114527927A (zh) * | 2020-11-20 | 2022-05-24 | 阿波罗智联(北京)科技有限公司 | 输入信息的方法、装置、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103853746A (zh) * | 2012-12-01 | 2014-06-11 | 上海斐讯数据通信技术有限公司 | 词库生成方法及其系统、输入法及输入系统 |
CN104731364A (zh) * | 2015-03-30 | 2015-06-24 | 天脉聚源(北京)教育科技有限公司 | 一种输入法及输入法系统 |
CN105511638A (zh) * | 2015-12-03 | 2016-04-20 | 魅族科技(中国)有限公司 | 输入法应用方法和装置 |
CN108932068A (zh) * | 2018-06-30 | 2018-12-04 | 珠海市魅族科技有限公司 | 一种输入法应用方法及装置 |
-
2019
- 2019-11-15 CN CN201911122083.0A patent/CN111158497A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103853746A (zh) * | 2012-12-01 | 2014-06-11 | 上海斐讯数据通信技术有限公司 | 词库生成方法及其系统、输入法及输入系统 |
CN104731364A (zh) * | 2015-03-30 | 2015-06-24 | 天脉聚源(北京)教育科技有限公司 | 一种输入法及输入法系统 |
CN105511638A (zh) * | 2015-12-03 | 2016-04-20 | 魅族科技(中国)有限公司 | 输入法应用方法和装置 |
CN108932068A (zh) * | 2018-06-30 | 2018-12-04 | 珠海市魅族科技有限公司 | 一种输入法应用方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114527927A (zh) * | 2020-11-20 | 2022-05-24 | 阿波罗智联(北京)科技有限公司 | 输入信息的方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8799401B1 (en) | System and method for providing supplemental information relevant to selected content in media | |
US20110106805A1 (en) | Method and system for searching multilingual documents | |
CN107577755B (zh) | 一种搜索方法 | |
CN102567475A (zh) | 用于交互式查询重构的用户接口 | |
CN110929125A (zh) | 搜索召回方法、装置、设备及其存储介质 | |
CN106708929B (zh) | 视频节目的搜索方法和装置 | |
CN107992523B (zh) | 移动应用的功能选项查找方法及终端设备 | |
CN101950288A (zh) | 信息处理装置、信息处理方法及程序 | |
WO2012079254A1 (zh) | 节目推荐装置和节目推荐方法 | |
CN105630767A (zh) | 一种文本相似性的比较方法以及装置 | |
US9256805B2 (en) | Method and system of identifying an entity from a digital image of a physical text | |
CN101082936A (zh) | 数据查询系统及方法 | |
US20230342400A1 (en) | Document search device, document search program, and document search method | |
CN111767378A (zh) | 一种智能推荐科技文献的方法及装置 | |
CN106570196B (zh) | 视频节目的搜索方法和装置 | |
CN115238154A (zh) | 搜索引擎优化系统 | |
CN112684907B (zh) | 一种文本输入方法、装置、设备及存储介质 | |
CN111158497A (zh) | 一种输入法的常用词词库识别方法 | |
CN113869063A (zh) | 数据推荐方法、装置、电子设备及存储介质 | |
CN113434763A (zh) | 搜索结果的推荐理由生成方法、装置、设备及存储介质 | |
US20120254209A1 (en) | Searching method, searching device and recording medium recording a computer program | |
JP2006251975A (ja) | テキスト分類方法ならびにその方法によるプログラム、およびテキスト分類装置 | |
CN102479206A (zh) | 按姓氏列表查找电话簿联系人的方法及电话簿存储装置 | |
CN110442593B (zh) | 基于用户搜索信息跨应用共享的方法 | |
CN103744884A (zh) | 一种整理信息碎片的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |