CN102298644A - 自造词的过滤方法、系统及移动终端 - Google Patents

自造词的过滤方法、系统及移动终端 Download PDF

Info

Publication number
CN102298644A
CN102298644A CN2011102794596A CN201110279459A CN102298644A CN 102298644 A CN102298644 A CN 102298644A CN 2011102794596 A CN2011102794596 A CN 2011102794596A CN 201110279459 A CN201110279459 A CN 201110279459A CN 102298644 A CN102298644 A CN 102298644A
Authority
CN
China
Prior art keywords
self
word creation
word
creation
access times
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011102794596A
Other languages
English (en)
Inventor
崔陈福
郦伟强
方元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Original Assignee
Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yulong Computer Telecommunication Scientific Shenzhen Co Ltd filed Critical Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Priority to CN2011102794596A priority Critical patent/CN102298644A/zh
Publication of CN102298644A publication Critical patent/CN102298644A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明适用于通信技术领域,提供了一种自造词的过滤方法,包括步骤有:识别出自造词;统计所述自造词在预定时间段内的使用次数;若所述自造词在所述预定时间段内的使用次数未达到预定阀值,则将所述自造词删除。相应地,本发明还提供一种自造词的过滤系统及移动终端。借此,本发明能够有效地过滤掉使用率过低的自造词,从而提高了文字输入效率。

Description

自造词的过滤方法、系统及移动终端
技术领域
本发明涉及通信技术领域,尤其涉及一种自造词的过滤方法、系统及移动终端。
背景技术
目前应用于电脑、移动终端等的输入法多已支持自造词功能,自造词是将连续输入的至少两个字判断为一个词,并将该词将作为自造词永久保留在词库中,而并未进行任何的逻辑判断。然而所述自造词可能使用率极低,用户很少会再次输入该自造词;或者所述自造词并不符合逻辑,甚至是误造词。但即便如此,此后当用户输入所述自造词的一个字时,与该字相关的自造词仍将出现在联想词中,而原有的与该字相关的词组组合联想却被挤到输入栏的靠后页面中,从而直接影响了用户的文字输入效率。
综上可知,现有自造词技术在实际使用上显然存在不便与缺陷,所以有必要加以改进。
发明内容
针对上述的缺陷,本发明的目的在于提供一种自造词的过滤方法、系统及移动终端,其可有效地过滤掉使用率过低的自造词,从而提高文字输入效率。
为了实现上述目的,本发明提供一种自造词的过滤方法,包括步骤如下:
识别出自造词;
统计所述自造词在预定时间段内的使用次数;
若所述自造词在所述预定时间段内的使用次数未达到预定阀值,则将所述自造词删除。
根据本发明所述的自造词的过滤方法,所述识别出自造词的步骤之后包括:将所述自造词暂时存储到暂时性词库;
若所述自造词在所述预定时间段内的使用次数未达到预定阀值,则将所述自造词删除的步骤包括:
若所述自造词在所述预定时间段内的使用次数未达到所述预定阀值,则将所述自造词从所述暂时性词库中删除;
若所述自造词在所述预定时间段内的使用次数达到所述预定阀值,则将所述自造词从所述暂时性词库中移出并永久存储到永久性词库。
根据本发明所述的自造词的过滤方法,所述自造词的过滤方法还包括:
预先设置自造词过滤模式。
根据本发明所述的自造词的过滤方法,所述识别出自造词的步骤包括:将连续输入的至少两个字自动识别为自造词。
根据本发明所述的自造词的过滤方法,所述自造词的过滤方法应用于手写输入法或者键盘输入法。
本发明还提供一种自造词的过滤系统,包括步骤如下:
识别模块,用于识别出自造词;
统计模块,用于统计所述自造词在预定时间段内的使用次数;
过滤模块,用于当所述自造词在所述预定时间段内的使用次数未达到预定阀值时,将所述自造词删除。
根据本发明所述的自造词的过滤系统,所述自造词的过滤系统还包括添加模块、暂时性词库以及永久性词库;
所述识别模块还用于识别出所述自造词后,将所述自造词暂时存储到所述暂时性词库;
所述过滤模块还用于当所述自造词在所述预定时间段内的使用次数未达到所述预定阀值时,将所述自造词从所述暂时性词库中删除;
所述添加模块用于当所述自造词在所述预定时间段内的使用次数达到所述预定阀值时,将所述自造词从所述暂时性词库中移出并永久存储到所述永久性词库。
根据本发明所述的自造词的过滤系统,所述自造词的过滤系统还包括:
设置模块,用于预先设置自造词过滤模式。
根据本发明所述的自造词的过滤系统,所述自造词的过滤系统应用于手写输入法或者键盘输入法。
本发明还提供一种包括有上述自造词的过滤系统的移动终端。
本发明考虑到并不是所有自造词都是符合逻辑或用户常用的词,因此对自造词增加一个逻辑判断,即判断所述自造词在预定时间段内的使用次数是否达到一预定阀值,若未到达预定阀值,则所述自造词将被认为使用率过低而被自动删除。借此,本发明能够有效地过滤掉用户使用率过低的自造词,使得连续输入的字自动识别成词的使用效率和准确率更高,既保留了连续成词的优势,还不会增加大量的词组,影响联想词的输入,从而提高了用户的文字输入效率,进而提升了用户的体验。
附图说明
图1是本发明自造词的过滤系统的结构示意图;
图2是本发明优选的自造词的过滤系统的结构示意图;
图3是本发明自造词的过滤方法的流程图;
图4是本发明第一实施例中自造词的过滤方法的流程图;以及
图5是本发明第二实施例中自造词的过滤方法的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示出了本发明自造词的过滤系统的结构,所述自造词的过滤系统10优选应用于移动终端100中,当然也可应用于电脑、GPS(Global Positioning System,全球定位系统)等具有输入法的其他设备中,所述自造词的过滤系统10主要包括识别模块11、统计模块12和过滤模块13,其中:
识别模块11,用于识别出自造词。优选的,识别模块11将用户连续输入的至少两个字自动识别为自造词,所述字优选为汉字,当然也可以是英文字母、阿拉伯数字、日文字等,例如用户连续输入“有木有”这三个字后,该“有木有”将被自动识别为自造词。
统计模块12,用于统计所述自造词在预定时间段内的使用次数。例如统计自造词“有木有”在一周内的使用次数。
过滤模块13,用于当自造词在预定时间段内的使用次数未达到预定阀值时,将该自造词删除,日后用户输入所述自造词的一个字时,所述自造词将不会出现在联想词中。例如将所述预定阀值设置为5,自造词“有木有”在一周内使用次数未到达5次时,认为其使用率过低而被自动删除,反之将该自造词“有木有”将永久保留到词库,日后用户输入“有”时,输入栏中会出现“有木有”的联想词。当然,所述自造词也可以不永久保留,而是采用预定周期分析其使用次数,例如检测自造词每年的使用次数是否小于20次,若第一年大于20次,而第二年小于20次,则在第二年届满后将该自造词自动删除。
本发明自造词的过滤系统10可应用于手写输入法或者键盘输入法等各种输入法中。
图2是本发明优选的自造词的过滤系统的结构示意图,所述自造词的过滤系统10可包括识别模块11、统计模块12、过滤模块13、设置模块14、添加模块15、暂时性词库16以及永久性词库17,其中:
设置模块14,用于预先设置自造词过滤模式。即用户若要使用自造词过滤,可通过设置模块14来预设自造词过滤模式,若用户不选择自造词过滤模式,则按照现有自造词技术进行处理。
暂时性词库16,用于暂时存储自造词。在暂时性词库16中存储的自造词可以被自动删除,也就是说,储存于暂时性词库16中的自造词若使用较少,则过段时间将自动消失。
永久性词库17,用于永久存储各种词汇。所述永久存储是指在永久性词库17存储的词不论使用频次如何也不会被自动删除。当然,也可允许用户修改和手动删除永久性词库17中的词汇。
识别模块11,用于识别出自造词后,将所述自造词暂时存储到暂时性词库16。
统计模块12,用于统计所述自造词在预定时间段内的使用次数。
过滤模块13,用于当自造词在预定时间段内的使用次数未达到预定阀值时,将自造词从暂时性词库16中删除。也就是说,该自造词将来不会在出现在输入栏的联想词中。
添加模块15,用于当自造词在预定时间段内的使用次数达到预定阀值时,将自造词从暂时性词库16中移出并永久存储到永久性词库17。该自造词日后将会一直在出现在输入栏的联想词中,当然输入栏可根据词组的使用频率来动态调整联想词的排列顺序。
本发明还提供包括如图1或图2所示的自造词的过滤系统10的移动终端100,该移动终端100可以是手机、掌上电脑、PDA(Personal Digital Assistant,个人数字助理)等。
图3是本发明自造词的过滤方法的流程图,所述过滤方法可通过如图1或图2所示的自造词的过滤系统10或者移动终端100实现,包括步骤如下:
步骤S301,识别出自造词,本步骤可由识别模块11实现。优选的是,将用户连续输入的至少两个字自动识别为自造词。
步骤S302,统计自造词在预定时间段内的使用次数,本步骤可由统计模块12实现。所述预定时间段可由系统默认设置或者用户自定义设置,例如设为一周、一个月或者一年等。
步骤S303,若自造词在预定时间段内的使用次数未达到预定阀值,则将所述自造词删除,即日后用户输入所述自造词的一个字时,与该字相关的自造词将不会出现在联想词中。所述预定阀值可由系统默认设置或者用户自定义设置,例如设为3次、5次、10次等。
本发明自造词的过滤方法可应用于手写输入法或者键盘输入法等各种输入法中。
图4是本发明第一实施例中自造词的过滤方法的流程图,所述过滤方法可通过如图2所示的自造词的过滤系统10或者移动终端100实现,包括步骤如下:
步骤S401,预先设置自造词过滤模式。
步骤S402,将用户连续输入的至少两个字自动识别为自造词。
步骤S403,将所识别的自造词暂时存储到暂时性词库16。
步骤S404,统计自造词在预定时间段内的使用次数。
步骤S405,判断所述自造词在预定时间段内的使用次数是否达到预定阀值,若达到所述预定阀值则执行步骤S406,否则执行步骤S407。
步骤S406,若自造词在预定时间段内的使用次数达到预定阀值,则认为该自造词是符合逻辑或用户常用的词,并将所述自造词从暂时性词库16中移出并永久存储到永久性词库17。即日后用户输入所述自造词的一个字时,与该字相关的自造词将会出现在联想词中。
步骤S407,若自造词在预定时间段内的使用次数未达到预定阀值,则认为该自造词的使用率过低,并将所述自造词从暂时性词库16中删除。即日后用户输入所述自造词的一个字时,与该字相关的自造词将不会出现在联想词中。
图5是本发明第二实施例中自造词的过滤方法的流程图,所述过滤方法可通过如图2所示的自造词的过滤系统10或者移动终端100实现,包括步骤如下:
步骤S501,用户连续手写输入“给”和“力”两个汉字,被自动识别成自造词--“给力”。
步骤S502,判断在一个月内,用户是否再次输入“给力”超过三次,若是则执行步骤S503,否则执行步骤S504。
步骤S503,若用户再次输入“给力”超过三次,则将“给力”存入永久性词库17中,无论过多久,只要用户再次输入“给”都将出现“力”的联想。
步骤S504,若用户再次输入“给力”未超过三次,一个月后,若用户再次输入“给”,将不再出现“力”的联想。
综上所述,本发明考虑到并不是所有自造词都是符合逻辑或用户常用的词,因此对自造词增加一个逻辑判断,即判断所述自造词在预定时间段内的使用次数是否达到一预定阀值,若未到达预定阀值,则所述自造词将被认为使用率过低而被自动删除。借此,本发明能够有效地过滤掉用户使用率过低的自造词,使得连续输入的字自动识别成词的使用效率和准确率更高,既保留了连续成词的优势,还不会增加大量的词组,影响联想词的输入,从而提高了用户的文字输入效率,进而提升了用户的体验。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (10)

1.一种自造词的过滤方法,其特征在于,包括步骤如下:
识别出自造词;
统计所述自造词在预定时间段内的使用次数;
若所述自造词在所述预定时间段内的使用次数未达到预定阀值,则将所述自造词删除。
2.根据权利要求1所述的自造词的过滤方法,其特征在于,所述识别出自造词的步骤之后包括:将所述自造词暂时存储到暂时性词库;
若所述自造词在所述预定时间段内的使用次数未达到预定阀值,则将所述自造词删除的步骤包括:
若所述自造词在所述预定时间段内的使用次数未达到所述预定阀值,则将所述自造词从所述暂时性词库中删除;
若所述自造词在所述预定时间段内的使用次数达到所述预定阀值,则将所述自造词从所述暂时性词库中移出并永久存储到永久性词库。
3.根据权利要求1所述的自造词的过滤方法,其特征在于,所述自造词的过滤方法还包括:
预先设置自造词过滤模式。
4.根据权利要求1所述的自造词的过滤方法,其特征在于,所述识别出自造词的步骤包括:将连续输入的至少两个字自动识别为自造词。
5.根据权利要求1所述的自造词的过滤方法,其特征在于,所述自造词的过滤方法应用于手写输入法或者键盘输入法。
6.一种自造词的过滤系统,其特征在于,包括步骤如下:
识别模块,用于识别出自造词;
统计模块,用于统计所述自造词在预定时间段内的使用次数;
过滤模块,用于当所述自造词在所述预定时间段内的使用次数未达到预定阀值时,将所述自造词删除。
7.根据权利要求6所述的自造词的过滤系统,其特征在于,所述自造词的过滤系统还包括添加模块、暂时性词库以及永久性词库;
所述识别模块还用于识别出所述自造词后,将所述自造词暂时存储到所述暂时性词库;
所述过滤模块还用于当所述自造词在所述预定时间段内的使用次数未达到所述预定阀值时,将所述自造词从所述暂时性词库中删除;
所述添加模块用于当所述自造词在所述预定时间段内的使用次数达到所述预定阀值时,将所述自造词从所述暂时性词库中移出并永久存储到所述永久性词库。
8.根据权利要求6所述的自造词的过滤系统,其特征在于,所述自造词的过滤系统还包括:
设置模块,用于预先设置自造词过滤模式。
9.根据权利要求6所述的自造词的过滤系统,其特征在于,所述自造词的过滤系统应用于手写输入法或者键盘输入法。
10.一种包括有如权利要求6~9任一项自造词的过滤系统的移动终端。
CN2011102794596A 2011-09-20 2011-09-20 自造词的过滤方法、系统及移动终端 Pending CN102298644A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011102794596A CN102298644A (zh) 2011-09-20 2011-09-20 自造词的过滤方法、系统及移动终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011102794596A CN102298644A (zh) 2011-09-20 2011-09-20 自造词的过滤方法、系统及移动终端

Publications (1)

Publication Number Publication Date
CN102298644A true CN102298644A (zh) 2011-12-28

Family

ID=45359058

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102794596A Pending CN102298644A (zh) 2011-09-20 2011-09-20 自造词的过滤方法、系统及移动终端

Country Status (1)

Country Link
CN (1) CN102298644A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104049766A (zh) * 2013-03-11 2014-09-17 百度国际科技(深圳)有限公司 用于在云输入法中更新语言模型的云端服务器及其终端
CN115066679A (zh) * 2020-03-25 2022-09-16 苏州七星天专利运营管理有限责任公司 一种提取专业领域内的自造术语的方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739459A (zh) * 2009-12-21 2010-06-16 中兴通讯股份有限公司 一种移动终端的词库添加方法和移动终端
CN101751202A (zh) * 2008-12-17 2010-06-23 爱思开电讯投资(中国)有限公司 一种基于环境信息进行文字关联输入的方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751202A (zh) * 2008-12-17 2010-06-23 爱思开电讯投资(中国)有限公司 一种基于环境信息进行文字关联输入的方法和装置
CN101739459A (zh) * 2009-12-21 2010-06-16 中兴通讯股份有限公司 一种移动终端的词库添加方法和移动终端

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104049766A (zh) * 2013-03-11 2014-09-17 百度国际科技(深圳)有限公司 用于在云输入法中更新语言模型的云端服务器及其终端
CN104049766B (zh) * 2013-03-11 2017-05-31 百度国际科技(深圳)有限公司 用于在云输入法中更新语言模型的云端服务器及其终端
CN115066679A (zh) * 2020-03-25 2022-09-16 苏州七星天专利运营管理有限责任公司 一种提取专业领域内的自造术语的方法及系统
CN115066679B (zh) * 2020-03-25 2024-02-20 苏州七星天专利运营管理有限责任公司 一种提取专业领域内的自造术语的方法及系统

Similar Documents

Publication Publication Date Title
CN103247290A (zh) 通信装置及其控制方法
CN105808058A (zh) 一种智能显示粘贴提示的方法及装置
CN101815262A (zh) 一种移动终端垃圾短信息屏蔽方法和装置
CN101763218A (zh) 一种手持设备输入方法
CN102737105A (zh) 一种字典树生成方法及搜索方法
CN104077194A (zh) 一种文本输入保护方法及装置
CN104219362A (zh) 搜索联系人的方法和装置
CN103150294A (zh) 基于语音识别结果的修正方法和系统
CN101963975A (zh) 一种移动终端应用程序快捷搜索的系统和方法
CN113591456A (zh) 文本纠错方法及装置、电子设备及存储介质
CN105072238A (zh) 一种根据新增号码的备注信息创建通讯录的方法及装置
CN107479786A (zh) 一种删除文本的方法、装置、计算机装置及计算机可读存储介质
CN101923401A (zh) 一种电子设备输入方法
CN103186522A (zh) 电子设备及其自然语言分析方法
CN101441549A (zh) 一种字符识别方法、系统及电子终端
CN102736831A (zh) 应用于包含虚拟键盘的移动终端的输入方法和装置
CN105959811B (zh) 一种视频网站弹幕合并方法及装置
CN104469011A (zh) 一种手机计算器的管理方法
CN101951427A (zh) 一种获取联系人资料的系统及方法
CN102298644A (zh) 自造词的过滤方法、系统及移动终端
CN102937948A (zh) 一种移动终端的图文数据编辑方法
CN101071462A (zh) 一种对用户输入的信息进行风险提示的系统及方法
CN102883020A (zh) 一种移动终端的拨号方法及拨号系统
CN102707886A (zh) 一种输入字符的编辑方法和系统
CN101436193A (zh) 文字编辑器预测输入系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20111228