CN103425257B - 一种生僻字符信息的提示方法和装置 - Google Patents

一种生僻字符信息的提示方法和装置 Download PDF

Info

Publication number
CN103425257B
CN103425257B CN201210164861.4A CN201210164861A CN103425257B CN 103425257 B CN103425257 B CN 103425257B CN 201210164861 A CN201210164861 A CN 201210164861A CN 103425257 B CN103425257 B CN 103425257B
Authority
CN
China
Prior art keywords
character
uncommon
text
capture
character set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210164861.4A
Other languages
English (en)
Other versions
CN103425257A (zh
Inventor
刘旋
李贝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201210164861.4A priority Critical patent/CN103425257B/zh
Publication of CN103425257A publication Critical patent/CN103425257A/zh
Application granted granted Critical
Publication of CN103425257B publication Critical patent/CN103425257B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供了一种生僻字符信息的提示方法和装置,其中的方法具体包括:构建生僻字符集合;监测用户在应用程序环境中捕获的文本;当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息;向用户提示所述落入生僻字符集合的字符的相关信息。本申请能够增加输入生僻字符的便捷性。

Description

一种生僻字符信息的提示方法和装置
技术领域
本申请涉及信息处理技术领域,特别是涉及一种生僻字符信息的提示方法和装置。
背景技术
目前,绝大多数用户使用拼音输入法进行汉字输入,其前提是知道该字的“大概”的读音。因此,对于这部分用户来说,一个汉字的读音是非常重要的,如果用户完全不知道某个字的读音,就很难用拼音输入法完成输入。
汉字的数量非常大,仅GB18030字符集中就有两万多个汉字。但是人们日常使用的汉字却只有几千个,其余不常使用的汉字对大多数人来说都属于生僻字,往往不知道该字的发音。
随着信息处理技术的发展,如果仅知道生僻字的字形而需要输入该生僻字,一般来说有如下方法:
方法一、在人工查询该生僻字的读音后,采用拼音输入该生僻字;
所述人工查询方式具体可以包括:通过查询字典得到该生僻字的读音;将该生僻字复制至搜索引擎来进行读音的查询等等。无论是哪种人工查询方式都需要复杂的流程,费时费力,影响输入效率。
方法二、现有流行的拼音输入法支持拆分输入模式,也即,可以将生僻字拆成几个简单的部首,通过输入这几个部首的读音来完成该生僻字的输入,并能同时得到该生僻字的读音等信息。参照图1,示出了现有一种拼音输入法的拆分输入方法示例,用户输入“tututu”就能找到“垚”字。但是,有些独体字难以进行拆分,另外用户可能不知道拆分后的部首的读音,还有可能会因为拆分顺序不一致等原因导致无法顺利得到该生僻字等等。故方法二也需要复杂的流程,费时费力,且容易影响输入效率和输入准确率。
方法三、直接采用基于字形的输入法(如五笔字型输入法)输入该生僻字,但基于字形的输入法并不为多数人使用,对于多数人来讲并不可行;
方法四、用户可以打开手写识别软件,用鼠标或其他手绘输入设备在软件界面中绘制出该生僻字的字形,通过手写识别技术完成该生僻字的输入。但是,对于普通用户来说,用鼠标绘制汉字比较麻烦,比较慢,效率较低;并且,在用户绘制的汉字不够“标准”情况下,容易导致手写识别软件没法识别出正确的字。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够增加输入生僻字符的便捷性。
发明内容
本申请所要解决的技术问题是提供一种生僻字符信息的提示方法和装置,能够增加输入生僻字符的便捷性。
为了解决上述问题,本申请公开了一种生僻字符信息的提示方法,包括:
构建生僻字符集合;
监测用户在应用程序环境中捕获的文本;
当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息;
向用户提示所述落入生僻字符集合的字符的相关信息。
优选的,所述当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息进一步包括:
当所述捕获的文本字数不超过字数阈值,且所述捕获的文本中有字符落入生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息。
优选的,所述捕获的文本包括选中的文本、复制的文本或者剪切的文本。
优选的,通过如下步骤构建生僻字符集合:
对字符的使用频率进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或
收集手写输入和/或拆分输入的字符,作为生僻字符保存至生僻字符集合;和/或
收集手写输入和/或拆分输入中符合对应的生僻属性条件的字符,作为生僻字符保存至生僻字符集合;和/或
对字符的笔画数目或者单词的字母长度进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或
对搜索引擎的搜索记录中记录的单个字或单个词进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合。
优选的,所述监测用户在应用程序环境中捕获的文本的步骤,包括:
监测用户在应用程序环境中执行的文本捕获操作;
通过调用该应用程序环境提供的功能接口,获取所述文本捕获操作所捕获的文本。
优选的,所述文本捕获操作包括文本选中操作、文本复制操作或者文本剪切操作。
优选的,所述监测用户在应用程序环境中捕获的文本的步骤,包括:
通过监控用户的剪贴板,获取用户的剪贴板中最新的文本内容,所述最新的文本内容为用户在应用程序环境中捕获的文本。
优选的,所述落入生僻字符集合的字符的相关信息包括读音、部首、笔画、释义、常用组词、便捷输入方法信息中的一种或多种。
优选的,所述提示所述落入生僻字符集合的字符的相关信息的步骤为,采用弹窗或浮动框方式提示所述落入生僻字符集合的字符的相关信息;或
所述提示所述落入生僻字符集合的字符的相关信息的步骤为,在所述捕获的文本相关联的位置提示所述落入生僻字符集合的字符的相关信息。
优选的,所述方法还包括:
当所述捕获的文本中未有字符落入生僻字符集合时,客户端将所述捕获的文本中的全部或部分字符上传至服务器端;
服务器端分析客户端上传的字符的生僻属性,并在分析得到的生僻属性符合生僻属性条件时,将所述字符保存至所述生僻字符集合;
服务器端将所述生僻字符集合同步至客户端。
优选的,所述当捕获的文本中未有字符落入生僻字符集合时,客户端将所述捕获的文本中的全部或部分字符上传至服务器端进一步包括:
当所述捕获的文本中未有字符落入生僻字符集合,且所述捕获的文本为单个字或单个词时,客户端将所述单个字或单个词上传至服务器端。
优选的,所述生僻属性条件包括:
依据字符的使用频率预置的条件;和/或
依据字符的笔画数目或者单词的字母长度预置的条件;和/或
对搜索引擎的搜索记录中记录的单个字或单个词进行分析统计,并依据分析统计结果预置的条件。
另一方面,本申请还公开了一种生僻字符信息的提示装置,包括:
构建模块,用于构建生僻字符集合;
监测模块,用于监测用户在应用程序环境中捕获的文本;
获取模块,用于当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息;及
提示模块,用于向用户提示所述落入生僻字符集合的字符的相关信息。
优选的,所述获取模块进一步包括:
信息获取子模块,用于当所述捕获的文本字数不超过字数阈值,且所述捕获的文本中有字符落入生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息。
优选的,所述捕获的文本包括选中的文本、复制的文本或者剪切的文本。
优选的,所述构建模块包括:
第一收集子模块,用于对字符的使用频率进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或
第二收集子模块,用于收集手写输入和/或拆分输入的字符,作为生僻字符保存至生僻字符集合;和/或
第三收集子模块,用于收集手写输入和/或拆分输入中符合对应的生僻属性条件的字符,作为生僻字符保存至生僻字符集合;和/或
第四收集子模块,用于对字符的笔画数目或者单词的字母长度进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或
第五收集子模块,用于对搜索引擎的搜索记录中记录的单个字或单个词进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合。
优选的,所述监测模块包括:
操作监测子模块,用于监测用户在应用程序环境中执行的文本捕获操作;
调用获取子模块,用于通过调用该应用程序环境提供的功能接口,获取所述文本捕获操作所捕获的文本。
优选的,所述文本捕获操作包括文本选中操作、文本复制操作或者文本剪切操作。
优选的,所述监测模块包括:
监控获取子模块,用于通过监控用户的剪贴板,获取用户的剪贴板中最新的文本内容,所述最新的文本内容为用户在应用程序环境中捕获的文本。
优选的,所述落入生僻字符集合的字符的相关信息包括读音、部首、笔画、释义、常用组词、便捷输入方法信息中的一种或多种。
优选的,所述提示模块,具体用于采用弹窗或浮动框方式提示所述落入生僻字符集合的字符的相关信息;或
所述提示模块,具体用于在所述捕获的文本相关联的位置提示所述落入生僻字符集合的字符的相关信息。
优选的,所述装置还包括:
上传模块,用于当所述捕获的文本中未有字符落入生僻字符集合时,客户端将所述捕获的文本中的全部或部分字符上传至服务器端;
分析保存模块,位于服务器端,用于分析客户端上传的字符的生僻属性,并在分析得到的生僻属性符合生僻属性条件时,将所述字符保存至所述生僻字符集合;
同步模块,位于服务器端,用于将所述生僻字符集合同步至客户端。
优选的,所述上传模块进一步包括:
单字上传子模块,用于当所述捕获的文本中未有字符落入生僻字符集合,且所述捕获的文本为单个字或单个词时,客户端将所述单个字或单个词上传至服务器端。
优选的,所述生僻属性条件包括:
依据字符的使用频率预置的条件;和/或
依据字符的笔画数目或者单词的字母长度预置的条件;和/或
对搜索引擎的搜索记录中记录的单个字或单个词进行分析统计,并依据分析统计结果预置的条件。
与现有技术相比,本申请具有以下优点:
本申请当用户捕获的文本中有字符落入生僻字符集合时,提示所述落入生僻字符集合的字符的相关信息;对于用户而言,其不需要现有技术中借助其他工具等额外甚至复杂的操作、就可以根据提示内容学习获得所述落入生僻字符集合的字符的相关信息;这样,在用户捕获生僻字的情形下,本申请可以向用户提供学习过程,增加用户下次输入该生僻字的便捷性;因此,本申请能够增加用户输入生僻字符的便捷性。
附图说明
图1是现有一种拼音输入法的拆分输入方法示例;
图2是本申请一种生僻字符信息的提示方法实施例1的流程图;
图3是本申请一种输入法采用弹窗方式提示生僻字信息的示例;
图4是本申请一种输入法采用浮动框方式提示生僻字信息的示例;
图5是本申请一种生僻字符信息的提示方法实施例2的流程图;
图6是本申请一种生僻字符信息的提示方法实施例3的流程图;
图7是本申请一种生僻字符信息的提示方法实施例4的流程图;
图8是本申请一种生僻字符信息的提示装置实施例的结构图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
首先,通过具体的示例对在仅知道生僻字的字形而需要输入该生僻字的情形下的用户行为习性进行分析。
假设用户在邮件中看到一个“吴浛翯”的人名,用户不认识“翯”这个字,若用户需要输入这个人名,而又不确定每个字的读音,那么用户可能采取以下三种操作:
①将这三个字都复制下来粘贴到需要的地方;
②将不认识的字“翯”单独复制下来去搜索引擎查询该字的读音;
③使用拆分输入、字形输入或手写输入方法来进行输入,这里的拆分输入主要指现有流行的拼音输入法支持拆分输入模式的输入,字形输入通常使用基于字形的输入法完成,手写输入通常使用手写识别软件完成;
上述三种用户操作中,第一种虽然能够正常输入,但除字形外用户仍然不知道该生僻字的其它信息,对之后相同字的输入无帮助,第二种和第三种则需要借助其他工具,比较麻烦,并且不一定能得到正确的输入结果。
如果在用户复制生僻字的情况下,不需要做额外的操作就可以对该生僻字的信息进行学习,那么下次就可以更便捷地输入该生僻字,例如,如果学习了该生僻字的读音,那么下次用户直接通过拼音输入该生僻字。并且,如果所述学习过程不需要用户进行拆分或手写,而是基于生僻字本身的客观的学习过程,那么可以避免手写识别等其他方法可能产生的错误,提高下次输入的准确率。
参照图2,示出了本申请一种生僻字符信息的提示方法实施例1的流程图,具体可以包括:
步骤201、构建生僻字符集合;
步骤202、监测用户在应用程序环境中捕获的文本;
步骤203、当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息;
步骤204、向用户提示所述落入生僻字符集合的字符的相关信息。
依据用户行为习性,当用户在应用程序环境中看到生僻字时,一般会首先捕获该字符,然后执行上述三种操作中的任一。本申请的应用程序环境主要可以包括word、excel等非联网环境,QQ、MSN等非web的联网环境,以及网页、邮件等web的联网环境等等,本申请对具体的应用程序环境不加以限制。
本申请可以提供如下监测用户在应用程序环境中捕获的文本的方案:
监控获取方案1、
监控获取方案1的实现过程具体可以包括:监测用户在应用程序环境中执行的文本捕获操作;通过调用该应用程序环境提供的功能接口,获取所述文本捕获操作所捕获的文本。
这里的文本捕获操作具体可以包括文本复制操作、文本剪切操作或文本选中操作,以及其他由用户发起、将部分文本与其他内容区别开来以便能够针对这部分文本进行后续处理的操作。由于文本捕获操作通常是由用户通过键盘、鼠标或触摸事件产生的,故无论是哪一种文本捕获操作,均可以通过调用操作系统功能接口完成键盘、鼠标或触摸事件产生的文本捕获操作。以文本选中操作为例,可以在鼠标抬起的时刻检测是否有文字被选中,若有选中文本,就可以调用该应用程序环境提供的功能接口将选中的文本读出来。
在具体实现中,可由寄宿程序监测用户在宿主程序环境中捕获的文本;并当所述捕获的文本中有字符落入生僻字符集合时,提示所述落入生僻字符集合的字符的相关信息。
宿主程序和寄宿程序为本技术领域内的概念,在此进行原理性的说明。其中,宿主程序可用于在计算机环境下,提供寄宿程序赖以生存的软件环境也即宿主环境(hostenvironment),同时,宿主程序还可以动态加载寄宿程序提供的DLL(动态链接库,DynamicLink Library),以动态加载外部功能。
在实际中,寄宿程序提供的DLL可以包括DirectX(图像绘制加速引擎),windows提供的WinSock2(网络操作链接库),Common Control(windows标准控件库),输入法提供的输入法编辑器链接库(如存放在c:\windows\system32下的SogouPy.ime),360安全卫士提供的DLL等等。下面主要以输入法为寄宿程序的例子进行说明,其它寄宿程序请相互参照即可。
监控获取方案2、
监控获取方案2的实现过程具体可以包括:通过监控用户的剪贴板,获取用户的剪贴板中最新的文本内容,所述最新的文本内容为用户在应用程序环境中捕获的文本。
剪贴板是一段可连续的。可随存放信息的大小而变化的内存空间,用来临时存放交换信息,其内置在操作系统中,并且使用操作系统的内部资源RAM(随机存储器,randomaccess memory)或虚拟内存来临时保存剪切和复制的信息,可以存放的信息种类是多种多样的,如文本、图片等等。剪切或复制时保存在剪贴板上的信息,可被再次剪切或复制的信息覆盖。
监控获取方案2关注剪贴板中的文本内容,由于用户在应用程序环境中执行复制或剪切操作时,复制或剪切的相关文本内容就保存在操作系统的剪贴板上,故输入法只要通过操作系统提供的接口就可以直接读取剪贴板中的文本内容。并且,由于剪贴板中的文本内容随着用户的复制或剪切操作而变化,故监控获取方案2获取用户的剪贴板中最新的文本内容能够具有实时性。
依据上述监测用户在应用程序环境中捕获的文本的方案,本申请的用户在应用程序环境中捕获的文本主要指与用户的文本捕获操作相应的文本,具体可以包括选中的文本、复制的文本、剪切的文本,以及其他由用户标识的能够与其他内容区别开来的部分文本等等。可以理解,上述监测用户在应用程序环境中捕获的文本的方案并不作为本申请的应用限制,实际上,任意的能够监测用户在应用程序环境中捕获的文本的方案都是可行的。
综上,本申请实施例当用户捕获的文本中有字符落入生僻字符集合时,提示所述落入生僻字符集合的字符的相关信息。对于用户而言,其不需要现有技术中借助其他工具等额外甚至复杂的操作、就可以根据提示内容学习获得所述落入生僻字符集合的字符的相关信息;这样,在用户捕获生僻字的情形下,本申请可以向用户提供学习过程,增加用户下次输入该生僻字的便捷性;并且,只要用户捕获了生僻字,本申请可以向用户提供数次的学习过程,直至用户能够在不借助其它工具等额外甚至复杂的操作的前提下输入该生僻字;总之,本申请能够增加用户输入生僻字符的便捷性。
本申请的生僻字符集合主要用于存储生僻字符和生僻字符的相关信息,这里的生僻字符主要可以包括各种文字,如汉字、英文、日文、韩文等等,下面主要以汉字为例进行说明,其它文字请相互参照即可。
在本申请的一种应用示例中,可以将所述捕获的文本中的所有单个字或单词(无特殊说明,本文的单词均针对英文而言,单词与单个词的区别在于,单词针对英文,单个词针对汉字)都取出来,与生僻字符集合中存储的所有生僻字符挨个进行比较,若发现有相同的,就可认为该单个字或单词落入生僻字符集合。
在具体实现中,生僻字符的相关信息可以作为生僻字符的属性信息进行存储。在本申请的一种优选实施例中,所述生僻字符的相关信息具体可以包括读音、部首、笔画、释义、常用组词、便捷输入方法信息中的一种或多种。将所述生僻字符的相关信息提供给用户,主要用于用户对相应的生僻字进行学习,以加深用户对该生僻字的认知能力,从而增加以后输入或使用该生僻字的便捷性。
生僻字符又称冷僻字符,指不常见的或人们不熟悉的汉字、英文等字符。本申请的一种优选实施例中,可以通过如下的几种方案构建生僻字符集合:
构建方案1、
构建方案1的实现过程具体可以包括:对字符的使用频率进行统计,收集统计结果符合对应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合。
通常来说,字符的使用频率越低,则可以认为相应的汉字或单词越难以辨认和记忆,越罕见,越生僻。故构建方案1在拼音输入和/或字形输入等各种输入环境下收集使用频率符合对应的生僻属性条件的字符,并作为生僻字符进行收集。这里对应的生僻属性条件是指与统计对象(本构建方案中为字符的使用频率)、具体采用的统计方法、和/或统计环境等相适应的条件。
以拼音输入法为例,现有的词库中存储有大量的汉字,如果一个汉字在拼音输入法中的使用频率非常低,则可以认为该汉字为生僻字;或者,如果某个汉字在字形输入(例如基于字形的输入法)中应用,且该汉字在基于字形的输入法中的使用频率很低,则也可以认为该汉字为生僻字。也即,在拼音输入和/或字形输入等各种输入环境下收集使用频率符合相应的生僻属性条件的字符,即可得到生僻字符。
需要说明的是,关于使用频率的统计环境,其可以包括某字符的任意一种或多种存在环境,例如,可以统计某字符在拼音输入或字形输入等一种输入法中的使用频率,也可以统计某字符在拼音输入和字形输入等多种输入法中的使用频率,或者,统计某字符在某种输入软件中的使用频率,或者,还可以统计某字符在某词典中的使用频率等等。
在本申请的一种应用示例中,可以通过如下步骤分析统计得到某个字符在某种统计环境中的使用频率:分别统计该统计环境中每个字符的使用次数,然后以每个字符的使用次数与所有字符的使用次数的比值作为相应字符的使用频率。另外,所述统计可以加上时间的因素等等,也即,字符在统计环境中的使用频率可以随时间不断变化。总之,本申请对具体的分析统计得到某个字符在某种统计环境中的使用频率的方法不加以限制。
另外,与采用的统计方式相应,构建方案1可以采用相对应的生僻属性条件来判定使用频率的高低,例如,一种与构建方案1相对应的生僻属性条件的示例可以为依据拼音输入和/或字形输入中字符的使用频率预置的条件。
参照表1,示出了本申请一种与构建方案1相应的生僻属性条件的示例,其具体可以包括字符的输入环境、字符的统计范围和相应的生僻属性条件等。
表1
当然,表1所示的生僻属性条件中的第一阈值、第二阈值可依据不同的统计环境预置得到;另外,除了数值外,还可以设置其它的生僻属性条件,例如,可以对各字符在某统计环境中的使用频率进行从小到大的排序,排在前面的M个字符即为符合生僻属性条件的字符等等。总之,本申请可以依据拼音输入和/或字形输入中字符的使用频率预置各种生僻属性条件,本申请对具体的生僻属性条件不加以限制。
构建方案2、
构建方案2的实现过程具体可以包括:收集手写输入和/或拆分输入中的字符,作为生僻字符保存至生僻字符集合。
由于拼音输入法的拆分输入模式就是为方便输入生僻字而产生的,那么如果某个汉字在拆分输入中应用,则可以认为该汉字为生僻字;同理,如果遇到不知道读音的字,用户通常去手写输入软件中输入该字,因此,如果某个汉字在手写输入(例如手写输入软件)中应用,则也可以认为该汉字为生僻字。
为了增加字符收集的严格性,在构建方案2的另外一些实施例中,还可以设置与构建方案2相应的生僻属性条件,也即,收集手写输入和/或拆分输入中符合对应的生僻属性条件的字符,作为生僻字符保存至生僻字符集合。在实际应用中,可以采用如下生僻属性条件中的一种或多种实施构建方案2:
依据字符的使用频率预置的条件;
依据字符的笔画数目或者单词的字母长度预置的条件;
对搜索引擎的搜索记录中记录的单个字或单个词进行分析统计,并依据分析统计结果预置的条件。
需要说明的是,构建方案1和构建方案2均可采用依据字符的使用频率预置的条件,但由于构建方案2中的字符在手写输入和/或拆分输入中出现,故可以预置比构建方案1更为宽松的“依据字符的使用频率预置的条件”,例如,构建方案1的“依据字符的使用频率预置的条件”为“字符在拼音输入法中的使用频率小于0.001”,那么,构建方案2的“依据字符的使用频率预置的条件”为“字符在拼音输入法中的使用频率小于0.01”即可。
构建方案3、
构建方案3的实现过程具体可以包括:对字符的笔画数目或者单词的字母长度进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合。
通常,汉字的笔画数目越多,单词的字母长度越长,则认为相应的汉字或单词越难以辨认和记忆,越罕见,越生僻。故构建方案3可以依据字符的笔画数目或者字母长度预置相应的生僻属性条件,例如,汉字的笔画数目大于20,单词的字母数目大于15,等等。
作为构建方案3的引申方案,本申请还可以对字符的难度系数进行分析统计,并将分析统计结果符合相应的生僻属性条件的字符进行收集。这里的难度系数的衡量因素可以包括笔画数目、字母长度等等;相应的生僻属性条件也可以依据字符的难度系数确定。
在具体实现中,除了依据字符的笔画数目或者单词的字母长度预置的条件外,与构建方案3相应的生僻属性条件还可以包括如下条件中的一种或多种:依据字符的使用频率预置的条件,对搜索引擎的搜索记录中记录的单个字或单个词进行分析统计,并依据分析统计结果预置的条件。
构建方案4、
构建方案4的实现过程具体可以包括:对搜索引擎的搜索记录中记录的单个字或单个词进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合。
依据用户行为习性的第二种,用户通常会将不认识的字(生僻字)单独复制下来去搜索引擎查询该字的读音;搜索引擎中会有很多类似的搜索记录,如“X字怎么念”、“X是什么意思”等等;故构建方案3可以对类似的搜索记录进行分析,得到搜索记录中的相关字符(如X)。
在具体实现中,与构建方案4相应的生僻属性条件可以为空条件,也即,搜索记录中的相关字符(如X)可直接作为生僻字符进行收集;与构建方案4相应的生僻属性条件还可以为搜索记录中的相关字符(如X)的记录频率(例如被用户查询了多少次);与构建方案4相应的生僻属性条件还可以包括如下条件中的一种或多种:依据字符的使用频率预置的条件,依据字符的笔画数目或者字母长度预置的条件。
以上对构建生僻字符集合的几种方案进行了详细介绍,可以理解,本领域技术人员可以根据需要使用上述几种方案中的一种或多种,或者,还可以根据需要使用其它构建生僻字符集合的方案,本申请对具体的构建生僻字符集合的方法不加以限制。
在本申请的一种应用示例中,可以从字符信息库中获取所述落入生僻字符集合的字符的相关信息。其中,字符信息库可用来存储字符及相关信息,字符信息库可为具有上述功能的各种信息库,如电子字典、百科词库等等,也可由本领域技术人员根据需求预置得到。
在本申请的一种优选实施例中,作为提示内容的所述落入生僻字符集合的字符的相关信息具体可以包括读音、部首、笔画、释义、常用组词、便捷输入方法信息中的一种或多种。这样,用户就可以根据提示内容学习获得所述落入生僻字符集合的字符的相关信息;也即,在用户捕获生僻字的情形下,本申请可以向用户提供学习过程,增加用户下次输入该生僻字的便捷性。
本申请实施例可以采用各种方案展现所述提示内容。
本申请对于所述提示内容的展现位置是不加以限制的,该展现位置可以为本领域技术人员认为的屏幕中的任意合适位置。例如,本领域技术人员可以应用程序环境为定位依据,将该展现位置设置在应用程序环境中的合适位置;又如,本领域技术人员可以输入法焦点或鼠标手势为定位依据,将该展现位置设置在输入法焦点附近或者鼠标手势附近等等。
为了增加提示内容的醒目性,在本申请的一种优选实施例中,提示所述落入生僻字符集合的字符的相关信息的步骤可以为,在所述捕获的文本相关联的位置提示所述落入生僻字符集合的字符的相关信息。由于所述捕获的文本相关联的位置在用户视线内,故用户可以及时醒目地看到所述提示内容。
为了增加用户的记忆效果,在本申请的另一种优选实施例中,提示所述落入生僻字符集合的字符的相关信息的步骤可以为,采用弹窗或浮动框方式提示所述落入生僻字符集合的字符的相关信息。
其中,可由寄宿程序实现弹窗方式的提示,例如,参照图3示出了本申请一种输入法采用弹窗方式提示生僻字信息的示例,该弹窗可以位于屏幕的任意位置;该弹窗提供有关闭按钮,可依据用户对该关闭按钮的操作而关闭,或者,该弹窗可被设置具有一定生命周期(如5秒),在生命周期结束后该弹窗自动退出。
在具体实现中,可通过调用应用程序的接口来在应用程序界面上实现浮动框(Tooltip)形式的提示,参照图4示出了本申请一种输入法采用浮动框方式提示生僻字信息的示例,该浮动框通常位于所述捕获的文本相关联的位置,优选地位于生僻字的相关联的位置。
需要说明的是,上述读音、部首、笔画、释义、常用组词、便捷输入方法信息并不作为所述落入生僻字符集合的字符的相关信息的限制,以及,弹窗、浮动框方式也不作为提示方式的限制。
由于本申请监测用户在应用程序环境中捕获的文本,处理速度非常快,故本申请几乎能够在用户在应用环境中捕获文本的同时提示所述落入生僻字符集合的字符的相关信息,这样,用户看到提示内容后,就不必去执行原来常用的三种可能操作;因此本申请不需要现有技术中借助其他工具等额外甚至复杂的操作、就可以向用户提示所述落入生僻字符集合的字符的相关信息;这样,在用户捕获生僻字的情形下,本申请可以向用户提供学习过程,增加用户下次输入该生僻字的便捷性。
参照图5,示出了本申请一种生僻字符信息的提示方法实施例2的流程图,具体可以包括:
步骤501、构建生僻字符集合;
步骤502、监测用户在应用程序环境中捕获的文本;
步骤503、当所述捕获的文本字数不超过字数阈值,且所述捕获的文本中有字符落入生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息;
步骤504、向用户提示所述落入生僻字符集合的字符的相关信息。
有些情况下用户捕获文本的最终目的是输入生僻字,有些情况下用户捕获文本并不是为了最终输入生僻字,例如,当用户在复制大段文本时只是想转移这大段文本。
因此,为了避免本申请提示内容对用户的干扰,本实施例预置字数阈值,当所述捕获的文本字数不超过字数阈值时才认为用户捕获文本的最终目的是输入生僻字,此时,才会触发提示功能。
关于如何预置所述字数阈值,在实际中,可以首先根据常规经验取一个初始值,然后根据用户反馈对该初始值进行调整。
例如,先初始将字数阈值定为10,在本申请生僻字符信息的提示功能投入使用后,用户可能抱怨经常在执行复制操作的时候系统性能受影响或弹出本不想要的提示窗,再或者通过统计数据可能得到在所有的成功捕获文本操作中,只有非常小的比例是含有生僻字的,这些都可以说明这个字数阈值设的太大了,影响了用户的正常操作,那么下次就可以将这个字数阈值调小点;总之,本申请可以根据需要不断调整字数阈值的数值。
参照图6,示出了本申请一种生僻字符信息的提示方法实施例3的流程图,具体可以包括:
步骤601、构建生僻字符集合;
步骤602、监测用户在应用程序环境中捕获的文本;
步骤603、当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息;
步骤604、向用户提示所述落入生僻字符集合的字符的相关信息;
步骤605、当所述捕获的文本中未有字符落入生僻字符集合时,客户端将所述捕获的文本中的全部或部分字符上传至服务器端;
步骤606、服务器端分析客户端上传的字符的生僻属性,并在分析得到的生僻属性符合生僻属性条件时,将所述字符保存至所述生僻字符集合;
步骤607、服务器端将所述生僻字符集合同步至客户端。
当前构建的生僻字符集合可能不能完全满足全部用户的需求,例如某些用户所认为的生僻字很有可能不在输入法构建的生僻字符集合中,因此,需要有一种对生僻字符集合进行扩展和同步的机制。
本实施例主要用于提供一种对生僻字符集合进行扩展和同步的机制,该机制由客户端发起,服务器端实现,具体而言,服务器端通过一个字符的生僻属性是否符合生僻属性条件来判定一个字符是否为生僻字符,以对生僻字符集合进行扩展,并同步至所有的客户端。
在实际应用中,客户端可以通过一定的筛选机制确定将所述捕获的文本中的全部或部分字符送至服务器端。例如,虽然所述捕获的文本中未有字符落入生僻字符集合,但仍有字符落入常用词库(这里的常用词库用于存储一些常用的字符)或者普通词库(这里的普通词库为输入法的普通词库,该普通词库未对字符的生僻属性加以区分)中,故此时客户端可以将所述捕获的文本中未落入常用词库或普通词库的字符送至服务器端。
在用户捕获的文本中,若只有单个字,则该单个字是生僻字符的可能性更高(用户遇到不认识的字的时候很可能将该字复制下来再去搜索或粘贴到其他地方),而若非单个字,生僻字的可能性较低。故为了达到学习的目的而又不至于耗费太多资源在非生僻字上,在本申请的一种优选实施例中,可以只选择捕获到的单个字或单个词送至服务器端进行学习。相应地,所述方法还可以包括:当所述捕获的文本中未有字符落入生僻字符集合,且所述捕获的文本为单个字或单个词时,客户端将所述单个字或单个词上传至服务器端。
在本申请的一种优选实施例中,服务器端可以采用如下步骤中的一种或多种来分析客户端上传的字符的生僻属性:
统计客户端上传的字符的使用频率;
分析客户端上传的字符的笔画数目或者字母长度;
统计客户端上传的字符在搜索引擎的搜索记录中的出现频率。
在本申请的一种优选实施例中,所述服务器端生僻属性条件可以包括如下条件中的一种或多种,对应于服务器对上传字符生僻属性的分析方式:依据字符的使用频率预置的条件;依据字符的笔画数目或者字母长度预置的条件;和对搜索引擎的搜索记录中出现的单个字或单个词进行分析统计,并依据分析统计结果预置的条件。本领域技术人员可以根据需要单独或联合上述生僻属性条件,或者采用其它的生僻属性条件,本申请对此不加以限制。
为使本领域技术人员更好地理解本申请,以下给出本申请一种生僻字符信息的提示方法实施例4,参照图7所示的流程图,具体可以包括:
步骤701、构建生僻字符集合;
步骤702、监测用户在应用程序环境中捕获的文本;
步骤703、判断所述捕获的文本字数是否在预设的字数阈值的范围内,若是,则执行步骤704,否则执行步骤710;
步骤704、判断所述捕获的文本中是否有字符落入生僻字符集合中,若是,则执行步骤705,否则执行步骤707;
步骤705、获取所述落入生僻字符集合的字符的相关信息;
步骤706、提示所述落入生僻字符集合的字符的相关信息;
步骤707、判断所述捕获的文本是否为单个字,若是,则执行步骤708,否则,执行步骤710;
步骤708、将该单个字上传至服务器端;
步骤709、服务器端分析客户端上传的字符的生僻属性,并在分析得到的生僻属性符合对应的生僻属性条件时,将相应的字符保存至所述生僻字符集合,并将所述生僻字符集合同步至客户端;
步骤710、不做任何操作直接退出生僻字符信息提示流程。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述即可。
并且,本领域技术人员易于想到的是:上述实施例1-实施例4任意组合应用都是可行的,故上述实施例1-实施例4之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。
与前述方法实施例相应,本申请还公开了一种生僻字符信息的提示装置,参照图8所示的结构图,具体可以包括:
构建模块801,用于构建生僻字符集合;
监测模块802,用于监测用户在应用程序环境中捕获的文本;
获取模块803,用于当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息;及
提示模块804,用于向用户提示所述落入生僻字符集合的字符的相关信息。
在本申请的一种优选实施例中,所述获取模块803可以进一步包括:
信息获取子模块,用于当所述捕获的文本字数不超过字数阈值,且所述捕获的文本中有字符落入生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息。
在本申请的另一种优选实施例中,所述捕获的文本具体可以包括选中的文本、复制的文本或者剪切的文本。
在本申请的再一种优选实施例中,所述构建模块801可以进一步包括:
第一收集子模块,用于对字符的使用频率进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或
第二收集子模块,用于收集手写输入和/或拆分输入的字符,作为生僻字符保存至生僻字符集合;和/或
第三收集子模块,用于收集手写输入和/或拆分输入中符合对应的生僻属性条件的字符,作为生僻字符保存至生僻字符集合;和/或
第四收集子模块,用于对字符的笔画数目或者单词的字母长度进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或
第五收集子模块,用于对搜索引擎的搜索记录中记录的单个字或单个词进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合。
在本申请的一种优选实施例中,所述监测模块802可以进一步包括:
操作监测子模块,用于监测用户在应用程序环境中执行的文本捕获操作;
调用获取子模块,用于通过调用该应用程序环境提供的功能接口,获取所述文本捕获操作所捕获的文本。
在本申请实施例中,优选的是,所述文本捕获操作具体可以包括文本选中操作、文本复制操作或者文本剪切操作。
在本申请的另一种优选实施例中,所述监测模块802可以进一步包括:
监控获取子模块,用于通过监控用户的剪贴板,获取用户的剪贴板中最新的文本内容,所述最新的文本内容为用户在应用程序环境中捕获的文本。
在本申请实施例中,优选的是,所述落入生僻字符集合的字符的相关信息具体可以包括读音、部首、笔画、释义、常用组词、便捷输入方法信息中的一种或多种。
在本申请实施例中,优选的是,所述提示模块804可具体用于采用弹窗或浮动框方式提示所述落入生僻字符集合的字符的相关信息;
所述提示模块804,还可具体用于在所述捕获的文本相关联的位置提示所述落入生僻字符集合的字符的相关信息。
在本申请实施例中,优选的是,所述装置还可以包括:
上传模块,用于当所述捕获的文本中未有字符落入生僻字符集合时,客户端将所述捕获的文本中的全部或部分字符上传至服务器端;
分析保存模块,位于服务器端,用于分析客户端上传的字符的生僻属性,并在分析得到的生僻属性符合生僻属性条件时,将所述字符保存至所述生僻字符集合;
同步模块,位于服务器端,用于将所述生僻字符集合同步至客户端。
在本申请的一种优选实施例中,所述上传模块可以进一步包括:
单字上传子模块,用于当所述捕获的文本中未有字符落入生僻字符集合,且所述捕获的文本为单个字或单个词时,客户端将所述单个字或单个词上传至服务器端。
在本申请实施例中,优选的是,所述生僻属性条件具体可以包括:
依据字符的使用频率预置的条件;和/或
依据字符的笔画数目或者单词的字母长度预置的条件;和/或
对搜索引擎的搜索记录中记录的单个字或单个词进行分析统计,并依据分析统计结果预置的条件。
对于装置实施例而言,由于其与方法实施例基本相似,故描述的比较简单,相似的地方请相互参照即可。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
以上对本申请所提供的一种生僻字符信息的提示方法和装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (22)

1.一种生僻字符信息的提示方法,其特征在于,包括:
构建生僻字符集合;
监测用户在应用程序环境中捕获的文本;
当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息;
向用户提示所述落入生僻字符集合的字符的相关信息;
当所述捕获的文本中未有字符落入生僻字符集合时,客户端将所述捕获的文本中的全部或部分字符上传至服务器端;
服务器端分析客户端上传的字符的生僻属性,并在分析得到的生僻属性符合生僻属性条件时,将所述字符保存至所述生僻字符集合;
服务器端将所述生僻字符集合同步至客户端。
2.如权利要求1所述的方法,其特征在于,所述当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息进一步包括:
当所述捕获的文本字数不超过字数阈值,且所述捕获的文本中有字符落入生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息。
3.如权利要求1或2所述的方法,其特征在于,所述捕获的文本包括选中的文本、复制的文本或者剪切的文本。
4.如权利要求1所述的方法,其特征在于,通过如下步骤构建生僻字符集合:
对字符的使用频率进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或
收集手写输入和/或拆分输入的字符,作为生僻字符保存至生僻字符集合;和/或
收集手写输入和/或拆分输入中符合对应的生僻属性条件的字符,作为生僻字符保存至生僻字符集合;和/或
对字符的笔画数目或者单词的字母长度进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或
对搜索引擎的搜索记录中记录的单个字或单个词进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合。
5.如权利要求1或2所述的方法,其特征在于,所述监测用户在应用程序环境中捕获的文本的步骤,包括:
监测用户在应用程序环境中执行的文本捕获操作;
通过调用该应用程序环境提供的功能接口,获取所述文本捕获操作所捕获的文本。
6.如权利要求5所述的方法,其特征在于,所述文本捕获操作包括文本选中操作、文本复制操作或者文本剪切操作。
7.如权利要求1或2所述的方法,其特征在于,所述监测用户在应用程序环境中捕获的文本的步骤,包括:
通过监控用户的剪贴板,获取用户的剪贴板中最新的文本内容,所述最新的文本内容为用户在应用程序环境中捕获的文本。
8.如权利要求1所述的方法,其特征在于,所述落入生僻字符集合的字符的相关信息包括读音、部首、笔画、释义、常用组词、便捷输入方法信息中的一种或多种。
9.如权利要求1所述的方法,其特征在于,所述提示所述落入生僻字符集合的字符的相关信息的步骤为,采用弹窗或浮动框方式提示所述落入生僻字符集合的字符的相关信息;或
所述提示所述落入生僻字符集合的字符的相关信息的步骤为,在所述捕获的文本相关联的位置提示所述落入生僻字符集合的字符的相关信息。
10.如权利要求9所述的方法,其特征在于,所述当所述捕获的文本中未有字符落入生僻字符集合时,客户端将所述捕获的文本中的全部或部分字符上传至服务器端进一步包括:
当所述捕获的文本中未有字符落入生僻字符集合,且所述捕获的文本为单个字或单个词时,客户端将所述单个字或单个词上传至服务器端。
11.如权利要求1、4或10所述的方法,其特征在于,所述生僻属性条件包括:
依据字符的使用频率预置的条件;和/或
依据字符的笔画数目或者单词的字母长度预置的条件;和/或
对搜索引擎的搜索记录中记录的单个字或单个词进行分析统计,并依据分析统计结果预置的条件。
12.一种生僻字符信息的提示装置,其特征在于,包括:
构建模块,用于构建生僻字符集合;
监测模块,用于监测用户在应用程序环境中捕获的文本;
获取模块,用于当所述捕获的文本中有字符落入所述生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息;
提示模块,用于向用户提示所述落入生僻字符集合的字符的相关信息;
上传模块,用于当所述捕获的文本中未有字符落入生僻字符集合时,客户端将所述捕获的文本中的全部或部分字符上传至服务器端;
分析保存模块,位于服务器端,用于分析客户端上传的字符的生僻属性,并在分析得到的生僻属性符合生僻属性条件时,将所述字符保存至所述生僻字符集合;及
同步模块,位于服务器端,用于将所述生僻字符集合同步至客户端。
13.如权利要求12所述的装置,其特征在于,所述获取模块进一步包括:
信息获取子模块,用于当所述捕获的文本字数不超过字数阈值,且所述捕获的文本中有字符落入生僻字符集合时,获取所述落入生僻字符集合的字符的相关信息。
14.如权利要求12或13所述的装置,其特征在于,所述捕获的文本包括选中的文本、复制的文本或者剪切的文本。
15.如权利要求12所述的装置,其特征在于,所述构建模块包括:
第一收集子模块,用于对字符的使用频率进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或
第二收集子模块,用于收集手写输入和/或拆分输入的字符,作为生僻字符保存至生僻字符集合;和/或
第三收集子模块,用于收集手写输入和/或拆分输入中符合对应的生僻属性条件的字符,作为生僻字符保存至生僻字符集合;和/或
第四收集子模块,用于对字符的笔画数目或者单词的字母长度进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合;和/或
第五收集子模块,用于对搜索引擎的搜索记录中记录的单个字或单个词进行统计,收集统计结果符合相应的生僻属性条件的字符,并作为生僻字符保存至生僻字符集合。
16.如权利要求12或13所述的装置,其特征在于,所述监测模块包括:
操作监测子模块,用于监测用户在应用程序环境中执行的文本捕获操作;
调用获取子模块,用于通过调用该应用程序环境提供的功能接口,获取所述文本捕获操作所捕获的文本。
17.如权利要求16所述的装置,其特征在于,所述文本捕获操作包括文本选中操作、文本复制操作或者文本剪切操作。
18.如权利要求12或13所述的装置,其特征在于,所述监测模块包括:
监控获取子模块,用于通过监控用户的剪贴板,获取用户的剪贴板中最新的文本内容,所述最新的文本内容为用户在应用程序环境中捕获的文本。
19.如权利要求12所述的装置,其特征在于,所述落入生僻字符集合的字符的相关信息包括读音、部首、笔画、释义、常用组词、便捷输入方法信息中的一种或多种。
20.如权利要求12所述的装置,其特征在于,所述提示模块,具体用于采用弹窗或浮动框方式提示所述落入生僻字符集合的字符的相关信息;或
所述提示模块,具体用于在所述捕获的文本相关联的位置提示所述落入生僻字符集合的字符的相关信息。
21.如权利要求12所述的装置,其特征在于,所述上传模块进一步包括:
单字上传子模块,用于当所述捕获的文本中未有字符落入生僻字符集合,且所述捕获的文本为单个字或单个词时,客户端将所述单个字或单个词上传至服务器端。
22.如权利要求12、15、或21所述的装置,其特征在于,所述生僻属性条件包括:
依据字符的使用频率预置的条件;和/或
依据字符的笔画数目或者单词的字母长度预置的条件;和/或
对搜索引擎的搜索记录中记录的单个字或单个词进行分析统计,并依据分析统计结果预置的条件。
CN201210164861.4A 2012-05-24 2012-05-24 一种生僻字符信息的提示方法和装置 Active CN103425257B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210164861.4A CN103425257B (zh) 2012-05-24 2012-05-24 一种生僻字符信息的提示方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210164861.4A CN103425257B (zh) 2012-05-24 2012-05-24 一种生僻字符信息的提示方法和装置

Publications (2)

Publication Number Publication Date
CN103425257A CN103425257A (zh) 2013-12-04
CN103425257B true CN103425257B (zh) 2017-03-15

Family

ID=49650119

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210164861.4A Active CN103425257B (zh) 2012-05-24 2012-05-24 一种生僻字符信息的提示方法和装置

Country Status (1)

Country Link
CN (1) CN103425257B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105446963B (zh) * 2014-05-26 2019-03-08 阿里巴巴集团控股有限公司 一种电子数据转移方法和服务器
CN105183844A (zh) * 2015-09-06 2015-12-23 国家基础地理信息中心 一种基础地理信息数据中生僻字库实现方法
CN105260035A (zh) * 2015-11-20 2016-01-20 北京奇虎科技有限公司 一种自造字的输入方法和装置
CN106774985A (zh) * 2016-12-30 2017-05-31 维沃移动通信有限公司 一种文字处理方法及移动终端
CN108846367B (zh) * 2018-06-25 2019-08-30 掌阅科技股份有限公司 生僻字处理方法、计算设备及计算机存储介质
CN110728111B (zh) * 2018-07-17 2024-06-25 珠海金山办公软件有限公司 一种文档内容的乱码修复方法、装置、终端设备和服务器
CN108958780B (zh) * 2018-09-30 2021-05-18 上海掌门科技有限公司 一种用于呈现寄宿程序的更新信息的方法与设备
CN109918638B (zh) * 2018-12-05 2023-03-24 国网浙江桐乡市供电有限公司 一种网络数据监测方法
CN112765445A (zh) * 2021-01-26 2021-05-07 维沃移动通信有限公司 生僻字识别方法及装置
CN113139369A (zh) * 2021-05-07 2021-07-20 仲恺农业工程学院 文档疑难杂字智能注音方法、系统、设备及介质
CN115509373A (zh) * 2022-10-11 2022-12-23 北京数科网维技术有限责任公司 一种改进冷僻字输入的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102346557A (zh) * 2010-07-28 2012-02-08 腾讯科技(深圳)有限公司 一种输入法和输入法系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021828A (zh) * 2007-01-23 2007-08-22 朱明� 汉语电子大字典
CN101930291B (zh) * 2009-06-26 2012-11-28 罗宇翔 一种汉字简易输入、查找和学习方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102346557A (zh) * 2010-07-28 2012-02-08 腾讯科技(深圳)有限公司 一种输入法和输入法系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
搜狗拼音输入法技巧;高娟等;《电脑知识与技术》;20110131;第7卷(第3期);第690-691页 *

Also Published As

Publication number Publication date
CN103425257A (zh) 2013-12-04

Similar Documents

Publication Publication Date Title
CN103425257B (zh) 一种生僻字符信息的提示方法和装置
JP6431119B2 (ja) 携帯式端末設備における摺接操作による入力補助制御のシステム及び方法
US11651149B1 (en) Event selection via graphical user interface control
US9501540B2 (en) Interactive visualization of big data sets and models including textual data
EP2833271A1 (en) Multimedia question and answer system and method
US10366154B2 (en) Information processing device, information processing method, and computer program product
US9720912B2 (en) Document management system, document management method, and document management program
CN109726712A (zh) 文字识别方法、装置及存储介质、服务器
WO2015061046A2 (en) Method and apparatus for performing topic-relevance highlighting of electronic text
CN109165386A (zh) 一种中文零代词消解方法及系统
CN110826302A (zh) 调查问卷创建方法、装置、介质及电子设备
CN110287313A (zh) 一种风险主体的确定方法及服务器
CN103324742B (zh) 推荐关键词的方法和设备
CN106537387B (zh) 检索/存储与事件相关联的图像
CN110119441A (zh) 基于汉字结构的文字点选验证码识别与填入方法
CN112269475A (zh) 文字显示方法、装置和电子设备
CN104881428B (zh) 一种信息图网页的信息图提取、检索方法和装置
CN109918641A (zh) 文章主题成分分解方法、装置、设备和存储介质
CN109634436A (zh) 输入法的联想方法、装置、设备及可读存储介质
CN110490237A (zh) 数据处理方法、装置、存储介质及电子设备
CN109697676A (zh) 基于社交群的用户分析及应用方法和装置
CN105930487A (zh) 应用于移动终端的题目搜索方法及装置
CN105354280A (zh) 一种基于社会媒体平台的社会事件的跟踪和演变方法
CN106919593B (zh) 一种搜索的方法和装置
US20130230219A1 (en) Systems and methods for efficient comparative non-spatial image data analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant