CN103927220A - 一种客户端中输入法的自适应调整方法及装置 - Google Patents

一种客户端中输入法的自适应调整方法及装置 Download PDF

Info

Publication number
CN103927220A
CN103927220A CN201310012754.4A CN201310012754A CN103927220A CN 103927220 A CN103927220 A CN 103927220A CN 201310012754 A CN201310012754 A CN 201310012754A CN 103927220 A CN103927220 A CN 103927220A
Authority
CN
China
Prior art keywords
input method
client
model
strategy
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310012754.4A
Other languages
English (en)
Inventor
黄艺华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu International Technology Shenzhen Co Ltd
Original Assignee
Baidu International Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu International Technology Shenzhen Co Ltd filed Critical Baidu International Technology Shenzhen Co Ltd
Priority to CN201310012754.4A priority Critical patent/CN103927220A/zh
Publication of CN103927220A publication Critical patent/CN103927220A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提出了一种客户端中输入法的自适应调整方法,包括以下步骤:在客户端中加载输入法程序;输入法程序获得客户端的当前资源状况;输入法程序根据客户端的当前资源状况从多个模型参数和/或多个执行策略中选择对应的模型参数和/或执行策略。本发明还提出了一种客户端中输入法的自适应调整装置。本发明中,输入法程序根据客户端的当前资源状况自动调整输入功能和效果,在性能和效果之间取得平衡。

Description

一种客户端中输入法的自适应调整方法及装置
技术领域
本发明涉及客户端用户交互技术领域,特别涉及一种客户端中输入法的自适应调整方法及装置。
背景技术
输入法是手机等客户端上的必备工具软件,是客户端上使用频率最高的软件之一。现在,随着技术的发展,输入法的各种附加功能也越来越强大。但是,输入法的功能增强也经常伴随着对内存和CPU等系统资源的消耗增大。移动设备的型号多种多样,不同设备的计算资源,包括处理能力、内存容量、以及网络访问速度等等存在巨大差异。甚至同一设备在不同环境下可用的资源也会变化。传统技术中,作为手机等客户端上的常驻运行软件,输入法针对多种设备只有一套固定的处理流程和数据,一旦安装即不能改变。固定的处理流程和数据无法适应于所有设备,导致低端设备高负载,运行卡顿,同时高端设备的资源没有充分利用,没有达到最佳的精度效果。输入法的功能扩展和系统资源消耗的平衡已经成为开发者需要考虑的重要技术问题。
发明内容
本发明旨在至少在一定程度上解决上述技术问题之一或至少提供一种有用的商业选择。
为此,本发明的第一个目的在于提出一种客户端中输入法的自适应调整方法,使输入法程序根据客户端的当前资源状况自动调整输入功能和效果,在性能和效果之间取得平衡。本发明的第二个目的在于提出一种客户端中输入法的自适应调整装置。
为达到上述目的,本发明第一方面的实施例提出了一种客户端中输入法的自适应调整方法,包括以下步骤:在客户端中加载输入法程序,其中,所述输入法程序包括多个模型参数和/或多个执行策略;所述输入法程序获得所述客户端的当前资源状况;所述输入法程序根据所述客户端的当前资源状况从所述多个模型参数和/或多个执行策略中选择对应的模型参数和/或执行策略。
根据本发明实施例的客户端中输入法的自适应调整方法,根据客户端的当前资源状况自动调整输入功能和效果,平衡资源占用和输入效果的矛盾,在充分利用资源的前提下提供最优的候选效果。
在本发明的一个实施例中,所述模型参数包括N-gram模型和N-POS模型。
在本发明的一个实施例中,所述多个执行策略包括云输入策略、本地输入策略、多级别的使用数据策略、多级别的剪枝策略,以及多级别的缓存策略。
在本发明的一个实施例中,所述当前资源状况包括网络资源、运算资源和内存资源。
在本发明的一个实施例中,当所述网络资源处于第一网络资源状态时,所述客户端的输入法调取云输入策略;当所述网络资源处于第二网络资源状态时,所述客户端的输入法调取本地输入策略,其中,所述第一网络资源状态优于所述第二网络资源状态。
在本发明的一个实施例中,根据当前的运算资源状态,所述客户端的输入法调取所述N-gram模型或所述N-POS模型,并选择所述模型的阶数及所述使用数据策略的级别。
在本发明的一个实施例中,根据当前的内存资源状态,所述客户端的输入法调整所述剪枝策略及所述缓存策略的级别。
在本发明的一个实施例中,所述执行策略还包括多个额外功能策略,所述输入法程序根据所述客户端的当前资源状况调取所述多个额外功能策略中的一个或多个。
本发明第二方面的实施例提出了一种客户端中输入法的自适应调整装置,包括:加载模块,用于在客户端中加载输入法程序,其中,所述输入法程序包括多个模型参数和/或多个执行策略;获得模块,用于获得所述客户端的当前资源状况;控制模块,用于根据所述客户端的当前资源状况从所述多个模型参数和/或多个执行策略中选择对应的模型参数和/或执行策略。
根据本发明实施例的客户端中输入法的自适应调整装置,根据客户端的当前资源状况自动调整输入功能和效果,平衡资源占用和输入效果的矛盾,在充分利用资源的前提下提供最优的候选效果。
在本发明的一个实施例中,所述模型参数包括N-gram模型和N-POS模型。
在本发明的一个实施例中,所述多个执行策略包括云输入策略、本地输入策略、多级别的使用数据策略、多级别的剪枝策略及多级别的缓存策略。
在本发明的一个实施例中,所述当前资源状况包括网络资源、运算资源和内存资源。
在本发明的一个实施例中,当所述网络资源处于第一网络资源状态时,所述控制模块调取云输入策略;当所述网络资源处于第二网络资源状态时,所述控制模块调取本地输入策略,其中,所述第一网络资源状态优于所述第二网络资源状态。
在本发明的一个实施例中,根据当前的运算资源状态,所述控制模块调取所述N-gram模型或所述N-POS模型,并选择所述模型的阶数的所述使用数据策略及的级别。
在本发明的一个实施例中,根据当前的内存资源状态,所述控制模块调整所述剪枝策略及所述缓存策略的级别。
在本发明的一个实施例中,所述输入法执行策略还包括多个候选项额外功能策略,所述输入法程序根据所述客户端的当前资源状况调取所述多个额外功能策略中的一个或多个。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明一个实施例的客户端中输入法的自适应调整方法的流程图;
图2为本发明另一个实施例的输入法的自适应调整方法的流程图;
图3为本发明另一个实施例的客户端中输入法的自适应调整装置的示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
下面分别参考图1至图2对本发明实施例的客户端中输入法的自适应调整方法的流程进行描述。一般情况下,输入法的外观、附加功能等效果越强大,消耗的系统资源也越多,本发明的目的是实现消耗资源和输入法效果的平衡。本发明实施例中,输入法程序获取客户端的当前资源状况,并根据当前资源状况调整输入法的模型参数和执行策略,以达到在消耗资源不至于影响到用户正常使用的情况下,最大程度的提高输入法的各种效果。
如图1所示,根据本发明第一方面的实施例的客户端中输入法的自适应调整方法,包括以下步骤:
S101:在客户端中加载输入法程序。在本发明的实施例中,客户端优选为移动终端。
其中,输入法程序包括多个模型参数和/或多个执行策略。
具体地,模型参数包括输入法的语言统计模型及统计模型的参数,语言统计模型有智能分词,根据上文判断下文等情形等多种具体应用,其参数则用于控制语言模型的规模。具体地,模型参数包括:N-gram模型和N-POS模型等。输入法中,普遍使用马可夫(Markov)模型作为语言模型,如果用词作为马可夫链的状态,就是N-gram模型,如果用词类作为状态,就是N-POS模型。N-POS模型因为状态数少很多,所以比N-gram模型节省了海量的数据,但N-POS模型的分词、上下文匹配等具体应用的精度也比N-gram模型低。在实际应用中,往往把一部分关键的N-gram数据插值到N-POS模型,增加一定的数据量,使N-POS模型在这些方面的精度表现逼近N-gram。另一方面,马可夫链的阶数也是重要的参数。输入法中普遍采用1阶马可夫链,称为2元模型。N-gram和N-POS等模型的阶数,体现在候选对上文的相关度。对上文的相关度,是输入法智能程度的重要体现,例如对于同样的用户输入“lj”,对于不同的上文“阅读”、“网络”、“文件”,输入法可以智能地分别将“理解”、“连接”、“路径”设置于候选的首选词处,方便用户输入。增加模型的阶数可以增加精度,但同时也会大大增加数据量和计算量,消耗系统资源显著增加。在具体应用中,也会把高阶数据插值到低阶模型,以增加一定精度。在资源极度紧张时,使用0阶模型,即候选与上文无关,具体表现为:无论已输入什么不同的内容,当前输入同样的读音(编码),总是输出相同的候选。反之,在资源丰富的平台,模型的阶数增加,候选和上文相关,即在上文不同的情况下,输入相同的读音(编码)会输出不同的候选。而且理论上,以词/短语为单位,模型的阶数越多,候选关联上文的程度越大。
执行策略包括多级别的使用数据、多级别的剪枝策略、缓存策略、额外功能策略等。剪枝策略主要是对计算过程中进行剪枝的幅度。缓存策略主要是在计算中是否占用客户端内存为缓存,以及缓存大小。额外功能策略为输入法程序提供一些额外的词库和功能。在本发明的一个实施例中,额外功能策略包括:
1.增加细胞词库,增加覆盖率;
2.通过网络从服务器端获取候选,即采用云输入;
3.学习用户输入历史,输出用户输入过的词;
4.加入英文候选;
5.从网络更新新词热词等网络词库;
6.加入表情符号等特殊候选。
7.数量词特殊展示,例如①~⑨等特殊符号。
采用以上额外功能策略,可以更好地判断用户输入的意图,或者为用户输入提供更多功能选择。需要说明的是,以上执行策略示例只是为了便于说明,而不应理解为对本发明的限制。
S102:输入法程序获得客户端的当前资源状况。
当前资源状况包括网络资源、运算资源和内存资源。具体地,网络资源包括网络是否可达、网络带宽、网络延迟、丢包率等网络质量参数,运算资源包括客户端的CPU性能等,内存资源包括客户端的RAM内存和ROM内存等。
具体地,对当前资源状况的检测,检测遵循探测和反馈两个方向:
a)每隔一定的时间,系统主动调用设备及其操作系统提供的接口,获取关键资源的当前状态,如处理器负荷、内存使用量、网络类型和带宽等等。
b)同时系统通过反馈获取自身的运行情况,如一个完整处理周期的耗时、网络请求的延时、用户按键和上屏情况(反映键盘和触摸屏精度)等等。
S103:输入法程序根据客户端的当前资源状况从多个模型参数和/或多个执行策略中选择对应的模型参数和/或执行策略。
输入法程序根据客户端的资源状态、运算状态和内存状态,从多个模型参数和/或执行策略中选择对应的模型参数和/或执行策略。
各模型参数和执行策略的设置和消耗的资源及输入法效果相关。
a)计算量越大,应用的策略越复杂,需要的处理器时间和内存空间越大,同时候选精度越高。
b)使用更多的内存,可以提高精度,同时减少计算量,即减少处理器时间。
c)从云端服务器获取的信息越多,占用网络流量越大,受网络延迟影响越大,同时精度越高。
选择合适的模型参数及执行策略,以更好地判断用户的输入意图,从而保证输入法的输入精度。具体地,包括但并不仅限于如下情形:
1)当网络资源处于第一网络资源状态时,客户端的输入法调取云输入策略;当网络资源处于第二网络资源状态时,客户端的输入法调取本地输入策略,其中,第一网络资源状态的特征为满足网络带宽大于一定数值、且网络连接速度大于一定数值等,第二网络资源状态为网络资源不能满足第一网络资源状态上述特征时的状态。云输入策略中,智能计算对应用户输入内容的首选词的过程在云端实现;本地输入策略中,该过程在本地实现。
2)根据当前的运算资源状态时,客户端的输入法调取N-gram模型或N-POS模型;具体地,当前运算资源状态满足一定条件,例如客户端的CPU主频大于一定预设数值时,客户端的输入法调取N-gram模型,小于一定预设数值时,客户端的输入法调取N-POS模型,并根据CPU主频选择统计模型计算时的阶数及使用数据策略的级别,CPU主频越高时,计算模型的阶数越高,使用的数据越多。
3)根据当前的内存资源状态时,客户端的输入法调整剪枝策略及缓存策略的级别;具体地,输入法程序根据当前的可用RAM和可用ROM,调整剪枝策略及缓存策略的级别,可用RAM和可用ROM越多,剪枝策略越保守,缓存使用越多。
在实际实施例中,执行策略可能是上述一种或几种情形,或是几种情形的组合,例如,采取使用更多缓存的策略,则可以节省计算量,减少了输入法程序对运算资源的需求,间接上影响了统计模型及其阶数的选择。又例如,在具体场景中,采用如下所示不同的执行策略:
场景一:平台的计算资源、内存和网络带宽均很富余。输入法程序从网络渐次下载高阶数据增加插值数据量,或使用高阶语言模型。计算过程中进行小幅度剪枝或不剪枝,追求识别用户输入意图的最高精度。
场景二:CPU资源强大,内存资源缺乏。使用较多数据,增加搜索空间,进行小量剪枝,不使用缓存。
场景三:CPU资源贫乏,内存资源丰富。使用保守的数据和剪枝策略,使用大量缓存。
场景四:CPU资源和内存资源均贫乏。使用基本数据和激进的剪枝策略。在必要时,模型退化到低阶,例如0阶马可夫模型只需很小的搜索空间,释放大量资源。
对于前述的额外功能策略,输入法程序也应根据客户端的当前资源状况调取多个额外功能策略中的一个或多个。通过各种额外功能策略,可以为用户提供更多的候选词。根据客户端的当前资源状况决定调取的额外功能策略。在CPU和内存贫乏的平台,只执行基本的功能,搜索词典数量较少,计算量较少,表现为只展现数量较少的基本候选。反之,CPU和内存丰富的平台,搜索更多词典,展现候选数量更多,内容也更丰富,如表情符号,数量词特殊符号,英文候选词等。在具体的实施例中,可以在候选词界面中对候选词进行分类加以标记。例如,使用网络词库的情形下,由网络词库得到的候选词可在候选词界面中标记来自网络,又例如,在使用细胞词库的情形下,由某个细胞词库来源的候选词加以相应标记,如shiji所对应的候选词“尸姬”加以“动漫”标记,klz所对应的候选词“克洛泽”加以“足球”标记,jnxs所对应的候选词“基尼系数”加以“经济”标记等,有助于用户根据具体的例子决定选择哪些适合自己的细胞词库。对于这些用户选择的细胞词库,输入法程序可以在当前系统资源允许的时候优先加载这些细胞词库。
对模型参数及执行策略的调整,都以当前资源状况为依据。例如,高性能手机在资源紧张时和低性能手机的资源状况相似,因此,输入法执行策略的自适应调节结果也相似。但是有些资源参数由于平台特性在长期内保持稳定,例如客户端的固化存储(ROM),固化存储空间大的机型适合储存大量数据,例如下载大量细胞词库,记录全部用户输入历史(一般情况下,用户输入历史会按一定策略进行保留与舍去)等等。如图2所示,具体的执行流程包括:
S201:加载输入法程序;
S202:检测当前系统资源;
S203:判断当前资源使用情况,如果当前系统资源处于高负载,执行S204;如果当前系统资源富余,执行S205;
S204:选择合适策略,具体可根据当前系统资源,决定使用N-POS模型、模型阶数为低阶、低级别数据、激进的剪枝策略等,降低系统资源使用,但会导致输入法的输入精度降低;
S205:选择合适策略,具体可根据当前系统资源,决定使用N-gram模型、模型阶数为高阶、高级别数据、小幅度的剪枝策略等,增加系统资源使用,可以提高输入法的输入精度。
执行S204或S205步骤,经过一定时间后,再次执行S202步骤检测当前系统资源,以保证实时平衡资源占用和输入效果。这个流程的循环执行,可以保证输入法系统资源占用的自动调整。如果在CPU、内存等系统资源上明显低于平均水平的平台初始化运行该输入法,可以感觉或用工具检测到资源过载及由此导致的性能低下。经过该流程一段时间的自适应,输入法性能趋于平稳,用工具可以检测到资源负荷下降、性能上升的过程。反之,如果在CPU、内存等系统资源上明显高于平均水平的平台初始化运行该输入法,可以检测到资源从空载到合理均衡占用的过程。
根据本发明实施例的客户端中输入法的自适应调整方法,根据客户端的当前资源状况自动调整输入功能和效果,平衡资源占用和输入效果的矛盾,在充分利用资源的前提下提供最优的候选效果。
为了实现上述实施例,本发明还提出一种客户端中输入法的自适应调整装置。
如图3所示,根据本发明第二方面的实施例的客户端中输入法的自适应调整装置,包括:加载模块310、获得模块320和控制模块330。
具体地,加载模块310用于在客户端中加载输入法程序,其中,输入法程序包括多个模型参数和/或多个执行策略。
具体地,模型参数包括输入法的语言统计模型及统计模型的参数,语言统计模型有智能分词,根据上文判断下文等情形等多种具体应用,其参数则用于控制语言模型的规模。具体地,模型参数包括:N-gram模型和N-POS模型等。输入法中,普遍使用马可夫(Markov)模型作为语言模型,如果用词作为马可夫链的状态,就是N-gram模型,如果用词类作为状态,就是N-POS模型。N-POS模型因为状态数少很多,所以比N-gram模型节省了海量的数据,但N-POS模型的分词、上下文匹配等具体应用的精度也比N-gram模型低。在实际应用中,往往把一部分关键的N-gram数据插值到N-POS模型,增加一定的数据量,使N-POS模型在这些方面的精度表现逼近N-gram。另一方面,马可夫链的阶数也是重要的参数。输入法中普遍采用1阶马可夫链,称为2元模型。N-gram和N-POS等模型的阶数,体现在候选对上文的相关度。对上文的相关度,是输入法智能程度的重要体现,例如对于同样的用户输入“lj”,对于不同的上文“阅读”、“网络”、“文件”,输入法可以智能地分别将“理解”、“连接”、“路径”设置于候选的首选词处,方便用户输入。增加模型的阶数可以增加精度,但同时也会大大增加数据量和计算量,消耗系统资源显著增加。在具体应用中,也会把高阶数据插值到低阶模型,以增加一定精度。在资源极度紧张时,使用0阶模型,即候选与上文无关,具体表现为:无论已输入什么不同的内容,当前输入同样的读音(编码),总是输出相同的候选。反之,在资源丰富的平台,模型的阶数增加,候选和上文相关,即在上文不同的情况下,输入相同的读音(编码)会输出不同的候选。而且理论上,以词/短语为单位,模型的阶数越多,候选关联上文的程度越大。
执行策略包括多级别的使用数据、多级别的剪枝策略、缓存策略、额外功能策略等。剪枝策略主要是对计算过程中进行剪枝的幅度。缓存策略主要是在计算中是否占用客户端内存为缓存,以及缓存大小。额外功能策略为输入法程序提供一些额外的词库和功能。在本发明的一个实施例中,额外功能策略包括:
1.增加细胞词库,增加覆盖率;
2.通过网络从服务器端获取候选,即采用云输入;
3.学习用户输入历史,输出用户输入过的词;
4.加入英文候选;
5.从网络更新新词热词等网络词库;
6.加入表情符号等特殊候选。
7.数量词特殊展示,例如①~⑨等特殊符号。
采用以上额外功能策略,可以更好地判断用户输入的意图,或者为用户输入提供更多功能选择。需要说明的是,以上执行策略示例只是为了便于说明,而不应理解为对本发明的限制。
获得模块320用于获得客户端的当前资源状况。当前资源状况包括网络资源、运算资源和内存资源。其中,网络资源包括网络是否可达、网络带宽、网络延迟、丢包率等网络质量参数,运算资源包括客户端的CPU性能等,内存资源包括客户端的RAM内存和ROM内存等。
具体地,对当前资源状况的检测,检测遵循探测和反馈两个方向:
a)每隔一定的时间,系统主动调用设备及其操作系统提供的接口,获取关键资源的当前状态,如处理器负荷、内存使用量、网络类型和带宽等等。
b)同时系统通过反馈获取自身的运行情况,如一个完整处理周期的耗时、网络请求的延时、用户按键和上屏情况(反映键盘和触摸屏精度)等等。
在获得模块320获取当前资源信息后,控制模块330根据当前资源信息,从多个模型参数和/或执行策略中选择对应的模型参数和/或执行策略。
各模型参数和执行策略的设置和消耗的资源及输入法效果相关。
a)计算量越大,应用的策略越复杂,需要的处理器时间和内存空间越大,同时候选精度越高。
b)使用更多的内存,可以提高精度,同时减少计算量,即减少处理器时间。
c)从云端服务器获取的信息越多,占用网络流量越大,受网络延迟影响越大,同时精度越高。
选择合适的模型参数及执行策略,以更好地判断用户的输入意图,从而保证输入法的输入精度。具体地,包括但并不仅限于如下情形:
1)当网络资源处于第一网络资源状态时,控制模块330调取云输入策略;当网络资源处于第二网络资源状态时,控制模块330调取本地输入策略,其中,第一网络资源状态的特征为满足网络带宽大于一定数值、且网络连接速度大于一定数值等,第二网络资源状态为网络资源不能满足第一网络资源状态上述特征时的状态。云输入策略中,智能计算对应用户输入内容的首选词的过程在云端实现;本地输入策略中,该过程在本地实现。
2)根据当前的运算资源状态,控制模块330调取N-gram模型或N-POS模型;具体地,当前运算资源状态满足一定条件,例如客户端的CPU主频大于一定预设数值时,客户端的输入法调取N-gram模型,小于一定预设数值时,客户端的输入法调取N-POS模型,并根据CPU主频选择统计模型计算时的阶数及使用数据策略的级别,CPU主频越高时,计算模型的阶数越高,使用的数据越多。
3)根据当前的内存资源状态,控制模块330调整剪枝策略及缓存策略的级别;具体地,输入法程序根据当前的可用RAM和可用ROM,调整剪枝策略及缓存策略的级别,可用RAM和可用ROM越多,剪枝策略越保守,缓存使用越多。
在实际实施例中,执行策略可能是上述一种或几种情形,或是几种情形的组合,例如,采取使用更多缓存的策略,则可以节省计算量,减少了输入法程序对运算资源的需求,间接上影响了统计模型及其阶数的选择。又例如,在具体场景中,采用如下所示不同的执行策略:
场景一:平台的计算资源、内存和网络带宽均很富余。输入法程序从网络渐次下载高阶数据增加插值数据量,或使用高阶语言模型。计算过程中进行小幅度剪枝或不剪枝,追求识别用户输入意图的最高精度。
场景二:CPU资源强大,内存资源缺乏。使用较多数据,增加搜索空间,进行小量剪枝,不使用缓存。
场景三:CPU资源贫乏,内存资源丰富。使用保守的数据和剪枝策略,使用大量缓存。
场景四:CPU资源和内存资源均贫乏。使用基本数据和激进的剪枝策略。在必要时,模型退化到低阶,例如0阶马可夫模型只需很小的搜索空间,释放大量资源。
对于前述的额外功能策略,输入法程序也应根据客户端的当前资源状况调取多个额外功能策略中的一个或多个。通过各种额外功能策略,可以为用户提供更多的候选词。根据客户端的当前资源状况决定调取的额外功能策略。在CPU和内存贫乏的平台,只执行基本的功能,搜索词典数量较少,计算量较少,表现为只展现数量较少的基本候选。反之,CPU和内存丰富的平台,搜索更多词典,展现候选数量更多,内容也更丰富,如表情符号,数量词特殊符号,英文候选词等。在具体的实施例中,可以在候选词界面中对候选词进行分类加以标记。例如,使用网络词库的情形下,由网络词库得到的候选词可在候选词界面中标记来自网络,又例如,在使用细胞词库的情形下,由某个细胞词库来源的候选词加以相应标记,如shiji所对应的候选词“尸姬”加以“动漫”标记,klz所对应的候选词“克洛泽”加以“足球”标记,jnxs所对应的候选词“基尼系数”加以“经济”标记等,有助于用户根据具体的例子决定选择哪些适合自己的细胞词库。对于这些用户选择的细胞词库,输入法程序可以在当前系统资源允许的时候优先加载这些细胞词库。
对模型参数及执行策略的调整,都以当前资源状况为依据。例如,高性能手机在资源紧张时和低性能手机的资源状况相似,因此,输入法执行策略的自适应调节结果也相似。但是有些资源参数由于平台特性在长期内保持稳定,例如客户端的固化存储(ROM),固化存储空间大的机型适合储存大量数据,例如下载大量细胞词库,记录全部用户输入历史(一般情况下,用户输入历史会按一定策略进行保留与舍去)等等。
根据本发明实施例的客户端中输入法的自适应调整装置,根据客户端的当前资源状况自动调整输入功能和效果,平衡资源占用和输入效果的矛盾,在充分利用资源的前提下提供最优的候选效果。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (16)

1.一种客户端中输入法的自适应调整方法,其特征在于,包括以下步骤:
在客户端中加载输入法程序,其中,所述输入法程序包括多个模型参数和/或多个执行策略;
所述输入法程序获得所述客户端的当前资源状况;以及
所述输入法程序根据所述客户端的当前资源状况从所述多个模型参数和/或多个执行策略中选择对应的模型参数和/或执行策略。
2.如权利要求1所述的客户端中输入法的自适应调整方法,其特征在于,所述模型参数包括N-gram模型和N-POS模型。
3.如权利要求1或2所述的客户端中输入法的自适应调整方法,其特征在于,所述多个执行策略包括云输入策略、本地输入策略、多级别的使用数据策略、多级别的剪枝策略,以及多级别的缓存策略。
4.如权利要求1-3任一项所述的客户端中输入法的自适应调整方法,其特征在于,所述当前资源状况包括网络资源、运算资源和内存资源。
5.如权利要求4所述的客户端中输入法的自适应调整方法,其特征在于,其中,
当所述网络资源处于第一网络资源状态时,所述客户端的输入法调取云输入策略;
当所述网络资源处于第二网络资源状态时,所述客户端的输入法调取本地输入策略,其中,所述第一网络资源状态优于所述第二网络资源状态。
6.如权利要求4所述的客户端中输入法的自适应调整方法,其特征在于,其中,
根据当前的运算资源状态,所述客户端的输入法调取所述N-gram模型或所述N-POS模型,并选择所述模型的阶数及所述使用数据策略的级别。
7.如权利要求4所述的客户端中输入法的自适应调整方法,其特征在于,其中,
根据当前的内存资源状态,所述客户端的输入法调整所述剪枝策略及所述缓存策略的级别。
8.如权利要求1所述的客户端中输入法的自适应调整方法,其特征在于,所述执行策略还包括多个额外功能策略,所述输入法程序根据所述客户端的当前资源状况调取所述多个额外功能策略中的一个或多个。
9.一种客户端中输入法的自适应调整装置,其特征在于,包括:
加载模块,用于在客户端中加载输入法程序,其中,所述输入法程序包括多个模型参数和/或多个执行策略;
获得模块,用于获得所述客户端的当前资源状况;以及
控制模块,用于根据所述客户端的当前资源状况从所述多个模型参数和/或多个执行策略中选择对应的模型参数和/或执行策略。
10.如权利要求9所述的客户端中输入法的自适应调整装置,其特征在于,所述模型参数包括N-gram模型和N-POS模型。
11.如权利要求10所述的客户端中输入法的自适应调整装置,其特征在于,所述多个执行策略包括多级别的使用数据、多级别的剪枝策略。
12.如权利要求11所述的客户端中输入法的自适应调整装置,其特征在于,所述当前资源状况包括网络资源、运算资源和内存资源。
13.如权利要求12所述的客户端中输入法的自适应调整装置,其特征在于,其中,
当所述网络资源处于第一网络资源状态时,所述控制模块调取云输入策略;
当所述网络资源处于第二网络资源状态时,所述控制模块调取本地输入策略,其中,所述第一网络资源状态优于所述第二网络资源状态。
14.如权利要求12所述的客户端中输入法的自适应调整装置,其特征在于,其中,
根据当前的运算资源状态,所述控制模块调取所述N-gram模型或所述N-POS模型,并选择所述模型的阶数及所述使用数据策略的级别。
15.如权利要求12所述的客户端中输入法的自适应调整装置,其特征在于,其中,
根据当前的内存资源状态,所述控制模块调整所述剪枝策略及所述缓存策略的级别。
16.如权利要求12所述的客户端中输入法的自适应调整装置,其特征在于,所述执行策略还包括多个额外功能策略,所述控制模块根据所述客户端的当前资源状况调取所述多个额外功能策略中的一个或多个。
CN201310012754.4A 2013-01-14 2013-01-14 一种客户端中输入法的自适应调整方法及装置 Pending CN103927220A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310012754.4A CN103927220A (zh) 2013-01-14 2013-01-14 一种客户端中输入法的自适应调整方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310012754.4A CN103927220A (zh) 2013-01-14 2013-01-14 一种客户端中输入法的自适应调整方法及装置

Publications (1)

Publication Number Publication Date
CN103927220A true CN103927220A (zh) 2014-07-16

Family

ID=51145449

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310012754.4A Pending CN103927220A (zh) 2013-01-14 2013-01-14 一种客户端中输入法的自适应调整方法及装置

Country Status (1)

Country Link
CN (1) CN103927220A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106257378A (zh) * 2016-07-19 2016-12-28 北京新美互通科技有限公司 一种表情符号输入方法及装置
CN109343902A (zh) * 2018-09-26 2019-02-15 Oppo广东移动通信有限公司 音频处理组件的运行方法、装置、终端及存储介质
CN110837288A (zh) * 2018-08-15 2020-02-25 北京搜狗科技发展有限公司 应用程序管理方法、装置、移动终端及可读存储介质
CN115494965A (zh) * 2021-06-18 2022-12-20 北京搜狗科技发展有限公司 一种请求发送方法、装置和用于发送请求的装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007286742A (ja) * 2006-04-13 2007-11-01 Ricoh Co Ltd 文書検索装置
CN101286093A (zh) * 2007-04-09 2008-10-15 谷歌股份有限公司 客户端输入方法
CN101430683A (zh) * 2007-11-09 2009-05-13 英业达股份有限公司 翻译软件的词库切换系统及其方法
CN101996101A (zh) * 2009-08-13 2011-03-30 北京搜狗科技发展有限公司 应用程序性能优化方法及装置
US20120059810A1 (en) * 2010-09-08 2012-03-08 Nuance Communications, Inc. Method and apparatus for processing spoken search queries

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007286742A (ja) * 2006-04-13 2007-11-01 Ricoh Co Ltd 文書検索装置
CN101286093A (zh) * 2007-04-09 2008-10-15 谷歌股份有限公司 客户端输入方法
CN101430683A (zh) * 2007-11-09 2009-05-13 英业达股份有限公司 翻译软件的词库切换系统及其方法
CN101996101A (zh) * 2009-08-13 2011-03-30 北京搜狗科技发展有限公司 应用程序性能优化方法及装置
US20120059810A1 (en) * 2010-09-08 2012-03-08 Nuance Communications, Inc. Method and apparatus for processing spoken search queries

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
俞士汶主编: "语料库的应用", 《计算语言学概论》 *
王小捷等编著: "N-Gram模型", 《自然语言处理技术基础》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106257378A (zh) * 2016-07-19 2016-12-28 北京新美互通科技有限公司 一种表情符号输入方法及装置
CN110837288A (zh) * 2018-08-15 2020-02-25 北京搜狗科技发展有限公司 应用程序管理方法、装置、移动终端及可读存储介质
CN110837288B (zh) * 2018-08-15 2024-03-19 北京搜狗科技发展有限公司 应用程序管理方法、装置、移动终端及可读存储介质
CN109343902A (zh) * 2018-09-26 2019-02-15 Oppo广东移动通信有限公司 音频处理组件的运行方法、装置、终端及存储介质
CN109343902B (zh) * 2018-09-26 2021-08-03 Oppo广东移动通信有限公司 音频处理组件的运行方法、装置、终端及存储介质
CN115494965A (zh) * 2021-06-18 2022-12-20 北京搜狗科技发展有限公司 一种请求发送方法、装置和用于发送请求的装置

Similar Documents

Publication Publication Date Title
US11836576B2 (en) Distributed machine learning at edge nodes
US10909327B2 (en) Unsupervised learning of interpretable conversation models from conversation logs
US11605304B2 (en) Learning of policy for selection of associative topic in dialog system
CN103500003B (zh) 便携式终端的cpu频率调节方法及调节装置
EP4268077A1 (en) Methods, systems, articles of manufacture and apparatus to optimize resources in edge networks
US8732717B2 (en) Resource allocation
US11875113B2 (en) Semantic matching of job titles with limited contexts
CN113792855A (zh) 一种模型训练及字库建立方法、装置、设备和存储介质
US20200311561A1 (en) Modifying artificial intelligence models using model fragments
US20220237232A1 (en) Conversation based data analysis recommendations
CN103927220A (zh) 一种客户端中输入法的自适应调整方法及装置
CN116057518A (zh) 使用机器学习模型的自动查询谓词选择性预测
US11803374B2 (en) Monolithic computer application refactoring
US20220058590A1 (en) Equipment maintenance in geo-distributed equipment
CN110674397B (zh) 年龄点预测模型的训练方法及装置、设备与可读介质
CN116684330A (zh) 基于人工智能的流量预测方法、装置、设备及存储介质
US10360302B2 (en) Visual comparison of documents using latent semantic differences
AU2020364386B2 (en) Rare topic detection using hierarchical clustering
US20210216727A1 (en) Machine translation integrated with user analysis
US11410023B2 (en) Lexicographic deep reinforcement learning using state constraints and conditional policies
Liao et al. Multicore parallel genetic algorithm with Tabu strategy for rainfall-runoff model calibration
US20230236871A1 (en) Computing environment predictive provisioning
CN113112311B (zh) 训练因果推断模型的方法、信息提示方法以装置
US11556685B1 (en) Time-based power analysis
Mittal et al. Optimized cpu frequency scaling on android devices based on foreground running application

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140716