CN106775794B - 一种输入法客户端安装方法和装置 - Google Patents

一种输入法客户端安装方法和装置 Download PDF

Info

Publication number
CN106775794B
CN106775794B CN201510825201.XA CN201510825201A CN106775794B CN 106775794 B CN106775794 B CN 106775794B CN 201510825201 A CN201510825201 A CN 201510825201A CN 106775794 B CN106775794 B CN 106775794B
Authority
CN
China
Prior art keywords
user
entries
input method
word
method client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510825201.XA
Other languages
English (en)
Other versions
CN106775794A (zh
Inventor
马尔胡甫·曼苏尔
汤沛
张扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201510825201.XA priority Critical patent/CN106775794B/zh
Publication of CN106775794A publication Critical patent/CN106775794A/zh
Application granted granted Critical
Publication of CN106775794B publication Critical patent/CN106775794B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/61Installation

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例提供了一种输入法客户端安装方法和装置,其中,所述方法包括:在输入法客户端安装过程中,判断终端上是否存在所述输入法客户端对应的用户词库;若终端上存在所述用户词库,则判断所述用户词库规模是否小于第一设定阈值;若小于第一设定阈值,则按照第一设定规则从所述输入法客户端对应的系统词库中提取词条,并将提取的所述词条预学习至所述用户词库中。通过本发明实施例提供的输入法客户端安装方案,能够保证推送给新用户词条的可靠性。

Description

一种输入法客户端安装方法和装置
技术领域
本发明涉及输入法技术领域,特别是涉及一种输入法客户端安装方法和装置。
背景技术
目前在输入法候选排序中,通常采用用户词绝对优先于系统词的通行策略。这一通行策略在用户长期使用输入法的过程中,会将用户用过、且用过次数多的词条排序在前,以满足文字输入中用户的个性化需求,提升用户首选率。
但是,在上述策略中用户偶尔使用过的词条也会被排到高频系统词条前面。而通常来说,对于一个用户仅使用过1次的词条(比如“记记”),它显然不会比同编码字符串对应的高频系统词条(比如“积极”)更可靠,这就导致了用户词库尚未积累到一定量级的新用户,往往需要多次翻页查找才能够找到所需的词条,会对新用户选词造成严重的干扰。
可见,现行的输入法候选排序规则仅当用户长期使用该输入法使用户词库积累到一定量级后才会比较可靠。若是刚安装输入法、或者是使用该输入法时间较短未使用户词库积累到一定量级的新用户,在使用输入法时,优先推送给新用户的词条往往将不可靠,用户大概率可能会上屏的词条会被用户词库学到的低概率词条“挤”到后面去,新用户需要多次翻页查找才能够找到所需的词条上屏,从而加大了新用户上屏高频词条的操作代价。不仅如此,现有的输入法的用户词库的扩充依赖于用户上屏的词条,也就是说,只有用户上屏的词条才能存储到用户词库中以使其积累到一定量级。可见,现有的这种用户词库规模扩充的方案用户词库的扩充速度慢。
因此,需要本领域技术人员解决的技术问题是,如何能够保证推送给新用户词条的可靠性。
发明内容
本发明提供了一种输入法客户端安装方法和装置,以解决现有的输入法推送给新用户的词条不可靠的问题。
为了解决上述问题,本发明公开了一种输入法客户端安装方法,包括:在输入法客户端安装过程中,判断终端上是否存在所述输入法客户端对应的用户词库;若终端上存在所述用户词库,则判断所述用户词库规模是否小于第一设定阈值;若小于第一设定阈值,则按照第一设定规则从所述输入法客户端对应的系统词库中提取词条,并将提取的所述词条预学习至所述用户词库中。
优选地,所述方法还包括:当终端上不存在所述用户词库时,则生成用户词库;按照第二设定规则从所述系统词库中提取词条,并将提取的所述词条预学习至生成的所述用户词库中。
优选地,所述按照第二设定规则从所述系统词库中提取词条的步骤包括:针对所述系统词库中存储的各编码字符串,分别提取当前编码字符串对应的满足设定条件的词条。
优选地,所述按照第一设定规则从所述输入法客户端对应的系统词库中提取词条的步骤包括:针对所述系统词库中存储的各编码字符串,分别提取当前编码字符串对应的满足设定条件的词条;和/或,针对所述用户词库中存储的各编码字符串,分别对当前编码字符串对应的词条进行分析,依据分析结果确定用户个性化特征,并从所述系统词库中提取与所述用户个性化特征相匹配的词条。
优选地,所述提取当前编码字符串对应的满足设定条件的词条的步骤包括:提取当前编码字符串对应的、词频值大于设定的词频阈值的词条;或者,提取当前编码字符串对应的、满足预设排序规则的词条。
为了解决上述问题,本发明还公开了一种输入法客户端安装装置,包括:第一判断模块,用于在输入法客户端安装过程中,判断终端上是否存在所述输入法客户端对应的用户词库;第二判断模块,用于若所述第一判断模块的判断结果为终端上存在所述用户词库,则判断所述用户词库规模是否小于第一设定阈值;第一预学习模块,用于若所述第二判断模块的判断结果为小于第一设定阈值,则按照第一设定规则从所述输入法客户端对应的系统词库中提取词条,并将提取的所述词条预学习至所述用户词库中。
优选地,所述装置还包括:生成模块,用于当所述第一判断模块的判断结果为终端上不存在所述用户词库时,则生成用户词库;第二预学习模块,用于按照第二设定规则从所述系统词库中提取词条,并将提取的所述词条预学习至生成的所述用户词库中。
优选地,所述第二预学习模块包括:提取子模块,用于针对所述系统词库中存储的各编码字符串,分别提取当前编码字符串对应的满足设定条件的词条;存储子模块,用于将提取的所述词条预学习至生成的所述用户词库中。
优选地,所述第一预学习模块按照第一设定规则从所述输入法客户端对应的系统词库中提取词条时:针对所述系统词库中存储的各编码字符串,分别提取当前编码字符串对应的满足设定条件的词条;和/或,针对所述用户词库中存储的各编码字符串,分别对当前编码字符串对应的词条进行分析,依据分析结果确定用户个性化特征,并从所述系统词库中提取与所述用户个性化特征相匹配的词条。
优选地,所述第一预学习模块或所述提取子模块提取当前编码字符串对应的满足设定条件的词条时:提取当前编码字符串对应的、词频值大于设定的词频阈值的词条;或者,提取当前编码字符串对应的、满足预设排序规则的词条。
为了解决上述问题,本发明又公开了一种用于安装输入法客户端的装置,包括存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上包含用于进行以下操作的指令的程序:在输入法客户端安装过程中,判断终端上是否存在所述输入法客户端对应的用户词库;若终端上存在所述用户词库,则判断所述用户词库规模是否小于第一设定阈值;若小于第一设定阈值,则按照第一设定规则从所述输入法客户端对应的系统词库中提取词条,并将提取的所述词条预学习至所述用户词库中。
与现有技术相比,本发明具有以下优点:
本发明实施例提供的输入法客户端安装方案,在输入法客户端安装过程中,首先判断在安装该输入法客户端的终端上是否存在用户词库,当存在用户词库时,则进一步判断用户词库规模是否小于第一设定阈值,若判断结果为小于,则认为安装该输入法客户端的用户为新用户,此时,便从系统词库中提取高频词条预学习到用户词库中以提升用户词库的规模即量级。当终端上不存在用户词库时,也认为安装该输入法客户端的用户为新用户,此时,则生成用户词库,并从系统词库中提取高频词条预学习到用户词库中以快速提升用户词库的规模。通过本发明实施例提供的输入法客户端安装方案、安装的输入法客户端,当新用户输入编码字符串时,用户词库中预学习的高频系统词条以及原本存在的用户词条则共同依据设定规则进行排序,可避免现有的输入法盲目将用户词条排序在高频系统词条前面的问题,因此,能够保证推送给新用户词条的可靠性。
附图说明
图1是根据本发明实施例一的一种输入法客户端安装方法的步骤流程图;
图2是根据本发明实施例二的一种输入法客户端安装方法的步骤流程图;
图3是采用实施例二中所示的方法进行输入法客户端安装的具体流程图;
图4是根据本发明实施例三的一种输入法客户端安装装置的结构框图;
图5是根据本发明实施例四的一种输入法客户端安装装置的结构框图;
图6是根据本发明实施例五的一种用于安装输入法客户端的装置的结构框图;
图7是本发明实施例五中的服务器设备的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例一
参照图1,示出了本发明实施例一的一种输入法客户端安装方法的步骤流程图。
本发明实施例的输入法客户端安装方法包括以下步骤:
步骤S102:在输入法客户端安装过程中,判断终端上是否存在输入法客户端对应的用户词库。
其中,用户词库用于存储输入法客户端使用过程中,用户上屏的词条。若终端中曾经安装过该输入法客户端,则在终端上将存在用户词库;而若终端中的用户词库受损,也将导致终端中的用户词库消失。若终端首次安装该输入法客户端,则终端上将不存在用户词库。
步骤S104:若终端上存在用户词库,则判断用户词库规模是否小于第一设定阈值。
第一设定阈值为用于衡量用户词库是否需要进行规模扩充的值,当用户词库的规模小于第一设定阈值时,则执行步骤S106以进行规模扩充,当用户词库的规模大于或等于第一设定阈值时,则表明该用户词库无需进行规模扩充。
需要说明的是,第一设定阈值的具体值可以由本领域技术人员根据实际需求进行设置,例如:设置成时间阈值、词条数据量阈值等,本发明实施例对此不作具体限制。
步骤S106:若小于第一设定阈值,则按照第一设定规则从输入法客户端对应的系统词库中提取词条,并将提取的词条预学习至用户词库中。
输入法客户端中存在系统词库,在系统词库中存储有输入法系统中设置的各编码字符串以及各编码字符串对应的词条。被预学习至用户词库的词条在输入法客户端使用过程中,将与用户词库中存储的用户上屏的词条一样,共同参与候选词条的学习、排序和调频。
其中,按照第一设定规则从系统词库中提取词条目的是提取出系统词库中各编码字符串对应的高频词条,对于第一设定规则的设置能满足上述要求即可,其具体的设定方式可以由本领域技术人员根据实际需求进行设置,本发明实施例中对此不作具体限制。通过本发明实施例提供的输入法客户端安装方法,在输入法客户端安装过程中,判断用户词库规模是否小于第一设定阈值,若判断结果为小于,则确定安装该输入法客户端的用户为新用户,此时,便从系统词库中提取高频词条预学习到用户词库中以提升用户词库的规模即量级。通过本发明实施例提供的输入法客户端安装方法、安装的输入法客户端,当新用户输入编码字符串时,用户词库中预学习的高频系统词条以及原本存在的用户词条则共同依据设定规则进行排序,可避免现有的输入法盲目将用户词条排序在高频系统词条前面的问题,因此,能够保证推送给新用户词条的可靠性。
实施例二
参照图2,示出了本发明实施例二的一种输入法客户端安装方法的步骤流程图。
本发明实施例的输入法客户端安装方法具体包括以下步骤:
步骤S202:安装程序在输入法客户端安装过程中,判断终端上是否存在该输入法客户端对应的用户词库;若存在,则执行步骤S204,若不存在,则执行步骤S208。
需要说明的是,输入法客户端包括但不限于PC、手机、平板、PDA等终端上的输入法客户端。
判断终端上是否存在该输入法客户端对应的用户词库时,可以通过判断终端上、特定路径下是否存在用户词库文件来确定是否存在用户词库。若存在用户词库文件,则确定存在用户词库,若不存在用户词库文件,则确定不存在用户词库。
本发明实施例中,在输入法客户端安装过程中,首先判断终端中是否存在用户词库,然后,分两个分支进行的处理:一个分支为:当判断出存在用户词库时,进一步判断词库规模是否满足第一设定阈值,若不满足,则需要对用户词库进行规模扩充,若满足,则不会对用户词库的规模进行扩充。另一个分支为:当判断出不存在用户词库时,生成用户词库,并将生成的新的用户词库进行规模扩充。上述两个分支的具体处理流程如下。
步骤S204:若终端上存在用户词库,则判断用户词库规模是否小于第一设定阈值;若小于第一设定阈值,则执行步骤S206,若大于或等于第一设定阈值,则执行设定操作。
第一设定阈值为用于衡量用户词库是否需要进行规模扩充的值,当用户词库的规模小于第一设定阈值时,则执行步骤S206以进行规模扩充,当用户词库的规模大于或等于第一设定阈值时,则表明该用户词库无需进行规模扩充。
第一设定阈值的设定可以由本领域技术人员根据实际需求进行设置,可以将第一设定阈值设定成时间阈值、词条数据量阈值等。例如:将第一设定阈值设置成一时间阈值,当用户词库生成时间超出设定的该时间阈值时,则确定其规模大于第一设定阈值。再例如:将第一设定阈值设置成词条数据量,当用户词库中存储的词条数量大于所设置的词条数据量时,则确定其规模大于第一设定阈值。
其中,设定操作可以设定为:不对用户词库进行与规模扩充有关的处理,而是直接执行输入法客户端安装包中其他的安装流程。
步骤S206:当用户词库的规模小于第一设定阈值时,则按照第一设定规则从输入法客户端对应的系统词库中提取词条,并将提取的词条预学习至用户词库中。
第一设定规则的三种优选设置方式如下:
第一种:针对系统词库中存储的各编码字符串,分别提取当前编码字符串对应的满足设定条件的词条。
其中,设定条件可以为任意适当的条件,只要能保证系统词库中的高频词条被提取出来即可。优选地,在提取每个编码字符串对应的满足设定条件的词条时可以通过以下任意一种方式:
1)提取编码字符串对应的、词频值大于设定的词频阈值的词条。例如:当前编码字符串对应10个词条,而这10个词条中有5词条的词频值大于设定的词频阈值,则在提取时仅提取这5个词条。
2)提取编码字符串对应的、满足预设排序规则的词条。例如:当前编码字符串对应的5个词条A、B、C、D和E的排序为A、D、C、B、E,而预设的排序规则为提取排序在前的3个词条,则在提取时仅提取A、D和C这3个词条。
第一种优选的设定规则可以保证将系统词库中的高频词条预学习至用户词库中。
第二种:针对用户词库中存储的各编码字符串,分别对当前编码字符串对应的词条进行分析,依据分析结果确定用户个性化特征,并从系统词库中提取与用户个性化特征相匹配的词条。
例如:用户词库中存储有词条“鱼友”、“渔具”、“海钓”、“夜钓”,那么通过上述达到一定数量规模的与钓鱼有关的词条即可确定该用户为钓鱼爱好者,因此,从系统词库中挑选出与钓鱼相匹配的词条(例如:“鱼竿”、“鱼饵”等)。
第二种优选的设定规则可以将系统词库中存储的、能够满足用户个性化需求的词条预学习至用户词库中。
第三种:兼顾上述第一种和第二种设定规则。即针对系统词库中存储的各编码字符串,分别提取当前编码字符串对应的满足设定条件的词条,并且,针对用户词库中存储的各编码字符串,分别对当前编码字符串对应的词条进行分析,依据分析结果确定用户个性化特征,并从系统词库中提取与用户个性化特征相匹配的词条。
通过第三种优选的设定规则,既可以保证将系统词库中的高频词条预学习至用户词库中,又能够将用户可能感兴趣的、能够满足用户个性化需求的词条预学习至用户词库中。
步骤S208:若终端上不存在用户词库,则生成用户词库;然后执行步骤S210。
需要说明的是,生成用户词库的具体实现方式参见相关技术即可,本发明实施例中对此不作具体限制。
步骤S210:在生成用户词库后,按照第二设定规则从系统词库中提取词条,并将提取的词条预学习至生成的用户词库中。
一种优选的按照第二设定规则从系统词库中提取词条的方法为:针对系统词库中存储的各编码字符串,分别提取当前编码字符串对应的满足设定条件的词条。例如:系统词库中存在5个编码字符串,那么,在进行处理时,分别提取这5个编码字符串对应的满足设定条件的词条。
其中,设定条件可以为任意适当的条件,只要能保证系统词库中的高频词条被提取出来即可。优选地,在提取当前编码字符串对应的满足设定条件的词条时可以通过以下任意一种方式:
第一种,提取当前编码字符串对应的、词频值大于设定的词频阈值的词条。第二种,提取当前编码字符串对应的、满足预设排序规则的词条。
通过本发明实施例提供的输入法客户端安装方法,除具有实施例一中所示的输入法客户端安装方法所具有的有益效果外,还会在输入法客户端安装过程中,当判断出终端中不存在用户词库时,生成用户词库,并从系统词库中安装设定规则提取词条预学习至新生成的用户词库中以对新生成的用户词库进行规模扩充。这样,当输入法客户端安装成后,新用户使用该客户端时,即可为新用户提供可靠的候选词条。不仅如此,本发明实施例提供的用户词库规模扩充方法,相较于现有的用户词库扩充方案,还能够提升用户词库规模的扩充速度。
下面参照图3,以一具体实例对本发明实施例的输入法客户端安装流程进行说明。
本具体实例中的输入法客户端安装流程包括以下步骤:
步骤S302:用户安装输入法客户端。
本步骤中,输入法客户端的安装可以是用户使用输入法客户端安装包进行输入法客户端安装,也可以是通过用户操作使输入法客户端进入自动升级安装的过程。
步骤S304:判断用户词库文件是否存在,若存在,则执行步骤S308,若不存在,则执行步骤S306。
当输入法客户端安装时,安装程序自动到用户目录查找用户词库文件。当查找到上述用户词库文件时,则确定存在用户词库文件即存在用户词库;当未查找到上述用户词库文件时,则确定不存在用户词库文件即不存在用户词库。
其中,用户词库用于存储输入法使用过程中,用户上屏的词条。例如:在用户安装完输入法的使用初期,某次上屏了一个以前没有输入过的词条“记记”,输入法则将其学习到用户词库中。
步骤S306:当不存在用户词库文件时,生成用户词库,并从系统词库中按规则挑选一部分词条预学习到用户词库中;然后,执行步骤S312。
需要说明的是,用户词库文件不存在包括但不限于:用户词库文件受损,或用户新安装输入法客户端还未建立用户词库这两种情况。
其中,本步骤中的规则即第二设定规则。如果在安装过程中安装程序确定用户词库不存在,则先生成一个用户词库,并按规则挑选一部分系统词条预学习到新生成的用户词库中。系统词库用于存储输入法系统中设置的各编码字符串以及各编码字符串对应的词条。
本步骤中的规则可以设定如下:针对系统词库中存在的每个编码字符串,挑选该编码字符串下系统词频值大于某个设定阈值的系统词条,将这些挑选出来的系统词条预学习到用户词库中。
需要说明的是,在该规则中的设定阈值为词频阈值,但是,在具体实现过程中还可以通过系统词条的排序进行词条挑选。例如:某一编码字符串下有五个顺次排列的词条A、B、C、D和E,而设定的规则为挑选每个编码字符串下排序在前三位的系统词条,故,在从系统词库中挑选该编码字符串下的词条时,则将词条A、B和C挑选出来。
由于用户词库中的词频与系统词库中的词频记录方式有区别,故不能简单将预学词条的词频设置为系统词频,但预学习到用户词库中的词条的用户词频分布与其在系统词库中的分布一致。
例如:在系统词库的记录方式为词条的词频值越小,则该词越好,越优先推送给用户;而在用户词库中的记录方式为词条的词频值越大,则该词条越好,越优先推送给用户;那么,在系统词库中按照词频值由大到小进行排序的三个词条A、B、C,预学习至用户词库中时则需要修改词条的词频,使C的词频值大于B的词频值,B的词频值大于A的词频值,这样才能满足在推送词条时将A优先推送给用户。
步骤S308:当存在用户词库文件时,判断当前用户词库规模是否小于阈值;若是,则执行步骤S310,若否,则执行步骤S312。
其中,阈值即第一设定阈值。
本步骤中,若当前用户词库的规模小于阈值则确定需要对该用户词库进行高频系统词条扩充,若当前用户词库的规模大于或等于阈值则确定无需对该用户词库进行高频系统词条扩充,因此,即可直接执行步骤S312完成输入法客户端的安装。
步骤S310:当小于阈值时,从系统词库中按规则挑选一部分词条预学习到用户词库中;然后,执行步骤S312。
本步骤中的规则即第一设定规则。在输入法客户端安装过程中,安装程序发现用户词库存在、但用户词库规模小于阈值即规模判断阈值时,则按规则挑选一部分系统词条预学习到用户词库中。
本步骤中的规则可以设定如下:在上述步骤S306中所述的第一规则的基础上,可以对用户词库中的词条进行分析,提取出用户使用过的关键词信息,并基于这些关键词确定该用户的个性化特征,然后依据确定的用户的个性化特征从系统词库中挑选出与该用户个性化特征相匹配的词条,这些相匹配的词条是该用户后期可能会上屏的词条。
例如:用户词库中存储有词条“鱼友”、“渔具”、“海钓”、“夜钓”,那么通过上述词条即可确定该用户为钓鱼爱好者,因此,从系统词库中挑选出与钓鱼相匹配的词条(例如:“鱼竿”、“鱼饵”等),并将挑选出的词条预学习至用户词库中。
步骤S312:完成输入法客户端安装。
输入法客户端安装完毕,即可正常使用。
下面以对用户词库中的编码字符串“jiji”为例,对采用本具体实例中的输入法客户端所能达到的效果进行说明。
当用户安装输入法客户端时,安装程序发现用户目录下没有用户词库,则生成了用户词库,且将系统词库中编码字符串“jiji”下词频大于某个阈值的系统词条“积极”预学习至用户词库中。
在用户使用输入法客户端的初期,某次上屏了一个以前没有输入过的词条“记记”,输入法则将其学习到了用户词库中编码字符串“jiji”对应的词条下。当用户下次再输入编码字符串“jiji”时,输入法从用户词库中载入该编码字符串下的用户词,此时用户词库中有了“积极”(安装时预学的)和“记记”(通过用户上屏学习到的),输入法排序时会将这两个用户词条排到其他词库词条(如系统词、细胞词)之前,且因“积极”的原始词频(系统词频)高于“记记”,故“积极”会被排到“记记”之前,即首位。而若采用现有的输入法,则用户在第二次输入编码字符串“jiji”时,用户上屏过一次的“记记”这个低频用户词就会排到“积极”这个系统高频词条之后,导致用户大概率可能会上屏的词条(“积极”)会被用户词库学到的低概率词条“记记”“挤”到后面去,将会加大用户上屏高频词条的操作代价。
本具体实例提供的输入法客户端安装方法,弥补了候选排序规则中的缺陷,在用户词库不存在(包括受损,或用户新安装输入法等)或用户词库规模较小时,自动从系统词库中按照一定规则预学习一部分词条加入到用户词库正常参与候选的学词、排序和调频,从而较好的解决在输入法安装初期,用户词库尚未积累到一定量级时,给用户提供的候选词条不够可靠的问题,提升了用户的使用体验。
实施例三
参照图4,示出了本发明实施例三的一种输入法客户端安装装置的结构框图。
本发明实施例的输入法客户端的安装装置包括:第一判断模块402,用于在输入法客户端安装过程中,判断终端上是否存在所述输入法客户端对应的用户词库;第二判断模块404,用于若所述第一判断模块402的判断结果为终端上存在所述用户词库,则判断所述用户词库规模是否小于第一设定阈值;第一预学习模块406,用于若所述第二判断模块404的判断结果为小于第一设定阈值,则按照第一设定规则从所述输入法客户端对应的系统词库中提取词条,并将提取的所述词条预学习至所述用户词库中。
通过本发明实施提供的输入法客户端安装装置,在输入法客户端安装过程中,判断用户词库规模是否小于第一设定阈值,若判断结果为小于,则确定安装该输入法客户端的用户为新用户,此时,便从系统词库中提取高频词条预学习到用户词库中以提升用户词库的规模即量级。通过本发明实施例提供的输入法客户端安装装置、安装的输入法客户端,当新用户输入编码字符串时,预学习的高频系统词条以及用户词库中本身存存储的用户词条则共同依据设定规则进行排序,可避免现有的输入法盲目将用户词条排序在高频系统词条前面的问题,因此,能够保证推送给新用户词条的可靠性。
实施例四
参照图5,示出了本发明实施例四的一种输入法客户端安装装置的结构框图。
本发明实施例是对实施例三中的输入法客户端安装装置的进一步优化,优化后的输入法客户端安装装置包括:第一判断模块502,用于在输入法客户端安装过程中,判断终端上是否存在所述输入法客户端对应的用户词库;第二判断模块504,用于若所述第一判断模块502的判断结果为终端上存在所述用户词库,则判断所述用户词库规模是否小于第一设定阈值;第一预学习模块506,用于若所述第二判断模块504的判断结果为小于第一设定阈值,则按照第一设定规则从所述输入法客户端对应的系统词库中提取词条,并将提取的所述词条预学习至所述用户词库中。
优选地,本发明实施例中的输入法客户端安装装置还包括:生成模块508,用于当所述第一判断模块502的判断结果为终端上未存在所述用户词库时,则生成用户词库;第二预学习模块510,用于按照第二设定规则从所述系统词库中提取词条,并将提取的所述词条预学习至生成的所述用户词库中。
优选地,所述第二预学习模块510包括:提取子模块5102,用于针对所述系统词库中存储的各编码字符串,分别提取当前编码字符串对应的满足设定条件的词条;存储子模块5104,用于将提取的所述词条预学习至生成的所述用户词库中。
优选地,所述第一预学习模块506按照第一设定规则从所述输入法客户端对应的系统词库中提取词条时:针对所述系统词库中存储的各编码字符串,分别提取当前编码字符串对应的满足设定条件的词条;和/或,针对所述用户词库中存储的各编码字符串,分别对当前编码字符串对应的词条进行分析,依据分析结果确定用户个性化特征,并从所述系统词库中提取与所述用户个性化特征相匹配的词条。
优选地,所述第一预学习模块506或所述提取子模块5102提取当前编码字符串对应的满足设定条件的词条时:提取当前编码字符串对应的、词频值大于设定的词频阈值的词条;或者,提取当前编码字符串对应的、满足预设排序规则的词条。
本发明实施例的输入法客户端安装装置用于实现前述实施例一、实施例二中相应的输入法客户端安装方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
实施例五
参照图6,示出了本发明实施例五的一种用于安装输入法客户端的装置的结构框图。
图6是根据一示例性实施例示出的一种用于安装输入法客户端的装置600的框图。例如,装置600可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,装置600可以包括以下一个或多个组件:处理组件602,存储器604,电源组件606,多媒体组件608,音频组件610,输入/输出(I/O)的接口612,传感器组件614,以及通信组件616。
处理组件602通常控制装置600的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件602可以包括一个或多个处理器620来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件602可以包括一个或多个模块,便于处理组件602和其他组件之间的交互。例如,处理组件602可以包括多媒体模块,以方便多媒体组件608和处理组件602之间的交互。
存储器604被配置为存储各种类型的数据以支持在装置600的操作。这些数据的示例包括用于在装置600上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件606为装置600的各种组件提供电力。电源组件606可以包括电源管理系统,一个或多个电源,及其他与为装置600生成、管理和分配电力相关联的组件。
多媒体组件608包括在所述装置600和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件608包括一个前置摄像头和/或后置摄像头。当装置600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件610被配置为输出和/或输入音频信号。例如,音频组件610包括一个麦克风(MIC),当装置600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中,音频组件610还包括一个扬声器,用于输出音频信号。
I/O接口612为处理组件602和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件614包括一个或多个传感器,用于为装置600提供各个方面的状态评估。例如,传感器组件614可以检测到装置600的打开/关闭状态,组件的相对定位,例如所述组件为装置600的显示器和小键盘,传感器组件614还可以检测装置600或装置600一个组件的位置改变,用户与装置600接触的存在或不存在,装置600方位或加速/减速和装置600的温度变化。传感器组件614可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件614还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件616被配置为便于装置600和其他设备之间有线或无线方式的通信。装置600可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件616还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器604,上述指令可由装置600的处理器620执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种输入法客户端安装方法,所述方法包括:在输入法客户端安装过程中,判断终端上是否存在所述输入法客户端对应的用户词库;若终端上存在所述用户词库,则判断所述用户词库规模是否小于第一设定阈值;若小于第一设定阈值,则按照第一设定规则从所述输入法客户端对应的系统词库中提取词条,并将提取的所述词条预学习至所述用户词库中。
图7是本发明实施例中服务器设备的结构示意图。该服务器设备1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessing units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器设备1900上执行存储介质1930中的一系列指令操作。
服务器设备1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本发明所提供的一种输入法客户端安装进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
在此提供的输入法客户端安装方案不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造具有本发明方案的系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的是输入法客户端安装方案中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (6)

1.一种输入法客户端安装方法,其特征在于,包括:
在输入法客户端安装过程中,判断终端上是否存在所述输入法客户端对应的用户词库;
若终端上存在所述用户词库,则判断所述用户词库规模是否小于第一设定阈值;
若小于第一设定阈值,则按照第一设定规则从所述输入法客户端对应的系统词库中提取词条,并将提取的所述词条预学习至所述用户词库中;
其中,提取的所述词条包括:所述系统词库中存储的各编码字符串对应的、词频值大于设定的词频阈值的词条;或者,所述系统词库中存储的各编码字符串对应的、满足预设排序规则的词条。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当终端上不存在所述用户词库时,则生成用户词库;
按照第二设定规则从所述系统词库中提取词条,并将提取的所述词条预学习至生成的所述用户词库中。
3.根据权利要求2所述的方法,其特征在于,所述按照第二设定规则从所述系统词库中提取词条的步骤包括:
针对所述系统词库中存储的各编码字符串,分别提取当前编码字符串对应的满足设定条件的词条。
4.根据权利要求1所述的方法,其特征在于,所述按照第一设定规则从所述输入法客户端对应的系统词库中提取词条的步骤包括:
针对所述系统词库中存储的各编码字符串,分别提取当前编码字符串对应的满足设定条件的词条;和/或,
针对所述用户词库中存储的各编码字符串,分别对当前编码字符串对应的词条进行分析,依据分析结果确定用户个性化特征,并从所述系统词库中提取与所述用户个性化特征相匹配的词条。
5.一种输入法客户端安装装置,其特征在于,包括:
第一判断模块,用于在输入法客户端安装过程中,判断终端上是否存在所述输入法客户端对应的用户词库;
第二判断模块,用于若所述第一判断模块的判断结果为终端上存在所述用户词库,则判断所述用户词库规模是否小于第一设定阈值;
第一预学习模块,用于若所述第二判断模块的判断结果为小于第一设定阈值,则按照第一设定规则从所述输入法客户端对应的系统词库中提取词条,并将提取的所述词条预学习至所述用户词库中;
其中,提取的所述词条包括:所述系统词库中存储的各编码字符串对应的、词频值大于设定的词频阈值的词条;或者,所述系统词库中存储的各编码字符串对应的、满足预设排序规则的词条。
6.一种用于安装输入法客户端的装置,其特征在于,包括存储器,以及一个或者一个以上的程序,其中所述一个或者一个以上程序存储于所述存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上包含用于进行以下操作的指令的程序:
在输入法客户端安装过程中,判断终端上是否存在所述输入法客户端对应的用户词库;
若终端上存在所述用户词库,则判断所述用户词库规模是否小于第一设定阈值;
若小于第一设定阈值,则按照第一设定规则从所述输入法客户端对应的系统词库中提取词条,并将提取的所述词条预学习至所述用户词库中;
其中,提取的所述词条包括:所述系统词库中存储的各编码字符串对应的、词频值大于设定的词频阈值的词条;或者,所述系统词库中存储的各编码字符串对应的、满足预设排序规则的词条。
CN201510825201.XA 2015-11-24 2015-11-24 一种输入法客户端安装方法和装置 Active CN106775794B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510825201.XA CN106775794B (zh) 2015-11-24 2015-11-24 一种输入法客户端安装方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510825201.XA CN106775794B (zh) 2015-11-24 2015-11-24 一种输入法客户端安装方法和装置

Publications (2)

Publication Number Publication Date
CN106775794A CN106775794A (zh) 2017-05-31
CN106775794B true CN106775794B (zh) 2021-02-12

Family

ID=58963702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510825201.XA Active CN106775794B (zh) 2015-11-24 2015-11-24 一种输入法客户端安装方法和装置

Country Status (1)

Country Link
CN (1) CN106775794B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113515618A (zh) * 2020-04-09 2021-10-19 北京搜狗科技发展有限公司 语音处理方法、装置和介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2003536A1 (en) * 2007-06-14 2008-12-17 NTT DoCoMo, Inc. Character input assist method, character input assist system, character input assist program, user terminal, character conversion method and character conversion program
CN101334774B (zh) * 2007-06-29 2013-08-14 北京搜狗科技发展有限公司 一种字符输入的方法和输入法系统
US8027964B2 (en) * 2007-07-13 2011-09-27 Medio Systems, Inc. Personalized query completion suggestion
CN101140585A (zh) * 2007-09-24 2008-03-12 腾讯科技(深圳)有限公司 用户词库管理系统和管理方法
CN101183351B (zh) * 2007-12-07 2011-05-11 腾讯科技(深圳)有限公司 一种文字输入方法及其系统
CN101290632B (zh) * 2008-05-30 2011-09-14 北京搜狗科技发展有限公司 一种用户词参与智能组词输入的方法及一种输入法系统
CN101510157B (zh) * 2008-09-03 2011-11-30 北京搜狗科技发展有限公司 一种输入法安装方法及装置
CN201897791U (zh) * 2010-09-10 2011-07-13 中兴通讯股份有限公司 一种用户词库扩容装置
JP6013951B2 (ja) * 2013-03-14 2016-10-25 本田技研工業株式会社 環境音検索装置、環境音検索方法

Also Published As

Publication number Publication date
CN106775794A (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
US11120078B2 (en) Method and device for video processing, electronic device, and storage medium
CN108038102B (zh) 表情图像的推荐方法、装置、终端及存储介质
CN111968635B (zh) 语音识别的方法、装置及存储介质
CN107291772B (zh) 一种搜索访问方法、装置及电子设备
CN107346182B (zh) 一种构建用户词库的方法、及用于构建用户词库的装置
CN111831806B (zh) 语义完整性确定方法、装置、电子设备和存储介质
CN112711723B (zh) 一种恶意网址检测方法、装置及电子设备
CN109685041B (zh) 图像分析方法及装置、电子设备和存储介质
CN106815291B (zh) 搜索结果项展现方法、装置和用于搜索结果项展现的装置
CN105095253B (zh) 网页显示方法及装置
CN111382339A (zh) 一种搜索处理方法、装置和用于搜索处理的装置
CN111753917A (zh) 数据处理方法、装置及存储介质
CN109558553B (zh) 样式确定方法及装置
CN111739535A (zh) 一种语音识别方法、装置和电子设备
CN108197105B (zh) 自然语言处理方法、装置、存储介质及电子设备
CN109725736B (zh) 一种候选排序方法、装置及电子设备
CN106776990B (zh) 一种信息处理方法、装置及电子设备
CN108073293B (zh) 一种目标词组的确定方法和装置
CN106775794B (zh) 一种输入法客户端安装方法和装置
CN111324214B (zh) 一种语句纠错方法和装置
CN111813932A (zh) 文本数据的处理方法、分类方法、装置及可读存储介质
CN109901726B (zh) 一种候选词生成方法、装置及用于候选词生成的装置
CN111382367B (zh) 一种搜索结果排序方法和装置
CN113342684A (zh) 一种网页的测试方法、装置及设备
CN108345590B (zh) 一种翻译方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant