CN109426354A - 一种输入方法、装置和用于输入的装置 - Google Patents

一种输入方法、装置和用于输入的装置 Download PDF

Info

Publication number
CN109426354A
CN109426354A CN201710744911.9A CN201710744911A CN109426354A CN 109426354 A CN109426354 A CN 109426354A CN 201710744911 A CN201710744911 A CN 201710744911A CN 109426354 A CN109426354 A CN 109426354A
Authority
CN
China
Prior art keywords
error correction
string
preset
classification
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710744911.9A
Other languages
English (en)
Other versions
CN109426354B (zh
Inventor
费腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201710744911.9A priority Critical patent/CN109426354B/zh
Publication of CN109426354A publication Critical patent/CN109426354A/zh
Application granted granted Critical
Publication of CN109426354B publication Critical patent/CN109426354B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供了一种输入方法、装置和用于输入的装置。其中的方法具体包括:获取用户的输入串对应的至少一个纠错串;确定所述纠错串和所述输入串对应的纠错类别;根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示。本发明实施例可以按照纠错类别对输入串进行纠错并且展示纠错候选项,以提高用户的输入效率。

Description

一种输入方法、装置和用于输入的装置
技术领域
本发明涉及输入法技术领域,尤其涉及一种输入方法、装置和用于输入的装置。
背景技术
随着输入法的不断发展,纠错功能已经成为输入法最基本的功能,当输入法检测到用户的输入出现错误时,会对错误的字符进行纠错,以得到正确的候选项并提供给用户,从而提高输入效率。
例如,某用户分不清平舌音和卷舌音,该用户输入字符串“zeyang”并且通过翻页、选择等操作上屏了候选项“这样”,下次,当该用户再次输入字符串“zeyang”时,输入法会对字符串“zeyang”进行纠错得到“zheyang”,并且将候选项“这样”排在候选项列表中靠前的位置以便用户选择,进而可以提高输入效率。
但是,当该用户再次犯了同样的错误,例如,输入字符串“zejiang”想要得到候选项“浙江”,或者,该用户输入字符串“side”想要得到候选项“是的”时,却仍然无法得到想要的候选项“浙江”或者“是的”,用户只能删除错输的字符并重新输入,或者,用户需要经过多次翻页、选择等操作得到所需的候选项,可见,目前的输入法不能对用户同一类别的输入错误给出有效的纠错。
发明内容
本发明实施例提供一种输入方法、装置和用于输入的装置,以解决现有技术中错误类别相同情况下的词汇纠错效率较低的问题。
为了解决上述问题,本发明公开了一种输入方法,包括:
获取用户的输入串对应的至少一个纠错串;
确定所述纠错串和所述输入串对应的纠错类别;
根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示。
另一方面,本发明公开了一种输入装置,包括:
纠错串获取模块,用于获取用户的输入串对应的至少一个纠错串;
纠错类别确定模块,用于确定所述纠错串和所述输入串对应的纠错类别;
候选项展示模块,用于根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示。
可选地,所述纠错类别确定模块,包括:
查询子模块,用于根据纠错对查询预置的纠错类别表,以得到所述纠错对相应的纠错类别;所述纠错对包括所述输入串与其对应的纠错串;所述纠错类别表用于存储预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
可选地,所述装置还包括:纠错类别表确定模块,用于确定所述纠错类别表;所述纠错类别表确定模块,包括:
分类子模块,用于根据预置输入串和预置纠错串之间的关系特征,确定预置输入串和预置纠错串对应的预置纠错类别;
第一建立子模块,用于建立并保存所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
可选地,所述装置还包括:纠错类别表确定模块,用于确定所述纠错类别表;所述纠错类别表确定模块,包括:
相似度确定子模块,用于根据预置纠错对相应的纠错得分,确定至少两个预置纠错对之间的相似度;所述预置纠错对包括预置输入串与其对应的预置纠错串;
相似性得分确定子模块,用于根据所述纠错得分,确定所述预置纠错对之间的相似性得分,将相似性得分大于预设阈值的预置纠错对划分到同一纠错类别中
第二建立子模块,用于建立并保存所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
可选地,所述装置还包括:
纠错类别表更新模块,用于依据至少两个预置纠错对之间的相似度,对所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系进行更新。
可选地,所述纠错类别的特征包括:纠错类别的使用频次和/或使用间隔;则所述候选项展示模块,包括:
得分调整子模块,用于根据所述纠错类别的使用频次和/或使用间隔,调整所述纠错串对应候选项的排序得分;
排序展示子模块,用于根据所述排序得分,对所述纠错串对应的纠错候选项进行排序展示。
可选地,所述得分调整子模块,包括:
第一调整单元,用于若所述纠错类别的使用频次超过第一阈值、且未超过第二阈值,则减少所述纠错串对应候选项的排序得分;和/或
第二调整单元,用于若所述纠错类别的使用频次超过第二阈值,且所述纠错类别的使用间隔小于预设间隔阈值,则保持所述纠错串对应候选项的排序得分;和/或
第三调整单元,用于若所述纠错类别的使用频次超过第二阈值、且所述纠错类别的使用间隔超过预设间隔阈值,则减少所述纠错串对应候选项的排序得分。
可选地,所述纠错类别的特征包括:纠错类别的使用频次和/或使用间隔,所述装置还包括:
使用频次更新模块,用于若用户对所述纠错串对应的纠错候选项执行上屏操作,则增加所述纠错类别的使用频次,否则,减少所述纠错类别的使用频次。
再一方面,本发明公开了一种用于输入的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户的输入串对应的至少一个纠错串;
确定所述纠错串和所述输入串对应的纠错类别;
根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示。
可选地,所述确定所述纠错串和所述输入串对应的纠错类别,包括:
根据纠错对查询预置的纠错类别表,以得到所述纠错对相应的纠错类别;所述纠错对包括所述输入串与其对应的纠错串;所述纠错类别表用于存储预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
可选地,通过如下步骤确定所述纠错类别表:
根据预置输入串和预置纠错串之间的关系特征,确定预置输入串和预置纠错串对应的预置纠错类别;
建立并保存所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
可选地,通过如下步骤确定所述纠错类别表:
根据预置纠错对相应的纠错得分,确定至少两个预置纠错对之间的相似度;所述预置纠错对包括预置输入串与其对应的预置纠错串;
根据所述纠错得分,确定所述预置纠错对之间的相似性得分,将相似性得分大于预设阈值的预置纠错对划分到同一纠错类别中;
建立并保存所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
可选地,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据至少两个预置纠错对之间的相似度,对所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系进行更新。
可选地,所述纠错类别的特征包括:纠错类别的使用频次和/或使用间隔;则所述根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示,包括:
根据所述纠错类别的使用频次和/或使用间隔,调整所述纠错串对应候选项的排序得分;
根据所述排序得分,对所述纠错串对应的纠错候选项进行排序展示。
可选地,所述根据所述纠错类别的使用频次和/或使用间隔调整所述纠错串对应候选项的排序得分,包括:
若所述纠错类别的使用频次超过第一阈值、且未超过第二阈值,则减少所述纠错串对应候选项的排序得分;和/或
若所述纠错类别的使用频次超过第二阈值,且所述纠错类别的使用间隔小于预设间隔阈值,则保持所述纠错串对应候选项的排序得分;和/或
若所述纠错类别的使用频次超过第二阈值、且所述纠错类别的使用间隔超过预设间隔阈值,则减少所述纠错串对应候选项的排序得分。
可选地,所述纠错类别的特征包括:纠错类别的使用频次和/或使用间隔,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
若用户对所述纠错串对应的纠错候选项执行上屏操作,则增加所述纠错类别的使用频次,否则,减少所述纠错类别的使用频次。
又一方面,本发明公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的输入方法。
本发明实施例包括以下优点:
本发明实施例在获取用户的输入串对应的至少一个纠错串之后,可以确定所述纠错串和所述输入串对应的纠错类别,即使用户之前从未输入过当前输入串,也可以得知当前输入串所属的纠错类别,并且根据纠错类别的特征,向用户展示当前纠错串对应的纠错候选项,以便用户可以直接选择纠错候选项,因此本发明实施例可以按照纠错类别对输入串进行纠错并且展示纠错候选项,以提高用户的输入效率。例如,用户首次输入“side”时,可以确定输入串“si”和纠错串“shi”对应的纠错类别为类别1,即可根据类别1的特征,对纠错候选项“是的”进行排序展示,若类别1的特征为使用概率较高,则“是的”可以排在靠前的位置,以便用户直接选择,提高用户的输入效率。若类别1的特征为使用概率较低,则“是的”可以排在靠后的位置,以避免对用户的干扰。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一种输入方法实施例的步骤流程图;
图2是本发明的一种确定所述纠错类别表方法实施例的步骤流程图;
图3是本发明的另一种确定所述纠错类别表方法实施例的步骤流程图;
图4是本发明的一种输入装置实施例的结构框图;
图5是本发明的一种用于输入的装置800的框图;及
图6是本发明的一种服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
方法实施例一
参照图1,示出了本发明的一种输入方法实施例的步骤流程图,具体可以包括:
步骤101、获取用户的输入串对应的至少一个纠错串;
本发明实施例可应用于键盘符号输入、手写输入、语音输入等输入方式的输入法程序,为便于描述,本发明实施例将用户在上述输入方式下输入的编码字符串称为输入串。本发明实施例适用于中文、英文、日文等各种语言的输入,为方便起见,以下均以中文为例进行描述。在输入中文时,通常需要键入字母、数字、符号等字符,输入法程序将所获取的用户输入字符转换为中文。
本发明实施例针对用户在输入过程中可能出现的错误进行纠错,所涉及的纠错场景可以包括但不限于如下情况:由于用户分不清平舌音和卷舌音、前鼻音和后鼻音等原因导致拼写错误的情况;或者,用户在使用键盘进行输入时,由于输入速度较高或者盲打时,出现漏输、错输、字符颠倒、以及误点在目标按键的邻近按键上的情况,其中,目标按键可以为用户的输入意图所对应的按键、也即用户意图输入的按键,例如,用户欲点击目标按键“s”,以输入字符“s”,由于输入速度较高误点击在邻近按键“a”上,输入错误字符“a”;或者,在使用手机等智能终端的触摸虚拟键盘进行输入时,由于虚拟键盘的按键尺寸相对较小,出现误点在邻近按键的情况;或者,由于行走、车辆颠簸、或者碰撞等原因导致智能终端或者操作移动终端的手指或触控笔出现抖动现象,从而导致错误输入的情况等。
在实际应用中,输入法程序根据纠错算法对用户输入串中的错误字符进行纠错,以获取用户的输入串对应的至少一个纠错串。所述纠错算法具体可以包括位置纠错、力度纠错和临近键位纠错中的至少一种。
其中,位置纠错算法指通过确定用户点击按键的位置偏离按键中心的方向和距离,对输入的字符进行纠错。例如,用户点击在按键“c”的左上角位置,则用户有可能原本打算输入字符“d”,而误点击在按键“c”上。
力度纠错算法指通过确定用户点击按键的力度,对输入的字符进行纠错。例如,通过统计用户的点击行为,得到用户正常点击按键时的力度范围,如果用户的某次点击不在该力度范围内,可以认为是用户的误点击操作。比如,用户在手机屏幕解锁的情况下,不小心触碰到某按键,此时的点击力度小于用户正常点击按键时的力度范围,则可以删除用户误点击按键输入的错误字符。
临近键位纠错算法指通过将用户输入字符替换为该字符临近的各按键字符,对对输入的字符进行纠错。例如,用户原本想要输入的输入串为“woai”,可以由于键盘中按键“o”和按键“i”为临近键位,用户误将“o”输入为“i”,则实际输入的输入串为“wiai”,本发明实施例可以通过对输入串“wiai”进行临近键位纠错,确定该输入串中的错误字符为“i”,并且对该错误字符进行纠错处理,替换为正确字符“o”,得到纠错串“woai”。
其中,对错误字符进行纠错处理,具体可以包括替换、删除、增加等操作。例如,由于键盘狭小等原因,用户误点击到错误字符上,则可以使用正确字符替换错误字符进行纠错处理;再如,由于用户点击速度过快等原因,可能会出现多点击或者漏点击某个字符的情况,则可以删除多点击的字符,或者增加漏点击的字符进行纠错处理。
当然,在实际应用中,可以利用任意的纠错算法对输入串进行纠错处理,以得到所述输入串对应的至少一个纠错串。例如,除了上述列举的纠错算法外,还可以采用基于编辑距离的纠错算法和基于统计的纠错算法等。
其中,基于编辑距离的纠错算法具体可以包括:对输入串的每个位置进行如下四种纠错尝试:插入一个字符、删除一个字符、替换一个字符和替换前后两个字符位置,以产生该输入串对应的纠错串序列。
基于统计的纠错算法可以通过大数据挖掘生成纠错模型,该纠错模型可用于学习纠错串被错输为输入串的概率(以下简称纠错模型概率),则可以向该纠错模型输入输入串,并由该纠错模型输出各纠错串被错输为输入串的概率。例如,输入串为“wiai”,纠错串为“woai”,则上述纠错模型概率可用于表示“woai”被错输成“wiai”的概率,在实际应用中,可以对用户的输入行为进行统计分析,以得到上述纠错模型概率。可以理解,本发明实施例对于具体的纠错算法不加以限制。
步骤102、确定所述纠错串和所述输入串对应的纠错类别;
其中,所述纠错类别表示纠错串相对于输入串的纠错种类。例如,用户想要输入“这样”时,由于用户分不清平舌音和卷舌音,错误输入“zeyang”,则应该将输入串“ze”进行纠错得到纠错串“zhe”,纠错串“zhe”相对于输入串“ze”的纠错种类为卷舌音错输为平舌音;再如,用户想要输入“音乐”时,由于用户分不清前鼻音和后鼻音,错误输入“yingyue”,则应该将输入串“ying”进行纠错得到纠错串“yin”,纠错串“yin”相对于输入串“ying”的纠错种类为后鼻音错输为前鼻音。
在实际应用中,对用户的某一个输入串进行纠错可以得到多个对应的纠错串,因此,可以将该输入串和其对应的每一个纠错串组成一个纠错对,确定每一个纠错对相应的纠错类别。例如,对于输入串1,对应有如下3个纠错串:纠错串1、纠错串2和纠错串3,则可以组成如下3个纠错对:(输入串1,纠错串1)、(输入串1,纠错串2)和(输入串1,纠错串3),分别确定每一个纠错对相应的纠错类别,由此,可以得到输入串1和纠错串1对应的纠错类别、输入串1和纠错串2对应的纠错类别、以及输入串1和纠错串3对应的纠错类别。
在本发明的一种可选实施例中,所述确定所述纠错串和所述输入串对应的纠错类别,具体可以包括:
根据纠错对查询预置的纠错类别表,以得到所述纠错对相应的纠错类别;所述纠错对包括所述输入串与其对应的纠错串;所述纠错类别表用于存储预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
本发明实施例可以预先建立纠错类别表,该纠错类别表用于存储预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。在用户的输入过程中,将用户当前的纠错串和输入串组成的纠错对作为关键词查询所述纠错类别表,即可得到所述纠错串和所述输入串对应的纠错类别。所述纠错类别表可以通过人工方式建立,也可以依据至少一个用户的输入行为数据建立,本发明实施例对于所述纠错类别表的建立方式不加以限制。参见表1,示出了本发明实施例的一种纠错类别表的具体示意。其中,类别1为卷舌音错输为平舌音,类别2为后鼻音错输为前鼻音,类别3为邻近按键错输。
表1
输入串 纠错串 纠错类别
ze zhe 类别1
si shi 类别1
yin ying 类别2
zhing zhong 类别3
在本发明的一种应用示例中,用户输入“zeyang”,根据现有的纠错算法对该用户的输入串进行纠错,例如将输入串“ze”进行纠错得到纠错串“zhe”,则根据输入串“ze”和纠错串“zhe”查询表1,得到输入串“ze”和纠错串“zhe”对应的纠错类别为类别1。
步骤103、根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示。
在实际应用中,由于用户的输入习惯不同,可能会导致纠错结果不够准确。例如,用户A分不清平舌音和卷舌音,因此,用户A经常将“zheyang”错误输成“zeyang”,将“shide”错误输出“side”等,对于用户A,其输入的“zeyang”为错误输入串的概率较大,需要进行纠错,以方便用户A选择正确的候选项;但是,对于能够分清平舌音和卷舌音的用户B,其输入“zeyang”时,有可能是用户B欲输入“泽阳”,如果此时对用户B的输入串“zeyang”进行纠错,反而给用户B造成困扰,影响用户B的输入效率。
为解决上述问题,本发明实施例在确定所述纠错串和所述输入串对应的纠错类别之后,根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示,其中,所述纠错类别的特征可以为纠错类别的使用概率等特征。例如,在用户A的输入过程中,根据纠错类别的特征可以得知用户A出现类别1的概率较高,则输入法程序可以将该类别的纠错候选项排在靠前的位置,以便用户A进行选择。再如,在用户B的输入过程中,根据纠错类别的特征可以得知用户B出现类别1的概率较低,则输入法程序可以将该类别的纠错候选项排在靠后的位置,以避免对用户B的干扰。
在本发明的一种可选实施例中,所述纠错类别的特征具体可以包括:纠错类别的使用频次和/或使用间隔;则所述根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示,具体可以包括:
根据所述纠错类别的使用频次和/或使用间隔,调整所述纠错串对应纠错候选项的排序得分;
根据所述排序得分,对所述纠错串对应的纠错候选项进行排序展示。
在实际应用中,可以通过纠错候选项与上下文的二元连接关系计算纠错候选项的排序得分,或者,还可以根据系统词库和/或用户词库中的词频计算纠错候选项的排序得分等,本发明实施例对于计算纠错候选项的排序得分的具体方法不加以限制。本发明实施例根据纠错类别的使用频次和/或使用间隔,对所述排序得分再进行调整,以使最终的排序得分可以体现纠错类别对用户的影响。
在本发明的一种应用示例中,假设词库中存储有词条之间的二元连接关系,例如,“中国|北京”、“中国|上海”、“中国|河北”等二元连接关系,也即,词条“中国”和词条“北京”具有二元连接关系,词条“中国”和词条“上海”具有二元连接关系,词条“中国”和词条“河北”具有二元连接关系等。当纠错串的上文为“中国”时,若纠错串对应的纠错候选项为“北京”,则纠错候选项“北京”可以具有较高的排序得分。或者,通过查询系统词库,纠错候选项“北京”的词频较高,则纠错候选项“北京”可以具有较高的排序得分等。
其中,词库中存储的词条之间的连接关系还可以为三元、四元等多元连接关系,本发明实施例对于多元连接关系的元数不加以限制。此外,本发明实施例中的词库具体可以包括:本地词库和/或云词库。所述本地词库具体可以包括:本地缓存词库和/或用户词库和/或系统词库和/或细胞词库等。可以理解,所述本地词库可以包括传统技术中的任一种词库或其组合,也可以为由本领域技术人员根据预置规则获取的任一种词库,并且所述本地词库的存储位置可以存在于服务器端或客户端,本发明实施例对于所述本地词库的类型以及存储方式均不加以限制。所述云词库可存储于云服务器中,所述云词库可以实时收集不同用户的输入数据,以对本地词库中的词条进行扩充,满足更多用户的输入需求。
在本发明实施例中,可以在用户的客户端存储所述纠错类别表,并且在纠错类别表中保存纠错类别的特征。当然,所述纠错类别表也可以存储在服务器中,通过用户账号或者客户端的设备标识区分不同用户的纠错类别表。参见表2,示出了本发明的一种用户A的客户端存储的纠错类别表的具体示意。以及参见表3,示出了本发明的一种用户B的客户端存储的纠错类别表的具体示意。可以理解,在实际应用中,可以为多个用户建立具有相同输入串、纠错串和纠错类别的通用的纠错类别表,或者,还可以根据用户不同的输入习惯,建立具有不同输入串、纠错串和纠错类别的个性化的纠错类别表,本发明实施例对于纠错类别表中输入串、纠错串和纠错类别的具体内容不加以限制。
表2
输入串 纠错串 纠错类别 使用频次 使用间隔
ze zhe 类别1 10 5分钟
si shi 类别1 8 3分钟
表3
输入串 纠错串 纠错类别 使用频次 使用间隔
ze zhe 类别1 1 5天
si shi 类别1 2 6天
以纠错类别的特征为使用频次为例,假设用户A输入“zeyang”,输入法程序对输入串“ze”进行纠错,得到对应的纠错串“zhe”,查询用户A的纠错类别表得到输入串“ze”和纠错串“zhe”对应的纠错类别为类别1,且类别1对应用户A的使用频次较高,说明用户A将“zhe”错输成“ze”的概率较高,则可以调整纠错候选项“这样”具有较高的排序得分,以使纠错候选项“这样”可以排在靠前的位置,以便用户A进行选择。而类别1对应用户B的使用频次较低,说明用户B可以分清平舌音和卷舌音,将“zhe”错输成“ze”的概率较低,则可以调整纠错候选项“这样”具有较低的排序得分,以使纠错候选项“这样”可以排在靠后的位置,或者在候选列表中不出现纠错候选项“这样”,以避免对用户B的干扰。
在上述示例中,还可以根据纠错类别的使用间隔对纠错候选项进行排序,例如对于用户A,查询得到输入串“ze”和纠错串“zhe”对应的纠错类别为类别1,类别1对应用户A的使用间隔为5分钟,说明用户A刚刚出现过此类错误,那么,用户A再次出现此类错误的概率较高,则可以调整纠错候选项“这样”具有较高的排序得分,以使纠错候选项“这样”可以排在靠前的位置,以便用户A进行选择。而类别1对应用户B的使用间隔为5天,说明用户B可以分清平舌音和卷舌音,将“zhe”错输成“ze”的概率较低,则可以调整纠错候选项“这样”具有较低的排序得分,以使纠错候选项“这样”可以排在靠后的位置,或者在候选列表中不出现纠错候选项“这样”,以避免对用户B的干扰。
可以理解,在实际应用中,本领域技术人员可以单独采用纠错类别的使用频次调整纠错串对应纠错候选项的排序得分,或者,单独采用纠错类别的使用间隔调整纠错串对应纠错候选项的排序得分,或者,采用纠错类别的使用频次和使用间隔的组合调整纠错串对应纠错候选项的排序得分,本发明实施例对于调整纠错串对应纠错候选项的排序得分的具体方案不加以限制。
在本发明的一种可选实施例中,所述纠错类别的特征具体可以包括:纠错类别的使用频次和/或使用间隔,所述方法还可以包括:
若用户对所述纠错串对应的纠错候选项执行上屏操作,则增加所述纠错类别的使用频次,否则,减少所述纠错类别的使用频次。
在用户的实际输入过程中,输入法程序对用户当前的输入串进行纠错得到对应的纠错串,查询纠错类别表得到输入串和纠错串对应的纠错类别,根据纠错类别的使用频次和/或使用间隔对纠错候选项进行排序并展示。如果用户上屏了纠错候选项,则可以增加当前的输入串和纠错串对应的纠错类别的使用频次,例如将当前的纠错类别的使用频次加1,并且记录当前的使用时间,所述使用时间可用于计算纠错类别的使用间隔。如果用户没有上屏纠错候选项,则减少当前的输入串和纠错串对应的纠错类别的使用频次,例如将当前的纠错类别的使用频次减1,且保持纠错类别原有的使用时间不变。
可选地,本发明实施例在用户手动纠错的过程中,也可以更新纠错类别的使用频次。例如,用户输入“zejiang”之后,发现拼写错误,手动删除并修改为“zhejiang”,最终上屏了候选项“浙江”。此时,可以增加输入串“ze”和纠错串“zhe”对应纠错类别的使用频次,并且记录纠错类别的使用时间。可选地,在该场景下,可以对使用频次增加一个较高的增量,例如,可以对输入串“ze”和纠错串“zhe”对应纠错类别的使用频次加5。
在本发明的一种可选实施例中,所述根据所述纠错类别的使用频次和/或使用间隔调整所述纠错串对应纠错候选项的排序得分,具体可以包括:
若所述纠错类别的使用频次超过第一阈值、且未超过第二阈值,则减少所述纠错串对应纠错候选项的排序得分;和/或
若所述纠错类别的使用频次超过第二阈值,且所述纠错类别的使用间隔小于预设间隔阈值,则保持所述纠错串对应纠错候选项的排序得分;和/或
若所述纠错类别的使用频次超过第二阈值、且所述纠错类别的使用间隔超过预设间隔阈值,则减少所述纠错串对应纠错候选项的排序得分。
本发明实施例可以根据所述纠错类别的使用频次和/或使用间隔调整所述纠错串对应候选项的排序得分,具体可以采用分段函数的方法。例如,若纠错类别的使用频次超过第一阈值、且未超过第二阈值,则减少所述纠错串对应候选项的排序得分;其中,第一阈值可以设置为某一负值,例如-20,第二阈值可以设置为0,如果纠错类别的使用频次在-20和0之间,说明用户很少出现此类错误,则可以对当前纠错串对应候选项的排序得分做惩罚,如惩罚值为a,以减少当前纠错串对应纠错候选项的排序得分。
若所述纠错类别的使用频次超过第二阈值,且所述纠错类别的使用间隔小于预设间隔阈值,则保持所述纠错串对应候选项的排序得分。其中,所述第二阈值为0,预设间隔阈值可以设置为1天。如果纠错类别的使用频次大于0,并且使用间隔小于1天,说明用户刚刚出现过此类错误,下次再出现此类错误的概率较高,则可以对当前纠错串对应候选项的排序得分不做惩罚,即保持当前纠错串对应候选项的排序得分不变。
若所述纠错类别的使用频次超过第二阈值、且所述纠错类别的使用间隔超过预设间隔阈值,则减少所述纠错串对应候选项的排序得分。其中,所述第二阈值为0,预设间隔阈值为1天。如果纠错类别的使用频次大于0,并且使用间隔大于1天,说明用户虽然以前出现过此类错误的概率较高,但是近期没有出现此类错误,说明用户下次有可能还会出现此类错误,但是出现的概率不会太高,因此可以对当前纠错串对应候选项的排序得分做惩罚,如惩罚值为b,且b<a,其中,a、b可以为负数。
进一步地,如果纠错类别的使用频次小于第一阈值,例如小于-20,说明用户出现此类错误的概率非常低,此时,可以不对用户的输入串进行纠错,以避免对用户的输入造成干扰。
可以理解,在实际应用中,本领域技术人员可以根据需要灵活设置上述分段函数的段数、第一阈值、第二阈值、第三阈值、预设间隔阈值、惩罚值、以及使用频次的增量等,本发明对此不加以限制。
综上,本发明实施例的输入方法,在获取用户的输入串对应的至少一个纠错串之后,可以确定所述纠错串和所述输入串对应的纠错类别,即使用户之前从未输入过当前输入串,也可以得知当前输入串所属的纠错类别,并且根据纠错类别的特征,向用户展示当前纠错串对应的纠错候选项,以便用户可以直接选择纠错候选项,因此本发明实施例可以按照纠错类别对输入串进行纠错并且展示纠错候选项,以提高用户的输入效率。例如,用户首次输入“side”时,可以确定输入串“si”和纠错串“shi”对应的纠错类别为类别1,即可根据类别1的特征,对纠错候选项“是的”进行排序展示,若类别1的特征为使用概率较高,则“是的”可以排在靠前的位置,以便用户直接选择,提高用户的输入效率。若类别1的特征为使用概率较低,则“是的”可以排在靠后的位置,以避免对用户的干扰。
方法实施例二
本实施例在上述实施例一的基础上,详细说明确定所述纠错类别表的具体过程。本发明实施例可以采用两种方案确定纠错类别表,一种是对纠错类别进行人工分类,以确定纠错类别表;另一种是依据至少一个用户的输入行为数据进行分类,以确定纠错类别表。此外,建立纠错类别表的过程可以在用户的客户端执行,并且直接保存在用户的客户端;或者,输入法程序可以收集用户的输入行为数据,并且将定期将用户的输入行为数据上传至服务器,由服务器根据用户的输入行为数据进行纠错类别划分,建立纠错类别表,以及将纠错类别表发送至用户的客户端。可以理解,本发明实施例对建立纠错类别表的执行客体不加以限制。
参照图2,示出了本发明的一种确定所述纠错类别表方法实施例的步骤流程图,具体可以包括:
步骤201、根据预置输入串和预置纠错串之间的关系特征,确定预置输入串和预置纠错串对应的预置纠错类别;
步骤202、建立并保存所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
在实际应用中,可以对纠错类别进行人工分类,具体地,根据预置输入串和预置纠错串之间的关系特征,确定预置输入串和预置纠错串对应的预置纠错类别。所述预置输入串和预置纠错串之间的关系特征至少可以包括如下中的一种:键盘位置相近的错输、多输、漏输、前后颠倒、模糊音等,其中模糊音具体可以包括:平舌音和卷舌音不分、前鼻音和后鼻音不分、n和l不分、f和h不分、r和l不分等。可以理解,本发明实施例对于所述预置输入串和预置纠错串之间的关系特征的具体类型不加以限制。
在本发明的一种应用示例中,采用人工分类的方式确定纠错类别表。例如,首先,根据预置输入串和预置纠错串之间的关系特征,获取大多数用户容易错输的预置输入串和预置纠错串,并且对预置输入串和预置纠错串进行分类,如预置输入串“ze”和预置纠错串“zhe”、以及预置输入串“si”和预置纠错串“shi”都属于平舌音和卷舌音不分的情况,因此可以划为同一纠错类别;预置输入串“zhing”和预置纠错串“zhong”属于键盘位置相近的错输情况;预置输入串“zhng”和预置纠错串“zhang”属于漏输的情况等;然后,记录预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。例如,记录类别1为卷舌音错输为平舌音,类别2为后鼻音错输为前鼻音,类别3为邻近按键错输,类别4为漏输等。参见表4,示出了本发明的一种采用人工分类方式确定的纠错类别表的具体示意。
表4
本发明实施例除了可以通过人工分类的方式预先建立纠错类别表,还可以依据至少一个用户的输入行为数据进行分类,自动建立纠错类别表。参照图3,示出了本发明的另一种确定所述纠错类别表方法实施例的步骤流程图,具体可以包括:
步骤301、根据预置纠错对相应的纠错得分,确定至少两个预置纠错对之间的相似度;所述预置纠错对包括预置输入串与其对应的预置纠错串;
步骤302、根据所述纠错得分,确定所述预置纠错对之间的相似性得分,将相似性得分大于预设阈值的预置纠错对划分到同一纠错类别中;
步骤303、建立并保存所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
本发明实施例利用预置纠错对之间的相似度进行纠错类别的分类,例如预置纠错对(ze,zhe)和预置纠错对(si,shi)之间的相似度较高,都属于平舌音和卷舌音不分的情况,因此,可以将预置输入串“ze”和预置纠错串“zhe”,与预置输入串“si”和预置纠错串“shi”划分到同一纠错类别中。具体地,本发明实施例根据所述预置纠错对相应的纠错得分,确定所述预置纠错对之间的相似性得分,将相似性得分大于预设阈值的预置纠错对划分到同一纠错类别中。
其中,所述预置纠错对相应的纠错得分可以根据用户的上屏操作所确定,例如,输入法程序可以初始化所有预置纠错对相应的纠错得分为0,如果用户对预置纠错串对应的候选项执行上屏操作,则将该预置纠错串对应预置纠错对的纠错得分加1,如用户输入“zeyang”,并且上屏了纠错候选项“这样”,那么就将预置纠错对(ze,zhe)的纠错得分加1。
在本发明的一种可选实施例中,所述根据所述纠错得分确定所述预置纠错对之间的相似性得分,具体可以包括:
将所述预置纠错对的纠错得分作为向量,计算所述向量之间的距离;
将所述向量之间的距离作为所述预置纠错对之间的相似性得分。
在本发明的一种应用示例中,以服务器建立纠错类别表为例说明具体的建立过程。假设客户端输入法程序初始化所有预置纠错对相应的纠错得分为0,如果用户对预置纠错串对应的候选项执行上屏操作,则将该预置纠错串对应预置纠错对的纠错得分加1,客户端定期将预置纠错串对及相应的纠错得分上传到服务器。
服务器根据客户端上传的预置纠错对以及相应的纠错得分计算各纠错对之间的相似性得分,将相似性得分大于预设阈值的预置纠错对划分到同一纠错类别中,最终得到纠错类别表,并且发送至对应的客户端。在实际应用中,服务器可以根据客户端上传的预置纠错对以及相应的纠错得分,定期重新计算各预置纠错对之间的相似性得分,以对纠错类别表进行及时更新。
在本发明的一种应用示例中,服务器可以维护一个N×M的矩阵,其中,N为用户的数目,M为纠错对的数目,矩阵的行表示一个预置纠错对相应所有用户的纠错得分,矩阵的列表示一个用户相应所有预置纠错对的纠错得分,纠错得分初始值均为0。如果某用户上屏预置纠错串对应的纠错候选项,则矩阵中该用户的预置纠错串对应预置纠错对的纠错得分加1,否则,预置纠错串对应预置纠错对的纠错得分仍然是0。
在计算预置纠错对之间的相似性时,可以将所述矩阵的每一行作为一个向量,将所述向量之间的距离作为所述预置纠错对之间的相似性得分。向量之间的距离可以采用皮尔逊相关度算法进行计算。可以理解,本发明对于计算向量之间距离的具体方法不加以限制,例如还可以采用欧几里德距离算法等。服务器将相似性得分大于预设阈值的预置纠错对划分到同一纠错类别中,最终得到纠错类别表,并且发送至用户的客户端。在本发明的一种可选实施例中,所述方法还可以包括:
依据至少两个预置纠错对之间的相似度,对所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系进行更新。
在具体应用中,采用人工分类方式或者依据至少一个用户的输入行为数据建立的纠错类别表为符合大多数用户输入习惯的通用的纠错类别表,不一定符合所有用户的输入习惯,或者,用户在输入过程中逐渐减少了错输的情况,例如某用户逐渐可以分清平舌音和卷舌音,此时,已建立的纠错类别表不再符合该用户的输入习惯。因此,本发明实施例在建立纠错类别表之后,存储在用户客户端,在用户的输入过程中,输入法程序可以依据至少两个预置纠错对之间的相似度,对用户客户端存储的纠错类别中的预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系进行更新,以使所述纠错类别表更加符合用户的输入习惯。
在本发明的一种应用示例中,用户A客户端存储的纠错类别表如表2所示,在用户A的输入过程中,客户端收集用户A的输入行为数据,假设用户A近5天输入“zheyang”时均未出错,则可以减少预置纠错对(ze,zhe)的纠错得分,这样,预置纠错对(ze,zhe)和其它预置纠错对如(si,shi)之间的相似性得分也会减少,说明预置纠错对(ze,zhe)和同一纠错类别中其它预置纠错对之间的相似度减少,则可以更新已建立的预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。例如,可以删除预置输入串“ze”、预置纠错串“zhe”与类别1之间的映射关系,用户输入“zeyang”时可以不再进行纠错。从而使得纠错结果更加符合用户的输入习惯,以及纠错结果更加精准。
装置实施例
参照图4,示出了本发明的一种输入装置实施例的结构框图,具体可以包括:
纠错串获取模块401,用于获取用户的输入串对应的至少一个纠错串;
纠错类别确定模块402,用于确定所述纠错串和所述输入串对应的纠错类别;
候选项展示模块403,用于根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示。
可选地,所述纠错类别确定模块402,可以包括:
查询子模块,用于根据纠错对查询预置的纠错类别表,以得到所述纠错对相应的纠错类别;所述纠错对可以包括所述输入串与其对应的纠错串;所述纠错类别表用于存储预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
可选地,所述装置还可以包括:纠错类别表确定模块,用于确定所述纠错类别表;所述纠错类别表确定模块,可以包括:
分类子模块,用于根据预置输入串和预置纠错串之间的关系特征,确定预置输入串和预置纠错串对应的预置纠错类别;
第一建立子模块,用于建立并保存所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
可选地,所述装置还可以包括:纠错类别表确定模块,用于确定所述纠错类别表;所述纠错类别表确定模块,可以包括:
相似度确定子模块,用于根据预置纠错对相应的纠错得分,确定至少两个预置纠错对之间的相似度;所述预置纠错对可以包括预置输入串与其对应的预置纠错串;
相似性得分确定子模块,用于根据所述纠错得分,确定所述预置纠错对之间的相似性得分,将相似性得分大于预设阈值的预置纠错对划分到同一纠错类别中
第二建立子模块,用于建立并保存所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
可选地,所述装置还可以包括:
纠错类别表更新模块,用于依据至少两个预置纠错对之间的相似度,对所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系进行更新。
可选地,所述纠错类别的特征可以包括:纠错类别的使用频次和/或使用间隔;则所述候选项展示模块403,可以包括:
得分调整子模块,用于根据所述纠错类别的使用频次和/或使用间隔,调整所述纠错串对应候选项的排序得分;
排序展示子模块,用于根据所述排序得分,对所述纠错串对应的纠错候选项进行排序展示。
可选地,所述得分调整子模块,可以包括:
第一调整单元,用于若所述纠错类别的使用频次超过第一阈值、且未超过第二阈值,则减少所述纠错串对应候选项的排序得分;和/或
第二调整单元,用于若所述纠错类别的使用频次超过第二阈值,且所述纠错类别的使用间隔小于预设间隔阈值,则保持所述纠错串对应候选项的排序得分;和/或
第三调整单元,用于若所述纠错类别的使用频次超过第二阈值、且所述纠错类别的使用间隔超过预设间隔阈值,则减少所述纠错串对应候选项的排序得分。
可选地,所述纠错类别的特征可以包括:纠错类别的使用频次和/或使用间隔,所述装置还可以包括:
使用频次更新模块,用于若用户对所述纠错串对应的纠错候选项执行上屏操作,则增加所述纠错类别的使用频次,否则,减少所述纠错类别的使用频次。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图5是根据一示例性实施例示出的一种用于输入的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种输入方法,所述方法包括:获取用户的输入串对应的至少一个纠错串;确定所述纠错串和所述输入串对应的纠错类别;根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示。
可选地,所述确定所述纠错串和所述输入串对应的纠错类别,包括:
根据纠错对查询预置的纠错类别表,以得到所述纠错对相应的纠错类别;所述纠错对包括所述输入串与其对应的纠错串;所述纠错类别表用于存储预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
可选地,通过如下步骤确定所述纠错类别表:
根据预置输入串和预置纠错串之间的关系特征,确定预置输入串和预置纠错串对应的预置纠错类别;
建立并保存所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
可选地,通过如下步骤确定所述纠错类别表:
根据预置纠错对相应的纠错得分,确定至少两个预置纠错对之间的相似度;所述预置纠错对包括预置输入串与其对应的预置纠错串;
根据所述纠错得分,确定所述预置纠错对之间的相似性得分,将相似性得分大于预设阈值的预置纠错对划分到同一纠错类别中;
建立并保存所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
可选地,所述处理器还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据至少两个预置纠错对之间的相似度,对所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系进行更新。
可选地,所述纠错类别的特征包括:纠错类别的使用频次和/或使用间隔;则所述根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示,包括:
根据所述纠错类别的使用频次和/或使用间隔,调整所述纠错串对应候选项的排序得分;
根据所述排序得分,对所述纠错串对应的纠错候选项进行排序展示。
可选地,所述根据所述纠错类别的使用频次和/或使用间隔调整所述纠错串对应候选项的排序得分,包括:
若所述纠错类别的使用频次超过第一阈值、且未超过第二阈值,则减少所述纠错串对应候选项的排序得分;和/或
若所述纠错类别的使用频次超过第二阈值,且所述纠错类别的使用间隔小于预设间隔阈值,则保持所述纠错串对应候选项的排序得分;和/或
若所述纠错类别的使用频次超过第二阈值、且所述纠错类别的使用间隔超过预设间隔阈值,则减少所述纠错串对应候选项的排序得分。
可选地,所述纠错类别的特征包括:纠错类别的使用频次和/或使用间隔,所述处理器还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
若用户对所述纠错串对应的纠错候选项执行上屏操作,则增加所述纠错类别的使用频次,否则,减少所述纠错类别的使用频次。
图6是本发明实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种输入方法、一种输入装置和一种用于输入的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (11)

1.一种输入方法,其特征在于,所述方法包括:
获取用户的输入串对应的至少一个纠错串;
确定所述纠错串和所述输入串对应的纠错类别;
根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示。
2.根据权利要求1所述的方法,其特征在于,所述确定所述纠错串和所述输入串对应的纠错类别,包括:
根据纠错对查询预置的纠错类别表,以得到所述纠错对相应的纠错类别;所述纠错对包括所述输入串与其对应的纠错串;所述纠错类别表用于存储预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
3.根据权利要求2所述的方法,其特征在于,通过如下步骤确定所述纠错类别表:
根据预置输入串和预置纠错串之间的关系特征,确定预置输入串和预置纠错串对应的预置纠错类别;
建立并保存所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
4.根据权利要求2所述的方法,其特征在于,通过如下步骤确定所述纠错类别表:
根据预置纠错对相应的纠错得分,确定至少两个预置纠错对之间的相似度;所述预置纠错对包括预置输入串与其对应的预置纠错串;
根据所述纠错得分,确定所述预置纠错对之间的相似性得分,将相似性得分大于预设阈值的预置纠错对划分到同一纠错类别中;
建立并保存所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
依据至少两个预置纠错对之间的相似度,对所述预置输入串与其对应的预置纠错串和预置纠错类别之间的映射关系进行更新。
6.根据权利要求1所述的方法,其特征在于,所述纠错类别的特征包括:纠错类别的使用频次和/或使用间隔;则所述根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示,包括:
根据所述纠错类别的使用频次和/或使用间隔,调整所述纠错串对应候选项的排序得分;
根据所述排序得分,对所述纠错串对应的纠错候选项进行排序展示。
7.根据权利要求6所述的方法,其特征在于,所述根据所述纠错类别的使用频次和/或使用间隔调整所述纠错串对应候选项的排序得分,包括:
若所述纠错类别的使用频次超过第一阈值、且未超过第二阈值,则减少所述纠错串对应候选项的排序得分;和/或
若所述纠错类别的使用频次超过第二阈值,且所述纠错类别的使用间隔小于预设间隔阈值,则保持所述纠错串对应候选项的排序得分;和/或
若所述纠错类别的使用频次超过第二阈值、且所述纠错类别的使用间隔超过预设间隔阈值,则减少所述纠错串对应候选项的排序得分。
8.根据权利要求1所述的方法,其特征在于,所述纠错类别的特征包括:纠错类别的使用频次和/或使用间隔,所述方法还包括:
若用户对所述纠错串对应的纠错候选项执行上屏操作,则增加所述纠错类别的使用频次,否则,减少所述纠错类别的使用频次。
9.一种输入装置,其特征在于,包括:
纠错串获取模块,用于获取用户的输入串对应的至少一个纠错串;
纠错类别确定模块,用于确定所述纠错串和所述输入串对应的纠错类别;
候选项展示模块,用于根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示。
10.一种用于输入的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户的输入串对应的至少一个纠错串;
确定所述纠错串和所述输入串对应的纠错类别;
根据所述纠错类别的特征,对所述纠错串对应的纠错候选项进行排序展示。
11.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至8中一个或多个所述的输入方法。
CN201710744911.9A 2017-08-25 2017-08-25 一种输入方法、装置和用于输入的装置 Active CN109426354B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710744911.9A CN109426354B (zh) 2017-08-25 2017-08-25 一种输入方法、装置和用于输入的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710744911.9A CN109426354B (zh) 2017-08-25 2017-08-25 一种输入方法、装置和用于输入的装置

Publications (2)

Publication Number Publication Date
CN109426354A true CN109426354A (zh) 2019-03-05
CN109426354B CN109426354B (zh) 2022-07-12

Family

ID=65499606

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710744911.9A Active CN109426354B (zh) 2017-08-25 2017-08-25 一种输入方法、装置和用于输入的装置

Country Status (1)

Country Link
CN (1) CN109426354B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334604A (zh) * 2019-06-06 2019-10-15 广州金域医学检验中心有限公司 细胞展示方法、装置、计算机设备和计算机可读存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271459A (zh) * 2007-03-22 2008-09-24 北京搜狗科技发展有限公司 一种生成词库的方法、一种输入的方法和一种输入法系统
CN101276245A (zh) * 2008-04-16 2008-10-01 北京搜狗科技发展有限公司 一种输入过程中编码纠错的提示方法和系统
CN101350004A (zh) * 2008-09-11 2009-01-21 北京搜狗科技发展有限公司 形成个性化纠错模型的方法及个性化纠错的输入法系统
CN102722483A (zh) * 2011-03-29 2012-10-10 百度在线网络技术(北京)有限公司 用于确定输入法的候选项排序的方法、装置和设备
CN103870000A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 一种对输入法所产生的候选项进行排序的方法及装置
CN104915264A (zh) * 2015-05-29 2015-09-16 北京搜狗科技发展有限公司 一种输入纠错方法和装置
CN106468960A (zh) * 2016-09-07 2017-03-01 北京新美互通科技有限公司 一种输入法候选项排序的方法和系统
CN106527757A (zh) * 2016-10-28 2017-03-22 上海智臻智能网络科技股份有限公司 一种输入纠错方法及装置
CN106774970A (zh) * 2015-11-24 2017-05-31 北京搜狗科技发展有限公司 对输入法的候选项进行排序的方法和装置
CN106873799A (zh) * 2017-02-16 2017-06-20 北京百度网讯科技有限公司 输入方法和装置
CN106896931A (zh) * 2015-12-18 2017-06-27 北京搜狗科技发展有限公司 一种输入法纠错方法和装置
CN107037965A (zh) * 2016-02-04 2017-08-11 北京搜狗科技发展有限公司 一种基于输入的信息展示方法、装置和移动终端

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271459A (zh) * 2007-03-22 2008-09-24 北京搜狗科技发展有限公司 一种生成词库的方法、一种输入的方法和一种输入法系统
CN101276245A (zh) * 2008-04-16 2008-10-01 北京搜狗科技发展有限公司 一种输入过程中编码纠错的提示方法和系统
CN101350004A (zh) * 2008-09-11 2009-01-21 北京搜狗科技发展有限公司 形成个性化纠错模型的方法及个性化纠错的输入法系统
CN102722483A (zh) * 2011-03-29 2012-10-10 百度在线网络技术(北京)有限公司 用于确定输入法的候选项排序的方法、装置和设备
CN103870000A (zh) * 2012-12-11 2014-06-18 百度国际科技(深圳)有限公司 一种对输入法所产生的候选项进行排序的方法及装置
CN104915264A (zh) * 2015-05-29 2015-09-16 北京搜狗科技发展有限公司 一种输入纠错方法和装置
CN106774970A (zh) * 2015-11-24 2017-05-31 北京搜狗科技发展有限公司 对输入法的候选项进行排序的方法和装置
CN106896931A (zh) * 2015-12-18 2017-06-27 北京搜狗科技发展有限公司 一种输入法纠错方法和装置
CN107037965A (zh) * 2016-02-04 2017-08-11 北京搜狗科技发展有限公司 一种基于输入的信息展示方法、装置和移动终端
CN106468960A (zh) * 2016-09-07 2017-03-01 北京新美互通科技有限公司 一种输入法候选项排序的方法和系统
CN106527757A (zh) * 2016-10-28 2017-03-22 上海智臻智能网络科技股份有限公司 一种输入纠错方法及装置
CN106873799A (zh) * 2017-02-16 2017-06-20 北京百度网讯科技有限公司 输入方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张仰森: "中文校对系统中纠错知识库的构造及纠错建议的产生算法", 《中文信息学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334604A (zh) * 2019-06-06 2019-10-15 广州金域医学检验中心有限公司 细胞展示方法、装置、计算机设备和计算机可读存储介质

Also Published As

Publication number Publication date
CN109426354B (zh) 2022-07-12

Similar Documents

Publication Publication Date Title
CN107102746B (zh) 候选词生成方法、装置以及用于候选词生成的装置
CN107229348A (zh) 一种输入纠错方法、装置和用于输入纠错的装置
CN107870677A (zh) 一种输入方法、装置和用于输入的装置
CN107608532A (zh) 一种联想输入方法、装置及电子设备
CN107544684B (zh) 一种候选词显示方法及装置
CN108073303B (zh) 一种输入方法、装置及电子设备
CN107315487B (zh) 一种输入处理方法、装置及电子设备
CN108345581A (zh) 一种信息识别方法、装置和终端设备
CN107291260B (zh) 一种信息输入方法和装置、及用于信息输入的装置
CN107092424B (zh) 一种纠错项的显示方法、装置和用于纠错项的显示的装置
CN109961791A (zh) 一种语音信息处理方法、装置及电子设备
CN107305438A (zh) 候选项的排序方法和装置、用于候选项排序的装置
CN107918496A (zh) 一种输入纠错方法和装置、一种用于输入纠错的装置
CN106886294B (zh) 一种输入法纠错方法和装置
CN110069624A (zh) 文本处理方法及装置
CN109783244A (zh) 处理方法和装置、用于处理的装置
CN107665218B (zh) 一种搜索方法、装置及电子设备
CN110244860A (zh) 一种输入方法、装置和电子设备
CN108573706A (zh) 一种语音识别方法、装置及设备
CN108803890A (zh) 一种输入方法、输入装置和用于输入的装置
CN109213412A (zh) 输入方法、装置和机器可读介质
CN109002184A (zh) 一种输入法候选词的联想方法和装置
CN109426354A (zh) 一种输入方法、装置和用于输入的装置
CN109977424A (zh) 一种机器翻译模型的训练方法及装置
CN110134936A (zh) 一种分词方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant