CN109460158A - 字符输入方法、字符校正模型训练方法和移动终端 - Google Patents

字符输入方法、字符校正模型训练方法和移动终端 Download PDF

Info

Publication number
CN109460158A
CN109460158A CN201811269965.5A CN201811269965A CN109460158A CN 109460158 A CN109460158 A CN 109460158A CN 201811269965 A CN201811269965 A CN 201811269965A CN 109460158 A CN109460158 A CN 109460158A
Authority
CN
China
Prior art keywords
character
correction
string
input
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811269965.5A
Other languages
English (en)
Inventor
董巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN201811269965.5A priority Critical patent/CN109460158A/zh
Publication of CN109460158A publication Critical patent/CN109460158A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种字符输入方法,包括:接收用户通过触控屏幕输入的初始字符串;在初始字符串中包含误输入字符的情况下,基于用户的输入习惯确定与误输入字符相对应的校正字符;根据校正字符,输出与初始字符串相对应的校正字符串。本发明还公开了字符校正模型训练方法。在本发明实施例中,移动终端可以提取用户输入的初始字符串中的误输入字符,并基于用户的输入习惯确定与误输入字符相对应的校正字符,进而可以根据校正字符输出与初始字符串相对应的校正字符串,从而能够有效识别并校正误输入字符,改善了用户的字符输入体验。

Description

字符输入方法、字符校正模型训练方法和移动终端
技术领域
本发明涉及终端领域,尤其涉及一种字符输入方法、字符校正模型训练方法和移动终端。
背景技术
目前,智能手机等移动终端上的屏幕相较于前几代产品增大了很多,因此,全键盘输入方式也逐渐成为一种常用的输入方式。由于全键盘输入方式可以直接输入字母、数字和常用标点符号,免去了大量的联想字词选取和切换操作,因此,深受用户喜爱。
但是,由于全键盘输入方式所需要的按键数量较多,排布在尺寸有限的屏幕上时,按键控件的有效触控区域较小,按键控件之间的间隙也较小,因此,用户在触控按键控件进行输入时,容易发生误输入、或者移动终端误识别的情况,在用户快速输入时,这种情况尤为突出。
相关技术中,移动终端无法有效校正用户在这种情况下的误输入,使得用户只能删除包含有错误字符的内容,进行多次重复输入,影响了用户体验。
因此,亟需一种字符输入方法,能够解决无法有效校正误输入字符的问题。
发明内容
本发明实施例提供一种字符输入方法、字符校正模型训练方法和移动终端,以解决无法有效校正误输入字符的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供一种字符输入方法,包括:
接收用户通过触控屏幕输入的初始字符串;
在所述初始字符串中包含误输入字符的情况下,基于所述用户的输入习惯确定与所述误输入字符相对应的校正字符;
根据所述校正字符,输出与所述初始字符串相对应的校正字符串。
第二方面,本发明实施例提供一种字符校正模型训练方法,包括:
在监听到用户通过触控屏幕删除字符的操作时,收集被删除的第一历史字符串和删除后用户重新输入的第二历史字符串;
根据所述第一历史字符串和所述第二历史字符串,确定相对应的错误字符和正确字符;
根据所述错误字符和所述正确字符,对初始字符校正模型进行训练,得到字符校正模型。
第三方面,本发明实施例提供一种移动终端,包括:
初始字符串接收模块,用于接收用户通过触控屏幕输入的初始字符串;
校正字符确定模块,用于在所述初始字符串中包含误输入字符的情况下,基于所述用户的输入习惯确定与所述误输入字符相对应的校正字符;
校正字符串输出模块,用于根据所述校正字符,输出与所述初始字符串相对应的校正字符串。
第四方面,本发明实施例提供一种字符校正模型训练装置,包括:
历史字符串收集模块,用于在监听到用户通过触控屏幕删除字符的操作时,收集被删除的第一历史字符串和删除后用户重新输入的第二历史字符串;
正误字符确定模块,用于根据所述第一历史字符串和所述第二历史字符串,确定相对应的错误字符和正确字符;
模型训练模块,用于根据所述错误字符和所述正确字符,对初始字符校正模型进行训练,得到字符校正模型。
第五方面,提供了一种移动终端,该移动终端包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的方法的步骤。
第六方面,提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法的步骤。
在本发明实施例中,移动终端可以提取用户输入的初始字符串中的误输入字符,并基于所述用户的输入习惯确定与误输入字符相对应的校正字符,进而可以根据校正字符输出与初始字符串相对应的校正字符串,从而能够有效识别并校正误输入字符,改善了用户的字符输入体验。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例提供的字符输入方法的流程示意图;
图2是本发明实施例提供的字符校正模型训练方法的流程示意图;
图3是本发明实施例提供的一种移动终端的结构示意图;
图4是本发明实施例提供的字符校正模型训练装置的结构示意图;
图5是本发明实施例提供的又一种移动终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
参见图1所示,本发明实施例提供一种字符输入方法,由移动终端执行。该方法可具体包括:
步骤101:接收用户通过触控屏幕输入的初始字符串。
需要说明的是,本发明实施例中所称的触控屏幕,可以具体化为移动终端的触摸屏,例如,电容感应式、电阻式、红外线式、或表面声波式等。用户对触控屏幕的触控输入,可以由用户的手指或者与触控屏幕相匹配的指点工具来进行。相对应的,移动终端所接收的用户通过触控屏幕输入的初始字符串,也可以通过识别用户的手指或者与触控屏幕相匹配的指点工具在触控屏幕上的触控输入进行。
一种场景在于,移动终端的触控屏幕上显示出全键盘输入界面,用户通过手指或者指点工具对该全键盘输入界面上的按键控件进行点击等触控操作,移动终端在接收到触控操作后,根据触控操作所对应的按键控件,即可识别出用户通过触控屏幕输入的初始字符串。
可以理解到,移动终端所接收并识别出的初始字符串,与用户在全键盘输入界面上实施触控操作的位置和顺序有关。
移动终端在执行步骤101接收到初始字符串后,可进一步执行步骤S103,判断初始字符串中是否包含误输入字符,以便确定是否需要对初始字符串进行校正。
可以理解到,参见图1所示,在执行步骤103进行判断的判断结果指示初始字符串中未包含误输入字符时,移动终端可以直接执行步骤109,输出初始字符串。而当判断结果指示初始字符串中未含误输入字符时,则可进一步对初始字符串进行校正后再输出。
可选的,移动终端执行步骤103判断初始字符串中是否包含误输入字符时,可以根据输入语言的语法和输入法的对应规则中至少一项进行判断。例如,采用拼音输入法时,若用户输入的初始字符串中存在不符合拼音规则的字符和/或字符串,则可以认为初始字符串中存在误输入字符。又例如,采用五笔输入法或者笔顺输入法时,若根据用户输入的初始字符串无法对应到字库中的汉字,则可以认为初始字符串中存在误输入字符。再例如,输入英文字符时,若在全量的英文单词库中无法找到与初始字符串相对应的单词,则可以认为初始字符串中存在误输入字符。还例如,输入中文字符时,如果根据初始字符串,虽然能够对应到一系列汉字,但这些汉字的组合不符合中文语法,或者在中文词库中无法找到相对应的、有语义的词,即这些汉字属于孤立的汉字,则可以认为初始字符串中存在误输入字符。
以下举例说明初始字符串中包含有误输入字符的一种情况。假设用户希望输入的文字内容为“像是你的人”,用户使用全键盘输入工具时,应当输入的字符串为“xiangshinideren”。然而,由于在全键盘输入界面上,按键控件“i”和按键控件“u”非常接近,因此,用户可能会输入字符串(即初始字符串)。按照汉语拼音的拼写规则,这段初始字符串会被识别为“xu”、“ang”、“shu”、“ni”、“de”、“ren”。可以理解到,移动终端可以判断该初始字符串中包含有误输入字符。
可以理解到,针对以上示例中输入的初始字符串“xuangshunideren”,传统拼音输入法可能会给出类似“徐昂”、“徐”、“许”、“虚”等与用户希望输入的文字内容相去甚远的备选项,导致用户需要将该字符串彻底删除后,或者至少要删除“uangshunideren”后重新输入,才可能得到希望输入的文字内容“像是你的人”。而采用本发明实施例提供的字符校正方法,移动终端可以对初始字符串中的误输入字符进行识别和校正,进而输出校正字符串,从而改善了用户的输入体验。以下将进一步详细介绍这一具体过程。
步骤105:在初始字符串中包含误输入字符的情况下,基于用户的输入习惯确定与误输入字符相对应的校正字符。
在执行步骤105,基于用户的输入习惯确定与误输入字符相对应的校正字符时,可以先根据初始字符串,确定字符校正模型的输入向量,将初始字符串对应的输入向量输入字符校正模型后,根据字符校正模型的输出向量,确定校正字符。可以理解到,此处所采用的字符校正模型,能够反映用户的输入习惯。因此,利用此字符校正模型,能够基于用户的输入习惯确定与误输入字符相对应的校正字符。
需要说明的是,在根据初始字符串,确定字符校正模型的输入向量时,可以有多种方式。以初始字符串“xuangshunideren”为例,移动终端可以将初始字符串整体确定为输入向量,此时,输入向量为{‘xuangshunideren’}。移动终端也可以根据初始字符串中相邻的两个字符构成的子字符串确定输入向量,此时,输入向量可体现为:{‘xu’,‘ua’,‘an’,‘ng’,‘gs’,‘sh’,···,‘en’}。移动终端也可以根据初始字符串中相邻的三个字符构成的子字符串确定输入向量,此时,输入向量可体现为:{‘xua’,‘uan’,‘ang’,‘ngs’,···,‘ren’}。
优选的,在根据初始字符串,确定字符校正模型的输入向量时,可以将初始字符串中每个独立的字符、任意相邻的两个字符构成的子字符串、任意相邻的三个字符构成的子字符串、任意相邻的四个字符构成的子字符串、任意相邻的五个字符构成的子字符串、以及初始字符串整体,均确定为输入向量中的分量,进而按照预设的分量排布顺序生成输入向量。例如,输入向量可体现为:
{‘x’,‘u’,‘a’,···‘n’,···,‘xu’,‘ua’,···‘en’,···,‘xua’,‘uan’,···,‘ren’,···,‘xuan’,‘uang’,···‘eren’,···‘xuang’,‘uangs’,···,‘deren’}
可以理解到,根据初始字符串,确定字符校正模型的输入向量的具体方式,是依据字符校正模型的输入向量的定义,也就是字符校正模型的输入向量中各个分量的定义来确定的。将根据初始字符串生成的输入向量输入字符校正模型后,进而可根据字符校正模型输出的输出向量,即可确定校正字符。
可选的,根据字符校正模型的输出向量中各分量的定义,输出向量可以直接是与初始字符串整体匹配程度最高的字符串,可以是与初始字符串中某一子字符串相对应、且匹配程度最高的子字符串。还可以是多个候选字符以及相对应的匹配参数,其中,匹配参数可以反映候选字符与初始字符串中误输入字符的匹配程度。
一种可选方案在于,匹配参数越大,表示候选字符与初始字符串中误输入字符的匹配程度越高,候选字符为用户实际希望输入的字符的可能性越大;匹配参数越小,表示候选字符与初始字符串中误输入字符的匹配程度越低,候选字符为用户实际希望输入的字符的可能性越小。
在字符校正模型的输出向量中包括候选字符及与候选字符相对应的匹配参数的情况下,移动终端可以将匹配参数最高的预设数量个候选字符确定为校正字符,也可以将匹配参数大于或者等于预设阈值的候选字符,确定为校正字符,还可以同时考虑以上两方面因素确定校正字符。
步骤107:根据校正字符,输出与初始字符串相对应的校正字符串。
可选的,移动终端在利用字符校正模型确定校正字符后,可以以“误输入字符-校正字符”对的形式,向用户展示校正字符。例如,针对初始字符串“xuangshunideren”,移动终端可以在输入界面上显示“xuang-xiang”,“shu-shi”等。
这种情况下,移动终端可以进一步接收用户对校正字符的选取操作,进而基于选取操作,输出校正字符串,以便实现根据校正字符,输出与初始字符串相对应的校正字符串的过程。
进一步的,用户对校正字符的选取操作,可以是从移动终端展示的多个“误输入字符-校正字符”对中选取出符合用户期望的“误输入字符-校正字符”对,进而采用校正字符替换初始字符串中的误输入字符,形成校正字符串。
用户对校正字符的选取操作,也可以是对移动终端上展示的“误输入字符-校正字符”对进行接受或者拒绝的操作。如果用户对校正字符的选取操作表示接受“误输入字符-校正字符”对,则移动终端可以进而采用被用户接受的校正字符替换初始字符串中的误输入字符,形成校正字符串。
在本发明实施例中,移动终端可以提取用户输入的初始字符串中的误输入字符,并基于用户的输入习惯确定与误输入字符相对应的校正字符,进而可以根据校正字符输出与初始字符串相对应的校正字符串,从而能够有效识别并校正误输入字符,改善了用户的字符输入体验。
为高效、准确的对用户输入的字符进行校正,本发明实施例还提供了一种字符校正模型训练方法。
需要说明的是,该方法可以由移动终端执行,也可以由服务端执行。
还需要说明的是,该方法既可以在移动终端执行字符输入方法之前执行,也可以在移动终端执行步骤107之前执行,只要能够为移动终端提供训练好的字符校正模型,以便移动终端能够执行步骤105基于用户的输入习惯确定与误输入字符相对应的校正字符即可。
参见图2所示,本发明实施例提供的字符校正模型训练方法可具体包括:
步骤201:在监听到用户通过触控屏幕删除字符的操作时,收集被删除的第一历史字符串和删除后用户重新输入的第二历史字符串。
能够理解,当用户通过触控屏幕,进行点击回退按键的操作时,可以认为用户希望删除已经输入的字符,因此,可以认为被删除的字符串(记为第一历史字符串)为用户认为存在误输入的字符串,而在此之后重新输入的字符串(记为第二历史字符串),可以认为是符合用户需求的正确字符串。
基于用户通过触控屏幕删除字符的操作,收集被删除的第一历史字符串和删除后用户重新输入的第二历史字符串,就能够了解到用户的输入习惯。因此,根据第一历史字符串和第二历史字符串确定训练字符校正模型时的训练样本,就能够训练出符合用户输入习惯的字符校正模型,使得字符校正模型能够更准确的输出符合用户期望的校正字符,进而更准确的对包含有误输入字符的初始字符串进行校正,进一步提升用户体验。
步骤203:根据第一历史字符串和第二历史字符串,确定相对应的错误字符和正确字符。
能够理解,在获取到被删除的第一历史字符串和删除后用户重新输入的第二历史字符串后,对二者进行比对,除去二者之间相同的字符或子字符串后,即可得到二者之间不同的字符或子字符串。
一个示例在于,用户希望输入的文字信息为“像是你的人”,输入的初始字符串为“xuangshunideren”。用户发现存在误输入时,可以点击回退按键,删除“uangshunideren”(即第一历史字符串),进而输入(即第二历史字符串),则通过执行步骤203,可以确定出错误字符与正确字符对:u-i。
又一示例在于,用户希望输入的文字信息为“国士无双”时,输入的初始字符串可能为“guoahiwishung”。用户发现存在误输入时,可以点击回退按键,删除“ahiwishung”(即第一历史字符串),进而输入(即第二历史字符串)。对第一历史字符串和第二历史字符串进行比对,可以确定出错误字符与正确字符对:a-s,i-u,shung-shuang。
再一示例在于,用于希望输入的汉字为“中心地带”时,输入的初始字符串可能为“hzongxindidai”。用户发现存在误输入时,可以点击回退按键,删除“hzongxindidai”(即第一历史字符串),进而输入“zhognxindidai”。此时,用户发现再次存在误输入,因此,可以再次点击回退按键,删除“zhognxindidai”,进而输入“zhongxindidai”,并确认输入争取。此时,可将最后确认争取的字符串“zhongxindidai”确认为第二历史字符串。对第一历史字符串和第二历史字符串进行比对,可以确定出错误字符与正确字符对:hzong-zhong。
步骤205:根据错误字符和正确字符,对初始字符校正模型进行训练,得到字符校正模型。
可以理解到,在执行步骤205时,将错误字符作为模型的输入,相对应的正确字符作为模型的期望输出,对初始模型进行训练。
具体的,可以先根据错误字符,生成初始字符校正模型的训练输入向量;然后将训练输入向量输入初始字符校正模型,得到训练输出向量;进而根据训练输出向量与正确字符之间的差距,调整初始字符校正模型的模型参数,直至差距满足预设条件,得到字符校正模型。
在本发明实施例中,可以采用多种机器学习模型搭建初始字符校正模型,例如,深度学习模型(Deep Learning),支持向量机SVM(全称Support Vector Machine)等,只要能够实现基于代表错误字符的输入向量输出代表正确字符(以及正确字符的正确概率)的输出向量即可。
优选的,在移动终端利用字符校正模型对用户输入的字符串进行校正后,字符校正模型进行训练的主体(可以是移动终端本身,也可以是服务端)还可以进一步接收用户对校正字符的选取操作,并根据用户对校正字符的选取操作,调整字符校正模型的模型参数。
可以理解到,校正字符是由移动终端基于用户输入的误输入字符、基于用户的输入习惯确定的,由于用户对校正字符的选取操作可以反映用户是否接受字符校正模型预测的校正字符,因此,根据用户对校正字符的选取操作,调整字符校正模型的模型参数,就可以使得重新训练后的字符校正模型能够输出更加符合用户需求的校正字符,从而进一步提升用户体验。
参见图3所示,本发明实施例还提供了一种移动终端,可具体包括:
初始字符串接收模块301,用于接收用户通过触控屏幕输入的初始字符串;
校正字符确定模块305,用于在初始字符串中包含误输入字符的情况下,基于用户的输入习惯确定与误输入字符相对应的校正字符;
校正字符串输出模块307,用于根据校正字符,输出与初始字符串相对应的校正字符串。
优选的,上述移动终端中,校正字符确定模块305,可进一步包括:
输入向量确定单元,用于根据所述初始字符串,确定字符校正模型的输入向量,所述字符校正模型用于反映所述用户的输入习惯;
校正字符确定单元,用于根据所述字符校正模型的输出向量,确定所述校正字符。
优选的,上述移动终端中,字符校正模型的输出向量中包括候选字符及与候选字符相对应的匹配参数;则校正字符确定单元中可进一步包括以下至少一项:
第一校正字符确定子单元,用于将匹配参数最高的预设数量个候选字符,确定为校正字符;
第二校正字符确定子单元,用于将匹配参数大于或者等于预设阈值的候选字符,确定为校正字符。
优选的,上述移动终端中,还可进一步包括:
历史字符串收集模块,用于在监听到用户通过触控屏幕删除字符的操作时,收集被删除的第一历史字符串和删除后用户重新输入的第二历史字符串;
正误字符确定模块,用于根据第一历史字符串和第二历史字符串,确定相对应的错误字符和正确字符;
模型训练模块,用于根据错误字符和正确字符,对初始字符校正模型进行训练,得到字符校正模型。
优选的,上述移动终端中,模型训练模块可进一步包括:
训练输入向量确定单元,用于根据错误字符,生成初始字符校正模型的训练输入向量;
训练输出向量生成单元,用于将训练输入向量输入初始字符校正模型,得到训练输出向量;
参数调整单元,用于根据训练输出向量与正确字符之间的差距,调整初始字符校正模型的模型参数,直至差距满足预设条件,得到字符校正模型。
优选的,上述移动终端中,校正字符串输出模块307可进一步包括:
选取操作接收单元,用于接收用户对校正字符的选取操作;
校正字符串输出单元,用于基于选取操作,输出校正字符串。
优选的,上述移动终端中,还可进一步包括:
模型参数调整模块,用于根据用户对校正字符的选取操作,调整字符校正模型的模型参数。
能够理解,本发明实施例提供的移动终端,能够实现前述实施例中由移动终端执行的字符输入方法中的各个步骤,关于字符输入方法的相关阐述均适用于移动终端,此处不再赘述。
在本发明实施例中,移动终端可以提取用户输入的初始字符串中的误输入字符,并基于用户的输入习惯确定与误输入字符相对应的校正字符,进而可以根据校正字符输出与初始字符串相对应的校正字符串,从而能够有效识别并校正误输入字符,改善了用户的字符输入体验。
参见图4所示,本发明实施例还提供了一种字符校正模型训练装置,可以应用于移动终端,也可以应用于服务端。该装置可具体包括:
历史字符串收集模块401,用于在监听到用户通过触控屏幕删除字符的操作时,收集被删除的第一历史字符串和删除后用户重新输入的第二历史字符串;
正误字符确定模块403,用于根据第一历史字符串和第二历史字符串,确定相对应的错误字符和正确字符;
模型训练模块405,用于根据错误字符和正确字符,对初始字符校正模型进行训练,得到字符校正模型。
优选的,上述字符校正模型训练装置中,模型训练模块405可进一步包括:
训练输入向量确定单元,用于根据错误字符,生成初始字符校正模型的训练输入向量;
训练输出向量生成单元,用于将训练输入向量输入初始字符校正模型,得到训练输出向量;
参数调整单元,用于根据训练输出向量与正确字符之间的差距,调整初始字符校正模型的模型参数,直至差距满足预设条件,得到字符校正模型。
优选的,上述字符校正模型训练装置中,还可进一步包括:
选取操作接收模块,用于接收用户对校正字符的选取操作,校正字符由移动终端基于用户输入的误输入字符、并基于用户的输入习惯确定;
模型参数调整模块,用于根据用户对校正字符的选取操作,调整字符校正模型的模型参数。
能够理解,本发明实施例提供的字符校正模型训练装置,能够实现前述实施例中由移动终端或者服务端执行的字符校正模型训练方法中的各个步骤,关于字符校正模型训练方法的相关阐述均适用于字符校正模型训练装置,此处不再赘述。
图5为实现本发明各个实施例的一种移动终端的硬件结构示意图,该移动终端700包括但不限于:射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709、处理器710、以及电源711等部件。本领域技术人员可以理解,图5中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,处理器710,用于执行以下步骤:
接收用户通过触控屏幕输入的初始字符串;
在所述初始字符串中包含误输入字符的情况下,基于所述用户的输入习惯确定与所述误输入字符相对应的校正字符;
根据所述校正字符,输出与所述初始字符串相对应的校正字符串。
在本发明实施例中,移动终端可以提取用户输入的初始字符串中的误输入字符,并基于用户的输入习惯确定与误输入字符相对应的校正字符,进而可以根据校正字符输出与初始字符串相对应的校正字符串,从而能够有效识别并校正误输入字符,改善了用户的字符输入体验。
其中,处理器710,还可以用于执行以下步骤:
在监听到用户通过触控屏幕删除字符的操作时,收集被删除的第一历史字符串和删除后用户重新输入的第二历史字符串;
根据所述第一历史字符串和所述第二历史字符串,确定相对应的错误字符和正确字符;
根据所述错误字符和所述正确字符,对初始字符校正模型进行训练,得到字符校正模型。
应理解的是,本发明实施例中,射频单元701可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器710处理;另外,将上行的数据发送给基站。通常,射频单元701包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元701还可以通过无线通信系统与网络和其他设备通信。
移动终端通过网络模块702为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元703可以将射频单元701或网络模块702接收的或者在存储器709中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元703还可以提供与移动终端700执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元703包括扬声器、蜂鸣器以及受话器等。
输入单元704用于接收音频或视频信号。输入单元704可以包括图形处理器(Graphics Processing Unit,GPU)7041和麦克风7042,图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元706上。经图形处理器7041处理后的图像帧可以存储在存储器709(或其它存储介质)中或者经由射频单元701或网络模块702进行发送。麦克风7042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元701发送到移动通信基站的格式输出。
移动终端700还包括至少一种传感器705,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板7061的亮度,接近传感器可在移动终端700移动到耳边时,关闭显示面板7061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器705还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元706用于显示由用户输入的信息或提供给用户的信息。显示单元706可包括显示面板7061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板7061。
用户输入单元707可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元707包括触控面板7071以及其他输入设备7072。触控面板7071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板7071上或在触控面板7071附近的操作)。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器710,接收处理器710发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板7071。除了触控面板7071,用户输入单元707还可以包括其他输入设备7072。具体地,其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板7071可覆盖在显示面板7061上,当触控面板7071检测到在其上或附近的触摸操作后,传送给处理器710以确定触摸事件的类型,随后处理器710根据触摸事件的类型在显示面板7061上提供相应的视觉输出。虽然在图5中,触控面板7071与显示面板7061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板7071与显示面板7061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元708为外部装置与移动终端700连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元708可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端700内的一个或多个元件或者可以用于在移动终端700和外部装置之间传输数据。
存储器709可用于存储软件程序以及各种数据。存储器709可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器709可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器710是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器709内的软件程序和/或模块,以及调用存储在存储器709内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器710可包括一个或多个处理单元;优选的,处理器710可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器710中。
移动终端700还可以包括给各个部件供电的电源711(比如电池),优选的,电源711可以通过电源管理系统与处理器710逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,移动终端700包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种移动终端,包括处理器710,存储器709,存储在存储器709上并可在所述处理器710上运行的计算机程序,该计算机程序被处理器710执行时实现上述字符输入方法和/或字符校正模型训练方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述字符输入方法和/或字符校正模型训练方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (10)

1.一种字符输入方法,其特征在于,包括:
接收用户通过触控屏幕输入的初始字符串;
在所述初始字符串中包含误输入字符的情况下,基于所述用户的输入习惯确定与所述误输入字符相对应的校正字符;
根据所述校正字符,输出与所述初始字符串相对应的校正字符串。
2.根据权利要求1所述方法,其特征在于,基于所述用户的输入习惯确定与所述误输入字符相对应的校正字符,包括:
根据所述初始字符串,确定字符校正模型的输入向量,所述字符校正模型用于反映所述用户的输入习惯;
根据所述字符校正模型的输出向量,确定所述校正字符。
3.根据权利要求2所述方法,其特征在于,所述字符校正模型的输出向量中包括候选字符及与所述候选字符相对应的匹配参数;
则根据所述字符校正模型的输出向量,确定所述校正字符,包括以下至少一项:
将所述匹配参数最高的预设数量个候选字符,确定为所述校正字符;
将所述匹配参数大于或者等于预设阈值的候选字符,确定为所述校正字符。
4.一种字符校正模型训练方法,其特征在于,包括:
在监听到用户通过触控屏幕删除字符的操作时,收集被删除的第一历史字符串和删除后用户重新输入的第二历史字符串;
根据所述第一历史字符串和所述第二历史字符串,确定相对应的错误字符和正确字符;
根据所述错误字符和所述正确字符,对初始字符校正模型进行训练,得到字符校正模型。
5.根据权利要求4所述方法,其特征在于,根据所述错误字符和所述正确字符,对初始字符校正模型进行训练,得到字符校正模型,包括:
根据所述错误字符,生成所述初始字符校正模型的训练输入向量;
将所述训练输入向量输入所述初始字符校正模型,得到训练输出向量;
根据所述训练输出向量与所述正确字符之间的差距,调整所述初始字符校正模型的模型参数,直至所述差距满足预设条件,得到所述字符校正模型。
6.根据权利要求4所述方法,其特征在于,所述方法还包括:
接收用户对校正字符的选取操作,所述校正字符由移动终端基于用户输入的误输入字符、利用所述字符校正模型输出;
根据用户对所述校正字符的选取操作,调整所述字符校正模型的模型参数。
7.一种移动终端,其特征在于,包括:
初始字符串接收模块,用于接收用户通过触控屏幕输入的初始字符串;
校正字符确定模块,用于在所述初始字符串中包含误输入字符的情况下,基于所述用户的输入习惯确定与所述误输入字符相对应的校正字符;
校正字符串输出模块,用于根据所述校正字符,输出与所述初始字符串相对应的校正字符串。
8.一种字符校正模型训练装置,其特征在于,包括:
历史字符串收集模块,用于在监听到用户通过触控屏幕删除字符的操作时,收集被删除的第一历史字符串和删除后用户重新输入的第二历史字符串;
正误字符确定模块,用于根据所述第一历史字符串和所述第二历史字符串,确定相对应的错误字符和正确字符;
模型训练模块,用于根据所述错误字符和所述正确字符,对初始字符校正模型进行训练,得到字符校正模型。
9.一种移动终端,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至3中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至3中任一项所述的方法的步骤。
CN201811269965.5A 2018-10-29 2018-10-29 字符输入方法、字符校正模型训练方法和移动终端 Pending CN109460158A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811269965.5A CN109460158A (zh) 2018-10-29 2018-10-29 字符输入方法、字符校正模型训练方法和移动终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811269965.5A CN109460158A (zh) 2018-10-29 2018-10-29 字符输入方法、字符校正模型训练方法和移动终端

Publications (1)

Publication Number Publication Date
CN109460158A true CN109460158A (zh) 2019-03-12

Family

ID=65608762

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811269965.5A Pending CN109460158A (zh) 2018-10-29 2018-10-29 字符输入方法、字符校正模型训练方法和移动终端

Country Status (1)

Country Link
CN (1) CN109460158A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111665955A (zh) * 2020-04-17 2020-09-15 北京百度网讯科技有限公司 候选字符串的处理方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657509A (zh) * 2015-03-18 2015-05-27 苏州大学 基于历史照片信息的旅游地点推荐方法及系统
CN105589570A (zh) * 2014-10-23 2016-05-18 北京搜狗科技发展有限公司 一种处理输入错误的方法和装置
CN105915438A (zh) * 2016-04-15 2016-08-31 北京奇虎科技有限公司 消息推送方法、装置及系统
CN107436691A (zh) * 2016-05-26 2017-12-05 北京搜狗科技发展有限公司 一种输入法进行纠错的方法、客户端、服务器及装置
CN107680579A (zh) * 2017-09-29 2018-02-09 百度在线网络技术(北京)有限公司 文本正则化模型训练方法和装置、文本正则化方法和装置
CN108197664A (zh) * 2018-01-24 2018-06-22 北京墨丘科技有限公司 模型获取方法、装置、电子设备及计算机可读存储介质
CN108304078A (zh) * 2017-01-11 2018-07-20 北京搜狗科技发展有限公司 一种输入方法、装置及电子设备
CN108647207A (zh) * 2018-05-08 2018-10-12 上海携程国际旅行社有限公司 自然语言修正方法、系统、设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105589570A (zh) * 2014-10-23 2016-05-18 北京搜狗科技发展有限公司 一种处理输入错误的方法和装置
CN104657509A (zh) * 2015-03-18 2015-05-27 苏州大学 基于历史照片信息的旅游地点推荐方法及系统
CN105915438A (zh) * 2016-04-15 2016-08-31 北京奇虎科技有限公司 消息推送方法、装置及系统
CN107436691A (zh) * 2016-05-26 2017-12-05 北京搜狗科技发展有限公司 一种输入法进行纠错的方法、客户端、服务器及装置
CN108304078A (zh) * 2017-01-11 2018-07-20 北京搜狗科技发展有限公司 一种输入方法、装置及电子设备
CN107680579A (zh) * 2017-09-29 2018-02-09 百度在线网络技术(北京)有限公司 文本正则化模型训练方法和装置、文本正则化方法和装置
CN108197664A (zh) * 2018-01-24 2018-06-22 北京墨丘科技有限公司 模型获取方法、装置、电子设备及计算机可读存储介质
CN108647207A (zh) * 2018-05-08 2018-10-12 上海携程国际旅行社有限公司 自然语言修正方法、系统、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111665955A (zh) * 2020-04-17 2020-09-15 北京百度网讯科技有限公司 候选字符串的处理方法、装置、电子设备及存储介质
CN111665955B (zh) * 2020-04-17 2023-06-27 北京百度网讯科技有限公司 候选字符串的处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US8893054B2 (en) Devices, systems, and methods for conveying gesture commands
CN109814968A (zh) 一种信息输入方法、终端设备和计算机可读存储介质
CN107943390A (zh) 一种文字复制方法及移动终端
CN108132752A (zh) 一种文本编辑方法及移动终端
CN112068762A (zh) 应用程序的界面显示方法、装置、设备及介质
CN109491738A (zh) 一种终端设备的控制方法及终端设备
CN109920309B (zh) 手语转换方法、装置、存储介质和终端
CN108573307A (zh) 一种处理神经网络模型文件的方法及终端
CN109215660A (zh) 语音识别后文本纠错方法及移动终端
CN110232174A (zh) 一种内容选中方法及终端设备
CN108108113A (zh) 网页切换方法及装置
CN108898555A (zh) 一种图像处理方法及终端设备
CN110046013A (zh) 一种界面显示方法及终端设备
CN108388354A (zh) 一种输入法候选区域的显示方法和移动终端
CN110007822A (zh) 一种界面显示方法及终端设备
CN110471589A (zh) 信息显示方法及终端设备
CN109901761A (zh) 一种内容显示方法及移动终端
CN109521937A (zh) 一种屏幕显示控制方法及移动终端
CN108009031A (zh) 一种应用程序的控制方法及移动终端
CN107728920A (zh) 一种复制方法及移动终端
JP2021532492A (ja) 文字入力方法及び端末
CN109992753A (zh) 一种翻译处理方法及终端设备
CN109976653A (zh) 一种信息输入方法及终端设备
CN110008884A (zh) 一种文字处理方法及终端
CN108959585A (zh) 一种表情图片获取方法和终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190312