CN113791694A - 数据输入方法、装置、设备及计算机可读存储介质 - Google Patents
数据输入方法、装置、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113791694A CN113791694A CN202110945770.3A CN202110945770A CN113791694A CN 113791694 A CN113791694 A CN 113791694A CN 202110945770 A CN202110945770 A CN 202110945770A CN 113791694 A CN113791694 A CN 113791694A
- Authority
- CN
- China
- Prior art keywords
- input
- word
- words
- replaced
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
- G06F3/0236—Character input methods using selection techniques to select from displayed items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种数据输入方法,包括:获取当前输入操作对应的输入法,并获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词;基于各个输入词与对应的候选词之间的第一相似度,确定各个输入词中的待替换词;在所述待替换词对应的候选词中,基于所述输入法获取所述待替换词对应的目标词;将所述输入语句中的待替换词替换为所述目标词,获得目标输入语句。本发明还公开了一种数据输入装置、设备及计算机可读存储介质。本发明能够根据候选词自动选择输入语句中存在错误的输入词的目标词,实现输入语句中错误的词的自动修正,大大减少了错误修改过程中用户的操作过程,提高了语句错误的修正效率以及用户体验。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据输入方法、装置、设备及计算机可读存储介质。
背景技术
目前,在用户通过电子设备的输入法键盘输入文字的过程中,电子设备可以根据用户点击的输入法键盘中的按键,显示这些按键指示的字符串和与该字符串对应的一些候选词,然后用户可以从这些候选词从选择需要的词。
但是,在用户的输入过程中,由于输入法会根据用户的输入习惯,改变候选词的顺序,而用户在输入过程中往往按照自身的习惯选择候选词,例如,用户一气呵成打完一连串编码而导致中间的某个或某些输入词发生了错误,此时,用户需要将操作光标(或鼠标)回到输入词的错误处,然后进行删除修改,导致错误修改的过程繁琐。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种数据输入方法、装置、设备及计算机可读存储介质,旨在解决现有输入文字的过程中错误修改的过程繁琐的技术问题。
为实现上述目的,本发明提供一种数据输入方法,所述数据输入方法包括以下步骤:
获取当前输入操作对应的输入法,并获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词;
基于各个输入词与对应的候选词之间的第一相似度,确定各个输入词中的待替换词;
在所述待替换词对应的候选词中,基于所述输入法获取所述待替换词对应的目标词;
将所述输入语句中的待替换词替换为所述目标词,获得目标输入语句。
进一步地,所述基于各个输入词与对应的候选词之间的第一相似度,确定各个输入词中的待替换词的步骤包括:
在各个输入词依次获取待处理输入词,获取所述待处理输入词与待处理输入词对应的候选词之间的第一相似度;
确定各个输入词对应的各个第一相似度的第一相似度均值;
若所述第一相似度均值中存在小于预设相似度的目标均值,则将所述目标均值对应的输入词作为所述待替换词。
进一步地,所述输入法为五笔输入法,所述在所述待替换词对应的候选词中,基于所述输入法获取所述待替换词对应的目标词的步骤包括:
确定所述待替换词以及所述待替换词对应的各个候选词中,两两之间的第二相似度;
基于所述待替换词对应的各个候选词的第二相似度,确定第二相似度均值;
将所述第二相似度均值中的最大相似度均值对应的候选词作为所述目标词。
进一步地,所述输入法为拼音输入法,所述在所述待替换词对应的候选词中,基于所述输入法获取所述待替换词对应的目标词的步骤包括:
在所述输入语句中获取所述待替换词对应的前一词以及后一词;
将所述前一词以及所述待替换词对应的候选词输入Skip-Gram模型,获得所述第一排序,并将所述后一词以及所述待替换词对应的候选词输入Skip-Gram模型,获得第二排序;
基于所述第一排序以及所述第二排序,在所述待替换词对应的候选词中,获取所述目标词。
进一步地,所述基于所述第一排序以及所述第二排序,在所述待替换词对应的候选词中,获取所述目标词的步骤包括:
基于所述待替换词对应的各个候选词,在所述第一排序中的顺序以及所述第二排序中的顺序,确定所述待替换词对应的各个候选词的权重;
确定所述权重中的最大权重,并将所述最大权重对应的候选词作为所述目标词。
进一步地,所述输入法为拼音输入法,所述获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词的步骤包括:
获取所述当前输入操作对应的输入语句中的各个输入词;
若各个输入词中存在输入拼音为非全拼的第一输入词,则获取所述第一输入词的输入拼音对应的全拼拼音,并获取所述全拼拼音对应的第一候选词;
获取各个输入词中输入拼音为全拼的第二输入词对应的第二候选词;
其中,所述候选词,包括所述第一候选词以及所述第二候选词。
进一步地,所述获取当前输入操作对应的输入法,并获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词的步骤包括:
基于所述当前输入操作对应的键盘输入信息以及输入词,确定所述当前输入操作对应的输入法;
在检测到输入操作对应的键盘输入信息为标点符号时,获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词。
此外,为实现上述目的,本发明还提供一种数据输入装置,所述数据输入装置包括:
第一获取模块,用于获取当前输入操作对应的输入法,并获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词;
确定模块,用于基于各个输入词与对应的候选词之间的第一相似度,确定各个输入词中的待替换词;
第二获取模块,用于在所述待替换词对应的候选词中,基于所述输入法获取所述待替换词对应的目标词;
替换模块,用于将所述输入语句中的待替换词替换为所述目标词,获得目标输入语句。
此外,为实现上述目的,本发明还提供一种数据输入设备,所述数据输入设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据输入程序,所述数据输入程序被所述处理器执行时实现前述的数据输入方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据输入程序,所述数据输入程序被处理器执行时实现前述的数据输入方法的步骤。
本发明通过获取当前输入操作对应的输入法,并获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词;接着基于各个输入词与其他输入词之间的第一相似度,确定各个输入词中的待替换词;而后在所述待替换词对应的候选词中,基于所述输入法获取所述待替换词对应的目标词;然后将所述输入语句中的待替换词替换为所述目标词,获得目标输入语句,能够根据候选词自动选择输入语句中存在错误的输入词的目标词,实现输入语句中错误的词的自动修正,大大减少了错误修改过程中用户的操作过程,提高了语句错误的修正效率以及用户体验。
附图说明
图1是本发明实施例方案涉及的硬件运行环境中数据输入设备的结构示意图;
图2为本发明数据输入方法第一实施例的流程示意图;
图3为本发明数据输入装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境中数据输入设备的结构示意图。
本发明实施例数据输入设备可以是PC。如图1所示,该数据输入设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,数据输入设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。当然,数据输入设备还可配置气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对数据输入设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及数据输入程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的数据输入程序。
在本实施例中,数据输入设备包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的数据输入程序,其中,处理器1001调用存储器1005中存储的数据输入程序时,并执行以下各个实施例中数据输入方法的步骤。
本发明还提供一种数据输入方法,参照图2,图2为本发明数据输入方法第一实施例的流程示意图。
本实施例中,该数据输入方法包括以下步骤:
步骤S101,获取当前输入操作对应的输入法,并获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词;
本实施例中,在用户通过电子设备输入文字(汉子)时,获取当前输入操作对应的输入法,具体地,可通过Hook(钩子函数)获取电子设备的键盘输入信息(输入键值),并同时获取该当前输入操作对应的输入词,即input输入的文字内容,根据该输入词以及键盘输入信息判断当前用户所使用的输入法,如:通过hook监听键盘输入信息为:fuvb+“空格”,而监听的input输入词为“幸好”,则通过五笔的字根反查以及拼音反查,当前的输入操作与五笔输入法匹配,则确定该输入法为五笔输入法。
接着,获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词,具体地,通过Hook实时监听键盘输入信息,若键盘输入信息存在标点符号,则确定当前存在断句,将该标签符号与前一个标点符号之间的文字信息作为输入语句,该输入语句中input输入的各个文字内容即为输入词,在input输入之前每一个输入词对应的其他候选词中选取预设个数的词作为输入词的候选词,该预设个数可以设置为3、5、8等。
步骤S102,基于各个输入词与对应的候选词之间的第一相似度,确定各个输入词中的待替换词;
本实施例中,在获取到输入词以及输入词对应的候选词之后,获取各个输入词与对应的候选词之间的第一相似度。对于每一个输入词,获取该输入词对应的候选词,并计算该输入词与各个候选词之间的第一相似度,具体地,获取该输入词的词向量以及各个候选词的候选词向量,计算输入词的词向量与候选词向量之间的余弦值,将该余弦值作为第一相似度。例如,可将输入词或者候选词word2vec、gpt、bert、fasttext等模型进行训练,得到该输入词的词向量或者各个候选词的候选词向量。
在获取到第一相似度时,基于该第一相似度对输入词进行打分,得到各个输入词对应的分值,该分值可以为对应的第一相似度的均值或者和值,根据分值确定各个输入词中的待替换词;例如,将分值小于预设值的输入词作为待替换词,若不存在分词小与预设值的输入词,则判定该输入语句不存在错误。
步骤S103,在所述待替换词对应的候选词中,基于所述输入法获取所述待替换词对应的目标词;
本实施例中,在获取到待替换词时,在所述待替换词对应的候选词中,基于所述输入法获取所述待替换词对应的目标词。具体地,对于五笔输入法,可采用上一步骤相同的方式对待替换词对应的候选词进行打分,将分值最高的候选词作为目标词。对于拼音输入法,通过待替换词的前一词以及后一词分别对待替换词对应的候选词进行排序,根据排序结果确定待替换词对应的各个候选词的权重,将权重最大的候选词作为目标词。
步骤S104,将所述输入语句中的待替换词替换为所述目标词,获得目标输入语句。
本实施例中,在获取到目标词时,将输入语句中的待替换词替换为所述目标词,进而获得目标输入语句,进一步地,为避免用户未发现当前可能存在错误的情况,因此,在得到目标词时,可输出替换确认信息,以便用户根据替换确认信息进行确认,在接收到确认信息时,将输入语句中的待替换词替换为目标词,具体地,在当前输入操作对应的输入文件中,将输入语句中的待替换词替换为目标词。
本实施例提出的数据输入方法,通过获取当前输入操作对应的输入法,并获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词;接着基于各个输入词与其他输入词之间的第一相似度,确定各个输入词中的待替换词;而后在所述待替换词对应的候选词中,基于所述输入法获取所述待替换词对应的目标词;然后将所述输入语句中的待替换词替换为所述目标词,获得目标输入语句,能够根据候选词自动选择输入语句中存在错误的输入词的目标词,实现输入语句中错误的词的自动修正,大大减少了错误修改过程中用户的操作过程,提高了语句错误的修正效率以及用户体验。
基于第一实施例,提出本发明数据输入方法的第二实施例,在本实施例中,步骤S102包括:
步骤S201,在各个输入词依次获取待处理输入词,获取所述待处理输入词与待处理输入词对应的候选词之间的第一相似度;
步骤S202,确定各个输入词对应的各个第一相似度的第一相似度均值;
步骤S203,若所述第一相似度均值中存在小于预设相似度的目标均值,则将所述目标均值对应的输入词作为所述待替换词。
本实施例中,在获取到输入词以及输入词对应的候选词之后,获取各个输入词与对应的候选词之间的第一相似度。对于每一个输入词,获取该输入词对应的候选词,并计算该输入词与各个候选词之间的第一相似度,具体地,获取该输入词的词向量以及各个候选词的候选词向量,计算输入词的词向量与候选词向量之间的余弦值,将该余弦值作为第一相似度。例如,可将输入词或者候选词word2vec、gpt、bert、fasttext等模型进行训练,得到该输入词的词向量或者各个候选词的候选词向量。
接着,基于该第一相似度对输入词进行打分,具体地,基于所述待替换词对应的各个输入词的第一相似度,确定第一相似度均值,即计算各个输入词的第一相似度的均值,得到第一相似度均值。
而后,确定各个第一相似度均值中是否存在小于预设相似度的目标均值,若所述第一相似度均值中存在小于预设相似度的目标均值,则将所述目标均值对应的输入词作为所述待替换词,进而准确确定输入语句中的待替换词(错误词)。
其中,预设相似度可进行合理设置,例如该预设相似度设置为30%等。
本实施例提出的数据输入方法,通过在各个输入词依次获取待处理输入词,获取所述待处理输入词与待处理输入词对应的候选词之间的第一相似度;接着确定各个输入词对应的各个第一相似度的第一相似度均值;而后若所述第一相似度均值中存在小于预设相似度的目标均值,则将所述目标均值对应的输入词作为所述待替换词,能够根据各个输入词的第一相似度均值准确确定输入语句中的待替换词(错误词),进一步提高输入语句进行修正的准确性。
基于第二实施例,提出本发明数据输入方法的第三实施例,在本实施例中,输入法为五笔输入法,步骤S103包括:
步骤S301,确定所述待替换词以及所述待替换词对应的各个候选词中,两两之间的第二相似度;
步骤S302,基于所述待替换词对应的各个候选词的第二相似度,确定第二相似度均值;
步骤S303,将所述第二相似度均值中的最大相似度均值对应的候选词作为所述目标词。
本实施例中,在确定待替换词时,确定所述待替换词以及所述待替换词对应的各个候选词中,两两之间的第二相似度。该第二相似度与第一相似度的计算方式类似,在此不再赘述。
接着,基于所述待替换词对应的各个候选词的第二相似度,确定第二相似度均值,具体地,计算各个输入词的第二相似度的均值,得到第二相似度均值。
而后,比较各个第二相似度均值,得到第二相似度均值中的最大相似度均值,并将所述第二相似度均值中的最大相似度均值对应的候选词作为所述目标词。
本实施例提出的数据输入方法,通过确定所述待替换词以及所述待替换词对应的各个候选词中,两两之间的第二相似度;接着基于所述待替换词对应的各个候选词的第二相似度,确定第二相似度均值;而后将所述第二相似度均值中的最大相似度均值对应的候选词作为所述目标词,能够根据第二相似度均值准确在候选词中确定目标词,进一步提高输入语句进行修正的准确性。
基于第一实施例,提出本发明数据输入方法的第四实施例,在本实施例中,输入法为拼音输入法,步骤S103包括:
步骤S401,在所述输入语句中获取所述待替换词对应的前一词以及后一词;
步骤S402,将所述前一词以及所述待替换词对应的候选词输入Skip-Gram模型,获得所述第一排序,并将所述后一词以及所述待替换词对应的候选词输入Skip-Gram模型,获得第二排序;
步骤S403,基于所述第一排序以及所述第二排序,在所述待替换词对应的候选词中,获取所述目标词。
本实施例中,在确定待替换词时,现在输入语句中获取所述待替换词对应的前一词以及后一词,即前一词为输入语句中该待替换词之前的一个词,后一词为输入语句中该待替换词之后的一个词。
接着,将所述前一词以及所述待替换词对应的候选词输入Skip-Gram模型进行模型训练,模型训练的结果即为第一排序,并将所述后一词以及所述待替换词对应的候选词输入Skip-Gram模型进行模型训练,模型训练的结果即为第二排序。
而后,基于所述第一排序以及所述第二排序,在所述待替换词对应的候选词中,获取所述目标词。具体地,一实施例中,该步骤S403包括:
步骤a,基于所述待替换词对应的各个候选词,在所述第一排序中的顺序以及所述第二排序中的顺序,确定所述待替换词对应的各个候选词的权重;
步骤b,确定所述权重中的最大权重,并将所述最大权重对应的候选词作为所述目标词。
本实施例中,基于所述待替换词对应的各个候选词,在所述第一排序中的顺序以及所述第二排序中的顺序,确定所述待替换词对应的各个候选词的权重,具体地,对于每一个候选词,先获取该候选词在第一排序中的顺序以及第二排序中的顺序,获取第一排序中的顺序的对应权重以及第二排序中的顺序的对应权重,该候选词的权重可以为第一排序中的顺序的对应权重以及第二排序中的顺序的对应权重之和,其中,在第一排序或者第二排序中,顺序越靠前,对应权重越大。
接着,确定所述权重中的最大权重,并将所述最大权重对应的候选词作为所述目标词,进而通过各个候选词的权重准确得到目标词,提高目标词的准确性。
本实施例提出的数据输入方法,通过在所述输入语句中获取所述待替换词对应的前一词以及后一词;接着将所述前一词以及所述待替换词对应的候选词输入Skip-Gram模型,获得所述第一排序,并将所述后一词以及所述待替换词对应的候选词输入Skip-Gram模型,获得第二排序;而后基于所述第一排序以及所述第二排序,在所述待替换词对应的候选词中,获取所述目标词,能够根据候选词的排序在候选词中筛选目标词,进一步提高输入语句进行修正的准确性。
基于第一实施例,提出本发明数据输入方法的第五实施例,在本实施例中,所述输入法为拼音输入法,步骤S101包括:
步骤S501,获取所述当前输入操作对应的输入语句中的各个输入词;
步骤S502,若各个输入词中存在输入拼音为非全拼的第一输入词,则获取所述第一输入词的输入拼音对应的全拼拼音,并获取所述全拼拼音对应的第一候选词;
步骤S503,获取各个输入词中输入拼音为全拼的第二输入词对应的第二候选词;
其中,所述候选词,包括所述第一候选词以及所述第二候选词。
本实施例中,先获取输入语句中的各个输入词,并根据键盘输入信息确定输入词中是否存在输入拼音为非全拼的第一输入词。
若各个输入词中存在输入拼音为非全拼的第一输入词,则获取所述第一输入词的输入拼音对应的全拼拼音,该全拼拼音为第一输入词的键盘输入信息所对应的所有可能的拼音,并获取所述全拼拼音对应的第一候选词,其中,对于每一个全屏拼音,选取预设个数的词作为输入词的第一候选词。
对于输入拼音为全拼的第二输入词,则直接获取对应的第二候选词。
本实施例提出的数据输入方法,通过获取所述当前输入操作对应的输入语句中的各个输入词;接着若各个输入词中存在输入拼音为非全拼的第一输入词,则获取所述第一输入词的输入拼音对应的全拼拼音,并获取所述全拼拼音对应的第一候选词;而后获取各个输入词中输入拼音为全拼的第二输入词对应的第二候选词;通过获取非全拼的拼音对应的全拼拼音的第一候选词,能够完整或者各个输入词的候选词,进一步提升在候选词中筛选目标词的准确性。
基于上述各个实施例,提出本发明数据输入方法的第六实施例,在本实施例中,步骤S101包括:
步骤S601,基于所述当前输入操作对应的键盘输入信息以及输入词,确定所述当前输入操作对应的输入法;
步骤S602,在检测到输入操作对应的键盘输入信息为标点符号时,获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词。
本实施例中,本实施例中,在用户通过电子设备输入文字(汉子)时,基于所述当前输入操作对应的键盘输入信息以及输入词,确定所述当前输入操作对应的输入法,具体地,可通过Hook(钩子函数)获取电子设备的键盘输入信息(输入键值),并同时获取该当前输入操作对应的输入词,即input输入的文字内容,根据该输入词以及键盘输入信息判断当前用户所使用的输入法,如:通过hook监听键盘输入信息为:fuvb+“空格”,而监听的input输入词为“幸好”,则通过五笔的字根反查以及拼音反查,当前的输入操作与五笔输入法匹配,则确定该输入法为五笔输入法。
接着,在检测到输入操作对应的键盘输入信息为标点符号时,获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词。具体地,通过Hook实时监听键盘输入信息,若键盘输入信息存在标点符号,则确定当前存在断句,将该标签符号与前一个标点符号之间的文字信息作为输入语句,该输入语句中input输入的各个文字内容即为输入词,在input输入之前每一个输入词对应的其他候选词中选取预设个数的词作为输入词的候选词。
本实施例提出的数据输入方法,通过基于所述当前输入操作对应的键盘输入信息以及输入词,确定所述当前输入操作对应的输入法;接着在检测到输入操作对应的键盘输入信息为标点符号时,获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词,能够准确的确定输入法并准确地到输入词对应的候选词,进一步提高输入语句进行修正的准确性。
本发明还提供一种数据输入装置,参照图3,所述数据输入装置包括:
第一获取模块10,用于获取当前输入操作对应的输入法,并获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词;
确定模块20,用于基于各个输入词与对应的候选词之间的第一相似度,确定各个输入词中的待替换词;
第二获取模块30,用于在所述待替换词对应的候选词中,基于所述输入法获取所述待替换词对应的目标词;
替换模块40,用于将所述输入语句中的待替换词替换为所述目标词,获得目标输入语句。
上述各程序单元所执行的方法可参照本发明数据输入方法各个实施例,此处不再赘述。
本发明还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有数据输入程序,所述数据输入程序被处理器执行时实现如上所述的数据输入方法的步骤。
其中,在所述处理器上运行的数据输入程序被执行时所实现的方法可参照本发明数据输入方法各个实施例,此处不再赘述。
此外,本发明实施例还提出一种计算机程序产品,该计算机程序产品上包括数据输入程序,所述数据输入程序被处理器执行时实现如上所述的数据输入方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种数据输入方法,其特征在于,所述数据输入方法包括以下步骤:
获取当前输入操作对应的输入法,并获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词;
基于各个输入词与对应的候选词之间的第一相似度,确定各个输入词中的待替换词;
在所述待替换词对应的候选词中,基于所述输入法获取所述待替换词对应的目标词;
将所述输入语句中的待替换词替换为所述目标词,获得目标输入语句。
2.如权利要求1所述的数据输入方法,其特征在于,所述基于各个输入词与对应的候选词之间的第一相似度,确定各个输入词中的待替换词的步骤包括:
在各个输入词依次获取待处理输入词,获取所述待处理输入词与待处理输入词对应的候选词之间的第一相似度;
确定各个输入词对应的各个第一相似度的第一相似度均值;
若所述第一相似度均值中存在小于预设相似度的目标均值,则将所述目标均值对应的输入词作为所述待替换词。
3.如权利要求2所述的数据输入方法,其特征在于,所述输入法为五笔输入法,所述在所述待替换词对应的候选词中,基于所述输入法获取所述待替换词对应的目标词的步骤包括:
确定所述待替换词以及所述待替换词对应的各个候选词中,两两之间的第二相似度;
基于所述待替换词对应的各个候选词的第二相似度,确定第二相似度均值;
将所述第二相似度均值中的最大相似度均值对应的候选词作为所述目标词。
4.如权利要求1所述的数据输入方法,其特征在于,所述输入法为拼音输入法,所述在所述待替换词对应的候选词中,基于所述输入法获取所述待替换词对应的目标词的步骤包括:
在所述输入语句中获取所述待替换词对应的前一词以及后一词;
将所述前一词以及所述待替换词对应的候选词输入Skip-Gram模型,获得所述第一排序,并将所述后一词以及所述待替换词对应的候选词输入Skip-Gram模型,获得第二排序;
基于所述第一排序以及所述第二排序,在所述待替换词对应的候选词中,获取所述目标词。
5.如权利要求4所述的数据输入方法,其特征在于,所述基于所述第一排序以及所述第二排序,在所述待替换词对应的候选词中,获取所述目标词的步骤包括:
基于所述待替换词对应的各个候选词,在所述第一排序中的顺序以及所述第二排序中的顺序,确定所述待替换词对应的各个候选词的权重;
确定所述权重中的最大权重,并将所述最大权重对应的候选词作为所述目标词。
6.如权利要求1所述的数据输入方法,其特征在于,所述输入法为拼音输入法,所述获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词的步骤包括:
获取所述当前输入操作对应的输入语句中的各个输入词;
若各个输入词中存在输入拼音为非全拼的第一输入词,则获取所述第一输入词的输入拼音对应的全拼拼音,并获取所述全拼拼音对应的第一候选词;
获取各个输入词中输入拼音为全拼的第二输入词对应的第二候选词;
其中,所述候选词,包括所述第一候选词以及所述第二候选词。
7.如权利要求1至6任一项所述的数据输入方法,其特征在于,所述获取当前输入操作对应的输入法,并获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词的步骤包括:
基于所述当前输入操作对应的键盘输入信息以及输入词,确定所述当前输入操作对应的输入法;
在检测到输入操作对应的键盘输入信息为标点符号时,获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词。
8.一种数据输入装置,其特征在于,所述数据输入装置包括:
第一获取模块,用于获取当前输入操作对应的输入法,并获取所述当前输入操作对应的输入语句中的各个输入词以及各个输入词对应的候选词;
确定模块,用于基于各个输入词与对应的候选词之间的第一相似度,确定各个输入词中的待替换词;
第二获取模块,用于在所述待替换词对应的候选词中,基于所述输入法获取所述待替换词对应的目标词;
替换模块,用于将所述输入语句中的待替换词替换为所述目标词,获得目标输入语句。
9.一种数据输入设备,其特征在于,所述数据输入设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据输入程序,所述数据输入程序被所述处理器执行时实现如权利要求1至7中任一项所述的数据输入方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据输入程序,所述数据输入程序被处理器执行时实现如权利要求1至7中任一项所述的数据输入方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110945770.3A CN113791694A (zh) | 2021-08-17 | 2021-08-17 | 数据输入方法、装置、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110945770.3A CN113791694A (zh) | 2021-08-17 | 2021-08-17 | 数据输入方法、装置、设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113791694A true CN113791694A (zh) | 2021-12-14 |
Family
ID=78876173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110945770.3A Pending CN113791694A (zh) | 2021-08-17 | 2021-08-17 | 数据输入方法、装置、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113791694A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664466A (zh) * | 2018-04-11 | 2018-10-16 | 广州视源电子科技股份有限公司 | 候选词评估方法、装置、计算机设备和存储介质 |
CN109408796A (zh) * | 2017-08-17 | 2019-03-01 | 北京搜狗科技发展有限公司 | 一种信息处理方法、装置及电子设备 |
CN111310440A (zh) * | 2018-11-27 | 2020-06-19 | 阿里巴巴集团控股有限公司 | 文本的纠错方法、装置和系统 |
WO2020220539A1 (zh) * | 2019-04-28 | 2020-11-05 | 平安科技(深圳)有限公司 | 数据增量方法、装置、计算机设备及存储介质 |
-
2021
- 2021-08-17 CN CN202110945770.3A patent/CN113791694A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109408796A (zh) * | 2017-08-17 | 2019-03-01 | 北京搜狗科技发展有限公司 | 一种信息处理方法、装置及电子设备 |
CN108664466A (zh) * | 2018-04-11 | 2018-10-16 | 广州视源电子科技股份有限公司 | 候选词评估方法、装置、计算机设备和存储介质 |
CN111310440A (zh) * | 2018-11-27 | 2020-06-19 | 阿里巴巴集团控股有限公司 | 文本的纠错方法、装置和系统 |
WO2020220539A1 (zh) * | 2019-04-28 | 2020-11-05 | 平安科技(深圳)有限公司 | 数据增量方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10156981B2 (en) | User-centric soft keyboard predictive technologies | |
US20170076181A1 (en) | Converting text strings into number strings, such as via a touchscreen input | |
US10049091B2 (en) | Method, device, and terminal equipment for enabling intelligent association in input method | |
WO2020077824A1 (zh) | 异常问题的定位方法、装置、设备及存储介质 | |
CN107085471B (zh) | 一种基于用户输入速度的输入法纠错方法和装置 | |
EP2940551B1 (en) | Method and device for implementing voice input | |
TWI567569B (zh) | Natural language processing systems, natural language processing methods, and natural language processing programs | |
CN108256523B (zh) | 基于移动终端的识别方法、装置及计算机可读存储介质 | |
CN105094368A (zh) | 一种对输入法候选项进行调频排序的控制方法及控制装置 | |
CN111160013B (zh) | 文本纠错方法及装置 | |
WO2020026366A1 (ja) | 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム | |
CN104375663A (zh) | 一种联想输入方法及装置 | |
KR101130206B1 (ko) | 입력 순서와 무관한 문자 입력 메커니즘을 제공하는 방법, 기기 및 컴퓨터 프로그램 제품 | |
CN114175017A (zh) | 模型构建方法、分类方法、装置、存储介质及电子设备 | |
JP5637143B2 (ja) | 共同開発支援システム、共同開発支援方法及びプログラム | |
CN111090341A (zh) | 输入法候选结果展示方法、相关设备及可读存储介质 | |
CN113791694A (zh) | 数据输入方法、装置、设备及计算机可读存储介质 | |
JP6419899B1 (ja) | 情報処理装置、制御方法及び制御プログラム | |
JP4936650B2 (ja) | 類似単語検索装置、その方法、そのプログラム、および、情報検索装置 | |
CN111009247B (zh) | 语音识别修正方法、装置和存储介质 | |
CN105892710B (zh) | 基于文本框的汉字输入方法及其装置 | |
CN109063106B (zh) | 网址修正方法、装置、计算机设备和存储介质 | |
CN104503980B (zh) | 确定综合搜索信息以及据此确定待推送候选搜索序列 | |
EP3537341A1 (en) | Character input device, character input method, and character input program | |
CN112328096A (zh) | 候选词显示方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |