CN104615591B - 基于上下文的前向输入纠错方法和装置 - Google Patents

基于上下文的前向输入纠错方法和装置 Download PDF

Info

Publication number
CN104615591B
CN104615591B CN201510106752.0A CN201510106752A CN104615591B CN 104615591 B CN104615591 B CN 104615591B CN 201510106752 A CN201510106752 A CN 201510106752A CN 104615591 B CN104615591 B CN 104615591B
Authority
CN
China
Prior art keywords
text
confirmed
candidate target
correction
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510106752.0A
Other languages
English (en)
Other versions
CN104615591A (zh
Inventor
宋林杰
吴琨
戴云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Chule Cootek Information Technology Co Ltd
Original Assignee
Shanghai Chule Cootek Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Chule Cootek Information Technology Co Ltd filed Critical Shanghai Chule Cootek Information Technology Co Ltd
Priority to CN201510106752.0A priority Critical patent/CN104615591B/zh
Publication of CN104615591A publication Critical patent/CN104615591A/zh
Priority to US15/557,451 priority patent/US20180060295A1/en
Priority to EP16761042.7A priority patent/EP3270299A4/en
Priority to PCT/CN2016/075183 priority patent/WO2016141815A1/zh
Application granted granted Critical
Publication of CN104615591B publication Critical patent/CN104615591B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04886Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures by partitioning the display area of the touch-screen or the surface of the digitising tablet into independently controllable areas, e.g. virtual keyboards or menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/048Indexing scheme relating to G06F3/048
    • G06F2203/04803Split screen, i.e. subdividing the display area or the window area into separate subareas
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements

Abstract

本发明涉及一种基于上下文的前向输入纠错方法和装置,所述方法包括获取已确认的文本,所述已确认文本为在当前输入开始前已确认的文本;基于所述已确认文本的校正形式,在语料库中进行检索,获得包含所述已确认文本校正形式的检索结果;基于所述检索结果,对所述已确认文本进行纠错。本发明提供了一种智能化的基于上下文的前向输入纠错的方法和装置,极大地简化了用户操作,提高了输入的效率和准确率,改善了用户体验。

Description

基于上下文的前向输入纠错方法和装置
技术领域
本发明涉及电子产品应用领域,特别涉及在电子产品上进行输入时,基于上下文的前向输入纠错方法和装置。
背景技术
如今,智能手机、平板电脑等便携式电子设备日益普及,作为基本的人机交互工具,输入法直接影响着人们在使用这些电子设备的用户体验。输入速度和输入准确性是评价输入法是否优秀的主要因素。通过尽可能少的操作获得尽可能准确的候选字词,是输入法一直在追求的目标,纠错正是实现这一目标的重要功能之一。
造成输入错误的因素有很多,例如客观上由于键盘尺寸的缩小造成容易按错按键,或者主观上由于用户自身拼写错误等。目前,对于这些无论是由于主观原因或是客观原因所造成的输入错误,大多数输入法仅能够提供向后的纠错功能。也就是说,仅能够根据用户正在输入或者已经输入的字符串,对用户后续将要进行输入的字符串进行纠错。
然而,这种人为设定的向后纠错,不仅对阻碍了用户更加快速的输入,其无疑也阻碍了输入法纠错功能的进一步提升。
发明内容
本发明要解决的技术问题是,提供智能化的基于上下文的前向输入纠错的方法和装置。
根据本发明的一方面,提供了一种基于上下文的前向输入纠错方法,包括:获取已确认的文本,所述已确认文本为在当前输入开始前已确认的文本,具体来说,可为在当前光标位置逆文本输入方向上的一个或多个单词;基于所述已确认文本的校正形式,在语料库中进行检索,获得与所述已确认文本校正形式对应的预测词或联想词;基于所述已确认文本校正形式与对应的联想词或预测词形成候选对象,当检测到存在对包含所述已确认文本校正形式的候选对象的选择时,对所述已确认文本进行纠错。
根据本发明的某些方面,所述基于已确认文本的校正形式,在语料库中进行检索,获得包含已确认文本校正形式的检索结果进一步包括用户操作手势操作点选择某一候选词中的一部分,以形成选中部分和剩余部分,具体包括:判断是否存在当前正在输入的字符串;当存在当前正在输入的字符串时,基于所述已确认文本的校正形式在语料库中进行检索并基于当前正在输入的字符串对该检索结果进行过滤,或基于用户当前正在输入的字符串触发采用已确认文本的校正形式,获取对应的预测词;当不存在当前正在输入的字符串时,基于已确认文本的校正形式,获得对应的联想词。
根据本发明的某些方面,进一步包括:基于已确认文本的原形和校正形式,在语料库中一起进行检索,获得除了与已确认文本校正形式对应的预测词或联想词之外,还获得与已确认文本原形对应的预测词或联想词。
根据本发明的一方面,提供了一种基于上下文的前向输入纠错装置,包括:获取单元,适于获取已确认的文本;检索单元,适于基于所述已确认文本的校正形式,在语料库中进行检索,获取与所述已确认文本校正形式对应的联想词或预测词;候选对象获取单元,适于根据所述已确认文本校正形式与对应的联想词或预测词形成候选对象并进行显示,根据输入获取所选择的候选对象;纠错单元,适于根据所述候选对象获取单元获得的候选对象对所述已确认文本进行纠错。
根据本发明的某些方面,当不存在当前正在输入的字符串时,所述检索单元进一步包括:基于已确认文本的校正形式,获得对应的联想词;当存在当前正在输入的字符串时,所述检索单元进一步包括:基于已确认文本的校正形式在语料库中进行检索,并基于当前正在输入的字符串对该检索结果进行过滤,或基于用户当前正在输入的字符串触发采用已确认文本的校正形式,获取对应的预测词。
根据本发明的某些方面,所述检索单元进一步包括,不仅基于所述已确认文本的校正形式,还基于所述已确认文本的原形,在语料库中进行检索,获取与所述已确认文本原形和校正形式分别对应的预测词或联想词。
与现有技术相比,本发明通过引入文本的校正形式,以用户已确认上屏文本的校正形式为检索基础,在语料库中查找对应的联想词或预测词,并且基于该校正形式形成候选对象,提示用户进行选择,并根据用户所选择的候选对象实现对已确认文本的纠错,从而能够在不打断当前正在输入文本的前提下,直接对已确认文本进行纠错,而无需对待纠错文本进行额外操作。这是对现有输入法技术取词思路的重大突破,从根本上改变了现有技术输入法中默认的向后纠错的纠错机制,而且采用这种方式极大的简化了用户操作,提高了输入的效率和准确率,进而大大改善了用户体验。
附图说明
图1和图2为用户与便携式电子设备进行输入交互的界面示意图。
图3为本发明基于上下文的前向输入纠错方法的一种实施方式的流程示意图;
图4为本发明基于上下文的前向输入纠错方法一种具体实施方式中的操作示意图;
图5为本发明基于上下文的前向输入纠错方法另一种具体实施方式中的操作示意图;
图6为本发明基于上下文的前向输入纠错方法又一种具体实施方式中的操作示意图;
图7为本发明基于上下文的前向输入纠错方法又一种具体实施方式中的操作示意图;
图8为本发明基于上下文的前向输入纠错方法又一种具体实施方式中的操作示意图;
图9为图3中步骤S5一种具体实施方式的流程示意图;
图10为图9中步骤S510一种具体实施方式中对候选对象进行显示的布局示意图;
图11为图3中步骤S5另一种具体实施方式的流程示意图;
图12为图1中步骤S520一种具体实施方式中的操作示意图;
图13为本发明基于上下文的前向输入纠错装置的一种实施方式的结构示意图;
图14为图13中候选对象获取单元一种具体实施方式的结构示意图;
图15为图13中候选对象获取单元另一种具体实施方式的结构示意图。
具体实施方式
现有技术的输入法中所提供的纠错功能大多为向后纠错功能,其中,所提及的“向前纠错”或“向后纠错”分别是指,在正常输入状态下,基于当前文本输入区域的光标位置而言,对位于当前光标位置逆文本输入方向或顺文本输入方向的文本进行纠正。在正常输入状态下,“当前光标位置”用于指示用户当前输入所开始的位置,当前光标位置之前,即当前光标位置逆文本输入方向,的文本通常指用户已确认的文本,而当前光标位置之后,即当前光标位置顺文本输入方向,的文本通常指的是用户当前正在输入且尚未确认的文本。在不同的输入法中,用户当前正在输入的文本有时通过单独的输入栏显示在特定区域,例如键盘区域上方,有时直接显示在文本输入区域中并通过下划线或通过将光标变为闪烁的图形用以提示这部分文本属于当前正在输入且尚未经确认的文本。
在现有技术中,常规的纠错通常是向后输入纠错。例如,用户在正常输入过程中,由于误操作,本该按下字母“a”的按键却误按了相邻的字母“s”的按键,或由于用户的拼写错误,导致用户期望输入的文本为“can”,而当前实际输入的字符串却为“csn”;在用户对该次输入确认上屏之前,通过对当前输入字符串进行纠错,获得单词“can”,并将该纠错结果“can”作为候选词之一,显示在候选词栏,供用户进行选择。然而,在这种情况下,如果用户已将错误的文本“csn”确认上屏,或已经开始输入“csn”之后的文本时才发现存在这样的错误时,现有的输入法无法在不停止当前输入的前提下,智能地对之前用户此前已确认上屏的文本进行纠错。
本发明正是考虑到现有技术的局限性,创造性地提出了一种能够实现“向前纠错”的输入法和输入装置,智能地对当前光标位置之前已确认输入的文本进行纠错,从而为用户提供了更为灵活的纠错功能,提高了输入效率,加快了文本输入的速度,也提升了文本输入的准确性。
其中,术语“确认上屏”用于描述用户通过某种设定的方式对某一个候选词进行选中确认,使该候选词被呈现至文本输入区域中的当前光标位置处。
以下将参考附图对示例实施方式进行更为全面的描述。附图中相同的附图标记将用来指示相同或相似的部件。尽管以下描述了本发明的若干示例性实施例和特征,但是在不背离本发明的发明思路的情况下,对本发明进行的修改、调整以及其它替换实现,例如,对附图所示部件进行等同替换、添加或修改,或通过替换、重新排序或添加步骤,不应造成对本发明的限制。本发明的适当范围应由所附权利要求所界定。
参考图1,用户在便携式电子设备上进行输入,图中示出了在正常输入状态下,用户与该便携式电子设备进行交互的界面。该交互界面通过该便捷式电子设备的触摸式显示屏进行显示,并至少包含键盘区域110和文本输入区域112。其中,文本输入区域112通常用于显示用户已经确认上屏的文本,文本输入区域112中包含光标,用于指示当前输入的起始位置,用户当前正在输入且未确认的字符串通过输入栏130进行显示。用户软件键盘120显示在键盘区域110中,当用户点击软件键盘120中的按键或在软件键盘120上进行滑动时,用户输入的字符串显示在输入栏130,与用户所输入的字符串对应的候选词或基于用户所输入字符串进行预测或联想所获得的预测词或联想词显示在候选词栏140。参考图2,当用户点击候选词栏140中的某一个候选词或选择该候选词对应的数字编号后,该候选词得到用户的确认,接着该确认的候选词被上屏,即被呈现至文本输入区域112中光标位置处,并且候选词栏140的候选词被清空。
参考图3,在本发明基于上下文的前向输入纠错方法的一种具体实施例中,其包括:
步骤S1,获取用户已确认的文本;
步骤S2,判断是否存在当前正在输入的字符串,当存在当前正在输入时,执行步骤S4,基于用户当前正在输入的字符串以及所述已确认的文本获得预测词;当不存在当前正在输入的字符串时,执行步骤S3,基于所述已确认的文本获得联想词;
步骤S3,基于所述已确认的文本的校正形式,在语料库中进行检索,获得与其校正形式对应的联想词,执行步骤S5;
步骤S4,在语料库中基于该已确认文本的校正形式进行检索并基于用户当前正在输入的字符串对该检索结果进行过滤,或基于用户当前正在输入的字符串触发采用已确认文本的某一校正形式,获得对应的预测词;
步骤S5,基于根据已确认文本的原形或校正形式与对应的联想词或预测词形成候选对象,对所述已确认的文本进行纠错。
其中,已确认的文本为在当前正在输入开始之前已经经由用户确认上屏的文本,其可包括光标当前位置之前的一个或多个单词。
在一种具体实施方式中,已确认文本的校正形式可包括首字母大写的形式。
参考图4,在用户已确认上屏文本“Wish you a happy new”后,根据本发明实施方式,首先根据步骤S1获取已确认上屏的文本,例如,所获取的已确认文本可以是字符串“new”。接着,在用户继续输入之前,即不存在当前正在输入的字符串,则执行步骤S3。其中,步骤S3可进一步包括:基于所述已确认文本的原形和校正形式,分别在语料库中进行检索,获得与所述已确认文本的原形和校正形式分别对应的联想词。具体来说,基于该上屏文本new的原形,即该文本不进行任何变化,在语料库中进行检索,并获得与该原形对应的联想词,例如start,term,page等;以及基于与该上屏文本new的校正形式,例如其首字母大写形式New,在语料库中进行检索,并获得与该校正形式对应的联想词,例如Year,York等。类似的,当所获取的已确认文本为字符串“happy new”时,执行步骤S3,分别基于其原形,即“happy new”,以及其校正形式,即其首字母大写形式“Happy New”,在语料库中进行检索,获得分别与原形对应的联想词(happy new)“year”以及与其校正形式对应的联想词(HappyNew)“Year”。
在一种实施方式中,由该确认文本的校正形式与其后续至少一个词所构成的短语,相较于该确认文本的原形与相同后续词所构成的短语,可非兼容地存储于语料库中,使得语料库中不存在两个短语,其差异仅仅为其校正形式与原形的差异。也就是说,当语料库中存储New York时,而其中不存在new York或new york;或者当语料库中存储MountainView时,其不存在mountain view或mountain View。在一种具体实现中,包含已确认文本校正形式的短语,其后续联想词也具有同样的校正形式,例如所述短语中每一个单词的首字母为大写形式。在一种具体实现中,根据对海量数据的统计和分析,形成语料库中至少一个具有某种校正形式的短语,其中该具有校正形式的短语可符合固有的搭配规则,例如对于首字母大写的校正形式,语料库中的短语可符合搭配规则,如人名George Washington,特定的地名Cascade Range、Great Wall、Dead Sea、Downing Street、South America,特定的日期Labor Day、Valentine’s Day,具有指定含义的建筑White House、Golden GateBridge,书报或小说或影视作品的名称Catching Fire、Sycamore Row、Big Bang Theory等。
类似的,已确认文本的校正形式还可包括全小写的形式。在一种具体实施方式中,参考图5,用户所输入的字母被不合适的大写时,例如当用户在输入过程中,涉及用于标识语句结束的标点符号,导致该标点符号后的字母被不合适地大写。具体地,例如i.e.,当用户在输入“i.”之后进一步输入e时,由于e之前存在句点“.”,e会被认做为新句子的句首字母而自动大写,因此确认上屏的文本原形为“i.E”。此时,在用户当前正在输入“.”之前,根据步骤S3,本发明前向输入纠错方式可包括:基于该上屏文本的原形,即“i.E”,在语料库中进行检索,并获得与该原形对应的联想词,例如i.Each,i.Every等;以及基于与该上屏文本的校正形式,例如其全小写形式“i.e”,在语料库中进行检索,并获得与该校正形式对应的联想词,例如i.e.等。
在又一种具体实施方式中,已确认文本的校正形式可包括该已确认文本的其它书写形式,例如包含空格或连字符的书写形式。例如,参考图6,当用户确认上屏文本”longdistance”,根据本发明实施方式,首先根据步骤S1获取已确认上屏的文本,即字符串”longdistance”。接着,在用户当前正在输入之前,执行步骤S3,包括:基于该上屏文本”longdistance”的原形,在语料库中进行检索,并获得与该原形对应的联想词,例如”to”;以及基于与该上屏文本”long distance”的校正形式,例如含连字符的书写形式long-distance,在语料库中进行检索,并获得与该校正形式“long-distance”对应的联想词“telephone”和“trip”。
而当用户在确认上屏文本之后,继续进行输入时,可执行步骤S4。在一种实施方式中,步骤S4可包括:根据用户当前正在输入的字符串,对基于已确认文本校正形式的检索结果进行过滤,获得对应的预测词。在一种具体实施例中,参考图7,当检测到用户对当前字符串(例如south)确认上屏时,获取用户已确认上屏的字符串,即south;接着,在语料库中基于该字符串的原形及校正形式分别进行检索,例如,分别就该字符串的全小写形式south以及该字符串的首字母大写形式South进行检索,获得对应的检索结果710,并将这些检索出来的联想词显示给用户;接着,当检测到用户当前正在输入po时,根据用户当前输入的字符串po在获得的检索结果710中进行过滤,获取检索结果中符合以po开头的词,例如(South)Pole、(South)Pointe、(South)Porland等。
其中,由于检索结果中可能具有包含已确认文本校正形式的短语,也可能具有包含该确认文本原形的短语,或者具有两者的集合,并且包含已确认文本校正形式的短语与包含该确认文本原形的短语非兼容地存储于语料库中,因此步骤S4进一步包括:根据用户当前输入的字符串的原形(例如po)及其校正形式(例如Po),分别对该检索结果进行过滤,从而获得对应的过滤结果,其中,该过滤结果包含当前输入字符串的原形或其校正形式。
在另一种实施方式中,步骤S4可包括:基于用户当前正在输入的字符串触发采用所述已确认文本的某一种校正形式,获得对应的预测词。在一种具体实施例中,参考图8,用户正在输入邮箱地址,邮箱地址的首字母被不必要的大写了,其中,当检测到用户当前正在输入的字符串为邮箱地址标识符“@”时,将该标识符与据其最近的一个空格符之间的所有已确认文本的全小写形式,提供给用户进行选择。
接着,执行步骤S5。由于检索结果中有可能既存在基于已确认文本校正形式而获得的联想词或预测词,也存在基于已确认文本原形而获得的联想词或预测词,一方面,为了实现较好的用户体验,有必要在候选对象中包含已确认文本的原形或校正形式,而另一方面,若直接将包含已确认文本原形或校正形式的候选对象确认上屏,会使得其中已确认文本的原形或校正形式将和原先已确认上屏的文本形成重复,因此,有必要对其进行处理。
在一种实施方式中,参考图9,步骤S5进一步可包括:
步骤S510,根据步骤S3或步骤S4获得的结果形成候选对象,并显示给用户;
步骤S512,检测用户的输入;当用户选择候选对象之一时,进入步骤S516;当用户当前正在输入时,返回步骤S4;当用户无输入时,进入步骤S514;
步骤S514,检测是否存在退出指令,若是,则结束该流程,否则返回步骤S512;
步骤S516,获取用户所选择的候选对象,判断其为基于原形或基于校正形式所获得的文本,当该选择的候选对象为基于校正形式所获得的文本,执行步骤S518;当该选择结果为基于原形所获得的文本时,则不对已确认文本进行校正。
步骤S518,根据所选择的候选对象对已确认的文本进行纠错。
具体来说,在步骤S510的一种实施方式中,根据步骤S3或步骤S4获得的结果形成候选对象可包括:将由步骤S3所获得的联想词或由步骤S4所获得预测词,与其对应的已确认文本的原形或校正形式相结合,形成候选对象。在另一种实施方式中,经由步骤S3或步骤S4从语料库中检索获得的结果包含已确认文本的原形或校正形式,则步骤S510直接将步骤S3或步骤S4的检索结果作为候选对象,进行显示。当将这些候选对象显示给用户时,可如图7所示,将其显示在候选词栏501,也可参考图10,将其显示在键盘中关联的字母附近,所述关联字母包括联想词的首字母或预测词中除去用户当前正在输入字符串之后剩余部分的首字母。
在步骤S514中,所述退出指令可包括:指定动作或指定按键的操作,例如当检测到用户按压退出键时,则退出输入操作。
当检测到用户对显示的候选对象进行选择时,执行步骤S516。在一种实施方式中,步骤S516包括:检测其是否具有校正标记或其对应的校正标记是否存在变更,当存在校正标记或该校正标记存在变更时,该选择结果为基于校正形式所获得的结果。在具体实现中,步骤S516进一步包括获取选择结果对应的校正标记。例如,语料库中对已确认文本的校正形式或原形,与其后续至少一个词所构成的短语进行存储时,其还进一步对每一个所存储的短语分配校正标记,用于标识其对应的校正形式。在某些实施例中,可将校正标记的第一位字符设置为大小写标记位,例如首字母大写对应于1,全小写对应于0;将校正标记的第二位字符设置为连字符标记位,例如存在连字符对应于1,不存在连字符对应于0,等等。将所选择结果的校正标记与已确认上屏文本原有的校正标记进行对比,判断是否存在变化,若有变化则该选择结果包含已确认文本的校正形式。又例如,仅对包含已确认文本校正形式的短语附加并发送校正标记,当检测到存在校正标记的短语时,则需要对已确认文本进行纠错。
在另一种实施方式中,步骤S516可包括:将所选择的候选对象与所述已确认文本进行文本对比,判断所选择的候选对象是否包含已确认文本的校正形式。在一种具体实施例中,引擎层将所获得的结果返回给界面层,界面层通过遮蔽联想词或预测词,即文本View,并将剩余的前缀,即文本Mountain,与光标当前位置前的字符串进行文本对比。当两部分相同,包括大小写、拼写、书写形式等都相同时,即表示无需对已确认部分进行校正,此时,界面层仅对联想词或预测词进行显示;而当两部分不相同,即大小写或拼写或书写形式等任一种存在不同时,界面层显示所接收到的整个检索结果,即Mountain View。
接着执行步骤S518,根据所选择的候选对象对已确认的文本进行校正。具体来说,可删除已确认上屏的文本,以所选择的候选对象来代替。例如,删除用户之前已确认上屏的文本united,而用所选择的候选对象United States代替。
在另一种实施方式中,参考图11,步骤S5进一步可包括:
步骤S520,判断步骤S3或步骤S4所获得的检索结果为基于已确认文本的原形还是基于校正形式所获得的文本,当该检索结果为基于已确认文本的校正形式时,将包含已确认文本校正形式的候选对象显示给用户;否则,仅显示检索结果中基于已确认文本原形的联想词或预测词;
步骤S522,检测用户的输入;当用户选择步骤S520所显示的候选对象之一时,进入步骤S526;当用户当前正在输入时,返回步骤S4;当用户无输入时,进入步骤S524;
步骤S524,检测是否存在退出指令,若是,则结束该流程,否则返回步骤S522;
步骤S526,获取用户所选择的候选对象,当所选择的候选对象包含已确认文本的校正形式时,对所述已确认的文本进行纠错。
其中,步骤S520进一步包括,检测所述检索结果是否具有校正标记或其对应的校正标记是否存在变更,当存在校正标记或该校正标记存在变更时,该检索结果为基于校正形式所获得的结果。在具体实现中,还可包括获取检索结果对应的校正标记。例如,语料库中每一个所存储的短语具有校正标记,用于标识其对应的形式。在某些实施例中,可将校正标记的第一位字符设置为大小写标记位,例如首字母大写对应于1,全小写对应于0;将校正标记的第二位字符设置为连字符标记位,例如存在连字符对应于1,不存在连字符对应于0,等等。将检索结果的校正标记与已确认上屏文本原有的校正标记进行对比,检测是否存在变化,若有变化则该检测结果包含已确认文本的校正形式。又例如,仅对包含已确认文本校正形式的短语附加校正标记,当检测到所述检测结果存在校正标记时,则其为基于已确认文本的校正形式而获得的。
在一种实施方式中,检索结果中包含已确认文本的原形或校正形式,此时当检索结果为基于已确认文本原形而获得的文本时,去除检索结果中已确认文本的原形部分,将剩余部分作为候选对象显示给用户。在另一种实施方式中,检索结果中仅包含基于已确认文本的原形或校正形式而获得的联想词或预测词时,当检索结果为基于已确认文本校正形式而获得时,将该检索结果与其对应的已确认文本的校正形式相结合,形成候选对象并显示给用户。根据某些实施方式,参考图12,引擎层将检索结果传输给界面(UI)层,例如,当用户在输入并确认了单词mountain的输入后,接着输入字符串vi;此时,引擎层根据已确认文本mountain以及当前输入的文本vi获得检索结果;接下来,引擎层将获得的检索结果“Mountain View”返回给界面层,并且,在传输“Mountain View”的时候传输一个校正标记给界面层,用于通知界面层当前所传输的单词需要对已确认文本进行校正;当界面层接收到“Mountain View”时,界面层通过检测是否存在校正标记,或检测校正标记是否相较于预设的标记发生了变更,来获知是否需要对已确认文本进行校正;当需要对已确认文本进行校正时,界面层直接显示所获取的传输结果,即“Mountain View”;当不需要进行校正时,界面层从传输结果中去除已确认文本,将剩余部分作为候选对象显示给用户。
在另一种实施方式中,步骤S520可包括:将所述检索结果与所述已确认文本进行文本对比,判断该检索结果是否为基于校正形式而获得的。例如,引擎层将所获得的检索结果返回给界面层,界面层通过遮蔽联想词或预测词,即文本View,并将剩余的前缀,即文本Mountain,与光标当前位置前的字符串,即已确认文本,进行文本对比。当两部分相同,包括大小写、拼写、书写形式等都相同时,即表示无需对已确认部分进行校正,此时,界面层去除检索结果中已确认文本部分,形成候选对象,并进行显示;而当两部分不相同,即大小写或拼写或书写形式等任一种存在不同时,界面层显示所接收到的整个检索结果,也就是已确认文本的校正形式与预测词或联想词的集合,即Mountain View。
此外,步骤S520还可包括:在进行显示时,以特定的显示形式对已确认文本校正形式的部分进行提示,从而起到对用户进行提醒的效果。例如,可对已确认文本校正形式部分进行高亮或采用下划线形式或其它标识形式。
参考图13,本发明还提供了一种基于上下文的前向输入纠错装置,在一种具体实施例中,该装置包括:获取单元1310,适于获取已确认的文本;检索单元1320,适于基于所述已确认文本的校正形式,在语料库1350中进行检索,获取与所述已确认文本校正形式对应的联想词或预测词;候选对象获取单元1330,适于根据所述已确认文本校正形式与对应的联想词或预测词形成候选对象,并显示给用户;纠错单元1340,适于根据候选对象获取单元1330获得的候选对象对所述已确认文本进行纠错;语料库1350,适于存储文本。
具体来说,已确认的文本为在当前正在输入开始之前已经经由用户确认上屏的文本,其可为光标当前位置之前的一个或多个单词。其中,获取单元1310还进一步包括:当存在当前正在输入的字符串时,获取当前正在输入的字符串;
在某些实施例中,当不存在当前正在输入的字符串时,检索单元1320还进一步包括:基于已确认文本的校正形式,获得对应的联想词;当存在当前正在输入的字符串时,检索单元1320还进一步包括:基于已确认文本的校正形式在语料库中进行检索并基于当前正在输入的字符串对该检索结果进行过滤,或基于用户当前正在输入的字符串触发采用已确认文本的校正形式,获取对应的预测词。其中,检索单元1320还可进一步包括,根据用户当前输入字符串的原形及其校正形式,分别对该检索结果进行过滤。
在某些实施例中,检索单元1320还进一步包括,不仅基于已确认文本的校正形式,还基于已确认文本的原形,在语料库中进行检索,获取与所述已确认文本原形和校正形式分别对应的预测词或联想词。其中,在一种实施方式中,由该确认文本的校正形式与其后续至少一个词所构成的短语,相较于该确认文本的原形与相同后续词所构成的短语,可非兼容地存储于语料库中。
在某些实施方式中,参考图14,候选对象获取单元1330进一步包括:判断单元1331,适于判断来自于检索单元1320的检索结果是基于已确认文本的原形还是校正形式。候选对象形成单元1332,适于根据判断单元1331的判断结果,形成候选对象;具体来说,当该检索结果为基于已确认文本的校正形式获得时,根据检索单元1320的检索结果,以已确认文本校正形式与对应的联想词或预测词的集合作为候选对象,否则,去除检索单元1320的检索结果中已确认文本原形部分,形成候选对象。候选对象检测单元1333,适于显示候选对象形成单元1332所形成的候选对象,并检测用户的输入,获得用户选择的候选对象。接着,纠错单元1340从候选对象获取单元1330获得候选对象,并根据该候选对象对所述已确认文本进行纠错。
在某些实施方式中,参考图15,候选对象获取单元1330进一步包括:候选对象形成单元1335,适于根据来自于检索单元1320的检索结果,形成所述候选对象;候选对象检测单元1336,适于将所述候选对象显示给用户,并检测用户的输入,获得用户选择的候选对象;判断单元1337,适于判断用户所选择的候选对象是基于已确认文本的原形还是校正形式。当根据判断单元1337的结果,所选择的候选对象是基于已确认文本的校正形式时,纠错单元1340根据候选对象获取单元1330获得的候选对象对所述已确认文本进行纠错。
在某些实施方式中,判断单元1331或判断单元1337可通过检测是否具有校正标记或其对应的校正标记是否存在变更,当存在校正标记或该校正标记存在变更时,其为基于已确认文本校正形式所获得的文本;或者通过遮蔽其中的联想词或预测词,将剩余部分与所述已确认文本进行文本对比,当两部分完全相同时,则该候选对象为基于已确认文本原形所获得的文本,从而对文本是基于已确认文本的原形还是校正形式进行判断。
在某些实施方式中,候选对象检测单元1333或候选对象检测单元1336进一步包括:以特定的显示形式对候选对象中已确认文本的校正形式部分进行提示,从而对用户进行提醒。
在某些实施方式中,由所述已确认文本的校正形式与其后续至少一个词所构成的短语,相较于该已确认文本的原形与相同后续词所构成的短语,非兼容地存储于语料库1350中。
相较于现有技术,本发明打破了现有技术中默认采用的向后纠错的纠错机制,通过通过引入文本的校正形式,以用户已确认上屏文本的校正形式为检索基础,在语料库中查找对应的联想词或预测词,并且基于该校正形式形成候选对象,提示用户进行选择,并根据用户所选择的候选对象实现对已确认文本的纠错,从而能够在不打断当前正在输入文本的前提下,直接对已确认文本进行纠错,而无需对待纠错文本进行额外操作。这一纠错取词思路的重大突破,极大的简化了用户操作,提升了输入的速度,增加了输入的准确率,也大大改善了用户体验。
本发明可适用于多种语言,其发明思路并不应受到说明书中所公开的实施例所涉及的具体语言种类的限制。本领域技术人员应当能理解,本发明可适用于例如英语、法语、意大利语、德语、荷兰语、波斯语、阿富汗语、芬兰语等印欧语系的语言,或者例如简体中文、繁体中文、藏语等汉藏语系的语言,或者例如车臣语、格鲁尼亚语等高加索语系的语言,或者例如芬兰语、匈牙利语等乌拉尔语系的语言,或者例如爱斯基摩语、切罗基语、苏语、克里克语等北美印第安语系的语言,或者例如柬埔寨语、孟语、布朗语等南亚语系的语言,或者例如泰米尔语等达罗毗荼语系的语言,或者例如东、西阿尔泰语等阿尔泰各语族的语言,或者例如非洲北部及西部各国所使用的尼罗—撒哈拉语系的语言,或者例如尼日尔语、刚果语、斯瓦西里语等尼日尔—刚果语系的语言,或者例如霍屯督语、布须曼语、散达维语等科依桑语系的语言,或者例如希伯来语、阿拉伯语、古埃及语、豪萨语等的闪米特-含米特语系的语言,或者例如印度尼西亚语、马来语、爪哇语、斐济语、毛利语等南岛语系的语言。
仅出于说明的目的,本文参考附图所示组件描述了某些方面和实施例。但是,所示组件的功能可以重叠,并且可用更少或更多数量的元件和组件来呈现。此外,所示元件的全部或部分功能可共存或者在若干地理分散的位置之间分布。而且,本发明的实施例、特征、方面和原理可在各种实施例中实现,并且不限于所示环境。此外,上述事件的序列是示例性的,并且不旨在限制。因此,可使用其它方法步骤,并且即使利用上述方法,事件的特定次序也可变化而不背离本发明的范围。而且,可能不出现某些步骤并且可实现附加的步骤。
上述本发明各实施方式通常可以在本领域熟知的计算机系统结构之内或之上实施,所述本发明各实施方式的功能可以通过硬件或软件实现。在软件上,一个部件可以是一个步骤、一个程序或其中一部分,其执行特定或相关功能。在硬件上,一个单元就是设计为和其它部件一起使用的一个功能性硬件单元。例如,一个单元可以使用离散的电子部件实现,或构成诸如专用集成电路(ASIC)的整个电路的一部分,还存在许多其它可能。本领域熟练技术人员可以理解,本发明也可通过硬件部件和软件部件的结合而实现。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (20)

1.一种基于上下文的前向输入纠错方法,其特征在于,所述的方法包括:
获取已确认的文本;
基于所述已确认文本的校正形式,在语料库中进行检索,获得与所述已确认文本校正形式对应的预测词或联想词,所述预测词或联想词为在已确认文本之后进行预测或联想的用户将要输入的词;
将所述已确认文本校正形式与对应的联想词或预测词相结合,形成候选对象,当检测到存在对包含所述已确认文本校正形式的候选对象的选择时,根据所述候选对象对所述已确认文本进行纠错。
2.根据权利要求1所述的前向输入纠错方法,其特征在于,所述基于已确认文本的校正形式,在语料库中进行检索,获得所述已确认文本校正形式对应的预测词或联想词进一步包括:判断是否存在当前正在输入的字符串;当存在当前正在输入的字符串时,基于所述已确认文本的校正形式在语料库中进行检索并基于当前正在输入的字符串对该检索结果进行过滤,或基于用户当前正在输入的字符串触发采用已确认文本的校正形式,获取对应的预测词;当不存在当前正在输入的字符串时,基于已确认文本的校正形式,获得对应的联想词。
3.根据权利要求1或2所述的前向输入纠错方法,其特征在于,进一步包括:基于已确认文本的原形和校正形式,在语料库中一起进行检索,获得与所述已确认文本原形和校正形式分别对应的预测词或联想词。
4.根据权利要求3所述的前向输入纠错方法,其特征在于,所述基于已确认文本校正形式与对应的联想词或预测词形成候选对象,当检测到存在对包含已确认文本校正形式的候选对象的选择时,根据该候选对象对已确认文本进行纠错包括:
将所述候选对象显示给用户,并检测用户的选择;
获取用户所选择的候选对象,判断其是基于已确认文本的原形还是基于已确认文本的校正形式获得的文本;
当所选择的候选对象是基于已确认文本的校正形式时,根据所选择的候选对象对所述已确认文本进行纠错。
5.根据权利要求4所述的前向输入纠错方法,其特征在于,所述判断候选对象为基于已确认文本的原形还是基于校正形式所获得的文本,包括:
检测是否具有校正标记或其对应的校正标记是否存在变更,当存在校正标记或该校正标记存在变更时,其为基于已确认文本校正形式所获得的文本;或者
通过将所述候选对象中除了联想词或预测词之外的剩余部分与所述已确认文本进行文本对比,当两部分完全相同时,则该候选对象为基于已确认文本原形所获得的文本。
6.根据权利要求3所述的前向输入纠错方法,其特征在于,所述基于已确认文本校正形式与对应的联想词或预测词形成候选对象,当检测到存在对包含已确认文本校正形式的候选对象的选择时,根据该候选对象对已确认文本进行纠错包括:
判断所获得的检索结果为基于已确认文本的原形还是基于校正形式所获得的文本,当该检索结果为基于已确认文本的校正形式获得时,将包含已确认文本校正形式的候选对象显示给用户;否则,将检索结果中的联想词或预测词作为候选对象,并显示给用户;
检测用户的输入,当所选择的候选对象包含已确认文本的校正形式时,对所述已确认的文本进行纠错。
7.根据权利要求6所述的前向输入纠错方法,其特征在于,所述判断所获得的检索结果为基于已确认文本的原形还是基于校正形式所获得的文本,包括:
检测是否具有校正标记或其对应的校正标记是否存在变更,当存在校正标记或该校正标记存在变更时,其为基于已确认文本校正形式所获得的文本;或者,
通过将所述候选对象中除了联想词或预测词之外的剩余部分与所述已确认文本进行文本对比,当两部分完全相同时,则该检索结果为基于已确认文本原形所获得的文本。
8.根据权利要求3所述的前向输入纠错方法,其特征在于,进一步包括:以特定的显示形式对已确认文本校正形式部分进行提示,从而对用户进行提醒。
9.根据权利要求3所述的前向输入纠错方法,其特征在于,所述校正形式包括首字母大写的形式,或全小写形式,或已确认文本的其它书写形式。
10.根据权利要求3所述的前向输入纠错方法,其特征在于,由所述已确认文本的校正形式与其后续至少一个词所构成的短语,相较于该已确认文本的原形与相同后续词所构成的短语,非兼容地存储于语料库中。
11.根据权利要求2所述的前向输入纠错方法,其特征在于,所述基于当前正在输入的字符串对该检索结果进行过滤包括:根据用户当前输入字符串的原形及其校正形式,分别对该检索结果进行过滤。
12.一种基于上下文的前向输入纠错装置,其特征在于,包括:
获取单元,适于获取已确认的文本;
检索单元,适于基于所述已确认文本的校正形式,在语料库中进行检索,获取与所述已确认文本校正形式对应的联想词或预测词,所述预测词或联想词为在已确认文本之后进行预测或联想的用户将要输入的词;
候选对象获取单元,适于将所述已确认文本校正形式与对应的联想词或预测词相结合,形成候选对象并进行显示,根据输入获取所选择的候选对象;
纠错单元,适于根据所述候选对象获取单元获得的候选对象对所述已确认文本进行纠错。
13.根据权利要求12所述的前向输入纠错装置,其特征在于,当不存在当前正在输入的字符串时,所述检索单元进一步包括:基于已确认文本的校正形式,获得对应的联想词;当存在当前正在输入的字符串时,所述检索单元进一步包括:基于已确认文本的校正形式在语料库中进行检索,并基于当前正在输入的字符串对该检索结果进行过滤,或基于用户当前正在输入的字符串触发采用已确认文本的校正形式,获取对应的预测词。
14.根据权利要求13所述的前向输入纠错装置,其特征在于,所述获取单元进一步包括:当存在当前正在输入的字符串时,获取当前正在输入的字符串。
15.根据权利要求13所述的前向输入纠错装置,其特征在于,所述检索单元进一步包括,不仅基于所述已确认文本的校正形式,还基于所述已确认文本的原形,在语料库中进行检索,获取与所述已确认文本原形和校正形式分别对应的预测词或联想词。
16.根据权利要求15所述的前向输入纠错装置,其特征在于,所述候选对象获取单元进一步包括:
判断单元,适于判断来自于所述检索单元的检索结果是基于已确认文本的原形还是校正形式;
候选对象形成单元,适于根据当所述检索结果为基于已确认文本的校正形式时,根据所述检索单元的检索结果,以已确认文本校正形式与对应的联想词或预测词的集合作为候选对象,否则,去除所述检索单元的检索结果中已确认文本原形部分,形成候选对象;
候选对象检测单元,适于显示来自所述候选对象形成单元的候选对象,并检测用户的输入,获得用户选择的候选对象;
并且,所述纠错单元从所述候选对象获取单元获得候选对象,并根据所述候选对象对所述已确认文本进行纠错。
17.根据权利要求15所述的前向输入纠错装置,其特征在于,所述候选对象获取单元进一步包括:
候选对象形成单元,适于根据来自于所述检索单元的检索结果,形成所述候选对象;
候选对象检测单元,适于将所述候选对象显示给用户,并检测用户的输入,获得用户选择的候选对象;
判断单元,适于判断所选择的候选对象是基于已确认文本的原形还是校正形式;
当根据所述判断单元的结果,所选择的候选对象是基于已确认文本的校正形式时,所述纠错单元根据所述候选对象获取单元获得的候选对象对所述已确认文本进行纠错。
18.根据权利要求16或17所述的前向输入纠错装置,其特征在于,所述判断单元通过以下方式判断所述文本是基于已确认文本的原形还是基于已确认文本的校正形式:
检测是否具有校正标记或其对应的校正标记是否存在变更,当存在校正标记或该校正标记存在变更时,其为基于已确认文本校正形式所获得的文本;或者
将其中除了联想词或预测词之外的剩余部分与所述已确认文本进行文本对比,当两部分完全相同时,则该候选对象为基于已确认文本原形所获得的文本。
19.根据权利要求16或17所述的前向输入纠错装置,其特征在于,所述候选对象检测单元进一步包括:以特定的显示形式对所述候选对象中已确认文本校正形式部分进行提示,从而对用户进行提醒。
20.根据权利要求16或17所述的前向输入纠错装置,其特征在于,由所述已确认文本的校正形式与其后续至少一个词所构成的短语,相较于该已确认文本的原形与相同后续词所构成的短语,非兼容地存储于所述语料库中。
CN201510106752.0A 2015-03-10 2015-03-10 基于上下文的前向输入纠错方法和装置 Active CN104615591B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201510106752.0A CN104615591B (zh) 2015-03-10 2015-03-10 基于上下文的前向输入纠错方法和装置
US15/557,451 US20180060295A1 (en) 2015-03-10 2016-03-01 Method and device for context-based forward input error correction
EP16761042.7A EP3270299A4 (en) 2015-03-10 2016-03-01 METHOD AND APPARATUS FOR CORRECTING INVERSE ERRORS WITHOUT RETURNING CIRCUIT BASED ON THE CONTEXT
PCT/CN2016/075183 WO2016141815A1 (zh) 2015-03-10 2016-03-01 基于上下文的前向输入纠错方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510106752.0A CN104615591B (zh) 2015-03-10 2015-03-10 基于上下文的前向输入纠错方法和装置

Publications (2)

Publication Number Publication Date
CN104615591A CN104615591A (zh) 2015-05-13
CN104615591B true CN104615591B (zh) 2019-02-05

Family

ID=53150043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510106752.0A Active CN104615591B (zh) 2015-03-10 2015-03-10 基于上下文的前向输入纠错方法和装置

Country Status (4)

Country Link
US (1) US20180060295A1 (zh)
EP (1) EP3270299A4 (zh)
CN (1) CN104615591B (zh)
WO (1) WO2016141815A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106325537A (zh) * 2015-06-23 2017-01-11 腾讯科技(深圳)有限公司 信息输入方法及装置

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104615591B (zh) * 2015-03-10 2019-02-05 上海触乐信息科技有限公司 基于上下文的前向输入纠错方法和装置
CN107340880B (zh) * 2016-05-03 2021-11-02 北京搜狗科技发展有限公司 一种联想输入方法、装置及用于实现联想输入的电子设备
CN106202046B (zh) * 2016-07-13 2019-09-13 Oppo广东移动通信有限公司 一种词语纠正方法及终端设备
JP6593303B2 (ja) * 2016-10-31 2019-10-23 京セラドキュメントソリューションズ株式会社 問題作成装置、問題作成方法、及び画像形成装置
CN106774978A (zh) * 2016-12-16 2017-05-31 百度在线网络技术(北京)有限公司 用于修正词条的方法及装置
CN108803890B (zh) * 2017-04-28 2024-02-06 北京搜狗科技发展有限公司 一种输入方法、输入装置和用于输入的装置
CN109388252B (zh) * 2017-08-14 2022-10-04 北京搜狗科技发展有限公司 一种输入方法及装置
CN109471538B (zh) * 2017-09-08 2022-07-05 北京搜狗科技发展有限公司 一种输入方法、装置和用于输入的装置
CN109948122B (zh) * 2017-12-21 2023-06-20 北京金山安全软件有限公司 输入文本的纠错方法、装置及电子设备
US11061556B2 (en) * 2018-01-12 2021-07-13 Microsoft Technology Licensing, Llc Computer device having variable display output based on user input with variable time and/or pressure patterns
CN109086266B (zh) * 2018-07-02 2021-09-14 昆明理工大学 一种文本形近字的检错与校对方法
CN110188274B (zh) * 2019-05-30 2021-06-08 口口相传(北京)网络技术有限公司 搜索纠错方法及装置
CN111310013A (zh) * 2020-02-17 2020-06-19 上海蓝鹇信息科技有限公司 一种基于人工智能的自动纠错方法
CN112001169B (zh) * 2020-07-17 2022-03-25 北京百度网讯科技有限公司 文本纠错的方法、装置、电子设备和可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136196A (zh) * 2008-04-18 2013-06-05 上海触乐信息科技有限公司 用于向电子设备输入文本和纠错的方法
CN104375665A (zh) * 2014-12-09 2015-02-25 三星电子(中国)研发中心 输入法纠错方法及装置

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH113338A (ja) * 1997-06-11 1999-01-06 Toshiba Corp 多言語入力システム、多言語入力方法及び多言語入力プログラムを記録した記録媒体
US6377965B1 (en) * 1997-11-07 2002-04-23 Microsoft Corporation Automatic word completion system for partially entered data
US7098896B2 (en) * 2003-01-16 2006-08-29 Forword Input Inc. System and method for continuous stroke word-based text input
US20150261429A1 (en) * 2014-01-02 2015-09-17 Benjamin Firooz Ghassabian Systems to enhance data entry in mobile and fixed environment
US7890852B2 (en) * 2003-06-26 2011-02-15 International Business Machines Corporation Rich text handling for a web application
US7207004B1 (en) * 2004-07-23 2007-04-17 Harrity Paul A Correction of misspelled words
EP1797506A1 (en) * 2004-09-30 2007-06-20 Koninklijke Philips Electronics N.V. Automatic text correction
US7827484B2 (en) * 2005-09-02 2010-11-02 Xerox Corporation Text correction for PDF converters
US20100050074A1 (en) * 2006-10-30 2010-02-25 Cellesense Technologies Ltd. Context sensitive, error correction of short text messages
US8225203B2 (en) * 2007-02-01 2012-07-17 Nuance Communications, Inc. Spell-check for a keyboard system with automatic correction
US7912700B2 (en) * 2007-02-08 2011-03-22 Microsoft Corporation Context based word prediction
US9465791B2 (en) * 2007-02-09 2016-10-11 International Business Machines Corporation Method and apparatus for automatic detection of spelling errors in one or more documents
US20120239834A1 (en) * 2007-08-31 2012-09-20 Google Inc. Automatic correction of user input using transliteration
WO2009130692A2 (en) * 2008-04-22 2009-10-29 Robert Iakobashvili Method and system for user-interactive iterative spell checking
CN101350004B (zh) * 2008-09-11 2010-08-11 北京搜狗科技发展有限公司 形成个性化纠错模型的方法及个性化纠错的输入法系统
JP5366562B2 (ja) * 2009-01-13 2013-12-11 キヤノン株式会社 情報処理装置および情報処理装置の制御方法およびプログラム
US20110087961A1 (en) * 2009-10-11 2011-04-14 A.I Type Ltd. Method and System for Assisting in Typing
US8379801B2 (en) * 2009-11-24 2013-02-19 Sorenson Communications, Inc. Methods and systems related to text caption error correction
US8782556B2 (en) * 2010-02-12 2014-07-15 Microsoft Corporation User-centric soft keyboard predictive technologies
EP2592565A1 (en) * 2010-07-06 2013-05-15 Nec Corporation Text conversion device, method of converting text, and recording medium
US10037319B2 (en) * 2010-09-29 2018-07-31 Touchtype Limited User input prediction
US9465798B2 (en) * 2010-10-08 2016-10-11 Iq Technology Inc. Single word and multi-word term integrating system and a method thereof
US9626429B2 (en) * 2010-11-10 2017-04-18 Nuance Communications, Inc. Text entry with word prediction, completion, or correction supplemented by search of shared corpus
KR101781557B1 (ko) * 2011-01-05 2017-09-26 구글 인코포레이티드 텍스트 입력을 용이하게 하기 위한 방법 및 시스템
US20120284308A1 (en) * 2011-05-02 2012-11-08 Vistaprint Technologies Limited Statistical spell checker
US20120324391A1 (en) * 2011-06-16 2012-12-20 Microsoft Corporation Predictive word completion
US20130104068A1 (en) * 2011-10-20 2013-04-25 Microsoft Corporation Text prediction key
US9310889B2 (en) * 2011-11-10 2016-04-12 Blackberry Limited Touchscreen keyboard predictive display and generation of a set of characters
US9715489B2 (en) * 2011-11-10 2017-07-25 Blackberry Limited Displaying a prediction candidate after a typing mistake
JP5689402B2 (ja) * 2011-11-17 2015-03-25 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 文章を編集するための方法、並びにその装置及びコンピュータ・プログラム
US20140304642A1 (en) * 2012-05-14 2014-10-09 Google Inc. Specifying a label for a computer application
US9128921B2 (en) * 2012-05-31 2015-09-08 Blackberry Limited Touchscreen keyboard with corrective word prediction
US9753638B2 (en) * 2012-06-06 2017-09-05 Thomson Licensing Method and apparatus for entering symbols from a touch-sensitive screen
US8843845B2 (en) * 2012-10-16 2014-09-23 Google Inc. Multi-gesture text input prediction
CN103853468A (zh) * 2012-11-29 2014-06-11 比亚迪股份有限公司 汉字拼音输入法的纠错方法及移动终端
US9047268B2 (en) * 2013-01-31 2015-06-02 Google Inc. Character and word level language models for out-of-vocabulary text input
US9081500B2 (en) * 2013-05-03 2015-07-14 Google Inc. Alternative hypothesis error correction for gesture typing
US20150019539A1 (en) * 2013-07-15 2015-01-15 Blackberry Limited Methods and devices for providing a text prediction
CN103389915A (zh) * 2013-07-23 2013-11-13 百度在线网络技术(北京)有限公司 输入纠错方法、输入纠错装置、输入纠错服务器和系统
US9161188B2 (en) * 2013-08-22 2015-10-13 Yahoo! Inc. System and method for automatically suggesting diverse and personalized message completions
CN103777774B (zh) * 2014-01-16 2018-03-16 宇龙计算机通信科技(深圳)有限公司 终端装置及输入法的文字纠错方法
CN103927329B (zh) * 2014-03-19 2017-03-29 北京奇虎科技有限公司 一种即时搜索方法和系统
CN104090669B (zh) * 2014-07-16 2017-03-01 三星电子(中国)研发中心 输入法编辑方法及装置
US10275152B2 (en) * 2014-10-28 2019-04-30 Idelan, Inc. Advanced methods and systems for text input error correction
CN104615591B (zh) * 2015-03-10 2019-02-05 上海触乐信息科技有限公司 基于上下文的前向输入纠错方法和装置
US10585984B2 (en) * 2015-11-10 2020-03-10 International Business Machines Corporation Techniques for improving input text processing in a data processing system that answers questions

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136196A (zh) * 2008-04-18 2013-06-05 上海触乐信息科技有限公司 用于向电子设备输入文本和纠错的方法
CN104375665A (zh) * 2014-12-09 2015-02-25 三星电子(中国)研发中心 输入法纠错方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106325537A (zh) * 2015-06-23 2017-01-11 腾讯科技(深圳)有限公司 信息输入方法及装置

Also Published As

Publication number Publication date
CN104615591A (zh) 2015-05-13
WO2016141815A1 (zh) 2016-09-15
US20180060295A1 (en) 2018-03-01
EP3270299A1 (en) 2018-01-17
EP3270299A4 (en) 2019-01-09

Similar Documents

Publication Publication Date Title
CN104615591B (zh) 基于上下文的前向输入纠错方法和装置
KR100806936B1 (ko) 자동완성 추천어를 정정하여 노출하는 자동완성 추천어제공 방법 및 시스템
US7895030B2 (en) Visualization method for machine translation
KR101187475B1 (ko) 다언어 환경을 갖는 장치를 위한 입력 방법
JP4935869B2 (ja) 電子機器及びプログラム
JPH07334625A (ja) 文字列入力装置
CN103026318A (zh) 输入法编辑器
JP2003513389A (ja) 言語入力ユーザインタフェース
EP2897055A1 (en) Information processing device, information processing method, and program
WO2016150346A1 (zh) 文本输入方法和装置
CN105759984B (zh) 二次输入文本的方法和装置
US9940317B2 (en) Sentence parsing correction system
CN104412204A (zh) 用于组装单词的方法、控制器以及装置
US20130174091A1 (en) Nine-key chinese input method
US9658771B2 (en) Computer implemented user interface for inputting indian language alphabets
Joshi et al. Enhanced version of Punjabi stemmer using synset
JP2007257369A (ja) 情報検索装置
CN113190125A (zh) 输入矫正方法和装置
Evans et al. Input Observer: Measuring text entry and pointing performance from naturalistic everyday computer use
CN107807739A (zh) 一种韵母至多两键输入的汉字输入法
JP2003308316A (ja) キーボードによる誤入力修正方法
Busemann et al. Toolbox self-training
JPH0728800A (ja) 文字処理方法および文字処理装置
JP5891886B2 (ja) 電子文書作成装置、印刷装置およびプログラム
JPH08314938A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant