CN106774978A - 用于修正词条的方法及装置 - Google Patents

用于修正词条的方法及装置 Download PDF

Info

Publication number
CN106774978A
CN106774978A CN201611165472.8A CN201611165472A CN106774978A CN 106774978 A CN106774978 A CN 106774978A CN 201611165472 A CN201611165472 A CN 201611165472A CN 106774978 A CN106774978 A CN 106774978A
Authority
CN
China
Prior art keywords
entry
input
adjacent previous
determined
mentioned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611165472.8A
Other languages
English (en)
Inventor
王泰格
陈丽敏
许宏涛
吴少凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201611165472.8A priority Critical patent/CN106774978A/zh
Publication of CN106774978A publication Critical patent/CN106774978A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying

Abstract

本申请公开了用于修正词条的方法及装置。该方法的一具体实施方式包括:根据用户输入的拼音信息查找并显示预选词条;在用户从预选词条中选定输入词条后,查询输入词条与相邻的前一个词条的匹配关系,匹配关系包括词条的二元关系和词条在当前文本中的组合关系;根据匹配关系对相邻的前一个词条进行修正。该实施方式避免了具有匹配关系的词条在被多次输入时破坏匹配关系的情况,提高了词条输入的准确率。

Description

用于修正词条的方法及装置
技术领域
本申请涉及数据处理技术领域,具体涉及输入法技术领域,尤其涉及用于修正词条的方法及装置。
背景技术
随着科技的发展,各种智能设备应运而生,这些智能设备通常具备很好的便携性,强大的数据处理功能和联网功能,提高了人们工作和学习的效率,成为人们工作和生活中不可或缺的组成部分。智能设备经常需要输入信息来进行相应的数据处理,输入法应用就成为了智能设备的必备应用。对于现有的大部分输入法而言,输入法的词条库决定了用户输入拼音信息时能够推荐的字、词或词组,以及这些字、词或词组的排序。此外,输入法还可以通过用户的历史输入词条来学习用户的输入习惯,对推荐的字、词或词组进行重新排序,以便快速准确地向用户提供信息。其中,拼音信息通常用于得到字、词、词组或句子等信息。
然而,现有的输入法在识别拼音信息时还存在一些不足。例如,现有的输入法通常使用词条之间的二元关系来向用户提示最匹配的词条。这种方式都是后向的,即通过当前输入的词条的二元关系判断后面最匹配的词条。当用户没有一次性拼写具有二元关系的词条的拼音信息时,现有的输入法则不能根据二元关系提供准确的词条,降低了输入的准确率。
发明内容
本申请提供了用于修正词条的方法及装置,以解决背景技术中提到的技术问题。
第一方面,本申请提供了一种用于修正词条的方法,该方法包括:根据用户输入的拼音信息查找并显示预选词条;在用户从上述预选词条中选定输入词条后,查询上述输入词条与相邻的前一个词条的匹配关系,上述匹配关系包括词条的二元关系和词条在当前文本中的组合关系;根据上述匹配关系对上述相邻的前一个词条进行修正。
在一些实施例中,上述查询上述输入词条与相邻的前一个词条的匹配关系包括:查看上述相邻的前一个词条的拼音信息,并将该拼音信息的全部词条设置为待确定词条集合;查询上述待确定词条集合中的每个待确定词条与上述输入词条的二元关系或组合关系。
在一些实施例中,上述根据上述匹配关系对上述相邻的前一个词条进行修正包括:当上述待确定词条与上述输入词条存在二元关系时,将上述待确定词条与上述输入词条之间最大的二元关系值对应的待确定词条作为预选目标词条;若上述相邻的前一个词条与上述预选目标词条不同,则显示第一信息提示框,上述第一信息提示框用于向用户提示是否将上述相邻的前一个词条替换为上述预选目标词条;在用户选择替换词条时,将上述相邻的前一个词条替换为上述预选目标词条。
在一些实施例中,上述将上述相邻的前一个词条替换为上述预选目标词条包括:在上述相邻的前一个词条和上述输入词条上显示删除标记,并显示替换信息提示框,上述替换信息提示框包含上述预选目标词条和上述输入词条;当用户在上述替换信息提示框上选择替换词条选项时,将上述相邻的前一个词条和上述输入词条替换为上述预选目标词条和上述输入词条。
在一些实施例中,上述根据上述匹配关系对上述相邻的前一个词条进行修正还包括:查看当前文本中是否存在上述输入词条与相邻的前一个词条的匹配关系,若有,则通过修改提示框进行提示,上述修改提示框用于提示对当前文本中存在匹配关系的词条进行修改。
在一些实施例中,上述根据上述匹配关系对上述相邻的前一个词条进行修正包括:当上述待确定词条与上述输入词条不存在二元关系时,查看上述待确定词条与上述输入词条在当前文本是否存在组合关系,若存在,且满足上述组合关系的待确定词条与上述相邻的前一个词条不相同,则显示第二信息提示框,上述第二信息提示框用于向用户提示是否将上述相邻的前一个词条替换为满足上述组合关系的待确定词条;在用户选择替换词条时,将上述相邻的前一个词条替换为上述满足上述组合关系的待确定词条。
在一些实施例中,上述方法还包括:查看并保存上述组合关系的步骤,上述查看并保存上述组合关系的步骤包括:查看当前文本中是否存在词条之间的固定组合,若满足上述固定组合的词条出现设定次,则保存上述固定组合,将不同于二元关系的固定组合设定为组合关系。
第二方面,本申请提供了一种用于修正词条的装置,该装置包括:词条显示单元,用于根据用户输入的拼音信息查找并显示预选词条;匹配关系查询单元,用于在用户从上述预选词条中选定输入词条后,查询上述输入词条与相邻的前一个词条的匹配关系,上述匹配关系包括词条的二元关系和词条在当前文本中的组合关系;词条修正单元,用于根据上述匹配关系对上述相邻的前一个词条进行修正。
在一些实施例中,上述匹配关系查询单元包括:待确定词条集合获取子单元,用于查看上述相邻的前一个词条的拼音信息,并将该拼音信息的全部词条设置为待确定词条集合;匹配关系查找子单元,用于查询上述待确定词条集合中的每个待确定词条与上述输入词条的二元关系或组合关系。
在一些实施例中,上述词条修正单元包括:预选目标词条获取子单元,用于在上述待确定词条与上述输入词条存在二元关系时,将上述待确定词条与上述输入词条之间最大的二元关系值对应的待确定词条作为预选目标词条;第一信息提示框显示子单元,用于在上述相邻的前一个词条与上述预选目标词条不同时显示第一信息提示框,上述第一信息提示框用于向用户提示是否将上述相邻的前一个词条替换为上述预选目标词条;第一词条修正子单元,用于在用户选择替换词条时,将上述相邻的前一个词条替换为上述预选目标词条。
在一些实施例中,上述第一词条修正子单元包括:替换信息提示框显示模块,用于在上述相邻的前一个词条和上述输入词条上显示删除标记,并显示替换信息提示框,上述替换信息提示框包含上述预选目标词条和上述输入词条;词条替换模块,用于用户在上述替换信息提示框上选择替换词条选项时,将上述相邻的前一个词条和上述输入词条替换为上述预选目标词条和上述输入词条。
在一些实施例中,上述词条修正单元还包括:修正查询子单元,用于查看当前文本中是否存在上述输入词条与相邻的前一个词条的匹配关系,若有,则通过修改提示框进行提示,上述修改提示框用于提示对当前文本中存在匹配关系的词条进行修改。
在一些实施例中,上述词条修正单元包括:第二信息提示框显示子单元,用于在上述待确定词条与上述输入词条不存在二元关系时,查看上述待确定词条与上述输入词条在当前文本是否存在组合关系,若存在,且满足上述组合关系的待确定词条与上述相邻的前一个词条不相同,则显示第二信息提示框,上述第二信息提示框用于向用户提示是否将上述相邻的前一个词条替换为满足上述组合关系的待确定词条;第二词条修正子单元,用于在用户选择替换词条时,将上述相邻的前一个词条替换为上述满足上述组合关系的待确定词条。
在一些实施例中,上述装置还包括:组合关系查询单元,用于查看并保存上述组合关系,上述组合关系查询单元包括:组合关系保存子单元,用于查看当前文本中是否存在词条之间的固定组合,若满足上述固定组合的词条出现设定次,则保存上述固定组合,将不同于二元关系的固定组合设定为组合关系。
本申请提供的用于修正词条的方法及装置,在用户从上述预选词条中选定输入词条后,查询输入词条与相邻的前一个词条的匹配关系,实现对当前输入词条与相邻的前一个词条的匹配关系检测;根据匹配关系对相邻的前一个词条进行修正,避免了具有匹配关系的词条在被多次输入时破坏匹配关系的情况,提高了词条输入的准确率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的用于修正词条的方法的一个实施例的流程图;
图3a是对具有二元关系的词条进行修正的一个实施例的示意图;
图3b是对具有二元关系的词条修正的示意图;
图3c是对文本中具有二元关系的其他词条进行修正的示意图;
图4a是对具有组合关系的词条进行修正的一个实施例的示意图;
图4b是对具有组合关系的词条修正的示意图;
图4c是对文本中具有组合关系的其他词条进行修正的示意图;
图5是根据本申请的用于修正词条的装置的一个实施例的结构示意图;
图6是根据本申请的服务器的一个实施例的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于修正词条的方法或用于修正词条的装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101、102、103通过网络104与服务器105交互,以接收或发送信息等。终端设备101、102、103上可以安装有各种信息处理应用,例如信息搜索应用、输入法应用等。
终端设备101、102、103可以是运行信息处理应用的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是为终端设备101、102、103上的信息处理应用提供词条的输入法服务器。例如,为终端设备101、102、103上的信息处理应用提供词条二元关系,或对终端设备101、102、103上用户的输入常用词条进行保存的服务器。服务器105可以根据用户当前输入的拼音信息在线查找拼音信息对应的词条的二元关系,并将根据二元关系得到的词条推送给终端设备101、102、103。
需要说明的是,本申请实施例所提供的用于修正词条的方法可以由终端设备101、102、103单独执行,或者也可以由终端设备101、102、103和服务器105共同执行。一般情况下,用于修正词条的方法由终端设备101、102、103执行。相应地,用于修正词条的装置可以设置于终端设备101、102、103中,也可以设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2,其示出了用于修正词条的方法的一个实施例的流程图200,该用于修正词条的方法包括:
步骤201,根据用户输入的拼音信息查找并显示预选词条。
在本实施例中,电子设备(例如图1所示的终端设备101、102、103)可以通过有线或无线的方式向服务器105发送拼音信息,并根据拼音信息在服务器105中查询对应的预选词条的。需要说明的是,终端设备101、102、103在用户输入拼音信息后,首先在终端设备101、102、103上的输入法词库中查找拼音信息对应的预选词条,若输入法词库中没有对应的词条,则通过有线或无线的方式将拼音信息发送给服务器105,在服务器105中查找对应拼音信息的预选词条。
当用户在终端设备101、102、103上通过输入法应用输入拼音信息时,输入法应用会根据拼音信息查询该拼音信息对应的词条。这些词条按照被按照使用频率进行排列,并显示在输入法应用的词条显示框上。由于此时的词条只是用于向用户提示可能用到的词条,所以这些词条都属于预选词条。即,预选词条是用于向用户提供拼音信息对应的词条。
步骤202,在用户从上述预选词条中选定输入词条后,查询上述输入词条与相邻的前一个词条的匹配关系。
通常,输入法应用在检测到用户输入的拼音信息后,会提供对应的预选词条。当拼音信息对应多个词条时,输入法应用会根据拼音信息查询这些拼音信息对应的预选词条是否存在二元关系,若有,则优先提供具有二元关系的预选词条。此处,二元关系为相邻的两个词条同时出现时,当在前词条选定后,在后词条出现的概率。即,当相邻两个词条的第一个词条出现时,第二个最有可能出现的词条是哪个。
需要说明的是,二元关系通常是后向的,即通过在前词条对在后词条进行判断和选择。而当用户输入的拼音信息对应单个词条,之后用户又相邻输入了其他单个词条时,现有的输入法通常不对这两个单个词条的二元关系进行识别和判断。如果这两个单个词条实际上存在二元关系,则用户通过两个输入拼音信息得到的单个词条就有可能存在不符合二元关系,甚至词条选择错误的情况。例如,用户想要输入“春困秋乏”,则输入“chunkunqiufa”或“ckqf”等拼音信息,得到词条“春困秋乏”。当用户单次输入“chunkun”时,则出现词条“春困”,用户选择了“春困”后,再次输入“qiufa”,则出现的词条包括“球阀”、“囚犯”、“求法”,甚至没有出现“秋乏”;用户还可能在单次输入“chunkun”时出现“蠢困”,而在单次输入“qiufa”时,出现“秋乏”,此时,二元关系无法对“蠢困”进行识别。显然,上述两种情况都出现词条错误的情况,没有得到用户想要的词条,降低了输入法的输入准确性和输入效率。
因此,本申请在用户从预选词条中选定输入词条后,还要查询输入词条与相邻的前一个词条的匹配关系,其中,上述匹配关系包括词条的二元关系和词条在当前文本中的组合关系。有些词条在当前文本中有特定的组合(例如:专业词汇或用户自定义的词条组合等),这些词条就存在组合关系。此处的组合关系和二元关系类似,但组合关系对应的词条可以是不在输入法词库中的多个词条,并且主要以当前文本内的词条作为存在基础。组合关系能够在输入法中没有相应的二元关系的情况下,基于当前文本内的词条对词条做出准确的选择。
在本实施例的一些可选的实现方式中,上述查询上述输入词条与相邻的前一个词条的匹配关系可以包括:
第一步,查看上述相邻的前一个词条的拼音信息,并将该拼音信息的全部词条设置为待确定词条集合。
二元关系是词条与词条之间的关系,当根据当前的输入词条判断前一个词条是否正确时,需要查看前一个词条的拼音信息。这是因为,此时的前一个词条存在选词错误的可能,如果直接通过当前输入词条对前一个词条的正确性进行判断,则可能无法通过匹配关系进行判断,也就无法对前一个词条的正确性进行判断。因此,需要获取前一个词条的拼音信息,然后将该拼音信息对应的全部词条组成待确定词条集合,以便后续对前一个词条的正确性进行判断。
第二步,查询上述待确定词条集合中的每个待确定词条与上述输入词条的二元关系或组合关系。
二元关系主要通过输入法的词条库来确定,组合关系需要基于当前的文本来确定。
需要说明的是,此步骤的前提是当前的输入词条是正确的或用户需要的词条,基于此前提对前一个词条进行判断。
步骤203,根据上述匹配关系对上述相邻的前一个词条进行修正。
若当前的输入词条存在匹配关系,则可以通过匹配关系对当前输入词条的前一个相邻的词条进行判断,查看前一个相邻的词条是否满足匹配关系。若满足,则可以不提示;若不满足,则可以对用户进行提示,并在用户确认修改操作后对前一个词条进行修改。
得到待确定词条集合后,查看待确定词条集合中每个待确定词条与当前的输入词条的二元关系,若有二元关系,则按照二元关系对前一个词条进行判断;若没有,则查看当前文本的组合关系,根据组合关系对前一个词条进行判断;若既没有二元关系,也没有组合关系,则按照用户的选择确定词条。
在本实施例的一些可选的实现方式中,上述根据上述匹配关系对上述相邻的前一个词条进行修正可以包括:
第一步,当上述待确定词条与上述输入词条存在二元关系时,将上述待确定词条与上述输入词条之间最大的二元关系值对应的待确定词条作为预选目标词条。
当待确定词条与输入词条存在二元关系时,计算待确定词条与输入词条的二元关系值,将最大的二元关系值对应的待确定词条作为预选目标词条。
第二步,若上述相邻的前一个词条与上述预选目标词条不同,则显示第一信息提示框。
此时,前一个词条可能与预选目标词条相同,也可能与预选目标词条不同。当前一个词条与预选目标词条不相同时,通过第一信息提示框对用户进行提示。其中,上述第一信息提示框用于向用户提示是否将上述相邻的前一个词条替换为上述预选目标词条;当前一个词条与预选目标词条相同时,则不用向用户提示。
第三步,在用户选择替换词条时,将上述相邻的前一个词条替换为上述预选目标词条。
当用户选择对词条进行替换时,可以在第一信息提示框上选择“替换”按键(或其他用户替换操作的按键),将前一个词条替换为预选目标词条。
在本实施例的一些可选的实现方式中,上述将上述相邻的前一个词条替换为上述预选目标词条可以包括:
第一步,在上述相邻的前一个词条和上述输入词条上显示删除标记,并显示替换信息提示框。
当需要对前一个词条进行替换操作时,可以在前一个词条和当前的输入词条上显示删除标记(如删除线等),并在前一个词条和当前的输入词条之后显示替换信息提示框,其中,上述替换信息提示框包含上述预选目标词条和当前的输入词条。此处,对前一个词条和当前的输入词条同时显示删除线和在替换信息提示框中同时包含预选目标词条和当前的输入词条,是为了表示通过预选目标词条和当前的输入词条对前一个词条和当前的输入词条进行整体替换,也说明了预选目标词条和当前的输入词条具有匹配关系。
第二步,当用户在上述替换信息提示框上选择替换词条选项时,将上述相邻的前一个词条和上述输入词条替换为上述预选目标词条和上述输入词条。
替换信息提示框上包含“替换”按键(或其他用户替换操作的按键)和“取消”按键(或其他用户取消操作的按键)。当用户通过“替换”按键选择替换词条时,可以将相邻的前一个词条和输入词条替换为预选目标词条和上述输入词条,完成对前一个词条的修正。
在本实施例的一些可选的实现方式中,上述根据上述匹配关系对上述相邻的前一个词条进行修正还可以包括:查看当前文本中是否存在上述输入词条与相邻的前一个词条的匹配关系,若有,则通过修改提示框进行提示,上述修改提示框用于提示对当前文本中存在匹配关系的词条进行修改。
除了当前的输入词条和前一个词条外,文本中还可能存在多处具备匹配关系的词条但出现词条拼写错误的情况。因此,通过修改提示框可以对当前文本中的词条进行全文搜索,查看是否需要根据匹配关系对其他词条进行修改。
在本实施例的一些可选的实现方式中,上述根据上述匹配关系对上述相邻的前一个词条进行修正可以包括:
第一步,当上述待确定词条与上述输入词条不存在二元关系时,查看上述待确定词条与上述输入词条在当前文本是否存在组合关系,若存在,且满足上述组合关系的待确定词条与上述相邻的前一个词条不相同,则显示第二信息提示框。
如果通过输入法应用无法查询到输入词条与待确定词条存在二元关系时,则可以查询待确定词条与输入词条在当前文本是否存在组合关系,如果存在,则根据组合关系和输入词条来查找对应的待确定词条,并通过第二信息提示框向用户提示。其中,上述第二信息提示框用于向用户提示是否将上述相邻的前一个词条替换为满足上述组合关系的待确定词条。
第二步,在用户选择替换词条时,将上述相邻的前一个词条替换为上述满足上述组合关系的待确定词条。
与上述存在二元关系的预选目标词条和输入词条的替换操作类似,此处,当用户在第二信息提示框上选择替换词条时,可以在第二信息提示框上选择“替换”按键(或其他用户替换操作的按键),将前一个词条替换为满足组合关系的待确定词条。
在本实施例的一些可选的实现方式中,上述方法还包括:查看并保存上述组合关系的步骤,上述查看并保存上述组合关系的步骤可以包括:查看当前文本中是否存在词条之间的固定组合,若满足上述固定组合的词条出现设定次,则保存上述固定组合,将不同于二元关系的固定组合设定为组合关系。
对应某些特定词条组合(例如,专业术语、专有名词或新出现的词),无法从输入法词库中确定二元关系,但在当前的文本中多次出现,则可以将这些特定词条视为固定组合的词条,并认为满足固定组合的词条具有组合关系。当文本中的词条具有组合关系时,在对词条进行二元关系判断后,还要对词条进行组合关系判断,以针对当前的文本进行词条的修正,提高了对词条的识别准确性和针对性。
继续参见图3a,图3a是根据本实施例的用于修正词条的方法的应用场景的一个示意图。在图3a的场景中,用户单次输入拼音信息“qiufa”,用户从“qiufa”的词条中选择了“秋乏”。此时,查询“秋乏”的前一个词条“蠢困”的拼音信息,将“蠢困”的拼音信息的全部词条组成待确定词条集合,待确定词条集合包括:“春困”、“蠢困”、“纯困”等词条。输入法应用查询词条库,确定“春困”和“秋乏”的二元关系值最大,通过第一信息提示框提示用户,“是否将‘蠢困’替换为‘春困’?”,如图3a所示。当用户选择替换词条并点击第一信息提示框上的“替换”按键时,在文本中“蠢困秋乏”上显示删除标记(删除线),并通过替换信息提示框显示“春困秋乏”,当用户再次点击“替换”按键后,将文本中的“蠢困秋乏”替换为“春困秋乏”,如图3b所示。
对当前的输入词条“秋乏”的前一个词条“蠢困”修正后,还要查询当前的文档中是否还有类似“蠢困”和“秋乏”的情况。若有,则在文档中对应的词条处显示修改提示框,并在用户确认替换操作后对词条进行修正,如图3c所示。
如果当前的输入词条没有二元关系,但在当前的文本中存在组合关系,则通过组合关系对词条进行修正。图4a是通过词条的组合关系对文本中词条进行修正的情况。图4a的文本中,当输入词条为“灞波儿奔”时,查找前一个词条“奔波儿霸”的拼音信息。此时,输入法的词条库中没有“奔波儿霸”和“灞波儿奔”的二元关系;之后,全文查询词条,发现文本中多次出现了词条“奔波儿灞”和“灞波儿奔”。并且,“奔波儿霸”和“奔波儿灞”的拼音信息相同,可知,“奔波儿灞”和“灞波儿奔”属于组合关系。通过该组合关系将“奔波儿霸”修正为“奔波儿灞”,如图4b所示。可见,用户在单次拼写“奔波儿灞”时出现了选择词条错误,将“灞”错选为“霸”,且“灞”和“霸”属于形近字,导致拼写错误不易被发现。
之后,查看文本中是否还存在类似的情况,若有,则继续修正,如图4c所示,直至文本内没有需要修正的词条。
本申请提供的用于修正词条的方法,在用户从上述预选词条中选定输入词条后,查询输入词条与相邻的前一个词条的匹配关系,实现对当前输入词条与相邻的前一个词条的匹配关系检测;根据匹配关系对相邻的前一个词条进行修正,避免了具有匹配关系的词条在被多次输入时破坏匹配关系的情况,提高了词条输入的准确率。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了用于修正词条的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例上述的用于修正词条的装置500可以包括:词条显示单元501、匹配关系查询单元502和词条修正单元503。其中,词条显示单元501用于根据用户输入的拼音信息查找并显示预选词条;匹配关系查询单元502用于在用户从上述预选词条中选定输入词条后,查询上述输入词条与相邻的前一个词条的匹配关系,上述匹配关系包括词条的二元关系和词条在当前文本中的组合关系;词条修正单元503用于根据上述匹配关系对上述相邻的前一个词条进行修正。
在本实施例的一些可选的实现方式中,上述匹配关系查询单元502可以包括待确定词条集合获取子单元(图中未示出)和匹配关系查找子单元(图中未示出)。其中,待确定词条集合获取子单元用于查看上述相邻的前一个词条的拼音信息,并将该拼音信息的全部词条设置为待确定词条集合;匹配关系查找子单元用于查询上述待确定词条集合中的每个待确定词条与上述输入词条的二元关系或组合关系。
在本实施例的一些可选的实现方式中,上述词条修正单元503包括:预选目标词条获取子单元(图中未示出)、第一信息提示框显示子单元(图中未示出)和第一词条修正子单元(图中未示出)。其中,预选目标词条获取子单元用于在上述待确定词条与上述输入词条存在二元关系时,将上述待确定词条与上述输入词条之间最大的二元关系值对应的待确定词条作为预选目标词条;第一信息提示框显示子单元用于在上述相邻的前一个词条与上述预选目标词条不同时显示第一信息提示框,上述第一信息提示框用于向用户提示是否将上述相邻的前一个词条替换为上述预选目标词条;第一词条修正子单元用于在用户选择替换词条时,将上述相邻的前一个词条替换为上述预选目标词条。
在本实施例的一些可选的实现方式中,上述第一词条修正子单元可以包括替换信息提示框显示模块(图中未示出)和词条替换模块(图中未示出)。其中,替换信息提示框显示模块用于在上述相邻的前一个词条和上述输入词条上显示删除标记,并显示替换信息提示框,上述替换信息提示框包含上述预选目标词条和上述输入词条;词条替换模块用于用户在上述替换信息提示框上选择替换词条选项时,将上述相邻的前一个词条和上述输入词条替换为上述预选目标词条和上述输入词条。
在本实施例的一些可选的实现方式中,上述词条修正单元503还可以包括修正查询子单元(图中未示出),用于查看当前文本中是否存在上述输入词条与相邻的前一个词条的匹配关系,若有,则通过修改提示框进行提示,上述修改提示框用于提示对当前文本中存在匹配关系的词条进行修改。
在本实施例的一些可选的实现方式中,上述词条修正单元503包括第二信息提示框显示子单元(图中未示出)和第二词条修正子单元(图中未示出)。其中,第二信息提示框显示子单元用于在上述待确定词条与上述输入词条不存在二元关系时,查看上述待确定词条与上述输入词条在当前文本是否存在组合关系,若存在,且满足上述组合关系的待确定词条与上述相邻的前一个词条不相同,则显示第二信息提示框,上述第二信息提示框用于向用户提示是否将上述相邻的前一个词条替换为满足上述组合关系的待确定词条;第二词条修正子单元用于在用户选择替换词条时,将上述相邻的前一个词条替换为上述满足上述组合关系的待确定词条。
在本实施例的一些可选的实现方式中,用于修正词条的装置500还可以包括组合关系查询单元(图中未示出),用于查看并保存上述组合关系,上述组合关系查询单元包括组合关系保存子单元(图中未示出),组合关系保存子单元用于查看当前文本中是否存在词条之间的固定组合,若满足上述固定组合的词条出现设定次,则保存上述固定组合,将不同于二元关系的固定组合设定为组合关系。
下面参考图6,其示出了适于用来实现本申请实施例的服务器的计算机系统600的结构示意图。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,上述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括词条显示单元、匹配关系查询单元和词条修正单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,词条修正单元还可以被描述为“用于对词条进行修正的单元”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中上述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当上述一个或者多个程序被一个设备执行时,使得上述设备:根据用户输入的拼音信息查找并显示预选词条;在用户从上述预选词条中选定输入词条后,查询上述输入词条与相邻的前一个词条的匹配关系,上述匹配关系包括词条的二元关系和词条在当前文本中的组合关系;根据上述匹配关系对上述相邻的前一个词条进行修正。。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (14)

1.一种用于修正词条的方法,其特征在于,所述方法包括:
根据用户输入的拼音信息查找并显示预选词条;
在用户从所述预选词条中选定输入词条后,查询所述输入词条与相邻的前一个词条的匹配关系,所述匹配关系包括词条的二元关系和词条在当前文本中的组合关系;
根据所述匹配关系对所述相邻的前一个词条进行修正。
2.根据权利要求1所述的方法,其特征在于,所述查询所述输入词条与相邻的前一个词条的匹配关系包括:
查看所述相邻的前一个词条的拼音信息,并将该拼音信息的全部词条设置为待确定词条集合;
查询所述待确定词条集合中的每个待确定词条与所述输入词条的二元关系或组合关系。
3.根据权利要求1所述的方法,其特征在于,所述根据所述匹配关系对所述相邻的前一个词条进行修正包括:
当所述待确定词条与所述输入词条存在二元关系时,将所述待确定词条与所述输入词条之间最大的二元关系值对应的待确定词条作为预选目标词条;
若所述相邻的前一个词条与所述预选目标词条不同,则显示第一信息提示框,所述第一信息提示框用于向用户提示是否将所述相邻的前一个词条替换为所述预选目标词条;
在用户选择替换词条时,将所述相邻的前一个词条替换为所述预选目标词条。
4.根据权利要求3所述的方法,其特征在于,所述将所述相邻的前一个词条替换为所述预选目标词条包括:
在所述相邻的前一个词条和所述输入词条上显示删除标记,并显示替换信息提示框,所述替换信息提示框包含所述预选目标词条和所述输入词条;
当用户在所述替换信息提示框上选择替换词条选项时,将所述相邻的前一个词条和所述输入词条替换为所述预选目标词条和所述输入词条。
5.根据权利要求1所述的方法,其特征在于,所述根据所述匹配关系对所述相邻的前一个词条进行修正还包括:
查看当前文本中是否存在所述输入词条与相邻的前一个词条的匹配关系,若有,则通过修改提示框进行提示,所述修改提示框用于提示对当前文本中存在匹配关系的词条进行修改。
6.根据权利要求3所述的方法,其特征在于,所述根据所述匹配关系对所述相邻的前一个词条进行修正包括:
当所述待确定词条与所述输入词条不存在二元关系时,查看所述待确定词条与所述输入词条在当前文本是否存在组合关系,若存在,且满足所述组合关系的待确定词条与所述相邻的前一个词条不相同,则显示第二信息提示框,所述第二信息提示框用于向用户提示是否将所述相邻的前一个词条替换为满足所述组合关系的待确定词条;
在用户选择替换词条时,将所述相邻的前一个词条替换为所述满足所述组合关系的待确定词条。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
查看并保存所述组合关系的步骤,所述查看并保存所述组合关系的步骤包括:
查看当前文本中是否存在词条之间的固定组合,若满足所述固定组合的词条出现设定次,则保存所述固定组合,将不同于二元关系的固定组合设定为组合关系。
8.一种用于修正词条的装置,其特征在于,所述装置包括:
词条显示单元,用于根据用户输入的拼音信息查找并显示预选词条;
匹配关系查询单元,用于在用户从所述预选词条中选定输入词条后,查询所述输入词条与相邻的前一个词条的匹配关系,所述匹配关系包括词条的二元关系和词条在当前文本中的组合关系;
词条修正单元,用于根据所述匹配关系对所述相邻的前一个词条进行修正。
9.根据权利要求8所述的装置,其特征在于,所述匹配关系查询单元包括:
待确定词条集合获取子单元,用于查看所述相邻的前一个词条的拼音信息,并将该拼音信息的全部词条设置为待确定词条集合;
匹配关系查找子单元,用于查询所述待确定词条集合中的每个待确定词条与所述输入词条的二元关系或组合关系。
10.根据权利要求8所述的装置,其特征在于,所述词条修正单元包括:
预选目标词条获取子单元,用于在所述待确定词条与所述输入词条存在二元关系时,将所述待确定词条与所述输入词条之间最大的二元关系值对应的待确定词条作为预选目标词条;
第一信息提示框显示子单元,用于在所述相邻的前一个词条与所述预选目标词条不同时显示第一信息提示框,所述第一信息提示框用于向用户提示是否将所述相邻的前一个词条替换为所述预选目标词条;
第一词条修正子单元,用于在用户选择替换词条时,将所述相邻的前一个词条替换为所述预选目标词条。
11.根据权利要求10所述的装置,其特征在于,所述第一词条修正子单元包括:
替换信息提示框显示模块,用于在所述相邻的前一个词条和所述输入词条上显示删除标记,并显示替换信息提示框,所述替换信息提示框包含所述预选目标词条和所述输入词条;
词条替换模块,用于用户在所述替换信息提示框上选择替换词条选项时,将所述相邻的前一个词条和所述输入词条替换为所述预选目标词条和所述输入词条。
12.根据权利要求8所述的装置,其特征在于,所述词条修正单元还包括:
修正查询子单元,用于查看当前文本中是否存在所述输入词条与相邻的前一个词条的匹配关系,若有,则通过修改提示框进行提示,所述修改提示框用于提示对当前文本中存在匹配关系的词条进行修改。
13.根据权利要求10所述的装置,其特征在于,所述词条修正单元包括:
第二信息提示框显示子单元,用于在所述待确定词条与所述输入词条不存在二元关系时,查看所述待确定词条与所述输入词条在当前文本是否存在组合关系,若存在,且满足所述组合关系的待确定词条与所述相邻的前一个词条不相同,则显示第二信息提示框,所述第二信息提示框用于向用户提示是否将所述相邻的前一个词条替换为满足所述组合关系的待确定词条;
第二词条修正子单元,用于在用户选择替换词条时,将所述相邻的前一个词条替换为所述满足所述组合关系的待确定词条。
14.根据权利要求8所述的装置,其特征在于,所述装置还包括:
组合关系查询单元,用于查看并保存所述组合关系,所述组合关系查询单元包括:
组合关系保存子单元,用于查看当前文本中是否存在词条之间的固定组合,若满足所述固定组合的词条出现设定次,则保存所述固定组合,将不同于二元关系的固定组合设定为组合关系。
CN201611165472.8A 2016-12-16 2016-12-16 用于修正词条的方法及装置 Pending CN106774978A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611165472.8A CN106774978A (zh) 2016-12-16 2016-12-16 用于修正词条的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611165472.8A CN106774978A (zh) 2016-12-16 2016-12-16 用于修正词条的方法及装置

Publications (1)

Publication Number Publication Date
CN106774978A true CN106774978A (zh) 2017-05-31

Family

ID=58892915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611165472.8A Pending CN106774978A (zh) 2016-12-16 2016-12-16 用于修正词条的方法及装置

Country Status (1)

Country Link
CN (1) CN106774978A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019140735A1 (zh) * 2018-01-22 2019-07-25 平安科技(深圳)有限公司 文字排序方法、装置、终端设备及介质
CN111126045A (zh) * 2019-11-25 2020-05-08 泰康保险集团股份有限公司 一种文本纠错方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064531A (zh) * 2013-01-18 2013-04-24 东莞宇龙通信科技有限公司 终端和输入法
WO2013163718A1 (en) * 2012-04-30 2013-11-07 Blackberry Limited Touchscreen keyboard with correction of previously input text
CN104615591A (zh) * 2015-03-10 2015-05-13 上海触乐信息科技有限公司 基于上下文的前向输入纠错方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013163718A1 (en) * 2012-04-30 2013-11-07 Blackberry Limited Touchscreen keyboard with correction of previously input text
CN103064531A (zh) * 2013-01-18 2013-04-24 东莞宇龙通信科技有限公司 终端和输入法
CN104615591A (zh) * 2015-03-10 2015-05-13 上海触乐信息科技有限公司 基于上下文的前向输入纠错方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019140735A1 (zh) * 2018-01-22 2019-07-25 平安科技(深圳)有限公司 文字排序方法、装置、终端设备及介质
CN111126045A (zh) * 2019-11-25 2020-05-08 泰康保险集团股份有限公司 一种文本纠错方法和装置

Similar Documents

Publication Publication Date Title
US20240078386A1 (en) Methods and systems for language-agnostic machine learning in natural language processing using feature extraction
US10229108B2 (en) System and method for adaptive spell checking
CN105183761B (zh) 敏感词替换方法和装置
CN110929125B (zh) 搜索召回方法、装置、设备及其存储介质
US20140122407A1 (en) Chatbot system and method having auto-select input message with quality response
US20080133222A1 (en) Spell checker for input of reduced keypad devices
US10073618B2 (en) Supplementing a virtual input keyboard
CN108984650A (zh) 计算机可读记录介质及计算机设备
CN112966081B (zh) 处理问答信息的方法、装置、设备和存储介质
CN109948122B (zh) 输入文本的纠错方法、装置及电子设备
CN110795628A (zh) 一种基于相关性的搜索词处理方法、装置及计算设备
CN105260469A (zh) 一种处理网站地图的方法、装置及设备
CN106774978A (zh) 用于修正词条的方法及装置
US11151119B2 (en) Textual overlay for indicating content veracity
CN106339105A (zh) 用于识别拼音信息的方法及装置
CN110347806A (zh) 原创文本甄别方法、装置、设备与计算机可读存储介质
CN115061580A (zh) 输入方法、装置、电子设备及可读存储介质
JP2019086815A (ja) 発想支援装置及びプログラム
US20160203220A1 (en) Method and apparatus for natural language searching based on mccs
CN112181167A (zh) 输入法侯选词处理方法和电子设备
WO2013118592A1 (ja) 情報検索装置および情報検索方法
US7865824B1 (en) Spelling correction based on input device geometry
US9734254B2 (en) Method and apparatus for automatic completion of an entry into an input field
WO2021241253A1 (ja) 文字入力補助装置、文字入力補助方法、および、文字入力補助プログラム
CN109597497B (zh) 一种信息预测方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication