CN103577393A - 校正处理方法及装置 - Google Patents

校正处理方法及装置 Download PDF

Info

Publication number
CN103577393A
CN103577393A CN201210265945.7A CN201210265945A CN103577393A CN 103577393 A CN103577393 A CN 103577393A CN 201210265945 A CN201210265945 A CN 201210265945A CN 103577393 A CN103577393 A CN 103577393A
Authority
CN
China
Prior art keywords
phrase
individual character
corrected
user
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210265945.7A
Other languages
English (en)
Inventor
朱纯深
郝天永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
City University of Hong Kong CityU
Original Assignee
City University of Hong Kong CityU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by City University of Hong Kong CityU filed Critical City University of Hong Kong CityU
Priority to CN201210265945.7A priority Critical patent/CN103577393A/zh
Publication of CN103577393A publication Critical patent/CN103577393A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本申请公开了一种校正处理方法及装置,应用于同一种语言内不同地区变体之间的转换,装置所执行的方法包括:接收用户输入的开始校正的指示信息;从执行完所述转换后的文档中查找待校正的单字或词组;显示该待校正的单字或词组的相关信息以及转换依据以供用户参考校对,并且显示候选修正方式;接收用户输入的关于当前查找到的待校正单字或词组的校对完成指示,或者接收用户对于候选修正方式的选择信息,并基于用户对于候选修正方式的选择信息对所述待校正的单字或词组进行修正。本申请提供的方法及装置,应用于同一种语言内不同地区变体之间的转换,能够提高转换或校正的准确度及效率。

Description

校正处理方法及装置
技术领域
本申请涉及文字处理技术,尤其涉及一种校正处理方法及装置,应用于同一种语言内不同地区变体之间的转换,尤其适合应用于简体中文和繁体中文中的一种到另一种的转换。
背景技术
中文文字包括简体中文和繁体中文两种字体,简体中文在中国大陆等区域的使用较为广泛,繁体中文在香港、台湾等区域的使用较为广泛。这两种字体之间差异较大,给这两种字体的使用者造成了一定的阅读和交流障碍。为了消除这些障碍,一些中文简繁或繁简转换技术应运而生。采用这些中文转换技术,可以将一篇文档中的简体中文转换成繁体中文,或者可以将一篇文档中的繁体中文转换成简体中文。
然而,要想将一篇简体中文或繁体中文进行准确无误的转换却并非易事。由于两种字体对应方面以及地区和文化上的差异,一个简体字可能对应于多个繁体字,一个繁体字可能对应于多个简体字,这就给简繁转换带来了一定的难度。
例如,在将简体中文转换成繁体中文时,一个简体中文单字“发”可以对应于两个繁体中文单字“發”和“髮”。在不同的单词中该中文单字应当转换成不同的繁体单字,例如,“发展”中的“发”对应于繁体单字“發”,“头发”中的“发”对应于繁体单字“髮”。
又例如,在将繁体中文转换成简体中文时,一个繁体中文单字“畫”可以对应于两个简体中文单字“划”和“画”。“計畫”中的“畫”对应于简体单字“划”,“鉛筆畫”中的“畫”对应于简体单字“画”。
由于上述这种一对多情况的存在,使得进行转换后的文档中可能存在错误的地方,进而影响转换准确度。
现有技术中的中文简繁或简繁转换方法很少提供转换后的校对或修正方法。如果需要校对或修正转换后的文档中可能存在的错误(例如,上述一对多的情况),则需要人工逐字校对,耗费时间多而且效率低。另外,人工校对容易导致遗漏,因而校对的准确率相对较低。
另外,尽管有的中文简繁或繁简转换方法中提供了简单的搜索和替换功能来允许用户搜索并替换转换后的文档中的某些单字或词组从而进行校对或修正,但是,这需要用户输入希望搜索的单字或词组才能完成搜索和替换,如果用户输入的希望搜索的单字或词组没有覆盖文档中所有的一对多情况,则会造成遗漏进而影响校对的准确率。而且,由于涉及用户人工输入待搜索的单字或词组,同样存在耗费时间多且效率低的问题。
此外,不仅是中文,其他语言也存在类似的问题。由于地区和文化的差异,同一种语言在不同的地区具有不同的变体。例如,不同地区的英语之间也存在差异。例如“颜色”这个词语,在美式英语中为“color”,而在英式英语中为“colour”。因而,也需要一些转换方法进行不同变体之间的转换。然而对于采用这些转换方法转换后的文档,现有技术也很少提供转换后的校对或修正方法。如果人工校对或修正,则耗费时间多而且效率低。
发明内容
本申请针对现有技术中存在的问题,提供一种校正处理方法,能够改善同一种语言内不同地区变体之间转换的校对效果,耗费时间少且效率高。
本申请提供了一种校正处理方法,应用于同一种语言内不同地区变体之间的转换,包括:
接收用户输入的开始校正的指示信息;
从执行完所述转换后的文档中查找待校正的单字或词组;
显示所述待校正的单字或词组的相关信息以及转换依据以供用户参考校对,并且显示候选修正方式;
接收用户输入的关于当前查找到的待校正的单字或词组的校对完成指示,或者接收用户对于候选修正方式的选择信息,并基于用户对于候选修正方式的选择信息对所述待校正的单字或词组进行修正。
本申请还提供了一种校正处理装置,应用于同一种语言内不同地区变体之间的转换,包括:
接收模块,用于接收用户输入的开始校正的指示信息;
查找模块,用于从执行完所述转换后的文档中查找待校正的单字或词组;
显示模块,用于显示所述待校正的单字或词组的相关信息以及转换依据以供用户参考校对,并且显示候选修正方式;
处理模块,用于接收用户输入的关于当前查找到的待校正单字或词组的校对完成指示,或者接收用户对于候选修正方式的选择信息,并基于用户对于候选修正方式的选择信息对所述待校正的单字或词组进行修正。
本申请提供的方法和装置中,通过自动查找待校正(在本申请的实施例中,“校正”包括对经过转换后的文档进行校对处理,或者包括对经过转换的文档进行校对处理以及修正处理)的单字或词组,而不是像现有技术那样人工校对或者需要由用户输入希望搜索的单字或词组才能完成搜索和替换。这样,就避免了用户可能漏掉一些可能有问题的单字或词组(例如,属于一对多情况的单字或词组)的情况,可以将转换后的文档中所有可能有问题的单字或词组的相关信息、转换依据以及候选修正方式显示给用户,供用户进行校正。因而,经过校正后的转换文档的准确率显著提高,校正效果得以改善。
而且,由于只是向用户显示可能有问题的单字或词组,跳过了那些不需要校正的单字或词组(例如,属于一对一情况的单字或词组),与现有技术中需要人工逐字校对的方式相比,减少了所需时间而且提高了效率。
通过以下参照附图对本申请实施例进行说明,帮助更进一步理解本申请所公开的内容及权利要求书所要保护的范围。
附图说明
图1示例性示出本申请校正处理方法涉及到的一种操作环境的例子;
图2示例性示出本申请校正处理方法的流程图;
图3示例性示出了本申请实施例中一对多数据库的例子;
图4示例性示出本申请中涉及到的一种显示界面的示意图;
图5示例性示出本申请校正处理装置的结构示意图。
具体实施方式
下面将详细描述本申请的实施例。应当注意,这里描述的实施例只用于举例说明,并不用于限制本申请。
图1示例性示出本申请校正处理方法涉及到的一种操作环境的例子。该操作环境可以包括一台或多台校正处理装置1,该处理装置1可以包括存储器和处理器,该存储器中可以存储处理器执行相关操作所需的指令,处理器可以根据存储器中存储的指令执行相应的操作。存储器中也可以存储各种数据库,处理器可以访问存储器中存储的各种数据库。或者,处理器也可以通过网络3访问外部存储器中存储的各种数据库4。该处理装置1可以是台式计算机、笔记本电脑、移动设备等,图1中以处理装置1是台式计算机为例进行介绍。
用户2可以通过接口设备(例如,鼠标、键盘或触摸屏幕等)与该处理装置1进行交互,例如用户2可以通过接口设备输入信息,处理装置1可以向用户2显示信息。
图2示例性示出本申请校正处理方法的流程图。下面结合图1和图2来描述该方法的具体实现过程。
本申请提供的校正处理方法可以应用于同一种语言内不同地区变体之间的转换(具体而言该转换可以指同一种语言内不同地区变体中的一种到另一种的转换),例如可以应用于中文、英语以及其他语言的不同地区变体之间的转换。其中,简体中文和繁体中文中的一种到另一种的转换是同一种语言内不同地区变体之间转换的一个典型且极具实用价值的例示。在以下的各实施例中,主要以简体中文和繁体中文中的一种到另一种的转换为例进行说明。
在描述校正处理方法之前,首先简单描述一下将简体中文和繁体中文中的一种转换成另一种的转换过程。
在转换中,处理装置1在接收到一篇文档时,可以先对该文档进行分词处理以将输入文档分割成多个单字或词组,然后将各个单字或词组分别转换成对应的目标字符形式。将简体中文和繁体中文中的一种转换成另一种包括从简体中文转换为繁体中文的情况和从繁体中文转换为简体中文的情况。
例如,在从简体转换到繁体的情况中,可以预先建立用于转换的映射数据库,该映射数据库中存储有用于从简体转换到繁体的数据源,例如可以存储有多个简体单字或词组以及每个简体单字或词组对应的一个或多个繁体单字或词组。另外,可以进一步将该转换数据库进行细分,即该映射数据库可以包括一对多数据库、一对一数据库以及其他数据库。该一对多数据库存储有多个简体单字或词组以及对应的多个繁体单字或词组,其中每个简体单字或词组存在多个可选的繁体单字或词组,也就是说每个简体单字或词组对应于多个繁体单字或词组。
图3示例性示出了本申请实施例中一对多数据库D1的例子。该数据库中的简体单字“发”分别对应于两个繁体单字“發”和“髮”,“發”和“髮”分别是彼此的变形体。简体单字“苏”分别对应于三个繁体单字“蘇”“囌”“甦”。在本申请的实施例中,待转换的单字或词组存在多个可选的目标单字或词组的情况称作一对多的情况。
在进行从简体到繁体的转换时,可以在各个数据库中分别查找待转换文档中的各个单字或词组,如果在一对一数据库中查找到转换文档中的某个单字或词组,则可以将该单字或词组转换成唯一的一个繁体单字或词组。如果在一对多数据库中查找到待转换文档中的某个单字或词组,则可以根据具体的转换规则将该单字或词组转换成多个对应繁体单字或词组中的一个。具体的转换规则可以根据文档的内容或类型等实际情况来选择,此处不再赘述。
另外,还可以不是采用一对多数据库的方式,而是采用预先设计的其他转换方法执行中文简繁转换。
从繁体到简体的情况与上述从简体到繁体的情况类似,也可以通过预先建立的数据库或其他转换方法实现。
当然,在进行从繁体到简体的转换或从简体到繁体的转换时也可以只采用一个统一的数据库,而不是分别针对一对一情况和一对多情况进行转换。
在完成文档的转换后,就可以开始进行校正处理了。下面描述校正处理的具体过程。本申请中的校正处理可以包括如下步骤101-104。
步骤101、处理装置1接收用户输入的开始校正的指示信息。
例如,用户2可以点击鼠标、触摸屏幕或者其他人机交互模式来输入信息触发校正,该输入信息即可以当作是开始校正的指示信息。
步骤102、处理装置1从执行完转换后的文档中查找待校正的单字或词组。
对于一篇已经执行转换的文档来说,以中文繁简转换或中文简繁转换为例,待校正单字或词组可以是那些属于一对多情况的单字或词组。
具体而言,在之前的转换过程中可以将那些属于一对多情况的单字或词组标识出来,例如,如果所使用的数据库包括一对一数据库和一对多数据库,那么可以为转换后的一对多单字或词组(这些一对多单字或词组能够在一对多数据库中查找到)添加一对多单字或词组标识,以表明这些单字或词组是属于一对多情况。这些标识可以是特定的字体颜色、特定的背景颜色、下划线、粗体或者斜体等。这样,在步骤102中可以从执行完转换后的文档中查找具有一对多单字或词组标识的单字或词组作为待校正的单字或词组。
如果在之前的文档转换过程中只采用一个统一的数据库而没有分别针对一对一情况和一对多情况进行转换,那么在步骤102中可以通过在预先建立的一对多数据库中查找执行完转换后的文档中的各个单字或词组来查找待校正的单字或词组。具体而言,如果某个单字或词组能够在该一对多数据库中查找到,则可以确定该单字或词组属于一对多情况。
该预先建立的一对多数据库中存储有多个简体单字或词组及其各自对应的多个繁体单字或词组(如图3所示),亦即其中每个简体单字或词组对应于多个繁体单字或词组。或者该预先建立的一对多数据库中存储有多个繁体单字或词组及其各自对应的多个简体单字或词组,亦即其中每个繁体单字或词组对应于多个简体单字或词组。
需要说明的是,如图1所示,本申请实施例中涉及到的各数据库,可以存储在处理装置1自身的存储器中,也可以存储在外部存储器中。
步骤103、处理装置1显示该待校正的单字或词组的相关信息以及转换依据(bibliographical evidence)以供用户参考校对,亦即让用户可以进一步判断该单字或词组是否正确。该处理装置1还显示候选的其他修正方式。
步骤104、接收用户输入的关于当前查找到的待校正的单字或词组的校对完成指示,或者接收用户对于候选修正方式的选择信息,并基于用户对于候选修正方式的选择信息对该待校正的单字或词组进行修正。
下面详细描述步骤103-104。
本申请的实施例中,待校正的单字或词组的转换依据可以表明将该待校正的单字或词组进行当前转换的依据。例如,依据“汉语大词典”,将“后顾”转换成“後顧”,此处“后”属于一对多情况。那么,“汉语大词典”就是当前一对多转换的转换依据。
该转换依据还可以包括:“简繁互转易错字辨析表”、“两岸地区常用词汇对照表”、“汉语分词词典”、“简化字总表”等,也可以包括一些网络数据源,例如“维基百科(Wikipedia):粤语用词”等。该转换依据甚至还可以包括用户自定义的个人词典。
在本申请的实施例中,候选修正方式的显示可以包括:对于当前查找到的待校正的单字或词组,显示用于表示基本修正方式的第一示意部、用于表示批量修正方式的第二示意部以及用于搜索然后修正方式的第三示意部等。这些示意部可以是显示在图形用户界面中的各种图形化按钮或按键等。通过显示这些示意部,相当于为用户提供了各种候选修正方式。用户可以通过鼠标或者触摸屏点击这些示意部、或者通过其他人机交互模式来选择这些示意部以确定相应的修正方式。用户通过这些方式输入的信息可以当作是关于这些示意部被选择的数据。
在接收到关于各个示意部被选择的数据后,处理装置可以执行相应的修正处理。例如,如果接收到关于第一示意部被选择的数据,则用用户输入的单字或词组替换当前的所述待校正的单字或词组;如果接收到关于第二示意部被选择的数据,则用用户输入的单字或词组替换文档中的所有的(即文档中各处出现的)所述待校正的单字或词组;如果接收到关于第三示意部被选择的数据,则定位待校正的单字或词组在所述文档中的位置,基于用户的指示,用用户输入的单字或词组替换文档中所有的(即文档中各处出现的)所述待校正的单字或词组中的全部或一部分。
图4示例性示出本申请中涉及到的一种显示界面的示意图。图4中的主窗口W1中示出的是一个进行中文简繁转换后的文档。对于该文档中的一个待校正的词组R1(图中以斜线阴影标记出),在该文档中该待校正的词组R1可以以不同于其他单字或词组的颜色示出。
在一个弹出窗口W2中显示出了该待校正的词组R1的相关信息以及该词组R1的转换依据。可以通过超链接(hyperlink)的方式将与待校正的词组R1相关的信息与“信息”字段21关联起来。与待校正的单元R1相关的信息可以包括待校正的词组R1中的一对多单字的一个或多个变形体以及词语搭配。这些变形体和词语搭配可以存储在一对多数据库中。而且,可以通过超链接的方式将与待校正的词组R1相关联的转换依据与“转换依据”字段22关联起来,这样就可以在窗口W2中显示与词组R1相关联的转换依据。在“修改为”输入框23中用户可以输入正确的词组。通过提供这些变形体、词语搭配以及转换依据,用户可以方便地校对该词组R1,判断该词组R1是否正确,并且用户可以基于这些变形体以及词语搭配在修正时挑选正确的单字或词组。
在弹出窗口W2中还示出了“跳过”按钮26。如果用户对于该词组R1进行校对之后发现该词组实际上不需要进行修正,则可以点击“跳过”按钮26。这样,处理装置1可以带领用户进入下一个单字或词组的校正,即,直接为用户显示下一个待校正的单字或词组的弹出窗口同时跳过那些不需要校正的单字或词组。用户对于“跳过”按钮26的点击信息可以作为当前查找到的待校正的单字或词组的校对完成指示。
在弹出的窗口W2中示出了“确认”按钮27,该按钮27可以当作是用于表示基本修正方式的第一示意部。通过这个按钮为用户提供了基本修正模式。在基本修正模式下,从转换后的文档中第一个待校正的单字或词组开始,逐一为用户显示针对各个待校正的单字或词组的弹出窗口W2。当用户点击“确认”按钮27时,可以用用户输入的词组替换当前的待校正的词组R1。
另外,在本申请的实施中,在基本修正模式的基础上还提供了批量修正和搜索后修正这两种高级修正模式。
在批量修正模式下,允许用户对于文档中各处出现的同一个待校正的单字或词组进行批量修正。
在搜索后修正模式下,处理装置先定位待校正的单字或词组在文档中的位置,然后基于用户的指示,用用户输入的单字或词组替换各处出现的待校对或修正的单字或词组中的全部或一部分。对于一些需要特别注意的单字或词组,用户可以选择搜索后修正这种模式,对单个待校正的单字或词组进行特别处理,以保证修正的准确性。
例如,在弹出窗口W2中示出了“批量修正”按钮24和“搜索后修正”按钮25,这两个按钮可以当作用于表示批量修正和搜索后修正这两种高级修正模式的第二示意部和第三示意部。
在本申请的实施例中,通过显示“批量修正”按钮24、“搜索后修正”按钮25、“确认”按钮27等,相当于为用户显示出了多种候选修正方式。
在步骤103中,用户可以在“修正为”输入框23中输入正确的词组,并点击“批量修正”按钮24(相当于用户输入了所选择的修正方式)。处理装置1然后可以将文档中各处出现的待修正的词组R1替换为用户在“修正为”输入框23中输入的正确的词组。
或者,用户可以在“修正为”输入框23中输入正确的词组,并点击“搜索后修正”按钮25。处理装置1可定位待校正的词组R1在文档中的各个位置,然后可以在每个位置处弹出窗口来接收用户指示,基于用户指示来修正当前位置的待校正的词组R1或跳过。这样可以实现对单个待校正词组的单独处理。
在本申请提供的校正处理方法中,在完成一个待校正的单字或词组的处理之后,处理装置1可以自动查找下一个待校正的单字或词组,显示下一个待校正的单字或词组的相关信息、转换依据以及候选修正方式,跳过那些不需要校对正的单字或词组。
另外,根据本申请的一个实施例,用户可以通过点击文档中的任意一个位置或预设位置来发出用于中断校正的信息。或者可以在窗口W2中显示用于表示中断校正的示意部(该示意部可以是一个图形化按钮,图4中未示出)和用于恢复校正的第四示意部,用户可以用鼠标点击这些示意部来选择中断或恢复校正。
在接收到用来中断校正的信息时,处理装置可以停止校正,并保存校正停止时的位置。例如,待校正的单字或词组在文档中的位置(例如,第几页,第几行)。
在接收到关于第四示意部被选择的数据时,处理装置可以从上一次停止的位置开始继续进行校正,或者从用户指定的任一位置开始继续进行校正。
例如,用户可以通过点击主窗口W1中的“恢复”按钮28来恢复校正,处理装置可以通过访问存储器来确定上一次停止时待校正的单字或词组在文档中的位置,直接向用户显示上一次停止时的页面,并显示弹出窗口。
当然,处理装置也可以从用户指定的任一位置开始继续进行校正。例如,用户可以在点击“恢复”按钮28后,将页面拖动到他希望看到的页面,然后点击拖动到的页面。处理装置可以从用户拖动到的当前页面开始恢复校正。
本申请提供的方法,通过处理装置自动查找待校正的单字或词组,而不是像现有技术那样需要人工校对或需要由用户输入希望搜索的单字或词组才能完成搜索和替换。这样,就避免了用户可能漏掉一些可能有问题的单字或词组(例如,属于一对多情况的单字或词组)的情况,处理装置可以将转换后的文档中所有可能有问题的单字或词组的相关信息、转换依据以及候选修正方式显示给用户,供用户校正。因而,校正的准确率提高。
而且,由于处理装置只是向用户显示可能有问题的单字或词组,跳过了那些不需要校正的单字或词组(例如,属于一对一情况的单字或词组),与现有技术中需要人工逐字校正的方式相比,减少了所需时间而且提高了效率。
另外,现有转换技术中均未提供待校正的单字或词组的相关信息、转换依据以及候选修正方式,这样不便于用户校正时选择合适的字符单字或词组和修正方式。而本申请的实施例中,通过处理装置将待校正的单字或词组的相关信息、转换依据以及候选修正方式进行显示,便于用户做出合理判断来选择正确的单字或词组并且灵活地选择合适的修正方式,进而可以提高校正的准确率和效率。
而且,现有转换技术中也不会记录上一次校正的位置,这样,如果校正过程中途停止,则难以找到停止之前的位置,影响校正效率。而本申请的实施例中,在校正过程中会记录校正停止时的位置,这样,恢复开始校正后,可以从保存的位置开始继续校正,节省了时间,提高了校正的效率。
本申请提供的方法提供了基本的修正模式、批量修正模式以及搜索后修正模式这些可选择的修正模式,提高了用户进行修正的灵活性,能够适用于各种专业需求,尤其适用于例如外交文件、公众演讲和电视字幕等严肃的文档处理场合。
本申请提供的校正处理方法可以应用于目前的各种同一种语言内不同地区变体之间的转换,尤其适用于中文简繁转换或中文繁简转换方法,以便进行用户可控的高效率的校正。
图5示例性示出本申请校修正处理装置的结构示意图,该装置可以包括接收模块31、查找模块32、显示模块33和处理模块34。接收模块31用于接收用户输入的开始校正的指示信息。查找模块32与接收模块31连接,用于响应于接收模块31接收到的用于开始修正的用户输入信息,从执行完转换后的文档中查找待校正的单字或词组。显示模块33与查找模块32连接,用于显示该待校正的单字或词组的相关信息以及转换依据以供用户参考校对,并且显示候选修正信息。处理模块34与显示模块33连接,用于接收用户输入的关于当前查找到的待校正的单字或词组的校对完成指示,或者接收用户对于候选修正方式的选择信息,并基于用户对于候选修正方式的选择信息对待校正的单字或词组进行修正。
根据本申请的一个实施例,还可以包括转换处理模块35,该转换处理模块35用于利用映射数据库执行所述转换,在转换过程中为转换后的一对多单字或词组添加一对多单字或词组标识。
其中,查找模块32可以从执行完转换后的文档中查找具有一对多单字或词组标识的单字或词组作为待校正的单字或词组。
根据本申请的一个实施例,显示模块33可以对于当前查找到的待校正的单字或词组显示用于表示基本修正方式的第一示意部、用于表示批量修正方式的第二示意部以及用于表示搜索然后修正方式的第三示意部。
处理模块34可以接收用户输入的单字或词组以及关于第一示意部、第二示意部或者第三示意部被选择的数据。在接收到关于第一示意部被选择的数据的情况下,处理模块34可以用用户输入的单字或词组替换当前的待校正的单字或词组。在接收到关于第二示意部被选择的数据的情况下,处理模块34可以用用户输入的单字或词组替换文档中的所有的待校正的单字或词组。或者在接收到关于第三示意部被选择的数据的情况下,处理模块34可以定位待校正的单字或词组在文档中的位置,基于用户的指示,用用户输入的单字或词组替换文档中所有的所述待校正的单字或词组中的全部或一部分。
在完成当前的待校正的单字或词组的处理之后,显示模块33自动显示下一个待校正的单字或词组的相关信息、转换依据以及候选修正方式,而跳过那些不需要校正的单字或词组。
显示模块33还可以在显示候选修正方式的同时显示用于表示恢复校正的第四示意部。
处理模块34还可以在接收到用户输入的用来中断校正的信息时,停止修正,并保存校正停止时的位置;在接收到第四示意部被选择的数据时,从上一次停止的位置开始继续进行校正,或者从用户指定的任一位置开始继续进行校正。
关于校正处理装置中各个模块的具体操作,可以参见前述关于方法实施例的描述。
本申请的处理装置中的各个模块可以为该处理装置运行计算机可执行指令时具有相应功能的设备组件。例如,接收模块可以是由处理装置中的处理器、接收接口、相关线路以及相应功能的计算机可执行指令来实现。
虽然已参照典型实施例描述了本申请,但应当理解,所用的术语是说明和示例性、而非限制性的术语。由于本申请能够以多种形式具体实施而不脱离发明的精神或实质,所以应当理解,上述实施例不限于任何前述的细节,而应在随附权利要求所限定的精神和范围内广泛地解释,因此落入权利要求或其等效范围内的全部变化和改型都应为随附权利要求所涵盖。

Claims (15)

1.一种校正处理方法,应用于同一种语言内不同地区变体之间的转换,包括:
接收用户输入的开始校正的指示信息;
从执行完所述转换后的文档中查找待校正的单字或词组;
显示所述待校正的单字或词组的相关信息以及转换依据以供用户参考校对,并且显示候选修正方式;
接收用户输入的关于当前查找到的待校正的单字或词组的校对完成指示,或者接收用户对于候选修正方式的选择信息,并基于用户对于候选修正方式的选择信息对所述待校正的单字或词组进行修正。
2.根据权利要求1所述的方法,所述同一种语言内不同地区变体之间的转换是同一种语言内不同地区变体中的一种到另一种的转换,其中包括简体中文和繁体中文中的一种到另一种的转换。
3.根据权利要求2所述的方法,在接收用户输入的开始校正的指示信息之前,还包括利用映射数据库执行所述转换,并为转换后的一对多单字或词组添加一对多单字或词组标识;
从执行完所述转换后的文档中查找待校正的单字或词组,包括:
从执行完所述转换后的文档中查找具有一对多单字或词组标识的单字或词组作为所述待校正的单字或词组。
4.根据权利要求2所述的方法,所述显示候选修正方式包括:
对于当前查找到的待校正的单字或词组,显示用于表示基本修正方式的第一示意部、用于表示批量修正方式的第二示意部以及用于表示搜索然后修正方式的第三示意部。
5.根据权利要求4所述的方法,其中,接收用户对于候选修正方式的选择信息包括:接收用户输入的单字或词组以及关于所述第一示意部、所述第二示意部或者所述第三示意部被选择的数据;
基于用户对于候选修正方式的选择信息对所述待校正的单字或词组进行修正包括:
如果接收到关于所述第一示意部被选择的数据,则用用户输入的单字或词组替换当前的所述待校正的单字或词组;
如果接收到关于所述第二示意部被选择的数据,则用用户输入的单字或词组替换所述文档中所有的所述待校正的单字或词组;
如果接收到关于所述第三示意部被选择的数据,则定位所述待校正的单字或词组在所述文档中的位置,基于用户的指示,用用户输入的单字或词组替换所述文档中所有的所述待校正的单字或词组中的全部或一部分。
6.根据权利要求5所述的方法,其中,在完成当前的所述待校正的单字或词组的校正处理之后,自动显示下一个待校正的单字或词组的相关信息、转换依据以及候选修正方式。
7.根据权利要求1-6中任一权利要求所述的方法,其中,所述待校正的单字或词组的相关信息包括所述待校正的单字或词组中一对多单字的一个或多个变形体以及词语搭配。
8.根据权利要求1-6中任一权利要求所述的方法,其中,在显示所述候选修正方式的同时还显示用于表示恢复校正的第四示意部;
所述方法还包括:
在接收到用来中断校正的信息时,停止校正,并保存校正停止时的位置;
在接收到关于所述第四示意部被选择的数据时,从上一次停止的位置开始继续进行校正,或者从用户指定的任一位置开始继续进行校正。
9.一种校正处理装置,应用于同一种语言内不同地区变体之间的转换,包括:
接收模块,用于接收用户输入的开始校正的指示信息;
查找模块,用于从执行完所述转换后的文档中查找待校正的单字或词组;
显示模块,用于显示所述待校正的单字或词组的相关信息以及转换依据以供用户参考校对,并且显示候选修正方式;
处理模块,用于接收用户输入的关于当前查找到的待校正单字或词组的校对完成指示,或者接收用户对于候选修正方式的选择信息,并基于用户对于候选修正方式的选择信息对所述待校正的单字或词组进行修正。
10.根据权利要求9所述的校正处理装置,其中,所述同一种语言内不同地区变体之间的转换是指同一种语言内不同地区变体中的一种到另一种的转换,其中包括简体中文和繁体中文中的一种到另一种的转换。
11.根据权利要求10所述的校正处理装置,还包括:转换处理模块,用于利用映射数据库执行所述转换,并为转换后的一对多单字或词组添加一对多单字或词组标识;
其中,所述查找模块用于从执行完所述转换后的文档中查找具有一对多单字或词组标识的单字或词组作为所述待校正的单字或词组。
12.根据权利要求10所述的校正处理装置,其中,所述显示模块对当前查找到的所述待校正的单字或词组显示用于表示基本修正方式的第一示意部、用于表示批量修正方式的第二示意部以及用于表示搜索然后修正方式的第三示意部。
13.根据权利要求12所述的校正处理装置,其中,所述处理模块用于接收用户输入的单字或词组以及关于所述第一示意部、所述第二示意部或者所述第三示意部被选择的数据,在接收到关于所述第一示意部被选择的数据的情况下,用用户输入的单字或词组替换当前的所述待校正的单字或词组;在接收到关于所述第二示意部被选择的数据的情况下,用用户输入的单字或词组替换所述文档中的所有的所述待校正的单字或词组;或者在接收到关于所述第三示意部被选择的数据的情况下,定位所述待校正的单字或词组在所述文档中的位置,基于用户的指示,用用户输入的单字或词组替换所述文档中所有的所述待校正的单字或词组中的全部或一部分。
14.根据权利要求9-13中任一权利要求所述的校正处理装置,其中,所述显示模块在显示所述候选修正方式的同时还显示用于表示恢复校正的第四示意部;
所述处理模块还用于在接收到用户输入的用来中断校正的信息时,停止校正,并保存校正停止时的位置;在接收到所述第四示意部被选择的数据时,从上一次停止的位置开始继续进行校正,或者从用户指定的任一位置开始继续进行校正。
15.根据权利要求9-13中任一权利要求所述的校正处理装置,其中,所述显示模块用于在完成当前的所述待校正的单字或词组的处理之后,自动显示下一个待校正的单字或词组的相关信息、转换依据以及候选修正方式。
CN201210265945.7A 2012-07-30 2012-07-30 校正处理方法及装置 Pending CN103577393A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210265945.7A CN103577393A (zh) 2012-07-30 2012-07-30 校正处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210265945.7A CN103577393A (zh) 2012-07-30 2012-07-30 校正处理方法及装置

Publications (1)

Publication Number Publication Date
CN103577393A true CN103577393A (zh) 2014-02-12

Family

ID=50049202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210265945.7A Pending CN103577393A (zh) 2012-07-30 2012-07-30 校正处理方法及装置

Country Status (1)

Country Link
CN (1) CN103577393A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168941A (zh) * 2017-05-12 2017-09-15 掌阅科技股份有限公司 文本内容修正方法、电子设备、计算机存储介质
CN108717412A (zh) * 2018-06-12 2018-10-30 北京览群智数据科技有限责任公司 基于中文分词的中文校对纠错方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060184352A1 (en) * 2005-02-17 2006-08-17 Yen-Fu Chen Enhanced Chinese character/Pin Yin/English translator
CN101859295A (zh) * 2009-04-07 2010-10-13 英业达股份有限公司 具标记提示的简繁字词转换系统及其方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060184352A1 (en) * 2005-02-17 2006-08-17 Yen-Fu Chen Enhanced Chinese character/Pin Yin/English translator
CN101859295A (zh) * 2009-04-07 2010-10-13 英业达股份有限公司 具标记提示的简繁字词转换系统及其方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168941A (zh) * 2017-05-12 2017-09-15 掌阅科技股份有限公司 文本内容修正方法、电子设备、计算机存储介质
CN108717412A (zh) * 2018-06-12 2018-10-30 北京览群智数据科技有限责任公司 基于中文分词的中文校对纠错方法及系统

Similar Documents

Publication Publication Date Title
US20200050661A1 (en) Incremental Multi-Word Recognition
CN109120511B (zh) 基于特征的自动校正方法、计算设备和系统
US9122376B1 (en) System for improving autocompletion of text input
US9025879B2 (en) Electronic apparatus and handwritten document processing method
CN100481089C (zh) 信息检索装置
KR101750968B1 (ko) 일관된 텍스트 제안 출력
US9753906B2 (en) Character string replacement
US20150121218A1 (en) Method and apparatus for controlling text input in electronic device
US9390341B2 (en) Electronic device and method for manufacturing the same
KR102240663B1 (ko) 필기 입력의 진행 디스플레이
JP6426417B2 (ja) 電子機器、方法及びプログラム
US20100231597A1 (en) Calculator and computer-readable medium
CN104412204A (zh) 用于组装单词的方法、控制器以及装置
CN112596650B (zh) 图表处理方法、装置及电子设备
US20160092430A1 (en) Electronic apparatus, method and storage medium
CN103577393A (zh) 校正处理方法及装置
CN102023785B (zh) 根据手写模式信息自动设置系统参数的方法及其装置
WO2022233275A1 (zh) 输入矫正方法和装置
US10019150B2 (en) Method and apparatus for controlling cursor in portable device
US9298366B2 (en) Electronic device, method and computer readable medium
WO2022143523A1 (zh) 词汇显示方法、装置和电子设备
CN102375655A (zh) 一种字母输入的处理方法及系统
JP6655331B2 (ja) 電子機器及び方法
CN107870678A (zh) 一种手写输入方法及装置
US20160209998A1 (en) Method and apparatus for inputting contents in a touch-screen device

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140212