CN111461119A - 一种文本信息的处理方法及电子设备 - Google Patents

一种文本信息的处理方法及电子设备 Download PDF

Info

Publication number
CN111461119A
CN111461119A CN202010247201.7A CN202010247201A CN111461119A CN 111461119 A CN111461119 A CN 111461119A CN 202010247201 A CN202010247201 A CN 202010247201A CN 111461119 A CN111461119 A CN 111461119A
Authority
CN
China
Prior art keywords
characters
target
character
character information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010247201.7A
Other languages
English (en)
Other versions
CN111461119B (zh
Inventor
甘君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN202010247201.7A priority Critical patent/CN111461119B/zh
Publication of CN111461119A publication Critical patent/CN111461119A/zh
Application granted granted Critical
Publication of CN111461119B publication Critical patent/CN111461119B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees

Abstract

本发明提供一种文本信息的处理方法及电子设备,其中,所述方法包括:识别目标图像中的字符,得到初始字符信息;所述初始字符信息中包含有修正符号;对所述初始字符信息进行修正处理,得到目标字符信息;显示包括有所述目标字符信息的目标文本信息。本发明能够针对包含有修正符号的初始字符信息进行修正处理,使得所显示的目标文本信息更整洁,从而保证针对手写文本等图片或纸张中的字符进行识别重建后生成的文本信息的显示效果。

Description

一种文本信息的处理方法及电子设备
技术领域
本发明涉及通信技术领域,尤其涉及一种文本信息的处理方法及电子设备。
背景技术
随着电子设备的发展,用户对电子设备的功能需求也越来越高,例如:针对一些手写文本,需要生成电子文本进行存档的情况下,可以通过拍摄照片或者扫描的方式,得到手写文本对应的图片;进一步通过光学字符识别(Optical Character Recognition,OCR)技术,可以将图片或纸张中的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字,实现图片或纸张中字符的可编辑处理;但是,目前基于OCR技术的字符识别方式,仅能够针对图片或纸张中的文字、字母、数字、标点符号等进行识别,导致针对手写文本等图片或纸张中的字符进行识别重建后生成的文本信息的显示效果较差。
发明内容
本发明提供了一种文本信息的处理方法及电子设备,以解决现有技术中针对手写文本等图片或纸张中的字符进行识别重建后生成的文本信息的显示效果较差的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种文本信息的处理方法,应用于电子设备,所述方法包括:
识别目标图像中的字符,得到初始字符信息;所述初始字符信息中包含有修正符号;
对所述初始字符信息进行修正处理,得到目标字符信息;
显示包括有所述目标字符信息的目标文本信息。
第二方面,本发明实施例还提供了一种电子设备,包括:
识别模块,用于识别目标图像中的字符,得到初始字符信息;所述初始字符信息中包含有修正符号;
修正模块,用于对所述初始字符信息进行修正处理,得到目标字符信息;
显示模块,用于显示包括有所述目标字符信息的目标文本信息。
第三方面,本发明实施例还提供了一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的文本信息的处理方法的步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的文本信息的处理方法的步骤。
在本发明实施例中,通过识别目标图像中的字符,得到包含有修正符号的初始字符信息;并对所述初始字符信息进行修正处理,得到目标字符信息,从而显示包括有所述目标字符信息的目标文本信息。这样,通过针对包含有修正符号的初始字符信息进行修正处理,使得所显示的目标文本信息更整洁,从而保证针对手写文本等图片或纸张中的字符进行识别重建后生成的文本信息的显示效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1表示本发明实施例的文本信息的处理方法的流程图;
图2表示本发明实施例的目标图像的示意图之一;
图3表示本发明实施例的目标图像的示意图之二;
图4表示本发明实施例的目标图像的示意图之三;
图5表示本发明实施例的定位框的示意图;
图6表示本发明实施例的目标文本信息的示意图;
图7表示本发明实施例的电子设备的框图;
图8表示本发明实施例的电子设备的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1,本发明实施例提供了一种文本信息的处理方法,应用于电子设备,所述方法包括:
步骤11:识别目标图像中的字符,得到初始字符信息;所述初始字符信息中包含有修正符号。
可选的,字符信息可以包括但不限于:文字、字母、数字、运算符号、标点符号、特殊符号以及修正符号等;其中,修正符号可以包括删除内容符号、调整内容顺序符号、增加内容符号、着重号标记符号等;着重号标记符号可以包括下划线符号、特定形状的围框符号(如:矩形、圆形、椭圆形、心形、星形等)、点标记符号等。
可选的,预先通过OCR识别模型训练,使得OCR识别模型具备对文字、字母、数字、运算符号、标点符号、特殊符号以及修正符号的识别能力;这样,通过OCR技术对目标图像中的字符进行识别,即可识别得到包含修正符号的初始字符信息。
步骤12:对所述初始字符信息进行修正处理,得到目标字符信息。
可选的,对所述初始字符信息进行修正处理包括但不限于:删除所述初始字符信息中的第一字符,在所述初始字符信息中的第二字符与第三字符之间增加第四字符,调整所述初始字符信息中的第五字符与第六字符的顺序,删除所述初始字符信息中的所述修正符号,对所述初始字符信息中的第七字符进行着重号标识等。
可选的,上述步骤12可以具体包括:根据所述初始字符信息中的第一类型的修正符号,对所述初始字符信息进行修正处理,得到目标字符信息;所述目标字符信息不包含所述第一类型的修正符号;
例如:该第一类型的修正符号可以为:删除内容符号、调整内容顺序符号、增加内容符号等修改类型的符号;这样,通过根据初始字符信息中的第一类型的修正符号进行修正处理,使得目标字符信息中不包含所述第一类型的修正符号,从而保证根据目标字符信息生成的目标文本信息更整洁美观。
可选的,当所述初始字符信息中包含有第二类型的修正符号的情况下,该目标字符信息中还可以包含有该第二类型的修正符号,如:该第二类型的修正符号可以是着重号标记符号等,以便于后续在显示包括有目标字符信息的目标文本信息时,可以根据该第二类型的修正符号,对所述目标字符信息中与所述第二类型的修正符号对应的字符进行标识,使得所显示的目标文本信息相对于目标图像具有更高的还原度,从而保证针对手写文本等图片或纸张中的字符进行识别重建后生成的文本信息的显示效果。
步骤13:显示包括有所述目标字符信息的目标文本信息。
可选的,上述步骤13可以具体包括:根据所述目标字符信息,生成目标文本信息,并显示所述目标文本信息。
例如:根据所述目标字符信息,生成目标文本信息可以是:根据修正后得到的目标字符信息,进行排版的重新构建,生成目标文本信息;
又例如:根据所述目标字符信息,生成目标文本信息还可以是在目标字符信息中包含有第二类型的修正符号(如着重号标记符号)的情况下,根据所述第二类型的修正符号对文本信息中的相应字符进行标记,生成目标文本信息;
再例如:根据所述目标字符信息,生成目标文本信息还可以是:根据修正后得到的目标字符信息,进行排版的重新构建,以及在目标字符信息中包含有第二类型的修正符号的情况下,根据所述第二类型的修正符号对文本信息中的相应字符进行标记。
上述方案中,通过识别目标图像中的字符,得到包含有修正符号的初始字符信息;并对所述初始字符信息进行修正处理,得到目标字符信息,从而显示包括有所述目标字符信息的目标文本信息;这样,通过针对包含有修正符号的初始字符信息进行修正处理,使得所显示的目标文本信息更整洁,从而保证针对手写文本等图片或纸张中的字符进行识别重建后生成的文本信息的显示效果。
此外,本发明实施例还可以针对手写文本中的着重号标记符号,在生成的目标文本信息中进行相应的标识处理,保证生成的目标文本信息具有更高的完整度。
可选的,上述识别目标图像中的字符,得到初始字符信息的步骤,可以具体包括:
在识别到所述目标图像中包含有修正标记的情况下,确定所述修正标记对应的修正符号;
根据所述修正符号以及识别到的第一字符,确定所述初始字符信息;其中,所述第一字符为:所述目标图像中除所述修正标记外的所有字符。
如图2所示,给出了一种目标图像21的示例,在该目标图像21中包含有删除标记,如图2中第二行的第12个字符以及第三行的第7个字符。
当识别到目标图像21中的删除标记时,可以根据预先建立的修正标记与修正符号之间的对应关系,确定该删除标记对应的修正符号(或者也可以称为修正编码),例如:删除标记对应修正符号“@@”,则识别得到目标图像21中的第一行内容对应的字符信息为“随笔”;识别得到目标图像21中的第二行内容对应的字符信息为“今天的天气真的是很好,@@情晴空万里,”;识别得到目标图像21中的第三行内容对应的字符信息为“我和我的小伙@@伙伴们去公园玩儿,我和小伙伴”;识别得到目标图像21中的第四行内容对应的字符信息为“在一起玩的很开心。”。
可选的,针对目标图像21中的空格,也可以通过相应的符号进行标记,如一个空格可以通过一个符号“·”来标记,则识别得到目标图像21中的第一行内容对应的字符信息为“随··笔”;识别得到目标图像21中的第二行内容对应的字符信息为“··今天的天气真的是很好,@@情晴空万里,”。
如图3所示,给出了又一种目标图像31的示例,在该目标图像31中包含有删除标记,如图3中第二行的第12个字符;该目标图像31中还包含有调整顺序标记,如图3中第三行的第6个字符和第7个字符上对应的标记。
当识别到目标图像31中的删除标记时,可以根据预先建立的修正标记与修正符号之间的对应关系,确定该删除标记对应的修正符号(或者也可以称为修正编码),例如:删除标记对应修正符号“@@”;当识别到目标图像31中的调整顺序标记时,可以根据预先建立的修正标记与修正符号之间的对应关系,确定该调整顺序标记对应的修正符号,例如:调整顺序标记对应修正符号“^”,则识别得到目标图像31中的第一行内容对应的字符信息为“随笔”;识别得到目标图像31中的第二行内容对应的字符信息为“今天的天气真的是很好,@@情晴空万里,”;识别得到目标图像31中的第三行内容对应的字符信息为“我和我的小伴^伙们去公园玩儿,我和小伙伴”;识别得到目标图像31中的第四行内容对应的字符信息为“在一起玩的很开心。”。
可选的,针对目标图像31中的空格,也可以通过相应的符号进行标记,如一个空格可以通过一个符号“·”来标记,具体可参见以上实施例所述,这里不再赘述。
如图4所示,给出了又一种目标图像41的示例,在该目标图像41中包含有删除标记,如图4中第二行的第12个字符;该目标图像41中还包含有着重号标记,如图4中第一行的第3个字符到第7个字符上的下划线标记。
当识别到目标图像41中的删除标记时,可以根据预先建立的修正标记与修正符号之间的对应关系,确定该删除标记对应的修正符号(或者也可以称为修正编码),例如:删除标记对应修正符号“@@”;当识别到目标图像41中的着重号标记(如图4中的下划线)时,可以根据预先建立的修正标记与修正符号之间的对应关系,确定该下划线的着重号标记对应的修正符号,例如:下划线的着重号标记对应修正符号“&&”;则识别得到目标图像41中的第一行内容对应的字符信息为“随笔&&3月27日”;识别得到目标图像41中的第二行内容对应的字符信息为“今天的天气真的是很好,@@情晴空万里,”;识别得到目标图像41中的第三行内容对应的字符信息为“我和我的小伙伴们去公园玩儿,我和小伙伴”;识别得到目标图像41中的第四行内容对应的字符信息为“在一起玩的很开心。”。
可选的,针对目标图像41中的空格,也可以通过相应的符号进行标记,如一个空格可以通过一个符号“·”来标记,具体可参见以上实施例所述,这里不再赘述。
需要说明的是,修正标记与修正符号之间的对应关系可以预先建立,具体的修正标记对应的符号还可以是除上述示例以外的其他符号形式,本发明实施例不做具体限定。
该实施例中,在识别目标图像中的字符的过程中,通过针对文字、字母、数字、运算符号、标点符号等字符进行识别的基础上,还能够针对目标图像中的修正标记进行识别,并通过将识别到的修正标记以编码的形式进行标记的方式,实现了针对目标图像中的修正标记的识别处理。
可选的,根据以上至少一个实施例,上述识别目标图像中的字符,得到初始字符信息的步骤,可以具体包括:
识别所述目标图像中的字符以及所述字符对应的定位信息;
根据识别到的所述字符以及所述字符对应的定位信息,确定所述初始字符信息。
可选的,作为一种实现方式:可以将目标图像中的字符划分为多个区域,例如:可以按照目标图像中的字符排版顺序划分区域,如字符顺序为横版排列,则可以将一行字符划分为一个区域,若字符顺序为竖版排列,则可以按照一列字符划分为一个区域。
如图5所示,目标图像51以横版排列为例,识别每一行字符的内容以及每一行字符对应的定位框52的坐标。例如:第一行的定位框坐标以及对应的字符内容为“1039,608,1510,608,1510,754,1039,754,随笔”;第二行的定位框坐标以及对应的字符内容为“662,777,2177,777,2177,923,662,923,今天的天气真的是很好,@@情晴空万里,”;第三行的定位框坐标以及对应的字符内容为“433,924,2177,951,2177,1067,433,1067,我和我的小伴^伙们去公园玩儿,我和小伙伴”;第四行的定位框坐标以及对应的字符内容为“433,1113,1565,1113,1565,1259,433,1259,在一起玩的很开心。”。
可选的,作为另一种实现方式:还可以针对目标图像中的每个字符划分为一个区域,例如:针对每个字符生成一个定位框,通过该每个字符对应的定位框的坐标作为对应的定位信息。
需要说明的是,本发明实施例中的定位框坐标以及对应的字符内容仅为示例性说明,当然本发明实施例中的定位信息的确定方式还可以采用除此之外的其他形式,本发明实施例不以此为限。
可选的,根据以上至少一个实施例,所述对所述初始字符信息进行修正处理,得到目标字符信息的步骤,可以具体包括:
根据所述修正符号,对所述初始字符信息中的第一目标字符进行修正处理,得到M个字符,M为正整数;所述第一目标字符为:所述修正符号对应的字符;
更新所述M个字符对应的定位信息;
根据所述M个字符以及更新后的所述M个字符对应的定位信息,确定所述目标字符信息。
可选的,所述第一目标字符为:所述修正符号对应的字符;如:该第一目标字符可以对应于目标图像中的修正标记,如:针对目标图像中的删除标记仅能识别到该删除标记并不能识别到其对应删除的字符,则该第一目标字符为所述修正标记对应的修正字符;又如:针对目标图像中的删除标记既能够识别到该删除标记,又能够识别到其对应删除的字符,则该第一目标字符为所述修正标记对应的修正字符以及所删除的字符。
其中,初始字符信息包括有N个字符;N和M均为正整数,N与M可以相同或不同,例如:在所述修正处理为增加字符的情况下,M可能大于N;在所述修正处理为删除字符的情况下,M可能小于N;在所述修正处理为不处理字符数量或者存在增加字符和删除字符的情况下,M可能等于N。
例如:参见图5所示的目标图像51,针对第一行的定位框坐标以及对应的字符内容“1039,608,1510,608,1510,754,1039,754,随笔”由于字符内容更整洁,则可以不进行修正处理;
针对第二行的定位框坐标以及对应的字符内容“662,777,2177,777,2177,923,662,923,今天的天气真的是很好,@@情晴空万里,”,由于其字符内容中包含有删除符号“@@”,则删除字符内容“@@情”,这样由于第二行中删除了一个字符,则可以将第三行中的第一个字符调整至第二行中,即对第三行中的第一个字符对应的定位信息进行了调整,如调整后为“662,777,2177,777,2177,923,662,923,今天的天气真的是很好,@@情晴空万里,我”;
针对第三行的定位框坐标以及对应的字符内容“433,924,2177,951,2177,1067,433,1067,我和我的小伴^伙们去公园玩儿,我和小伙伴”;由于其第一个字符调整到了第二行中,且存在调整顺序符号“^”,则需要将第四行的第一个字符调整至第三行中,以及将调整顺序符号“^”对应的第六个字符“伴”和第七个字符“伙”的顺序调整,即调整后为“433,924,2177,951,2177,1067,433,1067,和我的小伙伴们去公园玩儿,我和小伙伴在”;
针对第四行的定位框坐标以及对应的字符内容“433,1113,1565,1113,1565,1259,433,1259,在一起玩的很开心。”,虽然其不存在修正符号,但是由于第一个字符调整至第三行中需要对第四行的定位框的坐标进行调整,即定位框的长度缩短。
需要说明的是,本发明实施例中的对所述初始字符信息进行修正处理的方式,以及对修正后得到的M个字符的定位信息进行更新的方式仅为示例性说明,当然本发明实施例中的对字符信息进行修正以及更新定位信息的方式还可以采用除此之外的其他形式,本发明实施例不以此为限。
该实施例中,通过对初始字符信息中的字符进行修正处理以及更新修正后得到的字符对应的定位信息的方式,可以修正初始字符信息中包含的无效字符(如删除标记、删除标记对应的字符等),从而保证包括有修正后得到的目标字符信息的目标文本信息的显示效果。
可选的,根据以上至少一个实施例,所述显示所述目标字符信息的目标文本信息的步骤,可以具体包括:
获取所述初始字符信息中的N个字符在所述目标图像中所占区域的第一尺寸;
根据所述第一尺寸和所述字符的数量N,确定一个所述字符对应的第二尺寸;
根据所述目标字符信息和所述第二尺寸,显示所述目标文本信息。
可选的,作为一种实现方式:可以是根据N个字符在所述目标图像中所占区域的面积以及字符的数量N,来确定一个字符所占的平均面积。
可选的,作为另一种实现方式:在采用上述实施例中确定定位框坐标作为定位信息的基础上,还可以根据定位框坐标来确定每行字符的长度,从而根据每行字符的长度以及相应的字符数量,来确定每行中一个字符对应的平均宽度;进一步在根据每行中一个字符的平均宽度,确定这N个字符中一个字符的平均宽度;或者,在确定定位框坐标作为定位信息的基础上,根据定位框坐标来确定这N个字符的总长度L,根据L和N确定一个字符对应的平均宽度Wch
可选的,作为再一种实现方式:在根据每个字符确定其对应的定位框坐标的基础上,可以通过每个定位框坐标确定各个字符对应的宽度,进而可以计算得到一个字符对应的平均宽度。
进一步地,可以根据修正后得到的目标字符信息中的字符数量M以及计算得到的一个所述字符对应的第二尺寸,更新每行字符对应的定位框的实际宽度和容纳的字符数量,将文本信息做合并处理;此外,针对图5所示的目标图像51,其第一行字符内容(如本文的主题)可以按照主题的排版方式进行排版,针对第二行对应的字符内容(段落的开头)可以根据段落开头的排版方式进行排版,如起始空出约两个字符宽度的位置,将修正后得到的M个字符进行重新排版,得到目标文本信息61,如图6所示。
需要说明的是,本发明实施例中的文本信息的处理方法处理可以针对包含有手写类文本的图像进行处理外,还可以针对包含有打印体文本的图像进行处理;此外,本发明实施例中的文本信息的处理方法可以是针对获得的目标图像进行处理,也可以是在扫描过程中进行处理。
还需要说明的是,本发明实施例中文本信息的处理方法中,除了可以对以上示例中的修正符号(如删除内容符号、调整内容顺序符号、增加内容符号、着重号标记符号等)进行处理外,还可以标识字符的颜色、字符的字体型号等特征,本发明实施例不以此为限。
如图7所示,本发明实施例还提供了一种电子设备700,包括:
识别模块710,用于识别目标图像中的字符,得到初始字符信息;所述初始字符信息中包含有修正符号;
修正模块720,用于对所述初始字符信息进行修正处理,得到目标字符信息;
显示模块730,用于显示包括有所述目标字符信息的目标文本信息。
可选的,所述识别模块710包括:
第一识别单元,用于在识别到所述目标图像中包含有修正标记的情况下,确定所述修正标记对应的修正符号;
第一确定单元,用于根据所述修正符号以及识别到的第一字符,确定所述初始字符信息;其中,所述第一字符为:所述目标图像中除所述修正标记外的所有字符。
可选的,所述识别模块710包括:
第二识别单元,用于识别所述目标图像中的字符以及所述字符对应的定位信息;
第二确定单元,用于根据识别到的所述字符以及所述字符对应的定位信息,确定所述初始字符信息。
可选的,所述修正模块720包括:
修正单元,用于根据所述修正符号,对所述初始字符信息中的第一目标字符进行修正处理,得到M个字符,M为正整数;所述第一目标字符为:所述修正符号对应的字符;
更新单元,用于更新所述M个字符对应的定位信息;
第三确定单元,用于根据所述M个字符以及更新后的所述M个字符对应的定位信息,确定所述目标字符信息。
可选的,所述显示模块730包括:
获取单元,用于获取所述初始字符信息中的N个字符在所述目标图像中所占区域的第一尺寸;
第四确定单元,用于根据所述第一尺寸和所述字符的数量N,确定一个所述字符对应的第二尺寸;
显示单元,用于根据所述目标字符信息和所述第二尺寸,显示所述目标文本信息。
本发明实施例提供的电子设备能够实现以上至少一个方法实施例中电子设备实现的各个过程,为避免重复,这里不再赘述。
本发明实施例中的电子设备700,通过识别目标图像中的字符,得到包含有修正符号初始字符信息;并对所述初始字符信息进行修正处理,得到目标字符信息,从而显示包括有所述目标字符信息的目标文本信息;这样,通过针对包含有修正符号的初始字符信息进行修正处理,使得所显示的目标文本信息更整洁,从而保证针对手写文本等图片或纸张中的字符进行识别重建后生成的文本信息的显示效果。
图8为实现本发明各个实施例的一种电子设备的硬件结构示意图。
该电子设备800包括但不限于:射频单元801、网络模块802、音频输出单元803、输入单元804、传感器805、显示单元806、用户输入单元807、接口单元808、存储器809、处理器810、以及电源811等部件。本领域技术人员可以理解,图8中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,处理器810,用于识别目标图像中的字符,得到初始字符信息;所述初始字符信息中包含有修正符号;对所述初始字符信息进行修正处理,得到目标字符信息;显示包括有所述目标字符信息的目标文本信息。
本发明实施例中的电子设备800,通过识别目标图像中的字符,得到包含有修正符号初始字符信息;并对所述初始字符信息进行修正处理,得到目标字符信息,从而显示包括有所述目标字符信息的目标文本信息。这样,通过针对包含有修正符号的初始字符信息进行修正处理,使得所显示的目标文本信息更整洁,从而保证针对手写文本等图片或纸张中的字符进行识别重建后生成的文本信息的显示效果。
应理解的是,本发明实施例中,射频单元801可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器810处理;另外,将上行的数据发送给基站。通常,射频单元801包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元801还可以通过无线通信系统与网络和其他设备通信。
电子设备通过网络模块802为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元803可以将射频单元801或网络模块802接收的或者在存储器809中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元803还可以提供与电子设备800执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元803包括扬声器、蜂鸣器以及受话器等。
输入单元804用于接收音频或视频信号。输入单元804可以包括图形处理器(Graphics Processing Unit,GPU)8041和麦克风8042,图形处理器8041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元806上。经图形处理器8041处理后的图像帧可以存储在存储器809(或其它存储介质)中或者经由射频单元801或网络模块802进行发送。麦克风8042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元801发送到移动通信基站的格式输出。
电子设备800还包括至少一种传感器805,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板8061的亮度,接近传感器可在电子设备800移动到耳边时,关闭显示面板8061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器805还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元806用于显示由用户输入的信息或提供给用户的信息。显示单元806可包括显示面板8061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板8061。
用户输入单元807可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元807包括触控面板8071以及其他输入设备8072。触控面板8071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板8071上或在触控面板8071附近的操作)。触控面板8071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器810,接收处理器810发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板8071。除了触控面板8071,用户输入单元807还可以包括其他输入设备8072。具体地,其他输入设备8072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板8071可覆盖在显示面板8061上,当触控面板8071检测到在其上或附近的触摸操作后,传送给处理器810以确定触摸事件的类型,随后处理器810根据触摸事件的类型在显示面板8061上提供相应的视觉输出。虽然在图8中,触控面板8071与显示面板8061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板8071与显示面板8061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元808为外部装置与电子设备800连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元808可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备800内的一个或多个元件或者可以用于在电子设备800和外部装置之间传输数据。
存储器809可用于存储软件程序以及各种数据。存储器809可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器809可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器810是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器809内的软件程序和/或模块,以及调用存储在存储器809内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器810可包括一个或多个处理单元;优选的,处理器810可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器810中。
电子设备800还可以包括给各个部件供电的电源811(比如电池),优选的,电源811可以通过电源管理系统与处理器810逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备800包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种电子设备,包括处理器810,存储器809,存储在存储器809上并可在所述处理器810上运行的计算机程序,该计算机程序被处理器810执行时实现上述文本信息的处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述文本信息的处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (12)

1.一种文本信息的处理方法,应用于电子设备,其特征在于,所述方法包括:
识别目标图像中的字符,得到初始字符信息;所述初始字符信息中包含有修正符号;
对所述初始字符信息进行修正处理,得到目标字符信息;
显示包括有所述目标字符信息的目标文本信息。
2.根据权利要求1所述的文本信息的处理方法,其特征在于,所述识别目标图像中的字符,得到初始字符信息,包括:
在识别到所述目标图像中包含有修正标记的情况下,确定所述修正标记对应的修正符号;
根据所述修正符号以及识别到的第一字符,确定所述初始字符信息;其中,所述第一字符为:所述目标图像中除所述修正标记外的所有字符。
3.根据权利要求1所述的文本信息的处理方法,其特征在于,所述识别目标图像中的字符,得到初始字符信息,包括:
识别所述目标图像中的字符以及所述字符对应的定位信息;
根据识别到的所述字符以及所述字符对应的定位信息,确定所述初始字符信息。
4.根据权利要求3所述的文本信息的处理方法,其特征在于,所述对所述初始字符信息进行修正处理,得到目标字符信息,包括:
根据所述修正符号,对所述初始字符信息中的第一目标字符进行修正处理,得到M个字符,M为正整数;所述第一目标字符为:所述修正符号对应的字符;
更新所述M个字符对应的定位信息;
根据所述M个字符以及更新后的所述M个字符对应的定位信息,确定所述目标字符信息。
5.根据权利要求1至4中任一项所述的文本信息的处理方法,其特征在于,所述显示包括有所述目标字符信息的目标文本信息,包括:
获取所述初始字符信息中的N个字符在所述目标图像中所占区域的第一尺寸;
根据所述第一尺寸和所述字符的数量N,确定一个所述字符对应的第二尺寸;
根据所述目标字符信息和所述第二尺寸,显示所述目标文本信息。
6.一种电子设备,其特征在于,包括:
识别模块,用于识别目标图像中的字符,得到初始字符信息;所述初始字符信息中包含有修正符号;
修正模块,用于对所述初始字符信息进行修正处理,得到目标字符信息;
显示模块,用于显示包括有所述目标字符信息的目标文本信息。
7.根据权利要求6所述的电子设备,其特征在于,所述识别模块包括:
第一识别单元,用于在识别到所述目标图像中包含有修正标记的情况下,确定所述修正标记对应的修正符号;
第一确定单元,用于根据所述修正符号以及识别到的第一字符,确定所述初始字符信息;其中,所述第一字符为:所述目标图像中除所述修正标记外的所有字符。
8.根据权利要求6所述的电子设备,其特征在于,所述识别模块包括:
第二识别单元,用于识别所述目标图像中的字符以及所述字符对应的定位信息;
第二确定单元,用于根据识别到的所述字符以及所述字符对应的定位信息,确定所述初始字符信息。
9.根据权利要求8所述的电子设备,其特征在于,所述修正模块包括:
修正单元,用于根据所述修正符号,对所述初始字符信息中的第一目标字符进行修正处理,得到M个字符,M为正整数;所述第一目标字符为:所述修正符号对应的字符;
更新单元,用于更新所述M个字符对应的定位信息;
第三确定单元,用于根据所述M个字符以及更新后的所述M个字符对应的定位信息,确定所述目标字符信息。
10.根据权利要求6至9中任一项所述的电子设备,其特征在于,所述显示模块包括:
获取单元,用于获取所述初始字符信息中的N个字符在所述目标图像中所占区域的第一尺寸;
第四确定单元,用于根据所述第一尺寸和所述字符的数量N,确定一个所述字符对应的第二尺寸;
显示单元,用于根据所述目标字符信息和所述第二尺寸,显示所述目标文本信息。
11.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的文本信息的处理方法的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的文本信息的处理方法的步骤。
CN202010247201.7A 2020-03-31 2020-03-31 一种文本信息的处理方法及电子设备 Active CN111461119B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010247201.7A CN111461119B (zh) 2020-03-31 2020-03-31 一种文本信息的处理方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010247201.7A CN111461119B (zh) 2020-03-31 2020-03-31 一种文本信息的处理方法及电子设备

Publications (2)

Publication Number Publication Date
CN111461119A true CN111461119A (zh) 2020-07-28
CN111461119B CN111461119B (zh) 2024-01-26

Family

ID=71681295

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010247201.7A Active CN111461119B (zh) 2020-03-31 2020-03-31 一种文本信息的处理方法及电子设备

Country Status (1)

Country Link
CN (1) CN111461119B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023222097A1 (zh) * 2022-05-20 2023-11-23 华为技术有限公司 一种文本识别方法及相关装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3231860A (en) * 1962-01-15 1966-01-25 Philco Corp Character position detection and correction system
CN109522862A (zh) * 2018-11-28 2019-03-26 科大讯飞股份有限公司 一种文档修正方法、装置、设备及可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3231860A (en) * 1962-01-15 1966-01-25 Philco Corp Character position detection and correction system
CN109522862A (zh) * 2018-11-28 2019-03-26 科大讯飞股份有限公司 一种文档修正方法、装置、设备及可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023222097A1 (zh) * 2022-05-20 2023-11-23 华为技术有限公司 一种文本识别方法及相关装置

Also Published As

Publication number Publication date
CN111461119B (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
CN107943390B (zh) 一种文字复制方法及移动终端
CN111586237B (zh) 一种图像显示方法及电子设备
CN110995919B (zh) 一种消息处理方法和电子设备
CN108132752B (zh) 一种文本编辑方法及移动终端
CN111445927B (zh) 一种音频处理方法及电子设备
CN111610904B (zh) 图标整理方法、电子设备及存储介质
CN108563392B (zh) 一种图标显示控制方法及移动终端
KR20220154763A (ko) 이미지 처리 방법 및 전자 장비
CN109815462B (zh) 一种文本生成方法及终端设备
CN111372029A (zh) 视频显示方法、装置及电子设备
CN109189303B (zh) 文本编辑方法及移动终端
CN108055399B (zh) 一种文本复制方法及移动终端
CN110928407B (zh) 信息显示方法及装置
JP7408627B2 (ja) 文字入力方法及び端末
CN109992753B (zh) 一种翻译处理方法及终端设备
CN111007980A (zh) 一种信息录入方法及终端设备
CN111461119B (zh) 一种文本信息的处理方法及电子设备
CN109714462B (zh) 一种电话号码的标记方法及其移动终端
CN111273827A (zh) 一种文本处理方法及电子设备
CN108509126B (zh) 一种图片处理方法及移动终端
CN108471549B (zh) 一种遥控方法及终端
CN110851219A (zh) 一种信息处理方法及电子设备
CN111599386B (zh) 录屏方法及录屏装置
CN111090484B (zh) 一种信息处理方法及电子设备
CN110865859B (zh) 图片显示方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant