CN111291572B - 一种文字排版方法、装置及计算机可读存储介质 - Google Patents

一种文字排版方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN111291572B
CN111291572B CN202010065137.0A CN202010065137A CN111291572B CN 111291572 B CN111291572 B CN 111291572B CN 202010065137 A CN202010065137 A CN 202010065137A CN 111291572 B CN111291572 B CN 111291572B
Authority
CN
China
Prior art keywords
text
typesetting
semantic
characters
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010065137.0A
Other languages
English (en)
Other versions
CN111291572A (zh
Inventor
宋肃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN202010065137.0A priority Critical patent/CN111291572B/zh
Publication of CN111291572A publication Critical patent/CN111291572A/zh
Application granted granted Critical
Publication of CN111291572B publication Critical patent/CN111291572B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请提供了一种文字排版方法、装置及计算机可读存储介质,该文字排版方法包括:对目标图片的文本区域进行文字识别;对所识别出的文字进行语义分析;基于语义分析结果对所有文字进行排版,生成文本文件。通过本申请方案的实施,对从图片中所识别出的文字进行语义分析,并基于语义分析结果来进行文字排版,节省了人工排版所需要投入的工作量,充分保证了所得到的文本文件的版面质量,有效提高了文本文件的可用性。

Description

一种文字排版方法、装置及计算机可读存储介质
技术领域
本申请涉及电子技术领域,尤其涉及一种文字排版方法、装置及计算机可读存储介质。
背景技术
在信息交互越来越频繁的现代社会,很多情况下我们需要将图片中的文字内容进行文本生成,以便于后续进行文本编辑。
目前,通常采用OCR(Optical Character Recognition,光学字符识别)技术来进行图片中的文字识别,相关技术中在识别出文字之后,根据图片中原有的版面信息来对所识别出的文字进行排版,最终得到文本文件(例如word文档、txt文档)。然而在实际应用中,在图片中原始版面的版面质量较差时,按照此方式所得到的文本文件的版面质量也相对较差,不利于后续使用。
发明内容
本申请实施例提供了一种文字排版方法、装置及计算机可读存储介质,至少能够解决相关技术中直接按照图片中原有的版面信息来对所识别出的文字进行排版,所导致的所得到的文本文件的版面质量不能得到充分保证、可用性较差的问题。
本申请实施例第一方面提供了一种文字排版方法,包括:
对目标图片的文本区域进行文字识别;
对所识别出的文字进行语义分析;
基于语义分析结果对所有文字进行排版,生成文本文件。
本申请实施例第二方面提供了一种文字排版装置,包括:
识别模块,用于对目标图片的文本区域进行文字识别;
分析模块,用于对所识别出的文字进行语义分析;
排版模块,用于基于语义分析结果对所有文字进行排版,生成文本文件。
本申请实施例第三方面提供了一种电子装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现上述本申请实施例第一方面提供的文字排版方法中的各步骤。
本申请实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,实现上述本申请实施例第一方面提供的文字排版方法中的各步骤。
由上可见,根据本申请方案所提供的文字排版方法、装置及计算机可读存储介质,对目标图片的文本区域进行文字识别;对所识别出的文字进行语义分析;基于语义分析结果对所有文字进行排版,生成文本文件。通过本申请方案的实施,对从图片中所识别出的文字进行语义分析,并基于语义分析结果来进行文字排版,节省了人工排版所需要投入的工作量,充分保证了所得到的文本文件的版面质量,有效提高了文本文件的可用性。
附图说明
图1为本申请第一实施例提供的文字排版方法的基本流程示意图;
图2为本申请第一实施例提供的一种文字识别方法的流程示意图;
图3为本申请第一实施例提供的一种列表格式排版方法的流程示意图;
图4为本申请第一实施例提供的一种目录格式排版方法的流程示意图;
图5为本申请第二实施例提供的文字排版方法的细化流程示意图;
图6为本申请第三实施例提供的一种文字排版装置的程序模块示意图;
图7为本申请第三实施例提供的另一种文字排版装置的程序模块示意图;
图8为本申请第四实施例提供的电子装置的结构示意图。
具体实施方式
为使得本申请的发明目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了解决相关技术中直接按照图片中原有的版面信息来对所识别出的文字进行排版,所导致的所得到的文本文件的版面质量不能得到充分保证、可用性较差的缺陷,本申请第一实施例提供了一种文字排版方法,如图1为本实施例提供的文字排版方法的基本流程图,该文字排版方法包括以下的步骤:
步骤101、对目标图片的文本区域进行文字识别。
具体的,文字识别是从图片中提取文字区域的图像,然后再由文字区域的图像转换为纯文字的过程,在本实施例中,目标图片中包含有文字内容,这里的目标图片可以是扫描文件、照片等,而照片又可以分为终端中所存储的照片或实时拍摄的照片,照片的一种具体实现可以为会议记录照片。
应当说明的是,本实施例可以采用连接文本提议网络(CTPN,Connectionist TextProposal Network)作为ORC文本检测模型,来对目标图片中的文本区域进行检测,并且,可以采用卷积循环神经网络(CRNN,Convolutional Recurrent Neural Network)作为ORC文本识别模型,来对所检测的文本区域进行文本识别。
此外,还应当说明的是,在实际应用中,在对图片进行文字识别时,为了保证识别的准确性和有效性,通常对图片的质量有所要求,例如要求整体的背景与文字部分的色差和亮度辨识度较高等,基于此,本实施例在对目标图片的文本区域进行文字识别之前,还包括:判断目标图片的图片质量是否满足预设的文字识别条件;若是,则执行对目标图片的文本区域进行文字识别的步骤;若否,则对目标图片进行质量优化处理,然后再执行对目标图片的文本区域进行文字识别的步骤。本实施例的质量优化处理可以包括矫正、去噪、增强等处理方式,在此不作唯一限定。
步骤102、对所识别出的文字进行语义分析。
具体的,在本实施例中,对于每一个文本区域识别出来的文字,可以采用基于Transformer的双向编码器表征(BERT,Bidirectional Encoder Representation fromTransformers)进行语义提取,以对所识别出的文字的表达意图进行理解。
在本实施例的一些实施方式中,在对所识别出的文字进行语义分析之前,还包括:评估目标图片的原始文字版式的规范程度;在规范程度低于预设的程度阈值时,执行对所识别出的文字进行语义分析的步骤;在规范程度高于程度阈值时,按照原始文字版式对所有文字进行排版,生成文本文件。
具体的,在实际应用中,当图片中的原始文字版式不能满足用户需求时,通常则需要对所识别出的文字进行重新排版,而在原始文字版式可以满足用户需求时,则可以直接按照原始文字版式对所识别出的文字进行排版即可。应当理解的是,本实施例通过原始文字版式的规范程度评估结果来对是否可满足用户需求来进行衡量。本实施例通过规范程度评估结果来选择对应的排版方式进行文字排版,可以良好的适应于实际应用场景,在保证文本文件的质量的同时,还可以有效避免不必要的处理性能浪费。
步骤103、基于语义分析结果对所有文字进行排版,生成文本文件。
具体的,本实施例根据所提取的语义来对识别出来的文字进行智能排版,并输出排版好的文本文件,例如word文件或txt文件,而并不需要人工根据文字的内容来对识别出来的文字进行整理和排版,可以有效节省工作量。应当说明的是,在目标图片中具有多个文字区域时,在一种实现中,可以基于语义分析结果先分别对各个文字区域内部的文字进行排版,然后再对所有文字区域的排版进行并列,而在另一种实现中,则可以将所有文字区域中的文字均作为一个整体,一次性进行排版。
在本实施例的一些实施方式中,在基于语义分析结果对所有文字进行排版,生成文本文件之后,还包括:在接收到文本文件预览指令时,在预览界面上显示效果编辑选项;在通过效果编辑选项接收到效果编辑指令时,采用对应于效果编辑指令的效果元素对文本文件进行编辑,得到编辑完成的文本文件。
具体的,在本实施例中,在生成文本文件之后,为了增强文本文件的整体表现力,还可以向外部提供效果编辑功能,以根据外部输入的效果编辑指令来对文本文件进行后期处理,例如对特定段落进行突出显示(例如加黑加粗)等。应当说明的是,本实施例中的效果编辑对象可以包括文本文件中的字、词、句、段等,而效果元素则可以包括突出显示元素、水印元素、页码元素等。
如图2所示为本实施例提供的一种文字识别方法的流程示意图,在本实施例的一些实施方式中,对目标图片的文本区域进行文字识别具体包括以下步骤:
步骤201、检测目标图片中的所有文本区域,并获取各文本区域的属性信息;
步骤202、基于属性信息从所有文本区域中确定目标文本区域;
步骤203、对目标文本区域进行文字识别。
具体的,在实际应用中,目标图片中可以包括多个文本区域,而在进行文字识别时,可以对所有文本区域均进行文字识别,也可以仅对部分文本区域进行文字识别。本实施例基于部分文本区域的文字内容(例如草稿内容、反复涂改内容)的实际可用性较差,而对其进行识别则会造成处理性能的浪费以及文字识别效率的降低,对所有文本区域进行条件判断,也即基于各文本区域的属性信息对其文字内容的实际可用性进行评估,然后选择出目标文本区域执行文字识别。应当理解的是,本实施例的属性信息可以包括区域布局位置、区域文字版式的规范程度、区域清晰程度等。
在本实施例的一些实施方式中,对所识别出的文字进行语义分析包括:分别提取所识别出的各行文字的行语义特征;基于行语义特征分析行内及行间的行语义关联性。相对应的,基于语义分析结果对所有文字进行排版包括:基于行语义关联性的分析结果对所有行文字进行分段排版;其中,分段排版包括:将同一行文字拆分为不同段、将不同行文字合并为整段。
具体的,在对所识别出的文字进行排版时,可以基于每行文字的语义特征进行分段,其中,对于每一行文字,可以使用BERT提取此行文字的语义特征来判断是否是连贯的一句话,如果是,就作为单独的一个段落,如果不是,根据语意将其拆分为不同的段落。此外,从第二段开始判断其与前一段落的关联关系,使用BERT提取两段文字的语义特征,并判断两段文字是否属于连贯的一句话,如果是,则合并为一个整体段落。
如图3如本实施例提供的一种列表格式排版方法的流程示意图,在本实施例的一些实施方式中,在基于行语义关联性的分析结果对所有行文字进行分段排版之后,还具体包括以下步骤:
步骤301、提取分段排版后所得到的所有文字段落中,具有列表标识符的文字段落;
步骤302、基于标识符类型分析所有列表标识符之间的标识符关联性;
步骤303、基于标识符关联性的分析结果,对所有具有关联列表标识符的文字段落进行列表格式排版。
具体的,在本实施例中,对分段之后所得到的每一段文字,判断其中是否含有表示列表格式的字符,比如有序列表或无序列表的列表标识符,其中,有序列表的列表标识符可以为1、2、3或A、B、C等字符标识,而无序列表的列表标识符则可以为圆圈或者五角星等图形标识,然后找到所有包含表示列表格式的字符的段落,并按照列表标志符把相应段落的文字内容恢复成相应的列表格式,并可以把每个列表整体作为一个新的段落。
如图4为本实施例提供的一种目录格式排版方法的流程示意图,在本实施例的一些实施方式中,在基于行语义关联性的分析结果对所有行文字进行分段排版之后,还具体包括以下步骤:
步骤401、分别提取分段排版后所得到的所有文字段落的段落语义特征;
步骤402、基于段落语义特征分析段落间的段落语义关联性;
步骤403、基于段落语义关联性的分析结果,将关联文字段落归置为关联段落集合,并确定各关联段落集合中各关联文字段落的目录级别;
步骤404、基于所确定的目录级别,对所有文字段落进行目录格式排版。
具体的,本实施例根据语义特征判断所有段落之间的关联关系,找到相关联的段落组成段落集合,根据相关段落集合中段落之间的关系和此段落与段落集合中段落的关系来为此段落设定合适的目录级别并合理的调整其位置。其中,两个段落之间的关系包括并列、包含和没有关系,如果是并列关系,则两个段落属于同一目录级别,如果是包含关系,例如A段落包含B段落,则B段落属于A段落的下一级,如果此段落与前面所有段落都没有关系,则设定此段落为一级目录。应当说明的是,在实际应用中,为了保证目录级别编排的效率,可以先定义一个基准段落,例如将首段作为基准段落,来将其设置为一级目录,然后从第二段起依次基于已编排目录的段落进行目录编排。
基于上述本申请实施例的技术方案,对目标图片的文本区域进行文字识别;对所识别出的文字进行语义分析;基于语义分析结果对所有文字进行排版,生成文本文件。通过本申请方案的实施,对从图片中所识别出的文字进行语义分析,并基于语义分析结果来进行文字排版,节省了人工排版所需要投入的工作量,充分保证了所得到的文本文件的版面质量,有效提高了文本文件的可用性。
图5中的方法为本申请第二实施例提供的一种细化的文字排版方法,该文字排版方法包括:
步骤501、对目标图片的所有文本区域进行文字识别,并对所识别出的文字进行语义分析。
在本实施例中,文字识别是从图片中提取文字区域的图像,然后再由文字区域的图像转换为纯文字的过程,而语义分析则是对于每一个文本区域识别出来的文字进行语义提取,以对所识别出的文字的表达意图进行理解。
步骤502、分别提取所识别出的各行文字的行语义特征,并基于行语义特征分析行内及行间的行语义关联性。
步骤503、基于行语义关联性的分析结果对所有行文字进行分段排版。
在本实施例中,分段排版包括:将同一行文字拆分为不同段、将不同行文字合并为整段。在对所识别出的文字进行排版时,可以基于每行文字的语义特征进行分段,其中,对于每一行文字,可以提取此行文字的语义特征来判断是否是连贯的一句话,如果是,就作为单独的一个段落,如果不是,根据语意将其拆分为不同的段落。此外,从第二段开始判断其与前一段落的关联关系,使用BERT提取两段文字的语义特征,并判断两段文字是否属于连贯的一句话,如果是,则合并为一个整体段落。
步骤504、提取分段排版后所得到的所有文字段落中,具有列表标识符的文字段落。
步骤505、基于标识符类型分析所有列表标识符之间的标识符关联性,并基于标识符关联性的分析结果,对所有具有关联列表标识符的文字段落进行列表格式排版。
在本实施例中,对分段之后所得到的每一段文字,判断其中是否含有表示列表格式的字符,比如有序列表或无序列表的列表标识符,然后找到所有包含表示列表格式的字符的段落,并按照列表标志符把相应段落的文字内容恢复成相应的列表格式,最后再把每个列表整体合为一个新的段落。
步骤506、分别提取列表格式排版后所得到的所有文字段落的段落语义特征,并基于段落语义特征分析段落间的段落语义关联性。
步骤507、基于段落语义关联性的分析结果,将关联文字段落归置为关联段落集合,并确定各关联段落集合中各关联文字段落的目录级别。
在本实施例中,根据语义特征判断所有段落之间的关联关系,找到相关联的段落组成段落集合。
步骤508、基于所确定的目录级别,对所有文字段落进行目录格式排版,生成文本文件。
在本实施例中,根据相关段落集合中段落之间的关系和此段落与段落集合中段落的关系来为此段落设定合适的目录级别并合理的调整其位置。其中,两个段落之间的关系包括并列、包含和没有关系,如果是并列关系,则两个段落属于同一目录级别,如果是包含关系,则被包含的子段落属于母段落的下一级,如果此段落与前面所有段落都没有关系,则设定此段落为一级目录。
应当理解的是,本实施例中各步骤的序号的大小并不意味着步骤执行顺序的先后,各步骤的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成唯一限定。
本申请实施例公开了一种文字排版方法,对目标图片的文本区域进行文字识别;对所识别出的文字进行语义分析;基于语义分析结果对所有文字进行排版,生成文本文件。通过本申请方案的实施,对从图片中所识别出的文字进行语义分析,并基于语义分析结果来进行文字排版,节省了人工排版所需要投入的工作量,充分保证了所得到的文本文件的版面质量,有效提高了文本文件的可用性;此外,本实施例先对所识别出的文字进行分段排版,再进行列表格式排版,最后再进行目录格式排版,采用这种组合排版方式可以提高文本整理的全面性,更为有效的保证了文本文件的条理性和逻辑性。
图6为本申请第三实施例提供的一种文字排版装置。该文字排版装置可用于实现前述实施例中的文字排版方法。如图6所示,该文字排版装置主要包括:
识别模块601,用于对目标图片的文本区域进行文字识别;
分析模块602,用于对所识别出的文字进行语义分析;
排版模块603,用于基于语义分析结果对所有文字进行排版,生成文本文件。
在本实施例一些实施方式中,分析模块602具体用于:分别提取所识别出的各行文字的行语义特征;基于行语义特征分析行内及行间的行语义关联性。相对应的,排版模块603具体用于:基于行语义关联性的分析结果对所有行文字进行分段排版;其中,分段排版包括:将同一行文字拆分为不同段、将不同行文字合并为整段。
进一步地,在本实施例一些实施方式中,分析模块602还用于:在基于行语义关联性的分析结果对所有行文字进行分段排版之后,提取分段排版后所得到的所有文字段落中,具有列表标识符的文字段落;基于标识符类型分析所有列表标识符之间的标识符关联性。相对应的,排版模块603还用于:基于标识符关联性的分析结果,对所有具有关联列表标识符的文字段落进行列表格式排版。
进一步地,在本实施例一些实施方式中,分析模块602还用于:在基于行语义关联性的分析结果对所有行文字进行分段排版之后,分别提取分段排版后所得到的所有文字段落的段落语义特征;基于段落语义特征分析段落间的段落语义关联性;基于段落语义关联性的分析结果,将关联文字段落归置为关联段落集合,并确定各关联段落集合中各关联文字段落的目录级别。相对应的,排版模块603还用于:基于所确定的目录级别,对所有文字段落进行目录格式排版。
如图7所示为本实施例提供的另一种文字排版装置,在本实施例一些实施方式中,文字排版装置还包括:评估模块604,用于:在对所识别出的文字进行语义分析之前,评估目标图片的原始文字版式的规范程度。相对应的,在规范程度低于预设的程度阈值时,触发识别模块601执行对所识别出的文字进行语义分析的功能;而在规范程度高于程度阈值时,则触发排版模块603执行按照原始文字版式对所有文字进行排版,生成文本文件的功能。
请再次参阅图7,在本实施例的一些实施方式中,文字排版装置还包括:编辑模块605,用于在基于语义分析结果对所有文字进行排版,生成文本文件之后,在接收到文本文件预览指令时,在预览界面上显示效果编辑选项;在通过效果编辑选项接收到效果编辑指令时,采用对应于效果编辑指令的效果元素对文本文件进行编辑,得到编辑完成的文本文件。
在本实施例的一些实施方式中,识别模块601具体用于:检测目标图片中的所有文本区域,并获取各文本区域的属性信息;基于属性信息从所有文本区域中确定目标文本区域;对目标文本区域进行文字识别。
应当说明的是,第一、二实施例中的文字排版方法均可基于本实施例提供的文字排版装置实现,所属领域的普通技术人员可以清楚的了解到,为描述的方便和简洁,本实施例中所描述的文字排版装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
根据本实施例所提供的文字排版装置,对目标图片的文本区域进行文字识别;对所识别出的文字进行语义分析;基于语义分析结果对所有文字进行排版,生成文本文件。通过本申请方案的实施,对从图片中所识别出的文字进行语义分析,并基于语义分析结果来进行文字排版,节省了人工排版所需要投入的工作量,充分保证了所得到的文本文件的版面质量,有效提高了文本文件的可用性。
请参阅图8,图8为本申请第四实施例提供的一种电子装置。该电子装置可用于实现前述实施例中的文字排版方法。如图8所示,该电子装置主要包括:
存储器801、处理器802、总线803及存储在存储器801上并可在处理器802上运行的计算机程序,存储器801和处理器802通过总线803连接。处理器802执行该计算机程序时,实现前述实施例中的文字排版方法。其中,处理器的数量可以是一个或多个。
存储器801可以是高速随机存取记忆体(RAM,Random Access Memory)存储器,也可为非不稳定的存储器(non-volatile memory),例如磁盘存储器。存储器801用于存储可执行程序代码,处理器802与存储器801耦合。
进一步的,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是设置于上述各实施例中的电子装置中,该计算机可读存储介质可以是前述图8所示实施例中的存储器。
该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现前述实施例中的文字排版方法。进一步的,该计算机可存储介质还可以是U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的可读存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上为对本申请所提供的文字排版方法、装置及计算机可读存储介质的描述,对于本领域的技术人员,依据本申请实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

Claims (6)

1.一种文字排版方法,其特征在于,包括:
对目标图片的文本区域进行文字识别;所述对目标图片的文本区域进行文字识别包括:
检测所述目标图片中的所有文本区域,并获取各文本区域的属性信息;
基于所述属性信息从所述所有文本区域中确定目标文本区域;
对所述目标文本区域进行文字识别;
对所识别出的文字进行语义分析;所述对所识别出的文字进行语义分析包括:
分别提取所识别出的各行文字的行语义特征;
基于所述行语义特征分析行内及行间的行语义关联性;
基于语义分析结果对所有文字进行排版,生成文本文件;所述基于语义分析结果对所有文字进行排版包括:
基于所述行语义关联性的分析结果对所有行文字进行分段排版;其中,所述分段排版包括:将同一行文字拆分为不同段、将不同行文字合并为整段;
所述基于所述行语义关联性的分析结果对所有行文字进行分段排版之后,还包括:
提取分段排版后所得到的所有文字段落中,具有列表标识符的文字段落;
基于标识符类型分析所有所述列表标识符之间的标识符关联性;
基于所述标识符关联性的分析结果,对所有具有关联列表标识符的文字段落进行列表格式排版;
所述基于所述行语义关联性的分析结果对所有行文字进行分段排版之后,还包括:
分别提取分段排版后所得到的所有文字段落的段落语义特征;
基于所述段落语义特征分析段落间的段落语义关联性;
基于所述段落语义关联性的分析结果,将关联文字段落归置为关联段落集合,并确定各所述关联段落集合中各所述关联文字段落的目录级别;
基于所确定的所述目录级别,对所述所有文字段落进行目录格式排版。
2.根据权利要求1所述的文字排版方法,其特征在于,所述对所识别出的文字进行语义分析之前,还包括:
评估所述目标图片的原始文字版式的规范程度;
在所述规范程度低于预设的程度阈值时,执行所述对所识别出的文字进行语义分析的步骤;
在所述规范程度高于所述程度阈值时,按照所述原始文字版式对所有文字进行排版,生成文本文件。
3.根据权利要求1至2中任意一项所述的文字排版方法,其特征在于,所述基于语义分析结果对所有文字进行排版,生成文本文件之后,还包括:
在接收到文本文件预览指令时,在预览界面上显示效果编辑选项;
在通过所述效果编辑选项接收到效果编辑指令时,采用对应于所述效果编辑指令的效果元素对所述文本文件进行编辑,得到编辑完成的文本文件。
4.一种文字排版装置,其特征在于,包括:
识别模块,用于对目标图片的文本区域进行文字识别;所述对目标图片的文本区域进行文字识别包括:
检测所述目标图片中的所有文本区域,并获取各文本区域的属性信息;
基于所述属性信息从所述所有文本区域中确定目标文本区域;
对所述目标文本区域进行文字识别;
分析模块,用于对所识别出的文字进行语义分析;所述对所识别出的文字进行语义分析包括:
分别提取所识别出的各行文字的行语义特征;
基于所述行语义特征分析行内及行间的行语义关联性;
排版模块,用于基于语义分析结果对所有文字进行排版,生成文本文件;所述基于语义分析结果对所有文字进行排版包括:
基于所述行语义关联性的分析结果对所有行文字进行分段排版;其中,所述分段排版包括:将同一行文字拆分为不同段、将不同行文字合并为整段;
所述基于所述行语义关联性的分析结果对所有行文字进行分段排版之后,还包括:
提取分段排版后所得到的所有文字段落中,具有列表标识符的文字段落;
基于标识符类型分析所有所述列表标识符之间的标识符关联性;
基于所述标识符关联性的分析结果,对所有具有关联列表标识符的文字段落进行列表格式排版;
所述基于所述行语义关联性的分析结果对所有行文字进行分段排版之后,还包括:
分别提取分段排版后所得到的所有文字段落的段落语义特征;
基于所述段落语义特征分析段落间的段落语义关联性;
基于所述段落语义关联性的分析结果,将关联文字段落归置为关联段落集合,并确定各所述关联段落集合中各所述关联文字段落的目录级别;
基于所确定的所述目录级别,对所述所有文字段落进行目录格式排版。
5.一种电子装置,包括:存储器、处理器及总线,其特征在于,所述总线用于实现所述存储器、处理器之间的连接通信;所述处理器用于执行存储在所述存储器上的计算机程序,所述处理器执行所述计算机程序时,实现权利要求1至3中任意一项所述方法中的步骤。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1至3中的任意一项所述方法中的步骤。
CN202010065137.0A 2020-01-20 2020-01-20 一种文字排版方法、装置及计算机可读存储介质 Active CN111291572B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010065137.0A CN111291572B (zh) 2020-01-20 2020-01-20 一种文字排版方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010065137.0A CN111291572B (zh) 2020-01-20 2020-01-20 一种文字排版方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111291572A CN111291572A (zh) 2020-06-16
CN111291572B true CN111291572B (zh) 2023-06-09

Family

ID=71026203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010065137.0A Active CN111291572B (zh) 2020-01-20 2020-01-20 一种文字排版方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111291572B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111723555B (zh) * 2020-06-22 2022-02-08 稿定(厦门)科技有限公司 平面排版方法及系统
CN111859893B (zh) * 2020-07-30 2021-04-09 广州云从洪荒智能科技有限公司 图文排版方法、装置、设备及介质
CN113221901A (zh) * 2021-05-06 2021-08-06 中国人民大学 一种面向不成熟自检系统的图片识字转化方法及系统
CN113221507B (zh) * 2021-05-28 2022-02-11 掌阅科技股份有限公司 文档编辑操作同步方法、计算设备及存储介质
CN114155530A (zh) * 2021-11-10 2022-03-08 北京中科闻歌科技股份有限公司 文本识别及问答方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1788305A (zh) * 2003-06-19 2006-06-14 国际商业机器公司 使用语义分析配置语音阅读器的系统和方法
CN103810485A (zh) * 2014-01-22 2014-05-21 深圳市东信时代信息技术有限公司 识别装置、文字识别系统及方法
CN105701082A (zh) * 2016-01-13 2016-06-22 刘敏 演示文档的自动排版方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1788305A (zh) * 2003-06-19 2006-06-14 国际商业机器公司 使用语义分析配置语音阅读器的系统和方法
CN103810485A (zh) * 2014-01-22 2014-05-21 深圳市东信时代信息技术有限公司 识别装置、文字识别系统及方法
CN105701082A (zh) * 2016-01-13 2016-06-22 刘敏 演示文档的自动排版方法及系统

Also Published As

Publication number Publication date
CN111291572A (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
CN111291572B (zh) 一种文字排版方法、装置及计算机可读存储介质
WO2019200783A1 (zh) 动态图表类页面数据爬取方法、装置、终端及存储介质
CN107729526B (zh) 一种文本结构化的方法
WO2011085562A1 (en) System and method for automatically extracting metadata from unstructured electronic documents
JP7244223B2 (ja) 電子文書における強調テキストの識別
CN110738033B (zh) 报告模板生成方法、装置及存储介质
CN112784009A (zh) 一种主题词挖掘方法、装置、电子设备及存储介质
CN110532449B (zh) 一种业务文档的处理方法、装置、设备和存储介质
CN115828874A (zh) 基于图像识别技术的行业表格数字化处理方法
CN114155547B (zh) 一种图表识别方法、装置、设备及存储介质
CN114579796B (zh) 机器阅读理解方法及装置
CN114492365A (zh) 二进制文件之间相似度的确定方法、计算设备及存储介质
US11270155B2 (en) Duplicate image detection based on image content
CN114565751A (zh) Ocr识别模型训练方法、ocr识别方法及相关装置
CN112784825B (zh) 图片中文字的识别方法、关键字检索方法、装置及设备
CN109739981B (zh) 一种pdf文件类别判定方法及文字提取方法
RU2571379C2 (ru) Интеллектуальная обработка электронного документа
JP2020047031A (ja) 文書検索装置、文書検索システム及びプログラム
CN115857906B (zh) 低代码图表生成的方法、系统、电子设备及介质
US20240161528A1 (en) Entity extraction via document image processing
JP2014235584A (ja) 文書分析システム、文書分析方法およびプログラム
US20230206660A1 (en) Image processing apparatus, image processing method, and storage medium
US20240095985A1 (en) Image processing apparatus, image processing method, and storage medium
JP5223535B2 (ja) 画像処理装置、プログラム及び画像処理システム
CN113761833A (zh) 一种文档内容的显示方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant