CN101526999B - 一种图文分离输出装置及其方法 - Google Patents

一种图文分离输出装置及其方法 Download PDF

Info

Publication number
CN101526999B
CN101526999B CN2008102267717A CN200810226771A CN101526999B CN 101526999 B CN101526999 B CN 101526999B CN 2008102267717 A CN2008102267717 A CN 2008102267717A CN 200810226771 A CN200810226771 A CN 200810226771A CN 101526999 B CN101526999 B CN 101526999B
Authority
CN
China
Prior art keywords
text
legible
output
extracted
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2008102267717A
Other languages
English (en)
Other versions
CN101526999A (zh
Inventor
李平立
刘畅
蒋年华
王磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Founder International Beijing Co Ltd
Original Assignee
Peking University
Founder International Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Founder International Beijing Co Ltd filed Critical Peking University
Priority to CN2008102267717A priority Critical patent/CN101526999B/zh
Publication of CN101526999A publication Critical patent/CN101526999A/zh
Application granted granted Critical
Publication of CN101526999B publication Critical patent/CN101526999B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

本发明公开了一种图文分离输出装置及其方法,该方法包括以下步骤:(1)通过输入接口向缓冲器输入图文数据;(2)非文字输出模块从缓冲器中获取数据,将非文字部分从图文数据中分离出来并通过输出接口输出;(3)文字输出模块从缓冲器中获取数据,将文字部分从图文数据中分离出来并通过输出接口输出。本发明通过将图文数据中的文字部分和非文字部分分离,先输出非文字部分后再输出文字部分,这样就避免了输出文字被非文字部分覆盖。

Description

一种图文分离输出装置及其方法
技术领域
本发明涉及印前计算机排版技术领域,尤其涉及一种图文分离输出装置及其方法。
背景技术
在目前已有的排版软件中,文字的显示层次都是跟随文字容器的放置层次,后放置的对象比文字容器层次高,发生重叠时就会压住文字。虽然通常情况下由操作者避免文字与其他版面对象发生重叠,以确保文字内容的完整,但是在报纸制作等场合,由于时间要求非常紧迫,排版速度非常快,因操作失误发生文字与其他版面对象重叠导致印刷事故的事件还是时有发生。目前多数报社排版系统为解决上述问题采用下述两种方案:一种为人工校验方法,其靠排版人员和版面校验人员对样张进行人工校验,发现出问题的地方再调整,此方法费时费力,而且容易遗漏出错;另一种方法为自动校验方法,其在系统中增加检查功能,在版面定稿之前,自动检查版面上的所有对象的边界,判断文字容器上方是否有与其他版面对象位置发生重叠,如果发生重叠,那么进行警告并不允许操作人员进行定稿操作。此方法对于非矩形的文字容器或者版面物体,其外轮廓计算图形求交算法通常存在误差,可能出现未重叠的部分报告重叠,有重叠的部分未能检测出来,可能出现由于计算误差而导致不允许客户定稿的问题。因而上述两种方法都不能很好的解决其他版面对象覆盖文字而导致印刷事故的问题。
发明内容
针对现有技术中所存在的不足,本发明的目的在于提供一种高效率的、文字部分不会被其他非文字部分覆盖的图文分离输出装置及其方法。
为了实现上述发明目的,本发明采用的技术方案是:一种图文分离输出装置,其包括:
图文输入模块,用于通过输入接口输入图文数据,暂存在缓冲器中;
非文字输出模块,用于从缓冲器中获取数据,将非文字部分从图文数据中分离出来,并计算所提取的每个非文字部分的具体位置,使所提取的每个非文字部分的位置与这些非文字部分被提取前在图文中所处的位置一致,再根据计算好的所提取的每个非文字部分的具体位置通过输出接口输出所提取的非文字部分;
文字输出模块,用于从缓冲器中获取数据,将文字部分从图文数据中分离出来,并计算所提取的每个文字部分的具体位置,使所提取的每个文字部分的位置与这些文字部分被提取前在图文中所处的位置一致,再根据计算好的所提取的每个文字部分的具体位置通过输出接口输出所提取的文字部分。
进一步,所述文字输出模块和非文字输出模块均与缓冲器及输出接口连接。
进一步,所述文字输出模块和非文字输出模块外接发排装置直接完成发排处理,所述的发排是指将指定数据发送到打印输出设备的输出过程。
同时,本发明还提供一种图文输出方法,该方法包括以下步骤:
(1)通过输入接口输入图文数据,暂存在缓冲器中;
(2)非文字输出模块从缓冲器中获取数据,将非文字部分从图文数据中分离出来,并计算所提取的每个非文字部分的具体位置,使所提取的每个非文字部分的位置与这些非文字部分被提取前在图文中所处的位置一致,再根据计算好的所提取的每个非文字部分的具体位置通过输出接口输出所提取的非文字部分;
(3)文字输出模块从缓冲器中获取数据,将文字部分从图文数据中分离出来,并计算所提取的每个文字部分的具体位置,使所提取的每个文字部分的位置与这些文字部分被提取前在图文中所处的位置一致,再根据计算好的所提取的每个文字部分的具体位置通过输出接口输出所提取的文字部分。
进一步,所述步骤(2)中的非文字输出在步骤(3)中的文字输出之前。
更进一步,所述文字部分包括文字及文字上的附属属性,非文字部分包括图形、图像及图形、图像上的附属属性,其中所述的附属属性包括文字、图形或图像的底纹、勾边、影、背景、大小和位置等信息。
再进一步,所述步骤(2)和步骤(3)中,区分非文字部分与文字部分是通过区分输入图文数据中的注解和数据类型判断实现的,其中所述的注解是指标记数据片段的用途和意义的符号,包括文字注解、图形注解、图像注解和OLE。
进一步,该方法预定义了一个统一的接口Ix_Draw,并在非文字输出模块中预定义了非文字输出的函数DrawNormal(),在文字输出模块中预定义了文字部分输出的函数DrawText(),其中函数DrawNormal()用于输出非文字部分,函数DrawText()用于输出文字部分。
本发明的效果在于:由于本发明所述的技术方案通过将图文数据分成文字部分和非文字部分,使文字部分比非文字部分后输出,从而有效解决了现有技术中存在的文字部分被其它非文字部分覆盖的问题,并且很大程度上提高了排版时的工作效率。
附图说明
图1为本发明实施例中图文分离输出器结构图;
图2为本发明实施例中一种图文分离输出方法的流程图;
图3为本发明实施例中需显示输出的图文示意图;
图4为本发明实施例中非文字部分示意图;
图5为按照本发明输出的效果图。
具体实施方式
下面结合说明书附图对本发明所述的一种图文分离输出装置及其方法作进一步详细的描述:
本发明所提供的一种图文分离输出装置,其包括显示装置、输出装置和图文分离输出器。如图1所示,本发明所述的图文分离输出器11由文字输出模块12、非文字输出模块13、缓冲器14以及输入接口15和输出接口16组成,其中文字输出模块12用于将文字部分从图文数据中分离出来,非文字输出模块13用于将非文字部分从图文数据中分离出来,缓冲器14用于缓冲输入的图文数据。输入接口15与缓冲器14相连,文字输出模块12和非文字输出模块13既与缓冲器14相连也与输出接口16相连,输出接口16连接输出装置,输出装置与显示装置相连,输出装置用于向显示装置输出图文,显示装置用于显示图文。
另图文分离输出器11中的文字输出模块12和非文字输出模块13也可外接发排装置直接完成发排处理,或者仅实现数据分离,这里发排是指将指定数据发送到打印输出设备的输出过程。
如图2所示,一种图文输出方法,包括以下几个步骤:
步骤S21:向缓冲器输入图文数据。
此步骤通过图文分离输出器的输入接口输入图文数据,暂存在缓冲器中。即将所有图文数据都暂存在缓冲器中,以备图文分离输出器中的文字输出模块和非文字输出模块调用。
步骤S22:从图文数据中分离出非文字部分并输出。
此步骤非文字输出模块从缓冲器中获取数据,将非文字部分从图文数据中分离出来并通过输出接口输出。在这里的文字部分包括文字及其附属属性,非文字部分包括图形、图像及其附属属性,其中所述的附属属性包括文字、图形或图像的底纹、勾边、影、背景、大小和位置等信息。图3为本实施例中需显示输出的所有内容,我们从图2中能发现本实施例中需显示输出的所有内容中既有文字又有非文字部分,其中非文字部分包括一个对象图元和文本框。具体区分非文字部分与文字部分可通过区分输入图文数据中的注解来实现的,其中注解是指标记数据片段的用途和意义的符号,包括文字注解、图形注解、图像注解和OLE(Object Linking and Embedding,对象连接与嵌入)等。在本实施例中我们利用函数根据图文数据中的注解来分离非文字部分与文字部分,即先在图文分离输出器中预定定义了一个统一的接口Ix_Draw,并在图文分离输出器的非文字输出模块中预定义了非文字部分输出的函数DrawNormal(),在图文分离输出器的   文字输出模块中预定义了文字部分输出的函数DrawText(),其中函数DrawNormal()用于提取图文数据中文字注解以外的注解部分,如图形注 解、图像注解等注解,即非文字注解部分,提取了图文数据中的非文字注解部分也就是提取了图文数据中的非文字部分,并计算所提取的每个非文字部分的具体位置,使所提取的每个非文字部分的位置与这些非文字部分被提取前在图文中所处的位置一致,计算好所提取的每个非文字部分的具体位置后再输出所提取的非文字部分,也就是说函数DrawNormal()用输出非文字部分;函数DrawText()用于提取图文数据中的文字注解部分,即提取图文数据中的文字部分,并计算其所提取的每个文字部分的具体位置,使其所提取的每个文字部分的位置与这些文字部分被提取前在图文中所处的位置一致,计算好所提取的每个注解的具体位置后再输出所提取的文字部分,也就是说函数DrawText()用于输出文字部分。
此步骤通过非文字输出模块中的函数DrawNormal()从缓冲器中获取图文数据,然后非文字输出模块中的函数DrawNormal()将提取图文数据中文字注解以外的注解部分——对象图元注解和文本框注解,即非文字注解部分,提取了图文数据中的非文字注解部分也就是提取了图文数据中的非文字部分——对象图元和文本框,并计算所提取的对象图元和文本框的具体位置,使所提取的对象图元和文本框的位置与对象图元和文本框被提取前在图文中所处的位置一致,计算好所提取的对象图元和文本框的具体位置后再通过输出接口将所提取的对象图元和文本框输出到显示设备并在显示设备上显示出来。这里的显示设备为常用的显示设备,如显示器、打印机、postScript输出、PDF输出等。本实施例中的显示设备为显示器。执行本步骤后具体情况如图4所示。
步骤S23:从图文数据中分离出文字部分并输出。
此步骤文字输出模块从缓冲器中获取数据,将文字部分从图文数据中分离出来通过输出接口输出,本步骤在步骤S12之后。
在本实施例中此步骤通过文字输出模块中的函数DrawText()从缓冲 器中获取图文数据,然后非文字输出模块中的函数DrawText()将提取图文数据中的文字注解部分,即提取图文数据中的文字部分,并计算其所提取的每个文字部分的具体位置,使其所提取的每个文字部分的位置与这些文字部分被提取前在图文中所处的位置一致,计算好所提取的每个注解的具体位置后再通过输出接口将所提取的文字部分输出到显示设备并在显示设备上显示出来。此步骤中文字部分的显示与步骤S13中非文字部分的显示在时间上的差相当地小,即向显示设备输出并显示文字部分比向显示设备输出并显示非文字部分只晚一点点,所以在显示设备上文字部分和非文字部分分别先后被显示我们在视觉上感觉不出来。
执行完本步骤后显示器上的具体情况如图5所示。图3是用常规方法在显示器上显示输出的效果图,从图3中我们发现图元对象覆盖了部分文字。而在图5中,所有的文字都没有被图元对象覆盖,这样就避免了按照常规方法输出导致图2中的文字部分被非文字部分覆盖现象。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种图文分离输出装置,其包括:
图文输入模块,用于通过输入接口输入图文数据,暂存在缓冲器中;
非文字输出模块,用于从缓冲器中获取数据,将非文字部分从图文数据中分离出来,并计算所提取的每个非文字部分的具体位置,使所提取的每个非文字部分的位置与这些非文字部分被提取前在图文中所处的位置一致,再根据计算好的所提取的每个非文字部分的具体位置通过输出接口输出所提取的非文字部分;
文字输出模块,用于从缓冲器中获取数据,将文字部分从图文数据中分离出来,并计算所提取的每个文字部分的具体位置,使所提取的每个文字部分的位置与这些文字部分被提取前在图文中所处的位置一致,再根据计算好的所提取的每个文字部分的具体位置通过输出接口输出所提取的文字部分。
2.如权利要求1所述的一种图文分离输出装置,其特征在于:所述文字输出模块和非文字输出模块均与缓冲器及输出接口连接。
3.如权利要求1所述的一种图文分离输出装置,其特征在于:所述文字输出模块和非文字输出模块外接发排装置直接完成发排处理,所述的发排是指将指定数据发送到打印输出设备的输出过程。
4.一种图文分离输出方法,该方法包括以下步骤:
(1)通过输入接口输入图文数据,暂存在缓冲器中;
(2)非文字输出模块从缓冲器中获取数据,将非文字部分从图文数据中分离出来,并计算所提取的每个非文字部分的具体位置,使所提取的每个非文字部分的位置与这些非文字部分被提取前在图文中所处的位置一致,再根据计算好的所提取的每个非文字部分的具体位置通过输出接口 输出所提取的非文字部分;
(3) 文字输出模块从缓冲器中获取数据,将文字部分从图文数据中分离出来,并计算所提取的每个文字部分的具体位置,使所提取的每个文字部分的位置与这些文字部分被提取前在图文中所处的位置一致,再根据计算好的所提取的每个文字部分的具体位置通过输出接口输出所提取的文字部分。
5.如权利要求4所述的一种图文分离输出方法,其特征在于:所述步骤(2)中的非文字输出在步骤(3)中的文字输出之前。
6.如权利要求4所述的一种图文分离输出方法,其特征在于:所述文字部分包括文字及文字上的附属属性,非文字部分包括图形、图像及图形、图像上的附属属性,其中所述的附属属性包括文字、图形或图像的底纹、勾边、影、背景、大小和位置信息。
7.如权利要求4至6之一所述的一种图文分离输出方法,其特征在于:所述步骤(2)和步骤(3)中,区分非文字部分与文字部分是通过区分输入图文数据中的注解来实现的,其中所述的注解是指标记数据片段的用途和意义的符号,包括文字注解、图形注解、图像注解和OLE。
8.如权利要求7所述的一种图文分离输出方法,其特征在于:该方法预定义了一个统一的接口Ix_Draw,并在非文字输出模块中预定义了非文字输出的函数DrawNormal(),在文字输出模块中预定义了文字部分输出的函数DrawText(),其中函数DrawNormal()用于输出非文字部分,函数DrawText()用于输出文字部分。
CN2008102267717A 2008-11-24 2008-11-24 一种图文分离输出装置及其方法 Active CN101526999B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008102267717A CN101526999B (zh) 2008-11-24 2008-11-24 一种图文分离输出装置及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008102267717A CN101526999B (zh) 2008-11-24 2008-11-24 一种图文分离输出装置及其方法

Publications (2)

Publication Number Publication Date
CN101526999A CN101526999A (zh) 2009-09-09
CN101526999B true CN101526999B (zh) 2012-05-16

Family

ID=41094859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102267717A Active CN101526999B (zh) 2008-11-24 2008-11-24 一种图文分离输出装置及其方法

Country Status (1)

Country Link
CN (1) CN101526999B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914859B (zh) * 2012-12-31 2017-12-05 北京新媒传信科技有限公司 将输入文字变为图片的信息处理方法和装置
CN103425336A (zh) * 2013-07-16 2013-12-04 深圳市创凯电子有限公司 图像与文字信息合成的装置和方法
CN107358184A (zh) * 2017-06-30 2017-11-17 中国科学院自动化研究所 文档文字的提取方法及提取装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1581926A (zh) * 2003-08-07 2005-02-16 鸿友科技股份有限公司 自动检测图文的半色调处理方法
CN101008938A (zh) * 2007-01-25 2007-08-01 北京方正国际软件系统有限公司 一种基于可呼出注解的排版数据重用方法
CN101295290A (zh) * 2008-06-11 2008-10-29 北大方正集团有限公司 一种多行文字行中排版的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1581926A (zh) * 2003-08-07 2005-02-16 鸿友科技股份有限公司 自动检测图文的半色调处理方法
CN101008938A (zh) * 2007-01-25 2007-08-01 北京方正国际软件系统有限公司 一种基于可呼出注解的排版数据重用方法
CN101295290A (zh) * 2008-06-11 2008-10-29 北大方正集团有限公司 一种多行文字行中排版的方法

Also Published As

Publication number Publication date
CN101526999A (zh) 2009-09-09

Similar Documents

Publication Publication Date Title
US20190065451A1 (en) Apparatus for setting file name and the like for scan image, control method thereof, and storage medium
EP2071493A2 (en) Image processing device, image processing method, and program and recording medium thereof
JP2006251902A (ja) 翻訳文書画像生成装置、翻訳文書画像生成プログラム及び翻訳文書画像生成方法
WO2018131825A1 (ko) 전자책 서비스 제공방법 및 그를 위한 컴퓨터 프로그램
TWI507894B (zh) 可進行亂碼恢復的電子裝置及恢復亂碼的方法
CN101526999B (zh) 一种图文分离输出装置及其方法
CN104461409A (zh) 数据生成装置以及数据生成方法
CN1932802A (zh) 具有文本提取功能的主机设备及其提取方法
CA2396881A1 (en) Imaging documents having static content and variable data
US9614984B2 (en) Electronic document generation system and recording medium
JP2009010770A (ja) 画像処理装置、画像処理プログラム、および画像処理方法
US10515286B2 (en) Image processing apparatus that performs compression processing of document file and compression method of document file and storage medium
CN104820962A (zh) 一种代替人工签名栏的打印水印生成方法
US8913087B1 (en) Digital image cropping
JP4644741B2 (ja) 画像処理装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP2008181174A (ja) 特許出願又は実用新案登録出願の図面原稿の作成方法
CN106980604B (zh) 合同内容校阅装置
CN105302508A (zh) 一种AutoCAD文件批量打印的方法
JP2015215637A (ja) 画像形成装置、画像処理装置およびプログラム
CN104699361A (zh) 一种工控设备人机交互界面的启动与数据录入方法
US11006015B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
KR20070013157A (ko) 이미지데이터의 저장방법
JP2012048637A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
US20140063564A1 (en) Image reading apparatus having stamp function and document management system having document search function

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant