CN101140621A - 图文影像处理装置及其影像处理方法 - Google Patents
图文影像处理装置及其影像处理方法 Download PDFInfo
- Publication number
- CN101140621A CN101140621A CNA2006100309595A CN200610030959A CN101140621A CN 101140621 A CN101140621 A CN 101140621A CN A2006100309595 A CNA2006100309595 A CN A2006100309595A CN 200610030959 A CN200610030959 A CN 200610030959A CN 101140621 A CN101140621 A CN 101140621A
- Authority
- CN
- China
- Prior art keywords
- picture
- literal
- image
- text
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Abstract
一种图文影像的处理方法。首先,接收图文影像;接着,辨识该图文影像,以产生至少一个图片影像及多个文字区块;然后,比对图片影像及文字区块,以得到每一文字区块相对于图片影像的相对位置参数和/或相对大小参数;接着,辨识该多个文字区块,以产生文字资料,该文字资料包括多个对应于各文字区块的文字。
Description
技术领域
本发明涉及一种图文影像处理装置及其影像处理方法,特别涉及一种可分开编辑文字及图片的图文影像处理装置及其影像处理方法。
背景技术
随着扫描仪、打印机等光学分辨率的提高,以及影像处理方法的日益进步,消费者对于影像品质的要求也日益提高。尤其是对于同时含有图片及文字的文件扫描或打印,更希望扫描或打印输出的图片及文字能够不失真。
然而,扫描仪及打印机针对上述这类同时含有图片及文字的文件进行扫描或打印时,一律当成是影像的方式处理时,便会产生扫描或打印上的缺陷问题。例如,当以低分辨率的文字模式(例如黑白模式)处理时,所产生的图片影像不是黑就是白,造成图片有失真的现象。且在文字部分往往会出现模糊不清,甚至难以辨识的情况。
为了避免这种问题,若改用高分辨率的照片模式(例如8位灰阶模式)进行文件扫描及打印时,存在以下问题:将会造成该扫描或打印的文件以占记忆空间庞大的影像格式储存,并且处理速度慢且处理时间冗长。
发明内容
有鉴于此,本发明的目的在于提供一种图文影像处理装置及其影像处理方法,将图文影像的图片部分及文字部分分开处理,并将文字部分辨识为纯文本文件。因此文字部分可以保持清晰且不会占据大量的储存空间,而图片部分能以较高分辨率方式处理。最后,整合产生图文并茂的文件。
根据本发明的目的,提出一种图文影像的处理方法。首先,接收图文影像;接着,辨识该图文影像,以产生至少一个图片影像及多个文字区块;然后,比对图片影像及文字区块,以得到每一文字区块相对于图片影像的相对位置参数和/或相对大小参数;接着,辨识该多个文字区块,以产生文字资料,该文字资料包括多个对应于该多个文字区块的文字。
根据本发明的另一目的,提出一种图文影像处理装置,包括数据库及图文影像处理单元。数据库储存文字特征资料,图文影像处理单元耦接数据库。图文影像处理单元接收图文影像后,辨识该图文影像,以产生至少一个图片影像及多个文字区块。图文影像处理单元辨识该多个文字区块,并根据数据库中既存的文字特征资料以产生文字资料。文字资料包括多个对应于该多个文字区块的文字。
根据本发明的另一目的,提出一种文字影像处理方法。首先,接收文字影像;接着,辨识该文字影像,以产生至少一个文字区块;然后,辨识该文字区块,以产生文字资料,该文字资料包括多个对应于文字区块的文字。
附图说明
图1是表示本发明的图文影像处理装置的功能方块图;
图2是表示本发明的图文影像处理方法流程图;以及
图3是表示本发明的文字影像处理方法流程图。
具体实施方式
为让本发明的上述目的、特征、和优点能更明显易懂,下文特举一较佳实施例,并配合附图,作详细说明如下:
参照图1,其是显示本发明的图文影像处理装置的功能方块图。图文影像处理装置100包括数据库110、图文影像处理单元120、显示单元150、打印单元160、记忆单元140及传真单元170。数据库110储存文字特征资料,图文影像处理单元120耦接于数据库110。图文影像处理单元120接收图文影像S1后,辨识该图文影像S1以产生至少一个图片影像及多个文字区块。例如,图文影像处理单元120利用图文分离的技术将该图文影像S1区分为至少一个图片影像及多个文字区块。接着,图文影像处理单元120比对该图片影像及多个文字区块,以得到每一文字区块与该图片影像相对应的相对位置参数和/或相对大小参数。根据上述的参数,可以进行后续的图文合并,以及文字尺寸辨识。然后,图文影像处理单元120辨识该多个文字区块,并根据数据库110既存的文字特征资料以产生文字资料,该文字资料包括多个对应于该多个文字区块的文字。例如,图文影像处理单元120通过光学文字辨识(Optical Character Recognition,OCR)的技术抽取该多个文字区块供该图文影像处理单元120辨识的外形特征。接着,该图文影像处理单元120将该多个文字区块的外形特征,与该数据库110既存的文字特征资料相互比对,找出每一与外形特征最相符的文字。该图文影像处理单元120汇整该多个单一文字为文字资料。
本发明所属技术领域中具有通常知识的人,可知本发明的技术不限于此。例如,图文影像处理装置100还包括影像输入单元130,影像输入单元130耦接于图文影像处理单元120以输入图文影像。影像输入单元130可以包括电荷耦合组件(charge coupled device,CCD)或是互补金氧半导体(complementary metal oxide semiconductor,CMOS)感光组件,乃至任一影像感测组件。
此外,图文影像处理装置100还包括记忆单元140,记忆单元140耦接于图文影像处理单元120以记录图片影像及多个文字区块。记忆单元140还记录每一文字区块与每一图片影像对应的相对位置参数及相对大小参数,以利后续进行合并或文字辨识处理。记忆单元140还可用来记录多笔文字属性资料,每一文字属性资料包括对应每一辨识完成文字的文字尺寸参数或文字字体参数。
另外,图文影像处理单元120还可合并图片影像及文字资料,以产生且输出图文档案S2。图文影像处理装置120还可耦接于显示单元150、打印单元160、记忆单元140及传真单元170,分别用来显示、打印、储存或传真图文档案S2。
参照图2,其显示本发明的图文影像处理方法流程图。同时参考图1,首先,如步骤210所示,图文影像处理单元120接收来自影像输入单元130的图文影像S1;接着,如步骤220所示,辨识图文影像S1,以产生图片影像及多个文字区块;然后,如步骤230所示,比对图片影像及多个文字区块,以得到每一文字区块与图片影像相对应的相对位置参数和/或相对大小参数。接着流程在此区分为两部分:图片影像处理部分如步骤242所示,可以进一步进行各式影像处理,例如调校色彩、对比及亮度等等,以提高图片影像的品质;而文字区块处理部分如步骤244所示,可经由图文影像处理单元120进一步辨识,以产生文字资料,文字资料包括多个对应于各文字区块的文字。然后,如步骤250所示,合并图片影像及文字资料,以产生图文档案S2。而图文档案S2可进一步利用具有资料编辑功能的软件进行编辑,例如更改字体种类、字号、字体颜色,或者缩放图片等等;接着,如步骤260所示,可进一步分别采用显示单元150、打印单元160、记忆单元140及传真单元170,来显示、打印、储存或传真图文档案S2。
本发明所属技术领域中具有通常知识的人,可知本发明的技术不限于此。例如,步骤230还可包括:以记忆单元140记录每一文字区块的相对位置参数和/或相对大小参数。
此外,步骤244还包括:产生多笔文字属性资料,每一文字属性资料对应每一文字,每一文字属性资料包括相对应文字的文字尺寸参数和/或文字字体参数。其中,文字尺寸参数可以由文字区块的相对大小参数,与数据库110的文字特征资料比对产生(例如文字编辑软件如WORD中的字号)。文字字体种类例如是标楷体或新细明体,字号例如是各种字体号数(例如一般称呼的14号字或16号字)。文字资料可以是不含文字属性的纯文本文件,或包含文字属性的档案格式如微软公司出版的WORD档案格式,或者是Adobe公司的可携式档案格式(portable document file,PDF)。而产生文字属性资料的步骤还包括:提供文字特征资料,并比对文字区块与文字特征资料,以产生每一文字专属的文字属性资料。另外,图片影像也可以省略步骤242,在不进行影像编修的情况下直接与文字资料合并以产生图文档案S2。而合并后的图文档案S2也可直接分开编辑图像及文字。
此外,步骤250还包括:根据相对位置参数、文字尺寸参数和/或文字字体参数,合并图片影像及文字资料,呈现出原本输入的图文影像中,图片与文字之间相对应的位置关系以及文字样式。其中,使用者可依据现有需求,通过计算机软件编辑该图文档案的图片影像和/或文字,以产生编辑过的图文档案。
另外,本实施例虽以辨识图文影像为例进行了说明,但当然也适用于纯文字影像的辨识。与传统光学文字辨识(optical character recognition,OCR)系统同样具有辨识文字的能力。参照图3,其是本发明的文字影像处理方法流程图,并同时参照图1。首先,如步骤310所示,图文影像处理单元120接收来自影像输入单元130的文字影像;接着,如步骤320所示,辨识文字影像以产生多个文字区块;然后,如步骤330所示,文字区块经由图文影像处理单元120进一步辨识,以产生文字资料;接着,如步骤340所示,可进一步利用显示单元150、打印单元160、记忆单元140及传真单元170,分别显示、打印、储存或传真文字资料。
本发明上述实施例所揭示的图文影像处理装置及其影像处理方法,对输入的影像的图片部分及文字部分进行辨识并分开处理,并将文字部分辨识为文本文件。因此文字部分可以保持字形清晰工整且占据较少的储存空间,而图片部分可以较高分辨率模式处理,并针对色彩及对比、亮度等进行调校,最后整合文字与图片部分,产生图文并茂的文件。本发明相对于传统扫描仪以文字模式进行扫描而言,文件的图片纹理更清晰,且图片与文字更显分明;本发明相对于传统扫描仪以照片模式扫描而言,处理速度更快,缩短处理时间。而且文字不再以图片的资料格式储存,而是以字符的资料格式储存,大大地降低文件的储存容量。
综上所述,虽然本发明已以一较佳实施例揭示如上,然其并非用来限定本发明。本发明所属技术领域中具有通常知识的人,在不脱离本发明的精神和范围内,可作各种的更动与润饰。因此,本发明的保护范围应该以权利要求书所界定的内容为准。
符号说明
100:图文影像处理装置
110:数据库
120:图文影像处理单元
130:影像输入单元
140:记忆单元
150:显示单元
160:打印单元
170:传真单元
Claims (22)
1.一种图文影像的处理方法,包括:
接收图文影像;
辨识所述图文影像,以产生至少一个图片影像及多个文字区块;
比对所述图片影像及所述文字区块,以得到每一所述文字区块与所述图片影像相对应的相对位置参数和/或相对大小参数;以及
辨识所述文字区块,以产生文字资料,所述文字资料包括多个与所述文字区块对应的文字。
2.如权利要求1所述的影像处理方法,其特征在于,所述比对所述图片影像及所述文字区块的步骤还包括:
记录所述相对位置参数和/或所述相对大小参数。
3.如权利要求1所述的影像处理方法,其特征在于,所述辨识该文字区块的步骤还包括:
产生多笔文字属性资料,所述文字属性资料对应所述文字,每一所述文字属性资料包括对应每一所述文字的文字尺寸参数和/或文字字体参数。
4.如权利要求3所述的影像处理方法,其特征在于,所述产生所述文字属性资料的步骤还包括:
提供文字特征资料;以及
比对所述文字区块与所述文字特征资料,以产生所述文字属性资料。
5.如权利要求3所述的影像处理方法,还包括:
合并所述图片影像及所述文字资料,以产生图文档案。
6.如权利要求5所述的影像处理方法,其特征在于,所述合并所述图片影像及所述文字资料的步骤还包括:
根据所述相对位置参数、所述文字尺寸参数和/或所述文字字体参数,合并所述图片影像及所述文字资料。
7.如权利要求5所述的影像处理方法,还包括:
显示、打印、储存或传真所述图文档案。
8.如权利要求1所述的影像处理方法,还包括:
处理所述图片影像。
9.一种图文影像处理装置,其特征在于,包括:
数据库,用来储存文字特征资料;以及
图文影像处理单元,耦接于该数据库,所述图文影像处理单元接收图文影像后,辨识所述图文影像,以产生至少一个图片影像及多个文字区块,所述图文影像处理单元比对所述图片影像及所述文字区块,以得到每一所述文字区块与所述图片影像相对应的相对位置参数和/或相对大小参数,该图文影像处理单元辨识所述文字区块,并根据所述数据库中的所述文字特征资料以产生文字资料,所述文字资料包括多个对应于所述文字区块的文字。
10.如权利要求9所述的图文影像处理装置,其特征在于,还包括影像输入单元,所述影像输入单元耦接于所述图文影像处理单元以输入所述图文影像。
11.如权利要求10所述的图文影像处理装置,其特征在于,所述影像输入单元包括电荷耦合组件或是互补金氧半导体感光组件。
12.如权利要求9所述的图文影像处理装置,其特征在于,还包括记忆单元,所述记忆单元耦接于所述图文影像处理单元以记录每一所述文字区块与每一该图片影像对应的相对位置参数及相对大小参数。
13.如权利要求12所述的图文影像处理装置,其特征在于,所述记忆单元还记录多笔文字属性资料,每一所述文字属性资料包括对应每一所述文字的文字尺寸参数或文字字体参数。
14.如权利要求9所述的图文影像处理装置,其特征在于,所述图文影像处理单元还合并所述图片影像及所述文字资料,以产生图文档案。
15.如权利要求14所述的图文影像处理装置,其特征在于,还包括显示单元,所述显示单元耦接于所述图文影像处理单元以显示所述图文档案。
16.如权利要求14所述的图文影像处理装置,其特征在于,还包括打印单元,所述打印单元耦接于所述图文影像处理单元以打印所述图文档案。
17.如权利要求14所述的图文影像处理装置,其特征在于,还包括记忆单元,所述记忆单元耦接于所述图文影像处理单元以储存所述图文档案。
18.如权利要求14所述的图文影像处理装置,其特征在于,包括传真单元,所述传真单元耦接于所述图文影像处理单元以传真所述图文档案。
19.一种文字影像处理方法,其特征在于,包括:
接收文字影像;
辨识该文字影像,以产生多个文字区块;以及
辨识所述文字区块,以产生文字资料,所述文字资料包括多个对应于所述文字区块的文字。
20.如权利要求19所述的文字影像处理方法,其特征在于,该辨识该文字区块的步骤还包括:
产生多笔文字属性资料,所述文字属性资料对应所述文字,每一所述文字属性资料包括对应每一所述文字的文字尺寸参数和/或文字字体参数。
21.如权利要求20所述的文字影像处理方法,其特征在于,所述产生所述文字属性资料的步骤还包括:
提供文字特征资料;以及
比对所述文字区块与文字特征资料,以产生所述文字属性资料。
22.如权利要求19所述的文字影像处理方法,其特征在于,还包括:
显示、打印、储存或传真该文字资料。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2006100309595A CN100511267C (zh) | 2006-09-08 | 2006-09-08 | 图文影像处理装置及其影像处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2006100309595A CN100511267C (zh) | 2006-09-08 | 2006-09-08 | 图文影像处理装置及其影像处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101140621A true CN101140621A (zh) | 2008-03-12 |
CN100511267C CN100511267C (zh) | 2009-07-08 |
Family
ID=39192568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2006100309595A Active CN100511267C (zh) | 2006-09-08 | 2006-09-08 | 图文影像处理装置及其影像处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100511267C (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105302782A (zh) * | 2015-11-23 | 2016-02-03 | 魅族科技(中国)有限公司 | 一种信息转换方法及装置 |
CN110325989A (zh) * | 2017-02-24 | 2019-10-11 | 微软技术许可有限责任公司 | 估计的阅读时间 |
-
2006
- 2006-09-08 CN CNB2006100309595A patent/CN100511267C/zh active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105302782A (zh) * | 2015-11-23 | 2016-02-03 | 魅族科技(中国)有限公司 | 一种信息转换方法及装置 |
CN105302782B (zh) * | 2015-11-23 | 2019-04-26 | 魅族科技(中国)有限公司 | 一种信息转换方法及装置 |
CN110325989A (zh) * | 2017-02-24 | 2019-10-11 | 微软技术许可有限责任公司 | 估计的阅读时间 |
Also Published As
Publication number | Publication date |
---|---|
CN100511267C (zh) | 2009-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6668101B2 (en) | Image processing apparatus and method, and computer-readable memory | |
JP4661580B2 (ja) | 画像処理装置及びプログラム | |
US7986832B2 (en) | Image combining apparatus and control method for the same | |
JP4796486B2 (ja) | 画像処理装置 | |
WO2001003416A1 (fr) | Dispositif et procede d'elimination de bordure, et dispositif de creation | |
JP2007005950A (ja) | 画像処理装置及びネットワークシステム | |
CN100511267C (zh) | 图文影像处理装置及其影像处理方法 | |
JP4926589B2 (ja) | 画像合成装置、画像合成方法、およびプログラム | |
JP2004214991A (ja) | 文書画像データ管理システム、文書画像データ管理プログラム、文書画像データ管理装置及び文書画像データ管理方法 | |
JP2004072527A (ja) | 複合機、電子ファイリングシステムおよびスキャナ | |
JP4396710B2 (ja) | 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム | |
JP2005346459A (ja) | 文書処理システム | |
US20030009498A1 (en) | Method for digitally reordering and editing business stationery | |
JP4690676B2 (ja) | 画像処理システム、画像処理方法及び画像処理プログラム | |
JP5517028B2 (ja) | 画像処理装置 | |
TW200811726A (en) | Method and apparatus for processing image with picture and characters | |
JP4738978B2 (ja) | 筆記情報処理システム、筆記情報処理方法及びプログラム | |
JP2006039868A (ja) | 筆記情報入力装置、文書処理システム、筆記情報入力プログラム及び記録媒体 | |
JP2006309622A (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体 | |
JP2006094466A (ja) | 画像処理システム及び画像処理方法 | |
JP2006091979A (ja) | 画像処理システム及び画像処理方法 | |
JPH11224259A (ja) | 画像処理装置、画像処理方法および記憶媒体 | |
JP3720748B2 (ja) | 画像処理装置及びその制御方法並びにコンピュータプログラム及び記録媒体 | |
JP2008181223A (ja) | 電子文書管理システム、電子文書管理方法、プログラムおよび記録媒体 | |
JP4230478B2 (ja) | 文書処理装置、方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |