JP6311360B2 - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP6311360B2 JP6311360B2 JP2014044339A JP2014044339A JP6311360B2 JP 6311360 B2 JP6311360 B2 JP 6311360B2 JP 2014044339 A JP2014044339 A JP 2014044339A JP 2014044339 A JP2014044339 A JP 2014044339A JP 6311360 B2 JP6311360 B2 JP 6311360B2
- Authority
- JP
- Japan
- Prior art keywords
- type
- characters
- processed image
- image
- executed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 235
- 238000000034 method Methods 0.000 claims description 222
- 230000008569 process Effects 0.000 claims description 219
- 238000004590 computer program Methods 0.000 claims description 14
- 230000008707 rearrangement Effects 0.000 description 65
- 230000006870 function Effects 0.000 description 17
- 230000004048 modification Effects 0.000 description 15
- 238000012986 modification Methods 0.000 description 15
- 230000008859 change Effects 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000003672 processing method Methods 0.000 description 4
- 239000003086 colorant Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 235000010724 Wisteria floribunda Nutrition 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K15/00—Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers
- G06K15/02—Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers using printers
- G06K15/18—Conditioning data for presenting it to the physical printing elements
- G06K15/1801—Input data handling means
- G06K15/181—Receiving print data characterized by its formatting, e.g. particular page description languages
- G06K15/1815—Receiving print data in mixed format
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00344—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a management, maintenance, service or repair apparatus
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/04—Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32128—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title attached to the image data, e.g. file header, transmitted message header, information on the same page or in the same computer file as the image
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/393—Enlarging or reducing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/407—Control or modification of tonal gradation or of extreme levels, e.g. background level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3261—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal
- H04N2201/3266—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of multimedia information, e.g. a sound signal of text or character information, e.g. text accompanying an image
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3271—Printing or stamping
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3273—Display
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Editing Of Facsimile Originals (AREA)
- Record Information Processing For Printing (AREA)
- Image Processing (AREA)
Description
画像処理方法であって、
原画像を表わす原画像データを取得する取得工程であって、前記原画像は、複数個の文字によって構成されるM行(前記Mは1以上の整数)の文字列を含む、前記取得工程と、
前記原画像データに対して画像処理を実行して、処理済み画像を表わす処理済み画像データを生成する画像処理実行工程であって、前記処理済み画像では、前記原画像と比べて、前記複数個の文字が拡大されて表現されている、前記画像処理実行工程と、を備え、
前記画像処理実行工程は、
前記原画像内の前記M行の文字列に基づいて、第1種の拡大処理と第2種の拡大処理とを含む複数種類の拡大処理の中から1種類の拡大処理を選択する処理選択工程と、
前記選択された1種類の拡大処理を実行する拡大処理実行工程と、を備え、
前記第1種の拡大処理が選択される場合には、前記複数個の文字を含む第1種の前記処理済み画像を表わす第1種の前記処理済み画像データが生成され、前記第1種の処理済み画像は、前記複数個の文字が拡大されて表現されているM行の拡大文字列を含み、前記第1種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと同じであり、
前記第2種の拡大処理が選択される場合には、前記複数個の文字を含む第2種の前記処理済み画像を表わす第2種の前記処理済み画像データが生成され、前記第2種の処理済み画像は、前記複数個の文字が拡大されて表現されているN行(前記Nは1以上の整数)の拡大文字列を含み、前記第2種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと異なる、画像処理方法。
(通信システム2の構成)
図1に示されるように、通信システム2は、多機能機10と画像処理サーバ50とを備える。多機能機10と画像処理サーバ50とは、インターネット4を介して、相互に通信可能である。多機能機10は、印刷機能、スキャン機能、コピー機能、FAX機能等を含む多機能を実行可能な周辺機器(即ち図示省略のPC(Personal Computerの略)等の周辺機器)である。画像処理サーバ50は、多機能機10のベンダによってインターネット4上に設けられるサーバである。
多機能機10が実行可能なコピー機能は、モノクロコピー機能とカラーコピー機能とに分類されるが、本実施例では、カラーコピー機能に着目して説明する。カラーコピー機能は、通常カラーコピー機能と文字拡大カラーコピー機能とに分類される。多機能機10は、どちらのカラーコピー機能の実行指示がユーザから与えられる場合でも、まず、スキャン対象の画像を表わすシート(以下では「スキャン対象シート」と呼ぶ)をカラースキャンして、スキャン画像データSIDを生成する。スキャン画像データSIDは、多階調(例えば256階調)のRGBビットマップデータである。
画像処理サーバ50は、多機能機10から受信されるスキャン画像データSIDに対して画像処理を実行して、処理済み画像データPIDを生成し、当該処理済み画像データPIDを多機能機10に送信する。画像処理サーバ50は、ネットワークインターフェース52と、制御部60と、を備える。ネットワークインターフェース52は、インターネット4に接続される。制御部60は、CPU62とメモリ64とを備える。CPU62は、メモリ64に格納されているプログラム66に従って、様々な処理(即ち図2等の処理)を実行するプロセッサである。
続いて、図2を参照して、画像処理サーバ50のCPU62によって実行される各処理の内容を説明する。CPU62は、インターネット4を介して、多機能機10からスキャン画像データSIDを受信する場合に、図2の処理を開始する。
続いて、図4を参照して、図2のS100で実行される文字列解析処理の内容を説明する。S110では、CPU62は、スキャン画像データSIDに対して二値化処理を実行して、スキャン画像データSIDと同じ画素数を有する二値データBD(図4では一部のみが示されている)を生成する。具体的に、CPU62は、まず、スキャン画像データSIDを利用して、スキャン画像SIの背景色(本実施例では白色)を決定する。具体的には、CPU62は、スキャン画像データSID内の複数個の画素の画素値の頻度の分布を示すヒストグラムを生成する。そして、CPU62は、当該ヒストグラムを利用して、最高の頻度を有する画素値(以下では「最高頻度画素値」と呼ぶ)を特定することによって、背景色を決定する。次いで、CPU62は、スキャン画像データSID内の複数個の画素のそれぞれについて、当該画素の画素値が最高頻度画素値に一致する場合には、当該画素に対応する位置に存在するスキャン画像データSID内の画素の画素値として「0」を割り当て、当該画素の画素値が最高頻度画素値に一致しない場合には、当該画素に対応する位置に存在するスキャン画像データSID内の画素の画素値として「1」を割り当てる。この結果、スキャン画像データSIDに対応する「0」と「1」の画素値を有する画素によって構成される二値データBDが生成される。二値データBDでは、テキストオブジェクトTOBに含まれる各文字(例えば「A」,「B」)を表わす各画素が画素値「1」を示し、各写真オブジェクトOB1,OB2を表わす各画素が画素値「1」を示し、それ以外の各画素(即ち背景を表わす画素)が画素値「0」を示す。なお、以下では、二値データBD内の画素値「1」を示す画素、画素値「0」を示す画素のことを、それぞれ、「ON画素」、「OFF画素」と呼ぶ。
続いて、図5を参照して、図2のS300で実行される単純拡大条件を満たすスキャン画像SI1の一例と、図2のS400で実行される単純拡大処理の内容を説明する。上述の文字列解析処理(図4参照)のS160では、帯状領域が決定される。図2に示すスキャン画像SIでは、1個のテキスト領域TOAの中から、3個の帯状領域LA1〜LA3が決定される。CPU62は、1個のテキスト領域の中から2個以上の帯状領域が決定される場合、テキスト領域に含まれる文字列が2行以上であると判断して(図2のS300でNO)、S500に進む。
続いて、図6を参照して、図3のS500で実行される結合処理の内容を説明する。S510では、CPU62は、スキャン画像SI内の1個以上のテキスト領域のうちの1個のテキスト領域(以下では「対象テキスト領域」と呼ぶ)を処理対象として決定する。以下では、テキスト領域TOAが対象テキスト領域として決定される場合を例として説明する。
続いて、図7を参照して、図3のS600で実行される目標領域決定処理の内容を説明する。S630では、CPU62は、拡大率ERとして初期値「1.0」を設定すると共に、回数ポインタTPとして初期値「1」を設定する。拡大率ERは、後述のS650の領域拡大処理でテキスト領域を拡大するための面積拡大率である。回数ポインタTPは、後述のS650の領域拡大処理が実行された回数を示すポインタである。従って、以下では、「TP回目の領域拡大処理」又は「(TP−1)回目の領域拡大処理」という用語を使用することがある。
続いて、図8を参照して、図7のS650で実行される領域拡大処理の内容を説明する。領域拡大処理では、CPU62は、拡大率ERに従ってテキスト領域TOAを拡大して、拡大領域を決定する。
続いて、図9を参照して、図3のS700で実行される再配置処理の内容を説明する。S710では、CPU62は、スキャン画像SIに含まれる1個以上のテキスト領域のうちの1個のテキスト領域TOAを処理対象として決定する。以下では、S710で処理対象として決定されるテキスト領域のことを「対象テキスト領域」と呼ぶ。また、対象テキスト領域について決定された目標領域のことを「対象目標領域」と呼び、対象テキスト領域に含まれる各文字列が結合された結合画像(例えば図2のCI)を表わす結合画像データのことを「対象結合画像データ」と呼ぶ。
図10に示されるように、S751では、CPU62は、対象結合画像(例えば図11内のCI)の横方向の長さIWが、候補再配置領域の横方向の長さW以下であるのか否かを判断する。CPU62は、長さIWが長さW以下であると判断する場合(S751でYES)には、S752において、「1」を行数として決定する。対象結合画像CIに含まれる全ての文字「A〜M」が横方向に沿って直線状に並んだ状態で、全ての文字「A〜M」が候補再配置領域内に収まるからである。S752が終了すると、図10の処理が終了する。
図9のS760では、CPU62は、S760内の数式に従って、候補再配置領域の縦方向の新たな長さHを決定する。S760内の数式において、「m」はS740で決定された行間の長さであり、「n」はS750で決定された行数であり、「h」は対象結合画像データの縦方向の長さである(図10内の結合画像CIのh参照)。
続いて、図11を参照して、図3のS700の再配置処理(図9参照)とS800の拡大処理について、具体的なケースAを説明する。(A1)に示されるように、候補再配置領域の横方向の長さWの初期値、縦方向の長さHの初期値として、それぞれ、対象テキスト領域TOAの横方向の長さOPx、縦方向の長さOPyが設定される(図9のS720)。本ケースでは、W/HがTW/TH未満である。即ち、対象目標領域TAは、対象テキスト領域TOAと比べると、横長の形状を有する。この場合、候補再配置領域を横長の形状にしていけば、候補再配置領域のアスペクト比が対象目標領域TAのアスペクト比に近づくことになる。従って、(A2)に示されるように、候補再配置領域の横方向の現在の長さWに固定値βが加算されて、候補再配置領域の横方向の新たな長さWが決定される(S732)。この場合、行数として、文字列「A〜E」と文字列「F〜J」と文字列「K〜M」とを含む3行が決定される(S750)。そして、候補再配置領域の縦方向の新たな長さHが決定される(S760)。
続いて、図12を参照して、ケースBを説明する。(B1)に示されるように、本ケースでは、比W/Hが比TW/THよりも大きい。即ち、対象目標領域TAは、対象テキスト領域TOAと比べると、縦長の形状を有する。この場合、候補再配置領域を縦長の形状にしていけば、候補再配置領域のアスペクト比が対象目標領域TAのアスペクト比に近づくことになる。従って、(B2)に示されるように、候補再配置領域の横方向の現在の長さWから固定値βが減算されて、候補再配置領域の横方向の新たな長さWが決定される(S734)。この場合、行数として、文字列「A〜D」と文字列「E〜H」と文字列「I〜L」と文字列「M」とを含む4行と決定される(S750)。即ち、この場合、候補再配置領域の横方向の長さWが小さくなったことに起因して、候補再配置領域内の1行の文字列を構成することが可能な最大の文字数が減る。そして、候補再配置領域の縦方向の新たな長さHが決定される(S760)。
本実施例によると、画像処理サーバ50は、第1種の拡大処理を実行すべきか、第2種の拡大処理を実行すべきか、の判断結果に応じて、テキストオブジェクトに含まれる複数個の文字のレイアウトを変更しない単純拡大処理(図2のS400)と、レイアウトが変更され得る拡大処理(図3のS500〜S800)と、のいずれかの拡大処理を実行することができる。このため、単純拡大処理を実行すべきと判断される場合に、処理済み画像データを生成する際に、テキストオブジェクトTOBに含まれる複数個の文字のレイアウトを替えずに済む。
画像処理サーバ50が、「画像処理装置」の一例である。スキャン画像SI,SI1が、それぞれ、「原画像」の一例である。余白領域BAが、「スペース領域」の一例である。横方向、縦方向が、それぞれ、「第1方向」、「第2方向」の一例である。横方向の2個の余白の長さPx1,Px2、縦方向の2個の余白の長さPy1,Py2が、それぞれ、「第1方向に沿った2個の余白の長さ」、「第2方向に沿った2個の余白の長さ」の一例である。
図13に示すように、画像処理サーバ50のCPU62は、S300において、スキャン画像データSI2のテキスト領域TOAを目標倍率(例えば1.4)に拡大した単純拡大領域が、図2のS200で決定された余白領域BAに収まるのか否かを判断する。具体的には、CPU62は、テキスト領域TOAの縦方向の長さと横方向の長さとのそれぞれに、目標倍率の平方根(例えば√1.4)を乗算し、単純拡大領域の縦方向の長さと横方向の長さとして決定する。CPU62は、単純拡大領域の縦方向の長さが、余白領域BAの縦方向の長さ以下であり、かつ、単純拡大領域の横方向の長さが、余白領域BAの横方向の長さ以下である場合に、単純拡大領域が余白領域BAに収まると判断する。一方、CPU62は、単純拡大領域の縦方向の長さが、余白領域BAの縦方向の長さよりも大きい場合、及び、単純拡大領域の横方向の長さが、余白領域BAの横方向の長さよりも大きい場合、の少なくとも一方の場合に、単純拡大領域が、余白領域BAに収まらないと判断する。
目標倍率の平方根が「目標値」の一例であり、目標領域TAの横方向の長さ、縦方向の長さが、それぞれ、「第1の長さ」、「第2の長さ」の一例である。余白領域BAの横方向の長さ、縦方向の長さが、それぞれ、「スペース領域の第1方向に沿った長さ」、「スペース領域の前記第2方向に沿った長さ」の一例である。目標領域TAの縦方向の長さが、余白領域BAの縦方向の長さよりも小さく、かつ、目標領域TAの横方向の長さが、余白領域BAの横方向の長さよりも小さいことが、「特定の条件」の一例である。
図14に示すように、画像処理サーバ50のCPU62は、S300において、テキスト領域TOAに含まれるテキストオブジェクトTOBが、箇条書きで表現されているのか否かを判断する。
図15に示すように、画像処理サーバ50のCPU62は、S300において、テキスト領域TOAに含まれる各行の文字列の後端の余白のばらつきが大きいのか否かを判断する。
各帯状領域LA1〜LA4の射影ヒストグラムのうち、最も後ろ側に位置する高頻度範囲の後端が「1行の文字列の一端」の一例であり、各帯状領域LA1〜LA4の右端が「テキスト領域の境界」の一例である。距離BL1〜BL4が「余白の長さ」の一例である。距離BL1〜BL4の平均値と距離BL1〜BL4のそれぞれの差の絶対値の合計が、M行の文字列について算出されるM個の余白の長さのばらつきの一例であり、閾値が「所定のばらつき」の一例である。
図16に示すように、画像処理サーバ50のCPU62は、S300において、テキスト領域TOAに含まれる文字列の行の中に、行の幅(即ち縦方向の長さ)が、他の行の幅と比較して、極端に大きい行が存在するのか否かを判断する。
図17に示すように、画像処理サーバ50のCPU62は、S300において、テキスト領域TOAの背景色が、スキャン画像SI6の背景色と異なるのか否かを判断する。
Claims (21)
- 画像処理装置であって、
原画像を表わす原画像データを取得する取得部であって、前記原画像は、複数個の文字によって構成されるM行(前記Mは1以上の整数)の文字列を含む、前記取得部と、
前記原画像データに対して画像処理を実行して、処理済み画像を表わす処理済み画像データを生成する画像処理実行部であって、前記処理済み画像では、前記原画像と比べて、前記複数個の文字が拡大されて表現されている、前記画像処理実行部と、を備え、
前記画像処理実行部は、
前記原画像内の前記M行の文字列に基づいて、第1種の拡大処理を実行すべきか、第2種の拡大処理を実行すべきか、を判断する判断部と、
前記第1種の拡大処理を実行すべきと判断される場合に、前記第1種の拡大処理を実行して、第1種の前記処理済み画像を表わす第1種の前記処理済み画像データを生成する第1の生成部であって、前記第1種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと同じであり、前記第1種の処理済み画像は、前記複数個の文字が拡大されて表現されているM行の拡大文字列を含んでいる、前記第1の生成部と、
前記第2種の拡大処理を実行すべきと判断される場合に、前記第2種の拡大処理を実行して、第2種の前記処理済み画像を表わす第2種の前記処理済み画像データを生成する第2の生成部であって、前記第2種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと異なり、前記第2種の処理済み画像は、前記複数個の文字が拡大されて表現されているN行(前記Nは1以上の整数)の拡大文字列を含んでいる前記第2の生成部と、を備え、
前記判断部は、
前記Mが1であるのか、前記Mが2以上であるのか、を判断し、
前記Mが1であると判断される場合に、前記第1種の拡大処理を実行すべきと判断し、
前記Mが2以上であると判断される場合に、前記第2種の拡大処理を実行すべきと判断する、画像処理装置。 - 画像処理装置であって、
原画像を表わす原画像データを取得する取得部であって、前記原画像は、複数個の文字によって構成されるM行(前記Mは1以上の整数)の文字列を含む、前記取得部と、
前記原画像データに対して画像処理を実行して、処理済み画像を表わす処理済み画像データを生成する画像処理実行部であって、前記処理済み画像では、前記原画像と比べて、前記複数個の文字が拡大されて表現されている、前記画像処理実行部と、を備え、
前記画像処理実行部は、
前記原画像内の前記M行の文字列に基づいて、第1種の拡大処理を実行すべきか、第2種の拡大処理を実行すべきか、を判断する判断部と、
前記第1種の拡大処理を実行すべきと判断される場合に、前記第1種の拡大処理を実行して、第1種の前記処理済み画像を表わす第1種の前記処理済み画像データを生成する第1の生成部であって、前記第1種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと同じであり、前記第1種の処理済み画像は、前記複数個の文字が拡大されて表現されているM行の拡大文字列を含んでいる、前記第1の生成部と、
前記第2種の拡大処理を実行すべきと判断される場合に、前記第2種の拡大処理を実行して、第2種の前記処理済み画像を表わす第2種の前記処理済み画像データを生成する第2の生成部であって、前記第2種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと異なり、前記第2種の処理済み画像は、前記複数個の文字が拡大されて表現されているN行(前記Nは1以上の整数)の拡大文字列を含んでいる前記第2の生成部と、を備え、
前記Mは、2以上の整数であり、
前記判断部は、
前記M行の文字列が箇条書きによって表現されているのか否かを判断し、
前記M行の文字列が前記箇条書きによって表現されていると判断される場合に、前記第1種の拡大処理を実行すべきと判断し、
前記M行の文字列が前記箇条書きによって表現されていないと判断される場合に、前記第2種の拡大処理を実行すべきと判断する、画像処理装置。 - 前記M行の文字列のそれぞれでは、2個以上の文字が第1方向に沿って並び、
前記原画像データを構成する複数個の原画素は、前記M行の文字列を表わす複数個の文字列画素と、前記M行の文字列の背景を表わす複数個の背景画素と、を含み、
前記判断部は、
前記原画像データを利用して、前記M行の文字列を含むM個の文字列領域に対応するM個の射影ヒストグラムを生成し、前記M個の射影ヒストグラムを用いて、前記M行の文字列が箇条書きによって表現されているのか否かを判断し、
前記M個の射影ヒストグラムのそれぞれは、対応する文字列領域を構成する各原画素を前記第1方向に直交する第2の方向に沿って射影する場合における前記文字列画素の頻度の分布に相当するヒストグラムである、請求項2に記載の画像処理装置。 - 画像処理装置であって、
原画像を表わす原画像データを取得する取得部であって、前記原画像は、複数個の文字によって構成されるM行(前記Mは1以上の整数)の文字列を含む、前記取得部と、
前記原画像データに対して画像処理を実行して、処理済み画像を表わす処理済み画像データを生成する画像処理実行部であって、前記処理済み画像では、前記原画像と比べて、前記複数個の文字が拡大されて表現されている、前記画像処理実行部と、を備え、
前記画像処理実行部は、
前記原画像内の前記M行の文字列に基づいて、第1種の拡大処理を実行すべきか、第2種の拡大処理を実行すべきか、を判断する判断部と、
前記第1種の拡大処理を実行すべきと判断される場合に、前記第1種の拡大処理を実行して、第1種の前記処理済み画像を表わす第1種の前記処理済み画像データを生成する第1の生成部であって、前記第1種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと同じであり、前記第1種の処理済み画像は、前記複数個の文字が拡大されて表現されているM行の拡大文字列を含んでいる、前記第1の生成部と、
前記第2種の拡大処理を実行すべきと判断される場合に、前記第2種の拡大処理を実行して、第2種の前記処理済み画像を表わす第2種の前記処理済み画像データを生成する第2の生成部であって、前記第2種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと異なり、前記第2種の処理済み画像は、前記複数個の文字が拡大されて表現されているN行(前記Nは1以上の整数)の拡大文字列を含んでいる前記第2の生成部と、を備え、
前記Mは、2以上の整数であり、
前記M行の文字列のそれぞれでは、2個以上の文字が第1方向に沿って並び、
前記判断部は、
前記M行の文字列のそれぞれについて、当該1行の文字列の一端と前記M行の文字列を含むテキスト領域の境界との間の前記第1方向に沿った余白の長さを算出し、
前記M行の文字列について算出されるM個の余白の長さのばらつきが、所定のばらつきよりも大きいのか否かを判断し、
前記M個の余白の長さのばらつきが、前記所定のばらつきよりも大きいと判断される場合に、前記第1種の拡大処理を実行すべきと判断し、
前記M個の余白の長さのばらつきが、前記所定のばらつき以下であると判断される場合に、前記第2種の拡大処理を実行すべきと判断する、画像処理装置。 - 画像処理装置であって、
原画像を表わす原画像データを取得する取得部であって、前記原画像は、複数個の文字によって構成されるM行(前記Mは1以上の整数)の文字列を含む、前記取得部と、
前記原画像データに対して画像処理を実行して、処理済み画像を表わす処理済み画像データを生成する画像処理実行部であって、前記処理済み画像では、前記原画像と比べて、前記複数個の文字が拡大されて表現されている、前記画像処理実行部と、を備え、
前記画像処理実行部は、
前記原画像内の前記M行の文字列に基づいて、第1種の拡大処理を実行すべきか、第2種の拡大処理を実行すべきか、を判断する判断部と、
前記第1種の拡大処理を実行すべきと判断される場合に、前記第1種の拡大処理を実行して、第1種の前記処理済み画像を表わす第1種の前記処理済み画像データを生成する第1の生成部であって、前記第1種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと同じであり、前記第1種の処理済み画像は、前記複数個の文字が拡大されて表現されているM行の拡大文字列を含んでいる、前記第1の生成部と、
前記第2種の拡大処理を実行すべきと判断される場合に、前記第2種の拡大処理を実行して、第2種の前記処理済み画像を表わす第2種の前記処理済み画像データを生成する第2の生成部であって、前記第2種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと異なり、前記第2種の処理済み画像は、前記複数個の文字が拡大されて表現されているN行(前記Nは1以上の整数)の拡大文字列を含んでいる前記第2の生成部と、を備え、
前記M行の文字列を含むテキスト領域は、背景色を有し、
前記判断部は、
前記テキスト領域の前記背景色が、前記原画像内の背景色と異なるのか否かを判断し、
前記テキスト領域の前記背景色が、前記原画像内の前記背景色と異なると判断される場合に、前記第1種の拡大処理を実行すべきと判断し、
前記テキスト領域の前記背景色が、前記原画像内の前記背景色と同じであると判断される場合に、前記第2種の拡大処理を実行すべきと判断する、画像処理装置。 - 画像処理装置であって、
原画像を表わす原画像データを取得する取得部であって、前記原画像は、複数個の文字によって構成されるM行(前記Mは1以上の整数)の文字列を含む、前記取得部と、
前記原画像データに対して画像処理を実行して、処理済み画像を表わす処理済み画像データを生成する画像処理実行部であって、前記処理済み画像では、前記原画像と比べて、前記複数個の文字が拡大されて表現されている、前記画像処理実行部と、を備え、
前記画像処理実行部は、
前記原画像内の前記M行の文字列に基づいて、第1種の拡大処理を実行すべきか、第2種の拡大処理を実行すべきか、を判断する判断部と、
前記第1種の拡大処理を実行すべきと判断される場合に、前記第1種の拡大処理を実行して、第1種の前記処理済み画像を表わす第1種の前記処理済み画像データを生成する第1の生成部であって、前記第1種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと同じであり、前記第1種の処理済み画像は、前記複数個の文字が拡大されて表現されているM行の拡大文字列を含んでいる、前記第1の生成部と、
前記第2種の拡大処理を実行すべきと判断される場合に、前記第2種の拡大処理を実行して、第2種の前記処理済み画像を表わす第2種の前記処理済み画像データを生成する第2の生成部であって、前記第2種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと異なり、前記第2種の処理済み画像は、前記複数個の文字が拡大されて表現されているN行(前記Nは1以上の整数)の拡大文字列を含んでいる前記第2の生成部と、
前記原画像に含まれる複数個のオブジェクトを含む複数のオブジェクト領域を決定するオブジェクト領域決定部であって、前記複数のオブジェクト領域は、前記M行の文字列を含むテキスト領域を含む、前記オブジェクト領域決定部と、
前記テキスト領域を包含し、かつ、前記複数個のオブジェクト領域のうちの他のオブジェクト領域に重複しないスペース領域を決定するスペース領域決定部と、を備え、
前記第2の生成部は、
前記スペース領域に基づいて、前記テキスト領域のアスペクト比とは異なるアスペクト比を有する目標領域を決定し、
前記N行の拡大文字列が前記目標領域内に配置されている前記第2種の処理済み画像を表わす前記第2種の処理済み画像データを生成する、画像処理装置。 - 画像処理装置であって、
原画像を表わす原画像データを取得する取得部であって、前記原画像は、複数個の文字によって構成されるM行(前記Mは1以上の整数)の文字列を含む、前記取得部と、
前記原画像データに対して画像処理を実行して、処理済み画像を表わす処理済み画像データを生成する画像処理実行部であって、前記処理済み画像では、前記原画像と比べて、前記複数個の文字が拡大されて表現されている、前記画像処理実行部と、を備え、
前記画像処理実行部は、
前記原画像内の前記M行の文字列に基づいて、第1種の拡大処理を実行すべきか、第2種の拡大処理を実行すべきか、を判断する判断部と、
前記第1種の拡大処理を実行すべきと判断される場合に、前記第1種の拡大処理を実行して、第1種の前記処理済み画像を表わす第1種の前記処理済み画像データを生成する第1の生成部であって、前記第1種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと同じであり、前記第1種の処理済み画像は、前記複数個の文字が拡大されて表現されているM行の拡大文字列を含んでいる、前記第1の生成部と、
前記第2種の拡大処理を実行すべきと判断される場合に、前記第2種の拡大処理を実行して、第2種の前記処理済み画像を表わす第2種の前記処理済み画像データを生成する第2の生成部であって、前記第2種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと異なり、前記第2種の処理済み画像は、前記複数個の文字が拡大されて表現されているN行(前記Nは1以上の整数)の拡大文字列を含んでいる前記第2の生成部と、を備え、
前記M行の文字列のそれぞれでは、2個以上の文字が第1方向に沿って並び、
前記画像処理実行部は、さらに、
前記M行の文字列を含むテキスト領域を包含するスペース領域を決定するスペース領域決定部を備え、
前記第2の生成部は、
前記テキスト領域と前記スペース領域との間の前記第1方向に沿った2個の余白の長さと、前記第1方向に直交する第2方向に沿った2個の余白の長さと、に基づいて、前記テキスト領域のアスペクト比とは異なるアスペクト比を有する目標領域を決定し、
前記N行の文字列が前記目標領域内に配置されている前記第2種の処理済み画像を表わす前記第2種の処理済み画像データを生成する、画像処理装置。 - 前記画像処理実行部は、さらに、
前記M行の文字列のそれぞれでは、2個以上の文字が第1方向に沿って並び、
前記判断部は、
前記テキスト領域の前記第1方向に沿った長さに1より大きな目標値を乗算することによって得られる第1の長さが、前記スペース領域の前記第1方向に沿った長さ以下であり、かつ、前記テキスト領域の前記第1方向に直交する第2方向に沿った長さに前記目標値を乗算することによって得られる第2の長さが、前記スペース領域の前記第2方向に沿った長さ以下であるという特定の条件が満たされるのか否かを判断し、
前記特定の条件が満たされる場合に、前記第1種の拡大処理を実行すべきと判断し、
前記特定の条件が満たされない場合に、前記第2種の拡大処理を実行すべきと判断する、請求項6又は7に記載の画像処理装置。 - 前記判断部は、
前記M行の文字列に特定文字が含まれるのか否かを判断し、
前記M行の文字列に特定文字が含まれると判断される場合に、前記第1種の拡大処理を実行すべきと判断し、
前記M行の文字列に前記特定文字が含まれないと判断される場合に、前記第2種の拡大処理を実行すべきと判断し、
前記特定文字は、前記複数個の文字の文字サイズに応じて設定された閾値よりも大きいサイズを有する文字である、請求項6又は7に記載の画像処理装置。 - 前記第1種の処理済み画像内の前記M行の拡大文字列のそれぞれの行の文字数は、前記原画像内の前記M行の文字列の対応する行の文字数と等しく、
前記第2種の処理済み画像内の前記N行の拡大文字列のうちの先頭行の文字数は、前記原画像内の前記M行の文字列のうちの先頭行の文字数と異なる、請求項1から9のいずれか一項に記載の画像処理装置。 - 前記第2の生成部は、前記M行よりも少ない前記N行の拡大文字列を構成する前記複数個の文字を含む前記第2種の処理済み画像を表す前記第2の処理済み画像データを生成し、前記N行の拡大文字列のうちの先頭行の文字数が、前記原画像内の前記M行の文字列のうちの先頭行の文字数よりも多い、請求項1から10のいずれか一項に記載の画像処理装置。
- 前記第2の生成部は、前記M行よりも多い前記N行の拡大文字列を構成する前記複数個の文字を含む前記第2種の処理済み画像を表す前記第2の処理済み画像データを生成し、前記N行の拡大文字列のうちの先頭行の文字数が、前記原画像内の前記M行の文字列のうちの先頭行の文字数よりも少ない、請求項1から10のいずれか一項に記載の画像処理装置。
- 前記第1種の処理済み画像内の前記M行の拡大文字列を含む領域のアスペクト比は、前記原画像内の前記M行の文字列を含む領域のアスペクト比と等しく、
前記第2種の処理済み画像内の前記N行の拡大文字列を含む領域のアスペクト比は、前記原画像内の前記M行の文字列を含む領域のアスペクト比と異なる、請求項1から12のいずれか一項に記載の画像処理装置。 - 前記第1の生成部は、前記第1種の拡大処理を実行して、前記原画像内の前記複数個の文字が拡大され、かつ、前記原画像に含まれる前記複数個の文字以外のオブジェクトが拡大されていない前記第1種の処理済み画像を表す前記第1種の処理済み画像データを生成する、請求項1から13のいずれか一項に記載の画像処理装置。
- 前記第2の生成部は、前記第2種の拡大処理を実行して、前記原画像内の前記複数個の文字が拡大され、かつ、前記原画像に含まれる前記複数個の文字以外のオブジェクトが拡大されていない前記第2種の処理済み画像を表す前記第2種の処理済み画像データを生成する、請求項1から14のいずれか一項に記載の画像処理装置。
- 画像処理装置のためのコンピュータプログラムであって、
前記画像処理装置に搭載されるコンピュータに、以下の各ステップ、即ち、
原画像を表わす原画像データを取得する取得ステップであって、前記原画像は、複数個の文字によって構成されるM行(前記Mは1以上の整数)の文字列を含む、前記取得ステップと、
前記原画像データに対して画像処理を実行して、処理済み画像を表わす処理済み画像データを生成する画像処理実行ステップであって、前記処理済み画像では、前記原画像と比べて、前記複数個の文字が拡大されて表現されている、前記画像処理実行ステップと、を実行させ、
前記画像処理実行ステップは、
前記原画像内の前記M行の文字列に基づいて、第1種の拡大処理を実行すべきか、第2種の拡大処理を実行すべきか、を判断する判断ステップと、
前記第1種の拡大処理を実行すべきと判断される場合に、前記第1種の拡大処理を実行して、第1種の前記処理済み画像を表わす第1種の前記処理済み画像データを生成する第1の生成ステップであって、前記第1種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと同じであり、前記第1種の処理済み画像は、前記複数個の文字が拡大されて表現されているM行の拡大文字列を含んでいる、前記第1の生成ステップと、
前記第2種の拡大処理を実行すべきと判断される場合に、前記第2種の拡大処理を実行して、第2種の前記処理済み画像を表わす第2種の前記処理済み画像データを生成する第2の生成ステップであって、前記第2種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと異なり、前記第2種の処理済み画像は、前記複数個の文字が拡大されて表現されているN行(前記Nは1以上の整数)の拡大文字列を含んでいる、前記第2の生成ステップと、を含み、
前記判断ステップでは、
前記Mが1であるのか、前記Mが2以上であるのか、を判断し、
前記Mが1であると判断される場合に、前記第1種の拡大処理を実行すべきと判断し、
前記Mが2以上であると判断される場合に、前記第2種の拡大処理を実行すべきと判断する、コンピュータプログラム。 - 画像処理装置のためのコンピュータプログラムであって、
前記画像処理装置に搭載されるコンピュータに、以下の各ステップ、即ち、
原画像を表わす原画像データを取得する取得ステップであって、前記原画像は、複数個の文字によって構成されるM行(前記Mは1以上の整数)の文字列を含む、前記取得ステップと、
前記原画像データに対して画像処理を実行して、処理済み画像を表わす処理済み画像データを生成する画像処理実行ステップであって、前記処理済み画像では、前記原画像と比べて、前記複数個の文字が拡大されて表現されている、前記画像処理実行ステップと、を実行させ、
前記画像処理実行ステップは、
前記原画像内の前記M行の文字列に基づいて、第1種の拡大処理を実行すべきか、第2種の拡大処理を実行すべきか、を判断する判断ステップと、
前記第1種の拡大処理を実行すべきと判断される場合に、前記第1種の拡大処理を実行して、第1種の前記処理済み画像を表わす第1種の前記処理済み画像データを生成する第1の生成ステップであって、前記第1種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと同じであり、前記第1種の処理済み画像は、前記複数個の文字が拡大されて表現されているM行の拡大文字列を含んでいる、前記第1の生成ステップと、
前記第2種の拡大処理を実行すべきと判断される場合に、前記第2種の拡大処理を実行して、第2種の前記処理済み画像を表わす第2種の前記処理済み画像データを生成する第2の生成ステップであって、前記第2種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと異なり、前記第2種の処理済み画像は、前記複数個の文字が拡大されて表現されているN行(前記Nは1以上の整数)の拡大文字列を含んでいる、前記第2の生成ステップと、を含み、
前記Mは、2以上の整数であり、
前記判断ステップでは、
前記M行の文字列が箇条書きによって表現されているのか否かを判断し、
前記M行の文字列が前記箇条書きによって表現されていると判断される場合に、前記第1種の拡大処理を実行すべきと判断し、
前記M行の文字列が前記箇条書きによって表現されていないと判断される場合に、前記第2種の拡大処理を実行すべきと判断する、コンピュータプログラム。 - 画像処理装置のためのコンピュータプログラムであって、
前記画像処理装置に搭載されるコンピュータに、以下の各ステップ、即ち、
原画像を表わす原画像データを取得する取得ステップであって、前記原画像は、複数個の文字によって構成されるM行(前記Mは1以上の整数)の文字列を含む、前記取得ステップと、
前記原画像データに対して画像処理を実行して、処理済み画像を表わす処理済み画像データを生成する画像処理実行ステップであって、前記処理済み画像では、前記原画像と比べて、前記複数個の文字が拡大されて表現されている、前記画像処理実行ステップと、を実行させ、
前記画像処理実行ステップは、
前記原画像内の前記M行の文字列に基づいて、第1種の拡大処理を実行すべきか、第2種の拡大処理を実行すべきか、を判断する判断ステップと、
前記第1種の拡大処理を実行すべきと判断される場合に、前記第1種の拡大処理を実行して、第1種の前記処理済み画像を表わす第1種の前記処理済み画像データを生成する第1の生成ステップであって、前記第1種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと同じであり、前記第1種の処理済み画像は、前記複数個の文字が拡大されて表現されているM行の拡大文字列を含んでいる、前記第1の生成ステップと、
前記第2種の拡大処理を実行すべきと判断される場合に、前記第2種の拡大処理を実行して、第2種の前記処理済み画像を表わす第2種の前記処理済み画像データを生成する第2の生成ステップであって、前記第2種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと異なり、前記第2種の処理済み画像は、前記複数個の文字が拡大されて表現されているN行(前記Nは1以上の整数)の拡大文字列を含んでいる、前記第2の生成ステップと、を含み、
前記Mは、2以上の整数であり、
前記M行の文字列のそれぞれでは、2個以上の文字が第1方向に沿って並び、
前記判断ステップでは、
前記M行の文字列のそれぞれについて、当該1行の文字列の一端と前記M行の文字列を含むテキスト領域の境界との間の前記第1方向に沿った余白の長さを算出し、
前記M行の文字列について算出されるM個の余白の長さのばらつきが、所定のばらつきよりも大きいのか否かを判断し、
前記M個の余白の長さのばらつきが、前記所定のばらつきよりも大きいと判断される場合に、前記第1種の拡大処理を実行すべきと判断し、
前記M個の余白の長さのばらつきが、前記所定のばらつき以下であると判断される場合に、前記第2種の拡大処理を実行すべきと判断する、コンピュータプログラム。 - 画像処理装置のためのコンピュータプログラムであって、
前記画像処理装置に搭載されるコンピュータに、以下の各ステップ、即ち、
原画像を表わす原画像データを取得する取得ステップであって、前記原画像は、複数個の文字によって構成されるM行(前記Mは1以上の整数)の文字列を含む、前記取得ステップと、
前記原画像データに対して画像処理を実行して、処理済み画像を表わす処理済み画像データを生成する画像処理実行ステップであって、前記処理済み画像では、前記原画像と比べて、前記複数個の文字が拡大されて表現されている、前記画像処理実行ステップと、を実行させ、
前記画像処理実行ステップは、
前記原画像内の前記M行の文字列に基づいて、第1種の拡大処理を実行すべきか、第2種の拡大処理を実行すべきか、を判断する判断ステップと、
前記第1種の拡大処理を実行すべきと判断される場合に、前記第1種の拡大処理を実行して、第1種の前記処理済み画像を表わす第1種の前記処理済み画像データを生成する第1の生成ステップであって、前記第1種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと同じであり、前記第1種の処理済み画像は、前記複数個の文字が拡大されて表現されているM行の拡大文字列を含んでいる、前記第1の生成ステップと、
前記第2種の拡大処理を実行すべきと判断される場合に、前記第2種の拡大処理を実行して、第2種の前記処理済み画像を表わす第2種の前記処理済み画像データを生成する第2の生成ステップであって、前記第2種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと異なり、前記第2種の処理済み画像は、前記複数個の文字が拡大されて表現されているN行(前記Nは1以上の整数)の拡大文字列を含んでいる、前記第2の生成ステップと、を含み、
前記M行の文字列を含むテキスト領域は、背景色を有し、
前記判断ステップでは、
前記テキスト領域の前記背景色が、前記原画像内の背景色と異なるのか否かを判断し、
前記テキスト領域の前記背景色が、前記原画像内の前記背景色と異なると判断される場合に、前記第1種の拡大処理を実行すべきと判断し、
前記テキスト領域の前記背景色が、前記原画像内の前記背景色と同じであると判断される場合に、前記第2種の拡大処理を実行すべきと判断する、コンピュータプログラム。 - 画像処理装置のためのコンピュータプログラムであって、
前記画像処理装置に搭載されるコンピュータに、以下の各ステップ、即ち、
原画像を表わす原画像データを取得する取得ステップであって、前記原画像は、複数個の文字によって構成されるM行(前記Mは1以上の整数)の文字列を含む、前記取得ステップと、
前記原画像データに対して画像処理を実行して、処理済み画像を表わす処理済み画像データを生成する画像処理実行ステップであって、前記処理済み画像では、前記原画像と比べて、前記複数個の文字が拡大されて表現されている、前記画像処理実行ステップと、を実行させ、
前記画像処理実行ステップは、
前記原画像内の前記M行の文字列に基づいて、第1種の拡大処理を実行すべきか、第2種の拡大処理を実行すべきか、を判断する判断ステップと、
前記第1種の拡大処理を実行すべきと判断される場合に、前記第1種の拡大処理を実行して、第1種の前記処理済み画像を表わす第1種の前記処理済み画像データを生成する第1の生成ステップであって、前記第1種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと同じであり、前記第1種の処理済み画像は、前記複数個の文字が拡大されて表現されているM行の拡大文字列を含んでいる、前記第1の生成ステップと、
前記第2種の拡大処理を実行すべきと判断される場合に、前記第2種の拡大処理を実行して、第2種の前記処理済み画像を表わす第2種の前記処理済み画像データを生成する第2の生成ステップであって、前記第2種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと異なり、前記第2種の処理済み画像は、前記複数個の文字が拡大されて表現されているN行(前記Nは1以上の整数)の拡大文字列を含んでいる、前記第2の生成ステップと、
前記原画像に含まれる複数個のオブジェクトを含む複数のオブジェクト領域を決定するオブジェクト領域決定ステップであって、前記複数のオブジェクト領域は、前記M行の文字列を含むテキスト領域を含む、前記オブジェクト領域決定ステップと、
前記テキスト領域を包含し、かつ、前記複数個のオブジェクト領域のうちの他のオブジェクト領域に重複しないスペース領域を決定するスペース領域決定ステップと、を含み、
前記第2の生成ステップでは、
前記スペース領域に基づいて、前記テキスト領域のアスペクト比とは異なるアスペクト比を有する目標領域を決定し、
前記N行の拡大文字列が前記目標領域内に配置されている前記第2種の処理済み画像を表わす前記第2種の処理済み画像データを生成する、コンピュータプログラム。 - 画像処理装置のためのコンピュータプログラムであって、
前記画像処理装置に搭載されるコンピュータに、以下の各ステップ、即ち、
原画像を表わす原画像データを取得する取得ステップであって、前記原画像は、複数個の文字によって構成されるM行(前記Mは1以上の整数)の文字列を含む、前記取得ステップと、
前記原画像データに対して画像処理を実行して、処理済み画像を表わす処理済み画像データを生成する画像処理実行ステップであって、前記処理済み画像では、前記原画像と比べて、前記複数個の文字が拡大されて表現されている、前記画像処理実行ステップと、を実行させ、
前記画像処理実行ステップは、
前記原画像内の前記M行の文字列に基づいて、第1種の拡大処理を実行すべきか、第2種の拡大処理を実行すべきか、を判断する判断ステップと、
前記第1種の拡大処理を実行すべきと判断される場合に、前記第1種の拡大処理を実行して、第1種の前記処理済み画像を表わす第1種の前記処理済み画像データを生成する第1の生成ステップであって、前記第1種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと同じであり、前記第1種の処理済み画像は、前記複数個の文字が拡大されて表現されているM行の拡大文字列を含んでいる、前記第1の生成ステップと、
前記第2種の拡大処理を実行すべきと判断される場合に、前記第2種の拡大処理を実行して、第2種の前記処理済み画像を表わす第2種の前記処理済み画像データを生成する第2の生成ステップであって、前記第2種の処理済み画像内の前記複数個の文字のレイアウトは、前記原画像内の前記複数個の文字のレイアウトと異なり、前記第2種の処理済み画像は、前記複数個の文字が拡大されて表現されているN行(前記Nは1以上の整数)の拡大文字列を含んでいる、前記第2の生成ステップと、を含み、
前記M行の文字列のそれぞれでは、2個以上の文字が第1方向に沿って並び、
前記画像処理実行ステップは、さらに、
前記M行の文字列を含むテキスト領域を包含するスペース領域を決定するスペース領域決定ステップを含み、
前記第2の生成ステップでは、
前記テキスト領域と前記スペース領域との間の前記第1方向に沿った2個の余白の長さと、前記第1方向に直交する第2方向に沿った2個の余白の長さと、に基づいて、前記テキスト領域のアスペクト比とは異なるアスペクト比を有する目標領域を決定し、
前記N行の文字列が前記目標領域内に配置されている前記第2種の処理済み画像を表わす前記第2種の処理済み画像データを生成する、コンピュータプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014044339A JP6311360B2 (ja) | 2014-03-06 | 2014-03-06 | 画像処理装置 |
US14/640,483 US9600917B2 (en) | 2014-03-06 | 2015-03-06 | Image processing device |
US15/420,401 US10009507B2 (en) | 2014-03-06 | 2017-01-31 | Image processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014044339A JP6311360B2 (ja) | 2014-03-06 | 2014-03-06 | 画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015170982A JP2015170982A (ja) | 2015-09-28 |
JP6311360B2 true JP6311360B2 (ja) | 2018-04-18 |
Family
ID=54017837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014044339A Active JP6311360B2 (ja) | 2014-03-06 | 2014-03-06 | 画像処理装置 |
Country Status (2)
Country | Link |
---|---|
US (2) | US9600917B2 (ja) |
JP (1) | JP6311360B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6344064B2 (ja) * | 2014-05-30 | 2018-06-20 | ブラザー工業株式会社 | 画像処理装置およびコンピュータプログラム |
CN107533548B (zh) * | 2015-07-23 | 2021-07-30 | 惠普发展公司有限责任合伙企业 | 在文本显示器上展示显示数据 |
US10956439B2 (en) * | 2016-02-19 | 2021-03-23 | Micron Technology, Inc. | Data transfer with a bit vector operation device |
US9984314B2 (en) * | 2016-05-06 | 2018-05-29 | Microsoft Technology Licensing, Llc | Dynamic classifier selection based on class skew |
CN109240572B (zh) * | 2018-07-20 | 2021-01-05 | 华为技术有限公司 | 一种获取图片的方法、对图片进行处理的方法及装置 |
CN110865859B (zh) * | 2019-10-29 | 2021-10-22 | 维沃移动通信有限公司 | 图片显示方法、装置、电子设备及介质 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5204946A (en) * | 1988-06-17 | 1993-04-20 | Canon Kabushiki Kaisha | Mixed text and image data processing |
JPH0594511A (ja) | 1991-10-02 | 1993-04-16 | Ricoh Co Ltd | 画像処理装置 |
JP3234148B2 (ja) * | 1996-03-07 | 2001-12-04 | シャープ株式会社 | 表示制御装置 |
JPH1125283A (ja) | 1997-07-04 | 1999-01-29 | Fuji Xerox Co Ltd | 文書画像処理装置 |
JP2000137801A (ja) | 1998-11-02 | 2000-05-16 | Fuji Xerox Co Ltd | 画像形成方法および装置並びに画像処理制御プログラムを記憶した媒体 |
JP2002374400A (ja) * | 2001-06-15 | 2002-12-26 | Fuji Xerox Co Ltd | 画像出力装置 |
JP4182895B2 (ja) | 2004-02-09 | 2008-11-19 | 富士ゼロックス株式会社 | 画像形成装置及び画像形成支援装置 |
US20060227153A1 (en) * | 2005-04-08 | 2006-10-12 | Picsel Research Limited | System and method for dynamically zooming and rearranging display items |
KR101445603B1 (ko) * | 2007-08-27 | 2014-09-29 | 삼성전자주식회사 | 디스플레이 장치의 화면 크기에 기초한 적응적 영상 처리장치 및 영상 스케일링 방법 |
JP2010183484A (ja) | 2009-02-09 | 2010-08-19 | Seiko Epson Corp | コピー機能を有する画像形成装置 |
US9069731B2 (en) * | 2009-12-29 | 2015-06-30 | Olive Software Inc. | System and method for providing online versions of print-medium publications |
JP5229257B2 (ja) * | 2010-03-26 | 2013-07-03 | パナソニック株式会社 | 表示制御処理装置、表示制御処理方法及び表示制御処理プログラム |
JP2011242987A (ja) | 2010-05-18 | 2011-12-01 | Fujifilm Corp | ドキュメント画像配信装置及びドキュメント画像配信方法並びにドキュメント閲覧システム |
JP5654851B2 (ja) | 2010-11-18 | 2015-01-14 | 富士フイルム株式会社 | 文書画像表示装置ならびにその動作制御方法およびその制御プログラム |
JP5182902B2 (ja) | 2011-03-31 | 2013-04-17 | 京セラコミュニケーションシステム株式会社 | 文書イメージ出力装置 |
JP2012230623A (ja) | 2011-04-27 | 2012-11-22 | Fujifilm Corp | 文書ファイル表示装置、方法およびプログラム |
US8855413B2 (en) * | 2011-05-13 | 2014-10-07 | Abbyy Development Llc | Image reflow at word boundaries |
-
2014
- 2014-03-06 JP JP2014044339A patent/JP6311360B2/ja active Active
-
2015
- 2015-03-06 US US14/640,483 patent/US9600917B2/en active Active
-
2017
- 2017-01-31 US US15/420,401 patent/US10009507B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20170142287A1 (en) | 2017-05-18 |
JP2015170982A (ja) | 2015-09-28 |
US20150254804A1 (en) | 2015-09-10 |
US9600917B2 (en) | 2017-03-21 |
US10009507B2 (en) | 2018-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6311360B2 (ja) | 画像処理装置 | |
JP5274495B2 (ja) | 文書画像サイズ変更方法 | |
JP4483909B2 (ja) | 翻訳装置及びプログラム | |
JP5111268B2 (ja) | 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 | |
US20110113323A1 (en) | Systems and methods to resize document content | |
JP6029344B2 (ja) | 画像処理装置、画像処理方法、プログラム | |
US8384936B2 (en) | System which performs resolution-dependent vectorization of print data | |
JP5477320B2 (ja) | 画像処理装置 | |
JP6127877B2 (ja) | 画像処理装置、および、コンピュータプログラム | |
JP6303622B2 (ja) | 画像処理装置 | |
WO2011001669A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP5049922B2 (ja) | 画像処理装置及び画像処理方法 | |
JP5924207B2 (ja) | 画像処理装置及びプログラム | |
JP5590960B2 (ja) | 画像形成装置、画像形成方法およびプログラム | |
JP3619143B2 (ja) | 画像処理装置およびその方法 | |
US9277074B2 (en) | Image processing apparatus, method, and medium determining whether image data of a page to be processed is blank and contains a foreground object and transmitting the foreground object obtained by removing a background object | |
JP5111242B2 (ja) | 画像処理装置及び方法 | |
US8295602B2 (en) | Image processing apparatus and image processing method | |
JP6281329B2 (ja) | 画像処理装置 | |
JP6264955B2 (ja) | 画像処理装置 | |
JP6323076B2 (ja) | 画像処理装置 | |
JP6323075B2 (ja) | 画像処理装置 | |
JP2008077148A (ja) | 画像処理システムおよび画像処理装置 | |
JP2008294831A (ja) | 画像歪み補正装置 | |
JP2023021794A (ja) | 画像処理装置、画像処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160307 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170425 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180305 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6311360 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |