JP2015103114A - テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム - Google Patents
テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム Download PDFInfo
- Publication number
- JP2015103114A JP2015103114A JP2013244437A JP2013244437A JP2015103114A JP 2015103114 A JP2015103114 A JP 2015103114A JP 2013244437 A JP2013244437 A JP 2013244437A JP 2013244437 A JP2013244437 A JP 2013244437A JP 2015103114 A JP2015103114 A JP 2015103114A
- Authority
- JP
- Japan
- Prior art keywords
- character
- text data
- embedding
- specific
- size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Editing Of Facsimile Originals (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】文字認識処理部19により認識された各文字の中から特定の文字が検出された場合は、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置を決定し、出力ファイルに埋め込む。
【選択図】 図2
Description
(1)開始位置、終了位置の座標をともに(0,0)とする、
(2)前の文字の終了位置を開始位置、後の文字の開始位置を終了位置とする、
等の違いがある。
(1)画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識手段と、前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む際に、埋め込まれる前記テキストデータのサイズ及び位置を決定する決定手段と、前記決定手段により決定されたサイズ及び位置に基づいて、前記テキストデータを前記出力ファイルに埋め込む埋め込み手段と、前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出手段と、を備え、前記特定文字検出手段により前記特定の文字が検出された場合は、前記決定手段は、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置を決定することを特徴とするテキストデータの埋め込み処理装置。
(2)前記特定の文字は空白文字である前項1に記載のテキストデータの埋め込み処理装置。
(3)前記空白文字の前後に文字が存在しない場合、該空白文字を削除する前項2に記載のテキストデータの埋め込み処理装置。
(4)前記空白文字が行頭に存在する場合は、該空白文字を削除する前項2または3に記載のテキストデータの埋め込み処理装置。
(5)前記特定の文字は句読点、カンマ、ドットの少なくともいずれかである前項1に記載のテキストデータの埋め込み処理装置。
(6)前記文字の言語が全角文字を含む2バイト文字の言語である場合に限り、前記決定手段は、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報に基づいて、前記特定の文字のサイズ及び位置を決定する前項1〜5のいずれかに記載のテキストデータの埋め込み処理装置。
(7)画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識手段と、前記文字認識処理により認識された文字列を、予め設定された規則に従って複数の文字グループに区切る文字列区切り手段と、前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む埋め込み手段と、前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出手段と、前記特定文字検出手段により検出された特定文字の位置を判定する判定手段と、を備え、前記特定文字検出手段により前記特定の文字が検出され、かつ前記判定手段により検出された特定文字の位置が前記文字列区切り手段により区切られた文字グループの先頭でかつ行頭でないと判定された場合は、前記埋め込み手段は、前記特定の文字をその前の文字グループの最後に連結させて埋め込むことを特徴とするテキストデータの埋め込み処理装置。
(8)前記文字列区切り手段は、文字数、空白文字、句読点、カンマ、ドットの少なくともいずれかに基づいて、各行の文字列を複数の文字グループに区切る前項7に記載のテキストデータの埋め込み処理装置。
(9)画像を読み取る読み取り手段と、前項1〜8のいずれかに記載のテキストデータの埋め込み処理装置とを備えた画像処理装置。
(10)画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む際に、埋め込まれる前記テキストデータのサイズ及び位置を決定する決定ステップと、前記決定ステップにより決定されたサイズ及び位置に基づいて、前記テキストデータを前記出力ファイルに埋め込む埋め込みステップと、前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、を備え、前記特定文字検出ステツプにより前記特定の文字が検出された場合は、前記決定ステップでは、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置を決定することを特徴とするテキストデータの埋め込み処理方法。
(11)画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、前記文字認識ステップにより認識された文字列を、予め設定された規則に従って複数の文字グループに区切る文字列区切りステップと、前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む埋め込みステップと、前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、前記特定文字検出ステップにより検出された特定文字の位置を判定する判定ステップと、を備え、前記特定文字検出ステップにより前記特定の文字が検出され、かつ前記判定ステップにより検出された特定文字の位置が前記文字列区切りステップにより区切られた文字グループの先頭でかつ行頭でないと判定された場合は、前記埋め込みステップでは、前記特定の文字をその前の文字グループの最後に連結させて埋め込むことを特徴とするテキストデータの埋め込み処理方法。
(12)画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む際に、埋め込まれる前記テキストデータのサイズ及び位置を決定する決定ステップと、前記決定ステップにより決定されたサイズ及び位置に基づいて、前記テキストデータを前記出力ファイルに埋め込む埋め込みステップと、前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、をテキストデータの埋め込み処理装置のコンピュータに実行させ、さらに、前記特定文字検出ステツプにより前記特定の文字が検出された場合は、前記決定ステップでは、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置を決定する処理を、前記コンピュータに実行させるためのテキストデータの埋め込み処理方法。
(13)画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、前記文字認識ステップにより認識された文字列を、予め設定された規則に従って複数の文字グループに区切る文字列区切りステップと、前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む埋め込みステップと、前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、前記特定文字検出ステップにより検出された特定文字の位置を判定する判定ステップと、をテキストデータの埋め込み処理装置のコンピュータに実行させ、さらに、前記特定文字検出ステップにより前記特定の文字が検出され、かつ前記判定ステップにより検出された特定文字の位置が前記文字列区切りステップにより区切られた文字グループの先頭でかつ行頭でないと判定された場合は、前記埋め込みステップでは、前記特定の文字をその前の文字グループの最後に連結させて埋め込む処理を、前記コンピュータに実行させるためのテキストデータの埋め込み処理方法。
11 CPU
12 ROM
14 スキャナ部
15 記憶部
17 操作パネル
18 ネットワークコントローラ
19 文字認識部
100 文字画像
100a 句点
100b 読点
200 各文字の外接矩形
300、301、310、330、331、340 切り出し領域
400 埋め込み文字
500 スペース
Claims (13)
- 画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識手段と、
前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む際に、埋め込まれる前記テキストデータのサイズ及び位置を決定する決定手段と、
前記決定手段により決定されたサイズ及び位置に基づいて、前記テキストデータを前記出力ファイルに埋め込む埋め込み手段と、
前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出手段と、
を備え、
前記特定文字検出手段により前記特定の文字が検出された場合は、前記決定手段は、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置を決定することを特徴とするテキストデータの埋め込み処理装置。 - 前記特定の文字は空白文字である請求項1に記載のテキストデータの埋め込み処理装置。
- 前記空白文字の前後に文字が存在しない場合、該空白文字を削除する請求項2に記載のテキストデータの埋め込み処理装置。
- 前記空白文字が行頭に存在する場合は、該空白文字を削除する請求項2または3に記載のテキストデータの埋め込み処理装置。
- 前記特定の文字は句読点、カンマ、ドットの少なくともいずれかである請求項1に記載のテキストデータの埋め込み処理装置。
- 前記文字の言語が全角文字を含む2バイト文字の言語である場合に限り、前記決定手段は、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報に基づいて、前記特定の文字のサイズ及び位置を決定する請求項1〜5のいずれかに記載のテキストデータの埋め込み処理装置。
- 画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識手段と、
前記文字認識処理により認識された文字列を、予め設定された規則に従って複数の文字グループに区切る文字列区切り手段と、
前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む埋め込み手段と、
前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出手段と、
前記特定文字検出手段により検出された特定文字の位置を判定する判定手段と、
を備え、
前記特定文字検出手段により前記特定の文字が検出され、かつ前記判定手段により検出された特定文字の位置が前記文字列区切り手段により区切られた文字グループの先頭でかつ行頭でないと判定された場合は、前記埋め込み手段は、前記特定の文字をその前の文字グループの最後に連結させて埋め込むことを特徴とするテキストデータの埋め込み処理装置。 - 前記文字列区切り手段は、文字数、空白文字、句読点、カンマ、ドットの少なくともいずれかに基づいて、各行の文字列を複数の文字グループに区切る請求項7に記載のテキストデータの埋め込み処理装置。
- 画像を読み取る読み取り手段と、請求項1〜8のいずれかに記載のテキストデータの埋め込み処理装置とを備えた画像処理装置。
- 画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、
前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む際に、埋め込まれる前記テキストデータのサイズ及び位置を決定する決定ステップと、
前記決定ステップにより決定されたサイズ及び位置に基づいて、前記テキストデータを前記出力ファイルに埋め込む埋め込みステップと、
前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、
を備え、
前記特定文字検出ステツプにより前記特定の文字が検出された場合は、前記決定ステップでは、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置を決定することを特徴とするテキストデータの埋め込み処理方法。 - 画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、
前記文字認識ステップにより認識された文字列を、予め設定された規則に従って複数の文字グループに区切る文字列区切りステップと、
前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む埋め込みステップと、
前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、
前記特定文字検出ステップにより検出された特定文字の位置を判定する判定ステップと、
を備え、
前記特定文字検出ステップにより前記特定の文字が検出され、かつ前記判定ステップにより検出された特定文字の位置が前記文字列区切りステップにより区切られた文字グループの先頭でかつ行頭でないと判定された場合は、前記埋め込みステップでは、前記特定の文字をその前の文字グループの最後に連結させて埋め込むことを特徴とするテキストデータの埋め込み処理方法。 - 画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、
前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む際に、埋め込まれる前記テキストデータのサイズ及び位置を決定する決定ステップと、
前記決定ステップにより決定されたサイズ及び位置に基づいて、前記テキストデータを前記出力ファイルに埋め込む埋め込みステップと、
前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、
をテキストデータの埋め込み処理装置のコンピュータに実行させ、さらに、
前記特定文字検出ステツプにより前記特定の文字が検出された場合は、前記決定ステップでは、該特定の文字の1文字前の文字または1文字後の文字のサイズ及び位置情報を用いて、前記特定の文字のサイズ及び位置を決定する処理を、前記コンピュータに実行させるためのテキストデータの埋め込み処理方法。 - 画像を読み取る読み取り手段で読み取られた画像に対して文字認識処理を行う文字認識ステップと、
前記文字認識ステップにより認識された文字列を、予め設定された規則に従って複数の文字グループに区切る文字列区切りステップと、
前記文字認識処理により認識された各文字のテキストデータを、前記読み取り手段の出力ファイルに埋め込む埋め込みステップと、
前記文字認識処理により認識された各文字の中から特定の文字を検出する特定文字検出ステップと、
前記特定文字検出ステップにより検出された特定文字の位置を判定する判定ステップと、
をテキストデータの埋め込み処理装置のコンピュータに実行させ、さらに、
前記特定文字検出ステップにより前記特定の文字が検出され、かつ前記判定ステップにより検出された特定文字の位置が前記文字列区切りステップにより区切られた文字グループの先頭でかつ行頭でないと判定された場合は、前記埋め込みステップでは、前記特定の文字をその前の文字グループの最後に連結させて埋め込む処理を、前記コンピュータに実行させるためのテキストデータの埋め込み処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013244437A JP6201686B2 (ja) | 2013-11-26 | 2013-11-26 | テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013244437A JP6201686B2 (ja) | 2013-11-26 | 2013-11-26 | テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015103114A true JP2015103114A (ja) | 2015-06-04 |
JP6201686B2 JP6201686B2 (ja) | 2017-09-27 |
Family
ID=53378744
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013244437A Active JP6201686B2 (ja) | 2013-11-26 | 2013-11-26 | テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6201686B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107133615A (zh) * | 2016-02-26 | 2017-09-05 | 佳能株式会社 | 信息处理设备和信息处理方法 |
CN107729898A (zh) * | 2016-08-10 | 2018-02-23 | 富士通株式会社 | 检测文本图像中的文本行的方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04236685A (ja) * | 1991-01-18 | 1992-08-25 | Ricoh Co Ltd | 文字間スペース認識方法 |
JP2008059527A (ja) * | 2006-09-04 | 2008-03-13 | Ricoh Co Ltd | 画像処理装置およびプログラム |
JP2009009527A (ja) * | 2007-06-29 | 2009-01-15 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム |
JP2009223363A (ja) * | 2008-03-13 | 2009-10-01 | Fuji Xerox Co Ltd | 文書処理装置および文書処理プログラム |
JP2010211470A (ja) * | 2009-03-10 | 2010-09-24 | Ricoh Co Ltd | 文書データ生成装置と文書データ生成方法 |
JP2013080349A (ja) * | 2011-10-03 | 2013-05-02 | Canon Inc | 画像処理装置、画像処理方法、およびプログラム |
-
2013
- 2013-11-26 JP JP2013244437A patent/JP6201686B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04236685A (ja) * | 1991-01-18 | 1992-08-25 | Ricoh Co Ltd | 文字間スペース認識方法 |
JP2008059527A (ja) * | 2006-09-04 | 2008-03-13 | Ricoh Co Ltd | 画像処理装置およびプログラム |
JP2009009527A (ja) * | 2007-06-29 | 2009-01-15 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム |
JP2009223363A (ja) * | 2008-03-13 | 2009-10-01 | Fuji Xerox Co Ltd | 文書処理装置および文書処理プログラム |
JP2010211470A (ja) * | 2009-03-10 | 2010-09-24 | Ricoh Co Ltd | 文書データ生成装置と文書データ生成方法 |
JP2013080349A (ja) * | 2011-10-03 | 2013-05-02 | Canon Inc | 画像処理装置、画像処理方法、およびプログラム |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107133615A (zh) * | 2016-02-26 | 2017-09-05 | 佳能株式会社 | 信息处理设备和信息处理方法 |
KR20170101125A (ko) * | 2016-02-26 | 2017-09-05 | 캐논 가부시끼가이샤 | 정보 처리장치, 정보 처리방법, 및 기억매체 |
US10395131B2 (en) | 2016-02-26 | 2019-08-27 | Canon Kabushiki Kaisha | Apparatus, method and non-transitory storage medium for changing position coordinates of a character area stored in association with a character recognition result |
KR102090973B1 (ko) * | 2016-02-26 | 2020-03-19 | 캐논 가부시끼가이샤 | 정보 처리장치, 정보 처리방법, 및 기억매체 |
CN107133615B (zh) * | 2016-02-26 | 2021-08-13 | 佳能株式会社 | 信息处理设备和信息处理方法 |
CN107729898A (zh) * | 2016-08-10 | 2018-02-23 | 富士通株式会社 | 检测文本图像中的文本行的方法和装置 |
CN107729898B (zh) * | 2016-08-10 | 2020-12-22 | 富士通株式会社 | 检测文本图像中的文本行的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6201686B2 (ja) | 2017-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10528679B2 (en) | System and method for real time translation | |
US10860785B2 (en) | Apparatus for setting file name and the like for scan image, control method thereof, and storage medium | |
EP2162859B1 (en) | Image processing apparatus, image processing method, and computer program | |
US9442899B2 (en) | Image forming apparatus, text data embedding method, and recording medium | |
JP7159608B2 (ja) | 操作画面の表示装置、画像処理装置及びプログラム | |
JP2009146064A (ja) | 画像処理装置、画像処理方法、そのプログラム及び記憶媒体 | |
JP6427964B2 (ja) | 画像処理システム、情報処理装置及びプログラム | |
US9614984B2 (en) | Electronic document generation system and recording medium | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
US20110075932A1 (en) | Image processing method and image processing apparatus for extracting heading region from image of document | |
US20090150359A1 (en) | Document processing apparatus and search method | |
US20220068276A1 (en) | Information processor, print system, and control method | |
JP6201686B2 (ja) | テキストデータの埋め込み装置、該装置を備えた画像処理装置、テキストデータの埋め込み方法及び埋め込みプログラム | |
JP5412916B2 (ja) | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム | |
JP7147544B2 (ja) | 情報処理装置、及び情報処理方法 | |
US9400926B2 (en) | Image processing apparatus, image processing method, and non-transitory computer readable medium | |
JP6205973B2 (ja) | 変更履歴出力装置、プログラム | |
JP7115162B2 (ja) | 電子機器、画像形成装置、電子メール作成支援方法、及び電子メール作成支援プログラム | |
JP2017072941A (ja) | 文書振り分けシステム、情報処理方法及びプログラム | |
JP2020099030A (ja) | 情報処理装置、及び情報処理方法 | |
US20230325126A1 (en) | Information processing apparatus and method and non-transitory computer readable medium | |
US11006015B2 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
JP5935376B2 (ja) | 複写装置 | |
US20240129416A1 (en) | Method of producing image data and image reading system | |
JP2017011605A (ja) | 画像形成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160822 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170627 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170801 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170814 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6201686 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |