JP7559397B2 - 情報処理装置およびプログラム - Google Patents
情報処理装置およびプログラム Download PDFInfo
- Publication number
- JP7559397B2 JP7559397B2 JP2020125740A JP2020125740A JP7559397B2 JP 7559397 B2 JP7559397 B2 JP 7559397B2 JP 2020125740 A JP2020125740 A JP 2020125740A JP 2020125740 A JP2020125740 A JP 2020125740A JP 7559397 B2 JP7559397 B2 JP 7559397B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- color
- font
- certainty
- processing format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/56—Processing of colour picture signals
- H04N1/60—Colour correction or control
- H04N1/62—Retouching, i.e. modification of isolated colours only or in isolated picture areas only
- H04N1/626—Detection of non-electronic marks, e.g. fluorescent markers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/56—Processing of colour picture signals
- H04N1/60—Colour correction or control
- H04N1/62—Retouching, i.e. modification of isolated colours only or in isolated picture areas only
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
- G06V30/133—Evaluation of quality of the acquired characters
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41M—PRINTING, DUPLICATING, MARKING, OR COPYING PROCESSES; COLOUR PRINTING
- B41M1/00—Inking and printing with a printer's forme
- B41M1/10—Intaglio printing ; Gravure printing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40087—Multi-toning, i.e. converting a continuous-tone signal for reproduction with more than two discrete brightnesses or optical densities, e.g. dots of grey and black inks on white paper
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/41—Bandwidth or redundancy reduction
- H04N1/411—Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
- H04N1/413—Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information
- H04N1/417—Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information using predictive or differential encoding
- H04N1/4177—Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information using predictive or differential encoding encoding document change data, e.g. form drop out data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Character Discrimination (AREA)
- Editing Of Facsimile Originals (AREA)
- Facsimile Image Signal Circuits (AREA)
- Character Input (AREA)
Description
図1は、実施形態に係る情報処理システムの全体構成の一例を示す図である。図1を参照しながら、本実施形態に係る情報処理システム1の全体構成について説明する。
図2は、実施形態に係るMFPのハードウェア構成の一例を示す図である。図2を参照しながら、本実施形態に係るMFP10のハードウェア構成について説明する。
図3は、実施形態に係るMFPの機能ブロックの構成の一例を示す図である。図4は、フォント視認性および文字画素消去具体の確信度についての正の相関を説明する図である。図5は、フォント視認性および文字画素消去具体の確信度についての負の相関を説明する図である。図3~図5を参照しながら、本実施形態に係るMFP10の機能ブロックの構成および構成について説明する。
図6は、実施形態に係るMFPの言語処理および第2確信度算出処理の流れの一例を示すフローチャートである。図6に示すように、MFP10の言語処理および第2確信度算出処理の繰り返し処理について説明する。
言語処理部108は、第1確信度保持部121に言語処理を行っていない候補文字の連続である文字列が残っているか否か判定する。文字列が残っている場合(ステップS11:Yes)、ステップS12へ移行し、文字列が残っていない場合(ステップS11:No)、繰り返し処理を終了する。
言語処理部108は、第1確信度保持部121から言語処理を行っていない候補文字の連続である文字列を入力し、言語処理を実行する。なお、言語処理部108による言語処理の詳細は、図8で後述する。そして、ステップS13へ移行する。
第2確信度算出部109は、言語処理部108で単語とマッチした名詞の各文字の第1確信度を第1確信度保持部121から入力し、当該各文字の第1確信度に基づいて、当該各文字の第2確信度を算出する。第2確信度算出部109は、算出した第2確信度を第2確信度保持部123に保持させる。なお、第2確信度算出部109による第2確信度算出処理の詳細は、図9で後述する。そして、ステップS11へ戻る。
図7は、実施形態に係るMFPのフォント色決定処理、文字画素置換色決定処理およびラップ処理の流れの一例を示すフローチャートである。図7に示すように、MFP10のフォント色決定処理、文字画素置換色決定処理およびラップ処理の繰り返し処理について説明する。
フォント色決定部110は、第2確信度保持部123にフォント色決定処理を行っていない、第2確信度算出部109により第2確信度が算出された文字が残っているか否か判定する。文字が残っている場合(ステップS21:Yes)、ステップS22へ移行し、文字が残っていない場合(ステップS21:No)、繰り返し処理を終了する。
フォント色決定部110は、第2確信度保持部123からフォント色決定処理を行っていない文字等を入力し、当該文字についてフォント色決定処理を実行する。なお、フォント色決定部110によるフォント色決定処理の詳細は、図10で後述する。そして、ステップS23へ移行する。
文字画素置換色決定部111は、フォント色決定部110によりフォント色決定処理が行われた文字の文字画像に対応する原画像の画像部分の文字の色を決定する文字画素置換色決定処理を実行する。なお、文字画素置換色決定部111による文字画素置換色決定処理の詳細は、図11で後述する。そして、ステップS24へ移行する。
ラップ処理部112は、原画像に対して、フォント色決定部110により決定された文字画素置換色の置換文字画素、および文字画素置換色決定部111により決定されたフォント色のフォントを重畳し、XMLラップ処理等のラップ処理を行う。そして、ステップS21へ戻る。
図8は、実施形態に係るMFPの言語処理の流れの一例を示すフローチャートである。図8を参照しながら、MFP10の言語処理部108による言語処理の詳細について説明する。
言語処理部108は、切出し処理部103により切り出されたすべての文字画像に対応する第1確信度が記憶部120の第1確信度保持部121に保持されると、当該第1確信度保持部121から候補文字(文字コード)の連続である文字列を入力する。そして、言語処理部108は、入力した文字列から周知の形態素解析を行って名詞を抽出する。そして、ステップS122へ移行する。
言語処理部108は、抽出した名詞のうち、記憶部120の単語辞書122に含まれる単語(辞書内単語)と比較していない名詞があるか否かを判定する。辞書内単語と比較していない名詞がある場合(ステップS122:Yes)、ステップS123へ移行し、比較していない名詞がない場合(ステップS122:No)、ステップS129bへ移行する。
言語処理部108は、抽出した名詞の文字数kをカウントし、かつ、第1確信度の和の最大値Smaxを0にリセットする。そして、ステップS124へ移行する。
言語処理部108は、カウントした文字数kが、例えば3≦k≦5(3文字以上5文字以下)であるか否かを判定する。3≦k≦5を満たす場合(ステップS124:Yes)、ステップS125へ移行し、3≦k≦5を満たさない場合(ステップS124:No)、ステップS122へ戻る。なお、抽出した名詞の文字数kの範囲判定としては、3≦k≦5とは異なる範囲で判定を行ってもよい。
言語処理部108は、単語辞書122に含まれる辞書内単語のうち、比較を行っていない辞書内単語があるか否かを判定する。比較が行われていない辞書内単語がある場合(ステップS125:Yes)、ステップS126へ移行し、比較が行われていない辞書内単語がない場合(ステップS125:No)ステップS129bへ移行する。
言語処理部108は、単語辞書122に含まれる辞書内単語のうち、文字数kと同じ文字数の辞書内単語を探索する。そして、ステップS127へ移行する。
言語処理部108は、検索した辞書内単語の文字と、文字数kの名詞の文字とを比較し、一致した文字数が、例えば0.6×kより大きいか否かを判定する。一致した文字数が0.6×kよりも大きい場合(ステップS127:Yes)、ステップS128へ移行し、一致した文字数が0.6×k以下である場合(ステップS127:No)、ステップS125へ戻る。なお、一致した文字数と比較する0.6×kの係数0.6は、これに限定されるものではなく、他の値であってもよい。
言語処理部108は、名詞を構成する文字のうち、辞書内単語の文字と一致した文字のみについての第1確信度の和を計算して、当該和を確信度和Sとする。そして、ステップS129へ移行する。
言語処理部108は、確信度和Sが最大値Smaxよりも大きいか否かを判定する。確信度和Sが最大値Smaxよりも大きい場合(ステップS129:Yes)、ステップS129aへ移行し、確信度和Sが最大値Smax以下である場合(ステップS129:No)、ステップS125へ戻る。
言語処理部108は、確信度和Sを新たな最大値Smaxとし、当該確信度和Sに対応する名詞を保持する。そして、ステップS125へ戻る。
言語処理部108は、最大値Smaxが最大となった辞書内単語(最大値Smax=確信度和Sとなる、名詞とマッチした辞書内単語)を、名詞とマッチ(一致)した単語と決定し、当該名詞の文字列を当該辞書内単語で置換する。また、S=0の場合、言語処理部108は、名詞とマッチ(一致)した辞書内単語がないものと判断し、当該名詞をそのまま利用する。そして、言語処理部108による言語処理を終了する。
図9は、実施形態に係るMFPの第2確信度算出処理の流れの一例を示すフローチャートである。図9を参照しながら、MFP10の第2確信度算出部109による第2確信度処理の詳細について説明する。
言語処理部108により抽出された名詞が辞書内単語とマッチ(一致)した場合(すなわち、確信度和S>0の場合)(ステップS131:Yes)、ステップS132へ移行し、マッチ(一致)していない場合(すなわち、確信度和S=0の場合)(ステップS131:No)、ステップS133へ移行する。
第2確信度算出部109は、言語処理部108により辞書内単語に置換された名詞の各文字の第1確信度のうち最大の第1確信度を当該各文字の第2確信度として算出し、当該第2確信度を第2確信度保持部123に保持させる。そして、第2確信度算出部109による第2確信度算出処理を終了する。
第2確信度算出部109は、言語処理部108により抽出された名詞が辞書内単語とマッチ(一致)していない場合、当該名詞の第1確信度のうち最小の第1確信度を当該各文字の第2確信度として算出し、当該第2確信度を第2確信度保持部123に保持させる。そして、第2確信度算出部109による第2確信度算出処理を終了する。
図10は、実施形態に係るMFPのフォント色決定処理の流れの一例を示すフローチャートである。図10を参照しながら、MFP10のフォント色決定部110によるフォント色決定処理の詳細について説明する。
Rf=Rc,Gf=Gc,Bf=Bc ・・・(1)
(それ以外の場合)
Rf=Rc+(255-Rc)×{(100-C)/100}^0.5 ・・・(2)
Gf=Gc+(255-Gc)×{(100-C)/100}^0.5
Bf=Bc+(255-Bc)×{(100-C)/100}^0.5
フォント色決定部110は、第1確信度保持部121からフォント色の決定の対象となる外接矩形(座標情報)を取得する。そして、ステップS222へ移行する。
フォント色決定部110は、第1確信度保持部121から、取得した外接矩形の座標に対応した二値画像の画像部分(すなわち文字画像)、および原画像を取得する。そして、ステップS223へ移行する。
フォント色決定部110は、外接矩形内の文字画像が表す文字の画素と同じ位置にある原画像の画素の画素値の平均を算出して原文字色(Rc,Gc,Bc)とする。そして、ステップS224へ移行する。
フォント色決定部110は、算出した原文字色(Rc,Gc,Bc)に基づいて、上述の式(1)および(2)を用いてフォント色(Rf,Gf,Bf)を算出して決定する。具体的には、フォント色決定部110は、対象となる文字画像に対応する第2確信度を第2確信度保持部123から取得し、当該第2確信度を確信度Cとし、当該確信度Cが閾値Th(例えば85)以上である場合、上述の式(1)を用いてフォント色(Rf,Gf,Bf)を決定する。また、フォント色決定部110は、確信度Cが閾値Thよりも小さい場合、上述の式(2)を用いてフォント色(Rf,Gf,Bf)を算出して決定する。そして、フォント色決定部110によるフォント色決定処理を終了する。
図11は、実施形態に係るMFPの文字画素置換色決定処理の流れの一例を示すフローチャートである。図11を参照しながら、MFP10の文字画素置換色決定部111による文字画素置換色決定処理の詳細について説明する。
Rr=Rb,Gr=Gb,Br=Bb ・・・(3)
(それ以外の場合)
Rr=Rb+(255-Rb)×{(100-C)/100}^0.5 ・・・(4)
Gr=Gb+(255-Gb)×{(100-C)/100}^0.5
Br=Bb+(255-Bb)×{(100-C)/100}^0.5
文字画素置換色決定部111は、上述のステップS221でフォント色決定部110により取得された外接矩形内の文字画像が表す文字の画素とは別の位置にある原画像の画素の画素値の平均を算出することにより、文字画素置換色(Rr,Gr,Br)の算出の基となる原背景色(Rb,Gb,Bb)とする。そして、ステップS232へ移行する。
文字画素置換色決定部111は、算出した原背景色(Rb,Gb,Bb)に基づいて、上述の式(3)および(4)を用いて文字画素置換色(Rr,Gr,Br)を算出して決定する。具体的には、文字画素置換色決定部111は、ステップS224でフォント色決定部110により取得された第2確信度を確信度Cとし、当該確信度Cが閾値Th(例えば85)以上である場合、上述の式(3)を用いて文字画素置換色(Rr,Gr,Br)を決定する。また、文字画素置換色決定部111は、確信度Cが閾値Thよりも小さい場合、上述の式(4)を用いて文字画素置換色(Rr,Gr,Br)を算出して決定する。そして、文字画素置換色決定部111による文字画素置換色決定処理を終了する。
図12は、オレンジ色の地に赤い文字が記載された原画像の一例を示す図である。図13は、二値化した画像の一例を示す図である。図14は、二値画像から切出し処理を行う動作を説明する図である。図12~図14を参照しながら、MFP10における原画像から文字画像を切り出すまでの処理の具体例について説明する。
上述の切出し処理部103により外接矩形により切り出された「と」、「ま」、「と」の文字画像に対して、引き続き、文字認識部104による文字認識処理、組合せ選択部105による候補文字の最適な組み合わせ(パス)の選択処理、およびルール処理部106による一定のルールに従った候補文字の修正処理が実行される。
図15は、文字単位の確信度制御を行わない場合のフォントの一例を示す図である。図16は、文字単位の確信度制御を行った場合のフォントの一例を示す図である。図17は、文字単位の確信度制御を行わない場合の置換文字画素の一例を示す図である。図18は、文字単位の確信度制御を行った場合の置換文字画素の一例を示す図である。図19は、原画像に文字単位の確信度制御を行わない場合の置換文字画素を重畳させた状態の一例を示す図である。図20は、原画像に文字単位の確信度制御を行わない場合の置換文字画素およびフォントを重畳させた状態の一例を示す図である。図21は、原画像に文字単位の確信度制御を行った場合の置換文字画素およびフォントを重畳させた状態の一例を示す図である。図15~図21を参照しながら、パターン(1)の場合の正の相関に基づくフォント色決定処理および文字画素置換色決定処理の具体例について説明する。
確信度C=80の場合、(Rf,Gf,Bf)=(252,133,126)
確信度C=82の場合、(Rf,Gf,Bf)=(252,128,121)
確信度C=80の場合、(Rr,Gr,Br)=(255,241,199)
確信度C=82の場合、(Rr,Gr,Br)=(255,241,196)
図22は、文字単位の確信度制御を行わない場合のフォントの一例を示す図である。図23は、文字単位の確信度制御を行った場合のフォントの一例を示す図である。図24は、文字単位の確信度制御を行わない場合の置換文字画素の一例を示す図である。図25は、文字単位の確信度制御を行った場合の置換文字画素の一例を示す図である。図26は、原画像に文字単位の確信度制御を行わない場合の置換文字画素およびフォントを重畳させた状態の一例を示す図である。図27は、原画像に文字単位の確信度制御を行った場合の置換文字画素およびフォントを重畳させた状態の一例を示す図である。図22~図27を参照しながら、パターン(3)の場合の正の相関に基づくフォント色決定処理および文字画素置換色決定処理の具体例について説明する。
確信度C=85の場合、(Rf,Gf,Bf)=(250,34,22)
確信度C=40の場合、(Rf,Gf,Bf)=(252,205,202)
確信度C=85の場合、(Rr,Gr,Br)=(255,230,153)
確信度C=40の場合、(Rr,Gr,Br)=(255,249,232)
図28は、負の相関に基づいて文字単位の確信度制御を行った場合のフォントの一例を示す図である。図29は、負の相関に基づいて文字単位の確信度制御を行った場合の置換文字画素の一例を示す図である。図30は、原画像に負の相関に基づいて文字単位の確信度制御を行った場合の置換文字画素およびフォントを重畳させた状態の一例を示す図である。図31は、原画像に、負の相関に基づいて文字単位の確信度制御を行った場合の置換文字画素、および正の相関に基づいて文字単位の確信度制御を行った場合のフォントを重畳させた状態の一例を示す図である。図28~図31を参照しながら、パターン(3)の場合の負の相関に基づくフォント色決定処理および文字画素置換色決定処理の具体例について説明する。すなわち、フォント色決定部110は、フォント視認性が確信度と負の相関があるとした場合に基づいてフォント色を決定する。すなわち、負の相関があるとした場合、確信度が高いほど、注意喚起が重要でないと捉えてフォント色を薄くし、確信度が低いほど、注意喚起が重要であると捉えてフォント色を濃くする。また、文字画素置換色決定部111は、原画像での文字画素の消去具合が確信度と負の相関があるとした場合に基づいて文字画素置換色を決定する。すなわち、負の相関があるとした場合、確信度が高いほど、原画像の文字画素の色を原背景色から遠い色(文字画素の消去具合が低い傾向)に置換し、確信度が低いほど、原画像の文字画素の色を原背景色から近い色(文字画素の消去具合が高い傾向)に置換する。
Rf=Rc,Gf=Gc,Bf=Bc ・・・(5)
(それ以外の場合)
Rf=Rc-Rc×{(100-C)/100}^0.5 ・・・(6)
Gf=Gc-Gc×{(100-C)/100}^0.5
Bf=Bc-Bc×{(100-C)/100}^0.5
Rr=Rb,Gr=Gb,Br=Bb ・・・(7)
(それ以外の場合)
Rr=Rb-Rb×{(100-C)/100}^0.5 ・・・(8)
Gr=Gb-Gb×{(100-C)/100}^0.5
Br=Bb-Bb×{(100-C)/100}^0.5
図32は、白地に赤い文字が記載された原画像の一例を示す図である。図33は、原画像に、負の相関に基づいて文字単位の確信度制御を行った場合の置換文字画素、および正の相関に基づいて文字単位の確信度制御を行った場合のフォントを重畳させた状態の一例を示す図である。図32および図33を参照しながら、パターン(3)の場合であって、かつ原画像の地が白色である場合に対応したフォント色決定処理および文字画素置換色決定処理の具体例について説明する。
Rr=255,Gr=255,Br=255 ・・・(9)
(それ以外の場合)
Rr=255-255×{(100-C)/100}^0.5 ・・・(10)
Gr=255-255×{(100-C)/100}^0.5
Br=255
次に、原文字色および原背景色から、フォント色および文字画素置換色を全く異なる色に置き換えることにより、注意喚起をより効果的に行う動作について説明する。
Rf=Rcc,Gf=Gcc,Bf=Bcc ・・・(11)
(それ以外の場合:確信度Cが低いほど濃くする)
Rf=Rcc+255×(C/100)^0.5 ・・・(12)
Gf=Gcc+255×(C/100)^0.5
Bf=Bcc+255×(C/100)^0.5
(それ以外の場合:確信度Cが低いほど薄くする)
Rf=Rcc+255×{(100-C)/100}^0.5 ・・・(13)
Gf=Gcc+255×{(100-C)/100}^0.5
Bf=Bcc+255×{(100-C)/100}^0.5
Rr=Rbc,Gr=Gbc,Br=Bbc ・・・(14)
(それ以外の場合:確信度Cが低いほど濃くする)
Rr=Rbc+255×(C/100)^0.5 ・・・(15)
Gr=Gbc+255×(C/100)^0.5
Br=Bbc+255×(C/100)^0.5
(それ以外の場合:確信度Cが低いほど薄くする)
Rr=Rbc+255×{(100-C)/100}^0.5 ・・・(16)
Gr=Gbc+255×{(100-C)/100}^0.5
Br=Bbc+255×{(100-C)/100}^0.5
図34は、処理方式選択画面の一例を示す図である。図34を参照しながら、フォント色決定処理および文字画素置換色決定処理の処理方式を選択して設定する動作について説明する。
変形例に係るMFP10について、上述の本実施形態に係るMFP10とは異なる動作を中心に説明する。本変形例では、特定の確信度を転換点として、確信度に対する正の相関または負の相関に基づく処理方式と、補色に基づいた処理方式とを切り替える動作について説明する。なお、本変形例に係るMFP10のハードウェア構成および機能ブロックの構成は、上述の実施形態に係るMFP10と同様である。
10 MFP
11 スキャナ部
12 プリンタ部
20 PC
30 ファイルサーバ
101 画像取得部
102 二値化部
103 切出し処理部
104 文字認識部
105 組合せ選択部
106 ルール処理部
107 第1確信度算出部
108 言語処理部
109 第2確信度算出部
110 フォント色決定部
111 文字画素置換色決定部
112 ラップ処理部
120 記憶部
121 第1確信度保持部
122 単語辞書
123 第2確信度保持部
124 処理方式設定情報
131 通信部
132 表示制御部
133 入力部
134 設定部
500 コントローラ
501 CPU
502 システムメモリ(MEM-P)
503 ノースブリッジ(NB)
504a サウスブリッジ(SB)
504b ネットワークI/F
504c USB I/F
504d セントロニクスI/F
505 AGP
506 ASIC
507 ローカルメモリ(MEM-C)
508 補助記憶装置
510 操作表示部
520 FCU
531 プロッタ
532 スキャナ
1000 処理方式選択画面
1001 フォント色用選択ラジオボタン
1002 文字画素置換色用選択ラジオボタン
1011 OKボタン
1012 キャンセルボタン
N ネットワーク
Claims (9)
- 原画像を、画像および前記原画像に対する文字認識後のフォントを含む編集可能な電子文書に変換する情報処理装置であって、
前記文字認識の確信度に基づいて、設定された第1処理形式により、前記フォントの色である第1色を決定する第1決定部と、
前記確信度に基づいて、設定された第2処理形式により、前記原画像から前記文字認識により認識された文字の部分の画素である文字画素の色を置換するための色である第2色を決定する第2決定部と、
を備え、
前記第1決定部は、前記確信度が高いほど前記フォントの視認性を高くし、該確信度が低いほど該フォントの視認性を低くする正の相関に基づく処理形式、または、該確信度が低いほど該フォントの視認性を高くし、該確信度が高いほど該フォントの視認性を低くする負の相関に基づく処理形式のうち、設定された処理形式を前記第1処理形式として前記第1色を決定する情報処理装置。 - 前記第2決定部は、前記確信度が高いほど前記文字画素の消去具合を高くし、該確信度が低いほど該文字画素の消去具合を低くする正の相関に基づく処理形式、または、該確信度が低いほど該文字画素の消去具合を高くし、該確信度が高いほど該文字画素の消去具合を低くする負の相関に基づく処理形式のうち、設定された処理形式を前記第2処理形式として前記第2色を決定する請求項1に記載の情報処理装置。
- 原画像を、画像および前記原画像に対する文字認識後のフォントを含む編集可能な電子文書に変換する情報処理装置であって、
前記文字認識の確信度に基づいて、設定された第1処理形式により、前記フォントの色である第1色を決定する第1決定部と、
前記確信度に基づいて、設定された第2処理形式により、前記原画像から前記文字認識により認識された文字の部分の画素である文字画素の色を置換するための色である第2色を決定する第2決定部と、
を備え、
前記第1決定部は、前記確信度が高いほど前記フォントの視認性を高くし、該確信度が低いほど該フォントの視認性を低くする正の相関に基づく処理形式、該確信度が低いほど該フォントの視認性を高くし、該確信度が高いほど該フォントの視認性を低くする負の相関に基づく処理形式、前記文字画素の色の第1補色に基づく処理形式、または、前記原画像の前記文字画素以外の部分の画素値に基づく背景色の第2補色に基づく処理形式のうち、設定された処理形式を前記第1処理形式として前記第1色を決定する情報処理装置。 - 前記第2決定部は、前記確信度が高いほど前記文字画素の消去具合を高くし、該確信度が低いほど該文字画素の消去具合を低くする正の相関に基づく処理形式、該確信度が低いほど該文字画素の消去具合を高くし、該確信度が高いほど該文字画素の消去具合を低くする負の相関に基づく処理形式、前記文字画素の色の第1補色に基づく処理形式、または、前記原画像の前記文字画素以外の部分の画素値に基づく背景色の第2補色に基づく処理形式のうち、設定された処理形式を前記第2処理形式として前記第2色を決定する請求項1または3に記載の情報処理装置。
- 原画像を、画像および前記原画像に対する文字認識後のフォントを含む編集可能な電子文書に変換する情報処理装置であって、
前記文字認識の確信度に基づいて、設定された第1処理形式により、前記フォントの色である第1色を決定する第1決定部と、
前記確信度に基づいて、設定された第2処理形式により、前記原画像から前記文字認識により認識された文字の部分の画素である文字画素の色を置換するための色である第2色を決定する第2決定部と、
を備え、
前記第1決定部による前記第1色の決定処理、および前記第2決定部の前記第2色の決定処理のうち少なくともいずれかにおいて、特定の確信度を転換点として、前記確信度に対して前記フォントの視認性または前記文字画素の消去具合についての正の相関、または該確信度に対して該フォントの視認性または該文字画素の消去具合についての負の相関に基づく処理形式と、前記文字画素の色の第1補色、または前記原画像の前記文字画素以外の部分の画素値に基づく背景色の第2補色に基づく処理形式とが切り替えられる情報処理装置。 - 前記第1処理形式および前記第2処理形式は、互いに独立した処理形式である請求項1~5のいずれか一項に記載の情報処理装置。
- 入力部に対する操作内容に応じて、前記第1処理形式および前記第2処理形式を設定する設定部を、さらに備えた請求項1~6のいずれか一項に記載の情報処理装置。
- 前記原画像に対して、前記第2決定部により決定された前記第2色の前記文字画素を重畳し、さらに前記第1決定部により決定された前記第1色の前記フォントを重畳して、前記電子文書を生成する重畳部を、さらに備えた請求項1~7のいずれか一項に記載の情報処理装置。
- 原画像を、画像および前記原画像に対する文字認識後のフォントを含む編集可能な電子文書に変換するコンピュータに、
前記文字認識の確信度に基づいて、設定された第1処理形式により、前記フォントの色である第1色を決定する第1決定ステップと、
前記確信度に基づいて、設定された第2処理形式により、前記原画像から前記文字認識により認識された文字の部分の画素である文字画素の色を置換するための色である第2色を決定する第2決定ステップと、
を実行させ、
前記第1決定ステップでは、前記確信度が高いほど前記フォントの視認性を高くし、該確信度が低いほど該フォントの視認性を低くする正の相関に基づく処理形式、または、該確信度が低いほど該フォントの視認性を高くし、該確信度が高いほど該フォントの視認性を低くする負の相関に基づく処理形式のうち、設定された処理形式を前記第1処理形式として前記第1色を決定するためのプログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020125740A JP7559397B2 (ja) | 2020-07-22 | 2020-07-22 | 情報処理装置およびプログラム |
| US17/369,218 US11528387B2 (en) | 2020-07-22 | 2021-07-07 | Information processing apparatus, method and non-transitory recording medium storing program codes for replacing color of character pixel based on selection of first and second processing methods |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020125740A JP7559397B2 (ja) | 2020-07-22 | 2020-07-22 | 情報処理装置およびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022021875A JP2022021875A (ja) | 2022-02-03 |
| JP7559397B2 true JP7559397B2 (ja) | 2024-10-02 |
Family
ID=79688983
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020125740A Active JP7559397B2 (ja) | 2020-07-22 | 2020-07-22 | 情報処理装置およびプログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US11528387B2 (ja) |
| JP (1) | JP7559397B2 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7552263B2 (ja) * | 2020-11-04 | 2024-09-18 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置および画像形成装置 |
| JP2024036940A (ja) * | 2022-09-06 | 2024-03-18 | キヤノン株式会社 | 情報処理装置および制御方法、プログラム |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008152700A (ja) | 2006-12-20 | 2008-07-03 | Toshiba Corp | 電子漫画配信サーバ |
| JP2014232930A (ja) | 2013-05-28 | 2014-12-11 | コニカミノルタ株式会社 | 画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラム |
| JP2015026289A (ja) | 2013-07-26 | 2015-02-05 | 謙介 桑原 | 食事管理システムおよびプログラム |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2991779B2 (ja) * | 1990-06-11 | 1999-12-20 | 株式会社リコー | 文字認識方法及び装置 |
| JPH1069517A (ja) | 1996-08-27 | 1998-03-10 | Ricoh Co Ltd | 文字認識装置 |
| JP4631133B2 (ja) * | 2000-06-09 | 2011-02-16 | コニカミノルタビジネステクノロジーズ株式会社 | 文字認識処理のための装置、方法及び記録媒体 |
| JP2005259017A (ja) | 2004-03-15 | 2005-09-22 | Ricoh Co Ltd | 画像処理装置、画像処理用プログラム及び記憶媒体 |
| EP1555804A3 (en) | 2004-01-19 | 2006-08-16 | Ricoh Company, Ltd. | Image processing apparatus, image processing program and storage medium |
| JP2005352735A (ja) | 2004-06-10 | 2005-12-22 | Fuji Xerox Co Ltd | 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム |
| US20060008148A1 (en) * | 2004-07-06 | 2006-01-12 | Fuji Photo Film Co., Ltd. | Character recognition device and method |
| JP4667381B2 (ja) | 2004-07-20 | 2011-04-13 | パナソニック株式会社 | 映像処理装置およびその方法 |
| JP6100532B2 (ja) | 2013-01-15 | 2017-03-22 | 株式会社富士通マーケティング | レシート定義データ作成装置およびそのプログラム |
| JP2015060470A (ja) | 2013-09-19 | 2015-03-30 | シャープ株式会社 | 認識装置 |
| US20170289766A1 (en) * | 2016-03-29 | 2017-10-05 | Microsoft Technology Licensing, Llc | Digital Assistant Experience based on Presence Detection |
| JP7293908B2 (ja) | 2019-06-25 | 2023-06-20 | 株式会社リコー | 画像処理装置、プログラムおよび潜像埋め込み方法 |
-
2020
- 2020-07-22 JP JP2020125740A patent/JP7559397B2/ja active Active
-
2021
- 2021-07-07 US US17/369,218 patent/US11528387B2/en active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008152700A (ja) | 2006-12-20 | 2008-07-03 | Toshiba Corp | 電子漫画配信サーバ |
| JP2014232930A (ja) | 2013-05-28 | 2014-12-11 | コニカミノルタ株式会社 | 画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラム |
| JP2015026289A (ja) | 2013-07-26 | 2015-02-05 | 謙介 桑原 | 食事管理システムおよびプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022021875A (ja) | 2022-02-03 |
| US11528387B2 (en) | 2022-12-13 |
| US20220030138A1 (en) | 2022-01-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8355578B2 (en) | Image processing apparatus, image processing method, and storage medium | |
| US5751921A (en) | Document image processing device for converting monochrome images to color images | |
| US7805022B2 (en) | Image processing apparatus, image processing method and computer program | |
| US11082581B2 (en) | Image processing apparatus and method for control to smooth a character region of a binary image and perform character recognition | |
| JP7559397B2 (ja) | 情報処理装置およびプログラム | |
| JP5066977B2 (ja) | 画像処理装置、画像形成装置、及びプログラム | |
| US8355577B2 (en) | Image processing apparatus and method | |
| JP5178490B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
| KR20060128696A (ko) | 화상처리장치 및 그 방법 | |
| US20070002065A1 (en) | Image processing apparatus and image processing method | |
| JP5335581B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
| US9338310B2 (en) | Image processing apparatus and computer-readable medium for determining pixel value of a target area and converting the pixel value to a specified value of a target image data | |
| US10582088B2 (en) | Information processing apparatus, method, and storage medium for causing printer driver to generate drawing command | |
| US9489603B2 (en) | Image processing apparatus, image processing method, and storage medium that determine whether a white character exists inside a graphics object and convert density information accordingly | |
| JP6984145B2 (ja) | 情報処理装置 | |
| JP3899872B2 (ja) | 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体 | |
| JP2020099030A (ja) | 情報処理装置、及び情報処理方法 | |
| US8179560B2 (en) | Image processing apparatus and image processing method | |
| JP2005303740A (ja) | 画像形成装置、画像形成方法およびプログラム | |
| CN110536043B (zh) | 信息处理装置、信息处理方法及存储介质 | |
| US20020101614A1 (en) | Text only feature for a digital copier | |
| US11743411B2 (en) | Information processing apparatus and computer program product for reducing an image area or enlarging a blank area of a manuscript so an additional image fits in the blank area | |
| JP3899800B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体 | |
| US20070070425A1 (en) | Object-based sharpening for an image forming device | |
| JP2002049890A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230511 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240321 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240402 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240603 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240820 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240902 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7559397 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |







