JP6828333B2 - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP6828333B2 JP6828333B2 JP2016178469A JP2016178469A JP6828333B2 JP 6828333 B2 JP6828333 B2 JP 6828333B2 JP 2016178469 A JP2016178469 A JP 2016178469A JP 2016178469 A JP2016178469 A JP 2016178469A JP 6828333 B2 JP6828333 B2 JP 6828333B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- module
- area
- learning
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
しかし、画像から対象の領域だけを学習の対象とした技術では、その領域の周辺の領域を考慮した学習とはならない。一方、単に領域を拡大して学習したのでは、どの領域を認識すればよいのかが不明である。
請求項1の発明は、画像から対象が存在する領域を検出する検出手段と、前記領域を拡大する拡大手段と、前記拡大された領域で、前記画像から第1の画像を切り出す切出手段と、前記検出手段によって検出された領域内の対象から第2の画像を生成する生成手段と、前記第1の画像と前記第2の画像を用いて、機械学習を行う学習手段を有し、前記生成手段は、前記対象の第1の部分と対象以外の第2の部分とを分けた第2の画像を生成する、画像処理装置である。
図1は、本実施の形態(画像認識学習装置100)の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
また、ここで対象とは、例えば、文字、人物(顔、顔の一部、体、体の一部等)、物(自動車、飛行機等の人工物、山、川等の自然物、犬、猫等の動物)等がある。以下、対象として文字を例示するが、人物、物等であってもよい。文字画像が含まれている画像として、例えば、看板、標識、値札等を撮影した画像が該当する。
領域抽出モジュール115は、文字切取モジュール110、領域拡大モジュール120、マップ画像生成モジュール125と接続されている。領域抽出モジュール115は、文字切取モジュール110が検出した領域を抽出する。具体的には、画像受付モジュール105が受け付けた元画像における矩形領域の位置と大きさを示す値によって領域を特定する。例えば、矩形領域の左上角の位置(X座標、Y座標)、矩形領域の幅、高さの組み合わせ等がある。
また、マップ画像生成モジュール125は、対象の第1の部分(以下、関心領域ともいう)と対象以外の第2の部分とを分けた第2の画像を生成するようにしてもよい。この第2の画像は、いわゆるマップ画像(マスク画像)である。「第1の部分」とは、文字そのものを示す形を示す部分である。「第2の部分」とは、第1の部分以外の部分であって、いわゆる背景である。
さらに、マップ画像生成モジュール125は、第1の部分を第1の値とし、第2の部分を第2の値とした2値画像として、第2の画像を生成するようにしてもよい。2値画像であるので、マスク処理として、元画像とEOR処理を行うことによって、その画像を切り出すことができるようになる。
さらに、マップ画像生成モジュール125は、第1の画像と同じ大きさ(サイズ)の第2の画像を生成するようにしてもよい。ここで「第1の画像と同じ大きさ」とは、領域拡大モジュール120によって拡大された後の領域の大きさのことである。これによって、統一された大きさの画像を用いて学習することができるようになる。同じ大きさの画像を扱うことは、ベクトルの次元数が同じであることを意味する。もちろんのことながら、第1の画像と第2の画像は、画像受付モジュール105が受け付けた元画像内における位置も同じである。したがって、第1の画像と第2の画像は、元画像内の同じ部分画像(対象が存在する領域の画像)を対象としたものであり、後述するように第1の画像はその部分画像そのものであり、第2の画像はその部分画像のマップ画像である。
機械学習モジュール140が行う機械学習として、例えば、CNN(Convolutional Neural Networks)、サポートベクターマシン(SVM:Support Vector Machine)等がある。以下、CNNを例示して説明する。CNNでは、大量の学習データにより、自動的に画像の特徴抽出方法を学習する。そして、学習後は、CNNに画像を入力するだけで特徴量を抽出し、認識(ラベリング)を行うことができる。なお、CNNは、画像に写る物体の位置が多少ずれていても、そのずれを吸収する処理(後述するConvolution処理、Pooling処理)が組み込まれている。特に、R−CNN(Regions with Convolutional Neural Network)では、画像から文字切取モジュール110、領域抽出モジュール115で対象の領域を抽出し、抽出した領域を基準に画像の切り取りを行う。切り取られた画像(候補領域画像)をCNN(機械学習モジュール140)に入力し対象の認識を行う。そして、文字領域に適用した場合、前述したように、MSERによって領域を抽出し、抽出された領域を切り出し、CNNに入力しラベリングを行う。なお、CNNの出力はスコアでも文字認識結果でもよい。もちろんのことながら、正解付与モジュール135を不要として教師なし学習を行うようにしてもよい。
本実施の形態である画像認識装置200は、画像認識学習装置100による学習結果を用いて画像認識を行うものであって、図2の例に示すように、画像受付モジュール205、文字切取モジュール210、領域抽出モジュール215、領域拡大モジュール220、マップ画像生成モジュール225、画像切出モジュール230、認識モジュール240、認識結果出力モジュール245を有している。。
なお、画像認識装置200における画像受付モジュール205、文字切取モジュール210、領域抽出モジュール215、領域拡大モジュール220、マップ画像生成モジュール225、画像切出モジュール230は、図1の例に示した画像認識学習装置100の画像受付モジュール105、文字切取モジュール110、領域抽出モジュール115、領域拡大モジュール120、マップ画像生成モジュール125、画像切出モジュール130と同等の処理、機能を有している。したがって、画像認識学習装置100と画像認識装置200は、これらのモジュールを共有して用いてもよい。なお、これらのモジュールの説明は省略する。
画像受付モジュール205は、文字切取モジュール210、画像切出モジュール230と接続されている。
文字切取モジュール210は、画像受付モジュール205、領域抽出モジュール215、マップ画像生成モジュール225と接続されている。
領域抽出モジュール215は、文字切取モジュール210、領域拡大モジュール220、マップ画像生成モジュール225と接続されている。
領域拡大モジュール220は、領域抽出モジュール215、画像切出モジュール230と接続されている。
マップ画像生成モジュール225は、文字切取モジュール210、領域抽出モジュール215、認識モジュール240と接続されている。
画像切出モジュール230は、画像受付モジュール205、領域拡大モジュール220、認識モジュール240と接続されている。
認識結果出力モジュール245は、認識モジュール240と接続されている。認識結果出力モジュール245は、認識モジュール240による認識結果を出力する。例えば、認識結果を、ディスプレイ等の表示装置に表示すること、プリンタ等の印刷装置で印刷すること、データベース等の記憶装置へ書き込むこと、メモリーカード等の記憶媒体に記憶すること、他の情報処理装置へ渡すこと等が含まれる。
図3(a)に示す例は、画像認識学習装置100は、画像取得装置310と接続されている。いわゆるスタンドアロン型のシステム構成である。画像取得装置310は、スキャナ、カメラ等である。そして、学習結果を画像認識装置200に埋め込む。
図3(b)に示す例は、画像認識装置200は、画像撮影装置320と接続されている。いわゆるスタンドアロン型のシステム構成である。画像撮影装置320は、スキャナ、カメラ等である。画像認識装置200と画像撮影装置320を一体型の構成とした認識装置としてもよい。
図3(c)に示す例は、ユーザー端末330A、ユーザー端末330B、ユーザー端末330C、画像処理装置350は、通信回線390を介してそれぞれ接続されている。通信回線390は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、画像処理装置350による機能は、クラウドサービスとして実現してもよい。
画像処理装置350は、画像認識学習装置100、画像認識装置200を有している。例えば、学習用の画像をユーザー端末330Aが、画像処理装置350に送信し、画像認識学習装置100で学習した後、ユーザー端末330A、ユーザー端末330B、ユーザー端末330C等で、撮影した画像を画像処理装置350に送信し、画像認識装置200による認識結果を返信してもよい。また、前述したように、画像認識学習装置100と画像認識装置200には共通するモジュールがあるので、画像認識学習装置100と画像認識装置200を一体型の構成として、画像認識学習装置100として利用した後に、画像認識装置200として利用するようにしてもよい。
ステップS402では、画像受付モジュール105は、画像を受け付ける。ここでの画像は、学習対象である。
ステップS404では、文字切取モジュール110は、文字切取処理を行う。例えば、MSER処理を行う。
ステップS406では、領域抽出モジュール115は、領域を抽出する(入力画像のXY座標で取得する)。
ステップS408では、領域拡大モジュール120は、抽出された領域(切り取り領域)の範囲を拡大する。
ステップS412では、マップ画像生成モジュール125は、関心領域とそれ以外の領域を2値で埋めた画像(マップ画像)を作成する。
ステップS414では、機械学習モジュール140は、候補領域画像とマップ画像を受け付ける。
ステップS416では、機械学習モジュール140は、機械学習を行う。もちろんのことながら、ステップS402からステップS416までの処理を、複数回繰り返して行う。
ステップS418では、学習結果出力モジュール145は、学習結果を出力する。
ステップS502では、画像受付モジュール205は、画像を受け付ける。ここでの画像は、認識対象である。
ステップS504では、文字切取モジュール210は、文字切取処理を行う。例えば、MSER処理を行う。
ステップS506では、領域抽出モジュール215は、領域を抽出する(入力画像のXY座標で取得する)。
ステップS508では、領域拡大モジュール220は、抽出された領域(切り取り領域)の範囲を拡大する。
ステップS512では、マップ画像生成モジュール225は、関心領域とそれ以外の領域を2値で埋めた画像(マップ画像)を作成する。
ステップS514では、認識モジュール240は、候補領域画像とマップ画像を受け付ける。
ステップS516では、認識モジュール240は、認識処理を行う。
ステップS518では、認識結果出力モジュール245は、認識結果を出力する。
ステップS602では、画像受付モジュール205は、画像650を受け付ける。
ステップS604では、文字切取モジュール210は、MSER処理を行って、MSER処理画像652を生成する。
ステップS606では、領域抽出モジュール215は、領域を抽出して、MSER領域画像654のXY座標(例えば、左上角の座標、幅、高さ)を取得する。
ステップS608では、領域拡大モジュール220は、切り取り領域を拡大する。ここでは、MSER領域656をMSER拡大領域658のように拡大し、領域660を拡大領域662のように拡大する。
ステップS610−1では、画像切出モジュール230は、画像650から候補領域画像664を切り取る。
ステップS610−2では、マップ画像生成モジュール225は、MSER拡大領域でのマップ画像666を作成する。
ステップS612では、認識モジュール240は、CNNを行う。そして、認識結果出力モジュール245は、認識結果であるスコア670を出力する。ステップS612の処理については、図7の例を用いて説明する。
ステップS702では、候補領域画像664に対して、conv1処理を行う。つまり、1回目の、Convolution(畳み込み)処理を行う。具体的には、フィルタ処理を行い、Convolution Layer(conv1処理結果)を作成する。
ステップS704では、conv1処理結果に対して、pool1処理を行う。つまり、1回目のPooling(レイヤの縮小)処理を行う。具体的には、画像の圧縮を行い、Pooling Layer(pool1処理結果)を作成する。
ステップS708では、conv2処理結果に対して、pool2処理を行う。つまり、2回目のPooling処理を行う。
ステップS710では、pool2処理結果に対して、conv3処理を行う。つまり、3回目のConvolution処理を行う。
ステップS712では、conv3処理結果に対して、conv4処理を行う。つまり、4回目のConvolution処理を行う。
ステップS714では、conv4処理結果に対して、conv5処理を行う。つまり、5回目のConvolution処理を行う。
ステップS702aでは、マップ画像666に対して、conv1−a処理を行う。
ステップS704aでは、conv1−a処理結果に対して、pool1−a処理を行う。
ステップS706aでは、pool1−a処理結果に対して、conv2−a処理を行う。
ステップS708aでは、conv2−a処理結果に対して、pool2−a処理を行う。
ステップS710aでは、pool2−a処理結果に対して、conv3−a処理を行う。
ステップS712aでは、conv3−a処理結果に対して、conv4−a処理を行う。
ステップS714aでは、conv4−a処理結果に対して、conv5−a処理を行う。
ステップS718では、fc1処理結果に対して、fc2処理を行う。
ステップS720では、fc2処理結果に対して、fc3処理を行う。そして、スコア670として、文字領域スコア772と非文字領域スコア774を出力する。
ステップS716〜ステップS720で、3層のFully Connect処理を行う。つまり、ステップS702〜ステップS714で生成された特徴マップを入力して識別を行う。
ステップS802では、画像受付モジュール105は、画像850を受け付ける。この画像850内には、複数の文字(図8の例では、「alarm」)が撮影されている。
ステップS804では、文字切取モジュール110は、画像850に対して、MSER処理を行う。そして、1つの文字としてMSER領域画像852(図8の例では、「l」)を検出する。
ステップS806では、領域抽出モジュール115は、MSER領域画像852からMSER領域画像854を抽出する。具体的には、MSER領域画像852のバウンディングボックスであるMSER領域画像854の左上角のXY座標、幅、高さを抽出する。
なお、領域画像856は、MSER領域画像854に対応して、画像850から切り出した画像である。この領域画像856だけでは、文字「I」なのか、それに類似する物体なのか判別ができない。つまり、本実施の形態を用いない技術(従来の技術)では、領域画像856だけを機械学習の入力としているので、領域画像856のような画像に対しては、文字であるか画像であるかの判定精度が低かった。
なお、正方領域画像860は、正方MSER領域画像858に対応して、画像850から切り出した画像である。
ステップS810では、領域拡大モジュール120は、切り取り領域を拡大する。具体的には、正方MSER領域画像858を縦横ともに2倍して、マップ画像862を生成している。
なお、候補領域画像864は、マップ画像862に対応して、画像850から切り出した画像である。つまり、領域を拡大することによって、文字切取モジュール110が抽出した領域に対応する領域画像856の周辺領域を機械学習に加えることができるようになった。具体的には、画像「I」の近辺には画像「a」があり、画像「I」は文字であるとする判定を補助する情報となる。具体的には、「文字の周辺には文字がある可能性が高い」ということが機械学習されることとなる。しかし、単に、領域を拡大しただけでは(候補領域画像864だけでは)、どの部分を判定すればよいかの情報が失われてしまう。そこで、本来の判定対象となっている部分を示すマップ画像862も機械学習の入力としている。つまり、マップ画像862により判定する部分が明確なため、それ以外の部分(図8の例では、画像「a」)は補助情報として取り扱えることとなる。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
105…画像受付モジュール
110…文字切取モジュール
115…領域抽出モジュール
120…領域拡大モジュール
125…マップ画像生成モジュール
130…画像切出モジュール
135…正解付与モジュール
140…機械学習モジュール
145…学習結果出力モジュール
200…画像認識装置
205…画像受付モジュール
210…文字切取モジュール
215…領域抽出モジュール
220…領域拡大モジュール
225…マップ画像生成モジュール
230…画像切出モジュール
240…認識モジュール
245…認識結果出力モジュール
310…画像取得装置
320…画像撮影装置
330…ユーザー端末
350…画像処理装置
390…通信回線
Claims (8)
- 画像から対象が存在する領域を検出する検出手段と、
前記領域を拡大する拡大手段と、
前記拡大された領域で、前記画像から第1の画像を切り出す切出手段と、
前記検出手段によって検出された領域内の対象から第2の画像を生成する生成手段と、
前記第1の画像と前記第2の画像を用いて、機械学習を行う学習手段
を有し、
前記生成手段は、前記対象の第1の部分と対象以外の第2の部分とを分けた第2の画像を生成する、
画像処理装置。 - 前記生成手段は、前記第1の部分を第1の値とし、前記第2の部分を第2の値とした2値画像として、第2の画像を生成する、
請求項1に記載の画像処理装置。 - 前記生成手段は、前記第1の画像と同じ大きさの第2の画像を生成する、
請求項2に記載の画像処理装置。 - 文字を前記対象とし、
前記学習手段は、前記検出手段によって検出された領域内の画像が文字であるか否かを学習する、
請求項1に記載の画像処理装置。 - 前記学習手段は、文字である可能性を示す数値と文字ではない可能性を示す数値を出力する、
請求項4に記載の画像処理装置。 - 画像から対象が存在する領域を検出する検出手段と、
前記領域を拡大する拡大手段と、
前記拡大された領域で、前記画像から第1の画像を切り出す切出手段と、
前記検出手段によって検出された領域内の対象から第2の画像を生成する生成手段と、
請求項1から5のいずれか一項に記載の画像処理装置による学習結果を用いた認識を行う認識手段
を有する画像処理装置。 - コンピュータを、
画像から対象が存在する領域を検出する検出手段と、
前記領域を拡大する拡大手段と、
前記拡大された領域で、前記画像から第1の画像を切り出す切出手段と、
前記検出手段によって検出された領域内の対象から第2の画像を生成する生成手段と、
前記第1の画像と前記第2の画像を用いて、機械学習を行う学習手段
として機能させ、
前記生成手段は、前記対象の第1の部分と対象以外の第2の部分とを分けた第2の画像を生成する、
画像処理プログラム。 - コンピュータを、
画像から対象が存在する領域を検出する検出手段と、
前記領域を拡大する拡大手段と、
前記拡大された領域で、前記画像から第1の画像を切り出す切出手段と、
前記検出手段によって検出された領域内の対象から第2の画像を生成する生成手段と、
請求項7に記載の画像処理プログラムによる学習結果を用いた認識を行う認識手段
として機能させるための画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016178469A JP6828333B2 (ja) | 2016-09-13 | 2016-09-13 | 画像処理装置及び画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016178469A JP6828333B2 (ja) | 2016-09-13 | 2016-09-13 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018045359A JP2018045359A (ja) | 2018-03-22 |
JP6828333B2 true JP6828333B2 (ja) | 2021-02-10 |
Family
ID=61693153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016178469A Active JP6828333B2 (ja) | 2016-09-13 | 2016-09-13 | 画像処理装置及び画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6828333B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7172351B2 (ja) * | 2018-09-21 | 2022-11-16 | 富士フイルムビジネスイノベーション株式会社 | 文字列認識装置及び文字列認識プログラム |
CN109816663B (zh) * | 2018-10-15 | 2021-04-20 | 华为技术有限公司 | 一种图像处理方法、装置与设备 |
CN111612157B (zh) * | 2020-05-22 | 2023-06-30 | 四川无声信息技术有限公司 | 训练方法、文字识别方法、装置、存储介质及电子设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015088168A (ja) * | 2013-09-25 | 2015-05-07 | 国際航業株式会社 | 学習サンプル生成装置、学習サンプル生成プログラム、及び自動認識装置 |
JP6320112B2 (ja) * | 2014-03-27 | 2018-05-09 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
-
2016
- 2016-09-13 JP JP2016178469A patent/JP6828333B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018045359A (ja) | 2018-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018028583A1 (zh) | 字幕提取方法及装置、存储介质 | |
JP5775225B2 (ja) | マルチレイヤ連結成分をヒストグラムと共に用いるテキスト検出 | |
JP2018151748A (ja) | 画像処理装置、画像処理方法、テンプレート作成装置、物体認識処理装置及びプログラム | |
US9247080B2 (en) | Information processing apparatus for acquiring a variation region between image data and read data | |
JP6828333B2 (ja) | 画像処理装置及び画像処理プログラム | |
US10643097B2 (en) | Image processing apparatuses and non-transitory computer readable medium | |
JP2018206252A (ja) | 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム | |
US9767533B2 (en) | Image resolution enhancement based on data from related images | |
US11670067B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
US9785829B2 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium | |
JP6303671B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5737387B2 (ja) | 画像処理装置 | |
JP6852364B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5206890B1 (ja) | 画像処理装置及び画像処理プログラム | |
US10380463B2 (en) | Image processing device, setting support method, and non-transitory computer-readable media | |
JP5262778B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4890351B2 (ja) | 画像処理装置、画像処理プログラムおよび該画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに画像処理方法 | |
JP6241311B2 (ja) | 画像処理装置及び画像処理プログラム | |
US20130236101A1 (en) | Information processing apparatus, non-transitory computer readable medium, and information processing method | |
JP7342518B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4882929B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6676955B2 (ja) | 画像処理装置及び画像処理プログラム | |
EP3113031B1 (en) | Image processing device, image processing method, and program | |
JP2017072940A (ja) | 画像処理システム、画像処理方法および画像処理プログラム | |
JP2021189859A (ja) | 文書データ生成装置、画像形成装置、及び文書データ生成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190830 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201013 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201027 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6828333 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |