JP2019160285A - 読取システム及び読取方法 - Google Patents

読取システム及び読取方法 Download PDF

Info

Publication number
JP2019160285A
JP2019160285A JP2018203849A JP2018203849A JP2019160285A JP 2019160285 A JP2019160285 A JP 2019160285A JP 2018203849 A JP2018203849 A JP 2018203849A JP 2018203849 A JP2018203849 A JP 2018203849A JP 2019160285 A JP2019160285 A JP 2019160285A
Authority
JP
Japan
Prior art keywords
character string
character
characteristic
recognition unit
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018203849A
Other languages
English (en)
Other versions
JP7181761B2 (ja
Inventor
一樹 滝澤
Kazuki Takizawa
一樹 滝澤
佐藤 功一
Koichi Sato
功一 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsui E&S Machinery Co Ltd
Original Assignee
Mitsui E&S Machinery Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsui E&S Machinery Co Ltd filed Critical Mitsui E&S Machinery Co Ltd
Priority to JP2018203849A priority Critical patent/JP7181761B2/ja
Publication of JP2019160285A publication Critical patent/JP2019160285A/ja
Application granted granted Critical
Publication of JP7181761B2 publication Critical patent/JP7181761B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】撮像条件が悪い場合や画像に複数の文字列が存在する場合でも、所定の識別用文字列のみを高精度に自動認識することができる読取システム及び読取方法を提供する。【解決手段】既知の特徴を有する特徴文字列21と検査文字22とからなる識別用文字列20を、入力された画像14から読取る読取システム40は、文字列を認識単位として、画像14の中に含まれる複数の文字列の中から既知の特徴に基づいて特徴文字列21を認識する文字列認識部41と、単文字を認識単位として、文字列認識部41が探し出した特徴文字列21の位置に基づいて検査文字22を認識する単文字認識部42と、文字列認識部41が認識した特徴文字列21から算出した算出文字25と検査文字22とが一致した場合に、識別用文字列20として認識して出力する出力部44とを備える。【選択図】図4

Description

本発明は、読取システム及び読取方法に関し、具体的には、所定の識別用文字列を高精度に自動認識する読取システム及び読取方法に関する。
識別用文字列の自動認識する装置としては、カメラで取り込んだ画像に対して二値化処理を施し、二値化された画像から記号の特徴量に適合するものに対して一文字ずつ認識処理を施して識別用文字列として把握する装置が提案されている。(例えば、特許文献1参照)。
特開平10−105647号公報
ところで、文字を認識する技術として、ニューラルネットワークを用いて識別精度を向上させる試みがある。つまり、上記の特許文献1に記載の装置において、文字の認識にニューラルネットワークを用いることで識別精度をより向上させることが可能になる。
文字を認識する代表的なニューラルネットワークとしては、LeNetに代表される畳み込みニューラルネットワークが例示される。畳み込みニューラルネットワークは、単文字が写っている画像を複数のカテゴリに分類するように学習して、単文字を認識するニューラルネットワークである。
しかし、畳み込みニューラルネットワークは、認識単位が単文字に限定されることから、識別用文字列を認識するには画像処理を施して、画像から対象となる個々の単文字を切り出す必要がある。それ故、画像に写り込んだ影の影響や画像におけるコントラスト比などの撮像条件によっては、物品の表面に記録された識別用文字列の認識精度が落ち、認識率が低くなるという問題があった。また、画像に複数の文字列が存在する場合に、読み取る対象となる識別用文字列のみを認識することは難しく、不要な文字列にも処理を施す必要があった。
本発明の目的は、撮像条件が悪い場合や画像に複数の文字列が存在する場合でも、所定の識別用文字列のみを高精度に自動認識することができる読取システム及び読取方法を提供することである。
上記の目的を達成する本発明の読取システムは、既知の特徴を有する特徴文字列と、その特徴文字列の近傍に配置されて、その特徴文字列に対して所定の規則を適用して算出された単文字の検査文字とからなる識別用文字列を、入力された画像から読取る読取システムであって、前記画像の中に含まれる文字列が占有する文字列領域における先端から後尾までの間の特徴量の連なりから文字列を認識単位として、前記画像の中に含まれる複数の文字列の中から前記既知の特徴に基づいて前記特徴文字列を認識する文字列認識部と、前記画像の中に含まれる単文字が判別可能に切り出された単文字画像データから単文字を認識単位として、前記文字列認識部が認識した前記特徴文字列の位置に基づいて前記検査文字を認識する単文字認識部と、前記文字列認識部が認識した前記特徴文字列に対して前記所定の規則を適用して算出した算出文字と、前記検査文字とが一致した場合に、前記特徴文字列、及び前記検査文字を順に並べた文字列を前記識別用文字列として認識して出力する出力部とを備えることを特徴とする。
上記の目的を達成する本発明の読取方法は、既知の特徴を有する特徴文字列と、その特徴文字列の近傍に配置されて、その特徴文字列に対して所定の規則を適用して算出された単文字の検査文字とからなる識別用文字列を、入力された画像から読み取る読取方法であって、前記画像の中に含まれる文字列が占有する文字列領域における先端から後尾までの間の特徴量の連なりから文字列を認識単位として、前記画像の中に含まれる複数の文字列の中から前記既知の特徴に基づいて前記特徴文字列を認識し、前記画像の中に含まれる単文字が判別可能に切り出された単文字画像データから単文字を認識単位として、探し出した前記特徴文字列の位置に基づいて前記検査文字を認識し、前記文字列認識部が認識した前記特徴文字列に対して前記所定の規則を適用して算出文字を算出し、前記算出文字と、前記検査文字とが一致するか否かを判定し、前記算出文字と前記検査文字とが一致したと判定した場合に、前記特徴文字列、及び前記検査文字を順に並べた文字列を前記識別用文字列として認識することを特徴とする。
本発明は、文字列を認識単位として既知の特徴を手がかりとして特徴文字列を認識する文字列認識部と、単文字を認識単位として特徴文字列が認識されたことで位置が特定された単文字を検査文字として認識する単文字認識部とを併用する。それ故、本発明によれば、画像から対象となる文字を一文字ずつ切り出す画像処理を省き、画像処理を起因とする特徴文字列の認識の低下を解消することができる。同時に、特徴文字列を認識することで検査文字の位置を特定することで、高精度に検査文字を認識することが可能になり、特徴文字列の不確かな認識結果を排除することができる。これにより、撮像条件が悪い場合や画像に複数の文字列が存在する場合でも、所定の識別用文字列のみを高精度に自動認識することができる。
読取システムの実施形態を例示する構成図である。 図1の撮像装置が撮像した画像を例示する説明図である。 識別用文字列の配列を例示する説明図である。 図1の読取システムを例示するブロック図である。 読取方法を例示するフロー図の一部である。 図5のAから続く読取方法を例示するフロー図の一部である。 図6のBから続く読取方法を例示するフロー図の一部である。 図7のCから続く読取方法を例示するフロー図の一部である。 図7のDから続く読取方法を例示するフロー図の一部である。 図5の規則を例示する説明図である。 図6の規則を例示する説明図である。 図7の規則を例示する説明図である。
以下、読取システムの実施形態について説明する。なお、本明細書において、文字列の書字方向は、文字列が左から右へ順に並べられる左横書きとし、文字列の先頭は文字列の左端とし、後尾は文字列の右端とする。
図1に例示するように、読取システム40は、コンテナターミナル11で扱われる貨物12に記載された識別用文字列20を認識するシステムであり、撮像装置13により撮像された画像14から識別用文字列20を認識するシステムである。また、読取システム40は、エッジデバイス30に組み込まれたシステムである。
コンテナターミナル11は、貨物12の海上輸送及び陸上輸送の結節点となる港湾施設である。コンテナターミナル11では、出入口であるゲート15からコンテナターミナル11への進入時や退出時に、撮像装置13により撮像された画像14から貨物12に記載された識別用文字列20を認識する作業が行われる。
貨物12は、コンテナやコンテナタンクが例示される。貨物12は、コンテナターミナル11と外部との間で行き来する外来シャーシ16に搭載された状態で、外来シャーシ16の後退方向に向いた面に識別用文字列20が記載される。なお、識別用文字列20の記載場所は特に限定されず、貨物12の側面や上面に記載されてもよい。
撮像装置13は、ゲート15に設置されて、外来シャーシ16に搭載された状態の貨物12に記載の識別用文字列20を含む画像14を撮像する装置である。撮像装置13は、撮像した画像14に識別用文字列20が含まれていればよく、設置場所は限定されない。なお、貨物12において識別用文字列20が記載される箇所が特定可能な場合は、撮像装置13に、貨物12における特定した箇所のみを撮像させて、画像14における識別用文字列20とは異なる文字列の含有量を少なくするとよい。
図2に例示するように、貨物12がコンテナの場合に、その面には開閉扉17が形成され、識別用文字列20が外来シャーシ16を背面視で開閉扉17の右上の領域に記載される。また、識別用文字列20の配置位置によっては、識別用文字列20が開閉扉17の開閉バー18を避けるように複数に分割されて記載される場合もある。
識別用文字列20は、貨物12の背面に記載された複数の文字列のうちで、貨物12の背面の隅の近傍に記載される可能性が高い文字列であり、貨物12がコンテナの場合に背面の右上に記載される可能性が高い。なお、識別用文字列20は、貨物12がコンテナタンクの場合に背面の右下に記載されることもある。
識別用文字列20は、特徴文字列21及び検査文字(チェックデジットともいう)22を有する十一桁の文字列である。特徴文字列21は、識別用文字列20の先頭に配置され、第一文字列23及び第二文字列24を有する。
第一文字列23は、特徴文字列21の先頭に配置され、四桁のアルファベットで構成される。第一文字列23は、先頭側の三桁のアルファベットが貨物12の所有者ごとに異なる所有者コードを示し、後尾の一桁のアルファベットが装置区分識別子を示す。貨物12の装置区分識別子としては、「U」が用いられる。第二文字列24は、特徴文字列21の後尾に配置され、六桁の数字で構成され、貨物12の固有のシリアルナンバーを示す。検査文字22は、識別用文字列20に隣接するように配置され、特徴文字列21に対して所定の計算式を適用して算出される単文字の数字で構成される。
なお、所有者コードは、B.I.C(The Bureau International des Containers et du Transport Intermodal)に登録されたコードである。
つまり、貨物12の識別用文字列20は、先頭から後尾に向かって順に、三桁のアルファベット、一桁のアルファベットである「U」、六桁の数字、及び、一桁の数字が並ぶという既知の特徴を有する。また、第一文字列23は、三桁のアルファベットの組み合わせのうちのB.I.Cに登録された所有者コードに候補が絞られるという既知の特徴を有する。さらに、検査文字22は、特徴文字列21の後尾の近傍に配置された一桁の数字であるという既知の特徴を有する。なお、検査文字22においては、特徴文字列21と区別可能に枠により囲われる場合がある。そこで、特徴文字列21の近傍に配置された一桁の数字が枠に囲われることを既知の特徴としてもよい。
図3(a)〜図3(c)に例示するように、識別用文字列20は、第一文字列23、第二文字列24、及び検査文字22の配置が貨物12ごとに異なる。例えば、図3(a)に例示するように、第一文字列23の下方に第二文字列24が四桁の数字と二桁の数字との二つの文字列に区分されて一列に配置される場合がある。また、図3(b)に例示するように、第一文字列23の右方に第二文字列24が三桁の数字と三桁の数字との二つの文字列に区分されて一列に配置される場合もある。さらに、図3(c)に例示するように、第一文字列23の右方に第二文字列24が三桁の数字と三桁の数字との二つの文字列に区分された上下二列に配置される場合もある。但し、いずれの場合においても、第二文字列24は第一文字列23の近傍に配置され、検査文字22は第二文字列24の後尾の近傍に配置される。
図4に例示するように、エッジデバイス30は、ゲート15に設置され、各種情報処理を行うCPU、その各種情報処理を行うために用いられるプログラムや情報処理結果を読み書き可能な内部記憶装置、及び各種インターフェースなどから構成されるハードウェアである。エッジデバイス30は、撮像装置13、表示装置31、及び入力装置32に通信可能に接続され、各機能要素として、文字列領域検出システム33及び読取システム40を備える。各機能要素は、互いに独立したプログラムとして内部記憶装置に記憶されていて、適時、CPUにより実行されている。なお、各機能要素としては、プログラムの他にそれぞれが独立して機能するプログラマブルコントローラ(PLC)で構成されてもよい。
表示装置31及び入力装置32は、ゲート15で作業する作業者に携帯される携帯端末に組み込まれる装置である。なお、表示装置31及び入力装置32は、携帯端末以外にエッジデバイス30が設置される図示しない管理棟に設けられてもよい。
文字列領域検出システム33は、撮像装置13が撮像した画像14が入力されて、文字列領域(シーンテキストともいう)Tn及びその文字列領域Tnの位置Pnが検出されたデータ34を出力するシステムである。文字列領域Tnは、画像14の中に含まれる文字列が占有する領域であり、隣り合う文字どうしの間隔が所定の閾値以下の場合はそれらの文字どうしが同一の領域に存在するとして設定された領域である。つまり、文字列領域TnのX方向の長さは連なる文字数に応じて設定され、Y方向の長さは文字の大きさに応じて設定される。位置Pnは、画像14における文字列領域Tnの位置であり、画像14の中心を原点として文字列領域Tnの所定の点(実施形態では領域の中心点)の二次元座標として示される。なお、文字列領域Tnは、文字及び背景のコントラスト比や文字列において隣り合う文字どうしの間隔の閾値を設定することで、X方向の拡大や縮小を自在にコントロール可能であり、文字列領域Tnに存在する文字列の文字数を変えることが可能であることが望ましい。文字列領域Tnの検出には、様々な手法が提案されており、文字列領域検出システム33としては、提案されている周知の手法であればよい。
読取システム40は、データ34が入力されて、識別用文字列20の認識が成功した場合にその識別用文字列20を出力する一方で、識別用文字列20の認識が失敗した場合に認識が失敗したことを出力する機能要素である。読取システム40は、機能要素として文字列認識部41、単文字認識部42、判定部43、出力部44、及び画像処理部47を備える。
文字列認識部41は、データ34が入力されて、認識した特徴文字列21を判定部43に出力すると共に特徴文字列21の位置を画像処理部47に出力する機能要素である。文字列認識部41は、文字列を認識単位として、データ34に存在する複数の文字列の中から上述した既知の特徴に基づいて、複合型ニューラルネットワークを用いて、特徴文字列21を認識する機能要素である。文字列認識部41は、第一文字列認識部35、及び第二文字列認識部36を有する。
また、文字列認識部41は、認識可能な特徴文字列21が存在する文字列領域Tnを文字ごとに分割して生成された単文字画像データ48が教師データとして入力される機能要素である。
複合型ニューラルネットワークとしては、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)と再帰型ニューラルネットワーク(RNN:Recurrent Neural Network)と複合したニューラルネットワークが望ましい。複合型ニューラルネットワークは、文字列領域Tnを文字の配列方向の先端から後尾に向かって複数に区画し、区画ごとの特徴量を畳み込みニューラルネットワークにより抽出し、先端から後尾までの間の特徴量の連なりを再帰型ニューラルネットワークにより同時に捉えて、文字列を認識するニューラルネットワークである。つまり、複合型ニューラルネットワークは、文字列領域Tnに存在する文字列を個々の文字に切り出す必要がなく、文字列を認識単位として認識可能なニューラルネットワークである。
複合型ニューラルネットワークに与えられる学習のための教師データは、識別用文字列20に用いられるフォントデータや所有者コードになる。このように、複合型ニューラルネットワークに実際の貨物12の識別用文字列20に使用されるデータを教師データとして予め入力することで、複合型ニューラルネットワークを用いた文字列の認識精度を向上するには有利になる。なお、フォントデータとしては、一種類に限定せずに様々な種類や所定の角度で回転させたもの、上下左右を反転させたものを用いてもよく、実際に貨物を撮像した画像から切り出した文字を用いることが好ましい。
第一文字列認識部45は、データ34が入力されて、複合型ニューラルネットワークを用いて認識した第一文字列23を判定部43に出力すると共に第一文字列23の位置を第二文字列認識部46に出力する機能要素である。第一文字列認識部45は、第一文字列23が四桁のアルファベットであり、且つ、後尾に特定文字として「U」が存在するという既知の特徴に基づいて、第一文字列23を認識する。
第二文字列認識部46は、データ34及び第一文字列23の位置が入力されて、複合型ニューラルネットワークを用いて認識した第二文字列24を判定部43に出力すると共に第二文字列24の位置を画像処理部47に出力する機能要素である。第二文字列認識部46は、第二文字列24が第一文字列23の近傍に配置されることと六桁の数字であるという既知の特徴に基づいて、第二文字列24を認識する。
単文字認識部42は、画像処理部47で単文字が判別可能に切り出された単文字画像データ48(48a、48b)が入力されて、認識した検査文字22を判定部43に出力する機能要素である。単文字認識部42は、単文字を認識単位として、畳み込みニューラルネットワークを用いて、検査文字22を認識する機能要素である。
また、単文字認識部42は、文字列認識部41が特徴文字列21を認識不可の場合に、特徴文字列21を構成する文字の全て又は一部を一文字ずつ畳み込みニューラルネットワークを用いて再認識した再認識文字列26を文字列認識部41及び判定部43に出力する機能要素でもある。
畳み込みニューラルネットワークとしては、LeNetが例示される。単文字認識部42の畳み込みニューラルネットワークに与えられる学習のための教師データは、識別用文字列20に用いられるフォントデータである。なお、フォントデータとしては、複合型ニューラルネットワークの教師データと同様に、一種類に限定せずに様々な種類や所定の角度で回転させたもの、上下左右を反転させたものを用いてもよく、実際に貨物を撮像した画像から切り出した文字を用いることが好ましい。
判定部43は、文字列認識部41から出力された特徴文字列21と単文字認識部42から出力された検査文字22とが入力されて、特徴文字列21に対して所定の計算式を適用して算出された算出文字25と検査文字22とを照合する機能要素である。また、判定部43は、算出文字25と検査文字22とを照合して、それらが一致した場合に出力部44に特徴文字列21及び検査文字22を出力する機能要素である。一方、判定部43は、算出文字25と検査文字22とを照合して、それらが不一致の場合に特徴文字列21の位置に基づいて単文字認識部42に特徴文字列21を構成する文字の全て又は一部を一文字ずつ再認識させた再認識文字列26を特徴文字列21として判定部43に出力させる機能要素である。
出力部44は、判定部43から出力された特徴文字列21及び検査文字22が入力されて、特徴文字列21及び検査文字22を先頭から順に並べた文字列を識別用文字列20として出力し、表示装置31に出力した識別用文字列20を表示させる機能要素である。また、判定部43から識別用文字列20の認識不可が指示されると表示装置31に「認識不可」を表示させる機能要素でもある。
画像処理部47は、第二文字列認識部46から出力された第二文字列24の位置が入力されて、検査文字22が判別可能に切り出された検査文字画像データ48aを単文字認識部42に出力する機能要素である。また、画像処理部47は、第二文字列24が存在する文字列領域Tnが文字ごとに分割された複数の第二文字列画像データ48bを単文字認識部42に出力する機能要素でもある。なお、第二文字列画像データ48bは、第二文字列24の桁数と同数の個数となる。
図5〜図9に例示するように、識別用文字列20の認識方法は、文字列領域検出システム33から出力されたデータ34が入力するとスタートし、表示装置31に識別用文字列20が表示される又は「認識不可」が表示されると終了する方法である。また、識別用文字列20の認識方法は、繰り返し行う過程でニューラルネットワークの教師データが蓄積されるに連れて、認識精度が向上する方法である。
図5に例示するように、データ34が入力されると、第一文字列認識部45は、予め設定された規則Pに従ってデータ34に存在する複数の文字列領域Tnを序列する(S110)。
図10に例示するように、データ34は、文字列が占有する領域が複数の文字列領域Tn(n=1、2、・・・、25)として検出されたデータであり、その文字列領域Tnの位置と占有面積とが平面座標として検出されたデータである。規則Pは、複数の文字列領域Tnに対して優先順位を設定する規則であり、画像14の四隅のうちのいずれかの隅を原点P0として、原点P0と文字列領域Tnとの距離に基づく規則である。この実施形態で、規則Pは、識別用文字列20が貨物12の背面の右上に記載されるという慣例に基づいて画像14の右上隅を原点P0とする。また、規則Pは、原点P0に最も近い文字列領域T3を先頭とし、最も遠い文字列領域T21を後尾とし、原点P0との距離が近い順(T3、T2、T4、T1、T8、・・・、T21)に序列する。
次いで、第一文字列認識部45は、複合型ニューラルネットワークを用いて序列のa番目の文字列領域Tnに存在する文字列を認識する(S120)。文字列が左横書きに記載される場合に、文字列領域Tnの左端を先頭とし、右端を後尾とするとよく、文字列領域Tnを区切る区画数を第一文字列23の桁数以上とするとよい。
次いで、第一文字列認識部45は、認識した文字列に対して予め設定された条件Aが成立するか否かを判定する(S140)。条件Aは、第一文字列23の既知の特徴に基づく条件である。条件Aは、認識した文字列が四桁のアルファベットで構成され、且つ、後尾に特定文字として「U」が存在する場合に成立することが好ましい。また、条件Aは、認識した文字列の先頭から3桁までがB.I.Cに登録された管理者コードのいずれかであり、且つ、後尾に「U」が存在する場合に成立することがより好ましい。
次いで、条件Aが成立した場合に(S140:YES)、第一文字列認識部45は、認識した文字列を第一文字列23として判定部43に出力すると共に、第二文字列認識部46に第一文字列23のデータを出力する(S150)。
一方、条件Aが不成立の場合に(S140:NO)、第一文字列認識部45は、序列の順番をカウントアップする(S160)。次いで、第一文字列認識部45は、カウントアップした順番が規則Pで序列した最後尾の順番よりも大きいか否かを判定する(S170)。順番が最後尾の順番よりも大きいと判定すると、データ34から第一文字列23を認識できないとして、表示装置31に「認識不可(ERROR)」を表示させる(S180)。一方、順番が最後尾の順番以下と判定すると、ステップS120へ戻り、序列の(a+1)番目の文字列領域Tnを選択し、ステップS120以降を行う。
図6に例示するように、第一文字列認識部45から出力された第一文字列23のデータが入力されると、第二文字列認識部46は、予め設定された規則Qに従って文字列領域Tnを選択する(S210)。規則Qは、第一文字列23の文字列領域Tnの近傍に位置する複数の文字列領域Tnに対して優先順位を設定する規則である。
図11に例示するように、第二文字列24は第一文字列23の近傍に配置される。前述したとおり、第二文字列24は、第一文字列23の右方又は下方に配置される。加えて、第二文字列24は、一列の文字列、又は上下二列に分かれた二つの文字列で構成される。そこで、規則Qは図中の点線で囲われた範囲内の文字列領域(T2、T3、T4)を選択する。
図6に例示するように、第二文字列認識部46は、複合型ニューラルネットワークを用いて選択した文字列領域Tnに存在する文字列を認識する(S220)。このステップで、文字列領域T2、T3、T4を区切る区画数を第二文字列24の桁数以上とするとよい。
次いで、第二文字列認識部46は、認識した文字列に対して予め設定された条件Bが成立するか否かを判定する(S230)。条件Bは、第二文字列24の既知の特徴に基づく条件である。条件Bは、認識した文字列を組み合わせたときの文字数が合計して七文字以下で、且つその全てが数字であることが条件の一つである。なお、認識した文字列の組み合わせには、文字列が一つの場合を含むものとする。また、条件Bは、認識した文字列から六桁の数字が構成される場合に成立することが好ましい。つまり、条件Bは、認識した一つの文字列が横一列の六桁の数字、認識した一つの文字列が横一列の七桁の数字(後尾の一桁の数字は検査文字)、認識した二つの文字列が横一列の六桁の数字(三桁+三桁、四桁+二桁など)、認識した二つの文字列が上下二列の六桁の数字が構成される場合に成立することがより好ましい。
この実施形態で、条件Bが成立するか否かを第二文字列24が存在すると予測される複数の文字列領域Tnを選択して、それらに存在する文字列を認識して、それらの文字列の組み合わせで判断したが、左横書きの順番に文字列領域Tnごとに条件Bの成否を判断してもよい。例えば、文字列領域T2〜T4に存在する文字列を順番に認識し、文字列領域T2に存在する文字列が六桁の場合に条件Bが成立したと見做してもよい。また、文字列領域T2に存在する文字列が三桁の場合に、文字列領域T3又は文字列領域T4のそれぞれに存在する文字列が三桁のときに、条件Bが成立したと見做してもよい。
次いで、条件Bが成立した場合に(S230:YES)、第二文字列認識部46は、認識した文字列を第二文字列24として判定部43に出力すると共に、画像処理部47に第二文字列24のデータを出力する(S240)。
一方、条件Bが不成立の場合に(S230:NO)、第二文字列認識部46は、文字列領域検出システム33に文字列領域Tnを文字の配列方向に拡大させる指示をする(S250)。次いで、第二文字列認識部46は、拡大した文字列領域Tnが最大限まで拡大したか否かを判定する(S260)。文字列領域Tnが最大限まで拡大したと判定すると、データ34から第二文字列24を認識できないとして、表示装置31に「認識不可(ERROR)」を表示させる(S270)。一方、文字列領域Tnが最大限まで拡大していないと判定すると、ステップS210へ戻り、拡大された文字列領域Tnに対して規則Qで選択し、ステップS210以降を行う。
図7に例示するように、データ34及び第二文字列認識部46が出力した第二文字列24のデータが入力されると、画像処理部47は、予め設定された規則Rに従ってデータ34に存在する複数の文字列領域Tnの中から検査文字22が存在すると予測される文字列領域Tnを選択する(S310)。規則Rは、検査文字22が第二文字列24の後尾の近傍に配置される一文字の数字であることに基づいて、第二文字列24の後尾を基準とした所定の範囲内に存在する文字列領域T4を選択する規則である。
図12に例示するように、検査文字22は、第二文字列24の後尾の近傍に配置される。前述したとおり、検査文字22は、第二文字列24の後尾の右方又は下方に単文字として配置される。そこで、規則Rは図中の点線で囲われた範囲内の文字列領域(T3)を選択する。なお、上記のステップS210における条件Bの成否の過程で七桁の数字が認識された場合は、先頭側の六桁の数字が第二文字列24、最後尾の一桁の数字が検査文字22となることから、対象となる文字列領域T4の最後尾に当たる部位を画像処理部47で切り出すとよい。
図7に例示するように、画像処理部47は、選択された文字列領域Tnを画像処理した検査文字画像データ48aを単文字認識部42に出力する(S320)。
次いで、単文字認識部42は、畳み込みニューラルネットワークを用いて検査文字画像データ48aに存在する単文字を認識する(S330)。次いで、単文字認識部42は、認識した単文字を検査文字22として判定部43に出力する(S340)。
次いで、判定部43は、第一文字列23と第二文字列24とに所定の計算式を適用して算出文字25を算出する(S350)。所定の計算式は、第一文字列23と第二文字列24とからなる特徴文字列21から検査文字22を算出する際の計算式である。次いで、判定部43は、第一文字列23及び第二文字列24から算出した算出文字25が、単文字認識部42で認識された検査文字22に一致するか否かを判定する(S360)。
図8に例示するように、算出文字25が検査文字22に一致すると判定する(S360:YES)と、判定部43は、画像処理部47に指示を出し、画像処理部47に第二文字列24が存在する文字列領域Tnから文字ごとに分割する画像処理を施した複数の第二文字列画像データ48bを生成する(S410)。次いで、画像処理部47は、生成した複数の第二文字列画像データ48bをランダムに並び替えて(S420)、教師データとして第二文字列認識部46に入力する(S430)。
次いで、判定部43は出力部44に指示を出し、その指示に基づいて出力部44は、表示装置31に読取システム40が識別用文字列20を読み取れたことを示すように、読み取った識別用文字列20を表示させて(S440)、この読取方法が完了する。
図9に例示するように、算出文字25が検査文字22に一致しないと判定する(S360:NO)と、判定部43は、画像処理部47に指示を出し、画像処理部47に第二文字列24が存在する文字列領域Tnから文字ごとに分割する画像処理を施した複数の第二文字列画像データ48bを生成する(S510)。次いで、画像処理部47は、生成した複数の第二文字列画像データ48bの並び順を替えずに第二文字列認識部46に出力する(S520)。
次いで、単文字認識部42は、畳み込みニューラルネットワークを用いて複数の第二文字列画像データ48bに存在する単文字を認識する(S530)。次いで、単文字認識部42は、判定部43に再認識文字列26を出力する(S540)。
次いで、判定部43は、第一文字列23と再認識文字列26とに所定の計算式を適用して再算出文字28を算出する(S550)。次いで、判定部43は、算出した再算出文字28が、検査文字22に一致するか否かを判定する(S560)。再算出文字28が検査文字22に一致すると判定する(S560:YES)と、図8のステップS420へ進み、この読取方法が完了する。
一方、再算出文字28が検査文字22に一致しないと判定する(S560:NO)と、判定部43は出力部44に指示を出し、その指示に基づいて出力部44は、表示装置31に読取システム40が識別用文字列20を読み取れなかったことを示すように、「認識不可」を表示させて(S570)、この読取方法が完了する。
上記の読取方法において、表示装置31に「認識不可」が表示された場合は、作業者が目視により貨物12に記載される識別用文字列20を読み取り、読み取った文字を端末の入力装置32に入力する。次いで、入力装置32に入力された入力文字列27は、エッジデバイス30に送信されて、エッジデバイス30は貨物12の識別用文字列20を認識することが可能になる。
このように、読取システム40による識別用文字列20の読取方法は、識別用文字列20が認識できない場合に学習のための教師データがステップS420、S430の工程により入力される。つまり、読取方法は繰り返し行われることで、特徴文字列認識部41における特徴文字列21の認識精度が高くなる。それ故、経時的に図9に例示する第二文字列24を単文字認識部42に認識させる工程が低減する。
以上のように、読取システム40は、既知の特徴を手がかりとして文字列認識部41が複数の文字から構成される特徴文字列21を認識し、特徴文字列21が認識されたことで位置が特定された単文字を単文字認識部42が検査文字22として認識する構成である。
つまり、文字列を個々の文字に分解する画像処理の工程により認識率が低下する特徴文字列21を認識単位が文字列の文字列認識部41に認識させることで、画像処理の工程を省いて、画像処理を起因とする特徴文字列21の認識の低下を解消することができる。一方、文字列認識部41の数字の認識率が低いというデメリットを解消するために、単文字の検査文字22を認識単位が単文字の単文字認識部42に高精度に認識させることで、特徴文字列の不確かな認識結果を排除することができる。
以上のように、読取システム40は、識別用文字列20が既知の特徴を有する特徴文字列21とその特徴文字列21の近傍に配置される検査文字22とから構成されることに着目して、識別用文字列20の認識に異なる二つの認識方法を用いることで、それぞれの認識方法のデメリットを解消することができる。これにより、撮像装置13の撮像条件が悪い場合や画像14に複数の文字列が存在する場合でも、所定の識別用文字列20のみを高精度に自動認識することができる。
また、読取システム40は、導入直後に文字列認識部41の第二文字列認識部46における第二文字列24の認識率が低い状態である。これに関して、認識可能時の複数の第二文字列画像データ48bをランダムに並び替えて教師データとして活用する教師あり学習により、繰り返し認識を行う過程で第二文字列24の認識率を向上することができる。
読取システム40は、文字列認識部41が識別用文字列20の既知の特徴に基づいて特徴文字列21を一度に認識することも可能であるが、実施形態のように、特徴文字列21を既知の特徴ごとに区分して、それぞれを順番に認識することが望ましい。具体的に、まず、文字列認識部41の第一文字列認識部45が、識別用文字列20の既知の特徴として第一文字列23の桁数、並びに、特定文字の字形及び順番に基づいて、第一文字列23を認識する。次いで、第二文字列認識部46がその第一文字列23の画像14における位置、並びに、第二文字列24の桁数に基づいて、第二文字列24を認識する。このように、特徴文字列21を既知の特徴ごとに区分して、それぞれを順番に認識するようにしたことで、それぞれの認識候補を大幅に絞ることができる。これにより、認識率の向上には有利になり、高精度の自動認識が可能になる。なお、既知の特徴に基づいて、特徴文字列21を三つ以上に区分して、それぞれを認識可能な認識部を三つ以上設けてもよい。
読取システム40は、文字の読み取り方式が特に限定されないが、文字列認識部41として複合型ニューラルネットワークを用いて認識単位を文字列にし、単文字認識部42として畳み込みニューラルネットワークを用いて認識単位を単文字にすることが望ましい。畳み込みニューラルネットワークと再帰型ニューラルネットワークとを複合した複合型ニューラルネットワークは、時系列の流れに意味を持つデータの予測や分類に適するニューラルネットワークである。従って、このような複合型ニューラルネットワークは、特徴文字列21のように、複数の文字の組み合わせを認識させるには適したニューラルネットワークである。また、畳み込みニューラルネットワークは、文字や画像など各部位から特徴を検出することに適するニューラルネットワークである。
上述したとおり、第一文字列23は、所有者コードと「U」との組み合わせであり、認識候補を十分に絞ることができる。一方で、第二文字列24は、貨物12のシリアルナンバーを示しており、認識候補を絞ることができない。それ故、第二文字列24の認識精度は、第一文字列23の認識精度に比して低くなるおそれがある。そこで、判定部43により算出文字25が検査文字22と不一致であると判定した場合に、単文字認識部42に第二文字列24を一文字ずつ認識させることで、認識精度を向上することができる。
既述した実施形態の読取システム40は、コンテナターミナル11で扱われる貨物12に記載された識別用文字列20を認識するシステムを例に説明したが、識別用文字列20が既知の特徴を有するものであれば、貨物12以外に記載された識別用文字列を認識することも可能である。例えば、日本国における自動車登録番号標が例示される。
既述した実施形態では、認識過程に入力される教師データの対象を第二文字列24を例に説明したが、第一文字列23も同様にして教師データの対象としてもよい。また、検査文字22も教師データの対象としてもよい。
記述した実施形態では、第一文字列23に特徴文字である「U」が含まれることから、先に第一文字列認識部45で第一文字列23を認識し、その後、第二文字列認識部46で第二文字列23を認識する構成にしたが、この構成に限定されない。例えば、第二文字列に特徴文字が含まれる識別用文字列を認識する場合は、第二文字列から認識させてもよい。
表示装置31に「認識不可」が表示された場合に、入力装置32により入力される入力文字列27に基づいて、教師データを入力してもよい。
20 識別用文字列
21 特徴文字列
22 検査文字
40 読取システム
41 文字列認識部
42 単文字認識部
43 判定部
44 出力部

Claims (6)

  1. 既知の特徴を有する特徴文字列と、その特徴文字列の近傍に配置されて、その特徴文字列に対して所定の規則を適用して算出された単文字の検査文字とからなる識別用文字列を、入力された画像から読取る読取システムであって、
    前記画像の中に含まれる文字列が占有する文字列領域における先端から後尾までの間の特徴量の連なりから文字列を認識単位として、前記画像の中に含まれる複数の文字列の中から前記既知の特徴に基づいて前記特徴文字列を認識する文字列認識部と、
    前記画像の中に含まれる単文字が判別可能に切り出された単文字画像データから単文字を認識単位として、前記文字列認識部が認識した前記特徴文字列の位置に基づいて前記検査文字を認識する単文字認識部と、
    前記文字列認識部が認識した前記特徴文字列に対して前記所定の規則を適用して算出した算出文字と、前記検査文字とが一致した場合に、前記特徴文字列、及び前記検査文字を順に並べた文字列を前記識別用文字列として認識して出力する出力部とを備えることを特徴とする読取システム。
  2. 前記特徴文字列は、二桁以上の予め特定された桁数で構成されると共に予め字形及び順番が特定された特定文字を少なくとも一文字含む第一文字列と、前記第一文字列の近傍に配置されると共に予め特定された二桁以上の桁数で構成される第二文字列とから構成され、
    前記文字列認識部は、前記既知の特徴として前記第一文字列の桁数、並びに、前記特定文字の字形及び順番に基づいて、前記第一文字列を認識し、認識したその第一文字列の前記画像における位置、並びに、前記第二文字列の桁数に基づいて、前記第二文字列を認識する機能を有する請求項1に記載の読取システム。
  3. 前記文字列認識部は、畳み込みニューラルネットワークと再帰型ニューラルネットワークとを複合した複合型ニューラルネットワークを用いて前記特徴文字列を認識する機能を有し、
    前記単文字認識部は、畳み込みニューラルネットワークを用いて前記検査文字を認識する機能を有する請求項1又は2に記載の読取システム。
  4. 前記算出文字が前記検査文字と一致するか否かを判定する判定部を備えると共に前記文字列認識部がニューラルネットワークを用いて前記特徴文字列を認識する機能を有し、
    前記判定部は、前記算出文字が前記検査文字と不一致であると判定した場合に、前記単文字認識部に、前記特徴文字列を構成する文字の全て又はその一部を一文字ずつ再認識させ、
    前記判定部は、前記単文字認識部に再認識させた文字を含む再認識文字列に対して前記所定の規則を適用して算出した再算出文字が前記検査文字と一致すると判定した場合に、前記文字列認識部に対して、前記再認識文字列を文字ごとに分割した画像データをランダムに並び替えて教師データとして入力する機能を有する請求項1〜3のいずれか1項に記載の読取システム。
  5. 前記算出文字が前記検査文字と一致するか否かを判定する判定部を備えると共に前記文字列認識部がニューラルネットワークを用いて前記特徴文字列を認識する機能を有し、
    前記判定部は、前記算出文字が前記検査文字に一致したと判定した場合に、前記文字列認識部に対して、その文字列認識部が認識した文字列を文字ごとに分割した画像データをランダムに並び替えて教師データとして入力する機能を有する請求項1〜4のいずれか1項に記載の読取システム。
  6. 既知の特徴を有する特徴文字列と、その特徴文字列の近傍に配置されて、その特徴文字列に対して所定の規則を適用して算出された単文字の検査文字とからなる識別用文字列を、入力された画像から読み取る読取方法であって、
    前記画像の中に含まれる文字列が占有する文字列領域における先端から後尾までの間の特徴量の連なりから文字列を認識単位として、前記画像の中に含まれる複数の文字列の中から前記既知の特徴に基づいて前記特徴文字列を認識し、
    前記画像の中に含まれる単文字が判別可能に切り出された単文字画像データから単文字を認識単位として、探し出した前記特徴文字列の位置に基づいて前記検査文字を認識し、
    前記文字列認識部が認識した前記特徴文字列に対して前記所定の規則を適用して算出文字を算出し、
    前記算出文字と、前記検査文字とが一致するか否かを判定し、
    前記算出文字と前記検査文字とが一致したと判定した場合に、前記特徴文字列、及び前記検査文字を順に並べた文字列を前記識別用文字列として認識することを特徴とする読取方法。
JP2018203849A 2018-10-30 2018-10-30 読取システム及び読取方法 Active JP7181761B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018203849A JP7181761B2 (ja) 2018-10-30 2018-10-30 読取システム及び読取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018203849A JP7181761B2 (ja) 2018-10-30 2018-10-30 読取システム及び読取方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018049106A Division JP6430672B1 (ja) 2018-03-16 2018-03-16 読取システム及び読取方法

Publications (2)

Publication Number Publication Date
JP2019160285A true JP2019160285A (ja) 2019-09-19
JP7181761B2 JP7181761B2 (ja) 2022-12-01

Family

ID=67994098

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018203849A Active JP7181761B2 (ja) 2018-10-30 2018-10-30 読取システム及び読取方法

Country Status (1)

Country Link
JP (1) JP7181761B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021103573A (ja) * 2020-06-30 2021-07-15 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 文字認識の方法、装置、電子設備、コンピュータ可読記憶媒体、及びプログラム
JP2022504404A (ja) * 2019-09-27 2022-01-13 シェンチェン センスタイム テクノロジー カンパニー リミテッド テキストシーケンス認識方法及びその装置、電子機器並びに記憶媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002037453A (ja) * 2000-07-18 2002-02-06 Kawasaki Heavy Ind Ltd コンテナターミナルのゲートシステム
JP6430672B1 (ja) * 2018-03-16 2018-11-28 株式会社三井E&Sマシナリー 読取システム及び読取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002037453A (ja) * 2000-07-18 2002-02-06 Kawasaki Heavy Ind Ltd コンテナターミナルのゲートシステム
JP6430672B1 (ja) * 2018-03-16 2018-11-28 株式会社三井E&Sマシナリー 読取システム及び読取方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022504404A (ja) * 2019-09-27 2022-01-13 シェンチェン センスタイム テクノロジー カンパニー リミテッド テキストシーケンス認識方法及びその装置、電子機器並びに記憶媒体
JP7123255B2 (ja) 2019-09-27 2022-08-22 シェンチェン センスタイム テクノロジー カンパニー リミテッド テキストシーケンス認識方法及びその装置、電子機器並びに記憶媒体
JP2021103573A (ja) * 2020-06-30 2021-07-15 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 文字認識の方法、装置、電子設備、コンピュータ可読記憶媒体、及びプログラム
JP7142121B2 (ja) 2020-06-30 2022-09-26 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 文字認識の方法、装置、電子設備、コンピュータ可読記憶媒体、及びプログラム
US11775845B2 (en) 2020-06-30 2023-10-03 Beijing Baidu Netcom Science And Technology Co., Ltd. Character recognition method and apparatus, electronic device and computer readable storage medium

Also Published As

Publication number Publication date
JP7181761B2 (ja) 2022-12-01

Similar Documents

Publication Publication Date Title
JP6430672B1 (ja) 読取システム及び読取方法
US9008430B2 (en) Identification method and apparatus of confusable character
CN109801260B (zh) 牲畜个数的识别方法、装置、控制装置及可读存储介质
US8620094B2 (en) Pattern recognition apparatus, pattern recogntion method, image processing apparatus, and image processing method
CN101408937B (zh) 一种字符行定位的方法及装置
CN110619333B (zh) 一种文本行分割方法、文本行分割装置及电子设备
CN111340023B (zh) 文本识别方法及装置、电子设备、存储介质
CN110705531B (zh) 缺失字符检测、缺失字符检测模型的建立方法及装置
JP7181761B2 (ja) 読取システム及び読取方法
CN112507782A (zh) 文本图像的识别方法及装置
CN111079480A (zh) 身份证信息的识别方法、装置及终端设备
CN112541504A (zh) 一种针对文本中单个字符目标的检测方法
Sunny et al. Image based automatic traffic surveillance system through number-plate identification and accident detection
CN107862314B (zh) 一种喷码识别方法和识别装置
CN112381034A (zh) 一种车道线检测方法、装置、设备及存储介质
US5038391A (en) Optical character reader
CN111126286A (zh) 车辆动态检测方法、装置、计算机设备及存储介质
Ganai et al. Projection profile based ligature segmentation of Nastaleeq Urdu OCR
JPH07160822A (ja) パターン認識方法
CN109034166B (zh) 易混淆字符识别模型训练方法和装置
CN112541435B (zh) 一种图像处理的方法、装置和存储介质
TW200532586A (en) Multiple recognition system and method for license plates
CN109409370B (zh) 一种远程桌面字符识别方法和装置
CN111626982A (zh) 识别待检测货箱批次码的方法和装置
CN112700407A (zh) 一种确定图像清晰度的方法、装置和存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181106

A625 Written request for application examination (by other person)

Free format text: JAPANESE INTERMEDIATE CODE: A625

Effective date: 20210202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220201

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220602

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221018

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221118

R150 Certificate of patent or registration of utility model

Ref document number: 7181761

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350