JP2023007011A - 文字認識装置、文字認識方法及び文字認識プログラム - Google Patents
文字認識装置、文字認識方法及び文字認識プログラム Download PDFInfo
- Publication number
- JP2023007011A JP2023007011A JP2021109954A JP2021109954A JP2023007011A JP 2023007011 A JP2023007011 A JP 2023007011A JP 2021109954 A JP2021109954 A JP 2021109954A JP 2021109954 A JP2021109954 A JP 2021109954A JP 2023007011 A JP2023007011 A JP 2023007011A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- unit
- character string
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 121
- 238000000605 extraction Methods 0.000 claims abstract description 30
- 239000003507 refrigerant Substances 0.000 claims description 21
- 239000000284 extract Substances 0.000 claims description 16
- 238000004519 manufacturing process Methods 0.000 claims description 11
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 238000003384 imaging method Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000012423 maintenance Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000011835 investigation Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/196—Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
Description
撮影画像から、特定の文字列を抽出する抽出部と、
抽出された特定の文字列の位置に応じて、前記撮影画像の処理領域を決定する決定部と、
前記撮影画像のうち、決定された処理領域を対象に、文字認識を行う認識部とを有する。
前記抽出部が前記特定の文字列を抽出する際の文字認識において用いる第1ライブラリの文字種は、前記認識部が文字認識を行う際に用いる第2ライブラリの文字種よりも少ない。
前記特定の文字列に含まれる文字の構成を規定した判断情報を保持する第1保持部を有し、
前記抽出部は、前記撮影画像を対象に前記第1ライブラリを用いて文字認識を行い、認識した文字から文字列を識別し、識別した文字列のうち前記判断情報により規定された文字の構成を含む文字列を判定することで、前記特定の文字列を抽出する。
前記判断情報は、前記文字の構成として、文字数、文字種、文字順序のいずれかを規定する。
前記決定部は、前記抽出部が前記特定の文字列を抽出する際に用いたバウンディングボックスを含む領域であって、前記バウンディングボックスの高さの所定倍の高さを有し、かつ、前記特定の文字列の位置から前記撮影画像の端部位置までの幅を有する領域を、前記処理領域として決定する。
認識情報リストを保持する第2保持部を有し、
前記認識部は、認識した文字が前記認識情報リストに含まれるいずれかの認識情報に該当するかを判断する。
前記認識部により前記認識情報リストに含まれるいずれかの認識情報に該当すると判断された場合、前記抽出された特定の文字列を、該当する認識情報に対応するデータとして出力する出力部を有する。
複数の前記処理領域の一部が互いに重複することで、複数の前記処理領域に同じ認識情報が含まれる場合、前記出力部は、前記同じ認識情報の位置により近い特定の文字列を、前記同じ認識情報に対応するデータとして出力する。
前記認識情報リストに含まれる認識情報は機器のラベルであり、少なくとも、機種名、製造番号、製造年月、冷媒種類、冷媒量、圧縮機能力のいずれか1つを含む。
前記撮影画像は、機器に付された銘板を撮影した画像である。
撮影画像から、特定の文字列を抽出する抽出工程と、
抽出された特定の文字列の位置に応じて、前記撮影画像の処理領域を決定する決定工程と、
前記撮影画像のうち、決定された処理領域を対象に文字認識を行う認識工程とを有する。
撮影画像から、特定の文字列を抽出する抽出工程と、
抽出された特定の文字列の位置に応じて、前記撮影画像の処理領域を決定する決定工程と、
前記撮影画像のうち、決定された処理領域を対象に文字認識を行う認識工程と
をコンピュータに実行させる。
<文字認識装置の利用例>
はじめに、第1の実施形態に係る文字認識装置の利用例について説明する。図1は、文字認識装置の利用例を示す図である。図1の左側に示すように、文字認識装置120は、例えば、現場機器110の側面等に付された機器銘板111から、機器データを読み取るシーン等において利用される。
・室外機であることを示す記載、
・冷房と暖房とを兼用する室外機であることを示す記載、
・機種についての記載(ラベル、機種コードデータ)、
・製造番号についての記載(ラベル、製造番号データ)、
・製品質量についての記載(ラベル、質量データ)、
・電源仕様についての記載(ラベル、相数データ、電圧データ、周波数データ)、
・圧縮機電動機の出力についての記載(ラベル、消費電力量データ)、
・管理番号についての記載(ラベル、管理コードデータ)、
・冷媒の量及び種類についての記載(ラベル、冷媒量データ、冷媒種コード)、
・設計圧力についての記載(ラベル、圧力データ)、
・JISマークの記載、
・JISについての記載(登録認証機関コードデータ、JISコードデータ)、
等が含まれる。このように、機器銘板111の記載には、アルファベットや数字、記号、漢字(現場機器110が設置された国の言語)など、多くの文字種が含まれる。なお、図1の画像領域122には示されていないが、機器銘板111には、上記記載のほか、例えば、製造年月についての記載(ラベル、製造年月データ)が含まれていてもよい。
次に、文字認識装置120のハードウェア構成について説明する。図2は、文字認識装置のハードウェア構成の一例を示す図である。図2に示すように、文字認識装置120は、プロセッサ201、メモリ202、補助記憶装置203、ユーザインタフェース装置204、撮像装置205、通信装置206を有する。なお、文字認識装置120の各ハードウェアは、バス207を介して相互に接続されている。
次に、文字認識装置120の機能構成について説明する。上述したように、文字認識装置120には、文字認識プログラムがインストールされており、当該プログラムが実行されることで、文字認識装置120は、
・抽出部310、
・決定部320、
・認識部330、
として機能する。
・機種コードデータ、
・製造番号データ、
・製造年月データ、
・冷媒種コード、
・冷媒量データ、
・圧縮機電動機の消費電力量データ、
等が含まれる。
・文字種の少ない第1ライブラリを用いて文字認識を行うとともに、文字の構成を規定した機器ルールデータを用いて機器データの候補を抽出することで、処理領域を絞り込む。そして、絞り込んだ処理領域を対象に、文字種の多い第2ライブラリを用いて文字認識を行う。
・第2ライブラリを用いて文字認識を行うことで識別した文字列について、ラベルリストを用いてラベルに該当するかを判断し、該当すると判断した場合に、機器データの候補を、該当するラベルの機器データとして出力する。
次に、抽出部310の機能構成の詳細について説明する。図4は、抽出部の機能構成の詳細を示す図である。図4に示すように、抽出部310は、文字列識別部410、特定文字列判定部420、バウンディングボックス判定部430を有する。
次に、抽出部310の処理の具体例について説明する。図5は、抽出部の処理の具体例を示す図である。
次に、決定部320の機能構成の詳細について説明する。図6は、決定部の機能構成の詳細を示す図である。図6に示すように、決定部320は、高さ情報算出部610、幅情報算出部620、処理領域決定部630を有する。
次に、決定部320の処理の具体例について説明する。図7は、決定部の処理の具体例を示す図である。
次に、認識部330の機能構成の詳細について説明する。図8は、認識部の機能構成の詳細を示す図である。図8に示すように、認識部330は、処理領域文字認識部810、判断部820を有する。
・一方の機器データの候補と、「ラベル」の候補との間の距離と、
・他方の機器データの候補と、「ラベル」の候補との間の距離と、
を対比した際のより近い方の機器データの候補を指す。
・一方の機器データの候補と、「ラベル」の候補とが属する行と、
・他方の機器データの候補と、「ラベル」の候補とが属する行と、
を対比した際に同じ行またはより近い行に属する方の機器データの候補を指す。
次に、認識部330の処理の具体例について説明する。図9は、認識部の処理の具体例を示す図である。
・機器データの候補に対応するバウンディングボックスに基づいて処理領域を決定し、
・決定した処理領域の文字の領域に対して文字認識を行うことでラベルを特定し、
・特定したラベルに対応する機器データの候補を機器データとして、特定したラベルと対応付けて出力する。
・機種:A12BCD、
・製造番号:EF34567、
・圧縮機電動機出力:yy.y kW、
・冷媒量:zz.z kg、
・冷媒種類:G89、
を出力する。
次に、文字認識装置120による文字認識処理の流れについて説明する。図10及び図11は、文字認識処理の流れを示す第1及び第2のフローチャートである。
以上の説明から明らかなように、第1の実施形態に係る文字認識装置120は、
・撮影画像から、第1ライブラリに基づいて機器データの候補を抽出する。
・機器データの候補を抽出する際に用いたバウンディングボックスの位置に応じて、撮影画像の処理領域を決定する。
・撮影画像のうち、決定した処理領域を対象に、文字認識を行う。
上記第1の実施形態において決定部320は、抽出部310が機器データの候補を抽出する際のバウンディングボックスに基づいて、処理領域を決定するものとして説明した。しかしながら、決定部320は、バウンディングボックス以外の情報(機器データの候補となる文字列の高さ、幅、撮影画像内での位置を示す情報等)に基づいて処理領域を決定してもよい。
111 :機器銘板
120 :文字認識装置
121 :撮影画像
205 :撮像装置
310 :抽出部
320 :決定部
330 :認識部
410 :文字列識別部
420 :特定文字列判定部
430 :バウンディングボックス判定部
440 :機器データルール
610 :高さ情報算出部
620 :幅情報算出部
630 :処理領域決定部
701~707 :バウンディングボックス
710、720 :処理領域
810 :処理領域文字認識部
820 :判断部
911~915 :処理領域
Claims (12)
- 撮影画像から、特定の文字列を抽出する抽出部と、
抽出された特定の文字列の位置に応じて、前記撮影画像の処理領域を決定する決定部と、
前記撮影画像のうち、決定された処理領域を対象に、文字認識を行う認識部と
を有する文字認識装置。 - 前記抽出部が前記特定の文字列を抽出する際の文字認識において用いる第1ライブラリの文字種は、前記認識部が文字認識を行う際に用いる第2ライブラリの文字種よりも少ない、請求項1に記載の文字認識装置。
- 前記特定の文字列に含まれる文字の構成を規定した判断情報を保持する第1保持部を有し、
前記抽出部は、前記撮影画像を対象に前記第1ライブラリを用いて文字認識を行い、認識した文字から文字列を識別し、識別した文字列のうち前記判断情報により規定された文字の構成を含む文字列を判定することで、前記特定の文字列を抽出する、請求項2に記載の文字認識装置。 - 前記判断情報は、前記文字の構成として、文字数、文字種、文字順序のいずれかを規定する、請求項3に記載の文字認識装置。
- 前記決定部は、前記抽出部が前記特定の文字列を抽出する際に用いたバウンディングボックスを含む領域であって、前記バウンディングボックスの高さの所定倍の高さを有し、かつ、前記特定の文字列の位置から前記撮影画像の端部位置までの幅を有する領域を、前記処理領域として決定する、請求項4に記載の文字認識装置。
- 認識情報リストを保持する第2保持部を有し、
前記認識部は、認識した文字が前記認識情報リストに含まれるいずれかの認識情報に該当するかを判断する、請求項1に記載の文字認識装置。 - 前記認識部により前記認識情報リストに含まれるいずれかの認識情報に該当すると判断された場合、前記抽出された特定の文字列を、該当する認識情報に対応するデータとして出力する出力部を有する、請求項6に記載の文字認識装置。
- 複数の前記処理領域の一部が互いに重複することで、複数の前記処理領域に同じ認識情報が含まれる場合、前記出力部は、前記同じ認識情報の位置により近い特定の文字列を、前記同じ認識情報に対応するデータとして出力する、請求項7に記載の文字認識装置。
- 前記認識情報リストに含まれる認識情報は機器のラベルであり、少なくとも、機種名、製造番号、製造年月、冷媒種類、冷媒量、圧縮機能力のいずれか1つを含む、請求項6に記載の文字認識装置。
- 前記撮影画像は、機器に付された銘板を撮影した画像である、請求項1に記載の文字認識装置。
- 撮影画像から、特定の文字列を抽出する抽出工程と、
抽出された特定の文字列の位置に応じて、前記撮影画像の処理領域を決定する決定工程と、
前記撮影画像のうち、決定された処理領域を対象に文字認識を行う認識工程と
を有する文字認識方法。 - 撮影画像から、特定の文字列を抽出する抽出工程と、
抽出された特定の文字列の位置に応じて、前記撮影画像の処理領域を決定する決定工程と、
前記撮影画像のうち、決定された処理領域を対象に文字認識を行う認識工程と
をコンピュータに実行させるための文字認識プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021109954A JP7235995B2 (ja) | 2021-07-01 | 2021-07-01 | 文字認識装置、文字認識方法及び文字認識プログラム |
CN202280043601.3A CN117501324A (zh) | 2021-07-01 | 2022-06-09 | 字符识别装置、字符识别方法以及字符识别程序 |
PCT/JP2022/023216 WO2023276599A1 (ja) | 2021-07-01 | 2022-06-09 | 文字認識装置、文字認識方法及び文字認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021109954A JP7235995B2 (ja) | 2021-07-01 | 2021-07-01 | 文字認識装置、文字認識方法及び文字認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023007011A true JP2023007011A (ja) | 2023-01-18 |
JP7235995B2 JP7235995B2 (ja) | 2023-03-09 |
Family
ID=84690284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021109954A Active JP7235995B2 (ja) | 2021-07-01 | 2021-07-01 | 文字認識装置、文字認識方法及び文字認識プログラム |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7235995B2 (ja) |
CN (1) | CN117501324A (ja) |
WO (1) | WO2023276599A1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001060251A (ja) * | 1999-08-23 | 2001-03-06 | Fuji Photo Film Co Ltd | 画像処理装置、画像処理方法、及び記録媒体 |
JP2007233913A (ja) * | 2006-03-03 | 2007-09-13 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
JP2019220069A (ja) * | 2018-06-22 | 2019-12-26 | 株式会社東芝 | カード番号認識装置およびカード番号認識方法 |
JP2020184275A (ja) * | 2019-05-09 | 2020-11-12 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI607387B (zh) * | 2016-11-25 | 2017-12-01 | 財團法人工業技術研究院 | 字符辨識系統及其字符辨識方法 |
JP7225548B2 (ja) * | 2018-03-22 | 2023-02-21 | セイコーエプソン株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
-
2021
- 2021-07-01 JP JP2021109954A patent/JP7235995B2/ja active Active
-
2022
- 2022-06-09 WO PCT/JP2022/023216 patent/WO2023276599A1/ja active Application Filing
- 2022-06-09 CN CN202280043601.3A patent/CN117501324A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001060251A (ja) * | 1999-08-23 | 2001-03-06 | Fuji Photo Film Co Ltd | 画像処理装置、画像処理方法、及び記録媒体 |
JP2007233913A (ja) * | 2006-03-03 | 2007-09-13 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
JP2019220069A (ja) * | 2018-06-22 | 2019-12-26 | 株式会社東芝 | カード番号認識装置およびカード番号認識方法 |
JP2020184275A (ja) * | 2019-05-09 | 2020-11-12 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN117501324A (zh) | 2024-02-02 |
WO2023276599A1 (ja) | 2023-01-05 |
JP7235995B2 (ja) | 2023-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11138425B2 (en) | Named entity recognition with convolutional networks | |
Clausner et al. | Scenario driven in-depth performance evaluation of document layout analysis methods | |
JP5665125B2 (ja) | 画像処理方法、及び、画像処理システム | |
EP3916634A2 (en) | Text recognition method and device, and electronic device | |
CN112597773B (zh) | 文档结构化方法、系统、终端及介质 | |
CN109740425A (zh) | 基于增强现实的图像标注方法、系统、设备及存储介质 | |
CN112699775A (zh) | 基于深度学习的证件识别方法、装置、设备及存储介质 | |
WO2022001256A1 (zh) | 图像标注方法、装置、电子设备及存储介质 | |
CN111931771B (zh) | 票据内容识别方法、装置、介质及电子设备 | |
KR20120066397A (ko) | 텍스트 영역의 추출 방법, 추출 장치 및 이를 이용한 번호판 자동 인식 시스템 | |
EP3975139A1 (en) | Querying semantic data from unstructured documents | |
CN113094533B (zh) | 一种基于混合粒度匹配的图文跨模态检索方法 | |
CN107908843B (zh) | 基于图签信息提取的管理系统 | |
JP4589159B2 (ja) | ラスタ地図検索装置 | |
CN115546809A (zh) | 基于单元格约束的表格结构识别方法及其应用 | |
CN111046669A (zh) | 一种兴趣点的匹配方法、装置及计算机系统 | |
KR101911447B1 (ko) | 구조설계 도면의 패턴분석을 통한 3차원 구조해석 모델 생성 장치 | |
KR101768914B1 (ko) | 지오 태깅 방법, 지오 태깅 장치 및 이를 수행하는 프로그램을 기록하는 기록매체 | |
JP7235995B2 (ja) | 文字認識装置、文字認識方法及び文字認識プログラム | |
CN113762109A (zh) | 一种文字定位模型的训练方法及文字定位方法 | |
CN112417687A (zh) | 智能审图方法及相关装置 | |
US9378428B2 (en) | Incomplete patterns | |
CN108170838B (zh) | 话题演变的可视化展现方法、应用服务器及计算机可读存储介质 | |
CN115048599A (zh) | 企业产品的界面配置方法、装置、设备及介质 | |
CN114741697A (zh) | 恶意代码分类方法、装置、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220609 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230206 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7235995 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |