JP2022018202A - 情報処理装置およびプログラム - Google Patents
情報処理装置およびプログラム Download PDFInfo
- Publication number
- JP2022018202A JP2022018202A JP2020121135A JP2020121135A JP2022018202A JP 2022018202 A JP2022018202 A JP 2022018202A JP 2020121135 A JP2020121135 A JP 2020121135A JP 2020121135 A JP2020121135 A JP 2020121135A JP 2022018202 A JP2022018202 A JP 2022018202A
- Authority
- JP
- Japan
- Prior art keywords
- word
- character
- color
- information processing
- certainty
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 45
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 9
- 238000003672 processing method Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 5
- 239000003086 colorant Substances 0.000 abstract description 4
- 238000000034 method Methods 0.000 description 55
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 5
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000008719 thickening Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/255—Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Discrimination (AREA)
- Editing Of Facsimile Originals (AREA)
- Character Input (AREA)
Abstract
Description
画像データに含まれる文字を認識する認識手段を備える情報処理装置であって、
前記認識手段が認識した複数の文字から構成される文字列を単語化し、単語ごとに文字色を設定する単語処理手段と、
前記単語処理手段による設定に基づいて、前記画像データに含まれる文字をテキストデータに変換したファイルを出力する出力手段と
を含む、情報処理装置が提供される。
Claims (8)
- 画像データに含まれる文字を認識する認識手段を備える情報処理装置であって、
前記認識手段が認識した複数の文字から構成される文字列を単語化し、単語ごとに文字色を設定する単語処理手段と、
前記単語処理手段による設定に基づいて、前記画像データに含まれる文字をテキストデータに変換したファイルを出力する出力手段と
を含む、情報処理装置。 - 前記単語処理手段は、文字認識の確信度に応じて前記単語の文字色を設定する、請求項1に記載の情報処理装置。
- 前記単語処理手段は、文字認識の確信度に基づいて辞書データベースを参照して、前記文字列を単語化する、請求項1または2に記載の情報処理装置。
- 前記出力手段は、
前記認識手段によって認識された文字を、前記画像データに含まれる文字の画素に重畳したファイルを出力する、
請求項1~3のいずれか1項に記載の情報処理装置。 - 前記出力手段は、前記画像データに含まれる文字の画素の色を文字認識の確信度に応じた色に変換する、
請求項1~4のいずれか1項に記載の情報処理装置。 - 前記単語処理手段は、
前記単語が辞書データベースに記憶されている単語と一致すると判定した場合に、当該単語を構成する各文字の確信度のうち最も高い値の確信度を当該単語の確信度として、当該単語の文字色または文字の画素の変換色を設定する、
請求項1~5のいずれか1項に記載の情報処理装置。 - 前記単語処理手段は、
前記単語が辞書データベースに記憶されている単語と一致しないと判定した場合に、当該単語を構成する各文字の確信度のうち最も低い値の確信度を当該単語の確信度として、当該単語の文字色または文字の画素の変換色を設定する、
請求項1~6のいずれか1項に記載の情報処理装置。 - 画像データに含まれる文字を認識する認識手段を備える情報処理装置が実行するプログラムであって、前記情報処理装置を
前記認識手段が認識した複数の文字から構成される文字列を単語化し、単語ごとに文字色または文字の画素の変換色を設定する単語処理手段と、
前記単語処理手段による設定に基づいて、前記画像データに含まれる文字をテキストデータに変換したファイルを出力する出力手段と
として機能させる、プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020121135A JP2022018202A (ja) | 2020-07-15 | 2020-07-15 | 情報処理装置およびプログラム |
US17/305,407 US20220019833A1 (en) | 2020-07-15 | 2021-07-07 | Information processing apparatus, information processing method, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020121135A JP2022018202A (ja) | 2020-07-15 | 2020-07-15 | 情報処理装置およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022018202A true JP2022018202A (ja) | 2022-01-27 |
Family
ID=79292525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020121135A Pending JP2022018202A (ja) | 2020-07-15 | 2020-07-15 | 情報処理装置およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20220019833A1 (ja) |
JP (1) | JP2022018202A (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9798943B2 (en) * | 2014-06-09 | 2017-10-24 | I.R.I.S. | Optical character recognition method |
JP6950320B2 (ja) * | 2017-07-18 | 2021-10-13 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
JP7241506B2 (ja) * | 2018-10-30 | 2023-03-17 | ウイングアーク1st株式会社 | 光学式文字認識結果の修正支援装置および修正支援用プログラム |
WO2020194004A1 (en) * | 2019-03-28 | 2020-10-01 | The Nielsen Company (Us), Llc | Methods and apparatus to detect a text region of interest in a digital image using machine-based analysis |
JP2021144307A (ja) * | 2020-03-10 | 2021-09-24 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
-
2020
- 2020-07-15 JP JP2020121135A patent/JP2022018202A/ja active Pending
-
2021
- 2021-07-07 US US17/305,407 patent/US20220019833A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20220019833A1 (en) | 2022-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5647919B2 (ja) | 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム | |
CN111985464B (zh) | 面向法院判决文书的多尺度学习的文字识别方法及系统 | |
US10867171B1 (en) | Systems and methods for machine learning based content extraction from document images | |
RU2437152C2 (ru) | Устройство обработки изображений, способ и компьютерная программа обработки изображений | |
RU2643465C2 (ru) | Устройства и способы, которые используют иерархически упорядоченную структуру данных, содержащую непараметризованные символы, для преобразования изображений документов в электронные документы | |
US20060285748A1 (en) | Document processing device | |
JP2011065646A (ja) | 文字列認識装置及び文字列認識方法 | |
JP2010157107A (ja) | 業務文書処理装置 | |
CN111401099B (zh) | 文本识别方法、装置以及存储介质 | |
JP5249387B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
EP2806336A1 (en) | Text prediction in a text input associated with an image | |
JP6937508B2 (ja) | 画像処理システム、評価モデル構築方法、画像処理方法及びプログラム | |
CN115797706A (zh) | 目标检测方法、目标检测模型训练方法及相关装置 | |
CN110991303A (zh) | 一种图像中文本定位方法、装置及电子设备 | |
JP2022018202A (ja) | 情報処理装置およびプログラム | |
US20150254884A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
RU2657181C1 (ru) | Способ улучшения качества распознавания отдельного кадра | |
WO2022004097A1 (ja) | 情報処理装置、情報処理方法、及びコンピュータプログラム | |
US20150169973A1 (en) | Incomplete patterns | |
Rao et al. | MTESSERACT: An Application for Form Recognition in Courier Services | |
RU2703270C1 (ru) | Оптическое распознавание символов посредством применения специализированных функций уверенности, реализуемое на базе нейронных сетей | |
JP2009140478A (ja) | 画像処理装置及び画像処理方法 | |
CN111753836A (zh) | 文字识别方法、装置、计算机可读介质及电子设备 | |
JP2020047031A (ja) | 文書検索装置、文書検索システム及びプログラム | |
JP6593559B1 (ja) | 画像処理装置、プログラム及びデータ構造 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230511 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240312 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240509 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20240509 |