JP7139669B2 - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP7139669B2 JP7139669B2 JP2018078880A JP2018078880A JP7139669B2 JP 7139669 B2 JP7139669 B2 JP 7139669B2 JP 2018078880 A JP2018078880 A JP 2018078880A JP 2018078880 A JP2018078880 A JP 2018078880A JP 7139669 B2 JP7139669 B2 JP 7139669B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- information
- search
- character string
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/268—Lexical context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3337—Translation of the query language, e.g. Chinese to English
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
Description
前記文字情報に含まれる少なくとも1つ以上の文字を含む文字列の検索を指示する検索指示情報と、識別情報、前記文字認識手段に対する入力の対象となる第1の文字、及び前記文字認識手段で前記第1の文字を認識したときに出力される第2の文字を予め関連付けた関連情報とに応じて、前記画像情報から出力した前記文字情報の中から前記文字列を検索する検索手段と、
検索された前記文字列に含まれる前記第2の文字を前記関連情報に基づいて前記第1の文字に補正する補正手段と、を備える情報処理装置。
[2]前記文字列に前記第1の文字が含まれるとき、前記関連情報に基づいて前記第1の文字に対応する前記第2の文字を追加して、前記検索手段が前記文字情報において検索する前記文字列の範囲を拡張する拡張手段をさらに備える、前記[1]に記載の情報処理装置。
[3]前記補正手段は、前記関連情報に基づかずに、前記第1の文字の前記文字列における位置と、前記識別情報、当該第1の文字、及び追加された前記第2の文字の組み合わせとを関連付けた関連情報に基づいて、検索された前記文字列を補正する、前記[2]に記載の情報処理装置。
[4]前記検索指示情報が予め定められた条件を満たしたときに、前記文字列の範囲を分割する分割手段をさらに備える、前記[1]から[3]のいずれか1つに記載の情報処理装置。
[5]前記分割手段は、前記予め定められた条件として、前記関連情報に同一の前記第2の文字に対応する複数の前記第1の文字が含まれるときに、前記文字列の範囲を分割する、前記[4]に記載の情報処理装置。
[6]前記検索指示情報を構成する文字を1文字ずつ受け付ける受付手段をさらに備える、前記[1]から[5]のいずれか1つに記載の情報処理装置。
[7]コンピュータを、
画像情報に含まれる文字を認識して文字情報を出力する文字認識手段と、
前記文字情報に含まれる少なくとも1つ以上の文字を含む文字列の検索を指示する検索指示情報と、識別情報、前記文字認識手段に対する入力の対象となる第1の文字、及び前記文字認識手段で前記第1の文字を認識したときに出力される第2の文字を予め関連付けた関連情報とに応じて、前記画像情報から出力した前記文字情報の中から前記文字列を検索する検索手段と、
検索された前記文字列に含まれる前記第2の文字を前記関連情報に基づいて前記第1の文字に補正する補正手段として機能させるためのプログラム。
請求項2に係る発明によれば、検索する文字列の範囲を拡張して検索することができる。
請求項3に係る発明によれば、拡張された範囲で検索された文字列に含まれる文字を拡張前の文字に戻すことができる。
請求項4に係る発明によれば、拡張された範囲に含まれる文字が重複するような場合であっても、拡張された範囲で検索された文字列を一義的に補正することができる。
請求項5に係る発明によれば、拡張された範囲に含まれる文字が重複するような場合であっても、拡張前の文字を特定することができる。
請求項6に係る発明によれば、検索する文字列を1文字ずつ入力することができる。
本実施の形態に係る情報処理装置は、画像情報に含まれる文字を認識して文字情報を出力する文字認識手段と、画像情報に含まれる少なくとも1つ以上の文字を含む文字列の検索を指示する検索指示情報と、文字認識手段に対する入力の対象となる第1の文字及び文字認識手段で第1の文字を認識したときに出力される第2の文字とを予め関連付けた関連情報とに応じて、画像情報から出力した文字情報の中から文字列を検索する検索手段と、検索された文字列を関連情報に基づいて補正する補正手段とを備える。
図1は、本発明の実施の形態に係る情報処理システムの制御系の一例を示すブロック図である。この情報処理システム1は、情報処理装置2と、この情報処理装置2とネットワーク4を介して接続された外部装置3とを備える。情報処理装置2は、例えば、パーソナルコンピュータ、画像形成装置、タブレッド端末、多機能携帯電話機(スマートフォン)等が該当する。
この情報処理装置2は、各部を制御する制御部20と、各種のデータを記憶する記憶部21と、キーボード、マウス等で実現される操作部22と、液晶ディスプレイ等で実現される表示部23と、ネットワーク4を介して、外部装置3との間で信号を送受信する通信部25とを備える。なお、操作部22と表示部23とを一体化した操作表示部(不図示)を設けてもよい。
図2は、誤認識パターンテーブル212の一例を示す図である。誤認識パターンテーブル212には、「ID」欄と、「変換前文字」欄と、「変換後文字」欄とが設けられている。
図3を参照して画面情報215について説明する。図3は、検索文字列入力画面の一例を示す図である。図3(a)に示すように、検索文字列入力画面5Aには、例えば、1つの文字を入力する文字入力欄51、この文字入力欄51に現在何文字目の文字を入力しているかを示す番号情報52、現在までに入力された文字を文字列として示す文字列表示部53、次の文字の入力を行わせる第1の釦54、文字列の入力を終了させる第2の釦55等が含まれる。
次に、制御部20を構成する各手段の詳細について説明する。第1の受付手段200は、外部装置3から送信された画像情報(以下、「画像データ」ともいう。)を受け付ける。画像データは、文書、写真、図表等をデジタルデータとして記憶したものである。具体的には、画像データは、例えば、設計図、配線図、記号、模式図、絵文字、シンボルマーク等の図形情報と、文字や文字列等の文字情報とを含んで構成されたデータ等を含んで構成されている。また、この画像データには、例えば、一度の文字認識処理で全域の文字の認識ができない程度の大きさを有するものが含まれる。
次に、情報処理装置2の動作の一例について図4を参照して説明する。図4は、情報処理装置2の動作の一例を示すフローチャートである。以下、一例として、画像から文字列“fx20991”を検索する事例を例に挙げて説明する。
Claims (7)
- 画像情報に含まれる文字を認識して文字情報を出力する文字認識手段と、
前記文字情報に含まれる少なくとも1つ以上の文字を含む文字列の検索を指示する検索指示情報と、識別情報、前記文字認識手段に対する入力の対象となる第1の文字、及び前記文字認識手段で前記第1の文字を認識したときに出力される第2の文字を予め関連付けた関連情報とに応じて、前記画像情報から出力した前記文字情報の中から前記文字列を検索する検索手段と、
検索された前記文字列に含まれる前記第2の文字を前記関連情報に基づいて前記第1の文字に補正する補正手段と、
を備える情報処理装置。 - 前記文字列に前記第1の文字が含まれるとき、前記関連情報に基づいて前記第1の文字に対応する前記第2の文字を追加して、前記検索手段が前記文字情報において検索する前記文字列の範囲を拡張する拡張手段をさらに備える、
請求項1に記載の情報処理装置。 - 前記補正手段は、前記関連情報に基づかずに、前記第1の文字の前記文字列における位置と、前記識別情報、当該第1の文字、及び追加された前記第2の文字の組み合わせとを関連付けた関連情報に基づいて、検索された前記文字列を補正する、
請求項2に記載の情報処理装置。 - 前記検索指示情報が予め定められた条件を満たしたときに、前記文字列の範囲を分割する分割手段をさらに備える、
請求項1から3のいずれか1項に記載の情報処理装置。 - 前記分割手段は、前記予め定められた条件として、前記関連情報に同一の前記第2の文字に対応する複数の前記第1の文字が含まれるときに、前記文字列の範囲を分割する、
請求項4に記載の情報処理装置。 - 前記検索指示情報を構成する文字を1文字ずつ受け付ける受付手段をさらに備える、
請求項1から5のいずれか1項に記載の情報処理装置。 - コンピュータを、
画像情報に含まれる文字を認識して文字情報を出力する文字認識手段と、
前記文字情報に含まれる少なくとも1つ以上の文字を含む文字列の検索を指示する検索指示情報と、識別情報、前記文字認識手段に対する入力の対象となる第1の文字、及び前記文字認識手段で前記第1の文字を認識したときに出力される第2の文字を予め関連付けた関連情報とに応じて、前記画像情報から出力した前記文字情報の中から前記文字列を検索する検索手段と、
検索された前記文字列に含まれる前記第2の文字を前記関連情報に基づいて前記第1の文字に補正する補正手段として
機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018078880A JP7139669B2 (ja) | 2018-04-17 | 2018-04-17 | 情報処理装置及びプログラム |
CN201910168329.1A CN110390243A (zh) | 2018-04-17 | 2019-03-06 | 信息处理装置以及存储介质 |
US16/378,578 US20190318190A1 (en) | 2018-04-17 | 2019-04-09 | Information processing apparatus, and non-transitory computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018078880A JP7139669B2 (ja) | 2018-04-17 | 2018-04-17 | 情報処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019185631A JP2019185631A (ja) | 2019-10-24 |
JP7139669B2 true JP7139669B2 (ja) | 2022-09-21 |
Family
ID=68161677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018078880A Active JP7139669B2 (ja) | 2018-04-17 | 2018-04-17 | 情報処理装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20190318190A1 (ja) |
JP (1) | JP7139669B2 (ja) |
CN (1) | CN110390243A (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07152774A (ja) * | 1993-11-30 | 1995-06-16 | Hitachi Ltd | 文書検索方法および装置 |
JP3427692B2 (ja) * | 1996-11-20 | 2003-07-22 | 松下電器産業株式会社 | 文字認識方法および文字認識装置 |
JP4006239B2 (ja) * | 2002-02-21 | 2007-11-14 | 株式会社日立製作所 | 文書の検索方法および検索システム |
JP2004348591A (ja) * | 2003-05-23 | 2004-12-09 | Canon Inc | 文書検索方法及び装置 |
JP4750476B2 (ja) * | 2005-06-07 | 2011-08-17 | キヤノン株式会社 | 文書検索装置及び方法と記憶媒体 |
US8949267B2 (en) * | 2010-02-26 | 2015-02-03 | Rakuten, Inc. | Information processing device, information processing method, and recording medium that has recorded information processing program |
-
2018
- 2018-04-17 JP JP2018078880A patent/JP7139669B2/ja active Active
-
2019
- 2019-03-06 CN CN201910168329.1A patent/CN110390243A/zh active Pending
- 2019-04-09 US US16/378,578 patent/US20190318190A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2019185631A (ja) | 2019-10-24 |
CN110390243A (zh) | 2019-10-29 |
US20190318190A1 (en) | 2019-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0844583B1 (en) | Method and apparatus for character recognition | |
JP5647919B2 (ja) | 文字認識装置、文字認識方法、文字認識システム、および文字認識プログラム | |
US9158833B2 (en) | System and method for obtaining document information | |
Ahmad et al. | Kpti: Katib's pashto text imagebase and deep learning benchmark | |
US9213756B2 (en) | System and method of using dynamic variance networks | |
US11410442B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP7139669B2 (ja) | 情報処理装置及びプログラム | |
KR101176963B1 (ko) | 간판 영상 문자 인식 및 후처리 시스템 | |
JP2010211470A (ja) | 文書データ生成装置と文書データ生成方法 | |
US20210089813A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
KR20130122437A (ko) | 영어의 한글 표기 방법 및 시스템 | |
JP2011065597A (ja) | データ検索装置、データ検索方法及びプログラム | |
JP3958722B2 (ja) | イメージデータ文書検索システム | |
JP2020166810A (ja) | テキストの適合および修正の方法 | |
JP2745484B2 (ja) | 手書文字認識方法および装置 | |
AU2019203772B2 (en) | Braille editing method using error output function, recording medium storing program for executing same, and computer program stored in recording medium for executing same | |
JP3548372B2 (ja) | 文字認識装置 | |
JP7247472B2 (ja) | 情報処理装置及びプログラム | |
JP2024003769A (ja) | 文字認識システム、コンピュータによる文字の認識方法、および文字検索システム | |
KR20210047192A (ko) | 음소 기반 텍스트 검색 장치 및 방법 | |
JPH11120294A (ja) | 文字認識装置および媒体 | |
JP2874815B2 (ja) | 日本語文字読取装置 | |
JP2020204886A (ja) | 画像処理装置、その制御方法、及びプログラム | |
JP2005284716A (ja) | 文字認識システム、文字認識方法およびそのプログラム | |
JP2006330780A (ja) | 文字認識装置および文字認識プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210319 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220809 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220822 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7139669 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |