JP2009245464A - 単語認識プログラム、単語認識方法、単語認識装置 - Google Patents
単語認識プログラム、単語認識方法、単語認識装置 Download PDFInfo
- Publication number
- JP2009245464A JP2009245464A JP2009177596A JP2009177596A JP2009245464A JP 2009245464 A JP2009245464 A JP 2009245464A JP 2009177596 A JP2009177596 A JP 2009177596A JP 2009177596 A JP2009177596 A JP 2009177596A JP 2009245464 A JP2009245464 A JP 2009245464A
- Authority
- JP
- Japan
- Prior art keywords
- word
- character
- recognition
- reliability
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【解決手段】本装置は、画像に含まれる単語を構成する個々の文字を認識する文字認識部と、前記文字認識部にて認識された個々の文字についての文字認識の信頼度を判定する認識信頼度判定部と、前記認識信頼度判定部にて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換してワイルドカード検索を行い候補単語を取得する検索処理部と、前記低信頼度文字を含む画像領域部分と、前記低信頼度文字に対応する前記候補単語における文字から形成される文字画像との類似度の判定を行う類似度判定部と、前記類似度判定部による判定結果に基づいて、前記候補単語を前記画像に含まれる単語として判定する単語判定部とを備えてなる。
【選択図】図1
Description
前記画像に含まれる単語を構成する個々の文字を認識する文字認識ステップと、
前記文字認識ステップにて認識された個々の文字についての文字認識の信頼度を判定する認識信頼度判定ステップと、
前記認識信頼度判定ステップにて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換してワイルドカード検索を行い候補単語を取得する検索処理ステップと、
前記検索処理ステップにおいて、少なくとも2つの単語について候補単語の組み合わせが取得された場合、前記候補単語の組み合わせをキーワードとしてWeb検索を行い、該Web検索の検索結果において最も該当件数が多い組み合わせの候補単語を共起頻度が最も高い組み合わせの候補単語として前記画像に含まれる単語として判定する単語判定ステップと
をコンピュータに実行させる。
前記画像に含まれる単語を構成する個々の文字を認識する文字認識ステップと、
前記文字認識ステップにて認識された個々の文字についての文字認識の信頼度を判定する認識信頼度判定ステップと、
前記認識信頼度判定ステップにて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換してワイルドカード検索を行い候補単語を取得する検索処理ステップと、
前記検索処理ステップにおいて、少なくとも2つの単語について候補単語の組み合わせが取得された場合、前記候補単語の組み合わせをキーワードとしてWeb検索を行い、該Web検索の検索結果において最も該当件数が多い組み合わせの候補単語を共起頻度が最も高い組み合わせの候補単語として前記画像に含まれる単語として判定する単語判定ステップと
を有する。
前記画像に含まれる単語を構成する個々の文字を認識する文字認識部と、
前記文字認識部にて認識された個々の文字についての文字認識の信頼度を判定する認識信頼度判定部と、
前記認識信頼度判定部にて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換してワイルドカード検索を行い候補単語を取得する検索処理部と、
前記検索処理部において、少なくとも2つの単語について候補単語の組み合わせが取得された場合、前記候補単語の組み合わせをキーワードとしてWeb検索を行い、該Web検索の検索結果において最も該当件数が多い組み合わせの候補単語を共起頻度が最も高い組み合わせの候補単語として前記画像に含まれる単語として判定する単語判定部と
を備えてなる。
以下、第1の実施の形態について図面を参照しつつ説明する。図1は、本実施の形態による単語認識装置を示す機能ブロック図である。
(第2の実施の形態)
続いて、第2の実施の形態について説明する。
Claims (6)
- 単語を含む画像の画像情報に基づいて、該単語の認識を行う処理をコンピュータに実行させる単語認識プログラムであって、
前記画像に含まれる単語を構成する個々の文字を認識する文字認識ステップと、
前記文字認識ステップにて認識された個々の文字についての文字認識の信頼度を判定する認識信頼度判定ステップと、
前記認識信頼度判定ステップにて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換してワイルドカード検索を行い候補単語を取得する検索処理ステップと、
前記検索処理ステップにおいて、少なくとも2つの単語について候補単語の組み合わせが取得された場合、前記候補単語の組み合わせをキーワードとしてWeb検索を行い、該Web検索の検索結果において最も該当件数が多い組み合わせの候補単語を共起頻度が最も高い組み合わせの候補単語として前記画像に含まれる単語として判定する単語判定ステップと
をコンピュータに実行させる単語認識プログラム。 - 請求項1に記載の単語認識プログラムにおいて、
前記検索処理ステップにより取得された候補単語群に対して、所定の条件に基づいて、候補単語の絞り込みを行う候補単語限定ステップと、
前記低信頼度文字を含む画像領域部分と、前記低信頼度文字に対応する前記候補単語限定ステップにより絞り込まれた候補単語における文字から形成される文字画像との類似度の判定を行う前記類似度判定ステップと
をコンピュータに実行させる単語認識プログラム。 - 請求項1又は2に記載の単語認識プログラムにおいて、
前記候補単語限定ステップは、descender判定およびascender判定のうち少なくともいずれか一方を行うことにより、前記低信頼度文字を含む単語と前記候補単語との類似度の判定を行い、該判定結果に基づいて候補単語の絞り込みを行う単語認識プログラム。 - 請求項1ないし3のいずれかに記載の単語認識プログラムにおいて、
前記検索処理ステップは、前記低信頼度文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換して、所定の単語辞書検索サイトに配備された単語辞書データベースに対してワイルドカード検索を行い候補単語を取得する単語認識プログラム。 - 単語を含む画像の画像情報に基づいて、該単語の認識を行う単語認識方法であって、
前記画像に含まれる単語を構成する個々の文字を認識する文字認識ステップと、
前記文字認識ステップにて認識された個々の文字についての文字認識の信頼度を判定する認識信頼度判定ステップと、
前記認識信頼度判定ステップにて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換してワイルドカード検索を行い候補単語を取得する検索処理ステップと、
前記検索処理ステップにおいて、少なくとも2つの単語について候補単語の組み合わせが取得された場合、前記候補単語の組み合わせをキーワードとしてWeb検索を行い、該Web検索の検索結果において最も該当件数が多い組み合わせの候補単語を共起頻度が最も高い組み合わせの候補単語として前記画像に含まれる単語として判定する単語判定ステップと
を有する単語認識方法。 - 単語を含む画像の画像情報に基づいて、該単語の認識を行う単語認識装置であって、
前記画像に含まれる単語を構成する個々の文字を認識する文字認識部と、
前記文字認識部にて認識された個々の文字についての文字認識の信頼度を判定する認識信頼度判定部と、
前記認識信頼度判定部にて所定の閾値以下の認識信頼度である低信頼度文字と判定された文字を含む単語について、前記低信頼度文字を所定のワイルドカード記号と置換してワイルドカード検索を行い候補単語を取得する検索処理部と、
前記検索処理部において、少なくとも2つの単語について候補単語の組み合わせが取得された場合、前記候補単語の組み合わせをキーワードとしてWeb検索を行い、該Web検索の検索結果において最も該当件数が多い組み合わせの候補単語を共起頻度が最も高い組み合わせの候補単語として前記画像に含まれる単語として判定する単語判定部と
を備えてなる単語認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009177596A JP4985724B2 (ja) | 2009-07-30 | 2009-07-30 | 単語認識プログラム、単語認識方法、単語認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009177596A JP4985724B2 (ja) | 2009-07-30 | 2009-07-30 | 単語認識プログラム、単語認識方法、単語認識装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004330255A Division JP2006139659A (ja) | 2004-11-15 | 2004-11-15 | 単語認識装置、単語認識方法、単語認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009245464A true JP2009245464A (ja) | 2009-10-22 |
JP4985724B2 JP4985724B2 (ja) | 2012-07-25 |
Family
ID=41307199
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009177596A Expired - Fee Related JP4985724B2 (ja) | 2009-07-30 | 2009-07-30 | 単語認識プログラム、単語認識方法、単語認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4985724B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011113098A (ja) * | 2009-11-21 | 2011-06-09 | Kddi R & D Laboratories Inc | 伏せ字を含む文章を修正するための伏せ字修正プログラム、方法及び文章解析サーバ |
JP2014120059A (ja) * | 2012-12-18 | 2014-06-30 | Fuji Xerox Co Ltd | 情報処理装置及び情報処理プログラム |
KR20140114444A (ko) * | 2012-03-14 | 2014-09-26 | 오므론 가부시키가이샤 | 키워드 검출장치, 그 제어방법 및 제어 프로그램, 및 표시기기 |
JP2014241027A (ja) * | 2013-06-11 | 2014-12-25 | 富士ゼロックス株式会社 | 文書処理装置及びプログラム |
WO2015087379A1 (ja) * | 2013-12-09 | 2015-06-18 | 株式会社 東芝 | 手書き文書情報を処理するための電子機器および方法 |
KR20200128089A (ko) * | 2018-02-28 | 2020-11-11 | 캐논 유로파 엔.브이. | 영상 처리 방법 및 영상 처리 시스템 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02132577A (ja) * | 1988-11-12 | 1990-05-22 | Ricoh Co Ltd | 文字認識結果の修正方法 |
JPH05346974A (ja) * | 1992-06-16 | 1993-12-27 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JP2001022883A (ja) * | 1999-07-12 | 2001-01-26 | Ricoh Co Ltd | 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体 |
JP2004133565A (ja) * | 2002-10-09 | 2004-04-30 | Fujitsu Ltd | インターネットを利用した文字認識の後処理装置 |
-
2009
- 2009-07-30 JP JP2009177596A patent/JP4985724B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02132577A (ja) * | 1988-11-12 | 1990-05-22 | Ricoh Co Ltd | 文字認識結果の修正方法 |
JPH05346974A (ja) * | 1992-06-16 | 1993-12-27 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JP2001022883A (ja) * | 1999-07-12 | 2001-01-26 | Ricoh Co Ltd | 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体 |
JP2004133565A (ja) * | 2002-10-09 | 2004-04-30 | Fujitsu Ltd | インターネットを利用した文字認識の後処理装置 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011113098A (ja) * | 2009-11-21 | 2011-06-09 | Kddi R & D Laboratories Inc | 伏せ字を含む文章を修正するための伏せ字修正プログラム、方法及び文章解析サーバ |
KR20140114444A (ko) * | 2012-03-14 | 2014-09-26 | 오므론 가부시키가이샤 | 키워드 검출장치, 그 제어방법 및 제어 프로그램, 및 표시기기 |
KR101697933B1 (ko) * | 2012-03-14 | 2017-01-19 | 오므론 가부시키가이샤 | 키워드 검출장치, 그 제어방법 및 제어 프로그램, 및 표시기기 |
US9305234B2 (en) | 2012-03-14 | 2016-04-05 | Omron Corporation | Key word detection device, control method, and display apparatus |
JP2014120059A (ja) * | 2012-12-18 | 2014-06-30 | Fuji Xerox Co Ltd | 情報処理装置及び情報処理プログラム |
JP2014241027A (ja) * | 2013-06-11 | 2014-12-25 | 富士ゼロックス株式会社 | 文書処理装置及びプログラム |
JP6054547B2 (ja) * | 2013-12-09 | 2016-12-27 | 株式会社東芝 | 手書き文書情報を処理するための電子機器および方法 |
WO2015087379A1 (ja) * | 2013-12-09 | 2015-06-18 | 株式会社 東芝 | 手書き文書情報を処理するための電子機器および方法 |
KR20200128089A (ko) * | 2018-02-28 | 2020-11-11 | 캐논 유로파 엔.브이. | 영상 처리 방법 및 영상 처리 시스템 |
JP2021502628A (ja) * | 2018-02-28 | 2021-01-28 | キヤノン オイローパ エヌ.ヴェー. | 画像処理方法及び画像処理システム |
US11170265B2 (en) | 2018-02-28 | 2021-11-09 | I.R.I.S. | Image processing method and an image processing system |
JP7038988B2 (ja) | 2018-02-28 | 2022-03-22 | キヤノン オイローパ エヌ.ヴェー. | 画像処理方法及び画像処理システム |
KR102504635B1 (ko) * | 2018-02-28 | 2023-02-27 | 캐논 유로파 엔.브이. | 영상 처리 방법 및 영상 처리 시스템 |
Also Published As
Publication number | Publication date |
---|---|
JP4985724B2 (ja) | 2012-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8131087B2 (en) | Program and apparatus for forms processing | |
TWI321294B (en) | Method and device for determining at least one recognition candidate for a handwritten pattern | |
US7142716B2 (en) | Apparatus for searching document images using a result of character recognition | |
JP4985724B2 (ja) | 単語認識プログラム、単語認識方法、単語認識装置 | |
JP3919617B2 (ja) | 文字認識装置および文字認識方法、プログラムおよび記憶媒体 | |
WO2007137487A1 (en) | Method and apparatus for named entity recognition in natural language | |
JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
JP5646792B2 (ja) | 単語分割装置、単語分割方法、及び単語分割プログラム | |
JP6003705B2 (ja) | 情報処理装置及び情報処理プログラム | |
US10410632B2 (en) | Input support apparatus and computer program product | |
CN112784009B (zh) | 一种主题词挖掘方法、装置、电子设备及存储介质 | |
JP2019169025A (ja) | 情報処理装置、文字認識エンジン選択方法及びプログラム | |
CN107148624A (zh) | 预处理文本的方法以及用于执行该方法的预处理系统 | |
JP2018025956A (ja) | モデル作成装置、推定装置、方法、及びプログラム | |
JP5812534B2 (ja) | 質問応答装置、方法、及びプログラム | |
WO2016181468A1 (ja) | パターン認識装置、パターン認識方法およびプログラム | |
JP2004133565A (ja) | インターネットを利用した文字認識の後処理装置 | |
JP2006139659A (ja) | 単語認識装置、単語認識方法、単語認識プログラム | |
CN115563515A (zh) | 文本相似性检测方法、装置、设备及存储介质 | |
CN115455416A (zh) | 一种恶意代码检测方法、装置、电子设备及存储介质 | |
JP5594134B2 (ja) | 文字列検索装置,文字列検索方法および文字列検索プログラム | |
CN114492390A (zh) | 基于关键词识别的数据扩充方法、装置、设备及介质 | |
JP4148247B2 (ja) | 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP2003242446A (ja) | 文字列予測装置及び方法並びに当該方法を具現化するコンピュータ実行可能なプログラム | |
KR101452638B1 (ko) | 유사 문자열 검색 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090730 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120403 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120416 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150511 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |