JP2018041329A - 文字認識装置、及び、文字認識方法 - Google Patents
文字認識装置、及び、文字認識方法 Download PDFInfo
- Publication number
- JP2018041329A JP2018041329A JP2016175799A JP2016175799A JP2018041329A JP 2018041329 A JP2018041329 A JP 2018041329A JP 2016175799 A JP2016175799 A JP 2016175799A JP 2016175799 A JP2016175799 A JP 2016175799A JP 2018041329 A JP2018041329 A JP 2018041329A
- Authority
- JP
- Japan
- Prior art keywords
- word
- character
- dictionary
- user
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000011156 evaluation Methods 0.000 claims abstract description 29
- 239000002131 composite material Substances 0.000 description 17
- 238000012545 processing Methods 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 239000002245 particle Substances 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000006854 communication Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【解決手段】文字認識装置は、一般の単語が登録されている一般単語辞書及びユーザ固有の単語が登録されているユーザ単語辞書を保持する記憶部と、文書を含む画像である文書画像から1以上の文字候補を特定する文字特定部と、一般単語辞書及びユーザ単語辞書に基づいて文字特定部によって特定された1以上の文字候補の組み合わせから1以上の単語候補を特定し、単語候補の採用可能性を示すスコアを各単語候補に付与する単語候補特定部と、単語候補特定部によって特定された1以上の単語候補のうち、所定の条件に適合する単語候補のスコアを調整するスコア調整部と、各単語候補のスコアに基づいて採用する単語候補の組み合わせを決定するスコア評価部とを有する。
【選択図】図1
Description
一般の単語が登録されている一般単語辞書、及び、ユーザ固有の単語が登録されているユーザ単語辞書を保持する記憶部と、
文書を含む画像である文書画像から1以上の文字候補を特定する文字特定部と、
一般単語辞書及びユーザ単語辞書に基づいて、文字特定部によって特定された1以上の文字候補の組み合わせから1以上の単語候補を特定し、単語候補の採用可能性を示すスコアを各単語候補に付与する単語候補特定部と、
単語候補特定部によって特定された1以上の単語候補のうち、所定の条件に適合する単語候補のスコアを調整するスコア調整部と、
各単語候補のスコアに基づいて、採用する単語候補の組み合わせを決定するスコア評価部と、を有する。
Claims (9)
- 一般の単語が登録されている一般単語辞書、及び、ユーザ固有の単語が登録されているユーザ単語辞書を保持する記憶部と、
文書を含む画像である文書画像から1以上の文字候補を特定する文字特定部と、
前記一般単語辞書及び前記ユーザ単語辞書に基づいて、前記文字特定部によって特定された1以上の文字候補の組み合わせから1以上の単語候補を特定し、単語候補の採用可能性を示すスコアを各単語候補に付与する単語候補特定部と、
前記単語候補特定部によって特定された1以上の単語候補のうち、所定の条件に適合する単語候補のスコアを調整するスコア調整部と、
各単語候補のスコアに基づいて、採用する単語候補の組み合わせを決定するスコア評価部と
を有する文字認識装置。 - 前記ユーザ単語辞書では、単語と当該単語を一部に含む合成単語とが関連付けられている
請求項1に記載の文字認識装置。 - 前記スコア調整部における所定の条件に適合する単語候補とは、前記ユーザ単語辞書に基づいて抽出され、且つ、前記ユーザ単語辞書に登録されている合成単語の一部である単語候補である
請求項2に記載の文字認識装置。 - 前記スコア調整部における所定の条件に適合する単語候補とは、さらに、前記単語候補を一部に含む合成単語が前記スコア評価部において採用されている単語候補である
請求項3に記載の文字認識装置。 - 前記スコア調整部は、前記文書画像における、所定の条件に適合する単語候補と当該単語候補を一部に含む合成単語との位置関係に基づいて、当該単語候補のスコアを調整する
請求項4に記載の文字認識装置。 - 前記スコア調整部は、前記位置関係が近くなるほど大きくなるように、所定の条件に適合する単語候補のスコアを調整する
請求項5に記載の文字認識装置。 - 前記ユーザ単語辞書に登録する単語を受け付ける単語受付部と、
前記単語受付部が受け付けた単語の一部に前記一般単語辞書に登録されている単語が含まれている場合、当該受け付けた単語を合成単語として前記一般単語辞書に登録されている単語と関連付けて前記ユーザ単語辞書に登録する辞書登録部と
をさらに有する請求項2乃至6の何れか1項に記載の文字認識装置。 - 前記文書画像は、所定の技術分野に関する文書を含む画像であり、
前記合成単語は、当該技術分野で慣習的に使用されている単語である
請求項1乃至7の何れか1項に記載の文字認識装置。 - コンピュータが文字認識機能を提供する文字認識方法であって、
記憶部が、一般の単語が登録されている一般単語辞書、及び、ユーザ固有の単語が登録されているユーザ単語辞書を保持し、
文字特定部が、文書を含む画像である文書画像から複数の文字候補を特定し、
単語候補特定部が、前記一般単語辞書及び前記ユーザ単語辞書に基づいて、前記文字特定部によって特定された複数の文字候補の組み合わせから複数の単語候補を特定し、単語候補の採用可能性を示すスコアを各単語候補に付与し、
スコア調整部が、前記単語候補特定部によって特定された複数の単語候補のうち、所定の条件に適合する単語候補のスコアを調整し、
スコア評価部が、各単語候補のスコアに基づいて、採用する単語候補の組み合わせを決定する
文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016175799A JP6663329B2 (ja) | 2016-09-08 | 2016-09-08 | 文字認識装置、及び、文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016175799A JP6663329B2 (ja) | 2016-09-08 | 2016-09-08 | 文字認識装置、及び、文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018041329A true JP2018041329A (ja) | 2018-03-15 |
JP6663329B2 JP6663329B2 (ja) | 2020-03-11 |
Family
ID=61626137
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016175799A Active JP6663329B2 (ja) | 2016-09-08 | 2016-09-08 | 文字認識装置、及び、文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6663329B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02121078A (ja) * | 1988-10-31 | 1990-05-08 | Nippon Telegr & Teleph Corp <Ntt> | 用語辞書検索装置 |
JPH06259600A (ja) * | 1993-03-03 | 1994-09-16 | Hitachi Ltd | 辞書分散システム及び辞書分散管理方法 |
JPH0934889A (ja) * | 1995-07-19 | 1997-02-07 | Toshiba Syst Kaihatsu Kk | 住所認識処理システム |
-
2016
- 2016-09-08 JP JP2016175799A patent/JP6663329B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02121078A (ja) * | 1988-10-31 | 1990-05-08 | Nippon Telegr & Teleph Corp <Ntt> | 用語辞書検索装置 |
JPH06259600A (ja) * | 1993-03-03 | 1994-09-16 | Hitachi Ltd | 辞書分散システム及び辞書分散管理方法 |
JPH0934889A (ja) * | 1995-07-19 | 1997-02-07 | Toshiba Syst Kaihatsu Kk | 住所認識処理システム |
Also Published As
Publication number | Publication date |
---|---|
JP6663329B2 (ja) | 2020-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10049096B2 (en) | System and method of template creation for a data extraction tool | |
JP4366108B2 (ja) | 文書検索装置、文書検索方法及びコンピュータプログラム | |
WO2018003153A1 (ja) | 認識装置及び認識方法 | |
US11847806B2 (en) | Information extraction from images using neural network techniques and anchor words | |
JP2021043775A (ja) | 情報処理装置及びプログラム | |
US8750571B2 (en) | Methods of object search and recognition | |
JP2020042320A (ja) | 画像認識装置、画像認識方法、及び画像認識プログラム | |
EP3992923A2 (en) | System and method for identifying non-standard user interface object | |
JP6579456B1 (ja) | 検索対象情報絞込システム | |
WO2021131324A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP7272037B2 (ja) | 情報処理装置及びプログラム | |
JP2022095391A (ja) | 情報処理装置、及び情報処理プログラム | |
JP6663329B2 (ja) | 文字認識装置、及び、文字認識方法 | |
US11615636B2 (en) | Apparatus and method for document recognition | |
JP5481965B2 (ja) | 情報処理装置及び情報処理プログラム | |
US20210303782A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
US9224040B2 (en) | Method for object recognition and describing structure of graphical objects | |
JP5712415B2 (ja) | 帳票処理システム及び帳票処理方法 | |
JP2008176625A (ja) | 文字認識結果の管理装置およびその方法並びにコンピュータプログラム | |
JP7377565B2 (ja) | 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム | |
JP2020170445A (ja) | デジタル文書からのデータ抽出方法およびシステム | |
US20240346068A1 (en) | Drawing search device, drawing database construction device, drawing search system, drawing search method, and recording medium | |
JP5669044B2 (ja) | 文書検定システム及び文書検定方法 | |
US20210381837A1 (en) | Apparatus and method of setting navigation destination | |
JP6303742B2 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190109 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200214 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6663329 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |