JP2013041535A - 情報処理装置およびプログラム - Google Patents
情報処理装置およびプログラム Download PDFInfo
- Publication number
- JP2013041535A JP2013041535A JP2011179577A JP2011179577A JP2013041535A JP 2013041535 A JP2013041535 A JP 2013041535A JP 2011179577 A JP2011179577 A JP 2011179577A JP 2011179577 A JP2011179577 A JP 2011179577A JP 2013041535 A JP2013041535 A JP 2013041535A
- Authority
- JP
- Japan
- Prior art keywords
- character
- likelihood
- image data
- decorative
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】情報処理装置100は、画像データにより示される文字を非装飾文字と認識する非装飾文字認識部121と、画像データにより示される文字を装飾文字と認識する装飾文字認識部122と、該文字を非装飾文字として含む文字列とする判定の確からしさを示す第1尤度と、該文字を装飾文字として含む文字列とする判定の確からしさを示す第2尤度と、を取得する尤度取得部133と、第1尤度と、第2尤度と、に基づいて、該文字が前記非装飾文字および前記装飾文字のいずれであるか判定する尤度評価部134と、を含む。
【選択図】図1
Description
Claims (7)
- 画像読み取り手段により読み取られる画像データを取得する画像データ取得手段と、
前記画像データ取得手段により取得される前記画像データにより示される文字を非装飾文字と認識する非装飾文字認識手段と、
前記画像データ取得手段により取得される前記画像データにより示される文字を装飾文字と認識する装飾文字認識手段と、
前記画像データにより示される前記文字を含む文字列に関する、該文字を前記非装飾文字として含む文字列とする判定の確からしさを示す第1尤度と、該文字を前記装飾文字として含む文字列とする判定の確からしさを示す第2尤度と、を取得する尤度取得手段と、
前記尤度取得手段により取得される前記第1尤度と、前記第2尤度と、に基づいて、該文字が前記非装飾文字および前記装飾文字のいずれであるか判定する文字判定手段と、
を含むことを特徴とする情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記尤度取得手段は、前記第1尤度と、前記第2尤度と、を前記文字列において装飾文字が続く長さに基づいて取得することを特徴とする情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記尤度取得手段は、前記第1尤度と、前記第2尤度と、を前記文字列における装飾文字の比率に基づいて取得することを特徴とする情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記尤度取得手段は、前記第1尤度と、前記第2尤度と、を前記文字列における1又は複数の装飾文字からなる語の重要度に基づいて取得することを特徴とする情報処理装置。 - 請求項4に記載の情報処理装置であって、
前記文字列を解析して前記語の文法的属性を示す属性情報を取得する属性情報取得手段をさらに有し、
前記尤度取得手段は、前記語の重要度を、前記属性情報取得手段により取得される前記属性情報に基づいて取得することを特徴とする情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記尤度取得手段は、前記第1尤度と、前記第2尤度と、を前記文字列における1又は複数の装飾文字からなる複数の語の間の関係に基づいて取得することを特徴とする情報処理装置。 - コンピュータを、
画像読み取り手段により読み取られる画像データを取得する画像データ取得手段と、
前記画像データ取得手段により取得される前記画像データにより示される文字を非装飾文字と認識する非装飾文字認識手段、
前記画像データ取得手段により取得される前記画像データにより示される文字を装飾文字と認識する装飾文字認識手段、
前記画像データにより示される前記文字を含む文字列に関する、該文字を前記非装飾文字として含む文字列とする判定の確からしさを示す第1尤度と、該文字を前記装飾文字として含む文字列とする判定の確からしさを示す第2尤度と、を取得する尤度取得手段、および
前記尤度取得手段により取得される前記第1尤度と、前記第2尤度と、に基づいて、該文字が前記非装飾文字および前記装飾文字のいずれであるか判定する文字判定手段、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011179577A JP5853488B2 (ja) | 2011-08-19 | 2011-08-19 | 情報処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011179577A JP5853488B2 (ja) | 2011-08-19 | 2011-08-19 | 情報処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013041535A true JP2013041535A (ja) | 2013-02-28 |
JP5853488B2 JP5853488B2 (ja) | 2016-02-09 |
Family
ID=47889842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011179577A Active JP5853488B2 (ja) | 2011-08-19 | 2011-08-19 | 情報処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5853488B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11126883B2 (en) * | 2018-09-21 | 2021-09-21 | Fujifilm Business Innovation Corp. | Character string recognition apparatus, and non-transitory computer readable medium |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07200734A (ja) * | 1993-12-28 | 1995-08-04 | Toshiba Corp | 光学的文字読取装置 |
JPH09114931A (ja) * | 1995-10-18 | 1997-05-02 | Canon Inc | 文字認識装置及びその方法 |
JP2001043316A (ja) * | 1999-07-29 | 2001-02-16 | Ricoh Co Ltd | 文書画像処理方法、文書画像処理装置及び記録媒体 |
JP2005275996A (ja) * | 2004-03-26 | 2005-10-06 | Canon Inc | 文書管理装置、文書管理方法、プログラム及び記憶媒体 |
JP2011034454A (ja) * | 2009-08-04 | 2011-02-17 | Ricoh Co Ltd | 文字認識装置、文字認識方法、プログラム及び記録媒体 |
-
2011
- 2011-08-19 JP JP2011179577A patent/JP5853488B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07200734A (ja) * | 1993-12-28 | 1995-08-04 | Toshiba Corp | 光学的文字読取装置 |
JPH09114931A (ja) * | 1995-10-18 | 1997-05-02 | Canon Inc | 文字認識装置及びその方法 |
JP2001043316A (ja) * | 1999-07-29 | 2001-02-16 | Ricoh Co Ltd | 文書画像処理方法、文書画像処理装置及び記録媒体 |
JP2005275996A (ja) * | 2004-03-26 | 2005-10-06 | Canon Inc | 文書管理装置、文書管理方法、プログラム及び記憶媒体 |
JP2011034454A (ja) * | 2009-08-04 | 2011-02-17 | Ricoh Co Ltd | 文字認識装置、文字認識方法、プログラム及び記録媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11126883B2 (en) * | 2018-09-21 | 2021-09-21 | Fujifilm Business Innovation Corp. | Character string recognition apparatus, and non-transitory computer readable medium |
Also Published As
Publication number | Publication date |
---|---|
JP5853488B2 (ja) | 2016-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101376863B1 (ko) | 문서 시각 구조의 문법 분석 | |
US8745077B2 (en) | Searching and matching of data | |
JP2019091434A (ja) | 複数のディープ・ラーニング・ニューラル・ネットワークを動的に重み付けすることによるフォント認識の改善 | |
CN110114776B (zh) | 使用全卷积神经网络的字符识别的系统和方法 | |
RU2619712C1 (ru) | Оптическое распознавание символов серии изображений | |
JP2014106961A (ja) | アラビア語テキストを自動的に認識するためのコンピュータによって実行される方法、およびコンピュータプログラム | |
CN101133411A (zh) | 非罗马字符的容错罗马化输入方法 | |
RU2613849C1 (ru) | Оптическое распознавание символов серии изображений | |
CN105068997B (zh) | 平行语料的构建方法及装置 | |
US10963717B1 (en) | Auto-correction of pattern defined strings | |
EP1732012B1 (en) | Method of identifying redundant text in an electronic document | |
JP5664174B2 (ja) | 持ち運び可能な電子ファイルからキャラクタの外接矩形を抽出する装置及び方法 | |
CN111488732B (zh) | 一种变形关键词检测方法、系统及相关设备 | |
TWI567569B (zh) | Natural language processing systems, natural language processing methods, and natural language processing programs | |
JP5502814B2 (ja) | アラビア語テキストに発音区別符号を付与するための方法およびシステム | |
CN112329390A (zh) | 一种基于音形义的中文词相似度检测算法 | |
JP2008225695A (ja) | 文字認識誤り修正装置およびプログラム | |
Luu et al. | A pointwise approach for Vietnamese diacritics restoration | |
JP5097802B2 (ja) | ローマ字変換を用いる日本語自動推薦システムおよび方法 | |
Zelenko et al. | Discriminative methods for transliteration | |
CN103489268B (zh) | 一种用于pos平台的阿拉伯语显示方法 | |
CN117010368A (zh) | 一种基于字形相似的中文纠错数据增强方法 | |
JP5853488B2 (ja) | 情報処理装置およびプログラム | |
JP2012173959A (ja) | 文字認識装置及びプログラム | |
CN108021918B (zh) | 文字识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140711 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151123 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5853488 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |