JP6795195B2 - 文字種推定システム、文字種推定方法、および文字種推定プログラム - Google Patents
文字種推定システム、文字種推定方法、および文字種推定プログラム Download PDFInfo
- Publication number
- JP6795195B2 JP6795195B2 JP2017206520A JP2017206520A JP6795195B2 JP 6795195 B2 JP6795195 B2 JP 6795195B2 JP 2017206520 A JP2017206520 A JP 2017206520A JP 2017206520 A JP2017206520 A JP 2017206520A JP 6795195 B2 JP6795195 B2 JP 6795195B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- character type
- data
- document image
- estimated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
21 書類画像取得部
22 文字種推定部
23 テキスト特定部
24 データファイル生成部
25 検証部
26 機械学習処理部
Claims (6)
- 書類画像を取得する書類画像取得部と、
前記書類画像内の1または複数のテキスト領域の位置・サイズ情報、および前記1または複数のテキスト領域のそれぞれについて前記テキスト領域内のテキストの文字種を推定する文字種推定部と、
推定された前記テキスト領域について推定された前記文字種用の文字認識処理を実行して、推定された前記テキスト領域内のテキストをテキストデータとして特定するテキスト特定部とを備え、
前記文字種推定部は、機械学習済みのディープニューラルネットワークを備え、
前記ディープニューラルネットワークの入力データは、前記書類画像であり、
前記ディープニューラルネットワークの出力データは、前記1または複数のテキスト領域のそれぞれについての前記位置・サイズ情報および前記文字種であること、
を特徴とする文字種推定システム。 - 前記複数のテキスト領域の前記テキストデータを含むデータファイルを生成するデータファイル生成部とをさらに備え、
前記テキストデータは、前記データファイルにおいて、前記複数のテキスト領域の位置に対応する順序で配列されること、
を特徴とする請求項1記載の文字種推定システム。 - 前記複数のテキスト領域の前記テキストデータを含むデータファイルを生成するデータファイル生成部とをさらに備え、
前記テキストデータは、前記データファイルにおいて、前記文字種に対応する順序で配列されること、
を特徴とする請求項1記載の文字種推定システム。 - 前記1または複数のテキスト領域のうちの特定のテキスト領域のテキストの有無または前記特定のテキスト領域のテキストの整合性を検証する検証部をさらに備えることを特徴とする請求項1記載の文字種推定システム。
- 書類画像を取得する書類画像取得ステップと、
機械学習済みのディープニューラルネットワークで、前記書類画像内の1または複数のテキスト領域の位置・サイズ情報、および前記1または複数のテキスト領域のそれぞれについて前記テキスト領域内のテキストの文字種を推定する文字種推定ステップと、
推定された前記テキスト領域について推定された前記文字種用の文字認識処理を実行して、推定された前記テキスト領域内のテキストをテキストデータとして特定するテキスト特定ステップとを備え、
前記ディープニューラルネットワークの入力データは、前記書類画像であり、
前記ディープニューラルネットワークの出力データは、前記1または複数のテキスト領域のそれぞれについての前記位置・サイズ情報および前記文字種であること、
を特徴とする文字種推定方法。 - コンピュータを、
書類画像を取得する書類画像取得部、
前記書類画像内の1または複数のテキスト領域の位置・サイズ情報、および前記1または複数のテキスト領域のそれぞれについて前記テキスト領域内のテキストの文字種を推定する文字種推定部、並びに
推定された前記テキスト領域について推定された前記文字種用の文字認識処理を実行して、推定された前記テキスト領域内のテキストをテキストデータとして特定するテキスト特定部として機能させ、
前記文字種推定部は、機械学習済みのディープニューラルネットワークを備え、
前記ディープニューラルネットワークの入力データは、前記書類画像であり、
前記ディープニューラルネットワークの出力データは、前記1または複数のテキスト領域のそれぞれについての前記位置・サイズ情報および前記文字種であること、
を特徴とする文字種推定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017206520A JP6795195B2 (ja) | 2017-10-25 | 2017-10-25 | 文字種推定システム、文字種推定方法、および文字種推定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017206520A JP6795195B2 (ja) | 2017-10-25 | 2017-10-25 | 文字種推定システム、文字種推定方法、および文字種推定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019079347A JP2019079347A (ja) | 2019-05-23 |
JP6795195B2 true JP6795195B2 (ja) | 2020-12-02 |
Family
ID=66627784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017206520A Active JP6795195B2 (ja) | 2017-10-25 | 2017-10-25 | 文字種推定システム、文字種推定方法、および文字種推定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6795195B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929724A (zh) * | 2019-11-28 | 2020-03-27 | 上海眼控科技股份有限公司 | 字符识别方法、装置、计算机设备和存储介质 |
JP6809731B1 (ja) * | 2019-12-05 | 2021-01-06 | ネットスマイル株式会社 | ビデオ信号処理システムおよびビデオ信号処理方法 |
CN111460933B (zh) * | 2020-03-18 | 2022-08-09 | 哈尔滨拓博科技有限公司 | 一种实时识别连续手写图形的方法 |
JP2021090191A (ja) * | 2020-11-09 | 2021-06-10 | ネットスマイル株式会社 | ビデオ信号処理システムおよびビデオ信号処理方法 |
CN113762109B (zh) * | 2021-08-23 | 2023-11-07 | 北京百度网讯科技有限公司 | 一种文字定位模型的训练方法及文字定位方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2618504B2 (ja) * | 1989-12-04 | 1997-06-11 | シャープ株式会社 | 文字認識装置 |
JPH04105186A (ja) * | 1990-08-24 | 1992-04-07 | Sharp Corp | 自動文書入力装置 |
JP3373008B2 (ja) * | 1993-10-20 | 2003-02-04 | オリンパス光学工業株式会社 | 画像像域分離装置 |
JPH11338977A (ja) * | 1998-05-28 | 1999-12-10 | Canon Inc | 文字処理方法及び装置、記憶媒体 |
JP4385536B2 (ja) * | 2001-03-19 | 2009-12-16 | コニカミノルタビジネステクノロジーズ株式会社 | 文字認識装置、文字認識方法ならびに文字認識プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体 |
JP2002358521A (ja) * | 2001-05-31 | 2002-12-13 | Oki Electric Ind Co Ltd | 帳票フォーマット登録・識別装置、方法及びプログラム |
JP2005208687A (ja) * | 2004-01-19 | 2005-08-04 | Ricoh Co Ltd | 多言語文書処理装置及びプログラム |
-
2017
- 2017-10-25 JP JP2017206520A patent/JP6795195B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019079347A (ja) | 2019-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6795195B2 (ja) | 文字種推定システム、文字種推定方法、および文字種推定プログラム | |
CN111476227B (zh) | 基于ocr的目标字段识别方法、装置及存储介质 | |
US9626555B2 (en) | Content-based document image classification | |
EP3869385B1 (en) | Method for extracting structural data from image, apparatus and device | |
JP6366024B2 (ja) | 画像化された文書からテキストを抽出する方法及び装置 | |
US20170109610A1 (en) | Building classification and extraction models based on electronic forms | |
KR101769918B1 (ko) | 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치 | |
US20190294912A1 (en) | Image processing device, image processing method, and image processing program | |
JP2012083951A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2016048444A (ja) | 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法 | |
CN111914597B (zh) | 一种文档对照识别方法、装置、电子设备和可读存储介质 | |
US20220222284A1 (en) | System and method for automated information extraction from scanned documents | |
CN114005126A (zh) | 表格重构方法、装置、计算机设备及可读存储介质 | |
KR20180126352A (ko) | 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치 | |
JP2008282094A (ja) | 文字認識処理装置 | |
KR102051655B1 (ko) | 통합 이미지의 인식에 기초하여 상품 정보를 제공하는 방법 및 장치 | |
US9135517B1 (en) | Image based document identification based on obtained and stored document characteristics | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
CN113742559A (zh) | 关键词检测方法和装置、电子设备、存储介质 | |
US9208380B2 (en) | Methods and systems for recognizing handwriting in handwritten documents | |
CN112070092A (zh) | 一种验证码参数的获取方法及装置 | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
JP6682827B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2009223391A (ja) | 画像処理装置及び画像処理プログラム | |
JP2020030722A (ja) | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200514 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200514 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200904 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200916 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6795195 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |