JP6845911B1 - 文字処理システム及びプログラム - Google Patents
文字処理システム及びプログラム Download PDFInfo
- Publication number
- JP6845911B1 JP6845911B1 JP2019227374A JP2019227374A JP6845911B1 JP 6845911 B1 JP6845911 B1 JP 6845911B1 JP 2019227374 A JP2019227374 A JP 2019227374A JP 2019227374 A JP2019227374 A JP 2019227374A JP 6845911 B1 JP6845911 B1 JP 6845911B1
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- characters
- font
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 68
- 238000010801 machine learning Methods 0.000 claims abstract description 23
- 238000004458 analytical method Methods 0.000 claims description 57
- 238000000605 extraction Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 abstract description 6
- 241000219995 Wisteria Species 0.000 description 20
- 238000000034 method Methods 0.000 description 14
- 238000013461 design Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000000052 comparative effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
Abstract
Description
[先行技術文献]
[特許文献]
[特許文献1]特開2013−188935号公報
20 サンプル文書
30 解析対象文書
80 判定者
88 表示装置
100 フォントデータ
120 モデル
140 適応文字
160 特異文字情報
200 特徴文字情報生成装置
202 学習装置
204 フォント選択部
206 モデル生成部
210 処理対象文字取得部
220 文字画像生成部
230 文字画像選択部
240 相違情報出力部
250 判定結果取得部
280 文字解析装置
282 解析対象画像取得部
284 文字画像抽出部
286 文字解析部
290 記憶装置
400 文字ペア
500 画像
600 画面
610 ボタン
620、630、640 文字画像
650 比較画像
701、702 辺
2000 コンピュータ
2010 ホストコントローラ
2012 CPU
2014 RAM
2020 入力/出力コントローラ
2022 通信インタフェース
2024 フラッシュメモリ
2026 ROM
2040 入力/出力チップ
Claims (11)
- 文字処理システムであって、
予め定められた字形を持つ基準文字の画像と、互いに異なる字形を持つ複数の文字の画像とを用いた機械学習によって生成され、入力される文字の画像から前記予め定められた字形に適応した文字の画像を生成する学習済みモデルを格納する格納部と、
前記学習済みモデルを用いて、処理対象の文字の画像から、前記予め定められた字形に適応させた前記処理対象の文字の画像を生成する文字画像生成部と、
前記文字画像生成部が生成した画像と前記基準文字の画像との比較結果に基づいて、前記処理対象の文字と前記基準文字との相違を示す情報を出力する相違情報出力部と
を備える文字処理システム。 - 前記相違情報出力部は、前記文字画像生成部が生成した画像と前記基準文字の画像とを重畳して表示させる
請求項1に記載の文字処理システム。 - 複数の基準文字の画像の中から、前記文字画像生成部が生成した文字の画像に類似する文字の画像を選択する文字画像選択部
をさらに備え、
前記相違情報出力部は、前記文字画像選択部が選択した画像と、前記文字画像生成部が生成した画像とを重畳して表示させる
請求項2に記載の文字処理システム。 - 前記文字画像生成部が生成した画像と前記基準文字の画像とが相違するか否かを示す情報を、利用者から取得する判定結果取得部
さらに備える請求項3に記載の文字処理システム。 - 前記相違情報出力部は、前記処理対象の文字と前記基準文字とが相違すると判定された場合に、前記処理対象の文字が特徴的な字形を持つ文字であることを示す情報を記録する
請求項1から4のいずれか一項に記載の文字処理システム。 - 前記相違情報出力部は、前記文字画像生成部が生成した画像と前記基準文字の画像とを比較して、前記文字画像生成部が生成した画像において前記基準文字の画像とは文字の骨格が異なる部位が存在する場合に、前記文字の骨格が異なる部位を示す情報と前記処理対象の文字の識別情報とを対応づけて記録する
請求項5に記載の文字処理システム。 - 文字の解析対象となる文書の画像データを取得する解析対象画像取得部と、
前記文書の画像データから文字を含む画像を抽出する文字画像抽出部と、
前記相違情報出力部によって記録された情報を用いて、前記文字画像抽出部が抽出した画像に含まれる文字を解析する文字解析部と
をさらに備える請求項5又は6に記載の文字処理システム。 - 前記予め定められた字形を持つ基準文字の画像は、予め定められた第1のフォントに属する文字の画像であり、
前記互いに異なる字形を持つ文字の画像は、前記第1のフォントとは異なる、互いに異なる複数の第2のフォントに属する文字の画像である
請求項1から7のいずれか一項に記載の文字処理システム。 - 前記第1のフォントと、前記複数の第2のフォントとを選択するフォント選択部と、
前記第1のフォントの画像と、前記複数の第2のフォントの画像とを用いた機械学習を行って、前記複数の第2のフォントに属する文字の画像から、前記第1のフォントに属する文字の字形に適応した文字の画像を生成する前記学習済みモデルを生成するモデル生成部と
をさらに備える請求項8に記載の文字処理システム。 - 前記学習済みモデルは、前記予め定められた字形を持つ基準文字の画像と、前記互いに異なる字形を持つ文字のそれぞれの画像との複数の組を学習データとした敵対的生成ネットワーク(GAN)を用いて生成されたモデルである
請求項1から9のいずれか一項に記載の文字処理システム。 - コンピュータを、請求項1から10のいずれか一項に記載の文字処理システムとして機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019227374A JP6845911B1 (ja) | 2019-12-17 | 2019-12-17 | 文字処理システム及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019227374A JP6845911B1 (ja) | 2019-12-17 | 2019-12-17 | 文字処理システム及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6845911B1 true JP6845911B1 (ja) | 2021-03-24 |
JP2021096634A JP2021096634A (ja) | 2021-06-24 |
Family
ID=74878917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019227374A Active JP6845911B1 (ja) | 2019-12-17 | 2019-12-17 | 文字処理システム及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6845911B1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113792853A (zh) * | 2021-09-09 | 2021-12-14 | 北京百度网讯科技有限公司 | 字符生成模型的训练方法、字符生成方法、装置和设备 |
JP2022058691A (ja) * | 2021-04-30 | 2022-04-12 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 敵対的ネットワークモデルのトレーニング方法、文字ライブラリの作成方法、並びにそれらの装置、電子機器、記憶媒体及びプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7410532B2 (ja) | 2022-05-11 | 2024-01-10 | 株式会社佐賀電算センター | 文字判定装置及び文字判定プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6505937B1 (ja) * | 2018-11-26 | 2019-04-24 | フューチャー株式会社 | 照合システム、照合方法及び照合プログラム |
-
2019
- 2019-12-17 JP JP2019227374A patent/JP6845911B1/ja active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022058691A (ja) * | 2021-04-30 | 2022-04-12 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 敵対的ネットワークモデルのトレーニング方法、文字ライブラリの作成方法、並びにそれらの装置、電子機器、記憶媒体及びプログラム |
CN113792853A (zh) * | 2021-09-09 | 2021-12-14 | 北京百度网讯科技有限公司 | 字符生成模型的训练方法、字符生成方法、装置和设备 |
CN113792853B (zh) * | 2021-09-09 | 2023-09-05 | 北京百度网讯科技有限公司 | 字符生成模型的训练方法、字符生成方法、装置和设备 |
Also Published As
Publication number | Publication date |
---|---|
JP2021096634A (ja) | 2021-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10853638B2 (en) | System and method for extracting structured information from image documents | |
US10489682B1 (en) | Optical character recognition employing deep learning with machine generated training data | |
JP6845911B1 (ja) | 文字処理システム及びプログラム | |
US10915788B2 (en) | Optical character recognition using end-to-end deep learning | |
US8015203B2 (en) | Document recognizing apparatus and method | |
CN101326518B (zh) | 用于墨水笔记的手写体识别的方法和装置 | |
RU2760471C1 (ru) | Способы и системы идентификации полей в документе | |
CN112100063A (zh) | 界面语言的显示测试方法、装置、计算机设备和存储介质 | |
US10963717B1 (en) | Auto-correction of pattern defined strings | |
CN108597565B (zh) | 一种基于ocr与命名实体提取技术的临床队列数据协同校验方法 | |
CN112149663A (zh) | 结合rpa和ai的图像文字的提取方法、装置及电子设备 | |
JP4649512B2 (ja) | 文字列検索方法およびその装置 | |
CN110543475A (zh) | 一种基于机器学习的财务报表数据自动识别和分析方法 | |
US20110295881A1 (en) | Merging computer product, method, and apparatus | |
CN112308048B (zh) | 基于少量标注数据的病历完整性判别的方法、装置及系统 | |
US20120281919A1 (en) | Method and system for text segmentation | |
CN111339910A (zh) | 文本的处理、文本分类模型的训练方法及装置 | |
JP2022120308A (ja) | 画像処理装置及びプログラム | |
US20220129691A1 (en) | System and method for identifying non-standard user interface object | |
CN116168411A (zh) | 一种专利智能附图生成方法和系统 | |
JP4160206B2 (ja) | 文字認識装置を利用したデータベース登録方法 | |
CN111476090B (zh) | 水印识别方法和装置 | |
CN112541505B (zh) | 文本识别方法、装置以及计算机可读存储介质 | |
JP3467437B2 (ja) | 文字認識装置及びその方法とプログラム記録媒体 | |
US20210318949A1 (en) | Method for checking file data, computer device and readable storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210216 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6845911 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |