JP7298330B2 - 情報処理装置、及び情報処理プログラム - Google Patents
情報処理装置、及び情報処理プログラム Download PDFInfo
- Publication number
- JP7298330B2 JP7298330B2 JP2019116595A JP2019116595A JP7298330B2 JP 7298330 B2 JP7298330 B2 JP 7298330B2 JP 2019116595 A JP2019116595 A JP 2019116595A JP 2019116595 A JP2019116595 A JP 2019116595A JP 7298330 B2 JP7298330 B2 JP 7298330B2
- Authority
- JP
- Japan
- Prior art keywords
- correction
- character string
- frame
- tendency
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 54
- 238000012937 correction Methods 0.000 claims description 290
- 238000000034 method Methods 0.000 claims description 30
- 238000012790 confirmation Methods 0.000 description 52
- 238000012015 optical character recognition Methods 0.000 description 21
- 238000012545 processing Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 7
- 238000007405 data analysis Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000004575 stone Substances 0.000 description 2
- FBOUIAKEJMZPQG-AWNIVKPZSA-N (1E)-1-(2,4-dichlorophenyl)-4,4-dimethyl-2-(1,2,4-triazol-1-yl)pent-1-en-3-ol Chemical compound C1=NC=NN1/C(C(O)C(C)(C)C)=C/C1=CC=C(Cl)C=C1Cl FBOUIAKEJMZPQG-AWNIVKPZSA-N 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 241001026509 Kata Species 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 229940081330 tena Drugs 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/2445—Alphabet recognition, e.g. Latin, Kanji or Katakana
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
Claims (7)
- プロセッサを備え、
前記プロセッサは、帳票の文字列の認識結果から、帳票が用いられる分野、または帳票の記載者に関する属性の少なくとも一方を表す帳票特徴を特定すると共に、帳票に記載されていない記載者に関する属性を帳票に記載された文字列の筆跡、及び帳票に記載された文字列が表す内容の言葉遣いから特定して前記帳票特徴に加え、
特定した前記帳票特徴を有する帳票の文字列認識結果に対する過去の訂正傾向を蓄積し、
特定した前記帳票特徴と同じ特徴を有する帳票の訂正傾向を、蓄積した訂正傾向の中から取得し、取得した訂正傾向に従って、帳票の文字列認識結果に対する訂正候補を表示する制御を行う
情報処理装置。 - 前記プロセッサは、文字列が記載された帳票の枠毎に前記帳票特徴を特定し、文字列認識結果に対する過去の訂正傾向を帳票の各々の枠と対応付けて蓄積した上で、
受け付けた帳票と同じ種類の帳票の各枠にそれぞれ対応付けられた文字列の訂正傾向を取得し、取得した訂正傾向に従って、受け付けた帳票の枠毎に前記訂正候補を表示する制御を行う
請求項1記載の情報処理装置。 - 前記プロセッサは、帳票の枠毎に特定した前記帳票特徴を組み合わせることで推定される組み合わせ特徴を特定し、前記組み合わせ特徴を有する帳票の文字列認識結果に対する過去の訂正傾向を蓄積した上で、
受け付けた帳票に前記組み合わせ特徴が含まれる場合、蓄積した訂正傾向の中から前記組み合わせ特徴と対応付けられた文字列の訂正傾向を取得し、取得した訂正傾向に従って、前記組み合わせ特徴の推定に用いられた前記帳票特徴が対応付けられた枠の文字列に対して、前記訂正候補を表示する制御を行う
請求項2記載の情報処理装置。 - 前記プロセッサは、前記訂正候補を2文字以上の文字列で表示する制御を行う
請求項1~請求項3の何れか1項に記載の情報処理装置。 - 前記プロセッサは、前記訂正候補を単語単位で表示する制御を行う
請求項4記載の情報処理装置。 - 前記プロセッサは、前記訂正候補の表示理由を表示する制御を行う
請求項1~請求項5の何れか1項に記載の情報処理装置。 - コンピュータに、
帳票の文字列の認識結果から、帳票が用いられる分野、または帳票の記載者に関する属性の少なくとも一方を表す帳票特徴を特定すると共に、帳票に記載されていない記載者に関する属性を帳票に記載された文字列の筆跡、及び帳票に記載された文字列が表す内容の言葉遣いから特定して前記帳票特徴に加える処理と、
特定した前記帳票特徴を有する帳票の文字列認識結果に対する過去の訂正傾向を蓄積する処理と、
特定した前記帳票特徴と同じ特徴を有する帳票の訂正傾向を、蓄積した訂正傾向の中から取得し、取得した訂正傾向に従って、帳票の文字列認識結果に対する訂正候補を表示する制御を行う処理を実行させるための情報処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019116595A JP7298330B2 (ja) | 2019-06-24 | 2019-06-24 | 情報処理装置、及び情報処理プログラム |
US16/667,952 US11183191B2 (en) | 2019-06-24 | 2019-10-30 | Information processing apparatus and non-transitory computer readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019116595A JP7298330B2 (ja) | 2019-06-24 | 2019-06-24 | 情報処理装置、及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021002287A JP2021002287A (ja) | 2021-01-07 |
JP7298330B2 true JP7298330B2 (ja) | 2023-06-27 |
Family
ID=73994066
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019116595A Active JP7298330B2 (ja) | 2019-06-24 | 2019-06-24 | 情報処理装置、及び情報処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11183191B2 (ja) |
JP (1) | JP7298330B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022097138A (ja) * | 2020-12-18 | 2022-06-30 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009031328A (ja) | 2007-07-24 | 2009-02-12 | Panasonic Corp | 音声認識装置 |
JP2014182477A (ja) | 2013-03-18 | 2014-09-29 | Fuji Xerox Co Ltd | プログラム及び帳票処理装置 |
JP2015090623A (ja) | 2013-11-06 | 2015-05-11 | 株式会社東芝 | 帳票読取装置、プログラムおよび帳票読取システム |
JP2019040467A (ja) | 2017-08-25 | 2019-03-14 | キヤノン株式会社 | 画像処理装置およびその制御方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5305396A (en) * | 1992-04-17 | 1994-04-19 | International Business Machines Corporation | Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms |
US5329598A (en) * | 1992-07-10 | 1994-07-12 | The United States Of America As Represented By The Secretary Of Commerce | Method and apparatus for analyzing character strings |
US7106888B1 (en) * | 1999-05-25 | 2006-09-12 | Silverbrook Research Pty Ltd | Signature capture via interface surface |
JP2011107820A (ja) | 2009-11-13 | 2011-06-02 | Hitachi Solutions Ltd | 訂正データ分析システム |
TW201536050A (zh) * | 2014-03-13 | 2015-09-16 | Chicony Electronics Co Ltd | 可修正偏移視角的影像擷取方法、電腦程式產品暨其影像擷取裝置 |
-
2019
- 2019-06-24 JP JP2019116595A patent/JP7298330B2/ja active Active
- 2019-10-30 US US16/667,952 patent/US11183191B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009031328A (ja) | 2007-07-24 | 2009-02-12 | Panasonic Corp | 音声認識装置 |
JP2014182477A (ja) | 2013-03-18 | 2014-09-29 | Fuji Xerox Co Ltd | プログラム及び帳票処理装置 |
JP2015090623A (ja) | 2013-11-06 | 2015-05-11 | 株式会社東芝 | 帳票読取装置、プログラムおよび帳票読取システム |
JP2019040467A (ja) | 2017-08-25 | 2019-03-14 | キヤノン株式会社 | 画像処理装置およびその制御方法 |
Also Published As
Publication number | Publication date |
---|---|
US20200402503A1 (en) | 2020-12-24 |
JP2021002287A (ja) | 2021-01-07 |
US11183191B2 (en) | 2021-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10915788B2 (en) | Optical character recognition using end-to-end deep learning | |
US8015203B2 (en) | Document recognizing apparatus and method | |
US9633255B2 (en) | Substitution of handwritten text with a custom handwritten font | |
US8908971B2 (en) | Devices, systems and methods for transcription suggestions and completions | |
US10963717B1 (en) | Auto-correction of pattern defined strings | |
JP2007109118A (ja) | 入力指示処理装置および入力指示処理プログラム | |
JP2001344562A (ja) | 文書読取装置および文書読取方法 | |
JP2019040467A (ja) | 画像処理装置およびその制御方法 | |
WO2007094078A1 (ja) | 文字列検索方法およびその装置 | |
Toselli et al. | Transcribing a 17th-century botanical manuscript: Longitudinal evaluation of document layout detection and interactive transcription | |
KR101607672B1 (ko) | 비구조화 임상 문서의 치환 기반 패턴 검색 장치 및 검색 방법 | |
JP7298330B2 (ja) | 情報処理装置、及び情報処理プログラム | |
CN113673294B (zh) | 文献关键信息的提取方法、装置、计算机设备和存储介质 | |
CN114494679A (zh) | 一种双层pdf生成及校对方法和装置 | |
JP5550959B2 (ja) | 文書処理システム、及びプログラム | |
US11508139B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
JP2012108893A (ja) | 手描き入力方法 | |
JP7463675B2 (ja) | 情報処理装置、及び情報処理プログラム | |
US20240184985A1 (en) | Information representation structure analysis device, and information representation structure analysis method | |
JP6475288B2 (ja) | プログラム比較方法、プログラム比較装置およびプログラム比較プログラム | |
JP5315890B2 (ja) | 評価システムおよび評価方法 | |
JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム | |
KR20220063380A (ko) | 텍스트 전사장치 및 텍스트 전사방법 | |
JP2019086934A (ja) | 文書検索装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230516 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230529 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7298330 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |