JP2022049001A - イメージから認識したテキストを階層化する方法、システム、およびコンピュータプログラム - Google Patents
イメージから認識したテキストを階層化する方法、システム、およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2022049001A JP2022049001A JP2021147615A JP2021147615A JP2022049001A JP 2022049001 A JP2022049001 A JP 2022049001A JP 2021147615 A JP2021147615 A JP 2021147615A JP 2021147615 A JP2021147615 A JP 2021147615A JP 2022049001 A JP2022049001 A JP 2022049001A
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- text
- processor
- computer system
- linear
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/137—Hierarchical processing, e.g. outlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
210:線形クラスタリング部
220:仮想クラスタリング部
230:相関クラスタリング部
Claims (20)
- コンピュータシステムが実行する方法であって、
前記コンピュータシステムは、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、
前記方法は、
前記少なくとも1つのプロセッサにより、イメージ内のテキスト領域の間の視覚的区分領域に基づいて少なくとも1つのテキスト領域をクラスタリングすることによって自然語処理単位を構成する段階、および
前記少なくとも1つのプロセッサにより、前記自然語処理単位を学習データとするディープラーニング基盤の学習モデルを構築する段階
を含む、方法。 - 前記自然語処理単位を構成する段階は、
前記視覚的区分領域として、前記テキスト領域の区分が可能なライン、図形、イメージ、背景、間隔、記号、数字のうちの少なくとも1つを利用して前記テキスト領域をクラスタリングすること
を特徴とする、請求項1に記載の方法。 - 前記自然語処理単位を構成する段階は、
前記イメージから認識された単語単位のテキスト領域に該当する単語要素の集合をライン単位のテキスト領域に該当する線形クラスタとして構成する段階
を含む、請求項1に記載の方法。 - 前記線形クラスタとして構成する段階は、
同一線上に位置しながら視覚的区分領域が存在しない、連続する単語要素の集合を1つの線形クラスタとして構成すること
を特徴とする、請求項3に記載の方法。 - 前記自然語処理単位を構成する段階は、
前記線形クラスタの集合を文段単位のテキスト領域に該当する仮想クラスタとして構成する段階
をさらに含む、請求項3に記載の方法。 - 前記仮想クラスタとして構成する段階は、
視覚的区分領域が存在しない、連続する線形クラスタの集合を1つの仮想クラスタとして構成すること
を特徴とする、請求項5に記載の方法。 - 前記仮想クラスタとして構成する段階は、
前記線形クラスタに含まれたテキストスタイルに基づいて、少なくとも1つの線形クラスタを前記仮想クラスタとして構成すること
を特徴とする、請求項5に記載の方法。 - 前記自然語処理単位を構成する段階は、
前記仮想クラスタの集合を相関関係のテキスト領域に該当する相関クラスタとして構成する段階
をさらに含む、請求項5に記載の方法。 - 前記相関クラスタとして構成する段階は、
完成した文章や句(phrase)に該当する、連続する仮想クラスタの集合を1つの相関クラスタとして構成すること
を特徴とする、請求項8に記載の方法。 - 前記単語要素は、前記単語単位のテキスト領域を示すポリゴン座標情報を含み、
前記線形クラスタ、前記仮想クラスタ、および前記相関クラスタは、該当のクラスタを構成する子ノードの集合情報を含むこと
を特徴とする、請求項8に記載の方法。 - 請求項1~10のうちのいずれか一項に記載の方法を前記コンピュータシステムに実行させる、コンピュータプログラム。
- コンピュータシステムであって、
メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサ
を含み、
前記少なくとも1つのプロセッサは、
イメージ内のテキスト領域の間の視覚的区分領域に基づいて少なくとも1つのテキスト領域をクラスタリングすることによって自然語処理単位を構成する過程、および
前記自然語処理単位を学習データとするディープラーニング基盤の学習モデルを構築する過程
を処理する、コンピュータシステム。 - 前記少なくとも1つのプロセッサは、
前記視覚的区分領域として、前記テキスト領域の区分が可能なライン、図形、イメージ、背景、間隔、記号、数字のうちの少なくとも1つを利用して前記テキスト領域をクラスタリングすること
を特徴とする、請求項12に記載のコンピュータシステム。 - 前記少なくとも1つのプロセッサは、
前記イメージから認識された単語単位のテキスト領域に該当する単語要素の集合をライン単位のテキスト領域に該当する線形クラスタとして構成すること
を特徴とする、請求項12に記載のコンピュータシステム。 - 前記少なくとも1つのプロセッサは、
同一線上に位置しながら視覚的区分領域が存在しない、連続する単語要素の集合を1つの線形クラスタとして構成すること
を特徴とする、請求項14に記載のコンピュータシステム。 - 前記少なくとも1つのプロセッサは、
前記線形クラスタの集合を文段単位のテキスト領域に該当する仮想クラスタとして構成すること
を特徴とする、請求項14に記載のコンピュータシステム。 - 前記少なくとも1つのプロセッサは、
視覚的区分領域が存在しない、連続する線形クラスタの集合を1つの仮想クラスタとして構成すること
を特徴とする、請求項16に記載のコンピュータシステム。 - 前記少なくとも1つのプロセッサは、
前記線形クラスタに含まれたテキストスタイルに基づいて、少なくとも1つの線形クラスタを前記仮想クラスタとして構成すること
を特徴とする、請求項16に記載のコンピュータシステム。 - 前記少なくとも1つのプロセッサは、
前記仮想クラスタの集合を相関関係のテキスト領域に該当する相関クラスタとして構成すること
を特徴とする、請求項16に記載のコンピュータシステム。 - 前記少なくとも1つのプロセッサは、
完成した文章や句に該当する、連続する仮想クラスタの集合を1つの相関クラスタとして構成すること
を特徴とする、請求項19に記載のコンピュータシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200118419A KR102530657B1 (ko) | 2020-09-15 | 2020-09-15 | 이미지에서 인식된 텍스트를 계층화하는 방법, 시스템, 및 컴퓨터 프로그램 |
KR10-2020-0118419 | 2020-09-15 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022049001A true JP2022049001A (ja) | 2022-03-28 |
Family
ID=80844344
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021147615A Pending JP2022049001A (ja) | 2020-09-15 | 2021-09-10 | イメージから認識したテキストを階層化する方法、システム、およびコンピュータプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2022049001A (ja) |
KR (1) | KR102530657B1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0668300A (ja) * | 1991-12-18 | 1994-03-11 | Internatl Business Mach Corp <Ibm> | 文書画像のレイアウトモデルを作成する方法及び装置 |
JP2013246731A (ja) * | 2012-05-28 | 2013-12-09 | Toshiba Corp | 手書き文字検索装置、方法及びプログラム |
US20200279107A1 (en) * | 2019-02-28 | 2020-09-03 | International Business Machines Corporation | Digital image-based document digitization using a graph model |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10853638B2 (en) | 2018-08-31 | 2020-12-01 | Accenture Global Solutions Limited | System and method for extracting structured information from image documents |
KR102138748B1 (ko) * | 2019-02-08 | 2020-07-28 | 네이버 주식회사 | 라인 단위의 문자열을 검출 및 정렬하기 위한 방법 및 시스템 |
-
2020
- 2020-09-15 KR KR1020200118419A patent/KR102530657B1/ko active IP Right Grant
-
2021
- 2021-09-10 JP JP2021147615A patent/JP2022049001A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0668300A (ja) * | 1991-12-18 | 1994-03-11 | Internatl Business Mach Corp <Ibm> | 文書画像のレイアウトモデルを作成する方法及び装置 |
JP2013246731A (ja) * | 2012-05-28 | 2013-12-09 | Toshiba Corp | 手書き文字検索装置、方法及びプログラム |
US20200279107A1 (en) * | 2019-02-28 | 2020-09-03 | International Business Machines Corporation | Digital image-based document digitization using a graph model |
Also Published As
Publication number | Publication date |
---|---|
KR20220036165A (ko) | 2022-03-22 |
KR102530657B1 (ko) | 2023-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7164729B2 (ja) | クロスモーダル情報検索方法及びその装置、並びに記憶媒体 | |
US11150875B2 (en) | Automated content editor | |
US10013404B2 (en) | Targeted story summarization using natural language processing | |
CN111107422B (zh) | 图像处理方法及装置、电子设备和计算机可读存储介质 | |
CN110297893B (zh) | 自然语言问答方法、装置、计算机装置及存储介质 | |
WO2020103899A1 (zh) | 用于生成图文信息的方法和用于生成图像数据库的方法 | |
JP2021504781A (ja) | ブロックに基づく文書メタデータの抽出のための方法、コンピュータ・プログラム及びシステム | |
US20160085731A1 (en) | Reordering Text from Unstructured Sources to Intended Reading Flow | |
WO2022134779A1 (zh) | 人物动作相关数据的提取方法、装置、设备及存储介质 | |
CN111339250A (zh) | 新类别标签的挖掘方法及电子设备、计算机可读介质 | |
CN117333880A (zh) | 模型训练方法及装置、图像生成方法、电子设备 | |
CN110990563A (zh) | 一种基于人工智能的传统文化素材库构建方法及系统 | |
US10248738B2 (en) | Structuring narrative blocks in a logical sequence | |
CN113268593A (zh) | 意图分类和模型的训练方法、装置、终端及存储介质 | |
JP2022049001A (ja) | イメージから認識したテキストを階層化する方法、システム、およびコンピュータプログラム | |
CN116956019A (zh) | 文本生成方法、装置、电子设备及计算机可读存储介质 | |
KR102476208B1 (ko) | 한국어 명사 추출 토크나이저 기반의 워드클라우드 시스템 | |
JP7122773B2 (ja) | 辞書構築装置、辞書の生産方法、およびプログラム | |
CN111723177B (zh) | 信息提取模型的建模方法、装置及电子设备 | |
CN111368553A (zh) | 智能词云图数据处理方法、装置、设备及存储介质 | |
US20200302006A1 (en) | Comment-based article augmentation | |
US10169332B2 (en) | Data analysis for automated coupling of simulation models | |
JP2009140113A (ja) | 辞書編集装置、および辞書編集方法、並びにコンピュータ・プログラム | |
KR102672166B1 (ko) | 생성형 ai에 대한 프롬프트 정보 최적화 방법 | |
CN117009574B (zh) | 热点视频模板的生成方法、系统、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210910 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221118 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230609 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20230614 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20230810 |