JP2018077586A - 分類器学習装置、表種類分類装置、方法、及びプログラム - Google Patents
分類器学習装置、表種類分類装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2018077586A JP2018077586A JP2016217528A JP2016217528A JP2018077586A JP 2018077586 A JP2018077586 A JP 2018077586A JP 2016217528 A JP2016217528 A JP 2016217528A JP 2016217528 A JP2016217528 A JP 2016217528A JP 2018077586 A JP2018077586 A JP 2018077586A
- Authority
- JP
- Japan
- Prior art keywords
- cell
- token
- vector
- encoded
- encoding unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
Description
は行列の要素ごとの積を意味する。We、Wr、Ur、Wz、Uz、W、Uはセル符号化部26のモデルパラメータである。W.はH×E次元のパラメータ行列となる。U.はH×H次元のパラメータ行列となる。hの初期値はH次元の零ベクトルである。
20、70 演算部
22、72 セル符号化部
24、74 行符号化部
26、76 列符号化部
28、78 表符号化部
30 学習部
40、90 出力部
80 表種類分類部
100 分類器学習装置
150 表種類分類装置
Claims (5)
- セルの行列として記述された表形式データと表の種類を表す正解ラベルとの組の集合である訓練データ集合に含まれる前記表形式データの各々について、表の各セルに対し、前記セルに記載されたテキスト情報に基づいてトークン系列を生成するトークン系列生成部と、
前記訓練データ集合に含まれる前記表形式データの各々について、表の各セルに対し、前記トークン系列生成部により生成された前記トークン系列に含まれる各トークンをベクトルに変換して符号化トークン系列を生成するトークン符号化部と、
前記訓練データ集合に含まれる前記表形式データの各々について、表の各セルに対し、前記トークン符号化部により符号化された前記符号化トークン系列をセルベクトルに符号化するセル符号化部と、
前記訓練データ集合に含まれる前記表形式データの各々について、前記セル符号化部により各セルについて符号化された前記セルベクトルから得られる3次元テンソルデータを符号化して表符号化ベクトルを出力する表符号化部と、
前記訓練データ集合に含まれる表形式データの各々についての、前記表符号化部が出力した表符号化ベクトルと、前記正解ラベルと、に基づいて、表形式データの表の種類を分類するための分類器を学習する学習部と、
を有する分類器学習装置。 - セルの行列として記述された表形式データについて、表の各セルに対し、前記セルに記載されたテキスト情報に基づいてトークン系列を生成するトークン系列生成部と、
表の各セルに対し、前記トークン系列生成部により生成された前記トークン系列に含まれる各トークンをベクトルに変換して符号化トークン系列を生成するトークン符号化部と、
表の各セルに対し、前記トークン符号化部により符号化された前記符号化トークン系列をセルベクトルに符号化するセル符号化部と、
前記セル符号化部により各セルについて符号化された前記セルベクトルから得られる3次元テンソルデータを符号化して表符号化ベクトルを出力する表符号化部と、
前記表符号化部が出力した表符号化ベクトルと、表形式データの表の種類を分類するための予め学習された分類器とに基づいて、前記表形式データの表の種類を分類する表種類分類部と、
を有する表種類分類装置。 - トークン系列生成部が、セルの行列として記述された表形式データと表の種類を表す正解ラベルとの組の集合である訓練データ集合に含まれる前記表形式データの各々について、表の各セルに対し、前記セルに記載されたテキスト情報に基づいてトークン系列を生成し、
トークン符号化部が、前記訓練データ集合に含まれる前記表形式データの各々について、表の各セルに対し、前記トークン系列生成部により生成された前記トークン系列に含まれる各トークンをベクトルに変換して符号化トークン系列を生成し、
セル符号化部が、前記訓練データ集合に含まれる前記表形式データの各々について、表の各セルに対し、前記トークン符号化部により符号化された前記符号化トークン系列をセルベクトルに符号化し、
表符号化部が、前記訓練データ集合に含まれる前記表形式データの各々について、前記セル符号化部により各セルについて符号化された前記セルベクトルから得られる3次元テンソルデータを符号化して表符号化ベクトルを出力し、
学習部が、前記訓練データ集合に含まれる表形式データの各々についての、前記表符号化部が出力した表符号化ベクトルと、前記正解ラベルと、に基づいて、表形式データの表の種類を分類するための分類器を学習する
分類器学習方法。 - トークン系列生成部が、セルの行列として記述された表形式データについて、表の各セルに対し、前記セルに記載されたテキスト情報に基づいてトークン系列を生成し、
トークン符号化部が、表の各セルに対し、前記トークン系列生成部により生成された前記トークン系列に含まれる各トークンをベクトルに変換して符号化トークン系列を生成し、
セル符号化部が、表の各セルに対し、前記トークン符号化部により符号化された前記符号化トークン系列をセルベクトルに符号化し、
表符号化部が、前記セル符号化部により各セルについて符号化された前記セルベクトルから得られる3次元テンソルデータを符号化して表符号化ベクトルを出力し、
表種類分類部が、前記表符号化部が出力した表符号化ベクトルと、表形式データの表の種類を分類するための予め学習された分類器とに基づいて、前記表形式データの表の種類を分類する
表種類分類方法。 - コンピュータを、請求項1に記載の分類器学習装置、又は請求項2に記載の表種類分類装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016217528A JP6517773B2 (ja) | 2016-11-07 | 2016-11-07 | 分類器学習装置、表種類分類装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016217528A JP6517773B2 (ja) | 2016-11-07 | 2016-11-07 | 分類器学習装置、表種類分類装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018077586A true JP2018077586A (ja) | 2018-05-17 |
JP6517773B2 JP6517773B2 (ja) | 2019-05-22 |
Family
ID=62150779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016217528A Active JP6517773B2 (ja) | 2016-11-07 | 2016-11-07 | 分類器学習装置、表種類分類装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6517773B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2020261344A1 (ja) * | 2019-06-24 | 2020-12-30 | ||
WO2024053101A1 (ja) * | 2022-09-09 | 2024-03-14 | 富士通株式会社 | 学習プログラム、生成プログラム、学習方法および情報処理装置 |
-
2016
- 2016-11-07 JP JP2016217528A patent/JP6517773B2/ja active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2020261344A1 (ja) * | 2019-06-24 | 2020-12-30 | ||
WO2020261344A1 (ja) * | 2019-06-24 | 2020-12-30 | 日本電信電話株式会社 | データ処理装置、データ処理方法及びデータ処理プログラム |
WO2024053101A1 (ja) * | 2022-09-09 | 2024-03-14 | 富士通株式会社 | 学習プログラム、生成プログラム、学習方法および情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6517773B2 (ja) | 2019-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sadr et al. | Multi-view deep network: a deep model based on learning features from heterogeneous neural networks for sentiment analysis | |
Lee et al. | Variations of AlexNet and GoogLeNet to improve Korean character recognition performance. | |
CN107832458B (zh) | 一种字符级的基于嵌套深度网络的文本分类方法 | |
Rani et al. | Deformed character recognition using convolutional neural networks | |
Tixier et al. | Graph classification with 2d convolutional neural networks | |
Obaidullah et al. | Numeral script identification from handwritten document images | |
Saha et al. | Bangla handwritten digit recognition using an improved deep convolutional neural network architecture | |
Albattah et al. | Intelligent arabic handwriting recognition using different standalone and hybrid CNN architectures | |
Du et al. | Discriminative representation learning with supervised auto-encoder | |
Khayyat et al. | A deep learning based prediction of arabic manuscripts handwriting style. | |
Chaudhary et al. | Hindi handwritten character recognition using deep convolution neural network | |
Inunganbi et al. | Handwritten Meitei Mayek recognition using three‐channel convolution neural network of gradients and gray | |
Sadeghi et al. | Learning representation hierarchies by sharing visual features: a computational investigation of Persian character recognition with unsupervised deep learning | |
JP6517773B2 (ja) | 分類器学習装置、表種類分類装置、方法、及びプログラム | |
Gautam et al. | Recognition of Brahmi words by using deep convolutional neural network | |
CN112905793A (zh) | 一种基于Bilstm+Attention文本分类的案例推荐方法及系统 | |
Hajihashemi et al. | A pattern recognition based Holographic Graph Neuron for Persian alphabet recognition | |
Sevim et al. | Document image classification with vision transformers | |
Sevim et al. | Improving accuracy of document image classification through soft voting ensemble | |
Singh et al. | An improved approach for Devanagari handwritten characters recognition system | |
Abbas et al. | Feature extraction in six blocks to detect and recognize english numbers | |
JP6495212B2 (ja) | 分類器学習装置、表種類分類装置、方法、及びプログラム | |
Tejashwini et al. | Revolutionizing sentiment classification: A deep learning approach using self-attention based encoding–decoding transformers with feature fusion | |
Dey et al. | Recognition of handwritten characters from Devanagari, Bangla, and Odia languages using transfer-learning-based VGG-16 networks | |
Inunganbi et al. | Handwritten Character Recognition Using Directed Acyclic Graph |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180312 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190318 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190409 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190418 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6517773 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |