JP7332190B2 - 機械学習基盤情報の提供方法および装置 - Google Patents
機械学習基盤情報の提供方法および装置 Download PDFInfo
- Publication number
- JP7332190B2 JP7332190B2 JP2021189435A JP2021189435A JP7332190B2 JP 7332190 B2 JP7332190 B2 JP 7332190B2 JP 2021189435 A JP2021189435 A JP 2021189435A JP 2021189435 A JP2021189435 A JP 2021189435A JP 7332190 B2 JP7332190 B2 JP 7332190B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- item
- electronic device
- data
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/469—Contour-based spatial representations, e.g. vector-coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
Claims (9)
- 電子装置による機械学習基盤情報の提供方法であって、
前記電子装置によって、第1購入アイテムに関する第1伝票データを獲得する段階と、
前記電子装置によって、前記第1伝票データに含まれた前記第1購入アイテムの業者名情報および勘定摘要情報のうち少なくとも一部に対応するテキストを用いて、前記第1伝票データから前記第1購入アイテムの費用属性に関連した文字列を抽出する段階と、
前記電子装置によって、機械学習を通じて前記抽出された文字列に含まれた文字要素に対応するマトリックスを生成する段階と、
前記電子装置によって、少なくとも一つのフィルターを用いて前記マトリックスから前記抽出された文字列に対応する特徴ベクトルを生成する段階と、
前記電子装置によって、機械学習を通じて学習された第1学習モデルを用いて、テストデータとして前記特徴ベクトルを入力することによって、前記第1購入アイテムのうち間接費に該当する少なくとも一つのアイテムを確認する段階と、
前記電子装置によって、機械学習を通じて学習された第2学習モデルを用いて、テストデータとして前記特徴ベクトルを入力することによって、前記少なくとも一つのアイテムの費用カテゴリー情報を提供する段階と、を含む、機械学習基盤情報の提供方法。 - 前記文字列に含まれた文字要素は、英字、ハングル文字、および特殊文字のうち少なくとも一部を含む、請求項1に記載の機械学習基盤情報の提供方法。
- 前記電子装置によって、機械学習を通じて学習された第3学習モデルを用いて、テストデータとして前記特徴ベクトルを入力することによって、前記第1購入アイテム間の類似度情報を確認する段階と、
前記電子装置によって、前記第1購入アイテム間の類似度情報に基づいて、前記第1購入アイテムの予め設定された比率に該当する一部アイテムをサンプルアイテムとして決定する段階と、
前記電子装置によって、前記第1伝票データから前記サンプルアイテムの属性に関連したサンプル文字列を抽出する段階と、
前記電子装置によって、前記サンプルアイテムの間接費の該当可否に関する情報および前記サンプルアイテムの費用カテゴリー情報を獲得する段階と、をさらに含み、
前記第1学習モデルは、前記サンプル文字列および前記サンプルアイテムの間接費の該当可否に関する情報を第1学習データとして学習され、
前記第2学習モデルは、前記サンプル文字列および前記サンプルアイテムの費用カテゴリー情報を第2学習データとして学習された、請求項1に記載の機械学習基盤情報の提供方法。 - 前記第1購入アイテムに関する前記第1伝票データを獲得する前に、
前記電子装置によって、第2購入アイテムに関する第2伝票データを獲得する段階と、
前記電子装置によって、前記第2購入アイテムの間接費の該当可否に関する情報および費用カテゴリー情報を獲得する段階と、
前記電子装置によって、前記第2伝票データに含まれた前記第2購入アイテムの業者名情報および勘定摘要情報のうち少なくとも一部に対応するテキストを用いて、前記第2伝票データから前記第2購入アイテムの費用属性に関連した文字列を抽出する段階と、をさらに含み、
前記第1学習モデルは、前記第2購入アイテムの文字列および前記第2購入アイテムの間接費の該当可否に関する情報を第1学習データとして学習され、
前記第2学習モデルは、前記第2購入アイテムの文字列および前記第2購入アイテムの費用カテゴリー情報を第2学習データとして学習される、請求項1に記載の機械学習基盤情報の提供方法。 - 前記第1学習モデルおよび前記第2学習モデルのうちの少なくとも一つは、CNN(convolution neural network)を含む、請求項1に記載の機械学習基盤情報の提供方法。
- 前記費用カテゴリー情報は、階層化された複数のカテゴリーを含む、請求項1に記載の機械学習基盤情報の提供方法。
- 前記電子装置によって、学習繰り返し(iteration)回数、CNNフィルターナンバー、CNNフィルター出力、CNNドロップアウト(dropout)、FCN(Fully Connection Network)隠れユニット(hidden unit)、バッチサイズ(batch size)、およびラーニングレート(learning rate)のうち少なくとも一つに対するユーザー入力を受信する段階をさらに含み、
前記第1学習モデルおよび前記第2学習モデルのうち少なくとも一つは、前記ユーザー入力に基づいて学習された、請求項1に記載の機械学習基盤情報の提供方法。 - 電子装置であって、
メモリと、
前記メモリと電気的に連結されたプロセッサーと、を含み、
前記プロセッサーは、
購入アイテムに関する伝票データを獲得し、
前記伝票データに含まれた前記購入アイテムの業者名情報および勘定摘要情報のうち少なくとも一部に対応するテキストを用いて、前期伝票データから前記購入アイテムの費用属性に関連した文字列を抽出し、
機械学習を通じて前記抽出された文字列に含まれた文字要素に対応するマトリックスを生成し、
少なくとも一つのフィルターを用いて前記マトリックスから前記抽出された文字列に対応する特徴ベクトルを生成し、
機械学習を通じて学習された第1学習モデルを用いて、テストデータとして前記特徴ベクトルを入力することによって、前記購入アイテムのうち間接費に該当する少なくとも一つのアイテムを確認し、
機械学習を通じて学習された第2学習モデルを用いて、テストデータとして前記特徴ベクトルを入力することによって、前記少なくとも一つのアイテムの費用カテゴリー情報を提供するように設定された、電子装置。 - 機械学習基盤情報の提供方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な非一時的記憶媒体であって、
前記機械学習基盤情報の提供方法は、
購入アイテムに関する伝票データを獲得する段階と、
前記伝票データに含まれた前記購入アイテムの業者名情報および勘定摘要情報のうち少なくとも一部に対応するテキストを用いて、前記伝票データから前記購入アイテムの費用属性に関連した文字列を抽出する段階と、
機械学習を通じて前記抽出された文字列に含まれた文字要素に対応するマトリックスを生成する段階と、
少なくとも一つのフィルターを用いて前記マトリックスから前記抽出された文字列に対応する特徴ベクトルを生成する段階と、
機械学習を通じて学習された第1学習モデルを用いて、テストデータとして前記特徴ベクトルを入力することによって、前記購入アイテムのうち間接費に該当する少なくとも一つのアイテムを確認する段階と、
機械学習を通じて学習された第2学習モデルを用いて、テストデータとして前記特徴ベクトルを入力することによって、前記少なくとも一つのアイテムの費用カテゴリー情報を提供する段階と、を含む、非一時的記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2020-0158144 | 2020-11-23 | ||
KR1020200158144A KR102265947B1 (ko) | 2020-11-23 | 2020-11-23 | 기계 학습 기반 정보 제공 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022082525A JP2022082525A (ja) | 2022-06-02 |
JP7332190B2 true JP7332190B2 (ja) | 2023-08-23 |
Family
ID=76604090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021189435A Active JP7332190B2 (ja) | 2020-11-23 | 2021-11-22 | 機械学習基盤情報の提供方法および装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220164705A1 (ja) |
JP (1) | JP7332190B2 (ja) |
KR (1) | KR102265947B1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220414338A1 (en) * | 2021-06-29 | 2022-12-29 | Adobe Inc. | Topical vector-quantized variational autoencoders for extractive summarization of video transcripts |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019125126A (ja) | 2018-01-16 | 2019-07-25 | コニカミノルタ株式会社 | 医療機関検索方法、医療機関検索プログラム及び医療機関検索システム |
US20190377972A1 (en) | 2018-06-08 | 2019-12-12 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Method and apparatus for training, classification model, mobile terminal, and readable storage medium |
JP2020024653A (ja) | 2018-06-26 | 2020-02-13 | 幸雄 竹延 | 端末、管理サーバ、就業管理システム、制御方法、およびプログラム |
JP6780888B1 (ja) | 2020-05-19 | 2020-11-04 | Miletos株式会社 | 経費検査装置、経費検査方法、およびプログラム |
JP2020190895A (ja) | 2019-05-21 | 2020-11-26 | 富士通株式会社 | 情報処理装置、情報処理プログラム及び情報処理方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102015218B1 (ko) * | 2018-04-16 | 2019-10-21 | 한양대학교 산학협력단 | 기계 학습을 이용한 텍스트 분류 방법 및 장치 |
JP2020038570A (ja) * | 2018-09-05 | 2020-03-12 | Necソリューションイノベータ株式会社 | 推定装置、システム、方法及びプログラム、並びに、学習装置及び方法 |
KR20200088088A (ko) * | 2019-01-14 | 2020-07-22 | 주식회사 인사이터 | 단어 속성 분류 장치 및 방법 |
JP6590355B1 (ja) * | 2019-04-26 | 2019-10-16 | Arithmer株式会社 | 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム |
CN111640428B (zh) * | 2020-05-29 | 2023-10-20 | 阿波罗智联(北京)科技有限公司 | 一种语音识别方法、装置、设备和介质 |
-
2020
- 2020-11-23 KR KR1020200158144A patent/KR102265947B1/ko active IP Right Grant
-
2021
- 2021-11-22 US US17/456,135 patent/US20220164705A1/en active Pending
- 2021-11-22 JP JP2021189435A patent/JP7332190B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019125126A (ja) | 2018-01-16 | 2019-07-25 | コニカミノルタ株式会社 | 医療機関検索方法、医療機関検索プログラム及び医療機関検索システム |
US20190377972A1 (en) | 2018-06-08 | 2019-12-12 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Method and apparatus for training, classification model, mobile terminal, and readable storage medium |
JP2020024653A (ja) | 2018-06-26 | 2020-02-13 | 幸雄 竹延 | 端末、管理サーバ、就業管理システム、制御方法、およびプログラム |
JP2020190895A (ja) | 2019-05-21 | 2020-11-26 | 富士通株式会社 | 情報処理装置、情報処理プログラム及び情報処理方法 |
JP6780888B1 (ja) | 2020-05-19 | 2020-11-04 | Miletos株式会社 | 経費検査装置、経費検査方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2022082525A (ja) | 2022-06-02 |
KR102265947B1 (ko) | 2021-06-17 |
US20220164705A1 (en) | 2022-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11681925B2 (en) | Techniques for creating, analyzing, and modifying neural networks | |
CN111143550B (zh) | 一种基于层次注意力神经网络模型的争议焦点自动识别方法 | |
CN109034368B (zh) | 一种基于dnn的复杂设备多重故障诊断方法 | |
CN109657947B (zh) | 一种面向企业行业分类的异常检测方法 | |
CN110502361B (zh) | 面向bug报告的细粒度缺陷定位方法 | |
Jolly | Machine learning with scikit-learn quick start guide: classification, regression, and clustering techniques in Python | |
CN106611375A (zh) | 一种基于文本分析的信用风险评估方法及装置 | |
CN109598517B (zh) | 商品通关处理、对象的处理及其类别预测方法和装置 | |
US11640539B2 (en) | Techniques for visualizing the operation of neural networks using samples of training data | |
KR20210023452A (ko) | 속성 단위 리뷰 분석 장치 및 방법 | |
CN110472245B (zh) | 一种基于层次化卷积神经网络的多标记情绪强度预测方法 | |
US20210012209A1 (en) | Techniques for modifying neural network definitions | |
CN112270546A (zh) | 基于stacking算法的风险预测方法、装置和电子设备 | |
Sharp et al. | Toward Semi-autonomous Information: Extraction for Unstructured Maintenance Data in Root Cause Analysis | |
CN111221881B (zh) | 用户特征数据合成方法、装置及电子设备 | |
JP7332190B2 (ja) | 機械学習基盤情報の提供方法および装置 | |
US11615321B2 (en) | Techniques for modifying the operation of neural networks | |
JP7287699B2 (ja) | 機械学習を通じての学習モデルを使った情報提供方法および装置 | |
CN116071077A (zh) | 一种违规账户的风险评估与识别方法及装置 | |
CN116150367A (zh) | 一种基于方面的情感分析方法及系统 | |
Tutek et al. | Toward practical usage of the attention mechanism as a tool for interpretability | |
Coelho et al. | Text Classification in the Brazilian Legal Domain. | |
CN111210332A (zh) | 贷后管理策略生成方法、装置及电子设备 | |
Jeyaraman et al. | Practical Machine Learning with R: Define, build, and evaluate machine learning models for real-world applications | |
CN116089605A (zh) | 基于迁移学习和改进词袋模型的文本情感分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230404 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230710 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230803 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7332190 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |