JP2019128634A - 最適化装置及びハイパーパラメータの最適化方法 - Google Patents
最適化装置及びハイパーパラメータの最適化方法 Download PDFInfo
- Publication number
- JP2019128634A JP2019128634A JP2018007955A JP2018007955A JP2019128634A JP 2019128634 A JP2019128634 A JP 2019128634A JP 2018007955 A JP2018007955 A JP 2018007955A JP 2018007955 A JP2018007955 A JP 2018007955A JP 2019128634 A JP2019128634 A JP 2019128634A
- Authority
- JP
- Japan
- Prior art keywords
- optimization
- visualization
- dimensional vector
- unit
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
101 データバス
102 CPU
103 メモリ
104 入出力インターフェイス
105 通信装置
106 ドライブ装置
107 入力装置
108 出力装置
109 記憶媒体
200 プログラム
210 参照データ格納部
220 文書解釈部
230 結果表示部
310 最適化部
320 高次元可視化部
410 ハイパーパラメータ生成部
420 単語選択部
430 自然言語学習部
440 結果評価部
510 可視化ハイパーパラメータ生成部
520 可視化調整部
530 可視化評価部
540 考察要素提示部
1400 表示画面
1401 Import fileボタン
1402 optimizingボタン
1403 mapボタン
1404 Saveボタン
1405 Import file name欄
1406 Export file name欄
1407 結果表示領域
1408 ラジオボタン
Claims (12)
- プロセッサとメモリを含んで自然言語処理により文書集合の学習を行う最適化装置であって、
予め設定されたグループデータに基づいて所定の条件を満たすハイパーパラメータを決定し、当該決定したハイパーパラメータで学習モデルを生成し、当該学習モデルから高次元ベクトルを取得する最適化部と、
解析対象の単語または文書の前記高次元ベクトルを前記グループデータに基づいて変換する高次元可視化部と、を有することを特徴とする最適化装置。 - 請求項1に記載の最適化装置であって、
前記最適化部は、
前記ハイパーパラメータを生成し、前記学習モデルの評価に用いる単語または文書を取得し、前記ハイパーパラメータを使用した学習により学習モデルを生成し、前記生成したモデルと前記モデルの評価に用いる単語または文書を用いて精度の評価を行うことを特徴とする最適化装置。 - 請求項1に記載の最適化装置であって、
前記高次元可視化部は、
可視化ハイパーパラメータを生成し、前記生成した可視化ハイパーパラメータを使用して、高次元ベクトルを2次元または3次元の低次元ベクトルに変換し、前記低次元ベクトルに対して精度評価を行い、最も高い精度であった可視化結果を提示することを特徴とする最適化装置。 - 請求項3に記載の最適化装置であって、
前記高次元可視化部は、
前記学習に用いた文書集合や辞書または高次元ベクトルや前記低次元ベクトルを考察要素に用いるデータとして用いて、前記可視化結果または高次元ベクトルの結果に対して考察を行うための考察要素を提示することを特徴とする最適化装置。 - 請求項2に記載の最適化装置であって、
前記最適化部は、
前記精度の評価を、単語間の距離に基づいてスコアを算出し、当該スコアが最小となる学習モデルのハイパーパラメータを、前記所定の条件を満たすハイパーパラメータとして決定することを特徴とする最適化装置。 - 請求項4に記載の最適化装置であって、
前記高次元可視化部は、
前記考察要素に用いるデータを読み込んで、前記データに含まれる単語についてクラスタリングを行った結果を前記考察要素として出力することを特徴とする最適化装置。 - プロセッサとメモリを含む計算機が、自然言語処理により文書集合の学習を行う際のハイパーパラメータの最適化方法であって、
前記計算機が、予め設定されたグループデータに基づいて所定の条件を満たすハイパーパラメータを決定し、当該決定したハイパーパラメータで学習モデルを生成し、当該学習モデルから高次元ベクトルを取得する第1のステップと、
前記計算機が、解析対象の単語または文書の前記高次元ベクトルを前記グループデータに基づいて変換する第2のステップと、
を含むことを特徴とするハイパーパラメータの最適化方法。 - 請求項7に記載のハイパーパラメータの最適化方法であって、
前記第1のステップは、
前記ハイパーパラメータを生成し、前記学習モデルの評価に用いる単語または文書を取得し、前記ハイパーパラメータを使用した学習により学習モデルを生成し、前記生成したモデルと前記モデルの評価に用いる単語または文書を用いて精度の評価を行うことを特徴とするハイパーパラメータの最適化方法。 - 請求項7に記載のハイパーパラメータの最適化方法であって、
前記第2のステップは、
可視化ハイパーパラメータを生成し、前記生成した可視化ハイパーパラメータを使用して、高次元ベクトルを2次元または3次元の低次元ベクトルに変換し、前記低次元ベクトルに対して精度評価を行い、最も高い精度であった可視化結果を提示することを特徴とするハイパーパラメータの最適化方法。 - 請求項9に記載のハイパーパラメータの最適化方法であって、
前記第2のステップは、
前記学習に用いた文書集合や辞書または高次元ベクトルや前記低次元ベクトルを考察要素に用いるデータとして用いて、前記可視化結果または高次元ベクトルの結果に対して考察を行うための考察要素を提示することを特徴とするハイパーパラメータの最適化方法。 - 請求項8に記載のハイパーパラメータの最適化方法であって、
前記第1のステップは、
前記精度の評価を、単語間の距離に基づいてスコアを算出し、当該スコアが最小となる学習モデルのハイパーパラメータを、前記所定の条件を満たすハイパーパラメータとして決定することを特徴とするハイパーパラメータの最適化方法。 - 請求項10に記載のハイパーパラメータの最適化方法であって、
前記第2のステップは、
前記考察要素に用いるデータを読み込んで、前記データに含まれる単語についてクラスタリングを行った結果を前記考察要素として出力することを特徴とするハイパーパラメータの最適化方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018007955A JP6856557B2 (ja) | 2018-01-22 | 2018-01-22 | 最適化装置及びハイパーパラメータの最適化方法 |
US16/248,822 US10936971B2 (en) | 2018-01-22 | 2019-01-16 | Optimization apparatus and optimization method for hyper parameter |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018007955A JP6856557B2 (ja) | 2018-01-22 | 2018-01-22 | 最適化装置及びハイパーパラメータの最適化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019128634A true JP2019128634A (ja) | 2019-08-01 |
JP6856557B2 JP6856557B2 (ja) | 2021-04-07 |
Family
ID=67299383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018007955A Active JP6856557B2 (ja) | 2018-01-22 | 2018-01-22 | 最適化装置及びハイパーパラメータの最適化方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10936971B2 (ja) |
JP (1) | JP6856557B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023037399A1 (ja) * | 2021-09-07 | 2023-03-16 | 日本電気株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7377494B2 (ja) | 2020-05-11 | 2023-11-10 | Jrcモビリティ株式会社 | 属性の識別装置および識別方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111538776B (zh) * | 2020-03-19 | 2021-10-01 | 浙江中海达空间信息技术有限公司 | 多层认知约束的高维地理空间数据聚焦可视化方法 |
US20220335090A1 (en) * | 2021-04-14 | 2022-10-20 | International Business Machines Corporation | Identifying equivalent technical terms in different documents |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012053848A (ja) * | 2010-09-03 | 2012-03-15 | Nippon Telegr & Teleph Corp <Ntt> | データ可視化装置、データ変換装置、方法、及びプログラム |
US20170293687A1 (en) * | 2016-04-12 | 2017-10-12 | Abbyy Infopoisk Llc | Evaluating text classifier parameters based on semantic features |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9355171B2 (en) * | 2009-10-09 | 2016-05-31 | Hewlett Packard Enterprise Development Lp | Clustering of near-duplicate documents |
BR112015029806A2 (pt) * | 2013-05-30 | 2020-04-28 | President And Fellows Of Harvard College | sistemas e métodos para realizar otimização bayesiana |
US11436270B2 (en) * | 2014-02-28 | 2022-09-06 | San Diego State University Research Foundation | Knowledge reference system and method |
US10534994B1 (en) * | 2015-11-11 | 2020-01-14 | Cadence Design Systems, Inc. | System and method for hyper-parameter analysis for multi-layer computational structures |
-
2018
- 2018-01-22 JP JP2018007955A patent/JP6856557B2/ja active Active
-
2019
- 2019-01-16 US US16/248,822 patent/US10936971B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012053848A (ja) * | 2010-09-03 | 2012-03-15 | Nippon Telegr & Teleph Corp <Ntt> | データ可視化装置、データ変換装置、方法、及びプログラム |
US20170293687A1 (en) * | 2016-04-12 | 2017-10-12 | Abbyy Infopoisk Llc | Evaluating text classifier parameters based on semantic features |
Non-Patent Citations (1)
Title |
---|
斎藤 康毅, ゼロから作るDEEP LEARNING, vol. 第1版, JPN6020049870, 13 February 2017 (2017-02-13), JP, pages 197 - 203, ISSN: 0004413752 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7377494B2 (ja) | 2020-05-11 | 2023-11-10 | Jrcモビリティ株式会社 | 属性の識別装置および識別方法 |
WO2023037399A1 (ja) * | 2021-09-07 | 2023-03-16 | 日本電気株式会社 | 情報処理装置、情報処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20190228335A1 (en) | 2019-07-25 |
JP6856557B2 (ja) | 2021-04-07 |
US10936971B2 (en) | 2021-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Smilkov et al. | Embedding projector: Interactive visualization and interpretation of embeddings | |
Raikwal et al. | Performance evaluation of SVM and k-nearest neighbor algorithm over medical data set | |
Zhao et al. | Spectral feature selection for data mining | |
JP6856557B2 (ja) | 最適化装置及びハイパーパラメータの最適化方法 | |
Maguire et al. | Taxonomy-based glyph design—with a case study on visualizing workflows of biological experiments | |
Sherkat et al. | Interactive document clustering revisited: a visual analytics approach | |
JP6629935B2 (ja) | 文書のカテゴリ分類のためのディープラーニング学習方法およびそのシステム | |
CN112085041A (zh) | 神经网络的训练方法、训练装置和电子设备 | |
Edeki et al. | Comparison of data mining techniques used to predict cancer survivability | |
WO2019019969A1 (zh) | 知识验证方法、知识验证设备以及存储介质 | |
Schulz et al. | Generative data models for validation and evaluation of visualization techniques | |
Lawson et al. | Persistent homology for the automatic classification of prostate cancer aggressiveness in histopathology images | |
CN115795030A (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
JP6775366B2 (ja) | 選択装置、および選択方法 | |
JP2016110256A (ja) | 情報処理装置及び情報処理プログラム | |
Cousyn et al. | Web-based objects detection to discover key objects in human activities | |
JP7292235B2 (ja) | 分析支援装置及び分析支援方法 | |
Mahmood et al. | Interactive subspace cluster analysis guided by semantic attribute associations | |
JP6721036B2 (ja) | 推論システム、推論方法、及び、プログラム | |
JP2020038557A (ja) | 判定装置、判定方法、および判定プログラム | |
EP3109777B1 (en) | Object classification device and program | |
KR101602898B1 (ko) | 객체의 코멘트 데이터를 이용한 데이터 시각화 방법 및 시스템 | |
JP6515438B2 (ja) | 重要度算出装置、重要度算出装置方法、及び重要度算出装置システム | |
JP7034453B1 (ja) | 情報解析装置、情報解析方法および情報解析用プログラム | |
KR101983493B1 (ko) | 자연어 텍스트로부터 학습된 객체 표상에 포함된 특성 해석 및 시각화 방법 그리고 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210302 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6856557 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |