JP7473799B2 - 検索装置、モデル生成装置、検索方法、およびモデル生成方法 - Google Patents
検索装置、モデル生成装置、検索方法、およびモデル生成方法 Download PDFInfo
- Publication number
- JP7473799B2 JP7473799B2 JP2020088989A JP2020088989A JP7473799B2 JP 7473799 B2 JP7473799 B2 JP 7473799B2 JP 2020088989 A JP2020088989 A JP 2020088989A JP 2020088989 A JP2020088989 A JP 2020088989A JP 7473799 B2 JP7473799 B2 JP 7473799B2
- Authority
- JP
- Japan
- Prior art keywords
- example data
- data
- learning
- training
- training example
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 116
- 238000012549 training Methods 0.000 claims description 60
- 238000013527 convolutional neural network Methods 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 11
- 238000013473 artificial intelligence Methods 0.000 description 42
- 238000007781 pre-processing Methods 0.000 description 29
- 208000020990 adrenal cortex carcinoma Diseases 0.000 description 27
- 239000011159 matrix material Substances 0.000 description 27
- 230000010365 information processing Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 13
- 238000007477 logistic regression Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000003066 decision tree Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
以下、実施形態1の情報処理システム100について説明する。説明の便宜上、実施形態1にて説明した部材と同じ機能を有する部材については、以降の各実施形態では、同じ符号を付記し、その説明を繰り返さない。また、簡潔化のため、公知技術と同様の事項についても、説明を適宜省略する。
図1は、情報処理システム100の要部の構成を示すブロック図である。情報処理システム100は、情報処理装置1、過去事例DB(Database)91、および新規事例DB92を備える。情報処理装置1は、制御装置10、入力部71、出力部72、および記憶部80を備える。制御装置10は、学習装置11(モデル生成装置)および検索装置12を備える。
学習装置11は、学習データ取得部111、学習データ前処理部112(データ拡張部)、および学習モデル生成部113(学習部)を備える。
過去事例DB91には、D1が予め格納されている。学習データ取得部111は、過去事例DB91からD1を取得する。D1には、P個の過去事例データ(第1~第P過去事例データ)が含まれている。Pは、2以上の整数である。第1~第P過去事例データはそれぞれ、第1~第P学習用事例データと称されてもよい。一例として、P=20である。
過去事例データのそれぞれは、M行N列のテーブル(2次元配列)として作成されている。MおよびNはそれぞれ、2以上の整数である。一例として、M=N=100である。なお、検索精度の向上のためには、MはN以上に設定されることが好ましい。
学習データ前処理部112は、学習データ取得部111から、第1~第P学習データのうち1つの学習データ(例:TB1)を取得する。そして、学習データ前処理部112は、当該学習データを数値化する。
図4は、学習データ群230を生成する処理について説明する図である。学習データ前処理部112は、学習データ取得部111から、第1~第P数値化学習データのうち1つの数値化学習データ210(例:TB1num)を選択する。そして、学習データ前処理部112は、当該数値化学習データ210に基づき、学習データ群230を生成する。具体的には、学習データ前処理部112は、数値化学習データ210を学習データ群230へと拡張する。
図5は、D2(学習モデル)の生成方法を説明する図である。学習モデル生成部113は、第1~第P学習データに基づき、D2を生成する。より好ましくは、学習モデル生成部113は、学習データ前処理部112によって生成された第1~第P学習データ群(総称的に、「学習データ群」とも称する)を用いて、D2を生成する。
検索装置12は、新規事例データ取得部121、新規事例データ前処理部122、および検索部123を備える。新規事例DB92には、新規事例データD3が予め格納されている。新規事例データ取得部121は、新規事例DB92からD3を取得し、当該D3を新規事例データ前処理部122に供給する。
ΣACC(p)=ACC(1)+ACC(2)+…+ACC(P)=1
の関係が成立する。
情報処理装置1では、「過去事例データと当該過去事例データに適用されたAI手法との対応関係」をCNNに学習させることで、D2(学習済CNN)が生成されている。そして、D2を用いて、新規事例データに適した(適用すべき)AI手法の候補を検索できる。より具体的には、D2によって算出された各ACCに基づいて、上記候補を決定できる。例えば、ACCが高い順に、各AI手法の候補順位を決定できる。
実施形態1の例は、第1内容パラメータは、「第1特定文字列に係る物理量の大きさを示す値」であった。但し、第1内容パラメータの設定方法は、第1特定文字列に応じて変更されてよく、上記の例に限定されないことに留意されたい。以下、第1内容パラメータの設定方法の別の例について説明する。当然ながら、第1内容パラメータについての以下の説明は、その他の内容パラメータについても同様に当てはまる。
情報処理装置1の制御ブロック(特に制御装置10)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
本発明の一態様は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の一態様の技術的範囲に含まれる。
10 制御装置
11 学習装置(モデル生成装置)
12 検索装置
100 情報処理システム
112 学習データ前処理部(データ拡張部)
113 学習モデル生成部(学習部)
123 検索部
202、202a、202b ラベルデータ
210 学習データ(2次元配列,数値化された後の学習用事例データ)
220 行列(付加的な2次元配列)
220a 行列(第1学習データ群に含まれる付加的な2次元配列)
220b 行列(第2学習データ群に含まれる付加的な2次元配列)
230 学習データ群(学習用事例データ群)
230a 第1学習データ群(第1学習用事例データ群)
230b 第2学習データ群(第1学習用事例データ群)
320 行列(2次元配列,ターゲット事例データ)
321 行列(2次元配列,数値化された後のターゲット事例データ)
D2 学習モデル(学習済CNN)
TB1 テーブル(第1学習データ)
TB1num テーブル(数値化された後の第1学習データ)
Claims (11)
- P個(Pは2以上の整数)の問題解決手法の内から、ターゲット事例データに適用すべき少なくとも1つの問題解決手法を検索する検索装置であって、
上記P個の問題解決手法のそれぞれは、第1学習用事例データから第P学習用事例データまでのP個の学習用事例データと1対1に対応付けられており、
上記P個の学習用事例データに基づく学習をCNN(Convolutional Neural Network)に行わせることにより、学習済CNNが予め生成されており、
上記ターゲット事例データに応じた上記学習済CNNの出力に基づいて、上記少なくとも1つの問題解決手法を検索する検索部を備えている、検索装置。 - 上記P個の学習用事例データのそれぞれ、および、上記ターゲット事例データは、第1事例から第M事例(Mは2以上の整数)までのM個の事例のそれぞれの内容に係るデータを含んでおり、
第1特定文字列から第N特定文字列までのN個(Nは2以上の整数)の特定文字列が予め設定されており、
上記P個の学習用事例データのそれぞれ、および、上記ターゲット事例データは、M行N列の2次元配列であり、
上記2次元配列は、第j特定文字列(jは1以上かつN以下の整数)に係る第j記載内容のデータを含んでおり、
上記2次元配列のi行j列目(iは1以上かつM以下の整数)の成分は、第i事例の第j記載内容を示す、請求項1に記載の検索装置。 - 上記学習済CNNは、上記ターゲット事例データに対する上記P個の問題解決手法のそれぞれの好適性を示すスコアを出力し、
上記検索部は、上記スコアに応じて、上記P個の問題解決手法のそれぞれをソートする、請求項1または2に記載の検索装置。 - P個(Pは2以上の整数)の問題解決手法の内から、ターゲット事例データに適用すべき少なくとも1つの問題解決手法を検索するための学習モデルを生成するモデル生成装置であって、
上記P個の問題解決手法のそれぞれは、第1学習用事例データから第P学習用事例データまでのP個の学習用事例データと1対1に対応付けられており、
上記P個の学習用事例データに基づく学習をCNN(Convolutional Neural Network)に行わせることにより、上記学習モデルとしての学習済CNNを生成する学習部を備えている、モデル生成装置。 - 上記P個の学習用事例データのそれぞれは、第1事例から第M事例(Mは2以上の整数)までのM個の事例のそれぞれの内容に係るデータを含んでおり、
第1特定文字列から第N特定文字列までのN個(Nは2以上の整数)の特定文字列が予め設定されており、
上記P個の学習用事例データのそれぞれは、M行N列の2次元配列であり、
上記2次元配列は、第j特定文字列(jは1以上かつN以下の整数)に係る第j記載内容のデータを含んでおり、
上記2次元配列のi行j列目(iは1以上かつM以下の整数)の成分は、第i事例の第j記載内容を示す、請求項4に記載のモデル生成装置。 - 上記P個の学習用事例データのうち、p番目(pは1以上かつP以下の整数)の学習用事例データを第p学習用事例データと称し、
上記P個の問題解決手法のうち、上記第p学習用事例データに対応付けられた問題解決手法を第p問題解決手法と称し、
上記第p学習用事例データを数値化および加工することにより、上記第p学習用事例データに対応する第p学習用事例データ群を生成するとともに、生成した上記第p学習用事例データ群を上記第p問題解決手法に対応付けるデータ拡張部をさらに備えている、請求項5に記載のモデル生成装置。 - 上記第p学習用事例データ群には、数値化された後の上記第p学習用事例データの任意の2つの行を入れ替えることによって得られた付加的な2次元配列が含まれている、請求項6に記載のモデル生成装置。
- 上記第p学習用事例データ群には、数値化された後の上記第p学習用事例データの任意の2つの列を入れ替えることによって得られた付加的な2次元配列が含まれている、請求項6または7に記載のモデル生成装置。
- 上記データ拡張部は、上記P個の学習用事例データのそれぞれを数値化および加工することにより、第1学習用事例データ群から第P学習用事例データ群までのP個の学習用事例データ群を生成し、
上記学習部は、上記P個の学習用事例データ群を上記CNNに入力することにより、上記学習済CNNを生成する、請求項6から8のいずれか1項に記載のモデル生成装置。 - P個(Pは2以上の整数)の問題解決手法の内から、ターゲット事例データに適用すべき少なくとも1つの問題解決手法を、検索装置が検索する検索方法であって、
上記P個の問題解決手法のそれぞれは、第1学習用事例データから第P学習用事例データまでのP個の学習用事例データと1対1に対応付けられており、
上記P個の学習用事例データに基づく学習をCNN(Convolutional Neural Network)に行わせることにより、学習済CNNが予め生成されており、
上記検索装置が備える検索部が、上記ターゲット事例データに応じた上記学習済CNNの出力に基づいて、上記少なくとも1つの問題解決手法を検索する検索工程を含んでいる、検索方法。 - P個(Pは2以上の整数)の問題解決手法の内から、ターゲット事例データに適用すべき少なくとも1つの問題解決手法を検索するための学習モデルを、モデル生成装置が生成するモデル生成方法であって、
上記P個の問題解決手法のそれぞれは、第1学習用事例データから第P学習用事例データまでのP個の学習用事例データと1対1に対応付けられており、
上記モデル生成装置が備える学習部が、上記P個の学習用事例データに基づく学習をCNN(Convolutional Neural Network)に行わせることにより、上記学習モデルとしての学習済CNNを生成する学習工程を含んでいる、モデル生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020088989A JP7473799B2 (ja) | 2020-05-21 | 2020-05-21 | 検索装置、モデル生成装置、検索方法、およびモデル生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020088989A JP7473799B2 (ja) | 2020-05-21 | 2020-05-21 | 検索装置、モデル生成装置、検索方法、およびモデル生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021184153A JP2021184153A (ja) | 2021-12-02 |
JP7473799B2 true JP7473799B2 (ja) | 2024-04-24 |
Family
ID=78767432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020088989A Active JP7473799B2 (ja) | 2020-05-21 | 2020-05-21 | 検索装置、モデル生成装置、検索方法、およびモデル生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7473799B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004287478A (ja) | 2003-03-19 | 2004-10-14 | Toyota Motor Corp | 商品の予測需要量を算出する方法と装置とそのためのプログラム |
JP2005044087A (ja) | 2003-07-28 | 2005-02-17 | Hitachi Ltd | テキストマイニングシステム及びプログラム |
JP2010205218A (ja) | 2009-03-06 | 2010-09-16 | Dainippon Printing Co Ltd | データ分析支援装置、データ分析支援システム、データ分析支援方法、及びプログラム |
-
2020
- 2020-05-21 JP JP2020088989A patent/JP7473799B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004287478A (ja) | 2003-03-19 | 2004-10-14 | Toyota Motor Corp | 商品の予測需要量を算出する方法と装置とそのためのプログラム |
JP2005044087A (ja) | 2003-07-28 | 2005-02-17 | Hitachi Ltd | テキストマイニングシステム及びプログラム |
JP2010205218A (ja) | 2009-03-06 | 2010-09-16 | Dainippon Printing Co Ltd | データ分析支援装置、データ分析支援システム、データ分析支援方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021184153A (ja) | 2021-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112632385B (zh) | 课程推荐方法、装置、计算机设备及介质 | |
CN106980683B (zh) | 基于深度学习的博客文本摘要生成方法 | |
CN110851596A (zh) | 文本分类方法、装置及计算机可读存储介质 | |
Hoque et al. | Real time bangladeshi sign language detection using faster r-cnn | |
CN105139237A (zh) | 信息推送的方法和装置 | |
CN110705490B (zh) | 视觉情感识别方法 | |
WO2022134586A1 (zh) | 基于元学习的目标分类方法、装置、设备和存储介质 | |
CN111831924A (zh) | 内容推荐方法、装置、设备及可读存储介质 | |
CN112686345A (zh) | 一种基于注意力机制的脱机英文手写识别方法 | |
CN113627530A (zh) | 相似问题文本生成方法、装置、设备及介质 | |
CN112732872A (zh) | 面向生物医学文本的基于主题注意机制的多标签分类方法 | |
CN115238115A (zh) | 基于中文数据的图像检索方法、装置、设备及存储介质 | |
CN111444720A (zh) | 一种英文文本的命名实体识别方法 | |
Danilov et al. | Predicting postoperative hospital stay in neurosurgery with recurrent neural networks based on operative reports | |
Azawi | Handwritten digits recognition using transfer learning | |
CN113935459A (zh) | 一种基于bert的深度神经网络模型的自动评卷方法 | |
JP7473799B2 (ja) | 検索装置、モデル生成装置、検索方法、およびモデル生成方法 | |
CN112597304A (zh) | 一种问句分类方法及其应用 | |
CN115080689B (zh) | 融合标签关联的隐空间数据增强多标签文本分类方法 | |
AU2022216431B2 (en) | Generating neural network outputs by enriching latent embeddings using self-attention and cross-attention operations | |
CN113468311B (zh) | 一种基于知识图谱的复杂问句问答方法、装置及存储介质 | |
CN115658885A (zh) | 文本智能标注方法、系统、智能终端及存储介质 | |
CN112347150B (zh) | 一种学者学术标签标注方法、装置和电子设备 | |
CN115291888A (zh) | 基于自注意力交互式网络的软件社区仓库挖掘方法及装置 | |
Ranjan et al. | MCWS-transformers: towards an efficient modeling of protein sequences via multi context-window based scaled self-attention |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7473799 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |