JP7133351B2 - 生成方法、生成プログラムおよび生成装置 - Google Patents

生成方法、生成プログラムおよび生成装置 Download PDF

Info

Publication number
JP7133351B2
JP7133351B2 JP2018094189A JP2018094189A JP7133351B2 JP 7133351 B2 JP7133351 B2 JP 7133351B2 JP 2018094189 A JP2018094189 A JP 2018094189A JP 2018094189 A JP2018094189 A JP 2018094189A JP 7133351 B2 JP7133351 B2 JP 7133351B2
Authority
JP
Japan
Prior art keywords
information
input
parameter
word
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018094189A
Other languages
English (en)
Other versions
JP2019200554A (ja
Inventor
直紀 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018094189A priority Critical patent/JP7133351B2/ja
Publication of JP2019200554A publication Critical patent/JP2019200554A/ja
Application granted granted Critical
Publication of JP7133351B2 publication Critical patent/JP7133351B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、生成方法、生成プログラムおよび生成装置に関する。
機械学習を用いて、入力情報に基づいて出力情報を生成する分類器等のシステムを生成する技術が用いられている。しかし、入力情報に欠損がある場合、出力情報の精度が低下する可能性があるため、欠損した情報を予測する技術が用いられる。
関連する技術として、トレーニングデータをデータ学習プログラムに入力して分類器を作成し、欠損値を含むデータから生成した入力データを分類器に入力して、欠損値を予測する技術が提案されている(例えば、特許文献1を参照)。
また、関連する技術として、欠損値を含むフィールドが複数ある場合に欠損値を含むフィールド以外のフィールドのデータから欠損値を予測し、補間する技術が提案されている(例えば、特許文献2を参照)。
また、関連する技術として、iterative inversion法と誤差逆伝搬により、不完全なセンサ情報の欠損値を推定しモデル獲得を行う技術が提案されている(例えば、特許文献3を参照)。
また、関連する技術として、欠損値のうちの予測したい目的変数を受け付け、重回帰分析の結果をもとに、目的変数を含むレコードの各説明変数の値及び係数から目的変数の値を計算する技術が提案されている(例えば、特許文献4を参照)。
特開2007-334719号公報 特開2000-40079号公報 特開平8-212184号公報 特開2014-63432号公報
例えば、入力情報のうち文章が欠損している場合、入力情報内の他の情報を用いて文章を予測することが考えられる。しかし、文章内の単語の数が可変であり、単語の順番を考慮することになるため、欠損している文章を直接予測することは困難である。そして、欠損した文章の予測精度が低下すると、出力情報の精度も低下する。
1つの側面として、本発明は、文章が入力されないことが出力に与える影響を抑制することを目的とする。
1つの態様では、生成方法は、コンピュータが、第1の入力項目に対応付けて入力された第1の単語と、第2の入力項目に対応付けて入力された第1の文章と、前記第1の単語及び前記第1の文章の組みに応じた第1の情報と、を含む学習情報を取得し、前記学習情報に基づき、前記第1の単語と、前記第1の文章に対して文章変換パラメータを用いて行う文章変換により得られる第1の中間情報の組みに対して第1の変換パラメータを用いて行う第1の変換により得られる情報が前記第1の情報に最も近くなるように前記文章変換パラメータ及び前記第1の変換パラメータを調整することによって、前記文章変換パラメータ及び前記第1の変換パラメータを生成する共に、前記第1の単語に対して第2の変換パラメータを用いて行う第2の変換により得られる情報と前記第1の中間情報との差が最も小さくなるように前記第2の変換パラメータ生成し、前記第2の入力項目に対応付けられた文章の入力を受け付けずに、前記第1の入力項目に対応付けられた第2の単語の入力を受け付けると、前記第2の単語と、前記第2の単語に対して前記第2の変換パラメータを用いて行う前記第2の変換により得られる第2の中間情報との組みに対して前記第1の変換パラメータを用いて前記第1の変換を行うことにより第2の情報を生成し、前記第2の単語の入力と前記第2の入力項目に対応付けられた第2の文章の入力とを共に受け付けると、前記第2の単語と、前記第2の文章に対して前記文章変換パラメータを用いて行う前記文章変換により得られる第3の中間情報との組みに対して前記第1の変換パラメータを用いて前記第1の変換を行うことにより第3の情報を生成する、処理を実行する。
1つの側面によれば、文章が入力されないことが出力に与える影響を抑制することができる。
生成装置の一例を示す図である。 入力情報および出力情報の一例を示す図である。 各情報およびパラメータの例を示す図である。 パラメータ生成方法の一例を示す図である。 中間情報の例を示す図である。 中間情報に変換するパラメータの生成方法の例を示す図である。 入力情報から中間情報への変換方法の例を示す図である。 他の入力情報に変換するパラメータの生成方法の第1の例を示す図である。 他の入力情報に変換するパラメータの生成方法の第2の例を示す図である。 入力情報から他の入力情報への変換方法の例を示す図である。 学習時における処理の一例を示すフローチャートである。 運用時における処理の一例を示すフローチャートである。 入力情報を示す行列式の例を示す図である。 実施例における各情報およびパラメータを示す図である。 欠損および外れ値を含む情報の例を示す図である。 生成装置のハードウェア構成の一例を示す図である。
以下、図面を参照して、実施形態について説明する。図1は、生成装置1の一例を示す図である。生成装置1は、コンピュータの一例である。生成装置1は、例えば、サーバ、パーソナルコンピュータ、またはタブレット端末等である。
生成装置1は、取得部11と第1生成部12と第2生成部13と判定部14と変換部15と第3生成部16と記憶部17とを含む。
取得部11は、第1の入力項目に対応付けて入力された第1の単語と、第2の入力項目に対応付けて入力された第1の文章と、第1の単語及び第1の文章の組みに応じた第1の情報と、を含む学習情報を取得する。
第1生成部12は、学習情報に基づき、第1の単語、及び第1の文章に応じた第1の文章とは異なる形式の第1の中間情報の組みを、第1の情報に応じた情報に変換する第1の変換パラメータを生成する。
第2生成部13は、第1の単語を、第1の中間情報に変換する第2の変換パラメータを生成する。第1生成部12および第2生成部13は、パラメータ生成部の一例である。
判定部14は、入力情報に欠損があるか判定する。なお、生成装置1は、入力情報が学習情報に存在しない情報を含む場合等に、すなわち、入力情報に外れ値がある場合にも、欠損がある場合と同様の処理を行うこととする。
変換部15は、第2の入力項目に対応付けられた文章の入力を受け付けずに、第1の入力項目に対応付けられた第2の単語の入力を受け付けると、第2の変換パラメータにより第2の単語を変換して、第2の中間情報を生成する。
第3生成部16は、第1の変換パラメータにより第2の単語及び第2の中間情報の組みを変換して、第2の情報を生成する。変換部15および第3生成部16は、情報生成部の一例である。
記憶部17は、生成された各種パラメータ、中間情報等を記憶する。
図2は、入力情報および出力情報の一例を示す図である。図2に示す入力情報および出力情報は、映画に関する情報である。図2に示す入力情報の入力項目は、映画のジャンル(x)、製作会社(x)、映画の概要(x)を含む。映画のジャンル(x)、製作会社(x)、は、単語で表現され、映画の概要(x)は、文章で表現される。出力情報の項目は、面白さ(y)を含む。なお、以下の説明において、各項目を、記号(x、x、x、y)を用いて表現することがある。
図3は、各情報およびパラメータの例を示す図である。図3に示すように、入力情報xは、パラメータwを用いた分類器により中間情報x’に変換される。同様に、入力情報xは、パラメータwを用いた分類器により中間情報x’に変換される。また、入力情報xは、パラメータwを用いた分類器により中間情報x’に変換される。また、中間情報x’、x’、x’は、パラメータwを用いた分類器によりyに変換される。
生成装置1は、学習情報としてx~x、yを取得した場合、学習情報に基づいて各パラメータ(w~w、w)を生成する。また、生成装置1は、未知の出力情報を生成するために入力情報x~xを取得した場合、入力情報x~xと生成した各パラメータ(w~w、w)とを用いてyを生成する。
図4は、パラメータ生成方法の一例を示す図である。図4に示す例では、学習情報として、x~x、yが与えられているとする。そして、第1生成部12は、x~x、yに基づいて、各パラメータ(w~w、w)を生成する。第1生成部12は、x~x、yと初期パラメータに基づいて、yの予測値pred_yを生成し、pred_yがyに近づくように、パラメータを調整する。そして、第1生成部12は、あるパラメータを用いて生成した予測値pred_yがyに最も近い場合、そのパラメータ(w~w、w)を記憶部17に記憶する。記憶部17に記憶されたパラメータ(w~w、w)は、運用時において、入力情報から未知の出力情報を生成するために用いられる。
図5は、中間情報の例を示す図である。図5に示す例では、中間情報x’は、行列で表される。xが文章である場合、中間情報x’は、例えば、文章の意味を示す。中間情報x’は、入力情報xより少ない次元数の行列であるとする。よって、生成装置1は、入力情報xが欠損している場合に、入力情報xを予測するよりも容易に中間情報x’を予測することができる。
図6は、中間情報に変換するパラメータの生成方法の例を示す図である。図6に示す例では、第2生成部13は、xを取得し、xから中間情報x’を生成するためのパラメータw’31を生成する。第2生成部13は、例えば、xと初期のパラメータw’31に基づいて、中間情報x’の予測値であるpred1_x’を生成する。そして、第2生成部13は、pred1_x’とx’との差が最も小さくなるようにw’31を生成する。x’は、第1生成部12が学習情報に基づいて生成したパラメータwと入力情報とxを用いて、第2生成部13が予め生成した値である。
第2生成部13は、同様に、xを取得し、xから中間情報x’を生成するためのパラメータw’32を生成する。
変換部15は、入力情報xが欠損している場合、w’31を用いて、xからx’を生成する。または、変換部15は、入力情報xが欠損している場合、w’32を用いて、xからx’を生成する。
図6におけるxまたはxは、第1の単語の一例である。xは、第1の文章の一例である。w’31またはw’32は、第2の変換パラメータの一例である。
図7は、入力情報から中間情報への変換方法の例を示す図である。運用時の入力情報にxが欠損している場合、変換部15は、第2生成部13が生成したw’31を用いて、xからx’_1を生成する。さらに、変換部15は、第2生成部13が生成したw’32を用いて、xからx’_2を生成する。
変換部15は、xから生成したx’_1とxから生成したx’_2とに基づいて、x’を生成する。変換部15は、例えば、x’_1とx’_2との平均値を、x’とする。変換部15は、x’_1とx’_2とのいずれかをx’としてもよい。
図7におけるx、xは、第2の単語の一例であり、x’は、第2の中間情報の一例である。x、x、x’から生成されるyは、第2の情報の一例である。
図8は、他の入力情報に変換するパラメータの生成方法の第1の例を示す図である。図8に示す例では、第2生成部13は、xを取得し、xからxを生成するためのパラメータw21を生成する。第2生成部13は、例えば、xと初期のパラメータw21に基づいて、xの予測値であるpred1_xを生成する。そして、第2生成部13は、pred1_xとxとの差が最も小さくなるようにw21を生成する。
第2生成部13は、同様に、xを取得し、xからxを生成するためのパラメータw23を生成する。
図9は、他の入力情報に変換するパラメータの生成方法の第2の例を示す図である。第2生成部13は、図8に示した方法と同様の方法により、各入力情報を他の入力情報に変換するためのパラメータを生成する。
例えば、第2生成部13は、xをxに変換するためのパラメータw21、およびxをxに変換するためのパラメータw31を生成する。また、第2生成部13は、xをxに変換するためのパラメータw12、およびxをxに変換するためのパラメータw32を生成する。また、第2生成部13は、xをxに変換するためのパラメータw13、およびxをxに変換するためのパラメータw23を生成する。
図10は、入力情報から他の入力情報への変換方法の例を示す図である。運用時の入力情報にxが欠損している場合、変換部15は、第1生成部12が生成したw21を用いて、xからx_1を生成する。さらに、変換部15は、第1生成部12が生成したw23を用いて、xからx_3を生成する。
変換部15は、xから生成したx_1とxから生成したx_3とに基づいて、xを生成する。変換部15は、例えば、x_1とx_3との平均値を、xとする。変換部15は、例えば、x_1とx_3とのいずれかをxとしてもよい。
図11は、学習時における処理の一例を示すフローチャートである。取得部11は、分類器のパラメータを生成するための学習情報を取得する(ステップS101)。学習情報は、例えば、第1の入力項目(例えば、ジャンル、製作会社等)に対応付けて入力された第1の単語と、第2の入力項目(例えば、概要を示す文章)に対応付けて入力された第1の文章を含む。また、学習情報は、第1の単語及び第1の文章の組みに応じた第1の情報(例えば、面白さ)を含む。
第1生成部12は、第1の単語及び第1の中間情報の組みを、第1の情報に応じた情報に変換するパラメータを生成する(ステップS102)。ステップS102で生成されるパラメータは、第1の変換パラメータの一例である。ステップS102で生成されるパラメータは、例えば、図3に示すW、W、およびWの組である。
第2生成部13は、取得部11が取得した入力情報の入力項目毎に繰り返し処理を開始する(ステップS103)。第2生成部13は、処理対象の項目の入力情報が文章であるか判定する(ステップS104)。
入力情報が文章である場合(ステップS104でYES)、第2生成部13は、入力情報を他の入力情報に応じた中間情報に変換するためのパラメータを生成する(ステップS105)。第2生成部13は、例えば、xを、xの中間情報であるx’に変換するためのパラメータW’31を生成する(図6参照)。ステップS105で生成されるパラメータは第2のパラメータの一例である。
入力情報が文章でない場合(ステップS104でNO)、第2生成部13は、入力情報を他の入力情報に変換するためのパラメータを生成する(ステップS106)。第2生成部13は、例えば、xを、xに変換するためのパラメータW21を生成する(図8参照)。
第2生成部13は、取得部11が取得した入力情報の全項目についてステップS104~S106の処理を実行した場合、繰り返し処理を終了する(ステップS107)。
図12は、運用時における処理の一例を示すフローチャートである。取得部11は、入力情報を受け付ける(ステップS201)。入力情報は、例えば、単語および文章である。
判定部14は、入力情報に欠損があるか判定する(ステップS202)。判定部14は入力情報のうちの一部または全部が不足している場合、入力情報が欠損していると判定する。
入力情報に欠損があると判定された場合(ステップS202でYES)、変換部15は、欠損した入力情報毎の繰り返し処理を開始する(ステップS203)。
変換部15は、欠損している情報が文章であるか判定する(ステップS204)。欠損している情報が文章である場合(ステップS204でYES)、変換部15は、第2生成部13が生成した第2のパラメータを用いて入力情報を変換して、欠損した入力情報の中間情報を生成する(ステップS205)。中間情報は、入力情報とは異なる形式であるとする。変換部15は、例えば、図7の例に示すように、w’31を用いて、xからx’_1を生成する。
欠損している情報が文章でない場合(ステップS204でNO)、変換部15は、第1生成部12が生成したパラメータを用いて、入力情報を欠損した入力情報に変換する(ステップS206)。変換部15は、繰り返し処理を終了する(ステップS207)。変換部15は、例えば、第1生成部12が生成したw21を用いて、xからx_1を生成する。
第3生成部16は、欠損していた情報が文章であるか判定する(ステップS208)。文章が欠損していた場合、ステップS205の処理で中間情報が生成されている。よって、ステップS208でYESの場合、第3生成部16は、第1のパラメータを用いて、入力情報および中間情報の組に応じた出力情報を生成する(ステップS209)。第3生成部16は、例えば、入力情報(x、x)と、中間情報x’と、学習時に得られたW、W、W、とに基づいて出力情報yを生成する。
ステップS202、またはステップS208でNOの場合、第3生成部16は、第1のパラメータを用いて入力情報に応じた出力情報を生成する(ステップS210)。第3生成部16は、例えば、入力情報(x、x、x)と、学習時に得られたW、W、W、Wとに基づいて出力情報yを生成する。
なお、生成装置1は、学習時に学習情報が欠損を含む場合、欠損を除く学習情報に対して、図11に示す処理を実行し、パラメータを生成する。これにより、生成装置1は、欠損がノイズとなり、学習精度が低下することを防ぐことができる。また、生成装置1は、学習情報の欠損について、図12のステップS203~S207と同様の処理を実行し、入力情報または中間情報を生成する。これにより、生成装置1は、学習情報の欠損を補うことができるので、学習情報の量を増やし、出力情報の精度を向上させることができる。
以上のように本実施形態の生成装置1は、学習時に、単語から文章に応じた中間情報を生成するためのパラメータを生成する。そして、生成装置1は、運用時に、文章が入力されない(欠損している)場合に、生成したパラメータを用いて中間情報を生成し、その中間情報を用いて出力情報を生成する。そのため、生成装置1は、文章のように予測が困難な情報が欠損していたとしても、中間情報を用いて出力情報を生成することができる。
また、中間情報は、入力情報より次元が少ない情報であるため、生成装置1は、他の情報を用いて容易に中間情報を予測することできる。
<実施例>
図13は、入力情報を示す行列式の例を示す図である。図13に示す入力情報は、図2に示す入力情報に対応している。図13(a)は、”action”を示す入力情報xを示す行列式である。図13(a)の行数は、映画ジャンルの数に対応している。また、2行目が”action”を示すとする。よって、入力情報xが”action”である場合、行列式の2行目の値が1となる。
図13(b)は、”Disney”を示す入力情報xを示す行列式である。図13(b)の行数は、製作会社の数に対応している。また、1行目が”Disney”を示すとする。よって、入力情報xが”Disney”である場合、行列式の1行目の値が1となる。
図13(c)は、”ダイナミックな映画”を示す入力情報xを示す行列式である。図13(c)の行数は、登録単語数に対応し、列数(次元数)は、入力情報内の単語数に対応している。また、2行目が”ダイナミック”を示し、4行目が”な”を示し、5行目が”映画”を示す。
なお、実際の運用において登録単語数は、例えば、約10万語であり、入力情報内の単語数は約10語であるとする。その場合、パターン数は、10万×10=100万パターンとなる。このパターン数は、入力情報が単語である場合のパターン数と比べると大きく異なるため、単語から文章を直接予測することは困難である。
しかし、中間情報x’は、図5に示すように1次元の情報である。すなわち、入力情報から中間情報x’に変換すると含まれる単語の順序は失われるが、単語の意味は失われない。
(1)学習時における第1のパラメータ生成処理の例
以下、学習時における第1生成部12によるパラメータ生成の例について説明する。図14は、実施例における各情報およびパラメータを示す図である。hは、中間情報x’、x’、x’の組を示す。h以外の各情報、パラメータは図3に示す例と同様である。
中間情報x’、x’、x’は、下記の式(1)~(3)のように表される。
Figure 0007133351000001
Figure 0007133351000002
Figure 0007133351000003
また、中間情報x’、x’、x’の組を示すhは、下記の式(4)のように表される。
Figure 0007133351000004
また、出力情報yの予測値であるpred_yは、下記の式(5)のように表される。
Figure 0007133351000005
なお、式(5)のsoftmax関数は、以下のように定義される。
softmax(x)=exp(x)/sum(exp(x))
第1生成部12は、pred_yとyとが近づくように、各パラメータ(w~w、w)を調整する。第1生成部12は、例えば、バックプロパゲーションを用いて学習する。pred_yとyとの差(loss)としては、SoftMaxCrossEntropy、またはMean Squared Error(MSE)等が用いられる。
運用時において、第3生成部16は、第1生成部12が生成した各パラメータ(w~w、w)を用いてpred_yを算出し、算出されたpred_yから予測した値を出力情報yとして出力する。例えば、式(5)のpred_yでは、1行目の0.9が最も大きく、1行目が”very good”を示す場合、第3生成部16は、yが”very good”であると予測する。
(2)学習時における第2のパラメータ生成処理の例
次に、学習時において、第2生成部13が中間情報x’を生成するためのパラメータを生成する方法の例を示す。以下の説明は、図6に示す処理の実施例に相当する。xに基づく中間情報x’の予測値であるpred1_x’は、下記の式(6)のように表される。
Figure 0007133351000006
また、pred1_x’とx’との差は、MSEを用いた場合、下記の式(7)のように表される。
Figure 0007133351000007
第2生成部13は、式(7)に示すlossが最も小さくなるようにパラメータw’31を生成する。同様に、第2生成部13は、xから中間情報x’を生成するためのパラメータw’32を生成する。
(3)運用時に文章(x)が欠損していた場合の出力情報生成処理の例
次に運用時において、文章(x)が欠損していた場合の出力情報生成処理を説明する。第3生成部16は、入力情報xと学習時に生成されたwとに基づいて、下記の式(8)のように中間情報x’を生成する。
Figure 0007133351000008
また、第3生成部16は、入力情報xと学習時に生成されたwとに基づいて、下記の式(9)のように中間情報x’を生成する。
Figure 0007133351000009
そして、変換部15は、学習時に第2生成部13が生成したw’31に基づいて、下記の式(10)のように、入力情報xをx’_1に変換する。
Figure 0007133351000010
そして、変換部15は、学習時に第2生成部13が生成したw’32に基づいて、下記の式の式(11)のように、入力情報xをx’_2に変換する。
Figure 0007133351000011
そして、変換部15は、下記の式(12)のように、xから生成したx’_1とxから生成したx’_2との平均値を、x’とする。
Figure 0007133351000012
中間情報の組hは、上記の式(10)~(12)のように生成されたx’、x’、x’を用いると、下記の式(13)のように表される。
Figure 0007133351000013
第3生成部16は、学習時に生成されたWと上記のように算出されたhとに基づいて下記の式(14)のように出力情報yを生成する。この出力情報yは、第2の情報の一例である。
Figure 0007133351000014
(4)運用時に単語(x)が欠損していた場合の出力情報生成処理の例
次に運用時において、単語(x)が欠損していた場合の出力情報生成処理を説明する。変換部15は、学習時に生成されたw21に基づいて、下記の式(15)のように入力情報xを入力情報xの予測値であるpred1_xに変換する。
Figure 0007133351000015
Figure 0007133351000016
また、変換部15は、学習時に生成されたw23に基づいて、下記の式(16)のように入力情報xを入力情報xの予測値であるpred3_xに変換する。
式(16)におけるW23sum(x)は、下記の式(17)のように計算される。
Figure 0007133351000017
変換部15は、上記のように生成されたpred1_x、およびpred3_xの平均値を計算することにより、下記の式(18)のようにxを生成する。
Figure 0007133351000018
上記xのうち、3行目の0.42が最も大きい値であるため、変換部15は、0.42を1に変換し、他の数字を0に変換する。変換部15は、下記の式(19)のようなxを得る。
Figure 0007133351000019
第3生成部16は、上記の計算で得られたxを含む入力情報(x、x、x)と、学習時に得られたW、W、W、Wとに基づいて出力情報yを生成する。
図15は、欠損および外れ値を含む情報の例を示す図である。図15(a)は、欠損を含む入力情報の例である。図15(a)のxは、全ての要素が0であるため、判定部14は、欠損があると判定する。
図15(b)は、外れ値を含む入力情報の例である。図15(b)のxおよびxの組は、学習時の入力情報に存在しなかった組み合わせであるとする。判定部14は、このような入力情報に含まれる値を、外れ値であるとみなしてもよい。
図15(c)は、外れ値を含む入力情報の例である。図15(c)のxは、学習時の入力情報に存在しなかった情報であるとする。判定部14は、このような入力情報に含まれる値を、外れ値であるとみなしてもよい。
次に、生成装置1のハードウェア構成の一例を説明する。図16は、生成装置1のハードウェア構成の一例を示す図である。図16の例に示すように、生成装置1において、バス100に、プロセッサ111とメモリ112と補助記憶装置113と通信インタフェース114と媒体接続部115と入力装置116と出力装置117とが接続される。
プロセッサ111は、メモリ112に展開されたプログラムを実行する。実行されるプログラムには、実施形態における処理を行う生成プログラムが適用されてもよい。
メモリ112は、例えば、Random Access Memory(RAM)である。補助記憶装置113は、種々の情報を記憶する記憶装置であり、例えばハードディスクドライブや半導体メモリ等が適用されてもよい。補助記憶装置113に実施形態の処理を行う生成プログラムが記憶されていてもよい。
通信インタフェース114は、Local Area Network(LAN)、Wide Area Network(WAN)等の通信ネットワークに接続され、通信に伴うデータ変換等を行う。
媒体接続部115は、可搬型記録媒体118が接続可能なインタフェースである。可搬型記録媒体118には、光学式ディスク(例えば、Compact Disc(CD)やDigital Versatile Disc(DVD))、半導体メモリ等が適用されてもよい。可搬型記録媒体118に実施形態の処理を行う生成プログラムが記録されていてもよい。
入力装置116は、例えば、キーボード、ポインティングデバイス等であり、ユーザからの指示及び情報等の入力を受け付ける。
出力装置117は、例えば、表示装置、プリンタ、スピーカ等であり、ユーザへの問い合わせ又は指示、及び処理結果等を出力する。生成装置1は、出力装置117を用いて、生成したパラメータ、および出力情報等を出力(表示または印刷等)してもよい。
図1に示す記憶部17は、メモリ112、補助記憶装置113または可搬型記録媒体118等により実現されてもよい。図1に示す取得部11、第1生成部12、第2生成部13、判定部14、変換部15、および第3生成部16は、メモリ112に展開された生成プログラムをプロセッサ111が実行することにより実現されてもよい。
メモリ112、補助記憶装置113および可搬型記録媒体118は、コンピュータが読み取り可能であって非一時的な有形の記憶媒体であり、信号搬送波のような一時的な媒体ではない。
<その他>
本実施形態は、以上に述べた実施の形態に限定されるものではなく、本実施形態の要旨を逸脱しない範囲内で様々な変更、追加、省略が適用可能である。
1 生成装置
11 取得部
12 第1生成部
13 第2生成部
14 判定部
15 変換部
16 第3生成部
17 記憶部
100 バス
111 プロセッサ
112 メモリ
113 補助記憶装置
114 通信インタフェース
115 媒体接続部
116 入力装置
117 出力装置
118 可搬型記録媒体

Claims (5)

  1. コンピュータが、
    第1の入力項目に対応付けて入力された第1の単語と、第2の入力項目に対応付けて入力された第1の文章と、前記第1の単語及び前記第1の文章の組みに応じた第1の情報と、を含む学習情報を取得し、
    前記学習情報に基づき、前記第1の単語と、前記第1の文章に対して文章変換パラメータを用いて行う文章変換により得られる第1の中間情報の組みに対して第1の変換パラメータを用いて行う第1の変換により得られる情報が前記第1の情報に最も近くなるように前記文章変換パラメータ及び前記第1の変換パラメータを調整することによって、前記文章変換パラメータ及び前記第1の変換パラメータを生成する共に、前記第1の単語に対して第2の変換パラメータを用いて行う第2の変換により得られる情報と前記第1の中間情報との差が最も小さくなるように前記第2の変換パラメータ生成し、
    前記第2の入力項目に対応付けられた文章の入力を受け付けずに、前記第1の入力項目に対応付けられた第2の単語の入力を受け付けると、前記第2の単語と、前記第2の単語に対して前記第2の変換パラメータを用いて行う前記第2の変換により得られる第2の中間情報との組みに対して前記第1の変換パラメータを用いて前記第1の変換を行うことにより第2の情報を生成し、
    前記第2の単語の入力と前記第2の入力項目に対応付けられた第2の文章の入力とを共に受け付けると、前記第2の単語と、前記第2の文章に対して前記文章変換パラメータを用いて行う前記文章変換により得られる第3の中間情報との組みに対して前記第1の変換パラメータを用いて前記第1の変換を行うことにより第3の情報を生成する、
    処理を実行することを特徴とする生成方法。
  2. 前記第1の中間情報は、前記第1の文章の意味を示す、前記第1の文章とは異なる形式の情報である
    ことを特徴とする請求項1記載の生成方法。
  3. 前記第1の中間情報を示す行列の次元数は、前記第1の文章を示す行列の次元数より少ない
    ことを特徴とする請求項1または2記載の生成方法。
  4. 第1の入力項目に対応付けて入力された第1の単語と、第2の入力項目に対応付けて入力された第1の文章と、前記第1の単語及び前記第1の文章の組みに応じた第1の情報と、を含む学習情報を取得し、
    前記学習情報に基づき、前記第1の単語と、前記第1の文章に対して文章変換パラメータを用いて行う文章変換により得られる第1の中間情報の組みに対して第1の変換パラメータを用いて行う第1の変換により得られる情報が前記第1の情報に最も近くなるように前記文章変換パラメータ及び前記第1の変換パラメータを調整することによって、前記文章変換パラメータ及び前記第1の変換パラメータを生成する共に、前記第1の単語に対して第2の変換パラメータを用いて行う第2の変換により得られる情報と前記第1の中間情報との差が最も小さくなるように前記第2の変換パラメータ生成し、
    前記第2の入力項目に対応付けられた文章の入力を受け付けずに、前記第1の入力項目に対応付けられた第2の単語の入力を受け付けると、前記第2の単語と、前記第2の単語に対して前記第2の変換パラメータを用いて行う前記第2の変換により得られる第2の中間情報との組みに対して前記第1の変換パラメータを用いて前記第1の変換を行うことにより第2の情報を生成し、
    前記第2の単語の入力と前記第2の入力項目に対応付けられた第2の文章の入力とを共に受け付けると、前記第2の単語と、前記第2の文章に対して前記文章変換パラメータを用いて行う前記文章変換により得られる第3の中間情報との組みに対して前記第1の変換パラメータを用いて前記第1の変換を行うことにより第3の情報を生成する、
    処理をコンピュータに実行させるための生成プログラム。
  5. 第1の入力項目に対応付けて入力された第1の単語と、第2の入力項目に対応付けて入力された第1の文章と、前記第1の単語及び前記第1の文章の組みに応じた第1の情報と、を含む学習情報を取得する取得部と、
    前記学習情報に基づき、前記第1の単語と、及び前記第1の文章に対して文章変換パラメータを用いて行う文章変換により得られる第1の中間情報の組みに対して第1の変換パラメータを用いて行う第1の変換により得られる情報が前記第1の情報に最も近くなるように前記文章変換パラメータ及び前記第1の変換パラメータを調整することによって、前記文章変換パラメータ及び前記第1の変換パラメータを生成する共に、前記第1の単語に対して第2の変換パラメータを用いて行う第2の変換により得られる情報と前記第1の中間情報との差が最も小さくなるように前記第2の変換パラメータ生成するパラメータ生成部と、
    前記第2の入力項目に対応付けられた文章の入力を受け付けずに、前記第1の入力項目に対応付けられた第2の単語の入力を受け付けると、前記第2の単語と、前記第2の単語に対して前記第2の変換パラメータを用いて行う前記第2の変換により得られる第2の中間情報との組みに対して前記第1の変換パラメータを用いて前記第1の変換を行うことにより第2の情報を生成し、前記第2の単語の入力と前記第2の入力項目に対応付けられた第2の文章の入力とを共に受け付けると、前記第2の単語と、前記第2の文章に対して前記文章変換パラメータを用いて行う前記文章変換により得られる第3の中間情報との組みに対して前記第1の変換パラメータを用いて前記第1の変換を行うことにより第3の情報を生成する情報生成部と、
    を備えることを特徴とする生成装置。
JP2018094189A 2018-05-16 2018-05-16 生成方法、生成プログラムおよび生成装置 Active JP7133351B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018094189A JP7133351B2 (ja) 2018-05-16 2018-05-16 生成方法、生成プログラムおよび生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018094189A JP7133351B2 (ja) 2018-05-16 2018-05-16 生成方法、生成プログラムおよび生成装置

Publications (2)

Publication Number Publication Date
JP2019200554A JP2019200554A (ja) 2019-11-21
JP7133351B2 true JP7133351B2 (ja) 2022-09-08

Family

ID=68613148

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018094189A Active JP7133351B2 (ja) 2018-05-16 2018-05-16 生成方法、生成プログラムおよび生成装置

Country Status (1)

Country Link
JP (1) JP7133351B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014199920A1 (ja) 2013-06-12 2014-12-18 日本電気株式会社 予測関数作成装置、予測関数作成方法、及びコンピュータ読み取り可能な記録媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014199920A1 (ja) 2013-06-12 2014-12-18 日本電気株式会社 予測関数作成装置、予測関数作成方法、及びコンピュータ読み取り可能な記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田中 恒平、小林 亜樹,深層学習を用いた情報推薦のための欠損値補完手法,第8回データ工学と情報マネジメントに関するフォーラム (第14回日本データベース学会年次大会) [online],日本,電子情報通信学会データ工学研究専門委員会 日本データベース学会 情報処理学会データベースシステム研究会,2016年03月02日,pp.1-6

Also Published As

Publication number Publication date
JP2019200554A (ja) 2019-11-21

Similar Documents

Publication Publication Date Title
JP5755823B1 (ja) 類似度算出システム、類似度算出方法およびプログラム
JP2022074880A (ja) パラメータ最適化装置、方法及びシステム
JP2009152820A (ja) 学習装置および方法、画像処理装置および方法、並びにプログラム
WO2019138897A1 (ja) 学習装置および方法、並びにプログラム
JP2020505672A (ja) データ・シーケンスに基づく予測モデルの双方向学習のための学習装置、方法及びコンピュータ・プログラム
US9318106B2 (en) Joint sound model generation techniques
JP7133351B2 (ja) 生成方法、生成プログラムおよび生成装置
JP7211103B2 (ja) 系列ラベリング装置、系列ラベリング方法、およびプログラム
JP2011154554A (ja) 欠損値予測装置、欠損値予測方法及び欠損値予測プログラム
JP5370256B2 (ja) 解析支援プログラム、解析支援装置および解析支援方法
JP6964481B2 (ja) 学習装置、プログラムおよび学習方法
JP2019021218A (ja) 学習装置、プログラムパラメータ、学習方法およびモデル
JP2010204784A (ja) 外乱制御装置、外乱制御方法、外乱制御プログラムおよび記録媒体
JP6518142B2 (ja) 言語モデル生成装置およびそのプログラム
JP2018156619A (ja) 連続最適化問題の大域的探索装置及びプログラム
JP2022185799A (ja) 情報処理プログラム、情報処理方法および情報処理装置
JP2018049583A (ja) シミュレーション方法、コンピュータプログラム、及びシミュレーション装置
WO2015040860A1 (ja) 分類辞書生成装置、分類辞書生成方法及び記録媒体
JP6963988B2 (ja) 提供装置、提供方法および提供プログラム
JP2021114117A (ja) 情報処理プログラム、情報処理方法および情報処理装置
Forget et al. Normalizing flows for thermal scattering sampling
JP2020129297A (ja) 情報処理装置、情報処理方法、及びプログラム
WO2021106961A1 (ja) 画像生成装置
JP4042678B2 (ja) 単語ベクトル推定方法及び装置及び単語ベクトル推定プログラム及び単語ベクトル推定プログラムを記録したコンピュータ読み取り可能な記録媒体
JP7384285B2 (ja) ニューラルネットワーク処理装置、方法、および、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220405

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20220405

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220816

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220829

R150 Certificate of patent or registration of utility model

Ref document number: 7133351

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150