JP2019087157A - 単語ベクトル変換装置、方法、及びプログラム - Google Patents

単語ベクトル変換装置、方法、及びプログラム Download PDF

Info

Publication number
JP2019087157A
JP2019087157A JP2017216644A JP2017216644A JP2019087157A JP 2019087157 A JP2019087157 A JP 2019087157A JP 2017216644 A JP2017216644 A JP 2017216644A JP 2017216644 A JP2017216644 A JP 2017216644A JP 2019087157 A JP2019087157 A JP 2019087157A
Authority
JP
Japan
Prior art keywords
word
vector
distance
dictionary
concept
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017216644A
Other languages
English (en)
Other versions
JP6698061B2 (ja
Inventor
克人 別所
Katsuto Bessho
克人 別所
久子 浅野
Hisako Asano
久子 浅野
準二 富田
Junji Tomita
準二 富田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017216644A priority Critical patent/JP6698061B2/ja
Publication of JP2019087157A publication Critical patent/JP2019087157A/ja
Application granted granted Critical
Publication of JP6698061B2 publication Critical patent/JP6698061B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

【課題】任意の単語対の距離が適切となるように全単語を配置することを目的とする。【解決手段】単語と該単語の概念を表すベクトルとの対の集合である概念ベース22と、意味的に遠いまたは近い単語対の集合である辞書24を入力とし、変換手段30が、概念ベース22中の任意の単語A、Bの対Cに対し、Cが辞書24中にある場合、Aの変換後のベクトルとBの変換後のベクトルの距離d’と、Aの概念ベース22中のベクトルとBの概念ベース22中のベクトルの距離dに値αを加算ないし乗算した値とが可能な限り等しくなり、かつ、Cが辞書24中にない場合、d’とdとが可能な限り等しくなるように、概念ベース22中の任意の単語のベクトルを変換し、変換後概念ベース32を生成する。【選択図】図1

Description

本発明は、単語と該単語の概念を表すベクトルとの対の集合が与えられたとき、辞書中にある意味的に遠い単語対の各単語のベクトルの距離はこれまでより大きくなり、辞書中にある意味的に近い単語対の各単語のベクトルの距離はこれまでより小さくなり、かつ、辞書中にない単語対の各単語のベクトルの距離は可能な限り変化がないように、単語のベクトルを変換する単語ベクトル変換装置、方法、及びプログラムに関する。
単語と該単語の概念を表すベクトルとの対の集合である概念ベースとして、非特許文献1や非特許文献2で述べられている手法がある。
これらの手法はいずれもコーパスを入力として単語のベクトルを生成するものであり、意味的に近い単語のベクトルは近くなるような配置となる。生成アルゴリズムは、各単語の概念は、コーパスにおける該単語の周辺単語の出現パターン(周辺分布)によって推定できるという分布仮説をベースにしている。
これらの手法により生成した概念ベースを用いて、テキスト間の類似性を表す距離を算出することができる。任意のテキストに対し、該テキスト中の単語のベクトルを合成する(例えば単語ベクトルの重心をとる)ことにより、該テキストのベクトルを生成する。テキスト間の距離を、対応するテキストベクトル間の距離として算出する。
別所克人, 内山俊郎, 内山匡, 片岡良治, 奥雅博,"単語・意味属性間共起に基づくコーパス概念ベースの生成方式,"情報処理学会論文誌, Vol.49, No.12, pp.3997-4006, Dec. 2008. Tomas Mikolov, Kai Chen, Greg Corrado, Jeffrey Dean,"Efficient estimation of word representations in vector space,"ICLR, 2013.
上記従来手法で生成した概念ベースでは、以下に述べる課題がある。
課題1)
反義語の対(例:良い、悪い)は、各単語の周辺分布が似ているため、各単語のベクトルが近くなるという課題がある。このため、テキストベクトル間の距離関係が不適切なものになる。
例えば単語「良い」に対し、その反義語「悪い」の方が、同義語「宜しい」よりも、ベクトル間の距離が小さくなる。このため、以下のテキストAに対し、テキストCの方がテキストBよりも意味が近いにも関わらず、テキストBの方がテキストCよりもベクトル間の距離が小さくなる。
テキストA:この考えは良い。
テキストB:この考えは悪い。
テキストC:この考えは宜しい。
課題2)
単語の対について、一方の単語が他方の単語の上位語でも下位語でも同義語でもなく、共通の上位語があるとき、該対を同位語の対と呼ぶ。単語の対「野球、サッカー」は、一方の単語が他方の単語の上位語でも下位語でも同義語でもなく、共通の上位語「スポーツ」をもつため、同位語の対となる。
同位語の対(例:野球、サッカー)は、各単語の周辺分布が似ているため、各単語のベクトルが近くなるという課題がある。このため、テキストベクトル間の距離関係が不適切なものになる。
例えば単語「野球」に対し、その同位語「サッカー」の方が、下位語「草野球」よりも、ベクトル間の距離が小さくなる。このため、以下のテキストAに対し、テキストCの方がテキストBよりも意味が近いにも関わらず、テキストBの方がテキストCよりもベクトル間の距離が小さくなる。
テキストA:野球を見る。
テキストB:サッカーを見る。
テキストC:草野球を見る。
課題3)
同義語の対(例:野球、ベースボール)は、場合によっては、各単語のベクトルが遠くなるという課題がある。このため、テキストベクトル間の距離関係が不適切なものになる。
例えば単語「野球」に対し、その同義語「ベースボール」の方が、下位語「草野球」よりも、ベクトル間の距離が大きくなる。このため、以下のテキストAに対し、テキストBの方がテキストCよりも意味が近いにも関わらず、テキストCの方がテキストBよりもベクトル間の距離が小さくなる。
テキストA:野球を見る。
テキストB:ベースボールを見る。
テキストC:草野球を見る。
本発明は、上記課題を解決するためのものであり、一旦生成した概念ベースに対し、各単語のベクトルを変換することにより、単語のベクトルの配置が、単語間の意味的な近さを反映したものとなるようにするものである。具体的には、辞書中にある反義語や同位語といった意味的に遠い単語対の各単語のベクトルの距離はこれまでより大きくなり、辞書中にある同義語といった意味的に近い単語対の各単語のベクトルの距離はこれまでより小さくなるようにする。ただ、それだけを行うと、辞書中にない単語対については、ベクトルの距離が不当に大きくなったり小さくなったりし、配置が適切なものでなくなる。このため、辞書中にある単語対の距離を適切なものにするのと同時に、辞書中にない単語対の距離は可能な限り変化がないように、各単語のベクトルを変換する必要がある。本発明は、任意の単語対の距離が適切となるように全単語を配置することを目的とする。
上記目的を達成するために、本発明に係る単語ベクトル変換装置は、単語と該単語の概念を表すベクトルとの対の集合である概念ベースと、意味的に遠いまたは近い単語対の集合である辞書を入力とし、前記概念ベース中の任意の単語A、Bの対Cに対し、Cが前記辞書中にある場合、Aの変換後のベクトルとBの変換後のベクトルの距離d’と、Aの前記概念ベース中のベクトルとBの前記概念ベース中のベクトルの距離dに値αを加算ないし乗算した値とが可能な限り等しくなり、かつ、Cが前記辞書中にない場合、d’とdとが可能な限り等しくなるように、前記概念ベース中の任意の単語のベクトルを変換する変換手段を備えることを特徴とする。
また、本発明に係る単語ベクトル変換方法は、単語と該単語の概念を表すベクトルとの対の集合である概念ベースと、意味的に遠いまたは近い単語対の集合である辞書を入力とし、変換手段が、前記概念ベース中の任意の単語A、Bの対Cに対し、Cが前記辞書中にある場合、Aの変換後のベクトルとBの変換後のベクトルの距離d’と、Aの前記概念ベース中のベクトルとBの前記概念ベース中のベクトルの距離dに値αを加算ないし乗算した値とが可能な限り等しくなり、かつ、Cが前記辞書中にない場合、d’とdとが可能な限り等しくなるように、前記概念ベース中の任意の単語のベクトルを変換するステップを備えることを特徴とする。
本発明に係るプログラムは、コンピュータを、第1の発明に係る単語ベクトル変換装置の処理部として機能させるためのプログラムである。
本発明において、辞書中にある反義語や同位語といった意味的に遠い単語対に対しては、α>0としてdに加算するか、α>1としてdに乗算することにより、変換後のベクトル間距離d’はdより大きくなり、辞書中にある同義語といった意味的に近い単語対に対しては、α<0としてdに加算するか、α<1としてdに乗算することにより、ベクトル間距離d’はdより小さくなる。辞書中にない単語対に対しては、変換後のベクトル間距離d’はdとあまり変化がないようになる。このようにして任意の単語対の距離が適切となっている全単語の配置を実現した変換後概念ベースを生成できる。
テキスト間距離算出に、変換後概念ベースを用いることにより、テキストベクトル間の距離関係が適切なものに改善される。
課題1)の例では、単語「良い」に対し、その反義語「悪い」の方が、同義語「宜しい」よりも、ベクトル間の距離が大きくなるため、テキストAに対し、テキストCの方がテキストBよりもベクトル間の距離が小さくなる。
課題2)の例では、単語「野球」に対し、その同位語「サッカー」の方が、下位語「草野球」よりも、ベクトル間の距離が大きくなるため、テキストAに対し、テキストCの方がテキストBよりもベクトル間の距離が小さくなる。
課題3)の例では、単語「野球」に対し、その同義語「ベースボール」の方が、下位語「草野球」よりも、ベクトル間の距離が小さくなるため、テキストAに対し、テキストBの方がテキストCよりもベクトル間の距離が小さくなる。
本発明の実施の形態に係る単語ベクトル変換装置100の構成を示すブロック図である。 概念ベース22の一例を示す図である。 辞書24の反義語に関するレコード群の一例である。 辞書24の同位語に関するレコード群の一例である。 辞書24の同義語に関するレコード群の一例である。 本発明の実施の形態に係る単語ベクトル変換装置100における変換処理ルーチンの一例を示すフローチャートである。
以下、図面とともに本発明の実施の形態を説明する。
<本発明の実施の形態に係る単語ベクトル変換装置の構成>
図1は、本発明の請求項1の単語ベクトル変換装置の構成例である。
単語ベクトル変換装置100は、単語と該単語の概念を表すベクトルとの対の集合である概念ベース22と、意味的に遠いまたは近い単語対の集合である辞書24を入力とし、概念ベース22中の任意の単語A、Bの対Cに対し、Cが辞書24中にある場合、Aの変換後のベクトルとBの変換後のベクトルの距離d’と、Aの概念ベース22中のベクトルとBの概念ベース22中のベクトルの距離dに値αを加算ないし乗算した値とが可能な限り等しくなり、かつ、Cが辞書24中にない場合、d’とdとが可能な限り等しくなるように、概念ベース22中の任意の単語のベクトルを変換し、変換後概念ベース32を生成する変換手段30を備える。
図2は、概念ベース22の例である。概念ベース22は、例えば、非特許文献1や非特許文献2の手法によって生成する。
概念ベース22中の単語に重複するものはない。
各単語のベクトルはn次元ベクトルであり、意味的に近い単語のベクトルは、近くに配置されている。
概念ベース22には名詞、動詞、形容詞等の内容語のみを登録するというようにしてもよい。概念ベース22において単語を終止形で登録し、概念ベース22を検索する際は、単語の終止形で検索するというようにしてもよい。
辞書24の例として、レコード群が反義語、同位語、同義語それぞれに関するレコード群に分けられているように構成することができる。図3は反義語に関するレコード群の例、図4は同位語に関するレコード群の例、図5は同義語に関するレコード群の例である。図3の各レコードは、基点語とその基点語にとっての反義語のリストからなる。基点語とその反義語リスト中の各反義語との対が、反義語の単語対となる。図4、図5についても同様である。反義語レコード群及び同位語レコード群における単語対は、意味的に遠い単語対である。同義語レコード群における単語対は、意味的に近い単語対である。
辞書24は上記例に限らず、基点語とその基点語にとっての意味的に遠い単語のリストからなるレコードの群と、基点語とその基点語にとっての意味的に近い単語のリストからなるレコードの群から構成されているようにとることもできる。この場合、基点語とその意味的に遠い単語のリスト中の各単語との対が、意味的に遠い単語対となり、基点語とその意味的に近い単語のリスト中の各単語との対が、意味的に近い単語対となる。
辞書24は通常、辞書24の同種(意味的に遠い、意味的に近い等)のレコード群において、単語リスト中に単語Bがある基点語Aのレコードがあれば、単語リスト中に単語Aがある基点語Bのレコードがあるような構成である。
変換手段30の変換処理を、以下のように定式化する。
概念ベース22中の単語のリストを、

とする。
の概念ベース22中のベクトルを

とし、Wの変換後概念ベース32中のベクトルを

とする。
τpqは定数であり、ωpqは変数である。
概念ベース22中の単語対W,Wに対し、ω間の距離d'{i,j}は以下のように表される。
概念ベース22中の単語対W,Wに対し、τ間の距離d{i,j}は以下のようにして算出される。
距離d{i,j}に加算ないし乗算するαは、一般に{i,j}に依存し、α{i,j}と表す。
変換手段30では、以下の目的関数Fを最小化する(ωpq)を求める。
ここでT{i,j}は、以下である。
α{i,j}を距離d{i,j}に加算するか乗算するかも、{i,j}に依存して定める。
α{i,j}は下記のように設定することとする。
α{i,j}を距離d{i,j}に加算する場合、α{i,j}は、単語対W,Wが辞書24中の意味的に遠い単語対の場合、α{i,j}≧0として定めておき、単語対W,Wが辞書24中の意味的に近い単語対の場合、α{i,j}≦0として定めておき(但し、d{i,j}+α{i,j}≧0となるように定める)、単語対W,Wが辞書24中にない場合、α{i,j}=0として定めておく。
α{i,j}を距離d{i,j}に乗算する場合、α{i,j}は、単語対W,Wが辞書24中の意味的に遠い単語対の場合、α{i,j}≧1として定めておき、単語対W,Wが辞書24中の意味的に近い単語対の場合、0≦α{i,j}≦1として定めておき、単語対W,Wが辞書24中にない場合、α{i,j}=1として定めておく。
単語対W,Wが辞書24中の意味的に遠い単語対の場合、α{i,j}を{i,j}に依存しない定数としてもよいが、d{i,j}が大きい程、α{i,j}を小さくして、元々の距離が大きい単語対に対しては、変換後の距離が過度に大きくならないようにしてもよい。
単語対W,Wが辞書24中の意味的に近い単語対の場合、α{i,j}を{i,j}に依存しない定数としてもよいが、d{i,j}が小さい程、α{i,j}を大きくして、元々の距離が小さい単語対に対しては、変換後の距離が過度に小さくならないようにしてもよい。
目的関数Fを最小化する(ωpq)を、例えば確率的勾配降下法を用いて求める。(別の最適化手法でもよい。)確率的勾配降下法は以下のアルゴリズムとなる。
上記アルゴリズムの(m,n)行列(ωpq)の更新部分を、例えばAdagradにより以下のようにして行う。
上記アルゴリズム開始前に、行列(ωpq)行列の初期値を例えば、

として設定する。
(m,n)行列(rpq)をとる。上記アルゴリズム開始前に、行列(rpq)の初期値を例えば、

として設定する。
上記アルゴリズムの(m,n)行列(ωpq)の更新部分において、任意の

に対し、以下のように更新する。
上記更新を更新(1)と呼ぶことにする。

の計算は以下のようにする。
1)p=iかつd'{i,j}≠0のとき
2)p=jかつd'{i,j}≠0のとき
3)1),2)以外のとき
<本発明の実施の形態に係る単語ベクトル変換装置の作用>
図6は、変換手段30の変換処理ルーチンの一例を示す図である。以下、図6の各ステップの処理内容を述べる。
S1)
S2〜S6の処理からなるターンを実行するか否かを判断する。
所定の回数を実行済みの場合は、終了と判断して、変換処理ルーチンを終了する。
所定の回数を実行済みでない場合は、実行すると判断してS2に進む。
所定の回数を実行済みでない場合でも、現時点の行列(ωpq)と、一つ前のS1時点の行列(ωpq)とが同じ(すなわち収束している)場合、終了と判断して、変換処理ルーチンを終了してもよい。
変換処理ルーチンを終了する場合、概念ベース22中の各単語Wとその単語ベクトルωとの対の集合を、変換後概念ベース32として出力する。
S2)
概念ベース22中の単語のリストを、W,W,・・・,Wとする。W,W,・・・,Wの中で、S2で未選定の単語から一つ選定したWを処理対象の単語Xとし、S3に進む。未選定の単語がなければ、本ターンを終了し、S1に進む。
S3)
辞書24中のWが基点語であるレコード中の、対応する単語リストの中で、概念ベース22中にあり、かつ、S3で未選定であり、かつ、単語Wとの(集合としての)対が、本ターンのS4、S6においてこれまで処理をした(集合としての)対でないことを満たす単語から一つ選定したWを処理対象の単語Yとし、S4に進む。そのような単語がなければ、S5に進む。
S4)
{i,j}(jはS3で選定したもの)に対し、上記更新(1)を行う。S3に進む。
S5)
,W,・・・,Wの中で、Wでなく、かつ、S3で選定したいずれのWでもなく、かつ、S5で未選定であり、かつ、単語Wとの(集合としての)対が、本ターンのS4、S6においてこれまで処理をした(集合としての)対でないことを満たす単語から一つ選定したWを処理対象の単語Zとし、S6に進む。そのような単語がなければ、S2に進む。
S6の計算量を低減するために、Wを除くW,W,・・・,Wを、Wとの距離の昇順にソートし、その上位G個の中から、(場合によってはソートした順序で)、上記条件を満たす単語を選定するというようにしてもよい。あるいは、Wを除くW,W,・・・,Wの中で、Wとの距離が、ある閾値以下(あるいは未満)であるものの中から、(場合によっては距離の昇順にソートした順序で)、上記条件を満たす単語を選定するというようにしてもよい。
S6)
{i,j}(jはS5で選定したもの)に対し、上記更新(1)を行う。S5に進む。
上記変換処理ルーチンでは、単語対W,Wの距離d{i,j}の計算を、S4やS6の中で行っている(S5で計算量低減の処理をする場合は、S5の中で行っている)。上記変換処理ルーチンを行う前に、S2で選定する各Wに対し、S3やS5で選定することになるWと距離d{i,j}の組のリストをあらかじめ求めておき、変換処理ルーチンでは、そのリストの順序に従ってS3やS5における選定をし、距離d{i,j}の計算はせず、既に求めた距離d{i,j}を参照するという構成にしてもよい。
これまで述べた処理をプログラムとして構築し、当該プログラムを通信回線または記録媒体からインストールし、CPU等の手段で実施することが可能である。
なお、本発明は、上記の実施例に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
本発明は、単語と該単語の概念を表すベクトルとの対の集合が与えられたとき、任意の単語対の距離が適切となるように単語のベクトルを変換する単語ベクトル変換技術に適用可能である。
22 概念ベース
24 辞書
30 変換手段
32 変換後概念ベース
100 単語ベクトル変換装置

Claims (3)

  1. 単語と該単語の概念を表すベクトルとの対の集合である概念ベースと、
    意味的に遠いまたは近い単語対の集合である辞書を入力とし、
    前記概念ベース中の任意の単語A、Bの対Cに対し、Cが前記辞書中にある場合、Aの変換後のベクトルとBの変換後のベクトルの距離d’と、Aの前記概念ベース中のベクトルとBの前記概念ベース中のベクトルの距離dに値αを加算ないし乗算した値とが可能な限り等しくなり、かつ、Cが前記辞書中にない場合、d’とdとが可能な限り等しくなるように、前記概念ベース中の任意の単語のベクトルを変換する変換手段を備えることを特徴とする単語ベクトル変換装置。
  2. 単語と該単語の概念を表すベクトルとの対の集合である概念ベースと、
    意味的に遠いまたは近い単語対の集合である辞書を入力とし、
    変換手段が、前記概念ベース中の任意の単語A、Bの対Cに対し、Cが前記辞書中にある場合、Aの変換後のベクトルとBの変換後のベクトルの距離d’と、Aの前記概念ベース中のベクトルとBの前記概念ベース中のベクトルの距離dに値αを加算ないし乗算した値とが可能な限り等しくなり、かつ、Cが前記辞書中にない場合、d’とdとが可能な限り等しくなるように、前記概念ベース中の任意の単語のベクトルを変換するステップを備えることを特徴とする単語ベクトル変換方法。
  3. コンピュータを、請求項1に記載の単語ベクトル変換装置の処理部として機能させるためのプログラム。
JP2017216644A 2017-11-09 2017-11-09 単語ベクトル変換装置、方法、及びプログラム Active JP6698061B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017216644A JP6698061B2 (ja) 2017-11-09 2017-11-09 単語ベクトル変換装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017216644A JP6698061B2 (ja) 2017-11-09 2017-11-09 単語ベクトル変換装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2019087157A true JP2019087157A (ja) 2019-06-06
JP6698061B2 JP6698061B2 (ja) 2020-05-27

Family

ID=66763134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017216644A Active JP6698061B2 (ja) 2017-11-09 2017-11-09 単語ベクトル変換装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6698061B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021009538A (ja) * 2019-07-01 2021-01-28 株式会社野村総合研究所 自然言語処理装置および自然言語処理プログラム
WO2023148948A1 (ja) * 2022-02-07 2023-08-10 三菱電機株式会社 情報処理装置、更新方法、及び更新プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021009538A (ja) * 2019-07-01 2021-01-28 株式会社野村総合研究所 自然言語処理装置および自然言語処理プログラム
WO2023148948A1 (ja) * 2022-02-07 2023-08-10 三菱電機株式会社 情報処理装置、更新方法、及び更新プログラム

Also Published As

Publication number Publication date
JP6698061B2 (ja) 2020-05-27

Similar Documents

Publication Publication Date Title
WO2020182122A1 (zh) 用于生成文本匹配模型的方法和装置
JP7421604B2 (ja) モデル事前訓練方法および装置、テキスト生成方法および装置、電子機器、記憶媒体並びにコンピュータプログラム
US10832011B2 (en) Question answering system using multilingual information sources
JP2019504413A (ja) 絵文字を提案するためのシステムおよび方法
JP2021152963A (ja) 語義特徴の生成方法、モデルトレーニング方法、装置、機器、媒体及びプログラム
JP5710581B2 (ja) 質問応答装置、方法、及びプログラム
JP2022050379A (ja) 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム
CN109241243B (zh) 候选文档排序方法及装置
CN108846138B (zh) 一种融合答案信息的问题分类模型构建方法、装置和介质
US8521739B1 (en) Creation of inferred queries for use as query suggestions
US11481560B2 (en) Information processing device, information processing method, and program
WO2019198618A1 (ja) 単語ベクトル変更装置、方法、及びプログラム
US20150205860A1 (en) Information retrieval device, information retrieval method, and information retrieval program
Tiwari et al. Ensemble approach for twitter sentiment analysis
US11308146B2 (en) Content fragments aligned to content criteria
CN112905768A (zh) 一种数据交互方法、装置及存储介质
WO2023033942A1 (en) Efficient index lookup using language-agnostic vectors and context vectors
JP2019087157A (ja) 単語ベクトル変換装置、方法、及びプログラム
CN117076636A (zh) 一种智能客服的信息查询方法、系统和设备
Gupta et al. Text analysis and information retrieval of text data
US20230244934A1 (en) Augmenting machine learning language models using search engine results
JP6232358B2 (ja) 次発話候補ランキング装置、方法、及びプログラム
JP5284761B2 (ja) 文書検索装置及び方法及びプログラム及びプログラムを記録した記録媒体
JP7364065B2 (ja) 推定装置、学習装置、推定方法、学習方法及びプログラム
CN115203378A (zh) 基于预训练语言模型的检索增强方法、系统及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191126

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200421

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200427

R150 Certificate of patent or registration of utility model

Ref document number: 6698061

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150