JP2020064621A - 敵対的生成ネットワークを用いるユーザフレンドリな説明生成 - Google Patents

敵対的生成ネットワークを用いるユーザフレンドリな説明生成 Download PDF

Info

Publication number
JP2020064621A
JP2020064621A JP2019174282A JP2019174282A JP2020064621A JP 2020064621 A JP2020064621 A JP 2020064621A JP 2019174282 A JP2019174282 A JP 2019174282A JP 2019174282 A JP2019174282 A JP 2019174282A JP 2020064621 A JP2020064621 A JP 2020064621A
Authority
JP
Japan
Prior art keywords
data
real data
output
encoder
gan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2019174282A
Other languages
English (en)
Inventor
ペゾシュクポール・ポーヤ
Pezeshkpour Pouya
マルアー スリニバサン・ラムヤ
Malur Srinivasan Ramya
マルアー スリニバサン・ラムヤ
チャンダー・アジャイ
Ajay Chander
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2020064621A publication Critical patent/JP2020064621A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】敵対的生成ネットワークを用いて、ユーザフレンドリな説明を生成する方法を提供する。【解決手段】敵対的ネットワークを用いたテキストの生成方法は、実パラメータ及び実センテンスを有するリアルデータを含む限定的データセットを受信し、リアルデータの一部に関するコンセプトを含む又はリアルデータの問題を生じるコンテンツデータを受信し、リアルデータとコンテンツデータとの間の関係を生成し、コンテンツベクトル埋め込みを含むエンコーダ出力において、コンテンツデータをリアルデータに埋め込み、追加パラメータ及び1つ以上の追加ステートメントを含む、リアルデータに対する補足であり、モデルの表現力を向上する追加パラメータセットを生成し、追加パラメータセット及び関係に基づき、説明ステートメントを生成する。【選択図】図8A

Description

[関連出願の参照]
本願は、米国仮特許出願番号62/747,010、2018年10月17日出願、に基づく優先権及び利益を主張する。該米国仮特許出願は参照されることによりその全体が本願明細書に組み込まれる。さらに、本願は、共に係属中の出願である名称「Explanations Generation With Different Cognitive Values Using Generative Adversarial Networks」、シリアル番号「____」、2019年2月18日にPouya Pezeshkpour、Ramya Malur Shrinivasan、及びAjay Chanderによる出願に関連する。該出願は参照によりその全体が組み込まれる。
[技術分野]
ここに議論する実施形態は、敵対的生成ネットワークを用いるユーザフレンドリな説明生成に関する。
人工知能(Artificial intelligence:AI)モジュールは、複雑なシステムにおいて決定を行うために実装されてよい。これらの複雑なシステムの内部動作又は該システムにより決定が行われるパラメータに馴染みのない人々のような素人ユーザは、AIモジュールの出力を理解しないことがある。例えば、融資アプリケーションシステムは、融資アプリケーションを処理するためにAIを実装していることがある。融資アプリケーションに関する決定は、AIモジュールにより決定され得る。しかしながら、AIモジュールを実装する現在のシステムは決定の説明を提供せず、又は提供される説明は、複雑であり、決定の理解可能な説明を提供できない。
幾つかのAIモジュールは、出力される決定に関する幾らかの詳細を提供することがある。これらの詳細は、しかしながら、概して、ユーザに見えるようになる最終段階コード又は擬似コードに関する。これらの詳細は、素人ユーザにとって分かり易い理解可能な説明を提供しない。さらに、詳細は、決定の正当化のような単一の目的を有することがある。
さらに、AIモジュールの実装は、通常、膨大なデータセットに依存する。膨大なデータセットは、パラメータ及びシステムの出力を示す何十万又は数百万ものデータを含み得る。膨大なデータセットは、AIモジュールで使用される機械学習アルゴリズムをトレーニングし及びテストするために使用される。したがって、データセットが限られている分野で、効率的且つ機能的なAIモジュールを生成することは困難であり又は不可能である。
本願明細書で請求される主題は、任意の欠点を解決する実施形態や上述のような環境でのみ機能する実施形態に限定されない。むしろ、この背景技術は、単に、本願明細書に記載される複数の実施形態が実施される技術分野の一例を説明するために提供される。
実施形態の態様によると、敵対的ネットワークを用いてテキストを生成する方法は、実パラメータ及び実センテンスを有するリアルデータを含む限定的データセットを受信するステップを含み得る。方法は、リアルデータの一部に関するコンセプトを含む又はリアルデータの問題を生じるコンテンツデータを受信するステップを含み得る。方法は、リアルデータとコンテンツデータとの間の関係を生成するステップを含み得る。方法は、コンテンツベクトル埋め込みを含むエンコーダ出力において、コンテンツデータをリアルデータに埋め込むステップを含み得る。方法は、追加パラメータ及び1つ以上の追加ステートメントを含む追加パラメータセットを生成するステップを含み得る。追加パラメータセットは、リアルデータに対する補足であり、モデルの表現力を向上するよう構成されてよい。方法は、追加パラメータセット及びエンコーダにより生成された関係に基づき、説明ステートメントを生成するステップを含み得る。
実施形態の目的及び利点が理解され、少なくとも特に特許請求の範囲で指摘された要素、特徴及び組合せを用いて達成されるだろう。上述の全体的説明及び以下の詳細な説明の両方は、例示及び説明のためであり、本発明の範囲を限定しないことが理解される。
例示的な実施形態は、添付の図面を用いて、更なる特異性及び詳細事項と共に記載され説明される。
例示的な処理出力を示す。
例示的な動作環境のブロック図を示す。
図2の動作環境内に実装され得る人工知能(AI)モジュールの例示的な実施形態を示す。
図3のAIモジュール内に実装され得る複数レベル調整サブシステムを示す。
図3のAIモジュール内に実装され得る単一レベル調整サブシステムを示す。
図3のAIモジュール内に実装され得る例示的なノイズモジュールを示す。
図3のAIモジュール内に実装され得る例示的な損失モジュール動作を示す。
テキスト生成のために構成される例示的なコンピューティングシステムのブロック図である。
テキスト生成の例示的な方法のフローチャートである。 テキスト生成の例示的な方法のフローチャートである。
図3のAIモジュールにより利用され得る限定的データセットの例示的な部分を示す。
図3のAIモジュールにより生成され得る幾つかの例示的なステートメントを有するテーブルを示す。
全ての図は本願明細書に記載の少なくとも1つの実施形態に従う。
金融機関のような産業は、ビジネスプロセスを革新的に自動化するために人工知能(artificial intelligence:AI)を開発し採用し始めている。例えば、AIは、顧客の振る舞いを予測するため、不正検出のためにアイデンティティを検証するため、及び顧客の問い合わせに答えるよう構成され得る知的チャットボットに用いられる。さらに、AIは、Fintechアプリケーション(例えば、技術に基づくバンキングアプリケーション及び技術に基づく金融サービスアプリケーション)の中で利用され得る。
従来のAIシステムは、回答又は決定が説明無しに及び根拠無しに顧客に提供される「ブラックボックス技術」を生じ得る。幾つかのシステムでは、平文の回答又は単一語の決定が顧客に返されることがある。しかしながら、ブラックボックス技術は、特定のアプリケーションに適さない。例えば、ヘルスケアアプリケーション、裁判アプリケーション、及び幾つかの金融アプリケーションでは、ブラックボックス技術は適切でないことがある。特に、上述及び他のアプリケーションでは、顧客は、完全な回答を要求することがあり、上述又は他のアプリケーションとインタフェースしている顧客は、決定に伴う何からの追加根拠、説明、助言、等から利益を得ることがある。
例えば、Scalable Bayesian Rules Lists及びLIME出力は、何からの最終段階処理を特定決定と共にユーザに提供してよい。処理出力100の一例は図1に提供される。例示的な処理出力100は、主として、ルール及びAI処理で使用される擬似コードに関連する。処理出力100は、したがって、決定の理由を正しく説明しない。さらに、処理出力100は、代替決定に達するようユーザがAIモジュールを助けるために取り入れ得る治癒ステップを解決しない。
さらに、AI決定に理由を提供する幾つかの現在のシステムは、AIモデルをトレーニングするために大量のデータセットを利用する。大量のデータセットは、例えば数百万又は十数百万ものデータを含み得る。大量のデータセットは、生成し及びアクセスするのに高コストである。さらに、AIモデルをトレーニングするために使用される大量のデータセットは、素人又はその他の場合には経験の浅いユーザに必ずしも理解可能ではない機能を含み得る。例えば、融資アプリケーションAIシステムは、複雑なパラメータである、外部リスク推定、合計分割リボルビング負担、等を決定の基礎としてよい。素人ユーザは、AIシステムのデータセット内に現れない特徴を含む説明を好む場合がある。AIトレーニングデータのパラメータを素人ユーザにより理解可能な説明の特徴に変換することは困難であり得る。例えば、融資アプリケーションシステムの素人ユーザは、職歴、経歴のチェック、信用スコア、等に関連する説明に敏感であり、合計分割リボルビング負担等には敏感でないことがある。しかしながら、AIモデルをトレーニングして人間中心の説明を生成するために、機械学習アルゴリズムが実装されてよい。機械学習アルゴリズムの実装の前に、大量のデータセットが手動で注釈を付されることがある。人間中心の説明を生成するために大量のデータセットに手動で注釈を付けることは、困難であり高コストであり得る。
したがって、本開示の幾つかの実施形態は、限定的データセットからテキストを生成する方法に関する。テキストは、テキストが幅広いコンテンツデータ及び特定コンテンツデータにより生成され得る制御可能な方法で生成され得る。さらに、結果として生じるテキストは、音声に変換されてよく、それによりチャットボットのようなアプリケーションをエンドユーザにレンダリングする。
本開示に記載の実施形態は、AIモジュールに存在する現在の技術的制限及びAIモジュール内で機械学習アルゴリズムをトレーニングし及びテストするために実装されるデータセットの生成をブリッジし及び解決する。特に、本開示に記載の実施形態は、1つ以上のユーザフレンドリな説明を提供するテキストを効果的に生成することにより、研究と実用との間の技術的ギャップを解決する。このテキストは、説明を求めるより広範なユーザコミュニティの必要に応じることができ、異なる目的を提供し得る複数の説明を提供できる。
幾つかの実施形態では、データセットは小さくてよい。本開示で使用されるように、小さいは、AIモジュールの特定決定出力のために提供される約100個のユニークな理由を有する約2000(例えば、約2400)個のセンテンス/使用例を示すために使用される。実施形態は、事実上約2000個のセンテンス/使用例及び事実上約100個のユニークな理由を有する環境で利用されてよい。例えば、センテンス/使用例の数は、約1000、3000、4000、5000、10000、20000、又は別の適切な数であってよい。さらに、ユニークな理由の数は、40、50、80、120、140、300、500、又は別の適切な数のユニークな理由であってよい。
幾つかの実施形態では、ノイズ入力はモデル化されてよい。例えば、ノイズ入力は、ガウス分布(Gaussians)の混合(mixture)を用いてモデル化されてよい。条件付き情報は、1つ以上の異なる埋め込みプロセスを用いて組み込まれてよい。複数の埋め込み処理は、AIモデルのどの部分が条件付き情報を供給されるべきかを決定するのを助け得る。さらに、階層構造条件付き情報(一般及び特定コンテンツを通じて)は、データの希薄さを解決するために及び制御されたテキスト生成のために使用されてよい。用語及び意味の正確さは、ラベラ(labeler)及びアンチラベラ(anti−labeler)損失関数の使用を通じて向上され得る。センテンスは、次に、用語及び意味に基づき生成されてよい。
これらの及び他の実施形態は、添付の図面を参照して本願明細書で説明される。図中、共通の参照符号を有するコンポーネント及び特徴は、特に断りの無い限り、同様の機能及び構造を有する。
図2は、本開示に記載の少なくとも1つの実施形態により配置される例示的な動作環境200のブロック図を示す。動作環境200は、エンドユーザ214と人工知能(AI)システム212との間の相互作用又はインタフェースのために構成されてよい。相互作用は、通信ネットワーク208を介するエンドユーザ214への情報の通信を含んでよい。AIシステム212は、限定的データセットに基づく相互作用又はインタフェースに関連するステートメントを生成し通信するよう構成されてよい。ステートメントはユーザフレンドリであってよい。例えば、ステートメントは、素人ユーザ又は経験の浅い人物がステートメントを理解できるように生成されてよい。
AIシステム212は、AIモジュール210を含んでよい。AIモジュール210は、本開示の他の場所に記載される1つ以上の敵対的ネットワークを生成する又は含むよう構成されてよい。特に、AIモジュール210は、ユーザフレンドリなステートメントを生成するために実装され得る敵対的生成ネットワーク(generative adversarial network:GAN)を含んでよい。
AIモジュール210は、AIシステム内の技術的問題に対する技術的向上を表す。例えば、現在のAIシステムでは、ユーザフレンドリなステートメントを生成するためにモデルをトレーニングすることは、手動注釈を有する大量のデータセットを必要とする。大量データセットの手動注釈は高コストである。AIモジュール210は限定的データセットを利用する。特に、以下の更に記載されるように、AIモジュール210は、限定的データセットを補足するために、追加パラメータセットを生成するよう構成される。追加パラメータセットは、ステートメントの表現力を向上する。追加パラメータセットは、ガウス分布の混合を用いて生成されてよい。さらに、ステートメントを向上するために、ラベラ損失関数及びアンチラベラ損失関数(集合的に「損失関数」)は、AIモジュール210により実装されてよい。本開示に記載のGANのうちの1つ以上では、損失関数は生成されたステートメントに対して適用されてよい。
動作環境200の幾つかの例は、ITヘルプデスク(例えば、ソフトウェアアップデート、パッチ、等)、企業アプリケーション(例えば、雇用決定、生産性評価、リソース割り当て、等)、金融決定システム(例えば、融資拒否、信用スコア評価、利率評価、等)、又は別の適切なアプリケーション又はシステムを含んでよく又はその中に実装されてよい。
動作環境200は、AIシステム212、エンドユーザ装置204、AIモジュール210、AI問い合わせモジュール202、及びエンドユーザ214を含んでよく、これらのうちの何らかの部分は、通信ネットワーク208を介して情報及びデータを通信してよい。動作環境200のコンポーネントの各々は、以下に簡単に記載される。
通信ネットワーク208は、動作環境200のコンポーネントのうちの任意のものの間での信号の通信のために構成されてよい。通信ネットワーク208は、有線又は無線であってよい。通信ネットワーク208は、スター構成、トークンリング構成若しくは別の適切な構成を含む多数の構成を有してよい。さらに、通信ネットワーク208は、LAN(local area network)、WAN(wide area network)(例えば、インターネット)、及び/又は複数の装置が通信できる他の相互接続されたデータ経路を含み得る。幾つかの実施形態では、通信ネットワーク208は、ピアツーピアネットワークを有してよい。通信ネットワーク208は、種々の異なる通信プロトコルでデータ通信を可能にする電気通信ネットワークに結合され又はその部分を含んでよい。
エンドユーザ装置204及び/又はAIシステム212は、ハードウェアに基づくコンピューティングシステムを含んでよい。エンドユーザ装置204及び/又はAIシステム212は、動作環境200の他のコンポーネントと通信ネットワーク208を介して通信するよう構成されてよい。エンドユーザ装置204は、エンドユーザ214がAIシステム212とエンドユーザ装置204を用いてインタフェースすることを可能にするAI問い合わせモジュール202を含んでよい。AIシステム212は、エンドユーザ装置204から問い合わせを受信し、それに基づき説明及びステートメントを生成し、並びにエンドユーザ装置204へ通信ネットワーク208を介して説明を通信するよう構成されてよいAIモジュール210を含んでよい。
本開示を通じて記載されるAIモジュール210、AI問い合わせモジュール202、及びそれらの1つ以上のコンポーネント若しくはモジュールは、(例えば、1つ以上の動作を実行する又はその実行を制御するために)プロセッサ、マイクロプロセッサ、FPGA(field−programmable gate array)又はASIC(specific integrated circuit)を含むハードウェアを用いて実装されてよい。幾つかの他の例では、AIモジュール210、AI問い合わせモジュール202、及びそれらの1つ以上のコンポーネント又はモジュールは、ハードウェア及びソフトウェアの組み合わせを用いて実装されてよい。ソフトウェアでの実装は、コンピューティングシステム(例えば、AIシステム212又はエンドユーザ装置204)のハードウェアに含まれ得るような1つ以上のトランジスタ又はトランジスタ要素の迅速な起動及び停止を含み得る。追加で、ソフトウェア定義命令は、トランジスタ要素の中の情報に対して作用してよい。ソフトウェア命令の実装は、電子経路を少なくとも一時的に再構成し、コンピューティングハードウェアを変換してよい。
幾つかの実施形態では、AIモジュール210は、後述する第1敵対的ネットワークのような敵対的ネットワークを用いてテキストを生成するよう構成されてよい。AIモジュール210は、限定的データセットをデータセットソース206から通信ネットワーク208を介して受信してよい。データセットソース206は、公衆データベース、又は限定的データセットを蓄積し生成するシステムを含んでよい。限定的データセットは、実パラメータ及び実センテンスを有するリアルデータを含んでよい。AIモジュール210は、リアルデータの一部に関するコンセプトを含む又はリアルデータの問題を生じるコンテンツデータも受信してよい。AIモジュール210は、リアルデータとコンテンツデータとの間の関係を生成してよい。AIモジュール210は、コンテンツベクトル埋め込みを含むエンコーダ出力において、コンテンツデータをリアルデータに埋め込んでよい。AIモジュール210は、追加パラメータ及び1つ以上の追加ステートメントを含む追加パラメータセットを生成してよい。追加パラメータセットは、リアルデータに対する補足であり、モデルの表現力を向上するよう構成されてよい。AIモジュール210は、1つ以上の説明のユーザフレンドリなステートメントを、追加パラメータセット及び関係に基づき生成してよい。AIモジュール210は、生成したステートメントを音声出力に変換してよい。AIモジュール210は、次に、ネットワークに基づく相互作用の間に、音声出力をエンドユーザ214に伝達してよい。
本開示の範囲から逸脱することなく動作環境200に対し変更、追加又は省略が行われてよい。例えば、動作環境200は、1つ以上のユーザ204、1つ以上のエンドユーザ214、1つ以上の通信ネットワーク208、1つ以上のAIシステム212、又はそれらの任意の組合せを含んでよい。さらに、本願明細書に記載の実施形態の中の種々のコンポーネント及びサーバの分割は、分割が全ての実施形態において生じることを意味しない。例えば、AIモジュール210は、エンドユーザ装置204にローカルに実装されてよく、及び/又はAI問い合わせモジュール202は、AIモジュール210又は敵対的生成ネットワークの機能の一部を実装してよい。さらに、本開示の利益により、記載のコンポーネント及びサーバが単一のコンポーネント又はサーバに統合され又は複数のコンポーネント又はサーバに分割されてよいことが理解される。
図3は、本開示の少なくとも一実施形態によるAIモジュール210の例示的な実施形態を示す。図3のAIモジュール210は、敵対的生成ネットワーク(generative adversarial network:GAN)301を含む。GAN301は、限定的データセット303からのテキスト生成のために構成されてよい。限定的データセット303は、限られたトレーニングデータを含んでよい。GAN301により生成されたテキストは、ユーザフレンドリな説明を含んでよい。
限定的データセット303は、リアルデータ300を含んでよい。リアルデータ300は、AIモジュール210においてデータソースから通信ネットワークを介して受信されてよい。例えば、リアルデータ300は、データセットソース206から通信ネットワーク208を介して受信されてよい。リアルデータ300は、例えばアプリケーションの使用又は実装を通じて収集されたデータセットを含んでよい。
リアルデータ300は、エンコーダ318及びラベラ損失モジュール310(図中、ラベラ損失310)に伝達されてよい。図3の指示子「X」は、リアルデータ300又はその何らかの部分を表し、GAN301の他の部分に伝達される。リアルデータ300又は330により表されるその何らかの部分は、エンコーダ318への入力であってよい。さらに、リアルデータ300又は334により表されるその何らかの部分は、ラベラ損失モジュール310への入力であってよい。幾つかの実施形態では、リアルデータ300は、識別器(discriminator)322への入力であってもよい。
リアルデータ300は、センテンス、記述、使用例、理由、又はそれらの何らかの組み合わせを含んでよく、手動で編集され注釈を付されてよい。例えば、例示的な実施形態では、リアルデータ300は、AMT(Amazon Mechanical Turk)作業員のような作業員グループにより収集されてよい。AMT作業員は、融資拒否の理由を強調したテキスト記述を提供した。この例示的な実施形態では、記述は、構文及び意味の正確さのために編集された。さらに、言語学者が、対応する幅広い及び特定の理由を有する記述に注釈を提供した。この例示的な実施形態では、リアルデータ300は、融資拒否の対応する理由を有する2432個のセンテンスの監督付き(curated)データセットを含む。
図9を参照すると、限定的データセット303の例示的な部分900が示される。部分900は、記述906に関連する幅広い理由902及び特定理由904を含む。幅広い理由902及び特定理由904は、言語学者のような専門家により注釈を付されてよい。部分900は、融資拒否の理由を強調したテキスト記述906も含む。記述906は、構文及び/又は意味の正確さのために手動で編集されてよい。各記述の注釈は、対応する幅広い及び特定理由を有する。
図3に戻ると、限定的データセット303は、コンテンツデータ302も含んでよい。コンテンツデータ302は、リアルデータ300の一部に関する又はリアルデータ300の問題を生じるコンセプトを含んでよい。幾つかの実施形態では、コンテンツデータ302は、リアルデータ300の中で見付かった問題に関連付けられる又はその原因であると分かった汎用的又は幅広い概念を含んでよい。例えば、コンテンツデータ302は、「信用」又は「収入」のような、融資申請が拒否される理由を含んでよい。
コンテンツデータ302は、GAN301を通じて通信されてよい。例えば、コンテンツデータ302は、エンコーダ318への入力であってよい。エンコーダ318は、リアルデータ300とコンテンツデータ302との間の1つ以上の関係を生成するよう構成されてよい。さらに、コンテンツデータ302は、デコーダ320及び識別器322へ通信されてよい。図3では、「C」はコンテンツデータ302又はその何らかの部分を表す。例えば、コンテンツデータ302又は図3で344により表されるその何らかの部分は、エンコーダ318へ通信されてよい。さらに、コンテンツデータ302又はその何らかの部分は、デコーダ320に通信されてよく、識別器322は図3で346により表される。
幾つかの実施形態では、リアルデータ300は、融資拒否の幅広い根拠及び特定根拠のような幅広い及び特定条件を含んでよい。幅広い及び特定条件も、エンコーダ318への入力であるコンテンツデータ302に含まれてよい。エンコーダ318は、コンテンツデータ302をリアルデータ300に埋め込むよう構成されてよい。
さらに、GAN301は、2レベルの条件付き情報を組み込むよう構成されてよい。例えば、GAN301は、2レベルの条件付き情報を、リアルデータ300に階層的に組み込んでよい。上述及び他の実施形態で、エンコーダ318は、コンテンツデータ302をリアルデータ300に複数(例えば2)レベル調整により埋め込んでよい。例えば、上述の例では、監督付き(curated)データセットは、「返済」、「信用(クレジット)履歴」、又は「信用」のような、距離の幅広い根拠を含んでよい。監督付きデータセットは、「未払いの高いリスク」、「信用履歴無し」、又は「悪い信用」のような、特定根拠を更に含んでよい。幅広い及び特定理由は、コンテンツデータ302、及びリアルデータ300に埋め込まれるべきエンコーダ318への入力に含まれてよい。エンコーダ318は、階層的に(例えば、幅広い及び特定)コンテンツをリアルデータ300に埋め込んでよい。他の実施形態で、エンコーダ318は、コンテンツデータ302をリアルデータ300に単一レベル調整により埋め込んでよい。
例えば、図4A及び4Bを参照すると、図3のエンコーダ318の例示的な実施形態が示される。図4Aで、エンコーダ318は、複数レベル調整サブシステム400Aに含まれる。図4Aで、エンコーダ318は、複数レベルの調整サブシステム400Aに含まれる。図4Aを参照すると、エンコーダ318は、入力として幅広いコンテンツデータ402及び特定コンテンツデータ404を受信してよい。幅広いコンテンツデータ402(図4Aでは「幅広いコンテンツ(Broad Content)」)及び特定コンテンツデータ404(図4Aでは「特定コンテンツ(Specific Content)」)は、図3の限定的データセット303に含まれ又はその一部であってよい。
図4Aのエンコーダ318は、線形レイヤ406を出力してよい。線形レイヤ406は、連結モジュール408に通信されてよい。連結モジュール408は、幅広いコンテンツデータ402を特定コンテンツデータ404と連結してよい。連結モジュール408は、幅広いコンテンツデータ402及び特定コンテンツデータ404に基づきベクトルを出力してよい。例えば、ベクトルは、特定コンテンツデータ402と連結された幅広いコンテンツデータ402を含んでよい。例えば、連結モジュール408は、幅広い及び特定コンテンツベクトル埋め込み410を出力してよい。図4Aで、連結モジュール408は、エンコーダ318と別個である。他の実施形態では、連結モジュール408は、エンコーダ318に含まれる。上述及び他の実施形態では、エンコーダ318は、幅広いコンテンツデータ402を特定コンテンツデータ404と連結してよい。
図4Bを参照すると、単一レベル調整サブシステム400Bは、幅広いコンテンツデータ412(図4Bで、「幅広いコンテンツ(broad content)」)を含む。幅広いコンテンツデータ412は、エンコーダ318へ入力されてよい。エンコーダ318は、幅広いコンテンツデータ412に基づくベクトルを出力してよい。例えば、エンコーダ318は、幅広いコンテンツベクトル埋め込み416を出力してよい。
図3に戻ると、GAN301は、表現力を向上するよう構成されてよい。例えば、GAN301は、ノイズモデル304の使用を通じて表現力を向上してよい。ノイズモデル304は、限定的データセット303を補足し得る追加パラメータセットを含み得るノイズ入力をモデル化し又は生成してよい。図3で、追加パラメータセット及びノイズ入力は「Z」332により表される。ノイズ入力332は、ガウス分布(Gaussians)の混合(mixture)としてモデル化されてよい。
図5を参照すると、ノイズモデル304の例示的な実施形態の詳細図が示される。ノイズモデル304は、Swaminathan Gurumurthy、Ravi Kiran Sarvadevabhatla、及びR Venkatesh Babuにより開発された多様且つ限定的GAN(Diverse and Limited GAN、DeLiGANと呼ばれる)に基づく。Deligan:Generative Adversarial Networks For Diverse And Limited Data、CVPR、pp.4941−4949、2017は、参照により全体がここに組み込まれる。
図5のノイズモデル304は、本開示の他の場所に記載の生成器316及び識別器322と共に示される。ノイズモデル304は、追加パラメータセット536(図5では「パラメータセット536」)を生成するよう構成されてよい。パラメータセット536は、1つ以上の追加パラメータ及び1つ以上の追加ステートメントを含んでよい。追加パラメータセット536は、図3のリアルデータ300を補足するよう構成され、表現力を向上するよう構成される。例えば、上述のように、リアルデータ300は限定的データセットに基づいてよい。限定的データセットは、約2000個のセンテンス/使用例及び約100個のユニークな理由を含んでよい。限定的データセットは、図3のGAN301のようなGANをモデル化し及びトレーニングするのに不十分であり得る。したがって、パラメータセット536は、センテンス/使用例の数、及び/又はユニークな理由の数を増加してよい。
ノイズモデル304は、ガウス分布セット514に含まれるガウス分布502、504、506、及び508の混合を実施してよい。ガウス分布セット514は、単純な潜在的分布510により実装されてよい。潜在的空間は、ガウス分布セット514を用いて再パラメータ化される。ガウス分布セット514のうちの1つは、パラメータセット536を生成するためにランダムに選択される。図5で、第3ガウス分布506が選択される。ガウス分布502、504、506、及び508では、zは、ランダムに選択された特定ガウス分布、上述のGurumurthyで記載されたパラメータσ及びμに基づく確定関数を表す。変数k及びnは指標変数(indexing variable)である。
幾つかの実施形態では、ノイズモデル304は、ガウス分布セット514をバイパスしてよい。例えば、図5で、パラメータセット536は、単純な潜在的分布510に基づき生成されてよい。この動作は破線512により示される。
図3に戻ると、生成器316は、ステートメントを生成するためにエンコーダ318からの出力と共にノイズモデル304の追加パラメータセット536を使用してよい。エンコーダ318からの出力は、コンテンツデータ302を含んでよい。ステートメントは、ユーザフレンドリな説明であってよいセンテンスに組み込まれてよい。ステートメントは、図3で「336」及び「338」とラベル付けされる「G(Z,C)」として図に示される。パラメータ「G」は、ノイズモデル304及びコンテンツデータ302又は344からの追加パラメータセットの関数を示す。ステートメントは、識別器322、ラベラ損失モジュール310、及びアンチラベラ損失モジュール312、及びテキスト音声生成器328へ通信されてよい。
図10を参照すると、幾つかの例示的なステートメント1002を有するテーブル1000が示される。テーブル1000は、アーキテクチャ1004に基づくステートメント1002に対する差を含む。アーキテクチャが複雑さを増すにつれ、ステートメント1002は変化する。特に、生成されたステートメント1002の数は、文法的に及び意味的に一層正しくなり得る。
図3に戻ると、GAN301内の識別器322は、生成器316が正確な合成データを生成していることの何からの保証を提供するよう構成されてよい。識別器322は、生成器316から出力されたステートメントが「良い」又は「悪い」ことの信号を生成器316へ与えてよい。例えば、識別器322は、バイナリ信号を生成器316へフィードバックとして出力してよい。フィードバックに基づき、生成器316は、時間の経過に渡り、進化し、より良くなってよい。まとめると、識別器322は、生成器316から出力されたステートメントが良い又は悪いかの信号を生成器316に示すよう構成されてよい。
図3の識別器322は、ステートメントのうちの1つが本物であることの確率321を生成してよい。例えば、図3で、「P」は確率の略である。P(real)は、ステートメントが「実データ」に対応するか否かの確率を示す。生成器316へのフィードバックは、確率321に基づいてよい。
GAN301では、エンコーダ/デコーダは、生成器モデルの一種であり、時には自動エンコーダと呼ばれる。一般に、GAN301では、デコーダ320は、エンコーダ318からの埋め込みデータを受信する。デコーダ320は、次に、エンコーダ318により実行される埋め込み処理を逆行する処理を実行してよい。デコーダ320は、図3で「X」により表される逆埋め込み処理の出力324を生成する。エンコーダ318の埋め込み処理が適切に動作している場合、デコーダ320の出力324は、リアルデータ300/330に一致する又はそれに近くなり得る。デコーダ320の出力324とリアルデータ300/330との間の不一致に応答して、エンコーダ318の動作は変更されてよい。
幾つかの実施形態では、エンコーダ318、デコーダ320、生成器316、及び識別器322は、敵対正規化自動エンコーダGAN(adversarially regularized autoencoder GAN:ARAEGAN)アーキテクチャと整合してよい。ARAEGANアーキテクチャの幾つかの追加の詳細は、「Adversarially Regularized Autoencoders for Generating Discrete Structures」、Junbo et.al., ICML PMLR 2018から分かり、該文献は参照により全体がここに組み込まれる。
GAN301は、2(以上の)損失関数を組み込んでよい。損失関数は、GAN301にラベラ損失モジュール310及びアンチラベラモジュール312(集合的に損失モジュール310/312)として含まれる。損失モジュール310/312は、ステートメント336の条件付き提示を向上してよい。例えば、損失モジュール310/312は、生成器316及びリアルデータ334により出力されるステートメント336を評価するよう構成されてよい。概して、ラベラ損失モジュール310は、ステートメント336の良好な部分又は例を増加させるよう構成されてよく、アンチラベラ損失モジュール312は、ステートメント336の粗悪な部分又は例を減少させるよう構成されてよい。
図6を参照すると、損失モジュール動作600が示される。損失モジュール動作600は、ラベル推定626及び628を生成するよう構成されてよい。損失モジュール動作600では、生成器316は、ステートメント336をアンチラベラ損失モジュール312へ及びラベラ損失モジュール310へ出力してよい。リアルデータ334の少なくとも一部も、ラベラ損失モジュール310に入力されてよい。ラベラ損失モジュール310は、図3の限定的データセット303に基づき理由の推定を提供する。アンチラベラ損失モジュール312は、生成器316により生成されたステートメント336の中の理由の推定を提供する。ラベル推定626及び628は、ステートメントの又はそれと共に含まれる推定された理由を表す。ラベル推定626及び628は、生成器316により出力されるステートメントを向上し又は変更するよう構成されてよい。アンチラベラ損失モジュール312及びラベラ損失モジュール310の幾つかの追加の詳細は、Murat Kocaoglu et al. Causalgan: Leaning Causal Implicit Generative Models with Adversarial Training. arXiv preprint arXiv:1709.02023, 2017から分かり、該文献は参照により全体がここに組み込まれる。
テキスト音声生成器328は、生成器316により出力されるステートメント338を受信してよい。テキスト音声生成器328は、ステートメント338に基づき及びそれを代表して音声信号を生成するよう構成されてよい。テキスト音声生成器328は、エンドユーザに話し掛けるチャットボットを生成するために使用されてよい。例えば、図2及び3を参照する。音声信号は、エンドユーザ装置204へ通信ネットワーク208を介して通信されてよい。
図7は、本開示の少なくとも一実施形態によるテキスト生成のために構成された例示的なコンピューティングシステム700を示す。コンピューティングシステム700は、例えば図2の動作環境200において実装されてよい。コンピューティングシステム700の例は、ユーザ装置204又はAIシステム212を含み得る。コンピューティングシステム700は、1つ以上のプロセッサ710、メモリ712、通信ユニット714、ユーザインタフェース装置716、データ記憶装置704を含んでよい。データ記憶装置704は、AIモジュール210及びAI問い合わせモジュール202(集合的に、モジュール210/202)を含む。
プロセッサ710は、任意の適切な特定用途向け又は汎用コンピュータ、コンピューティングエンティティ、又は種々のコンピュータハードウェア若しくはソフトウェアモジュールを有してよく、任意の適切なコンピュータ可読記録媒体に格納された命令を実行するよう構成されてよい。例えば、プロセッサ710は、マイクロプロセッサ、マイクロコントローラ、デジタシグナルプロセッサ(DSP)、ASIC、FPGA又はプログラム命令を解釈し及び/若しくは実行し並びに/又はデータを処理するよう構成された任意の他のデジタル若しくはアナログ回路を有してよい。
図7には単一のプロセッサを示したが、プロセッサ710は、より一般的には、本開示で説明される任意の数の工程を個々に又は共同で実行するよう構成される任意の数のプロセッサを有してよい。さらに、プロセッサ710のうちの1つ以上は、1つ以上の異なる電子装置又はコンピューティングシステムに存在してよい。幾つかの実施形態では、プロセッサ710は、プログラム命令を解釈し及び/又は実行し、及び/又はメモリ712、データ記憶装置704又はメモリ712及びデータ記憶装置704に格納されたデータを処理してよい。幾つかの実施形態では、プロセッサ710は、データ記憶装置704からプログラム命令をフェッチし、該プログラム命令をメモリ712にロードしてよい。プログラム命令がメモリ712にロードされた後、プロセッサ710は該プログラム命令を実行してよい。
メモリ712及びデータ記憶装置704は、コンピュータ実行可能命令又はデータ構造を伝える又は格納しているコンピュータ可読記憶媒体を含み得る。例として且つ限定ではなく、このようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM、CD−ROM又は他の光ディスク記憶装置、磁気ディスク記憶装置又は他の磁気記憶装置、フラッシュメモリ装置(例えば、固体メモリ素子)を含む有形又は非一時的コンピュータ可読記憶媒体、又はコンピュータにより実行可能な命令若しくはデータ構造の形式で所望のプログラムコードを伝える若しくは格納するために用いられ汎用若しくは特定目的コンピュータによりアクセス可能な任意の他の記憶媒体を有し得る。上述の組合せも、コンピュータ可読記憶媒体の範囲に包含され得る。コンピュータ実行可能命令は、例えば、プロセッサ710に特定の工程又は工程のグループを実行させるよう構成される命令及びデータを含み得る。
通信ユニット714は、通信を受信し及び送信するよう構成されるハードウェアの1つ以上のピースを有してよい。幾つかの実施形態では、通信ユニット714は、通信ハードウェア装置の中でも特に、アンテナ、有線ポート、変調/復調ハードウェア、のうちの1つ以上を有してよい。特に、通信ユニット714は、コンピューティングシステム700の外部から通信を受信するよう、及び該通信をプロセッサ710に提示し又はプロセッサ710からの通信を別の装置若しくはネットワーク(例えば、図2の208)に送信するよう、構成されてよい。
ユーザインタフェース装置716は、ユーザからの入力を受信し及び/又はユーザに出力を提供するよう構成されるハードウェアの1つ以上のピースを有してよい。幾つかの実施形態では、ユーザインタフェース装置716は、ハードウェア装置の中でも特に、スピーカ、マイクロフォン、ディスプレイ、キーボード、タッチスクリーン、ホログラフィックプロジェクション、のうちの1又は複数を有してよい。
モジュール210/202は、データ記憶装置704に格納されたプログラム命令を有してよい。プロセッサ710は、モジュール210/202をメモリ712にロードし、モジュール210/202を実行するよう構成されてよい。代替として、プロセッサ710は、メモリ712にロードしないで、データ記憶装置704からモジュール210/202を1行毎に実行してよい。モジュール210/202を実行するとき、プロセッサ710は、本開示の他の場所に記載したように、参加認証処理を実行するよう構成されてよい。
本開示の範囲から逸脱することなくコンピューティングシステム700に対し変更、追加又は省略が行われてよい。例えば、幾つかの実施形態では、コンピューティングシステム700は、ユーザインタフェース装置716を有しなくてよい。幾つかの実施形態では、コンピューティングシステム700の異なるコンポーネントは、物理的に別個であってよく、任意の適切なメカニズムにより通信可能に結合されてよい。例えば、データ記憶装置704は、記憶装置に通信可能に結合されるプロセッサ710とメモリ712と通信ユニット714とを含む、サーバから分離した、該記憶装置の部分であってよい。本願明細書に記載した実施形態は、以下に更に詳細に議論するように、種々のコンピュータハードウェア又はソフトウェアモジュールを備えた特定用途又は汎用コンピュータの使用を含み得る。
図8A及び8Bは、本開示に記載の少なくとも一実施形態による、敵対的ネットワークを用いてテキストを生成する例示的な方法800のフローチャートである。方法800は、図2の動作環境200のような動作環境で実行されてよい。方法800は、図2を参照して記載されたAIシステム212により幾つかの実施形態においてプログラム制御されて実行されてよい。幾つかの実施形態では、AIシステム212又は別のコンピューティングシステムは、コンピューティングシステム及び/又は適AIシステム212に方法800を実行させる又は実行を制御させる(図7のプロセッサ710のような)1つ以上のプロセッサにより実行可能なプログラムコード又は命令を格納している非一時的コンピュータ可読媒体(例えば、図7のメモリ712)を有してよく又はそれに通信可能に結合されてよい。追加又は代替で、AIシステム212は、AIシステム212又は別のコンピューティングシステムに方法800を実行させる又は実行を制御させるコンピュータ命令を実行するよう構成される、本開示の他の場所に記載されるプロセッサ710を有してよい。別個のブロックとして示したが、所望の実装に依存して、図8A及び8Bの種々のブロックは、更なるブロックに分割され、少ないブロックに結合され、又は除去されてよい。
ブロック802で、限定的データセットが受信されてよい。限定的データセットはエンコーダにおいて受信されてよい。限定的データセットは、1つ以上の実パラメータ及び1つ以上の実センテンスを有するリアルデータを含んでよい。例えば、限定的データセットは、特定決定出力のために提供される約100個より少ないユニークな理由を有する約2000個のセンテンス/ユーザケースを含んでよい。幾つかの実施形態では、特定決定出力は融資申請に関する結果を記述する。ブロック804で、コンテンツデータが受信されてよい。コンテンツデータは、幾つかの実施形態ではエンコーダにより受信されてよい。コンテンツデータは、リアルデータ一部に関する又はリアルデータの問題を生じるコンセプトを含んでよい。ブロック806で、リアルデータとコンテンツデータとの間の1つ以上の関係が生成されてよい。関係は、幾つかの実施形態ではエンコーダにより生成されてよい。
ブロック808で、コンテンツデータは、リアルデータに埋め込まれてよい。コンテンツデータは、幾つかの実施形態ではエンコーダによりリアルデータに埋め込まれてよい。コンテンツデータは、エンコーダ出力においてリアルデータに埋め込まれてよい。エンコーダ出力はコンテンツベクトル埋め込みを含んでよい。幾つかの実施形態では、コンテンツデータは、単一レベルの調整でリアルデータに埋め込まれる。他の実施形態では、コンテンツデータは、2以上のレベルの条件付き情報でリアルデータに埋め込まれる。上述及び他の実施形態では、コンテンツデータは、幅広い根拠及び特定根拠を含む階層的方法で埋め込まれる。さらに、上述の実施形態では、コンテンツベクトル埋め込みは、特定根拠に連結された幅広い根拠を含んでよい。
ブロック810で、追加パラメータセットが生成されてよい。追加パラメータセットは、1つ以上の追加パラメータ及び1つ以上の追加ステートメントを含んでよい。追加パラメータセットは、リアルデータを補足してよい。さらに、追加パラメータセットは、モデルの表現力を向上するよう構成されてよい。幾つかの実施形態では、追加パラメータセットを生成することは、ガウス分布の混合としてノイズ入力をモデル化することを含む。
ブロック812で、説明ステートメントが生成されてよい。説明ステートメントは、幾つかの実施形態では追加パラメータセット及び関係に基づき生成されてよい。ブロック814で、ラベラ損失関数及びアンチラベラ損失関数を生成されたステートメントに適用して、生成されたステートメントの意味及び構文の正確さを向上する。ブロック816で、生成されたステートメントは音声出力に変換されてよい。ブロック818で、音声出力は、ネットワークに基づくアプリケーション相互作用の間に、ユーザに伝達されてよい。ブロック820で、生成されたステートメントが評価されてよい。例えば、生成されたステートメントは、リアルデータと追加パラメータセットとの間の比較に基づき評価されてよい。幾つかの実施形態では、生成されたステートメントの評価は、生成されたステートメントを向上し又は変更し得る、生成器により使用されるバイナリ信号の合成データ出力を生成することを含んでよい。ブロック822で、エンコーダ出力からデコーダ出力を生成する。ブロック824で、デコーダ出力とリアルデータとの間に不一致があるか否かが決定されてよい。デコーダ出力とリアルデータとの間に不一致があることに応答して(ブロック824で「YES」)、方法800は、ブロック826に進んでよい。ブロック826で、エンコーダの動作は変更されてよい。デコーダ出力とリアルデータとの間に不一致がないことに応答して(ブロック824で「NO」)、方法800はブロック828に進んでよく、そこで方法800は終了してよい。ブロック824から、方法800は、上述の1つ以上のブロック(例えば、806、808、810、812、等)を通じて進んでよい。
当業者は、上述の及び本願明細書に開示した他の手順及び方法について、処理及び方法において実行される機能が異なる順序で実施されてよいことを理解するだろう。さらに、概略のステップ及び動作は、単に例として提供され、幾つかのステップ及び動作は、開示の実施形態から逸脱することなく、任意であり、より少ないステップ及び動作に組み合わされ、又は追加ステップ及び動作に拡張されてよい。
本願明細書に記載した実施形態は、以下に更に詳細に議論するように、種々のコンピュータハードウェア又はソフトウェアモジュールを備えた特定用途又は汎用コンピュータの使用を含み得る。
本願明細書に記載した実施形態は、コンピュータにより実行可能な命令又はデータ構造を伝える又は格納しているコンピュータ可読媒体を用いて実施され得る。このようなコンピュータ可読媒体は、汎用又は特定目的コンピュータによりアクセスできる利用可能な媒体であり得る。例として且つ限定ではなく、このようなコンピュータ可読媒体は、RAM(Random Access Memory)、ROM(Read−Only Memory)、EEPROM(Electrically Erasable Programmable Read−Only Memory)、CD−ROM(Compact Disc Read−Only Memory)又は他の光ディスク記憶装置、磁気ディスク記憶装置又は他の磁気記憶装置、フラッシュメモリ装置(例えば、固体メモリ素子)を含む非一時的コンピュータ可読記憶媒体、又はコンピュータにより実行可能な命令若しくはデータ構造の形式で所望のプログラムコード手段を伝える若しくは格納するために用いられ汎用若しくは特定目的コンピュータによりアクセス可能な任意の他の記憶媒体を有し得る。上述の組合せも、コンピュータ可読媒体の範囲に包含され得る。
コンピュータにより実行可能な命令は、例えば、汎用コンピュータ、特定目的コンピュータ又は特定目的処理装置(例えば、1又は複数のプロセッサ)に特定の機能又は機能グループを実行させる命令及びデータを有してよい。本発明の主題は構造的特徴及び/又は方法論的動作に特有の言葉で記載されたが、本発明の主題は、特許請求の範囲に定められる上述の特定の特徴又は動作に限定されないことが理解されるべきである。むしろ、上述の特定の特徴及び動作は、特許請求の範囲の実施の例示的形態として開示されたものである。
本願明細書で用いられるように、用語「モジュール」又は「コンポーネント」は、モジュール若しくはコンポーネントの動作を実行するよう構成される特定ハードウェア実装、及び/又はコンピューティングシステムの汎用ハードウェア(例えばコンピュータ可読媒体、処理装置、等)に格納され及び/又はそれらにより実行され得るソフトウェアオブジェクト若しくはソフトウェアルーチンを表してよい。幾つかの実施形態では、本願明細書に記載されたのと異なるコンポーネント、モジュール、エンジン及びサービスは、(例えば、別個のスレッドとして)コンピューティングシステムで実行されるオブジェクト又は処理として実施されてよい。本願明細書に記載のシステム及び方法の幾つかは概して(汎用ハードウェアに格納される及び/又はそれにより実行される)ソフトウェアで実装されるように記載されたが、専用ハードウェアの実装又はソフトウェアと専用ハードウェアの組み合わせの実装も可能であり考えられる。この説明では、「コンピュータエンティティ」は、本願明細書で先に定められたようにコンピューティングシステム、又はコンピューティングシステムで実行されるモジュール若しくはモジュールの組合せであってよい。
本願明細書に記載された全ての例及び条件文は、教育上の目的で、読者が本発明の原理及び発明者により考案された概念を理解するのを助け、技術を促進させるためであり、これらの特に記載された例及び条件に限定されないものと考えられるべきである。本発明の実施形態が詳細に記載されたが、種々の変更、置換及び修正が本発明の精神及び範囲から逸脱することなく行われうることが理解されるべきである。
以上の実施形態に加えて、さらに以下の付記を開示する。
(付記1) 敵対的ネットワークを用いてテキストを生成する方法であって、前記方法は、
1つ以上の実パラメータ及び1つ以上の実センテンスを有するリアルデータを含む限定的データセットを受信するステップと、
前記リアルデータの一部に関連するコンセプトを含む又は前記リアルデータの問題を生じるコンテンツデータを更に受信するステップと、
前記リアルデータと前記コンテンツデータとの間の1つ以上の関係を生成するステップと、
コンテンツベクトル埋め込みを含むエンコーダ出力において、前記コンテンツデータを前記リアルデータに埋め込むステップと、
1つ以上の追加パラメータ及び1つ以上の追加ステートメントを含む追加パラメータセットを生成するステップであって、前記追加パラメータセットは、前記リアルデータに対する補足であり、モデルの表現力を向上するよう構成される、ステップと、
前記追加パラメータセット及び前記関係に基づき、説明ステートメントを生成するステップと、
を含む方法。
(付記2) 前記追加パラメータセットを生成する前記ステップは、ガウス分布の混合としてノイズ入力をモデル化するステップを含む、付記1に記載の方法。
(付記3) リアルデータと前記生成されたステートメントとの間の比較に基づき前記生成されたステートメントを評価するステップ、を更に含み、前記生成されたステートメントを評価する前記ステップは、生成器により前記生成されたステートメントを変更するために使用されるバイナリ信号の合成データ出力を生成するステップを含む、付記1に記載の方法。
(付記4) ラベラ損失関数及びアンチラベラ損失関数を前記生成されたステートメントに適用して、前記生成されたステートメントの意味及び構文の正確さを変更するステップ、を更に含む付記1に記載の方法。
(付記5) 前記コンテンツデータは、単一レベルの調整で前記リアルデータに埋め込まれる、付記1に記載の方法。
(付記6) 前記コンテンツデータは、2以上のレベルの条件付き情報の中で前記リアルデータに埋め込まれ、
前記コンテンツデータは、幅広い根拠及び特定根拠を含む階層方式で埋め込まれ、
前記コンテンツベクトルは、前記特定根拠に連結された前記幅広い根拠を埋め込む、
付記1に記載の方法。
(付記7) 前記エンコーダ出力からデコーダ出力を生成するステップと、
前記デコーダ出力と前記リアルデータとの間の不一致に応答して、エンコーダの動作を変更するステップと、
を更に含む付記1に記載の方法。
(付記8) 前記限定的データセットは、特定決定出力のために提供される約100個より少ないユニークな理由を有する約2000個のセンテンス/ユーザケースを含む、付記1に記載の方法。
(付記9) 前記特定決定出力は、
融資アプリケーションに関する結果、
情報技術ヘルプデスクに関する説明、
企業アプリケーションに関する説明、又は、
財務決定に関する説明、
を記述する、付記8に記載の方法。
(付記10) 前記生成されたステートメントを音声出力に変換するステップと、
ネットワークに基づくアプリケーション相互作用の間に前記音声出力をユーザに伝達するステップと、
を更に含む付記1に記載の方法。
(付記11) 敵対的生成ネットワーク(GAN)であって、
エンコーダであって、
リアルデータ及びコンテンツデータを有する限定的データセットを受信し、前記リアルデータは1つ以上の実パラメータ及び1つ以上の実センテンスを有し、前記コンテンツデータは前記リアルデータの一部に関連するコンセプトを含み又は前記リアルデータの問題を生じ、
前記リアルデータと前記コンテンツデータとの間の1つ以上の関係を生成し、
コンテンツベクトル埋め込みを含むエンコーダ出力において、前記コンテンツデータを前記リアルデータに埋め込む、よう構成されるエンコーダと、
1つ以上の追加パラメータ及び1つ以上の追加ステートメントを含む追加パラメータセットを生成するよう構成されるノイズモデルであって、前記追加パラメータセットは前記リアルデータに対する補足であり、モデルの表現力を向上するよう構成される、ノイズモデルと、
前記追加パラメータセット及び前記エンコーダにより生成された前記関係に基づき、1つ以上の説明ステートメントを生成するよう構成される生成器と、
を含むGAN。
(付記12)
前記追加パラメータセットを生成することは、ガウス分布の混合としてノイズ入力をモデル化することを含む、付記11に記載のGAN。
(付記13) 識別器であって、
リアルデータと前記追加パラメータセットとの間の比較に基づき前記生成されたステートメントを評価し、
生成されたステートメントを変更するために前記生成器により使用されるバイナリ信号の合成データ出力を生成する、
よう構成される識別器を更に含む、付記11に記載のGAN。
(付記14) 前記生成されたステートメントの意味及び構文の正確さを変更するよう構成されるラベラ損失モジュール及びアンチラベラ損失モジュール、を更に含む付記11に記載のGAN。
(付記15) 前記コンテンツデータは、単一レベルの調整で前記リアルデータに埋め込まれる、付記11に記載のGAN。
(付記16) 前記コンテンツデータは、2以上のレベルの条件付き情報の中で前記リアルデータに埋め込まれ、
前記コンテンツデータは、幅広い根拠及び特定根拠を含む階層方式で埋め込まれ、
前記コンテンツベクトルは、前記特定根拠に連結された前記幅広い根拠を埋め込む、
付記11に記載のGAN。
(付記17) デコーダであって、
前記エンコーダ出力からデコーダ出力を生成し、
前記デコーダ出力と前記リアルデータとの間の不一致に応答して、前記エンコーダの動作を変更する、
よう構成されるデコーダ、を更に含む付記11に記載のGAN。
(付記18) 前記限定的データセットは、特定決定出力のために提供される約100個より少ないユニークな理由を有する約2000個のセンテンス/ユーザケースを含む、付記11に記載のGAN。
(付記19) 前記特定決定出力は、
融資アプリケーションに関する結果、
情報技術ヘルプデスクに関する説明、
企業アプリケーションに関する説明、又は、
財務決定に関する説明、
を記述する、付記18に記載のGAN。
(付記20) テキスト音声生成器であって、
前記生成されたステートメントを音声出力に変換し、
ネットワークに基づくアプリケーション相互作用の間に前記音声出力をユーザに伝達する、
よう構成されるテキスト音声生成器、を更に含む付記11に記載のGAN。
210 AIモジュール
300 リアルデータ
302 コンテンツデータ
303 限定的データセット
304 ノイズモデル
310 ラベラ損失
312 アンチラベラ損失
316 生成器
318 エンコーダ
320 デコーダ
322 識別器
328 テキスト音声生成器

Claims (20)

  1. 敵対的ネットワークを用いてテキストを生成する方法であって、前記方法は、
    1つ以上の実パラメータ及び1つ以上の実センテンスを有するリアルデータを含む限定的データセットを受信するステップと、
    前記リアルデータの一部に関連するコンセプトを含む又は前記リアルデータの問題を生じるコンテンツデータを更に受信するステップと、
    前記リアルデータと前記コンテンツデータとの間の1つ以上の関係を生成するステップと、
    コンテンツベクトル埋め込みを含むエンコーダ出力において、前記コンテンツデータを前記リアルデータに埋め込むステップと、
    1つ以上の追加パラメータ及び1つ以上の追加ステートメントを含む追加パラメータセットを生成するステップであって、前記追加パラメータセットは、前記リアルデータに対する補足であり、モデルの表現力を向上するよう構成される、ステップと、
    前記追加パラメータセット及び前記関係に基づき、説明ステートメントを生成するステップと、
    を含む方法。
  2. 前記追加パラメータセットを生成する前記ステップは、ガウス分布の混合としてノイズ入力をモデル化するステップを含む、請求項1に記載の方法。
  3. リアルデータと前記生成されたステートメントとの間の比較に基づき前記生成されたステートメントを評価するステップ、を更に含み、前記生成されたステートメントを評価する前記ステップは、生成器により前記生成されたステートメントを変更するために使用されるバイナリ信号の合成データ出力を生成するステップを含む、請求項1に記載の方法。
  4. ラベラ損失関数及びアンチラベラ損失関数を前記生成されたステートメントに適用して、前記生成されたステートメントの意味及び構文の正確さを変更するステップ、を更に含む請求項1に記載の方法。
  5. 前記コンテンツデータは、単一レベルの調整で前記リアルデータに埋め込まれる、請求項1に記載の方法。
  6. 前記コンテンツデータは、2以上のレベルの条件付き情報の中で前記リアルデータに埋め込まれ、
    前記コンテンツデータは、幅広い根拠及び特定根拠を含む階層方式で埋め込まれ、
    前記コンテンツベクトルは、前記特定根拠に連結された前記幅広い根拠を埋め込む、
    請求項1に記載の方法。
  7. 前記エンコーダ出力からデコーダ出力を生成するステップと、
    前記デコーダ出力と前記リアルデータとの間の不一致に応答して、エンコーダの動作を変更するステップと、
    を更に含む請求項1に記載の方法。
  8. 前記限定的データセットは、特定決定出力のために提供される約100個より少ないユニークな理由を有する約2000個のセンテンス/ユーザケースを含む、請求項1に記載の方法。
  9. 前記特定決定出力は、
    融資アプリケーションに関する結果、
    情報技術ヘルプデスクに関する説明、
    企業アプリケーションに関する説明、又は、
    財務決定に関する説明、
    を記述する、請求項8に記載の方法。
  10. 前記生成されたステートメントを音声出力に変換するステップと、
    ネットワークに基づくアプリケーション相互作用の間に前記音声出力をユーザに伝達するステップと、
    を更に含む請求項1に記載の方法。
  11. 敵対的生成ネットワーク(GAN)であって、
    エンコーダであって、
    リアルデータ及びコンテンツデータを有する限定的データセットを受信し、前記リアルデータは1つ以上の実パラメータ及び1つ以上の実センテンスを有し、前記コンテンツデータは前記リアルデータの一部に関連するコンセプトを含み又は前記リアルデータの問題を生じ、
    前記リアルデータと前記コンテンツデータとの間の1つ以上の関係を生成し、
    コンテンツベクトル埋め込みを含むエンコーダ出力において、前記コンテンツデータを前記リアルデータに埋め込む、よう構成されるエンコーダと、
    1つ以上の追加パラメータ及び1つ以上の追加ステートメントを含む追加パラメータセットを生成するよう構成されるノイズモデルであって、前記追加パラメータセットは前記リアルデータに対する補足であり、モデルの表現力を向上するよう構成される、ノイズモデルと、
    前記追加パラメータセット及び前記エンコーダにより生成された前記関係に基づき、1つ以上の説明ステートメントを生成するよう構成される生成器と、
    を含むGAN。
  12. 前記追加パラメータセットを生成することは、ガウス分布の混合としてノイズ入力をモデル化することを含む、請求項11に記載のGAN。
  13. 識別器であって、
    リアルデータと前記追加パラメータセットとの間の比較に基づき前記生成されたステートメントを評価し、
    生成されたステートメントを変更するために前記生成器により使用されるバイナリ信号の合成データ出力を生成する、
    よう構成される識別器を更に含む、請求項11に記載のGAN。
  14. 前記生成されたステートメントの意味及び構文の正確さを変更するよう構成されるラベラ損失モジュール及びアンチラベラ損失モジュール、を更に含む請求項11に記載のGAN。
  15. 前記コンテンツデータは、単一レベルの調整で前記リアルデータに埋め込まれる、請求項11に記載のGAN。
  16. 前記コンテンツデータは、2以上のレベルの条件付き情報の中で前記リアルデータに埋め込まれ、
    前記コンテンツデータは、幅広い根拠及び特定根拠を含む階層方式で埋め込まれ、
    前記コンテンツベクトルは、前記特定根拠に連結された前記幅広い根拠を埋め込む、
    請求項11に記載のGAN。
  17. デコーダであって、
    前記エンコーダ出力からデコーダ出力を生成し、
    前記デコーダ出力と前記リアルデータとの間の不一致に応答して、前記エンコーダの動作を変更する、
    よう構成されるデコーダ、を更に含む請求項11に記載のGAN。
  18. 前記限定的データセットは、特定決定出力のために提供される約100個より少ないユニークな理由を有する約2000個のセンテンス/ユーザケースを含む、請求項11に記載のGAN。
  19. 前記特定決定出力は、
    融資アプリケーションに関する結果、
    情報技術ヘルプデスクに関する説明、
    企業アプリケーションに関する説明、又は、
    財務決定に関する説明、
    を記述する、請求項18に記載のGAN。
  20. テキスト音声生成器であって、
    前記生成されたステートメントを音声出力に変換し、
    ネットワークに基づくアプリケーション相互作用の間に前記音声出力をユーザに伝達する、
    よう構成されるテキスト音声生成器、を更に含む請求項11に記載のGAN。
JP2019174282A 2018-10-17 2019-09-25 敵対的生成ネットワークを用いるユーザフレンドリな説明生成 Withdrawn JP2020064621A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862747010P 2018-10-17 2018-10-17
US62/747010 2018-10-17
US16/278604 2019-02-18
US16/278,604 US11042710B2 (en) 2018-10-17 2019-02-18 User-friendly explanation production using generative adversarial networks

Publications (1)

Publication Number Publication Date
JP2020064621A true JP2020064621A (ja) 2020-04-23

Family

ID=68295931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019174282A Withdrawn JP2020064621A (ja) 2018-10-17 2019-09-25 敵対的生成ネットワークを用いるユーザフレンドリな説明生成

Country Status (3)

Country Link
US (1) US11042710B2 (ja)
EP (1) EP3640814A1 (ja)
JP (1) JP2020064621A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4244767A1 (en) 2020-11-16 2023-09-20 Umnai Limited Method for an explainable autoencoder and an explainable generative adversarial network
CN112950291B (zh) * 2021-03-31 2023-07-21 北京奇艺世纪科技有限公司 模型的偏差优化方法、装置、设备及计算机可读介质
CN113066475B (zh) * 2021-06-03 2021-08-06 成都启英泰伦科技有限公司 一种基于生成式对抗网络的语音合成方法
CN113536080B (zh) * 2021-07-20 2023-06-20 湖南快乐阳光互动娱乐传媒有限公司 一种数据上传方法、装置及电子设备
CN114609493B (zh) * 2022-05-09 2022-08-12 杭州兆华电子股份有限公司 一种信号数据增强的局部放电信号识别方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10475165B2 (en) * 2017-04-06 2019-11-12 Disney Enterprises, Inc. Kernel-predicting convolutional neural networks for denoising
US10242292B2 (en) * 2017-06-13 2019-03-26 Digital Surgery Limited Surgical simulation for training detection and classification neural networks
US10162816B1 (en) 2017-06-15 2018-12-25 Oath Inc. Computerized system and method for automatically transforming and providing domain specific chatbot responses
EP3635605B1 (en) * 2017-07-24 2022-06-15 Samsung Electronics Co., Ltd. Electronic device and method for controlling the electronic device
US10642846B2 (en) * 2017-10-13 2020-05-05 Microsoft Technology Licensing, Llc Using a generative adversarial network for query-keyword matching
US10380260B2 (en) * 2017-12-14 2019-08-13 Qualtrics, Llc Capturing rich response relationships with small-data neural networks
US10789703B2 (en) * 2018-03-19 2020-09-29 Kla-Tencor Corporation Semi-supervised anomaly detection in scanning electron microscope images
US11481416B2 (en) * 2018-07-12 2022-10-25 International Business Machines Corporation Question Answering using trained generative adversarial network based modeling of text
US11151334B2 (en) * 2018-09-26 2021-10-19 Huawei Technologies Co., Ltd. Systems and methods for multilingual text generation field

Also Published As

Publication number Publication date
US11042710B2 (en) 2021-06-22
US20200125640A1 (en) 2020-04-23
EP3640814A1 (en) 2020-04-22

Similar Documents

Publication Publication Date Title
JP2020064621A (ja) 敵対的生成ネットワークを用いるユーザフレンドリな説明生成
CN108630190B (zh) 用于生成语音合成模型的方法和装置
US11120217B2 (en) Natural language translation-based orchestration workflow generation
US11874861B2 (en) Retraining a conversation system based on negative feedback
US10169336B2 (en) Translating structured languages to natural language using domain-specific ontology
US11069346B2 (en) Intent recognition model creation from randomized intent vector proximities
US10839033B1 (en) Referring expression generation
JP2020064622A (ja) 敵対的生成ネットワークを用いる異なる認知値により説明生成
US20200183961A1 (en) External action execution with conversational agent
WO2020182892A1 (en) System and method for interoperable communication of between entities with different structures
CN116802629A (zh) 用于自然语言处理的多因素建模
CN111340245B (zh) 一种模型训练方法及系统
WO2023278980A1 (en) Interface to natural language generator for generation of knowledge assessment items
US20210064982A1 (en) Cross-domain homophily quanitifcation for transfer learning
Dinesh et al. Ai bot for academic schedules using rasa
US10970490B2 (en) Automatic evaluation of artificial intelligence-based processes
US11876756B2 (en) Graph-based natural language generation for conversational systems
WO2022121663A1 (en) Adversarial hardening of queries against automated responses
US11379738B2 (en) Using higher order actions to annotate a syntax tree with real data for concepts used to generate an answer to a question
US10585986B1 (en) Entity structured representation and variant generation
US11968088B1 (en) Artificial intelligence for intent-based networking
US11881217B2 (en) Solution guided response generation for dialog systems
US20220198321A1 (en) Data Validation Systems and Methods
US20230316101A1 (en) Knowledge Graph Driven Content Generation
Dosanalieva Based on Android operating system" Beat. Development of mobile application" Maker"

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220609

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20230206