JP7547653B2 - 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル - Google Patents
文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル Download PDFInfo
- Publication number
- JP7547653B2 JP7547653B2 JP2023561822A JP2023561822A JP7547653B2 JP 7547653 B2 JP7547653 B2 JP 7547653B2 JP 2023561822 A JP2023561822 A JP 2023561822A JP 2023561822 A JP2023561822 A JP 2023561822A JP 7547653 B2 JP7547653 B2 JP 7547653B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- contextual
- language model
- text string
- machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9038—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/30—Creation or generation of source code
- G06F8/38—Creation or generation of source code for implementing user interfaces
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/092—Reinforcement learning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Human Computer Interaction (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Machine Translation (AREA)
- Stored Programmes (AREA)
- Devices For Executing Special Programs (AREA)
- Debugging And Monitoring (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本出願は、2021年5月21日に出願された米国仮特許出願第63/191,563号の優先権および利益を主張する。米国仮特許出願第63/191,563号は、その全体が参照により本明細書に組み込まれる。
一般に、本開示は、文脈テキスト生成のサービスにおいて中間テキスト分析(たとえば、APIなどの構造ツールの使用を含む)を生成する1つまたは複数の機械学習済み言語モデルを含むかつ/または活用するシステムおよびモデルを対象にする。たとえば、コンピューティングシステムは、1つまたは複数の文脈テキストトークンを含む文脈テキスト文字列を取得することができる。コンピューティングシステムは、1つまたは複数の中間テキストトークンを含む1つまたは複数の中間テキスト文字列を生成するために、機械学習済み言語モデルを用いて文脈テキスト文字列を処理することができる。コンピューティングシステムは、1つまたは複数の出力テキストトークンを含む出力テキスト文字列を生成するために、機械学習済み言語モデルを用いて1つまたは複数の中間テキスト文字列を処理することができる。1つまたは複数の中間テキスト文字列は、出力テキスト文字列をサポートする文脈テキスト文字列のテキスト分析を含むことができる。
図1は、本開示の例示的な実施形態による、文脈テキスト生成のサービスにおいてテキスト分析を生成する例示的な機械学習済み言語モデルのブロック図を示す。具体的には、言語モデル14は、1つまたは複数の文脈テキストトークンを含む文脈テキスト文字列12を受信することができる。言語モデル14は、1つまたは複数の中間テキストトークンを含む1つまたは複数の中間テキスト文字列16を生成するために、文脈テキスト文字列12を処理することができる。言語モデル14は、1つまたは複数の出力テキストトークン18を含む出力テキスト文字列を生成するために、1つまたは複数の中間テキスト文字列16を処理することができる。1つまたは複数の中間テキスト文字列16は、出力テキスト文字列18を生成するために文脈テキスト文字列12の論理分析をサポートする、もたらす、証明する、または場合によっては示す文脈テキスト文字列12のテキスト分析を含むことができる。
このセクションは、様々な例示的なアプリケーションを示す中間テキスト分析のいくつかの例を提供する。
図5Aは、本開示の例示的実施形態による例示的コンピューティングシステム100のブロック図を示す。システム100は、ネットワーク180を介して通信可能に結合されている、ユーザコンピューティングデバイス102、サーバコンピューティングシステム130、およびトレーニング用コンピューティングシステム150を含む。
本明細書において論じた技術は、サーバ、データベース、ソフトウェアアプリケーション、および他のコンピュータベースのシステム、ならびに行われるアクションおよびそのようなシステムとの間で送られる情報を参照する。コンピュータベースのシステムに固有の柔軟性によって、構成要素の間のタスクおよび機能の多種多様な可能な構成、組合せ、および分割が可能になる。たとえば、本明細書で説明するプロセスは、単一のデバイスもしくは構成要素、または組合せにおいて働く複数のデバイスもしくは構成要素を使用して実装され得る。データベースおよびアプリケーションは、単一のシステム上で実装されるか、または複数のシステムにわたって分散され得る。分散構成要素は、順次または並行して動作することができる。
12 文脈テキスト文字列
14 言語モデル
15 構造ツール
16 中間テキスト文字列
18 出力テキスト文字列
50 コンピューティングデバイス
100 コンピューティングシステム
102 ユーザコンピューティングデバイス
112 プロセッサ
114 メモリ
116 データ
118 命令
120 機械学習済みモデル
122 ユーザ入力構成要素
130 サーバコンピューティングシステム
132 プロセッサ
134 メモリ
136 データ
138 命令
140 機械学習済みモデル
150 トレーニング用コンピューティングシステム
152 プロセッサ
154 メモリ
156 データ
158 命令
160 モデル訓練器
162 トレーニングデータのセット
180 ネットワーク
202 ベース言語モデル
204 ベース出力
312 訓練テキストトークン
314 言語モデル
316 次の予測されるテキストトークン
318 損失関数
412 文脈トークン
414 機械学習済み言語モデル
415 構造ツール
416 出力トークン
418 報酬関数
Claims (19)
- 改善された解釈可能性を有する文脈テキスト生成のためのコンピューティングシステムであって、
1つまたは複数のプロセッサと、
1つまたは複数の非一時的コンピュータ可読媒体とを含み、前記1つまたは複数の非一時的コンピュータ可読媒体が、
文脈テキスト生成のサービスにおいてテキスト分析を実行する機械学習済み言語モデルと、
前記1つまたは複数のプロセッサによって実行されるときに前記コンピューティングシステムに動作を実行させる命令とをまとめて記憶し、前記動作が、
1つまたは複数の文脈テキストトークンを含む文脈テキスト文字列を取得することと、
1つまたは複数の中間テキストトークンを含む1つまたは複数の中間テキスト文字列を生成するために、前記機械学習済み言語モデルを用いて前記文脈テキスト文字列を処理することであって、前記1つまたは複数の中間テキストトークンが、前記文脈テキスト文字列に含まれない追加の情報にアクセスするために構造ツールの使用を引き起こす少なくとも1つのツールトークンを含む、ことと、
1つまたは複数の出力テキストトークンを含む出力テキスト文字列を生成するために、前記機械学習済み言語モデルを用いて前記1つまたは複数の中間テキスト文字列を処理することとを含み、
前記1つまたは複数の中間テキスト文字列は、前記出力テキスト文字列をサポートする前記文脈テキスト文字列のテキスト分析を含む、コンピューティングシステム。 - 前記構造ツールが、データベースから追加の情報にアクセスするためにデータベース検索を含む、請求項1に記載のコンピューティングシステム。
- 前記構造ツールが、アプリケーションプログラミングインターフェース(API)を介して追加の情報を要求して受信するために、API呼び出しを含む、請求項1に記載のコンピューティングシステム。
- 前記構造ツールが、入力テキストトークン上で1つまたは複数の動作のシーケンスを実行するプログラミング言語インタープリタを含む、請求項1に記載のコンピューティングシステム。
- 前記構造ツールが、検索エンジン、ナレッジグラフ、またはデジタルアシスタントからの結果をクエリするクエリサービスを含む、請求項1に記載のコンピューティングシステム。
- 前記機械学習済み言語モデルが前記ツールトークンを生成するとき、前記動作が、
前記機械学習済み言語モデルを中断することと、
前記追加の情報にアクセスするために前記構造ツールを実行することと、
前記1つまたは複数の中間テキスト文字列の現在のバージョンに前記追加の情報を付加することと、
前記1つまたは複数の中間テキスト文字列の前記現在のバージョンおよび前記付加された追加の情報に基づいて前記機械学習済み言語モデルを用いてテキスト生成を再開することとを含む、請求項1に記載のコンピューティングシステム。 - オーディオ出力を生成するために音声合成システムを用いて出力テキスト文字列を処理することをさらに含む、請求項1に記載のコンピューティングシステム。
- 前記機械学習済み言語モデルは、トークンごとに動作し、前記1つまたは複数の中間テキスト文字列を生成するとき、各生成された中間テキストトークンを再帰的に入力として受信する、請求項1に記載のコンピューティングシステム。
- 1つまたは複数の中間テキストトークンを含む1つまたは複数の中間テキスト文字列を生成するために前記機械学習済み言語モデルを用いて前記文脈テキスト文字列を処理することが、
第1の反復に対して、
1つまたは複数の中間テキストトークンを含む第1の中間テキスト文字列を生成するために、前記機械学習済み言語モデルを用いて前記文脈テキスト文字列を処理することと、
更新された文脈テキスト文字列を生成するために、前記文脈テキスト文字列に前記第1の中間テキスト文字列を付加することと、
1つまたは複数の追加の反復の各々に対して、前記機械学習済み言語モデルが閉止トークンを出力するまで、
1つまたは複数の中間テキストトークンを含む追加の中間テキスト文字列を生成するために、前記機械学習済み言語モデルを用いて前記更新された文脈テキスト文字列を処理することと、
次の反復に対して前記更新された文脈テキスト文字列を生成するために、前記更新された文脈テキスト文字列に前記追加の中間テキスト文字列を付加することとを含む、請求項1に記載のコンピューティングシステム。 - 前記機械学習済み言語モデルが、複数の訓練タプル上で訓練されており、各訓練タプルは、例示的な文脈テキスト文字列、1つまたは複数の例示的な中間テキスト文字列、および例示的な出力テキスト文字列を含む、請求項1に記載のコンピューティングシステム。
- 少なくとも前記1つまたは複数の例示的な中間テキスト文字列が、ヒューマンラベラーによって生成されている、請求項10に記載のコンピューティングシステム。
- 前記機械学習済み言語モデルが質問応答モデルを含み、前記文脈テキスト文字列が質問を含む、請求項1に記載のコンピューティングシステム。
- 前記機械学習済み言語モデルが対話モデルを含み、前記文脈テキスト文字列が対話履歴を含む、請求項1に記載のコンピューティングシステム。
- 前記機械学習済み言語モデルが、
回帰型ニューラルネットワーク、
マルチヘッドセルフアテンションモデル、または
シーケンスツーシーケンスモデルを含む、請求項1に記載のコンピューティングシステム。 - 前記文脈テキスト文字列の少なくとも一部が、ユーザによって入力されたテキストを含み、前記動作が、前記ユーザに表示するために少なくとも前記出力テキスト文字列を提供することをさらに含む、請求項1に記載のコンピューティングシステム。
- 前記文脈テキスト文字列が、中間テキスト文字列を生成することなく、元の文脈テキスト文字列からベース出力を直接生成するように構成された機械学習済み言語モデルによって生成された前記ベース出力と連結された前記元の文脈テキスト文字列を含む、請求項1に記載のコンピューティングシステム。
- 改善された文脈テキスト生成のためのコンピュータ実装方法であって、
複数の訓練タプルを取得するステップであって、各訓練タプルは、1つまたは複数の文脈テキストトークンを含む例示的な文脈テキスト文字列、1つまたは複数の中間テキストトークンを含む1つまたは複数の例示的な中間テキスト文字列、および1つまたは複数の出力テキストトークンを含む例示的な出力テキスト文字列を含む、ステップと、
各訓練タプルに対して、
前記訓練タプルの少なくとも一部を言語モデルに入力するステップと、
予測された次のトークンを前記言語モデルの出力として受信するステップであって、前記予測される次のトークンは、前記訓練タプルの前記一部を処理することによって前記言語モデルによって生成される、ステップと、
前記言語モデルによって生成された前記予測される次のトークンを、前記訓練タプルに含まれる実際の次のトークンと比較する損失関数を評価するステップと、
前記損失関数の前記評価に基づいて前記言語モデルの1つまたは複数のパラメータの1つまたは複数の値を修正するステップとを含み、
前記訓練タプルのうちの少なくとも1つに対して、前記1つまたは複数の中間テキストトークンが、前記例示的な文脈テキスト文字列に含まれない追加の情報にアクセスするために、構造ツールの使用を引き起こす少なくとも1つのツールトークンを含み、前記追加の情報が、前記1つまたは複数の中間テキストトークンに含まれる、コンピュータ実装方法。 - 各訓練タプルに対して、前記入力するステップ、受信するステップ、評価するステップ、および修正するステップが、前記1つまたは複数の例示的な中間テキスト文字列および前記例示的な出力テキスト文字列に含まれる各トークンに対して実行される、請求項17に記載のコンピュータ実装方法。
- 改善された解釈可能性を有する文脈テキスト生成のためのコンピューティングシステムであって、
1つまたは複数のプロセッサと、
1つまたは複数の非一時的コンピュータ可読媒体とを含み、前記1つまたは複数の非一時的コンピュータ可読媒体が、
文脈テキスト生成のサービスにおいてテキスト分析を実行する機械学習済み言語モデルと、
前記1つまたは複数のプロセッサによって実行されるときに前記コンピューティングシステムに動作を実行させる命令とをまとめて記憶し、前記動作が、
1つまたは複数の文脈テキストトークンを含む文脈テキスト文字列を取得することと、
1つまたは複数の中間テキストトークンを含む1つまたは複数の中間テキスト文字列を生成するために、前記機械学習済み言語モデルを用いて前記文脈テキスト文字列を処理することであって、1つまたは複数の中間テキストトークンを含む1つまたは複数の中間テキスト文字列を生成するために前記機械学習済み言語モデルを用いて前記文脈テキスト文字列を処理することが、
第1の反復に対して、
1つまたは複数の中間テキストトークンを含む第1の中間テキスト文字列を生成するために、前記機械学習済み言語モデルを用いて前記文脈テキスト文字列を処理することと、
更新された文脈テキスト文字列を生成するために、前記文脈テキスト文字列に前記第1の中間テキスト文字列を付加することと、
1つまたは複数の追加の反復の各々に対して、前記機械学習済み言語モデルが閉止トークンを出力するまで、
1つまたは複数の中間テキストトークンを含む追加の中間テキスト文字列を生成するために、前記機械学習済み言語モデルを用いて前記更新された文脈テキスト文字列を処理することと、
次の反復に対して前記更新された文脈テキスト文字列を生成するために、前記更新された文脈テキスト文字列に前記追加の中間テキスト文字列を付加することとを含む、ことと、
1つまたは複数の出力テキストトークンを含む出力テキスト文字列を生成するために、前記機械学習済み言語モデルを用いて前記1つまたは複数の中間テキスト文字列を処理することとを含み、
前記1つまたは複数の中間テキスト文字列は、前記出力テキスト文字列をサポートする前記文脈テキスト文字列のテキスト分析を含む、コンピューティングシステム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2024065417A JP7547677B2 (ja) | 2021-05-21 | 2024-04-15 | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル |
| JP2024141989A JP7769062B2 (ja) | 2021-05-21 | 2024-08-23 | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル |
| JP2024144022A JP7793705B2 (ja) | 2021-05-21 | 2024-08-26 | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US202163191563P | 2021-05-21 | 2021-05-21 | |
| US63/191,563 | 2021-05-21 | ||
| PCT/US2022/030249 WO2022246194A1 (en) | 2021-05-21 | 2022-05-20 | Machine-learned language models which generate intermediate textual analysis in service of contextual text generation |
Related Child Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024065417A Division JP7547677B2 (ja) | 2021-05-21 | 2024-04-15 | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル |
| JP2024144022A Division JP7793705B2 (ja) | 2021-05-21 | 2024-08-26 | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2024520994A JP2024520994A (ja) | 2024-05-28 |
| JP7547653B2 true JP7547653B2 (ja) | 2024-09-09 |
Family
ID=82156703
Family Applications (4)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023561822A Active JP7547653B2 (ja) | 2021-05-21 | 2022-05-20 | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル |
| JP2024065417A Active JP7547677B2 (ja) | 2021-05-21 | 2024-04-15 | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル |
| JP2024141989A Active JP7769062B2 (ja) | 2021-05-21 | 2024-08-23 | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル |
| JP2024144022A Active JP7793705B2 (ja) | 2021-05-21 | 2024-08-26 | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル |
Family Applications After (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024065417A Active JP7547677B2 (ja) | 2021-05-21 | 2024-04-15 | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル |
| JP2024141989A Active JP7769062B2 (ja) | 2021-05-21 | 2024-08-23 | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル |
| JP2024144022A Active JP7793705B2 (ja) | 2021-05-21 | 2024-08-26 | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル |
Country Status (8)
| Country | Link |
|---|---|
| US (4) | US11574131B2 (ja) |
| EP (1) | EP4298547A1 (ja) |
| JP (4) | JP7547653B2 (ja) |
| KR (7) | KR20250083582A (ja) |
| CN (3) | CN119691246A (ja) |
| BR (1) | BR112023021621A2 (ja) |
| CA (1) | CA3213522A1 (ja) |
| WO (1) | WO2022246194A1 (ja) |
Families Citing this family (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119691246A (zh) * | 2021-05-21 | 2025-03-25 | 谷歌有限责任公司 | 生成中间文本分析以服务于上下文文本生成的机器学习语言模型 |
| WO2023235346A1 (en) * | 2022-06-03 | 2023-12-07 | Google Llc | Prompting machine-learned models using chains of thought |
| US20240184982A1 (en) * | 2022-12-01 | 2024-06-06 | Deepmind Technologies Limited | Hierarchical text generation using language model neural networks |
| US20240256762A1 (en) * | 2023-01-31 | 2024-08-01 | Shopify Inc. | Methods and systems for prompting large language model to process inputs from multiple user elements |
| US12541638B2 (en) | 2023-02-15 | 2026-02-03 | Microsoft Technology Licensing, Llc | Generative collaborative publishing system |
| US20240273286A1 (en) * | 2023-02-15 | 2024-08-15 | Microsoft Technology Licensing, Llc | Generative collaborative publishing system |
| US12493740B2 (en) | 2023-02-15 | 2025-12-09 | Microsoft Technology Licensing, Llc | Generative collaborative publishing system |
| US20240281487A1 (en) * | 2023-02-17 | 2024-08-22 | Snowflake Inc. | Enhanced search result generation using multi-document summarization |
| US20240290462A1 (en) * | 2023-02-28 | 2024-08-29 | Microsoft Technology Licensing, Llc | Generating Multi-Sensory Content based on User State |
| CN115952274B (zh) * | 2023-03-10 | 2023-06-27 | 北京百度网讯科技有限公司 | 基于深度学习模型的数据生成方法、训练方法和装置 |
| US20240419912A1 (en) * | 2023-06-13 | 2024-12-19 | Microsoft Technology Licensing, Llc | Detecting hallucination in a language model |
| US20250054405A1 (en) * | 2023-08-08 | 2025-02-13 | Google Llc | System for Providing Step-by-Step Explanations of Pedagogical Exercises Using Machine-Learned Models |
| CN117033030B (zh) * | 2023-08-25 | 2024-07-12 | 玻尔科技成都有限公司 | 基于大规模语言模型的应用程序接口调度系统及方法 |
| WO2025149761A1 (en) * | 2024-01-10 | 2025-07-17 | Technology Innovation Institute-Sole Proprietorship Llc | Edge prompt personalization in large language models |
| CN118394422A (zh) * | 2024-03-13 | 2024-07-26 | 中国科学院自动化研究所 | 用于智能硬件协同控制的提示工程方法、系统及设备 |
| CN118194881B (zh) * | 2024-04-16 | 2025-07-25 | 摩尔线程智能科技(北京)股份有限公司 | 文本生成系统及方法 |
| US20250348628A1 (en) * | 2024-05-10 | 2025-11-13 | The Regents Of The University Of Michigan | Automated framework for simulated time-series data generation based on user-defined criteria |
| US20250371041A1 (en) * | 2024-05-29 | 2025-12-04 | Microsoft Technology Licensing, Llc | Semantic-tree-based ai content management platform |
| CN118838155B (zh) * | 2024-06-07 | 2025-02-28 | 天津大学 | 一种基于大语言模型的经验学习自适应预瞄控制方法 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20190130305A1 (en) | 2017-10-27 | 2019-05-02 | Intuit Inc. | Methods, systems, and computer program product for implementing an intelligent system with dynamic configurability |
| US20200110803A1 (en) | 2018-10-08 | 2020-04-09 | Tableau Software, Inc. | Determining Levels of Detail for Data Visualizations Using Natural Language Constructs |
| US20210073465A1 (en) | 2019-09-11 | 2021-03-11 | Oracle International Corporation | Semantic parser including a coarse semantic parser and a fine semantic parser |
| JP2021524623A (ja) | 2018-05-18 | 2021-09-13 | セールスフォース ドット コム インコーポレイティッド | 質問応答としてのマルチタスク学習 |
Family Cites Families (64)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20040243554A1 (en) * | 2003-05-30 | 2004-12-02 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis |
| US20040243556A1 (en) * | 2003-05-30 | 2004-12-02 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis, and including a document common analysis system (CAS) |
| US7139752B2 (en) * | 2003-05-30 | 2006-11-21 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis, and providing multiple document views derived from different document tokenizations |
| US7146361B2 (en) * | 2003-05-30 | 2006-12-05 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis, including a search operator functioning as a Weighted AND (WAND) |
| CA2529037A1 (en) | 2003-08-15 | 2005-02-24 | Silverbrook Research Pty Ltd | Natural language recognition using distributed processing |
| US20110196864A1 (en) * | 2009-09-03 | 2011-08-11 | Steve Mason | Apparatuses, methods and systems for a visual query builder |
| US9472189B2 (en) * | 2012-11-02 | 2016-10-18 | Sony Corporation | Language processing method and integrated circuit |
| US9342502B2 (en) * | 2013-11-20 | 2016-05-17 | International Business Machines Corporation | Contextual validation of synonyms in otology driven natural language processing |
| US10095689B2 (en) * | 2014-12-29 | 2018-10-09 | International Business Machines Corporation | Automated ontology building |
| US20200143247A1 (en) * | 2015-01-23 | 2020-05-07 | Conversica, Inc. | Systems and methods for improved automated conversations with intent and action response generation |
| WO2016183229A1 (en) * | 2015-05-11 | 2016-11-17 | Olsher Daniel Joseph | Universal task independent simulation and control platform for generating controlled actions using nuanced artificial intelligence |
| US20170075877A1 (en) * | 2015-09-16 | 2017-03-16 | Marie-Therese LEPELTIER | Methods and systems of handling patent claims |
| CN106844368B (zh) * | 2015-12-03 | 2020-06-16 | 华为技术有限公司 | 用于人机对话的方法、神经网络系统和用户设备 |
| US10831800B2 (en) * | 2016-08-26 | 2020-11-10 | International Business Machines Corporation | Query expansion |
| US11367074B2 (en) * | 2016-10-28 | 2022-06-21 | Fair Isaac Corporation | High resolution transaction-level fraud detection for payment cards in a potential state of fraud |
| CN108021549B (zh) * | 2016-11-04 | 2019-08-13 | 华为技术有限公司 | 序列转换方法及装置 |
| TWI753034B (zh) * | 2017-03-31 | 2022-01-21 | 香港商阿里巴巴集團服務有限公司 | 特徵向量的產生、搜索方法、裝置及電子設備 |
| US10817650B2 (en) | 2017-05-19 | 2020-10-27 | Salesforce.Com, Inc. | Natural language processing using context specific word vectors |
| WO2018232623A1 (en) * | 2017-06-21 | 2018-12-27 | Microsoft Technology Licensing, Llc | Providing personalized songs in automated chatting |
| US10877735B1 (en) * | 2017-09-25 | 2020-12-29 | Amazon Technologies, Inc. | Automated generation of software applications using analysis of submitted content items |
| CN110020010A (zh) * | 2017-10-10 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置及电子设备 |
| EP3625699A1 (en) * | 2017-10-25 | 2020-03-25 | Google LLC | Natural language processing with an n-gram machine |
| DE102017219631A1 (de) * | 2017-11-06 | 2019-05-09 | Heidelberger Druckmaschinen Ag | CAD/CAM Analyse Werkzeug mit Rückverbindung zu CAD/CAM Daten |
| US11222627B1 (en) * | 2017-11-22 | 2022-01-11 | Educational Testing Service | Exploring ASR-free end-to-end modeling to improve spoken language understanding in a cloud-based dialog system |
| US11030414B2 (en) | 2017-12-26 | 2021-06-08 | The Allen Institute For Artificial Intelligence | System and methods for performing NLP related tasks using contextualized word representations |
| US10977711B1 (en) * | 2018-01-03 | 2021-04-13 | Amazon Technologies, Inc. | Artificial intelligence system with hierarchical machine learning for interaction session optimization |
| US10769295B2 (en) * | 2018-01-18 | 2020-09-08 | Sap Se | Join operations on encrypted database tables |
| JP6523498B1 (ja) * | 2018-01-19 | 2019-06-05 | ヤフー株式会社 | 学習装置、学習方法および学習プログラム |
| US10169315B1 (en) * | 2018-04-27 | 2019-01-01 | Asapp, Inc. | Removing personal information from text using a neural network |
| CN109271878B (zh) * | 2018-08-24 | 2020-04-21 | 北京地平线机器人技术研发有限公司 | 图像识别方法、图像识别装置和电子设备 |
| CN110162799B (zh) | 2018-11-28 | 2023-08-04 | 腾讯科技(深圳)有限公司 | 模型训练方法、机器翻译方法以及相关装置和设备 |
| US11194815B1 (en) * | 2019-02-11 | 2021-12-07 | Amazon Technologies, Inc. | Constrained query execution |
| US11475329B2 (en) * | 2019-04-03 | 2022-10-18 | RELX Inc. | Systems and methods for adaptive training of a machine learning system processing textual data |
| US11475216B2 (en) * | 2019-06-17 | 2022-10-18 | Microsoft Technology Licensing, Llc | Constructing answers to queries through use of a deep model |
| CN110415022B (zh) * | 2019-07-05 | 2023-08-18 | 创新先进技术有限公司 | 处理用户行为序列的方法及装置 |
| CN118349673A (zh) * | 2019-09-12 | 2024-07-16 | 华为技术有限公司 | 文本处理模型的训练方法、文本处理方法及装置 |
| CN110781312B (zh) * | 2019-09-19 | 2022-07-15 | 平安科技(深圳)有限公司 | 基于语义表征模型的文本分类方法、装置和计算机设备 |
| KR20210043995A (ko) * | 2019-10-14 | 2021-04-22 | 삼성전자주식회사 | 모델 학습 방법 및 장치, 및 시퀀스 인식 방법 |
| US11269907B1 (en) * | 2019-11-15 | 2022-03-08 | Palantir Technologies Inc. | Object-centric data analysis system and graphical user interface |
| CN112818671B (zh) * | 2019-11-15 | 2024-11-12 | 阿里巴巴集团控股有限公司 | 文本信息的处理方法、装置、存储介质和处理器 |
| US20230009370A1 (en) * | 2019-12-09 | 2023-01-12 | Nippon Telegraph And Telephone Corporation | Model learning apparatus, voice recognition apparatus, method and program thereof |
| GB2590509B (en) * | 2019-12-20 | 2022-06-15 | Sonantic Ltd | A text-to-speech synthesis method and system, and a method of training a text-to-speech synthesis system |
| CN111382582B (zh) | 2020-01-21 | 2023-04-07 | 沈阳雅译网络技术有限公司 | 一种基于非自回归的神经机器翻译解码加速方法 |
| US11921711B2 (en) * | 2020-03-06 | 2024-03-05 | Alibaba Group Holding Limited | Trained sequence-to-sequence conversion of database queries |
| CN111428470B (zh) | 2020-03-23 | 2022-04-22 | 北京世纪好未来教育科技有限公司 | 文本连贯性判定及其模型训练方法、电子设备及可读介质 |
| US20210319338A1 (en) * | 2020-04-09 | 2021-10-14 | Royal Bank Of Canada | System and method for testing machine learning |
| CN111611377B (zh) * | 2020-04-22 | 2021-10-29 | 淮阴工学院 | 基于知识蒸馏的多层神经网络语言模型训练方法与装置 |
| CN111723220B (zh) | 2020-06-18 | 2023-03-10 | 中南大学 | 基于注意力机制和哈希的图像检索方法、装置及存储介质 |
| CN111538908B (zh) | 2020-06-22 | 2020-10-20 | 腾讯科技(深圳)有限公司 | 搜索排序方法、装置、计算机设备和存储介质 |
| CN111860785A (zh) | 2020-07-24 | 2020-10-30 | 中山大学 | 基于注意力机制循环神经网络的时间序列预测方法及系统 |
| US11514888B2 (en) * | 2020-08-13 | 2022-11-29 | Google Llc | Two-level speech prosody transfer |
| CN111967224A (zh) | 2020-08-18 | 2020-11-20 | 深圳市欢太科技有限公司 | 对话文本的处理方法、装置、电子设备及存储介质 |
| US11734510B2 (en) * | 2020-08-27 | 2023-08-22 | Bayerische Motoren Werke Aktiengesellschaft | Natural language processing of encoded question tokens and encoded table schema based on similarity |
| CN112434212B (zh) | 2020-09-18 | 2021-11-23 | 昆明理工大学 | 基于神经自回归分布估计的涉案新闻主题模型构建方法及装置 |
| US11749264B2 (en) * | 2020-11-03 | 2023-09-05 | Salesforce, Inc. | System and methods for training task-oriented dialogue (TOD) language models |
| CN112347780B (zh) | 2020-11-27 | 2023-09-12 | 浙江大学 | 基于深度神经网络的司法事实查明生成方法、装置、介质 |
| US11481210B2 (en) * | 2020-12-29 | 2022-10-25 | X Development Llc | Conditioning autoregressive language model to improve code migration |
| US11829449B2 (en) * | 2020-12-30 | 2023-11-28 | Zoox, Inc. | Intermediate input for machine learned model |
| US11620903B2 (en) * | 2021-01-14 | 2023-04-04 | Baidu Usa Llc | Machine learning model to fuse emergency vehicle audio and visual detection |
| CN114973393B (zh) * | 2021-02-26 | 2025-01-07 | 北京市商汤科技开发有限公司 | 一种关系检测方法、装置、计算机设备及存储介质 |
| CN113052246B (zh) * | 2021-03-30 | 2023-08-04 | 北京百度网讯科技有限公司 | 用于训练分类模型及图像分类的方法和相关装置 |
| CN119691246A (zh) * | 2021-05-21 | 2025-03-25 | 谷歌有限责任公司 | 生成中间文本分析以服务于上下文文本生成的机器学习语言模型 |
| JP7804056B2 (ja) * | 2021-07-28 | 2026-01-21 | グーグル エルエルシー | 自己回帰言語モデルニューラルネットワークを使用して出力系列を評価すること |
| US12148421B2 (en) * | 2021-09-07 | 2024-11-19 | Google Llc | Using large language model(s) in generating automated assistant response(s |
-
2022
- 2022-05-20 CN CN202411587978.2A patent/CN119691246A/zh active Pending
- 2022-05-20 CN CN202280027602.9A patent/CN117178274B/zh active Active
- 2022-05-20 KR KR1020257017536A patent/KR20250083582A/ko active Pending
- 2022-05-20 KR KR1020257017487A patent/KR20250080921A/ko active Pending
- 2022-05-20 EP EP22732730.1A patent/EP4298547A1/en active Pending
- 2022-05-20 KR KR1020237039509A patent/KR102812249B1/ko active Active
- 2022-05-20 BR BR112023021621A patent/BR112023021621A2/pt unknown
- 2022-05-20 KR KR1020257017537A patent/KR20250083583A/ko active Pending
- 2022-05-20 WO PCT/US2022/030249 patent/WO2022246194A1/en not_active Ceased
- 2022-05-20 KR KR1020257017486A patent/KR20250080920A/ko active Pending
- 2022-05-20 CA CA3213522A patent/CA3213522A1/en active Pending
- 2022-05-20 KR KR1020257017538A patent/KR20250083584A/ko active Pending
- 2022-05-20 US US17/749,844 patent/US11574131B2/en active Active
- 2022-05-20 CN CN202410510827.0A patent/CN118445461B/zh active Active
- 2022-05-20 JP JP2023561822A patent/JP7547653B2/ja active Active
- 2022-05-20 KR KR1020247012535A patent/KR102815829B1/ko active Active
-
2023
- 2023-02-03 US US18/164,216 patent/US11960848B2/en active Active
-
2024
- 2024-03-13 US US18/603,734 patent/US12430515B2/en active Active
- 2024-03-13 US US18/603,756 patent/US12481834B2/en active Active
- 2024-04-15 JP JP2024065417A patent/JP7547677B2/ja active Active
- 2024-08-23 JP JP2024141989A patent/JP7769062B2/ja active Active
- 2024-08-26 JP JP2024144022A patent/JP7793705B2/ja active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20190130305A1 (en) | 2017-10-27 | 2019-05-02 | Intuit Inc. | Methods, systems, and computer program product for implementing an intelligent system with dynamic configurability |
| JP2021524623A (ja) | 2018-05-18 | 2021-09-13 | セールスフォース ドット コム インコーポレイティッド | 質問応答としてのマルチタスク学習 |
| US20200110803A1 (en) | 2018-10-08 | 2020-04-09 | Tableau Software, Inc. | Determining Levels of Detail for Data Visualizations Using Natural Language Constructs |
| US20210073465A1 (en) | 2019-09-11 | 2021-03-11 | Oracle International Corporation | Semantic parser including a coarse semantic parser and a fine semantic parser |
Non-Patent Citations (1)
| Title |
|---|
| 栗林 樹生、外6名,論述構造解析におけるスパン分散表現,自然言語処理,日本,一般社団法人言語処理学会,2020年12月15日,第27巻,第4号,p.753-779 |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7547677B2 (ja) | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル | |
| CN112567394B (zh) | 用于在有限的知识领域中构建知识图的技术 | |
| JP2024036354A (ja) | 言語タスクのための対照事前トレーニング | |
| US20200342347A1 (en) | Machine learning quantum algorithm validator | |
| US20240354065A1 (en) | Machine Learning for Automated Development of Data Schema from Natural Language Inputs | |
| EP4589442A1 (en) | Synthetic data generation utilizing generative artifical intelligence and scalable data generation tools | |
| US12306837B2 (en) | Intuitive data retrieval and visualization with large language models and logic programming | |
| CN115699021A (zh) | 子任务自适应神经网络 | |
| US20260037746A1 (en) | Machine-Learned Language Models Which Generate Intermediate Textual Analysis in Service of Contextual Text Generation | |
| US20260037745A1 (en) | Machine-Learned Language Models Which Generate Intermediate Textual Analysis in Service of Contextual Text Generation | |
| US20260037744A1 (en) | Machine-Learned Language Models Which Generate Intermediate Textual Analysis in Service of Contextual Text Generation | |
| US20260037747A1 (en) | Machine-Learned Language Models Which Generate Intermediate Textual Analysis in Service of Contextual Text Generation | |
| US20240354070A1 (en) | Machine Learning for Automated Development of Declarative Model Application Definition from Natural Language Inputs | |
| EP4636650A1 (en) | Dynamic determination of inference-time parameters | |
| Chandran | Explainable Artificial Intelligence (XAI) for Transparent Decision Systems |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231121 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231121 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240412 |
|
| A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20240412 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240729 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240828 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7547653 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |