JP2017505964A - 機械学習に基づく自動タスク分類 - Google Patents

機械学習に基づく自動タスク分類 Download PDF

Info

Publication number
JP2017505964A
JP2017505964A JP2016556246A JP2016556246A JP2017505964A JP 2017505964 A JP2017505964 A JP 2017505964A JP 2016556246 A JP2016556246 A JP 2016556246A JP 2016556246 A JP2016556246 A JP 2016556246A JP 2017505964 A JP2017505964 A JP 2017505964A
Authority
JP
Japan
Prior art keywords
task
user
request
category
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016556246A
Other languages
English (en)
Other versions
JP6440732B2 (ja
Inventor
ヒョン シク シン,
ヒョン シク シン,
ロナルド スジタン,
ロナルド スジタン,
サヤンデヴ ムカルジー,
サヤンデヴ ムカルジー,
ホンフェン イン,
ホンフェン イン,
ヤン スン,
ヤン スン,
和計 秋永
和計 秋永
ペロ スバシッチ,
ペロ スバシッチ,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of JP2017505964A publication Critical patent/JP2017505964A/ja
Application granted granted Critical
Publication of JP6440732B2 publication Critical patent/JP6440732B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering
    • G10L2015/0633Creating reference templates; Clustering using lexical or orthographic knowledge sources

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

機械学習アルゴリズムを用いて複数のタスクカテゴリの各々の中の、人間によって生成される要求の訓練データベースを処理して、後続のユーザ要求に対する最も可能性の高いタスクカテゴリを判定するために後続のユーザ要求に適用することができるタスク分類器モデルを開発するシステム及び方法が提供される。【選択図】 図1

Description

関連出願
[0001]本出願は、その内容全体が本明細書に組み込まれる、2013年11月27日に出願された米国仮特許出願第61/909,992号の利益を主張する。
[0002]本開示は、一般的にパーソナルアシスタントアプリケーション(personal assistant application)に関し、より詳細には、機械学習に基づくユーザ要求の処理に関する。
背景
[0003]ユーザのテキスト又は自然言語の要求に、対応するタスクを実行することによって応答する様々なパーソナルアシスタントソフトウェアアプリケーションが開発されている。たとえば、スマートフォンユーザによってアクセスされるパーソナルアシスタントアプリケーションは、電話番号検索を行って電話をかけ、レストランを検索し、電子メールを作成して送信し、カレンダー入力を行う、などすることができる。それに関連して、特定のユーザは、所与のタスクを求める要求について、他のユーザの表現とは異なる表現をすることが多い。そのような変化は、人間の対話に関して特有のものである。この表現の変動性に起因して、従来のパーソナルアシスタントソフトウェアアプリケーションは、一般的に、ユーザの所望の要求を適切に実行することに関してエラーを起こしやすい。その上、結果もたらされるアプリケーションは、その場しのぎのものになる傾向にあり、したがって、異なる言語に適用することが困難である。
[0004]したがって、ユーザによって所望されるタスクを分類及び実行することに関して、より良好な精度を有する言語非依存の改善されたシステムが、当該技術分野において必要とされている。
概要
[0005]タスク分類及び実行に関して精度を改善することを可能にするために、タスク分類に機械学習アルゴリズムを利用するシステム及び方法が提供される。様々なユーザから、複数のタスクカテゴリ内でユーザがどのように要求を表現したかに関連する訓練データベースが生成される。十分に多数のユーザを調査することによって、個々のユーザが所与の所望のタスクをどのように表現するかの自然な変動を、適切にサンプリングすることができる。たとえば、ユーザの母親のような特定の相手に電話するタスクに関して、或るユーザは、そのタスクを「ママに電話して(call mom)」と表現する場合があれば、一方で別のユーザはそのタスクを「ママに電話してください(please call mom)」又は「母に電話して(call mother)」と表現する場合がある。所与のタスクが異なるユーザによってどのように表現されるかに関するこれらの変動を特性化するために、たとえば、クラウドソーシングを通じて相対的に大規模な訓練データベースを生成することができる。結果もたらされる訓練データベースは、複数のタスクカテゴリからの特定のタスクの要求に関する数千のユーザの応答を含むことができる。ユーザが特定のタスクを意図していたことは事前に分かっているため、結果もたらされるユーザ要求は、その分類に関して曖昧さがない。したがって、訓練データベースは、すべてが適切なタスクカテゴリに編成されている、様々なユーザ要求の多数の例を有し得る。
[0006]そのような高品質の訓練データベースは、その後、様々な機械学習アルゴリズムによって利用することができる。たとえば各データベースユーザ要求は、特徴ベクトル又は他の数学的表現に変換することができる。したがって、訓練データベースは、各タスクカテゴリの様々な特徴ベクトルを含むことになり、各特徴ベクトルは、所与の訓練データベースユーザ要求に対応する。各特徴ベクトルの次元性は、所望の複雑度に応じて決まる。たとえば、所与のユーザ要求内の各固有の単語(又は語句)が、特徴ベクトル次元に対応することができる。各特徴ベクトル次元に対する重みは、対応する単語又は語句が対応するユーザ要求内に何回現れるかに応じて決まり得る。代替的に、重みは、所与の単語又は語句がユーザ要求内に存在したか否かのみに応じて重み付けが決まるような、2値であってもよい。結果もたらされる特徴ベクトルは、その後、各タスクの様々なユーザ要求が特徴ベクトル空間においてどのようにクラスタ化されるかのタスク分類器モデルを決定するために、サポートベクターマシンのような機械学習アルゴリズムを訓練するのに使用することができる。
[0007]タスク分類器モデルを開発するための様々なタスクに関する人間によって生成される要求の高品質の訓練データベースに対するこの先験的な機械学習を所与として、その後、タスク分類器モデルに従って、さらなるユーザ要求をリアルタイムでロバストに分類することができる。言い換えれば、受信されるユーザ要求が容易にテキストに変換され(自然言語入力の場合)、対応するテキストが特徴ベクトルに変換され、所定のタスク分類器モデルに従って予測されるタスクカテゴリに分類され得る。このプロセスは、タスク分類の精度を増大させるだけでなく、言語非依存でもある、つまり、ユーザ要求を対応する言語において適合させるためにこのプロセスを拡張するためには、他の言語における訓練データベースを収集するだけでよい。
[0008]タスク実行の精度を増大させるために、ユーザ要求は、その特定のクエリ(存在する場合)を判定するために予測タスクの識別情報に基づいてさらに処理することができる。これに関連して、各タスクカテゴリは、様々なクエリカテゴリと関連付けることができる。たとえば、ユーザ要求が「レストラン検索」タスクカテゴリに分類されていると仮定する。このタスク分類は、「レストランのタイプ」(たとえばイタリアン又は中華)及び「レストランの場所」(たとえば、パロアルト)のような様々なクエリタイプと関連付けることができる。所与のユーザ要求におけるクエリクラスのインスタンス化を、本明細書では「クエリ」として示す。たとえば、「パロアルトの良いイタリアンレストランを探して」のユーザ要求が処理されて、料理クエリ(イタリアン)及び場所クエリ(パロアルト)が抽出され得る。クエリ抽出の精度を増大させるために、クエリクラス及び対応する可能性のあるクエリの辞書を開発することができる。たとえば、辞書は、場所クエリカテゴリ内の各可能性のある場所に関するエントリを含むことができる。このとき、クエリ抽出は、ユーザ要求内の一致する辞書エントリを識別することを含むことができ、この辞書エントリはその後、辞書内の対応するクエリクラスと容易に関連付けられる。
[0009]タスク実行モジュールが、適切なアプリケーションプログラミングインターフェース(API)を呼び出すことによって、予測タスク及び任意の関連するクエリを使用することができる。たとえば、レストラン検索タスクは、レストラン検索のサービスを提供している「Yelp」のような外部検索プロバイダを使用して最良に実施され得る。他方、予測タスクが通話開始である場合、関連するクエリは、ユーザのポータブルデバイス内の携帯電話機能のAPIを通じて送信されることになる。
[0010]本明細書に開示されているシステム及び方法のさらなる特徴及び利点は、以下の詳細な説明を通じてより良好に諒解され得る。
本開示の一実施形態による、ユーザ要求を実行するためのシステムのブロック図である。 ユーザ要求がタスク分類された後のユーザ要求からのクエリ抽出を示す図である。 図1のシステムのタスク分類モジュールのより詳細なブロック図である。 図3のタスク分類モジュールによって使用されるタスク分類器モデルを作成するためのモジュールを示す図である。 図1のシステムのクエリ抽出モジュールのより詳細なブロック図である。 図1のシステムのタスク実行モジュールのより詳細なブロック図である。 本開示の一実施形態による、ユーザ要求を実行するように構成されているコンピュータシステムを示す図である。 [0018]本発明の実施形態及びその実施形態の利点は、以下の詳細な説明を参照することによって最良に理解される。1つ又は複数の図面に示されている同様の要素を識別するために、同様の参照符号が使用されることが諒解されるべきである。
[0019]下記に記載する詳細な説明は、添付の図面とともに、様々な構成の説明として意図されており、本明細書に記載されている概念を実践することができる唯一の構成を表すようには意図されていない。詳細な説明は、様々な概念の完全な理解を提供することを目的とした、特定の詳細を含む。しかしながら、これらの概念は、これらの特定の詳細なしに実施されることができることが当業者には諒解されよう。いくつかの事例において、そのような概念を曖昧にしないために、既知の構造及び構成要素がブロック図形式で示されている。
[0020]パーソナルアシスタントアプリケーションによるユーザ要求の実行の精度をより高くすることを可能にするために、タスクセットに関する以前に記録されたユーザ要求の訓練データベースに対する機械学習アルゴリズムを通じて、タスク分類器が訓練される。たとえば、クラウドソーシングを使用して、いくつかのタスクに関する人間によって生成される要求を含む訓練データベースを生成することができる。それに関連して、特定のユーザは、所与のタスクを求める要求について、他のユーザの表現とは異なる表現をすることが多い。そのような変化は、人間の対話に関して特有のものである。この表現の変動性に起因して、従来のパーソナルアシスタントソフトウェアアプリケーションは、多くの場合、ユーザの所望の要求を適切に実行することに関してエラーを起こしやすい。時間をかけて、そのような従来のパーソナルアシスタントアプリケーションは、適切なタスクが実行されるようにユーザによって訂正されることによって、当該アプリケーションの誤りから学習することができる。しかし、そのような経時的な学習は、ユーザにとって非常に苛立たしく、それによって、ユーザは、ユーザの意図を実行することに関して不可避の誤りを訂正するのに必要な時間を費やすよりも、パーソナルアシスタントアプリケーションを使用することをやめる可能性がある。
[0021]打って変わって、本明細書に開示されているシステム及び方法は、訓練データベースに関して訓練されるタスク分類器を使用して、ユーザが正確な結果を達成するために訓練のハードルを克服する必要がないように、ユーザ要求に対する対応するタスクを予測する。加えて、その後、識別されたタスクを利用して、ユーザ要求からクエリ及び対応するクエリカテゴリ又はクラスを抽出することができる。本明細書において使用される場合、ユーザ要求からのクエリの抽出に関する「クエリ」という用語は、所与のタスクの特定のパラメータを指す。タスクに基づいて、これらの特定のパラメータは、クラスに編成することができる。たとえば、レストラン検索は一般的に、ユーザが所望する料理のタイプ及び所望の場所を識別する。料理のタイプ及び所望の場所は各々、クエリクラスを含む。このとき、「クエリ」は、各クエリクラスの特定のインスタンス化を含むことになる。たとえば、「パロアルトのイタリアンレストランを探して」のユーザ要求は、料理のタイプの「イタリアン」、及び、所望の場所の「パロアルト」のクエリを有することになる。このクエリ抽出の精度は、予測タスクに応答して実施されることによって大きく増進されることに留意されたい。クエリ抽出に関連して、各タスクカテゴリは、可能性のあるクエリ及びそれらのクエリの対応するクエリカテゴリの辞書と関連付けることができる。ユーザ要求が特定の予測タスクに分類されると、ユーザ要求は、そのタスクの対応する辞書と比較されて、任意のクエリ及び対応するクエリクラスの一致が識別され得る。
[0022]その後、タスク実行モジュールが、予測タスク及び対応するクエリの識別情報を使用して、ユーザ要求を実行することができる。たとえば、タスク実行モジュールは、予測タスクを使用して、クエリを対応するアプリケーションプログラミングインターフェース(API)に送信することができる。APIが選択されるか否かにかかわらず、結果としてのタスク実行は、従来の手法と比較して顕著に正確である。ここで、いくつかの例示的な実施形態を説明する。
例示的な実施形態
[0023]ここで図面を参照すると、図1は、自然言語入力110を通じて受信されるようなユーザ要求を実行するための例示的なシステム100を示す。システム100は、自然言語入力110によって表されるようなユーザ要求を処理して、ユーザによって所望される対応するタスクを予測するように機能する。システム100は、ユーザ要求を、可能性のあるタスクカテゴリのセットから選択されるような所与のタスクに対応するように分類するように、容易に構成される。システム100によってサービスされ得る可能性のあるタスクのセットのサイズは、本明細書においてさらに説明されるように、設計上の選択に過ぎない。したがってシステム100は容易にスケーリング可能であるため、これは特に有利である。その上、本明細書においてさらに説明されるように、システム100はまた、英語に加えて他の言語に容易に適合される。
[0024]自然言語入力−テキスト変換器モジュール120が、ユーザの自然言語入力110をテキスト入力130に変換する。代替的に、ユーザは、(発話される)自然言語入力110を提供するのとは対照的に、テキスト入力130を直に提供してもよい。タスク分類器モジュール140が、テキスト入力130を処理して、本明細書においてさらに説明されるように、ユーザについて所望されるタスクを予測する。タスク分類器モジュール140によって判定されるような予測タスクに基づいて、クエリ抽出器モジュール150が、テキスト入力130を処理して、クエリ及び対応するクエリクラスを抽出する。例示的なクエリ抽出220が図2に示されている。この事例においては、「パロアルトの良いイタリアンレストランを探して」のユーザ要求が、図1のタスク分類器モジュール140によってレストラン検索タスクに分類されている。レストラン検索タスクは、2つのクエリクラス、すなわち、レストランのタイプ、及びまた、場所を含む。システム100のクエリ抽出器150が、ユーザ要求を解析して、各クエリクラスのインスタンス化を識別する。言い換えれば、クエリ抽出器150が、各クエリクラスの対応するクエリを識別する。図2の例において、結果もたらされるクエリ220は、イタリアンレストラン及びパロアルトである。再び図1を参照すると、タスク実行インターフェースモジュール160が、予測タスクを使用して、タスク実行モジュール170におけるAPIのような適切なタスク実行インターフェースについて選択する。
[0025]ここで、システム100の様々なモジュールの動作をより詳細に説明する。タスク分類器モジュール140の拡大ブロック図を図3に示す。モジュール140内の特徴抽出器モジュール310が、テキスト入力130を処理して特徴ベクトル320を抽出する。この抽出は、また、図4の訓練データセット400に対しても実施される。訓練データセット400は、様々なタスクカテゴリ又は分類にわたる多くの以前に収集されたユーザ要求を含む。図4の実施形態においては、32個のタスク分類がある。各タスクに対するユーザ要求は、整数を含み得る同じタスクIDを割り当てられる。たとえば、訓練データセット400は、以下の表1内のタスクに及び得る。
Figure 2017505964
[0026]代替的な実施形態について、タスクカテゴリの数は容易に変更され得ることが諒解されよう。訓練データセット400は、クラウドソーシング、既存の訓練データの他の自然言語への翻訳、ウェブサイト巡回、又は他の適切な方法によって生成することができる。クラウドソーシング実施形態においては、匿名の人間のユーザが、表1のタスクのような様々なタスクに対して自身の表現に関する質問に答える。ユーザは、自然言語応答などによって質問に答え、この応答はその後、入力テキストに変換されて、訓練データセット400を形成するために特徴ベクトルが抽出され得る訓練データベースが構築され得る。特徴抽出の前の入力テキストの例示的な訓練データベースを、以下の表2に示す。
Figure 2017505964
[0027]テキスト入力及び対応するタスクのこの例示的な訓練データベースにおいて、可能性のあるタスクカテゴリは、「レストラン検索」タスクカテゴリ及び「電話」タスクカテゴリを含むことになる。レストラン検索の例示的なテキストが「この近くで美味しいハンバーガー屋はどこか」である。訓練データベースは、人間のユーザによって生成される何千というこのような例示的なレストラン検索を含むように、容易に拡張することができる。他のタスクもまた、人間のユーザによって生成される数千の例示的なテキストによって表されてもよい。表2において、「電話」タスクは、「ママに電話して」及び「Joeに電話して」の2つの例示的なテキストを含む。一般的に、訓練データベースに入力することができるテキストが多いほど、本明細書に開示されている機械学習アルゴリズムがそのような各例から学習するという点で、より良好な結果になる。タスクは先験的にすでに識別されているため、訓練データベース内の各データは、タスク名(タスクID)及び人間のユーザによって生成される対応するテキスト入力を含む。「交通」のような所与のカテゴリに関する訓練データセット400内のすべてのユーザ要求は、同じタスクIDを与えられる。対応するユーザ要求のテキストは、特徴抽出モジュール310又はその等価物によって訓練特徴ベクトルに変換される。一実施形態において、訓練データセット400内の異なる各単語は、2進値によって表される特徴に対応する。テキスト入力が特定の単語を有する場合、この単語の特徴に対応する2進値は1に設定される。加えて、異なる各Nグラム、すなわち、ユーザ要求内のN個の単語から構成される語句も、2進値を割り当てられ得る。したがって、訓練特徴ベクトルの結果もたらされる特徴ベクトル空間は、M個の次元を有することになり、Mは、訓練データセット400に見られるすべての異なる単語及びNグラムの合計に等しい。一実施形態においては、結果生じる複雑度を低くするために、個々の単語に加えてのバイグラム(2つの連続した単語)のみが、個々の特徴に割り当てられる。単語出現頻度−逆出現頻度(TF−IDF)のような、他の重み付け方式が、訓練特徴ベクトルを作成するのに使用されてもよいことに留意されたい。たとえば、図4の訓練データセット400の訓練特徴ベクトルは、そのベクトルの様々な次元について非整数の係数を有する。
[0028]訓練データセット400の訓練特徴ベクトルを考慮して、テキスト入力130に使用することができる特徴(個々の単語及びNグラム)の辞書を形成することができる。再び図3を参照すると、特徴抽出器モジュール310が、訓練データセット400の訓練特徴ベクトルを構築するのに使用された任意の特徴(個々の単語及び任意の適用可能なNグラム)についてユーザのテキスト入力130を解析する。訓練データセット400に現れたものと一致しない単語及びNグラムは、無視することができる。一実施形態において、テキスト入力130内の一致する各特徴は、1の2値重みを与えられるが、そのような重み付けは上述したように変更されてもよい。結果もたらされる特徴ベクトル320がその後、タスク分類器サブモジュール330によって、訓練データセット400から抽出されるタスク分類器モデル340に従って処理されて、訓練データセット400の構築に使用されているタスクのセットから予測タスク350が提供される。
[0029]再び図4を参照すると、訓練器モジュール410によって実施されるものとしての機械学習アルゴリズムが、訓練データセット400内の訓練特徴ベクトルを使用して、タスク分類器モデル340を生成する。サポートベクターマシン(SVM)又はナイーブベイズ分類器のような、機械学習訓練モジュール410によって実装することができる種々雑多な適切な機械学習アルゴリズムがある。特定の機械学習アルゴリズムに基づいて、訓練モジュール410によって生成されるタスク分類器モデル340は、タスク分類器サブモジュール330が、特徴ベクトル320について最も可能性の高い予測タスク350を判定することを可能にする。これに関連して、所与のタスクに対する訓練特徴ベクトルは、様々な特徴によって生成されるベクトル空間内に集まる傾向にある。このクラスタ化に基づいて、タスク分類器サブモジュール330はこのとき、特徴ベクトル320が、訓練データセット400を構築するのに使用されている元の訓練特徴ベクトルの一部であった場合に特徴ベクトル320が属することになる最も可能性の高いタスクカテゴリを判定することができる。
[0030]訓練特徴ベクトルに対するこの先験的な機械学習は、特徴ベクトルが単語ではなく数学的エンティティであるという点において、全体的にユーザによって発話される言語に対して非依存である。したがって、対応する訓練データセットを生成して適切なタスク分類器モデルを構築することのみによって、システム100を他の言語に容易に拡張することができる。したがって、ユーザの所与の市場に使用される特定の言語にかかわりなく、ユーザは本明細書に開示されている正確なタスク分類を有利に享受することができる。このタスク分類は、従来のパーソナルアシスタントアプリケーションに使用されるその場しのぎの技法よりも正確であるだけでなく、結果もたらされる分類によってまた、クエリ抽出もより正確なものになる。
[0031]クエリ抽出器モジュール150が、図5により詳細に示されている。各タスクに関して、いくつかのタスクは関連するクエリを有しないことに留意されたい。たとえば、退屈タスクは、システム100によって冗談を言われることを所望しているユーザに関連する。一実施形態において、タスク分類器モジュール140によるそのタスクの識別以外に、退屈タスクのさらなる分類はない。しかし、電話タスクのような他のタスクについては、これは当てはまらず、システム100はどの相手が電話されるべきかを知る必要があるため、システム100は、単に所与のユーザ要求が電話タスクに対応することを識別する以上のことをしなければならない。これらの追加のパラメータは、前述のように「クエリクラス」に編成される。たとえば、レストラン検索は一般的に、所望されるレストランのタイプを1つのクエリクラスとして識別する。加えて、同じレストラン検索がまた、通常、場所を別のクエリクラスとして識別する。各タスク(該当する場合)に対して様々なクエリクラスの識別情報を所与として、その後、辞書530が形成され得る。各辞書エントリは、クエリクラス(「タグ」として示される場合もある)と、クエリクラスの特定のインスタンス化(関連するクエリ)とのデータ対となる。
[0032]辞書530の形成に関連して、訓練データセット400のすべての可能性のあるクエリを識別するには、任意の所与のユーザによって為され得るすべての可能性のあるユーザ入力を含む必要があり、無論こうすることは支持できないため、すべての可能性のあるクエリを識別することは期待できないことに留意されたい。システム100と対話する可能性のあるユーザは無数にあり、そのため、訓練データセット400は、そのような多数の可能性のあるユーザからすべての可能性のあるクエリを容易に含むことはできない。しかし、Wikipediaのようなデータベースは、「場所」のような所与のクエリクラスに対するすべての可能性のあるクエリを識別するために容易に解析することができる。たとえば、米国又は別の所望の国の中のすべての町が、そのようなデータベースから識別されて、レストラン検索タスクのための場所タグとともに辞書530に入力され得る。同様に、可能性のある料理のタイプも、レストラン検索タスクのための料理タイプタグとともに辞書530に入力され得る。他の検索タスクのためのタグについての可能性のあるクエリも、適切なデータベースの検索を通じてインスタンス化されてもよい。たとえば、電話タスクのための「電話される相手の名前」タグが、ファーストネームを(及び、所望される場合は性も)用いてインスタンス化されてもよい。これは、可能性のあるクエリがこのように容易に予期され、辞書530に入力され、それによって、ユーザ要求が所与のタスクカテゴリに属すると予測されると、対応するクエリがクエリ抽出モジュール520によって容易に識別される点において、非常に有利である。そうするために、モジュール520は、テキスト入力130内の単語を、関連するタグ(クエリクラス)について、辞書530内の辞書エンティティと比較する。たとえば、再び図2を参照すると、「パロアルト」という用語は、場所タグの下で、辞書530に一致を有し得る。同様に、「イタリアンレストラン」という用語は、料理タイプタグの下で辞書530に一致を有し得る。このように、所与のテキスト入力130は、その関連するクエリ500を識別するためにシステム100によって容易に識別される。
[0033]図6に示すように、タスク実行インターフェースモジュール160は、予測タスク350を使用して、任意の外部コンテンツプロバイダが必要であるか否かを判定する。電話タスクのような特定のタスクは、外部コンテンツプロバイダを必要としない。他方、レストラン検索は、外部検索プロバイダを使用して実施される場合がある。したがって、タスク実行モジュール160は、任意の関連するクエリを、タスク実行モジュール170内の適切なAPIにルーティングする。外部検索プロバイダを必要とするクエリは、対応するコンテンツプロバイダのAPI620にルーティングされる。逆に、ユーザのデバイスの内部機能を必要とするクエリは、対応する内部機能API610にルーティングされる。
[0034]システム100は、1つ若しくは複数のコンピュータを使用して実装されてもよく、又は代わりに、構成済みFPGA若しくはASIC(複数可)を使用してインスタンス化されてもよい。システム100の1つ又は複数のモジュールを実装するための適切なコンピュータシステム700が図7に示されている。管理者は、ディスプレイ711、キーボード704、及び音響/視覚I/O705を使用してシステム700を構成することができる。システム700は、バス702を通じて命令のメモリ714に結合されている少なくとも1つのプロセッサを含む。バス702は、ネットワークインターフェース706及び通信リンク718を通じてインターネットのようなネットワーク750にも結合している。このように、図1の自然言語入力110のようなユーザの対話が、ネットワーク750からシステム700によって容易に受信され得る。本明細書に説明されている様々なモジュールを実装するためにプロセッサ712によって実行される、メモリ714に記憶されている命令は、Java又は他の適切なプログラミング言語で書かれてもよい。
[0035]ここで、当業者には諒解されるように、手近な特定の用途に応じて、本開示の精神及び範囲から逸脱することなく、本開示のデバイスの材料、装置、構成及び使用方法において、及び、それらに対して、多くの修正、置換及び変更を行うことができる。これに照らして、本明細書に例示及び説明されている特定の実施形態が、その実施形態のいくつかの例に過ぎず、添付の特許請求の範囲及びその機能的均等物と完全に釣り合うべきものであるため、本開示の範囲は、これらの特定の実施形態の範囲に限定されるべきではない。

Claims (20)

  1. 複数のタスクカテゴリの各々に対する、人間によって生成される複数の要求を収集して、ユーザ要求の訓練データベースを作成するステップと、
    前記訓練データベース内の各ユーザ要求から訓練特徴ベクトルを抽出して、各タスクカテゴリに対する複数の訓練特徴ベクトルを有する訓練データセットを形成するステップと、
    前記訓練データセット内の前記訓練特徴ベクトルを処理して、各タスクカテゴリに対するタスク分類器モデルを決定するステップと、
    ユーザからさらなる要求を受信するステップであって、前記さらなる要求が前記タスクカテゴリのうちの1つに分類可能である、受信するステップと、
    機械において、前記さらなる要求から抽出される特徴ベクトルを、前記タスク分類器モデルと比較して、前記さらなる要求の予測タスクカテゴリを決定するステップと
    を含む、機械実施方法。
  2. 前記機械において、前記さらなる要求内の単語を、前記予測タスクカテゴリの少なくとも1つのクエリクラスの可能な値の辞書と比較して、少なくとも1つのタスクパラメータについて、前記さらなる要求内の一致する単語又は語句を識別するステップをさらに含む、請求項1に記載の機械実施方法。
  3. 前記一致する単語又は語句を使用して前記さらなる要求にサービスするステップをさらに含む、請求項2に記載の機械実施方法。
  4. 前記予測タスクが、そのタスクを完了するために外部コンテンツプロバイダを必要とするか否か、又は、前記予測タスクを前記ユーザのポータブルデバイスによって実施することができるか否かを判定するステップと、
    前記予測タスクがそのタスクを完了するために前記外部コンテンツプロバイダを必要とするという判定に応答して、前記外部コンテンツプロバイダのためのアプリケーションプログラムインターフェースを呼び出すステップと、
    前記予測タスクを前記ポータブルデバイスによって実施することができるという判定に応答して、前記ポータブルデバイス上のプログラムのためのアプリケーションプログラムインターフェースを呼び出すステップと
    をさらに含む、請求項1に記載の機械実施方法。
  5. 前記ポータブルデバイスは携帯電話を含む、請求項4に記載の機械実施方法。
  6. 前記さらなる要求は自然言語要求を含み、前記方法は、
    前記自然言語要求をテキスト入力に変換するステップと、
    前記テキスト入力から前記特徴ベクトルを抽出するステップと
    をさらに含む、請求項1に記載の機械実施方法。
  7. 前記訓練データセットを処理して、タスク分類器モデルを決定するステップは、前記訓練データセットに機械学習アルゴリズムを適用するステップを含む、請求項1に記載の機械実施方法。
  8. 前記機械学習アルゴリズムは、サポートベクターマシン訓練アルゴリズムを含む、請求項7に記載の機械実施方法。
  9. 前記機械学習アルゴリズムは、ナイーブベイズアルゴリズムを含む、請求項7に記載の機械実施方法。
  10. 前記タスクカテゴリは、レストラン検索タスクカテゴリ、電話タスクカテゴリ、電子メールタスクカテゴリ、及び交通タスクカテゴリを含む、請求項1に記載の機械実施方法。
  11. 複数のタスクカテゴリのうちの1つに対応する第1のユーザ要求から特徴ベクトルを抽出し、前記特徴ベクトルを、前記タスクカテゴリの各々に対する複数の他のユーザ要求から開発されたタスク分類器モデルと比較して、前記第1のユーザ要求に対応する前記タスクカテゴリを予測するように構成されているタスク分類器モジュールと、
    前記第1のユーザ要求を、予測タスクカテゴリの少なくとも1つのタスクパラメータの可能な値の辞書と比較して、前記少なくとも1つのタスクパラメータについて、前記第1の要求内の一致する単語又は語句を識別するように構成されているクエリ抽出モジュールと、
    前記予測タスクカテゴリを解析して、前記予測タスクカテゴリが、そのタスクカテゴリを完了するために外部コンテンツプロバイダを必要とするか否か、又は、前記予測タスクカテゴリを前記ユーザのポータブルデバイスによって実施することができるか否かを判定するように構成されているタスク実行モジュールと、
    前記予測タスクカテゴリがそのタスクカテゴリを完了するために前記外部コンテンツプロバイダを必要とするという判定に応答して、前記識別された単語又は語句を用いて、前記外部コンテンツプロバイダのためのアプリケーションプログラムインターフェースを呼び出すように構成されているタスク実行モジュールと
    を備える、システム。
  12. 前記タスク実行モジュールが、前記予測タスクカテゴリを前記ユーザのポータブルデバイスによって実施することができるという判定に応答して、前記識別された単語又は語句を用いて、前記ユーザのポータブルデバイスのためのアプリケーションプログラムインターフェースを呼び出すようにさらに構成されている、請求項11に記載のシステム。
  13. 前記予測タスクカテゴリは、レストラン検索タスクカテゴリ、電話タスクカテゴリ、電子メールタスクカテゴリ、及び交通タスクカテゴリを含む、請求項11に記載のシステム。
  14. 前記タスクカテゴリの各々に対する前記複数の他のユーザ要求から前記タスク分類器モデルを開発するように構成されている機械学習訓練モジュールをさらに備える、請求項11に記載のシステム。
  15. 前記機械学習訓練モジュールは、サポートベクターマシン訓練アルゴリズムを使用して前記タスク分類器モデルを開発するように構成されている、請求項14に記載のシステム。
  16. 前記機械学習訓練モジュールは、ナイーブベイズアルゴリズムを使用して前記タスク分類器モデルを開発するように構成されている、請求項14に記載のシステム。
  17. 自然言語入力を、前記第1のユーザ要求を含むテキスト入力に変換するように構成されている自然言語−テキスト変換器モジュールをさらに備える、請求項14に記載のシステム。
  18. 記憶されているプログラム命令を含む有形コンピュータ可読媒体であって、1つ又は複数のプロセッサによって前記プログラム命令が実行されることによって、前記1つ又は複数のプロセッサが、
    訓練データベース内の各ユーザ要求から訓練特徴ベクトルを抽出して、複数のタスクカテゴリの各々に対する複数の訓練特徴ベクトルを有する訓練データセットを形成するステップと、
    前記訓練データセットを処理して、各タスクカテゴリに対するタスク分類器モデルを決定するステップと、
    ユーザからさらなる要求を受信するステップであって、前記さらなる要求が前記タスクカテゴリのうちの1つに分類可能である、受信するステップと、
    さらなる要求から抽出される特徴ベクトルを、前記タスク分類器モデルと比較して、前記さらなる要求の予測タスクカテゴリを決定するステップと
    を実行する、有形コンピュータ可読媒体。
  19. 前記1つ又は複数のプロセッサによって前記プログラム命令が実行されることによって、前記1つ又は複数のプロセッサが、
    前記さらなる要求内の単語を、前記予測タスクカテゴリの少なくとも1つのタスクパラメータの可能性な値の辞書と比較して、前記少なくとも1つのタスクパラメータについて、前記さらなる要求内の一致する単語又は語句を識別するステップをさらに実行する、請求項18に記載の有形コンピュータ可読媒体。
  20. 前記1つ又は複数のプロセッサによって前記プログラム命令が実行されることによって、前記1つ又は複数のプロセッサが、
    前記一致する単語又は語句を使用することによって前記さらなる要求にサービスするステップをさらに実行する、請求項18に記載の有形コンピュータ可読媒体。
JP2016556246A 2013-11-27 2014-11-25 機械学習に基づく自動タスク分類 Active JP6440732B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361909992P 2013-11-27 2013-11-27
US61/909,992 2013-11-27
PCT/US2014/067475 WO2015081128A1 (en) 2013-11-27 2014-11-25 Automatic task classification based upon machine learning

Publications (2)

Publication Number Publication Date
JP2017505964A true JP2017505964A (ja) 2017-02-23
JP6440732B2 JP6440732B2 (ja) 2018-12-19

Family

ID=53199614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016556246A Active JP6440732B2 (ja) 2013-11-27 2014-11-25 機械学習に基づく自動タスク分類

Country Status (6)

Country Link
US (1) US9471887B2 (ja)
EP (1) EP3074877A4 (ja)
JP (1) JP6440732B2 (ja)
KR (1) KR101770527B1 (ja)
CN (1) CN105378699B (ja)
WO (1) WO2015081128A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019040543A (ja) * 2017-08-29 2019-03-14 京セラドキュメントソリューションズ株式会社 情報処理システムおよびプログラム
JP2019164761A (ja) * 2018-01-29 2019-09-26 楽天株式会社 ラベル付きトレーニングデータの品質向上
US10490189B2 (en) 2017-11-15 2019-11-26 Kabushiki Kaisha Toshiba Support system, support method, and memory medium
JP2020013521A (ja) * 2018-07-20 2020-01-23 カーベーセー グループ エンフェーKBC Groep NV 改善された要求ハンドリング
US11775868B1 (en) 2019-09-20 2023-10-03 Amazon Technologies, Inc. Machine learning inference calls for database query processing
US11972490B2 (en) 2018-07-20 2024-04-30 Kbc Groep Nv Determining a category of a request by word vector representation of a natural language text string with a similarity value

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10042923B2 (en) 2015-04-24 2018-08-07 Microsoft Technology Licensing, Llc Topic extraction using clause segmentation and high-frequency words
US9792281B2 (en) * 2015-06-15 2017-10-17 Microsoft Technology Licensing, Llc Contextual language generation by leveraging language understanding
US9626627B1 (en) * 2016-01-26 2017-04-18 International Business Machines Corporation Predicting API storytelling mapping
US20170300533A1 (en) * 2016-04-14 2017-10-19 Baidu Usa Llc Method and system for classification of user query intent for medical information retrieval system
KR102573933B1 (ko) 2016-10-04 2023-09-05 한국전자통신연구원 기계 학습 기반의 실감 미디어 저작 방법 및 장치
US10713593B2 (en) * 2016-11-04 2020-07-14 Google Llc Implicit bridging of machine learning tasks
CN108229686B (zh) * 2016-12-14 2022-07-05 阿里巴巴集团控股有限公司 模型训练、预测方法、装置、电子设备及机器学习平台
US20190207946A1 (en) * 2016-12-20 2019-07-04 Google Inc. Conditional provision of access by interactive assistant modules
US20180211260A1 (en) * 2017-01-25 2018-07-26 Linkedin Corporation Model-based routing and prioritization of customer support tickets
US10592995B1 (en) 2017-01-27 2020-03-17 Intuit Inc. Methods, systems, and computer program product for providing expense information for an electronic tax return preparation and filing software delivery model
US11270185B1 (en) * 2017-01-27 2022-03-08 Intuit Inc. Methods, systems, and computer program product for generating a personalized flow for a software delivery model
US10127227B1 (en) 2017-05-15 2018-11-13 Google Llc Providing access to user-controlled resources by automated assistants
US11436417B2 (en) 2017-05-15 2022-09-06 Google Llc Providing access to user-controlled resources by automated assistants
US10466963B2 (en) 2017-05-18 2019-11-05 Aiqudo, Inc. Connecting multiple mobile devices to a smart home assistant account
CN111095331B (zh) * 2017-09-14 2023-09-22 艾玛迪斯简易股份公司 使用机器学习的实时在线旅行者细分的方法和系统
CN107957989B9 (zh) * 2017-10-23 2021-01-12 创新先进技术有限公司 基于集群的词向量处理方法、装置以及设备
CN107767058B (zh) * 2017-10-26 2021-03-19 北京航空航天大学 一种众包软件开发者推荐方法
CN108170663A (zh) 2017-11-14 2018-06-15 阿里巴巴集团控股有限公司 基于集群的词向量处理方法、装置以及设备
US10176171B1 (en) * 2017-12-29 2019-01-08 Aiqudo, Inc. Language agnostic command-understanding digital assistant
US10963499B2 (en) 2017-12-29 2021-03-30 Aiqudo, Inc. Generating command-specific language model discourses for digital assistant interpretation
US10929613B2 (en) 2017-12-29 2021-02-23 Aiqudo, Inc. Automated document cluster merging for topic-based digital assistant interpretation
US10963495B2 (en) 2017-12-29 2021-03-30 Aiqudo, Inc. Automated discourse phrase discovery for generating an improved language model of a digital assistant
US10417328B2 (en) * 2018-01-05 2019-09-17 Searchmetrics Gmbh Text quality evaluation methods and processes
US10423727B1 (en) 2018-01-11 2019-09-24 Wells Fargo Bank, N.A. Systems and methods for processing nuances in natural language
CN108280021A (zh) * 2018-01-25 2018-07-13 郑州云海信息技术有限公司 一种基于机器学习的日志等级分析方法
US10572321B2 (en) * 2018-03-12 2020-02-25 Amazon Technologies, Inc. Machine learning repository service
EP3776376A4 (en) * 2018-04-09 2021-12-01 Veda Data Solutions, Inc. PROCESSING OF PERSONAL DATA USING MACHINE LEARNING ALGORITHMS, AND RELATED APPLICATIONS
US11263035B2 (en) * 2018-04-13 2022-03-01 Microsoft Technology Licensing, Llc Longevity based computer resource provisioning
KR102092617B1 (ko) * 2018-07-05 2020-05-22 인하대학교 산학협력단 단방향 데이터 변환을 이용한 프라이버시 보장형 기계 학습 방법
DE102018213021A1 (de) * 2018-08-03 2020-02-06 Robert Bosch Gmbh Computerimplementiertes Verfahren und Vorrichtung für Textanalyse
EP3682345B1 (en) 2018-08-07 2021-11-24 Google LLC Assembling and evaluating automated assistant responses for privacy concerns
US10803182B2 (en) 2018-12-03 2020-10-13 Bank Of America Corporation Threat intelligence forest for distributed software libraries
CN111797869A (zh) * 2019-04-09 2020-10-20 Oppo广东移动通信有限公司 模型训练方法、装置、存储介质及电子设备
US11562500B2 (en) 2019-07-24 2023-01-24 Squadle, Inc. Status monitoring using machine learning and machine vision
KR102209147B1 (ko) * 2019-07-31 2021-01-28 주식회사 같다 재활용품 또는 중고물품의 자동 분류 시스템 및 이를 이용한 자동 분류 방법
US11328715B2 (en) * 2019-09-24 2022-05-10 International Business Machines Corporation Automatic assignment of cooperative platform tasks
TWI728507B (zh) * 2019-10-15 2021-05-21 財團法人資訊工業策進會 產生一對話狀態追蹤模型之裝置及方法
CN111381970B (zh) * 2020-03-16 2023-07-25 第四范式(北京)技术有限公司 集群任务的资源分配方法及装置、计算机装置及存储介质
US11789905B2 (en) 2020-05-27 2023-10-17 Roblox Corporation Automated generation of game tags
US11514444B2 (en) 2020-11-03 2022-11-29 Capital One Services, Llc Leveraging blockchain based machine learning modeling for expense categorization
US20220245898A1 (en) * 2021-02-02 2022-08-04 Unisys Corporation Augmented reality based on diagrams and videos
US11509746B2 (en) * 2021-02-17 2022-11-22 Salesforce.Com, Inc. Distributing user requests to cloud computing systems across regions using a machine learning model
AU2022328719A1 (en) * 2021-08-19 2024-02-29 Yohana Llc Systems and methods for recommending tasks for execution by third party services
US20230069285A1 (en) * 2021-08-19 2023-03-02 Bank Of America Corporation Cognitive scrum master assistance interface for developers

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006146621A (ja) * 2004-11-19 2006-06-08 Nec Corp 情報管理装置及び方法並びに情報管理用プログラム
US20080104037A1 (en) * 2004-04-07 2008-05-01 Inquira, Inc. Automated scheme for identifying user intent in real-time

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7266559B2 (en) * 2002-12-05 2007-09-04 Microsoft Corporation Method and apparatus for adapting a search classifier based on user queries
US8335683B2 (en) * 2003-01-23 2012-12-18 Microsoft Corporation System for using statistical classifiers for spoken language understanding
US7231375B2 (en) * 2003-10-10 2007-06-12 Microsoft Corporation Computer aided query to task mapping
US7624006B2 (en) * 2004-09-15 2009-11-24 Microsoft Corporation Conditional maximum likelihood estimation of naïve bayes probability models
US7949186B2 (en) * 2006-03-15 2011-05-24 Massachusetts Institute Of Technology Pyramid match kernel and related techniques
US7558766B1 (en) * 2006-09-29 2009-07-07 Hewlett-Packard Development Company, L.P. Classification using enhanced feature sets
US20080162117A1 (en) * 2006-12-28 2008-07-03 Srinivas Bangalore Discriminative training of models for sequence classification
CN101211339A (zh) * 2006-12-29 2008-07-02 上海芯盛电子科技有限公司 基于用户行为的智能网页分类器
US8326859B2 (en) * 2009-11-02 2012-12-04 Microsoft Corporation Task prediction
EP2817739A4 (en) * 2012-02-22 2016-04-20 Nokia Technologies Oy SYSTEM AND METHOD FOR PROVIDING A FORECAST FOR CONTROLLING A SYSTEM
DK2639749T3 (en) * 2012-03-15 2017-02-27 Cortical Io Gmbh Methods, apparatus and products for semantic processing of text
WO2014022441A1 (en) * 2012-07-30 2014-02-06 Khalid Sayood Classification of nucleotide sequences by latent semantic analysis
CN102929613B (zh) * 2012-10-16 2016-08-10 无锡江南计算技术研究所 操作系统的调优装置和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080104037A1 (en) * 2004-04-07 2008-05-01 Inquira, Inc. Automated scheme for identifying user intent in real-time
JP2006146621A (ja) * 2004-11-19 2006-06-08 Nec Corp 情報管理装置及び方法並びに情報管理用プログラム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019040543A (ja) * 2017-08-29 2019-03-14 京セラドキュメントソリューションズ株式会社 情報処理システムおよびプログラム
US10490189B2 (en) 2017-11-15 2019-11-26 Kabushiki Kaisha Toshiba Support system, support method, and memory medium
JP2019164761A (ja) * 2018-01-29 2019-09-26 楽天株式会社 ラベル付きトレーニングデータの品質向上
US11803883B2 (en) 2018-01-29 2023-10-31 Nielsen Consumer Llc Quality assurance for labeled training data
JP7458148B2 (ja) 2018-01-29 2024-03-29 ミロ・アクイジション・サブ・リミテッド・ライアビリティ・カンパニー ラベル付きトレーニングデータの品質向上
JP2020013521A (ja) * 2018-07-20 2020-01-23 カーベーセー グループ エンフェーKBC Groep NV 改善された要求ハンドリング
JP7206072B2 (ja) 2018-07-20 2023-01-17 カーベーセー グループ エンフェー 改善された要求ハンドリング
US11972490B2 (en) 2018-07-20 2024-04-30 Kbc Groep Nv Determining a category of a request by word vector representation of a natural language text string with a similarity value
US11775868B1 (en) 2019-09-20 2023-10-03 Amazon Technologies, Inc. Machine learning inference calls for database query processing
JP7364146B2 (ja) 2019-09-20 2023-10-18 アマゾン テクノロジーズ インコーポレイテッド データベースクエリ処理のための機械学習推論コール

Also Published As

Publication number Publication date
CN105378699A (zh) 2016-03-02
KR101770527B1 (ko) 2017-08-22
WO2015081128A1 (en) 2015-06-04
EP3074877A1 (en) 2016-10-05
EP3074877A4 (en) 2017-09-06
KR20160053905A (ko) 2016-05-13
JP6440732B2 (ja) 2018-12-19
US20160019471A1 (en) 2016-01-21
US9471887B2 (en) 2016-10-18
CN105378699B (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
JP6440732B2 (ja) 機械学習に基づく自動タスク分類
CN107436875B (zh) 文本分类方法及装置
US10192545B2 (en) Language modeling based on spoken and unspeakable corpuses
KR102288249B1 (ko) 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체
US10832011B2 (en) Question answering system using multilingual information sources
US11797765B2 (en) Language identification for text strings
US10387410B2 (en) Method and system of classification in a natural language user interface
US20150120723A1 (en) Methods and systems for processing speech queries
US20230024457A1 (en) Data Query Method Supporting Natural Language, Open Platform, and User Terminal
US9916829B2 (en) Voice search and response based on relevancy
US20220254507A1 (en) Knowledge graph-based question answering method, computer device, and medium
US20180075354A1 (en) Method and system for using existing models in connection with new model development
KR101545050B1 (ko) 정답 유형 자동 분류 방법 및 장치, 이를 이용한 질의 응답 시스템
CN116583837A (zh) 用于自然语言处理的基于距离的logit值
US11625630B2 (en) Identifying intent in dialog data through variant assessment
US20140165002A1 (en) Method and system using natural language processing for multimodal voice configurable input menu elements
JP5850886B2 (ja) 情報処理装置及び方法
KR102630487B1 (ko) 고객 불만 분석 시스템 및 방법
CN114036373B (zh) 搜索方法及装置、电子设备和存储介质
CN117520608A (zh) 数据操作方法、装置、设备和介质
CN113792129A (zh) 一种智能会话方法、装置、计算机设备及介质
JP2018055622A (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170523

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180717

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181120

R150 Certificate of patent or registration of utility model

Ref document number: 6440732

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250