JP2005537532A - 自然言語理解アプリケーションを構築するための総合開発ツール - Google Patents

自然言語理解アプリケーションを構築するための総合開発ツール Download PDF

Info

Publication number
JP2005537532A
JP2005537532A JP2004504138A JP2004504138A JP2005537532A JP 2005537532 A JP2005537532 A JP 2005537532A JP 2004504138 A JP2004504138 A JP 2004504138A JP 2004504138 A JP2004504138 A JP 2004504138A JP 2005537532 A JP2005537532 A JP 2005537532A
Authority
JP
Japan
Prior art keywords
nlu
semantic tree
text
tree
interpretation information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004504138A
Other languages
English (en)
Other versions
JP2005537532A5 (ja
Inventor
エプスタイン、マーク、エドワード
ジョーンズ、シャロン、バーバラ
ワード、ロバート、トッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2005537532A publication Critical patent/JP2005537532A/ja
Publication of JP2005537532A5 publication Critical patent/JP2005537532A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Stored Programmes (AREA)

Abstract

【課題】 自然言語理解(NLU)アプリケーションを開発する方法を提供する。
【解決手段】 本方法には、マルチ・パス処理技法を使用して、NLUトレーニング・テキスト・コーパスからNLU解釈情報を決定することが含まれる。1つのパスを変更して、後続のパスに対する入力を変更することができる。NLU解釈情報は、NLUトレーニング・テキスト・コーパスの少なくとも一部の解釈を指定することができる。NLU解釈情報はデータベースに格納され、NLU解釈情報の選択された項目をグラフィカル・エディタに提示することができる。ユーザ指定の編集も、グラフィカル・エディタで受け取られる。

Description

本発明は、自然言語理解の分野に関し、より具体的に言えば、自然言語理解アプリケーションを構築するための総合開発ツールに関する。
自然言語理解(NLU)システムは、コンピュータが人間の音声から情報を理解および抽出できるようにするものである。こうしたシステムは、人間の音声を理解する必要のある音声認識システムなどのさまざまな他のコンピュータ・アプリケーションを使用して、補足的に機能することが可能である。NLUシステムは、テキスト内に含まれる関連情報を抽出し、その後この情報を、飛行機のフライト予約、文書の検索、またはテキストの要約などの目的で、他のアプリケーション・プログラムまたはシステムに供給することができる。
現在当分野では、NLUシステムは、テキスト文字列が文字のグループ、単語、または文を表すことのできるテキスト文字列から情報を抽出するために、いくつかの異なる技法を採用している。最も一般的な技法は、一般に当分野では、終端(terminal)および非終端(non−terminal)を有するバッカス−ナウア記法(BNF)を使用して表される、文脈自由文法を使用してテキスト文字列を解析するための言語手法である。終端とは、それ以上細分化できない単語または他の記号のことであるのに対して、通常、非終端とは、動詞句または名詞句などの音声の部分あるいは句のことである。したがって、NLUへの文法的手法は、統計処理を使用せずにBNF文法に基づいて各テキスト文字列を解析しようとするものである。
こうしたNLUシステムに基づいた文法を構築するためには、通常、アプリケーションの開発にかなりの時間と費用をかけることのできる言語学者が必要である。しかしながら、特に電話での会話様式に関して、潜在的な各ユーザの要求またはプロンプトに対する応答を予測することが困難であるため、NLUアプリケーションの品質は満足できるものではない。特に、言語学者を使用したにもかかわらずこうした不満足な結果が生じる場合がある。
NLUシステムがテキスト文字列から情報を抽出する際に使用する他の技法には、テキスト文字列の分析に文法を使用しない統計的手法がある。現在、こうしたシステムは、注釈付き文の大規模なコーパスから意味を学習する。注釈付き文は、トレーニング・コーパスと呼ばれるテキストのコーパスにまとめられる。統計的NLUシステムの開発およびテキストの注釈付けに使用されるツールは、ASCIIファイル、従来のテキスト・エディタ、およびキーボード・マクロのようなまったく異なる要素を含んでいた。これらの非効率的なツールを使用して、単語の関係を指定し統計モデルを構築することができる。しかしこれまでのところ、効率的かつ正確なグラフィックによるビジュアル編集ツールは、まだ開発されていない。
従来のNLUアプリケーション開発ツールを使用することの他の欠点は、チーム環境での開発が難しいことである。とりわけ、既存のツールではまったく異なる構成要素を使用するので、こうした開発ツールでは、1人のチーム・メンバによる変更を追跡するかまたはフラグを立てて、他のチーム・メンバがテキストの同じ部分を上書きしたり注釈を付け直したりしないようにすることができない。さらに、従来の開発ツールでは、トレーニング・コーパス内の特定の文の複数のインスタンスに互いに整合性のない方法で注釈が付けられているような状況を、識別することができない。
したがって、主として熟練した専門家達には、統計的NLUアプリケーションの開発が残されている。
本明細書で開示された発明は、請求項1、37、および38に記載されたような自然言語理解(NLU)アプリケーションを構築するための、方法、システム、およびマシン読取り可能ストレージに関する。具体的に言えば、本明細書で開示された発明は、統計モデルを構築するための総合開発ツールをユーザに提供することができる。本発明は、一連のテキスト・ファイル、テキスト・エディタ、およびキーボード・マクロを使用して、テキストのコーパスの解釈、意味、または構造を指定する解釈情報を指定するのではなく、データベースならびに多彩なグラフィック編集ツールおよび可聴ツールを利用して、解釈情報を指定することができる。本発明は、ユーザ編集の同期化およびラベル付け機能を含む本発明のデータベース機能により、特にネットワークまたはワークグループ環境での使用に好適なものとなっている。結果として、本発明はより多くの機能を提供することができる。
好ましいことに、本ステップには、データ項目を表す終端および非終端ノードを含む意味ツリーとしてNLU解釈情報を提示することが含まれる。本発明の一実施形態に従って、意味ツリーの一部が正しいかどうかを示す確率を決定することができる。意味ツリーのこの部分は、確率が所定の確率のしきい値を超えていない場合に視覚的に識別することができる。別の方法として、NLU解釈情報内での意味ツリーの下部構造のオカレンスの数を決定することができる。意味ツリーの下部構造は、オカレンスの数が所定のしきい値を超えていない場合に視覚的に識別することができる。
この方法は、NLU解釈情報からの意味ツリーの選択されたノードの交差(intersection)を決定すること、当該選択されたノードの交差を追加のノードを意味ツリーに追加するための選択肢として提示すること、および、その後意味ツリーの選択されたノードより上にノードを追加することも含むことができる。とりわけ、追加されるノードを提示された選択肢から選択することができる。意味ツリーの追加ノードは、ユーザのコマンドに応答して作成することができる。追加ノードは追加のデータ項目を表すことができる。さらにユーザは、追加されるノードの記述を入力することが可能であり、当該記述が入力される場合にはスペル・チェックを受けることができる。ユーザの要求に応答して意味ツリーのノードが選択される場合、ノードおよびノードのパラメータを表示するための1つまたは複数の列を有するディクショナリ・ビューを表示することができる。とりわけ、ディクショナリ・ビューは、意味ツリーのハイライト表示されたノードで表されるデータ項目を有するディクショナリの領域を含むか、またはこの領域に焦点を合わせることができる。
意味ツリーは、データ項目のディクショナリなどの所定の注釈データまたはテキスト解釈を指定するモデルに従って、自動的に完了することができる。一実施形態では、データ項目のディクショナリの中の単一のデータ項目が、NLUトレーニング・テキスト・コーパスの単語に関連付けられているかどうかに関して、判定することができる。関連付けられていれば、単一のデータ項目を当該の単語に割り当てることができる。NLU解釈情報の選択された項目は、提示された意味ツリーが正しい解釈であるかどうかを示すツール・チップ様式および確率で表示することができる。この方法には、指定された意味ツリー構造をNLU解釈情報から検索することも含まれる。データ項目の交差は、NLUトレーニング・テキスト・コーパスのユーザ指定語に注釈を付けるための選択として識別および提示することができる。
好ましいことに、本発明は、ディクショナリ・ビュー内にNLU解釈情報を提示することを含むことができる。その場合、NLU解釈情報は、親および子のデータ項目とデータ項目のパラメータとを表示するための1つまたは複数の列を使用して提示することができる。ディクショナリ・ビューは、データ項目の子を示すための列と、データ項目の親を示すための列とを含むことができる。データ項目は、親および子の列を含むいずれかの列に従ってソートすることができる。データ項目が所定のしきい値を超える確率またはカウントを有する場合、ディクショナリ・ビューに表示されるデータ項目を視覚的に見分けることができる。ディクショナリ・ビューに表示されるデータ項目が所定のしきい値を超えない確率またはカウントを有する場合は、非表示にすることができる。ユーザが関連のある特定のデータ項目を選択したのに応答して、NLU解釈情報から関連を表す終端および非終端のノードを含む意味ツリーを検索することができる。さらに当該方法は、データ項目ソース、データ項目ターゲット、データ項目に関連する方向(direction)、データ項目に関連する注釈付けプログラム(annotator)、注釈状況、ノード・カウント、データ・ファイル、文の領域、および/または使用状況などのパラメータに従って、NLU解釈情報をフィルタリングすることを含むこともできる。NLU解釈情報から導出されたヒストグラム情報を表示することもできる。
好ましいことに、本発明は、文ビュー内にNLU解釈情報を提示することを含むことができる。個々のテキスト句に関連するNLU解釈情報を表示することができる。たとえば、注釈状況、カウント、指定された用法、コレクション情報、正確さの確率、正確さのランクなどの情報を、文および/または句ごとに表示することができる。
好ましいことに、本発明は、分割画面ビュー内にNLU解釈情報を1つまたは複数の意味ツリーとして提示することを含むことができる。分割画面ビューは、少なくとも、第1の意味ツリーを表示するための第1のウィンドウと、第2の意味ツリーを表示するための第2のウィンドウを含むことができる。当該方法は、第1のウィンドウに第1の意味ツリーを表示しながら、ユーザの要求に応答して第2のウィンドウに異なる意味ツリーを提示することを含むことができる。当該意味ツリーは、同じコンテキスト内の同じテキスト句の異なる解釈、2つの異なるコンテキスト内の同じテキスト句の異なる解釈、あるいは、異なる処理パスの結果とすることができる。たとえば、第1のウィンドウは第1の処理パス後に決定された意味ツリーを提示し、第2のウィンドウは後続の処理パス後に決定された結果として生じる意味ツリーを提示することができる。別の方法として、第1の意味ツリーはテキスト句の正しい解釈を表し、第2の意味ツリーは、統計モデルに従ってテキスト句の予測解釈を表すこともできる。正しい解釈のスコアが予測解釈のスコアよりも高い場合、統計モデルは不正確であるという指示を与えることができる。第1の意味ツリーが第1のテキスト句を表す場合、当該方法は、第1のウィンドウ内の第1の意味ツリーへの編集を受け取ること、さらにユーザ編集に応答して、編集された第1の意味ツリーに対応する異なるテキスト句の意味ツリーを検索すること、ならびに第2のウィンドウ内に異なるテキスト句に関する意味ツリーを表示することを、含むことができる。当該方法は、第1の意味ツリーと第2の意味ツリーとの相違を視覚的に示すこと、および第1の意味ツリーを第2の意味ツリーと一致させることを含むことができる。
好ましいことに、本発明は、NLUトレーニング文を自動的にインポートすること、および、NLUトレーニング・テキスト・コーパスから決定された統計的可能性に従って、NLUトレーニング文の解釈を自動的に決定することを、含むことができる。別の方法として、トレーニング文のNLU解釈を自動的にインポートして、NLUトレーニング・テキスト・コーパスに適用することもできる。マルチ・パスのいずれか1つから結果として生じるNLU解釈情報は、パスのうちの1つを指定するユーザ入力に応答して表示することができる。さらに当該方法は、テキスト句に関するNLU解釈情報の属性に従って、NLUトレーニング・テキスト・コーパスのテキスト句を文ビュー内で順序付けすること、および、少なくとも2つのテキスト句に関するNLU解釈情報を意味ツリーとして順次表示することも、含むことができる。意味ツリーは、この順序付けに従って文ビュー内に表示することができる。
総合開発ツールは、NLU解釈情報のデータ項目の中から選択された項目の検索を指定するための、グラフィカル・ユーザ・インターフェースを含むこともできる。グラフィカル・ユーザ・インターフェースは、検索を指定するための選択可能な終端および非終端の少なくとも1つのリストを含むことができる。選択されたデータ項目と他のデータ項目との関係を指定するために、グラフィカル・ユーザ・インターフェースに追加の領域を含めることができる。
グラフィカル・エディタは、NLU解釈情報の項目を階層ツリー構造で提示するためのツリー・ビューと、NLU解釈情報の個々の項目を列フォーマットで提示するためのディクショナリ・ビューと、NLU解釈情報の1つまたは複数の項目を文形式で提示するための文ビューと、少なくとも2つの意味ツリーを同時に提示するための分割画面ビューと、追加のNLUトレーニング・テキストおよび関連する解釈情報をインポートするためのインポート・ビューとを含むことができる。NLUトレーニング・テキスト・コーパスから少なくとも1つの解釈を決定するように構成されたプログラム可能統計モデルも、含むことができる。
現時点で好ましい実施形態が現時点で図面に示されているが、本発明は、図示された精密な配置構成および手段に限定されるものではないことを理解されよう。
本明細書で開示された発明は、自然言語理解(NLU)アプリケーションで使用する統計モデルを構築するための方法およびシステムに関する。具体的に言えば、本明細書で開示された発明は、NLUシステムで使用する統計モデルを構築するための総合開発ツールをユーザに提供することができる。本発明は、一連のテキスト・ファイル、テキスト・エディタ、およびキーボード・マクロを含む構成要素の合同体(amalgamation)を使用して、テキストのコーパスを有する文の意味および構造を指定するのではなく、総合開発ツール(IDT)を提供するものである。IDTは、テキストのコーパスへの注釈として指定されることが多い解釈情報を指定するための、データベースならびに視覚(グラフィカル)ツールおよび可聴ツールの組合せ(assortment)を含むことができる。NLU解釈情報は、トレーニング・テキスト・コーパスを有する文の解釈または意味を指定する。ユーザ編集を同期化およびラベル付けする本発明の機能を含む本発明のデータベース機能は、本発明を特にネットワーク化コンピューティングまたはワークグループ環境で使用するのに適したものとする。
図1は、本発明と共に使用するための典型的なコンピュータ・システム100を示す図である。コンピュータ・システム100は、中央処理ユニット110(CPU)、1つまたは複数のメモリ・デバイス115、および関連する回路を有する、コンピュータ105を含むことができる。メモリ・デバイス115はIDT210を含むことが可能であり、電子ランダム・アクセス・メモリおよび大容量データ記憶媒体からなるものとすることができる。コンピュータ・システムは、好適なインターフェース回路125を介してコンピュータ・システムに動作可能なように接続されたマイクロフォン120と、動作可能なように接続されたビデオ・データ端末などのオプションのユーザ・インターフェース・ディスプレイ・ユニット130とを含むこともできる。CPUは、当業者によく知られているような任意の好適なマイクロプロセッサまたは他の電子処理ユニットからなるものであることが可能である。システムには、スピーカ135および140、ならびにマウス145およびキーボード150などのインターフェース・デバイスを提供することが可能であるが、本明細書に記載された発明の動作には必要でない。本明細書に記載されたコンピュータ・システムに関する様々なハードウェア要件は、通常、多くの市販の高速コンピュータのいずれか1つによって満たすことができる。
図2は、本明細書で開示された発明が実施可能なシステム・アーキテクチャの例を示す概略図である。図に示されるように、システム・アーキテクチャは、いくつかのコンピュータ・システム215、220、および225を含むことが可能であり、それらはそれぞれ、好適なオペレーティング・システムで実行中のIDT210を含むことが可能である。コンピュータ・システム215〜225は、コンピュータ通信ネットワーク200を介して相互に、およびデータベース・サーバ205と、通信可能なようにリンクすることができる。したがって、コンピュータ・システム215〜225はそれぞれ、注釈付けおよび非注釈付けデータ、統計モデル、ならびにアルゴリズムの完全なセットを有する、内蔵型IDT210を含むことが可能であるが、本発明の一態様に従い、IDT210によって使用されるデータの様々な部分をデータベース・サーバ205に格納し、これにアクセスすることが可能である。たとえば、ワークグループの複数のユーザがアクセスを必要とする可能性のある情報の様々な項目を、個々の各コンピュータ・システム215〜225ではなく、データベース・サーバ205に格納することができる。たとえば図2に示されるように、データベース・サーバ205は、注釈付けテキスト、非注釈付けテキスト、統計モデル、アルゴリズム、およびその他を格納することができる。
IDT210は、テキストのコーパスを統計的に処理するための機能の分類および解析を含むことができる。より具体的に言えば、IDT210を使用して、分類プログラム(classer)および解析プログラム(parser)の少なくとも一部を含む統計モデルを構築することができる。IDT210を使用してテキストのコーパスに注釈付けすることが可能であり、その結果生じる注釈付けされたテキストのコーパスをコンポーネント文に編成し、それぞれが注釈から導出されたツリー状の階層構造を有するようにすることができる。統計モデルは、注釈付けされたテキストのコーパスを使用して構築またはトレーニングすることができる。統計モデルが構築またはトレーニングされると、さらにIDTは現在の統計モデルの正確さをテストすることができる。
しかしながら、2つより多くのパスが使用可能なマルチ・パス・テキスト処理手法に従うことが可能であることを理解されたい。したがって、各パスからの出力は、次または後続のパスへの入力として働くことができる。たとえば、様々なフィルタおよび/またはワード・スポッティング・アルゴリズム、たとえば意味のない単語を識別および注釈付けするための「nullフィルタ」、または前置詞句、名詞句、およびその他などの小規模な意味句を識別する句パスを、使用することができる。さらに、ソース・チャネル・モデル化などの他の注釈付け技法を使用することも可能であり、結果として生じる注釈は整列と呼ばれ、ツリー様の構造ではない。
分類プログラムおよび解析プログラムの例を挙げると、財務NLUアプリケーションにおけるアカウント・タイプなどの、関連するテキスト文字列のアプリケーション特有のグループ分けであることが可能なクラスに関して、文に注釈付けすることができる。時刻および日付などの他のクラスは、アプリケーションに依存しないものとすることができる。クラスは、テキストのコーパスの分析を介して経験的に決定することが可能であり、その結果、分類プログラムは、特定のテキスト文字列または単語を定義済みクラスに属するものとして認識することができる。終端および非終端の記述子、解析ツリーおよびクラス・ツリーを含む意味ツリー、ならびにIDTツールからまとめて導出された任意の他の単語頻度データまたは統計データを、注釈データと呼ぶことができることを理解されたい。とりわけ、テキストのコーパスを構成する任意のテキストを含む注釈データは、1つまたは複数のテキスト・ファイルとして格納するのではなく、データベース内に格納することができる。
分類プログラムは、事前に定義されたクラスのうちの1つを構成する、受け取ったテキスト内の部分文字列を識別するための統計処理方法を使用して構築することができる。たとえば分類プログラムは、何千という文に注釈付けを行い、文を構成する単語またはテキスト文字列のクラスを識別する、統計処理方法を使用して構築することができる。注釈付けされた文を使用して、NLUシステム内で単語またはテキスト文字列が属するクラスを認識するように、分類プログラムをトレーニングすることができる。したがって分類プログラムは、条件付きエントロピーを最小にすること、または結果として生じるモデルが主要なテキスト文字列を識別するためのトレーニング・データを予測する可能性を最大にすることなどの、当分野で知られた統計処理アルゴリズムを使用して構築することができる。たとえば、NLUシステムは、テキスト文字列の特定のクラスを認識することが可能な、意思決定ツリーまたは最大エントロピー・モデルを使用することができる。
分類プログラムは、受け取ったテキストの一部から結果として生じる簡略化されたテキストを生成することが可能であり、ここでは、オリジナルのテキスト文字列内にあるクラスの識別されたメンバに定義済みクラスを用いて注釈付けし、それによって実際のテキスト文字列をクラス名に効果的に置き換えることができる。たとえば、分類プログラムは「私は500ドルをXYZ口座からABC口座に振り替えたい」というテキスト文字列を、「私は「金額(AMOUNT)」を「口座(FUND)」から「口座(FUND)」に振り替えたい」という例示的な出力となるように処理することができる。とりわけ、テキスト入力の構造が大幅に簡略化されている。具体的に言えば、受け取ったテキスト入力を分類することによって、結果として生じる入力構造の数、すなわち可能な文法上の構造を大幅に減少させ、後続の統計処理を容易にすることができる。たとえば、受け取ったテキスト入力を分類することなく、以下の文を異なる構造を有するものとみなすことができる。
・私は500ドルをXYZ口座からABC口座に振り替えたい。
・私は5000ドルをXYZ口座からABC口座に振り替えたい。
・私は100ドルをXYZ口座からABC口座に振り替えたい。
・私は500ドルをABC口座からXYZ口座に振り替えたい。
・私は500ドルをA口座からB口座に振り替えたい。
・私は500ドルをC口座からA口座に振り替えたい。
しかしながら、上記のテキストを分類すると、その結果は、各テキスト入力が「私は「金額」を「口座」から「口座」に振り替えたい」という共通の構造を共有していることを示すものである。したがって、受け取ったテキスト入力内にクラスの異なるメンバが存在していても、テキスト入力が異なる構造として扱われることはない。とりわけ、分類した文は、クラス・ツリーと呼ぶことのできる階層ツリー構造を使用して表すことができる。クラス・ツリーは、対応する文の解釈または意味を表す1タイプの意味ツリーである。階層意味ツリーは、終端または非終端の両方のノードを含むことができる。たとえば、意味ツリーのリーフは、処理済テキストの単語およびクラスに対応することができる。リーフは1つまたは複数の非終端にまで及ぶことが可能であり、それぞれ、他の意味および構造を意味ツリーに提供することができる。さらに、リーフおよび非終端(ならびに終端)はそれぞれ、ユーザ構成可能記述子を含むことができる。それぞれのリーフは、直接あるいは1つまたは複数の非終端を介して最終的にルート・ノードまで及ぶことが可能である。
解析プログラムは、処理されたテキスト出力を入力として分類プログラムから受け取ることができる。解析プログラムは、受け取ったテキストを処理して、受け取ったテキスト入力の残りの関連テキスト文字列に、特徴、すなわちアクションおよびパラメータまたは他の終端または非終端グループ分けに対応する、追加の非終端および/または記述子を追加することができる。たとえば、解析プログラムは、特定の主要な単語をグループ分けすることができる。これらの特徴を決定する場合、解析プログラムは、分類プログラムの説明で前述したように統計処理方法を利用することができる。たとえば解析プログラムは、分類プログラムからのテキスト出力を処理して、テキスト文字列用の解析ツリーを決定することができる。テキスト文字列の解析ツリーは、全般から細部へと流れて終端または単語レベルまで延在する、受け取ったテキスト文字列のクラス、アクション、およびパラメータからなる自然言語テキスト入力の階層表現とすることができる。解析ツリーは、テキスト文字列を識別するために使用される最高レベルがルートとして働く、グラフィカル形式で示すことができる。ルートの下方にはより詳細な非終端が存在し、終端レベルへと延在しており、それぞれの非終端および終端が解析ツリーのノードである。文の解析ツリーは、通常、その文に対応するクラス・ツリーよりも複雑である。しかしそれでもなお、解析ツリーおよびクラス・ツリーはどちらも意味ツリーと呼ぶことができる。
IDT210は、様々な再構築された統計モデルを含むことができる。たとえば、日付、時刻、量、あるいは他の句または表現のクラスなどの句を広範囲にわたって使用した処理のための、タグ用プログラム(tagger)または分類プログラムと呼ばれる統計モデルを、IDTに含めることができる。こうした統計モデルは、分類および解析モデルを含むことができる。したがって、IDT210がインポートまたは読み取った任意のテキストのコーパスについて、IDT210は、インポートされたテキストのコーパスを自動的に分析して、事前に構築されたモデルに関するインジケータを識別することができる。このインジケータは、日付、時刻、および儀礼的な言葉(すなわち「ありがとう」)を含む他の容易に置換え可能な項目などのクラスに対応する、終端を含むことができる。特定の事前に構築されたモデルに対応するそれぞれのインジケータについて、IDT210は、その事前に構築された統計モデルを現在構築中の統計モデルに組み込むことができる。たとえばIDT210は、キーワード検索を実行するか、または前述の他の統計処理方法を使用して、テキストのコーパスを分析し、事前に構築されたモデルがテキストのコーパスとの関連性を有するかどうかを判別することができる。さらにIDT210がこうした事前に構築されたモデルを含むかどうかをユーザに問い合わせるか、別の方法として、ユーザはこうしたモデルが含まれるように要求することができる。いずれのイベントでも、ユーザはこうした機能により、常に繰り返し発生するテキスト句を処理するための統計モデルを作り直すことから解放される。
上記で述べたように、分類プログラムおよび解析プログラムをIDT210に含めることは、本明細書で開示された発明の一実施形態を表すものに過ぎない。当業者であれば、任意の適切な統計処理方法および/またはモデルが使用できることを理解されよう。たとえば、他の実施形態は、ワード・スポッティング・アルゴリズム、最大エントロピー、規則、またはヒューリスティックス(heuristics)を含むことができる。いずれの場合でも、本明細書で開示された発明は、分類プログラムおよび解析プログラムを使用する特定の実施形態に限定されるものではない。
上記で述べたように、IDT210は、リレーショナル・データベースなどのデータベースならびにグラフィカル・ツールおよび可聴ツールの組合せを利用して、テキストのコーパスの注釈付けおよびNLUアプリケーションで使用するための統計モデルの開発において、ユーザを支援することができる。図3は、IDTの例示的なグラフィカル・ユーザ・インターフェース(GUI)300内に提示された、例示的なツリー・エディタ・ビュー310を示す図である。当該ツリー・エディタ・ビューは、クラス・ツリーと解析ツリーの両方を含むことができる、意味ツリーを表示する直感的な方法を提供するものである。図3に示されるように、テキストのコーパスからの例示的な文がツリー・フォーマットで表示されている。ツリー状の文構造は下から上へと流れるものであり、この場合は単語である終端から非終端へと流れ、非終端から「!S!」と示されたルート・ノードへと流れる。とりわけ、非終端から他の非終端へと流れて、複数レベルの文構造に対処することができる。場合によっては、終端から直接ルート・ノードへと流れることもできる。いずれの場合も、終端および非終端のデータ項目に対応する記述を完全に構成することができる。具体的に言えば、NLUシステム設計者は、終端および非終端データ項目(および対応する記述)の適切なセットを決定して、意味および文脈を指定することができる。これらのユーザが構成した終端および非終端のデータ項目を、IDT内に組み込むことができる。
たとえば図3は、財務システムと共に働くように調整されたNLUシステムに対処する、一連の終端および非終端データ項目を示す図である。終端および非終端データ項目はツリー構造で編成され、ツリーのルートは当該構造の頂点にある。このルート・ノードから親ノードが子ノードへと分岐し、さらにこれらの子ノードは他の子ノードに対する親ノードとして働く。ツリー構造は、コーパス・テキストの実際の単語に達するまで下方へと続く。たとえば、図3に示されるように、単語「want」320には終端「null」330によって注釈が付けられている。とりわけ、文に関する文脈上の情報または意味を、もしもあったとしてもそれほど多く伝えているものとは識別されない単語に、「null」終端を適用することができる。また、単語「first」340には終端「select」350によって注釈が付けられており、これがその親へ、この場合は非終端の「SELECT」360へと流れる。「SELECT」非終端360は、他の非終端「FUND−INFO」370である親ノードへと流れる。したがって、意味ツリーの「SELECT」非終端360は、「FUND−INFO」の子であり、「select」に対しては親である。次に「FUND−INFO」は、テキスト文字列のルート・ノードであり最高レベルを示す「!S!」へと流れる。終端および非終端の名前は、完全にユーザが構成することができる。たとえば、統計モデルが旅行予約システムと共に働くように設計されている場合、アプリケーション開発者またはユーザは、アプリケーション特有の単語グループ分けを表すように終端および非終端を構成することができる。その場合の例には、休暇の種類、出発日、到着日、旅行期間、およびその他を含めることができる。
非注釈付け文の場合、IDTはデフォルトの終端および非終端の注釈付けプログラムを使用して、解析ツリーまたはクラス・ツリーを完了させることができる。デフォルトの非終端注釈付けプログラムが「null」の場合、IDTはメモリ内に格納された個々の単語を照会して、他の好適または適当な非終端を選択することができる。依然としてIDTは、デフォルトの非終端ではなく、特定の単語に対して以前に指定された非終端注釈付けプログラムを使用することができる。
部分的に注釈付けされた文の場合、IDTはその文に関する解析ツリーまたはクラス・ツリーを自動的に完了させることができる。その場合IDTは、決定された解析ツリーを有するメモリから文を検索することが可能であり、当該文は入力された文に似ているか、または部分的に注釈付けされた文である。したがってIDTは、格納された解析済みの文に基づいて、入力された文に対する完全な解析ツリーを提案することができる。この方法でIDTは、自動完了機能を使用して、テキスト文に対するクラス・ツリーおよび解析ツリーを決定することができる。別の方法として、ユーザは、終端および非終端を挿入すること、ならびにノードを適切な分岐線に接続することによって、IDTを使用して意味ツリーを手動で構築することができる。
解釈データは、いくつかの方法で、ツリー・エディタ・ビューを使用してグラフィカルに編集することができる。たとえば、ツリー・エディタ・ビューでは、テキストのコーパスを有する単語の編集が可能であり、終端および非終端の編集が可能であり、分岐の編集が可能である。前述の編集はそれぞれ、ドラッグ・アンド・ドロップ、右および左クリック、ならびにダブル・クリック・アクションなどの、従来のポインタ制御アクションを使用して実行することができる。たとえばツリーのノードは、そのノードを選択し、そのノードをドラッグしてユーザが意図する新しい親の上でドロップすることにより、異なる親を指すように編集することができる。このアクションは、選択されたノードへの以前の親からのリンクを外し、そのノードを新しい親にリンクさせるものである。さらにユーザは、ツリーの分岐を手動で描くか、またはIDT内で様々な機能を使用して分岐を描くことが可能であり、その結果として生じるツリーの形状は読取り可能な構造を有する。IDTは、任意のツリー分岐が他のツリー分岐と重複するかまたは交わることがないようにする設定を含むことができる。ユーザは、分岐の角度、および直線または曲線の分岐を選択することが可能であり、その結果として生じるツリーの形状は読取り可能な構造を有する。さらに、テキスト、テキスト・サイズ、充てんカラー、および充てんパターンは、ユーザが構成することができる。システム内の有効なツリーは、最終的に「!S!」などのルート記号またはルート・ノードを代表する何らかの他の記号につながる単語を含まなければならないことを理解されたい。したがってIDTは、無効なツリー構造を生じる結果となるような、特定の編集制御またはアクションを使用禁止にする安全機能を含むことができる。
図4は、本明細書に開示された本発明の配置構成に従っていくつかの異なる検索機能を実施するための、例示的なGUI375を示す概略図である。図に示されるように、様々な異なる方法でユーザがテキストの注釈および構造を検索できるようにする、GUI375が提供可能である。具体的に言えば、ユーザは、特定のタグに関してはフィールド380を使用し、特定のラベルに関してはフィールド385を使用し、特定のツリー構造および/または下部構造に関してはフィールド390を使用して、テキスト注釈を検索することができる。たとえば、ユーザは、大規模なツリー構造のうちの小さなセグメントを描画し、フィールド390に指定されたツリー構造に似ている構造を注釈データから検索することができる。
ツリー構造それ自体を使用して、他の関連または一致する構造を検索することができる。具体的に言えば、IDTは、ユーザが意味ツリーの一部を選択できるようにするものである。いったん選択すると、ユーザは、選択された構造に一致する構造を他の意味ツリーから検索するように、IDTに指示することができる。たとえばユーザは、ユーザがテキストのコーパス内のどこかに配置しようと考える構造を有するツリー・ノードを、マウスを使用して四角で囲むことができる。ユーザが描いた四角の中にある意味ツリーの項目またはノードを、選択することができる。いったん選択されると、IDTは、データベース機能を使用して注釈付けされたテキストのコーパスを検索し、一致する構造を突き止めることができる。キーボードのキーストロークの異なる組合せなどの、ツリー・ノードを選択する他の方法も使用できることを理解されたい。したがって本発明は、意味ツリー構造を選択する特定の方法に限定されるものではない。
終端および非終端の両方を編集または作成するための、例示的なGUI400を提供することができる。したがって、以下の考察では非終端について述べるが、これは、終端および非終端のどちらにも適用可能である。このユーザ・インターフェースは、ユーザが新しい非終端(場合によってはタグと呼ばれることもある)を記述できるようにするものである。また、既存の非終端の定義を編集することもできる。この機能を呼び出す場合、ユーザは、非終端が作成または編集される単語を選択し、当該非終端を編集または作成するためのユーザ・コマンドを発行することができる。フィールド405は、1つまたは複数の選択されたツリー・ノードのすべての親および子ノードの交差を取り、当該交差を、選択された単語またはノードに可能なラベル選択肢としてユーザに提示することができる、「許容ディクショナリ・リスト(Dictionary Allowed List)」である。さらに、ノードの交差内で、許容ディクショナリ・リストは、以前の親および子ノードが他の意味ツリー内で編成されていた方法、ならびに、親および子ノードから延在する分岐と親および子ノードへつながる分岐の方向に関する他の履歴情報を、考慮に入れることができる。本発明の一実施形態では、自動モードを提供することができる。自動モードでは、可能な終端または非終端を許容ディクショナリ・リストが1つだけ含んでいる場合、IDTは、ユーザが選択した単語または単語のグループに適用される終端または非終端を自動的に選択することができる。
フィールド410は、システムで定義されたすべての終端または非終端をユーザに提示することができる、GUI400のディクショナリ・フィールドである。ユーザが終端または非終端を選択するためにリストを使用するかどうかに関わらず、記述フィールド415は、選択された項目の適切な使用法に関する情報をユーザに提供することができる。フィールド415の記述は、ユーザが特定の終端または非終端の適切かつ所期の用途を学習するのを支援することができる。たとえば、IDTによって、ユーザがツール・エディタ・ビュー内でポインタを終端または非終端の上に移動させたときに、記述それ自体をツール・チップとして表示することができる。これは、新しい開発者が既存のNLU開発チームに加入し、その開発チームが使用する注釈付けの方法を習得しなければならない場合に、特に有益な可能性がある。
ユーザがまだ定義されていない新しい終端をIDTに入力したい場合、ユーザは「新規タグ(New Tag)」アイコン420を選択することができる。図6は、その場合にアイコン420の起動に応答してIDTが表示することのできる、例示的なGUI500を示す図である。図6の例示的GUI500は、ユーザが、新しい終端または非終端をフィールド510に、付随する記述をフィールド520に入力できるようにするものである。
図7は、図3のGUIと同様のツリー・エディタ・ビューを提示するための、他の例示的GUI600を示す図である。図に示されるように、例示的GUI600には、GUI600のウィンドウ610内でアクセス可能な例示的ポップアップ・メニュー605が含まれる。とりわけ、このポップアップ・メニュー605から前述の機能の多くに直接アクセスすることができる。たとえばユーザは、追加の非終端の追加、構成ファイル内に指定された統計モデルに従った文の分類を含む解析ツリーの自動完了の選択、ツリーのノードの編集、単語構造または文全体の構造の検索、ならびに、アクションの削除または取消しを実行することができる。さらに図に示されるように、それぞれの単語が対応するタグですでに注釈付けされているために、「タグの追加(Add Tag)」機能は使用不可である。とりわけ本発明のこの実施形態では、タグおよびラベルという用語は特定の終端または非終端に関連して使用されている。たとえば、タグは単語に割り当てられ、ラベルはタグのグループ分けに構造を割り当てる際に使用することができる。したがって、ルート・ノードまでの解析ツリーを完了するためにはラベルのみが使用可能である。
図8は、ツリー・エディタ・ビューを提示するための他の例示的GUI700を示す図である。この場合、ユーザはツリー・エディタ・ビューに示されたテキストのコーパスの単語を編集することを選択した。とりわけ、ユーザはトレーニング文の単語を選択し、その単語の編集を選択した。以前の単語の代わりに、新しい単語「description」705が入力されている。したがってユーザは、テキストの実際のコーパス、ならびにIDTのいずれかのツリー・エディタ・ビューからの終端、非終端、およびツリー構造を編集することができる。とりわけこの場合は、ツリーの単語を変更してもツリーの形状は変化しないが、古い単語が新しくユーザが指定した単語に置き換えられる。さらに、IDTは、メモリからの文と編集された文とが一致するかどうかをチェックすることができる。一致する場合、既存のツリーを使用するか、または既存のツリーを新しく編集したツリーに置き換えるかに関して、ユーザに照会することができる。
図9は、ユーザが文変更機能を呼び出した、ツリー・エディタ・ビューを提示するための他の例示的GUI800を示す図である。こうしたユーザの要求に応答して、IDTは、ユーザが任意のツリー・エディタ・ビュー内からトレーニング・コーパス文全体を編集することのできる、例示的GUI805を表示することができる。とりわけ、ユーザが文を編集する際に、任意の解析ツリー、クラス・ツリー、および編集済みの文にはもはや対応しない他の解釈情報を、データベース内で更新することができる。IDTは、既存の文を検索して、他の文が新しく編集した文と一致するかどうかを判別することができる。一致する場合、一致する文のクラス・ツリーおよび解析ツリーのデータを、新しく編集された文に関連付けることができる。さらにこの機能により、ユーザは、テキストのコーパスが読み取られるかまたは処理されるときに、以下で論じるいくつかのオプションのうちの1つを使用して、そのコーパスに導入されたエラーを修正することができる。
図10は、ツリーの基部を有する単語を表示するために使用可能な、例示的GUI900を示す図である。文はフィールド925内にリスト表示可能であり、情報はいくつかの異なる列フィールドに従って編成可能である。具体的に言えば、列見出し905を使用して、テキストのコーパス内での個々の文の番号位置を表示することができる。列見出し910は、カウント、すなわちその正確なテキストがテキストのコーパス内に現れる回数を表示するために、予約することができる。列見出し915は、文の先頭に付けられるフィードバック・タグ、ならびに文のテキストを表示することができる。フィードバック・タグは、文が対応する形式名およびスロット名を示すことができる。フィードバック・タグは、別の列にリスト表示するか、または文のテキストの前に付けることができる。さらにユーザは、IDTを文の分類モードにするボタン920を起動することによって、他のビューに切り替えることができる。図に示されるように、クラス名またはタグが文に組み込まれている。とりわけ、同じGUIスタイルを使用して、解析済みまたは分類済みの両方の文をユーザに提示することができる。したがって、文の単語を、場合に応じて終端または非終端に置き換えることができる。
リスト表示された文は、文番号列、カウント番号列、またはテキスト列に従って昇順または降順でソートすることができる。GUI900は、各文に含まれる単語の数を示す列を含むこともできる。ユーザはこの情報を使用して、分類または解析を開始するための短い文を選択することができる。文を昇順または降順でソートすることが可能であり、任意の列カテゴリに基づいて検索またはフィルタリングすることが可能であることを理解されたい。
GUI900に含まれる表示列は、IDEによって追跡される任意のデータに従ってユーザが構成できるものである。たとえば、所与の文に対応するフィードバック・タグ、プロンプト、解析ツリー・スコア、またはアプリケーション・フォームを指定する、追加の列を含めることができる。解析プログラムまたは分類プログラムによって決定された、文の注釈付けランクを示す列を含めることができる。たとえば、ランク1は、モデルが正しい答えを予測する最も高い可能性を示すことができる。ランクが高いほど、モデルが正しい答えを予測する可能性は低くなる。文がトレーニングまたは平滑化(smoothing)に使用されるかどうかを示すことが可能な、状況列を含めることができる。文法生成、ユーザによる入力、パイロット・テスト中の会話、システム・テスト中の会話、展開中の会話、またはその他などの、文がどのように集められたかを示す情報を含めることもできる。いずれの場合も、前述のリストが網羅的であるという意味ではない。
図11は、ディクショナリ・スタイルの単語ビューを提示するために使用可能な、例示的GUI1000を示す図である。このビューを使用して、終端、非終端、または注釈付き単語の完全なリストを表示することができる。当該表示は、特定のテキストのコーパス内で使用されない終端および非終端を表示する必要がないように、構成することができる。とりわけユーザは、現在のビューをさらに示す起動可能アイコン1025を起動することによって、分類ビューと解析ビューとの間を前後にトグルすることができる。この場合、当該ビューはディクショナリ解析ビューである。注釈付けされていない単語を単語ビュー内に表示することができるが、必ずしも必要ではない。図11に示されるように、ウィンドウ1005の単語ビューは、少なくとも2つの見出しに再分割することができる。見出しは、単語見出し1010と終端または非終端見出し1015を含むことができる。終端または非終端見出し1015では、括弧に入った数字で、データがテキストのコーパスに現れた回数を示すことができる。ユーザは、カウントを実行可能または実行不能にすること、ならびにGUI1000内の項目の色およびフォントを調整することができる。また、IDTは、ユーザがカウントの少ない項目とカウントの多い項目とを区別できるようにするものでもある。たとえば、IDTはカウントの少ない項目を1つの色で表し、カウントの多い項目を別の色を使用して表すことができる。さらに、特定の終端または非終端のカウントが特定のプログラム可能しきい値よりも少ない場合、システムは、終端または非終端の統計精度を上げるためにはより多くのデータが必要であることを示すことができる。一実施形態では、特定の情報項目を、開発者が適切であるとみなす統計的または発見的情報に基づいてハイライト表示することができる。
例示的GUI1000を使用して、終端が非終端まで延在する方法を表示することもできる。たとえば、終端を列見出し1010の下にある列に配置し、非終端を列見出し1015の下にある列に配置することができる。ディクショナリ・タグ・ビューでは、特定のノードから親ノードへと延在する分岐の方向を表示することができる。たとえば、ポインティング・デバイスを使用して、ユーザが特定の非終端上で右クリックすると、IDTは子ノードから親ノードへと延在する分岐の方向を表示することができる。可能な方向には、単項(unary)、左、中、右、上、または下が含まれる。
さらに例示的GUI1000を使用して、非終端が他の非終端に接続する方法を表示することができる。この場合、ラベルが他のラベルと接続できることから、ラベルはどちらの列にも配置可能であることを除いて、ビューはタグ・ビューと同様とすることができる。いずれの場合も、GUI1000はユーザによる構成が可能である。一態様では、列の順序付けをユーザが決定することができる。たとえば、タグ列および付随する番号情報を単語列の左に表示することができる。同様に、単語列の左の列に、テキストのコーパスに単語が現れた合計回数を表示することができる。単語列の右には、単語が特定のタグまたはルートとしてタグ付けされた回数を示す番号を表示することができる。それでも、列の順序付け、ならびに他の解釈情報を表示するための追加の列を含めることは、ユーザによる構成が可能である。
ディクショナリ・スタイル・ビューの他の実施形態では、解釈情報、ならびに具体的には、ディレクトリ・ツリー構造と同様に終端および非終端情報を、ユーザに提示することができる。この場合、タグはグラフィックではルートとして提示することが可能であり、ラベルはグラフィックではルートの下に折りたたみ式構造として示すことが可能である。さらに、他の非終端に接続する非終端は、グラフィックではそれらの親である非終端の下に示すことが可能である。ユーザは、終端または非終端をクリックして、下にある構造を展開および表示するか、または終端または非終端をクリックして、下にある構造を折りたたむことができる。ディレクトリ・ツリー・ビューは、終端および非終端が構築中の統計モデル内で使用されている間に、終端および非終端の階層全体の直感的なグラフィカル表示をユーザに提供することができる。
検索機能をディクショナリ・ビューに含めて、ユーザが特定のエントリを有するデータ項目を検索できるようにすることができる。たとえばユーザは、特定のタグまたはラベルを検索すること、ならびに、タグまたはラベルを、注釈データ内でタグまたはラベルが発生した回数などのパラメータによって検索することができる。当該検索機能は、終端と非終端との間にユーザが指定した関係を検索することもできる。例えばユーザは、右、左、上、または単項などの特定の方向から、ノードから延在するかまたはノードに到達する分岐を有する、任意のノード、親および/または子に関して、注釈データを検索することができる。
ディクショナリ・ビューにフィルタ機能を含めることもできる。ユーザは、GUI1000を介して、データ項目ソース、データ項目ターゲット、データ項目に関連付けられた方向、またはデータ項目に関連付けられた注釈付けプログラムなどのパラメータに従って、表示された情報をフィルタリングすることができる。ユーザは、データが注釈付けされているかまたはいないかを示す注釈状況、子ノードが親として「N」よりも多くの注釈付けされた例を有するかどうかを示すノード・カウント、特定のデータ・ファイルからの関係のみが表示されるデータ・ファイル、特定の文からのみ導出された関係を表示するための文の領域、ならびに、トレーニング、平滑化、および/またはテスト・データからの関係を表示するための使用状況に従って、データをフィルタリングすることもできる。
図12は、IDTの構築構成要素と共に使用可能な例示的GUI1100を示す図である。例示的GUI1100には、NLUアプリケーションを「構築」するために実行可能なスクリプトを指定するための、いくつかのフィールドが含まれる。フィールド1105を使用して、デフォルトのパラメータ、他の特定用途向けパラメータ、実行されるスクリプト、ならびにスクリプトが実行された後に表示される情報を指定することが可能な、特定のファイルを指定することができる。さらに当該ファイルは、回帰テスト中に処理および使用されるテキスト・ファイルを指定することもできる。記述(Description)フィールド1110には、スクリプトの機能の記述が含まれる。パラメータ・リスト(Parameter List)フィールド1115には、スクリプトの実行に使用可能なパラメータのリストを表示することができる。フィールド1120を使用して、スクリプトに関連する可能性のある任意の追加の情報または所見を伝えることができる。とりわけ、記述フィールド1110および追加情報(Additional Information)フィールド1120は、ユーザのチームまたはアプリケーション開発者がNLUアプリケーションを開発中である開発環境で役立つ可能性がある。
図13は、IDTの回帰テスト構成要素と共に使用可能な、例示的GUI1200を示す図である。とりわけ、GUI1200は、2つの部分に再分割することができる。フィールド1205は、テキストのコーパスのユーザの注釈から決定された真の意味ツリーを表示することができる。フィールド1210は、図12のフィールド1105で以前に指定された構成ファイルに指定された統計モデルを使用して、IDTによって生成された意味ツリーを表示することができる。したがって、構成ファイル内に複数の統計モデルを指定することが可能であり、それによって各統計モデルの結果を比較することができる。たとえば、GUIは第3の部分を含むことが可能であり、ここでGUIは、回帰テスト中に使用された各統計モデルに対して1つの部分を有し、真に対して別の部分を有する。この2つのツリーの相違点を、自動的にハイライト表示することができる。異なる確率が最も高く、不正な結果につながるような相違点は、さらに強調させることができる。したがって、どこからデバッグを開始すればよいかというヒントを、ユーザに与えることができる。ユーザは、例示された意味ツリー間の相違点を視覚的に確認することができる。
ユーザは、結果として生じる意味ツリー、この場合は解析ツリーを、1つずつ循環させることができる。例えばユーザは、各回析ツリーに対応する信頼スコアで示された上位「n」個の選択肢を循環させることができる。信頼スコアは、真ではなく、結果として生じる解析ツリーが基礎となる統計モデルをどこまで細密に反映しているかについて、IDTが解釈したインジケーションを提供するものであることを理解されたい。高い信頼スコアを有する結果として生じる解析ツリーと、真と細密に一致する結果として生じる解析ツリーとの間には、対応関係が存在する可能性がある。とりわけ、上位「n」個の選択肢のうちの1つは、真と一致する統計モデルである可能性がある。にもかかわらずユーザは、特に真が正しくない場合に、可能な解釈を循環させて、将来の編集の基点とすることのできる解釈を見つけることができる。
さらに図13には、モデルの信頼スコアがユーザに対して表示されていることをユーザに通知する、自動完了スコア(Autocompletion Score)1215も示されている。各ノードまたは各ノードに対応するテキストの信頼スコアなどの追加情報を、ノード内に表示するか、またはポインタが意味ツリーのノード上に置かれたときにツール・チップとして表示することができる。一実施形態では、ノードを拡張して増加した解釈情報を収容することができる。ノードの信頼スコアは、エラーを検出する際、あるいは特定の解析ツリーがなぜ真に近似または一致しなかったかを判別する際に、開発者を支援することができる。しかしながら、IDTは、様々な意味ツリーの特徴および設定のいずれかを、ツール・チップとしてまたはノード内に表示できるように構成可能であることを理解されたい。GUI1200は、正しい注釈のスコアが、モデルから抽出された回答の最高スコアよりも高い場合に、メッセージを提示することもできる。その場合、モデルは正しい回答を予測しており、統計モデルの検索メカニズムには問題が生じている。これは通常、検索の範囲を広げることによって修復され、開発者が直接何らかのデバッグを行う必要はない。
さらに図13のGUIを使用して、同じ文の注釈データの異なるステージを示すこともできる。具体的に言えば、第1のパス、たとえば解析パスから生じた注釈データを1つのウィンドウに表示し、分類パスなどの第2のパスから生じた注釈データを他のウィンドウに表示することができる。しかしながら、分割画面GUI1200は異なる文を表示することもできる。たとえば、1つのウィンドウを使用して文のビューを保持し、第2のウィンドウを使用して特定の構造を有する他の文を検索することができる。
さらに分割画面GUI1200を使用して、文脈の異なる同じテキスト文について2つの異なる注釈を表示することもできる。たとえば、解析「what’s available」は、「how may I help you」または「what fund would you like the price of」、あるいは「how much would you like to withdraw」に答える場合に、異なる意味をとる。
図14は、IDTのインポート構成要素と共に使用可能な例示的GUI1300を示す図である。インポート構成要素は、いくつかの方法のうちのいずれかを使用して既存のテキストのコーパスをインポートすることができる。たとえば、テキストのコーパスは、文の注釈付けされていないテキスト・ファイルまたは注釈付けされたテキスト・ファイルとしてインポートすることができる。さらに、従来のNLUシステムはユーザの応答を格納できるものであるため、NLUシステムのログを調べて、解析プログラムの出力、分類プログラムの出力、または言語モデル・テキストのデータを取得することができる。前述のデータ・タイプは、それぞれIDTにインポートすることができる。他の実施形態では、ユーザは、ディクショナリ・スタイル・ビューまたはツリー・ビューを使用して、テキスト文をIDTに1つずつ直接タイプ入力することができる。
さらに他の実施形態は、テキストのコーパスを表現するユーザが話した言葉を含むデジタル・オーディオ・ファイルを受け取ることができる。別の方法としてIDTは、サウンド・カードなどのアナログ−デジタル変換器を介して、アナログ・オーディオ・ソースをデジタル形式で記録することができる。にもかかわらず、IDTは、ユーザが話した言葉をテキストに変換してトレーニング・コーパスを導出するための音声認識システムを含むことができる。その場合、テキストのコーパスのデジタル記録を、将来の使用および分析用、ならびにIDT使用時の再生用に、メモリに格納することができる。トレーニング・テキスト・コーパスを表現するオーディオ・ファイルを特定のテキスト句または文に関連付けると、その結果としてユーザまたは開発者は、トレーニング・テキストのオーディオ表現を聞くこと、ならびにテキストに関係する注釈情報を見ることができる。たとえば、オーディオ・ファイルの位置およびファイル名を指定することによって、テキストの一部、テキストに注釈が付けられているか、付けられていないか、分類プログラムの出力、または解析プログラムの出力を、オーディオ・ファイルに関連付けることができる。別の方法として、オーディオ・ファイルを指定して、開発者が関連付けられたテキストをIDTにタイプ入力することもできる。
GUI1300は、テキストのコーパスをインポートするときにインポート構成要素の設定を調整するために使用することができる。フィールド1305を使用して、IDTにインポートされるファイルの名前およびパスを表示することができる。とりわけこのファイルは、注釈付けされたテキストのコーパス、注釈付けされていないテキストのコーパス、および/または、処理される音声のデジタル記録または音声認識エンジンから導出されたテキスト・ファイルを含む音声ファイルとすることができる。フィールド1310は、インポートされるファイル内でIDTによって認識された文の数を示すことができる。コントロール1315、1320、1325、および1330は、インポートのタイプ、あるいはIDTに組み込まれている現在の統計モデルにどの文および対応する注釈データが組み入れられるかを決定する。たとえば、コントロール1315を起動すると、結果としてIDTはすべての文を追加する。文がすでにデータベースに含まれている場合、IDTはインポートされた文に対してIDT内に定義されているツリー構造を使用する。コントロール1320を起動してもいずれの文もインポートされないが、インポート済みファイル内の重複する文に対応する注釈データで、IDTに含まれる注釈データを上書することになる。コントロール1325を起動すると、リレーショナル・データベース内にすでに含まれている文であるにもかかわらず、すべての文を追加する。しかしながらコントロール1325は、インポート済みファイルからの重複する文に対応する注釈データで、IDT内の注釈データを上書することになる。コントロール1330を起動すると、リレーショナル・データベース内に含まれていない、インポート済みファイルからの文および注釈データのみを追加することになる。コントロール1335を起動すると、前述のインポート基準に従って、指定されたファイルがインポートされる。
図15は、インポート済みファイル内に位置する終端および非終端を現在の統計モデルに追加するために使用可能な、例示的GUI1400を示す図である。たとえばIDTは、注釈付けされたテキスト・ファイルをインポートした後、当該の注釈付けされたインポート済みテキスト・ファイル内で、現在の統計モデル内に存在しない終端および非終端を識別することができる。したがって、ユーザに提示可能なGUI1400では、ウィンドウ1405内で新しい終端および非終端をユーザに提示することができる。とりわけ、「タグ/ラベル(Tag/Label)」列1410内のインジケーションは、新しい項目を、たとえばタグまたはラベル(終端または非終端)として識別することができる。特定のタグまたはラベルの正確なスペリングは、「スペリング(Spelling)」列1415にリスト表示することができる。ユーザは、「記述(Description)」列1420に、タグまたはラベルに関する機能または他の関連情報の適切な記述を記入することができる。とりわけユーザは、特別なGUIを必要とせずに、テキストをGUI1400に直接入力して記述列に記入することができる。したがって、タグまたはラベル記述の編集は、所望のタグに対応する記述の行および列を選択することで「インライン」で実行することができる。
ユーザは、本明細書で開示されたIDTが解釈情報の様々な側面を表すために、様々な色、パターン、サウンド、および記号を含む様々な方法のうちのいずれかで解釈情報を描写するように、構成することができる。同様にユーザは、IDT内で使用される終端または非終端をカスタマイズすることができる。したがって、上記明細書では本発明の好ましい実施形態について例示および説明しているが、本発明が本明細書で開示された精密な構造に限定されるものでないことを理解されよう。本発明は、その趣旨または不可欠な属性から逸脱することなく、他の特定の形式で具体化することが可能である。したがって、本発明の範囲を示すものとしては、上記明細書ではなく特許請求の範囲を参照すべきである。
本発明は、ハードウェア、ソフトウェア、またはハードウェアとソフトウェアの組合せで実現することができる。本発明は、1つのコンピュータ・システム内の集中型方式、または異なる要素がいくつかの相互に接続されたコンピュータ・システムにまたがって分散している分散型方式で、実現することができる。本明細書に記載された方法を実施するように適合された、任意の種類のコンピュータ・システムまたは他の装置が好適である。ハードウェアとソフトウェアの典型的な組合せは、ロードおよび実行されると、本明細書に記載された方法を実行するようにコンピュータを制御するコンピュータ・プログラムを備えた、汎用コンピュータ・システムとすることができる。
本発明は、本明細書に記載された方法の実施を可能にするすべての機能を有し、コンピュータ・システムにロードされるとこれらの方法を実行することが可能な、コンピュータ・プログラム記録媒体で具体化することもできる。この文脈でのコンピュータ・プログラムとは、情報処理機能を有するシステムに、特定の機能を実行させることを意図した命令セットの、任意の言語、コード、または表記法での任意の表現式を意味するものであり、当該特定機能の実行は、直接、あるいはa)他の言語、コード、または表記法への変換、b)異なる材料形式での再生のうちの、いずれかまたは両方を実行した後に行われる。
本発明が使用可能なコンピュータ・システムの例を示す概略図である。 本明細書で開示された本発明が実施可能なシステム・アーキテクチャの例を示す概略図である。 例示的なツリー・ビューのグラフィカル・ユーザ・インターフェースを示す図である。 自然言語理解解釈情報を検索するための例示的なグラフィカル・ユーザ・インターフェースを示す図である。 タグを修正および作成するための例示的なグラフィカル・ユーザ・インターフェースを示す図である。 新しいタグを定義するための例示的なグラフィカル・ユーザ・インターフェースを示す図である。 意味ツリー・ビューを示す例示的なグラフィカル・ユーザ・インターフェースを示す図である。 意味ツリー・ビューを示す他の例示的なグラフィカル・ユーザ・インターフェースを示す図である。 意味ツリー・ビュー内のテキストを修正するための例示的なグラフィカル・ユーザ・インターフェースを示す図である。 トレーニング・テキスト・コーパスの文および/または句を表示するための、例示的なグラフィカル・ユーザ・インターフェースを示す図である。 ディクショナリ・スタイル・ビュー内に終端および非終端のデータ項目を表示するための、例示的なグラフィカル・ユーザ・インターフェースを示す図である。 本明細書に開示された本発明の構築ビューおよび構成要素を示す、例示的なグラフィカル・ユーザ・インターフェースを示す図である。 複数の意味ツリーを表示するための例示的なグラフィカル・ユーザ・インターフェースを示す図である。 データをインポートするための例示的なグラフィカル・ユーザ・インターフェースを示す図である。 インポート済みデータ内で終端および非終端を識別するための例示的なグラフィカル・ユーザ・インターフェースを示す図である。

Claims (38)

  1. マルチ・パス処理技法を使用して自然言語理解(NLU)トレーニング・テキスト・コーパスからNLU解釈情報を決定するステップであって、1つのパスを変更すると後続のパスに関する入力が自動的に変更され、前記NLU解釈情報は前記NLUトレーニング・テキスト・コーパスの少なくとも一部の解釈を指定するものである、NLU解釈情報を決定するステップと、
    前記NLU解釈情報をデータベース(205)内に格納するステップと、
    グラフィカル・エディタ(310)内で、NLU解釈情報の選択された項目(330)を提示するステップ、および前記NLU解釈情報に対するユーザ指定の編集を受け取るステップと、
    を有する、自然言語理解(NLU)アプリケーションを開発する方法。
  2. 前記提示するステップが、
    前記NLU解釈情報を、データ項目を表す終端ノードおよび非終端ノードからなる意味ツリーとして提示するステップをさらに有する、請求項1に記載の方法。
  3. 前記意味ツリーの一部が正しいかどうかを示す確率を決定するステップと、
    前記確率が所定のしきい値確率を超えない場合、前記意味ツリーの前記一部を視覚的に識別するステップと、
    をさらに有する、請求項2に記載の方法。
  4. 前記NLU解釈情報内での前記意味ツリーの下部構造のオカレンスの数を決定するステップと、
    前記オカレンスの数が所定のしきい値を超えない場合、前記意味ツリーの前記下部構造を視覚的に識別するステップと、
    をさらに有する、請求項2に記載の方法。
  5. 前記NLU解釈情報からの前記意味ツリーの選択されたノードの交差を決定するステップと、
    前記選択されたノードの交差を、追加のノードを前記意味ツリーに追加するための選択肢として提示するステップと、
    前記意味ツリーの前記選択されたノードより上にノードを追加するステップであって、前記追加されるノードは前記選択肢から選択されるものである、ノードを追加するステップと、
    をさらに有する、請求項2に記載の方法。
  6. ユーザ・コマンドに応答して、前記意味ツリーの追加ノードを作成するステップであって、前記ノードは追加のデータ項目を表すものである、追加ノードを作成するステップと、
    前記ノードを記述に関連付けるステップと、
    をさらに有する、請求項2に記載の方法。
  7. 前記関連付けられる記述をスペル・チェックするステップをさらに有する、請求項6に記載の方法。
  8. 前記意味ツリーのノードが選択され、前記方法は、
    ユーザの要求に応答して、前記ノードおよび前記ノードのパラメータを表示するための複数の列を有するディクショナリ・ビューを表示するステップをさらに有し、前記ディクショナリ・ビューは、ハイライト表示されたノードによって表されるデータ項目を含むものである、請求項2に記載の方法。
  9. データ項目のディクショナリおよびテキスト解釈を指定するモデルからなるグループから選択された所定のNLU解釈情報に従って、前記意味ツリーを自動的に完了するステップをさらに有する、請求項2に記載の方法。
  10. 前記自動的に完了するステップが、
    前記データ項目のディクショナリからの単一のデータ項目が、前記NLUトレーニング・テキスト・コーパスの単語に関連付けられているかどうかを判定するステップと、
    関連付けられている場合、前記データ項目を前記単語に自動的に割り当てるステップと、
    を有する、請求項9に記載の方法。
  11. 前記NLU解釈情報の選択された項目を、ツール・チップとして表示するステップと、
    前記提示された意味ツリーが正しい解釈である確率を表示するステップと、
    をさらに有する、請求項2に記載の方法。
  12. 指定された意味ツリー構造を前記NLU解釈情報から検索するステップをさらに有する、請求項2に記載の方法。
  13. データ項目の交差を識別するステップと、
    前記NLUトレーニング・テキスト・コーパスの文に関する前記意味ツリーのユーザ指定ノードに注釈を付けるための選択肢として、前記識別されたデータ項目を提示するステップと、
    をさらに有する、請求項2に記載の方法。
  14. 前記提示するステップが、
    親および子のデータ項目と前記データ項目のパラメータとを表示するための複数の列を有するディクショナリ・ビュー内に、前記NLU解釈情報を提示するステップをさらに有する、請求項1に記載の方法。
  15. 前記ディクショナリ・ビューが、前記データ項目の子を示すための列と、前記データ項目の親を示すための他の列とを含む、請求項14に記載の方法。
  16. 前記データ項目を、前記子または親の列に従ってソートするステップをさらに有する、請求項15に記載の方法。
  17. 所定のしきい値を超える確率またはカウントを有するデータ項目を視覚的に示すステップをさらに有する、請求項14に記載の方法。
  18. 所定のしきい値を超えない確率またはカウントを有するデータ項目を非表示にするステップをさらに有する、請求項14に記載の方法。
  19. ユーザが関連のある特定のデータ項目を選択したのに応答して、前記NLU解釈情報から前記関連を表す終端および非終端のノードを有する意味ツリーを検索するステップをさらに有する、請求項14に記載の方法。
  20. データ項目ソース、データ項目ターゲット、データ項目に関連する方向、データ項目に関連する注釈付けプログラム、注釈状況、ノード・カウント、データ・ファイル、文の領域、および使用状況からなるグループから選択されたパラメータに従って、NLU解釈情報をフィルタリングするステップをさらに有する、請求項14に記載の方法。
  21. 前記NLU解釈情報から導出されたヒストグラム情報を表示するステップをさらに有する、請求項14に記載の方法。
  22. 前記提示するステップが、文ビュー内に個々のテキスト句に関連する前記NLU解釈情報を提示するステップをさらに有し、前記NLU解釈情報は、注釈状況、句のカウント、指定された句の用法、句のコレクション情報、正確さの確率、および正確さのランクからなるグループから選択されるものである、請求項1に記載の方法。
  23. 前記提示するステップが、
    前記NLU解釈情報を複数の意味ツリーとして分割画面ビュー内に提示するステップをさらに有し、前記分割画面ビューは、少なくとも、第1の意味ツリーを表示するための第1のウィンドウと、第2の意味ツリーを表示するための第2のウィンドウを有するものである、請求項1に記載の方法。
  24. 前記第1のウィンドウに前記第1の意味ツリーを表示しながら、ユーザの要求に応答して前記第2のウィンドウに前記意味ツリーの異なるツリーを提示するステップをさらに有する、請求項23に記載の方法。
  25. 前記第1および第2の意味ツリーは、同じコンテキスト内の同じテキスト句の異なる解釈である、請求項23に記載の方法。
  26. 前記第1の意味ツリーはテキスト句の正しい解釈を表し、前記第2の意味ツリーは統計モデルに従って前記テキスト句の予測解釈を表すものである、請求項25に記載の方法。
  27. 前記正しい解釈のスコアが前記予測解釈のスコアよりも高い場合、前記統計モデルは不正確であることを指示するステップをさらに有する、請求項26に記載の方法。
  28. 前記第1および第2の意味ツリーは、2つの異なるコンテキスト内の同じテキスト句の異なる解釈である、請求項23に記載の方法。
  29. 前記第1の意味ツリーは第1の処理パス後のテキスト句に対応し、前記第2の意味ツリーは後続の処理パス後の前記テキスト句に対応するものである、請求項23に記載の方法。
  30. 前記第1の意味ツリーが第1のテキスト句を表すものであり、前記方法は、
    前記第1のウィンドウ内の前記第1の意味ツリーへの編集を受け取るステップと、
    ユーザ編集に応答して、前記編集された第1の意味ツリーに対応する異なるテキスト句の意味ツリーを検索するステップと、前記第2のウィンドウ内に前記異なるテキスト句に関する前記意味ツリーを表示するステップと、
    を有する、請求項23に記載の方法。
  31. 前記第1の意味ツリーと前記第2の意味ツリーとの相違を視覚的に示すステップをさらに有する、請求項23に記載の方法。
  32. 前記第1の意味ツリーを前記第2の意味ツリーと一致させるステップをさらに有する、請求項23に記載の方法。
  33. NLUトレーニング文を自動的にインポートするステップと、
    前記NLUトレーニング・テキスト・コーパスから決定された統計的可能性に従って、前記NLUトレーニング文の解釈を自動的に決定するステップと、
    をさらに有する、請求項1に記載の方法。
  34. トレーニング文のNLU解釈を自動的にインポートするステップと、
    前記NLU解釈を前記NLUトレーニング・テキスト・コーパスに適用するステップと、
    をさらに有する、請求項1に記載の方法。
  35. 前記マルチ・パスのうちの1つから結果として生じる前記NLU解釈情報を、前記パスのうちの前記1つを指定するユーザ入力に応答して表示するステップをさらに有する、請求項1に記載の方法。
  36. テキスト句に関するNLU解釈情報の属性に従って、前記NLUトレーニング・テキスト・コーパスのテキスト句を文ビュー内で順序付けするステップと、
    前記テキスト句のうちの少なくとも2つに関する前記NLU解釈情報を意味ツリーとして順次表示するステップであって、前記意味ツリーは、前記文ビューの前記順序付けに従って表示されるものである、順次表示するステップと、
    をさらに有する、請求項1に記載の方法。
  37. 前記いずれかの請求項に記載の方法に従って自然言語理解(NLU)アプリケーションを開発するための総合開発ツールであって、
    NLUトレーニング・テキスト・コーパスに対応するNLU解釈情報の項目を格納するように構成されたデータベースと、
    前記NLU解釈情報の項目を操作するための複数のビューを有する、前記データベースと通信可能なようにリンクされたグラフィカル・エディタと、
    マルチ・パス・システムに従って前記NLU解釈情報の項目を決定するように、および、前記NLU解釈情報の項目を前記データベース内に格納するように、構成されたプロセッサと、
    を有する、総合開発ツール。
  38. コンピュータに、請求項1から36のうちのいずれかに記載の方法の各ステップを実行させるためのコンピュータ・プログラム。
JP2004504138A 2002-05-07 2003-04-10 自然言語理解アプリケーションを構築するための総合開発ツール Pending JP2005537532A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/140,522 US7191119B2 (en) 2002-05-07 2002-05-07 Integrated development tool for building a natural language understanding application
PCT/GB2003/001554 WO2003096217A2 (en) 2002-05-07 2003-04-10 Integrated development tool for building a natural language understanding application

Publications (2)

Publication Number Publication Date
JP2005537532A true JP2005537532A (ja) 2005-12-08
JP2005537532A5 JP2005537532A5 (ja) 2006-03-16

Family

ID=29399446

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004504138A Pending JP2005537532A (ja) 2002-05-07 2003-04-10 自然言語理解アプリケーションを構築するための総合開発ツール

Country Status (8)

Country Link
US (1) US7191119B2 (ja)
EP (1) EP1508102A2 (ja)
JP (1) JP2005537532A (ja)
KR (1) KR100650427B1 (ja)
CN (1) CN100489841C (ja)
AU (1) AU2003222602A1 (ja)
CA (1) CA2482514A1 (ja)
WO (1) WO2003096217A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008108144A (ja) * 2006-10-26 2008-05-08 Hitachi Ltd 情報処理方法、情報処理装置、およびプログラム
JP2008520319A (ja) * 2004-11-23 2008-06-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 気管支樹の平面角視覚化
JP2019197084A (ja) * 2018-05-07 2019-11-14 日本放送協会 手話cg翻訳編集装置及びプログラム

Families Citing this family (140)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7548847B2 (en) 2002-05-10 2009-06-16 Microsoft Corporation System for automatically annotating training data for a natural language understanding system
US7805302B2 (en) * 2002-05-20 2010-09-28 Microsoft Corporation Applying a structured language model to information extraction
US7366655B1 (en) * 2003-04-02 2008-04-29 At&T Corp. Method of generating a labeling guide for spoken dialog services
US7412383B1 (en) * 2003-04-04 2008-08-12 At&T Corp Reducing time for annotating speech data to develop a dialog application
US20040243531A1 (en) * 2003-04-28 2004-12-02 Dean Michael Anthony Methods and systems for representing, using and displaying time-varying information on the Semantic Web
US7853451B1 (en) * 2003-12-18 2010-12-14 At&T Intellectual Property Ii, L.P. System and method of exploiting human-human data for spoken language understanding systems
US20050255431A1 (en) * 2004-05-17 2005-11-17 Aurilab, Llc Interactive language learning system and method
JP4579585B2 (ja) * 2004-06-08 2010-11-10 キヤノン株式会社 音声認識文法作成装置、音声認識文法作成方法、プログラムおよび記憶媒体
JP4579595B2 (ja) * 2004-06-29 2010-11-10 キヤノン株式会社 音声認識文法作成装置、音声認識文法作成方法、プログラム、及び記憶媒体
US20060009966A1 (en) * 2004-07-12 2006-01-12 International Business Machines Corporation Method and system for extracting information from unstructured text using symbolic machine learning
US20060074980A1 (en) * 2004-09-29 2006-04-06 Sarkar Pte. Ltd. System for semantically disambiguating text information
US7970600B2 (en) * 2004-11-03 2011-06-28 Microsoft Corporation Using a first natural language parser to train a second parser
US7305413B2 (en) * 2004-12-14 2007-12-04 Microsoft Corporation Semantic authoring, runtime and training environment
US20060136870A1 (en) * 2004-12-22 2006-06-22 International Business Machines Corporation Visual user interface for creating multimodal applications
US8280719B2 (en) * 2005-05-05 2012-10-02 Ramp, Inc. Methods and systems relating to information extraction
US20060277028A1 (en) * 2005-06-01 2006-12-07 Microsoft Corporation Training a statistical parser on noisy data by filtering
US8433558B2 (en) * 2005-07-25 2013-04-30 At&T Intellectual Property Ii, L.P. Methods and systems for natural language understanding using human knowledge and collected data
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US20070067154A1 (en) * 2005-09-22 2007-03-22 International Business Machines Corporation Language translation system
US8688673B2 (en) * 2005-09-27 2014-04-01 Sarkar Pte Ltd System for communication and collaboration
US7512574B2 (en) * 2005-09-30 2009-03-31 International Business Machines Corporation Consistent histogram maintenance using query feedback
US7965275B1 (en) * 2006-01-13 2011-06-21 Intuit Inc. User interface for lenient exception feedback
US7813926B2 (en) * 2006-03-16 2010-10-12 Microsoft Corporation Training system for a speech recognition application
US10796390B2 (en) * 2006-07-03 2020-10-06 3M Innovative Properties Company System and method for medical coding of vascular interventional radiology procedures
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8515733B2 (en) * 2006-10-18 2013-08-20 Calculemus B.V. Method, device, computer program and computer program product for processing linguistic data in accordance with a formalized natural language
US8131536B2 (en) * 2007-01-12 2012-03-06 Raytheon Bbn Technologies Corp. Extraction-empowered machine translation
US9015047B1 (en) * 2007-02-12 2015-04-21 West Corporation Automatic speech recognition reporting
US8639509B2 (en) 2007-07-27 2014-01-28 Robert Bosch Gmbh Method and system for computing or determining confidence scores for parse trees at all levels
US8135578B2 (en) * 2007-08-24 2012-03-13 Nuance Communications, Inc. Creation and use of application-generic class-based statistical language models for automatic speech recognition
US8868479B2 (en) 2007-09-28 2014-10-21 Telogis, Inc. Natural language parsers to normalize addresses for geocoding
US7890539B2 (en) * 2007-10-10 2011-02-15 Raytheon Bbn Technologies Corp. Semantic matching using predicate-argument structure
US20100262598A1 (en) * 2007-11-21 2010-10-14 Nec Corporation User interface recognition device and user interface recognition method
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8832135B2 (en) * 2008-05-02 2014-09-09 Verint Systems, Ltd. Method and system for database query term suggestion
KR101462932B1 (ko) * 2008-05-28 2014-12-04 엘지전자 주식회사 이동 단말기 및 그의 텍스트 수정방법
US8214734B2 (en) * 2008-10-09 2012-07-03 International Business Machines Corporation Credibility of text analysis engine performance evaluation by rating reference content
US8335754B2 (en) * 2009-03-06 2012-12-18 Tagged, Inc. Representing a document using a semantic structure
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20110271258A1 (en) * 2010-04-30 2011-11-03 Microsoft Corporation Software Development Tool
US8355903B1 (en) 2010-05-13 2013-01-15 Northwestern University System and method for using data and angles to automatically generate a narrative story
US8510100B2 (en) * 2010-05-20 2013-08-13 Xerox Corporation Human readable sentences to represent complex color changes
US10185477B1 (en) 2013-03-15 2019-01-22 Narrative Science Inc. Method and system for configuring automatic generation of narratives from data
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9002772B2 (en) 2011-11-18 2015-04-07 International Business Machines Corporation Scalable rule-based processing system with trigger rules and rule evaluator
US8990070B2 (en) * 2011-11-18 2015-03-24 International Business Machines Corporation Computer-based construction of arbitrarily complex formal grammar expressions
US9122673B2 (en) 2012-03-07 2015-09-01 International Business Machines Corporation Domain specific natural language normalization
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10091323B2 (en) 2012-05-17 2018-10-02 The Meet Group, Inc. Social discovery feed for facilitating social exploration in social networking environments
US9213725B2 (en) 2012-05-17 2015-12-15 Ifwe Inc. Systems and methods for generating automated social interactions in social networking environments
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US20130332450A1 (en) * 2012-06-11 2013-12-12 International Business Machines Corporation System and Method for Automatically Detecting and Interactively Displaying Information About Entities, Activities, and Events from Multiple-Modality Natural Language Sources
US8935155B2 (en) * 2012-09-14 2015-01-13 Siemens Aktiengesellschaft Method for processing medical reports
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9058317B1 (en) * 2012-11-01 2015-06-16 Digital Reasoning Systems, Inc. System and method for machine learning management
US9501140B2 (en) * 2012-11-05 2016-11-22 Onysus Software Ltd Method and apparatus for developing and playing natural user interface applications
US9471559B2 (en) * 2012-12-10 2016-10-18 International Business Machines Corporation Deep analysis of natural language questions for question answering system
CN105408865B (zh) * 2013-05-16 2020-01-10 康维达无线有限责任公司 用于针对IoT系统的作为服务的数据注释的方法与设备
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
US9728184B2 (en) 2013-06-18 2017-08-08 Microsoft Technology Licensing, Llc Restructuring deep neural network acoustic models
US9589565B2 (en) 2013-06-21 2017-03-07 Microsoft Technology Licensing, Llc Environmentally aware dialog policies and response generation
US9311298B2 (en) * 2013-06-21 2016-04-12 Microsoft Technology Licensing, Llc Building conversational understanding systems using a toolset
US9548049B2 (en) * 2014-02-19 2017-01-17 Honeywell International Inc. Methods and systems for integration of speech into systems
US9529794B2 (en) 2014-03-27 2016-12-27 Microsoft Technology Licensing, Llc Flexible schema for language model customization
US9614724B2 (en) 2014-04-21 2017-04-04 Microsoft Technology Licensing, Llc Session-based device configuration
US9520127B2 (en) 2014-04-29 2016-12-13 Microsoft Technology Licensing, Llc Shared hidden layer combination for speech recognition systems
US9430667B2 (en) 2014-05-12 2016-08-30 Microsoft Technology Licensing, Llc Managed wireless distribution network
US10111099B2 (en) 2014-05-12 2018-10-23 Microsoft Technology Licensing, Llc Distributing content in managed wireless distribution networks
US9874914B2 (en) 2014-05-19 2018-01-23 Microsoft Technology Licensing, Llc Power management contracts for accessory devices
US9502031B2 (en) * 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10037202B2 (en) 2014-06-03 2018-07-31 Microsoft Technology Licensing, Llc Techniques to isolating a portion of an online computing service
US9367490B2 (en) 2014-06-13 2016-06-14 Microsoft Technology Licensing, Llc Reversible connector for accessory devices
US9717006B2 (en) 2014-06-23 2017-07-25 Microsoft Technology Licensing, Llc Device quarantine in a wireless network
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10698585B2 (en) * 2014-08-29 2020-06-30 Nuance Communications, Inc. Virtual assistant development system
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US11475076B2 (en) 2014-10-22 2022-10-18 Narrative Science Inc. Interactive and conversational data exploration
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10354188B2 (en) * 2016-08-02 2019-07-16 Microsoft Technology Licensing, Llc Extracting facts from unstructured information
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10417346B2 (en) * 2016-01-23 2019-09-17 Microsoft Technology Licensing, Llc Tool for facilitating the development of new language understanding scenarios
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
CN105893348A (zh) * 2016-03-30 2016-08-24 乐视控股(北京)有限公司 语料获取方法及装置
US10169470B2 (en) * 2016-04-11 2019-01-01 Rovi Guides, Inc. Systems and methods for identifying a meaning of an ambiguous term in a natural language query
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
EP3458952A1 (en) * 2016-06-30 2019-03-27 Siemens Aktiengesellschaft A method for amending or adding functionality to an automation device
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10453454B2 (en) * 2017-10-26 2019-10-22 Hitachi, Ltd. Dialog system with self-learning natural language understanding
US11042708B1 (en) 2018-01-02 2021-06-22 Narrative Science Inc. Context saliency-based deictic parser for natural language generation
US10963649B1 (en) 2018-01-17 2021-03-30 Narrative Science Inc. Applied artificial intelligence technology for narrative generation using an invocable analysis service and configuration-driven analytics
US11030408B1 (en) 2018-02-19 2021-06-08 Narrative Science Inc. Applied artificial intelligence technology for conversational inferencing using named entity reduction
CN110321534B (zh) * 2018-03-28 2023-11-24 科大讯飞股份有限公司 一种文本编辑方法、装置、设备及可读存储介质
US11042713B1 (en) 2018-06-28 2021-06-22 Narrative Scienc Inc. Applied artificial intelligence technology for using natural language processing to train a natural language generation system
US11341330B1 (en) 2019-01-28 2022-05-24 Narrative Science Inc. Applied artificial intelligence technology for adaptive natural language understanding with term discovery
US11757906B2 (en) 2019-04-18 2023-09-12 Oracle International Corporation Detecting behavior anomalies of cloud users for outlier actions
CN111045992B (zh) * 2019-12-04 2023-07-25 中盈优创资讯科技有限公司 一种基于树形结构的配置文件检查方法及系统
CN111130877B (zh) * 2019-12-23 2022-10-04 国网江苏省电力有限公司信息通信分公司 一种基于nlp的网络日志处理系统及方法
US11482223B2 (en) 2020-03-31 2022-10-25 Pricewaterhousecoopers Llp Systems and methods for automatically determining utterances, entities, and intents based on natural language inputs
US11580112B2 (en) 2020-03-31 2023-02-14 Pricewaterhousecoopers Llp Systems and methods for automatically determining utterances, entities, and intents based on natural language inputs
CN111753552B (zh) * 2020-07-02 2024-04-19 浙江百应科技有限公司 一种基于nlp的训练模式与识别模式动态切换的方法
US20220091716A1 (en) * 2020-09-21 2022-03-24 Corel Corporation External content capture for visual mapping methods and systems
CN115457951A (zh) * 2022-05-10 2022-12-09 北京罗克维尔斯科技有限公司 一种语音控制方法、装置、电子设备以及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4914590A (en) * 1988-05-18 1990-04-03 Emhart Industries, Inc. Natural language understanding system
EP0361570B1 (en) * 1988-09-15 1997-08-06 Océ-Nederland B.V. A system for grammatically processing a sentence composed in natural language
US5794050A (en) * 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
US5963940A (en) * 1995-08-16 1999-10-05 Syracuse University Natural language information retrieval system and method
AU9513198A (en) 1997-09-30 1999-04-23 Ihc Health Services, Inc. Aprobabilistic system for natural language processing
US6496208B1 (en) * 1998-09-10 2002-12-17 Microsoft Corporation Method and apparatus for visualizing and exploring large hierarchical structures
US20020103837A1 (en) * 2001-01-31 2002-08-01 International Business Machines Corporation Method for handling requests for information in a natural language understanding system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008520319A (ja) * 2004-11-23 2008-06-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 気管支樹の平面角視覚化
JP4871292B2 (ja) * 2004-11-23 2012-02-08 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 解剖学的ツリー構造を視覚化するためのシステム
JP2008108144A (ja) * 2006-10-26 2008-05-08 Hitachi Ltd 情報処理方法、情報処理装置、およびプログラム
JP2019197084A (ja) * 2018-05-07 2019-11-14 日本放送協会 手話cg翻訳編集装置及びプログラム
JP7049173B2 (ja) 2018-05-07 2022-04-06 日本放送協会 手話cg翻訳編集装置及びプログラム

Also Published As

Publication number Publication date
CA2482514A1 (en) 2003-11-20
AU2003222602A8 (en) 2003-11-11
CN1726488A (zh) 2006-01-25
AU2003222602A1 (en) 2003-11-11
WO2003096217A3 (en) 2004-04-01
KR20040102071A (ko) 2004-12-03
KR100650427B1 (ko) 2006-11-29
WO2003096217A2 (en) 2003-11-20
US7191119B2 (en) 2007-03-13
CN100489841C (zh) 2009-05-20
US20030212543A1 (en) 2003-11-13
EP1508102A2 (en) 2005-02-23

Similar Documents

Publication Publication Date Title
US7191119B2 (en) Integrated development tool for building a natural language understanding application
EP1361522B1 (en) A system for automatically annotating training data for a natural language understanding system
MacWhinney Tools for analyzing talk part 2: The CLAN program
US7080004B2 (en) Grammar authoring system
US6446081B1 (en) Data input and retrieval apparatus
US7076732B2 (en) Document processing apparatus having an authoring capability for describing a document structure
US7774198B2 (en) Navigation system for text
US8370352B2 (en) Contextual searching of electronic records and visual rule construction
US6993487B2 (en) Software code comments management method and system supporting speech recognition technology
US20070219773A1 (en) Syntactic rule development graphical user interface
US5280573A (en) Document processing support system using keywords to retrieve explanatory information linked together by correlative arcs
CN108304375A (zh) 一种信息识别方法及其设备、存储介质、终端
WO2009007181A1 (en) A method, system and computer program for intelligent text annotation
JPH1078964A (ja) 一般に混同するワードを自然言語パーザにおいて識別及び分析する方法及びシステム
US20200210441A1 (en) System and method of database creation through form design
MacWhinney The childes project
US7313784B2 (en) Language independent code assist user preferences configuration method, system, article of manufacture, and computer program product
JP2957875B2 (ja) 文書情報検索装置及び文書検索結果表示方法
Van Halteren et al. Linguistic Exploitation of Syntactic Databases: The Use of the Nijmegen LDB Program
Edhlund et al. NVivo for Mac essentials
US7080316B2 (en) Method for determining rubies
MacWhinney The CHILDES Project Part 2: The CLAN Programs
Paternò et al. Model-based customizable adaptation of web applications for vocal browsing
Weisser Dialogue Annotation & Research Tool (DART)
JP2003173338A (ja) 辞書構築支援装置、辞書構築支援方法及び辞書構築支援プログラム

Legal Events

Date Code Title Description
A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20041222

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050126

A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A072

Effective date: 20050913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070419

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20070419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070419

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070911

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071203

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080117

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20080215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101228

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20110427