JP2000112938A - 自然言語処理装置及びその方法、及び自然言語認識装置 - Google Patents

自然言語処理装置及びその方法、及び自然言語認識装置

Info

Publication number
JP2000112938A
JP2000112938A JP11287094A JP28709499A JP2000112938A JP 2000112938 A JP2000112938 A JP 2000112938A JP 11287094 A JP11287094 A JP 11287094A JP 28709499 A JP28709499 A JP 28709499A JP 2000112938 A JP2000112938 A JP 2000112938A
Authority
JP
Japan
Prior art keywords
data
semantic
lexical
natural language
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11287094A
Other languages
English (en)
Other versions
JP4306894B2 (ja
JP2000112938A5 (ja
Inventor
David Elworthy
エルウォーシー デビッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2000112938A publication Critical patent/JP2000112938A/ja
Publication of JP2000112938A5 publication Critical patent/JP2000112938A5/ja
Application granted granted Critical
Publication of JP4306894B2 publication Critical patent/JP4306894B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 コンピュータによるアクションを開始させる
ために、ユーザが自然言語の句、文、一節を表すデータ
を入力することが可能なユーザ・インタフェースを提供
する。 【解決手段】 入力データは、辞書的意味表現と、その
修飾関係を定義する連結形式の意味データを生成するた
めに解析される(S2,S3)。他の辞書的意味表現を
修飾しない主要な辞書的意味表現を特定することによっ
て、入力データの意味表現を参照データの類似の意味表
現と比較し、参照データ内で等価な辞書的意味表現を特
定する(S4)。そして、入力意味データ内と参照デー
タ内とで辞書的意味表現の等価な連鎖連結された対を特
定する(S5)。コンピュータは、判断された等価性の
程度(S13)に基づいて応答する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は自然言語を処理する
自然言語処理装置及びその方法、及び自然言語認識装置
に関し、特に、入力された自然言語を、その意味を考慮
して参照自然言語と突き合わせる自然言語処理装置及び
その方法、及び自然言語認識装置に関する。
【0002】
【従来の技術】その操作がますます複雑化しているコン
ピュータおよびデータ処理装置の絶え間ない進歩に伴
い、ユーザ・インタフェースを簡略化して、直観的に使
用することを可能としてユーザの必要とする訓練を減ら
した、より「ユーザ・フレンドリ」なインタフェースが
望まれている。
【0003】ユーザがコンピュータまたはデータ処理装
置において何らかの操作を行いたい場合、ユーザは命令
を入力する必要がある。例えば欧州特許EP-A-0118187号
に開示されているように、命令を入力する方法として自
然言語を使用することが、従来より研究されてきた。
【0004】単にキーワードを入力するのではなくて自
然言語を使用する場合、入力された自然言語命令の意味
を判断する必要がある。自然言語の入力命令の意味は、
たとえば英国特許GB-A-2269923号および欧州特許EP-A-0
737928号に開示されているように、パーサ(parser)を
使用して判断することができる。
【0005】英国特許GB-A-2269923号および欧州特許EP
-A-0737928号(その内容は本明細書において参照され
る)では、依存性文法(dependency grammar)と呼ばれ
る特定の形態の文法を使用してオペレーションの解析を
行う、特定の形態のパーサが開示されている。このよう
な依存性パーサの他の例は、「A Dependency Parser fo
r English」(Technical Reports, No. TR-1,ヘルシン
キ大学一般言語学部、1997年3月、T.イェルヴィネン
(Jarvinen)およびP.タパナイネン(Tapanainen)お
よび「A Nonprojective Dependency Parser」(P.Tapan
ainenおよびT. Jarvinen, 第5回Applied Natural Lang
urage Processing会議議事録、ワシントンDC、1997年4
月、Association for Computational Linguistics)で
開示されており、その内容は本明細書において参照され
る。依存性パーサは、自然言語を解析して語の意味表現
を含む意味データを生成し、それらを連結する。この連
結は、どの意味表現によって他の意味表現の意味が修飾
されるかを示し、連結と連結のタイプは自然言語の文法
を考慮して判断される。
【0006】従って、自然言語を使用した命令が装置に
入力されると、パーサを使用して意味表現構造を判断す
ることができる。その後、装置がどの命令を実行すべき
かを解釈するために、意味データが、自然言語の句、
文、または一節を表す1セットまたは複数セットの参照
データと比較される。この比較によって、入力命令の意
味が参照データのうちのいずれかと一致するか否かを判
断することができる。意味の一致が見つかった場合、装
置はそれに応じて応答することができる。
【0007】たとえば、装置が照明のスイッチングを制
御する場合、入力命令が「2階の照明を消す」というも
のであれば、照明を消すためにそれと突き合わせる必要
のある参照句は、「2階のスイッチをオフにする」とい
うものである。それぞれの句で語(word)及びシンタッ
クス(syntax)が異なるため、単純な語の突き合わせ
(word matching)操作は成功しない。しかし、この2
つの句の意味を解析すれば、意味を突き合わせることが
できる。このような問題が生じる他の分野として、デー
タベース検索の分野がある。一般には、データベースは
キーワードを使用して検索されるが、意味解析と意味突
き合わせを併用することによって、データベース検索の
確度を大幅に向上させることができる。
【0008】
【発明が解決しようとする課題】しかしながら、英国特
許GB-A-2269923号および欧州特許EP-A-0737928号におい
ては、自然言語の入力命令に応答する方法として、入力
命令を解析し、次に知識ベース推論プログラムを適用す
る必要がある。しかしこの技法は、事実のセットを有す
る知識ベースを使用しなければならないという点で限界
があった。
【0009】自然言語の句を突き合わせる他の方法とし
ては、C.シュワルツ(Schwarz)による「Automatic S
yntactic Analysis of Free Text」(Joural of the Am
erican Society for Information Science, 1990年9月,
408〜417ページ)と題する論文で開示されている。シュ
ワルツによって開示されているこの技法では、突き合わ
せる自然言語の一節内の名詞句を識別し、それらを選択
して解析する。解析された名詞句は、意味表現構造が標
準または共通の依存性構造に合うように正規化される。
次に、同じ経路またはノードを特定するために、正規化
された意味表現の単純な比較によって名詞句突き合わせ
を行う。
【0010】この句突き合わせ技法は、意味表現構造を
突き合わせることができる利点があるが、名詞句しか突
き合わせることができないという欠点がある。さらに、
正規化プロセスは複雑であり、情報の損失、すなわち意
味の歪曲が生じる可能性があった。
【0011】本発明は上記問題を解決するためになされ
たものであり、自然言語の句、文、または一節を表す入
力データを入力し、従来開示されているものより効率的
かつ正確な方式で意味解析を使用して自然言語の句、
文、または一節を表す参照データと突き合わせることを
可能とする、自然言語処理装置およびその方法、及び自
然言語認識装置を提供することを目的とする。
【0012】
【課題を解決するための手段】上記目的を達成するため
の一態様として、本発明は、装置に操作を実行させるた
めに、自然言語を表すデータをユーザが入力することが
できるようにするユーザ・インタフェースを提供する方
法および装置を提供する。このような操作は、たとえ
ば、データの検索、入力データのルーティング、入力デ
ータの意味によって与えられた命令の実行を含む。装置
へのデータの入力は、音声認識によりテキスト・データ
が生成される発話、テキスト・データが生成される文書
の光学式文字認識、テキスト・データの単純な入力、遠
隔装置からのテキスト・データの転送などのいくつかの
方法のいずれかで行うことができる。
【0013】入力データを解析し、自然言語の文法を考
慮して、辞書的意味表現(lexicalmeaning representat
ions)およびそれらの間の連結(link)としてコンピュ
ータ使用可能な形態に構造化された意味データを生成す
る。連結は、辞書的意味表現のうちのどの表現によって
他の辞書的意味表現が修飾されるかを示す。従って、本
発明は依存性パーサを使用して実施されることが好まし
い。しかし、本発明はそのような形態のパーサには限定
されず、修飾関係を導き出すことができる任意のパーサ
を使用することができる。
【0014】次に、入力データの意味データを参照デー
タの意味データと比較する。参照データの意味データ
は、記憶されている参照データから比較のたびに決定す
るか、または参照データの意味データを事前に決定し、
いつでも比較できるように記憶しておくこともできる。
【0015】比較は、他の辞書的意味表現を修飾しない
主要な辞書的意味表現から始めて、辞書的意味表現のう
ちの少なくとも1つと、連結された辞書的意味表現と、
連結との間の等価性を定義する関係のセットに従って、
等価の連結によって連結された入力データと参照データ
の意味データ内の等価の辞書的意味表現を判断すること
によって行われる。従って、これらの関係が、等価性の
判断を可能にするための規則を定義する。このプロセス
は、入力データと参照データについて辞書的意味表現の
連鎖に沿って等価性を漸進的または再帰的に判断する、
漸進プロセスまたは再帰的プロセスである。この連鎖
は、どの辞書的意味表現が他の辞書的意味表現を修飾す
るか、または修飾されるかを識別する連結によって連続
して連結された複数の辞書的意味表現を含む。多くの異
なる等価性規則を使用することができ、それらの規則の
形態は、文法と、入力データと参照データとの間に必要
な突き合わせの確度とに依存する。
【0016】この装置は、入力データと参照データとの
間の等価性の度合いに応じて、操作、たとえば、入力デ
ータと参照データの意味とが一致するかどうか、あるい
はどの程度一致するかの判断や、入力データと意味の等
価性が最も高い参照データのセットの特定を行うことが
でき、その結果の操作は、画面上への一致結果の表示
や、入力データの意味に最もよく一致する参照データに
応答する命令の実施とすることができる。
【0017】従って、本発明のこの態様によると、入力
意味データの主要な辞書的意味表現を特定し、連鎖連結
された辞書的意味表現内の等価性を再帰的に判断するこ
とによって、従来技術に比べて計算量の少ない、より汎
用的で正確な突き合わせ技法が得られる。
【0018】本発明の他の態様によると、機械実行可能
命令を生成する方法であって、自然言語の句、文、一節
を表すデータを入力するステップと、前記入力データを
解析し、自然言語の文法を考慮して辞書的意味表現およ
びそれらの間の連結としてコンピュータ使用可能形態で
構造化された意味データを生成するステップであって、
前記連結が前記辞書的意味表現のうちのどの表現が該辞
書的意味表現の他の表現を修飾するかを示すステップ
と、辞書的意味表現のうちの少なくとも1つの辞書的意
味表現と、連結された辞書的意味表現と、連結との間の
等価性を定義する関係のセットに従って、前記入力デー
タの前記意味データ内の前記辞書的意味表現のうちの他
の前記辞書的意味表現を修飾しない主要な辞書的意味表
現から始まって、等価の連結によって連結された前記入
力データと参照データの意味データ内の等価の辞書的意
味表現を判断することによって前記入力データの意味デ
ータを参照データの意味データと比較するステップと、
前記比較ステップの結果に応じて機械実行可能命令を生
成するステップとを含む方法が提供される。
【0019】本発明のこの態様は、機械実行可能命令を
生成する装置であって、自然言語の句、文、または一節
を表すデータを入力する入力手段と、前記入力データを
解析し、自然言語の文法を考慮して辞書的意味表現およ
びそれらの間の連結としてコンピュータ使用可能形態で
構造化された意味データを生成する解析手段であって、
前記連結が前記辞書的意味表現のうちのどの表現が該辞
書的意味表現の他の表現を修飾するかを示す解析手段
と、辞書的意味表現のうちの少なくとも1つの辞書的意
味表現と、連結された辞書的意味表現と、連結との間の
等価性を定義する関係のセットに従って、前記入力デー
タの前記意味データ内の前記辞書的意味表現のうちの他
の前記辞書的意味表現を修飾しない主要な辞書的意味表
現から始まって、等価の連結によって連結された前記入
力データと参照データの意味データ内の等価の辞書的意
味表現を判断することによって前記入力データの意味デ
ータを参照データの意味データと比較する比較手段と、
前記比較手段の結果に応じて機械実行可能命令を生成す
る生成手段とを含む装置も提供する。
【0020】本発明のこの態様では、自然言語の入力テ
キストから機械実行可能命令を生成することができる。
これによって、便利なユーザ・インタフェースが得ら
れ、それによってユーザは特定の標準命令を修得する必
要がなく、直観的に正しいが参照テキストの句と厳密に
は一致しないこともある命令を使用することができる。
【0021】辞書的意味表現は、語のセットを表す。こ
のような語のセットは、複数の異なる品詞を含むことが
でき、ある概念を意味するとみなせる語の任意のセット
を含むことができる。
【0022】連結は、連結された辞書的意味表現間の修
飾関係を定義することができる。連結は、辞書的意味表
現の意味関係を示すか、または規制詞を含むか、あるい
はその両方とすることができる。
【0023】一実施形態では、比較ステップは、入力デ
ータの意味データ内の第1の辞書的意味表現を特定する
ステップと、参照データの意味データ内のそれに対応す
る第1の辞書的意味表現を特定するステップと、第1の
辞書的意味表現を修飾する第2の辞書的意味表現を特定
するステップと、参照データの意味データ内の前記特定
された対応する第1の辞書的意味表現に連結された対応
する第2の辞書的意味表現を特定するステップと、関係
のセットに従って入力データと参照データの意味データ
内の連結された第1および第2の辞書的意味表現の等価
性を判断するステップと、等価性が検出された場合、等
価性が検出されなくなるまで各n番目の辞書的意味表現
を修飾する各(n+1)番目の辞書的意味表現について
特定ステップと判断ステップとを繰り返すステップとを
含む。
【0024】連結された辞書的意味表現を比較する一実
施形態では、入力意味データ内と参照意味データ内で等
価の辞書的意味表現を特定し、それらの間に接続を登録
する。次に、辞書的意味表現の連結された対を特定する
ステップは、入力意味データと参照意味データとの間に
登録された接続があり、それらの間に等価連結がある辞
書的意味表現を順次に特定するステップを含む。
【0025】生成される機械実行可能命令は、等価と判
断された連結された辞書的意味表現の数に依存させるこ
とができる。たとえば、一致を登録することができるの
は、入力意味データ内の連結された辞書的意味表現のす
べてが、参照意味データ内の等価な連結された辞書的意
味表現を持つ場合のみとすることができる。あるいは、
突き合わせをトリガするように、等価とされた連結され
た辞書的意味表現のしきい数値を選定することができ
る。
【0026】一実施形態では、関係のセットによって等
価性に点数を与え、高い点数は一致度が良いことを示
し、低い点数は一致度が悪いことを示す。次に、連結さ
れた辞書的意味表現の等価性を累算点として判断し、一
致はこの累算点に依存する。あるいは、一致度が悪い場
合は一致度が良い場合に比べて高いペナルティが蓄積さ
れ、従って良好な一致度は累算ペナルティ点数が低いこ
とによって示される。
【0027】点数は、多くの異なる関係について与える
ことができる。たとえば、特定の辞書的意味表現の出現
に点数を与えることができる。すなわち、あまり弁別的
でない辞書的意味表現は、より弁別的な辞書的意味表現
よりも高い点数を有する。特定の辞書的意味表現の弁別
性は出現頻度およびその他の要素から判断することがで
きる。たとえば、画像を検索するために使用される一実
施形態では、「ピクチャ」および「画像」という語は、
この応用分野ではよく用いられる語であるためあまり弁
別的ではない。しかし、一般的な言語用法では、これら
の語は特に頻出する語ではない。
【0028】辞書的意味表現は、割り当てられた意味を
有する、可能な語のセットを含む。各辞書的意味表現
は、下位辞書的意味表現、すなわちより具体的な辞書的
意味に分けることができ、さらにそれを特定の語に分け
ることができる。さらに、辞書的意味表現内に入る語の
セット内の語のグループを異なるタイプ、たとえば品詞
に分けることができる。下位辞書的意味またはタイプの
出現にも、応用分野またはその他の何らかの要素を考慮
して、その出現頻度に応じて特定の点数を与えることが
できる。
【0029】関係のセットに、各辞書的意味表現のタイ
プの等価性について点数を与えることもできる。たとえ
ば、入力意味データと参照意味データに同じ辞書的意味
表現が現れることがあるが、入力意味データの場合、タ
イプは動詞を含むのに対し、参照意味データではタイプ
は名詞を含むことがある。辞書的意味表現は同じでも、
両者は異なる品詞から派生しているため、等価性の点数
はそれに応じて下がることがある。
【0030】関係のセットには、辞書的意味表現間の連
結のタイプの等価性について点数を付けることもでき
る。連結のタイプは、連結の両端を形成する辞書的意味
表現の対と、自然言語の文法とに依存する。関係は、1
つまたは多重連結を、1つまたは複数の中間の辞書的意
味表現を飛び越える連結と等価であると定義することが
できる。このような等価性が与えられた場合、等価性の
点数は下がる。点数の低下は多重連結内の連結数に依存
することがある。
【0031】正確な突き合わせになるように保証するた
め、一実施形態では、この方法は、入力データ内と参照
データ内にある否定も考慮に入れる。否定を、参照デー
タの意味データ内の等価と判断された、連結された辞書
的意味表現に連結された辞書的意味表現内で検出し、否
定が検出された場合は累算点数を下げる。
【0032】示差的な内容のない入力データおよび参照
データの意味データ内の辞書的意味表現は、等価性の判
断には使用しないことが好ましい。たとえば、そのよう
な辞書的意味表現は、前置詞、代名詞、強意語、および
限定詞を含む。
【0033】辞書的意味表現構造がブランチを含む場
合、すなわち入力データおよび/または参照データの意
味データの辞書的意味表現が複数の他の辞書的意味表現
によって修飾される場合、連鎖連結された辞書的意味表
現の等価性を各ブランチごとに次々に判断し、累算点数
を使用する場合は、等価性の最終点数としてブランチの
点数の積を求める。
【0034】他の態様によると、本発明は、コンピュー
タ使用可能形態のデータを認識する方法であって、自然
言語の句、文、または一節を表すデータを入力するステ
ップと、前記入力データを解析し、自然言語の文法を考
慮して辞書的意味表現およびそれらの間の連結としてコ
ンピュータ使用可能形態で構造化された意味データを生
成するステップであって、前記連結が前記辞書的意味表
現のうちのどの表現が該辞書的意味表現の他の表現を修
飾するかを示すステップと、前記入力データの意味デー
タ内の主要な辞書的意味表現から始まり、辞書的意味表
現のうちの少なくとも1つの辞書的意味表現と、連結さ
れた辞書的意味表現と、連結との間の等価性を定義する
関係のセットに従って、前記入力データと参照データの
意味データ内の辞書的意味表現の等価な連鎖連結された
対を繰り返し判断することによって、前記入力データの
意味データを参照データの意味データと比較するステッ
プと、前記比較の結果に従って前記入力データの意味デ
ータを認識するステップとを含む方法を提供する。
【0035】本発明のこの態様は、自然言語の句、文、
または一節を表すデータを入力する入力手段と、前記入
力データを解析し、自然言語の文法を考慮して辞書的意
味表現およびそれらの間の連結としてコンピュータ使用
可能形態で構造化された意味データを生成する解析手段
であって、前記連結が前記辞書的意味表現のうちのどの
表現が該辞書的意味表現の他の表現を修飾するかを示す
解析手段と、前記入力データの意味データ内の主要な辞
書的意味表現から始まり、辞書的意味表現のうちの少な
くとも1つの辞書的意味表現と、連結された辞書的意味
表現と、連結との間の等価性を定義する関係のセットに
従って、前記入力データと参照データの意味データ内の
辞書的意味表現の等価な連鎖連結された対を繰り返し判
断することによって、前記入力データの意味データを参
照データの意味データと比較する比較手段と、前記比較
の結果に従って前記入力データの意味データを認識する
認識手段とを含む認識装置も提供する。
【0036】本発明のこの態様では、入力データは、そ
の意味を判断し、その意味を参照データの意味と比較す
ることによって認識される。
【0037】一実施形態では、入力データの意味データ
を、参照データの複数のセットと比較し、認識ステップ
は、意味データが入力データの意味データと最もよく一
致する参照データのセットを特定するステップを含む。
【0038】一実施形態では、辞書的意味表現の等価な
連鎖連結された対を判断するステップが、入力データと
参照データの意味データ内の等価な辞書的意味表現を特
定する初期ステップと、特定された等価な辞書的意味表
現間の等価性を登録するステップとを含み、辞書的意味
表現の等価な連鎖連結された対が、登録された等価性
と、前記連結と、関係の前記セットとを使用して判断さ
れる。
【0039】本発明の他の態様によると、自然言語の
句、文、または一節を表す入力データを、自然言語の
句、文、または一節を表す参照データの1つまたは複数
のセットと突き合わせる装置であって、入力データと参
照データを入力する入力手段と、前記入力データと前記
参照データとを解析し、自然言語の文法を考慮して辞書
的意味表現およびそれらの間の連結としてそれぞれ構造
化された入力意味データと出力意味データとを生成する
解析手段であって、前記連結が前記辞書的意味表現のう
ちのどの表現が該辞書的意味表現の他の表現を修飾する
かを示す解析手段と、他の辞書的意味表現を修飾しない
前記入力意味データ内の主要な辞書的意味表現と前記参
照意味データ内の等価な辞書的意味表現とを特定し、前
記主要な辞書的意味表現またはそれと等価な表現にそれ
ぞれ連鎖連結された前記入力意味データ内および前記参
照意味データ内の等価な辞書的意味表現を判断すること
によって前記入力意味データと前記参照意味データとを
比較する比較手段であって、等価性が辞書的意味表現の
うちの少なくとも1つの辞書的意味表現と、辞書的意味
表現の連結された対と、連結との間の等価性を定義する
関係のセットを使用して判断される比較手段と、前記比
較手段の出力に基づいて、前記入力データと前記参照デ
ータまたは参照データの各セットとの間の一致を判断す
る突き合わせ手段とを含む装置が提供される。
【0040】また本発明のこの態様によると、自然言語
の句、文、または一節を表す入力データを自然言語の
句、文、または一節を表す参照データの1つまたは複数
のセットとを突き合わせる方法であって、前記入力デー
タと前記参照データとを解析し、自然言語の文法を考慮
して辞書的意味表現およびそれらの間の連結としてそれ
ぞれ構造化された入力意味データと出力意味データとを
生成するステップであって、前記連結が前記辞書的意味
表現のうちのどの表現が該辞書的意味表現の他の表現を
修飾するかを示す解析ステップと、他の辞書的意味表現
を修飾しない前記入力意味データ内の主要な辞書的意味
表現を特定し、前記参照意味データ内の等価な辞書的意
味表現を特定し、前記主要な辞書的意味表現またはそれ
と等価な表現にそれぞれ連鎖連結された前記入力意味デ
ータ内および前記参照意味データ内の等価な辞書的意味
表現を判断することによって前記入力意味データと前記
参照意味データとを比較するステップであって、等価性
が辞書的意味表現のうちの少なくとも1つの辞書的意味
表現と、辞書的意味表現の連結された対と、連結との間
の等価性を定義する関係のセットを使用して判断される
比較ステップと、前記比較手段の出力に基づいて、前記
入力データと前記参照データまたは参照データの各セッ
トとの間の一致を判断するステップとを含む方法が提供
される。
【0041】本発明のこの態様では、入力データの意味
と参照データの1つまたは複数のセットの意味との間の
一致が判断される。
【0042】入力意味データと参照意味データとの間で
一致を見つけることができるのは、特定の数、たとえば
全部またはしきい数値の連結された辞書的意味表現が入
力意味データ内と参照意味データ内で等価であると判断
された場合である。あるいは、累算点数を使用する場合
は、特定のしきい値累算点数に達したときに一致を特定
することができるか、または最高累算点数に関連づけら
れた参照データの1つまたは複数のセットを1つまたは
複数の最善の一致として選択することができる。ペナル
ティ点数を使用する他の実施形態では、等価な辞書的意
味表現間の低い一致度に良好な一致度よりも高いペナル
ティ点数を割り当てる場合、累算ペナルティ点数から導
き出された最低ペナルティ点数を有する一致を選定する
ことができる。
【0043】一致の結果は、累算確率に従ってランク付
けされた参照データの1つまたは複数のセットの識別情
報の表示とすることができる。たとえば、データベース
を検索する場合で、照会がたとえば要約を含むキーと一
致する場合、取り出される情報または表示される情報
は、参照データに関連づけられた情報を含む。このよう
な情報は、標題または書誌情報を含むことができる。ま
たは、参照データがたとえば画像の記述を含む場合は、
取り出される情報は画像自体、またはそのファイル名な
どの画像に関する情報を含むことができる。
【0044】
【発明の実施の形態】以下、本発明に係る一実施形態に
ついて、添付図面を参照して説明する。
【0045】図1に、入力データが入力されるとそれを
表示する表示装置10を備えたコンピュータ装置を含む
本発明の一実施形態のハードウェアを示す。プロセッサ
11が、解析(analyser)エンジン11aと、整列(al
ignment)エンジン11bと、突き合わせ(matching)
エンジン11cとを含む。また、従来のファームウェ
ア、すなわちBIOSなどを記憶するための読取り専用
メモリ(ROM)12を備え、プロセッサ11が使用す
るための作業メモリとしてランダム・アクセス・メモリ
(RAM)13を備える。データを入力することができ
るようにするために、ユーザがこの装置とのインタフェ
ースをとる際に操作されるキーボード17を備える。こ
の実施形態では入力装置としてキーボードが示されてい
るが、たとえば、音声認識インタフェースや光学式文字
認識インタフェース、装置にデータを入力するための外
部装置とのインタフェースなど、自然言語を表すデータ
を入力する他の任意の手段を使用することができる。
【0046】また、プロセッサ11が本発明を実施する
ために使用するプログラムを記憶するプログラム記憶装
置15を備える。この記憶装置15は、固定磁気「ハー
ド」ディスク、光ディスク、磁気テープ・ドライブ、プ
ログラム可能読取り専用メモリ、取り外し可能磁気「フ
ロッピィ」ディスクなどの任意の従来の形態を採ること
ができる。
【0047】また、入力データと突き合わせる参照デー
タを記憶する参照データ記憶装置16を備える。また、
参照データを外部装置から、たとえばローカル・エリア
・ネットワーク(LAN)、ワイド・エリア・ネットワ
ーク(WAN)またはインターネットを介して取り出す
ことができるように、通信インタフェース18を備え
る。従って、通信インタフェース18は、参照データ記
憶装置16に加えて、またはその代替として備えること
ができる。
【0048】この装置の要素はすべて、通信/データバ
ス14を介して相互接続され、それらの間で制御信号と
データを受渡しすることができるようになっている。
【0049】従って、本発明はプログラム式コンピュー
タとして実施可能であり、コンピュータ可読記憶媒体に
記憶されたコンピュータ・プログラムとして実施可能で
ある。このような記憶媒体は、光ディスク、磁気ディス
クまたはテープ、あるいはプログラム可能読取り専用メ
モリ(PROM)などの電子メモリ装置など、任意の従
来の記憶媒体を含むことができる。コンピュータ・プロ
グラムはコード化信号として、たとえばインターネット
を介してコードをダウンロードすることによって入手可
能であるため、本発明は、後述する方法を実行するよう
にプロセッサを制御するプロセッサ実施可能命令を伝え
るコード化信号として、実施することもできる。
【0050】図2は、自然言語の句、文、または一節を
表すデータがデータ入力ユニット20によって意味解析
エンジン21に入力される本発明の第1の実施形態を示
す略図である。この実施形態では、検索する自然言語の
句、文、または一節を表す参照データを記憶する記憶ユ
ニット22を備える。この記憶ユニット22には通常、
入力データと突き合わせる参照データの複数のセットが
入れられる。記憶ユニット22内のデータは、意味解析
エンジン21に入力され、それによって、検索するデー
タの意味データが生成されて一時記憶ユニット23に入
力され、入力データの意味データが生成されて一時記憶
ユニット24に入力される。
【0051】一時記憶ユニット23および24からの意
味データは次に、意味データ内の等価な辞書的意味表現
(lexical meaning representations)を判断し、それ
らの間の連結を登録するために、整列エンジン25に読
み込まれる。この実施形態では、どの辞書的意味表現が
等価であり、従って整列(align)可能であるかを示すデ
ータを記憶するために、整列データ記憶ユニット30を
備える。このデータは、整列エンジン25に入力され、
等価性の判断と連結の登録を可能にする。登録された連
結は、一時記憶ユニット26内に整列データとして記憶
され、このデータは次に、一時記憶ユニット23および
24からの意味データと共に突き合わせエンジン27に
渡される。等価性関係を記憶する等価性データ記憶ユニ
ット28がさらに備えられている。これらの等価性関係
は突き合わせエンジン27に入力され、突き合わせエン
ジン27は入力データと参照データの意味データ間の一
致を判断し、該判断結果は一致の結果を出力する一致出
力ユニット29に渡される。
【0052】この実施形態では、整列エンジン25と突
き合わせエンジン27が別々のものとして示され、整列
エンジン25で意味表現を整列する第1のステップを行
い、次に突き合わせエンジン27で辞書的意味表現の連
結の等価性を判断する第2のステップを行うが、これら
の機能は、単一のユニットで1つのプロセスでも等しく
適切に行うことができる。
【0053】図2では、検索するデータが解析エンジン
21に入力されるため、データが入力されるたびに解析
エンジン21が参照データについて意味解析を行わなけ
ればならないようになっているが、これは必須ではな
い。図3に、検索するデータの意味データのための永続
記憶ユニット22aがある本発明の第2の実施形態を示
す。これにより、参照データを解析するために意味解析
エンジン21をリアルタイムで使用する必要がない。こ
れは、初期段階またはセットアップ段階で行うことがで
きる。従ってこの構成によれば、意味解析エンジン21
の必要計算量を少なくすることによって突き合わせを高
速化することができる。しかし、参照データの内容が、
全くではないにしてもあまり変化しない必要がある。従
って、図2に示す実施形態は参照データが動的な場合に
適するのに対し、図3に示す実施形態は参照データが静
的であるか、または少なくとも記憶ユニット22a内の
意味データの更新頻度に比して静的な状況に適する。
【0054】図4に、図2に示す実施形態をデータ検索
システムに組み込んだ本発明の他の実施形態(第3実施
形態)を示す。装置の同様の構成については同様の参照
番号によって示してあるため、図2に示す実施形態とこ
の実施形態との相違点についてのみ、説明する。
【0055】突き合わせ出力ユニット29が、突き合わ
せエンジン27によって行われた一致結果に応じて信号
を生成する。これによって、入力意味データと参照意味
データとの間で一致が見つかったデータを取り出すよう
に指示するために検索ユニット31が制御される。この
信号に応答して、検索ユニット21は記憶ユニット22
にアクセスし、そのデータを取り出してデータ出力ユニ
ット32に出力する。
【0056】本発明のこの実施形態は、入力データが自
然言語より成り、記憶ユニット22に記憶されたデータ
が複数のキー、すなわち自然言語の文書などのテキスト
のセットを含む、データ検索システムに適する。入力デ
ータと参照データのセットのうちの1つについて意味の
一致が見つかると、検索ユニット31が、その特定され
た参照データのセット、たとえば文書を出力のために取
り出すように制御される。データ出力ユニット32は、
そのデータを、たとえば表示装置、プリンタ、または取
り出されたデータを遠隔ユニットに伝達するための通信
インタフェースに出力する等、いくつかの方法によって
出力することができる。
【0057】図5に、記憶ユニット33に記憶されてい
る情報の索引データの形態で記憶ユニット22bに検索
データが記憶される、図4に修正を加えた実施形態(第
4実施形態)を示す。索引データは、たとえば、記憶ユ
ニット33に記憶されている文書の要約、標題またはそ
の他の書誌情報、あるいは記憶ユニット33に記憶され
ている情報の説明、たとえば画像の内容の説明とするこ
とができる。従って、このデータ検索システムの目的
は、記憶ユニット22b内の索引データを取り出すこと
ではなく、記憶ユニット33から情報を取り出すことで
ある。
【0058】一致出力ユニット29から一致信号が出力
されると、それによって検索ユニット31aが記憶ユニ
ット22bから索引データを取り出すように制御され
る。索引データには記憶ユニット33b内の必要な情報
の場所を識別する情報が含まれている。この情報検索ユ
ニット31aを使用することによって、索引データによ
って識別されている情報を記憶ユニット33から取り出
すことができ、それをデータ出力ユニット32に出力す
ることができる。この情報は次に、たとえばユーザのコ
ンピュータ画面、プリンタ、または遠隔装置への出力な
ど、いくつかの異なる方法によって出力できる。
【0059】図6に、コンピュータ実行可能命令を生成
する装置内に図2の実施形態を組み込んだ、本発明の他
の実施形態(第5実施形態)を示す。
【0060】この実施形態では、一致出力ユニット29
の出力は、命令の生成を制御するために命令生成ユニッ
ト34に渡される。命令生成ユニットは記憶ユニット2
2を参照する。記憶ユニット22には、実行する操作の
自然言語による説明の形の検索データだけでなく、生成
する命令の識別情報も記憶されている。命令生成ユニッ
トは、記憶ユニット22を参照することによって生成す
る命令を識別し、それによって命令を生成し、それが命
令出力ユニット35に渡される。
【0061】従ってこの実施形態では、記憶ユニット2
2は自然言語の一連の命令を、命令生成ユニット34が
解釈可能な、実行されるコンピュータ識別可能アクショ
ンと共に記憶する。
【0062】図7に、入力データが属するカテゴリを識
別する本発明の他の実施形態(第6実施形態)を示す。
この実施形態では、記憶ユニット22cにはカテゴリ記
述が記憶され、一時記憶ユニット23aには、記憶ユニ
ット22cからのカテゴリ記述の意味解析エンジン21
による解析後のカテゴリ記述の意味データが記憶され
る。記憶ユニット22cには、カテゴリ・データ記憶ユ
ニット38に記憶されているカテゴリ・データの記述が
記憶される。一致出力ユニット29が一致を示すと、カ
テゴライザ・ユニット36が制御されて、カテゴリ・デ
ータ記憶ユニット38からカテゴリ・データを取り出
し、それをカテゴリ出力ユニット37に送る。
【0063】従って、本発明のこの実施形態では、デー
タを分類またはカテゴリ化することができる。たとえ
ば、カテゴリ出力ユニット37は特定されたカテゴリを
表示装置上に出力し、入力データが属するカテゴリをユ
ーザに知らせることができる。
【0064】図8は、単にカテゴリ出力ユニット37に
よってカテゴリが出力されるだけでなく、データ入力ユ
ニット20によって入力されたデータを受け取るデータ
・ルータ39を備えた図7の実施形態の拡張形態(第7
実施形態)である。入力データの経路指定を制御するた
めに、特定されたカテゴリを含むカテゴライザ・ユニッ
ト36の出力がデータ・ルータ39に入力される。従っ
て、たとえば入力データが特定の主題分野のテキストを
含む場合、それをある主題カテゴリに入るものとして識
別し、そのデータをそれに応じて経路指定し、たとえば
特定の記憶場所に記憶することができる。従って、この
実施形態は、文書などのデータを自動的に分類する方法
を提供する。具体的には、これによって、光学式文字認
識された文書を文書の内容の主題に応じて適切に記憶さ
れるように自動的に分類する方法が提供される。
【0065】図9に、スイッチング・アクションを引き
起こす本発明の他の実施形態(第8実施形態)を示す。
この実施形態は、図6の実施形態と類似している。この
実施形態では、記憶ユニット22cには、記憶ユニット
40に記憶されているスイッチング命令を記述するスイ
ッチング・アクション記述が記憶される。一時記憶ユニ
ット23dに、意味解析エンジン21によるスイッチン
グ・アクション記述の解析によって生成されたスイッチ
ング・アクション記述の意味データが記憶される。
【0066】一致出力ユニット29から一致が出力され
ると、スイッチング・アクション命令ジェネレータ41
が、記憶ユニット40から適切なスイッチング命令を取
り出すように制御され、それらの命令がスイッチング命
令出力ユニット42に出力される。
【0067】図10に、この(第8)実施形態の物理的
実施態様を示す。図10に図示する装置は、プロセッサ
53と、メモリ52と、表示装置51と、キーボード5
4とを含むコンピュータ装置50で実施される。スイッ
チング・アクション命令がコンピュータ装置50からイ
ンタフェース60を介してスイッチング・ユニット70
に出力され、そこで、命令に従って装置80、81、8
2、または83のいずれかにスイッチを切り換えること
によって、スイッチング・アクション命令が実施され
る。
【0068】従って、この実施形態は、コンピュータ装
置による命令を実行させるために、ユーザがコンピュー
タ装置に命令を入力する方法を提供するものであること
が明らかである。
【0069】入力データと参照データを解析し、意味デ
ータを突き合わせる方法について、以下に詳述する。
【0070】図11は、本発明において入力データと参
照データとの間の一致を判断する際に行われるステップ
群を示す流れ図である。入力データまたは参照データ
は、自然言語の句、文、または一節のコンピュータ可読
表現を含む。一般に、このような表現はテキストの形態
をとる。
【0071】ステップS1で、突き合わせるデータが入
力され、ステップS2でその入力データが意味解析エン
ジン21によって解析されて意味データが生成される。
この実施形態では入力データだけでなく参照データも解
析され、それによってステップS2でそれぞれの意味デ
ータが生成される。
【0072】ステップS2における解析は構文解析プロ
セスを含み、このプロセスはこの実施形態では依存文法
を使用するとする。辞書的意味表現と修飾情報を生成
し、修飾情報から辞書的意味表現間の連結を生成して、
どの辞書的意味表現がどの辞書的意味表現の意味を修飾
するかを識別することができるパーサであれば、どのよ
うなパーサでも使用することができる。そのようなパー
サは、前述の英国特許GB-A-2269923号,欧州特許EP-A-0
737928号、またはT.イェルヴィネンおよびP.タパナ
イネンによる「A Dependency Parser for English」と
題する論文に記載されている形態のものとすることがで
きる。パーサは、自然言語の句、文、または一節から、
辞書的意味表現と意味修飾情報の形態の意味データを生
成する。辞書的意味表現は、同じ意味を持つ語のセット
の表現を含む。辞書的意味表現は、異なるタイプの意味
を表す小分類に分類することができる。例えば、「cop
y」という意味表現は、「copy」(名詞または動詞),
「copies」(名詞または動詞),「copying」(動
詞),または「copied」(動詞),等のように、名詞お
よび動詞の構文上の変形を表すことができる。また、
「copier」および「copyist」という派生的変形も表す
ことができる。
【0073】辞書的意味表現のレベルは、語と意味表現
との間の等価性を定義する、パーサ内で使用される表に
依存する。辞書的意味表現は、最も単純な形態では、実
際には語自体を表す。任意のレベルの辞書的意味表現が
使用可能である。
【0074】辞書的意味表現間の連結によって、辞書的
意味表現間の修飾関係が特定される。本発明に必要な最
小限の情報は、修飾の方向、すなわち辞書的意味表現の
連結された対のうち、どの対が修飾されているかであ
る。
【0075】本発明のこの実施形態で使用するパーサに
ついて以下に詳述する。このパーサは、コンピュータ上
のプログラムとして実施され、関数型プログラミング言
語(Haskell)によって実現された規則のセットによっ
て定義される。パーサは、語が入力されるにつれてそれ
らの語に順次に作用し、意味データを順次に構築する。
この実施形態で使用されるパーサは、連結の方向だけで
なく連結のタイプも与える。連結のタイプには、たとえ
ば主語、規制詞、目的語などの関係によってラベル付け
される。以下に示す表1に、パーサが辞書的意味表現の
タイプと連結のタイプを関連付けるために参照する規則
を示す。
【0076】
【表1】 各カテゴリの語句例: 名詞的語句 − 例なし。他のいくつかのカテゴリの共
通の特性を集めるのみ。 動詞的語句 − 例なし。他のいくつかのカテゴリの共
通の特性を集めるのみ。 名詞 dog 代名詞 he 補文標識 that 関係代名詞 who 動詞 walk 繋合詞 is 助動詞Have have 助動詞Be be 法助動詞 will 形容詞 happy 動名詞 copying 受動態 broken 前置詞 with To to 副詞 suddenly 接続詞N and 表1において、連結のタイプはカテゴリと修飾の方向に
よって示され、この修飾の方向は、修飾が左から右に行
われることを示すIsか、または修飾が右から左に行われ
ることを示すHasのいずれかである。この表は、形成さ
れる可能性のあるすべてのタイプの連結を示している。
しかし、特定の連結が行われないようにする制約があ
る。
【0077】いくつかのタイプの制約を以下に示す。
【0078】必要条件 このタイプの制約は、特定のタイプの連結が形成される
ためにある条件を満たすことを要求する。以下の表2
に、表1の用語を使用して右側の意味表現のための品詞
である動詞の語形に関する必要条件を示す。
【0079】
【表2】
【0080】禁止連結 たとえばdog walked by a manという句の場合、Has主語
連結とHas目的語連結の両方が形成されるのを回避する
ために、1つの連結のみが登録される。この場合、名詞
「dog」と動詞「walked」の正しい連結は、Has目的であ
り、Has主語ではない。
【0081】動詞が受動形でない場合は、動詞は名詞を
主語としてしかとることができない。「dog walked by
a man」の例では、「dog」は目的語であり、主語ではな
い。
【0082】違法な連結 これは、語がすでにいくつかの連結を持っている場合に
特定の連結が形成されるのを禁止するために使用され
る。たとえば、2つの連続した名詞の間には、IsNomNom
という連結が形成され(たとえば、「dog basket」)、
従って「dog」という語は「Is NomNom」という連結を有
する。「is brown」という語が入力されて「dog basket
is brown」という句を形成する場合、動詞「is」の主
語はbasketであって「dog」ではない。従って、「dog」
はすでにIs NomNom連結を持っているため、動詞「is」
から名詞「dog」への連結は禁止される。以下の表3に
違法な連結を禁止する規則を示す。
【0083】
【表3】
【0084】必要な連結 このタイプの制約は、語へのある連結が形成されるため
には、別のある連結がすでに存在していなければならな
いということを要求する。実施される唯一の制約は、名
詞に対して右接続詞連結を形成する場合、左接続詞連結
がすでに存在しなければならないというものである。
【0085】連結ブロック このタイプの制約では、現行語が特定のタイプの連結を
有する場合、その語はそれより前の語に戻る別の特定の
タイプの連結を有することができない。たとえば、「gi
ve a dog a bone」という句では、「bone」という語は
中間の規制詞「a」のために「dog」へのNomNom連結を形
成することを禁止される。以下の表4に、ブロック連結
の規則を示す。
【0086】
【表4】
【0087】削られる連結 このタイプの制約は、語のカテゴリの前に戻る連結の可
能性を制限するかまたは削る。このような制約は以下の
2つある。 (1)現行語が動詞の場合、連結先のいかなる限定詞に
ついても振り返らない(すなわち、その動詞の左側に戻
らない)。 (2)現行語が助動詞Have,助動詞Be,または法助動詞
の場合、いかなる名詞についても振り返らない。
【0088】従って、これらの制約は、表1の可能な連
結を使用して形成される連結に影響を与える。
【0089】表1には、これらの制約を考慮に入れた、
パーサからの出力である意味データが示されている。連
結の方向はHasまたはIsによって示され、一般にIsとい
うラベルが付けられた連結は左から右への連結であり、
Hasというラベルの付けられた連結は右から左への連結
であるが、誤りを防止するために、以下の表5に示す規
則に従って連結の方向に修正を加える必要がある。
【0090】
【表5】
【0091】これらの制約の適用後、表1の関係を使用
して、1つが一致するまで表5に示す各規則を次々に試
す。このようにして、表5に示す最初の7個の規則は、
パーサから与えられた連結方向の修正が必要な例外を示
している。
【0092】次に、図11のプロセスはステップS3に
進み、入力データと参照データの辞書的意味表現が整列
される。このプロセスは、入力データ内と参照データ内
のどの辞書的意味表現の意味が等価であるかを判断する
ステップを含む。整列プロセスは、入力意味データの各
辞書的意味表現を参照データの各辞書的意味表現と比較
し、それによって等価性が見つかった場合にはそれらの
間に連結を登録することによって行われ、突き合わせま
たは整列された辞書的意味表現の位置を示す表を作成
し、記憶する。
【0093】どのような辞書的意味表現が整列可能(ま
たは等価)であるかを判断するために、整列のための規
則のセットが参照可能である。この実施形態では、以下
のカテゴリまたはタイプの辞書的意味表現が整列可能で
ある。
【0094】名詞的語句 動詞的語句 名詞 副詞 形容詞 動詞 受動形 進行形 完了形 動名詞 以下のカテゴリまたはタイプの辞書的意味表現は整列で
きない。
【0095】限定詞 前置詞 強意語 代名詞 関係代名詞 所有代名詞 不変化詞 助動詞 補文標識 to 繋合詞 否定詞 接続詞 仮定法 句読点 さらに、この実施形態では、入力データと参照データの
突き合わせは、累算点数を求めることによって判断され
るため、同じカテゴリの辞書的意味表現に与えられる点
数は1.0であるのに対し、整列可能なカテゴリの辞書
的意味表現の同等性に与えられる点数は0.3である。
ただし、形容詞と動名詞、名詞と形容詞、および名詞と
動名詞には、それぞれ1.0という点数が与えられる。
【0096】辞書的意味表現の品詞による整列の判断に
加えて、類義語(たとえばanimalとbeast)、シソーラ
ス関係(たとえばroseとflower)、および階層関係(被
包摂語など、たとえばcopyとrepresentationまたはdocu
ment、copierとoffice machineなど)に基づいて辞書的
意味表現間に等価性を与えることもできる。また、辞書
的意味表現は、屈折語形と派生語形を考慮に入れること
ができるが、辞書的意味表現がきわめて限定的で、これ
らを考慮に入れない場合、辞書的意味表現の整列は、そ
のような辞書的意味表現の整列を確実にするために、そ
の代わりに語形論的語尾変化を考慮に入れることができ
る。そのような等価性関係を使用する辞書的意味表現の
等価性には、0から1.0の間の点数を与えることがで
きる。
【0097】各辞書的意味表現は、語のセットを表す。
各語には、自然言語における出現頻度に応じた点数を割
り当てることができる。従って、希にしか出現しない語
には高い点数を割り当て、その語が入力データと参照デ
ータの両方に存在することが特定された場合、その高い
点数を使用して入力データと参照データの間の一致の点
数を高くすることができる。
【0098】整列時に考慮に入れることができる他の要
素は意味階層であり、辞書的意味表現によって表される
特定の語の間の等価性に点数を付けることができる。以
下に、このような意味階層の例を2例示す。 例1 「car」と「automobile」との類似度 1.0 「car」と「lorry」との類似度 0.8 「car」と「vehicle」との類似度 0.6 「car」と「bicycle」との類似度 0.3(vehicleを介して) 「car」と「train」との類似度 0.1(vehicleを介して)例2 「copier」と「duplicator」との類似度 0.9 「copier」と「photocopier」との類似度 0.9 「copier」と「office machine」との類似度 0.7 整列プロセスの結果は、すべての整列可能な辞書的意味
表現と、整列の点数とを示す表である。
【0099】図12に、入力句「colour document copi
er」と記憶されている句「machinefor copying documen
ts colour」の辞書的意味表現の整列を概略図で示す。
図12でわかるように、辞書的意味表現「colour」と
「document」は、入力データと参照データの辞書的意味
表現と厳密に整列し、入力意味表現「copier」は参照辞
書的意味表現「copy」と派生語形等価性関係によって整
列する。
【0100】図12においては、辞書的意味表現の整列
は双方向矢印で示され、辞書的意味表現間の連結は、一
方向矢印で示されている。
【0101】次に、図11のプロセスはステップS4に
進み、入力データ内の主要な(head)辞書的意味表現が
選択され、整列データを使用して整列参照データ内で等
価な辞書的意味表現が特定される。入力データ内の主要
な辞書的意味表現を特定するには、他の辞書的意味表現
を修飾しない辞書的意味表現を特定する必要がある。こ
れは、連結データの表を作成することによって可能とな
る。たとえば、図12の上部に示されている入力データ
の場合、位置1、2、および3を語 colour document c
opier にそれぞれ割り当てることができ、以下に示す表
6が作成される。
【0102】
【表6】
【0103】主要な辞書的意味表現は、表3の左側欄に
現れて右側欄には現れない位置、すなわち辞書的意味表
現「copier」に対応する位置3にあるものとして識別可
能である。図12でわかるように入力データの主要な辞
書的意味表現が「copier」であると特定されたため、整
列データを使用してこれを参照データ内の辞書的意味表
現「copy」と整列させることができる。整列データは、
入力データの辞書的意味表現と参照データの辞書的意味
表現との間の多くの異なる整列を示すことがあるため、
後述の突き合わせプロセスで1つ1つ試すことになる。
【0104】次に、図11のプロセスはステップS5に
進み、入力データ内の主要な辞書的意味表現に連結され
た、整列された辞書的意味表現を、パーサから出力され
た意味データの連結データから特定し、整列データを使
用して参照データ内の等価な辞書的意味表現を特定す
る。このプロセスを図13Aに示す。図13Aからわか
るように、入力データ内の主要な辞書的意味表現「copi
er」は、参照データ内の辞書的意味表現「copy」と整列
され、パーサから出力された連結データを使用して入力
データ内で連結された辞書的意味表現「document」が特
定される。次に、参照データ内の等価な辞書的意味表現
「document」が特定される。
【0105】図11のプロセスで、プロセスは次にステ
ップS6に進み、辞書的意味表現の連結された対を比較
して等価性を調べる。等価性の比較は、経路の等価性を
定義する関係のセットに基づいて行われる。この実施形
態で使用する等価性関係を以下の表7に示す。
【0106】
【表7】
【0107】表7において、経路の等価性に点数を付け
る。「任意の連結」という用語は、任意の数の連結を無
条件に突き合わせ可能であることを意味する。すなわ
ち、1つの連結に複数の連結を一致させることができ、
それによって中間の意味表現がスキップされる。また、
「主要語」という用語は、辞書的意味表現が主要な辞書
的意味表現であることを示す。
【0108】従って、表7の関係を使用して、ステップ
S7で経路が一致するか否か、すなわち一致の点数を判
断することができる。点数がしきい値より大きい場合、
たとえばゼロより大きい場合、図11の流れ図でプロセ
スはステップS7からステップS8に進み、連結された
辞書的意味表現を名目上、主要語とする。ステップS9
で点数が累算される。これには、経路の点数を、整列さ
れた辞書的意味表現の点数および特定の語を整列させる
点数などその他の点数と共に累算する必要がある。プロ
セスは次にステップS5に戻り、辞書的意味表現の整列
された対を特定し、経路を比較し、点数を累算するため
に、辞書的意味表現の連鎖連結された対をたどって再帰
的に進む。
【0109】図13Bに、2番目のループのステップS
5およびS6を示す。ここでは、辞書的意味表現「docu
ment」を名目上、主要語とし、入力データ内の連結され
た辞書的意味表現「colour」を特定する。整列データか
ら、これは参照データ内の辞書的意味表現「colour」と
連結すると判断される。次に、比較ステップS6におい
て、「colour document」の経路を「document in colou
r」の経路と比較する。図からわかるように、参照デー
タ内の辞書的意味表現「document」と「colour」との間
の経路は、直接的経路ではない。すなわち複数の連結が
存在する。突き合わせプロセスは、存在する連結の数の
相違を考慮に入れ、連結の数に応じて点数を付けること
ができる。すなわち、連結数が多い場合には点数が下が
る。
【0110】図11のプロセスで一致が見つからなかっ
た場合、または一致の点数がしきい値、たとえばゼロよ
りも低い場合、プロセスはステップS10に進み、連結
された辞書的意味表現構造内にブランチがあるか否かを
判断し、プロセスはステップS11に進み、ブランチが
発生した辞書的意味表現を名目上、主要語とし、ステッ
プS12で突き合わせのための点数が累算される。次に
プロセスは、ステップS5に戻り、ブランチの累算点数
を求める。
【0111】図16に、主要な辞書的意味表現「copy」
にブランチがある、連結された辞書的意味表現構造を示
す。図16に示す句が、入力データまたは参照データで
あったとすれば、各ブランチが入力データまたは参照デ
ータと突き合わせされ、各ブランチについて点数が累算
され、この句の突き合わせの合計点数はブランチの累算
点数の積(product)になる。
【0112】ステップS10ですべてのブランチが突き
合わせされると、プロセスは図11のステップS13に
進み、一致の累算結果が点数として出力される。次に、
ステップS14でこれを所定のパラメータのセット、た
とえばしきい値と比較し、ステップS15で一致結果が
出力される。
【0113】複数の累算点数を得るために参照データの
複数セットについてステップS1からS13までを実施
することができる。次に、最高累算点数を有する参照デ
ータを、入力データの突き合わせ対象の参照データとし
て選択することができる。この一致はしきい値累算点数
に達した場合、すなわち一致の質が十分である場合にの
み示されるという点で、この突き合わせに制約を加える
ことができる。
【0114】辞書的意味表現の連結された対の経路の突
き合わせは、連結のタイプおよび数、連結された対を含
む辞書的意味表現のタイプなど、多くの異なる突き合わ
せ規則に依存することができる。
【0115】より一般的には、突き合わせは、連結のタ
イプおよび数に関係なく、すべての特定された連結対を
突き合わせることによって行うことができる。突き合わ
せは直接連結に限定するか、または同じタイプの連結の
突き合わせにのみ限定することもできる。
【0116】好ましい実施形態としては、間接的連結お
よび連結タイプを考慮に入れた1組の規則を定義する1
組の規則を使用する。
【0117】ステップS5の経路突き合わせプロセスに
おいては、意味のある意味表現のみを特定する。従っ
て、重要でない意味表現、たとえば限定詞、強意語、前
置詞、および代名詞は突き合わせプロセスでは使用しな
い。
【0118】否定を考慮に入れるため、一致の終わり
に、すなわち図11のステップS7でそれ以上の一致が
見つからないときに、参照意味データをさらに調べて否
定を特定する。たとえば、入力データが「colour docum
ent copier」であり、参照データが「not a colour doc
ument copier」である場合、このプロセスでは「colour
document copier」と一致するものを見つけ、そのさら
に連結された辞書的意味表現を特定することができ、既
知の否定辞書的意味表現と比較して累算点数を下げる
か、または一致がないことを示すことができる。
【0119】辞書的意味表現の連結された対間の等価性
を定義する関係のセットを使用することによって、入力
データと参照データの意味の正確な突き合わせが可能に
なる。たとえば図14に、参照データ「document in co
lour」と付き合わせる「colour document」を含む入力
データを示す。「document in colour」間の単一の連結
と、中間の辞書的意味表現「in」との複数の連結とを等
価とすることによって、入力データを参照データと一致
させることができる。
【0120】図15Aおよび図15Bに、この形態の意
味突き合わせの感度を示す。入力データ「software des
ign」を参照データ「design of software」と付き合わ
せる場合、中間の辞書的意味表現「of」との複数の連結
があるために、一致を見つけることができる。しかし、
図15Aに示す入力データ「design software」と、図
15Bに示す参照データ「design of software」では修
飾方向が異なるため、一致は見つからない。
【0121】図2から図10に示す実施形態を参照して
説明したように、突き合わせ操作を行った後に、一致の
結果を多くの異なる用途に使用することができる。最も
単純な用途は、たとえばコンピュータ命令など、アクシ
ョンを引き起こすことである。しかし、累算点数を使用
して入力データと参照データとの一致を判断する場合、
突き合わせの結果が単に入力データと複数セットの参照
データとの突き合わせの最善の一致を特定することであ
ったり、1セットの参照データしかない場合に一致があ
るか否かを示すことが必ずしも望ましいとは限らない。
突き合わせプロセスの結果としては、ある程度の一致が
見つかった複数セットの参照データを特定し、それと共
にその一致の程度、すなわち累算点数を示すことが望ま
しい場合もある。1セットの参照データしかない場合と
しては、結果が単に、一致が良好な一致である尤度を示
す標識となる累算点数であることもある。
【0122】上述した実施形態の説明によれば、本発明
は、機械を特定の方式で動作させるために、ユーザが自
然言語の句、文、または一節を表すデータを入力可能と
する、はるかに単純なユーザ・インタフェースを提供す
ることが明らかであろう。このような技法は、取り出す
情報自体、または索引データについて検索を行う、デー
タベースからの情報検索に対して特に有用である。本発
明は、装置の動作を制御するためにコマンドを入力する
どのような装置にも適用される。そのような装置では、
自然言語のコマンド句を表す参照データのセットを記憶
しておき、それによって、ユーザが自然言語のコマンド
句を入力すると、対応する命令を実行することができる
ように、本発明の突き合わせプロセスを使用して両者を
付き合わせることができる。
【0123】以上、本発明について特定の実施形態を参
照しながら説明したが、本発明はこれらの特定の実施形
態には限定されず、当業者であれば、本発明の範囲内で
変更を加えることが可能であろう。たとえば、上記の実
施形態で、辞書的意味表現を語のセットを表すもの、す
なわち一般的な意味を定義するものであると説明した
が、辞書的意味表現は語自体を含むこともできる。ま
た、上記の実施形態では、整列の方法、すなわち辞書的
意味表現間の等価性を見つける方法を、経路の突き合わ
せとは別個の、それに先立つプロセスとして説明した
が、このプロセスは一緒に行うこともできる。さらに、
本発明は、意味表現とそれらの間の修飾関係とを求める
ために解析可能な任意の自然言語として表すことができ
るデータに適用される。さらに、本発明における意味デ
ータの生成は、意味表現と修飾関係を判断する任意のパ
ーサによって行うことができる。このようなパーサの多
くは周知であり、意味表現と修飾関係を直接生成する依
存パーサである。しかしながら、本発明は、意味データ
を形成するためにそのようなパーサを使用することに限
定されるものではない。
【0124】
【発明の効果】以上説明したように本発明によれば、自
然言語の句、文、または一節を表す入力データを入力し
て、効率的かつ正確な方式によって意味解析を行って自
然言語の句、文、または一節を表す参照データと突き合
わせることが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施形態におけるハードウェア構成
を示す概略図、
【図2】本発明に係る第1実施形態を示す概略図、
【図3】本発明に係る第2実施形態を示す概略図、
【図4】本発明に係る第3実施形態を示す概略図、
【図5】本発明に係る第4実施形態を示す概略図、
【図6】本発明に係る第5実施形態を示す概略図、
【図7】本発明に係る第6実施形態を示す概略図、
【図8】本発明に係る第7実施形態を示す概略図、
【図9】本発明に係る第8実施形態を示す概略図、
【図10】本発明に係る第8実施形態におけるハードウ
ェア構成を示す図、
【図11】本発明の一実施形態における動作を示す流れ
図、
【図12】図11に示す方法の整列ステップを示す図、
【図13A】再帰的突き合わせプロセスを示す図、
【図13B】再帰的突き合わせプロセスを示す図、
【図14】多重連結のある連結の突き合わせを示す図、
【図15A】突き合わせプロセスの感度を示す図、
【図15B】突き合わせプロセスの感度を示す図、
【図16】分岐した依存関係文法構造を示す図、であ
る。

Claims (92)

    【特許請求の範囲】
  1. 【請求項1】 機械実行可能命令を生成する自然言語処
    理方法であって、 自然言語の句、文、一節を表すデータを入力するステッ
    プと、 前記入力データを解析し、自然言語の文法を考慮して辞
    書的意味表現およびそれらの間の連結としてコンピュー
    タ使用可能形態で構造化された意味データを生成するス
    テップであって、前記連結が前記辞書的意味表現のうち
    のどの表現が該辞書的意味表現の他の表現を修飾するか
    を示すステップと、 辞書的意味表現のうちの少なくとも1つ、連結された辞
    書的意味表現、及び連結、との間の等価性を定義する関
    係のセットに従って、前記入力データの前記意味データ
    内の前記辞書的意味表現のうちの他を修飾しない主要な
    辞書的意味表現から始まって、等価な連結によって連結
    された前記入力データと参照データの意味データ内の等
    価の辞書的意味表現を判断することによって前記入力デ
    ータの意味データを参照データの意味データと比較する
    ステップと、 前記比較ステップの結果に基づいて機械実行可能命令を
    生成するステップと、を有することを特徴とする自然言
    語処理方法。
  2. 【請求項2】 前記比較ステップが、 前記入力データの前記意味データ内の第1の辞書的意味
    表現を特定する第1のステップと、 前記参照データの意味データ内の対応する第1の辞書的
    意味表現を特定する第2のステップと、 前記第1の辞書的意味表現を修飾する第2の辞書的意味
    表現を特定する第3のステップと、 前記参照データの意味データ内の特定された前記対応す
    る第1の辞書的意味表現に連結された対応する第2の辞
    書的意味表現を特定する第4のステップと、 関係の前記セットに従って前記入力データと前記参照デ
    ータの意味データ内の連結された第1および第2の辞書
    的意味表現の等価性を判断する第5のステップと、 前記第5のステップで等価なものが見つかった場合、該
    第5のステップで等価なものが見つからなくなるまで、
    各n番目の辞書的意味表現を修飾する各(n+1)番目
    の辞書的意味表現について前記第3のステップから第5
    のステップまでを繰り返すステップであって、nが2以
    上の整数である第6のステップと、を有することを特徴
    とする請求項1記載の自然言語処理方法。
  3. 【請求項3】 前記機械可読命令が、判断された等価な
    連結された辞書的意味表現の数に応じて生成されること
    を特徴とする請求項1または2に記載の自然言語処理方
    法。
  4. 【請求項4】 関係の前記セットが、前記等価性の点数
    を与え、連結された辞書的意味表現の等価性が累算点数
    として判断され、前記機械可読命令が前記累算点数に基
    づいて生成されることを特徴とする請求項1または2に
    記載の自然言語処理方法。
  5. 【請求項5】 関係の前記セットが、辞書的意味表現の
    出現に関する点数を含み、より出現頻度の低い辞書的意
    味表現がより出現頻度の高い辞書的意味表現よりも高い
    点数を有することを特徴とする請求項4に記載の自然言
    語処理方法。
  6. 【請求項6】 関係の前記セットが各辞書的意味表現の
    タイプの等価性の点数を与えることを特徴とする請求項
    4又は5に記載の自然言語処理方法。
  7. 【請求項7】 関係の前記セットが辞書的意味表現間の
    連結のタイプの等価性の点数を与えることを特徴とする
    請求項4乃至6のいずれかに記載の自然言語処理方法。
  8. 【請求項8】 前記参照データの意味データ内の前記判
    断された等価な連結された辞書的意味表現に連結された
    辞書的意味表現内の否定を検出し、否定が検出された場
    合は前記累算点数を下げるステップを含むことを特徴と
    する請求項4乃至7のいずれかに記載の自然言語処理方
    法。
  9. 【請求項9】 前記参照データの意味表現と等価である
    と判断されなかった前記入力データの意味データが出力
    されることを特徴とする請求項1乃至8のいずれかに記
    載の自然言語処理方法。
  10. 【請求項10】 前記入力データの意味データと等価で
    あると判断されなかった前記参照データの意味データが
    出力されることを特徴とする請求項1乃至9のいずれか
    に記載の自然言語処理方法。
  11. 【請求項11】 等価であると判断された前記入力デー
    タと前記参照データの意味データが出力されることを特
    徴とする請求項1乃至10のいずれかに記載の自然言語
    処理方法。
  12. 【請求項12】 関係の前記セットが、いくつかの連結
    を1つまたは複数の中間の辞書的意味表現を飛び越す複
    数の連結と等価であると定義することを特徴とする請求
    項1乃至3のいずれかに記載の自然言語処理方法。
  13. 【請求項13】 関係の前記セットが、前記参照データ
    の意味データ内の等価な辞書的意味表現間を飛び越す複
    数の連結の数に応じた連結の等価性の点数を含む前記等
    価性の点数を与え、連結された辞書的意味表現の等価性
    が累算点数として判断され、前記機械実行可能命令が前
    記累算点数に基づいて生成されることを特徴とする請求
    項12に記載の自然言語処理方法。
  14. 【請求項14】 有意の内容を持たない、前記入力デー
    タと前記参照データの意味データ内の辞書的意味表現
    が、等価性の判断に使用されないことを特徴とする請求
    項1乃至13のいずれかに記載の自然言語処理方法。
  15. 【請求項15】 前記意味データが分岐し、前記入力デ
    ータおよび/または前記参照データの前記意味データ内
    の辞書的意味表現が複数の他の辞書的意味表現によって
    修飾される場合、等価性を判断する前記ステップが各分
    岐の等価性を順次に判断することを特徴とする請求項1
    乃至14のいずれかに記載の自然言語処理方法。
  16. 【請求項16】 前記参照データを受け取り、前記参照
    データを解析して前記参照データの意味データを生成す
    るステップを含むことを特徴とする請求項1乃至15の
    いずれかに記載の自然言語処理方法。。
  17. 【請求項17】 前記機械実行可能命令が、等価なデー
    タが判断された前記参照データの特定と、等価な意味デ
    ータが判断された前記参照データの取り出しと、等価な
    意味データが判断された前記参照データに従った前記入
    力データの経路指定、等価な意味データが判断された前
    記参照データに関係するデータの取り出しと、前記入力
    データ内で記述され、等価な意味データが判断された前
    記参照データ内で定義されているアクションの実施との
    うちの1つを引き起こすことを特徴とする請求項1乃至
    16のいずれかに記載の自然言語処理方法。
  18. 【請求項18】 前記入力ステップが、音声認識デー
    タ、光学式文字認識データ、タイプされたテキスト、お
    よび遠隔機から転送されたデータのうちのいずれか1つ
    を入力するステップを含むことを特徴とする請求項1乃
    至17のいずれかに記載の自然言語処理方法。
  19. 【請求項19】 コンピュータ使用可能形態のデータを
    認識する自然言語処理方法であって、 自然言語の句、文、または一節を表すデータを入力する
    ステップと、 前記入力データを解析し、自然言語の文法を考慮して辞
    書的意味表現およびそれらの間の連結としてコンピュー
    タ使用可能形態で構造化された意味データを生成するス
    テップであって、前記連結が前記辞書的意味表現のうち
    のどの表現が該辞書的意味表現の他の表現を修飾するか
    を示すステップと、 前記入力データの意味データ内の主要な辞書的意味表現
    から始まり、辞書的意味表現のうちの少なくとも1つの
    辞書的意味表現と、連結された辞書的意味表現と、連結
    との間の等価性を定義する関係のセットに従って、前記
    入力データと参照データの意味データ内の辞書的意味表
    現の等価な連鎖連結された対を繰り返し判断することに
    よって、前記入力データの意味データを参照データの意
    味データと比較するステップと、 前記比較の結果に従って前記入力データの意味データを
    認識するステップと、を有することを特徴とする自然言
    語処理方法。
  20. 【請求項20】 前記比較ステップが、前記入力データ
    の前記意味データを参照データの複数のセットと比較す
    るステップを含み、 前記認識ステップが、その意味データが前記入力データ
    の意味データと最もよく一致する参照データのセットを
    特定するステップを含むことを特徴とする請求項19記
    載の自然言語処理方法。
  21. 【請求項21】 前記入力データの意味データが、辞書
    的意味表現の、判断された等価な連結された対の数に基
    づいて認識されることを特徴とする請求項19又は20
    記載の自然言語処理方法。
  22. 【請求項22】 関係の前記セットが前記等価性の点数
    を与え、連結された辞書的意味表現の等価性が累算点数
    として判断され、前記機械実行可能命令が前記累算点数
    に基づいて生成されることを特徴とする請求項19又は
    20記載の自然言語処理方法。
  23. 【請求項23】 関係の前記セットが、辞書的意味表現
    の出現に関する点数を含み、より出現頻度の低い辞書的
    意味表現がより出現頻度の高い辞書的意味表現よりも高
    い点数を有することを特徴とする請求項22記載の自然
    言語処理方法。
  24. 【請求項24】 関係の前記セットが各辞書的意味表現
    のタイプの等価性の点数を与えることを特徴とする請求
    項22又は23記載の自然言語処理方法。
  25. 【請求項25】 関係の前記セットが辞書的意味表現間
    の連結のタイプの等価性の点数を与えることを特徴とす
    る請求項22乃至24のいずれかに記載の自然言語処理
    方法。
  26. 【請求項26】 前記参照データの意味データ内の前記
    判断された等価な連結された辞書的意味表現に連結され
    た辞書的意味表現内の否定を検出し、否定が検出された
    場合は前記累算点数を下げるステップを含むことを特徴
    とする請求項22乃至25のいずれかに記載の自然言語
    処理方法。
  27. 【請求項27】 前記参照データの意味データと等価で
    あると判断されなかった、前記入力データの意味データ
    の一部に対応する入力データが出力されることを特徴と
    する請求項19乃至26のいずれかに記載の自然言語処
    理方法。
  28. 【請求項28】 前記入力データの意味データと等価で
    あると判断されなかった、前記参照データの意味データ
    の一部に対応する参照データが出力されることを特徴と
    する請求項19乃至27のいずれかに記載の自然言語処
    理方法。
  29. 【請求項29】 前記参照データの意味データと等価で
    あると判断された、前記入力データの意味データの一部
    に対応する入力データが出力されることを特徴とする請
    求項19乃至28のいずれかに記載の自然言語処理方
    法。
  30. 【請求項30】 関係の前記セットが、いくつかの連結
    を1つまたは複数の中間の辞書的意味表現を飛び越す複
    数の連結と等価であると定義することを特徴とする請求
    項19乃至21のいずれかに記載の自然言語処理方法。
  31. 【請求項31】 関係の前記セットが、前記参照データ
    の意味データ内の等価な辞書的意味表現間を飛び越す複
    数の連結の数に応じた連結の等価性の点数を含む、前記
    等価性の点数を与え、連結された辞書的意味表現の等価
    性が累算点数として判断され、前記機械実行可能命令が
    前記累算点数に基づいて生成されることを特徴とする請
    求項30記載の自然言語処理方法。
  32. 【請求項32】 有意の内容を持たない、前記入力デー
    タと前記参照データの意味データ内の辞書的意味表現
    が、等価性の判断に使用されないことを特徴とする請求
    項19乃至31のいずれかに記載の自然言語処理方法。
  33. 【請求項33】 前記意味データが分岐し、前記入力デ
    ータおよび/または前記参照データの前記意味データ内
    の辞書的意味表現が複数の他の辞書的意味表現によって
    修飾される場合、等価性を判断する前記ステップが各分
    岐の等価性を順次に判断することを特徴とする請求項1
    9乃至32のいずれかに記載の自然言語処理方法。
  34. 【請求項34】 前記参照データを受け取り、前記参照
    データを解析して前記参照データの意味データを生成す
    るステップを含むことを特徴とする請求項19乃至33
    のいずれかに記載の自然言語処理方法。
  35. 【請求項35】 辞書的意味表現の等価な連鎖連結され
    た対を判断する前記ステップが、前記入力データと前記
    参照データの意味データ内の等価な辞書的意味表現を特
    定する初期ステップと、特定された等価な辞書的意味表
    現間の等価性を登録するステップとを含み、辞書的意味
    表現の前記等価な連鎖連結された対が前記登録された等
    価性と前記連結と前記関係セットとを使用して判断され
    ることを特徴とする請求項19乃至34のいずれかに記
    載の自然言語処理方法。
  36. 【請求項36】 機械実行可能命令を生成する自然言語
    処理装置であって、 自然言語の句、文、または一節を表すデータを入力する
    入力手段と、 前記入力データを解析し、自然言語の文法を考慮して辞
    書的意味表現およびそれらの間の連結としてコンピュー
    タ使用可能形態で構造化された意味データを生成する解
    析手段であって、前記連結が前記辞書的意味表現のうち
    のどの表現が該辞書的意味表現の他の表現を修飾するか
    を示す解析手段と、 辞書的意味表現のうちの少なくとも1つの辞書的意味表
    現と、連結された辞書的意味表現と、連結との間の等価
    性を定義する関係のセットに従って、前記入力データの
    前記意味データ内の前記辞書的意味表現のうちの他の前
    記辞書的意味表現を修飾しない主要な辞書的意味表現か
    ら始まって、等価の連結によって連結された前記入力デ
    ータと参照データの意味データ内の等価の辞書的意味表
    現を判断することによって前記入力データの意味データ
    を参照データの意味データと比較する比較手段と、 前記比較手段の結果に応じて機械実行可能命令を生成す
    る生成手段と、を有することを特徴とする自然言語処理
    装置
  37. 【請求項37】 前記比較手段が、 前記入力データの前記意味データ内の第1の辞書的意味
    表現を特定する第1の特定手段と、 前記参照データの意味データ内の対応する第1の辞書的
    意味表現を特定する第2の特定手段と、 前記第1の辞書的意味表現を修飾する第2の辞書的意味
    表現を特定する第3の特定手段と、 前記参照データの意味データ内の特定された前記対応す
    る第1の辞書的意味表現に連結された対応する第2の辞
    書的意味表現を特定する第4の特定手段と、 関係の前記セットに従って前記入力データと前記参照デ
    ータの意味データ内の連結された第1および第2の辞書
    的意味表現の等価性を判断する判断手段と、 前記判断手段によって等価なものが見つかった場合、前
    記判断手段によって等価なものが見つからなくなるま
    で、各n番目の辞書的意味表現を修飾する各(n+1)
    番目の辞書的意味表現について前記第1乃至第4の特定
    手段と前記判断手段の各手段が反復的に動作し、nが2
    以上の整数であることを特徴とする請求項36記載の自
    然言語処理装置。
  38. 【請求項38】 前記生成手段が、判断された等価な連
    結された辞書的意味表現の数に応じて前記機械実行可能
    命令を生成することを特徴とする請求項36又は37に
    記載の自然言語処理装置。
  39. 【請求項39】 関係の前記セットが、前記等価性の点
    数を与え、前記比較手段が、連結された辞書的意味表現
    の等価性を累算点数として判断し、前記生成手段が前記
    累算点数に基づいて動作可能なことを特徴とする請求項
    36又は37に記載の自然言語処理装置。
  40. 【請求項40】 前記判断手段が、辞書的意味表現の出
    現に関する点数を含む関係の前記セットに従って等価性
    を判断し、より出現頻度の低い辞書的意味表現がより出
    現頻度の高い辞書的意味表現よりも高い点数を有するこ
    とを特徴とする請求項39記載の自然言語処理装置。
  41. 【請求項41】 前記判断手段が、各辞書的意味表現の
    タイプの等価性の点数を与える関係の前記セットに従っ
    て等価性を判断することを特徴とする請求項39又は4
    0に記載の自然言語処理装置。
  42. 【請求項42】 前記判断手段が、辞書的意味表現間の
    連結のタイプの等価性の点数を与える関係の前記セット
    に従って等価性を判断することを特徴とする請求項39
    乃至41のいずれかに記載の自然言語処理装置。
  43. 【請求項43】 前記参照データの意味データ内の前記
    判断された等価な連結された辞書的意味表現に連結され
    た辞書的意味表現内の否定を検出し、否定が検出された
    場合は前記累算点数を下げる手段を含むことを特徴とす
    る請求項39乃至42のいずれかに記載の自然言語処理
    装置。
  44. 【請求項44】 前記参照データの意味表現と等価であ
    ると判断されなかった前記入力データの意味データを出
    力する手段を含むことを特徴とする請求項36乃至43
    のいずれかに記載の自然言語処理装置。
  45. 【請求項45】 前記入力データの意味データと等価で
    あると判断されなかった前記参照データの意味データを
    出力する手段を含むことを特徴とする請求項36乃至4
    4のいずれかに記載の自然言語処理装置。
  46. 【請求項46】 等価であると判断された前記入力デー
    タと前記参照データの意味データを出力する手段を含む
    ことを特徴とする請求項36乃至38のいずれかに記載
    の自然言語処理装置。
  47. 【請求項47】 前記比較手段が、いくつかの連結を1
    つまたは複数の中間の辞書的意味表現を飛び越す複数の
    連結と等価であると定義する関係の前記セットに従って
    等価性を判断することを特徴とする請求項36乃至38
    のいずれかに記載の自然言語処理装置。
  48. 【請求項48】 関係の前記セットが、前記参照データ
    の意味データ内の等価な辞書的意味表現間を飛び越す複
    数の連結の数に応じた連結の等価性の点数を含む、前記
    等価性の点数を与え、前記比較手段が、連結された辞書
    的意味表現の等価性を累算点数として判断し、前記生成
    手段が、前記機械実行可能命令を前記累算点数に基づい
    て生成することを特徴とする請求項47記載の自然言語
    処理装置。
  49. 【請求項49】 前記比較手段が、有意の内容を持たな
    い、前記入力データと前記参照データの意味データ内の
    辞書的意味表現を、等価性の判断に使用しないことを特
    徴とする請求項36乃至48のいずれかに記載の自然言
    語処理装置。
  50. 【請求項50】 前記意味データが分岐し、前記入力デ
    ータおよび/または前記参照データの前記意味データ内
    の辞書的意味表現が複数の他の辞書的意味表現によって
    修飾される場合、前記比較手段が、各分岐の等価性を順
    次に判断することを特徴とする請求項36乃至49のい
    ずれかに記載の自然言語処理装置。
  51. 【請求項51】 前記参照データを受け取る手段を含
    み、前記解析手段が前記参照データの解析によって前記
    参照データの前記意味データを生成することを特徴とす
    る請求項36乃至50のいずれかに記載の自然言語処理
    装置。
  52. 【請求項52】 前記入力手段が、音声認識データ、光
    学式文字認識データ、タイプされたテキスト、および遠
    隔機から転送されたデータのうちのいずれか1つを入力
    することを特徴とする請求項36乃至51のいずれかに
    記載の自然言語処理装置。
  53. 【請求項53】 自然言語の句、文、または一節を表す
    データを入力する入力手段と、 前記入力データを解析し、自然言語の文法を考慮して辞
    書的意味表現およびそれらの間の連結としてコンピュー
    タ使用可能形態で構造化された意味データを生成する解
    析手段であって、連結が前記辞書的意味表現のうちのど
    の表現が該辞書的意味表現の他の表現を修飾するかを示
    す解析手段と、 前記入力データの意味データ内の主要な辞書的意味表現
    から始まり、辞書的意味表現のうちの少なくとも1つの
    辞書的意味表現と、連結された辞書的意味表現と、連結
    との間の等価性を定義する関係のセットに従って、前記
    入力データと参照データの意味データ内の辞書的意味表
    現の等価な連鎖連結された対を繰り返し判断することに
    よって、前記入力データの意味データを参照データの意
    味データと比較する比較手段と、 前記比較の結果に従って前記入力データの意味データを
    認識する認識手段と、を有することを特徴とする自然言
    語認識装置。
  54. 【請求項54】 前記比較手段が、前記入力データの前
    記意味データを参照データの複数のセットと比較し、 前記認識手段が、その意味データが前記入力データの意
    味データと最もよく一致する参照データのセットを特定
    することを特徴とする請求項53記載の自然言語認識装
    置。
  55. 【請求項55】 前記認識手段が、辞書的意味表現の判
    断された等価な連結された対の数に基づいて前記入力デ
    ータの意味データを認識することを特徴とする請求項5
    3または54記載の自然言語認識装置。
  56. 【請求項56】 関係の前記セットが前記等価性の点数
    を与え、前記比較手段が連結された辞書的意味表現の等
    価性を累算点数として判断し、前記生成手段が前記累算
    点数に基づいて動作可能なことを特徴とする請求項53
    または54記載の自然言語認識装置。
  57. 【請求項57】 前記判断手段が、辞書的意味表現の出
    現に関する点数を含む関係の前記セットに従って等価性
    を判断し、より出現頻度の低い辞書的意味表現がより出
    現頻度の高い辞書的意味表現よりも高い点数を有するこ
    とを特徴とする請求項56記載の自然言語認識装置。
  58. 【請求項58】 前記判断手段が、各辞書的意味表現の
    タイプの等価性の点数を与える関係の前記セットに従っ
    て等価性を判断することを特徴とする請求項56または
    57記載の自然言語認識装置。
  59. 【請求項59】 前記判断手段が、辞書的意味表現間の
    連結のタイプの等価性の点数を与える関係の前記セット
    に従って等価性を判断することを特徴とする請求項56
    乃至58のいずれかに記載の自然言語認識装置。
  60. 【請求項60】 前記参照データの意味データ内の前記
    判断された等価な連結された辞書的意味表現に連結され
    た辞書的意味表現内の否定を検出し、否定が検出された
    場合は前記累算点数を下げる手段を含むことを特徴とす
    る請求項56乃至59のいずれかに記載の自然言語認識
    装置。
  61. 【請求項61】 前記参照データの意味データと等価で
    あると判断されなかった、前記入力データの意味データ
    を出力する手段を含むことを特徴とする請求項53乃至
    60のいずれかに記載の自然言語認識装置。
  62. 【請求項62】 前記入力データの意味データと等価で
    あると判断されなかった参照データの意味データを出力
    する手段を含むことを特徴とする請求項53乃至61の
    いずれかに記載の自然言語認識装置。
  63. 【請求項63】 等価であると判断された前記入力デー
    タと前記参照データの意味データを出力する手段を含む
    ことを特徴とする請求項53乃至62のいずれかに記載
    の自然言語認識装置。
  64. 【請求項64】 前記比較手段が、いくつかの連結を1
    つまたは複数の中間の辞書的意味表現を飛び越す複数の
    連結と等価であると定義する関係の前記セットに従って
    等価性を判断することを特徴とする請求項53乃至55
    のいずれかに記載の自然言語認識装置。
  65. 【請求項65】 関係の前記セットが、前記参照データ
    の意味データ内の等価な辞書的意味表現間を飛び越す複
    数の連結の数に応じた連結の等価性の点数を含む、前記
    等価性の点数を与え、前記比較手段が、連結された辞書
    的意味表現の等価性を累算点数として判断し、前記認識
    手段が、前記意味データを前記累算点数に基づいて認識
    することを特徴とする請求項64記載の自然言語認識装
    置。
  66. 【請求項66】 前記比較手段が、有意の内容を持たな
    い、前記入力データと前記参照データの意味データ内の
    辞書的意味表現を、等価性の判断に使用しないことを特
    徴とする請求項53乃至65のいずれかに記載の自然言
    語認識装置。
  67. 【請求項67】 前記意味データが分岐し、前記入力デ
    ータおよび/または前記参照データの前記意味データ内
    の辞書的意味表現が複数の他の辞書的意味表現によって
    修飾される場合、前記比較手段が、各分岐の等価性を順
    次に判断することを特徴とする請求項53乃至66のい
    ずれかに記載の自然言語認識装置。
  68. 【請求項68】 前記参照データを受け取る手段を含
    み、前記解析手段が前記参照データの解析によって前記
    参照データの前記意味データを生成することを特徴とす
    る請求項53乃至67のいずれかに記載の自然言語認識
    装置。
  69. 【請求項69】 前記判断手段が、最初に前記入力デー
    タと前記参照データの意味データ内の等価な辞書的意味
    表現を特定し、特定された等価な辞書的意味表現間の等
    価性を登録する手段と、前記登録された等価性と前記連
    結と前記関係セットとを使用して辞書的意味表現の前記
    等価な連鎖連結された対を判断する手段とを含むことを
    特徴とする請求項53乃至68のいずれかに記載の自然
    言語認識装置。
  70. 【請求項70】 自然言語の句、文、または一節を表す
    入力データを、自然言語の句、文、または一節を表す参
    照データの1つまたは複数のセットと突き合わせる自然
    言語処理装置であって、 入力データと参照データを入力する入力手段と、 前記入力データと前記参照データとを解析し、自然言語
    の文法を考慮して辞書的意味表現およびそれらの間の連
    結としてそれぞれ構造化された入力意味データと出力意
    味データとを生成する解析手段であって、連結が前記辞
    書的意味表現のうちのどの表現が該辞書的意味表現の他
    の表現を修飾するかを示す解析手段と、 他の辞書的意味表現を修飾しない前記入力意味データ内
    の主要な辞書的意味表現と前記参照意味データ内の等価
    な辞書的意味表現とを特定し、前記主要な辞書的意味表
    現またはそれと等価な表現にそれぞれ連鎖連結された前
    記入力意味データ内および前記参照意味データ内の等価
    な辞書的意味表現を判断することによって前記入力意味
    データと前記参照意味データとを比較する比較手段であ
    って、等価性が辞書的意味表現のうちの少なくとも1つ
    の辞書的意味表現と、辞書的意味表現の連結された対
    と、連結との間の等価性を定義する関係のセットを使用
    して判断される比較手段と、 前記比較手段の出力に基づいて、前記入力データと前記
    参照データまたは参照データの各セットとの間の一致を
    判断する突き合わせ手段と、を有することを特徴とする
    自然言語処理装置。
  71. 【請求項71】 前記突き合わせ手段が、判断された辞
    書的意味表現の等価な連結された対の数に基づいて一致
    を判断することを特徴とする請求項70記載の自然言語
    処理装置。
  72. 【請求項72】 関係の前記セットが等価性の点数を与
    え、前記比較手段が、前記点数を累算することによって
    辞書的意味表現の連結された対の等価性を判断し、前記
    突き合わせ手段が前記累算された点数に基づいて前記一
    致を判断することを特徴とする請求項70記載の自然言
    語処理装置。
  73. 【請求項73】 前記一致を示す表示を出力する出力手
    段を含むことを特徴とする請求項70乃至72のいずれ
    かに記載の自然言語処理装置。
  74. 【請求項74】 前記出力手段が、一致すると判断され
    た前記入力データと前記参照データの部分と、前記参照
    データと一致しないと判断された前記入力データの部分
    と、前記入力データと一致しないと判断された前記参照
    データの部分とのうちの少なくとも1つの部分を出力す
    ることを特徴とする請求項73記載の自然言語処理装
    置。
  75. 【請求項75】 前記比較手段が、少なくとも1つの連
    結を、1つまたは複数の辞書的意味表現を飛び越す複数
    の連結と等価であると定義する関係の前記セットを使用
    して等価性を判断することを特徴とする請求項70乃至
    74のいずれかに記載の自然言語処理装置。
  76. 【請求項76】 関係の前記セットが、等価な複数連結
    内の連結の数に応じた連結の等価性の点数を含む等価性
    の点数を与え、前記比較手段が辞書的意味表現の連鎖連
    結された対の等価性を累算点数として判断し、前記突き
    合わせ手段が前記累算点数に基づいて前記一致を判断す
    ることを特徴とする請求項75記載の自然言語処理装
    置。
  77. 【請求項77】 前記比較手段が、有意な内容を持たな
    い前記入力データと前記参照データの意味データ内の辞
    書的意味表現を等価性の判断のために使用しないことを
    特徴とする請求項70乃至76のいずれかに記載の自然
    言語処理装置。
  78. 【請求項78】 前記意味データが分岐し、前記入力デ
    ータおよび/または前記参照データの前記意味データ内
    の辞書的意味表現が複数の他の意味表現によって修飾さ
    れる場合、前記比較手段が、各分岐の等価性を順次に判
    断することを特徴とする請求項70乃至77のいずれか
    に記載の自然言語処理装置。
  79. 【請求項79】 自然言語の句、文、または一節を表す
    入力データを、前記自然言語の句、文、または一節を表
    す参照データの1つまたは複数のセットと突き合わせる
    自然言語処理方法であって、 前記入力データと前記参照データとを解析し、自然言語
    の文法を考慮して辞書的意味表現およびそれらの間の連
    結としてそれぞれ構造化された入力意味データと出力意
    味データとを生成するステップであって、前記連結が前
    記辞書的意味表現のうちのどの表現が該辞書的意味表現
    の他の表現を修飾するかを示す解析ステップと、 他の辞書的意味表現を修飾しない前記入力意味データ内
    の主要な辞書的意味表現を特定し、前記参照意味データ
    内の等価な辞書的意味表現を特定し、前記主要な辞書的
    意味表現またはそれと等価な表現にそれぞれ連鎖連結さ
    れた前記入力意味データ内および前記参照意味データ内
    の等価な辞書的意味表現を判断することによって前記入
    力意味データと前記参照意味データとを比較するステッ
    プであって、等価性が辞書的意味表現のうちの少なくと
    も1つの辞書的意味表現と、辞書的意味表現の連結され
    た対と、連結との間の等価性を定義する関係のセットを
    使用して判断される比較ステップと、 前記比較手段の出力に基づいて、前記入力データと前記
    参照データまたは参照データの各セットとの間の一致を
    判断するステップと、を有することを特徴とする自然言
    語処理方法。
  80. 【請求項80】 判断された辞書的意味表現の等価な連
    結された対の数に基づいて前記一致が判断されることを
    特徴とする請求項79記載の自然言語処理方法。
  81. 【請求項81】 関係の前記セットが前記等価性の点数
    を与え、辞書的意味表現の連結された対の等価性が累算
    点数として判断され、前記一致が前記累算点数に基づい
    て判断されることを特徴とする請求項79記載の自然言
    語処理方法。
  82. 【請求項82】 前記一致を示す表示を出力するステッ
    プを含むことを特徴とする請求項79乃至81のいずれ
    かに記載の自然言語処理方法。
  83. 【請求項83】 一致すると判断された前記入力データ
    と前記参照データの部分と、前記参照データと一致しな
    いと判断された前記入力データの部分と、前記入力デー
    タと一致しないと判断された前記参照データの部分との
    うちの少なくとも1つの部分が出力されることを特徴と
    する請求項82記載の自然言語処理方法。
  84. 【請求項84】 関係の前記セットが、少なくとも1つ
    の連結を、1つまたは複数の辞書的意味表現を飛び越す
    複数の連結と等価であると定義することを特徴とする請
    求項79乃至83のいずれかに記載の自然言語処理方
    法。
  85. 【請求項85】 関係の前記セットが、等価な複数連結
    内の連結の数に応じた連結の等価性の点数を含む等価性
    の点数を与え、前記等価性が累算点数として判断され、
    前記一致が前記累算点数に基づいて判断されることを特
    徴とする請求項84記載の自然言語処理方法。
  86. 【請求項86】 有意な内容を持たない前記入力データ
    と前記参照データの意味データ内の辞書的意味表現が等
    価性の判断のために使用されないことを特徴とする請求
    項79乃至85のいずれかに記載の自然言語処理方法。
  87. 【請求項87】 前記意味データが分岐し、前記入力デ
    ータおよび/または前記参照データの前記意味データ内
    の辞書的意味表現が複数の他の辞書的意味表現によって
    修飾される場合、等価性を判断する前記ステップが各分
    岐の等価性を順次に判断することを特徴とする請求項7
    9乃至86のいずれかに記載の自然言語処理方法。
  88. 【請求項88】 データを処理するデータ処理装置であ
    って、請求項36乃至52のいずれかに記載の自然言語
    処理装置を備え、前記機械実行可能命令に応答する手段
    を含むことを特徴とするデータ処理装置。
  89. 【請求項89】 請求項36乃至52のいずれかに記載
    された自然言語処理装置、又は請求項53乃至69のい
    ずれかに記載された自然言語認識装置、請求項70乃至
    78のいずれかに記載された自然言語処理装置装置から
    なるユーザ・インタフェースを有する装置。
  90. 【請求項90】 プロセッサに、自然言語の句、文、ま
    たは一節を表す入力データと参照データを処理させて意
    味に一致があるか否かを判断させるコンピュータ可読命
    令が記憶されたコンピュータ使用可能媒体であって、前
    記命令が、 プロセッサに、前記入力データと前記参照データとを解
    析させ、自然言語の文法を考慮して辞書的意味表現およ
    びそれらの間の連結をそれぞれ含む入力意味データと出
    力意味データとを生成させる命令であって、前記連結が
    前記辞書的意味表現のうちのどの辞書的意味表現が前記
    辞書的意味表現のうちの他の辞書的意味表現を修飾する
    かを示す解析命令と、 前記プロセッサに、前記入力意味データ内の主要な辞書
    的意味表現から始まり、辞書的意味表現のうちの少なく
    とも1つの辞書的意味表現と、連結された辞書的意味表
    現と、連結との間の等価性を定義する関係のセットに従
    って、前記入力意味データと前記参照意味データ内の辞
    書的意味表現の等価な連鎖連結された対を繰り返し判断
    することによって、前記入力意味データを前記参照意味
    データと比較させる比較命令と、 プロセッサに、前記比較の結果に基づいて前記入力デー
    タと前記参照データとの間の一致を登録させる登録命令
    と、を含むことを特徴とするコンピュータ使用可能媒
    体。
  91. 【請求項91】 請求項1乃至35または請求項79乃
    至87のいずれかに記載された自然言語処理方法を実行
    するようにプロセッサを制御するプロセッサ実施可能命
    令を伝達する伝達媒体。
  92. 【請求項92】 請求項1乃至35または請求項79乃
    至87のいずれかに記載された自然言語処理方法を実行
    するようにプロセッサを制御するプロセッサ実施可能命
    令を伝達するコード化信号。
JP28709499A 1998-10-08 1999-10-07 自然言語処理装置及びその方法、及び自然言語認識装置 Expired - Fee Related JP4306894B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9821969.4 1998-10-08
GBGB9821969.4A GB9821969D0 (en) 1998-10-08 1998-10-08 Apparatus and method for processing natural language

Publications (3)

Publication Number Publication Date
JP2000112938A true JP2000112938A (ja) 2000-04-21
JP2000112938A5 JP2000112938A5 (ja) 2006-11-24
JP4306894B2 JP4306894B2 (ja) 2009-08-05

Family

ID=10840226

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28709499A Expired - Fee Related JP4306894B2 (ja) 1998-10-08 1999-10-07 自然言語処理装置及びその方法、及び自然言語認識装置

Country Status (5)

Country Link
US (1) US6937975B1 (ja)
EP (1) EP0992919B1 (ja)
JP (1) JP4306894B2 (ja)
DE (1) DE69934371T2 (ja)
GB (1) GB9821969D0 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031668A (ja) * 2004-07-15 2006-02-02 Hitachi Ltd データ価値に基づく階層型ストレージ管理の為の方法と装置
JP2009528581A (ja) * 2005-11-14 2009-08-06 メイク センス インコーポレイテッド 知識相関サーチエンジン
US8024653B2 (en) 2005-11-14 2011-09-20 Make Sence, Inc. Techniques for creating computer generated notes
US8108389B2 (en) 2004-11-12 2012-01-31 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US8126890B2 (en) 2004-12-21 2012-02-28 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US8140559B2 (en) 2005-06-27 2012-03-20 Make Sence, Inc. Knowledge correlation search engine
JP2012185567A (ja) * 2011-03-03 2012-09-27 Fujitsu Ltd 表示制御装置、表示制御方法、および表示制御プログラム
US8898134B2 (en) 2005-06-27 2014-11-25 Make Sence, Inc. Method for ranking resources using node pool
US9330175B2 (en) 2004-11-12 2016-05-03 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms

Families Citing this family (205)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001013255A2 (en) 1999-08-13 2001-02-22 Pixo, Inc. Displaying and traversing links in character array
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US20030225751A1 (en) * 2000-07-06 2003-12-04 Kim Si Han Information searching system and method thereof
GB0026353D0 (en) 2000-10-27 2000-12-13 Canon Kk Apparatus and a method for facilitating searching
US7120900B2 (en) * 2001-04-19 2006-10-10 International Business Machines Bi-directional display
US7996207B2 (en) * 2001-06-26 2011-08-09 International Business Machines Corporation Bidirectional domain names
US20070265834A1 (en) * 2001-09-06 2007-11-15 Einat Melnick In-context analysis
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
US20040128138A1 (en) * 2002-06-28 2004-07-01 Andrews Donna B. Universal type-in line
US7720680B2 (en) * 2004-06-17 2010-05-18 Robert Bosch Gmbh Interactive manual, system and method for vehicles and other complex equipment
US7669134B1 (en) 2003-05-02 2010-02-23 Apple Inc. Method and apparatus for displaying information during an instant messaging session
JP4476609B2 (ja) * 2003-12-10 2010-06-09 株式会社東芝 中国語解析装置、中国語解析方法および中国語解析プログラム
US20050138556A1 (en) * 2003-12-18 2005-06-23 Xerox Corporation Creation of normalized summaries using common domain models for input text analysis and output text generation
US7565368B2 (en) * 2004-05-04 2009-07-21 Next It Corporation Data disambiguation systems and methods
US7603705B2 (en) * 2004-05-04 2009-10-13 Next It Corporation Methods and systems for enforcing network and computer use policy
US7580837B2 (en) 2004-08-12 2009-08-25 At&T Intellectual Property I, L.P. System and method for targeted tuning module of a speech recognition system
US7242751B2 (en) 2004-12-06 2007-07-10 Sbc Knowledge Ventures, L.P. System and method for speech recognition-enabled automatic call routing
US7751551B2 (en) 2005-01-10 2010-07-06 At&T Intellectual Property I, L.P. System and method for speech-enabled call routing
US7627096B2 (en) * 2005-01-14 2009-12-01 At&T Intellectual Property I, L.P. System and method for independently recognizing and selecting actions and objects in a speech recognition system
US7817983B2 (en) * 2005-03-14 2010-10-19 Qualcomm Incorporated Method and apparatus for monitoring usage patterns of a wireless device
US7657020B2 (en) 2005-06-03 2010-02-02 At&T Intellectual Property I, Lp Call routing system and method of using the same
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7633076B2 (en) 2005-09-30 2009-12-15 Apple Inc. Automated response to and sensing of user activity in portable devices
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
WO2008073850A2 (en) * 2006-12-08 2008-06-19 Sri International Method and apparatus for reading education
CN101595474B (zh) * 2007-01-04 2012-07-11 思解私人有限公司 语言分析
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US20090018818A1 (en) * 2007-07-10 2009-01-15 Aibelive Co., Ltd. Operating device for natural language input
ITFI20070177A1 (it) 2007-07-26 2009-01-27 Riccardo Vieri Sistema per la creazione e impostazione di una campagna pubblicitaria derivante dall'inserimento di messaggi pubblicitari all'interno di uno scambio di messaggi e metodo per il suo funzionamento.
US8868479B2 (en) 2007-09-28 2014-10-21 Telogis, Inc. Natural language parsers to normalize addresses for geocoding
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8165886B1 (en) 2007-10-04 2012-04-24 Great Northern Research LLC Speech interface system and method for control and interaction with applications on a computing system
US8595642B1 (en) 2007-10-04 2013-11-26 Great Northern Research, LLC Multiple shell multi faceted graphical user interface
US8364694B2 (en) 2007-10-26 2013-01-29 Apple Inc. Search assistant for digital media assets
US8620662B2 (en) 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8327272B2 (en) 2008-01-06 2012-12-04 Apple Inc. Portable multifunction device, method, and graphical user interface for viewing and managing electronic calendars
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
US8289283B2 (en) 2008-03-04 2012-10-16 Apple Inc. Language input interface on a device
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US8706477B1 (en) 2008-04-25 2014-04-22 Softwin Srl Romania Systems and methods for lexical correspondence linguistic knowledge base creation comprising dependency trees with procedural nodes denoting execute code
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US8352272B2 (en) 2008-09-29 2013-01-08 Apple Inc. Systems and methods for text to speech synthesis
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8396714B2 (en) 2008-09-29 2013-03-12 Apple Inc. Systems and methods for concatenation of words in text to speech synthesis
US8355919B2 (en) 2008-09-29 2013-01-15 Apple Inc. Systems and methods for text normalization for text to speech synthesis
US8352268B2 (en) 2008-09-29 2013-01-08 Apple Inc. Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8583418B2 (en) 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US8494857B2 (en) 2009-01-06 2013-07-23 Regents Of The University Of Minnesota Automatic measurement of speech fluency
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US8762130B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for natural language processing including morphological analysis, lemmatizing, spell checking and grammar checking
US8762131B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US8600743B2 (en) 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
DE112011100329T5 (de) 2010-01-25 2012-10-31 Andrew Peter Nelson Jerram Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8639516B2 (en) 2010-06-04 2014-01-28 Apple Inc. User-specific noise suppression for voice quality improvements
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US9104670B2 (en) 2010-07-21 2015-08-11 Apple Inc. Customized search or acquisition of digital media assets
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
DE102010054217A1 (de) 2010-12-11 2012-06-14 Volkswagen Aktiengesellschaft Verfahren zum Bereitstellen eines Sprachbediensystems in einem Fahrzeug und Sprachbediensystem dazu
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US8688453B1 (en) * 2011-02-28 2014-04-01 Nuance Communications, Inc. Intent mining via analysis of utterances
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10672399B2 (en) 2011-06-03 2020-06-02 Apple Inc. Switching between text data and audio data based on a mapping
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US9934218B2 (en) * 2011-12-05 2018-04-03 Infosys Limited Systems and methods for extracting attributes from text content
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
WO2013138633A1 (en) 2012-03-15 2013-09-19 Regents Of The University Of Minnesota Automated verbal fluency assessment
CN103365834B (zh) * 2012-03-29 2017-08-18 富泰华工业(深圳)有限公司 语言歧义消除系统及方法
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US10019994B2 (en) 2012-06-08 2018-07-10 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US20130338995A1 (en) * 2012-06-12 2013-12-19 Grant Street Group, Inc. Practical natural-language human-machine interfaces
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
DE212014000045U1 (de) 2013-02-07 2015-09-24 Apple Inc. Sprach-Trigger für einen digitalen Assistenten
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
US9104780B2 (en) 2013-03-15 2015-08-11 Kamazooie Development Corporation System and method for natural language processing
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US11151899B2 (en) 2013-03-15 2021-10-19 Apple Inc. User training by intelligent digital assistant
WO2014144949A2 (en) 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
KR101904293B1 (ko) 2013-03-15 2018-10-05 애플 인크. 콘텍스트-민감성 방해 처리
US9342846B2 (en) * 2013-04-12 2016-05-17 Ebay Inc. Reconciling detailed transaction feedback
US9495357B1 (en) * 2013-05-02 2016-11-15 Athena Ann Smyros Text extraction
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
DE112014002747T5 (de) 2013-06-09 2016-03-03 Apple Inc. Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
AU2014306221B2 (en) 2013-08-06 2017-04-06 Apple Inc. Auto-activating smart responses based on activities from remote devices
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US10825724B2 (en) 2014-04-25 2020-11-03 Taiwan Semiconductor Manufacturing Company Metal contact structure and method of forming the same in a semiconductor device
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
WO2018161306A1 (en) * 2017-03-09 2018-09-13 Microsoft Technology Licensing, Llc Application recommendation
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59176823A (ja) 1983-01-28 1984-10-06 テキサス インスツルメンツ インコ−ポレイテツド 自然言語を用いてコンピュータに入力する方法
US5404506A (en) * 1985-03-27 1995-04-04 Hitachi, Ltd. Knowledge based information retrieval system
US4914590A (en) * 1988-05-18 1990-04-03 Emhart Industries, Inc. Natural language understanding system
NL8900247A (nl) * 1989-02-01 1990-09-03 Bso Buro Voor Systeemontwikkel Werkwijze en stelsel voor het weergeven van meervoudige analyses in een afhankelijkheidsgrammatica, alsmede ontleed-inrichting voor het genereren van een dergelijke weergave.
GB9217886D0 (en) * 1992-08-21 1992-10-07 Canon Res Ct Europe Ltd Method and apparatus for parsing natural language
GB2272091B (en) 1992-10-30 1996-10-23 Canon Europa Nv Apparatus for use in aligning bilingual corpora
GB2278467B (en) 1993-05-20 1998-04-01 Canon Res Ct Europe Ltd Apparatus and method for data processing and/or for control
US5840701A (en) 1993-08-16 1998-11-24 Hsia; Jen-Chang Compositions and methods utilizing nitroxides in combination with biocompatible macromolecules
GB2300495A (en) 1995-04-13 1996-11-06 Canon Kk Language processing
JPH08287094A (ja) * 1995-04-18 1996-11-01 Fujitsu Social Sci Lab:Kk マルチメディアデータのデータ管理システムおよびデータ管理装置
US5963940A (en) * 1995-08-16 1999-10-05 Syracuse University Natural language information retrieval system and method
US6026388A (en) * 1995-08-16 2000-02-15 Textwise, Llc User interface and other enhancements for natural language information retrieval system and method
US6076051A (en) * 1997-03-07 2000-06-13 Microsoft Corporation Information retrieval utilizing semantic representation of text
US5933822A (en) * 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
US5960384A (en) * 1997-09-03 1999-09-28 Brash; Douglas E. Method and device for parsing natural language sentences and other sequential symbolic expressions
US6144958A (en) * 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
US6167370A (en) * 1998-09-09 2000-12-26 Invention Machine Corporation Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031668A (ja) * 2004-07-15 2006-02-02 Hitachi Ltd データ価値に基づく階層型ストレージ管理の為の方法と装置
JP4648723B2 (ja) * 2004-07-15 2011-03-09 株式会社日立製作所 データ価値に基づく階層型ストレージ管理の為の方法と装置
US10467297B2 (en) 2004-11-12 2019-11-05 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US9330175B2 (en) 2004-11-12 2016-05-03 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US9311601B2 (en) 2004-11-12 2016-04-12 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US8108389B2 (en) 2004-11-12 2012-01-31 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US8126890B2 (en) 2004-12-21 2012-02-28 Make Sence, Inc. Techniques for knowledge discovery by constructing knowledge correlations using concepts or terms
US8898134B2 (en) 2005-06-27 2014-11-25 Make Sence, Inc. Method for ranking resources using node pool
US8140559B2 (en) 2005-06-27 2012-03-20 Make Sence, Inc. Knowledge correlation search engine
US9477766B2 (en) 2005-06-27 2016-10-25 Make Sence, Inc. Method for ranking resources using node pool
US9213689B2 (en) 2005-11-14 2015-12-15 Make Sence, Inc. Techniques for creating computer generated notes
JP4864095B2 (ja) * 2005-11-14 2012-01-25 メイク センス インコーポレイテッド 知識相関サーチエンジン
US8024653B2 (en) 2005-11-14 2011-09-20 Make Sence, Inc. Techniques for creating computer generated notes
JP2009528581A (ja) * 2005-11-14 2009-08-06 メイク センス インコーポレイテッド 知識相関サーチエンジン
JP2012185567A (ja) * 2011-03-03 2012-09-27 Fujitsu Ltd 表示制御装置、表示制御方法、および表示制御プログラム

Also Published As

Publication number Publication date
GB9821969D0 (en) 1998-12-02
DE69934371T2 (de) 2007-09-20
JP4306894B2 (ja) 2009-08-05
EP0992919A1 (en) 2000-04-12
EP0992919B1 (en) 2006-12-13
DE69934371D1 (de) 2007-01-25
US6937975B1 (en) 2005-08-30

Similar Documents

Publication Publication Date Title
JP4306894B2 (ja) 自然言語処理装置及びその方法、及び自然言語認識装置
US7174507B2 (en) System method and computer program product for obtaining structured data from text
JP3027052B2 (ja) 文書検索システム
US5424947A (en) Natural language analyzing apparatus and method, and construction of a knowledge base for natural language analysis
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
US5528491A (en) Apparatus and method for automated natural language translation
JP3429184B2 (ja) テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
US5890103A (en) Method and apparatus for improved tokenization of natural language text
US6243670B1 (en) Method, apparatus, and computer readable medium for performing semantic analysis and generating a semantic structure having linked frames
US6101492A (en) Methods and apparatus for information indexing and retrieval as well as query expansion using morpho-syntactic analysis
US7567902B2 (en) Generating speech recognition grammars from a large corpus of data
JP2742115B2 (ja) 類似文書検索装置
JP2012520528A (ja) 自然言語テキストの自動的意味ラベリングのためのシステム及び方法
JP2000315216A (ja) 自然言語検索方法および装置
JP3743678B2 (ja) 自動自然言語翻訳
JPH06325073A (ja) 特殊共起処理方法およびその特殊共起処理方法を用いた装置
Kazman Structuring the text of the Oxford English Dictionary through finite state transduction
JPH09198395A (ja) 文書検索装置
Litkowski Question Answering Using XML-Tagged Documents.
Vickers Ontology-based free-form query processing for the semantic web
JPH1074207A (ja) 情報検索装置及び情報検索方法
JPH07244669A (ja) 文書検索方式
JP2002278963A (ja) 事例翻訳装置
JP2002366556A (ja) 情報検索方法
JPH10171815A (ja) 統合化検索装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061010

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061010

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080303

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080502

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080805

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090130

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090331

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090420

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090428

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130515

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees