JPH0447364A - 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 - Google Patents

自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法

Info

Publication number
JPH0447364A
JPH0447364A JP2155570A JP15557090A JPH0447364A JP H0447364 A JPH0447364 A JP H0447364A JP 2155570 A JP2155570 A JP 2155570A JP 15557090 A JP15557090 A JP 15557090A JP H0447364 A JPH0447364 A JP H0447364A
Authority
JP
Japan
Prior art keywords
natural language
vocabulary
tree
knowledge base
language analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2155570A
Other languages
English (en)
Other versions
JP3266246B2 (ja
Inventor
Katashi Nagao
長尾 確
Hiroshi Nomiyama
浩 野美山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP15557090A priority Critical patent/JP3266246B2/ja
Priority to US07/714,408 priority patent/US5424947A/en
Priority to EP19910305412 priority patent/EP0467527A3/en
Publication of JPH0447364A publication Critical patent/JPH0447364A/ja
Application granted granted Critical
Publication of JP3266246B2 publication Critical patent/JP3266246B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 本発明は、自然言語の文章の語彙間の依存関係に関する
知識を用いて、文の構造的多義性を解消する装置及び方
法並びにそのための知識ベース構築方法に関する。
ここで、語彙とは名詞、動詞、形容詞、副詞などの内容
語であり、冠詞、前置詞などの機能語は含まないものと
する。分野によっては、−続きの内容語も一つの語彙と
して扱われる。例えば、コンピュータの技術文献では、
”virtual disk”を一つの語彙として扱う
。また、依存関係とは語彙間の修飾・被修飾関係(係り
受は関係とも言う)のことである。
B、従来技術 、自然言語を扱うシステムにとって、文の構造的多義性
は依然として解消が困難な問題として残されている。例
えば、英語文などにおける前置詞句の係り受けの多義性
である。”A user can log onthe
 system with a password、+
という文章において、”with a passwor
d−という前置詞句が、−1゜gon”という動詞に副
詞的に係るが、あるいは“the 5yste腸”とい
う名詞句に係るか、という多義性が存在する。
文の構造的多義性を、語彙や句などの構成要素の意味・
機能的情報を基にして、解消するという手法がいくつか
考えられている。例えば、Prentice−Hal1
社1969年発行の、Modern 5tudies 
inEnglishの361−375頁のChares
 J、Fil1more著。
ゴaward a modern theory of
 case”に開示される格文法を理論的基盤とした手
法である。文の構成要素が述語に対して果たす機能を格
といい、格の機能のうち意味的なものを特に深層格とい
う(添付の表1参照)。
格文法では、文の構成要素は格要素と呼ばれ、格と格要
素の整合性によって文の適格性を判断する。例えば、先
の文章では、”log on”が述語で、Huser”
は動作主格、”the 5ysLe+n”は対象格、−
apassword”は道具格の機能を持つ。各々の動
詞には格フレームと呼ばれる枠組みが付けられていて、
各々の動詞が持つ格とそれに対する格要素の制約条件が
記述される。。
格文法では、格に許容される格要素が規定されており、
これに違反する入力は意味的に不適切であるとして棄却
されていたが、実際の言語現象では意味的に受は入れら
れる文とそうでない文の境界は微妙であり、それは文脈
にも依存する。例えば、My car drinks 
gasolins、 ”という文において、述語”dr
ink”が、動作主格として人間を表わす語彙(HUI
Jという意味的属性を持つ語彙)シか許さないとすると
、car”は”drink”の動作主格としては棄却さ
れる。しかし、この文では、”car”は比瞼的に用い
られていると考えると、“car”は”d「ink”の
動作主格として意味的に受は入れられる。
格文法のように属性値を取るシステムは知識の構築は容
易であるが、その運用の柔軟性に欠ける。
また、語紮間の統計的頻度情報を用いて構文解析木の優
先度を計算して構造的多義性を解消する手法が特開昭6
3−91776号公報に開示されている。この方法の概
要とその問題点を説明する。
(1)入力された文から複数の解析木が実際に生成され
、その中からもっともらしいものを選択する。複数の解
析木を生成することは、手間である。
また、多義性にあまり関係のない語彙の情報であっても
、使わなければならない。
(2)多義性の解消に、語彙と語彙の共起関係の統計的
頻度を使う。したがって、個別の例外は扱えない。たと
えば、ある単語AがBとCのどちらに係るか多義なとき
、統計的にはBに係ることが多いとしても、ある特定の
文章の中ではCに係るということは扱えない。また、統
計的頻度情報を得るために十分に正規化されたデータ(
“virtual■achine”を”machine
 is virtual”として登録するなど)を必要
とするため、データの収集に非常にコストがかかる。
(3)一般に、自然言語の語彙の数は膨大である。
そこで、カバーできる範囲を拡大するために単語を抽象
化したカテゴリーである意味マーカーというものを設定
しているが、これは対象分野を変えると−から作り直さ
なければならない。例えば、department”と
いう語は、ある分野Pでは、組織のカテゴリーに分類さ
れる。そして、”d6partmenじに関する係受け
の知識は、組織のカテゴリーとその他のカテゴリーの共
起関係の統計情報に吸収されてしまう。しかしながら、
別の分野Qでは、department”は、別のカテ
ゴリーに分類されるとしたなら、分野Pの知識は、分野
Qでは役にたたない。分野毎に単語を抽象化し直して、
統計情報を集め直すのは、非常にコストがかかる。
C発明の解決しようとする課題 要約すると、自然言語処理において、実用的に意味処理
を行なうには2つの問題がある。1つは、そのための知
識を大量に、しかも効率よく構築すること。もう1つは
、大量な知識を効率よく利用するメカニズムである。
本発明は、この2つの問題点を克服し、実用に耐えうる
自然言語の意味解析システムを初めて提供する事を目的
とする。
D 課題を解決するための手段 自然言語文を解析する上で、最大のボトルネックとなる
構造的多義性は、語彙間の係り受け(依存)関係が複数
考えられることから発生する。このような構造的多義性
は、文法的知識だけでは解消することができない。意味
処理が必要となる。
そこで、この問題を、語彙の依存関係をあらかじめ背景
知識として定義しておき、候補となる依存関係の中から
、背景知識に照らし合わせて、適切な依存関係を選択す
ることによって解決する。つまり、このシステムは、文
章の構文解析の結果として、係り受けの候補が複数存在
する構造が得られた場合に、背景知識として蓄えられた
語彙間の依存関係を基にして、文章中の語彙の依存関係
の優先度を求めることによって、どの係り受けがより適
切であるかを決定することができる。
したがって、本発明の自然言語解析装置は、機械翻訳シ
ステムや自然言語による質問応答システムなどの文解析
の中で適用され、構造的多義性を含む入力文に対して、
語彙間の類義関係、階層関係、依存関係の知識を用いて
、最も適切な構文木を出力するために用いられる。つま
り、文法を用いた解析では、解消できない問題、例えば
、領域に固有の知識を用いることによって、初めて一意
に決まるような多義性や、先行する文の内容に依存して
決まる多義性の解消の問題に適用される。
従来の解析法に共通しているのは、語彙があらかじめ持
つべき情報、例えば意味的な分類のためのいくつかの属
性など、が非常に豊富で、それを人間がヒユーリスティ
ックに決めている点である。
これに対し、本発明の自然言語解析に必要な情報は、か
なり形式的に記述され、新たに大量の背景知識を自動的
ないし半自動的に構築できる。それゆえ、比較的容易に
実用的なシステムを構築できる。
E 発明の構成 El システムの概略 構造的多義性の問題を解決するために、まず知識を、語
彙間の類義関係、階層関係、依存関係を表わす木構造で
表現する。文章が入力されたら、多義な係り受けに関し
て、背景知識に定義されている語彙間の依存関係を、類
義関係や階層関係を利用して探索し、文章から得られる
制約と、文脈から得られる制約を用いて、最適な係り受
けを選択することによって、多義性を解消する。確定さ
れた依存構造は、文脈依存関係データとして、知識ベー
スに登録される。システムの全体構成は第1図に示す通
りである。
次に、このシステムの、各々の構成要素について説明す
る。以下に示す例では全て英文を用いているが、本手法
は特定の言語には依存しない。
El−1構文解析器 文章を受は取り、多義性を内包した統語構造を出力する
文+VM/SP  keeps  the  info
rmation  on  thevirtual d
isk、”は、構文解析され、第2図のまうな係り受け
の多義性を内包した句構造が生成される。構文解析技術
は本発明に含まれないので、説明は省略する。
El−2依存構造解析器 (1)依存構造生成部 句構造を、第3図のような語彙間の依存関係が明示的に
表現された依存構造に変換する。ここで、句構造の係り
受けの多義性は、語紮間の依存関係の多義性として表現
される。また、語彙間の依存関係には、深層格に相当す
るラベルが付けられる。
これは、表層の語順や前置詞を手がかり決められ、可能
な深層格の候補のリストとして表わされる。
(2)依存関係抽出部 生成された依存構造から、第4図のような多義な依存関
係を抽出する。これは、一つの多義性に関して、複数の
可能な依存関係の候補として表わされる。
(3)依存関係選択部 これは、可能な依存関係の候補に対して、それに相当す
る関係を背景知識の中で探索する装置であり、複数候補
に関係が見いだされた場合は、どの関係がより確からし
いかを制約条件を用いて決定する。これに関しては、後
で詳細を説明する。
(4)依存構造変形部 各多義性に関して、最も確からしい依存関係が選択され
、それに従って依存構造を変形し、構造的多義性を解消
する。このとき、依存関係に付けられた深層格も一意に
決められる。 依存関係解析器の出力は、多義性の解消
された文の依存構造であり、その確定された依存関係は
、それ以降の文を解析するための制約となるため、文脈
依存関係データとして知識ベースに登録される。
このシステムの特徴は、半自動的に構築される知識ベー
スと、知識ベースを用いて最良の依存関係を選択するメ
カニズムである。次に、それらを順に説明する。
E2 知識ベースの構築 本実施例では、用語解説書のような、語常に関する情報
を集めたものから、ある語彙と別の語彙との間の関係、
つまり、類義関係、階層関係、依存関係を抽出する。こ
れらの関係が、知識ベースを構成する。
知識の表現形式としては、次のような理由から木構造を
採用した。
(1)文章を解析することによって、半自動的に構築で
きる。
(2)階層関係、依存関係を表現するのに適している。
類義関係は、後で述べるように2つの階層関係に変換す
る。
(3)依存関係解析のための推論は、基本的に木構造の
枝を上にたどる手続きである。知識ベースには、文章か
ら得られた依存構造、また依存構造を変換して得られた
階層関係を表わす木構造が集められる。すなわち、知識
ベースは、木構造の集合体である。
従来の自然言語処理システムでは、知識ベースは、文章
解析に必要な情報が定式化されていないこともあって、
フレームなどの比較的何でも表現できる形式が好まれて
いた。しかし、フレーム表現は体系的に構築するのが困
難で、人間に依存した部分が多い。そのため、知識ベー
スを大規模化するための労力が大変なものになる。
本システムの知識ベースは、ボトムアップ式に構築する
ことが可能であり、大規模化することが容易である。さ
らに構造的多義性という問題の性質にもよく適合してい
る。
もちろん、先ず学習によって、知識を与える必要がある
。知識ベースのデータは、用語解説文を解析し、依存構
造を生成し、それを変換することによって作られる。 
以下にその手順を述べる。
(1)文章から、構文解析器を用いて、句構造を生成し
、それを語彙間の係り受は関係が明確となる依存構造に
変換する。学習段階においては、多義な係り受は関係は
人間が決定し、構造を特定する。
例えば、文+Operating system 5t
ores files onthe disk、“から
、第5図のような句構造が生成される。 これを、第6
図のような依存構造に変換する。これは、依存関係解析
器の依存構造生成部によって行われる。
(2)第7図に示されるように、詔書間の依存関係を表
わすリンクには、深層格のラベル(agent、 pa
tienL 1ocation)が属性として付加され
る。これは、多義性解消のときの制約条件の一つとなる
このラベルは、学習段階においては、依存構造生成部に
よって、その候補が付けられた後で、人間によって一意
に決められる。
(3)−A  is  a  B、+や+A  is 
 a  synonygg  for  B、−などの
語彙間の階層(上位/下位)関係や類義関係を表わす文
から得られた依存構造は、isaというラベルのついた
リンクでAとBが繋がれた構造に変換される。この構造
をisa木と呼ぶ。第8図と第9図にその例を示す。
E3 最尤な依存関係の選択 最尤な依存関係を選択するために、本システムでは、(
1)各々の依存関係に対応するパスを知識ベースにおい
て探索しくパス・サーチ)、(2)各々のパスに対して
依存距離と呼ばれる値を、制約条件に基づいて計算する
(距離計算)、という新しい方式を用いる。そして、最
短な依存距離を持つパスに対応する依存関係を、最尤な
ものとして選択する。これは、依存関係解析器の依存関
係選択部によって行われる。
パス・サーチは、まず語彙と詔書の共起関係を用いて、
膨大な知識中の探索空間を限定する。自然言語において
1つの語彙が生起する確率は非常に小さく、2語の共起
が実際に生じている知識は非常に少なくなる。そのため
、実際上、計算の負荷が最も大きい距離の計算の対象と
なるものは、非常に小さくなり、結果として非常に効率
的な探索となる。
以下に、パス・サーチと距離計算に関して述べる。
(1)パス・サーチ パスとは、2つの詔書に関して、各々の詔書の類義語、
上位語の連鎖と、連鎖の終端の詔書間の依存関係を合わ
せたものであり、知識ベースを、語彙を節点としたグラ
フと考えたときの、語彙間の一つの経路である。例えば
、語彙”l<sep”と”virtual disk”
の間の一つのパスは第10図のようになる。
知識ベースにおいて、パスを探索するために、次のよう
なアルゴリズムを考案した。このアルゴリズムは、添付
の表2のようなインデックス・テーブルを利用する。
ここで、テーブル中のtxは、その詔書の現われる木の
ポインターを表わし、かっこの値は、その木における、
その飴業の位置を表わす(第11図参照)。
isaなどの枝につけられたラベルは、常に下位の節点
の属性として付けられているため、isa木のコラムに
あるポインターは、その語彙がisaの枝の下位に現わ
れる木を指している。ここで、テーブル(表2)から、
語彙aはisa木10の(0)の位置にあり、語彙すは
同じ木toの0の位置にあることが分かる。すなわち、
第12図のようになっている。
ここで、bが8の類義語あるいは上位語であることは、
tO(0)を一つ上にたどることによって分かる。この
ようにして、テーブルの語彙すのisa木のコラムを見
れば、aとisaのついた枝でつながれた語彙はすべて
分かる。bについても同様に、isa木を一段たどって
、類義語・上位語が分かる。このようにして、aの類義
語・上位語の連鎖が、いくつかできる。
今、PはQの上位語であり、QはRの上位語であるとし
よう。このとき、isa木は、二本できる。
そして、本発明では、Rの上位語を知るために、Rがテ
ーブルに入力されたなら、まず−本のisa木を使って
Rの直接の上位語Qを知り、次にもう一本のisa木を
使ってQの直接の上位語Pを知る事によって、Rの上位
語を全て知るようにする。
上の例では、isa木は、上位語と下位語の二つのみを
含む。したがって、テーブルに入力された語を下位語と
して含むisa木の識別データが重要であり、その木の
中での下位語の位置情報は必須ではないことに注意され
たい。
他の例では、1本のisa木が上記P、Q、Rを含む事
も可能である。その場合には、テーブルに入力された語
を下位語として含むisa木の識別データのみならず、
その木の中での下位語の位置情報も必須となることに注
意されたい。
次に、2つの語彙の間のパスを探索するためには、各々
の類義語・上位語の連鎖のいずれかに登場する語彙の間
に依存関係が存在するかどうかを調べる必要がある。そ
れは、一方の連鎖に含まれる語彙の含まれる依存構造木
の集合と、他方のそれとの間に共通のものがあり、さら
にその木において、各々の語彙の間に依存関係あるいは
依存関係の推移があるかどうかを調べることに相当する
依存構造木において、2つの詔書のその木における位置
から、詔書間に依存関係あるいはその推移があるかどう
かが分かる。
例えば、語彙すに、語彙dが係るような依存関係は、b
の含まれる依存構造木の集合(t30(1)、 111
0(0))とdの含まれる依存構造木の集合(t40(
10)。
tllo(010))の間の共通要素t110における
bの位置(0)とdの位置(010)から、bはdの先
祖(ancestor)であることから、bとdの間に
依存関係の推移があることが分かる(第13図参照)。
木構造においては、節点aが、節点すの先祖であるとき
、bからaへの経路は一意に決まるので、依存関係を見
いだすことと、位置関係を調べることは等価であると見
なされる。 語彙の間のパスは、各々の全ての類義語・
上位語連鎖をisa木から求め、連鎖に含まれる語彙の
含まれる依存構造木の集合の共通要素を求め、その木に
おける語彙の位置関係を調べることで、その存在の有無
が分かり、依存関係の存在する木をたどることによって
、求められる。例えば、語彙aとCの間の一つのパスは
、第14図のようになる。
(2)依存距離計算 パスには、いくつかの制約条件が考えられ、それによっ
て詔書間の依存関係の近さを計算することができる。詔
書間の依存関係の近さの度合を表わす尺度を依存距離と
呼ぶ。依存距離は、パスに含まれる枝(依存関係)の数
と制約を評価した結果得られる値に基づいて決定される
制約条件は、大きく分けて3種類が考えられる。
一つは、枝につけられた深層格のラベルが、候補となる
係り受けにおいて可能な関係(ある語彙が、ある述語に
主語として係るとか、目的語として係るなど)に対応し
ているかどうか、という制約である。例えば、”VM/
SP keeps the ir+4ormation
 。
n the virtual disk、”という文で
、第15図のような依存関係から、第16図のようなパ
スが得られたとする。このとき、”keep”と”vi
rtual disk−の間の表層格(文章から直接得
られる格)と、“st。
「e”と”disk”の間の深層格の間に整合がとられ
ていなければならない。ここで、表層格Onは場所を表
わす深層格1ocationを持つ場合があるので、依
存関係とパスの間で格の整合性は保たれている。
このように、依存関係とパスの間の格関係の整合がとれ
ていれば、パスの格制約の値は1、さもなくば0になる
。この場合のパスの格制約の値は1である。
もう一つは、共起関係、すなわち同じ文の興なる位置に
現われている語彙との関係に関する制約で、例えば、あ
る詔書が、ある述語に目的語として係る場合に、その述
語の主語は、ある特定の語彙か、あるいはその類義語・
上位語である、という制約である。
先の例では、第17図のように、”VM/SP”が“k
eep”の主語(subject)になっている。一方
、パスは、第18図のような知識ベースの依存構造木か
ら得られたものとすると、第19図の共起関係が見つか
り、  operating system″が5to
re”の行偽者(agent)であることが分かる。ま
た、第20図のような”VM/SP”と”operat
ing system”との階層関係がやはり知識とし
て定義されていれば、第21図のように、パスと文章の
間で、語彙の共起に関する整合がとれていることが分か
る。ここで、表層格5ubjectは深層格agen 
tを持ちうるので、格についても整合がとれている。こ
のように、共起の整合がとれているものく語票と格が同
時に対応しているもの)の数が、共起制約の値となる。
この場合のパスの共起制約の値は1である。(主語以外
の共起に関する整合はとれていない、) 3つめの制約は、文脈に関する制約であり、パス上に現
われた詔書間の依存関係がすでに前文までの文脈に現わ
れている場合、その依存関係は、その文脈で強く支持さ
れてると考えられるので、そのパス上の依存関係の互層
が近くなる、という制約である。
例えば、先の例の文に先行する文として、“InVM/
SP、 the data is 5tored on
 the storage device、”という文
があった場合、第22図のような依存構造が知識ベース
の文脈データとして、登録されていることになる。(こ
こでの、objectは深層格ではなく、目的語を表わ
す表層格である。)このとき、パスに現われた依存関係
5tore4−diskの”5tore”と”disk
“の間で、知識ベースの類義・階層関係と文脈の依存関
係を用いて、パス・サーチを行なうと、第23図のよう
なパスが見つかり、”5tore”と”disk”の依
存関係が文脈において規定されていることが分かる。こ
のように、パスに含まれる依存関係のうち文脈おいて依
存関係が規定されているものの数が、文脈制約の値とな
る。この場合は、パスに含まれる依存関係は一つである
ので、パスの文脈制約の値は1になる。
依存距離の値は、以上の制約の値と、パスに含まれる依
存関係の数を用いて計算される。すなわち、次のような
式で計算される。
依存関係数十文脈制約値X (rrl)依存距離=−−
−−−一−−−−−−−−−−−−−−−−−−−−−
m−(格制約値+1)×(共起制約値+1)この式は、
格制約と共起制約はパス全体に、文脈制約はパスに含ま
れる個々の依存関係に、それぞれ影響することを反映し
ている。ここで、nは0<n〈1である実数で、文脈を
どの程度重要視するかを表わす、ヒユーリスティックに
決められるパラメータである。上の例のパスの依存距離
は、依存関係数1、格制約値1、共起制約値1、文脈制
約値1より、0.125になる(n=0.5)。
E4 知識ベースへの登録 最尤であると判断された依存構造は、知識ベースに登録
され、後に入力される文の構造的多義性の解消に利用さ
れる。判断結果は、文脈に依存する度合いが高いので、
学習データと区別するために、文脈依存関係データとし
て、別個に登録するのが好ましい(第1図参照)。具体
的には、第7図の様な依存構造と深層格の情報を蓄積す
る知識ベースと、表2の右半分のみのインデックス・テ
ーブルが、文脈依存関係データのために分野毎に用意さ
れる。そして、最尤の依存関係が決定されると、それを
反映するデータが知識ベースとインデックス・テーブル
に追加される。既登録の依存構造と照合する事により、
重複登録は避けるようにしてもよい。
このようにして、知識を自動的に増加することが可能に
なる。厳密には、人間の介入を要する場面もあるので、
自動的とは言えなくても、少なくとも半自動的には知識
は増加する。
国 = ベ 単′讐 ≦ 天   I べ 事′誓 F 効果 本発、明によれば、自然言語における構造的多犠牲解消
のための知識を大量に、且効率よく構築することが可能
になる。更に、大量の知識を効率よく利用することも可
能になる。
【図面の簡単な説明】
第1図は、本発明による自然言語解析用システムの構成
の説明図である。 第2図は、多義性を含む句構造の説
明図である。 第3図は、多義性を含む依存構造の説明
図である。 第4図は、可能な依存構造の候補の説明図
である。 第5図は、句構造の一例の説明図である。 
第6図は、依存構造の一例の説明図である。 第7図は
、依存構造と深層格の説明図である。 第8図は、階層
関係の説明図である。 第9図は、類義関係の説明図で
ある。 第10図は、パスの説明図である。 第11図は、依存構造木における簡素の位置の説明図で
ある。 第12図は、isa木の説明図である。 第1
3図は、依存関係の推移の説明図である。 第14図は
、語*cから簡素aへのパスの説明図である。 第15
図は、keepとvirtual diskの間の依存
関係の説明図である。 第16図は、virtual 
diskからkeepへのパスの説明図である。 第17図は、共起関係の説明図である。 第18図は、
知識ベース中の依存構造の説明図である。 第19図は、知識ベース中の共起関係の説明図である。  第20図は、知識ベース中の階層関係の説明図である
。 第21図は、パスと文の間の共起関係に関する説明
図である。 第22図は、文脈データの依存構造の説明
図である。 第23図は、文脈データにおけるパスの説
明図である。 出願人 インターナショナル・ビジネス・マシーンズ・
コーポレーション 代理人 弁理士 頓宮 孝−(外1名)入力文 ↓ ↓ 多義性を含む句構造 ↓ information ↑ vIrtual disk keep ↑ virtual disk 第4図 5tore / ↑\ +C)Is  Is  an  operating 
 5yste++、−operating syste
m isa privileged prograw+isa authorizedprogrB− authorized programisa privileged  program第9図 類#1語 keep→5tore ↑依存関係 tx  →  00 /↑\ 0(0)○(1)○(2) ↑    / \ t。 ↑ b(0) 7 \ d to 10) t++e → Q ↑ to→b(Oン isa↑\ ↑ keep←virtualdisk 第f 5fgJ 5a keep→5tore tore 2 千 − agent  pstient  locationa
gentlocation operating system−→5tore←−
−disk第19図 V14/SP→operating system第2
0r!!j agent   location operating system −−→5tore
←−diskTisa       Ti5a    
Ti5aV)l/SP−一→keep←−−virtu
al disksubject      on ← ← パス 文章 tore / ↑ \ in   object  on / \ on           isa store(−storage device+−di
sk第28WJ

Claims (27)

    【特許請求の範囲】
  1. (1)(a)文の中での語彙の依存関係を表わす第一種
    の木及び語彙の階層関係を表す第二種の木を蓄積する知
    識ベース手段、 (b)語彙の入力に応答して、該語彙の現れる第一種の
    木の識別データ及び該第一種の木の中での該語彙の位置
    データ並びに該語彙を下位語として含む第二種の木の識
    別データを出力するためのテーブル手段、 (c)入力された文の構造的一義性を判定する手段、 (d)構造的に多義的であると判定された文については
    、複数の可能な依存関係の各々について、修飾語と被修
    飾語のペアを抽出する手段、 (e)ペア毎に、ペアを構成する語彙をテーブル手段に
    入力し、出力データに基づいて、該語彙を両端とし、か
    つ第一種の木に現れる語彙の一部を含んでなるパスを決
    定する手段、 (f)ペア毎に距離を計算する手段、及び (g)ペア毎に求まった距離に基づいて、最尤の依存関
    係を決定する手段 を具備する自然言語解析装置。
  2. (2)(h)上記手段(g)によって決定された最尤の
    依存関係を含む入力文に関する第一種の木を上記知識ベ
    ース手段(a)に蓄積し、且つこれに応じて上記テーブ
    ル手段(b)を更新する手段を具備する請求項1記載の
    自然言語解析装置。
  3. (3)上記知識ベース手段(a)は、学習データと上記
    手段(h)の追加する文脈データとを区別して蓄積する
    請求項2記載の自然言語解析装置。
  4. (4)上記テーブル手段(b)は、学習データ用と文脈
    データ用とに分れている請求項2記載の自然言語解析装
    置。
  5. (5)上記手段(f)は、パスに含まれる依存関係の数
    にしたがって距離を計算する請求項1記載の自然言語解
    析装置。
  6. (6)上記第一種の木には、依存関係毎に深層格のデー
    タが与えられている請求項1記載の自然言語解析装置。
  7. (7)上記手段(f)は、修飾語と被修飾語の候補の間
    の格関係とパスの格関係との整合性にしたがって距離を
    計算する請求項6記載の自然言語解析装置。
  8. (8)上記手段(f)は、入力された文に含まれる語彙
    とパスを含む第一種の木に含まれる語彙の共起に関する
    整合性にしたがって距離を計算する請求項1記載の自然
    言語解析装置。
  9. (9)上記手段(f)は、パスと上記手段(h)によっ
    て追加された第一種の木との一致度にしたがって距離を
    計算する請求項1記載の自然言語解析装置。
  10. (10)上記第二種の木は上位語と下位語に相当する二
    つのノードのみを持つisa木であり、上記手段(e)
    は、ペアを構成する語彙の上位語が出力されたなら、更
    にその上位語を下位語として含むisa木を探すことを
    繰返すことにより、上位語の連鎖を出力する請求項1記
    載の自然言語解析装置。
  11. (11)類義関係を二本のisa木で表わす請求項1記
    載の自然言語解析装置。
  12. (12)文の中での語彙の依存関係を表す第一種の木及
    び語彙の階層関係を表す第二種の木を蓄積する知識ベー
    スと、語彙の入力に応答して、該語彙の現れる第一種の
    木の識別データ及び該第一種の木の中での該語彙の位置
    データ並びに該語彙を下位語として含む第二種の木の識
    別データを出力するためのテーブルとを備えたコンピュ
    ータ・システムにおいて、 (a)入力された文の構造的一義性を判定するステップ
    、 (b)構造的に多義的であると判定された文については
    、複数の可能な依存関係の各々について、修飾語と被修
    飾語のペアを抽出するステップ、(c)ペア毎に、ペア
    を構成する語彙をテーブルに入力し、出力データに基づ
    いて、該語彙を両端とし、かつ第一種の木に現れる語彙
    の一部を含んでなるパスを決定するステップ、 (d)ペア毎に距離を計算するステップ、及び(e)ペ
    ア毎に求まった距離に基づいて、最尤の依存関係を決定
    するステップ を具備する自然言語解析方法。
  13. (13)(f)上記ステップ(e)によって決定された
    最尤の依存関係を含む入力文に関する第一種の木を上記
    知識ベースに蓄積し、且つこれに応じて上記テーブルを
    更新するステップを具備する請求項12記載の自然言語
    解析方法。
  14. (14)上記知識ベースは、学習データと上記ステップ
    (f)で追加される文脈データとを区別して蓄積する請
    求項13記載の自然言語解析方法。
  15. (15)上記テーブルは、学習データ用と文脈データ用
    とに分れている請求項13記載の自然言語解析方法。
  16. (16)上記ステップ(d)では、パスに含まれる依存
    関係の数にしたがって距離を計算する請求項12記載の
    自然言語解析方法。
  17. (17)上記第一種の木には、依存関係毎に深層格のデ
    ータが与えられている請求項12記載の自然言語解析方
    法。
  18. (18)上記ステップ(d)では、修飾語と被修飾語の
    候補の間の格関係とパスの格関係との整合性にしたがっ
    て距離を計算する請求項17記載の自然言語解析方法。
  19. (19)上記ステップ(d)では、入力された文に含ま
    れる語彙とパスを含む第一種の木に含まれる語彙の共起
    に関する整合性にしたがって距離を計算する請求項12
    記載の自然言語解析方法。
  20. (20)上記ステップ(d)では、パスと上記ステップ
    (f)によって追加された第一種の木との一致度にした
    がって距離を計算する請求項12記載の自然言語解析方
    法。
  21. (21)上記第二種の木は上位語と下位語に相当する二
    つのノードのみを持つisa木であり、上記ステップ(
    c)は、ペアを構成する語彙の上位語が出力されたなら
    、更にその上位語を下位語として含むisa木を探すこ
    とを繰返すことにより、上位語の連鎖を出力する請求項
    12記載の自然言語解析方法。
  22. (22)類義関係を二本のisa木で表わす請求項12
    記載の自然言語解析方法。
  23. (23)(a)文の中での語彙の依存関係を表す木を蓄
    積する知識ベースを設け、 (b)上記知識ベースを用いて入力文の複数の可能な依
    存関係の中から最尤の依存関係を決定し、(c)決定さ
    れた最尤の依存関係を含む入力文に関する木を上記知識
    ベースに蓄積する 自然言語解析用の知識ベース構築方法。
  24. (24)上記知識ベースは、学習データと上記ステップ
    (c)で追加される文脈データとを区別して蓄積する請
    求項23記載の自然言語解析用の知識ベース構築方法。
  25. (25)(a)文の中での語彙の依存関係を表す木を蓄
    積する知識ベース、及び語彙の入力に応答して、該語彙
    の現れる木の識別データ及び該木の中での該語彙の位置
    データを出力するためのテーブルを設け、 (b)上記知識ベース及び上記テーブルを用いて入力文
    の複数の可能な依存関係の中から最尤の依存関係を決定
    し、 (c)決定された最尤の依存関係を含む入力文に関する
    木を上記知識ベースに蓄積し、且つこれに応じて上記テ
    ーブルを更新する自然言語解析用の知識ベース構築方法
  26. (26)上記知識ベースは、学習データと上記ステップ
    (c)で追加される文脈データとを区別して蓄積する請
    求項25記載の自然言語解析用の知識ベース構築方法。
  27. (27)上記テーブルは、学習データ用と文脈データ用
    とに分れている請求項25記載の自然言語解析用の知識
    ベース構築方法。
JP15557090A 1990-06-15 1990-06-15 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 Expired - Fee Related JP3266246B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP15557090A JP3266246B2 (ja) 1990-06-15 1990-06-15 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US07/714,408 US5424947A (en) 1990-06-15 1991-06-12 Natural language analyzing apparatus and method, and construction of a knowledge base for natural language analysis
EP19910305412 EP0467527A3 (en) 1990-06-15 1991-06-14 Natural language apparatus and method and construction of a knowledge base for natural language analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15557090A JP3266246B2 (ja) 1990-06-15 1990-06-15 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法

Publications (2)

Publication Number Publication Date
JPH0447364A true JPH0447364A (ja) 1992-02-17
JP3266246B2 JP3266246B2 (ja) 2002-03-18

Family

ID=15608932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15557090A Expired - Fee Related JP3266246B2 (ja) 1990-06-15 1990-06-15 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法

Country Status (3)

Country Link
US (1) US5424947A (ja)
EP (1) EP0467527A3 (ja)
JP (1) JP3266246B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332940A (ja) * 1993-05-25 1994-12-02 A T R Jido Honyaku Denwa Kenkyusho:Kk 用例主導型自然言語解析装置
JP2007159195A (ja) * 2005-12-01 2007-06-21 Kokusan Denki Co Ltd モータ
JP2015043163A (ja) * 2013-08-26 2015-03-05 日本電信電話株式会社 係り受け関係解析パラメータ学習装置、係り受け関係解析装置、方法、及びプログラム

Families Citing this family (262)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
JP2821840B2 (ja) * 1993-04-28 1998-11-05 日本アイ・ビー・エム株式会社 機械翻訳装置
JPH07182465A (ja) * 1993-12-22 1995-07-21 Hitachi Ltd 文字認識方法
CA2148028A1 (en) * 1994-05-25 1995-11-26 Deborah L. Mcguinness Knowledge base management system with dependency information for procedural tests
JPH0869470A (ja) * 1994-06-21 1996-03-12 Canon Inc 自然言語処理装置及びその方法
US5799268A (en) * 1994-09-28 1998-08-25 Apple Computer, Inc. Method for extracting knowledge from online documentation and creating a glossary, index, help database or the like
US5682539A (en) * 1994-09-29 1997-10-28 Conrad; Donovan Anticipated meaning natural language interface
JP2855409B2 (ja) * 1994-11-17 1999-02-10 日本アイ・ビー・エム株式会社 自然言語処理方法及びシステム
US5887120A (en) 1995-05-31 1999-03-23 Oracle Corporation Method and apparatus for determining theme for discourse
US5983169A (en) * 1995-11-13 1999-11-09 Japan Science And Technology Corporation Method for automated translation of conjunctive phrases in natural languages
JP2987099B2 (ja) * 1996-03-27 1999-12-06 株式会社日立国際ビジネス 文書作成支援システム及び用語辞書
US5848386A (en) * 1996-05-28 1998-12-08 Ricoh Company, Ltd. Method and system for translating documents using different translation resources for different portions of the documents
US5966686A (en) * 1996-06-28 1999-10-12 Microsoft Corporation Method and system for computing semantic logical forms from syntax trees
US5878385A (en) * 1996-09-16 1999-03-02 Ergo Linguistic Technologies Method and apparatus for universal parsing of language
US5841895A (en) * 1996-10-25 1998-11-24 Pricewaterhousecoopers, Llp Method for learning local syntactic relationships for use in example-based information-extraction-pattern learning
US5991712A (en) * 1996-12-05 1999-11-23 Sun Microsystems, Inc. Method, apparatus, and product for automatic generation of lexical features for speech recognition systems
US6076051A (en) * 1997-03-07 2000-06-13 Microsoft Corporation Information retrieval utilizing semantic representation of text
US5822743A (en) * 1997-04-08 1998-10-13 1215627 Ontario Inc. Knowledge-based information retrieval system
US5991710A (en) * 1997-05-20 1999-11-23 International Business Machines Corporation Statistical translation system with features based on phrases or groups of words
US6016467A (en) * 1997-05-27 2000-01-18 Digital Equipment Corporation Method and apparatus for program development using a grammar-sensitive editor
US5930788A (en) * 1997-07-17 1999-07-27 Oracle Corporation Disambiguation of themes in a document classification system
US6138085A (en) * 1997-07-31 2000-10-24 Microsoft Corporation Inferring semantic relations
US6098033A (en) * 1997-07-31 2000-08-01 Microsoft Corporation Determining similarity between words
US6098042A (en) * 1998-01-30 2000-08-01 International Business Machines Corporation Homograph filter for speech synthesis system
EP0962873A1 (en) * 1998-06-02 1999-12-08 International Business Machines Corporation Processing of textual information and automated apprehension of information
EP1026604A4 (en) * 1998-08-18 2006-04-19 Mitsubishi Electric Corp OBJECT DATA ACCESS DEVICE, OBJECT DATA ACCESS PROCEDURE, AND COMPUTER READABLE RECORDING MEDIA CONTAINING RECORDED DATA
US6499013B1 (en) * 1998-09-09 2002-12-24 One Voice Technologies, Inc. Interactive user interface using speech recognition and natural language processing
US6167370A (en) * 1998-09-09 2000-12-26 Invention Machine Corporation Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
DE19910621C2 (de) 1999-03-10 2001-01-25 Thomas Poetter Vorrichtung und Verfahren zum Verbergen von Informationen und Vorrichtung und Verfahren zum Extrahieren von Informationen
US6405211B1 (en) 1999-07-08 2002-06-11 Cohesia Corporation Object-oriented representation of technical content and management, filtering, and synthesis of technical content using object-oriented representations
JP2001051997A (ja) * 1999-08-11 2001-02-23 Sony Corp 文書データ作成装置、文書データ作成方法、及び記録媒体
US7233891B2 (en) * 1999-08-24 2007-06-19 Virtural Research Associates, Inc. Natural language sentence parser
JP2001075957A (ja) * 1999-08-24 2001-03-23 Internatl Business Mach Corp <Ibm> 自然言語構造の表示方法及び装置
US6876991B1 (en) 1999-11-08 2005-04-05 Collaborative Decision Platforms, Llc. System, method and computer program product for a collaborative decision platform
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7120574B2 (en) * 2000-04-03 2006-10-10 Invention Machine Corporation Synonym extension of search queries with validation
US20020016707A1 (en) * 2000-04-04 2002-02-07 Igor Devoino Modeling of graphic images from text
US7962326B2 (en) * 2000-04-20 2011-06-14 Invention Machine Corporation Semantic answering system and method
WO2001082125A1 (en) * 2000-04-25 2001-11-01 Invention Machine Corporation, Inc. Creation of tree-based and customized industry-oriented knowledge base
AU2001271891A1 (en) * 2000-07-07 2002-01-21 Criticalpoint Software Corporation Methods and system for generating and searching ontology databases
US6732097B1 (en) 2000-08-11 2004-05-04 Attensity Corporation Relational text index creation and searching
US6741988B1 (en) 2000-08-11 2004-05-25 Attensity Corporation Relational text index creation and searching
US7171349B1 (en) 2000-08-11 2007-01-30 Attensity Corporation Relational text index creation and searching
US6738765B1 (en) 2000-08-11 2004-05-18 Attensity Corporation Relational text index creation and searching
US6732098B1 (en) 2000-08-11 2004-05-04 Attensity Corporation Relational text index creation and searching
US6728707B1 (en) 2000-08-11 2004-04-27 Attensity Corporation Relational text index creation and searching
US6461166B1 (en) 2000-10-17 2002-10-08 Dennis Ray Berman Learning system with learner-constructed response based testing methodology
US7146308B2 (en) * 2001-04-05 2006-12-05 Dekang Lin Discovery of inference rules from text
US7734459B2 (en) * 2001-06-01 2010-06-08 Microsoft Corporation Automatic extraction of transfer mappings from bilingual corpora
US7050964B2 (en) * 2001-06-01 2006-05-23 Microsoft Corporation Scaleable machine translation system
US9009590B2 (en) * 2001-07-31 2015-04-14 Invention Machines Corporation Semantic processor for recognition of cause-effect relations in natural language documents
US7074128B2 (en) 2001-08-03 2006-07-11 Drb Lit Ltd. Method and system for enhancing memorization by using a mnemonic display
US20070265834A1 (en) * 2001-09-06 2007-11-15 Einat Melnick In-context analysis
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
US7113905B2 (en) * 2001-12-20 2006-09-26 Microsoft Corporation Method and apparatus for determining unbounded dependencies during syntactic parsing
US7398209B2 (en) * 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7693720B2 (en) 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
EP1588277A4 (en) * 2002-12-06 2007-04-25 Attensity Corp SYSTEMS AND METHOD FOR PROVIDING A MIXING DATA INTEGRATION SERVICE
WO2004053836A1 (en) * 2002-12-10 2004-06-24 Kirusa, Inc. Techniques for disambiguating speech input using multimodal interfaces
US7357640B2 (en) * 2003-07-02 2008-04-15 Drb Lit Ltd. Lock-In Training system
US7813916B2 (en) 2003-11-18 2010-10-12 University Of Utah Acquisition and application of contextual role knowledge for coreference resolution
TWM249950U (en) * 2004-01-02 2004-11-11 Cvc Technologies Inc Cap tightening machine capable of controlling tightening torque
CN1934570B (zh) * 2004-03-18 2012-05-16 日本电气株式会社 文本挖掘装置和其方法
US7364432B2 (en) * 2004-03-31 2008-04-29 Drb Lit Ltd. Methods of selecting Lock-In Training courses and sessions
US7702500B2 (en) * 2004-11-24 2010-04-20 Blaedow Karen R Method and apparatus for determining the meaning of natural language
FR2885712B1 (fr) 2005-05-12 2007-07-13 Kabire Fidaali Dispositif et procede d'analyse semantique de documents par constitution d'arbres n-aire et semantique
CN101366024B (zh) * 2005-05-16 2014-07-30 电子湾有限公司 用于处理数据搜索请求的方法和系统
US8775158B2 (en) * 2005-08-04 2014-07-08 Nec Corporation Data processing device, data processing method, and data processing program
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7620549B2 (en) * 2005-08-10 2009-11-17 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US7949529B2 (en) 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
WO2007027989A2 (en) 2005-08-31 2007-03-08 Voicebox Technologies, Inc. Dynamic speech sharpening
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7633076B2 (en) 2005-09-30 2009-12-15 Apple Inc. Automated response to and sensing of user activity in portable devices
US8195683B2 (en) 2006-02-28 2012-06-05 Ebay Inc. Expansion of database search queries
US20090112583A1 (en) * 2006-03-07 2009-04-30 Yousuke Sakao Language Processing System, Language Processing Method and Program
US8423348B2 (en) * 2006-03-08 2013-04-16 Trigent Software Ltd. Pattern generation
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8073681B2 (en) * 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US8041730B1 (en) 2006-10-24 2011-10-18 Google Inc. Using geographic data to identify correlated geographic synonyms
US8065307B2 (en) * 2006-12-20 2011-11-22 Microsoft Corporation Parsing, analysis and scoring of document content
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US7890521B1 (en) 2007-02-07 2011-02-15 Google Inc. Document-based synonym generation
US20080221870A1 (en) * 2007-03-08 2008-09-11 Yahoo! Inc. System and method for revising natural language parse trees
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US20090024385A1 (en) * 2007-07-16 2009-01-22 Semgine, Gmbh Semantic parser
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8620662B2 (en) 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8589161B2 (en) 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US8082248B2 (en) * 2008-05-29 2011-12-20 Rania Abouyounes Method and system for document classification based on document structure and written style
US8311806B2 (en) 2008-06-06 2012-11-13 Apple Inc. Data detection in a sequence of tokens using decision tree reductions
US8738360B2 (en) 2008-06-06 2014-05-27 Apple Inc. Data detection of a character sequence having multiple possible data types
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US8583418B2 (en) 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
JP5282528B2 (ja) * 2008-11-04 2013-09-04 富士通株式会社 翻訳支援プログラム、翻訳支援装置、および翻訳支援方法
US8489388B2 (en) 2008-11-10 2013-07-16 Apple Inc. Data detection
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US20100228538A1 (en) * 2009-03-03 2010-09-09 Yamada John A Computational linguistic systems and methods
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
CN102439590A (zh) * 2009-03-13 2012-05-02 发明机器公司 用于自然语言文本的自动语义标注的系统和方法
CN101876981B (zh) * 2009-04-29 2015-09-23 阿里巴巴集团控股有限公司 一种构建知识库的方法及装置
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US9502025B2 (en) 2009-11-10 2016-11-22 Voicebox Technologies Corporation System and method for providing a natural language content dedication service
US9171541B2 (en) 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US8600743B2 (en) 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
DE112011100329T5 (de) 2010-01-25 2012-10-31 Andrew Peter Nelson Jerram Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20110239146A1 (en) * 2010-03-23 2011-09-29 Lala Dutta Automatic event generation
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10672399B2 (en) 2011-06-03 2020-06-02 Apple Inc. Switching between text data and audio data based on a mapping
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
CN103198057B (zh) * 2012-01-05 2017-11-07 深圳市世纪光速信息技术有限公司 一种自动给文档添加标签的方法和装置
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
WO2013185109A2 (en) 2012-06-08 2013-12-12 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
EP2915068A4 (en) 2012-11-02 2016-08-03 Fido Labs Inc METHOD AND SYSTEM FOR NATURAL LANGUAGE PROCESSING
US9772995B2 (en) * 2012-12-27 2017-09-26 Abbyy Development Llc Finding an appropriate meaning of an entry in a text
CN104969289B (zh) 2013-02-07 2021-05-28 苹果公司 数字助理的语音触发器
US20140249801A1 (en) * 2013-03-01 2014-09-04 The Software Shop, Inc. Systems and methods for improving the efficiency of syntactic and semantic analysis in automated processes for natural language understanding
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
KR101759009B1 (ko) 2013-03-15 2017-07-17 애플 인크. 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것
EP2973002B1 (en) 2013-03-15 2019-06-26 Apple Inc. User training by intelligent digital assistant
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
KR102057795B1 (ko) 2013-03-15 2019-12-19 애플 인크. 콘텍스트-민감성 방해 처리
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101959188B1 (ko) 2013-06-09 2019-07-02 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
WO2014200731A1 (en) 2013-06-13 2014-12-18 Apple Inc. System and method for emergency calls initiated by voice command
KR101749009B1 (ko) 2013-08-06 2017-06-19 애플 인크. 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
CN104142917B (zh) * 2014-05-21 2018-05-01 北京师范大学 一种用于语言理解的层次语义树构建方法及系统
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
CN107003996A (zh) 2014-09-16 2017-08-01 声钰科技 语音商务
WO2016044321A1 (en) 2014-09-16 2016-03-24 Min Tang Integration of domain information into state transitions of a finite state transducer for natural language processing
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
CN107003999B (zh) 2014-10-15 2020-08-21 声钰科技 对用户的在先自然语言输入的后续响应的系统和方法
US10614799B2 (en) 2014-11-26 2020-04-07 Voicebox Technologies Corporation System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
JP6070809B1 (ja) * 2015-12-03 2017-02-01 国立大学法人静岡大学 自然言語処理装置及び自然言語処理方法
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10191899B2 (en) 2016-06-06 2019-01-29 Comigo Ltd. System and method for understanding text using a translation of the text
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
WO2018023106A1 (en) 2016-07-29 2018-02-01 Erik SWART System and method of disambiguating natural language processing requests
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
CN107784088A (zh) * 2017-09-30 2018-03-09 杭州博世数据网络有限公司 基于知识点连接关系的知识图谱构建方法
US10956670B2 (en) 2018-03-03 2021-03-23 Samurai Labs Sp. Z O.O. System and method for detecting undesirable and potentially harmful online behavior
WO2021251972A1 (en) * 2020-06-11 2021-12-16 Hitachi, Ltd. Method to improve probability calculation of knowledge base construction
CN112036151B (zh) * 2020-09-09 2024-04-05 平安科技(深圳)有限公司 基因疾病关系知识库构建方法、装置和计算机设备
CN117648933B (zh) * 2024-01-29 2024-05-03 杭州智芯科微电子科技有限公司 基于深度学习和知识库的自然语言歧义消解方法和系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57201958A (en) * 1981-06-05 1982-12-10 Hitachi Ltd Device and method for interpretation between natural languages
JPS61105671A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 自然言語処理装置
US4887212A (en) * 1986-10-29 1989-12-12 International Business Machines Corporation Parser for natural language text
JP2664915B2 (ja) * 1988-01-12 1997-10-22 株式会社日立製作所 情報検索システム
JPH0242572A (ja) * 1988-08-03 1990-02-13 Hitachi Ltd 共起関係辞書生成保守方法
NL8900247A (nl) * 1989-02-01 1990-09-03 Bso Buro Voor Systeemontwikkel Werkwijze en stelsel voor het weergeven van meervoudige analyses in een afhankelijkheidsgrammatica, alsmede ontleed-inrichting voor het genereren van een dergelijke weergave.
NL8900587A (nl) * 1989-03-10 1990-10-01 Bso Buro Voor Systeemontwikkel Werkwijze voor het bepalen van de semantische verwantheid van lexicale componenten in een tekst.

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332940A (ja) * 1993-05-25 1994-12-02 A T R Jido Honyaku Denwa Kenkyusho:Kk 用例主導型自然言語解析装置
JP2007159195A (ja) * 2005-12-01 2007-06-21 Kokusan Denki Co Ltd モータ
JP2015043163A (ja) * 2013-08-26 2015-03-05 日本電信電話株式会社 係り受け関係解析パラメータ学習装置、係り受け関係解析装置、方法、及びプログラム

Also Published As

Publication number Publication date
EP0467527A2 (en) 1992-01-22
US5424947A (en) 1995-06-13
JP3266246B2 (ja) 2002-03-18
EP0467527A3 (en) 1993-07-21

Similar Documents

Publication Publication Date Title
JPH0447364A (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US10296584B2 (en) Semantic textual analysis
Liu et al. Discourse representation structure parsing
US6101492A (en) Methods and apparatus for information indexing and retrieval as well as query expansion using morpho-syntactic analysis
US5528491A (en) Apparatus and method for automated natural language translation
JP3196868B2 (ja) テキストをインデックス及び検索するための関連ワード形態の限定状態トランスジューサ
US20030004706A1 (en) Natural language processing system and method for knowledge management
KR101136007B1 (ko) 문서 감성 분석 시스템 및 그 방법
JP2012520528A (ja) 自然言語テキストの自動的意味ラベリングのためのシステム及び方法
KR20170106308A (ko) 어노테이션 보조 장치 및 그것을 위한 컴퓨터 프로그램
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
KR20040111715A (ko) 검색 시스템에 사용하기 위해 텍스트 문서로부터 정보를검색하기 위한 자기 학습 시스템의 합성 방법
JP2000315216A (ja) 自然言語検索方法および装置
KR20050032937A (ko) 언어분석 기반 자동 질문/정답 색인 방법과 그 질의응답방법 및 시스템
JP2006164293A (ja) 自動自然言語翻訳
GB2375859A (en) Search engine systems
JP2609173B2 (ja) 用例主導型機械翻訳方法
ElSayed An Arabic natural language interface system for a database of the Holy Quran
JPH08129554A (ja) 関係表現抽出装置および関係表現検索装置
Litkowski Question Answering Using XML-Tagged Documents.
Chandra et al. Natural language interfaces to databases
KR100327115B1 (ko) 부분 대역 패턴 데이터베이스에 기반한 번역문 생성장치및 그 방법
Al-Taani et al. Searching concepts and keywords in the Holy Quran
JP2001503540A (ja) アノテートされたテキストの自動翻訳
Vickers Ontology-based free-form query processing for the semantic web

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees