JPH0756957A

JPH0756957A - ユーザへの情報提供方法

Info

Publication number: JPH0756957A
Application number: JP6174497A
Authority: JP
Inventors: Annie E Zaenen; イー．ザイネンアニー; Lauri J Karttunen; ジェイ．カートゥーネンローリ
Original assignee: Xerox Corp
Current assignee: Xerox Corp
Priority date: 1993-08-03
Filing date: 1994-07-26
Publication date: 1995-03-03
Also published as: EP0637805A2; DE69424350D1; EP0637805B1; US5642522A; DE69424350T2; EP0637805A3

Abstract

(57)【要約】【目的】電子的に符号化されたテキスト本体と関連す
る電子辞書を用いる技術。【構成】選択された語を入力する( ステップ60) 。選
択語を含む文を選ぶ(S65) 。各語を解析し、各語をその
屈折形態から可能な引用形態へ写像する(S70) 。語毎の
情報は、確率的な曖昧性除去装置へ伝達され、最もあり
そうな引用形態を文構造に基づいた文中の語毎に決定す
る(S75) 。複数ワードの組合せ及びありそうな意味につ
いて辞書にアクセスする(S80) 。各複数の語の組合せは
最もありそうな文解析と比較される(S85) 。１つが発見
されればユーザへ通信される(S90)。なければ、語の最
もありそうな意味に関する情報はユーザに示される(S9
5) 。追加の情報が必要であれば(S100)、表示される(10
5) 。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は一般的にコンピュータ化
情報検索装置又はシステムに関し、更に詳細には電子的
に符号化されたテキスト本体と関連する電子辞書を用い
る技術に関する。

【０００２】

【従来の技術】電子的に符号化された辞書等は、ありふ
れたものとなり、ワード処理プログラムと共に、及び独
立型の基準ワークとの両方に適用性がある。一方、現在
の電子辞書は、印刷された辞書から得られ、且つ同一フ
ォーマットに情報を表示する。例えば、テキスト中の語
を選択することによって、辞書からの情報が要求される
と、その語に関する全情報が提供される。その語が、１
つよりも多い構文範疇(syntactic category)を有した
り、そうでなく曖昧である場合、ユーザは表示された情
報のどれが適切であるかを決定できる。従って、印刷さ
れた辞書の使用に対して電子辞書の使用の唯一の利点
は、ルックアップがより早いことと、結果がテキストを
表示する同一スクリーン上に表示できることである。

【０００３】

【発明が解決しようとする課題】本発明は、電子的に符
号化される実行テキスト(running text)と共に、電子辞
書を使用するが、ある意味では、選択された語について
あり得る全情報を用いてユーザに詳しく説明するという
よりも、最も適切な部分をユーザに与える技術を提供す
る。

【０００４】

【課題を解決するための手段と作用】簡潔に言えば、本
発明は選択される語をその屈折形態( 表層形態とも称さ
れる) から引用形態（辞書形態又は字句形態と称される
こともある）を含む１組の情報へ写像し、曖昧性を除く
ために隣接した及び周囲の語の文脈に選択された語を解
析し、おそらく最も適切だろうと決定される情報を表示
する。ユーザは、追加情報を自由に要求することがで
き、その場合、選択された語についての次に最も適切な
情報、又は全情報をのいづれかが提供される。辞書は、
好ましくは選択された語を含む複数の語の組合せに関す
る情報を有し、前後関係（文脈）の決定は一般的に、選
択語が予め定義された複数の語の組合せの部分であるか
否かの検査を伴う。

【０００５】特定の実施例において、選択語（及び好ま
しくは同一文中の他の語）は形態素解析器(morphologic
al analyzer)へ伝達され、引用形態及び、例えば音声
（スピーチ）の部分等の形態素範疇又はタグを提供す
る。形態素解析器は好ましくは有限状態変換器（FST;fi
nite state transducer)として実施する。更に、最も適
切そうな情報の決定は、好ましくは、隠れマルコフモデ
ル(HMM; hidden Markov model)等の統計的手法を用いて
決定される。

【０００６】本発明は、現在の文脈において意味を成す
ことを使用するユーザの能力(ability) を利用する。完
全な構文解析をテキストに使用する等の他の可能なアプ
ローチと対照的に、本発明による辞書情報の文脈依存フ
ィルタリングは、計算的に特別に要求をしない。同時
に、最初の情報が意味を成さない場合に、ユーザが追加
情報を要求できることによって、技術が非常に正確であ
るべきであるという抑制条件を緩和する。このことは、
１、２％のエラー率でさえ許容できない機械翻訳等の文
脈と対照的である。

【０００７】請求項１に記載の本発明は、文中に語を備
える電子的に符号化されたテキストの本体、及びテキス
ト中の語の少なくとも幾つかについての情報を有する電
子的に符号化された辞書と共に用いるために、テキスト
中のユーザが選択する語に応答して、ユーザに辞書から
の情報を提供するための方法であって、語の集合のそれ
ぞれに対して、その集合中の各語と関連する少なくとも
１つの引用形態を含む解析を生成する形態素解析器を提
供するステップと、選択語と関連する全ての解析を得る
ために選択語を形態素解析器へ伝達するステップと、選
択語及びテキスト中の少なくとも幾つかの隣接する語を
基準として、選択語と関連する最も可能性がある解析を
決定するステップと、選択語と関連する最も可能性があ
る解析についての情報を表示するステップと、を備え
る。

【０００８】請求項２に記載のユーザへの情報提供方法
は、請求項１のユーザへの情報提供方法において、請求
項１の方法であって、更に同じ引用形態の複数事例があ
り、それぞれが音声の異なる部分を備える時に実行され
る、音声の最も可能性のある部分の確認ステップ、を備
える。

【０００９】請求項３に記載のユーザへの情報提供方法
は、請求項１のユーザへの情報提供方法において、形態
素解析器が有限状態変換器として実行される。

【００１０】請求項４に記載のユーザへの情報提供方法
は、請求項１のユーザへの情報提供方法において、最も
可能性のある解析を決定する前記ステップが、隠れマル
コフモデルを使用して実行される。

【００１１】請求項５に記載のユーザへの情報提供方法
は、請求項１のユーザへの情報提供方法において、辞書
が複数の語の組合せについての情報を有し、更に、選択
された語が複数の語の組合せの１つの中の部分であるか
否かを決定し、もしそうであれば、複数の語の組合せに
ついての情報を表示するステップと、を備える。

【００１２】

【実施例】以下の明細書及び図面を参照することによっ
て、本発明の特徴及び利点が更に理解される。

【００１３】システムの概要図１は、その中に本発明を組み込めるコンピュータシス
テム１０のブロック図である。この高レベルで図示され
たコンピュータシステム構成は、標準型であり、そのよ
うなものとして、図１は”従来技術”としてラベル付け
される。しかしながら、本発明を具体化するように適切
にプログラムされる、例えばシステム１０等のコンピュ
ータシステムは、従来技術ではない。周知の実施によ
り、コンピュータシステムは、バスサブシステム１５を
介して多数の周辺装置（デバイス）と通信を行うプロセ
ッサ１２を含む。これらの周辺装置は一般的に、メモリ
１７、キーボード又は他の入力装置２０、ディスプレイ
（表示装置）又は他の出力装置２２、及び例えば１つ以
上のハードディスクドライブやフロッピーディスクドラ
イブ等のファイル記憶（ストレージ）システム２５を含
む。

【００１４】一般的なテキスト適用業務( アプリケーシ
ョン) では、ユーザは電子的に符号化されたテキスト本
体をディスプレイで見る。テキストは、既存のマテリア
ル（材料）、又はユーザが作成、若しくは修正処理中で
あるマテリアルでありうる。テキストは通常、ディスク
に記憶され、選択された部分は表示及び操作のためにメ
モリに読み込まれる。これへの一般的な付属物が次第に
増えると、ユーザは例えば、辞書やシソーラス（類語辞
典）などのオンライン基準ワークにアクセスする。一般
的なワード処理プログラムでは、ユーザは語を強調表示
すること又はカーソルを語の上に配置することによって
語を選択でき、シソーラス又は辞書をアクセスする。シ
ソーラスの場合、ユーザは選択語の多数のシノウム（同
義語）を呈される。辞書の場合、ユーザは、辞書が選択
語に関して含有するあらゆる情報、通常、選択語の多数
の定義を、呈される。

【００１５】別の可能性は翻訳のための辞書の使用であ
る。例えば、ユーザはフランス語のテキスト本体を有
し、テキストを読み、理解する目的のために、又はテキ
ストを英語に翻訳する目的のためにフランス語−英語辞
書を用いることができる。特に次の説明の例は、この内
容によくある。

【００１６】周知であるように、一般的な語は多くの定
義を有すると共に、多数ある複数の語からなる複合形又
はイディオムの部分に成り得る。例えば、American Her
itage Dictionary, Second College edition (Houghton
Mifflin Company 1985)の語”table(テーブル) ”に関
する見出し語は、１６個の名詞の定義、３個の動詞の定
義、及びそれ自体が２つの定義を有する" under the ta
ble"を含む３個のイディオムを有する。見出し語は"tab
le cloth (テーブルクロス)"や"water table (地下水
面)"を示すものは全く含まず、こられは別の見出し語に
ある。

【００１７】この例によって２つの問題が説明される。
先ず最初に、文 "The table is white (そのテーブルは
白い)"の中の語 "ｔable" を選ぶユーザは、"under the
table" が "こっそりと" 又は "泥酔状態で" を意味す
ること、更にその語 "table"は多数の動詞の意味を有す
ること、という興味深いが、的外れの事実に直面するで
あろう。２番目に、文 "The water table has dropped
fifteen feet (地下水面は１５フィート下がった)"の中
の語 "ｔable" を選ぶユーザは、"table" について全て
の意味を調べるが、"water table" の望ましい意味を見
つけないであろう。

【００１８】辞書が電子フォームに利用できれたと仮定
すれば、ユーザは更に、ルックアップがより速いこと、
及び情報がテキストと同じスクリーン上に呈されること
の利益を得るだろうが、ユーザはコンピュータが提供で
きる全ての利益を必ずしも有しているとは限らない。

【００１９】図２はコンピュータシステム１０で実現さ
れる本発明の動作部分を示すブロック図である。キーボ
ード又は他の入力装置、及びディスプレイ又は他の出力
装置はユーザインタフェース４０として一まとめにして
に示される。ユーザインタフェースは、例えば、音響ベ
ースの装置や触覚ベースの装置等の少ししかない装置と
同様に、より多くの従来の装置を含むコンピュータと、
ユーザが通信できるあらゆる装置を含むことができる。
記憶されたテキスト及び辞書は、別個のブロック４２及
び４５として示され、プログラムされたプロセッサの関
連部分は語解析器（アナライザ）５０及びフィルタ５２
を含むものとして示される。システムは、テキスト４２
及び辞書４５が電子フォームであるので、語解析器５０
で言語学的に解析できるという事実の重要な利点を使用
する。語解析器５０は、生の辞書データよりも標準的
に、より有用である情報をユーザに提供するようにフィ
ルタ５２を制御する。本発明の態様はユーザに最初に呈
する情報をフィルタリングするように１００％の精度で
ある必要がないということである。その理由は、ユーザ
は追加情報又は全情報を要求するオプション（任意選
択）を常に有しているからである。

【００２０】図３は、電子的に符号化されたテキスト本
体中のユーザの選択する語に応答して、電子辞書からの
有用な情報をユーザに提供するための本発明による手順
を説明するフロー図である。ユーザは先ず、テキスト中
の語を選択し、語解析器によって受け取られる（ステッ
プ６０）。そして、選択語を含む文を選択するように、
選択語周辺のテキスト本体が解析される（ステップ６
５）。文中の全語は形態素解析器へ伝達され、各語（ワ
ード）を解析し、各語をその屈折形態(inflectedform)
から可能な引用形態(citation form) へ写像する（ステ
ップ７０）。形態素解析器も各引用形態を追加の情報
（形態素タグ）へ提供する。語毎の情報は、確率的な曖
昧性除去装置(disambiguator）へ伝達され、最もありそ
うな引用形態を文構造に基づいた文中の語毎に決定す
る。（ステップ７５）

【００２１】次に辞書はアクセスされ、選択語を含む全
ての複数語の組合せ（イディオム及び複合形態）は、最
もありそうな意味の単一語と同様に調べられる（ステッ
プ８０）。各複数の語の組合せは最もありそうな文解析
と比較され（ステップ８５）、１つが発見されればユー
ザへ通信される（ステップ９０）。文が複数の語の組合
せの１つを含んでいなければ、語の最もありそうな意味
に関する情報は（視覚的に又は他の方法で）ユーザに示
される（ステップ９５）。この段階で、ユーザは表示さ
れた情報が意味を成しているか否かを確認でき、意味を
成していなければ、ユーザは更に情報を要求できる。シ
ステムはユーザが更に情報を必要としているか否かを確
認し（ステップ１００）、もし必要としていれば追加の
情報を通信する（ステップ１０５）。この追加情報は、
次に最もありそうな定義又は選択語と関連する全ての辞
書情報の形を取ることができる。

【００２２】文中の語の形態素解析選択語を含む文の選択は、少なくとも第１の順序（オー
ダー）に対してほぼ直接的である。一般的に、文は多数
ある終止符の内の１つで終了する。引用符を無視すれ
ば、疑問符及び感嘆符は比較的明瞭な終端物である。ピ
リオドは一般的に終端物であるが、敬称（例えばMr., M
s., Dr. 等) や省略形 (例えば、e.g., i.e., etc.等)
等の一定の周知の文脈に見られる。ピリオドのこれらの
存在は無視可能であり、他の文の終端物(terminator)に
なりうるものはフラグを立てられる。

【００２３】１つの文の終端物と次の文の終端物（タブ
及び行間を無視する）の間のテキストは、本発明の目的
のために文であると考えられる。これにより、文選択を
向上できるかもしれないが、全体処理の動作の速度を著
しく落とす場合、回避されるべきである。時々生じる文
の識別誤りによって、選択語が誤って解釈されることが
あるが、最初に表示された情報が適切でないと判断され
れば、ユーザは更に多くの情報を容易に要求できる。

【００２４】形態素解析器は、語の屈折形態（表層形態
も称されることもある）を１つ以上の引用形態（辞書形
態、字句形態、ベース（基本）形態、又は標準形態と称
されることもある）へ写像（マッピング）する。従っ
て、引用形態"swim"を有する関連語は、例えば "swims"
や"swam"等、多数の屈折形態がある。形態素解析器は、
与えられた屈折形態を使用し、引用形態を提供すると共
に両者の関係を示す。

【００２５】形態素解析器はまた、多数の形態素タグを
提供し、例えば音声部分等の情報を提供する。特定のタ
グは言語によって決まる。フランス語は非常に屈折言語
であり、音声部分に関するタグは、多数の追加のタグを
有する傾向にある。例えば、動詞は一般的に関連する人
称、時制、叙法、及び数を有し、形容詞は性称及び数を
有し、名詞は関連する人称、数、性称、及び格を有す
る。一方、英語は、フランス語ほど多く屈折しないの
で、形容詞は普通、更には限定されない。

【００２６】従って、例えば形態素解析器は語"swam"を
受け取ると、動詞"to swim" の過去時制であることを示
すだろう。一方、形態素解析器は語"swim"自体を受け取
ると、それは動詞"to swim" 又は名詞"swim"であること
示すただろう。同様に、形態素解析器は語"left"を受け
取ると、それは動詞"to leave"の過去時制、若しくは過
去分詞である、又は名詞"left"若しくは形容詞"left"で
あるということを示すだろう。

【００２７】特定の実施例の形態素解析器は字句変換器
（ＬＴ;lexical transducer ）である。ＬＴは、有限状
態変換器（ＦＳＴ;finite state transducer）の特定の
フォームである。更に、ＦＳＴは、それ自体、有限状態
機械（ＦＳＭ;fintie statemachine ）の特定のフォー
ムであり、有限状態オートマトン（ＦＳＡ;finite stat
e automaton ）としても周知である。

【００２８】ＦＳＡは要約すると、入力として記号スト
リング（列）を受取り、左から右へ進みながらストリン
グを１度に１記号読み、列の最後の記号を読むと、停止
する演算装置(computing device)である。いつでも、Ｆ
ＳＡは、指定された初期状態で開始された有限数状態の
１つにある。多数の状態は最終状態を指定され、ＦＳＡ
が最終状態の１つで停止する場合、ストリングを受理さ
れたと見なされる。ＦＳＡが最終状態の１つでない状態
で停止する場合、列を拒絶されたと見なされる。制御プ
ログラムは、どの遷移（transition）が読み込まれる記
号に基づいて生じるかを特定する。ＦＳＡはしばしば、
円で描かれる状態、及び矢印（又はアーク）で描かれる
状態遷移を備える状態図として、図的に示され、ある状
態から別の状態へ（又は同じ状態へ）遷移可能であるこ
とを示す。与えられた遷移は、そのパス（経路）と一致
する遷移をもたらす記号によってラベル付けされる。指
定された最終状態は二重円で描かれる。

【００２９】ＦＳＴはデータの順序対の集合を符号化す
るために用いられるＦＳＡである。一般的に、ＦＳＴは
例えば、連接(concatenation) 、和(union) 、反復(ite
ration) 等のブール演算によって順序対の有限リストか
ら生成されるあらゆる”正則関係”を表すために使用可
能である。ひとたび順序対がＦＳＴデータ構造として符
号化されると、その構造はコンピュータで対のメンバー
（要素）にアクセスするように用いられ、これによって
他の関連する要素も容易にアクセスされる。ＦＳＴの状
態遷移は１対の記号によってラベル付けされるが、単純
なＦＳＡにおけるように単一記号によってはラベル付け
されない。

【００３０】ＬＴは（タグを備える）引用形態を屈折形
態に写像し、逆に屈折形態を引用形態に写像する特殊Ｆ
ＳＴである。このような項(term)は、語表示が２レベル
ＦＳＡを介するデータベースを参照する。各語は、状態
遷移アークによって結合される順序付状態を含むパスに
よって表される。パスは、表された語を産するために、
横移動(traversing)ルーチンによって横に移動される。
各パスは、語の引用形態及び語の関連する屈折形態を表
すために用いられる。周知の語の認知及び生成が、あら
ゆる形態素規則の適用を必要としないという点でＬＴは
効率的である。即ち、語の全ての屈折形態がその引用形
態及び関連するタグを備える順序対として記憶されれ
ば、語の全ての屈折形態は引用形態をアクセスすること
によってアクセスできる。これにより、語形態の双方向
アクセス、即ち引用形態から屈折形態へ（生成）、又は
屈折形態から引用形態（語幹）へのアクセスが可能とな
る。

【００３１】図４（Ａ）は、字句変換器中のパス１２０
の一例を示す。パス１２０は、初期状態１２１、複数の
中間状態１２２から１２７、及び最終状態１２８を含む
８状態を含む。隣接する状態はアークによって接続さ
れ、各アークは、各々と関連する２つまでの記号を備え
ることができる。上部記号はパスの上側に示され、下部
記号はパスの下側に示される。記号は、以下に説明よう
に文字（キャラクタ）又は形態素タグでもよい。従っ
て、状態１２１及び１２２の間のアークは、文字”ｍ”
である上部記号と、さらに文字”ｍ”である下部記号と
を有する。状態１２２及び１２３の間のアークは、上部
記号”ｏ”及び、下部記号”ｉ”を有する。パスを構成
する状態及びアークの集まりは、パスが上部及び下部の
記号の順序シーケンスを定義するように整列される。

【００３２】ソフトウェアのルーチンは語の屈折形態を
パスの引用形態から検索するために用いられる。ここで
なされる説明では、引用形態を与えられた屈折形態の検
索を示すが、明白であるように、屈折形態の与えられた
引用形態の検索もまた可能である。特定の例において、
パス１２０は上部語”ｍｏｕｓｅ”及び下部語”ｍｉｃ
ｅ”を有する。上部語は引用形態であり、下部語は屈折
形態である。

【００３３】このような表示は、例えば屈折形態の引用
形態を生成するのに有用である。これにより語サーチプ
ログラムは効率的な”知的”サーチを実行でき、引用形
態の屈折形態を形成するための規則が変化し多種多様で
ある語の形態を検出（ロケート）できる。語の屈折形態
をその引用形態から導き出す問題は、例えば、共通の基
準引用表現の多くの屈折形態を含むフランス語等の言語
において拡大される。

【００３４】パス１２０を含むＬＴが与えられるとすれ
ば、屈折形態”ｍｉｃｅ”を引用形態”ｍｏｕｓｅ”へ
写像する方法はコンピュータで実行するソフトウェアル
ーチンを使用する。語をパスから生成するためにＬＴに
アクセスするルーチンは、横移動(traversing)ルーチン
と称される。横移動ルーチンは、語の屈折形態を与えら
れ、その語の考えられる引用形態にリターンする。例え
ば、語”ｍｉｃｅ”の単数の名詞を捜すことが所望され
る場合、横移動ルーチンは記号”ｍ”で開始する字句変
換器内のパスを識別する。一般的に、１つの状態はそれ
と接続されるあらゆる数のアークを有することができ
る。これらの追加のアークは図４（Ａ）に示されていな
いが、その存在の趣旨は、横移動ルーチンが、１状態に
おいて、そこから発する２つ以上のアークに対してどの
アークが次に来るかに関して決断をしなくてはならない
ということである。以下に詳細に説明されるように、１
状態に結合されるアークが１つよりも多い可能性のめ
に、アークは１つを超えるパスにおいて使用可能であ
る。

【００３５】引用形態への屈折形態の写像を行うため
に、横移動ルーチンは初期状態１２１で開始する。この
例において、他のパスは示されていないが状態１２１は
他の全パスと共通する。初期状態からアークは、屈折形
態中の最初の文字に整合する下部記号でシーク（検索）
される。この場合、その文字は”ｍ”であるので、ルー
チンはその下部記号を有するアークに従う。

【００３６】また、”ｍ”にもなる上部記号は検索さ
れ、リストに記憶される。追加の上部記号は横方向移動
が進むにつれ得られ、語の引用形態を作成するためにリ
ストに記憶される。字句変換器（ＬＴ）内に上部及び下
部の記号を記憶すること、及び記号のアークとの関連
は、従来技術において周知のあらゆる手段によって成さ
れ得る。既存のプロトタイプ（原型）のＣプログラミン
グ言語が用いられる。

【００３７】状態１２３と１２４の間の状態は、上部記
号に”ｕ”を有するが、下部記号に何も有さない（実際
に下部記号は空白(null)である）。このアークを横方向
移動することにより、記号”ｕ”はリストに加えられ
る。パスを横方向に更に進むと、文字”ｓ”及び”ｅ”
がリストに加えられる。状態１２６と１２７の間のアー
クにおいて、記号”＋ＮＰＬ”は上部記号にある。これ
は、このパスと関連する屈折形態が語”ｍｏｕｓｅ”の
複数の名詞形であるという情報を示す形態タグである。
状態１２８は最終状態として示される（マーク）される
ので、横移動ルーチンは終了し、アセンブル引用形態は
その形態素タグと共に出力としてリターンされる。

【００３８】図４（Ｂ）は、語 "ｓｐｙ" の３つの異な
る屈折フォームをその引用形態及び形態素タグへ写像す
る３つのパスを有するＬＴ１４０の一部分を示す。第１
のパスは、初期状態１４２で開始し、第１の最終状態１
４５で終了する。この第１パスは語の３人称単数の屈折
形態、即ち "ｓｐｉｅｓ" を引用形態に写像すると共
に、タグ "＋" 及び "３ＳＧ" も提供する。第２のパス
もまた初期状態１４２で開始するが、第１パスから分岐
し、第２の最終状態１５０で終了する。この第２パスは
語の過去時制の屈折形態、即ち "ｓｐｉｅｄ" を引用形
態に写像すると共に、タグ "＋" 及び "ＰＡＳＴ" も提
供する。第３パスは初期状態１４０で開始し、第３の最
終状態１５５で終了し、複数形の進行形の屈折形態、即
ち "ｓｐｙｉｎｇ" を引用形態に写像すると共にタグ "
＋" "ＰＬ" "ＰＲＯＧ" を提供する。

【００３９】実施において、ＬＴは大型のデータ構造で
ある。数字で表す例として、英語の場合、ＬＴは、約５
０、０００の状態、１００、０００のアーク、及び２２
５、０００の識別（離散）パスを有する。フランス語の
場合ＬＴは、英語と同等数の状態及びアークを有するほ
ぼ同じ全体サイズであるが、言語の特性により約５、７
００、０００の識別パスを有する。

【００４０】複数の引用形態の曖昧性除去詳細に上述されたように、形態素解析器からの出力は、
選択語を含む文中の語毎に、それぞれが問題の語を描写
する形態素コード（タグ）でタグ付けされた、全ての引
用形態からなる。文献は共通の屈折形態から写像される
複数の異なる引用形態（及びタグ）を識別するために部
分スピーチ（part-of-speech) 解析を実行する多くの技
術を説明する。現在、好ましい技術は、隠れマルコフモ
デル(hidden Markov model) に基づく統計的方法であ
る。本発明の重要な態様は、曖昧性の取り除きにおいて
完全な正確さを要求しないことである。その理由は、最
初に表示される情報が不正確に思われれば、ユーザは常
により多い情報を要求できるからである。統計的方法は
本質的に１００％よりも少ない精度なので、その方法の
多くは幾つかの使用法に適さないが、本発明の使用法に
は適す。

【００４１】隠れマルコフモデル化は、認識される音声
の変動性をモデル化するために音声認識において一般的
に用いられる統計的手法である。このような変動性は、
異なる話者から生じるだけでなく、異なる会話速度から
も結果として生じる。本発明において隠れマルコフモデ
ル化は、音声の部分認識に使用される。ここで、変動性
によって、与えられた屈折形態が多数の様々な引用形態
へ写像できるという事実が得られる。

【００４２】隠れマルコフモデル（ＨＭＭ）は、状態間
での確率的遷移と、各状態と関連する観測される特徴ベ
クトルの確率分布と、を有する１組の状態からなる。音
声認識において、これらの特徴ベクトルは与えられた時
間での音声のスペクトル内容を表す。語解析システムの
特徴ベクトルは、文中の語の構文情報からなる。状態同
士の間の遷移は観測シーケンスを指定する。確率を各状
態の観測結果と同様に、状態同士間での遷移と関連づけ
ることによって、ＨＭＭは音声又は語法の変動性を統計
的にモデル化するために用いられる。

【００４３】より詳細には、ＨＭＭは、１組のＮ個の状
態Ｓ₁．．．Ｓ_Nと、１組の遷移確率ａ_ij（ｉ＝
１．．．Ｎ、ｊ＝１．．．Ｎで、この場合、ａ_ijが状態
ｉから状態ｊへの遷移の確率である）と、１組の確率分
布ｂ_i(x)（ｉ＝１．．．Ｎで、この場合、ｂ_i(x)は状態
ｉにあり、特徴ベクトルｘを観測する確率である）と、
からなる。

【００４４】ＨＭＭを用いる認識は以下のようになされ
る。認識される各オブジェクトは、ＨＭＭによってモデ
ル化される。長さＴの与えられた観測シーケンスｘ（Ｘ
＝ｘ ₁．．．ｘ）は、シーケンスＸを最も生成しそうで
あったと決定されるＨＭＭと対応するオブジェクトとし
て認識される。これを行う１つの方法は、フォワード
（前向き）アルゴリズム（Rabiner 参照) を用いて、各
ＨＭＭに与えられるＸの可能性（確度）を計算すること
によって行われる。より効率的な方法はビタービ(Viter
bi) アルゴリズムであり、これは以下のように成され
る。認識されるオブジェクト毎のＨＭＭは、ネットワー
クを形成するように並列に接続される。観測シーケンス
Ｘ＝ｘ₁．．．ｘ_Tが与えられると、ビタービアルゴリ
ズム（Rabiner 参照) は、シーケンスＸを最も生成しそ
うだったネットワークを介して状態シーケンスを見つけ
るために使用可能である。各状態シーケンスは認識され
るオブジェクトの１つのＨＭＭに特有なものであるの
で、最適な状態シーケンスは認識されるオブジェクトを
特定する。

【００４５】ＨＭＭに関するパラメータは、遷移確率ａ
_ij及び観測確率ｂ_i(x)である。これらのパラメータは、
ＨＭＭによってモデル化されたオブジェクトによって生
成されたことが分かっている１組の観測シーケンスＸで
ＨＭＭを訓練することによって学習させることができ
る。バーム−ウェルチ手順（Baum-Welch procedure:Rab
iner参照) として周知であるアルゴリズムは一般的に使
用される。

【００４６】曖昧さ取り除き手順は、主として語と関連
する音声部分に基づき、確率によって識別された選択語
の１組の可能な文脈をもたらす。文中の他の語の最も可
能性のある引用形態と同様に選択語の最も可能性のある
解析の引用形態は、以下に説明される初期辞書ルックア
ップのために用いられる。文解析が選択語に対して不正
確な解析へ導きそうになったことは少なくとも幾分ある
ので、ユーザが追加の情報を要求する場合に、他の少な
い可能性の文解析の少なくともいくつかをセーブするこ
とは一般的に好ましい。

【００４７】音声の部分タッグ付けについてＨＭＭに基
づく特定のシステムに関する詳細は、１９９２年、「Co
mputer Speech and Language」の６巻の２２５頁から２
４２頁、Julian Kupiec による"Robust part-of-speech
tagging using a hidden Markov model" にあり、その
技術に関しては参照によってここに組み込まれる。その
刊行物に説明されているシステムは、テキストの約９６
％に正確にタグ付けをし、英語以外のフランス語を含む
他の言語に適用可能である。

【００４８】文中の語の音声の部分によって主に決まる
曖昧性除去と比べて、形態素解析は、比較的細かなレゾ
リューション（導出法、resolution）によって特徴付け
られることは留意されるべきである。より高いレゾリュ
ーションを有する処理の部分に生じる重要な計算ペナル
ティーが存在する程度まで、処理のその部分の荒い解釈
（バージョン）を使用できる。別の方法では、著しい浪
費無しに、処理のより微細部分のレゾリューションをよ
り荒い部分のレゾリューションに整合できる。

【００４９】辞書ルックアップ及び情報のディスプレイ語の屈折形態をその引用形態に写像するＬＴは、好まし
くは、各引用形態を固有の番号にも写像し、データ圧縮
や辞書ルックアップを容易にする。与えられた語に関す
る辞書情報は、好ましくはその語を含む全ての複数語の
組合せに対するポインタ（pointers）も含む。一例であ
るが上述された"table" と"water table" の場合のよう
に、たいていの辞書は複数語の組合せをシステム的に連
結(link)しない。英語言語を熟知しているユーザは、お
そらく”water table"は"table"に関する見出し語の項
目下で見つけられないかもしれないと認識するだろう
が、その言語について一般的な知識だけを有するユーザ
は、その事実を認識できないかもしれない。

【００５０】全ての複数語の組合せを連結することは、
ユーザに正しい意味を得る機会を与えるために必要であ
るが、ユーザが多すぎる情報を得ないようにするために
は不十分である。フランス語による例は、この点を示し
ている。文脈に語"provenance"又は"en provenance de"
を呈されたユーザは、語"provenance"が一般的に" 起
源" を意味すること、又は"pays de provenance"は "産
出物が必ずしも生産される場所ではないが、そこから輸
入される国" を意味しているということを知る必要はな
い。むしろ、ユーザの要求は、"en provenance de"が "
〜から" を意味することを知ることのみが必要である。

【００５１】従って、情報をフィルタリングするための
迅速かつ正確な方法は、選択された語が、選択語に索引
をつけられた知られている複数の語の組合せ部分である
か否かをチェックし、もしそうである場合は、その複数
語の組合せの意味を表示することである。もし選択され
た語が周知の複数の語の組合せの文脈にない場合、単一
の語の引用形態の１つ以上の意味に関する情報が表示さ
れる。一般的に、曖昧性取り除き装置が、特定の引用形
態の様々な定義を識別するということはないだろう。例
えば、名詞"table" は、水平平面を有する家具の１個以
外の何かを意味することがある。従って、語"table" の
全ての名詞定義は表示されるだろうが、文中に存在しな
い周知の複数語の形態は表示されないだろうし、語の動
詞形に関する情報も表示されないだろう。

【００５２】ユーザが表示された情報に満足しなけれ
ば、より多くの情報を要求できる。ユーザが特定のレベ
ルの追加情報を要求できることを含む追加情報の表示に
関する多数の可能性がある。複数の意味の幾らかだけが
最初に表示されたとすれば、最少量の追加情報は、同じ
引用形態（即ち、曖昧性除去装置によって、最もありそ
うであると決定された引用形態）の追加の意味になるだ
ろう。最大量の追加情報は選択された語の全ての引用形
態に関する全情報である。その極端な２つの中間は、他
（より可能性の少ない）の文解析の多くの内の１つの結
果を表すべきであり、他の複数の語の組合せについての
可能な情報はそのような他の文脈に対応する。

【００５３】複数語の組合せの符号化図５は、正則表現として特定のイディオムを符号化する
ＦＳＡ１８０の一部分を示す。特定のイディオムは

【００５４】

【外１】

【００５５】であり、そのもともとの意味は、" 午後２
時に正午を捜す (to look for noon at 2 o'cklock) ”
である。Collins French/English辞典はこのイディオム
を" tocomplicate the issue, to look for complicati
ons.(問題を複雑化すること、複雑なことを期待するこ
と)"と訳している。

【００５６】このイディオムは不変部分

【００５７】

【外２】

【００５８】例えば、"toujours"(always)( 常に) 等の
副詞的な語が挿入可能であるフリースロット（・・・；
自由位置）と、イディオム的な意味を失うことなく同じ
動詞

【００５９】

【外３】

【００６０】のあらゆる他の形態に置換できる可変部
分"chercher"(to look for) と、を有する。

【００６１】イディオムの多数の可能なバリエーション
（変体）を簡単な方法で表すために、それを正則表現と
して符号化することは有益である。周知のアルゴリズム
によって、正則表現をＦＳＡへ変換可能であり、イディ
オムがあらゆる与えられた文中に存在するか否かを決定
するのに効率的な方法を提供する。

【００６２】イディオムのコード化において、ＬＴがテ
キストの２レベル表現を提供する、即ち片側はテキスト
中の実際の語であり、他側は基準の引用形態及び形態素
タグであるという事実を利用する。識別は、イディオム
をパターンとして指定するためにコロンでマークされ
る。イディオムをパターンとして指定するのにコロンで
マークすることによって、識別がなされる。要素の後の
コロン(chercher:) は、あらゆる数の表面認識を備える
ことができる字句形態であることを示し、要素の前のコ
ロン(:midi) は、表面要素であり、且つテキストと正確
に整合しなければならないことを指示する。

【００６３】２レベル正則関係としてイディオムの概略
的な表現は、以下のようにあたえられる：

【００６４】

【外４】

【００６５】ここで、"Infl:" は時制及び叙法、並びに
数及び人称の全ての組合せに関する省略形である。"Sub
jClitic"は"cherchez-vous" として、倒置型疑問のクリ
ティサイズ（cliticized；前の語の一部分を形成する音
声ユニットとして発音すること) 主語を表す。"<word>:
＋Adv:" はあらゆる副詞の字句形態と整合するパターン
である。丸括弧は、任意選択を示す。

【００６６】ＦＳＡ１８０の図示された部分は初期状態
１８１、複数の中間状態１８２から１８９、及び最終状
態１９０を含む。状態１８３と１８５の間、並びに状態
１８５と１８８の間のスキップアークは、クリティサイ
ズ主語と副詞の任意特性によって求められる。

【００６７】結果として、本発明によってユーザは電子
辞書と相互作用でき、その十分な恩恵を得ることができ
る。本発明は、ユーザに最も有用な情報を合理的に提供
しようとするが、ユーザは追加の情報を要求することが
できる。

【００６８】上記記載は、本発明の好適な実施例の十分
な記載であるが、様々な態様、変更構造、及び本発明に
相当するものが使用可能である。従って、上記説明及び
図は、請求項で定義される発明の範囲を限定する物とし
て扱われるべきではない。

【００６９】〔参考文献〕１９８９年２月の「Proc. IE
EE」の第２号、７７巻の L.R. Rabiner による "A Tuto
rial on Hidden Markov Models and Selected Applicat
ions in Speech Recognition" 。

【００７０】１９９２年「Computer Speech and Langua
ge」の６巻の頁２５２〜２４２のJulian Kupiec による
"Robust part-of-speech tagging using a hidden Mar
kov model"。

【００７１】

【発明の効果】本発明によって、電子的に符号化された
テキスト本体と関連する電子辞書を用いる技術が提供さ
れる。

【図面の簡単な説明】

【図１】本発明が内蔵されうる従来技術のコンピュータ
システムのブロック図。

【図２】図１のコンピュータシステムで実現される本発
明の動作部分のブロック図。

【図３】本発明による手順のフロー図。

【図４】（Ａ）は字句変換器（ＬＴ）中のパスの一例を
示し、（Ｂ）は語の３つの異なる屈折形態をその引用形
態又はタグに写像する３つのパスを有するＬＴの一部分
を示す。

【図５】複数の語のイディオムを符号化するための初期
状態オートマトン（ＦＳＡ）の一部分を示す。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁶ 識別記号庁内整理番号ＦＩ技術表示箇所 8125−5ＬＧ０６Ｆ 15/38 Ｄ 9194−5Ｌ 15/40 ３７０Ｅ (72)発明者ローリジェイ．カートゥーネンアメリカ合衆国 94062 カリフォルニア州レッドウッドシティジェファソンアヴェニュー 3950

Claims

【特許請求の範囲】

【請求項１】文中に語を備える電子的に符号化された
テキストの本体、及びテキスト中の語の少なくとも幾つ
かについての情報を有する電子的に符号化された辞書と
共に用いるために、テキスト中のユーザが選択する語に
応答して、ユーザに辞書からの情報を提供するための方
法であって、語の集合のそれぞれに対して、その集合中の各語と関連
する少なくとも１つの引用形態を含む解析を生成する形
態素解析器を提供するステップと、選択語と関連する全ての解析を得るために選択語を形態
素解析器へ伝達するステップと、選択語及びテキスト中の少なくとも幾つかの隣接する語
を基準として、選択語と関連する最も可能性がある解析
を決定するステップと、選択語と関連する最も可能性がある解析についての情報
を表示するステップと、を備えるユーザへの情報提供方法。
【請求項２】請求項１の方法であって、更に同じ引用形
態の複数事例があり、それぞれが音声の異なる部分を備
える時に実行される、音声の最も可能性のある部分の確
認ステップ、を備えるユーザへの情報提供方法。
【請求項３】形態素解析器が有限状態変換器として実行
される請求項１に記載のユーザへの情報提供方法。
【請求項４】最も可能性のある解析を決定する前記ステ
ップが、隠れマルコフモデルを使用して実行される請求
項１に記載のユーザへの情報提供方法。
【請求項５】辞書が複数の語の組合せについての情報を
有し、更に、選択された語が複数の語の組合せの１つの中の部分であ
るか否かを決定し、もしそうであれば、複数の語の組合
せについての情報を表示するステップと、を備える請求項１に記載のユーザへの情報提供方法。