JP2001075964A

JP2001075964A - 情報処理装置および情報処理方法、並びに記録媒体

Info

Publication number: JP2001075964A
Application number: JP24546199A
Authority: JP
Inventors: Naoto Iwahashi; 直人岩橋
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1999-08-31
Filing date: 1999-08-31
Publication date: 2001-03-23
Also published as: US20050251385A1; KR20010075669A; AU6867500A; EP1146439A1; WO2001016794A1; CN1158621C; US7010477B1; CN1327562A; ID29197A; EP1146439A4

Abstract

(57)【要約】【課題】辞書に登録されていない単語が入力された場
合にも、その単語と、辞書に登録されている単語との類
似度を計算する。【解決手段】単語集合出力部３においては、単語が、
その単語が表す物事を表現する関数である概念表記関数
とともに、最適単語列出力部４に入力され、最適単語列
出力部４では、単語集合出力部３からの単語と、辞書に
登録されている登録単語との類似度が、それぞれの概念
表記関数に基づいて演算される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、情報処理装置およ
び情報処理方法、並びに記録媒体に関し、特に、例え
ば、大規模な辞書がなくても、多くの単語について、単
語どうしの類似度の計算を可能とし、さらに、複雑な文
法規則等がなくても、単語の集合を、適切な意味となる
単語の並び（単語列）に変換することができるようにす
る情報処理装置および情報処理方法、並びに記録媒体に
関する。

【０００２】

【従来の技術】単語どうしの意味的な類似度は、自然言
語処理技術において、様々な用途で用いられている。

【０００３】即ち、例えば、翻訳処理の手法として、大
量の対訳用例文を、あらかじめ用意しておき、その対訳
用例文の中から、入力文に最も類似するものを探索し、
その探索した対訳用例文を修正することで、入力文を翻
訳した翻訳文を生成する方法があるが、この方法におい
て、入力文と対訳用例文との類似度は、その入力文を構
成する各単語と、その単語に対応する、対訳用例文を構
成する単語との類似度（単語類似度）に基づいて計算さ
れる。

【０００４】単語類似度の計算方法としては、木状また
はネットワーク状のシソーラスを用いるものや、単語
の、文中での共起情報を用いるものなどが知られてい
る。

【０００５】シソーラスを用いる方法では、例えば、シ
ソーラスにおいて、単語類似度を計算する２つの単語そ
れぞれに相当するノードを結ぶ最短のパスを構成するア
ークの数が求められ、そのアークの数の逆数が、単語類
似度とされる。また、共起情報を用いる方法では、大量
の文について、その文に現れる単語の共起情報を登録し
ておき、その共起情報から得られる統計量（単語類似度
を計算しようとしている２つの単語それぞれと共起しや
すい単語の統計量）に基づいて、単語類似度が求められ
る。

【０００６】なお、シソーラスを用いて単語類似度を計
算する方法については、例えば、飯田仁、”英語前置詞
句係り先の用例主導あいまい性解消”、電子情報通信学
会論文誌、D-II, Vol.J77-D-II, No.3, pp.557-565, 19
94等に、共起情報を用いて単語類似度を計算する方法に
ついては、例えば、Donald Hindle, "Noun classificat
ion from predicate-argument structures", Proceedin
gs of Annual meetingof the Association for Computa
tional Linguistics, pp.268-275, 1990等に、それぞ
れ、その詳細が記載されている。

【０００７】

【発明が解決しようとする課題】ところで、シソーラス
や共起情報を用いる方法では、シソーラスに登録されて
いない単語や共起情報が登録されていない単語（以下、
適宜、未登録単語という）については、単語類似度を計
算することができない。従って、シソーラスや共起情報
を用いて言語処理を行う言語処理システムにおいて、豊
富な言語能力を実現しようとする場合には、莫大な数の
学習用のサンプルを用いて学習を行い、シソーラスや共
起情報を登録した辞書を生成する必要がある。

【０００８】しかしながら、言語処理システムにおいて
は、少ない学習用のサンプルだけで柔軟で、かつ効率的
な学習を行い、豊富な言語能力を実現することができる
のが望ましく、そのためには、未登録単語についても、
学習済みの単語との単語類似度を計算することが要求さ
れ、さらに、未登録単語を含む単語列と、学習済みの文
法規則から得られる単語列との類似度（単語列類似度）
を計算することも要求される。

【０００９】一方、例えば、福井直樹、”極小モデルの
展開−言語の説明理論をめざして”、岩波講座言語の
科学６生成文法第４章、岩波書店、１９９８等では、
人間が、複数の単語の集合を、文法に合致した適切な順
序に並べる操作は、人間の言語能力における根源的な心
的操作とみなすことができることが記載されているが、
その心的機能のメカニズムの解明は、理論言語学におい
て、重要な研究テーマとして扱われている。

【００１０】また、人間の言語機能（の全部または一
部）を実現（模擬）するシステムの開発においても、人
間が行うのと同様の単語の並びを生成する機能の実現が
求められている。

【００１１】しかしながら、現状では、言語処理システ
ムにおける学習の初期段階、即ち、文法規則の学習が不
十分であったり、処理対象の単語が、学習用のサンプル
として与えられていない段階においては、単語類似度、
さらには、単語列類似度を計算することができず、適切
な単語の並び（単語列）を得ることが困難である。ま
た、不十分な文法規則によって得られる単語列を出力す
ることができるだけでは、システムの言語の表現能力が
限定されたものとなる。

【００１２】以上から、学習によって得られた辞書に登
録されていない単語についても、辞書に登録されている
単語（以下、適宜、登録単語という）との単語類似度を
計算し、さらに、その単語類似度に基づく単語のクラス
タリングを行うことができるようにして、学習済みの文
法に、より一般性をもたせる手法が求められている。

【００１３】本発明は、このような状況に鑑みてなされ
たものであり、大規模な辞書がなくても、多くの単語に
ついて、単語どうしの類似度の計算を可能とし、さら
に、複雑な文法規則等がなくても、単語の集合を、適切
な意味となる単語列に変換することができるようにする
ものである。

【００１４】

【課題を解決するための手段】本発明の第１の情報処理
装置は、単語を、その単語が表す物事を表現する関数で
ある概念表記関数とともに入力する入力手段と、概念表
記関数に基づいて、単語と登録単語との類似度である単
語類似度を演算する単語類似度演算手段とを含むことを
特徴とする。

【００１５】辞書には、登録単語を、その登録単語につ
いての概念表記関数とともに記憶させておくことができ
る。

【００１６】第１の情報処理装置には、辞書を記憶して
いる辞書記憶手段をさらに設けることができる。

【００１７】概念表記関数は、単語が表す物事から得ら
れる情報を表現する関数とすることができる。

【００１８】また、概念表記関数は、単語が表す物事か
ら受ける刺激を感知する感知手段の出力から得られる情
報を表現する関数とすることができる。

【００１９】感知手段は、光若しくは音を電気信号に変
換するデバイス、触覚センサ、温度センサ、または加速
度センサとすることができ、この場合、概念表記関数
は、感知手段によって、単語が表す物事を観測すること
によって得られるパラメータを表現する関数とすること
ができる。

【００２０】概念表記関数は、確率密度関数または離散
確率分布関数とすることができる。

【００２１】単語類似度演算手段には、単語と登録単語
との単語類似度を、その単語および登録単語の概念表記
関数どうしのバタチャリア(Bhattacharyya)距離または
カルバックダイバージェンスに基づいて演算させること
ができる。

【００２２】入力手段には、単語の集合である単語集合
を、各単語についての概念表記関数とともに入力させ、
辞書は、複数の登録単語を並べた登録単語列の集合を、
各登録単語についての概念表記関数とともに記憶させて
おくことができ、この場合、第１の情報処理装置には、
単語集合を構成する単語を並べた単語列を生成する単語
列生成手段と、単語列を構成する各単語と、その単語に
対応する、登録単語列を構成する登録単語との単語類似
度から、単語列と登録単語列との類似度である単語列類
似度を演算する単語列類似度演算手段と、単語列類似度
に基づいて、単語集合を構成する単語を所定の順番で並
べた単語列を出力する出力手段とをさらに設けることが
できる。

【００２３】本発明の第１の情報処理方法は、単語を、
その単語が表す物事を表現する関数である概念表記関数
とともに入力する入力ステップと、概念表記関数に基づ
いて、単語と登録単語との類似度である単語類似度を演
算する単語類似度演算ステップとを含むことを特徴とす
る。

【００２４】本発明の第１の記録媒体は、単語を、その
単語が表す物事を表現する関数である概念表記関数とと
もに入力する入力ステップと、概念表記関数に基づい
て、単語と登録単語との類似度である単語類似度を演算
する単語類似度演算ステップとを含むプログラムが記録
されていることを特徴とする。

【００２５】本発明の第２の情報処理装置は、辞書に登
録する単語である登録単語が表す物事を表現する関数で
ある概念表記関数を生成する関数生成手段と、登録単語
と、その登録単語についての概念表記関数とを対応付け
る対応付け手段とを含むことを特徴とする。

【００２６】概念表記関数は、単語が表す物事から得ら
れる情報を表現する関数とすることができる。

【００２７】また、概念表記関数は、単語が表す物事か
ら受ける刺激を感知する感知手段の出力から得られる情
報を表現する関数とすることができる。

【００２８】感知手段は、光若しくは音を電気信号に変
換するデバイス、触覚センサ、温度センサ、または加速
度センサとし、概念表記関数は、感知手段によって、単
語が表す物事を観測することによって得られるパラメー
タを表現する関数とすることができる。

【００２９】概念表記関数は、確率密度関数または離散
確率分布関数とすることができる。

【００３０】本発明の第２の情報処理方法は、辞書に登
録する単語である登録単語が表す物事を表現する関数で
ある概念表記関数を生成する関数生成ステップと、登録
単語と、その登録単語についての概念表記関数とを対応
付ける対応付けステップとを含むことを特徴とする。

【００３１】本発明の第２の記録媒体は、辞書に登録す
る単語である登録単語が表す物事を表現する関数である
概念表記関数を生成する関数生成ステップと、登録単語
と、その登録単語についての概念表記関数とを対応付け
る対応付けステップとを含むプログラムが記録されてい
ることを特徴とする。

【００３２】本発明の第１の情報処理装置および第１の
情報処理方法、並びに第１の記録媒体においては、単語
が、その単語が表す物事を表現する関数である概念表記
関数とともに入力され、その概念表記関数に基づいて、
単語と登録単語との類似度である単語類似度が演算され
る。

【００３３】本発明の第２の情報処理装置および第２の
情報処理方法、並びに第２の記録媒体においては、辞書
に登録する単語である登録単語が表す物事を表現する関
数である概念表記関数が生成され、登録単語と、その登
録単語についての概念表記関数とが対応付けられる。

【００３４】

【発明の実施の形態】図１は、本発明を適用した最適単
語列出力装置の一実施の形態の構成例を示している。

【００３５】この最適単語列出力装置においては、ある
事物を表す単語列を構成する単語の集合（単語集合）か
ら、その事物を適切に表す単語列が出力されるようにな
っている。

【００３６】即ち、センサ部１は、ある具体的な物事を
対象として、その事物（以下、適宜、注目事物という）
から受ける刺激を感知するようになっており、その感知
の結果を、前処理部２に出力する。ここで、図１の実施
の形態においては、センサ部１は、光を電気信号に変換
するデバイスとしてのビデオカメラ、音を電気信号に変
換するデバイスとしてのマイク（マイクロフォン）、触
覚センサ、温度センサ、および加速度センサ等から構成
されており、従って、センサ部１では、注目事物の色
や、形、大きさ、位置、方向、速度等が感知される。

【００３７】前処理部２では、センサ部１の出力が処理
され、その出力から、特徴パラメータ（特徴ベクトル）
が抽出される。即ち、前処理部２では、センサ部１によ
って、注目事物が観測されることにより得られる情報に
ついての特徴パラメータ（従って、注目事物の色や、
形、大きさ、位置、方向、速度等の、注目事物の特徴を
表すパラメータ）が求められる。この特徴パラメータ
は、単語集合出力部３に供給される。

【００３８】単語集合出力部３は、Ｎ個の識別器１１₁
乃至１１_Nと、セレクタ１２とから構成され、センサ部
１によって観測された注目事物を表現する単語列を構成
する単語の集合を出力する。

【００３９】即ち、識別器１１_nは、注目事物から得ら
れる特徴パラメータに基づいて、その注目事物をパター
ン認識等により識別し、その識別結果を出力する。具体
的には、識別器１１_nは、ある単語＃ｎが表す事物を識
別するための識別関数ｆ_n（モデル）を記憶しており、
前処理部２からの特徴パラメータを用いて、その識別関
数ｆ_nを演算する。そして、識別器１１_nは、識別関数ｆ
_nの演算結果（以下、適宜、関数値という）、識別関数
ｆ_nによって識別される事物を表す単語＃ｎのテキスト
表記および音声表記、並びに識別関数ｆ_nを、単語＃ｎ
が表す事物の識別結果として、セレクタ１２に出力す
る。

【００４０】セレクタ１２は、識別器１１₁乃至１１_Nそ
れぞれからの識別結果を受信すると、その識別結果の中
から、例えば、識別関数ｆ₁乃至ｆ_Nの関数値が所定値以
上のものを選択する。即ち、ここでは、識別関数ｆ_nの
関数値が大きいほど、注目事物が、単語＃ｎで表現され
るものであることの確からしさが高いこととしており、
セレクタ１２は、関数値が所定値以上の識別結果を、注
目事物を表現するのに適切なものとして選択する。

【００４１】ここで、注目事物が、例えば、大きな赤い
球であった場合、識別関数ｆ₁乃至ｆ_Nのうち、「大き
い」、「赤い」、「球」という３つの事物をそれぞれ表
現する単語を識別するものの関数値は、いずれも所定値
以上になると考えられる。従って、この場合、セレクタ
１２では、そのような３つの識別結果が選択されること
になるが、本実施の形態では、このように、セレクタ１
２において、基本的に、複数の識別結果が選択されるも
のとする。

【００４２】セレクタ１２は、以上のように、注目事物
を表現する単語それぞれに対応する複数の識別結果を選
択すると、その選択した複数の識別結果を、最適単語列
出力部４に入力する。

【００４３】ここで、識別器１１_nにおいて、単語＃ｎ
が表す事物を識別するために用いられる識別関数ｆ
_nは、単語＃ｎが表す個々の具体的な事物を観測するこ
とにより得られる特徴パラメータを用いて学習を行うこ
とにより得られるものであり、従って、単語＃ｎが表す
個々の具体的な事物から成る特徴パラメータを代表して
表現する。

【００４４】一方、物事を表現する関数を、概念表記関
数ということとすると、識別関数ｆ _nは、上述のよう
に、単語＃ｎが表す具体的な各物事から得られる特徴パ
ラメータを代表して表現しており、従って、識別関数ｆ
_nは、概念表記関数の一種と捉えることができる。な
お、識別関数ｆ_nは、あくまで、概念表記関数としても
捉えることができるだけであり、従って、概念表記関数
として、識別関数ｆ_n以外の関数を用いることも可能で
ある。

【００４５】また、以下においては、単語ｗを、適宜、
次のような定義で用いることとする。

【００４６】ｗ＝（Ｌ，Ｐ，Ｃ）・・・（１）但し、Ｌは、単語を表現する文字列（テキスト表記）
を、Ｐは、単語を音声で表現するための表記（音声表
記）を、Ｃは、単語が表す物事を表現する表記（概念表
記）を、それぞれ表す。

【００４７】音声表記Ｐとしては、例えば、単語を発話
した音声を特徴づける音響パターンの分布を用いて学習
を行うことにより得られるＨＭＭ(Hidden Markov Mode
l)等の確率モデルを用いることができる。また、概念表
記Ｃとしては、概念表記関数である識別関数ｆ_nを用い
ることができる。

【００４８】なお、音声表記Ｐとして用いる確率モデル
を生成するための学習方法等については、例えば、Kein
osuke Fukunaga, "Statistical Pattern Recognition",
Academic Press, 1990や、Lawence Rabiner, Biing-Hw
ang Juang（古井監訳）、”音声認識の基礎（上、
下）”、ＮＴＴアドバンステクノロジ株式会社、１９９
５等に、その詳細が記載されている。

【００４９】セレクタ１２は、注目事物についての複数
の識別結果それぞれを、式（１）で定義する単語の形の
集合として、最適単語列出力部４に供給する。

【００５０】即ち、いま、注目事物を適切に表現する複
数の単語を、ｗ₁，ｗ₂，・・・と表すと、セレクタ１２
は、この複数の単語ｗ₁，ｗ₂，・・・の集合を、最適単
語列出力部４に供給する。

【００５１】ここで、複数の単語ｗ₁，ｗ₂，・・・の集
合（単語集合）Ｗを、次式のように定義する。

【００５２】Ｗ＝｛ｗ₁，ｗ₂，・・・｝・・・（２）また、複数の単語ｗ₁，ｗ₂，・・・の並び（単語列）ｓ
を、次式のように定義する。

【００５３】ｓ＝［ｗ₁，ｗ₂，・・・］・・・（３）さらに、複数の単語列ｓ₁，ｓ₂，・・・の集合（単語列
集合）Ｓを、次式のように定義する。

【００５４】Ｓ＝｛ｓ₁，ｓ₂，・・・｝・・・（４）なお、単語集合Ｗは、複数の単語ｗ₁，ｗ₂，・・・の集
合であり、その複数の単語ｗ₁，ｗ₂，・・・の並びに意
味はない（同一の単語からなる単語集合は、その単語の
並びが異なっていても、同一の集合である）。一方、単
語列は、複数の単語ｗ₁，ｗ₂，・・・の並びであり、そ
の複数の単語ｗ₁，ｗ₂，・・・の並びに意味がある（同
一の単語からなる単語列であっても、その単語の並びが
異なっていれば、異なる単語列である）。

【００５５】最適単語列出力部４は、単語集合出力部３
（セレクタ１２）から、注目事物を適切に表現する複数
の単語ｗ₁，ｗ₂，・・・の集合Ｗを受信すると、その単
語集合を構成する単語から、注目事物を適切に表現する
単語の並びとしての単語列（あるいは文）（以下、適
宜、最適単語列という）を構成して出力する。

【００５６】次に、図２は、図１の最適単語列出力部４
の構成例を示している。

【００５７】単語集合出力部３（図１）からの単語集合
（以下、適宜、入力単語集合という）Ｗは、単語列生成
部２１に入力されるようになっており、単語列生成部２
１は、入力単語集合Ｗを構成する複数の単語（以下、適
宜、入力単語という）ｗ₁，ｗ₂，・・・すべてを用いて
構成される、単語の順列（以下、適宜、入力単語列とい
う）ｓ₁，ｓ₂，・・・すべてを生成し、そのすべての単
語列の集合（以下、適宜、入力単語列集合という）Ｓ
を、最適単語列探索部２２に出力するようになってい
る。ここで、単語集合出力部３が出力する単語集合が、
Ｍ個の単語から構成される場合には、単語列生成部２１
では、Ｍ！通りの単語列が生成されることになる（！は
階乗を表す）。

【００５８】最適単語列探索部２２は、登録単語列デー
タベース２３を参照することにより、単語列生成部２１
からの入力単語列集合Ｓを構成する入力単語列ｓ₁，
ｓ₂，・・・から、最適単語列を探索して出力するよう
になっている。

【００５９】即ち、最適単語列探索部２２は、単語類似
度計算部３１、単語列類似度計算部３２、および選択部
３３から構成され、入力単語列集合Ｓを構成する入力単
語列ｓ₁，ｓ₂，・・・それぞれについて、登録単語列デ
ータベース２３に登録されている単語列（登録単語列）
それぞれとの単語列類似度を計算し、入力単語列ｓ₁，
ｓ₂，・・・の中から、最も大きい単語列類似度（値が
大きいほど、単語列どうしの類似度が高いものとする）
が得られるものを選択して、最適単語列として出力する
ようになっている。

【００６０】具体的には、単語類似度計算部３１は、入
力単語列ｓ_iを構成する各入力単語ｗ_ijと、登録単語列
を構成する、入力単語ｗ_ijに対応する単語（入力単語ｗ
_ijと同一の順番に位置する単語）との単語類似度を、概
念表記関数に基づいて演算し、単語列類似度計算部３２
に出力するようになっている。

【００６１】ここで、単語ｗ_ijとは、単語列ｓ_iの先頭
からｊ番目に位置する単語を意味する。

【００６２】単語列類似度計算部３２は、入力単語列ｓ
_iと登録単語列の単語列類似度を、入力単語列ｓ_iを構成
する各単語と、その単語に対応する、登録単語列を構成
する単語との単語類似度に基づいて演算し、選択部３３
に出力するようになっている。

【００６３】選択部３３は、入力単語列集合Ｓを構成す
る入力単語列ｓ₁，ｓ₂，・・・のうち、登録単語列との
単語列類似度を最も大きくするものを選択し、最適単語
列として出力するようになっている。

【００６４】登録単語列データベース２３は、例えば、
図３に示すような単語辞書と単語列辞書を記憶してい
る。即ち、単語辞書には、図３（Ａ）に示すように、登
録単語が、式（１）で定義したように、テキスト表記、
音声表記、および概念表記を対応付けた形で登録されて
いる。単語列辞書には、複数の登録単語を、ある意味と
なる並びに並べた単語列（登録単語列）が登録されてい
る。

【００６５】なお、登録単語列が登録されている単語列
辞書は、必ずしも、登録単語列データベース２３に記憶
させておく必要はない。即ち、登録単語列は、登録単語
列データベース２３に、文法等の規則を登録しておけ
ば、その規則に基づいて、単語辞書に登録された登録単
語を並べることにより作成することができる。

【００６６】次に、図２の最適単語列出力部４の処理に
ついて説明する。

【００６７】単語列生成部２１は、単語集合出力部３
（図１）から、入力単語集合Ｗを受信すると、その入力
単語集合Ｗを構成する複数の入力単語ｗ₁，ｗ₂，・・・
を用いて構成される入力単語列ｓ₁，ｓ₂，・・・を生成
し、その単語列の集合（入力単語列集合）Ｓを、最適単
語列探索部２２に出力する。

【００６８】最適単語列探索部２２は、単語列生成部２
１から入力単語列集合Ｓを受信すると、登録単語列デー
タベース２３を参照しながら、入力単語列集合Ｓを構成
する入力単語列ｓ₁，ｓ₂，・・・の中から、最適単語列
を探索して出力する最適単語列探索処理を行う。

【００６９】即ち、図４のフローチャートに示すよう
に、最適単語列探索処理では、まず最初に、ステップＳ
１において、単語類似度計算部３１は、入力単語列集合
Ｓの中から、ある単語列ｓ_iを、注目単語列として選択
し、ステップＳ２に進む。ステップＳ２では、単語類似
度計算部３１は、登録単語列データベース２３の辞書か
ら、ある登録単語列を、注目登録単語列として選択し、
注目単語列ｓ_iを構成する各単語と、その単語に対応す
る、注目登録単語列の単語との単語類似度を、概念表記
関数に基づいて計算する。

【００７０】即ち、いま、単語類似度を計算しようとし
ている注目単語列または登録単語列の単語を、それぞれ
ｗ＿１またはｗ＿２と表すと、これらの単語ｗ＿１，ｗ
＿２は、式（１）から次式で表すことができる。

【００７１】ｗ＿１＝（Ｌ＿１，Ｐ＿１，Ｃ＿１）ｗ＿２＝（Ｌ＿２，Ｐ＿２，Ｃ＿２）・・・（５）但し、Ｌ＿１，Ｐ＿１，Ｃ＿１は、単語ｗ＿１のテキス
ト表記、音声表記、概念表記を、それぞれ表す。同様
に、Ｌ＿２，Ｐ＿２，Ｃ＿２は、単語ｗ＿２のテキスト
表記、音声表記、概念表記を、それぞれ表す。

【００７２】概念表記として用いる概念表記関数として
は、例えば、ガウス確率分布関数を用いることができ、
いま、平均ベクトルがｘで、共分散行列がΣのガウス分
布確率関数を、Ｎ（ｘ，Σ）で表すと、式（５）の概念
表記Ｃ＿１，Ｃ＿２は、次式で表すことができる。

【００７３】Ｃ＿１＝Ｎ（ｘ₁，Σ₁）Ｃ＿２＝Ｎ（ｘ₂，Σ₂）・・・（６）但し、ｘ₁またはΣ₁は、単語ｗ＿１が表す個々の具体的
な事物から得られる特徴パラメータの平均値または共分
散行列をそれぞれ表す。同様に、ｘ₂またはΣ₂は、単語
ｗ＿２が表す個々の具体的な事物から得られる特徴パラ
メータの平均値または共分散行列をそれぞれ表す。

【００７４】なお、本実施の形態では、上述したよう
に、入力単語の概念表記関数は、その入力単語を識別す
るための識別関数に等しく、従って、ここでは、図１の
識別器１１ｎが有する識別関数ｆ_nは、ガウス確率分布
関数によって表される。

【００７５】ここで、注目単語列の単語ｗ＿１が表す事
物を識別するための識別関数としてのガウス確率分布関
数Ｎ（ｘ₁，Σ₁）を規定する平均値ｘ₁および共分散行
列Σ₁は、その単語ｗ＿１が表す個々の具体的な事物か
ら得られる特徴パラメータを用いて学習を行うことによ
り求められる。また、登録単語列の単語ｗ＿２が表す事
物についての概念表記関数としてのガウス確率分布関数
Ｎ（ｘ₂，Σ₂）を規定する平均値ｘ₂および共分散行列
Σ₂も、その単語ｗ＿２が表す個々の具体的な事物から
得られる特徴パラメータを用いて学習を行うことにより
求められる。

【００７６】概念表記関数として、ガウス確率分布関数
を用いる場合、２つの単語ｗ＿１とｗ＿２との単語類似
度Ｒ_w（ｗ＿１，ｗ＿２）は、それぞれの概念表記関数
としてのガウス分布のバタチャリア(Bhattacharyya)距
離を用いて、例えば、次式で計算することができる。

【００７７】

【数１】・・・（７）但し、ｌｎ（ｘ）は、ｘの自然対数を表す。

【００７８】ここで、ガウス分布のバタチャリア距離の
計算にあたっては、一般には、平均ベクトルも考慮され
るが、ここでは、２つの単語についてのガウス分布どう
しの相対的な形状の差異（２つのガウス分布の絶対的な
位置を無視して比較を行った場合、即ち、２つのガウス
分布の平行移動のみを許して比較した場合に（従って、
回転や縮小、拡大は除く）、その２つのガウス分布の形
状が似ているかどうか）に注目するため、式（７）は、
共分散行列のみを用いた式になっている。

【００７９】即ち、式（７）によれば、単語ｗ＿１また
はｗ＿２それぞれが表す事物から得られる特徴パラメー
タのガウス分布どうしの相対的な形状が似ているかどう
かによって、２つの単語ｗ＿１とｗ＿２との単語類似度
Ｒ_w（ｗ＿１，ｗ＿２）が求められる。

【００８０】なお、式（７）によって求められる単語類
似度Ｒ_w（ｗ＿１，ｗ＿２）は、単語ｗ＿１またはｗ＿
２それぞれについてのガウス分布どうしの相対的な形状
が似ているほど、即ち、単語ｗ＿１とｗ＿２の意味的な
類似性が高いほど、大きな値となる。

【００８１】ステップＳ２において、注目単語列を構成
する各単語と、その単語に対応する、注目登録単語列の
単語との単語類似度が計算されると、ステップＳ３に進
み、単語類似度計算部３１は、すべての登録単語列を、
注目登録単語列として、ステップＳ２における単語類似
度の計算を行ったかどうかを判定する。ステップＳ３に
おいて、まだ、すべての登録単語列を、注目登録単語列
として、ステップＳ２における単語類似度の計算を行っ
ていないと判定された場合、ステップＳ２に戻り、まだ
注目登録単語列としていない登録単語列を、新たに注目
登録単語列として、以下、同様の処理が繰り返される。

【００８２】また、ステップＳ３において、すべての登
録単語列を、注目登録単語列として、ステップＳ２にお
ける単語類似度の計算を行ったと判定された場合、ステ
ップＳ４に進み、入力単語列集合の中に、まだ、注目単
語列としていない入力単語列があるかどうかが判定され
る。ステップＳ４において、入力単語列集合の中に、ま
だ、注目単語列としていない入力単語列があると判定さ
れた場合、ステップＳ１に戻り、その、まだ注目単語列
としていない入力単語列を、新たに注目単語列として、
以下、ステップＳ２以降の処理を繰り返す。

【００８３】一方、ステップＳ４において、入力単語列
集合の中に、まだ、注目単語列としていない入力単語列
がないと判定された場合、即ち、入力単語列集合を構成
するすべての入力単語列について、登録単語列データベ
ース２３に登録されている登録単語列それぞれを構成す
る単語との単語類似度の計算を行った場合、ステップＳ
５に進み、単語列類似度計算部３２において、入力単語
列集合を構成する各単語列について、各登録単語列との
単語列類似度が計算される。

【００８４】即ち、単語類似度計算部３１において求め
られた単語類似度は、単語列類似度計算部３２に供給さ
れ、単語列類似度計算部３２では、ステップＳ５におい
て、単語類似度計算部３１からの単語類似度を用いて、
入力単語列集合を構成する各単語列について、各登録単
語列との単語列類似度が計算される。

【００８５】即ち、入力単語列集合を構成するある入力
単語列をｓ₁とするとともに、ある登録単語列をｓ₂とす
る。さらに、単語列ｓ₁またはｓ₂を構成する単語の数
を、それぞれＬ（ｓ₁）またはＬ（ｓ₂）と表すと、単語
列類似度計算部３２では、２つの単語列ｓ₁とｓ₂の単語
列類似度Ｒ_s（ｓ₁，ｓ₂）が、例えば、次式にしたがっ
て計算される。Ｌ（ｓ₁）＝Ｌ（ｓ₂）の場合

【００８６】

【数２】Ｌ（ｓ₁）≠Ｌ（ｓ₂）の場合Ｒ_s（ｓ₁，ｓ₂）＝０・・・（８）但し、単語ｗ_ijは、上述したように、単語列ｓ_iの先頭
からｊ番目の単語を意味する。

【００８７】従って、入力単語列ｓ₁と、登録単語列ｓ₂
とが、同一の数の単語で構成される場合には、それらの
単語列類似度Ｒ_s（ｓ₁，ｓ₂）は、入力単語列ｓ₁を構成
する各単語と、その単語に対応する、登録単語列ｓ₂を
構成する単語との単語類似度の総和として求められる。
また、入力単語列ｓ₁と、登録単語列ｓ₂とが、異なる数
の単語で構成される場合には、それらの単語列類似度Ｒ
_s（ｓ₁，ｓ₂）は、０とされる。

【００８８】なお、式（８）によって求められる、単語
列ｓ₁とｓ₂の単語列類似度Ｒ_s（ｓ₁，ｓ₂）も、式
（７）によって求められる単語類似度Ｒ_w（ｗ＿１，ｗ
＿２）と同様に、単語列ｓ₁とｓ₂の意味的な類似性が高
いほど、大きな値となる。

【００８９】単語列類似度計算部３２は、ステップＳ５
において、入力単語列集合を構成する各単語列につい
て、各登録単語列との単語列類似度を計算すると、その
単語列類似度を、選択部３３に供給する。

【００９０】選択部３３では、ステップＳ６において、
単語列類似度計算部３２からの単語列類似度の最大値が
求められ、その最大の単語列類似度が得られる入力単語
列と登録単語列の組合せが選択される。そして、ステッ
プＳ７に進み、選択部３３は、ステップＳ６で選択した
入力単語列を、最適単語列として出力し、最適単語列探
索処理を終了する。

【００９１】即ち、入力単語列集合、または登録単語列
データベース２３に登録されている登録単語列の集合
を、それぞれＳまたはＳ’とし、それぞれが、次のよう
に表されるとする。

【００９２】Ｓ＝｛ｓ₁，ｓ₂，・・・｝Ｓ’＝｛ｓ₁’，ｓ₂’，・・・｝・・・（９）但し、ｓ₁，ｓ₂，・・・は、それぞれ入力単語列を表
し、ｓ₁’，ｓ₂’，・・・は、それぞれ登録単語列を表
す。

【００９３】この場合、選択部３３では、次式にしたが
って、入力単語列集合Ｓの中から、最適単語列ｓ
_suitableが求められる。

【００９４】

【数３】・・・（１０）但し、ｍａｘ｛ｘ｝は、ｘの最大値を表し、ａｒｇｍａ
ｘ｛ｘ｝は、Ｘの最大値を与える引数を表す。

【００９５】以上のように、最適単語列出力部４に対し
て、単語を、その単語が表す物事を表現する概念表記関
数とともに入力し、最適単語列出力部４において、その
入力単語と、登録単語列データベース２３に登録されて
いる登録単語との単語類似度を、概念表記関数に基づい
て演算するようにしたので、入力単語と同一の登録単語
が、登録単語列データベース２３に登録されていなくて
も、入力単語と登録単語との単語類似度を計算し、さら
に、入力単語列と登録単語列との単語列類似度も計算す
ることができる。その結果、大規模な辞書がなくても、
多くの単語について、単語どうしの類似度の計算が可能
となり、さらに、複雑な文法規則等がなくても、単語の
集合を、適切な意味となる単語列に変換することができ
る。

【００９６】即ち、例えば、２次元の方向を表す特徴パ
ラメータ空間において、単語「上」、「下」、「左」、
「右」の概念表記関数としてのガウス分布は、図５に示
すように、上、下、左、右方向に行くほど、それぞれ出
現確率が高くなるようなものになると考えられる。な
お、図５においては、図面に対して垂直な方向が確率の
高さを表し、また、確率が等しい部分を、線で結んで表
してある。

【００９７】いま、登録単語列データベース２３におい
て、登録単語として、「左」と「上」が登録されている
とともに、登録単語列として、「左上」が登録されてい
るとして、単語集合として、単語列生成部２１（図２）
に、登録単語列データベース２３には登録されていない
単語「下」および「右」の集合が入力されたとする。

【００９８】この場合、単語列生成部２１では、入力単
語列として、「下右」と「右下」とが生成され、最適単
語列探索部２２に供給される。

【００９９】最適単語列探索部２２では、単語類似度計
算部３１において、入力単語列「下右」を構成する単語
それぞれと、その単語に対応する、登録単語列「左上」
を構成する単語との単語類似度が計算されるとともに、
入力単語列「右下」を構成する単語それぞれと、その単
語に対応する、登録単語列「左上」を構成する単語との
単語類似度が計算される。

【０１００】即ち、入力単語列「下右」については、単
語「下」と単語「左」との単語類似度、および単語
「右」と単語「上」との単語類似度が計算される。ま
た、入力単語「右下」については、単語「右」と単語
「左」との単語類似度、および単語「下」と単語「上」
との単語類似度が計算される。

【０１０１】そして、単語列類似度計算部３２におい
て、単語「下」と単語「左」との単語類似度、および単
語「右」と単語「上」との単語類似度の和が、入力単語
列「下右」と登録単語列「左上」との単語列類似度とし
て計算されるとともに、単語「右」と単語「左」との単
語類似度、および単語「下」と単語「上」との単語類似
度の和が、入力単語列「右下」と登録単語列「左上」と
の単語列類似度として計算される。

【０１０２】いま、図５に示した単語「上」、「下」、
「左」、「右」の概念表記関数としてのガウス分布か
ら、それぞれの形状の概形は、図６に示すようなものと
なる。図６から明らかなように、単語「上」と「下」の
ガウス分布の形状は類似しており、また、単語「左」と
「右」のガウス分布の形状も類似しているが、単語
「上」と、「右」や「左」のガウス分布の形状は似てお
らず、単語「下」と「右」や「左」のガウス分布の形状
も似ていない。

【０１０３】従って、単語「右」と単語「左」との単語
類似度、および単語「下」と単語「上」との単語類似度
は、いずれも大きな値となるが、単語「下」と単語
「左」との単語類似度、および単語「右」と単語「上」
との単語類似度は、いずれも小さな値となる。

【０１０４】その結果、単語「右」と単語「左」との単
語類似度、および単語「下」と単語「上」との単語類似
度の和である、入力単語列「右下」と登録単語列「左
上」との単語列類似度は大きな値となり、単語「下」と
単語「左」との単語類似度、および単語「右」と単語
「上」との単語類似度の和である、入力単語列「下右」
と登録単語列「左上」との単語列類似度は小さな値とな
る。

【０１０５】従って、選択部３３では、単語列類似度が
大きい、入力単語列「右下」と登録単語列「左上」の組
が選択され、入力単語列「右下」が、最適単語列として
出力される。即ち、入力単語列としては、「下右」と
「右下」が得られるが、これらのうち、単語の並びとし
てより適切な「右下」が、最適単語列として出力され
る。

【０１０６】また、例えば、登録単語列データベース２
３において、登録単語として、「赤い」と「靴」が登録
されているとともに、登録単語列として、「赤い靴」が
登録されているとして、単語集合として、単語列生成部
２１に、登録単語列データベース２３には登録されてい
ない単語「白い」と、登録単語列データベース２３に登
録されている単語「靴」の集合が入力された場合でも、
上述の場合と同様にして、単語列「白い靴」が、最適単
語列として出力されることになる。

【０１０７】以上のように、登録単語列データベース２
３に登録されていない入力単語について、単語類似度を
計算し、さらに、そのような入力単語を含む入力単語列
について、単語列類似度も計算することができるので、
大規模な辞書がなくても、多くの単語について、単語ど
うしの類似度の計算が可能となり、さらに、複雑な文法
規則や、入力単語列と同一の単語からなる単語列が、登
録単語列として登録されていなくても、単語の集合を、
適切な意味となる単語列（最適単語列）に変換すること
ができる。

【０１０８】次に、図７は、図２の登録単語列データベ
ース２３に記憶させる単語辞書および単語列辞書を作成
するための学習処理を行う学習装置の一実施の形態の構
成例を示している。

【０１０９】センサ部４１は、図２のセンサ部１と同様
に構成され、学習の対象とする具体的な事物（以下、適
宜、学習対象事物という）から受ける刺激を感知するよ
うになっており、その感知の結果を、前処理部４２に出
力するようになっている。

【０１１０】前処理部４２は、図２の前処理部２と同様
に構成され、センサ部１の出力を処理し、その出力か
ら、特徴パラメータを抽出するようになっている。即
ち、前処理部４２は、センサ部４１によって、学習対象
事物が観測されることにより得られる情報についての特
徴パラメータを求め、学習部４３に出力する。

【０１１１】学習部４３には、前処理部４２から、学習
対象事物についての特徴パラメータが供給される他、テ
キスト入力部４４または音声入力部４５から、学習対象
事物を表現する単語列を構成する各単語を表す文字列ま
たは音声が、それぞれ供給されるようになっている。そ
して、学習部４３は、学習対象事物を表現する単語列を
構成する各単語についての特徴パラメータを用いて学習
を行うことにより、各単語によって表される事物を表現
する概念表記関数を生成するとともに、テキスト入力部
４４または音声入力部４５から供給される文字列または
音声に基づいて、テキスト表記または音声表記をそれぞ
れ生成し、各単語についてのテキスト表記、音声表記、
および概念表記関数を対応付けて、図３（Ｂ）に示した
ような単語辞書を作成するようになっている。さらに、
学習部４３は、学習対象事物を表現する単語列を登録し
た、図３（Ａ）に示したような単語列辞書を作成するよ
うにもなっている。

【０１１２】テキスト入力部４４は、例えば、キーボー
ド等で構成され、学習対象事物を表現する単語列を構成
する各単語を表す文字列を入力するときに操作される。
音声入力部４５は、例えば、マイク等で構成され、そこ
には、学習対象事物を表現する単語列を構成する各単語
を発話した音声が入力される。

【０１１３】次に、図８のフローチャートを参照して、
図７の学習装置による学習処理について説明する。

【０１１４】まず最初に、ステップＳ１１では、センサ
部４１において、学習対象事物から受ける刺激が感知さ
れるとともに、テキスト入力部４４または音声入力部４
５から、学習対象事物を表現する単語列を構成する各単
語を表す文字列または音声が、それぞれ入力される。そ
して、センサ部４１による感知の結果は、前処理部４２
に供給され、テキスト入力部４４または音声入力部４５
それぞれからの文字列または音声は、いずれも、学習部
４３に供給される。

【０１１５】前処理部４２は、センサ部４１による感知
の結果を受信すると、ステップＳ１２において、その感
知の結果から、特徴パラメータを抽出し、学習部４３に
供給する。

【０１１６】なお、センサ部４１においては、学習しよ
うとしている単語列によって表現される、異なる学習対
象事物（例えば、学習しようとしている単語列が、青い
ボールであれば、具体的な個々の事物としての各種の青
いボール（例えば、青い野球のボールや、青いサッカー
ボールなど）が、ここでいう異なる学習対象事物に該当
する）から受ける刺激が感知され、前処理部４２に供給
される。従って、前処理部４２では、そのような異なる
学習対象事物から受ける刺激それぞれについて、特徴パ
ラメータが抽出され、学習部４３に供給される。従っ
て、学習しようとしている単語列を構成する１つの単語
に注目すれば、前処理部４２では、その単語によって表
現される、異なる事物から受ける刺激から得られる複数
の特徴パラメータが抽出され、学習部４３に供給され
る。

【０１１７】学習部４３は、学習しようとしている単語
列を構成する各単語について、その単語によって表現さ
れる、異なる事物についての特徴パラメータを受信する
と、ステップＳ１３において、学習しようとしている単
語列を構成する単語それぞれについて得られた複数の特
徴パラメータを用いて学習を行い、その分布を表す、例
えば、そのガウス確率分布関数等を、各単語についての
概念表記関数として求める。そして、学習部４３は、テ
キスト入力部４４または音声入力部４５からの文字列か
ら、学習しようとしている単語列を構成する単語それぞ
れについてのテキスト表記または音声表記を生成し、ス
テップＳ１４において、それらに、各単語の概念表記関
数を対応付けることで、単語辞書を作成するとともに、
学習対象事物を表現する単語列を登録した単語列辞書を
作成し、いま学習の対象となっている単語列を対象とす
る学習処理を終了する。

【０１１８】なお、ある単語によって表現される、異な
る事物それぞれについての特徴パラメータ、即ち、複数
の特徴パラメータを用いて学習を行う方法としては、例
えば、上述の文献"Statistical Pattern Recognition"
や、”音声認識の基礎（上、下）”等に記載されている
方法を用いることができる。

【０１１９】次に、上述した一連の処理は、ハードウェ
アにより行うこともできるし、ソフトウェアにより行う
こともできる。一連の処理をソフトウェアによって行う
場合には、そのソフトウェアを構成するプログラムが、
専用のハードウェアとしての最適単語列出力装置や学習
装置に組み込まれているコンピュータや、汎用のコンピ
ュータ等にインストールされる。

【０１２０】そこで、図９を参照して、上述した一連の
処理を実行するプログラムをコンピュータにインストー
ルし、コンピュータによって実行可能な状態とするため
に用いられる、そのプログラムが記録されている記録媒
体について説明する。

【０１２１】プログラムは、図９（Ａ）に示すように、
コンピュータ１０１に内蔵されている記録媒体としての
ハードディスク１０２や半導体メモリ１０３に予め記録
しておくことができる。

【０１２２】あるいはまた、プログラムは、図９（Ｂ）
に示すように、フロッピーディスク１１１、CD-ROM(Com
pact Disc Read Only Memory)１１２，MO(Magneto opti
cal)ディスク１１３，DVD(Digital Versatile Disc)１
１４、磁気ディスク１１５、半導体メモリ１１６などの
記録媒体に、一時的あるいは永続的に格納（記録）して
おくことができる。このような記録媒体は、いわゆるパ
ッケージソフトウエアとして提供することができる。

【０１２３】なお、プログラムは、上述したような記録
媒体からコンピュータにインストールする他、図９
（Ｃ）に示すように、ダウンロードサイト１２１から、
ディジタル衛星放送用の人工衛星１２２を介して、コン
ピュータ１０１に無線で転送したり、LAN(Local Area N
etwork)、インターネットといったネットワーク１３１
を介して、コンピュータ１２３に有線で転送し、コンピ
ュータ１０１において、内蔵するハードディスク１０２
などにインストールすることができる。

【０１２４】また、本明細書において、コンピュータに
各種の処理を行わせるためのプログラムを記述するステ
ップは、必ずしもフローチャートとして記載された順序
に沿って時系列に処理する必要はなく、並列的あるいは
個別に実行される処理（例えば、並列処理あるいはオブ
ジェクトによる処理）も含むものである。

【０１２５】次に、図１０は、図９のコンピュータ１０
１の構成例を示している。

【０１２６】コンピュータ１０１は、図１０に示すよう
に、CPU(Central Processing Unit)１４２を内蔵してい
る。CPU１４２には、バス１４１を介して、入出力イン
タフェース１４５が接続されており、CPU１４２は、入
出力インタフェース１４５を介して、ユーザによって、
キーボードやマウス等で構成される入力部１４７が操作
されることにより指令が入力されると、それにしたがっ
て、図９（Ａ）の半導体メモリ１０３に対応するROM(Re
ad Only Memory)１４３に格納されているプログラムを
実行する。あるいは、また、CPU１４２は、ハードディ
スク１０２に格納されているプログラム、衛星１２２若
しくはネットワーク１３１から転送され、通信部１４８
で受信されてハードディスク１０２にインストールされ
たプログラム、またはドライブ１４９に装着されたフロ
ッピディスク１１１、CD-ROM１１２、MOディスク１１
３、DVD１１４、若しくは磁気ディスク１１５から読み
出されてハードディスク１０２にインストールされたプ
ログラムを、RAM(Random Access Memory)１４４にロー
ドして実行する。そして、CPU１４２は、その処理結果
を、例えば、入出力インタフェース１４５を介して、LC
D(Liquid CryStal Display)等で構成される表示部１４
６に、必要に応じて出力する。

【０１２７】なお、本実施の形態においては、センサ部
１や４１によって感知される事物からの刺激を用いて、
その物事を表現する概念表記関数を求めるようにした
が、概念表記関数は、事物からの刺激ではなく、例え
ば、その事物を表現する単語を発話した音声等を用いて
求めるようにすることも可能である。但し、事物からの
刺激を用いて、その物事を表現する概念表記関数を求め
る場合には、現実世界に存在する具体的な事物と、その
事物を表現する単語とを対応付けることができ、その結
果、例えば、ある事物から受ける刺激を、各種のセンサ
によって感知し、その感知の結果から、その事物を適切
に表現する単語列を出力するようなロボット、その他
の、ユーザや現実世界の環境と関わりながら、言語処理
を行うシステムを実現することが可能となる。

【０１２８】また、本実施の形態では、概念表記関数と
して、ガウス確率分布関数を用いるようにしたが、概念
表記関数としては、ガウス確率分布関数以外の確率密度
関数、さらには、ＨＭＭ等に代表される離散確率分布関
数等を用いることも可能である。

【０１２９】さらに、本実施の形態では、２つの単語ど
うしの単語類似度を、概念表記関数のバタチャリア距離
を用いて求めるようにしたが、単語類似度は、その他、
例えば、概念表記関数のカルバックダイバージェンス等
に基づいて求めることも可能である。即ち、単語類似度
は、２つの単語それぞれの概念表記関数によって表され
る分布等の形状の類似性が反映される物理量に基づいて
求めることが可能である。

【０１３０】また、本実施の形態では、最適単語列出力
部４による最適単語列の出力方法については、特に言及
しなかったが、最適単語列は、例えば、その最適単語列
を構成する単語の並びの順番で、各単語を表示すること
もできるし、あるいは、音声（合成音）で出力すること
もできる。最適単語列の表示は、各単語のテキスト表記
を用いることで行うことができ、また、最適単語列の音
声による出力は、各単語の音声表記を用いて合成音を生
成することで行うことができる。

【０１３１】

【発明の効果】本発明の第１の情報処理装置および第１
の情報処理方法、並びに第１の記録媒体によれば、単語
が、その単語が表す物事を表現する関数である概念表記
関数とともに入力され、その概念表記関数に基づいて、
単語と登録単語との類似度である単語類似度が演算され
る。従って、入力された単語と同一の単語が、登録単語
として登録されていなくても、その入力され単語と登録
単語との単語類似度を計算することが可能となる。

【０１３２】本発明の第２の情報処理装置および第２の
情報処理方法、並びに第２の記録媒体によれば、辞書に
登録する単語である登録単語が表す物事を表現する関数
である概念表記関数が生成され、登録単語と、その登録
単語についての概念表記関数とが対応付けられる。従っ
て、概念表記関数を用いることによって、単語どうしの
類似度を計算することが可能となる。

【図面の簡単な説明】

【図１】本発明を適用した最適単語列出力装置の一実施
の形態の構成例を示すブロック図である。

【図２】図１の最適単語列出力部４の構成例を示すブロ
ック図である。

【図３】図２の登録単語列データベース２３に記憶され
た単語辞書および単語列辞書を示す図である。

【図４】図２の最適単語列探索部２２が行う最適単語列
探索処理を説明するためのフローチャートである。

【図５】２次元の方向を表す特徴パラメータ空間におけ
るガウス分布を示す図である。

【図６】概念表記関数によって表されるガウス分布の概
形を示す図である。

【図７】本発明を適用した学習装置の一実施の形態の構
成例を示すブロック図である。

【図８】図７の学習装置による学習処理を説明するため
のフローチャートである。

【図９】本発明を適用した記録媒体を説明するための図
である。

【図１０】図９のコンピュータ１０１の構成例を示すブ
ロック図である。

【符号の説明】

１センサ部，２前処理部，３単語集合出力
部，４最適単語列出力部，１１₁乃至１１_N 識別
器，１２セレクタ，２１単語列生成部，２２
最適単語列探索部，２３登録単語列データベース，
３１単語類似度計算部，３２単語列類似度計算
部，３３選択部，４１センサ部，４２前処
理部，４３学習部，４４テキスト入力部，４
５音声入力部，１０１コンピュータ，１０２
ハードディスク，１０３半導体メモリ，１１１
フロッピーディスク，１１２ CD-ROM，１１３ MO
ディスク，１１４ DVD，１１５磁気ディスク，
１１６半導体メモリ，１２１ダウンロードサイ
ト，１２２衛星，１３１ネットワーク，１４１
バス，１４２ CPU，１４３ ROM，１４４ RA
M，１４５入出力インタフェース，１４６表示
部，１４７入力部，１４８通信部，１４９
ドライブ

Claims

【特許請求の範囲】

【請求項１】入力された単語について、辞書に登録さ
れた単語である登録単語との類似度を求める情報処理装
置であって、単語を、その単語が表す物事を表現する関数である概念
表記関数とともに入力する入力手段と、前記概念表記関数に基づいて、前記単語と登録単語との
類似度である単語類似度を演算する単語類似度演算手段
とを含むことを特徴とする情報処理装置。
【請求項２】前記辞書は、前記登録単語を、その登録
単語についての前記概念表記関数とともに記憶している
ことを特徴とする請求項１に記載の情報処理装置。
【請求項３】前記辞書を記憶している辞書記憶手段を
さらに含むことを特徴とする請求項２に記載の情報処理
装置。
【請求項４】前記概念表記関数は、前記単語が表す物
事から得られる情報を表現する関数であることを特徴と
する請求項１に記載の情報処理装置。
【請求項５】前記概念表記関数は、前記単語が表す物
事から受ける刺激を感知する感知手段の出力から得られ
る情報を表現する関数であることを特徴とする請求項４
に記載の情報処理装置。
【請求項６】前記感知手段は、光若しくは音を電気信
号に変換するデバイス、触覚センサ、温度センサ、また
は加速度センサであり、前記概念表記関数は、前記感知手段によって、前記単語
が表す物事を観測することによって得られるパラメータ
を表現する関数であることを特徴とする請求項５に記載
の情報処理装置。
【請求項７】前記概念表記関数は、確率密度関数また
は離散確率分布関数であることを特徴とする請求項１に
記載の情報処理装置。
【請求項８】前記単語類似度演算手段は、前記単語と
登録単語との単語類似度を、その単語および登録単語の
概念表記関数どうしのバタチャリア(Bhattacharyya)距
離またはカルバックダイバージェンスに基づいて演算す
ることを特徴とする請求項１に記載の情報処理装置。
【請求項９】前記入力手段は、単語の集合である単語
集合を、各単語についての前記概念表記関数とともに入
力し、前記辞書は、複数の登録単語を並べた登録単語列の集合
を、各登録単語についての前記概念表記関数とともに記
憶しており、前記単語集合を構成する単語を並べた単語列を生成する
単語列生成手段と、前記単語列を構成する各単語と、その単語に対応する、
前記登録単語列を構成する登録単語との前記単語類似度
から、前記単語列と登録単語列との類似度である単語列
類似度を演算する単語列類似度演算手段と、前記単語列類似度に基づいて、前記単語集合を構成する
単語を所定の順番で並べた単語列を出力する出力手段と
をさらに含むことを特徴とする請求項１に記載の情報処
理装置。
【請求項１０】入力された単語について、辞書に登録
された単語である登録単語との類似度を求める情報処理
方法であって、単語を、その単語が表す物事を表現する関数である概念
表記関数とともに入力する入力ステップと、前記概念表記関数に基づいて、前記単語と登録単語との
類似度である単語類似度を演算する単語類似度演算ステ
ップとを含むことを特徴とする情報処理方法。
【請求項１１】入力された単語について、辞書に登録
された単語である登録単語との類似度を求める情報処理
を、コンピュータに行わせるためのプログラムが記録さ
れている記録媒体であって、単語を、その単語が表す物事を表現する関数である概念
表記関数とともに入力する入力ステップと、前記概念表記関数に基づいて、前記単語と登録単語との
類似度である単語類似度を演算する単語類似度演算ステ
ップとを含むプログラムが記録されていることを特徴と
する記録媒体。
【請求項１２】入力された単語との類似度を計算する
ために用いる辞書を作成する情報処理装置であって、前記辞書に登録する単語である登録単語が表す物事を表
現する関数である概念表記関数を生成する関数生成手段
と、前記登録単語と、その登録単語についての前記概念表記
関数とを対応付ける対応付け手段とを含むことを特徴と
する情報処理装置。
【請求項１３】前記概念表記関数は、前記単語が表す
物事から得られる情報を表現する関数であることを特徴
とする請求項１２に記載の情報処理装置。
【請求項１４】前記概念表記関数は、前記単語が表す
物事から受ける刺激を感知する感知手段の出力から得ら
れる情報を表現する関数であることを特徴とする請求項
１３に記載の情報処理装置。
【請求項１５】前記感知手段は、光若しくは音を電気
信号に変換するデバイス、触覚センサ、温度センサ、ま
たは加速度センサであり、前記概念表記関数は、前記感知手段によって、前記単語
が表す物事を観測することによって得られるパラメータ
を表現する関数であることを特徴とする請求項１４に記
載の情報処理装置。
【請求項１６】前記概念表記関数は、確率密度関数ま
たは離散確率分布関数であることを特徴とする請求項１
２に記載の情報処理装置。
【請求項１７】入力された単語との類似度を計算する
ために用いる辞書を作成する情報処理方法であって、前記辞書に登録する単語である登録単語が表す物事を表
現する関数である概念表記関数を生成する関数生成ステ
ップと、前記登録単語と、その登録単語についての前記概念表記
関数とを対応付ける対応付けステップとを含むことを特
徴とする情報処理方法。
【請求項１８】入力された単語との類似度を計算する
ために用いる辞書を作成する情報処理を、コンピュータ
に行わせるためのプログラムが記録されている記録媒体
であって、前記辞書に登録する単語である登録単語が表す物事を表
現する関数である概念表記関数を生成する関数生成ステ
ップと、前記登録単語と、その登録単語についての前記概念表記
関数とを対応付ける対応付けステップとを含むプログラ
ムが記録されていることを特徴とする記録媒体。