JP3172511B2

JP3172511B2 - 類推語生成装置及び方法

Info

Publication number: JP3172511B2
Application number: JP22379299A
Authority: JP
Inventors: イヴ・ルパージュ
Original assignee: 株式会社エイ・ティ・アール音声翻訳通信研究所
Priority date: 1998-08-06
Filing date: 1999-08-06
Publication date: 2001-06-04
Anticipated expiration: 2019-08-06
Also published as: US6219633B1; JP2000112940A; EP0978793A2

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力された３つの
単位列から類推される類推語を生成する類推語生成装置
及び方法に関し、特に、その属性がある一定順序で与え
られるそれぞれ複数の単位にてなる入力された３つの単
位列に所定の類推関係で類推的に類似する、複数の単位
にてなる単位列を生成するための類推語生成装置及び方
法に関する。ここで、単位とは１つの文字、アルファベ
ット、単語又はこれに類するものである。

【０００２】

【従来の技術】従来、他の単語に形態論的に関連した新
たな単語を生成する１つの手順として、有限状態オート
マトンのような技術が用いられている。例えば、従来技
術文献１「キンモ・コスケンニエミ（Kimmo Koskenniem
i)，“２つのレベル−形態論：単語形式の認識及び生成
のための一般的計算モデル（Two level-Morphology:A G
eneral Computational Model for Word Form Recogniti
on and Production）”，Department of General Lingu
istics，University of Helsinki，1983年」は、所定の
形式を特定する属性であって、所定の形式を与えられた
幾つかの属性に対して１つの単語を生成する方法（以
下、第１の従来例という。）を提案している。

【０００３】例えば文字列”ｌｉｋｅ”及び属性”反義
語（又は反意語）”から文字列”ｕｎｌｉｋｅ”を生成
することについて考察する。第１の従来例において、属
性”反義語”が有限状態オートマトンに与えられ、ま
た、上記有限状態オートマトンが、この属性が与えられ
た単語の前に接頭辞、すなわち”ｕｎ”を挿入するタス
クに変換すれば、文字列”ｌｉｋｅ”は、接頭辞”ｕ
ｎ”が挿入されることによって、文字列”ｕｎｌｉｋ
ｅ”に変換されることが可能であり、従って、文字列”
ｌｉｋｅ”の反義語は”ｕｎｌｉｋｅ”として計算され
ることができる。同様に、文字列”ｋｎｏｗｎ”の反義
語も同様の方法を使用して計算することが可能であり、
従って、文字列”ｋｎｏｗｎ”の反義語は”ｕｎｋｎｏ
ｗｎ”として計算されることができる。

【０００４】従って、第１の従来例においては、新たな
文字列を生成するためには、文字列が有限状態オートマ
トンに与えられると同時に、属性を入力することが必要
である。それゆえ、有限状態オートマトンを実行するこ
とにより、入力された単語に類似しているが幾つかの異
なる属性を入力することによって、異なる単語を得るこ
とができる。また、特にすべての処理が有限状態オート
マトンによって実行されるために、第１の従来例は比較
的高速で処理されるという利点を有する。

【０００５】同様に、従来技術文献２「ユニックス・ユ
ーザ・コマンド（Unix user commands）, sed - ストリ
ーム・エディタ（stream editor）」は、一般的表現の
記述によって文字列を他の文字列に置換するための方法
（以下、第２の従来例という。）を提案している。

【０００６】例えば、文字列”ｍｉｒａｃｌｅ”を文字
列”ｍｉｒａｃｕｌｏｕｓ”に置き換える場合について
考察する。第２の従来例では、有限状態オートマトンに
文字列”ｍｉｒａｃｌｅ”と文字列”ｍｉｒａｃｕｌｏ
ｕｓ”が与えられ、上記有限状態オートマトンが最初に
文字列”ｍｉｒａｃｌｅ”を認識し、文字ストリームに
おけるその境界を設定し、さらにその境界内において文
字列”ｍｉｒａｃｌｅ”を文字列”ｍｉｒａｃｕｌｏｕ
ｓ”に置換すると、文字列”ｍｉｒａｃｌｅ”が文字ス
トリームにおいて認識されたときに、それを文字列”ｍ
ｉｒａｃｕｌｏｕｓ”に置換することができる。例え
ば、文字ストリーム”it was a miracle and fable hea
ling”において、文字列”ｍｉｒａｃｌｅ”は文字列”
ｍｉｒａｃｕｌｏｕｓ”に置換されることができる。従
って、第２の従来例の方法を実行すれば、ある文字列を
他の文字列に置換することができる。

【０００７】

【発明が解決しようとする課題】しかしながら、第１の
従来例は、有限状態オートマトンを使用することによっ
て単語の形式又は形態（form）を生成するために、処理
対象言語について接頭辞、接尾辞又は挿入辞として追加
可能なすべての文字列がまず登録される。それゆえ、第
１の従来例は、即時ではない処理対象言語の言語学的記
述を必要とする。従って、第１の従来例の場合、処理対
象言語の非即時の言語記述を確立するための専門作業員
を登録する必要がある。

【０００８】また、第２の従来例による方法は、有限状
態オートマトンを用いる方法を基礎としていることか
ら、有限状態オートマトンに文字列”ｍｉｒａｃｌｅ”
と文字列”ｍｉｒａｃｕｌｏｕｓ”を与えても、例えば
文字列”ｆａｂｌｅ”の文字列”ｆａｂｕｌｏｕｓ”に
よる置換は不可能である。しかしながら、文字列”ｆａ
ｂｕｌｏｕｓ”は文字列”ｆａｂｌｅ”に対して、文字
列”ｍｉｒａｃｕｌｏｕｓ”が文字列”ｍｉｒａｃｌ
ｅ”に対して有する関係と同一関係にある。従って、第
２の従来例は、類推的に類似する類推語同士の置換を実
行することができない。

【０００９】本発明の目的は以上の問題点を解決し、属
性を使用することなく、また、有限状態オートマトンを
用いることなく、入力される３つの単位列に基づいて、
類推的に類似する他の単位列である類推語を、従来例に
比較して高速で生成することができる類推語生成装置及
び方法を提供することにある。

【００１０】

【課題を解決するための手段】本願の第１の発明に係る
類推語生成装置は、所定の順序で入力される３つの第
１、第２及び第３の単位列に基づいて、所定の類推関係
で類推的に類似する属性を有する第４の単位列である類
推語を生成する類推語生成装置（１００）であって、行
列記憶手段（１０）を備え、１つの単位列ともう１つの
単位列の間で削除又は置き換えを行う単位の数を擬似距
離で表し、上記入力された３つの単位列を解析すること
により、上記入力された第１の単位列の最初の単位から
最後の単位までの各部分列と上記入力された第２の単位
列の最初の単位から最後の単位までの各部分列との間の
擬似距離を表す第１の擬似距離行列の一部の要素の位置
において、上記入力された第１の単位列の単位数（Ｌｅ
ｎ１）が、上記第１の単位列と上記第２の単位列との間
の擬似距離を表す、第１の擬似距離行列の最終行最終列
の要素の値（ｐ２）と、上記第１の単位列と上記第３の
単位列との間の擬似距離を表す、第２の擬似距離行列の
最終行最終列の要素の値（ｐ３）との加算値よりも大き
くなるように、上記第１の擬似距離行列における所定幅
の対角要素からなる対角バンドと、上記対角バンドの外
側に位置する所定幅の要素からなるエキストラバンドと
を含む制限された第１の擬似距離行列の複数の要素を計
算し、上記入力された第１の単位列の最初の単位から最
後の単位までの各部分列と上記入力された第３の単位列
の最初の単位から最後の単位までの各部分列との間の擬
似距離を表す第２の擬似距離行列の一部の要素の位置に
おいて、上記入力された第１の単位列の単位数（Ｌｅｎ
１）が、上記第１の単位列と上記第２の単位列との間の
擬似距離を表す、第１の擬似距離行列の最終行最終列の
要素の値（ｐ２）と、上記第１の単位列と上記第３の単
位列との間の擬似距離を表す、第２の擬似距離行列の最
終行最終列の要素の値（ｐ３）との加算値よりも大きく
なるように、上記第２の擬似距離行列における所定幅の
対角要素からなる対角バンドと、上記対角バンドの外側
に位置する所定幅の要素からなるエキストラバンドとを
含む制限された第２の擬似距離行列の複数の要素を計算
して上記計算した制限された第１又は第２の擬似距離行
列の複数の要素を上記行列記憶手段（１０）に記憶させ
る前処理手段（２，Ｓ２）と、上記入力された３つの第
１乃至第３の単位列と、生成される第４の単位列とから
なる４つの単位列が上記類推関係にあることを判断する
ためのパラメータであって、上記第４の単位列が生成さ
れたときに上記４つの単位列に共通する単位の数を表す
状態パラメータ（ｃｏｍ）を記憶するパラメータ記憶手
段（５１）と、上記入力された３つの単位列の長さ及び
上記行列記憶手段（１０）に記憶された制限された第１
と第２の擬似距離行列の各要素とに基づいて、上記状態
パラメータ（ｃｏｍ）の初期値を計算して上記パラメー
タ記憶手段（５１）に記憶した後（Ｓ６１）、上記パラ
メータ記憶手段（５１）に記憶された状態パラメータ
（ｃｏｍ）と上記行列記憶手段（１０）に記憶された制
限された第１と第２の擬似距離行列の各要素とに基づい
て、上記パラメータ記憶手段（５１）に記憶された状態
パラメータ（ｃｏｍ）を更新しながら（Ｓ７４）、上記
制限された第１の擬似距離行列における最終行最終列の
要素から第１行第１列の要素までの最短経路と、上記制
限された第２の擬似距離行列における最終行最終列の要
素から第１行第１列の要素までの最短経路とを、上記制
限された第１と第２の擬似距離行列のそれぞれにおける
ある要素から別の要素に対角方向、水平方向、又は垂直
方向である移動方向で移動させながら決定し（Ｓ６３−
Ｓ６８）、上記決定された制限された第１と第２の擬似
距離行列の各最短経路に従って上記移動方向に応じて第
２又は第３の単位列の単位を収集することにより類推語
を生成して出力する類推語生成手段（５，Ｓ３）とを備
えたことを特徴とする。

【００１１】上記類推語生成装置において、上記単位列
は文字列であり、上記単位列を構成する単位は文字であ
る。もしくは、上記単位列は単語列であり、上記単位列
を構成する単位は単語である。

【００１２】また、本願の第２の発明に係る類推語生成
方法は、所定の順序で入力される３つの第１、第２及び
第３の単位列に基づいて、所定の類推関係で類推的に類
似する属性を有する第４の単位列である類推語を制御装
置により生成する類推語生成方法（１００）であって、
１つの単位列ともう１つの単位列の間で削除又は置き換
えを行う単位の数を擬似距離で表し、上記制御装置を用
いて、上記入力された３つの単位列を解析することによ
り、上記入力された第１の単位列の最初の単位から最後
の単位までの各部分列と上記入力された第２の単位列の
最初の単位から最後の単位までの各部分列との間の擬似
距離を表す第１の擬似距離行列の一部の要素の位置にお
いて、上記入力された第１の単位列の単位数（Ｌｅｎ
１）が、上記第１の単位列と上記第２の単位列との間の
擬似距離を表す、第１の擬似距離行列の最終行最終列の
要素の値（ｐ２）と、上記第１の単位列と上記第３の単
位列との間の擬似距離を表す、第２の擬似距離行列の最
終行最終列の要素の値（ｐ３）との加算値よりも大きく
なるように、上記第１の擬似距離行列における所定幅の
対角要素からなる対角バンドと、上記対角バンドの外側
に位置する所定幅の要素からなるエキストラバンドとを
含む制限された第１の擬似距離行列の複数の要素を計算
し、上記入力された第１の単位列の最初の単位から最後
の単位までの各部分列と上記入力された第３の単位列の
最初の単位から最後の単位までの各部分列との間の擬似
距離を表す第２の擬似距離行列の一部の要素の位置にお
いて、上記入力された第１の単位列の単位数（Ｌｅｎ
１）が、上記第１の単位列と上記第２の単位列との間の
擬似距離を表す、第１の擬似距離行列の最終行最終列の
要素の値（ｐ２）と、上記第１の単位列と上記第３の単
位列との間の擬似距離を表す、第２の擬似距離行列の最
終行最終列の要素の値（ｐ３）との加算値よりも大きく
なるように、上記第２の擬似距離行列における所定幅の
対角要素からなる対角バンドと、上記対角バンドの外側
に位置する所定幅の要素からなるエキストラバンドとを
含む制限された第２の擬似距離行列の複数の要素を計算
し、上記計算した制限された第１と第２の擬似距離行列
の複数の要素を行列記憶手段（１０）に記憶するステッ
プ（２，Ｓ２）と、上記制御装置を用いて、上記入力さ
れた３つの単位列の長さ及び上記行列記憶手段（１０）
に記憶された制限された第１と第２の擬似距離行列の各
要素とに基づいて、上記入力された３つの第１乃至第３
の単位列と生成される第４の単位列とからなる４つの単
位列が上記類推関係にあることを判断するためのパラメ
ータであって上記第４の単位列が生成されたときに上記
４つの単位列に共通する単位の数を表す状態パラメータ
（ｃｏｍ）の初期値を計算してパラメータ記憶手段（５
１）に記憶するステップと、上記制御装置を用いて、上
記パラメータ記憶手段（５１）に記憶された状態パラメ
ータ（ｃｏｍ）と上記行列記憶手段（１０）に記憶され
た制限された第１と第２の擬似距離行列の各要素とに基
づいて、上記パラメータ記憶手段（５１）に記憶された
状態パラメータ（ｃｏｍ）を更新しながら（Ｓ７４）、
上記制限された第１の擬似距離行列における最終行最終
列の要素から第１行第１列の要素までの最短経路と、上
記制限された第２の擬似距離行列における最終行最終列
の要素から第１行第１列の要素までの最短経路とを、上
記制限された第１と第２の擬似距離行列のそれぞれにお
けるある要素から別の要素に対角方向、水平方向、又は
垂直方向である移動方向で移動させながら決定（Ｓ６３
−Ｓ６８）するステップと、上記制御装置を用いて、上
記決定された制限された第１と第２の擬似距離行列の各
最短経路に従って上記移動方向に応じて第２又は第３の
単位列の単位を収集することにより類推語を生成して出
力するステップ（５，Ｓ３）とを含むことを特徴とす
る。

【００１３】上記類推語生成方法において、上記単位列
は文字列であり、上記単位列を構成する単位は文字であ
る。もしくは、上記単位列は単語列であり、上記単位列
を構成する単位は単語である。

【００１４】

【発明の実施の形態】以下、図面を参照して本発明に係
る実施形態について説明する。なお、図面において、同
一のものは同一の符号で示している。また、本明細書に
おいて、要素とは、行列の要素をいう。

【００１５】図１は、本発明に係る好ましい実施形態の
類推語生成装置１００を示すブロック図である。好まし
い実施形態の類推語生成装置１００は、一定の順序で入
力される３つの文字列に類推的に類似する文字列である
単位列（以下、類推語という。）を生成するための類推
語生成装置１００であって、（ａ）キーボードインター
フェース５４を介してキーボード２１によって一定順序
で入力される３つの第１、第２及び第３の文字列におい
て、（ａ１）第１の文字列の最初の文字から最後の文字
までの各部分列と、第２の文字列の最初の文字から最後
の文字までの各部分列との間の擬似距離値と、（ａ２）
第１の文字列の最初の文字から最後の文字までの各部分
列と、第３の文字列の最初の文字から最後の文字までの
各部分列との間の擬似距離値とを表し、かつ上記２つの
擬似距離値の計算に必要十分とされる中間情報の要素の
みを記憶するための擬似距離行列メモリ１０と、（ｂ）
入力された３つの文字列を解析して上記擬似距離行列の
各要素を計算して、擬似距離値を擬似距離行列メモリ１
０に記憶させるための前処理部２と、（ｃ）生成される
類推語を記憶する類推語メモリ４と、（ｄ）生成される類推語を一時的に記憶する内部パラメ
ータメモリ５１を内部に備え、前処理部２から文字列が
入力される毎に、類推語生成処理に従って擬似距離行列
メモリ１０に記憶された擬似距離行列を参照して類推語
を生成し、生成された類推語を類推語メモリ４に記憶さ
せ、また、プリンタインターフェース５２を介して上記
類推語をプリンタ２２に出力し、又はディスプレイイン
ターフェース５３を介して上記類推語をＣＲＴディスプ
レイ２３に出力する類推語生成部５とを備えたことを特
徴としている。ここで、２つの文字列（単語）間の擬似
距離とは、第１の文字列から別の第２の文字列を生成す
るために削除又は置き換えされた文字数の値をいう。

【００１６】ここで、擬似距離行列メモリ１０には、２
つの擬似距離行列の要素のうち、各２つの文字列間の擬
似距離を計算するために必要十分である行列要素のみを
記憶し、具体的には、図７を参照して詳細後述するよう
に、対角要素を含む行列要素を計算して記憶される。類
推語生成部５は、入力された３つの文字列に基づいて、
擬似距離行列メモリ１０に記憶された第１と第２の擬似
距離行列の各要素を参照して、詳細後述する状態パラメ
ータｃｏｍ（Ａ，Ｂ，Ｃ，Ｄ）を計算して内部パラメー
タメモリ５１に記憶し、当該状態パラメータｃｏｍ
（Ａ，Ｂ，Ｃ，Ｄ）を更新しながら上記第１と第２の擬
似距離行列が表す擬似距離の最短経路を計算し、上記２
つの最小の擬似距離の経路に従って類推語を生成し、生
成された類推語を出力する。

【００１７】ここで、類推語生成部５は、擬似距離行列
メモリ１０から読み出された値が類推的制約条件の妥当
性（validity）を反映する場合にのみ、一定順序で入力
された３つの文字列に類推語を生成する。また、この好
ましい実施形態では、類推語生成の対象となる文字はロ
ーマ字であり、文字列はローマ字列又はローマ文字列で
ある。なお、この文字は、他の言語の文字又は単語であ
ってもよい。

【００１８】図１を参照すると、中央演算処理装置１
は、例えば、類推語生成装置１００の類推語生成処理を
実行するＣＰＵを備え、また、実行するプログラムと当
該プログラムを実行する際に必要なデータとを記憶する
ためのＲＯＭ（読取り専用メモリ）と、ＣＰＵのワーク
エリアとして使用されるＲＡＭ（ランダムアクセスメモ
リ）とを備えたデジタル計算機で構成され、互いに接続
された前処理部２と類推語生成部５を備えている。ここ
で、前処理部２と類推語生成部５はそれぞれ別のデジタ
ル計算機で構成されてもよい。

【００１９】前処理部２は、信号変換等の処理を行うキ
ーボードインターフェース５４を介して、３つの文字列
の入力データを入力するためのキーボード２１に接続さ
れ、また、前処理部２と類推語生成部５は、例えばハー
ドディスクメモリから構成される擬似距離行列メモリ１
０に接続される。

【００２０】類推語生成部５は、例えばＲＡＭから構成
され、内部に所定のパラメータを一時的に記憶するため
の内部パラメータメモリ５１を備える。また、類推語生
成部５は、例えばハードディスクメモリから構成されか
つ生成される類推語を記憶する類推語メモリ４に接続さ
れる。類推語生成部５はまた、信号変換等の処理を行う
プリンタインターフェース５２を介して、類推語生成結
果のデータを印字するプリンタ２２に接続され、また、
信号変換等の処理を行うディスプレイインターフェース
５３を介して、類推語生成結果のデータを表示するＣＲ
Ｔディスプレイ２３に接続される。

【００２１】また、類推語生成部５において、入力され
た第１の文字列の幾つかの文字が、入力された第２の文
字列又は入力された第３の文字列のいずれにも現れない
場合は、類推語を生成することはできない。対偶的に言
えば、入力された３つの文字列から類推される類推語を
生成するためには、入力された第１の文字列における任
意の文字が、入力された第２の文字列又は入力された第
３の文字列のいずれかに現れなければならない。従っ
て、入力された３つの単位列から類推語を生成するため
には、入力された第１の文字列と入力された第２の文字
列との間で共通する部分列、及び入力された第１の文字
列と入力された第３の文字列との間で共通する部分列が
空であってはならない。従って、類推語の生成は、入力
された第１の文字列と入力された第２の文字列との間で
共通する部分列の検出、及び入力された第１の文字列と
入力された第３の文字列との間で共通する部分列の検出
に依存する。

【００２２】そこで、入力された文字列の間で共通する
部分列の計算方法は、まず、前処理部２において、入力
された第１の文字列と入力された第２の文字列との間の
擬似距離行列と、入力された第１の文字列と入力された
第３の文字列との間の擬似距離行列とを計算し、次い
で、類推語生成部５において、上記２つの擬似距離行列
における最小の擬似距離の経路を計算する。生成される
類推語は、上記２つの擬似距離行列における擬似距離の
最短経路を計算することによって計算可能である。類推
語はまた、入力された第１の文字列と入力された第２の
文字列との間で共通する部分列に対応する入力された第
３の文字列の部分列と、入力された第１の文字列と入力
された第３の文字列との間で共通する部分列に対応する
入力された第２の文字列の部分列と、入力された第１の
文字列、入力された第２の文字列及び入力された第３の
文字列において共通する部分列とから構成される。ここ
で、上記擬似距離行列における経路は、入力された文字
列の最後の文字から最初の文字に向かうように、上記擬
似距離行列において、ある１つの要素から次の要素に連
続して計算される。ここで、経路に沿った移動は必ず、
対角方向、垂直方向又は水平方向のうちの１方向のみで
行われる。

【００２３】従って、本実施形態の類推語生成装置１０
０は、所定の順序で入力される３つの第１、第２及び第
３の単位列に基づいて、詳細後述する所定の類推関係で
類推的に類似する属性を有する第４の単位列である類推
語を生成する類推語生成装置である。ここで、１つの単
位列ともう１つの単位列の間で削除又は置き換えを行う
単位の数を擬似距離で表し、擬似距離行列メモリ１０
は、（ａ）上記入力された第１の単位列の最初の単位か
ら最後の単位までの各部分列と上記入力された第２の単
位列の最初の単位から最後の単位までの各部分列との間
の擬似距離を表す第１の擬似距離行列の一部の要素の位
置で計算され、上記入力される第１の単位列と入力され
る第２の単位列との間の制限された擬似距離の計算を行
うために十分な情報を含むように、上記第１の擬似距離
行列における所定幅の対角要素からなる対角バンドと、
上記対角バンドの外側に位置する所定幅の要素からなる
エキストラバンドとを含む制限された第１の擬似距離行
列の複数の要素と、（ｂ）上記入力された第１の単位列
の最初の単位から最後の単位までの各部分列と上記入力
された第３の単位列の最初の単位から最後の単位までの
各部分列との間の擬似距離を表す第２の擬似距離行列の
一部の要素の位置で計算され、上記入力される第１の単
位列と入力される第３の単位列との間の制限された擬似
距離の計算を行うために十分な情報を含むように、上記
第２の擬似距離行列における所定幅の対角要素からなる
対角バンドと、上記対角バンドの外側に位置する所定幅
の要素からなるエキストラバンドとを含む制限された第
２の擬似距離行列の複数の要素とを記憶する。そして、
前処理部２は、入力された３つの単位列を解析すること
により、上記制限された第１と第２の擬似距離行列の要
素を計算して擬似距離行列メモリ１０に記憶させる。類
推語生成部５内の内部パラメータメモリ５１は、上記入
力された３つの第１乃至第３の単位列と、生成される第
４の単位列とからなる４つの単位列が上記類推関係にあ
ることを判断するためのパラメータであって、上記第４
の単位列が生成されたときに上記４つの単位列に共通す
る単位の数を表す状態パラメータｃｏｍを記憶する。さ
らに、類推語生成部５は、入力された３つの単位列の長
さ及び擬似距離行列メモリ１０に記憶された制限された
第１と第２の擬似距離行列の各要素とに基づいて、状態
パラメータｃｏｍの初期値を計算して上記パラメータ記
憶手段５１に記憶した後（図１６のステップＳ６１）、
内部パラメータメモリ５１に記憶された状態パラメータ
ｃｏｍと擬似距離行列メモリ１０に記憶された制限され
た第１と第２の擬似距離行列の各要素とに基づいて、内
部パラメータメモリ５１に記憶された状態パラメータｃ
ｏｍを更新しながら（図１８のステップＳ７４）、上記
制限された第１の擬似距離行列における最後の要素から
最初の要素までの最短経路と、上記制限された第２の擬
似距離行列における最後の要素から最初の要素までの最
短経路とを、上記制限された第１と第２の擬似距離行列
のそれぞれにおけるある要素から別の要素に対角方向、
水平方向、又は垂直方向である移動方向で移動させなが
ら決定し（図１６のステップＳ６３−Ｓ６８）、上記決
定された制限された第１と第２の擬似距離行列の各最短
経路に従って類推語を生成して出力する。

【００２４】まず、図１の類推語生成装置１００におい
て実行されるの類推語生成処理について説明する。本実
施形態の類推語生成処理の導入に当たり、我々は類推の
観念の歴史的展開の逆をたどる（例えば、従来技術文献
３「Robert R. Hoffman，“怪奇な類推（Monster Analo
gy）”，AI Magazine，vol.11，pp.11-35，1995年秋」
参照。）。言語的類推について語る際には、ある程度の
不可解さに直面することから、これは必要である。すな
わち、通常はより広義で、より心理的な定義が付与され
る。また、我々の提案は計算によるものであるために、
今や人工知能を意味するコンピュータ科学における類推
に関する作業を無視することはできない。

【００２５】次いで、類推語生成処理のアルゴリズムに
ついて説明する。従来技術文献４「エサ・イトコーネン
（Esa Itkonen）ほか，“対照形（及びその他）におけ
る類推のリハビリテーション（A Rehabilitation of an
alogy in syntax (and elsewhere)）”，Andras Kertes
z(editor)，Metalinguistik im Wandel：die kognitive
Wende in Wissenschaftstheorie und Linguistik Fran
kfurt a/M, Peter Lang，pp.131-171，1997年」は、類
推は非文法的文章をもたらすために構文論においては機
能しないとするチョムスキー（Chomsky）への論駁（ref
utation）として、序文において、類推語を文章におい
て生成するためのプログラムを提供している。類推は構
文法にも適用されるとする考え方は、ヘルマン・パウル
（Hermann Paul）及びブルームフィールド（Bloomfiel
d）によって数十年前に提唱されている。チョムスキー
の主張は、類推をシンボルレベルにのみ適用することを
前提としているため公平性を欠いている。イトコーネン
（Itkonen）ほかは、類推は、何らかの構成レベルで制
御されていれば、完全に文法的な文章を生み出すことを
示している。我々は、彼らの方法の核心となる技術に関
心を抱き、それが本実施形態の類推語生成処理の基礎と
なっている。すなわち、出力される類推語Ｄは、入力さ
れた第２の文字列Ｂ及び入力された第３の文字列Ｃを通
じて同時に１文字ずつ調べ、各要素と入力された第１の
文字列Ａの構成との関係性を調べること（加えて、出力
される類推語Ｄの既定部分との結合）によって形成され
る。従って、入力された第１の文字列Ａは、入力された
第２の文字列Ｂ及び入力された第３の文字列Ｃを比較す
るための軸であり、それとの対照で出力される類推語Ｄ
が構築される。

【００２６】従って、類推語生成処理は以下の通りであ
る。（ａ）まず、入力された第１の文字列Ａを軸として、入
力された第１の文字列Ａとは共通していない入力された
第２の文字列Ｂの部分文字列を検索する一方で、他方で
は、入力された第１の文字列Ａとは共通していない入力
された第３の文字列Ｃの部分文字列を検索する。（ｂ）次いで、それらを正しい順序に配置する。

【００２７】次式は、類推語生成方法の処理手順の一例
として、入力された第１の文字列Ａを”ｒｅａｄｅ
ｒ”、入力された第２の文字列Ｂを”ｕｎｒｅａｄａｂ
ｌｅ”、入力された第３の文字列Ｃを”ｄｏｅｒ”とし
たときの、類推語ｘを生成する関係式を示す。

【００２８】

【数１】

【００２９】上述の類推語生成処理に沿って説明する。（ａ）まず、入力された第２の文字列Ｂ”ｕｎｒｅａｄ
ａｂｌｅ”のうちの入力された第１の文字列Ａ”ｒｅａ
ｄｅｒ”に共通しない部分文字列を調べると、部分文字
列”ｕｎ”及び”ａｂｌｅ”が共通していないことが分
かる。また、入力された第３の文字列Ｃ”ｄｏｅｒ”の
うちの入力された第１の文字列Ａ”ｒｅａｄｅｒ”と共
通していない部分文字列を調べると、部分文字列”ｄ
ｏ”が検索される。（ｂ）次いで、それらを正しい順序で配置すると、”ｕ
ｎ””ｄｏ””ａｂｌｅ”となり、最終的に類推語”ｕ
ｎｄｏａｂｌｅ”が結果として生成される。

【００３０】上述の処理（ａ）は、第１の文字列Ａ”ｒ
ｅａｄｅｒ”と第２の文字列Ｂ”ｕｎｒｅａｄａｂｌ
ｅ”（又は、第１の文字列Ａ”ｒｅａｄｅｒ”と第３の
文字列Ｃ”ｄｏｅｒ”）との共通する部分文字列を、相
補性によって検索することにより行われる。

【００３１】例えば、従来技術文献５「ロバート・エ
イ．ワグナー（Robert A. Wagner）ほか，”文字列から
文字列への修正問題（The String-to-String Correctio
n Problem）”，Journal for the Association of Comp
uting Machinery，vol.21，No1，pp.168-173，１９７４
年１月」は、編集距離行列を計算することによって２つ
の文字列間の最長共通部分系列を検索する方法(以下、
第５の従来例という。)を提案し、上記方法は、１つの
文字列Ｘを他の文字列Ｙに変換するために必要な編集操
作（文字の置換、削除、挿入）数を最小にする。上記編
集操作数を、上記１つの文字列Ｘと上記他の文字列Ｙと
の編集距離ｄｉｓｔ（Ｘ，Ｙ）という。

【００３２】ここで、第５の従来例において、第１の文
字列”ｌｉｋｅ”、第２の文字列”ｕｎｌｉｋｅ”及び
第３の文字列”ｋｎｏｗｎ”が入力された場合を考え
る。図２は、第５の従来例において、入力された第１の
文字列”ｌｉｋｅ”及び入力された第２の文字列”ｕｎ
ｌｉｋｅ”間の編集距離を表す編集距離行列を示す表で
あり、図３は、第５の従来例において、入力された第１
の文字列”ｌｉｋｅ”及び入力された第３の文字列”ｋ
ｎｏｗｎ”間の編集距離を表す編集距離行列を示す表で
ある。図２及び図３において、同様に、最も右下の数値
が２つの文字列間の編集距離を表す。従って、図２及び
図３を参照すると、編集距離ｄｉｓｔ（ｌｉｋｅ，ｕｎ
ｌｉｋｅ）＝２、編集距離ｄｉｓｔ（ｌｉｋｅ，ｋｎｏ
ｗｎ）＝５である。

【００３３】次いで、本発明に係る本実施形態において
用いられる単語間の擬似距離を説明する。入力された第
１の文字列Ａと入力された第２の文字列Ｂの最長共通部
分系列の文字数を、２つの文字列間の類似度ｓｉｍ
（Ａ，Ｂ）という。また、第１の文字列Ａの文字数か
ら、第２の文字列Ｂを生成するために削除又は置換され
た文字数を擬似距離といい、ｐｄｉｓｔ（Ａ，Ｂ）と定
義され、挿入コストが０である場合を除いて、上述の編
集距離として正確に計算することができる。

【００３４】

【数２】ｓｉｍ（Ａ，Ｂ）＝｜Ａ｜−ｐｄｉｓｔ（Ａ，Ｂ）

【００３５】図４は、本発明に係る実施形態において、
入力された第１の文字列Ａを”ｕｎｌｉｋｅ”、第２の
文字列Ｂを”ｌｉｋｅ”としたときの両方の文字列間の
擬似距離を表す擬似距離行列を示す表であり、図５は、
本発明に係る実施形態において、入力された第１の文字
列Ａを”ｌｉｋｅ”、第２の文字列Ｂを”ｕｎｌｉｋ
ｅ”として、それらの間の擬似距離を表す擬似距離行列
を示す表である。第１の文字列Ａと第２の文字列との間
の擬似距離の値は、擬似距離行列における最後の行の最
後の列における要素の値である。同様に、図４を参照す
ると、擬似距離ｐｄｉｓｔ（ｕｎｌｉｋｅ，ｌｉｋｅ）
＝２であり、また図５を参照すると、擬似距離ｐｄｉｓ
ｔ（ｌｉｋｅ，ｕｎｌｉｋｅ）＝０であることが分か
る。

【００３６】第２の文字列Ｂ又は第３の文字列Ｃに挿入
される文字は、それらが明らかに第２の文字列Ｂと第３
の文字列Ｃの一部であって第１の文字列Ａに存在しない
文字であるために類推語Ｄに組み込みたい文字として、
別に記憶されてもよい。

【００３７】図６は、本発明に係る実施形態において、
入力された第１の文字列”ｌｉｋｅ”を縦軸として、入
力された第２の文字列”ｕｎｌｉｋｅ”と、入力された
第３の文字列”ｋｎｏｗｎ”とのそれぞれの間の擬似距
離を表す擬似距離行列を示す表である。入力された第１
の文字列Ａは、類推を行う際の軸であるために、擬似距
離行列ではこれを縦軸にして、その周囲で擬似距離の計
算を行なう。例えば、ｌｉｋｅ：ｕｎｌｉｋｅ＝ｋｎｏ
ｗｎ：ｘの場合は、上記擬似距離行列は図６のような行
列になる。

【００３８】次いで、適用すべき制約条件について説明
する。第１の文字列Ａの幾つかの文字が、第２の文字列
Ｂ及び第３の文字列Ｃにも現れない場合は、類推語が存
在しないことは簡単に証明される。対偶的に言えば、類
推が成立するためには、第１の文字列Ａのいずれかの文
字が、第２の文字列Ｂ又は第３の文字列Ｃに現れなけれ
ばならない。従って、次式のように、第１の文字列Ａと
第２の文字列Ｂとの間の類似度ｓｉｍ（Ａ，Ｂ）と、第
１の文字列Ａと第３の文字列Ｃとの間の類似度ｓｉｍ
（Ａ，Ｃ）との和は、第１の文字列Ａの文字数｜Ａ｜よ
り大きいか又は同一でなければならない。

【００３９】

【数３】ｓｉｍ（Ａ，Ｂ）＋ｓｉｍ（Ａ，Ｃ）≧｜Ａ｜

【００４０】また、上述の式は次式に書きかえることが
できる。

【００４１】

【数４】｜Ａ｜≧ｐｄｉｓｔ（Ａ，Ｂ）＋ｐｄｉｓｔ（Ａ，Ｃ）

【００４２】上式において、第１の文字列Ａの文字数｜
Ａ｜が２つの擬似距離の和より大きければ、第１の文字
列Ａに存在するある部分文字列（又は部分系列）が、す
べての文字列において同一順序で共通していることにな
る。こうした共通の部分文字列は、類推語Ｄにも存在す
るはずである。このような部分系列の長さ（文字数）の
和を、状態パラメータｃｏｍ（Ａ，Ｂ，Ｃ，Ｄ）と定義
する。細心の注意を要する点は、この和が、本発明に係
る本実施形態の類推語生成処理によって構築中の類推語
Ｄに正確に依存していることにある。換言すれば、類推
関係Ａ：Ｂ＝Ｃ：Ｄが成り立つためには、次式が成り立
たなければならない。

【００４３】

【数５】│Ａ│=ｐｄｉｓｔ（Ａ,Ｂ）+ｐｄｉｓｔ（Ａ,
Ｃ）+ｃｏｍ（Ａ,Ｂ,Ｃ,Ｄ）

【００４４】次いで、本実施形態の類推語生成処理の詳
細について説明する。本実施形態の類推語生成処理は、
当該類推語生成処理の最初の３つの入力された文字列の
間で行われる２つの擬似距離行列の計算を基礎としてい
る。従来技術文献６「エスコ・ウッコネン（Esko Ukkon
en），“文字列近似照合のためのアルゴリズム（Algori
thms for Approximate String Matching）”，Informat
ion and Control，64，pp.100-118，1985年」の結果
は、全体の距離の値がある所定のしきい値未満であるこ
とが周知であれば、正確な距離を得るには、編集距離行
列の両サイドのそれぞれについて、対角バンド（diagon
al band）の他に２つのエキストラバンド（extra band)
を計算するだけでよいと述べている。

【００４５】ここで、対角バンドとは、行数ｌ１と列数
ｌ２の擬似距離行列において、ｌ１＜ｌ２のときに、図
２１に示すように、当該擬似距離行列における対角要素
を含みかつその対角要素から右方向にｌ２−ｌ１だけの
列数も含む対角方向で存在する行列要素の帯（band）を
いい、また、ｌ１＞ｌ２のときに、図２２に示すよう
に、当該擬似距離行列における対角要素を含みかつその
対角要素から下方向にｌ１−ｌ２だけの行数も含む対角
方向で存在する行列要素の帯（band）をいい、さらに
は、ｌ１＝ｌ２のときに、図２３に示すように、当該擬
似距離行列における対角要素のみを含む対角方向で存在
する行列要素をいう。また、エキストラバンドとは、図
２４及び図２５に示すように、対角バンドの両側に、列
数又は行数が幅ｄｋ／２である行列要素の帯をいい、エ
キストラバンドの幅ｄｋ／２は、図１２のステップＳ２
６において計算されて更新され、図１３及び図１４のス
テップにおいて使用される。

【００４６】従来技術文献６の結果は本実施形態で使用
する擬似距離にも当てはまることから、これを使用して
２つの擬似距離行列の計算量を減少させる。エキストラ
バンドの幅は、他の行列における現在の擬似距離の値に
よって重ね合わせの制約条件を満足させるように試行す
ることによって得られる。

【００４７】次いで、類推語生成処理において計算され
る主要素（main component）について説明する。擬似距
離行列において十分な計算を行った後は、両方の擬似距
離行列で同時に、類推語生成処理に従って経路をたど
り、最長共通部分系列を検索して類推語Ｄに文字をコピ
ーする。いつでも、両方の擬似距離行列において検索さ
れる要素の位置は、必ず同一の水平線上、すなわち第１
の文字列Ａにおける同一の文字の位置に在って、類推語
Ｄを構築する間の正しい順序を保証する。

【００４８】経路の決定は、第５の従来例の方法に従っ
て、擬似距離行列内の現在処理されている要素（以下、
現在の要素という。）と、それより１つ前の位置にある
３つの要素（現在の要素から見て水平方向にある１つ前
の要素、現在の要素から見て垂直方向にある１つ前の要
素、現在の要素から見て対角方向にある１つ前の要素）
とを比較して行なわれる。結果的には、経路は、まず、
文字列の最後の文字へと進行し、次に、最後の文字から
最初の文字へと進行する。可能な９つの組み合わせ（２
つの擬似距離行列における３方向）は、両方の擬似距離
行列内で方向が同一の場合と、異なる場合との２グルー
プに分けることができる。

【００４９】ここで、類推語生成処理について簡単に説
明する。まず、状態パラメータｃｏｍ（Ａ，Ｂ，Ｃ，
Ｄ）は、

【数６】｛│Ａ│−（ｐｄｉｓｔ（Ａ，Ｂ）＋ｐｄｉｓ
ｔ（Ａ，Ｃ））｝の計算値に初期設定される。パラメータｉ_A、ｉ_B及びｉ
_Cはそれぞれ、第１の文字列Ａ、第２の文字列Ｂ及び第
３の文字列Ｃにおける現在の位置である。ｄｉｒ _AB（又
はｄｉｒ_AC）は、擬似距離行列Ａ×Ｂ（又は擬似距離行
列Ａ×Ｃ）における現在の位置からの経路の方向であ
る。ここで、”コピーする”とは、ある文字列の１文字
を類推語Ｄのある部分に設定し、当該文字列の前の文字
へと移動することを意味している。

【００５０】次いで、検出失敗における早期終了につい
て説明する。両方の擬似距離行列の計算が完了しなくて
も、類推語の生成失敗を検出することはできる。第１の
文字列Ａの１文字が、第２の文字列Ｂ又は第３の文字列
Ｃに現れていなければ、生成失敗は明白である。これは
また、擬似距離行列の計算を開始する前の時点で既に検
出することができる。また、重ね合わせの制約条件をチ
ェックすることによって、本実施形態の類推語生成処理
は、満足でない動作が実行されるとすぐに終了すること
ができる。

【００５１】以上のような本実施形態の類推語生成処理
に従って、次の関係式

【数７】ｌｉｋｅ：ｕｎｌｉｋｅ＝ｋｎｏｗｎ：ｘにおいて類推語ｘを生成する処理について説明する。こ
こで、入力された第１の文字列は”ｌｉｋｅ”、入力さ
れた第２の文字列”ｕｎｌｉｋｅ”、入力された第３の
文字列は”ｋｎｏｗｎ”とする。

【００５２】次いで、類推語生成処理の一例について説
明する。本実施形態の類推語生成処理はまず、第１の文
字列”ｌｉｋｅ”の全文字が、第２の文字列”ｕｎｌｉ
ｋｅ”又は第３の文字列”ｋｎｏｗｎ”のいずれかに存
在していることを調べる。次いで、擬似距離行列に関し
て各要素の計算が最少の計算コストで行われる。すなわ
ち、最小の対角バンドの範囲内の要素だけが計算され
る。図７は、図６の擬似距離行列において、対角バンド
の範囲内の要素だけを計算した制限された擬似距離行列
を示す表である。図７の擬似距離行列における”・”
は、値を計算していない要素、すなわち値を計算する必
要がない要素を示す。図７において”・”がかなり多数
見られるために、図６の擬似距離行列の計算コストと比
較すると、かなり計算コストが減少していることが分か
る。

【００５３】次いで、重ね合わせの制約条件を検証する
ために、制限された擬似距離行列における主要素が用い
られる。図８は、図７の擬似距離行列において、主要素
を円で囲んだ擬似距離行列を示す表である。本発明に係
る本実施形態の類推語生成処理における主要素は、両行
列において円内の値によって記述された経路をたどる。
この動作の連続は、図８を参照すると、次表のように、
コピーされる文字を類推語にトリガ（活性化）する。

【００５４】

【表１】 ――――――――――――――――――――― ｄｉｒ_AB ｄｉｒ_AC コピーされる文字 ――――――――――――――――――――― 対角方向対角方向ｎ対角方向対角方向ｗ対角方向対角方向ｏ対角方向対角方向ｎ水平方向水平方向ｋ水平方向対角方向ｎ水平方向対角方向ｕ ――――――――――――――――――――――

【００５５】上の表のように、各ステップで重ね合わせ
の制約条件が検証され、最終的に、類推語ｘ＝ｕｎｋｎ
ｏｗｎが出力される。

【００５６】自明な事例は、当然、

【数８】Ａ：Ａ＝Ａ：ｘ ⇒ ｘ＝Ａもしくは、

【数９】Ａ：Ａ＝Ｃ：ｘ ⇒ ｘ＝Ｃといったアルゴリズムによって解かれる。また、構造
上、Ａ：Ｂ＝Ｃ：ｘとＡ：Ｃ＝Ｂ：ｘは、同一の類推語
ｘをもたらす。

【００５７】次いで、類推関係における文字列の”反復
（reduplication）”及び”入れ替え（permutation）”
関係について説明する。従来例は、同一の文字列を繰り
返すような”反復”関係を有する類推語を生成すること
ができない。しかし、例えば、インドネシア語で複数形
を作りたい場合、例えば、次式のような関係が存在す
る。

【００５８】

【数１０】ｏｒａｎｇ：ｏｒａｎｇ−ｏｒａｎｇ＝ｂｕ
ｒｕｎｇ：ｘｘ＝ｂｕｒｕｎｇ−ｂｕｒｕｎｇ

【００５９】ここで、”ｏｒａｎｇ”は、インドネシア
語で人間を意味し、その複数形は、”ｏｒａｎｇ−ｏｒ
ａｎｇ”である。また、”ｂｕｒｕｎｇ”は、インドネ
シア語で鳥を意味し、複数形は”ｂｕｒｕｎｇ−ｂｕｒ
ｕｎｇ”である。このような関係では、類推語ｘを生成
するために、文字列の”反復”が必要となる。この場
合、従来例では、接頭辞を変更せずに残すことが優先さ
れて、類推語ｘ＝ｏｒａｎｇ−ｂｕｒｕｎｇとなる。

【００６０】また、入れ替えは、本実施形態によって生
成されない。例えば、原セム語の、ｙａｑｔｉｌｕ：ｙ
ｕｑｔｉｌｕ＝ｑａｔａｌ：ｑｕｔａｌ（ｑを、ａとｕ
で置き換える。）は、その一例である。

【００６１】本実施形態の類推語生成処理の特徴とし
て、類推語生成処理は、シンボルレベルでしか計算を実
行しないために、どのような言語にでも適用可能であ
る。従って、本実施形態の類推語生成処理は言語非依存
型である。従来の言語学における類推は、確実に、より
一般的な心理学的操作から生まれ、このことは人類に共
通しているとも言えることから、この点は幸運である。
後述の実施例は、本実施形態の言語非依存性について示
している。

【００６２】また、逆に言えば、シンボルは、計算され
る類推の粒度（granularity）又は精密度を決定する。
従って、コード化システムに反映されない交換又は転換
（commutation）は実行されない。これは、３つの異な
るコーディングにおける日本語の例である日本語の書
体、ヘボン式表記及び正式な訓令式、によって示すこと
ができる。次式は、日本語の書体において、ヘボン式表
記及び正式な訓令式を用いた場合の一例を示す。

【００６３】

【数１１】（ａ）漢字／かなの場合待つ：待ちます＝働く：ｘｘ＝生成不可能

【数１２】（ｂ）ヘボン式の場合ｍａｔｓｕ：ｍａｃｈｉｍａｓｕ＝ｈａｔａｒａｋｕ：
ｘｘ＝生成不可能

【数１３】（ｃ）訓令式の場合ｍａｔｕ：ｍａｔｉｍａｓｕ＝ｈａｔａｒａｋｕ：ｘｘ＝ｈａｔａｒａｋｉｍａｓｕ

【００６４】本実施形態の類推語生成処理では、漢字か
な及びヘボン式における類推語（漢字かな：働きます、
ヘボン式：ｈａｔａｒａｋｉｍａｓｕ）を生成すること
ができない。これは、本実施形態の類推語生成処理で
は、漢字かな表記の”つ：ち＝く：き”、ヘボン式表記
の”ｔｓｕ：ｃｈｉ＝ｋｕ：ｋｉ”というようなシンボ
ルレベルを超越した基本的類推を行うことができないた
めである。但し、このような類推上の関係を予め定義し
てパラメータ表示を行えば、本実施形態において上述の
ような類推語を生成することは可能である。

【００６５】以下、上述で説明された、図１の類推語生
成装置１００において実行される類推語生成処理、特に
編集単位が文字であり、”ｌｉｋｅ”、”ｕｎｌｉｋ
ｅ”及び”ｋｎｏｗｎ”が３つの文字列としてこの順序
で入力された場合の類推語生成処理について図面を参照
しながら説明する。

【００６６】図１を参照すると、まず、前処理部２は、
２つの擬似距離行列の計算における十分な情報を計算す
るために前処理を実行し、２つの擬似距離行列は前処理
部２によって計算されて擬似距離行列メモリ１０に出力
されて記憶される。ここで、前処理部２は、行列初期化
処理を行って、擬似距離行列メモリ１０内の両方の擬似
距離行列のすべての要素に正の無限大のデータを設定す
る。さらに、擬似距離メモリ１０に記憶された２つの擬
似距離行列における十分な情報を計算するために、前処
理部２において十分な擬似距離行列の計算処理が実行さ
れる。この処理では、図１２に示すように、２つの制限
された擬似距離行列の計算と、１つの十分な擬似距離行
列の計算とが実行される。

【００６７】制限された擬似距離行列の計算処理Ｌｉｍ
ＭａｔＣｏｍｐは、ある１つの擬似距離行列に含まれる
すべての行列要素を計算するのではなく、擬似距離行列
の対角バンドとエキストラバンドにおける要素のみを計
算する。当該対角バンドとエキストラバンドに属しない
要素は変化なしのままであるが、図１１のステップＳ９
５に示すように、初期化処理ＩｎｉｔＭａｔｒｉｘ中に
おいて最大値のデータに保持される。

【００６８】３つの入力された文字列に対して類推的に
類似する文字列の生成は、入力された第１の文字列と第
２の文字列との間、並びに入力された第１の文字列と第
３の文字列との間の擬似距離行列におけるすべての行列
要素を計算することによって行うことができる。制限さ
れた擬似距離行列の計算処理ＬｉｍＭａｔＣｏｍｐの目
的は、入力された第１の文字列と第２の文字列との間、
並びに入力された第１の文字列と第３の文字列との間の
擬似距離行列における対角バンド及び２つのエキストラ
バンドに含まれる行列要素のみを計算することによっ
て、入力された３つの文字列に類推的に類似する文字列
の生成のために、入力された第１の文字列と第２の文字
列との間、並びに入力された第１の文字列と第３の文字
列との間の擬似距離行列における十分な情報のみを計算
することにある。それ故、制限された擬似距離行列の計
算処理ＬｉｍＭａｔＣｏｍｐを用いて入力された３つの
文字列に類推的に類似する文字列を生成する処理は、入
力された第１の文字列と第２の文字列との間、並びに入
力された第１の文字列と第３の文字列との間の擬似距離
行列におけるすべての行列要素を計算して入力された３
つの文字列に類推的に類似する文字列を生成する処理に
比較して高速で実行することができる。

【００６９】制限された擬似距離行列の計算処理Ｌｉｍ
ＭａｔＣｏｍｐによって計算された行列要素の値は、擬
似距離行列のすべての行列要素を計算する処理によって
計算された行列要素の値と異なる場合がある。これにつ
いて、図６及び図７に図示している。図６において、文
字列”ｌｉｋｅ”の文字”ｋ”と、文字列”ｋｎｏｗ
ｎ”の文字”ｏ”とに対応する、文字列”ｌｉｋｅ”と
文字列”ｋｎｏｗｎ”との間の擬似距離行列における第
３行第３列の値は、２の値を有する。しかしながら、図
７のそれは、３の値を有する。

【００７０】図７において示されるような擬似距離行列
を使用すると、以下のように、入力された第２の文字
列”ｕｎｌｉｋｅ”において最良の順序（best order）
で現れる入力された第１の文字列”ｌｉｋｅ”からの最
大の文字数（highest number）、及び入力された第３の
文字列”ｋｎｏｗｎ”において最良の順序で現れる入力
された第１の文字列”ｌｉｋｅ”からの最大の文字数を
得ることができる。

【００７１】まず、図１１の行列初期化処理によって２
つの擬似距離行列内の各要素は、正の無限大のデータに
設定される。さらに、図１２において示される十分な擬
似距離行列の計算処理は、以下のように２つの擬似距離
行列における十分な個数の要素を計算する。

【００７２】まず、制限された擬似距離行列処理では、
第２の文字列”ｕｎｌｉｋｅ”の文字数６と第１の文字
列”ｌｉｋｅ”の文字数４との差の値２に１を加算した
値３というように、入力された第１の文字列”ｌｉｋ
ｅ”と第２の文字列”ｕｎｌｉｋｅ”との間の擬似距離
行列の要素を計算するために、この第１のステップにお
ける対角バンドの値３を計算しなければならないことが
分かる。

【００７３】さらに、入力された第１の文字列と第２の
文字列との間の擬似距離行列における幅３の対角バンド
内の各要素の値が計算される。まず、第１の文字列”ｌ
ｉｋｅ”の第１の文字”ｌ”と第２の文字列”ｕｎｌｉ
ｋｅ”の第１の文字”ｕ”は、等しくないことが分か
り、従って、文字”ｌ”で始まる第１の文字列”ｌｉｋ
ｅ”の１文字である部分列に対応する部分列”ｌ”、及
び”ｕ”で始まる第２の文字列”ｕｎｌｉｋｅ”の１文
字である部分列に対応する部分列”ｕ”の最大の文字数
（highest number）に対応する要素は、数値１に設定さ
れる。

【００７４】次いで、擬似距離行列の１番目の行におけ
る２番目の要素の値は、それと同一行である１番目の行
におけるそれの１つ前の要素の値である１番目の要素の
値１と、入力された第１の文字列”ｌｉｋｅ”の１番目
の文字”ｌ”と入力された第２の文字列”ｕｎｌｉｋ
ｅ”の２番目の文字”ｕ”が等しくないことによる関数
ｔｒｕｅの比較結果値（関数値）１とのうちの最小値１
として計算される。ここで、関数ｔｒｕｅ（ｆ）は、条
件ｆが満たされれば１を返し、満たされなければ０を返
す関数である。

【００７５】さらに、擬似距離行列の１番目の行におけ
る３番目の要素の値は、それと同一行である１番目の行
におけるそれの１つ前の要素の値である２番目の要素の
値１と、第１の文字列”ｌｉｋｅ”の１番目の文字”
ｌ”と第２の文字列”ｕｎｌｉｋｅ”の３番目の文字”
ｌ”が等しいことによる関数ｔｒｕｅの比較結果値（関
数値）０とのうちの最小値０として計算される。

【００７６】さらに、擬似距離行列の２番目の行におけ
る２番目の要素の値は、それの１つ前の行である１番目
の行におけるその１つ前の要素の値である１番目の要素
の値１に、第１の文字列”ｌｉｋｅ”の２番目の文字”
ｉ”と第２の文字列”ｕｎｌｉｋｅ”の２番目の文字”
ｎ”とが等しくないことによる関数ｔｒｕｅの比較結果
値（関数値）１を加算した値である合計値（和）２と、
その１つ前の１番目の行における同一の２番目の要素の
値１に１を加算した値である合計値（和）２とのうちの
最小値２に設定される。従って、２番目の行における２
番目の要素の値は、数値２に設定される。

【００７７】次いで、擬似距離行列の２番目の行におけ
る３番目の要素の値は、それの１つ前の行である１番目
の行におけるその１つ前の要素である２番目の要素の値
１に、第１の文字列”ｌｉｋｅ”の２番目の文字”ｉ”
と第２の文字列”ｕｎｌｉｋｅ”の３番目の文字”ｌ”
が等しくないことによる関数ｔｒｕｅの結果値（関数
値）１を加算した値である合計値（和）２と、それの１
つ前の行である１番目の行におけるそれと同一番目の要
素である３番目の要素の値１に１を加算した値である合
計値（和）２と、それと同一行である２番目の行におけ
るそれの１つ前の要素である２番目の要素の値２との間
の最小値である数値２に設定される。

【００７８】従って、入力された第１の文字列”ｌｉｋ
ｅ”と第２の文字列”ｕｎｌｉｋｅ”との間の擬似距離
行列における幅３の対角バンドのｉ１番目（ｉ１＝１，
２，…，第１の文字列の文字数）の行のｉｋ番目（ｉｋ
＝１，２，…，第ｋの文字列の文字数）の要素には、図
１４のステップＳ４０に記述され、図７において示され
るように、現在の要素の１つ前の行である（ｉ１−１）
番目の行における現在の要素の１つ前の（ｉｋ−１）番
目の要素の値に、第１の文字列”ｌｉｋｅ”のｉ１番目
の文字と第２の文字列”ｕｎｌｉｋｅ”のｉｋ番目の文
字とが等しければ０を、等しくなければ１を加算した値
と、擬似距離行列のその１つ前の行である（ｉ１−１）
番目の行におけるそれと同一番目の要素であるｉｋ番目
の要素の値に１を加算した値と、擬似距離行列のそれと
同一の行であるｉ１番目の行におけるその１つ前の要素
である（ｉｋ−１）番目の要素の値とのうちの最小値が
設定される。従って、入力された第１の文字列”ｌｉｋ
ｅ”と第２の文字列”ｕｎｌｉｋｅ”との間の擬似距離
行列における４番目の行における６番目の要素の値は、
このように処理を実行することによって結果的に数値０
に設定される。

【００７９】また、入力された第１の文字列”ｌｉｋ
ｅ”及び第３の文字列”ｋｎｏｗｎ”間の擬似距離行列
において、入力された第３の文字列”ｋｎｏｗｎ”の文
字数５と入力された第１の文字列”ｌｉｋｅ”の文字数
４との差に１を加算した合計値（和）を表す幅２の対角
バンドのｉ１番目の行におけるｉｋ番目の要素には、図
１４のステップＳ４０に記述され、図７において示され
るように、その１つ前の行である（ｉ１−１）番目の行
におけるそれの１つ前の要素である（ｉｋ−１）番目の
要素の値に、第１の文字列”ｌｉｋｅ”のｉ１番目の文
字と第３の文字列”ｋｎｏｗｎ”のｉｋ番目の文字とが
等しければ０を、等しくなければ１を加算した値と、擬
似距離行列のその１つ前の行である（ｉ１−１）番目の
行におけるそれと同一番目の要素であるｉｋ番目の要素
の値に１を加算した値と、擬似距離行列のそれと同一行
であるｉ１番目の行におけるそれの１つ前の要素である
（ｉｋ−１）番目の要素の値とのうちの最小値が設定さ
れる。従って、入力された第１の文字列”ｌｉｋｅ”及
び第３の文字列”ｋｎｏｗｎ”間の擬似距離行列におけ
る４番目の行における５番目の要素の値は、結果的に数
値４に設定される。このようにして、２つの擬似距離行
列の各要素の値を計算する前処理は終了して次の処理を
行う。

【００８０】次いで、前処理において計算された各要素
を有する２つの擬似距離行列に基づいて、類推語を生成
する類推語生成処理について説明する。まず、入力され
た第１の文字列”ｌｉｋｅ”の文字数４は、第１の文字
列”ｌｉｋｅ”と第２の文字列”ｕｎｌｉｋｅ”との間
の擬似距離行列における４番目の行における６番目の要
素の値０と、第１の文字列”ｌｉｋｅ”と第３の文字
列”ｋｎｏｗｎ”との間の擬似距離行列における４番目
の行における５番目の要素の値４との合計値（和）４以
下に当てはまることが分かるが、これは擬似距離行列に
おいて十分な要素数が計算されたことを意味し、十分な
擬似距離の計算処理から原処理である前処理に戻り、ま
た、前処理から原処理である類推語生成処理に戻り次の
処理に進む。類推語生成処理は、以下のようにして進行
する。

【００８１】まず、入力された３つの文字列における位
置ｉ１、ｉ２、ｉ３は、入力された３つの文字列の各々
の文字数の値に初期設定される。ここで文字列における
位置とは、処理されているのは文字列の何番目の文字か
を表すパラメータである。次いで、生成される文字列で
ある類推語における位置ｉ４が、入力された３つの文字
列における文字数の値のうちの最大値の２倍の値に初期
設定される。

【００８２】さらに、共通の文字数が、入力された第１
の文字列”ｌｉｋｅ”の文字数４と、入力された第１の
文字列”ｌｉｋｅ”と入力された第２の文字列”ｕｎｌ
ｉｋｅ”との間の擬似距離行列の４番目の行における６
番目の要素の値０に第１の文字列”ｌｉｋｅ”と第３の
文字列”ｋｎｏｗｎ”との間の擬似距離行列の４番目の
行における５番目の要素の値４を加算した値である合計
値（和）４との差分値０に初期設定される。

【００８３】次いで、入力された第１の文字列”ｌｉｋ
ｅ”及び第２の文字列”ｕｎｌｉｋｅ”間の擬似距離行
列においては、４番目の行における６番目の要素の値０
は、３番目の行における５番目の要素の値０に、第１の
文字列”ｌｉｋｅ”の４番目の文字”ｅ”と第２の文字
列”ｕｎｌｉｋｅ”の６番目の文字”ｅ”とを比較した
関数ｔｒｕｅの比較結果値（関数値）０を加算した値と
同一値であることから、動作方向が対角方向であること
が分かる。

【００８４】また、入力された第１の文字列”ｌｉｋ
ｅ”及び第３の文字列”ｋｎｏｗｎ”間の擬似距離行列
においては、４番目の行における５番目の要素の値４
は、３番目の行における４番目の要素の値３に、第１の
文字列”ｌｉｋｅ”の４番目の文字”ｅ”と第３の文字
列”ｋｎｏｗｎ”の５番目の文字”ｎ”とを比較した関
数ｔｒｕｅの比較結果値（関数値）１を加算した値と同
一であることから、動作方向が対角方向であることが分
かる。

【００８５】それゆえ、両行列における２つの方向が対
角方向であり同一であることが分かり、従って、同一方
向処理を行う。同一方向処理は、以下のように進行す
る。

【００８６】まず、入力された第２の文字列及び入力さ
れた第３の文字列における両方の現在の位置がゼロでは
なく、また第１の文字列”ｌｉｋｅ”の４番目の文字”
ｅ”と第２の文字列”ｕｎｌｉｋｅ”の６番目の文字”
ｅ”が等しいことが分かる。第１の文字列”ｌｉｋｅ”
の４番目の文字”ｅ”と第３の文字列”ｋｎｏｗｎ”の
５番目の文字”ｎ”が等しくなく、また第１の文字列”
ｌｉｋｅ”の４番目の文字”ｅ”と第２の文字列”ｕｎ
ｌｉｋｅ”の６番目の文字”ｅ”が等しいと分かること
により、生成されて出力される類推語の最終文字は、入
力された第３の文字列”ｋｎｏｗｎ”からの現在の文字
値”ｎ”に設定される。

【００８７】さらに、入力された３つの文字列の現在の
位置、及び生成されて出力される類推語における現在の
位置のすべてが１だけデクリメントされて設定され、処
理は元の類推語生成サブルーチン処理に戻る。

【００８８】従って、２つの擬似距離行列における動作
方向は双方とも対角方向であるために、生成されて出力
される類推語の最後から２番目の文字は、入力された第
３の文字列”ｋｎｏｗｎ”からの４番目の文字”ｗ”に
設定されることがさらに判明する。次いで、２つの擬似
距離行列における動作方向が双方とも対角方向であるた
めに、生成されて出力される類推語の最後から３番目の
文字は、第３の文字列”ｋｎｏｗｎ”からの３番目の文
字”ｏ”に設定されることがさらに判明し、次いで、２
つの擬似距離行列における動作方向が双方とも対角方向
であるために、生成されて出力される類推語の最後から
４番目の文字は、第３の文字列”ｋｎｏｗｎ”からの２
番目の文字”ｎ”に設定されることがさらに判明し、次
いで、２つの擬似距離行列における動作方向が双方とも
水平方向であるために、生成されて出力される類推語の
最後から５番目の文字は、第３の文字列”ｋｎｏｗｎ”
からの１番目の文字”ｋ”に設定されることがさらに判
明し、次いで、第１の文字列と第２の文字列との擬似距
離行列における動作方向が水平方向であり、また第１の
文字列と第３の文字列と間の擬似距離行列における動作
方向が対角方向であるために、生成されて出力される類
推語の最後から６番目の文字は、第２の文字列”ｕｎｌ
ｉｋｅ”からの２番目の文字”ｎ”に設定されることが
さらに判明し、次いで、第１の文字列と第２の文字列と
の間の擬似距離行列における動作方向が水平方向であ
り、また第１の文字列と第３の文字列との間の擬似距離
行列における動作方向が対角方向であるために、生成さ
れて出力される類推語の最後から７番目の文字は、第２
の文字列”ｕｎｌｉｋｅ”からの最初の文字”ｕ”に設
定されることがさらに判明し、結果的に、出力される類
推語は、”ｕｎｋｎｏｗｎ”に設定される。

【００８９】次に、上述された類推語生成処理をフロー
チャートを用いて説明する。図９は、図１において示さ
れる類推語生成装置１００の中央演算処理装置１によっ
て実行される類推語生成処理を示すフローチャートであ
る。

【００９０】図９を参照すると、まずステップＳ１で、
キーボード２１を使用して入力された３つの第１，第２
及び第３の文字列（すなわち、単語）が、データＷｏｒ
ｄ１，Ｗｏｒｄ２，Ｗｏｒｄ３に設定され、さらに、第
１の文字列Ｗｏｒｄ１、第２の文字列Ｗｏｒｄ２及び第
３の文字列Ｗｏｒｄ３のそれぞれの文字数（長さ）がそ
れぞれ、データＬｅｎ１、Ｌｅｎ２及びＬｅｎ３に設定
される。

【００９１】次いで、ステップＳ２で、前処理部２にお
いて前処理が実行された後、ステップＳ３で、類推語生
成部５によって類推語生成処理が実行される。ここで、
この好ましい実施形態では、データＷｏｒｄ１、Ｗｏｒ
ｄ２及びＷｏｒｄ３、並びにデータＬｅｎ１、Ｌｅｎ２
及びＬｅｎ３は、ＦＯＲＴＲＡＮやＢＡＳＩＣ等の言語
で使用される大域変数（global variables）のように各
サブルーチンにおいて有効な変数であるために、処理名
に続く括弧（）内に各サブルーチンで使用する引数は表
示されていない。

【００９２】図１０は、図９におけるメインルーチンの
うちのサブルーチンであるステップＳ２の前処理を示す
フローチャートである。この前処理は、キーボード２１
を用いて入力された３つの文字列（単語）に基づいて、
（ａ１）第１の文字列Ｗｏｒｄ１の最初の文字から始ま
って最後の文字までの各部分列と、第２の文字列Ｗｏｒ
ｄ２の最初の文字から始まって最後の文字までの各部分
列との間の擬似距離行列Ｍ１２の各要素と、（ａ２）第
１の文字列Ｗｏｒｄ１の最初の文字から始まって最後の
文字までの各部分列と、第３の文字列Ｗｏｒｄ３の最初
の文字から始まって最後の文字までの各部分列との間の
擬似距離行列Ｍ１３の各要素とを計算して擬似距離行列
メモリ１０に記憶する処理である。

【００９３】図１０を参照すると、まずステップＳ１１
で、擬似距離行列Ｍ１２の各要素の値を正の無限大のデ
ータに初期設定する行列初期化処理ＩｎｉｔＭａｔｒｉ
ｘ（Ｍ１２，Ｌｅｎ２）が実行され、次いで、ステップ
Ｓ１２で、擬似距離行列Ｍ１３の各要素の値を正の無限
大のデータに初期設定する行列初期化処理ＩｎｉｔＭａ
ｔｒｉｘ（Ｍ１３，Ｌｅｎ３）が実行され、さらに、ス
テップＳ１３で、十分な擬似距離値を計算する十分な擬
似距離行列の計算処理ＳｕｆＭａｔＣｏｍｐ（Ｍ１２，
Ｍ１３，０，０）が実行された後、元のメインルーチン
に戻る。本明細書において、例えば、行列初期化処理Ｉ
ｎｉｔＭａｔｒｉｘ（Ｍ１２，Ｌｅｎ２）におけるＩｎ
ｉｔＭａｔｒｉｘは処理名であって、（Ｍ１２，Ｌｅｎ
２）は当該サブルーチン処理を実行するための引数であ
る。

【００９４】図１１は、図１０の前処理のサブルーチン
であるステップＳ１１及び１２の行列初期化処理を示す
フローチャートである。ここで、図１０のステップＳ１
１における行列初期化処理の場合はｋ＝２であり、図１
０のステップＳ１２における行列初期化処理の場合はｋ
＝３である。

【００９５】図１１を参照すると、まずステップＳ９１
でパラメータｉ１が１に初期設定され、その後、ステッ
プＳ９２で、ｉ１≦Ｌｅｎ１であるか否かが判断され、
ｉ１＞Ｌｅｎ１のときは、行列初期化処理が終了したと
判断されて、図１０の前処理に戻る。また、ステップＳ
９２でｉ１≦Ｌｅｎ１のときは、ステップＳ９３でパラ
メータｉｋが１に初期設定された後、ステップＳ９４で
ｉｋ≦Ｌｅｎｋであるか否かが判断される。ステップＳ
９４で、ｉｋ＞Ｌｅｎｋのときは、ステップＳ９７に進
み、パラメータｉ１は１だけインクリメントされて設定
され、ステップＳ９２に戻る。一方、ステップＳ９４
で、ｉｋ≦Ｌｅｎｋのときは、ステップＳ９５で、擬似
距離行列Ｍ１ｋにおけるｉ１番目の行のｉｋ番目の要素
Ｍ１ｋ［ｉ１］［ｉｋ］には正の無限大のデータが設定
される。次いで、ステップＳ９６において、パラメータ
ｉｋは１だけインクリメントされて設定された後、ステ
ップＳ９４に戻る。

【００９６】図１２は、図１０における前処理のサブル
ーチンであるステップＳ１３の十分な擬似行列の計算処
理を示すフローチャートである。

【００９７】図１２を参照すると、まずステップＳ２１
において、制限された擬似距離計算処理ＬｉｍＭａｔＣ
ｏｍｐ（Ｍ１２，ｄ２，Ｌｅｎ２）が実行され、ここ
で、対角バンドとｄ２で制限された幅のエキストラバン
ドにおける要素の値に対して、第１の文字列Ｗｏｒｄ１
の最初の文字から最後の文字までの部分列と第２の文字
列Ｗｏｒｄ２の最初の文字から最後の文字までの部分列
との間の擬似距離を表す擬似距離行列Ｍ１２における行
数と１行当たりの文字数との間の差の絶対値を加算す
る。次いで、同様にステップＳ２２において、限定され
た擬似距離計算処理ＬｉｍＭａｔＣｏｍｐ（Ｍ１３，ｄ
３，Ｌｅｎ３）が実行される。ここで、対角バンドとｄ
３で制限された幅のエキストラバンドにおける要素の値
に、第１の文字列Ｗｏｒｄ１の最初の文字から最後の文
字までの部分列と第３の文字列Ｗｏｒｄ３の最初の文字
から最後の文字までの部分列との間の擬似距離を表す擬
似距離行列Ｍ１３における行数と１行当たりの文字数と
の間の絶対差を加算する。さらに、ステップＳ２３で、
第１の文字列Ｗｏｒｄ１と第２の文字列Ｗｏｒｄ２との
間の擬似距離を表す、擬似距離行列の最後の行における
最後の要素の値が、パラメータｐ２に設定され、同様
に、第１の文字列Ｗｏｒｄ１と第３の文字列Ｗｏｒｄ３
との間の擬似距離を表す、擬似距離行列の最後の行にお
ける最後の要素の値が、パラメータｐ３に設定される。

【００９８】次いで、ステップＳ２４で、入力された第
１の文字列Ｗｏｒｄ１の文字数Ｌｅｎ１がパラメータｐ
２とパラメータｐ３の和以下であるか否かが判断され
る。ここで、Ｌｅｎ１＞ｐ２＋ｐ３であれば、擬似距離
行列Ｍ１２及びＭ１３において十分な数の値が計算され
たことを意味し、元のサブルーチンである図１０の前処
理に戻る。一方、Ｌｅｎ１≦ｐ２＋ｐ３であれば、ステ
ップＳ２５に進み、入力された第１の文字列Ｗｏｒｄ１
の文字数がパラメータｄ２とパラメータｄ３の和より大
きい又は等しいか否かが判断される。

【００９９】ステップＳ２５で、Ｌｅｎ１＜ｄ２＋ｄ３
であれば、第１の文字列Ｗｏｒｄ１のうちの幾つかの文
字が、第２の文字列Ｗｏｒｄ２及び第３の文字列Ｗｏｒ
ｄ３の何れにも発見できないことを意味し、当該処理で
は一定順序で入力された３つの文字列から類推語を生成
することができないこととなり、生成処理に失敗して終
了する。一方、ステップＳ２５においてＬｅｎ１≧ｄ２
＋ｄ３のときは、ステップＳ２６に進み、第１の文字列
Ｗｏｒｄ１の文字数Ｌｅｎ１から、第１の文字列Ｗｏｒ
ｄ１と第３の文字列Ｗｏｒｄ３との間の反対の暫定的な
擬似距離ｐ３を減算した値と、パラメータｄ２に１を加
算した値とのうちの最大値がパラメータｄ２に設定さ
れ、同様に、第１の文字列Ｗｏｒｄ１の文字数Ｌｅｎ１
から、第１の文字列Ｗｏｒｄ１と第２の文字列Ｗｏｒｄ
２との間の暫定擬似距離を減算した値と、パラメータｄ
３に１を加算した値とのうちの最大値がパラメータｄ３
に設定される。次いで、ステップＳ２７で再度、十分な
擬似距離行列の計算処理ＳｕｆＭａｔＣｏｍｐ（Ｍ１
２，Ｍ１３，ｄ２，ｄ３）が実行された後、元の処理に
戻る。

【０１００】図１３及び図１４は、図１２における十分
な擬似距離行列の計算処理のサブルーチンであるステッ
プＳ２１及びステップＳ２２の制限された擬似距離行列
の計算処理を示すフローチャートである。ここで、図１
２のステップＳ２１における制限された擬似距離計算処
理の場合はｋ＝２であり、図１２のステップＳ２２にお
ける制限された擬似距離計算処理の場合はｋ＝３であ
る。

【０１０１】図１３を参照すると、まずステップＳ３１
で、パラメータｄｋｌｅｆｔが値（−ｄｋ／２）に初期
設定され、かつパラメータｄｋｒｉｇｈｔが値ｄｋ／２
に初期設定された後、ステップＳ３２で、Ｌｅｎ１≧Ｌ
ｅｎｋであるか否かが判断される。ここで、入力された
第１の文字列Ｗｏｒｄ１の文字数Ｌｅｎ１が、入力され
た他の文字列Ｗｏｒｄｋの文字数Ｌｅｎｋ以上であれ
ば、ステップＳ３３で、文字数Ｌｅｎ１から文字数Ｌｅ
ｎｋを減算した値が、パラメータｄｋｌｅｆｔから減算
され、減算結果値がパラメータｄｋｌｅｆｔに設定され
た後、図１４のステップＳ３５に進む。一方、ステップ
Ｓ３２で、Ｌｅｎ１＜Ｌｅｎｋであれば、ステップＳ３
４で、パラメータｄｋｒｉｇｈｔには、文字数Ｌｅｎｋ
から文字数Ｌｅｎ１を減算した値が加算されて更新され
た後、図１４のステップＳ３５に進む。

【０１０２】図１４のステップＳ３５では、パラメータ
ｉ１の値が１に初期設定される。次いで、ステップＳ３
６で、ｉ１＞Ｌｅｎ１であるか否かが判断される。ここ
で、ｉ１＞Ｌｅｎ１であれば、擬似距離行列Ｍ１ｋのす
べての要素に対して処理を行ったことを意味し、元のサ
ブルーチンである図１２の十分な擬似距離行列の計算処
理に戻る。一方、ステップＳ３６においてｉ１≦Ｌｅｎ
１であれば、ステップＳ３７に進み、パラメータｉｋｌ
ｅｆｔの値には、パラメータｄｋｌｅｆｔの値とパラメ
ータｉ１の値の和と、数値１のうちの最大値が設定さ
れ、かつ、パラメータｉｋｒｉｇｈｔの値には、パラメ
ータｄｋｒｉｇｈｔの値にパラメータｉ１の値を加算し
た値と、パラメータＬｅｎｋの値に数値１を加算した値
のうちの最小値が設定される。

【０１０３】ステップＳ３７に次いで、ステップＳ３８
では、パラメータｉｋにパラメータｉｋｌｅｆｔの値が
初期値として設定される。次いで、ステップＳ３９で、
ｉｋ＞ｉｋｒｉｇｈｔであるか否かが判断される。ここ
で、ｉｋ＞ｉｋｒｉｇｈｔであれば、擬似距離行列Ｍ１
ｋの現在処理中の行には処理されてない十分な要素がな
いことを意味するので、ステップＳ４２に進み、次の行
における処理を行うように、パラメータｉ１は１だけイ
ンクリメントされて設定され、ステップＳ３６に戻る。
一方、ステップＳ３９において、ｉｋ≦ｉｋｒｉｇｈｔ
であれば、ステップＳ４０に進み、（ａ）１つ前の行で
ある（ｉ１−１）番目の行における１つ前の要素の値Ｍ
１ｋ［ｉ１−１］［ｉｋ−１］と関数ｔｒｕｅ（Ｗｏｒ
ｄ１［ｉ１］≠Ｗｏｒｄｋ［ｉｋ］）の関数値との和
と、（ｂ）擬似距離行列Ｍ１ｋの前の行である（ｉ１−
１）番目の行のｉｋ番目の要素の値Ｍ１ｋ［ｉ１−１］
［ｉｋ］と数値１との和と、（ｃ）擬似距離行列Ｍ１ｋ
のｉ１番目の行における１つ前の要素である（ｉｋ−
１）番目の要素の値Ｍ１ｋ［ｉ１］［ｉｋ−１］とのう
ちの最小値が、擬似距離行列Ｍ１ｋのｉ１番目の行のｉ
ｋ番目の要素の値Ｍｋ１［ｉ１］［ｉｋ］に設定され
る。次いで、ステップＳ４１でパラメータｉｋは１だけ
インクリメントされて設定され、ステップＳ３９に戻
る。

【０１０４】図１５は、図９の類推語生成処理のサブル
ーチンであるステップＳ３の類推語生成処理を示すフロ
ーチャートである。図１５を参照すると、まずステップ
Ｓ５１で、パラメータｉ１を、入力された第１の文字列
Ｗｏｒｄ１の文字数Ｌｅｎ１の値に初期設定し、次い
で、パラメータｉ２を、入力された第２の文字列Ｗｏｒ
ｄ２の文字数Ｌｅｎ２の値に初期設定し、次いで、パラ
メータｉ３を、入力された第３の文字列Ｗｏｒｄ３の文
字数Ｌｅｎ３の値に初期設定し、さらに、パラメータｉ
４を、入力された３つの文字列である第１の文字列Ｗｏ
ｒｄ１の文字数Ｌｅｎ１、第２の文字列Ｗｏｒｄ２の文
字数Ｌｅｎ２及び第３の文字列Ｗｏｒｄ３の文字数Ｌｅ
ｎ３のうちの最大の文字数の２倍の値に初期設定する。
次に、ステップＳ５２において、類推語生成部５によっ
て類推語生成サブルーチン処理ＰｒｏＰｒｏを実行した
後、図９の類推語生成処理（メインルーチン）に戻り、
類推語生成処理を終了する。

【０１０５】図１６は、図１５における類推語生成処理
ＰｒｏＰｒｏ（ｉ１，ｉ２，ｉ３，ｉ４）のサブルーチ
ンであるステップＳ５２の類推語生成サブルーチン処理
を示すフローチャートである。図１６を参照すると、ま
ずステップＳ６１で、状態パラメータｃｏｍ（Ａ，Ｂ，
Ｃ，Ｄ）は、擬似距離行列Ｍ１２のｉ１番目の行におけ
るｉ２番目の要素の値Ｍ１２［ｉ１］［ｉ２］に、擬似
距離行列Ｍ１３のｉ１番目の行におけるｉ３番目の要素
の値Ｍ１３［ｉ１］［ｉ３］を加算した値を、パラメー
タｉ１の値から減算した値に初期設定される。

【０１０６】次いで、ステップＳ６２で、パラメータｉ
１、ｉ２及びｉ３の値がすべて０より大きいか否かが判
断される。ここで、パラメータｉ１、ｉ２及びｉ３のす
べての値が０より大きくなければ、少なくとも１つの文
字列はステップＳ６３乃至ステップＳ６８の各処理を完
全に行われていることを意味するので、元のサブルーチ
ンである図１５の類推語生成処理に戻る。一方、ステッ
プＳ６２で、パラメータｉ１、ｉ２及びｉ３のすべてが
０より大きいときは、ステップＳ６３に進み、パラメー
タｉ１の値は、擬似距離行列Ｍ１２のｉ１番目の行にお
けるｉ２番目の要素の値Ｍ１２［ｉ１］［ｉ２］に、擬
似距離行列Ｍ１３のｉ１番目の行におけるｉ３番目の要
素の値Ｍ１３［ｉ１］［ｉ３］と、状態パラメータｃｏ
ｍ（Ａ，Ｂ，Ｃ，Ｄ）の値とを加算した値に等しいか否
かが判断される。ステップＳ６３で、等しくなければ、
入力された一定順序の３つの文字列に類推語が存在しな
いことを意味し、当該処理ではこうした文字列が生成で
きないことが含意され、類推語を生成することはできな
いと判断して、生成処理が失敗したとして終了する。ま
た、ステップＳ６３において等式が成立するときは、ス
テップＳ６４に進む。ステップＳ６４では、方向決定処
理ＤｉｒＤｅｃ（ｉ１，ｉ２，Ｍ１２，Ｗｏｒｄ２，Ｄ
２）が実行され、その計算結果をパラメータＤ２に設定
し、次いで、ステップＳ６５では、方向決定処理Ｄｉｒ
Ｄｅｃ（ｉ１，ｉ３，Ｍ１３，Ｗｏｒｄ３，Ｄ３）が実
行され、その計算結果をパラメータＤ３に設定し、ステ
ップＳ６６に進む。

【０１０７】ステップＳ６６では、２つのパラメータＤ
２及びＤ３の値が等しいか否かが判断される。ここで、
２つのパラメータ値Ｄ２及びＤ３が等しいときは、同一
の方向である判断してステップＳ６７に進み、同一方向
処理ＳａｍＤｉｒが実行され、ステップＳ６２に戻る。
一方、ステップＳ６６において２つのパラメータ値Ｄ２
及びＤ３が等しくないときは、同一の方向ではないと判
断して、ステップＳ６８に進み、異なった方向処理Ｄｉ
ｆｆＤｉｒが実行されてステップＳ６２に戻る。

【０１０８】図１７は、図１６における類推語生成サブ
ルーチン処理のサブルーチンであるステップＳ６４又は
６５の方向決定処理ＤｉｒＤｅｃ（ｉ１，ｉｋ，Ｍ１
ｋ，Ｗｏｒｄｋ，ｒｅｓｕｌｔ）を示すフローチャート
である。ここで、図１６のステップＳ６４における方向
決定処理ＤｉｒＤｅｃの場合はｋ＝２であり、図１６の
ステップＳ６５における方向決定処理ＤｉｒＤｅｃの場
合はｋ＝３である。ここで、“現在の要素”とは、擬似
距離行列の要素のうち現在処理されている要素を表し、
“次の要素”とは、擬似距離行列において現在の要素の
次に処理を行われる要素を表す。

【０１０９】図１７におけるステップＳ６４及び６５の
方向決定処理ＤｉｒＤｅｃ（ｉ１，ｉｋ，Ｍ１ｋ，Ｗｏ
ｒｄｋ，ｒｅｓｕｌｔ）は、擬似距離行列の１つの要素
から次の要素への移動の方向を計算する。ここで、次の
要素の値が対応する両方の文字同士が異なれば、対角方
向への移動が可能である。入力された文字列の文字同士
が異なると、擬似距離は値１だけ増加される。従って、
反対方向に移動しながら、入力された文字列の対応する
文字同士が異なる場合は、１つ前の要素が１だけ異なっ
ているときに経路は対角方向への移動をたどる。２つの
入力された文字列の対応する文字同士が同一である場合
は、現在の要素から対角方向にある１つ前の要素は、現
在の要素と同一の値を有する。現在の要素の直上の要素
の値が現在の要素と同一の場合には、水平移動が可能で
ある。垂直移動は、現在の要素の側面（右又は左）の要
素が現在の要素の値と１だけ異なる場合に可能である。

【０１１０】図１７を参照すると、まず、ステップＳ１
１０で、擬似距離行列Ｍ１ｋのｉ１番目の行におけるｉ
ｋ番目の要素の値Ｍ１ｋ［ｉ１］［ｉｋ］が、擬似距離
行列Ｍ１ｋの（ｉ１−１）番目の行における（ｉｋ−
1）番目の要素の値Ｍ１ｋ［ｉ１‐１］［ｉｋ‐１］
と、関数ｔｒｕｅ（Ｗｏｒｄ１［ｉ１］≠Ｗｏｒｄｋ
［ｉｋ］）の関数値との和｛Ｍ１ｋ［ｉ１‐１］［ｉｋ
‐１］＋ｔｒｕｅ（Ｗｏｒｄ１［ｉ１］≠Ｗｏｒｄｋ
［ｉｋ］）｝と等しいか否かが判断される。ステップＳ
１１０で等しければ、ステップＳ１１１に進み、結果値
ｒｅｓｕｌｔには対角方向が設定され、図１６の類推語
生成サブルーチン処理に戻る。また、ステップＳ１１０
において、等式が成立しないときは、ステップＳ１１２
で、擬似距離行列Ｍ１ｋのｉ１番目の行におけるｉｋ番
目の要素の値Ｍ１ｋ［ｉ１］［ｉｋ］が、擬似距離行列
Ｍ１ｋの同一行であるｉ１番目の行における１つ前の要
素である（ｉｋ−１）番目の要素の値Ｍ１ｋ［ｉ１］
［ｉｋ−１］に等しいか否かが判断される。ステップＳ
１１２で等しければ、ステップＳ１１３に進み、結果値
ｒｅｓｕｌｔには水平方向が設定され、次いで、図１６
の類推語生成サブルーチン処理に戻る。ステップＳ１１
２において等式が成立しないときは、ステップＳ１１４
に進み、擬似距離行列Ｍ１ｋのｉ１番目の行におけるｉ
ｋ番目の要素の値Ｍ１ｋ［ｉ１］［ｉｋ］が、擬似距離
行列Ｍ１ｋの１つ前の行である（ｉ１−１）番目の行に
おける同一番目であるｉｋ番目の要素の値Ｍ１ｋ［ｉ１
−１］［ｉｋ］に数値１を加算した値｛Ｍ１ｋ［ｉ１−
１］＋１｝に等しいか否かが判断される。ステップＳ１
１４で等しいときは、ステップＳ１１５に進み、結果値
ｒｅｓｕｌｔに垂直方向が設定され、次いで、図１６の
類推語生成サブルーチン処理に戻る。また、ステップＳ
１１４において等式が成立しないときは、擬似距離行列
Ｍ１ｋのｉ１番目の行におけるｉｋ番目の要素の値が擬
似距離行列の計算に一致しないことを意味し、類推語を
生成することができないと判断して、生成失敗として終
了する。

【０１１１】図１８は、図１６における類推語生成サブ
ルーチン処理のサブルーチンである同一方向処理Ｓａｍ
ｅＤｉｒ（ステップＳ６７）を示すフローチャートであ
る。同一方向処理は、両方の擬似距離行列Ｍ１２及びＭ
１３において移動の方向が同一である場合の処理であ
る。両方の移動が共に対角方向である場合は、入力され
た第１の文字列の文字が他の入力された文字列の文字と
少なくとも１つが同一文字でなければならない。そうで
ない場合は、入力された第１の文字列のいずれかの文字
が、入力された第２の文字列又は第３の文字列のいずれ
かに現れなければならないという重ね合わせの制約条件
に従って、類推語の生成は不可能であり、従って、生成
失敗であることを意味する。３つの入力された文字列の
文字が同一である場合は、当該文字を類推語にコピーす
ることができる。入力された第１の文字列の文字が、入
力された第２の文字列の文字とだけ同一の場合は、入力
された第３の文字列からの文字が類推語にコピーされ
る。入力された第１の文字列の文字が、入力された第３
の文字列の文字とだけ同一の場合は、入力された第２の
文字列からの文字が類推語にコピーされる。また、両方
の移動方向が共に水平方向である場合は、一方の擬似距
離行列において１つの移動のみが行われ、他方の擬似距
離行列では移動が行われない。移動は擬似距離が小さい
方の擬似距離行列で行われるために、入力された第２又
は第３の文字列からの文字が類推語にコピーされる。両
方の移動方向が共に垂直方向である場合は、どの文字も
類推語にコピーされないことを意味している。各擬似距
離行列においては、１つの移動のみが実行可能である。

【０１１２】図１８を参照すると、まず、ステップＳ７
１でパラメータＤ２の値が対角方向であるか否かが判断
される。パラメータＤ２の値が対角方向でないときは、
ステップＳ７９に進む。ステップＳ７１において、パラ
メータＤ２の値が対角方向であれば、ステップＳ７２に
進み、パラメータｉ２及びｉ３の値がそれぞれ０より大
きい、かつ、入力された第１の文字列Ｗｏｒｄ１内のｉ
１番目の文字Ｗｏｒｄ１［ｉ１］が、入力された第２の
文字列Ｗｏｒｄ２内のｉ２番目の文字Ｗｏｒｄ２［ｉ
２］に等しい、又は、入力された第１の文字列Ｗｏｒｄ
１内のｉ１番目の文字Ｗｏｒｄ１［ｉ１］が、入力され
た第３の文字列Ｗｏｒｄ３内のｉ３番目の文字Ｗｏｒｄ
３［ｉ３］に等しいという条件を満たすか否かが判断さ
れる。ステップＳ７２でＮＯであればその順序で入力さ
れた３つの文字列に類推的に類似するような文字列であ
る類推語は存在せず、従って、類推語生成処理がこのよ
うな文字列を生成することができないことを意味し、生
成処理に失敗して終了する。

【０１１３】一方、ステップＳ７２においてＹＥＳであ
れば、ステップＳ７３に進み、入力された第１の文字列
Ｗｏｒｄ１内のｉ１番目の文字Ｗｏｒｄ１［ｉ１］と、
入力された第２の文字列Ｗｏｒｄ２内のｉ２番目の文字
Ｗｏｒｄ２［ｉ２］と、入力された第３の文字列Ｗｏｒ
ｄ３内のｉ３番目の文字Ｗｏｒｄ３［ｉ３］とが等しい
か否かが判断され、等しいときは、ステップＳ７４に進
み、状態パラメータｃｏｍ（Ａ，Ｂ，Ｃ，Ｄ）の値が１
だけデクリメントされて設定され、次いで、ステップＳ
７５に進む。また、ステップＳ７３でＮＯであれば、直
接にステップＳ７５に進む。

【０１１４】ステップＳ７５では、入力された第１の文
字列Ｗｏｒｄ１内のｉ１番目の文字Ｗｏｒｄ１［ｉ１］
と、入力された第２の文字列Ｗｏｒｄ２内のｉ２番目の
文字Ｗｏｒｄ２［ｉ２］とが等しいか否かが判断され
る。等しいときは、ステップＳ７６に進み、入力された
第３の文字列Ｗｏｒｄ３内のｉ３番目の文字Ｗｏｒｄ３
［ｉ３］が、生成された文字列Ｗｏｒｄ４内のｉ４番目
の要素Ｗｏｒｄ４［ｉ４］に設定され、次いで、ステッ
プＳ７８に進む。また、ステップＳ７５において、等し
くないときは、入力された第２の文字列Ｗｏｒｄ２内の
ｉ２番目の文字Ｗｏｒｄ２［ｉ２］が、生成された文字
列Ｗｏｒｄ４内のｉ４番目の要素Ｗｏｒｄ４［ｉ４］に
設定され、次いで、ステップＳ７８に進む。ステップＳ
７８では、パラメータｉ１，ｉ２，ｉ３及びｉ４のすべ
ての値が１だけデクリメントされて設定され、次いで、
図１６の類推語生成サブルーチン処理に戻る。

【０１１５】ステップＳ７１のＮＯからのステップＳ７
９では、パラメータＤ２の値が水平方向であるか否かが
判断される。ここで、パラメータＤ２の値が水平方向に
等しくないときは、ステップＳ８３でパラメータｉ１を
１だけデクリメントされて図１６の類推語生成サブルー
チン処理に戻る。また、ステップＳ７９において、パラ
メータＤ２の値が水平方向であれば、ステップＳ８０に
進み、擬似距離行列Ｍ１２のｉ１番目の行におけるｉ２
番目の要素の値Ｍ１２［ｉ１］［ｉ２］が、擬似距離行
列Ｍ１３のｉ１番目の行におけるｉ３番目の要素の値Ｍ
１３［ｉ１］［ｉ３］より小さいか否かが判断される。
ステップＳ８０でＹＥＳのときは、ステップＳ８１で、
入力された第２の文字列Ｗｏｒｄ２のｉ２番目の文字Ｗ
ｏｒｄ２［ｉ２］が、生成される文字列Ｗｏｒｄ４内の
ｉ４番目の要素Ｗｏｒｄ４［ｉ４］に設定され、かつ、
パラメータｉ２及びｉ４の値がそれぞれ１だけデクリメ
ントされて設定された後、図１６の類似語生成サブルー
チン処理に戻る。

【０１１６】また、ステップＳ８０でＮＯのときは、ス
テップＳ８２に進み、入力された第３の文字列Ｗｏｒｄ
３のｉ３番目の文字Ｗｏｒｄ３［ｉ３］が、生成される
文字列Ｗｏｒｄ４内のｉ４番目の要素Ｗｏｒｄ４［ｉ
４］に設定され、かつ、パラメータｉ３及びｉ４の各値
が１だけデクリメントされて設定された後、図１６の類
似語生成サブルーチン処理に戻る。

【０１１７】図１９は、図１６における類似語生成サブ
ルーチン処理のサブルーチンであるステップＳ６８の異
なった方向処理ＤｉｆｆＤｉｒを示すフローチャートで
ある。ステップＳ６８の異なった方向処理ＤｉｆｆＤｉ
ｒは、両擬似距離行列において移動方向が異なる場合の
処理である。文字は、両擬似距離行列の移動方向の１つ
が水平方向である場合にのみ類推語にコピーされる。入
力された第１の文字列と第２の文字列との間の擬似距離
行列における移動が水平方向である場合には、この文字
は入力された第３の文字列からももたらされる。この場
合、入力された第１の文字列と第２の文字列との間の擬
似距離行列では移動は行われない。

【０１１８】図１９を参照すると、まずステップＳ１０
１で、パラメータＤ２が水平方向であるか否かが判断さ
れる。ここで、パラメータＤ２の値が水平方向であれ
ば、ステップＳ１０２に進み、入力された第２の文字列
Ｗｏｒｄ２のｉ２番目の文字Ｗｏｒｄ２［ｉ２］が、生
成された文字列Ｗｏｒｄ４内のｉ４番目の要素Ｗｏｒｄ
４［ｉ４］に設定され、パラメータｉ２及びｉ４の値が
それぞれ１だけデクリメントされて設定され、図１６の
類似語生成サブルーチン処理に戻る。

【０１１９】また、ステップＳ１０１でＮＯであると
き、ステップＳ１０３に進み、パラメータＤ２の値が垂
直方向であるか否かが判断される。パラメータＤ２の値
が垂直方向であれば、ステップＳ１０４で、パラメータ
ｉ１及びｉ３の値がそれぞれ１だけデクリメントされて
設定され、図１６の類似語生成サブルーチン処理に戻
る。

【０１２０】ステップＳ１０３において、パラメータＤ
２の値が垂直方向でなければ、ステップＳ１０５に進
み、パラメータＤ３の値が水平方向であるか否かが判断
される。パラメータＤ３の値が水平方向であれば、ステ
ップＳ１０６に進み、入力された第３の文字列Ｗｏｒｄ
３のｉ３番目の文字Ｗｏｒｄ３［ｉ３］が、生成された
文字列Ｗｏｒｄ４内のｉ４番目の要素Ｗｏｒｄ４［ｉ
４］に設定され、パラメータｉ３及びｉ４の値がそれぞ
れ１だけデクリメントされて設定され、図１６の類似語
生成サブルーチン処理に戻る。

【０１２１】ステップＳ１０５において、パラメータＤ
３の値が水平方向でないときは、ステップＳ１０７に進
み、パラメータＤ３の値が垂直方向であるか否かが判断
される。パラメータＤ３の値が垂直方向であれば、ステ
ップＳ１０８に進み、パラメータｉ１及びｉ２の値がそ
れぞれ１だけデクリメントされて設定され、図１６の類
似語生成サブルーチン処理に戻る。また、ステップＳ１
０７においてパラメータＤ３の値が垂直方向でないとき
は、直接に、図１６の類似語生成サブルーチン処理に戻
る。

【０１２２】また、好ましい本実施形態による類推語生
成装置１００は、以下の予め決められた条件下で類推語
生成処理を早期停止することができ、それによって処理
時間を短縮化することが可能である。

【０１２３】上述の条件としては、例えば次のようなも
のがある。＜条件＞：入力された第１の文字列における現在の位置
は、入力された第１の文字列と入力された第２の文字列
との間の擬似距離行列における第１の文字列の現在の位
置のランクの行における第２の文字列の現在の位置のラ
ンクの要素の値と、入力された第１の文字列と入力され
た第３の文字列との間の擬似距離行列における第１の文
字列の現在の位置のランクの行における第３の文字列の
現在の位置のランクの要素の値と、入力された３つの文
字列の共通文字数との和に等しくない。

【０１２４】上述の条件を説明する。この条件は、入力
された第１の文字列Ｗｏｒｄ１における現在の位置ｉ１
が、入力された第１の文字列Ｗｏｒｄ１と第２の文字列
Ｗｏｒｄ２との間の擬似距離行列Ｍ１２における第１の
文字列Ｗｏｒｄ１の現在の位置ｉ１のランクの行におけ
る第２の文字列Ｗｏｒｄ２の現在の位置ｉ２のランクの
要素の値Ｍ１２［ｉ１］［ｉ２］と、入力された第１の
文字列Ｗｏｒｄ１と入力された第３の文字列Ｗｏｒｄ３
との間の擬似距離行列Ｍ１３における第１の文字列Ｗｏ
ｒｄ１の現在の位置ｉ１のランクの行における第３の文
字列Ｗｏｒｄ３の現在の位置ｉ３のランクの要素の値Ｍ
１３［ｉ１］［ｉ３］と、入力された３つの文字列の共
通の文字数である状態パラメータｃｏｍ（Ａ，Ｂ，Ｃ，
Ｄ）との和と等しくない場合、すなわち、ランクｉ２ま
での入力された第２の文字列と、ランクｉ１までの入力
された第１の文字列との間の類似度の和が、入力された
第１の文字列における現在の位置ｉ１のランクと、入力
された３つの文字列に対して共通な文字数である状態パ
ラメータｃｏｍ（Ａ，Ｂ，Ｃ，Ｄ）と等しくない場合で
ある。

【０１２５】従って、この条件は、ランクｉ２までの入
力された第２の文字列と、ランクｉ１までの入力された
第１の文字列との間の類似度と、ランクｉ３までの入力
された第３の文字列とランクｉ１までの入力された第１
の文字列との間の類似度との和が、入力された第１の文
字列における現在の位置ｉ１のランクと、入力された３
つの文字列に対して共通な文字数である状態パラメータ
ｃｏｍ（Ａ，Ｂ，Ｃ，Ｄ）の和に比較して小さい場合、
もしくは、ランクｉ２までの入力された第２の文字列
と、ランクｉ１までの入力された第１の文字列との間の
類似度と、ランクｉ３までの入力された第３の文字列と
ランクｉ１までの入力された第１の文字列との間の類似
度との和が、入力された第１の文字列における現在の位
置ｉ１のランクと、入力された３つの文字列に対して共
通な文字数である状態パラメータｃｏｍ（Ａ，Ｂ，Ｃ，
Ｄ）の和に比較して大きい場合のいずれかの場合であ
る。

【０１２６】ランクｉ２までの入力された第２の文字列
と、ランクｉ１までの入力された第１の文字列との間の
類似度と、ランクｉ３までの入力された第３の文字列と
ランクｉ１までの入力された第１の文字列との間の類似
度との和が、入力された第１の文字列における現在の位
置ｉ１のランクと、入力された３つの文字列に対して共
通な文字数である状態パラメータｃｏｍ（Ａ，Ｂ，Ｃ，
Ｄ）の和に比較して小さい場合においては、ランクｉ１
までの入力された第１の文字列における幾つかの文字
は、ランクｉ２までの入力された第２の文字列に属せ
ず、また、ランクｉ３までの入力された第３の文字列に
属すことはない。このことは、各ランクｉ１，ｉ２，ｉ
３までの入力された３つの文字列に対して類推的に類似
する文字列は存在しないことを意味する。従って、類推
的に類似する文字列を生成するためには、入力された第
１の文字列における任意の文字が、入力された第２の文
字列又は入力された第３の文字列のいずれかに属する必
要がある（上述の適用すべき制約条件について参照せ
よ。）。この場合において、入力された３つの文字列に
対して類推的に類似する文字列の生成の処理は失敗する
（図１６のステップＳ６３参照。）。

【０１２７】ランクｉ２までの入力された第２の文字列
と、ランクｉ１までの入力された第１の文字列との間の
類似度と、ランクｉ３までの入力された第３の文字列と
ランクｉ１までの入力された第１の文字列との間の類似
度との和が、入力された第１の文字列における現在の位
置ｉ１のランクと、入力された３つの文字列に対して共
通な文字数である状態パラメータｃｏｍ（Ａ，Ｂ，Ｃ，
Ｄ）の和に比較して大きい場合においては、各ランクｉ
１，ｉ２，ｉ３までの現在生成された、入力された３つ
の文字列に対して類推的に類似する文字列は、３つの文
字列に対して共通な文字数と矛盾している。この場合に
おいて、入力された３つの文字列に対して類推的に類似
する文字列の生成の処理は失敗する（図１６のステップ
Ｓ６３参照。）。

【０１２８】上述の好ましい実施形態においては、類似
度の計算のために使用する擬似編集距離の定義として、
削除及び置換の操作数が修正なしで使用されている。し
かしながら、本発明に係る実施形態はこれに限定され
ず、変形例として操作の種類毎に重みを設定して距離を
定義してもよい。また、この好ましい実施形態による類
推語生成装置においても、類似度計算の部分に重み計算
を導入することが可能であり、重み付けされた類推語生
成処理を達成することができる。

【０１２９】次に、本発明の別の実施形態として、類似
語生成装置１００を用いた音声自動翻訳システムを図２
０を参照して以下に説明する。図２０において、発声音
声がマイクロホン１１に入力されて、音声信号に変換さ
れた後、Ａ／Ｄ変換器１２においてアナログ音声信号か
らデジタル音声信号にＡ／Ｄ変換される。デジタル音声
信号は、音声認識装置１３に入力され、例えばＬＰＣ分
析されて、ケプストラム係数などの特徴パラメータが抽
出される。音声認識装置１３は、抽出した特徴パラメー
タに基づいて、ＨＭＭメモリ３１内の所定の隠れマルコ
フモデルを参照して音素認識を行った後、言語モデルメ
モリ３２内の統計的言語モデルを参照して単語認識を行
うことにより、音声認識処理を実行して、音声認識され
た文字列のテキストデータをパターン追加部１４に出力
する。

【０１３０】パターン追加部１４には、類似語パターン
メモリ３３が接続され、この類似語パターンメモリ３３
には、複数の単語に対応して、後述の実施例において示
すように、例えば接頭辞又は接尾辞を挿入し又は削除す
ることによって互いに対（ｘ：ｙ）となる単語対からな
る類似語パターンが予め記憶される。パターン追加部１
４は、入力される文字列のテキストデータに含まれる単
語毎に、それに対応する類似語パターンの単語対を、類
似語パターンメモリ３３から検索して、処理対象の単語
に対してその類似語パターンの単語対を追加して、すな
わち、処理対象単語と、２つの単語対との合計３つの単
語を、類推語生成装置１００に出力する。

【０１３１】類推語生成装置１００は、入力された３つ
の単語に基づいて、上述の類推語生成処理を実行するこ
とにより類推語を生成し、音声認識装置１３から出力さ
れる単語列に対応する類推語の単語列のテキストデータ
を、自動翻訳装置１５に出力する。自動翻訳装置１５に
は、例えば日本語から英語への翻訳パターンのテキスト
データを記憶する翻訳パターンメモリ３４が接続され、
自動翻訳装置１５は、入力される単語列のテキストデー
タ（日本語）に基づいて、翻訳パターンメモリ３４内の
翻訳パターンを参照して、日本語から英語への翻訳を行
って、翻訳結果の単語列のテキストデータ（英語）をプ
リンタ２２に出力して記録紙に印字するとともに、ＣＲ
Ｔディスプレイ２３に出力して表示する。

【０１３２】本実施形態の音声自動翻訳システムは、上
述の類推語生成装置１００を備えているために、マイク
ロホン１１を介して入力された文字列又は単語列等の音
声信号から類推される類推語の単語列の文を自動翻訳し
て翻訳結果をプリンタ２２に出力したり、ＣＲＴディス
プレイ２３に表示させたりすることが可能である。

【０１３３】

【実施例】以下の幾つかの例は、本発明に係る実施形態
の類推語生成方法による実際の類推語の生成結果を示し
たものである。ここで、以下の関係式Ａ：Ｂ＝Ｃ：ｘに
おいて、Ａは入力された第１の文字列、Ｂは入力された
第２の文字列、Ｃは入力された第３の文字列を表し、ｘ
は、本発明に係る実施形態の類推語生成装置１００によ
って、第１の文字列Ａ、第２の文字列Ｂ及び第３の文字
列Ｃの関係から類推して生成される類推語を表す。

【０１３４】＜Ａ１＞接頭辞、接尾辞を挿入又は削除す
ることによって類推語を生成する場合。＜＜Ａ１．１＞＞ラテン語の単語を入力した場合：

【数１４】ｏｒａｔｏｒｅｍ：ｏｒａｔｏｒ＝ｈｏｎｏ
ｒｅｍ：ｘｘ＝ｈｏｎｏｒ＜＜Ａ１．２＞＞フランス語の単語を入力した場合：

【数１５】＜＜Ａ１．３＞＞マレー語の単語を入力した場合：

【数１６】ｔｉｎｇｇａｌ：ｋｅｔｉｎｇｇａｌａｎ＝
ｄｕｄｕｋ：ｘｘ＝ｋｅｄｕｄｕｋａｎ＜＜Ａ１．４＞＞中国語の単語を入力した場合：

【数１７】科学：科学家＝政治：ｘｘ＝政治家

【０１３５】＜Ａ２＞接頭辞、接尾辞を置換することに
よって類推語を生成する場合。＜＜Ａ２．１＞＞英語の単語を入力した場合：

【数１８】ｗｏｌｆ：ｗｏｌｖｅｓ＝ｌｅａｆ：ｘｘ＝ｌｅａｖｅｓ＜＜Ａ２．２＞＞マレー語の単語を入力した場合：

【数１９】ｋａｗａｎ：ｍｅｎｇａｗａｎｉ＝ｋｅｌｉ
ｌｉｎｇ：ｘｘ＝ｍｅｎｇｅｌｉｌｉｎｇｉ＜＜Ａ２．３＞＞マレー語の単語を入力した場合：

【数２０】ｋｅｒａｓ：ｍｅｎｇｅｒａｓｋａｎ＝ｋｅ
ｎａ：ｘｘ＝ｍｅｎｇｅｎａｋａｎ＜＜Ａ２．４＞＞ポーランド語の単語を入力した場合：

【数２１】

【０１３６】＜Ａ３＞接中辞、ウムラウトを挿入する場
合。＜＜Ａ３．１＞＞日本語の単語を入力した場合：

【数２２】乗る：乗せる＝寄る：ｘｘ＝寄せる＜＜Ａ３．２＞＞ドイツ語の単語を入力した場合：

【数２３】＜＜Ａ３．３＞＞ドイツ語の単語を入力した場合：

【数２４】ｆｌｉｅｈｅｎ：ｅｒｆｌｏｈ＝ｓｃｈｌ
ｉｅβｅｎ：ｘｘ＝ｅｒｓｃｈｌｏβ ＜＜Ａ３．４＞＞ポーランド語の単語を入力した場合：

【数２５】ｚｇｕｂｉｏｎｙ:ｚｇｕｂｉｅｎｉ=ｚｍａ
ｒｔｗｉｏｎｙ:ｘｘ＝ｚｍａｒｔｗｉｅｎｉ＜＜Ａ３．５＞＞アッカド語の単語を入力した場合：

【数２６】

【０１３７】＜Ａ４＞複数の接中辞を挿入することによ
って類推語を生成する場合。＜＜Ａ４．１＞＞原セム語の単語を入力した場合：

【数２７】ｙａｓｒｉｑｕ：ｓａｒｉｑ＝ｙａｎｑｉｍ
ｕ：ｘｘ＝ｎａｑｉｍ＜＜Ａ４．２＞＞アラビア語の単語を入力した場合：

【数２８】＜＜Ａ４．３＞＞アラビア語の単語を入力した場合：

【数２９】ａｒｓａｌａ：ｍｕｒｓｉｌｕｎ＝ａｓｌａ
ｍａ：ｘｘ＝ｍｕｓｌｉｍｕｎ

【０１３８】以上の幾つかの例から、本実施形態の類推
語生成処理が実際の多数の言語において類推語を生成可
能であることが分かる。

【０１３９】以上説明したように、本発明に係る実施形
態によれば、以下の特有の効果を有する。（１）３つの単位列を与えられた場合に、上記３つの単
位列から類推される４つ目の単位列を生成することがで
き、また、類推に関連した制約条件の検証が擬似距離行
列の各要素の計算を制限するために、生成に失敗すれば
早期終了が可能であり、従って、計算コストが減少され
て従来例に比較して高速に演算処理することができる。（２）また、従来例のように属性を付加する必要がない
ので、属性付与のための専門家は必要がない。それ故、
属性を記憶する記憶装置を備える必要がないので、装置
構成が小型化することができる。（３）さらに、第２の従来例で不可能であった、類推的
に類似する類似語同士の入れ替えを行うことができる。（４）さらには、本発明は、多くの異なった言語におい
て多くの異なった事例を扱えることが、実施例から実証
されており、実施形態で述べた反復処理にも容易に展開
することができる。

【０１４０】上述した実施形態について以下の補足説明
する。

【０１４１】＜補足１＞図６の擬似距離行列と、図７の
擬似距離行列との値が異なっていることについて補足説
明する。以下、文字列Ｗｏｒｄ［１，…，ｉ］は、文字
列Ｗｏｒｄの第１番目の最初の文字から文字列Ｗｏｒｄ
のｉ番目の文字までから構成される文字列を意味する。

【０１４２】図１及び図２を参照して、編集距離の計算
について説明する。文字列Ｗｏｒｄ１及びＷｏｒｄ２の
擬似距離計算のための擬似距離行列Ｍにおいては、各要
素Ｍ［ｉ１］［ｉ２］の値は、２つの文字列Ｗｏｒｄ
［１，…，ｉ１］及びＷｏｒｄ［１，…，ｉ２］間の編
集距離の距離値である。編集距離行列Ｍの各要素の値
は、従来技術文献５の記述において与えられている以下
の一般式に従って、先行する行及び列の直前の３つの要
素の値に基づいて計算される。

【０１４３】

【数３０】Ｍ［ｉ１］［ｉ２］＝ｍｉｎ（（１）Ｍ［ｉ１−１］［ｉ２−１］＋ｔｒｕｅ（Ｗｏｒｄ１［ｉ１］≠Ｗｏｒｄ２［ｉ２］），（２）Ｍ［ｉ１−１］［ｉ２］＋１，（３）Ｍ［ｉ１］［ｉ２−１］＋１）（４）

【０１４４】ここで、説明の便宜上、数３０の各行に
（１）乃至（４）の行数番号を付与する。また、関数ｍ
ｉｎ（・）は複数の引数のうちの最小値を与える関数で
あり、関数ｔｒｕｅ（・）は引数が真であるときに１と
なる一方、引数が偽であるときに０となる関数である。
数３０の（２）行目は、Ｗｏｒｄ１［１，…，ｉ１］及
びＷｏｒｄ２［１，…，ｉ２］間の距離と、先行する前
の文字までの両方の文字列間の距離、すなわち２つの文
字列Ｗｏｒｄ１［１，…，ｉ１−１］及びＷｏｒｄ２
［１，…，ｉ２−１］間の距離とが、ちょうど２つの付
加された文字Ｗｏｒｄ１［ｉ１］及びＷｏｒｄ２［ｉ
２］間の距離だけ相違していることを意味している。従
って、２つの付加された文字Ｗｏｒｄ１［ｉ１］及びＷ
ｏｒｄ２［ｉ２］が等しければ、Ｗｏｒｄ１［１，…，
ｉ１］及びＷｏｒｄ２［１，…，ｉ２］間の距離は、先
行する前の文字までの両方の文字列間の距離、すなわち
２つの文字列Ｗｏｒｄ１［１，…，ｉ１−１］及びＷｏ
ｒｄ２［１，…，ｉ２−１］間の距離に等しくなると思
われる。２つの付加された文字Ｗｏｒｄ１［ｉ１］及び
Ｗｏｒｄ２［ｉ２］が異なっていれば、Ｗｏｒｄ１
［１，…，ｉ１］及びＷｏｒｄ２［１，…，ｉ２］間の
距離は、先行する前の文字までの両方の文字列間の距
離、すなわち２つの文字列Ｗｏｒｄ１［１，…，ｉ１−
１］及びＷｏｒｄ２［１，…，ｉ２−１］間の距離に１
つの文字の差分を加算した値に等しくなる。

【０１４５】数３０の（３）行目は、２つの文字列Ｗｏ
ｒｄ１［１，…，ｉ１−１］及びＷｏｒｄ２［１，…，
ｉ２］間の距離が、２つの文字列Ｗｏｒｄ１［１，…，
ｉ１−１］及びＷｏｒｄ２［１，…，ｉ２−１］間の距
離から、文字Ｗｏｒｄ２［ｉ２］をＷｏｒｄ２［１，
…，ｉ２−１］の終わりに付加したときの差分である１
文字の差分だけ相違していることを意味している。

【０１４６】同様に、数３０の（４）行目は、２つの文
字列Ｗｏｒｄ１［１，…，ｉ１］及びＷｏｒｄ２［１，
…，ｉ２−１］間の距離が、２つの文字列Ｗｏｒｄ１
［１，…，ｉ１−１］及びＷｏｒｄ２［１，…，ｉ２−
１］間の距離から、文字Ｗｏｒｄ１［ｉ１］をＷｏｒｄ
１［１，…，ｉ１−１］の終わりに付加したときの差分
である１文字の差分だけ相違していることを意味してい
る。

【０１４７】距離を最小値として取り扱う直観的な概念
のために、Ｗｏｒｄ１［１，…，ｉ１］及びＷｏｒｄ２
［１，…，ｉ２］間の距離値を計算する３つの可能な方
法から、数３０の（１）行目は、Ｗｏｒｄ１［１，…，
ｉ１］及びＷｏｒｄ２［１，…，ｉ２］間の距離値、す
なわち要素Ｍ［ｉ１］［ｉ２］の値が、（２）行目、
（３）行目、（４）行目で与えられる３つの可能な計算
のうちの最小値であることを意味している。

【０１４８】次に、図４及び図５を参照して、擬似距離
の計算について説明する。２つの文字列Ｗｏｒｄ１及び
Ｗｏｒｄ２間の擬似距離の計算は、編集距離の計算と同
様に行い、以下のような同様な式を用いる。

【０１４９】

【数３１】Ｍ［ｉ１］［ｉ２］＝ｍｉｎ（（１）Ｍ［ｉ１−１］［ｉ２−１］＋ｔｒｕｅ（Ｗｏｒｄ１［ｉ１］≠Ｗｏｒｄ２［ｉ２］），（２）Ｍ［ｉ１−１］［ｉ２］＋１，（３）Ｍ［ｉ１］［ｉ２−１］）（４）

【０１５０】ここで、説明の便宜上、数３１の各行に
（１）乃至（４）の行数番号を付与する。数３０と数３
１の相違は、（４）行目における相違点のみである。こ
の相違は、文字列Ｗｏｒｄ１［１，…，ｉ１］及びＷｏ
ｒｄ２［１，…，ｉ２］間の擬似距離が、文字列Ｗｏｒ
ｄ１［１，…，ｉ１］及びＷｏｒｄ２［１，…，ｉ２−
１］間の擬似距離に等しいことを意味している。言い替
えれば、文字列Ｗｏｒｄ２［１，…，ｉ２］の終わりに
１文字が付加されたは擬似距離の値に影響しない。さら
に別の言い方をすれば、従来技術文献５の編集距離と、
本願発明の擬似距離との相違は、擬似距離において、第
２番目の文字列において文字の挿入を計数しないことに
ある。

【０１５１】＜補足２＞図６及び図７の擬似距離行列間
の相違点について説明する。図６及び図７では共に、要
素値は上記数３１を使用して計算されている。ここで、
図６と図７の違いは、図７では計算において対角バンド
内の要素しか考慮されないことにある。従って、図６は
２つの文字列間の擬似距離の計算を示し、図７は２つの
文字列間の制限された擬似距離の計算を示している。

【０１５２】対角バンド内の要素は、当該行列の各行に
対して計算された２つのパラメータｉｋｌｅｆｔ及びｉ
ｋｒｉｇｈｔの各行上に局所的に位置する。ｉｋｌｅｆ
ｔは、処理対象の現在の行におけるバンド内の最小の要
素番号（インデックス）の列の要素番号（インデック
ス）である。また、ｉｋｒｉｇｈｔは、処理対象の現在
の行におけるバンド内の最大の要素番号（インデック
ス）の列の要素番号（インデックス）である。

【０１５３】バンド外の要素の値、すなわちその列指数
がｉｋｌｅｆｔ及びｉｋｒｉｇｈｔの外にあるような要
素の値は、可能な最大値に等しい値に初期化することが
できるので、一般式を使用して、すなわち最小値を採用
して要素の値を計算する際には、バンド外の要素の値は
計算結果に何の影響も与えない。バンド外の要素の最高
可能値への初期化は、前もって実行しておくことができ
る。これは、図１１のステップＳ９５において実行され
る。

【０１５４】数３１によって各要素値が最小値として計
算されるという事実に従えば、バンド内の要素の値のみ
を考慮して計算する場合には使用される情報がより少な
く、その結果、最後の要素（図６の”ｌｉｋｅ”と”ｋ
ｎｏｗｎ”の間の擬似距離を計算する場合の一番下の最
も右側の要素、図６の”ｌｉｋｅ”と”ｕｎｌｉｋｅ”
の間の擬似距離を計算する場合の一番下の最も左側の要
素）の値は、すべての要素を考慮して計算する場合の行
列の最後の要素（図７の”ｌｉｋｅ”と”ｋｎｏｗｎ”
の間の擬似距離を計算する場合の一番下の最も右側の要
素、図７の”ｌｉｋｅ”と”ｕｎｌｉｋｅ”の間の擬似
距離を計算する場合の一番下の最も左側の要素）の値よ
り大きい。これは、図７における場合であって、バンド
内の要素のみを考慮して取得した一番下の最右要素の値
４は、行列のすべての要素の値を考慮して取得した図６
の一番下の最右要素の値３より大きい。

【０１５５】＜補足３＞図８を参照して最短経路の計算
方法について説明する。長さｌ１の文字列Ｗｏｒｄ１及
び長さｌ２の文字列Ｗｏｒｄ２である２つの文字列間の
擬似距離行列Ｍにおいては、最後の要素は要素Ｍ［ｌ
１］［ｌ２］である。図８を参照すると、文字列”ｌｉ
ｋｅ”及び”ｕｎｌｉｋｅ”間の制限された擬似距離の
行列における最後の要素は、この行列における一番下の
最左要素である。同じく、図８を参照すると、文字列”
ｌｉｋｅ”及び”ｋｎｏｗｎ”間の制限された擬似距離
の行列における最後の要素は、当該行列における一番下
の最右要素である。

【０１５６】２つの文字列Ｗｏｒｄ１及びＷｏｒｄ２間
の擬似距離行列Ｍにおいては、第１番目の最初の要素は
要素Ｍ［１］［１］である。図８を参照すると、文字
列”ｌｉｋｅ”及び”ｕｎｌｉｋｅ”間の制限された擬
似距離の行列における第１番目の最初の要素は、当該行
列における一番上の最右要素である。同じく、図８を参
照すると、文字列”ｌｉｋｅ”及び”ｋｎｏｗｎ”間の
制限された擬似距離の行列における第１番目の最初の要
素は、当該行列における一番上の最左要素である。

【０１５７】擬似距離又は制限された擬似距離の行列に
おける最短経路の計算は、当該行列の最後の要素から第
１番目の最初の要素まで実行される。最短経路上の処理
対象の現在の要素の場合、最短経路上の先行する前の要
素は、３つの先行する前の要素のうちの１つである可能
性がある。すなわち、対角線上の先行する前の要素、同
一行上の先行する前の要素、又は同一列上の先行する前
の要素のいずれかである。どの要素が選択されるかは、
ステップＳ１１０、Ｓ１１２及びＳ１１４で説明されて
いるように、処理対象の現在の要素の値を先行する前の
要素の値と比較することによって決定される。ステップ
Ｓ１１０、Ｓ１１２及びＳ１１４におけるこうした比較
はそれぞれ、上記数３０において（２）、（３）及び
（４）行目の何れを使用して処理対象の現在の要素の値
を計算したかを決定する。

【０１５８】ステップＳ１１０、Ｓ１１２及びＳ１１４
は、対角方向の要素、水平方向の要素、次いで垂直方向
の要素の順に先行する前の要素をテストするが、これ
は、対角方向の進行が常に水平方向の進行より優先さ
れ、また水平方向の進行が常に垂直方向の進行より優先
されることを意味している。

【０１５９】＜補足４＞最短経路の一般的意味について
説明する。制限された擬似距離行列における最短経路
は、行列の最小値に沿って両方の文字列の終わりから両
方の文字列の開始点に至る最短行程を表している。一つ
の直感的比較として、行列が立体模型の地図を表し、各
要素の値が高さを表すと仮定すれば、最短経路は、最も
高い位置（両方の文字列の終わりにおける行列の最後の
要素）から最も低い位置（両方の文字列の開始点）に流
れる立体模型地図上の川の経路である。

【０１６０】＜補足５＞処理フローにおいて最短経路を
計算するステップについて以下に説明する。行列Ｍ１２
及びＭ１３の両方における処理対象の現在の要素から先
行する前の要素までの最短経路の方向は、ステップＳ６
４及びＳ６５において、図７の方向決定処理（ＤｉｒＤ
ｅｃ）を呼び出して実行することにより、ステップ毎に
計算される。行列Ｍ１２及びＭ１３の両方における先行
する前の要素の行番号及び列番号は、ステップＳ６７及
びＳ６８ではそれぞれ、図１８の同一の方向処理（Ｓａ
ｍｅＤｉｒ）と、図１９の異なった方向処理（Ｄｉｆｆ
Ｄｉｒ）を呼び出して実行することにより計算される。
処理対象の現在の要素から先行する前の要素への方向
は、ステップＳ１１０乃至Ｓ１１５（Ｓ１１０、Ｓ１１
１、Ｓ１１２、Ｓ１１３、Ｓ１１４、Ｓ１１５）におい
て計算される。最短経路上の先行する前の要素の要素番
号（インデックス）の実際の計算は、ステップＳ７８、
Ｓ８１、Ｓ８２、Ｓ８３、又はステップＳ１０２、Ｓ１
０４、Ｓ１０６、Ｓ１０８において実行される。

【０１６１】＜補足６＞状態パラメータｃｏｍの更新に
ついて説明する。状態パラメータｃｏｍは、上述のよう
に４つの文字列に共通な文字数を表している。また、擬
似距離行列における最短パスに沿って４つの類推語が生
成される。図１８の同一方向処理のステップＳ７３で
は、入力された３つの文字列の現在の文字が同一である
か否かが判断され、ＹＥＳのときにステップＳ７４にお
いて状態パラメータｃｏｍを１だけデクリメントする一
方、ＮＯのときに状態パラメータｃｏｍを更新せずに次
のステップＳ７５の処理を実行している。

【０１６２】

【発明の効果】以上詳述したように本発明に係る類推語
生成装置又は方法によれば、所定の順序で入力される３
つの第１、第２及び第３の単位列に基づいて、所定の類
推関係で類推的に類似する属性を有する第４の単位列で
ある類推語を生成する類推語生成装置又は方法（１０
０）であって、１つの単位列ともう１つの単位列の間で
削除又は置き換えを行う単位の数を擬似距離で表し、上
記入力された３つの単位列を解析することにより、上記
入力された第１の単位列の最初の単位から最後の単位ま
での各部分列と上記入力された第２の単位列の最初の単
位から最後の単位までの各部分列との間の擬似距離を表
す第１の擬似距離行列の一部の要素の位置において、上
記入力された第１の単位列の単位数（Ｌｅｎ１）が、上
記第１の単位列と上記第２の単位列との間の擬似距離を
表す、第１の擬似距離行列の最終行最終列の要素の値
（ｐ２）と、上記第１の単位列と上記第３の単位列との
間の擬似距離を表す、第２の擬似距離行列の最終行最終
列の要素の値（ｐ３）との加算値よりも大きくなるよう
に、上記第１の擬似距離行列における所定幅の対角要素
からなる対角バンドと、上記対角バンドの外側に位置す
る所定幅の要素からなるエキストラバンドとを含む制限
された第１の擬似距離行列の複数の要素を計算し、上記
入力された第１の単位列の最初の単位から最後の単位ま
での各部分列と上記入力された第３の単位列の最初の単
位から最後の単位までの各部分列との間の擬似距離を表
す第２の擬似距離行列の一部の要素の位置において、上
記入力された第１の単位列の単位数（Ｌｅｎ１）が、上
記第１の単位列と上記第２の単位列との間の擬似距離を
表す、第１の擬似距離行列の最終行最終列の要素の値
（ｐ２）と、上記第１の単位列と上記第３の単位列との
間の擬似距離を表す、第２の擬似距離行列の最終行最終
列の要素の値（ｐ３）との加算値よりも大きくなるよう
に、上記第２の擬似距離行列における所定幅の対角要素
からなる対角バンドと、上記対角バンドの外側に位置す
る所定幅の要素からなるエキストラバンドとを含む制限
された第２の擬似距離行列の複数の要素を計算し、上記
計算した制限された第１と第２の擬似距離行列の複数の
要素を行列記憶手段（１０）に記憶し（２，Ｓ２）、上
記入力された３つの単位列の長さ及び上記行列記憶手段
（１０）に記憶された制限された第１と第２の擬似距離
行列の各要素とに基づいて、上記入力された３つの第１
乃至第３の単位列と生成される第４の単位列とからなる
４つの単位列が上記類推関係にあることを判断するため
のパラメータであって上記第４の単位列が生成されたと
きに上記４つの単位列に共通する単位の数を表す状態パ
ラメータ（ｃｏｍ）の初期値を計算してパラメータ記憶
手段（５１）に記憶し、上記パラメータ記憶手段（５
１）に記憶された状態パラメータ（ｃｏｍ）と上記行列
記憶手段（１０）に記憶された制限された第１と第２の
擬似距離行列の各要素とに基づいて、上記パラメータ記
憶手段（５１）に記憶された状態パラメータ（ｃｏｍ）
を更新しながら（Ｓ７４）、上記制限された第１の擬似
距離行列における最終行最終列の要素から第１行第１列
の要素までの最短経路と、上記制限された第２の擬似距
離行列における最終行最終列の要素から第１行第１列の
要素までの最短経路とを、上記制限された第１と第２の
擬似距離行列のそれぞれにおけるある要素から別の要素
に対角方向、水平方向、又は垂直方向である移動方向で
移動させながら決定（Ｓ６３−Ｓ６８）し、上記決定さ
れた制限された第１と第２の擬似距離行列の各最短経路
に従って上記移動方向に応じて第２又は第３の単位列の
単位を収集することにより類推語を生成して出力する
（５，Ｓ３）。

【０１６３】従って、本発明によれば、以下の特有の効
果を有する。（１）３つの単位列を与えられた場合に、上記３つの単
位列から類推される４つ目の単位列を生成することがで
き、また、類推に関連した制約条件の検証が擬似距離行
列の各要素の計算を制限するために、生成に失敗すれば
早期終了が可能であり、従って、計算コストが減少され
て従来例に比較して高速に演算処理することができる。（２）また、従来例のように属性を付加する必要がない
ので、属性付与のための専門家は必要がない。それ故、
属性を記憶する記憶装置を備える必要がないので、装置
構成が小型化することができる。（３）さらに、第２の従来例で不可能であった、類推的
に類似する類似語同士の置き換えを行うことができる。（４）さらには、本発明は、多くの異なった言語におい
て多くの異なった事例を扱えることが、実施例から実証
されており、実施形態で述べた反復処理にも容易に展開
することができる。

【図面の簡単な説明】

【図１】本発明の好ましい実施形態による類推語生成
装置１００のブロック図である。

【図２】第５の従来例において、入力された第１の文
字列”ｌｉｋｅ”及び入力された第２の文字列”ｕｎｌ
ｉｋｅ”間の編集距離を表す編集距離行列を示す表であ
る。

【図３】第５の従来例において、入力された第１の文
字列”ｌｉｋｅ”及び入力された第３の文字列”ｋｎｏ
ｗｎ”間の編集距離を表す編集距離行列を示す表であ
る。

【図４】本発明に係る実施形態において、入力された
第１の文字列Ａを”ｕｎｌｉｋｅ”とし、第２の文字列
Ｂを”ｌｉｋｅ”としたときの両方の文字列間の擬似距
離を表す擬似距離行列を示す表である。

【図５】本発明に係る実施形態において、入力された
第１の文字列Ａを”ｌｉｋｅ”とし、第２の文字列Ｂ
を”ｕｎｌｉｋｅ”として、それらの間の擬似距離を表
す擬似距離行列を示す表である。

【図６】本発明に係る実施形態において、入力された
第１の文字列”ｌｉｋｅ”を縦軸として、入力された第
２の文字列”ｕｎｌｉｋｅ”と、入力された第３の文字
列”ｋｎｏｗｎ”とのそれぞれの間の擬似距離を表す擬
似距離行列を示す表である。

【図７】図６の擬似距離行列において、対角バンドの
範囲内だけの行列要素を計算した擬似距離行列を示す表
である。

【図８】図７の擬似距離行列において、最短パスに沿
った主要素を円で囲んだ擬似距離行列を示す表である。

【図９】図１の類推語生成装置１００の中央演算処理
装置１によって実行される類推語生成処理（メインルー
チン）を示すフローチャートである。

【図１０】図９の類推語生成処理（メインルーチン）
のサブルーチンであるステップＳ２の前処理を示すフロ
ーチャートである。

【図１１】図１０の前処理のサブルーチンであるステ
ップＳ１１及びＳ１２の行列初期化処理を示すフローチ
ャートである。

【図１２】図１０の前処理のサブルーチンであるステ
ップＳ１３の十分な擬似行列の計算処理を示すフローチ
ャートである。

【図１３】図１２の十分な擬似行列の計算処理のサブ
ルーチンであるステップＳ２１の制限された擬似距離行
列計算処理の第１の部分を示すフローチャートである。

【図１４】図１２の十分な擬似行列の計算処理のサブ
ルーチンであるステップＳ２１の制限された擬似距離行
列計算処理の第２の部分を示すフローチャートである。

【図１５】図９の類推語生成処理（メインルーチン）
のサブルーチンであるステップＳ３の類推語生成処理を
示すフローチャートである。

【図１６】図１５の類推語生成処理のサブルーチンで
あるステップＳ５２の類推語生成サブルーチン処理を示
すフローチャートである。

【図１７】図１６の類推語生成サブルーチン処理のサ
ブルーチンであるステップＳ６４の方向決定処理を示す
フローチャートである。

【図１８】図１６の類推語生成サブルーチン処理のサ
ブルーチンであるステップＳ６７の同一方向処理を示す
フローチャートである。

【図１９】図１６の類推語生成サブルーチン処理のサ
ブルーチンであるステップＳ６８の異なった方向処理を
示すフローチャートである。

【図２０】図１の類推語生成装置１００を備えた音声
自動翻訳システムを示すブロック図である。

【図２１】本実施形態の擬似距離行列における対角バ
ンドの第１の例を示す図である。

【図２２】本実施形態の擬似距離行列における対角バ
ンドの第２の例を示す図である。

【図２３】本実施形態の擬似距離行列における対角バ
ンドの第３の例を示す図である。

【図２４】本実施形態の擬似距離行列におけるエキス
トラバンドの第１の例を示す図である。

【図２５】本実施形態の擬似距離行列におけるエキス
トラバンドの第２の例を示す図である。

【符号の説明】

１…中央演算処理装置（ＣＰＵ）、２…前処理部、４…類推語メモリ、５…類推語生成部、１０…擬似距離行列メモリ、１１…マイクロホン、１２…Ａ／Ｄ変換器、１３…音声認識装置、１４…パターン追加部、１５…自動翻訳装置、２１…キーボード、２２…プリンタ、２３…ＣＲＴディスプレイ、３１…ＨＭＭメモリ、３２…言語モデルメモリ、３３…類似語パターンメモリ、３４…翻訳パターンメモリ、５１…内部パラメータメモリ、５２…プリンタインターフェース、５３…ディスプレイインターフェース、５４…キーボードインターフェース、１００…類推語生成装置。

Claims

(57)【特許請求の範囲】

【請求項１】所定の順序で入力される３つの第１、第
２及び第３の単位列に基づいて、所定の類推関係で類推
的に類似する属性を有する第４の単位列である類推語を
生成する類推語生成装置（１００）であって、行列記憶手段（１０）を備え、１つの単位列ともう１つの単位列の間で削除又は置き換
えを行う単位の数を擬似距離で表し、上記入力された３つの単位列を解析することにより、上記入力された第１の単位列の最初の単位から最後の単
位までの各部分列と上記入力された第２の単位列の最初
の単位から最後の単位までの各部分列との間の擬似距離
を表す第１の擬似距離行列の一部の要素の位置におい
て、上記入力された第１の単位列の単位数（Ｌｅｎ１）
が、上記第１の単位列と上記第２の単位列との間の擬似
距離を表す、第１の擬似距離行列の最終行最終列の要素
の値（ｐ２）と、上記第１の単位列と上記第３の単位列
との間の擬似距離を表す、第２の擬似距離行列の最終行
最終列の要素の値（ｐ３）との加算値よりも大きくなる
ように、上記第１の擬似距離行列における所定幅の対角
要素からなる対角バンドと、上記対角バンドの外側に位
置する所定幅の要素からなるエキストラバンドとを含む
制限された第１の擬似距離行列の複数の要素を計算し、上記入力された第１の単位列の最初の単位から最後の単
位までの各部分列と上記入力された第３の単位列の最初
の単位から最後の単位までの各部分列との間の擬似距離
を表す第２の擬似距離行列の一部の要素の位置におい
て、上記入力された第１の単位列の単位数（Ｌｅｎ１）
が、上記第１の単位列と上記第２の単位列との間の擬似
距離を表す、第１の擬似距離行列の最終行最終列の要素
の値（ｐ２）と、上記第１の単位列と上記第３の単位列
との間の擬似距離を表す、第２の擬似距離行列の最終行
最終列の要素の値（ｐ３）との加算値よりも大きくなる
ように、上記第２の擬似距離行列における所定幅の対角
要素からなる対角バンドと、上記対角バンドの外側に位
置する所定幅の要素からなるエキストラバンドとを含む
制限された第２の擬似距離行列の複数の要素を計算して
上記計算した制限された第１又は第２の擬似距離行列の
複数の要素を上記行列記憶手段（１０）に記憶させる前
処理手段（２，Ｓ２）と、上記入力された３つの第１乃至第３の単位列と、生成さ
れる第４の単位列とからなる４つの単位列が上記類推関
係にあることを判断するためのパラメータであって、上
記第４の単位列が生成されたときに上記４つの単位列に
共通する単位の数を表す状態パラメータ（ｃｏｍ）を記
憶するパラメータ記憶手段（５１）と、上記入力された３つの単位列の長さ及び上記行列記憶手
段（１０）に記憶された制限された第１と第２の擬似距
離行列の各要素とに基づいて、上記状態パラメータ（ｃ
ｏｍ）の初期値を計算して上記パラメータ記憶手段（５
１）に記憶した後（Ｓ６１）、上記パラメータ記憶手段
（５１）に記憶された状態パラメータ（ｃｏｍ）と上記
行列記憶手段（１０）に記憶された制限された第１と第
２の擬似距離行列の各要素とに基づいて、上記パラメー
タ記憶手段（５１）に記憶された状態パラメータ（ｃｏ
ｍ）を更新しながら（Ｓ７４）、上記制限された第１の
擬似距離行列における最終行最終列の要素から第１行第
１列の要素までの最短経路と、上記制限された第２の擬
似距離行列における最終行最終列の要素から第１行第１
列の要素までの最短経路とを、上記制限された第１と第
２の擬似距離行列のそれぞれにおけるある要素から別の
要素に対角方向、水平方向、又は垂直方向である移動方
向で移動させながら決定し（Ｓ６３−Ｓ６８）、上記決
定された制限された第１と第２の擬似距離行列の各最短
経路に従って上記移動方向に応じて第２又は第３の単位
列の単位を収集することにより類推語を生成して出力す
る類推語生成手段（５，Ｓ３）とを備えたことを特徴と
する類推語生成装置。
【請求項２】上記単位列は文字列であり、上記単位列
を構成する単位は文字であることを特徴とする請求項１
記載の類推語生成装置。
【請求項３】上記単位列は単語列であり、上記単位列
を構成する単位は単語であることを特徴とする請求項１
記載の類推語生成装置。
【請求項４】所定の順序で入力される３つの第１、第
２及び第３の単位列に基づいて、所定の類推関係で類推
的に類似する属性を有する第４の単位列である類推語を
制御装置により生成する類推語生成方法（１００）であ
って、１つの単位列ともう１つの単位列の間で削除又は置き換
えを行う単位の数を擬似距離で表し、上記制御装置を用いて、上記入力された３つの単位列を
解析することにより、上記入力された第１の単位列の最初の単位から最後の単
位までの各部分列と上記入力された第２の単位列の最初
の単位から最後の単位までの各部分列との間の擬似距離
を表す第１の擬似距離行列の一部の要素の位置におい
て、上記入力された第１の単位列の単位数（Ｌｅｎ１）
が、上記第１の単位列と上記第２の単位列との間の擬似
距離を表す、第１の擬似距離行列の最終行最終列の要素
の値（ｐ２）と、上記第１の単位列と上記第３の単位列
との間の擬似距離を表す、第２の擬似距離行列の最終行
最終列の要素の値（ｐ３）との加算値よりも大きくなる
ように、上記第１の擬似距離行列における所定幅の対角
要素からなる対角バンドと、上記対角バンドの外側に位
置する所定幅の要素からなるエキストラバンドとを含む
制限された第１の擬似距離行列の複数の要素を計算し、上記入力された第１の単位列の最初の単位から最後の単
位までの各部分列と上記入力された第３の単位列の最初
の単位から最後の単位までの各部分列との間の擬似距離
を表す第２の擬似距離行列の一部の要素の位置におい
て、上記入力された第１の単位列の単位数（Ｌｅｎ１）
が、上記第１の単位列と上記第２の単位列との間の擬似
距離を表す、第１の擬似距離行列の最終行最終列の要素
の値（ｐ２）と、上記第１の単位列と上記第３の単位列
との間の擬似距離を表す、第２の擬似距離行列の最終行
最終列の要素の値（ｐ３）との加算値よりも大きくなる
ように、上記第２の擬似距離行列における所定幅の対角
要素からなる対角バンドと、上記対角バンドの外側に位
置する所定幅の要素からなるエキストラバンドとを含む
制限された第２の擬似距離行列の複数の要素を計算し、上記計算した制限された第１と第２の擬似距離行列の複
数の要素を行列記憶手段（１０）に記憶するステップ
（２，Ｓ２）と、上記制御装置を用いて、上記入力された３つの単位列の
長さ及び上記行列記憶手段（１０）に記憶された制限さ
れた第１と第２の擬似距離行列の各要素とに基づいて、
上記入力された３つの第１乃至第３の単位列と生成され
る第４の単位列とからなる４つの単位列が上記類推関係
にあることを判断するためのパラメータであって上記第
４の単位列が生成されたときに上記４つの単位列に共通
する単位の数を表す状態パラメータ（ｃｏｍ）の初期値
を計算してパラメータ記憶手段（５１）に記憶するステ
ップと、上記制御装置を用いて、上記パラメータ記憶手段（５
１）に記憶された状態パラメータ（ｃｏｍ）と上記行列
記憶手段（１０）に記憶された制限された第１と第２の
擬似距離行列の各要素とに基づいて、上記パラメータ記
憶手段（５１）に記憶された状態パラメータ（ｃｏｍ）
を更新しながら（Ｓ７４）、上記制限された第１の擬似
距離行列における最終行最終列の要素から第１行第１列
の要素までの最短経路と、上記制限された第２の擬似距
離行列における最終行最終列の要素から第１行第１列の
要素までの最短経路とを、上記制限された第１と第２の
擬似距離行列のそれぞれにおけるある要素から別の要素
に対角方向、水平方向、又は垂直方向である移動方向で
移動させながら決定（Ｓ６３−Ｓ６８）するステップ
と、上記制御装置を用いて、上記決定された制限された第１
と第２の擬似距離行列の各最短経路に従って上記移動方
向に応じて第２又は第３の単位列の単位を収集すること
により類推語を生成して出力するステップ（５，Ｓ３）
とを含むことを特徴とする類推語生成方法。
【請求項５】上記単位列は文字列であり、上記単位列
を構成する単位は文字であることを特徴とする請求項４
記載の類推語生成方法。
【請求項６】上記単位列は単語列であり、上記単位列
を構成する単位は単語であることを特徴とする請求項４
記載の類推語生成方法。