JP2001013863A - 最適テンプレートパターン探索方法,探索装置および記録媒体 - Google Patents

最適テンプレートパターン探索方法,探索装置および記録媒体

Info

Publication number
JP2001013863A
JP2001013863A JP11182480A JP18248099A JP2001013863A JP 2001013863 A JP2001013863 A JP 2001013863A JP 11182480 A JP11182480 A JP 11182480A JP 18248099 A JP18248099 A JP 18248099A JP 2001013863 A JP2001013863 A JP 2001013863A
Authority
JP
Japan
Prior art keywords
template
template pattern
item
value
input sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11182480A
Other languages
English (en)
Other versions
JP3669870B2 (ja
Inventor
Naoyuki Tokuda
尚之 徳田
Hiroyuki Sasai
紘幸 笹井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SAN FUREA KK
Original Assignee
SAN FUREA KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SAN FUREA KK filed Critical SAN FUREA KK
Priority to JP18248099A priority Critical patent/JP3669870B2/ja
Priority to US09/597,270 priority patent/US6804637B1/en
Publication of JP2001013863A publication Critical patent/JP2001013863A/ja
Application granted granted Critical
Publication of JP3669870B2 publication Critical patent/JP3669870B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 どのような入力文に対しても、適確なテンプ
レートパターンを得ることができるようにする。 【解決手段】 模範解答用のテンプレート群を用意す
る。このテンプレート群を、任意数の文章要素を同列で
包含する複数のテンプレートブロックを、文法規則に基
づき上位のものから順次配列して構成する。テンプレー
ト群中のすべての単語に、その重要度に応じたポイント
数のポイントを付けておく。そしてこれらを読込む(S
1,S2)。その後入力文を読込むとともに、その解析
を行なう(S3,S4)。次いで、テンプレートパター
ン候補を検索し(S5)、入力文との一致単語の検索,
一致単語ポイント数の演算,および合計ポイント数の演
算を行なう(S6〜S8)。その後、一致単語ポイント
数を分子,合計ポイント数を分母とする最適度比較値を
求め(S9)、分子が最大となる最適度比較値のうち
で、最適度比較値が最も大きいテンプレートパターン候
補を、最適テンプレートパターンとして選択する。そし
て、これを用いて入力文を添削する(S10〜S1
2)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば翻訳文を添
削したり評価する際に使用される最適テンプレートパタ
ーン探索方法,探索装置および記録媒体に係り、特にど
のような入力文に対しても、これに最も適した最適テン
プレートパターンを得ることができる最適テンプレート
パターン探索方法,探索装置および記録媒体に関する。
【0002】
【従来の技術】一般に、技術翻訳者養成講座において
は、受講生が例題に対する解答文を本部に送付し、本部
では送付されてきた解答文を添削して受講生に送り返
し、受講生はその添削内容を見て自己のレベルを確認す
る方法が採られている。
【0003】ところで従来、解答文の添削は、多数送ら
れてくる解答文を複数の添削者に振分け、各添削者が人
力により行う方法が採られているが、人力による添削に
は多大な時間を要するとともに、一定レベル以上の実力
を有する添削者を確保することが必ずしも容易でなく、
添削者によって添削内容にバラツキが生じるという問題
がある。
【0004】そこで本発明者等は先に、特開平9−32
5673号公報に示すように、専門家が人力で行なうの
と同程度の結果が得られる翻訳文添削支援装置を提案し
た。
【0005】
【発明が解決しようとする課題】本発明者等が先に提案
した翻訳文添削支援装置は、模範解答に対応するテンプ
レートパターンを複数種類用意しておき、解答文がどの
テンプレートパターンと一致するかを判断した後、解答
文を当該テンプレートパターンと同様のテンプレートパ
ターンに分解し、各テンプレート毎に解答文と模範解答
との異同を判断して添削結果を得るものであり、技術翻
訳者養成講座のように、解答文の翻訳レベルにバラツキ
が少ない場合には、極めて精度の高い添削結果を得るこ
とができる。
【0006】ところが、例えば一般の語学学校のよう
に、解答文の翻訳レベルのバラツキが極めて大きい場合
には、そのすべてのケースを想定して、模範解答に対応
するテンプレートパターンを多数用意しておくことは不
可能である。このため、解答文が予め用意された模範解
答のテンプレートパターンと一致しない場合が多発する
ことになり、最悪の場合には、解答文に対応する模範解
答のテンプレートパターンを提示できないことがある。
【0007】このような問題は、翻訳の場合に限らず、
例えばインターネットを利用した情報検索システムにお
いて、入力文に基づき所定の情報を検索する等の場合に
も同様に生じる。
【0008】ところで、前述のような問題は、入力文
(解答文)に対する模範解答用のテンプレートパターン
を予め用意しておき、その中で入力文に適したテンプレ
ートパターンを探す方法を採っていたことに起因するも
のである。したがって、入力文に対して、その都度これ
に適した模範解答用のテンプレートパターンを作成する
ようにすれば、どのような入力文に対しても、これに最
も適した模範解答用のテンプレートパターンを得ること
ができるものと予想される。
【0009】本発明は、かかる知見に基づきなされたも
ので、どのような入力文に対しても、入力者が意図した
入力文のテンプレートパターンと同一のテンプレートパ
ターンを、模範解答用の最適テンプレートパターンとし
て得ることができる最適テンプレートパターン探索方
法,探索装置および記録媒体を提供することを目的とす
る。
【0010】
【課題を解決するための手段】前記目的を達成するため
本発明は、任意数の文章要素を同列で包含する複数のテ
ンプレートブロックを文法規則に基づき上位のものから
順次配列して構成される模範解答用のテンプレート群を
予め用意し、このテンプレート群から作成可能なすべて
のテンプレートパターン候補の中から、入力文に最も適
したテンプレートパターン候補を探索する最適テンプレ
ートパターン探索方法であって、前記テンプレート群中
のすべての単語に、その重要度に応じたポイント数のポ
イントを付与した後、前記すべてのテンプレートパター
ン候補について、各テンプレートパターン候補で用いら
れているすべての単語の合計ポイント数を分母,入力文
と各テンプレートパターン候補との間での一致単語の合
計ポイント数を分子とする最適度比較値を求め、分子が
最大となる最適度比較値のうちで、最適度比較値が最も
大きくなるテンプレートパターン候補を、最適テンプレ
ートパターンと判定するようにしたことを特徴とする。
【0011】すなわち、本発明においては、任意数の文
章要素を同列で包含する複数のテンプレートブロックを
文法規則に基づき上位のものから順次配列して構成され
る模範解答用のテンプレート群が予め用意されている。
そして、このテンプレート群からは、上位のテンプレー
トブロック内の任意の文章要素と、その下位のテンプレ
ートブロック内の任意の文章要素とを順次連結していく
ことにより、入力文に対応する多数のテンプレートパタ
ーン候補を作成することが可能である。一方、前記テン
プレート群中のすべての単語には、その重要度に応じた
ポイント数のポイントが付与される。したがって、前記
すべてのテンプレートパターン候補について、各テンプ
レートパターン候補で用いられているすべての単語の合
計ポイント数を分母,入力文と各テンプレートパターン
候補との間での一致単語の合計ポイント数を分子とする
最適度比較値を求め、分子が最大となる最適度比較値の
うちで、最適度比較値が最も大きくなるテンプレートパ
ターン候補を、最適テンプレートパターンと判定するこ
とにより、どのような入力文であっても、入力者が意図
した入力文のテンプレートパターンと同一のテンプレー
トパターンを、模範解答用の最適テンプレートパターン
として得ることが可能となる。
【0012】本発明はまた、任意数の文章要素を同列で
包含する複数のテンプレートブロックを文法規則に基づ
き上位のものから順次配列して構成される模範解答用の
テンプレート群を記憶するテンプレート群記憶手段と;
入力文を記憶する入力文記憶手段と;前記テンプレート
群の各テンプレートブロックと入力文とを比較し、テン
プレート群から作成可能なすべてのテンプレートパター
ン候補を探索するテンプレートパターン候補検索手段
と;検索されたテンプレートパターン候補を記憶するテ
ンプレートパターン候補記憶手段と;テンプレート群中
のすべての単語にその重要度に応じたポイント数で付与
されるポイントを、単語と関連付けて記憶する単語ポイ
ント数記憶手段と;各テンプレートパターン候補におい
て入力文と一致する単語を検索する一致単語検索手段
と;各テンプレートパターン候補で用いられているすべ
ての単語の合計ポイント数を演算する合計ポイント数演
算手段と;入力文と各テンプレートパターン候補との間
での一致単語の合計ポイント数を演算する一致単語ポイ
ント数演算手段と;各テンプレートパターン候補におけ
る全単語の合計ポイント数を分母,各テンプレートパタ
ーン候補における入力文との一致単語の合計ポイント数
を分子とする最適度比較値を演算する最適度比較値演算
手段と;各テンプレートパターン候補の最適度比較値を
比較し、分子が最大となる最適度比較値のうちで、最も
大きな最適度比較値を有するテンプレートパターン候補
を、最適テンプレートパターンと判定する最適テンプレ
ートパターン判定手段と;を設けるようにしたことを特
徴とする。そして、テンプレートパターン候補検索手段
において、テンプレート群の各テンプレートブロックと
入力文とを比較し、テンプレート群から作成可能なすべ
てのテンプレートパターン候補を探索するようにしてい
るので、どのような入力文であっても、これに対応する
テンプレートパターン候補を得ることが可能となる。ま
た、複数のテンプレートパターン候補の中から最適テン
プレートパターンを得る際には、各単語のポイント数が
考慮されるので、入力文中にポイント数の高い重要単語
が含まれている場合には、重要単語をより多く含むテン
プレートパターン候補が最適テンプレートパターンとし
て選択されることになり、入力者が意図した入力文のテ
ンプレートパターンと同一のテンプレートパターンを、
最適テンプレートパターンと判定することが可能とな
る。
【0013】本発明はさらに、任意数の文章要素を同列
で包含する複数のテンプレートブロックを文法規則に基
づき上位のものから順次配列して構成される模範解答用
のテンプレ群を、メモリ領域に記憶させる処理;入力文
をメモリ領域に記憶させる処理;前記テンプレート群中
のすべての単語に対し、その重要度に応じたポイント数
で付与されたポイントを、単語と関連付けてメモリ領域
に記憶させる処理;前記テンプレート群から作成可能な
すべてのテンプレートパターン候補について、各テンプ
レートパターン候補で用いられているすべての単語の合
計ポイント数を分母,入力文と各テンプレートパターン
候補との間での一致単語の合計ポイント数を分子とする
最適度比較値を用い、分子が最大となる最適度比較値の
うちで、最適度比較値が最も大きくなるテンプレートパ
ターン候補を、最適テンプレートパターンと判定する処
理;をコンピュータに実行させるようにしたことを特徴
とする。そして前記各処理により、予め模範解答用のテ
ンプレートパターンを容易しておかなくても、入力者が
意図した入力文のテンプレートパターンと同一のテンプ
レートパターンを、模範解答用の最適テンプレートパタ
ーンとして得ることが可能となる。
【0014】
【発明の実施の形態】以下、本発明を図面を参照して説
明する。図1は、本発明の実施の一形態に係る最適テン
プレートパターン探索装置を示すもので、この装置は、
図2に示す模範解答用のテンプレート群を記憶するテン
プレート群記憶手段1、入力文を記憶する入力文記憶手
段2およびテンプレートパターン候補検索作手段3を備
えており、テンプレートパターン候補検索手段3は、後
に詳述するテンプレート群の各テンプレートブロックと
入力文とを比較し、テンプレート群から作成可能なすべ
てのテンプレートパターン候補を探索するようになって
いる。そして、探索された各テンプレートパターン候補
は、テンプレートパターン候補記憶手段4に記憶される
ようになっている。
【0015】前記テンプレート群は、図2に示すよう
に、単語・句からなる文章要素を任意数同列で包含する
複数のテンプレートブロックを備えており、これら各テ
ンプレートブロックは、文法規則に基づき上位のものか
ら順次配列されている。そして、このテンプレート群か
らは、上位のテンプレートブロック内の任意の文章要素
と、その下位のテンプレートブロック内の任意の文章要
素とを順次連結していくことにより、入力文に対応する
多数のテンプレートパターン候補を作成することができ
るようになっている。
【0016】例えば、図2に示すテンプレート群の場合
には、『Japan has beautiful p
arksnationwide.』 『Japan is dotted with lov
elypublic gardens all ove
r thecountry.』等のテンプレートパター
ン候補を作成することができるようになっている。
【0017】このテンプレート群は、過去の添削例等を
参考にして、添削作業等で翻訳文の核になる要素が何で
あるかを、専門家の知識を用いて吟味し、模範解答を単
語・句からなる文章要素に分解するとともに、文法規則
上同順位の文章要素を任意数同列でまとめてテンプレー
トブロックを作り、各テンプレートブロックを、文法規
則に基づき上位のものから順次配列することにより構成
されている。
【0018】前記各テンプレートブロックは、正しく使
われた単語・句だけでなく、統語的または意味上誤用さ
れた単語・句も含めて作成されており、これにより、通
常考えられないような入力文に対しても、これに対応す
るテンプレートパターン候補を作成することができるよ
うになっている。
【0019】また、前記テンプレート群中のすべての単
語には、図2に示すように、その重要度に応じたポイン
ト数のポイントが付与されており、このポイントは、図
1に示す単語ポイント数記憶手段5に、単語と関連付け
て記憶されるようになっている。
【0020】例えば、図2に示すテンプレート群の場合
には、ほとんどの単語には、ポイント数「1」のポイン
トが付与されているが、『dotted』および『th
ere』には、他の単語の2倍のポイント数「2」のポ
イントが付与されているとともに、『nationwi
de』には、他の単語の3倍のポイント数「3」のポイ
ントが付与されている。すなわち、『dotted』,
『there』および『nationwide』は、他
の単語の2倍のあるいは3倍の重要度を有する重要単語
として設定されている。
【0021】ここで重要単語は、例えば教師が学生の翻
訳文(入力文)を添削するような場合に、教師側が是非
学生に覚えて貰いたいと考えている文型を強調する等の
場合に設定されるのもので、この場合教師は、授業にお
いてこの文型を用いて翻訳するよう、学生を指導するで
あろうし、学生もこの文型を用いて例題を翻訳するよう
努力することが予想される。そして、学生がこの文型を
用いて翻訳してきた場合には、その添削も、この文型に
添ったテンプレートパターンを用いて評価してやること
が、翻訳文(入力文)を教師に提出した学生の意図に添
った評価となることは明らかである。
【0022】そこで、本発明においては、後に詳述する
ように、学生がこの文型を用いて翻訳してきた場合に
は、この文型に添ったテンプレートパターンを、最適テ
ンプレートパターンとして選択できるようにしている。
【0023】なお、図2に示すテンプレート群では、
『dotted』,『there』および『natio
nwide』が、重要単語として設定されているが、す
べての単語のポイント数を「1」にしてもよい。
【0024】前述のようにして作成された各テンプレー
トパターン候補は、図1に示すように、一致単語検索手
段6において、入力文と一致する単語が検索されるよう
になっており、また合計ポイント数演算手段7において
は、各テンプレートパターン候補で用いられているすべ
ての単語の合計ポイント数が演算されるとともに、一致
単語ポイント数演算手段8においては、入力文と各テン
プレートパターン候補との間での一致単語の合計ポイン
ト数が演算されるようになっている。そして、これら両
合計ポイント数は、最適度比較値演算手段9において比
較され、各テンプレートパターン候補の最適度比較値が
演算されるようになっている。
【0025】すなわち、最適度比較値演算手段9におい
ては、各テンプレートパターン候補における全単語の合
計ポイント数を分母とするとともに、各テンプレートパ
ターン候補における入力文との一致単語の合計ポイント
数を分子とすることにより、最適度比較値が演算される
ようになっており、各テンプレートパターン候補の最適
度比較値は、図1に示すように、最適テンプレートパタ
ーン判定手段10において相互に比較され、分子が最大
となる最適度比較値のうちで、最も大きな最適度比較値
を有するテンプレートパターン候補が、最適テンプレー
トパターンと判定されるようになっている。そして、一
致単語の合計ポイント数のみならず、各テンプレートパ
ターン候補における全単語の合計ポイント数をも考慮さ
れるので、入力文により類似したテンプレートパターン
候補が最適テンプレートとして決定されるようになって
いる。
【0026】図3は、前記最適テンプレートパターン探
索装置における最適テンプレートパターンの探索方法を
示す流れ図であり、以下これについて説明する。
【0027】まず、入力文に対応する模範解答用のテン
プレート群が予め用意され、ステップS1においてこの
テンプレート群を読込む。このテンプレート群は通常、
FSA(有限状態オートマトン)を使用してコンピュー
タに組込み格納される。
【0028】次いで、ステップS2において、テンプレ
ート群中のすべての単語にその重要度に応じたポイント
数で付与されているポイントを読込む。
【0029】次いで、ステップS3において、入力文の
読込みを行なうとともに、ステップS4において、入力
文の解析を行なう。
【0030】なお、この入力文の解析としては、例えば
前記例のような和文英訳の場合であれば、前述の特開平
9−325673号公報に示されているように、基本的
用法が正しく履行されているか否かを調べるためのキー
パターンによるキーパターンチェック、入力文のすべて
の単語に対し内蔵する辞書を用いて行なわれる品詞分
類、および構文解析プログラムによる構文解析が順次行
なわれることになる。
【0031】次いで、ステップS5において、テンプレ
ート群の各テンプレートブロックと入力文とを比較し、
作成可能なすべてのテンプレートパターン候補を検索す
る。
【0032】次いで、ステップS6において、入力文中
の各単語が、各テンプレートパターン候補中のどの単語
と一致するかを検索するとともに、ステップS7におい
て、一致した単語の合計のポイント数を各テンプレート
パターン候補毎に演算する。
【0033】次いで、ステップS8において、各テンプ
レートパターン候補で用いられているすべての単語の合
計ポイント数を各テンプレートパターン候補毎に演算す
るとともに、ステップS9において、各テンプレートパ
ターン候補の最適度比較値をそれぞれ演算する。
【0034】この最適度比較値は、具体的には、ステッ
プS8で求められた合計ポイント数を分母,ステップS
7で求められた一致単語ポイント数を分子とすることに
より求められる。すなわち、一致単語ポイント数を合計
ポイント数で除すことにより求められる。
【0035】次いで、ステップS10において、各テン
プレートパターン候補の最適度比較値を比較し、ステッ
プS7で求められた一致単語ポイント数が最大となる最
適度比較値のうちで、最適度比較値が最も大きくなるテ
ンプレートパターンを、最適テンプレートパターンと判
定する。
【0036】例えば例題が、『日本には、全国的に美し
い庭が多い。』であり、これに対し学生(入力者)の翻
訳文(入力文)が、『In Japan , are
dotted with lovelypublic
gardens nationwide.』であったと
すると、本発明においては、図2に示すテンプレート群
から作成可能な多数のテンプレートパターン候補の中か
ら、『Japan is dotted with l
ovelypublic gardens natio
nwide.』が最適テンプレートパターンとして決定
される。
【0037】次に、前記学生の翻訳文中の『In Ja
pan , are dotted with』の部分
に対して、図2に示すテンプレート群から作成可能な多
数のテンプレート候補の中から、どのようにして最適テ
ンプレートパターンが決定されるのかにつき具体的に説
明する。
【0038】いま、『In Japan , are
dotted with』という入力文に対して、図2
に示すテンプレート群から、『Japan is do
tted with』と、『In Japan , t
here are』とがテンプレートパターン候補とし
て作成されるものとすると、図4に示すような有向グラ
フが得られる。
【0039】この有向グラフのノード(状態)が、N
1,N2,N3,N4,N6,N7,N8,N9,N5
とソート済みであることを前提とした上で、各ノードと
入力文とのマッチングを行なう。
【0040】図5は初期状態を示し、この状態から、矢
印(N1,N2)すなわち『Japan』、矢印(N
1,N6)すなわち『In』、矢印(N2,N3)すな
わち『is』、矢印(N3,N4)すなわち『dott
ed』、矢印(N4,N5)すなわち『with』、矢
印(N6,N7)すなわち『Japan』、矢印(N
7,N8)すなわち『,』、矢印(N8,N9)すなわ
ち『there』、および矢印(N9,N5)すなわち
『are』と、入力文中の各単語とのマッチングが順次
行なわれる。
【0041】まず、矢印(N1,N2)と入力文とのマ
ッチングについて、図6を参照して説明する。 (1) 矢印(N1,N2)と入力文の『In』とを照
合すると、両者は等しくないので、項目(N2,“I
n”)の値および項目(N1,“In”)の値をチェッ
クし、両者は共に0であることから、項目(N2,“I
n”)はそのままとし、バックリンクも同様にそのまま
とする(項目(N1,“In”)のバックリンクは当初
設定されていないので、この時点で(N1,“In”)
に設定する)。図6の表中における矢印がバックリンク
である。
【0042】ここで、バックリンクとは、以下のような
理由で設定されるものである。すなわち、このマッチン
グ方法では、図4に示す始端ノードN1から終端ノード
N5までのすべてのマッチング作業を完了しなければ、
最適テンプレートパターンがどの経路の文字列なのか判
明しない。具体的には、図4の終端ノードN5まで作業
を完了した時点で、矢印(N4,N5)側が最適テンプ
レートパターンであると判明した場合、ノードN4は、
N4→N3→N2→N1の経路を辿って始端ノードN1
に至る文字列であることが判る必要がある。この経路を
示すものがバックリンクである。
【0043】(2) 矢印(N1,N2)と入力文の
『Japan』とを照合する。すると、両者は等しいの
で、項目(N2,“Japan”)の値(=0)、項目
(N2,“In”)の値(=0)、項目(N1,“Ja
pan”)の値(=0)、および(項目(N1,“I
n”)+1の値(=1、ここで+1は図4の“Japa
n”のポイント数を加えることを意味する。)をチェッ
クし、そのうちの最大値を選択して項目(N2,“Ja
pan”)の値とする。この数字は、前記最適度比較値
を求める際の分子の数字として用いられるもので、これ
により、項目(N2,“Japan”)=1となり、バ
ックリンクは、最大値として選択した項目(N1,“I
n”)にリンクされる(ここで、N1は矢印(N1,N
2)の始端ノードである)。なお、図6に示す表におい
て、N2の行の各升目の右下に記している数字「1」
は、図4の始端ノードN1からノードN2までに含まれ
る単語の合計のポイント数を表わし、この数字は、前記
最適度比較値を求める際の分母の数字として用いられ
る。
【0044】(3) 次に、矢印(N1,N2)と入力
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N2,“,”)の値(=0)、項目(N2,
“Japan”)の値(=1)、および(項目(N1,
“,”)値(=0)をチェックし、そのうちの最大値を
選択する。したがって、項目(N2,“,”)=1とな
り、バックリンクは、最大値として選択した項目(N
2,“Japan”)にリンクされる。
【0045】(4) 次に、矢印(N1,N2)と入力
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N2,“are”)の値(=0)、項目
(N2,“,”)の値(=1)、および(項目(N1,
“are”)値(=0)をチェックし、そのうちの最大
値を選択する。したがって、項目(N2,“are”)
=1となり、バックリンクは、最大値として選択した項
目(N2,“,”)にリンクされる。
【0046】(5) 次に、矢印(N1,N2)と入力
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N2,“dotted”)の値
(=0)、項目(N2,“are”)の値(=1)、お
よび(項目(N1,“dotted”)値(=0)をチ
ェックし、そのうちの最大値を選択する。したがって、
項目(N2,“dotted”)=1となり、バックリ
ンクは、最大値として選択した項目(N2,“ar
e”)にリンクされる。
【0047】(6) 次に、矢印(N1,N2)と入力
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N2,“with”)の値(=0)、
項目(N2,“dotted”)の値(=1)、および
(項目(N1,“with”)値(=0)をチェック
し、そのうちの最大値を選択する。したがって、項目
(N2,“with”)=1となり、バックリンクは、
最大値として選択した項目(N2,“dotted”)
にリンクされる。
【0048】次に、矢印(N1,N6)と入力文とのマ
ッチングについて、図7を参照して説明する。 (1) まず、矢印(N1,N6)と入力文の『In』
とを照合すると、両者は等しいので、項目(N6,“I
n”)の値(=0)、および項目(N1,“In”)+
1の値(=1、ここで+1は図4の“In”のポイント
数を加えることを意味する。)をチェックし、そのうち
の最大値を選択して項目(N6,“In”)の値とす
る。これにより、項目(N6,“In”)=1となり、
バックリンクは、最大値として選択した項目(N1,
“In”)にリンクされる。なお、図7に示す表におい
て、N6の行の各升目の右下に記している数字「1」
は、図4の始端ノードN1からノードN6までに含まれ
る単語の合計のポイント数,すなわち『In』のポイン
ト数である。
【0049】(2) 次に、矢印(N1,N6)と入力
文の『Japan』とを照合する。すると、両者は等し
くないので、項目(N6,“Japan”)の値(=
0)、項目(N6,“In”)の値(=1)、および
(項目(N1,“Japan”)値(=0)をチェック
し、そのうちの最大値を選択する。したがって、項目
(N6,“Japan”)=1となり、バックリンク
は、最大値として選択した項目(N6,“In”)にリ
ンクされる。
【0050】(3) 次に、矢印(N1,N6)と入力
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N6,“,”)の値(=0)、項目(N6,
“Japan”)の値(=1)、および(項目(N1,
“,”)値(=0)をチェックし、そのうちの最大値を
選択する。したがって、項目(N6,“,”)=1とな
り、バックリンクは、最大値として選択した項目(N
6,“Japan”)にリンクされる。
【0051】(4) 次に、矢印(N1,N6)と入力
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N6,“are”)の値(=0)、項目
(N6,“,”)の値(=1)、および(項目(N1,
“are”)値(=0)をチェックし、そのうちの最大
値を選択する。したがって、項目(N6,“are”)
=1となり、バックリンクは、最大値として選択した項
目(N6,“,”)にリンクされる。
【0052】(5) 次に、矢印(N1,N6)と入力
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N6,“dotted”)の値
(=0)、項目(N6,“are”)の値(=1)、お
よび項目(N1,“dotted”)値(=0)をチェ
ックし、そのうちの最大値を選択する。したがって、項
目(N6,“dotted”)=1となり、バックリン
クは、最大値として選択した項目(N6,“are”)
にリンクされる。
【0053】(6) 次に、矢印(N1,N6)と入力
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N6,“with”)の値(=0)、
項目(N6,“dotted”)の値(=1)、および
項目(N1,“with”)値(=0)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
6,“with”)=1となり、バックリンクは、最大
値として選択した項目(N6,“dotted”)にリ
ンクされる。
【0054】次に、矢印(N2,N3)と入力文とのマ
ッチングについて、図8を参照して説明する。 (1) まず、矢印(N2,N3)と入力文の『In』
とを照合すると、両者は等しくないので、項目(N3,
“In”)の値および項目(N2,“In”)をチェッ
クし、両者は共に0であるので、項目(N3,“I
n”)はそのままとし、バックリンクもそのままとす
る。なお、図8に示す表において、N3の行の各升目の
右下に記している数字「2」は、図4の始端ノードN1
からノードN3までに含まれる単語の合計のポイント
数,すなわち『Japan』および『is』の合計のポ
イント数である。
【0055】(2) 次に、矢印(N2,N3)と入力
文の『Japan』とを照合する。すると、両者は等し
くないので、項目(N3,“Japan”)の値(=
0)、項目(N3,“In”)の値(=0)、および項
目(N2,“Japan”)値(=1)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
3,“Japan”)=1となり、バックリンクは、最
大値として選択した項目(N2,“Japan”)にリ
ンクされる。
【0056】(3) 次に、矢印(N2,N3)と入力
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N3,“,”)の値(=0)、項目(N3,
“Japan”)の値(=1)、および項目(N
2,“,”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N3,“,”)=1
となり、バックリンクは、最大値として選択した項目
(N3,“Japan”)にリンクされる。
【0057】(4) 次に、矢印(N2,N3)と入力
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N3,“are”)の値(=0)、項目
(N3,“,”)の値(=1)、および項目(N2,
“are”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N3,“are”)
=1となり、バックリンクは、最大値として選択した項
目(N3,“,”)にリンクされる。
【0058】(5) 次に、矢印(N2,N3)と入力
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N3,“dotted”)の値
(=0)、項目(N3,“are”)の値(=1)、お
よび項目(N2,“dotted”)値(=1)をチェ
ックし、そのうちの最大値を選択する。したがって、項
目(N3,“dotted”)=1となり、バックリン
クは、最大値として選択した項目(N3,“are”)
にリンクされる。
【0059】(6) 次に、矢印(N2,N3)と入力
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N3,“with”)の値(=0)、
項目(N3,“dotted”)の値(=1)、および
項目(N2,“with”)値(=1)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
3,“with”)=1となり、バックリンクは、最大
値として選択した項目(N3,“dotted”)にリ
ンクされる。
【0060】次に、矢印(N3,N4)と入力文とのマ
ッチングについて、図9を参照して説明する。 (1) まず、矢印(N3,N4)と入力文の『In』
とを照合すると、両者は等しくないので、項目(N4,
“In”)の値および項目(N3,“In”)の値をチ
ェックし、両者は共に0であるので、項目(N4,“I
n”)はそのままとし、バックリンクもそのままとす
る。なお、図9に示す表において、N4の行の各升目の
右下に記している数字「4」は、図4の始端ノードN1
からノードN4までに含まれる単語,すなわち『Jap
an』,『is』および『dotted』の合計のポイ
ント数である。
【0061】(2) 次に、矢印(N3,N4)と入力
文の『Japan』とを照合する。すると、両者は等し
くないので、項目(N4,“Japan”)の値(=
0)、項目(N4,“In”)の値(=0)、および項
目(N3,“Japan”)値(=1)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
4,“Japan”)=1となり、バックリンクは、最
大値として選択した項目(N3,“Japan”)にリ
ンクされる。
【0062】(3) 次に、矢印(N3,N4)と入力
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N4,“,”)の値(=0)、項目(N4,
“Japan”)の値(=1)、および項目(N
3,“,”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N4,“,”)=1
となり、バックリンクは、最大値として選択した項目
(N4,“Japan”)にリンクされる。
【0063】(4) 次に、矢印(N3,N4)と入力
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N4,“are”)の値(=0)、項目
(N4,“,”)の値(=1)、および項目(N3,
“are”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N4,“are”)
=1となり、バックリンクは、最大値として選択した項
目(N4,“,”)にリンクされる。
【0064】(5) 次に、矢印(N3,N4)と入力
文の『dotted』とを照合する。すると、両者は等
しいので、項目(N4,“dotted”)の値(=
0)、項目(N4,“are”)の値(=1)、項目
(N3,“dotted”)値(=1)、および項目
(N3,“are”)+2の値(=3、ここで+2は図
4の“dotted”のポイント数を加えることを意味
する。)をチェックし、その最大値を選択する。したが
って、項目(N4,“dotted”)=3となり、バ
ックリンクは、最大値として選択した項目(N3,“a
re”)にリンクされる。
【0065】(6) 次に、矢印(N3,N4)と入力
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N4,“with”)の値(=0)、
項目(N4,“dotted”)の値(=3)、および
項目(N3,“with”)の値(=1)をチェック
し、そのうちの最大値を選択する。したがって、項目
(N4,“with”)=3となり、バックリンクは、
最大値として選択した項目(N4,“dotted”)
にリンクされる。
【0066】次に、矢印(N4,N5)と入力文とのマ
ッチングについて、図10を参照して説明する。 (1) まず、矢印(N4,N5)と入力文の『In』
とを照合すると、両者は等しくないので、項目(N5,
“In”)の値および項目(N4,“In”)の値をチ
ェックし、両者は共に0であるので、項目(N5,“I
n”)はそのままとし、バックリンクもそのままとす
る。なお、図10に示す表において、N5の行の各升目
の右下に記している数字「5」は、図4の始端ノードN
1からノードN5までの上側の文字列に含まれる単語,
すなわち『Japan』,『is』,『dotted』
および『with』の合計のポイント数である。
【0067】(2) 次に、矢印(N4,N5)と入力
文の『Japan』とを照合する。すると、両者は等し
くないので、項目(N5,“Japan”)の値(=
0)、項目(N5,“In”)の値(=0)、および項
目(N4,“Japan”)値(=1)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
5,“Japan”)=1となり、バックリンクは、最
大値として選択した項目(N4,“Japan”)にリ
ンクされる。
【0068】(3) 次に、矢印(N4,N5)と入力
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N5,“,”)の値(=0)、項目(N5,
“Japan”)の値(=1)、および項目(N
4,“,”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N5,“,”)=1
となり、バックリンクは、最大値として選択した項目
(N5,“Japan”)にリンクされる。
【0069】(4) 次に、矢印(N4,N5)と入力
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N5,“are”)の値(=0)、項目
(N5,“,”)の値(=1)、および項目(N4,
“are”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N5,“are”)
=1となり、バックリンクは、最大値として選択した項
目(N5,“,”)にリンクされる。
【0070】(5) 次に、矢印(N4,N5)と入力
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N5,“dotted”)の値
(=0)、項目(N5,“are”)の値(=1)、お
よび項目(N4,“dotted”)値(=3)をチェ
ックし、そのうちの最大値を選択する。したがって、項
目(N5,“dotted”)=3となり、バックリン
クは、最大値として選択した項目(N4,“dotte
d”)にリンクされる。
【0071】(6) 次に、矢印(N4,N5)と入力
文の『with』とを照合する。すると、両者は等しい
ので、項目(N5,“with”)の値(=0)、項目
(N5,“dotted”)の値(=3)、項目(N
4,“with”)の値(=3)、および項目(N4,
“dotted”)+1の値(=4、ここで+1は図4
の“with”のポイント数を加えることを意味す
る。)をチェックし、そのうちの最大値を選択する。し
たがって、項目(N5,“with”)=4となり、バ
ックリンクは、最大値として選択した項目(N4,“d
otted”)にリンクされる。
【0072】次に、矢印(N6,N7)と入力文とのマ
ッチングについて、図11を参照して説明する。 (1) まず、矢印(N6,N7)と入力文の『In』
とを照合すると、両者は等しくないので、項目(N7,
“In”)の値(=0)と項目(N6,“In”)の値
(=1)とをチェックし、そのうちの大きい方の値を選
択する。したがって、項目(N7,“In”)=1とな
り、バックリンクは、選択した項目(N6,“In”)
にリンクされる。なお、図11に示す表において、N7
の行の各升目の右下に記している数字「2」は、図4の
始端ノードN1からノードN7までに含まれる単語,す
なわち『In』および『Japan』の合計のポイント
数である。
【0073】(2) 次に、矢印(N6,N7)と入力
文の『Japan』とを照合する。すると、両者は等し
いので、項目(N7,“Japan”)の値(=0)、
項目(N7,“In”)の値(=0)、項目(N6,
“Japan”)値(=1)、および項目(N6,“I
n”)+1の値(=2、ここで+1は図4の“Japa
n”のポイント数を加えることを意味する。)をチェッ
クし、そのうちの最大値を選択する。したがって、項目
(N7,“Japan”)=2となり、バックリンク
は、最大値として選択した項目(N6,“In”)にリ
ンクされる。
【0074】(3) 次に、矢印(N6,N7)と入力
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N7,“,”)の値(=0)、項目(N7,
“Japan”)の値(=2)、および項目(N
6,“,”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N7,“,”)=2
となり、バックリンクは、最大値として選択した項目
(N7,“Japan”)にリンクされる。
【0075】(4) 次に、矢印(N6,N7)と入力
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N7,“are”)の値(=0)、項目
(N7,“,”)の値(=2)、および項目(N6,
“are”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N7,“are”)
=2となり、バックリンクは、最大値として選択した項
目(N7,“,”)にリンクされる。
【0076】(5) 次に、矢印(N6,N7)と入力
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N7,“dotted”)の値
(=0)、項目(N7,“are”)の値(=2)、お
よび項目(N6,“dotted”)値(=1)をチェ
ックし、そのうちの最大値を選択する。したがって、項
目(N7,“dotted”)=2となり、バックリン
クは、最大値として選択した項目(N7,“are”)
にリンクされる。
【0077】(6) 次に、矢印(N6,N7)と入力
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N7,“with”)の値(=0)、
項目(N7,“dotted”)の値(=2)、および
項目(N6,“with”)値(=1)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
7,“with”)=2となり、バックリンクは、最大
値として選択した項目(N7,“dotted”)にリ
ンクされる。
【0078】次に、矢印(N7,N8)と入力文とのマ
ッチングについて、図12を参照して説明する。 (1) まず、矢印(N7,N8)と入力文の『In』
とを照合すると、両者は等しくないので、項目(N8,
“In”)の値(=0)と項目(N7,“In”)の値
(=1)とをチェックし、そのうちの大きい方の値を選
択する。したがって、項目(N8,“In”)=1とな
り、バックリンクは、選択した項目(N7“In”)に
リンクされる。なお、図12に示す表において、N8の
行の各升目の右下に記している数字「3」は、図4の始
端ノードN1からノードN8までに含まれる単語,すな
わち『In』,『Japan』および『,』の合計のポ
イント数である。
【0079】(2) 次に、矢印(N7,N8)と入力
文の『Japan』とを照合する。すると、両者は等し
くないので、項目(N8,“Japan”)の値(=
0)、項目(N8,“In”)の値(=1)、および項
目(N7,“Japan”)値(=2)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
8,“Japan”)=2となり、バックリンクは、最
大値として選択した項目(N7,“Japan”)にリ
ンクされる。
【0080】(3) 次に、矢印(N7,N8)と入力
文の『,』とを照合する。すると、両者は等しいので、
項目(N8,“,”)の値(=0)、項目(N8,“J
apan”)の値(=2)、項目(N7,“,”)の値
(=2)、および項目(N7,“Japan”)+1の
値(=3、ここで+1は図4の“,”のポイント数を加
えることを意味する。)をチェックし、そのうちの最大
値を選択する。したがって、項目(N8,“,”)=3
となり、バックリンクは、最大値として選択した項目
(N7,“Japan”)にリンクされる。
【0081】(4) 次に、矢印(N7,N8)と入力
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N8,“are”)の値(=0)、項目
(N8,“,”)の値(=3)、および項目(N7,
“are”)値(=2)をチェックし、そのうちの最大
値を選択する。したがって、項目(N8,“are”)
=3となり、バックリンクは、最大値として選択した項
目(N8,“,”)にリンクされる。
【0082】(5) 次に、矢印(N7,N8)と入力
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N8,“dotted”)の値
(=0)、項目(N8,“are”)の値(=3)、お
よび項目(N7,“dotted”)値(=2)をチェ
ックし、そのうちの最大値を選択する。したがって、項
目(N8,“dotted”)=3となり、バックリン
クは、最大値として選択した項目(N8,“are”)
にリンクされる。
【0083】(6) 次に、矢印(N7,N8)と入力
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N8,“with”)の値(=0)、
項目(N8,“dotted”)の値(=3)、および
項目(N7,“with”)値(=2)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
8,“with”)=3となり、バックリンクは、最大
値として選択した項目(N8,“dotted”)にリ
ンクされる。
【0084】次に、矢印(N8,N9)と入力文とのマ
ッチングについて、図13を参照して説明する。 (1) まず、矢印(N8,N9)と入力文の『In』
とを照合すると、両者は等しくないので、項目(N9,
“In”)の値(=0)と項目(N8,“In”)の値
(=1)とをチェックし、そのうちの大きい方の値を選
択する。したがって、項目(N9,“In”)=1とな
り、バックリンクは、選択した項目(N8“In”)に
リンクされる。なお、図13に示す表において、N9の
行の各升目の右下に記している数字「5」は、図4の始
端ノードN1からノードN9までに含まれる単語,すな
わち『In』,『Japan』『,』および『ther
e』の合計ポイント数である。
【0085】(2) 次に、矢印(N8,N9)と入力
文の『Japan』とを照合する。すると、両者は等し
くないので、項目(N9,“Japan”)の値(=
0)、項目(N9,“In”)の値(=1)、および項
目(N8,“Japan”)値(=2)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
9,“Japan”)=2となり、バックリンクは、最
大値として選択した項目(N8,“Japan”)にリ
ンクされる。
【0086】(3) 次に、矢印(N8,N9)と入力
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N9,“,”)の値(=0)、項目(N9,
“Japan”)の値(=2)、および項目(N
8,“,”)値(=3)をチェックし、そのうちの最大
値を選択する。したがって、項目(N9,“,”)=3
となり、バックリンクは、最大値として選択した項目
(N8,“,”)にリンクされる。
【0087】(4) 次に、矢印(N8,N9)と入力
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N9,“are”)の値(=0)、項目
(N9,“,”)の値(=3)、および項目(N8,
“are”)値(=3)をチェックし、そのうちの最大
値を選択する。したがって、項目(N9,“are”)
=3となり、バックリンクは、最大値として選択した項
目(N9,“,”)にリンクされる。
【0088】(5) 次に、矢印(N8,N9)と入力
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N9,“dotted”)の値
(=0)、項目(N9,“are”)の値(=3)、お
よび項目(N8,“dotted”)値(=3)をチェ
ックし、そのうちの最大値を選択する。したがって、項
目(N9,“dotted”)=3となり、バックリン
クは、最大値として選択した項目(N9,“are”)
にリンクされる。
【0089】(6) 次に、矢印(N8,N9)と入力
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N9,“with”)の値(=0)、
項目(N9,“dotted”)の値(=3)、および
項目(N8,“with”)値(=3)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
9,“with”)=3となり、バックリンクは、最大
値として選択した項目(N9,“dotted”)にリ
ンクされる。
【0090】次に、矢印(N9,N5)と入力文とのマ
ッチングについて、図14を参照して説明する。 (1) まず、矢印(N9,N5)と入力文の『In』
とを照合すると、両者は等しくないので、項目(N9,
“In”)の値(=0)と項目(N9,“In”)の値
(=1)とをチェックし、そのうちの大きい方の値を選
択する。したがって、項目(N5,“In”)=1とな
り、バックリンクは、選択した項目(N9“In”)に
リンクされ、バックリンクが変更される。なお、図14
に示す表において、N5の行の第1列目から第5列目の
各升目の右下に記している数字「6」は、図4の始端ノ
ードN1からノードN5までの下側の文字列に含まれる
単語,すなわち『In』,『Japan』『,』『th
ere』および『are』の合計ポイント数である。こ
こで、N5の行の第6列目の升目の右下に記している数
字は、「6」ではなく「5」のままであるが、その理由
については後に詳述する。
【0091】(2) 次に、矢印(N9,N5)と入力
文の『Japan』とを照合する。すると、両者は等し
くないので、項目(N5,“Japan”)の値(=
1)、項目(N5,“In”)の値(=1)、および項
目(N9,“Japan”)値(=2)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
5,“Japan”)=2となり、バックリンクは、最
大値として選択した項目(N9,“Japan”)にリ
ンクされ、バックリンクが変更される。
【0092】(3) 次に、矢印(N9,N5)と入力
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N5,“In”)の値(=1)、項目(N
5,“Japan”)の値(=2)、および項目(N
9,“,”)値(=3)をチェックし、そのうちの最大
値を選択する。したがって、項目(N5,“,”)=3
となり、バックリンクは、最大値として選択した項目
(N9,“,”)にリンクされ,バックリンクが変更さ
れる。
【0093】(4) 次に、矢印(N9,N5)と入力
文の『are』とを照合する。すると、両者は等しいの
で、項目(N5,“are”)の値(=1)、項目(N
5,“,”)の値(=3)、項目(N9,“are”)
値(=3)、および項目(N9,“,”)+1の値(=
4、ここで+1は図4の“are”のポイント数を加え
ることを意味する。)をチェックし、そのうちの最大値
を選択する。したがって、項目(N5,“are”)=
4となり、バックリンクは、最大値として選択した項目
(N9,“,”)にリンクされ、バックリンクが変更さ
れる。
【0094】(5) 次に、矢印(N9,N5)と入力
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N5,“dotted”)の値
(=3)、項目(N5,“are”)の値(=4)、お
よび項目(N9,“dotted”)値(=3)をチェ
ックし、そのうちの最大値を選択する。したがって、項
目(N5,“dotted”)=4となり、バックリン
クは、最大値として選択した項目(N5,“are”)
にリンクされ、バックリンクが変更される。
【0095】(6) 次に、矢印(N9,N5)と入力
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N5,“with”)の値(=4)、
項目(N5,“dotted”)の値(=4)、および
項目(N9,“with”)値(=3)をチェックす
る。
【0096】ここで、項目(N5,“dotted”)
の値(=4)が最大値である場合には、N5の行の第1
列から第5列までの場合と同様、バックリンクが変更さ
れ、各升目の右下に記している数字も、変更された文字
列の合計ポイント数である「6」に変更されることにな
る。
【0097】ところが、項目(N5,“dotte
d”)の値(=4)と、元の項目(N5,“wit
h”)の値(=4)とは同一値である。そしてこの場合
には、バックリンクを変更することにより、N5の行の
升目の右下に記している数字が小さくなる場合を除き、
バックリンクの変更は行なわない。したがって、項目
(N5,“with”)=4となり、バックリンクは、
項目(N4,“dotted”)にリンクされたままの
状態が保持され、升目の右下に記している数字も、図4
の上側の文字列の合計ポイント数である「5」のままの
状態が保持される。
【0098】以上説明したマッチング作業により、図4
に示す上側の文字列の最適度比較値が4/5で、下側の
文字列の最適度比較値が4/6となり、上側の文字列が
入力文に対する最適テンプレートパターンとして決定さ
れることになる。
【0099】このようにして、最適テンプレートパター
ンが決定されたならば、図3のステップS11におい
て、入力文を最適テンプレートパターンと同様のテンプ
レートに分解するとともに、ステップS12において、
入力文の添削を行なう。この添削方法は、前述の特開平
9−325673号公報に示されている添削方法と同一
である。
【0100】しかして、模範解答用のテンプレートパタ
ーンを予め用意せず、入力文に合わせてその都度これに
適したテンプレートパターンを作成するようにしている
ので、どのような入力文に対しても、これに最も適した
模範解答用のテンプレートパターンを得ることができ
る。
【0101】なお、前記実施の一形態においては、和文
英訳の添削を例に採って説明したが、英文和訳の場合
や、他の言語間の翻訳の場合にも同様に適用でき、また
前述のように、インターネット等を利用した情報検索シ
ステムにおいて、入力文に基づき所定の情報を検索する
ような場合に、自然言語文章からなる複合情報を持つテ
ンプレートパターンを検索キーとして使用することによ
り、同様に適用することができる。
【0102】
【発明の効果】以上説明したように本発明は、任意数の
文章要素を同列で包含する複数のテンプレートブロック
を文法規則に基づき上位のものから順次配列して構成さ
れる模範解答用のテンプレート群を予め用意し、このテ
ンプレート群から作成可能なすべてのテンプレートパタ
ーン候補の中から、入力文に最も適したテンプレートパ
ターン候補を探索する最適テンプレートパターン探索方
法であって、前記テンプレート群中のすべての単語に、
その重要度に応じたポイント数のポイントを付与した
後、前記すべてのテンプレートパターン候補について、
各テンプレートパターン候補で用いられているすべての
単語の合計ポイント数を分母,入力文と各テンプレート
パターン候補との間での一致単語の合計ポイント数を分
子とする最適度比較値を求め、分子が最大となる最適度
比較値のうちで、最適度比較値が最も大きくなるテンプ
レートパターン候補を、最適テンプレートパターンと判
定するようにしているので、どのような入力文であって
も、入力者が意図した入力文のテンプレートパターンと
同一のテンプレートパターンを、模範解答用の最適テン
プレートパターンとして得ることができる。
【0103】本発明はまた、任意数の文章要素を同列で
包含する複数のテンプレートブロックを文法規則に基づ
き上位のものから順次配列して構成される模範解答用の
テンプレート群を記憶するテンプレート群記憶手段と;
入力文を記憶する入力文記憶手段と;前記テンプレート
群の各テンプレートブロックと入力文とを比較し、テン
プレート群から作成可能なすべてのテンプレートパター
ン候補を探索するテンプレートパターン候補検索手段
と;検索されたテンプレートパターン候補を記憶するテ
ンプレートパターン候補記憶手段と;テンプレート群中
のすべての単語にその重要度に応じたポイント数で付与
されるポイントを、単語と関連付けて記憶する単語ポイ
ント数記憶手段と;各テンプレートパターン候補におい
て入力文と一致する単語を検索する一致単語検索手段
と;各テンプレートパターン候補で用いられているすべ
ての単語の合計ポイント数を演算する合計ポイント数演
算手段と;入力文と各テンプレートパターン候補との間
での一致単語の合計ポイント数を演算する一致単語ポイ
ント数演算手段と;各テンプレートパターン候補におけ
る全単語の合計ポイント数を分母,各テンプレートパタ
ーン候補における入力文との一致単語の合計ポイント数
を分子とする最適度比較値を演算する最適度比較値演算
手段と;各テンプレートパターン候補の最適度比較値を
比較し、分子が最大となる最適度比較値のうちで、最も
大きな最適度比較値を有するテンプレートパターン候補
を最適テンプレートパターンと判定する最適テンプレー
トパターン判定手段と;を設けるようにしているので、
どのような入力文であっても、これに対応するテンプレ
ートパターン候補を得ることができる。また、複数のテ
ンプレートパターン候補の中から最適テンプレートパタ
ーンを得る際には、最適度比較値を比較して判定するよ
うにしているので、最適テンプレートパターンが複数出
てくるといった不具合を、ほぼ完全に防止することがで
きる。
【0104】本発明はさらに、任意数の文章要素を同列
で包含する複数のテンプレートブロックを文法規則に基
づき上位のものから順次配列して構成される模範解答用
のテンプレ群を、メモリ領域に記憶させる処理;入力文
をメモリ領域に記憶させる処理;前記テンプレート群中
のすべての単語に対し、その重要度に応じたポイント数
で付与されたポイントを、単語と関連付けてメモリ領域
に記憶させる処理;前記テンプレート群から作成可能な
すべてのテンプレートパターン候補について、各テンプ
レートパターン候補で用いられているすべての単語の合
計ポイント数を分母,入力文と各テンプレートパターン
候補との間での一致単語の合計ポイント数を分子とする
最適度比較値を用い、分子が最大となる最適度比較値の
うちで、最適度比較値が最も大きくなるテンプレートパ
ターン候補を、最適テンプレートパターンと判定する処
理;をコンピュータに実行させるようにしているので、
予め模範解答用のテンプレートパターンを用意しておか
なくても、入力者が意図した入力文のテンプレートパタ
ーンと同一のテンプレートパターンを、模範解答用の最
適テンプレートパターンとして得ることができる。
【図面の簡単な説明】
【図1】本発明の実施の一形態に係る最適テンプレート
パターン探索装置を示す全体構成図である。
【図2】図1の装置で用いられるテンプレート群の一例
を示す説明図である。
【図3】図1の装置による最適テンプレートパターン探
索方法を示す流れ図である。
【図4】有向グラフの一例を示す説明図である。
【図5】図4の各ノードと入力文とのマッチングを行な
う際の初期状態を示す表である。
【図6】矢印(N1,N2)と入力文とのマッチングを
示す表である。
【図7】矢印(N1,N6)と入力文とのマッチングを
示す表である。
【図8】矢印(N2,N3)と入力文とのマッチングを
示す表である。
【図9】矢印(N3,N4)と入力文とのマッチングを
示す表である。
【図10】矢印(N4,N5)と入力文とのマッチング
を示す表である。
【図11】矢印(N6,N7)と入力文とのマッチング
を示す表である。
【図12】矢印(N7,N8)と入力文とのマッチング
を示す表である。
【図13】矢印(N8,N9)と入力文とのマッチング
を示す表である。
【図14】矢印(N9,N5)と入力文とのマッチング
を示す表である。
【符号の説明】
1 テンプレート群記憶手段 2 入力文記憶手段 3 テンプレートパターン候補検索手段 4 テンプレートパターン候補記憶手段 5 単語ポイント数記憶手段 6 一致単語検索手段 7 合計ポイント数演算手段 8 一致単語ポイント数演算手段 9 最適度比較値演算手段 10 最適テンプレートパターン判定手段

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 任意数の文章要素を同列で包含する複数
    のテンプレートブロックを文法規則に基づき上位のもの
    から順次配列して構成される模範解答用のテンプレート
    群を予め用意し、このテンプレート群から作成可能なす
    べてのテンプレートパターン候補の中から、入力文に最
    も適したテンプレートパターン候補を探索する最適テン
    プレートパターン探索方法であって、前記テンプレート
    群中のすべての単語に、その重要度に応じたポイント数
    のポイントを付与した後、前記すべてのテンプレートパ
    ターン候補について、各テンプレートパターン候補で用
    いられているすべての単語の合計ポイント数を分母,入
    力文と各テンプレートパターン候補との間での一致単語
    の合計ポイント数を分子とする最適度比較値を求め、分
    子が最大となる最適度比較値のうちで、最適度比較値が
    最も大きくなるテンプレートパターン候補を、最適テン
    プレートパターンと判定することを特徴とする最適テン
    プレートパターン探索方法。
  2. 【請求項2】 任意数の文章要素を同列で包含する複数
    のテンプレートブロックを文法規則に基づき上位のもの
    から順次配列して構成される模範解答用のテンプレート
    群を記憶するテンプレート群記憶手段と;入力文を記憶
    する入力文記憶手段と;前記テンプレート群の各テンプ
    レートブロックと入力文とを比較し、テンプレート群か
    ら作成可能なすべてのテンプレートパターン候補を探索
    するテンプレートパターン候補検索手段と;検索された
    テンプレートパターン候補を記憶するテンプレートパタ
    ーン候補記憶手段と;テンプレート群中のすべての単語
    にその重要度に応じたポイント数で付与されるポイント
    を、単語と関連付けて記憶する単語ポイント数記憶手段
    と;各テンプレートパターン候補において入力文と一致
    する単語を検索する一致単語検索手段と;各テンプレー
    トパターン候補で用いられているすべての単語の合計ポ
    イント数を演算する合計ポイント数演算手段と;入力文
    と各テンプレートパターン候補との間での一致単語の合
    計ポイント数を演算する一致単語ポイント数演算手段
    と;各テンプレートパターン候補における全単語の合計
    ポイント数を分母,各テンプレートパターン候補におけ
    る入力文との一致単語の合計ポイント数を分子とする最
    適度比較値を演算する最適度比較値演算手段と;各テン
    プレートパターン候補の最適度比較値を比較し、分子が
    最大となる最適度比較値のうちで、最も大きな最適度比
    較値を有するテンプレートパターン候補を最適テンプレ
    ートパターンと判定する最適テンプレートパターン判定
    手段と;を具備することを特徴とする最適テンプレート
    パターン探索装置。
  3. 【請求項3】 任意数の文章要素を同列で包含する複数
    のテンプレートブロックを文法規則に基づき上位のもの
    から順次配列して構成される模範解答用のテンプレ群
    を、メモリ領域に記憶させる処理;入力文をメモリ領域
    に記憶させる処理;前記テンプレート群中のすべての単
    語に対し、その重要度に応じたポイント数で付与された
    ポイントを、単語と関連付けてメモリ領域に記憶させる
    処理;前記テンプレート群から作成可能なすべてのテン
    プレートパターン候補について、各テンプレートパター
    ン候補で用いられているすべての単語の合計ポイント数
    を分母,入力文と各テンプレートパターン候補との間で
    の一致単語の合計ポイント数を分子とする最適度比較値
    を用い、分子が最大となる最適度比較値のうちで、最適
    度比較値が最も大きくなるテンプレートパターン候補
    を、最適テンプレートパターンと判定する処理;をコン
    ピュータに実行させるためのプログラムを記録したコン
    ピュータ読取り可能な記録媒体。
JP18248099A 1999-06-28 1999-06-28 最適テンプレートパターン探索方法,探索装置および記録媒体 Expired - Fee Related JP3669870B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP18248099A JP3669870B2 (ja) 1999-06-28 1999-06-28 最適テンプレートパターン探索方法,探索装置および記録媒体
US09/597,270 US6804637B1 (en) 1999-06-28 2000-06-20 Method, apparatus, and recording medium for retrieving optimum template pattern

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP18248099A JP3669870B2 (ja) 1999-06-28 1999-06-28 最適テンプレートパターン探索方法,探索装置および記録媒体
US09/597,270 US6804637B1 (en) 1999-06-28 2000-06-20 Method, apparatus, and recording medium for retrieving optimum template pattern

Publications (2)

Publication Number Publication Date
JP2001013863A true JP2001013863A (ja) 2001-01-19
JP3669870B2 JP3669870B2 (ja) 2005-07-13

Family

ID=33492323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18248099A Expired - Fee Related JP3669870B2 (ja) 1999-06-28 1999-06-28 最適テンプレートパターン探索方法,探索装置および記録媒体

Country Status (2)

Country Link
US (1) US6804637B1 (ja)
JP (1) JP3669870B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009129032A (ja) * 2007-11-20 2009-06-11 Fuji Xerox Co Ltd 翻訳装置及び翻訳プログラム
JP2010152420A (ja) * 2008-12-23 2010-07-08 Fuji Xerox Co Ltd 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4574047B2 (ja) * 2001-03-30 2010-11-04 富士通株式会社 訳例辞書を用いて翻訳を行う機械翻訳装置およびプログラム
US7013262B2 (en) * 2002-02-12 2006-03-14 Sunflare Co., Ltd System and method for accurate grammar analysis using a learners' model and part-of-speech tagged (POST) parser
US6988063B2 (en) * 2002-02-12 2006-01-17 Sunflare Co., Ltd. System and method for accurate grammar analysis using a part-of-speech tagged (POST) parser and learners' model
US7249012B2 (en) * 2002-11-20 2007-07-24 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
US7356457B2 (en) 2003-02-28 2008-04-08 Microsoft Corporation Machine translation using learned word associations without referring to a multi-lingual human authored dictionary of content words
US8666928B2 (en) * 2005-08-01 2014-03-04 Evi Technologies Limited Knowledge repository
US8340957B2 (en) * 2006-08-31 2012-12-25 Waggener Edstrom Worldwide, Inc. Media content assessment and control systems
US8271266B2 (en) * 2006-08-31 2012-09-18 Waggner Edstrom Worldwide, Inc. Media content assessment and control systems
US8838659B2 (en) 2007-10-04 2014-09-16 Amazon Technologies, Inc. Enhanced knowledge repository
EP2251798A1 (en) * 2008-02-29 2010-11-17 Sharp Kabushiki Kaisha Information processing device, method, and program
US9805089B2 (en) 2009-02-10 2017-10-31 Amazon Technologies, Inc. Local business and product search system and method
US9110882B2 (en) 2010-05-14 2015-08-18 Amazon Technologies, Inc. Extracting structured knowledge from unstructured text
US20150007181A1 (en) * 2013-06-27 2015-01-01 Xerox Corporation Method and system for selecting task templates

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4507750A (en) * 1982-05-13 1985-03-26 Texas Instruments Incorporated Electronic apparatus from a host language
US4802231A (en) * 1987-11-24 1989-01-31 Elliot Davis Pattern recognition error reduction system
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
JP2887660B2 (ja) 1996-06-05 1999-04-26 株式会社サン・フレア 翻訳文添削支援装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009129032A (ja) * 2007-11-20 2009-06-11 Fuji Xerox Co Ltd 翻訳装置及び翻訳プログラム
JP2010152420A (ja) * 2008-12-23 2010-07-08 Fuji Xerox Co Ltd 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置

Also Published As

Publication number Publication date
US6804637B1 (en) 2004-10-12
JP3669870B2 (ja) 2005-07-13

Similar Documents

Publication Publication Date Title
JP2640793B2 (ja) 共起辞書構築装置及びこの共起辞書を用いた文解析装置
JP2001013863A (ja) 最適テンプレートパターン探索方法,探索装置および記録媒体
CN108804428A (zh) 一种译文中术语错译的纠正方法、系统及相关装置
CN109766538B (zh) 一种文本纠错方法、装置、电子设备以及存储介质
US20080046405A1 (en) Query speller
EP1145141A2 (en) Spelling and grammar checking system
WO1999021105A1 (en) Automatically recognizing the discourse structure of a body of text
WO2005022294A2 (en) Method and apparatus for language processing
JPH05151260A (ja) 翻訳テンプレート学習方法および翻訳テンプレート学習システム
JP2005518020A (ja) 品詞タグ付き(post)パーサーおよび学習者モデルを使用した正確な文法分析のためのシステムおよび方法
CN111061832A (zh) 基于开放域信息抽取的人物行为抽取方法
JP4502114B2 (ja) データベース検索装置
JP2004355204A (ja) 自然言語処理装置、自然言語処理方法及び自然言語処理プログラム
US20030195740A1 (en) Translation evaluation using optimum template pattern determination method
JP3669869B2 (ja) 最適テンプレートパターンを用いた評価方法、評価装置および記録媒体
JP3932350B2 (ja) 言語変換処理統一システム
CN116360794A (zh) 数据库语言解析方法、装置、计算机设备及存储介质
CN112732885A (zh) 用于问答系统的答案扩展方法、装置及电子设备
JP2887660B2 (ja) 翻訳文添削支援装置
JPH07244665A (ja) 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置
Yamura-Takei et al. Automatic linguistic analysis for language teachers: The case of zeros
WO1999021104A1 (en) Automatically recognizing the discourse structure of a body of text
JP2005134691A (ja) ネットワークを経由した教育システムの自動採点装置
Angkawattanawit et al. Thai q-cor: Integrating word approximation and soundex for thai query correction
JP3353647B2 (ja) 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040323

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050412

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080422

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090422

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100422

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100422

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110422

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120422

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120422

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130422

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140422

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees