JP2001013863A - 最適テンプレートパターン探索方法,探索装置および記録媒体 - Google Patents
最適テンプレートパターン探索方法,探索装置および記録媒体Info
- Publication number
- JP2001013863A JP2001013863A JP11182480A JP18248099A JP2001013863A JP 2001013863 A JP2001013863 A JP 2001013863A JP 11182480 A JP11182480 A JP 11182480A JP 18248099 A JP18248099 A JP 18248099A JP 2001013863 A JP2001013863 A JP 2001013863A
- Authority
- JP
- Japan
- Prior art keywords
- template
- template pattern
- item
- value
- input sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/47—Machine-assisted translation, e.g. using translation memory
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Electrically Operated Instructional Devices (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
レートパターンを得ることができるようにする。 【解決手段】 模範解答用のテンプレート群を用意す
る。このテンプレート群を、任意数の文章要素を同列で
包含する複数のテンプレートブロックを、文法規則に基
づき上位のものから順次配列して構成する。テンプレー
ト群中のすべての単語に、その重要度に応じたポイント
数のポイントを付けておく。そしてこれらを読込む(S
1,S2)。その後入力文を読込むとともに、その解析
を行なう(S3,S4)。次いで、テンプレートパター
ン候補を検索し(S5)、入力文との一致単語の検索,
一致単語ポイント数の演算,および合計ポイント数の演
算を行なう(S6〜S8)。その後、一致単語ポイント
数を分子,合計ポイント数を分母とする最適度比較値を
求め(S9)、分子が最大となる最適度比較値のうち
で、最適度比較値が最も大きいテンプレートパターン候
補を、最適テンプレートパターンとして選択する。そし
て、これを用いて入力文を添削する(S10〜S1
2)。
Description
削したり評価する際に使用される最適テンプレートパタ
ーン探索方法,探索装置および記録媒体に係り、特にど
のような入力文に対しても、これに最も適した最適テン
プレートパターンを得ることができる最適テンプレート
パターン探索方法,探索装置および記録媒体に関する。
は、受講生が例題に対する解答文を本部に送付し、本部
では送付されてきた解答文を添削して受講生に送り返
し、受講生はその添削内容を見て自己のレベルを確認す
る方法が採られている。
れてくる解答文を複数の添削者に振分け、各添削者が人
力により行う方法が採られているが、人力による添削に
は多大な時間を要するとともに、一定レベル以上の実力
を有する添削者を確保することが必ずしも容易でなく、
添削者によって添削内容にバラツキが生じるという問題
がある。
5673号公報に示すように、専門家が人力で行なうの
と同程度の結果が得られる翻訳文添削支援装置を提案し
た。
した翻訳文添削支援装置は、模範解答に対応するテンプ
レートパターンを複数種類用意しておき、解答文がどの
テンプレートパターンと一致するかを判断した後、解答
文を当該テンプレートパターンと同様のテンプレートパ
ターンに分解し、各テンプレート毎に解答文と模範解答
との異同を判断して添削結果を得るものであり、技術翻
訳者養成講座のように、解答文の翻訳レベルにバラツキ
が少ない場合には、極めて精度の高い添削結果を得るこ
とができる。
に、解答文の翻訳レベルのバラツキが極めて大きい場合
には、そのすべてのケースを想定して、模範解答に対応
するテンプレートパターンを多数用意しておくことは不
可能である。このため、解答文が予め用意された模範解
答のテンプレートパターンと一致しない場合が多発する
ことになり、最悪の場合には、解答文に対応する模範解
答のテンプレートパターンを提示できないことがある。
例えばインターネットを利用した情報検索システムにお
いて、入力文に基づき所定の情報を検索する等の場合に
も同様に生じる。
(解答文)に対する模範解答用のテンプレートパターン
を予め用意しておき、その中で入力文に適したテンプレ
ートパターンを探す方法を採っていたことに起因するも
のである。したがって、入力文に対して、その都度これ
に適した模範解答用のテンプレートパターンを作成する
ようにすれば、どのような入力文に対しても、これに最
も適した模範解答用のテンプレートパターンを得ること
ができるものと予想される。
ので、どのような入力文に対しても、入力者が意図した
入力文のテンプレートパターンと同一のテンプレートパ
ターンを、模範解答用の最適テンプレートパターンとし
て得ることができる最適テンプレートパターン探索方
法,探索装置および記録媒体を提供することを目的とす
る。
本発明は、任意数の文章要素を同列で包含する複数のテ
ンプレートブロックを文法規則に基づき上位のものから
順次配列して構成される模範解答用のテンプレート群を
予め用意し、このテンプレート群から作成可能なすべて
のテンプレートパターン候補の中から、入力文に最も適
したテンプレートパターン候補を探索する最適テンプレ
ートパターン探索方法であって、前記テンプレート群中
のすべての単語に、その重要度に応じたポイント数のポ
イントを付与した後、前記すべてのテンプレートパター
ン候補について、各テンプレートパターン候補で用いら
れているすべての単語の合計ポイント数を分母,入力文
と各テンプレートパターン候補との間での一致単語の合
計ポイント数を分子とする最適度比較値を求め、分子が
最大となる最適度比較値のうちで、最適度比較値が最も
大きくなるテンプレートパターン候補を、最適テンプレ
ートパターンと判定するようにしたことを特徴とする。
章要素を同列で包含する複数のテンプレートブロックを
文法規則に基づき上位のものから順次配列して構成され
る模範解答用のテンプレート群が予め用意されている。
そして、このテンプレート群からは、上位のテンプレー
トブロック内の任意の文章要素と、その下位のテンプレ
ートブロック内の任意の文章要素とを順次連結していく
ことにより、入力文に対応する多数のテンプレートパタ
ーン候補を作成することが可能である。一方、前記テン
プレート群中のすべての単語には、その重要度に応じた
ポイント数のポイントが付与される。したがって、前記
すべてのテンプレートパターン候補について、各テンプ
レートパターン候補で用いられているすべての単語の合
計ポイント数を分母,入力文と各テンプレートパターン
候補との間での一致単語の合計ポイント数を分子とする
最適度比較値を求め、分子が最大となる最適度比較値の
うちで、最適度比較値が最も大きくなるテンプレートパ
ターン候補を、最適テンプレートパターンと判定するこ
とにより、どのような入力文であっても、入力者が意図
した入力文のテンプレートパターンと同一のテンプレー
トパターンを、模範解答用の最適テンプレートパターン
として得ることが可能となる。
包含する複数のテンプレートブロックを文法規則に基づ
き上位のものから順次配列して構成される模範解答用の
テンプレート群を記憶するテンプレート群記憶手段と;
入力文を記憶する入力文記憶手段と;前記テンプレート
群の各テンプレートブロックと入力文とを比較し、テン
プレート群から作成可能なすべてのテンプレートパター
ン候補を探索するテンプレートパターン候補検索手段
と;検索されたテンプレートパターン候補を記憶するテ
ンプレートパターン候補記憶手段と;テンプレート群中
のすべての単語にその重要度に応じたポイント数で付与
されるポイントを、単語と関連付けて記憶する単語ポイ
ント数記憶手段と;各テンプレートパターン候補におい
て入力文と一致する単語を検索する一致単語検索手段
と;各テンプレートパターン候補で用いられているすべ
ての単語の合計ポイント数を演算する合計ポイント数演
算手段と;入力文と各テンプレートパターン候補との間
での一致単語の合計ポイント数を演算する一致単語ポイ
ント数演算手段と;各テンプレートパターン候補におけ
る全単語の合計ポイント数を分母,各テンプレートパタ
ーン候補における入力文との一致単語の合計ポイント数
を分子とする最適度比較値を演算する最適度比較値演算
手段と;各テンプレートパターン候補の最適度比較値を
比較し、分子が最大となる最適度比較値のうちで、最も
大きな最適度比較値を有するテンプレートパターン候補
を、最適テンプレートパターンと判定する最適テンプレ
ートパターン判定手段と;を設けるようにしたことを特
徴とする。そして、テンプレートパターン候補検索手段
において、テンプレート群の各テンプレートブロックと
入力文とを比較し、テンプレート群から作成可能なすべ
てのテンプレートパターン候補を探索するようにしてい
るので、どのような入力文であっても、これに対応する
テンプレートパターン候補を得ることが可能となる。ま
た、複数のテンプレートパターン候補の中から最適テン
プレートパターンを得る際には、各単語のポイント数が
考慮されるので、入力文中にポイント数の高い重要単語
が含まれている場合には、重要単語をより多く含むテン
プレートパターン候補が最適テンプレートパターンとし
て選択されることになり、入力者が意図した入力文のテ
ンプレートパターンと同一のテンプレートパターンを、
最適テンプレートパターンと判定することが可能とな
る。
で包含する複数のテンプレートブロックを文法規則に基
づき上位のものから順次配列して構成される模範解答用
のテンプレ群を、メモリ領域に記憶させる処理;入力文
をメモリ領域に記憶させる処理;前記テンプレート群中
のすべての単語に対し、その重要度に応じたポイント数
で付与されたポイントを、単語と関連付けてメモリ領域
に記憶させる処理;前記テンプレート群から作成可能な
すべてのテンプレートパターン候補について、各テンプ
レートパターン候補で用いられているすべての単語の合
計ポイント数を分母,入力文と各テンプレートパターン
候補との間での一致単語の合計ポイント数を分子とする
最適度比較値を用い、分子が最大となる最適度比較値の
うちで、最適度比較値が最も大きくなるテンプレートパ
ターン候補を、最適テンプレートパターンと判定する処
理;をコンピュータに実行させるようにしたことを特徴
とする。そして前記各処理により、予め模範解答用のテ
ンプレートパターンを容易しておかなくても、入力者が
意図した入力文のテンプレートパターンと同一のテンプ
レートパターンを、模範解答用の最適テンプレートパタ
ーンとして得ることが可能となる。
明する。図1は、本発明の実施の一形態に係る最適テン
プレートパターン探索装置を示すもので、この装置は、
図2に示す模範解答用のテンプレート群を記憶するテン
プレート群記憶手段1、入力文を記憶する入力文記憶手
段2およびテンプレートパターン候補検索作手段3を備
えており、テンプレートパターン候補検索手段3は、後
に詳述するテンプレート群の各テンプレートブロックと
入力文とを比較し、テンプレート群から作成可能なすべ
てのテンプレートパターン候補を探索するようになって
いる。そして、探索された各テンプレートパターン候補
は、テンプレートパターン候補記憶手段4に記憶される
ようになっている。
に、単語・句からなる文章要素を任意数同列で包含する
複数のテンプレートブロックを備えており、これら各テ
ンプレートブロックは、文法規則に基づき上位のものか
ら順次配列されている。そして、このテンプレート群か
らは、上位のテンプレートブロック内の任意の文章要素
と、その下位のテンプレートブロック内の任意の文章要
素とを順次連結していくことにより、入力文に対応する
多数のテンプレートパターン候補を作成することができ
るようになっている。
には、『Japan has beautiful p
arksnationwide.』 『Japan is dotted with lov
elypublic gardens all ove
r thecountry.』等のテンプレートパター
ン候補を作成することができるようになっている。
参考にして、添削作業等で翻訳文の核になる要素が何で
あるかを、専門家の知識を用いて吟味し、模範解答を単
語・句からなる文章要素に分解するとともに、文法規則
上同順位の文章要素を任意数同列でまとめてテンプレー
トブロックを作り、各テンプレートブロックを、文法規
則に基づき上位のものから順次配列することにより構成
されている。
われた単語・句だけでなく、統語的または意味上誤用さ
れた単語・句も含めて作成されており、これにより、通
常考えられないような入力文に対しても、これに対応す
るテンプレートパターン候補を作成することができるよ
うになっている。
語には、図2に示すように、その重要度に応じたポイン
ト数のポイントが付与されており、このポイントは、図
1に示す単語ポイント数記憶手段5に、単語と関連付け
て記憶されるようになっている。
には、ほとんどの単語には、ポイント数「1」のポイン
トが付与されているが、『dotted』および『th
ere』には、他の単語の2倍のポイント数「2」のポ
イントが付与されているとともに、『nationwi
de』には、他の単語の3倍のポイント数「3」のポイ
ントが付与されている。すなわち、『dotted』,
『there』および『nationwide』は、他
の単語の2倍のあるいは3倍の重要度を有する重要単語
として設定されている。
訳文(入力文)を添削するような場合に、教師側が是非
学生に覚えて貰いたいと考えている文型を強調する等の
場合に設定されるのもので、この場合教師は、授業にお
いてこの文型を用いて翻訳するよう、学生を指導するで
あろうし、学生もこの文型を用いて例題を翻訳するよう
努力することが予想される。そして、学生がこの文型を
用いて翻訳してきた場合には、その添削も、この文型に
添ったテンプレートパターンを用いて評価してやること
が、翻訳文(入力文)を教師に提出した学生の意図に添
った評価となることは明らかである。
ように、学生がこの文型を用いて翻訳してきた場合に
は、この文型に添ったテンプレートパターンを、最適テ
ンプレートパターンとして選択できるようにしている。
『dotted』,『there』および『natio
nwide』が、重要単語として設定されているが、す
べての単語のポイント数を「1」にしてもよい。
トパターン候補は、図1に示すように、一致単語検索手
段6において、入力文と一致する単語が検索されるよう
になっており、また合計ポイント数演算手段7において
は、各テンプレートパターン候補で用いられているすべ
ての単語の合計ポイント数が演算されるとともに、一致
単語ポイント数演算手段8においては、入力文と各テン
プレートパターン候補との間での一致単語の合計ポイン
ト数が演算されるようになっている。そして、これら両
合計ポイント数は、最適度比較値演算手段9において比
較され、各テンプレートパターン候補の最適度比較値が
演算されるようになっている。
ては、各テンプレートパターン候補における全単語の合
計ポイント数を分母とするとともに、各テンプレートパ
ターン候補における入力文との一致単語の合計ポイント
数を分子とすることにより、最適度比較値が演算される
ようになっており、各テンプレートパターン候補の最適
度比較値は、図1に示すように、最適テンプレートパタ
ーン判定手段10において相互に比較され、分子が最大
となる最適度比較値のうちで、最も大きな最適度比較値
を有するテンプレートパターン候補が、最適テンプレー
トパターンと判定されるようになっている。そして、一
致単語の合計ポイント数のみならず、各テンプレートパ
ターン候補における全単語の合計ポイント数をも考慮さ
れるので、入力文により類似したテンプレートパターン
候補が最適テンプレートとして決定されるようになって
いる。
索装置における最適テンプレートパターンの探索方法を
示す流れ図であり、以下これについて説明する。
プレート群が予め用意され、ステップS1においてこの
テンプレート群を読込む。このテンプレート群は通常、
FSA(有限状態オートマトン)を使用してコンピュー
タに組込み格納される。
ート群中のすべての単語にその重要度に応じたポイント
数で付与されているポイントを読込む。
読込みを行なうとともに、ステップS4において、入力
文の解析を行なう。
前記例のような和文英訳の場合であれば、前述の特開平
9−325673号公報に示されているように、基本的
用法が正しく履行されているか否かを調べるためのキー
パターンによるキーパターンチェック、入力文のすべて
の単語に対し内蔵する辞書を用いて行なわれる品詞分
類、および構文解析プログラムによる構文解析が順次行
なわれることになる。
ート群の各テンプレートブロックと入力文とを比較し、
作成可能なすべてのテンプレートパターン候補を検索す
る。
の各単語が、各テンプレートパターン候補中のどの単語
と一致するかを検索するとともに、ステップS7におい
て、一致した単語の合計のポイント数を各テンプレート
パターン候補毎に演算する。
レートパターン候補で用いられているすべての単語の合
計ポイント数を各テンプレートパターン候補毎に演算す
るとともに、ステップS9において、各テンプレートパ
ターン候補の最適度比較値をそれぞれ演算する。
プS8で求められた合計ポイント数を分母,ステップS
7で求められた一致単語ポイント数を分子とすることに
より求められる。すなわち、一致単語ポイント数を合計
ポイント数で除すことにより求められる。
プレートパターン候補の最適度比較値を比較し、ステッ
プS7で求められた一致単語ポイント数が最大となる最
適度比較値のうちで、最適度比較値が最も大きくなるテ
ンプレートパターンを、最適テンプレートパターンと判
定する。
い庭が多い。』であり、これに対し学生(入力者)の翻
訳文(入力文)が、『In Japan , are
dotted with lovelypublic
gardens nationwide.』であったと
すると、本発明においては、図2に示すテンプレート群
から作成可能な多数のテンプレートパターン候補の中か
ら、『Japan is dotted with l
ovelypublic gardens natio
nwide.』が最適テンプレートパターンとして決定
される。
pan , are dotted with』の部分
に対して、図2に示すテンプレート群から作成可能な多
数のテンプレート候補の中から、どのようにして最適テ
ンプレートパターンが決定されるのかにつき具体的に説
明する。
dotted with』という入力文に対して、図2
に示すテンプレート群から、『Japan is do
tted with』と、『In Japan , t
here are』とがテンプレートパターン候補とし
て作成されるものとすると、図4に示すような有向グラ
フが得られる。
1,N2,N3,N4,N6,N7,N8,N9,N5
とソート済みであることを前提とした上で、各ノードと
入力文とのマッチングを行なう。
印(N1,N2)すなわち『Japan』、矢印(N
1,N6)すなわち『In』、矢印(N2,N3)すな
わち『is』、矢印(N3,N4)すなわち『dott
ed』、矢印(N4,N5)すなわち『with』、矢
印(N6,N7)すなわち『Japan』、矢印(N
7,N8)すなわち『,』、矢印(N8,N9)すなわ
ち『there』、および矢印(N9,N5)すなわち
『are』と、入力文中の各単語とのマッチングが順次
行なわれる。
ッチングについて、図6を参照して説明する。 (1) 矢印(N1,N2)と入力文の『In』とを照
合すると、両者は等しくないので、項目(N2,“I
n”)の値および項目(N1,“In”)の値をチェッ
クし、両者は共に0であることから、項目(N2,“I
n”)はそのままとし、バックリンクも同様にそのまま
とする(項目(N1,“In”)のバックリンクは当初
設定されていないので、この時点で(N1,“In”)
に設定する)。図6の表中における矢印がバックリンク
である。
理由で設定されるものである。すなわち、このマッチン
グ方法では、図4に示す始端ノードN1から終端ノード
N5までのすべてのマッチング作業を完了しなければ、
最適テンプレートパターンがどの経路の文字列なのか判
明しない。具体的には、図4の終端ノードN5まで作業
を完了した時点で、矢印(N4,N5)側が最適テンプ
レートパターンであると判明した場合、ノードN4は、
N4→N3→N2→N1の経路を辿って始端ノードN1
に至る文字列であることが判る必要がある。この経路を
示すものがバックリンクである。
『Japan』とを照合する。すると、両者は等しいの
で、項目(N2,“Japan”)の値(=0)、項目
(N2,“In”)の値(=0)、項目(N1,“Ja
pan”)の値(=0)、および(項目(N1,“I
n”)+1の値(=1、ここで+1は図4の“Japa
n”のポイント数を加えることを意味する。)をチェッ
クし、そのうちの最大値を選択して項目(N2,“Ja
pan”)の値とする。この数字は、前記最適度比較値
を求める際の分子の数字として用いられるもので、これ
により、項目(N2,“Japan”)=1となり、バ
ックリンクは、最大値として選択した項目(N1,“I
n”)にリンクされる(ここで、N1は矢印(N1,N
2)の始端ノードである)。なお、図6に示す表におい
て、N2の行の各升目の右下に記している数字「1」
は、図4の始端ノードN1からノードN2までに含まれ
る単語の合計のポイント数を表わし、この数字は、前記
最適度比較値を求める際の分母の数字として用いられ
る。
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N2,“,”)の値(=0)、項目(N2,
“Japan”)の値(=1)、および(項目(N1,
“,”)値(=0)をチェックし、そのうちの最大値を
選択する。したがって、項目(N2,“,”)=1とな
り、バックリンクは、最大値として選択した項目(N
2,“Japan”)にリンクされる。
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N2,“are”)の値(=0)、項目
(N2,“,”)の値(=1)、および(項目(N1,
“are”)値(=0)をチェックし、そのうちの最大
値を選択する。したがって、項目(N2,“are”)
=1となり、バックリンクは、最大値として選択した項
目(N2,“,”)にリンクされる。
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N2,“dotted”)の値
(=0)、項目(N2,“are”)の値(=1)、お
よび(項目(N1,“dotted”)値(=0)をチ
ェックし、そのうちの最大値を選択する。したがって、
項目(N2,“dotted”)=1となり、バックリ
ンクは、最大値として選択した項目(N2,“ar
e”)にリンクされる。
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N2,“with”)の値(=0)、
項目(N2,“dotted”)の値(=1)、および
(項目(N1,“with”)値(=0)をチェック
し、そのうちの最大値を選択する。したがって、項目
(N2,“with”)=1となり、バックリンクは、
最大値として選択した項目(N2,“dotted”)
にリンクされる。
ッチングについて、図7を参照して説明する。 (1) まず、矢印(N1,N6)と入力文の『In』
とを照合すると、両者は等しいので、項目(N6,“I
n”)の値(=0)、および項目(N1,“In”)+
1の値(=1、ここで+1は図4の“In”のポイント
数を加えることを意味する。)をチェックし、そのうち
の最大値を選択して項目(N6,“In”)の値とす
る。これにより、項目(N6,“In”)=1となり、
バックリンクは、最大値として選択した項目(N1,
“In”)にリンクされる。なお、図7に示す表におい
て、N6の行の各升目の右下に記している数字「1」
は、図4の始端ノードN1からノードN6までに含まれ
る単語の合計のポイント数,すなわち『In』のポイン
ト数である。
文の『Japan』とを照合する。すると、両者は等し
くないので、項目(N6,“Japan”)の値(=
0)、項目(N6,“In”)の値(=1)、および
(項目(N1,“Japan”)値(=0)をチェック
し、そのうちの最大値を選択する。したがって、項目
(N6,“Japan”)=1となり、バックリンク
は、最大値として選択した項目(N6,“In”)にリ
ンクされる。
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N6,“,”)の値(=0)、項目(N6,
“Japan”)の値(=1)、および(項目(N1,
“,”)値(=0)をチェックし、そのうちの最大値を
選択する。したがって、項目(N6,“,”)=1とな
り、バックリンクは、最大値として選択した項目(N
6,“Japan”)にリンクされる。
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N6,“are”)の値(=0)、項目
(N6,“,”)の値(=1)、および(項目(N1,
“are”)値(=0)をチェックし、そのうちの最大
値を選択する。したがって、項目(N6,“are”)
=1となり、バックリンクは、最大値として選択した項
目(N6,“,”)にリンクされる。
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N6,“dotted”)の値
(=0)、項目(N6,“are”)の値(=1)、お
よび項目(N1,“dotted”)値(=0)をチェ
ックし、そのうちの最大値を選択する。したがって、項
目(N6,“dotted”)=1となり、バックリン
クは、最大値として選択した項目(N6,“are”)
にリンクされる。
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N6,“with”)の値(=0)、
項目(N6,“dotted”)の値(=1)、および
項目(N1,“with”)値(=0)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
6,“with”)=1となり、バックリンクは、最大
値として選択した項目(N6,“dotted”)にリ
ンクされる。
ッチングについて、図8を参照して説明する。 (1) まず、矢印(N2,N3)と入力文の『In』
とを照合すると、両者は等しくないので、項目(N3,
“In”)の値および項目(N2,“In”)をチェッ
クし、両者は共に0であるので、項目(N3,“I
n”)はそのままとし、バックリンクもそのままとす
る。なお、図8に示す表において、N3の行の各升目の
右下に記している数字「2」は、図4の始端ノードN1
からノードN3までに含まれる単語の合計のポイント
数,すなわち『Japan』および『is』の合計のポ
イント数である。
文の『Japan』とを照合する。すると、両者は等し
くないので、項目(N3,“Japan”)の値(=
0)、項目(N3,“In”)の値(=0)、および項
目(N2,“Japan”)値(=1)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
3,“Japan”)=1となり、バックリンクは、最
大値として選択した項目(N2,“Japan”)にリ
ンクされる。
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N3,“,”)の値(=0)、項目(N3,
“Japan”)の値(=1)、および項目(N
2,“,”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N3,“,”)=1
となり、バックリンクは、最大値として選択した項目
(N3,“Japan”)にリンクされる。
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N3,“are”)の値(=0)、項目
(N3,“,”)の値(=1)、および項目(N2,
“are”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N3,“are”)
=1となり、バックリンクは、最大値として選択した項
目(N3,“,”)にリンクされる。
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N3,“dotted”)の値
(=0)、項目(N3,“are”)の値(=1)、お
よび項目(N2,“dotted”)値(=1)をチェ
ックし、そのうちの最大値を選択する。したがって、項
目(N3,“dotted”)=1となり、バックリン
クは、最大値として選択した項目(N3,“are”)
にリンクされる。
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N3,“with”)の値(=0)、
項目(N3,“dotted”)の値(=1)、および
項目(N2,“with”)値(=1)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
3,“with”)=1となり、バックリンクは、最大
値として選択した項目(N3,“dotted”)にリ
ンクされる。
ッチングについて、図9を参照して説明する。 (1) まず、矢印(N3,N4)と入力文の『In』
とを照合すると、両者は等しくないので、項目(N4,
“In”)の値および項目(N3,“In”)の値をチ
ェックし、両者は共に0であるので、項目(N4,“I
n”)はそのままとし、バックリンクもそのままとす
る。なお、図9に示す表において、N4の行の各升目の
右下に記している数字「4」は、図4の始端ノードN1
からノードN4までに含まれる単語,すなわち『Jap
an』,『is』および『dotted』の合計のポイ
ント数である。
文の『Japan』とを照合する。すると、両者は等し
くないので、項目(N4,“Japan”)の値(=
0)、項目(N4,“In”)の値(=0)、および項
目(N3,“Japan”)値(=1)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
4,“Japan”)=1となり、バックリンクは、最
大値として選択した項目(N3,“Japan”)にリ
ンクされる。
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N4,“,”)の値(=0)、項目(N4,
“Japan”)の値(=1)、および項目(N
3,“,”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N4,“,”)=1
となり、バックリンクは、最大値として選択した項目
(N4,“Japan”)にリンクされる。
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N4,“are”)の値(=0)、項目
(N4,“,”)の値(=1)、および項目(N3,
“are”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N4,“are”)
=1となり、バックリンクは、最大値として選択した項
目(N4,“,”)にリンクされる。
文の『dotted』とを照合する。すると、両者は等
しいので、項目(N4,“dotted”)の値(=
0)、項目(N4,“are”)の値(=1)、項目
(N3,“dotted”)値(=1)、および項目
(N3,“are”)+2の値(=3、ここで+2は図
4の“dotted”のポイント数を加えることを意味
する。)をチェックし、その最大値を選択する。したが
って、項目(N4,“dotted”)=3となり、バ
ックリンクは、最大値として選択した項目(N3,“a
re”)にリンクされる。
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N4,“with”)の値(=0)、
項目(N4,“dotted”)の値(=3)、および
項目(N3,“with”)の値(=1)をチェック
し、そのうちの最大値を選択する。したがって、項目
(N4,“with”)=3となり、バックリンクは、
最大値として選択した項目(N4,“dotted”)
にリンクされる。
ッチングについて、図10を参照して説明する。 (1) まず、矢印(N4,N5)と入力文の『In』
とを照合すると、両者は等しくないので、項目(N5,
“In”)の値および項目(N4,“In”)の値をチ
ェックし、両者は共に0であるので、項目(N5,“I
n”)はそのままとし、バックリンクもそのままとす
る。なお、図10に示す表において、N5の行の各升目
の右下に記している数字「5」は、図4の始端ノードN
1からノードN5までの上側の文字列に含まれる単語,
すなわち『Japan』,『is』,『dotted』
および『with』の合計のポイント数である。
文の『Japan』とを照合する。すると、両者は等し
くないので、項目(N5,“Japan”)の値(=
0)、項目(N5,“In”)の値(=0)、および項
目(N4,“Japan”)値(=1)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
5,“Japan”)=1となり、バックリンクは、最
大値として選択した項目(N4,“Japan”)にリ
ンクされる。
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N5,“,”)の値(=0)、項目(N5,
“Japan”)の値(=1)、および項目(N
4,“,”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N5,“,”)=1
となり、バックリンクは、最大値として選択した項目
(N5,“Japan”)にリンクされる。
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N5,“are”)の値(=0)、項目
(N5,“,”)の値(=1)、および項目(N4,
“are”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N5,“are”)
=1となり、バックリンクは、最大値として選択した項
目(N5,“,”)にリンクされる。
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N5,“dotted”)の値
(=0)、項目(N5,“are”)の値(=1)、お
よび項目(N4,“dotted”)値(=3)をチェ
ックし、そのうちの最大値を選択する。したがって、項
目(N5,“dotted”)=3となり、バックリン
クは、最大値として選択した項目(N4,“dotte
d”)にリンクされる。
文の『with』とを照合する。すると、両者は等しい
ので、項目(N5,“with”)の値(=0)、項目
(N5,“dotted”)の値(=3)、項目(N
4,“with”)の値(=3)、および項目(N4,
“dotted”)+1の値(=4、ここで+1は図4
の“with”のポイント数を加えることを意味す
る。)をチェックし、そのうちの最大値を選択する。し
たがって、項目(N5,“with”)=4となり、バ
ックリンクは、最大値として選択した項目(N4,“d
otted”)にリンクされる。
ッチングについて、図11を参照して説明する。 (1) まず、矢印(N6,N7)と入力文の『In』
とを照合すると、両者は等しくないので、項目(N7,
“In”)の値(=0)と項目(N6,“In”)の値
(=1)とをチェックし、そのうちの大きい方の値を選
択する。したがって、項目(N7,“In”)=1とな
り、バックリンクは、選択した項目(N6,“In”)
にリンクされる。なお、図11に示す表において、N7
の行の各升目の右下に記している数字「2」は、図4の
始端ノードN1からノードN7までに含まれる単語,す
なわち『In』および『Japan』の合計のポイント
数である。
文の『Japan』とを照合する。すると、両者は等し
いので、項目(N7,“Japan”)の値(=0)、
項目(N7,“In”)の値(=0)、項目(N6,
“Japan”)値(=1)、および項目(N6,“I
n”)+1の値(=2、ここで+1は図4の“Japa
n”のポイント数を加えることを意味する。)をチェッ
クし、そのうちの最大値を選択する。したがって、項目
(N7,“Japan”)=2となり、バックリンク
は、最大値として選択した項目(N6,“In”)にリ
ンクされる。
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N7,“,”)の値(=0)、項目(N7,
“Japan”)の値(=2)、および項目(N
6,“,”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N7,“,”)=2
となり、バックリンクは、最大値として選択した項目
(N7,“Japan”)にリンクされる。
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N7,“are”)の値(=0)、項目
(N7,“,”)の値(=2)、および項目(N6,
“are”)値(=1)をチェックし、そのうちの最大
値を選択する。したがって、項目(N7,“are”)
=2となり、バックリンクは、最大値として選択した項
目(N7,“,”)にリンクされる。
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N7,“dotted”)の値
(=0)、項目(N7,“are”)の値(=2)、お
よび項目(N6,“dotted”)値(=1)をチェ
ックし、そのうちの最大値を選択する。したがって、項
目(N7,“dotted”)=2となり、バックリン
クは、最大値として選択した項目(N7,“are”)
にリンクされる。
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N7,“with”)の値(=0)、
項目(N7,“dotted”)の値(=2)、および
項目(N6,“with”)値(=1)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
7,“with”)=2となり、バックリンクは、最大
値として選択した項目(N7,“dotted”)にリ
ンクされる。
ッチングについて、図12を参照して説明する。 (1) まず、矢印(N7,N8)と入力文の『In』
とを照合すると、両者は等しくないので、項目(N8,
“In”)の値(=0)と項目(N7,“In”)の値
(=1)とをチェックし、そのうちの大きい方の値を選
択する。したがって、項目(N8,“In”)=1とな
り、バックリンクは、選択した項目(N7“In”)に
リンクされる。なお、図12に示す表において、N8の
行の各升目の右下に記している数字「3」は、図4の始
端ノードN1からノードN8までに含まれる単語,すな
わち『In』,『Japan』および『,』の合計のポ
イント数である。
文の『Japan』とを照合する。すると、両者は等し
くないので、項目(N8,“Japan”)の値(=
0)、項目(N8,“In”)の値(=1)、および項
目(N7,“Japan”)値(=2)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
8,“Japan”)=2となり、バックリンクは、最
大値として選択した項目(N7,“Japan”)にリ
ンクされる。
文の『,』とを照合する。すると、両者は等しいので、
項目(N8,“,”)の値(=0)、項目(N8,“J
apan”)の値(=2)、項目(N7,“,”)の値
(=2)、および項目(N7,“Japan”)+1の
値(=3、ここで+1は図4の“,”のポイント数を加
えることを意味する。)をチェックし、そのうちの最大
値を選択する。したがって、項目(N8,“,”)=3
となり、バックリンクは、最大値として選択した項目
(N7,“Japan”)にリンクされる。
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N8,“are”)の値(=0)、項目
(N8,“,”)の値(=3)、および項目(N7,
“are”)値(=2)をチェックし、そのうちの最大
値を選択する。したがって、項目(N8,“are”)
=3となり、バックリンクは、最大値として選択した項
目(N8,“,”)にリンクされる。
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N8,“dotted”)の値
(=0)、項目(N8,“are”)の値(=3)、お
よび項目(N7,“dotted”)値(=2)をチェ
ックし、そのうちの最大値を選択する。したがって、項
目(N8,“dotted”)=3となり、バックリン
クは、最大値として選択した項目(N8,“are”)
にリンクされる。
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N8,“with”)の値(=0)、
項目(N8,“dotted”)の値(=3)、および
項目(N7,“with”)値(=2)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
8,“with”)=3となり、バックリンクは、最大
値として選択した項目(N8,“dotted”)にリ
ンクされる。
ッチングについて、図13を参照して説明する。 (1) まず、矢印(N8,N9)と入力文の『In』
とを照合すると、両者は等しくないので、項目(N9,
“In”)の値(=0)と項目(N8,“In”)の値
(=1)とをチェックし、そのうちの大きい方の値を選
択する。したがって、項目(N9,“In”)=1とな
り、バックリンクは、選択した項目(N8“In”)に
リンクされる。なお、図13に示す表において、N9の
行の各升目の右下に記している数字「5」は、図4の始
端ノードN1からノードN9までに含まれる単語,すな
わち『In』,『Japan』『,』および『ther
e』の合計ポイント数である。
文の『Japan』とを照合する。すると、両者は等し
くないので、項目(N9,“Japan”)の値(=
0)、項目(N9,“In”)の値(=1)、および項
目(N8,“Japan”)値(=2)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
9,“Japan”)=2となり、バックリンクは、最
大値として選択した項目(N8,“Japan”)にリ
ンクされる。
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N9,“,”)の値(=0)、項目(N9,
“Japan”)の値(=2)、および項目(N
8,“,”)値(=3)をチェックし、そのうちの最大
値を選択する。したがって、項目(N9,“,”)=3
となり、バックリンクは、最大値として選択した項目
(N8,“,”)にリンクされる。
文の『are』とを照合する。すると、両者は等しくな
いので、項目(N9,“are”)の値(=0)、項目
(N9,“,”)の値(=3)、および項目(N8,
“are”)値(=3)をチェックし、そのうちの最大
値を選択する。したがって、項目(N9,“are”)
=3となり、バックリンクは、最大値として選択した項
目(N9,“,”)にリンクされる。
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N9,“dotted”)の値
(=0)、項目(N9,“are”)の値(=3)、お
よび項目(N8,“dotted”)値(=3)をチェ
ックし、そのうちの最大値を選択する。したがって、項
目(N9,“dotted”)=3となり、バックリン
クは、最大値として選択した項目(N9,“are”)
にリンクされる。
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N9,“with”)の値(=0)、
項目(N9,“dotted”)の値(=3)、および
項目(N8,“with”)値(=3)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
9,“with”)=3となり、バックリンクは、最大
値として選択した項目(N9,“dotted”)にリ
ンクされる。
ッチングについて、図14を参照して説明する。 (1) まず、矢印(N9,N5)と入力文の『In』
とを照合すると、両者は等しくないので、項目(N9,
“In”)の値(=0)と項目(N9,“In”)の値
(=1)とをチェックし、そのうちの大きい方の値を選
択する。したがって、項目(N5,“In”)=1とな
り、バックリンクは、選択した項目(N9“In”)に
リンクされ、バックリンクが変更される。なお、図14
に示す表において、N5の行の第1列目から第5列目の
各升目の右下に記している数字「6」は、図4の始端ノ
ードN1からノードN5までの下側の文字列に含まれる
単語,すなわち『In』,『Japan』『,』『th
ere』および『are』の合計ポイント数である。こ
こで、N5の行の第6列目の升目の右下に記している数
字は、「6」ではなく「5」のままであるが、その理由
については後に詳述する。
文の『Japan』とを照合する。すると、両者は等し
くないので、項目(N5,“Japan”)の値(=
1)、項目(N5,“In”)の値(=1)、および項
目(N9,“Japan”)値(=2)をチェックし、
そのうちの最大値を選択する。したがって、項目(N
5,“Japan”)=2となり、バックリンクは、最
大値として選択した項目(N9,“Japan”)にリ
ンクされ、バックリンクが変更される。
文の『,』とを照合する。すると、両者は等しくないの
で、項目(N5,“In”)の値(=1)、項目(N
5,“Japan”)の値(=2)、および項目(N
9,“,”)値(=3)をチェックし、そのうちの最大
値を選択する。したがって、項目(N5,“,”)=3
となり、バックリンクは、最大値として選択した項目
(N9,“,”)にリンクされ,バックリンクが変更さ
れる。
文の『are』とを照合する。すると、両者は等しいの
で、項目(N5,“are”)の値(=1)、項目(N
5,“,”)の値(=3)、項目(N9,“are”)
値(=3)、および項目(N9,“,”)+1の値(=
4、ここで+1は図4の“are”のポイント数を加え
ることを意味する。)をチェックし、そのうちの最大値
を選択する。したがって、項目(N5,“are”)=
4となり、バックリンクは、最大値として選択した項目
(N9,“,”)にリンクされ、バックリンクが変更さ
れる。
文の『dotted』とを照合する。すると、両者は等
しくないので、項目(N5,“dotted”)の値
(=3)、項目(N5,“are”)の値(=4)、お
よび項目(N9,“dotted”)値(=3)をチェ
ックし、そのうちの最大値を選択する。したがって、項
目(N5,“dotted”)=4となり、バックリン
クは、最大値として選択した項目(N5,“are”)
にリンクされ、バックリンクが変更される。
文の『with』とを照合する。すると、両者は等しく
ないので、項目(N5,“with”)の値(=4)、
項目(N5,“dotted”)の値(=4)、および
項目(N9,“with”)値(=3)をチェックす
る。
の値(=4)が最大値である場合には、N5の行の第1
列から第5列までの場合と同様、バックリンクが変更さ
れ、各升目の右下に記している数字も、変更された文字
列の合計ポイント数である「6」に変更されることにな
る。
d”)の値(=4)と、元の項目(N5,“wit
h”)の値(=4)とは同一値である。そしてこの場合
には、バックリンクを変更することにより、N5の行の
升目の右下に記している数字が小さくなる場合を除き、
バックリンクの変更は行なわない。したがって、項目
(N5,“with”)=4となり、バックリンクは、
項目(N4,“dotted”)にリンクされたままの
状態が保持され、升目の右下に記している数字も、図4
の上側の文字列の合計ポイント数である「5」のままの
状態が保持される。
に示す上側の文字列の最適度比較値が4/5で、下側の
文字列の最適度比較値が4/6となり、上側の文字列が
入力文に対する最適テンプレートパターンとして決定さ
れることになる。
ンが決定されたならば、図3のステップS11におい
て、入力文を最適テンプレートパターンと同様のテンプ
レートに分解するとともに、ステップS12において、
入力文の添削を行なう。この添削方法は、前述の特開平
9−325673号公報に示されている添削方法と同一
である。
ーンを予め用意せず、入力文に合わせてその都度これに
適したテンプレートパターンを作成するようにしている
ので、どのような入力文に対しても、これに最も適した
模範解答用のテンプレートパターンを得ることができ
る。
英訳の添削を例に採って説明したが、英文和訳の場合
や、他の言語間の翻訳の場合にも同様に適用でき、また
前述のように、インターネット等を利用した情報検索シ
ステムにおいて、入力文に基づき所定の情報を検索する
ような場合に、自然言語文章からなる複合情報を持つテ
ンプレートパターンを検索キーとして使用することによ
り、同様に適用することができる。
文章要素を同列で包含する複数のテンプレートブロック
を文法規則に基づき上位のものから順次配列して構成さ
れる模範解答用のテンプレート群を予め用意し、このテ
ンプレート群から作成可能なすべてのテンプレートパタ
ーン候補の中から、入力文に最も適したテンプレートパ
ターン候補を探索する最適テンプレートパターン探索方
法であって、前記テンプレート群中のすべての単語に、
その重要度に応じたポイント数のポイントを付与した
後、前記すべてのテンプレートパターン候補について、
各テンプレートパターン候補で用いられているすべての
単語の合計ポイント数を分母,入力文と各テンプレート
パターン候補との間での一致単語の合計ポイント数を分
子とする最適度比較値を求め、分子が最大となる最適度
比較値のうちで、最適度比較値が最も大きくなるテンプ
レートパターン候補を、最適テンプレートパターンと判
定するようにしているので、どのような入力文であって
も、入力者が意図した入力文のテンプレートパターンと
同一のテンプレートパターンを、模範解答用の最適テン
プレートパターンとして得ることができる。
包含する複数のテンプレートブロックを文法規則に基づ
き上位のものから順次配列して構成される模範解答用の
テンプレート群を記憶するテンプレート群記憶手段と;
入力文を記憶する入力文記憶手段と;前記テンプレート
群の各テンプレートブロックと入力文とを比較し、テン
プレート群から作成可能なすべてのテンプレートパター
ン候補を探索するテンプレートパターン候補検索手段
と;検索されたテンプレートパターン候補を記憶するテ
ンプレートパターン候補記憶手段と;テンプレート群中
のすべての単語にその重要度に応じたポイント数で付与
されるポイントを、単語と関連付けて記憶する単語ポイ
ント数記憶手段と;各テンプレートパターン候補におい
て入力文と一致する単語を検索する一致単語検索手段
と;各テンプレートパターン候補で用いられているすべ
ての単語の合計ポイント数を演算する合計ポイント数演
算手段と;入力文と各テンプレートパターン候補との間
での一致単語の合計ポイント数を演算する一致単語ポイ
ント数演算手段と;各テンプレートパターン候補におけ
る全単語の合計ポイント数を分母,各テンプレートパタ
ーン候補における入力文との一致単語の合計ポイント数
を分子とする最適度比較値を演算する最適度比較値演算
手段と;各テンプレートパターン候補の最適度比較値を
比較し、分子が最大となる最適度比較値のうちで、最も
大きな最適度比較値を有するテンプレートパターン候補
を最適テンプレートパターンと判定する最適テンプレー
トパターン判定手段と;を設けるようにしているので、
どのような入力文であっても、これに対応するテンプレ
ートパターン候補を得ることができる。また、複数のテ
ンプレートパターン候補の中から最適テンプレートパタ
ーンを得る際には、最適度比較値を比較して判定するよ
うにしているので、最適テンプレートパターンが複数出
てくるといった不具合を、ほぼ完全に防止することがで
きる。
で包含する複数のテンプレートブロックを文法規則に基
づき上位のものから順次配列して構成される模範解答用
のテンプレ群を、メモリ領域に記憶させる処理;入力文
をメモリ領域に記憶させる処理;前記テンプレート群中
のすべての単語に対し、その重要度に応じたポイント数
で付与されたポイントを、単語と関連付けてメモリ領域
に記憶させる処理;前記テンプレート群から作成可能な
すべてのテンプレートパターン候補について、各テンプ
レートパターン候補で用いられているすべての単語の合
計ポイント数を分母,入力文と各テンプレートパターン
候補との間での一致単語の合計ポイント数を分子とする
最適度比較値を用い、分子が最大となる最適度比較値の
うちで、最適度比較値が最も大きくなるテンプレートパ
ターン候補を、最適テンプレートパターンと判定する処
理;をコンピュータに実行させるようにしているので、
予め模範解答用のテンプレートパターンを用意しておか
なくても、入力者が意図した入力文のテンプレートパタ
ーンと同一のテンプレートパターンを、模範解答用の最
適テンプレートパターンとして得ることができる。
パターン探索装置を示す全体構成図である。
を示す説明図である。
索方法を示す流れ図である。
う際の初期状態を示す表である。
示す表である。
示す表である。
示す表である。
示す表である。
を示す表である。
を示す表である。
を示す表である。
を示す表である。
を示す表である。
Claims (3)
- 【請求項1】 任意数の文章要素を同列で包含する複数
のテンプレートブロックを文法規則に基づき上位のもの
から順次配列して構成される模範解答用のテンプレート
群を予め用意し、このテンプレート群から作成可能なす
べてのテンプレートパターン候補の中から、入力文に最
も適したテンプレートパターン候補を探索する最適テン
プレートパターン探索方法であって、前記テンプレート
群中のすべての単語に、その重要度に応じたポイント数
のポイントを付与した後、前記すべてのテンプレートパ
ターン候補について、各テンプレートパターン候補で用
いられているすべての単語の合計ポイント数を分母,入
力文と各テンプレートパターン候補との間での一致単語
の合計ポイント数を分子とする最適度比較値を求め、分
子が最大となる最適度比較値のうちで、最適度比較値が
最も大きくなるテンプレートパターン候補を、最適テン
プレートパターンと判定することを特徴とする最適テン
プレートパターン探索方法。 - 【請求項2】 任意数の文章要素を同列で包含する複数
のテンプレートブロックを文法規則に基づき上位のもの
から順次配列して構成される模範解答用のテンプレート
群を記憶するテンプレート群記憶手段と;入力文を記憶
する入力文記憶手段と;前記テンプレート群の各テンプ
レートブロックと入力文とを比較し、テンプレート群か
ら作成可能なすべてのテンプレートパターン候補を探索
するテンプレートパターン候補検索手段と;検索された
テンプレートパターン候補を記憶するテンプレートパタ
ーン候補記憶手段と;テンプレート群中のすべての単語
にその重要度に応じたポイント数で付与されるポイント
を、単語と関連付けて記憶する単語ポイント数記憶手段
と;各テンプレートパターン候補において入力文と一致
する単語を検索する一致単語検索手段と;各テンプレー
トパターン候補で用いられているすべての単語の合計ポ
イント数を演算する合計ポイント数演算手段と;入力文
と各テンプレートパターン候補との間での一致単語の合
計ポイント数を演算する一致単語ポイント数演算手段
と;各テンプレートパターン候補における全単語の合計
ポイント数を分母,各テンプレートパターン候補におけ
る入力文との一致単語の合計ポイント数を分子とする最
適度比較値を演算する最適度比較値演算手段と;各テン
プレートパターン候補の最適度比較値を比較し、分子が
最大となる最適度比較値のうちで、最も大きな最適度比
較値を有するテンプレートパターン候補を最適テンプレ
ートパターンと判定する最適テンプレートパターン判定
手段と;を具備することを特徴とする最適テンプレート
パターン探索装置。 - 【請求項3】 任意数の文章要素を同列で包含する複数
のテンプレートブロックを文法規則に基づき上位のもの
から順次配列して構成される模範解答用のテンプレ群
を、メモリ領域に記憶させる処理;入力文をメモリ領域
に記憶させる処理;前記テンプレート群中のすべての単
語に対し、その重要度に応じたポイント数で付与された
ポイントを、単語と関連付けてメモリ領域に記憶させる
処理;前記テンプレート群から作成可能なすべてのテン
プレートパターン候補について、各テンプレートパター
ン候補で用いられているすべての単語の合計ポイント数
を分母,入力文と各テンプレートパターン候補との間で
の一致単語の合計ポイント数を分子とする最適度比較値
を用い、分子が最大となる最適度比較値のうちで、最適
度比較値が最も大きくなるテンプレートパターン候補
を、最適テンプレートパターンと判定する処理;をコン
ピュータに実行させるためのプログラムを記録したコン
ピュータ読取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18248099A JP3669870B2 (ja) | 1999-06-28 | 1999-06-28 | 最適テンプレートパターン探索方法,探索装置および記録媒体 |
US09/597,270 US6804637B1 (en) | 1999-06-28 | 2000-06-20 | Method, apparatus, and recording medium for retrieving optimum template pattern |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18248099A JP3669870B2 (ja) | 1999-06-28 | 1999-06-28 | 最適テンプレートパターン探索方法,探索装置および記録媒体 |
US09/597,270 US6804637B1 (en) | 1999-06-28 | 2000-06-20 | Method, apparatus, and recording medium for retrieving optimum template pattern |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001013863A true JP2001013863A (ja) | 2001-01-19 |
JP3669870B2 JP3669870B2 (ja) | 2005-07-13 |
Family
ID=33492323
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP18248099A Expired - Fee Related JP3669870B2 (ja) | 1999-06-28 | 1999-06-28 | 最適テンプレートパターン探索方法,探索装置および記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6804637B1 (ja) |
JP (1) | JP3669870B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009129032A (ja) * | 2007-11-20 | 2009-06-11 | Fuji Xerox Co Ltd | 翻訳装置及び翻訳プログラム |
JP2010152420A (ja) * | 2008-12-23 | 2010-07-08 | Fuji Xerox Co Ltd | 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4574047B2 (ja) * | 2001-03-30 | 2010-11-04 | 富士通株式会社 | 訳例辞書を用いて翻訳を行う機械翻訳装置およびプログラム |
US7013262B2 (en) * | 2002-02-12 | 2006-03-14 | Sunflare Co., Ltd | System and method for accurate grammar analysis using a learners' model and part-of-speech tagged (POST) parser |
US6988063B2 (en) * | 2002-02-12 | 2006-01-17 | Sunflare Co., Ltd. | System and method for accurate grammar analysis using a part-of-speech tagged (POST) parser and learners' model |
US7249012B2 (en) * | 2002-11-20 | 2007-07-24 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among phrases |
US7356457B2 (en) | 2003-02-28 | 2008-04-08 | Microsoft Corporation | Machine translation using learned word associations without referring to a multi-lingual human authored dictionary of content words |
US8666928B2 (en) * | 2005-08-01 | 2014-03-04 | Evi Technologies Limited | Knowledge repository |
US8340957B2 (en) * | 2006-08-31 | 2012-12-25 | Waggener Edstrom Worldwide, Inc. | Media content assessment and control systems |
US8271266B2 (en) * | 2006-08-31 | 2012-09-18 | Waggner Edstrom Worldwide, Inc. | Media content assessment and control systems |
US8838659B2 (en) | 2007-10-04 | 2014-09-16 | Amazon Technologies, Inc. | Enhanced knowledge repository |
EP2251798A1 (en) * | 2008-02-29 | 2010-11-17 | Sharp Kabushiki Kaisha | Information processing device, method, and program |
US9805089B2 (en) | 2009-02-10 | 2017-10-31 | Amazon Technologies, Inc. | Local business and product search system and method |
US9110882B2 (en) | 2010-05-14 | 2015-08-18 | Amazon Technologies, Inc. | Extracting structured knowledge from unstructured text |
US20150007181A1 (en) * | 2013-06-27 | 2015-01-01 | Xerox Corporation | Method and system for selecting task templates |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4507750A (en) * | 1982-05-13 | 1985-03-26 | Texas Instruments Incorporated | Electronic apparatus from a host language |
US4802231A (en) * | 1987-11-24 | 1989-01-31 | Elliot Davis | Pattern recognition error reduction system |
US5758257A (en) * | 1994-11-29 | 1998-05-26 | Herz; Frederick | System and method for scheduling broadcast of and access to video programs and other data using customer profiles |
JP2887660B2 (ja) | 1996-06-05 | 1999-04-26 | 株式会社サン・フレア | 翻訳文添削支援装置 |
-
1999
- 1999-06-28 JP JP18248099A patent/JP3669870B2/ja not_active Expired - Fee Related
-
2000
- 2000-06-20 US US09/597,270 patent/US6804637B1/en not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009129032A (ja) * | 2007-11-20 | 2009-06-11 | Fuji Xerox Co Ltd | 翻訳装置及び翻訳プログラム |
JP2010152420A (ja) * | 2008-12-23 | 2010-07-08 | Fuji Xerox Co Ltd | 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 |
Also Published As
Publication number | Publication date |
---|---|
US6804637B1 (en) | 2004-10-12 |
JP3669870B2 (ja) | 2005-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2640793B2 (ja) | 共起辞書構築装置及びこの共起辞書を用いた文解析装置 | |
JP2001013863A (ja) | 最適テンプレートパターン探索方法,探索装置および記録媒体 | |
CN108804428A (zh) | 一种译文中术语错译的纠正方法、系统及相关装置 | |
CN109766538B (zh) | 一种文本纠错方法、装置、电子设备以及存储介质 | |
US20080046405A1 (en) | Query speller | |
EP1145141A2 (en) | Spelling and grammar checking system | |
WO1999021105A1 (en) | Automatically recognizing the discourse structure of a body of text | |
WO2005022294A2 (en) | Method and apparatus for language processing | |
JPH05151260A (ja) | 翻訳テンプレート学習方法および翻訳テンプレート学習システム | |
JP2005518020A (ja) | 品詞タグ付き(post)パーサーおよび学習者モデルを使用した正確な文法分析のためのシステムおよび方法 | |
CN111061832A (zh) | 基于开放域信息抽取的人物行为抽取方法 | |
JP4502114B2 (ja) | データベース検索装置 | |
JP2004355204A (ja) | 自然言語処理装置、自然言語処理方法及び自然言語処理プログラム | |
US20030195740A1 (en) | Translation evaluation using optimum template pattern determination method | |
JP3669869B2 (ja) | 最適テンプレートパターンを用いた評価方法、評価装置および記録媒体 | |
JP3932350B2 (ja) | 言語変換処理統一システム | |
CN116360794A (zh) | 数据库语言解析方法、装置、计算机设备及存储介质 | |
CN112732885A (zh) | 用于问答系统的答案扩展方法、装置及电子设备 | |
JP2887660B2 (ja) | 翻訳文添削支援装置 | |
JPH07244665A (ja) | 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置 | |
Yamura-Takei et al. | Automatic linguistic analysis for language teachers: The case of zeros | |
WO1999021104A1 (en) | Automatically recognizing the discourse structure of a body of text | |
JP2005134691A (ja) | ネットワークを経由した教育システムの自動採点装置 | |
Angkawattanawit et al. | Thai q-cor: Integrating word approximation and soundex for thai query correction | |
JP3353647B2 (ja) | 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040323 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050412 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080422 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090422 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090422 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100422 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100422 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110422 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120422 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120422 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130422 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140422 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |