JP3669869B2 - 最適テンプレートパターンを用いた評価方法、評価装置および記録媒体 - Google Patents
最適テンプレートパターンを用いた評価方法、評価装置および記録媒体 Download PDFInfo
- Publication number
- JP3669869B2 JP3669869B2 JP18234799A JP18234799A JP3669869B2 JP 3669869 B2 JP3669869 B2 JP 3669869B2 JP 18234799 A JP18234799 A JP 18234799A JP 18234799 A JP18234799 A JP 18234799A JP 3669869 B2 JP3669869 B2 JP 3669869B2
- Authority
- JP
- Japan
- Prior art keywords
- template pattern
- input sentence
- points
- template
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000011156 evaluation Methods 0.000 title claims description 37
- 238000000034 method Methods 0.000 claims description 36
- 230000035943 smell Effects 0.000 claims 1
- 238000013519 translation Methods 0.000 description 17
- 238000012937 correction Methods 0.000 description 16
- 238000007796 conventional method Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Electrically Operated Instructional Devices (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の属する技術分野】
本発明は、例えば翻訳文を添削したり評価する際に使用される最適テンプレートパターン決定方法,決定装置,最適テンプレートパターンを用いた評価方法,評価装置および記録媒体に係り、特に重要度が他の単語よりも高い重要単語に基づいて最適テンプレートパターンを決定し、この最適テンプレートパターンに基づき入力文を評価することができる最適テンプレートパターン決定方法,決定装置,最適テンプレートパターンを用いた評価方法,評価装置および記録媒体に関する。
【0002】
【従来の技術】
一般に、技術翻訳者養成講座においては、受講生が例題に対する解答文を本部に送付し、本部では送付されてきた解答文を添削して受講生に送り返し、受講生はその添削内容を見て自己のレベルを確認する方法が採られている。
【0003】
ところで従来、解答文の添削は、多数送られてくる解答文を複数の添削者に振分け、各添削者が人力により行う方法が採られているが、人力による添削には多大な時間を要するとともに、一定レベル以上の実力を有する添削者を確保することが必ずしも容易でなく、添削者によって添削内容にバラツキが生じるという問題がある。
【0004】
そこで本発明者等は先に、特開平9−325673号公報に示すように、専門家が人力で行なうのと同程度の結果が得られる翻訳文添削支援装置を提案した。
【0005】
【発明が解決しようとする課題】
本発明者等が先に提案した翻訳文添削支援装置は、模範解答に対応するテンプレートパターンを複数種類用意しておき、解答文がどのテンプレートパターンと一致するかを判断した後、解答文を当該テンプレートパターンと同様のテンプレートパターンに分解し、各テンプレート毎に解答文と模範解答との異同を判断して添削結果を得るものであり、技術翻訳者養成講座のように、解答文の翻訳レベルにバラツキが少ない場合には、極めて精度の高い添削結果を得ることができる。
【0006】
ところが、例えば一般の語学学校のように、解答文の翻訳レベルのバラツキが極めて大きい場合には、そのすべてのケースを想定して、模範解答に対応するテンプレートパターンを多数用意しておくことは不可能である。このため、解答文が予め用意された模範解答のテンプレートパターンと一致しない場合が多発することになる。
【0007】
従来このような場合には、解答文と各テンプレートパターンとを比較した際に、一致する単語の合計数が最も多いテンプレートパターンを、最適テンプレートパターンとして選択するようにしているが、一致する単語の数が多いという理由だけで模範解答のテンプレートパターンを選択すると、解答者が解答文で意図したテンプレートパターンと必ずしも一致せず、ために精度の高い添削や、入力文の正しい評価が期待できないという問題がある。
【0008】
このような問題は翻訳の場合に限らず、例えばインターネットを利用した情報検索システムにおいて、入力文に基づき所定の情報を検索する等の場合にも同様に生じる。
【0009】
本発明は、かかる現況に鑑みなされたもので、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを、模範解答用のテンプレートパターンとして確実に選択することができる最適テンプレートパターン決定方法,決定装置および記録媒体を提供することを目的とする。
【0010】
本発明の他の目的は、このようにして選択された最適テンプレートパターンに基づき、入力文を正しく評価することができる最適テンプレートパターンを用いた評価方法,評価装置および記録媒体を提供することを目的とする。
【0011】
【課題を解決するための手段】
前記目的を達成するため本発明は、任意数のテンプレートに分解された模範解答用の複数のテンプレートパターンを予め用意しておき、これら各テンプレートパターンと入力文とを比較し、入力文に最も適したテンプレートパターンを最適テンプレートパターンとして決定する最適テンプレートパターン決定方法において、前記各テンプレートパターンで用いられるすべての単語に、その重要度に応じたポイント数のポイントを付与し、前記入力文と各テンプレートパターンとを比較し、一致するすべての単語の合計ポイント数が最も高くなるテンプレートパターンを、最適テンプレートパターンとして決定するようにしたことを特徴とする。そして、各単語に、その重要度に応じたポイント数のポイントを付与し、一致する単語の合計ポイント数により、最適テンプレートパターンを決定するようにしているので、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを、模範解答用のテンプレートパターンとして確実に選択,決定することが可能となる。
【0012】
本発明はまた、任意数のテンプレートに分解された模範解答用の複数のテンプレートパターンを予め用意しておき、これら各テンプレートパターンと入力文とを比較し、入力文に最も適したテンプレートパターンを最適テンプレートパターンとして決定し、次いでこの最適テンプレートパターンに基づき入力文を評価する最適テンプレートパターンを用いた評価方法において、前記テンプレートパターンで用いられるすべての単語に、その重要度に応じたポイント数のポイントを付与し、前記入力文と各テンプレートパターンとを比較し、一致するすべての単語の合計ポイント数が最も高くなるテンプレートパターンを最適テンプレートパターンとして決定し、次いで入力文中の一致単語数を入力文の総単語数で除した値と、入力文中の一致単語ポイント数を最適テンプレートパターンの総ポイント数で除した値とを用い、これら両値の積に基づき入力文を評価することを特徴とする。そしてこれにより、文法を正しく理解しているか否か、あるいは重要単語を知っているか否か等を勘案して、入力文を正しく評価することが可能となる。
【0013】
本発明はまた、任意数のテンプレートに分解された模範解答用の複数のテンプレートパターンを予め用意しておき、これら各テンプレートパターンと入力文とを比較し、入力文に最も適したテンプレートパターンを最適テンプレートパターンとして決定する最適テンプレートパターン決定装置において、前記各テンプレートパターンを記憶するテンプレートパターン記憶手段と;前記入力文を記憶する入力文記憶手段と;前記各テンプレートパターンで用いられるすべて単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と;入力文と各テンプレートパターンとを比較し、各テンプレートパターンにおいて入力文と一致する単語を検索する一致単語検索手段と;各テンプレートパターンにおける一致単語の合計ポイント数を演算するポイント数演算手段と;合計ポイント数が最も高いテンプレートパターンを最適テンプレートパターンとして選択する最適テンプレートパターン選択手段と;を設けるようにしたことを特徴とする。そして、ポイント数演算手段において、一致単語の合計ポイント数を演算し、その結果に基づき最適テンプレートパターンを選択するようにしているので、重要単語をより多く含むテンプレートパターンが、最適テンプレートパターンとして選択される可能性が高くなり、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを、模範解答用のテンプレートパターンとして確実に選択,決定することが可能となる。
【0014】
本発明はまた、任意数のテンプレートパターンに分解された模範解答用の複数のテンプレートパターンを予め用意しておき、これら各テンプレートパターンと入力文とを比較し、入力文に最も適したテンプレートパターンを最適テンプレートパターンとして決定し、次いでこの最適テンプレートパターンを用いて入力文を評価する最適テンプレートパターンを用いた評価装置において、前記各テンプレートパターンを記憶するテンプレートパターン記憶手段と;前記入力文を記憶する入力文記憶手段と;前記各テンプレートパターンで用いられるすべて単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と;入力文と各テンプレートパターンとを比較し、各テンプレートパターンにおいて入力文と一致する単語を検索する一致単語検索手段と;各テンプレートパターンにおける一致単語の合計ポイント数を演算するポイント数演算手段と;合計ポイント数が最も高いテンプレートパターンを最適テンプレートパターンとして選択する最適テンプレートパターン選択手段と;最適テンプレートパターンの総ポイント数を演算する最適テンプレートパターン総ポイント数演算手段と;入力文の一致単語数を演算する一致単語数演算手段と;入力文の一致単語数を入力文の総単語数で除した値と、入力文中の一致単語ポイント数を最適テンプレートパターンの総ポイント数で除した値とを用い、これら両値の積に基づき入力文を評価する入力文評価手段と;を設けるようにしたことを特徴とする。そしてこれにより、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを用いて入力文を評価することが可能となり、高い信頼性を得ることが可能となる。
【0015】
本発明はまた、任意数のテンプレートに分解された模範解答用の複数のテンプレートパターンを、メモリ領域に記憶させる処理;入力文をメモリ領域に記憶させる処理;前記各テンプレートパターンで用いられる単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けてメモリ領域に記憶させる処理;前記入力文と各テンプレートパターンとを比較し、一致するすべての単語の合計ポイント数が最も高くなるテンプレートパターンを、最適テンプレートパターンとして選択する処理;をコンピュータに実行させるようにしたことを特徴とする。そして前記各処理により、ポイント数の高い重要単語をより多く含むテンプレートパターンが、最適テンプレートパターンとして選択される可能性が高くなり、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを、模範解答用のテンプレートパターンとして選択,決定することが可能となる。
【0016】
本発明はさらに、任意数のテンプレートに分解された模範解答用の複数のテンプレートパターンを、メモリ領域に記憶させる処理;入力文をメモリ領域に記憶させる処理;前記各テンプレートパターンで用いられる単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けてメモリ領域に記憶させる処理;前記入力文と各テンプレートパターンとを比較し、一致するすべての単語の合計ポイント数が最も高くなるテンプレートパターンを、最適テンプレートパターンとして選択する処理;入力文の一致単語数を入力文の総単語数で除した値と、入力文中の一致単語ポイント数を最適テンプレートパターンの総ポイント数で除した値とを用い、これら両値の積に基づき入力文を評価する処理;をコンピュータに実行させるようにしたことを特徴とする。そして、前記各処理により、入力文を正しく評価することが可能となる。
【0017】
【発明の実施の形態】
以下、本発明を図面を参照して説明する。
図1は、本発明の実施の一形態に係る最適テンプレートパターンの決定および入力文の評価を行なう装置を示すもので、この装置は、任意数のテンプレートパターンに分解された模範解答用の複数のテンプレートパターンを記憶するテンプレートパターン記憶手段1、入力文を記憶する入力記憶手段2、および単語ポイント数記憶手段3を備えており、単語ポイント数記憶手段3は、前記各テンプレートパターンで用いられるすべての単語に対し、その重要度に応じたポイント数で予め付与されているポイントを、単語と関連付けて記憶するようになっている。
【0018】
前記入力文記憶手段2に記憶されている入力文データは、図1に示すように、テンプレートパターン記憶手段1に記憶されている各テンプレートパターンのデータとともに、一致単語検索手段4に入力されるようになっており、この一致単語検索手段4においては、入力文と各テンプレートパターンとを比較し、各テンプレートパターンにおいて入力文と一致する単語がそれぞれ検索され、その後ポイント数演算手段5において、各テンプレートパターンにおける一致単語の合計ポイント数が演算されるようになっている。そして、最適テンプレートパターン選択手段6においては、合計ポイント数が最も高いテンプレートパターンを、最適テンプレートパターンとして選択,決定するようになっている。
【0019】
この最適テンプレートパターン選択手段6で選択された最適テンプレートパターンは、最適テンプレートパターン総ポイント数演算手段7において、その総ポイント数が演算されるようになっており、また入力文は、一致単語数演算手段8において、最適テンプレートパターンとの一致単語数が演算されるようになっている。そして、入力文評価手段9においては、入力文の一致単語数を入力文の総単語数で除した値と、入力文中の一致単語ポイント数を最適テンプレートパターンの総ポイント数で除した値とを用い、これら両値の積に基づき入力文の評価が行なわれるようになっている。
【0020】
図2は、前記装置における最適テンプレートパターンの決定方法を示す流れ図であり、以下これについて説明する。
【0021】
まずステップS1において、入力文に対応する模範解答用の複数のテンプレートパターンを予め用意しておき、これら各テンプレートパターンを読込む。
【0022】
例えば例題が、
『日本には美しい公園が沢山ある。』
であるとすると、入力文に対応する模範解答用のテンプレートパターンとしては、例えば表1に示すように、5つのテンプレートT1,T2,T3,T4,T5に分解された三種類のテンプレートパターンA,B,Cが用意される。
【0023】
【表1】
【0024】
なおここで、各テンプレートパターンA,B,Cにおけるテンプレート分解方法は、過去の添削例を参考にして、添削作業で翻訳文(模範解答)の核になる要素が何であるかを、専門家の添削知識を用いて吟味し、その単位をテンプレートと呼ぶ文章要素に分解することにより行なわれる。
【0025】
次いでステップS2において、前記各テンプレートパターンで用いられるすべての単語に対し、その重要度に応じたポイント数のポイントを付与する。
【0026】
表1はその一例を示すもので、『dotted』および『nationwide』以外の各単語には、ポイント数「1」のポイントが付与され、一方『dotted』および『nationwide』には、他の単語の3倍のポイント数「3」のポイントが付与されている。すなわち、『dotted』および『nationwide』は、他の単語の3倍の重要度を有する重要単語として設定されている。
【0027】
ここで重要単語は、例えば教師が学生の翻訳文(入力文)を添削するような場合に、教師側が是非学生に覚えて貰いたいと考えている文型を強調する等の場合に設定されるのもので、この場合教師は、授業において前記文型を用いて翻訳するよう、学生を指導するであろうし、学生も前記文型を用いて例題を翻訳するよう努力することが予想される。そして、学生が前記文型を用いて翻訳してきた場合には、その添削も、前記文型に添ったテンプレートパターンを用いて評価してやることが、翻訳文(入力文)を教師に提出した学生の意図に添った評価となることは明らかである。
【0028】
そこで、本発明はおいては、後に詳述するように、学生が前記文型を用いて翻訳してきた場合には、前記文型に添ったテンプレートパターンが、最適テンプレートパターンとして選択されるようにしている。
【0029】
なお、前記重要単語のポイント数の倍率は3倍に限られるものではなく、その倍率は自由に設定することができ、またポイント数が2倍の単語,ポイント数が3倍の単語,ポイント数が4倍の単語のように、ポイント数の倍率を複数段階に分けて設定することもできる。
【0030】
このようにして、単語ポイント数の読込みが完了したならば、図2のステップS3において、入力文の読込みを行なう。この入力文は、前記例では、学生が教師に提出した翻訳文である。そして、この入力文の読込みの後、ステップS4において、入力文の解析を行なう。
【0031】
なお、この入力文の解析としては、例えば前記例のような和文英訳の場合であれば、前述の特開平9−325673号公報に示されているように、基本的用法が正しく履行されているか否かを調べるためのキーパターンによるキーパターンチェック、入力文のすべての単語に対し内蔵する辞書を用いて行なわれる品詞分類、および構文解析プログラムによる構文解析が順次行なわれることになる。
【0032】
次いでステップS5において、入力文中の各単語が、各テンプレートパターン中のどの単語と一致するかを検索するとともに、ステップS6において、一致した単語の合計のポイント数を各テンプレートパターン毎に演算する。そしてステップS7において、合計のポイント数が最も高くなるテンプレートパターンを、最適テンプレートパターンとして選択,決定する。
【0033】
例えば、前記例題に対する学生の翻訳文(入力文)が、
『Japan has dotted beautiful parksall over nationwide.』
であるとすると、表1に示す各テンプレートパターンA,B,Cの一致単語ポイント数は、表2のようになる。
【0034】
【表2】
【0035】
表2からも明らかなように、テンプレートパターンAの一致単語ポイント数は「6」、テンプレートパターンBの一致単語ポイント数は「8」、テンプレートパターンCの一致単語ポイント数は「9」であるので、最適テンプレートパターンとしては、テンプレートパターンCが選択されることになる。
【0036】
なお、各テンプレートパターンA,B,Cの一致単語数は、表2に示すように、テンプレートパターンA,Bが「6」、テンプレートパターンCが「5」である。そして従来は、最適なテンプレートパターンを選択する際に、一致単語数が最も多いテンプレートパターンを選択するようにしているので、従来の方法では、テンプレートパターンAあるいはテンプレートパターンBが最適テンプレートパターンとして選択されてしまうことになる。
【0037】
前記学生の翻訳文は、『dotted』と『nationwide』とを用いて、例題を翻訳しようと努力していることは明らかであるので、テンプレートパターンCを用いて学生の翻訳文を添削してやることが、学生の意図する翻訳文の内容に対する正しい添削結果となることは明らかである。
【0038】
一方、前記例題に対する学生の翻訳文(入力文)が
『Japan is dotted with beautifulparks country.』
であるとすると、表1に示す各テンプレートパターンA,B,Cの一致単語ポイント数は、表3のようになる。
【0039】
【表3】
【0040】
表3からも明らかなように、テンプレートパターンAの一致単語ポイント数は「4」、テンプレートパターンBの一致単語ポイント数は「9」、テンプレートパターンCの一致単語ポイント数「8」であるので、この場合の最適テンプレートパターンとしては、テンプレートパターンBが選択されることになる。
【0041】
なお、各テンプレートパターンA,B,Cの一致単語数は、表3に示すように、テンプレートパターンAが「4」、テンプレートパターンBが「7」、テンプレートパターンCが「6」であるので、一致単語数が最も多いテンプレートパターンを最適テンプレートパターンとして選択する従来の方法の場合でも、結果は同一となる。
【0042】
このようにして、最適テンプレートパターンが選択されたならば、図2のステップS8において、入力文を最適テンプレートパターンと同様のテンプレートに分解する。表4はその例を示し、各テンプレートt1,t2,t3,t4,t5が、テンプレートパターンB,Cの各テンプレートT1,T2,T3,T4,T5にそれぞれ対応している。
【0043】
【表4】
【0044】
このようにして、入力文のテンプレートパターン分解が完了したならば、ステップS9において、入力文の添削を行なう。この添削方法は、前述の特開平9−325673号公報に示されている添削方法と同一である。
【0045】
しかして、各テンプレートパターンA,B,Cで用いられるすべての単語に対し、その重要度に応じたポイント数のポイントを付与し、入力文と各テンプレートパターンA,B,Cとを比較し、一致するすべての単語の合計ポイント数が最も高くなるテンプレートパターンB,Cを、最適テンプレートパターンとして選択するようにしているので、入力文が意図している内容に添った添削内容となり、極めて精度の高い添削結果を得ることができる。
【0046】
図3は、前記装置における最適テンプレートパターンを用いた入力文の評価方法を示す流れ図であり、以下これについて説明する。
【0047】
まずステップS11において、最適テンプレートパターンを読込むとともに、ステップS12において、入力文を読込む。
【0048】
次いで、ステップS13において、読込んだ入力文中の一致単語数(A)を演算する。具体的には、前記表2で説明した一番目の入力文の場合には、「(A)=5」が読込まれ、また表3で説明した二番目の入力文の場合には、「(A)=7」が読込まれる。
【0049】
次いで、ステップS14において、入力文の総単語数(B)を演算する。具体的には、表2で説明した一番目の入力文の場合には、「(B)=8」が読込まれ、また表3で説明した二番目の入力文の場合には、「(B)=10」が読込まれる。
【0050】
次いで、ステップS15において、入力文中の一致単語ポイント数(C)を演算する。具体的には、表2で説明した一番目の入力文の場合には、「(C)=9」が読込まれ、また表3で説明した入力文の場合には、「(C)=9」が読込まれる。
【0051】
次いで、ステップS16において、最適テンプレートパターンの総ポイント数(D)を演算する。具体的には、前記表1に示すテンプレートパターンCが最適テンプレートパターンとして選択された場合(一番目の入力文の場合)には、「(D)=11」が読込まれ、またテンプレートパターンBが最適テンプレートパターンとして選択された場合(二番目の入力文の場合)には、「(D)=12」が読込まれる。
【0052】
次いで、ステップS17において、入力文中の一致単語数(A)を入力文の総単語数(B)で除す計算がなされ、その計算結果(X)が求められるとともに、ステップS18において、入力文中の一致単語ポイント数(C)を最適テンプレートパターンの総ポイント数(D)で除す計算がなされ、その計算結果(Y)が求められる。そして最後に、ステップS19において、前記両計算結果(X),(Y)を用いて入力文の評価が点数の形式で求められる。以下の数1,数2および数3は、前記各ステップS17,S18,S19における計算内容をそれぞれ示すものである。
【0053】
【数1】
【0054】
【数2】
【0055】
【数3】
【0056】
ここで、前記数1は、入力者(学生)が例題をどの程度推測して翻訳したのかを測定する尺度であり、この尺度を用いることにより、当て推量が多い場合には、評価点を下げることができるとともに、単語は知っているが文法を理解していない場合には、評価点を下げることができるようになっている。
【0057】
また、前記数2は、入力者(学生)が間違って使った単語の数を評価点に反映させるための尺度であり、この尺度を用いることにより、語彙が少ない場合には、評価点を下げることができるとともに、簡単な単語しか知らないで重要な単語を用いない場合には、評価点を下げることができるようになっている。
【0058】
すなわち、本発明に係る入力文の評価方法は、入力者(学生)の語彙の豊富さ、文法知識の豊富さ、および重要な文法,単語に関する知識の豊富さに重点を置いた評価法である。
【0059】
この入力文の評価方法を具体的に説明すると、前記表1に示すテンプレートパターンCが最適テンプレートパターンとして選択された場合(一番目の入力文の場合)には、以下の数4に示すように、評価点は51.1点となり、一方前記表1に示すテンプレートパターンBが最適テンプレートパターンとして選択された場合(二番目の入力文の場合)には、以下の数5に示すように、評価点は52.5点となる。
【0060】
【数4】
【0061】
【数5】
【0062】
両者を比較すると、一番目の入力文は、重要単語である『nationwide』を用いているにも拘らず、この重要単語を用いていない二番目の入力文よりも評価点が低くなっている。
【0063】
これは、一番目の入力文は、『dotted』に関して『with』がないとともに、『is』を『has』と誤って用い、かつ『nationwide』に関して不要な『all over』を用いているからである。
【0064】
しかして、この入力文の評価方法を用いることにより、入力者(学生)の翻訳能力を正確に評価することができ、学生は得られた評価点から、自己の弱点を容易に知ることができる。
【0065】
なお、前記実施の一形態においては、和文英訳の添削を例に採って説明したが、英文和訳の場合や、他の言語間の翻訳の場合にも同様に適用でき、また前述のように、インターネット等を利用した情報検索システムにおいて、入力文に基づき所定の情報を検索するような場合に、自然言語文章からなる複合情報を持つテンプレートパターンを検索キーとして使用することにより、同様に適用することができる。
【0066】
【発明の効果】
以上説明したように本発明は、任意数のテンプレートに分解された模範解答用の複数のテンプレートパターンを予め用意しておき、これら各テンプレートパターンと入力文とを比較し、入力文に最も適したテンプレートパターンを最適テンプレートパターンとして決定する最適テンプレートパターン決定方法において、前記各テンプレートパターンで用いられるすべての単語に、その重要度に応じたポイント数のポイントを付与し、前記入力文と各テンプレートパターンとを比較し、一致するすべての単語の合計ポイント数が最も高くなるテンプレートパターンを、最適テンプレートパターンとして決定するようにしているので、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを、模範解答用のテンプレートパターンとしてとして確実に選択,決定することができる。
【0067】
本発明はまた、任意数のテンプレートに分解された模範解答用の複数のテンプレートパターンを予め用意しておき、これら各テンプレートパターンと入力文とを比較し、入力文に最も適したテンプレートパターンを最適テンプレートパターンとして決定し、次いでこの最適テンプレートパターンに基づき入力文を評価する最適テンプレートパターンを用いた評価方法において、前記テンプレートパターンで用いられるすべての単語に、その重要度に応じたポイント数のポイントを付与し、前記入力文と各テンプレートパターンとを比較し、一致するすべての単語の合計ポイント数が最も高くなるテンプレートパターンを最適テンプレートパターンとして決定し、次いで入力文中の一致単語数を入力文の総単語数で除した値と、入力文中の一致単語ポイント数を最適テンプレートパターンの総ポイント数で除した値とを用い、これら両値の積に基づき入力文を評価するようにしているので、文法を正しく理解しているか否か、あるいは重要単語を知っているか否か等を勘案して、入力文を正しく評価することができる。
【0068】
本発明はまた、任意数のテンプレートに分解された模範解答用の複数のテンプレートパターンを予め用意しておき、これら各テンプレートパターンと入力文とを比較し、入力文に最も適したテンプレートパターンを最適テンプレートパターンとして決定する最適テンプレートパターン決定装置において、前記各テンプレートパターンを記憶するテンプレートパターン記憶手段と;前記入力文を記憶する入力文記憶手段と;前記各テンプレートパターンで用いられるすべて単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と;入力文と各テンプレートパターンとを比較し、各テンプレートパターンにおいて入力文と一致する単語を検索する一致単語検索手段と;各テンプレートパターンにおける一致単語の合計ポイント数を演算するポイント数演算手段と;合計ポイント数が最も高いテンプレートパターンを最適テンプレートパターンとして選択する最適テンプレートパターン選択手段と;を設け、ポイント数演算手段において、一致単語の合計ポイント数を演算し、その結果に基づき最適テンプレートパターンを選択するようにしているので、重要単語をより多く含むテンプレートパターンが、最適テンプレートパターンとして選択される可能性が高くなり、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを、模範解答用のテンプレートパターンとして確実に選択,決定することができる。
【0069】
本発明はまた、任意数のテンプレートパターンに分解された模範解答用の複数のテンプレートパターンを予め用意しておき、これら各テンプレートパターンと入力文とを比較し、入力文に最も適したテンプレートパターンを最適テンプレートパターンとして決定し、次いでこの最適テンプレートパターンを用いて入力文を評価する最適テンプレートパターンを用いた評価装置において、前記各テンプレートパターンを記憶するテンプレートパターン記憶手段と;前記入力文を記憶する入力文記憶手段と;前記各テンプレートパターンで用いられるすべて単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と;入力文と各テンプレートパターンとを比較し、各テンプレートパターンにおいて入力文と一致する単語を検索する一致単語検索手段と;各テンプレートパターンにおける一致単語の合計ポイント数を演算するポイント数演算手段と;合計ポイント数が最も高いテンプレートパターンを最適テンプレートパターンとして選択する最適テンプレートパターン選択手段と;最適テンプレートパターンの総ポイント数を演算する最適テンプレートパターン総ポイント数演算手段と;入力文の一致単語数を演算する一致単語数演算手段と;入力文の一致単語数を入力文の総単語数で除した値と、入力文中の一致単語ポイント数を最適テンプレートパターンの総ポイント数で除した値とを用い、これら両値の積に基づき入力文を評価する入力文評価手段と;を設けるようにしているので、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを用いて入力文を評価することができ、高い信頼性を得ることができる。
【0070】
本発明はまた、任意数のテンプレートに分解された模範解答用の複数のテンプレートパターンを、メモリ領域に記憶させる処理;入力文をメモリ領域に記憶させる処理;前記各テンプレートパターンで用いられる単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けてメモリ領域に記憶させる処理;前記入力文と各テンプレートパターンとを比較し、一致するすべての単語の合計ポイント数が最も高くなるテンプレートパターンを、最適テンプレートパターンとして選択する処理;をコンピュータに実行させるようにしているので、ポイント数の高い重要単語をより多く含むテンプレートパターンが、最適テンプレートパターンとして選択される可能性が高くなり、入力者が意図した入力文のテンプレートパターンと同一のテンプレートパターンを、模範解答用のテンプレートパターンとして選択,決定することができる。
【0071】
本発明はさらに、任意数のテンプレートに分解された模範解答用の複数のテンプレートパターンを、メモリ領域に記憶させる処理;入力文をメモリ領域に記憶させる処理;前記各テンプレートパターンで用いられる単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けてメモリ領域に記憶させる処理;前記入力文と各テンプレートパターンとを比較し、一致するすべての単語の合計ポイント数が最も高くなるテンプレートパターンを、最適テンプレートパターンとして選択する処理;入力文の一致単語数を入力文の総単語数で除した値と、入力文中の一致単語ポイント数を最適テンプレートパターンの総ポイント数で除した値とを用い、これら両値の積に基づき入力文を評価する処理;をコンピュータに実行させるようにしているので、入力文を正しく評価することができる。
【図面の簡単な説明】
【図1】本発明の実施の一形態に係る最適テンプレートパターンの決定および入力文の評価を行なう装置を示す全体構成図である。
【図2】図1の装置による最適テンプレートパターン決定方法を示す流れ図である。
【図3】図1の装置による入力文の評価方法を示す流れ図である。
【符号の説明】
1 テンプレートパターン記憶手段
2 入力記憶手段
3 単語ポイント数記憶手段
4 一致単語検索手段
5 ポイント数演算手段
6 最適テンプレートパターン選択手段
7 最適テンプレートパターン総ポイント数演算手段
8 一致単語数演算手段
9 入力文評価手段
Claims (3)
- 任意数のテンプレートに分解された模範解答用の複数のテンプレートパターンを記憶するテンプレートパターン記憶手段と;入力文を記憶する入力文記憶手段と;前記各テンプレートパターンで用いられるすべての単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と;を備え、前記各テンプレートパターンと入力文とを比較し、入力文に最も適したテンプレートパターンを最適テンプレートパターンとして決定し、次いでこの最適テンプレートパターンに基づき入力文を評価する最適テンプレートパターンを用いた評価方法において、一致単語検索手段が、前記テンプレートパターン記憶手段からの各テンプレートパターンと前記入力文記憶手段からの入力文とを比較し、各テンプレートパターンにおいて入力文と一致する単語を検索するステップと;ポイント数演算手段が、前記単語ポイント数記憶手段からの情報に基づき、各テンプレートパターンにおける一致単語の合計ポイント数を演算するステップと;最適テンプレートパターン選択手段が、合計ポイント数が最も高いテンプレートパターンを最適テンプレートパターンとして選択するステップと;最適テンプレートパターン総ポイント数演算手段が、最適テンプレートパターンの総ポイント数を演算するステップと;一致単語数演算手段が、入力文の一致単語数を演算するステップと;入力文評価手段が、入力文の一致単語数を入力文の総単語数で除した値と、入力文中の一致単語ポイント数を最適テンプレートパターンの総ポイント数で除した値とを用い、これら両値の積に基づき入力文を評価するステップと;を具備することを特徴とする最適テンプレートパターンを用いた評価方法。
- 任意数のテンプレートパターンに分解された模範解答用の複数のテンプレートパターンを予め用意しておき、これら各テンプレートパターンと入力文とを比較し、入力文に最も適したテンプレートパターンを最適テンプレートパターンとして決定し、次いでこの最適テンプレートパターンを用いて入力文を評価する最適テンプレートパターンを用いた評価装置において、前記各テンプレートパターンを記憶するテンプレートパターン記憶手段と;前記入力文を記憶する入力文記憶手段と;前記各テンプレートパターンで用いられるすべて単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と;入力文と各テンプレートパターンとを比較し、各テンプレートパターンにおいて入力文と一致する単語を検索する一致単語検索手段と;各テンプレートパターンにおける一致単語の合計ポイント数を演算するポイント数演算手段と;合計ポイント数が最も高いテンプレートパターンを最適テンプレートパターンとして選択する最適テンプレートパターン選択手段と;最適テンプレートパターンの総ポイント数を演算する最適テンプレートパターン総ポイント数演算手段と;入力文の一致単語数を演算する一致単語数演算手段と;入力文の一致単語数を入力文の総単語数で除した値と、入力文中の一致単語ポイント数を最適テンプレートパターンの総ポイント数で除した値とを用い、これら両値の積に基づき入力文を評価する入力文評価手段と;を具備することを特徴とする最適テンプレートパターンを用いた評価装置。
- 任意数のテンプレートに分解された模範解答用の複数のテンプレートパターンを、メモリ領域に記憶させる処理;入力文をメモリ領域に記憶させる処理;前記各テンプレートパターンで用いられる単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けてメモリ領域に記憶させる処理;前記入力文と各テンプレートパターンとを比較し、一致するすべての単語の合計ポイント数が最も高くなるテンプレートパターンを、最適テンプレートパターンとして選択する処理;入力文の一致単語数を入力文の総単語数で除した値と、入力文中の一致単語ポイント数を最適テンプレートパターンの総ポイント数で除した値とを用い、これら両値の積に基づき入力文を評価する処理;をコンピュータに実行させるためのプログラムを記録したコンピュータ読取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18234799A JP3669869B2 (ja) | 1999-06-28 | 1999-06-28 | 最適テンプレートパターンを用いた評価方法、評価装置および記録媒体 |
US09/597,269 US6598019B1 (en) | 1999-06-28 | 2000-06-20 | Evaluation method, apparatus, and recording medium using optimum template pattern determination method, apparatus and optimum template pattern |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18234799A JP3669869B2 (ja) | 1999-06-28 | 1999-06-28 | 最適テンプレートパターンを用いた評価方法、評価装置および記録媒体 |
US09/597,269 US6598019B1 (en) | 1999-06-28 | 2000-06-20 | Evaluation method, apparatus, and recording medium using optimum template pattern determination method, apparatus and optimum template pattern |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001013862A JP2001013862A (ja) | 2001-01-19 |
JP3669869B2 true JP3669869B2 (ja) | 2005-07-13 |
Family
ID=28676611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP18234799A Expired - Fee Related JP3669869B2 (ja) | 1999-06-28 | 1999-06-28 | 最適テンプレートパターンを用いた評価方法、評価装置および記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6598019B1 (ja) |
JP (1) | JP3669869B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3520022B2 (ja) * | 2000-01-14 | 2004-04-19 | 株式会社国際電気通信基礎技術研究所 | 外国語学習装置、外国語学習方法および媒体 |
US7013262B2 (en) * | 2002-02-12 | 2006-03-14 | Sunflare Co., Ltd | System and method for accurate grammar analysis using a learners' model and part-of-speech tagged (POST) parser |
US6988063B2 (en) * | 2002-02-12 | 2006-01-17 | Sunflare Co., Ltd. | System and method for accurate grammar analysis using a part-of-speech tagged (POST) parser and learners' model |
US20070141544A1 (en) * | 2003-11-28 | 2007-06-21 | Katsuaki Nakane | Apparatus for grading and evaluating compositional essays |
US8868670B2 (en) * | 2004-04-27 | 2014-10-21 | Avaya Inc. | Method and apparatus for summarizing one or more text messages using indicative summaries |
US8392193B2 (en) * | 2004-06-01 | 2013-03-05 | Verizon Business Global Llc | Systems and methods for performing speech recognition using constraint based processing |
US7873149B2 (en) * | 2004-06-01 | 2011-01-18 | Verizon Business Global Llc | Systems and methods for gathering information |
JP7405234B2 (ja) * | 2020-03-03 | 2023-12-26 | 日本電信電話株式会社 | 文生成装置、文生成学習装置、文生成方法、文生成学習方法及びプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4507750A (en) * | 1982-05-13 | 1985-03-26 | Texas Instruments Incorporated | Electronic apparatus from a host language |
JPH03116273A (ja) * | 1989-09-29 | 1991-05-17 | Fujitsu Ltd | 対訳文テンプレート対を用いた機械翻訳システム |
US6278967B1 (en) * | 1992-08-31 | 2001-08-21 | Logovista Corporation | Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis |
JP2887660B2 (ja) * | 1996-06-05 | 1999-04-26 | 株式会社サン・フレア | 翻訳文添削支援装置 |
US5905972A (en) * | 1996-09-30 | 1999-05-18 | Microsoft Corporation | Prosodic databases holding fundamental frequency templates for use in speech synthesis |
GB9806085D0 (en) * | 1998-03-23 | 1998-05-20 | Xerox Corp | Text summarisation using light syntactic parsing |
JP3822990B2 (ja) * | 1999-01-07 | 2006-09-20 | 株式会社日立製作所 | 翻訳装置、記録媒体 |
JP4802370B2 (ja) * | 2001-01-30 | 2011-10-26 | ソニー株式会社 | 通信制御装置および方法、記録媒体、並びにプログラム |
-
1999
- 1999-06-28 JP JP18234799A patent/JP3669869B2/ja not_active Expired - Fee Related
-
2000
- 2000-06-20 US US09/597,269 patent/US6598019B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US6598019B1 (en) | 2003-07-22 |
JP2001013862A (ja) | 2001-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Meara et al. | Tools for researching vocabulary | |
US6341959B1 (en) | Method and system for learning a language | |
CN110705302B (zh) | 命名实体的识别方法、电子设备及计算机存储介质 | |
KR20050005523A (ko) | 단어 상관 방법 및 장치 | |
JP3669870B2 (ja) | 最適テンプレートパターン探索方法,探索装置および記録媒体 | |
CN111242816B (zh) | 基于人工智能的多媒体教案制作方法和系统 | |
CN109522397B (zh) | 信息处理方法及装置 | |
KR101060973B1 (ko) | 에세이에서 과도하게 반복되는 단어 사용의 자동 평가 | |
JP3669869B2 (ja) | 最適テンプレートパターンを用いた評価方法、評価装置および記録媒体 | |
CN108280065B (zh) | 一种外文文本评价方法及装置 | |
US20040243394A1 (en) | Natural language processing apparatus, natural language processing method, and natural language processing program | |
CN111061832A (zh) | 基于开放域信息抽取的人物行为抽取方法 | |
US20030195740A1 (en) | Translation evaluation using optimum template pattern determination method | |
CN115309910A (zh) | 语篇要素和要素关系联合抽取方法、知识图谱构建方法 | |
US11494560B1 (en) | System and methodology for computer-facilitated development of reading comprehension test items through passage mapping | |
Park et al. | Is the sky pure today? AwkChecker: an assistive tool for detecting and correcting collocation errors | |
CN116860947A (zh) | 面向文本阅读理解的选择题生成方法、系统及存储介质 | |
JP3932350B2 (ja) | 言語変換処理統一システム | |
KR100353549B1 (ko) | 언어를 학습하기 위한 방법 및 시스템 | |
CN109460417A (zh) | 一种错题本生成方法、装置、服务器及计算机存储介质 | |
CN115114417A (zh) | 中文填空题自动评分方法及装置 | |
JP2887660B2 (ja) | 翻訳文添削支援装置 | |
KR101747924B1 (ko) | 한국어 철자 검사 방법 및 이를 실행하는 장치 | |
Lu et al. | Automated assessment of language | |
Yamura-Takei et al. | Automatic linguistic analysis for language teachers: The case of zeros |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040323 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050412 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080422 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090422 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090422 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100422 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100422 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110422 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120422 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120422 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130422 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140422 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |