JP5578623B2 - 文書添削装置、文書添削方法及び文書添削プログラム - Google Patents

文書添削装置、文書添削方法及び文書添削プログラム Download PDF

Info

Publication number
JP5578623B2
JP5578623B2 JP2011098247A JP2011098247A JP5578623B2 JP 5578623 B2 JP5578623 B2 JP 5578623B2 JP 2011098247 A JP2011098247 A JP 2011098247A JP 2011098247 A JP2011098247 A JP 2011098247A JP 5578623 B2 JP5578623 B2 JP 5578623B2
Authority
JP
Japan
Prior art keywords
sentence
document
correction
sentences
relevance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011098247A
Other languages
English (en)
Other versions
JP2012230539A (ja
Inventor
進介 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solutions Innovators Ltd
Original Assignee
NEC Solutions Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solutions Innovators Ltd filed Critical NEC Solutions Innovators Ltd
Priority to JP2011098247A priority Critical patent/JP5578623B2/ja
Publication of JP2012230539A publication Critical patent/JP2012230539A/ja
Application granted granted Critical
Publication of JP5578623B2 publication Critical patent/JP5578623B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、テンプレートを用いた文書の添削に関する。
ユーザが文章を作成した後、作成した文書を添削装置に入力することで文書の解析を行い、所定の正解文例と比較することで文書を添削し、その結果をユーザに提示するといった文書添削に関する技術が存在する。
また、このような文書添削を行うに際し、規範となる文書であるテンプレート文書を用いるという技術も存在する。
例えば、テンプレートを用いて、文書の添削を行っている例が特許文献1に記載されている。また、特許文献2には文書の要素として文章を組み合わせることで文書を作成する技術が記載されている。
特開2000−90080号公報 特開2001−331481号公報
しかしながら、上述した各技術には以下のような問題があった。
特許文献1に記載の技術は過去の添削例を元に正解例を提示するものであり、文章の前後関係に挿入できるものではないという問題があった。また、このような技術ではそもそも記載されていない文章を摘出するのは困難であった。
また、特許文献2に記載の技術の場合は、文書の要素として文章を組み合わせることで文書を作成しているが、文書を選択することで記載の自由度が妨げられる可能性があるという問題があった。
更に、類似する文書そのものを提示するような技術も存在するが、文章単位での指摘ができないため、その文書から必要な文章を抜き出す手間がかかっていた。
テンプレートの中からユーザが可変の文字列を埋め込むものや、多くの選択肢から文章を構成していく技術もあるが、文書の自由度が狭められてしまう恐れがあるという問題があった。
そこで、本発明は、或る一定の書式が定まっているが、文書ごとに自由度が求められるような文書(ソフトウェアの設計書や報告書など)において漏れがない文書を作成することが可能な、文書添削装置、文書添削方法及び文書添削プログラムを提供することを目的とする。
本発明の第1の観点によれば、添削対象の文書の添削を行う添削装置において、
正しい順序で記載されている文書であって該文書を文章単位で区切った場合に各文章に含まれる一つ以上のキーワードの組み合わせが各文章間で完全には一致しない文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度がある文章を関連度が高い文章から順に漏れている文章の候補として出力する添削文章抽出手段と、を備えることを特徴とする添削装置が提供される。
本発明の第2の観点によれば、添削対象の文書の添削を行う添削装置が行う添削方法において、正しい順序で記載されている文書であって該文書を文章単位で区切った場合に各文章に含まれる一つ以上のキーワードの組み合わせが各文章間で完全には一致しない文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成し、添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度がある文章を関連度が高い文章から順に漏れている文章の候補として出力することを特徴とする添削方法が提供される。
本発明の第3の観点によれば、添削対象の文書の添削を行う添削装置に組み込まれる添削プログラムにおいて、正しい順序で記載されている文書であって該文書を文章単位で区切った場合に各文章に含まれる一つ以上のキーワードの組み合わせが各文章間で完全には一致しない文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度がある文章を関連度が高い文章から順に漏れている文章の候補として出力する添削文章抽出手段と、を備える添削装置としてコンピュータを機能させることを特徴とする添削プログラムが提供される。
本発明によれば、テンプレートに記載された文書からキーワードを読み込み、キーワードと文章の前後関係、文章間の距離において関連度を算出することから、或る一定の書式が定まっているが、文書ごとに自由度が求められるような文書(ソフトウェアの設計書や報告書など)において漏れがない文書を作成することが可能となる。
本発明の実施形態の基本的構成を表す図である。 本発明の実施形態における文章の関連度を算出する動作を示すフローチャートである。 本発明の実施形態におけるテーブルの具体例を表す図である。 抜けている文章の抽出をする動作を示すフローチャートである。
本発明の実施形態の構成及び動作を説明するに先立って、まず本実施形態の特徴について説明する。
本実施形態では、まず、マスタとなる文書(以下、適宜「テンプレート文書」と呼ぶ)をデータベースに登録する。そして、このテンプレート文書と、添削対象とする文書(以下、適宜「添削文書」と呼ぶ)との比較を行い、後述する関連度の高い順に文章の前後に本来必要な文章の候補を提示し、ユーザに漏れや抜けを提示する。
ここで、テンプレート文書は、ユーザが事前に用意しておき、正しい順序で記載されている文書であるものとする。更に、キーワードも事前にユーザが指定しておくものとする。ここで、キーワードとは、文章の中の単語であって、他の文章と関連性が出やすい単語を指すものとする。
本実施形態における関連度の算出方法は、以下の通りである。指定されたキーワードが、或る文章と、それ以外の他の文章でも検出されれば、この或る文章と他の文章はそれぞれ関連のある文章として扱うものとする。また関連のある文章同士の前後関係及び文章間の距離を足し合わせることにより、文章の関連度を算出する。文章間の距離とは、句点で区切られた文章と文章の間に何個の文章があるか示したものである。また、マスタとなる文書であるテンプレート文書は随時更新が可能であり、運用を繰り返すことで、より精度の高い検出が可能となる。
なお、本実施形態では、句点を基準として「文章」を区切る。すなわち、対象とする文の最初の文字から最初の句点まで、又は、或る句点の次の文字から当該或る句点の次の句点まで、をそれぞれ1つの文章として扱う。そして、この文章の集合を「文書」と呼ぶこととする。
ここで、句点とは一般的に「。」を指すが、例えば「.」等の他の文字を句点として扱うようにしてもよい。すなわち句点とは、一般的に指される文字のみならずユーザの設定に応じて任意に定められる文字であるとする。
次に、本発明の実施形態について図面を用いて詳細に説明する。
図1を参照すると本実施形態は、文章添削装置100、入力装置200及び出力装置300を有する。
本実施形態における文章添削装置100は、ソフトウェア設計や、報告書等を含む一定の書式が定まっており、内容に記載漏れがあってはならない文書において、その文章の前後に漏れや抜けがあることを指摘/添削を行う装置である。
文章添削装置100は、本実施形態特有の装置により実現されてもよいが、汎用のPCに本実施形態特有のプログラムを組み込むことにより実現してもよい。また、入力装置200及び出力装置300の何れか若しくは双方が文章添削装置101と一体になり、単一の装置として実現されてもよい。
ここで、文章添削装置100は、関連度算出部101、テンプレート/関連度格納部102及び添削文章抽出部103を有する。
関連度算出部101は、入力されたテンプレート文書から文章の関連度を算出する部分である。また、テンプレート/関連度格納部102は、テンプレート文書及びテンプレート文書から算出された関連度を格納しておく記憶装置である。更に、添削文章抽出部103は、漏れている可能性のある文章を抽出する部分である。
入力装置200は、ユーザがテンプレート文書及び添削文書を入力するための装置であり、キーボード等により実現される。また、テンプレート文書及び添削文書は、ユーザが直接入力してもよいが、準備されているテンプレート文書や添削文書を記憶媒体(例えば、USBメモリや外部記憶装置)から読み込んだり、ネットワークを介して取得するようにしてもよい。また、入力装置200をスキャナーにより実現し、紙媒体より読み込んだ文字をOCR(Optical Character Recognition)ソフトにより文字認識することによりテンプレート文書や添削文書を入力するようにしてもよい。
出力装置300は、ユーザに情報を提示するための装置であり、ディスプレイ等により実現される。そして出力装置300は、添削した結果漏れている可能性のある文章をユーザに提示する。また、プリンタにより出力装置300を実現して、紙媒体に出力するようにしてもよい。更に、何らかの記憶媒体に出力するようにしてもよい。
なお、入力装置200及び出力装置300をタッチパネルディスプレイとして一体化して実現してもよい。
上述の各装置及び各部は、それぞれ以下のように動作する。
テンプレート文書及び添削文書を入力する入力装置200は、読み込んだテンプレート文書をファイル化して関連度算出部101へ送出する。
関連度算出部101は入力された文書ファイルを読み込み、文章(句点)区切りで分割し、文章から関連度を算出する。なお、可能であれば入力装置200が文書を文章(句点)区切りで分割するようにしてもよい。算出した関連度と文章はテンプレート/関連度格納部102にて格納される。
入力装置200から添削文章抽出部103に対して添削文書が入力されると、添削文章抽出部103がテンプレート/関連度格納部102から抜けている文章を抽出する。抽出した文章は出力装置300によってユーザに出力される。
次に、図2及び図4のフローチャート及び図3に示すテーブルを参照して、本実施形態の動作を説明する。
まず、テンプレート文書を入力として、文章の関連度を算出する方法について説明する。
テンプレート文書の入力の場合は、まず関連度算出部101がテンプレート/関連度格納部102に格納されているテーブルの初期化を行い、テーブルの中の情報を空にする(ステップS11)。
次に、関連度算出部101は、入力装置200から受け取ったテンプレート文章のファイルを読み込み、全体の文章量を計算する(ステップS12)。具体的には、テンプレート文章内に含まれている文章の数がいくつであるのかを算出する。
次に、関連度算出部101は、入力した文書を文章単位(句点)で読み取る(ステップS13)。そして、文章毎に、含まれているキーワードを読み込む(ステップS14)。
続いて、関連度算出部101は、読み込んだ文章とキーワード及びキーワードの個数から関連度を算出する(ステップS15)。
具体的には、以下の数式1により関連度を算出する。
関連度=(全文章数−文章間の距離)+一致するキーワードの個数
・・・数式1
この数式では、一般的に文章が離れれば離れるほど、文章同士の関連性は低くなり、一致するキーワードが多ければ文書間の関連性は高くなるため(全文章数−文章間の距離)を関連度の要素としている。更に一致するキーワードが多いほど関連度が高いと考えられるため一致するキーワードの個数も関連度の要素としている。但し、一致するキーワードが存在しない場合は、(全文章数−文章間の距離)を考慮することなく関連度をゼロとする。すなわち、間に文章が存在しなくとも関連度はゼロとなる。算出した関連度と文章を図3の形式で、テンプレート/関連度格納部102内のテーブルに登録する(ステップS16)。
テーブルの登録方法は、登録されている文章の順番を格納する文章順番番号列と、その文章に含まれるキーワード一覧列と、その文章の後ろに挿入される可能性のある文章の関連度を示した後関連度列及び、その文章の前に挿入される可能性のある文章の関連度を示した前関連度列からなる。後関連度及び前関連度は(文章順番番号,関連度)の形式で保持するものとする。
具体例を挙げて説明する。例えば、以下の文書がテンプレートとして入力されていたとする。
<文書例>
「ファイルAを読み込む。ファイルAをファイルBにバックアップとして出力しておく。ファイルAの内容を修正する。修正した内容をファイルAに出力する。ファイルAの出力に成功した場合、ファイルBを削除する。」
この場合、図3に示すような形式でテーブルに格納されることとなる。
続いて図4を参照して、添削文章抽出部103が、添削文書を入力として抜けている文章の抽出をする方法について説明する。
ユーザが添削文書を入力し、添削文章抽出部103が、入力装置200から添削文書を受け付ける(ステップS21)。
読み込んだ文書を句点単位で文章に区切り、各文章からキーワードを抽出し、キーワードが一致する文章をテンプレート/関連度格納部102から検索する(ステップS22)。
一致する文章が検索されれば、その前後の文章に対してもテンプレート/関連度格納部102からキーワードが一致する文章になっているか検索をする(ステップS23)。
もし、一致するキーワードが存在すれば(ステップS24においてNo)、抜けや漏れはないと考え、次の文章を対象として処理を続ける(ステップS22)。
一方、一致するキーワードが存在しない場合は(ステップS24においてYes)、添削文章抽出部103が、一致した文章の前関連度、後関連度を用いて漏れている文章の候補を抽出し、出力装置300が出力する(ステップS22)。
具体例を挙げて説明する。上述した説明と同様に以下の文書がテンプレートとして入力されていたとする。
<文書例>
「ファイルAを読み込む。ファイルAをファイルBにバックアップとして出力しておく。ファイルAの内容を修正する。修正した内容をファイルAに出力する。ファイルAの出力に成功した場合、ファイルBを削除する。」
この場合、図3に示すような形式でテーブルに格納されている。
この状態で、もし文章順番番号2の文章が漏れている文書を添削文書として入力された場合は、1の文章の後ろに後関連度が高い文章順、つまり文章順番番号2→3→4→5の順番となり、3の文章の前に前関連度が高い文章順、つまり文章順番番号2→1の順番で摘出される。また、この場合1及び3,4,5は既に添削文書に記載されているため、指摘文章としては出力しない。結果として、文章順番番号1及び3の間に2が挿入される形式で文書に挿入し出力する。なお、文書として出力するのではなく、挿入候補を出力するようにしてもよい。上述の例でいえば、単に「文章順番番号2の文章が漏れていると考えられる」旨のみを出力するようにしてもよい。更に、「1の後関連度が高い文章を順に」示して挿入候補として出力するようにしてもよい。加えて、「3の前関連度が高い文章を順に」示して挿入候補として出力するようにしてもよい。
以上説明した本実施形態では、テンプレートに記載された文書からキーワードを読み込み、キーワードと文章の前後関係、文章間の距離において関連度を算出する。これにより、文章単位で抜けや漏れのある文章を指摘することが可能となるという効果を奏する。
これにより、ある一定の書式が定まっているが、文書ごとに自由度が求められるような文書(ソフトウェアの設計書や報告書など)において漏れがない文書を作成することができる。そのため、文書の修正や再作成といった工数の短縮化が図れるという効果を奏する。
続いて、上述の実施形態を変形した変形例について説明する。本変形例の構成は、図1に示される上述の実施形態の構成と同様である。
本変形例では、テンプレート文書に含まれるキーワードを文章に含まれる単語ではなく、章題を指定する。これにより文書の中での大まかな添削を行うことが可能となる。これにより、文章の骨格を作成する段階での添削も可能である。
また、上記実施形態では、各装置が隣接しているものとして説明した。しかし、各装置を別のコンピュータとして実現し、バスやUSB規格に準拠したケーブル、インターネット等の手段を用いて接続するようにしてもよい。また、接続は有線接続であってもよいがその一部又は全部を無線による接続としてもよい。
更に、上記実施形態では、プログラムが、文章添削装置に予め記憶されているものとして説明した。しかし、コンピュータを、文章添削装置の全部又は一部として動作させ、あるいは、上述の処理を実行させるためのプログラムを、フレキシブルディスク、CD−ROM(Compact Disc Read-Only Memory)、DVD(Digital Versatile Disc)、MO(Magneto Optical Disk(Disc))BD(Blu-ray Disc)等のコンピュータ読み取り可能な記録媒体に格納して配布し、これを別のコンピュータにインストールし、上述の手段として動作させ、あるいは、上述の工程を実行させてもよい。
さらに、インターネット上のサーバ装置が有するディスク装置等にプログラムを格納しておき、例えば、搬送波にプログラムを重畳させて、コンピュータにダウンロード等してプログラムを実行してもよい。
なお、本発明の実施形態である文章添削装置は、ハードウェアにより実現することもできるが、コンピュータをその文章添削装置として機能させるためのプログラムをコンピュータがコンピュータ読み取り可能な記録媒体から読み込んで実行することによっても実現することができる。
また、本発明の実施形態による文章添削方法は、ハードウェアにより実現することもできるが、コンピュータにその方法を実行させるためのプログラムをコンピュータがコンピュータ読み取り可能な記録媒体から読み込んで実行することによっても実現することができる。
また、上述した実施形態は、本発明の好適な実施形態ではあるが、上記実施形態のみに本発明の範囲を限定するものではなく、本発明の要旨を逸脱しない範囲において種々の変更を施した形態での実施が可能である。例えば上述の説明においては各装置を機能毎に分類して図示したが単一の装置により各機能を実現するようにしてもよい。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1) 添削対象の文書の添削を行う添削装置において、
正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力する添削文章抽出手段と、
を備えることを特徴とする添削装置。
(付記2) 付記1に記載の添削装置において、
前記算出した文章間の距離が近いほど前記関連度を高くし、前記算出した文章内に含まれるキーワードの個数が多いほど前記関連度を高くし、前記算出した文章内に含まれるキーワードの個数がゼロの場合は前記関連度をゼロとする、ことにより前記関連度を算出することを特徴とする添削装置。
(付記3) 付記1又は2に記載の添削装置において、
前記関連度は文章の前後関係を加味して、自身より前に位置する文章との関連度である前関連度と、自身より後ろに位置する文章との関連度である後関連度と、の2つの関連度を算出しており、
前記第1の文章の前の文章とキーワードが一致する文章が前記テーブルに存在しない場合は、前記第2の文章との前記前関連度が高い文章を漏れている文章の候補として出力し、前記第1の文章の後ろの文章とキーワードが一致する文章が前記テーブルに存在しない場合は、前記第2の文章との前記後関連度が高い文章を漏れている文章の候補として出力することを特徴とする添削装置。
(付記4) 付記1乃至3の何れか1に記載の添削装置において、
前記漏れている文章の候補として、前記第2の文章との関連度が高い順に複数の文章を出力することを特徴とする添削装置。
(付記5) 付記1乃至4の何れか1に記載の添削装置において、
前記キーワードとは、文章の中の単語であって他の文章と関連性が出やすい単語であり、予めユーザに指定された単語であることを特徴とする添削装置。
(付記6) 付記1乃至5の何れか1に記載の添削装置において、
前記テンプレート文書及び添削文書を句点で区切り、当該区切った文をそれぞれ前記文章として扱うことを特徴とする添削装置。
(付記7) 付記1乃至6の何れか1に記載の添削装置において、
前記キーワードに変えて章題を用いることを特徴とする添削装置。
(付記8) 添削対象の文書の添削を行う添削装置が行う添削方法において、
正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成し、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力することを特徴とする添削方法。
(付記9) 添削対象の文書の添削を行う添削装置に組み込まれる添削プログラムにおいて、
正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力する添削文章抽出手段と、
を備える添削装置としてコンピュータを機能させることを特徴とする添削プログラム。
本発明は、ソフトウェア設計や、報告書等を含む一定の書式が定まっており、内容に
記載漏れがあってはならない文書の添削に好適である。
100 文章添削装置
101 関連度算出部
102 テンプレート/関連度格納部
103 添削文章抽出部
200 入力装置
300 出力装置

Claims (9)

  1. 添削対象の文書の添削を行う添削装置において、
    正しい順序で記載されている文書であって該文書を文章単位で区切った場合に各文章に含まれる一つ以上のキーワードの組み合わせが各文章間で完全には一致しない文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、
    添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度がある文章を関連度が高い文章から順に漏れている文章の候補として出力する添削文章抽出手段と、
    を備えることを特徴とする添削装置。
  2. 請求項1に記載の添削装置において、
    前記算出した文章間の距離が近いほど前記関連度を高くし、前記算出した文章内に含まれる文章間で一致するキーワードの個数が多いほど前記関連度を高くし、前記算出した文章内に含まれる文章間で一致するキーワードの個数がゼロの場合は前記関連度をゼロとする、ことにより前記関連度を算出することを特徴とする添削装置。
  3. 請求項1又は2に記載の添削装置において、
    前記関連度は文章の前後関係を加味して、自身より前に位置する文章との関連度である前関連度と、自身より後ろに位置する文章との関連度である後関連度と、の2つの関連度を算出しており、
    前記第1の文章の前の文章とキーワードが一致する文章が前記テーブルに存在しない場合は、前記第2の文章との前記前関連度が高い文章を漏れている文章の候補として出力し、前記第1の文章の後ろの文章とキーワードが一致する文章が前記テーブルに存在しない場合は、前記第2の文章との前記後関連度が高い文章を漏れている文章の候補として出力することを特徴とする添削装置。
  4. 請求項1乃至3の何れか1項に記載の添削装置において、
    前記漏れている文章の候補として、前記第2の文章との関連度が高い順に複数の文章を出力することを特徴とする添削装置。
  5. 請求項1乃至4の何れか1項に記載の添削装置において、
    前記キーワードとは、文章の中の単語であって他の文章と関連性が出やすい単語であり、予めユーザに指定された単語であることを特徴とする添削装置。
  6. 請求項1乃至5の何れか1項に記載の添削装置において、
    前記テンプレート文書及び添削文書を句点で区切り、当該区切った文をそれぞれ前記文章として扱うことを特徴とする添削装置。
  7. 請求項1乃至6の何れか1項に記載の添削装置において、
    前記キーワードに変えて章題を用いることを特徴とする添削装置。
  8. 添削対象の文書の添削を行う添削装置が行う添削方法において、
    正しい順序で記載されている文書であって該文書を文章単位で区切った場合に各文章に含まれる一つ以上のキーワードの組み合わせが各文章間で完全には一致しない文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成し、
    添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度がある文章を関連度が高い文章から順に漏れている文章の候補として出力することを特徴とする添削方法。
  9. 添削対象の文書の添削を行う添削装置に組み込まれる添削プログラムにおいて、
    正しい順序で記載されている文書であって該文書を文章単位で区切った場合に各文章に含まれる一つ以上のキーワードの組み合わせが各文章間で完全には一致しない文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、
    添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度がある文章を関連度が高い文章から順に漏れている文章の候補として出力する添削文章抽出手段と、
    を備える添削装置としてコンピュータを機能させることを特徴とする添削プログラム。
JP2011098247A 2011-04-26 2011-04-26 文書添削装置、文書添削方法及び文書添削プログラム Active JP5578623B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011098247A JP5578623B2 (ja) 2011-04-26 2011-04-26 文書添削装置、文書添削方法及び文書添削プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011098247A JP5578623B2 (ja) 2011-04-26 2011-04-26 文書添削装置、文書添削方法及び文書添削プログラム

Publications (2)

Publication Number Publication Date
JP2012230539A JP2012230539A (ja) 2012-11-22
JP5578623B2 true JP5578623B2 (ja) 2014-08-27

Family

ID=47432038

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011098247A Active JP5578623B2 (ja) 2011-04-26 2011-04-26 文書添削装置、文書添削方法及び文書添削プログラム

Country Status (1)

Country Link
JP (1) JP5578623B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112631923B (zh) * 2020-12-29 2024-04-12 中国农业银行股份有限公司 一种测试数据的确定方法、装置及电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232871A (ja) * 1997-02-19 1998-09-02 Sharp Corp 検索装置
JP3429184B2 (ja) * 1998-03-19 2003-07-22 シャープ株式会社 テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
JP2001249608A (ja) * 2000-03-02 2001-09-14 Vlc Co Ltd 電子通信を用いた自動採点・添削方法及びシステム
JP2004086851A (ja) * 2002-06-27 2004-03-18 Oki Electric Ind Co Ltd 電子文書有意更新検知装置、方法及びプログラム、並びに、電子文書有意更新検知プログラムを記録した記録媒体
JP3765798B2 (ja) * 2003-05-27 2006-04-12 沖電気工業株式会社 文書対応関係検査装置、翻訳処理装置、文書対応関係検査方法、翻訳処理方法、および文書対応関係検査プログラム
JP2010009118A (ja) * 2008-06-24 2010-01-14 Omron Corp 文書解析システム、文書解析方法、文書解析プログラム、および、記録媒体

Also Published As

Publication number Publication date
JP2012230539A (ja) 2012-11-22

Similar Documents

Publication Publication Date Title
JP5426710B2 (ja) 検索支援装置、検索支援方法およびプログラム
US9286526B1 (en) Cohort-based learning from user edits
JP5071373B2 (ja) 言語処理装置、言語処理方法および言語処理用プログラム
KR101544690B1 (ko) 단어 분할 장치, 단어 분할 방법 및 단어 분할 프로그램
JP4372133B2 (ja) 辞書登録装置、辞書登録方法及び辞書登録プログラム
JP5845888B2 (ja) ソフトウェア修正装置、ソフトウェア修正システム、ソフトウェア修正方法、及び、ソフトウェア修正プログラム
JP5578623B2 (ja) 文書添削装置、文書添削方法及び文書添削プログラム
US8135573B2 (en) Apparatus, method, and computer program product for creating data for learning word translation
JP6705352B2 (ja) 言語処理装置、言語処理方法、及び言語処理プログラム
US10255904B2 (en) Reading-aloud information editing device, reading-aloud information editing method, and computer program product
JP6648421B2 (ja) 文書を処理する情報処理装置、情報処理方法、およびプログラム
JP4734400B2 (ja) 文書検索装置およびプログラム
JP6131765B2 (ja) 情報処理装置及び情報処理プログラム
US20120254738A1 (en) Time-series information generating apparatus and time-series information generating method
Raja et al. Exploring Edit Distance for Normalising Out-of-Vocabulary Malay Words on Social Media
JP2013206261A (ja) 構造化データ生成装置、データ処理装置、構造化データ生成方法、及び構造化データ生成プログラム
KR20160053587A (ko) 엔-그램 언어 모델의 데이터베이스 사이즈 최소화 방법
JPWO2012131822A1 (ja) 音声認識結果整形装置、音声認識結果整形方法及びプログラム
JP6055267B2 (ja) 文字列分割装置、モデルファイル学習装置および文字列分割システム
JP6300596B2 (ja) 辞書装置、形態素解析装置、データ構造ならびに形態素解析の方法およびプログラム
KR20240070874A (ko) 텍스트 데이터에 대한 띄어쓰기 교정 수행 방법 및 텍스트 데이터에 대한 띄어쓰기 교정 수행 장치
JP2007219586A (ja) ソースコード解析装置
JP2009258887A (ja) 機械翻訳装置及び機械翻訳プログラム
JP2017162390A (ja) 言語処理装置、方法、およびプログラム
JP2022175661A (ja) 校正支援装置、校正支援方法、及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131105

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140106

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20140609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140613

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140703

R150 Certificate of patent or registration of utility model

Ref document number: 5578623

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150