JP5578623B2 - 文書添削装置、文書添削方法及び文書添削プログラム - Google Patents
文書添削装置、文書添削方法及び文書添削プログラム Download PDFInfo
- Publication number
- JP5578623B2 JP5578623B2 JP2011098247A JP2011098247A JP5578623B2 JP 5578623 B2 JP5578623 B2 JP 5578623B2 JP 2011098247 A JP2011098247 A JP 2011098247A JP 2011098247 A JP2011098247 A JP 2011098247A JP 5578623 B2 JP5578623 B2 JP 5578623B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- document
- correction
- sentences
- relevance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
そこで、本発明は、或る一定の書式が定まっているが、文書ごとに自由度が求められるような文書(ソフトウェアの設計書や報告書など)において漏れがない文書を作成することが可能な、文書添削装置、文書添削方法及び文書添削プログラムを提供することを目的とする。
正しい順序で記載されている文書であって該文書を文章単位で区切った場合に各文章に含まれる一つ以上のキーワードの組み合わせが各文章間で完全には一致しない文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度がある文章を関連度が高い文章から順に漏れている文章の候補として出力する添削文章抽出手段と、を備えることを特徴とする添削装置が提供される。
・・・数式1
<文書例>
「ファイルAを読み込む。ファイルAをファイルBにバックアップとして出力しておく。ファイルAの内容を修正する。修正した内容をファイルAに出力する。ファイルAの出力に成功した場合、ファイルBを削除する。」
この場合、図3に示すような形式でテーブルに格納されることとなる。
<文書例>
「ファイルAを読み込む。ファイルAをファイルBにバックアップとして出力しておく。ファイルAの内容を修正する。修正した内容をファイルAに出力する。ファイルAの出力に成功した場合、ファイルBを削除する。」
正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力する添削文章抽出手段と、
を備えることを特徴とする添削装置。
前記算出した文章間の距離が近いほど前記関連度を高くし、前記算出した文章内に含まれるキーワードの個数が多いほど前記関連度を高くし、前記算出した文章内に含まれるキーワードの個数がゼロの場合は前記関連度をゼロとする、ことにより前記関連度を算出することを特徴とする添削装置。
前記関連度は文章の前後関係を加味して、自身より前に位置する文章との関連度である前関連度と、自身より後ろに位置する文章との関連度である後関連度と、の2つの関連度を算出しており、
前記第1の文章の前の文章とキーワードが一致する文章が前記テーブルに存在しない場合は、前記第2の文章との前記前関連度が高い文章を漏れている文章の候補として出力し、前記第1の文章の後ろの文章とキーワードが一致する文章が前記テーブルに存在しない場合は、前記第2の文章との前記後関連度が高い文章を漏れている文章の候補として出力することを特徴とする添削装置。
前記漏れている文章の候補として、前記第2の文章との関連度が高い順に複数の文章を出力することを特徴とする添削装置。
前記キーワードとは、文章の中の単語であって他の文章と関連性が出やすい単語であり、予めユーザに指定された単語であることを特徴とする添削装置。
前記テンプレート文書及び添削文書を句点で区切り、当該区切った文をそれぞれ前記文章として扱うことを特徴とする添削装置。
前記キーワードに変えて章題を用いることを特徴とする添削装置。
正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成し、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力することを特徴とする添削方法。
正しい順序で記載されている文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度が高い文章を漏れている文章の候補として出力する添削文章抽出手段と、
を備える添削装置としてコンピュータを機能させることを特徴とする添削プログラム。
記載漏れがあってはならない文書の添削に好適である。
101 関連度算出部
102 テンプレート/関連度格納部
103 添削文章抽出部
200 入力装置
300 出力装置
Claims (9)
- 添削対象の文書の添削を行う添削装置において、
正しい順序で記載されている文書であって該文書を文章単位で区切った場合に各文章に含まれる一つ以上のキーワードの組み合わせが各文章間で完全には一致しない文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度がある文章を関連度が高い文章から順に漏れている文章の候補として出力する添削文章抽出手段と、
を備えることを特徴とする添削装置。 - 請求項1に記載の添削装置において、
前記算出した文章間の距離が近いほど前記関連度を高くし、前記算出した文章内に含まれる文章間で一致するキーワードの個数が多いほど前記関連度を高くし、前記算出した文章内に含まれる文章間で一致するキーワードの個数がゼロの場合は前記関連度をゼロとする、ことにより前記関連度を算出することを特徴とする添削装置。 - 請求項1又は2に記載の添削装置において、
前記関連度は文章の前後関係を加味して、自身より前に位置する文章との関連度である前関連度と、自身より後ろに位置する文章との関連度である後関連度と、の2つの関連度を算出しており、
前記第1の文章の前の文章とキーワードが一致する文章が前記テーブルに存在しない場合は、前記第2の文章との前記前関連度が高い文章を漏れている文章の候補として出力し、前記第1の文章の後ろの文章とキーワードが一致する文章が前記テーブルに存在しない場合は、前記第2の文章との前記後関連度が高い文章を漏れている文章の候補として出力することを特徴とする添削装置。 - 請求項1乃至3の何れか1項に記載の添削装置において、
前記漏れている文章の候補として、前記第2の文章との関連度が高い順に複数の文章を出力することを特徴とする添削装置。 - 請求項1乃至4の何れか1項に記載の添削装置において、
前記キーワードとは、文章の中の単語であって他の文章と関連性が出やすい単語であり、予めユーザに指定された単語であることを特徴とする添削装置。 - 請求項1乃至5の何れか1項に記載の添削装置において、
前記テンプレート文書及び添削文書を句点で区切り、当該区切った文をそれぞれ前記文章として扱うことを特徴とする添削装置。 - 請求項1乃至6の何れか1項に記載の添削装置において、
前記キーワードに変えて章題を用いることを特徴とする添削装置。 - 添削対象の文書の添削を行う添削装置が行う添削方法において、
正しい順序で記載されている文書であって該文書を文章単位で区切った場合に各文章に含まれる一つ以上のキーワードの組み合わせが各文章間で完全には一致しない文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成し、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度がある文章を関連度が高い文章から順に漏れている文章の候補として出力することを特徴とする添削方法。 - 添削対象の文書の添削を行う添削装置に組み込まれる添削プログラムにおいて、
正しい順序で記載されている文書であって該文書を文章単位で区切った場合に各文章に含まれる一つ以上のキーワードの組み合わせが各文章間で完全には一致しない文書であるテンプレート文書の入力を受け付けると、当該テンプレート文書を文章単位で区切り、各文章の組合せ毎に文章間の距離を算出し、文章毎に文章内に含まれるキーワードの個数を算出し、前記算出した文章間の距離及びキーワードの個数に基づいて各文章間の関連度を算出することによりテーブルを生成する関連度算出手段と、
添削対象の文書である添削文書の入力を受け付けると、当該添削文書と前記テーブルを比較し、添削文書内の第1の文章とキーワードが一致する文章である第2の文章が前記テーブルに存在した場合であって、前記第1の文章の前後の文章とキーワードが一致する文章が前記テーブルに存在しない場合には、前記第2の文章との関連度がある文章を関連度が高い文章から順に漏れている文章の候補として出力する添削文章抽出手段と、
を備える添削装置としてコンピュータを機能させることを特徴とする添削プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011098247A JP5578623B2 (ja) | 2011-04-26 | 2011-04-26 | 文書添削装置、文書添削方法及び文書添削プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011098247A JP5578623B2 (ja) | 2011-04-26 | 2011-04-26 | 文書添削装置、文書添削方法及び文書添削プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012230539A JP2012230539A (ja) | 2012-11-22 |
JP5578623B2 true JP5578623B2 (ja) | 2014-08-27 |
Family
ID=47432038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011098247A Active JP5578623B2 (ja) | 2011-04-26 | 2011-04-26 | 文書添削装置、文書添削方法及び文書添削プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5578623B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112631923B (zh) * | 2020-12-29 | 2024-04-12 | 中国农业银行股份有限公司 | 一种测试数据的确定方法、装置及电子设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10232871A (ja) * | 1997-02-19 | 1998-09-02 | Sharp Corp | 検索装置 |
JP3429184B2 (ja) * | 1998-03-19 | 2003-07-22 | シャープ株式会社 | テキスト構造解析装置および抄録装置、並びにプログラム記録媒体 |
JP2001249608A (ja) * | 2000-03-02 | 2001-09-14 | Vlc Co Ltd | 電子通信を用いた自動採点・添削方法及びシステム |
JP2004086851A (ja) * | 2002-06-27 | 2004-03-18 | Oki Electric Ind Co Ltd | 電子文書有意更新検知装置、方法及びプログラム、並びに、電子文書有意更新検知プログラムを記録した記録媒体 |
JP3765798B2 (ja) * | 2003-05-27 | 2006-04-12 | 沖電気工業株式会社 | 文書対応関係検査装置、翻訳処理装置、文書対応関係検査方法、翻訳処理方法、および文書対応関係検査プログラム |
JP2010009118A (ja) * | 2008-06-24 | 2010-01-14 | Omron Corp | 文書解析システム、文書解析方法、文書解析プログラム、および、記録媒体 |
-
2011
- 2011-04-26 JP JP2011098247A patent/JP5578623B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012230539A (ja) | 2012-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5426710B2 (ja) | 検索支援装置、検索支援方法およびプログラム | |
US9286526B1 (en) | Cohort-based learning from user edits | |
JP5071373B2 (ja) | 言語処理装置、言語処理方法および言語処理用プログラム | |
KR101544690B1 (ko) | 단어 분할 장치, 단어 분할 방법 및 단어 분할 프로그램 | |
JP4372133B2 (ja) | 辞書登録装置、辞書登録方法及び辞書登録プログラム | |
JP5845888B2 (ja) | ソフトウェア修正装置、ソフトウェア修正システム、ソフトウェア修正方法、及び、ソフトウェア修正プログラム | |
JP5578623B2 (ja) | 文書添削装置、文書添削方法及び文書添削プログラム | |
US8135573B2 (en) | Apparatus, method, and computer program product for creating data for learning word translation | |
JP6705352B2 (ja) | 言語処理装置、言語処理方法、及び言語処理プログラム | |
US10255904B2 (en) | Reading-aloud information editing device, reading-aloud information editing method, and computer program product | |
JP6648421B2 (ja) | 文書を処理する情報処理装置、情報処理方法、およびプログラム | |
JP4734400B2 (ja) | 文書検索装置およびプログラム | |
JP6131765B2 (ja) | 情報処理装置及び情報処理プログラム | |
US20120254738A1 (en) | Time-series information generating apparatus and time-series information generating method | |
Raja et al. | Exploring Edit Distance for Normalising Out-of-Vocabulary Malay Words on Social Media | |
JP2013206261A (ja) | 構造化データ生成装置、データ処理装置、構造化データ生成方法、及び構造化データ生成プログラム | |
KR20160053587A (ko) | 엔-그램 언어 모델의 데이터베이스 사이즈 최소화 방법 | |
JPWO2012131822A1 (ja) | 音声認識結果整形装置、音声認識結果整形方法及びプログラム | |
JP6055267B2 (ja) | 文字列分割装置、モデルファイル学習装置および文字列分割システム | |
JP6300596B2 (ja) | 辞書装置、形態素解析装置、データ構造ならびに形態素解析の方法およびプログラム | |
KR20240070874A (ko) | 텍스트 데이터에 대한 띄어쓰기 교정 수행 방법 및 텍스트 데이터에 대한 띄어쓰기 교정 수행 장치 | |
JP2007219586A (ja) | ソースコード解析装置 | |
JP2009258887A (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP2017162390A (ja) | 言語処理装置、方法、およびプログラム | |
JP2022175661A (ja) | 校正支援装置、校正支援方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130708 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131105 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140106 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20140609 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140613 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140703 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5578623 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |