JPS638858A - 日本語文書の文体チエツク処理方式 - Google Patents
日本語文書の文体チエツク処理方式Info
- Publication number
- JPS638858A JPS638858A JP61152520A JP15252086A JPS638858A JP S638858 A JPS638858 A JP S638858A JP 61152520 A JP61152520 A JP 61152520A JP 15252086 A JP15252086 A JP 15252086A JP S638858 A JPS638858 A JP S638858A
- Authority
- JP
- Japan
- Prior art keywords
- expression
- sentence
- style
- expressions
- japanese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title description 12
- 230000014509 gene expression Effects 0.000 claims abstract description 78
- 238000012937 correction Methods 0.000 claims description 17
- 238000000034 method Methods 0.000 claims description 11
- 241001122315 Polites Species 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 4
- 238000003672 processing method Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 11
- 241000282412 Homo Species 0.000 description 2
- 241000277269 Oncorhynchus masou Species 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 241001385733 Aesculus indica Species 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[概 要]
日本語編集プログラムにより作成された日本語文書の文
体の統一性を調べるため、文末の助動詞表現のうち明ら
かに常体または敬体と判断される表現を選び、文書の文
末表現と比較することにより文体を判断し、文体統一の
ための修正個所を指摘するようにしたものである。
体の統一性を調べるため、文末の助動詞表現のうち明ら
かに常体または敬体と判断される表現を選び、文書の文
末表現と比較することにより文体を判断し、文体統一の
ための修正個所を指摘するようにしたものである。
[産業上の利用分野]
本発明は、日本語編集プログラムによって作られた日本
語文書に対して文体の統一性を調べる方式に関する。
語文書に対して文体の統一性を調べる方式に関する。
日本語文書の文体を決める一つの方法に、それが敬体(
です・ます調)か常体(である調)であるかを調べるこ
とがある。
です・ます調)か常体(である調)であるかを調べるこ
とがある。
第6図に示すように、常体表現と敬体表現とが混用され
ている文書は、読んでみて非常にちぐはぐの感じを受け
る。
ている文書は、読んでみて非常にちぐはぐの感じを受け
る。
文書全体がどちらかの文体で統一されていることが正し
い日本語文書を執筆する上で要件される。
い日本語文書を執筆する上で要件される。
従って、作成された日本語文書の文体をチェックするこ
とが必要とされる。
とが必要とされる。
[従来の技術]
従来の文体チェックの方法としては、作成された日本語
文書に対して、印刷結果を読み手が見て、敬体か常体か
を判断し、文体統一のためには人間が修正作業を行うも
のであった。
文書に対して、印刷結果を読み手が見て、敬体か常体か
を判断し、文体統一のためには人間が修正作業を行うも
のであった。
し発明が解決しようとする問題点]
従来の印刷された日本語文書の文体を人間の目で見て判
断する方法では、チェックのための印刷を必要とし、読
むための時間と労力を要し、見落しなどのチェック洩れ
の問題を生じていた。
断する方法では、チェックのための印刷を必要とし、読
むための時間と労力を要し、見落しなどのチェック洩れ
の問題を生じていた。
本発明はこのような従来の問題点を解消した新規な文体
チェック処理方式を提供しようとするものである。
チェック処理方式を提供しようとするものである。
[問題点を解決するための手段]
第1図は本発明の文体チェック処理方式の原理ブロック
図を示す。
図を示す。
第1図において、1は文末表現抽出手段であり、入力さ
れた日本語文書の各々の文の文末の助動詞の表現を、予
め選定した複数個の文末表現と比較し、一致するものを
抽出する。
れた日本語文書の各々の文の文末の助動詞の表現を、予
め選定した複数個の文末表現と比較し、一致するものを
抽出する。
2は敬体表現計数手段であり、文末表現抽出手段1によ
り抽出された文末表現より敬体表現の数を計数する。
り抽出された文末表現より敬体表現の数を計数する。
3は常体表現計数手段であり、同じく抽出された文末表
現より常体表現の数を計数する。
現より常体表現の数を計数する。
4は比較手段であり、敬体表現計数手段2の計数値と常
体表現計数手段3の計数値とを比較する。
体表現計数手段3の計数値とを比較する。
5は文体判断手段であり、比較手段4の比較結果により
入力された日本語文書の文体が敬体であるか、常体であ
るかを判断する。
入力された日本語文書の文体が敬体であるか、常体であ
るかを判断する。
6は修正個所指摘手段であり、文体判断手段5の判断し
た文体に統一するよう修正するための個所を指摘する。
た文体に統一するよう修正するための個所を指摘する。
[作用]
日本語文書の文末の助動詞の表現がら代表的なものを選
定する。例えば、敬体の文末表現として、「です」、「
まず」、「ました」、「でしよう」等を、常体の文末表
現として、「ある」、「する」、「なる」等を選定する
。
定する。例えば、敬体の文末表現として、「です」、「
まず」、「ました」、「でしよう」等を、常体の文末表
現として、「ある」、「する」、「なる」等を選定する
。
入力された日本語文書の各文の文末をこれらと比較し、
一致したものを抽出し、敬体の表現と常体の表現の数を
計数し、これらを比較する。
一致したものを抽出し、敬体の表現と常体の表現の数を
計数し、これらを比較する。
入力された日本語文書の文末表現において、敬体と常体
との出現数の多い方で統一されていると仮定して、文体
を判断する。
との出現数の多い方で統一されていると仮定して、文体
を判断する。
文体判断の結果に基づいて、文体を統一するため、少な
い方の側の文末表現を修正するよう修正個所を指摘する
。
い方の側の文末表現を修正するよう修正個所を指摘する
。
指摘された修正個所は、日本語編集プログラムの本来持
つ修正機能により修正することにより、より正しい日本
語文書を執筆することが可能となる。
つ修正機能により修正することにより、より正しい日本
語文書を執筆することが可能となる。
このように、本発明の敬体チェック方式は、入力された
日本語文書の文体を自動的に判断し、文体統一のための
修正個所を指摘するものである。
日本語文書の文体を自動的に判断し、文体統一のための
修正個所を指摘するものである。
[実施例]
以下第2図〜第5図に示す実施例により、本発明をさら
に具体的に説明する。
に具体的に説明する。
第2図は本発明を適用した日本語文書作成装置の実施例
を示す図である。
を示す図である。
図において、10は日本語ワードプロセッサまたは汎用
計算機において備えている日本語編集プログラムであり
、人間によりキー人力された日本語文書を編集する。
計算機において備えている日本語編集プログラムであり
、人間によりキー人力された日本語文書を編集する。
20は、人間によりキー人力され、日本語編集ブログラ
ム10により編集されて作成された日本語文書である。
ム10により編集されて作成された日本語文書である。
30は、本発明による敬体/常体チェックを示し、入力
された日本語文書20をチェックし、文体を判断して文
体統一のための修正個所を、40で示すチェックリスト
として出力する。
された日本語文書20をチェックし、文体を判断して文
体統一のための修正個所を、40で示すチェックリスト
として出力する。
チェックリスト40は、日本語編集プログラム10に入
力され、その修正機能により修正され、より正しい日本
語文書として出力される。
力され、その修正機能により修正され、より正しい日本
語文書として出力される。
第3図は本発明の実施例による処理を示すフローチャー
トである。
トである。
第3図(alはフローチャートであり、(b)はこの処
理のためメモリ内に準備するテーブルである。
理のためメモリ内に準備するテーブルである。
以下、フローチャートに従って本実施例による処理を説
明する。
明する。
■日本語文書が文字コード列として格納しであるフロッ
ピィディスクから文字コード列を順次読み出す。
ピィディスクから文字コード列を順次読み出す。
■読み出した文字コード列から文末の句点(。)を検出
する。
する。
■検出した句点の前の4文字を抽出する。
■抽出した4文字を、敬体表現リスト31に格納してい
る各敬体表現と次々に比較し、−敗がとれれば、■に飛
び敬体カウンタ33をカウントアツプし、[相]でその
文字列位置を敬体表現位置レジスタ35に記憶させる。
る各敬体表現と次々に比較し、−敗がとれれば、■に飛
び敬体カウンタ33をカウントアツプし、[相]でその
文字列位置を敬体表現位置レジスタ35に記憶させる。
一致がとれ なければ、ステップ■へ進む。
■抽出した4文字を、常体表現リスト32に格納してい
る各常体表現と次々に比較し、一致がとれれば、■に飛
び敬体カウンタ34をカウントアツプし、■でその文字
列位置を常体表現位置レジスタ36に記憶させる。一致
がとれなければ、ステップ■へ進む。
る各常体表現と次々に比較し、一致がとれれば、■に飛
び敬体カウンタ34をカウントアツプし、■でその文字
列位置を常体表現位置レジスタ36に記憶させる。一致
がとれなければ、ステップ■へ進む。
■文書の最終か否かを判断し、最終でなければステップ
■へ戻る。最終であれば、ステップ■へ進む。
■へ戻る。最終であれば、ステップ■へ進む。
■および■、ならびに■および[相]の処理が終ればス
テップ■へ戻る。
テップ■へ戻る。
このような処理を文書の終りまで繰り返し行う。
■敬体カウンタ33および常体カウンタ34の値を読み
出して、両者の大きさを比較する。
出して、両者の大きさを比較する。
[相]ステップ■の比較の結果、敬体のカウント値が多
ければ、この文書の文体は敬体と判定し、逆であれば常
体と判定する。文体が敬体と判定されればステップ0へ
進み、そうでなければステップ[相]へ進む。
ければ、この文書の文体は敬体と判定し、逆であれば常
体と判定する。文体が敬体と判定されればステップ0へ
進み、そうでなければステップ[相]へ進む。
■常体表現位置レジスタ36の内容を読み出す。
[相]敬体表現位置レジスタ35の内容を読み出す。
■ステップ[相]または■で読み出した文字列位置にア
ングラインを施すための表示制御処理を行う。
ングラインを施すための表示制御処理を行う。
これにより、文体チェックの処理を終了する。
第4図は本発明による処理例を示す図である。
第4図(alは処理例を示す文例であり、(blは処理
の経過を示す。
の経過を示す。
第4図(alおよび(b)を参照し、第4図(alに示
す入力文例について、処理の経過を説明すると次のとお
りである。
す入力文例について、処理の経過を説明すると次のとお
りである。
(1)入力された日本語文の文末表現のうち該当するも
のを抽出する。
のを抽出する。
(2)抽出された文末表現の中から敬体表現を計数する
。その結果2を得る。
。その結果2を得る。
(3)抽出された文末表現の中から常体表現を計数する
。その結果4を得る。
。その結果4を得る。
(41(21の結果と(3)の結果を比較する。その結
果、常体表現の数の方が多いことが判る。
果、常体表現の数の方が多いことが判る。
(5) +41の比較結果から入力された日本語文は常
体と判断する。
体と判断する。
+61 (51の判断結果により、敬体の文末表現「で
す」、「まず」を常体に修正するよう、その位置を指摘
する。
す」、「まず」を常体に修正するよう、その位置を指摘
する。
第5図は、本発明による修正個所指摘の表示例を示す図
である。
である。
本発明による修正個所指摘が日本語編集プログラムに入
力されると、その機能により修正個所が、アングライン
、反転表示等で表示され、自動修正を指示すれば自動的
に修正が行われる。
力されると、その機能により修正個所が、アングライン
、反転表示等で表示され、自動修正を指示すれば自動的
に修正が行われる。
[発明の効果]
以上説明のように本発明によれば、入力された日本語文
書の文体を自動的に判断し、文体統一のための修正個所
を指摘することができ、人間が印刷された日本語文書を
読み文体のチェックを行うという従来の方式に比べ、チ
ェック時間及び労力を短縮し、見落しによるチェック洩
れをなくすることが可能となり、その実用上の効果は大
である。
書の文体を自動的に判断し、文体統一のための修正個所
を指摘することができ、人間が印刷された日本語文書を
読み文体のチェックを行うという従来の方式に比べ、チ
ェック時間及び労力を短縮し、見落しによるチェック洩
れをなくすることが可能となり、その実用上の効果は大
である。
第1図は本発明の原理ブロック図、
第2図は本発明を適用した日本語文書作成装置の実施例
を示す図、 第3図は本発明の実施例による処理を示すフローチャー
ト、 第4図は本発明による処理例を示す図、第5図は本発明
による修正個所指摘の表示例を示す図、 第6図は日本語文例を示す図である。 図面において、 1は文末表現抽出手段、 2は敬体表現比較手段、3は
常体表現計数手段、 4は比較手段、5は文体判断手段
、 6は修正個所指摘手段、10は日本語編集プロ
グラム、 20は日本語文書、 30は敬体/常体チェック、 40はチェックリスト、 をそれぞれ示す。 本発明の原理ブロック図 第1図 第 2 図 本発明の実施例による処理を示すフローチャート第
3 図 fil 文末表現:敬体表覆=です、ます、ましな、で
しよう常体表現=ある、する、なる、あろう (2) 敬体表引軒数結果−2 (3) 常体表現針数結果〒4 141 kkm4m:9引く1貝(2)QR(14f
JJ (4)(5) 文体祠断卑課:常体 (6)1駈B口折闇鳴:第2行第9〜lα字第6行第加
〜21字 Cbl 処理経過 本発明による妨19柄?k1g 第4図 第5図 第6図
を示す図、 第3図は本発明の実施例による処理を示すフローチャー
ト、 第4図は本発明による処理例を示す図、第5図は本発明
による修正個所指摘の表示例を示す図、 第6図は日本語文例を示す図である。 図面において、 1は文末表現抽出手段、 2は敬体表現比較手段、3は
常体表現計数手段、 4は比較手段、5は文体判断手段
、 6は修正個所指摘手段、10は日本語編集プロ
グラム、 20は日本語文書、 30は敬体/常体チェック、 40はチェックリスト、 をそれぞれ示す。 本発明の原理ブロック図 第1図 第 2 図 本発明の実施例による処理を示すフローチャート第
3 図 fil 文末表現:敬体表覆=です、ます、ましな、で
しよう常体表現=ある、する、なる、あろう (2) 敬体表引軒数結果−2 (3) 常体表現針数結果〒4 141 kkm4m:9引く1貝(2)QR(14f
JJ (4)(5) 文体祠断卑課:常体 (6)1駈B口折闇鳴:第2行第9〜lα字第6行第加
〜21字 Cbl 処理経過 本発明による妨19柄?k1g 第4図 第5図 第6図
Claims (1)
- 【特許請求の範囲】 日本語編集プログラムにより作成された日本語文書のチ
ェック処理方式であって、 入力された日本語文書の各文の文末の表現を、予め選定
した複数個の文末表現と比較し、一致するものを抽出す
る文末表現抽出手段(1)と、文末表現抽出手段(1)
により抽出された文末表現より敬体表現の数を計数する
敬体表現計数手段(2)と、 同じく抽出された文末表現より常体表現の数を計数する
常体表現計数手段(3)と、 敬体表現計数手段(2)の計数値と常体表現計数手段(
3)の計数値とを比較する比較手段(4)と、比較手段
(4)の比較結果により前記日本語文書の文体を判断す
る文体判断手段(5)と、 判断手段(5)の判断結果に基づいて文末表現の修正個
所を指摘する修正個所指摘手段(6)とを備え、 各文の文末表現よりその文書の文体を判断し、文体統一
のための修正個所を指摘するよう構成したことを特徴と
する日本語文書の文体チェック処理方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61152520A JPH0754517B2 (ja) | 1986-06-28 | 1986-06-28 | 日本語文書の文体チェック処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61152520A JPH0754517B2 (ja) | 1986-06-28 | 1986-06-28 | 日本語文書の文体チェック処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS638858A true JPS638858A (ja) | 1988-01-14 |
JPH0754517B2 JPH0754517B2 (ja) | 1995-06-07 |
Family
ID=15542235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61152520A Expired - Lifetime JPH0754517B2 (ja) | 1986-06-28 | 1986-06-28 | 日本語文書の文体チェック処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0754517B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01191260A (ja) * | 1988-01-26 | 1989-08-01 | Nec Corp | 文章検査装置 |
JPH03246760A (ja) * | 1990-02-26 | 1991-11-05 | Matsushita Electric Ind Co Ltd | 日本語処理装置 |
EP0692765A3 (en) * | 1994-06-21 | 1996-07-31 | Canon Kk | System and method for text preparation using a knowledge base |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS621062A (ja) * | 1985-06-26 | 1987-01-07 | Toshiba Corp | 文書作成支援装置 |
JPS62180472A (ja) * | 1986-02-04 | 1987-08-07 | Nec Corp | 語調の不統一箇所検出方式 |
-
1986
- 1986-06-28 JP JP61152520A patent/JPH0754517B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS621062A (ja) * | 1985-06-26 | 1987-01-07 | Toshiba Corp | 文書作成支援装置 |
JPS62180472A (ja) * | 1986-02-04 | 1987-08-07 | Nec Corp | 語調の不統一箇所検出方式 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01191260A (ja) * | 1988-01-26 | 1989-08-01 | Nec Corp | 文章検査装置 |
JPH03246760A (ja) * | 1990-02-26 | 1991-11-05 | Matsushita Electric Ind Co Ltd | 日本語処理装置 |
EP0692765A3 (en) * | 1994-06-21 | 1996-07-31 | Canon Kk | System and method for text preparation using a knowledge base |
US5802504A (en) * | 1994-06-21 | 1998-09-01 | Canon Kabushiki Kaisha | Text preparing system using knowledge base and method therefor |
Also Published As
Publication number | Publication date |
---|---|
JPH0754517B2 (ja) | 1995-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0361464A2 (en) | Method and apparatus for producing an abstract of a document | |
EP0501770B1 (en) | Data base creating method and apparatus | |
US7107524B2 (en) | Computer implemented example-based concept-oriented data extraction method | |
US5270918A (en) | Automatic programming method | |
JPS638858A (ja) | 日本語文書の文体チエツク処理方式 | |
JP3131432B2 (ja) | 機械翻訳方法及び機械翻訳装置 | |
JP2870375B2 (ja) | 文章訂正装置 | |
JP2570681B2 (ja) | ワード・プロセッサ | |
JP3537570B2 (ja) | 日英混在文書のスペース検出方法、ピッチ書式判定方法及び定ピッチ英数文字列のスペース検出方法 | |
JPS61202273A (ja) | 電子式辞書 | |
JP2893239B2 (ja) | 翻訳支援辞書検索表示システム | |
JPH08153101A (ja) | 日本語文の校正方法 | |
CN117313817A (zh) | Java代码审计模型训练方法、装置、系统及存储介质 | |
JP2965578B2 (ja) | 文書作成支援方法 | |
JP2693489B2 (ja) | 日本語文誤り検出方法 | |
JP3747957B2 (ja) | 接続テーブル編集装置 | |
JPH0561856A (ja) | 文書作成装置 | |
JPS6274130A (ja) | プログラム構造資料作成処理装置 | |
JPS63317879A (ja) | 翻訳中間結果表示方法 | |
JPS62160534A (ja) | 文字列照合方式 | |
JPH06348697A (ja) | 日本語文章処理装置および日本語文章処理方法 | |
JPS63229561A (ja) | 文書作成・校正支援装置 | |
JPH11282838A (ja) | 入力補正方法及び入力補正装置 | |
JPH04139568A (ja) | 文書処理装置 | |
JPH03186932A (ja) | 字句解析における空白読み飛ばし装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |