JPH01191260A - 文章検査装置 - Google Patents

文章検査装置

Info

Publication number
JPH01191260A
JPH01191260A JP63016197A JP1619788A JPH01191260A JP H01191260 A JPH01191260 A JP H01191260A JP 63016197 A JP63016197 A JP 63016197A JP 1619788 A JP1619788 A JP 1619788A JP H01191260 A JPH01191260 A JP H01191260A
Authority
JP
Japan
Prior art keywords
expression
style
storage means
stored
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63016197A
Other languages
English (en)
Other versions
JPH0658667B2 (ja
Inventor
Shunichi Fukushima
俊一 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63016197A priority Critical patent/JPH0658667B2/ja
Publication of JPH01191260A publication Critical patent/JPH01191260A/ja
Publication of JPH0658667B2 publication Critical patent/JPH0658667B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、入力された文章から誤り箇所または不適切箇
所を検出する文章検査装置に関する。
(従来の技術) 日本語文章の文体は、常#:(だ・である体)と敬体(
です・ます体、であります体、ございます体)とに分け
ることかできる。例えば、次の(1)、(2)の文は常
体の文であり、(3)。
(4)の文は敬体の文である。
次の通りだ。           ・・・(1)次の
通りである。         ・・・(2)次の通り
です。          ・・・(3)次の通りでご
ざいます、      ・・・(4)一般に、ひとつの
文章中で、常体の文と敬体の文とが混在することは好ま
しくない。
そのような混在の検査は、従来、「日本語文章作成支援
システムCOMETJ  (福島・池、電子通信学会技
術研究報告0386−21.1986年)、特開昭61
−229155号公報「日本語ワード・プロセッシング
方式」などで述べられている。その方式は、文#(常体
/敬体)を特徴付ける表現を記憶する文体表現記憶手段
を用意し、文章中からこの文体表現記憶手段に記憶され
た表現を検出すると同時に、検出された表現の数を常体
と敬体とに分けてカウントするというものである。常体
と敬体の数かともに1以上であれば、常体と敬体とが混
在していることになる。
(発明が解決しようとする課題) 文体に関する検査としては、従来の常体と敬体との混在
に関する検査たけでなく、敬体や常体が使用されている
位置に関する検査が必要である。
この敬体や常体が使用されている位置に関する検査を、
例をあげて説明する。
次の(5)は常体の文であり、(6)、(7)。
(8)はともに(5)に対する敬体の文である。
しかし、同じ敬体の文であっても、(6)。
(7)、(8)では、文の途中の敬体の使用されている
位置・回数が異なる(下線部分が敬体を特徴付ける表現
である)、その結果、(5)<(6)<(7)<(8)
の順に丁寧さが増している。
データは次に示した通りだが、安易に結論は出せない。
            ・・・(5)データは次に示
した通りたが、安易に結論は出せません。      
     ・・・(6)データは次に示した通り1工が
、安易に結論は出せません。          ・・
・(7)データは次に示しました通りゴが、安易に結論
は出せません、        ・・・(8)常体の文
と敬体の文という区別だけでなく、敬体の文に関する様
々な形が日本語では許されるが、作成する文章の種類に
よっては、好ましくない形か存在する。例えば、社内文
書を考えた場合、(8)は過度に丁寧であり、避けたい
形である。
また、ひとつの文章中では、常体の文または敬体の文に
統一されているだけでなく、敬体の文の場合の敬体の使
用法も統一されているべきである。
例えば、次の(9)のような文章は、敬体の使用法か不
規則で、日本語として不自然である(下線部分が敬体を
特徴付ける表現である)。
超新星から届いたと考えられます素粒子のデータを収集
しましな、そのデータは、次に示した通りだか、安易に
結論は出せません。他のグループもデータを収集してい
ますが、そのデータとの比較が必要立並、    ・・
・(9)上記のような問題は、敬体や常体を使用する位
置に関する検査を行えば解決することができる。
例えば、文末(句点の直前)と接続助詞「が」の直前で
は敬体を使用し、池の位置では常体を使用するという条
件を定めて検査するならば、(5)〜(8)については
(5>、(6)、(8)は不適切で(7)が適切である
と判定される。同様に、くっ)は不適切であり、それに
対して、次の(10)のような文章は適切であると判定
されることになる(下線部分が敬体を特徴付ける表現で
ある)。
超新星から届いたと考えられる素粒子のデータを収集し
ましな、そのデータは、次に示した通りニエが、安易に
結論は出せません、他のグループもデータを収集してい
ますか、そのデータとの比較が必要二。   ・(10
)従来、このような敬体や常体の使用されている位置に
関する検査は、人間が行うしか方法がなかっな。
本発明の目的は、敬体や常体の使用されている位置に関
する検査を行うことのできる文章検査装置を提供するこ
とである。
(課題を解決するための手段) 本発明は、入力された日本語文章から誤り箇所あるいは
不適切箇所を検出する文章検査装置であって、文体を特
徴付ける表現を記憶する文体表現記憶手段と、前記入力
された日本語文章から前記文体表現記憶手段に記憶され
た表現を検出する文体表現検出手段と、前記文体を特徴
付ける表現を使用する位置の条件を記憶する位置条件記
憶手段と、前記文体表現検出手段によって検出された表
現の位置が前記位置条件記憶手段に記憶された条件を満
たすか否かを判定する位置条件判定手段とを備えること
を特徴とする文章検査装置である。
(実施例) 図面を参照して、本発明の構成・作用を説明する。
第1図は、本発明の文章検査装置の第一の実施例の構成
を示すブロック図である。
第1図において、文章入力手段1は、日本語文章を入力
する手段である。かな漢字変換入力装置、ベンタッチ・
キーボード、文字認識装置などが用いられる。
文章記憶手段2は、文章入力手段1によって入力された
日本語文章を、文字コード列として記憶する手段である
。ICメモリ、磁気ディスク装置、磁気テープ装置、光
デイスク装置などが用いられる。
文体表現記憶手段3は、文体(常体/敬体)を特徴付け
る表現を記憶する手段である。ICメモリ、磁気ディス
ク装置、磁気テープ装置、光デイスク装置などが用いら
れる。第2図および第3図は、文体表現記憶手段3の内
容の例である。第2図では、常体を特徴付ける表現の文
字列と、敬体を特徴付ける文字列の両方が、文体表現3
0の文字コード順に並べて記憶されている。そして、各
表現には、常体と敬体のいずれかを識別する情報である
文章識別31が付加されている。第3図では、常体を特
徴付ける表現が(a)、敬体を特徴付ける表現が(b)
に、分けて登録される。従って、第3図では、文体識別
、は各々の表現には付与されていない。
文体表現検出手段4は、文章記憶手段2に記憶された日
本語文章から、文体表現記憶手段3に記憶された表現を
検出する手段である。コンピュータのCPUなどが用い
られる。この文体表現検出手段4では、文章記憶手段2
に記憶された日本語文章と、文体表現記憶手段3に記憶
された表現とを比較・照合する処理を行えばよく、文体
表現検出手段4は、当業者には容易に実現可能な手段で
ある。なお、文体表現検出手段4は、検出された表現の
文章中の位置と文体識別とを、位置条件判定手段6へ送
る。
位置条件記憶手段5は、文体く常#:/敬体)を特徴付
ける表現を使用する位置に関する条件を記憶する手段で
ある。ICメモリ、磁気ディスク装置、磁気テープ装置
、光デイスク装置などが用いられる。第4図および第5
図は、位置条件記憶手段5の内容の例である。第4図の
位置条件記憶手段5は、敬体を特徴付ける表現の直後に
接続する表現の文字列を登録する形で、条件を表してい
る。
すなわち、第4図の位置条件記憶手段5では、敬体を特
徴付ける表現の直後は、「、」「が、」「ので、」のい
ずれかであり、常体を特徴付ける表現の直後は、「、」
「が、」 「ので、」以外であるという条件を表してい
る。第5図の位置条件記憶手段5は、文体識別50と条
件種別51と接続表現52から成っている0文体識別5
0は、常体を特徴付ける表現の位置に関する条件なのか
、敬体を特徴付ける表現の位置に関する条件なのかを示
す。
条件種別51が「+」の場合は、その文体表現の直後に
接続する表現として、接続表現52の部分の文字列を許
すということを表し、条件種別51が「−」の場合は、
その文体表現の直後に接続する表現として、接続表現5
2の部分の文字列を禁止するということを表す、この第
5図は、第4図と同様の条件を表したものである。
位置条件判定手段6は、文体表現検出手段4によって検
出された表現の位置が、位置条件記憶手段5に記憶され
た条件を満たすが否がを判定する手段である。コンピュ
ータのCPUなどが用いられる。この位置条件判定手段
6は、まず、文体表現検出手段4より、文体(常体/敬
体)を特徴付ける表現の検出された位置を受は取る。そ
して、次に、その文体に関する条件を、位置条件記憶手
段5から読み込み、検出された表現の位置が、その条件
を満たすか否かを、文章記憶手段2に記憶された日本語
文章を検索して判定する。この判定処理の内容は、位置
条件記憶手段5における条件の記述方法によって異なる
ものになるが、第4図に示したような位置条件記憶手段
5の場合は、第6図のフローチャートのような判定処理
となる。
なお、位置条件判定手段6は、検出された表現の位置と
、判定結果とを出力する。
また、文体表現検出手段4と位置条件判定手段6の動作
タイミングの制御方法としては、文体表現検出手段4が
文体を特徴付ける表現をひとつ検出するごとに、それに
対する位置条件判定手段6の判定処理を行う方法と、文
体表現検出手段4が文体を特徴付ける表現を全て検出し
た後で、位置条件判定手段6の判定処理をまとめて行う
方法がある。
次にこの実施例の動作を例を用いて説明する。
この例では、文章入力手段1から前に示した(9)の例
文が入力され、文章記憶手段2に記憶されているものと
する。また、文体表現記憶手段3の内容は第2図の例を
用い、位置条件記憶手段5の内容は、第4図の内容を用
いる。動作タイミングについては、文体表現検出手段4
が文体を特徴付ける表現を全て検出した後で、位置条件
判定手段6の判定処理をまとめて行う形で説明を行う。
まず、文体表現検出手段4は、文章記憶手段2に記憶さ
れた(9)の文章と、文体表現記憶手段3に記憶された
文字列とを照合し、次のような文字列を、文体を特徴付
ける表現として検出する。
[コ内は検出された表現の位置(文章の先頭からの文字
数)と、文体識別である。
いた      [7〜8.常体] られます    [12〜15.敬体]しました   
 [26〜29.敬体]しな      [41〜42
.常体]た            [45〜45.常
体]せません    [55〜58.敬体]います  
   [75〜77、敬体コでず      [92〜
93.敬体コそして、[コ内の情報が、文体表現検出手
段4から位置条件判定手段6へ送られる0次に、位置条
件判定手段6は、文体表現検出手段4によって検出され
た表現の直後の文字列と、位置条件記憶手段5に記憶さ
れた文字列との比較を行い、第6図のフローチャートに
従った判定を行う。
具体的に説明すると、[7〜8.常体]に対しては、文
章の9文字目からの文字列「と考え・・・」は、位置条
件記憶手段5に記憶された「、」「が、」 「ので、」
とは一致しない。そして、文体識別は常体なので、条件
を満たすと判定される。
[12〜15.敬体]に対しては、文章の16文字目か
らの文字列「素粒子の・・・」は、位置条件記憶手段5
に記憶された「。」 「が、」 「ので、」とは一致し
ない、そして、文体識別は敬体なので、条件を満たさな
いと判定される。[26〜29゜敬体]に対しては、文
章の30文字目からの文字列「。その・・・」は、位置
条件記憶手段5に記憶された「。」とは一致する。そし
て、文体識別は敬体なので、条件を満たすと判定される
。以下同様である。
その結果、位置条件判定手段6からは、次のような情報
が出力される。
[7〜82条件を満たすコ [12〜151条件を満たさない] [26〜299条件を満たす] [41〜421条件を満たす] [45〜451条件を満たさない] [55〜581条件を満たすコ [75〜77、条件を満たす〕 [92〜931条件を満たす] すなわち、(9)の文章に対して、次に(11)の下線
で示した部分の文体がおかしいという結果が得られ、常
体や敬体の使用されている位置に関する検査が行われた
超新星から届いたと考え五江圭j素粒子のデータを収集
しました。そのデータは、次に示した通りなか、安易に
結論は出せません、他のグループもデータを収集してい
ますが、そのデータとの比較が必要です。   ・・・
(11)第1の下線の部分は「られる」となるべきであ
り、敬体が過剰な箇所が検出されている。第2の下線の
部分は「です」となるべきであり、敬体か不足している
部分が検出されている。
ここで、上記の第一の実施例において、文体表現記憶手
段3に記憶しておく内容を制限しておくことも考えられ
る。
例えば、文体表現記憶手段3に記憶しておく内容を、第
3図<a>のように、常体を特徴付GJる表現のみとす
ることもできる。その場合には、(11)の第2の下線
部分のような、敬体が不足し゛  ている箇所のみが検
出される(敬体が過剰な箇所は検出されない)。逆に、
文体表現記憶手段3に記憶しておく内容を、第3図(b
)のように、敬体を特徴付ける表現のみとした場合には
、(11)の第1の下線部分のような、敬体が過剰な箇
所のみが検出される(敬体が不足している箇所は検出さ
れない)。
また、文体表現記憶手段3に記憶しておく表現の文体識
別について、常体/敬体の2分類だけでなく、3つ以上
の分間を用いることも可能である。
第7図は常体/敬体1/敬体2の3種類の文体識別を用
いた文体表現記憶手段3の内容の例である。
第7図における文体識別が敬体2のものは「ございます
体」といわれるものである。そして、文体識別の種類に
応じて、条件を細分化することも可能である。第8図は
、第7図のような文体識別の種類に対応した、位置条件
記憶手段5の内容の例である。
第9図は、本発明の文章検査装置の第二の実施例の構成
を示すブロック図である。
この第二の実施例は、第一の実施例に対して、単語辞書
記憶手段7と文章解析手段8を加えたものである。
第9図における単語辞書検索手段7は、日本語の単語に
ついて少なくとも表記と品詞とを登録した単語辞書を記
憶する手段である。ICメモリ、磁気ディスク装置、磁
気テープ装置、光デイスク装置などが用いられる。文章
解析手段8は、文章記憶手段2に記憶された文章の解析
を行う手段である。コンピュータのCPUなどが用いら
れる。
文章の解析は、単語辞書記憶手段7に記憶された単語辞
書を参照して行い、その結果としては、文節・単語の単
位や単語の品詞などが得られる。
この文章解析手段8と単語辞書記憶手段7は、公知の手
段であり、例えば、「国語辞書の記憶と日本語文の自動
分割」 (長屋・他、「情報処理」第19巻第6号、1
978 )のようにして実現できる。
文章解析手段8は、文章記憶手段2に記憶された文章の
解析結果を、再び文章記憶手段2に書き込むので、文章
記憶手段2には、文章の文字コード列だけでなく、文節
・単語の単位や単語の品詞の情報も記憶されることにな
る4例えば、文章解析の結果として、(6)に対しては
、次の(12)のような内容が記憶されることになる。
[]内は単語の品詞、/は文節の境界を表す。
データ[名詞]は[格助詞17次[名詞]に[格助詞]
/示[動詞語幹コシ[亘設語尾連用形]た「助動詞「た
」連用形17通り[名詞〕だ[助動詞「だ」終止形]が
「接続助詞「が」]、[読点]/安易[形容動詞語幹]
に[形容動詞語尾連用形コ/結論[名詞]は゛[格助詞
]/出[動詞語幹]せ[下一段語尾連用形]ませ[助動
詞「ます」未然形]んU助動詞rん」終止形〕、[句点
] ・・・〈12)この第二の実施例では、文体表現記
憶手段3や位置条件記憶手段5に記憶されている表現に
ついて、その表現の文字列だけでなく、その表現を構成
する単語の品詞情報もあわせて持つ。第10図は、第二
の実施例における文体表現記憶手段3の内容の例を示す
図であり、第11図は、第二の実施例における位置条件
記憶手段5の内容の例を示す図である。
文体表現検出手段4や、位置条1件判定手段6について
は、第一の実施例で説明した処理において、文字列の照
合を行う際に、文字列の照合だけでなく、単語の品詞の
照合も行うようにする。その結果、第二の実施例では、
第一の実施例に比べて、文体表現検出手段4の文体を特
徴付ける表現の検出誤りや、位置条件判定手段6の条件
の判定誤りがなくなり、文章検査装置の性能が向上する
(発明の効果) 以上に説明したように、本発明によれは、敬体や常体の
使用されている位置に関する検査を行うことが可能とな
る。すなわち、日本語文章の文体について、従来のよう
に、常体と敬体の混在を検査するだけでなく、敬体の使
い方も検査することができるので、より自然な日本語文
章を作成することに役立つ。
【図面の簡単な説明】
第1図および第9図は本発明の第一および第二の実施例
の構成をそれぞれ示すブロック図であり、第2図、第3
図、第7図および第10図は文体表現記憶手段3の内容
の例を示す図であり、第4図、第5図、第8図および第
11図は位置条件記憶手段5の内容の例を示す図であり
、第6図は位置条件判定手段6における判定処理のフロ
ーチャートである。 ■・・・文章入力手段、2・・・文章記憶手段、3・・
・文体表現記憶手段、4・・・文体表現検出手段、5・
・・位置条件記憶手段、6・・・位置条件判定手段、7
・・・単語辞書記憶手段、8・・・文章解析手段。

Claims (1)

    【特許請求の範囲】
  1. 入力された日本語文章から誤り箇所または不適切箇所を
    検出する文章検査装置において、文体を特徴付ける表現
    を記憶する文体表現記憶手段と、前記入力された日本語
    文章から前記文体表現記憶手段に記憶された表現を検出
    する文体表現検出手段と、前記文体を特徴付ける表現を
    使用する位置の条件を記憶する位置条件記憶手段と、前
    記文体表現検出手段によって検出された表現の位置が前
    記位置条件記憶手段に記憶された条件を満たすか否かを
    判定する位置条件判定手段とを備えることを特徴とする
    文章検査装置。
JP63016197A 1988-01-26 1988-01-26 文章検査装置 Expired - Lifetime JPH0658667B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63016197A JPH0658667B2 (ja) 1988-01-26 1988-01-26 文章検査装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63016197A JPH0658667B2 (ja) 1988-01-26 1988-01-26 文章検査装置

Publications (2)

Publication Number Publication Date
JPH01191260A true JPH01191260A (ja) 1989-08-01
JPH0658667B2 JPH0658667B2 (ja) 1994-08-03

Family

ID=11909785

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63016197A Expired - Lifetime JPH0658667B2 (ja) 1988-01-26 1988-01-26 文章検査装置

Country Status (1)

Country Link
JP (1) JPH0658667B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04280364A (ja) * 1991-03-08 1992-10-06 Nec Corp 文章検査装置
JPH07234873A (ja) * 1994-02-23 1995-09-05 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 言語翻訳システム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS638858A (ja) * 1986-06-28 1988-01-14 Fujitsu Ltd 日本語文書の文体チエツク処理方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS638858A (ja) * 1986-06-28 1988-01-14 Fujitsu Ltd 日本語文書の文体チエツク処理方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04280364A (ja) * 1991-03-08 1992-10-06 Nec Corp 文章検査装置
JPH07234873A (ja) * 1994-02-23 1995-09-05 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 言語翻訳システム

Also Published As

Publication number Publication date
JPH0658667B2 (ja) 1994-08-03

Similar Documents

Publication Publication Date Title
EP0612018B1 (en) Apparatus and method for syntactic signal analysis
JPS61163467A (ja) 機械翻訳システム
US11386269B2 (en) Fault-tolerant information extraction
US7328404B2 (en) Method for predicting the readings of japanese ideographs
Al-Taani et al. A rule-based approach for tagging non-vocalized Arabic words.
EP1471440A2 (en) System and method for word analysis
Harper et al. Integrating language models with speech recognition
JPH01191260A (ja) 文章検査装置
Basili et al. Lexicalizing a shallow parser
JPH01191259A (ja) 文章検査装置
JP3721397B2 (ja) 話し言葉の書き言葉への変換装置
JP3783053B2 (ja) 負の例予測処理方法、処理プログラムおよび処理装置、負の例予測処理を用いた日本語表記誤り検出処理プログラムおよび処理装置、ならびに負の例予測処理を用いた外の関係検出処理プログラムおよび処理装置
JPH04280364A (ja) 文章検査装置
Jaf et al. Towards the development of a hybrid parser for natural languages
Murata et al. Resolution of verb ellipsis in Japanese sentence using surface expressions and examples
JP2599973B2 (ja) 日本文訂正候補文字抽出装置
JPH02103658A (ja) 文章検査装置
JPH0322083A (ja) 自然言語処理装置
JPS63118868A (ja) 日本語文章校正装置
JP3873299B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JPH01245297A (ja) 文音声認識装置における文節候補検証方法
JPH05250403A (ja) 日本文単語解析方式
Levow An experimental discourse-neutral prosodic phrasing system for Mandarin Chinese
JP3300492B2 (ja) 辞書検査装置
JPH0554028A (ja) 文章検査装置