JP2958811B2 - 日本語文章処理装置 - Google Patents

日本語文章処理装置

Info

Publication number
JP2958811B2
JP2958811B2 JP3023514A JP2351491A JP2958811B2 JP 2958811 B2 JP2958811 B2 JP 2958811B2 JP 3023514 A JP3023514 A JP 3023514A JP 2351491 A JP2351491 A JP 2351491A JP 2958811 B2 JP2958811 B2 JP 2958811B2
Authority
JP
Japan
Prior art keywords
word
words
sentence
kanji
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3023514A
Other languages
English (en)
Other versions
JPH04263360A (ja
Inventor
浩 山口
寿平 中垣
明男 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP3023514A priority Critical patent/JP2958811B2/ja
Publication of JPH04263360A publication Critical patent/JPH04263360A/ja
Application granted granted Critical
Publication of JP2958811B2 publication Critical patent/JP2958811B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、日本語文章から校正
・推敲すべき文字列を検出する装置に関し、特に、漢字
表記することが望ましいかな書きされた語を検出する装
置に関する。
【0002】
【従来の技術】近年、ワードプロセッサなどの普及によ
り、日本語文章を作成する機会が多くなっているが、適
切な文章を作成することは難しい。そこで、日本語文章
のための校正・推敲システムが開発されている。日本語
文章では、特に漢字の誤りが発生しやすいという特徴が
あるため、従来の校正・推敲システムでは、主に漢字表
記に着目し、作成された文章を解析して誤字などを自動
的に修正するようにしたものが多い。例えば、特開平1
−207868号公報には、常用漢字表以外の漢字はひ
らがなに修正し、常用漢字表外の音訓は正しい用法に修
正するようにした日本語文章処理方式が開示されてい
る。
【0003】
【発明が解決しようとする課題】ところで、日本語文章
では漢字表記の誤りだけでなく、漢字表記することが望
ましい語が、かな書きのままになっている場合も少なく
ない。しかし、従来の校正・推敲スシテムは、上述した
ように、主に漢字の誤りを修正するものであるため、か
な書きされている語の修正には対処できないという問題
点があった。これは、上記特開平1−207868号公
報に記載された日本語文章処理方式でも同様である。
【0004】この発明は、漢字表記することが望ましい
かな書きの語を検出することができる日本語文章処理装
置を提供することを目的とする。
【0005】
【課題を解決するための手段】上述した目的を達成する
ため、請求項1の発明では、複数の単語と、該複数の単
語の少なくとも一部の単語に対して該単語を漢字表記す
ることが望ましいか否かの情報とを記憶した単語記憶手
段と、単語間の接続関係を記憶した接続関係記憶手段
と、前記単語記憶手段に記憶された単語と前記接続関係
記憶手段に記憶された接続関係とに基づいて、推敲対象
の日本語文章から単語列を切り出すとともに、該切り出
した単語列の各単語に漢字表記することが望ましいか否
かの情報を付加して出力する文章解析手段と、前記文章
解析手段が出力した単語を該単語に付加された情報とと
もに表示する表示手段とを具備することを特徴とする。
また、請求項2の発明では、推敲対象の日本語文章を記
憶する文章記憶手段と、複数の単語と、該複数の単語の
少なくとも一部の単語に対して該単語を漢字表記するこ
とが望ましいか否かの情報とを記憶した単語記憶手段
と、単語間の接続関係を記憶した接続関係記憶手段と、
前記単語記憶手段に記憶された単語と前記接続関係記憶
手段に記憶された接続関係とに基づいて、前記文章記憶
手段に記憶された推敲対象の日本語文章から単語列を切
り出すとともに、該切り出した単語列の各単語に漢字表
記することが望ましいか否かの情報を付加して出力する
文章解析手段と前記文章解析手段が出力した各単語を表
示するとともに、前記情報に基づき漢字表記することが
望ましい単語にアンダーラインを付して表示する表示手
段とを具備することを特徴とする。
【0006】
【作用】文章解析手段は、読み込んだ入力文を単語記憶
手段を参照しながら単語検索すると共に、接続関係記憶
手段の接続情報に基づいて単語間の接続の可否をチェッ
クし、文章解析した各単語にかな書きで漢字表記するこ
とが望ましい語であるかどうかの情報を付加して出力す
る。したがって、各単語に付加された情報に基づいて文
章中のかな書きの語で漢字表記が望ましい語を検出し、
適切な手段を用いて使用者に知らせることにより校正・
推敲をスムーズに行うことができる。
【0007】
【実施例】以下、この発明に係わる日本語文章処理装置
の一実施例を添付図面に基づいて説明する。
【0008】図1は、この発明に係わる日本語文章処理
装置の概略構成を示す機能ブロック図である。この日本
語文章処理装置は、文章記憶手段1、単語記憶手段2、
接続関係記憶手段3、文章解析手段4、解析結果記憶手
段5、漢字書き推奨語検出手段6、表示手段7から構成
されている。
【0009】文章記憶手段1には、推敲を行いたい日本
語文章が格納されている。この文章記憶手段1は、磁気
ディスクやフロッピーディスクなどの日本語文章を格納
できる媒体であればどのような構成でもよい。また、日
本語文章はキーボードから入力されたものや、音声認識
や文字認識の結果入力されたものでもよいし、ネットワ
ークやフロッピ−ディスクなどによって他の装置から転
送されたものでもよい。 単語記憶手段2は、単語とそ
の属性情報を登録した日本語辞書である。各単語の属性
情報には、品詞情報などのほか、漢字表記することが望
ましいかどうかの情報が含まれている。登録されている
単語のうち、漢字については漢字表記することが望まし
いかどうかの情報を持たせる必要はないが、ここでは説
明を簡単にするため、漢字・かな共に漢字表記すること
が望ましいかどうかの情報を持たせている。
【0010】接続関係記憶手段3には、単語間の接続の
可否を示す接続情報が格納されている。
【0011】文章解析手段4は、単語記憶手段2と接続
関係記憶手段3を検索して入力文を単語単位に文章解析
し、解析した各単語にかな書きで漢字表記することが望
ましい語であるかどうかの情報を付加して出力する。解
析された単語のうち、漢字については漢字表記すること
が望ましいかどうかの情報を持たせる必要はないが、こ
こでは説明を簡単にするため、全ての単語に漢字表記す
ることが望ましいかどうかの情報情報を持たせている。
【0012】解析結果記憶手段5は、前記文章解析手段
4で単語単位に解析された結果を記憶する。
【0013】漢字書き推奨語検出手段6は、前記解析結
果記憶手段5に記憶された単語に付けられている、かな
書きで漢字表記することが望ましい語であるかどうかの
情報を参照し、かな書きで漢字表記することが望ましい
語(漢字書き推奨語)を検出して、その単語の位置情報
を記憶する。この位置情報は、例えば文章中の単語の開
始位置と終了位置の文字数などで表すことができる。
【0014】表示手段7は、漢字書き推奨語検出手段6
によって検出されたかな書きで漢字表記することが望ま
しい語を、他の単語と区別して表示する。他の単語と区
別して表示する方法としては、例えば、反転する、アン
ダ−ラインを付ける、色を変える、文字の大きさを変え
る、文字の字体を変える、KWIC(KeyWordI
n Context)表示するなどがあるが、この実施
例でアンダ−ラインを付けて表示している。
【0015】次に、上記日本語文章処理装置において、
かな書きで漢字表記が望ましい語を検出して表示する場
合の処理手順を図2及び図3のフローチャート、並びに
図4〜図7に基づいて説明する。
【0016】図2において、文章解析手段4は文章記憶
手段1に記憶されている日本語文章を取り出す操作を試
み(ステップ101)、文章があるかどうかを判断する
(ステップ102)。ここで、文章がないときは処理を
終了し、文章があるときは、その中から1文を読み込む
(ステップ103)。以下の処理では、この1文全体が
処理の単位となる。ここでは、具体例として「明日は晴
れだとおもう。」という文が読み込まれたものとする。
【0017】文章解析手段4は、単語記憶手段2の日本
語辞書を用いて入力文を文頭から文末まで単語検索する
(ステップ104)。単語記憶手段2の内容の一例を図
4に示す。図4において、漢字表記することが望ましい
語であるかどうかの情報は、漢字書き推奨フラグとして
表されている。この実施例では、漢字表記することが望
ましい語については1という値が付けられ、そうでない
語については0という値が付けられている。単語検索に
よって、入力文の各単語に対応する語の情報が読み取ら
れる。続いて、検索された単語が持つ品詞情報と、接続
関係記憶手段3の接続情報とに基づいて単語間の接続関
係をチェックする(ステップ105)。接続関係記憶手
段3の内容の一例を図5に示す。図5において、単語間
の接続の可否を示す接続情報としては、接続が可能であ
る組み合わせには1という値が付けられ、接続できない
組み合わせには0という値が付けられている。文章解析
手段4は、これらの情報を用いて、接続可能であった単
語の内文節数が最少のものを結果として出力する文節数
最少法により文章解析を行う(ステップ106)。な
お、文章解析には最長一致法やコスト最少法を用いても
よい。
【0018】この結果、明日/は/晴れ/だ/と/おも
/う/。という単語列が切り出される。文章解析手段4
は、各単語に漢字表記することが望ましい語であるかど
うかの情報を付加し(ステップ107)、解析結果記憶
手段5に格納する(ステップ108)。解析結果記憶手
段5に格納された情報を図6に示す。図6において、各
単語には品詞、位置情報及び漢字表記することが望まし
い語であるかどうかの情報として、漢字書き推奨表記フ
ラグが付加されている。漢字書き推奨表記フラグは、図
4の漢字書き推奨フラグと同様に、漢字表記することが
望ましい語については1という値が付けられ、そうでな
い語については0という値が付けられる。この例では、
「おも」という語について、漢字書き推奨表記フラグに
1という値が付いている。
【0019】次に、図3において、漢字書き推奨語検出
手段6は解析結果記憶手段5に格納された1文の単語を
一つ取り出し(ステップ109)、その単語に付加され
ている漢字書き推奨表記フラグを参照して、かな書きで
漢字表記が望ましい語であるかどうかを判断する(ステ
ップ110)。ここで、その単語が漢字表記が望ましい
語であるときは、その単語の位置情報を記憶する(ステ
ップ111)。そして、全ての単語をチェックしたかど
うかを判断し(ステップ112)、チェックしていない
単語が残っているときは、解析結果記憶手段5から次の
単語を取り出し(ステップ113)、ステップ110に
リターンする。また、ステップ112で全ての単語をチ
ェックしたと判断したときは、全ての単語の情報を表示
手段7に送る(ステップ114)。表示手段7は、漢字
書き推奨表記フラグに1の値が付けられた語の位置情報
を参照し、その単語にアンダーラインをつけて表示する
(ステップ115)。かな書きで漢字表記することが望
ましい語として判断された語にアンダーラインをつけて
表示したときの例を図7に示す。
【0020】なお、上述した実施例では、漢字書き推奨
表記フラグとして1又は0の値を付けて漢字書き推奨語
を検出するようにしているが、例えば、0〜100の中
から適当な値を漢字書き推奨表記レベルとして単語記憶
手段2に記憶しておき、レベルに応じて漢字書き推奨語
を検出するようにしてもよい。
【0021】
【発明の効果】以上説明したように、この発明に係わる
日本語文章処理装置においては、入力文を解析して、か
な書きで漢字表記することが望ましい語であるか否かを
判断し、漢字表記が望ましい語であるときは、その情報
を単語に付加して出力するという構成にしたため、漢字
表記することが望ましい語であるにもかかわらず、かな
書きされている語を容易に検出することができる。した
がって、その語を適切な手段を用いて使用者に知らせる
ことにより校正・推敲をスムーズに行うことが可能とな
る。
【図面の簡単な説明】
【図1】この発明に係わる日本語文章処理装置の概略構
成を示す機能ブロック図。
【図2】かな書きで漢字表記が望ましい語を検出して表
示する場合の処理手順を示すフローチャート。
【図3】かな書きで漢字表記が望ましい語を検出して表
示する場合の処理手順を示すフローチャート。
【図4】単語記憶手段の内容を示す説明図。
【図5】接続関係記憶手段の内容を示す説明図。
【図6】解析結果記憶手段に格納された情報を示す説明
図。
【図7】漢字表記することが望ましい語として判断され
た語にアンダーラインをつけて表示したときの例を示す
説明図。
【符号の説明】
1…文章記憶手段 2…単語記憶手段 3…接続関係記憶手段 4…文章解析手段 5…解析結果記憶手段 6…漢字書き推奨語検出手段 7…表示手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 山下 明男 東京都渋谷区代々木三丁目57番6号 グ ランフォーレ 富士ゼロックス株式会社 内 (56)参考文献 特開 昭58−35629(JP,A) 特開 昭63−163571(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 17/21 - 17/28

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 複数の単語と、該複数の単語の少なくと
    も一部の単語に対して該単語を漢字表記することが望ま
    しいか否かの情報とを記憶した単語記憶手段と、 単語間の接続関係を記憶した接続関係記憶手段と、 前記単語記憶手段に記憶された単語と前記接続関係記憶
    手段に記憶された接続関係とに基づいて、推敲対象の日
    本語文章から単語列を切り出すとともに、該切り出した
    単語列の各単語に漢字表記することが望ましいか否かの
    情報を付加して出力する文章解析手段と、 前記文章解析手段が出力した単語を該単語に付加された
    情報とともに表示する表示手段とを具備することを特徴
    とする日本語文章処理装置。
  2. 【請求項2】 推敲対象の日本語文章を記憶する文章記
    憶手段と、 複数の単語と、該複数の単語の少なくとも一部の単語に
    対して該単語を漢字表記することが望ましいか否かの情
    報とを記憶した単語記憶手段と、 単語間の接続関係を記憶した接続関係記憶手段と、 前記単語記憶手段に記憶された単語と前記接続関係記憶
    手段に記憶された接続関係とに基づいて、前記文章記憶
    手段に記憶された推敲対象の日本語文章から単語列を切
    り出すとともに、該切り出した単語列の各単語に漢字表
    記することが望ましいか否かの情報を付加して出力する
    文章解析手段と前記文章解析手段が出力した各単語を表
    示するとともに、前記情報に基づき漢字表記することが
    望ましい単語にアンダーラインを付して表示する表示手
    段とを具備することを特徴とする日本語文章処理装置。
JP3023514A 1991-02-18 1991-02-18 日本語文章処理装置 Expired - Fee Related JP2958811B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3023514A JP2958811B2 (ja) 1991-02-18 1991-02-18 日本語文章処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3023514A JP2958811B2 (ja) 1991-02-18 1991-02-18 日本語文章処理装置

Publications (2)

Publication Number Publication Date
JPH04263360A JPH04263360A (ja) 1992-09-18
JP2958811B2 true JP2958811B2 (ja) 1999-10-06

Family

ID=12112560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3023514A Expired - Fee Related JP2958811B2 (ja) 1991-02-18 1991-02-18 日本語文章処理装置

Country Status (1)

Country Link
JP (1) JP2958811B2 (ja)

Also Published As

Publication number Publication date
JPH04263360A (ja) 1992-09-18

Similar Documents

Publication Publication Date Title
US7243305B2 (en) Spelling and grammar checking system
US5678051A (en) Translating apparatus with special display mode for supplemented words
US5845306A (en) Context based system for accessing dictionary entries
US7774193B2 (en) Proofing of word collocation errors based on a comparison with collocations in a corpus
US5485372A (en) System for underlying spelling recovery
JP4301515B2 (ja) 文章表示方法、情報処理装置、情報処理システム、プログラム
JPH07325824A (ja) 文法チェックシステム
Vosse Detecting and correcting morpho-syntactic errors in real texts
JPH07325828A (ja) 文法チェックシステム
JP2000194699A (ja) 翻訳支援装置及びその方法並びにコンピュ―タ可読記録媒体
US7136805B2 (en) System for distinguishing names of organizations in Asian writing systems
JP2958811B2 (ja) 日本語文章処理装置
Gondaliya et al. A Rule-based Grammar and Spell Checking
JP3118880B2 (ja) 日本語文章処理装置
JPS60254367A (ja) 文章分析装置
JP3285149B2 (ja) 外国語電子辞書検索方法及び装置
JP3420369B2 (ja) 文書処理装置、および文書処理方法
JP2818185B2 (ja) 文書作成支援装置
JPH07200592A (ja) 文章処理装置
JPH0531186B2 (ja)
Trushkina Automatic error detection in second language learners' writing
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
Smirnov Producing rules for ascertaining meanings of minimal semantic-syntactic text units
JPS62209663A (ja) 日本語文章校正装置
JPH0836580A (ja) 翻訳装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080730

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090730

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees