JPH04365166A - 文章検査装置 - Google Patents

文章検査装置

Info

Publication number
JPH04365166A
JPH04365166A JP3167673A JP16767391A JPH04365166A JP H04365166 A JPH04365166 A JP H04365166A JP 3167673 A JP3167673 A JP 3167673A JP 16767391 A JP16767391 A JP 16767391A JP H04365166 A JPH04365166 A JP H04365166A
Authority
JP
Japan
Prior art keywords
drawing reference
word
sentence
reference word
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3167673A
Other languages
English (en)
Other versions
JP2776069B2 (ja
Inventor
Yutaka Oyama
裕 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3167673A priority Critical patent/JP2776069B2/ja
Publication of JPH04365166A publication Critical patent/JPH04365166A/ja
Application granted granted Critical
Publication of JP2776069B2 publication Critical patent/JP2776069B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文章の検査を行う文章
検査装置に関し、特に日本語文章内で使用する図面参照
用の符号を検査する文章検査装置に関する。
【0002】
【従来の技術】ワードプロセッサ等の文書作成装置の向
上により、一般の利用者が文書作成装置を用いて効率よ
く文書を作成することが容易になった。最近では、かな
漢字変換などによる日本語入力だけでなく、入力した文
章を計算機によりチェックする機能も実現されている。 例えば、日本ソフトウェア科学会第4回大会予稿B−1
−2「日本語文章作成支援ツール『推敲』のパーソナル
コンピュータでの実用化」には、「言い替えた方がよい
語句の検索」や「KWICリストの作成」など、多くの
文章検査機能が紹介されている。これらの機能を活用し
、日本語の文章の誤りを検出・訂正することで、文章の
品質を向上させることができる。
【0003】
【発明が解決しようとする課題】発明や考案を特許出願
または実用新案登録出願する際に作成する明細書(以下
、特許明細書と称する)には図面を伴う。この特許明細
書の文章を作成する際にも、前述の文章検査機能は有効
である。しかしながら、前述の文章検査機能は、一般的
日本語文章を処理対象としており、特許文書における図
面参照特有の表現や用語に対しての検査には従来の文章
検査機能は有効とはいえない。以下に、その例を挙げて
説明する。
【0004】図面参照を伴う文章作成時特有の誤りの一
つに、図面参照用の符号(一般に数字または英数記号で
構成される)の付け間違いがある。例えば、特許図面の
中で「100」という符号を付けられた項目(符号の名
称)「制御装置」を使用している場合には、「制御装置
100」と参照される。本願明細書では、これを図面参
照語と称す。図面の変更に伴い、符号「100」を「1
01」に変更した場合には、文章中の「制御装置100
」をすべて「制御装置101」に変更しなければならな
い。ところが、「制御装置100」という記述は、明細
書の中で複数回使用されるこが多く、変更洩れのために
「制御装置100」のまま残してしまう恐れがある。
【0005】上記誤りを最少限に抑える手段として、前
述の『推敲』における数字などの限定字種を指定した文
字列検索機能を使用し、抽出部分を人間が黙視確認する
手段が考えられる。しかし、この機能を使用すると、章
立ての番号や文中の数字など、明らかに符号にならない
部分も同時に検索されてしまい、検査効率が悪い。
【0006】
【課題を解決するための手段】本発明は、前述の従来技
術にみられた欠点を克服し、文章中に存在する図面参照
用符号の誤りの検出を支援する文章検査装置を提供する
。本発明によれば、文章を入力する入力手段と、入力さ
れた前記文章を記憶する文章記憶手段と、前記文章内の
数字列とその文章中における位置を抽出する数字列情報
抽出手段と、前記数字列を記憶する数字列記憶手段と、
単語辞書と、前記文章中における前記数字列の直前の文
字列をもとに前記単語辞書を検索する単語辞書検索手段
と、前記単語辞書検索手段によって検索された単語列と
対応する数字列の組を文章中の図面参照語候補として抽
出する図面参照語候補抽出手段と、該図面参照語候補を
該文章中の位置とともに記憶する図面参照語候補記憶手
段と、符号と該符号の名称で構成される図面参照語を記
憶する図面参照語記憶手段と、前記図面参照語候補と前
記図面参照語を照合して前記符号と前記数字列が一致し
て対応する前記符号の名称と前記単語列が一致しないも
のを検出する図面参照語照合手段と、照合結果を表示す
る表示手段とを備えたことを特徴とする文章検査装置を
得ることができる。
【0007】
【作用】本発明の作用は以下の通りである。まず、入力
される文章を文章記憶装置に記憶した後、文章内の数字
列とその文章中における位置を抽出する。ただし、本願
明細書において数字列は、図面参照用符号として使用で
きる文字列の意味であり、100aや100−aのよう
に、数字列の直後に連続する英記号(句読点や括弧など
の区切り記号を除く)の結合も許すよう拡大解釈する。 次に、抽出された各数字列について、文章内におけるそ
の直前文字列をもとに単語辞書を検索して、単語列を抽
出する。なお、本願明細書では、単独の単語も単語列の
一種とみなす。抽出した単語列は、直後の数字列を対応
させて、図面参照語候補として一時記憶する。そして、
予め記憶してある図面参照語(符号と符号の名称で構成
される)と比較照合することで、図面参照語候補の不正
を検出して表示する。
【0008】
【実施例】以下、本発明について図面を参照して説明す
る。図1は本発明の一実施例を示すブロック図である。 図において、1は文章を入力する入力手段であり、2は
入力された文章を記憶するための文章記憶手段であり、
3は文章記憶手段2内の文章の中の数字列とその文章中
における位置を抽出する数字列情報抽出手段であり、4
は抽出された数字列および位置情報を記憶するための数
字列記憶手段であり、5は少なくとも符号の名称になり
得る可能性のある自立語が収められた単語辞書であり、
6は単語辞書5を検索するための単語辞書検索手段であ
り、7は単語辞書検索手段6によって検索された1個ま
たは複数個の単語と対応する数字列の組を図面参照語候
補として抽出する図面参照語候補抽出手段であり、8は
図面参照語候補抽出手段7で得られた図面参照語を記憶
する図面参照語候補記憶手段であり、9は符号と該符号
の名称で構成され、文章作成者が所望する図面参照語を
記憶するための図面参照語記憶手段であり、10は、図
面参照語候補記憶手段8内の図面参照語候補と図面参照
語記憶手段9内の図面参照語を照合し、照合結果を出力
する図面参照語照合手段であり、11は図面参照語照合
手段10による照合結果を表示する表示手段である。ま
た、12は全体の動作を制御する制御部である。図1に
おいて、入力手段1はフロッピーディスク装置や通信回
線などで、文章記憶手段2、数字列記憶手段4、単語辞
書5、図面参照語候補記憶手段8、図面参照語記憶手段
9はメモリ装置などで、表示手段11はCRTディスプ
レイ装置などで、数字列情報抽出手段3、単語辞書検索
手段6、図面参照語候補抽出手段7、図面参照語照合手
段10、制御部12はCPUとメモリなどで実現できる
【0009】また、図2は、入力手段1から入力され文
章記憶手段2に収められる特許明細書文章例の一部であ
り、文中に「結果記憶手段」と「形態素解析手段」に対
して、同じ符号「4」が与えられている誤りの例である
。また、図3は、同じく入力手段1から入力されて図面
参照語記憶手段9に記憶される、正しい図面参照語の例
である。以下、図2の文章および図3の図面参照語を例
にとって本実施例の動作を説明する。
【0010】入力手段1より入力された日本語文章は、
文章記憶手段2に記憶される。その後、数字列情報抽出
手段3は、制御部12の制御のもとで、文章記憶手段2
内の数字列とその文章中における位置を抽出し、数字列
記憶手段4に収める。数字列抽出手順の詳細は、前述の
文献において「字種別の文字列検索コマンド」として紹
介されているので省略する。この時点での数字列記憶手
段4の内容を図4に示す。図4において、「位置」は文
章先頭からの文字数として表わされている。
【0011】次に、図面参照語候補抽出手段7は、制御
部12の制御のもとで単語辞書検索手段6を起動し、文
章記憶手段2内の日本語文章中の各数字列の直前の文字
列(図4の位置情報を用いて参照できる)をもとに単語
辞書5を検索して単語列を抽出し、対応する数字列と組
にして図面参照語候補として図面参照語候補記憶手段8
に格納する。単語辞書5の実現例を図5に示す。図5は
、単語辞書5内の各単語が、表記、読み、品詞情報およ
び、図面参照語候補にならないことを示す不要語情報を
有していることを表わしている。単語辞書5および単語
辞書検索手段6は、日本語ワードプロセッサのかな漢字
変換処理などで一般的に使用されているものであるため
、詳細の説明を省略する。
【0012】図面参照語候補抽出手段7は、以下の手順
で処理を行う。 (手順7−1)数字列記憶手段4から数字列とその位置
情報を取り出す。すべて取り出したら、処理を終了する
。 (手順7−2)文章記憶手段2を参照し、位置情報の指
す数字列の直前の文字列をもとに、手順(7−2a)〜
手順(7−2c)の基準で、単語辞書検索手段6により
単語辞書5を検索する。 (7−2a)単語が抽出できない場合には抽出失敗とし
て(手順7−1へ)。 (7−2b)抽出した単語列の中に、不要語であること
を示す情報が含まれている場合、抽出失敗として(手順
7−1)へ。 (7−2c)数字列直前の文字列で形成できる最長の複
合語を構成する単語列を抽出する。 (手順7−3)得た単語列と数字列の組を図面参照語候
補とし、図面参照語候補記憶手段8に格納して、(手順
7−1)へ。
【0013】本実施例における図面参照語候補記憶手段
8の内容を図6に示す。図2の文章中における数字表現
と図6の図面参照語候補とを比較すると、図2の中の「
請求項1」「3.」「2単語間」「第3」が排除されて
いる。これは、「3.」「2単語間」は(7−2a)で
、「請求項1」「第3」は(7−2b)で排除されたた
めである。
【0014】次に、図面参照語照合手段10は、図面参
照語候補記憶手段8の内容と、図面参照語記憶手段9の
内容を照合し、図面参照語候補記憶手段8内の不正なも
のを検出する。具体的な手順は以下の通りである。 (手順9−1)図面参照語候補記憶手段8内の図面参照
語候補を1つ取り出す。すべて処理を終えたら終了。 (手順9−2)取り出した図面参照語候補と同じものが
図面参照語記憶手段9内に存在しているか否かを検出す
る。存在していたら(手順9−1)、存在していない場
合には、(手順9−3)へ。 (手順9−3)図面参照語候補を表示手段11に送り、
(手順9−1)へ。
【0015】図面参照語候補記憶手段8の内容が図6で
、図面参照語記憶手段9の内容が図3であった場合、図
面参照語候補記憶手段8内の「結果記憶手段4」が不正
であるあることが検出される。得られた不正と思われる
図面参照語候補は、表示手段11によって利用者に対し
て表示される。本例における表示手段11の表示例を図
7に示す。
【0016】なお、図7は、不正と思われる図面参照語
候補の表示のみを行っているが、別の表示形態として、
数字列記憶手段4内の該当位置情報と文章記憶手段2内
の文章情報をもとに、不正な図面参照語候補の文中での
使われ方を併せて表示することも可能である。
【0017】
【発明の効果】本発明を用いることにより、文章中にお
ける図面参照用符号の不正を容易に検出し、利用者に提
示することができる。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図である。
【図2】文章記憶手段2内の日本語文章例の一部分を示
す説明図である。
【図3】図面参照語記憶手段9内の図面参照語の例を示
す説明図である。
【図4】数字列記憶手段4における記憶内容の一例を表
わす図である。
【図5】単語辞書5の内容の一部分を示す図である。
【図6】図面参照語候補記憶手段8における記憶内容の
一例を示す図である。
【図7】表示手段11の表示例を表わす図である。
【符号の説明】
1    入力手段 2    文章記憶手段 3    数字列情報抽出手段 4    数字列記憶手段 5    単語辞書 6    単語辞書検索手段 7    図面参照語候補抽出手段 8    図面参照語候補記憶手段 9    図面参照語記憶手段 10    図面参照語照合手段 11    表示手段

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  文章を入力する入力手段と、入力され
    た前記文章を記憶する文章記憶手段と、前記文章内の数
    字列とその文章中における位置を抽出する数字列情報抽
    出手段と、前記数字列を記憶する数字列記憶手段と、単
    語辞書と、前記文章中における前記数字列の直前の文字
    列をもとに前記単語辞書を検索する単語辞書検索手段と
    、前記単語辞書検索手段によって検索された単語列と対
    応する数字列の組を文章中の図面参照語候補として抽出
    する図面参照語候補抽出手段と、該図面参照語候補を該
    文章中の位置とともに記憶する図面参照語候補記憶手段
    と、符号と該符号の名称で構成される図面参照語を記憶
    する図面参照語記憶手段と、前記図面参照語候補と前記
    図面参照語を照合して前記符号と前記数字列が一致して
    対応する前記符号の名称と前記単語列が一致しないもの
    を検出する図面参照語照合手段と、照合結果を表示する
    表示手段とを備えたことを特徴とする文章検査装置。
JP3167673A 1991-06-12 1991-06-12 文章検査装置 Expired - Fee Related JP2776069B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3167673A JP2776069B2 (ja) 1991-06-12 1991-06-12 文章検査装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3167673A JP2776069B2 (ja) 1991-06-12 1991-06-12 文章検査装置

Publications (2)

Publication Number Publication Date
JPH04365166A true JPH04365166A (ja) 1992-12-17
JP2776069B2 JP2776069B2 (ja) 1998-07-16

Family

ID=15854100

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3167673A Expired - Fee Related JP2776069B2 (ja) 1991-06-12 1991-06-12 文章検査装置

Country Status (1)

Country Link
JP (1) JP2776069B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101065135B1 (ko) 2008-10-16 2011-09-16 엔에이치엔(주) 질의문에 대한 속성 범위 추출 방법 및 시스템

Also Published As

Publication number Publication date
JP2776069B2 (ja) 1998-07-16

Similar Documents

Publication Publication Date Title
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
US5890182A (en) Sentence processing method and apparatus
JP2595934B2 (ja) 仮名漢字変換処理装置
JPH04365166A (ja) 文章検査装置
JP3935374B2 (ja) 辞書構築支援方法、装置及びプログラム
JPH0531186B2 (ja)
JP3884001B2 (ja) 言語解析システムおよび方法
JPS6395573A (ja) 日本語文形態素解析における未知語処理方法
JPH03129568A (ja) 文書処理装置
JPH04296970A (ja) 文章検査装置
JPH05342251A (ja) 辞書検索装置
JPH02136959A (ja) 日本文訂正候補抽出装置
JPH0222761A (ja) 辞書メモリ作成装置
JPH04263355A (ja) カタカナ誤り検出装置
Cowie CRL’s Approach to MET
JPH0682367B2 (ja) 文書作成・校正支援装置
JPH01114973A (ja) 文書作成・校正支援装置
JPH0484360A (ja) 文章検査装置
JPS63136264A (ja) 機械翻訳装置
JPH03111965A (ja) 仮名漢字変換方法及び仮名漢字変換装置
JPH03129562A (ja) インデックス作成支援装置
JPS63133228A (ja) 情報抽出装置
JPH0683862A (ja) 文書作成装置
JPH01260531A (ja) 文書検索装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980331

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090501

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100501

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees