JPH0484360A - Sentence inspecting device - Google Patents

Sentence inspecting device

Info

Publication number
JPH0484360A
JPH0484360A JP2199648A JP19964890A JPH0484360A JP H0484360 A JPH0484360 A JP H0484360A JP 2199648 A JP2199648 A JP 2199648A JP 19964890 A JP19964890 A JP 19964890A JP H0484360 A JPH0484360 A JP H0484360A
Authority
JP
Japan
Prior art keywords
string
sentence
character
character string
immediately
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2199648A
Other languages
Japanese (ja)
Inventor
Yutaka Oyama
裕 大山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2199648A priority Critical patent/JPH0484360A/en
Publication of JPH0484360A publication Critical patent/JPH0484360A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To easily detect a wrong drawing reference code by extracting a numeral string in a sentence and the position of the string in the sentence and inspecting the character strings immediately before and after the numeral string in a sentence. CONSTITUTION:A sentence storing means 2, numeral string information extracting means 3, numeral string storing means 4, and immediately-before and immediately-after character string inspecting means 5 and 6 are provided and, after an inputted sentence is stored in the sentence storage device 2, a numeral string in the sentence and the position of the string in the sentence are extracted. Then the form of character strings immediately before and after the numeral string in the sentence are inspected about each extracted numeral string and, after deleting numeral strings which are not codes for referring items in a drawing, a KWIC list using the remaining numeral strings as keys is prepared and displayed. Therefore, detection of erroneous drawing reference code in a sentence can be supported efficiently.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 図面参照用の符号を検査する文章検査装置に関する。[Detailed description of the invention] [Industrial application field] The present invention relates to a text inspection device that inspects drawing reference symbols.

〔従来の技術〕[Conventional technology]

文章技術の向上により、一般の利用者がワードプロセッ
サなどを用いて効率よく文書を作成することが容易にな
った。最近では、かな漢字変換などによる日本語入力だ
けでなく、入力した文章を計算機によりチエツクする機
能も実現されている。
Improvements in writing technology have made it easier for general users to efficiently create documents using word processors and the like. Recently, not only Japanese input through kana-kanji conversion, etc., but also the ability to check input sentences using a calculator have been realized.

例えば、日本ソフトウェア科学会第4回大会予稿B−1
−2F日本語文章作成支援ツール「推敲J1のパーソナ
ルコンピュータでの実用化」には、「言い替えた方がよ
い語句の検索」やrKWICリストの作成コなと、多く
の文章検査機能が紹介されている。これらの機能を活用
し、日本語の文章の誤りを検出・訂正することで、文章
の品質を向上させることができる。
For example, Proceedings of the 4th Annual Conference of the Japan Software Science Society B-1
-2F Japanese text creation support tool "Practical application of Elaboration J1 on a personal computer" introduces many text inspection functions such as "search for words that should be rephrased" and rKWIC list creation. There is. By utilizing these functions to detect and correct errors in Japanese sentences, it is possible to improve the quality of the sentences.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

特許や考案(以下、まとめて特許と呼ぶ)など、図面を
伴う文章の作成時にも前述の文章検査機能は有効である
。しかしながら、前述の文章検査機能は一般的日本語文
章を処理対象としており、図面参照特有の表現や用語に
対しての検査を行うことはできない。
The text inspection function described above is also effective when creating texts accompanied by drawings, such as patents and inventions (hereinafter collectively referred to as patents). However, the above-mentioned text inspection function processes general Japanese sentences, and cannot inspect expressions and terms specific to drawing references.

特許明細書作成時特有の誤りの一つに、図面参照用の符
号(一般に数字または英数記号で構成される)の付は間
違いがある。例えば、特許図面の中でrl、oOJ と
いう符号を付けられた項目(符号の名称)「制御装置」
を使用している場合には、「制御装置100」と参照さ
れる。ここで、図面の変更に伴い符号r100Jをrl
 OIJに変更した場合には、文章中の「制御装置10
0Jをすべて「制御装置101」に変更しなければなら
ない。ところが、「制御装置100」という記述は明細
書の中で複数回使用されることが多く、変更漏れのため
に「制御装置100」のまま残してしまう恐れがある。
One of the common errors that occur when drafting patent specifications is the incorrect use of drawing reference symbols (generally consisting of numbers or alphanumeric symbols). For example, in a patent drawing, items (code names) labeled rl and oOJ are "control devices."
is referred to as the "control device 100". Here, due to a change in the drawing, the code r100J has been changed to rl.
When changing to OIJ, the “control device 10” in the text
All 0J must be changed to "control device 101". However, the description "control device 100" is often used multiple times in the specification, and there is a risk that the description "control device 100" will remain as it is due to omission of changes.

上記誤りを最小限に抑える手段として、前述の「推敲」
における数字などの限定字種を指定した文字列献策機能
を使用し、抽出部分を人間が黙視確認する手段が考えら
れる。しかしながら、この機能を使用すると、車室ての
番号や文中の数字など、明らかに符号にならない部分も
同時に検索されてしまい、検査効率が悪いという欠点が
ある。
As a means to minimize the above errors, the above-mentioned "elaboration"
A possible method is to use a character string suggestion function that specifies limited character types such as numbers in , and allow a human to silently check the extracted part. However, when this function is used, parts that clearly do not correspond to codes, such as vehicle interior numbers and numbers in sentences, are also searched at the same time, resulting in poor inspection efficiency.

本発明の目的は、前述の従来技術にみられた欠点を解決
し、文章中に存在する図面参照用符号の誤りの検出を支
援する文章検査装置を提供することにある。
SUMMARY OF THE INVENTION An object of the present invention is to provide a text inspection device that solves the drawbacks seen in the above-mentioned prior art and supports the detection of errors in drawing reference symbols existing in texts.

〔課題を解決するための手段〕[Means to solve the problem]

第1の発明の文章検査装置は、文章を入力する入力手段
と、入力された前記文章を記憶するための文章記憶手段
と、前記文章内の数字列とその文章中における位置を抽
出する数字列情報抽出手段と、前記数字列を記憶するた
めの数字列記憶手段と、前記文章中における前記数字列
の直前の文字列の形態を検査する直前文字列検査手段と
、前記文章中における前記数字列の直後の文字列の形態
を検査する直後文字列検査手段と、前記直前文字列検査
手段および直後文字列検査手段の検査結果をもとに前記
数字列記憶手段内の前記数字列を削除する数字列削除手
段と、前記数字列および前記文章をもとにKWICリス
トを生成するKWIC生成手段と、前記KWICリスト
を表示する表示手段を備え、前記直前文字列検査手段は
前記文章中の前記数字列の直後が図面参照用符号の名称
を構成しうる文字または文字列でないものを検出し、前
記直後文字列検査手段は前記文章中の前記数字列の直後
が図面参照用符号の直後に位置しうる文字または文字列
でないものを検出し、前記数字列削除手段は前記直前文
字列検査手段および前記直前文字列検査手段によって検
出された数字列を削除することを特徴とする突≠検妻≠
1 また、第2の発明の文章検査装置は、文章を入力する入
力手段と、入力された前記文章を記憶するための文章記
憶手段と、前記文章内の数字列とその文章中における位
置を抽出する数字列情報抽出手段と、前記数字列を記憶
するための数字列記憶手段と、前記文章中における前記
数字列の直前の文字列の形態を検査する直前文字列検査
手段と、前記文章中における前記数字列の直後の文字列
の形態を検査する直後文字列検査手段と、前記直前文字
列検査手段および直後文字列検査手段の検査結果をもと
に前記数字列記憶手段内の前記数字列を削除する第1の
数字列削除手段と、特許明細書特有の不要語を収めた不
要語辞書と、前記文章中における前記数字列の前後の文
字列が前記不要語と一致する場合に前記数字列記憶手段
内の前記数字列を削除する第2の数字列削除手段と、前
記数字列および前記文章をもとにKWICリストを生成
するKWIC生成手段と、前記KWIC!、Iストを表
示する表示手段を備え、前記直前文字列検査手段は前記
文章中の前記数字列の直前が図面参照用符号の名称を構
成しうる文字または文字列でないものを検出し、前記直
後文字列検査手段は前記文章中の前記数字列の直後が図
面参照用符号の直後に位置しうる文字または文字列でな
いものを検出し、前記数字列削除手段は前記直前文字列
検査手段および前記直前文字列検査手段によって検出さ
れた数字列を削除することを特徴とす6.p検−1ツ4
壮 〔作用〕 第1の発明の作用は以下の通りである。まず、入力され
る文章を文章記憶装置に記憶した後、文章内の数字列と
その文章中における位置を抽出する。ただし、本発明に
おいて数字列は図面参照用符号として使用できる文字列
の意味であり、100aや100−aのように、数字列
の直後に連続する英記号(句読点や括弧などの区切り記
号を除く)の結合も許すよう拡大解釈する。次に、抽出
された各数字列について文章内におけるその数字列の直
前と直後の文字列の形態を調べ、その数字列が図面内の
項目参照のための符号であるもの以外を削除する。次に
、残った数字列をキーにしたKWICリストを生成し表
示を行う。
A text inspection device according to a first aspect of the present invention includes an input means for inputting a text, a text storage means for storing the input text, and a number string for extracting a number string in the text and its position in the text. information extraction means, number string storage means for storing the number string, immediately preceding character string inspection means for inspecting the form of the character string immediately before the number string in the sentence, and the number string in the sentence. Immediate character string testing means for inspecting the form of the character string immediately after the character string, and numbers for deleting the numeric string in the numeric string storage means based on the test results of the immediately preceding character string testing means and the immediately following character string testing means. The preceding character string inspection means includes a column deletion means, a KWIC generation means for generating a KWIC list based on the number string and the text, and a display means for displaying the KWIC list, and the immediately preceding character string inspection means is configured to delete the number string in the text. The character string immediately after the number string in the text may be located immediately after the drawing reference code. A character string that is not a character or a character string is detected, and the number string deletion means deletes the number string detected by the immediately preceding character string inspection means and the immediately preceding character string inspection means.
1 Further, the text inspection device of the second invention includes an input means for inputting a text, a text storage means for storing the input text, and a number string in the text and its position in the text. a number string information extraction means for storing the number string; a immediately preceding character string inspection means for inspecting the form of the character string immediately before the number string in the sentence; Immediate character string inspection means for inspecting the form of the character string immediately after the numeric string, and the numeric string in the numeric string storage means based on the test results of the immediately preceding character string inspection means and the immediately following character string inspection means. a first number string deletion means to be deleted; an unnecessary word dictionary containing unnecessary words specific to patent specifications; a second number string deletion means for deleting the number string in the storage means; a KWIC generation means for generating a KWIC list based on the number string and the text; and a KWIC! , I list, and the immediately preceding character string checking means detects a character immediately before the number string in the text that is not a character or a character string that can constitute the name of a drawing reference code, The character string inspection means detects a character or character string immediately after the number string in the text that can be located immediately after the drawing reference code, and the number string deletion means detects the immediately preceding character string inspection means and the immediately preceding character string. 6. It is characterized by deleting the number string detected by the character string inspection means. p-ken-1tsu4
[Operation] The operation of the first invention is as follows. First, an input sentence is stored in a sentence storage device, and then a number string in the sentence and its position in the sentence are extracted. However, in the present invention, the numeric string means a character string that can be used as a reference code for drawings, such as 100a and 100-a, and the alphanumeric characters immediately following the numeric string (excluding punctuation marks and delimiters such as parentheses). ) is expanded to allow the combination of Next, for each extracted number string, the format of the character strings immediately before and after the number string in the text is examined, and those whose number strings are not codes for referring to items in the drawings are deleted. Next, a KWIC list is generated and displayed using the remaining number string as a key.

第2の発明の作用では、第1の発明の作用の流れに加え
て、数字列を並べ換える前に、文章内におけるその数字
列の直前と直後の文字列と予め用意された特有の不要語
(「第」、「図」、「請求項」など)が一致するか否か
を調べ、一致するものを削除した後にKWICリストの
生成・表示を行う。
In the operation of the second invention, in addition to the flow of the operation of the first invention, before rearranging the number string, the character strings immediately before and after the number string in the sentence and unique unnecessary words prepared in advance are ("Part", "Figures", "Claims", etc.) are checked to see if they match, and after deleting the matches, the KWIC list is generated and displayed.

〔実施例〕〔Example〕

以下、本発明の実施例について図面を参照して説明する
Embodiments of the present invention will be described below with reference to the drawings.

第1図は第1の発明の一実施例を示すブロック図である
FIG. 1 is a block diagram showing an embodiment of the first invention.

第1図において、1は文章を入力する入力手段であり、
2は入力された文章を記憶するための文章記憶手段であ
り、3は文章記憶手段2内の文章の中の数字列とその文
章中における位置を抽出する数字列情報抽出手段であり
、4は抽出された数字列および位置情報を記憶するため
の数字列記憶手段であり、5は数字列記憶手段4内の各
数字列に関して文章記憶手段2内の文章中における直前
の文字列の形態を検査する直前文字列検査手段であり、
6は数字列記憶手段4内の各数字列に関して文章記憶手
段2内の文章中における直後の文字列の形態を検査する
直後文字列検査手段であり、7は直前文字列検査手段5
および直後文字列検査手段6の検査結果をもとに数字列
記憶手段4内の所定の数字列を削除する数字列削除手段
であり、8は数字列記憶手段4内の数字列と文章記憶手
段2内の文章をもとにKWICリストを生成するKWI
C生成手段であり、9はKWICリストを表示する表示
手段であり、10は全体の動作を制御する制御部である
。第1図において、入力手段1はフロッピーディスク装
置や通信回線などで、などで、数字列情報抽出手段3.
直前文字列検査手段5.直後文字列検査手段6.KWI
C生成手段8.制御部10はCPUなどで実現できる。
In FIG. 1, 1 is an input means for inputting sentences;
2 is a text storage means for storing the input text; 3 is a number string information extraction means for extracting a number string from the text in the text storage means 2 and its position in the text; 4 is a number string information extraction means A number string storage means for storing extracted number strings and position information, and 5 inspects the form of the immediately preceding character string in the sentence in the text storage means 2 for each number string in the number string storage means 4. It is a means to check the character string immediately before
Reference numeral 6 denotes an immediately preceding character string inspection means for inspecting the form of the immediately following character string in the sentence in the text storage means 2 for each number string in the number string storage means 4, and 7 indicates an immediately preceding character string inspection means 5.
8 is a number string deletion means for deleting a predetermined number string in the number string storage means 4 based on the test result of the character string inspection means 6, and 8 is a number string and text storage means in the number string storage means 4. KWI that generates a KWIC list based on the sentences in 2.
9 is a display means for displaying the KWIC list, and 10 is a control section for controlling the overall operation. In FIG. 1, input means 1 is a floppy disk device, communication line, etc., and number string information extraction means 3.
Immediately preceding character string inspection means 5. Immediately after character string inspection means 6. KWI
C generation means 8. The control unit 10 can be realized by a CPU or the like.

また、第3図は入力手段から入力される日本語して同じ
符号「4」が与えられている誤りの例である。以下、第
3図の文章を例にとって本実施例の動作を説明する。
Furthermore, FIG. 3 is an example of an error in which the same code "4" is given to the Japanese inputted from the input means. The operation of this embodiment will be described below using the text in FIG. 3 as an example.

入力手段1から入力された日本語文章は文章記憶手段2
に記憶される。その後、数字列情報抽出手段3は制御部
10の制御のもとで、文章記憶手段2内の日本語文章か
ら数字列とその文章中における位置を抽出して数字列記
憶手段4に収める。
The Japanese sentences input from input means 1 are stored in sentence storage means 2.
is memorized. Thereafter, the number string information extraction means 3 extracts a number string and its position in the sentence from the Japanese text in the text storage means 2 under the control of the control section 10, and stores it in the number string storage means 4.

数字列抽出の手順の詳細は、前述の文献においてF字種
列の文字列検索コマンド」として紹介されているので省
略する。この時点での数字列記憶手段4の内容を第4図
に示す。第4図において、「位置」は文章先頭からの文
字数として表わされている。
The details of the procedure for extracting a numeric string are omitted because they are introduced in the above-mentioned literature as ``Character string search command for F-character type string.'' The contents of the number string storage means 4 at this point are shown in FIG. In FIG. 4, "position" is expressed as the number of characters from the beginning of the sentence.

次に、直前文字列検査手段5は制御部10の制御のもと
で、日本語文章(文章記憶手段2にある)中の各数字列
の直前の文字列(第4図の位置情報を用いて参照できる
)が図面で用いる符号の名称を構成しうる文字または文
字列(漢字や片仮名、平仮名など)でない場合に、その
旨を数字列削除手段7に伝える。本例では、1文字目か
らはしまる「3」(文頭)と119文字目からはじまる
「2」(直前が読点)とが符号の名称を構成てきないた
め、その旨が数字列削除手段7に送られる。
Next, under the control of the control unit 10, the immediately preceding character string checking means 5 uses the character string immediately preceding each number string in the Japanese text (in the text storage means 2) (using the position information in FIG. 4). If the character (which can be referred to as a reference) is not a character or character string (such as kanji, katakana, hiragana, etc.) that can constitute the name of a code used in the drawing, this fact is communicated to the number string deletion means 7. In this example, since "3" starting from the 1st character (the beginning of the sentence) and "2" starting from the 119th character (the immediately preceding comma) do not constitute a code name, the number string deletion means 7 sent to.

直後文字列検査手段6は、日本語文章中の各数字列の直
後の文字列が図面で用いる参照用符号の直後に位置しう
る文字または文字列(句読点や平仮名など)でないもの
を検出する。本例では、119文字目からはじまる「2
」および169文字目からはじまる「3」(直後が漢字
)が条件を満たさないため、これを数字列削除手段7に
伝える。直前文字列検査手段5および直後文字列検査手
段6の動作に関しては、単純な字種の比較で実現できる
ので、詳細な説明を省略する。
Immediate character string inspection means 6 detects whether the character string immediately following each number string in the Japanese text is not a character or character string (such as a punctuation mark or hiragana) that can be located immediately after a reference sign used in a drawing. In this example, “2” starts from the 119th character.
" and "3" starting from the 169th character (the immediately following is a kanji character) do not satisfy the condition, so this is communicated to the number string deletion means 7. The operations of the immediately preceding character string checking means 5 and the following character string checking means 6 can be realized by simple comparison of character types, so a detailed explanation will be omitted.

数字列削除手段7は制御部10の制御のもとで、数字列
記憶手段4内の数字列のうち直前文字列検査手段5およ
び直後文字列検査手段6で検出された数字列を削除する
。本例では、1文字目がらはじまるr3J、 119文
字目からはじまる「2」および169文字目からはじま
る「3」が削除される。この時点での数字列記憶手段4
の内容は第5図のようになる。
Under the control of the control unit 10, the number string deletion means 7 deletes the number string detected by the immediately preceding character string checking means 5 and the following character string checking means 6 from among the number strings in the number string storage means 4. In this example, r3J starting from the 1st character, "2" starting from the 119th character, and "3" starting from the 169th character are deleted. Number string storage means 4 at this point
The contents are as shown in Figure 5.

次に、KWIC生成手段8は制御部10の制御のもとで
、数字列記憶手段4内の数字列をもとに、第1キーを数
字列に、第2キーを日本語文章中の数字列の直前の文字
列にとってソートを行った上で、キー前後の文字列を含
めてリストとして生成する。KWIC!jストの作成方
法については、前述の文献の中に実現例が紹介されてお
り(文献の例では第1キーを漢字列に、第2キーを読み
にしてソートしている)、容易に実現できるので動作の
詳細を省略する。得られたKWICリストは表示手段9
で利用者に対して表示される。本例における表示手段9
の表示例を第6図に示す。
Next, under the control of the control unit 10, the KWIC generation means 8 uses the first key to generate a numerical string and the second key to a numerical value in a Japanese sentence based on the numerical string in the numerical string storage means 4. After sorting the string immediately before the column, generate a list including the strings before and after the key. KWIC! An example of how to create a list is introduced in the above-mentioned literature (in the example in the literature, the first key is sorted by a kanji string and the second key is sorted by reading), and it can be easily realized. Since it can be done, the details of the operation will be omitted. The obtained KWIC list is displayed on display means 9.
displayed to the user. Display means 9 in this example
An example of the display is shown in FIG.

第6図では、「結果記憶手段」に対する符号としてr4
Jが与えられており、これが「形態素解析手段」の符号
「4」と型抜していることが見やすい形で表示される。
In FIG. 6, the code for "result storage means" is r4.
J is given, and it is displayed in an easy-to-read format that it is stamped with the code "4" for "morphological analysis means".

その結果、利用者は表示結果を見ることによって誤り部
分を容易に見つけ出しく誤りであるか否かの最終判断は
利用者に任される)、明細書の修正を行うことができる
。なお、符号1について、「請求項1」と「制御部l」
の2つが表示されている。第1の発明では、「請求項1
」が図面符号の名称でないことは利用者の判断に任され
る。
As a result, the user can easily find the erroneous part by looking at the displayed results (the final decision as to whether or not it is an error is left to the user) and can make corrections to the specification. Regarding code 1, "Claim 1" and "Control unit l"
Two are displayed. In the first invention, “Claim 1
” is not the name of a drawing code is left to the user's discretion.

次に、第2図は第2の発明の一実施例を示すブロック図
である。
Next, FIG. 2 is a block diagram showing an embodiment of the second invention.

第2図において、入力手段1〜表示手段9は第1図の同
じ参照符号のものと同一であるので説明を省略する。1
1は特許明細書に特有に使用され図面で用いる符号の名
称に使用されることのない文字または文字列(不要語)
を収めた不要語辞書であり、12は数字列記憶手段4内
の数字列に関して文章記憶手段2内の日本語文章中にお
ける前記数字列の前後の文字列が不要語辞書ll内に存
在するかどうかを調べる不要語検査手段であり、13は
不要語検査手段12による検査結果をもとに数字列記7
手段4内の所定の数字列を削除する第2の数字列削除手
段である。また、10aは全体の動作を制御する制御部
である。以下、第1の3キ1例と同じ例を用いて本実施
例を説明する。
In FIG. 2, input means 1 to display means 9 are the same as those with the same reference numerals in FIG. 1, and therefore their explanations will be omitted. 1
1 is a character or character string (unnecessary word) that is used specifically in patent specifications and is not used in the name of symbols used in drawings.
12 is an unnecessary word dictionary that contains the number string in the number string storage means 4, and whether character strings before and after the number string in the Japanese text in the sentence storage means 2 exist in the unnecessary word dictionary ll. 13 is a list of numbers 7 based on the test results by the unnecessary word testing means 12.
This is a second number string deletion means for deleting a predetermined number string in the means 4. Further, 10a is a control section that controls the overall operation. Hereinafter, this embodiment will be explained using the same example as the first 3/1 example.

入力手段1により日本語文章が入力されてから数字列削
除手段7によって数字列記憶手段4内の所定の数字列が
削除されるまでの手順は第1の発明の一実施例の場合と
同じである。この時点での数字列記憶手段4の内容は第
5図のようになっている。ここで、不要語検査手段12
は制御部10aの制御のもとで、数字列記憶手段4内の
各数字列に関して文章記憶手段2内のこの数字列の前後
の文字列に不要語辞書ll内の不要語と一致するものが
あるか否かを調べ、その結果を第2の数字列削除手段1
3に渡す。ここで、不要語辞書11内に「第」、「請求
項」、「および」、「特許請求の範囲」などが収められ
ていたとする。不要語検査手段12は第5図に示されて
いる190文字目からはじまる符号「1」が文章記憶手
段2内では「請求項1」として表現されており、これが
不要語辞書11内の「請求項Jと一致するので、その旨
を第2の数字列削除手段13に伝える。第2の数字列削
除手段13は制御部10aの制御のもとで、不要語検査
手段12からの指示を受けて数字列記憶手段4内の符号
Ill (190文字目)の項を削除する。以下、第1
図に示した実施例の場合と同様に、KWIC生成手段8
によってKWICが生成されて表示手段9に表示される
。本実施例では第7図のような表示が得られる。
The procedure from when a Japanese sentence is input by the input means 1 to when a predetermined number string in the number string storage means 4 is deleted by the number string deletion means 7 is the same as in the embodiment of the first invention. be. The contents of the number string storage means 4 at this point are as shown in FIG. Here, unnecessary word checking means 12
Under the control of the control unit 10a, for each number string in the number string storage means 4, the character strings before and after this number string in the sentence storage means 2 match an unnecessary word in the unnecessary word dictionary ll. Check whether there is one or not, and send the result to the second number string deletion means 1.
Pass it to 3. Here, it is assumed that the unnecessary word dictionary 11 contains words such as "No.", "Claim", "And", and "Claims". The unnecessary word checking means 12 uses the code "1" starting from the 190th character shown in FIG. Since it matches term J, this fact is transmitted to the second number string deletion means 13.The second number string deletion means 13 receives an instruction from the unnecessary word checking means 12 under the control of the control section 10a. to delete the term of the code Ill (190th character) in the number string storage means 4.Hereafter, the first
As in the embodiment shown in the figure, the KWIC generating means 8
The KWIC is generated and displayed on the display means 9. In this embodiment, a display as shown in FIG. 7 is obtained.

第7図では、「結果記憶手段」に対する符号として「4
」が与えられており、これが「形態素解析手段」の符号
「4」と重複していることが見やすい形で表示される。
In FIG. 7, the code for “result storage means” is “4”.
” is given, and it is clearly displayed that this overlaps with the code “4” of “morphological analysis means”.

さらに、明らかに符号の名称とは異なるものの自動排除
も行われている。
Additionally, items that are clearly different from the code name are automatically excluded.

〔発明の効果〕〔Effect of the invention〕

以上説明したように本発明を用いることにより、図面参
照用符号の不正の検出を容易にすることができるという
効果が得られる。
As explained above, by using the present invention, it is possible to easily detect fraudulent drawing reference symbols.

図に示す表示手段の表示例を示す概念図である。FIG. 3 is a conceptual diagram showing a display example of the display means shown in the figure.

1・・・・・・入力手段、2・・・・・・文章記憶手段
、3・・・・・・数字列情報抽出手段、4・・・・・・
数字列記憶手段、5・・・・・直前文字列検査手段、6
・・・・・・直後文字列検査手段、7・・・・数字列削
除手段、8・・・・・・KWIC生成手段、9・・・・
・表示手段、10.IOa・・・・・・制御部、11・
・・・・・不要語辞書、12・・・・・・不要語検査手
段、13・・・・・第2の数字列削除手段。
1...Input means, 2...Text storage means, 3...Number string information extraction means, 4...
Number string storage means, 5... Immediately preceding character string inspection means, 6
... Immediate character string inspection means, 7... Number string deletion means, 8... KWIC generation means, 9...
・Display means, 10. IOa...control unit, 11.
. . . Unnecessary word dictionary, 12 . . . Unnecessary word inspection means, 13 . . . Second number string deletion means.

代理人 弁理士  内 原   晋Agent Patent Attorney Susumu Uchihara

【図面の簡単な説明】[Brief explanation of drawings]

第1図は第1の発明の一実施例を示すプロ、り区、第2
図は第2の発明の一実施例を示すブロック図、第3図は
入力手段から入力される日本語文章例の一部分を示す図
、第4図、第5図は第1図、第2図における数字列記憶
手段の一例を示す概念図、第6図、第7図はそれぞれ第
1図、第2第1図 第3図 第2図 第4図 第5図 第6図 第7図
FIG. 1 shows an embodiment of the first invention.
Figure 3 is a block diagram showing an embodiment of the second invention, Figure 3 is a diagram showing a part of an example of Japanese text input from the input means, Figures 4 and 5 are Figures 1 and 2. A conceptual diagram showing an example of the number string storage means in , FIGS. 6 and 7 are respectively shown in FIG. 1, FIG. 2, FIG. 1, FIG. 3, FIG.

Claims (1)

【特許請求の範囲】 1、文章を入力する入力手段と、入力された前記文章を
記憶するための文章記憶手段と、前記文章内の数字列と
その文章中における位置を抽出する数字列情報抽出手段
と、前記数字列を記憶するための数字列記憶手段と、前
記文章中における前記数字列の直前の文字列の形態を検
査する直前文字列検査手段と、前記文章中における前記
数字列の直後の文字列の形態を検査する直後文字列検査
手段と、前記直前文字列検査手段および直後文字列検査
手段の検査結果をもとに前記数字列記憶手段内の前記数
字列を削除する数字列削除手段と、前記数字列および前
記文章をもとにKWICリストを生成するKWIC生成
手段と、前記KWICリストを表示する表示手段を備え
、前記直前文字列検査手段は前記文章中の前記数字列の
直後が図面参照用符号の名称を構成しうる文字または文
字列でないものを検出し、前記直後文字列検査手段は前
記文章中の前記数字列の直後が図面参照用符号の直後に
位置しうる文字または文字列でないものを検出し、前記
数字列削除手段は前記直前文字列検査手段および前記直
前文字列検査手段によって検出された数字列を削除する
ことを特徴とする文章検査装置。 2、文章を入力する入力手段と、入力された前記文章を
記憶するための文章記憶手段と、前記文章内の数字列と
その文章中における位置を抽出する数字列情報抽出手段
と、前記数字列を記憶するための数字列記憶手段と、前
記文章中における前記数字列の直前の文字列の形態を検
査する直前文字列検査手段と、前記文章中における前記
数字列の直後の文字列の形態を検査する直後文字列検査
手段と、前記直前文字列検査手段および直後文字列検査
手段の検査結果をもとに前記数字列記憶手段内の前記数
字列を削除する第1の数字列削除手段と、特許明細書特
有の不要語を収めた不要語辞書と、前記文章中における
前記数字列の前後の文字列が前記不要語と一致する場合
に前記数字列記憶手段内の前記数字列を削除する第2の
数字列削除手段と、前記数字列および前記文章をもとに
KWICリストを生成するKWIC生成手段と、前記K
WICリストを表示する表示手段を備え、前記直前文字
列検査手段は前記文章中の前記数字列の直前が図面参照
用符号の名称を構成しうる文字または文字列でないもの
を検出し、前記直後文字列検査手段は前記文章中の前記
数字列の直後が図面参照用符号の直後に位置しうる文字
または文字列でないものを検出し、前記数字列削除手段
は前記直前文字列検査手段および前記直前文字列検査手
段によって検出された数字列を削除することを特徴とす
る文章検査装置。
[Scope of Claims] 1. Input means for inputting a sentence, text storage means for storing the inputted sentence, and number string information extraction for extracting a number string in the sentence and its position in the sentence. means, a number string storage means for storing the number string, immediately preceding character string inspection means for inspecting the form of a character string immediately before the number string in the sentence, and immediately after the number string in the sentence. Immediate character string testing means for inspecting the form of the character string; and numeric string deletion for deleting the numeric string in the numeric string storage means based on the test results of the immediately preceding character string testing means and the immediately following character string testing means. KWIC generating means for generating a KWIC list based on the number string and the text, and display means for displaying the KWIC list, and the immediately preceding character string checking means includes a KWIC list immediately after the number string in the text. is not a character or a character string that can constitute the name of a drawing reference code, and the immediate character string checking means detects a character or character string that can be located immediately after the number string in the text and immediately after the drawing reference code. A text inspection device, characterized in that a non-character string is detected, and the number string deletion means deletes the number string detected by the immediately preceding character string inspection means and the immediately preceding character string inspection means. 2. An input means for inputting a sentence, a sentence storage means for storing the inputted sentence, a number string information extraction means for extracting a number string in the sentence and its position in the sentence, and the number string a number string storage means for storing a number string; a immediately preceding character string inspection means for inspecting the form of a character string immediately before the number string in the sentence; a character string checking means immediately after the test; a first number string deletion means for deleting the number string in the number string storage means based on the test results of the immediately preceding character string checking means and the immediately preceding character string checking means; an unnecessary word dictionary containing unnecessary words specific to patent specifications; and a device for deleting the numerical string in the numerical string storage means when character strings before and after the numerical string in the text match the unnecessary word. a KWIC generating means for generating a KWIC list based on the numerical string and the text;
Display means for displaying a WIC list is provided, and the immediately preceding character string inspection means detects a character immediately before the number string in the text that is not a character or a character string that can constitute the name of a drawing reference code, and detects the immediately preceding character string. The string checking means detects a character or character string immediately after the number string in the text that can be located immediately after the drawing reference code, and the number string deletion means detects the immediately preceding character string checking means and the immediately preceding character. A text inspection device characterized by deleting a number string detected by a column inspection means.
JP2199648A 1990-07-27 1990-07-27 Sentence inspecting device Pending JPH0484360A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2199648A JPH0484360A (en) 1990-07-27 1990-07-27 Sentence inspecting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2199648A JPH0484360A (en) 1990-07-27 1990-07-27 Sentence inspecting device

Publications (1)

Publication Number Publication Date
JPH0484360A true JPH0484360A (en) 1992-03-17

Family

ID=16411342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2199648A Pending JPH0484360A (en) 1990-07-27 1990-07-27 Sentence inspecting device

Country Status (1)

Country Link
JP (1) JPH0484360A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014171519A1 (en) * 2013-04-17 2014-10-23 アイビーリサーチ株式会社 Typographical error detection device and recording medium

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63163956A (en) * 1986-12-26 1988-07-07 Sharp Corp Document preparation and correction supporting device
JPH01205263A (en) * 1988-02-12 1989-08-17 Toshiba Corp Method for extracting referring construction

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63163956A (en) * 1986-12-26 1988-07-07 Sharp Corp Document preparation and correction supporting device
JPH01205263A (en) * 1988-02-12 1989-08-17 Toshiba Corp Method for extracting referring construction

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014171519A1 (en) * 2013-04-17 2014-10-23 アイビーリサーチ株式会社 Typographical error detection device and recording medium

Similar Documents

Publication Publication Date Title
JPS6231467A (en) Sentence preparation device
JPH0484360A (en) Sentence inspecting device
JP2621999B2 (en) Document processing device
JPH08115330A (en) Method for retrieving similar document and device therefor
JP2776069B2 (en) Document inspection device
JPH04296970A (en) Sentence checking device
JPH05233619A (en) Method for correcting error of japanese language sentence and device therefor
JPH0531186B2 (en)
JPH08263486A (en) Device and method for kana/kanji conversion
JPS60207948A (en) "kana"/"kanji" conversion processor
JPS60189573A (en) Character convertor
JPS61175855A (en) Kana to kanji converting device
JPH0282348A (en) Document proofreading backup device
JPH03137768A (en) Document processor
JPH0785040A (en) Inscription nonuniformity detecting method and kana/ kanji converting method
JPH0682366B2 (en) Character string correction method
JPS6175467A (en) Kana and kanji converting device
JPH0581234A (en) 'kana'/'kanji' converter
JPH0264859A (en) Text processing device
JPH034358A (en) Kana/kanji conversion system
JPH08263492A (en) Method and device for supporting document preparation
JPH10171804A (en) Machine translation system
JPS61180360A (en) Document editing device
JPS6327916A (en) Documentation device
JPH08339366A (en) Method and device for documentation