JP2894736B2 - Sentence inspection method - Google Patents

Sentence inspection method

Info

Publication number
JP2894736B2
JP2894736B2 JP1226943A JP22694389A JP2894736B2 JP 2894736 B2 JP2894736 B2 JP 2894736B2 JP 1226943 A JP1226943 A JP 1226943A JP 22694389 A JP22694389 A JP 22694389A JP 2894736 B2 JP2894736 B2 JP 2894736B2
Authority
JP
Japan
Prior art keywords
inspection
sentence
character string
expression
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1226943A
Other languages
Japanese (ja)
Other versions
JPH0390958A (en
Inventor
俊一 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP1226943A priority Critical patent/JP2894736B2/en
Publication of JPH0390958A publication Critical patent/JPH0390958A/en
Application granted granted Critical
Publication of JP2894736B2 publication Critical patent/JP2894736B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、与えられた文章から不適切な表現や注意を
要する表現等を検出する文章検査方法に関する。
Description: TECHNICAL FIELD The present invention relates to a sentence inspection method for detecting an inappropriate expression or an expression requiring attention from a given sentence.

〔従来の技術〕 文章中から不適切な表現や注意を要する表現等を検出
する手法が要望されている。この検出対象となる表現項
目としては、例えば、接続関係(直接/逆接)があいま
いになりがちな接続助詞の「が」や、主体があいまいに
なりがちな受け身表現(受け身の助動詞「れる」「られ
る」などがある。
[Related Art] There is a demand for a method of detecting inappropriate expressions, expressions requiring attention, and the like from sentences. Examples of the expression items to be detected include, for example, a connection particle “ga” whose connection relation (direct / reverse connection) tends to be ambiguous, and a passive expression (a passive auxiliary verb “re” Be ".

従来この種の文章検査方法には、次の2つの方法があ
る。
Conventionally, this type of sentence inspection method includes the following two methods.

字面処理による文章検査方法 文章解析処理による文章検査方法 第1の方法である字面処理による文章検査方法は、あ
る特定の条件を満たす文字列を検索するものであり、
「日本語文章推敲支援ツールにおける推敲情報抽出アル
ゴリズムの構築」(菅沼・牛島、日本ソフトウェア科学
会第4回大会論文集、1987)や「日本語文章推敲支援ツ
ールにおける受身形の抽出方法」(牛島・石田・尹・高
木、情報処理学会論文誌、第28巻第8号、1987)等の文
献に示されている。
Sentence Inspection Method by Textual Processing Sentence Inspection Method by Textual Analysis Processing The first method, the sentence inspection method by textual processing, searches for a character string satisfying a specific condition.
"Construction of an algorithm for extracting elaboration information in a Japanese text editing tool" (Suganuma / Ushijima, Proceedings of the 4th Annual Conference of the Japan Society for Software Science, 1987) Ushijima, Ishida, Yun, Takagi, IPSJ Transactions, Vol. 28, No. 8, 1987).

例えば、接続助詞の「が」を検出する場合は、直前の
文字が、ウ段の文字、「い」「だ」「た」「ん」のいず
れかであるような「が」を検索する。受身の助動詞
「れ」「られる」を検出する場合は、直前の文字列が
「か」「さ」「た」「ま」「ら」「わ」「が」「ば」
「死な」「しな」のいずれかで、「われわれ」に含まな
い「れ」を検索する。
For example, when detecting the connecting particle "GA", a search is made for "GA" in which the immediately preceding character is one of the U-column characters "I", "DA", "TA", or "N". When detecting the passive auxiliary verb "re""reru", the character string immediately preceding it is "ka""sa""ta""ma""ra""wa""ga""ba"
Search for "re" in either "dead" or "shina" that is not included in "us".

第2の方法である文章解析処理による文章検査方法
は。単語辞書や文法辞書を用いた文章解析処理によっ
て、与えられた全文章に対して、文・文節・単語等の文
法的な単位・構造、および各単語の品詞等を認定した
後、検出対象の表現項目に該当する単語(あるいは単語
列)を検索するものである。
What is the sentence inspection method by the sentence analysis processing that is the second method? After the sentence analysis processing using a word dictionary or grammar dictionary, the grammatical units and structures of sentences, phrases, words, etc., and the parts of speech of each word, etc. are identified for all given sentences, This is to search for a word (or word string) corresponding to the expression item.

この第2の方法は、「日本語文書校正支援システムCR
ITAC」(鈴木・武田・藤崎、情報処理学会研究報告、86
−JDP−8−5,1986)や「日本語文章作成支援システムC
OMET」(福島・大竹・大山・首藤、電子通信学会技術研
究報告、OS86−21,1986)等の文献に示されている。
This second method is based on “Japanese document proofreading support system CR
ITAC ”(Suzuki, Takeda, Fujisaki, Information Processing Society of Japan, 86
−JDP-8-5,1986) and “Japanese Text Creation Support System C”
OMET "(Fukushima, Ohtake, Oyama, Shuto, IEICE Technical Report, OS86-21, 1986).

〔発明が解決しようとする課題〕[Problems to be solved by the invention]

上述の従来の第1の方法(字面処理による文章検査方
法)は、簡易な処理方法であるから、高速であるが、検
出精度が低いという問題点がある(検査という目的から
該当箇所の検出もれは避けて設計されるため、通常、該
当箇所以上の検出過剰が生ずる)。例えば、前述の字面
処理による接続助詞の「が」の検出方法では、「したが
って」や「1つが」などの「が」も接続助詞として検出
されてしまう。
The above-mentioned first conventional method (sentence inspection method using character surface processing) is a simple processing method, and therefore has a problem of high speed but low detection accuracy. This is designed to avoid this, so that over-detection usually occurs at the relevant point or more). For example, in the method of detecting the connecting particle "GA" by the above-described character surface processing, "GA" such as "hatsu" and "one" is also detected as the connecting particle.

一方、第2の方法(文章解析処理による文章検査方
法)は、該当箇所の前後まで含めて単語認定が行なわれ
ているので検出精度が高いが、一般に数万件の見出しを
もつ単語辞書と、全文章とを照合するため、第1の方法
に比べてはるかに処理時間を要するという問題点があ
る。
On the other hand, the second method (sentence inspection method by sentence analysis processing) has high detection accuracy because word recognition is performed up to and including the relevant part, but generally a word dictionary having tens of thousands of headings, There is a problem that processing time is much longer than that of the first method because the entire text is collated.

すなわち、上述の従来の方法では、処理速度と検出精
度とは相反するものであった。
That is, in the above-described conventional method, the processing speed and the detection accuracy are contradictory.

そこで、本発明の目的は、処理が高速で、かつ検出精
度の高い文章検査方法を提供することにある。
Therefore, an object of the present invention is to provide a sentence inspection method that is fast in processing and high in detection accuracy.

〔課題を解決するための手段〕[Means for solving the problem]

本発明は、与えられた文章から不適切な表現や注意を
要する表現等を検出する文章検査方法において、第1段
階として、検出対象の1表現項目について前記与えられ
た文章の全文を検査対象範囲とする辞書・文法を用いな
い文字列照合による検査処理を行い、第2段階として、
検査対象範囲を前記文字列照合による検査処理の検出箇
所を含む1文あるいは句読点で区切られた範囲に制限し
て辞書・文法を用いた文章解析による検査処理を行う。
According to the present invention, in a sentence inspection method for detecting an inappropriate expression, an expression requiring attention, or the like from a given sentence, as a first step, the entire sentence of the given sentence for one expression item to be detected is checked. Inspection processing by character string matching without using a dictionary / grammar
The inspection process is performed by restricting the inspection target range to one sentence including the detection position of the inspection process by the character string collation or a range delimited by punctuation marks, and by a sentence analysis using a dictionary / grammar.

〔実施例〕 次に、本発明について図面を参照して説明する。Next, the present invention will be described with reference to the drawings.

第1図は、本発明における1表現項目に関する検査手
続きを示したフローチャートである。また、第2図は、
同手続きを実現したある1表現項目に関する検査装置の
ブロック図の例である。以下、第1図と第2図を参照し
て本発明の説明を行なう。
FIG. 1 is a flowchart showing an inspection procedure for one expression item in the present invention. Also, FIG.
It is an example of the block diagram of the inspection device regarding one certain expression item which realized the same procedure. Hereinafter, the present invention will be described with reference to FIG. 1 and FIG.

まず、検査対象の文章全体が、文章入力手段1によっ
て読み込まれて、文章記憶手段2に記憶されているもの
とする。
First, it is assumed that the entire text to be inspected is read by the text input unit 1 and stored in the text storage unit 2.

ここで、第2図に示されているように、検査対象の1
表現項目についてn個の検査手段3(3(1),3
(2),……3(n))が設けられている。第1図で
は、ステップ101でiが1に設定され、ステップ105でi
が1ずつ増加されながら、ステップ102〜104の処理が繰
り返されており、すなわち、第2図に示されているn個
の検査手段は、検査手段3(1),検査手段3(2),
……検査手段3(n)と順次適用される。また、その
際、最初に適用される検査手段3(1)は、第1図のス
テップ100に示されているように、文章記憶手段2に記
憶された文章全文を検査対象範囲とするが、それ以降に
適用される検査手段3(i)(図示せず、2≦i≦n)
については、第1図のステップ104に示されているよう
に、検査手段(i−1)の検出結果をもとにして、検査
対象範囲が決定される。第2図における範囲決定手段4
が、その検査対象範囲の決定を行なう。
Here, as shown in FIG.
For the expression item, n inspection means 3 (3 (1), 3
(2),... 3 (n)). In FIG. 1, i is set to 1 in step 101, and i is set in step 105.
Are incremented by one, and the processing of steps 102 to 104 is repeated, that is, the n inspection means shown in FIG. 2 include the inspection means 3 (1), the inspection means 3 (2),
... Applied sequentially to the inspection means 3 (n). In addition, at this time, as shown in step 100 of FIG. 1, the inspection means 3 (1) applied first sets the whole sentence stored in the sentence storage means 2 as the inspection target range. Inspection means 3 (i) applied thereafter (not shown, 2 ≦ i ≦ n)
For, as shown in step 104 of FIG. 1, the inspection target range is determined based on the detection result of the inspection means (i-1). Range determining means 4 in FIG.
Determines the inspection target range.

n個の検査手段が順次適用されたならば、第1図のス
テップ106に示されているように、最後の検査手段3
(n)の検出結果を出力する。第2図では、結果出力手
段5が検出結果の出力を行なっている。
If the n inspection means have been applied sequentially, the last inspection means 3 is used, as shown in step 106 of FIG.
The detection result of (n) is output. In FIG. 2, the result output means 5 outputs a detection result.

以上は、例えば、接続助詞の「が」の検出というよう
に、1つの表現項目に関する検査を説明したものである
が、他に受身の助動詞も検出するなど別の表現項目に関
しても検査を行なう場合もある。そのように複数の表現
項目に関する検査を行なう場合の手続きは、第1図のフ
ローチャートに示した手続き全体を繰り返せばよい。ま
た、それに対し、複数の表現項目(m項目)に関する検
査を行なう検査装置のブロック図の例は第3図のように
なる。第3図では、各表現項目について複数の検査手段
(1−1)〜(1−n),(2−1)〜(2−n),…
…,(m−1)〜(m−nm)が設けられている。
The above describes the inspection for one expression item, for example, detection of the connecting particle "GA". However, when the inspection is performed for another expression item, for example, the detection of a passive auxiliary verb is also performed. There is also. The procedure for such a check on a plurality of expression items may be performed by repeating the entire procedure shown in the flowchart of FIG. On the other hand, an example of a block diagram of an inspection apparatus for inspecting a plurality of expression items (m items) is as shown in FIG. In FIG. 3, a plurality of inspection means (1-1) to (1-n), (2-1) to (2-n),.
, (M-1) to (m-nm) are provided.

以上では、方法の手続き・構成を一般的に述べたが、
次に検査手段の内容を具体的に示した実施例を説明す
る。
In the above, the procedure and structure of the method have been described generally.
Next, an embodiment that specifically shows the contents of the inspection means will be described.

第4図は、本発明の文章検査方法を用いた接続助詞
「が」の検査装置の一実施例の構成を示すブロック図で
ある。第4図のブロック図は、第2図のブロック図にお
いて検査手段の数nが2の場合に相当する。
FIG. 4 is a block diagram showing a configuration of an embodiment of a connection particle "GA" inspection apparatus using the sentence inspection method of the present invention. The block diagram of FIG. 4 corresponds to the case where the number n of the inspection means is 2 in the block diagram of FIG.

第4図のブロック図の各構成要素を説明する。 Each component of the block diagram of FIG. 4 will be described.

文章入力手段1は、漢字かな混じりの日本語文章を入
力する手段であり、キーボードとかな漢字変換装置、あ
るいは、文字認識装置、あるいはワードプロセッサで作
成される文書ファイルを読み込む装置などで実現でき
る。文章記憶手段では、文章入力手段1によって入力さ
れた日本語文章を記憶する手段で、ICメモリや磁気ディ
スク装置などで実現できる。
The sentence input unit 1 is a unit for inputting Japanese sentences mixed with kanji and kana, and can be realized by a keyboard and a kana to kanji conversion device, a character recognition device, or a device for reading a document file created by a word processor. The text storage means is a means for storing Japanese text input by the text input means 1, and can be realized by an IC memory, a magnetic disk device, or the like.

検査手段3(1)には文字列検査手段310が対応す
る。文字列検索手段310は、文章記憶手段2に記憶され
た日本語文章から、ある特定の条件を満たす文字列を検
索する手段である。ここでは、接続助詞の「が」の検出
を目的としているので、特定の条件を満たす文字列と
は、具体的には、直前の文字がウ段の文字、「い」
「だ」「た」「ん」のいずれかであるような「が」であ
る。この文字列検索手段310は、従来技術で述べた従来
の第1の文章検査方法と同等のものであり、当業者は容
易に実現できる。なお、文字列検索手段310が対象とす
る文章の範囲は範囲決定手段4から通知され、また、文
字列検索手段310の検出した文字列の位置(特定の条件
を満たした文字列の位置)は範囲決定手段4へ送られ
る。
The character string inspection unit 310 corresponds to the inspection unit 3 (1). The character string search means 310 is a means for searching a Japanese sentence stored in the sentence storage means 2 for a character string satisfying a specific condition. Here, since the purpose is to detect the connecting particle “GA”, a character string that satisfies a specific condition is, specifically, the character immediately before the character in the U-column, “I”
It is "ga" which is either "da", "ta" or "n". This character string search means 310 is equivalent to the conventional first sentence inspection method described in the related art, and can be easily realized by those skilled in the art. The range of the sentence targeted by the character string search means 310 is notified from the range determination means 4, and the position of the character string detected by the character string search means 310 (the position of the character string satisfying the specific condition) is It is sent to the range determining means 4.

範囲決定手段4は、前述のように、検査手段(1)の
検査対象範囲を文章全文とし、検査手段(i)(2≦i
≦n)の検査対象範囲を検査手段(i−1)の検出箇所
をもとに決定する。
As described above, the range determination unit 4 sets the inspection target range of the inspection unit (1) to the whole sentence, and checks the inspection unit (i) (2 ≦ i
The inspection target range of ≦ n) is determined based on the detection position of the inspection means (i-1).

第4図の実施例では、検査手段の数nが2であるか
ら、範囲決定手段4は、まず検査手段3(1)の文字列
検索手段310に対して、検査対象範囲を文章記憶手段2
に記憶された日本語文章の全文とするように通知する。
In the embodiment shown in FIG. 4, since the number n of the inspection means is 2, the range determination means 4 first sends the inspection target range to the text storage means 2 to the character string search means 310 of the inspection means 3 (1).
To be the full sentence of the Japanese sentence stored in.

次に、文字列検索手段310から検出位置の情報を受け
取ったならば、範囲決定手段4は、検査手段(2)の文
章解析手段322に検査対象範囲を通知する。この文章解
析手段322の検査対象範囲の決定方法は、例えば、文字
列検索手段310の検出した文字列の位置ごとに、その位
置を含む文の範囲(あるいは句読点で区切られた範囲)
とする方法がある。
Next, when information on the detection position is received from the character string search unit 310, the range determination unit 4 notifies the text analysis unit 322 of the inspection unit (2) of the inspection target range. The method of determining the inspection target range by the sentence analysis means 322 is, for example, for each position of the character string detected by the character string search means 310, the range of the sentence including that position (or the range delimited by punctuation).
There is a method.

検査手段3(2)には、単語辞書320,文法辞書321,文
章解析手段322,解析結果記憶手段323,単語列検索手段32
4が対応する。
The inspection means 3 (2) includes a word dictionary 320, a grammar dictionary 321, a sentence analysis means 322, an analysis result storage means 323, and a word string search means 32.
4 corresponds.

単語辞書320には単語の表記・品詞等が登録されてい
る。文法辞書321には単語の並び・文の構造等に関する
文法的な条件が記述されている。
In the word dictionary 320, word expressions, parts of speech, and the like are registered. The grammar dictionary 321 describes grammatical conditions concerning the arrangement of words, the structure of sentences, and the like.

文章解析手段322は、単語辞書320と文法辞書321とを
参照して、与えられた文章に対して、文・文節・単語等
の文法的な単位・構造,および各単語の品詞等を認定す
る手段である。
The sentence analysis means 322 refers to the word dictionary 320 and the grammar dictionary 321 and certifies the grammatical units and structures of sentences, phrases, words, etc., and the parts of speech of each word, for the given sentences. Means.

解析結果記憶手段323は、文章解析手段322の解析結果
を記憶する手段である(ICメモリ,磁気ディスク等で実
現される)。
The analysis result storage unit 323 is a unit that stores the analysis result of the text analysis unit 322 (implemented by an IC memory, a magnetic disk, or the like).

単語列検索手段324は、解析結果記憶手段323に記憶さ
れた、文章解析結果としての単語列を対象として、ある
特定の条件を満たす単語あるいは単語列を検索する。こ
こでは、単語列検索手段324は、接続助詞「が」(表記
が「が」で品詞が接続助詞の単語)を検索する。この単
語列検索手段324は、前述の従来の第2の文章検査方法
と同等のものであり、当業者は容易に実現できる。な
お、単語列検索手段324の検出した単語(あるいは単語
列)の位置は、結果出力手段5へ送られる。
The word string search unit 324 searches for a word or a word string that satisfies a specific condition with respect to the word string as a sentence analysis result stored in the analysis result storage unit 323. Here, the word string search unit 324 searches for a connecting particle “GA” (a word whose notation is “GA” and the part of speech is a connecting particle). This word string search means 324 is equivalent to the above-described second conventional sentence inspection method, and can be easily realized by those skilled in the art. The position of the word (or word string) detected by the word string search means 324 is sent to the result output means 5.

結果出力手段5は、前述のように最後の検出手段の検
出結果、ここでは単語列検索手段324の検出結果を出力
する手段であり、ディスプレイやプリンタ等で実現でき
る。出力形式は、文章記憶手段2に記憶された文章を表
示しながら、検出された箇所を括弧で囲ったり、反転・
プリンタ・網掛けを行なったりして強調する方法や、検
出された箇所を前後の文脈とともにKWIC表示する方法等
がある。
As described above, the result output unit 5 is a unit that outputs the detection result of the last detection unit, here, the detection result of the word string search unit 324, and can be realized by a display, a printer, or the like. The output format is to display the text stored in the text storage means 2 while enclosing the detected part in parentheses,
There are a method of emphasizing by printing or shading, and a method of displaying the detected portion in KWIC with the context before and after.

文字列検索手段310で行なっている接続助詞「が」の
検出方法では、「したがって」の「が」や「1つが」の
「が」などのように接続助詞「が」以外の箇所も過剰に
検出されるが、接続助詞「が」の検出もれは生じない。
したがって、範囲決定手段4によって決定される文章解
析手段323の解析対象範囲は、接続助詞「が」の出現位
置をもれなく含み、また、通常、文章全体に比べて文章
量は少ない。すなわち、文章解析手段322は、接続助詞
「が」の出現可能性の高い部分にのみ絞って解析するよ
うになる。
In the method for detecting the connecting particle "GA" performed by the character string search means 310, the portions other than the connecting particle "GA", such as "GA" of "Hita" and "GA" of "one", are excessive. Although it is detected, detection omission of the connecting particle "GA" does not occur.
Therefore, the analysis target range of the sentence analyzing means 323 determined by the range determining means 4 includes all occurrence positions of the connecting particle "GA", and the sentence amount is usually smaller than the entire sentence. In other words, the sentence analysis means 322 analyzes only the portion where the connection particle "ga" is likely to appear.

また、上記の実施例は、検出対象の表現項目として、
接続助詞「が」をとりあげた検査装置であるが、受け身
表現を検出対象とした検査装置等、他の表現項目を検出
対象とした検査装置も、第4図に示す構成と同じ構成で
実現できる。
Further, in the above embodiment, as the expression items to be detected,
Although the inspection device uses the connecting particle "GA", an inspection device that detects other expression items, such as an inspection device that detects a passive expression, can be realized with the same configuration as the configuration illustrated in FIG. .

〔発明の効果〕〔The invention's effect〕

以上説明したように本発明によると、処理速度は速い
が検出精度が低く過剰検出の傾向のある検査手段Aと、
検出精度は高いが処理速度が遅い検査手段Bとがある場
合、検査手段Aによる文章全体の検査結果をもとにし
て、検査手段Bの検査対象範囲を制限する文章検査方法
が実現できる。その場合、検査手段Aに検出もれがなけ
れば、最終的な検査結果および検出精度は、文章全文を
対象に検査手段Bを適用した場合と同じである。しか
も、処理速度は、検査手段Aで文章全文を処理した場合
より、やや遅れる程度であり、検査手段Bで文章全文を
処理した場合に比べてかなり速い。すなわち、従来に比
べて、処理速度をあまり低下させることなく、検出精度
の高い文章検査方法が得られる。
As described above, according to the present invention, the inspection means A which has a high processing speed but low detection accuracy and a tendency of excessive detection,
In the case where there is an inspection unit B having a high detection accuracy but a low processing speed, a text inspection method that limits the inspection target range of the inspection unit B based on the inspection result of the entire text by the inspection unit A can be realized. In this case, if the inspection means A has no detection errors, the final inspection result and detection accuracy are the same as when the inspection means B is applied to the entire text. In addition, the processing speed is slightly delayed as compared with the case where the whole sentence is processed by the inspection means A, and is considerably faster than the case where the whole sentence is processed by the inspection means B. That is, a sentence inspection method with high detection accuracy can be obtained without significantly lowering the processing speed as compared with the related art.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明における1表現項目に関する検査手続き
を示すフローチャート、第2図は第1図の検査手続きを
実現する検査装置の構成例を示すブロック図、第3図は
本発明によってm個の表現項目に関する検査を行なう検
査装置の構成例を示すブロック図、第4図は本発明を用
いた接続助詞「が」の検査装置の一実施例の構成を示す
ブロック図である。 1……文章入力手段、2……文章記憶手段、3……検査
手段、4……範囲決定手段、5……結果出力手段、310
……文字列検索手段、320……単語辞書、321……文法辞
書、322……文章解析手段、323……解析結果記憶手段、
324……単語列検索手段。
FIG. 1 is a flowchart showing an inspection procedure for one expression item in the present invention, FIG. 2 is a block diagram showing a configuration example of an inspection apparatus for realizing the inspection procedure in FIG. 1, and FIG. FIG. 4 is a block diagram showing an example of a configuration of an inspection apparatus for inspecting an expression item, and FIG. 4 is a block diagram showing a configuration of an embodiment of an inspection apparatus for a connection particle "GA" using the present invention. 1 ... sentence input means, 2 ... sentence storage means, 3 ... inspection means, 4 ... range determination means, 5 ... result output means, 310
…… Character string search means, 320 …… Word dictionary, 321… Grammar dictionary, 322 …… Sentence analysis means, 323 …… Analysis result storage means,
324 ... Word string search means.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】与えられた文章から不適切な表現や注意を
要する表現等を検出する文章検査方法において、 第1段階として、検出対象の1表現項目について前記与
えられた文章の全文を検査対象範囲とする辞書・文法を
用いない文字列照合による検査処理を行い、 第2段階として、検査対象範囲を前記文字列照合による
検査処理の検出箇所を含む1文あるいは句読点で区切ら
れた範囲に制限して辞書・文法を用いた文章解析による
検査処理を行うことを特徴とする文章検査方法。
In a sentence inspection method for detecting an inappropriate expression or an expression requiring attention from a given sentence, as a first step, the whole sentence of the given sentence is inspected for one expression item to be detected. Inspection processing by character string matching without using a dictionary or grammar as a range is performed. As a second step, the inspection target range is limited to a single sentence or a range delimited by punctuation marks including the detection point of the inspection processing by the character string matching. A sentence inspection method characterized by performing inspection processing by sentence analysis using a dictionary and grammar.
JP1226943A 1989-08-31 1989-08-31 Sentence inspection method Expired - Lifetime JP2894736B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1226943A JP2894736B2 (en) 1989-08-31 1989-08-31 Sentence inspection method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1226943A JP2894736B2 (en) 1989-08-31 1989-08-31 Sentence inspection method

Publications (2)

Publication Number Publication Date
JPH0390958A JPH0390958A (en) 1991-04-16
JP2894736B2 true JP2894736B2 (en) 1999-05-24

Family

ID=16853046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1226943A Expired - Lifetime JP2894736B2 (en) 1989-08-31 1989-08-31 Sentence inspection method

Country Status (1)

Country Link
JP (1) JP2894736B2 (en)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01181152A (en) * 1988-01-14 1989-07-19 Toshiba Corp Document production back-up device
JPH01189760A (en) * 1988-01-25 1989-07-28 Canon Inc Document processor

Also Published As

Publication number Publication date
JPH0390958A (en) 1991-04-16

Similar Documents

Publication Publication Date Title
JP4652737B2 (en) Word boundary probability estimation device and method, probabilistic language model construction device and method, kana-kanji conversion device and method, and unknown word model construction method,
US6523000B1 (en) Translation supporting apparatus and method and computer-readable recording medium, wherein a translation example useful for the translation task is searched out from within a translation example database
EP1178408A2 (en) Segmenter for a natural language processing system
US8224642B2 (en) Automated identification of documents as not belonging to any language
Chen et al. Integrating natural language processing with image document analysis: what we learned from two real-world applications
JPH10326275A (en) Method and device for morpheme analysis and method and device for japanese morpheme analysis
US20030229634A1 (en) System for distinguishing names in asian writing systems
CN111062208A (en) File auditing method, device, equipment and storage medium
JP2002132791A (en) Device and method for extracting place name information, recording medium with extraction program recorded thereon and map information retrieving device
US7343280B2 (en) Processing noisy data and determining word similarity
JP2894736B2 (en) Sentence inspection method
US6731802B1 (en) Lattice and method for identifying and normalizing orthographic variations in Japanese text
Le Thanh et al. Automated discourse segmentation by syntactic information and cue phrases
Olinsky et al. Non-standard word and homograph resolution for asian language text analysis.
JP3300142B2 (en) Natural language processor
Takeuchi et al. Japanese OCR error correction using stochastic morphological analyzer and probabilistic word N-gram model
Kaur et al. Improving the accuracy of tesseract OCR engine for machine printed Hindi documents
KR20080049764A (en) Detecting segmentation errors in an annotated corpus
JP3783053B2 (en) Negative example prediction processing method, processing program and processing device, Japanese notation error detection processing program and processing device using negative example prediction processing, and external relationship detection processing program and processing device using negative example prediction processing
JP3767180B2 (en) Document structure analysis method and apparatus, and storage medium storing document structure analysis program
JP2599973B2 (en) Japanese sentence correction candidate character extraction device
JP3109187B2 (en) Morphological analysis method
JPH0658667B2 (en) Sentence inspection device
JP2902138B2 (en) How to correct misread characters
JP2796140B2 (en) Data editing support device for natural language processing

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080305

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090305

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090305

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100305

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100305

Year of fee payment: 11