JPS63163571A - Sentence inspecting device - Google Patents

Sentence inspecting device

Info

Publication number
JPS63163571A
JPS63163571A JP61310317A JP31031786A JPS63163571A JP S63163571 A JPS63163571 A JP S63163571A JP 61310317 A JP61310317 A JP 61310317A JP 31031786 A JP31031786 A JP 31031786A JP S63163571 A JPS63163571 A JP S63163571A
Authority
JP
Japan
Prior art keywords
word
kanji
speech
text
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61310317A
Other languages
Japanese (ja)
Other versions
JPH0544699B2 (en
Inventor
Shunichi Fukushima
俊一 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61310317A priority Critical patent/JPS63163571A/en
Publication of JPS63163571A publication Critical patent/JPS63163571A/en
Publication of JPH0544699B2 publication Critical patent/JPH0544699B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

PURPOSE:To automatically detect a part to be corrected by extracting a word in which a KANJI (Chinese character) is included in a notation of the extracted words and indicating the extracted word in a display method different from other word. CONSTITUTION:A specific part of speed extracting means 3 extract the word of the specific part of speech from an inputted Japanese sentence. A KANJI word extracting means 4 extracts the word in which the KANJI is included in the notation of the words extracted by the specific part of speech extracting means 3. Further, a word indicating means 5 indicates the word extracted by the KANJI word extracting means according to the display method different from other word. Accordingly, a part for which it seems to be preferable that a KANJI notation is changed to KANA (Japanese syllabary) notation is automatically detected by considering the part of speech of the word. Thereby, the including ratio of the KANJI is reduced, thereby, the efficiency in a correcting operation for easily reading the sentence is attained.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、入力された日本語文章中から校正の対象箇所
を自動的に検出する文章検査装置に関するものである。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a text inspection device that automatically detects points to be proofread from input Japanese text.

(従来の技術) 入力された日本語文章中から校正の対象箇所を自動的に
検出する文章検査装置としては、従来、[文章の異常検
査装置」 (特開昭59−127138号公報)や「文
章の自動異常検査修正装置J (特開昭59−1271
40号公報)などがある。これらは、文章中から誤った
単語や用語を検出するものである。
(Prior Art) Conventional text inspection devices that automatically detect points to be proofread from input Japanese text include the ``Sentence Abnormality Detection Device'' (Japanese Patent Laid-open Publication No. 127138/1983) and the ``Text Abnormality Inspection Device'' Automatic text abnormality inspection and correction device J
Publication No. 40). These methods detect incorrect words and terms in sentences.

すなわち、[文章の異常検査装置J (特開昭59−1
27130号公報)は、単語の正しい並びとみなせない
箇所を検出し、「文章の自動異常検査修正装置」 (特
開昭59−127140号公報)は、誤って使用される
可能性のある文字列を予め記憶しておき、それらを文章
中から検出する。
In other words, [Text Anomaly Inspection Apparatus J
27130 (Japanese Patent Laid-open No. 127140) detects parts of words that cannot be considered as correct, and the ``Automatic Sentence Abnormality Inspection and Correction Device'' (Japanese Unexamined Patent Publication No. 127140/1982) detects character strings that may be used incorrectly. are memorized in advance and detected from the text.

ここで、文章の校正の目的を考えてみると、上記のよう
に文章中から誤った単語や用語を検出して直すことだけ
でなく、文章を読みやすく直すことも必要である。
Now, if we consider the purpose of proofreading a text, it is not only necessary to detect and correct incorrect words and terms in the text as described above, but also to make the text easier to read.

日本語の文章において、文章中の漢字の含有率(文章の
全文字数に対する漢字の文字数の割合)が、文章の読み
やすさに大きく影響していることが知られている。漢字
の使用は一般に4割程度までにとどめるのがよい(安本
美典:「説得の文章技術」、講談社現代新書)。
It is known that the content of kanji in a Japanese text (the ratio of the number of kanji to the total number of characters in the text) has a large effect on the readability of the text. Generally, it is best to limit the use of kanji to around 40% (Yasunori Yasumoto: ``Writing Techniques for Persuasion'', Kodansha Gendai Shinsho).

そこで、使用する漢字の種類を制限することが、[日本
語ワードプロセッサ」く特開昭59−94132号公報
)で行われている。すなわち、この「日本語ワード10
セツサ」では、漢字が複数の水準に層別されており、か
な漢字変換結果として指定された水準の範囲の漢字のみ
が使用されるようになっている。
Therefore, Japanese Patent Application Laid-open No. 59-94132 (Japanese Patent Application Laid-Open No. 59-94132) has introduced a Japanese word processor to limit the types of kanji to be used. In other words, this “10 Japanese words”
In "Setsusa", kanji are stratified into multiple levels, and only kanji within the specified level range are used as the result of kana-kanji conversion.

(発明が解決しようとする問題点) しかし、文章中の漢字の含有率を小さくするために、単
純に使用する漢字の種類を制限すると、表記法が不自然
になり、かえって文章が読みにくくなることがある。そ
の例を次に示す。
(Problem that the invention aims to solve) However, if the types of kanji used are simply restricted in order to reduce the content of kanji in a text, the notation will become unnatural and the text will become difficult to read. Sometimes. An example is shown below.

次の例文(1)は漢字含有率42%(全文字数69、漢
字数29)であり、漢字の量がやや多いため、読みにく
い印象を与える。
The following example sentence (1) has a kanji content rate of 42% (total number of characters: 69, number of kanji characters: 29), and the amount of kanji is rather large, giving the impression that it is difficult to read.

「物体が地面に落ちると言う事実は、成程、誰もが知っ
ている事である。然し、この事実から引力と言う自然の
法則を発見する事は、決して容易ではない。」    
    ・・・(1)この例文(1)から漢字を減らす
ために、例えば、「程」「然」「自」「易jなどの漢字
の使用を制限すると、次の(2+のようになる。
"Everyone knows the fact that objects fall to the ground. However, it is by no means easy to discover the law of nature called gravity from this fact."
(1) In order to reduce the number of kanji from this example sentence (1), for example, if we restrict the use of kanji such as ``mode,''``ran,''``ji,'' and ``easy j,'' we get the following (2+).

「物体が地面に落ちると言う事実は、成はど、誰もが知
っている事である。しかし、この事実から引力と言うし
ぜんの法則を発見する事は、決して容いではない、J 
   ・・・(21漢字の使用を制限することによって
、この文章+21の漢字の含有率は33%(全文字数7
2、漢字数24)に減少した。けれども、「然し」がか
なの「しかしJになったように読みやすくなった箇所も
あるが、「成はど」 「容い」などのように、ひとつの
単語が漢字とかなで混ぜ書きされるようになったり、「
しぜん」のように漢字がかなで書かれたりして、全般に
、かえって文章として読みにくくなっている。
``The fact that objects fall to the ground is something that everyone knows.However, it is by no means easy to discover the natural law of gravity from this fact.
...(By restricting the use of 21 kanji, the content rate of this sentence + 21 kanji is 33% (total number of characters 7)
2, the number of kanji decreased to 24). However, there are some places where it has become easier to read, such as when ``butashi'' has been changed to ``but J,'' but the same word is written in both kanji and kana, such as ``narihado'' and ``oi''. or “
Kanji such as "shizen" are written in kana, making the text generally more difficult to read.

漢字を減らして文章が読みやすくなるようにするだめに
は、単純に使用する漢字の種類を制限するのではなく、
単語の品詞を考慮して、漢字表記をかな表記に直す必要
がある。例えば、形式名詞、補助動詞、代名詞、副詞、
接続詞を、かなで書くようにすると、先にあげた例文(
1)は次のようになる。
In order to make texts easier to read by reducing the number of kanji, we should not simply limit the types of kanji used.
It is necessary to take into account the part of speech of the word and convert the kanji notation to kana notation. For example, formal nouns, auxiliary verbs, pronouns, adverbs,
If you write conjunctions in kana, the example sentence given earlier (
1) becomes as follows.

「物体が地面に落ちるという事実は、なるほど、だれも
が知っていることである。しかし、この事実から引力と
いう自然の法則を発見することは、けっして容易ではな
い、」・・・(3)この文章(3)の漢字の含有率は2
8%(全文字数76、漢字数20)となり、最初の文章
(1)に比べ、柔らかく読みやすい印象を与える。
"Everyone knows that objects fall to the ground. However, it is by no means easy to discover the natural law of gravity from this fact." (3) The content rate of kanji in this sentence (3) is 2
8% (total number of characters: 76, number of kanji: 20), giving an impression of being softer and easier to read than the first sentence (1).

そこで、文章の校正の際、文章中から、上記のような、
品詞を考慮して漢字表記をかな表記に直した方が好まし
いと思われる箇所を検出することが、機械によって自動
的にできるならば、校正の効率化に役立つ。
Therefore, when proofreading the text, from the text, such as the above,
If a machine could automatically detect places where it would be better to change the kanji notation to kana by taking into account the parts of speech, it would help make proofreading more efficient.

本発明の目的は、文章中の漢字の含有率を下げることに
よって文章を読みやすくするために、単純に使用する漢
字を制限するのではなく、単語の品詞を考1・Zシて漢
字表記をかな表記に直した方が好ましいと思われる箇所
を検出する文章検査装置を提供することである。
The purpose of the present invention is to make the text easier to read by reducing the content of kanji in the text. Rather than simply restricting the kanji used, the purpose of the present invention is to consider the parts of speech of words and write them in kanji. To provide a text inspection device that detects a part where it is considered preferable to change it to kana notation.

(問題を解決するための手段) 本発明は、入力された日本語文章中から校正の対象箇所
を自動的に検出する文章検査装置において、前記入力さ
れた日本語文章中から特定の品詞の単語を抽出する特定
品詞抽出手段と、前記特定品詞抽出手段によって抽出さ
れた単語のうち表記に漢字が含まれる単語を抽出する漢
字単語抽出手段と、前記漢字単語抽出手段によって抽出
された単語を池の単語と異なる表示方法で提示する単語
提示手段とを備えたことを特徴とする文章検査装置であ
る。
(Means for Solving the Problem) The present invention provides a text inspection device that automatically detects a part of proofreading from an input Japanese text. a specific part-of-speech extracting means for extracting a specific part-of-speech; a kanji-word extracting means for extracting words whose notation includes kanji from among the words extracted by the specific part-of-speech extracting means; This is a text inspection device characterized by comprising a word presentation means for presenting words in a different display method.

(実施例) 図面を用いて、本発明の構成・作用を説明する。(Example) The structure and operation of the present invention will be explained using the drawings.

第1図は本発明の文章検査装置の一実施例の楕成を示す
ブロック図である。
FIG. 1 is a block diagram showing the structure of an embodiment of the text inspection device of the present invention.

第1図において、文章入力手段1は、日本語文章の漢字
かな混じり文字列を人力する手段であり、キーボードを
備えたかな漢字変換装置、ベンタッチ・キーボード、文
字認識装置などが用いられる。
In FIG. 1, text input means 1 is a means for manually inputting a character string containing kanji and kana in a Japanese text, and includes a kana-kanji conversion device equipped with a keyboard, a Bentouch keyboard, a character recognition device, and the like.

文章記憶手段2は、文章入力手段1によって入力された
日本語文章の漢字かな混じり文字列を記憶する手段であ
り、ICメモリ、磁気ディスク装置、磁気テープ装置な
どが用いられる。
The text storage means 2 is a means for storing a character string including kanji and kana of the Japanese text inputted by the text input means 1, and uses an IC memory, a magnetic disk device, a magnetic tape device, etc.

特定品詞抽出手段3は、文章記憶手段2に記憶された漢
字かな混じり文字列から、かなで表記することが好まし
い特′定の品詞の単語を抽出する手段である。かなで表
記することが好ましい特定の品詞とは、例えば、代名詞
、連体詞、副詞、接続詞、形式名詞、補助動詞、助詞、
助動詞などである。従来、r国語辞書の記憶と日本語文
の自動分割」 (長屋、達弁、山上、連部、「情報処理
」第19巻第6号、197B>に記載されているように
、単語辞書を参照して、漢字仮名混じり文字列を単語に
分割し、各単語の品詞を認定する手法が知られている。
The specific part of speech extraction means 3 is a means for extracting words of a specific part of speech, preferably written in kana, from the character string containing kanji and kana stored in the text storage means 2. Specific parts of speech that are preferably written in kana include pronouns, adjectives, adverbs, conjunctions, formal nouns, auxiliary verbs, particles,
They are auxiliary verbs, etc. Conventionally, the word dictionary has been used as described in ``Memory of a Japanese dictionary and automatic segmentation of Japanese sentences'' (Nagaya, Tatsuben, Yamagami, Renbe, ``Information Processing'' Vol. 19, No. 6, 197B). A known method is to divide a character string containing kanji and kana into words and identify the part of speech of each word.

そこで、この手法により漢字かな混じり文字列が単語に
分割され、各単語の品詞が決定されたところで、代名詞
、連体詞、副詞、接続詞、形式名詞、補助動詞、助詞、
助動詞などを取り出すようにすれば、特定品詞抽出手段
3が実現できる。
Therefore, using this method, a string of characters containing kanji and kana is divided into words, and once the part of speech of each word has been determined, pronouns, adnominals, adverbs, conjunctions, formal nouns, auxiliary verbs, particles,
By extracting auxiliary verbs, etc., the specific part-of-speech extraction means 3 can be realized.

第3図に、特定品詞抽出手段3の構成例のブロック図を
示す。第3図において、入力文字列バッファ310は、
文章記憶手段2から読み込んだ文字列を一時的に格納す
る。単語辞書320には単語の表記、品詞、読みなと゛
が収納されている。単語検索部300は入力文字列バッ
ファ310内の文字列と単語辞書320を照合し見つか
った単語を出力する。単語候補バッファ311は単語検
索部300の出力した単語を一時的に記憶する。接続テ
ーブル321は、2つの品詞の接続の可否を記述したテ
ーブルである。文法解析部301は接続テーブル321
を参照して単語候補バッファ311内の単語の接続をチ
ェックし、文節候補を形成し出力する。文節評価部30
2は文節候補バッファ312内の文節候補のなかから、
最も確からしい文節を決定し出力する。解析結果バッフ
ァ313は文節評価部302の出力した文節の系列を一
時的に格納する。特定品詞テーブル323はかなで表記
することが好ましい品詞として、代名詞、連体詞、副詞
、接続詞、形式名詞、補助動詞、助詞、助動詞の品詞コ
ードを格納する。品詞検索部303は解析結果バッファ
313内の文節を形成する単語の品詞と、特定品詞テー
ブル323内の品詞とを照合し一致した単語を出力する
。出力単語バッファ314は品詞検索部303の出力を
格納する。
FIG. 3 shows a block diagram of a configuration example of the specific part of speech extraction means 3. In FIG. 3, the input string buffer 310 is
The character string read from the text storage means 2 is temporarily stored. The word dictionary 320 stores the notation, part of speech, and pronunciation of words. The word search unit 300 compares the character string in the input character string buffer 310 with the word dictionary 320 and outputs the found words. The word candidate buffer 311 temporarily stores the words output by the word search section 300. The connection table 321 is a table that describes whether or not two parts of speech can be connected. The grammar analysis unit 301 uses the connection table 321
The connection of words in the word candidate buffer 311 is checked with reference to , and clause candidates are formed and output. Clause evaluation section 30
2 is selected from among the phrase candidates in the phrase candidate buffer 312,
Determine and output the most likely phrase. The analysis result buffer 313 temporarily stores a series of clauses output by the clause evaluation unit 302. The specific part-of-speech table 323 stores part-of-speech codes for pronouns, adnominals, adverbs, conjunctions, formal nouns, auxiliary verbs, particles, and auxiliary verbs as parts of speech that are preferably written in kana. The part-of-speech search unit 303 compares the part-of-speech of the word forming the clause in the analysis result buffer 313 with the part-of-speech in the specific part-of-speech table 323, and outputs matching words. The output word buffer 314 stores the output of the part of speech search unit 303.

漢字単語抽出手段4は、特定品詞抽出手段3によって抽
出された単語について、単語の表記に漢字が含まれてい
るか否かを判定し、単語の表記に漢字が含まれているも
ののみを抽出する手段である。単語の表記に漢字が含ま
れているか否かは、単語の表記の各文字コードをチェッ
クすることによって、容易に判定できる(例えば、JI
Sで定められているコード系では、ある値より大きいコ
ードは漢字であると判定できる)。
The kanji word extraction means 4 determines whether the words extracted by the specific part of speech extraction means 3 include kanji in the word notation, and extracts only those words in which the kanji is included in the word notation. It is a means. Whether or not a word's notation includes kanji can be easily determined by checking each character code of the word's notation (for example, JI
In the code system defined by S, codes larger than a certain value can be determined to be Kanji.)

単語提示手段5は、漢字単語抽出手段4によって抽出さ
れた単語を、他の単語と異なる方法で提示する手段であ
る。他の単語と異なる提示方法とは、例えば、CRTデ
ィスプレイ上に文章を表示している場合ならば、漢字単
語抽出手段4によって抽出された単語に対応する文字列
を、反転表示するとか、色を変えて表示するとか、アン
ダーラインを付加して表示するなどの方法が考えられる
The word presentation means 5 is means for presenting the words extracted by the Kanji word extraction means 4 in a different way from other words. For example, when a sentence is displayed on a CRT display, a presentation method different from other words may include displaying the character string corresponding to the word extracted by the kanji word extraction means 4 in reverse video, or changing the color. Possible methods include displaying the text differently or displaying it with an underline added.

次にこの実施例の動作を例を用いて説明する。Next, the operation of this embodiment will be explained using an example.

まず、例文(1)が、文章入力手段lによって入力され
、文章記憶手段2に記憶されているものとする。
First, it is assumed that example sentence (1) is input by the text input means l and stored in the text storage means 2.

続いて、文章記憶手段2に記憶された例文(1)は、特
定品詞抽出手段3によって解析゛され、次のような単語
列に分割され、かつ各単語の品詞が認定される。/が単
語の切れ目を表し、()のなかは品詞を示す。
Subsequently, the example sentence (1) stored in the sentence storage means 2 is analyzed by the specific part of speech extraction means 3, divided into the following word strings, and the part of speech of each word is identified. / indicates a word break, and the part of speech is indicated in parentheses.

[物体(名詞)/が(助詞)/地面(名詞)/に(助詞
)、/落ちる(動詞)/と(助詞)/言う(補助動詞)
/′事実〈名詞)/は(助詞)/、(読点)/成程(副
詞)7/、(読点〉/′誰(代名詞)/も(助詞)/が
(助詞)/知つく動詞)7/て(助詞)/いる(補助動
詞〉/′事(形式名詞)/で(助動詞)7/ある(補助
動詞)/。(句点)/然しく接続詞〉/、(読点)/こ
の(連体詞)/事実(名詞)/がら(助詞)/引力(名
詞)/と(助詞)/言う(補助動詞〉/自然(名詞)/
の(助詞)/法則(名詞)7/を(助詞)/′発見する
(動詞)/事く形式名詞)/は(助詞)/、(読点)/
決して(副詞)/′容易で(形容動詞)/′はく助詞〉
/ない(助動詞)/。(句点)」 特定品詞抽出手段3は、このなかがら、代名詞、連体詞
、副詞、接続詞、形式名詞、補助動詞、助詞、助動詞を
抽出して、漢字単語抽出手段X1に送る。漢字単語抽出
手段4に送られるのは、次の単語である。
[object (noun) / ga (particle) / ground (noun) / to (particle), / fall (verb) / to (particle) / say (auxiliary verb)
/'fact (noun)/ha (particle)/, (comma)/progress (adverb) 7/, (comma)/'who (pronoun)/also (particle)/ga (particle)/verb to know) 7 / te (particle) / iru (auxiliary verb) / 'thing (formal noun) / de (auxiliary verb) 7 / aru (auxiliary verb) /. (punctuate) / deshiku conjunction > /, (comma) / kono (adjunctive) / fact (noun) / gara (particle) / attraction (noun) / to (particle) / say (auxiliary verb) / nature (noun) /
of (particle) / law (noun) 7 / to (particle) / 'discover (verb) / formal noun) / is (particle) /, (comma) /
Never (adverb) / 'easy (adjective) / 'particle)
/Not (auxiliary verb)/. The specific part of speech extraction means 3 extracts pronouns, adjectives, adverbs, conjunctions, formal nouns, auxiliary verbs, particles, and auxiliary verbs, and sends them to the Kanji word extraction means X1. The next word is sent to the Kanji word extraction means 4.

が(助詞〉    に(助詞) と(助詞)    言う(補助動詞) は(助詞)    成程(副詞) 誰(代名詞〉   も(助詞) が(助詞)    て(助詞) いる(補助動詞) 事く形式名詞) で(助動詞)   ある(補助動詞) 然しく接続詞)  この(連体詞) から(助詞)   とく助詞) 言う(補助動詞) の(助詞) を(助詞)    事(形式名詞) はく助詞〉    決して(副詞) は(助詞)    ない(助動詞) 続いて、漢字単語抽出手段4は、これらの単語のうち表
記に漢字が含まれているものを抽出する。その結果、次
のような単語が抽出され、単語提示手段5に送られる。
ga (particle) に (particle) と (particle) say (auxiliary verb) wa (particle) ri (adverb) anyone (pronoun) also (particle) ga (particle) te (particle) いる (auxiliary verb) (noun) de (auxiliary verb) aru (auxiliary verb) deshiku conjunction) this (adjunctive) kara (particle) toku particle) say (auxiliary verb) of (particle) wo (particle) thing (formal noun) haku particle> never ( Adverb) は (particle) No (auxiliary verb) Subsequently, the kanji word extraction means 4 extracts words that include kanji in their notation from among these words. As a result, the following words are extracted and sent to the word presentation means 5.

言う(補助動詞) 成程(副詞) 誰(代名詞〉   事(形式名詞) 然しく接続詞)  言う(補助動詞) 事(形式名詞)  決して(副詞) 単語提示手段5は、漢字単語抽出手段4から送られてき
たこれらの単語を、他の単語と異なる方法で提示する。
to say (auxiliary verb) to change (adverb) who (pronoun) thing (formal noun) but conjunction) say (auxiliary verb) thing (formal noun) never (adverb) The word presentation means 5 receives the information sent from the kanji word extraction means 4. Present these words that have been taught to you in a way that is different from other words.

例えば、CRTディスプレイ上でアンダーラインを付加
して表示した例を第2図に示す。
For example, FIG. 2 shows an example of display with an underline added on a CRT display.

本発明の文章検査装置は、上記の実施例に述べたような
、単独の装置として実施するだけでなく、ワードプロセ
ッサなどに組み込まれた形態で実施することも可能であ
る。その場き、文章入力手段1、文章記憶手段2などは
、ワードプロセッサと共用できる。
The text inspection device of the present invention can be implemented not only as a stand-alone device as described in the above embodiments, but also in a form incorporated into a word processor or the like. At that time, the text input means 1, text storage means 2, etc. can be shared with a word processor.

前に述べた「文章の異常検査装置」 (特開昭59−1
27138号公報)、「文章の自動異常検査修正装置」
く特開昭59−127140号公報)、「日本語ワード
プロセッサJ(特開昭59−94132号公報)などと
組み合わせることによって、文章の検査機能を高めるこ
とができる。
The previously mentioned ``Text Abnormality Inspection Device'' (Unexamined Japanese Patent Publication No. 59-1
Publication No. 27138), “Automatic abnormality inspection and correction device for text”
By combining it with a Japanese word processor J (Japanese Patent Application Laid-Open No. 59-127140) or Japanese Word Processor J (Japanese Patent Application Laid-open No. 59-94132), the text inspection function can be enhanced.

(発明の効果) 以上説明したように、本発明によれば、漢字表記をかな
表記に直した方が好ましいと思われる箇所が、単語の品
詞を考慮して自動的に検出される。従って、漢字の含有
率を小さくすることによって、文章を読みやすくしよう
とする校正作業の効率化が図られる。
(Effects of the Invention) As described above, according to the present invention, locations where it would be preferable to change the kanji notation to the kana notation are automatically detected in consideration of the part of speech of the word. Therefore, by reducing the content of kanji characters, the efficiency of proofreading work for making texts easier to read can be improved.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の実施例の構成を示すブロック図、第2
図は単語提示手段5による表示の例を示す図、第3図は
特定品詞抽出手段3の構成例を示すブロック図である。 図において、 1・・・文章入力手段 2・・・文章記憶手段 3・・・特定品詞抽出手段3 4・・・漢字単語抽出手段4 5・・・単語提示手段ら である。                 7.−1
、・A7:τ゛0、 代理人 弁理士 内厚 晋、・− H−
FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention, and FIG.
The figure shows an example of the display by the word presentation means 5, and FIG. 3 is a block diagram showing an example of the configuration of the specific part of speech extraction means 3. In the figure, 1... text input means 2... text storage means 3... specific part of speech extraction means 3 4... kanji word extraction means 4 5... word presentation means. 7. -1
,・A7:τ゛0, Agent Patent Attorney Susumu Uchiatsu,・−H−

Claims (1)

【特許請求の範囲】[Claims] 入力された日本語文章中から校正の対象箇所を自動的に
検出する文章検査装置において、前記入力された日本語
文章中から特定の品詞の単語を抽出する特定品詞抽出手
段と、前記特定品詞抽出手段によって抽出された単語の
うち表記に漢字が含まれる単語を抽出する漢字単語抽出
手段と、前記漢字単語抽出手段によって抽出された単語
を他の単語と異なる表示方法で提示する単語提示手段と
を備えたことを特徴とする文章検査装置。
A text inspection device that automatically detects a portion to be proofread from an input Japanese sentence, comprising: a specific part of speech extraction means for extracting a word of a specific part of speech from the input Japanese text; and a specific part of speech extraction means. Kanji word extraction means for extracting words whose notation includes Kanji characters from among the words extracted by the means; and word presentation means for presenting the words extracted by the Kanji word extraction means in a different display method from other words. A text inspection device characterized by:
JP61310317A 1986-12-25 1986-12-25 Sentence inspecting device Granted JPS63163571A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61310317A JPS63163571A (en) 1986-12-25 1986-12-25 Sentence inspecting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61310317A JPS63163571A (en) 1986-12-25 1986-12-25 Sentence inspecting device

Publications (2)

Publication Number Publication Date
JPS63163571A true JPS63163571A (en) 1988-07-07
JPH0544699B2 JPH0544699B2 (en) 1993-07-07

Family

ID=18003771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61310317A Granted JPS63163571A (en) 1986-12-25 1986-12-25 Sentence inspecting device

Country Status (1)

Country Link
JP (1) JPS63163571A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03135661A (en) * 1989-10-20 1991-06-10 Canon Inc Character processor
JPH03135662A (en) * 1989-10-20 1991-06-10 Canon Inc Character processor

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03135661A (en) * 1989-10-20 1991-06-10 Canon Inc Character processor
JPH03135662A (en) * 1989-10-20 1991-06-10 Canon Inc Character processor

Also Published As

Publication number Publication date
JPH0544699B2 (en) 1993-07-07

Similar Documents

Publication Publication Date Title
US5708822A (en) Methods and apparatus for thematic parsing of discourse
JPH0736896A (en) Method and equipment for summarizing document
Tesfaye A rule-based Afan Oromo Grammar Checker
JP5231698B2 (en) How to predict how to read Japanese ideograms
Megyesi Improving Brill’s POS tagger for an agglutinative language
JPS63163571A (en) Sentence inspecting device
Kumolalo et al. Development of a syllabicator for Yorùbá language
KR102182248B1 (en) System and method for checking grammar and computer program for the same
Salameh et al. Reversing morphological tokenization in English-to-Arabic SMT
Lazareva et al. Technology for mastering russian vocabulary by chinese students in the field of international trade
JPS63163572A (en) Sentence inspecting and correcting device
Turcato et al. Pre-processing closed captions for machine translation
JPH04167049A (en) Document processor
JP2915225B2 (en) Document creation device
JPS6037510B2 (en) Romaji-kanji conversion method
JPH11184854A (en) Electronic dictionary
JPS5832418B2 (en) Kanji-mixed sentence input device
Mittmann A method for finding and assessing differences in lexical clusters and cluster frequencies between spoken British and American English
JP3327587B2 (en) Document creation support device
JPS61282966A (en) Kana/kanji conversion system
JPH01185766A (en) Kana/kanji conversion device
Ruplin et al. On Generating a German Lexicon
JPH033064A (en) Character processor
JPS63115264A (en) Document processor
JPS6132167A (en) Kana-kanji conversion processor