JPH07200592A - Text processor - Google Patents

Text processor

Info

Publication number
JPH07200592A
JPH07200592A JP5353381A JP35338193A JPH07200592A JP H07200592 A JPH07200592 A JP H07200592A JP 5353381 A JP5353381 A JP 5353381A JP 35338193 A JP35338193 A JP 35338193A JP H07200592 A JPH07200592 A JP H07200592A
Authority
JP
Japan
Prior art keywords
expression
word
recommended word
recommended
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5353381A
Other languages
Japanese (ja)
Inventor
Yukifumi Takeda
幸史 竹田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP5353381A priority Critical patent/JPH07200592A/en
Publication of JPH07200592A publication Critical patent/JPH07200592A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To provide a text processor capable of presuming the function of a word in a sentence and correcting the word to a correct notation for the word for which certain expression is recommended. CONSTITUTION:A HIRAGANA (the cursive form of Japanese syllabary) writing recommended word retrieval, part 2 uses a HIRAGANA writing recommended word dictionary 3 and retrieves a HIRAGANA writing recommended word from the morpheme information of the sentence stored in a morepheme information storage part 1. Then, an erroneous use detection part 4 detects the erroneous use of the notation by using an erroneous use detection rule 5, syntax information inside a syntax information storage device 7 and the information of mandatory cases by a mandatory case retrieval part 8, etc., for the HIRAGANA writing recommended word retrieved in the HIRAGANA writing recommended word retrieval part 2. In this case, the mandatory case retrieval part 8 uses the syntax information inside the syntax information storage part 7, a mandatory case dictionary 10 and a semantic kind dictionary 9 and investigates the presence/absence of the mandatory case. When the error of the notation is detected in the erroneous use detection part 4, that effect is outputted to an output part 6 and rewrite is performed in a character kind rewrite part 11 corresponding to the instruction of the rewrite from an input part 12 by a user.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文章の作成、推敲を行
なう際、ある表現形式が推奨される語等を検出し、正し
い表記へ変換することのできる文章処理装置に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a sentence processing apparatus capable of detecting a word or the like which is recommended for a certain expression format and converting it into a correct notation when creating and reviewing a sentence.

【0002】[0002]

【従来の技術】日本語には、文章にするときにある表現
形式が推奨される場合がある。例えば、ひらがなで書い
た方が望ましいとされるひらがな書き推奨語がある。具
体例としては、「しかし」や「もし」などの接続詞は、
漢字で「併し」、「若し」と書くよりもひらがなで書い
た方が分かりやすい。そのため、ひらがな書きが推奨さ
れる。しかし、ひらがな書き推奨語にも、「したがっ
て」のように、接続詞として働くときだけ、ひらがな書
きが推奨されているものがある。当然、動詞として働く
ときには接続詞と区別するために「従って」と漢字で書
かれた方が分かりやすい。
2. Description of the Related Art In Japanese, there are cases where a certain expression format is recommended when writing sentences. For example, there are recommended words for writing in hiragana that are said to be preferable to write in hiragana. As a specific example, conjunctions such as "but" and "if" are
Writing in hiragana is easier to understand than writing “side by side” or “young” in kanji. Therefore, Hiragana writing is recommended. However, some hiragana writing recommended words, such as "hence," recommend hiragana writing only when acting as a conjunction. Of course, when working as a verb, it is easier to understand in "kanji" in Kanji to distinguish it from conjunctions.

【0003】従来、このような字種の変換に関する技術
としては、例えば特開平1−207868号公報に記載
されているように、常用漢字でない漢字をひらがなに修
正するものや、特開平5−35729号公報に記載され
ているように、漢字表記またはカタカナ表記が望ましい
かな書きの語を検出し、自動的に修正して表示するもの
などがある。
[0003] Conventionally, as a technique related to such character type conversion, for example, as described in Japanese Patent Laid-Open No. 1-207868, a Kanji that is not a commonly used Kanji is corrected to Hiragana, or Japanese Patent Laid-Open No. 5-35729. As described in Japanese Patent Publication, there is a device that detects a kana writing word in which kanji or katakana notation is desirable and automatically corrects and displays it.

【0004】しかし、上述の従来の技術においては、い
ずれも修正しようとする語の文中での働きを考慮してい
ないので、上述のひらがな書き推奨語のような、望まし
い表記が文中の役割に応じて変化する語については、望
ましい表記に必ずしも修正できるとは限らないという欠
点があった。
However, none of the above-mentioned conventional techniques considers the action of the word to be corrected in the sentence, so that a desirable notation such as the above-mentioned recommended word for hiragana writing depends on the role in the sentence. However, there is a drawback in that words that change with time cannot always be corrected to the desired notation.

【0005】[0005]

【発明が解決しようとする課題】本発明は、上述した事
情に鑑みてなされたもので、ある表現が推奨される語に
ついて、語の文章中での働きを推測し、語を正しい表記
へ修正することのできる文章処理装置を提供することを
目的とするものである。
SUMMARY OF THE INVENTION The present invention has been made in view of the above-mentioned circumstances. For a word for which a certain expression is recommended, the action in the text of the word is guessed and the word is corrected to the correct notation. It is an object of the present invention to provide a text processing device that can be used.

【0006】[0006]

【課題を解決するための手段】本発明は、文章の形態素
に関する情報が入力され、文章中の第1の表現が推奨さ
れる第1表現推奨語について、他の表現形式で記述され
た部分を検出する文章処理装置において、第1表現推奨
語の第1の表現の表記と他の表現形式の表記が記載され
た第1表現推奨語辞書と、該第1表現推奨語辞書を用い
て入力された形態素に関する情報から第1表現推奨語を
検索する第1表現推奨語検索手段と、第1表現推奨語の
位置や前後の語の品詞から該第1表現推奨語がどのよう
な表現形式で記述されるべきかという知識が記述された
誤用検出ルールを保持する誤用検出ルール保持手段と、
前記形態素に関する情報と前記誤用検出ルールを用いて
第1表現推奨語の誤用を検出する誤用検出手段を有する
ことを特徴とするものである。
According to the present invention, information about a morpheme of a sentence is input, and the first expression recommended word in which the first expression in the sentence is recommended is replaced with a part described in another expression format. In a sentence processing device for detection, a first expression recommended word dictionary in which a description of a first expression of a first expression recommended word and a description of another expression format are described, and the first expression recommended word dictionary is used for input. First expression recommended word searching means for searching the first expression recommended word from the information on the morpheme, and the expression form of the first expression recommended word from the position of the first expression recommended word and the part of speech of words before and after Misuse detection rule holding means for holding the misuse detection rule in which knowledge whether it should be
It is characterized by comprising misuse detecting means for detecting misuse of the first expression recommended word using the information on the morpheme and the misuse detection rule.

【0007】さらに文章の構文に関する情報が入力さ
れ、前記誤用検出ルールは、第1表現推奨語の位置や前
後の語の品詞の他に、第1表現推奨語が用言として働く
可能性の有無から、該第1表現推奨語がどのような表現
形式で記述されるべきかという知識が記述されており、
前記誤用検出手段は、入力される文章の形態素に関する
情報および構文に関する情報と前記誤用検出ルールを用
いて第1表現推奨語の誤用を検出するように構成するこ
ともできる。
[0007] Further, information about the syntax of the sentence is input, and the misuse detection rule determines whether the first expression recommended word may act as a word, in addition to the position of the first expression recommended word and the part of speech of words before and after. Describes the knowledge as to which expression format the first expression recommended word should be described,
The misuse detection means may be configured to detect misuse of the first recommended expression word by using information about a morpheme and syntax of an input sentence and the misuse detection rule.

【0008】さらに、第1表現推奨語等が用言として用
いられる場合に必要とされる格が記載された必須格辞書
と、単語の属する意味種別を記述した意味種別辞書と、
前記第1表現推奨語検索手段により検索された第1表現
推奨語が動詞として働く可能性がある場合に、入力され
る文章の構文に関する情報と前記必須格辞書と前記意味
種別辞書を用いて文章中の用言の必須格に相当する語句
の存在を調べる必須格検索手段を備え、前記誤用検出ル
ールは、第1表現推奨語の位置や前後の語の品詞、第1
表現推奨語が用言として働く可能性の有無の他に、第1
表現推奨語が用言として働く場合の必須格の有無から、
該第1表現推奨語がどのような表現形式で記述されるべ
きかという知識が記述されており、前記誤用検出手段
は、入力される文章の形態素に関する情報と構文に関す
る情報と前記必須格検索手段による検索結果と誤用検出
ルールを用いて第1表現推奨語の誤用を検出するように
構成することもできる。
Further, an essential case dictionary in which a case required when the first expression recommended word or the like is used as a noun is described, and a meaning type dictionary in which a meaning type to which the word belongs is described.
When the first expression recommended word searched by the first expression recommended word searching means may act as a verb, the sentence using the information about the syntax of the inputted sentence, the essential case dictionary, and the meaning type dictionary An essential case search means for checking the existence of a word or phrase corresponding to the essential case of the idiom inside, wherein the misuse detection rule includes the position of the first expression recommended word, the part of speech of words before and after, and the first word.
In addition to the possibility that the recommended word of expression may act as a idiom,
From the presence or absence of the indispensable case when the recommended word for expression works as a word,
The knowledge as to which expression format the first expression recommended word should be described in is described, and the misuse detection means includes information about the morpheme of the input sentence, information about the syntax, and the essential case search means. It is also possible to detect misuse of the first expression recommended word by using the search result and the misuse detection rule.

【0009】[0009]

【作用】本発明によれば、第1表現推奨語検索手段によ
り、入力される文章の形態素に関する情報をもとに、第
1表現推奨語辞書を用いて第1表現推奨語を検索し、誤
用検出手段により、第1表現推奨語の表記が間違ってい
ないか調べる。このようにして誤用の箇所が検出された
場合、例えば、その旨をユーザに伝え、ユーザから書き
換えの指示に従って表現形式の変換を行なうことができ
る。
According to the present invention, the first expression recommended word search means searches the first expression recommended word using the first expression recommended word dictionary on the basis of the information about the morpheme of the input sentence and misuses it. The detecting means checks whether or not the notation of the first expression recommended word is incorrect. When a misused portion is detected in this way, it is possible to inform the user of that fact and convert the expression format according to the rewriting instruction from the user.

【0010】誤用検出手段において、表記が間違ってい
るか否かを調べる情報として、入力される文章の形態素
に関する情報、誤用検出ルールを用いる。それに加え
て、構文に関する情報、あるいは、文章の構文に関する
情報と、必須格辞書および意味種別辞書を用いて必須格
検索手段で検索された結果等の情報を用いることもでき
る。誤用検出ルールとしては、第1表現推奨語がどのよ
うな表現形式で記述されるべきかという知識が記述され
ており、その判断に用いる情報として第1表現推奨語の
位置や前後の語の品詞、加えて、第1表現推奨語が用言
として働く可能性の有無、第1表現推奨語が用言として
働く場合の必須格の有無等の情報が記述されている。
In the misuse detecting means, the information about the morpheme of the input sentence and the misuse detection rule are used as the information for checking whether or not the notation is incorrect. In addition to this, it is also possible to use information about the syntax, or information about the syntax of the sentence, and information such as the result of the search performed by the essential case search means using the essential case dictionary and the meaning type dictionary. As the misuse detection rule, knowledge about what expression format the first expression recommended word should be described is described, and as the information used for the determination, the position of the first expression recommended word and the part of speech of words before and after it. In addition, information about whether or not the first expression recommended word may work as a noun and whether or not the first expression recommended word has an indispensable case as a noun is described.

【0011】第1の表現としては、例えば、ひらがな書
きとすることができ、ひらがな表記と漢字表記の間の誤
用の検出を行なうように構成することができる。
The first expression can be written in hiragana, for example, and can be configured to detect misuse between hiragana and kanji notation.

【0012】[0012]

【実施例】図1は、本発明の文章処理装置の一実施例を
示すブロック図である。図中、1は形態素情報記憶部、
2はひらがな書き推奨語検索部、3はひらがな書き推奨
語辞書、4は誤用検出部、5は誤用検出ルール、6は出
力部、7は構文情報記憶部、8は必須格検索部、9は意
味種別辞書、10は必須格辞書、11は字種書き換え
部、12は入力部である。この実施例では、一例とし
て、ひらがな表記と漢字表記の間の誤用およびその書き
換えについて説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 is a block diagram showing an embodiment of a text processing apparatus of the present invention. In the figure, 1 is a morpheme information storage unit,
2 is a recommended hiragana writing word search unit, 3 is a recommended hiragana writing word dictionary, 4 is an misuse detection unit, 5 is an misuse detection rule, 6 is an output unit, 7 is a syntax information storage unit, 8 is an essential case search unit, and 9 is A semantic type dictionary, 10 is an essential case dictionary, 11 is a character type rewriting unit, and 12 is an input unit. In this embodiment, as an example, misuse between the Hiragana notation and the Kanji notation and rewriting thereof will be described.

【0013】形態素情報記憶部1および構文情報記憶部
7には、処理対象となる文章が、それぞれ、形態素解析
がなされた状態、および、構文解析がなされた状態で格
納されている。ひらがな書き推奨語検索部2は、形態素
情報記憶部1に格納されている処理対象の文章の形態素
情報から、ひらがな書き推奨語辞書3を用いて、ひらが
な書き推奨語を検索する。ひらがな書き推奨語辞書3
は、ひらがな書き推奨語について、ひらがな表記と、漢
字表記を対にして記憶している。誤用検出部4は、ひら
がな書き推奨語検索部2により検索されたひらがな書き
推奨語について、誤用検出ルール5、構文情報記憶部
7、必須格検索部8を用いて、ひらがな書き推奨語の表
記が間違っていないか調べる。誤用検出ルール5は、ひ
らがな書き推奨語がひらがな表記されるべきか、漢字表
記されるべきかという知識が記述されており、その判断
のためのルールとして、ひらがな書き推奨語の文章中の
位置や前後の語の品詞、ひらがな書き推奨語が用言とし
て働く可能性の有無、ひらがな書き推奨語が用言として
働く場合の必須格の有無等の情報が記述されている。必
須格検索部8は、構文情報記憶部7に格納されている構
文情報、意味種別辞書9、必須格辞書10を用い、ひら
がな書き推奨語検索部2で検索されたひらがな書き推奨
語が用言である場合に、必須格に相当する語句があるか
否かを調べる。意味種別辞書9には、例えば、名詞の単
語について、人を表わすのか、動物を表わすのか、地名
を表わすのかなど、意味的な単語の属するカテゴリであ
る意味種別が記述されている。必須格辞書10には、ひ
らがな書き推奨語等が用言として用いられる場合に必要
とされる格が記載されている。出力部6は、誤用検出部
4におて誤用として検出されたひらがな書き推奨語をユ
ーザに提示する。入力部12は、ユーザからの入力を受
け付け、例えば、誤用として検出されたひらがな書き推
奨語の書き換えの指示入力を字種書き換え部11に通知
する。字種書き換え部11は、誤用検出部4において誤
用として検出され、入力部12から書き換えの指示がな
されると、形態素情報記憶部1および構文情報記憶部7
に記憶されている文章中のひらがな書き推奨語を書き換
える。
The morpheme information storage unit 1 and the syntax information storage unit 7 store the sentences to be processed in a morpheme analyzed state and a syntactic analyzed state, respectively. The hiragana writing recommended word search unit 2 searches the morpheme information of the sentence to be processed stored in the morpheme information storage unit 1 using the hiragana writing recommended word dictionary 3 to search for hiragana writing recommended words. Hiragana writing recommended word dictionary 3
Stores hiragana writing and kanji writing in pairs for recommended hiragana writing words. The misuse detection unit 4 uses the misuse detection rule 5, the syntax information storage unit 7, and the indispensable case search unit 8 to write the recommended hiragana writing word for the hiragana writing recommended word searched by the hiragana writing recommended word search unit 2. Check for mistakes. The misuse detection rule 5 describes the knowledge as to whether or not the recommended hiragana writing word should be written in hiragana or kanji. As a rule for the judgment, the position of the recommended hiragana writing word in the sentence or Information such as the part of speech of the preceding and following words, the possibility that the recommended hiragana writing word works as a noun, and the presence or absence of the essential case when the recommended hiragana writing word works as a noun are described. The essential case search unit 8 uses the syntactic information stored in the syntactic information storage unit 7, the meaning type dictionary 9, and the essential case dictionary 10 to identify the recommended hiragana writing word searched by the hiragana writing recommended word search unit 2. If it is, it is checked whether there is a word corresponding to the essential case. In the semantic type dictionary 9, for example, a semantic type that is a category to which a semantic word belongs, such as whether a noun word represents a person, an animal, or a place name, is described. The indispensable case dictionary 10 describes the case that is required when a recommended word such as hiragana writing is used as a noun. The output unit 6 presents to the user the recommended hiragana writing words detected by the misuse detection unit 4 as misuse. The input unit 12 receives an input from the user, and notifies the character type rewriting unit 11 of, for example, an instruction input of rewriting the recommended hiragana writing word detected as misuse. The character type rewriting unit 11 is detected as misuse by the misuse detection unit 4, and when a rewriting instruction is given from the input unit 12, the morpheme information storage unit 1 and the syntax information storage unit 7 are executed.
Rewrite the recommended hiragana words in the sentences stored in.

【0014】上述の構成のうち、誤用検出部4において
ひらがな書き推奨語が用言として働く場合の必須格の検
査を行なわない場合には、必須格検索部8、意味種別辞
書9、必須格辞書10を省略して構成することができ
る。さらに、誤用検出部4でひらがな書き推奨語が用言
として働く可能性についての検査も行なわない場合に
は、構文情報記憶部7も省略して構成することができ
る。これらの一部を省略した構成では、誤用検出ルール
5として記憶させておく情報も、一部省略することがで
きる。
In the above-mentioned structure, when the misuse detection unit 4 does not check the essential case when the recommended hiragana writing word works as a noun, the essential case search unit 8, the meaning type dictionary 9, and the essential case dictionary are used. It can be configured by omitting 10. Further, when the misuse detection unit 4 does not check the possibility that the recommended hiragana writing word works as a noun, the syntax information storage unit 7 can be omitted. In a configuration in which some of these are omitted, some of the information stored as the misuse detection rule 5 can also be omitted.

【0015】また、形態素情報記憶部1については、文
章記憶部と、文章に対して形態素解析を行なう形態素解
析部により構成することができる。同様に、構文情報記
憶部7についても、文章記憶部に格納されている文章に
対して構文解析を行なう構文解析部により構成すること
ができる。さらに、ネットワークや回線などを通じて、
他のコンピュータやシステムから入力されるように構成
されてもよい。また、文書入力編集システム等、上位の
システムから文章の形態素情報や構文情報を受け取り、
誤用検出部4の出力を上位のシステムに渡すサブシステ
ムとして構成されてもよい。この場合、字種書き換え部
11、出力部6、入力部12の機能は、上位のシステム
に組み込まれる場合もある。
The morpheme information storage unit 1 can be composed of a sentence storage unit and a morpheme analysis unit for performing a morpheme analysis on a sentence. Similarly, the syntactic information storage unit 7 can also be configured by a syntactic analysis unit that performs syntactic analysis on the sentence stored in the sentence storage unit. Furthermore, through networks and lines,
It may be configured to be input from another computer or system. Also, it receives morpheme information and syntactic information of a sentence from a higher-level system such as a document input editing system,
It may be configured as a subsystem that passes the output of the misuse detection unit 4 to a higher-level system. In this case, the functions of the character type rewriting unit 11, the output unit 6, and the input unit 12 may be incorporated in a higher-level system.

【0016】図2は、本発明の文章処理装置の一実施例
における動作の概要を説明するためのフローチャートで
ある。文章処理装置に表記をチェックする旨の命令が与
えられると、まず、S21において、ひらがな書き推奨
語検索部2は、ひらがな書き推奨語辞書3を用い、形態
素情報記憶部1に格納されている文章の形態素情報から
ひらがな書き推奨語を検索する。
FIG. 2 is a flow chart for explaining the outline of the operation in one embodiment of the text processing apparatus of the present invention. When an instruction to check the notation is given to the sentence processing device, first, in S21, the hiragana writing recommended word search unit 2 uses the hiragana writing recommended word dictionary 3 and the sentences stored in the morpheme information storage unit 1 are stored. Hiragana writing recommended words are searched from the morpheme information of.

【0017】次に、S22において、誤用検出部4は、
ひらがな書き推奨語検索部2で検索されたひらがな書き
推奨語について、誤用検出ルール5、構文情報記憶装置
7内の構文情報、必須格検索部8による必須格の情報等
を用いて、表記が間違っていないか調べる。ここで、必
須格検索部8は、ひらがな書き推奨語検索部2で検索さ
れたひらがな書き推奨語が用言になりうるかを構文情報
記憶部7に格納されている構文情報をもとに調べる。用
言になりうる場合、その用言が必要とする格を必須格辞
書10から調べ、構文情報記憶部7に格納されている構
文情報から、ひらがな書き推奨語の周囲の語を参照して
必須格が存在するか否かを調べる。必須格が存在する場
合、その必須格が意味的に適切か否かを、意味種別辞書
9を用いて調べる。
Next, in S22, the misuse detection unit 4
Regarding the recommended hiragana writing words searched by the hiragana writing recommended word search unit 2, the notation is incorrect using the misuse detection rule 5, the syntax information in the syntax information storage device 7, the essential case information by the essential case search unit 8, and the like. Check for not. Here, the indispensable case search unit 8 checks whether or not the recommended hiragana writing word searched by the hiragana writing recommended word search unit 2 can be a noun, based on the syntax information stored in the syntax information storage unit 7. When it can be used as a dictation, the case required by the verb is searched from the essential case dictionary 10, and it is necessary to refer to the words around the recommended hiragana writing word from the syntax information stored in the syntax information storage unit 7. Check whether there is a case. If there is an essential case, it is checked using the meaning type dictionary 9 whether the essential case is semantically appropriate.

【0018】S22においてひらがな書き推奨語の表記
に誤りが検出されると、S23において、その旨を出力
部6に出力し、ユーザに知らせる。そして、入力部12
から書き換えの指示が入力されると、S24において、
字種書き換え部11は、ひらがな書き推奨語を正しい語
に書き換える。そして、次のひらがな書き推奨語につい
ての検査を行なうべく、S21へ戻る。文章が終了した
時点で検査および書き換えの処理は終了する。
When an error is detected in the notation of the recommended hiragana writing word in S22, the fact is output to the output unit 6 to notify the user in S23. Then, the input unit 12
When a rewriting instruction is input from, in S24,
The character type rewriting unit 11 rewrites the recommended hiragana writing words into correct words. Then, the process returns to S21 in order to check the next recommended hiragana writing word. The process of inspection and rewriting ends when the sentence is completed.

【0019】本発明の文章処理装置の動作を具体例をも
とに説明する。まず、「従って、この答えは真であ
る。」という第1の例文が入力された場合について、図
3ないし図7を用いて説明する。ここでは、この「従っ
て」という単語がひらがな表記に書き換える場合につい
て説明する。また、この文例については、構文情報記憶
部7、必須格検索部8、意味種別辞書9、必須格辞書1
0を用いない構成の場合について説明する。
The operation of the text processing apparatus of the present invention will be described based on a specific example. First, a case in which the first example sentence "Thus, this answer is true." Is input will be described with reference to FIGS. Here, a case will be described in which the word “follow” is rewritten in hiragana notation. Also, for this example sentence, the syntax information storage unit 7, the essential case search unit 8, the meaning type dictionary 9, the essential case dictionary 1
The case where the configuration does not use 0 will be described.

【0020】図3は、第1の例文の形態素解析結果の説
明図である。第1の例文は、図3に示すような形態素情
報として、形態素情報記憶部1に格納される。また、こ
の形態素情報ははじめから図3のように与えられている
としても構わないし、解析対象である第1の例文を形態
素解析して入力されてもかまわない。格納される形態素
情報としては、文章中で用いられている表現そのものを
示す表層と、その品詞、語幹、用言の場合にはその活用
形等である。そのほかの情報を格納しておくこともでき
る。図3では、備考欄を設けている。第1の例文におい
て、「従って」という単語は、接続詞となるか、あるい
は、動詞+助詞となるか、どちらの可能性も秘めてい
る。そのため、図3において、単語「従って」の形態素
情報として、接続詞の場合と動詞+助詞の場合の両方の
情報が格納されている。
FIG. 3 is an explanatory diagram of the morphological analysis result of the first example sentence. The first example sentence is stored in the morpheme information storage unit 1 as morpheme information as shown in FIG. Further, this morpheme information may be provided from the beginning as shown in FIG. 3, or the first example sentence to be analyzed may be morpheme-analyzed and input. The stored morpheme information includes a surface layer indicating the expression itself used in the sentence, its part of speech, a stem, and its inflection form in the case of a verb. Other information can also be stored. In FIG. 3, a remarks column is provided. In the first example sentence, the word “according to” has the possibility of either being a conjunction or a verb + particle. Therefore, in FIG. 3, as the morpheme information of the word “according to”, information on both a conjunction and a verb + particle is stored.

【0021】図4は、ひらがな書き推奨語辞書3の一例
の説明図である。ひらがな書き推奨語辞書3には、図4
に示すように、ひらがな書き推奨語のひらがな表記と漢
字表記を対にした情報が格納されている。ひらがな書き
推奨語検索部2は、図3に示した形態素情報のうち、各
表層の情報と、図4に示すようなひらがな書き推奨語辞
書3の中身とのパターンマッチングを行なう。ここで
は、「従って」と「ある」が検索されるので、この2語
をひらがな書き推奨語とし、この2語について次のステ
ップで誤用のチェックを行なう。
FIG. 4 is an explanatory diagram of an example of the hiragana writing recommended word dictionary 3. The hiragana writing recommended word dictionary 3 is shown in FIG.
As shown in, the information in which the hiragana writing and the kanji writing of the recommended hiragana writing word are paired is stored. The hiragana writing recommended word search unit 2 performs pattern matching between the information of each surface layer of the morpheme information shown in FIG. 3 and the contents of the hiragana writing recommended word dictionary 3 shown in FIG. Here, since "according to" and "aru" are searched, these two words are used as recommended words for writing in hiragana, and these two words are checked for misuse in the next step.

【0022】図5は、誤用検出ルール5の一例の説明図
である。誤用検出ルール5は、例えば図5に示すよう
に、見出し語と、その見出し語が誤用になる場合のルー
ルと、書換え語から構成されている。図中のルールの記
載において用いられているPre.品詞、Post.品
詞は、それぞれ見出し語の直前の語の品詞、直後の品詞
を表わしている。同様に、Pre.表層やPre.活用
形も、見出し語の直前の後の表層、活用形を表わしてい
る。また、φは存在しないことを、‘T’は、常に誤用
であることを示している。例えば、見出し語「従って」
のルールは、直前の品詞が存在しないか、句点か読点で
あれば、すなわち、文や語の先頭であれば誤用であるこ
とを示している。また、「乃至」のように文中の働きに
よらず、ひらがな書きにしたほうがよいので、ルールに
は‘T’が入れられている。ここでは、前後の形態素の
情報のみを用いているが、その他の語の情報を用いても
構わない。
FIG. 5 is an explanatory diagram of an example of the misuse detection rule 5. The misuse detection rule 5 includes, for example, as shown in FIG. 5, a headword, a rule when the headword is misused, and a rewrite word. Pre. Used in the description of rules in the figure. Part of speech, Post. The part-of-speech represents the part-of-speech of the word immediately before the headword and the part-of-speech immediately after it. Similarly, Pre. Surface or Pre. The inflectional form also indicates the surface layer immediately before the headword, the inflectional form. Also, φ indicates that it does not exist, and “T” indicates that it is always misused. For example, the entry word “follow”
The rule indicates that if there is no preceding part of speech, or if it is a punctuation mark or a reading point, that is, if it is the beginning of a sentence or word, it is misused. Also, since it is better to write in hiragana regardless of the function in the sentence like “to”, “T” is put in the rule. Here, only the information of the morphemes before and after is used, but the information of other words may be used.

【0023】第1の例文では、「従って」の場合は、文
章の先頭であるため、Pre.品詞=φである。この結
果、ルールの部分が真となって、「従って」は誤用の可
能性があるとされる。これに対し、「ある」は、直前の
形態素「で」の品詞が接続助詞であり、表層が「で」で
あるから、ルールの部分が偽となり、誤用ではないと判
断される。ここで、誤用の可能性ありと判断された場合
には、例えば、表示部6に表示してユーザにその旨を伝
え、書き換えるかどうかの問い合わせを行なうことがで
きる。
In the first example sentence, the case of "according to" is at the beginning of the sentence, so Pre. Part of speech = φ. As a result, the part of the rule becomes true, and "following" may be misused. On the other hand, since "aru" is the part of speech of the immediately preceding morpheme "de" is the connecting particle and the surface layer is "de", the rule part is false and it is judged not to be misused. If it is determined that there is a possibility of misuse, it can be displayed on the display unit 6 to inform the user of that fact, and an inquiry as to whether to rewrite can be made.

【0024】図6は、書き換えの問い合わせの画面の一
例の説明図である。図6では、もとの文章と、誤用の可
能性のある語に関する情報、および、書き換えるかどう
かを問い合わせる情報を表示している。ここで、入力部
12から書き換えの指示が与えられたものについては、
字種書き換え部11は、形態素情報記憶部1の中の表層
の部分を書き換える。書き換える方法については、字種
書き換え部11を用いず、仮名漢字変換部、もしくは漢
字仮名変換部を用いて書き換えても構わない。この場合
には、誤用検出ルール5の書換え語の情報は不要であ
る。第1の例文では誤用の可能性のある語が1つであっ
たが、複数存在するとき、図6に示すように、1つずつ
書き換えの問合せを行なってもよいし、いくつかをまと
めて問合せるように構成することもできる。
FIG. 6 is an explanatory diagram of an example of a rewriting inquiry screen. In FIG. 6, the original sentence, information about a word that may be misused, and information inquiring whether or not to rewrite are displayed. Here, with respect to the instruction given by the input unit 12 for rewriting,
The character type rewriting unit 11 rewrites the surface layer portion in the morpheme information storage unit 1. Regarding the rewriting method, the kana-kanji conversion section or the kanji-kana conversion section may be used without using the character type rewriting section 11. In this case, the rewrite word information of the misuse detection rule 5 is unnecessary. In the first example sentence, there is one word that may be misused, but when there are a plurality of words, as shown in FIG. 6, rewriting queries may be made one by one, or some may be put together. It can also be configured to query.

【0025】図7は、第1の例文の書き換え後の形態素
情報の説明図である。「従って」に対して書き換えの指
示が与えられると、字種書き換え部11は、誤用検出部
4から誤用検出ルール5中の書換え語「したがって」を
受け取り、形態素情報記憶部1の中の表層の部分の「従
って」を「したがって」に書き換える。その結果、形態
素情報記憶部1に格納されている形態素情報は、図3か
ら図7のようになる。
FIG. 7 is an explanatory diagram of the morpheme information after the rewriting of the first example sentence. When the rewriting instruction is given to “follow”, the character type rewriting unit 11 receives the rewriting word “following” in the misuse detection rule 5 from the misuse detection unit 4, and the Rewrite "follow" in the part to "follow". As a result, the morpheme information stored in the morpheme information storage unit 1 becomes as shown in FIGS.

【0026】次に、「花子がおいしいといったレストラ
ンはそこです。」という第2の例文が入力された場合に
ついて、図8ないし図14を用いて説明する。図8は、
第2の例文の形態素情報の一例の説明図、図9は、第2
の例文の構文情報の一例の説明図である。図8に示すよ
うな形態素情報が形態素情報記憶部1に、また、図9に
示すような構文情報が構文情報記憶部7にそれぞれ格納
されている。第1の文例の場合と同様に、文章を形態素
解析部で形態素解析して入力してもかまわない。また、
文章を構文解析部で構文解析して入力したり、形態素情
報記憶部1に記憶されている形態素情報をもとに構文解
析して入力してもよい。図9では、構文情報を樹形図の
ように示しているが、構文情報記憶部7へ格納するデー
タ形式としては、種々のデータ形式を用いることができ
る。形態素情報と構文情報を一体として構成することも
できる。
Next, a case where the second example sentence "Hanako is delicious is there" is input will be described with reference to FIGS. Figure 8
Explanatory drawing of an example of the morpheme information of a 2nd example sentence, FIG.
5 is an explanatory diagram of an example of syntax information of an example sentence of FIG. The morpheme information as shown in FIG. 8 is stored in the morpheme information storage unit 1, and the syntax information as shown in FIG. 9 is stored in the syntax information storage unit 7. As in the case of the first sentence example, the sentence may be morphologically analyzed by the morphological analysis unit and input. Also,
The sentence may be syntactically analyzed and input by the syntactic analysis unit, or may be syntactically analyzed and input based on the morpheme information stored in the morpheme information storage unit 1. In FIG. 9, the syntax information is shown as a tree diagram, but various data formats can be used as the data format to be stored in the syntax information storage unit 7. The morpheme information and the syntactic information can be integrated.

【0027】まず、第1の文例の場合と同様に、ひらが
な書き推奨語検索部2は、第2の文例においてひらがな
書き推奨語があるかどうかを、ひらがな書き推奨語辞書
3と比較することにより調べる。ひらがな書き推奨語辞
書3に図4に示した内容が格納されているとき、第2の
文例中の「といった」がひらがな書き推奨語として抽出
される。
First, as in the case of the first sentence example, the hiragana writing recommended word search unit 2 compares the hiragana writing recommended word in the second sentence example with the hiragana writing recommended word dictionary 3 for comparison. Find out. When the content shown in FIG. 4 is stored in the hiragana writing recommended word dictionary 3, “to” in the second sentence example is extracted as the hiragana writing recommended word.

【0028】次に、誤用検出部4において、ひらがな書
き推奨語が誤用であるかどうかを、誤用検出ルール5を
用いてチェックする。ここでは、形態素情報、構文情
報、ひらがな書き推奨語を用言としてみた場合の必須格
にあたるものがあるかどうかという3つの情報を用いて
調べる。形態素情報については、第1の文例の場合と同
様に、形態素情報記憶部1から直接、前後の語の品詞や
表層などの情報を得る。文中の働きを示す構文情報は、
構文情報記憶部7から得る。必須格に関する情報は必須
格検索部8と意味種別辞書9と必須格辞書10と構文情
報を用いて得る。
Next, the misuse detection unit 4 checks whether or not the hiragana writing recommended word is misused by using the misuse detection rule 5. Here, three types of information, that is, morpheme information, syntactic information, and whether or not there is an indispensable case when using hiragana writing recommended words as synonyms, are used for checking. As for the morpheme information, as in the case of the first sentence example, information such as the part of speech and the surface layer of the preceding and following words is directly obtained from the morpheme information storage unit 1. The syntax information showing the function in the sentence is
Obtained from the syntax information storage unit 7. Information about the essential case is obtained by using the essential case search unit 8, the meaning type dictionary 9, the essential case dictionary 10, and the syntax information.

【0029】まず、必須格検索部8では、検索されたひ
らがな書き推奨語が用言になり得るかを構文情報から調
べる。用言になる可能性がなければ、誤用検出部4は形
態素情報と構文情報のみで誤用の可能性を判断する。ひ
らがな書き推奨語が用言になる場合には、用言になった
場合の必須格を必須格辞書から調べる。
First, the indispensable case search unit 8 checks from the syntax information whether the searched recommended hiragana writing word can be a word. If there is no possibility of becoming a verb, the misuse detection unit 4 determines the possibility of misuse based only on the morpheme information and the syntax information. When the hiragana writing recommended word becomes a noun, the essential case when it becomes a noun is searched from the essential case dictionary.

【0030】図10は、必須格辞書10の一例の説明図
である。必須格辞書10は、見出し語と辞書内容とから
構成され、見出し語と辞書内容はポインタにより関係づ
けられている。辞書内容は、見出し語である用言が必要
とする格およびその格が取る意味種別により構成されて
いる。図中の「HUM」、「ANI」は、それぞれ、人
間、動物の意味種別を示している。例えば、「言う」
は、辞書内容が「HUM+が」であるので、ガ格を必要
とすることがわかるとともに、ガ格として人間を取るこ
とを意味している。同様に、「歌う」、「泳ぐ」は、辞
書内容が「ANI+が」であるので、ガ格を必要とし、
ガ格として動物を取ることを意味している。「呼ぶ」の
辞書内容は「*+を」であるが、これは、ヲ格を必要と
し、それに続く意味種別は何でも良いことを意味してい
る。
FIG. 10 is an explanatory diagram of an example of the essential case dictionary 10. The essential case dictionary 10 is composed of headwords and dictionary contents, and the headwords and dictionary contents are related by a pointer. The dictionary contents are composed of the case required by the idiom, which is a headword, and the meaning type taken by the case. “HUM” and “ANI” in the figure indicate the meaning types of human and animal, respectively. For example, "say"
Indicates that the dictionary is "HUM + ga", and that it requires a Ga case, and means that a person is a Ga case. Similarly, "Sing" and "Swim" require the Ga case because the dictionary contents are "ANI + ga".
It means taking an animal as a moth. The dictionary content of "call" is "***", which means that the case is required and the meaning type that follows it can be anything.

【0031】必須格辞書10の内容と、構文情報記憶部
7に記憶されている構文情報とをパターンマッチングす
ることにより、必須格があるか否かを調べる。必須格が
あり、かつ必須格として取る意味種別が指定されている
場合には、意味種別辞書9を用いて適切な必須格である
かどうかを調べる。
By pattern matching the contents of the essential case dictionary 10 with the syntax information stored in the syntax information storage unit 7, it is checked whether or not there is an essential case. If there is an essential case and a semantic type to be taken as an essential case is specified, the semantic type dictionary 9 is used to check whether or not it is an appropriate essential case.

【0032】図11は、意味種別辞書9の一例の説明図
である。意味種別辞書9は、見出し語と辞書内容から構
成され、それぞれポインタにより関係づけられている。
辞書内容の「HUM」、「ANI」、「CON」、「L
OC」、「ABS」は、それぞれ、人間、動物、具象名
詞、場所・時間、抽象名詞の意味種別を示している。例
えば、「花子」や「太郎」は、辞書内容「HUM,AN
I,CON」と関係づけられており、「花子」、「太
郎」が人間と動物と具象名詞の意味種別を持っているこ
とを示している。同様に、「ポチ」は、動物と具象名詞
の意味種別を、また、「品川」は、場所、時間の意味種
別と抽象名詞の意味種別を持つことを示している。
FIG. 11 is an explanatory diagram of an example of the meaning type dictionary 9. The meaning type dictionary 9 is composed of headwords and dictionary contents, which are associated with each other by pointers.
Dictionary contents "HUM", "ANI", "CON", "L"
“OC” and “ABS” indicate the meaning types of human, animal, concrete noun, place / time, and abstract noun, respectively. For example, "Hanako" and "Taro" are dictionary contents "HUM, AN
It is associated with “I, CON” and indicates that “Hanako” and “Taro” have semantic types of humans, animals, and concrete nouns. Similarly, “Pochi” indicates that the meaning type of animals and concrete nouns, and “Shinagawa” has the meaning type of place and time and the meaning type of abstract nouns.

【0033】必須格辞書10を検索して、必須格の指定
がある場合、意味種別の部分の単語により意味種別辞書
9を検索する。必須格として取るべき意味種別の指定
を、意味種別辞書9の辞書内容が満たせば、必須格が存
在しているとする。また、必須格として取るものに指定
がない場合には必須格が見つかった時点で必須格が存在
しているものとする。
When the essential case dictionary 10 is searched and the essential case is designated, the meaning class dictionary 9 is searched for by the word of the meaning class part. If the dictionary contents of the meaning type dictionary 9 satisfy the designation of the meaning type to be taken as an essential case, it is assumed that the essential case exists. Also, if there is no designation in what is taken as an indispensable case, it is assumed that the indispensable case exists when the indispensable case is found.

【0034】例えば、必須格辞書10および意味種別辞
書9がそれぞれ図10、図11に示した内容であると
き、第2の例文中、ひらがな書き推奨語として抽出され
た「といった」について調べる。「といった」は、用言
になる可能性を有しているので、「といった」の動詞
「いっ」の原形「言う」により、必須格辞書10を検索
する。検索の結果、必須格が「HUM+が」であること
がわかる。ガ格は構文情報中に存在している。すなわ
ち、「花子」+「が」の部分である。そのため、「花
子」の意味種別を意味種別辞書9を用いて調べる。この
とき、「花子」の意味種別は「HUM,ANI,CO
N」であり、意味種別「HUM」を持っているので、
「花子」+「が」は「といった」の必須格となり、「と
いった」の必須格は存在していることになる。
For example, when the essential case dictionary 10 and the meaning type dictionary 9 have the contents shown in FIG. 10 and FIG. 11, respectively, the second example sentence is searched for “toru” extracted as a recommended word in hiragana writing. Since "toru" has a possibility of becoming a verb, the essential case dictionary 10 is searched for by the original form "say" of the verb "it" of "toru". As a result of the search, it is found that the essential case is “HUM + is”. The moth case is present in the syntactic information. That is, it is a part of "Hanako" + "ga". Therefore, the meaning type of “Hanako” is checked using the meaning type dictionary 9. At this time, the meaning type of "Hanako" is "HUM, ANI, CO
Since it is “N” and has the meaning type “HUM”,
"Hanako" + "ga" becomes the essential case of "to", and the essential case of "to" exists.

【0035】図12は、誤用検出ルールの別の例の説明
図である。この例では、ルールとして、形態素に関する
ルールのほかに、構文に関するルール、必須格に関する
ルールを有している。形態素に関するルールは、図5で
説明したルールと同様である。構文に関するルールは、
その語の文中での機能を示している。また、必須格に関
するルールは、必須格の存在の有無を示している。これ
らの3つのルールが全て満たされるとき、誤用の可能性
があるものと判断する。例えば、見出し語「といった」
は、形態素に関するルールは「T」であるので、常に書
き換えた方がよいことを示している。また、構文に関す
るルールは「述語」であるので、「といった」が「述
語」である場合には、書き換えた方がよいことを示して
いる。さらに、必須格に関するルールは「ある」なの
で、必須格が存在する場合には書き換えた方がよいこと
を示している。このような誤用検出ルールを用いて誤用
検出部でチェックを行なう。
FIG. 12 is an explanatory diagram of another example of the misuse detection rule. In this example, in addition to morpheme rules, syntax rules and essential case rules are provided as rules. The rules regarding morphemes are the same as the rules described in FIG. The syntax rules are
It shows the function of the word in the sentence. In addition, the rule regarding the essential case indicates whether or not the essential case exists. If all three of these rules are met, then there is a possibility of misuse. For example, the entry word “toru”
Indicates that the rule regarding the morpheme is “T”, so it is always better to rewrite. Further, since the rule regarding the syntax is “predicate”, it means that it is better to rewrite when “to” is “predicate”. Furthermore, since the rule regarding the indispensable case is “yes”, it is indicated that it is better to rewrite it when the indispensable case exists. The misuse detection unit checks using such misuse detection rules.

【0036】第2の文例において、ひらがな書き推奨語
として抽出された「といった」は、形態素に関するルー
ルは「T」であり、図9に示した構文情報から述語であ
ることがわかる。さらに、必須格検索部8による必須格
辞書10および意味種別辞書9の検索から、上述のよう
に必須格が存在することがわかる。このように、3つの
ルールを満足する。このことは、「といった」は誤用の
可能性があるので、「と言った」に書き直した方が良い
ことを示している。
In the second sentence example, "toru" extracted as the recommended hiragana writing word has a morpheme rule "T", and it can be seen from the syntax information shown in FIG. 9 that it is a predicate. Further, the search of the essential case dictionary 10 and the meaning type dictionary 9 by the essential case search unit 8 reveals that the essential case exists as described above. Thus, the three rules are satisfied. This indicates that it is better to rewrite "to say" because "to" can be misused.

【0037】この結果、第1の文例の場合と同様に、書
き換えの問い合わせをユーザに行ない、書き換えの指示
が行なわれたなら、形態素情報の表層部分と構文情報を
書き換える。図13は、第2の例文の書き換え後の形態
素情報の説明図、図14は、第2の例文の書き換え後の
構文情報の説明図である。図8に示した形態素情報の
「といった」の表層の欄が「と言った」に書き換えられ
ている。また、図9に示した構文情報の「いう」が「言
う」に書き換えられている。このようにして、第2の例
文「花子がおいしいといったレストランはすぐそこで
す。」の「といった」を「と言った」に書き換え、「花
子がおいしいと言ったレストランはすぐそこです。」と
いう文を得ることができる。
As a result, as in the case of the first sentence example, a rewriting inquiry is made to the user, and if a rewriting instruction is given, the surface layer portion of the morpheme information and the syntax information are rewritten. FIG. 13 is an explanatory diagram of the morpheme information after rewriting the second example sentence, and FIG. 14 is an explanatory diagram of the syntax information after rewriting the second example sentence. The column of the surface layer of “to” of the morpheme information shown in FIG. 8 is rewritten to “say”. In addition, “say” in the syntax information shown in FIG. 9 is rewritten as “say”. In this way, the second example sentence, "The restaurant where Hanako is delicious is right there." Is replaced with "I said", and the sentence "The restaurant where Hanako is delicious is right there." Can be obtained.

【0038】また、同様に、「コンピュータと言った機
械の出現で情報の価値は飛躍的に増大した。」という文
が入力された場合には、この文中の「と言った」を「と
いった」に書き換えることができる。これは、図12に
示した誤用検出ルールにおいて、「と言った」の構文情
報が接続語であり、図10に示した必須格辞書から検索
されるガ格を有しないので、誤用検出ルールが満たされ
るためである。
Similarly, when a sentence "The value of information has dramatically increased due to the advent of machines called computers." Is input, "said" in this sentence is "liked". Can be rewritten as This is because the misuse detection rule shown in FIG. 12 has the syntactic information of “said” as a connective word and does not have a G case retrieved from the essential case dictionary shown in FIG. This is because it is satisfied.

【0039】上述の文例では、書き換えの発生する場合
を示したが、誤用検出ルールの条件を満足しない場合に
は、漢字表記がひらがな書き推奨語であっても書き換え
の提示を行なわない。このように、ひらがな書き推奨語
であっても、形態素や構文、必須格等、文の形式的な構
成および意味的な構成から、ひらがな表記および漢字表
記のうち、適切な表記を選択して、誤用の可能性のある
場合にユーザに提示することができる。
In the above-mentioned sentence example, the case where rewriting occurs is shown. However, if the condition of the misuse detection rule is not satisfied, rewriting is not presented even if the kanji notation is a recommended word in hiragana writing. In this way, even for recommended words in Hiragana writing, select an appropriate notation from Hiragana and Kanji notation based on the formal and semantic composition of sentences such as morphemes, syntaxes, essential cases, etc. It can be presented to the user when there is a possibility of misuse.

【0040】上述の実施例では、ひらがな書き推奨語に
ついて説明したが、これを漢字書き推奨語としても同等
の構成により同等の効果を得ることができる。また、ひ
らがなと漢字間の書き換えに限らず、ひらがなとカタカ
ナの間、カタカナと漢字の間等、種々の字種の間での書
き換えに応用することができる。例えば、カタカナと漢
字の間の書き換えでは、「100米」を「100メート
ル」に書き換えることができる。また、算用数字と漢数
字の間の書き換えとして、「1例」を「一例」に書き換
えることもできる。さらに、これらの種々の字種の間の
書き換え規則をまとめて構成することができる。他の字
種への適用は、図1に示した構成のうち、ひらがな書き
推奨語辞書3、誤用検出ルール5、意味種別辞書9、必
須格辞書10に格納する情報を変更すればよい。
In the above-described embodiment, the hiragana writing recommended word has been described, but the same effect can be obtained even if the hiragana writing recommended word is used as the kanji writing recommended word. Further, the present invention can be applied not only to rewriting between hiragana and kanji, but also to rewriting between various character types such as hiragana and katakana, katakana and kanji, and the like. For example, in rewriting between katakana and kanji, "100 US" can be rewritten to "100 meters". Further, as a rewriting between the arithmetic number and the Chinese number, "1 example" can be rewritten to "one example". Further, rewriting rules between these various character types can be collectively configured. To apply to other character types, the information stored in the hiragana writing recommended word dictionary 3, the misuse detection rule 5, the meaning type dictionary 9, and the essential case dictionary 10 in the configuration shown in FIG. 1 may be changed.

【0041】[0041]

【発明の効果】以上の説明から明らかなように、本発明
によれば、ある表現形式が推奨される語について、その
語の文中の働きに応じて望ましい表現形式を検出し、書
き換えることができるので、文章の作成、校正、推敲に
関してより適切な支援を行なうことができるという効果
がある。
As is apparent from the above description, according to the present invention, it is possible to detect and rewrite a desired expression form for a word for which a certain expression form is recommended according to the function of the word in the sentence. Therefore, there is an effect that more appropriate support can be provided regarding writing, proofreading, and revision of sentences.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明の文章処理装置の一実施例を示すブロ
ック図である。
FIG. 1 is a block diagram showing an embodiment of a text processing device of the present invention.

【図2】 本発明の文章処理装置の一実施例における動
作の概要を説明するためのフローチャートである。
FIG. 2 is a flowchart for explaining an outline of an operation in one embodiment of the text processing device of the present invention.

【図3】 第1の例文の形態素解析結果の説明図であ
る。
FIG. 3 is an explanatory diagram of a morphological analysis result of a first example sentence.

【図4】 ひらがな書き推奨語辞書3の一例の説明図で
ある。
FIG. 4 is an explanatory diagram of an example of a hiragana writing recommended word dictionary 3.

【図5】 誤用検出ルール5の一例の説明図である。FIG. 5 is an explanatory diagram of an example of the misuse detection rule 5.

【図6】 書き換えの問い合わせの画面の一例の説明図
である。
FIG. 6 is an explanatory diagram of an example of a rewriting inquiry screen.

【図7】 第1の例文の書き換え後の形態素情報の説明
図である。
FIG. 7 is an explanatory diagram of morpheme information after rewriting the first example sentence.

【図8】 第2の例文の形態素情報の一例の説明図であ
る。
FIG. 8 is an explanatory diagram of an example of morpheme information of a second example sentence.

【図9】 第2の例文の構文情報の一例の説明図であ
る。
FIG. 9 is an explanatory diagram of an example of syntax information of a second example sentence.

【図10】 必須格辞書10の一例の説明図である。10 is an explanatory diagram of an example of the essential case dictionary 10. FIG.

【図11】 意味種別辞書9の一例の説明図である。FIG. 11 is an explanatory diagram of an example of the meaning type dictionary 9.

【図12】 誤用検出ルールの別の例の説明図である。FIG. 12 is an explanatory diagram of another example of the misuse detection rule.

【図13】 第2の例文の書き換え後の形態素情報の説
明図である。
FIG. 13 is an explanatory diagram of morpheme information after rewriting the second example sentence.

【図14】 第2の例文の書き換え後の構文情報の説明
図である。
FIG. 14 is an explanatory diagram of syntax information after rewriting the second example sentence.

【符号の説明】[Explanation of symbols]

1 形態素情報記憶部、2 ひらがな書き推奨語検索
部、3 ひらがな書き推奨語辞書、4 誤用検出部、5
誤用検出ルール、6 出力部、7 構文情報記憶部、
8 必須格検索部、9 意味種別辞書、10 必須格辞
書、11 字種書き換え部、12 入力部。
1 Morphological information storage unit, 2 Hiragana writing recommended word search unit, 3 Hiragana writing recommended word dictionary, 4 Misuse detection unit, 5
Misuse detection rule, 6 output section, 7 syntax information storage section,
8 essential case search section, 9 meaning type dictionary, 10 essential case dictionary, 11 character type rewriting section, 12 input section.

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 文章の形態素に関する情報が入力され文
章中の第1の表現が推奨される第1表現推奨語について
他の表現形式で記述された部分を検出する文章処理装置
において、第1表現推奨語の第1の表現の表記と他の表
現形式の表記が記載された第1表現推奨語辞書と、該第
1表現推奨語辞書を用いて入力された形態素に関する情
報から第1表現推奨語を検索する第1表現推奨語検索手
段と、第1表現推奨語の位置や前後の語の品詞から該第
1表現推奨語がどのような表現形式で記述されるべきか
という知識が記述された誤用検出ルールを保持する誤用
検出ルール保持手段と、前記形態素に関する情報と前記
誤用検出ルールを用いて第1表現推奨語の誤用を検出す
る誤用検出手段を有することを特徴とする文章処理装
置。
1. A first expression in a sentence processing device that detects a portion described in another expression format for a first expression recommended word in which information about a morpheme of a sentence is input and a first expression in a sentence is recommended. A first expression recommended word dictionary in which the expression of the first expression of the recommended word and the expression of another expression format are described, and the first expression recommended word from the information on the morphemes input using the first expression recommended word dictionary The first expression recommended word searching means for searching for the first expression recommended word and the knowledge of what expression format the first expression recommended word should be described based on the position of the first expression recommended word and the part of speech of words before and after. A sentence processing device comprising: an misuse detection rule holding unit that holds an misuse detection rule; and an misuse detection unit that detects misuse of a first expression recommended word using the information about the morpheme and the misuse detection rule.
【請求項2】 さらに文章の構文に関する情報が入力さ
れ、前記誤用検出ルールは、第1表現推奨語の位置や前
後の語の品詞の他に、第1表現推奨語が用言として働く
可能性の有無から、該第1表現推奨語がどのような表現
形式で記述されるべきかという知識が記述されており、
前記誤用検出手段は、入力される文章の形態素に関する
情報および構文に関する情報と前記誤用検出ルールを用
いて第1表現推奨語の誤用を検出することを特徴とする
請求項1に記載の文章処理装置。
2. The information on the syntax of the sentence is further input, and in the misuse detection rule, in addition to the position of the first expression recommended word and the part of speech of words before and after the first expression recommended word, the first expression recommended word may serve as a noun. Based on the presence / absence of the expression, knowledge of what expression format the first expression recommended word should be described is described,
The sentence processing apparatus according to claim 1, wherein the misuse detection unit detects misuse of the first recommended expression word by using information about a morpheme and syntax of an input sentence and the misuse detection rule. .
【請求項3】 第1表現推奨語等が用言として用いられ
る場合に必要とされる格が記載された必須格辞書と、単
語の属する意味種別を記述した意味種別辞書と、前記第
1表現推奨語検索手段により検索された第1表現推奨語
が動詞として働く可能性がある場合に、入力される文章
の構文に関する情報と前記必須格辞書と前記意味種別辞
書を用いて文章中の用言の必須格に相当する語句の存在
を調べる必須格検索手段を備え、前記誤用検出ルール
は、第1表現推奨語の位置や前後の語の品詞、第1表現
推奨語が用言として働く可能性の有無の他に、第1表現
推奨語が用言として働く場合の必須格の有無から、該第
1表現推奨語がどのような表現形式で記述されるべきか
という知識が記述されており、前記誤用検出手段は、入
力される文章の形態素に関する情報と構文に関する情報
と前記必須格検索手段による検索結果と誤用検出ルール
を用いて第1表現推奨語の誤用を検出することを特徴と
する請求項2に記載の文章処理装置。
3. An essential case dictionary in which a case required when a first expression recommended word or the like is used as a noun is described, a meaning type dictionary describing a meaning type to which a word belongs, and the first expression When there is a possibility that the first expression recommended word searched by the recommended word searching means may act as a verb, the information about the syntax of the input sentence, the essential case dictionary, and the meaning type dictionary Is provided with an essential case search means for checking the existence of a word or phrase corresponding to the essential case, and in the misuse detection rule, the position of the first expression recommended word, the part of speech of words before and after, and the first recommended word may work as a noun. In addition to the presence / absence of the phrase, knowledge of what expression format the first expression recommended word should be described based on whether or not the first expression recommended word is indispensable when acting as a noun. The misuse detection means is a morpheme of the input sentence. 3. The sentence processing device according to claim 2, wherein the misuse of the first expression recommended word is detected by using the information about the information, the information about the syntax, the search result by the essential case search means, and the misuse detection rule.
JP5353381A 1993-12-29 1993-12-29 Text processor Pending JPH07200592A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5353381A JPH07200592A (en) 1993-12-29 1993-12-29 Text processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5353381A JPH07200592A (en) 1993-12-29 1993-12-29 Text processor

Publications (1)

Publication Number Publication Date
JPH07200592A true JPH07200592A (en) 1995-08-04

Family

ID=18430456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5353381A Pending JPH07200592A (en) 1993-12-29 1993-12-29 Text processor

Country Status (1)

Country Link
JP (1) JPH07200592A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002010977A1 (en) * 2000-07-06 2002-02-07 Si Han Kim Information searching system and method thereof
WO2002029637A1 (en) * 2000-09-30 2002-04-11 Soo Sung Lee System and method for searching a web site having an english-based domain name mapped to another language-based domain name by employing a web browser

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002010977A1 (en) * 2000-07-06 2002-02-07 Si Han Kim Information searching system and method thereof
WO2002029637A1 (en) * 2000-09-30 2002-04-11 Soo Sung Lee System and method for searching a web site having an english-based domain name mapped to another language-based domain name by employing a web browser

Similar Documents

Publication Publication Date Title
US5890103A (en) Method and apparatus for improved tokenization of natural language text
US7243305B2 (en) Spelling and grammar checking system
JP5362353B2 (en) Handle collocation errors in documents
US5475586A (en) Translation apparatus which uses idioms with a fixed and variable portion where a variable portion is symbolic of a group of words
JPH07325828A (en) Grammar checking system
JPH07325824A (en) Grammar checking system
JPH0844719A (en) Dictionary access system
JPH083815B2 (en) Natural language co-occurrence relation dictionary maintenance method
JPH07200592A (en) Text processor
JP3580760B2 (en) Automatic editing apparatus and method, and storage medium used therefor
JP2818185B2 (en) Document creation support device
JP3197110B2 (en) Natural language analyzer and machine translator
JP2719453B2 (en) Machine translation equipment
JP3253311B2 (en) Language processing apparatus and language processing method
JPS62272357A (en) System for displaying error of input sentence in mechanical translating system
JP2839419B2 (en) Machine translation device with idiom registration function
JPH01126767A (en) Dictionary referring device
JP2958811B2 (en) Japanese sentence processor
JPH03129568A (en) Document processor
JPH09185629A (en) Machine translation method
JP2020184218A (en) Search program, search method, and search device
JPH07121542A (en) Machine translation system
JPH11282838A (en) Input correction method and device
JPS63136264A (en) Mechanical translating device
JPH07129577A (en) Document proofreading supporting device