JP3420369B2 - Document processing apparatus and document processing method - Google Patents

Document processing apparatus and document processing method

Info

Publication number
JP3420369B2
JP3420369B2 JP04980595A JP4980595A JP3420369B2 JP 3420369 B2 JP3420369 B2 JP 3420369B2 JP 04980595 A JP04980595 A JP 04980595A JP 4980595 A JP4980595 A JP 4980595A JP 3420369 B2 JP3420369 B2 JP 3420369B2
Authority
JP
Japan
Prior art keywords
phrase
moving
document processing
dictionary
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04980595A
Other languages
Japanese (ja)
Other versions
JPH08249331A (en
Inventor
信治 徳永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP04980595A priority Critical patent/JP3420369B2/en
Publication of JPH08249331A publication Critical patent/JPH08249331A/en
Application granted granted Critical
Publication of JP3420369B2 publication Critical patent/JP3420369B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、日本語の校正/推敲を
行う日本語ワードプロセッサ、機械翻訳装置などに関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a Japanese word processor, a machine translation device, etc. for proofreading / revising Japanese.

【0002】[0002]

【従来の技術】従来、日本語校正/推敲を行う文書処理
装置においては、日英機械翻訳装置などでは必ず行われ
る構文解析処理を行うものは少なく、ほとんどが形態素
解析処理のみで、誤りを指摘するものがほとんどであっ
た。
2. Description of the Related Art Conventionally, there are few document processing devices that perform Japanese proofreading / reviewing that perform parsing processing that is always performed by Japanese-English machine translators, etc. Most of them are morphological analysis processing and point out errors. Most did.

【0003】例えば、特開平4-213155に開示されている
発明においては、形態素解析処理を行い、より確からし
い単語の並びが存在する場合に限って誤字候補を出力す
るというものが記されている。単語の品詞その他の情報
から表層の並びの出現確率を定義したコストテーブルを
利用して、単語辞書に登録がなかった未登録語および接
続コストが閾値よりも低い同音語がある場合、つまり文
法的により確からしい単語の並びが存在する場合に限っ
て誤字候補を出力するようにしている。
For example, the invention disclosed in Japanese Patent Laid-Open No. 4-213155 describes that morphological analysis processing is performed and typographical error candidates are output only when a more probable word sequence exists. . If there is an unregistered word that has not been registered in the word dictionary and a homonym whose connection cost is lower than the threshold value, that is, grammatically, by using the cost table that defines the appearance probability of the surface layer from the word part of speech and other information. Therefore, the typographical error candidate is output only when a certain word sequence exists.

【0004】また、特開昭62-150461、特開昭62-150462
には呼応関係を有する副詞と助動詞の組を記憶してお
き、それに該当する組み合わせの表現がない場合に、検
出/修正を行うものである。これによって、呼応関係に
ある語の用法に誤りがある可能性がある部分を検出/修
正することが可能となっている。
Further, JP-A-62-150461 and JP-A-62-150462
A pair of adverbs and auxiliary verbs having a sympathetic relationship is stored in, and detection / correction is performed when there is no corresponding combination expression. This makes it possible to detect / correct a portion that may have an error in the usage of words having a synergistic relationship.

【0005】特開昭62-209659においては、形態素解
析、構文解析を行い、制約条件の付いた文法を用いて、
その制約条件に該当する箇所を指摘することによって、
校正を支援している。
In Japanese Patent Laid-Open No. 62-209659, morphological analysis and syntactic analysis are performed, and a grammar with a constraint condition is used.
By pointing out the part corresponding to the constraint condition,
Supports proofreading.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、形態素
解析のみを行って校正/修正を行う場合においては、係
り受け関係は無視されているため、誤字の訂正は可能で
はあるが、係り受け関係が明確にならず、校正/修正が
できないことがある。
However, when the calibration / correction is performed by performing only the morphological analysis, the dependency relation is ignored, so that the typographical error can be corrected, but the dependency relation is clear. It may not be possible to calibrate / correct.

【0007】例えば次のような2つの文を例にとる。For example, the following two sentences will be taken as an example.

【0008】(1)「彼は休憩しているところを見
た。」 (2)「彼が休憩しているところを見た。」 この2つの文では「彼」「休憩している」のか「見た」
のかは曖昧にとれる。一般的に(1)の文では 「彼は(誰かが)休憩しているところを見た。」 というように「彼」が遠くの「見た」にかかるのが自然
であり、一方(2)の文では、 「(誰かが)彼が休憩しているところを見た。」 というように「彼」が近くの「休憩している」に係ると
理解するのが自然である。
(1) "He saw a rest." (2) "He saw a rest." In these two sentences, "he" and "rest"? "saw"
It can be ambiguous. Generally, in the sentence (1), it is natural for "he" to look "far" in the distance, such as "he saw someone (resting) taking a break." ) Sentence, it is natural to understand that "(someone) saw him resting", such that "he" relates to a "resting" nearby.

【0009】そこで本発明では、構文解析を行うことに
より、係り受け関係を解析し、係り受け関係が曖昧であ
る場合に、曖昧性を解消する位置に文節を移動したり、
係り受けの係り文節の直後に読点やコンマを挿入するこ
とによって、係り受けの曖昧性を解消し、読みやすい日
本語文にする。
Therefore, in the present invention, by performing a syntactic analysis, the dependency relation is analyzed, and when the dependency relation is ambiguous, the clause is moved to a position where the ambiguity is resolved,
By inserting a punctuation mark or a comma immediately after the dependency phrase of the dependency, the ambiguity of the dependency is resolved and the sentence is easy to read.

【0010】例えば、文節移動による曖昧性の解消で
は、(1a)「休憩しているところを彼は見た。」とな
り、また、読点による曖昧性の解消では、(1b)「彼
は、休憩しているところを見た。」となる。
For example, in the resolution of ambiguity by moving clauses, (1a) "He saw a break.", And in resolution of ambiguity by reading points, (1b) "He took a break. I saw it doing. "

【0011】この場合に、読点やコンマについては、必
要以上にあるとかえって読みにくい文章になってしまう
ので、構文解析を行って、曖昧性がある場合のみを挿入
対象とする。
In this case, if there are more punctuation marks or commas than necessary, the sentence becomes rather difficult to read. Therefore, a syntactic analysis is performed and only ambiguity is inserted.

【0012】また、構文解析を行う場合においても、従
来の技術のように文法に制約条件を入れるという特殊な
処理を行うのではなく、1つの用言に係っているすべて
の要素を認識し、かつ辞書情報として持っている格パタ
ーンと比較する格解析を行い、語順のチェックなどを行
う。
Also, in the case of parsing, instead of performing a special process of putting a constraint condition on the grammar as in the conventional technique, all the elements related to one idiom are recognized. In addition, case analysis is performed to compare with case patterns held as dictionary information, and word order is checked.

【0013】[0013]

【課題を解決するための手段】本発明の文書処理装置
は、日本語を入力/編集する編集手段と、前記編集手段
によって入力された日本語文を記憶する記憶手段と、前
記日本語文を表示する表示手段と、辞書や文法を記憶す
る辞書記憶手段と、前記辞書記憶手段に記憶された辞書
や文法に基づいて形態素解析を行う形態素解析手段
構文解析を行う構文解析手段と、を備えた文書処理装置
において、前記構文解析手段の結果から係り先が一意に
決まらない文節の有無を判断する係り先チェック手段
と、前記係り先チェック手段で曖昧な文節が存在する場
合に当該文節を区別表示すると共に、当該文節を移動さ
せることで係り先の曖昧性を解消できる移動位置を区別
表示する移動先表示手段と、前記移動先表示手段による
移動対象文節と移動位置の区別表示後に当該文節の移動
を指示する指示手段と、前記指示手段による指示に基づ
いて上記文節を区別表示された位置に移動する文節移動
手段と、を備えたことを特徴とする。また、本発明の文
書処理装置は、前記係り先チェック手段で曖昧な文節が
存在する場合に、係り先の曖昧性を解消できる位置に読
点またはコンマを挿入するコンマ挿入手段を備え、前記
指示手段によって当該コンマ挿入手段あるいは前記文節
移動手段の何れかを起動させることを特徴とする。
た、本発明の文書処理装置は、前記辞書記憶手段に、用
言の格パターンを格納し、前記係り先チェック手段にお
いて、解析結果と前記辞書記憶手段に格納された格パタ
ーンを照合し、前記文節移動手段は、前記辞書記憶手段
に格納された格パターンの順序に、入力文の名詞句文節
を移動させることを特徴とする。
A document processing apparatus of the present invention displays an editing means for inputting / editing Japanese, a storage means for storing a Japanese sentence input by the editing means, and the Japanese sentence. display means, and a dictionary storage means for storing a dictionary and grammar, and morphological analysis unit for performing morphological analysis on the basis of the stored dictionary and grammar to the dictionary storage means,
Document processing apparatus comprising: a parsing unit configured to parse, the
In the above , in accordance with the result of the syntactic analysis means, the dependent check means for determining the presence or absence of a clause for which the dependent is not uniquely determined, and when there is an ambiguous clause in the dependent check means, the clause is displayed separately. The phrase is moved
Distinguishing the ambiguity of the contact by distinguishing the moving position
By the destination display means for displaying and the destination display means
Move the target phrase after distinguishing the target phrase and move position
And an instruction means for instructing
Move the phrase to the position where the above phrase is displayed distinguishably
Means and are provided . Also, the sentence of the present invention
In the call processing device, the ambiguous phrase is detected by the contact check means.
If it exists, read it at a position where the ambiguity of the contact person can be resolved.
A comma insertion means for inserting dots or commas,
The comma inserting means or the phrase according to the indicating means
It is characterized in that any one of the moving means is activated. Also, the document processing apparatus of the present invention stores a case pattern of a noun in the dictionary storage means, and compares the analysis result with the case pattern stored in the dictionary storage means in the dependency check means, The clause moving means moves the noun phrase clause of the input sentence in the order of the case patterns stored in the dictionary storage means.

【0014】[0014]

【0015】[0015]

【0016】[0016]

【0017】[0017]

【作用】発明によれば、編集手段によって入力された
入力文に対して、構文解析手段で構文解析を行い、その
結果を係り先チェック手段で判断し、曖昧な文節が存在
する場合、この文節を区別表示すると共に、この文節を
移動させることで係り先の曖昧性を解消できる移動位置
を区別表示し、この移動対象文節と移動位置の区別表示
後にこの文節の移動を指示し、この指示に基づいてこの
文節を区別表示された位置に移動することができ、係り
受けの曖昧性を解消することができる。また、本発明
よれば、係り先の曖昧性を解消できる位置に読点または
コンマを挿入するコンマ挿入手段を備えているので、係
り先チェック手段で曖昧な文節が存在する場合に、指示
手段によって当該コンマ挿入手段あるいは文節移動手段
の何れかを起動させることができる。また、本発明によ
れば、辞書記憶手段に、用言の格パターンを格納し、係
り先チェック手段において、解析結果と辞書記憶手段に
格納された格パターンを照合し、文節移動手段は、辞
記憶手段に格納された格パターンの順序に、入力文の名
詞句文節を移動させることができる。
According to the present invention, with respect to the input sentence input by the editing means, the syntactic analysis means performs syntactic analysis, and the result checking means judges the result, and when an ambiguous clause exists, this This phrase is displayed while distinguishing the phrase
Moving position that can resolve the ambiguity of the person in charge by moving it
Is displayed separately, and this moving target clause and the moving position are displayed separately.
Later, I instructed to move this clause, and based on this instruction,
Can move clause distinctively displayed position, it is possible to eliminate the ambiguity of the received dependency. Further, according to the present invention , a reading point or a position at a position where the ambiguity of the contact person can be resolved.
Since it has a comma insertion means for inserting a comma,
If there is an ambiguous clause in the destination check method, an instruction is given.
Depending on the means, the comma insertion means or phrase movement means
Either of them can be activated . Further, according to the present invention, the dictionary storage means, and storing each pattern of predicate, the engagement <br/> Risaki check means, against a rating pattern stored in the analysis result and the dictionary storage means , clause moving means in the order of case patterns stored in the dictionary storage means, it is possible to move the noun phrase clause of the input sentence.

【0018】[0018]

【0019】[0019]

【0020】[0020]

【0021】[0021]

【実施例】以下、本発明による文書処理装置の一実施例
を図面を用いて説明する。図1は、本発明における文書
処理装置の構成の一例を示した図である。1は制御手
段、2は入力/編集手段、3は表示手段、4は辞書記憶
手段、5は文法記憶手段、6は形態素解析手段、7は構
文解析手段、8は入力文字記憶手段、9は文節移動手
段、10は係り先チェック手段、11はコンマ挿入手
段、12は文節挿入手段、13は格パターン記憶手段、
14は標準語順チェック手段を示している。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of a document processing apparatus according to the present invention will be described below with reference to the drawings. FIG. 1 is a diagram showing an example of the configuration of a document processing apparatus according to the present invention. 1 is control means, 2 is input / editing means, 3 is display means, 4 is dictionary storage means, 5 is grammar storage means, 6 is morpheme analysis means, 7 is syntactic analysis means, 8 is input character storage means, and 9 is Phrase movement means, 10 is a check destination means, 11 is a comma insertion means, 12 is a phrase insertion means, 13 is a case pattern storage means,
Reference numeral 14 indicates a standard word order checking means.

【0022】制御手段1の制御により、入力手段2から
入力された入力文は、入力文字記憶手段8に格納され
る。これと同時に、表示手段にもこの内容は表示され
る。形態素解析手段6では、辞書記憶手段4の辞書や文
法記憶手段5の文法を用いて、文を文節ごとに区切る。
Under the control of the control means 1, the input sentence input from the input means 2 is stored in the input character storage means 8. At the same time, this content is displayed on the display means. The morphological analysis unit 6 uses the dictionary of the dictionary storage unit 4 and the grammar of the grammar storage unit 5 to divide a sentence into phrases.

【0023】構文解析手段7では、辞書記憶手段4の辞
書や格パターン記憶手段13の格パターンおよび文法記
憶手段5の文法を用いて、構文解析木を作成する。構文
解析木から、係り先チェック手段10により、係り先の
曖昧な文を検出し、表示手段3において、表示を行う。
また、曖昧性を解消または減少する位置へ文節移動手段
9により移動したり、コンマ挿入手段11で、読点やコ
ンマを挿入したりする。
The syntactic analysis means 7 creates a syntactic analysis tree using the dictionary of the dictionary storage means 4, the case pattern of the case pattern storage means 13 and the grammar of the grammar storage means 5. From the syntactic analysis tree, the dependent check means 10 detects an ambiguous sentence related to the dependent, and the display means 3 displays the ambiguous sentence.
Also, the phrase moving unit 9 moves to a position where the ambiguity is resolved or reduced, and the comma insertion unit 11 inserts a reading point or a comma.

【0024】さらに、構文解析木と格パターン記憶部1
3の格パターンから、標準語順チェック手段14によ
り、格要素標準の順に出現しているかどうかをチェック
し、文節移動手段9によって移動を行う。
Further, the syntax analysis tree and case pattern storage unit 1
From the case pattern No. 3, the standard word order checking unit 14 checks whether or not they appear in the order of the case element standard, and the phrase moving unit 9 moves them.

【0025】図2は、本発明の処理を示すフローチャー
トである。図9は画面表示イメージの例を示す図であ
る。まず、構成対象の文章を表示するメインウインドウ
がある。全文が表示できない場合は、スクロールなどの
機能により、全体を確認することが可能である。
FIG. 2 is a flow chart showing the processing of the present invention. FIG. 9 is a diagram showing an example of a screen display image. First, there is a main window that displays the text to be composed. If the full text cannot be displayed, it is possible to check the entire text by using a function such as scrolling.

【0026】本発明では、基本的に一文毎の処理である
ので、処理対象としている一文と、指摘内容を表示する
ウインドウを用意する。図9では、「指摘対象文を示す
ウインドウ」として示す。図9(a)、図9(b)にお
いて、下線を付した文節は、文節を移動する方がよい文
節を示し、空枠は移動すべき位置を示している。
In the present invention, since the processing is basically for each sentence, a window for displaying the sentence to be processed and the pointed out contents is prepared. In FIG. 9, it is shown as a “window showing the indication target sentence”. In FIG. 9A and FIG. 9B, the underlined clauses indicate the clauses that are better to be moved, and the blank frames indicate the positions to be moved.

【0027】また、校正操作をメニューにしたウインド
ウを「校正操作選択メニューウインドウ」として示す。
システムの指摘通りにするかどうかを選択する「●」
「○」はそれぞれ選択、非選択を示し、マウスなどで変
更/選択できるようになっている。
A window in which the calibration operation is used as a menu is shown as a "calibration operation selection menu window".
"●" to select whether to follow the system's instructions
“O” indicates selection and non-selection, respectively, which can be changed / selected with a mouse or the like.

【0028】さらに図9には図示していないが、問題と
なる理由(内容)を表示するウインドウを表示させても
よい。例えば図9(a)であれば「係り先の曖昧な文節
があります。曖昧さを軽減できる位置に該当の文節を移
動しますか?」という表示を、また図9(b)であれば
「用言に対する格助詞の順序が標準と異なります。標準
の語順に変更しますか?」と表示させる。
Although not shown in FIG. 9, a window for displaying the reason (content) of the problem may be displayed. For example, in the case of Fig. 9 (a), the display "There is an ambiguous phrase related to the person concerned. Are you sure you want to move the corresponding phrase to a position that can reduce the ambiguity?" The order of case particles for adjectives is different from the standard. Are you sure you want to change the standard word order? ”Is displayed.

【0029】図2はメインフローである。ステップS1
では、入力文一文が入力文字記憶手段8に読込まれる。
それと同時に表示手段3に表示が行われる。ステップS
2では形態素解析手段6で、辞書記憶手段4の辞書や文
法記憶手段5の文法を用いて、文節を作成する。ステッ
プS3では、形態素解析レベルで行える校正支援を行
う。例えば、表記の間違い指摘や語尾の不統一の指摘な
どを行う。
FIG. 2 is a main flow. Step S1
Then, one input sentence is read into the input character storage means 8.
At the same time, a display is made on the display means 3. Step S
In 2, the morphological analysis unit 6 creates a clause using the dictionary of the dictionary storage unit 4 and the grammar of the grammar storage unit 5. In step S3, calibration support that can be performed at the morphological analysis level is provided. For example, it points out typographical errors and points out inconsistencies in word endings.

【0030】ステップS4において、ステップS3で行
われた校正支援での指摘に基づいて、入力文が変更され
たかどうかを判断し、変更された場合は、再び形態素解
析を行うために、ステップS2に戻る。変更が行われな
かった場合にはステップS6に処理を進める。
In step S4, it is judged whether the input sentence is changed or not based on the indication in the proofreading support performed in step S3, and if it is changed, the process proceeds to step S2 to perform the morphological analysis again. Return. If no change has been made, the process proceeds to step S6.

【0031】ステップS6では、構文解析処理を行う。
構文解析処理のアルゴリズムは特に特別なものではない
が、格パターンを用いた格解析/意味解析を行う。
In step S6, a syntax analysis process is performed.
The syntax analysis algorithm is not special, but case analysis / semantic analysis using case patterns is performed.

【0032】ステップS7において、ステップS6での
結果を利用して校正支援を行う。詳細は図3、図4のフ
ロー、図5の例文を用いて説明する。なお、この図3、
図4で示す処理の順序は問題ではない。
In step S7, the calibration support is performed using the result of step S6. Details will be described with reference to the flows of FIGS. 3 and 4 and the example sentences of FIG. In addition, this FIG.
The order of the processes shown in FIG. 4 does not matter.

【0033】次に図3を用いて、係り受けに曖昧性があ
った場合の処理を示す。ステップS11において、図5
(1-3)のような文では、構文解析の結果は、図7に示すよ
うに2種類の係り受けの可能性がある。図7は依存構造
であり、受けの語の下に係りの語を並べる構造である。
図7(1-3a)は、「本を」と「昨日」が「読んだ」に、
「買った」が「本を」に係ることを示し、(1-3b)は、
「昨日」が「買った」に、「買った」が「本を」に、
「本を」が「読んだ」に係ることを示している。この構
造を同じように示したのが図6(1-3)である。係り先チ
ェック手段10を用いて、この構造から2カ所にかかる
可能性がある文節を探し、「昨日」を見つける。2カ所
以上に係る可能性がある文節があった場合にはステップ
S12へ、ない場合はメインフローへ処理が戻る。
Next, with reference to FIG. 3, the processing when there is ambiguity in the dependency is shown. In step S11, as shown in FIG.
In the sentence like (1-3), the result of the syntactic analysis may have two types of dependency as shown in FIG. FIG. 7 shows a dependency structure, in which related words are arranged below the receiving word.
In Figure 7 (1-3a), "Book" and "Yesterday" are "Read",
Indicates that "buying" is related to "book", and (1-3b)
"Yesterday" is "buy", "buy" is "book",
It indicates that "reading a book" is related to "reading". FIG. 6 (1-3) shows this structure in the same manner. Using the contact check means 10, a phrase that may be at two places is searched from this structure, and "yesterday" is found. If there is a phrase that may be related to two or more places, the process returns to step S12, and if not, the process returns to the main flow.

【0034】実施例の場合、2つ以上ある係り先のう
ち、どちらに係る可能性が高いかを、格パターン記憶手
段13の格パターンを用いて、格解析および意味解析を
行い判断する。
In the case of the present embodiment, the case pattern of the case pattern storage means 13 is used to determine which of the two or more related parties is more likely to be related by performing case analysis and semantic analysis.

【0035】図5(1-1a)では、図6(1-1a)に示すように
「ギターを」は、より遠くの「弾いている」に、図5(1
-1b)では、図6(1-1b)のように、より近くの文節「唄っ
ている」に係る。同様に、図5(1-2a)および(1-2b)の例
では、(1-2a)の例が、より遠くの文節に係っている。こ
のステップで、係り先の曖昧な文節があり、かつ係り先
の可能性がある文節のうち、より遠い方に係っていると
システムが判断した場合、ステップS12へ、それ以外
の場合はメインフローに戻る。
In FIG. 5 (1-1a), as shown in FIG. 6 (1-1a), "playing the guitar" is changed to "playing" at a farther position.
-1b), as shown in FIG. 6 (1-1b), relates to a closer phrase “singing”. Similarly, in the examples of (1-2a) and (1-2b) of FIG. 5, the example of (1-2a) relates to a farther bunsetsu . In this step, if the system determines that there is an ambiguous phrase related to the destination and that the farther one of the possible phrases related to the destination is involved, the process proceeds to step S12. Otherwise, return to the main flow.

【0036】つまり、図5の(1-1a)および(1-2a)の文で
は、ステップS12へすすみ、図5(1-1b)および(1-2b)
の文はメインフローに戻る。また、(1-3)の例では「昨
日」が「買った」に係るのか「読んだ」に係るのか判断
できない。さらに図5(1-4)、図6の(1-4)でも「赤い」
が「会社」に係るのか「車」に係るのか判断できない
(「赤い会社」なるものがないという知識を格納してい
れば判断できる)。これらの場合も、ステップS12で
ユーザの判断にゆだねることになる。
That is, in the sentences (1-1a) and (1-2a) in FIG. 5, the process proceeds to step S12, and the sentences (1-1b) and (1-2b) in FIGS.
Statement returns to the main flow. In addition, in the example of (1-3), it cannot be determined whether "yesterday" relates to "buying" or "reading". In addition, "red" in Fig. 5 (1-4) and Fig. 6 (1-4).
It is not possible to determine whether is related to "company" or "car" (it can be determined if the knowledge that there is no "red company" is stored). In these cases as well, it is up to the user's judgment in step S12.

【0037】ステップS12では、係り先の曖昧な文節
の特徴表示(例えばカラー表示、アンダーライン表示な
ど)と、移動先の位置を表示する。図5の(1-1a)の文の
場合、図9の(1-1a)の「指摘対象文を示すウインドウ」
のような表示を行う。また、「校正操作メニューウイン
ドウ」のように、選択項目を表示する。ここで、文節移
動を行うか、読点(またはコンマ)を挿入するか、その
ままかの選択肢を表示し、ステップS13へ進む。
In step S12, the characteristic display (for example, color display, underline display, etc.) of the ambiguous phrase of the destination and the position of the destination are displayed. In the case of the sentence of (1-1a) in FIG. 5, "window showing the indicated sentence" in (1-1a) of FIG. 9
Is displayed. Also, selection items are displayed as in the “calibration operation menu window”. Here, the option of moving the phrase, inserting a reading point (or a comma), or leaving it as it is is displayed, and the process proceeds to step S13.

【0038】ステップS13では、ステップS12で表
示の選択肢からユーザが選択し、ステップS14に進
む。
In step S13, the user selects from the display options in step S12, and the process proceeds to step S14.

【0039】ステップS14では、ステップS13で文
節移動を選択した場合には、特徴表示している文節を移
動先の位置に移動する。移動先は、係り先の文節の直前
である。また、読点挿入を選択した場合は、特徴表示し
た文節の直後へ読点(またはコンマ)を挿入する。それ
ぞれの処理終了後メインフローへ戻る。
In step S14, when the phrase movement is selected in step S13, the feature-displayed phrase is moved to the destination position. The destination is just before the clause of the destination. Also, when insertion of a reading point is selected, a reading point (or a comma) is inserted immediately after the phrase displayed as a feature. After each process is completed, the process returns to the main flow.

【0040】次に、格解析を用いて語順のチェックを行
い、語順を変更する処理を説明する。ステップS21で
は、構文解析を行った結果、各用言にどんな文節がどん
な順で係っているのか解析される。これを格パターンデ
ータと比較することにより、標準的な語順であるかどう
かが判断される。例えば、図5(2-1)および(2-2)では、
用言「書いた」には「本を」と「私が」が、この順で係
っている。また、用言「見なす」には、「正解と」と
「これを」とが、この順で係っている。この用言には、
格パターンデータとして図8のようなものがある。格パ
ターンの各要素の順を標準語順とすると、両者とも異な
っている。このように標準語順と異なっている場合は、
ステップS22へ進み、異なっていない場合はメインフ
ローに戻る。
Next, the processing for checking the word order using case analysis and changing the word order will be described. In step S21, as a result of the syntactic analysis, it is analyzed what clauses are associated with which terms and in what order. By comparing this with the case pattern data, it is judged whether or not the word order is standard. For example, in FIGS. 5 (2-1) and (2-2),
The terms "written" include "book" and "me" in that order. In addition, in the verb "to regard", "correct answer" and "this" are related in this order. In this idiom,
Case pattern data is shown in FIG. If the order of each element of the case pattern is the standard word order, both are different. If it is different from the standard word order like this,
The process proceeds to step S22, and if they are not different, the process returns to the main flow.

【0041】ステップS22では、標準語順にするため
の文節移動の表示を行う。つまり、図9の(2-1)の「指
摘対象文を示すウインドウ」のように、移動する文節と
移動先を表示する。格要素が3つ以上ある場合は、ステ
ップS21〜ステップS24が繰り返される。
In step S22, the phrase movement for displaying in the standard word order is displayed. That is, the phrase to be moved and the move destination are displayed as in the “window showing the indicated object sentence” in (2-1) of FIG. If there are three or more case elements, steps S21 to S24 are repeated.

【0042】語順の変更を、格要素である文節の移動と
考えて、標準の語順で用言に最も近い格要素からチェッ
クし、入力文でその格要素と用言との間に他の格要素が
入っていると、用言の直前に移動先を設定する。繰り返
される場合は、その次に用言に近い各要素をチェック
し、先に移動し終えた用言に最も近い格要素の直前に移
動先を設定する。その後ステップS23へ進む。
Considering the change of word order as the movement of a clause that is a case element, the case element closest to the word in the standard word order is checked, and another case is inserted between the case element and the word in the input sentence. When the element is included, the destination is set just before the idiom. When it is repeated, each element next to the word is checked, and the destination is set immediately before the case element closest to the word that has finished moving first. After that, the process proceeds to step S23.

【0043】ステップS23では、ユーザは移動するか
どうかを選択する。移動を行う場合には、ステップS2
4に進み、そうでない場合はメインフローに戻る。
In step S23, the user selects whether to move. When moving, step S2
4. If not, return to the main flow.

【0044】ステップS24では、特徴表示している文
節を移動先の位置へ移動する。そしてメインフローに戻
る。
In step S24, the feature-displayed clause is moved to the destination position. Then return to the main flow.

【0045】ステップS7では、ステップS3の従来の
校正支援機能による校正の結果およびステップS6の本
発明による校正支援機能による校正の結果で、入力文字
記憶手段8の内容および表示手段3の内容が変更され
る。
In step S7, the contents of the input character storage means 8 and the contents of the display means 3 are changed depending on the result of the calibration by the conventional calibration support function of step S3 and the result of the calibration by the calibration support function of the present invention of step S6. To be done.

【0046】ステップS8で、次の文があればステップ
S1に戻り、なければ、処理を終了する。
If there is a next sentence in step S8, the process returns to step S1. If not, the process ends.

【0047】[0047]

【発明の効果】本発明によれば、係り先が曖昧な文節に
対して、より遠い方の係り先に係る方が、ユーザの意図
する内容である場合に、該文節を係り先の直前に移動
し、曖昧性を解消もしくは減少させた文に校正すること
が可能であり、読み手に書き手の意図を正確に伝えるこ
とが可能となる。つまり、曖昧な文節が存在する場合、
この文節を区別表示すると共に、この文節を移動させる
ことで係り先の曖昧性を解消できる移動位置を区別表示
し、この移動対象文節と移動位置の区別表示後にこの文
節の移動を指示し、この指示に基づいてこの文節を区別
表示された位置に移動することができ、係り受けの曖昧
性を解消することができる。また、文節の移動の代わり
に、該文節の直後に読点かコンマを挿入することによっ
て、読み手に該文節が遠方に係ることを示していること
を暗に伝えることができ、曖昧性を軽減することが可能
となる。また、格解析/共起情報を用いることによっ
て、正確に係り受けを判断することが可能となる。さら
に、日本語において、用言の格要素の語順は比較的自由
であるが、特別な効果をねらう場合以外は標準的な語順
がある程度決まっており、読み手に伝わりやすい。よっ
て、標準的でない語順を指摘し、標準的な位置に移動す
ることによって、読み手に伝わりやすい。
As described above, according to the present invention, if a user's intention is that a farther destination is related to an ambiguous phrase, the phrase is placed immediately before the phrase. It is possible to move and proofread the sentence to eliminate or reduce ambiguity, and to accurately convey the reader's intention to the reader. In other words, if there is an ambiguous clause,
This phrase is displayed separately, and this phrase is moved.
Distinguishing display of moving positions that can resolve ambiguity
However, after displaying the distinction between this movement target clause and the movement position, this sentence
Instructs to move a clause and distinguishes this clause based on this instruction
You can move to the displayed position, and ambiguous dependency
The sex can be eliminated. Also, instead of moving the phrase, by inserting a punctuation mark or a comma immediately after the phrase, it is possible to implicitly convey to the reader that the phrase relates to a distant place and reduce ambiguity. It becomes possible. Further, by using the case analysis / co-occurrence information, it becomes possible to accurately determine the dependency. Furthermore, in Japanese, the word order of the case elements of idioms is relatively free, but the standard word order is fixed to some extent except for the purpose of special effects, which is easy for readers to understand. Therefore, by pointing out a non-standard word order and moving to a standard position, it is easy for the reader to understand.

【0048】[0048]

【0049】[0049]

【0050】[0050]

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例に係るブロック図である。FIG. 1 is a block diagram according to an embodiment of the present invention.

【図2】本発明に関するメインフロー図である。FIG. 2 is a main flow diagram according to the present invention.

【図3】本発明の請求項1または2の処理に関するフロ
ー図である。
FIG. 3 is a flowchart relating to the processing of claim 1 or 2 of the present invention.

【図4】本発明の請求項4の処理に関するフロー図であ
る。
FIG. 4 is a flow chart relating to the processing of claim 4 of the present invention.

【図5】入力文の例を示す図である。FIG. 5 is a diagram showing an example of an input sentence.

【図6】入力文の例の係り受け構造を示す図である。FIG. 6 is a diagram showing a dependency structure of an example of an input sentence.

【図7】入力文の例の構文解析結果を示す図である。FIG. 7 is a diagram showing a result of syntax analysis of an example of an input sentence.

【図8】用言辞書の格パターンの例を示す図である。FIG. 8 is a diagram showing an example of a case pattern of a vocabulary dictionary.

【図9】本発明の一実施例の画面表示例を示す図であ
る。
FIG. 9 is a diagram showing a screen display example according to an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 制御手段 2 入力/挿入手段 3 表示手段 4 辞書記憶手段 5 文法記憶手段 6 形態素解析手段 7 構文解析手段 8 入力文字記憶手段 9 文節移動手段 10 係り先チェック手段 11 コンマ挿入手段 12 文節挿入手段 13 格パターン記憶手段 14 標準語順チェック手段 1 control means 2 Input / insertion means 3 display means 4 dictionary storage means 5 Grammar storage means 6 Morphological analysis means 7 syntax analysis means 8 Input character storage means 9 clause movement means 10 Contact check means 11 comma insertion means 12 clause insertion means 13 Case pattern storage means 14 Standard word order checking means

フロントページの続き (56)参考文献 特開 平2−90359(JP,A) 特開 平4−68465(JP,A) 特開 平6−195377(JP,A) 特開 平3−127266(JP,A) 特開 平4−259065(JP,A) 特開 平5−113996(JP,A) 特開 平6−52217(JP,A) 特開 平6−176057(JP,A) 特開 昭62−163173(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/28 Continuation of front page (56) Reference JP-A-2-90359 (JP, A) JP-A-4-68465 (JP, A) JP-A-6-195377 (JP, A) JP-A-3-127266 (JP , A) JP-A 4-259065 (JP, A) JP-A 5-113996 (JP, A) JP-A 6-52217 (JP, A) JP-A 6-176057 (JP, A) JP-A 62-163173 (JP, A) (58) Fields investigated (Int.Cl. 7 , DB name) G06F 17/21-17/28

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 日本語を入力/編集する編集手段と、 前記編集手段によって入力された日本語文を記憶する記
憶手段と、 前記日本語文を表示する表示手段と、 辞書や文法を記憶する辞書記憶手段と、 前記辞書記憶手段に記憶された辞書や文法に基づいて形
態素解析を行う形態素解析手段、 構文解析を行う構文解析手段と、 を備えた文書処理装置において、 前記構文解析手段の結果から係り先が一意に決まらない
文節の有無を判断する係り先チェック手段と、 前記係り先チェック手段で曖昧な文節が存在する場合に
当該文節を区別表示すると共に、当該文節を移動させる
ことで係り先の曖昧性を解消できる移動位置を区別表示
する移動先表示手段と、 前記移動先表示手段による移動対象文節と移動位置の区
別表示後に当該文節の移動を指示する指示手段と、 前記指示手段による指示に基づいて上記文節を区別表示
された位置に移動する文節移動手段と、 を備えた ことを特徴とする文書処理装置。
1. An editing unit for inputting / editing Japanese, a storage unit for storing the Japanese sentence input by the editing unit, a display unit for displaying the Japanese sentence, and a dictionary storage for storing a dictionary and grammar. means and a morphological analysis unit for performing morphological analysis on the basis of the stored dictionary and grammar to the dictionary storage means, the document processing apparatus comprising: a parsing unit, a performing syntax analysis, the results of the syntax analysis means In the case where there is an ambiguous phrase in the dependency check means for determining whether or not there is a phrase whose dependency is not uniquely determined,
The phrase is displayed separately and the phrase is moved.
Distinguishing display of moving positions that can resolve ambiguity
Moving destination display means and a group of moving target clauses and moving positions by the moving destination display means
Instructing means for instructing movement of the phrase after separate display, and distinguishing display of the phrase based on the instruction by the instructing means
A document processing device , comprising: a phrase moving unit that moves to a specified position .
【請求項2】 前記係り先チェック手段で曖昧な文節が
存在する場合に、係り先の曖昧性を解消できる位置に読
点またはコンマを挿入するコンマ挿入手段を備え、 前記指示手段によって当該コンマ挿入手段あるいは前記
文節移動手段の何れかを起動させる ことを特徴とする請
求項1に記載の文書処理装置。
2. The ambiguous clause is detected by the contact check means.
If it exists, read it at a position where the ambiguity of the contact person can be resolved.
A comma insertion means for inserting a dot or a comma is provided, and the comma insertion means or the
The document processing apparatus according to claim 1, wherein any one of the phrase moving means is activated .
【請求項3】 前記辞書記憶手段に、用言の格パターン
を格納し、前記係り先チェック手段において、解析結果
と前記辞書記憶手段に格納された格パターンを照合し、 前記文節移動手段は、前記辞書記憶手段に格納された格
パターンの順序に、入力文の名詞句文節を移動させるこ
とを特徴とする請求項1に記載の文書処理装置
3. A case pattern of a noun in the dictionary storage means.
The result of the analysis is stored in the contact check means.
And the case pattern stored in the dictionary storage means are collated with each other, and the phrase movement means determines the case pattern stored in the dictionary storage means.
You can move the noun phrase clause of the input sentence to the order of the pattern.
The document processing apparatus according to claim 1, wherein the door.
JP04980595A 1995-03-09 1995-03-09 Document processing apparatus and document processing method Expired - Fee Related JP3420369B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04980595A JP3420369B2 (en) 1995-03-09 1995-03-09 Document processing apparatus and document processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04980595A JP3420369B2 (en) 1995-03-09 1995-03-09 Document processing apparatus and document processing method

Publications (2)

Publication Number Publication Date
JPH08249331A JPH08249331A (en) 1996-09-27
JP3420369B2 true JP3420369B2 (en) 2003-06-23

Family

ID=12841364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04980595A Expired - Fee Related JP3420369B2 (en) 1995-03-09 1995-03-09 Document processing apparatus and document processing method

Country Status (1)

Country Link
JP (1) JP3420369B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3921523B2 (en) * 2001-12-27 2007-05-30 独立行政法人情報通信研究機構 Text generation method and text generation apparatus
JP6244676B2 (en) * 2013-06-07 2017-12-13 コニカミノルタ株式会社 Operation support program, operation support method, and information processing apparatus
JP6792584B2 (en) * 2018-03-01 2020-11-25 Kddi株式会社 Analyst and program

Also Published As

Publication number Publication date
JPH08249331A (en) 1996-09-27

Similar Documents

Publication Publication Date Title
US5678051A (en) Translating apparatus with special display mode for supplemented words
US5537317A (en) System for correcting grammer based parts on speech probability
US4962452A (en) Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence
US7243305B2 (en) Spelling and grammar checking system
US5535121A (en) System for correcting auxiliary verb sequences
US5020021A (en) System for automatic language translation using several dictionary storage areas and a noun table
US20080133444A1 (en) Web-based collocation error proofing
JPH0844719A (en) Dictionary access system
US4964030A (en) Apparatus for translating sentences containing punctuation marks
US4860206A (en) Translation system allowing user designation of postpositional words
JP3420369B2 (en) Document processing apparatus and document processing method
USRE35464E (en) Apparatus and method for translating sentences containing punctuation marks
JPH0693221B2 (en) Voice input device
JPH07325825A (en) English grammar checking system device
JP2818185B2 (en) Document creation support device
JPH0696117A (en) Document change supporting system
JPH07200592A (en) Text processor
JP2958811B2 (en) Japanese sentence processor
JP3253311B2 (en) Language processing apparatus and language processing method
JPH07129577A (en) Document proofreading supporting device
JP3353873B2 (en) Machine translation equipment
JP2608384B2 (en) Machine translation apparatus and method
JPH06251009A (en) Sentence proofreading support device
JPH07105215A (en) Phrase structure extracting device and syntax check device
JPH06176056A (en) Machine translating device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080418

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees