JPH04152458A - Word processor - Google Patents

Word processor

Info

Publication number
JPH04152458A
JPH04152458A JP2276494A JP27649490A JPH04152458A JP H04152458 A JPH04152458 A JP H04152458A JP 2276494 A JP2276494 A JP 2276494A JP 27649490 A JP27649490 A JP 27649490A JP H04152458 A JPH04152458 A JP H04152458A
Authority
JP
Japan
Prior art keywords
analysis
sentence
word
gist
produces
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2276494A
Other languages
Japanese (ja)
Inventor
Shigemi Nakazato
茂美 中里
Hirofumi Goto
浩文 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Software Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Software Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Software Engineering Corp filed Critical Toshiba Corp
Priority to JP2276494A priority Critical patent/JPH04152458A/en
Publication of JPH04152458A publication Critical patent/JPH04152458A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To easily confirm the contents of a document by analyzing each word, each paragraph, and an entire sentence for each sentence, segmenting plural words showing the gists, and generating the auxiliary verbs, etc., for production of the sentences. CONSTITUTION:A syntax analyzing part 14 absorbs the auxiliary verbs, etc., into the precedent words and arranges them in the paragraphs in a word list analyzed by a morpheme analyzing part 13. Thus, the part 14 produces a reference notion structure. A semantic analyzing part 15 produces the Japanese word notion reliant structure data where the active-passive relation is adjusted against the reference notion structure. A gist segmenting part 16 segments the necessary words against the Japanese word notion reliant structure data based on a rule stored in a rule memory 19. A generating part 17 produces an auxiliary verb absorbed by the part 14 and produces a sentence. This sentence is outputted to a control part 10 and displayed at an output part 12. In such a constitution, the gist of a produced document is surely extracted and the contents of the document can be easily confirmed from the extracted gist.

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、文書の要点を作成する機能を備えた文書作成
装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention] (Industrial Application Field) The present invention relates to a document creation device having a function of creating main points of a document.

(従来の技術) 近年、文書作成装置(ワードプロセッサ)においては、
文章推敲機能を備えたものがある。この文章推敲機能に
より作成文章をチエツクする場合、文章中から1文を切
り出した後、解析辞書の検索により形態素解析を行なっ
て1文の系列に解析し、所定のルールに従って文中の不
適当な部分に対する置換候補を作成し、プロパティ等に
よりユーザーに示し、ユーザーの指示に従って校正処理
する。上記文中の不適当な部分に対する置換候補を作成
する場合、従来では文の意味解析を行ない、その解析結
果に基づいて文の並び変え等を行なって分かり易い文を
作成するようにしている。
(Prior art) In recent years, in document creation devices (word processors),
There are some that have a text editing function. When checking a created sentence using this sentence refinement function, after cutting out one sentence from the sentence, morphological analysis is performed by searching an analysis dictionary to analyze it into a series of sentences, and inappropriate parts of the sentence are removed according to predetermined rules. A replacement candidate is created, shown to the user using properties, etc., and proofreaded according to the user's instructions. When creating replacement candidates for the inappropriate portions of a sentence, conventionally the sentences are semantically analyzed and the sentences are rearranged based on the analysis results to create easy-to-understand sentences.

(発明が解決しようとする課題) 上記のように従来の文書作成装置では、文章推敲におい
て置換候補を示す場合、単に文の並び変え等を行なって
分かり易い文を作成するだけであり、要点だけを切り出
すことができなかった。
(Problems to be Solved by the Invention) As mentioned above, in conventional document creation devices, when presenting replacement candidates in text editing, they simply rearrange the sentences to create an easy-to-understand sentence, and only focus on the main points. I couldn't cut it out.

本発明は上記のような点に鑑みてなされたもので、文の
要点だけを切り出すことかでき、文章推敲に際して置換
候補の選択が極めて容易な文書作成装置を提供すること
を目的とする。
The present invention has been made in view of the above-mentioned points, and it is an object of the present invention to provide a document creation device that can extract only the main points of a sentence and that makes it extremely easy to select replacement candidates when revising a sentence.

[発明の構成] (課題を解決するための手段と作用) すなわち、本発明に係る文書作成装置は、日本語解析に
使用する知識情報を記憶してなる解析辞書と、この解析
辞書を参照して単語単位の解析を行なう形態素解析手段
と、この形態素解析手段の解析結果に基づいて文節単位
の解析を行ない助動詞等を前の単語に吸収させる構文解
析手段と、この構文解析手段の解析結果に基づき一文を
通しての解析を行なう意味解析手段と、この意味解析手
段の解析結果から必要な単語を切り出す要点切り出し手
段と、この要点切り田し手段により切り出された単語に
対し、上記構文解析手段で吸収された助動詞を生成して
1つの文を作成する文生成手段とを具備する。
[Structure of the Invention] (Means and Effects for Solving the Problems) That is, the document creation device according to the present invention includes an analysis dictionary that stores knowledge information used for Japanese language analysis, and a document creation device that refers to this analysis dictionary. A morphological analysis means that performs word-by-word analysis based on the analysis result of this morphological analysis means, a syntactic analysis means that performs clause-by-clause analysis based on the analysis result of this morphological analysis means and absorbs auxiliary verbs etc. into the previous word, a semantic analysis means for analyzing a whole sentence based on the analysis results; a gist extraction means for cutting out necessary words from the analysis result of the semantic analysis means; and a syntactic analysis means for absorbing the words extracted by the gist cutting means. and sentence generation means for generating one sentence by generating the auxiliary verbs.

この結果、作成された文書は、各文毎に「単語単位」、
「文節単位」、「−文全体」を対象として順次解析が行
なわれ、その解析結果に基づいて要点を示す単語が抽出
される。そして、この抽出された単語に対して助動詞等
が生成され、要点を示す文が作成される。従って、この
抽出された要点から文書内容を容易に確認することが可
能になる。
As a result, the created document is created for each sentence in "word units",
Analyzes are performed sequentially for "phrase units" and "- whole sentences," and words indicating key points are extracted based on the analysis results. Then, auxiliary verbs and the like are generated for the extracted words, and a sentence indicating the main point is created. Therefore, it becomes possible to easily confirm the document content from the extracted key points.

(実施例) 以下、図面を参照して本発明の一実施例を説明する。(Example) Hereinafter, one embodiment of the present invention will be described with reference to the drawings.

第1図はこの実施例の文書作成装置の基本的な構成を示
すブロック図である。
FIG. 1 is a block diagram showing the basic configuration of the document creation device of this embodiment.

第1図に於いて、10はマイクロプロセッサ(CPU)
等を用いて構成される制御部、11は同制御部10に接
続される入力部、12は制御部10に接続される表示部
である。上記入力部11は、各種のキー及びマウスなど
による入力を受付けて上記制御部lOに入力する。また
、表示部12は、入力データあるいは処理データ等を表
示するもので、CRTあるいはドツトマトリクス方式の
液晶デイスプレィ装置等からなり、例えば640X40
0ドツトの大きさに設定される。
In Figure 1, 10 is a microprocessor (CPU)
11 is an input section connected to the control section 10, and 12 is a display section connected to the control section 10. The input section 11 accepts inputs using various keys, a mouse, etc., and inputs them to the control section IO. The display unit 12 displays input data or processed data, and is composed of a CRT or a dot matrix type liquid crystal display device, for example, a 640×40
The size is set to 0 dot.

上記制御部10は、装置全体の制御を行なうもので、入
力指示に従うプログラムの起動で、文書作成処理、文書
編集処理、表示制御処理等を行なうと共に、形態素解析
部13、構文解析部14、意味解析部15、要点切り出
し部16、生成部17を制御して、要点の切り出し制御
を実行する。
The control unit 10 controls the entire device, and performs document creation processing, document editing processing, display control processing, etc. by starting a program according to input instructions, and also controls the morphological analysis unit 13, the syntax analysis unit 14, the semantic analysis unit 14, and the like. The analysis section 15, main point extraction section 16, and generation section 17 are controlled to execute main point extraction control.

形態素解析部13は、制御部10から送られてくる文に
対し、解析辞書18を検索して単語単位に解析したリス
トを作成する。解析辞書18には、この日本語解析に使
用する知識情報が収容されている。
The morphological analysis unit 13 searches the analysis dictionary 18 for the sentences sent from the control unit 10 and creates a list of the sentences analyzed word by word. The analysis dictionary 18 stores knowledge information used for this Japanese language analysis.

構文解析部14は、形態素解析部13により解析された
単語リストの中で助動詞等を前の単語に吸収させて文節
にまとめ、基準概念構造を作成する。
The syntactic analysis unit 14 absorbs auxiliary verbs and the like into previous words in the word list analyzed by the morphological analysis unit 13 and combines them into clauses to create a reference conceptual structure.

意味解析部15は、−文を通しての解析を行なうもので
、構文解析部14により作成された基準概念構造に対し
、その係り受けを調整した日本語概念依存構造データを
作成する。
The semantic analysis unit 15 performs analysis through the - sentence, and creates Japanese concept dependent structure data in which the dependencies are adjusted for the reference concept structure created by the syntactic analysis unit 14.

要点切り出し部16は、上記日本語概念依存構造データ
に対し、規則メモリ1つに記憶されている規則に基づい
て必要な単語を切り出し、生成部17へ出力する。規則
メモリ19には、文の要点を切り出すための規則が収容
されている。
The gist extraction section 16 extracts necessary words from the Japanese concept dependent structure data based on the rules stored in one rule memory and outputs them to the generation section 17 . The rule memory 19 stores rules for cutting out the main points of sentences.

生成部17は、構文解析部14て吸収された助動詞第を
生成し、1つの文を作成して制御部10に出力し、表示
部12に表示する。
The generation unit 17 generates the auxiliary verbs absorbed by the syntax analysis unit 14, creates one sentence, outputs it to the control unit 10, and displays it on the display unit 12.

次に、上記実施例における要点切り出し動作について第
2図のフローチャートを参照して説明する。
Next, the gist extraction operation in the above embodiment will be explained with reference to the flowchart of FIG.

要点の切り出しを行なう場合には、画面上に対象となる
文章が表示されている状態で、入力部11から文章を指
定して要点の切り出しを指示する。制御部10は、要点
の切り出しが指示されると、第2図のフローチャートに
示す処理動作を開始する。すなわち、制御部10は、要
点の切り出しが指示されると、その対象となる文を形態
素解析部13に出力する。これにより形態素解析部13
は、第2図のステップAIに示す形態素解析動作を行な
う。
When cutting out the main points, the user specifies the text from the input section 11 and instructs to cut out the main points while the target text is displayed on the screen. When the control unit 10 is instructed to cut out the main points, it starts the processing operation shown in the flowchart of FIG. 2. That is, when the control unit 10 is instructed to cut out the main points, it outputs the target sentence to the morphological analysis unit 13. As a result, the morphological analysis unit 13
performs the morphological analysis operation shown in step AI in FIG.

今、例えば第3図のBlに示すように、私はかなり勉強
したので、今回の試験に合格することができた。
Now, for example, as shown in Figure 3, Bl, I studied a lot, so I was able to pass this exam.

の文か制御部10から形態素解析部13に送られたとす
ると、形態素解析部13は解析辞書18を参照して形態
素解析を行なう。この形態素解析により、第3図のB2
に示すように単語単位に解析したリスト、 私/はlかなり7勉強した/ので/、l今回/の7試験
/に7合格すること/が/でき/た。7を作成する。
When a sentence is sent from the control unit 10 to the morphological analysis unit 13, the morphological analysis unit 13 refers to the analysis dictionary 18 and performs morphological analysis. Through this morphological analysis, B2 in Figure 3
As shown in the list, analyzed word by word, I studied quite a lot, so I was able to pass the exam this time. Create 7.

次に制御部10は、上記形態素解析部13により解析さ
れた単語リストを構文解析部14に出力する。この構文
解析部14は、上記単語リストの中で助動詞等を前の単
語に吸収させて文節にまとめ、第3図の83に示すよう
に基準概念構造を作成する(ステップA2)。即ち、目
的語である「合格」を頂点として■「かなり」、「勉強
」。
Next, the control unit 10 outputs the word list analyzed by the morphological analysis unit 13 to the syntax analysis unit 14. The syntactic analysis unit 14 absorbs auxiliary verbs and the like into the previous words in the word list and combines them into clauses, creating a reference conceptual structure as shown at 83 in FIG. 3 (step A2). In other words, with the object word ``pass'' at the top, ■ ``quite'' and ``study''.

「ので」、■「今回」、「試験」の2つの系統が関連付
けられる。また、「勉強」に対して「私」が関連付けら
れる。
Two systems are associated: "So", ■ "This time", and "Test". Moreover, "I" is associated with "study".

そして、上記構文解析部14で作成された基準概念構造
データは、意味解析部15へ送られてその意味が解析さ
れ(ステップA3)、第3図のB4に示すように係り受
けを調整した日本語概念依存構造が作成される。即ち、
基準概念構造において、「勉強」に係っていた「私」が
「合格」に係るように意味解析部15により調整され、
要点切り出し部16へ送られる。
The reference concept structure data created by the syntax analysis unit 14 is then sent to the semantic analysis unit 15, where its meaning is analyzed (step A3), and the dependencies are adjusted as shown in B4 of FIG. A word concept dependent structure is created. That is,
In the standard concept structure, "I" which was related to "studying" is adjusted by the semantic analysis unit 15 so that it is related to "passing",
The information is sent to the main point extraction section 16.

要点切り出し部16は、意味解析部15で作成された日
本語概念依存構造データから規則メモリ19に記憶して
いる要点切り出し規則に基づいて必要な単語を切り出す
(ステップA4)。即ち、要点切り出し部16は、第3
図の85に示すように日本語概念依存構造データから要
点切り出し規則に基づいて主客と目的格のアークである
「私」。
The gist cutting unit 16 cuts out necessary words from the Japanese concept dependent structure data created by the semantic analysis unit 15 based on gist cutting rules stored in the rule memory 19 (step A4). That is, the main point cutting section 16
As shown at 85 in the figure, ``Washi'' is the arc of the subject and objective case based on the gist extraction rules from the Japanese concept-dependent structure data.

「合格」、「試験」を切り出し、生成部17へ出力する
“Pass” and “Test” are cut out and output to the generation unit 17.

生成部17は、要点切り出し部16により切り出された
「私」、「合格」、「試験」から、上記構文解析部14
で吸収された助動調節を生成し、第3図の86に示すよ
うに1つの文「私は試験に合格した。」を作成する(ス
テップA5)。この生成部17により生成された文は、
制御部10へ送られ、表示部12に表示される。
The generation unit 17 generates the syntax analysis unit 14 from “I”, “pass”, and “examination” extracted by the gist extraction unit 16.
The system generates the auxiliary adjustment absorbed in the step A5, and creates one sentence "I passed the exam" as shown at 86 in FIG. 3 (step A5). The sentence generated by this generation unit 17 is
It is sent to the control section 10 and displayed on the display section 12.

上記のようにして作成文書に対する要点の抽出が行なわ
れる。
The main points of the created document are extracted as described above.

[発明の効果] 以上のように本発明に係る文書作成装置は、作成された
文書に対し、各文毎に「単語単位」、「文節単位」、「
−文全体」を対象として順次解析を行ない、その解析結
果に基づいて要点を示す複数の単語を切り出し、この単
語に対して助動詞等を生成して文を作成するようにした
ので、作成文書の要点を確実に抽出することができ、こ
の要点から文書内容を容易に確認することができる。
[Effects of the Invention] As described above, the document creation device according to the present invention can process the created document for each sentence by "word unit", "bunse unit unit", or "bunsetsu unit".
- The entire sentence is sequentially analyzed, and based on the analysis results, multiple words that indicate the main points are extracted, and auxiliary verbs are generated for these words to create a sentence. The key points can be reliably extracted, and the content of the document can be easily confirmed from the key points.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例による文書作成装置を示すブ
ロック図、第2図は同実施例の動作を示すフローチャー
ト、第3図は同実施例における要点切り出しの具体的な
例を示す図である。 10・・・制御部、11・・・入力部、12・・表示部
、13・・・形態素解析部、14・構文解析部、15・
・・意味解析部、16・・・要点切り出し部、17・・
・生成部、18・・・解析辞書、19・・・規則メモリ
FIG. 1 is a block diagram showing a document creation device according to an embodiment of the present invention, FIG. 2 is a flowchart showing the operation of the embodiment, and FIG. 3 is a diagram showing a specific example of key point extraction in the embodiment. It is. DESCRIPTION OF SYMBOLS 10... Control part, 11... Input part, 12... Display part, 13... Morphological analysis part, 14. Syntax analysis part, 15.
...Semantic analysis part, 16...Gist extraction part, 17...
- Generation unit, 18... Analysis dictionary, 19... Rule memory.

Claims (1)

【特許請求の範囲】[Claims] 文書作成装置において、日本語解析に使用する知識情報
を記憶してなる解析辞書と、この解析辞書を参照して単
語単位の解析を行なう形態素解析手段と、この形態素解
析手段の解析結果に基づいて文節単位の解析を行ない助
動詞等を前の単語に吸収させる構文解析手段と、この構
文解析手段の解析結果に基づき一文を通しての解析を行
なう意味解析手段と、この意味解析手段の解析結果から
必要な単語を切り出す要点切り出し手段と、この要点切
り出し手段により切り出された単語に対し、上記構文解
析手段で吸収された助動詞を生成して1つの文を作成す
る文生成手段とを具備してなることを特徴とする文書作
成装置。
In the document creation device, there is an analysis dictionary that stores knowledge information used for Japanese language analysis, a morphological analysis means that performs word-by-word analysis by referring to this analysis dictionary, and an analysis result of the morphological analysis means. There is a syntactic analysis means that analyzes each clause and absorbs auxiliary verbs into the previous word, a semantic analysis means that analyzes the whole sentence based on the analysis results of this syntactic analysis means, and a syntactic analysis means that analyzes the entire sentence based on the analysis results of this syntactic analysis means. The present invention further comprises: gist extraction means for cutting out words; and sentence generation means for generating one sentence by generating auxiliary verbs absorbed by the parsing means for the words extracted by the gist extraction means. Characteristic document creation device.
JP2276494A 1990-10-17 1990-10-17 Word processor Pending JPH04152458A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2276494A JPH04152458A (en) 1990-10-17 1990-10-17 Word processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2276494A JPH04152458A (en) 1990-10-17 1990-10-17 Word processor

Publications (1)

Publication Number Publication Date
JPH04152458A true JPH04152458A (en) 1992-05-26

Family

ID=17570244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2276494A Pending JPH04152458A (en) 1990-10-17 1990-10-17 Word processor

Country Status (1)

Country Link
JP (1) JPH04152458A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09245036A (en) * 1996-03-05 1997-09-19 Csk Corp Syntax analysis system and electronic dictionary
CN103324653A (en) * 2012-03-21 2013-09-25 株式会社东芝 Main point extraction device and main point extraction method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09245036A (en) * 1996-03-05 1997-09-19 Csk Corp Syntax analysis system and electronic dictionary
CN103324653A (en) * 2012-03-21 2013-09-25 株式会社东芝 Main point extraction device and main point extraction method
JP2013196504A (en) * 2012-03-21 2013-09-30 Toshiba Corp Gist extracting device and program
CN103324653B (en) * 2012-03-21 2016-12-28 株式会社东芝 Withdrawing device to be put and extraction method to be put

Similar Documents

Publication Publication Date Title
JPH0411906B2 (en)
Young et al. An analysis of ill-formed input in natural language queries to document retrieval systems
JPH04152458A (en) Word processor
Sass The verb argument browser
JP2007072841A (en) Word extraction method, database construction method, database constructing device, database construction program, and recording medium
JPH0635961A (en) Document summerizing device
JP2817497B2 (en) Dictionary editing device
JPH01126767A (en) Dictionary referring device
JPH0795323B2 (en) Natural language processor
JPS62203266A (en) Mechanical translation system
JP3197110B2 (en) Natural language analyzer and machine translator
JPH0455975A (en) Document preparing device
JPH07200605A (en) Translation device
JPH0715692B2 (en) Context processor
JPH0612449A (en) System and method for machine translation
JP3253311B2 (en) Language processing apparatus and language processing method
JPS6180358A (en) Translation system
JPH0746359B2 (en) Japanese sentence processing method
JPH0587864B2 (en)
JPH0785046A (en) Syntax analyzing method
JPH03225468A (en) Machine translation device
JPH077418B2 (en) Natural language context processor
JPH05282289A (en) Document preparation device
JPH03157766A (en) Machine translation device
JPH0512332A (en) Translation processor