JPS61206069A - Document input processing system - Google Patents

Document input processing system

Info

Publication number
JPS61206069A
JPS61206069A JP60046947A JP4694785A JPS61206069A JP S61206069 A JPS61206069 A JP S61206069A JP 60046947 A JP60046947 A JP 60046947A JP 4694785 A JP4694785 A JP 4694785A JP S61206069 A JPS61206069 A JP S61206069A
Authority
JP
Japan
Prior art keywords
document
word
input
title
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60046947A
Other languages
Japanese (ja)
Inventor
Masamichi Shiyudo
首藤 正道
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP60046947A priority Critical patent/JPS61206069A/en
Publication of JPS61206069A publication Critical patent/JPS61206069A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To retrieve easily the inputted document by extracting the word used for the title part of the document, and using the word of the part of speech designated beforehand and the word to which the similar word is added as a key word. CONSTITUTION:When the Japanese sentence is inputted by a KANA (Japanese syllabary) character input from a keyboard 1, the sentence is inputted and accumulated to a document processing part 9 as a KANJI (Chinese character) KANA mixing Japanese sentence by a KANA KANJI converting part 2. Next, the form of the document is displayed on a monitor 12 by the control of the processing part 9, and the input place of the title part is indicated. Thus, in a word selecting part 4, the word of the title part is selected during the input of the title, sent to a similar word retrieving part 6 and the similar word of the word is extracted. When the input of the document is completed, the document accumulated at the processing part 9 is stored into a document file 10 in relation to the key word including the word used in the title at the retrieving part 6 and the similar word. Thus, the inputted document can be easily retrieved.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、ワードプロセッサ等の文書入力処理方式に関
する。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a document input processing method for a word processor or the like.

(従来の技術) 近年ワードプロセッサ等の文書入力処理装置の普及が進
展し、文書を情報処理装置によって処理することが一般
的になって来た。このようにワードプロセッサ等が普及
し、情報処理装置で扱う文書データが増大してゆくにつ
れて、大量の文書データの中から必要とするものをいか
に能率良く抽出するかが問題となる。従来ワードプロセ
ッサ等では、文章の入力編集等文書の作成機能に重点が
おかれており、作成した文書のファイルからの検索機能
は貧弱であり、作成した文書の表題や著者名を登録して
おき、それ等のリストを出力してそのリストの中から探
索して必要としている文書の検索を行っていた。
(Prior Art) In recent years, document input processing devices such as word processors have become more widespread, and it has become common for documents to be processed by information processing devices. As word processors and the like become widespread and the amount of document data handled by information processing apparatuses increases, the problem becomes how to efficiently extract necessary documents from a large amount of document data. Conventional word processors have focused on document creation functions such as text input and editing, and have poor search functions for created documents from files. A list of these documents was output and the document searched for the desired document.

(発明が解決しようとする問題点) この様な従来の方式では、検索の対象となるファイル中
の文書の数が多くなると、リストの中から目的とする文
書を探索する手間がかかり、使用者への負担が増大する
問題点がある。
(Problem to be solved by the invention) In such a conventional method, when the number of documents in a file to be searched increases, it takes time and effort to search for the target document from the list, and the user There is a problem that the burden on people increases.

そこで、本発明の目的は、従来の問題点を除去し、入力
した文書の検索が容易な文書入力処理方式の提供にある
SUMMARY OF THE INVENTION Therefore, an object of the present invention is to provide a document input processing method that eliminates the conventional problems and allows easy searching of input documents.

(問題点を解決するために本発明が提供する手段) 前述の問題点を解決するために本発明が提供する文書入
力処理方式は、文書を入力する手段と、前記文書の中の
表題部分の単語を抽出する手段と、前記単語の類似語を
与える手段と、前記文書と前記単語及び前記類似語とを
関連づけて格納する記憶手段とを含むことを特徴とする
(Means provided by the present invention to solve the problems) The document input processing method provided by the present invention to solve the above-mentioned problems includes a means for inputting a document, and a means for inputting a title part of the document. The present invention is characterized in that it includes means for extracting a word, means for providing a similar word to the word, and storage means for storing the document in association with the word and the similar word.

(作用) 大量の文書の中から必要とする文書を選び出して検索す
る場合、その文書の内容から引き当てるのが望ましい。
(Operation) When selecting and retrieving a required document from a large amount of documents, it is desirable to locate the document based on the content of the document.

大量の文書リストを一つ一つチェックして目的のものを
探し当てる手間は大変であり、その文書の内容を表わす
いくつかのキーワードを指定すれば対応する文書が選択
きれるならばユーザの負担は大幅に軽減される。また、
文書の内容については良くわかっていても、文書の名称
を正確に覚えていない場合がしばしばあり、そのような
場合にも文書の内容から検索できることは極めて有効で
ある0本発明は、文書の内容から文書を検索できるよう
にするために、文書を入力しファイルに格納する際にそ
の文書の内容を表わすキーワードを抽出して文書本体と
共に格納するようにするものである。
The effort of checking a large list of documents one by one to find the desired one is a lot of work, but if the corresponding documents could be selected by specifying several keywords that represent the content of the document, the burden on the user would be significantly reduced. will be reduced to Also,
Even if you know the contents of a document well, you often do not remember the name of the document accurately, and even in such cases, it is extremely effective to be able to search from the contents of the document. In order to be able to search for a document from a computer, when a document is input and stored in a file, keywords representing the content of the document are extracted and stored together with the document itself.

文書の内容はその表題に集約きれていると云っても良く
、従って文書の内容を表わす主要なキーワードは表題中
に含まれていると考えられる。本発明においては、文書
の表題部分に使用きれている単語を抽出し、あらかじめ
指定した品詞(複数でも良い)の単語をキーワードとす
る。
It can be said that the content of a document can be summarized in its title, and therefore the main keywords representing the content of the document are considered to be included in the title. In the present invention, unused words in the title of a document are extracted, and words of a pre-designated part of speech (or parts of speech) are used as keywords.

また、検索の際に使用するキーワードが、文書の中で使
用されている単語と同一の単語でなければその文書を抽
出できないという制限は利用者にとって不便であり、意
味的に同一であれば異なる単語を用いても検索が可能で
あるよう融通性を持たせることが必要である。本発明で
は、キーワードとして抽出された単語に、さらにそれ等
単語と同意味の類似語を加えたものをキーワードとして
用いる。
In addition, the restriction that a document cannot be extracted unless the keyword used in the search is the same as the word used in the document is inconvenient for the user; It is necessary to provide flexibility so that searches can be performed using words. In the present invention, words extracted as keywords are further added with similar words having the same meaning as the words, and are used as keywords.

(実施例) 以下に実施例をもとにさらに本発明の詳細を述べる。第
1図は本発明の一実施例を示すブロック図である。1は
日本文のカナ文字列および制御情報を入力するためのキ
ーボード。2はカナ漢字変換部で、キーボード1から入
力きれたカナ文字列を辞書記憶部3に格納されている単
語辞書、文法辞書を参照して単語を認定し、カナ文字列
を漢字かな混じり文に変換する。カナ漢字変換部2で変
換された漢字かな混じり文字列は文書処理部9に、また
変換時に抽出された単語は単語選択部4は送出される。
(Example) The present invention will be further described in detail based on Examples below. FIG. 1 is a block diagram showing one embodiment of the present invention. 1 is a keyboard for inputting Japanese kana character strings and control information. 2 is a kana-kanji conversion unit, which refers to the kana character string input from the keyboard 1 to the word dictionary and grammar dictionary stored in the dictionary storage unit 3, identifies the word, and converts the kana character string into a sentence containing kanji and kana. Convert. The kanji-kana mixed character string converted by the kana-kanji conversion section 2 is sent to the document processing section 9, and the words extracted at the time of conversion are sent to the word selection section 4.

単語選択部4は、文書処理部9より現在カナ漢字変換入
力中である文字列が表題入力部分に対応していることを
示す情報を得て、その期間のみカナ漢字変換部2からの
単語を受は取ると共に、あらかじめ指定しである品詞の
l1l(品詞の指定は複数であっても良い)のみを選択
して類似語検索部6に送出する。単語の品詞情報はカナ
漢字変換部2が辞書記憶部3を用いて抽出した単一に付
加してくるものとする。類似語検索部6は単語選択部4
から受けた単語をキーにして類似語記憶部7より′その
単語の類似語を検索し、その単語と類似語を一時蓄積す
る。類似語記憶部7は、見出し単語とその類似語を組に
したレコードを単位に複数レコードを有している0文書
処理部9は、キーボード1よりカナ漢字変換部2を介し
て入力された文章を一時的に蓄積すると共に、キーボー
ド1からの制御情報により入力きれた文章の編集処理を
行う。11は表示制御部で、文書処理部9を介して入力
された文章、編集処理過程をモニター12でモニタリン
グするためにモニター12を制御する。8は格納制御部
で、文書処理部9に蓄積されている入力文書と、類似語
検索部6に蓄積されている入力文書のキーワードとなる
単語およびそれ等の類似語を関連付けて文書ファイル1
0に格納する。格納制御部8はまたキーボード1から入
力された検索用キーワードをカナ漢字変換部2および文
書処理部9を経て受は取り、文書ファイル10に格納き
れている文書の中から対応するキーワードを有する文書
を検索して文書処理部9に送り込む。
The word selection unit 4 obtains information from the document processing unit 9 indicating that the character string currently being input for kana-kanji conversion corresponds to the title input part, and selects the words from the kana-kanji conversion unit 2 only during that period. At the same time, only l1l of the parts of speech specified in advance (more than one part of speech may be specified) is selected and sent to the similar word search unit 6. It is assumed that the part-of-speech information of a word is added to the single word extracted by the kana-kanji conversion unit 2 using the dictionary storage unit 3. Similar word search unit 6 is word selection unit 4
Using the word received from as a key, the similar word storage section 7 is searched for similar words to the word, and the word and similar words are temporarily stored. The similar word storage unit 7 has a plurality of records each consisting of a headword and its similar words. The document processing unit 9 stores sentences input from the keyboard 1 via the kana-kanji conversion unit 2. is temporarily stored, and the text that has been completely input is edited using control information from the keyboard 1. Reference numeral 11 denotes a display control section which controls the monitor 12 in order to monitor the text input through the document processing section 9 and the editing process. Reference numeral 8 denotes a storage control unit that associates the input document stored in the document processing unit 9 with the words serving as keywords of the input document stored in the similar word search unit 6 and their similar words to create a document file 1.
Store at 0. The storage control unit 8 also receives the search keyword input from the keyboard 1 via the kana-kanji conversion unit 2 and the document processing unit 9, and selects a document having the corresponding keyword from among the documents that have been stored in the document file 10. is searched and sent to the document processing section 9.

上に延べた構成の実施例の全体の動作は次のようになる
。キーボード1よりカナ文字入力によって日本文を入力
するとカナ漢字変換部2により漢字かな混じり日本文と
して文書処理部9に入力文章が蓄積される。文書処理部
9の制御により、入力の際にはあらかじめ設定した書式
がモニター12上に表示され表題部分の入力場所が指示
される。入力中の文章は、モニター12によってモニタ
ーすることができ、必要に応じてキーボード1からの制
御情報によって文書処理部9で編集処理が実行される。
The overall operation of the embodiment of the configuration described above is as follows. When a Japanese sentence is input by inputting kana characters from the keyboard 1, the input sentence is stored in the document processing section 9 as a Japanese sentence mixed with kanji and kana by the kana-kanji conversion section 2. Under the control of the document processing section 9, a preset format is displayed on the monitor 12 at the time of input, and the input location of the title section is indicated. The text being input can be monitored by the monitor 12, and editing processing is executed by the document processing section 9 according to control information from the keyboard 1 as needed.

入力文章が文書処理部9に蓄積きれると同時に入力文章
中に使用された単語はカナ漢字変換部2で抽出される。
As soon as the input text is stored in the document processing section 9, the words used in the input text are extracted by the kana-kanji conversion section 2.

単語選択部4において、表題の入力中に、表題部分の単
語を選択し、類似語検索部6に送り、それ等の単語の類
似語を抽出する。文書の入力が完了しキーボード1より
入力した文章のファイルへの格納の指示を出すと、文書
処理部9に蓄積きれていた文章は類似語検索部6にある
表題中に使用きれていた単語およびそれ等の類似語を含
むキーワードと関連付けて文書ファイル10に格納きれ
る。
In the word selection section 4, while inputting the title, words in the title part are selected and sent to the similar word search section 6, where similar words of these words are extracted. When the input of a document is completed and an instruction to store the entered text in a file is issued from the keyboard 1, the text that has been stored in the document processing section 9 is stored in the similar word search section 6, including words that have not been used in the title and It can be stored in the document file 10 in association with keywords containing similar words.

このようにして文書ファイル10に格納きれた文書は、
キーボード1から検索指示と共に入力されたキーワード
に対応して選択諮れ、文書処理部9に取り込みさらにモ
ニター12上にその文章を表示することができる。
The documents stored in the document file 10 in this way are
A selection is made in response to a keyword input along with a search instruction from the keyboard 1, and the text is imported into the document processing section 9 and further displayed on the monitor 12.

なお、第1図のブロック図には示していないが文書処理
部9にプリンタを接続すれば検索した文書のハード】ピ
ーを得ることが出来、また通信回線接続部を付加するこ
とによって検索した文書を遠隔の端末に送ることも可能
となる。
Although not shown in the block diagram of FIG. 1, if a printer is connected to the document processing section 9, a hard copy of the retrieved document can be obtained, and by adding a communication line connection section, the retrieved document can be obtained. It is also possible to send it to a remote terminal.

なお、本発明の実施形態には本発明の基本思想にもとづ
いて種々の変形が存在し、以上に述べた実施例は本発明
の範囲を限定するものではない。
Note that there are various modifications to the embodiments of the present invention based on the basic idea of the present invention, and the examples described above do not limit the scope of the present invention.

(発明の効果) 以上に述べたように、本発明によれば、入力した文章の
キーワードを、その文章を入力中に自動的に抽出し、そ
れ等キーワードを入力した文章本体と同時に関連づけて
ファイルに格納することが出来るから、一度入力した文
章を検索する場合にキーワード検索が可能となる。そこ
で、本発明の方式を用いれば、文章の表題リストを1つ
1つチヱックして選択するような手間が省けると同時に
、このように検索を容易にするための情報の付加に入力
オペレータの負担を全く必要としない。
(Effects of the Invention) As described above, according to the present invention, the keywords of the input text are automatically extracted while the text is being input, and the keywords are associated with the input text body at the same time. Since the text can be stored in the ``keyword'', it is possible to perform a keyword search when searching for a text that has been input once. Therefore, by using the method of the present invention, it is possible to save the trouble of clicking and selecting a list of text titles one by one, and at the same time, it is possible to reduce the burden on the input operator in adding information to facilitate the search. is not required at all.

また、本発明の方式では、キーワードとして、入力した
文章中に使用された単語に限定されずそれ等の単語と同
意の類似語をも使用することが可能であり、融通性に富
んだ検索が可能である。このように、本発明によれば、
入力した文書の検索が容易な文書入力処理方式が提供で
きる。
Furthermore, in the method of the present invention, keywords are not limited to words used in the input text, but also similar words that are the same as those words can be used, making it possible to perform a highly flexible search. It is possible. Thus, according to the present invention,
A document input processing method that allows easy searching of input documents can be provided.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例を示すブロック図である。 1・・・キーボード、2・・・カナ漢字変換部、3・・
・辞書記憶部、4・・・単語選択部、6・・・類似語検
索部、7・・・類似語記憶部、8・・・格納制御部、9
・・・文書処理部、10・・・文書ファイル、11・・
・表示制御部、12・・・モニター。
FIG. 1 is a block diagram showing one embodiment of the present invention. 1...Keyboard, 2...Kana-Kanji converter, 3...
- Dictionary storage unit, 4... Word selection unit, 6... Similar word search unit, 7... Similar word storage unit, 8... Storage control unit, 9
...Document processing unit, 10...Document file, 11...
-Display control unit, 12...monitor.

Claims (1)

【特許請求の範囲】[Claims] 文書を入力する手段と、前記文書の中の表題部分の単語
を抽出する手段と、前記単語の類似語を与える手段と、
前記文書と前記単語及び前記類似語とを関連づけて格納
する記憶手段とを含むことを特徴とする文書入力処理方
式。
means for inputting a document; means for extracting a word in a title portion of the document; and means for providing a similar word to the word;
A document input processing method, comprising: a storage means for storing the document, the word, and the similar word in association with each other.
JP60046947A 1985-03-08 1985-03-08 Document input processing system Pending JPS61206069A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60046947A JPS61206069A (en) 1985-03-08 1985-03-08 Document input processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60046947A JPS61206069A (en) 1985-03-08 1985-03-08 Document input processing system

Publications (1)

Publication Number Publication Date
JPS61206069A true JPS61206069A (en) 1986-09-12

Family

ID=12761489

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60046947A Pending JPS61206069A (en) 1985-03-08 1985-03-08 Document input processing system

Country Status (1)

Country Link
JP (1) JPS61206069A (en)

Similar Documents

Publication Publication Date Title
JPH0581326A (en) Data base retrieving device
JPS6175952A (en) Document input processing system
JPS60176169A (en) Sentence processor
JPS61206069A (en) Document input processing system
JPS6151247A (en) Document storing system
JPS5969829A (en) Device for documentation
JPS62197864A (en) Language information offering device
JPS61248160A (en) Document information registering system
JPS59103133A (en) Kana (japanese syllabary)/kanji (chinese character) converting system
JPS6134668A (en) Kana (japanese syllabary) to kanji (chinese character) converting system
JPH0245876A (en) Document retrieving device
JPH0668140A (en) Electronic translation system
JPH0314162A (en) Document processor
JPH0528129A (en) Word processor
JPH05181853A (en) Document processing system
JPS61267827A (en) Information registering and retrieving device
JPH1097537A (en) Translation supporting system and its recording medium
JP2999049B2 (en) Sentence processing equipment
JPS61267828A (en) Information registering and retrieving device
JPH0535788A (en) Information processing device
JPS62287338A (en) Retrieving device
JPH08339365A (en) Method and device for documentation
JPS62282364A (en) Character string retrieval system
JPS58219632A (en) Data conversion processing system
JPH0492961A (en) Document input editing processor