JPS63219067A - Dictionary retrieval device - Google Patents

Dictionary retrieval device

Info

Publication number
JPS63219067A
JPS63219067A JP62051954A JP5195487A JPS63219067A JP S63219067 A JPS63219067 A JP S63219067A JP 62051954 A JP62051954 A JP 62051954A JP 5195487 A JP5195487 A JP 5195487A JP S63219067 A JPS63219067 A JP S63219067A
Authority
JP
Japan
Prior art keywords
topic
search
dictionary
retrieval
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62051954A
Other languages
Japanese (ja)
Inventor
Teruki Niki
仁木 輝記
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Agency of Industrial Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency of Industrial Science and Technology filed Critical Agency of Industrial Science and Technology
Priority to JP62051954A priority Critical patent/JPS63219067A/en
Publication of JPS63219067A publication Critical patent/JPS63219067A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To obtain an efficient dictionary retrieval device by fetching from a storage means a retrieval order and a retrieval range which a retrieval control means has extracted from a topic extraction means and which corresponds to the change of a topic and using them for the retrieval of dictionaries. CONSTITUTION:If an inputted sentence is analyzed in a natural language analysis device 1, the device 1 transmits information 100 to the topic extraction device 2 for extracting the topic. The device 2 extracts a topic 101 (is set to a subject C) in accordance with the function of a system based on the information. If the topic C which the dictionary retrieval device uses for deciding the retrieval order and the retrieval range differs with the subject 101, the topic 101 is transmitted from the device 2 to the retrieval control device 4. Said device 4 sets the topic 101, namely, the topic C as the new subject, and simultaneously fetches the retrieval order and the retrieval range with respect to the topic 101, namely the order of dictionaries D2 and D4 from a storage device 3. The retrieval order and the retrieval range is used hereafter in the retrieval of the dictionaries.

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、話題が動的に変化する自然言語の文書又は対
話の解析装置において用いられる辞書を検索する装置に
関する。
DETAILED DESCRIPTION OF THE INVENTION Field of the Invention The present invention relates to an apparatus for searching a dictionary used in an apparatus for analyzing natural language documents or dialogues in which topics change dynamically.

従来の技術 自然言語の文書及び対話は多数の話題から構成されてお
り、文書及び対話の流れにしたがって話題は動的に変化
する。自然言語の文書及び会話には多数の語が使われ、
自然言語解析装置では辞書を検索することによりそれら
の語に対する情報を抽出するが、従来の自然言語解析装
置では辞書検索の過程は話題の推移とは独立していたた
め、対象文書もしくは対話の話題の変化により辞書検索
の検索順序もしくは検索範囲を変化させることはなかっ
た。
BACKGROUND OF THE INVENTION Natural language documents and dialogues are composed of many topics, and the topics dynamically change according to the flow of the document and dialogue. Natural language documents and conversations use many words,
Natural language analysis devices extract information for those words by searching dictionaries, but in conventional natural language analysis devices, the dictionary search process was independent of topic trends, so The change did not change the search order or search range of the dictionary search.

文の解析に伴って辞書検索の順序が変化するものとして
は、現在ワードプロセッサの辞書で広範に使われている
ような、最近比の単語を検索のさいに最優先させるとい
うものがある。しかし、この方法では検索順序の変化は
その単語のみにとどまり、検索効率改善の効果は頻出す
る単語のみに限られる。
One way to change the order of dictionary searches as a sentence is analyzed is to give top priority to words with the most recent ratios, as is currently widely used in word processor dictionaries. However, with this method, the search order is changed only for that word, and the effect of improving search efficiency is limited to only frequently occurring words.

発明が解決しようとする問題点 辞書は解析の対象の文書に現われる全てもしくはほとん
ど全ての語を含んでいる。多くの語はその使用頻度が話
題によって異なり、話題によってはほとんど使用されな
い語も存在する。しかし、従来の辞書検索では対象文書
または対話の話題およびその話題の変化とは独立に辞書
検索を行っているため、そのような話題による単語使用
頻度の変化には対応しえない。
The problem to be solved by the invention The dictionary contains all or almost all the words that appear in the document to be analyzed. The frequency of use of many words varies depending on the topic, and some words are rarely used depending on the topic. However, in conventional dictionary searches, dictionary searches are performed independently of the topic of the target document or conversation and changes in the topic, and therefore cannot respond to changes in the frequency of word usage due to such topics.

また、辞書が一つの見出しに対し選択肢として複数の異
なる情報を持つ場合がある。たとえば、一つの語が複数
の意味を持つ場合がこれに当たる。自然言語解析でこの
ような複数の選択肢から一つを選択する場合に、話題に
より選択肢を絞り込むことが可能な場合が多いが、従来
の話題に対し独立の辞書検索では検索時に選択肢を絞り
込むことはできず、誤った情報を選択する可能性が大き
い。
Furthermore, a dictionary may have a plurality of different pieces of information as options for one heading. For example, this is the case when one word has multiple meanings. When selecting one of these multiple options using natural language analysis, it is often possible to narrow down the options by topic, but with traditional dictionary searches for independent topics, it is not possible to narrow down the options at the time of search. There is a high possibility that the wrong information will be selected.

本発明は上記問題点を解5消し、効率のよい辞書検索の
具現化を目的とする。
The present invention aims to solve the above-mentioned problems and realize an efficient dictionary search.

問題点を解決するための手段 本発明の辞書検索装置は文書又は対話の話題を抽出する
話題抽出手段と、話題ごとの見出し語及びその見出し語
に対する辞書情報の検索順序・検索範囲を記憶する記憶
手段と、検索に使用する検索順序、検索範囲および検索
に用いる辞書を管理する検索管理手段を有し、前記話題
抽出手段により話題の変化が抽出されると同時に、検索
管理手段がその話題に対応した検索順序・検索範囲を前
記記憶手段より取り出し、その検索順序・検索範囲をそ
の後の辞書検索に用いるものである。
Means for Solving the Problems The dictionary search device of the present invention includes topic extraction means for extracting the topics of documents or dialogues, and a memory that stores headwords for each topic and the search order and search range of dictionary information for the headwords. and a search management means for managing the search order, search range, and dictionary used for the search, and at the same time as the topic extraction means extracts a change in topic, the search management means responds to the topic. The search order and search range obtained are retrieved from the storage means, and the search order and search range are used for subsequent dictionary searches.

作用 前記記憶手段に記憶させる辞書検索順序・辞書検索範囲
は各々の話題での個々の単語の出現頻度に対応しており
、各々の話題でもっとも頻繁に使用される見出し語、も
しくは個々の見出し語に関してはその話題においてもっ
とも妥当な辞書情報を優先的に検索し、その話題では使
用される可能性のないものについては検索を行わないよ
うに設定されている。
Effect: The dictionary search order and dictionary search range stored in the storage means correspond to the frequency of appearance of individual words in each topic, and the dictionary search order and dictionary search range stored in the storage means correspond to the frequency of appearance of individual words in each topic. It is set to preferentially search for the most appropriate dictionary information for the topic, and not to search for information that is unlikely to be used in the topic.

また、前言ご話題抽出手段は対象とする文書又は対話の
話題を抽出し、話題が変化した場合には検索管理手段が
新しい話題に対応した辞書検索順序・辞書検索範囲を前
記記憶手段より捜し、その検索順序・検索範囲を用いて
辞書検索を行う。
Further, the preamble topic extraction means extracts the topic of the target document or dialogue, and when the topic changes, the search management means searches the storage means for a dictionary search order and dictionary search range corresponding to the new topic, A dictionary search is performed using the search order and search range.

実施例 まず、第1図を用いて、本発明の詳細な説明する。Example First, the present invention will be explained in detail using FIG.

実施例は、自然言語解析装置1より情報を与えられその
情報から解析対象文の話題を抽出する話題抽出装置2と
、各話題に対する辞書の検索順序・検索範囲を話題と検
索順序・検索範囲の対応表の形で格納する記憶装置3と
、解析中の文の話題からそれに対応する辞書検索順序・
辞書検索範囲を引出し、その検索順序・検索範囲に基づ
き実際の検索を行う検索管理装置4からなる辞書検索装
置と、辞書検索装置に接続されている自然言語解析装置
1および解析に使用する辞書D1〜5から構成される。
In the embodiment, a topic extraction device 2 receives information from a natural language analysis device 1 and extracts a topic of a sentence to be analyzed from that information, and a topic extraction device 2 extracts a topic of a sentence to be analyzed from the information, and a dictionary search order and search range for each topic is divided into topics and search order and search range. A storage device 3 that stores data in the form of a correspondence table, and a dictionary search order and dictionary corresponding to the topic of the sentence being analyzed.
A dictionary search device consisting of a search management device 4 that retrieves a dictionary search range and performs an actual search based on the search order and search range, a natural language analysis device 1 connected to the dictionary search device, and a dictionary D1 used for analysis. It consists of ~5.

この実施例では、辞書D1〜5を最初から分割し、記憶
装置3は各々の話題で使用する辞書とその検索の優先順
位を格納している。例では、話題AではDl、D2、D
3、D4の順に辞書を検索し、話題BではD2、D4、
Dl、D3の順に辞書を検索する・・・となっている。
In this embodiment, the dictionaries D1 to D5 are divided from the beginning, and the storage device 3 stores the dictionaries used for each topic and their search priorities. In the example, for topic A, Dl, D2, D
3. Search the dictionary in the order of D4, and for topic B, search for D2, D4,
The dictionary is searched in the order of Dl, D3, etc.

単語は各話題での使用頻度によって、各々の辞書にふり
わけ、話題による検索順序・検索範囲の切り換えにより
効率良く検索が行えるようにする。
Words are sorted into different dictionaries according to their frequency of use in each topic, and searches can be performed efficiently by switching the search order and search range depending on the topic.

次に、実際の動作例を第1図により説明する。Next, an example of actual operation will be explained with reference to FIG.

第1図(a)は解析を開始する前の初期状態を示す。こ
の状態ではまだいずれの話題も選択されていない。この
ときの入力文の解析での辞書検索では辞書の検索順序・
検索範囲は適当な初期値を設定してお(。例えば、対象
文がいずれの話題にも属さない場合の検索順序・検索範
囲を記憶装置3に格納しておきそれを用いてもよいし、
もし最初の話題が決まったものであるなら、その話題に
対する検索順序・検索範囲を設定しておいてもよい。
FIG. 1(a) shows the initial state before starting analysis. In this state, no topic has been selected yet. At this time, in the dictionary search when analyzing the input sentence, the search order of the dictionary and
For the search range, set an appropriate initial value (for example, if the target sentence does not belong to any topic, the search order and search range may be stored in the storage device 3 and used.
If the initial topic is fixed, the search order and search range for that topic may be set in advance.

第1図の例では初期値を話題Aに対する検索順序・検索
範囲としている。
In the example shown in FIG. 1, the initial values are the search order and search range for topic A.

第1図(b)で自然言語解析装置1で入力文が解析され
ると自然言語解析装置1は話題抽出装置2に話題抽出の
ための情報100を送り、その情報に基づき話題抽出装
置は話題を抽出する。話題の抽出の方法としては、キー
ワード抽出のような簡単なもの、入力文の構文的構造を
手掛かりとするもの、入力文の意味からの推論によって
話題を抽出するものなどシステムの機能により多様な方
法が考えられる。また、自然言語解析装置1が話題の切
り換えをシステム側が積極的に行うシステム主導型の対
話システムの一部である場合には、話題はシステムから
直接得られる。それぞれの方法により話題抽出装置2に
送られる情報100も異なる。
In FIG. 1(b), when the input sentence is analyzed by the natural language analysis device 1, the natural language analysis device 1 sends information 100 for topic extraction to the topic extraction device 2, and based on that information, the topic extraction device extracts the topic. Extract. There are various ways to extract topics depending on the system's functionality, such as simple methods such as keyword extraction, methods that use the syntactic structure of the input sentence as clues, and methods that extract topics by inference from the meaning of the input sentence. is possible. Furthermore, if the natural language analysis device 1 is part of a system-driven dialogue system in which the system actively switches topics, the topic can be obtained directly from the system. The information 100 sent to the topic extraction device 2 differs depending on each method.

第1図(c)で話題−101が抽出され、さらに辞書検
索装置が検索順序・検索範囲の決定に用いている話題と
その話題101が異なる場合には、話題101は話題抽
出装置2から検索管理装置4に送られる。この例では話
題101は話題Cである。
If the topic 101 is extracted in FIG. 1(c) and the topic 101 is different from the topic used by the dictionary search device to determine the search order and search range, the topic 101 is retrieved from the topic extraction device 2. The information is sent to the management device 4. In this example, topic 101 is topic C.

第1図(d)では、検索管理装置4は話題101を新し
い話題として設定すると同時に記憶装置3からその話題
101に対する検索順序・検索範囲102を取り出す。
In FIG. 1(d), the search management device 4 sets a topic 101 as a new topic and at the same time retrieves the search order and search range 102 for the topic 101 from the storage device 3.

この例では検索順序・検索範囲は辞書D2、辞書D4の
順番である。
In this example, the search order/search range is the order of dictionary D2 and dictionary D4.

第1図(e)で、検索管理装置4は話題101に対する
検索順序・検索範囲102を得、これ以降辞書検索にお
いてこの検索順序・検索範囲を用いる。
In FIG. 1(e), the search management device 4 obtains a search order/search range 102 for a topic 101, and uses this search order/search range in subsequent dictionary searches.

話題による辞書の検索順序・検索範囲の切り換えは以上
のような過程で行われ、この過程は対象−とする文書ま
たは対話の話題の変化のさいに繰り返される。
Switching of the dictionary search order and search range based on topics is performed in the process described above, and this process is repeated when the target document or conversation topic changes.

次に、第1図の側辺外の検索順序・検索範囲の指定の方
法について述べる。
Next, a method for specifying the search order and search range outside the sides of FIG. 1 will be described.

第2図の方式は話題ごとに辞書を完全に分離したもので
あり、それぞれの話題に対し専用の辞書を有する。この
場合に二つ以上の辞書に一つの単語が存在してもよい。
In the system shown in FIG. 2, dictionaries are completely separated for each topic, and each topic has its own dictionary. In this case, one word may exist in two or more dictionaries.

話題の変化のさいの動作は第1図の例と同様である。The operation when the topic changes is the same as the example shown in FIG.

第3図は辞書を分割するのではなく、辞書の検索の方法
を変えることにより、辞書の検索順序・検索範囲を変え
るものである。第3図の例では辞書5に対する検索に用
いるノ1ツシュ関数とノ1ツシュテーブルを記憶装置3
が格納しており話題の変化にしたがって、使用するハツ
シュ関数、ハツシュテーブルを変化させる。検索方法の
切り換えと辞書の分割を組み合わせても良い。
In FIG. 3, the dictionary search order and search range are changed by changing the dictionary search method rather than dividing the dictionary. In the example shown in FIG.
The hash functions and hash tables used are changed according to changes in topics. Switching the search method and dividing the dictionary may be combined.

第4図は辞書の記述にも話題に関する情報を含めた例で
ある。第4図の例で単語すを検索した場合について説明
する。辞書5は見出し・辞書情報の他に話題に関する情
報を含む。記憶装置3に含まれる情報も同じ話題情報で
ある。辞書検索のさいには現在の話題に対応する話題情
報と話題情報が一致したものの辞書情報だけが取り出さ
れる。辞書5は単語すに対する見出しを3つ持っている
FIG. 4 is an example in which information about the topic is also included in the dictionary description. The case of searching for the word ``su'' using the example shown in FIG. 4 will be explained. The dictionary 5 includes information related to topics in addition to heading/dictionary information. The information contained in the storage device 3 is also the same topic information. During a dictionary search, only dictionary information whose topic information corresponds to the current topic matches the topic information is retrieved. Dictionary 5 has three headings for each word.

辞書検索装置4は3つの辞書項目の中から現在の話題に
対する話題情報である4、8のいずれかを持つ辞書項目
を捜し、話題情報として4を有する辞書項目を選ぶ。自
然言語解析装置にはこの辞書項目の辞書情報である意味
b−3が渡される。
The dictionary search device 4 searches for a dictionary item having either 4 or 8 as the topic information for the current topic from among the three dictionary items, and selects the dictionary item having 4 as the topic information. Meaning b-3, which is dictionary information of this dictionary item, is passed to the natural language analysis device.

なお上記の第3図、第4図の例とも話題の変化のさいの
動作は第1図の例と同様である。
In both the examples shown in FIGS. 3 and 4, the operation when the topic changes is the same as in the example shown in FIG.

発明の効果 上記装置を用いることにより各話題での個々の単語の出
現頻度の変化に対応した辞書検索を行うことが可能にな
り、その結果辞書検索の効率が向上する。また、複数の
情報を選択肢に持つ語の検索では前記記憶手段での各々
の選択肢に対する検索の範囲・検索の優先順位をその話
題における使用法の頻度に対応させることにより検索さ
れる情報の妥当性が増す。
Effects of the Invention By using the above-mentioned device, it becomes possible to perform a dictionary search that corresponds to changes in the frequency of appearance of individual words in each topic, and as a result, the efficiency of the dictionary search is improved. In addition, when searching for a word that has multiple information options, the validity of the information to be searched is determined by matching the search range and search priority for each option in the storage means to the frequency of usage in the topic. increases.

【図面の簡単な説明】[Brief explanation of drawings]

第1図(a)〜(e)は本発明の一実施例の辞書検索装
置における話題の変化に伴う辞書の検索順序・検索範囲
の切換動作の説明図、第2図から第4図は検索順序・検
索範囲の指定の方法を変えた他の実施例の辞書検索装置
の説明図である。 1・・・・・・自然言語解析装置、2・・・・・・話題
抽出装置、3・・・・・・記憶装置、4・・・・・・検
索管理装置、5・・・・・・辞書。 出顯人 工業技術院長 飯 塚 幸 三第 l 図 (Q) 第 1 図 (b) 第1図    (C) 第1図    +ch 第1図    te+ DI      D2      υ3      [
)4       LI5第2図 DI、      Dz      03      
D4     05第3図 す 第 4 図
FIGS. 1(a) to 4(e) are explanatory diagrams of the switching operation of the dictionary search order and search range in accordance with a change in topic in a dictionary search device according to an embodiment of the present invention, and FIGS. 2 to 4 are diagrams showing the search FIG. 7 is an explanatory diagram of another embodiment of the dictionary search device in which the method of specifying the order and search range is changed. 1... Natural language analysis device, 2... Topic extraction device, 3... Storage device, 4... Search management device, 5... ·dictionary. Director of the Agency of Industrial Science and Technology Yukizo Iizuka Figure 1 (Q) Figure 1 (b) Figure 1 (C) Figure 1 +ch Figure 1 te+ DI D2 υ3 [
)4 LI5 Figure 2 DI, Dz 03
D4 05Figure 3Figure 4

Claims (1)

【特許請求の範囲】[Claims] 自然言語の文書又は対話の解析からその文書又は対話の
話題を抽出する話題抽出手段と、辞書の見出し語および
各見出し語が選択肢として持つ複数の情報に対する検索
順序・検索範囲を話題ごとに記憶する記憶手段と、辞書
検索の順序及び範囲を管理する検索管理手段を有し、前
記話題抽出手段により抽出される話題の変化に伴い、検
索管理手段が前記記憶手段に記憶された辞書検索順序・
辞書検索範囲を解析のさいの辞書検索に自動的に適用す
るをことを特徴とする辞書検索装置。
Topic extraction means for extracting the topic of a document or dialogue from analysis of a natural language document or dialogue, and storing for each topic the search order and search range for a dictionary headword and a plurality of pieces of information that each headword has as options. It has a storage means, and a search management means for managing the order and range of dictionary searches, and the search management means changes the dictionary search order and range stored in the storage means as the topics extracted by the topic extraction means change.
A dictionary search device characterized in that a dictionary search range is automatically applied to a dictionary search during analysis.
JP62051954A 1987-03-09 1987-03-09 Dictionary retrieval device Pending JPS63219067A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62051954A JPS63219067A (en) 1987-03-09 1987-03-09 Dictionary retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62051954A JPS63219067A (en) 1987-03-09 1987-03-09 Dictionary retrieval device

Publications (1)

Publication Number Publication Date
JPS63219067A true JPS63219067A (en) 1988-09-12

Family

ID=12901268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62051954A Pending JPS63219067A (en) 1987-03-09 1987-03-09 Dictionary retrieval device

Country Status (1)

Country Link
JP (1) JPS63219067A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003079328A1 (en) * 2002-03-20 2003-09-25 Japan Science And Technology Agency Audio video conversion apparatus and method, and audio video conversion program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003079328A1 (en) * 2002-03-20 2003-09-25 Japan Science And Technology Agency Audio video conversion apparatus and method, and audio video conversion program

Similar Documents

Publication Publication Date Title
US6167370A (en) Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures
CN100458795C (en) Intelligent word input method and input method system and updating method thereof
EP0597630A1 (en) Method for resolution of natural-language queries against full-text databases
CN110134760A (en) A kind of searching method, device, equipment and medium
US20020184204A1 (en) Information retrieval apparatus and information retrieval method
WO1999066378A3 (en) Method and apparatus for knowledgebase searching
CN110162768B (en) Method and device for acquiring entity relationship, computer readable medium and electronic equipment
US20050021508A1 (en) Method and apparatus for calculating similarity among documents
JP2001084255A (en) Device and method for retrieving document
US8572082B2 (en) Method and device for generating a similar meaning term list and search method and device using the similar meaning term list
JPH1049543A (en) Document retrieval device
JP2003150624A (en) Information extraction device and information extraction method
JPH05151253A (en) Document retrieving device
JPS63219067A (en) Dictionary retrieval device
JPH06215035A (en) Text retrieving device
JPH11272709A (en) File retrieval system
CN113761104A (en) Method and device for detecting entity relationship in knowledge graph and electronic equipment
Oldroyd et al. Study of strategies used in online searching: 2. Positional Logic—an example of the importance of selecting the right Boolean operator
KR20020054254A (en) Analysis Method for Korean Morphology using AVL+Trie Structure
JPH09231233A (en) Network retrieval device
JP2002117043A (en) Device and method for document retrieval, and recording medium with recorded program for implementing the same method
JP3161660B2 (en) Keyword search method
CN117909473A (en) Multi-scene self-comprehensive question-answering device and method based on document compression
JPH10171821A (en) Method for presenting retrieval word candidate and device therefor
JPH05233696A (en) Method for retrieving data base