JP2804297B2 - Natural language processor - Google Patents

Natural language processor

Info

Publication number
JP2804297B2
JP2804297B2 JP1171471A JP17147189A JP2804297B2 JP 2804297 B2 JP2804297 B2 JP 2804297B2 JP 1171471 A JP1171471 A JP 1171471A JP 17147189 A JP17147189 A JP 17147189A JP 2804297 B2 JP2804297 B2 JP 2804297B2
Authority
JP
Japan
Prior art keywords
dictionary
kana
information
word
heading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1171471A
Other languages
Japanese (ja)
Other versions
JPH0336661A (en
Inventor
佐敏 山内
和博 井上
中島  勝
延幸 大呂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1171471A priority Critical patent/JP2804297B2/en
Publication of JPH0336661A publication Critical patent/JPH0336661A/en
Application granted granted Critical
Publication of JP2804297B2 publication Critical patent/JP2804297B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 技術分野 ワードプロセッサやDPSの日本語入力などに用いる仮
名漢字変換処理装置、音声認識、機械翻訳や校正支援や
文字認識等における自然言語解析装置に関し、例えば音
声合成等における仮名漢字変換装置等にも適用されるも
のである。
Description: TECHNICAL FIELD The present invention relates to a kana-kanji conversion processor used for inputting Japanese into a word processor or a DPS, a natural language analyzer for speech recognition, machine translation, proofreading support, character recognition, etc. It is also applied to a kanji conversion device and the like.

従来技術 従来、日本語の読みを仮名で入力し、単語辞書から仮
名・漢字の単語データを読み出し、漢字仮名混じり文を
生成する仮名漢変換装置では、前記単語辞書は、見出
し、表記、頻度、文法情報(品詞等)を並べたものであ
った。このため仮名漢字変換処理を行う際、まず見出し
に対応した辞書情報を集めて、それから文法的に振り落
していた。しかし、仮名漢字変換処理のための辞書検索
回数が増大すると、単語データの処理量が膨大となり、
処理時間が長くなるという欠点があった。これについ
て、特開昭59−112328号公報では単語辞書に2段のイン
デックスを設けることで解決を試みている。だが、この
方法でも辞書の情報(例えば、意味・共起情報)が多く
なると、単語データの処理量が膨大となり処理時間が長
くなる。又、第2インデックスを参照しなければ各単語
の辞書データを参照することができず不便であった。
Conventional technologyConventionally, in a kana-kan conversion device that inputs a Japanese reading in kana, reads word data of kana / kanji from a word dictionary, and generates a sentence mixed with kanji kana, the word dictionary includes headings, notations, frequencies, Grammar information (part of speech etc.) was arranged. For this reason, when performing the kana-kanji conversion process, first, dictionary information corresponding to the headline was collected, and then grammatically dropped. However, as the number of dictionary searches for the kana-kanji conversion process increases, the processing amount of word data becomes enormous,
There is a disadvantage that the processing time is long. JP-A-59-112328 attempts to solve this problem by providing a two-stage index in the word dictionary. However, even in this method, if the dictionary information (for example, meaning / co-occurrence information) increases, the processing amount of the word data becomes enormous and the processing time becomes longer. In addition, unless the second index is referred to, the dictionary data of each word cannot be referred to, which is inconvenient.

目的 本発明は、上述のごとき欠点を解決するためになされ
たもので、単語辞書を用いる仮名漢字変換処理におい
て、必要な辞書データを必要なときに高速に読み出すこ
とのできる辞書方式を実現する自然言語処理装置を提供
することを目的としてなされたものである。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-described drawbacks. In a kana-kanji conversion process using a word dictionary, a natural dictionary system capable of reading necessary dictionary data at a high speed when necessary is provided. It is intended to provide a language processing device.

構成 本発明は、上記目的を達成するために、単語の情報を
保持する単語辞書を用いて、仮名文字列を漢字仮名混じ
り文字列に変換する仮名漢字変換処理において、インデ
ックス中に各見出し毎に複数のポインタを設けた単語辞
書を有しており、該ポインタは入力制御処理を終えてか
ら出力処理の前までの複数の処理に対して、それぞれの
処理で最小限とする情報を保持しているエリアを示すポ
インタであって、前記複数の各処理がそれぞれに前記見
出しを検索し、各処理に対応するポインタに従って辞書
情報を読み出すことを特徴としたものである。以下、本
発明の実施例に基づいて説明する。
In order to achieve the above object, the present invention provides a kana-kanji conversion process for converting a kana character string into a character string mixed with kanji kana using a word dictionary that holds word information. It has a word dictionary provided with a plurality of pointers, and the pointer holds information to be minimized in each of a plurality of processes from the end of the input control process to before the output process. A pointer indicating an area in which each of the plurality of processes retrieves the heading, and reads dictionary information according to a pointer corresponding to each process. Hereinafter, a description will be given based on examples of the present invention.

第1図は、本発明による自然言語処理装置の一実施例
を説明するための構成図で、図中、1はキーボード、2
は入力制御部、3は構文解析部、4は意味解析部、5は
表記生成部、6は出力制御部、7はディスプレイ、8は
辞書である。
FIG. 1 is a configuration diagram for explaining an embodiment of a natural language processing apparatus according to the present invention, wherein 1 is a keyboard, 2
Is an input control unit, 3 is a syntax analysis unit, 4 is a semantic analysis unit, 5 is a notation generation unit, 6 is an output control unit, 7 is a display, and 8 is a dictionary.

第2図(a)〜(d)は、辞書見出し部を示す図であ
る。
2 (a) to 2 (d) are diagrams showing a dictionary entry part.

入力された読みに対して構文解析部3、意味解析部
4、表記生成部5のように3段階の処理を行ない、仮名
漢字混じり文を生成する仮名漢字変換処理の場合、第2
図に示すように、上記それぞれの段階における必要最小
限の情報を保持しているエリアを示すポインタを辞書見
出し部にそれぞれ保持する。構文解析部の処理では入力
された読みから辞書見出し部(8−1)を検索して対応
する見出しデータの構文解析用の情報を示すポインタ
(A)に従って単語辞書情報を読み出し解析を行う。意
味解析を行う時は、辞書見出し部(8−1)の中のポイ
ンタ(B)を参照して意味分類など必要最小限の情報を
読み出す。表記生成の時は、ポインタ(C)を参照す
る。
In the case of the kana-kanji conversion process for performing a three-stage process on the input reading like the syntactic analysis unit 3, the semantic analysis unit 4, and the notation generation unit 5 to generate a kana-kanji mixed sentence,
As shown in the figure, pointers indicating areas holding the minimum necessary information in each of the above stages are stored in the dictionary headings. In the processing of the parsing unit, the dictionary heading (8-1) is searched from the input reading, and the word dictionary information is read and analyzed in accordance with the pointer (A) indicating the parsing information of the corresponding heading data. When performing the semantic analysis, the necessary minimum information such as the semantic classification is read by referring to the pointer (B) in the dictionary heading (8-1). At the time of notation generation, the pointer (C) is referred to.

効果 以上の説明から明らかなように、本発明によると、単
語辞書の見出し部に、それぞれの処理に必要な辞書情報
を指すポインタを複数保持することにより見出し部を参
照するだけで、必要な情報を読み出すことができるの
で、一度に扱う情報量が少なくなり処理時間を大幅に短
縮することができる。
Advantages As is apparent from the above description, according to the present invention, by holding a plurality of pointers pointing to dictionary information necessary for each processing in the heading part of the word dictionary, the necessary information can be obtained simply by referring to the heading part. Can be read, so that the amount of information handled at a time is reduced, and the processing time can be greatly reduced.

【図面の簡単な説明】[Brief description of the drawings]

第1図は、本発明による自然言語処理装置の一実施例を
説明するための構成図、第2図(a)〜(d)は、辞書
見出し部を示す図である。 1……キーボード、2……入力制御部、3……構文解析
部、4……意味解析部、5……表記生成部、6……出力
制御部、7……ディスプレイ、8……辞書。
FIG. 1 is a configuration diagram for explaining an embodiment of a natural language processing device according to the present invention, and FIGS. 2 (a) to 2 (d) are diagrams showing a dictionary heading. DESCRIPTION OF SYMBOLS 1 ... Keyboard, 2 ... Input control part, 3 ... Syntax analysis part, 4 ... Semantic analysis part, 5 ... Notation generation part, 6 ... Output control part, 7 ... Display, 8 ... Dictionary.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 大呂 延幸 鳥取県鳥取市南隈342番地 リコー鳥取 技術開発株式会社内 (56)参考文献 特開 昭61−33569(JP,A) 特開 昭60−189571(JP,A) 特開 昭62−43769(JP,A) 特開 昭59−112328(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 17/20 - 17/26──────────────────────────────────────────────────続 き Continued on the front page (72) Inventor Nobuyuki Oro 342 Minamikuma, Tottori-shi, Tottori Prefecture Ricoh Tottori Technology Development Co., Ltd. (56) References JP-A-61-33569 (JP, A) JP-A-60- 189571 (JP, A) JP-A-64-23769 (JP, A) JP-A-59-112328 (JP, A) (58) Fields investigated (Int. Cl. 6 , DB name) G06F 17 / 20-17 / 26

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】単語の情報を保持する単語辞書を用いて、
仮名文字列を漢字仮名混じり文字列に変換する仮名漢字
変換処理において、インデックス中に各見出し毎に複数
のポインタを設けた単語辞書を有しており、該ポインタ
は入力制御処理を終えてから出力処理の前までの複数の
処理に対して、それぞれの処理で最小限とする情報を保
持しているエリアを示すポンイタであって、前記複数の
各処理がそれぞれに前記見出しを検索し、各処理に対応
するポインタに従って辞書情報を読み出すことを特徴と
する自然言語処理装置。
1. Using a word dictionary holding word information,
In the kana-kanji conversion process of converting a kana character string into a character string mixed with kanji and kana, the index has a word dictionary in which a plurality of pointers are provided for each heading in the index, and the pointer is output after the input control process is completed. A ponita indicating an area holding information to be minimized in each of a plurality of processes before the process, wherein each of the plurality of processes searches for the heading, A natural language processing apparatus for reading dictionary information in accordance with a pointer corresponding to a language.
JP1171471A 1989-07-03 1989-07-03 Natural language processor Expired - Fee Related JP2804297B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1171471A JP2804297B2 (en) 1989-07-03 1989-07-03 Natural language processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1171471A JP2804297B2 (en) 1989-07-03 1989-07-03 Natural language processor

Publications (2)

Publication Number Publication Date
JPH0336661A JPH0336661A (en) 1991-02-18
JP2804297B2 true JP2804297B2 (en) 1998-09-24

Family

ID=15923721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1171471A Expired - Fee Related JP2804297B2 (en) 1989-07-03 1989-07-03 Natural language processor

Country Status (1)

Country Link
JP (1) JP2804297B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59112328A (en) * 1982-12-20 1984-06-28 Fujitsu Ltd Processing method of "kana"-"kanji" conversion
JPS60189571A (en) * 1984-03-09 1985-09-27 Canon Inc Character processor
JPS6133569A (en) * 1984-07-26 1986-02-17 Ricoh Co Ltd "kana"/"kanji" converter
JPH0797369B2 (en) * 1985-08-21 1995-10-18 アルプス電気株式会社 Kana-Kanji conversion device

Also Published As

Publication number Publication date
JPH0336661A (en) 1991-02-18

Similar Documents

Publication Publication Date Title
JP3220560B2 (en) Machine translation equipment
JPH02165378A (en) Machine translation system
JPH0782498B2 (en) Machine translation system
EP1655674A2 (en) THIRD LANGUAGE TEXT GENERATING ALGORITHM BY MULTI−LINGUAL TEXT INPUTTING AND DEVICE AND PROGRAM THEREFOR
JP2804297B2 (en) Natural language processor
JP3300142B2 (en) Natural language processor
JP2719453B2 (en) Machine translation equipment
JP2715419B2 (en) Translation equipment
JP2817497B2 (en) Dictionary editing device
KR940022312A (en) Machine Translation Device and Method
JP2947554B2 (en) Machine translation equipment
JPS63163956A (en) Document preparation and correction supporting device
JPH05290030A (en) Word processor
JPS6160167A (en) Japanese word processor
JP3233283B2 (en) Japanese sentence analyzer
JPS62263568A (en) Word processor
JPH02110771A (en) Electronic translation device
JPH02140869A (en) Sentence structure analyzing method
JPH0785046A (en) Syntax analyzing method
JPH0869468A (en) Japanese word processing system
JPH01185766A (en) Kana/kanji conversion device
JPH061468B2 (en) Japanese sentence proofreading device
JPS6389975A (en) Language analyzer
JPS6315633B2 (en)
JPH0512332A (en) Translation processor

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees