JPH035875A - Electronic dictionary dealing with regular description and different description - Google Patents

Electronic dictionary dealing with regular description and different description

Info

Publication number
JPH035875A
JPH035875A JP1140036A JP14003689A JPH035875A JP H035875 A JPH035875 A JP H035875A JP 1140036 A JP1140036 A JP 1140036A JP 14003689 A JP14003689 A JP 14003689A JP H035875 A JPH035875 A JP H035875A
Authority
JP
Japan
Prior art keywords
notation
regular
link information
different
description
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1140036A
Other languages
Japanese (ja)
Inventor
Yuji Uchida
裕士 内田
Hisahiro Adachi
安達 久博
Akira Kumano
明 熊野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NIPPON DENSHIKA JISHO KENKYUSHO KK
Original Assignee
NIPPON DENSHIKA JISHO KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NIPPON DENSHIKA JISHO KENKYUSHO KK filed Critical NIPPON DENSHIKA JISHO KENKYUSHO KK
Priority to JP1140036A priority Critical patent/JPH035875A/en
Publication of JPH035875A publication Critical patent/JPH035875A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

PURPOSE:To realize the reduction of the capacity and the facilitation of the update and the expansion of the contents of an electronic dictionary by registering beforehand regular description link information and different description link information as coordinating them with a keyword number, and executing direct two-way reference between regular description and different description in the same language. CONSTITUTION:A keyword (regular description, different description, etc.) 3, the regular description link information 6 and the different description link information 7, etc., are registered beforehand in the electronic dictionary 1 as coordinating them with the keyword number 2. Then, the corresponding regular description or the corresponding different description is referred to in the same language by using the keyword number stored as these regular description link information 6 or different description link information 7. Thus, the capacity of the electronic dictionary 1 can be reduced, and simultaneously, the update and the expansion of the contents can be easily executed.

Description

【発明の詳細な説明】 (Ia要〕 自然言語処理用の電子化辞書において、正表記および異
表記がある見出し語について正表記リンク情報および異
表記リンク情報を設定して両者の関係をデータ構造上で
関連づけるようにしている。
Detailed Description of the Invention (Required Ia) In an electronic dictionary for natural language processing, for a headword that has a regular notation and a different notation, the regular notation link information and the different notation link information are set and the relationship between the two is established in a data structure. I'm trying to relate it above.

〔産業上の利用分野〕[Industrial application field]

本発明ば、正表記と異表記とを対応づける正表記・異表
記対応電子化辞書に関するものである。
The present invention relates to an electronic dictionary compatible with regular notations and different notations, which associates regular notations with different notations.

1つの単語の表記は1通りであるとは限られず、「ゆれ
」が存在する0例えば日本語のように、ひらがな、カタ
カナ、漢字などの多種類の文字で表記される言語は、こ
の「ゆれ」は特に多い。従って、文の解析時に「ゆれ」
に柔軟に対処でき、生成時に一般に「標準的」とされる
正表記を選択できるだけの情報を提供することが要望さ
れている。
One word is not necessarily written in one way, and there is a ``yure'' character.For example, languages such as Japanese, which are written in many types of characters such as hiragana, katakana, and kanji, use this ``yure'' character. ” is particularly common. Therefore, when parsing a sentence, there is a ``sway''.
There is a need to be able to deal with this flexibly and to provide enough information to select a generally "standard" orthographic notation at the time of generation.

〔従来の技術と発明が解決しようとする課題〕近年、自
然言語処理技術の発達に伴い、多くの種類の応用ソフト
ウェアが開発されている。ここで、ソフトウェアの中心
は、データを処理するプログラムと、データの基礎であ
る辞書つまり電子化辞書とである。ソフトウェアが対象
とする自然言語の範囲が拡大するに伴い、辞書の情報量
として大きなものが必要となる。ところが大規模になれ
ばなるほど、#書全体の譬を向上させることが困難にな
り、かつ変更・拡張に伴うメンテナンスが困難となる。
[Prior art and problems to be solved by the invention] In recent years, with the development of natural language processing technology, many types of application software have been developed. Here, the core of the software is a program that processes data and a dictionary that is the basis of the data, that is, an electronic dictionary. As the range of natural languages covered by software expands, a larger amount of dictionary information is required. However, the larger the scale, the more difficult it becomes to improve the parables of the entire book, and the more difficult it becomes to maintain it as it changes and expands.

目標の質・量を満足するためには、辞書の記述量を拡大
せざるを得ない、これに対して、メンテナンスを容易に
するためには、情報を整理しなければならないという問
題があった。
In order to meet the target quality and quantity, the amount of descriptions in the dictionary had to be expanded, but in order to make maintenance easier, the information had to be organized. .

例えば、表層上の語形の大きく異なる「クラブ」という
正表記と、「倶楽部」という異表記は、そのもつ意味は
全く同じでなく、「クラブ」の意味の方が大きい概念が
多い(例えば「ゴルフの道具」)、このため、従来は、
両者を全く別の見出し語として辞書中に収め、情報も別
々に記述を行っていた。
For example, the regular notation ``club'' and the variant ``club'', which have very different word forms on the surface, do not have exactly the same meaning, and there are many concepts in which ``club'' has a larger meaning (for example, ``golf''). ), therefore, conventionally,
The two were included in the dictionary as completely different headwords, and the information was also described separately.

本発明は、見出し語番号に対応づけて正表記リンク情報
および異表記リンク情報を予め登録し、これらによって
正表記および異表記を双方向に関連づけを持たせて互い
に参照し、文解析時に表記の「ゆれ」に柔軟に対処、文
生成時に一般に「標準的」とされる正表記の選択、静置
記述量の削減、および内容の更新・拡張の容易化を可能
にすることを目的としている。
According to the present invention, regular notation link information and variant notation link information are registered in advance in association with headword numbers, and by using these, regular notation and variant notation are bidirectionally associated and referred to each other, and the notation is changed during sentence analysis. The purpose of this method is to flexibly deal with fluctuations, select a generally ``standard'' orthography when generating sentences, reduce the amount of static description, and make it easier to update and expand content.

〔課題を解決する手段〕[Means to solve problems]

第1図を参照して課題を解決する手段を説明する。 Means for solving the problem will be explained with reference to FIG.

第1図において、電子化辞書1ば、見出し語番号2に対
応づけて見出し語(正表記、異表記など)3、正表記リ
ンク情報6、および異表記リンク情報7をなどを予め登
録した辞書である。
In FIG. 1, an electronic dictionary 1 is a dictionary in which headwords (regular notation, alternate notation, etc.) 3, regular notation link information 6, different notation link information 7, etc. are registered in advance in association with headword number 2. It is.

〔作用〕[Effect]

本発明は、第1図に示すように、見出し語番号2に対応
づけて見出し語(正表記、異表記など)3、正表記リン
ク情報6、および異表記リンク情報7などを電子化辞書
1に予め登録し、これら正表記リンク情報6あるいは異
表記リンク情報7として格納されている見出し語番号に
よって同一言語内で該当正表記あるいは異表記を参照し
得るようにしている。
As shown in FIG. 1, the present invention stores headwords (regular notation, different notation, etc.) 3, regular notation link information 6, different notation link information 7, etc. in an electronic dictionary 1 in association with headword number 2. The headword numbers stored as the regular notation link information 6 or the different notation link information 7 can be used to refer to the corresponding regular notation or different notation within the same language.

従って、見出し語番号2に対応づけて正表記リンク情報
6、および異表記リンク情報7を予め登録することによ
り、同一言語内で正表記と異表記の双方向の直接の参照
が可能となる。また、正表記および異表記が共通に持つ
辞書記述を異表記などで省略することにより、電子化辞
書1の容量を削減することが可能となると共に、内容の
更新・拡張を容易に行うことが可能となる。
Therefore, by registering the regular notation link information 6 and the variant notation link information 7 in advance in association with the headword number 2, it becomes possible to directly refer to the regular notation and the variant notation within the same language. In addition, by omitting the dictionary descriptions that both the regular notation and the different notation have in common by using different notation, etc., it is possible to reduce the capacity of the electronic dictionary 1, and it is possible to easily update and expand the contents. It becomes possible.

〔実施例〕〔Example〕

次に、第1図および第2図を用いて本発明の1実施例の
構成および動作を順次詳細に説明する。
Next, the configuration and operation of one embodiment of the present invention will be explained in detail using FIGS. 1 and 2.

第1図において、電子化辞書lは、見出し語番号2に対
応づけて見出し語(正表記、異表記など)3、文法情報
4、概念側情報5、正表記リンク情報6、異表記リンク
情t[!7などを予め登録する辞書である。
In FIG. 1, the electronic dictionary 1 includes a headword (regular notation, different notation, etc.) 3, grammar information 4, conceptual information 5, regular notation link information 6, different notation link information, in association with a headword number 2. t[! This is a dictionary in which words such as 7 are registered in advance.

見出し語番号2は、見出し語3の各々に重複することな
く付与した番号である。
Headword number 2 is a number assigned to each headword 3 without duplication.

見出し語3ば、日本語、英語などの単語、熟語句、文な
どを文字(漢字、カナ、アフファベント、数字など)に
よって表現したものである。
Headwords are expressions of Japanese, English, etc. words, phrases, sentences, etc. using characters (kanji, kana, affabendos, numbers, etc.).

文法情報4は、見出し語3の日本語などの文中における
振る舞いを、品詞、その他のコードで表現したものであ
る。
The grammatical information 4 expresses the behavior of the headword 3 in a sentence such as Japanese using parts of speech and other codes.

概念側情報5ば、見出し語3について、概念の区別を明
確に把握するために必要な情報を記述したものである0
例えば見出し語「クラブ」について、「団体」という概
念、「ゴルフの道具」という概念、「トランプのマーク
」という概念を把握するための記述である。
Concept-side information 5 describes the information necessary to clearly understand the distinction between concepts regarding headword 3.0
For example, for the headword "club," this is a description to understand the concept of "group,""golfequipment," and "card mark."

正表記リンク情報6は、見出し語3が異表記であり、こ
れに対応する正表記が同−辞書内に存在する場合、その
正表記の見出し語番号を記述するものである。
The regular notation link information 6 describes the entry word number of the regular notation when the headword 3 is a different notation and the corresponding regular notation exists in the same dictionary.

異表記リンク情報7ば、見出し語3が正表記であり、こ
れに対応する異表記が同−辞書内に存在する場合、その
異表記の見出し語番号を記述するものである。この異表
記リンク情報7には、複数個の異表記の見出し語番号を
記述することが可能である。
Variant spelling link information 7, if the headword 3 is a regular spelling and a corresponding variant spelling exists in the same dictionary, describes the headword number of the variant spelling. In this variant notation link information 7, it is possible to describe a plurality of headword numbers in different notations.

ここで、正表記と異表記とは、それぞれの正表記すンク
情l1i6および異表記リンク情報7に記述された見出
し語番号によって双方向にリンク関係が保持されている
。また、文法情fla4や概念側情報5について、正表
記と異表記とが共通に持つ情報については、正表記と異
なる情報のみ異表記の見出し語に記述し、それ以外の情
報の記述を省略する。これにより、異表記の見出し語の
辞書情報の記迷最を大幅に減少させ、電子化辞書1の全
体の記ttを削減し、コンパクトにすることができる。
Here, a bidirectional link relationship is maintained between the regular notation and the different notation by the headword numbers written in the regular notation link information l1i6 and the different notation link information 7. In addition, regarding the information that both the regular notation and the variant notation have in common regarding grammatical information fla 4 and conceptual side information 5, only the information that differs from the regular notation is written in the headword of the variant notation, and the description of other information is omitted. . As a result, it is possible to significantly reduce the number of entries in the dictionary information for headwords with different notations, and to reduce the overall number of entries in the electronic dictionary 1, thereby making it more compact.

省略した辞書情報は、正表記リンク情報6を辿って参照
する。
The omitted dictionary information is referred to by following the regular notation link information 6.

次に、第1図構成の動作を具体的に説明する。Next, the operation of the configuration shown in FIG. 1 will be specifically explained.

fl)  見出し語番号JO120の見出し語「倶楽部
」について第1図電子化辞書1を参照すると、異表記リ
ンク情報7が“0° (零)であって、当該見出し語が
異表記であることが判明し、更に正表記すンク情!11
Gとして見出し語番号“J0020”を取り出す。この
見出し語番号“JOO20”・を参照すると、見出し語
「クラブ」という正表記を得る。この「クラブ」という
正表記には、概念側情報5から、異表記として、「団体
」、「ゴルフの道具」、「トランプのマーク」という概
念があることが判明する。このうち、「団体」が見出し
語「倶楽部」に該当すると判明する。
fl) When referring to the electronic dictionary 1 in Figure 1 for the entry word "club" with entry word number JO120, the different spelling link information 7 is "0° (zero)," indicating that the entry word is in a different spelling. Information revealed and further corrected! 11
The headword number "J0020" is extracted as G. When this headword number "JOO20" is referred to, the regular notation of the headword "club" is obtained. From the concept information 5, it is revealed that the regular notation "club" has different notations such as "group,""golfequipment," and "card mark." Of these, it turns out that "group" corresponds to the headword "club."

(2)一方、見出し語番号JOO20の見出し語「クラ
ブ」について、第1図電子化辞書1を参照すると、正表
記リンク情報6が“0” (零)であって、当該見出し
語が正表記であることが判明する。この正表記の見出し
語「クラブ」には、概念側情報5を参照して3つの概念
があり、そのうちの1つの概念「団体」には、見出し語
番号Jot20に異表記があることが判明する。この見
出し語番号JO120には、異表記の見出し語「倶楽部
」があることが判明する。
(2) On the other hand, when referring to the electronic dictionary 1 in Figure 1 for the headword "club" with headword number JOO20, the regular notation link information 6 is "0" (zero), and the headword is in the right notation. It turns out that. Referring to the concept side information 5, it is found that the headword "club" in this regular notation has three concepts, and one of them, the concept "group", has a different notation in the headword number Jot20. . It turns out that this headword number JO120 has a different spelling of the headword "club."

以上のように、見出し語の正表記リンク情報6あるいは
異表記リンク情報7を辿って正表記の見出し語あるいは
異表記の見出し語を直接に双方向に参照することが可能
となる。
As described above, by following the regular notation link information 6 or the different notation link information 7 of the headword, it is possible to directly refer to the regular notation or the different notation of the headword in both directions.

第2図は、本発明に係わる電子化辞書のデータ構造例を
示す。図中に記載したように、第1図の見出し語番号2
、見出し語3、文法情r44、概念側情報5、正表記リ
ンク情報6、および異表記リンク情報7などを図示のよ
うに1つのレコードに予め登録するようにしている。こ
れらレコードを多数、連続して一次元的にメモリ上に展
開し、第1図電子化辞書1を構成するようにしている。
FIG. 2 shows an example of the data structure of the electronic dictionary according to the present invention. As stated in the figure, headword number 2 in Figure 1
, headword 3, grammatical information r44, concept side information 5, regular notation link information 6, variant notation link information 7, etc. are registered in advance in one record as shown in the figure. A large number of these records are successively and one-dimensionally developed on a memory to constitute the electronic dictionary 1 in FIG.

ここで、各項目は、先頭にデータ長、これに続く領域に
実際のデータを登録するようにしている。
Here, for each item, the data length is registered at the beginning, and the actual data is registered in the area following this.

〔発明の効果〕〔Effect of the invention〕

以上説明したように、本発明によれば、見出し語番号2
に対応づけて正表記リンク情報6、および異表記リンク
情報7を予め登録する構成を採用しているため、同一言
語内で正表記と異表記との関連づけを持たせて双方向の
参照を直接に行うことができる。また、正表記の見出し
語3および異表記の見出し語3が共通に持つ辞書記述を
異表記で省略して電子化辞書工の容量を削減することが
できると共に、内容の更新・拡張に際して1箇所で行え
ばよく、保守・管理を容易に行うことができる。
As explained above, according to the present invention, headword number 2
Since we have adopted a configuration in which regular notation link information 6 and variant notation link information 7 are registered in advance in association with can be done. In addition, it is possible to reduce the capacity of electronic dictionary engineers by omitting the common dictionary descriptions of the headword 3 in the regular notation and the headword 3 in the different notation by using the different notation. Maintenance and management can be easily performed.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の1実施例構成図、第2図は本発明の電
子化辞書のデータ構造例を示す。 図中、1は電子化辞書、2は見出し語番号、3は見出し
語、4は文法情報、5は概念側情報、6は正表記リンク
情報、7は異表記リンク情報を表す。
FIG. 1 shows a configuration diagram of an embodiment of the present invention, and FIG. 2 shows an example of the data structure of an electronic dictionary of the present invention. In the figure, 1 is an electronic dictionary, 2 is a headword number, 3 is a headword, 4 is grammatical information, 5 is conceptual side information, 6 is regular notation link information, and 7 is different notation link information.

Claims (1)

【特許請求の範囲】 正表記と異表記とを対応づける電子化辞書において、 見出し語番号(2)に対応づけて見出し語(正表記、異
表記など)(3)、正表記リンク情報(6)、および異
表記リンク情報(7)を予め登録し、 これら正表記リンク情報(6)あるいは異表記リンク情
報(7)として格納されている見出し語番号によって同
一言語内で該当正表記あるいは異表記を参照し得るよう
に構成したことを特徴とする正表記・異表記対応電子化
辞書。
[Claims] In an electronic dictionary that associates a regular notation and a different notation, a headword (regular notation, different notation, etc.) (3) and a right notation link information (6) are provided in association with a headword number (2). ), and the different spelling link information (7) are registered in advance, and the corresponding normal spelling or variant spelling within the same language is determined by the headword number stored as the regular spelling link information (6) or the variant spelling link information (7). An electronic dictionary compatible with regular notation and variant notation, characterized in that it is configured to be able to refer to.
JP1140036A 1989-06-01 1989-06-01 Electronic dictionary dealing with regular description and different description Pending JPH035875A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1140036A JPH035875A (en) 1989-06-01 1989-06-01 Electronic dictionary dealing with regular description and different description

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1140036A JPH035875A (en) 1989-06-01 1989-06-01 Electronic dictionary dealing with regular description and different description

Publications (1)

Publication Number Publication Date
JPH035875A true JPH035875A (en) 1991-01-11

Family

ID=15259469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1140036A Pending JPH035875A (en) 1989-06-01 1989-06-01 Electronic dictionary dealing with regular description and different description

Country Status (1)

Country Link
JP (1) JPH035875A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59197923A (en) * 1983-04-26 1984-11-09 Toshiba Corp Documentation device
JPS63261458A (en) * 1987-04-17 1988-10-28 Matsushita Electric Ind Co Ltd 'kana'/'kanji' converter

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59197923A (en) * 1983-04-26 1984-11-09 Toshiba Corp Documentation device
JPS63261458A (en) * 1987-04-17 1988-10-28 Matsushita Electric Ind Co Ltd 'kana'/'kanji' converter

Similar Documents

Publication Publication Date Title
Silberztein Formalizing natural languages: The NooJ approach
US4641264A (en) Method for automatic translation between natural languages
Nagata Robo-Sensei's NLP-based error detection and feedback generation
FI113096B (en) Integrated text production and translation system
US5895446A (en) Pattern-based translation method and system
US5384702A (en) Method for self-correction of grammar in machine translation
US5084817A (en) System for translating a language having polite expressions
van Heuven et al. Analysis and synthesis of speech: strategic research towards high-quality text-to-speech generation
KR20040086775A (en) System and method for word analysis
JPS58192173A (en) System for selecting word used in translation in machine translation
USRE35464E (en) Apparatus and method for translating sentences containing punctuation marks
Reifler The first conference on mechanical translation
JPH035875A (en) Electronic dictionary dealing with regular description and different description
Garside The large-scale production of syntactically analysed corpora
Voutilainen Engcg tagger, version 2
JPS6210763A (en) Kana to kanji conversion system
Gwei et al. A Flexible Synonym Interface with application examples in CAL and Help Environments
JPH0157829B2 (en)
Mahsut et al. Utilizing agglutinative features in japanese-uighur machine translation
JPH04313158A (en) Machine translation device
JPS60193074A (en) Analyzer of japanese language
Lee et al. Korean-English machine translation based on idiom recognition
JPS61208164A (en) Display system of proofreading device for japanese document
JPH0785040A (en) Inscription nonuniformity detecting method and kana/ kanji converting method
JP3386520B2 (en) Kana-kanji conversion apparatus and method