JPS5931101B2 - 電子辞書 - Google Patents

電子辞書

Info

Publication number
JPS5931101B2
JPS5931101B2 JP58004948A JP494883A JPS5931101B2 JP S5931101 B2 JPS5931101 B2 JP S5931101B2 JP 58004948 A JP58004948 A JP 58004948A JP 494883 A JP494883 A JP 494883A JP S5931101 B2 JPS5931101 B2 JP S5931101B2
Authority
JP
Japan
Prior art keywords
word
code
address
stored
spelling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58004948A
Other languages
English (en)
Other versions
JPS58144975A (ja
Inventor
秀雄 吉田
繁信 柳内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP58004948A priority Critical patent/JPS5931101B2/ja
Publication of JPS58144975A publication Critical patent/JPS58144975A/ja
Publication of JPS5931101B2 publication Critical patent/JPS5931101B2/ja
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 本発明は、第一言語の入力データに対応あるいは関係す
る第二言語のデータを出力する電子辞書のデータ記憶方
法に関し、更に詳述すると、単語、品詞、意味、変化、
熟語等の辞書の機能を持たせるのに必要なデータをコー
ド化してROMに記憶させマイクロコンピュータによつ
てデータ用ROMを制御することにより実現される電子
辞書のデータ記憶方法に関する。
辞書を構成するデータは、膨大なものであり、限られた
容量のROMにより多くの単語を入れるためにはデータ
の圧縮方法規格化、分類などのデータの扱い方が重要な
問題となる。
またデータの挿大による単語検索スピードの遅れなど種
々の問題が発生する。本発明は、このような問題を十分
に解決するものである。すなわち本発明の目的は、下記
に列挙する電子辞書のデータ記憶方法を提供することに
ある。(1)キー入力装置の入力操作等によりその入力
データに対応或いは関係するデータを検知する所謂電子
辞書に於いて、単語品詞意味変化熟語等のデータをコー
ド化し、各データを所定の区切コードを介して記憶する
記憶方法。
(2)単語を記憶する記憶エリアにその変形語(変化形
)を記憶しているアドレスを挿入し、変形語の記憶エリ
アに単語の原形を記憶しているアドレスを挿入する、記
憶方法。
(3)(2)に於いて第1の変化形と第2の変化形が同
一の場合共通化して記憶する記憶方法。
(4)単語スペルをアルファベット順に記憶し、一つ前
の単語と共通部分は所定のコードによつて単語スペルを
記憶する記憶方法。
(5)音節単位で組をつくり頻度の高いtionやin
g等の音節を一つのコードとして記憶する単語スペル記
憶方法。
(6)単語の意味(訳語)はアドレスとして記憶し、意
味の補足を必要とする場合、その補足の語を文字コード
として記憶する訳語記憶方法。
(7)単語(例えば、日本語)を文字順(例えば、50
音順)に記憶し、頭N(N−1、2、・・・・・)文字
(例えば、頭2文字)を共通とする単語を1プロツクと
し、各々の単語には上記頭N文字を挿入しないことを特
徴とする単語記憶方法。
(8)単語スペルを所定のコードとし文字コードと共に
熟語を記憶する熟語の記憶方法。
まずはじめに、本発明によるデータの圧縮、規格化、及
び分類の手法を説明する。
(単語の規格化および記憶方法) 辞書として一単語を構成する要素としては、単語のスペ
ル、品詞、意味、発音記号、変化、熟語のスペル、熟語
の意味を採用する。
それぞれのデータは、後に説明する方法によつてコード
化され第1図アに示すように規格化された状態でROM
に格納されている。ROMの1データ(一つのアドレス
に記憶できる情報)を8ビツトとしたときは256種類
のキヤラクタ一(一つの文字や記号を示すもの)を作る
ことが可能となる。本発明ではビツト数には関係なく構
成できるものであるが、8ビツト構成法によつて説明を
行う。表1に各キャラクタ一のコード割り当てを示す。
これによつて、各コードとキヤラクタ一は1対1に対応
しており、ROMに記憶されたコードをデコードするO
ことにより、単語に関する情報をアルフアベツト、カタ
カナなどの文字に表わすことが可能となる。また一部コ
ードを特別なコントロールコードとすることによりデコ
ード時の繁雑さを容易にするものである。第1図アに示
す図を説明すると、1の単語スペルは後に述べる圧縮方
法によつて圧縮された単語のスペルが入つている。
2は1バイト(8bit)でもつて品詞が記憶されてい
る。
例えばpron.(代名詞)は(01000111)の
コードでもつて記憶でき、このコードがROMから読み
出されたときはその単語の品詞が代名詞であることが判
別できる。それを表示するさいにはそのコードからPr
On.の文字を作成すればPrOn.の文字をそのまま
コード化して記憶する場合に比べ4キヤラ容量が減るこ
とになる。3には、その単語の意味(訳語)が記憶され
ている位置を示すアドレスが2バイトでもつて示される
従つて単語の意味を表示する場合は品詞コードの直後に
ある2バイトコードで示されるアドレスを指定し、その
位置に記憶されたカタカナを示すコードを後に説明する
方法にもとづいてデコードすることにより意味を表わす
文字が生成できる。4には発音記号を示すコードが人つ
ており5の位置に記憶されたコードが発音記号を表わす
ことを示す。
この場合も2文字がペアとして表わされる発音記号(A
u.tsなど)を1コード示すことによつて、ROM容
量を減らす工夫が成されている。6には変化コードが記
憶されておりその直後の7に記憶されたコードがその単
語の変化した形のスペルが記憶された位置をさすアドレ
スであることを示している。
この変化コードには第1図力,キに示すCl,C2の2
種類が有り、C1のときは過去、過去分詞のスペルが同
一の場合でありスペルが記憶された場所を示すアドレス
コードは一つ即ち2バイトでよい。C2のときは過去、
過去分詞のスペルが異なる場合で、それぞれのスペルが
記憶されたアドレスを指定する必要があるため、C2コ
ードの直後にある4バイトのうち前の2バイトが過去形
のスペルが記憶されたアドレスを示し後の2バイトが過
去分詞形のスペルが記憶されたアドレスを示す。8には
熟語コードが記憶されており9に記憶されたァルフアベ
ットコードが熟語を形成することを示す。
10にはその熟語の意味が、カタカナを表わすコードで
もつて記憶されている。
9と10の区切はアルフアベツトを示すコードかカタカ
ナを示すコードかによつて行ない特別の区切りのコード
を設ける必要がない。
9に記憶されている熟語スペルは*コードとアルフアベ
ツトコードにより構成し、*コード検索位置に1で検索
した単語スペルを挿入する。
これによつてデータ容量を減らすことが出来る。1の単
語スペルが不規則動詞の過去形又は過去分詞形のときは
2,3の位置が第1図のイ,ウ,工のいずれかの形をと
る。
この場合2の位置に品詞コードにかわつてP.(1のス
ペノルが過去形を示す)PP.(1のスペルが過去分詞
形を示す)WP.(1のスペルが過去・過去分詞形を示
す)のコードが記憶されており、3にはこの動詞の原形
が記憶されているアドレスが入つている。
(このとき動詞の原形は1の位置に記憶されている)検
索時にこの3つのコードのうちのいずれかを検出した場
合はその単語の原形とともに過去・過去分詞の区別の表
示を行なう。この方法によつて単語の原形が1に有るス
ペルを利用できるため、容量圧縮が可能となる。次に単
語の意味を示す場合、3で指定されたアドレスに記憶さ
れた意味だけでは十分ではなく、意味を補足する必要が
ある場合は、オに示すようにアドレスコードの後に1コ
ードを付けその後に補足する意味を並べる。
こうすることによつて意味の充実をはかるとともに和英
検索用に50音順に記憶された意味を利用することが可
能となる。単語の意味の記憶方法を第2図に示す。21
は意味でカタカナと1対1に対応づけられたコードによ
つて記憶する。
23にはその意味に相当する単語のスペルが記憶された
位置を示すアドレスを2バイトで記憶する。
以上のように単語のスペルと意味を切り離し違つたRO
Mエリアに記憶し単語はアルフアベツト順に、意味は5
0音順に並べそれぞれをアドレスコードによつて結ぶこ
とにより英和、和英の両検索機能を十分短かい時間内に
実現可能となる。(単語スペルおよび意味の圧縮記憶法
) (a)単語スペルの圧縮方法としては表2の例に示すよ
うな方法をとる。
表2は単語のスペルの見出しが“S゛の文字で始まるも
ので2番目のスペルが“a゛のものを示している。゛S
a”の見出しで最初に現われる文字(この場合はSac
rifice)は表1のキヤラクタ一表に示すコードに
変換してそのまま記憶する(この場合、9バイトとなる
)。
次に現われる単語のスペルを記憶するに際しては、ひと
つ前に記憶している単語のスペルと比較し、スペルの書
き出しから何語が一致しているかを較べ、一致している
語を$nコードに置きかえる。($nコードのnは一致
する語数を示す。)$nコードに置きかえることのでき
ない語は、アルフアベツトでもつて記憶する。表2の“
Sad”の場合一つ前の単語が“Sacrifice゛
でありSaの2文字が一致している。よつて“Sad゛
という単語は$2dという2バイトの形で記憶する。こ
うすることにより“Sad″と記憶する場合には3バイ
ト必要であるが“$2d″と記憶すると2バイトで済む
ことになる。次に現われる“゜sad1y゛においては
Sadの3文字が一致しており$31yの3バイトでも
つて置き換えることが可能である。このようにすること
によつて単語をそのままの形で記憶する必要があるのは
単語の頭2文字による分類の最初に限られる単語だけで
よい。これを除くすべての単語に対しては、上記方法に
よる圧縮が可能である。この方法によつて圧縮されたデ
ータからの英和、和英の検索の具体的方法は後に説明す
る。b)音節単位で組を作りそれを1コードと考えて容
量の圧縮をはかる。
例えば“InstructiOnlと゜“PrOduc
tiOn”の単語を比べた場合“TiOn”という音節
は共用されている。これ以外の単語においても“TiO
n” という音節がひんぱんに使用されていることから
“TiOn″ を1つのコードに交換して記憶すること
によつて容量が圧縮される。このように゜゜ti0n”
“Ing”などのひんぱんに使用される音節を1つのコ
ードとして扱う。逆に和英検索時このようなコードを検
出した場合“TiOnl“Ing” などの文字にデコ
ードすることによつて単語のスペルが生成できる。c)
単語の意味の圧縮方法 単語の意味は50音順に並べ第2図のごとく規格化した
状態で記憶する。
第2図21には、意味を記憶し22には21の意味と2
3のアドレスを区別するためと、23のアドレスコード
の長さ(数)を示すことを兼用するためのコードを入れ
る。23にはその意味が示す単語のスペルが記憶されて
いるアドレスが入つている。
アドレスは2バイトで1つのアドレスを生成している。
1つの意味で複数個の単語が存在するときは2のコード
でその長さを指定し3のアドレスコードを追加する。
例えば1の意味が“クモ”のとき、この意味に相当する
単語には゜“ClOud゛と“Spider″″の2つ
がある。
“ClOud“と“Spider“のスペルはそれぞれ
異なつたアドレスに記憶されているため3のアドレスは
2種類必要となりデータとしては4バイトとなる。(第
14,15図参照)2のコードは表1のなかの¥2を記
憶し次にくるアドレスが2種類であることを示す。ここ
で意味の具体例を第3図A,Bに示す。今Aに示す4つ
の意味を記憶するとBの形式でもつて実現する。意味は
頭の2文字を共通なものを1プロツクと考え、その共通
語はBのα,β位置でひとまとめにして記憶する。Bの
先頭の閃はAの゜゜アイデの共通語を除いた後のテを記
憶する。¥2によつて゜“アイテ8の意味に相当する単
語が″COmpaniOn8と″Partner8の2
語あることを示しておりその後のアドレス1でもつて前
者のスペルが記憶されているアドレス、アドレス2でも
つて後者のスペルが記憶されているアドレスを示してい
る。次にある田(イ)閃はAの“アイマイナ゛より共通
語を除いたものである。E1コードは共通語アイはこの
意味で最後であることと゜゜アイマィナ8の単語が一種
類であることを示している。E1コードの後の2バイト
でもつて“アイマイナ”に相当する単語のスペルが記憶
されているアドレスを示し、次のα位置のアイはこの1
プロツクがアイのプロツクであることを示す。こうする
ことによつて意味の頭の2文字を圧縮でき容量を減らす
ことが可能となる。検索の具体的方法は後節で説明する
。(検索手法) (a)単語のスペルをアルフアベツトキ一で入力しその
単語の意味などを調べるときの検索方法について説明す
る。
ROMに記憶されている単語はアルフアベツト順に並べ
られ前に説明したような規格を行なつた後順次記憶され
ている。
全ての単語は頭の文字がアルフアベツト(A−Z)のい
ずれであるかによつて大きく分類される。さらに2番目
の文字をも考慮して分類すれば676のプロツクに分類
できる。(ここでは頭2文字によつて分類する場合の検
索を説明するが、必ずしも2文字でなくともよく3文字
でも4文字でも分類できる。)まず入力された単語の先
頭の文字によつて、スペル、意味などが記憶されたRO
Mのアドレスの上位8ビツトを決定する。ここではaに
は(00000000)bには(00000001)・
・・・・・・・・zには(00011001)のコード
を割り当て、それをアドレス上位8ビツトに入れる。
次に2番目の文字によつてアドレス下位8ビツトを決定
するわけであるがそれは次のようにすることにより実現
できる。2番目にくる文字のコードをアドレス上位桁を
決定したときと同様にして発生させそれを2倍しその下
位6ビツトをアドレス下位8ビツトに入れる。
こうすることによつて頭2文字によつて676個のアド
レスエリアが決定される。この方法によつて指定される
アドレスエリアを示したものが表3である。例えば入力
した単語の最初の文字が゛゜S”゜のとき、ROMアド
レスの上位8ビツトには(00010010)が入る。
2番目の文字が゜“a″のときROMアドレスの下位6
ビツトには(000000)が入る。
したがつて頭2文字によつて表3に示すROMエリアの
(イ)の部分が選択される。この選択されたROMエリ
アと次のアドレスの(口)のエリアに“Sa゛の文字で
始まる単語プロツクの最初のスペルが記憶されているア
ドレスコードを収納しておく。この場合には表2に示す
゜゜sacrifici゛という単語がSaのプロツク
の最初のスペルであるから、表3(イ)(口)にはこの
“゜sacrifice′″の単語スペルの“C”の文
字が記憶されているアドレスコードが格納されている。
このようにしてプロツクの先頭のアドレスを指定するこ
とにより、大量の単語の中から一つの単語を簡単にかつ
迅速に検索出来るようになる。/ 次に、単語のスペルをキー入力してその意味変化形、熟
語などの検索方法を第4図に示すフロー図とともに説明
する。
まず調べたい単語のスペルをアルフアベツトキ一で入力
する。入力されたアルフアベツトを表1に示すアルフア
ベツトコードに変換して先頭文字から順番にXレジスタ
ーの1桁目から順次入れる。Xレジスターとはコントロ
ール用LSIに内蔵されたRAMを利用した、入力単語
一時記憶領域のことである。
入力した単語の意味または変化などを調べるキーを操作
すると、Xレジスターの1桁目2桁目に入つている文字
コードより、上記で説明したように表3に示すROMエ
リアの特定アドレスを指定し、そこに格納されたアドレ
スコードでもつてXレジスターの1、2桁目ではじまる
単語のプロツクの最初の単語スペルの頭から3番目の文
字が記憶されたROM位置が指定される。これ以後は第
4図のフロー図を利用して説明する。ROMアドレスが
指定されると、第4図の英→和の入口に飛び込む。41
においてはXレジスターの3桁目を指定する。
これはxレジスターの1桁目、2桁目で選択されるプロ
ツクのスペル検索を行うのであるから、41の状態では
、1桁目、2桁目の単語のスペルは明らかに一致してい
るためで、次には3桁目が一致しているかを見くらべる
ためである。42であられれるJはXレジスターにある
単語スペルとデータ用ROMに記憶された単語スペルが
頭から何語一致したかをカウントするためのカウンター
である。
42の状態ではXレジスターの1桁目、2桁目がROM
に記憶されたスペルと一致しているのでJを2とする。
43において、Xレジスターの指定された桁にあるコー
ドとデータROMの現在指定されているアドレスに記憶
されたアルフアベツトコードを比較する。
両者が一致していれば44に進み単語の先頭からの一致
している語数を1つ増えたわけであるから、Jに1を加
える。45でもつて、Xレジスターの指定桁を+1し次
の文字を指定し、46でもつてデータ用ROMアドレス
を+1し、それぞれ次の文字が格納されたエリアを指定
する。
47ではXレジスターのデータ有無を判断する。
データが有れば43にもどつてさらにXレジスターとR
OMとの一致を見にいく。データがなければ48に進み
現在指定しているROMアドレスにあるデータが品詞コ
ードであるか判断する。品詞コードであれば、単語スペ
ルは終了したことになり、Xレジスターの単語とこのR
OM位置にある単語スペルが一致したことになる。よつ
て入力した単語に関する種々のデータがこのアドレス以
後に記憶されていることが明確になる。48において品
詞コードでなければROMの単語スペルはまだ続いてい
ることにより、入力した単語が、ROMにはないことを
示す。
43でXレジスターとROMのデータが異なる場合は、
ROMアドレスを歩進して次に現われる単語スペルとの
一致を比較し、Xレジスターの単語に関する情報が記憶
されたROMアドレスを探す必要がある。
ROMデータは、第1図アに示すような形式で記憶され
ており1の単語スペルが完全に一致しないときは2〜1
0のデータを飛ばし11の単語スペルを選択する必要が
ある。第4図49において、第1図2の品詞を指定でき
たかを判断し、品詞を指定できるやでROMアドレスを
歩進する。品詞コードの後の2バイトはアドレスコード
であるから、第4図50においてROMアドレスを2番
地歩進する。51においてROMアドレスを1歩進し、
52において変化1コードを判断する。
この変化1コードの後の2バイトはアドーレスコードで
あるため50にもどつてROMアドレスを2歩進する。
53において変化2コードC2を判断する。
第1図キに示すように変化2コードの後の4バイトはア
ドレスコードであるため、第4図54においてROMア
ドレスを2歩進し50にもどつてROMアドレスを2歩
進し全体でROMアドレスを4歩進する。
55において$コードを判断する。
$コードは表2に示すように、単語スペルの先頭を示す
とともに、前に記憶されている単語との共通する文字数
を示している。単語の頭2文字によつて分類されるプロ
ツクの最初に現われる単語はすべてアルフアベツトコー
ドで構成されていて$コードは使用されていない。第4
図56で品詞コードが判断されると、次のプロツクの単
語へ移つたこととなり、入力した単語がROMにないこ
とを示す。品詞コードが判断されないときは51にもど
つて単語スペルの先頭を見つける動作を繰り返す。55
で$コードを判断し単語スペルの先頭を見つけると57
に進みJの値と$コードを比較する。
両者の値が等しいときは新しく一致をみようとする単語
スペルのうち$コードにおきかえられているスペルとX
レジスターのスペルが一致していることになる。よつて
43に戻つて単語の残るスペルの一致をみにいく。Jと
$コードが一致していないときは59に進み$コードと
Jとの大きさを比較する。$コードが大きいときは、X
レジスターの単語1Cのうちそれまでに一致している語
数よりも、共通化した語数が多いことになり、入力した
単語がROMにないことを示す。$コードがJよりも大
きいときはそのスペルはXレジスターのスペルとは一致
しないことになるので、49にも1△どつて次の単語ス
ペルの先頭を検出しにいく。こうして第4図のフローを
通過すると、調べようとする単語に関するデータが記憶
されたROMエリアが検索できたことになる。
入力した単語の意味を検索するキーを操作したときは2
C第4図のフローを通過後第1図2の品詞コードの後の
2バイトをLSIに取り入れそのコードでもつてROM
アドレスを指定し、そのエリアに記憶された意味を表わ
すコードを取り人れて意味を表わす文字にデコードして
表示する。また23第4図のフローを通過後第1図アの
6,8の変化コード、熟語コードを検出し、それぞれの
コードがある場合は変化および熟語が存在することを示
す表示シンボルを点灯する。これによつて入力した単語
に変化形や熟語が存在すること3Cが判断できる。変化
形や熟語が存在する単語についてはそれぞれを調べるキ
ーを操作する。変化コードの後の2バイトでアドレスを
指定しそのエリアのスペルコードを取り入れ変化形の単
語を表示する。熟語の場合は熟語コードの後のス 3ペ
ルコードから熟語を生成し、その後の意味コードより熟
語の意味を生成する。発音記号の場合もキーを操作され
た時点で発音コードを検出しその後のコードによつて、
発音記号を生成し表示することにより実現可能となる。
4(b)日本語の意味をカタカナ(ひらがな
でも同様に扱える)キーで入力しその意味に相当する単
語のスペルを検索する方法を説明する。日本語の意味は
50音順に第3図で示す方法でROMに記憶されている
。まず意味がカタカナキ一によつて入力されると、それ
ぞれの文字は表1に示すカタカナに相当するコードに変
換されてXレジスターに人る。Xレジスターの1桁目(
単語の先頭の文字に相当する)によつて、その文字で分
類されるプロツクの先頭のアドレスを指定する。すなわ
ち1桁目の文字を50音で分類したプロツクの先頭を指
定する。Xレジスターの意味コードと指定された ROMエリアのコードとを1バイトずつ比較する。
一致しているときは入力された意味に割り当てられたR
OMエリアが検出できたわけであり一致していないとき
は、アドレスをアツプしていき一致するエリアを探す。
一致するエリアを見つけると次に、第3図Bに示すよう
に¥コード、Eコードの後のアドレスコードを、LSI
に取り入れる。
それから第5図に示すフローの入口に飛び込む。60に
おいてLSIVC取り入れたアドレスコードでもつてデ
ータROMのアドレスを指定する(単語スペルの終り1
文字)。
61kあるnは表2に示す$コードに記憶された一致語
数を記憶するカウンターである。
第5図61の状態では$コードは検出されていないので
nはクリアしておく。62において単語スペルを構成す
る文字データをLSIのスペル生成用レジスターに取り
入れる。
63でROMアドレスを1番地逆進し、次の文字コード
が記憶されたエリアを指定する。
64において$コードを判断する。
$コードが検出されると$コードに置きかえられている
文字を生成する必要があるため一つ前に記憶されている
単語スペルから必要とする文字データを取り入れていく
。67において$コードの数をnに入れる。
これによつて、あと何語を文字コードに置き換える必要
があるかを記憶する。68,69,70で一つ前の単語
スペルが記憶されているエリアを検索している。
単語は頭2文字によつて分類されるプロツクを構成して
ROMに記憶されている。プロツクの先頭の単語スペル
は$コードを使用せずすべてアルフアベツトコードで記
憶されている。そしてこの先頭のスペルの最初の文字は
大文字のアルフアベツトコードで記憶されており、これ
によつてプロツクとプロックの区分が可能となる。70
で大文字が判断されると、その位置が今生成しようとす
る単語が存するプロツクの境界であることが判断できる
よつて71においてまだスペルコードとしてLSIに取
り入れられていないデータ数だけROMアドレスを進め
62にもどつてスペルデータを取り入れる。69におい
て$コードが判断されると72において$コードの数と
nの数とを比較する。
$コードがnよりも大きいときは、現在選択している単
語スペルにはLSIに取り入れるべきスペルデータがな
いことになり68にもどつて次の単語へと進む。
スペルデータを取り入れる必要があるときは、73に進
み取り入れる必要がある数だけROMアドレスを進め、
62においてデータを取り入れていく。65において大
文字が検出されなければ62にもどつてデータを取り入
れる動作を繰り返し大文字が検出されると、65におい
てそのデータを取り入れてスペル作成が完了することに
なる。
こうやつて取り入れた単語スペルコードをデコードして
アルフアベツトとして表示することによつて、カタカナ
キ一によつて入力した日本語の意味に相当する単語が検
索できる。(本発明方法を実施する装置) 次に以上述べた様に圧縮されたデータを使用し、具体的
に英和或は和英辞書として使用する場合の基本的な装置
の例を説明する。
第6図に本発明方法を実施する装置の回路プロツク図を
示す。
図において、Kはキー入力装置、KEはキーエンコーダ
、ICはXの入力ゲート、COは入力語数カウンタ、C
は0Cの指定文字カウンタ、JZはCf)O検出器、X
は入力単語レジスタ、0CはXの出力制御回路、TBは
2倍回路、GAlはAMの入力ゲート、AMlはAMの
上位8ビツト、AM2はAMの下位6ビツト、ASはA
Mの加減算機、AMDはMUのアドレスデコーダ、MU
は単語データ記憶部、0BはMUの出力バツフア、DC
はデコーダ、GOは0B.DCの出力切換ゲート、DS
Cは表示制御回路、DSPは表示体、GWはWAの入力
ゲート、WAは単語アドレスレジスタ、WAlはWAの
上位8ビツトWA2はWAの下位6ビツト、GA2はW
Aの出力ゲート、AMはMUのアドレスレジスタ、AM
Bはアドレスバツフアレジスタ、GA3はAMBの出力
ゲート、GJはJDl及びJCの入力切換ゲート、JD
はX内の文字コードとGOの出力の一致検出器、JCは
IDより出力されるコードとGD出力の一致検出器、R
Oは命令語記憶部、ARDはROのアドレスデコーダ、
ARはROのアドレスレジスタ、GRはARの入力ゲー
ト、ACはARの加算器、ISは命令語選択回路、ID
は命令語解読器、FCはフリツプフロツプ、$Ml,$
M2は$コード記憶レジスタ、$Jは$Ml,$M2の
大小比較器、$Sは$M1と$M2との減算回路、SD
は$Sの減算回路、G$1,G$2は$Ml,$M2の
入力ゲート、GM2は$M2の出力ゲートである。全体
としての動作は、命令語記憶部ROは数種の命令語が所
定の順序に記憶しているものであり、キー入力装置によ
りレジスタXに入力したデータと、単語データ記憶部M
Uに予め記憶している単語ヂータとの一致検出を行い、
所望のデータを表示体DSPに表示する。
第7図に、第6図の装置を用いて第4図の英和検索を行
う場合のフローチヤートを示す。
図において○印の中の数字は第6図の装置におけるマイ
クロオーダを示す。和訳キーを押圧すれば、Nl,n2
をYesVc進みN3で指定文字カウンタCに1を入力
し、0CがX内に記憶されている先頭の文字を指定する
ことによりN4で先頭の文字コードX1をGAlを介し
てAMlへ転送する。
N5でCの内容を“2゛とすることにより、0CはX内
の2文字目を指定する。N6で2文字目の文字コードX
2はTBにより2倍(1bit左シフト)されGAlを
介してAM2へ転送される。これによりMUはAMに入
力されたアドレスが指定されその内容を0Bに出力する
。0Bに出力されるデータは8bitであり、N7で0
Bの内容がそのままGOとGWを介してWA,へ転送す
る。
N8,n9で次のアドレスの内容をWA2へ転送する。
NlO′(−WAに取り出された単語の先頭アドレスを
AMへ送り、そのアドレスの内容を0Bに出力する。例
えばレジスタXに入力されている単語が「Safe」で
あればWAに一時記憶されるアドレスは第2表のSac
rificeの3文字目の″C″の位置である。
NllでCに1を加算し、Nl2でXの3文字目の「f
」をJDへ送り、Nl3で0Bの内容即ち「C」をJD
へ送り、JDで一致検出を行う。この場合不一致である
が一致しているとすればNl5で更に4文字目を指定し
同様にN,6で単語データ記憶部内の文字も次の文字の
アドレスを指定するNl7でCとCOの比較を行う。C
OはXに入力された文字数をカウントするカウンタであ
りNl7では現在検索している文字が、Xに入力された
文字の最後の文字であるのかどうかの判別を行う。最後
の文字でなければN,2へ戻りNl5,nl6で指定し
た文字の一致検出を行う。これを繰返し途中で一致しな
い文字があれば、Nl4をNOに進む。最後まで一致す
ればN,8→N,,→N2Oでそのアドレスが品詞コー
ドHcであればXレジスタに入力した単語に相当するM
Uのアドレスを検出したことになる。一致検出の途中で
スペルが一致しなければNl4からN2lへ進む0n2
1→N22→N23→N24→N2l→・・・・・・・
・・の繰返しによつて品詞コードを検出するまでMUの
アドレスをアツプし、品詞コードが0Bに出力されれば
N25,n26でアドレスは二つアツプしN27で品詞
コードの後ろの訳語アドレスがアドレス指定される。(
第1図ア参照)N28→N29→N3Oは0Bに出力さ
れたデータがC1コード(第1図力)であるがどうかの
検出であり、C1コードがあればN25→N26でアド
レスを二つアツプする。またN3l→N32→N33で
C2コードが検出されればN34→N35→N25→N
26でアドレスを4つアツプする。N36→N37→N
38は$コードを検出するものであり、$コードであれ
ばN42→N43→N44へ進み$コードの番号(大き
さ)と文字の指定位置Cとの一致を検出する。第8図は
第6図のキー入力装置Kより入力されたスペルと、MU
に記憶されているスペルが一致した後その単語の訳語(
意味)と品詞を表示するための手順を表したものである
先ず80で品詞コードをデコードして表示制御回路へ出
力し、81で訳語アドレスの記憶アドレス(第1図アの
3)を待避した後訳語アドレスを指定し第1図アの1の
単語に対応する訳語を指定する訳語として例えば「アイ
マイナ」であれば第3図2の“マ”の位置を指定するこ
とになる。
そしてその文字を表示制御回路へ出力し、84でROM
アドレス1歩進を行い“イ゛を指定する。85,86,
98,99は訳語の文字データが終了したかどうかの検
出であり、E1コードを検出すれば88でROMアドレ
スを2歩進し、E2コードであれば87,88でROM
アドレスを4歩進する。
またY1であればE1の場合と同様後ろの2バイトは単
語スペルのアドレスであるため、100でROMアドレ
スを2歩進し、¥2であれば後ろの4バイトは単語スペ
ルのアドレスであるため100,101でROMアドレ
スを4歩進する。E1又はE2コードを検出した時は後
ろの89で訳語の先頭2文字「アイ」を表示制御回路へ
出力する。以上でキーより入力した単語に対応する訳語
を表示することができる。92以降は更に付加的な説明
を表示するためのものであり、90で訳語アドレスを記
憶しているROMのアドレス(の2バイト目)を指定し
その次のアドレスに4コードが挿入されているかどうか
を判別し、挿入されていれば1コード以降の文字コード
を表示制御回路へ出力する。
そして95で発音コード(第1図アの4)或は変化コー
ド(第1図アの6)等を検出すればそのコードをデコー
ドした後表示制御回路へ出力する。95のCCは第1図
アの4,6,8等のコードを意味し、例えば発音記号の
データはなく訳語アドレスの後付加説明の文字コードの
後にすぐ変化コードを記憶している場合は第8図95で
変化コードを検出することとなる。
また付加説明の文字コードの後すぐ次の単語スペルを記
憶している場合は第8図96をYesに進み訳語の検索
を終了する。第9図は第8図の動作を第6図のプロツク
により実現するためのフローチヤートであり、第8図を
更に詳細に表したものである。
n1→N2は第8図の80に対応し、品詞コードをDC
でデコードし、デコードした信号Dcを表示制御回路へ
出力する。
N3→N4→N5→N6→N7は第8図81に対応し訳
語アドレスの記憶アドレス2バイト目をレジスタAMB
に待避する。N8で訳語アドレスを指定し、N9で訳語
(1文字)を表示制御回路へ出力する。Nll→N,2
→Nl3は第8図85に対応し、Nl4→Nl5→Nl
6は86に、また、N,7→N,8→Nl9は98に、
N2O→N2l→N22は99に夫々対応する。N23
n24→N25n26n27は100→101に対応し
、N28n29→N3On3ln32は87→88に対
応する。N33→n34nn35は89に、N36は9
0に対応し、以降対応するものはN388n39tn4
Oが92に、N4lが93に、N42が94に、N43
→N44→N4.が95に、N46n47が96に、N
48n49が97に夫々対応する。第10図はキーより
入力された日本語に対応する英語の単語で表示する所謂
和英辞書として使用する場合等、英単語のアドレスを記
憶するアドレスを検索するためのフローチヤートである
111でXレジスタに入力された先頭2文字により11
2でその2文字で始まる単語の先頭のアドレスを決定す
る。
例えば[アイマイナ」と入力した場合第3図2の“テ”
を指定する。113でXレジスタ3文字目を指定し、1
14でXレジスタの文字とROMの文字(1文字)を比
較し、114→115→116→117→114→・・
・・・・・・・を繰返すことによりXレジスタ内の単語
を3文字目から順々に一致検出を行い、総て一致し、入
力データの最後の文字まで一致すれば118,119へ
進み、¥コード又はEコードであれば所望の単語を検出
できたことになる。
また、入力データが終了しても、ROMにはまだ文字が
つづいておれば、入力した単語はROM内に記憶してい
ないことになり、検索不可となる。入力データの最後ま
で一致せず途中文字が一致しなければ120へ進みRO
M内の次の単語との一致検出を始める。
しかし120でEコードを検出すれば入力した単語はR
OM内に記憶していないことになり、検索不可となる。
また¥1コードであればその後3バイト目から次の単語
が始まつているため124,125でROMアドレスを
3歩進し113へ戻り再び3文字目から一致検出を行う
。¥コードを検出すればその後5バイト目から次の単語
が始まつているため123,124,125でROMア
ドレスを5歩進し113へ戻る。また¥1でも¥2でも
なければ116でROMアドレスを1歩進し120へ戻
り、次の単語の先頭(現実には3文字目)の検出を行う
。第11図は、第6図の装置を用いて第10図の方法を
実現するためのフローチヤートであり、第10図を更に
詳細に表したものである。
N,→N2→N3→N4は第10図111に、N5は1
13に、N6→N7→N8は114に対応し、N9は1
15Vc.n10は116に夫々対応する。
NllはXレジスタに入力した文字数を記憶するC0と
現在指定している文字の位置を記憶するCとの比較であ
り、C>COとなれば入力データの総ての文字の一致を
検出したことになりNl2へ進む0n12のn13検n
14こn15りn16へn17は第10図118に、N
l81nl91n2OOn2l→N22→N23は11
9に対応する。同様にN241n258n268n27
On288n29は120にSn3O2n3l2n32
は121に)N334n34→N35は122に夫々対
応する。
またN36→N37→n38はn39にn4Oは123
ま1246125に、N4lは126に対応する。第1
2図は、第6図の装置を用いて第5図の方法を実現する
ためのフローチヤートであり、第5図を更に詳細に表し
たものである。
n1→N2→N3→N4→N5で所望英単語スペルの最
後の文字のアドレスを指定する。
N6→N7は第5図62→63に対応し、以下同様に、
N8→N,→NlOは64に、Nll→Nl2は67→
68に、N,3→Nl4→Nl5は69に、Nl6は7
0に、Nl7→Nl8→Nl9→N2Oは71に、N2
l→N22は72に)N23Nn24Nn257n26
は73に1n27は65に、N28は66にそれぞれ対
応する。次に訳語、品詞の表示以外に第1図アの他のデ
ータの表示について説明する。先ず発音記号の場合は発
音コード4を検出し以降のコードをデコードすることに
よつて発音記号表示を行うことができる。
変化語は、変化語6を検出し、その後ろ、2バイト或は
4バイトのアドレスを指定することによつて単語スペル
1の変化語を表示することができる。例えば単語が動詞
゜“Break”であれば第13図に示す如く変化コー
ド136はC2であり、過去形“BrOke”のアドレ
スと過去分詞形“BrOkenOのアドレスが共に記憶
されている。従つて過去形アドレスを指定すれば“Br
Oke゛を表示することができる。また逆に゜“BrO
ke”で検索した場合は132,133のデータにより
それは“Break”の過去形であることを表示するこ
とができる。熟語の場合、熟語コード8以降の熟語スペ
ルとその意味を表示すればよいがこの場合単語は*コー
ドとして第16図に示す如く表示されているため、この
*コードを検出すれば、ROMアドレスを逆進し単語ス
ペルを挿入すれば“BeabOuttO゛と表示するこ
とができる。
本発明によれば、次に列挙する効果がある。
1単語、品詞、意味、変化、熟語等のデータをコード化
し、各データを所定の区切りコードを介して記憶するこ
とができる。
2単語を記憶する記憶エリアにその変形語(変化例)を
記憶しているアドレスを挿入し、変形語の記憶エリアに
単語の原形を記憶しているアドレスを挿入して記憶する
ことができる。
3前項2において、第1の変化形と第2の変化形が同一
の場合、共通化して記憶することができる。
4単語スペルをアルフアベツト順に記憶し、一つ前の単
語と共通部分は所定のコードを用いて単語スペルを記憶
することができる。
5音節単位で組をつくり頻度の高い“TiOn゛や“I
ng”等の音節を一つのコードとして記憶することがで
きる。
6単語の意味(訳語)はアドレスとして記憶し、意味の
補足を必要とする場合、その補足の語を文字コードとし
て記憶することができる。
7単語(例えば、日本語)を文字順(例えば、50音順
)に記憶し、頭N(N−1、2、・・・・・・・・・)
文字(例えば、頭2文字)を共通とする単語を1プロツ
クとし、各単語をその頭N文字を挿入しないで記憶する
ことができる。
8単語スペルを所定コードとし、文字コードと共に熟語
を記憶することができる。
【図面の簡単な説明】
第1図は本発明による単語のデータ構成を示す図である

Claims (1)

    【特許請求の範囲】
  1. 1 キー入力装置の入力操作等により、その入力データ
    に対応或いは関係するデータを報知する電子辞書であつ
    て、単語及びその訳語を記憶するメモリ手段であつて上
    記単語を所定の文字順に記憶するメモリ手段と、単語入
    力手段と、翻訳指示手段と、上記単語入力手段による単
    語入力後の上記翻訳指示手段による翻訳指示に基づき、
    上記メモリ手段より入力単語の訳語を読み出す手段と、
    該手段により読み出された訳語を外部報知する手段とを
    備えたものに於て、上記単語を、頭N文字(N=1、2
    、・・・・・・・・・)を共通とするもの毎にブロック
    分けし、上記頭N文字を除いた残りの部分を順次記憶す
    ると共に、上記頭N文字は各ブロック領域中の所定部分
    に記憶した上記メモリ手段を設けたことを特徴とする電
    子辞書。
JP58004948A 1983-01-12 1983-01-12 電子辞書 Expired JPS5931101B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58004948A JPS5931101B2 (ja) 1983-01-12 1983-01-12 電子辞書

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58004948A JPS5931101B2 (ja) 1983-01-12 1983-01-12 電子辞書

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP54039212A Division JPS59864B2 (ja) 1979-03-30 1979-03-30 電子辞書

Publications (2)

Publication Number Publication Date
JPS58144975A JPS58144975A (ja) 1983-08-29
JPS5931101B2 true JPS5931101B2 (ja) 1984-07-31

Family

ID=11597790

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58004948A Expired JPS5931101B2 (ja) 1983-01-12 1983-01-12 電子辞書

Country Status (1)

Country Link
JP (1) JPS5931101B2 (ja)

Also Published As

Publication number Publication date
JPS58144975A (ja) 1983-08-29

Similar Documents

Publication Publication Date Title
US5587902A (en) Translating system for processing text with markup signs
JPH0225214B2 (ja)
JPS59864B2 (ja) 電子辞書
JPS5931101B2 (ja) 電子辞書
JPS5931102B2 (ja) 電子辞書
JPS5892063A (ja) イデイオム処理方式
JPS5931100B2 (ja) 電子辞書
JPS5931099B2 (ja) 電子辞書
JPS5931103B2 (ja) 電子辞書
JP7247460B2 (ja) 対応関係生成プログラム、対応関係生成装置、対応関係生成方法、及び翻訳プログラム
JPS5947347B2 (ja) 電子辞書
JPS58175076A (ja) 自然言語処理装置
JPH0140372B2 (ja)
JPS6336031B2 (ja)
JPS63278174A (ja) 翻訳装置
JPH0140370B2 (ja)
JPH05151256A (ja) 機械翻訳方法および機械翻訳装置
JP2698192B2 (ja) 電子辞書における第2言語検索方法
JPH0612453A (ja) 未知語抽出登録装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPS6217266B2 (ja)
JPS55129862A (en) Electronic dictionary
JPS5949629A (ja) カナ漢字変換処理方式
Björklund et al. Structured Language Modeling for Automatic Speech Recognition
JPH04306766A (ja) 機械翻訳装置