JPH0260022B2 - - Google Patents

Info

Publication number
JPH0260022B2
JPH0260022B2 JP59115531A JP11553184A JPH0260022B2 JP H0260022 B2 JPH0260022 B2 JP H0260022B2 JP 59115531 A JP59115531 A JP 59115531A JP 11553184 A JP11553184 A JP 11553184A JP H0260022 B2 JPH0260022 B2 JP H0260022B2
Authority
JP
Japan
Prior art keywords
information
kana
input
kanji
kana character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59115531A
Other languages
English (en)
Other versions
JPS60262263A (ja
Inventor
Hiromi Saito
Kimito Takeda
Tsutomu Kawada
Shigemi Nakazato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP59115531A priority Critical patent/JPS60262263A/ja
Publication of JPS60262263A publication Critical patent/JPS60262263A/ja
Publication of JPH0260022B2 publication Critical patent/JPH0260022B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明はカナ漢字変換を効率良く行なうための
情報検索装置に関する。
〔発明の技術的背景とその問題点〕
ワードプロセツサや機械翻訳装置などにおいて
は仮名漢字変換や対訳情報等を得るために単語辞
書なる膨大なテーブルデータが必要とされる。こ
のテーブルは一般にフロツピーデイスクなどのメ
モリに一定の規則、例えば、よみがなの五十音順
とかアルフアベツト順のように文字コードをキー
としてソーテイングされており、検索時間を早め
るために全体をいくつかのブロツクに分けてそれ
ぞれのブロツクの位置を指示するためのデイレク
トリと呼ばれる索引部を備えている。
ところでワードプロセツサのように対話的に処
理を行う装置においては、例えば変換を要求する
特定のキーが入力されたときに、それまで入力さ
れた一連のよみがなデータに対してかな漢字変換
を行うために単語辞書部より該該当する誤句を探
し当てるわけであるが、応答時間をできるだけ短
縮させるために、一般に辞書の先読みと呼ばれる
処理が施されている。
この先読み機構とは、例えば、1文字または2
文字程度の入力が行なわれた時点でデイレクトリ
を引き当てておくこと、さらには該当するブロツ
クの中からその時点までに照合一致した見出し語
を探し当てておくものである。
すなわち、例えばデイレクトリが50音のそれぞ
れに対応して記述してあるとすると、「うつくし
い」という入力単語をかな漢字変換させる際、
「う」と入力された時に、「う」を頭にもつ部署ブ
ロツクを探し当て、同時に見出し語が「う」なる
単語を求めておくものである。次に「つ」が入力
されると同時に「うつ」なる見出し語が取り出さ
れ、以下順に入力が行なわれ、「うつくし」なる
見出し語すなわち形容詞「美しい」の語幹部分が
求められた後、変換要求の指示がなされると、こ
れまでに求められた見出し語の全てに対して活用
語尾の解釈を行つて「美しい」なる表記データを
出力することができる。
オペレータがキーを入力する速度は、上達者で
もせいぜい1秒間に数タツチ、初心者であればそ
れ以下であり、この間隔時間を計算機制御部に有
効に活用させるためにこのような先読み処理を行
うものである。
ところで、このような辞書の先読み処理は、変
換する単位を単一の単語のみでなく複数単語を連
接して複合語として扱う場合には、複合語のうち
の最初の単語情報を引き当てることしか有効でな
くなる。複合化した時の第2あるいは第3の単語
に対しても、先読みの効果を得るには、結局、入
力された全ての文字についてデイレクトリを引き
当て、これらのデイレクトリをもとにあらゆる可
能性のある単語の見出し語を照合検索していく必
要が生じる。このため、変換要求があるまでに入
力された文字データにつき全てのデイレクトリの
情報を記憶しておく必要があること、また文字入
力の毎に様々なデイレクトリにつながるデイスク
データ格納領域を検索することは、物理的なデイ
スクの広範囲な移動を伴うために、処理時間の上
で問題があつた。つまり、文字が入力された時点
で複数のデイレクトリを順次たどつて見出し語を
サーチする必要があつたので処理時間を多大に要
した。
〔発明の目的〕
本発明の目的は、カナ漢字変換において先読み
処理等を行う際に、カナ文字列に該当する漢字を
効率良く検索することの出来る情報検索装置を提
供することにある。
〔発明の概要〕
本発明は、カナ文字列情報と漢字変換指示信号
を入力するための入力部、カナ文字列の見出し語
の並び順がその末尾側からの順序となつておりこ
れらの各々を対応する漢字情報文法情報と共に格
納した単語辞書、入力部から入力されたカナ文字
列の末尾側からの順序に部分的に一致した見出し
語を全て単語辞書より検索しこれと共に単語辞書
に格納されている漢字情報文法情報を抽出し対応
する入力カナ文字列情報と共に記憶する検索制御
部とを備え、単語辞書のデイレクトリはカナ文字
列の末尾の見出し文字が共通である単語(漢字)
群の格納場所(ブロツク)を指し示すものであ
り、入力部より漢字変換指示信号が入力された場
合、検索制御部は記憶している漢字情報をこれと
共に記憶している文法情報及び入力カナ文字列情
報を基に適宜変形し組み合せてカナ漢字混り文と
して表示部等へ出力するものである。
〔発明の効果〕
本発明によれば、入力が順次行われていく都度
現在入力された文字を末尾にもち、それまでに入
力された前方の文字列に一致又は部分一致する見
出し語全てを1つのデイレクトリが指示するブロ
ツク内の単語群から検索出来ることになる為、例
えばデイスクのヘツドの移動は最小範囲のみで済
み、高速の辞書先読み処理を行うことが出来る。。
〔発明の実施例〕
以下、図面を参照して本発明の一実施例につき
説明する。第1図は本発明の一実施例装置の概略
構成図である。この実施例は入力されたカナ文字
列に対し、これに該当する漢字を単語辞書より検
索し、これを基にカナ漢字混り文に変換して出力
するものである。
入力部1はカナキー、フアンクシヨンキー等を
有するキーボードであり、ユーザが所望のカナ文
字列及び漢字変換指示信号を入力するためのもの
である。この入力部1より入力されたカナ文字列
は順次1字ずつ検索制御部2へ送られる。検索制
御部2はこのカナ文字列を入力された順序で入力
バツフア4へ格納すると共に出力部6へ同順序で
出力する。出力部6はCRTデイスプレイ等の表
示部であり、カナ文字列が入力された順序(検索
制御部2より出力された順序)で表示されるもの
である。又、検索制御部2は入力されたカナ文字
列に対する漢字情報、文法情報を入力順に単語辞
書3より検索する。第2図はこの単語辞書3の構
成を示す図であり、これはデイレクトリ3a、見
出し部3b、項目情報部3cから構成されてい
る。デイレクトリ3aは全てのカナ文字とそれに
対応するアドレス(ブロツクアドレス)を格納し
たものであり、このアドレスは見出し部3bにお
いて対応するカナ文字を末尾にもつ見出し語全て
を格納したブロツクアドレスとなつている。この
見出し部3bは、第2図に示すように共通のカナ
文字1字を末尾に持ち末尾からの読み順(逆読み
順)がアイウエオ順となつて並んでいるカナ文字
列を1ブロツクとしており、更にこのブロツクが
末尾カナ文字のアイウエオ順となつて複数格納さ
れたものである。項目情報部3cは見出し部3b
のカナ文字列の各々に対応する漢字情報(含ひら
がな情報)及び文法情報が格納されているもので
ある。例えば第2図においてデイレクトリ3aで
はカナ「い」に対するアドレスは1001であり、こ
のアドレス1001に対して見出し部3bではカナ
「い」を末尾に持つ全ての見出し語(文字列)が
逆読みのアイウエオ順に並んでおり、これらの
各々に対する漢字情報、文法情報項目情報部3c
に格納されている。つまりブロツクアドレス1001
なカナ「い」を末尾に持つカナ文字列と漢字情報
(文法情報)のブロツクを示すもの、同様にブロ
ツクアドレス1010はカナ「か」を末尾に持つカナ
文字列と漢字情報(文法情報)のブロツクを示す
ものである。検索制御部2は入力されたカナ文字
に対応するアドレスをデイレクトリ3aより探
し、そのアドレスに該当する見出し部3b、項目
情報部3cのブロツク内において、該当カナ文字
を末尾に持ちこれまでに入力されたカナ文字との
全ての組合せに該当する漢字情報、文法情報より
成る項目内容を取り出して先読みメモリ5に記憶
させる。先読みメモリ5は第3図に示す構成とな
つており、出力部6上に表示されたカナ文字の表
示位置情報とこのカナ文字に対応する項目内容が
一対となつて記憶されるものである。(尚、検索
制御部2の詳細な動作は後に説明する)次に、入
力部1よりナ漢字変換指示信号がフアンクシヨン
キー等より入力されると、検索制御部2は先読み
メモリ5に記憶されている漢字情報(含ひらがな
情報)をこれと共に記憶されている文法情報や対
応するカナ文字を表示位置情報に基いて組み合せ
選択して漢字カナ混り文として出力部6に出力す
る。つまり出力部6にはユーザが入力したカナ文
字列とそれに対応する適当なカナ漢字混り文字列
とが表示されるものである。
次に検索制御部2の動作を第4図の処理フロー
図を使つて説明する。ユーザが入力部1より「だ
いかいかく」というカナ文字列を入力しこれを漢
字に変換したい場合を例に挙げる。先ずカナ
「だ」が入力部1より入力されて検索制御部2へ
送られる(第4図ステツプ11)。検索制御部2は
この入力された「だ」がカナ文字である為に(第
4図ステツプ12)、「だ」を入力バツフア4にスタ
ツク(格納)するとともに(第4図ステツプ13)、
出力部6の所定位置に表示させる。次に検索制御
部2は単語辞書3内のデイレクトリ3aにおい
て、カナ「だ」に対応するアドレスを引く(第4
図ステツプ14)。例えば第2図に示すように「だ」
のアドレスは1100であるため、見出し部3bと項
目情報部3cにおいてアドレス1100のブロツクを
検索する。更にこのブロツク内で見出し部3b内
の「だ」に対応して項目情報部3c内に格納され
ている漢字情報、文法情報(第2図では「打/接
尾」「出/五段さ」の2つ)を取り出して先読み
メモリ5に記憶させる(第4図ステツプ15)。又、
この「だ」に対する項目内容(漢字情報、文法情
報)は出力部6上の「だ」の表示位置情報(始
点、終点)と共に第3図に示すように先読みメモ
リ5へ記憶させる。次に入力部1より入力された
カナ「い」が検索制御部2へ入力されると(第4
図ステツプ11)、検索制御部2はこの「い」もカ
ナである為に(第4図ステツプ12)、この「い」
を入力バツフア4内の「だ」の次場所へスタツク
すると共に出力部6上で「だ」の次の位置に表示
させる(第4図ステツプ13)。更に検索制御部2
は単語辞書3のデイレクトリ3aよりカナ「い」
に対応するアドレス1001を引き(第4図ステツプ
13)、見出し部3b、項目情報部3cのアドレス
1001のブロツクを検索する。ところで入力バツフ
ア4内にはカナ「だい」とスタツクされているた
め「い」、「だい」の見出しに対応する項目内容を
取り出し先読みメモリ5に記憶させる(第4図ス
テツプ11)。この際に本願では見出し語「い」と
「だい」の両方が、アドレス1001のカナ「い」を
末尾に持つ見出し語のブロツク内にあるため、従
来の様に検索用アドレスが大幅に移動すること無
く効率良く行える。尚、「い」「だい」の項目内容
も各々、出力部6上の「い」の表示位置、「だい」
の表示位置と共に第3図に示すように記憶させ
る。同様にして3番目のカナ「か」が入力される
と「か」「いか」「だいか」の3つの見出し語に対
応する項目内容がアドレス1010のブロツク内より
検索される。こうして「だいかいかく」というカ
ナ6文字の入力が全て終了した後に、ユーザが入
力部1より漢字変換指示信号を入力するとこれも
検索制御部2へ送られる(第4図ステツプ11)。
検索制御部2ではこれがカナ文字では無く、漢字
変換指示信号である為に(第4図ステツプ12)、
先読みメモリ5内に記憶されている項目内容の漢
字情報(含ひらがな情報)をこれと共に記憶され
た文法情報、表示位置情報に基き組合せし正しい
ものを選択して出力部6に表示させる。(第4図
ステツプ16)例えば「打」+「以下」+「い」+「角」
という漢字変換文は「以下(名詞)」と「い(上
一段活用動詞)」の組合せが文法的に正しくない
為に棄却される。「大」+「改革」の様な漢字変換
文は(名詞)+(名詞)で文法的に正しく且つ組み
合わせ数も少ないので選択されて出力部6へ表示
される。
この様に検索制御部2は先読みメモリ5内の表
示位置情報に基きこれに対応する項目内容を組み
合わせ、その文法情報を基に文法的に正しいもの
だけを出力するのである。尚、出力部6上に複数
の漢字変換文が表示された場合は、ユーザが所望
の1文を選択すれば良い。
以上の処理が終ると検索制御部2は入力バツフ
ア4及び先読みメモリ5をクリヤする(第4図ス
テツプ17)。
この様に本願の単語辞書では共通のカナ文字を
末尾に持つ見出し語(カナ文字列)をブロツク単
位で格納しているため、先読み処理を入力カナ文
字の逆読み順で効率良く行うことが出来る。つま
り従来のものに比べて検索のためのサーチ範囲が
狭くなり処理時間が縮小される。
【図面の簡単な説明】
第1図は本発明の実施例のブロツク図、第2図
は単語辞書の構成を示す図、第3図は先読みメモ
リの内容を示す図、第4図は検索制御部の処理フ
ロー図である。 1……入力部、2……検索制御部、3……単語
辞書、4……入力バツフア、5……先読みメモ
リ、6……出力部。

Claims (1)

    【特許請求の範囲】
  1. 1 カナ文字及び漢字変換指示信号を入力するた
    めの入力部と、共通のカナ文字を末尾に持つカナ
    文字列でブロツク構成されたカナ文字列の見出し
    語、この見出し語に対応する漢字情報及び文法情
    報を格納した単語辞書と、前記入力部よりカナ文
    字が入力された場合このカナ文字を入力順序に従
    つて記憶する第1の記憶手段と、前記入力部より
    入力されたカナ文字と一致する見出し語を前記単
    語辞書より検索するとともに前記第1の記憶手段
    により既に記憶されているカナ文字が有れば前記
    入力されたカナ文字を末尾カナとし該カナ文字と
    前記既に記憶されているカナ文字との組合せ文字
    に一致する見出し語を前記単語辞書より検索する
    検索手段と、この検索手段により検索された見出
    し語に対応する漢字情報及び文法情報を前記単語
    辞書より抽出する抽出手段と、この抽出手段によ
    り抽出された漢字情報及び文法情報を前記第1の
    記憶手段に記憶された対応するカナ文字の入力順
    序情報と共に記憶する第2の記憶手段と、前記入
    力部より漢字変換指示信号が入力された場合前記
    第2の記憶手段により記憶されている漢字情報を
    これと共に記憶された文法情報及び入力順序情報
    に基き組合せて出力する出力手段とを具備したこ
    とを特徴とする情報検索装置。
JP59115531A 1984-06-07 1984-06-07 情報検索装置 Granted JPS60262263A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59115531A JPS60262263A (ja) 1984-06-07 1984-06-07 情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59115531A JPS60262263A (ja) 1984-06-07 1984-06-07 情報検索装置

Publications (2)

Publication Number Publication Date
JPS60262263A JPS60262263A (ja) 1985-12-25
JPH0260022B2 true JPH0260022B2 (ja) 1990-12-14

Family

ID=14664835

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59115531A Granted JPS60262263A (ja) 1984-06-07 1984-06-07 情報検索装置

Country Status (1)

Country Link
JP (1) JPS60262263A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0752450B2 (ja) * 1986-08-01 1995-06-05 株式会社日立製作所 辞書デ−タ検索装置
JPS649521A (en) * 1987-07-02 1989-01-12 Fujitsu Ltd Screen data retrieving system
JPH0277964A (ja) * 1988-09-14 1990-03-19 Sharp Corp 文字処理装置

Also Published As

Publication number Publication date
JPS60262263A (ja) 1985-12-25

Similar Documents

Publication Publication Date Title
US5099426A (en) Method for use of morphological information to cross reference keywords used for information retrieval
JPH0260022B2 (ja)
JPH0578058B2 (ja)
JP3285149B2 (ja) 外国語電子辞書検索方法及び装置
JPH07114565A (ja) 電子辞書
JPS59103136A (ja) カナ漢字変換処理装置
JPS6246029B2 (ja)
JP2589090B2 (ja) 文章処理装置
JP3934774B2 (ja) 文字処理方法および装置
JPS62144269A (ja) 情報検索装置
JP2786211B2 (ja) 機械翻訳装置における後編集装置
JP3537888B2 (ja) かな漢字変換装置
JPH0724057B2 (ja) 電子機器
JP2634596B2 (ja) かな漢字変換装置
JPH0821031B2 (ja) 言語解析装置
JPS60251461A (ja) 仮名漢字変換装置
JPS6116117B2 (ja)
JPS5998236A (ja) 日本文入力装置
JPH01204174A (ja) 文字処理装置
JPS6133569A (ja) かな漢字変換装置
JPH01321559A (ja) ワードプロセッサ
JPH06162079A (ja) 対訳検索装置
JPS5924382A (ja) 電子式翻訳機の語形変換方式
JPS608922A (ja) 日本語処理装置
JPS6068421A (ja) 日本語文章入力方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term