JPS58103025A - かな漢字変換装置 - Google Patents
かな漢字変換装置Info
- Publication number
- JPS58103025A JPS58103025A JP56201948A JP20194881A JPS58103025A JP S58103025 A JPS58103025 A JP S58103025A JP 56201948 A JP56201948 A JP 56201948A JP 20194881 A JP20194881 A JP 20194881A JP S58103025 A JPS58103025 A JP S58103025A
- Authority
- JP
- Japan
- Prior art keywords
- kana
- character string
- dictionary
- independent
- kanji
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/018—Input/output arrangements for oriental characters
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
この発明は入力されるかな文字列を漢字かな混り文字列
に変換するかな漢字変換装置に関し、特にこの変換過程
において用いられる自立語辞書の検索に関するものであ
る。
に変換するかな漢字変換装置に関し、特にこの変換過程
において用いられる自立語辞書の検索に関するものであ
る。
第1図はかな漢字変換装置の自立語辞書に対する従来の
検索方法を説明するための構成図である。
検索方法を説明するための構成図である。
図において、(1)は操作部であり、たとえばタイプラ
イタ、CRT表示装置等を備え、操作者がかな文字列を
入力したり装置に対する動作指令情報を人力したり、或
は変換結果、後述の出力ファイル(3)等の内容をCR
’r表示部によって確認する等の操作を行う、(2)は
自立語辞書、(3)はかな文字列から漢字かな混り文字
列に変換された結果が格納される記憶装置からなる出力
ファイル、(4)は処理部であろ0 第2図は上記自立語辞書(2)の内容を図式化して表現
したフォーマット図で、図において、(5)はかな見出
し項、(6)はかな見出し項(5)に記憶されたかな文
字列に対応する漢字かな混り文字列を収容する表記績で
ある。かな見出し項(5)に示すかな文字列及び表記項
(6)に示す漢字かな混り文字列はそれぞれの文字に対
応する符号から構成された符号列として記憶装置に記憶
されている。
イタ、CRT表示装置等を備え、操作者がかな文字列を
入力したり装置に対する動作指令情報を人力したり、或
は変換結果、後述の出力ファイル(3)等の内容をCR
’r表示部によって確認する等の操作を行う、(2)は
自立語辞書、(3)はかな文字列から漢字かな混り文字
列に変換された結果が格納される記憶装置からなる出力
ファイル、(4)は処理部であろ0 第2図は上記自立語辞書(2)の内容を図式化して表現
したフォーマット図で、図において、(5)はかな見出
し項、(6)はかな見出し項(5)に記憶されたかな文
字列に対応する漢字かな混り文字列を収容する表記績で
ある。かな見出し項(5)に示すかな文字列及び表記項
(6)に示す漢字かな混り文字列はそれぞれの文字に対
応する符号から構成された符号列として記憶装置に記憶
されている。
以−ヒのような構成において、例えば1しようさく/−
1にせつめいする」と入力して「詳細に説明する」とい
う結果を期待するときの動作について説明する。操作者
は文節単位で人力するものとすると、先ず操作部(1)
から1−シようさいに1と入力する。
1にせつめいする」と入力して「詳細に説明する」とい
う結果を期待するときの動作について説明する。操作者
は文節単位で人力するものとすると、先ず操作部(1)
から1−シようさいに1と入力する。
処理部(4)はこの入力された乃\な文字列力1ら自立
語辞書(2)のめ・な見出12項(5)に同一のかな文
字列を持つレコード(1自立詔)の有無全検索する。こ
の場合はかな見出し瑣(5)に同一のかな文字列を持つ
語が存在しないため、処理部(4)は入力かな文字列の
末尾1文字を削除し、[シようさい−1として再度自立
語辞書(2)を検索する。この検索においてかな見出し
項(5)に同一かな文字列を持°つ@が存在するため対
応する表記項(6)から1−詳細」を読み出すことがで
きる。処理部(4)はこの読み出した漢字かな混り文字
列1詳細、」とこの飴を得るまでに削除した語「に」を
接続し、かな漢字変換結果として[詳細に」を操作部(
1)へ送り、たとえばCRT表示装置(操作部(1)内
の)へ表示して操作者の確認を促す。操作者は表示され
た変換結果か慈図したものであれば、後続の文節[せつ
めいする」を操作部(1)から入力する。処理部(4)
はこのかな文字列を読み取ることにより、前文の変換結
果が正しかったものとして出力ファイル(3)に書き込
み、後続文の処理に移行する。処理部(4)は前文同様
自立語辞書(2)の検索、かな文字列の末尾1文字削除
の処理を繰り返し「説明」を自立語辞書(2)の表記項
(6)より読み出し、削除した文字列「する」と接続し
、操作部(1)へ送る。このように人力されたかな文字
列から自立語辞書(2)を細葉し、該当−を見い出すか
、あるいは最後の1文字まで削除するような状態になる
まで検索を繰り返えす手法は″最醍一致法″と貯ばれ一
般n:Jに用いられている。
語辞書(2)のめ・な見出12項(5)に同一のかな文
字列を持つレコード(1自立詔)の有無全検索する。こ
の場合はかな見出し瑣(5)に同一のかな文字列を持つ
語が存在しないため、処理部(4)は入力かな文字列の
末尾1文字を削除し、[シようさい−1として再度自立
語辞書(2)を検索する。この検索においてかな見出し
項(5)に同一かな文字列を持°つ@が存在するため対
応する表記項(6)から1−詳細」を読み出すことがで
きる。処理部(4)はこの読み出した漢字かな混り文字
列1詳細、」とこの飴を得るまでに削除した語「に」を
接続し、かな漢字変換結果として[詳細に」を操作部(
1)へ送り、たとえばCRT表示装置(操作部(1)内
の)へ表示して操作者の確認を促す。操作者は表示され
た変換結果か慈図したものであれば、後続の文節[せつ
めいする」を操作部(1)から入力する。処理部(4)
はこのかな文字列を読み取ることにより、前文の変換結
果が正しかったものとして出力ファイル(3)に書き込
み、後続文の処理に移行する。処理部(4)は前文同様
自立語辞書(2)の検索、かな文字列の末尾1文字削除
の処理を繰り返し「説明」を自立語辞書(2)の表記項
(6)より読み出し、削除した文字列「する」と接続し
、操作部(1)へ送る。このように人力されたかな文字
列から自立語辞書(2)を細葉し、該当−を見い出すか
、あるいは最後の1文字まで削除するような状態になる
まで検索を繰り返えす手法は″最醍一致法″と貯ばれ一
般n:Jに用いられている。
しかしながら自立飴辞緩(2)は用遂に際し数万珀から
十数方間の自立語を記憶するため格納装置として一般に
ディスク装置が用いられており、ディスク装置への検索
はディスクの回転待ちによる時間及びディスクヘッドの
移動等で検索時間が大きくなる危険があり、変換処理速
度に与える影響が大きい。また史に小な漢字変換装置に
於ける1文節は前記例でも示した通り自立語+14属語
(例えば説明士する)から成り立っており、1文節に対
する検索で付属語の文字擾に比例して無駄な検索を必要
とし、その検索毎にディスクの回転待ち、ヘッドの移動
時間等が加算されることになる。例えは「従来からの」
に対しては「従来」を得るまでに「従来」を得るための
検索と、付属語「からり」の3回、#f4回ディスク装
置を検索し、その検索毎にディスクの回転待ち、ヘッド
の移動時間等が加わることになり、1文節の変換に要す
る時間が大きくなる。
十数方間の自立語を記憶するため格納装置として一般に
ディスク装置が用いられており、ディスク装置への検索
はディスクの回転待ちによる時間及びディスクヘッドの
移動等で検索時間が大きくなる危険があり、変換処理速
度に与える影響が大きい。また史に小な漢字変換装置に
於ける1文節は前記例でも示した通り自立語+14属語
(例えば説明士する)から成り立っており、1文節に対
する検索で付属語の文字擾に比例して無駄な検索を必要
とし、その検索毎にディスクの回転待ち、ヘッドの移動
時間等が加算されることになる。例えは「従来からの」
に対しては「従来」を得るまでに「従来」を得るための
検索と、付属語「からり」の3回、#f4回ディスク装
置を検索し、その検索毎にディスクの回転待ち、ヘッド
の移動時間等が加わることになり、1文節の変換に要す
る時間が大きくなる。
この発明はこの欠点を除去するためになされたもので、
自立胎i!#−書に対する検索を1文節の統計情報をも
とに与えられたかな文字列から予め末尾N文字を削除し
て、1回のディスク装置への検索で削除したかな文字列
から与えられたかな文字列までに該当する自立語を順次
ディスク装置から読み出しディスク装置より十分高速な
記憶装置上に展開して、その高速メモリ上で自立語を検
索するようにした変換処理速度の高いかな漢字変換装置
を提供することを目的としている。
自立胎i!#−書に対する検索を1文節の統計情報をも
とに与えられたかな文字列から予め末尾N文字を削除し
て、1回のディスク装置への検索で削除したかな文字列
から与えられたかな文字列までに該当する自立語を順次
ディスク装置から読み出しディスク装置より十分高速な
記憶装置上に展開して、その高速メモリ上で自立語を検
索するようにした変換処理速度の高いかな漢字変換装置
を提供することを目的としている。
以下第3図に示すこの発明の実施例について説明する。
第3図において、第1図と同一符号は同一′または相当
部分を示し、(7)は辞書管理部、(8)は高速メモリ
部である。
部分を示し、(7)は辞書管理部、(8)は高速メモリ
部である。
以ヒのような構成において、予め削除する文字数を仮に
′2゛′とじて従来の検索方法について説明したと同様
に1しようさいにせつめいする」を例に説明する。先ず
操作者は操作部(1)から1文節単位で「しrうさいに
」と入力する。処理部(4)は該かな文字列を読み取り
、辞書制御u (7)へ渡す。
′2゛′とじて従来の検索方法について説明したと同様
に1しようさいにせつめいする」を例に説明する。先ず
操作者は操作部(1)から1文節単位で「しrうさいに
」と入力する。処理部(4)は該かな文字列を読み取り
、辞書制御u (7)へ渡す。
辞書制御部(7)は与えられたかな文字列から予め設定
された末尾削除数″2°′の情報をもとに末尾2文字削
除して「しようさ」で自立語辞書(2)を検索し、これ
によって位置決めされたディスク装置の自立語辞書(2
)の位置から順次該当する自立語を読み−出し高速メモ
リ部(8)へ書き込む、辞書制御部(7)ほこの動作を
自立語辞書(2)のみ見出し項(5)に記憶されている
かな文字列が与えられた仏な文字列「しようさいに」よ
りも大きくなったとき(一般の国語辞典に記載されてい
る単語順位に相当する)読み出しを終了する。第4図は
この検索において辞書制御部(7)によって自立語辞書
(2)から読み出され、高速メモリ部(8)へ書き込ま
れた内容を図式化して表現したフォーマット図で情報形
態は第2図に示したものと同一であり、記憶されている
情報(自立語)は当然自立語辞書(2)のかな見出し項
(5)に記憶されている力・な文字列Sがしようさ≦S
くしようさいにの範囲にある自立語となる。第4図の例
では少佐、照査、詳細の3胎である。辞書制御部(7)
はこの^速メモリ部(8)上に展開された自立語のかな
見出し項(9)を検索することにより与えられたかな文
字列に該当する語が無いことを知り、その旨処理部(4
)へ通達する。処理部(4)は辞書制御部(力からの情
報により該当飴が無かったことを知り末尾1文字を削除
し、再度辞書側割部(7)へ検索要求を出す。それに対
し辞書制御部(7)は高速メモリ部(8)を検索し「し
ようさい」に一致する飴としてI#細」を表記項(10
)より見い出し処理部(4)へ送る。処理部(4)はこ
の「詳細」と削除した後1に」を接続し操作部(1)に
設けられているCRT表示部へ表示し操作者の確認を持
つ同様に後続の文節[せつめいする、1に対しても辞書
制御部(7)は末尾2文字削除して「せつめい」から[
せつめいする−1の仏な文字列に相当する曲を自立語辞
書(2)から読み出すことによって[せつめいI [説
明−1をディスク装置ヒに展開された自立語辞書(2)
から1回の検索で高速メモリ部(8)に読み出すことが
できる。
された末尾削除数″2°′の情報をもとに末尾2文字削
除して「しようさ」で自立語辞書(2)を検索し、これ
によって位置決めされたディスク装置の自立語辞書(2
)の位置から順次該当する自立語を読み−出し高速メモ
リ部(8)へ書き込む、辞書制御部(7)ほこの動作を
自立語辞書(2)のみ見出し項(5)に記憶されている
かな文字列が与えられた仏な文字列「しようさいに」よ
りも大きくなったとき(一般の国語辞典に記載されてい
る単語順位に相当する)読み出しを終了する。第4図は
この検索において辞書制御部(7)によって自立語辞書
(2)から読み出され、高速メモリ部(8)へ書き込ま
れた内容を図式化して表現したフォーマット図で情報形
態は第2図に示したものと同一であり、記憶されている
情報(自立語)は当然自立語辞書(2)のかな見出し項
(5)に記憶されている力・な文字列Sがしようさ≦S
くしようさいにの範囲にある自立語となる。第4図の例
では少佐、照査、詳細の3胎である。辞書制御部(7)
はこの^速メモリ部(8)上に展開された自立語のかな
見出し項(9)を検索することにより与えられたかな文
字列に該当する語が無いことを知り、その旨処理部(4
)へ通達する。処理部(4)は辞書制御部(力からの情
報により該当飴が無かったことを知り末尾1文字を削除
し、再度辞書側割部(7)へ検索要求を出す。それに対
し辞書制御部(7)は高速メモリ部(8)を検索し「し
ようさい」に一致する飴としてI#細」を表記項(10
)より見い出し処理部(4)へ送る。処理部(4)はこ
の「詳細」と削除した後1に」を接続し操作部(1)に
設けられているCRT表示部へ表示し操作者の確認を持
つ同様に後続の文節[せつめいする、1に対しても辞書
制御部(7)は末尾2文字削除して「せつめい」から[
せつめいする−1の仏な文字列に相当する曲を自立語辞
書(2)から読み出すことによって[せつめいI [説
明−1をディスク装置ヒに展開された自立語辞書(2)
から1回の検索で高速メモリ部(8)に読み出すことが
できる。
以上は末尾削除文字数をn 2 uとしたときについて
説明したが、この発明はこれに限らず与えられた文字醍
に依存するように削除数を設定する構成にしてもよい。
説明したが、この発明はこれに限らず与えられた文字醍
に依存するように削除数を設定する構成にしてもよい。
たとえば与えられた1文節の文字1kが10文字であれ
ば末尾5文字を削除して検索を開始し、1文節の文字し
が短いときは末尾を削除せず検索するなど動的に制御T
Rするようにしても良い。これは一般的な自立語のかな
見出り長単位の自立語分布によるものでかな見出し腿が
渋い自立語#′i該当飴が少なく、かな見出し醍が短い
自立語は該当数が多いことが知られているため自立語辞
書(2)と高速メモリ部(8)間の無駄な転送を省くた
めのものである。また辞書制御部(7)と処理部(4)
との情報の授受を辞書制御部(7)側で処理部(4)か
ら与えられたかな文字列に対して該かな文字列の先頭か
ら最も長く一致する自立語を送るように構成しても良い
例えば「しようさいに」対して「しようさ1から「しよ
うさいに」の範囲内で「しょうさい」が先頭から最も豪
く一致している為処理部(4)にその旨転送する方法も
ある。
ば末尾5文字を削除して検索を開始し、1文節の文字し
が短いときは末尾を削除せず検索するなど動的に制御T
Rするようにしても良い。これは一般的な自立語のかな
見出り長単位の自立語分布によるものでかな見出し腿が
渋い自立語#′i該当飴が少なく、かな見出し醍が短い
自立語は該当数が多いことが知られているため自立語辞
書(2)と高速メモリ部(8)間の無駄な転送を省くた
めのものである。また辞書制御部(7)と処理部(4)
との情報の授受を辞書制御部(7)側で処理部(4)か
ら与えられたかな文字列に対して該かな文字列の先頭か
ら最も長く一致する自立語を送るように構成しても良い
例えば「しようさいに」対して「しようさ1から「しよ
うさいに」の範囲内で「しょうさい」が先頭から最も豪
く一致している為処理部(4)にその旨転送する方法も
ある。
以上のようにこの発明に係るかな漢字変換装置では従来
のディスク装置に設けられた自立語辞書と処理部との間
にディスク装置のアクセス時間より十分高速なメモリ部
を設けかな漢字変換単位である1文節の統計情報をもと
に、自立語辞書から定められた範囲の該当語を高速メモ
リーヒに移動することにより付属語豪に比例した無駄な
検索をディスク装置に対して行う必要がないため高速に
変換処理が行なえる等効果がある。
のディスク装置に設けられた自立語辞書と処理部との間
にディスク装置のアクセス時間より十分高速なメモリ部
を設けかな漢字変換単位である1文節の統計情報をもと
に、自立語辞書から定められた範囲の該当語を高速メモ
リーヒに移動することにより付属語豪に比例した無駄な
検索をディスク装置に対して行う必要がないため高速に
変換処理が行なえる等効果がある。
第1図は従来のかな漢字変換装置を示すブロック図、第
2図は自立語辞書の内容を図式化して表現しl七フォー
マット図、第3図にこの発明の一実施例を示すブロック
図、第4図は第3図の高速メモリ部の内容を図式化して
表現したフォーマット図である。 図にb ’!” で、(1)は操作S、(2)Vi自立
g9辞薔、(3)は出力ファイル、(4)は処理部、(
5)はかな見出し項、(6)は表記項、(7)は辞書部
、(8)は高速メモリ部である。なお図中同一符号は同
一または相当部分を示す。 代理人 葛 舒 信 − 第1図 第2図 第3図 第4図
2図は自立語辞書の内容を図式化して表現しl七フォー
マット図、第3図にこの発明の一実施例を示すブロック
図、第4図は第3図の高速メモリ部の内容を図式化して
表現したフォーマット図である。 図にb ’!” で、(1)は操作S、(2)Vi自立
g9辞薔、(3)は出力ファイル、(4)は処理部、(
5)はかな見出し項、(6)は表記項、(7)は辞書部
、(8)は高速メモリ部である。なお図中同一符号は同
一または相当部分を示す。 代理人 葛 舒 信 − 第1図 第2図 第3図 第4図
Claims (1)
- かな文字を入力する手段と、自立語の読み全かな文字列
の符号で表わす見出し項とこれに相当する漢字かな混り
文字列の符号で表わす表記績とを対応させて記憶する自
立語辞書と、入力されたかな文字列をもとに一ヒ記自立
d8辞書を検索し対応する漢字かな混り文字列を出力す
る処理部とを有するかな漢字変換装置において、上記処
理部と自立語辞書との間にかな漢字変換処理に際し一ヒ
記処理部から上記自立語辞書を検索するときに与えられ
たかな文字列を上限とし上記文字列から末尾N文字を削
除した語を下限とする範囲で上記自立語辞書を検索する
辞書制劉部と、上記範囲で上記自立語辞書より読み出さ
れた自立語を記憶するメ七り部とを備えていることを特
徴とするかな漢字変換装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56201948A JPS58103025A (ja) | 1981-12-15 | 1981-12-15 | かな漢字変換装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56201948A JPS58103025A (ja) | 1981-12-15 | 1981-12-15 | かな漢字変換装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS58103025A true JPS58103025A (ja) | 1983-06-18 |
Family
ID=16449426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56201948A Pending JPS58103025A (ja) | 1981-12-15 | 1981-12-15 | かな漢字変換装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58103025A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03206551A (ja) * | 1990-08-31 | 1991-09-09 | Hitachi Ltd | 読み入力文字列の変換候補表示方法および装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5759266A (en) * | 1980-09-26 | 1982-04-09 | Canon Inc | Retrieving device of information |
-
1981
- 1981-12-15 JP JP56201948A patent/JPS58103025A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5759266A (en) * | 1980-09-26 | 1982-04-09 | Canon Inc | Retrieving device of information |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03206551A (ja) * | 1990-08-31 | 1991-09-09 | Hitachi Ltd | 読み入力文字列の変換候補表示方法および装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5214583A (en) | Machine language translation system which produces consistent translated words | |
US5384700A (en) | Method and system for storing multiple, modifiable Yomi and Kanji strings in a structured document | |
JPS58103025A (ja) | かな漢字変換装置 | |
JP2819612B2 (ja) | 文字変換装置 | |
JPS60262263A (ja) | 情報検索装置 | |
JPH11328160A (ja) | 文字コード変換処理装置、文字コード変換処理方法、文字コード変換処理プログラムを記録した記録媒体 | |
JPS6337425A (ja) | 辞書デ−タ検索装置 | |
JP3585944B2 (ja) | データ処理方法及びその装置 | |
JPH0697455B2 (ja) | 仮名漢字変換装置 | |
JPS6198475A (ja) | 日本語文章入力装置 | |
JP2727076B2 (ja) | 翻訳支援装置 | |
JP2634926B2 (ja) | かな漢字変換装置 | |
JPH0546593A (ja) | 文字入力装置 | |
JPS60251461A (ja) | 仮名漢字変換装置 | |
JPH05298368A (ja) | 電子ファイリングシステムの検索語入力方法 | |
JPH0140371B2 (ja) | ||
JPH06187371A (ja) | 圧縮地名データの格納方法及び読み出し方法 | |
JPH03191472A (ja) | 文解析装置及びこれを用いた機械翻訳装置 | |
JPH1091627A (ja) | 漢字よみがな自動変換方法およびシステム | |
JPH10334122A (ja) | 類似名検索システムおよび記録媒体 | |
JPS60129875A (ja) | 仮名漢字変換装置における季語変換方式 | |
JPH08339365A (ja) | 文書作成装置及び文書作成方法 | |
JPS61169961A (ja) | ユ−ザ辞書を備えた文字処理装置 | |
JPH0695330B2 (ja) | 文書作成装置 | |
JPS62119665A (ja) | ワ−ドプロセツサ |