JPH02311952A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPH02311952A
JPH02311952A JP1133737A JP13373789A JPH02311952A JP H02311952 A JPH02311952 A JP H02311952A JP 1133737 A JP1133737 A JP 1133737A JP 13373789 A JP13373789 A JP 13373789A JP H02311952 A JPH02311952 A JP H02311952A
Authority
JP
Japan
Prior art keywords
word
kana
words
okurigana
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1133737A
Other languages
English (en)
Other versions
JPH0769916B2 (ja
Inventor
Yoshizo Saito
斎藤 佳三
Takuji Kawamura
卓司 川村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1133737A priority Critical patent/JPH0769916B2/ja
Publication of JPH02311952A publication Critical patent/JPH02311952A/ja
Publication of JPH0769916B2 publication Critical patent/JPH0769916B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)産業上のIII用分野 この発明は、主として、日本語ワードプロセッサのよう
な、かな漢字変換辞書を備えた情報処理装置に用いられ
、入力されたかな文字列を漢字かな交じり文に変換する
かな漢字変換装置に関する。
(ロ)従来の技術 一般に、日本語における単語の中には、送りかなの付は
方によって許容される表記が複数存在する場合がある。
例えば、「おぼえかき」という単語であれば、「覚え書
」、「覚え書き」、「覚書」、「覚書き」等の送りがな
がある。
従来のかな漢字変換装置においては、例えば、上述した
「おぼえかき」のような、送りがなに種類の多い単語を
所望の送りがなで入力するためには、 ■送りがなの異なる単語を、全てかな漢字変換辞書1こ
登録しておき、そこから所望の送りがなの単語を選択す
る。
■一つの単語に対して一つの送りがなの表記のみをかな
漢字変換辞書に登録しておき、かな漢字変換後、所望の
送りがなに修正する。
■アルゴリズムで送りがなを削除する。つまり、送りが
なを全て付記した表記のみを辞書に登録しておき、それ
を変換の第1候補とし、そこから順に送りがなを削除す
る。例えば、前述の「おぼえかき」のように、送りがな
の候補が「覚え書」、「覚え書き」、「覚書」、「覚書
き」と4つあるような場合には、送りがなの字数の最も
多い表記を第1@補とし、第1候補(覚え書き)→第2
候補(覚え書、又は、覚書き)→第3候補(覚書)のよ
うにして、送りがなを自動的に削除してゆく。
というような方法を用いている。
(ハ)発明が解決しようとする課題 しかしながら、上述の■のように、かな漢字変換辞書内
に送りがなの異なる単語全てを登録することは、限られ
た辞書容量内での登録単語数の低下を招く。また、たと
え登録していたとしても、送りがなのっけかたには「好
み」や「くせ」というものがあり、その中の一種類か二
種類しか使用しない送りがなのパターンを、その都度選
択しなければならないことは、かえって操作を繁雑にし
てしまう。
また、上述の■のように、一つの単語に対して一つの送
りがなの表記しか登録していない場合には、単語を読出
す毎にその送りがなを修正(送りがなの追加、削除)し
なければならず不便である。
さらに、上述の■のように、アルゴリズムで送りがなを
削除する場合には、送りがなを追加する方向での表記の
処理が困難であり、例えば、「おぼえかき」の場合であ
れば、第1候補を「覚書」や「覚え書」にしたような場
合には、次の候補を「覚え書き」(送りがなの追加処理
)とすることが難しいという問題がある。
この発明は、このような事情を考慮してなされたもので
、送りがなに複数の表記が存在する単語については、そ
の送りがなのパターンをかな漢字変換辞書とは別にテー
ブルとして記憶しておき、その単語が続出される場合に
は、そのテーブルに基づいて送りがなを変化させるよう
にして、従来のような送りがなの追加、削除等の修正操
作を不要にした、かな漢字変換装置を提供するものであ
る。
(ニ)課題を解決するための手段 第1図はこの発明の構成を示すブロック図である。
図に示すように、この発明は、漢字を含む多数の単語を
その読み情報と共に記憶した辞書手段101と、辞書手
段lotに記憶された単語について複数種類の送りがな
を存する単語に付された識別符号102と、識別符号1
02が付された単語の送りがなのパターンをテーブルと
して記憶した送りがな記憶手段103と、入力手段10
4から入力された読み情報に対応する単語を辞書手段1
01から読出す読出し手段L05と、読出し手段105
によって続出される単語に前記識別符号102が付され
ているときには送りがな記憶手段103に記憶されたテ
ーブルに基づいてその単語の表記を前記複数種類の送り
がなの表記に順次変換する変換手段106と、変換手段
106によって送りがなの表記が変換された単語を表示
する表示手段107を備えてなるかな漢字変換装置であ
る。
なお、この発明における辞書手段101としては、漢字
を含む多数の単語をその読み情報と共に記憶できるもの
であればよ<、ROM、あるいはフロッピーディスク装
置、磁気ディスク装置等の外部記憶媒体が用いられる。
また、識別符号102としては、識別可能な番号、記号
等の各種の符号が用いられる。
さらに、送りがな記憶手段103としては、識別符号1
02が付された単語の送りがなのパターンをテーブルと
して記憶できるものであればよく、辞書手段101と同
様、ROM、あるいはフロッピーディスク装置、磁気デ
ィスク装置等の外部記憶媒体が用いられる。
そして、入力手段104としては、かな及び漢字の読み
情報としての平がな文字列等を入力できるものであれば
よく、例えば、キーボード、タブレット装置、0CR1
磁気テープ装置等が用いられる。
また、続出し手段105としては、入力手段104から
入力された読み情報に対応する単語を辞書手段101か
ら読出すことができるものであればよく、また、変換手
段106としては、読出し手段105によって続出され
る単語に識別符号102が付されているときには、送り
がな記憶手段103に記憶されたテーブルに基づいてそ
の単語の表記を複数種類の送りがなの表記に順次変換で
きるものであればよく、読出し手段105、及び変換手
段106としては、一般に、マイクロプロセッサを用い
るのが便利である。
そして、表示手段167としては、変換手段106によ
って送りがなの表記が変換された単語を表示できるもの
であればよく、プリンタ、ディスプレイ装置、磁気テー
プ装置、磁気ディスク装置等が用いられるが、処理内容
を迅速に確認できるものとしては、ディスプレイ装置を
用いて好適である。
(ホ)作用 第1図に示すように、この発明によれば、入力手段10
4から読み情報が入力されると、続出し手段105によ
って、その読み情報に対応する単語が辞書手段101か
ら読出される。
このとき、続出される単語に識別符号1G2が付されて
いる場合には、変換手段106によって、送りがな記憶
手段103に記憶されたテーブルに基づいて、その単語
の表記が複数種類の送りがなの表記に順次変換され、そ
れが表示手段107によって表示される。
従って、あらかじめ設定したテーブルに基づいて単語の
送りがなが変換されるので、従来のような送りがなの追
加、削除等の修正操作が不要となり、送りがなの異なる
単語の登録が一単語ですむため、辞書容量の節約が可能
となる。
(へ)実施例 以下、図面に示す実施例に基づいてこの発明を詳述する
。なお、これによってこの発明が限定されるものではな
い。
第2図はこの発明の一実施例を示す構成ブロック図であ
る。
この図において、lほかなキーやファンクションキー、
また、かな漢字変換を指示するためのかな漢字変換キー
、あるいは、入力内容を確定する実行キー等を備えたキ
ーボードであり、かなによる単語の読み情報を制御部2
に入力する。
制御部2はマイクロプロセッサから構成され、ROMか
らなるプログラムメモリ3に書き込まれている制御プロ
グラムに従い、後述する各種のデータ処理を行う。
4はキーボードlから入力されたかなによる単語の読み
情報を記憶する入力バッファである。
5はROMからなるかな漢字変換辞書であり、漢字を含
む多数の単語をその読み情報と共に記憶した自立語辞書
6、品詞情報を記憶した品詞テーブル7、送りがな情報
を記憶した送りがなテーブル8を有している。
自立語辞書6に記憶された単語の内、複数種類の送りが
なを有する単語(以後、送りがなにゆらぎのある単語と
いう。また特に、送りがなの変化を単にゆらぎという)
には、後述するような、送りがな番号が付されている。
また、送りがなテーブル8には、自立語辞書6内の送り
がな番号が付されている単語についての送りがなのパタ
ーンが、テーブルとして記憶されている。
9はCRTディスプレイやLC(液晶)ディスプレイ、
あるいはELディスプレイ等からなる表示装置である。
制御部2は、キーボード1から入力された単語の読み情
報、つまり、かな文字列を入力バッファ4に格納し、そ
のかな文字列に対してかな漢字変換が指示されたときに
は、そのかな文字列に対応する単語を自立語辞書6から
読出す。
そして、その続出した単語に送りがな番号が付されてい
るときには、送りがなテーブル8の、その送りがな番号
が示すポインタに位置する送りがなのパターンに基づい
て、その単語の表記を複数種類の送りがなの表記に順次
変換し、それを表示装置9に表示する。
第3図は自立語辞書6の記憶フォーマットを示す説明図
である。
図に示すように、自立語辞書6には、一つの単語につき
、語&lO1重複11.涜みがな12、品詞番号13、
表記14の項目が設けられており、さらに、送りがなに
ゆらぎのある単語についてのみ、送りがな番号15の項
目が設けられている。
語長10には、−単語についてのレコード長、重複11
には、単語の重複部分の記憶を避けるための、同一表記
についての変化部分のみを記憶しているという情報、読
みがな12には、見出しとしての平がな表記が、それぞ
れ記憶されている。
また、品詞番号13は、名詞、動詞等の品詞の情報か記
憶されるところであるが、各単語についての品詞情報は
、品詞テーブル7に別途記憶されており、品詞番号13
には、その単語の品詞情報が、品詞テーブル7の何番目
のレコードに記憶されているかのポインタ(数値)が記
憶されている。
表記14には、漢字を含む単語の表記が記憶されている
これらの、語長10、重複11、読みがなI2、品詞番
号13、表記14は、それぞれ従来公知の自立語辞書の
構造に準じている。
送りがな番号15には、上記の品詞テーブル7と同様に
、単語の送りがなのパターンが、送りがなテーブル8の
何番目のレコードに記憶されているかのポインタ(数値
)が記憶されている。
そして、単語に送りがな番号15が付加されているかど
うかは、品詞番号13がある一定の数値を超えているか
どうかで判定する。すなわち、送りがなにゆらぎのある
単語についての品詞情報を品詞テーブル7の後半にまと
めて登録しておき、品詞番号13を確認することによっ
て、その単語に送りがな番号15が付加されているかど
うかを判定できるようにしている。
第4図は送りがなテーブル8の記憶フォーマットを示す
説明図である。
図に示すように、送りがなテーブル8には、送りがな番
号順に、送りがなのパターンが、第1候補、第2候補、
第3候補、・・・・・・、というように、各単語につい
ての送りがなのパターン分の候補が記憶されている。例
えば、送りがな番号nであれば、第1候補(11100
000)、第2候補(10100000)、第3候補(
11110000)である。
この送りがなテーブルの内容は、1バイト単位で漢字表
記に対応させている。例えば、「おぼえかき」という、
第4図の送りがな番号nの送りがなパターンを育する単
語である場合には、読み文字データは、 (覚=2)(え=1)(書=1)(き=1)=211’
1であるので、この4桁の表記に、第5図に示すように
、それぞれ先頭から1ビツトずつ割り当てる。
そして、・第6図に示すように、ビットが°1(オン)
”になっている表記のみを抽出する。
このような処理方法だと、−文選択した単語の送りがな
について、その送りがなのパターンを学旨バッファに格
納しておけば、二度目からは、1回の変換で、その単語
について所望する送りがなでの表記を得ることができる
このようにして、送りがなのパターンを1バイト情報と
してテーブル化したものが第4図である。
第7図は第4図において1バイト情報で示した送りがな
のパターンを実際にかな漢字変換した場合の例を示す説
明図である。
図に示すように、第4図の送りがな番号nで示した送り
がなパターンである、上述の「おぼえかき」の例であれ
ば、第1候補(覚え書)−第2候補(覚書)−第3候補
(覚え書き)−第4候補(覚書き)−第5候補(おぼえ
かき)−第6候補(オボエガキ)と順次変換される。
このように、送りがなのパターンを、例えば、「おぼえ
かき」の場合であれば、先頭の4ビツト分について、“
l(オン)”、“0(オフ)”の情報でビット化して登
録しておき、「おぼえかき」と入力され、それをかな漢
字変換する場合には、最初の4文字の表記の読みデータ
に対応する送り、がなパターンのビットが“1(オン)
“だけの表記文字を抽出するようにする。
これらの変換の内、第5候補と第6候補については、単
語の先頭の文字は、通常、削除されることがないため、
これを利用して、先頭が“0(オフ)”、つまり、削除
のビットであれば、その単語の読みがなを全て平がな、
又はカナカナで表記するようにした例を示したものであ
る。
なお、送りがなのパターンの種類が255種類以内なら
、送りがな番号は1バイトの情報となって、送りがなパ
ターンの情報は固定長となり、送りがなパターンの種類
が256種類以上なら、送りがな番号は2バイトのアド
レス情報となり、送りがなパターンの情報は1バイトの
整数倍による可変長データとなる。
また、第7図に示した送りがなのパターンの1バイト情
報は一例であって、例えば、「覚え書き」の場合であれ
ば、先頭の4ビツトについては“1(オン)“と“0(
オフ)”とが逆でもよく、その場合の例を示したものが
第8図である。
次に、制御部2の処理動作の内容を第9図及び第10図
に示すフローチャートに従い説明する。
第9図はかな漢字変換が行われる場合の処理内容を示す
フローチャートである。
かな漢字変換が行われる場合には、まず、キーボードl
から文字列が入力され(ステップ201)、その文字列
が入力バッファ4に記憶された後、かな漢字変換が指示
されると(ステップ202) 、制御部2により、同音
異義語があるかどうかが判定され(ステップ203) 
、同音異義語がある場合には、同音異義語の候補が抽出
されて表示装置9に表示され(ステップ204) 、そ
れらの選択が行われる(ステップ205)。
次に、自立語辞書6の品詞番号13が検索されて、送り
がなにゆらぎがあるかどうかが判定され(ステップ20
8) 、送りがなにゆらぎがある場合には、送りがなの
ゆらぎが抽出されて表示装置9に表示され(ステップ2
07)、それらの選択が行われる(ステップ208)。
そして、文字列が再度入力される場合にはステップ20
1に戻り、文字列が入力されない場合にはかな漢字変換
処理の終了となる(ステップ209)。
第1O図は第9図に示した送りがなのゆらぎが抽出され
る場合の詳細フローチャートである。
送りがなのゆらぎが抽出される場合には、まず、自立語
辞書6内に送りがな番号が付加されているのかどうかが
判定され(ステップ301) 、送りがな番号が付加さ
れている場合には、その送りがな番号に基づいて送りが
なテーブル8が参照され(ステップ302) 、送りが
なテーブル8より、該当す゛る送りがなパターンの情報
が検索される(ステップ303)。
そして、漢字表記に対応させた送りがなパターンの1バ
イト情報より、送りがなが作成されて出力される(ステ
ップ304)。
このようにして、自立語辞書6に送りがな番号を付加し
た単語に関してのみ、あらかじめ送りがなテーブル8に
送りがなのパターンを登録しておき、そのテーブルに基
づいて単語の送りがなを変換することにより、自立語辞
書6の登録単語数を増大させることなく、単語を所望の
送りがなで表記することが可能となる。
(ト)発明の効果 この発明によれば、複数種類の送りがなを有する単語に
ついては、その送りがなのパターンを辞書手段とは別に
テーブルとして記憶しておき、その単語が読出されると
きには、そのテーブルに基づいて、その単語の表記を複
数種類の送りがなの表記に変換するようにしたので、従
来のような送りがなの追加、削除等の修正操作が不要と
なると共に、複数種類の送りがなを有する単語の登録が
一単語ですむため、辞書容量の節約が可能となる。
また、送りがなの表記の候補順位を、例えば、「おぼえ
かき」の場合であれば、第tl捕(覚え書)−第2候補
(覚書)→第3候補(覚え書き)−第4候補(覚書き)
のように、任意に設定することができるので、従来のア
ルゴリズムで送りがなを削除してゆくような、送りがな
の削除処理のみではなく、単語ごとの送りがなの追加、
及び削除処理が可能となる。
【図面の簡単な説明】
第1図はこの発明の構成を示すブロック図、第2図はこ
の発明の一実施例を示す構成ブロック図、第3図は自立
語辞書6の記憶フォーマットを示す説明図、第4図は送
りがなテーブル8の記憶フを一マットを示す説明図、第
5図は送りがなのビットの割り当て例を示す説明図、第
6図は送りがなのビットの抽出例を示す説明図、第7図
は送りがなのパターンを実際にかな漢字変換した場合の
例を示す説明図、第8図はビットパターンが逆の場合を
示す第7図相当図、第9図及び第1O図は実施例の動作
を示すフローチャートである。 1・・−キーボード、2・・・制御部、3・・・プログ
ラムメモリ、4・・・入力バッファ、5・・・かな漢字
変換辞書、6・・・自立語辞書、7・・・品詞テーブル
、8・・・送りがなテーブル、9・・・表示装置。 第 1 図 一2図 、:、3 図 1、4 図 層 号 策 5 図 第 6 図 第7図 ご8 図 第 9− −10::つ

Claims (1)

    【特許請求の範囲】
  1. 1、漢字を含む多数の単語をその読み情報と共に記憶し
    た辞書手段と、辞書手段に記憶された単語について複数
    種類の送りがなを有する単語に付された識別符号と、識
    別符号が付された単語の送りがなのパターンをテーブル
    として記憶した送りがな記憶手段と、入力手段からへ入
    力された読み情報に対応する単語を辞書手段から読出す
    読出し手段と、読出し手段によって読出される単語に前
    記識別符号が付されているときには送りがな記憶手段に
    記憶されたテーブルに基づいてその単語の表記を前記複
    数種類の送りがなの表記に順次変換する変換手段と、変
    換手段によって送りがなの表記が変換された単語を表示
    する表示手段を備えてなるかな漢字変換装置。
JP1133737A 1989-05-26 1989-05-26 かな漢字変換装置 Expired - Lifetime JPH0769916B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1133737A JPH0769916B2 (ja) 1989-05-26 1989-05-26 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1133737A JPH0769916B2 (ja) 1989-05-26 1989-05-26 かな漢字変換装置

Publications (2)

Publication Number Publication Date
JPH02311952A true JPH02311952A (ja) 1990-12-27
JPH0769916B2 JPH0769916B2 (ja) 1995-07-31

Family

ID=15111741

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1133737A Expired - Lifetime JPH0769916B2 (ja) 1989-05-26 1989-05-26 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPH0769916B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58101329A (ja) * 1981-12-11 1983-06-16 Nec Corp 和文情報入力装置
JPS59109939A (ja) * 1982-12-15 1984-06-25 Comput Basic Mach Technol Res Assoc 用例辞書
JPS6298455A (ja) * 1985-10-25 1987-05-07 Ricoh Co Ltd 文字列処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58101329A (ja) * 1981-12-11 1983-06-16 Nec Corp 和文情報入力装置
JPS59109939A (ja) * 1982-12-15 1984-06-25 Comput Basic Mach Technol Res Assoc 用例辞書
JPS6298455A (ja) * 1985-10-25 1987-05-07 Ricoh Co Ltd 文字列処理装置

Also Published As

Publication number Publication date
JPH0769916B2 (ja) 1995-07-31

Similar Documents

Publication Publication Date Title
JPH02311952A (ja) かな漢字変換装置
JPS60176169A (ja) 文章処理装置
JP2634926B2 (ja) かな漢字変換装置
US5404517A (en) Apparatus for assigning order for sequential display of randomly stored titles by comparing each of the titles and generating value indicating order based on the comparison
JPH0612548B2 (ja) 文書処理装置
JPS6010348B2 (ja) 半角・全角文字の自動変換方式
JPS58101329A (ja) 和文情報入力装置
JPS58151677A (ja) 翻訳文編集方法
JPH0363101B2 (ja)
JPS59100941A (ja) 仮名漢字変換装置
JPS62119665A (ja) ワ−ドプロセツサ
JPH1166061A (ja) 情報処理装置および情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2786260B2 (ja) かな漢字変換装置
JPS6370372A (ja) 文書処理装置
JP2845235B2 (ja) 文書データ処理装置
JPS61285573A (ja) 仮名漢字変換装置
JPS62271048A (ja) 索引出力装置
JP2603269B2 (ja) 文字処理装置
JPH032963A (ja) 文書処理装置
JPH10177573A (ja) 文書処理方法および装置
JPS63184864A (ja) 文章作成装置
JPH10124504A (ja) 電子辞書並びにその検索方法
JPS60129875A (ja) 仮名漢字変換装置における季語変換方式
JPS62267857A (ja) ワ−ドプロセツサ
JPH06266768A (ja) 電子ブックおよび電子ブックプレーヤにおける検索方式