JPH09146944A - 仮名漢字変換装置 - Google Patents

仮名漢字変換装置

Info

Publication number
JPH09146944A
JPH09146944A JP7326389A JP32638995A JPH09146944A JP H09146944 A JPH09146944 A JP H09146944A JP 7326389 A JP7326389 A JP 7326389A JP 32638995 A JP32638995 A JP 32638995A JP H09146944 A JPH09146944 A JP H09146944A
Authority
JP
Japan
Prior art keywords
kana
kanji
conversion
character string
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7326389A
Other languages
English (en)
Other versions
JP3876451B2 (ja
Inventor
Yasuo Koyama
泰男 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EE I SOFT KK
Original Assignee
EE I SOFT KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EE I SOFT KK filed Critical EE I SOFT KK
Priority to JP32638995A priority Critical patent/JP3876451B2/ja
Publication of JPH09146944A publication Critical patent/JPH09146944A/ja
Application granted granted Critical
Publication of JP3876451B2 publication Critical patent/JP3876451B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 確定した文字列やスキャナ等から読み込み文
字認識した文字列に対して再変換を行なう場合、単語単
位で仮名に戻すと、「ひ行き」などのように一部が漢字
の文字列を再変換できない。 【解決手段】 指定された文字列に対して、まず単語単
位で逆引き辞書JDを参照して仮名文字列に逆変換し
(RC1)、単文節変換を行なう(KKC)。この手法
によっては適正な変換候補が得られない場合には、単漢
字単位で作成された逆引き辞書KDを参照して仮名文字
列を逆変換し(RC2)、その後、単文節変換を行なう
(KKC)。この結果、単語単位では、仮名文字列が得
られず、所望の再変換文字列が得られない場合でも、単
漢字単位で仮名文字列を得て、所望の変換文字列を得る
ことが容易となる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、仮名漢字変換装置
および仮名漢字変換方法に関し、少なくとも漢字を含む
文字列を取り込んでこれを変換する仮名漢字変換装置お
よび仮名漢字変換方法に関する。
【0002】
【従来の技術】日本語をコンピュータで扱うことを目的
として作られた仮名漢字変換装置では、仮名文字列を入
力し、これを漢字仮名混じり文に変換する。これに対し
て、近年、既に確定した文字列を再変換することを目的
として、あるいはOCRにより読み取った文字列や手書
き認識により読み取った文字列を再変換することを目的
として、漢字が混じった文字列を変換しようとするもの
が提案されている。
【0003】即ち、ワードプロセッサなどに入力して確
定済みの文字列に変換の誤りなどを見いだした場合に、
もう一度仮名文字列を入力する替わりに、入力され確定
済みの文字列から仮名文字列を作成して、再変換に供す
るのである。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
仮名漢字変換では、変換済みの文字列から逆変換用の単
語辞書(漢字見出しと読みとを有する辞書)を参照して
仮名文字列を得ているので、単語が不完全な形態で入力
されている場合には、再変換できないという問題があっ
た。例えば、手書き文字を認識する場合、「飛行機」や
「伊藤」といった熟語について画数の多い漢字を入力す
る手間を嫌って「ひ行き」「伊とー」と入力することが
考えられる。こうした文字列を正しい日本語文字列に変
換しようとすると、一旦これらの文字列を仮名文字列に
変換しなければならないが、辞書には「飛行機」を見出
しとする語は登録されていても、「ひ行き」といった語
は登録されていないから、うまく再変換できないと言う
問題を招致する。
【0005】また、一旦仮名文字列に変換できたとして
も、該当する単語が見いだされない場合には、入力を最
初からやり直さなければならなかった。例えば、名前な
どは種々の漢字を当てはめることができるので、一旦漢
字を仮名に戻してから仮名漢字変換を行なっても所望の
漢字を得ることができない場合があった。
【0006】本発明は、上記問題点を解決するためにな
され、少なくとも漢字が混じった文字列をスムースに仮
名漢字変換することを目的とする。
【0007】
【課題を解決するための手段およびその作用・効果】か
かる目的を達成するためになされた本発明の仮名漢字変
換装置は、少なくとも漢字を含んだ文字列を一旦仮名文
字列に変換した後、再度仮名漢字変換を行なう仮名漢字
変換装置であって、前記漢字を含む文字列を取り込む文
字列入力手段と、該取り込まれた文字列を、辞書を参照
して仮名文字列に逆変換する逆変換手段と、該逆変換に
より得られた仮名文字列を単文節として仮名漢字変換
し、単文節の変換候補を出力する第1の変換手段と、該
第1の変換手段により変換候補が得られなかった場合に
は、単漢字について漢字見出しと読みとを記録した第2
の辞書を参照して仮名文字列に逆変換し、該逆変換され
た仮名文字列を所望の仮名漢字変換に供する第2の変換
手段とを備えることを要旨とする。
【0008】この仮名漢字変換装置に対応した本発明の
仮名漢字変換方法は、少なくとも漢字を含んだ文字列を
一旦仮名文字列に変換した後、再度仮名漢字変換を行な
う仮名漢字変換方法であって、前記漢字を含む文字列
を、取り込み、該取り込まれた文字列を、文節を構成す
る語について漢字見出しと読みとを記録した第1の辞書
を参照して仮名文字列に逆変換し、該逆変換により得ら
れた仮名文字列を単文節として仮名漢字変換し、単文節
の変換候補を出力し、該変換により変換候補が得られな
かった場合には、単漢字について漢字見出しと読みとを
記録した第2の辞書を参照して仮名文字列に逆変換し、
該逆変換された仮名文字列を所望の仮名漢字変換に供す
ることを要旨とする。
【0009】かかる仮名漢字変換装置および方法は、O
CRやペン入力、キーボード入力などにより取り込んだ
漢字を含む文字列を、第1の辞書を参照して一旦仮名文
字列に逆変換し、これを文節を構成する語について漢字
見出しと読みとを記録した第1の辞書を用いて仮名文字
列に逆変換し、得られた仮名文字列を基に仮名漢字変換
を行なって、単文節の変換候補を出力する。かかる変換
候補が得られなかった場合には、単漢字について漢字見
出しと読みを記録した第2の辞書を参照して、前記取り
込まれた文字列を仮名文字列に逆変換し、これを所望の
仮名漢字変換に供する。従って、この仮名漢字変換装置
および方法によれば、対象となる文字列について文節を
構成する語が含まれるとしてまず逆変換および仮名漢字
変換を行なった後、変換候補が得られない場合(例えば
漢字の熟語の一部を仮名で入力した場合など)には、単
漢字についての第2の辞書を参照して逆変換を行なうこ
とにより、所望の変換候補を得られ易くなると言う利点
がある。
【0010】漢字などを含む文字列を再変換するといっ
た要請は、比較的短い文字列の範囲に対して生じると考
えられるから、単文節を前提とした逆変換および仮名漢
字変換を起動することにより、文法解析などの手間を低
減でき、短時間のうちに変換候補を得ることができる。
しかも、変換候補が得られない場合には、単漢字毎に逆
変換を行なってから仮名漢字変換に供するので、仮名漢
字変換の基本となる仮名文字列が必ず得られるという利
点がある。最終的に単漢字変換を用いれば、所望の変換
結果を得ることができる可能性は高い。
【0011】なお、第2の逆変換手段によって得られた
仮名文字列は、単文節の仮名漢字変換を行なう仮名漢字
変換手段による仮名漢字変換に供しても良いが、これ以
外の仮名漢字変換、例えば単漢字変換や連文節変換ある
いは自動変換などに供しても差し支えない。
【0012】この仮名漢字変換装置において、前記仮名
漢字変換手段に、第2の辞書を参照して得られた仮名文
字列について仮名漢字変換を行なう際、前記取り込まれ
た文字列に含まれる漢字と仮名漢字変換後に得られた単
文節に含まれる漢字とが一致するもののみを変換候補と
する変換候補制限手段を備えるものとすることができ
る。例えば、「公えん」と入力されたときに、「公園」
や「公演」は変換候補とするが、「講演」や「後援」な
どは候補としないのである。この結果、単文節変換にお
ける変換精度が各段に向上する。
【0013】また、この仮名漢字変換装置において、第
2の逆変換手段により得られた仮名文字列を基にして、
前記仮名漢字変換手段が変換候補を作成できなかった場
合には、該仮名文字列に対して単漢字変換を行なう単漢
字変換手段を備えるものとすることができる。この場合
には、仮名漢字変換用の辞書に登録がない文字列につい
て漢字候補を出力することができる。人名などの変換の
場合に有効である。更に、取り込まれた文字列に含まれ
る漢字の位置を、単漢字変換の対象となる仮名文字の区
切り位置とする区切り位置決定手段を備えるものとする
こともできる。この場合には、単漢字変換の区切り位置
が決定しやすいので、単漢字変換の変換精度を向上する
ことができる。例えば「ひ行き」という文字列を取り込
んだ場合、「行」を区切り位置として「ひ」と「き」に
ついて単漢字変換を行なえば良く、「ひこ(彦)」等を
変換候補とする必要がない。
【0014】仮名漢字変換手段による変換候補が得られ
なかった場合に、最終的に単漢字変換手段による単漢字
変換を行なう場合、得られた変換候補がいずれの変換手
段により変換されたものであるか直ちに判断することが
困難なことが考えられる。そこで、仮名漢字変換手段に
より出力される単文節としての変換候補と前記単漢字変
換手段により出力される単漢字としての変換候補とを区
別可能な態様で表示することも好適である。
【0015】漢字の含まれる文字列から仮名文字列を得
るには、漢字から仮名を取り出す逆変換用の辞書が必要
となる。この辞書は、専用に用意してもよいが、仮名文
字列を漢字混じり文に変換する仮名漢字変換用の辞書か
ら、生成することも可能である。なお、仮名漢字変換に
おいて新たな単語が登録された場合には、そのたびに逆
変換用の辞書を更新するものとすることも可能である。
この場合には、基本的に用意する辞書を一種類ですませ
ることができる。
【0016】上述した様々な仮名漢字変換装置におい
て、第2の辞書を単漢字変換用の辞書から生成するもの
とすることができる。この場合には、特別な辞書を用意
する必要がなく、簡便に第2の辞書を構築することがで
きる。
【0017】なお、仮名漢字変換手段によって漢字候補
を出力する場合には、使用頻度に応じた順に単漢字変換
による変換候補を出力するものとすることができる。単
漢字変換の場合には、変換候補が多数に上ることがあり
得るから、どのような手法で変換候補を出力するかは使
い勝手に影響を与えやすい。をその要旨とする。
【0018】
【発明の他の態様】本発明の他の態様として、入力手段
が手書き認識手段であるもの、スキャナなどの光学式文
字読み取り装置であるもの、音声認識装置である等、種
々の態様を考えることができる。更に、この仮名漢字変
換装置は、単独でワードプロセッサとして用いることも
できるし、仮名漢字変換を要する種々の機器に組み込ん
で用いることも可能である。また、コンピュータのオペ
レーティングシステムに組み込む形態で実現することも
可能である。コンピュータを用いた機器にソフトウェア
として組み込んで実現する場合には、このソフトウェア
を記録したフレキシブルディスクやCD−ROMなどの
形態で取り扱ったり、パソコン通信などを介して配布す
ることも可能である。
【0019】例えば、コンピュータシステムのマイクロ
プロセッサによって実行されることによって、少なくと
も漢字を含んだ文字列を一旦仮名文字列に変換した後、
再度仮名漢字変換を行なうソフトウェアプログラムを格
納した携帯型記憶媒体であって、前記漢字を含む文字列
を、取り込み、該取り込まれた文字列を、辞書を参照し
て仮名文字列に逆変換し、該逆変換により得られた仮名
文字列を単文節として仮名漢字変換して、単文節の変換
候補を出力し、該単文節の変換候補が得られなかった場
合には、前記逆変換された仮名文字列に対して単漢字変
換を行ない、単漢字の変換候補を出力する機能を実現す
るものが実施可能である。
【0020】これらの各部の機能を実現するソフトウェ
アプログラム(アプリケーションプログラム)は、フロ
ッピディスクやCD−ROM等の携帯型記憶媒体(可搬
型記憶媒体)に格納され、携帯型記憶媒体からコンピュ
ータシステムのメインメモリまたは外部記憶装置に転送
される。なお、通信回線を介して、これらのソフトウェ
アプログラムを提供する装置を設け、上記仮名漢字変換
方法を実現するソフトウェアプログラムを通信回線を介
して、この供給装置からコンピュータシステムのメイン
メモリまたは外部記憶装置に転送するものとしても良
い。例えば、電話回線を介してパソコン通信のホストコ
ンピュータからダウンロードしたり、衛星放送を用いて
配信を受けることも可能である。
【0021】
【発明の実施の形態】次に、本発明に係る仮名漢字変換
装置の好適な実施例について、図面に基づき説明する。
図1は、第1本実施例の仮名漢字変換装置の機能ブロッ
ク図、図2は、かかる仮名漢字変換装置が実現されるコ
ンピュータの概略構成を示すブロック図、である。
【0022】説明の便宜上、まず図2に従い、コンピュ
ータ10のハードウェア構成について説明する。このコ
ンピュータ10は、図示するように、ローカルバス22
に接続された演算処理部20、ローカルバス22を外部
バスの一つであるPCIバス32に接続するPCIブリ
ッジ30、PCIバス32を介して演算処理部20のC
PU21等によりアクセスを受けるコントローラ部4
0、各種のI/O装置等を制御する機器が低速の外部バ
スであるISAバス42に接続されたI/O部60、お
よび周辺機器であるキーボード72,スピーカ74,C
RT76などから構成されている。
【0023】演算処理部20は、中央演算処理装置とし
てのCPU21(本実施例ではインテル社製Penti
umを使用)、キャッシュメモリ23,そのキャッシュ
コントローラ24およびメインメモリ25から構成され
ている。PCIブリッジ30は、高速のPCIバス32
を制御する機能を備えたコントローラである。CPU2
1が扱うメモリ空間は、CPU21の内部に用意された
各種レジスタにより、実際の物理アドレスより広い論理
アドレスに拡張されている。
【0024】コントローラ部40は、モニタ(CRT)
76への画像の表示を司るグラフィックスコントローラ
(以下、VGAと呼ぶ)44、接続されるSCSI機器
とのデータ転送を司るSCSIコントローラ46、PC
Iバス32と下位のISAバスとのインタフェースを司
るPCI−ISAブリッジ48から構成されている。V
GA44は、CRT76に対して、640×480ドッ
ト、16色表示が可能である。なお、表示用のフォント
を記憶したキャラクタジェネレータや所定のコマンドを
受け取って所定の図形を描画するグラフィックコントロ
ーラ、さらには描画画像を記憶するビデオメモリ等は、
このVGA44に実装されているが、これらの構成は周
知のものなので、必要に応じて後述するものとし、図2
では省略した。
【0025】PCI−ISAブリッジ48を介して接続
されたISAバス42は、各種のI/O機器が接続され
る入出力制御用のバスであり、DMAコントローラ(以
下単にDMAと呼ぶ)50、リアルタイムクロック(R
TC)52、2つの複合I/Oポート54,55、サウ
ンドI/O56、キーボード72およびマウス73との
インタフェースを司るキーボードインタフェース(以下
KEYと呼ぶ)64、優先順位を有する割り込み制御を
行なう割り込みコントローラ(以下PICと呼ぶ)6
6、各種の時間カウントやビープ音を発生するタイマ6
8等から構成されている。なお、ISAバス42には、
拡張ボードが実装可能なISAスロット62が接続され
ている。
【0026】複合I/Oポート54には、パラレル出
力,シリアル出力の他、フロッピディスク装置82やハ
ードディスク84を制御する信号を入出力するポートが
用意されている。また、パラレル入出力には、パラレル
ポート86を介してプリンタ88が、シリアル入出力に
は、シリアルポート90を介してモデム92が、各々接
続されている。もう一つの複合I/Oポート55には、
スキャナ93や手書き入力可能なタブレット94が接続
されている。サウンドI/O56には、上述したスピー
カ74の他、マイクロフォン96が接続可能とされてい
る。これらの構成の他、DOS/V機では、標準化され
たI/Oチャンネルが用意されることも多いが、本実施
例では図示および説明は省略する。
【0027】次に、こうして構成されたハードウエアに
より実行される機能を図1を用いて説明する。図1に示
した各部の構成と働きについて概説するが、ここで行な
われる処理は、キーボード72,スキャナ93あるいは
タブレット94より入力されたデータに基づき、中央処
理装置(CPU21)が実行するものである。このCP
U21により、総ての処理がおこなわれる。仮名漢字変
換については、キーボード72などから文字列が入力さ
れた後、所定の操作によって仮名漢字変換の実行が指示
されたとき、所定の割込処理が起動し、取り込まれた文
字列(仮名文字列あるいは漢字を含む文字列)を変換
し、最終的に仮名漢字混じり文字列に変換するデバイス
ドライバが起動する。もとより、並列処理可能なコンピ
ュータであれば、仮名漢字変換を一つのアプリケーショ
ン(インプットメソッド)が行なうものとし、変換結果
を、必要とするアプリケーションに引き渡す構成として
も差し支えない。この場合には、キーボード72等から
の入力をインプットメソッドが一括して引き受けること
になる。
【0028】コンピュータ10上で実現されるこの仮名
漢字変換装置は、図1に示すように、文字列を入力部I
PUにより入力する。この入力部IPUは、既に文書と
して入力された文字列を範囲指定して取り込むのが基本
であるが、文字列を直接コードにより入力するキーボー
ド72、紙などに記載された文字を読み取り文字認識に
より文字列を認識するスキャナ93と文字認識ソフトウ
ェア、手書き文字を入力し文字列として認識するタブレ
ット94と手書き文字認識ソフトウェアなどを用いて、
文字列を入力するものも含まれる。
【0029】こうして入力された文字列には漢字が混じ
っていることがあり、漢字混じりの部分は、第1の逆変
換部RC1により、ハードディスク84に記憶された第
1の辞書を利用して仮名文字列に変換される。第1の辞
書は、漢字見出し(文節を構成し得る語)に対して少な
くともその読みを与えるものであり、実施例では、図3
に示しように、品詞情報を併せ持つ構造としている。
【0030】次に、第1の逆変換部RC1から得られた
仮名文字列を基に、仮名漢字変換部KKCが、単文節変
換を行なう。単文節変換は、周知のものであり、与えら
れた仮名文字列が、一つの自立語+付属語として構成さ
れるものとして、変換を行なう。単文節変換に限定する
と、仮名文字列に対する形態素解析などが簡略にでき、
単純なマッチングにより、変換候補を得ることができ
る。なお、詳しい処理の内容については後述する。単文
節変換には、図示を省略したが、仮名漢字変換用の自立
語辞書、付属語辞書が用いられる。
【0031】単文節変換により変換候補が得られた場合
には、これを出力し、出力された変換候補は、CRT7
6の所定の領域に表示される。一方、変換候補が得られ
なかった場合には、次に第2の逆変換部RC2を起動
し、入力部により得られた文字列に対して、単漢字の漢
字読み出しと読みとを含む第2の辞書を用いて仮名文字
れを行なう。この結果、文節を構成する語の一部であっ
て本来漢字で表記される部分が仮名になっているような
場合でも、仮名漢字変換を行なって、変換候補を得やす
くなる。なお、それでも変換候補が得られない場合に
は、図1には示していないが、更に単漢字変換を行なう
モジュールを起動することもできる。この場合には図示
しない単漢字変換辞書を利用する。単漢字変換であれ
ば、大部分の文字列について、変換候補を示すことがで
きる。
【0032】なお、これらの各部の機能を実現するソフ
トウェアプログラム(アプリケーションプログラム)
は、CPU21により直接実行可能にROMに記憶して
おくことも可能であるが、フレキシブルディスクやM
O,CD−ROM等の携帯型記憶媒体(可搬型記憶媒
体)に格納され、携帯型記憶媒体からこのコンピュータ
システムのメインメモリ25またはハードディスク84
に転送されて、実行されるものとすることもできる。な
お、通信回線を介して、これらのソフトウェアプログラ
ムを提供する装置を設け、この装置をモデム92を介し
て通信回線に接続し、供給装置から、当該ソフトウェア
プログラムをコンピュータシステムのメインメモリ25
またはハードディスク84に転送するものとしても良
い。
【0033】次に、各処理ルーチンについて、順次説明
する。図4および図5は、漢字を含む文字列を取り込ん
でこれを再度仮名漢字変換する再変換処理ルーチンを示
すフローチャートである。ワードプロセッサなどのアプ
リケーションプログラムを実行中に、既に入力され確定
された文字列の範囲を指定して、再変換の指示がなされ
ると、仮名漢字変換用のプログラムが起動され、図4お
よび図5に示す処理を開始する。
【0034】このルーチンが開始されると、まず対象文
字列を取得する処理が行なわれる(ステップS10
0)。対象文字列とは、範囲指定して本実施例の仮名漢
字変換プログラムに渡される文字列であり、以下で再変
換の対象となる文字列である。例えば、図6(A)に示
したように、確定した文字列「佐賀のは今日の北部に」
が対象文字列として取得されたものとする。次に、検索
文字ポインタと検索回数を初期化する処理を行ない(ス
テップS110)、まず検索文字を一つ追加する処理を
行なう(ステップS120)。図6(B)に示すよう
に、検索文字ポインタの初期値は0なので、ステップS
120の処理を一回行なうことにより、まず検索文字ポ
インタを先頭の文字に設定する。
【0035】次に逆引き自立語辞書JD1を検索する処
理を行なう(ステップS130)。即ち、検索文字ポイ
ンタが示している文字(図6では「佐」)について、第
1の辞書に相当する逆引き自立語辞書JD1を検索す
る。この辞書JD1は、漢字見出しにより検索が可能で
あり、実施例では、その読みと品詞情報とを得ることが
できる。検索した後、検索結果について判定する。逆引
き自立語辞書JD1は、漢字見出しの順に並んでおり、
一回の検索で同じ漢字見出しの単語が一つ読み出される
から、まずその漢字見出しについて最初の単語について
一致するかを判断する(ステップS140)。図6の例
のように一致する語が見つからない場合には、更に前方
一致があるか否かについて判断する(ステップS15
0)。「佐」にたいして「佐賀」や「佐藤」が存在する
場合には、前方一致する語が存在することになるから、
この場合には、ステップS120に戻って、検索文字を
一つ追加し、逆引き自立語辞書JD1の検索を再度実行
する。即ち、「佐賀」について逆引き自立語辞書JD1
を検索するのである。
【0036】この場合には、一致する語「佐賀」が見い
だされるので、処理は、図5に示すステップS160以
降に移行する。なお、検索回数番目での一致がなくかつ
前方一致もなければ、この逆引き自立語辞書JD1によ
っては適正な仮名文字列は得られないと判断して、図8
に示す追変換処理ルーチンに移行するが、この処理につ
いては後述する。
【0037】逆引き自立語辞書JD1を引いて丁度検索
回数番目の一致が見いだされた場合には(ステップS1
40)、該当する単語が自立語辞書JD1に登録されて
いると判断できるので、検索文字ポインタを一つ進め
(ステップS160)、続いて語尾/付属語検索回数を
初期化、即ち値1に設定する処理を行なう(ステップS
170)。次に検索文字を一つ追加して自立語に続く最
初の文字(図6(C)では「の」)にポインタをおい
て、語尾/付属語について逆引き辞書JD2を検索し
(ステップS190)、一致があるか否かを判断する
(ステップS200)。一致がなく、前方一致が見いだ
された場合には(ステップS210)、逆引き自立語辞
書JD1の検索の場合と同様、検索文字を追加し(ステ
ップS180)、再度逆引き語尾/付属語検索を行なう
(ステップS190)。なお、図6では、逆引き語尾/
付属語辞書JD2について、見出し語しか示さなかった
が、付属語には漢字からなる接辞(「化」、「課」、
「町」、「下さい」など)も存在するので、漢字もしく
は仮名の見出しとその読みおよび文法情報とから構成さ
れていることは、逆引き自立語辞書JD1と同様であ
る。
【0038】図6に示した例では、「の」は逆引き語尾
/付属語辞書に見出し語が見いだされるから、ステップ
S200での判断は「YES」となり、この場合には、
接続検定を行なう(ステップS220)。即ち、既に逆
引き自立語辞書の検索により見いだされた自立語との文
法上の接続を検定し、接続するか否かを判断するのであ
る(ステップS230)。地名「佐賀」に格助詞「の」
は接続するが、仮に接続しない場合には、検索回数を増
やして(ステップS240)、再度逆引き語尾/付属語
検索(ステップS190)以下の処理を行なう。この結
果、接続する語尾または付属語が見いだされた場合に
は、この語尾または付属語を、先に見いだされた自立語
に追加し(ステップS250)、取得された文字列すべ
てについて対象文字列を再構成したか判断する(ステッ
プS260)。図6の例では、検索ポインタが「の」に
置かれたとき、接続検定は「YES」となるから、対象
文字列の再構成が完了したかを判断し、まだ「は」が残
っていることから、ステップS160に戻って、検索文
字ポインタを一つ進める所から処理を繰り返す。この結
果、今度は「のは」という付属語が見いだされ、かつ対
象文字列がすべて再構成されたことになるから、仮名文
字列「さがのは」を得て、次に自立語の読みを用いた自
立語検索(ステップS270)を中心とする仮名漢字変
換を実行する(ステップS280)。即ち、図7に示す
ように、自立語を辞書を検索して、最長一致でかつ付属
語も接続する自立語を検索し、変換候補「佐賀のは」
「嵯峨のは」「性のは」などを表示し、使用者による候
補の選択などを受け付ける(ステップS300)。な
お、表示を伴う候補の選択処理の詳細については、後述
する。
【0039】語尾/付属語の検索において、検索回数番
目での一致がなくかつ前方一致も見いだされない場合に
は、語尾/付属語の検索に入る以前の自立語の切り出し
に問題があったと考えられるから、検索回数を増やし
(ステップS290)、図4に示したステップS130
に戻って、自立語の検索、即ち逆非自立語検索から処理
を再開する。この場合には、同じ見出しの次の語に一致
するものがあれば、これを用いて、上述した語尾/付属
語の検索や接続の検定を行なうことになる。例えば、文
字列「実物大の」についてまず「実物」までを逆引き自
立語検索で検索した結果、「実物、じつぶつ、名詞」を
見いだしたとすると、ここで一旦語尾/付属語検索を行
なう。ところが、「大」については逆引き語尾/付属語
辞書JD2には、対応する見出しがなく、前方一致も見
いだされない。この場合には、検索回数を増やして(ス
テップS290)再度検索を行ない(ステップS130
以下)、検索回数番目の一致はなく(ステップS14
0)かつ前方一致が見いだされるから(ステップS15
0)、次は自立語「実物大」を切り出してから、語尾/
付属語の検索に入ることになる。この場合には、付属語
「の」が見いだされ、対象文字列の再構成が完了する。
【0040】次に、逆引き自立語検索においていかなる
一致も見いだされない場合に実行される追変換処理につ
いて、図8を用いて説明する。図8に示した追変換が開
始されると、まず文字ポインタを初期化、即ち値1に設
定し(ステップS310)、まずそのポインタの位置か
ら1文字の取り出しを行なう(ステップS320)。こ
の文字が漢字が否かの判断を行ない(ステップS33
0)、漢字の場合には、第2の辞書に相当する逆引き単
漢字辞書KDを検索し(ステップS340)、漢字でな
ければそのまま読み(かな)を取得する(ステップS3
50)。得られた読み(仮名)を、既に取得された仮名
文字列の末尾に追加し(ステップS360)、文字ポイ
ンタを1だけ進める処理を行なう(ステップS37
0)。その後、残りの文字があるか否かを判断し(ステ
ップS380)、あればステップS320に戻って1文
字の取り出しから処理を繰り返す。
【0041】例えば、図9に示す「ひ行き」という文字
列の場合、図4および図5に示した再変換の手法では、
逆引き自立語検索の時点で破綻し、図8に示した追変換
が起動される。文字ポインタが値1の場合に取り出され
た文字「ひ」については、そのまま読み(仮名)「ひ」
を取得し、文字「行」については、逆引き単漢字辞書K
Dを参照して読み「こう」を取得する。こうして総ての
文字について処理を繰り返すと、読みとして「ひこう
き」が得られる。
【0042】残りの文字がなくなったとき、取得した読
みをもって単文節かな漢字変換を起動する(ステップS
390)。この変換は、図5に示したステップS280
と同一であり、仮名漢字変化により変換候補が得られる
と、次に候補選択処理(ステップS300)が実行され
る。そこで次に、候補選択処理(ステップS300)の
詳細について説明する。候補選択処理は、図10のフロ
ーチャートに示すように、まずキーボード72などから
の指示を受け付ける処理を行ない(ステップS40
0)、この指示が候補の選択を指示するものであれば、
候補を入れ替える処理を行なう(ステップS410)。
図7に示した再変換の結果の例では、最初の候補が「嵯
峨野は」となっていれば、これを次候補である「佐賀
の」や「性の」に入れ替えるのである。なお、「佐賀
の」に対して再変換を行なっているのであるから、再変
換の対象となった文字列「佐賀の」は候補として表示し
ないか、最後に表示する候補とすることも好適である。
【0043】また、指示が修正指示であれば(ステップ
S400)、表示していた候補を一旦仮名文字列に戻し
これを修正する処理を行なう(ステップS420)。得
ようとした文字列が「坂野は(さかのは)」であり、こ
れを誤って「さがのは」と入力したために誤変換を生じ
ていたといった場合には、確定文字列を仮名文字列に戻
して再変換を行なっても正しい変換結果を得ることはで
きない。そこで、こうした場合には、仮名文字列に戻し
た後、読み(仮名文字列)を修正する作業を行なうので
ある。読みを修正した後、単文節仮名漢字変換を実行す
る(ステップS430)。この変換処理は、上述した単
文節仮名漢字変換の処理(ステップS280,390)
と同一である。なお、追変換の場合も、文字列の修正と
その後の単文節仮名漢字変換の処理は、全く同様に行な
われる。
【0044】キーボード72等からの指示が確定の指示
である場合には、まず自立語辞書KDに、選択された候
補を優先的に出力するように学習する処理を行なう(ス
テップS440)。これは通常の仮名漢字変換における
学習と同様である。その後、現在選択されている候補か
らなる文節を確定文字列として出力する処理を行ない
(ステップS450)、本ルーチンを終了する。
【0045】以上の候補選択処理により、再変換もしく
は追変換の対象となった文字列を所望の日本語文字列に
容易に変換することができる。
【0046】以上説明した実施例では、逆引き自立語辞
書JD1や逆引き語尾・付属語辞書JD2は、それぞれ
自立語辞書KDや語尾・付属語辞書から生成するものと
して説明した。通常の自立語辞書KDなどは、見出しと
しての読み,変換文字列としての漢字および品詞情報と
を備えているので、これから図3に示した逆引き辞書を
生成することは容易である。このように自立語辞書など
から生成する場合でも、あるいは自立語辞書とは別に逆
引き辞書を用意する場合でも、新たな単語を登録した時
に逆引き辞書にもこれを登録する必要が存在する。図1
1は、単語登録の処理ルーチンを示すフローチャートで
ある。
【0047】図示するように、このルーチンが起動され
ると、まず登録しようとする単語を入力する処理を行な
う(ステップS500)。続いて、読みを入力する処理
を行ない(ステップS510)、更に品詞を入力する処
理を行なう(ステップS520)。品詞の入力は、予め
用意した品詞を選択することにより行なっても差し支え
ない。以上の情報を順次入力した後、自立語辞書もしく
は語尾・付属語辞書に登録する処理を行ない(ステップ
S530)、更に逆引き辞書に登録する処理を行なう
(ステップS540)。
【0048】この処理を実行することにより、単語登録
と同時に逆引き辞書も更新され、再変換や追変換の対象
とすることができるものとなる。
【0049】以上説明した実施例では、登録単語単位で
逆変換を行なってから再度仮名漢字変換に供すること
(再変換)と、単漢字単位で逆変換を行なってから再度
仮名漢字変換に供すること(追変換)とを行なっている
が、再度行なわれる仮名漢字変換は単文節変換としてい
る。これは、再変換や追変換の要請が複文節に亘って行
なわれることが少なく、むしろ変換の速度を優先すべき
考えれるからである。単文節変換では、接辞の処理(特
に接頭語)の処理が困難な場合が考えられるが、「接
辞」+「単語」を予め登録しておけば、単文節変換によ
っても容易に変換することができる。もとより、形態素
解析を行なうものとして、連文節変換を行なうものとす
ることもできる。
【0050】人名などの場合には、単文節変換によって
は所望の文字が得られない場合も考えられる。したがっ
て、こうした場合を含め、候補選択処理(ステップS3
00)において、単漢字変換の選択肢を加えることも好
適である。この例を図12に示す。キーボード72など
からの入力が単漢字変換の起動を指示するものである場
合には、読みを区切る処理を行ない(ステップS46
0)、区切った読み毎に単漢字変換を起動する(ステッ
プS470)。こうした単漢字変換によれば、図13に
示すように、「ひ行き」といった文字列が指定された場
合には、「行」という漢字の存在により、読みをその前
後で区切り、「ひ」と「き」とをそれぞれ単漢字変換す
ることになる。また、「行」については、単漢字変換の
対処としても良いし、既に漢字で入力されていると判断
し、単漢字変換の対象から除くことも望ましい。図13
の例では、漢字で入力された部分は、単漢字変換の対象
から除いてある。なお、入力した文字列に漢字の部分が
含まれていない場合には、先頭から単漢字変換の見出し
となりうる最大長の文字列を切り出し、順次単漢字変換
に供すれば良い。
【0051】こうした単漢字変換は、「ひ行き」のよう
に一部が漢字で入力された場合に有用であるばかりでな
く、図14に例示するように、確定した漢字文字列を変
換する場合にも有用である。特に人名の場合には、すべ
てを登録しておくことは困難なので、単漢字変換を併用
することは有用である。図14に示した人名「北岡」は
逆変換により仮名文字列「きたおか」を得たとしても、
通常の文節変換では、「貴田岡」に変換することは困難
である。こうした場合に、単漢字変換を起動し、逆変換
により得られた仮名文字列「きたおか」を、単漢字の見
出しのある最小の見出しの組み合わせに区切り、その
後、単漢字変換を起動する。この例では、「きた」+
「おか」、「きた」+「お」+「か」、「き」+「た」
+「おか」、「き」+「た」+「おか」、「き」+
「た」+「お」+「か」といった区切りが可能であり、
これらを適宜指定することで、「き」+「た」+「お
か」に対する単漢字変換を起動して、所望の漢字「貴」
+「田」+「岡」に変換することができる。なお、単漢
字変換により得られた変換候補と単文節変換により得ら
れた候補とは、異なる態様で表示することが望ましい。
図14に示した例では、変換の単位毎に区切って表示し
ており、いずれの変換が行なわれているか直感的に理解
できるが、更に表示の色などを変えることにより、明示
することも好適である。
【0052】以上説明したように本実施例の仮名漢字変
換装置は、確定した文字列や、スキャナ93により読み
込まれた文字列、あるいはタブレット94から手書き入
力され文字認識された文字列などに対して、単語単位で
逆変換して再度仮名漢字変換を実行し、この処理によっ
ては有意な候補が得られない場合には、漢字毎に単漢字
の逆変換を行なってから仮名漢字変換を行なう。したが
って、必ず漢字候補を得ることができ、誤変換などに対
する修正を容易に行なうことができる。
【0053】以上本発明の実施例について説明したが、
本発明はこの様な実施例になんら限定されるものではな
く、本発明の要旨を逸脱しない範囲において種々なる態
様で実施し得ることは勿論である。
【0054】
【図面の簡単な説明】
【図1】本実施例における仮名漢字変換の概略構成を示
す説明図である。
【図2】実施例で用いたコンピュータ10のハードウェ
ア構成を示すブロック図である。
【図3】逆引き辞書の構造を示す説明図である。
【図4】再変換処理の前半を示すフローチャートであ
る。
【図5】再変換処理の後半を示すフローチャートであ
る。
【図6】再変換処理の一例を示す説明図である。
【図7】再変換処理の後の単文節変換の様子を示す説明
図である。
【図8】追変換の処理を示すフローチャートである。
【図9】同じく追変換の様子を示す説明図である。
【図10】候補選択処理を示すフローチャートである。
【図11】単語登録処理ルーチンを示すフローチャート
である。
【図12】候補選択処理において単漢字変換を起動する
場合の処理を示すフローチャートである。
【図13】単漢字変換の様子を示す説明図である。
【図14】同じく単漢字変換の他の例を示す説明図であ
る。
【符号の説明】
10…コンピュータ 20…演算処理部 21…CPU 22…ローカルバス 23…キャッシュメモリ 24…キャッシュコントローラ 25…メインメモリ 30…PCIブリッジ 32…PCIバス 40…コントローラ部 42…ISAバス 44…VGA 46…SCSIコントローラ 48…ISAブリッジ 54,55…複合I/Oポート 54…複合I/Oポート 55…複合I/Oポート 56…サウンドI/O 60…I/O部 62…ISAスロット 68…タイマ 72…キーボード 73…マウス 74…スピーカ 76…CRT 82…フロッピディスク装置 84…ハードディスク 86…パラレルポート 88…プリンタ 90…シリアルポート 92…モデム 93…スキャナ 94…タブレット 96…マイクロフォン IPU…入力部 KEY…以下 PIC…以下 Pentium…インテル社製 RCU…逆変換部 SBC…単文節変換部 SKC…単漢字変換部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも漢字を含んだ文字列を一旦仮
    名文字列に変換した後、再度仮名漢字変換を行なう仮名
    漢字変換装置であって、 前記漢字を含む文字列を取り込む文字列入力手段と、 該取り込まれた文字列を、文節を構成する語について漢
    字見出しと読みとを記録した第1の辞書を参照して仮名
    文字列に逆変換する逆変換手段と、 該逆変換により得られた仮名文字列を単文節として仮名
    漢字変換し、単文節の変換候補を出力する仮名漢字変換
    手段と、 該仮名漢字変換手段により変換候補が得られなかった場
    合には、単漢字について漢字見出しと読みとを記録した
    第2の辞書を参照して仮名文字列に逆変換し、該逆変換
    された仮名文字列を所望の仮名漢字変換に供する第2の
    逆変換手段とを備える仮名漢字変換装置。
  2. 【請求項2】 前記第2の逆変換手段は、前記逆変換し
    て得られた仮名文字列を、前記単文節の変換候補を出力
    する前記仮名漢字変換手段に出力する請求項1記載の仮
    名漢字変換装置。
  3. 【請求項3】 請求項1記載の仮名漢字変換装置におい
    て、 前記仮名漢字変換手段は、前記第2の辞書を参照して得
    られた仮名文字列について仮名漢字変換を行なう際、前
    記取り込まれた文字列に含まれる漢字と仮名漢字変換後
    に得られた単文節に含まれる漢字とが一致するもののみ
    を変換候補とする変換候補制限手段を備えることを特徴
    とする仮名漢字変換装置。
  4. 【請求項4】 請求項1記載の仮名漢字変換装置におい
    て、 前記第2の逆変換手段により得られた仮名文字列を基に
    して、前記仮名漢字変換手段が変換候補を作成できなか
    った場合には、該仮名文字列に対して単漢字変換を行な
    う単漢字変換手段を備えた仮名漢字変換装置。
  5. 【請求項5】 請求項4記載の仮名漢字変換装置であっ
    て、 前記第2の逆変換手段が取り込んだ文字列に含まれる漢
    字の位置を、前記単漢字変換の対象となる仮名文字の区
    切り位置とする区切り位置決定手段を備えることを特徴
    とする仮名漢字変換装置。
  6. 【請求項6】 前記仮名漢字変換手段により出力される
    単文節としての変換候補と前記単漢字変換手段により出
    力される単漢字としての変換候補とを区別可能な態様で
    表示する表示手段を備えた請求項4記載の仮名漢字変換
    装置。
  7. 【請求項7】 請求項1ないし6のいずれか記載の仮名
    漢字変換装置であって、 仮名文字列を漢字混じり文に変換する仮名漢字変換用の
    辞書から、前記逆変換用の第1の辞書を生成する第1辞
    書辞書生成手段を備えた仮名漢字変換装置。
  8. 【請求項8】 請求項1ないし6のいずれか記載の仮名
    漢字変換装置において、 単漢字変換用の辞書から前記第2の辞書を生成する第2
    辞書生成手段を備えた仮名漢字変換装置。
  9. 【請求項9】 前記仮名漢字変換手段は、使用頻度に応
    じた順に単文節変換による変換候補を出力する手段を備
    えた請求項1ないし8記載の仮名漢字変換装置。
  10. 【請求項10】 少なくとも漢字を含んだ文字列を一旦
    仮名文字列に変換した後、再度仮名漢字変換を行なう仮
    名漢字変換方法であって、 前記漢字を含む文字列を、取り込み、 該取り込まれた文字列を、文節を構成する語について漢
    字見出しと読みとを記録した第1の辞書を参照して仮名
    文字列に逆変換し、 該逆変換により得られた仮名文字列を単文節として仮名
    漢字変換し、単文節の変換候補を出力し、 該変換により変換候補が得られなかった場合には、単漢
    字について漢字見出しと読みとを記録した第2の辞書を
    参照して仮名文字列に逆変換し、該逆変換された仮名文
    字列を所望の仮名漢字変換に供する仮名漢字変換方法。
JP32638995A 1995-11-20 1995-11-20 仮名漢字変換装置 Expired - Fee Related JP3876451B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32638995A JP3876451B2 (ja) 1995-11-20 1995-11-20 仮名漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32638995A JP3876451B2 (ja) 1995-11-20 1995-11-20 仮名漢字変換装置

Publications (2)

Publication Number Publication Date
JPH09146944A true JPH09146944A (ja) 1997-06-06
JP3876451B2 JP3876451B2 (ja) 2007-01-31

Family

ID=18187259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32638995A Expired - Fee Related JP3876451B2 (ja) 1995-11-20 1995-11-20 仮名漢字変換装置

Country Status (1)

Country Link
JP (1) JP3876451B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002288091A (ja) * 2001-03-28 2002-10-04 Seiko Epson Corp メール、データの表示
JP2012108893A (ja) * 2010-10-22 2012-06-07 Metamoji Corp 手描き入力方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002288091A (ja) * 2001-03-28 2002-10-04 Seiko Epson Corp メール、データの表示
JP2012108893A (ja) * 2010-10-22 2012-06-07 Metamoji Corp 手描き入力方法

Also Published As

Publication number Publication date
JP3876451B2 (ja) 2007-01-31

Similar Documents

Publication Publication Date Title
JP3689954B2 (ja) 異種コード文字列転記装置および電子辞書
JPH09146944A (ja) 仮名漢字変換装置
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JPS607514A (ja) ワ−ドプロセツサ
JPH10320399A (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JPS60105029A (ja) 文書入力装置
JPH077411B2 (ja) 文書処理装置
JPS59100941A (ja) 仮名漢字変換装置
JPH05282293A (ja) 文書作成装置
JP2833650B2 (ja) 文書処理装置
JP2837848B2 (ja) 電子辞書
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JPH07200605A (ja) 翻訳装置
JPS60207948A (ja) カナ漢字変換処理装置
JPS60112175A (ja) 仮名漢字変換装置における略称語変換方式
JPH10307823A (ja) 翻訳方法、翻訳装置及び翻訳プログラムを格納した 記録媒体
JPH09179865A (ja) 翻訳対象領域決定機能付き機械翻訳装置
JPH05197752A (ja) 機械翻訳装置
JPH08185400A (ja) 文字変換装置
JPH0981555A (ja) 文書処理装置及びその方法
JPS62140165A (ja) 仮名漢字変換方式
JPH0213341B2 (ja)
JPH0512251A (ja) 文書処理装置
JPH01197876A (ja) 電子辞書
JPH0769908B2 (ja) 文書処理装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20041015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061010

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061023

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091110

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101110

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101110

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111110

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111110

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121110

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121110

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131110

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees