JPH05197711A - 日本文入力方法 - Google Patents

日本文入力方法

Info

Publication number
JPH05197711A
JPH05197711A JP4230920A JP23092092A JPH05197711A JP H05197711 A JPH05197711 A JP H05197711A JP 4230920 A JP4230920 A JP 4230920A JP 23092092 A JP23092092 A JP 23092092A JP H05197711 A JPH05197711 A JP H05197711A
Authority
JP
Japan
Prior art keywords
key
reading
kanji
term
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4230920A
Other languages
English (en)
Inventor
Akira Nakajima
晃 中島
Masahiro Abe
正博 阿部
Hiroshi Kogyo
博志 光行
Katsuhiko Yuura
克彦 湯浦
Noriyuki Takechi
宣之 武市
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4230920A priority Critical patent/JPH05197711A/ja
Publication of JPH05197711A publication Critical patent/JPH05197711A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】本発明の目的は、かな漢字変換精度が高くかつ
操作性の良い日本文入力装置を提供することにある。 【構成】用語探索の方法として従来の最長一致探索法等
を用いて、優先順位をつけて候補文字列を表示するとと
もに、候補文字列中に品詞の異なる用語が存在した場
合、用言の性質を持つ用語を体言の性質を持つ用語に優
先して表示する。候補用語の中に品詞の異なるものが混
入し、特に読み長が短い場合は、頻度の高い用言が多い
という点と、用言の場合は、辞書に貯えられている読み
が語幹であり、名詞等に比べると短い読みで格納されて
いる点とから、用言を優先して候補リストの上位に置い
ている。 【効果】本発明によれば、かな漢字変換の変換精度が高
くかつ操作性の良い日本文の入力を実現できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、計算機、ワードプロセ
ッサ等の情報処理装置に入力するための日本文入力方法
に関するものである。
【0002】
【従来の技術】従来、計算機、ワードプロセッサ等の情
報処理装置に漢字を含む日本文を入力する入力方式とし
て用いられているものの一つにかな漢字変換方式があ
る。かな漢字変換方式は文字通り、かなで入力された漢
字や用語あるいは文節等の情報を、漢字あるいは漢字か
な混りの文に変換する方式である。まず、かなを入力す
るための入力手段としては漢字とかなを切り換えて打鍵
することのできるタイプライタ形式のものが多い。かな
漢字変換方式において、かなから変換された用語等は必
ずしも一意に定まらず、複数になることがある。
【0003】かな漢字変換において、入力かなが、日本
文の文節を表わすものであった場合に、その読みから、
予め用意されている用語辞書中の用語を探索し、該読み
の前の部分から最も長く一致するものを取り出す、いわ
ゆる最長一致探索法が広く行なわれている。
【0004】
【発明が解決しようとする課題】この最長一致探索法に
おいて、用語辞書は、動詞や形容詞といったいわゆる用
言に対してはその語幹が登録されており、最長一致探索
では、名詞などではその読みすべてが対象になるのに比
べ、用言は活用形を含まない、語幹のみが対象になるの
で、名詞等に比べ用語としての長さが短くなる傾向があ
る。従って、例えば、「カイニ」という読みを入力する
と、最長一致探索の実行により、変換結果は、「貝に」
のようになり、決して「買いに」という結果は得られな
い。これは前者が「かい」という読みで用語辞書に登録
されているのに対し、後者が「か」という読みで用語辞
書に登録されているためである。
【0005】本発明の目的は、かな漢字変換精度が高く
かつ操作性の良い日本文入力装置を提供することにあ
る。
【0006】
【課題を解決するための手段】上記課題を解決するため
本発明は、用語探索の方法として従来の最長一致探索法
等を用いて、優先順位をつけて候補文字列を表示すると
ともに、候補文字列中に品詞の異なる用語が存在した場
合、用言の性質を持つ用語を体言の性質を持つ用語に優
先して表示する。
【0007】
【作用】候補用語の中に品詞の異なるものが混入し、特
に読み長が短い場合は、頻度の高い用言が多いという点
と、用言の場合は、辞書に貯えられている読みが語幹で
あり、名詞等に比べると短い読みで格納されている点と
から、用言を優先して候補リストの上位に置いている。
【0008】
【実施例】以下、本発明の一実施例を説明する。図1は
本発明における日本文入力装置の一実施例を示す機能構
成図である。図1において、処理装置101はマイクロ
プロセッサであり、プログラムメモリ102に格納され
たプログラムを読み出して実行するとともに、バスライ
ン123を介して各ブロックの制御およびデータ転送制
御を行なう。キー入力装置112より、カナまたはロー
マ字で入力したい日本語の単位、たとえば「文節」の読
みを入力すると、該読みに相当する文字コードの系列が
キーコードメモリ111に貯えられる。キーコードメモ
リ111に貯えられた該文字コード列は、1字入力され
るごとに、表示制御回路116によって表示装置117
内のリフレッシュメモリの該当する場所、すなわちカー
ソルポインタ113の示す表示装置117のカーソル位
置に書込まれる。表示装置117は上記リフレッシュメ
モリを一定時間ごとに走査し、上記文字コードに対応す
る文字発生装置115内の文字パタンを表示制御回路1
16を通して受け取り表示する。
【0009】キー入力装置112より入力される文字
は、前述のカナまたはローマ字によるカナのみでなく、
日本語文に現われるすべての文字、たとえば、ひらが
な、カタカナ、英字、数字、記号を含んでいる。
【0010】キー入力装置112より、上記入力した文
字系列の漢字かな混り文への変換を指示するキー(以下
「変換キー」と称する。)が入力されると、処理装置1
01へ取り込まれた、プログラムメモリ102からのプ
ログラムは、各辞書ファイルのどの位置に所望の用語が
登録されているかを示す辞書インデックステーブル10
9を参照し、用語辞書ファイル120、個人辞書ファイ
ル121および漢字辞書ファイル122内に登録されて
いる用語の、前記読み文字系列に相当する部分を、外部
記憶装置制御回路118を通して辞書バッファ110に
取込み、更に文法テーブル103、接尾語テーブル10
4および接頭語テーブル105を参照しながら後述する
自立語切出し方法および接続チェックによって前記読み
文字系列より、自立語の切り出しおよび、該自立語とそ
れ以降の文字系列の接続可能性をチェックして漢字かな
混り文字系列を作成して、同音語リストメモリ107に
貯える。同音語リストメモリ107に貯えられた該漢字
かな混り文字系列は通常複数個存在するので、同音語リ
ストメモリ107には同音の(同一の読みを持つ)候補
として格納されている。前記プログラムは、同音語リス
トメモリ107内の候補を、後述する「候補のならべか
え」の手順によって、最も確からしい候補を最も上位に
配するならべかえ操作を行ない、再配列を行なう。上記
同音リストメモリ107内の候補のうちの上位から一定
数(本実施例では3〜9個)は候補表示メモリ106へ
送られ、表示装置117の所定の候補場所へ表示され
る。同時に、同音語リスト・メモリ107内の前記候補
の最上位にある候補が表示装置117内の、カーソルポ
インタ113が示されている場所に、前記読みに入れ代
わって表示されるが、同音語リスト・メモリ107内の
候補のどの候補が上記カーソルポインタ113が示す場
所へ表示されているかの情報も表示ポインタ108へ常
に貯えられている。
【0011】図1で示した日本文入力装置を操作してい
る操作者は、上記候補が表示されると、該表示された候
補を見て、所望の変換結果が、前記カーソルポインタ1
13が示す表示装置117の位置へ表示されているかど
うかを判定し、所望の変換結果が表示されていれば、次
に変換を所望する変換単位の読みの入力を開始する。以
下の処理の流れは前記述べたことと同一である。
【0012】また、もし所望の変換結果と異なるものが
表示装置117へ表示されていれば、次に述べる3つの
操作のいずれかの操作を行なう。
【0013】〔操作1〕候補表示メモリ106の内容が
表示されている表示装置117の候補から、キー入力装
置112の選択キーによって所望の変換結果を選択す
る。表示されている候補中に所望の変換結果がないとき
は、キー入力装置112にある「次ページキー」の打鍵
により、候補表示メモリの内容は、現在貯えられている
候補につづく候補が同音語リスト・メモリ107より取
出され書き換えられる。
【0014】〔操作2〕キー入力装置112内の「次候
補キー」の打鍵により、表示装置117のカーソルポイ
ンタ113の内容に沿って表示されている変換結果が、
同音語リスト・メモリ107内の表示ポインタ108の
示している候補の次に位置する候補に置きかえられ、同
時に表示ポインタ108の内容も該表示した候補を指す
ように置きかえられる。
【0015】〔操作3〕上記2種の操作によっても所望
の変換結果が得られないときは、キー入力装置112よ
り、「変換取消しキー」を打鍵すると、変換された前記
変換単位の変換結果はすべて無効となり、変換を行なう
前の読み入力に戻る。次に、キー入力装置112の、
「後退」キーの打鍵により、上記読みは後部より1文字
ずつ削られていく。適当なところで再び、変換を指示す
る「変換キー」をキー入力装置112より入力すれば、
前記同様の変換が行なわれる。
【0016】以上述べた操作を用いて作成された文書
は、文書格納ファイル119に貯えられ、保存される。
【0017】図2は以上述べたことを、処理の流れを主
体として表現したものであり、図1におけるプログラム
メモリ102内のプログラムが実行する手順を表わして
いる。図2において、ブロック番号201〜208が処
理の流れを表わすブロックであり、二重枠で囲まれたブ
ロックは、図1に示した構成図の構成装置で、上記処理
の流れにおいて参照されたり、データを受け取ったりす
るものである。図2において、キー入力装置112より
変換をするための読み入力201がなされ、変換指示の
キー打鍵により自立語切出し、文法チェック202へと
移る。自立語切出し、文法チェック202では、上記入
力された読みより、用語辞書ファイル120、個人辞書
ファイル121および漢字辞書ファイル122の外部記
憶装置内の探索を行ない、文法テーブル103、接尾語
テーブル104および接頭語テーブル105参照による
接続チェックを行ない、チェックに合格したもののみ
が、同音語リスト・メモリ107に格納される。次のブ
ロックの候補再配列203では、上記用語切出し、接続
チェックに合格したもの(候補)を、用語の頻度情報等
を考えて候補の再配列を行なう。再配列を行なった結果
の再上位のものは表示装置117のカーソル位置(文
中)に表示され、上位から一定の数の候補は、候補表示
メモリへ移され、表示装置117の所定のエリアに候補
表示204される。次の処理は、候補表示204の結果
を、操作者が見て、4通りに分かれる。1つは、表示装
置117のカーソル位置に表示された最上位候補が、所
望の変換結果であったとき、操作者は、次に変換したい
文字列に対する読み入力(図2のの操作)を開始す
る。該読みを開始すると同時に表示装置117のカーソ
ル位置に表示されていた文字列は確立し、外部記憶装置
119〜122の頻度情報の更新208を行なう。他の
1つは、表示装置117の所定の位置に複数個表示され
た候補の中から所望の候補をキー入力装置112の選択
キーを用いて選択する(205)ことである。もし、上
記表示された候補の中に所望の変換結果がなければ、次
ページ(現在表示されている候補の次に同音語リスト・
メモリ107に位置づけられた一定の数の候補)を指示
するキーの打鍵で、次の候補が表示される。選択キーに
よる選択操作(205)が行なわれると、頻度情報更新
208を行ない、処理へ進む。他の1つは、表示装置
117のカーソル位置に表示された候補が所望の候補で
なかった場合に、キー入力装置112の次候補キー(現
在表示されている候補の次に同音語リスト・メモリ10
7に位置づけられた候補)打鍵による次候補の表示であ
り、次いで、図2のの場所へ制御が移る。該表示され
た候補が所望の用語であったならば、前記述べたように
次に変換したい文字列の入力を開始する。他の1つは、
同音語リスト・メモリ107中に所望の変換結果がない
場合で、一たん、キー入力装置112の「変換取消キ
ー」を打鍵して変換前の読みに戻し、キー入力装置11
2の「後退キー」使用によって読みを後の方から削り、
読みの長さを短くして再び変換操作207を行ない、図
2におけるの処理へと移る処理である。
【0018】図3は、キー入力装置112のキー配列の
一実施例を示したものである。入力関連キー301は、
本発明による日本文入力装置の入力に係わるキー群、編
集関連キー302は編集校正に関するキー群であり、コ
ントロールキー309は、キー入力装置112に配置さ
れたキーの本来のキーの意味を変更する(従ってキーコ
ードも変化する)ためのキーである。ひらがなキー30
3は、日本文に現われるひらがなおよび漢字部分の読み
を入力するために入力に先だって打鍵する入力モードキ
ーである。また、カタカナ・キー304、英数キー30
5はそれぞれ日本文のカタカナ、英字・数字・記号の入
力を指定するために入力に先だって打鍵する入力モード
キーであり、前記ひらがなキー303とともに排他的で
ある。変換キー306は、入力した読みを変換すること
を指示する機能および、前記次候補表示を指示するため
の次候補キーと共用している。無変換キー307は、入
力した読みを変換せず、読み入力したひらがなのままテ
キストに入力することを指示する機能、および、変換キ
ー306を入力して変換した結果が所望の変換結果と異
なり、しかも同音語リスト・メモリ107にもない場合
に、もとの読みに戻すことを指示する変換取消しキーを
共用している。後退キー308は、上記変換した結果を
再びもとの読みに戻した後、変換の対象の読みを短くす
るために読みを後方から1つずつ削るために使用するキ
ーである。
【0019】図3において一点鎖線−・−・−・ で囲んだ
範囲のキー(310)は通常は文字キー(かな、英字、
記号等)であるが、コントロールキー309との同時打
鍵により、選択キーとなる機能を持っている。この位置
は、タイプする際、右手のホームポジション、およびそ
の上下の位置に相当しており、従ってブラインド・タッ
チにより高速にテンキーを打鍵できる。
【0020】図4は図1における表示装置117の表示
画面を表わしたものである。図4において、401は、
テキスト入力文であり、「日本文」という文が既に作成
されている。次に例えば「入力し」という文を入力した
いとする。図1のキー入力装置112より「入力し」の
読みの最初の部分「にゅう」を入力すると、読み表示部
分402に「にゅう」と表示される。同時に、仮想選択
キー403に、「にゅう」という読みに対する単一の漢
字の候補が表示される。この状態で、候補漢字を選択し
たいときには、図3のキー入力装置の選択キー310に
よって選択し、読み入力を続けたい場合は、更に前記キ
ー入力装置112より読み入力を続行する。
【0021】図5は、「入力し」という文を入力するま
での、図4における仮想選択キーの表示状態の変化を表
わしたものである。図5において、501から504ま
での状態は図3の変換キー306を打鍵する以前であ
り、読み入力に対しては、単一漢字の辞書を検索して候
補を表示する。501は読みが「に」の場合、502は
読み入力が「にゅ」、503は読み入力が「にゅう」、
504は読み入力が「にゅうり」、「にゅうりょ」、
「にゅうりょく」、「にゅうりょくし」の場合の候補の
表示例である。上記の場合は、文中401には文字は表
示されず、選択キー310による選択操作後はじめて文
中401に表示される。505は、読み入力「にゅうり
ょくし」打鍵後、変換キーを打鍵した後の候補表示例で
ある。この場合は、文中401にも、505に表示され
た候補中の最上位の候補「入力し」が表示される。
【0022】図13は、図1における漢字辞書ファイル
122の構成の一例を示したものである。図13におい
て、読み部分1301,1304,1306,……は、
おのおの4字のかなの読みになっており、各かな文字は
1バイトずつで構成されている。4文字以下の読みの場
合は、空白(図13において_で示されている。)を補
充してあり、また4文字を超える場合は4文字までで切
ってあり、全ての読みは4バイトになっている。また漢
字は漢字1文字が2バイトで構成されており、「あ」と
いう読み1301に対して、複数個の漢字「阿」(13
02)、「亜」(1303)、……が続き、再び次のか
な読み「あい」(1304)、漢字「愛」(130
5)、……と連なっている。かな読みと漢字部の区別は
次の通りである。「あ」というかなを構成する1バイト
のビット構成は例えば、1310,1311に示すよう
になっており、1バイトの最上位ビット1310を0に
セットし、それ以下のビット1311に、例えばJIS
漢字コード「あ」の下1バイトの2ビット目以下のコー
ドを割りつけてある。また、「愛」という漢字の2バイ
トのコードの各バイトの最上位ビット(1312,13
13)を「1」にセットし、それ以外の部分(131
3,1314)にJIS漢字コードの各バイの最上位を
除いた部分をセットしたものを用いる。このようにすれ
ば、読みのコードと漢字のコードが1列に並んでいて
も、その最上位ビットを見れば、読み部分か漢字部分か
を判定することができる。
【0023】図6は、図2における自立語切り出し、文
法チェック202の内容を、処理の流れとして表わした
ものである。図6において□は実行する処理の内容を示
し、◇は、◇の中に書かれてある条件が成立するかどう
かの判断を行ない、成立するならば、YESと書かれた
分枝に処理は流れ、成立しなければNOと書かれた分枝
に処理は流れる。
【0024】また処理の流れを表わす線の横に書かれた
内容は、該内容の処理が該地点から開始されることを意
味している。
【0025】図6の、自立語切り出し、文法チェックの
処理の流れを、具体的な例を用いながら説明する。
【0026】図7には、図6の自立語切り出し、文法チ
ェックの処理の流れを具体的な例を用いた場合の辞書探
索結果および同音リストの内容を示している。図7の1
つ目の例において、図1のキー入力装置112より「せ
んかに」というカナ系列が入力され、変換キーが押され
たとする。図6の、探索すべきキー設定601により、
「せんかに」を変換対象文字に設定されると、該キーに
より辞書との一致探索602が行なわれる。今、「せん
かに」という読みを持つ用語はないとすると、一致探索
602の結果は失敗するので、一致探索が失敗した(6
21)の分枝に進む。このとき、同音リストの内容は空
である。次の判定、「次最長一致まで終了したか」に対
しては、明らかにNO(623)の分枝に進む。次の判
定、「キーはまだ削れるか(606)の判定に対して
は、「せんかに」の最後の1文字「に」が削れるからY
ES(624)の分枝に進み、キーを一文字削って(6
07)キーは「せんか」になる。次の判定条件「同音リ
ストは空か」(608)では、空であるのでYES(6
08)へ進んで、「せんか」というキーで最長一致探索
再開(626)の分枝に進んで再び最長一致をやり直
す。探索すべきキーは今度は「せんか」に設定され(6
01)、該キーによる一致探索(602)の結果は今度
は成功し、例えば「戦火」「戦果」「専科」などが取り
出されるので、成功したか(603)の結果はYES
(620)の分枝に進み、付属語、接尾語接続チェック
604を行なう。該チェックの結果は成功し、図7に示
すように、同音リストの内容は、「戦火に」「戦果に」
「専科に」となる。 いま行なったのは最長一致探索で
あるから、次最長一致まで終了?(605)の判定はN
O(623)の分枝に進み、更にキーは「せんか」の
「か」が削れるからキーがまだ削れるか(606)の判
定はYES(624)の分枝となり、キーを一文字削っ
て(607)キーは「せん」となる。今度の場合、同音
リストは空でないから同音リストは空?(608)の判
定はNO(627)の分枝へ進んで、次最長一致探索開
始へはいる。探索すべきキー設定(601)で「せん」
を設定し、設定したキーによる一致探索(602)で
は、例えば「線」という用語が取り出されたとする。成
功したか(603)の判定はYES(620)へ行き、
付属語、接尾語接続チェック(604)の結果、たとえ
ば、接尾語として「下」が一致し、付属語として「に」
または「かに」がチェックに合格したとすると、同音リ
ストの内容は、前記最長一致の場合に登録されたものと
合わせ、図7に*で示したようになる。
【0027】今の回は次最長一致探索まで終了している
から次最長一致終了(605)の判断は、YES(62
2)に分枝し、単漢字探索(614)を行なう。今の場
合は「せんかに」という読みを持つ単漢字は存在しない
ので、同音リストの内容は不変であり、自立語切り出
し、文法チェックは終了する。
【0028】図7の2番目の表の例は、最初のキーが
「みのる」であった場合の自立語切り出し、文法チェッ
クの結果を表したものである。上記キーによる探索で
は、最長一致探索により「実る」と出るが次最長一致で
はもはや取り出すべきキーが辞書中に存在せず、失敗、
最後の単漢字探索614によって「実」「稔」「酉」と
いう単漢字が引き当てられた例である。またもし、最初
の読みが「んろ」などといった、無意味なものであった
場合は、うしろから1字ずつキーを削っていっても、辞
書と一致する読みにならず、図6中の、キーはまだ削れ
るか(606)の分枝がいつかはNO(625)すなわ
ち、キーが1文字の状態で更にキーを削ることはできな
い状態になるので、分枝625に進む。同音語リストは
空か(609)の判断は当然のことながらYES(62
8)へ進み、接頭語処理は済んでいるか(610)の間
に対してはNO(631)へ進むが、接頭語最長一致探
索611による結果は成功せず、成功したか(612)
の問にはNO(633)ということになり、単漢字探索
614によっても合致するものがないから結局、かな−
漢字変換は失敗に終わることになる。また、最初のキー
「だいせんそう」のように、接頭語付きの用語の場合
は、図6の処理を行なうと、最長一致自体が、いくらキ
ーを削っても失敗し、最後には、キーはまだ削れるか
(606)でNO(625)の分枝へ行き、更に同音リ
ストは空か(609)でYES(628)の分枝へ行っ
た後、接頭語処理は済んでいるか(610)の問いに対
して、NO(631)の分枝へ行き、次いで、接頭語最
長一致探索611において、「大」「図」といった接頭
語を取り出すことができ、成功したか(612)でYE
S(632)の分枝へ行くから、これより、接頭語を除
いた部分をキーとする(613)処理によってキーは
「せんそう」となり、改めて、自立語切り出し、文法チ
ェックを開始することになる。
【0029】図8、図9は図6における文法チェック、
接尾語接続チェック604を実行するに必要な、接尾語
テーブル、文法テーブルの一例を示したものである。接
尾語接続チェックでは、最初の読み全体から、最長一致
で切出された自立語を取り除いたカナ読み(図7の1つ
目の表の次最長一致後の状態では「かに」)に対して、
図8の読みの項目とのやはり最長一致探索を行なう。図
7の上記の例では、「かに」という読みの接尾語は存在
せず、「か」の読みに対する接尾語「下」が引き当てら
れ、「線・下・に」となっている。
【0030】また、「線」という名詞のあとに、「か
に」という語が続くかどうかを、図9の文法テーブルを
用いて試験する。図9に示す文法テーブルの作成規準は
次の通りである。(1)引き当てられた自立語が、名詞、
代名詞、固有名詞、副詞などのような非活用語(体言)
の場合はそれに続くことのできる助詞。(2)引き当てら
れた自立語が、動詞、形容詞、形容動詞等の活用語(用
言)の場合は、その活用語尾。以上の規準に合致する語
を表に書き込んである。上記の場合は「線」(名詞)+
「かに」であるので、図9の品詞が名詞の部分を見てい
くと、接続語の「か」があるので、接続したと判定し、
「か」のあとの「に」はチェックしない。このように、
図9に記載されている語が、接続詞のはじめの方に含ま
れていさえすれば接続OKとし、それ以後のチェックは
行なわない。
【0031】図10には、図6における接頭語最長一致
探索611を行なう際に用いる接頭語テーブルを示した
ものである。この場合は、図8の接尾語テーブルの使用
法と同じく、読みと、図10の各接頭語との最長一致探
索を行なって、接頭語を切り出し、残った部分を改め
て、読み入力されたものと見なして図6の自立語切り出
しを再び行なうのである。
【0032】図11は図1における用語辞書ファイル1
20および個人辞書ファイル121のファイルのデータ
の構造を示したものである。読み見出し1101は、あ
る見出しを持つ自立語の読み見出しを示す。
【0033】表記1102、表記1105は、読み見出
し1101に対応する表記を表わしている。例を示す
と、読み見出し1101に「こうせい」と記されている
とすると、表記1102には「構成」、表記1105に
は「校正」が記されているという具合である。文法情報
1103、文法情報1106は、それぞれ表記1102
および表記1105に対する文法情報が示されており、
上記の例では、いずれも、「名詞」および「サ行変格活
用」と記されている。頻度情報1104および頻度情報
1107には、それぞれ表記1102および表記110
5に対する頻度の情報がかかれている。該頻度は、1つ
の読み見出しごとに管理されている。すなわち、読み見
出し1101の読みで探索された場合、図1の処理装置
101内のバッファメモリには、読み見出し1101の
部分から、次の読み見出し1108の直前までの全情報
が転送される。前記のような選択操作によって、表記1
102、表記1105、……のうちの1つの表記で示さ
れる用語が選択されると、該選択された表記に対応する
頻度情報が1だけ加算される。該加算された頻度情報が
設定された最高値(通常は、頻度情報が貯えられている
メモリが表し得る最大値)を越えるようなことが発生し
たときには、同じ読み見出し1101内の頻度情報11
04,1107,……全てからある一定値を差し引くか
又は1以下の数を掛けることにより、各用語の頻度の順
位は不変であり、なおかつ頻度情報の値にあふれが起き
ないようにする。
【0034】読み見出し1101の次にある読み見出し
1108に対しても、表記1109,……、文法情報1
110,……、頻度情報1111,……、が続き、同様
のデータ構造をしている。なお、図1における個人辞書
ファイル121は、個人が使用する外部記憶装置ごとに
作られているがその構造は図11に図示したものと同じ
である。
【0035】頻度情報1104,1107の構成をそれ
ぞれ(1120,1121)、(1122,1123)
に示す。1120,1122は前回使用ビットと呼ばれ
るものであり、用語が選択されると、該選択された用語
の表記に対応する前回使用ビットに値「1」をセット
し、同じ読みを持つ別の表記に対する前回使用ビットの
値を0にセットする。すなわち例えば、1120,11
22が同時に「1」となることはないわけである。次に
上記読みが入力されると、まず前回使用ビットの1とな
っているものを同音リストの最上位に配列する。また、
1121,1123は、頻度の値が書かれており、値の
範囲は例えば0〜127と定まっている。上記頻度に対
応する表記の語が選択されると、該頻度情報に1を加え
る。
【0036】ただし、このとき、上記頻度情報が127
であったときはそれに1を加えると128になって、制
限値を越えてしまうので、上記選択された用語の読み見
出しに対する全表記に対する頻度情報を予め2で除し、
かかる後に前記選択された用語の頻度に1を加えるので
ある。
【0037】図12は、図1における同音語リスト・メ
モリ107の同音異議語の並べかえに用いる再配列の規
準を示したものである。図12における規準は、前記前
回使用語ビットが1になっている語を最優先とするが、
その中でも最長一致で取り出された語のものが一ばん優
先度が高く、次いで次最長一致のものへと続く。上記前
回使用ビットの更新は、個人辞書、用語辞書共通に行な
われるから、一つの読み見出しについては最長一致語に
1つ、次最長一致語に1つしか前回使用ビットは付かな
い。
【0038】次に、個人辞書の語、用語辞書の語と続く
が、各々が、4つのレベルに分かれており、それぞれ
「用言の最長一致語」「用言の次最長一致語」「体言の
最長一致語」「体言の次最長一致語」となっている。体
言よりも用言を順位を上げたのは、一般に用言の方が頻
度が高いからである。
【0039】上記のような規準に従うと例えば、「わか
い」という読みに対しては、図6における自立語切り出
しでは、まず最長一致で「和解」、次最長一致で「若
い」が取り出されるが、体言よりも用言優先という規準
に従い、同音語リスト・メモリ107は、「若い」「和
解」の順に並びかえられる。なお図12の再配列規準
の、同一順位に複数の候補が存在する場合は、図11で
も説明したように、辞書中の頻度情報より頻度の高い順
に並べられる。
【0040】
【発明の効果】本発明によれば、かな漢字変換の変換精
度が高くかつ操作性の良い日本文の入力を実現できる。
【図面の簡単な説明】
【図1】本発明による日本文入力装置の一実施例を示す
構成図である。
【図2】本発明による日本文入力装置が行なう処理の流
れを表わした流れ図である。
【図3】図1におけるキー入力装置の一実施例を示す構
成図である。
【図4】図1における表示装置117の表示形式を示す
図である。
【図5】図4における仮想テンキーの表示例を示す図で
ある。
【図6】本発明による日本文入力装置が行なう自立語の
切り出し方法を説明する流れ図である。
【図7】図4における自立語切り出しにより変化する、
図1における同音語リスト・メモリの内容を説明する図
である。
【図8】接尾語テーブルの一例を示す図である。
【図9】付属語接続テーブルの一例を示す図である。
【図10】接頭語テーブルの一例を示す図である。
【図11】図1における用語辞書ファイルおよび個人辞
書ファイルの構成の一実施例を示す図である。
【図12】図1における同音語リスト・メモリを用いて
行う同音語再配列の規準を示す図である。
【図13】漢字辞書ファイルの構造を示す図である。
【符号の説明】
112…キー入力装置、107…同音語リストメモリ、
117…表示装置、…119〜122…外部記憶装置、
103〜105…テーブル類。
フロントページの続き (72)発明者 湯浦 克彦 東京都国分寺市東恋ケ窪1丁目280番地株 式会社日立製作所中央研究所内 (72)発明者 武市 宣之 東京都国分寺市東恋ケ窪1丁目280番地株 式会社日立製作所中央研究所内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】文字系列を打鍵により入力する入力手段
    と、該文字系列を変換操作によって所望の漢字かな混り
    文に変換する変換手段と、該変換された漢字かな混り文
    を表示する表示手段を用いて日本文を入力する日本文入
    力方法において、 前記変換手段は、前記カナ文字列を漢字かな混り文に変
    換するときに参照する用語辞書の内容をいったんメモリ
    上に取り出し、 該内容の中の用語が選択されると、該選択された用語に
    付随している頻度情報を更新して上記用語辞書に格納
    し、 次に上記内容と同じ読みが入力された時に該内容中に書
    かれた頻度情報の順に候補文字列を前記表示手段に表示
    するとともに、 候補文字列中に品詞の異なる用語が存在した場合、用言
    の性質を持つ用語を体言の性質を持つ用語に優先して表
    示することを特徴とする日本文入力方法。
JP4230920A 1992-08-31 1992-08-31 日本文入力方法 Pending JPH05197711A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4230920A JPH05197711A (ja) 1992-08-31 1992-08-31 日本文入力方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4230920A JPH05197711A (ja) 1992-08-31 1992-08-31 日本文入力方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP57206151A Division JPH0776964B2 (ja) 1982-11-26 1982-11-26 日本文入力方法

Publications (1)

Publication Number Publication Date
JPH05197711A true JPH05197711A (ja) 1993-08-06

Family

ID=16915357

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4230920A Pending JPH05197711A (ja) 1992-08-31 1992-08-31 日本文入力方法

Country Status (1)

Country Link
JP (1) JPH05197711A (ja)

Similar Documents

Publication Publication Date Title
KR19990035985A (ko) 감축된 키보드 명료화 시스템
JP2005530272A (ja) 曖昧なテキスト入力の明確な文字フィルタリング
KR20090007343A (ko) 키패드의 멀티캐릭터 키를 사용한 문자 숫자식 데이터 입력장치와 방법
JPS62274360A (ja) ワ−ドプロセツサ
JPH0776964B2 (ja) 日本文入力方法
JPH05197711A (ja) 日本文入力方法
JP2008117310A (ja) 辞書検索装置および辞書検索処理プログラム
JPS6054032A (ja) 読み入力文字別の変換候補表示方法および装置
JP2580138B2 (ja) かな漢字変換属性変更処理装置
JPS6246029B2 (ja)
JP2833650B2 (ja) 文書処理装置
JPS6172359A (ja) べた書きかな漢字変換における文字修正方式
JPS60195663A (ja) 日本語処理装置
JPS60136863A (ja) カナ漢字変換装置における短縮変換方式
JPS6172360A (ja) べた書きかな漢字変換方式
JPS61196359A (ja) 文字処理装置
JPS58222330A (ja) 日本語変換方式
JPH01204174A (ja) 文字処理装置
JPH06110878A (ja) 仮名漢字変換方法
JPH02255936A (ja) 文書作成編集装置
WO2007022591A1 (en) Word processing system
JPS62154170A (ja) 日本語入力方式
JPS6278673A (ja) 仮名漢字変換装置
JPS63138450A (ja) 同音異義語選択方式
JPH07168822A (ja) 情報処理装置