JPH0776964B2 - 日本文入力方法 - Google Patents

日本文入力方法

Info

Publication number
JPH0776964B2
JPH0776964B2 JP57206151A JP20615182A JPH0776964B2 JP H0776964 B2 JPH0776964 B2 JP H0776964B2 JP 57206151 A JP57206151 A JP 57206151A JP 20615182 A JP20615182 A JP 20615182A JP H0776964 B2 JPH0776964 B2 JP H0776964B2
Authority
JP
Japan
Prior art keywords
key
candidate
conversion
reading
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57206151A
Other languages
English (en)
Other versions
JPS5998236A (ja
Inventor
晃 中島
正博 阿部
博志 光行
克彦 湯浦
宣之 武市
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP57206151A priority Critical patent/JPH0776964B2/ja
Publication of JPS5998236A publication Critical patent/JPS5998236A/ja
Publication of JPH0776964B2 publication Critical patent/JPH0776964B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、計算機,ワードプロセツサ等の情報処理装置
に入力するための日本文入力方法に関するものである。
〔従来技術〕
従来、計算機,ワードプロセツサ等の情報処理装置に漢
字を含む日本文を入力する入力方法として用いられてい
るものの一つにかな漢字変換方式がある。かな漢字変換
方式は文字通り、かなで入力された漢字や用語あるいは
文節等の情報を、漢字あるいは漢字かな混りの文に変換
する方式である。まず、かなを入力するための入力手段
としては英字とかなを切り換えて打鍵することのできる
タイプライタ形式のものが多い。かな漢字変換方式にお
いて、かなから変換された用語等は必ずしも一意に定ま
らず、複数になることがあり、その選択操作が煩雑であ
った。さらに、このような場合に、所望の用語等を選択
するためのキーが必要であるが、通常はテンキーと称す
る、3×3のマトリクス状になつている数字キーかもし
くは、キーボードが英字モードになつたとき、キーボー
ドの最上位に位置する数字キーが用いられることが多
い。この場合、前者のテンキーは、キーボードの主配列
とは離れた場所に置かれるため、キーボードを見ないで
打鍵する、いわゆるブラインドタツチには適さない。ま
た後者の数字キーは英字モードでしか打鍵できず、キー
ボードの最上位に位置するため、打鍵しにくい欠点があ
つた。
次に、かな漢字変換において、入力かなが、日本文の文
節を表わすものであつた場合に、その読みから、予め用
意されている用語辞書中の用語を探索し、該読みの前の
部分から最も長く一致するものを取り出す、いわゆる最
長一致探索法が広く行なわれている。用語辞書は、動詞
や形容詞といつたいわゆる用語に対してはその語幹が登
録されており、最長一致探索では、名詞などではその読
みすべてが対象になるのに比べ、用言は活用形を含まな
い、語幹のみが対象になるので、名詞等に比べ用語とし
ての長さが短くなる傾向がある。従つて、例えば、「カ
イニ」という読みを入力すると、最長一致探索の実行に
より、変換結果は、「貝に」のようになり、決して「買
いに」という結果は得られない。これは前者が「かい」
という読みで用語辞書に登録されているのに対し、後者
が「か」という読みで用語辞書に登録されているためで
ある。
また、変換された結果の漢字かな混り文が所望のものと
異なる場合の候補の表示,選択は、所望の用語が出現す
るまでの時間が長かつたり、操作性が悪いためにキーボ
ードの打鍵数および操作時間が長いという欠点があつ
た。
また、一度使用した用語が、次回に最も優先的にでてく
る機能はすでに実現されているが、その効果が、そのセ
ツシヨン内だけに限られ、一たん電源を切つた後では効
果がなかつたり、たとえ、その効果があるような装置で
あつても、一回用語を使用したという情報を蓄えるため
のメモリが、膨大であるといつた欠点があつた。
更に、用語の前に「お」や「ご」といつた短かい語を付
して作る表現などは、接頭語の処理といつた範ちゆうで
は処理できず、しばしば変換誤りを引き起こすという欠
点があつた。
また、通常の用語辞書とは別に、操作者が、自分で定義
した語などを蓄えておくための個人辞書は大ていのワー
ドプロセツサ等に用意されているが、その構造が不備で
あるため、アクセスに時間を費し、かつその保守も複雑
な処理を伴うという欠点を有していた。
〔発明の目的〕
本発明の目的は、ブラインドタツチで入力でき、かな漢
字変換精度が高くかつ操作性の良い日本文入力方法を提
供することにある。
〔発明の概要〕
上記目的を達成するため、本発明ではまず、入力された
カナ文字列のかな漢字変換結果の最上位の候補文字列を
テキスト文中に表示すると同時に、表示画面上に別に設
けた候補表示部分に複数の候補文字列を表示して、選択
手段により選択できるようにした。そして、新たに次の
カナ文字列が入力された場合には、その時点で自動的に
テキスト文中に表示された候補文字列を確立されたテキ
スト文として記憶する。従って、日本文の入力を効率的
に行なえる。
また、かな漢字変換結果の所望文字の選択や、表示され
ている候補以外の用語候補表示指示の機能を果すテンキ
ーを、ブラインドタツチができるように、右手のホーム
位置を中心とした位置に配置した。通常の仮名モードや
英字モードからの移行にはそれ専用のキーを設けること
により実現できる。このようにすれば、操作者はキーボ
ードを見ずにテンキーを操作でき、位置がホーム位置の
近くであることからホーム位置から手が離れないので操
作が容易になるのである。
また、用語探索の方法として、従来の最長一致探索法に
加え、最長一致探索で得られた用語の読みの長さをうし
ろから1文字削つて改めて探索する次最長一致探索法を
提案する。従来技術の項で述べたように、最長一致探索
法のみでは、「カイニ」の読みに対しては「貝に」しか
変換されないが、次最長一致探索法をも併せて用いれ
ば、「貝」の読みより1文字少ない「買」も探索される
ことになり、探索漏れを防ぐことができる。更に本発明
では、候補用語の並べ方についても規定しており、候補
用語の頻度順に並べれば、頻度の高い用語が候補リスト
の上位に並び、かな漢字変換率の向上が期待できる。ま
た、候補用語の中に品詞の異なるものが混入し、特に読
み長が短かい場合は、頻度の高い用語が多いという点
と、用語の場合は、辞書に貯えられている読みが語幹で
あり、名詞等に比べると短い読みで格納されている点と
から、用語を優先して候補リストの上位に置いている。
更に、一度使用した用語は、同じ文章中は勿論同じ使用
者、同様な利用分野では頻度多く出現する可能性があ
る。これは、同一セツシヨン内でのみならず長い期間に
わたつて言えることである。
従つて本発明では、用語辞書内に、一たん使つた用語に
対して前回使用フラグなるものをつけ、次回からその読
みが入力されたときは、最優先で候補リストに載せるこ
とを実現している。一たんつけられた前回使用フラグ
は、同じ読みの別の用語が選択された時点で消される。
〔発明の実施例〕
以下、本発明の一実施例を説明する。第1図は本発明に
おける日本文入力装置の一実施例を示す機能構成図であ
る。第1図において、処理装置101はマイクロプロセツ
サであり、プログラムメモリ102に格納されたプログラ
ムを読み出して実行するとともに、バスライン123を介
して各ブロツクの制御およびデータ転送制御を行なう。
キー入力装置112より、カナまたはローマ字で入力した
い日本語の単位、たとえば「文節」の読みを入力する
と、該読みに相当する文字コードの系列がキーコードメ
モリ111に貯えられる。キーコードメモリ111に貯えられ
た該文字コード列は、1字入力されるごとに、表示制御
回路116によつて表示装置117内のリフレツシユメモリの
該当する場所、すなわちカーソルポインタ113の示す表
示装置117のカーソル位置に書込まれる。表示装置117は
上記リフレツシユメモリを一定時間ごとに走査し、上記
文字コードに対応する文字発生装置115内の文字パタン
を表示制御回路116を通して受け取り表示する。
キー入力装置112より入力される文字は、前述のカナま
たはローマ字によるカナのみでなく、日本語文に現れる
すべての文字、たとえば、ひらがな,カタカナ,英字,
数字,記号を含んでいる。
キー入力装置112より、上記入力した文字系列の漢字か
な混り文への変換を指示するキー(以下「変換キー」と
称する。)が入力されると、処理装置101へ取り込まれ
た、プログラムメモリ102からのプログラムは、各辞書
フアイルのどの位置に所望の用語が登録されているかを
示す辞書インデツクステーブル109を参照し、用語辞書
フアイル120、個人辞書フアイル121および漢字辞書フア
イル122内に登録されている用語の、前記読み文字系列
に相当する部分を、外部記憶装置制御回路118を通して
辞書バツフア110に取込み、更に文法テーブル103、接尾
語テーブル104および接頭語テーブル105を参照しながら
後述する自立語切出し方法および接続チエツクによつて
前記読み文字系列より、自立語の切り出しおよび、該自
立語とそれ以降の文字系列の接続可能性をチエツクして
漢字かな混り文字系列を作成して、同音語リストメモリ
107に貯える。同音語リストメモリ107に貯えられた該漢
字かな混り文字系列は通常複数個存在するので、同音語
リストメモリ107には同音の(同一の読みを持つ)候補
として格納されている。前記プログラムは、同音語リス
トメモリ107内の候補を、後述する「候補のならべか
え」の手順によつて、最も確からしい候補を最も上位に
配するならべかえ操作を行ない、再配列を行なう。上記
同音リストメモリ107内の候補のうちの上位から一定数
(本実施例では3〜9個)は候補表示メモリ106へ送ら
れ、表示装置117の所定の候補場所へ表示される。同時
に、同音語リスト・メモリ107内の前記候補の最上位に
ある候補が表示装置117内の、カーソルポインタ113が示
されている場所に、前記読みに入れ代わつて表示される
が、同音語リスト・メモリ107内の候補のどの候補が上
記カーソルポインタ113が示す場所へ表示されているか
の情報も表示ポインタ108へ常に貯えられている。
第1図で示した日本文入力装置を操作している操作者
は、上記候補が表示されると、該表示された候補を見
て、所望の変換結果が、前記カーソルポインタ113が示
す表示装置117の位置へ表示されているかどうかを判定
し、所望の変換結果が表示されていれば、次に変換を所
望する変換単位の読みの入力を開始する。以下の処理の
流れは前記述べたことと同一である。
また、もし所望の変換結果と異なるものが表示装置117
へ表示されていれば、次のに述べる3つの操作のいずれ
かの操作を行なう。
〔操作1〕候補表示メモリ106の内容が表示されている
表示装置117の候補から、キー入力装置112の選択キーに
よつて所望の変換結果を選択する。表示されている候補
中に所望の変換結果がないときは、キー入力装置112に
ある「次ページキー」の打鍵により、候補表示メモリの
内容は、現在貯えられている候補につづく候補が同音語
リスト・メモリ107により取出され書き換えられる。
〔操作2〕キー入力装置112内の「次候補キー」の打鍵
により、表示装置117のカーソルポインタ113の内容に沿
つて表示されている変換結果が、同音語リスト・メモリ
107内の表示ポインタ108の示している候補の次に位置す
る候補に置きかえられ、同時に表示ポインタ108の内容
も該表示した候補を指すように書きかえられる。
〔操作3〕上記2種の操作によつても所望の変換結果が
得られないときは、キー入力装置112より、「変換取消
しキー」を打鍵すると、変換された前記変換単位の変換
結果はすべて無効となり、変換を行なう前の読み入力に
戻る。次に、キー入力装置112の、「後退」キーの打鍵
により、上記読みは後部より1文字ずつ削られていく。
適当なところで再び、変換を指示する「変換キー」をキ
ー入力装置112より入力すれば、前記同様の変換が行な
われる。
以上述べた操作を用いて作成された文書は、文書格納フ
アイル119に貯えられ、保存される。
第2図は以上述べたことを、処理の流れを主体として表
現したものであり、第1図におけるプログラムメモリ10
2内のプログラムが実行する手順を表わしている。第2
図において、ブロツク番号201〜208が処理の流れを表わ
すブロツクであり、二重枠で囲まれたブロツクは、第1
図に示した構成図の構成要素で、上記処理の流れにおい
て参照されたり、データを受け取つたりするものであ
る。第2図において、キー入力装置112より変換をする
ための読み入力201がなされ、変換指示のキー打鍵によ
り自立語切出し、文法チエツク202へと移る。自立語切
出し、文法チエツク202では、上記入力された読みよ
り、用語辞書フアイル120、個人辞書フアイル121および
漢字辞書フアイル122の外部記憶装置内の探索を行な
い、文法テーブル103、接尾語テーブル104および接頭語
テーブル105参照による接続チエツクを行ない、チエツ
クに合格したもののみが、同音語リスト・メモリ107に
格納される。次のブロツクの候補再配列203では、上記
用語切出し、接続チエツクに合格したもの(候補)を、
用語の頻度情報等を考えて候補の再配列を行なう。再配
列を行なつた結果の最上位のものは表示装置117のカー
ソル位置(文中)に表示され、上位から一定の数の候補
は、候補表示メモリへ移され、表示装置117の所定のエ
リアに候補表示204される。次の処理は、候補表示204の
結果を、操作者が見て、4通りに分かれる。1つは、表
示装置117のカーソル位置に表示された最上位候補が、
所望の変換結果であつたとき、操作者は、次に変換した
い文字列に対する読み入力(第2図のの操作)を開始
する。該読みを開始すると同時に表示装置117のカーソ
ル位置に表示されていた文字列は確立し、外部記憶装置
119〜122の頻度情報の更新208を行なう。他の1つは、
表示装置117の所定の位置に複数個表示された候補の中
から所望の候補をキー入力装置112の選択キーを用いて
選択する(205)ことである。もし、上記表示された候
補の中に所望の変換結果がなければ、次ページ(現在表
示されている候補の次に同音語リスト・メモリ107に位
置づけられた一定の数の候補)を指示するキーの打鍵
で、次の候補が表示される。選択キーによる選択操作
(205)が行なわれると、頻度情報更新208を行ない、処
理へ進む。他の1つは、表示装置117のカーソル位置
に表示された候補が所望の候補でなかつた場合に、キー
入力装置112の次候補キー(現在表示されている候補の
次に同音語リスト・メモリ107に位置づけられた候補)
打鍵による次候補の表示であり、次いで、第2図のの
場所へ制御が移る。該表示された候補が所望の用語であ
つたならば、前記述べたように次に変換したい文字列の
入力を開始する。他の1つは、同音語リスト・メモリ10
7中に所望の変換結果がない場合で、一たん、キー入力
装置112の「変換取消キー」を打鍵して変換前の読みに
戻し、キー入力装置112の「後退キー」使用によつて読
みを後の方から削り、読みの長さを短かくして再び変換
操作207を行ない、第2図におけるの処理へと移る処
理である。
第3図は、キー入力装置112のキー配列の一実施例を示
したものである。入力関連キー301は、本発明による日
本文入力装置の入力に係わるキー群、編集関連キー302
は編集校正に関するキー群であり、コントロールキー30
9は、キー入力装置112に配置されたキーの本来のキーの
意味を変更する(従つてキーコードも変化する)ための
キーである。ひらがなキー303は、日本文に現われるひ
らがなおよび漢字部分の読みを入力するために入力に先
だつて打鍵する入力モードキーである。また、カタカナ
・キー304、英数キー305はそれぞれ日本文のカタカナ、
英字・数字・記号の入力を指定するために入力に先だつ
て打鍵する入力モードキーであり、前記ひらがなキー30
3とともに排他的である。変換キー306は、入力した読み
を変換することを指示する機能および、前記次候補表示
を指示するための次候補キーと共用している。無変換キ
ー307は、入力した読みを変換せず、読み入力したひら
がなのままテキストに入力することを指示する機能、お
よび、変換キー306を入力して変換した結果が所望の変
換結果と異なり、しかも同音語リスト・メモリ107にも
ない場合に、もとの読みに戻すことを指示する変換取消
しキーを共用している。後端キー308は、上記変換した
結果を再びもとの読みに戻した後、変換の対象の読みを
短かくするために読みを後方から1つずつ削るために使
用するキーである。
第3図において一点鎖線−・−・−・で囲んだ範囲のキ
ー(310)は通常は文字キー(かな,英字,記号等)で
あるが、コントロールキー309との同時打鍵により、選
択キーとなる機能を持つている。この位置は、タイプす
る際、右手のホームポジシヨン、およびその上下の位置
に相当しており、従つてブラインド・タツチにより高速
にテンキーを打鍵できる。
第4図は第1図における表示装置117の表示画面を表わ
したものである。第4図において、401は、テキスト入
力文であり、「日本文」という文が既に作成されてい
る。次に例えば「入力し」という文を入力したいとす
る。第1図のキー入力装置112より「入力し」の読みの
最初の部分「にゆう」を入力すると、読み表示部分402
に「にゆう」と表示される。同時に、仮想選択キー403
に、「にゆう」という読みに対する単一の漢字の候補が
表示される。この状態で、候補漢字を選択したいときに
は、第3図のキー入力装置の選択キー310によつて選択
し、読み入力を続けたい場合は、更に前記キー入力装置
112より読み入力を続行する。
第5図は、「入力し」という文を入力するまでの、第4
図における仮想選択キーの表示状態の変化を表わしたも
のである。第5図において、501から504までの状態は第
3図の変換キー306を打鍵する以前であり、読み入力に
対しては、単一漢字の辞書を検索して候補を表示する。
501は読みが「に」の場合、502は読み入力が「にゆ」、
503は読み入力が「にゆう」、504は読み入力が「にゆう
り」,「にゆうりよ」,「にゆうりよく」,「にゆうり
よくし」の場合の候補の表示例である。上記の場合は、
文中401には文字は表示されず、選択キー310による選択
操作後はじめて文中401に挾持される。505は、読み入力
「にゆうりよくし」打鍵後、 を打鍵した後の候補表示例である。この場合は、文中40
1にも、505に表示された候補中の最上位の候補「入力
し」が表示される。
第13図は、第1図における漢字辞書フアイル122の構造
の一例を示したものである。第13図において、読み部分
1301,1304,1306,……は、おのおの4字のかなの読みに
なつており、各かな文字は1バイトずつで構成されてい
る。4文字以下の読みの場合は、空白(第13図において
で示されている。)を補充してあり、また4文字を越
える場合は4文字までで切つてあり、全ての読みは4バ
イトになつている。また漢字は漢字1文字が2バイトで
構成されており、「あ」という読み1301に対して、複数
個の数字「阿」(1302),「亜」(1303),……が続
き、再び次のかな読み「あい」(1304),漢字「愛」
(1305),……と連なつている。かな読みと漢字の区別
は次の通りである。「あ」というかなを構成する1バイ
トのビツト構成は例えば、1310,1311に示すようになつ
ており、1バイトの最上位ビツト1310を0にセツトし、
それ以下のビツト1311に、例えばJIS漢字コード「あ」
の下1バイトの2ビツト目以下のコードを割りつけてあ
る。また、「愛」という漢字の2バイトのコードの各バ
イトの最上位ビツト(1312,1313)を「1」にセツト
し、それ以外の部分(1313,1314)にJIS漢字コードの各
バイの最上位を除いた部分をセツトとしたものを用い
る。このようにすれば、読みのコードと漢字のコードが
1列に並んでいても、その最上位ビツトを見れば、読み
部分が漢字部分かを判定することができる。
第6図は、第2図における自立語切り出し、文法チエツ
ク202の内容を、処理の流れとして表わしたものであ
る。第6図において は実行する処理の内容を示し、◇は、◇の中に書かれて
ある条件が成立するかどうかの判断を行ない、成立する
ならば、YESと書かれた分枝に処理は流れ、成立しなけ
ればNOと書かれた分枝に処理は流れる。
また処理の流れを表わす線の横に書かれた内容は、該内
容の処理が該地点から開始されることを意味している。
第6図の、自立語切り出し、文法チエツクの処理流れ
を、具体的な例を用いながら説明する。
第7図には、第6図の自立語切り出し、文法チエツクの
処理の流れを具体的な例を用いた場合の辞書検索結果お
よび同音リストの内容を示している。第7図の1つ目の
例において、第1図のキー入力装置112より「せんか
に」というカナ系列が入力され、変換キーが押されたと
する。第6図の、探索すべきキー設定601により、「せ
んかに」を変換対象文字に設定されると、該キーにより
辞書との一致探索602が行なわれる。今、「せんかに」
という読みを持つ用語はないとすると、一致探索602の
結果は失敗するので、一致探索が失敗した(621)の分
枝に進む。このとき、同音リストの内容は空である。次
の判定、「次最長一致まで終了したか」に対しては、明
らかにNO(623)の分枝に進む。次の判定、「キーはま
だ削れるか(606)の判定に対しては、「せんかに」の
最後の1文字「に」が削れるからYES(624)の分枝に進
み、キーを一文字削つて(607)キーは「せんか」にな
る。次の判定条件「同音リストは空か」(608)では、
空であるのでYES(608)へ進んで、「せんか」というキ
ーで最長一致探索再開(626)の分枝に進んで再び最長
一致をやり直す。検索すべきキーは今度は「せんか」に
設定され(601)、該キーによる一致検索(602)の結果
は今度は成功し、例えば「戦火」「戦果」「専科」など
が取り出されるので、成功したか(603)の結果はYES
(620)の分枝に進み、付属語,接尾語接続チエツク604
を行なう。該チエツクの結果は成功し、第7図に示すよ
うに、同音リストの内容は、「戦火に」「戦果に」「専
科に」となる。
いま行なつたのは最長一致検索であるから、次最長一致
まで終了?(605)の判定はNO(623)の分枝に進み、更
にキーは「せんか」の「か」が削れるからキーがまだ削
れるか(606)の判定はYES(624)の分枝となり、キー
を一文字削つて(607)キーは「せん」となる。今度の
場合、同音リストは空でないから同音リストは空?(60
8)の判定はNO(627)の分枝へ進んで、次最長一致探索
開始へはいる。検索すべきキー設定(601)で「せん」
を設定し、設定したキーによる一致探索(602)では、
例えば「線」と言う用語が取り出されたとする。成功し
たか(603)の判定はYES(620)へ行き、付属語,接尾
語接続チエツク(604)の結果、例えば、接尾語として
「下」が一致し、付属語として「に」または「かに」が
チエツクに合格したとすると、同音リストの内容は、前
記最長一致の場合に登録されたもの合わせ、第7図に*
で示したようになる。
今の回は次最長一致探索まで終了しているから次最長一
致終了(605)の判断は、YES(622)に分枝し、単漢字
探索(614)を行なう。今の場合は「せんかに」という
読みを持つ単漢字は存在しないので、同音リストの内容
は不変であり、自立語切り出し、文法チエツクは終了す
る。
第7図の2番目の表の例は、最初のキーが「みのる」で
あつた場合の自立語切り出し、文法チエツクの結果を表
したものである。上記キーによる検索では、最長一致探
索により「実る」と出るが次最長一致ではもはや取り出
すべきキーが辞書中に存在せず、失敗、最後の単漢字検
索614によつて「実」「稔」「酉」という単漢字が引き
当てられた例である。またもし、最初の読みが「んろ」
などといつた、無意味なものであつた場合は、うしろか
ら1字ずつキーを削つていつても、辞書と一致する読み
にならず、第6図中の、キーはまだ削れるか(606)の
分枝がいつかはNO(625)すなわち、キーが1文字の状
態で更にキーを削ることはできない状態になるので、分
枝625に進む。同音語リストは空か(609)の判断は当然
のことながらYES(628)へ進み、接頭語処理は済んでい
るか(610)の間に対してはNO(631)へ進むが、接頭語
最長一致探索611による結果は成功せず、成功したか(6
12)の間には、NO(633)ということになり、単漢字探
索614によつても合致するものがないから結局、かな一
漢字変換は失敗に終わることになる。また、最初のキー
「だいせんそう」のように、接頭語付きの用語の場合
は、第6図の処理を行なうと、最長一致自体が、いくら
キーを削つても失敗し、最後には、キーはまだ削れるか
(606)でNO(625)の分枝へ行き、更に同音リストは空
か(609)でYES(628)の分枝へ行つた後、接頭語処理
は済んでいるか(610)の間に対して、NO(631)の分枝
へ行き、次いで、接頭語最長一致探索611において、
「大」「第」といつた接頭語を取り出すことができ、成
功したか(612)でYES(632)の分枝へ行くから、これ
より、接頭語を除いた部分をキーとする(613)処理に
よつてキーは「せんそう」となり、改めて、自立語切り
出し、文法チエツクを開始することになる。
第8図,第9図は第6図における文法チエツク,接尾語
接続チエツク604を実行するに必要な、接尾語テーブ
ル,文法テーブルの一例を示したものである。接尾語接
続チエツクでは、最初の読み全体から、最長一致で切出
された自立語を取り除いたカナ読み(第7図の1つ目の
表の次最長一致後の状態では「かに」)に対して、第8
図の読みの項目とのやはり最長一致探索を行なう。第7
図の上記の例では、「かに」という読みの接尾語は存在
せず、「か」の読みに対する接尾語「下」が引き当てら
れ、「線・下・に」となつている。
また、「線」という名詞のあとに、「かに」という語が
続くかどうかを、第9図の文法テーブルを用いて試験す
る。第9図に示す文法テーブルの作成規準は次の通りで
ある。(1)引き当てられた自立語が、名詞,代名詞,
固有名詞,副詞などのような非活用語(体言)の場合は
それに続くことのできる助詞。(2)引き当てられた自
立語が、動詞,形容詞,形容動詞等の活用語(用言)の
場合は、その活用語尾。以上の規準に合致する語を表に
書き込んである。上記の場合は「線」(名詞)+「か
に」であるので、第9図の品詞が名詞の部分を見ていく
と、接続語の「か」があるので、接続したと判定し、
「か」のあとの「に」はチエツクしない。このように、
第9図に記載されている語が、接続詞のはじめの方に含
まれていさえすれば接続OKとし、それ以後のチエツクは
行なわない。
第10図には、第6図における接頭語最長一致検索611を
行なう際に用いる接頭語テーブルを示したものである。
この場合は、第8図の接尾語テーブルの使用法と同じ
く、読みと、第10図の各接頭語との最長一致検索を行な
つて、接頭語を切り出し、残つた部分を改めて、読み入
力されたものと見なして第6図の自立語切り出しを再び
行なうのである。
第11図は第1図における用語辞書フアイル120および個
人辞書フアイル121のフアイルのデータの構造を示した
ものである。読み見出し1101は、ある見出しを持つ自立
語の読み見出しを示す。
表記1102、表記1105は、読み見出し1101に対応する表記
を表わしている。例を示すと、読み見出し1101に「こう
せい」と記されているとすると、表記1102には「構
成」、表記1105には「校正」が記されているという具合
である。文法情報1103、文法情報1106は、それぞれ表記
1102および表記1105に対する文法情報が示されており、
上記の例では、いずれも、「名詞」および「サ行変格活
用」と記されている。頻度情報1104および頻度情報1107
には、それぞれ表記1102および表記1105に対する頻度の
情報がかかれている。該頻度は、1つの読み見出しごと
に管理されている。すなわち、読み見出し1101の読みで
探索された場合、第1図の処理装置101内のバツフアメ
モリには、読み見出し1101の部分から、次の見出し1108
の直前までの全情報が転送される。前記のような選択操
作によつて、表記1102,表記1105,……のうちの1つの表
記で示される用語が選択されると、該選択された表記に
対応する頻度情報が1だけ加算される。該加算された頻
度情報が設定された最高値(通常は、頻度情報が貯えら
れているメモリが表し得る最大値)を越えるようなこと
が発生したときには、同じ読み見出し1101内の頻度情報
1104,1107,……全てからある一定値を差し引くか又は1
以下の数を掛けることにより、各用語の頻度の順位は不
変であり、なおかつ頻度情報の値にあふれが起きないよ
うにする。
読み見出し101の次にある読み見出し1108に対しても、
表記1109,……,文法情報1110,……,頻度情報1111,…
…,が続き、同様のデータ構造をしている。なお、第1
図における個人辞書フアイル121は、個人が使用する外
部記憶装置ごとに作られているがその構造は第11図に図
示したものと同じである。
頻度情報1104,1107の構成をそれぞれ(1120,1121),
(1122,1123)に示す。1120,1122は前回使用ビツトと呼
ばれるものであり、用語が選択されると、該選択された
用語の表記に対応する前回使用ビツトに値「1」をセツ
トし、同じ読みを持つ別の表記に対する前回使用ビツト
の値を0にセツトする。すなわち例えば、1120,1122が
同時に「1」となることはないわけである。次に上記読
みが入力されると、まず前回使用ビツトの1となつてい
るものを同音リストの最上位に配列する。また、1121,1
123は、頻度の値が書かれており、値の範囲は例えば0
〜127と定まつている。上記頻度に対応する表記の語が
選択されると、該頻度情報に1を加える。
ただし、このとき、上記頻度情報が127であつたときは
それに1を加えると128になつて、制限値を越えてしま
うので、上記選択された用語の読み見出しに対する全表
記に対する頻度情報を予め2で除し、かかる後に前記選
択された用語の頻度に1を加えるのである。
第12図は、第1図における同音語リスト・メモリ107の
同音異議語の並べかえに用いる再配列の規準を示したも
のである。第12図における規準は、前記前回使用語ビツ
トが1になつている語を最優先とするが、その中でも最
長一致で取り出された語のものが一ばん優先度が高く、
次いで次最長一致のものへと続く。上記前回使用ビツト
の更新は、個人辞書,用語辞書共通に行なわれるから、
一つの読み見出しについては最長一致語に1つ、次最長
一致語に1つしか前回使用ビツトは付かない。
次に、個人辞書の語,用語辞書の語と続くが、各々が、
4つのレベルに分かれており、それぞれ「用語の最長一
致語」「用言の次最長一致語」「体言の最長一致語」
「体言の次最長一致語」となつている。体言よりも用言
を順位を上げたのは、一般に用言の方頻度が高いからで
ある。
上記のような規準に従うと例えば、「わかい」という読
みに対しては、第6図における自立語切り出しは、まず
最長一致で「和解」、次最長一致で「若い」が取り出さ
れるが、体言よりも用言優先という規準に従い、同音語
リスト・メモリ107は、「若い」「和解」の順に並びか
えられる。なお第12図の再配列規準の、同一順位に複数
の候補が存在する場合は、第11図でも説明したように、
辞書中の頻度情報より頻度の高い順に並べられる。
〔発明の効果〕
本発明によれば、ブラインドタツチで入力でき、かな漢
字変換の変換精度が高くかつ操作性の良い日本文の入力
を実現できる。
【図面の簡単な説明】
第1図は、本発明による日本文入力装置の一実施例を示
す構成図、第2図は、本発明による日本文入力装置が行
なう処理の流れを表わした流れ図、第3図は、第1図に
おけるキー入力装置の一実施例を示す構成図、第4図
は、第1図における表示装置117の表示形式、第5図
は、第4図における仮想テンキーの表示例、第6図は、
本発明による日本文入力装置が行なう自立語の切り出し
の方法を説明する流れ図、第7図は、第4図における自
立語切り出しにより変化する、第1図における同音語リ
スト・メモリの内容を説明する図、第8図は、接尾語テ
ーブルの一例を示す図、第9図は、付属語接続テーブル
の一例を示す図、第10図は、接頭語テーブルの一例を示
す図、第11図は、第1図における用語辞書フアイルおよ
び個人辞書フアイルの構成の一実施例を示す図、第12図
は、第1図における同音語リスト・メモリを用いて行う
同音語再配列の規準を示す図である。第13図は漢字辞書
フアイルの構造を示す図である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 光行 博志 茨城県日立市東多賀町1丁目1番1号 株 式会社日立製作所多賀工場内 (72)発明者 湯浦 克彦 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 武市 宣之 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (56)参考文献 特開 昭57−94883(JP,A)

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】文字列を打鍵により入力する入力手段と、
    該文字列を所望の漢字かな混り文に変換する変換手段
    と、該変換された漢字かな混り文を表示する表示手段
    と、 選択操作によって所望の文字を得る選択手段を用いて日
    本文を入力する日本文入力方法において、 前記入力手段によりカナ文字列を入力し、 変換を指示する変換キーが打鍵される以前に、前記カナ
    文字列を読みの一部とする単一漢字からなる第1の候補
    群を前記変換手段より探索して前記表示手段の候補表示
    の部分に特定の数表示し、 前記変換キーが打鍵された以後に、前記カナ文字列に一
    致した熟語あるいは文節を含む第2の候補群を前記変換
    手段により探索して前記候補表示の部分に特定の数表示
    し、 前記選択手段によって、前記変換キーの操作の前には前
    記第1の候補群から所望の単一漢字を、前記変換キーの
    操作の後には前記第2の候補群から所望の熟語、文節ま
    たは単一漢字を選択することを特徴とする日本文入力方
    法。
  2. 【請求項2】前記入力手段は、仮名文字または英文字で
    打鍵され、かつ、テンキーが右手のホームポジションを
    中心とした場所に割り当てられ、前記テンキーの選択操
    作への切換え又はシフトを行うキーを含む前記キーボー
    ドであり、 前記表示手段による前記第1および第2の候補群の前記
    候補表示の部分での表示は、前記テンキーの配置に対応
    して行われ、 前記選択操作は、所望の前記第1または第2の候補群に
    対応する前記テンキーの打鍵により行われる特許請求の
    範囲第1項記載の日本文入力方法。
JP57206151A 1982-11-26 1982-11-26 日本文入力方法 Expired - Lifetime JPH0776964B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57206151A JPH0776964B2 (ja) 1982-11-26 1982-11-26 日本文入力方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57206151A JPH0776964B2 (ja) 1982-11-26 1982-11-26 日本文入力方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP4230920A Division JPH05197711A (ja) 1992-08-31 1992-08-31 日本文入力方法

Publications (2)

Publication Number Publication Date
JPS5998236A JPS5998236A (ja) 1984-06-06
JPH0776964B2 true JPH0776964B2 (ja) 1995-08-16

Family

ID=16518636

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57206151A Expired - Lifetime JPH0776964B2 (ja) 1982-11-26 1982-11-26 日本文入力方法

Country Status (1)

Country Link
JP (1) JPH0776964B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102439540B (zh) 2009-03-19 2015-04-08 谷歌股份有限公司 输入法编辑器
WO2010105427A1 (en) 2009-03-19 2010-09-23 Google Inc. Input method editor

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5087244A (ja) * 1973-12-05 1975-07-14
JPS55124862A (en) * 1979-03-19 1980-09-26 Toshiba Corp Frequency control unit
JPS5814689B2 (ja) * 1979-05-08 1983-03-22 富士通株式会社 同音異義語順次表示を行なう漢字まじり文入力装置
JPS5827529B2 (ja) * 1979-12-11 1983-06-10 富士通株式会社 漢字・仮名混り文作成装置
JPS5757373A (en) * 1980-09-25 1982-04-06 Canon Inc Character processing device
JPS5762461A (en) * 1980-10-02 1982-04-15 Nec Corp Word splitting system
JPS57153374A (en) * 1981-03-19 1982-09-21 Mitsubishi Electric Corp Kana-to-kanji converting system
JPS57187731A (en) * 1981-05-12 1982-11-18 Hitachi Ltd Kanji (chinese character) input system
JPS5794883A (en) * 1981-09-28 1982-06-12 Hitachi Ltd Word processor

Also Published As

Publication number Publication date
JPS5998236A (ja) 1984-06-06

Similar Documents

Publication Publication Date Title
CA1259416A (en) Machine translation system
KR100552085B1 (ko) 감소된 키보드 명확화 시스템
EP0370774A2 (en) Machine translation system
KR19990035985A (ko) 감축된 키보드 명료화 시스템
JP2005530272A (ja) 曖昧なテキスト入力の明確な文字フィルタリング
JPS62274360A (ja) ワ−ドプロセツサ
JPH0776964B2 (ja) 日本文入力方法
KR900008402B1 (ko) 기계번역장치
JPS6054032A (ja) 読み入力文字別の変換候補表示方法および装置
JPH05197711A (ja) 日本文入力方法
JPS6246029B2 (ja)
JPS6362018B2 (ja)
JPH06203063A (ja) 電子辞書
JPS6172359A (ja) べた書きかな漢字変換における文字修正方式
JP2539588B2 (ja) かな漢字変換方法
JP2024031263A (ja) 日本語入力システムのkearm詳細変換
JPS60195663A (ja) 日本語処理装置
JPS60136863A (ja) カナ漢字変換装置における短縮変換方式
JPS6172360A (ja) べた書きかな漢字変換方式
JPH08171568A (ja) 複数言語入力方法
JPS61196359A (ja) 文字処理装置
JPH03291747A (ja) かな漢字変換方式
JPH01204174A (ja) 文字処理装置
JPH02255936A (ja) 文書作成編集装置
JPH06110878A (ja) 仮名漢字変換方法