JPS60235271A

JPS60235271A - かな漢字変換装置

Info

Publication number: JPS60235271A
Application number: JP59090250A
Authority: JP
Inventors: Kimito Takeda; 武田　公人; Hiromi Saito; 裕美斎藤; Tsutomu Kawada; 河田　勉; Shigemi Nakazato; 茂美中里
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1984-05-08
Filing date: 1984-05-08
Publication date: 1985-11-21
Also published as: JPH0563831B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は例えば文単位として入力されるような長さの長
い連続仮名文字系列を適宜文節単位に区切りながら仮名
漢字変換を行って漢字仮名混じりの日本語文章を効果的
に作成することのできる仮名漢字変換装置に関する。

〔発明の技術的背景とその問題点〕

従来の日本語ワードプロセッサ等における仮名漢字入力
の単位は、一般に単一文節に限られており、また名詞の
複合語の入力においても高々数単位程度に限定されてい
るものが殆んどである。従って、この種の装置を用いて
日本語文章を入力作成する場合、単語あるいは文節の単
位を常に意識しなければならず、オペレータにとって大
きな負担となった。そこで最近では文章入力の単位を制
限することなく、文単位の読み仮名列、所網ペタ文を入
力し、とのペタ文に対して仮名漢字変換処理を行う研究
が種々試みられている。それらは具体的には、例えば文
節解析処理を再帰的に行うことでその目的を達成してい
る。然し乍ら、この為には相当長い処理時間を必要とし
、またバッファメモリを大量に消費せざるを得ないとい
う問題があった。また処理時間およびメモリ量を制限し
て文節解析処理のアルゴリズムを簡素化するととが考え
られているが、その変換処理精度が劣化することが否め
なかった。しかも、このようにして得られた変換結果を
どのように表示出力すれば、その同音語選択の指示を扱
い易くできるかが大きな課題となっていた。

例えば、「ざんだかをもとめる」なる文字列を仮名人力
した場合、「ざんだかを／もとめる」と機械的に文節分
割ができることが予想されるが、あるいは「ざんだかを
も／とめる」という分割形式も文法的にあシうる。この
場合、一般に経験的にみて所謂最長一致するものが確か
らしいと考えられるが、このような経験則だけに基いて
、常に入力文字列の前方から文節解析処理を行い、例え
ば「残高をも／止める」だけを抽出したのではその変換
精度が著しく悪くなる。従って、結局「残高をも／止め
る」、及び「残高を請求める」等の複数の変換候′補を
抽出し、その選択をオペレータの判断に委ねることが必
要となる。

また、「けいさんしき」という入力に対しても、本し装
置内の辞書に「計算式」という単語が登録されていない
とすると、結果は同様にして「計算／式」、「計算し／
木」と云うように複数の変換結果が生じる。更には「毛
／遺産／式」のような変換結果も生じる。更には仮に「
るけい−”流刑″」という単語が辞書登録されていると
すれば、［残高を請求め／流刑／算式］という候補も出
現する。

ところで、このような入力に対する多様な変換結果の中
で、最も確からしいものを第１順位に出力するだめの評
価処理として、例えば、全体を構成する文節数あるいは
単語数の少ない順に優先度を決定する方法が考えられて
いる。具体的には、例えば「こうがくしよと〈」の入力
に対して、「高額／所得」を「項が／句／所得」や「項
が／区処と７句」より確からしいと判定するものである
。尚、この場合、同音語については使用頻度の犬なる単
語から優先して出力するのが自然であり、好ましい。し
かし、全体を構成する文節数が同じであってもその区切
シ方が異なる場合もあり、また変換漏れを少々くするた
めに構成数の多い解析結果をも含めて出力する場合には
、その取扱うデータ構造が複雑になる。しかもオペレー
タがよシ選択操作を行い易くする為に、それらの複数の
変換結果をどのように表示出力するかが問題となる。

この問題を解釈するために例えば、複数の単語を辞書登
録した辞書検索部を用いて一連の入力文字列からその文
節単位の系列を抽出し、これらの各文節をその文節の読
みに対応する仮名漢字混じシ表記にそれぞれ変換して出
力するに際し、前記入力文字列に対する複数の文節系列
の相互に異なる区切多位置の中で最も前方にある文節始
点を基準点とし、この基準点以降に存在する次の文節の
自立語部分と前記基準点で区切られた前文節の付属を分
とを変換候補の単位として仮名漢字変換を行■ い、その変換候補を順に表示出力する手法が考慮されて
いる。

例えば上述した例の「ざんだかをもとめるけいさんしき
」という入力に対して、「残高をも／止める」や「残高
を請求める」のように文節系列の候補を作成し、その変
換候補結果を「〔残高〕を〔も止〕める」、「〔残高〕
を請求〕める」等のようにめ、これを順に表示出力する
ので、同音次候補の選択処理を非常に簡単化することが
できる。即ち、例えば、前記〔も止〕の部分については
、実際上「も止」という単語は存在しないが、その読み
仮名である「もと」の部分に他の同音単語情報や別表起
語が存在している。つまシ同じ読みに対応する他の候補
が存在することが示され、文節内の同音語の選択と同様
に同音語次候補の切シ換え指示によシ、異構造文節列の
選択が可能となる。

しかしながら、異構造文節列が自立語１つからなる場合
は、選択操作は簡易であるが、複数の自立語が組合わさ
ってな如たつ場合は、多くの同音語が出力されることと
なる。例えば、「研究や開発の活動の様子を今日的な視点から考えてみ
ると、研究成果の記録と公表に関する努力が不足してい
たとする執筆者の方々の反省の意見は」を、ベタ文で入
力すると、（研究や／開発、研究／夜会／発）の　（か集うの／様
子、活動のよう／果、活動のよう／酢、活動の／様子）
を　（今日／的、今日／敵、今日７滴、相に／知的）な
　（支店、軸、始点、支点）から　（煮−１勘が、観が
、缶が）えてみると、（研究／製か、研究／制か、研究
／声か、研究／生か、研究７世か、研究／性か、研究／
星か、研究／成果、研究／盛夏、研究／正価、研究／生
花、研究／−ｊ！！！菓、研究／肯未、件／急性か、兼
／急性か、券／急性か、剣／急性か、県／急性か、件／
急逝か、兼／急逝か、券／急逝か、剣／急逝か、県／急
逝か、件／旧制か、兼／旧制か、券／旧制か、剣／旧制
か、県／旧制か、件／旧姓か、兼／旧姓か、券／旧姓か
、剣／旧姓か、県／旧姓か、研究せ／意か、研究せ／以
下、研究せ／医科、研究せ／胃か、研究／製／日、研究
／制／日、研究／声／日、研究／生／日、研究／世／日
、研究／星／日、研究／製／課、研究／制／昧、研究／
声／課、研究／生／課、研究７世７課、研究／星／課、
研究／製／化、研究／制／化、研究／声／化、研究／生
／化、研究／世／化、研究／星／化、研究／製／科、研
究／制／科、研究／声／科、研究／生／科、研究／世／
科、研究／星／科、研究／製／家、研究／制／家、研究
／声／家、研究／生／家、研究／世／家、研究／星／家
、研究／製／下、研究／制／下、研究／声／下、研究／
生／下、研究／世／下、研究／星／下）の　記録と（好
評、公表、講評）に　（関、冠）する　努力が　不足し
てい　（たと刷、たとす、他とす、田とす）る　執筆　
（車、煮、社、舎）の　（労久不文、か細形、か円形、
か他型、か田型、か他方、か出方）の　反省　（のい件
は、の意見は、の達意は、のい兼は、のい券は、のい剣
は、のい県は、の意見派、の違憲派、の意見波、の違廠
波、のい兼派、のい券派、のい剣派、のい宗派、のい兼
波、のい側波、のい基波、のい基波）の変換候補が得られる。ここで、「けんきゅうせいかの
」の入力文に対しては６０以上の同音語が発生し、選択
に時間が多くかかり問題が多かった。

〔発明の目的〕本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、多数の同音語を効率よく選択し
て、文書作成の効率を向上し得るかな漢字変換装置を提
供することにある。

〔発明の概要〕

本発明は、同音語の選択に際し、確認された確認情報を
文節単位に記憶するのと合わせて、隣なシ合う文節との
組合せ情報も記憶し、この記憶された確認情報を含む変
換候補が出現したとき、優先して出力するようにしたも
のである。

〔発明の効果〕

かくして本発明によれば、例えば上述した例の「けんき
ゅうせいか」の入力に対して、「研究／成果」を選択す
ると、次に同じ入力があった場合、「研究／製か」より
「研究／成果」は優先して出力され、確認のみ行えばよ
い。即ち、例えば、前記「研究／成果」を選択すること
により、文節単位の確認情報として、「研究」と「成果
」が記憶され、合せてとなり合う組合せ情報として、「
研究−成果」が記憶されて、優先出力の対象となる。

上述の例文全てを選択すると以下の組合せ情報が記憶さ
れる。

■研究−開発　ｔＯ■研究−成果　ｔＱ■開発−活動　
ｔｌ　■成果−記録　ｔ３■活動一様子　ｔｏ　［Ｆ］
記録−公表　ｔ２■様子−今日ｔｔ　■公表−関する　
ｔ１■今日−的　ｔＯｏ関する一努力　ｔ３■的−視点
　ｔｌ　Ｏ努力−不足　× ■視点−考　１１　０執筆−者　ｔ２０５者一方々　ｔｌ　０反省−意見　ｔ２■方々−反省
　ｔ３　［相］意見− 上記例における組合せ情報の後に記しであるｔＱ〜ｔ３
　は記憶するタイミングを示しである。隣なシ合う文節
に同音異議語がある場合と、前又は後に同音異議語がな
い場合とて、タイミングが相異する。

ｔｏ・・・同音語が選択された時点で合成語となってい
る。

ｔｌ・　〃　前の文節が同音異礒語である。

ｔ２・・・　〃　前の文節が同音異礒語でない。

ｔ３．＝　ｔｔ　後の文節が同音異議語でない。

×・・・瞬なり合う文節が同音異議語でない。

ここで、×は、組合せ情報を記憶する必要はない。

又、文節間にある助詞、助動詞は無視して、例では示し
である。確認情報を記憶するタイミングにより、組合せ
情報として記憶しなくてもよい。

例えば、ｔｏのみ記憶することでも選択効率は高かくな
る。従って、異構造文節列の中の別の候補を選択する為
の特殊な指示キーを設けることなく、従来の同音語次候
補キーを用いてその選択処理を効率良く行うことが可能
となる等の絶大なる効果が奏せられる。

〔発明の実施例〕

以下、図面を参照して本発明の一実施例装置につき説明
する。

第１図は実施例装置の概略構成図である。入力装置１は
鍵盤装置や音声認識装置、仮名文字読取シ装置等からな
る。この入力装置１を介して入力される読みを表わす文
字列（第１の文字列）は、例えば仮名′文字コードに変
換された後、仮名漢字変換部２に与えられる。尚、上記
読みを表わす第１の文字列は、例えば平仮名、片仮名、
ローマ字等として示されるものである。

仮名漢字変換部２は、例えばブロック抽出部２ａ。

総文節系列抽出部２ｂ、文節抽出部２ｃ、および変換辞
書３によ）構成される。この仮名漢字変換部２は、前記
入力装置１よシ転送された第１の文字列に対して、それ
に該当する漢字混じシの表示文字列からなる第２の文字
列をめ、これを出力制御部４に与えている。ブロック抽
出部２ａは、上記第１の文字列に対して、特に長さの長
い入力文字列を能率よく解析する為に設けられたもので
あり、予め設定されている数値Ｎ１例えばＮ−４として
、Ｎ文節以内の文節系列として対応づける文節解析結果
をめるもので、対応した文節解析結果がない時には、上
記第１の入力文字列を幾つかのブロック区間に分割して
いる。そしてこのようにして分割した各ブロックの読み
仮名列を総文節系列抽出部２ｂに送り、またこの総文節
系列抽出部２ｂでめられた前記各ブロックについての仮
名漢字変換結果、即ち第２の文字列を順次出力制御部４
に送っている。

上記総文節系列抽出部２ｂは、文節抽出部２Ｃを用いて
前記第１の文字列を分割可能な文節系列に分割し、これ
らの文節系列についてそれぞれめられた仮名漢字混り表
記の変換結果を上記ブロック抽出部２ａに出力するもの
である。文節系列は前記入力文字列の文節分割可能な全
ての組合せについてめられ、例えば優先度の評価によっ
て、その確からしい候補の順に順位付されたのち、その
第１順位のものから順に出力される。尚、優先度の評価
としては、一般に文節個数が少ないもののほうが入力目
的とする漢字混り文に対応している傾向が高いことから
、例えば文節個数の少ない文節系列を優先して出力する
等して行われる。

文節抽出部２Ｃは、入力された文字コード列と変換辞書
３に予め登録された文字列（単＠）との間で照合検索を
行い、上記第１の文字列に該当する漢字混りの表記文字
からなる第２の文字列をめている。変換辞書３は、例え
ば第２図にそのメモリ構成例を示すように、入力見出し
表領域３ａ、出力見出し表領域３ｂおよび品詞領域３Ｃ
とを備え、上記入力見出し表領域３ａに読みを表わす第
１の文字列を格納し、またこの第１の文字列に対応する
漢字混じシの表記文字からなる第２の文字列を上記出力
見出し表領域３ｂに格納したものとなっている。

そして品詞領域３Ｃには、上記第１および第２の文字列
に対する品詞の情報を格納している。

しかして文節抽出部２Ｃは、与えられた入力文字列に対
して、例えば公知の前方最長一致法によシ変換辞書３０
入力見出し表領域３ａに予め登録されている文字列（単
語）を検索し、その活用語尾や付属語の解析等を行って
、前記入力文字列の碩学よシ最も長く一致した入力文字
列部分を文節抽出結果としてめている。この時、上記の
活用語尾の解析は品詞領域３Ｃに格納された品詞項目に
基いて行われる。そして、この解析によって見出された
文節抽出結果に対応する漢字混りの表記文字からなる第
２の文字列を前記出力見出し表領域３ｂから読出し、こ
れを出力している。更にこのとき、前記総文節系列抽出
部２ｂは、前記文節抽出部２Ｃへの入力単位（文節抽出
結果）を、前記入力文字列に対して定められたブロック
区間における文節分割可能な組合せについて様々に変化
させ、その中の最も確からしい文節系列をめている。

仮名漢字変換部２は、このような文節系列に対してめら
れた仮名漢字混じシ表記からなる第２の文字列を出力制
御部４の出力データメモリ５に転送している。出力制御
部４はこれらのデータを所定の表示出力形式に変換し、
文書表示用メモリ６に格納する。

文書表示用メモリ６に格納された、これらのデータは、
確認情報優先部８へ送られ、確認情報記憶部９を参照す
ることによシ、既でに確認された変換候補がなるときは
、その変換候補を優先して、出力するように、順番が変
更される。

本実施例において、確認情報記憶部９は、第３Ｅ　（ｄ
）に示すように、文節単位の情報と、瞬なυ合う文節の
組合せ情報からなる。文節単位の情報はＲＯＭにある単
語とＦＤＤ／ＲＡＭにある単語と別々に記憶をする。　
Ｒ，ＯＭにある単語は、かな漢字変換において、一般的
に使かわれる標準的単語を記憶する。ＦＤＤ／ＲＡＭに
ある単語は、利用者が登録した単語や、分野別の単語を
記憶している。この様に構成することにより、分野が変
更されたときに容易に確認情報の入れかえが可能となる
。

隣なシ合う文節の組合せ情報は、文節単位の情報の相対
位置と、標準的単語であるのか、利用者が登録した単語
又は、分野別の単語であるかの区別を記憶する。

第３図（ｅ）に前述例において、タイミングｔＱで記憶
した例を示す、。

ここで前記出力データメモリ５は第３図（ａ）に示すよ
うに組合せテーブル５ａ、マツピングテーブル５ｂ、見
出し語テーブル５Ｃからなり、上記辞書検索部２によっ
て変換された見出し語を、各組合せの構造と併わせて記
憶するものである。この例は第４図（ａ）に示す日本語
文の例をデータ格納構造を表の並びを記述している。こ
のテーブル５ａの行は文節構造の解釈上の種類を、列は
個々の文節構造における文節の繁がりを順に記述したも
のとなっている。即ち、最初のブロックでは候補が１種
類、２番目のブロックは２種類、３番目は３種類の系列
候補が有ることが示される。またこれらの各数値ハマッ
ピングテーブル５ｂの要素番号を示している。まだ各文
節単位毎に存在する同音異議語の見出し語をテーブル５
Ｃでグループ化して記憶し、マツピングテーブル５ｂの
各要素をポインタとして、見出し語テーブル５Ｃの各グ
ループをそれぞれ記述している。このようにして入力の
読み仮名位置との対応関係も同時に記述している。

第３図（ｂ）は前記出力データメモリ６の内容を表示装
置７に出力する為の文字表示情報をｉか臆する前記文書
表示用メモリ６のテーブル構造でめる。

このメモリ６は前記出力データメモリ５の内容に基いて
、同じ読み仮名位置にある同音意義語や異構造文節列に
ついて比較照合し、先ず入力文字列に対する全ての文節
系列候補中の共通の文節区切）箇所で前記入力文字列を
分割し、さらに共通の付属語文字部分および唯−通シ求
められる変換結果部分とをそれぞれ他の部分から切離し
て記述している。また、ある文節の頭部の見出し語文字
に対して、同じ読み仮名を付属語部分に持つ変換候補結
果については、先の文節頭部に合せて区切丸区切られた
後ろ側の付属語部分の文字列を次に続く文節に結合させ
て記述している。即ち、成る文節系列の文節における付
属語の文字であっても、対応する同じ読みの部分が他の
文節系列中において自立語の始シの一部になっていれば
、その付属語の文字は次に続く文節の変換候補に結合さ
せて記述している。

第３図（Ｃ）は、前記第３図（ｂ）の内容を、確認情報
優先部８によシ、順位変更した例である。この例では、
「資源開発」が、組合せ情報として、確認情報記憶部９
に記憶されていたと、「資源開発」が表示順位第１位に
変更される。

）これらの同音語は後述するように、その表示属性を通常
の表示属性とは異ならせて表示出力される。

第５図（ａ）〜（ｅ）はその表示例であり、斜線部が表
示属性の異なシを示している。この表示属性の変更は、
例えば表示文字の反転、プリンク、輝度変更。

下線性等によって行われる。

次に第３図に示す仮名文字入力例を用いて、上記仮名漢
字変換部２における仮名漢字変換処理につき説明する。

ブロック抽出部２ａは入力された文字系列の先頭から最
大Ｎ文節の系列を可能な限りめ体る。ここでＮを例えば
４とすると第４図（ａ）に示す例では、先づ入力系列全
体を文節抽出部２Ｃに入力し、最長一致法によシ「そし
て」を第１の文節結果として得る。次にこの文節切れ目
以降を始点（次の文節開始文字位置）として同様に最長
一致結果をめ、「こんどのと」なる文節を得る。このよ
うな処理を順に繰返して第１の文節系列候補「そして／
こんごのと／うしは／かいていし」を第４図（ｂ）中の
項目「ア」の如く得る。次にこの項目「ア」で得られた
文節系列と別の文節系列を得るために、第３番目の文節
結果「うしは」の最後の１文字、つま）その文節におい
て付属語として解析される「は」を削除してこれを文節
抽出部２Ｃに送シ、同様にして最長一致結果「うし」な
る文節を得、続く「は」で始まる文節としてｌ「は」を
める。

以下、同様にして上記第３、第２および第１の文節によ
シ短い文節が得られる都度、更にこれらに続く別の文節
列を順次求める。このようにして入力文字列に対して文
節分割可能な全ての４文節系列を第４図（ｂ）に示す如
くめる。尚この時、対応する漢字混じシの見出し語候補
（第２の文字列）も同時にめておく。

次にこれらの系列のうちで、その全体の長さが最長とな
る候補（文節系列）だけに着目する。このことは先に示
したように入力による文節数が最小となる系列が、入力
目的とする変換結果に合っている傾向が高いと太うこと
に立脚している。このことは、一つのブロックの文節構
成数が最小であればよく、まだ文節の構成数が同じであ
れば、そのブロックはより長い長さ全もっことを意味し
ている。

しかして前記第４図（ｂ）に示される結果の中で、最長
の文節系列となるものは、項目「ア」と項目「つ」に示
されるものである。そこで次にこれら文節系列が共通に
文節の切れ目をもっている個所を見つける。この例では
「そして／〜」と、「〜は／〜」しか共通の文節区切多
箇所としてめられる。ブロック抽出部２ａはこのような
２つの位置をブロックの区切りと判定するもので、第１
ブロック区間を「そして」、第２ブロック区間を「こん
どのとうしは」とする。そして順次これらの区間の文字
列を総文節列解析部２ｂに解析させ、それらの変換結果
を出力制御部４へ送っている。

この結果、上記第１のブロック区間は「そして」のみの
候補となシ、この情報が先ず出力制御部４へ送られる。

尚、この場合、他に同音語が無いので、そのまま文書中
の文字データ（変換結果）として通常形態で表示される
。しかる後、第２ブロック区間の解析が行われる。

ここで、前記総文節列解析部２ｂは、与えられたブロッ
ク区間の読みに対応した文字系列を総蟲りでめるもので
あるが、実際には第４図（ｂ）に示すように既に文節系
列がめられているので、その指定区間の範囲に対応する
ものだけ選べば十分である。そして優先度の評価として
、例えば文節数最小の構成の候補だけを選ぶと、その解
析結果は第４図（ｄ）の項目ｒＩ［Ｊのようになる。勿
論、その他の文節候補列も出力データメモリ５に与えて
おくようにしてもよい。例えば「今後の／問う７誌は」
をも、出力結果に加えることも可能である。

さて、ブロック抽出部２ａは、次に前記入力文字系列の
うちで未だにブロックが決定していない残りの部分、つ
まり「かいていしけ・・・・・・」なる文字列について
、同様の方法でブロックの単位をめ、第４図（ｄ）の項
目ｒＩ［Ｊに示す如き変換結果をめる。続いて変換結果
「限って」を第３図（ｄ）の項目「■」のようにめ、そ
の入力系列全体に対する変換処理を終了することになる
。

以上の変換結果は各ブロック毎に出力制御部４へ送られ
る。出力制御部４は出力データメモリ５に格納された各
ブロック毎のデータをそれぞれ変換し、文書表示用メモ
リ６に順次スタックし、出力の優先順位を変更し、表示
装置７に出力する。

即ち、出力制御部４では文書表示用データを前記第３図
（ｂ）の如く作成し、これを先ず第４図（ａ）に示すよ
うに表示装置７に出力している。上記の例では、「今後
のと」の文節候補に対しては、自立語部が“今後”とし
て、付属語部が“のと”として分離される。文節候補「
牛は」も同様に“牛”と“は″に分離される。また第２
文節系列候補では自立語部が“今後”、付属語部が“の
”として分離され、「投資は」は“投資”とパは”とに
分離される。従ってこの場合、“の”と“は”は共に共
通の付属語文字であシ、また“今後″には他に同音語が
ないので、これらの文字部分については通常の表示形態
で表示される。また他の文字については複数の変換候補
（同音異字）が存在することから、これを強調して示す
ために例えば高輝度で表示される。つま）、文節「今後
のと」における“と”は付属語ではあるが、次の文節単
語Ｐト」と共に扱われる。

従って、表示装置７には、「そして今後の〔と牛〕は〔
改定し限界発に〕限って」と表示されることになる。尚
、〔〕内は高輝度表示される文字を示している。

ここで目的とする見出し語の選択の為に、入力装置１に
は例えば第１図中１ａに示すように次候補キーが設けら
れている。この次候補キー１ａは、例えば第５図に示す
ように〔と牛〕の部分にカーソル１ｂを合わせ、この状
態で前記次候補キー１ａが操作されたとき、その表示を
次の候補に変更する役割を担うものである。従ってこの
場合には、第４図（ａ）に示されるテーブル５ａの第１
行目の構造に代えて、第２行目に示す文節列構造、即ち
「今後の〔投資〕は」が第５図（ｂ）に示す如く出力表
示される。そして、更に前記次候補キー１ａを操作して
いくと〔投資〕が〔闘志〕、〔透視〕の如く、順次他の
同音語に変更され、再び元の〔と牛〕の表示に戻ること
になる。尚、これらの動作は前記第３図（ｂ）に示しだ
文書表示用メモリ６に格納されたデータに基づいて行わ
れる。

ところで前記第３図（ｂ）に示される文書対応テーブル
６ａは、表示装置７の表示画面上の座標値ｉ１　−〜１
７と出力データ（変換結果）との対応を表したものであ
る。表示語テーブル６ｂは出力データの内容を示してい
る。しかして変換候補の表示は、先ず文書対応テーブル
６ａのデータｉ３によって表示語テーブル６ｂの「■と
牛」が指示され、これが表示される。しかる後、前記次
候補キー１ａが操作されると、データｉ３によってその
ブロックにおける次の候補「■投資」にポインタが進め
られ、表示が切換えられる。このようにしてポインタが
進められて「■凍死」まで表示が切替えられると、その
次には再び「■と牛」に戻るように制御されている′。

この表示語テーブル６ｂに示されるように、前述したよ
うに文節単位に基いて解析された複数の変換候補結果は
、同音異字の関係に従って整理され、部分的にその区切
、りの単位が変更されている。

次候補キー１ａを操作し、目的とする単語が表示された
とき、選択キー１ｂを操作し、確認を行う。

この確認操作により、出力制御部６は、確認情報を確認
情報記憶部９へ記憶する指示をする。例においては、「
投資」が目的とする単語であることを指示すると、例え
ば、「投資」の辞書番号が確認情報記憶部９へ記憶され
る。

この「投資」においては、確認された文節が複数でない
ので文節単位の情報のみ登録される。

同様にして「かいていしげ・・・」なる文字列について
も、自立語部が“改定”、付属語部が“′シバとして扱
われ、“し”の部分については他に“費源”という文節
単語が存在しているので、との“し”は次の文節“限界
″と結合して出力される。続く「発に」までは全候補が
共通に持つ単語の区切シがないので、これらはまとめて
出力される。なお機械処理上、自立語は１単飴毎に文節
として扱われる。

「かいていしけ・・・・・」なる文字列は、複数の文節
から同音語構造を構成していることより、文節単位の情
報の他に、隣なり合う文節との組合せ情報も、確認情報
記憶部９へ記憶する。実施例においては、「海底−資源
」　「資源−開発」が記憶される。ここで、文節単位の
確認情報と組合せ情報の優先関係を説明する。例えば、
「海底−資源」が選択された後、「改定」が単独で選択
されたとすると、文節単位の優先関係は、改定〉海底と
なる。

このため、「かいてい」を入力すると、出力順位は改定
→海底→改訂→開延となる。しかしながら「かいていし
げん」が入力されると、組合せ情報が、優先され、出力
順位は、海底→改定→改訂→開延となる。

第６図乃至第１１図は本装置の上述した処理の流れを示
すものである。第６図に示す制御フローにおいて、入力
装置１から得られる入力キーコードは常時調べられてお
り、その入力コードが日本語文の読みに対応する仮名文
字コードであれば、順次スタックに蓄えられる。また上
記入力コードが変換要求を示すものであれば第７図に示
される仮名漢字変換処理が行われる。この変換要求は、
入力装置が変換要求キーを有している場合、オペレータ
が適当な長さの文字列を入力後、この変換要求キーを打
鍵することによシ発生される。また入力装置が変換要求
キーを有するか否かに拘らず、入力文字が例えば句読点
を示すコードであったことを検出した場合には、上記変
換要求を自動的に発生することが望ましい。

また入力コードが前記次候補キー１ａに対応したもので
あれば、第８図に示す同音語選択処理を行ない、その他
のコード、例えば訂正、挿入、削除等のコードの場合に
は既に表示された文章について編集処理が行なわれる。

また第９図は本発明における第７図中の変換候補の編集
出力処理を示すものである。

尚、一般にワードプロセッサでは、同音語の選択を各変
換結果毎に遂次実行するものと、例えば１頁分の文字列
の入力後に一括して選択するものが知られているが、本
発明装置にあっては、そのいずれの方式であってもよい
。

以上説明したように本装置によれば、比較的長い入力仮
名文字列を解析し、仮名漢字混シの文字列に変換して日
本語文章を作成していく際、その結果として生ずる多数
の文節列候補を、単純明快に表示することができ、表示
される順序は、複合文節は確認情報がよシ優先して行な
われオペレータの同音語選択の操作の能率を上げること
ができる。つ捷り、一つの文節候補における同音語の選
択ばかりではなく、文節区切りの異なる異文節系列の候
補についても前述したように一括して同音字の選択を行
い得る。従って、同音異議語および同音異文節の変換候
補文字から目的とする仮名漢字変換文字を簡易に選択し
て日本語文章を極めて効率良く作成することができる。

またオペレータの負担を大幅に軽減することができ、そ
の実用的利点は絶大である。

尚、本発明は上記実施例に限定されるものではない。例
えば、ベタ文の入力でなく、文節単位に区切って入力さ
れるものでも、文節単位と隣なり合う文節を組合せた情
報を記憶するようにして出力する優先順序を入れかえ、
その選択を促すようにしても良い。又、付属語の種類や
、付属語そのものを組合せて記憶してもよい。要するに
本発明はその要旨を逸脱しない範囲で種々変形して実施
することができる。

【図面の簡単な説明】

第１図は本発明の一実施例を示す装置概略構成図、第２
図は変換辞書のメモリの構成を示す図、第３図は出力デ
ータメモリと文書表示用メモリの構成と確認情報を示す
図、第４図は入力文字列とその変換処理を示す図、第５
図は変換候補の表示例を示す図、第６図乃至第１１図は
変換処理の制御フローの一例を示す図である。１・・・入力装置、２・・・仮名漢字変換部、３・・・
変換辞書、４・・出力制御部、５・・・出力データメモ
リ、６・・・制御テーブル、７・・・辰示装置、１ａ・
・・次候補キー、ｌｂ・・・選択キー、２ａ・・・ブロ
ック抽出部、２ｂ・・・総文節系列抽出部、２Ｃ・・文
節抽出部、３ａ・・・入力見出し表領域、３ｂ・・・出
力見出し表領域、６ａ・・・文書対応テーブル、６ｂ・
・表示語テーブル、８・・・確認情報優先部、９・・・
確認情報記憶部代理人　弁理士　則　近　憲　佑（ほか１名）（体　力ｇ舌し ω厄　Σ リ　シ＼Ｎつ４−ＬＱ−−一〜〜−一一一−−−トＪ　Ｃす ν　塾　塾　やヤも　ニコ　口　ｔ［Ｆ］・Ｎノ　ゝ′　＼ノ　−一　−ノ第　７　図特開昭ＧＯ−２３５２７１（１４）第　８　図第　９　図叉節系列カ・・・Ｎ頭数、ｔａカ・Ｎ　ら基５通６リイーしΔζ１轟１トゝ勢ｐ健ｆあ卸゛云多５ｉｔリイてしンピリ志擢Ｉごワ＃＋オ支υλ（ホ
プータグルーグｌｚ　Ｅ　ｔ／］ｂぢ工、　Ｎあ為１刊” あ３ｎゝゼω品首上斜１ヴ、とし７ ″　升り２゛′ルーツ°に５

Claims

【特許請求の範囲】

（１）一連の入力文字列を得るだめの入力装置と、複数
の単語を記憶する辞書記憶部と、この辞書記憶部を検索
する＃曹検索部と、この辞書検索部を用いて前記入力文
字列より文節単位の系列を抽出する文節系列抽出部と、
この文節系列抽出部によってめられた各々の文節に対し
て、文法的評価を施しかな漢字混じシ表記を出力する結
果出力部と、この結果出力部に出力された変換結果に対
して、確認情報を与える手段と、この確認された情報を
記憶する確認情報記憶部と、この確認情報記憶部に記憶
された確認情報を有する変換候補が出現したとき、優先
順位を変更する確認情報優先部を具備し、前記確認情報
は、文節単位の確認情報と、隣合う文節を組合わせた情
報を記憶することを特徴とするかな漢字変換装置。
（２）確認情報優先部は、隣合う文節を組合せた情報は
文節単位の確認情報より優先して出力することを特徴と
する特許請求の範囲第１項記載のかな漢字変換装置。
（３）前記確認情報記憶部へ記憶する隣合う文節を組合
わせた情報は、結果出力部に於いて、文節の区切りが単
一でない複合文節のときに記憶することを特徴とする特
許請求の範囲第１項記載のかな漢字変換装置。