JPH10247192A

JPH10247192A - かな漢字変換装置

Info

Publication number: JPH10247192A
Application number: JP10049982A
Authority: JP
Inventors: Kimito Takeda; 公人武田; Hiromi Saito; 裕美斎藤; Tsutomu Kawada; 勉河田; Shigemi Nakazato; 茂美中里
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1998-02-17
Filing date: 1998-02-17
Publication date: 1998-09-14

Abstract

(57)【要約】【課題】文単位として入力されるような長さの長い連続
仮名文字系列を適宣文節単位に区切りながら仮名漢字変
換を行って漢字仮名混じりの日本語文章を作成する際、
単語あるいは文節の単位を常に意識しなければなら
ず、オペレータにとって大きな負担となった。【解決手段】入力されたかな文字列を文節単位に抽出
し、抽出されたかな文字列に対応するかな文字列を辞書
によって検索され、各々の文節単位に選択されたかな漢
字混じり文字列を出力し、出力されたかな漢字混じり文
字列に対して文節単位の確認情報及び隣り合う文節の組
み合わせの確認情報を記憶し、記憶された確認情報を有
するかな漢字文字列の変換候補が出現した場合、このか
な漢字文字列を優先して出力するようにしたものであ
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は例えば文単位として
入力されるような長さの長い連続仮名文字系列を適宣文
節単位に区切りながら仮名漢字変換を行って漢字仮名混
じりの日本語文章を効果的に作成することのできるかな
漢字変換装置に関する。

【０００２】

【従来の技術】従来の日本語ワードプロセッサ等におけ
る仮名漢字入力の単位は、一般に単一文節にかぎられて
おり、また名詞の複合語の入力においても高々数単位程
度に限定されているものが殆どである。

【０００３】従って、この種の装置を用いて日本語文章
を入力作成する場合、単語あるいは文節の単位を常に意
識しなければならず、オペレータにとって大きな負担と
なった。そこで最近では文章入力の単位を制限すること
なく、文単位の読み仮名列、所謂ベタ文を入力し、この
ベタ文に対して仮名漢字変換処理を行う研究が種々試み
られている。それらは具体的には、例えば文節分析処理
を再帰的に行うことでその目的を達成している。

【０００４】然し乍ら、この為には相当長い処理時間を
必要とし、またバッファメモリを大量に消費させざるを
得ないという問題があった。また処理時間およびメモリ
量を制限して文節解析処理のアリゴリズムを簡素化する
ことが考えられているが、その変換処理精度が劣化する
ことが否めなかった。しかも、このように得られた変換
結果をどのように表示出力すれば、その同音語選択の指
示を扱い易くできるかが大きな課題となっていた。

【０００５】例えば、「ざんだかをもとめる」なる文字
列をかな入力した場合、「ざんだかを／もとめる」と機
械的に文節分割できることが予想されるが、あるいは
「ざんだかをも／とめる」という分割形式も文法的にあ
りうる。

【０００６】この場合、一般に経験的にみて所謂最長一
致するものが確からしい考えられるが、このような経験
則だけに基いて、常に入力文字列の前方から分析解析処
理を行い、例えば「残高もを／止める」だけを抽出した
のではその変換精度は著しく悪くなる。

【０００７】従って、結局「残高もを／止める」、及び
「残高を／求める」等の複数の変換候補を抽出し、その
選択をオペレータの判断に委ねることが必要となる。

【０００８】また、「さいけんしき」という入力に対し
ても、もし装置内の辞書に「計算式」という単語が登録
されてないとすると、結果は同様にして「計算／式」、
「計算し／木」と云うように複数の変換結果が生じる更
には「毛／遺産／式」のような変換結果も生じる。更に
は仮に「るけい＝“流刑”」という単語が辞書登録され
ているとすれば、「残高を／求め／流刑／算式」という
候補も出現する。

【０００９】ところで、こうような入力に対する多様な
変換結果の中で、最も確からしいものを第1 順位に出力
するための評価処理として、例えば、全体を構成する文
節数あるいは単語数の少ない順に優先度を決定する方法
が考えられている。具体的には、例えば「こうがくしょ
とく」の入力に対して、「高額／所得」を「項が／句／
所得」や「項が／区処と／句」より確からしいと判定す
るものである。

【００１０】尚、この場合、同音語については使用頻度
の大なる単語か優先して出力するのが自然であり、好ま
しい。

【００１１】しかし、全体を構成する文節数が同じであ
ってもその区切り方が異なる場合もあり、また変換漏れ
を少なくするために構成数の多い分析結果をも含めて出
力する場合には、その取扱うデータ構造が複雑になる。
しかもオペレータがより選択操作を行い易くする為に、
それらの複数の変換結果をどのように出力表示するかが
問題となる。

【００１２】この問題を解択するために例えば、複数の
単語を辞書登録した辞書検索部を用いて一連の入力文字
列からその文節単位の系列を抽出し、これらの各文節を
その文節の読みに対応する仮名漢字混じり表記にそれぞ
れ変換して出力するに際し、前記入力文字列に対する複
数の文節系列の相互に異なる区切り位置の中で最も前方
にある文節始点を基準点とし、この基準点以降に存在す
る次の文節の自立語部分と前記標準点で区切られた全文
節の付属語部分とを変換候補の単位として仮名漢字変換
を行い、その変換候補を順に表示出力する手法が考慮さ
れている。

【００１３】例えば上述した例の「ざんだかをもとめる
けいさんしき」という入力に対して、「残高をも／止め
る」や「残高を／求める」のように文節系列の候補を作
成し、その変換候補結果を「（残高）を（も止）め
る」、「（残高）を（求）める」等のように求め、これ
を順に表示出力するので、同音次候補の選択処理を非常
に簡単化することができる。

【００１４】即ち、例えば、前記（も止）の部分につい
ては、実際上「も止」という単語は存在しないが、その
読み仮名である「もと」の部分に他の同音単語情報や別
表記語が存在している。つまり同じ読みに対応する他の
候補が存在することが示され、文節内の同音語の選択と
同様に同音語次候補の切り換え指示により、異構造文節
列の選択が可能となる。

【００１５】しかしながら、異構造文節列が自立語１つ
からなる場合は、選択操作は簡易であるが、複数の自立
語が組合わさってなりたつ場合は、多くの同音語が出力
されることとなる。例えば、「研究や開発の活動の様子
を今日的な始点から考えてみると、研究成果の記録と公
表に関する努力が不足していたとする執筆者の方々の反
省の意見は」をベタ文で入力すると、｛研究や／開発、
研究／夜会／発｝の｛か集うの／様子、活動のよう／
巣、活動のよう／酢、活動の／様子｝を｛今日／的、今
日／敵、今日／滴、紺に／知的｝な｛支店、視点、始
点、支点｝から｛考、勘が、観が、缶が｝えてみると、
｛研究／製か、研究／制か、研究／声か、研究／生か、
研究／世か、研究／性か、研究／星か、研究／成果、研
究／盛夏、研究／正価、研究／生花、研究／製菓、研究
／青果、件／急性か、兼／急性か、券／急性か、剣／急
性か、県／急性か、件／急逝か、兼／急逝か、券／急逝
か、剣／急逝か、県／急逝か、件／旧制か、兼／旧制
か、券／旧制か、剣／旧制か、県／旧制か、件／旧姓
か、兼／旧姓か、券／旧姓か、剣／旧姓か、県／旧姓
か、研究せ／意か、研究せ／以下、研究せ／医科、研究
せ／胃か、研究／製／日、研究／制／日、研究／声／
日、研究／生／日、研究／世／日、研究／星／日、研究
／製／課、研究／制／課、研究／声／課、研究／生／
課、研究／世／課、研究／星／課、研究／製／化、研究
／制／化、研究／声／化、研究／生／化、研究／世／
化、研究／星／化、研究／製／科、研究／制／科、研究
／声／科、研究／生／科、研究／世／科、研究／星／
科、研究／製／家、研究／制／家、研究／声／家、研究
／生／家、研究／世／家、研究／星／家、研究／製／
下、研究／制／下、研究／声／下、研究／生／下、研究
／世／下、研究／星／下｝の記録と｛好評、公表、講
評｝に｛関、冠｝する。努力が不足してい｛たと刷、た
とす、他とす、田とす｝る執筆｛車、者、社、舎｝の
｛旁々、方々、か他形、か田形、か他型、か田型、か他
方、か田方｝の反省｛のい件は、の意見は、の違憲は、
のい兼は、のい券は、のい剣は、のい県は、の意見派、
の違憲派、の意見波、の違憲波、のい兼派、のい券派、
のい剣派、のい県派、のい兼波、のい剣波、のい県波｝
の変換候補が得られる。ここで「けんきゅうせいかの」
の入力文に対して６０以上の同音語が発生し、選択に時
間が多くかかり問題が多かった。

【００１６】

【発明が解決しようとする課題】本発明はこのような事
情を考慮してなされたもので、その目的とするところ
は、多数の同音語を効率よく選択して、文書作成の効率
を向上し得るかな漢字変換装置を提供することにある。

【００１７】

【課題を解決するための手段】本発明は、同音語の選択
に際し、確認された確認情報を文節単位に記憶するのと
合わせて、隣り合う文節との組み合わせ情報も記憶し、
この記憶された確認情報を含む変換候補が出現したと
き、優先して出力するようにしたものである。

【００１８】つまり、変換すべき文字列を入力するため
の入力手段と、この入力手段によって入力されたかな文
字列を文節単位に抽出する文節抽出手段と、かな文字列
に対応する漢字文字列を記憶してなる辞書記憶手段と、
この辞書記憶手段から前記文節抽出手段によって抽出さ
れたかな文字列に対応するかな文字列を検索するための
辞書検索手段と、この辞書検索手段によって検索され、
各々の文節単位に選択されたかな漢字混じり文字列を出
力する結果出力手段と、この結果出力手段に出力された
かな漢字混じり文字列に対して文節単位の確認情報及び
隣り合う文節の組み合わせの確認情報を記憶する確認情
報記憶手段と、この確認情報記憶手段に記憶された確認
情報を有するかな漢字文字列の変換候補が出現した場
合、このかな漢字文字列を優先して出力させるための確
認情報優先手段とを有することを特徴とする。

【００１９】

【発明の実施の形態】以下、図面を参照して本発明の一
実施例装置につき説明する。

【００２０】図１は実施例装置の概略構成図である。入
力装置１は鍵盤装置や音声確認装置、仮名文字読取り装
置などからなる。この入力装置１を介して入力される読
みを表わす文字列（第１の文字列）は、例えば仮名文字
コードに変換された後、仮名漢字変換部２に与えられ
る。尚、上記読みを表わす第１の文字列は、例えば平仮
名、片仮名、ローマ字等として示されるものである。

【００２１】仮名漢字変換部２は、例えばブロック抽出
部２ａ、総文節系列抽出部２ｂ、文節抽出部２ｃ、およ
び変換辞書３により構成される。この仮名漢字変換部２
は、前記入力装置１より転送された第１の文字列に対し
て、それに該当する漢字混じりの表示文字列からなる第
２の文字列を求め、これを出力制御部４に与えている。

【００２２】ブロック抽出部２ａは、上記第１の文字列
に対して、特に長さの長い入力文字列を能率よく解析す
る為に設けられたものであり、予め設定されている数値
Ｎ、例えばＮ＝４として、Ｎ文節以内の文節系列として
対応づける文節解析結果を求めるもので、対応した文節
解析結果がない時には、上記第１の入力文字列を幾つか
のブロック区間に分割している。

【００２３】そしてこのようにして分割した各ブロック
の読み仮名列を総文節系列抽出部２ｂに送り、またこの
総文節系列抽出部２ｂで求められた前記各ブロックにつ
いての仮名漢字変換結果、即ち第２の文字列を順次出力
制御部４に送っている。

【００２４】上記総文節系列抽出部２ｂは、文節抽出部
２ｃを用いて前記第１の文字列を分割可能な文節系列に
分割し、これらの文節系列についてそれぞれ求められた
仮名漢字混じり表記の変換結果を上記ブロック抽出２ａ
に出力するものである。文節系列は前記入力文字列の文
節分割可能な全ての組合せについて求められ例えば優先
度の評価によってその確からしい候補の順に順位付けさ
れたのち、その第１順位のものから順に出力される。

【００２５】尚、優先度の評価としては、一般に文節個
数が少ないもののほうが入力目的とする漢字混り文に対
応している傾向が高いことから、例えば文節個数の少な
い文節系列を優先して出力する等として行われる。

【００２６】文節抽出部２ｃは、入力された文字コード
列と変換辞書３に予め登録された文字列（単語）との間
で照合検索を行い、上記第１の文字列に該当する漢字混
りの表記文字からなる第２の文字列を求めている。

【００２７】変換辞書３は、例えば図２にそのメモリ構
成例を示すように、入力見出し表領域３ａ、出力見出し
表領域３ｂおよび品詞領域３ｃとを備え、上記入力見出
し表領域３ａに読みを表わす第１の文字列を格納し、ま
たこの第１の文字列に対応する漢字混じりの表記文字か
らなる第２の文字列を上記出力見出し表領域３ｂに格納
したものとなっている。

【００２８】そして、品詞領域３ｃには、上記第１およ
び第２の文字列に対する品詞の情報を格納している。

【００２９】しかして文節抽出部２ｃは、与えられた入
力文字に対して、例えば公知の前方最長一致法により変
換辞書３の入力見出し表領域３ａに予め登録されている
文字列（単語）を検索し、その活用語尾や付属語の解析
などを行って、前記入力文字列の頭字より最も長く一致
した入力文字列部分を支節抽出結果として求めているこ
の時、上記の活用語尾の解析は品詞領域３ｃに格納され
た品詞項目に基いて行われる。

【００３０】そして、この解析によって見出された文節
抽出結果に対応する漢字混りの表記文字からなる第２の
文字列を前記出力見出し表領域３ｂから読出し、これを
入力している。更にこのとき、前記総文節系列抽出部２
ｂは、前記文節抽出部２ｃへの入力単位（文節抽出結
果）を、前記入力文字列に対して定められたブロック区
間における文節分割可能な組合せについて様々に変化さ
せ、その中の最も確からしい文節系列を求めている。

【００３１】仮名漢字変換部２は、このような文節系列
に対して求められた仮名漢字混じり表記からなる第２の
文字列を出力制御部４の出力データメモリ５に転送して
いる。出力制御部４はこれらのデータを所定の表示出力
形式に変換し、文書表示用メモリ６に格納する。

【００３２】文章表示用メモリ６に格納された、これら
のデータは、確認情報優先部８へ送られ、確認情報記憶
部９を参照することのより既でに確認された変換候補が
なるときは、その変換候補を優先して、出力するように
順番が変更される。

【００３３】本実施例において、確認情報記憶部９は、
図６に示すように、文節単位の情報と隣り合う文節の組
合せ情報からなる。文節単位の情報はＲＯＭにある単語
とＦＤＤ／ＲＡＭにある単語と別々に記憶する。ＲＯＭ
にある単語は、かな漢字変換において、一般的に使われ
る標準的単語を記憶する。ＦＤＤ／ＲＡＭにある単語
は、利用者が登録した単語や、分野別の単語を記憶して
いる。

【００３４】この様に構成することにより分野が変更さ
れたときに容易に確認情報の入れかえが可能となる。隣
り合う文節の組合せ情報は、文節単位の情報の相対位置
と、標準的単語であるのか、利用者が登録した単語又
は、分別の単語であるかの区別を記憶する。

【００３５】図７に前述例において、タイミングt0で記
憶した例を示す。

【００３６】ここで前記出力データメモリ５は図３に示
すように組合せテーブル５ａ、マツピングテーブル５
ｂ、見出し語テーブル５ｃからなり、上記辞書検索部2
によって変換された見出し語を、各組合せの構造と併せ
て記憶するものである。この例は図８（ａ）に示す日本
語文の例をデータ格納構造を表現したもので組合せテー
ブル５ａは、前記入力文字列の文節構造に対応して番号
付けされた各文節の並びを記述している。このテーブル
５ａの行は文節構造の解釈上の種類を、列は個々の文節
構造における文節の繋がり順に記述したものとなってい
る。

【００３７】即ち、最初のブロックでは候補が１種類、
２番目のブロックは２種類、３番目は３種類の系列候補
があることが示される。またこれらの各数値はマツピン
グテーブル５ｂ要素番号に示している。また各文節単位
毎に存在する同音異義語の見出し語をテーブル５ｃでグ
ループ化して記憶し、マツピングテーブル５ｂの各要素
をポインタとして、見出し語テーブル５ｃの各グループ
をそれぞれ記述している。このようにして入力の読み仮
名位置との対応関係も同時に記述している。

【００３８】図４は前記出力データメモリ６の内容を表
示装置７に出力する為の文字表示情報を記憶する前記文
書表示用メモリ６の構造である。このメモリ６は前記出
力データメモリ５の内容に基いて、同じ読み仮名位置に
ある同音異義語や異構造分列について比較照合し、先ず
入力文字列に対する全ての文節系列候補中の共通の文節
区切り箇所で前記入力文字列を分解し、さらに共通の付
属語文字部分および唯一通り求められる変換結果部分と
をそれぞれ他の部分から切離して記述している。

【００３９】また、ある文節の頭部の見出し語文字に対
して、同じ読み仮名を付属語部分に持つ変換候補結果に
ついては、先の文節頭部に合せて区切り、区切られた後
ろ側の付属語部分の文字列を次に続く文節に結合させて
記述している。

【００４０】即ち、或る文節系列の文節における付属語
の文字であっても、対応する同じ読みの部分が他の文節
系列中において自立語の始りの一部になっていれば、そ
の付属語の文字は次に続く文節の変換候補に結合させて
記述している。

【００４１】図５は、前記図４の内容を確認情報優先部
８により、順に変更した例である。この例では、「資源
開発」が、組合わせた情報として、確認情報記憶部９に
記憶されていたと、「資源開発」が表示順位第１位に変
更される。

【００４２】これらの同音語は後述するように、その表
示属性を通常の表示属性とは異ならせて表示出力され
る。

【００４３】図１０（ａ）〜（ｅ）はその表示例であ
り、斜線部が表示属性の異なりを示している。この表示
属性の変更は、例えば表示文字の反転、ブリンク、輝度
変更、下線付等によって行われる。

【００４４】次に図３に示す仮名文字入力例を用いて、
上記仮名漢字変換部２における仮名漢字変換処理につき
説明する。

【００４５】ブロック抽出部２ａは入力された文字系列
の先頭から最大Ｎ文節の系列を可能な限り求め体る。こ
こでＮを例えば４とすると図８（ａ）に示す例では、先
ず入力系列全体を文節抽出部２ｃに入力し、最長一致法
により「そして」を第１の文節結果として得る。次にこ
の文節切れ目以降を始点（次の文節開始文字位置）とし
て同様に最長一致結果を求め、「こんごのと」なる文節
を得る。

【００４６】このような処理を順に繰返して第１文節系
列候補「そして／こんごのと／うちは／かいていし」を
図８（ｂ）中の項目「ア」の如く得る。次にこの項目
「ア」で得られた文節系列と別の文節系列を得るために
第３番目の文節結果「うしは」最後の１文字、つまりそ
の文節において付属語として解析される「は」削除して
これを文節抽出部２ｃに送り、同様にして最長一致結果
「うし」なる文節を得、続く「は」で始まる文節として
「は」を求める。

【００４７】以下、同様にして上記第３、第２および第
１の文節により短い文節が得られる都度、更にこれらに
続く別の文節列を順次求める。このようにして入力文字
列に対して文節分割可能な全ての４文節系列を図８
（ｂ）に示す如く求める。尚この時、対応する漢字混じ
りの見出し語候補（第２の文字列）を同時に求めてお
く。

【００４８】次にこれらの系列のうちで、その全体の長
さが最長となる候補（文節系列）だけに着目する。この
ことは先に示したように入力による文節数が最小となる
系列が、入力目的とする変換結果に合っている傾向が高
いと云うことに立脚している。このことは、一つのブロ
ックの文節構成数が最小であればよく、また文節の構成
数が同じであれば、そのブロックはより長い長さをもつ
ことを意味している。

【００４９】しかして前記図８（ｂ）に示される結果の
中で最長の文節系列となるものは、項目「ア」や項目
「ウ」に示されるものである。そこで次にこれら文節系
列が共通に文節の切れ目を持っている個所を見つける。

【００５０】この例では「そして／〜」と、「〜は／
〜」しが共通の文節区切り箇所として求められる。ブロ
ック抽出部２ａはこのような２つの位置をブロック区切
りと判定するもので、第１ブロック区間を「そして」、
第２ブロック区間を「こんごとうしは」とする。そして
順次これらの区間の文字列を総文節列解析部２ｂに解析
させ、それらの変換結果を出力制御部４へ送っている。

【００５１】この結果、上記第１ブロック区間は「そし
て」のみの候補となり、この情報が先ず出力制御部４へ
送られる。尚、この場合、他に同音語が無いのでそのま
ま文書中の文字データ（変換結果）として通常形態で表
示される。しかる後、第２ブロック区間の解析が行われ
る。

【００５２】ここで、前記総文節列解析部２ｂは、与え
られたブロック区間の読みの対応した文字系列を総当た
りで求めるものであるが、実際には図８（ｂ）に示すよ
うに既に文節系列が求められているので、その指定区間
の範囲に対応するものだけ選べば十分である。

【００５３】そして優先度の評価として、例えば文節数
最小の構成の候補だけを選ぶと、その解析結果は図９の
項目［２］のようになる。勿論、その他の文節候補列も
出力データメモリ５に与えておくようにしてもよい。例
えば、「この後の／問う／誌は」をも、出力結果に加え
ることも可能である。

【００５４】さて、ブロック抽出部２ａは、次に前記入
力文字系列のうちで未だにブロックが決定していない残
りの部分、つまり「かいていしげ……」なる文字列につ
いて、同様の方法でブロックの単位を求め、図９の項目
［３］に示す如き変換結果を求める。続いて変換結果
「限って」を図９の項目［４］のように求め、その入力
系列全体に対する変換処理を終了することになる。

【００５５】以上の変換結果は各ブロック毎に出力制御
部４へ送られる。出力制御部４は出力データメモリ５に
格納された各ブロック毎のデータをそれぞれ変換し、文
書表示用メモリ６に順次スタックし、出力の優先順位を
変更し表示装置７に出力する。

【００５６】即ち、出力制御部４では文書表示用データ
を前記図４の如く作成し、これを先ず図８（ａ）に示す
ように表示装置７に出力している。上記の例では、「今
後のと」の文節候補に対しては、自立語部が“今後”と
して、付属語部が“のと”として分離される。文節候補
「牛は」も同様に“牛”と“は”に分離される。また第
２文節系列候補では自立語部が“今後”、付属語部が
“の”として分離され、「投資は」は“投資”と
“と”，“は”とに分離される。

【００５７】従ってこの場合、“の”と“は”は共に共
通の付属語文字であり、また“今後”には他に同音語が
ないので、これらの文字部分については通常の表示形態
で表示される。また他の文字については複数の変換候補
（同音異字）が存在することから、これを、強調して示
すために例えば高輝度で表示される。つまり、文節「今
後のと」における“と”は付属語であるが、次の文節単
語「牛」とともに扱われる。

【００５８】従って、表示装置７には、「そして今後の
［と牛］は［改定し限界発に］限って」と表示されるこ
とになる。尚、［］内は高輝度表示される文字を示して
いる。

【００５９】ここで目的とする見出し語の選択のため
に、入力装置１には例えば図１中１ａに示すように次候
補キーが設けられている。この次候補キー１ａは、例え
ば図１０に示すように［と牛］の部分にカーソル１ｂを
合わせ、この状態で前記次候補キー１ａが操作されたと
き、その表示を次の候補に変更する役割を担うものであ
る。

【００６０】従ってこの場合には、図８（ａ）に示され
るテーブル５ａの第１行目の構造に代えて、第２行目に
示す文節列構造、即ち「今後の［投資］は」が図１０
（ｂ）に示す如く出力表示される。そして、更に前記次
候補キー１ａを操作していくと［投資］が［闘志］，
［透視］の如く、順次他の同音語に変更され、再び元の
［と牛］の表示に戻ることになる。尚、これらの動作は
前記図４に示した文書表示用メモリ６に格納されたデー
タに基づいて行われる。

【００６１】ところで前記図４に示される文書対応デー
ブル６ａは、表示装置７の表示画面上の座標値ｉ１〜ｉ
７と出力データ（変換結果）との対応を表したものであ
る。表示語テーブル６ｂは出力データの内容を示してい
る。しかして変換候補の表示は、先ず文書対応テーブル
６ａのデータｉ３によって表示語テーブル６ｂの
「（１）と牛」が指示され、これが表示される。

【００６２】しかる後、前記次候補キー１ａが操作され
ると、データｉ３によってそのブロックにおける次の候
補「（２）投資」にポインタが進められ、表示が切り換
えられる。このようにしてポインタが進められて
「（３）凍死」まで表示が切り替えられると、その次に
は再び「（１）と牛」に戻るように制御されている。こ
の表示語テーブル６ｂに示されるように、前述したよう
に文節単位に基づいて解析された複数の変換候補結果
は、同音異字の関係に従って整理され、部分的にその区
切りの単位が変更されている。

【００６３】次候補キー１ａを操作し、確認を行う。こ
の確認操作により、出力制御部６は、確認情報記憶部９
へ記憶する指示をする。例においては、「投資」が目的
とする単語であることを指示すると、例えば、「投資」
の辞書番号が確認情報記憶部９へ記憶される。

【００６４】この「投資」においては、確認された文節
が複数ではないので文節単位の情報のみ登録される。

【００６５】同様にして「かいていしげん…」なる文字
列についても、自立語部が“改定”、付属語部が“し”
として扱われ、“し”の部分については他に“資源”と
いう文節単語が存在しているので、この“し”は次の文
節“限界”と統合して出力される。続く「発に」までは
全候補が共通に持つ単語の区切りがないので、これらは
まとめて出力される。

【００６６】なお、機械処理上、自立語は１単語毎に文
節として扱われる。

【００６７】「かいていしげん…」なる文字列は、複数
の文節から同音語構造を構成していることにより、文節
単位の情報の他に、隣合う文節との組み合わせ情報も、
確認情報記憶部９へ記憶する。実施例においては、「海
底−資源」「資源−開発」が記憶される。ここで、文節
単位の確認情報と組合せ情報の優先関係を説明する。

【００６８】例えば、「海底−資源」が選択された後、
「改定」が単独で選択されたとすると、文節単位の優先
関係は、改定＞海底となる。このため、「かいてい」を
入力すると、出力順位は改定→海底→改訂→開廷とな
る。

【００６９】図１１乃至図１６は本装置の上述した処理
の流れを示すものである。図１１に示す制御フローにお
いて、入力装置１から得られる入力キーコードは常時調
べられており、その入力コードが日本語文の読みに対応
する仮名文字コードであれば、順次スタックに蓄えられ
る。

【００７０】また上記入力コードが変換要求を示すもの
であれば図１２に示される仮名漢字変換処理が行われ
る。この変換要求は、入力装置が変換要求キーを有して
いる場合、オペレータが適当な長さの文字列を入力後、
この変換要求キーを打鍵することにより発生される。ま
た入力装置が変換要求キーを有するか否かに拘らず、入
力文字が例えば句読点を示すコードであったことを検出
した場合には、上記変換要求を自動的に発生することが
望ましい。

【００７１】また、入力コードが前記次候補キー１ａに
対応したものであれば、図１３に示す同音語選択処理を
行い、その他のコード、例えば訂正，挿入，削除等のコ
ードの場合には既に表示された文章について編集処理が
行われる。また図１４は本発明における図１２中の変換
候補の編集処理を示すものである。

【００７２】なお、一般にワードプロセッサでは、動員
語同音語の選択を各変換結果毎に逐次実行するものと、
例えば１頁分の文字列の入力後に一括して選択するもの
が知られているが、本発明装置にあっては、そのいずれ
の方式であってもよい。

【００７３】以上説明したように本発明によれば、比較
的長い入力仮名文字列を解析し、仮名漢字混じりの文字
列に変換して日本語文章を作成していく際、その結果と
して生ずる多数文節列候補を、単純明快に表示すること
ができ、表示される順序は、複合文節は確認情報が寄り
優先して行われオペレータの同音語選択の操作の能率を
上げることができる。

【００７４】つまり、一つの文節候補における同音語の
選択ばかりではなく、文節区切りの異なる異文節系列の
候補についても前述したように一括して同音字の選択を
行い得る。

【００７５】したがって、同音異義語および同音異文節
の変換候補文字から目的とする仮名漢字変換文字を簡易
に選択して日本語文章を極めて効率よく作成することが
できる。また、オペレータの負担を大幅に軽減すること
ができ、その実用的利点は絶大である。

【００７６】なお、本発明は上記実施例に限定されてい
るものではない。例えば、ベタ文の入力でなく、文節単
位に区切って入力されるものでも、文節単位と隣合う文
節を組み合わせた情報を記憶するようにして出力する優
先順序を入れ換え、その選択を促すようにしてもよい。

【００７７】また、付属語の種類や、付属語そのものを
組み合わせて記憶してもよい。要するに本発明はその要
旨を逸脱しない範囲では種々変形して実施することがで
きる。

【００７８】かくして本発明によれば、例えば上述した
例の「けんきゅうせいか」の入力に対して、「研究／成
果」を選択すると、次に同じ入力があった場合、「研究
／製か」より「研究／成果」は優先して出力され、確認
のみ行えばよい。即ち、例えば、前記「研究／成果」を
選択することにより、文節単位の確認情報として、「研
究」と「成果」が記憶され、合わせてとなり合う組合せ
情報として、「研究−成果」が記憶されて、優先出力の
対象となる。

【００７９】上述の例文すべてを選択すると以下の組合
せ情報が記憶される。（１）研究−開発 t0 （２）開発−活動 t1 （３）活動−様子 t0 （４）様子−今日 t1 （５）今日−的 t0 （６）的 −視点 t1 （７）視点−考 t1 （８）研究−成果 t0 （９）成果−記録 t3 （10）記録−公表 t2 （11）公表−関する t1 （12）関する−努力 t3 （13）努力−不足ｘ（14）執筆−者 t2 （15）者 −方々 t1 （16）方々−反省 t3 （17）反省−意見 t2 （18）意見− 上記例における組合せ情報の後に記してあるt0〜t3は記
憶するタイミングを示してある。隣り合う文節に同音異
義語がある場合と、前又は後に同音異義語がない場合と
して、タイミングが相異する。 t0…同音語が選択された時点では合成語となっている。 t1…同音語が選択された時点では前の文の文節が同音異
義語である。 t2…同音語が選択された時点では前の文の文節が同音異
義語でない。 t3…同音語が選択された時点では後の文の文節が同音異
義語でない。ｘ…隣り合う文節が同音異義語でない。

【００８０】ここで、ｘ、組合せ情報を記憶する必要は
ない。又、文節間にある助詞、助動詞は無視して、例で
は示してある。確認情報を記憶するタイミングにより、
組合せ情報として記憶しなくてもよい。

【００８１】例えば、t0のみ記憶することでも選択効果
は高くなる。従って、異構造文節列の中の別の候補を選
択する為の特殊な指示キーを設けることなく、従来の同
音語次候補キーを用いてその選択処理を効率良く行うこ
とが可能となる等の絶大なる効果が奏せられる。

【００８２】

【発明の効果】かくして本発明によれば、例えば上述し
た例の「けんきゅうせいか」の入力に対して、「研究／
成果」を選択すると、次に同じ入力があった場合、「研
究／製か」より「研究／成果」は優先して出力され、確
認のみ行えばよいという効果を奏する。

【図面の簡単な説明】

【図１】本発明の一実施例を示す装置概略構成図であ
る。

【図２】変換辞書のメモリの構成を示す図である。

【図３】出力データメモリと文書表示用メモリの構成と
確認情報を示す図である。

【図４】出力データメモリと文書表示用メモリの構成と
確認情報を示す図である。

【図５】出力データメモリと文書表示用メモリの構成と
確認情報を示す図である。

【図６】出力データメモリと文書表示用メモリの構成と
確認情報を示す図である。

【図７】出力データメモリと文書表示用メモリの構成と
確認情報を示す図である。

【図８】入力文字列とその変換処理を示す図である。

【図９】入力文字列とその変換処理を示す図である。

【図１０】変換候補の表示例を示す図である。

【図１１】変換処理の制御フローの例を示す図である。

【図１２】変換処理の制御フローの例を示す図である。

【図１３】変換処理の制御フローの例を示す図である。

【図１４】変換処理の制御フローの例を示す図である。

【図１５】変換処理の制御フローの例を示す図である。

【図１６】変換処理の制御フローの例を示す図である。

【符号の説明】

１…入力装置、２…仮名漢字変換部、３…変換辞書、４
…出力制御部、５…出力データメモリ、６…制御テーブ
ル、７…表示装置、１ａ…次候補変換キー、１ｂ…選択
キー、２ａ…ブロック抽出部、２ｂ…総文節系抽出部、
２ｃ…文節抽出部、３ａ…入力見出し表領域、３ｂ…出
力見出し表領域、６ａ…文書対応テーブル、６ｂ…表示
語テーブル、８…確認情報優先部、９…確認情報記憶部

───────────────────────────────────────────────────── フロントページの続き (72)発明者中里茂美東京都青梅市末広町２丁目９株式会社東芝青梅工場内

Claims

【特許請求の範囲】

【請求項１】変換すべき文字列を入力するための入力手
段と、この入力手段によって入力されたかな文字列を文節単位
に抽出する文節抽出手段と、かな文字列に対応する漢字文字列を記憶してなる辞書記
憶手段と、この辞書記憶手段から前記文節抽出手段によって抽出さ
れたかな文字列に対応するかな文字列を検索するための
辞書検索手段と、この辞書検索手段によって検索され、各々の文節単位に
選択されたかな漢字混じり文字列を出力する結果出力手
段と、この結果出力手段に出力されたかな漢字混じり文字列に
対して文節単位の確認情報及び隣り合う文節の組み合わ
せの確認情報を記憶する確認情報記憶手段と、この確認情報記憶手段に記憶された確認情報を有するか
な漢字文字列の変換候補が出現した場合、このかな漢字
文字列を優先して出力させるための確認情報優先手段
と、を有することを特徴とするかな漢字変換装置。