JPH10247192A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPH10247192A
JPH10247192A JP10049982A JP4998298A JPH10247192A JP H10247192 A JPH10247192 A JP H10247192A JP 10049982 A JP10049982 A JP 10049982A JP 4998298 A JP4998298 A JP 4998298A JP H10247192 A JPH10247192 A JP H10247192A
Authority
JP
Japan
Prior art keywords
character string
phrase
kana
conversion
research
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10049982A
Other languages
English (en)
Inventor
Kimito Takeda
公人 武田
Hiromi Saito
裕美 斎藤
Tsutomu Kawada
勉 河田
Shigemi Nakazato
茂美 中里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10049982A priority Critical patent/JPH10247192A/ja
Publication of JPH10247192A publication Critical patent/JPH10247192A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】文単位として入力されるような長さの長い連続
仮名文字系列を適宣文節単位に区切りながら仮名漢字変
換を行って漢字仮名混じりの日本語文章を作成する際、
単語あるいは 文節の単位を常に意識しなければなら
ず、オペレータにとって大きな負担となった。 【解決手段】入力されたかな文字列を文節単位に抽出
し、抽出されたかな文字列に対応するかな文字列を辞書
によって検索され、各々の文節単位に選択されたかな漢
字混じり文字列を出力し、出力されたかな漢字混じり文
字列に対して文節単位の確認情報及び隣り合う文節の組
み合わせの確認情報を記憶し、記憶された確認情報を有
するかな漢字文字列の変換候補が出現した場合、このか
な漢字文字列を優先して出力するようにしたものであ
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は例えば文単位として
入力されるような長さの長い連続仮名文字系列を適宣文
節単位に区切りながら仮名漢字変換を行って漢字仮名混
じりの日本語文章を効果的に作成することのできるかな
漢字変換装置に関する。
【0002】
【従来の技術】従来の日本語ワードプロセッサ等におけ
る仮名漢字入力の単位は、一般に単一文節にかぎられて
おり、また名詞の複合語の入力においても高々数単位程
度に限定されているものが殆どである。
【0003】従って、この種の装置を用いて日本語文章
を入力作成する場合、単語あるいは文節の単位を常に意
識しなければならず、オペレータにとって大きな負担と
なった。そこで最近では文章入力の単位を制限すること
なく、文単位の読み仮名列、所謂ベタ文を入力し、この
ベタ文に対して仮名漢字変換処理を行う研究が種々試み
られている。それらは具体的には、例えば文節分析処理
を再帰的に行うことでその目的を達成している。
【0004】然し乍ら、この為には相当長い処理時間を
必要とし、またバッファメモリを大量に消費させざるを
得ないという問題があった。また処理時間およびメモリ
量を制限して文節解析処理のアリゴリズムを簡素化する
ことが考えられているが、その変換処理精度が劣化する
ことが否めなかった。しかも、このように得られた変換
結果をどのように表示出力すれば、その同音語選択の指
示を扱い易くできるかが大きな課題となっていた。
【0005】例えば、「ざんだかをもとめる」なる文字
列をかな入力した場合、「ざんだかを/もとめる」と機
械的に文節分割できることが予想されるが、あるいは
「ざんだかをも/とめる」という分割形式も文法的にあ
りうる。
【0006】この場合、一般に経験的にみて所謂最長一
致するものが確からしい考えられるが、このような経験
則だけに基いて、常に入力文字列の前方から分析解析処
理を行い、例えば「残高もを/止める」だけを抽出した
のではその変換精度は著しく悪くなる。
【0007】従って、結局「残高もを/止める」、及び
「残高を/求める」等の複数の変換候補を抽出し、その
選択をオペレータの判断に委ねることが必要となる。
【0008】また、「さいけんしき」という入力に対し
ても、もし装置内の辞書に「計算式」という単語が登録
されてないとすると、結果は同様にして「計算/式」、
「計算し/木」と云うように複数の変換結果が生じる更
には「毛/遺産/式」のような変換結果も生じる。更に
は仮に「るけい=“流刑”」という単語が辞書登録され
ているとすれば、「残高を/求め/流刑/算式」という
候補も出現する。
【0009】ところで、こうような入力に対する多様な
変換結果の中で、最も確からしいものを第1 順位に出力
するための評価処理として、例えば、全体を構成する文
節数あるいは単語数の少ない順に優先度を決定する方法
が考えられている。具体的には、例えば「こうがくしょ
とく」の入力に対して、「高額/所得」を「項が/句/
所得」や「項が/区処と/句」より確からしいと判定す
るものである。
【0010】尚、この場合、同音語については使用頻度
の大なる単語か優先して出力するのが自然であり、好ま
しい。
【0011】しかし、全体を構成する文節数が同じであ
ってもその区切り方が異なる場合もあり、また変換漏れ
を少なくするために構成数の多い分析結果をも含めて出
力する場合には、その取扱うデータ構造が複雑になる。
しかもオペレータがより選択操作を行い易くする為に、
それらの複数の変換結果をどのように出力表示するかが
問題となる。
【0012】この問題を解択するために例えば、複数の
単語を辞書登録した辞書検索部を用いて一連の入力文字
列からその文節単位の系列を抽出し、これらの各文節を
その文節の読みに対応する仮名漢字混じり表記にそれぞ
れ変換して出力するに際し、前記入力文字列に対する複
数の文節系列の相互に異なる区切り位置の中で最も前方
にある文節始点を基準点とし、この基準点以降に存在す
る次の文節の自立語部分と前記標準点で区切られた全文
節の付属語部分とを変換候補の単位として仮名漢字変換
を行い、その変換候補を順に表示出力する手法が考慮さ
れている。
【0013】例えば上述した例の「ざんだかをもとめる
けいさんしき」という入力に対して、「残高をも/止め
る」や「残高を/求める」のように文節系列の候補を作
成し、その変換候補結果を「(残高)を(も止)め
る」、「(残高)を(求)める」等のように求め、これ
を順に表示出力するので、同音次候補の選択処理を非常
に簡単化することができる。
【0014】即ち、例えば、前記(も止)の部分につい
ては、実際上「も止」という単語は存在しないが、その
読み仮名である「もと」の部分に他の同音単語情報や別
表記語が存在している。つまり同じ読みに対応する他の
候補が存在することが示され、文節内の同音語の選択と
同様に同音語次候補の切り換え指示により、異構造文節
列の選択が可能となる。
【0015】しかしながら、異構造文節列が自立語1つ
からなる場合は、選択操作は簡易であるが、複数の自立
語が組合わさってなりたつ場合は、多くの同音語が出力
されることとなる。例えば、「研究や開発の活動の様子
を今日的な始点から考えてみると、研究成果の記録と公
表に関する努力が不足していたとする執筆者の方々の反
省の意見は」をベタ文で入力すると、{研究や/開発、
研究/夜会/発}の{か集うの/様子、活動のよう/
巣、活動のよう/酢、活動の/様子}を{今日/的、今
日/敵、今日/滴、紺に/知的}な{支店、視点、始
点、支点}から{考、勘が、観が、缶が}えてみると、
{研究/製か、研究/制か、研究/声か、研究/生か、
研究/世か、研究/性か、研究/星か、研究/成果、研
究/盛夏、研究/正価、研究/生花、研究/製菓、研究
/青果、件/急性か、兼/急性か、券/急性か、剣/急
性か、県/急性か、件/急逝か、兼/急逝か、券/急逝
か、剣/急逝か、県/急逝か、件/旧制か、兼/旧制
か、券/旧制か、剣/旧制か、県/旧制か、件/旧姓
か、兼/旧姓か、券/旧姓か、剣/旧姓か、県/旧姓
か、研究せ/意か、研究せ/以下、研究せ/医科、研究
せ/胃か、研究/製/日、研究/制/日、研究/声/
日、研究/生/日、研究/世/日、研究/星/日、研究
/製/課、研究/制/課、研究/声/課、研究/生/
課、研究/世/課、研究/星/課、研究/製/化、研究
/制/化、研究/声/化、研究/生/化、研究/世/
化、研究/星/化、研究/製/科、研究/制/科、研究
/声/科、研究/生/科、研究/世/科、研究/星/
科、研究/製/家、研究/制/家、研究/声/家、研究
/生/家、研究/世/家、研究/星/家、研究/製/
下、研究/制/下、研究/声/下、研究/生/下、研究
/世/下、研究/星/下}の記録と{好評、公表、講
評}に{関、冠}する。努力が不足してい{たと刷、た
とす、他とす、田とす}る執筆{車、者、社、舎}の
{旁々、方々、か他形、か田形、か他型、か田型、か他
方、か田方}の反省{のい件は、の意見は、の違憲は、
のい兼は、のい券は、のい剣は、のい県は、の意見派、
の違憲派、の意見波、の違憲波、のい兼派、のい券派、
のい剣派、のい県派、のい兼波、のい剣波、のい県波}
の変換候補が得られる。ここで「けんきゅうせいかの」
の入力文に対して60以上の同音語が発生し、選択に時
間が多くかかり問題が多かった。
【0016】
【発明が解決しようとする課題】本発明はこのような事
情を考慮してなされたもので、その目的とするところ
は、多数の同音語を効率よく選択して、文書作成の効率
を向上し得るかな漢字変換装置を提供することにある。
【0017】
【課題を解決するための手段】本発明は、同音語の選択
に際し、確認された確認情報を文節単位に記憶するのと
合わせて、隣り合う文節との組み合わせ情報も記憶し、
この記憶された確認情報を含む変換候補が出現したと
き、優先して出力するようにしたものである。
【0018】つまり、変換すべき文字列を入力するため
の入力手段と、この入力手段によって入力されたかな文
字列を文節単位に抽出する文節抽出手段と、かな文字列
に対応する漢字文字列を記憶してなる辞書記憶手段と、
この辞書記憶手段から前記文節抽出手段によって抽出さ
れたかな文字列に対応するかな文字列を検索するための
辞書検索手段と、この辞書検索手段によって検索され、
各々の文節単位に選択されたかな漢字混じり文字列を出
力する結果出力手段と、この結果出力手段に出力された
かな漢字混じり文字列に対して文節単位の確認情報及び
隣り合う文節の組み合わせの確認情報を記憶する確認情
報記憶手段と、この確認情報記憶手段に記憶された確認
情報を有するかな漢字文字列の変換候補が出現した場
合、このかな漢字文字列を優先して出力させるための確
認情報優先手段とを有することを特徴とする。
【0019】
【発明の実施の形態】以下、図面を参照して本発明の一
実施例装置につき説明する。
【0020】図1は実施例装置の概略構成図である。入
力装置1は鍵盤装置や音声確認装置、仮名文字読取り装
置などからなる。この入力装置1を介して入力される読
みを表わす文字列(第1の文字列)は、例えば仮名文字
コードに変換された後、仮名漢字変換部2に与えられ
る。尚、上記読みを表わす第1の文字列は、例えば平仮
名、片仮名、ローマ字等として示されるものである。
【0021】仮名漢字変換部2は、例えばブロック抽出
部2a、総文節系列抽出部2b、文節抽出部2c、およ
び変換辞書3により構成される。この仮名漢字変換部2
は、前記入力装置1より転送された第1の文字列に対し
て、それに該当する漢字混じりの表示文字列からなる第
2の文字列を求め、これを出力制御部4に与えている。
【0022】ブロック抽出部2aは、上記第1の文字列
に対して、特に長さの長い入力文字列を能率よく解析す
る為に設けられたものであり、予め設定されている数値
N、例えばN=4として、N文節以内の文節系列として
対応づける文節解析結果を求めるもので、対応した文節
解析結果がない時には、上記第1の入力文字列を幾つか
のブロック区間に分割している。
【0023】そしてこのようにして分割した各ブロック
の読み仮名列を総文節系列抽出部2bに送り、またこの
総文節系列抽出部2bで求められた前記各ブロックにつ
いての仮名漢字変換結果、即ち第2の文字列を順次出力
制御部4に送っている。
【0024】上記総文節系列抽出部2bは、文節抽出部
2cを用いて前記第1の文字列を分割可能な文節系列に
分割し、これらの文節系列についてそれぞれ求められた
仮名漢字混じり表記の変換結果を上記ブロック抽出2a
に出力するものである。文節系列は前記入力文字列の文
節分割可能な全ての組合せについて求められ例えば優先
度の評価によってその確からしい候補の順に順位付けさ
れたのち、その第1順位のものから順に出力される。
【0025】尚、優先度の評価としては、一般に文節個
数が少ないもののほうが入力目的とする漢字混り文に対
応している傾向が高いことから、例えば文節個数の少な
い文節系列を優先して出力する等として行われる。
【0026】文節抽出部2cは、入力された文字コード
列と変換辞書3に予め登録された文字列(単語)との間
で照合検索を行い、上記第1の文字列に該当する漢字混
りの表記文字からなる第2の文字列を求めている。
【0027】変換辞書3は、例えば図2にそのメモリ構
成例を示すように、入力見出し表領域3a、出力見出し
表領域3bおよび品詞領域3cとを備え、上記入力見出
し表領域3aに読みを表わす第1の文字列を格納し、ま
たこの第1の文字列に対応する漢字混じりの表記文字か
らなる第2の文字列を上記出力見出し表領域3bに格納
したものとなっている。
【0028】そして、品詞領域3cには、上記第1およ
び第2の文字列に対する品詞の情報を格納している。
【0029】しかして文節抽出部2cは、与えられた入
力文字に対して、例えば公知の前方最長一致法により変
換辞書3の入力見出し表領域3aに予め登録されている
文字列(単語)を検索し、その活用語尾や付属語の解析
などを行って、前記入力文字列の頭字より最も長く一致
した入力文字列部分を支節抽出結果として求めているこ
の時、上記の活用語尾の解析は品詞領域3cに格納され
た品詞項目に基いて行われる。
【0030】そして、この解析によって見出された文節
抽出結果に対応する漢字混りの表記文字からなる第2の
文字列を前記出力見出し表領域3bから読出し、これを
入力している。更にこのとき、前記総文節系列抽出部2
bは、前記文節抽出部2cへの入力単位(文節抽出結
果)を、前記入力文字列に対して定められたブロック区
間における文節分割可能な組合せについて様々に変化さ
せ、その中の最も確からしい文節系列を求めている。
【0031】仮名漢字変換部2は、このような文節系列
に対して求められた仮名漢字混じり表記からなる第2の
文字列を出力制御部4の出力データメモリ5に転送して
いる。出力制御部4はこれらのデータを所定の表示出力
形式に変換し、文書表示用メモリ6に格納する。
【0032】文章表示用メモリ6に格納された、これら
のデータは、確認情報優先部8へ送られ、確認情報記憶
部9を参照することのより既でに確認された変換候補が
なるときは、その変換候補を優先して、出力するように
順番が変更される。
【0033】本実施例において、確認情報記憶部9は、
図6に示すように、文節単位の情報と隣り合う文節の組
合せ情報からなる。文節単位の情報はROMにある単語
とFDD/RAMにある単語と別々に記憶する。ROM
にある単語は、かな漢字変換において、一般的に使われ
る標準的単語を記憶する。FDD/RAMにある単語
は、利用者が登録した単語や、分野別の単語を記憶して
いる。
【0034】この様に構成することにより分野が変更さ
れたときに容易に確認情報の入れかえが可能となる。隣
り合う文節の組合せ情報は、文節単位の情報の相対位置
と、標準的単語であるのか、利用者が登録した単語又
は、分別の単語であるかの区別を記憶する。
【0035】図7に前述例において、タイミングt0で記
憶した例を示す。
【0036】ここで前記出力データメモリ5は図3に示
すように組合せテーブル5a、マツピングテーブル5
b、見出し語テーブル5cからなり、上記辞書検索部2
によって変換された見出し語を、各組合せの構造と併せ
て記憶するものである。この例は図8(a)に示す日本
語文の例をデータ格納構造を表現したもので組合せテー
ブル5aは、前記入力文字列の文節構造に対応して番号
付けされた各文節の並びを記述している。このテーブル
5aの行は文節構造の解釈上の種類を、列は個々の文節
構造における文節の繋がり順に記述したものとなってい
る。
【0037】即ち、最初のブロックでは候補が1種類、
2番目のブロックは2種類、3番目は3種類の系列候補
があることが示される。またこれらの各数値はマツピン
グテーブル5b要素番号に示している。また各文節単位
毎に存在する同音異義語の見出し語をテーブル5cでグ
ループ化して記憶し、マツピングテーブル5bの各要素
をポインタとして、見出し語テーブル5cの各グループ
をそれぞれ記述している。このようにして入力の読み仮
名位置との対応関係も同時に記述している。
【0038】図4は前記出力データメモリ6の内容を表
示装置7に出力する為の文字表示情報を記憶する前記文
書表示用メモリ6の構造である。このメモリ6は前記出
力データメモリ5の内容に基いて、同じ読み仮名位置に
ある同音異義語や異構造分列について比較照合し、先ず
入力文字列に対する全ての文節系列候補中の共通の文節
区切り箇所で前記入力文字列を分解し、さらに共通の付
属語文字部分および唯一通り求められる変換結果部分と
をそれぞれ他の部分から切離して記述している。
【0039】また、ある文節の頭部の見出し語文字に対
して、同じ読み仮名を付属語部分に持つ変換候補結果に
ついては、先の文節頭部に合せて区切り、区切られた後
ろ側の付属語部分の文字列を次に続く文節に結合させて
記述している。
【0040】即ち、或る文節系列の文節における付属語
の文字であっても、対応する同じ読みの部分が他の文節
系列中において自立語の始りの一部になっていれば、そ
の付属語の文字は次に続く文節の変換候補に結合させて
記述している。
【0041】図5は、前記図4の内容を確認情報優先部
8により、順に変更した例である。この例では、「資源
開発」が、組合わせた情報として、確認情報記憶部9に
記憶されていたと、「資源開発」が表示順位第1位に変
更される。
【0042】これらの同音語は後述するように、その表
示属性を通常の表示属性とは異ならせて表示出力され
る。
【0043】図10(a)〜(e)はその表示例であ
り、斜線部が表示属性の異なりを示している。この表示
属性の変更は、例えば表示文字の反転、ブリンク、輝度
変更、下線付等によって行われる。
【0044】次に図3に示す仮名文字入力例を用いて、
上記仮名漢字変換部2における仮名漢字変換処理につき
説明する。
【0045】ブロック抽出部2aは入力された文字系列
の先頭から最大N文節の系列を可能な限り求め体る。こ
こでNを例えば4とすると図8(a)に示す例では、先
ず入力系列全体を文節抽出部2cに入力し、最長一致法
により「そして」を第1の文節結果として得る。次にこ
の文節切れ目以降を始点(次の文節開始文字位置)とし
て同様に最長一致結果を求め、「こんごのと」なる文節
を得る。
【0046】このような処理を順に繰返して第1文節系
列候補「そして/こんごのと/うちは/かいていし」を
図8(b)中の項目「ア」の如く得る。次にこの項目
「ア」で得られた文節系列と別の文節系列を得るために
第3番目の文節結果「うしは」最後の1文字、つまりそ
の文節において付属語として解析される「は」削除して
これを文節抽出部2cに送り、同様にして最長一致結果
「うし」なる文節を得、続く「は」で始まる文節として
「は」を求める。
【0047】以下、同様にして上記第3、第2および第
1の文節により短い文節が得られる都度、更にこれらに
続く別の文節列を順次求める。このようにして入力文字
列に対して文節分割可能な全ての4文節系列を図8
(b)に示す如く求める。尚この時、対応する漢字混じ
りの見出し語候補(第2の文字列)を同時に求めてお
く。
【0048】次にこれらの系列のうちで、その全体の長
さが最長となる候補(文節系列)だけに着目する。この
ことは先に示したように入力による文節数が最小となる
系列が、入力目的とする変換結果に合っている傾向が高
いと云うことに立脚している。このことは、一つのブロ
ックの文節構成数が最小であればよく、また文節の構成
数が同じであれば、そのブロックはより長い長さをもつ
ことを意味している。
【0049】しかして前記図8(b)に示される結果の
中で最長の文節系列となるものは、項目「ア」や項目
「ウ」に示されるものである。そこで次にこれら文節系
列が共通に文節の切れ目を持っている個所を見つける。
【0050】この例では「そして/〜」と、「〜は/
〜」しが共通の文節区切り箇所として求められる。ブロ
ック抽出部2aはこのような2つの位置をブロック区切
りと判定するもので、第1ブロック区間を「そして」、
第2ブロック区間を「こんごとうしは」とする。そして
順次これらの区間の文字列を総文節列解析部2bに解析
させ、それらの変換結果を出力制御部4へ送っている。
【0051】この結果、上記第1ブロック区間は「そし
て」のみの候補となり、この情報が先ず出力制御部4へ
送られる。尚、この場合、他に同音語が無いのでそのま
ま文書中の文字データ(変換結果)として通常形態で表
示される。しかる後、第2ブロック区間の解析が行われ
る。
【0052】ここで、前記総文節列解析部2bは、与え
られたブロック区間の読みの対応した文字系列を総当た
りで求めるものであるが、実際には図8(b)に示すよ
うに既に文節系列が求められているので、その指定区間
の範囲に対応するものだけ選べば十分である。
【0053】そして優先度の評価として、例えば文節数
最小の構成の候補だけを選ぶと、その解析結果は図9の
項目[2]のようになる。勿論、その他の文節候補列も
出力データメモリ5に与えておくようにしてもよい。例
えば、「この後の/問う/誌は」をも、出力結果に加え
ることも可能である。
【0054】さて、ブロック抽出部2aは、次に前記入
力文字系列のうちで未だにブロックが決定していない残
りの部分、つまり「かいていしげ……」なる文字列につ
いて、同様の方法でブロックの単位を求め、図9の項目
[3]に示す如き変換結果を求める。続いて変換結果
「限って」を図9の項目[4]のように求め、その入力
系列全体に対する変換処理を終了することになる。
【0055】以上の変換結果は各ブロック毎に出力制御
部4へ送られる。出力制御部4は出力データメモリ5に
格納された各ブロック毎のデータをそれぞれ変換し、文
書表示用メモリ6に順次スタックし、出力の優先順位を
変更し表示装置7に出力する。
【0056】即ち、出力制御部4では文書表示用データ
を前記図4の如く作成し、これを先ず図8(a)に示す
ように表示装置7に出力している。上記の例では、「今
後のと」の文節候補に対しては、自立語部が“今後”と
して、付属語部が“のと”として分離される。文節候補
「牛は」も同様に“牛”と“は”に分離される。また第
2文節系列候補では自立語部が“今後”、付属語部が
“の”として分離され、「投資は」は“投資”と
“と”,“は”とに分離される。
【0057】従ってこの場合、“の”と“は”は共に共
通の付属語文字であり、また“今後”には他に同音語が
ないので、これらの文字部分については通常の表示形態
で表示される。また他の文字については複数の変換候補
(同音異字)が存在することから、これを、強調して示
すために例えば高輝度で表示される。つまり、文節「今
後のと」における“と”は付属語であるが、次の文節単
語「牛」とともに扱われる。
【0058】従って、表示装置7には、「そして今後の
[と牛]は[改定し限界発に]限って」と表示されるこ
とになる。尚、[]内は高輝度表示される文字を示して
いる。
【0059】ここで目的とする見出し語の選択のため
に、入力装置1には例えば図1中1aに示すように次候
補キーが設けられている。この次候補キー1aは、例え
ば図10に示すように[と牛]の部分にカーソル1bを
合わせ、この状態で前記次候補キー1aが操作されたと
き、その表示を次の候補に変更する役割を担うものであ
る。
【0060】従ってこの場合には、図8(a)に示され
るテーブル5aの第1行目の構造に代えて、第2行目に
示す文節列構造、即ち「今後の[投資]は」が図10
(b)に示す如く出力表示される。そして、更に前記次
候補キー1aを操作していくと[投資]が[闘志],
[透視]の如く、順次他の同音語に変更され、再び元の
[と牛]の表示に戻ることになる。尚、これらの動作は
前記図4に示した文書表示用メモリ6に格納されたデー
タに基づいて行われる。
【0061】ところで前記図4に示される文書対応デー
ブル6aは、表示装置7の表示画面上の座標値i1〜i
7と出力データ(変換結果)との対応を表したものであ
る。表示語テーブル6bは出力データの内容を示してい
る。しかして変換候補の表示は、先ず文書対応テーブル
6aのデータi3によって表示語テーブル6bの
「(1)と牛」が指示され、これが表示される。
【0062】しかる後、前記次候補キー1aが操作され
ると、データi3によってそのブロックにおける次の候
補「(2)投資」にポインタが進められ、表示が切り換
えられる。このようにしてポインタが進められて
「(3)凍死」まで表示が切り替えられると、その次に
は再び「(1)と牛」に戻るように制御されている。こ
の表示語テーブル6bに示されるように、前述したよう
に文節単位に基づいて解析された複数の変換候補結果
は、同音異字の関係に従って整理され、部分的にその区
切りの単位が変更されている。
【0063】次候補キー1aを操作し、確認を行う。こ
の確認操作により、出力制御部6は、確認情報記憶部9
へ記憶する指示をする。例においては、「投資」が目的
とする単語であることを指示すると、例えば、「投資」
の辞書番号が確認情報記憶部9へ記憶される。
【0064】この「投資」においては、確認された文節
が複数ではないので文節単位の情報のみ登録される。
【0065】同様にして「かいていしげん…」なる文字
列についても、自立語部が“改定”、付属語部が“し”
として扱われ、“し”の部分については他に“資源”と
いう文節単語が存在しているので、この“し”は次の文
節“限界”と統合して出力される。続く「発に」までは
全候補が共通に持つ単語の区切りがないので、これらは
まとめて出力される。
【0066】なお、機械処理上、自立語は1単語毎に文
節として扱われる。
【0067】「かいていしげん…」なる文字列は、複数
の文節から同音語構造を構成していることにより、文節
単位の情報の他に、隣合う文節との組み合わせ情報も、
確認情報記憶部9へ記憶する。実施例においては、「海
底−資源」「資源−開発」が記憶される。ここで、文節
単位の確認情報と組合せ情報の優先関係を説明する。
【0068】例えば、「海底−資源」が選択された後、
「改定」が単独で選択されたとすると、文節単位の優先
関係は、改定>海底となる。このため、「かいてい」を
入力すると、出力順位は改定→海底→改訂→開廷とな
る。
【0069】図11乃至図16は本装置の上述した処理
の流れを示すものである。図11に示す制御フローにお
いて、入力装置1から得られる入力キーコードは常時調
べられており、その入力コードが日本語文の読みに対応
する仮名文字コードであれば、順次スタックに蓄えられ
る。
【0070】また上記入力コードが変換要求を示すもの
であれば図12に示される仮名漢字変換処理が行われ
る。この変換要求は、入力装置が変換要求キーを有して
いる場合、オペレータが適当な長さの文字列を入力後、
この変換要求キーを打鍵することにより発生される。ま
た入力装置が変換要求キーを有するか否かに拘らず、入
力文字が例えば句読点を示すコードであったことを検出
した場合には、上記変換要求を自動的に発生することが
望ましい。
【0071】また、入力コードが前記次候補キー1aに
対応したものであれば、図13に示す同音語選択処理を
行い、その他のコード、例えば訂正,挿入,削除等のコ
ードの場合には既に表示された文章について編集処理が
行われる。また図14は本発明における図12中の変換
候補の編集処理を示すものである。
【0072】なお、一般にワードプロセッサでは、動員
語同音語の選択を各変換結果毎に逐次実行するものと、
例えば1頁分の文字列の入力後に一括して選択するもの
が知られているが、本発明装置にあっては、そのいずれ
の方式であってもよい。
【0073】以上説明したように本発明によれば、比較
的長い入力仮名文字列を解析し、仮名漢字混じりの文字
列に変換して日本語文章を作成していく際、その結果と
して生ずる多数文節列候補を、単純明快に表示すること
ができ、表示される順序は、複合文節は確認情報が寄り
優先して行われオペレータの同音語選択の操作の能率を
上げることができる。
【0074】つまり、一つの文節候補における同音語の
選択ばかりではなく、文節区切りの異なる異文節系列の
候補についても前述したように一括して同音字の選択を
行い得る。
【0075】したがって、同音異義語および同音異文節
の変換候補文字から目的とする仮名漢字変換文字を簡易
に選択して日本語文章を極めて効率よく作成することが
できる。また、オペレータの負担を大幅に軽減すること
ができ、その実用的利点は絶大である。
【0076】なお、本発明は上記実施例に限定されてい
るものではない。例えば、ベタ文の入力でなく、文節単
位に区切って入力されるものでも、文節単位と隣合う文
節を組み合わせた情報を記憶するようにして出力する優
先順序を入れ換え、その選択を促すようにしてもよい。
【0077】また、付属語の種類や、付属語そのものを
組み合わせて記憶してもよい。要するに本発明はその要
旨を逸脱しない範囲では種々変形して実施することがで
きる。
【0078】かくして本発明によれば、例えば上述した
例の「けんきゅうせいか」の入力に対して、「研究/成
果」を選択すると、次に同じ入力があった場合、「研究
/製か」より「研究/成果」は優先して出力され、確認
のみ行えばよい。即ち、例えば、前記「研究/成果」を
選択することにより、文節単位の確認情報として、「研
究」と「成果」が記憶され、合わせてとなり合う組合せ
情報として、「研究−成果」が記憶されて、優先出力の
対象となる。
【0079】上述の例文すべてを選択すると以下の組合
せ情報が記憶される。 (1)研究−開発 t0 (2)開発−活動 t1 (3)活動−様子 t0 (4)様子−今日 t1 (5)今日−的 t0 (6)的 −視点 t1 (7)視点−考 t1 (8)研究−成果 t0 (9)成果−記録 t3 (10)記録−公表 t2 (11)公表−関する t1 (12)関する−努力 t3 (13)努力−不足 x (14)執筆−者 t2 (15)者 −方々 t1 (16)方々−反省 t3 (17)反省−意見 t2 (18)意見− 上記例における組合せ情報の後に記してあるt0〜t3は記
憶するタイミングを示してある。隣り合う文節に同音異
義語がある場合と、前又は後に同音異義語がない場合と
して、タイミングが相異する。 t0…同音語が選択された時点では合成語となっている。 t1…同音語が選択された時点では前の文の文節が同音異
義語である。 t2…同音語が選択された時点では前の文の文節が同音異
義語でない。 t3…同音語が選択された時点では後の文の文節が同音異
義語でない。 x…隣り合う文節が同音異義語でない。
【0080】ここで、x、組合せ情報を記憶する必要は
ない。又、文節間にある助詞、助動詞は無視して、例で
は示してある。確認情報を記憶するタイミングにより、
組合せ情報として記憶しなくてもよい。
【0081】例えば、t0のみ記憶することでも選択効果
は高くなる。従って、異構造文節列の中の別の候補を選
択する為の特殊な指示キーを設けることなく、従来の同
音語次候補キーを用いてその選択処理を効率良く行うこ
とが可能となる等の絶大なる効果が奏せられる。
【0082】
【発明の効果】かくして本発明によれば、例えば上述し
た例の「けんきゅうせいか」の入力に対して、「研究/
成果」を選択すると、次に同じ入力があった場合、「研
究/製か」より「研究/成果」は優先して出力され、確
認のみ行えばよいという効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施例を示す装置概略構成図であ
る。
【図2】変換辞書のメモリの構成を示す図である。
【図3】出力データメモリと文書表示用メモリの構成と
確認情報を示す図である。
【図4】出力データメモリと文書表示用メモリの構成と
確認情報を示す図である。
【図5】出力データメモリと文書表示用メモリの構成と
確認情報を示す図である。
【図6】出力データメモリと文書表示用メモリの構成と
確認情報を示す図である。
【図7】出力データメモリと文書表示用メモリの構成と
確認情報を示す図である。
【図8】入力文字列とその変換処理を示す図である。
【図9】入力文字列とその変換処理を示す図である。
【図10】変換候補の表示例を示す図である。
【図11】変換処理の制御フローの例を示す図である。
【図12】変換処理の制御フローの例を示す図である。
【図13】変換処理の制御フローの例を示す図である。
【図14】変換処理の制御フローの例を示す図である。
【図15】変換処理の制御フローの例を示す図である。
【図16】変換処理の制御フローの例を示す図である。
【符号の説明】
1…入力装置、2…仮名漢字変換部、3…変換辞書、4
…出力制御部、5…出力データメモリ、6…制御テーブ
ル、7…表示装置、1a…次候補変換キー、1b…選択
キー、2a…ブロック抽出部、2b…総文節系抽出部、
2c…文節抽出部、3a…入力見出し表領域、3b…出
力見出し表領域、6a…文書対応テーブル、6b…表示
語テーブル、8…確認情報優先部、9…確認情報記憶部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中里 茂美 東京都青梅市末広町2丁目9 株式会社東 芝青梅工場内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】変換すべき文字列を入力するための入力手
    段と、 この入力手段によって入力されたかな文字列を文節単位
    に抽出する文節抽出手段と、 かな文字列に対応する漢字文字列を記憶してなる辞書記
    憶手段と、 この辞書記憶手段から前記文節抽出手段によって抽出さ
    れたかな文字列に対応するかな文字列を検索するための
    辞書検索手段と、 この辞書検索手段によって検索され、各々の文節単位に
    選択されたかな漢字混じり文字列を出力する結果出力手
    段と、 この結果出力手段に出力されたかな漢字混じり文字列に
    対して文節単位の確認情報及び隣り合う文節の組み合わ
    せの確認情報を記憶する確認情報記憶手段と、 この確認情報記憶手段に記憶された確認情報を有するか
    な漢字文字列の変換候補が出現した場合、このかな漢字
    文字列を優先して出力させるための確認情報優先手段
    と、 を有することを特徴とするかな漢字変換装置。
JP10049982A 1998-02-17 1998-02-17 かな漢字変換装置 Pending JPH10247192A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10049982A JPH10247192A (ja) 1998-02-17 1998-02-17 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10049982A JPH10247192A (ja) 1998-02-17 1998-02-17 かな漢字変換装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP59090250A Division JPS60235271A (ja) 1984-05-08 1984-05-08 かな漢字変換装置

Publications (1)

Publication Number Publication Date
JPH10247192A true JPH10247192A (ja) 1998-09-14

Family

ID=12846235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10049982A Pending JPH10247192A (ja) 1998-02-17 1998-02-17 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPH10247192A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017004127A (ja) * 2015-06-05 2017-01-05 富士通株式会社 テキスト分割プログラム、テキスト分割装置、及びテキスト分割方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017004127A (ja) * 2015-06-05 2017-01-05 富士通株式会社 テキスト分割プログラム、テキスト分割装置、及びテキスト分割方法

Similar Documents

Publication Publication Date Title
US7506254B2 (en) Predictive conversion of user input
KR100707725B1 (ko) 자동완성 질의어 제공 시스템, 방법 및 상기 방법을실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한기록 매체
JPH0563831B2 (ja)
JP3937741B2 (ja) 文書の標準化
JP4783563B2 (ja) インデックス生成プログラム、検索プログラム、インデックス生成方法、検索方法、インデックス生成装置および検索装置
JPH07334499A (ja) 文字列入力装置
KR20060104544A (ko) 자동완성 질의어 제공 시스템, 방법 및 상기 방법을실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한기록 매체
JPH10247192A (ja) かな漢字変換装置
JP2006072787A (ja) 自動質問解答方法、そのためのモデル作成方法、およびコンピュータプログラム
JP3056810B2 (ja) 文書検索方法および装置
JPH0528129A (ja) 文書作成装置
JPH07191986A (ja) 文章入力装置
JPH0969104A (ja) 仮名漢字変換装置および仮名漢字変換方法
JPS60128559A (ja) 仮名漢字変換装置
JP3048793B2 (ja) 文字変換装置
JPS6389976A (ja) 言語解析装置
JPS6061825A (ja) 文字変換装置
JP5767784B2 (ja) 情報処置装置、文字列候補確定方法及びプログラム
JPH04169971A (ja) 文書検索装置
JPS5998236A (ja) 日本文入力装置
KR20070064566A (ko) 자동완성 질의어 제공 시스템, 방법 및 상기 방법을실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한기록 매체
JPH0610804B2 (ja) かな漢字変換装置
JPH05151199A (ja) 文書作成装置
JP2002297581A (ja) 文書作成支援装置およびその方法
JPH01237877A (ja) 漢字変換方式