JPS60235271A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPS60235271A
JPS60235271A JP59090250A JP9025084A JPS60235271A JP S60235271 A JPS60235271 A JP S60235271A JP 59090250 A JP59090250 A JP 59090250A JP 9025084 A JP9025084 A JP 9025084A JP S60235271 A JPS60235271 A JP S60235271A
Authority
JP
Japan
Prior art keywords
clause
kana
character string
confirmation information
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59090250A
Other languages
English (en)
Other versions
JPH0563831B2 (ja
Inventor
Kimito Takeda
武田 公人
Hiromi Saito
裕美 斎藤
Tsutomu Kawada
河田 勉
Shigemi Nakazato
茂美 中里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59090250A priority Critical patent/JPS60235271A/ja
Publication of JPS60235271A publication Critical patent/JPS60235271A/ja
Publication of JPH0563831B2 publication Critical patent/JPH0563831B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は例えば文単位として入力されるような長さの長
い連続仮名文字系列を適宜文節単位に区切りながら仮名
漢字変換を行って漢字仮名混じりの日本語文章を効果的
に作成することのできる仮名漢字変換装置に関する。
〔発明の技術的背景とその問題点〕
従来の日本語ワードプロセッサ等における仮名漢字入力
の単位は、一般に単一文節に限られており、また名詞の
複合語の入力においても高々数単位程度に限定されてい
るものが殆んどである。従って、この種の装置を用いて
日本語文章を入力作成する場合、単語あるいは文節の単
位を常に意識しなければならず、オペレータにとって大
きな負担となった。そこで最近では文章入力の単位を制
限することなく、文単位の読み仮名列、所網ペタ文を入
力し、とのペタ文に対して仮名漢字変換処理を行う研究
が種々試みられている。それらは具体的には、例えば文
節解析処理を再帰的に行うことでその目的を達成してい
る。然し乍ら、この為には相当長い処理時間を必要とし
、またバッファメモリを大量に消費せざるを得ないとい
う問題があった。また処理時間およびメモリ量を制限し
て文節解析処理のアルゴリズムを簡素化するととが考え
られているが、その変換処理精度が劣化することが否め
なかった。しかも、このようにして得られた変換結果を
どのように表示出力すれば、その同音語選択の指示を扱
い易くできるかが大きな課題となっていた。
例えば、「ざんだかをもとめる」なる文字列を仮名人力
した場合、「ざんだかを/もとめる」と機械的に文節分
割ができることが予想されるが、あるいは「ざんだかを
も/とめる」という分割形式も文法的にあシうる。この
場合、一般に経験的にみて所謂最長一致するものが確か
らしいと考えられるが、このような経験則だけに基いて
、常に入力文字列の前方から文節解析処理を行い、例え
ば「残高をも/止める」だけを抽出したのではその変換
精度が著しく悪くなる。従って、結局「残高をも/止め
る」、及び「残高を請求める」等の複数の変換候′補を
抽出し、その選択をオペレータの判断に委ねることが必
要となる。
また、「けいさんしき」という入力に対しても、本し装
置内の辞書に「計算式」という単語が登録されていない
とすると、結果は同様にして「計算/式」、「計算し/
木」と云うように複数の変換結果が生じる。更には「毛
/遺産/式」のような変換結果も生じる。更には仮に「
るけい−”流刑″」という単語が辞書登録されていると
すれば、[残高を請求め/流刑/算式]という候補も出
現する。
ところで、このような入力に対する多様な変換結果の中
で、最も確からしいものを第1順位に出力するだめの評
価処理として、例えば、全体を構成する文節数あるいは
単語数の少ない順に優先度を決定する方法が考えられて
いる。具体的には、例えば「こうがくしよと〈」の入力
に対して、「高額/所得」を「項が/句/所得」や「項
が/区処と7句」より確からしいと判定するものである
。尚、この場合、同音語については使用頻度の犬なる単
語から優先して出力するのが自然であり、好ましい。し
かし、全体を構成する文節数が同じであってもその区切
シ方が異なる場合もあり、また変換漏れを少々くするた
めに構成数の多い解析結果をも含めて出力する場合には
、その取扱うデータ構造が複雑になる。しかもオペレー
タがよシ選択操作を行い易くする為に、それらの複数の
変換結果をどのように表示出力するかが問題となる。
この問題を解釈するために例えば、複数の単語を辞書登
録した辞書検索部を用いて一連の入力文字列からその文
節単位の系列を抽出し、これらの各文節をその文節の読
みに対応する仮名漢字混じシ表記にそれぞれ変換して出
力するに際し、前記入力文字列に対する複数の文節系列
の相互に異なる区切多位置の中で最も前方にある文節始
点を基準点とし、この基準点以降に存在する次の文節の
自立語部分と前記基準点で区切られた前文節の付属を分
とを変換候補の単位として仮名漢字変換を行■ い、その変換候補を順に表示出力する手法が考慮されて
いる。
例えば上述した例の「ざんだかをもとめるけいさんしき
」という入力に対して、「残高をも/止める」や「残高
を請求める」のように文節系列の候補を作成し、その変
換候補結果を「〔残高〕を〔も止〕める」、「〔残高〕
を請求〕める」等のようにめ、これを順に表示出力する
ので、同音次候補の選択処理を非常に簡単化することが
できる。即ち、例えば、前記〔も止〕の部分については
、実際上「も止」という単語は存在しないが、その読み
仮名である「もと」の部分に他の同音単語情報や別表起
語が存在している。つまシ同じ読みに対応する他の候補
が存在することが示され、文節内の同音語の選択と同様
に同音語次候補の切シ換え指示によシ、異構造文節列の
選択が可能となる。
しかしながら、異構造文節列が自立語1つからなる場合
は、選択操作は簡易であるが、複数の自立語が組合わさ
ってな如たつ場合は、多くの同音語が出力されることと
なる。例えば、 「研究や開発の活動の様子を今日的な視点から考えてみ
ると、研究成果の記録と公表に関する努力が不足してい
たとする執筆者の方々の反省の意見は」を、ベタ文で入
力すると、 (研究や/開発、研究/夜会/発)の (か集うの/様
子、活動のよう/果、活動のよう/酢、活動の/様子)
を (今日/的、今日/敵、今日7滴、相に/知的)な
 (支店、軸、始点、支点)から (煮−1勘が、観が
、缶が)えてみると、(研究/製か、研究/制か、研究
/声か、研究/生か、研究7世か、研究/性か、研究/
星か、研究/成果、研究/盛夏、研究/正価、研究/生
花、研究/−j!!!菓、研究/肯未、件/急性か、兼
/急性か、券/急性か、剣/急性か、県/急性か、件/
急逝か、兼/急逝か、券/急逝か、剣/急逝か、県/急
逝か、件/旧制か、兼/旧制か、券/旧制か、剣/旧制
か、県/旧制か、件/旧姓か、兼/旧姓か、券/旧姓か
、剣/旧姓か、県/旧姓か、研究せ/意か、研究せ/以
下、研究せ/医科、研究せ/胃か、研究/製/日、研究
/制/日、研究/声/日、研究/生/日、研究/世/日
、研究/星/日、研究/製/課、研究/制/昧、研究/
声/課、研究/生/課、研究7世7課、研究/星/課、
研究/製/化、研究/制/化、研究/声/化、研究/生
/化、研究/世/化、研究/星/化、研究/製/科、研
究/制/科、研究/声/科、研究/生/科、研究/世/
科、研究/星/科、研究/製/家、研究/制/家、研究
/声/家、研究/生/家、研究/世/家、研究/星/家
、研究/製/下、研究/制/下、研究/声/下、研究/
生/下、研究/世/下、研究/星/下)の 記録と(好
評、公表、講評)に (関、冠)する 努力が 不足し
てい (たと刷、たとす、他とす、田とす)る 執筆 
(車、煮、社、舎)の (労久不文、か細形、か円形、
か他型、か田型、か他方、か出方)の 反省 (のい件
は、の意見は、の達意は、のい兼は、のい券は、のい剣
は、のい県は、の意見派、の違憲派、の意見波、の違廠
波、のい兼派、のい券派、のい剣派、のい宗派、のい兼
波、のい側波、のい基波、のい基波) の変換候補が得られる。ここで、「けんきゅうせいかの
」の入力文に対しては60以上の同音語が発生し、選択
に時間が多くかかり問題が多かった。
〔発明の目的〕 本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、多数の同音語を効率よく選択し
て、文書作成の効率を向上し得るかな漢字変換装置を提
供することにある。
〔発明の概要〕
本発明は、同音語の選択に際し、確認された確認情報を
文節単位に記憶するのと合わせて、隣なシ合う文節との
組合せ情報も記憶し、この記憶された確認情報を含む変
換候補が出現したとき、優先して出力するようにしたも
のである。
〔発明の効果〕
かくして本発明によれば、例えば上述した例の「けんき
ゅうせいか」の入力に対して、「研究/成果」を選択す
ると、次に同じ入力があった場合、「研究/製か」より
「研究/成果」は優先して出力され、確認のみ行えばよ
い。即ち、例えば、前記「研究/成果」を選択すること
により、文節単位の確認情報として、「研究」と「成果
」が記憶され、合せてとなり合う組合せ情報として、「
研究−成果」が記憶されて、優先出力の対象となる。
上述の例文全てを選択すると以下の組合せ情報が記憶さ
れる。
■研究−開発 tO■研究−成果 tQ■開発−活動 
tl ■成果−記録 t3■活動一様子 to [F]
記録−公表 t2■様子−今日tt ■公表−関する 
t1■今日−的 tOo関する一努力 t3■的−視点
 tl O努力−不足 × ■視点−考 11 0執筆−者 t2 05者一方々 tl 0反省−意見 t2■方々−反省
 t3 [相]意見− 上記例における組合せ情報の後に記しであるtQ〜t3
 は記憶するタイミングを示しである。隣なシ合う文節
に同音異議語がある場合と、前又は後に同音異議語がな
い場合とて、タイミングが相異する。
to・・・同音語が選択された時点で合成語となってい
る。
tl・ 〃 前の文節が同音異礒語である。
t2・・・ 〃 前の文節が同音異礒語でない。
t3.= tt 後の文節が同音異議語でない。
×・・・瞬なり合う文節が同音異議語でない。
ここで、×は、組合せ情報を記憶する必要はない。
又、文節間にある助詞、助動詞は無視して、例では示し
である。確認情報を記憶するタイミングにより、組合せ
情報として記憶しなくてもよい。
例えば、toのみ記憶することでも選択効率は高かくな
る。従って、異構造文節列の中の別の候補を選択する為
の特殊な指示キーを設けることなく、従来の同音語次候
補キーを用いてその選択処理を効率良く行うことが可能
となる等の絶大なる効果が奏せられる。
〔発明の実施例〕
以下、図面を参照して本発明の一実施例装置につき説明
する。
第1図は実施例装置の概略構成図である。入力装置1は
鍵盤装置や音声認識装置、仮名文字読取シ装置等からな
る。この入力装置1を介して入力される読みを表わす文
字列(第1の文字列)は、例えば仮名′文字コードに変
換された後、仮名漢字変換部2に与えられる。尚、上記
読みを表わす第1の文字列は、例えば平仮名、片仮名、
ローマ字等として示されるものである。
仮名漢字変換部2は、例えばブロック抽出部2a。
総文節系列抽出部2b、文節抽出部2c、および変換辞
書3によ)構成される。この仮名漢字変換部2は、前記
入力装置1よシ転送された第1の文字列に対して、それ
に該当する漢字混じシの表示文字列からなる第2の文字
列をめ、これを出力制御部4に与えている。ブロック抽
出部2aは、上記第1の文字列に対して、特に長さの長
い入力文字列を能率よく解析する為に設けられたもので
あり、予め設定されている数値N1例えばN−4として
、N文節以内の文節系列として対応づける文節解析結果
をめるもので、対応した文節解析結果がない時には、上
記第1の入力文字列を幾つかのブロック区間に分割して
いる。そしてこのようにして分割した各ブロックの読み
仮名列を総文節系列抽出部2bに送り、またこの総文節
系列抽出部2bでめられた前記各ブロックについての仮
名漢字変換結果、即ち第2の文字列を順次出力制御部4
に送っている。
上記総文節系列抽出部2bは、文節抽出部2Cを用いて
前記第1の文字列を分割可能な文節系列に分割し、これ
らの文節系列についてそれぞれめられた仮名漢字混り表
記の変換結果を上記ブロック抽出部2aに出力するもの
である。文節系列は前記入力文字列の文節分割可能な全
ての組合せについてめられ、例えば優先度の評価によっ
て、その確からしい候補の順に順位付されたのち、その
第1順位のものから順に出力される。尚、優先度の評価
としては、一般に文節個数が少ないもののほうが入力目
的とする漢字混り文に対応している傾向が高いことから
、例えば文節個数の少ない文節系列を優先して出力する
等して行われる。
文節抽出部2Cは、入力された文字コード列と変換辞書
3に予め登録された文字列(単@)との間で照合検索を
行い、上記第1の文字列に該当する漢字混りの表記文字
からなる第2の文字列をめている。変換辞書3は、例え
ば第2図にそのメモリ構成例を示すように、入力見出し
表領域3a、出力見出し表領域3bおよび品詞領域3C
とを備え、上記入力見出し表領域3aに読みを表わす第
1の文字列を格納し、またこの第1の文字列に対応する
漢字混じシの表記文字からなる第2の文字列を上記出力
見出し表領域3bに格納したものとなっている。
そして品詞領域3Cには、上記第1および第2の文字列
に対する品詞の情報を格納している。
しかして文節抽出部2Cは、与えられた入力文字列に対
して、例えば公知の前方最長一致法によシ変換辞書30
入力見出し表領域3aに予め登録されている文字列(単
語)を検索し、その活用語尾や付属語の解析等を行って
、前記入力文字列の碩学よシ最も長く一致した入力文字
列部分を文節抽出結果としてめている。この時、上記の
活用語尾の解析は品詞領域3Cに格納された品詞項目に
基いて行われる。そして、この解析によって見出された
文節抽出結果に対応する漢字混りの表記文字からなる第
2の文字列を前記出力見出し表領域3bから読出し、こ
れを出力している。更にこのとき、前記総文節系列抽出
部2bは、前記文節抽出部2Cへの入力単位(文節抽出
結果)を、前記入力文字列に対して定められたブロック
区間における文節分割可能な組合せについて様々に変化
させ、その中の最も確からしい文節系列をめている。
仮名漢字変換部2は、このような文節系列に対してめら
れた仮名漢字混じシ表記からなる第2の文字列を出力制
御部4の出力データメモリ5に転送している。出力制御
部4はこれらのデータを所定の表示出力形式に変換し、
文書表示用メモリ6に格納する。
文書表示用メモリ6に格納された、これらのデータは、
確認情報優先部8へ送られ、確認情報記憶部9を参照す
ることによシ、既でに確認された変換候補がなるときは
、その変換候補を優先して、出力するように、順番が変
更される。
本実施例において、確認情報記憶部9は、第3E (d
)に示すように、文節単位の情報と、瞬なυ合う文節の
組合せ情報からなる。文節単位の情報はROMにある単
語とFDD/RAMにある単語と別々に記憶をする。 
R,OMにある単語は、かな漢字変換において、一般的
に使かわれる標準的単語を記憶する。FDD/RAMに
ある単語は、利用者が登録した単語や、分野別の単語を
記憶している。この様に構成することにより、分野が変
更されたときに容易に確認情報の入れかえが可能となる
隣なシ合う文節の組合せ情報は、文節単位の情報の相対
位置と、標準的単語であるのか、利用者が登録した単語
又は、分野別の単語であるかの区別を記憶する。
第3図(e)に前述例において、タイミングtQで記憶
した例を示す、。
ここで前記出力データメモリ5は第3図(a)に示すよ
うに組合せテーブル5a、マツピングテーブル5b、見
出し語テーブル5Cからなり、上記辞書検索部2によっ
て変換された見出し語を、各組合せの構造と併わせて記
憶するものである。この例は第4図(a)に示す日本語
文の例をデータ格納構造を表の並びを記述している。こ
のテーブル5aの行は文節構造の解釈上の種類を、列は
個々の文節構造における文節の繁がりを順に記述したも
のとなっている。即ち、最初のブロックでは候補が1種
類、2番目のブロックは2種類、3番目は3種類の系列
候補が有ることが示される。またこれらの各数値ハマッ
ピングテーブル5bの要素番号を示している。まだ各文
節単位毎に存在する同音異議語の見出し語をテーブル5
Cでグループ化して記憶し、マツピングテーブル5bの
各要素をポインタとして、見出し語テーブル5Cの各グ
ループをそれぞれ記述している。このようにして入力の
読み仮名位置との対応関係も同時に記述している。
第3図(b)は前記出力データメモリ6の内容を表示装
置7に出力する為の文字表示情報をiか臆する前記文書
表示用メモリ6のテーブル構造でめる。
このメモリ6は前記出力データメモリ5の内容に基いて
、同じ読み仮名位置にある同音意義語や異構造文節列に
ついて比較照合し、先ず入力文字列に対する全ての文節
系列候補中の共通の文節区切)箇所で前記入力文字列を
分割し、さらに共通の付属語文字部分および唯−通シ求
められる変換結果部分とをそれぞれ他の部分から切離し
て記述している。また、ある文節の頭部の見出し語文字
に対して、同じ読み仮名を付属語部分に持つ変換候補結
果については、先の文節頭部に合せて区切丸区切られた
後ろ側の付属語部分の文字列を次に続く文節に結合させ
て記述している。即ち、成る文節系列の文節における付
属語の文字であっても、対応する同じ読みの部分が他の
文節系列中において自立語の始シの一部になっていれば
、その付属語の文字は次に続く文節の変換候補に結合さ
せて記述している。
第3図(C)は、前記第3図(b)の内容を、確認情報
優先部8によシ、順位変更した例である。この例では、
「資源開発」が、組合せ情報として、確認情報記憶部9
に記憶されていたと、「資源開発」が表示順位第1位に
変更される。
) これらの同音語は後述するように、その表示属性を通常
の表示属性とは異ならせて表示出力される。
第5図(a)〜(e)はその表示例であり、斜線部が表
示属性の異なシを示している。この表示属性の変更は、
例えば表示文字の反転、プリンク、輝度変更。
下線性等によって行われる。
次に第3図に示す仮名文字入力例を用いて、上記仮名漢
字変換部2における仮名漢字変換処理につき説明する。
ブロック抽出部2aは入力された文字系列の先頭から最
大N文節の系列を可能な限りめ体る。ここでNを例えば
4とすると第4図(a)に示す例では、先づ入力系列全
体を文節抽出部2Cに入力し、最長一致法によシ「そし
て」を第1の文節結果として得る。次にこの文節切れ目
以降を始点(次の文節開始文字位置)として同様に最長
一致結果をめ、「こんどのと」なる文節を得る。このよ
うな処理を順に繰返して第1の文節系列候補「そして/
こんごのと/うしは/かいていし」を第4図(b)中の
項目「ア」の如く得る。次にこの項目「ア」で得られた
文節系列と別の文節系列を得るために、第3番目の文節
結果「うしは」の最後の1文字、つま)その文節におい
て付属語として解析される「は」を削除してこれを文節
抽出部2Cに送シ、同様にして最長一致結果「うし」な
る文節を得、続く「は」で始まる文節としてl「は」を
める。
以下、同様にして上記第3、第2および第1の文節によ
シ短い文節が得られる都度、更にこれらに続く別の文節
列を順次求める。このようにして入力文字列に対して文
節分割可能な全ての4文節系列を第4図(b)に示す如
くめる。尚この時、対応する漢字混じシの見出し語候補
(第2の文字列)も同時にめておく。
次にこれらの系列のうちで、その全体の長さが最長とな
る候補(文節系列)だけに着目する。このことは先に示
したように入力による文節数が最小となる系列が、入力
目的とする変換結果に合っている傾向が高いと太うこと
に立脚している。このことは、一つのブロックの文節構
成数が最小であればよく、まだ文節の構成数が同じであ
れば、そのブロックはより長い長さ全もっことを意味し
ている。
しかして前記第4図(b)に示される結果の中で、最長
の文節系列となるものは、項目「ア」と項目「つ」に示
されるものである。そこで次にこれら文節系列が共通に
文節の切れ目をもっている個所を見つける。この例では
「そして/〜」と、「〜は/〜」しか共通の文節区切多
箇所としてめられる。ブロック抽出部2aはこのような
2つの位置をブロックの区切りと判定するもので、第1
ブロック区間を「そして」、第2ブロック区間を「こん
どのとうしは」とする。そして順次これらの区間の文字
列を総文節列解析部2bに解析させ、それらの変換結果
を出力制御部4へ送っている。
この結果、上記第1のブロック区間は「そして」のみの
候補となシ、この情報が先ず出力制御部4へ送られる。
尚、この場合、他に同音語が無いので、そのまま文書中
の文字データ(変換結果)として通常形態で表示される
。しかる後、第2ブロック区間の解析が行われる。
ここで、前記総文節列解析部2bは、与えられたブロッ
ク区間の読みに対応した文字系列を総蟲りでめるもので
あるが、実際には第4図(b)に示すように既に文節系
列がめられているので、その指定区間の範囲に対応する
ものだけ選べば十分である。そして優先度の評価として
、例えば文節数最小の構成の候補だけを選ぶと、その解
析結果は第4図(d)の項目rI[Jのようになる。勿
論、その他の文節候補列も出力データメモリ5に与えて
おくようにしてもよい。例えば「今後の/問う7誌は」
をも、出力結果に加えることも可能である。
さて、ブロック抽出部2aは、次に前記入力文字系列の
うちで未だにブロックが決定していない残りの部分、つ
まり「かいていしけ・・・・・・」なる文字列について
、同様の方法でブロックの単位をめ、第4図(d)の項
目rI[Jに示す如き変換結果をめる。続いて変換結果
「限って」を第3図(d)の項目「■」のようにめ、そ
の入力系列全体に対する変換処理を終了することになる
以上の変換結果は各ブロック毎に出力制御部4へ送られ
る。出力制御部4は出力データメモリ5に格納された各
ブロック毎のデータをそれぞれ変換し、文書表示用メモ
リ6に順次スタックし、出力の優先順位を変更し、表示
装置7に出力する。
即ち、出力制御部4では文書表示用データを前記第3図
(b)の如く作成し、これを先ず第4図(a)に示すよ
うに表示装置7に出力している。上記の例では、「今後
のと」の文節候補に対しては、自立語部が“今後”とし
て、付属語部が“のと”として分離される。文節候補「
牛は」も同様に“牛”と“は″に分離される。また第2
文節系列候補では自立語部が“今後”、付属語部が“の
”として分離され、「投資は」は“投資”とパは”とに
分離される。従ってこの場合、“の”と“は”は共に共
通の付属語文字であシ、また“今後″には他に同音語が
ないので、これらの文字部分については通常の表示形態
で表示される。また他の文字については複数の変換候補
(同音異字)が存在することから、これを強調して示す
ために例えば高輝度で表示される。つま)、文節「今後
のと」における“と”は付属語ではあるが、次の文節単
語Pト」と共に扱われる。
従って、表示装置7には、「そして今後の〔と牛〕は〔
改定し限界発に〕限って」と表示されることになる。尚
、〔〕内は高輝度表示される文字を示している。
ここで目的とする見出し語の選択の為に、入力装置1に
は例えば第1図中1aに示すように次候補キーが設けら
れている。この次候補キー1aは、例えば第5図に示す
ように〔と牛〕の部分にカーソル1bを合わせ、この状
態で前記次候補キー1aが操作されたとき、その表示を
次の候補に変更する役割を担うものである。従ってこの
場合には、第4図(a)に示されるテーブル5aの第1
行目の構造に代えて、第2行目に示す文節列構造、即ち
「今後の〔投資〕は」が第5図(b)に示す如く出力表
示される。そして、更に前記次候補キー1aを操作して
いくと〔投資〕が〔闘志〕、〔透視〕の如く、順次他の
同音語に変更され、再び元の〔と牛〕の表示に戻ること
になる。尚、これらの動作は前記第3図(b)に示しだ
文書表示用メモリ6に格納されたデータに基づいて行わ
れる。
ところで前記第3図(b)に示される文書対応テーブル
6aは、表示装置7の表示画面上の座標値i1 −〜1
7と出力データ(変換結果)との対応を表したものであ
る。表示語テーブル6bは出力データの内容を示してい
る。しかして変換候補の表示は、先ず文書対応テーブル
6aのデータi3によって表示語テーブル6bの「■と
牛」が指示され、これが表示される。しかる後、前記次
候補キー1aが操作されると、データi3によってその
ブロックにおける次の候補「■投資」にポインタが進め
られ、表示が切換えられる。このようにしてポインタが
進められて「■凍死」まで表示が切替えられると、その
次には再び「■と牛」に戻るように制御されている′。
この表示語テーブル6bに示されるように、前述したよ
うに文節単位に基いて解析された複数の変換候補結果は
、同音異字の関係に従って整理され、部分的にその区切
、りの単位が変更されている。
次候補キー1aを操作し、目的とする単語が表示された
とき、選択キー1bを操作し、確認を行う。
この確認操作により、出力制御部6は、確認情報を確認
情報記憶部9へ記憶する指示をする。例においては、「
投資」が目的とする単語であることを指示すると、例え
ば、「投資」の辞書番号が確認情報記憶部9へ記憶され
る。
この「投資」においては、確認された文節が複数でない
ので文節単位の情報のみ登録される。
同様にして「かいていしげ・・・」なる文字列について
も、自立語部が“改定”、付属語部が“′シバとして扱
われ、“し”の部分については他に“費源”という文節
単語が存在しているので、との“し”は次の文節“限界
″と結合して出力される。続く「発に」までは全候補が
共通に持つ単語の区切シがないので、これらはまとめて
出力される。なお機械処理上、自立語は1単飴毎に文節
として扱われる。
「かいていしけ・・・・・」なる文字列は、複数の文節
から同音語構造を構成していることより、文節単位の情
報の他に、隣なり合う文節との組合せ情報も、確認情報
記憶部9へ記憶する。実施例においては、「海底−資源
」 「資源−開発」が記憶される。ここで、文節単位の
確認情報と組合せ情報の優先関係を説明する。例えば、
「海底−資源」が選択された後、「改定」が単独で選択
されたとすると、文節単位の優先関係は、改定〉海底と
なる。
このため、「かいてい」を入力すると、出力順位は改定
→海底→改訂→開延となる。しかしながら「かいていし
げん」が入力されると、組合せ情報が、優先され、出力
順位は、海底→改定→改訂→開延となる。
第6図乃至第11図は本装置の上述した処理の流れを示
すものである。第6図に示す制御フローにおいて、入力
装置1から得られる入力キーコードは常時調べられてお
り、その入力コードが日本語文の読みに対応する仮名文
字コードであれば、順次スタックに蓄えられる。また上
記入力コードが変換要求を示すものであれば第7図に示
される仮名漢字変換処理が行われる。この変換要求は、
入力装置が変換要求キーを有している場合、オペレータ
が適当な長さの文字列を入力後、この変換要求キーを打
鍵することによシ発生される。また入力装置が変換要求
キーを有するか否かに拘らず、入力文字が例えば句読点
を示すコードであったことを検出した場合には、上記変
換要求を自動的に発生することが望ましい。
また入力コードが前記次候補キー1aに対応したもので
あれば、第8図に示す同音語選択処理を行ない、その他
のコード、例えば訂正、挿入、削除等のコードの場合に
は既に表示された文章について編集処理が行なわれる。
また第9図は本発明における第7図中の変換候補の編集
出力処理を示すものである。
尚、一般にワードプロセッサでは、同音語の選択を各変
換結果毎に遂次実行するものと、例えば1頁分の文字列
の入力後に一括して選択するものが知られているが、本
発明装置にあっては、そのいずれの方式であってもよい
以上説明したように本装置によれば、比較的長い入力仮
名文字列を解析し、仮名漢字混シの文字列に変換して日
本語文章を作成していく際、その結果として生ずる多数
の文節列候補を、単純明快に表示することができ、表示
される順序は、複合文節は確認情報がよシ優先して行な
われオペレータの同音語選択の操作の能率を上げること
ができる。つ捷り、一つの文節候補における同音語の選
択ばかりではなく、文節区切りの異なる異文節系列の候
補についても前述したように一括して同音字の選択を行
い得る。従って、同音異議語および同音異文節の変換候
補文字から目的とする仮名漢字変換文字を簡易に選択し
て日本語文章を極めて効率良く作成することができる。
またオペレータの負担を大幅に軽減することができ、そ
の実用的利点は絶大である。
尚、本発明は上記実施例に限定されるものではない。例
えば、ベタ文の入力でなく、文節単位に区切って入力さ
れるものでも、文節単位と隣なり合う文節を組合せた情
報を記憶するようにして出力する優先順序を入れかえ、
その選択を促すようにしても良い。又、付属語の種類や
、付属語そのものを組合せて記憶してもよい。要するに
本発明はその要旨を逸脱しない範囲で種々変形して実施
することができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示す装置概略構成図、第2
図は変換辞書のメモリの構成を示す図、第3図は出力デ
ータメモリと文書表示用メモリの構成と確認情報を示す
図、第4図は入力文字列とその変換処理を示す図、第5
図は変換候補の表示例を示す図、第6図乃至第11図は
変換処理の制御フローの一例を示す図である。 1・・・入力装置、2・・・仮名漢字変換部、3・・・
変換辞書、4・・出力制御部、5・・・出力データメモ
リ、6・・・制御テーブル、7・・・辰示装置、1a・
・・次候補キー、lb・・・選択キー、2a・・・ブロ
ック抽出部、2b・・・総文節系列抽出部、2C・・文
節抽出部、3a・・・入力見出し表領域、3b・・・出
力見出し表領域、6a・・・文書対応テーブル、6b・
・表示語テーブル、8・・・確認情報優先部、9・・・
確認情報記憶部 代理人 弁理士 則 近 憲 佑 (ほか1名) ( 体 力 g 舌 し ω厄 Σ リ シ \Nつ4−LQ−−一〜〜−一一一−−−トJ Cす ν 塾 塾 やヤ も ニコ 口 t[F] ・Nノ ゝ′ \ノ −一 −ノ 第 7 図 特開昭GO−235271(14) 第 8 図 第 9 図 叉節系列カ・・・N 頭数、taカ・ N ら基5通6リイーしΔζ1轟1ト ゝ勢p健fあ卸゛ 云多5itリイてしンピリ志擢Iごワ#+オ支υλ(ホ
プータグルーグlz E t/]bぢ工、 N あ為1刊” あ3nゝ ゼω品首上斜1ヴ、とし7 ″ 升り2゛′ルーツ°に 5

Claims (3)

    【特許請求の範囲】
  1. (1)一連の入力文字列を得るだめの入力装置と、複数
    の単語を記憶する辞書記憶部と、この辞書記憶部を検索
    する#曹検索部と、この辞書検索部を用いて前記入力文
    字列より文節単位の系列を抽出する文節系列抽出部と、
    この文節系列抽出部によってめられた各々の文節に対し
    て、文法的評価を施しかな漢字混じシ表記を出力する結
    果出力部と、この結果出力部に出力された変換結果に対
    して、確認情報を与える手段と、この確認された情報を
    記憶する確認情報記憶部と、この確認情報記憶部に記憶
    された確認情報を有する変換候補が出現したとき、優先
    順位を変更する確認情報優先部を具備し、前記確認情報
    は、文節単位の確認情報と、隣合う文節を組合わせた情
    報を記憶することを特徴とするかな漢字変換装置。
  2. (2)確認情報優先部は、隣合う文節を組合せた情報は
    文節単位の確認情報より優先して出力することを特徴と
    する特許請求の範囲第1項記載のかな漢字変換装置。
  3. (3)前記確認情報記憶部へ記憶する隣合う文節を組合
    わせた情報は、結果出力部に於いて、文節の区切りが単
    一でない複合文節のときに記憶することを特徴とする特
    許請求の範囲第1項記載のかな漢字変換装置。
JP59090250A 1984-05-08 1984-05-08 かな漢字変換装置 Granted JPS60235271A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59090250A JPS60235271A (ja) 1984-05-08 1984-05-08 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59090250A JPS60235271A (ja) 1984-05-08 1984-05-08 かな漢字変換装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP10049982A Division JPH10247192A (ja) 1998-02-17 1998-02-17 かな漢字変換装置

Publications (2)

Publication Number Publication Date
JPS60235271A true JPS60235271A (ja) 1985-11-21
JPH0563831B2 JPH0563831B2 (ja) 1993-09-13

Family

ID=13993247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59090250A Granted JPS60235271A (ja) 1984-05-08 1984-05-08 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPS60235271A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63308665A (ja) * 1987-06-10 1988-12-16 Seiko Epson Corp 仮名漢字変換装置
JPS63311471A (ja) * 1987-06-12 1988-12-20 Matsushita Electric Ind Co Ltd かな漢字変換装置
JPS643773A (en) * 1987-06-26 1989-01-09 Hitachi Ltd Kana/kanji conversion device
JPH02150956A (ja) * 1988-12-01 1990-06-11 Seiko Epson Corp かな漢字変換装置
JPH02299061A (ja) * 1989-05-15 1990-12-11 Casio Comput Co Ltd 仮名漢字変換装置
JPH07146859A (ja) * 1994-06-10 1995-06-06 Seiko Epson Corp 仮名漢字変換装置
JPH08272797A (ja) * 1995-12-28 1996-10-18 Canon Inc 文字処理装置及びその方法
JPH08287062A (ja) * 1995-12-28 1996-11-01 Canon Inc 文字処理装置及びその方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS567173A (en) * 1979-06-29 1981-01-24 Sharp Corp Sentence processor
JPS58192128A (ja) * 1982-05-06 1983-11-09 Ricoh Co Ltd カナ漢字変換処理装置
JPS59186026A (ja) * 1983-04-08 1984-10-22 Hitachi Ltd かな漢字変換方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS567173A (en) * 1979-06-29 1981-01-24 Sharp Corp Sentence processor
JPS58192128A (ja) * 1982-05-06 1983-11-09 Ricoh Co Ltd カナ漢字変換処理装置
JPS59186026A (ja) * 1983-04-08 1984-10-22 Hitachi Ltd かな漢字変換方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63308665A (ja) * 1987-06-10 1988-12-16 Seiko Epson Corp 仮名漢字変換装置
JPS63311471A (ja) * 1987-06-12 1988-12-20 Matsushita Electric Ind Co Ltd かな漢字変換装置
JPH0612537B2 (ja) * 1987-06-12 1994-02-16 松下電器産業株式会社 かな漢字変換装置
JPS643773A (en) * 1987-06-26 1989-01-09 Hitachi Ltd Kana/kanji conversion device
JPH02150956A (ja) * 1988-12-01 1990-06-11 Seiko Epson Corp かな漢字変換装置
JPH02299061A (ja) * 1989-05-15 1990-12-11 Casio Comput Co Ltd 仮名漢字変換装置
JPH07146859A (ja) * 1994-06-10 1995-06-06 Seiko Epson Corp 仮名漢字変換装置
JPH08272797A (ja) * 1995-12-28 1996-10-18 Canon Inc 文字処理装置及びその方法
JPH08287062A (ja) * 1995-12-28 1996-11-01 Canon Inc 文字処理装置及びその方法

Also Published As

Publication number Publication date
JPH0563831B2 (ja) 1993-09-13

Similar Documents

Publication Publication Date Title
US5214583A (en) Machine language translation system which produces consistent translated words
JPS60235271A (ja) かな漢字変換装置
JPH0612537B2 (ja) かな漢字変換装置
JPS60176169A (ja) 文章処理装置
JPS5822767B2 (ja) 和文タイプライタ
JPS60108959A (ja) 文章変換装置
JPS62197864A (ja) 言語情報提供装置
JPH04167049A (ja) 文書処理装置
JPS60128559A (ja) 仮名漢字変換装置
JPH10247192A (ja) かな漢字変換装置
JP3048793B2 (ja) 文字変換装置
JPH0612453A (ja) 未知語抽出登録装置
JPS5899828A (ja) カナ漢字変換処理装置
JPH04281558A (ja) 文書検索方法および装置
JPH01237877A (ja) 漢字変換方式
JP2702443B2 (ja) 日本語入力装置
JPS62202259A (ja) 文書作成装置
JPS5957327A (ja) 文章作成装置
JPS59221731A (ja) カナ漢字変換処理装置
CN113227946A (zh) 一种拼音文字输入法
JPS61223971A (ja) 文章作成装置
JPH05151199A (ja) 文書作成装置
JPH0778795B2 (ja) 文字処理装置
JPS6154560A (ja) かな漢字変換方式
JPS60173666A (ja) 漢字検索機