JPH0652152A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPH0652152A
JPH0652152A JP4205437A JP20543792A JPH0652152A JP H0652152 A JPH0652152 A JP H0652152A JP 4205437 A JP4205437 A JP 4205437A JP 20543792 A JP20543792 A JP 20543792A JP H0652152 A JPH0652152 A JP H0652152A
Authority
JP
Japan
Prior art keywords
kana
words
conversion
kanji
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4205437A
Other languages
English (en)
Inventor
Fusao Makino
房雄 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP4205437A priority Critical patent/JPH0652152A/ja
Publication of JPH0652152A publication Critical patent/JPH0652152A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 辞書に格納されている単語を意味的に分類
し、単語の共起関係をこの分類と分類との接続の可否と
して記憶することにより、用例辞書の容量の圧縮を図
る。 【構成】 分類コードを各単語毎に記憶した変換辞書部
と、単語の共起関係を分類コードの接続の可否として記
憶した用例辞書部と、キーボードと、メモリと、CPU
を備え、CPUにより、メモリに記憶した仮名文字列を
文節単位に分割して単語に変換し、用例辞書部を参照す
ることにより、変換した単語どうしの接続の可否を判定
し、メモリに記憶した仮名文字列を複数文節からなる漢
字仮名交じり文に変換し、変換した漢字仮名交じり文を
出力するよう構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、日本語ワードプロセ
ッサや日本語による文書作成が可能なコンピュータなど
の文書処理装置に関する。
【0002】
【従来の技術】従来、この種の文書処理装置において
は、例えば、仮名文字列「たちよるきかい」を入力し、
その入力文字列「たちよるきかい」を仮名漢字変換する
場合には、先ず「たちよる」を「立ち寄る」に変換し、
「きかい」を第1候補「機械」に変換した後、同音語
(機械、機会、器械、貴会、奇怪)の中から「機会」を
選択するようにしている。
【0003】そして、このような同音語の変換率を高め
るために、例えば、上述の例であれば(立ち寄る−機
会)のように、共起関係にある単語を用例として辞書に
内蔵し、仮名漢字変換時にはその用例を参照するように
している(特開平3−288260号公報参照)。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
この種の文書処理装置においては、共起関係にある単語
を用例として記憶する場合、組み合わせの数が非常に多
くなる。例えば5万語の単語がある場合、その組み合わ
せの数は5万×5万=25億になり、この中から用例を
抽出するのは、ぼう大な工数を要する。また用例数も非
常に多くなる。
【0005】この発明は、このような事情を考慮してな
されたもので、辞書に格納されている単語を意味的に分
類し、単語の共起関係をこの分類と分類との接続の可否
として記憶することにより、用例辞書の容量の圧縮を図
るようにした文書処理装置を提供するものである。
【0006】
【課題を解決するための手段】図1は本願の第1の発明
の構成を示すブロック図であり、この図に示すように、
本願の第1の発明は、漢字を含む多数の単語をその読み
情報と共に記憶し、さらに単語を意味的に分類した分類
コードを各単語毎に記憶した変換辞書部101と、単語
の共起関係を分類コードの接続の可否として記憶した用
例辞書部102と、仮名文字列を入力する入力手段10
3と、入力された仮名文字列を記憶する記憶手段104
と、変換辞書部101に基づいて、記憶手段104に記
憶された仮名文字列を文節単位に分割し、分割した仮名
文字列を単語に変換する仮名漢字変換手段105と、用
例辞書部102を参照することにより、仮名漢字変換手
段105によって変換された単語どうしの接続の可否を
判定し、単語どうしが有効な組み合わせとなるように、
記憶手段104に記憶された仮名文字列を複数文節から
なる漢字仮名交じり文に変換する連文節変換手段106
と、連文節変換手段106によって変換された漢字仮名
交じり文を出力する出力手段107を備えてなる文書処
理装置である。
【0007】上記構成において、用例辞書部102は、
行と列にそれぞれ前文節と後文節との組み合わせを示す
マトリクス構造を有していることが好ましい。
【0008】図2は本願の第2の発明の構成を示すブロ
ック図であり、この図に示すように、本願の第2の発明
は、漢字を含む多数の単語をその読み情報と共に記憶
し、さらに単語を意味的に分類した分類コードを各単語
毎に記憶した変換辞書部201と、分類コードと単語と
の共起関係を記憶した用例辞書部202と、仮名文字列
を入力する入力手段203と、入力された仮名文字列を
記憶する記憶手段204と、変換辞書部201に基づい
て、記憶手段204に記憶された仮名文字列を単語に変
換し、変換した単語を記憶する仮名漢字変換手段205
と、仮名漢字変換手段205によって単語が変換される
際、用例辞書部202を参照することにより、既に変換
した単語と現在変換しようとする単語との共起関係を判
定し、単語どうしが有効な組み合わせとなるように、仮
名漢字変換手段205を制御する仮名漢字変換制御手段
206と、仮名漢字変換手段205によって変換された
単語を出力する出力手段206を備えてなる文書処理装
置である。
【0009】なお、この発明において、変換辞書部10
1,201、及び用例辞書部102,202としては、
ROMのような内部メモリや、フロッピーディスク装置
や磁気ディスク装置のような外部記憶装置が用いられ
る。
【0010】入力手段103,203としては、キーボ
ード装置やタブレット装置などの各種の入力装置が用い
られる。
【0011】仮名漢字変換手段105,205、連文節
変換手段106、及び仮名漢字変換制御手段206とし
ては、CPU,ROM,RAM,I/Oポートからなる
マイクロコンピュータを用いるのが便利であり、記憶手
段104,204としては、通常、その中のRAMが用
いられる。
【0012】出力手段107,207としては、CRT
ディスプレイ装置や液晶ディスプレイ装置などの表示装
置や、熱転写式のドットプリンタやレーザプリンタのよ
うな印字装置が用いられる。
【0013】
【作用】第1の発明によれば、単語の共起関係が分類コ
ードの接続の可否として用例辞書部102に記憶されて
おり、仮名漢字変換が行われるときには、仮名文字列が
単語に変換された後、用例辞書部102が参照され、単
語どうしの接続の可否が判定されて、仮名文字列から漢
字仮名交じり文への変換が行われる。したがって、仮名
漢字の変換効率が向上するとともに、用例辞書部102
の容量の圧縮化を図ることができる。
【0014】また、第2の発明によれば、分類コードと
単語との共起関係が用例辞書部202に記憶されてお
り、仮名漢字変換が行われるときには、用例辞書部20
2が参照されることにより、既に変換した単語と現在変
換しようとする単語との共起関係が判定されて、仮名文
字列から漢字仮名交じり文への変換が行われる。したが
って、文節単位での入力の場合でも、仮名漢字の変換効
率を向上させることができるとともに、用例辞書部20
2の容量の圧縮化を図ることができる。
【0015】
【実施例】以下、図面に示す実施例に基づいてこの発明
を詳述する。なお、これによってこの発明が限定される
ものではない。
【0016】図3は本願の第1の発明を日本語ワードプ
ロセッサに適用した一実施例の構成を示すブロック図で
ある。本願の第1の発明は、仮名漢字変換に意味マトリ
クスを用いることにより、メモリを効率よく利用して、
一発変換率を向上させ、キータッチ数を減らす効果を得
ようとするものである。
【0017】図3において、1はキーボードから構成さ
れた入力装置であり、この入力装置1には、仮名文字列
を入力するための仮名文字列キーや、変換キーなどが配
列されている。
【0018】2は文字列制御装置であり、入力されたキ
ーの情報を判断し、仮名文字列か、変換キーか、などの
キーの種類により、変換対象文字列として記憶・表示し
たり、仮名漢字変換を起動させたりするもので、1チッ
プのCPUで構成されている。
【0019】3はROMとRAMで構成された記憶装置
であり、この記憶装置3のROMには、制御情報(プロ
グラム)が書き込まれている。また、記憶装置3のRA
Mは、入力された文字列データを文書データとして記憶
したり、変換対象文字列の記憶、制御用一時データや表
示用データなどの記憶を行う。
【0020】4はCRTや液晶などで構成される表示装
置であり、入力された文字列の表示、仮名漢字変換結果
の表示などを行う。
【0021】5は辞書データに基づいて変換対象文字列
の仮名漢字変換を行い、漢字仮名交じり文字列の候補を
いくつか生成するための仮名漢字変換装置である。この
仮名漢字変換装置5は、単語、品詞、活用情報、頻度情
報、助詞・助動詞との接続可否情報等をもとに、文法的
に可能な組み合わせをつくり出し、頻度情報の高いもの
を優先するなど、一定の規則のもとで、変換結果の順位
づけを行うものである。
【0022】6は辞書データを検索処理するための辞書
検索装置である。仮名漢字変換装置5及び辞書検索装置
6はプログラム化されたデータで主に構成され、文字列
制御装置2で制御されている。7はROMからなる辞書
装置であり、この辞書装置7内には、単語辞書7aと意
味マトリクス7bが記憶されている。
【0023】辞書装置7内の単語辞書7aには、読み、
表記、品詞、頻度等の従来情報に加えて、新たに意味分
類概念情報を持たせている。この意味分類概念情報(以
下意味分類という)の例を図4に示す。この図に示すよ
うに、意味分類としては、単語を1〜1000の項目に
意味的に分類し、単語辞書7aには、これに該当する分
類の番号が記憶されている。
【0024】例えば、単語「機会」,「時」,「時
機」,「チャンス」,「折」,「タイミング」には15
0の分類コードが、単語「立ち寄る」,「訪問」,「伺
う」,「寄る」,「訪れる」には780の分類コード
が、それぞれ付けられている。
【0025】辞書装置7内の意味マトリクス7bには、
分類1〜1000の行・列からなる1000×1000
のマトリクスが記憶されている。図5に意味マトリクス
7bの例を示す。図において、y軸(行)方向に記され
ているのが先行分類、x軸(列)方向に記されているの
が後続分類である。マトリクスの交点の黒丸「・」印
は、先行分類と後続分類との接続が可能であることを示
している。例えば、訪問−時機,刃物−切断,失敗−発
生,敏感−感じ,紛争−相手、などが接続可能である。
【0026】意味マトリクス7bのメモリ上での具体的
構成例を図6に示す。また、意味マトリクス7bへのア
クセスと分類コードとの番地対応を図7に示す。これら
の図に示すように、意味マトリクス7bとしては、先行
分類に上位10ビットを、後続分類に下位10ビット
を、それぞれ割り当て、後続分類の10ビットのうち上
位7ビットで対応するバイトを示し、下位3ビットで1
バイト内の位置を示している。
【0027】このような構成における処理動作の内容を
図8に示すフローチャートに従い説明する。なお、以下
には、具体例「するどいかんじ」という文字列が入力さ
れ、変換キーが押された場合について説明する。
【0028】入力装置1から文字「す」が入力されると
(ステップ21)、文字列制御装置2は、これが変換対
象文字列であることを判断して(ステップ22)、結果
を表示装置4に出力し、「す」を変換対象文字列として
記憶装置3に記憶する(ステップ23,24)。そし
て、同じ処理が「る」「ど」……「じ」までの入力文字
列についてなされる。
【0029】この状態で「変換キー」が押されると(ス
テップ25)、文字列制御装置2は、仮名漢字変換装置
5を起動して、辞書検索装置6による辞書装置7の検索
を行い、変換対象が有れば(ステップ26)、いくつか
の変換候補文字列を生成する(ステップ27)。この場
合の変換候補文字列としては、(鋭い/漢字)、
(鋭い/感じ)、(鋭い/幹事)などが生成される。
【0030】次に、これらの変換候補文字列は、2文節
以上であるので(ステップ28)、その単語につけられ
ている分類コードに基づいて意味マトリクス7bを参照
する(ステップ29)。この参照においては、図9の意
味マトリクスに示すように、「鋭い」の分類コードは6
70、「感じ」の分類コードは400であるため、行方
向においては670行目、列方向においては50バイト
目の第8ビットを参照し、この参照したビットが「1」
となっていれば、接続可能となる。
【0031】上記変換候補の内、接続可能となっている
のが、例えば、(鋭い/感じ)だけであるとすれば、
該当候補有りとして(ステップ30)、この候補が第1
位の候補として記憶及び表示出力される(ステップ3
1)。
【0032】なお、ステップ28において、変換候補文
字列が2文節以上でない場合には、変換結果がそのまま
出力される(ステップ32)。また、ステップ25にお
いて、変換キー以外のキーが押された場合には、そのキ
ーに対応する処理が行われる(ステップ33)。
【0033】このようにして、単語辞書7aに格納され
ている単語を意味分類し、分類と分類との共起関係を接
続の可否としてマトリクス化することにより、辞書容量
の圧縮化を図ることができる。
【0034】図10は本願の第2の発明を日本語ワード
プロセッサに適用した一実施例の構成を示すブロック図
である。本願の第2の発明は、意味コード用例辞書を用
い、入力変換処理が文節単位で逐次処理される場合で
も、変換候補の第1位を決定するのに、既に変換確定し
ている前の文節と現在の文節候補との間で意味コード用
例辞書を参照することにより、変換効率を向上させると
ともに、辞書容量の圧縮化を図るものである。ここで、
意味コード用例とは、単語辞書の個々の単語を概念で分
類し、各々の単語と、その単語にあてはまる概念とを対
応づけるとともに、概念と共起する単語との関係をも対
応づけたものである。
【0035】図10において、入力装置11、文字列制
御装置12、記憶装置13、表示装置14、仮名漢字変
換装置15、及び辞書検索装置16については、それぞ
れ図3に示した入力装置1、文字列制御装置2、記憶装
置3、表示装置4、仮名漢字変換装置5、及び辞書検索
装置6と同じであるため、その説明を省略する。17は
ROMからなる辞書装置であり、この辞書装置17内に
は、単語辞書17aと意味コード用例辞書17bが記憶
されている。
【0036】辞書装置17の概念図を図11に示す。こ
の図に示すように、辞書装置17の単語辞書17aに
は、単語の読み、表記、品詞、活用、頻度などの情報が
格納されている。辞書装置17の意味コード用例辞書1
7bには、単語の意味概念に該当する意味コードが単語
と対応づけられて格納され、また、意味コードと用例単
語が対(つい)として格納されている。
【0037】このような構成における処理動作の内容を
図12に示すフローチャートに従い説明する。なお、以
下には、「こいぬが」「ないた」の文字列の変換を例に
挙げて説明する。
【0038】入力装置11から文字「こ」が入力される
と(ステップ41)、文字列制御装置12は、これが仮
名文字であれば(ステップ42)、変換対象文字列とし
て記憶装置13に記憶し(ステップ43)、結果を表示
装置14に表示出力する(ステップ44)。引き続き入
力される「い」「ぬ」「が」についても同様に処理され
る。
【0039】「こいぬが」の状態に続いて変換キーが押
されると(ステップ45)、文字列制御装置13により
仮名漢字変換装置15が起動されて、辞書検索装置16
により辞書装置17が参照され、変換対象が有れば(ス
テップ46)、文法、頻度等で決まる候補列が作成さ
れ、第1位の候補として「子犬」が出力・表示される
(ステップ47)。引き続き入力される「な」「い」
「た」については、それぞれ変換対象文字列として処理
が行なわれ仮名文字列が出力・表示される。
【0040】この状態で変換キーが押されると、次の仮
名漢字変換処理が行なわれ、「ないた」の変換候補列
「泣いた」,「鳴いた」が生成される(ステップ4
7)。ここで、変換結果が1文節か否か(ステップ4
8)、が判定されるとともに、前文節が1文節か否か
(ステップ49)、が判定され、変換結果も前文節も1
文節であれば、仮名漢字変換装置15は、この状態で前
文節の「子犬」と現在の文節の「泣いた」,「鳴いた」
との共起関係を判定するために、意味コード用例辞書1
7bを検索する(ステップ50)。
【0041】図11に示したように、単語「子犬」には
意味コード「50」が付けられている。また、現在の文
節の単語「鳴く」,「泣く」で意味コード用例辞書17
bの用例単語を検索すると、「鳴く」と対をなす意味コ
ードとして「50」が検出され、これと単語「子犬」の
意味コード「50」が照合され、結果が一致するため
(ステップ51)、第1位の変換候補として「鳴いた」
を出力・表示する(ステップ52)。
【0042】なお、ステップ48において変換結果が1
文節でない場合、ステップ49において前文節が1文節
でない場合、及びステップ51において該当候補が無い
場合には、変換結果がそのまま出力される(ステップ5
3)。また、ステップ45において、変換キー以外のキ
ーが押された場合には、そのキーに対応する処理が行わ
れる(ステップ54)。
【0043】このようにして、分類コードと単語との共
起関係を記憶させた意味コード用例辞書17bを用い
て、既に変換済みの単語と現在変換しようとする単語と
の共起関係を調べ、仮名漢字変換を行うことにより、文
節単位での変換時においても変換効率を向上させること
ができる。
【0044】
【発明の効果】本願の第1の発明によれば、各単語に分
類コードを設定し、単語の共起関係を分類コードの接続
の可否として記憶しておき、これを参照して仮名漢字変
換を行うようにしたので、仮名漢字の変換効率を向上さ
せることができるとともに、用例辞書の容量を従来より
も圧縮することができる。
【0045】また、本願の第2の発明によれば、既に変
換した単語と現在変換しようとする単語との共起関係を
判定して、仮名漢字変換を行うようにしたので、以下の
ような効果を奏する。 一発変換率を向上させることにより、入力キータッチ
数を減らすことができる。 変換/次候補キーを押す回数を減らすことにより、精
神的イライラ、疲労なども減らすことができる。 仮名漢字変換における変換効率の向上により、操作性
が向上する。 連文節変換が可能であっても修正操作の面から文節変
換で入力処理する場合も多く、このような場合でも変換
効率を上げることができる。 文節単位の変換では分かち位置の誤りはかなり少なく
なるが、同音語選択は変換/次候補キーで選択しなくて
はならない。しかしながら、このような場合でも、連文
節変換と同じように一発変換が可能となる。
【図面の簡単な説明】
【図1】本願の第1の発明の構成を示すブロック図であ
る。
【図2】本願の第2の発明の構成を示すブロック図であ
る。
【図3】本願の第1の発明の一実施例の構成を示すブロ
ック図である。
【図4】意味分類概念情報の例を示す説明図である。
【図5】意味マトリクスの具体例を示す説明図である。
【図6】意味マトリクスのメモリ構造を示す説明図であ
る。
【図7】意味マトリクスをアクセスする時の番地対応を
示す説明図である。
【図8】本願の第1の発明における実施例の動作を示す
フローチャートである。
【図9】意味マトリクスをアクセスする時のデータ位置
の具体例を示す説明図である。
【図10】本願の第2の発明の一実施例の構成を示すブ
ロック図である。
【図11】辞書装置の概念を示す説明図である。
【図12】本願の第2の発明における実施例の動作を示
すフローチャートである。
【符号の説明】
1,11 入力装置 2,12 文字列制御装置 3,13 記憶装置 4,14 表示装置 5,15 仮名漢字変換装置 6,16 辞書検索装置 7,17 辞書装置 7a,17a 単語辞書 7b 意味マトリクス 17b 意味コード用例辞書

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 漢字を含む多数の単語をその読み情報と
    共に記憶し、さらに単語を意味的に分類した分類コード
    を各単語毎に記憶した変換辞書部と、 単語の共起関係を分類コードの接続の可否として記憶し
    た用例辞書部と、 仮名文字列を入力する入力手段と、 入力された仮名文字列を記憶する記憶手段と、 変換辞書部に基づいて、記憶手段に記憶された仮名文字
    列を文節単位に分割し、分割した仮名文字列を単語に変
    換する仮名漢字変換手段と、 用例辞書部を参照することにより、仮名漢字変換手段に
    よって変換された単語どうしの接続の可否を判定し、単
    語どうしが有効な組み合わせとなるように、記憶手段に
    記憶された仮名文字列を複数文節からなる漢字仮名交じ
    り文に変換する連文節変換手段と、 連文節変換手段によって変換された漢字仮名交じり文を
    出力する出力手段を備えてなる文書処理装置。
  2. 【請求項2】 用例辞書部が、行と列にそれぞれ前文節
    と後文節との組み合わせを示すマトリクス構造を有して
    いることを特徴とする請求項1記載の文書処理装置。
  3. 【請求項3】 漢字を含む多数の単語をその読み情報と
    共に記憶し、さらに単語を意味的に分類した分類コード
    を各単語毎に記憶した変換辞書部と、 分類コードと単語との共起関係を記憶した用例辞書部
    と、 仮名文字列を入力する入力手段と、 入力された仮名文字列を記憶する記憶手段と、 変換辞書部に基づいて、記憶手段に記憶された仮名文字
    列を単語に変換し、変換した単語を記憶する仮名漢字変
    換手段と、 仮名漢字変換手段によって単語が変換される際、用例辞
    書部を参照することにより、既に変換した単語と現在変
    換しようとする単語との共起関係を判定し、単語どうし
    が有効な組み合わせとなるように、仮名漢字変換手段を
    制御する仮名漢字変換制御手段と、 仮名漢字変換手段によって変換された単語を出力する出
    力手段を備えてなる文書処理装置。
JP4205437A 1992-07-31 1992-07-31 文書処理装置 Pending JPH0652152A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4205437A JPH0652152A (ja) 1992-07-31 1992-07-31 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4205437A JPH0652152A (ja) 1992-07-31 1992-07-31 文書処理装置

Publications (1)

Publication Number Publication Date
JPH0652152A true JPH0652152A (ja) 1994-02-25

Family

ID=16506860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4205437A Pending JPH0652152A (ja) 1992-07-31 1992-07-31 文書処理装置

Country Status (1)

Country Link
JP (1) JPH0652152A (ja)

Similar Documents

Publication Publication Date Title
JP3196868B2 (ja) テキストをインデックス及び検索するための関連ワード形態の限定状態トランスジューサ
US20060031207A1 (en) Content search in complex language, such as Japanese
JPH0652152A (ja) 文書処理装置
JPH0412866B2 (ja)
JPH07271774A (ja) 文章入力装置
EP1221082B1 (en) Use of english phonetics to write non-roman characters
Takeda et al. CRITAC—An experimental system for Japanese text proofreading
JP2981237B2 (ja) 文書作成装置及び文書作成方法
JP3115616B2 (ja) 仮名漢字変換装置および方法
JP2866437B2 (ja) 用例辞書登録方法及び装置
JPH06149790A (ja) 文章作成装置
JP2802369B2 (ja) かな漢字変換装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPH0765013A (ja) 文書検索装置
JPH0455976A (ja) 文書作成装置におけるソート処理方法
JPH0776965B2 (ja) カナ漢字変換処理装置
JPH0991304A (ja) 情報検索方法、情報検索システム及び情報検索用記憶媒体
Fujisaki CRITAC-An experimental
JPS60122463A (ja) 文字処理装置
JPH0474262A (ja) 文書処理装置
JPH0462664A (ja) データ検索装置
JPH04120656A (ja) 文書処理装置
JPH0512251A (ja) 文書処理装置
JPH0798702A (ja) 文書作成装置
JPH0261759A (ja) 文書作成装置