JPS6057421A

JPS6057421A - 文書作成装置

Info

Publication number: JPS6057421A
Application number: JP58164072A
Authority: JP
Inventors: Kazuo Oguro; 大黒　和夫
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1983-09-08
Filing date: 1983-09-08
Publication date: 1985-04-03
Also published as: JPS646499B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は、かな漢字変換方式を日本語文書入力方式とし
て使用するＭ文書作成装置に関する。

〔発明の技術的背景とその問題点〕

日本語文書の作成、校正、編集を行う日本語文書作成装
置（以下文書作成装置と記す）には、日本語の入力方式
として３種類の方式がある。第１は文字盤入力方式であ
り、和文タイプライタ−の如く漢字を含む文字が配置さ
れたタブレット、又はベンタッチ式のキーボードを使用
して文字入力を行うものである。第２の入力方式として
は、連想コード入力方式がある。辷れは、２打鍵文字コ
ード方式とも呼ばれ、漢字１字に対し２文字のカナを割
り島て、漢字１字を入力するために必ず２文字のカナ入
力を行う方式である。これら第１及び第２の方式は、オ
ペレータが専門訓練を行い、各入力方式に習熟すれば入
力速度を向上させることができるが、一般利用者が使用
するＫは適さない。

この欠点を解消する入力方式としてかな漢字変換入力方
式がある。かな漢字変換方式は入力をすべてかなで行い
機器の内部で漢字に変換するものである。変換は文法解
析をしながらオペレータと会話形式で行われるのが一般
的である。かな漢字変換方式については、電子通信学会
技術報告ＥＣ７ｓ−ｚ３［計算機への日本語情報人力Ｊ
（１９７８年９月２０日発行）他種々の文献にその説明
があるので、ここでは説明を省略する。このかな漢字変
換方式を採用した文書作成装置Ｈ１大衆普及の点から日
本語入力手段の本命となりている。

さて、かな漢字変換方式をとる文書作成装置では、同音
異字語を多数含む日本語において、「かな」から所望の
「漢字」に変換を行うために、単語辞書、文法辞書等の
変換用辞書を具備することが必須である。従来のシステ
ム構成においては、外部記憶装置としてフレキシブルデ
ィスクドライバを具備し、これに辞書フロッピーディス
クを挿入して、この辞書を変換の都度アクセスして使用
するものが一般的であった。しかし、近年の装置の小型
化の傾向から、辞書フロッピーディスクの内容を主メモ
リにローディングしてしまうものができ、ひいては、半
導体メモリの高集積化から、大容量マスクＲＯＭを変換
用辞書として使用する傾向にある。

第１図は、辞書の１語のフォーマットを示す図である。

１１は「読み」情報の記憶部であり、２４バイト程度の
記憶容量を有する。１２は品詞分類コードが記憶される
６バイト程度の領域であり、体言ではその品詞が、用言
については品詞とその活用形、活用性が記憶される。用
言の場合、読み記憶部１１には語幹のみが記憶される。

１３は見出し記憶部であり、２４バイト程度の領域で、
「読み」に対応する漢字が記憶される。１４は利用者別
ひん度情報の記憶部であり、８バイト程度の記憶部であ
る。利用者別ひん度情軸は、同音異義語が生じた場合に
、どの語を優先して選択するかの判断に利用される。

これらの辞書を構成する俗語は、一般に５０音順に並べ
られている。システムが、かな漢字変換処理を実行し、
ある「読み」に対応する見出しをめる場合、常に「読み
」の先頭「あ」より検索を開始したのでは検索時間が増
大し性能上の問題があるため、辞書ブイレフ）　ＩＪが
設けられる。辞書ディレクトリは単語の読みの１部（例
えば、先頭の一字、二字、三字等）に対して、その「見
出し」が存在する位置が登録されたものである。具体的
に言えば、辞書ディレクトリには例えば「あ」Ｋ対応す
る「見出し」はＡ１の記憶位置から、・「い」はＡ２か
ら、「さ」はＡｌｌから記憶されているという情報が登
録される。オペレータが、「さ」で始まる単語を入力し
、かな漢字変換処理が実行されたとき、システムは、辞
書ディレクトリを参照して、辞書本体のＡｌｌから「見
出し」の検索を開始する。

上記構成の変換用辞書をマスクＲＯＭＫ記憶させた従来
例を第２図に示す。Ｎ個のＲＯＭチップで変換用辞書が
構成されるとすると、ＲＯＭチップ２１に前記辞書ディ
レクト９部と辞書本体部ｌが、残りのＲＯＭチップ２２
．・＝・、　２ＮＩＣは各々辞書本体部２゜・・・、Ｎ
が５０音順に記憶される。辞書検索部２０１（ＣＰＵ及
び制御プログラムによる動作を機能ブロックとして示す
ものである）がかな漢字変換処理において辞書検索を行
う場合、まず辞書ＲＯＭチップ１上に存在する辞書ディ
レクトリ部を参照して、目的の単語が存在する辞書本体
部のアドレスをめ、とのアドレス情報にもとづき、辞書
本体部のアクセスを行う。

上記構成で、マスクＲＯＭ２１．・・・、２Ｎに辞書を
記憶させた場合、辞書ブイレフ）　ＩＪがＲＯＭチップ
２１に存在するため、辞書ＲＯＭ２ｉに関して内容を変
更する場合に、ＲＯＭチップ２１にも変更が生ずる。更
に、単語が５０音順に並べられているため、「あ」で始
まる語はＲＯＭチップ２１上Ｋ。

「さ」で始まる語はＲＯＭチップ２５上にと分かれて存
在するため、５０音の各音で始壕る語のうち、使用頻度
の高いもののみを抜き出してコンパクトな辞書を作成す
る場合、全てのＲＯＭチップの変更を必要とする。これ
は、逆に、専門用語等を追加する場合も同様である。

〔発明の目的〕

本発明は上述した問題点を解決するために、辞硼内容の
変更による影響を弗小眼にする辞書の記憶構成を採用し
た、かな漢字変換方式の文書作成装置の提供を目的とす
る。

〔発明の概要〕

上記目的を達成するため、本発明の文書作成装置は、複
数個の記憶素子に各々独立した単語辞書を記憶させてい
る。更に、この記憶素子にけ、前記単語辞書とともに、
この単語辞書のアドレス管理情報からなる辞書ディレク
トリが記憶さＪする。

そして、本発明の文書作成装置は、かな漢字変換処理に
際し、入力装置より入力された文字列にもとづき、前記
記憶素子名々のアドレス管理情報を参照して、各記憶素
子より読み該当部分の単語群を読み出す手段と、各記憶
素子より読み出された前記単語群を格納するバッファ記
憶部と、このバッファ記憶部に格納された前記幣語群を
辞書構成に並べ換える手段とを具備する。かな漢字変換
処理は、前記バッファ記憶部に構成された辞書を利用し
て実行される。

〔発明の実施例〕

以１実施例により本発明の文書作成装置を詳細に説明す
る。

第３図は実施例の文書作成装置の機能ブロック図でるる
。３１はキー人力装置であり、文書を構成する文字情報
及びかな漢字変換指示、校正・編集指示等の各種制ｉ情
報の入力に使用される。３２はキー人力制御機構である
。キー人力制御機構は人力スタック３３（主メモリの１
部領域が使用される）を具備し、キー人力装置より入力
されたかな文字列がこの入力スタック中に積まれる。３
４はかな漢字変換機構であ抄、この機構の１部として辞
書検索制御部３５が具備される。３６１及至３６３はか
な漢字変換用辞書記憶用のＲＯＭである。各ＲＯＭ　３
６１及至３６３は各々辞書ブイレフ）　ＩＪ部と辞書本
体部とを有している。ＲＯＭ３６１には使用頻度が高い
単語が、ＲＯＭ３６２には使用頻度が中位の単語が、Ｒ
ＯＭ３６３には専門分野でのみ使用される単語が記憶さ
れる。そして、各ＲＯＭ３６１及至３６３の辞書ディレ
クトリ部は当９ＲＯＭＫ記憶された辞書本体部のみを管
理する。３７は単語辞書バッファであり、前記辞書検索
制御部３５によって各ＲＯＭ３６１及至３６３から読み
出された必要とする「読み」に該当するすべての単語を
記憶する。３８は文書バッファであり、かな漢字変換機
構３４の変換結果が記憶される。　３９は表示制御装置
であり、文書バッファ３８の内容を表示装置４０に表示
せし、める。４１は校正・編集機構であり、キー人力装
置３１からの指示により文書バッフ７３８中の文書にお
ける訂正、削除筒の校正・編集動作、同音異字語の選択
を行う。４２Ｕ単語間の接続性を判定するだめのテーブ
ルである。

次に、実施例の文書作成装置の動作を説明する。

入力スタック３３にかな文字列が積まれると、この文字
列が文節単位でかな漢字変換機＃ｔ３４に送られる。例
えば「せんせいは」なる文字列が入力スタック３３に積
まれているとする。このとき、かな漢字変換機構３４に
おいて、辞書検察制御部３５に起動がかけられる。、噴
ず、ＲＯＭ３６１のディレクトリが文字コードから算出
されるアドレスにより参照され、「せ」を読みの先頭と
する単語群が記憶されたＲＯＭ３６１の辞書本体内のア
ドレスがめられる。そして、このアドレスから前記単語
群が単語辞書バッファ３７に読み出される。

以下、辞書検索制御部３５は１ン０Ｍ３６２．　１セ０
Ｍ３６３についても同様の動作を行い、全てのＲＯＭ３
６１及至３６３より「せ」を読みの先頭とする単語群を
単語辞書バッファ３７に格納する。

辞書検索制御部３５はすべての辞書ＲＯＭチップからの
単語の読み出しを完了すると、単語辞書バッファ３７に
記憶された単語のソートを行う。ソートの条件としては
、読みの５０音順、品詞コードの順、頻度の順となる。

品詞コードによるソートは、同じ品詞の単語を集中させ
るために行われるものである。使用頻度り降順に並べら
れるのが一般的である。このソート処理の結果、各々独
立した辞書を各ＲＯＭチップに分けても、単語辞書バッ
ファ３７内に、従来と同様の辞書が構成できる。ソート
処理が終了すると、再びかな漢字変換機構３４に処理が
戻される。かな漢字変換機構３４は単語辞書バッファ３
７に記憶された単語群を利用して入力スタック３３中に
記憶された文節の分析を行う。分析の第１ステツプとし
て、まず、自立語を調べるために単語辞書バッファ内の
単語とのマツチングを行う。辞書の中の単語の読み（ひ
らがな）の部分が人力かな列の一部であるとき、それが
自立語の候補となる。マツチングは最長一致したものか
ら第１候補として、すべてのマツチングがとれたものを
候補とする。候補は主メモリ内のスタックに積まれる。

前述のように入力スタック３３に「せんせいは」なる文
節があるとすれば、まず「せんせいは」の文字列とのマ
ツチングが検索される。この単語は単語辞書バッファ３
７内の単語群には存在しないので、次に「せんせい」の
文字列とのマツチングが検索される。この場合、「先生
ｊ、「宣誓」、「先制」、「専制」が候補としてスタッ
クに積マれる。ただし、活用のある語は活用語尾のマツ
チングがとられる。続いて、「せんぜ」、「せん」、「
せ」のマツチングがとられる。

次に付Ｊｌｊｉｉｎのマツチング、及び自立語と付属語
との接続可能性が検定される。自立語と付属語との接続
可能はテーブル形式で記憶されており、このテーブル４
２にしたがって決定される。テーブルむし、自立語の種
類と付属語の種類とによってアクセスさｉする位置に接
続可否のビットを立てて構成されるマトリクス形式のも
のが利用できる。

以上の処理によって与えられたかな系列が自立語と付属
語の組合せとして正しいものであるとき、辞唐からその
見出語部分（漢字）を抜出しこれをかな漢字変換のし果
とする。この結果がかな漢字変換機構３４から文書バッ
ファ３８に転送され格納される。この段階で同音異義語
が前記スタック中に存在する場合、同音異義語の情報も
文書バッファ３８に格納される。

〔発明の効果〕

この発明によれば、Ｎ個のメモリ素子に記憶された辞書
名々は独立し７ているため、装置の要求に応じて辞書の
語霊数を増減したり、専門分野に応じて辞■の構成を変
更することが、必要最少限のメモリ要素の変更によって
可能となる。また、辞書は各素子ごとに管理されている
〆こめ各素子の内容に変更が生じた場合も、その素子の
みを佑換すればよく、辞書仕様の変更にともなうコスト
を低減することができる。尚、各記憶素子をプラグイン
の形式にすれば、専門分野によらない文書作成装置とす
ることもできる。

【図面の簡単な説明】

第１図は単語辞書を構成する＋　１Ｉｆｉのフ→−マッ
トを示す図であり、第２図は従来のかな漢字変換用辞書
の構成を示す図である。第３図は実施例の文書作成装置
の機能ブロック図である。３４・・・・・・かな漢字変換機構３５・・・・・・辞書検索制御部３６１及至３６３・・・・・・かな漢字変換用辞書記憶
用０Ｍ３８・・・・・・文書ハッ７ア（７３１７）　代理人　弁理士　則　近　憲　佑（＃１
か１名）

Claims

【特許請求の範囲】読みに対応して見出し語を記憶する単語辞書を有し、こ
の辞書を検索することにより、入力装置から入力された
文字列を漢字混じり文に変換する？文書作成装置において、前記単語辞書を構成する各々独
立した部分単語辞書、及びこの部分単語辞書のアドレス
管理情報からなる辞書ディレクトリとを各々に記憶する
複数の記憶素子と、前記入力装置より入力された文字列
にもとづき、繭記記憶素子各々のアドレス管理情報を参
照して、各記憶素子より読み鯖当部分の単語群を読み出
す手段と、各記憶素子より読み出された前記単語群を格
納するバッファ記憶部と、このバッファ記憶部に格納さ
れた前記単語群を辞書構成に並べ換える手段とを具備し
たことを特徴とする文書作成装置ｉ６