JPS646499B2 - - Google Patents

Info

Publication number
JPS646499B2
JPS646499B2 JP58164072A JP16407283A JPS646499B2 JP S646499 B2 JPS646499 B2 JP S646499B2 JP 58164072 A JP58164072 A JP 58164072A JP 16407283 A JP16407283 A JP 16407283A JP S646499 B2 JPS646499 B2 JP S646499B2
Authority
JP
Japan
Prior art keywords
dictionary
word
kana
words
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58164072A
Other languages
English (en)
Other versions
JPS6057421A (ja
Inventor
Kazuo Ooguro
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP58164072A priority Critical patent/JPS6057421A/ja
Publication of JPS6057421A publication Critical patent/JPS6057421A/ja
Publication of JPS646499B2 publication Critical patent/JPS646499B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、かな漢字変換方式を日本語文書入力
方式として使用する文書作成装置に関する。
〔発明の技術的背景とその問題点〕
日本語文書の作成、校正、編集を行う日本語文
書作成装置(以下文書作成装置と記す)には、日
本語の入力方式として3種類の方式がある。第1
は文字盤入力方式であり、和文タイプライターの
如く漢字を含む文字が配置されたタブレツト、又
はペンタツチ式のキーボードを使用して文字入力
を行うものである。第2の入力方式としては、連
想コード入力方式がある。これは、2打鍵文字コ
ード方式とも呼ばれ、漢字1字に対し2文字のカ
ナを割り当て、漢字1字を入力するために必ず2
文字のカナ入力を行う方式である。これら第1及
び第2の方式は、オペレータが専門訓練を行い、
各入力方式に習熟すれば入力速度を向上させるこ
とができるが、一般利用者が使用するには適さな
い。
この欠点を解消する入力方式としてかな漢字変
換入力方式がある。かな漢字変換方式は入力をす
べてかなで行い機器の内部で漢字に変換するもの
である。変換は文法解析をしながらオペレータと
会話形式で行われるのが一般的である。かな漢字
変換方式については、電子通信学会技術報告
EC78―23「計算機への日本語情報入力」(1978年
9月20日発行)他種々の文献にその説明があるの
で、ここでは説明を省略する。このかな漢字変換
方式を採用した文書作成装置は、大衆普及の点か
ら日本語入力手段の本命となつている。
さて、かな漢字変換方式をとる文書作成装置で
は、同音異字語を多数含む日本語において、「か
な」から所望の「漢字」に変換を行うために、単
語辞書、文法辞書等の変換用辞書を具備すること
が必須である。従来のシステム構成においては、
外部記憶装置としてフレキシブルデイスクドライ
バを具備し、これに辞書フロツピーデイスクを挿
入して、この辞書を変換の都度アクセスして使用
するものが一般的であつた。しかし、近年の装置
の小型化の傾向から、辞書フロツピーデイスクの
内容を主メモリにローデイングしてしまうものが
でき、ひいては、半導体メモリの高集積化から、
大容量マスクROMを変換用辞書として使用する
傾向にある。
第1図は、辞書の1語のフオーマツトを示す図
である。11は「読み」情報の記憶部であり、24
バイト程度の記憶容量を有する。12は品詞分類
コードが記憶される6バイト程度の領域であり、
体言ではその品詞が、用言については品詞とその
活用形、活用行が記憶される。用言の場合、読み
記憶部11には語幹のみが記憶される。13は見
出し記憶部であり、24バイト程度の領域で、「読
み」に対応する漢字が記憶される。14は利用者
別ひん度情報の記憶部であり、8バイト程度の記
憶部である。利用者別ひん度情報は、同音異義語
が生じた場合に、どの語を優先して選択するかの
判断に利用される。
これらの辞書を構成する各語は、一般に50音順
に並べられている。システムが、かな漢字変換処
理を実行し、ある「読み」に対応する見出しを求
める場合、常に「読み」の先頭「あ」より検索を
開始したのでは検索時間が増大し性能上の問題が
あるため、辞書デイレクトリが設けられる。辞書
デイレクトリは単語の読みの1部(例えば、先頭
の一字、二字、三字等)に対して、その「見出
し」が存在する位置が登録されたものである。具
体的に言えば、辞書デイレクトリには例えば
「あ」に対応する「見出し」はA1の記憶位置か
ら、「い」はA2から、「さ」はA11から記憶さ
れているという情報が登録される。オペレータ
が、「さ」で始まる単語を入力し、かな漢字変換
処理が実行されたとき、システムは、辞書デイレ
クトリを参照して、辞書本体のA11から「見出
し」の検索を開始する。
上記構成の変換用辞書をマスクROMに記憶さ
せた従来例を第2図に示す。N個のROMチツプ
で変換用辞書が構成されるとすると、ROMチツ
プ21に前記辞書デイレクトリ部と辞書本体部1
が、残りのROMチツプ22,…,2Nには各々
辞書本体部2,…,Nが50音順に記憶される。辞
書検索部201(CPU及び制御プログラムによ
る動作を機能ブロツクとして示すものである)が
かな漢字変換処理において辞書検索を行う場合、
まず辞書ROMチツプ1上に存在する辞書デイレ
クトリ部を参照して、目的の単語が存在する辞書
本体部のアドレスを求め、このアドレス情報にも
とづき、辞書本体部のアクセスを行う。
上記構成で、マスクROM21,…,2Nに辞
書を記憶させた場合、辞書デイレクトリがROM
チツプ21に存在するため、辞書ROM2iに関
して内容を変更する場合に、ROMチツプ21に
も変更が生ずる。更に、単語が50音順に並べられ
ているため、「あ」で始まる語はROMチツプ2
1上に、「さ」で始まる語はROMチツプ25上
にと分かれて存在するため、50音の各音で始まる
語のうち、使用頻度の高いもののみを抜き出して
コンパクトな辞書を作成する場合、全てのROM
チツプの変更を必要とする。これは、逆に、専門
用語等を追加する場合も同様である。
〔発明の目的〕
本発明は上述した問題点を解決するために、辞
書内容の変更による影響を最小限にする辞書の記
憶構成を採用した、かな漢字変換方式の文書作成
装置の提供を目的とする。
〔発明の概要〕
上記目的を達成するため、本発明の文書作成装
置は、複数個の記憶素子に各々独立した単語辞書
を記憶させている。更に、この記憶素子には、前
記単語辞書とともに、この単語辞書のアドレス管
理情報からなる辞書デイレクトリが記憶される。
そして、本発明の文書作成装置は、かな漢字変換
処理に際し、入力装置より入力された文字列にも
とづき、前記記憶素子各々のアドレス管理情報を
参照して、各記憶素子より読み該当部分の単語群
を読み出す手段と、各記憶素子より読み出された
前記単語群を格納するバツフア記憶部と、このバ
ツフア記憶部に格納された前記単語群を辞書構成
に並べ換える手段とを具備する。かな漢字変換処
理は、前記バツフア記憶部に構成された辞書を利
用して実行される。
〔発明の実施例〕
以下実施例により本発明の文書作成装置を詳細
に説明する。
第3図は実施例の文書作成装置の機能ブロツク
図である。31はキー入力装置であり、文書を構
成する文字情報及びかな漢字変換指示、校正・編
集指示等の各種制御情報の入力に使用される。3
2はキー入力制御機構である。キー入力制御機構
は入力スタツク33(主メモリの1部領域が使用
される)を具備し、キー入力装置より入力された
かな文字列がこの入力スタツク中に積まれる。3
4はかな漢字変換機構であり、この機構の1部と
して辞書検索制御部35が具備される。361及
至363はかな漢字変換用辞書記憶用のROMで
ある。各ROM361及至363は各々辞書デイ
レクトリ部と辞書本体部とを有している。ROM
361には使用頻度が高い単語が、ROM362
には使用頻度が中位の単語が、ROM363には
専門分野でのみ使用される単語が記憶される。そ
して、各ROM361及至363の辞書デイレク
トリ部は当該ROMに記憶された辞書本体部のみ
を管理する。37は単語辞書バツフアであり、前
記辞書検索制御部35によつて各ROM361及
至363から読み出された必要とする「読み」に
該当するすべての単語を記憶する。38は文書バ
ツフアであり、かな漢字変換機構34の変換結果
が記憶される。39は表示制御装置であり、文書
バツフア38の内容を表示装置40に表示せしめ
る。41は校正・編集機構であり、キー入力装置
31からの指示により文書バツフア38中の文書
における訂正、削除等の校正・編集動作、同音異
字語の選択を行う。42は単語間の接続性を判定
するためのテーブルである。
次に、実施例の文書作成装置の動作を説明す
る。
入力スタツク33にかな文字列が積まれると、
この文字列が文節単位でかな漢字変換機構34に
送られる。例えば「せんせいは」なる文字列が入
力スタツク33に積まれているとする。このと
き、かな漢字変換機構34において、辞書検索制
御部35に起動がかけられる。まず、ROM36
1のデイレクトリが文字コードから算出されるア
ドレスにより参照され、「せ」を読みの先頭とす
る単語群が記憶されたROM361の辞書本体内
のアドレスが求められる。そして、このアドレス
から前記単語群が単語辞書バツフア37に読み出
される。以下、辞書検索制御部35はROM36
2、ROM363についても同様の動作を行い、
全てのROM361及至363より「せ」を読み
の先頭とする単語群を単語辞書バツフア37に格
納する。
辞書検索制御部35はすべての辞書ROMチツ
プからの単語の読み出しを完了すると、単語辞書
バツフア37に記憶された単語のソートを行う。
ソートの条件としては、読みの50音順、品詞コー
ドの順、頻度の順となる。品詞コードによるソー
トは、同じ品詞の単語を集中させるために行われ
るものである。使用頻度は降順に並べられるのが
一般的である。このソート処理の結果、各々独立
した辞書を各ROMチツプに分けても、単語辞書
バツフア37内に、従来と同様の辞書が構成でき
る。ソート処理が終了すると、再びかな漢字変換
機構34に処理が戻される。かな漢字変換機構3
4は単語辞書バツフア37に記憶された単語群を
利用して入力スタツク33中に記憶された文節の
分析を行う。分析の第1ステツプとして、自立語
を調べるために単語辞書バツフア内の単語とのマ
ツチングを行う。辞書の中の単語の読み(ひらが
な)の部分が入力かな列の一部であるとき、それ
が自立語の候補となる。マツチングは最長一致し
たものから第1候補として、すべてのマツチング
がとれたものを候補とする。候補は主メモリ内の
スタツクに積まれる。前述のように入力スタツク
33に「せんせいは」なる文節があるとすれば、
まず「せんせいは」の文字列とのマツチングが検
索される。この単語は単語辞書バツフア37内の
単語群には存在しないので、次に「せんせい」の
文字列とのマツチングが検索される。この場合、
「先生」、「宣誓」、「先制」、「専制」が候補として
スタツクに積まれる。ただし、活用のある語は活
用語尾のマツチングがとられる。続いて、「せん
せい」、「せん」、「せ」のマツチングがとられる。
次に付属語のマツチング、及び自立語と付属語
との接続可能性が検定される。自立語と付属語と
の接続可能はテーブル形式で記憶されており、こ
のテーブル42にしたがつて決定される。テーブ
ルは、自立語の種類と付属語の種類とによつてア
クセスされる位置に接続可否のビツトを立てて構
成されるマトリクス形式のものが利用できる。
以上の処理によつて与えられたかな系列が自立
語と付属語の組合せとして正しいものであると
き、辞書からその見出語部分(漢字)を抜出しこ
れをかな漢字変換の結果とする。この結果がかな
漢字変換機構34から文書バツフア38に転送さ
れ格納される。この段階で同音異義語が前記スタ
ツク中に存在する場合、同音異義語の情報も文書
バツフア38に格納される。
〔発明の効果〕
この発明によれば、N個のメモリ素子に記憶さ
れた辞書各々は独立しているため、装置の要求に
応じて辞書の語彙数を増減したり、専門分野に応
じて辞書の構成を変更することが、必要最少限の
メモリ要素の変更によつて可能となる。また、辞
書は各素子ごとに管理されているため各素子の内
容に変更が生じた場合も、その素子のみを置換す
ればよく、辞書仕様の変更にともなうコストを低
減することができる。尚、各記憶素子をプラグイ
ンの形式にすれば、専門分野によらない文書作成
装置とすることもできる。
【図面の簡単な説明】
第1図は単語辞書を構成する1語のフオーマツ
トを示す図であり、第2図は従来のかな漢字変換
用辞書の構成を示す図である。第3図は実施例の
文書作成装置の機能ブロツク図である。 34……かな漢字変換機構、35……辞書検索
制御部、361及至363……かな漢字変換用辞
書記憶用ROM、38……文書バツフア。

Claims (1)

    【特許請求の範囲】
  1. 1 読みに対応して見出し語を記憶する単語辞書
    を有し、この辞書を検索することにより、入力装
    置から入力された文字列を漢字混じり文に変換す
    る文書作成装置において、前記単語辞書を構成す
    る各々独立した部分単語辞書、及びこの部分単語
    辞書のアドレス管理情報からなる辞書デイレクト
    リとを各々に記憶する複数の記憶素子と、前記入
    力装置より入力された文字列にもとづき、前記記
    憶素子各々のアドレス管理情報を参照して、各記
    憶素子より読み該当部分の単語群を読み出す手段
    と、各記憶素子より読み出された前記単語群を格
    納するバツフア記憶部と、このバツフア記憶部に
    格納された前記単語群を辞書構成に並べ換える手
    段とを具備したことを特徴とする文書作成装置。
JP58164072A 1983-09-08 1983-09-08 文書作成装置 Granted JPS6057421A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58164072A JPS6057421A (ja) 1983-09-08 1983-09-08 文書作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58164072A JPS6057421A (ja) 1983-09-08 1983-09-08 文書作成装置

Publications (2)

Publication Number Publication Date
JPS6057421A JPS6057421A (ja) 1985-04-03
JPS646499B2 true JPS646499B2 (ja) 1989-02-03

Family

ID=15786244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58164072A Granted JPS6057421A (ja) 1983-09-08 1983-09-08 文書作成装置

Country Status (1)

Country Link
JP (1) JPS6057421A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6057421B2 (ja) * 1979-04-03 1985-12-14 株式会社村田製作所 電子部品の被半田付け部分への半田付け方法
JPS63130265A (ja) * 1986-11-19 1988-06-02 Fuji Plant Kogyo Kk リ−ドフレ−ムへの半田外装方法
JPS63130264A (ja) * 1986-11-19 1988-06-02 Fuji Plant Kogyo Kk リ−ドフレ−ムへの半田外装方法
JPS63266896A (ja) * 1987-04-23 1988-11-02 Asahi Chem Res Lab Ltd 電子部品の接合方法

Also Published As

Publication number Publication date
JPS6057421A (ja) 1985-04-03

Similar Documents

Publication Publication Date Title
EP0423683B1 (en) Apparatus for automatically generating index
CN100334530C (zh) 简化键盘多义性消除系统
US4903206A (en) Spelling error correcting system
EP0813156A2 (en) Method and apparatus for language translation
JPH0531787B2 (ja)
JPS646499B2 (ja)
JP2595934B2 (ja) 仮名漢字変換処理装置
JP3873305B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JPS6246029B2 (ja)
JPH1021262A (ja) 情報検索装置
JP3888701B2 (ja) 文字変換装置
JP3045886B2 (ja) 手書き入力機能付き文字処理装置
JP2862236B2 (ja) 文字処理装置
JPH01114976A (ja) 文書処理装置の辞書構造
JPS6380361A (ja) 言語情報処理装置
JPS60207948A (ja) カナ漢字変換処理装置
JPS6198475A (ja) 日本語文章入力装置
Cain The development of Chinese ideographic processing for a shared cataloguing system
JPS59116835A (ja) 短縮入力機能付日本語入力装置
JPH0991304A (ja) 情報検索方法、情報検索システム及び情報検索用記憶媒体
JPS6210762A (ja) 仮名漢字変換方式
JPH0430247A (ja) かな漢字変換における自動未知語登録方式
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置
JPH06131329A (ja) 日本語文字処理装置
JPH0727526B2 (ja) かな漢字変換装置