JPS6057421A - 文書作成装置 - Google Patents

文書作成装置

Info

Publication number
JPS6057421A
JPS6057421A JP58164072A JP16407283A JPS6057421A JP S6057421 A JPS6057421 A JP S6057421A JP 58164072 A JP58164072 A JP 58164072A JP 16407283 A JP16407283 A JP 16407283A JP S6057421 A JPS6057421 A JP S6057421A
Authority
JP
Japan
Prior art keywords
dictionary
word
kana
words
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58164072A
Other languages
English (en)
Other versions
JPS646499B2 (ja
Inventor
Kazuo Oguro
大黒 和夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58164072A priority Critical patent/JPS6057421A/ja
Publication of JPS6057421A publication Critical patent/JPS6057421A/ja
Publication of JPS646499B2 publication Critical patent/JPS646499B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、かな漢字変換方式を日本語文書入力方式とし
て使用するM文書作成装置に関する。
〔発明の技術的背景とその問題点〕
日本語文書の作成、校正、編集を行う日本語文書作成装
置(以下文書作成装置と記す)には、日本語の入力方式
として3種類の方式がある。第1は文字盤入力方式であ
り、和文タイプライタ−の如く漢字を含む文字が配置さ
れたタブレット、又はベンタッチ式のキーボードを使用
して文字入力を行うものである。第2の入力方式として
は、連想コード入力方式がある。辷れは、2打鍵文字コ
ード方式とも呼ばれ、漢字1字に対し2文字のカナを割
り島て、漢字1字を入力するために必ず2文字のカナ入
力を行う方式である。これら第1及び第2の方式は、オ
ペレータが専門訓練を行い、各入力方式に習熟すれば入
力速度を向上させることができるが、一般利用者が使用
するKは適さない。
この欠点を解消する入力方式としてかな漢字変換入力方
式がある。かな漢字変換方式は入力をすべてかなで行い
機器の内部で漢字に変換するものである。変換は文法解
析をしながらオペレータと会話形式で行われるのが一般
的である。かな漢字変換方式については、電子通信学会
技術報告EC7s−z3[計算機への日本語情報人力J
(1978年9月20日発行)他種々の文献にその説明
があるので、ここでは説明を省略する。このかな漢字変
換方式を採用した文書作成装置H1大衆普及の点から日
本語入力手段の本命となりている。
さて、かな漢字変換方式をとる文書作成装置では、同音
異字語を多数含む日本語において、「かな」から所望の
「漢字」に変換を行うために、単語辞書、文法辞書等の
変換用辞書を具備することが必須である。従来のシステ
ム構成においては、外部記憶装置としてフレキシブルデ
ィスクドライバを具備し、これに辞書フロッピーディス
クを挿入して、この辞書を変換の都度アクセスして使用
するものが一般的であった。しかし、近年の装置の小型
化の傾向から、辞書フロッピーディスクの内容を主メモ
リにローディングしてしまうものができ、ひいては、半
導体メモリの高集積化から、大容量マスクROMを変換
用辞書として使用する傾向にある。
第1図は、辞書の1語のフォーマットを示す図である。
11は「読み」情報の記憶部であり、24バイト程度の
記憶容量を有する。12は品詞分類コードが記憶される
6バイト程度の領域であり、体言ではその品詞が、用言
については品詞とその活用形、活用性が記憶される。用
言の場合、読み記憶部11には語幹のみが記憶される。
13は見出し記憶部であり、24バイト程度の領域で、
「読み」に対応する漢字が記憶される。14は利用者別
ひん度情報の記憶部であり、8バイト程度の記憶部であ
る。利用者別ひん度情軸は、同音異義語が生じた場合に
、どの語を優先して選択するかの判断に利用される。
これらの辞書を構成する俗語は、一般に50音順に並べ
られている。システムが、かな漢字変換処理を実行し、
ある「読み」に対応する見出しをめる場合、常に「読み
」の先頭「あ」より検索を開始したのでは検索時間が増
大し性能上の問題があるため、辞書ブイレフ) IJが
設けられる。辞書ディレクトリは単語の読みの1部(例
えば、先頭の一字、二字、三字等)に対して、その「見
出し」が存在する位置が登録されたものである。具体的
に言えば、辞書ディレクトリには例えば「あ」K対応す
る「見出し」はA1の記憶位置から、・「い」はA2か
ら、「さ」はAllから記憶されているという情報が登
録される。オペレータが、「さ」で始まる単語を入力し
、かな漢字変換処理が実行されたとき、システムは、辞
書ディレクトリを参照して、辞書本体のAllから「見
出し」の検索を開始する。
上記構成の変換用辞書をマスクROMK記憶させた従来
例を第2図に示す。N個のROMチップで変換用辞書が
構成されるとすると、ROMチップ21に前記辞書ディ
レクト9部と辞書本体部lが、残りのROMチップ22
.・=・、 2NICは各々辞書本体部2゜・・・、N
が50音順に記憶される。辞書検索部201(CPU及
び制御プログラムによる動作を機能ブロックとして示す
ものである)がかな漢字変換処理において辞書検索を行
う場合、まず辞書ROMチップ1上に存在する辞書ディ
レクトリ部を参照して、目的の単語が存在する辞書本体
部のアドレスをめ、とのアドレス情報にもとづき、辞書
本体部のアクセスを行う。
上記構成で、マスクROM21.・・・、2Nに辞書を
記憶させた場合、辞書ブイレフ) IJがROMチップ
21に存在するため、辞書ROM2iに関して内容を変
更する場合に、ROMチップ21にも変更が生ずる。更
に、単語が50音順に並べられているため、「あ」で始
まる語はROMチップ21上K。
「さ」で始まる語はROMチップ25上にと分かれて存
在するため、50音の各音で始壕る語のうち、使用頻度
の高いもののみを抜き出してコンパクトな辞書を作成す
る場合、全てのROMチップの変更を必要とする。これ
は、逆に、専門用語等を追加する場合も同様である。
〔発明の目的〕
本発明は上述した問題点を解決するために、辞硼内容の
変更による影響を弗小眼にする辞書の記憶構成を採用し
た、かな漢字変換方式の文書作成装置の提供を目的とす
る。
〔発明の概要〕
上記目的を達成するため、本発明の文書作成装置は、複
数個の記憶素子に各々独立した単語辞書を記憶させてい
る。更に、この記憶素子にけ、前記単語辞書とともに、
この単語辞書のアドレス管理情報からなる辞書ディレク
トリが記憶さJする。
そして、本発明の文書作成装置は、かな漢字変換処理に
際し、入力装置より入力された文字列にもとづき、前記
記憶素子名々のアドレス管理情報を参照して、各記憶素
子より読み該当部分の単語群を読み出す手段と、各記憶
素子より読み出された前記単語群を格納するバッファ記
憶部と、このバッファ記憶部に格納された前記幣語群を
辞書構成に並べ換える手段とを具備する。かな漢字変換
処理は、前記バッファ記憶部に構成された辞書を利用し
て実行される。
〔発明の実施例〕
以1実施例により本発明の文書作成装置を詳細に説明す
る。
第3図は実施例の文書作成装置の機能ブロック図でるる
。31はキー人力装置であり、文書を構成する文字情報
及びかな漢字変換指示、校正・編集指示等の各種制i情
報の入力に使用される。32はキー人力制御機構である
。キー人力制御機構は人力スタック33(主メモリの1
部領域が使用される)を具備し、キー人力装置より入力
されたかな文字列がこの入力スタック中に積まれる。3
4はかな漢字変換機構であ抄、この機構の1部として辞
書検索制御部35が具備される。361及至363はか
な漢字変換用辞書記憶用のROMである。各ROM 3
61及至363は各々辞書ブイレフ) IJ部と辞書本
体部とを有している。ROM361には使用頻度が高い
単語が、ROM362には使用頻度が中位の単語が、R
OM363には専門分野でのみ使用される単語が記憶さ
れる。そして、各ROM361及至363の辞書ディレ
クトリ部は当9ROMK記憶された辞書本体部のみを管
理する。37は単語辞書バッファであり、前記辞書検索
制御部35によって各ROM361及至363から読み
出された必要とする「読み」に該当するすべての単語を
記憶する。38は文書バッファであり、かな漢字変換機
構34の変換結果が記憶される。 39は表示制御装置
であり、文書バッファ38の内容を表示装置40に表示
せし、める。41は校正・編集機構であり、キー人力装
置31からの指示により文書バッフ738中の文書にお
ける訂正、削除筒の校正・編集動作、同音異字語の選択
を行う。42U単語間の接続性を判定するだめのテーブ
ルである。
次に、実施例の文書作成装置の動作を説明する。
入力スタック33にかな文字列が積まれると、この文字
列が文節単位でかな漢字変換機#t34に送られる。例
えば「せんせいは」なる文字列が入力スタック33に積
まれているとする。このとき、かな漢字変換機構34に
おいて、辞書検察制御部35に起動がかけられる。、噴
ず、ROM361のディレクトリが文字コードから算出
されるアドレスにより参照され、「せ」を読みの先頭と
する単語群が記憶されたROM361の辞書本体内のア
ドレスがめられる。そして、このアドレスから前記単語
群が単語辞書バッファ37に読み出される。
以下、辞書検索制御部35は1ン0M362. 1セ0
M363についても同様の動作を行い、全てのROM3
61及至363より「せ」を読みの先頭とする単語群を
単語辞書バッファ37に格納する。
辞書検索制御部35はすべての辞書ROMチップからの
単語の読み出しを完了すると、単語辞書バッファ37に
記憶された単語のソートを行う。ソートの条件としては
、読みの50音順、品詞コードの順、頻度の順となる。
品詞コードによるソートは、同じ品詞の単語を集中させ
るために行われるものである。使用頻度り降順に並べら
れるのが一般的である。このソート処理の結果、各々独
立した辞書を各ROMチップに分けても、単語辞書バッ
ファ37内に、従来と同様の辞書が構成できる。ソート
処理が終了すると、再びかな漢字変換機構34に処理が
戻される。かな漢字変換機構34は単語辞書バッファ3
7に記憶された単語群を利用して入力スタック33中に
記憶された文節の分析を行う。分析の第1ステツプとし
て、まず、自立語を調べるために単語辞書バッファ内の
単語とのマツチングを行う。辞書の中の単語の読み(ひ
らがな)の部分が人力かな列の一部であるとき、それが
自立語の候補となる。マツチングは最長一致したものか
ら第1候補として、すべてのマツチングがとれたものを
候補とする。候補は主メモリ内のスタックに積まれる。
前述のように入力スタック33に「せんせいは」なる文
節があるとすれば、まず「せんせいは」の文字列とのマ
ツチングが検索される。この単語は単語辞書バッファ3
7内の単語群には存在しないので、次に「せんせい」の
文字列とのマツチングが検索される。この場合、「先生
j、「宣誓」、「先制」、「専制」が候補としてスタッ
クに積マれる。ただし、活用のある語は活用語尾のマツ
チングがとられる。続いて、「せんぜ」、「せん」、「
せ」のマツチングがとられる。
次に付Jljiinのマツチング、及び自立語と付属語
との接続可能性が検定される。自立語と付属語との接続
可能はテーブル形式で記憶されており、このテーブル4
2にしたがって決定される。テーブルむし、自立語の種
類と付属語の種類とによってアクセスさiする位置に接
続可否のビットを立てて構成されるマトリクス形式のも
のが利用できる。
以上の処理によって与えられたかな系列が自立語と付属
語の組合せとして正しいものであるとき、辞唐からその
見出語部分(漢字)を抜出しこれをかな漢字変換のし果
とする。この結果がかな漢字変換機構34から文書バッ
ファ38に転送され格納される。この段階で同音異義語
が前記スタック中に存在する場合、同音異義語の情報も
文書バッファ38に格納される。
〔発明の効果〕
この発明によれば、N個のメモリ素子に記憶された辞書
名々は独立し7ているため、装置の要求に応じて辞書の
語霊数を増減したり、専門分野に応じて辞■の構成を変
更することが、必要最少限のメモリ要素の変更によって
可能となる。また、辞書は各素子ごとに管理されている
〆こめ各素子の内容に変更が生じた場合も、その素子の
みを佑換すればよく、辞書仕様の変更にともなうコスト
を低減することができる。尚、各記憶素子をプラグイン
の形式にすれば、専門分野によらない文書作成装置とす
ることもできる。
【図面の簡単な説明】
第1図は単語辞書を構成する+ 1Ifiのフ→−マッ
トを示す図であり、第2図は従来のかな漢字変換用辞書
の構成を示す図である。第3図は実施例の文書作成装置
の機能ブロック図である。 34・・・・・・かな漢字変換機構 35・・・・・・辞書検索制御部 361及至363・・・・・・かな漢字変換用辞書記憶
用0M 38・・・・・・文書ハッ7ア (7317) 代理人 弁理士 則 近 憲 佑(#1
か1名)

Claims (1)

  1. 【特許請求の範囲】 読みに対応して見出し語を記憶する単語辞書を有し、こ
    の辞書を検索することにより、入力装置から入力された
    文字列を漢字混じり文に変換する? 文書作成装置において、前記単語辞書を構成する各々独
    立した部分単語辞書、及びこの部分単語辞書のアドレス
    管理情報からなる辞書ディレクトリとを各々に記憶する
    複数の記憶素子と、前記入力装置より入力された文字列
    にもとづき、繭記記憶素子各々のアドレス管理情報を参
    照して、各記憶素子より読み鯖当部分の単語群を読み出
    す手段と、各記憶素子より読み出された前記単語群を格
    納するバッファ記憶部と、このバッファ記憶部に格納さ
    れた前記単語群を辞書構成に並べ換える手段とを具備し
    たことを特徴とする文書作成装置i6
JP58164072A 1983-09-08 1983-09-08 文書作成装置 Granted JPS6057421A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58164072A JPS6057421A (ja) 1983-09-08 1983-09-08 文書作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58164072A JPS6057421A (ja) 1983-09-08 1983-09-08 文書作成装置

Publications (2)

Publication Number Publication Date
JPS6057421A true JPS6057421A (ja) 1985-04-03
JPS646499B2 JPS646499B2 (ja) 1989-02-03

Family

ID=15786244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58164072A Granted JPS6057421A (ja) 1983-09-08 1983-09-08 文書作成装置

Country Status (1)

Country Link
JP (1) JPS6057421A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55133868A (en) * 1979-04-03 1980-10-18 Murata Mfg Co Ltd Soldering method to portion to be soldered of electronic parts
JPS63130265A (ja) * 1986-11-19 1988-06-02 Fuji Plant Kogyo Kk リ−ドフレ−ムへの半田外装方法
JPS63130264A (ja) * 1986-11-19 1988-06-02 Fuji Plant Kogyo Kk リ−ドフレ−ムへの半田外装方法
JPS63266896A (ja) * 1987-04-23 1988-11-02 Asahi Chem Res Lab Ltd 電子部品の接合方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55133868A (en) * 1979-04-03 1980-10-18 Murata Mfg Co Ltd Soldering method to portion to be soldered of electronic parts
JPS6057421B2 (ja) * 1979-04-03 1985-12-14 株式会社村田製作所 電子部品の被半田付け部分への半田付け方法
JPS63130265A (ja) * 1986-11-19 1988-06-02 Fuji Plant Kogyo Kk リ−ドフレ−ムへの半田外装方法
JPS63130264A (ja) * 1986-11-19 1988-06-02 Fuji Plant Kogyo Kk リ−ドフレ−ムへの半田外装方法
JPS63266896A (ja) * 1987-04-23 1988-11-02 Asahi Chem Res Lab Ltd 電子部品の接合方法

Also Published As

Publication number Publication date
JPS646499B2 (ja) 1989-02-03

Similar Documents

Publication Publication Date Title
CN100594470C (zh) 用于对用户输入的多义性输入序列进行多义性消除的系统和方法
JP2009116900A (ja) 曖昧なテキスト入力の明確な文字フィルタリング
US5560037A (en) Compact hyphenation point data
JPS6057421A (ja) 文書作成装置
JPH0140372B2 (ja)
JPH0412866B2 (ja)
JP3873305B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JPS6246029B2 (ja)
JPS62214468A (ja) かな漢字変換装置
JPH0821031B2 (ja) 言語解析装置
JP2001202388A (ja) フルテキストサーチ方法および装置
JPH01114976A (ja) 文書処理装置の辞書構造
JPS6198475A (ja) 日本語文章入力装置
JPH06215038A (ja) データベース検索装置
JPH0991304A (ja) 情報検索方法、情報検索システム及び情報検索用記憶媒体
JPH0140371B2 (ja)
JPS60207948A (ja) カナ漢字変換処理装置
JPH0721212A (ja) 文書処理装置
JPH03127254A (ja) 単語検索装置
JPS60205661A (ja) かな漢字変換装置
JPS61128367A (ja) カナ漢字変換装置
JPH03208162A (ja) 入力装置
JPS59116835A (ja) 短縮入力機能付日本語入力装置
JPS5998236A (ja) 日本文入力装置
JPS6133569A (ja) かな漢字変換装置