JPH0410104B2 - - Google Patents

Info

Publication number
JPH0410104B2
JPH0410104B2 JP57125538A JP12553882A JPH0410104B2 JP H0410104 B2 JPH0410104 B2 JP H0410104B2 JP 57125538 A JP57125538 A JP 57125538A JP 12553882 A JP12553882 A JP 12553882A JP H0410104 B2 JPH0410104 B2 JP H0410104B2
Authority
JP
Japan
Prior art keywords
information
dictionary
kana
kanji
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57125538A
Other languages
English (en)
Other versions
JPS5916039A (ja
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP57125538A priority Critical patent/JPS5916039A/ja
Publication of JPS5916039A publication Critical patent/JPS5916039A/ja
Publication of JPH0410104B2 publication Critical patent/JPH0410104B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 発明の対象 本発明はワードプロセツサ等に用いられるカナ
漢字変換方法に関し、特に同音異語の発生を抑止
するために使用者、使用分野に適合する辞書を選
択して用いることを可能とするカナ漢字変換方法
に関する。
従来技術 日本語文章におけるカナ漢字変換においては、
同音異語が発生するという問題があり、その対策
として、従来、カナ漢字変換用辞書に使用頻度情
報を追加する方式、使用分野別に異なる辞書を作
成する方式あるいは辞書の用語が選択されるごと
に辞書内の用語を並べかえる方式等各種の方式が
提案されている。
しかしながら、上述の方式はいずれも辞書の読
み、表記文字等の用語固有の情報と、使用者また
は使用分野ごとに異なる使用頻度等の情報とが一
体となつたものであり、使用者、使用分野ごとに
最適化された辞書を持つためには、辞書を収容す
る記憶媒体容量が増加するか、媒体数が増加し、
管理運用上重大な欠点を有するものであつた。
発明の目的 本発明は上記事情に鑑みてなされたもので、そ
の目的とするところは、従来のカナ漢字変換方式
における上述の如き欠点を除去し、辞書を収容す
る記憶媒体容量を過大にすることなしに、使用
者、使用分野に適合する辞書を選択して用いるこ
とを可能とするカナ漢字変換方式を提供すること
にある。
発明の総括的説明 上記目的を達成するため、本発明のカナ漢字変
換方法は、カナ文字列とカナ文字列に対応する漢
字の候補情報を含む基本辞書と、漢字の候補情報
に対応付けられた優先度情報を含み、用途毎に内
容を書き替えることができる用途別辞書を用い
て、入力されたカナ文字列に対応する漢字の候補
を基本辞書から特定し、特定された漢字の候補に
対応する優先度情報を前記用途別辞書から得て、
優先度情報に従つて漢字を出力することに特徴が
ある。
発明の実施例 第1図は本発明の一実施例を示す構成図であ
り、1は辞書の付加情報を収容するフロツピーデ
イスク(以下、「FD」という。)、2は辞書の基本
情報を収容するデイスク(以下、「DK」とい
う。)、3は読込み機構、4は辞書情報結合機構で
ある。また、5はカナ文字列作成機構、6はカナ
漢字変換制御機構、7は出力バツフアそして8は
キーボードである。
キーボード8はカナ文字を入力する装置、カナ
文字列作成機構5はキーボード8から入力された
カナコードをカナ文字列に作成し、バツフア13
に書込む機構である。読込み機構3はカナ漢字変
換制御機構6から送られる指定カナ文字列情報に
従つて、FD1およびFD2から辞書情報を読み出
し、それぞれバツフア9,10に書込む機構であ
る。辞書情報結合機構4は、前記バツフア9,1
0に書込まれた辞書情報を結合し、バツフア11
に書込む機構である。
第2図に辞書情報の一例を示した。AはDK2
に収容されている基本情報を示すものであり、用
語の読みA1、表記文字A2、語彙番号A3、品詞情
報A4から成つている。また、BはFD1に収容さ
れている付加情報を示すものであり、この場合は
使用頻度情報B1のみから成つている。Cは上記
両情報を語彙番号をキーとして結合した情報を示
すものである。
上述の如く構成された本実施例装置の動作につ
いて以下説明する。
カナ漢字変換機構6は、キーボード8から入力
されたカナコードに基づいてカナ文字列作成機構
5によりバツフア13に書込まれたカナ文字列に
従つて、辞書読出しのための辞書見出しのカナ文
字列を作成し、これをバツフア12に書込み、読
込み機構3を起動する。読込み機構3は、文字列
とDK2内の辞書情報を収容する領域のアドレス
との対応を示す辞書インデツクス情報をDK2か
ら読出し、前記指定された文字列に対応するDK
2の物理アドレスを求める。そして該アドレスに
従い、DK2から前記指定文字列に対応する辞書
情報を読出す。ここで、DK2から読出される辞
書情報は第2図Aに示した如き、用語の読み、表
記文字、品詞情報および語彙番号をまとめた情報
であり、用語単位の情報である。例えば、「社会」
という用語は、読み:しやかい、表記文字:社
会、品詞情報:名詞であり、語彙番号は辞書に収
容された用語の通し番号であり、用語ごとに異な
る番号である。
読込み機構3は次に、上記読出した語彙番号に
よりFD1から前記基本情報に対応する付加情報
を読出す。FD1に収容する付加情報を固定長と
しておけば、上記語彙番号に対応するFD1内の
物理アドレスを容易に求めることが可能となる。
こうして読出された付加情報、前記基本情報は、
それぞれバツフア9,10に書込まれる。
辞書情報結合機構4は、上記バツフア9,10
に書込まれた情報を読出してこれらを結合させ
て、第2図Cに示した如き情報としてバツフア1
1に書込む。
カナ漢字変換機構6は、上記バツフア11の内
容を読出し、使用頻度情報を調べて、現用語より
使用頻度の高い用語が存在すればその用語を求
め、使用頻度が最も高い用語を第1候補とする。
なお、品詞情報はカナ漢字変換語の用言のつなが
りおよび語尾変化等の妥当性を調べるための情報
であり、妥当性がなければ、その用語は捨て次の
用語を求める。
上述の如くして変換された用語は、バツフア7
に書込まれ、カナ漢字変換後の文字列として貯え
られる。
上記実施例において、使用者、使用分野ごと
に、同一基本情報(実際には、キーとしての語彙
番号)に対して異なつた使用頻度情報を有する付
加情報を収容するFD1を用意しておけば、FD1
を差換えることにより辞書内容を実質的に該使用
者、使用分野に適合するものに変更することがで
きることになる。
上記実施例においては、FD1に収容する付加
情報として、使用頻度情報を例に挙げたが、付加
情報はこれに限られるものではない。例えば、使
用頻度情報に使用可/使用不可情報を追加するこ
とにより、一般的には使用頻度の高い用語であつ
ても、特定の使用者、使用分野では使用しない用
語を容易に−頻度情報の修正を行わずに−表示す
ることができる。
また、辞書の基本情報を収容するには膨大な記
憶容量を必要とするが、付加情報は比較的少ない
情報量であるので、辞書の基本情報を、配下の複
数のターミナルに共通的に提供する機能を持つた
ターミナルコントローラと前記複数のカナ漢字変
換ターミナル装置とを接続するシステムを構成
し、各ターミナル装置が付加情報のみを持つよう
にすることにより、各ターミナル装置の使用者が
その使用分野に最適化された辞書を使用できるよ
うになる。
発明の効果 以上述べた如く、本発明によれば、入力手段か
ら入力されたカナ文字列を、カナ漢字変換用辞書
を用いて漢字に変換するカナ漢字変換方式におい
て、前記カナ漢字変換用辞書を、カナ文字列と該
カナ文字列に対応する漢字の候補情報を含む基本
辞書と、前記漢字の候補情報に対応付けられた優
先度情報を含む用途別辞書とから構成するととも
に、カナ漢字変換時に、入力されたカナ文字列に
対応する漢字の候補を前記基本辞書から特定し、
該特定された漢字の侯補に対応する優先度を前記
用途別辞書から得て、該優先度に従つて漢字を出
力するようにしたので、使用者、使用分野ごとに
前記付加情報のみを容易に変換することが可能と
なり、この変更により装置内で最適化された辞書
を得ることができ、変換率の高いカナ漢字変換方
法を実現できるという顕著な効果を奏する。
【図面の簡単な説明】
第1図は本発明の一実施例を示す構成図、第2
図は辞書情報の一例を示す図である。 1:FD、2:DK、3:読込み機構、4:辞
書情報結合機構、5:カナ文字列作成機構、6:
カナ漢字変換制御機構、7,9,10,11,1
2,13:バツフア、8:キーボード。

Claims (1)

    【特許請求の範囲】
  1. 1 カナ文字列と該カナ文字列に対応する漢字の
    候補情報を含む基本辞書と、前記漢字の候補情報
    に対応付けられた優先度情報を含み、用途毎に内
    容を書き替えることができる用途別辞書を用い
    て、入力されたカナ文字列に対応する漢字の候補
    を前記基本辞書から特定し、特定された漢字の侯
    補に対応する優先度情報を前記用途別辞書から得
    て、該優先度情報に従つて漢字を出力することを
    特徴とするカナ漢字変換方法。
JP57125538A 1982-07-19 1982-07-19 カナ漢字変換方法 Granted JPS5916039A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57125538A JPS5916039A (ja) 1982-07-19 1982-07-19 カナ漢字変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57125538A JPS5916039A (ja) 1982-07-19 1982-07-19 カナ漢字変換方法

Publications (2)

Publication Number Publication Date
JPS5916039A JPS5916039A (ja) 1984-01-27
JPH0410104B2 true JPH0410104B2 (ja) 1992-02-24

Family

ID=14912667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57125538A Granted JPS5916039A (ja) 1982-07-19 1982-07-19 カナ漢字変換方法

Country Status (1)

Country Link
JP (1) JPS5916039A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59111517A (ja) * 1982-12-17 1984-06-27 Fuji Xerox Co Ltd 辞書用メモリ
JPS60159965A (ja) * 1984-01-30 1985-08-21 Toshiba Corp 単語辞書記憶方式
JPS60171565A (ja) * 1984-02-15 1985-09-05 Comput Basic Mach Technol Res Assoc 同音語明示方式
JPS62107369A (ja) * 1985-11-05 1987-05-18 Toshiba Corp 文書作成装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5556224A (en) * 1978-10-18 1980-04-24 Fujitsu Ltd Japanese input device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5556224A (en) * 1978-10-18 1980-04-24 Fujitsu Ltd Japanese input device

Also Published As

Publication number Publication date
JPS5916039A (ja) 1984-01-27

Similar Documents

Publication Publication Date Title
JPH0410104B2 (ja)
Afzal et al. Urdu computing standards: development of Urdu Zabta Takhti (UZT) 1.01
JPH0140372B2 (ja)
JPS646499B2 (ja)
JPH0140370B2 (ja)
JPS6389976A (ja) 言語解析装置
JP3526074B2 (ja) 文字処理装置
JPH0225544B2 (ja)
JPS635793B2 (ja)
JPH0638254B2 (ja) 仮名漢字変換装置
RU2294011C2 (ru) Способ и устройство для обеспечения иерархического индекса структуры данных модели языка
JP2022151023A (ja) 読み方推定装置、読み方推定方法、読み方推定プログラム、および記録媒体
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPH0140371B2 (ja)
JPH0724057B2 (ja) 電子機器
JP3020230B2 (ja) 辞書コンパクト装置および自然言語処理方法
JPH024940B2 (ja)
JPS6229833B2 (ja)
JPH06187371A (ja) 圧縮地名データの格納方法及び読み出し方法
JPS61184682A (ja) 仮名漢字変換装置
JPS61255465A (ja) 言語処理装置
JP2002117025A (ja) かな漢字変換装置およびかな漢字変換方法
JPH03296856A (ja) 文書処理装置
JPS61128366A (ja) カナ漢字変換装置
JPS61128367A (ja) カナ漢字変換装置