JPS62130458A - かな漢字変換処理方式 - Google Patents

かな漢字変換処理方式

Info

Publication number
JPS62130458A
JPS62130458A JP60270333A JP27033385A JPS62130458A JP S62130458 A JPS62130458 A JP S62130458A JP 60270333 A JP60270333 A JP 60270333A JP 27033385 A JP27033385 A JP 27033385A JP S62130458 A JPS62130458 A JP S62130458A
Authority
JP
Japan
Prior art keywords
katakana
word
conversion
character
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60270333A
Other languages
English (en)
Inventor
Hiroyuki Matsuyama
松山 浩之
Masahiko Shimada
万佐彦 島田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Usac Electronic Ind Co Ltd
Original Assignee
Fujitsu Ltd
Usac Electronic Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Usac Electronic Ind Co Ltd filed Critical Fujitsu Ltd
Priority to JP60270333A priority Critical patent/JPS62130458A/ja
Publication of JPS62130458A publication Critical patent/JPS62130458A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 かな漢字変換処理において、カタカナ文字列に対応する
読みをカタカナ自動変換した際、変換結果のカタカナ文
字語を学習することにより、以後そのカタカナ文字語を
含む複合語あるいは複合文節のかな漢字変換を可能にす
る。
〔産業上の利用分野〕
本発明は、ワードプロセッサなどの日本語情報処理装置
におけるかな漢字変換方式に関する。
〔従来の技術〕
日本語情報処理装置では1日本語文の読みをかな入力し
、入力された読みのかな文字列を辞書を用いて解析し5
語を識別してかな漢字変換を行い日本語文を作成してい
る。
第3図に、このような従来の日本語情報処理装置の一般
的な構成を示す。
図において、1はキーボード、2はディスプレイ、3は
日本語処理部、4は編集処理部、5は日本語データファ
イルを表している。
キーボード1を用いて入力された読みのかな文字列は1
日本語処理部3において、読み列辞書。
単語辞四、構文規則等を用いてそれぞれ読み列解析、単
語解析、構文解析され、かな漢字変換される。この変換
結果は1日本語データファイル5に格納される。また、
入力された読みと変換結果とは、ディスプレイ2上に表
示される。
編集処理部4は、削除、挿入、移動、改行などの文書作
成上の編集処理を行う。
ここで、辞書内に読みのかな文字列に対応する語を検出
できなかった場合にば5直ちに無変換とはせず、さらに
そのかな文字列中に、長音、パ行の文字、ア行の小文字
のいずれかが含まれているかどうかを調べ、それらが含
まれている場合には2外来語や擬音語などのカタカナ表
現の語と判定して、カタカナ変換する。これをカタカナ
自動変換という。
たとえば、読み「えでいしょん」は、対応する漢字がな
く、シかもア行の小文字“い”を含むことから、カタカ
ナ文字列「エディジョン」にカタカナ自動変換される。
また[えでいしょんけいかくJのような複合語の読みを
入力して変換を指示した場合には、「えでいしょんけい
かく」全体がカタカナ文字列「エディションケイカク」
にカタカナ自動変換される。
これをたとえば正しい「エディジョン計画」に変換する
ためには、「えでいしょん」と「けいかく」とを分けて
変換指示する必要があった。
また以上のようなカタカナ文字列への自動変換が行われ
る場合には1通常の漢字への変換の場合のように、他の
候補がいくつか呈示された中から選択されるのではなく
、一番最初に呈示された候補を確定させることになるた
め、従来、学習は不要であるとして行われていない。
〔発明が解決しようとする問題点〕
近年、科学技術などの多くの分野で、外国語を発音通り
にカタカナ表記した用語がひんばんに用いられるように
なっており、またこのようなカタカナ表記を一部に含む
複合語も増加している。
しかし、上述したように、従来の日本語情報処理装置で
は、カタカナ文字語を含む複合語を変換する場合、その
カタカナ文字語が予め辞書に登録されているものでない
限り、複合語全体がカタカナ表現に自動変換される。ま
たカタカナ自動変換されたカタカナ文字語については学
習することができない。
このため、カタカナ文字語を含む複合語を入力するたび
にカタカナ文字語の前後で区分して入力変換しなければ
ならず、入力処理の能率が著しく低下するという問題が
あった。
〔問題点を解決するための手段」 本発明は、カタカナ自動変換されるカタカナ文字列を語
として学習させることにより、このようなカタカナ文字
列を一部に含む複合語を複合語として認識させ、正しく
仮名漢字変換できるようにするものである。
第1図は1本発明による日本語情報処理装置の原理的構
成を示したものである。なお1本発明に特に関連のない
部分は省略して示しである。
図において、■はキーボード、2はディスプレイ、3は
日本語処理部、31は単語解析処理ルーチン、32は辞
書、33はカタカナ自動変換処理ルーチン、34は学習
処理ルーチン、35は学習テーブルを表す。
キーボード1からかな入力された日本語文の読み列は1
日本語処理部3の単語解析処理ルーチン31により、辞
書32および学習テーブル35を用いて単語認識される
単語辞書32および学習テーブル35に登録されている
語と照合できない読み列は、カタカナ自動変換処理ルー
チン33により、長音文字、パ行文字、ア行小文字の有
無を検出され、これらの文字が含まれている場合には、
その読みをカタカナ文字語と判定して、カタカナ自動変
換する。
これと同時に学習処理ルーチン34は、カタカナ自動変
換された結果のカタカナ文字語を学習テーブル35に登
録する。
以後、同一のカタカナ文字語あるいはそれを一部に含む
複合語の読み列が入力された場合には。
単語解析処理ルーチン31により学習テーブル35のカ
タカナ文字語と対応をとられ、単語認識される。
〔作用〕
本発明の構成によれば、たとえば「えで1、しょん」が
最初に入力されたとき、「エディジョン」にカタカナ自
動変換されたものとすれば、「エディジョン」が学習テ
ーブルに登録されるため、その後に再び「えでいしょん
」が入力されると直ちに「エディジョン」として単語認
識され変換される。また[えでいしょんけいかく]のよ
うな複合語が入力されると、「えでいしょん」は学習テ
ーブルにより、「エディジョン」にそして「けいかく」
は辞書により「計画」に対応づけられるため。
全体は「エディジョン計画」に変換される。
このように、任意のカタカナ自動変換された読みは、そ
の後、学習によりカタカナ文字語として単語認識可能と
なる。
〔実施例〕
第2図は、第1図に示されている日本語処理部3におけ
る。学習テーブルの登録処理の実施例フローである。
以下、■ないし■の処理ステップについて順に説明する
■ キーボードよりかな文字による読みを入力する。
■ 単語、複合語2文節、複数文節などの文の適当な区
切りで変換キーを押す。
■ 学習テーブルおよび辞書中に登録されている単語を
用いて変換可能かどうかを調べる。
■ 変換可能である場合、該当する候補の1つをディス
プレイに表示する。
■ 次候補キーが押された場合、■に戻り2次候補を表
示させる。
■ ディスプレイされた候補を確定させる操作が行われ
た場合、それが2回目の使用であるかどうかを、別途作
成されている使用実績データに基づいてチェックする。
■ 初回の使用であれば終了する。
■ 2回目以降の使用であれば、その語を学習テーブル
に登録する。
■ ■で学習テーブルおよび辞書を用いた変換ができな
いものと判定された場合、その読み中に。
長音文字、パ行の文字、ア行の小文字のいずれかが含ま
れているかどうかを調べる。
[相] ■の各文字のいずれも含まれていない場合には
、読みをひらがなのまま無変換出力する。
■ ■の各文字のいずれかが含まれている場合には、カ
タカナ自動変換する。
[相] 変換したカタカナ文字語をディスプレイに表示
する。
■ 表示したカタカナ文字語が確定したかどうかを識別
する。
■ 確定しなければたとえば区分再入力等の入力修正が
行われる。
■ 確定すればそのカタカナ文字語を学習テーブルに登
録する。
以上の処理により、学習テーブルには、カタカナ自動変
換が行われるたびにその変換されたカタカナ文字語が登
録され、以後単語認識に使用される。
なお、学習テーブルは単語辞書等の辞書の一部に組込む
ことも可能である。
〔発明の効果〕
本発明によれば、カタカナ文字の用語が頻繁に出現する
日本語文書の作成が極めて容易となり。
特に新しい用語が多く、同じカタカナ文字語が多数の複
合語あるいは複合文節中に現れる場合には。
能率的な文書作成処理が可能となる。
【図面の簡単な説明】
第1図は本発明の原理的構成図、第2図は学習テーブル
登録処理の1実施例のフロー図、第3図は本発明が対象
とする日本語情報処理装置の一般的な構成を示す図であ
る。 第1図中。 1;キーボード 2:ディスプレイ 3:日本語処理部 31:単語解析処理ルーチン 32:辞書 33:カタカナ自動変換処理ルーチン 34:学習処理ルーチン 35:学習テーブル 特許出廓人  富士通株式会社(外1名)代理人弁理士
 長谷用 文廣(外1名)摩1「戸ア゛’IL/登を艷
9!!−工電フロー¥、2In 印阿看慴板絶理饅1ゼ和勺な構成 烹3m

Claims (1)

  1. 【特許請求の範囲】 入力された日本語文の読み列が、学習テーブル(35)
    および辞書(32)に登録されている語のいずれとも対
    応せず、かつ長音文字、ア行小文字、パ行文字等のカタ
    カナ文字語に特徴的な文字を含んでいる場合に、その読
    み列をカタカナ文字語に変換するカタカナ自動変換機能
    をもつ日本語情報処理装置において、 カタカナ自動変換された結果のカタカナ文字語を、学習
    テーブル(35)に登録することを特徴とするかな漢字
    変換処理方式。
JP60270333A 1985-11-30 1985-11-30 かな漢字変換処理方式 Pending JPS62130458A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60270333A JPS62130458A (ja) 1985-11-30 1985-11-30 かな漢字変換処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60270333A JPS62130458A (ja) 1985-11-30 1985-11-30 かな漢字変換処理方式

Publications (1)

Publication Number Publication Date
JPS62130458A true JPS62130458A (ja) 1987-06-12

Family

ID=17484794

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60270333A Pending JPS62130458A (ja) 1985-11-30 1985-11-30 かな漢字変換処理方式

Country Status (1)

Country Link
JP (1) JPS62130458A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01113860A (ja) * 1987-10-28 1989-05-02 Sharp Corp 文字処理装置
JPH01205371A (ja) * 1988-02-12 1989-08-17 Seiko Epson Corp 仮名漢字変換装置
JPH038051A (ja) * 1988-11-16 1991-01-16 Ricoh Co Ltd 自然言語処理システム
JPH03276252A (ja) * 1990-03-27 1991-12-06 Internatl Business Mach Corp <Ibm> 文字種変換方法および装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01113860A (ja) * 1987-10-28 1989-05-02 Sharp Corp 文字処理装置
JPH01205371A (ja) * 1988-02-12 1989-08-17 Seiko Epson Corp 仮名漢字変換装置
JPH038051A (ja) * 1988-11-16 1991-01-16 Ricoh Co Ltd 自然言語処理システム
JPH03276252A (ja) * 1990-03-27 1991-12-06 Internatl Business Mach Corp <Ibm> 文字種変換方法および装置

Similar Documents

Publication Publication Date Title
JPS62130458A (ja) かな漢字変換処理方式
JPS63118868A (ja) 日本語文章校正装置
JPS6037510B2 (ja) ロ−マ字漢字変換方式
JPH0380363A (ja) 文書処理装置
JPS60164864A (ja) デ−タ処理装置
JPH0350668A (ja) 文字処理装置
JPS63316162A (ja) 文書作成装置
JPH0441399Y2 (ja)
JPH02255970A (ja) 文章提示装置
JP3118880B2 (ja) 日本語文章処理装置
JPS63115264A (ja) 文書処理装置
JPS60207948A (ja) カナ漢字変換処理装置
JPS60189573A (ja) 文字変換装置
JPH0346865B2 (ja)
JPH0264859A (ja) 文章処理装置
JPS6120176A (ja) ロ−マ字−中国語変換装置
JPH03260687A (ja) 視覚障害者用点字漢字変換装置
JPS6365566A (ja) カナ漢字変換装置
JPS6327966A (ja) ワ−ドプロセツサにおけるカタカナ変換方式
JPH0340060A (ja) かな漢字変換装置
JPS62296267A (ja) 日本語文章入力装置
JPH0217568A (ja) カタカナ語混じり文節の仮名漢字変換システム
JPH0468466A (ja) かな漢字変換装置
JPS61128364A (ja) 辞書検索装置
JPH02289032A (ja) ワードプロセツサおよびその変換辞書・ソフトウエアならびにその変換方法