JPH024940B2 - - Google Patents

Info

Publication number
JPH024940B2
JPH024940B2 JP55167057A JP16705780A JPH024940B2 JP H024940 B2 JPH024940 B2 JP H024940B2 JP 55167057 A JP55167057 A JP 55167057A JP 16705780 A JP16705780 A JP 16705780A JP H024940 B2 JPH024940 B2 JP H024940B2
Authority
JP
Japan
Prior art keywords
kanji
data
word
kana
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP55167057A
Other languages
English (en)
Other versions
JPS5790781A (en
Inventor
Tetsuyuki Masuda
Shunpei Takenaka
Toshiko Hosokawa
Shuji Ichimura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP55167057A priority Critical patent/JPS5790781A/ja
Publication of JPS5790781A publication Critical patent/JPS5790781A/ja
Publication of JPH024940B2 publication Critical patent/JPH024940B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 本発明は不自然な漢字の組み合わせを削除する
処理を行なう際、漢字と漢字との間の接続情報に
基づいて削除するか否かの処理を行なう文字処理
装置に関する。
従来漢字を取り扱う文字処理装置に於いて不自
然な漢字の組み合せをつくることを避ける為、不
自然な漢字の組み合せを作るのを被ける処理(今
後異常分割処理と称する)を行なつていた。
かかる異常分割処理の1例を示すと、仮名漢字
変換方式で、入力されたひらがな列によつてつく
られた同音異義語のテーブルより、不自然な漢字
の組み合せによる同音異義語を省く処理を行なう
ものである。
例えば{こと}と入力すれば、メモリー記憶さ
れている辞書より「事」という単語の他に読みが
「こ」である漢字と、同じく「と」である漢字を
組み合せて小途、小都、小従、個除、個都、個従
などの同音異義語をつくる。「こ」という読みの
漢字が前記辞書上に7個ありまた「と」という読
みの漢字が8個あつたとすると、8×7=56個の
同音異義語がつくられることになる。このまます
べての同音異義語をつくるのを許せば、収拾のつ
かない事態になる。
したがつて上記例の「こと」の場合には不自然
な同音異義語列をカナ漢字変換方式によつてつく
ることを避けるため、上記例「小途」などの漢字
の読み数が1―1であるような組み合せの同音異
義語はつくらず同様に漢字の読み数が1―2,2
―1,2―2であるような同音異義語列はつくら
ないような処理を異常分割処理にて行なつてい
る。
ここで言う「漢字の読み数」「組み合せ」とは、
前記辞書上に「相」および「違う」という漢字が
「あい」「ちがう」という読みで登録されていた場
合、前記漢字の「漢字の読み数」は共に2である
という、そして、これらの前記2つの漢字よりカ
ナ漢字変換方式によつて「相違う」という語をつ
くり出した場合、これは2―2の組み合せである
と呼ぶことにしている。
第6図には組み合せが2―2,2―1,1―
2,1―1である例を示す。
しかし、そうすると、「言訳」「乗越し」「相等
しい」などの文字を出力しようとすると前記辞書
上に「言」「訳」「乗」「越し」「相」「等しい」と
いう漢字があるにもかかわらず、異常分割処理さ
れ前記「言訳」「乗越し」「相等しい」などの文字
列を出力できないこととなる。
これを解決するためには、「言訳」「乗越し」
「相等しい」などの正当な文字列であるにもかか
わらず異常分割処理されてしまう文字列をすべて
記憶しなければならず、記憶容量が拡大するとい
う欠点があつた。
本発明の目的は上述の点に鑑み、各良した文字
処理装置を提供するものであります。
本発明の他の目的は漢字を組み合せるとき、第
1の漢字の接続情報を識別し前記第1の漢字に引
き続く第2の漢字を選択し組み合せる文字処理装
置を提供するものである。
本発明の他の目的は、すなわち「言訳」「乗越
し」「相等しい」「不確か」などのような使い方は
ある程度限られた語に多く、前記における「訳」、
「越し」、「等しい」などの第2番目の語は動詞、
形容詞が多い、したがつて「言」「乗」「相」など
の第1番目の語になりやすい語には前記辞書中の
接続情報に前記の使い方をする語である情報を入
れ異常分割処理においても、2語で構成する同音
異義語のうち、第1番目の語が前記情報を持ち、
第2番目の語が動詞、形容詞、形容動詞などの用
言である場合に限り、漢字の読みによる組み合せ
が1―1,1―2,2―1,2―2である同音異
義語もつくることにより、辞書メモリーも小さ
く、なおカナ漢字変換の効率もすぐれた文字処理
装置を提供することにある。
本発明による他の目的は以下図面を参照して行
なわれる実施例の説明より明らかとなるであろ
う。
次に第1図に示した全体構成の本発明文字処理
装置について説明する。
図示の構成において、1はマイクロプロセツサ
であり、2はアドレスバスであつて各入出力メモ
リの番地を指定する。また、3はデータバスであ
つて、各種のデータの転送に用いる双方向性のバ
スであり、4はコントロールバスであつて、各メ
モリ等のリード、ライト、インタラプトの受付
け、データセツトのタイミング等を伝送するため
に用いる。さらに、5はキーボードであつて、ア
ルフアベツトキー、平仮名キー等の各種のキーを
配設してあり、6はキーボードコントローラであ
る。キーボード5によつて入力したデータをキー
ボードコントローラ6によつてエンコードすると
ともに、インタープラト信号をコントロールバス
4に送出する。つぎに、7はCRTコントローラ
であり、CRT装置8、キヤラクタジエネレータ
9、リフレツシユメモリ10、リフレツシユメモ
リコントローラ11を制御する。また、8は
CRT装置であつて、通常のテレビジヨン受像機
と同様のデイスプレイを行なうことができ、9は
キヤラクタジエネレータであつて、文字コード、
文字パターンの行アドレス等のコード入力により
その文字パターンのうちその行のパターンを順次
に出力し、10はリフレツシユメモリであつて、
CRT装置8に表示する文字コードを記憶し、
CRTコントローラ7からの表示の指示に応じて
繰返しその文字コードを出力するものであり、1
1はリフレツシユメモリコントローラであつて、
CRTコントローラ7からの指示に応じてCRT表
示のための上述したリフレツシユサイクルとマイ
クロプロセツサ1からのデータの書込み、読出し
を制御する。さらに、12は読出し専用メモリ、
すなわち、いわゆるROMであつて、第3図に示
した制御手順を記憶するとともに各種の処理手順
を記憶させてある。また、13はROM12のコ
ントローラであり、14はランダムアクセスメモ
リ、すなわち、いわゆるRAMであつて、各種の
データの一時記憶に用いる。
図に示すように入力データを記憶するデータレ
ジスタINDR、単語辞書を構成するメモリWD、
同音異義語を格納するメモリJM及びメモリJM内
の同音異義語をアドレスするアドレス情報が格納
されるレジスタFLを有する。
上述のメモリWDについてさらに説明すると、
第2図に示す如く、かかるメモリWDに記憶され
る。
1単語はすべて9ワード構成とし、1ワードを
例えば16ビツトで構成する。
かかる構成の1単語のうち、初めの8バイトに
は読み情報を入れ、それから最初の4ワード分に
引続く次の3ワードには漢字コードを入れ、次の
1ワードには、文法情報を入れ、最後の1ワード
には接続情報を入れること図示のとおりである。
すなわち、この辞書の構成においては読み情報は
8文字までで、また漢字は3文字までである。
メモリWDはフロツピデイスク16に記憶され
る単語が処理の為に記憶される。
次に上述のメモリJMについてさらに説明する
と、第3図に示す如く、かかるメモリJMに記憶
される1単語はすべて7ワード構成とし1ワード
を16ビツトで構成する。
かかる構成の1単語のうち、初めの5ワードに
は単語コードを入れ、引き続く次の1ワードに
は、その同音異義語が何単語で構成されているか
の情報を入れ引き続く次の1ワードには他の同音
異義語に対してどの位確からしいかの値ウエイト
を入れる。
すなわちこの同音語テーブルの構成において
は、一つの同音異義語は最大5単語までである。
さらに、15はRAM14のコントローラであ
り、16はフリツピデイスクであり、単語を記憶
している。17はフロツピデイスク駆動装置であ
り、18はフロツピ駆動装置のコントローラであ
る。また、19はプリンタであり、20はプリン
タのコントローラである。
上述したような各構成要素からなる本発明文字
処理装置は、キーボード5からの入力によつて作
動するものであつて、キーボード5からの入力が
なされると、インタラプト信号がマイクロプロセ
サ1に伝えられて、ROM12内に記憶されてい
る制御手順に従つて文字処理に必要な各種の制御
動作を行なう。
上述の構成から成る実施例の作動を第4図を参
照して説明する。
まず、ステツプ21においてキーボードコント
ローラ6から読み出したデータをRAM14内の
入力データレジスタINDRに書き込み、ついでス
テツプ22において、カナ漢字変換開始のデータ
であるか否かを判別し、カナ漢字変換以外のデー
タであれば、ステツプ23において各種の入力処
理、例えば通常の英文字、仮名文字の入力や、文
字コードの入力等や各種の制御が行なわれる。か
かる入力処理は通常のワードプロセサ等により実
施されている入力処理と同様の処理を行なう。
一方、ステツプ22において入力データがカナ
漢字変換を指定するデータであつた場合にはまず
ステツプ24において、入力された平仮名列デー
タに従つて、メモリWD内の辞書より単語を抽出
し組み合せ第3図に示す同音異義語のテーブルを
メモリJMにつくる。
ついでステツプ25においてメモリJM内の同
音異義語のテーブルの中の一つの同音異義語を指
定するレジスタFLを0にセツトする。ステツプ
26において同音異義語テーブル中のすべての同
音異義語について処理が行なわれたか否かをレジ
スタFLの内容により判別し、すべての同音異義
語について処理が行なわれた場合、ステツプ31
に移る。
そうでない場合にはステツプ27に移り異常分
割であるか否かを判別し、異常分割でない場合は
ステツプ30へ移り、異常分割の場合はステツプ
28へ移る。ステツプ28において同音異義語が
2単語で構成されているか否かを判別し、2単語
で構成されている場合ステツプ32に移り、そう
でない場合にはステツプ29へ移る。
ステツプ29において同音異義語のテーブルよ
り現在レジスタFLにより指定されている同音異
義語を削除する。そしてステツプ30において、
カウントレジスタFLの内容を1つ増加させる。
ステツプ32において第1番目の単語に前述の
使い方をする語である情報が前記単語の接続情報
の中にあるか否かを判別し入つていない場合はス
テツプ29に移る。一方前記接続情報があつた場
合、ステツプ33に移り、第2番目の単語の接続
情報を見て動詞であるか否かを判別する。
前記単語が動詞である場合はステツプ35に移
り同様に動詞でない場合はステツプ34に移る。
ステツプ34において第2番目の単語の接続情
報を見て形容詞であるか否かを判別する。
前記単語が形容詞である場合はステツプ35に
移る。
同様に形容詞でない場合、ステツプ29に移
る。
ステツプ35においてレジスタFLのカウント
を一つ増加させる。
ステツプ31においてその他の処理、例えば、
各同音異義語の出現率のウエイト操作、表示装置
への表示処理などを行ない、一連の処理を終え
る。
次に本発明の他の実施例について説明する。
すなわち、上述した実施例においては、2単語
で構成されている同音異義語について述べたが、
3単語、4単語、5単語で構成されている同音異
義語についても、第5図に示すように、メモリに
記憶される各々の単語に同音異義語を構成する
際、なりうる単語の位置の情報も記憶させれば例
えば第5図では第1番目の単語の接続情報にAと
いう情報が入つていれば、第2番目の単語にはA
―2という情報、第3番目の単語にはA―3とい
う情報、第4番目の単語にはA―4という情報、
第5番目の単語にはA―5という情報が前記接続
情報の中に入つている単語を選んで同音異義語を
構成することもできる。
また前記情報は前記辞書中の接続情報の中に入
れたか、前記辞書中の文法情報の中に含めること
もできる。
同音異義語は5単語までとしたが、必要に応じ
て増加させることもできる。
また前記第4図フローチヤートのステツプ3
3、ステツプ34においては動詞と形容詞につい
て選択を行なつているが、すべての用言において
同様の判別をすることもできる。
以上、述べた如く、本発明によると、分割手段
によつて分割された結果、文字数に基づく異常分
割とみなされ従来は出力されなかつた漢字が、そ
の接続関係によつても評価され、その評価結果に
よつては、出力されるので、仮名漢字変換時の同
音異義語の数が少なく、しかも正確な漢字が得ら
れるという効果がある。
【図面の簡単な説明】
第1図は本発明文字処理装置の構成例を示すブ
ロツク線図、第2図は同じく単語辞書のICメモ
リもしくはメモリデイスク上における構成を示す
図、第3図は同じく同音異義語のテーブルの構成
を示す図、第4図は同じくその動作の態様を順次
示す制御手順図、第5図は同音異義語の構成を示
す線図であり第6図は「漢字の読み数」「組み合
せ」の例を示す説明図である。 1…マイクロプロセサ、2…アドレスバス、3
…データバス、4…コントロールバス、5…キー
ボード、6…キーボードコントローラ、7…
CRTコントローラ、8…CRT、9…キヤラク
タ、ジエネレータ、10…リフレツシユメモリ、
11…リフレツシユメモリ・コントローラ、12
…リードオンリメモリ(ROM)、13…ROMコ
ントローラ、14…ランダムアクセスメモリ
(RAM)、15…RAMコントローラ、16…フ
ロツピデイスク、17…フロツピ駆動装置、18
…フロツピ駆動コントローラ、19…プリンタ、
20…プリンタ・コントローラ。

Claims (1)

  1. 【特許請求の範囲】 1 仮名データを入力する入力手段と、 仮名データと該仮名データに対応する漢字デー
    タと該漢字データに引き続く漢字データに関する
    接続情報とを記憶した記憶手段と、 前記記憶手段を参照して、前記入力手段から入
    力された仮名データを対応する漢字データが存在
    する毎に分割する分割手段と、 前記分割手段による分割結果の文字数に基づく
    正当性を評価する第1評価手段と、 前記分割手段によつて分割された各仮名データ
    に対応する漢字データの間の接続関係を前記記憶
    手段の接続情報に基づき評価する評価手段と、 前記第1評価手段および前記第2評価手段の評
    価結果に従つて前記仮名データを該仮名データに
    対応する漢字データに変換する変換手段と、 を有することを特徴とする文字処理装置。
JP55167057A 1980-11-27 1980-11-27 Character processor Granted JPS5790781A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55167057A JPS5790781A (en) 1980-11-27 1980-11-27 Character processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55167057A JPS5790781A (en) 1980-11-27 1980-11-27 Character processor

Publications (2)

Publication Number Publication Date
JPS5790781A JPS5790781A (en) 1982-06-05
JPH024940B2 true JPH024940B2 (ja) 1990-01-31

Family

ID=15842594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55167057A Granted JPS5790781A (en) 1980-11-27 1980-11-27 Character processor

Country Status (1)

Country Link
JP (1) JPS5790781A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0630101B2 (ja) * 1984-09-25 1994-04-20 株式会社リコー 仮名漢字変換方式

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5429939A (en) * 1977-08-11 1979-03-06 Agency Of Ind Science & Technol Japanese setence alalyzer
JPS54139356A (en) * 1978-04-21 1979-10-29 Toshiba Corp Kana-chinese character converter
JPS5549771A (en) * 1978-10-02 1980-04-10 Canon Inc Character processing unit
JPS5617468A (en) * 1979-07-20 1981-02-19 Fujitsu Ltd *kana* japanese syllabary *kanji* chinese character converter
JPS56157563A (en) * 1980-05-08 1981-12-04 Canon Inc Character processing device
JPS56157567A (en) * 1980-05-08 1981-12-04 Canon Inc Character procession device

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5429939A (en) * 1977-08-11 1979-03-06 Agency Of Ind Science & Technol Japanese setence alalyzer
JPS54139356A (en) * 1978-04-21 1979-10-29 Toshiba Corp Kana-chinese character converter
JPS5549771A (en) * 1978-10-02 1980-04-10 Canon Inc Character processing unit
JPS5617468A (en) * 1979-07-20 1981-02-19 Fujitsu Ltd *kana* japanese syllabary *kanji* chinese character converter
JPS56157563A (en) * 1980-05-08 1981-12-04 Canon Inc Character processing device
JPS56157567A (en) * 1980-05-08 1981-12-04 Canon Inc Character procession device

Also Published As

Publication number Publication date
JPS5790781A (en) 1982-06-05

Similar Documents

Publication Publication Date Title
JPH024938B2 (ja)
JPH024940B2 (ja)
JP2616628B2 (ja) キー入力装置
JPH0410104B2 (ja)
JPH0115906B2 (ja)
JPS6246029B2 (ja)
JPS5814688B2 (ja) 同音異義語順次表示を行なう漢字まじり文入力装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JP3577741B2 (ja) 文字入力装置
JPS59184941A (ja) 漢字コ−ド変換方法
JPS5832418B2 (ja) 漢字まじり文入力装置
JPS6162970A (ja) 仮名漢字変換装置
JPH0724057B2 (ja) 電子機器
JPH0685169B2 (ja) 文書処理方式
JPS6336551B2 (ja)
JPH01200470A (ja) 文字処理装置
JPS61180360A (ja) 文書編集装置
JPH03271967A (ja) 文書処理装置
JPH0680508B2 (ja) 文字処理装置
JPS62260266A (ja) カナ漢字変換方式
JPH0566761U (ja) 日本語かな漢字変換装置
JPS6275761A (ja) 文字列処理装置
JPH01237877A (ja) 漢字変換方式
JPH04120656A (ja) 文書処理装置
JPH10187700A (ja) 文書処理装置