JPH0421063A - 自然言語処理装置 - Google Patents

自然言語処理装置

Info

Publication number
JPH0421063A
JPH0421063A JP2121207A JP12120790A JPH0421063A JP H0421063 A JPH0421063 A JP H0421063A JP 2121207 A JP2121207 A JP 2121207A JP 12120790 A JP12120790 A JP 12120790A JP H0421063 A JPH0421063 A JP H0421063A
Authority
JP
Japan
Prior art keywords
kana
kanji
character type
conversion
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2121207A
Other languages
English (en)
Inventor
Keiichi Sakai
桂一 酒井
Minoru Fujita
稔 藤田
Tsuyoshi Yagisawa
津義 八木沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2121207A priority Critical patent/JPH0421063A/ja
Publication of JPH0421063A publication Critical patent/JPH0421063A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は日本語ワードプロセッサ等の日本語文を処理す
る自然言語処理装置に関するものである。
[従来の技術] 従来のワードプロセッサ等の自然言語処理装置では、仮
名漢字変換する際に予め辞書中に指定された優先順位に
従って変換文字が決定される。
[発明が解決しようとしている課題] しかしながら、上記従来の装置では仮名の漢字への変換
を極力進めるため、漢字が多くなり過ぎて読みづらい文
章になってしまう等の欠点があった。
本発明は、前記従来の欠点を除去し、漢字の比率を調整
して読みやすい文章を作成する自然言語処理装置を提供
する。
[課題を解決するための手段] この課題を解決するために、本発明の自然言語処理装置
は、入力された仮名文を仮名漢字変換する仮名漢字変換
手段と、前記仮名漢字変換手段で仮名漢字変換された結
果と入力仮名文とを文節毎に対応させて保持する保持手
段と、文中の所定字種の含有率を設定する字種率設定手
段と、前記保持手段に保持された仮名漢字変換の結果と
入力仮名文とに基づいて、前記字種率設定手段により設
定された字種の含有率に対応した仮名漢字変換の結果を
出力する変換結果出力手段とを備える。
ここで、前記保持手段は、仮名漢字変換された結果及び
仮名の漢字数と仮名数とを保持し、前記変換結果出力手
段は、前記漢字数と仮名数との組み合わせによる所定字
種の含有率を計算して、前記字種率設定手段により設定
された含有率に対応させる。
[作用] かかる構成において、所定字種の含有率を設けて仮名漢
字変換を制御することにより、読みやすい文章を作成で
きるようにしたものである。
[実施例] 以下、添付図面に従って、本発明の詳細な説明する。
第1図は本実施例の自然言語処理装置の構成を示す図で
あり、第2図は本実施例の自然言語処理装置を実現する
システムの構成を示す図である。
1は文保持部であり、キーボード25から入力された文
字列を格納するバッファであり、第2図のRAM23の
ソースバッファSBにより実現される。2は文保持部1
に格納された文字列の仮名漢字変換部である。3は仮名
漢字変換部2によって分割された文節の仮名表記、変換
表記。
字種計算処理部4で求められる字種、及び漢字にするか
仮名にするかのフラグを格納するバッファであり、第2
図のRAM23のキャラクタバッファCBにより、後述
の第4図、第5図のようなテーブル形式で表される。4
は字種計算処理部であり、字種保持部3に格納された仮
名及び変換表記の各文字種の数を求めて、再び字種保持
部3に返す。なおフラグの初期値はすべて“漢字”とす
る。
5は予め文体により異なり、文に含まれる漢字の比率を
格納するバッファであり、第2図のRAM23のレート
バッファRBにより実現される。6は字種率判定部であ
り、字種保持部3に格納されたデータから文中の漢字の
比率を求め、字種率保持部5に格納された値と比較して
、漢字の比率が高いと判定されれば上の文節から順次仮
名表記に戻す文節を決定する。7は字種置換部であり、
字種保持部3のフラグの値に従って変換表記あるいは仮
名表記を選択して、変換結果保持部8に出力する。又、
字種率判定部6で仮名表記に戻すと決定された文節に対
しては、字種保持部3のフラグを“仮名”にすることに
より仮名表記に置換する。8は字種置換部7から受けと
った出力変換結果を格納するバッファで、第2図のRA
M23のゴールバッファGBにより実現される。
ここで、第2図の構成をさらに具体的に説明する。21
は第3図に示すような制御手順(後述する)を記録する
制御メモリ(以下P M EM)である。PMEM21
はROM(リードオンリメモリ)の形でもよいし、RA
M (ランダムアクセスメモリ)の形でもよい。22は
PMEM21に記憶されている制御手順に従って論理・
判断・演算を行う中央処理装置(以下CPU)である。
23はメモリ(以下MEM)であり、文保持部SB、字
種保持部CB、字種率保持部RB、変換結果保持部GB
を有している。24は辞書等を格納するディスク装置で
ある。25は入力文の入力装置として用いるキーボード
(KB)  26は変換結果の出力装置としてのデイス
プレィ(CRT)である。
次に、第3図に示す動作フローチャートを参照して、本
実施例の自然言語処理装置の動作手順について説明する
まず、入力文が文保持部1に保持されるまでステップS
1が繰り返される。入力文が文保持部1に保持されると
、ステップS2で文保持部1に保持されている文が仮名
漢字変換部2で仮名漢字変換される。そして、その変換
結果が字種保持部3の変換表記項目及び仮名表記項目に
保持される。ここで、字種保持部3は第4図、第5図に
示すように、仮名/漢字を示すフラグ、変換表記時の漢
字数及び仮名数、仮名表記、仮名表記時の仮名数の対応
表の状態で記憶保持している。
例えば、”従って素晴らしい効果が上がった”という文
の場合は、まずステップS2で第4図の変換表記項目及
び仮名表記項目が保持される。
ステップS2が終了するとステップS3に移り、字種保
持部3に保持されている変換表記と仮名表記の漢字と仮
名の字種計算が行われる。
そして、その計算結果が字種保持部3の変換表記の漢字
数項目及び仮名数項目、仮名表記の仮名数項目に保持さ
れる。例えば“素晴らしい”という変換表記に対しては
漢字数2.仮名数3が保持され、それに対応する“すば
らしい“という仮名表記に対しては仮名数5が保持され
る。さらに、ここで、字種保持部3のフラグ項目に本実
施例では漢字変換表記を優先しているので“漢字”を保
持する。
ステップS3が終了するとステップS4に移り、字種保
持部3に保持されている漢字数項目と仮名数項目とを参
照して字種率判定部6により漢字含有率が計算されて、
その漢字含有率と字種率保持部5に格納されている値が
比較され、字種率保持部5に格納されている漢字含有率
の値の範囲内にあるか否かが判断される。
漢字含有率は下式 の演算を行うことによって演算される。ここで、全漢字
数とはフラグが“漢字”である変換表記漢字数項目の漢
字数の和で、全仮名数とはフラグが“漢字”の変換表記
の仮名数項目の仮名数とフラグが“仮名”の仮名表記の
仮名数項目の仮名数との和である。
従って、第4図のような仮名漢字変換直後の状態では、 となる。
ステップS4で予め設定された範囲内にあるときは、ス
テップS6の結果保持部に移り、範囲内にないときはス
テップS5に進んで、ステップS4−35を繰り返すこ
とによって、字種保持部3に保持されている変換表記を
仮名表記に上から順次戻すことによって、字種率保持部
5に格納された値の範囲内に収まるようにする。このと
き、字種保持部中の仮名表記に戻す文節のフラグ項目は
“仮名”に変更する。ステップS6においては、字種保
持部3に保持されているフラグ項目の値に基づいて変換
表記あるいは仮名表記を選択して、変換結果保持部8に
保持する。
例えば、漢字含有率30%以下として置換した場合、第
4図では含有率4o%なので、まず第5図のように“従
って”が仮名表記“したがって”となる。この結果の含
有率は、 となり、30%以下の条件を満足し、変換結果は”した
がって素晴らしい効果が上がった”となる。
なお、上記実施例においては、字種置換処理においては
上から順次置換する場合を説明したが、他のたとえば仮
名漢字変換時に得られる文節の品詞を更に字種保持部に
保持し、その品詞に基づいて置換する順序を決定しても
よい。
また、上記実施例においては、字種保持部に漢字表記項
目を1つの仮名表記につき1個として説明したが、他の
たとえば“よみこむ”に対し“読み込む”と“読みこむ
”のように複数個保持してもよい。
また、上記実施例1こおいて字種率保持部においては、
格納される値をあらかじめ装置に固定されているものと
して説明したが、他のたとえば利用者が与えてもよい。
また、上記実施例においては、字種保持部に同じ単語が
格納される場合については特別な処理を行わずに説明し
たが、別途頻度項目を設けて置換する場合には同時に行
ってもよい。
また、上記実施例においては、漢字含有率を全漢字数と
全仮名数のみから求めたが、全仮名数の代わりにその他
の文字記号、例えば句読点。
括弧などを含んだものとしてもよい。
更に、字種率は仮名含有率でもよく、仮名表記を基準に
変換表示に変更する手順をとってもよい。
以上説明したように、本実施例によれば、漢字仮名の字
種の比率を考慮したチエツクを行うようにしたので読み
やすい文を作成することができる効果がある。
[発明の効果] 本発明により、漢字の比率を調整して読みやすい文章を
作成する自然言語処理装置を提供できる。
【図面の簡単な説明】
第1図は本実施例の自然言語処理装置の構成を示すブロ
ック図、 第2図は本実施例の自然言語処理装置を実現するシステ
ムの構成を示すブロック図、第3図は本実施例の自然言
語処理装置の動作手順を説明するためのフローチャート
、第4図は字種保持部の構成例を説明する図、第5図は
漢字含有率30%以下で置換した第4図の置換結果を示
す図である。 図中、1・・・文保持部、2・・・仮名漢字変換部、3
・・・字種保持部、4・・・字種計算処理部、5・・・
字種率保持部、6・・・字種率判定部、7・・・字種置
換部、8・・・変換結果保持部、21・・・制御メモリ
、22・・・中央処理装置(CPU) 、23・・・R
AM、24・・・ディスク装置、25・・・キーボード
(KB)   26・・・デイスプレィ(CRT)SB
・・・ソースバッファ、CB・・・キャラクタバッファ
、RB−・・レートバッファ、GB・・・ゴールバッフ
ァである。 ぢ’iト:= 第 図 第3 図 第4 図 第5図

Claims (2)

    【特許請求の範囲】
  1. (1)入力された仮名文を仮名漢字変換する仮名漢字変
    換手段と、 前記仮名漢字変換手段で仮名漢字変換された結果と入力
    仮名文とを文節毎に対応させて保持する保持手段と、 文中の所定字種の含有率を設定する字種率設定手段と、 前記保持手段に保持された仮名漢字変換の結果と入力仮
    名文とに基づいて、前記字種率設定手段により設定され
    た字種の含有率に対応した仮名漢字変換の結果を出力す
    る変換結果出力手段とを備えることを特徴とする自然言
    語処理装置。
  2. (2)前記保持手段は、仮名漢字変換された結果及び仮
    名の漢字数と仮名数とを保持し、 前記変換結果出力手段は、前記漢字数と仮名数との組み
    合わせによる所定字種の含有率を計算して、前記字種率
    設定手段により設定された含有率に対応させることを特
    徴とする自然言語処理装置。
JP2121207A 1990-05-14 1990-05-14 自然言語処理装置 Pending JPH0421063A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2121207A JPH0421063A (ja) 1990-05-14 1990-05-14 自然言語処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2121207A JPH0421063A (ja) 1990-05-14 1990-05-14 自然言語処理装置

Publications (1)

Publication Number Publication Date
JPH0421063A true JPH0421063A (ja) 1992-01-24

Family

ID=14805526

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2121207A Pending JPH0421063A (ja) 1990-05-14 1990-05-14 自然言語処理装置

Country Status (1)

Country Link
JP (1) JPH0421063A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5941728A (en) * 1996-03-01 1999-08-24 Yazaki Corporation Cover member of press-connecting connector

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5941728A (en) * 1996-03-01 1999-08-24 Yazaki Corporation Cover member of press-connecting connector

Similar Documents

Publication Publication Date Title
US5214583A (en) Machine language translation system which produces consistent translated words
JPH0421063A (ja) 自然言語処理装置
JPS60189069A (ja) かな漢字変換装置
JPS60254367A (ja) 文章分析装置
JP2915225B2 (ja) 文書作成装置
JPH07110807A (ja) 文書読み上げ装置
JP2714238B2 (ja) 文字処理装置
JPH0350668A (ja) 文字処理装置
JPS5899828A (ja) カナ漢字変換処理装置
JP2798931B2 (ja) 中国語の語音区切方式および語音漢字変換方式
JP2802369B2 (ja) かな漢字変換装置
JPS5870345A (ja) 漢字索引方式
JPH07129566A (ja) かな漢字変換処理装置
JPH0619771B2 (ja) 文字処理装置
JPH03286252A (ja) 文生成装置
JPH07210571A (ja) 単語検索処理装置及び単語検索処理方法
JPH05120331A (ja) 同音異義語認識装置
JPH0414168A (ja) 文書作成装置
JPH0610804B2 (ja) かな漢字変換装置
JPH0477856A (ja) ルビ変換機能付き文字処理装置
JPH04552A (ja) 仮名漢字変換装置
JPH10154141A (ja) かな漢字変換装置
JPS6258371A (ja) 文生成装置
JPH02288945A (ja) 日本語処理装置
JPH08287055A (ja) 日本語変換装置