JPH03202951A - 日本語文章処理装置 - Google Patents

日本語文章処理装置

Info

Publication number
JPH03202951A
JPH03202951A JP1344206A JP34420689A JPH03202951A JP H03202951 A JPH03202951 A JP H03202951A JP 1344206 A JP1344206 A JP 1344206A JP 34420689 A JP34420689 A JP 34420689A JP H03202951 A JPH03202951 A JP H03202951A
Authority
JP
Japan
Prior art keywords
word
kana
conversion
registered
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1344206A
Other languages
English (en)
Inventor
Hiroshi Yamada
洋志 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1344206A priority Critical patent/JPH03202951A/ja
Publication of JPH03202951A publication Critical patent/JPH03202951A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は文章処理装置に関し、特に文章の入力にかな
漢字変換を用いる日本語文章処理装置に関する。
(従来の技術) 従来、この種の文章処理装置のかな漢字変換部では、変
換用辞書にない単語を含む文章を入力する場合には利用
者が単語を変換用辞書に登録されている単語に分割して
変換してい、た、あるいは予め単語を登録しておくこと
もできた。しかしいずれにしても非常に時間と手間がか
かる作業であった。
利用者の手間を省くために利用者によって一度行われた
修正の結果を自動的に辞書に登録して2回目以降の変換
に利用する方式もある(例えば公開特許公報昭和64−
29962号)。
この方式では修正の行われた範囲の長さと修正の回数で
単語の範囲を判定して単8登録を行う。
すなわち、 1、°修正した部分が一箇所だけの場合は直前の修正の
行われていない単語とまとめて一つの単語として登録す
る。
2、修正前は文節末であった位置を越えて修正した場合
は越えたところまでを一つの単語として登録する。
3、上記1又は2のいずれでもなければ修正した範  
 囲を一つの単語として登録する。
という処理を行う。
例えば「不可視光線をあてる」という文章を入力しよう
として「不可視」という単語がないために「更かし光線
」と変換されたとする。利用者が「不」 「可」 「視
」を1文字ずつ区切って変換しなおすと「不可視」が一
つの*iとして登録される。
(発明が解決しようとする課B) 従来の方式では、前記の例の「不可視」のようにひとま
とまりの単語は登録されても「可視」のような修正箇所
に含まれている単語は登録されない、すなわち従来の方
式では、利用者によって修正された部分をひとまとまり
の単語として登録するか、あるいは単に長さをもとにし
て一つの単語のIP、囲を判定していたから、修正され
た部分の一部だけが前後にあって修正の行われなかった
単語と合わせて一つの単語だった場合や、修正範囲が複
数の単語だった場合に適当な新語を抽出することが出来
ないという問題がある。
(課題を解決するための手段) 本発明の日本語文章処理装置は、文字を入力するための
入力装置と、単語の読み、表記、品詞、品詞間接枝情報
を登録した変換用辞書と、該変換用辞書を参照すること
により前記入力装置から入力されたかな又はローマ字列
を漢字かな混じり文に変換するかな漢字変換部と、該か
な漢字変換部でなされた変換の結果を表示する出力装置
と、前記入力装置から入力された情報に基づく前記かな
漢字変換部において修正された変換の結果から前記変換
用辞書に登録されていない単語を抽出する新語抽出部を
有する日本語文章処理装置であって、前記新語抽出部は
、修正された単語列および該単語列における部分単語列
のうちで前記変換用辞書に登録されていない単語を抽出
することを特徴とする。
(作用) この発明によれば、かな漢字変換の結果に対し求める文
章を得るための修正が行われた場合で、修正された部分
が幾つかに分割出来る場合は、分割したものも登録の対
象とする。そこで、本発明の装置の採用により、修正範
囲が複数の単語だった場合にも適当な新語を抽出するこ
とが出来る。
(実施PA) 以下、実施例を挙げることにより本発明を一層詳しく説
明する。
第1図は本発明の一実施例である装置の構成を表すブロ
ック図である0図において、1はかな文字や変換結果の
修正操作を入力するためのキーボードなどの入力装置、
2は変換結果の確認などに用いるCRTなどの表示装置
、3は入力されたかな文字列をかな漢字変換し、また利
用者の指示にしたがって変換結果の修正を行うかな漢字
変換部、4はかな漢字変換に用いる変換用辞書、5は入
力されたかな文字列を一時記憶する入力メモリ、6はか
な漢字変換結果を記憶しておく出力メモリ、7は出力メ
モリ6の内容を参照して変換用辞書4に登録されていな
い単語を抽出し、変換用辞書4に登録する新語登録部で
ある。
次に本実施例の動作を説明する。
第2図は本実施例におけるかな漢字変換部3の動作の一
例を示す流れ図である。以下、第2図にしたがってかな
漢字変換部3の動作を説明する。
21、入力装置1からかな文字列を入力し入力メモリ5
に蓄積する。
22、利用者からの変換指示や句読点文字の入力などに
よってかな漢字変換を行い結果を出力メモリ6に入れ、
出力装置2によって利用者に提示する。第4図は出力メ
モリ6の内容の一例を表す概念図である。第4図で文章
は単語ごとに区切られている。第4図の41の欄は単語
の読み、42の枕は単語の表記を示し、43の欄はその
単語に対する修正が行われた場合にONl、行われてい
ない場合にOFFになる。
23、入力装置1から現在の出力メモリ6の結果に対す
る修正がないことを指示する入力(例えば確定キーの押
下)があった場合は処理を終える。
24、結果の修正指示が入力された場合は指示にしたが
って同音選択、文節区切りの変更、一部分の再変換など
を行う、その際修正の行われた単語には修正は行われた
ことを示すフラグを付ける。第5図は修正後の出力メモ
リ6の内容の一例を表す概念図である。
第5図では修正が行われた単語の柵43がONになって
いる。第5図の例は例えば、「不可視光線をあてる」 という文章を入力しようとして「不可視」という単語が
ないために、利用者が「不」「可」 「視」を1文字ず
つ区切って変換しなおした場合に相当する。
25、修正が終了したならば、新語登録部7に制御を移
す、新語登録部7が作業を終えるとかな漢字変換部3に
制御が戻され、動作を終了する。
第3図は新B登録部7の動作の一例を表す流れ図である
。以下第3図に沿って新語登録部7の動作を説明する。
31、出力メモリ6に修正フラグの付いた単語がなけれ
ば処理を終わる。
32、出力メモリ6から連続した位置にある修正フラグ
の付いた単語列を取り出す、取り出した単語列をWl、
W2. ・−、Wn (n≧1)とする、取り出された
単語列の修正フラグはOFFにする。
33、取り出した単語列の部分列W i 、 W f 
+ 1 。
・・・、WJ(1≦i≦j≦n)をすべて作る。
34、部分列を一つの単語と見做し変換用辞書4に登録
する。ただし既に変換用辞書4に登録されている単語は
登録しない、ステップ34を終えるとステップ31へ戻
る。
以下では第5図の例を用いて新語登録部7の動作を具体
的に説明する。
31、修正フラグがONになっている単語の列があるの
で新語登録処理を行う。
32、修正フラグがONになっている単語の列、不()
)、可(力)、視(シ) を取り出す、出力メモリ6中での上記3単語の修正フラ
グをOFFにする。
33、取り出された単語列の部分列をすべて作り下記の
6単語が得られる。
“不可視(フカシ)”不可(フカ)” “不())″ “可視(カシ)”可(力)” “視(シ)” 34、変換用辞書4を検索し、登録されていない“不可
視(フカシ)”と“可視(カシ)″を変換用辞書4に登
録する(どの単語が登録されているかは変換用辞書によ
って異なるが、説明のため“不可(フカ)” “不())”可(力)”、“視(シ)”が既に登録され
ているものとする)。
こ0結果、以後のかな漢字変換では“不可視(フカシ)
”と“可視(カシ)”というjli語が既登録単語とし
て使われることになる。
以下では、本発明の別の実施例について説明する。
第6図は本発明の第2の実施例である装置の構成を表す
ブロック図である。第6図の1.2.34.5.6は第
1図の同番号のものと同じなので説明を省略する。67
は、出力メモリ6の内容を参照して変換用辞書4に登録
されていない単語を抽出し、新語辞書8に登録し、新語
辞書8に登録されている単語のうち頻度が一定以上にな
ったものを変換用辞書4に登録する新語登録部である。
第8図は新語辞書8の一例を表す概念図である。第8図
で81の欄は単語の読み、82の欄は単語の表記、83
の欄は単語の出現頻度を示している。
第7図は新語登録部67の動作の一例を表す流れ図であ
る。以下第7図に沿って新8登録装置7の動作を説明す
る。
71、出力メモリ6に修正フラグの付いた単語がノ なければ処理を終わる。・ 72、出力メモリ6から連続した位置にある修正フラグ
の付いた単語列を取り出す、取り出した単語列をW 1
 、 W2、−、 Wn (n≧1)とする、取り出さ
れた単語列の修正フラグはOFFにする。
73、取り出しな単語列の部分列W i 、 W i 
+1 。
・・・、Wj(1≦1≦j≦n)をすべて作る。
74、部分列を一つの単語と見做し変換用辞書8に登録
する。ただし既に変換用辞14に登録されている単語は
登録しない、その後、新語辞書8に登録されている単語
で頻度が一定値(例えば3)以上になったものを単語辞
書4に登録し、新語辞書8から削除する。ステップ74
を終えるとステップ71へ戻る。
以下では第5図の例を用いて新語登録部67の動作を具
体的に説明する。
71、修正フラグがONになっている単語の列があるの
で新語登録処理を行う。
72、修正フラグがONになっている単語の列、不()
)、可(力)、視(シ〉 を取り出す、出力メモリ6中での上記3単語の修正フラ
グをOFFにする。
73、取り出された単語列の部分列をすべて作り下記の
6単語が得られる。
“不可視(フカシ)″   “不可(フカ)”“不()
)#  “可視(カシ)” “可(力)”視(シ)” 74、変換用辞書4を検索し、登録されていない“不可
視(フカシ)”と“可視(カシ)”を新語辞書8に登録
する(どの単語が登録されているかは変換用辞書によっ
て異なるが、説明のため“不可〈フカ)”不 ())”可(力)”視(シ)”が 既に登録されているものとする)、新語辞書8にそれま
で第8図の単語が登録されていたとすると、“不可視(
フカシ)”が新たに登録され、“可視(カシ)”の頻度
が1増えて3になる。′可視(カシ)”の頻度が3以上
になったので“可視(カシ)”を変換用辞書4に登録し
新語辞書8がら削除する。
この結果、以後のかな漢字変換では“可視(カシ)″と
いう単語が既登録単語として使われることになる。
(発明の効果) かな漢字変換の結果に対して利用者が行った修正をもと
にして、変換用の辞書に登録されていなかった単語を自
動的に登録できる。
また修正された箇所が複数の単語であったり修正された
置所の一部だけが新しい単語だった場合にも適切な単語
を登録することができ、利用者の負担を軽減できる。
出力メモJ6の内容の一例を表す概念図、第5図は修正
後の出力メモリ6の内容の一例を表す概念図、第6図は
本発明の第2の実施例の構成を表すブロック図、第7図
はこの第6図実施例におけるる新語登録部67の動作の
一例を表す流れ図、第8図は新語辞書8の一例を表す概
念図である。
l・・・入力装置、2・・・出力装置、3・・・かな漢
字変換部、4・・・変換用辞書、5・・・入力メモリ、
6・・・出力メモリ、7.67・・・新語登録部、8・
・・新語辞書。

Claims (1)

    【特許請求の範囲】
  1. 文字を入力するための入力装置と、単語の読み、表記、
    品詞、品詞間接続情報を登録した変換用辞書と、該変換
    用辞書を参照することにより前記入力装置から入力され
    たかな又はローマ字列を漢字かな混じり文に変換するか
    な漢字変換部と、該かな漢字変換部でなされた変換の結
    果を表示する出力装置と、前記入力装置から入力された
    情報に基づく前記かな漢字変換部において修正された変
    換の結果から前記変換用辞書に登録されていない単語を
    抽出する新語抽出部を有する日本語文章処理装置におい
    て、前記新語抽出部は、修正された単語列および該単語
    列における部分単語列のうちで前記変換用辞書に登録さ
    れていない単語を抽出することを特徴とする日本語文章
    処理装置。
JP1344206A 1989-12-28 1989-12-28 日本語文章処理装置 Pending JPH03202951A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1344206A JPH03202951A (ja) 1989-12-28 1989-12-28 日本語文章処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1344206A JPH03202951A (ja) 1989-12-28 1989-12-28 日本語文章処理装置

Publications (1)

Publication Number Publication Date
JPH03202951A true JPH03202951A (ja) 1991-09-04

Family

ID=18367452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1344206A Pending JPH03202951A (ja) 1989-12-28 1989-12-28 日本語文章処理装置

Country Status (1)

Country Link
JP (1) JPH03202951A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5655128A (en) * 1992-02-20 1997-08-05 Canon Kabushiki Kaisha Electronic dictionary

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5655128A (en) * 1992-02-20 1997-08-05 Canon Kabushiki Kaisha Electronic dictionary

Similar Documents

Publication Publication Date Title
US20070242071A1 (en) Character Display System
JPH03202951A (ja) 日本語文章処理装置
JPS6210763A (ja) 仮名漢字変換処理装置
JPH0350668A (ja) 文字処理装置
JP3184035B2 (ja) 単文節カナ漢字変換入力方式
JPS613267A (ja) 仮名漢字変換処理装置
JPH0736878A (ja) 同音異義語選択装置
JPS6327960A (ja) 文書作成装置
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JPH10154141A (ja) かな漢字変換装置
JPH0628396A (ja) 電子化辞書装置
JPS63316162A (ja) 文書作成装置
JPS6365566A (ja) カナ漢字変換装置
JPH03160555A (ja) 日本語入力装置
JPS6142064A (ja) 日本語入力制御方式
JPH07129566A (ja) かな漢字変換処理装置
JPH0394367A (ja) 日本語入力方式
JP2002358299A (ja) 文書処理装置及び文書処理プログラム
JPH01316865A (ja) かな漢字変換の読み入力機能付加装置
JPH05266065A (ja) 機械翻訳装置
JPS63120363A (ja) 日本語処理方法および装置
JPS6175471A (ja) 連字学習方式
JPS63310066A (ja) かな漢字変換方法
JPS63214872A (ja) かな漢字変換方式
JPS63206860A (ja) 情報処理装置