JPH09153034A - 文書作成装置及び文書作成方法 - Google Patents

文書作成装置及び文書作成方法

Info

Publication number
JPH09153034A
JPH09153034A JP7311049A JP31104995A JPH09153034A JP H09153034 A JPH09153034 A JP H09153034A JP 7311049 A JP7311049 A JP 7311049A JP 31104995 A JP31104995 A JP 31104995A JP H09153034 A JPH09153034 A JP H09153034A
Authority
JP
Japan
Prior art keywords
character
sentence
character string
unknown word
notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7311049A
Other languages
English (en)
Inventor
Keiji Saito
啓司 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7311049A priority Critical patent/JPH09153034A/ja
Publication of JPH09153034A publication Critical patent/JPH09153034A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】本発明は、キーの打ち間違いによって生じた未
知語を修正するための置換え候補をユーザに提示出力可
能としたことを特徴とする。 【解決手段】文章を記憶する文章記憶部102と、文章
中から1文章を切り出す1文章取得部104と、その文
章を形態素に分割する形態素解析部105と、この形態
素解析部105より未知語と判断された文字列を記憶す
る未知語記憶部106と、その未知語からひらがな表記
となっている部分を取り出すひらがな表記取得部107
と、そのひらがな表記中の1文字とその文字がかな入力
のキーボード配置上で隣り合っている文字とを置き換え
た文字列を生成する置き換え文字列生成部107と、置
き換えた文字列が辞書中に存在するかどうかを検索する
辞書検索部114とを具備し、未知語と判断された文字
列と1文字違いである語句を出力部103に出力しユー
ザに提示することを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、日本語文章中の未
知語訂正機能の改善を図った文書作成装置、及び文書作
成方法に関する。
【0002】
【従来の技術】従来、文書作成装置にあっては、かな入
力字のキーの打ち間違いによって生じた未知語を修正す
るための置き換え候補を、ユーザに提示出力するような
ものは存在しなかった。従ってキーの打ち間違いによっ
て入力された文字列に対しては、誤った入力文としてそ
のまま気付かずに放置され、又は誤って入力された文字
列を消去した後、改めて入力し直していた。
【0003】
【発明が解決しようとする課題】上述したように、従来
の文書作成装置では、かな入力字のキーの打ち間違いに
よって生じた未知語を修正するための置き換え候補を、
ユーザに提示出力するようなものはなかったので、キー
の打ち間違いによって生じた未知語は気付かずにそのま
ま放置されるか、又は誤った部分を消去して再び打ち直
すしかなく、入力文書の信頼性、訂正時に於ける操作性
等、種々の面で問題があった。
【0004】そこで、本発明は上記不具合を解消し、キ
ーの打ち間違いによって生じた未知語を修正するための
置換え候補をユーザに提示出力可能にした文書作成装
置、及び文書作成方法を提供することを目的とする。
【0005】
【課題を解決するための手段】本発明は、上記目的を達
成するため、文章を記憶する文章記憶手段と、文章中か
ら1文章を切り出す1文章取得手段と、その文章を形態
素に分割する形態素解析手段と、この形態素解析手段よ
り未知語と判断された文字列を記憶する未知語記憶手段
と、その未知語からひらがな表記となっている部分を取
り出すひらがな表記取得手段と、そのひらがな表記中の
1文字とその文字がかな入力のキーボード配置上で隣り
合っている文字とを置き換えた文字列を生成する置き換
え文字列生成手段と、置き換えた文字列が辞書中に存在
するかどうかを検索する辞書検索手段とを具備し、未知
語と判断された文字列と1文字違いである語句を提示す
ることを特徴とする文書作成装置にある。
【0006】又、本発明は上記目的を達成するため、文
章を記憶する文章記憶手段と、文章中から1文章を切り
出す1文章取得手段と、その文章を形態素に分割する形
態素解析手段と、この形態素解析手段より未知語と判断
された文字列を記憶する未知語記憶手段と、その未知語
からひらがな表記となっている部分を取り出すひらがな
表記取得手段と、そのひらがな表記中の1文字をローマ
字表記に変換する表記変換手段と、そのローマ字表記に
用いられたアルファベット中の1文字とその文字がアル
ファベット入力のキーボード配置上で隣り合っている文
字とを置き換えたローマ字列を生成する置き換え文字列
生成手段と、置き換えた文字列がローマ字表記としてか
な文字に置き換えられる場合にそのかな文字を表記変換
手段で対象となったかな文字の代わりに用いて別のかな
文字列を生成するかな文字列生成手段とを具備し、生成
した文字列と読みが似た語句を提示出力することを特徴
とする文書作成装置にある。
【0007】更に、本発明は上記目的を達成するため、
文章を記憶する文章記憶手段と、文章中から1文章を切
り出す1文章取得手段と、その文章を形態素に分割する
形態素解析手段と、この形態素解析手段より未知語と判
断された文字列を記憶する未知語記憶手段と、その未知
語からひらがな表記となっている部分を取り出すひらが
な表記取得手段と、そのひらがな表記中の1文字をロー
マ字表記に変換する表記変換手段と、そのローマ字表記
に変換する表記変換手段と、そのローマ字列から得られ
るすべてのパターンのひらがな文字列を生成するひらが
な文字列生成手段と、生成した文字列が辞書中に存在す
るかどうかを検索する辞書検索手段とを具備し、未知語
と判断された文字列に似た語句を提示出力するようにし
たを特徴とする文書作成装置にある。
【0008】更に、本発明は上記目的を達成するため、
文章を記憶し、文章中から1文章を切り出して、その文
章に形態素解析を施し、その結果として未知語と判断さ
れた文字列を記憶し、その未知語からひらがな表記とな
っている部分を取り出し、そのひらがな表記中の1文字
とその文字がかな入力キーのキーボード配置上で隣り合
っている文字とを置き換えた文字列を生成し、置き換え
た文字列が辞書中に存在するかどうかを検索することに
より、未知語と判断された文字列と1文字違いであり、
且つ辞書中に存在する語句を提示出力することを特徴と
する文書作成方法にある。
【0009】更に、本発明は上記目的を達成するため、
文章を記憶し、文章中から1文章を切り出して、その文
章に形態素解析を施し、その結果として未知語と判断さ
れた文字列を記憶し、その未知語からひらがな表記とな
っている部分を取り出し、そのひらがな表記中の1文字
をローマ字表記に変換し、そのローマ字表記に用いられ
たアルファベット中の1文字とその文字がアルファベッ
ト入力キーボード配置上で隣り合っている文字とを置き
換えたローマ字列を生成し、置き換えた文字列がローマ
字表記としてかな文字に置き換えられた場合にそのかな
文字を表記変換時に対象となったかな文字の代わりに用
いて別のかな文字列を生成し、生成した文字列が辞書中
に存在するかどうかを検索することにより、未知語と判
断された文字列と読みが似た語句を提示出力することを
特徴とする文書作成方法にある。
【0010】更に、本発明は上記目的を達成するため、
文章を記憶し、文章中から1文章を切り出して、その文
章に形態素解析を施し、その結果として未知語と判断さ
れた文字列を記憶し、その未知語からひらがな表記とな
っている部分を取り出し、そのひらがな表記中の1文字
をローマ字表記に変換し、そのローマ字列から得られる
すべてのパターンのひらがな文字列を生成し、それらの
生成した文字列が辞書中に存在するかどうかを検索する
ことにより、未知語と判断された文字列に似た語句をユ
ーザに提示することを特徴とする文書作成方法にある。
【0011】上記構成によれば、文章に形態素解析を施
すことにより、未知語を検出することができる。又、そ
の未知語がユーザのキーの打ち間違いから生じたものと
仮定し、入力時のキー配列において隣り合うキーを打っ
た場合の文字列を生成し、それらの文字列のうち辞書中
から検索されたものを置き換え候補としてユーザに提示
出力することができる。
【0012】
【発明の実施の形態】以下、図面を参照して本発明の一
実施の形態を説明する。尚、本発明の実施形態に係る装
置は一般的なワークステーションやワードプロセッサ中
に実現されるものである。
【0013】図1は文書作成装置に於ける本発明の実施
の形態に係わる部分の構成を示すブロック図である。図
1に於いて、入力部101は、ユーザが文字を入力した
り、コマンドを入力する部分であり、具体的にはキーボ
ードやペン、マウス等である。
【0014】文章記憶部102は、処理対象となる文章
を記憶する部分であり、具体的にはフロッピーディスク
装置や、ハードディスク装置、メモリ等である。出力部
103は、対象となる文書、未知語、及びその訂正候補
や、制御部からのメッセージ等を表示し出力する部分で
あり、具体的にはディスプレイやプリンタ等である。
【0015】104乃至114はそれぞれマイクロプロ
セッサ及び制御記憶、RAM等により実現される文書処
理装置の一部の構成要素である。これらの各構成要素の
うち、1文章取得部104は、文章記憶部102に保存
された文書中から1文章を切り出す部分である。
【0016】形態素解析部105は、1文章取得部10
4に於いて取り出された文章を形態素単位で解析して、
未知語を得る部分であり、取得した未知語を未知語記憶
部106に記憶する。
【0017】ひらがな表記取得部107は、未知語記憶
部106に記憶された未知語から、ひらがな表記となっ
ている部分を取り出す部分である。置き換え文字列生成
部108は、ひらがな表記取得部107で得られた、ひ
らがな表記中の1文字を選択し、その文字をキーボード
配置上で隣り合っている文字と置き換えて、その置き換
えた文字列を生成する部分である。
【0018】置き換えローマ字列生成部110は、表記
変換部109で得られたローマ字列中の1文字を選択
し、その文字と、その文字がアルファベット入力キーの
キーボード配置上で隣り合っている文字とを置き換えた
ローマ字列を生成する部分である。
【0019】かな文字列生成部111は、置き換えロー
マ字列生成部110で得られたローマ字列が、かな文字
に置き換えられる場合に、そのかな文字を表記変換部1
09にて選択された文字と置き換えて、別のかな文字列
を生成する部分である。
【0020】ローマ字表示変換部112は、ひらがな表
記取得部107で選択された、ひらがな表記全てをロー
マ字表記に変換する部分である。ひらがな文字列生成部
113は、ローマ字表示変換部112で得られたローマ
字表記を、ひらがなに変換する場合に、考えられる全て
のパターンのひらがな文字列を生成する部分である。
【0021】辞書検索部114は、置き換え文字列生成
部108や、かな文字列生成部111、ひらがな文字列
生成部113等で得られた、ひらがな文字列が辞書中に
存在するか否かを検索する部分である。
【0022】図2は上記図1に示す文書作成装置により
実行される、本発明の実施形態による部分の処理手順を
示すフローチャートである。図2に於いて、ステップS
1は、ユーザが用いている日本語入力手段をユーザがシ
ステムに通達する情報を入力したり、読み込む文書デー
タを指定したりする初期化のステップである。この場合
の日本語入力手段とは、かな入力を日本語キーボードの
かなキーを用いて行っているか、或いはアルファベット
キーによるローマ字入力を用いているかのいずれかを指
す。この情報は、ステップS7に於ける処理の分岐に反
映される。又、直接ステップS7に於ける処理の分岐を
指定することもできる。
【0023】ステップS3は、ステップS2で読み込ん
だデータから1文を切り出すステップであり、1文章取
得部104が、文章記憶部102に保存された文書中か
ら1文章を切り出す。
【0024】ステップS4は、ステップS3で切り出さ
れた文章に形態素解析を施し、未知語と判断された語を
未知語記憶部106に記憶するステップであり、形態素
解析部105が、1文章取得部104により取り出され
た文章を形態素単位で解析して、未知語を得、取得した
未知語を未知語記憶部106に記憶する。
【0025】ステップS5は、処理対象となる文書が終
わりか否かを判定するステップであり、処理対象となる
文書の終わりであればステップS6へ分岐し、そうでな
い場合はステップS3へ分岐する。
【0026】ステップS6は、ステップS4に於いて、
未知語記憶部106に記憶された未知語を1つ取り出
し、更にそこからひらがな部分を切り出すステップであ
り、ひらがな表記取得部107が、未知語記憶部106
に記憶された未知語から、ひらがな表記となっている部
分を取り出す。
【0027】ステップS7は、ステップS1でユーザが
指定した日本語入力手段によって処理を分岐させる、又
は、直接ユーザが指定した処理へ分岐させるステップで
ある。ユーザの直接の指定がない場合、「かなキー入
力」はステップS8へ、又「ローマ字入力」はステップ
S9、及びステップS11のそれぞれに分岐する。
【0028】ステップS8は、ステップS6で取得され
た、ひらがな中の1文字を選び、その文字と、その文字
のかな入力がキーボード配置上で隣り合っている文字と
を置き換えた文字列を生成するステップであり、置き換
え文字列生成部108が、ひらがな表記取得部107で
得られたひらがな表記中の1文字を選択し、その文字を
キーボード配置上で隣り合っている文字と置き換える。
【0029】ステップS9は、ステップS6で取得され
たひらがな中の1文字を選び、その文字をローマ字表記
に変換するステップである。ステップS11は、ステッ
プS6で取得されたひらがな文字列すべてをローマ字表
記に変換するステップである。
【0030】ステップS12は、ステップS11で得ら
れたローマ字表記をひらがなに変換した場合に得られる
全てのひらがな文字列を生成するステップである。ステ
ップS13は、ステップS8、ステップS10及びステ
ップS12で得られたかな文字列をステップS6に於い
て切り出された残りの非ひらがな文字列と連結し、辞書
中にそれが存在するか否かを検索するステップである。
【0031】ステップS14は、ステップS13に於い
て辞書中から検索された語を未知語の置き換え候補とし
て、ユーザに提示するステップである。ステップS15
は、ステップS14で提示された置き換え候補を参考に
してユーザが未知語を修正するステップである。
【0032】ステップS16は、ユーザが未知語の修正
処理を継続するか否かを選択するステップである。継続
が選択された場合にはステップS6へ、そうでない場合
は処理を終了する。
【0033】ここで上記した図1及び図2を参照して本
発明の実施形態に於ける文書作成装置の動作を説明す
る。尚、図2に示すフローチャートのステップS7から
先は3つの部分に分れ、それぞれ処理が異なるので各々
処理別に説明する。
【0034】先ず、ユーザに日本語の入力時に使用した
日本語入力手段を選択させる。この場合の入力手段と
は、かな漢字変換時のひらがなの入力に、日本語キーボ
ードのかなキーによるかな入力を用いたか、或いはアル
ファベットキーによるローマ字入力を用いたかのいずれ
かを指す。ここでは、未知語の訂正候補の生成に於い
て、3つの種類の方法を用いるので、それらを直接ユー
ザが指定することも可能とする。3つの方法とは、
(1)かなキー入力時のキーの打ち間違いによって未知
語が生じたと仮定した場合の方法、(2)ローマ字入力
時のキーの打ち間違いによって未知語が生じたと仮定し
た場合の方法、(3)ローマ字入力時のローマ字の可読
冗長性(ローマ字列「na」が「な」とも「んあ」とも
読める)によって未知語が生じた場合の方法のいずれか
を指す。
【0035】処理対象となる文書を読み込み、出力部1
03の表示画面上に表示させる(ステップS2)。次
に、その文書中から1文を切り出す。即ち、1文章取得
部104が、文章記憶部102に保存された文書中から
1文章を切り出す(ステップS3)。
【0036】切り出した1文に対して、形態素解析を施
し、その結果未知語と判断された文字列を未知語記憶部
106に記憶する。即ち形態素解析部105は、1文章
取得部104に於いて取り出された文章を形態素単位で
解析して未知語を得ると、その未知語を未知語記憶部1
06に記憶する(ステップS4)。
【0037】処理対象となる文章データの切り出しが全
て終わっておらず、処理するデータが残っているとき
は、次の文章を切り出す処理(ステップS3)へ戻り、
又、文章データの全ての切り出しが終了したならば次の
処理へ移る(ステップS5)。
【0038】次に、得られた未知語を未知語記憶部10
6から1つ取り出し、ひらがな部分があるか否かをチェ
ックし、あればその部分を取り出す。即ち、ひらがな表
記取得部107は、未知語記憶部106に記憶された未
知語から、ひらがな表記となっている部分を取り出す。
(ステップS6)。
【0039】以下に未知語の例と取り出されるひらがな
文字列を示す。 (例文1) 「今日は心地ゆい天気ですね。」→(未知
語:「心地ゆい」)→(ひらがな文字列:「ゆい」) (例文2) 「つたい時もある。」→(未知語:「つた
い」)→(ひらがな文字列:「つたい」) (例文3) 「それはとんでもんあい。」→(未知語:
「んあい」)→(ひらがな文字列:「んあい」) 上記したそれぞれの例文はキーの打ち間違いによって生
じた未知語の例であり、正しくは(例文1)「今日は心
地よい天気ですね。」、(例文2)「つらい時もあ
る。」、(例文3)「それはとんでもない。」となる。
【0040】以下にこの未知語を訂正するための置き換
え候補を提示する手段について説明する。 (1)かなキー入力時のキーの打ち間違いによって未知
語が生じたと仮定した場合を先程の例文1を対象にして
説明する。
【0041】ここでは、ひらがな文字列「ゆい」が、か
なキー入力時に、隣の別のキーを打ち間違えて生じたも
のとし、「ゆ」あるいは「い」と隣り合うかなキーを挙
げてみると、以下のようになる。但し、キーの配列はキ
ーボードの種類によって異なる場合があるので、その場
合はキーボードに合わせてキーが選ばれる。
【0042】 「ゆ」に隣り合うキー;「や」、「よ」 「い」に隣り合うキー;「て」、「す」 「ゆい」から1文字を選択し、それを隣り合うキーの文
字に置き換える(ステップS8)。
【0043】結果として得られる文字列は、以下のよう
になる。(2文字以上が打ち間違っている場合は考えな
い)。 「ゆ」を選択した場合の置き換え候補:「やい」、「よ
い」 「い」を選択した場合の置き換え候補:「ゆて」、「す
て」 以上が、かなキー入力時のキーの打ち間違いによって未
知語が生じたと仮定した場合の文字の置き換え例であ
る。
【0044】(2)ローマ字入力時のキーの打ち間違い
によって未知語が生じたと仮定した場合を先程の例文2
を対象にして説明する。ここでは、ひらがな文字列「つ
たい」がローマ字入力のアルファベットキー入力時に隣
の別のキーを打ち間違えて生じたものとする。
【0045】「つたい」のうちの「つ」を取り出し、ロ
ーマ字表記に変換すると、「tsu」あるいは「tu」
となる。更に、ここから1文字を選び、それを隣り合う
キーを挙げてみると、以下のようになる。
【0046】 「t」に隣り合うキー:「r」、「y」 「s」に隣り合うキー:「a」、「d」 「u」に隣り合うキー:「y」、「i」 ここで、「tsu」の中の「t」が打ち間違いであると
すると、正しいキー入力の候補は「rsu」あるいは
「ysu」ということになるが、どちらもローマ字表記
としては不可読となるので、置き換えはされない。
【0047】次に「tsu」の中の「s」が打ち間違い
であるとすると、正しいキー入力の候補は「tau]あ
るいは「tdu]ということになる。この場合、「ta
u」は「たう」という読みが可能であるので、置き換え
ることにする(ステップS9)。
【0048】置き換えた文字列は「たうたい」となる
(ステップS10)。このようにして、ひらがな1文字
を選択し、ローマ字に変換し、さらに1文字を選んで隣
り合うキーを代入して文字列を生成してゆくと、「つた
い」に対しては以下のような候補が挙げられることにな
る。
【0049】「つ」を選択した場合の置き換え候補:
「たうたい」、「つぃたい」、「るたい」、「ゆた
い」、「ちたい」 「た」を選択した場合の置き換え候補:「つらい」、
「つやい」 「い」を選択した場合の置き換え候補:「つたう」、
「つたお」 以上が、ローマ字入力時のキーの打ち間違いによって未
知語が生じたと仮定した場合の文字の置き換え例であ
る。
【0050】(3)ローマ字入力時のローマ字の可読冗
長性によって未知語が生じた場合を先程の例文3を対象
にして説明する。ここでは、ひらがな文字列「んあい」
がローマ字入力の可読冗長性から生じたものとする。
【0051】「んあい」をローマ字表記に変換してみる
と「nai」となる(ステッブS11)。これを更にひ
らがな表記に戻すと、ローマ字の区切り方によって以下
のような2通りの読み方ができる。 「nai」→「んあい」,「ない」 これらのひらがな文字列のうち、もとの文字列と同一で
ないものを置き換え候補とする(ステップS12)。
【0052】以上の(1)(2)(3)の処理の結果、
各々の例文に対して以下のような文字列が生成されたこ
とになる。 (例文1):「やい」、「よい」、「ゆて」、「すて」 (例文2):「たうたい」、「つぃたい」、「るた
い」、「ゆたい」、「ちたい」、「つらい」、「つや
い」、「つたう」、「つたお」 (例文3):「ない」 これらの文字列について辞書検索を施す(ステップS1
3)。
【0053】更に、辞書中に見出し語として登録された
語だけを取り出し、未知語の訂正候補としてユーザに提
示する(ステップS14)。上記例文の場合、以下のよ
うになる。この場合はそれぞれ候補が1つずつしか提示
されないが、一般には複数の候補が提示されたり、候補
がなかったりする場合がある。
【0054】 (例文1):「よい」 (例文2):「つらい」 (例文3):「ない」 この後、ユーザは提示された情報を参考にして未知語の
訂正を行う(ステップS15)。
【0055】更に、未知語の訂正を継続するか否かを選
択する(ステップS16)。このように、文章に形態素
解析を施すことで未知語を検出し、その未知語がユーザ
のキーの打ち間違いから生じたものと仮定して、入力時
のキー配列に於いて隣り合うキーを打った場合の文字列
を生成し、それらの文字列のうち、辞書中から検索され
たものを置き換え候補としてユーザに提示出力する機能
をもつことにより、キーの打ち間違いによって生じた未
知語に気付かずにそのまま放置した際の信頼性の低下を
回避できる。又、誤った部分を消去して再び打ち直す、
面倒な操作が不要となり、訂正時に於ける操作性が向上
する。
【0056】
【発明の効果】以上詳記したように本発明によれば、文
章に形態素解析を施すことにより、未知語を検出するこ
とができる。又、その未知語がユーザのキーの打ち間違
いから生じたものと仮定し、入力時のキー配列において
隣り合うキーを打った場合の文字列を生成し、それらの
文字列のうち辞書中から検索されたものを置き換え候補
としてユーザに提示することができる。即ち、キーの打
ち間違いによって生じた未知語を修正するための置換え
候補をユーザに提示出力することができ、これにより、
キーの打ち間違いによって生じた未知語に気付かずにそ
のまま放置した際の信頼性の低下を回避できるととも
に、誤った部分を消去して再び打ち直す、面倒な操作が
不要となり、訂正時に於ける操作性が向上するという優
れた効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施の形態に係る文書作成装置の構
成を示すブロック図。
【図2】同実施の形態の動作を説明するためのフローチ
ャート。
【符号の説明】
101…入力部、102…文章記憶部、103…出力
部、104…1文章取得部、105…形態素解析部、1
06…未知語記憶部、107…ひらがな表記取得部、1
08…置き換え文字列生成部、109…表記変換部、1
10…置き換えローマ字列生成部、111…かな文字列
生成部、112…ローマ字表示変換部、113…ひらが
な文字列生成部、114…辞書検索部。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 文章を記憶する文章記憶手段と、 文章中から1文章を切り出す1文章取得手段と、 その切り出された文章を形態素に分割する形態素解析手
    段と、 この形態素解析手段より未知語と判断された文字列を記
    憶する未知語記憶手段と、 その未知語からひらがな表記となっている部分を取り出
    すひらがな表記取得手段と、 そのひらがな表記中の1文字とその文字がかな入力のキ
    ーボード配置上で隣り合っている文字とを置き換えた文
    字列を生成する置き換え文字列生成手段と、 置き換えた文字列が辞書中に存在するか否かを検索する
    辞書検索手段とを具備し、未知語と判断された文字列と
    1文字違いである語句を提示することを特徴とする文書
    作成装置。
  2. 【請求項2】 文章を記憶する文章記憶手段と、 文章中から1文章を切り出す1文章取得手段と、 その切り出された文章を形態素に分割する形態素解析手
    段と、 この形態素解析手段より未知語と判断された文字列を記
    憶する未知語記憶手段と、 その未知語からひらがな表記となっている部分を取り出
    すひらがな表記取得手段と、 そのひらがな表記中の1文字をローマ字表記に変換する
    表記変換手段と、 そのローマ字表記に用いられたアルファベット中の1文
    字とその文字がアルファベット入力のキーボード配置上
    で隣り合っている文字とを置き換えたローマ字列を生成
    する置き換え文字列生成手段と、 置き換えた文字列がローマ字表記としてかな文字に置き
    換えられる場合に、そのかな文字を表記変換手段で対象
    となったかな文字の代わりに用いて別のかな文字列を生
    成するかな文字列生成手段とを具備し、生成した文字列
    と読みが似た語句を提示出力することを特徴とする文書
    作成装置。
  3. 【請求項3】 文章を記憶する文章記憶手段と、 文章中から1文章を切り出す1文章取得手段と、 その文章を形態素に分割する形態素解析手段と、 この形態素解析手段より未知語と判断された文字列を記
    憶する未知語記憶手段と、 その未知語からひらがな表記となっている部分を取り出
    すひらがな表記取得手段と、 そのひらがな表記中の1文字をローマ字表記に変換する
    表記変換手段と、 そのローマ字列から得られるすべてのパターンのひらが
    な文字列を生成するひらがな文字列生成手段と、 生成した文字列が辞書中に存在するか否かを検索する辞
    書検索手段とを具備し、未知語と判断された文字列に似
    た語句を提示出力するようにしたを特徴とする文書作成
    装置。
  4. 【請求項4】 文章中から1文章を切り出して、その文
    章に形態素解析を施し、その結果として未知語と判断さ
    れた文字列を記憶し、その未知語からひらがな表記とな
    っている部分を取り出し、そのひらがな表記中の1文字
    とその文字がかな入力キーのキーボード配置上で隣り合
    っている文字とを置き換えた文字列を生成して、置き換
    えた文字列が辞書中に存在するか否かを検索することに
    より、未知語と判断された文字列と1文字違いで且つ辞
    書中に存在する語句を提示出力することを特徴とする文
    書作成方法。
  5. 【請求項5】 記憶した文章中から1文章を切り出し
    て、その文章に形態素解析を施し、その結果として未知
    語と判断された文字列を記憶し、その未知語からひらが
    な表記となっている部分を取り出し、そのひらがな表記
    中の1文字をローマ字表記に変換し、そのローマ字表記
    に用いられたアルファベット中の1文字とその文字がア
    ルファベット入力キーボード配置上で隣り合っている文
    字とを置き換えたローマ字列を生成し、置き換えた文字
    列がローマ字表記としてかな文字に置き換えられた場合
    にそのかな文字を表記変換時に対象となったかな文字の
    代わりに用いて別のかな文字列を生成し、生成した文字
    列が辞書中に存在するか否かを検索することにより、未
    知語と判断された文字列と読みが似た語句を提示出力す
    ることを特徴とする文書作成方法。
  6. 【請求項6】 記憶した文章中から1文章を切り出し
    て、その文章に形態素解析を施し、その結果として未知
    語と判断された文字列を記憶し、その未知語からひらが
    な表記となっている部分を取り出し、そのひらがな表記
    中の1文字をローマ字表記に変換し、そのローマ字列か
    ら得られるすべてのパターンのひらがな文字列を生成
    し、それらの生成した文字列が辞書中に存在するか否か
    を検索することにより、未知語と判断された文字列に似
    た語句をユーザに提示することを特徴とする文書作成方
    法。
JP7311049A 1995-11-29 1995-11-29 文書作成装置及び文書作成方法 Pending JPH09153034A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7311049A JPH09153034A (ja) 1995-11-29 1995-11-29 文書作成装置及び文書作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7311049A JPH09153034A (ja) 1995-11-29 1995-11-29 文書作成装置及び文書作成方法

Publications (1)

Publication Number Publication Date
JPH09153034A true JPH09153034A (ja) 1997-06-10

Family

ID=18012500

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7311049A Pending JPH09153034A (ja) 1995-11-29 1995-11-29 文書作成装置及び文書作成方法

Country Status (1)

Country Link
JP (1) JPH09153034A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010257022A (ja) * 2009-04-22 2010-11-11 Kddi Corp 修正候補取得装置、修正候補取得システム、修正候補取得方法、修正候補取得プログラム
JP2011113097A (ja) * 2009-11-21 2011-06-09 Kddi R & D Laboratories Inc 未知語を含む文章を修正するための文章修正プログラム、方法及び文章解析サーバ
JP2011215938A (ja) * 2010-03-31 2011-10-27 Ntt Docomo Inc データ入力端末及び修正候補提示方法
JP2013069182A (ja) * 2011-09-26 2013-04-18 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
KR20160026039A (ko) * 2014-08-29 2016-03-09 주식회사 큐키 오타 수정 방법
KR101684681B1 (ko) * 2016-08-08 2016-12-20 김영길 오타 문자 수정 방법

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010257022A (ja) * 2009-04-22 2010-11-11 Kddi Corp 修正候補取得装置、修正候補取得システム、修正候補取得方法、修正候補取得プログラム
JP2011113097A (ja) * 2009-11-21 2011-06-09 Kddi R & D Laboratories Inc 未知語を含む文章を修正するための文章修正プログラム、方法及び文章解析サーバ
JP2011215938A (ja) * 2010-03-31 2011-10-27 Ntt Docomo Inc データ入力端末及び修正候補提示方法
JP2013069182A (ja) * 2011-09-26 2013-04-18 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
KR20160026039A (ko) * 2014-08-29 2016-03-09 주식회사 큐키 오타 수정 방법
KR101684681B1 (ko) * 2016-08-08 2016-12-20 김영길 오타 문자 수정 방법
WO2018030601A1 (ko) * 2016-08-08 2018-02-15 김영길 오타 문자 수정 방법

Similar Documents

Publication Publication Date Title
US5835924A (en) Language processing apparatus and method
US5214583A (en) Machine language translation system which produces consistent translated words
EP0686286B1 (en) Text input transliteration system
KR101425182B1 (ko) 타이핑 효율을 증강시키기 위한 타이핑 후보생성방법
JPH0793328A (ja) 綴り不適切訂正装置
US5890183A (en) Method, apparatus, electronic dictionary and recording medium for converting converted output into character code set accetpable for re-retrieval as original input
JPH09153034A (ja) 文書作成装置及び文書作成方法
Szanser Automatic error-correction in natural languages
JPH07334499A (ja) 文字列入力装置
Saharia et al. LuitPad: a fully unicode compatible Assamese writing software
JPH10232863A (ja) かな漢字変換装置および方法、並びに記録媒体
JP3103179B2 (ja) 文書作成装置及び文書作成方法
JPH10320399A (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JP3377942B2 (ja) 電子辞書検索装置および電子辞書検索装置制御用プログラムを記憶したコンピュータ読取可能な記憶媒体
JP3285149B2 (ja) 外国語電子辞書検索方法及び装置
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JPS60164864A (ja) デ−タ処理装置
JPH07200605A (ja) 翻訳装置
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
Kawada Inputting Japanese from the keyboard
JPH0728800A (ja) 文字処理方法および文字処理装置
JPH0773174A (ja) 日本語処理システム
JPS60189573A (ja) 文字変換装置
JPH0962672A (ja) 日本語入力装置