JPH11259472A - 文字列処理装置、文字列処理方法および文字列処理プログラムを記憶した媒体 - Google Patents
文字列処理装置、文字列処理方法および文字列処理プログラムを記憶した媒体Info
- Publication number
- JPH11259472A JPH11259472A JP10054657A JP5465798A JPH11259472A JP H11259472 A JPH11259472 A JP H11259472A JP 10054657 A JP10054657 A JP 10054657A JP 5465798 A JP5465798 A JP 5465798A JP H11259472 A JPH11259472 A JP H11259472A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- warning
- word
- synonym
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【課題】入力された文が、同じ単語を繰り返し使用した
単調な文になっていないかをチェックする。 【解決手段】入力された文を検査単位である文節に分割
し、各文節に含まれる主要単語の出現頻度をカウントす
る。このカウント値が1文中で4回などの所定値以上に
なった場合には、この単語を使いすぎであるとして警告
を発するとともに、この単語に置き換えるべき類義語を
検索して置換候補としてリスト表示する。ユーザはこの
リストのなかから適当なものを選択することにより、同
じ単語の使いすぎを容易に解消することができる。
単調な文になっていないかをチェックする。 【解決手段】入力された文を検査単位である文節に分割
し、各文節に含まれる主要単語の出現頻度をカウントす
る。このカウント値が1文中で4回などの所定値以上に
なった場合には、この単語を使いすぎであるとして警告
を発するとともに、この単語に置き換えるべき類義語を
検索して置換候補としてリスト表示する。ユーザはこの
リストのなかから適当なものを選択することにより、同
じ単語の使いすぎを容易に解消することができる。
Description
【0001】
【発明の属する技術分野】この発明は、与えられた文字
列内で同じ単位文字列が繰り返し使用されているかを検
査して警告する文字列処理装置、文字列処理方法および
文字列処理プログラムを記憶した媒体に関する。
列内で同じ単位文字列が繰り返し使用されているかを検
査して警告する文字列処理装置、文字列処理方法および
文字列処理プログラムを記憶した媒体に関する。
【0002】
【従来の技術】今日のインターネットの普及に伴い、文
書を用いた電子メール、ネットニュースなどの情報交換
が頻繁に行われるようになってきている。このための文
書作成は、日本語,英語,中国語,韓国語などの使用言
語に応じた言語入力システム(IME)を利用して、コ
ンピュータ上で直接行われている。
書を用いた電子メール、ネットニュースなどの情報交換
が頻繁に行われるようになってきている。このための文
書作成は、日本語,英語,中国語,韓国語などの使用言
語に応じた言語入力システム(IME)を利用して、コ
ンピュータ上で直接行われている。
【0003】
【発明が解決しようとする課題】しかし、従来の言語入
力システムにおける連文節解析アルゴリズムでは、ユー
ザが入力した情報をそのまま対象言語に変換して入力す
るものであるが、大抵のユーザは知っている語彙数が少
ないので、1つの文書で同じ語彙を繰り返し使用するこ
とになり、読むときに理解しにくいものになるという問
題点があった。特に、英語の場合は、同じ意味の言葉で
も類義語を用いて言いまわしを変えるのが一般的である
が、これができないため稚拙な文章となってしまう問題
点があった。
力システムにおける連文節解析アルゴリズムでは、ユー
ザが入力した情報をそのまま対象言語に変換して入力す
るものであるが、大抵のユーザは知っている語彙数が少
ないので、1つの文書で同じ語彙を繰り返し使用するこ
とになり、読むときに理解しにくいものになるという問
題点があった。特に、英語の場合は、同じ意味の言葉で
も類義語を用いて言いまわしを変えるのが一般的である
が、これができないため稚拙な文章となってしまう問題
点があった。
【0004】しかし、その一方で、類義語を用いて言い
まわしを変えようとする場合には、通常の単語変換用の
基本辞書とは別に専用の類義語辞書を検索する必要があ
り手間がかかるという問題点があった。
まわしを変えようとする場合には、通常の単語変換用の
基本辞書とは別に専用の類義語辞書を検索する必要があ
り手間がかかるという問題点があった。
【0005】この発明はこのような課題に鑑みてなされ
たものであって、同じ単語を繰り返し使用していないか
チェックし、場合によっては類義語を自動的に提示する
を備えた文字列処理装置、文字列処理方法および文字列
処理プログラムを記憶した媒体を提供することを目的と
する。
たものであって、同じ単語を繰り返し使用していないか
チェックし、場合によっては類義語を自動的に提示する
を備えた文字列処理装置、文字列処理方法および文字列
処理プログラムを記憶した媒体を提供することを目的と
する。
【0006】
【課題を解決するための手段】この発明は、同じ文字列
の使用回数を計数し、頻繁に(所定値以上)使用された
文字列について警告を発するものである。請求項1の発
明は、上記課題を解決するため、与えられた文を単語や
文節等の文字列に分割する手段と、各文字列の前記与え
られた文中での出現回数を計数する手段と、出現回数が
所定値以上の文字列について警告を発する警告手段と、
を備えたことを特徴とする。文を分割した文字列は、単
語や文節などの単位にすればよく、より長い「句」程度
のものを単位としてもよい。また、前記所定値は文全体
における出願回数の値としてもよいが、文の所定文字数
毎に出現回数を集計した場合の値としてもよい。
の使用回数を計数し、頻繁に(所定値以上)使用された
文字列について警告を発するものである。請求項1の発
明は、上記課題を解決するため、与えられた文を単語や
文節等の文字列に分割する手段と、各文字列の前記与え
られた文中での出現回数を計数する手段と、出現回数が
所定値以上の文字列について警告を発する警告手段と、
を備えたことを特徴とする。文を分割した文字列は、単
語や文節などの単位にすればよく、より長い「句」程度
のものを単位としてもよい。また、前記所定値は文全体
における出願回数の値としてもよいが、文の所定文字数
毎に出現回数を集計した場合の値としてもよい。
【0007】また、単に警告を発するのみでは、ユーザ
がどのように文を入力すればよいかが分からなくなる可
能性があるため、請求項2の発明は、与えられた文から
分割された文字列と置き換える類似文字列を予め記憶し
た類似辞書を備え、前記警告手段に、前記出現回数が所
定値以上の文字列に対する類似文字列を前記類似辞書か
ら検索して置換候補として提示する置換候補検索手段を
含むことを特徴としている。このように、類似文字列を
表示することにより、ユーザは出現回数が所定値以上の
文字列に代えてこの類似文字列を用いることができ、書
き換えが容易になる。なお、類似辞書に登録しておく類
似文字列としては意味的に類似する類義語などを用いれ
ばよい。
がどのように文を入力すればよいかが分からなくなる可
能性があるため、請求項2の発明は、与えられた文から
分割された文字列と置き換える類似文字列を予め記憶し
た類似辞書を備え、前記警告手段に、前記出現回数が所
定値以上の文字列に対する類似文字列を前記類似辞書か
ら検索して置換候補として提示する置換候補検索手段を
含むことを特徴としている。このように、類似文字列を
表示することにより、ユーザは出現回数が所定値以上の
文字列に代えてこの類似文字列を用いることができ、書
き換えが容易になる。なお、類似辞書に登録しておく類
似文字列としては意味的に類似する類義語などを用いれ
ばよい。
【0008】上記警告手段や置換候補検索手段が不要な
ユーザもいるため、請求項3の発明は、前記置換候補検
索手段の動作の有効/無効を設定する手段を備えたこと
を特徴とし、請求項4の発明は、前記警告手段の動作の
有効/無効、および、前記所定値のうち一方または両方
を設定する手段を備えたことを特徴としている。これに
より、置換候補検索手段や警告手段そのものをオン/オ
フすることができる。また、同じ文字列を何度使用すれ
ば警告を発するかの所定値を設定できるようにしたこと
により、ユーザの文書作成形態に合わせた設定が可能で
ある。
ユーザもいるため、請求項3の発明は、前記置換候補検
索手段の動作の有効/無効を設定する手段を備えたこと
を特徴とし、請求項4の発明は、前記警告手段の動作の
有効/無効、および、前記所定値のうち一方または両方
を設定する手段を備えたことを特徴としている。これに
より、置換候補検索手段や警告手段そのものをオン/オ
フすることができる。また、同じ文字列を何度使用すれ
ば警告を発するかの所定値を設定できるようにしたこと
により、ユーザの文書作成形態に合わせた設定が可能で
ある。
【0009】
【発明の実施の形態】図1は、この発明の実施形態であ
る文書処理装置の機能ブロック図である。この文書処理
装置は、ユーザ入出力部1、連文節解析処理部2、辞書
検索部3、基本辞書4、同語使用回数判定部5、同語使
用警告部6および自動類義語表示部10からなってい
る。自動類義語表示部10は、類義語解析処理部7,類
義語辞書検索部8および類義語辞書9からなっている。
る文書処理装置の機能ブロック図である。この文書処理
装置は、ユーザ入出力部1、連文節解析処理部2、辞書
検索部3、基本辞書4、同語使用回数判定部5、同語使
用警告部6および自動類義語表示部10からなってい
る。自動類義語表示部10は、類義語解析処理部7,類
義語辞書検索部8および類義語辞書9からなっている。
【0010】ユーザ入出力部1は、入力機能部と出力機
能部を有し、入力機能部は、文書処理装置を操作するユ
ーザが、文書(かな文字列)を入力するとともにこの文
書処理装置の機能の設定を行う機能部であり、出力機能
部は、かな漢字変換された文書を表示するとともに、同
語の使用頻度が所定値を超えているときにはその警告を
表示する機能部である。
能部を有し、入力機能部は、文書処理装置を操作するユ
ーザが、文書(かな文字列)を入力するとともにこの文
書処理装置の機能の設定を行う機能部であり、出力機能
部は、かな漢字変換された文書を表示するとともに、同
語の使用頻度が所定値を超えているときにはその警告を
表示する機能部である。
【0011】ユーザ入出力部1から入力されたかな文字
列は、連文節解析処理部2に入力される。連文節解析処
理部2は、かな文字列から文節を推定するとともに、推
定された文節の文脈内での候補を絞り込んだのち、この
かな文字列を辞書検索部3に入力する。辞書検索部3
は、入力された文節単位のかな文字列で基本辞書4を検
索し、この文字列を前記文脈にあった単語に変換してこ
の検索結果を連文節解析処理部2に返信する。一般的に
文節は名詞や動詞などの主要な単語と助詞や助動詞など
の補助的な単語からなるが、辞書検索部3はこのうち主
要な単語を抽出して基本辞書4を検索する。連文節解析
処理部2は、辞書検索部3から入力された単語に基づい
て、ユーザ入出力部1から入力されたかな文字列を漢字
を含む文(漢字かな混じり文)に変換する。連文節解析
処理部2は、このかな漢字変換処理を連文節すなわち文
単位で行うことができる。連文節解析処理部2が変換し
た漢字かな混じり文はユーザ入出力部1に入力されユー
ザに対して表示される。
列は、連文節解析処理部2に入力される。連文節解析処
理部2は、かな文字列から文節を推定するとともに、推
定された文節の文脈内での候補を絞り込んだのち、この
かな文字列を辞書検索部3に入力する。辞書検索部3
は、入力された文節単位のかな文字列で基本辞書4を検
索し、この文字列を前記文脈にあった単語に変換してこ
の検索結果を連文節解析処理部2に返信する。一般的に
文節は名詞や動詞などの主要な単語と助詞や助動詞など
の補助的な単語からなるが、辞書検索部3はこのうち主
要な単語を抽出して基本辞書4を検索する。連文節解析
処理部2は、辞書検索部3から入力された単語に基づい
て、ユーザ入出力部1から入力されたかな文字列を漢字
を含む文(漢字かな混じり文)に変換する。連文節解析
処理部2は、このかな漢字変換処理を連文節すなわち文
単位で行うことができる。連文節解析処理部2が変換し
た漢字かな混じり文はユーザ入出力部1に入力されユー
ザに対して表示される。
【0012】また、変換された漢字かな混じり文、およ
び、この文の各単語の基本辞書に登録されている番号で
ある登録番号が、連文節解析処理部2から同語使用回数
判定部5に入力される。同語使用回数判定部5は、1文
(句点「。」が使用されるまでの文字列)毎を対象とし
て、同じ単語(同語)が複数回使用されているかを検査
する。この検査は前記登録番号に基づいて行われる。同
じ単語が複数回使用されている場合には、その単語の登
録番号とその使用回数を同語使用警告部6に通知する。
び、この文の各単語の基本辞書に登録されている番号で
ある登録番号が、連文節解析処理部2から同語使用回数
判定部5に入力される。同語使用回数判定部5は、1文
(句点「。」が使用されるまでの文字列)毎を対象とし
て、同じ単語(同語)が複数回使用されているかを検査
する。この検査は前記登録番号に基づいて行われる。同
じ単語が複数回使用されている場合には、その単語の登
録番号とその使用回数を同語使用警告部6に通知する。
【0013】以上の動作を、図2を参照しながら、「わ
たしのどうさにあわせてきかいはどうさし、そのどうさ
にあわせてきみがどうさする。」という文を例にして説
明する。ここで、基本辞書4には同図(B)の変換候補
が登録されているとする。連文節解析処理部2および辞
書検索部3は、上記のかな文字列を文節単位に分割し、
文脈として意味が通じるように単語を変換する。その変
換結果が同図(A)に示すものである。そして、同語使
用回数判定部5には、同図(C)に示すように変換後の
文とともに各単語の登録番号が入力される。
たしのどうさにあわせてきかいはどうさし、そのどうさ
にあわせてきみがどうさする。」という文を例にして説
明する。ここで、基本辞書4には同図(B)の変換候補
が登録されているとする。連文節解析処理部2および辞
書検索部3は、上記のかな文字列を文節単位に分割し、
文脈として意味が通じるように単語を変換する。その変
換結果が同図(A)に示すものである。そして、同語使
用回数判定部5には、同図(C)に示すように変換後の
文とともに各単語の登録番号が入力される。
【0014】同語使用回数判定部5は、同じ登録番号の
出現度数をカウントし、この文について同図(D)のよ
うな判定結果を得る。この判定結果は、同語使用警告部
6にに入力される。同語使用警告部6は、同語使用回数
判定部5から入力された判定結果を同語使用警告に関す
るユーザの設定内容に照らして、警告処理を行う必要が
あれば、 対象となった過使用語(使いすぎの単語)の反転表示ま
たは下線表示 『「動作」の使い過ぎです。』などの警告ウィンドウの
表示 過使用語に置き換え可能な類義語である置換候補の自動
検索 などの処理を実行する。この警告処理に関して、ユーザ
は、ユーザ入出力部1から、 同語使用警告ON/OFF 同語使用警告回数 類義語自動表示ON/OFF の動作モードを設定することができる。設定内容が、同
語使用警告=ON、同語使用警告回数=4、同義語自動
表示=ONの場合、ユーザが、図2の「私の動作に合わ
せてこの機械を動作し、その動作に合わせて君が動作す
る。」の文を入力したとき、同語使用回数判定部5から
同語使用警告部6に対して図2(D)の判定結果が入力
される。このとき、ユーザ設定の同語使用警告=ON、
同語使用警告回数=4であるので、入力された判定結果
に4回以上使用されている単語があるかをチェックす
る。そして、登録番号5(合う)の使用回数は2回なの
で警告を行わない。登録番号3(動作)の使用回数は4
回なので、使いすぎの単語(過使用語)である「動作」
を含む4か所の文節を反転表示し、警告ウィンドウ
『「動作」の使いすぎです。』を表示するとともに、類
義語自動表示=ONであるので、自動類義語表示部10
に過使用語「動作」を出力して置換候補を検索する。
出現度数をカウントし、この文について同図(D)のよ
うな判定結果を得る。この判定結果は、同語使用警告部
6にに入力される。同語使用警告部6は、同語使用回数
判定部5から入力された判定結果を同語使用警告に関す
るユーザの設定内容に照らして、警告処理を行う必要が
あれば、 対象となった過使用語(使いすぎの単語)の反転表示ま
たは下線表示 『「動作」の使い過ぎです。』などの警告ウィンドウの
表示 過使用語に置き換え可能な類義語である置換候補の自動
検索 などの処理を実行する。この警告処理に関して、ユーザ
は、ユーザ入出力部1から、 同語使用警告ON/OFF 同語使用警告回数 類義語自動表示ON/OFF の動作モードを設定することができる。設定内容が、同
語使用警告=ON、同語使用警告回数=4、同義語自動
表示=ONの場合、ユーザが、図2の「私の動作に合わ
せてこの機械を動作し、その動作に合わせて君が動作す
る。」の文を入力したとき、同語使用回数判定部5から
同語使用警告部6に対して図2(D)の判定結果が入力
される。このとき、ユーザ設定の同語使用警告=ON、
同語使用警告回数=4であるので、入力された判定結果
に4回以上使用されている単語があるかをチェックす
る。そして、登録番号5(合う)の使用回数は2回なの
で警告を行わない。登録番号3(動作)の使用回数は4
回なので、使いすぎの単語(過使用語)である「動作」
を含む4か所の文節を反転表示し、警告ウィンドウ
『「動作」の使いすぎです。』を表示するとともに、類
義語自動表示=ONであるので、自動類義語表示部10
に過使用語「動作」を出力して置換候補を検索する。
【0015】自動類義語表示部10において、同語使用
警告部6から過使用語が入力されると、類義語解析処理
部7がその単語の意味を解析し、置き換え可能な類義語
を類義語辞書検索部8に検索させる。類義語辞書検索部
8は、類義語辞書9を検索して、上記過使用語と置き換
え可能な置換候補の単語を1つ以上選出して類義語解析
処理部7に入力する。類義語解析処理部7は、選出され
た置換候補の単語を反転表示した過使用語の文節の下に
ユーザ選択可能なリストとして表示する。
警告部6から過使用語が入力されると、類義語解析処理
部7がその単語の意味を解析し、置き換え可能な類義語
を類義語辞書検索部8に検索させる。類義語辞書検索部
8は、類義語辞書9を検索して、上記過使用語と置き換
え可能な置換候補の単語を1つ以上選出して類義語解析
処理部7に入力する。類義語解析処理部7は、選出され
た置換候補の単語を反転表示した過使用語の文節の下に
ユーザ選択可能なリストとして表示する。
【0016】たとえば、過使用語として「動作」が入力
され、類義語辞書9に図3(A)のような類義語が登録
されている場合、同図(B)のような置換候補のリスト
が表示される。ユーザはマウスを用いてこのリストから
適当な置換候補を選択することにより、過使用語の「動
作」を適当な置換候補の単語に置き換えることができ
る。
され、類義語辞書9に図3(A)のような類義語が登録
されている場合、同図(B)のような置換候補のリスト
が表示される。ユーザはマウスを用いてこのリストから
適当な置換候補を選択することにより、過使用語の「動
作」を適当な置換候補の単語に置き換えることができ
る。
【0017】一方、前記ユーザ入出力部1は、前記同時
使用警告の動作モードを設定する同時使用警告モード設
定機能を備えている。ユーザはこの機能において、マウ
ス操作により、同語使用警告のON/OFF、同語使用
警告回数の設定および、類義語自動表示のON/OFF
を自由に行うことができる。ユーザが動作モードの設定
変更を行うと、同語使用警告部6のパラメータが変更さ
れる。
使用警告の動作モードを設定する同時使用警告モード設
定機能を備えている。ユーザはこの機能において、マウ
ス操作により、同語使用警告のON/OFF、同語使用
警告回数の設定および、類義語自動表示のON/OFF
を自由に行うことができる。ユーザが動作モードの設定
変更を行うと、同語使用警告部6のパラメータが変更さ
れる。
【0018】なお、上記説明では、日本語をかな入力し
て漢字に変換する場合について説明したが、処理する言
語は日本語に限らず英語,中国語,韓国語などどのよう
な言語でもよい。以下英語を処理する場合について説明
する。
て漢字に変換する場合について説明したが、処理する言
語は日本語に限らず英語,中国語,韓国語などどのよう
な言語でもよい。以下英語を処理する場合について説明
する。
【0019】ユーザ入出力部1から入力される文字列
は、たとえば図4(A)の「I helped you
help him help her help.」
のようなものである。英語の文章は単語毎にスペースで
区切られるので、連文節解析処理部2は日本語のように
文字列を文節に分割する処理は不要となり、スペースで
区切られた単語毎に連文節解析処理をして辞書変換部3
に入力すればよい。辞書検索部3は、基本辞書4を検索
し、各単語に文脈に合った意味の登録単語の登録番号を
付与し、この検索結果を連文節解析処理部2に返信す
る。基本辞書4に図4(B)のような変換候補が登録さ
れている場合、同図(A)の文の各単語には、同図
(C)のような登録番号が付与される。同語使用回数判
定部5は、1文(ピリオド「.」が使用されるまでの単
語列)毎を対象として、同じ単語(同語)が複数回使用
されているかを検査する。同じ単語が複数回使用されて
いる場合には、その単語の登録番号とその使用回数を判
定結果として同語使用警告部6に通知する。上記例では
図4(D)のような判定結果が通知される。
は、たとえば図4(A)の「I helped you
help him help her help.」
のようなものである。英語の文章は単語毎にスペースで
区切られるので、連文節解析処理部2は日本語のように
文字列を文節に分割する処理は不要となり、スペースで
区切られた単語毎に連文節解析処理をして辞書変換部3
に入力すればよい。辞書検索部3は、基本辞書4を検索
し、各単語に文脈に合った意味の登録単語の登録番号を
付与し、この検索結果を連文節解析処理部2に返信す
る。基本辞書4に図4(B)のような変換候補が登録さ
れている場合、同図(A)の文の各単語には、同図
(C)のような登録番号が付与される。同語使用回数判
定部5は、1文(ピリオド「.」が使用されるまでの単
語列)毎を対象として、同じ単語(同語)が複数回使用
されているかを検査する。同じ単語が複数回使用されて
いる場合には、その単語の登録番号とその使用回数を判
定結果として同語使用警告部6に通知する。上記例では
図4(D)のような判定結果が通知される。
【0020】同語使用警告部6の設定内容が、同語使用
警告=ON、同語使用警告回数=4、同義語自動表示=
ONの場合、ユーザの「I helped you h
elp her help.」の入力に対応して同語使
用警告部6に図4(D)の判定結果が入力されるが、登
録番号4(help)の使用回数は4回で過使用語ある
ため、この単語を反転表示し、警告ウィンドウ『“he
lp” is used too many time
s.』を表示するとともに、類義語自動表示=ONであ
るので、自動類義語表示部10に過使用語「help」
を出力して置換候補を検索する。類義語辞書9に図5
(A)のような類義語が登録されている場合、同図
(B)のように置換候補のリストが表示される。ユーザ
はマウスを用いてこのリストから適当な置換候補を選択
することにより、過使用語の「help」を適当な置換
候補の単語に置き換えることができる。
警告=ON、同語使用警告回数=4、同義語自動表示=
ONの場合、ユーザの「I helped you h
elp her help.」の入力に対応して同語使
用警告部6に図4(D)の判定結果が入力されるが、登
録番号4(help)の使用回数は4回で過使用語ある
ため、この単語を反転表示し、警告ウィンドウ『“he
lp” is used too many time
s.』を表示するとともに、類義語自動表示=ONであ
るので、自動類義語表示部10に過使用語「help」
を出力して置換候補を検索する。類義語辞書9に図5
(A)のような類義語が登録されている場合、同図
(B)のように置換候補のリストが表示される。ユーザ
はマウスを用いてこのリストから適当な置換候補を選択
することにより、過使用語の「help」を適当な置換
候補の単語に置き換えることができる。
【0021】以上説明した文書処理装置は、パーソナル
コンピュータとソフトウェアで実現される場合が多い。
以下、上記実施形態の文書処理装置の機能を実行するパ
ーソナルコンピュータのハードウェアとその処理部の動
作について説明する。
コンピュータとソフトウェアで実現される場合が多い。
以下、上記実施形態の文書処理装置の機能を実行するパ
ーソナルコンピュータのハードウェアとその処理部の動
作について説明する。
【0022】図6は文書処理装置の機能を実行するパー
ソナルコンピュータの構成を示す図である。パーソナル
コンピュータ本体20は、CPUやメモリを搭載したメ
インボード21と内蔵の周辺機器であるハードディスク
22、CD−ROMドライブ23、フロッピィディスク
ドライブ24、モデム25などで構成される。また、こ
のパーソナルコンピュータ本体20には、モニタ30、
キーボード31、マウス32などが接続されている。上
記文書処理装置の機能を実行するための動作プログラム
は、通常はハードディスク22に記憶されており、その
処理動作を実行するときメインボード21のRAMに読
み込まれる。また、この動作プログラムは、CD−RO
Mドライブ23にセットされるCD−ROM33やフロ
ッピィディスクドライブ24にセットされるフロッピィ
ディスク34などによって供給され、ハードディスク2
2にインストールされる。また、モデム25を介して接
続されるサーバコンピュータ40からこの動作プログラ
ムをダウンロードするようにしてもよい。
ソナルコンピュータの構成を示す図である。パーソナル
コンピュータ本体20は、CPUやメモリを搭載したメ
インボード21と内蔵の周辺機器であるハードディスク
22、CD−ROMドライブ23、フロッピィディスク
ドライブ24、モデム25などで構成される。また、こ
のパーソナルコンピュータ本体20には、モニタ30、
キーボード31、マウス32などが接続されている。上
記文書処理装置の機能を実行するための動作プログラム
は、通常はハードディスク22に記憶されており、その
処理動作を実行するときメインボード21のRAMに読
み込まれる。また、この動作プログラムは、CD−RO
Mドライブ23にセットされるCD−ROM33やフロ
ッピィディスクドライブ24にセットされるフロッピィ
ディスク34などによって供給され、ハードディスク2
2にインストールされる。また、モデム25を介して接
続されるサーバコンピュータ40からこの動作プログラ
ムをダウンロードするようにしてもよい。
【0023】図7,図8を参照して上記文書処理装置の
機能を実行するための動作プログラムによるパーソナル
コンピュータの動作を説明する。
機能を実行するための動作プログラムによるパーソナル
コンピュータの動作を説明する。
【0024】図7において、ユーザがキーボード31を
操作してかな文字列を入力すると(s1)、入力された
文字列について連文節解析を行って文節毎に分割し(s
2)、活用語尾の割り出しや助詞・助動詞の切り離しな
どの形態素解析を行う(s3)。そして、文脈解析を行
うため先に入力され既に確定している文書の情報を参照
し(s4)、これらの情報に基づいて基本辞書を検索す
る(s5)。既確定文や基本辞書はメインボード21上
のRAMまたはハードディスク22に記憶されている。
基本辞書の検索結果に基づいて上記文字列を漢字かな混
じり文に変換する(s6)。この変換に伴って、各文節
(単語)の基本辞書登録番号が得られるため、この登録
番号をスキャンする(s7)。スキャンの結果同じ登録
番号の単語(同語)を複数回使用していることが判明す
れば(s8)、同語使用情報としてこれを記憶する(s
9)。変換された漢字かな混じり文についての登録番号
スキャンが終了するまで(s10)、s7〜s9の動作
を繰り返し実行する。スキャン終了ののち(s10)、
同語使用情報があるかを判断し(s11)、ある場合に
は同語使用警告動作(s12)を実行する。同語使用情
報がない場合にはこの文についての処理を終了し、ユー
ザによる次のキー入力に対応する。
操作してかな文字列を入力すると(s1)、入力された
文字列について連文節解析を行って文節毎に分割し(s
2)、活用語尾の割り出しや助詞・助動詞の切り離しな
どの形態素解析を行う(s3)。そして、文脈解析を行
うため先に入力され既に確定している文書の情報を参照
し(s4)、これらの情報に基づいて基本辞書を検索す
る(s5)。既確定文や基本辞書はメインボード21上
のRAMまたはハードディスク22に記憶されている。
基本辞書の検索結果に基づいて上記文字列を漢字かな混
じり文に変換する(s6)。この変換に伴って、各文節
(単語)の基本辞書登録番号が得られるため、この登録
番号をスキャンする(s7)。スキャンの結果同じ登録
番号の単語(同語)を複数回使用していることが判明す
れば(s8)、同語使用情報としてこれを記憶する(s
9)。変換された漢字かな混じり文についての登録番号
スキャンが終了するまで(s10)、s7〜s9の動作
を繰り返し実行する。スキャン終了ののち(s10)、
同語使用情報があるかを判断し(s11)、ある場合に
は同語使用警告動作(s12)を実行する。同語使用情
報がない場合にはこの文についての処理を終了し、ユー
ザによる次のキー入力に対応する。
【0025】図8(A)は同語使用警告動作を示すフロ
ーチャートである。まず、最初にユーザによって同語使
用警告モードがオンされているか否かを判断する(s2
0)。警告モードがオフであれば何もしないでそのまま
リターンする。警告モードがオンであれば同語使用情報
に記録されている同語の使用回数(図2(D)参照)が
ユーザによって設定されている使用制限回数以上である
かを判断する(s21)。同語の使用回数が使用制限回
数に満たない場合にはそのままリターンする。同語の使
用回数が設定されている使用制限回数以上の場合にはモ
ニタ30に警告ウィンドウを表示するとともに(s2
2)、類義語自動表示モードがオンされているかを判断
する(s23)。類義語自動表示モードがオフの場合に
は警告ウィンドウを表示するのみでリターンする。類義
語自動表示モードがオンしている場合には使用制限回数
以上になった過使用語の類義語を類義語辞書から検索し
て(s24)、過使用語の下にリスト表示する(s2
5:図3(B)参照)。これにより、ユーザはリスト内
の単語を選択することによって、過使用語を類義語に置
き換えることができる。
ーチャートである。まず、最初にユーザによって同語使
用警告モードがオンされているか否かを判断する(s2
0)。警告モードがオフであれば何もしないでそのまま
リターンする。警告モードがオンであれば同語使用情報
に記録されている同語の使用回数(図2(D)参照)が
ユーザによって設定されている使用制限回数以上である
かを判断する(s21)。同語の使用回数が使用制限回
数に満たない場合にはそのままリターンする。同語の使
用回数が設定されている使用制限回数以上の場合にはモ
ニタ30に警告ウィンドウを表示するとともに(s2
2)、類義語自動表示モードがオンされているかを判断
する(s23)。類義語自動表示モードがオフの場合に
は警告ウィンドウを表示するのみでリターンする。類義
語自動表示モードがオンしている場合には使用制限回数
以上になった過使用語の類義語を類義語辞書から検索し
て(s24)、過使用語の下にリスト表示する(s2
5:図3(B)参照)。これにより、ユーザはリスト内
の単語を選択することによって、過使用語を類義語に置
き換えることができる。
【0026】同図(B)は同語使用警告モードの設定動
作を示すフローチャートである。この動作は文書処理プ
ログラムの設定メニューにおいて実行されるものであ
る。まず、ユーザによる警告モードの切り換えを受け付
ける(s30)。この切換操作に対応して警告モードの
オン/オフを反転する(s31)。この反転の結果、警
告モードがオフになれば以下の動作をスキップして動作
を終了する(s32)。警告モードがオンのときは以下
の動作を実行する。
作を示すフローチャートである。この動作は文書処理プ
ログラムの設定メニューにおいて実行されるものであ
る。まず、ユーザによる警告モードの切り換えを受け付
ける(s30)。この切換操作に対応して警告モードの
オン/オフを反転する(s31)。この反転の結果、警
告モードがオフになれば以下の動作をスキップして動作
を終了する(s32)。警告モードがオンのときは以下
の動作を実行する。
【0027】まず、ユーザによる使用制限回数の入力を
受け付け(s33)、この回数を使用制限回数として設
定する(s34)。そして類義語自動表示モードのオン
/オフの切り換えを受け付け(s35)、この切換操作
に対応して類義語自動表示モードのオン/オフを反転す
る(s36)。このように、文書入力時における同語複
数使用時の警告動作をユーザが任意に設定することがで
きる。
受け付け(s33)、この回数を使用制限回数として設
定する(s34)。そして類義語自動表示モードのオン
/オフの切り換えを受け付け(s35)、この切換操作
に対応して類義語自動表示モードのオン/オフを反転す
る(s36)。このように、文書入力時における同語複
数使用時の警告動作をユーザが任意に設定することがで
きる。
【0028】なお、上記フローチャートは日本語入力の
場合について説明したが、英文等の他言語の場合でもほ
ぼ同様の動作で処理することができる。
場合について説明したが、英文等の他言語の場合でもほ
ぼ同様の動作で処理することができる。
【0029】また、上記実施形態では、ユーザが連文節
からなる1文を一度に入力する場合について説明した
が、1文節毎に変換・確定を行う単文節変換で入力した
場合でも、句点やピリオドが入力されるまで、ユーザが
確定した候補情報(基本辞書登録番号)を覚えておくこ
とにより、上記処理を同様に実行することができる。
からなる1文を一度に入力する場合について説明した
が、1文節毎に変換・確定を行う単文節変換で入力した
場合でも、句点やピリオドが入力されるまで、ユーザが
確定した候補情報(基本辞書登録番号)を覚えておくこ
とにより、上記処理を同様に実行することができる。
【0030】また、上記実施形態では、1文当たりの使
用回数を集計して警告するようにしているが、集計する
範囲は1文に限定されず、1段落単位などより広範囲に
してもよい。
用回数を集計して警告するようにしているが、集計する
範囲は1文に限定されず、1段落単位などより広範囲に
してもよい。
【0031】なお、上記実施形態では、検査対象となる
単位文字列を文節や単語とし、これに置き換える置換候
補も単語としているが、過使用の単語の置換候補として
複数の単語からなる句を提示するようにしてもよい。ま
た、検査対象となる文字列を文節よりも長い句や節にし
てもよい。
単位文字列を文節や単語とし、これに置き換える置換候
補も単語としているが、過使用の単語の置換候補として
複数の単語からなる句を提示するようにしてもよい。ま
た、検査対象となる文字列を文節よりも長い句や節にし
てもよい。
【0032】また、上記実施形態では、かな文字列を入
力して漢字かな混じり文に変換するなどの同一言語内で
の処理について説明したが、日本語を入力して英文に変
換する場合や英文を入力して日本語に変換する場合など
の翻訳機能においても同様に同語使用の検査・警告・類
義語表示機能を実行することができる。
力して漢字かな混じり文に変換するなどの同一言語内で
の処理について説明したが、日本語を入力して英文に変
換する場合や英文を入力して日本語に変換する場合など
の翻訳機能においても同様に同語使用の検査・警告・類
義語表示機能を実行することができる。
【0033】また、図3(B)、図5(D)のリスト表
示は、4回使用されている単語のうち最後の単語を置き
換えるようにリスト表示しているが、置き換え対象とな
る単語は最後のものに限定されない。また、使用限度回
数も4回(4語)に限定されない。
示は、4回使用されている単語のうち最後の単語を置き
換えるようにリスト表示しているが、置き換え対象とな
る単語は最後のものに限定されない。また、使用限度回
数も4回(4語)に限定されない。
【0034】また、上記実施形態では、ユーザがキー入
力した文字列(文)についてリアルタイムに同語使用検
査を行う例について説明したが、既に入力されて保存さ
れている文書についてバッチ処理で検査するようにして
もよい。
力した文字列(文)についてリアルタイムに同語使用検
査を行う例について説明したが、既に入力されて保存さ
れている文書についてバッチ処理で検査するようにして
もよい。
【0035】
【発明の効果】以上のようにこの発明によれば、文節や
単語などの単位文字列の使用頻度を検査し、それが所定
値以上の場合には警告を発するため、同じ文字列の繰り
返しを容易に発見することができる。
単語などの単位文字列の使用頻度を検査し、それが所定
値以上の場合には警告を発するため、同じ文字列の繰り
返しを容易に発見することができる。
【0036】また、その場合に、その単位文字列に対す
る置換候補として類似文字列を提示するようにしたこと
により、ユーザが自ら考えなくても同じ文字列の繰り返
しを解消することができる。
る置換候補として類似文字列を提示するようにしたこと
により、ユーザが自ら考えなくても同じ文字列の繰り返
しを解消することができる。
【図1】この発明の実施形態である文書処理装置の機能
ブロック図
ブロック図
【図2】同文書処理装置における日本文処理機能を説明
する図
する図
【図3】同文書処理装置における類義語表示機能を説明
する図
する図
【図4】同文書処理装置における英文処理機能を説明す
る図
る図
【図5】同文書処理装置における類義語表示機能を説明
する図
する図
【図6】同文書処理装置をパーソナルコンピュータで構
成した場合のハード構成図
成した場合のハード構成図
【図7】同パーソナルコンピュータの動作を示すフロー
チャート
チャート
【図8】同パーソナルコンピュータの動作を示すフロー
チャート
チャート
1…ユーザ入出力部、2…連文節解析処理部、3…辞書
検索部、4…基本辞書、5…同語使用回数判定部、6…
同語使用警告部、7…類義語解析処理部、8…類義語辞
書検索部、9…類義語辞書、20…パーソナルコンピュ
ータ本体、22…ハードディスク、31…キーボード、
33…CD−ROM、34…フロッピィディスク
検索部、4…基本辞書、5…同語使用回数判定部、6…
同語使用警告部、7…類義語解析処理部、8…類義語辞
書検索部、9…類義語辞書、20…パーソナルコンピュ
ータ本体、22…ハードディスク、31…キーボード、
33…CD−ROM、34…フロッピィディスク
Claims (8)
- 【請求項1】 与えられた文を単語や文節等の文字列に
分割する手段と、 各文字列の前記与えられた文中での出現回数を計数する
手段と、 出現回数が所定値以上の文字列について警告を発する警
告手段と、 を備えたことを特徴とする文字列処理装置。 - 【請求項2】 前記文字列に対する類似文字列を予め記
憶した類似辞書を備え、 前記警告手段は、前記出現回数が所定値以上の文字列に
対する類似文字列を前記類似辞書から検索して置換候補
として提示する置換候補検索手段を含む請求項1に記載
の文字列処理装置。 - 【請求項3】 前記置換候補検索手段の動作の有効/無
効を設定する手段を備えたことを特徴とする請求項2に
記載の文字列処理装置。 - 【請求項4】 前記警告手段の動作の有効/無効、およ
び、前記所定値のうち一方または両方を設定する手段を
備えたことを特徴とする請求項1、請求項2または請求
項3に記載の文字列処理装置。 - 【請求項5】 与えられた文を単語や文節等の文字列に
分割する分割ステップと、 各文字列の前記与えられた文中での出現回数を計数する
ステップと、 出現回数が所定値以上の文字列について警告を発する警
告ステップと、 を有することを特徴とする文字列処理方法。 - 【請求項6】 前記警告ステップは、前記出現回数が所
定値以上の文字列に対する類似文字列を、前記文字列に
対する類似文字列を予め記憶した類似辞書から検索して
置換候補として提示するステップを含む請求項5に記載
の文字列処理方法。 - 【請求項7】 与えられた文を単語や文節等の文字列に
分割する分割ステップと、各文字列の前記与えられた文
中での出現回数を計数するステップと、出現回数が所定
値以上の文字列について警告を発する警告ステップと、
を有する文字列処理プログラムを記憶した媒体。 - 【請求項8】 与えられた文を単語や文節等の文字列に
分割する分割ステップと、各文字列の前記与えられた文
中での出現回数を計数するステップと、出現回数が所定
値以上の文字列について警告を発するとともに、出現回
数が所定値以上の文字列に対する類似文字列を類似辞書
から検索して置換候補として提示するステップと、を有
する文字列処理プログラムを記憶した媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10054657A JPH11259472A (ja) | 1998-03-06 | 1998-03-06 | 文字列処理装置、文字列処理方法および文字列処理プログラムを記憶した媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10054657A JPH11259472A (ja) | 1998-03-06 | 1998-03-06 | 文字列処理装置、文字列処理方法および文字列処理プログラムを記憶した媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH11259472A true JPH11259472A (ja) | 1999-09-24 |
Family
ID=12976869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10054657A Pending JPH11259472A (ja) | 1998-03-06 | 1998-03-06 | 文字列処理装置、文字列処理方法および文字列処理プログラムを記憶した媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH11259472A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006506740A (ja) * | 2002-11-14 | 2006-02-23 | エデュケーショナル テスティング サービス | エッセイ中の過度の反復語使用の自動評価 |
JP2010524135A (ja) * | 2007-04-09 | 2010-07-15 | グーグル・インコーポレーテッド | クライアントの入力メソッド |
-
1998
- 1998-03-06 JP JP10054657A patent/JPH11259472A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006506740A (ja) * | 2002-11-14 | 2006-02-23 | エデュケーショナル テスティング サービス | エッセイ中の過度の反復語使用の自動評価 |
JP2010015571A (ja) * | 2002-11-14 | 2010-01-21 | Educational Testing Service | エッセイ中の過度の反復語使用の自動評価 |
JP2010524135A (ja) * | 2007-04-09 | 2010-07-15 | グーグル・インコーポレーテッド | クライアントの入力メソッド |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4777600A (en) | Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms | |
US8199112B2 (en) | Character input device | |
JP2005135113A (ja) | 電子機器装置、関連語抽出方法及びプログラム | |
KR20110069488A (ko) | 입력 언어에 따른 전자사전의 자동검색 시스템 및 그 방법 | |
JP5025603B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
JPH11259472A (ja) | 文字列処理装置、文字列処理方法および文字列処理プログラムを記憶した媒体 | |
JPH07334499A (ja) | 文字列入力装置 | |
JP2004295578A (ja) | 翻訳装置 | |
JP2010282507A (ja) | 辞書機能を備えた電子機器およびプログラム | |
JP5487898B2 (ja) | 辞書機能を備えた電子機器およびプログラム | |
JP2004334699A (ja) | テキスト評価装置、テキスト評価方法、プログラム及び記憶媒体 | |
JP2022148873A (ja) | 情報検索装置、情報検索方法およびプログラム | |
JP2009116585A (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP5338482B2 (ja) | 漢文例文検索装置およびプログラム | |
JP3438913B2 (ja) | 文書処理装置 | |
CN114442818A (zh) | 输入辅助装置、方法和系统以及计算机可读介质 | |
JPH09179865A (ja) | 翻訳対象領域決定機能付き機械翻訳装置 | |
JPS63136264A (ja) | 機械翻訳装置 | |
JP2004355248A (ja) | 電子辞書 | |
JP2009271593A (ja) | 情報検索装置、情報検索方法、及びコンピュータプログラム | |
JPH0683809A (ja) | 文書処理装置 | |
JPH08263471A (ja) | 情報処理装置 | |
JP2005293069A (ja) | 電子辞書 | |
JP2002351867A (ja) | 文書処理装置 | |
JPH0973460A (ja) | 文書検索装置 |