JP2974295B2 - 日本語入力システム - Google Patents
日本語入力システムInfo
- Publication number
- JP2974295B2 JP2974295B2 JP9137215A JP13721597A JP2974295B2 JP 2974295 B2 JP2974295 B2 JP 2974295B2 JP 9137215 A JP9137215 A JP 9137215A JP 13721597 A JP13721597 A JP 13721597A JP 2974295 B2 JP2974295 B2 JP 2974295B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- unit
- learning
- user
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Document Processing Apparatus (AREA)
Description
【0001】
【発明の属する技術分野】この発明は、例えば電子メー
ルシステム上でのかな漢字変換処理において未登録語の
抽出,学習を行えるようにする日本語入力システムに関
する。
ルシステム上でのかな漢字変換処理において未登録語の
抽出,学習を行えるようにする日本語入力システムに関
する。
【0002】
【従来の技術】現在、電子メールの普及により、コンピ
ュータ上で日本語入力処理を利用し文書を作成し、ネッ
トワークを介し種々の情報のやり取りを行うケースが増
えている。そのやり取りにおいて、文書内で使われてい
る人名,地域名,専門用語あるいは文書内で固有に表現
された単語/複合語等を繰り返し入力する場合が多い。
このような日本語入力処理では、単語辞書に含まれない
単語/複合語があれば、文節の区切り直し機能等により
単語/複合語を作り出すか、この操作で作り出すことが
できない場合は、単語登録する若しくは、アプリケーシ
ョンの持つカットアンドペースト機能を用いて該単語/
複合語を目的の位置に張り付けたりしている。
ュータ上で日本語入力処理を利用し文書を作成し、ネッ
トワークを介し種々の情報のやり取りを行うケースが増
えている。そのやり取りにおいて、文書内で使われてい
る人名,地域名,専門用語あるいは文書内で固有に表現
された単語/複合語等を繰り返し入力する場合が多い。
このような日本語入力処理では、単語辞書に含まれない
単語/複合語があれば、文節の区切り直し機能等により
単語/複合語を作り出すか、この操作で作り出すことが
できない場合は、単語登録する若しくは、アプリケーシ
ョンの持つカットアンドペースト機能を用いて該単語/
複合語を目的の位置に張り付けたりしている。
【0003】そして、このように単語辞書に登録されて
いない単語を自動的に学習あるいは登録する方法が、例
えば特開平7−28808号公報及び特開平2−163
874号公報に記載されている。これらは、いずれも利
用者が一度必ず漢字変換操作を行い、その結果作り出し
た文字列の中で、単語辞書に未登録な単語があれば自動
的に学習あるいは登録する方法であり、二度目の入力か
ら有効である。
いない単語を自動的に学習あるいは登録する方法が、例
えば特開平7−28808号公報及び特開平2−163
874号公報に記載されている。これらは、いずれも利
用者が一度必ず漢字変換操作を行い、その結果作り出し
た文字列の中で、単語辞書に未登録な単語があれば自動
的に学習あるいは登録する方法であり、二度目の入力か
ら有効である。
【0004】
【発明が解決しようとする課題】しかしながら、かかる
従来の日本語入力処理方法にあっては、かな漢字変換す
る場合に、単語辞書に存在する文字で構成される単語/
熟語しか、扱うことができないため、電子メールでやり
取りを行う文書内に、他の単語辞書でユーザ登録された
単語で、利用者が使用しているかな漢字変換では作成で
きない漢字が含まれている場合、それらの単語を再入力
するには、単語登録機能を用いて利用者の単語辞書へ追
加登録するか、アプリケーションの持つカットアンドペ
ースト機能により張り付けるかしか方法がなく、その作
業が面倒で、そのたびに作業が中断し、作業能率が低下
するという課題があった。
従来の日本語入力処理方法にあっては、かな漢字変換す
る場合に、単語辞書に存在する文字で構成される単語/
熟語しか、扱うことができないため、電子メールでやり
取りを行う文書内に、他の単語辞書でユーザ登録された
単語で、利用者が使用しているかな漢字変換では作成で
きない漢字が含まれている場合、それらの単語を再入力
するには、単語登録機能を用いて利用者の単語辞書へ追
加登録するか、アプリケーションの持つカットアンドペ
ースト機能により張り付けるかしか方法がなく、その作
業が面倒で、そのたびに作業が中断し、作業能率が低下
するという課題があった。
【0005】また、電子メールでやり取りを行う文書内
に、利用者の単語辞書に存在しない未登録語が存在し、
それらの単語を再入力しようとする場合、文字列の変換
を行った後、再度区切り直し等を行って単語を作り出す
必要があるという課題があった。その理由は、単語を学
習若しくは単語辞書へ登録するためには、その単語の読
み及び品詞情報が必要だが、文書内の文字列からその情
報を取得できないためである。
に、利用者の単語辞書に存在しない未登録語が存在し、
それらの単語を再入力しようとする場合、文字列の変換
を行った後、再度区切り直し等を行って単語を作り出す
必要があるという課題があった。その理由は、単語を学
習若しくは単語辞書へ登録するためには、その単語の読
み及び品詞情報が必要だが、文書内の文字列からその情
報を取得できないためである。
【0006】前記目的達成のため、この発明にかかる単
語辞書に存在しない漢字等から構成される単語でも、最
初の変換候補として表示することが可能となり、単語入
力のために余分な操作を行わずに、思考を中断すること
なく日本語入力を行うことでできる日本語入力システム
を得ることを目的とする。
語辞書に存在しない漢字等から構成される単語でも、最
初の変換候補として表示することが可能となり、単語入
力のために余分な操作を行わずに、思考を中断すること
なく日本語入力を行うことでできる日本語入力システム
を得ることを目的とする。
【0007】
【課題を解決するための手段】前記目的達成のため、請
求項1の発明にかかる日本語入力システムは、かな漢字
変換部に設けられて、利用者が文書内に日本語入力を開
始し、確定した文字列の中で、ユーザ登録単語及び単語
辞書に存在しない未登録語を抽出する学習単語候補切出
し部と、利用者の入力が完了して文書を保存する際、実
際に入力された文字列以外に前記学習単語候補切出し部
で抽出したユーザ登録単語及び未登録語からなる学習単
語情報も併せて文書ファイル内に追加して保存するファ
イル保存部と、前記文書ファイルが開かれた場合、その
ファイル情報をかな漢字変換部へ通知するファイルオー
プン部と、前記かな漢字変換部に設けられて、前記ファ
イル情報の通知を受けて、文書ファイル内の前記学習単
語情報をメモリ上へロードし、その学習単語情報に含ま
れる単語が現在使用中の単語辞書に存在するか否かを検
索し、存在しない未登録の単語のみを取込む学習単語候
補取込み部とを設けて、日本語変換処理部に、利用者が
入力した読み情報が、前記学習単語候補取込み部で取込
んだ単語に該当する場合、文法的に問題がなければ最初
の変換候補として出力させ、更に、その単語が選択され
た場合は、単語登録させるかを利用者に確認させ、また
は必要なら自動的に単語登録を行わせるようにしたもの
である。
求項1の発明にかかる日本語入力システムは、かな漢字
変換部に設けられて、利用者が文書内に日本語入力を開
始し、確定した文字列の中で、ユーザ登録単語及び単語
辞書に存在しない未登録語を抽出する学習単語候補切出
し部と、利用者の入力が完了して文書を保存する際、実
際に入力された文字列以外に前記学習単語候補切出し部
で抽出したユーザ登録単語及び未登録語からなる学習単
語情報も併せて文書ファイル内に追加して保存するファ
イル保存部と、前記文書ファイルが開かれた場合、その
ファイル情報をかな漢字変換部へ通知するファイルオー
プン部と、前記かな漢字変換部に設けられて、前記ファ
イル情報の通知を受けて、文書ファイル内の前記学習単
語情報をメモリ上へロードし、その学習単語情報に含ま
れる単語が現在使用中の単語辞書に存在するか否かを検
索し、存在しない未登録の単語のみを取込む学習単語候
補取込み部とを設けて、日本語変換処理部に、利用者が
入力した読み情報が、前記学習単語候補取込み部で取込
んだ単語に該当する場合、文法的に問題がなければ最初
の変換候補として出力させ、更に、その単語が選択され
た場合は、単語登録させるかを利用者に確認させ、また
は必要なら自動的に単語登録を行わせるようにしたもの
である。
【0008】また、請求項2の発明にかかる日本語入力
システムは、前記学習単語候補取込み部に、前記学習単
語候補切出し部で切出した単語情報と現在使用中の単語
辞書とを照合した結果、未登録語と断定した単語を第1
の学習単語候補テーブルに格納させるようにしたもので
ある。
システムは、前記学習単語候補取込み部に、前記学習単
語候補切出し部で切出した単語情報と現在使用中の単語
辞書とを照合した結果、未登録語と断定した単語を第1
の学習単語候補テーブルに格納させるようにしたもので
ある。
【0009】また、請求項3の発明にかかる日本語入力
システムは、前記かな漢字変換部に、前記学習単語候補
取込み部で取込んだ単語を選択して単語辞書へ登録させ
る単語登録部を設けたものである。
システムは、前記かな漢字変換部に、前記学習単語候補
取込み部で取込んだ単語を選択して単語辞書へ登録させ
る単語登録部を設けたものである。
【0010】また、請求項4の発明にかかる日本語入力
システムは、前記かな漢字変換部に、前記日本語変換処
理部で作成した変換結果を表示装置に表示させる画面表
示部を設けたものである。
システムは、前記かな漢字変換部に、前記日本語変換処
理部で作成した変換結果を表示装置に表示させる画面表
示部を設けたものである。
【0011】
【発明の実施の形態】以下、この発明の実施の一形態を
図について説明する。図1において、110は利用者が
キーボード装置113より入力したキー情報をもとに、
変換処理に必要な読み情報を作成したり、また文字列の
変換、文字列の選択等のかな漢字変換処理を判断する入
力処理部、111はかな漢字変換処理の結果をCRTデ
ィスプレイなどの表示装置114へ出力する画面表示
部、108は一般的な漢字,ひらがな,熟語や利用者が
追加したユーザ単語が登録されている単語辞書、105
は学習単語候補切出し部であり、利用者がキーボード装
置113より読み文字列を入力し、変換を行った後、ど
のような操作が行われるか監視し、文節を区切り直す
か、またはカタカナ変換(文節内の文字列をすべてカタ
カナ文字列に変更する)が行われた場合、その文節の位
置を記憶しておき、利用者が変換文字列を確定した段階
で、文節の位置をもとに未登録語を抽出し、また、確定
文字列中にユーザ登録単語が含まれていた場合は、その
文字列も抽出する。
図について説明する。図1において、110は利用者が
キーボード装置113より入力したキー情報をもとに、
変換処理に必要な読み情報を作成したり、また文字列の
変換、文字列の選択等のかな漢字変換処理を判断する入
力処理部、111はかな漢字変換処理の結果をCRTデ
ィスプレイなどの表示装置114へ出力する画面表示
部、108は一般的な漢字,ひらがな,熟語や利用者が
追加したユーザ単語が登録されている単語辞書、105
は学習単語候補切出し部であり、利用者がキーボード装
置113より読み文字列を入力し、変換を行った後、ど
のような操作が行われるか監視し、文節を区切り直す
か、またはカタカナ変換(文節内の文字列をすべてカタ
カナ文字列に変更する)が行われた場合、その文節の位
置を記憶しておき、利用者が変換文字列を確定した段階
で、文節の位置をもとに未登録語を抽出し、また、確定
文字列中にユーザ登録単語が含まれていた場合は、その
文字列も抽出する。
【0012】更に、この学習単語候補切出し部105は
付属語テーブルを用いて品詞情報及び自立語を決定し、
自立語部分とその読み文字列及びフラグ(品詞と学習単
語候補であることを示す)情報を、第2の学習単語候補
テーブル109に保存する。104は利用者が入力を完
了し文書を保存する際、前記第2の学習単語候補テーブ
ル109の情報を参照し、文書ファイル内に学習単語候
補テーブル109として追加保存することが可能なファ
イル保存部である。101は利用者により前記情報が付
加された文書ファイルがオープンされた場合、文書ファ
イル情報を学習単語候補取込み102に通知するファイ
ルオープン部である。
付属語テーブルを用いて品詞情報及び自立語を決定し、
自立語部分とその読み文字列及びフラグ(品詞と学習単
語候補であることを示す)情報を、第2の学習単語候補
テーブル109に保存する。104は利用者が入力を完
了し文書を保存する際、前記第2の学習単語候補テーブ
ル109の情報を参照し、文書ファイル内に学習単語候
補テーブル109として追加保存することが可能なファ
イル保存部である。101は利用者により前記情報が付
加された文書ファイルがオープンされた場合、文書ファ
イル情報を学習単語候補取込み102に通知するファイ
ルオープン部である。
【0013】また、102は前記ファイルオープン部1
01から入手したファイル情報をもとに、文書ファイル
内の第2の学習単語候補テーブル部109のみをメモリ
上へロードし、第2の学習単語候補テーブル109内の
単語が既に単語辞書108に登録されていないか検索
し、存在しない単語のみを第1の学習単語候補テーブル
103へ保存する学習単語取込み部、106は入力処理
部110から入手した情報をもとに単語辞書108を検
索し、変換処理等を行う日本語変換処理部で、更に、利
用者が入力した読みに該当する単語が第1の学習単語候
補テーブル103に存在する場合はその単語を優先的に
出力し、利用者がその文字列を確定した場合に単語辞書
108へ登録するか確認後、必要なら自動的に単語登録
を行う機能も有する。107は前記日本後変換処理部1
06より単語,単語の読み,品詞情報を入手し単語辞書
108へ登録を行う単語登録部である。
01から入手したファイル情報をもとに、文書ファイル
内の第2の学習単語候補テーブル部109のみをメモリ
上へロードし、第2の学習単語候補テーブル109内の
単語が既に単語辞書108に登録されていないか検索
し、存在しない単語のみを第1の学習単語候補テーブル
103へ保存する学習単語取込み部、106は入力処理
部110から入手した情報をもとに単語辞書108を検
索し、変換処理等を行う日本語変換処理部で、更に、利
用者が入力した読みに該当する単語が第1の学習単語候
補テーブル103に存在する場合はその単語を優先的に
出力し、利用者がその文字列を確定した場合に単語辞書
108へ登録するか確認後、必要なら自動的に単語登録
を行う機能も有する。107は前記日本後変換処理部1
06より単語,単語の読み,品詞情報を入手し単語辞書
108へ登録を行う単語登録部である。
【0014】次にこの発明の動作について、図2〜図8
を参照して詳細に説明する。図2はこの発明における特
徴的な利用形態を示した図である。電子メールシステム
において各利用者A,Bは、個々に単語辞書108A,
108Bを有しており、同一の日本語入力システムで
も、運用の仕方(ユーザ登録単語や学習文字列の違い)
により、単語辞書の内容が異なってくる。例えば、利用
者Bは”古手川”という人名をユーザ単語として単語辞
書108Bに登録しており、その文字列を含んだ文書を
作成し利用者Aに送付すると、利用者Aは受け取った文
書上で、再度古手側”を入力したいが、単語辞書108
Aにはその単語が含まれていないため、区切り直し操作
文字列を作る必要がある。あるいは、辞書に存在しない
漢字が含まれている単語(利用者Bがユーザ登録した単
語)は、かな漢字変換を用いた操作では入力が行えな
い。
を参照して詳細に説明する。図2はこの発明における特
徴的な利用形態を示した図である。電子メールシステム
において各利用者A,Bは、個々に単語辞書108A,
108Bを有しており、同一の日本語入力システムで
も、運用の仕方(ユーザ登録単語や学習文字列の違い)
により、単語辞書の内容が異なってくる。例えば、利用
者Bは”古手川”という人名をユーザ単語として単語辞
書108Bに登録しており、その文字列を含んだ文書を
作成し利用者Aに送付すると、利用者Aは受け取った文
書上で、再度古手側”を入力したいが、単語辞書108
Aにはその単語が含まれていないため、区切り直し操作
文字列を作る必要がある。あるいは、辞書に存在しない
漢字が含まれている単語(利用者Bがユーザ登録した単
語)は、かな漢字変換を用いた操作では入力が行えな
い。
【0015】この発明では、文書内に既に入力されてい
る単語/熟語(漢字やカタカナで構成される)のうち、
利用者の辞書に存在しない未登録語を他の利用者が文書
作成時に抽出し、文書ファイル内に保持することで、そ
の文書ファイルを再編集する場合にそれらの単語を取出
して自動的に学習することで、未登録語を意識すること
なく日本語入力が可能になる。
る単語/熟語(漢字やカタカナで構成される)のうち、
利用者の辞書に存在しない未登録語を他の利用者が文書
作成時に抽出し、文書ファイル内に保持することで、そ
の文書ファイルを再編集する場合にそれらの単語を取出
して自動的に学習することで、未登録語を意識すること
なく日本語入力が可能になる。
【0016】図3は前記文書ファイルの構造図で、この
文書ファイルは文書ヘッダ部301、画面表示文字列3
02および学習単語候補テーブル部303から構成され
ている。更に学習単語候補テーブル部303は学習単語
候補テーブルの容量を示す全データ長304、格納され
ている単語/熟語の数を示す学習文字列数305、及び
文字列登録エリア306を構成する読み文字列307、
単語/熟語文字列としての学習文字列308、品詞と学
習単語候補テーブル部303内に含まれる単語/熟語で
あることを示すフラグ309などから構成されている。
図1に示す第1,第2の学習単語候補テーブル103,
109も同様の構成を持つ。また、図4は品詞の決定及
び自立語部分の判定に使用する付属語テーブルを示す。
文書ファイルは文書ヘッダ部301、画面表示文字列3
02および学習単語候補テーブル部303から構成され
ている。更に学習単語候補テーブル部303は学習単語
候補テーブルの容量を示す全データ長304、格納され
ている単語/熟語の数を示す学習文字列数305、及び
文字列登録エリア306を構成する読み文字列307、
単語/熟語文字列としての学習文字列308、品詞と学
習単語候補テーブル部303内に含まれる単語/熟語で
あることを示すフラグ309などから構成されている。
図1に示す第1,第2の学習単語候補テーブル103,
109も同様の構成を持つ。また、図4は品詞の決定及
び自立語部分の判定に使用する付属語テーブルを示す。
【0017】図5は図1における学習単語候補切出し部
105の詳細を示す機能構成図で、これが操作監視部4
01、学習単語候補検出部402、学習単語候補情報作
成部403からなる。これらのうち、操作監視部401
は利用者が読み文字列を入力し、日本語変換処理を行っ
た後、その変換文字列に対し文節の区切り直しあるい
は、カタカナ変換が行われるかを監視し、修正が行われ
た場合は、修正された文節を記憶する。
105の詳細を示す機能構成図で、これが操作監視部4
01、学習単語候補検出部402、学習単語候補情報作
成部403からなる。これらのうち、操作監視部401
は利用者が読み文字列を入力し、日本語変換処理を行っ
た後、その変換文字列に対し文節の区切り直しあるい
は、カタカナ変換が行われるかを監視し、修正が行われ
た場合は、修正された文節を記憶する。
【0018】また、学習単語候補検出部402は利用者
が修正を完了し確定した文字列に対し、操作監視部40
1で記憶した文節位置から、付属後が含まれる文字列が
存在する文節までを、学習単語候補文字列として抽出す
る。更に、確定文字列内にユーザ登録単語が存在するか
を、かな漢字変換処理時の内部情報を参照することで判
断し、あれば抽出する。さらに学習単語候補情報作成部
403は前記学習単語候補検出部402で抽出した文字
列に対し、図4に示すような付属語テーブルを検証する
ことで、品詞を決定し、更に文字列から付属語部分を取
り除き、図1に示す第2の学習単語候補テーブル109
へ格納する。
が修正を完了し確定した文字列に対し、操作監視部40
1で記憶した文節位置から、付属後が含まれる文字列が
存在する文節までを、学習単語候補文字列として抽出す
る。更に、確定文字列内にユーザ登録単語が存在するか
を、かな漢字変換処理時の内部情報を参照することで判
断し、あれば抽出する。さらに学習単語候補情報作成部
403は前記学習単語候補検出部402で抽出した文字
列に対し、図4に示すような付属語テーブルを検証する
ことで、品詞を決定し、更に文字列から付属語部分を取
り除き、図1に示す第2の学習単語候補テーブル109
へ格納する。
【0019】図6は図1における学習単語候補取込み部
102の詳細を示す機能構成図で、これが文書情報ロー
ド部501と学習単語候補テーブル検索部502とから
構成されている。文書情報ロード部501は利用者が文
書ファイルをオープンした時点で、図1に示すファイル
オープン部101よりファイル情報を受け取り、文書フ
ァイル内の学習単語候補テーブル部303をメモリ上へ
ロードし、第1の学習単語候補テーブル103を作成す
る。学習単語候補テーブル検索部502は第1の学習単
語候補テーブル103に含まれる単語について、単語辞
書に存在するか否かを検証し、既に存在する単語があれ
ば、第1の学習単語候補テーブル103から削除する。
102の詳細を示す機能構成図で、これが文書情報ロー
ド部501と学習単語候補テーブル検索部502とから
構成されている。文書情報ロード部501は利用者が文
書ファイルをオープンした時点で、図1に示すファイル
オープン部101よりファイル情報を受け取り、文書フ
ァイル内の学習単語候補テーブル部303をメモリ上へ
ロードし、第1の学習単語候補テーブル103を作成す
る。学習単語候補テーブル検索部502は第1の学習単
語候補テーブル103に含まれる単語について、単語辞
書に存在するか否かを検証し、既に存在する単語があれ
ば、第1の学習単語候補テーブル103から削除する。
【0020】また、図7は学習単語候補切出し部105
における処理手順を示すフロー図である。まず、利用者
は入力を開始する(ステップS601)。例えば、”大
動物展が開催される”と入力すると、かな漢字変換処理
が実行され(ステップS602)、”大同/物展が/開
催される”と変換された場合の未登録語の抽出方法につ
いて説明する。いま、前記変換が正しく、利用者は文字
列を確定しない場合には(ステップS603)、修正処
理を監視し(ステップS604)、文字を区切り直す
か、カタカナ変換を実行し(ステップS605)、変換
文字列を確定したとき文節位置を記憶する(ステップS
606)。すなわち、利用者は意図した変換文字列が得
られないため、第1文節の”大同”を”大/同”で区切
り直しを行う。その結果”大/動物/展が/開催され
る”との変換結果を得る。そして、このように区切り直
しが行われた第1文節を記憶する。なお、ステップS6
05で文節変更やカタカナ変換が実行されない場合に
は、その他の処理を実行する(ステップS613)。
における処理手順を示すフロー図である。まず、利用者
は入力を開始する(ステップS601)。例えば、”大
動物展が開催される”と入力すると、かな漢字変換処理
が実行され(ステップS602)、”大同/物展が/開
催される”と変換された場合の未登録語の抽出方法につ
いて説明する。いま、前記変換が正しく、利用者は文字
列を確定しない場合には(ステップS603)、修正処
理を監視し(ステップS604)、文字を区切り直す
か、カタカナ変換を実行し(ステップS605)、変換
文字列を確定したとき文節位置を記憶する(ステップS
606)。すなわち、利用者は意図した変換文字列が得
られないため、第1文節の”大同”を”大/同”で区切
り直しを行う。その結果”大/動物/展が/開催され
る”との変換結果を得る。そして、このように区切り直
しが行われた第1文節を記憶する。なお、ステップS6
05で文節変更やカタカナ変換が実行されない場合に
は、その他の処理を実行する(ステップS613)。
【0021】次に文字列を確定した場合には、利用者が
意図した変換結果が得られたため、ステップS603で
文字列を確定する。そして、記憶された文節があるか、
更にユーザ登録単語が含まれるか否かを確認する(ステ
ップS607)。なお、ユーザ登録単語が存在するかど
うかは、変換処理時の内部情報を参照することで、容易
に確認できる。続いて、修正のあった文字列(未登録
語)およびユーザ登録単語を抽出し(ステップS60
8)、未登録語については、ステップS607で記憶し
た文節位置にもとづいて、その文節内の文字列から付属
語テーブルに含まれる付属語が存在する文節までを学習
単語候補文字列として抽出する。例えば、”大/動物/
展が/開催される”の場合、第1文節から文字列をサー
チし、付属語”が”が含まれる第3文節までの文字列”
大動物展が”を抽出する。ユーザ登録単語については、
全て1文節で構成されるため、該当文節の文字列を抽出
する。
意図した変換結果が得られたため、ステップS603で
文字列を確定する。そして、記憶された文節があるか、
更にユーザ登録単語が含まれるか否かを確認する(ステ
ップS607)。なお、ユーザ登録単語が存在するかど
うかは、変換処理時の内部情報を参照することで、容易
に確認できる。続いて、修正のあった文字列(未登録
語)およびユーザ登録単語を抽出し(ステップS60
8)、未登録語については、ステップS607で記憶し
た文節位置にもとづいて、その文節内の文字列から付属
語テーブルに含まれる付属語が存在する文節までを学習
単語候補文字列として抽出する。例えば、”大/動物/
展が/開催される”の場合、第1文節から文字列をサー
チし、付属語”が”が含まれる第3文節までの文字列”
大動物展が”を抽出する。ユーザ登録単語については、
全て1文節で構成されるため、該当文節の文字列を抽出
する。
【0022】次にステップS608で抽出した文字列の
付属語から、品詞を決定し(ステップS609)、更
に、その付属語部分を取り除き単語を抽出する。”大動
物展が”の場合、付属語テーブルより付属語”が”は名
詞と判断でき、”が”を取り除いた”大動物展”を単語
として抽出できる。続いて、摘出した”大動物展”が、
既に学習単語候補として、第1および第2の学習単語候
補テーブル103,109に存在するか否かを確認し、
存在すれば該単語を学習単語候補から削除する(ステッ
プS611)。もし、存在しなければ、取り出された単
語を第2の学習単語候補テーブル109に格納する(ス
テップS612)。
付属語から、品詞を決定し(ステップS609)、更
に、その付属語部分を取り除き単語を抽出する。”大動
物展が”の場合、付属語テーブルより付属語”が”は名
詞と判断でき、”が”を取り除いた”大動物展”を単語
として抽出できる。続いて、摘出した”大動物展”が、
既に学習単語候補として、第1および第2の学習単語候
補テーブル103,109に存在するか否かを確認し、
存在すれば該単語を学習単語候補から削除する(ステッ
プS611)。もし、存在しなければ、取り出された単
語を第2の学習単語候補テーブル109に格納する(ス
テップS612)。
【0023】図8は図1における学習単語候補取込み部
102による処理手順を示すフロー図である。まず、図
1におけるアプリケーション部114のファイルオープ
ン部101よりファイル情報を入手し(ステップS70
1)、文書ファイル内の学習単語候補テーブル部303
をメモリ上へロードし、第1の学習単語候補テーブル1
03を作成する(ステップS702)。さらに、単語辞
書を検索し(ステップS703)、既に登録されている
単語がないか確認する(ステップS704)。既に存在
する単語が含まれている場合は、該単語を削除し、第1
の学習単語候補テーブル103を再編成する(ステップ
S705)。
102による処理手順を示すフロー図である。まず、図
1におけるアプリケーション部114のファイルオープ
ン部101よりファイル情報を入手し(ステップS70
1)、文書ファイル内の学習単語候補テーブル部303
をメモリ上へロードし、第1の学習単語候補テーブル1
03を作成する(ステップS702)。さらに、単語辞
書を検索し(ステップS703)、既に登録されている
単語がないか確認する(ステップS704)。既に存在
する単語が含まれている場合は、該単語を削除し、第1
の学習単語候補テーブル103を再編成する(ステップ
S705)。
【0024】図9は図1における日本語変換処理部10
6による処理手順を示すフロー図である。これによれ
ば、まず、処理の種別を判定し(ステップS801)、
変換処理である場合には、利用者が読み文字列を入力し
変換処理を実行した際(ステップS802)、入力した
読み文字列の中に第1の学習単語候補テーブル103に
存在する読みが指定されているか否かを判断し(ステッ
プS803)、存在した場合は品詞情報のチェックを行
い、その読みに該当する単語が変換候補として成立する
か否かを確認する(ステップS804)。成立すると判
断した場合は、最初の変換候補として出力するよう変更
する(ステップS805)。
6による処理手順を示すフロー図である。これによれ
ば、まず、処理の種別を判定し(ステップS801)、
変換処理である場合には、利用者が読み文字列を入力し
変換処理を実行した際(ステップS802)、入力した
読み文字列の中に第1の学習単語候補テーブル103に
存在する読みが指定されているか否かを判断し(ステッ
プS803)、存在した場合は品詞情報のチェックを行
い、その読みに該当する単語が変換候補として成立する
か否かを確認する(ステップS804)。成立すると判
断した場合は、最初の変換候補として出力するよう変更
する(ステップS805)。
【0025】更に、学習処理を選択し、利用者が変換文
字列を確定した場合、その単語を選択したか否かを判断
し(ステップST806)、選択された場合は単語辞書
へ登録するか否かを利用者に確認する(ステップS80
7)。確認した結果、辞書への登録を要求された場合
は、該単語及び単語の読み及び品詞情報を図1における
単語登録部107へ通知し、単語辞書への登録を行う
(ステップS808)。なお、ステップS806で第1
の学習候補テーブルに含まれる候補がないと判定された
場合には、従来の学習処理を実行する(ステップS80
9)。また、ステップS801でその他の処理が選択さ
れた場合には、既存の処理を実行する(ステップS81
0)。
字列を確定した場合、その単語を選択したか否かを判断
し(ステップST806)、選択された場合は単語辞書
へ登録するか否かを利用者に確認する(ステップS80
7)。確認した結果、辞書への登録を要求された場合
は、該単語及び単語の読み及び品詞情報を図1における
単語登録部107へ通知し、単語辞書への登録を行う
(ステップS808)。なお、ステップS806で第1
の学習候補テーブルに含まれる候補がないと判定された
場合には、従来の学習処理を実行する(ステップS80
9)。また、ステップS801でその他の処理が選択さ
れた場合には、既存の処理を実行する(ステップS81
0)。
【0026】
【発明の効果】以上のように、この発明によれば、既に
入力済みの文字列以外に、その文字列内に含まれるユー
ザ登録単語及び未登録語の情報を文書ファイル内に持
ち、その情報をもとに、事前に学習することができるよ
うにしたので、既に日本語文字列が入力されている文書
を利用者が編集/修正する際、その文書内の単語を再入
力するケースで、現在使用している単語辞書に存在しな
い単語が含まれていても、かな漢字変換の最初の変換候
補として出力することが可能になる。これにより利用者
は余分な操作を行わず、思考を中断することなく文字の
入力を行うことができるという効果が得られる。
入力済みの文字列以外に、その文字列内に含まれるユー
ザ登録単語及び未登録語の情報を文書ファイル内に持
ち、その情報をもとに、事前に学習することができるよ
うにしたので、既に日本語文字列が入力されている文書
を利用者が編集/修正する際、その文書内の単語を再入
力するケースで、現在使用している単語辞書に存在しな
い単語が含まれていても、かな漢字変換の最初の変換候
補として出力することが可能になる。これにより利用者
は余分な操作を行わず、思考を中断することなく文字の
入力を行うことができるという効果が得られる。
【0027】また、この発明によれば、文書ファイルの
情報から自動学習した単語を利用者が入力した際、利用
者の指示により、自動的に単語辞書へ登録することが可
能になる。これにより、登録に必要な読みや品詞情報を
予め備えることによって、利用者は単語登録機能を使っ
て単語や読み文字列及び品詞情報の設定等煩わしい操作
を行わなくとも、単語辞書へ登録することができるとい
う効果が得られる。
情報から自動学習した単語を利用者が入力した際、利用
者の指示により、自動的に単語辞書へ登録することが可
能になる。これにより、登録に必要な読みや品詞情報を
予め備えることによって、利用者は単語登録機能を使っ
て単語や読み文字列及び品詞情報の設定等煩わしい操作
を行わなくとも、単語辞書へ登録することができるとい
う効果が得られる。
【図1】 この発明による日本語入力システムの実施の
一形態を示すブロック図である。
一形態を示すブロック図である。
【図2】 図1における日本語入力システムの利用の形
態を示す説明図である。
態を示す説明図である。
【図3】 この発明における文書ファイルの構成を示す
構成図である。
構成図である。
【図4】 この発明における付属語テーブルの構成を示
す説明図である。
す説明図である。
【図5】 図1における学習単語候補切出し部の概略構
成を示すブロック図である。
成を示すブロック図である。
【図6】 図1における学習単語候補取込み部の概略構
成を示すブロック図である。
成を示すブロック図である。
【図7】 図1における学習単語候補切出し部の動作を
示すフローチャートである。
示すフローチャートである。
【図8】 図1における学習単語候補取出し部の動作を
示すフローチャートである。
示すフローチャートである。
【図9】 図1における日本語変換処理部の動作を示す
フローチャートである。
フローチャートである。
101 ファイルオープン部 102 学習単語候補取込み部 103 第1の学習単語候補テーブル 104 ファイル保存部 105 学習単語候補切出し部 106 日本語変換処理部 107 単語登録部 108 単語辞書 111 画面表示部 118 かな漢字変換部
Claims (4)
- 【請求項1】 かな漢字変換部に設けられて、利用者が
文書内に日本語入力を開始し、確定した文字列の中で、
ユーザ登録単語及び単語辞書に存在しない未登録語を抽
出する学習単語候補切出し部と、 利用者の入力が完了して文書を保存する際、実際に入力
された文字列以外に前記学習単語候補切出し部で抽出し
たユーザ登録単語及び未登録語からなる学習単語情報も
併せて文書ファイル内に追加して保存するファイル保存
部と、 前記文書ファイルが開かれた場合、そのファイル情報を
かな漢字変換部へ通知するファイルオープン部と、 前記かな漢字変換部に設けられて、前記ファイル情報の
通知を受けて、文書ファイル内の前記学習単語情報をメ
モリ上へロードし、その学習単語情報に含まれる単語が
現在使用中の単語辞書に存在するか否かを検索し、存在
しない未登録の単語のみを取込む学習単語候補取込み部
と、 利用者が入力した読み情報が、前記学習単語候補取込み
部で取込んだ単語に該当する場合、文法的に問題がなけ
れば最初の変換候補として出力し、更に、その単語が選
択された場合は、単語登録するかを利用者に確認し、ま
たは必要なら自動的に単語登録を行う日本語変換処理部
とを備えたことを特徴とする日本語入力システム。 - 【請求項2】 前記学習単語候補取込み部が、前記学習
単語候補切出し部で切出した単語情報と現在使用中の単
語辞書とを照合した結果、未登録語と断定した単語を第
1の学習単語候補テーブルに格納することを特徴とする
請求項1に記載の日本語入力システム。 - 【請求項3】 前記かな漢字変換部に、前記学習単語候
補取込み部で取込んだ単語を選択して単語辞書へ登録さ
せる単語登録部を有することを特徴とする請求項1に記
載の日本語入力システム。 - 【請求項4】 前記かな漢字変換部に、前記日本語変換
処理部で作成した変換結果を表示装置に表示させる画面
表示部を有することを特徴とする請求項1に記載の日本
語入力システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9137215A JP2974295B2 (ja) | 1997-05-27 | 1997-05-27 | 日本語入力システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9137215A JP2974295B2 (ja) | 1997-05-27 | 1997-05-27 | 日本語入力システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10334090A JPH10334090A (ja) | 1998-12-18 |
JP2974295B2 true JP2974295B2 (ja) | 1999-11-10 |
Family
ID=15193487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9137215A Expired - Lifetime JP2974295B2 (ja) | 1997-05-27 | 1997-05-27 | 日本語入力システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2974295B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001339424A (ja) * | 2000-05-26 | 2001-12-07 | Nec Corp | 電子メール処理システム、処理方法及び処理装置 |
-
1997
- 1997-05-27 JP JP9137215A patent/JP2974295B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH10334090A (ja) | 1998-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3598211B2 (ja) | 関連語抽出装置および関連語抽出方法および関連語抽出プログラムが記録されたコンピュータ読取可能な記録媒体 | |
JP4544674B2 (ja) | 選択文字列に関連する情報を提供するシステム | |
JPH05314166A (ja) | 電子化辞書および辞書検索装置 | |
US7957956B2 (en) | Systems and methods for normalization of linguistic structures | |
JPH08235182A (ja) | 文章処理方法とその装置 | |
JP2974295B2 (ja) | 日本語入力システム | |
JP2785692B2 (ja) | 辞書検索表示装置 | |
JP4039635B2 (ja) | 言語情報処理装置 | |
JP2840258B2 (ja) | 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法 | |
JP2000207475A (ja) | 文書作成装置及び文書作成プログラムを記録した機械読み取り可能な記録媒体 | |
JP3025847B2 (ja) | 電子化辞書検索方法 | |
JP3783053B2 (ja) | 負の例予測処理方法、処理プログラムおよび処理装置、負の例予測処理を用いた日本語表記誤り検出処理プログラムおよび処理装置、ならびに負の例予測処理を用いた外の関係検出処理プログラムおよび処理装置 | |
JP3935374B2 (ja) | 辞書構築支援方法、装置及びプログラム | |
JP2893911B2 (ja) | 文章読解支援装置 | |
JPH06223113A (ja) | 電子ファイリング装置 | |
JP3278889B2 (ja) | 機械翻訳装置 | |
JP2982076B2 (ja) | 文章処理装置および方法 | |
JP2776069B2 (ja) | 文章検査装置 | |
JPH03129568A (ja) | 文書処理装置 | |
JP4039583B2 (ja) | 言語情報処理装置 | |
JPH07200592A (ja) | 文章処理装置 | |
JPH08314934A (ja) | 辞書登録システム | |
JPS63136264A (ja) | 機械翻訳装置 | |
JPH0816589A (ja) | 構造化文書処理装置 | |
JPH04139568A (ja) | 文書処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19990727 |