JP2009169710A

JP2009169710A - データ処理装置

Info

Publication number: JP2009169710A
Application number: JP2008007625A
Authority: JP
Inventors: Yukiko Kaida; 有紀子開田
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2008-01-17
Filing date: 2008-01-17
Publication date: 2009-07-30

Abstract

【課題】ユーザのログイン時にそのユーザ用に１つにまとめた統合辞書を作成し、その統合辞書を検索することにより、データ処理装置に搭載する辞書を増やしても新たな検索モジュールを追加しなくて済むようにする。
【解決手段】データ処理部３は、ユーザのログイン時に、ＨＤＤ１から予め記憶されている言語辞書１０，ユーザ辞書２０，グループ辞書３０の各辞書とその各辞書内のデータ格納のフォーマット情報と、新たに作成する統合辞書５１内のデータ格納のフォーマット情報とを取得し、上記各辞書からそれぞれのフォーマット情報に基づいて読み出した各データを上記新たに作成する辞書内のデータ格納のフォーマット情報に基づくデータ格納のフォーマットで１つにまとめた統合辞書５１を作成してＲＡＭ４に格納する。
【選択図】図１

Description

この発明は、ファクシミリ装置、複写機、プリンタ、それらの複合機、コンピュータを含むデータ処理装置に関する。

ファクシミリ装置、複写機、プリンタ、それらの複合機、コンピュータを含むデータ処理装置における文字入力では、入力されたかな文字に対する単語の予測変換を行う場合、候補単語の検索には辞書が必要である（例えば、特許文献１，２参照）。
例えば、ユーザ辞書、グループ辞書、言語辞書を含む複数種類の辞書が搭載されている複合機（ＭＦＰ）では、ユーザによって検索対象の辞書の種類を変えることにより、ユーザの入力したかな文字に対してユーザが望む候補単語を出し易くすることができる。
特開平１０−１５４０３３号公報特開２００３−２３３６０５号公報

しかしながら、従来のデータ処理装置は、ユーザが入力したかな文字に対する候補単語を検索する際、複数種類の辞書を別々に検索するので、新たな種類の辞書を追加する場合に、その新たに追加した辞書を検索するモジュールを追加しなければならないし、その新たな種類の辞書のフォーマットが既存の辞書と異なる場合、その新たに追加した辞書を検索するモジュール内の検索アルゴリズムを新たに実装しなければならないという問題があった。
この発明は上記の点に鑑みてなされたものであり、ユーザのログイン時にそのユーザ用に１つにまとめた統合辞書を作成し、その統合辞書を検索することにより、データ処理装置に搭載する辞書を増やしても新たな検索モジュールを追加しなくて済むようにすることを目的とする。

この発明は上記の目的を達成するため、次のデータ処理装置を提供する。
（１）ユーザのログイン時に、予め記憶されている複数の辞書と各辞書内のデータ格納のフォーマット情報と、新たに作成する統合辞書内のデータ格納のフォーマット情報とを取得し、上記各辞書からそれぞれのフォーマット情報に基づいて読み出した各データを上記新たに作成する統合辞書内のデータ格納のフォーマット情報に基づくデータ格納のフォーマットで１つにまとめた統合辞書を作成する手段を備えたデータ処理装置。
（２）上記のようなデータ処理装置において、上記複数の辞書のデータを１つにまとめるときの順番を予め格納し、上記各辞書内のデータを統合辞書にまとめる際、上記順番で各辞書のデータを１つにまとめるようにしたデータ処理装置。
（３）上記のようなデータ処理装置において、上記順番をユーザ毎に格納するようにしたデータ処理装置。

（４）上記のようなデータ処理装置において、上記各辞書内のデータを統合辞書にまとめる際、重複する複数のデータは１つのみを残して他のデータを削除するようにしたデータ処理装置。
（５）上記のようなデータ処理装置において、上記各辞書の各データには出所先の辞書を示す識別情報が付与されているデータ処理装置。
（６）上記のようなデータ処理装置において、上記識別情報は、上記各辞書毎に異なる数値であり、上記各辞書内のデータを統合辞書にまとめる際、重複する複数のデータは１つのみを残して他のデータを削除するとき、残すデータの識別情報の数値と削除するデータの識別情報の数値とを加算した結果の数値を上記残すデータの識別情報として添付するようにしたデータ処理装置。

（７）上記のようなデータ処理装置において、上記統合辞書から検索した候補単語のデータを候補単語リストとして保存し、上記候補単語リストから候補単語のデータを検索するようにしたデータ処理装置。
（８）上記のようなデータ処理装置において、上記候補単語リストからの候補単語のデータ検索時、予め選択された辞書の識別情報が添付されたデータからのみ候補単語のデータを検索するようにしたデータ処理装置。
（９）上記のようなデータ処理装置において、上記統合辞書から検索した候補単語のデータを候補単語リストとして保存し、上記候補単語リストから候補単語のデータの検索時、重複する複数のデータが検索された場合、上記候補単語リストから重複する複数のデータは１つのみを残して他のデータを削除するようにしたデータ処理装置。

この発明によるデータ処理装置は、ユーザのログイン時にそのユーザ用に１つにまとめた統合辞書を作成し、その統合辞書を検索するので、データ処理装置に搭載する辞書を増やしても新たな検索モジュールを追加しなくて済むようにすることができる。

以下、この発明を実施するための最良の形態を図面に基づいて具体的に説明する。
〔実施例〕
図１は、この発明の実施例のデータ処理装置の機能構成を示すブロック図である。
このデータ処理装置は、ファクシミリ装置、複写機、プリンタ、それらの複合機、コンピュータを含む文字入力可能な装置であり、ハードディスク装置（ＨＤＤ）１，操作表示部２，データ処理部３，ＲＡＭ４，及び検索部５を備えている。
ＨＤＤ１は、大容量の記憶装置であり、言語辞書１０，ユーザ辞書２０，グループ辞書３０と、統合辞書用構成情報４１，優先度情報４２，ユーザ情報４３，フラグ情報４４を格納している。
ＲＡＭ４は、統合辞書５１，候補単語リスト５２，前入力文字列５３を格納している。

ＨＤＤ１の言語辞書１０には、例えば、日本語辞書１１とその構成情報１２、英語辞書１３とその構成情報１４を含む複数種類の言語の辞書とそれぞれの構成情報とを対応させて記憶している。
図２は、言語辞書１０の日本語辞書１１のデータ格納例を示す図である。
言語辞書１０内の各辞書は、検索キー，文字列，単語種別フラグの項目からなる。

例えば、日本語辞書１１の場合、検索キーは、ユーザによって入力されるかな文字であり、それに対応する文字列の読み仮名に相当する。また、文字列は、検索キーに対応する単語又は漢字混じりの文字列であり、ユーザによって入力されたかな文字に対応する単語又は漢字混じりの文字列が候補単語として検索される。さらに、単語種別フラグは、単語の種類を示すフラグ情報である。
この単語種別フラグは、日本語辞書１１の場合、例えば、通常単語を示す「０」、会社名／人名を示す「１」、地名を示す「２」、上記１，２以外の固有名詞を示す「３」、略称を示す「４」がある。
図２に示すように、検索キー「にほん」には、文字列「日本」と単語種別フラグ「２」が対応させて記憶されている。

ＨＤＤ１のユーザ辞書２０には、例えば、Ａさん用辞書２１とその構成情報２２、Ｂさん用辞書２３とその構成情報２４を含む複数のユーザ毎の辞書とそれぞれの構成情報とを対応させて記憶している。
図３は、ユーザ辞書２０のＡさん用辞書２１のデータ格納例を示す図である。
ユーザ辞書２０内の各辞書は、検索キー，文字列，単語種別フラグの項目からなる。

例えば、Ａさん用辞書２１の場合、検索キーは、ユーザによって入力されるかな文字であり、それに対応する文字列の読み仮名に相当する。また、文字列は、検索キーに対応する単語又は漢字混じりの文字列であり、ユーザによって入力されたかな文字に対応する単語又は漢字混じりの文字列が候補単語として検索される。さらに、単語種別フラグは、単語の種類を示すフラグ情報である。
この単語種別フラグは、日本語辞書１１の場合、例えば、通常単語を示す「０」、会社名／人名を示す「１」、地名を示す「２」、上記１，２以外の固有名詞を示す「３」、略称を示す「４」がある。
図３に示すように、検索キー「かいだ」には、文字列「開田」と単語種別フラグ「１」が対応させて記憶されている。

ＨＤＤ１のグループ辞書３０には、例えば、第１グループ辞書３１とその構成情報３２、第２グループ辞書３３とその構成情報３４を含む複数のグループ毎の辞書とそれぞれの構成情報とを対応させて記憶している。
図４は、グループ辞書３０の第１グループ辞書３１のデータ格納例を示す図である。
グループ辞書３０内の各辞書は、検索キー，文字列，単語種別フラグの項目からなり、ここでは、単語種別フラグ，検索キー，文字列の順に対応させて記憶されている。

例えば、第１グループ辞書３１の場合、検索キーは、ユーザによって入力されるかな文字であり、それに対応する文字列の読み仮名に相当する。また、文字列は、検索キーに対応する単語又は漢字・アルファベット混じりの文字列であり、ユーザによって入力されたかな文字に対応する単語又は漢字・アルファベット混じりの文字列が候補単語として検索される。さらに、単語種別フラグは、単語の種類を示すフラグ情報である。
この単語種別フラグは、日本語辞書１１の場合、例えば、通常単語を示す「０」、会社名／人名を示す「１」、地名を示す「２」、上記１，２以外の固有名詞を示す「３」、略称を示す「４」がある。
図４に示すように、単語種別フラグ「４」に、検索キー「えーびーかい」と文字列「ＡＢ開」とが対応させて記憶されている。

上記各辞書の構成情報は、それぞれの辞書のデータ格納のフォーマット情報を格納している。
図５は、図２に示す日本語辞書１１のデータフォーマット例とその構成情報の内容の一例を示す図である。
図６は、図３に示すＡさん用辞書２１のデータフォーマット例とその構成情報の内容の一例を示す図である。
図７は、図４に示す第１グループ辞書３１のデータフォーマット例とその構成情報の内容の一例を示す図である。

図５の（ａ）に示すように、日本語辞書１１には、上記各データが「にほん＿日本＿２↓」のように格納されており、図５の（ｂ）に示すように、その構成情報には、検索キー，文字列，単語識別フラグの各列の位置と、単語内区切り記号の種類と、単語間区切り記号の種類と、項目数と、辞書の種類とをそれぞれ示す情報が格納されている。
また、Ａさん用辞書２１と第１グループ辞書３１についても、それぞれ図６と図７に示すように、それぞれ上記日本語辞書１１の場合と同様の情報が格納されている。

図８は、図１に示す統合辞書用構成情報４１のデータ内容の一例を示す図である。
統合辞書用構成情報４１には、ユーザのログイン時に、データ処理部３が言語辞書１０，ユーザ辞書２０，グループ辞書３０のそれぞれに格納されている各辞書のデータを１つにまとめて作成する統合辞書５１のフォーマット情報である構成情報が格納されている。
例えば、図８に示すように、データ格納時の１列目を検索キーの列にし、２列目を文字列の列にし、３列目を出所フラグ（言語辞書１０，ユーザ辞書２０，グループ辞書３０のいずれに格納されていたデータであるかを示すフラグ）の列にし、単語内区切り記号を「タブ」にし、単語間区切り記号を「改行」にし、項目数を３にする情報と共に、辞書の種類が統合辞書であることを示す情報を格納する。

図９は、図１に示す優先度情報４２のデータ内容の一例を示す図である。
優先度情報４２には、ユーザのログイン時に、データ処理部３が言語辞書１０，ユーザ辞書２０，グループ辞書３０のそれぞれに格納されている各辞書のデータを１つにまとめて統合辞書５１を作成する際、そのまとめるときの順番を示す情報を格納しており、データ処理部３は、言語辞書１０，ユーザ辞書２０，グループ辞書３０のそれぞれに格納されている各辞書のデータを１つにまとめる際、この優先度情報４２に格納されている順番に従って各辞書のデータを１つにまとめる。

例えば、図９に示すように、統合辞書５１に１番目にユーザ辞書のデータを（優先度フラグは「０」にしている）、２番目にグループ辞書のデータを（優先度フラグは「１」にしている）、３番目に言語辞書のデータを（優先度フラグは「２」にしている）それぞれ格納していく。
ここでは、１種類のデータを示したが、この優先度情報４２は、ユーザ毎にそれぞれ登録することができ、上記データに各ユーザ名を格納することにより、ログインしたユーザ毎に対応するユーザ名が格納されている優先度情報を読み出すことができる。

図１０は、図１に示すユーザ情報４３のデータ内容の一例を示す図である。
ユーザ情報４３には、ユーザをグループ化した場合の各グループ内のユーザを示す情報を格納しており、グループ辞書３０の各辞書について、どのユーザが利用できるかを示すものでもある。
例えば、図１０に示すように、第１グループは、Ａさん，Ｂさん……からなり、第２グループは、Ａさん，Ｃさん……からなる。

図１１は、図１に示すフラグ情報４４のデータ内容の一例を示す図である。
フラグ情報４４には、上記出所フラグとして格納する辞書の種類を示す辞書フラグが格納されている。
例えば、図１１に示すように、ユーザ辞書の辞書フラグは「１」、グループ辞書の辞書フラグは「２」、言語辞書の辞書フラグは「４」である。

次に、このデータ処理装置におけるユーザのログイン時に統合辞書作成して格納するまでの処理について説明する。
図１２は、図１に示すデータ処理装置におけるユーザのログイン時に統合辞書作成して格納するまでの処理を示すシーケンス図である。
ステップ（図中「Ｓ」で示す）１で、ユーザが操作表示部２によって自己のユーザ名と、このデータ処理装置を利用するために予め付与されたパスワードとからなるログインの情報を入力すると、操作表示部２はその入力されたログインの情報をデータ処理部３へ送り、ステップ２で、データ処理部３は、そのユーザ名とパスワードに基づいてこのデータ処理装置を利用できる正規のユーザであるか否かを判断し、正規のユーザであると判断したらログインを許可するログイン処理を実行する。このログイン処理は、公知技術を用いればよいので、ここではその詳細な説明を省略する。

データ処理部３は、ステップ２でログイン処理を実行し、ユーザに対してログインを許可すると、ＨＤＤ１にアクセスし、ステップ３で統合辞書用構成情報４１を読み出して取得し、ステップ４で上記入力されたユーザ名に対応する優先度情報４２とユーザ情報４３を読み出して取得し、ステップ５で優先度情報４２とユーザ情報４３に基づいて言語辞書１０，ユーザ辞書２０，グループ辞書３０から各辞書とそれに対応する構成情報とフラグ情報４４とを読み出して取得し、ステップ６でそれらの取得した辞書と情報とに基づいて統合辞書５１を作成し、ステップ７で、統合辞書５１をＲＡＭ４に格納する。

次に、データ処理部３における上記統合辞書の作成の詳しい処理について説明する。
図１３は、図１に示すデータ処理部３における統合辞書の作成処理を示すフローチャート図である。
データ処理部３は、ステップ１１で、ＨＤＤ１から統合辞書用構成情報４１を読み出して取得し、ステップ１２で、操作表示部２から入力されたユーザ名に対応する優先度情報４２とユーザ情報４３とをＨＤＤ１から取得し、ステップ１３の初期設定でｉ＝０とし、ステップ１４の初期設定でｊ＝０とし、ステップ１５で、ＨＤＤ１から優先度情報４２に格納された優先度ｉの辞書とその構成情報を読み出して取得し、ステップ１６で、ＨＤＤ１からフラグ情報の優先度ｉの辞書の辞書ｊに対応する辞書フラグを読み出して取得し、ステップ１７の初期設定でｋ＝０とする。

ステップ１８で、優先度ｉの辞書の辞書ｊの構成情報に基づいて、優先度ｉの辞書の辞書ｊ内のｋ＋１番目の単語の検索キーと文字列を取得し、ステップ１９で、優先度ｉの辞書の辞書ｊ内のｋ＋１番目の単語の検索キーと文字列と辞書フラグ（この辞書フラグは出所フラグとして格納）を、統合辞書用構成情報に基づいて統合辞書のフォーマットの文字列に挿入する。この出所フラグは、単語がどの辞書に登録されていたものかの出所を示す情報になる。
このように、上記各辞書の各データには出所先の辞書を示す識別情報を付与している。

ステップ２０で、ｋ＝ｋ＋１とし、ステップ２１で、ｋ＞Ｎｗ［ｉ］＝辞書内の単語数か否かを判断し、ｋ＞Ｎｗ［ｉ］でなければ、ステップ１８へ戻って上述の処理を繰り返し、ｋ＞Ｎｗ［ｉ］なら、ステップ２２で、ｊ＞［ｉ］＝辞書内の辞書数（ここでは、例えば、ユーザ辞書なら、ユーザ辞書内のＡさん用辞書，Ｂさん用辞書，…の合計数）か否かを判断し、ｊ＞［ｉ］でなければ、ステップ２６でｊ＝ｊ＋１とし、ステップ１５へ戻って上述の処理を繰り返す。

ステップ２２の判断でｊ＞［ｉ］なら、ステップ２３で、統合辞書のフォーマットの文字列に挿入された検索キーと文字列と辞書フラグを、統合辞書のフォーマットのファイルに書き込み、統合辞書のフォーマットの文字列にＮＵＬＬを上書きし、ステップ２４で、ｉ＝ｉ＋１とし、ステップ２５でｉ＞Ｎｄ＝ＨＤＤ１内の辞書数（ここでは、言語辞書，ユーザ辞書，グループ辞書の「３」）か否かを判断し、ｉ＞Ｎｄでなければ、ステップ１４へ戻って上述の処理を繰り返し、ｉ＞Ｎｄなら、この処理を終了する。

このようにして、データ処理部３が、ユーザのログイン時に、予め記憶されている複数の辞書と各辞書内のデータ格納のフォーマット情報と、新たに作成する統合辞書内のデータ格納のフォーマット情報とを取得し、上記各辞書からそれぞれのフォーマット情報に基づいて読み出した各データを上記新たに作成する辞書内のデータ格納のフォーマット情報に基づくデータ格納のフォーマットで１つにまとめた統合辞書を作成する。
したがって、このデータ処理装置によれば、データ処理装置内に搭載する辞書が増えても検索モジュールを変更せず済む。
さらに、ユーザ毎にまとめた辞書やまとめる対象の辞書に対して構成情報を用意することにより、それぞれの種類の辞書のフォーマットが異なっていても辞書をまとめることができる。

また、データ処理部３は、複数の辞書のデータを１つにまとめるときの優先度情報（順番）を予め格納し、各辞書内のデータを統合辞書にまとめる際、上記優先度情報の順番で各辞書のデータを１つにまとめるようにする。
このようにすれば、このデータ処理装置のシステム管理者が編集可能な優先度情報を用意することにより、データ処理装置毎にどの辞書の単語を優先的に候補として抽出するかを変えることができる。
さらに、データ処理部３は、上記優先度情報をユーザ毎に格納し、その優先度情報を変更可能にするようにすれば、ユーザ毎にどの辞書の単語を優先的に候補として抽出するかを変えることができる。

次に、上述のようにして複数の辞書を１つにまとめると、統合辞書内に同じデータが重複して格納される可能性があり、ＲＡＭ４の容量を浪費するだけでなく、候補単語を検索する際に同じ単語を検索して出力するような無駄な処理を行う恐れがある。
したがって、複数の辞書を１つにまとめる際に同じ単語を削除するようにするとよい。
そこで、データ処理部３は、上記のような各辞書内のデータを統合辞書にまとめる際、重複する複数のデータは１つのみを残して他のデータを削除する。
また、重複する単語を削除すると、削除された単語の出所フラグが残らないため、複数の辞書に登録されていたことが分からなくなるので、上記出所フラグを工夫する必要がある。

図１４は、図１に示すデータ処理部３における統合辞書作成時に重複するデータは１つのみを残して他のデータを削除する処理を示すフローチャート図である。
データ処理部３は、ステップ３１の初期設定でｉ＝０，ｊ＝ｉ＋１とし、ステップ３２で、統合辞書から取得し、同じか否かを比較する２つの単語のｗｏｒｄ［ｉ］とｗｏｒｄ［ｊ］（このｗｏｒｄ［ｉ］とｗｏｒｄ［ｊ］は統合辞書内で登録先が連続する２単語に相当する）のそれぞれの検索キーが同じか否かを判断し、同じでなければステップ３６へ進み、同じならば、ステップ３３へ進む。
ステップ３３で、引き続き比較する２つの単語のｗｏｒｄ［ｉ］とｗｏｒｄ［ｊ］の文字列（単語）が同じか否かを判断し、同じでなければステップ３６へ進み、同じならば、ステップ３４へ進む。

ステップ３４で、統合辞書内のｗｏｒｄ［ｉ］の検索キーと文字列と出所フラグを削除し、ステップ３５でｗｏｒｄ［ｊ］の出所フラグを変更し、ステップ３６でｊ＝ｊ＋１とし、ステップ３７でｊ＞Ｎ＝統合辞書内の総単語数（総文字列数）か否かを判断し、ｊ＞Ｎでなければ、ステップ３２へ戻って上述の処理を繰り返し、ｊ＞Ｎなら、ステップ３８で、ｉ＝ｉ＋１とし、ステップ３９でｉ＞Ｎ＝統合辞書内の総単語数（総文字列数）か否かを判断し、ｉ＞Ｎでなければ、ステップ３１へ戻って上述の処理を繰り返し、ｉ＞Ｎなら、この処理を終了する。
この処理を終了した後の統合辞書では、重複した単語を１つにすることができる。
このようにして、統合辞書内に重複した単語がなくなるので、候補単語の検索の処理を効率よく行うことができ、操作表示部へ検索結果の候補単語をより素早く送ることができる。

上述の出書フラグの変更については、例えば、辞書Ａに載っている単語の出所フラグを「１（＝２＾０：２の０乗）」、辞書Ｂに載っている単語の出書フラグを「２（＝２＾１：２の１乗）」、辞書Ｃに載っている単語の出書フラグを「４（＝２＾２：２の２乗）」というようにし、上述した重複する単語の削除の際には、残す単語の出所フラグに削除する単語の出書フラグを加算した値を、残す単語の新たな出所フラグとして登録し直して変更するようにすれば、その出書フラグを参照することにより、複数の辞書の内のどの辞書にそれぞれ登録されていた単語であるかを明らかにすることができる。
例えば、辞書Ａと辞書Ｂのどちらにも載っている単語の出所フラグは３（＝１＋２）となる。

すなわち、上記識別情報は、上記各辞書毎に異なる数値であり、データ処理部３が、上記各辞書内のデータを統合辞書にまとめる際、重複する複数のデータは１つのみを残して他のデータを削除するとき、残すデータの識別情報の数値と削除するデータの識別情報の数値とを加算した結果の数値を上記残すデータの識別情報として添付する。
このようにして、統合辞書から重複する単語のデータを１つだけ残して他を削除しても、その残った単語の出所フラグに基づいて、残った単語も削除した単語もどの辞書に登録されていたものであるかの出所が不明にならずに済む

図１５は重複データを含む状態の統合辞書のデータ内容の一例を示す図であり、図１６は重複データを削除した後の状態の統合辞書のデータ内容の一例を示す図である。
例えば、図２〜図４にそれぞれ示した言語辞書とユーザ辞書とグループ辞書を１つにまとめた統合辞書を作成した場合、重複データを含む状態では、図１５に示すように、図中２行目と１２行目にそれぞれ検索キー「かいだ」、文字列「開田」の重複データが格納されているが、上述した重複データの削除処理を行うと、図１６に示すように、２行目の検索キー「かいだ」、文字列「開田」のデータのみが残り、その出所フラグが、上述した変更処理によって「１」から「５」に変更されている。

次に、上記優先度情報４２を変更する際の操作例について説明する。
図１７乃至図２０は、図１に示した優先度情報４２を変更する際の操作例を示す図である。
図１７に示すように、ユーザは、操作表示部２の表示部に表示されたユーザ設定画面中の複数の機能選択キーの中から、辞書の優先度変更キー６０をタッチして選択すると、図１８に示すように、操作表示部２の表示部に各辞書の現在設定されている優先度の一覧表６１と共に、カーソル６２が表示する。
なお、同図中の各キーの内、辞書の優先度変更キー６０以外は説明を省略し、空白で示している。
この画面では、統合辞書を作成する際に１番目に格納する優先度「１」が言語辞書であり、２番目に格納する優先度「２」がユーザ辞書であり、３番目に格納する優先度「３」がグループ辞書である。

ここで、例えば、ユーザ辞書の優先度を１つ繰り上げる場合、図１９に示すように、ユーザ辞書の欄６３をタッチし（図中斜線を施して選択されたことを示す）、上方向カーソル６４を１回タッチすると、図２０に矢示６５で示すように、ユーザ辞書が１行目の優先度「１」の欄に移動して、言語辞書が２行目の優先度「２」の欄に繰り下がり、両辞書の優先度が入れ替わる。
このような操作の結果、データ処理部３は、ＨＤＤ１内の優先度情報４２の内容を更新する。

次に、上述の処理では、複数の辞書を１つにまとめて統合辞書を作成するときに重複するデータを削除する場合の処理を説明したが、そのように同じデータを削除するようにすると、検索キー，文字列の両方が一致する単語を辞書全体から探さなければならないので、処理時間が長くかかる。
そこで、統合辞書を作成したときには重複するデータをそのままにし、候補単語を検索したとき、重複する単語が検索されたときに１つを残して他の単語を削除するようにするとよい。
このようにすれば、文字列のみ一致する単語を候補単語から探すため、処理時間が短く、優れている。
すなわち、この場合は、上記検索部５が、上記統合辞書からの候補単語のデータの検索時、重複する複数のデータが検索された場合、その各データの内、１つのみを残して他のデータを削除する。

このようにして、統合辞書から候補単語を検索する際に複数の辞書に掲載されている同じ単語がそのまま格納されていれば、同じ単語が複数回抽出される。その際、重複する単語を削除して１つのみを残すことにより、同じ候補単語を重複して操作表示部に表示させずに済む。

次に、このデータ処理装置における上記候補単語を検索したときに重複する単語を削除する場合の候補単語の検索処理について説明する。
この検索処理は上記検索部５が行う。また、検索部５は、上記統合辞書から検索した候補単語のデータを候補単語リストとして保存し、上記候補単語リストから候補単語のデータを検索する。さらに、上記候補単語リストからの候補単語のデータ検索時、予め選択された辞書の識別情報が添付されたデータからのみ候補単語のデータを検索する。

図２１は、図１に示すデータ処理装置の検索部５における候補単語の検索処理を示すシーケンス図である。
図２２と図２３は、検索対象辞書の選択作業の一例を示す操作画面の図である。
図２１に示すように、ステップ４１で、ユーザが操作表示部２によって候補単語の検索対象辞書を指定入力した後に、かな文字列を入力すると、操作表示部２は指定入力された検索対象辞書の情報とかな文字列とを検索部５へ送る。
検索部５は、ステップ４２で、操作表示部２から受け取った検索対象辞書の情報に基づいて、検索先（ＨＤＤ１かＲＡＭ４）と検索対象辞書を選択し、言語辞書１０，ユーザ辞書２０，グループ辞書３０のいずれかが指定されたら、ＨＤＤ１にアクセスし、統合辞書５１が指定されたら、ＲＡＭ４にアクセスする。
このようにすれば、ユーザの所望の種類の辞書から検索した候補単語のみを表示することができる。

以下の処理では、統合辞書５１が指定された場合について説明する。
検索部５は、ステップ４３で、選択した検索先であるＲＡＭ４にアクセスし、検索対象辞書である統合辞書５１を検索し、上記入力されたかな文字列に対応する候補単語を読み出して取得する。この検索処理では、入力されたかな文字列に該当する検索キーに対応する文字列を候補単語として読み出す。
検索部５は、ステップ４４で、統合辞書５１から取得した候補単語を操作表示部２へ出力し、操作表示部２は、その候補単語を表示する。

例えば、図２２に示すように、検索対象辞書指定欄７０の統合辞書，ユーザ辞書，グループ辞書，言語辞書のいずれかを選択するプルダウンメニューから、統合辞書を選択し、文字列入力欄７２に文字「お」を入力すると、図２３に示すように、検索対象辞書指定欄７０に統合辞書が選択され、候補単語表示欄７４に先頭文字が「お」の候補単語「お疲れさまです」「お世話になっております」「大阪」「億」「思う」などが表示される。

一方、図２１に示すように、検索部５は、ステップ４５で、ＲＡＭ４にかな文字列を前入力文字列５３として記憶し、ステップ４６で、ＲＡＭ４に候補単語リスト５２を作成して上記取得した候補単語を記憶し、あるいは、既に候補単語リスト５２が作成されているなら、上記取得した候補単語を追加記憶して、候補単語リスト５２の内容を更新する。
そして、ステップ４７で、候補単語リスト又は統合辞書から重複して検索されたデータを削除する。

さらに、ステップ４８で、ユーザが操作表示部２によって候補単語の検索対象辞書を変更入力した後に、かな文字列を入力すると、操作表示部２は変更入力された検索対象辞書のフラグとかな文字列とを検索部５へ送る。
検索部５は、ステップ４９で、操作表示部２から受け取った、変更入力された検索対象辞書のフラグに基づいて、ＲＡＭ４の候補単語リスト５２を検索する。

図２４は、図１に示すデータ処理部３における統合辞書検索時に重複するデータは１つのみを残して他のデータを削除する処理を示すフローチャート図である。
検索部５は、ステップ５１の初期設定でｉ＝０，ｊ＝ｉ＋１とし、ステップ５２で、統合辞書から取得し、同じか否かを比較する２つの単語のｗｏｒｄ［ｉ］とｗｏｒｄ［ｊ］（このｗｏｒｄ［ｉ］とｗｏｒｄ［ｊ］は統合辞書から同じ検索キーで検索された２単語に相当する）のそれぞれの文字列が同じか否かを判断し、同じでなければステップ５５へ進み、同じならば、ステップ５３へ進む。

ステップ５３で、統合辞書内のｗｏｒｄ［ｉ］の検索キーと文字列と出所フラグを削除し、ステップ５４でｗｏｒｄ［ｊ］の出所フラグを変更し、ステップ５５でｊ＝ｊ＋１とし、ステップ５６でｊ＞ｎ＝統合辞書から同じ検索キーで検索された総単語数（総文字列数）か否かを判断し、ｊ＞ｎでなければ、ステップ５２へ戻って上述の処理を繰り返し、ｊ＞ｎなら、ステップ５７で、ｉ＝ｉ＋１とし、ステップ５８でｉ＞ｎ＝統合辞書から同じ検索キーで検索された総単語数（総文字列数）か否かを判断し、ｉ＞ｎでなければ、ステップ５１へ戻って上述の処理を繰り返し、ｉ＞ｎなら、この処理を終了する。

この検索時の処理により、統合辞書内の重複した単語はユーザの利用が進むにつれて徐々に無くすことができる。また、このように統合辞書内の重複した単語を検索時に削除することにより、統合辞書の作成時にかかる時間を短縮することができる。
また、上述の処理に関連して、候補単語リスト５２に登録された単語についても上述と同じ処理を施せば、候補単語リスト５２に登録された重複単語も削除することができる。

次に、このデータ処理装置における候補単語リストに対する処理を説明する。
図２５は、図１に示す検索部５による候補単語リスト５２に対する処理を示すフローチャート図である。
検索部５は、ステップ６１で、入力されたかな文字列の文字数＜前入力文字列の文字数か、又は、前入力文字列の文字数＝０かを判断し、入力されたかな文字列の文字数＜前入力文字列の文字数、又は、前入力文字列の文字数＝０であれば、ステップ６２へ進み、入力されたかな文字列の文字数＜前入力文字列の文字数でも、前入力文字列の文字数＝０でもなければ、ステップ６６へ進む。

上記入力されたかな文字列の文字数＜前入力文字列の文字数の場合は、入力された文字列が消去された場合であり、前入力文字列の文字数＝０の場合は、初めて文字が入力された場合であり、そのいずれかであれば、ステップ６２で候補単語リストを削除し、ステップ６３で統合辞書、あるいは指定された言語辞書，ユーザ辞書，グループ辞書のいずれかを検索し、ステップ６４で上記検索結果から候補単語リストを作成してＲＡＭに格納し、ステップ６５で候補単語リスト内で重複してるデータを１つのみ残して他を削除すると共に、残したデータの出書フラグを変更し、この処理を終了する。

一方、入力された文字列が消去された場合でもなく、初めて文字が入力された場合でもなければ、ステップ５６で、候補単語リストを検索し、ステップ６７で候補単語リストの内容を更新し、ステップ６５で候補単語リスト内で重複してるデータを１つのみ残して他を削除すると共に、残したデータの出書フラグを変更し、この処理を終了する。
このようにして、統合辞書５１内の重複単語をそのままにし、候補単語リスト５２に登録された重複単語を上述と同じようにして削除するようにしてもよい。

図２６は重複単語が登録された状態の候補単語リストの内容の一例を示す図であり、図２７は重複単語が削除された後の候補単語リストの内容の一例を示す図である。
図２６に示すように、候補単語リスト内の２行目と４行目の重複単語である、検索キー「かいだ」、文字列「開田」は、上述の処理によって、図２７に示すように、２行目の検索キー「かいだ」、文字列「開田」、出所フラグ「５」にまとめられる。

この発明によるデータ処理装置は、ファクシミリ装置、複写機、プリンタ、それらの複合機、コンピュータを含むデータ処理を行う装置全般において適用することができる。

この発明の実施例のデータ処理装置の機能構成を示すブロック図である。図１に示す言語辞書の日本語辞書のデータ格納例を示す図である。図１に示すユーザ辞書のＡさん用辞書のデータ格納例を示す図である。図１に示すグループ辞書の第１グループ辞書のデータ格納例を示す図である。図２に示す日本語辞書のデータフォーマット例とその構成情報の内容の一例を示す図である。

図３に示すＡさん用辞書のデータフォーマット例とその構成情報の内容の一例を示す図である。図４に示す第１グループ辞書のデータフォーマット例とその構成情報の内容の一例を示す図である。図１に示す統合辞書用構成情報のデータ内容の一例を示す図である。図１に示す優先度情報のデータ内容の一例を示す図である。図１に示すユーザ情報のデータ内容の一例を示す図である。

図１に示すフラグ情報のデータ内容の一例を示す図である。図１に示すデータ処理装置におけるユーザのログイン時に統合辞書作成して格納するまでの処理を示すシーケンス図である。図１に示すデータ処理部における統合辞書の作成処理を示すフローチャート図である。図１に示すデータ処理部における統合辞書作成時に重複するデータは１つのみを残して他のデータを削除する処理を示すフローチャート図である。重複データを含む状態の統合辞書のデータ内容の一例を示す図である。

重複データを削除した後の状態の統合辞書のデータ内容の一例を示す図である。図１に示す優先度情報を変更する際の操作例を示す図である。同じく優先度情報を変更する際の操作例を示す図である。また同じく優先度情報を変更する際の操作例を示す図である。さらに同じく優先度情報を変更する際の操作例を示す図である。図１に示すデータ処理装置の検索部における候補単語の検索処理を示すシーケンス図である。

検索対象辞書の選択作業の一例を示す操作画面の図である。同じく検索対象辞書の選択作業の一例を示す操作画面の図である。図１に示すデータ処理部における統合辞書検索時に重複するデータは１つのみを残して他のデータを削除する処理を示すフローチャート図である。図１に示す検索部による候補単語リスト５２に対する処理を示すフローチャート図である。重複単語が登録された状態の候補単語リストの内容の一例を示す図である。重複単語が削除された後の候補単語リストの内容の一例を示す図である。

符号の説明

１：ＨＤＤ２：操作表示部３：データ処理部４：ＲＡＭ５：検索部１０：言語辞書１１：日本語辞書１２，１４，２２，２４，３２，３４：構成情報１３：英語辞書２０：ユーザ辞書２１：Ａさん用辞書２３：Ｂさん用辞書３０：グループ辞書３１：第１グループ辞書３３：第２グループ辞書４１：統合辞書用構成情報４２：優先度情報４３：ユーザ情報４４：フラグ情報５１：統合辞書５２：候補単語リスト５３：前入力文字列

Claims

ユーザのログイン時に、予め記憶されている複数の辞書と各辞書内のデータ格納のフォーマット情報と、新たに作成する統合辞書内のデータ格納のフォーマット情報とを取得し、前記各辞書からそれぞれのフォーマット情報に基づいて読み出した各データを前記新たに作成する統合辞書内のデータ格納のフォーマット情報に基づくデータ格納のフォーマットで１つにまとめた統合辞書を作成する手段を備えたことを特徴とするデータ処理装置。
請求項１記載のデータ処理装置において、前記複数の辞書のデータを１つにまとめるときの順番を予め格納し、前記各辞書内のデータを統合辞書にまとめる際、前記順番で各辞書のデータを１つにまとめるようにしたことを特徴とするデータ処理装置。
請求項２記載のデータ処理装置において、前記順番をユーザ毎に格納するようにしたことを特徴とするデータ処理装置。
請求項１乃至３のいずれか一項に記載のデータ処理装置において、前記各辞書内のデータを統合辞書にまとめる際、重複する複数のデータは１つのみを残して他のデータを削除するようにしたことを特徴とするデータ処理装置。
請求項４記載のデータ処理装置において、前記各辞書の各データには出所先の辞書を示す識別情報が付与されていることを特徴とするデータ処理装置。
請求項５記載のデータ処理装置において、前記識別情報は、前記各辞書毎に異なる数値であり、前記各辞書内のデータを統合辞書にまとめる際、重複する複数のデータは１つのみを残して他のデータを削除するとき、残すデータの識別情報の数値と削除するデータの識別情報の数値とを加算した結果の数値を前記残すデータの識別情報として添付するようにしたことを特徴とするデータ処理装置。
請求項５又は６記載のデータ処理装置において、前記統合辞書から検索した候補単語のデータを候補単語リストとして保存し、前記候補単語リストから候補単語のデータを検索するようにしたことを特徴とするデータ処理装置。
請求項７記載のデータ処理装置において、前記候補単語リストからの候補単語のデータ検索時、予め選択された辞書の識別情報が添付されたデータからのみ候補単語のデータを検索するようにしたことを特徴とするデータ処理装置。
請求項１乃至３のいずれか一項に記載のデータ処理装置において、前記統合辞書から検索した候補単語のデータを候補単語リストとして保存し、前記候補単語リストから候補単語のデータの検索時、重複する複数のデータが検索された場合、前記候補単語リストから重複する複数のデータは１つのみを残して他のデータを削除するようにしたことを特徴とするデータ処理装置。