JP2009169710A - データ処理装置 - Google Patents

データ処理装置 Download PDF

Info

Publication number
JP2009169710A
JP2009169710A JP2008007625A JP2008007625A JP2009169710A JP 2009169710 A JP2009169710 A JP 2009169710A JP 2008007625 A JP2008007625 A JP 2008007625A JP 2008007625 A JP2008007625 A JP 2008007625A JP 2009169710 A JP2009169710 A JP 2009169710A
Authority
JP
Japan
Prior art keywords
dictionary
data
integrated
data processing
candidate word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008007625A
Other languages
English (en)
Inventor
Yukiko Kaida
有紀子 開田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2008007625A priority Critical patent/JP2009169710A/ja
Publication of JP2009169710A publication Critical patent/JP2009169710A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】 ユーザのログイン時にそのユーザ用に1つにまとめた統合辞書を作成し、その統合辞書を検索することにより、データ処理装置に搭載する辞書を増やしても新たな検索モジュールを追加しなくて済むようにする。
【解決手段】 データ処理部3は、ユーザのログイン時に、HDD1から予め記憶されている言語辞書10,ユーザ辞書20,グループ辞書30の各辞書とその各辞書内のデータ格納のフォーマット情報と、新たに作成する統合辞書51内のデータ格納のフォーマット情報とを取得し、上記各辞書からそれぞれのフォーマット情報に基づいて読み出した各データを上記新たに作成する辞書内のデータ格納のフォーマット情報に基づくデータ格納のフォーマットで1つにまとめた統合辞書51を作成してRAM4に格納する。
【選択図】 図1

Description

この発明は、ファクシミリ装置、複写機、プリンタ、それらの複合機、コンピュータを含むデータ処理装置に関する。
ファクシミリ装置、複写機、プリンタ、それらの複合機、コンピュータを含むデータ処理装置における文字入力では、入力されたかな文字に対する単語の予測変換を行う場合、候補単語の検索には辞書が必要である(例えば、特許文献1,2参照)。
例えば、ユーザ辞書、グループ辞書、言語辞書を含む複数種類の辞書が搭載されている複合機(MFP)では、ユーザによって検索対象の辞書の種類を変えることにより、ユーザの入力したかな文字に対してユーザが望む候補単語を出し易くすることができる。
特開平10−154033号公報 特開2003−233605号公報
しかしながら、従来のデータ処理装置は、ユーザが入力したかな文字に対する候補単語を検索する際、複数種類の辞書を別々に検索するので、新たな種類の辞書を追加する場合に、その新たに追加した辞書を検索するモジュールを追加しなければならないし、その新たな種類の辞書のフォーマットが既存の辞書と異なる場合、その新たに追加した辞書を検索するモジュール内の検索アルゴリズムを新たに実装しなければならないという問題があった。
この発明は上記の点に鑑みてなされたものであり、ユーザのログイン時にそのユーザ用に1つにまとめた統合辞書を作成し、その統合辞書を検索することにより、データ処理装置に搭載する辞書を増やしても新たな検索モジュールを追加しなくて済むようにすることを目的とする。
この発明は上記の目的を達成するため、次のデータ処理装置を提供する。
(1)ユーザのログイン時に、予め記憶されている複数の辞書と各辞書内のデータ格納のフォーマット情報と、新たに作成する統合辞書内のデータ格納のフォーマット情報とを取得し、上記各辞書からそれぞれのフォーマット情報に基づいて読み出した各データを上記新たに作成する統合辞書内のデータ格納のフォーマット情報に基づくデータ格納のフォーマットで1つにまとめた統合辞書を作成する手段を備えたデータ処理装置。
(2)上記のようなデータ処理装置において、上記複数の辞書のデータを1つにまとめるときの順番を予め格納し、上記各辞書内のデータを統合辞書にまとめる際、上記順番で各辞書のデータを1つにまとめるようにしたデータ処理装置。
(3)上記のようなデータ処理装置において、上記順番をユーザ毎に格納するようにしたデータ処理装置。
(4)上記のようなデータ処理装置において、上記各辞書内のデータを統合辞書にまとめる際、重複する複数のデータは1つのみを残して他のデータを削除するようにしたデータ処理装置。
(5)上記のようなデータ処理装置において、上記各辞書の各データには出所先の辞書を示す識別情報が付与されているデータ処理装置。
(6)上記のようなデータ処理装置において、上記識別情報は、上記各辞書毎に異なる数値であり、上記各辞書内のデータを統合辞書にまとめる際、重複する複数のデータは1つのみを残して他のデータを削除するとき、残すデータの識別情報の数値と削除するデータの識別情報の数値とを加算した結果の数値を上記残すデータの識別情報として添付するようにしたデータ処理装置。
(7)上記のようなデータ処理装置において、上記統合辞書から検索した候補単語のデータを候補単語リストとして保存し、上記候補単語リストから候補単語のデータを検索するようにしたデータ処理装置。
(8)上記のようなデータ処理装置において、上記候補単語リストからの候補単語のデータ検索時、予め選択された辞書の識別情報が添付されたデータからのみ候補単語のデータを検索するようにしたデータ処理装置。
(9)上記のようなデータ処理装置において、上記統合辞書から検索した候補単語のデータを候補単語リストとして保存し、上記候補単語リストから候補単語のデータの検索時、重複する複数のデータが検索された場合、上記候補単語リストから重複する複数のデータは1つのみを残して他のデータを削除するようにしたデータ処理装置。
この発明によるデータ処理装置は、ユーザのログイン時にそのユーザ用に1つにまとめた統合辞書を作成し、その統合辞書を検索するので、データ処理装置に搭載する辞書を増やしても新たな検索モジュールを追加しなくて済むようにすることができる。
以下、この発明を実施するための最良の形態を図面に基づいて具体的に説明する。
〔実施例〕
図1は、この発明の実施例のデータ処理装置の機能構成を示すブロック図である。
このデータ処理装置は、ファクシミリ装置、複写機、プリンタ、それらの複合機、コンピュータを含む文字入力可能な装置であり、ハードディスク装置(HDD)1,操作表示部2,データ処理部3,RAM4,及び検索部5を備えている。
HDD1は、大容量の記憶装置であり、言語辞書10,ユーザ辞書20,グループ辞書30と、統合辞書用構成情報41,優先度情報42,ユーザ情報43,フラグ情報44を格納している。
RAM4は、統合辞書51,候補単語リスト52,前入力文字列53を格納している。
HDD1の言語辞書10には、例えば、日本語辞書11とその構成情報12、英語辞書13とその構成情報14を含む複数種類の言語の辞書とそれぞれの構成情報とを対応させて記憶している。
図2は、言語辞書10の日本語辞書11のデータ格納例を示す図である。
言語辞書10内の各辞書は、検索キー,文字列,単語種別フラグの項目からなる。
例えば、日本語辞書11の場合、検索キーは、ユーザによって入力されるかな文字であり、それに対応する文字列の読み仮名に相当する。また、文字列は、検索キーに対応する単語又は漢字混じりの文字列であり、ユーザによって入力されたかな文字に対応する単語又は漢字混じりの文字列が候補単語として検索される。さらに、単語種別フラグは、単語の種類を示すフラグ情報である。
この単語種別フラグは、日本語辞書11の場合、例えば、通常単語を示す「0」、会社名/人名を示す「1」、地名を示す「2」、上記1,2以外の固有名詞を示す「3」、略称を示す「4」がある。
図2に示すように、検索キー「にほん」には、文字列「日本」と単語種別フラグ「2」が対応させて記憶されている。
HDD1のユーザ辞書20には、例えば、Aさん用辞書21とその構成情報22、Bさん用辞書23とその構成情報24を含む複数のユーザ毎の辞書とそれぞれの構成情報とを対応させて記憶している。
図3は、ユーザ辞書20のAさん用辞書21のデータ格納例を示す図である。
ユーザ辞書20内の各辞書は、検索キー,文字列,単語種別フラグの項目からなる。
例えば、Aさん用辞書21の場合、検索キーは、ユーザによって入力されるかな文字であり、それに対応する文字列の読み仮名に相当する。また、文字列は、検索キーに対応する単語又は漢字混じりの文字列であり、ユーザによって入力されたかな文字に対応する単語又は漢字混じりの文字列が候補単語として検索される。さらに、単語種別フラグは、単語の種類を示すフラグ情報である。
この単語種別フラグは、日本語辞書11の場合、例えば、通常単語を示す「0」、会社名/人名を示す「1」、地名を示す「2」、上記1,2以外の固有名詞を示す「3」、略称を示す「4」がある。
図3に示すように、検索キー「かいだ」には、文字列「開田」と単語種別フラグ「1」が対応させて記憶されている。
HDD1のグループ辞書30には、例えば、第1グループ辞書31とその構成情報32、第2グループ辞書33とその構成情報34を含む複数のグループ毎の辞書とそれぞれの構成情報とを対応させて記憶している。
図4は、グループ辞書30の第1グループ辞書31のデータ格納例を示す図である。
グループ辞書30内の各辞書は、検索キー,文字列,単語種別フラグの項目からなり、ここでは、単語種別フラグ,検索キー,文字列の順に対応させて記憶されている。
例えば、第1グループ辞書31の場合、検索キーは、ユーザによって入力されるかな文字であり、それに対応する文字列の読み仮名に相当する。また、文字列は、検索キーに対応する単語又は漢字・アルファベット混じりの文字列であり、ユーザによって入力されたかな文字に対応する単語又は漢字・アルファベット混じりの文字列が候補単語として検索される。さらに、単語種別フラグは、単語の種類を示すフラグ情報である。
この単語種別フラグは、日本語辞書11の場合、例えば、通常単語を示す「0」、会社名/人名を示す「1」、地名を示す「2」、上記1,2以外の固有名詞を示す「3」、略称を示す「4」がある。
図4に示すように、単語種別フラグ「4」に、検索キー「えーびーかい」と文字列「AB開」とが対応させて記憶されている。
上記各辞書の構成情報は、それぞれの辞書のデータ格納のフォーマット情報を格納している。
図5は、図2に示す日本語辞書11のデータフォーマット例とその構成情報の内容の一例を示す図である。
図6は、図3に示すAさん用辞書21のデータフォーマット例とその構成情報の内容の一例を示す図である。
図7は、図4に示す第1グループ辞書31のデータフォーマット例とその構成情報の内容の一例を示す図である。
図5の(a)に示すように、日本語辞書11には、上記各データが「にほん_日本_2↓」のように格納されており、図5の(b)に示すように、その構成情報には、検索キー,文字列,単語識別フラグの各列の位置と、単語内区切り記号の種類と、単語間区切り記号の種類と、項目数と、辞書の種類とをそれぞれ示す情報が格納されている。
また、Aさん用辞書21と第1グループ辞書31についても、それぞれ図6と図7に示すように、それぞれ上記日本語辞書11の場合と同様の情報が格納されている。
図8は、図1に示す統合辞書用構成情報41のデータ内容の一例を示す図である。
統合辞書用構成情報41には、ユーザのログイン時に、データ処理部3が言語辞書10,ユーザ辞書20,グループ辞書30のそれぞれに格納されている各辞書のデータを1つにまとめて作成する統合辞書51のフォーマット情報である構成情報が格納されている。
例えば、図8に示すように、データ格納時の1列目を検索キーの列にし、2列目を文字列の列にし、3列目を出所フラグ(言語辞書10,ユーザ辞書20,グループ辞書30のいずれに格納されていたデータであるかを示すフラグ)の列にし、単語内区切り記号を「タブ」にし、単語間区切り記号を「改行」にし、項目数を3にする情報と共に、辞書の種類が統合辞書であることを示す情報を格納する。
図9は、図1に示す優先度情報42のデータ内容の一例を示す図である。
優先度情報42には、ユーザのログイン時に、データ処理部3が言語辞書10,ユーザ辞書20,グループ辞書30のそれぞれに格納されている各辞書のデータを1つにまとめて統合辞書51を作成する際、そのまとめるときの順番を示す情報を格納しており、データ処理部3は、言語辞書10,ユーザ辞書20,グループ辞書30のそれぞれに格納されている各辞書のデータを1つにまとめる際、この優先度情報42に格納されている順番に従って各辞書のデータを1つにまとめる。
例えば、図9に示すように、統合辞書51に1番目にユーザ辞書のデータを(優先度フラグは「0」にしている)、2番目にグループ辞書のデータを(優先度フラグは「1」にしている)、3番目に言語辞書のデータを(優先度フラグは「2」にしている)それぞれ格納していく。
ここでは、1種類のデータを示したが、この優先度情報42は、ユーザ毎にそれぞれ登録することができ、上記データに各ユーザ名を格納することにより、ログインしたユーザ毎に対応するユーザ名が格納されている優先度情報を読み出すことができる。
図10は、図1に示すユーザ情報43のデータ内容の一例を示す図である。
ユーザ情報43には、ユーザをグループ化した場合の各グループ内のユーザを示す情報を格納しており、グループ辞書30の各辞書について、どのユーザが利用できるかを示すものでもある。
例えば、図10に示すように、第1グループは、Aさん,Bさん……からなり、第2グループは、Aさん,Cさん……からなる。
図11は、図1に示すフラグ情報44のデータ内容の一例を示す図である。
フラグ情報44には、上記出所フラグとして格納する辞書の種類を示す辞書フラグが格納されている。
例えば、図11に示すように、ユーザ辞書の辞書フラグは「1」、グループ辞書の辞書フラグは「2」、言語辞書の辞書フラグは「4」である。
次に、このデータ処理装置におけるユーザのログイン時に統合辞書作成して格納するまでの処理について説明する。
図12は、図1に示すデータ処理装置におけるユーザのログイン時に統合辞書作成して格納するまでの処理を示すシーケンス図である。
ステップ(図中「S」で示す)1で、ユーザが操作表示部2によって自己のユーザ名と、このデータ処理装置を利用するために予め付与されたパスワードとからなるログインの情報を入力すると、操作表示部2はその入力されたログインの情報をデータ処理部3へ送り、ステップ2で、データ処理部3は、そのユーザ名とパスワードに基づいてこのデータ処理装置を利用できる正規のユーザであるか否かを判断し、正規のユーザであると判断したらログインを許可するログイン処理を実行する。このログイン処理は、公知技術を用いればよいので、ここではその詳細な説明を省略する。
データ処理部3は、ステップ2でログイン処理を実行し、ユーザに対してログインを許可すると、HDD1にアクセスし、ステップ3で統合辞書用構成情報41を読み出して取得し、ステップ4で上記入力されたユーザ名に対応する優先度情報42とユーザ情報43を読み出して取得し、ステップ5で優先度情報42とユーザ情報43に基づいて言語辞書10,ユーザ辞書20,グループ辞書30から各辞書とそれに対応する構成情報とフラグ情報44とを読み出して取得し、ステップ6でそれらの取得した辞書と情報とに基づいて統合辞書51を作成し、ステップ7で、統合辞書51をRAM4に格納する。
次に、データ処理部3における上記統合辞書の作成の詳しい処理について説明する。
図13は、図1に示すデータ処理部3における統合辞書の作成処理を示すフローチャート図である。
データ処理部3は、ステップ11で、HDD1から統合辞書用構成情報41を読み出して取得し、ステップ12で、操作表示部2から入力されたユーザ名に対応する優先度情報42とユーザ情報43とをHDD1から取得し、ステップ13の初期設定でi=0とし、ステップ14の初期設定でj=0とし、ステップ15で、HDD1から優先度情報42に格納された優先度iの辞書とその構成情報を読み出して取得し、ステップ16で、HDD1からフラグ情報の優先度iの辞書の辞書jに対応する辞書フラグを読み出して取得し、ステップ17の初期設定でk=0とする。
ステップ18で、優先度iの辞書の辞書jの構成情報に基づいて、優先度iの辞書の辞書j内のk+1番目の単語の検索キーと文字列を取得し、ステップ19で、優先度iの辞書の辞書j内のk+1番目の単語の検索キーと文字列と辞書フラグ(この辞書フラグは出所フラグとして格納)を、統合辞書用構成情報に基づいて統合辞書のフォーマットの文字列に挿入する。この出所フラグは、単語がどの辞書に登録されていたものかの出所を示す情報になる。
このように、上記各辞書の各データには出所先の辞書を示す識別情報を付与している。
ステップ20で、k=k+1とし、ステップ21で、k>Nw[i]=辞書内の単語数か否かを判断し、k>Nw[i]でなければ、ステップ18へ戻って上述の処理を繰り返し、k>Nw[i]なら、ステップ22で、j>[i]=辞書内の辞書数(ここでは、例えば、ユーザ辞書なら、ユーザ辞書内のAさん用辞書,Bさん用辞書,…の合計数)か否かを判断し、j>[i]でなければ、ステップ26でj=j+1とし、ステップ15へ戻って上述の処理を繰り返す。
ステップ22の判断でj>[i]なら、ステップ23で、統合辞書のフォーマットの文字列に挿入された検索キーと文字列と辞書フラグを、統合辞書のフォーマットのファイルに書き込み、統合辞書のフォーマットの文字列にNULLを上書きし、ステップ24で、i=i+1とし、ステップ25でi>Nd=HDD1内の辞書数(ここでは、言語辞書,ユーザ辞書,グループ辞書の「3」)か否かを判断し、i>Ndでなければ、ステップ14へ戻って上述の処理を繰り返し、i>Ndなら、この処理を終了する。
このようにして、データ処理部3が、ユーザのログイン時に、予め記憶されている複数の辞書と各辞書内のデータ格納のフォーマット情報と、新たに作成する統合辞書内のデータ格納のフォーマット情報とを取得し、上記各辞書からそれぞれのフォーマット情報に基づいて読み出した各データを上記新たに作成する辞書内のデータ格納のフォーマット情報に基づくデータ格納のフォーマットで1つにまとめた統合辞書を作成する。
したがって、このデータ処理装置によれば、データ処理装置内に搭載する辞書が増えても検索モジュールを変更せず済む。
さらに、ユーザ毎にまとめた辞書やまとめる対象の辞書に対して構成情報を用意することにより、それぞれの種類の辞書のフォーマットが異なっていても辞書をまとめることができる。
また、データ処理部3は、複数の辞書のデータを1つにまとめるときの優先度情報(順番)を予め格納し、各辞書内のデータを統合辞書にまとめる際、上記優先度情報の順番で各辞書のデータを1つにまとめるようにする。
このようにすれば、このデータ処理装置のシステム管理者が編集可能な優先度情報を用意することにより、データ処理装置毎にどの辞書の単語を優先的に候補として抽出するかを変えることができる。
さらに、データ処理部3は、上記優先度情報をユーザ毎に格納し、その優先度情報を変更可能にするようにすれば、ユーザ毎にどの辞書の単語を優先的に候補として抽出するかを変えることができる。
次に、上述のようにして複数の辞書を1つにまとめると、統合辞書内に同じデータが重複して格納される可能性があり、RAM4の容量を浪費するだけでなく、候補単語を検索する際に同じ単語を検索して出力するような無駄な処理を行う恐れがある。
したがって、複数の辞書を1つにまとめる際に同じ単語を削除するようにするとよい。
そこで、データ処理部3は、上記のような各辞書内のデータを統合辞書にまとめる際、重複する複数のデータは1つのみを残して他のデータを削除する。
また、重複する単語を削除すると、削除された単語の出所フラグが残らないため、複数の辞書に登録されていたことが分からなくなるので、上記出所フラグを工夫する必要がある。
図14は、図1に示すデータ処理部3における統合辞書作成時に重複するデータは1つのみを残して他のデータを削除する処理を示すフローチャート図である。
データ処理部3は、ステップ31の初期設定でi=0,j=i+1とし、ステップ32で、統合辞書から取得し、同じか否かを比較する2つの単語のword[i]とword[j](このword[i]とword[j]は統合辞書内で登録先が連続する2単語に相当する)のそれぞれの検索キーが同じか否かを判断し、同じでなければステップ36へ進み、同じならば、ステップ33へ進む。
ステップ33で、引き続き比較する2つの単語のword[i]とword[j]の文字列(単語)が同じか否かを判断し、同じでなければステップ36へ進み、同じならば、ステップ34へ進む。
ステップ34で、統合辞書内のword[i]の検索キーと文字列と出所フラグを削除し、ステップ35でword[j]の出所フラグを変更し、ステップ36でj=j+1とし、ステップ37でj>N=統合辞書内の総単語数(総文字列数)か否かを判断し、j>Nでなければ、ステップ32へ戻って上述の処理を繰り返し、j>Nなら、ステップ38で、i=i+1とし、ステップ39でi>N=統合辞書内の総単語数(総文字列数)か否かを判断し、i>Nでなければ、ステップ31へ戻って上述の処理を繰り返し、i>Nなら、この処理を終了する。
この処理を終了した後の統合辞書では、重複した単語を1つにすることができる。
このようにして、統合辞書内に重複した単語がなくなるので、候補単語の検索の処理を効率よく行うことができ、操作表示部へ検索結果の候補単語をより素早く送ることができる。
上述の出書フラグの変更については、例えば、辞書Aに載っている単語の出所フラグを「1(=2^0:2の0乗)」、辞書Bに載っている単語の出書フラグを「2(=2^1:2の1乗)」、辞書Cに載っている単語の出書フラグを「4(=2^2:2の2乗)」というようにし、上述した重複する単語の削除の際には、残す単語の出所フラグに削除する単語の出書フラグを加算した値を、残す単語の新たな出所フラグとして登録し直して変更するようにすれば、その出書フラグを参照することにより、複数の辞書の内のどの辞書にそれぞれ登録されていた単語であるかを明らかにすることができる。
例えば、辞書Aと辞書Bのどちらにも載っている単語の出所フラグは3(=1+2)となる。
すなわち、上記識別情報は、上記各辞書毎に異なる数値であり、データ処理部3が、上記各辞書内のデータを統合辞書にまとめる際、重複する複数のデータは1つのみを残して他のデータを削除するとき、残すデータの識別情報の数値と削除するデータの識別情報の数値とを加算した結果の数値を上記残すデータの識別情報として添付する。
このようにして、統合辞書から重複する単語のデータを1つだけ残して他を削除しても、その残った単語の出所フラグに基づいて、残った単語も削除した単語もどの辞書に登録されていたものであるかの出所が不明にならずに済む
図15は重複データを含む状態の統合辞書のデータ内容の一例を示す図であり、図16は重複データを削除した後の状態の統合辞書のデータ内容の一例を示す図である。
例えば、図2〜図4にそれぞれ示した言語辞書とユーザ辞書とグループ辞書を1つにまとめた統合辞書を作成した場合、重複データを含む状態では、図15に示すように、図中2行目と12行目にそれぞれ検索キー「かいだ」、文字列「開田」の重複データが格納されているが、上述した重複データの削除処理を行うと、図16に示すように、2行目の検索キー「かいだ」、文字列「開田」のデータのみが残り、その出所フラグが、上述した変更処理によって「1」から「5」に変更されている。
次に、上記優先度情報42を変更する際の操作例について説明する。
図17乃至図20は、図1に示した優先度情報42を変更する際の操作例を示す図である。
図17に示すように、ユーザは、操作表示部2の表示部に表示されたユーザ設定画面中の複数の機能選択キーの中から、辞書の優先度変更キー60をタッチして選択すると、図18に示すように、操作表示部2の表示部に各辞書の現在設定されている優先度の一覧表61と共に、カーソル62が表示する。
なお、同図中の各キーの内、辞書の優先度変更キー60以外は説明を省略し、空白で示している。
この画面では、統合辞書を作成する際に1番目に格納する優先度「1」が言語辞書であり、2番目に格納する優先度「2」がユーザ辞書であり、3番目に格納する優先度「3」がグループ辞書である。
ここで、例えば、ユーザ辞書の優先度を1つ繰り上げる場合、図19に示すように、ユーザ辞書の欄63をタッチし(図中斜線を施して選択されたことを示す)、上方向カーソル64を1回タッチすると、図20に矢示65で示すように、ユーザ辞書が1行目の優先度「1」の欄に移動して、言語辞書が2行目の優先度「2」の欄に繰り下がり、両辞書の優先度が入れ替わる。
このような操作の結果、データ処理部3は、HDD1内の優先度情報42の内容を更新する。
次に、上述の処理では、複数の辞書を1つにまとめて統合辞書を作成するときに重複するデータを削除する場合の処理を説明したが、そのように同じデータを削除するようにすると、検索キー,文字列の両方が一致する単語を辞書全体から探さなければならないので、処理時間が長くかかる。
そこで、統合辞書を作成したときには重複するデータをそのままにし、候補単語を検索したとき、重複する単語が検索されたときに1つを残して他の単語を削除するようにするとよい。
このようにすれば、文字列のみ一致する単語を候補単語から探すため、処理時間が短く、優れている。
すなわち、この場合は、上記検索部5が、上記統合辞書からの候補単語のデータの検索時、重複する複数のデータが検索された場合、その各データの内、1つのみを残して他のデータを削除する。
このようにして、統合辞書から候補単語を検索する際に複数の辞書に掲載されている同じ単語がそのまま格納されていれば、同じ単語が複数回抽出される。その際、重複する単語を削除して1つのみを残すことにより、同じ候補単語を重複して操作表示部に表示させずに済む。
次に、このデータ処理装置における上記候補単語を検索したときに重複する単語を削除する場合の候補単語の検索処理について説明する。
この検索処理は上記検索部5が行う。また、検索部5は、上記統合辞書から検索した候補単語のデータを候補単語リストとして保存し、上記候補単語リストから候補単語のデータを検索する。さらに、上記候補単語リストからの候補単語のデータ検索時、予め選択された辞書の識別情報が添付されたデータからのみ候補単語のデータを検索する。
図21は、図1に示すデータ処理装置の検索部5における候補単語の検索処理を示すシーケンス図である。
図22と図23は、検索対象辞書の選択作業の一例を示す操作画面の図である。
図21に示すように、ステップ41で、ユーザが操作表示部2によって候補単語の検索対象辞書を指定入力した後に、かな文字列を入力すると、操作表示部2は指定入力された検索対象辞書の情報とかな文字列とを検索部5へ送る。
検索部5は、ステップ42で、操作表示部2から受け取った検索対象辞書の情報に基づいて、検索先(HDD1かRAM4)と検索対象辞書を選択し、言語辞書10,ユーザ辞書20,グループ辞書30のいずれかが指定されたら、HDD1にアクセスし、統合辞書51が指定されたら、RAM4にアクセスする。
このようにすれば、ユーザの所望の種類の辞書から検索した候補単語のみを表示することができる。
以下の処理では、統合辞書51が指定された場合について説明する。
検索部5は、ステップ43で、選択した検索先であるRAM4にアクセスし、検索対象辞書である統合辞書51を検索し、上記入力されたかな文字列に対応する候補単語を読み出して取得する。この検索処理では、入力されたかな文字列に該当する検索キーに対応する文字列を候補単語として読み出す。
検索部5は、ステップ44で、統合辞書51から取得した候補単語を操作表示部2へ出力し、操作表示部2は、その候補単語を表示する。
例えば、図22に示すように、検索対象辞書指定欄70の統合辞書,ユーザ辞書,グループ辞書,言語辞書のいずれかを選択するプルダウンメニューから、統合辞書を選択し、文字列入力欄72に文字「お」を入力すると、図23に示すように、検索対象辞書指定欄70に統合辞書が選択され、候補単語表示欄74に先頭文字が「お」の候補単語「お疲れさまです」「お世話になっております」「大阪」「億」「思う」などが表示される。
一方、図21に示すように、検索部5は、ステップ45で、RAM4にかな文字列を前入力文字列53として記憶し、ステップ46で、RAM4に候補単語リスト52を作成して上記取得した候補単語を記憶し、あるいは、既に候補単語リスト52が作成されているなら、上記取得した候補単語を追加記憶して、候補単語リスト52の内容を更新する。
そして、ステップ47で、候補単語リスト又は統合辞書から重複して検索されたデータを削除する。
さらに、ステップ48で、ユーザが操作表示部2によって候補単語の検索対象辞書を変更入力した後に、かな文字列を入力すると、操作表示部2は変更入力された検索対象辞書のフラグとかな文字列とを検索部5へ送る。
検索部5は、ステップ49で、操作表示部2から受け取った、変更入力された検索対象辞書のフラグに基づいて、RAM4の候補単語リスト52を検索する。
図24は、図1に示すデータ処理部3における統合辞書検索時に重複するデータは1つのみを残して他のデータを削除する処理を示すフローチャート図である。
検索部5は、ステップ51の初期設定でi=0,j=i+1とし、ステップ52で、統合辞書から取得し、同じか否かを比較する2つの単語のword[i]とword[j](このword[i]とword[j]は統合辞書から同じ検索キーで検索された2単語に相当する)のそれぞれの文字列が同じか否かを判断し、同じでなければステップ55へ進み、同じならば、ステップ53へ進む。
ステップ53で、統合辞書内のword[i]の検索キーと文字列と出所フラグを削除し、ステップ54でword[j]の出所フラグを変更し、ステップ55でj=j+1とし、ステップ56でj>n=統合辞書から同じ検索キーで検索された総単語数(総文字列数)か否かを判断し、j>nでなければ、ステップ52へ戻って上述の処理を繰り返し、j>nなら、ステップ57で、i=i+1とし、ステップ58でi>n=統合辞書から同じ検索キーで検索された総単語数(総文字列数)か否かを判断し、i>nでなければ、ステップ51へ戻って上述の処理を繰り返し、i>nなら、この処理を終了する。
この検索時の処理により、統合辞書内の重複した単語はユーザの利用が進むにつれて徐々に無くすことができる。また、このように統合辞書内の重複した単語を検索時に削除することにより、統合辞書の作成時にかかる時間を短縮することができる。
また、上述の処理に関連して、候補単語リスト52に登録された単語についても上述と同じ処理を施せば、候補単語リスト52に登録された重複単語も削除することができる。
次に、このデータ処理装置における候補単語リストに対する処理を説明する。
図25は、図1に示す検索部5による候補単語リスト52に対する処理を示すフローチャート図である。
検索部5は、ステップ61で、入力されたかな文字列の文字数<前入力文字列の文字数か、又は、前入力文字列の文字数=0かを判断し、入力されたかな文字列の文字数<前入力文字列の文字数、又は、前入力文字列の文字数=0であれば、ステップ62へ進み、入力されたかな文字列の文字数<前入力文字列の文字数でも、前入力文字列の文字数=0でもなければ、ステップ66へ進む。
上記入力されたかな文字列の文字数<前入力文字列の文字数の場合は、入力された文字列が消去された場合であり、前入力文字列の文字数=0の場合は、初めて文字が入力された場合であり、そのいずれかであれば、ステップ62で候補単語リストを削除し、ステップ63で統合辞書、あるいは指定された言語辞書,ユーザ辞書,グループ辞書のいずれかを検索し、ステップ64で上記検索結果から候補単語リストを作成してRAMに格納し、ステップ65で候補単語リスト内で重複してるデータを1つのみ残して他を削除すると共に、残したデータの出書フラグを変更し、この処理を終了する。
一方、入力された文字列が消去された場合でもなく、初めて文字が入力された場合でもなければ、ステップ56で、候補単語リストを検索し、ステップ67で候補単語リストの内容を更新し、ステップ65で候補単語リスト内で重複してるデータを1つのみ残して他を削除すると共に、残したデータの出書フラグを変更し、この処理を終了する。
このようにして、統合辞書51内の重複単語をそのままにし、候補単語リスト52に登録された重複単語を上述と同じようにして削除するようにしてもよい。
図26は重複単語が登録された状態の候補単語リストの内容の一例を示す図であり、図27は重複単語が削除された後の候補単語リストの内容の一例を示す図である。
図26に示すように、候補単語リスト内の2行目と4行目の重複単語である、検索キー「かいだ」、文字列「開田」は、上述の処理によって、図27に示すように、2行目の検索キー「かいだ」、文字列「開田」、出所フラグ「5」にまとめられる。
この発明によるデータ処理装置は、ファクシミリ装置、複写機、プリンタ、それらの複合機、コンピュータを含むデータ処理を行う装置全般において適用することができる。
この発明の実施例のデータ処理装置の機能構成を示すブロック図である。 図1に示す言語辞書の日本語辞書のデータ格納例を示す図である。 図1に示すユーザ辞書のAさん用辞書のデータ格納例を示す図である。 図1に示すグループ辞書の第1グループ辞書のデータ格納例を示す図である。 図2に示す日本語辞書のデータフォーマット例とその構成情報の内容の一例を示す図である。
図3に示すAさん用辞書のデータフォーマット例とその構成情報の内容の一例を示す図である。 図4に示す第1グループ辞書のデータフォーマット例とその構成情報の内容の一例を示す図である。 図1に示す統合辞書用構成情報のデータ内容の一例を示す図である。 図1に示す優先度情報のデータ内容の一例を示す図である。 図1に示すユーザ情報のデータ内容の一例を示す図である。
図1に示すフラグ情報のデータ内容の一例を示す図である。 図1に示すデータ処理装置におけるユーザのログイン時に統合辞書作成して格納するまでの処理を示すシーケンス図である。 図1に示すデータ処理部における統合辞書の作成処理を示すフローチャート図である。 図1に示すデータ処理部における統合辞書作成時に重複するデータは1つのみを残して他のデータを削除する処理を示すフローチャート図である。 重複データを含む状態の統合辞書のデータ内容の一例を示す図である。
重複データを削除した後の状態の統合辞書のデータ内容の一例を示す図である。 図1に示す優先度情報を変更する際の操作例を示す図である。 同じく優先度情報を変更する際の操作例を示す図である。 また同じく優先度情報を変更する際の操作例を示す図である。 さらに同じく優先度情報を変更する際の操作例を示す図である。 図1に示すデータ処理装置の検索部における候補単語の検索処理を示すシーケンス図である。
検索対象辞書の選択作業の一例を示す操作画面の図である。 同じく検索対象辞書の選択作業の一例を示す操作画面の図である。 図1に示すデータ処理部における統合辞書検索時に重複するデータは1つのみを残して他のデータを削除する処理を示すフローチャート図である。 図1に示す検索部による候補単語リスト52に対する処理を示すフローチャート図である。 重複単語が登録された状態の候補単語リストの内容の一例を示す図である。 重複単語が削除された後の候補単語リストの内容の一例を示す図である。
符号の説明
1:HDD 2:操作表示部 3:データ処理部 4:RAM 5:検索部 10:言語辞書 11:日本語辞書 12,14,22,24,32,34:構成情報 13:英語辞書 20:ユーザ辞書 21:Aさん用辞書 23:Bさん用辞書 30:グループ辞書 31:第1グループ辞書 33:第2グループ辞書 41:統合辞書用構成情報 42:優先度情報 43:ユーザ情報 44:フラグ情報 51:統合辞書 52:候補単語リスト 53:前入力文字列

Claims (9)

  1. ユーザのログイン時に、予め記憶されている複数の辞書と各辞書内のデータ格納のフォーマット情報と、新たに作成する統合辞書内のデータ格納のフォーマット情報とを取得し、前記各辞書からそれぞれのフォーマット情報に基づいて読み出した各データを前記新たに作成する統合辞書内のデータ格納のフォーマット情報に基づくデータ格納のフォーマットで1つにまとめた統合辞書を作成する手段を備えたことを特徴とするデータ処理装置。
  2. 請求項1記載のデータ処理装置において、前記複数の辞書のデータを1つにまとめるときの順番を予め格納し、前記各辞書内のデータを統合辞書にまとめる際、前記順番で各辞書のデータを1つにまとめるようにしたことを特徴とするデータ処理装置。
  3. 請求項2記載のデータ処理装置において、前記順番をユーザ毎に格納するようにしたことを特徴とするデータ処理装置。
  4. 請求項1乃至3のいずれか一項に記載のデータ処理装置において、前記各辞書内のデータを統合辞書にまとめる際、重複する複数のデータは1つのみを残して他のデータを削除するようにしたことを特徴とするデータ処理装置。
  5. 請求項4記載のデータ処理装置において、前記各辞書の各データには出所先の辞書を示す識別情報が付与されていることを特徴とするデータ処理装置。
  6. 請求項5記載のデータ処理装置において、前記識別情報は、前記各辞書毎に異なる数値であり、前記各辞書内のデータを統合辞書にまとめる際、重複する複数のデータは1つのみを残して他のデータを削除するとき、残すデータの識別情報の数値と削除するデータの識別情報の数値とを加算した結果の数値を前記残すデータの識別情報として添付するようにしたことを特徴とするデータ処理装置。
  7. 請求項5又は6記載のデータ処理装置において、前記統合辞書から検索した候補単語のデータを候補単語リストとして保存し、前記候補単語リストから候補単語のデータを検索するようにしたことを特徴とするデータ処理装置。
  8. 請求項7記載のデータ処理装置において、前記候補単語リストからの候補単語のデータ検索時、予め選択された辞書の識別情報が添付されたデータからのみ候補単語のデータを検索するようにしたことを特徴とするデータ処理装置。
  9. 請求項1乃至3のいずれか一項に記載のデータ処理装置において、前記統合辞書から検索した候補単語のデータを候補単語リストとして保存し、前記候補単語リストから候補単語のデータの検索時、重複する複数のデータが検索された場合、前記候補単語リストから重複する複数のデータは1つのみを残して他のデータを削除するようにしたことを特徴とするデータ処理装置。
JP2008007625A 2008-01-17 2008-01-17 データ処理装置 Pending JP2009169710A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008007625A JP2009169710A (ja) 2008-01-17 2008-01-17 データ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008007625A JP2009169710A (ja) 2008-01-17 2008-01-17 データ処理装置

Publications (1)

Publication Number Publication Date
JP2009169710A true JP2009169710A (ja) 2009-07-30

Family

ID=40970795

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008007625A Pending JP2009169710A (ja) 2008-01-17 2008-01-17 データ処理装置

Country Status (1)

Country Link
JP (1) JP2009169710A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015172854A (ja) * 2014-03-12 2015-10-01 日本電気株式会社 ユーザ辞書管理装置、ユーザ辞書管理方法、及び、ユーザ辞書管理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015172854A (ja) * 2014-03-12 2015-10-01 日本電気株式会社 ユーザ辞書管理装置、ユーザ辞書管理方法、及び、ユーザ辞書管理プログラム

Similar Documents

Publication Publication Date Title
JPH1153384A (ja) キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
US8370384B2 (en) Information processing apparatus, file management method, program, and storage medium
JP5284030B2 (ja) 検索条件指定装置、検索条件指定方法及びプログラム
JPWO2004111876A1 (ja) 検索条件を再利用する検索システムおよび方法
US9881001B2 (en) Image processing device, image processing method and non-transitory computer readable recording medium
JP2006259919A (ja) 文字列入力支援装置
JP2008234078A (ja) 情報処理装置、情報処理方法、情報処理プログラム、及び情報処理プログラムを記録した記録媒体
JP2009169710A (ja) データ処理装置
JP6811087B2 (ja) 検索装置、検索方法、及びプログラム
JP4116434B2 (ja) 計算ユニットにおけるテキスト処理方法及び計算ユニット
JP2005011055A (ja) 電子帳票設計管理方法及び装置並びに処理プログラムと記録媒体
JP2009093581A (ja) 類義語検索管理システム
JP2012043258A (ja) 検索システム、検索装置、検索プログラム、記録媒体及び検索方法
JP6712521B2 (ja) 検索式提示システム、検索式提示方法、およびプログラム
JP2008117310A (ja) 辞書検索装置および辞書検索処理プログラム
JP2002140338A (ja) 辞書構築支援装置および辞書構築支援方法
JP6554841B2 (ja) 情報処理装置及び情報処理プログラム
JP4778466B2 (ja) データ管理装置及びデータ管理方法並びにプログラム
JP2006338114A (ja) データ管理装置およびデータ管理方法
WO2021111769A1 (ja) 検索装置
JP7247688B2 (ja) 情報処理装置、情報処理システム、及び情報処理プログラム
JP2006092004A (ja) 辞書情報表示制御装置、辞書情報表示制御プログラム、および辞書情報表示制御方法
JP6166443B1 (ja) 情報検索支援装置及びプログラム
JP2007065990A (ja) 情報検索装置
JP6712520B2 (ja) 検索式提示システム、検索式提示方法、およびプログラム