JP4208288B2 - Search menu creation device, search menu creation method, and recording medium recording search menu creation program - Google Patents

Search menu creation device, search menu creation method, and recording medium recording search menu creation program Download PDF

Info

Publication number
JP4208288B2
JP4208288B2 JP15737298A JP15737298A JP4208288B2 JP 4208288 B2 JP4208288 B2 JP 4208288B2 JP 15737298 A JP15737298 A JP 15737298A JP 15737298 A JP15737298 A JP 15737298A JP 4208288 B2 JP4208288 B2 JP 4208288B2
Authority
JP
Japan
Prior art keywords
classification pattern
input data
data
item
search menu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP15737298A
Other languages
Japanese (ja)
Other versions
JPH1153368A (en
Inventor
隆一 塩見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP15737298A priority Critical patent/JP4208288B2/en
Publication of JPH1153368A publication Critical patent/JPH1153368A/en
Application granted granted Critical
Publication of JP4208288B2 publication Critical patent/JP4208288B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、複数のデータからデータの内容に応じた検索メニューを作成する検索メニュー作成装置、検索メニュー作成方法、検索メニュー作成プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
近年、インターネットなどのネットワークを経由して個人が大量のデータを容易に入手できるようになってきている。こうして入手できる大量のデータの中から、情報機器に不慣れなユーザーであっても容易に所望の情報を獲得できるように、データの内容に応じた検索メニューを作成するメニュー検索システムが、情報処理学会研究報告97−NL−117−14「シソーラスを用いた文書データの自動分類法」に紹介されている。図41には、このメニュー検索システムの構成を表すブロック図を示す。
【0003】
図41に示すメニュー検索システムは、データ記憶部3501、シソーラス記憶部3502、データ特徴点抽出部3503、データ対応付部3504、メニュー作成部3505、表示部3506から構成されている。
データ記憶部3501は、ネットワークなどを経由して取得した文書データとデータ特徴点抽出部3503により抽出された特徴点とを記憶する。図42(a)には、データ記憶部3501に記憶されるデータの一例を示す。この図に示すように、データ記憶部3501は、ネットワークなどを経由して取得した文書データ3621、3622、3623と、データ特徴点抽出部3503により抽出された特徴点3601、3602、3603とを記憶している。
シソーラス記憶部3502はシソーラスを記憶する。シソーラスは、単語を意味によって木構造状に分類配列した辞書である。シソーラス記憶部3502は、このシソーラスに、木構造の根に近いほど上位概念の単語を配列し、木構造の葉に近いほど下位概念の単語を配列し、意味が近い(複数の)単語ほど近くに配列する。
【0004】
図42(b)には、シソーラス記憶部3502が記憶しているシソーラスの一例として、シソーラス3511を示す。このシソーラス3511において、「交通機関」3618が根であり、「交通機関」3618には、「車」3617と「鉄道」3616とが接続し、「車」3617には、「トラック」3611と「バス」3612とが接続し、「鉄道」3616には、「汽車」3613と「電車」3614とが接続している。
このシソーラス3511は、「交通機関」3618が「車」3617と「鉄道」3616との上位概念であり、「車」3617が「トラック」3611と「バス」3612との上位概念であり、「鉄道」3616が「汽車」3613と「電車」3614との上位概念であることを示している。
【0005】
データ特徴点抽出部3503は、データ記憶部3501に記憶されている文書データからその文書データの持つ特徴を示す特徴点を抽出する。具体的には、文書データの中に多く出現する単語を重要な単語として抽出し特徴点とする。図42(a)において、特徴点3601「バス」、特徴点3602「トラック」、特徴点3603「電車」は、データ特徴点抽出部3503が、それぞれ文書データ3621、3622、3623から抽出した特徴点である。
データ対応付部3504は、特徴点と、特徴点と同じ表現のシソーラス中の単語とを対応付ける。例えば、データ対応付部3504は、特徴点3601「バス」を、特徴点3601「バス」と同じ表現のシソーラス3511中の「バス」3612に対応付ける。データ対応付部3504は、特徴点3602「トラック」、特徴点3603「電車」についても、同様に、それぞれシソーラス3511中の「トラック」3611、「電車」3614に対応付ける。こうして、図43に示すように、特徴点が対応づけられたシソーラス3511aが生成される。
【0006】
メニュー作成部3505は、データの対応付けが終了したシソーラス3511aから、特徴点が対応づけられた単語と、その単語に接続する単語とを抽出し、メニュー構造を生成する。メニュー作成部3505は、図43に示すシソーラス3511aにおいて、特徴点3602「トラック」に対応づけられた「トラック」3611と、特徴点3601「バス」に対応づけられた「バス」3612と、特徴点3603「電車」に対応づけられた「電車」3614と、「トラック」3611に接続する「車」3617と、「電車」3614に接続する「鉄道」3616と、「車」3617に接続する「交通機関」3618とを抽出し、図44(a)に示すメニュー構造3511bを生成する。
【0007】
表示部3506は、生成されたメニュー構造にしたがって検索メニューを表示する。表示部3506は、図44(a)に示すメニュー構造3511bを基にして、図44(b)に示すように、「交通機関」3701を標題として、選択肢「車」3702と選択肢「鉄道」3703とからなる検索メニュー3700を表示する。ここで、ユーザーが選択肢「車」3702を選択すると、次に表示部3506は、図44(b)に示すように、「車」3711を標題として、選択肢「トラック」3712と選択肢「バス」3713とからなる検索メニュー3710を表示する。
【0008】
【発明が解決しようとする課題】
しかしながら、上記の従来例では、ネットワークなどを経由して取得されたデータを基にして、シソーラスを利用した検索メニューが生成されるので、情報機器に不慣れなユーザーであっても容易に所望の情報を検索できる検索メニューが生成されるという利点があるものの、1つのシソーラスを用いて検索メニューを生成するため、検索の対象となるデータが単語を意味によって木構造状に分類配列したシソーラスに当てはまらないことがあるという問題点がある。例えば、「道路」という言葉は「交通機関」に関連しているが、「交通機関」という視点で分類配列されたシソーラス3511内の単語にうまく対応付けられない。
【0009】
また、選択肢「〜10歳未満」、「11〜20歳」、「21歳以上」を有する年齢メニューと、前記選択肢「21歳以上」の下位に、選択肢「学生」、「会社員」、「主婦」を有する職業メニューとからなる検索メニューは、前記年齢メニューと職業メニューに含まれる選択肢が、分類の視点が異なり、またその意味において繋がりがないので、シソーラスを基にしては生成できないという問題点がある。
【0010】
さらに、シソーラスへデータを追加したり、シソーラスのデータを変更したりする際には、データが意味において木構造状に分類配列されるというシソーラス特有の構造を保ちながら行う必要があり、これらのデータの追加や変更の操作は非常に煩雑であるという問題点がある。
本発明は、分類の視点が異なり、意味において繋がりのない分類パターンに含まれる選択肢に対しても、データをうまく対応づけて検索メニューを生成する検索メニュー作成装置、検索メニュー作成方法及び検索メニュー作成プログラムを記録した記録媒体を提供することを目的とする。
【0011】
【課題を解決するための手段】
この問題点を解決するために、本発明は、複数の入力データの検索に利用する選択肢を含む検索メニューを作成する検索メニュー作成装置であって、複数の入力データを記憶するための記憶領域を有するデータ記憶手段と、検索メニューの選択肢となりえる複数の項目から構成される分類パターンが予め複数個記憶された分類パターン記憶手段と、複数の入力データを受信する受信手段と、前記受信した複数の入力データを前記データ記憶手段に書き込む書込手段と、前記データ記憶手段に書き込まれた複数の入力データのそれぞれを、前記分類パターン記憶手段に予め記憶された複数の分類パターンのうちのいずれかに含まれる項目に対応付ける対応付手段と、前記分類パターン記憶手段に予め記憶された複数の分類パターンのそれぞれについて、前記分類パターンを構成する各項目に対応付けた入力データの数を計数し、前記計数した値から算出される入力データの分散値を基に、分類パターンを選択する分類パターン選択手段と、前記選択された分類パターンを構成する項目から、前記入力データに対応付けた項目を抽出し、抽出した前記項目を選択肢とした検索メニューを生成するメニュー抽出手段と、前記メニュー抽出手段により生成された検索メニューを表示する表示手段とを備えることを特徴とする。
【0014】
ここで、前記データ記憶手段は、各入力データを識別するデータ識別子を記憶しており、前記対応付手段は、前記データ記憶手段から入力データを順次読み出し、読み出された入力データ毎に、入力データに含まれる特徴点を抽出する特徴点抽出部と、抽出された前記特徴点毎に、前記特徴点に対応する項目を前記分類パターン記憶手段より検索する項目検索部と、前記検索された項目に、前記入力データを識別するデータ識別子を付加するデータ対応付部とを含むように構成してもよい。
【0015】
ここで、前記データ記憶手段に記憶されている各入力データは、文書データであり、前記特徴点抽出部は、前記データ記憶手段から文書データを順次読み出すデータ読出要素と、読み出された文書データに対して形態素解析を施して、文書データ毎に形態素に分解する形態素解析要素と、前記分解された形態素から重要語を抽出し、抽出した重要語の一部又は全部を特徴点とする重要語抽出要素とを含むように構成してもよい。
【0016】
ここで、前記重要語抽出要素は、前記分解された形態素から重要語候補を抽出する重要語候補抽出要素と、同一文書データにおいて、前記抽出された重要語候補と同じ重要語候補が出現する回数をカウントする出現回数カウント要素と、抽出された重要語候補から、前記カウントされた回数が所定の回数以上の重要語候補を重要語として抽出し、抽出された重要語を特徴点とする所定回数抽出要素とを含むように構成してもよい。
【0017】
ここで、前記重要語抽出要素は、前記分解された形態素から重要語候補を抽出する重要語候補抽出要素と、同一文書データにおいて、抽出された重要語候補と同じ重要語候補が出現する回数をカウントする出現回数カウント要素と、抽出された重要語候補のうち、前記カウントされた回数が多い重要語候補から順に所定数の重要語候補を重要語として抽出し、抽出された所定数の重要語を特徴点とする所定数抽出要素とを含むように構成してもよい。
【0018】
ここで、前記データ記憶手段は、リレーショナルデータベースとして前記複数の入力データを記憶し、各入力データはリレーショナルデータベースの行に相当し、少なくとも1つの値の並びから構成され、前記特徴点抽出部は、前記データ記憶手段から入力データを順次読み出すデータ読出要素と、前記読み出した入力データを構成する少なくとも1つの値を特徴点として抽出するデータ抽出要素とを含むように構成してもよい。
【0019】
ここで、前記分類パターン記憶手段に含まれる前記項目は、階層構造を形成し、前記対応付手段は、さらに、抽出された前記特徴点毎に、前記特徴点に対応する前記項目を前記分類パターン記憶手段より検索する階層項目検索部を含み、前記データ対応付部は、前記検索された項目と、前記特徴点を含む前記入力データとを対応付けるように構成してもよい。
【0020】
ここで、さらに、ユーザーより、表示された検索メニューから選択肢の選択を受け付ける入力受付手段と、前記入力受付手段が前記ユーザーの選択を受け付けた場合に、所定の基準に基づいて、検索メニューを作成するか、又は、入力データを表示するかを判定する判定手段と、前記判定手段により検索メニューを作成すると判定された場合に、前記選択を受け付けられた選択肢に対応する前記項目に従属する項目から、入力データが対応付けられた項目を抽出し、抽出した前記項目を選択肢とする検索メニューを生成する項目メニュー生成手段と、前記判定手段により検索メニューを作成すると判定された場合に、前記生成された検索メニューを表示し、入力データを表示すると判定された場合に、前記選択を受け付けられた選択肢に対応する項目及びこの項目に従属するすべての項目に対応付けられた入力データをデータ記憶手段より読み出し、読み出した入力データを表示する入力データメニュー表示手段と、前記入力データメニュー表示手段により前記読み出した入力データが表示されるまで、前記入力受付手段による1つの選択肢の選択の受け付けと、前記判定手段による判定と、前記項目メニュー生成手段による検索メニューの生成と、前記入力データメニュー表示手段による検索メニューの表示とを繰り返すよう、前記入力受付手段、前記判定手段、前記項目メニュー生成手段、前記入力データメニュー表示手段を制御する繰返制御手段とを備えるように構成してもよい。
【0021】
ここで、前記判定手段における所定の基準とは、前記選択を受け付けられた選択肢に対応する項目と当該項目に従属するすべての項目とに対応付けられている入力データの数が、所定の値以下であれば、入力データを表示し、所定の値よりも大きければ、検索メニューを生成する判定基準であるように構成してもよい。
【0022】
ここで、前記データ記憶手段は、各入力データを識別するデータ識別子を記憶しており、前記対応付手段は、前記分類パターン記憶手段から、各分類パターンに含まれる項目を順次読み出す項目読出部と、前記データ記憶手段から入力データを順次読み出し、読み出された入力データ毎に、入力データに含まれる特徴点を抽出する特徴点抽出部と、読み出された前記項目と抽出された前記特徴点とが対応するか否かを判定する一致判定部と、前記一致判定部により、読み出された前記項目と抽出された前記特徴点とが対応すると判定された場合に、前記読み出された項目に、前記特徴点を含む前記入力データを識別するデータ識別子を付加するデータ対応付部とを備えるように構成してもよい。
【0027】
ここで、前記分類パターン選択手段は、各分類パターン毎に各項目に対応付けられている入力データの計数値から前記入力データの分散値を算出する分散算出部と、最も小さい分散が算出された分類パターンを選択する分散選択部とを含むように構成してもよい。
ここで、前記分類パターン選択手段は、各分類パターン毎に項目に対応付けられている入力データの種類の数を計数する入力データ数計数部と、各分類パターン毎に各項目に対応付けられている入力データの数の計数値から前記入力データの分散値を算出する分散算出部と、前記計数した入力データの種類の数および前記算出した入力データの分散値を基に、分類パターンを選択する入力データ数選択部と、を含むように構成してもよい。
【0029】
ここで、前記分類パターン選択手段は、各分類パターン毎に優先度を記憶している優先度記憶手段と、前記優先度記憶手段から優先度を読み出し、読み出した優先度を用いて、1つの分類パターンを選択する優先度選択手段とを含むように構成してもよい。
【0030】
ここで、前記検索メニュー作成装置は、さらに、ユーザーより、前記表示手段に表示された検索メニューの切替指示を受け付ける切替受付手段と、前記切替受付手段が前記ユーザーの切替指示を受け付けた場合に、前記分類パターン選択手段により選択された分類パターンを除く他の分類パターンより、前記分類パターン選択手段における前記所定の基準に基づいて、分類パターンを選択する第2分類パターン選択手段とを含み、前記メニュー抽出手段は、前記第2分類パターン選択手段により選択された分類パターンから、検索メニューを生成するように構成してもよい。
【0031】
ここで、前記検索メニュー作成装置は、さらに、ユーザーより、前記表示された検索メニューから選択肢の選択を受け付ける入力受付手段を含み、前記対応付手段は、さらに、前記選択を受け付けられた選択肢に対応する項目に対応付けられた入力データを選択データとして抽出する選択入力データ抽出手段と、前記入力データと前記項目との全ての前記対応付けを取り消す対応付取消手段と、前記選択を受け付けられた選択肢に対応する項目を含む分類パターンを除く他の分類パターンを構成する各項目と、前記抽出された選択データとを対応付ける選択入力データ対応付手段とを含み、前記分類パターン選択手段は、前記選択を受け付けられた選択肢に対応する項目を含む分類パターンを除く他の分類パターンから、前記所定の基準に基づいて、分類パターンを選択し、前記メニュー抽出手段は、前記分類パターンを基にして、検索メニューを生成し、前記表示手段は、前記生成された検索メニューを表示するように構成してもよい。
【0032】
ここで、さらに、ユーザーより分類パターンと、分類パターンの登録と分類パターンの削除とを含む分類パターンの編集指示との入力を受け付ける分類パターン入力受付手段と、前記分類パターン入力受付手段により入力を受け付けられた分類パターンと分類パターンの編集指示を基にして、分類パターン記憶手段に記憶された分類パターンを編集する分類パターン編集手段とを含むように構成してもよい。
【0033】
【発明の実施の形態】
1.実施の形態1
以下に本発明に係る一つの実施の形態としての検索メニュー作成装置100について、図面を参照しながら説明する。
1.1 検索メニュー作成装置の構成
検索メニュー作成装置100の構成を示すブロック図を図1に示す。
検索メニュー作成装置100は、データ記憶部101、データ特徴点抽出部102、分類パターン記憶部103、優先度記憶部104、対応付部105、第1分類パターン選択部106、メニュー作成部107、表示部108、入力部109、第2分類パターン選択部110から構成されている。
【0034】
1.1.1 データ記憶部101
データ記憶部101は、ネットワークなどを経由して送られてくる伝言板情報260を1例とする入力データを記憶している。また、データ記憶部101は、データ特徴点抽出部102から出力される特徴点からなる特徴点情報270を記憶している。データ記憶部101は、具体的には磁気ディスク装置などによって構成されている。
図1に図示していない受信部は、ネットワークなどを経由して外部から前記入力データを受信し、図1に図示していないデータ書込部は、前記受信した入力データをデータ記憶部101に書き込む。
なお、前記受信部は、CD−ROMなど、コンピュータによる読み出しができる記録媒体に記録されている辞書、類語辞典、百科辞典などから入力データを読み出すとしてもよい。
【0035】
(1)伝言板情報260
伝言板情報260は、物品を買いたい又は売りたいという情報を多数の人に伝達するために用いられ、図2に示すように、伝言板識別情報261、購入譲渡区別262、住所263、情報提供者名264、年齢265、職業266、コメント267から構成されている。
伝言板識別情報261は、伝言板情報260を識別するためのデータ識別子であり、伝言板情報260を識別できれば、どのような付け方であっても良い。入力データの到着順などにより決まる番号を利用するのが一般的である。購入譲渡区別262は、伝言板に記載されている情報が購入に関する情報であるか譲渡に関する情報であるかの区別を示す。住所263は、情報提供者の住所を示し、情報提供者名264は、情報提供者の名前を示し、年齢265は、情報提供者の年齢を示し、職業266は、情報提供者の職業を示す。コメント267は、購入又は譲渡に係る品物名、金額、条件などを含む文章である。
【0036】
データ記憶部101に記憶される伝言板情報260の一例を図3に示す。この図に示すように、データ記憶部101は、ネットワークを経由して取得した物品の購入及び譲渡に関する伝言板情報201、202、203を記憶している。伝言板情報201には、伝言板識別情報211と、購入譲渡区別231と、住所232と、情報提供者名233と、年齢234と、職業235と、コメント236とが含まれており、伝言板情報202には、伝言板識別情報212と、購入譲渡区別241と、住所242と、情報提供者名243と、年齢244と、職業245と、コメント246とが含まれており、伝言板情報203には、伝言板識別情報213と、購入譲渡区別251と、住所252と、情報提供者名253と、年齢254と、職業255と、コメント256とが含まれている。
【0037】
(2)特徴点情報270
特徴点情報270は、図4に示すように、特徴点識別情報271と特徴点272とから構成される。
一つの特徴点情報270は、一つの伝言板情報260に対応している。特徴点識別情報271は、対応する伝言板情報260に含まれる伝言板識別情報261と同じ内容が格納されており、特徴点情報270を識別するために用いられる。特徴点272は、データ特徴点抽出部102により抽出され、データ記憶部101へ書き込まれたものである。特徴点272については、後述する。
データ記憶部101に記憶されている特徴点情報270の一例を図5に示す。この図に示すように、データ記憶部101は、特徴点情報301と、特徴点情報302と、特徴点情報303とを記憶している。特徴点情報301は、特徴点識別情報214、特徴点221、222、223、224、225、226、227、228から構成され、特徴点識別情報214は、伝言板識別情報211と同じ値を有し、特徴点情報301が伝言板情報201に対応していることを示している。また、特徴点情報302は、特徴点識別情報215、特徴点281、282、283、284、285、286、287、288、289から構成され、特徴点識別情報215は、伝言板識別情報212と同じ値を有し、特徴点情報302が伝言板情報202に対応していることを示している。さらに、特徴点情報303は、特徴点識別情報216、特徴点291、292、293、294、295、296、297から構成され、特徴点識別情報216は、伝言板識別情報213と同じ値を有し、特徴点情報303が伝言板情報203に対応していることを示している。
【0038】
1.1.2 データ特徴点抽出部102
データ特徴点抽出部102は、データ記憶部101に記憶されている伝言板情報260毎に、伝言板情報260を構成する伝言板識別情報261、購入譲渡区別262、住所263、情報提供者名264、年齢265、職業266、コメント267を読み出す。
次に、データ特徴点抽出部102は、読み出したコメント267に対して形態素解析を行うことにより、コメント267を形態素に分解し、前記形態素から、名詞単語を抽出する。
ここで、形態素解析は、与えられた文を意味を持つ最小の言語単位である形態素の並びに分解し、それぞれの形態素の品詞を決定することを目的としており、形態素解析については、自然言語処理PP117〜137(岩波書店、1996年4月発行)に説明されているので、詳細については省略する。
【0039】
さらに、データ特徴点抽出部102は、読み出された伝言板識別情報261を特徴点識別情報として、読み出された購入譲渡区別262と、住所263と、情報提供者名264と、年齢265と、職業266と、抽出された名詞単語とをそれぞれ特徴点として、データ記憶部101へ書き込む。
ここで、伝言板情報260に含まれる購入譲渡区別262は、伝言板に記載されている情報が購入に関する情報であるか譲渡に関する情報であるかの区別を示しており、他の情報が含まれていないので、上記に説明するように、データ特徴点抽出部102は、購入譲渡区別262をそのまま特徴点とする。同様に、住所263、情報提供者名264、年齢265、職業266についてもそのまま特徴点とする。一方、コメント267は、購入又は譲渡に係る品物名、金額、条件などを含む文章であるので、コメント267をそのまま特徴点として用いるのは不適切であり、上記に説明するように、データ特徴点抽出部102は、コメント267に対して形態素解析を行って、コメント267から名詞単語を抽出し、抽出した名詞単語を特徴点とする。
【0040】
このように、入力データをそのまま特徴点とするか、入力データに対して形態素解析を行って特徴点を抽出するかは、データ構造を利用して決定することができる。
【0041】
次に、図3及び図5に示す例を用いて、データ特徴点抽出部102について、説明する。
データ特徴点抽出部102は、データ記憶部101が記憶する伝言板情報201から、伝言板識別情報211「(1)」、購入譲渡区別231「売ります」、住所232「東京」、情報提供者名233「佐藤」、年齢234「22歳」、職業235「大学生」、コメント236「パソコンを22万円で売ります。手渡しを希望します。」を読み出す。次に、データ特徴点抽出部102は、読み出したコメント236「パソコンを22万円で売ります。手渡しを希望します。」に対して形態素解析を行なって、コメント236を形態素「パソコン」、「を」、「22万円」、「で」、「売り」、「ます」、「。」、「手渡し」、「を」、「希望し」、「ます」、「。」に分解し、分解された形態素「パソコン」、「を」、「22万円」、「で」、「売り」、「ます」、「。」、「手渡し」、「を」、「希望し」、「ます」、「。」から名詞単語「パソコン」、「22万円」、「手渡し」を抽出する。さらに、データ特徴点抽出部102は、読み出した伝言板識別情報211「(1)」を特徴点識別情報として、読み出した購入譲渡区別231「売ります」、住所232「東京」、情報提供者名233「佐藤」、年齢234「22歳」、職業235「大学生」と、抽出した名詞単語「パソコン」、「22万円」、「手渡し」とを特徴点として、データ記憶部101へ書き込む。
また、データ特徴点抽出部102は、データ記憶部101が記憶する伝言板情報202、203についても、上記と同様にして、それぞれ、特徴点識別情報と特徴点をデータ記憶部101へ書き込む。
【0042】
1.1.3 分類パターン記憶部103
分類パターン記憶部103は、分類パターン情報700を記憶する。具体的には分類パターン記憶部103は磁気ディスク装置などによって構成される。
分類パターン情報700は、入力データを選択するための選択肢から構成される検索メニューを生成する際に、選択肢生成の基となる情報である。分類パターン情報700は、図6に示すように、少なくとも1つの分類パターン701から構成される。
【0043】
分類パターン701は、分類パターン名702と、項目グループ705とを必ず含む。分類パターン701は、さらに、データ対応項目数703又は選択マーク704を含む場合がある。
項目グループ705は、少なくとも1つの項目711を含む。項目711は、少なくとも1つの伝言板識別情報713を付加される場合がある。また、項目711は、少なくとも1つの小項目712を従属して付加される場合がある。小項目712は、少なくとも1つの伝言板識別情報714を付加される場合がある。
分類パターン名702は、分類パターン701を代表する名称である。
分類パターン記憶部103は、各分類パターン毎に、第1分類パターン選択部106により書き込まれるデータ対応項目数をデータ対応項目数703として記憶している。
分類パターン記憶部103は、第1分類パターン選択部106により書き込まれる選択マークを選択マーク704として記憶している。
データ対応項目数703、選択マーク704については、詳細について、後述する。
【0044】
伝言板識別情報713、714は、図2に示す伝言板識別情報261と同じものである。
ここで、任意の1つの分類パターンを構成するどの項目も、他の任意の分類パターンを構成するどの項目とも相互に関連はない。
分類パターン記憶部103に記憶される分類パターン情報700の一例としての分類パターン情報400を、図7に示す。
分類パターン情報400は、分類パターン421、431、441、451、461、471を含む。
【0045】
分類パターン421、431、441、451、461、471は、分類パターン名として、それぞれ「年齢」411、「職業」412、「性別」413、「地名」414、「値段1」415、「値段2」416が与えられている。
分類パターン421は、年齢を7つに分類した7つの項目「〜9」、「10〜20」、「21〜29」、「30〜39」、「40〜49」、「50〜59」、「60〜」から構成される項目グループ420を含む。
分類パターン431は、10個の項目「幼児」、「小学生」、「中学生」、「高校生」、「大学生」、「主婦」、「会社員」、「専門学校生」、「自営業」、「無職」から構成される項目グループ430を含む。
分類パターン441は、2つの項目「男」、「女」から構成される項目グループ440を含む。
【0046】
分類パターン451は、8つの地域名「北海道」、「東北」、「関東」、「中部」、「近畿」、「中国」、「四国」、「九州」を項目として構成される項目グループ450を含み、さらに、項目「東北」452は、小項目「青森」453、「岩手」454、「宮城」455、「秋田」456、「山形」457、「福島」458を付加されている。このように、項目は、さらに各地域の都道府県名を小項目とする2層構造となっている。
分類パターン名「値段1」415を付加された分類パターン461は、項目グループ460「〜1万、1〜10万、10〜100万、100万〜」を含み、分類パターン名「値段2」416を付加された分類パターン471は、項目グループ470「〜1千、1〜3千、3〜5千、5〜10千、1万〜」を含む。このように、分類パターン461と分類パターン471とは、分類パターンの対象はともに値段であるが、項目の構成が異なってる。このように対象が同じであるが、構成が異なる複数のパターンが格納されていても良い。
【0047】
1.1.4 優先度記憶部104
優先度記憶部104は、各分類パターン701毎に優先度を対応づけた優先度情報750を記憶している。優先度記憶部104は、具体的には磁気ディスク装置などによって構成される。
優先度情報750は、図8に示すように、少なくとも1つの優先パターン情報751を含んでいる。優先パターン情報751は、分類パターン名752と優先度753とから構成されている。分類パターン名752は、図6に示す分類パターン名702と同じであり、優先度753は、分類パターン名752で示される分類パターンについて、ユーザーの好みの程度を表現し、数字の大きいものほどユーザーの好みが高いことを示す。
【0048】
優先度情報750の一例としての優先度情報760を図9に示す。この図に示すように、分類パターン名「年齢」511、「職業」512、「性別」513、「地名」514、「値段1」515、「値段2」516に、それぞれ優先度「3」521、「4」522、「5」523、「8」524、「2」525、「4」526が対応づけられている。従って、図7に示す分類パターン421、431、441、451、461、471には、それぞれ優先度「3」、「4」、「5」、「8」、「2」、「4」が割り当てらてていることになる。
本実施の形態では、分類パターン名と優先度を対応させているので、分類パターン名を用いて分類パターンの優先度の知ることができるが、優先度情報750の分類パターン名752の代わりに分類パターンの格納位置を記憶するようにしてもよい。この場合、分類パターン情報700に、分類パターン名702を設けず、分類パターンの格納位置を設けるようにする。
また、優先度の数字が小さいものほど優先度を高くしてもよい。
【0049】
1.1.5 対応付部105
対応付部105は、データ記憶部101に記憶されている特徴点情報を用いて、データ記憶部101が記憶する伝言板情報を分類パターン記憶部103が記憶する分類パターンに対応付けする。
図5及び図7を参照しながら、対応付部105の具体的な動作について説明する。
対応付部105は、まず特徴点情報301に含まれる特徴点識別情報214と特徴点221とをデータ記憶部101より読み出し、読み出した特徴点221を、分類パターン記憶部103に記憶されている分類パターン421、431、441、451、461、471に含まれる項目又は小項目と比較する。特徴点221が前記項目又は前記小項目と一致すれば、又は、特徴点221が前記項目又は前記小項目で示される範囲に含まれれば、対応付部105は、特徴点221が一致した項目若しくは小項目、又は、特徴点221がその範囲に含まれる項目又は小項目に、前記読み出した特徴点識別情報214を、伝言板識別情報として、付加する。これにより、特徴点情報と項目又は小項目との対応付けを行う。
【0050】
対応付部105は、特徴点情報301に含まれる特徴点222、223、224、225、226、227、228について、特徴点221と同様に、特徴点と分類パターンの項目又は小項目との比較と、特徴点識別情報214の付加とを行う。
【0051】
次に、対応付部105は、特徴点情報302に含まれる特徴点に対して、特徴点情報301と同様に、特徴点と分類パターンの項目又は小項目との比較と、特徴点識別情報215の付加とを行う。同様にして、対応付部105は、データ記憶部101に含まれる全ての特徴点情報について、特徴点と分類パターンの項目又は小項目との比較と、特徴点識別情報の付加とを行う。
例えば、対応付部105は、特徴点情報301に含まれる特徴点識別情報214「(1)」と特徴点221「売ります」とを読み出し、特徴点221と分類パターン421、431、441、451、461、471に含まれる項目又は小項目と順に比較する。分類パターン421、431、441、451、461、471に含まれる項目又は小項目には、特徴点221「売ります」に一致する項目又は小項目がなく、かつ、特徴点221「売ります」が前記項目又は前記小項目で示される範囲に含まれないので、対応付部105は、次の特徴点222「東京」を読み出す。
【0052】
対応付部105は、特徴点222「東京」と分類パターン421、431、441、451、461、471に含まれる項目又は小項目と比較する。特徴点222「東京」は、分類パターン451に含まれる小項目「東京」と一致するので、分類パターン451に含まれる小項目「東京」に特徴点識別情報214「(1)」を、伝言板識別情報として付加する。
図10に、分類パターン451に含まれる小項目「東京」に特徴点識別情報214「(1)」を伝言板識別情報として付加した場合の、分類パターン情報を示す。この図に示すように、符号611は、この対応付けられた伝言板識別番号を示している。
同様にして、特徴点情報301に含まれるその他の特徴点223、224、225、226、227、228について、これら特徴点識別情報を項目又は小項目に付加する。
ここで、特徴点223「佐藤」、特徴点226「パソコン」、特徴点228「手渡し」は分類パターンにないので、特徴点識別情報は項目又は小項目に付加されない。
【0053】
また特徴点227「22万」などの数値データは、数値の大小関係を用いて、項目の範囲内かどうかを判定し対応付ける。本実施の形態では、特徴点227「22万」に対して、2つの分類パターン名415「値段1」、416「値段2」で示される分類パターン461、471の両方に含まれる項目に伝言板情報201を対応付けることになる。
図11に、特徴点情報301に含まれる全ての特徴点を用いた対応付けが終了したときの分類パターン記憶部103の状態を表している。この図で、符号611〜符号615は、対応付部105により、対応づけられた伝言板情報201の伝言板識別情報211「(1)」を示している。
図12に、特徴点情報301、302、303に含まれる全ての特徴点を用いた対応付けが終了したときの分類パターン情報652を示している。符号811〜符号822は対応づけられた伝言板情報201、202、203の伝言板識別番号を示している。
図13に、特徴点情報301、302、303に、新たに別の17個の特徴点情報を加えて、合計で20個の特徴点情報に含まれる全ての特徴点を用いた対応付けが終了したときの分類パターン情報653を示している。
【0054】
1.1.6 第1分類パターン選択部106
第1分類パターン選択部106は、以下に説明する所定の基準に基づいて、分類パターン記憶部103に記憶されている分類パターン情報から優先度記憶部104に記憶されている優先度情報を用いて、検索メニューを作成するための最適な分類パターンを選択する。
第1分類パターン選択部106は、分類パターン記憶部103に記憶されている分類パターン情報700を分類パターン701毎に読み出し、読み出した分類パターン701毎に、伝言板識別情報713が付加された項目及び伝言板識別情報714が付加された小項目を含む項目の数を数え、数えた項目数をデータ対応項目数703として、分類パターン701毎に、分類パターン記憶部103の分類パターン情報700に書き込む。
【0055】
ここでは、図13に示す分類パターン情報653を用いて、第1分類パターン選択部106の動作を説明する。
第1分類パターン選択部106は、分類パターン情報653から、分類パターン1010を読み出し、分類パターン1010に含まれる各項目に伝言板識別情報が付加されているかどうかを判断し、伝言板識別情報が付加されている項目の数を数える。
分類パターン1010に含まれる項目のうち、入力データが対応づけられているのは、項目1012、1013の2項目であるので、第1分類パターン選択部106は項目数として「2」を数え、データ対応項目数として「2」を分類パターン1010内に書き込む。
ここで、分類パターン名「地名」1021で示される、項目と小項目との2階層の構造を持つ分類パターンについては、第1分類パターン選択部106は、伝言板識別情報が付加されている小項目を含む項目の数を数える。
図14に、伝言板識別情報が対応づけられた項目数が分類パターン名毎に記憶されている状態を示している。
【0056】
検索メニューを作成する場合、1画面あたりに表示する選択肢の数が少なすぎるとメニュー階層が深くなって検索しにくくなり、逆に多すぎると一度に比較しにくいので、選択しにくくなる。そこで、あらかじめ最良とする選択肢の所定の数を設定しておき、その数に近いほど適切な分類であると決定する。ここで仮に適切な選択肢の数を6とすると、図14に示す例では、分類パターン名1021「地名」と1022「値段2」で示される分類パターンの項目数はそれぞれ5であり、適切な選択肢の数6に最も近いので、第1分類パターン選択部106は、分類パターン名1021「地名」と1022「値段2」とで示される分類パターンが最適であると判断する。
【0057】
このようにして、第1分類パターン選択部106は、最適な分類パターンを選択する。ここで、最適な分類パターンが複数あるときは、次に示すように、第1分類パターン選択部106は、選択された複数の分類パターンからさらに絞り込みを行って分類パターンを選択する。
すなわち、第1分類パターン選択部106は、前記最適として選択された複数の分類パターンの分類パターン名にそれぞれ対応する複数の優先度を、優先度記憶部104から読み出し、読み出した複数の優先度を比較する。例えば、図9に示すように、第1分類パターン選択部106は、分類パターン名1021「地名」に対応する優先度524「8」と、分類パターン名1022「値段2」に対応する優先度526「4」とを読み出す。第1分類パターン選択部106は、読み出した優先度524「8」と優先度526「4」とを比較し、優先度524「8」が優先度526「4」より大きいので、分類パターン名1021「地名」により示される分類パターンが最適であると判断する。
なお、優先度も等しい場合は、第1分類パターン選択部106は、ランダムに決める、又は分類パターンの登録順で決定する、などの方法を用いて1つの分類パターンを選択する。
【0058】
第1分類パターン選択部106は、最適と決定した分類パターンには、最適と決定したことを示す選択マーク「○」を、分類パターン記憶部103の分類パターン701に、選択マーク704として付加し書き込む。
図15には、決定された分類パターン名「地名」に対して、選択マークとして1111「○」が付加されたときの、分類パターン情報1100を示す。
【0059】
1.1.7 メニュー作成部107
メニュー作成部107は、第1分類パターン選択部により選択された分類パターンから伝言板情報が対応付けられている項目のみを抽出し、抽出された項目を選択肢とする検索メニューを作成する。以下に、メニュー作成部107の動作の詳細について、図面を参照しながら、説明する。
メニュー作成部107は、分類パターン記憶部103に記憶されている分類パターン情報700から、「○」の選択マーク704を含む分類パターン701を抽出し、抽出された分類パターン701から、伝言板識別情報713が付加された項目、及び伝言板識別情報714が付加された小項目を含む項目を抽出する。また、メニュー作成部107は、前記抽出された項目毎に、当該項目に付加された伝言板識別情報713の数を算出し、当該項目に含まれる小項目に付加された伝言板識別情報714の数を算出し、算出された伝言板識別情報713の数と算出された伝言板識別情報714の数を合計し、合計して得られた値を当該項目に付加された伝言板情報の数とする。
このようにして、メニュー作成部107は、前記抽出された項目と当該項目に付加された伝言板情報の数との組を少なくとも1つ生成し、生成した少なくとも1つの組の前記項目と前記伝言板情報の数とを表示部108へ出力する。
【0060】
ここで、図15を参照しながら、メニュー作成部107の動作の詳細について、具体的に説明する。
まず、メニュー作成部107は、「○」1111の選択マークの付けられた分類パターン1120を抽出する。次に、メニュー作成部107は、分類パターン1120に含まれる項目1121「北海道」、1122「東北」、1123「関東」、1124「中部」、1125「近畿」、1126「中国」、1127「四国」、1128「九州」の中から、前記それぞれの項目から伝言板識別情報が対応づけられた小項目を含む項目1123「関東」、1124「中部」、1125「近畿」、1126「中国」、1127「四国」を抽出する。なお、この例においては、伝言板識別情報が付加された項目はない。メニュー作成部107は、このように抽出された5つの項目1123「関東」、1124「中部」、1125「近畿」、1126「中国」、1127「四国」に含まれる小項目に付加された伝言板識別情報の数を、前記それぞれの項目毎に算出する。このようして、メニュー作成部107は、前記抽出された項目と当該項目に付加された伝言板情報の数との組を5個生成する。図16に、メニュー作成部107により生成された項目1201と伝言板情報の数1202との5つの組を示す。次に、メニュー作成部107は、抽出された項目と項目毎に算出された伝言板情報の数との5つの組を表示部108へ出力する。
【0061】
1.1.8 表示部108
表示部108は、メニュー作成部107から、項目と伝言板情報の数との少なくとも1つの組を受け取り、受け取った項目と伝言板情報の数との少なくとも1つの組を基にして、前記受け取った項目と、前記受け取った伝言板情報の数に比例した長さの棒グラフと、前記受け取った伝言板情報の数との少なくとも1つの組を検索メニューとして表示する。また、表示部108は、項目を選択するためのカーソルを表示する。
図17には、表示部108により表示された検索メニューの一例を示す。この図において、検索メニューは、項目1302と、棒グラフ1303と、伝言板情報の数1304との5つの組から構成されており、また、項目を選択するためのカーソル1301が表示されている。
なお、表示部108は、項目と、棒グラフと、伝言板情報の数とを表示するとしているが、項目と、伝言板情報の数とを表示するとしてもよい。
【0062】
表示部108は、表示部108により検索メニューが表示されている状態で、入力部109より「上移動」を受け取ると、カーソル1301を1つ上の項目に移動して表示し、入力部109より「下移動」を受け取ると、カーソル1301を1つ下の項目に移動して表示する。
入力部109より「実行」を受け取ると、表示部108は、カーソル1301が示す項目を選択し、選択された項目に付加されている一つの伝言板識別情報を、分類パターン記憶部103に記憶されている分類パターン情報700から読み出し、読み出した1つの伝言板識別情報により識別される伝言板情報260をデータ記憶部101から読み出し、読み出した伝言板情報260を表示する。
表示部108が伝言板情報260を表示している状態で、表示部108が入力部109より、「下移動」を受け取ると、前記選択された項目に付加されている前記読み出した伝言板識別情報に続くまた別の一つの伝言板識別情報を、分類パターン記憶部103に記憶されている分類パターン情報700から読み出し、読み出した1つの伝言板識別情報により識別される伝言板情報260をデータ記憶部101から読み出し、読み出した伝言板情報260を表示する。
【0063】
表示部108が伝言板情報260を表示している状態で、表示部108が入力部109より「上移動」を受け取ると、前記選択された項目に付加されている前記読み出した伝言板識別情報の前のまた別の一つの伝言板識別情報を、分類パターン記憶部103に記憶されている分類パターン情報700から読み出し、読み出した1つの伝言板識別情報により識別される伝言板情報260をデータ記憶部101から読み出し、読み出した伝言板情報260を表示する。
図17に示す検索メニューが表示部108により表示されている状態で、表示部108が入力部109より「実行」を受け取ると、表示部108は、分類パターン情報に含まれる項目「関東」に付加されている1つの伝言板識別情報「(1)」を分類パターン記憶部103から読み出し、読み出した伝言板識別情報「(1)」により識別される伝言板情報201をデータ記憶部101から読み出し、読み出した伝言板情報201を表示する。図19には、伝言板情報201が表示部108に表示されている状態を表す。この状態で、ユーザーが上カーソルキー1401、下カーソルキー1402を押すと、他の伝言板情報が読み出されて表示される。
【0064】
1.1.9 入力部109
入力部109は、図18に示すように、上カーソルキー1401、下カーソルキー1402、実行キー1403、切替キー1404から構成され、ユーザーの入力を受け付ける。
表示部108により、検索メニューが表示されている状態で、上カーソルキー1401がユーザーにより押されると、入力部109は、「上移動」を表示部108へ出力する。表示部108により、検索メニューが表示されている状態で、下カーソルキー1402がユーザーにより押されると、入力部109は、「下移動」を表示部108へ出力する。
実行キー1403がユーザーにより押されると、入力部109は、「実行」を表示部108へ出力する。
切替キー1404がユーザーにより押されると、入力部109は、「切替」を第2分類パターン選択部110へ出力する。
なお、入力部109は4つの上カーソルキー1401、下カーソルキー1402、実行キー1403、切替キー1404から構成されるとしているが、一般のコンピュータのキーボードの任意のキーに前記4つのキーの機能を割り当てるようにしてもよい。
【0065】
1.1.10 第2分類パターン選択部110
第2分類パターン選択部110は、表示部108が図17に示すような検索メニューを表示する場合に、ユーザーがこの検索メニューによる分類が気に入らないときに、別の検索メニューを作成するために用いられる。
第2分類パターン選択部110は、入力部109から「切替」を受け取ると、分類パターン記憶部103に記憶されている分類パターン情報700から「○」の選択マーク704を検出し、検出した選択マーク704の「○」を使用済みを示す「●」に変更し、分類パターン情報700に書き込む。
図15に示す分類パターン情報1100において、現在選択されている分類パターン1120には、選択マークに、「○」1111が付けられている。第2分類パターン選択部110は、この選択マークの「○」1111を読み出し、読み出した選択マークを使用済みを示す「●」に変更し、再度、分類パターン情報1100に書き込む。図20に、選択マークに使用済みを示す「●」1601が付けられたときの分類パターン情報1600を示す。
【0066】
次に、第2分類パターン選択部110は、選択マークに使用済みを示す「●」がつけられていない分類パターンから、第1分類パターン選択部106と同じ方法で最適な分類パターンを選択する。図21を例にとると、第2分類パターン選択部110は、分類パターン名1611「値段2」により示される分類パターン1612を選択する。
第2分類パターン選択部110は、選択された前記分類パターンには選択されたことを示す選択マークに「○」を付ける。図21は、選択されたことを示す選択マークに「○」が付けられたときの分類パターン情報1620を示す。分類パターン1612に、選択されたことを示す選択マークとして、「○」1602が付けられている。
【0067】
第2分類パターン選択部110は、選択できる分類パターン即ち使用済マーク「●」がつけられていない分類パターンが残っている状態であれば、何度でも切替キー1404が押される毎に、次の分類パターンを選択することができる。図21に示す分類パターン情報1620の場合には、あと3回切り替えることが出来ることになる。
このようにして、第2分類パターン選択部110が分類パターンを選択すると、再びメニュー作成部107が、選択マークとして「○」をつけられた分類パターンを含む分類パターン情報を用いて、検索メニューを作成し、表示部108が検索メニューを表示する。
【0068】
1.2 検索メニュー作成装置100の動作
ここでは、検索メニュー作成装置100の動作について説明する。
1.2.1 検索メニュー作成の動作
ここでは、検索メニュー作成装置100が検索メニューを作成する動作について、図22に示すフローチャートを用いて説明する。
【0069】
データ特徴点抽出部102は、データ記憶部101に記憶されている伝言板情報260から特徴点を抽出し、抽出した特徴点を特徴点情報270としてデータ記憶部101に書き込む(ステップS1801)。対応付部105は、データ記憶部101に記憶されている特徴点情報270から特徴点識別情報271を取り出し(ステップS1802)、特徴点情報270に含まれる1つの特徴点272を取り出し(ステップS1803)、この取り出した1つの特徴点272と、分類パターン記憶部103に記憶された分類パターン情報に含まれる項目とを比較し(ステップS1804)、1つの特徴点272と前記項目とが一致すれば前記取り出した特徴点識別情報271を前記項目に付加して、対応づける(ステップS1805)。前記特徴点情報270に含まれる全ての特徴点に対して、特徴点の取り出しと、比較と、対応付けとを繰り返す(ステップS1804〜ステップS1806)。さらに、データ記憶部101に含まれる全ての特徴点情報に対して、特徴点識別情報の取り出しと、特徴点の取り出しと、比較と、対応付けとを繰り返す(ステップS1802〜ステップS1807)。全ての特徴点情報に対して、対応付けが終了すると、第1分類パターン選択部106は、各分類パターン毎に、伝言板識別情報が対応付けられた項目数を算出し(ステップS1808)、予め設定された最適な項目数に近い項目数を持つ分類パターンを最適な分類パターンとして選択する(ステップS1809)。ここで、最適な分類パターンが複数ある場合は、さらに、第1分類パターン選択部106は、優先度記憶部104を参照し、選択された分類パターンのうち優先度の最も高い分類パターンを1つ選択し、選択した分類パターンには選択したことを示す選択マーク「○」を付ける(ステップS1810)。次に、メニュー作成部107は、選択された分類パターンに含まれる項目を選択肢とする検索メニューを作成し(ステップS1811)、表示部108は、作成された検索メニューを表示する(ステップS1812)。
【0070】
1.2.2 切替キーが押された場合の動作
ここでは、検索メニュー作成装置100において切替キーが押され検索メニューを再度作成する場合の動作について、図23に示すフローチャートを用いて説明する。
なお、図23に示すフローチャートにおいて、ステップS1811、S1812については、図22に示すフローチャートで同じ符号が付されたステップと同じ動作であるので説明を省略する。
【0071】
切替キー1404がユーザーにより押されると、入力部109は、「切替」を第2分類パターン選択部110へ出力して、検索メニュー画面の切り替えを指示し(ステップS1901)、第2分類パターン選択部110は、現在選択されている分類パターンに使用済みを示す選択マーク「●」を付ける(ステップS1902)。次に、第2分類パターン選択部1903は、使用済みを示す選択マーク「●」の付いていない未使用の分類パターンの中から、予め設定された最適な項目数に近い項目数を持つ分類パターンを最適な分類パターンとして選択する(ステップS1903)。ここで、最適な分類パターンが複数ある場合は、さらに、第2分類パターン選択部110は、優先度記憶部104を参照し、選択された分類パターンのうち優先度の最も高い分類パターンを1つ選択し、選択した分類パターンには選択したことを示す選択マーク「○」を付ける(ステップS1904)。続けて、メニュー作成部107は選択マーク「○」の付加された分類パターンを用いて検索メニューを作成し、表示部108は検索メニューを表示する(ステップS1811〜S1812)。
【0072】
2.実施の形態2
以下に本発明に係る別の一つの実施の形態としての検索メニュー作成装置2100について、図面を参照しながら説明する。
2.1 検索メニュー作成装置2100の構成
検索メニュー作成装置2100の構成を示すブロック図を図24に示す。
検索メニュー作成装置2100は、データ記憶部2101、重要語抽出部2102、重要語記憶部2103、分類パターン記憶部2104、対応付部2105、分類パターン選択部2106、メニュー作成部2107、表示部2108、入力部2109から構成されている。
【0073】
2.1.1 データ記憶部2101
データ記憶部2101は、磁気ディスク装置などによって構成されている。データ記憶部2101は、ネットワークなどを経由して送られてくる文書データに識別番号を付加し、識別番号の付加された文書データを記憶する。識別番号は、文書データを特定するための番号である。識別番号は、文書データを受信する順に振られる。
図25に示すように、データ記憶部2101には、文書データ2201、2202、・・・が記憶されている。文書データ2201、2202、・・・は、ネットワークを通して得られた新聞記事である。また、文書データ2201、2202、・・・には、それぞれ文書データを識別するための識別番号「1」2211、識別番号「2」2212、・・・が付加されている。
【0074】
2.1.2 重要語抽出部2102
重要語抽出部2102は、データ記憶部2101に記憶されている文書データを読み出し、読み出した文書データに対して形態素解析を行って、文書データを少なくとも1つの形態素に分解する。
文書データが日本語で記載されている場合には、重要語抽出部2102は、分解された少なくとも1つの形態素から少なくとも1つの自立語(英語では、full word又はcontent wordに相当する。)を抽出する。また、文書データが英語で記載されている場合には、重要語抽出部2102は、不要語リスト(英語では、stop words)を有し、不要語リストに重要語にしない単語を登録しておく。具体的には、前置詞、be動詞などを登録しておく。次に、分解された形態素から不要語リストに登録されている形態素を除外する。
【0075】
次に、重要語抽出部2102は、前記抽出された少なくとも1つの自立語の中で、同じ自立語が出現する回数を計数し、最も多い回数が計数された自立語から順に所定数の自立語を抽出し、抽出した所定数の自立語を、特徴点の1例としての重要語とする。
また、重要語抽出部2102は、データ記憶部2101に記憶されている文書データに付加されている識別番号を読み出す。
さらに、重要語抽出部2102は、前記読み出した識別番号と重要語とした所定数の自立語を重要語記憶部2103へ出力する。
【0076】
重要語抽出部2102は、データ記憶部2101に記憶されている全ての文書データについて、上記に示すように、重要語の抽出と識別番号の読み出しとを行い、前記読み出した識別番号と重要語とした所定数の自立語を重要語記憶部2103へ出力する。
ここで自立語とは、大部分の名詞、形容詞、動詞、副詞のようにもっぱら実質的な意味をになうものであり、概念やイメージを伝える語である。
以下に、図25に示す文書データ2201を例として、重要語抽出部2102の動作を説明する。
【0077】
重要語抽出部2102は、データ記憶部2101に記憶されている文書データ2201に対して形態素解析を行い、文書データ2201を分解して、図26に示すように、複数の単語を得る。図中、「/」が単語の区切りを表している。次に、重要語抽出部2102は、図26に示す複数の単語から、複数の自立語を重要語候補として抽出し、前記抽出した複数の自立語の中で、同じ自立語が出現する回数を計数する。図27には、抽出された自立語である10個の単語とそれらの単語の出現回数とを示す。ここで、重要語抽出部2102は、重要語候補として抽出された自立語である10個の単語から、高い出現回数を持つ自立語を5つだけ抽出し、重要語とする。こうして、「晴れ」、「天気」、「大阪」、「京都」、「神戸」の5単語が重要語として抽出される。
なお、本実施の形態においては、重要語抽出部2102は文書データ中の単語の出現回数のみを利用して重要語を抽出しているが、これだけに限定されるものではない。
【0078】
重要語抽出部2102は、単語の出現位置により重要語を決定するようにしてもよい。例えば、文書データ中のタイトルや本文の最初の方に出現している単語を重要な単語とみなすようにしてもよい。
また、重要語抽出部2102は、単語の役割により重要語を決定するようにしてもよい。例えば、文書データに対して形態素解析を行って、形態素を抽出し、抽出された形態素に対して構文解析を行って文書データの文章構造を明らかにし、これによりある単語が文章構造の中で主語であると判定し、前記単語が主語である場合に重要語とみなすようにしてもよい。
【0079】
さらに、重要語抽出部2102は、ある単語の一般的な文書データにおける出現回数と、検索の対象とする文書データ中の前記単語の出現回数とを比較して、前記単語の重要語とするようにしてもよい。具体的には、重要語抽出部2102は、一般的な文書データにおける出現回数が少ない単語が、検索の対象とする文書データ中に多く出現する場合には、前記単語を重要語とみなすようにしてもよい。
また、本実施の形態では重要語の個数は5としているが、4、3、6、7など、他の数でも実施可能である。また、固定数でなく、所定の出現回数以上のすべての自立語を抽出し、抽出された自立語を重要語とするようにしてもよい。
【0080】
2.1.3 重要語記憶部2103
重要語記憶部2103は、文書データ毎に重要語抽出部2102から識別番号と所定数の重要語とを受け取り、受け取った識別番号と所定数の重要語とを重要語情報2530として記憶する。重要語記憶部2103は、データ記憶部2101に記憶されている文書データの数と同じ数の識別番号と所定数の重要語とを受け取るので、重要語記憶部2103は、データ記憶部2101に記憶されている文書データの数と同じ数の重要語情報2530を記憶する。重要語記憶部2103は、具体的にはメモリーなどによって構成される。
図28に、重要語情報2530の構成を示す。重要語情報2530は、重要語識別情報2531と、所定数の重要語2532とから構成される。重要語識別情報2531は、前記受け取った識別番号であり、所定数の重要語2532は、前記受け取った所定数の重要語である。
ここで、所定数は、重要語抽出部2102が、同じ自立語が出現する回数を計数し、最も多い回数が計数された自立語から順に所定数の自立語を抽出する際に、抽出された自立語の数である。
【0081】
図29に、重要語記憶部2103が記憶している重要語情報2530の一例を示す。この図に示すように、重要語記憶部2103は、重要語情報2506、2516、・・・を記憶しており、重要語情報2506は、重要語識別情報2521と重要語2501〜2505とを含み、重要語情報2516は、重要語識別情報2522と重要語2511〜2515とを含む。
ここで、重要語2501〜2505は、それぞれ文書データ2201から抽出された重要語であり、重要語2511〜2515は、それぞれ文書データ2202から抽出された重要語である。また、重要語識別情報2521は、文書データ2201の識別番号2211と同じ内容であり、重要語識別情報2522は、文書データ2202の識別番号2212と同じ内容である。従って、重要語情報2506は、文書データ2201に対応し、重要語情報2516は、文書データ2202に対応している。
【0082】
2.1.4 分類パターン記憶部2104
分類パターン記憶部2104は、文書データをキーワードで分類する分類パターン情報2700を記憶する。分類パターン記憶部2104は、具体的には磁気ディスク装置などによって構成される。
分類パターン情報2700は、図30に示すように、少なくとも1つの分類パターン2701から構成される。
分類パターン2701は、選択マーク2711、分類パターン番号2712、分類視点名2713、文書データ対応数2714、少なくとも1つの分類項目2715から構成され、分類項目2715は、分類項目名2721、文書データ数2722、文書データ識別番号2723、少なくとも1つのキーワード2724から構成される。
【0083】
選択マーク2711については、選択マーク704と同じであり、説明は省略する。
分類パターン番号2712は、分類パターン2701を識別するための番号である。
分類視点名2713は、分類パターン2701を代表する名称である。
文書データ対応数2714は、分類パターン2701に含まれるすべての文書データ識別番号2723により識別される文書データの種類の数である。
分類項目名2721は、分類項目2715を代表する名称である。
文書データ数2722は、分類項目2715に含まれる文書データ識別番号の数である。
文書データ識別番号2723は、データ記憶部2101に記憶されている文書データを識別するための識別番号である。
キーワード2724は、分類項目と文書データとの対応付けに用いられる。
【0084】
図31には、分類パターン記憶部2104に記憶される分類パターン情報2700の一例としての分類パターン情報2600を示す。この図に示すように、分類パターン記憶部2104には、分類パターン情報2600が記憶されており、分類パターン情報2600は、分類パターン2601と分類パターン2602と分類パターン2603、・・・とから構成されている。
分類パターン2601において、「日本の8地方」2611は分類視点である。また「1」2612は、分類パターンを識別するための分類パターン番号である。分類パターン2601には、分類項目2631、2632、2633、2634、2635、2636、2637、2638が含まれる。
分類項目2631において、「北海道」2621は、分類項目名であり、「北海道」2641、「札幌」2642、「旭川」2643、「函館」2644、「釧路」2645、「小樽」2646、「苫小牧」2647は、キーワードである。
分類項目2632にも、同様に、分類項目名と複数のキーワードが含まれる。分類項目2633、2634、2635、2636、2637、2638についても同様である。
【0085】
2.1.5 対応付部2105
(1)重要語と、分類パターンと分類項目との組との対応づけ
対応付部2105は、重要語記憶部2103に記憶されている重要語情報2506から重要語「晴れ」2501を読み出す。
次に、対応付部2105は、分類パターン記憶部2104に記憶されている分類パターン情報2600内の分類パターン2601に含まれる分類項目2631を構成するキーワード「北海道」2641を読み出し、前記読み出した重要語「晴れ」2501とキーワード「北海道」2641を比較する。キーワード「北海道」2641と重要語「晴れ」2501とは一致しないので、次に、対応付部2105は、分類項目2631を構成するキーワード「札幌」2642を読み出し、重要語「晴れ」2501とキーワード「札幌」2642とを比較する。以下同様に、重要語「晴れ」2501に一致するキーワードが見つかるまで、分類項目2631を構成するキーワードを順次読み出し、読み出したキーワードと重要語「晴れ」2501とを比較する。
【0086】
分類項目2631を構成する複数のキーワードは、どれも重要語「晴れ」2501と一致しない。次に対応付部2105は、分類項目2632を構成する複数のキーワードに対して、重要語「晴れ」2501と一致するキーワードが見つかるまで、順次キーワードの読み出しと、重要語「晴れ」2501との比較を行う。
分類項目2632を構成する複数のキーワードは、どれも重要語「晴れ」2501と一致しないので、対応付部2105は、重要語「晴れ」2501と一致するキーワードが見つかるまで、分類項目2633〜2638について、それぞれの分類項目を構成する複数のキーワードに対して、順次キーワードの読み出しと、重要語「晴れ」2501との比較を行う。
【0087】
対応付部2105は、重要語「晴れ」2501と一致するキーワードを分類パターン2601内に見つけることができなかった。次に、分類パターン2602、2603、・・・に対して同様に、キーワードの読み出しと、重要語「晴れ」2501との比較を行う。この結果、対応付部2105は、重要語「晴れ」2501と一致するキーワードを分類パターン情報2600内に見つけることができなかったので、次に、対応付部2105は、重要語記憶部2103に記憶されている重要語情報2506から重要語「天気」2502を読み出し、読み出した重要語「天気」2502と一致するキーワードを分類パターン情報2600内から検索する。この結果、対応付部2105は、図31には図示していない分類パターン番号(14)で示される分類パターン内の6番めの分類項目に含まれるキーワードの中に、重要語「天気」2502とが一致するキーワードを検出した。従って、対応付部2105は、重要語「天気」2502と、分類パターン番号(14)と6番目の分類項目との組とを対応づけて記憶する。
【0088】
同様にして、対応付部2105は、重要語記憶部2103に記憶されている重要語情報2506に含まれる重要語「大阪」2503、「京都」2504、「神戸」2505を順次読み出し、読み出した重要語「大阪」2503、「京都」2504、「神戸」2505に一致するキーワードを分類パターン情報2600に含まれるキーワードから検索し、一致するキーワードが見つかった場合には、重要語と、分類パターン番号と、分類項目とを対応づけて記憶する。
このようにして、重要語記憶部2103に記憶されている1つの重要語情報に含まれる全ての重要語と、分類パターン情報2600に含まれる全てのキーワードとの対応付けが、終了すると、図32に示すように、対応付部2105は、重要語「天気」2802については、分類パターン番号(14)2821と分類項目(6)2822とを対応付けて記憶し、重要語「大阪」2803については、分類パターン番号(1)2831と分類項目(5)2832と及び分類パターン番号(12)2833と分類項目(2)2834とを対応付けて記憶し、重要語「京都」2804については、分類パターン番号(1)2841と分類項目(5)2842とを対応付けて記憶し、重要語「神戸」2805については、分類パターン番号(1)2851と分類項目(5)2852とを対応付けて記憶する。なお、重要語「晴れ」2801について、対応付けは発生していない。
【0089】
(2)組の重複削除
図32に示すように、分類パターン番号(1)と分類項目名を識別する番号(5)とが対応付けられた組は、3回出てきているので、対応付部2105は、これらの組の重複を削除し、図33に示すように、分類パターン番号(14)と分類項目名を識別する番号(6)との対応付け2861と、分類パターン番号(1)と分類項目名を識別する番号(5)との対応付け2862と、分類パターン番号(12)と分類項目名を識別する番号(2)との対応付け2863とを記憶する。
【0090】
(3)文書識別番号の対応付け
図33に示す分類パターン番号と分類項目名を識別する番号との対応付けは、文書データ2201から抽出された重要語を用いて行われているので、対応付部2105は、組2862については、図34に示すように、分類パターン2601内の分類項目2635と文書データと2201の識別番号「(1)」とを対応付けるために、分類項目2635に識別番号「(1)」2901を付加する。
【0091】
(4)文書データ数の書き込み
対応付部2105は、各分類項目毎に、対応付けられた文書データの識別番号の数を算出し、各分類項目毎に分類パターンの分類項目内に書き込む。
また、対応付部2105は、各分類パターン毎に、分類パターン内に対応付けられた文書データの種類の数を算出し、算出された文書データの種類の数を分類パターン毎に文書データ対応数として分類パターン内に記憶する。ここで、重複して対応付けられている文書データは、1個とみなして算出する。
以上に説明したようにして、対応付けが終了したあとの分類パターン2601を図35に示す。なお、この図において、分類項目名に対応するキーワードの記載は省略している。
この図において、符号3113〜3118は対応付けられた文書データの識別番号であり、符号3102〜3109は、各分類項目に対応付けられた文書データ数であり、符号3101は、文書データ対応数である。文書データの識別番号(3)は3つの分類項目に対応づけられているので、分類項目に対応づけられている文書データ数の和は14であるが、重複する文書データを除くと、分類パターンに対応付けられている文書データの種類の数は12であり、文書データ対応数は12となる。
【0092】
2.1.6 分類パターン選択部2106
分類パターン選択部2106は、分類パターン情報に記憶されている文書データの対応付け結果を用いて、分類パターンを選択するため、図36(a)に示す評価式(式1)により分類パターンの評価を行う。
(式1)において、Pは分類パターンの評価値であり、(式1)の第1項のnは分類パターンに対応付けられた文書データ数である。(式1)の第2項のmは文書データが対応付けられた分類項目名数である。関数f(x)は図36(b)に示すように分類項目数を引数とする関数であり、x=5の時、最大値1をとり、x=0の時、最小値0をとり、x=10の時、最小値0をとる。(式1)の第3項のσの2乗は対応付けられた文書データの数の分散である。α、β、γは定数である。
【0093】
(式1)の第1項は、分類パターンに対応付けられた文書データ数が多いほど分類パターンの評価値が高くなることを示している。第2項は、分類パターン中の文書データが対応付けられた分類項目数が5に近いほど分類パターンの評価値が高くなることを示している。第3項は、分類パターンに対応付けられた文書データの数の分散が小さいほど分類パターンの評価値が高くなることを示している。
図35に示す分類パターン2601に対して、評価式(式1)を適用して、分類パターンの評価値を算出する。ここで、定数α、β、γはそれぞれ1とする。文書データ対応数は、12であるので、評価式(式1)の第1項の値は12となる。
分類パターン2601の分類項目のうち、文書データが対応付けられている分類項目は6個であるので、図36(a)に示す関数f(x)を用いると、評価式(式1)の第2項は0.8となる。
次に、評価式(式1)の第3項について、文書データが対応付けされている分類項目のみを対象として、まず、対応する文書データ数の平均として、(1+2+3+5+2+1)/6=2.33を得る。次に対応する文書データ数の分散として、σ2 =(1−2.33)2+(2−2.33)2+(3−2.33)2+(5−2.33)2+(2−2.33)2+(1−2.33)2=11.33を得る。こうして第3項は1/(1+11.33)=0.08となる。
従って、分類パターン2601の評価値は12+0.8+0.08=12.88となる。
なお、ここで便宜上、定数α、β、γの値はそれぞれ1としたが、これら定数は各項のバランスを取るための定数であり、適当な値を設定することができる。
【0094】
このように、評価式(式1)の第1項によると、多くの入力データが対応付けられた分類パターンから優先的に検索メニューの選択肢を作成でき、有効な検索メニューが作成できるという効果がある。評価式(式1)の第2項によると、入力データに対応付けられた項目の数が適切な分類パターンから優先的にメニューの選択肢を作成でき、有効な検索メニューが作成できるという効果がある。評価式(式1)の第3項によると、各項目に対応付けられた入力データの数ができるだけ均等な分類パターンから優先的にメニューの選択肢を作成でき、有効な検索メニューが作成できるという効果がある。
分類パターン選択部2106は、上記に示すように、全ての分類パターンについて、分類パターン毎に、分類パターンの評価値を算出し、最大の評価値を持つ分類パターンを最適な分類パターンとして選択する。
分類パターン選択部2106は、最適な分類パターンとして選択された分類パターンに、選択マーク「○」を付加する。
【0095】
2.1.7 メニュー作成部2107
メニュー作成部2107は、分類パターン記憶部2104から分類パターン選択部2106により選択マーク「○」が付加された分類パターンを抽出し、さらに抽出された分類パターンから、分類視点名と文書データ識別番号が付加されている分類項目とを抽出し、抽出された分類項目に含まれる分類項目名と抽出された分類項目に対応付けられた文書データ数との少なくとも1つの組を抽出し、分類視点名と抽出した少なくとも1つの組とを表示部2108へ出力する。図35に示す分類パターン2601が選択されたとすると、メニュー作成部2107は、図37(a)に示すように、分類視点名と分類項目名及び文書データ数の組とを作成する。
【0096】
2.1.8 表示部2108
表示部2108は、メニュー作成部2107から、分類視点名と分類項目名及び文書データ数の少なくとも1つの組とを受け取る。受け取った分類視点名と、前記受け取った分類項目名、前記受け取った文書データ数に比例した長さの棒グラフ及び前記受け取った文書データ数の少なくとも1つの組とを検索メニューとして表示する。また、表示部2108は、分類項目を選択するためのカーソルを表示する。
図37(b)には、表示部2108により作成された検索メニューを表示している一例を示す。この図において、入力データを選択するためのカーソル3201が表示されている。
【0097】
表示部2108は、入力部2109より、「上移動」を受け取ると、カーソル3201を1つ上の分類項目に移動して表示し、入力部2109より、「下移動」を受け取ると、カーソル3201を1つ下の分類項目に移動して表示する。
表示部2108は、入力部2109から「選択」を受け取ると、表示部2108は、カーソル3201が示す分類項目名で示される分類項目に含まれる文書データ識別番号を読み出し、読み出した文書識別番号により識別される文書データをデータ記憶部2101より読み出し、読み出した文書データを表示する。
表示部2108は、図37(b)に示す検索メニューを表示している状態で、入力部2109から「選択」を受け取ると、分類項目名「近畿」で示される分類項目に含まれる文書データ識別番号(1)を読み出し、読み出した文書識別番号(1)により識別される文書データ2201をデータ記憶部2101から読み出して、表示する。
なお、表示部2108は、前記受け取った分類項目名と、前記受け取った文書データ数との少なくとも1つの組を検索メニューとして表示するようにしてもよい。
【0098】
2.1.9 入力部2109
入力部2109は、ユーザーの入力を受け付ける。図38に示すように、入力部2109は、上カーソルキー3301、下カーソルキー3302、選択キー3303とを含む。
上カーソルキー3301がユーザーにより操作されると、「上移動」を表示部2108へ出力し、下カーソルキー3302がユーザーにより操作されると、「下移動」を表示部2108出力する。
選択キー3303がユーザーにより操作されると、入力部2109は、「選択」を表示部2108へ出力する。
【0099】
2.2 検索メニュー作成装置2100の検索メニュー作成の動作
ここでは、図24に示す検索メニュー作成装置2100が検索メニューを作成する動作について、図39に示すフローチャートを参照しながら説明する。
重要語抽出部2102は、データ記憶部2101に記憶された文書データから、文書データ毎に重要語を抽出し、重要語記憶部2103は抽出された重要語を重要語情報として記憶する。(ステップS3401)。対応付部2105は、重要語記憶部2103から1つの重要語情報に付加された重要語識別情報を取り出し(ステップS3402)、前記取り出した重要語識別情報により特定される重要語情報の中から1つの重要語を取り出し(ステップS3403)、この取り出した重要語と、分類パターン記憶部2104に記憶された分類パターンに含まれるキーワードとを比較し(ステップS3404)、一致すればその分類パターンとキーワードに対応する分類項目を取り出す(ステップS3405)。対応付部2105は、前記取り出した重要語識別情報により特定される重要語情報から抽出された全ての重要語に対して、上記比較と取り出しとを繰り返す(ステップS3404〜S3406)。対応付部2105は、抽出された分類パターンと分類項目との組で重複するものを削除し、重要語識別情報を前記抽出された分類パターンに含まれる分類項目に書き込むことにより、分類パターンに含まれる分類項目と、文書データとを対応付ける(ステップS3407)。さらに、対応付部2105は、全ての文書データに対して、上記比較と対応付けを繰り返す(ステップS3402〜S3408)。全ての文書データに対して、対応付けが終了すると、分類パターン選択部2106は、各分類パターンの評価値を(式1)を用いて計算し(ステップS3409)、最大の評価値の分類パターンを選択する(ステップS3410)。次に、メニュー作成部2107は、選択された分類パターンの分類項目を選択肢とする検索メニューを作成し(ステップS3411)、表示部2108は、作成された検索メニューを表示する(ステップS3412)。
【0100】
3.その他の実施の形態
なお、本発明を上記実施の形態に基づいて説明してきたが、本発明は上記実施の形態に限定されないのはもちろんである。すなわち、以下のような場合も本発明に含まれる。
【0101】
(1) 本実施の形態では、ユーザーにより検索メニューの選択肢が選択された後に、ユーザーにより選択された検索メニューの選択肢に対応する項目に対応づけられた入力データを順次表示するとしているが、選択肢に対応する項目に対応づけられた入力データが非常に多い場合は、選択された選択肢に対応する項目に対応付けられた入力データを基にして、さらに検索メニューを作成するとしてもよい。例えば、図17に示す検索メニューにおいて、ユーザーにより選択肢「関東」が選択されたとすると、図15に示すように、選択肢「関東」に対応する項目「関東」には、さらに複数の小項目「栃木」、「茨城」、「千葉」、「群馬」、「埼玉」、「東京」、「山梨」、「神奈川」が含まれており、メニュー作成部107部は、これら複数の小項目「栃木」、「茨城」、「千葉」、「群馬」、「埼玉」、「東京」、「山梨」、「神奈川」から、伝言板識別情報が付加されている小項目として、「千葉」、「群馬」、「埼玉」、「東京」、「神奈川」の5つの小項目を抽出し、抽出された5つの小項目とこれらの小項目に含まれる伝言板識別情報の数とを表示部108へ出力し、表示部108は、図40に示すように、抽出された5つの小項目とこれらの小項目に含まれる伝言板識別情報の数と、カーソル1301とを表示する。ユーザーによりこの図に表示される検索メニューから一つの小項目が選択されると、表示部108は、選択された小項目に含まれる伝言板情報を順次表示するようにしてもよい。
【0102】
(2) ユーザーにより検索メニューから1つの選択肢が選択された後に、ユーザーにより選択された1つの選択肢に対応する項目に含まれる入力データを、再度選択されていない分類パターンに対応付け、新たに入力データが対応付けられた前記分類パターンを用いて、検索メニューを作成するにようにしてもよい。
例えば、最初の検索メニューで、階層構造の地名の検索メニューを表示し、ユーザーにより1つの地名の選択肢の選択を受け、選択された地名の選択肢に対応付けられた項目に含まれる入力データのみを、再度、選択マークが付加されていない他の分類パターンに対応付け、これらの入力データの対応付けられた分類パターンから、上記の実施の形態で説明した同様の方法により、一つの分類パターンを選択し、選択された分類パターン用いて、また別の検索メニューを作成し、表示するようにしてもよい。このようにすると大量の入力データが存在する場合においても、検索効率のよい検索メニューを作成することができる。
【0103】
(3) 分類パターン毎に対応付けられている入力データの数に応じて、入力データを表示するか、再度次の検索メニューを作成するかを判定するとしてもよい。
例えば、分類パターン毎に対応付けられている入力データの数が、所定の値以下であれば、入力データを表示し、所定の値よりも大きければ、再度次の検索メニューを作成するようにしてもよい。このようにすることにより、一つの検索メニューに表示される選択肢の数を所定の値に近く設定することができ、より検索効率のよい検索メニューを作成することができる。
【0104】
具体的には、上記実施の形態の検索メニュー作成装置において、入力部109は、ユーザーより、前記表示された検索メニューから1つの選択肢の選択を受け付け、メニュー作成部107は、さらに、入力部109が前記ユーザーの選択を受け付けた場合に、所定の基準に基づいて、前記選択を受け付けられた選択肢に対応する前記項目に含まれる小項目を選択肢とする検索メニューを作成するか、又は、前記項目に対応付けられた入力データを表示するかを判定し、検索メニューを作成すると判定された場合に、前記選択を受け付けられた選択肢に対応する前記項目から、少なくとも1つの入力データが対応付けられた少なくとも1つの小項目を抽出し、抽出した前記小項目を選択肢とする検索メニューを生成する。表示部108は、さらに、メニュー作成部107により検索メニューを作成すると判定された場合に、前記小項目を選択肢として生成された検索メニューを表示し、入力データを表示すると判定された場合に、前記項目に対応付けられた入力データをデータ記憶部101より読み出し、読み出した入力データを表示するようにしてもよい。
【0105】
ここで、所定の基準とは、選択された分類パターンに対応付けられている入力データの数が、所定の値以下であれば、入力データを表示し、所定の値よりも大きければ、検索メニューを生成する判定基準である。
【0106】
また、前記の再度次の検索メニューを作成する際に、上記(2)で説明したように、ユーザーにより検索メニューから1つの選択肢が選択された後に、ユーザーにより選択された1つの選択肢に対応する項目に含まれる入力データを、再度使用済みを示す選択マークが付いていない分類パターンに対応付け、新たに入力データが対応付けられた前記分類パターンを用いて、検索メニューを作成するにようにしてもよい。
【0107】
また、入力部109は、ユーザーより、表示された検索メニューから1つの選択肢の選択を受け付け、対応付部105は、さらに、前記選択を受け付けられた選択肢に対応する項目に対応付けられた入力データを選択データとして抽出し、前記入力データと前記項目との全ての前記対応付けを取り消し、前記選択を受け付けられた選択肢に対応する項目を含む分類パターンを除く他の分類パターンを構成する各項目と、前記抽出された選択データとを対応付け、第1分類パターン選択部106は、前記選択を受け付けられた選択肢に対応する項目を含む分類パターンを除く他の分類パターンから、前記所定の基準に基づいて、少なくとも1つの分類パターンを選択し、メニュー作成部107は、前記少なくとも1つの分類パターンを基にして、検索メニューを生成し、表示部108は、前記生成された検索メニューを表示するようにしてもよい。例えば、検索メニューに表示された選択肢「関東」をユーザーが選んだあと、「関東」に対応づけられた入力データを、再度、地名以外の分類パターンに対応づけ、地名以外の分類パターンから上記実施の形態と同様にして、一つの分類パターン「値段2」を選択し、分類パターン「値段2」に含まれる項目を選択肢とする検索メニューを生成し、表示するようにできる。
【0108】
(4) 上記第1の実施の形態において、分類パターンは複数の階層からなる項目を含むとしてもよい。例えば、前記小項目にはさらに詳細項目が従属し、前記詳細項目にはさらに詳細項目が従属するとしてもよい。対応付部105は、入力データと複数の階層からなる項目とを対応付け、第1分類パターン選択部106は、入力データに対応づけらた複数の階層からなる項目を用いて、分類パターンを選択し、メニュー作成部107は、選択された分類パターンを用いて、検索メニューを作成するとしてもよい。
【0109】
また、メニュー作成部107は、選択された分類パターンに含まれる項目を選択肢とする検索メニューを作成し、ユーザーにより、1つの選択肢が選ばれ、次に、メニュー作成部107は、前記選ばれた選択肢に対応する項目に従属する小項目を選択肢とする検索メニューを作成し、ユーザーにより、1つの選択肢が選ばれ、さらに、メニュー作成部107は、前記選ばれた選択肢に対応する小項目に従属する詳細項目を選択肢とする検索メニューを作成する。このように、複数の階層からなる項目を基にして、複数の階層からなる検索メニューを作成するとしてもよい。
【0110】
また、上記(3)で説明したように、分類パターン毎に対応付けられている入力データの数に応じて、入力データを表示するか、再度次の検索メニューを作成するかを判定する場合、再度次の検索メニューを作成すると判定されたときに、上記に説明したように複数の階層からなる検索メニューを作成するとし、入力データを表示すると判定されたときに、選択された選択肢に対応する項目及びこの項目に従属するすべての項目に対応付けられた入力データを順次表示するとしていもよい。
【0111】
また、分類パターンに含まれる項目は、上記に説明したように階層構造を形成し、対応付部105は、抽出された前記特徴点毎に、前記特徴点に対応する前記項目を前記分類パターン記憶部103段より検索し、前記検索された項目と、前記特徴点を含む前記入力データとを対応付け、入力部109は、ユーザーより、表示された検索メニューから1つの選択肢の選択を受け付ける。検索メニュー作成装置は、さらに、判定部と、項目メニュー生成部と、入力データメニュー表示と、繰返制御部とを有し、前記判定部は、前記入力部109が前記ユーザーの選択を受け付けた場合に、所定の基準に基づいて、検索メニューを作成するか、又は、入力データを表示するかを判定し、前記項目メニュー生成部は、前記判定部により検索メニューを作成すると判定された場合に、前記選択を受け付けられた選択肢に対応する前記項目に従属する項目から、入力データが対応付けられた項目を抽出し、抽出した前記項目を選択肢とする検索メニューを生成し、前記入力データメニュー部は、前記判定部段により検索メニューを作成すると判定された場合に、前記生成された検索メニューを表示し、入力データを表示すると判定された場合に、前記選択を受け付けられた選択肢に対応する項目及びこの項目に従属するすべての項目に対応付けられた入力データをデータ記憶部101より読み出し、読み出した入力データを表示し、前記繰返制御部は、前記入力データメニュー表示部により前記読み出した入力データが表示されるまで、入力部109による1つの選択肢の選択の受け付けと、前記判定部による判定と、前記項目メニュー生成部による検索メニューの生成と、前記入力データメニュー表示部による検索メニューの表示とを繰り返すよう、入力部109、前記判定部、前記項目メニュー生成部、前記入力データメニュー表示部を制御するとしてもよい。
【0112】
また、前記判定部における所定の基準とは、前記選択を受け付けられた選択肢に対応する項目と当該項目に従属するすべての項目とに対応付けられている入力データの数が、所定の値以下であれば、入力データを表示し、所定の値よりも大きければ、検索メニューを生成する判定基準であるとしてもよい。
【0113】
(5) さらに、分類パターン編集部を設け、利用者が分類パターン記憶部103に分類パターンを新たに登録したり、分類パターン記憶部103に記憶されている分類パターンを削除したりすることができるようにしてもよい。
分類パターンの登録を行うためには、入力部109は、ユーザーによる分類パターンの入力を受け付け、表示部108は、入力を受け付けられた分類パターンを表示する。次に、入力部109は、ユーザーによる分類パターンの登録の指示を受け付け、分類パターン編集部は入力を受け付けられた分類パターンを分類パターン記憶部103に登録する。
分類パターンの削除を行うためには、表示部108は、分類パターン記憶部103に記憶されている分類パターンを表示し、入力部109は、ユーザーにより削除すべき分類パターンの指定を受け付ける。次に、入力部109は、ユーザーによる分類パターンの削除の指示を受け付け、分類パターン編集部はユーザーにより指定された分類パターンを分類パターン記憶部103から削除する。
ここで、分類パターンの登録、削除の操作をまとめて編集と呼ぶ。
これにより新しい分類基準ができた場合や、新しい専門用語ができた場合などに容易に分類パターンを登録することができ、また使用されなくなった、古い分類パターンを容易に削除することができるので、ユーザーが自分の好みの分類パターンのみを登録することが可能である。
【0114】
(6) さらに、語句とその類語からなる類語辞典部を設け、対応付部105が、入力データの特徴点と分類パターンの項目を対応付ける時に、前記特徴点を用いて前記類語辞典部から特徴点の類語を検出し、この検出された特徴点の類語と分類パターンの項目を対応付けるとしてもよい。
こうして、入力データの特徴点と分類パターンの項目とを類語を介して対応づけることにより、特徴点に類似する分類パターンの項目に、特徴点を対応づけることができ、入力データを分類パターンへ対応づけられない場合を減らすことができる。
【0115】
(7) さらに、ユーザーにより切替キー1404が押された場合、そのときに用いられていた分類パターンはユーザーの好みに合っていないと考えられるので、この分類パターンの優先度を下げて、優先度記憶部104に記憶するようにしてもよい。具体的には、切替キー1404が押されたとき、使用されていた分類パターンの優先度の値から1を引いた値を新しい優先度として、優先度記憶部104に記憶するようにしてもよい。
こうして、ユーザーの好みに応じて分類パターンの優先度を学習させることが出来る。
【0116】
(8) 本第1の実施の形態では、最適な分類パターンを決定する際、まず項目数で評価し、さらに優先度で評価するとしているが、これらの評価手順を逆にして、まず優先度で評価し、さらに項目数で評価するとしてもよい。またこれらの2つの評価を組合わせて評価基準を作成し、このように作成された評価基準を用いて最適な分類パターンを決定するようにしてもよい。
また、優先度のみを使用して最適な分類パターンを決定してもよい。
【0117】
(9) 本第1の実施の形態においては、データ特徴点抽出部102が伝言板情報から特徴点を抽出してデータ記憶部101へ書き込むとしているが、次のようにしてもよい。
データ記憶部101は、リレーショナルデータベースとして入力データを記憶している。前記リレーショナルデータベースは、表(table)を基本とする入力データの集まりであり、表は、少なくとも1つの行(row)と少なくとも1つの列(column)からなる。行は、少なくとも1つの値の並びから構成され、列は同じデータ型を有する少なくとも1つの値の集まりである。1つの列の1つの値は、表から選択したり、表を更新できる入力データの最小単位である。データ型には、文字列型、数値型などがあり、文字列型のデータ型を有する列は、文字列の集まりであり、数値型のデータ型を有する列は、数値の集まりである。
ここで、各行は、上記実施の形態の伝言板情報260に相当する。
対応付部105は、データ記憶部101に、リレーショナルデータベースの中に記憶されている1つの行を構成する少なくとも1つの値の並びから少なくとも1つの値を抽出し、抽出した少なくとも1つの値を特徴点とする。この場合、データ特徴点抽出部102は不要となる。
伝言板情報260を構成する購入譲渡区別262、住所263、情報提供者名264、年齢265、職業266は、上記のリレーショナルデータベースの列に相当する。
【0118】
(10)前記第1の実施の形態では、伝言板情報260を基にして、伝言板情報260と分類パターン701に含まれる項目711と対応づけるとしているが、分類パターン701に含まれる項目711を基にして、伝言板情報260と項目711と対応づけるようにしてもよい。
この場合、対応付部105は、分類パターン記憶部103から、各分類パターンに含まれる項目を順次読み出し、またデータ記憶部101から伝言板情報を順次読み出し、読み出された伝言板情報毎に、伝言板情報に含まれる少なくとも1つの特徴点を抽出し、読み出された前記項目と抽出された前記特徴点とが一致するか否かを判定し、読み出された前記項目と抽出された前記特徴点とが一致すると判定された場合に、前記読み出された項目と、前記項目に一致する前記特徴点を含む前記伝言板情報とを対応付ける。
【0119】
(11)前記第2の実施の形態では、3つの評価要素である分類パターンに対応付けられた文書データ数と、文書データが対応付けられた分類項目名数と、対応付けられた文書データの分散とを含む(式1)を用いて各分類パターンの評価値を算出し、評価値が一番高い分類パターンを選択するとしているが、分類パターンに対応付けられた文書データ数のみ、文書データが対応付けられた分類項目名数のみ又は対応付けられた文書データの分散のみを含む評価式を用いて、各分類パターンの評価値を算出し、評価値が一番高い分類パターンを選択するとしてもよい。また、これらの評価要素の2つを組み合わせた評価式を用いて、各分類パターンの評価値を算出し、分類パターンを選択するとしてもよい。
【0120】
(12)前記第1の実施の形態では、ユーザーは、検索メニューから1つの項目を選択するとしているが、ユーザーは、検索メニューから複数の項目を選択するとしてもよい。この場合、入力部109は、さらに複数指定キーを含み、表示部108により、検索メニューが表示されている状態で、前記複数指定キーがユーザーにより操作されると、表示部108は、カーソル1301により示される項目を、反転表示する。反転表示された項目は、この項目がユーザーにより選択されたことを示している。ユーザーがさらに、上カーソルキー1401又は下カーソルキー1402を用いて、カーソル1301を上又は下方向に移動させ、この検索メニューの他の項目にカーソル1301を位置付け、前記複数指定キーをユーザーが操作すると、表示部108は、カーソル1301により示される項目を、反転表示する。このようにして、複数の項目がユーザーにより、選択される。次に、実行キー1403がユーザーにより操作されると、表示部108は、前記選択された複数の項目に対応付けられている入力データをデータ記憶部101から読み出し、読み出した入力データを表示する。
また、上記のように、ユーザーにより複数の項目が選択された場合に、上記(1)、(2)において説明したように、前記選択された複数の項目に対応付けられている入力データを用いて、さらに検索メニューを作成し、表示するようにしてもよい。
また、前記第2の実施の形態においても、同様である。
【0121】
(13)前記第1の実施の形態では、第1分類パターン選択部106及び第2分類パターン選択部110は、1つの分類パターンを選択するとしているが、第1分類パターン選択部106又は第2分類パターン選択部110は、複数の分類パターンを選択するとしてもよい。例えば、第1分類パターン選択部106は、入力データが対応づけられた項目の数を算出し、適切な選択肢の数6に最も近い値が算出された複数の項目を選択するようにしてもよい。このように、第1分類パターン選択部106又は第2分類パターン選択部110が、複数の分類パターンを選択する場合に、メニュー作成部107は、選択された複数の分類パターンから、入力データが対応付けられている項目を抽出し、抽出された項目を選択肢とする検索メニューを作成する。
また、前記第2の実施の形態においても、同様である。
【0122】
(14) 実施の形態の1つとして、上記に説明した手順をコンピュータにより実行するプログラムを、フロッピーディスク等のコンピュータで読み取り可能な記録媒体に記録して移送することにより、又は、前記プログラムを通信回線を通して移送することにより、独立した他のコンピュータシステムで容易に実施するようにしてもよい。
【0123】
【発明の効果】
以上説明したように、本発明は、複数の入力データの検索に利用する選択肢を含む検索メニューを作成する検索メニュー作成装置であって、複数の入力データを記憶するための記憶領域を有するデータ記憶手段と、検索メニューの選択肢となりえる複数の項目から構成される分類パターンが予め複数個記憶された分類パターン記憶手段と、複数の入力データを受信する受信手段と、前記受信した複数の入力データを前記データ記憶手段に書き込む書込手段と、前記データ記憶手段に書き込まれた複数の入力データのそれぞれを、前記分類パターン記憶手段に予め記憶された複数の分類パターンのうちのいずれかに含まれる項目に対応付ける対応付手段と、前記分類パターン記憶手段に予め記憶された複数の分類パターンのそれぞれについて、前記分類パターンを構成する各項目に対応付けた入力データの数を計数し、前記計数した値から算出される入力データの分散値を基に、分類パターンを選択する分類パターン選択手段と、前記選択された分類パターンを構成する項目から、前記入力データに対応付けた項目を抽出し、抽出した前記項目を選択肢とした検索メニューを生成するメニュー抽出手段と、前記メニュー抽出手段により生成された検索メニューを表示する表示手段とを備える。
この構成によれば、検索のための選択肢となりえる複数の項目から構成される分類パターンを予め複数用意し、用意した複数の分類パターン中から各項目に対応付けられた入力データの数ができるだけ均等な分類パターンを優先して自動的に選択することが可能となり、この優先して自動的に選択した分類パターンに含まれる項目を選択肢として選択し検索メニューを生成できるので、書き込まれた複数の入力データの検索に最適な検索メニューを作成できるようになるという効果がある。
【0124】
らに、前記メニュー抽出手段により生成された検索メニューを表示する表示手段を備えるので、生成された検索メニューが表示され、ユーザーは、上記生成された検索メニューを見ることができる。
【0125】
らに、外部より複数の入力データを受信する受信手段と、前記受信した複数の入力データを前記データ記憶手段に書き込む書込手段とを備えるので、外部より受信した複数の入力データを基にして、検索メニューを生成することができるという効果がある。
【0126】
ここで、前記データ記憶手段は、各入力データを識別するデータ識別子を記憶しており、前記対応付手段は、前記データ記憶手段から入力データを順次読み出し、読み出された入力データ毎に、入力データに含まれる特徴点を抽出する特徴点抽出部と、抽出された前記特徴点毎に、前記特徴点に対応する項目を前記分類パターン記憶手段より検索する項目検索部と、前記検索された項目に、前記入力データを識別するデータ識別子を付加するデータ対応付部とを含むように構成してもよい。
この構成によれば、入力データから抽出された特徴点を用いて、入力データと分類パターンとを対応付けるので、入力データから抽出された特徴点に応じたメニューが作成できるという効果がある。
【0127】
ここで、前記データ記憶手段に記憶されている各入力データは、文書データであり、前記特徴点抽出部は、前記データ記憶手段から文書データを順次読み出すデータ読出要素と、読み出された文書データに対して形態素解析を施して、文書データ毎に形態素に分解する形態素解析要素と、前記分解された形態素から重要語を抽出し、抽出した重要語の一部又は全部を特徴点とする重要語抽出要素とを含むように構成してもよい。
この構成によれば、文書データに形態素解析を施し抽出された重要語を用いて、文書データと分類パターンとを対応付けるので、文書データのような定型化されていないデータから抽出された特徴点に応じたメニューが作成できるいう効果がある。
【0128】
ここで、前記重要語抽出要素は、前記分解された形態素から重要語候補を抽出する重要語候補抽出要素と、同一文書データにおいて、前記抽出された重要語候補と同じ重要語候補が出現する回数をカウントする出現回数カウント要素と、抽出された重要語候補から、前記カウントされた回数が所定の回数以上の重要語候補を重要語として抽出し、抽出された重要語を特徴点とする所定回数抽出要素とを含むように構成してもよい。
この構成によれば、文書データから、所定の回数以上含まれる重要語候補を重要語として抽出するので、文書データに応じた適切な特徴点が抽出できるという効果がある。
【0129】
ここで、前記重要語抽出要素は、前記分解された形態素から重要語候補を抽出する重要語候補抽出要素と、同一文書データにおいて、抽出された重要語候補と同じ重要語候補が出現する回数をカウントする出現回数カウント要素と、抽出された重要語候補のうち、前記カウントされた回数が多い重要語候補から順に所定数の重要語候補を重要語として抽出し、抽出された所定数の重要語を特徴点とする所定数抽出要素とを含むように構成してもよい。
この構成によれば、文書データから、含まれる回数が多い重要語候補から順に所定数の重要語候補を重要語として抽出するので、文書データに応じた適切な特徴点が抽出できるという効果がある。
【0130】
ここで、前記データ記憶手段は、リレーショナルデータベースとして前記複数の入力データを記憶し、各入力データはリレーショナルデータベースの行に相当し、少なくとも1つの値の並びから構成され、前記特徴点抽出部は、前記データ記憶手段から入力データを順次読み出すデータ読出要素と、前記読み出した入力データを構成する少なくとも1つの値を特徴点として抽出するデータ抽出要素とを含むように構成してもよい。
この構成によれば、リレーショナルデータベースに記憶されている各要素をそのまま特徴点とするので、入力データから適切な特徴点を素早く抽出できるという効果がある。
【0131】
ここで、前記分類パターン記憶手段に含まれる前記項目は、階層構造を形成し、前記対応付手段は、さらに、抽出された前記特徴点毎に、前記特徴点に対応する前記項目を前記分類パターン記憶手段より検索する階層項目検索部を含み、前記データ対応付部は、前記検索された項目と、前記特徴点を含む前記入力データとを対応付けるように構成してもよい。
この構成によれば、分類パターンを構成する項目は階層構造を形成しており、複数の階層からなる項目に対して入力データを対応付けることができるという効果がある。
【0132】
ここで、さらに、ユーザーより、表示された検索メニューから選択肢の選択を受け付ける入力受付手段と、前記入力受付手段が前記ユーザーの選択を受け付けた場合に、所定の基準に基づいて、検索メニューを作成するか、又は、入力データを表示するかを判定する判定手段と、前記判定手段により検索メニューを作成すると判定された場合に、前記選択を受け付けられた選択肢に対応する前記項目に従属する項目から、入力データが対応付けられた項目を抽出し、抽出した前記項目を選択肢とする検索メニューを生成する項目メニュー生成手段と、前記判定手段により検索メニューを作成すると判定された場合に、前記生成された検索メニューを表示し、入力データを表示すると判定された場合に、前記選択を受け付けられた選択肢に対応する項目及びこの項目に従属するすべての項目に対応付けられた入力データをデータ記憶手段より読み出し、読み出した入力データを表示する入力データメニュー表示手段と、前記入力データメニュー表示手段により前記読み出した入力データが表示されるまで、前記入力受付手段による1つの選択肢の選択の受け付けと、前記判定手段による判定と、前記項目メニュー生成手段による検索メニューの生成と、前記入力データメニュー表示手段による検索メニューの表示とを繰り返すよう、前記入力受付手段、前記判定手段、前記項目メニュー生成手段、前記入力データメニュー表示手段を制御する繰返制御手段とを備えるように構成してもよい。
この構成によれば、所定の基準により、各階層の項目の検索メニューを表示するか、当該項目に含まれる入力データを表示するかを判定するので、ユーザーは所望の入力データを素早く検索できるという効果がある。また、選択されたデータに対して再度検索メニューを作成することにより多層の階層メニューを実現するので、大量のデータをユーザーが容易に検索できるという効果がある。
【0133】
ここで、前記判定手段における所定の基準とは、前記選択を受け付けられた選択肢に対応する項目と当該項目に従属するすべての項目とに対応付けられている入力データの数が、所定の値以下であれば、入力データを表示し、所定の値よりも大きければ、検索メニューを生成する判定基準であるように構成してもよい。この構成によれば、各階層の項目及びその項目以下に従属する全ての項目に対応付けられた入力データの数に応じて、検索メニューを表示するか入力データを表示するかを判定するので、選択されたデータが少なくなったときに、不要な検索メニューを表示することを防ぐことができ、ユーザーは所望の入力データを素早く検索できるという効果がある。
【0134】
ここで、前記データ記憶手段は、各入力データを識別するデータ識別子を記憶しており、前記対応付手段は、前記分類パターン記憶手段から、各分類パターンに含まれる項目を順次読み出す項目読出部と、前記データ記憶手段から入力データを順次読み出し、読み出された入力データ毎に、入力データに含まれる特徴点を抽出する特徴点抽出部と、読み出された前記項目と抽出された前記特徴点とが対応するか否かを判定する一致判定部と、前記一致判定部により、読み出された前記項目と抽出された前記特徴点とが対応すると判定された場合に、前記読み出された項目に、前記特徴点を含む前記入力データを識別するデータ識別子を付加するデータ対応付部とを備えるように構成してもよい。
この構成によれば、分類パターンに含まれる項目を基にして、各項目と各入力データとを対応づけるので、分類パターンに含まれる項目に応じた検索メニューを作成できるという効果がある。
【0139】
ここで、前記分類パターン選択手段は、各分類パターン毎に各項目に対応付けられている入力データの数の分散値を計数する分散計数部と、最も小さい分散が算出された分類パターンを選択する分散選択部とを含むように構成してもよい。
この構成によれば、前記分類パターン選択手段は、各分類パターン毎に、各項目に対応付けされた前記データの数の分散を算出し、算出された分散に基づいて分類パターンを選択するので、各項目に対応付けられたデータ数ができるだけ均等な分類パターンから優先的にメニューの選択肢を作成でき、有効な検索メニューが作成できる。
【0140】
ここで、前記分類パターン選択手段は、各分類パターン毎に項目に対応付けられている入力データの種類の数を計数する入力データ数計数部と、各分類パターン毎に各項目に対応付けられている入力データの数の計数値から前記入力データの分散値を算出する分散算出部と、前記計数した入力データの種類の数および前記算出した入力データの分散値を基に、分類パターンを選択する入力データ数選択部と、を含むように構成してもよい。
この構成によれば、前記分類パターン選択手段は、各分類パターン毎に、対応付けられた前記データの数を算出し、算出されたデータの数および分散値に基づいて分類パターンを選択するので、多くのデータが対応付けられ、かつ各項目に対応付けられたデータ数ができるだけ均等な分類パターンから優先的にメニューの選択肢を作成でき、有効な検索メニューが作成できる。
【0141】
ここで、前記分類パターン選択手段は、各分類パターン毎に優先度を記憶している優先度記憶手段と、前記優先度記憶手段から優先度を読み出し、読み出した優先度を用いて、1つの分類パターンを選択する優先度選択手段とを含むように構成してもよい。
この構成によれば、分類パターン毎に分類パターンを選択する順位を示す優先度を記憶し、優先度に基づいて分類パターンを選択するので、ユーザーの好みに応じた優先度をあらかじめ設定しておけば、ユーザーの好みに応じた検索メニューを作成することができるという効果がある。
【0142】
ここで、前記検索メニュー作成装置は、さらに、ユーザーより、前記表示手段に表示された検索メニューの切替指示を受け付ける切替受付手段と、前記切替受付手段が前記ユーザーの切替指示を受け付けた場合に、前記分類パターン選択手段により選択された分類パターンを除く他の分類パターンより、前記分類パターン選択手段における前記所定の基準に基づいて、分類パターンを選択する第2分類パターン選択手段とを含み、前記メニュー抽出手段は、前記第2分類パターン選択手段により選択された分類パターンから、検索メニューを生成するように構成してもよい。
この構成によれば、ユーザーの指示があった時、他の分類パターンを選択してメニューを作成できるので、ユーザーが好みのメニューに切り替えることができるという効果がある。
【0143】
ここで、前記検索メニュー作成装置は、さらに、ユーザーより、前記表示された検索メニューから選択肢の選択を受け付ける入力受付手段を含み、前記対応付手段は、さらに、前記選択を受け付けられた選択肢に対応する項目に対応付けられた入力データを選択データとして抽出する選択入力データ抽出手段と、前記入力データと前記項目との全ての前記対応付けを取り消す対応付取消手段と、前記選択を受け付けられた選択肢に対応する項目を含む分類パターンを除く他の分類パターンを構成する各項目と、前記抽出された選択データとを対応付ける選択入力データ対応付手段とを含み、前記分類パターン選択手段は、前記選択を受け付けられた選択肢に対応する項目を含む分類パターンを除く他の分類パターンから、前記所定の基準に基づいて、分類パターンを選択し、前記メニュー抽出手段は、前記分類パターンを基にして、検索メニューを生成し、前記表示手段は、前記生成された検索メニューを表示するように構成してもよい。
この構成によれば、ユーザーにより選択された選択肢に対応づけられた入力データを、他の分類パターンに再度対応づけ、再度検索メニューを作成するので、視点の異なり、意味的につながりのない検索メニューを作成することができ、ユーザーは所望の入力データを素早く検索できるという効果がある。
【0144】
ここで、さらに、ユーザーより分類パターンと、分類パターンの登録と分類パターンの削除とを含む分類パターンの編集指示との入力を受け付ける分類パターン入力受付手段と、前記分類パターン入力受付手段により入力を受け付けられた分類パターンと分類パターンの編集指示を基にして、分類パターン記憶手段に記憶された分類パターンを編集する分類パターン編集手段とを含むように構成してもよい。
この構成によれば、ユーザーは自由に分類パターンを登録又は削除できるので、好みのメニューを表示させることができるという効果がある。
【0145】
また、本発明は、複数の入力データを記憶するための記憶領域を有するデータ記憶手段と複数の項目から構成される分類パターンを予め複数個記憶している分類パターン記憶手段とを備えるコンピュータを複数の入力データの検索に利用する選択肢を含む検索メニューを作成する検索メニュー作成装置として動作させるための検索メニュー作成方法であって、複数の入力データを受信する受信ステップと、前記受信した複数の入力データを前記データ記憶手段に書き込む書込ステップと、前記データ記憶手段に書き込まれた複数の入力データのそれぞれを、前記分類パターン記憶手段に予め記憶された複数の分類パターンのうちのいずれかに含まれる項目に対応付ける対応付ステップと、前記分類パターン記憶手段に予め記憶された複数の分類パターンのそれぞれについて、前記分類パターンを構成する各項目に対応付けた入力データの数を計数し、前記計数した値から算出される入力データの分散値を基に、分類パターンを選択する分類パターン選択ステップと、前記選択された分類パターンを構成する項目から、前記入力データ対応付けた項目を抽出し、抽出した前記項目を選択肢とした検索メニューを生成するメニュー抽出ステップと、前記メニュー抽出手段により生成された検索メニューを表示する表示ステップを含む。
この方法を用いると、検索のための選択肢となりえる複数の項目から構成される分類パターンを予め複数用意し、用意した複数の分類パターン中から各項目に対応付けられた入力データの数ができるだけ均等な分類パターンを優先して自動的に選択することが可能となり、この優先して自動的に選択した分類パターンに含まれる項目を選択肢として選択し検索メニューを生成できるので、書き込まれた複数の入力データの検索に最適な検索メニューを作成できるようになるという効果がある。
【0146】
らに、前記メニュー抽出ステップにより生成された検索メニューを表示する表示ステップを含むので、生成された検索メニューが表示され、ユーザーは、上記生成された検索メニューを見ることができる。
【0147】
らに、外部より複数の入力データを受信する受信ステップと、前記受信した複数の入力データを、前記データ記憶手段に書き込む書込ステップとを含むので、外部より受信した複数の入力データを基にして、検索メニューを生成することができるという効果がある。
【0148】
ここで、前記データ記憶手段は、各入力データを識別するデータ識別子を記憶しており、前記対応付ステップは、前記データ記憶手段から入力データを順次読み出し、読み出された入力データ毎に、入力データに含まれる特徴点を抽出する特徴点抽出ステップと、抽出された前記特徴点毎に、前記特徴点に対応する項目を前記分類パターン記憶手段より検索する項目検索ステップと、前記検索された項目に、前記入力データを識別するデータ識別子を付加するデータ対応付ステップとを含むように構成してもよい。
この方法を用いると、入力データから抽出された特徴点を用いて、入力データと分類パターンとを対応付けるので、入力データから抽出された特徴点に応じたメニューが作成できるという効果がある。
【0149】
ここで、前記データ記憶手段に記憶されている各入力データは、文書データであり、前記特徴点抽出ステップは、前記データ記憶手段から文書データを順次読み出すデータ読出ステップと、読み出された文書データに対して形態素解析を施して、文書データ毎に形態素に分解する形態素解析ステップと、前記分解された形態素から重要語を抽出し、抽出した重要語の一部又は全部を特徴点とする重要語抽出ステップとを含むように構成してもよい。
この方法を用いると、文書データに形態素解析を施し抽出された重要語を用いて、文書データと分類パターンとを対応付けるので、文書データのような定型化されていないデータから抽出された特徴点に応じたメニューが作成できるいう効果がある。
【0150】
ここで、前記重要語抽出ステップは、前記分解された形態素から重要語候補を抽出する重要語候補抽出ステップと、同一文書データにおいて、抽出された重要語候補と同じ重要語候補が出現する回数をカウントする出現回数カウントステップと、抽出された重要語候補から、前記カウントされた回数が所定の回数以上の重要語候補を重要語として抽出し、抽出された重要語を特徴点とする所定回数抽出ステップとを含むように構成してもよい。
この方法を用いると、文書データから、所定の回数以上含まれる自立語を重要語として抽出するので、文書データに応じた適切な特徴点が抽出できるという効果がある。
【0151】
ここで、前記重要語抽出ステップは、前記分解された形態素から重要語候補を抽出する重要語候補抽出ステップと、同一文書データにおいて、抽出された重要語候補と同じ重要語候補が出現する回数をカウントする出現回数カウントステップと、抽出された重要語候補のうち、前記カウントされた回数が多い重要語候補から順に所定数の重要語候補を重要語として抽出し、抽出された所定数の重要語を特徴点とする所定数抽出ステップとを含むように構成してもよい。
この方法を用いると、文書データから、含まれる回数が多い自立語から順に所定数の自立語を重要語として抽出するので、文書データに応じた適切な特徴点が抽出できるという効果がある。
【0152】
ここで、前記データ記憶手段は、リレーショナルデータベースとして前記複数の入力データを記憶し、各入力データはリレーショナルデータベースの行に相当し、少なくとも1つの値の並びから構成され、前記特徴点抽出ステップは、前記データ記憶手段から入力データを順次読み出すデータ読出ステップと、前記読み出した入力データを構成する少なくとも1つの値を特徴点として抽出するデータ抽出ステップとを含むように構成してもよい。
この方法を用いると、リレーショナルデータベースに記憶されている各要素をそのまま特徴点とするので、入力データから適切な特徴点を素早く抽出できるという効果がある。
【0153】
ここで、前記分類パターン記憶手段に含まれる前記項目は、階層構造を形成し、前記対応付ステップは、さらに、抽出された前記特徴点毎に、前記特徴点に対応する前記項目を前記分類パターン記憶手段より検索する階層項目検索ステップを含み、前記データ対応付ステップは、前記検索された項目と、前記特徴点を含む前記入力データとを対応付けるように構成してもよい。
この方法を用いると、分類パターンを構成する項目は階層構造を形成しており、複数の階層からなる項目に対して入力データを対応付けることができるという効果がある。
【0154】
ここで、さらに、ユーザーより、表示された検索メニューから選択肢の選択を受け付ける入力受付ステップと、前記入力受付ステップが前記ユーザーの選択を受け付けた場合に、所定の基準に基づいて、検索メニューを作成するか、又は、入力データを表示するかを判定する判定ステップと、前記判定ステップにより検索メニューを作成すると判定された場合に、前記選択を受け付けられた選択肢に対応する前記項目に従属する項目から、入力データが対応付けられた項目を抽出し、抽出した前記項目を選択肢とする検索メニューを生成する項目メニュー生成ステップと、前記判定ステップにより検索メニューを作成すると判定された場合に、前記生成された検索メニューを表示し、入力データを表示すると判定された場合に、前記選択を受け付けられた選択肢に対応する項目及びこの項目に従属するすべての項目に対応付けられた入力データをデータ記憶手段より読み出し、読み出した入力データを表示する入力データメニュー表示ステップと、前記入力データメニュー表示ステップにより前記読み出した入力データが表示されるまで、前記入力受付ステップによる1つの選択肢の選択の受け付けと、前記判定ステップによる判定と、前記項目メニュー生成ステップによる検索メニューの生成と、前記入力データメニュー表示ステップによる検索メニューの表示とを繰り返すよう、前記入力受付ステップ、前記判定ステップ、前記項目メニュー生成ステップ、前記入力データメニュー表示ステップを制御する繰返制御ステップとを含むように構成してもよい。
この方法を用いると、所定の基準により、各階層の項目の検索メニューを表示するか、当該項目に含まれる入力データを表示するかを判定するので、ユーザーは所望の入力データを素早く検索できるという効果がある。また、選択されたデータに対して再度検索メニューを作成することにより多層の階層メニューを実現するので、大量のデータをユーザーが容易に検索できるという効果がある。
【0155】
ここで、前記判定ステップにおける所定の基準とは、前記選択を受け付けられた選択肢に対応する項目と当該項目に従属するすべての項目とに対応付けられている入力データの数が、所定の値以下であれば、入力データを表示し、所定の値よりも大きければ、検索メニューを生成する判定基準であるように構成してもよい。
この方法を用いると、各階層の項目及びその項目以下に従属する全ての項目に対応付けられた入力データの数に応じて、検索メニューを表示するか入力データを表示するかを判定するので、選択されたデータが少なくなったときに、不要な検索メニューを表示することを防ぐことができ、ユーザーは所望の入力データを素早く検索できるという効果がある。
【0156】
ここで、前記データ記憶手段は、各入力データを識別するデータ識別子を記憶しており、前記対応付ステップは、前記分類パターン記憶手段から、各分類パターンに含まれる項目を順次読み出す項目読出ステップと、前記データ記憶手段から入力データを順次読み出し、読み出された入力データ毎に、入力データに含まれる特徴点を抽出する特徴点抽出ステップと、読み出された前記項目と抽出された前記特徴点とが対応するか否かを判定する一致判定ステップと、前記一致判定ステップにより、読み出された前記項目と抽出された前記特徴点とが対応すると判定された場合に、前記読み出された項目に、前記特徴点を含む前記入力データを識別するデータ識別子を付加するデータ対応付ステップとを含むように構成してもよい。
この方法を用いると、分類パターンに含まれる項目を基にして、各項目と各入力データとを対応づけるので、分類パターンに含まれる項目に応じた検索メニューを作成できるという効果がある。
【0161】
ここで、前記分類パターン選択ステップは、各分類パターン毎に各項目に対応付けられている入力データの数の分散値を算出する分散算出ステップと、最も小さい分散が算出された分類パターンを選択する分散選択ステップとを含むように構成してもよい。
この方法を用いると、前記分類パターン選択ステップは、各分類パターン毎に、各項目に対応付けされた前記データの数の分散を算出し、算出された分散に基づいて分類パターンを選択するので、各項目に対応付けられたデータ数ができるだけ均等な分類パターンから優先的にメニューの選択肢を作成でき、有効な検索メニューが作成できる。
【0162】
ここで、前記分類パターン選択ステップは、各分類パターン毎に項目に対応付けられている入力データの種類の数を計数する入力データ数計数ステップと、各分類パターン毎に各項目に対応付けられている入力データの数の計数値から前記入力データの分散値を算出する分散算出ステップと、前記計数した入力データの種類の数および前記算出した入力データの分散値を基に、分類パターンを選択する入力データ数選択ステップと、を含むように構成してもよい。
この構成によれば、前記分類パターン選択ステップは、各分類パターン毎に、対応付けられた前記データの数を算出し、算出されたデータの数および分散値に基づいて分類パターンを選択するので、多くのデータが対応付けられ、かつ各項目に対応付けられたデータ数ができるだけ均等な分類パターンから優先的にメニューの選択肢を作成でき、有効な検索メニューが作成できる。
【0163】
ここで、前記検索メニュー作成装置は、さらに、各分類パターン毎に優先度を記憶している優先度記憶手段を含み、さらに、前記分類パターン選択ステップにより、複数の分類パターンが選択された場合に、前記複数の分類パターン毎に、前記優先度記憶手段から優先度を読み出し、読み出した優先度を用いて、1つの分類パターンを選択する優先度選択ステップを含むように構成してもよい。
この方法を用いると、分類パターン毎に分類パターンを選択する順位を示す優先度を記憶し、優先度に基づいて分類パターンを選択するので、ユーザーの好みに応じた優先度をあらかじめ設定しておけば、ユーザーの好みに応じた検索メニューを作成することができるという効果がある。
【0164】
ここで、前記検索メニュー作成方法は、さらに、ユーザーより、前記表示ステップに表示された検索メニューの切替指示を受け付ける切替受付ステップと、前記切替受付ステップが前記ユーザーの切替指示を受け付けた場合に、前記分類パターン選択ステップにより選択された分類パターンを除く他の分類パターンより、前記分類パターン選択ステップにおける前記所定の基準に基づいて、分類パターンを選択する第2分類パターン選択ステップとを含み、前記メニュー抽出ステップは、前記第2分類パターン選択ステップにより選択された分類パターンから、検索メニューを生成するように構成してもよい。
この方法を用いると、ユーザーの指示があった時、他の分類パターンを選択してメニューを作成できるので、ユーザーが好みのメニューに切り替えることができるという効果がある。
【0165】
ここで、前記検索メニュー作成方法は、さらに、ユーザーより、前記表示された検索メニューから選択肢の選択を受け付ける入力受付ステップを含み、前記対応付ステップは、さらに、前記選択を受け付けられた選択肢に対応する項目に対応付けられた入力データを選択データとして抽出する選択入力データ抽出ステップと、前記入力データと前記項目との全ての前記対応付けを取り消す対応付取消ステップと、前記選択を受け付けられた選択肢に対応する項目を含む分類パターンを除く他の分類パターンを構成する各項目と、前記抽出された選択データとを対応付ける選択入力データ対応付ステップとを含み、前記分類パターン選択ステ+プは、前記選択を受け付けられた選択肢に対応する項目を含む分類パターンを除く他の分類パターンから、前記所定の基準に基づいて、分類パターンを選択し、前記メニュー抽出ステップは、前記分類パターンを基にして、検索メニューを生成し、前記表示ステップは、前記生成された検索メニューを表示するように構成してもよい。
この方法を用いると、ユーザーにより選択された項目に対応づけられた入力データを、他の分類パターンに再度対応づけ、再度検索メニューを作成するので、視点の異なる検索メニューを作成することができ、ユーザーは所望の入力データを素早く検索できるという効果がある。
【0166】
ここで、さらに、ユーザーより分類パターンと、分類パターンの登録と分類パターンの削除とを含む分類パターンの編集指示との入力を受け付ける分類パターン入力受付ステップと、前記分類パターン入力受付ステップにより入力を受け付けられた分類パターンと分類パターンの編集指示を基にして、分類パターン記憶手段に記憶された分類パターンを編集する分類パターン編集ステップと、を含むように構成してもよい。
この方法を用いると、ユーザーは自由に分類パターンを登録又は削除できるので、好みのメニューを表示させることができるという効果がある。
【0167】
また、本発明は、以上に説明した検索メニュー作成方法をコンピュータに実行させる検索メニュー作成プログラムを記録したコンピュータ読み取り可能な記録媒体とし、前記検索メニュー作成プログラムにより上記検索メニュー作成方法をコンピュータに実行させることにより、上記検索メニュー作成装置と同様の効果を奏することは明らかである。
【図面の簡単な説明】
【図1】図1は、本発明の第1の実施の形態としての検索メニュー作成装置の構成図である。
【図2】図2は、図1に示す検索メニュー作成装置のデータ記憶部に記憶されている伝言板情報のデータ構成を示す図である。
【図3】図3は、図1に示す検索メニュー作成装置のデータ記憶部に記憶されている伝言板情報の一例を示す図である。
【図4】図4は、図1に示す検索メニュー作成装置のデータ記憶部に記憶されている特徴点情報のデータ構成を示す図である。
【図5】図5は、図1に示す検索メニュー作成装置のデータ記憶部に記憶されている特徴点の一例を示す図である。
【図6】図6は、図1に示す検索メニュー作成装置の分類パターン記憶部に記憶されている分類パターン情報のデータ構成を示す図である。
【図7】図7は、図1に示す検索メニュー作成装置の分類パターン記憶部に記憶されている分類パターンの一例を示す図である。
【図8】図8は、図1に示す検索メニュー作成装置の優先度記憶部に記憶されている優先度情報のデータ構成を示す図である。
【図9】図9は、図1に示す検索メニュー作成装置の優先度記憶部に記憶されている優先度情報の一例を示す図である。
【図10】図10は、図1に示す検索メニュー作成装置の分類パターン記憶部に記憶されている分類パターン情報の一例を示す図である。
【図11】図11は、図1に示す検索メニュー作成装置の分類パターン記憶部に記憶されている分類パターン情報の一例を示す図である。
【図12】図12は、図1に示す検索メニュー作成装置の分類パターン記憶部に記憶されている分類パターン情報の一例を示す図である。
【図13】図13は、図1に示す検索メニュー作成装置の分類パターン記憶部に記憶されている分類パターン情報の一例を示す図である。
【図14】図14は、図1に示す検索メニュー作成装置の分類パターン記憶部に記憶されている分類パターン情報の一例を示す図である。
【図15】図15は、図1に示す検索メニュー作成装置の分類パターン記憶部に記憶されている分類パターン情報の一例を示す図である。
【図16】図16は、図1に示す検索メニュー作成装置により作成された検索メニューの一例を示す図である。
【図17】図17は、図1に示す検索メニュー作成装置の表示部による検索メニューの表示の一例を示す図である。
【図18】図18は、図1に示す検索メニュー作成装置の入力部の一例を示す図である。
【図19】図19は、図1に示す検索メニュー作成装置の表示部によるデータの表示の一例を示す図である。
【図20】図20は、図1に示す検索メニュー作成装置の分類パターン記憶部に記憶されている分類パターン情報の一例を示す図である。
【図21】図21は、図1に示す検索メニュー作成装置の分類パターン記憶部に記憶されている分類パターン情報の一例を示す図である。
【図22】図22は、図1に示す検索メニュー作成装置の動作を表すフローチャートである。
【図23】図23は、図1に示す検索メニュー作成装置の検索メニュー作成の動作を表すフローチャートである。
【図24】図24は、本発明の第2の実施の形態としての検索メニュー作成装置の構成図である。
【図25】図25は、図24に示す検索メニュー作成装置のデータ記憶部に記憶されているデータの一例を示す図である。
【図26】図26は、図25に示す1つの文書データが形態素解析されて得られた単語を示す図である。
【図27】図27は、図25に示す1つの文書データが形態素解析され分割された単語の出現回数を表す図である。
【図28】図28は、図24に示す検索メニュー作成装置の重要語記憶部に記憶されている重要語情報のデータ構成を示す図である。
【図29】図29は、図24に示す検索メニュー作成装置の重要語記憶部に記憶されている重要語の一例を示す図である。
【図30】図30は、図24に示す検索メニュー作成装置の分類パターン記憶部に記憶されている分類パターン情報のデータ構成を示す図である。
【図31】図31は、図24に示す検索メニュー作成装置の分類パターン記憶部に記憶されている分類パターン情報の一例を示す図である。
【図32】図32は、図24に示す検索メニュー作成装置の対応付部が記憶している重要語と分類パターンと分類項目の対応の一例を示す図である。
【図33】図33は、図24に示す検索メニュー作成装置の対応付部が記憶している分類パターンと分類項目の対応のうち、重複する対応が削除された一例を示す図である。
【図34】図34は、図24に示す検索メニュー作成装置の分類パターン記憶部が記憶する分類パターンに文書データの識別番号が付加された一例を示す図である。
【図35】図35は、図24に示す検索メニュー作成装置の分類パターン記憶部が記憶する分類パターンに文書データの識別番号が付加された一例を示す図である。
【図36】図36(a)は、図24に示す検索メニュー作成装置の分類パターン選択部が分類パターンを評価するときに用いる評価式の一例を示す図である。
図36(b)は、図24に示す検索メニュー作成装置の分類パターン選択部が分類パターンを評価するときに用いる評価式の第2項の関数を示す図である。
【図37】図37(a)は、図24に示す検索メニュー作成装置のメニュー作成部が作成した検索メニューの一例を示す図である。図37(a)は、図24に示す検索メニュー作成装置の表示部による検索メニューの表示の1例を示す図である。
【図38】図38は、図24に示す検索メニュー作成装置の入力部の一例を示す図である。
【図39】図39は、図24に示す検索メニュー作成装置の検索メニュー作成の動作を表すフローチャートである。
【図40】図40は、図1に示す検索メニュー作成装置の表示部による検索メニューの表示の一例を示す図である。
【図41】図41は、従来のメニュー検索システムの構成を示すブロック図である。
【図42】図42(a)は、図41に示すメニュー検索システムのデータ記憶部に記憶されているデータの一例を示す図である。
図42(b)は、図41に示すメニュー検索システムのシソーラス記憶部に記憶されているシソーラスの一例を示す図である。
【図43】図43は、図41に示すメニュー検索システムのデータ記憶部に記憶されているデータとシソーラス記憶部に記憶されているシソーラスとの対応付けを示す図である。
【図44】図44(a)は、図41に示すメニュー検索システムが一例として作成した検索メニューの階層構造を示す図である。
図44(b)は、図41に示すメニュー検索システムの表示部による検索メニューの表示の一例を示す図である。
図44(c)は、図41示すメニュー検索システムの表示部による検索メニューの表示の一例を示す図である。
【符号の説明】
100 検索メニュー作成装置
101 データ記憶部
102 データ特徴点抽出部
103 分類パターン記憶部
104 優先度記憶部
105 対応付部
106 分類パターン選択部
107 メニュー作成部
108 表示部
109 入力部
110 分類パターン選択部
2100 検索メニュー作成装置
2101 データ記憶部
2102 重要語抽出部
2103 重要語記憶部
2104 分類パターン記憶部
2105 対応付部
2106 分類パターン選択部
2107 メニュー作成部
2108 表示部
2109 入力部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a search menu creation device that creates a search menu corresponding to the content of data from a plurality of data, a search menu creation method, and a recording medium on which a search menu creation program is recorded.
[0002]
[Prior art]
In recent years, a large amount of data can be easily obtained by an individual via a network such as the Internet. A menu search system that creates a search menu according to the contents of the data so that even a user unfamiliar with information equipment can easily obtain desired information from the large amount of data thus obtained is an information processing society. It is introduced in Research Report 97-NL-117-14 “Automatic Classification of Document Data Using Thesaurus”. FIG. 41 is a block diagram showing the configuration of this menu search system.
[0003]
The menu search system shown in FIG. 41 includes a data storage unit 3501, a thesaurus storage unit 3502, a data feature point extraction unit 3503, a data association unit 3504, a menu creation unit 3505, and a display unit 3506.
A data storage unit 3501 stores document data acquired via a network or the like and feature points extracted by the data feature point extraction unit 3503. FIG. 42A shows an example of data stored in the data storage unit 3501. As shown in this figure, the data storage unit 3501 stores document data 3621, 3622, 3623 acquired via a network and the like, and feature points 3601, 3602, 3603 extracted by the data feature point extraction unit 3503. is doing.
The thesaurus storage unit 3502 stores a thesaurus. The thesaurus is a dictionary in which words are classified and arranged in a tree structure according to meaning. The thesaurus storage unit 3502 arranges higher concept words closer to the root of the tree structure in this thesaurus, and arranges lower concept words closer to the leaves of the tree structure. Arrange.
[0004]
FIG. 42B shows a thesaurus 3511 as an example of the thesaurus stored in the thesaurus storage unit 3502. In this thesaurus 3511, “transportation” 3618 is the root, “transportation” 3618 is connected to “car” 3617 and “railway” 3616, and “car” 3617 is connected to “truck” 3611 and “traffic”. A “bus” 3612 is connected, and a “railway” 3616 is connected with a “train” 3613 and a “train” 3614.
In this thesaurus 3511, “transportation” 3618 is a superordinate concept of “car” 3617 and “railway” 3616, “car” 3617 is a superordinate concept of “truck” 3611 and “bus” 3612, and “railway” "3616" is a superordinate concept of "train" 3613 and "train" 3614.
[0005]
A data feature point extraction unit 3503 extracts feature points indicating features of the document data from the document data stored in the data storage unit 3501. Specifically, words that frequently appear in the document data are extracted as important words and used as feature points. In FIG. 42A, feature points 3601 “bus”, feature points 3602 “truck”, and feature points 3603 “train” are feature points extracted by the data feature point extraction unit 3503 from the document data 3621, 3622, and 3623, respectively. It is.
The data association unit 3504 associates the feature points with the words in the thesaurus having the same expression as the feature points. For example, the data association unit 3504 associates the feature point 3601 “bus” with the “bus” 3612 in the thesaurus 3511 having the same expression as the feature point 3601 “bus”. Similarly, the data association unit 3504 associates the feature point 3602 “track” and the feature point 3603 “train” with “track” 3611 and “train” 3614 in the thesaurus 3511, respectively. In this way, as shown in FIG. 43, a thesaurus 3511a associated with the feature points is generated.
[0006]
The menu creation unit 3505 extracts a word associated with a feature point and a word connected to the word from the thesaurus 3511a that has been associated with data, and generates a menu structure. In the thesaurus 3511a shown in FIG. 43, the menu creation unit 3505 includes a “track” 3611 associated with the feature point 3602 “track”, a “bus” 3612 associated with the feature point 3601 “bus”, and a feature point. “Train” 3614 associated with 3603 “Train”; “Car” 3617 connected to “Track” 3611; “Railway” 3616 connected to “Train” 3614; “Transport” connected to “Car” 3617 The “engine” 3618 is extracted to generate a menu structure 3511b shown in FIG.
[0007]
Display unit 3506 displays a search menu according to the generated menu structure. Based on the menu structure 3511b shown in FIG. 44 (a), the display unit 3506 has an option “car” 3702 and an option “railway” 3703 with the title “transportation” 3701 as shown in FIG. 44 (b). A search menu 3700 consisting of Here, when the user selects the option “car” 3702, the display unit 3506 next displays the option “truck” 3712 and the option “bus” 3713 with “car” 3711 as the title, as shown in FIG. A search menu 3710 consisting of is displayed.
[0008]
[Problems to be solved by the invention]
However, in the above conventional example, since a search menu using a thesaurus is generated based on data acquired via a network or the like, even a user unfamiliar with information equipment can easily obtain desired information. Although there is an advantage that a search menu that can search for is generated, the search menu is generated using one thesaurus, so the search target data does not apply to a thesaurus in which words are classified and arranged in a tree structure by meaning There is a problem that there are things. For example, the word “road” is related to “transportation”, but does not correspond well to the words in the thesaurus 3511 classified and arranged from the viewpoint of “transportation”.
[0009]
In addition, an age menu having options “under 10 years old”, “11-20 years old”, “21 years old or older”, and options “student”, “company employee”, “ The search menu consisting of the occupation menu with "Housewife" cannot be generated based on the thesaurus because the options included in the age menu and occupation menu have different viewpoints of classification and are not connected in that sense. There is a point.
[0010]
Furthermore, when adding data to the thesaurus or changing the data of the thesaurus, it is necessary to maintain the structure specific to the thesaurus that the data is categorized and arranged in a tree structure in the meaning. There is a problem that the operation of adding or changing is very complicated.
The present invention relates to a search menu creation device, a search menu creation method, and a search menu creation for generating a search menu by properly associating data with respect to options included in classification patterns that have different viewpoints of classification and are not connected in meaning. An object is to provide a recording medium on which a program is recorded.
[0011]
[Means for Solving the Problems]
  In order to solve this problem, the present inventionA search menu creation device for creating a search menu including options used for searching for a plurality of input data, a data storage means having a storage area for storing a plurality of input data, and a plurality of search menu options Classification pattern storage means in which a plurality of classification patterns composed of the above items are stored in advance, receiving means for receiving a plurality of input data, writing means for writing the received plurality of input data to the data storage means, Association means for associating each of the plurality of input data written in the data storage means with an item included in any of the plurality of classification patterns stored in advance in the classification pattern storage means; and the classification pattern Each item constituting the classification pattern for each of a plurality of classification patterns stored in advance in the storage means Item that constitutes the selected classification pattern, and the classification pattern selection means for selecting the classification pattern based on the variance of the input data calculated from the counted value Menu extraction means for extracting an item associated with the input data, generating a search menu using the extracted item as an option, and display means for displaying the search menu generated by the menu extraction means;It is characterized by providing.
[0014]
Here, the data storage means stores a data identifier for identifying each input data, and the associating means sequentially reads the input data from the data storage means, and inputs the input data for each read input data. A feature point extraction unit for extracting feature points included in the data; an item search unit for searching for an item corresponding to the feature point from the classification pattern storage unit for each of the extracted feature points; and the searched item In addition, a data association unit for adding a data identifier for identifying the input data may be included.
[0015]
Here, each input data stored in the data storage means is document data, and the feature point extraction unit includes a data reading element for sequentially reading the document data from the data storage means, and the read document data A morphological analysis element that performs morpheme analysis on each document data and decomposes it into morphemes for each document data, and extracts important words from the decomposed morphemes, and important words having a part or all of the extracted important words as feature points You may comprise so that an extraction element may be included.
[0016]
Here, the important word extraction element is an important word candidate extraction element that extracts a keyword candidate from the decomposed morpheme, and the number of times that the same keyword candidate as the extracted keyword candidate appears in the same document data. The number of appearance count elements for counting and the extracted important word candidates are extracted as important words from the extracted important word candidates, and the extracted number of important words is a predetermined number of times. You may comprise so that an extraction element may be included.
[0017]
Here, the important word extraction element is a key word candidate extraction element that extracts a key word candidate from the decomposed morpheme, and the number of times that the same key word candidate as the extracted key word candidate appears in the same document data. A predetermined number of important word candidates are extracted as important words in order from the extracted important word candidates and the extracted important word candidates in order from the important word candidates with the largest number of counted times. It may be configured to include a predetermined number of extraction elements having a feature point.
[0018]
Here, the data storage means stores the plurality of input data as a relational database, each input data corresponds to a row of the relational database, and is composed of an array of at least one value. A data reading element for sequentially reading input data from the data storage means and a data extracting element for extracting at least one value constituting the read input data as a feature point may be included.
[0019]
Here, the items included in the classification pattern storage unit form a hierarchical structure, and the association unit further extracts, for each extracted feature point, the item corresponding to the feature point as the classification pattern. A hierarchical item search unit that searches from storage means may be included, and the data association unit may be configured to associate the searched item with the input data including the feature point.
[0020]
Here, further, an input receiving unit that accepts selection of an option from the displayed search menu from the user, and when the input receiving unit receives the user's selection, a search menu is created based on a predetermined criterion. Determining means for determining whether or not to display input data, and, if the determination means determines that a search menu is to be created, from the items subordinate to the item corresponding to the option for which the selection is accepted An item menu generating unit that extracts an item associated with input data and generates a search menu using the extracted item as an option; and the determination unit generates the search menu when it is determined to generate the search menu. If the search menu is displayed and it is determined that the input data is displayed, the selection is accepted. And input data associated with all items subordinate to the item are read from the data storage means, and the input data menu display means for displaying the read input data, and the input read by the input data menu display means Until the data is displayed, the selection of one option by the input reception unit, the determination by the determination unit, the generation of the search menu by the item menu generation unit, and the search menu by the input data menu display unit You may comprise so that the input reception means, the determination means, the item menu generation means, and the repetition control means for controlling the input data menu display means may be provided so as to repeat the display.
[0021]
Here, the predetermined criterion in the determination means is that the number of input data associated with the item corresponding to the option for which the selection has been accepted and all items subordinate to the item is equal to or less than a predetermined value. If so, the input data may be displayed, and if it is larger than a predetermined value, it may be configured to be a criterion for generating a search menu.
[0022]
Here, the data storage means stores a data identifier for identifying each input data, and the associating means includes an item reading unit that sequentially reads items included in each classification pattern from the classification pattern storage means. , Sequentially reading input data from the data storage means, and extracting a feature point included in the input data for each read input data; the read item and the extracted feature point When the match determination unit determines whether or not the corresponding item is extracted and the extracted feature points correspond to each other, the read item is determined. In addition, a data association unit for adding a data identifier for identifying the input data including the feature point may be provided.
[0027]
  Here, the classification pattern selection means is input data associated with each item for each classification pattern.A variance calculation unit for calculating a variance value of the input data from the counted value ofSmallest variancevalueAnd a distribution selection unit that selects the calculated classification pattern.
  Here, the classification pattern selection means includes an input data number counting unit that counts the number of types of input data associated with items for each classification pattern, and is associated with each item for each classification pattern. A classification pattern is selected based on a variance calculation unit that calculates a variance value of the input data from a count value of the number of input data, and the number of types of the input data counted and the variance value of the calculated input data And an input data number selection unit.
[0029]
Here, the classification pattern selection unit includes a priority storage unit that stores a priority for each classification pattern, and reads out the priority from the priority storage unit, and uses the read priority to perform one classification. You may comprise so that the priority selection means to select a pattern may be included.
[0030]
Here, the search menu creating device further includes a switch receiving unit that receives a switching instruction for the search menu displayed on the display unit from the user, and the switching receiving unit that receives the switching instruction for the user. A second classification pattern selection means for selecting a classification pattern based on the predetermined criteria in the classification pattern selection means from other classification patterns excluding the classification pattern selected by the classification pattern selection means; The extraction unit may be configured to generate a search menu from the classification pattern selected by the second classification pattern selection unit.
[0031]
Here, the search menu creation device further includes an input reception unit that receives selection of an option from the displayed search menu from the user, and the association unit further corresponds to the option for which the selection has been received. Selection input data extracting means for extracting input data associated with an item to be selected as selection data, correspondence canceling means for canceling all the correspondence between the input data and the item, and an option for accepting the selection A selection input data associating means for associating each item constituting another classification pattern excluding a classification pattern including an item corresponding to the item and the extracted selection data, wherein the classification pattern selection means performs the selection. Based on the predetermined criteria from other classification patterns excluding the classification pattern including the item corresponding to the accepted option. There are, select a classification pattern, the menu extraction means, based on the classification pattern, generates a search menu, the display unit may be configured to display a search menu that is generated.
[0032]
Here, a classification pattern input accepting unit that accepts input of a classification pattern and a classification pattern editing instruction including registration of the classification pattern and deletion of the classification pattern from the user, and an input by the classification pattern input acceptance unit A classification pattern editing unit that edits a classification pattern stored in the classification pattern storage unit based on the classification pattern and the classification pattern editing instruction may be included.
[0033]
DETAILED DESCRIPTION OF THE INVENTION
1. Embodiment 1
Hereinafter, a search menu creating apparatus 100 according to an embodiment of the present invention will be described with reference to the drawings.
1.1 Configuration of search menu creation device
A block diagram showing the configuration of the search menu creation device 100 is shown in FIG.
The search menu creation apparatus 100 includes a data storage unit 101, a data feature point extraction unit 102, a classification pattern storage unit 103, a priority storage unit 104, an association unit 105, a first classification pattern selection unit 106, a menu creation unit 107, a display Unit 108, input unit 109, and second classification pattern selection unit 110.
[0034]
1.1.1 Data storage unit 101
The data storage unit 101 stores input data, for example, message board information 260 sent via a network or the like. In addition, the data storage unit 101 stores feature point information 270 including feature points output from the data feature point extraction unit 102. Specifically, the data storage unit 101 is configured by a magnetic disk device or the like.
A receiving unit (not shown in FIG. 1) receives the input data from the outside via a network or the like, and a data writing unit (not shown in FIG. 1) stores the received input data in the data storage unit 101. Write.
The receiving unit may read input data from a dictionary, thesaurus, or encyclopedia recorded on a computer-readable recording medium such as a CD-ROM.
[0035]
(1) Message board information 260
The message board information 260 is used to convey information that the user wants to buy or sell the article to a large number of people. As shown in FIG. 2, the message board identification information 261, the purchase transfer distinction 262, the address 263, the name of the information provider H.264, age 265, occupation 266, and comment 267.
The message board identification information 261 is a data identifier for identifying the message board information 260 and may be attached in any manner as long as the message board information 260 can be identified. In general, a number determined by the arrival order of input data is used. The purchase transfer distinction 262 indicates whether the information described on the message board is information related to purchase or information related to transfer. The address 263 indicates the address of the information provider, the information provider name 264 indicates the name of the information provider, the age 265 indicates the age of the information provider, and the occupation 266 indicates the occupation of the information provider. . The comment 267 is a sentence including the item name, amount, conditions, etc. relating to purchase or transfer.
[0036]
An example of the message board information 260 stored in the data storage unit 101 is shown in FIG. As shown in this figure, the data storage unit 101 stores message board information 201, 202, and 203 related to purchase and transfer of articles acquired via a network. The message board information 201 includes message board identification information 211, purchase transfer distinction 231, address 232, information provider name 233, age 234, occupation 235, and comment 236. Includes message board identification information 212, purchase / transfer distinction 241, address 242, information provider name 243, age 244, occupation 245, and comment 246. Message board information 203 includes message board identification information. Information 213, purchase / transfer distinction 251, address 252, information provider name 253, age 254, occupation 255, and comment 256 are included.
[0037]
(2) Feature point information 270
The feature point information 270 is composed of feature point identification information 271 and feature points 272 as shown in FIG.
One feature point information 270 corresponds to one message board information 260. The feature point identification information 271 stores the same content as the message board identification information 261 included in the corresponding message board information 260 and is used to identify the feature point information 270. The feature point 272 is extracted by the data feature point extraction unit 102 and written to the data storage unit 101. The feature point 272 will be described later.
An example of the feature point information 270 stored in the data storage unit 101 is shown in FIG. As shown in this figure, the data storage unit 101 stores feature point information 301, feature point information 302, and feature point information 303. The feature point information 301 includes feature point identification information 214 and feature points 221, 222, 223, 224, 225, 226, 227, and 228. The feature point identification information 214 has the same value as the message board identification information 211. , The feature point information 301 corresponds to the message board information 201. The feature point information 302 includes feature point identification information 215 and feature points 281, 282, 283, 284, 285, 286, 287, 288, and 289. The feature point identification information 215 is the same as the message board identification information 212. And the feature point information 302 corresponds to the message board information 202. Further, the feature point information 303 includes feature point identification information 216 and feature points 291, 292, 293, 294, 295, 296, and 297. The feature point identification information 216 has the same value as the message board identification information 213. , The feature point information 303 corresponds to the message board information 203.
[0038]
1.1.2 Data feature point extraction unit 102
For each message board information 260 stored in the data storage unit 101, the data feature point extraction unit 102 includes message board identification information 261 that constitutes the message board information 260, purchase transfer distinction 262, address 263, information provider name 264, and age 265. , Occupation 266 and comment 267 are read out.
Next, the data feature point extraction unit 102 performs morpheme analysis on the read comment 267 to decompose the comment 267 into morphemes, and extracts noun words from the morphemes.
Here, the morpheme analysis is aimed at decomposing a given sentence into a sequence of morphemes which are the smallest linguistic units, and determining the part of speech of each morpheme. ~ 137 (Iwanami Shoten, issued in April 1996), the details are omitted.
[0039]
Further, the data feature point extraction unit 102 uses the read message board identification information 261 as the feature point identification information, the read purchase transfer distinction 262, the address 263, the information provider name 264, the age 265, The occupation 266 and the extracted noun word are written in the data storage unit 101 as feature points.
Here, the purchase transfer distinction 262 included in the message board information 260 indicates whether the information described in the message board is information related to purchase or information related to transfer, and does not include other information. Therefore, as described above, the data feature point extraction unit 102 uses the purchase transfer distinction 262 as it is as a feature point. Similarly, the address 263, the information provider name 264, the age 265, and the occupation 266 are also used as characteristic points. On the other hand, since the comment 267 is a sentence including the name, price, condition, etc. of the item related to purchase or transfer, it is inappropriate to use the comment 267 as a feature point as it is, and as described above, the data feature point The extraction unit 102 performs morphological analysis on the comment 267, extracts a noun word from the comment 267, and uses the extracted noun word as a feature point.
[0040]
In this way, whether the input data is used as a feature point as it is or whether a feature point is extracted by performing morphological analysis on the input data can be determined using the data structure.
[0041]
Next, the data feature point extraction unit 102 will be described using the examples shown in FIGS. 3 and 5.
From the message board information 201 stored in the data storage unit 101, the data feature point extraction unit 102 receives the message board identification information 211 “(1)”, the purchase transfer distinction 231 “sell”, the address 232 “Tokyo”, and the information provider name 233. “Sato”, age 234 “22 years old”, occupation 235 “university student”, comment 236 “PC is sold for 220,000 yen. Next, the data feature point extraction unit 102 performs a morphological analysis on the read comment 236 “PC is sold for 220,000 yen. I would like handing it over”, and the comment 236 is converted into the morpheme “PC”, “ ”,“ 220,000 yen ”,“ de ”,“ sell ”,“ mas ”,“. ”,“ Handing ”,“ ”,“ hope ”,“ mas ”,“. ” Morpheme “PC”, “O”, “220,000 Yen”, “De”, “Sell”, “Masu”, “.”, “Handing”, “O”, “Wish”, “Masu”, The noun words “PC”, “220,000 yen”, and “handing” are extracted from “.”. Further, the data feature point extraction unit 102 uses the read message board identification information 211 “(1)” as the feature point identification information, and reads the purchase transfer distinction 231 “sell”, the address 232 “Tokyo”, and the information provider name 233. “Sato”, age 234 “22 years old”, occupation 235 “university student”, and extracted noun words “computer”, “220,000 yen”, and “handing” are written in the data storage unit 101 as feature points.
The data feature point extraction unit 102 also writes the feature point identification information and the feature point to the data storage unit 101 for the message board information 202 and 203 stored in the data storage unit 101 in the same manner as described above.
[0042]
1.1.3 Classification pattern storage unit 103
The classification pattern storage unit 103 stores classification pattern information 700. Specifically, the classification pattern storage unit 103 is configured by a magnetic disk device or the like.
The classification pattern information 700 is information that serves as a basis for option generation when a search menu including options for selecting input data is generated. The classification pattern information 700 includes at least one classification pattern 701 as shown in FIG.
[0043]
The classification pattern 701 always includes a classification pattern name 702 and an item group 705. The classification pattern 701 may further include a data corresponding item number 703 or a selection mark 704.
The item group 705 includes at least one item 711. The item 711 may be added with at least one message board identification information 713. In addition, the item 711 may be added as a subordinate to at least one small item 712. At least one message board identification information 714 may be added to the small item 712.
The classification pattern name 702 is a name representing the classification pattern 701.
The classification pattern storage unit 103 stores the number of data corresponding items written by the first classification pattern selection unit 106 as the number of data corresponding items 703 for each classification pattern.
The classification pattern storage unit 103 stores a selection mark written by the first classification pattern selection unit 106 as a selection mark 704.
Details of the data correspondence item number 703 and the selection mark 704 will be described later.
[0044]
The message board identification information 713 and 714 is the same as the message board identification information 261 shown in FIG.
Here, any item constituting any one classification pattern is not related to any item constituting any other classification pattern.
FIG. 7 shows classification pattern information 400 as an example of classification pattern information 700 stored in the classification pattern storage unit 103.
The classification pattern information 400 includes classification patterns 421, 431, 441, 451, 461, and 471.
[0045]
The classification patterns 421, 431, 441, 451, 461, and 471 are “age” 411, “occupation” 412, “gender” 413, “place name” 414, “price 1” 415, and “price 2”, respectively. 416 is given.
The classification pattern 421 includes seven items “˜9”, “10-20”, “21-29”, “30-39”, “40-49”, “50-59”, classified into seven ages. An item group 420 composed of “60-” is included.
The classification pattern 431 includes 10 items “infant”, “elementary school student”, “junior high school student”, “high school student”, “college student”, “housewife”, “company employee”, “professional school student”, “self-employed”, “ An item group 430 composed of “unemployed” is included.
The classification pattern 441 includes an item group 440 including two items “male” and “female”.
[0046]
The classification pattern 451 includes an item group 450 including eight regional names “Hokkaido”, “Tohoku”, “Kanto”, “Chubu”, “Kinki”, “China”, “Shikoku”, and “Kyushu”. In addition, the item “Tohoku” 452 includes sub-items “Aomori” 453, “Iwate” 454, “Miyagi” 455, “Akita” 456, “Yamagata” 457, and “Fukushima” 458. Thus, the item has a two-layer structure in which the prefecture name of each region is further set as a small item.
The classification pattern 461 to which the classification pattern name “price 1” 415 is added includes the item group 460 “˜10,000, 1 to 100,000, 100,000 to 1,000,000,” and the classification pattern name “price 2” 416. The classification pattern 471 to which “” is added includes an item group 470 “˜1,000, 1 to 3,000, 3 to 5,000, 5 to 10,000, and 10,000”. As described above, the classification pattern 461 and the classification pattern 471 are different in the configuration of items, although the classification pattern targets are both prices. As described above, a plurality of patterns having the same target but different configurations may be stored.
[0047]
1.1.4 Priority Storage Unit 104
The priority storage unit 104 stores priority information 750 in which priority is associated with each classification pattern 701. Specifically, the priority storage unit 104 is configured by a magnetic disk device or the like.
The priority information 750 includes at least one priority pattern information 751 as shown in FIG. The priority pattern information 751 includes a classification pattern name 752 and a priority 753. The classification pattern name 752 is the same as the classification pattern name 702 shown in FIG. 6, and the priority 753 expresses the degree of preference of the user with respect to the classification pattern indicated by the classification pattern name 752. Indicates that the taste of is high.
[0048]
FIG. 9 shows priority information 760 as an example of the priority information 750. As shown in this figure, the classification pattern names “age” 511, “occupation” 512, “gender” 513, “place name” 514, “price 1” 515, “price 2” 516 have priority “3” 521, respectively. , “4” 522, “5” 523, “8” 524, “2” 525, and “4” 526 are associated with each other. Accordingly, the priority levels “3”, “4”, “5”, “8”, “2”, and “4” are assigned to the classification patterns 421, 431, 441, 451, 461, and 471 shown in FIG. It will be received.
In this embodiment, since the classification pattern name is associated with the priority, it is possible to know the priority of the classification pattern using the classification pattern name, but the classification pattern name 752 is used instead of the classification pattern name 752 of the priority information 750. The storage position of the pattern may be stored. In this case, the classification pattern name 700 is not provided in the classification pattern information 700 but the storage position of the classification pattern is provided.
Further, the priority may be set higher as the priority number is smaller.
[0049]
1.1.5 Corresponding part 105
The association unit 105 uses the feature point information stored in the data storage unit 101 to associate the message board information stored in the data storage unit 101 with the classification pattern stored in the classification pattern storage unit 103.
A specific operation of the associating unit 105 will be described with reference to FIGS. 5 and 7.
The association unit 105 first reads the feature point identification information 214 and the feature point 221 included in the feature point information 301 from the data storage unit 101, and the read feature point 221 is stored in the classification pattern storage unit 103. Compare with items or sub-items included in the patterns 421, 431, 441, 451, 461, 471. If the feature point 221 matches the item or the small item, or if the feature point 221 is included in the range indicated by the item or the small item, the associating unit 105 determines whether the feature point 221 matches or The read feature point identification information 214 is added as message board identification information to a small item or an item or small item in which the feature point 221 is included in the range. Thereby, the feature point information is associated with the item or the small item.
[0050]
Corresponding unit 105 compares feature points with classification pattern items or small items for feature points 222, 223, 224, 225, 226, 227, and 228 included in feature point information 301, as with feature points 221. And adding the feature point identification information 214.
[0051]
Next, the associating unit 105 compares the feature points included in the feature point information 302 with the feature points and classification pattern items or small items, and the feature point identification information 215, as with the feature point information 301. Is added. Similarly, the associating unit 105 compares the feature points with classification pattern items or small items and adds feature point identification information for all feature point information included in the data storage unit 101.
For example, the associating unit 105 reads the feature point identification information 214 “(1)” and the feature point 221 “sell” included in the feature point information 301, and the feature points 221 and the classification patterns 421, 431, 441, 451. , 461, 471 and the items included in the sub items. The items or small items included in the classification patterns 421, 431, 441, 451, 461, 471 have no item or small item that matches the feature point 221 “sell”, and the feature point 221 “sell” Since it is not included in the range indicated by the item or the small item, the associating unit 105 reads the next feature point 222 “Tokyo”.
[0052]
The associating unit 105 compares the feature point 222 “Tokyo” with the items or small items included in the classification patterns 421, 431, 441, 451, 461, and 471. Since the feature point 222 “Tokyo” matches the small item “Tokyo” included in the classification pattern 451, the feature point identification information 214 “(1)” is added to the small item “Tokyo” included in the classification pattern 451. Add as information.
FIG. 10 shows classification pattern information when the feature point identification information 214 “(1)” is added as message board identification information to the small item “Tokyo” included in the classification pattern 451. As shown in this figure, the code | symbol 611 has shown this matched message board identification number.
Similarly, for the other feature points 223, 224, 225, 226, 227, and 228 included in the feature point information 301, the feature point identification information is added to the item or sub-item.
Here, since the feature point 223 “Sato”, the feature point 226 “PC”, and the feature point 228 “handing” are not in the classification pattern, the feature point identification information is not added to the item or the small item.
[0053]
Further, numerical data such as the feature point 227 “220,000” is determined by using the magnitude relation of the numerical values to determine whether they are within the range of the item. In the present embodiment, message board information is included in items included in both of the classification patterns 461 and 471 indicated by the two classification pattern names 415 “price 1” and 416 “price 2” for the feature point 227 “220,000”. 201 are associated with each other.
FIG. 11 shows the state of the classification pattern storage unit 103 when the association using all the feature points included in the feature point information 301 is completed. In this figure, reference numerals 611 to 615 indicate message board identification information 211 “(1)” of the message board information 201 associated by the associating unit 105.
FIG. 12 shows the classification pattern information 652 when the association using all the feature points included in the feature point information 301, 302, 303 is completed. Reference numerals 811 to 822 indicate message board identification numbers of the message board information 201, 202, and 203 associated with each other.
In FIG. 13, another 17 feature point information is newly added to the feature point information 301, 302, 303, and the association using all the feature points included in the total 20 feature point information is completed. The classification pattern information 653 is shown.
[0054]
1.1.6 First classification pattern selection unit 106
The first classification pattern selection unit 106 uses priority information stored in the priority storage unit 104 from classification pattern information stored in the classification pattern storage unit 103 based on a predetermined criterion described below. Select the optimal classification pattern for creating a search menu.
The first classification pattern selection unit 106 reads out the classification pattern information 700 stored in the classification pattern storage unit 103 for each classification pattern 701, and items and message boards to which the message board identification information 713 is added for each of the read classification patterns 701. The number of items including small items to which the identification information 714 is added is counted, and the counted number of items is written in the classification pattern information 700 of the classification pattern storage unit 103 for each classification pattern 701 as the data-corresponding item number 703.
[0055]
Here, the operation of the first classification pattern selection unit 106 will be described using the classification pattern information 653 shown in FIG.
The first classification pattern selection unit 106 reads the classification pattern 1010 from the classification pattern information 653, determines whether or not message board identification information is added to each item included in the classification pattern 1010, and the message board identification information is added. Count the number of items you have.
Among the items included in the classification pattern 1010, the input data is associated with two items 1012, 1013. Therefore, the first classification pattern selection unit 106 counts “2” as the number of items, and the data “2” is written in the classification pattern 1010 as the number of corresponding items.
Here, for a classification pattern having a two-level structure of items and small items indicated by the classification pattern name “place name” 1021, the first classification pattern selection unit 106 adds the message board identification information to the small items. Count the number of items that contain.
FIG. 14 shows a state in which the number of items associated with message board identification information is stored for each classification pattern name.
[0056]
When creating a search menu, if the number of options displayed per screen is too small, the menu hierarchy becomes deep and difficult to search, and conversely if too many, it is difficult to compare at a time, making selection difficult. Therefore, a predetermined number of the best options is set in advance, and the closer to the number, the more appropriate classification is determined. Here, assuming that the number of appropriate options is 6, in the example shown in FIG. 14, the number of items of the classification pattern indicated by the classification pattern name 1021 “place name” and 1022 “price 2” is 5, respectively. Therefore, the first classification pattern selection unit 106 determines that the classification pattern indicated by the classification pattern name 1021 “place name” and 1022 “price 2” is optimal.
[0057]
In this way, the first classification pattern selection unit 106 selects an optimal classification pattern. Here, when there are a plurality of optimum classification patterns, as shown below, the first classification pattern selection unit 106 further narrows down the selected plurality of classification patterns and selects a classification pattern.
That is, the first classification pattern selection unit 106 reads a plurality of priorities corresponding to the classification pattern names of the plurality of classification patterns selected as the optimum from the priority storage unit 104, and sets the plurality of read priorities. Compare. For example, as illustrated in FIG. 9, the first classification pattern selection unit 106 has a priority 524 “8” corresponding to the classification pattern name 1021 “place name” and a priority 526 corresponding to the classification pattern name 1022 “price 2”. Read “4”. The first classification pattern selection unit 106 compares the read priority 524 “8” with the priority 526 “4”. Since the priority 524 “8” is higher than the priority 526 “4”, the classification pattern name 1021 The classification pattern indicated by “place name” is determined to be optimal.
When the priorities are also equal, the first classification pattern selection unit 106 selects one classification pattern using a method such as determining at random or determining in the order of registration of the classification patterns.
[0058]
The first classification pattern selection unit 106 adds a selection mark “◯” indicating that the classification is determined to be optimal to the classification pattern 701 in the classification pattern storage unit 103 as a selection mark 704 and writes the selection pattern “◯”. .
FIG. 15 shows classification pattern information 1100 when 1111 “◯” is added as a selection mark to the determined classification pattern name “place name”.
[0059]
1.1.7 Menu creation unit 107
The menu creation unit 107 extracts only items associated with message board information from the classification pattern selected by the first classification pattern selection unit, and creates a search menu using the extracted items as options. Details of the operation of the menu creation unit 107 will be described below with reference to the drawings.
The menu creation unit 107 extracts the classification pattern 701 including the selection mark 704 of “O” from the classification pattern information 700 stored in the classification pattern storage unit 103, and the message board identification information 713 from the extracted classification pattern 701. And items including small items to which message board identification information 714 is added are extracted. In addition, the menu creation unit 107 calculates the number of message board identification information 713 added to the item for each of the extracted items, and calculates the number of message board identification information 714 added to the small item included in the item. The calculated number of message board identification information 713 and the calculated number of message board identification information 714 are totaled, and the sum is obtained as the number of message board information added to the item.
In this way, the menu creation unit 107 generates at least one set of the extracted item and the number of message board information added to the item, and the generated at least one set of the item and the message board information Are output to the display unit 108.
[0060]
Here, the details of the operation of the menu creation unit 107 will be specifically described with reference to FIG.
First, the menu creation unit 107 extracts a classification pattern 1120 with a selection mark “◯” 1111. Next, the menu creation unit 107 includes items 1121 “Hokkaido”, 1122 “Tohoku”, 1123 “Kanto”, 1124 “Chubu”, 1125 “Kinki”, 1126 “China”, 1127 “Shikoku” included in the classification pattern 1120. Items 1123 “Kanto”, 1124 “Chubu”, 1125 “Kinki”, 1126 “China”, 1127 “Shikoku” including small items associated with message board identification information from the respective items Is extracted. In this example, there is no item to which message board identification information is added. The menu creation unit 107 identifies the message board added to the small items included in the five items 1123 “Kanto”, 1124 “Chubu”, 1125 “Kinki”, 1126 “China”, and 1127 “Shikoku” extracted in this way. The number of information is calculated for each item. In this way, the menu creation unit 107 generates five sets of the extracted item and the number of message board information added to the item. FIG. 16 shows five sets of the item 1201 generated by the menu creation unit 107 and the number 1202 of message board information. Next, the menu creation unit 107 outputs five sets of the extracted items and the number of message board information calculated for each item to the display unit 108.
[0061]
1.1.8 Display unit 108
The display unit 108 receives at least one set of items and the number of message board information from the menu creation unit 107, and based on at least one set of the received items and the number of message board information, the received items and At least one set of a bar graph having a length proportional to the number of received message board information and the number of received message board information is displayed as a search menu. The display unit 108 displays a cursor for selecting an item.
FIG. 17 shows an example of the search menu displayed by the display unit 108. In this figure, the search menu is composed of five sets of an item 1302, a bar graph 1303, and a number 1304 of message board information, and a cursor 1301 for selecting an item is displayed.
In addition, although the display part 108 is displaying the item, a bar graph, and the number of message board information, you may display an item and the number of message board information.
[0062]
When the display unit 108 receives “move up” from the input unit 109 in a state where the search menu is displayed on the display unit 108, the display unit 108 moves the cursor 1301 to the next item and displays the item. When “downward movement” is received, the cursor 1301 is moved to the next lower item and displayed.
When “execute” is received from the input unit 109, the display unit 108 selects the item indicated by the cursor 1301, and stores one message board identification information added to the selected item in the classification pattern storage unit 103. The message board information 260 identified by the one message board identification information read out from the classified pattern information 700 is read out from the data storage unit 101, and the read out message board information 260 is displayed.
When the display unit 108 receives the “downward movement” from the input unit 109 while the display unit 108 displays the message board information 260, the read message board identification information added to the selected item follows. Further, another message board identification information is read from the classification pattern information 700 stored in the classification pattern storage unit 103, and the message board information 260 identified by one read message board identification information is read from the data storage unit 101 and read. Message board information 260 is displayed.
[0063]
When the display unit 108 displays “message board information 260” and the display unit 108 receives “move up” from the input unit 109, the message board identification information before the read message board identification information added to the selected item is displayed. Further, another message board identification information is read from the classification pattern information 700 stored in the classification pattern storage unit 103, and the message board information 260 identified by one read message board identification information is read from the data storage unit 101 and read. Message board information 260 is displayed.
When the display unit 108 receives “execute” from the input unit 109 while the search menu shown in FIG. 17 is being displayed, the display unit 108 adds the item “Kanto” included in the classification pattern information. The read message board identification information “(1)” is read from the classification pattern storage unit 103, the message board information 201 identified by the read message board identification information “(1)” is read from the data storage unit 101, and the read message board is read. Information 201 is displayed. FIG. 19 shows a state in which the message board information 201 is displayed on the display unit 108. When the user presses the up cursor key 1401 and the down cursor key 1402 in this state, other message board information is read and displayed.
[0064]
1.1.9 Input unit 109
As shown in FIG. 18, the input unit 109 includes an up cursor key 1401, a down cursor key 1402, an execute key 1403, and a switch key 1404, and accepts user input.
When the up cursor key 1401 is pressed by the user while the search menu is displayed on the display unit 108, the input unit 109 outputs “move up” to the display unit 108. When the down cursor key 1402 is pressed by the user while the search menu is displayed on the display unit 108, the input unit 109 outputs “move down” to the display unit 108.
When the execution key 1403 is pressed by the user, the input unit 109 outputs “execute” to the display unit 108.
When the switch key 1404 is pressed by the user, the input unit 109 outputs “switch” to the second classification pattern selection unit 110.
The input unit 109 includes four up cursor keys 1401, a down cursor key 1402, an execute key 1403, and a switch key 1404. The functions of the four keys can be assigned to any key of a general computer keyboard. You may make it allocate.
[0065]
1.1.10 Second classification pattern selection unit 110
When the display unit 108 displays a search menu as shown in FIG. 17, the second classification pattern selection unit 110 is used to create another search menu when the user does not like the classification based on the search menu. It is done.
When receiving the “switch” from the input unit 109, the second classification pattern selection unit 110 detects the selection mark 704 of “◯” from the classification pattern information 700 stored in the classification pattern storage unit 103, and the detected selection mark The “◯” in 704 is changed to “●” indicating used, and is written in the classification pattern information 700.
In the classification pattern information 1100 shown in FIG. 15, “◯” 1111 is added to the selection mark of the currently selected classification pattern 1120. The second classification pattern selection unit 110 reads “◯” 1111 of this selection mark, changes the read selection mark to “●” indicating that it has been used, and writes it again into the classification pattern information 1100. FIG. 20 shows classification pattern information 1600 when “●” 1601 indicating used is attached to the selection mark.
[0066]
Next, the second classification pattern selection unit 110 selects an optimum classification pattern by the same method as the first classification pattern selection unit 106 from the classification patterns not marked with “●” indicating used in the selection mark. Taking FIG. 21 as an example, the second classification pattern selection unit 110 selects the classification pattern 1612 indicated by the classification pattern name 1611 “Price 2”.
The second classification pattern selection unit 110 puts “◯” on a selection mark indicating that the selected classification pattern is selected. FIG. 21 shows classification pattern information 1620 when a selection mark indicating that it has been selected is marked with “◯”. “◯” 1602 is attached to the classification pattern 1612 as a selection mark indicating that it has been selected.
[0067]
The second classification pattern selection unit 110, if there is a classification pattern that can be selected, that is, a classification pattern without a used mark “●”, every time the switch key 1404 is pressed many times, A classification pattern can be selected. In the case of the classification pattern information 1620 shown in FIG. 21, it can be switched three more times.
In this way, when the second classification pattern selection unit 110 selects a classification pattern, the menu creation unit 107 again uses the classification pattern information including the classification pattern with “◯” as a selection mark to select a search menu. The display unit 108 displays the search menu.
[0068]
1.2 Operation of search menu creation device 100
Here, the operation of the search menu creation device 100 will be described.
1.2.1 Search menu creation operation
Here, the operation in which the search menu creating apparatus 100 creates the search menu will be described with reference to the flowchart shown in FIG.
[0069]
The data feature point extraction unit 102 extracts feature points from the message board information 260 stored in the data storage unit 101, and writes the extracted feature points into the data storage unit 101 as feature point information 270 (step S1801). The associating unit 105 extracts the feature point identification information 271 from the feature point information 270 stored in the data storage unit 101 (step S1802), and extracts one feature point 272 included in the feature point information 270 (step S1803). Then, the extracted one feature point 272 is compared with the items included in the classification pattern information stored in the classification pattern storage unit 103 (step S1804), and if one feature point 272 matches the item, The extracted feature point identification information 271 is added to the item and associated (step S1805). Extraction, comparison, and association of feature points are repeated for all feature points included in the feature point information 270 (steps S1804 to S1806). Further, extraction of feature point identification information, extraction of feature points, comparison, and association are repeated for all feature point information included in the data storage unit 101 (steps S1802 to S1807). When the association is completed for all feature point information, the first classification pattern selection unit 106 calculates the number of items associated with the message board identification information for each classification pattern (step S1808), and sets it in advance. A classification pattern having the number of items close to the optimal number of items is selected as the optimal classification pattern (step S1809). Here, when there are a plurality of optimum classification patterns, the first classification pattern selection unit 106 further refers to the priority storage unit 104 and selects one of the selected classification patterns with the highest priority. A selection mark “◯” indicating selection is added to the selected classification pattern (step S1810). Next, the menu creation unit 107 creates a search menu using items included in the selected classification pattern as options (step S1811), and the display unit 108 displays the created search menu (step S1812).
[0070]
1.2.2 Operation when the switch key is pressed
Here, the operation in the case where the search key creation device 100 presses the switch key to create the search menu again will be described with reference to the flowchart shown in FIG.
In the flowchart shown in FIG. 23, steps S1811 and S1812 are the same as the steps denoted by the same reference numerals in the flowchart shown in FIG.
[0071]
When the switch key 1404 is pressed by the user, the input unit 109 outputs “switch” to the second classification pattern selection unit 110 to instruct switching of the search menu screen (step S1901), and the second classification pattern selection unit. 110 adds a selection mark “●” indicating used to the currently selected classification pattern (step S1902). Next, the second classification pattern selection unit 1903 selects the classification pattern having the number of items close to the preset optimum number of items from the unused classification patterns without the selection mark “●” indicating used. Is selected as the optimum classification pattern (step S1903). Here, when there are a plurality of optimum classification patterns, the second classification pattern selection unit 110 further refers to the priority storage unit 104 and selects one of the selected classification patterns with the highest priority. A selection mark “◯” indicating selection is added to the selected classification pattern (step S1904). Subsequently, the menu creation unit 107 creates a search menu using the classification pattern to which the selection mark “◯” is added, and the display unit 108 displays the search menu (steps S1811 to S1812).
[0072]
2. Embodiment 2
Hereinafter, a search menu creating apparatus 2100 according to another embodiment of the present invention will be described with reference to the drawings.
2.1 Configuration of Search Menu Creation Device 2100
FIG. 24 is a block diagram showing the configuration of the search menu creation apparatus 2100.
The search menu creation device 2100 includes a data storage unit 2101, an important word extraction unit 2102, an important word storage unit 2103, a classification pattern storage unit 2104, an association unit 2105, a classification pattern selection unit 2106, a menu creation unit 2107, a display unit 2108, An input unit 2109 is included.
[0073]
2.1.1 Data storage unit 2101
The data storage unit 2101 is configured by a magnetic disk device or the like. The data storage unit 2101 adds an identification number to document data sent via a network or the like, and stores the document data to which the identification number is added. The identification number is a number for specifying the document data. The identification numbers are assigned in the order in which the document data is received.
As shown in FIG. 25, the data storage unit 2101 stores document data 2201, 2202,. Document data 2201, 2202,... Are newspaper articles obtained through a network. Further, identification numbers “1” 2211, “2” 2212,... For identifying the document data are added to the document data 2201, 2202,.
[0074]
2.1.2 Important word extraction unit 2102
The keyword extraction unit 2102 reads the document data stored in the data storage unit 2101, performs morphological analysis on the read document data, and decomposes the document data into at least one morpheme.
When the document data is written in Japanese, the keyword extraction unit 2102 extracts at least one independent word (in English, corresponding to a full word or a content word) from the decomposed at least one morpheme. To do. If the document data is written in English, the keyword extraction unit 2102 has an unnecessary word list (stop words in English) and registers words that are not to be an important word in the unnecessary word list. . Specifically, prepositions, be verbs, and the like are registered. Next, morphemes registered in the unnecessary word list are excluded from the decomposed morphemes.
[0075]
Next, the important word extraction unit 2102 counts the number of times the same independent word appears in the extracted at least one independent word, and a predetermined number of independent words in order from the independent word from which the largest number of independent words has been counted. And a predetermined number of extracted independent words are set as important words as an example of feature points.
The important word extraction unit 2102 reads the identification number added to the document data stored in the data storage unit 2101.
Further, the keyword extraction unit 2102 outputs the read identification number and a predetermined number of independent words as the keyword to the keyword storage unit 2103.
[0076]
The keyword extraction unit 2102 extracts the keyword and reads the identification number for all the document data stored in the data storage unit 2101, as described above, The predetermined number of independent words is output to the important word storage unit 2103.
Independent words here are words that convey a concept or an image that have a substantial meaning, such as most nouns, adjectives, verbs, and adverbs.
The operation of the keyword extraction unit 2102 will be described below using the document data 2201 shown in FIG. 25 as an example.
[0077]
The keyword extraction unit 2102 performs morphological analysis on the document data 2201 stored in the data storage unit 2101 and decomposes the document data 2201 to obtain a plurality of words as shown in FIG. In the figure, “/” represents a word break. Next, the important word extraction unit 2102 extracts a plurality of independent words as important word candidates from the plurality of words shown in FIG. 26, and calculates the number of times the same independent word appears in the extracted plurality of independent words. Count. FIG. 27 shows 10 words that are extracted independent words and the number of appearances of those words. Here, the important word extraction unit 2102 extracts only five independent words having a high frequency of appearance from ten words that are independent words extracted as important word candidates, and sets them as important words. In this way, five words “sunny”, “weather”, “Osaka”, “Kyoto”, and “Kobe” are extracted as important words.
In this embodiment, the keyword extraction unit 2102 extracts the keyword using only the number of occurrences of the word in the document data. However, the present invention is not limited to this.
[0078]
The keyword extraction unit 2102 may determine the keyword based on the appearance position of the word. For example, a word appearing at the beginning of a title or text in document data may be regarded as an important word.
Further, the important word extraction unit 2102 may determine an important word according to the role of the word. For example, morphological analysis is performed on document data, morphemes are extracted, syntax analysis is performed on the extracted morphemes to clarify the sentence structure of the document data, and a certain word is the subject in the sentence structure. If the word is a subject, it may be regarded as an important word.
[0079]
Further, the important word extraction unit 2102 compares the number of appearances of a certain word in general document data with the number of appearances of the word in the document data to be searched, so that the important word of the word is obtained. It may be. Specifically, the important word extraction unit 2102 regards the word as an important word when a word with a small number of appearances in general document data appears frequently in the document data to be searched. May be.
In this embodiment, the number of important words is 5. However, other numbers such as 4, 3, 6, 7 can be used. Further, instead of a fixed number, all independent words that are equal to or more than a predetermined number of appearances may be extracted, and the extracted independent words may be used as important words.
[0080]
2.1.3 Important word storage unit 2103
The important word storage unit 2103 receives the identification number and a predetermined number of important words from the important word extraction unit 2102 for each document data, and stores the received identification number and the predetermined number of important words as important word information 2530. Since the important word storage unit 2103 receives the same number of identification numbers as the number of document data stored in the data storage unit 2101 and a predetermined number of important words, the important word storage unit 2103 stores the identification number in the data storage unit 2101. The same number of important word information 2530 as the number of document data being stored is stored. The keyword storage unit 2103 is specifically composed of a memory or the like.
FIG. 28 shows the configuration of the keyword information 2530. The important word information 2530 includes important word identification information 2531 and a predetermined number of important words 2532. Important word identification information 2531 is the received identification number, and a predetermined number of important words 2532 are the received predetermined number of important words.
Here, the predetermined number is extracted when the important word extraction unit 2102 counts the number of times the same independent word appears, and extracts a predetermined number of independent words in order from the independent word that has been counted the most. The number of independent words.
[0081]
FIG. 29 shows an example of important word information 2530 stored in the important word storage unit 2103. As shown in this figure, the important word storage unit 2103 stores important word information 2506, 2516,..., And the important word information 2506 includes important word identification information 2521 and important words 2501-2505. The important word information 2516 includes important word identification information 2522 and important words 2511 to 2515.
Here, the important words 2501 to 2505 are important words extracted from the document data 2201, respectively, and the important words 2511 to 2515 are important words extracted from the document data 2202, respectively. The important word identification information 2521 has the same content as the identification number 2211 of the document data 2201, and the important word identification information 2522 has the same content as the identification number 2212 of the document data 2202. Accordingly, the important word information 2506 corresponds to the document data 2201, and the important word information 2516 corresponds to the document data 2202.
[0082]
2.1.4 Classification pattern storage unit 2104
The classification pattern storage unit 2104 stores classification pattern information 2700 for classifying document data with keywords. Specifically, the classification pattern storage unit 2104 is configured by a magnetic disk device or the like.
The classification pattern information 2700 includes at least one classification pattern 2701 as shown in FIG.
The classification pattern 2701 includes a selection mark 2711, a classification pattern number 2712, a classification viewpoint name 2713, a document data correspondence number 2714, and at least one classification item 2715. The classification item 2715 includes a classification item name 2721, a document data number 2722, The document data identification number 2723 and at least one keyword 2724 are included.
[0083]
The selection mark 2711 is the same as the selection mark 704, and a description thereof will be omitted.
The classification pattern number 2712 is a number for identifying the classification pattern 2701.
The classification viewpoint name 2713 is a name representing the classification pattern 2701.
The document data correspondence number 2714 is the number of document data types identified by all the document data identification numbers 2723 included in the classification pattern 2701.
The classification item name 2721 is a name representing the classification item 2715.
The document data number 2722 is the number of document data identification numbers included in the classification item 2715.
The document data identification number 2723 is an identification number for identifying document data stored in the data storage unit 2101.
The keyword 2724 is used for associating the classification item with the document data.
[0084]
FIG. 31 shows classification pattern information 2600 as an example of classification pattern information 2700 stored in the classification pattern storage unit 2104. As shown in this figure, the classification pattern storage unit 2104 stores classification pattern information 2600, and the classification pattern information 2600 includes a classification pattern 2601, a classification pattern 2602, a classification pattern 2603, and so on. ing.
In the classification pattern 2601, “8 regions in Japan” 2611 is a classification viewpoint. “1” 2612 is a classification pattern number for identifying a classification pattern. The classification pattern 2601 includes classification items 2631, 2632, 2633, 2634, 2635, 2636, 2637, and 2638.
In the classification item 2631, “Hokkaido” 2621 is a classification item name, “Hokkaido” 2641, “Sapporo” 2642, “Asahikawa” 2643, “Hakodate” 2644, “Kushiro” 2645, “Otaru” 2646, “Tomakomai” 2647 is a keyword.
Similarly, the classification item 2632 includes a classification item name and a plurality of keywords. The same applies to the classification items 2633, 2634, 2635, 2636, 2637, and 2638.
[0085]
2.1.5 Corresponding part 2105
(1) Correspondence between key words, classification patterns and classification items
The association unit 2105 reads the keyword “sunny” 2501 from the keyword information 2506 stored in the keyword storage unit 2103.
Next, the associating unit 2105 reads the keyword “Hokkaido” 2641 that constitutes the classification item 2631 included in the classification pattern 2601 in the classification pattern information 2600 stored in the classification pattern storage unit 2104, and the read important word “Sunny” 2501 is compared with the keyword “Hokkaido” 2641. Since the keyword “Hokkaido” 2641 and the keyword “sunny” 2501 do not match, the associating unit 2105 next reads the keyword “Sapporo” 2642 that constitutes the classification item 2631, and the keyword “sunny” 2501 and the keyword “ Compare with Sapporo 2642. Similarly, the keywords constituting the classification item 2631 are sequentially read out until a keyword matching the important word “sunny” 2501 is found, and the read keyword and the important word “sunny” 2501 are compared.
[0086]
None of the plurality of keywords constituting the classification item 2631 matches the important word “sunny” 2501. Next, the associating unit 2105 sequentially reads out the keywords and compares them with the keyword “sunny” 2501 until a keyword matching the keyword “sunny” 2501 is found for a plurality of keywords constituting the classification item 2632. I do.
None of the plurality of keywords constituting the classification item 2632 matches the important word “sunny” 2501, and therefore the associating unit 2105 relates to the classification items 2633 to 2638 until a keyword matching the important word “sunny” 2501 is found. For a plurality of keywords constituting each classification item, the keyword reading is sequentially performed and a comparison with the keyword “sunny” 2501 is performed.
[0087]
The associating unit 2105 could not find a keyword that matches the important word “sunny” 2501 in the classification pattern 2601. Next, for the classification patterns 2602, 2603,..., The keyword reading is compared with the keyword “sunny” 2501. As a result, the associating unit 2105 cannot find a keyword that matches the keyword “sunny” 2501 in the classification pattern information 2600, and the associating unit 2105 stores the keyword in the keyword storage unit 2103. The important word “weather” 2502 is read from the important word information 2506, and the keyword matching the read important word “weather” 2502 is searched from the classification pattern information 2600. As a result, the associating unit 2105 includes the keyword “weather” 2502 among the keywords included in the sixth classification item in the classification pattern indicated by the classification pattern number (14) (not shown in FIG. 31). A keyword matching with was detected. Therefore, the associating unit 2105 stores the keyword “weather” 2502, the group of the classification pattern number (14), and the sixth classification item in association with each other.
[0088]
Similarly, the associating unit 2105 sequentially reads the important words “Osaka” 2503, “Kyoto” 2504, and “Kobe” 2505 included in the important word information 2506 stored in the important word storage unit 2103 and reads the important words If keywords matching the words “Osaka” 2503, “Kyoto” 2504, and “Kobe” 2505 are searched from the keywords included in the classification pattern information 2600, and a matching keyword is found, the keyword, classification pattern number, The classification items are stored in association with each other.
In this manner, when the association between all the important words included in one important word information stored in the important word storage unit 2103 and all the keywords included in the classification pattern information 2600 is completed, FIG. As shown, the association unit 2105 stores the classification pattern number (14) 2821 and the classification item (6) 2822 in association with each other for the important word “weather” 2802 and stores the important word “Osaka” 2803. , Classification pattern number (1) 2831, classification item (5) 2832, classification pattern number (12) 2833, and classification item (2) 2834 are stored in association with each other. Number (1) 2841 and classification item (5) 2842 are stored in association with each other, and for important word “Kobe” 2805, classification pattern number (1) 28 1 and classification item (5) 2852 and in association with each other is stored. It should be noted that no association has occurred for the important word “sunny” 2801.
[0089]
(2) Duplicate deletion of pairs
As shown in FIG. 32, the group in which the classification pattern number (1) and the number (5) for identifying the classification item name are associated has appeared three times. As shown in FIG. 33, the association 2861 between the classification pattern number (14) and the number (6) for identifying the classification item name, the classification pattern number (1), and the classification item name are identified. The association 2862 with the number (5) and the association 2863 with the classification pattern number (12) and the number (2) for identifying the classification item name are stored.
[0090]
(3) Association of document identification numbers
The association between the classification pattern number and the number for identifying the classification item name shown in FIG. 33 is performed using the important words extracted from the document data 2201. Therefore, the association unit 2105 As shown in FIG. 34, in order to associate the classification item 2635 in the classification pattern 2601 with the document data and the identification number “(1)” of 2201, the identification number “(1)” 2901 is added to the classification item 2635.
[0091]
(4) Writing the number of document data
The association unit 2105 calculates the number of identification numbers of the associated document data for each classification item, and writes it in the classification item of the classification pattern for each classification item.
Also, the associating unit 2105 calculates the number of document data types associated with the classification pattern for each classification pattern, and calculates the calculated number of document data types for each classification pattern. Is stored in the classification pattern. Here, calculation is performed assuming that the document data associated with each other is duplicated.
FIG. 35 shows the classification pattern 2601 after the association is completed as described above. In this figure, keywords corresponding to classification item names are not shown.
In this figure, reference numerals 3113 to 3118 are identification numbers of the associated document data, reference numerals 3102 to 3109 are the document data numbers associated with the respective classification items, and reference numeral 3101 is the document data correspondence number. is there. Since the document data identification number (3) is associated with the three classification items, the sum of the number of document data associated with the classification item is 14, but if the duplicate document data is excluded, the classification pattern The number of types of document data associated with is 12, and the number of document data correspondence is 12.
[0092]
2.1.6 Classification pattern selection unit 2106
Since the classification pattern selection unit 2106 selects a classification pattern using the association result of the document data stored in the classification pattern information, the classification pattern evaluation unit 2106 evaluates the classification pattern using the evaluation formula (Formula 1) shown in FIG. I do.
In (Expression 1), P is an evaluation value of the classification pattern, and n in the first term of (Expression 1) is the number of document data associated with the classification pattern. The second term m in (Expression 1) is the number of classification item names associated with the document data. The function f (x) is a function having the number of classification items as an argument as shown in FIG. 36 (b), and takes a maximum value of 1 when x = 5 and takes a minimum value of 0 when x = 0. When x = 10, the minimum value is 0. The square of σ in the third term of (Equation 1) is the variance of the number of associated document data. α, β, and γ are constants.
[0093]
The first term of (Expression 1) indicates that the evaluation value of the classification pattern increases as the number of document data associated with the classification pattern increases. The second term indicates that the evaluation value of the classification pattern increases as the number of classification items associated with the document data in the classification pattern approaches five. The third term indicates that the evaluation value of the classification pattern increases as the variance of the number of document data associated with the classification pattern decreases.
An evaluation formula (formula 1) is applied to the classification pattern 2601 shown in FIG. 35 to calculate the evaluation value of the classification pattern. Here, the constants α, β, and γ are each 1. Since the document data correspondence number is 12, the value of the first term of the evaluation formula (Formula 1) is 12.
Among the classification items of the classification pattern 2601, there are six classification items associated with the document data. Therefore, when the function f (x) shown in FIG. The second term is 0.8.
Next, with respect to the third term of the evaluation formula (Formula 1), only the classification items associated with the document data are targeted, and first, (1 + 2 + 3 + 5 + 2 + 1) /6=2.33 as the average of the number of corresponding document data. Get. Next, as the variance of the number of corresponding document data, σ2 = (1-2.33)2+ (2-2.33)2+ (3-2.33)2+ (5-2.33)2+ (2-2.33)2+ (1-2.33)2= 11.33 is obtained. Thus, the third term becomes 1 / (1 + 11.33) = 0.08.
Therefore, the evaluation value of the classification pattern 2601 is 12 + 0.8 + 0.08 = 12.88.
Here, for convenience, the values of the constants α, β, and γ are each 1. However, these constants are constants for balancing each term, and appropriate values can be set.
[0094]
As described above, according to the first term of the evaluation formula (Formula 1), it is possible to create a search menu option preferentially from a classification pattern associated with a large amount of input data, and to create an effective search menu. is there. According to the second term of the evaluation formula (Formula 1), menu options can be created preferentially from a classification pattern with an appropriate number of items associated with input data, and an effective search menu can be created. . According to the third term of the evaluation formula (Formula 1), it is possible to preferentially create menu choices from a classification pattern in which the number of input data associated with each item is as uniform as possible, thereby creating an effective search menu. There is.
As described above, the classification pattern selection unit 2106 calculates the evaluation value of the classification pattern for every classification pattern, and selects the classification pattern having the maximum evaluation value as the optimum classification pattern.
The classification pattern selection unit 2106 adds a selection mark “◯” to the classification pattern selected as the optimal classification pattern.
[0095]
2.1.7 Menu creation unit 2107
The menu creation unit 2107 extracts the classification pattern to which the selection mark “◯” has been added by the classification pattern selection unit 2106 from the classification pattern storage unit 2104, and the classification viewpoint name and the document data identification number are extracted from the extracted classification pattern. And extracting at least one set of the classification item name included in the extracted classification item and the number of document data associated with the extracted classification item, and the classification viewpoint name and The extracted at least one set is output to the display unit 2108. If the classification pattern 2601 shown in FIG. 35 is selected, the menu creation unit 2107 creates a set of a classification viewpoint name, a classification item name, and the number of document data, as shown in FIG.
[0096]
2.1.8 Display unit 2108
The display unit 2108 receives the classification viewpoint name, the classification item name, and at least one set of the number of document data from the menu creation unit 2107. The received classification viewpoint name, the received classification item name, a bar graph having a length proportional to the received document data number, and at least one set of the received document data number are displayed as a search menu. The display unit 2108 displays a cursor for selecting a classification item.
FIG. 37B shows an example in which the search menu created by the display unit 2108 is displayed. In this figure, a cursor 3201 for selecting input data is displayed.
[0097]
When the display unit 2108 receives “move up” from the input unit 2109, it moves the cursor 3201 to the next higher category and displays it. When it receives “move down” from the input unit 2109, the display unit 2108 displays the cursor 3201. Move to the next lower category and display.
When the display unit 2108 receives “selection” from the input unit 2109, the display unit 2108 reads out the document data identification number included in the classification item indicated by the classification item name indicated by the cursor 3201, and identifies it by the read document identification number. The read document data is read from the data storage unit 2101 and the read document data is displayed.
When the display unit 2108 receives “selection” from the input unit 2109 in a state where the search menu shown in FIG. 37B is displayed, the document data identification included in the classification item indicated by the classification item name “Kinki” is displayed. The number (1) is read, and the document data 2201 identified by the read document identification number (1) is read from the data storage unit 2101 and displayed.
The display unit 2108 may display at least one set of the received classification item name and the received number of document data as a search menu.
[0098]
2.1.9 Input unit 2109
The input unit 2109 receives user input. As shown in FIG. 38, the input unit 2109 includes an up cursor key 3301, a down cursor key 3302, and a selection key 3303.
When the up cursor key 3301 is operated by the user, “upward movement” is output to the display unit 2108, and when the down cursor key 3302 is operated by the user, “downward movement” is output to the display unit 2108.
When the selection key 3303 is operated by the user, the input unit 2109 outputs “selection” to the display unit 2108.
[0099]
2.2 Search Menu Creation Operation of Search Menu Creation Device 2100
Here, the operation of creating the search menu by the search menu creating apparatus 2100 shown in FIG. 24 will be described with reference to the flowchart shown in FIG.
The keyword extraction unit 2102 extracts the keyword for each document data from the document data stored in the data storage unit 2101, and the keyword storage unit 2103 stores the extracted keyword as keyword information. (Step S3401). The associating unit 2105 extracts important word identification information added to one important word information from the important word storage unit 2103 (step S3402), and selects one of the important word information specified by the extracted important word identification information. One important word is extracted (step S3403), and the extracted important word is compared with the keyword included in the classification pattern stored in the classification pattern storage unit 2104 (step S3404). A corresponding classification item is extracted (step S3405). The associating unit 2105 repeats the comparison and extraction for all the important words extracted from the important word information specified by the extracted important word identification information (steps S3404 to S3406). The associating unit 2105 deletes the duplicated combination of the classification pattern and the classification item, and writes the important word identification information to the classification item included in the extracted classification pattern, thereby including it in the classification pattern. The classified item is associated with the document data (step S3407). Furthermore, the associating unit 2105 repeats the above comparison and association for all the document data (steps S3402 to S3408). When the association is completed for all the document data, the classification pattern selection unit 2106 calculates the evaluation value of each classification pattern using (Equation 1) (step S3409), and determines the classification pattern of the maximum evaluation value. Select (step S3410). Next, the menu creation unit 2107 creates a search menu using the classification item of the selected classification pattern as an option (step S3411), and the display unit 2108 displays the created search menu (step S3412).
[0100]
3. Other embodiments
Although the present invention has been described based on the above embodiment, it is needless to say that the present invention is not limited to the above embodiment. That is, the following cases are also included in the present invention.
[0101]
(1) In the present embodiment, after the user selects a search menu option, the input data associated with the item corresponding to the search menu option selected by the user is sequentially displayed. If there is a large amount of input data associated with the item corresponding to, a search menu may be further created based on the input data associated with the item corresponding to the selected option. For example, if the option “Kanto” is selected by the user in the search menu shown in FIG. 17, the item “Kanto” corresponding to the option “Kanto” has a plurality of small items “Tochigi” as shown in FIG. ”,“ Ibaraki ”,“ Chiba ”,“ Gunma ”,“ Saitama ”,“ Tokyo ”,“ Yamanashi ”,“ Kanagawa ”, and the menu creation unit 107 copies these multiple sub-items“ Tochigi ”. , “Ibaraki”, “Chiba”, “Gunma”, “Saitama”, “Tokyo”, “Yamanashi”, “Kanagawa”, “Chiba”, “Gunma”, “ Five sub-items “Saitama”, “Tokyo”, and “Kanagawa” are extracted, and the extracted five sub-items and the number of message board identification information included in these sub-items are output to the display unit 108 and displayed. As shown in FIG. 40, the unit 108 includes five extracted small items. The number of the message board identification information contained in these small items, displaying the cursor 1301. When the user selects one small item from the search menu displayed in this figure, the display unit 108 may sequentially display the message board information included in the selected small item.
[0102]
(2) After an option is selected from the search menu by the user, input data included in an item corresponding to the option selected by the user is associated with a classification pattern that is not selected again and newly input. A search menu may be created using the classification pattern associated with the data.
For example, in the first search menu, a hierarchical place name search menu is displayed, the user selects one place name option, and only the input data included in the item associated with the selected place name option is displayed. Again, associate with another classification pattern without a selection mark, and select one classification pattern from the classification patterns associated with these input data by the same method described in the above embodiment. Then, another search menu may be created and displayed using the selected classification pattern. In this way, a search menu with high search efficiency can be created even when a large amount of input data exists.
[0103]
(3) Depending on the number of input data associated with each classification pattern, it may be determined whether to display input data or create the next search menu again.
For example, if the number of input data associated with each classification pattern is less than or equal to a predetermined value, the input data is displayed, and if it is greater than the predetermined value, the next search menu is created again. Also good. In this way, the number of options displayed on one search menu can be set close to a predetermined value, and a search menu with higher search efficiency can be created.
[0104]
Specifically, in the search menu creation device of the above embodiment, the input unit 109 accepts selection of one option from the displayed search menu from the user, and the menu creation unit 107 further includes the input unit 109. When the selection of the user is accepted, a search menu is created using the small items included in the items corresponding to the choices accepted as selections based on predetermined criteria, or the items When it is determined whether to display the input data associated with the item, and when it is determined to create a search menu, at least one input data is associated with the item corresponding to the option for which the selection is accepted At least one small item is extracted, and a search menu using the extracted small item as an option is generated. The display unit 108 further displays a search menu generated using the small items as options when the menu creation unit 107 determines to create a search menu, and when it is determined to display input data, the display unit 108 The input data associated with the item may be read from the data storage unit 101 and the read input data may be displayed.
[0105]
Here, the predetermined criterion is that the input data is displayed if the number of input data associated with the selected classification pattern is equal to or smaller than the predetermined value, and if the number is larger than the predetermined value, the search menu is displayed. Is a criterion for generating
[0106]
Further, when the next search menu is created again, as described in (2) above, after one option is selected from the search menu by the user, it corresponds to one option selected by the user. The input data included in the item is again associated with a classification pattern without a selection mark indicating used, and a search menu is created using the classification pattern newly associated with the input data. Also good.
[0107]
The input unit 109 accepts selection of one option from the displayed search menu from the user, and the associating unit 105 further inputs data associated with an item corresponding to the option for which the selection has been accepted. Each item constituting another classification pattern excluding the classification pattern including the item corresponding to the option for which the selection is accepted, canceling all the associations between the input data and the items The first classification pattern selection unit 106 associates the selected selection data with the extracted selection data based on the predetermined criterion from the other classification patterns excluding the classification pattern including the item corresponding to the selection accepted. Then, at least one classification pattern is selected, and the menu creation unit 107 is based on the at least one classification pattern. It generates a search menu, the display unit 108 may display a search menu that is generated. For example, after the user selects the option “Kanto” displayed in the search menu, the input data associated with “Kanto” is again associated with the classification pattern other than the place name, and the above-described operation is performed from the classification pattern other than the place name. In the same manner as in the above, it is possible to select one classification pattern “price 2” and generate and display a search menu using options included in the classification pattern “price 2”.
[0108]
(4) In the first embodiment, the classification pattern may include an item including a plurality of hierarchies. For example, the detailed item may be further subordinate to the small item, and the detailed item may be subordinate to the detailed item. Correspondence unit 105 associates input data with items composed of a plurality of hierarchies, and first classification pattern selection unit 106 selects a classification pattern using items composed of a plurality of hierarchies associated with input data. Then, the menu creation unit 107 may create a search menu using the selected classification pattern.
[0109]
In addition, the menu creation unit 107 creates a search menu using items included in the selected classification pattern as options, and one option is selected by the user. Next, the menu creation unit 107 selects the selected menu. A search menu is created using the sub-items subordinate to the item corresponding to the option as an option, and one option is selected by the user. Further, the menu creating unit 107 is subordinate to the sub-item corresponding to the selected option. Create a search menu with detailed items to be selected as options. Thus, a search menu consisting of a plurality of hierarchies may be created based on items consisting of a plurality of hierarchies.
[0110]
Further, as described in (3) above, when determining whether to display input data or create the next search menu again according to the number of input data associated with each classification pattern, When it is determined that the next search menu is to be created again, a search menu consisting of a plurality of hierarchies is created as described above, and when it is determined that the input data is displayed, it corresponds to the selected option. The input data associated with the item and all items subordinate to the item may be sequentially displayed.
[0111]
In addition, the items included in the classification pattern form a hierarchical structure as described above, and the associating unit 105 stores the item corresponding to the feature point for each extracted feature point in the classification pattern storage. A search is performed from step 103, the searched item is associated with the input data including the feature point, and the input unit 109 receives selection of one option from the displayed search menu from the user. The search menu creation device further includes a determination unit, an item menu generation unit, an input data menu display, and a repetition control unit. The determination unit receives the user's selection from the input unit 109. In this case, it is determined whether to create a search menu or display input data based on a predetermined criterion, and the item menu generation unit determines that the determination unit generates a search menu. Extracting an item associated with input data from items subordinate to the item corresponding to the option accepted for selection, generating a search menu using the extracted item as an option, and the input data menu unit Is determined to display the generated search menu and display the input data when it is determined by the determination unit to create a search menu. The input corresponding to the option for which the selection is accepted and the input data associated with all the items subordinate to the item are read from the data storage unit 101, the read input data is displayed, and the repetition control is performed. Until the input data menu display unit displays the read input data, the input unit 109 accepts selection of one option, the determination by the determination unit, and the search menu by the item menu generation unit. The input unit 109, the determination unit, the item menu generation unit, and the input data menu display unit may be controlled to repeat generation and display of the search menu by the input data menu display unit.
[0112]
Further, the predetermined criterion in the determination unit is that the number of input data associated with an item corresponding to the option for which the selection is accepted and all items subordinate to the item is equal to or less than a predetermined value. If there is, input data may be displayed, and if it is larger than a predetermined value, it may be a criterion for generating a search menu.
[0113]
(5) Furthermore, a classification pattern editing unit is provided so that the user can newly register a classification pattern in the classification pattern storage unit 103 or delete a classification pattern stored in the classification pattern storage unit 103. You may do it.
In order to register the classification pattern, the input unit 109 receives an input of the classification pattern by the user, and the display unit 108 displays the classification pattern for which the input has been received. Next, the input unit 109 receives an instruction to register a classification pattern by the user, and the classification pattern editing unit registers the classification pattern for which the input has been received in the classification pattern storage unit 103.
In order to delete the classification pattern, the display unit 108 displays the classification pattern stored in the classification pattern storage unit 103, and the input unit 109 accepts designation of the classification pattern to be deleted by the user. Next, the input unit 109 receives an instruction to delete the classification pattern from the user, and the classification pattern editing unit deletes the classification pattern designated by the user from the classification pattern storage unit 103.
Here, the operations of registering and deleting classification patterns are collectively referred to as editing.
This allows you to easily register classification patterns when new classification criteria are created or new technical terms are created, and old classification patterns that are no longer used can be easily deleted. It is possible for the user to register only his / her favorite classification pattern.
[0114]
(6) Furthermore, a synonym dictionary unit comprising a phrase and its synonyms is provided, and when the associating unit 105 associates feature points of input data with items of classification patterns, feature points are extracted from the synonym dictionary unit using the feature points. And the detected feature point synonym may be associated with the classification pattern item.
In this way, by associating feature points of input data with classification pattern items via synonyms, feature points can be associated with classification pattern items similar to feature points, and input data can be associated with classification patterns. The number of cases that cannot be attached can be reduced.
[0115]
(7) Furthermore, when the switching key 1404 is pressed by the user, it is considered that the classification pattern used at that time does not match the user's preference. You may make it memorize | store in the memory | storage part 104. FIG. Specifically, when the switch key 1404 is pressed, a value obtained by subtracting 1 from the priority value of the classification pattern that has been used may be stored in the priority storage unit 104 as a new priority. .
Thus, the priority of the classification pattern can be learned according to the user's preference.
[0116]
(8) In the first embodiment, when determining the optimum classification pattern, first, the number of items is evaluated, and further, the evaluation is performed based on the priority. You may evaluate by, and may also evaluate by the number of items. Alternatively, an evaluation standard may be created by combining these two evaluations, and an optimum classification pattern may be determined using the evaluation standard created in this way.
Further, an optimal classification pattern may be determined using only the priority.
[0117]
(9) In the first embodiment, the data feature point extraction unit 102 extracts feature points from the message board information and writes them to the data storage unit 101. However, the following may be used.
The data storage unit 101 stores input data as a relational database. The relational database is a collection of input data based on a table, and the table includes at least one row and at least one column. A row is composed of a sequence of at least one value, and a column is a collection of at least one value having the same data type. One value in one column is the minimum unit of input data that can be selected from the table or updated. The data type includes a character string type, a numeric type, and the like. A column having a character string type data type is a collection of character strings, and a column having a numeric data type is a collection of numeric values.
Here, each line corresponds to the message board information 260 of the above embodiment.
The associating unit 105 extracts at least one value from the sequence of at least one value constituting one row stored in the relational database in the data storage unit 101, and characterizes the extracted at least one value. Let it be a point. In this case, the data feature point extraction unit 102 becomes unnecessary.
The purchase transfer distinction 262, the address 263, the information provider name 264, the age 265, and the occupation 266 that constitute the message board information 260 correspond to the above-mentioned relational database columns.
[0118]
(10) In the first embodiment, the message board information 260 is associated with the item 711 included in the classification pattern 701 on the basis of the message board information 260, but based on the item 711 included in the classification pattern 701. Thus, the message board information 260 and the item 711 may be associated with each other.
In this case, the associating unit 105 sequentially reads items included in each classification pattern from the classification pattern storage unit 103, sequentially reads out message board information from the data storage unit 101, and for each read message board information, the message board information Extracting at least one feature point included in the image, determining whether the read item matches the extracted feature point, and reading the item and the extracted feature point; Are determined to match, the read item is associated with the message board information including the feature point that matches the item.
[0119]
(11) In the second embodiment, the number of document data associated with the classification pattern as three evaluation elements, the number of classification item names associated with the document data, and the associated document data The evaluation value of each classification pattern is calculated using (Equation 1) including variance, and the classification pattern with the highest evaluation value is selected. However, only the number of document data associated with the classification pattern is document data. Assuming that the evaluation value of each classification pattern is calculated using an evaluation formula that includes only the number of classification item names associated with or the distribution of the associated document data, and the classification pattern with the highest evaluation value is selected. Also good. Alternatively, an evaluation value obtained by combining two of these evaluation elements may be used to calculate an evaluation value of each classification pattern and select a classification pattern.
[0120]
(12) In the first embodiment, the user selects one item from the search menu, but the user may select a plurality of items from the search menu. In this case, the input unit 109 further includes a plurality of designation keys, and when the plurality of designation keys are operated by the user while the search menu is displayed on the display unit 108, the display unit 108 is moved by the cursor 1301. The displayed item is highlighted. The highlighted item indicates that this item has been selected by the user. When the user further moves the cursor 1301 upward or downward using the up cursor key 1401 or the down cursor key 1402 to position the cursor 1301 in another item of the search menu, and the user operates the plurality of designation keys. The display unit 108 reverse-displays the item indicated by the cursor 1301. In this way, a plurality of items are selected by the user. Next, when the execution key 1403 is operated by the user, the display unit 108 reads the input data associated with the selected items from the data storage unit 101 and displays the read input data.
In addition, as described above, when a plurality of items are selected by the user, as described in (1) and (2) above, input data associated with the selected items is used. Further, a search menu may be created and displayed.
The same applies to the second embodiment.
[0121]
(13) In the first embodiment, the first classification pattern selection unit 106 and the second classification pattern selection unit 110 select one classification pattern, but the first classification pattern selection unit 106 or the second classification pattern selection unit 106 The classification pattern selection unit 110 may select a plurality of classification patterns. For example, the first classification pattern selection unit 106 may calculate the number of items associated with the input data and select a plurality of items for which a value closest to the number of appropriate options 6 is calculated. . As described above, when the first classification pattern selection unit 106 or the second classification pattern selection unit 110 selects a plurality of classification patterns, the menu creation unit 107 responds to input data from the selected plurality of classification patterns. Extract attached items and create a search menu with the extracted items as options.
The same applies to the second embodiment.
[0122]
(14) As one embodiment, a program for executing the above-described procedure by a computer is recorded on a computer-readable recording medium such as a floppy disk and transferred, or the program is communicated It may be easily implemented by another independent computer system by transferring it through a line.
[0123]
【The invention's effect】
  As described above, the present inventionA search menu creation device for creating a search menu including options used for searching for a plurality of input data, a data storage means having a storage area for storing a plurality of input data, and a plurality of search menu options Classification pattern storage means in which a plurality of classification patterns composed of the above items are stored in advance, receiving means for receiving a plurality of input data, writing means for writing the received plurality of input data to the data storage means, Association means for associating each of the plurality of input data written in the data storage means with an item included in any of the plurality of classification patterns stored in advance in the classification pattern storage means; and the classification pattern Each item constituting the classification pattern for each of a plurality of classification patterns stored in advance in the storage means Item that constitutes the selected classification pattern, and the classification pattern selection means for selecting the classification pattern based on the variance of the input data calculated from the counted value A menu extracting unit that extracts an item associated with the input data, generates a search menu using the extracted item as an option, and a display unit that displays the search menu generated by the menu extracting unit. .
  According to this configuration, a plurality of classification patterns composed of a plurality of items that can serve as search options are prepared in advance, and the number of input data associated with each item among the plurality of prepared classification patterns is as uniform as possible. It is possible to automatically select priority classification patterns and select items included in this priority classification pattern automatically as a choice to generate a search menu, so multiple written inputs This has the effect of making it possible to create a search menu that is optimal for searching data.
[0124]
  TheAnd a display unit for displaying the search menu generated by the menu extraction unit.SoThe generated search menu is displayed.AndThe user can view the generated search menu.
[0125]
  TheAnd receiving means for receiving a plurality of input data from the outside, and writing means for writing the received plurality of input data to the data storage means.SoThere is an effect that a search menu can be generated based on a plurality of input data received from the outside.
[0126]
Here, the data storage means stores a data identifier for identifying each input data, and the associating means sequentially reads the input data from the data storage means, and inputs the input data for each read input data. A feature point extraction unit for extracting feature points included in the data; an item search unit for searching for an item corresponding to the feature point from the classification pattern storage unit for each of the extracted feature points; and the searched item In addition, a data association unit for adding a data identifier for identifying the input data may be included.
According to this configuration, since the input data and the classification pattern are associated with each other using the feature points extracted from the input data, there is an effect that a menu corresponding to the feature points extracted from the input data can be created.
[0127]
Here, each input data stored in the data storage means is document data, and the feature point extraction unit includes a data reading element for sequentially reading the document data from the data storage means, and the read document data A morphological analysis element that performs morpheme analysis on each document data and decomposes it into morphemes for each document data, and extracts important words from the decomposed morphemes, and important words having a part or all of the extracted important words as feature points You may comprise so that an extraction element may be included.
According to this configuration, since the key word extracted by performing morphological analysis on the document data is used to associate the document data with the classification pattern, the feature points extracted from the non-stylized data such as the document data are used. There is an effect that a corresponding menu can be created.
[0128]
Here, the important word extraction element is an important word candidate extraction element that extracts a keyword candidate from the decomposed morpheme, and the number of times that the same keyword candidate as the extracted keyword candidate appears in the same document data. The number of appearance count elements for counting and the extracted important word candidates are extracted as important words from the extracted important word candidates, and the extracted number of important words is a predetermined number of times. You may comprise so that an extraction element may be included.
According to this configuration, since an important word candidate included a predetermined number of times or more is extracted from the document data as an important word, there is an effect that an appropriate feature point corresponding to the document data can be extracted.
[0129]
Here, the important word extraction element is a key word candidate extraction element that extracts a key word candidate from the decomposed morpheme, and the number of times that the same key word candidate as the extracted key word candidate appears in the same document data. A predetermined number of important word candidates are extracted as important words in order from the extracted important word candidates and the extracted important word candidates in order from the important word candidates with the largest number of counted times. It may be configured to include a predetermined number of extraction elements having a feature point.
According to this configuration, since a predetermined number of important word candidates are extracted as important words in order from important word candidates that are included in the document data, an appropriate feature point corresponding to the document data can be extracted. .
[0130]
Here, the data storage means stores the plurality of input data as a relational database, each input data corresponds to a row of the relational database, and is composed of an array of at least one value. A data reading element for sequentially reading input data from the data storage means and a data extracting element for extracting at least one value constituting the read input data as a feature point may be included.
According to this configuration, since each element stored in the relational database is used as a feature point as it is, there is an effect that an appropriate feature point can be quickly extracted from the input data.
[0131]
Here, the items included in the classification pattern storage unit form a hierarchical structure, and the association unit further extracts, for each extracted feature point, the item corresponding to the feature point as the classification pattern. A hierarchical item search unit that searches from storage means may be included, and the data association unit may be configured to associate the searched item with the input data including the feature point.
According to this configuration, the items constituting the classification pattern form a hierarchical structure, and there is an effect that input data can be associated with an item composed of a plurality of layers.
[0132]
Here, further, an input receiving unit that accepts selection of an option from the displayed search menu from the user, and when the input receiving unit receives the user's selection, a search menu is created based on a predetermined criterion. Determining means for determining whether or not to display input data, and, if the determination means determines that a search menu is to be created, from the items subordinate to the item corresponding to the option for which the selection is accepted An item menu generating unit that extracts an item associated with input data and generates a search menu using the extracted item as an option; and the determination unit generates the search menu when it is determined to generate the search menu. If the search menu is displayed and it is determined that the input data is displayed, the selection is accepted. And input data associated with all items subordinate to the item are read from the data storage means, and the input data menu display means for displaying the read input data, and the input read by the input data menu display means Until the data is displayed, the selection of one option by the input reception unit, the determination by the determination unit, the generation of the search menu by the item menu generation unit, and the search menu by the input data menu display unit You may comprise so that the input reception means, the determination means, the item menu generation means, and the repetition control means for controlling the input data menu display means may be provided so as to repeat the display.
According to this configuration, it is determined whether to display a search menu for items in each hierarchy or to display input data included in the items based on a predetermined criterion, so that the user can quickly search for desired input data. effective. In addition, since a multi-level hierarchical menu is realized by creating a search menu again for selected data, there is an effect that a user can easily search a large amount of data.
[0133]
Here, the predetermined criterion in the determination means is that the number of input data associated with the item corresponding to the option for which the selection has been accepted and all items subordinate to the item is equal to or less than a predetermined value. If so, the input data may be displayed, and if it is larger than a predetermined value, it may be configured to be a criterion for generating a search menu. According to this configuration, according to the number of input data associated with the items of each hierarchy and all items subordinate to the item, it is determined whether to display the search menu or to display the input data. When the selected data becomes small, it is possible to prevent an unnecessary search menu from being displayed, and the user can quickly search for desired input data.
[0134]
Here, the data storage means stores a data identifier for identifying each input data, and the associating means includes an item reading unit that sequentially reads items included in each classification pattern from the classification pattern storage means. , Sequentially reading input data from the data storage means, and extracting a feature point included in the input data for each read input data; the read item and the extracted feature point When the match determination unit determines whether or not the corresponding item is extracted and the extracted feature points correspond to each other, the read item is determined. In addition, a data association unit for adding a data identifier for identifying the input data including the feature point may be provided.
According to this configuration, since each item is associated with each input data based on the item included in the classification pattern, there is an effect that a search menu corresponding to the item included in the classification pattern can be created.
[0139]
  Here, the classification pattern selection means is configured to input the input data associated with each item for each classification pattern.A variance counter for counting the variance value of the number;The smallest variancevalueAnd a distribution selection unit that selects the calculated classification pattern.
  According to this configuration, the classification pattern selection unit distributes the number of data associated with each item for each classification pattern.valueAnd calculate the variancevalueSince the classification pattern is selected based on the menu item, it is possible to preferentially create menu choices from a classification pattern in which the number of data associated with each item is as uniform as possible, thereby creating an effective search menu.
[0140]
  Here, the classification pattern selection means includes an input data number counting unit that counts the number of types of input data associated with items for each classification pattern, and is associated with each item for each classification pattern. A classification pattern is selected based on a variance calculation unit that calculates a variance value of the input data from a count value of the number of input data, and the number of types of the input data counted and the variance value of the calculated input data And an input data number selection unit.
  According to this configuration, the classification pattern selection unit calculates the number of the associated data for each classification pattern, and selects the classification pattern based on the calculated number of data and the variance value. Menu options can be created preferentially from a classification pattern in which a lot of data is associated and the number of data associated with each item is as uniform as possible, and an effective search menu can be created.
[0141]
Here, the classification pattern selection unit includes a priority storage unit that stores a priority for each classification pattern, and reads out the priority from the priority storage unit, and uses the read priority to perform one classification. You may comprise so that the priority selection means to select a pattern may be included.
According to this configuration, the priority indicating the order of selecting the classification pattern is stored for each classification pattern, and the classification pattern is selected based on the priority. Therefore, the priority according to the user's preference can be set in advance. Thus, it is possible to create a search menu according to the user's preference.
[0142]
Here, the search menu creating device further includes a switch receiving unit that receives a switching instruction for the search menu displayed on the display unit from the user, and the switching receiving unit that receives the switching instruction for the user. A second classification pattern selection means for selecting a classification pattern based on the predetermined criteria in the classification pattern selection means from other classification patterns excluding the classification pattern selected by the classification pattern selection means; The extraction unit may be configured to generate a search menu from the classification pattern selected by the second classification pattern selection unit.
According to this configuration, when a user gives an instruction, a menu can be created by selecting another classification pattern, so that the user can switch to a favorite menu.
[0143]
Here, the search menu creation device further includes an input reception unit that receives selection of an option from the displayed search menu from the user, and the association unit further corresponds to the option for which the selection has been received. Selection input data extracting means for extracting input data associated with an item to be selected as selection data, correspondence canceling means for canceling all the correspondence between the input data and the item, and an option for accepting the selection A selection input data associating means for associating each item constituting another classification pattern excluding a classification pattern including an item corresponding to the item and the extracted selection data, wherein the classification pattern selection means performs the selection. Based on the predetermined criteria from other classification patterns excluding the classification pattern including the item corresponding to the accepted option. There are, select a classification pattern, the menu extraction means, based on the classification pattern, generates a search menu, the display unit may be configured to display a search menu that is generated.
According to this configuration, the input data associated with the option selected by the user is associated with another classification pattern again, and a search menu is created again. Thus, the user can quickly search for desired input data.
[0144]
Here, a classification pattern input accepting unit that accepts input of a classification pattern and a classification pattern editing instruction including registration of the classification pattern and deletion of the classification pattern from the user, and an input by the classification pattern input acceptance unit A classification pattern editing unit that edits a classification pattern stored in the classification pattern storage unit based on the classification pattern and the classification pattern editing instruction may be included.
According to this configuration, since the user can freely register or delete the classification pattern, there is an effect that a favorite menu can be displayed.
[0145]
  The present invention also provides a plurality of input data.Has a storage area for storingClassification pattern consisting of data storage means and multiple itemsIn advanceA plurality of classification pattern storage means for storingTo operate as a search menu creation device for creating a search menu including options for using a computer to search a plurality of input dataA search menu creation method,A receiving step for receiving a plurality of input data, a writing step for writing the received plurality of input data into the data storage means, and a plurality of input data written in the data storage means, respectively, Corresponding to an item included in any of a plurality of classification patterns stored in advance in the meansA step with correspondence;SaidFor classification pattern storage meansFor each of a plurality of pre-stored classification patterns, count the number of input data associated with each item constituting the classification pattern, based on the variance of the input data calculated from the counted value,The input data includes a classification pattern selection step for selecting a classification pattern, and items constituting the selected classification pattern.InThe method includes a menu extracting step of extracting a correlated item, generating a search menu using the extracted item as an option, and a display step of displaying the search menu generated by the menu extracting unit.
  When this method is used, a plurality of classification patterns composed of a plurality of items that can be search options are prepared in advance, and the number of input data associated with each item among the plurality of prepared classification patterns is as uniform as possible. It is possible to automatically select priority classification patterns and select items included in this priority classification pattern automatically as a choice to generate a search menu, so multiple written inputs This has the effect of making it possible to create a search menu that is optimal for searching data.
[0146]
  TheAnd a display step for displaying the search menu generated by the menu extraction step.SoThe generated search menu is displayed.AndThe user can view the generated search menu.
[0147]
  TheAnd a receiving step for receiving a plurality of input data from the outside, and a writing step for writing the received plurality of input data to the data storage means.BecauseThere is an effect that a search menu can be generated based on a plurality of input data received from the outside.
[0148]
Here, the data storage means stores a data identifier for identifying each input data, and the associating step sequentially reads the input data from the data storage means, and inputs the input data for each read input data. A feature point extracting step for extracting a feature point included in the data; an item search step for searching for an item corresponding to the feature point for each extracted feature point from the classification pattern storage unit; and the searched item And a data association step for adding a data identifier for identifying the input data.
When this method is used, the input data and the classification pattern are associated with each other using the feature points extracted from the input data, so that a menu corresponding to the feature points extracted from the input data can be created.
[0149]
Here, each input data stored in the data storage means is document data, and the feature point extraction step includes a data read step for sequentially reading the document data from the data storage means, and the read document data A morpheme analysis step that performs morpheme analysis on each document data and decomposes it into morphemes for each document data, and extracts important words from the decomposed morphemes, and important words having a part or all of the extracted important words as feature points An extraction step may be included.
When this method is used, document data and classification patterns are associated using important words extracted by performing morphological analysis on the document data, so that feature points extracted from non-stylized data such as document data are used. There is an effect that a corresponding menu can be created.
[0150]
Here, in the important word extraction step, the important word candidate extraction step of extracting the important word candidate from the decomposed morpheme, and the number of times that the same important word candidate as the extracted important word candidate appears in the same document data. From the appearance count counting step for counting and the extracted important word candidates, the important word candidates whose counted number is equal to or more than a predetermined number are extracted as important words, and the extracted important words are extracted a predetermined number of times as feature points. Steps may be included.
When this method is used, since independent words included a predetermined number of times or more are extracted from the document data as important words, there is an effect that an appropriate feature point corresponding to the document data can be extracted.
[0151]
Here, in the important word extraction step, the important word candidate extraction step of extracting the important word candidate from the decomposed morpheme, and the number of times that the same important word candidate as the extracted important word candidate appears in the same document data. Counting the number of occurrences to be counted and extracting a predetermined number of important word candidates as important words in order from the extracted important word candidates having the highest counted number, and extracting the predetermined number of important words And a predetermined number of extraction steps having a feature point as a feature point.
When this method is used, since a predetermined number of independent words are extracted as important words in order from the independent words having the highest number of contained words, it is possible to extract appropriate feature points according to the document data.
[0152]
Here, the data storage means stores the plurality of input data as a relational database, each input data corresponds to a row of the relational database, and is composed of an array of at least one value, and the feature point extraction step includes: A data reading step for sequentially reading input data from the data storage means and a data extracting step for extracting at least one value constituting the read input data as a feature point may be included.
When this method is used, since each element stored in the relational database is used as a feature point as it is, an appropriate feature point can be quickly extracted from the input data.
[0153]
Here, the items included in the classification pattern storage unit form a hierarchical structure, and the association step further includes, for each of the extracted feature points, the items corresponding to the feature points to the classification pattern. A hierarchical item search step for searching from storage means may be included, and the data association step may be configured to associate the searched item with the input data including the feature point.
When this method is used, the items constituting the classification pattern form a hierarchical structure, and there is an effect that input data can be associated with items consisting of a plurality of layers.
[0154]
Here, furthermore, an input receiving step for accepting selection of an option from the displayed search menu from the user, and when the input receiving step accepts the user's selection, a search menu is created based on a predetermined criterion. Or determining whether to display input data, and if the determination step determines that a search menu is to be created, from the items subordinate to the item corresponding to the option for which the selection is accepted An item menu generation step for generating an item associated with input data and generating a search menu using the extracted item as an option; and when the determination step determines that the search menu is to be generated, the item is generated If the search menu is displayed and the input data is determined to be displayed, the selection is accepted. An input data menu display step for reading out the input data associated with the attached option and all the items subordinate to this item from the data storage means, and displaying the read input data, and the input data menu display Until the read input data is displayed by step, selection of one option by the input reception step, determination by the determination step, generation of a search menu by the item menu generation step, and the input data menu The input reception step, the determination step, the item menu generation step, and a repetition control step for controlling the input data menu display step may be included so as to repeat the display of the search menu in the display step. .
If this method is used, it is determined whether to display a search menu for items in each hierarchy or to display input data included in the items based on a predetermined criterion, so that the user can quickly search for desired input data. effective. In addition, since a multi-level hierarchical menu is realized by creating a search menu again for selected data, there is an effect that a user can easily search a large amount of data.
[0155]
Here, the predetermined criterion in the determination step is that the number of input data associated with an item corresponding to the option for which the selection has been accepted and all items subordinate to the item is equal to or less than a predetermined value. If so, the input data may be displayed, and if it is larger than a predetermined value, it may be configured to be a criterion for generating a search menu.
When this method is used, it is determined whether to display the search menu or to display the input data according to the number of input data associated with the items of each hierarchy and all items subordinate to the item. When the selected data becomes small, it is possible to prevent an unnecessary search menu from being displayed, and the user can quickly search for desired input data.
[0156]
Here, the data storage means stores a data identifier for identifying each input data, and the associating step includes an item reading step for sequentially reading items included in each classification pattern from the classification pattern storage means; , Sequentially reading input data from the data storage means, extracting a feature point included in the input data for each read input data, and reading the item and the extracted feature point A match determination step for determining whether or not the corresponding item is matched, and when the match determination step determines that the read item corresponds to the extracted feature point, the read item And a data association step of adding a data identifier for identifying the input data including the feature point.
When this method is used, each item and each input data are associated with each other based on the items included in the classification pattern, so that it is possible to create a search menu corresponding to the items included in the classification pattern.
[0161]
  Here, the classification pattern selection step is a distribution of the number of input data associated with each item for each classification pattern.A variance calculation step for calculating a value;The smallest variancevalueAnd a distributed selection step of selecting the calculated classification pattern.
  When this method is used, the classification pattern selection step performs distribution of the number of data associated with each item for each classification pattern.valueAnd calculate the variancevalueSince the classification pattern is selected based on the menu item, it is possible to preferentially create menu choices from a classification pattern in which the number of data associated with each item is as uniform as possible, thereby creating an effective search menu.
[0162]
  Here, the classification pattern selection step includes an input data number counting step for counting the number of types of input data associated with the items for each classification pattern, and an association with each item for each classification pattern. A classification pattern is selected based on a variance calculation step of calculating a variance value of the input data from a count value of the number of input data, and the number of types of the input data counted and the variance value of the calculated input data And an input data number selection step.
  According to this configuration, the classification pattern selection step calculates the number of the associated data for each classification pattern, and selects the classification pattern based on the calculated number of data and the variance value. Menu options can be created preferentially from a classification pattern in which a lot of data is associated and the number of data associated with each item is as uniform as possible, and an effective search menu can be created.
[0163]
Here, the search menu creation device further includes priority storage means for storing a priority for each classification pattern, and when a plurality of classification patterns are selected by the classification pattern selection step. For each of the plurality of classification patterns, a priority selection step of reading a priority from the priority storage unit and selecting one classification pattern using the read priority may be included.
If this method is used, the priority indicating the order of selecting the classification pattern is stored for each classification pattern, and the classification pattern is selected based on the priority. Therefore, the priority according to the user's preference can be set in advance. Thus, it is possible to create a search menu according to the user's preference.
[0164]
Here, the search menu creation method further includes a switching reception step for receiving a switching instruction for the search menu displayed in the display step from a user, and when the switching reception step receives the switching instruction for the user. A second classification pattern selection step of selecting a classification pattern based on the predetermined criteria in the classification pattern selection step from other classification patterns excluding the classification pattern selected in the classification pattern selection step, and the menu The extraction step may be configured to generate a search menu from the classification pattern selected in the second classification pattern selection step.
When this method is used, when a user gives an instruction, a menu can be created by selecting another classification pattern, so that the user can switch to a favorite menu.
[0165]
Here, the search menu creation method further includes an input reception step of receiving selection of an option from the displayed search menu from the user, and the association step further corresponds to the option for which the selection has been received. A selection input data extraction step for extracting input data associated with an item to be selected as selection data, a correspondence cancellation step for canceling all the associations between the input data and the item, and an option for which the selection is accepted Each of the items constituting the classification pattern other than the classification pattern including the item corresponding to the item, and a selection input data association step for associating the extracted selection data with the classification pattern selection step, Other classification patterns excluding classification patterns that include items corresponding to the choices accepted for selection Then, a classification pattern is selected based on the predetermined criteria, the menu extraction step generates a search menu based on the classification pattern, and the display step displays the generated search menu. You may comprise as follows.
Using this method, the input data associated with the item selected by the user is re-associated with another classification pattern, and a search menu is created again, so a search menu with a different viewpoint can be created, The user can quickly search for desired input data.
[0166]
Here, further, a classification pattern input receiving step for receiving input of a classification pattern from the user, and a classification pattern editing instruction including registration of the classification pattern and deletion of the classification pattern, and input by the classification pattern input reception step. And a classification pattern editing step of editing the classification pattern stored in the classification pattern storage means based on the classification pattern and the classification pattern editing instruction.
If this method is used, the user can freely register or delete the classification pattern, so that it is possible to display a favorite menu.
[0167]
Further, the present invention provides a computer-readable recording medium storing a search menu creation program that causes a computer to execute the search menu creation method described above, and causes the computer to execute the search menu creation method using the search menu creation program. As a result, it is clear that the same effect as the above-described search menu creating apparatus can be obtained.
[Brief description of the drawings]
FIG. 1 is a configuration diagram of a search menu creation apparatus as a first embodiment of the present invention.
FIG. 2 is a diagram showing a data structure of message board information stored in a data storage unit of the search menu creation device shown in FIG. 1;
FIG. 3 is a diagram showing an example of message board information stored in a data storage unit of the search menu creation device shown in FIG. 1;
4 is a diagram showing a data configuration of feature point information stored in a data storage unit of the search menu creation device shown in FIG. 1. FIG.
FIG. 5 is a diagram illustrating an example of feature points stored in a data storage unit of the search menu creation device illustrated in FIG. 1;
6 is a diagram showing a data configuration of classification pattern information stored in a classification pattern storage unit of the search menu creation device shown in FIG. 1. FIG.
FIG. 7 is a diagram illustrating an example of a classification pattern stored in a classification pattern storage unit of the search menu creation device illustrated in FIG. 1;
FIG. 8 is a diagram showing a data configuration of priority information stored in a priority storage unit of the search menu creation device shown in FIG. 1;
FIG. 9 is a diagram illustrating an example of priority information stored in a priority storage unit of the search menu creation device illustrated in FIG. 1;
FIG. 10 is a diagram illustrating an example of classification pattern information stored in a classification pattern storage unit of the search menu creation device illustrated in FIG. 1;
FIG. 11 is a diagram illustrating an example of classification pattern information stored in a classification pattern storage unit of the search menu creation device illustrated in FIG. 1;
12 is a diagram illustrating an example of classification pattern information stored in a classification pattern storage unit of the search menu creation device illustrated in FIG. 1. FIG.
FIG. 13 is a diagram showing an example of classification pattern information stored in a classification pattern storage unit of the search menu creation device shown in FIG. 1;
FIG. 14 is a diagram illustrating an example of classification pattern information stored in a classification pattern storage unit of the search menu creation device illustrated in FIG. 1;
FIG. 15 is a diagram illustrating an example of classification pattern information stored in a classification pattern storage unit of the search menu creation device illustrated in FIG. 1;
FIG. 16 is a diagram showing an example of a search menu created by the search menu creation device shown in FIG. 1;
FIG. 17 is a diagram illustrating an example of a search menu displayed by the display unit of the search menu creation device illustrated in FIG. 1;
FIG. 18 is a diagram illustrating an example of an input unit of the search menu creation apparatus illustrated in FIG. 1;
FIG. 19 is a diagram illustrating an example of data display by the display unit of the search menu creation device illustrated in FIG. 1;
FIG. 20 is a diagram illustrating an example of classification pattern information stored in a classification pattern storage unit of the search menu creation device illustrated in FIG. 1;
FIG. 21 is a diagram illustrating an example of classification pattern information stored in a classification pattern storage unit of the search menu creation device illustrated in FIG. 1;
FIG. 22 is a flowchart showing the operation of the search menu creation device shown in FIG. 1;
FIG. 23 is a flowchart showing a search menu creation operation of the search menu creation device shown in FIG. 1;
FIG. 24 is a block diagram of a search menu creation device as a second exemplary embodiment of the present invention.
FIG. 25 is a diagram illustrating an example of data stored in a data storage unit of the search menu creation device illustrated in FIG. 24;
26 is a diagram showing words obtained by morphological analysis of one piece of document data shown in FIG. 25. FIG.
FIG. 27 is a diagram illustrating the number of appearances of words obtained by dividing the single document data illustrated in FIG. 25 by morphological analysis.
FIG. 28 is a diagram showing a data structure of important word information stored in the important word storage unit of the search menu creating device shown in FIG. 24;
FIG. 29 is a diagram showing an example of important words stored in the important word storage unit of the search menu creating apparatus shown in FIG. 24;
30 is a diagram showing a data configuration of classification pattern information stored in a classification pattern storage unit of the search menu creation device shown in FIG. 24. FIG.
FIG. 31 is a diagram showing an example of classification pattern information stored in a classification pattern storage unit of the search menu creation device shown in FIG. 24;
32 is a diagram showing an example of correspondence between important words, classification patterns, and classification items stored in an association unit of the search menu creation device shown in FIG. 24. FIG.
FIG. 33 is a diagram showing an example in which overlapping correspondence is deleted from the correspondence between the classification pattern and the classification item stored in the correspondence unit of the search menu creation device shown in FIG. 24;
34 is a diagram showing an example in which an identification number of document data is added to the classification pattern stored in the classification pattern storage unit of the search menu creation device shown in FIG. 24. FIG.
FIG. 35 is a diagram showing an example in which an identification number of document data is added to the classification pattern stored in the classification pattern storage unit of the search menu creation device shown in FIG. 24;
36 (a) is a diagram showing an example of an evaluation formula used when the classification pattern selection unit of the search menu creation device shown in FIG. 24 evaluates a classification pattern.
FIG. 36B is a diagram illustrating a function of the second term of the evaluation formula used when the classification pattern selection unit of the search menu creation device illustrated in FIG. 24 evaluates the classification pattern.
37A is a diagram showing an example of a search menu created by a menu creation unit of the search menu creation device shown in FIG. 24. FIG. FIG. 37A is a diagram showing an example of search menu display by the display unit of the search menu creation device shown in FIG.
FIG. 38 is a diagram illustrating an example of an input unit of the search menu creation device illustrated in FIG. 24;
FIG. 39 is a flowchart showing the search menu creation operation of the search menu creation device shown in FIG. 24;
40 is a diagram showing an example of a search menu displayed by the display unit of the search menu creation device shown in FIG. 1. FIG.
FIG. 41 is a block diagram showing a configuration of a conventional menu search system.
42A is a diagram showing an example of data stored in the data storage unit of the menu search system shown in FIG. 41. FIG.
FIG. 42B is a diagram showing an example of a thesaurus stored in the thesaurus storage unit of the menu search system shown in FIG.
43 is a diagram showing a correspondence between data stored in the data storage unit of the menu search system shown in FIG. 41 and a thesaurus stored in the thesaurus storage unit.
44A is a diagram showing a hierarchical structure of a search menu created by the menu search system shown in FIG. 41 as an example. FIG.
FIG. 44B is a diagram showing an example of search menu display by the display unit of the menu search system shown in FIG.
FIG. 44C is a diagram showing an example of search menu display by the display unit of the menu search system shown in FIG.
[Explanation of symbols]
100 Search menu creation device
101 Data storage unit
102 Data feature point extraction unit
103 Classification pattern storage unit
104 Priority storage unit
105 Corresponding part
106 Classification pattern selection unit
107 Menu creation section
108 Display
109 Input section
110 Classification pattern selection unit
2100 Search menu creation device
2101 Data storage unit
2102 Keyword extraction unit
2103 Important word storage
2104 Classification pattern storage unit
2105 Corresponding part
2106 Classification pattern selection unit
2107 Menu creation section
2108 display unit
2109 Input section

Claims (31)

複数の入力データの検索に利用する選択肢を含む検索メニューを作成する検索メニュー作成装置であって、
複数の入力データを記憶するための記憶領域を有するデータ記憶手段と、
検索メニューの選択肢となりえる複数の項目から構成される分類パターンが予め複数個記憶された分類パターン記憶手段と、
複数の入力データを受信する受信手段と、
前記受信した複数の入力データを前記データ記憶手段に書き込む書込手段と、
前記データ記憶手段に書き込まれた複数の入力データのそれぞれを、前記分類パターン記憶手段に予め記憶された複数の分類パターンのうちのいずれかに含まれる項目対応付ける対応付手段と、
前記分類パターン記憶手段に予め記憶され複数の分類パターンのそれぞれについて、前記分類パターンを構成する各項目に対応付けた入力データの数を計数し、前記計数した値から算出される入力データの分散値を基に、分類パターンを選択する分類パターン選択手段と、
前記選択された分類パターンを構成する項目から、前記入力データ対応付た項目を抽出し、抽出した前記項目を選択肢とした検索メニューを生成するメニュー抽出手段と
前記メニュー抽出手段により生成された検索メニューを表示する表示手段と
を備えることを特徴とする検索メニュー作成装置。
A search menu creation device for creating a search menu including options to be used for searching a plurality of input data,
Data storage means having a storage area for storing a plurality of input data;
Classification pattern storage means in which a plurality of classification patterns composed of a plurality of items that can be search menu options are stored in advance ,
Receiving means for receiving a plurality of input data;
Writing means for writing the received plurality of input data into the data storage means;
Each of the plurality of input data written to said data storage means, and associating means for associating the items included in any of the plurality of sort pattern stored in advance in the classification pattern storage means,
For each of a plurality of classification patterns previously stored in the sort pattern storing means, counts the number of input data associated with each item constituting the classification pattern, the variance of input data is calculated from the counted value Classification pattern selection means for selecting a classification pattern based on the value ,
From items constituting the selected sort pattern, and a menu extraction unit operable to extract the item was Installing corresponding to the input data, generates an extraction search menu the item was choices and,
A search menu creating apparatus comprising: display means for displaying a search menu generated by the menu extracting means .
前記データ記憶手段は、各入力データを識別するデータ識別子を記憶しており、
前記対応付手段は、
前記データ記憶手段から入力データを順次読み出し、読み出された入力データ毎に、入力データに含まれる特徴点を抽出する特徴点抽出部と、
抽出された前記特徴点毎に、前記特徴点に対応する項目を前記分類パターン記憶手段より検索する項目検索部と、
前記検索された項目に、前記入力データを識別するデータ識別子を付加するデータ対応付部と
を含むことを特徴とする請求項1記載の検索メニュー作成装置。
The data storage means stores a data identifier for identifying each input data,
The correspondence means is
A feature point extracting unit that sequentially reads input data from the data storage unit and extracts a feature point included in the input data for each read input data;
For each extracted feature point, an item search unit that searches the classification pattern storage means for an item corresponding to the feature point;
The search menu creating apparatus according to claim 1 , further comprising: a data association unit that adds a data identifier for identifying the input data to the searched item.
前記データ記憶手段に記憶されている各入力データは、文書データであり、
前記特徴点抽出部は、
前記データ記憶手段から文書データを順次読み出すデータ読出要素と、
読み出された文書データに対して形態素解析を施して、文書データ毎に形態素に分解する形態素解析要素と、
前記分解された形態素から重要語を抽出し、抽出した重要語の一部又は全部を特徴点とする重要語抽出要素と
を含むことを特徴とする請求項2記載の検索メニュー作成装置。
Each input data stored in the data storage means is document data,
The feature point extraction unit includes:
A data reading element for sequentially reading out document data from the data storage means;
A morphological analysis element that performs morphological analysis on the read document data and decomposes the document data into morphemes, and
The search menu creation device according to claim 2 , further comprising: a key word extraction element that extracts a key word from the decomposed morpheme and has a feature point of a part or all of the extracted key word.
前記重要語抽出要素は、
前記分解された形態素から重要語候補を抽出する重要語候補抽出要素と、
同一文書データにおいて、前記抽出された重要語候補と同じ重要語候補が出現する回数をカウントする出現回数カウント要素と、
抽出された重要語候補から、前記カウントされた回数が所定の回数以上の重要語候補を重要語として抽出し、抽出された重要語を特徴点とする所定回数抽出要素と
を含むことを特徴とする請求項3記載の検索メニュー作成装置。
The important word extraction element is:
An important word candidate extraction element for extracting an important word candidate from the decomposed morpheme;
In the same document data, an appearance count element that counts the number of times the same important word candidate as the extracted important word candidate appears,
An important word candidate whose extracted count is equal to or more than a predetermined number of times is extracted as an important word from the extracted important word candidates, and includes a predetermined number of extraction elements having the extracted important word as a feature point. The search menu creation device according to claim 3 .
前記重要語抽出要素は、
前記分解された形態素から重要語候補を抽出する重要語候補抽出要素と、
同一文書データにおいて、抽出された重要語候補と同じ重要語候補が出現する回数をカウントする出現回数カウント要素と、
抽出された重要語候補のうち、前記カウントされた回数が多い重要語候補から順に所定数の重要語候補を重要語として抽出し、抽出された所定数の重要語を特徴点とする所定数抽出要素と
を含むことを特徴とする請求項3記載の検索メニュー作成装置。
The important word extraction element is:
An important word candidate extraction element for extracting an important word candidate from the decomposed morpheme;
An occurrence count element that counts the number of occurrences of the same important word candidate as the extracted important word candidate in the same document data;
Among the extracted important word candidates, a predetermined number of important word candidates are extracted as important words in order from the important word candidates with the largest number of counts, and a predetermined number is extracted with the extracted predetermined number of important words as feature points. The search menu creation device according to claim 3 , further comprising:
前記データ記憶手段は、リレーショナルデータベースとして前記複数の入力データを記憶し、各入力データはリレーショナルデータベースの行に相当し、少なくとも1つの値の並びから構成され、
前記特徴点抽出部は、
前記データ記憶手段から入力データを順次読み出すデータ読出要素と、
前記読み出した入力データを構成する少なくとも1つの値を特徴点として抽出するデータ抽出要素と
を含むことを特徴とする請求項2記載の検索メニュー作成装置。
The data storage means stores the plurality of input data as a relational database, each input data corresponds to a row of the relational database, and is composed of a sequence of at least one value;
The feature point extraction unit includes:
A data read element for sequentially reading input data from the data storage means;
The search menu creation device according to claim 2 , further comprising: a data extraction element that extracts at least one value constituting the read input data as a feature point.
前記分類パターン記憶手段に含まれる前記項目は、階層構造を形成し、
前記対応付手段は、さらに、
抽出された前記特徴点毎に、前記特徴点に対応する前記項目を前記分類パターン記憶手段より検索する階層項目検索部を含み、
前記データ対応付部は、前記検索された項目と、前記特徴点を含む前記入力データとを対応付ける
ことを特徴とする請求項2記載の検索メニュー作成装置。
The items included in the classification pattern storage unit form a hierarchical structure,
The correspondence means further includes:
For each extracted feature point, including a hierarchical item search unit that searches the classification pattern storage means for the item corresponding to the feature point,
The search menu creation device according to claim 2, wherein the data association unit associates the retrieved item with the input data including the feature point.
さらに、ユーザーより、表示された検索メニューから選択肢の選択を受け付ける入力受付手段と、
前記入力受付手段が前記ユーザーの選択を受け付けた場合に、所定の基準に基づいて、検索メニューを作成するか、又は、入力データを表示するかを判定する判定手段と、
前記判定手段により検索メニューを作成すると判定された場合に、前記選択を受け付けられた選択肢に対応する前記項目に従属する項目から、入力データが対応付けられた項目を抽出し、抽出した前記項目を選択肢とする検索メニューを生成する項目メニュー生成手段と、
前記判定手段により検索メニューを作成すると判定された場合に、前記生成された検索メニューを表示し、入力データを表示すると判定された場合に、前記選択を受け付けられた選択肢に対応する項目及びこの項目に従属するすべての項目に対応付けられた入力データをデータ記憶手段より読み出し、読み出した入力データを表示する入力データメニュー表示手段と、
前記入力データメニュー表示手段により前記読み出した入力データが表示されるまで、前記入力受付手段による1つの選択肢の選択の受け付けと、前記判定手段による判定と、前記項目メニュー生成手段による検索メニューの生成と、前記入力データメニュー表示手段による検索メニューの表示とを繰り返すよう、前記入力受付手段、前記判定手段、前記項目メニュー生成手段、前記入力データメニュー表示手段を制御する繰返制御手段とを備え、
前記判定手段における所定の基準とは、前記選択を受け付けられた選択肢に対応する項目と当該項目に従属するすべての項目とに対応付けられている入力データの数が、所定の値以下であれば、入力データを表示し、所定の値よりも大きければ、検索メニューを生成する判定基準である
ことを特徴とする請求項7記載の検索メニュー作成装置。
Furthermore, an input receiving means for receiving selection of an option from the displayed search menu from the user,
A determination unit that determines whether to create a search menu or display input data based on a predetermined criterion when the input reception unit receives the user's selection;
When it is determined by the determination means to create a search menu, an item associated with input data is extracted from items subordinate to the item corresponding to the option for which the selection has been accepted, and the extracted item is Item menu generation means for generating a search menu as an option;
When the determination unit determines to create a search menu, the generated search menu is displayed, and when it is determined to display input data, an item corresponding to the option for which the selection is accepted and this item Input data menu display means for reading input data associated with all items subordinate to the data storage means, and displaying the read input data;
Until the input data read by the input data menu display means, the selection of one option by the input reception means, the determination by the determination means, and the generation of the search menu by the item menu generation means, , to repeat the display of the search menu by the input data menu display means, said input receiving means, said determining means, said item menu generating means, Bei example and repeat control means for controlling said input data menu display means,
The predetermined criterion in the determination means is that the number of input data associated with an item corresponding to the option for which the selection has been accepted and all items subordinate to the item is equal to or less than a predetermined value 8. The search menu creation device according to claim 7 , wherein the input data is displayed, and if it is larger than a predetermined value, it is a criterion for generating a search menu.
前記データ記憶手段は、各入力データを識別するデータ識別子を記憶しており、
前記対応付手段は、
前記分類パターン記憶手段から、各分類パターンに含まれる項目を順次読み出す項目読出部と、
前記データ記憶手段から入力データを順次読み出し、読み出された入力データ毎に、入力データに含まれる特徴点を抽出する特徴点抽出部と、
読み出された前記項目と抽出された前記特徴点とが対応するか否かを判定する一致判定部と、
前記一致判定部により、読み出された前記項目と抽出された前記特徴点とが対応すると判定された場合に、前記読み出された項目に、前記特徴点を含む前記入力データを識別するデータ識別子を付加するデータ対応付部と
を備えることを特徴とする請求項1記載の検索メニュー作成装置。
The data storage means stores a data identifier for identifying each input data,
The correspondence means is
An item reading unit for sequentially reading items included in each classification pattern from the classification pattern storage unit;
A feature point extracting unit that sequentially reads input data from the data storage unit and extracts a feature point included in the input data for each read input data;
A match determination unit that determines whether or not the read item corresponds to the extracted feature point;
A data identifier for identifying the input data including the feature point in the read item when the coincidence determination unit determines that the read item corresponds to the extracted feature point The search menu creation device according to claim 1, further comprising: a data association unit for adding
前記分類パターン選択手段は、
各分類パターン毎に各項目に対応付けられている入力データの計数値から前記入力データの分散値を算出する分散算出部と、
最も小さい分散が算出された分類パターンを選択する分散選択部と
を含むことを特徴とする請求項1記載の検索メニュー作成装置。
The classification pattern selection means includes:
A variance calculation unit that calculates a variance value of the input data from a count value of the input data associated with each item for each classification pattern ;
The search menu creation device according to claim 1 , further comprising: a variance selection unit that selects a classification pattern for which the smallest variance value is calculated.
前記分類パターン選択手段は、
各分類パターン毎に項目に対応付けられている入力データの種類の数を計数する入力データ数計数部と、
各分類パターン毎に各項目に対応付けられている入力データの数の計数値から前記入力データの分散値を算出する分散算出部と、
前記計数した入力データの種類の数および前記算出した入力データの分散値を基に、分類パターンを選択する入力データ数選択部と、
を含むことを特徴とする請求項1記載の検索メニュー作成装置。
The classification pattern selection means includes:
An input data number counting unit for counting the number of types of input data associated with items for each classification pattern;
A variance calculation unit that calculates a variance value of the input data from a count value of the number of input data associated with each item for each classification pattern;
Based on the number of types of the counted input data and the calculated variance value of the input data, an input data number selection unit that selects a classification pattern;
The search menu creating apparatus according to claim 1, wherein:
さらに、各分類パターン毎に優先度を記憶している優先度記憶手段と、
前記分散選択部により、複数の分類パターンが選択された場合に、前記複数の分類パターン毎に、前記優先度記憶手段から優先度を読み出し、読み出した優先度を用いて、1つの分類パターンを選択する優先度選択手段と
を含むことを特徴とする請求項1、10及び11のいずれか1項に記載の検索メニュー作成装置。
Furthermore, priority storage means for storing the priority for each classification pattern;
When a plurality of classification patterns are selected by the distribution selection unit, the priority is read from the priority storage unit for each of the plurality of classification patterns, and one classification pattern is selected using the read priority. The search menu creation device according to any one of claims 1, 10, and 11, further comprising: a priority selection unit.
前記検索メニュー作成装置は、さらに、
ユーザーより、前記表示手段に表示された検索メニューの切替指示を受け付ける切替受付手段と、
前記切替受付手段が前記ユーザーの切替指示を受け付けた場合に、前記分類パターン選択手段により選択された分類パターンを除く他の分類パターンより、前記分類パターン選択手段における前記所定の基準に基づいて、分類パターンを選択する第2分類パターン選択手段とを含み、
前記メニュー抽出手段は、前記第2分類パターン選択手段により選択された分類パターンから、検索メニューを生成する
ことを特徴とする請求項1記載の検索メニュー作成装置。
The search menu creation device further includes:
Switching accepting means for accepting an instruction to switch the search menu displayed on the display means from the user;
When the switching accepting unit accepts the user's switching instruction, the classification pattern is selected based on the predetermined criterion in the classification pattern selecting unit, from other classification patterns excluding the classification pattern selected by the classification pattern selecting unit. Second classification pattern selection means for selecting a pattern,
The search menu creation device according to claim 1 , wherein the menu extraction unit generates a search menu from the classification pattern selected by the second classification pattern selection unit.
前記検索メニュー作成装置は、さらに、
ユーザーより、前記表示された検索メニューから選択肢の選択を受け付ける入力受付手段を含み、
前記対応付手段は、さらに、
前記選択を受け付けられた選択肢に対応する項目に対応付けられた入力データを選択データとして抽出する選択入力データ抽出手段と、
前記入力データと前記項目との全ての前記対応付けを取り消す対応付取消手段と、
前記選択を受け付けられた選択肢に対応する項目を含む分類パターンを除く他の分類パターンを構成する各項目と、前記抽出された選択データとを対応付ける選択入力データ対応付手段とを含み、
前記分類パターン選択手段は、前記選択を受け付けられた選択肢に対応する項目を含む分類パターンを除く他の分類パターンから、前記所定の基準に基づいて、分類パターンを選択し、
前記メニュー抽出手段は、前記分類パターンを基にして、検索メニューを生成し、
前記表示手段は、前記生成された検索メニューを表示する
ことを特徴とする請求項1記載の検索メニュー作成装置。
The search menu creation device further includes:
From the user, including an input receiving means for receiving selection of options from the displayed search menu,
The correspondence means further includes:
Selection input data extraction means for extracting, as selection data, input data associated with an item corresponding to the option for which the selection has been accepted;
Correspondence canceling means for canceling all the correspondence between the input data and the item,
Each of the items constituting a classification pattern other than a classification pattern including an item corresponding to the option for which the selection has been accepted, and selection input data association means for associating the extracted selection data;
The classification pattern selection means selects a classification pattern based on the predetermined criterion from other classification patterns excluding a classification pattern including an item corresponding to the option for which the selection has been accepted,
The menu extraction means generates a search menu based on the classification pattern,
The search menu creating apparatus according to claim 1 , wherein the display unit displays the generated search menu.
さらに、ユーザーより分類パターンと、分類パターンの登録と分類パターンの削除とを含む分類パターンの編集指示との入力を受け付ける分類パターン入力受付手段と、
前記分類パターン入力受付手段により入力を受け付けられた分類パターンと分類パターンの編集指示を基にして、分類パターン記憶手段に記憶された分類パターンを編集する分類パターン編集手段と
を含むことを特徴とする請求項1記載の検索メニュー作成装置。
Further, a classification pattern input receiving means for receiving input of a classification pattern from the user, and a classification pattern editing instruction including registration of the classification pattern and deletion of the classification pattern;
A classification pattern editing unit that edits a classification pattern stored in the classification pattern storage unit based on a classification pattern received by the classification pattern input reception unit and a classification pattern editing instruction. The search menu creation device according to claim 1 .
複数の入力データを記憶するための記憶領域を有するデータ記憶手段と複数の項目から構成される分類パターンを予め複数個記憶している分類パターン記憶手段とを備えるコンピュータを複数の入力データの検索に利用する選択肢を含む検索メニューを作成する検索メニュー作成装置として動作させるための検索メニュー作成方法であって、
受信手段により、複数の入力データを受信する受信ステップと、
書込手段により、前記受信した複数の入力データを前記データ記憶手段に書き込む書込ステップと、
対応付け手段により、前記データ記憶手段に書き込まれた複数の入力データのそれぞれを、前記分類パターン記憶手段に予め記憶された複数の分類パターンのうちのいずれかに含まれる項目対応付ける対応付ステップと、
分類パターン選択手段により、前記分類パターン記憶手段に予め記憶され複数の分類パターンのそれぞれについて、前記分類パターンを構成する各項目に対応付けた入力データの数を計数し、前記計数した値から算出される入力データの分散値を基に、分類パターンを選択する分類パターン選択ステップと、
メニュー抽出手段により、前記選択された分類パターンを構成する項目から、前記入力データ対応付けた項目を抽出し、抽出した前記項目を選択肢とした検索メニューを生成するメニュー抽出ステップと、
表示手段により、前記メニュー抽出手段により生成された検索メニューを表示する表示ステップと
を含むことを特徴とする検索メニュー作成方法。
A computer comprising a data storage means having a storage area for storing a plurality of input data and a classification pattern storage means for storing a plurality of classification patterns composed of a plurality of items in advance for searching for a plurality of input data A search menu creation method for operating as a search menu creation device for creating a search menu including options to be used ,
A receiving step of receiving a plurality of input data by a receiving means;
A writing step of writing the received plurality of input data into the data storage unit by a writing unit;
An associating step of associating each of the plurality of input data written in the data storage unit with an item included in any of the plurality of classification patterns stored in advance in the classification pattern storage unit by the associating unit; ,
Calculated by the classification pattern selection means, for each of the plurality of sort pattern stored in advance in the classification pattern storage unit, the sort pattern by counting the number of input data associated with each item constituting, from the counted value A classification pattern selection step for selecting a classification pattern based on a variance value of input data to be input ,
The menu extraction means, from the items constituting the selected sort pattern, and a menu extraction step of the extracted items digits with corresponding to the input data, generates an extraction search menu the item was choices and,
And a display step for displaying the search menu generated by the menu extraction means by a display means .
前記データ記憶手段は、各入力データを識別するデータ識別子を記憶しており、
前記対応付ステップは、
前記データ記憶手段から入力データを順次読み出し、読み出された入力データ毎に、入力データに含まれる特徴点を抽出する特徴点抽出ステップと、
抽出された前記特徴点毎に、前記特徴点に対応する項目を前記分類パターン記憶手段より検索する項目検索ステップと、
前記検索された項目に、前記入力データを識別するデータ識別子を付加するデータ対応付ステップと
を含むことを特徴とする請求項16記載の検索メニュー作成方法。
The data storage means stores a data identifier for identifying each input data,
The correspondence step includes
A feature point extracting step of sequentially reading out input data from the data storage means and extracting a feature point included in the input data for each read input data;
For each of the extracted feature points, an item search step of searching for items corresponding to the feature points from the classification pattern storage unit;
The search menu creation method according to claim 16 , further comprising: a data association step of adding a data identifier for identifying the input data to the retrieved item.
前記データ記憶手段に記憶されている各入力データは、文書データであり、
前記特徴点抽出ステップは、
前記データ記憶手段から文書データを順次読み出すデータ読出ステップと、
読み出された文書データに対して形態素解析を施して、文書データ毎に形態素に分解する形態素解析ステップと、
前記分解された形態素から重要語を抽出し、抽出した重要語の一部又は全部を特徴点とする重要語抽出ステップと
を含むことを特徴とする請求項17記載の検索メニュー作成方法。
Each input data stored in the data storage means is document data,
The feature point extraction step includes:
A data reading step for sequentially reading out document data from the data storage means;
A morphological analysis step for performing morphological analysis on the read document data and decomposing the document data into morphemes for each document data;
The search menu creation method according to claim 17 , further comprising: extracting a key word from the decomposed morpheme and extracting a key word using a part or all of the extracted key word as a feature point.
前記重要語抽出ステップは、
前記分解された形態素から重要語候補を抽出する重要語候補抽出ステップと、
同一文書データにおいて、抽出された重要語候補と同じ重要語候補が出現する回数をカウントする出現回数カウントステップと、
抽出された重要語候補から、前記カウントされた回数が所定の回数以上の重要語候補を重要語として抽出し、抽出された重要語を特徴点とする所定回数抽出ステップと
を含むことを特徴とする請求項18記載の検索メニュー作成方法。
The important word extraction step includes:
An important word candidate extracting step of extracting an important word candidate from the decomposed morpheme;
In the same document data, an appearance count counting step for counting the number of times the same important word candidate as the extracted important word candidate appears,
Extracting from the extracted important word candidates important word candidates with the counted number of times equal to or greater than a predetermined number as important words, and a predetermined number of extraction steps using the extracted important words as feature points. The search menu creation method according to claim 18 .
前記重要語抽出ステップは、
前記分解された形態素から重要語候補を抽出する重要語候補抽出ステップと、
同一文書データにおいて、抽出された重要語候補と同じ重要語候補が出現する回数をカウントする出現回数カウントステップと、
抽出された重要語候補のうち、前記カウントされた回数が多い重要語候補から順に所定数の重要語候補を重要語として抽出し、抽出された所定数の重要語を特徴点とする所定数抽出ステップと
を含むことを特徴とする請求項18記載の検索メニュー作成方法。
The important word extraction step includes:
An important word candidate extracting step of extracting an important word candidate from the decomposed morpheme;
In the same document data, an appearance count counting step for counting the number of times the same important word candidate as the extracted important word candidate appears,
Among the extracted important word candidates, a predetermined number of important word candidates are extracted as important words in order from the important word candidates with the largest number of counts, and a predetermined number is extracted with the extracted predetermined number of important words as feature points. The search menu creation method according to claim 18 , further comprising:
前記データ記憶手段は、リレーショナルデータベースとして前記複数の入力データを記憶し、各入力データはリレーショナルデータベースの行に相当し、少なくとも1つの値の並びから構成され、
前記特徴点抽出ステップは、
前記データ記憶手段から入力データを順次読み出すデータ読出ステップと、
前記読み出した入力データを構成する少なくとも1つの値を特徴点として抽出するデータ抽出ステップと
を含むことを特徴とする請求項17記載の検索メニュー作成方法。
The data storage means stores the plurality of input data as a relational database, each input data corresponds to a row of the relational database, and is composed of a sequence of at least one value;
The feature point extraction step includes:
A data reading step for sequentially reading input data from the data storage means;
The search menu creation method according to claim 17 , further comprising: a data extraction step of extracting at least one value constituting the read input data as a feature point.
前記分類パターン記憶手段に含まれる前記項目は、階層構造を形成し、
前記対応付ステップは、さらに、
抽出された前記特徴点毎に、前記特徴点に対応する前記項目を前記分類パターン記憶手段より検索する階層項目検索ステップを含み、
前記データ対応付ステップは、前記検索された項目と、前記特徴点を含む前記入力データとを対応付ける
ことを特徴とする請求項17記載の検索メニュー作成方法。
The items included in the classification pattern storage unit form a hierarchical structure,
The correspondence step further includes:
For each of the extracted feature points, a hierarchical item search step of searching the item corresponding to the feature points from the classification pattern storage means,
The search menu creation method according to claim 17, wherein the data association step associates the retrieved item with the input data including the feature point.
さらに、ユーザーより、表示された検索メニューから選択肢の選択を受け付ける入力受付ステップと、
前記入力受付ステップが前記ユーザーの選択を受け付けた場合に、所定の基準に基づいて、検索メニューを作成するか、又は、入力データを表示するかを判定する判定ステップと、
前記判定ステップにより検索メニューを作成すると判定された場合に、前記選択を受け付けられた選択肢に対応する前記項目に従属する項目から、入力データが対応付けられた項目を抽出し、抽出した前記項目を選択肢とする検索メニューを生成する項目メニュー生成ステップと、
前記判定ステップにより検索メニューを作成すると判定された場合に、前記生成された検索メニューを表示し、入力データを表示すると判定された場合に、前記選択を受け付けられた選択肢に対応する項目及びこの項目に従属するすべての項目に対応付けられた入力データをデータ記憶手段より読み出し、読み出した入力データを表示する入力データメニュー表示ステップと、
前記入力データメニュー表示ステップにより前記読み出した入力データが表示されるまで、前記入力受付ステップによる1つの選択肢の選択の受け付けと、前記判定ステップによる判定と、前記項目メニュー生成ステップによる検索メニューの生成と、前記入力データメニュー表示ステップによる検索メニューの表示とを繰り返すよう、前記入力受付ステップ、前記判定ステップ、前記項目メニュー生成ステップ、前記入力データメニュー表示ステップを制御する繰返制御ステップとを含み、
前記判定ステップにおける所定の基準とは、前記選択を受け付けられた選択肢に対応する項目と当該項目に従属するすべての項目とに対応付けられている入力データの数が、所定の値以下であれば、入力データを表示し、所定の値よりも大きければ、検索メニューを生成する判定基準である
ことを特徴とする請求項22記載の検索メニュー作成方法。
Furthermore, an input receiving step for receiving selection of an option from the displayed search menu from the user,
A determination step for determining whether to create a search menu or display input data based on a predetermined criterion when the input reception step receives the user's selection;
When it is determined that the search menu is created by the determination step, an item associated with input data is extracted from items subordinate to the item corresponding to the option for which the selection is accepted, and the extracted item is An item menu generation step for generating a search menu as an option;
When it is determined that the search menu is created in the determination step, the generated search menu is displayed, and when it is determined that the input data is displayed, the item corresponding to the option for which the selection is accepted and the item An input data menu display step for reading input data associated with all items subordinate to the data storage means and displaying the read input data;
Until the read input data is displayed by the input data menu display step, the selection of one option by the input reception step, the determination by the determination step, the generation of the search menu by the item menu generation step, , to repeat the display of the search menu by the input data menu display step, the input receiving step, the determination step, the item menu generating step, seen including a repeat control step of controlling the input data menu display step,
The predetermined criterion in the determination step is that the number of input data associated with an item corresponding to the option for which the selection has been accepted and all items subordinate to the item is equal to or less than a predetermined value. 23. The search menu creation method according to claim 22 , wherein the input data is displayed, and if the input data is larger than a predetermined value, it is a criterion for generating a search menu.
前記データ記憶手段は、各入力データを識別するデータ識別子を記憶しており、
前記対応付ステップは、
前記分類パターン記憶手段から、各分類パターンに含まれる項目を順次読み出す項目読出ステップと、
前記データ記憶手段から入力データを順次読み出し、読み出された入力データ毎に、入力データに含まれる特徴点を抽出する特徴点抽出ステップと、
読み出された前記項目と抽出された前記特徴点とが対応するか否かを判定する一致判定ステップと、
前記一致判定ステップにより、読み出された前記項目と抽出された前記特徴点とが対応すると判定された場合に、前記読み出された項目に、前記特徴点を含む前記入力データを識別するデータ識別子を付加するデータ対応付ステップと
を含むことを特徴とする請求項16記載の検索メニュー作成方法。
The data storage means stores a data identifier for identifying each input data,
The correspondence step includes
An item reading step for sequentially reading items included in each classification pattern from the classification pattern storage means;
A feature point extracting step of sequentially reading out input data from the data storage means and extracting a feature point included in the input data for each read input data;
A match determination step for determining whether or not the read item corresponds to the extracted feature point;
A data identifier for identifying the input data including the feature point in the read item when it is determined by the matching determination step that the read item corresponds to the extracted feature point The search menu creation method according to claim 16 , further comprising: a data association step of adding.
前記分類パターン選択ステップは、
各分類パターン毎に各項目に対応付けられている入力データの計数値から前記入力データの分散値を算出する分散算出ステップと、
最も小さい分散が算出された分類パターンを選択する分散選択ステップと
を含むことを特徴とする請求項21記載の検索メニュー作成方法。
The classification pattern selection step includes:
A variance calculating step for calculating a variance value of the input data from a count value of the input data associated with each item for each classification pattern ;
The search menu creation method according to claim 21 , further comprising: a variance selection step of selecting a classification pattern for which the smallest variance value is calculated.
前記分類パターン選択ステップは、
各分類パターン毎に項目に対応付けられている入力データの種類の数を計数する入力データ数計数ステップと、
各分類パターン毎に各項目に対応付けられている入力データの計数値から前記入力データの分散値を算出する分散算出ステップと、
前記計数した入力データの種類の数および前記算出した入力データの分散値を基に、分類パターンを選択する入力データ数選択ステップと、
を含むことを特徴とする請求項25記載の検索メニュー作成方法。
The classification pattern selection step includes:
An input data number counting step for counting the number of types of input data associated with items for each classification pattern;
A variance calculating step for calculating a variance value of the input data from a count value of the input data associated with each item for each classification pattern;
Based on the counted number of types of input data and the calculated variance of the input data, an input data number selection step for selecting a classification pattern;
The search menu creation method according to claim 25 , further comprising:
前記検索メニュー作成装置は、さらに、各分類パターン毎に優先度を記憶している優先度記憶手段を含み、
さらに、前記分散選択ステップにより、複数の分類パターンが選択された場合に、前記複数の分類パターン毎に、前記優先度記憶手段から優先度を読み出し、読み出した優先度を用いて、1つの分類パターンを選択する優先度選択ステップ
を含むことを特徴とする請求項16、25及び26のいずれか1項に記載の検索メニュー作成方法。
The search menu creation device further includes priority storage means for storing a priority for each classification pattern,
Further, when a plurality of classification patterns are selected by the distribution selection step, the priority is read from the priority storage unit for each of the plurality of classification patterns, and one classification pattern is used using the read priority. 27. The search menu creation method according to claim 16 , further comprising a priority selection step of selecting.
前記検索メニュー作成方法は、さらに、
ユーザーより、前記表示ステップに表示された検索メニューの切替指示を受け付ける切替受付ステップと、
前記切替受付ステップが前記ユーザーの切替指示を受け付けた場合に、前記分類パターン選択ステップにより選択された分類パターンを除く他の分類パターンより、前記分類パターン選択ステップにおける前記所定の基準に基づいて、分類パターンを選択する第2分類パターン選択ステップとを含み、
前記メニュー抽出ステップは、前記第2分類パターン選択ステップにより選択された分類パターンから、検索メニューを生成する
ことを特徴とする請求項16記載の検索メニュー作成方法。
The search menu creation method further includes:
From the user, a switching reception step for receiving a switching instruction for the search menu displayed in the display step,
When the switching acceptance step accepts the user's switching instruction, the classification pattern other than the classification pattern selected by the classification pattern selection step is classified based on the predetermined criterion in the classification pattern selection step. A second classification pattern selection step of selecting a pattern,
The search menu creation method according to claim 16 , wherein the menu extraction step generates a search menu from the classification pattern selected by the second classification pattern selection step.
前記検索メニュー作成方法は、さらに、
ユーザーより、前記表示された検索メニューから選択肢の選択を受け付ける入力受付ステップを含み、
前記対応付ステップは、さらに、
前記選択を受け付けられた選択肢に対応する項目に対応付けられた入力データを選択データとして抽出する選択入力データ抽出ステップと、
前記入力データと前記項目との全ての前記対応付けを取り消す対応付取消ステップと、
前記選択を受け付けられた選択肢に対応する項目を含む分類パターンを除く他の分類パターンを構成する各項目と、前記抽出された選択データとを対応付ける選択入力データ対応付ステップとを含み、
前記分類パターン選択ステップは、前記選択を受け付けられた選択肢に対応する項目を含む分類パターンを除く他の分類パターンから、前記所定の基準に基づいて、分類パターンを選択し、
前記メニュー抽出ステップは、前記分類パターンを基にして、検索メニューを生成し、
前記表示ステップは、前記生成された検索メニューを表示する
ことを特徴とする請求項16記載の検索メニュー作成方法。
The search menu creation method further includes:
From the user, including an input receiving step of receiving selection of an option from the displayed search menu,
The correspondence step further includes:
A selection input data extraction step for extracting, as selection data, input data associated with an item corresponding to the option for which the selection has been accepted;
A correspondence canceling step for canceling all the correspondences between the input data and the item;
A step of associating each item constituting a classification pattern other than a classification pattern including an item corresponding to an option accepted for selection with a selection input data correspondence step for associating the extracted selection data;
The classification pattern selection step selects a classification pattern based on the predetermined criterion from other classification patterns excluding a classification pattern including an item corresponding to the option for which the selection has been accepted,
The menu extraction step generates a search menu based on the classification pattern,
The search menu creation method according to claim 16 , wherein the display step displays the generated search menu.
さらに、ユーザーより分類パターンと、分類パターンの登録と分類パターンの削除とを含む分類パターンの編集指示との入力を受け付ける分類パターン入力受付ステップと、
前記分類パターン入力受付ステップにより入力を受け付けられた分類パターンと分類パターンの編集指示を基にして、分類パターン記憶手段に記憶された分類パターンを編集する分類パターン編集ステップと、
を含むことを特徴とする請求項21記載の検索メニュー作成方法。
Further, a classification pattern input receiving step for receiving an input of a classification pattern from the user, and a classification pattern editing instruction including classification pattern registration and classification pattern deletion,
A classification pattern editing step for editing the classification pattern stored in the classification pattern storage means based on the classification pattern received by the classification pattern input reception step and the instruction for editing the classification pattern;
The search menu creation method according to claim 21 , further comprising:
複数の入力データを基にして検索メニューを作成する検索メニュー作成方法をコンピュータに実行させるためのプログラムを記録するコンピュータ読み取り可能な媒体であって、
請求項16〜30記載の何れかの検索メニュー作成方法をコンピュータに実行させるためのプログラムを含むことを特徴とする記録媒体。
A computer-readable medium for recording a program for causing a computer to execute a search menu creation method for creating a search menu based on a plurality of input data,
A recording medium comprising a program for causing a computer to execute the search menu creation method according to any one of claims 16 to 30 .
JP15737298A 1997-06-06 1998-06-05 Search menu creation device, search menu creation method, and recording medium recording search menu creation program Expired - Fee Related JP4208288B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15737298A JP4208288B2 (en) 1997-06-06 1998-06-05 Search menu creation device, search menu creation method, and recording medium recording search menu creation program

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP14957097 1997-06-06
JP9-149570 1997-06-06
JP15737298A JP4208288B2 (en) 1997-06-06 1998-06-05 Search menu creation device, search menu creation method, and recording medium recording search menu creation program

Publications (2)

Publication Number Publication Date
JPH1153368A JPH1153368A (en) 1999-02-26
JP4208288B2 true JP4208288B2 (en) 2009-01-14

Family

ID=26479413

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15737298A Expired - Fee Related JP4208288B2 (en) 1997-06-06 1998-06-05 Search menu creation device, search menu creation method, and recording medium recording search menu creation program

Country Status (1)

Country Link
JP (1) JP4208288B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001167174A (en) * 1999-12-08 2001-06-22 Yamauchi Jimusho:Kk Dealing and inquiry system
US8356044B2 (en) * 2009-01-27 2013-01-15 Palo Alto Research Center Incorporated System and method for providing default hierarchical training for social indexing

Also Published As

Publication number Publication date
JPH1153368A (en) 1999-02-26

Similar Documents

Publication Publication Date Title
Ehrmann et al. Extended overview of CLEF HIPE 2020: named entity processing on historical newspapers
JP5744873B2 (en) Trusted Query System and Method
EP0883069A1 (en) A retrieval menu creation device and method, and a recording medium storing a retrieval menu creation program
US20040049499A1 (en) Document retrieval system and question answering system
Uma et al. Formation of SQL from natural language query using NLP
US20090094223A1 (en) System and method for classifying search queries
US20090157664A1 (en) System for extracting itineraries from plain text documents and its application in online trip planning
JP2002297602A (en) Method and device for structured document retrieval, structured document managing device, program, and recording medium
JP2010003015A (en) Document search system
US20050060651A1 (en) Electronic document indexing system and method
US20110196879A1 (en) System And Method For Propagating Classification Decisions
JP2007249322A (en) Document visualization device and document visualization program
EP1099171B1 (en) Accessing a semi-structured database
JP4821039B2 (en) Place name information extraction apparatus, extraction method thereof, and recording medium
JP3612769B2 (en) Information search apparatus and information search method
JP4208288B2 (en) Search menu creation device, search menu creation method, and recording medium recording search menu creation program
JP4423841B2 (en) Keyword determination device, determination method, document search device, search method, document classification device, classification method, and program
Rodosthenous et al. GeoMantis: Inferring the Geographic Focus of Text using Knowledge Bases.
Jagerman Creating, maintaining and applying quality taxonomies
JP2003036261A (en) Device, program, and method for automatically classifying sentence, and computer readable recording medium recorded with automated sentence classifying program
Stephenson Knowledge browsing—front ends to statistical databases
JPH11154164A (en) Adaptability calculating method in whole sentence search processing and storage medium storing program related to the same
JP5115631B2 (en) Place name information extraction device, control method, recording medium, and map information search device
CN101310274A (en) A knowledge correlation search engine
JPH08305726A (en) Information retrieving device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050311

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080430

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080924

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081021

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees