JP3711710B2 - Information search and collection system and storage medium storing information search and collection program - Google Patents

Information search and collection system and storage medium storing information search and collection program Download PDF

Info

Publication number
JP3711710B2
JP3711710B2 JP27131497A JP27131497A JP3711710B2 JP 3711710 B2 JP3711710 B2 JP 3711710B2 JP 27131497 A JP27131497 A JP 27131497A JP 27131497 A JP27131497 A JP 27131497A JP 3711710 B2 JP3711710 B2 JP 3711710B2
Authority
JP
Japan
Prior art keywords
information
class
content
collection
collected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP27131497A
Other languages
Japanese (ja)
Other versions
JPH10228488A (en
Inventor
仁 宮坂
真司 三輪
敏雄 田中
道博 長石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP27131497A priority Critical patent/JP3711710B2/en
Publication of JPH10228488A publication Critical patent/JPH10228488A/en
Application granted granted Critical
Publication of JP3711710B2 publication Critical patent/JP3711710B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ある特定の情報をインターネット上から収集する際、ユーザの入力するキーワードに関連する多数の情報の中からユーザの要求に見合った情報を収集してその収集した情報を1つの包括的な情報として出力する情報検索収集方法およびそのシステムに関する。
【0002】
【従来の技術】
最近、インターネットを利用して各種情報の検索したり収集することが可能になってきた。インターネット上から情報の検索・収集を行うには、たとえば、ユーザの入力したキーワードをサーチエンジンにかけて、そのキーワードに対してヒットしたすべてのページのアドレスを出力するというような検索方法がある。たとえば、或る有名な人物についての情報を収集しようとして、その人物の氏名をキーワードとして入力すると、そのキーワードに対してヒットするページのアドレスがすべて出力される。これによって、ユーザは、その人物に関する様々な情報の中で、ユーザの必要とする情報を得るために、その情報が有りそうなページをアクセスして、必要な情報のみを取り出すというような作業を行うことで、所望とする情報を得るようにしている。
【0003】
【発明が解決しようとする課題】
しかしながら、上述したような検索・収集方法では、情報収集しようとする人物が多方面に活躍しているような人物である場合には、氏名だけのキーワードで検索すると、検索されるページ数は、ときには数百ページにもなることがある。これは、人物だけではなく、たとえば、ある施設などについての情報を得ようとする場合も、有名な施設の場合には、色々な分野にその施設の情報が存在している可能性が高く、施設名をキーワードとして検索・収集しようとすると、膨大なページ数が検索されることになる。
【0004】
このような検索・収集の手間を少しでも改善する方法として、たとえば、収集しようとする情報についてその情報を表す複数のキーワードを入力可能として、すべてのキーワードに対してヒットするページのアドレスを出力したり、キーワードが一定の数以上出てくるページのみのアドレスを出力するというように、ある程度の情報絞り込みを行うようにすることもなされている。
【0005】
具体例としては、広い分野で活躍する或る有名な人物の情報として、その人物の主な職業とそれに関連する様々な情報を収集しようとする場合、その人物の氏名と主な職業をキーワードとして入力することにより、両方のキーワードに対してヒットするページのみのアドレスを出力することにより、取り出されるページ数は大幅に絞り込まれることになる。
【0006】
しかしながら、このようにして或る程度の絞り込みがなされて取り出された場合でも、ユーザが本当に必要とする情報は取り出されたページすべてではなく、その中の一部であることが多く、結局は、取り出されたページの中から、ユーザが必要な情報を取捨選択するというような作業を行う必要がある。
【0007】
このように、現段階の検索サービスでは、ある程度の情報の絞り込みはなされた場合でも、結局は、検索された大量の情報の中からユーザが自ら必要な情報を探して1つの情報ページとして編集する必要があり、使い勝手の面でさらに改善の余地がある。
【0008】
そこで本発明は、ユーザからのキーワードをもとに、ユーザの入力要求解析を行い、ユーザの要求をシステムが理解できるような形式に変換して、予め設定したアルゴリズムに基づいて情報の検索・収集を行い、ユーザの要求入力に応じた包括的な情報として提供できるようにすることを目的としている。
【0009】
【課題を解決するための手段】
本発明の情報検索収集方法は、要求入力に基づいて情報を検索して収集する情報検索収集方法において、要求入力をシステムが理解できる要求入力形式とし、その要求入力形式に基づき、当該要求入力に関連した情報を収集し、その収集した結果を解析して、必要なコンテンツを取り出し、取り出したコンテンツを要求入力に応じた包括的な情報として出力することを特徴としている。
【0010】
さらに、具体的には、要求入力に基づいて情報を検索して収集する情報検索収集方法において、オブジェクト指向プログラミングに基づいてそれぞれのコンテンツのカテゴリを表現するカテゴリクラスを定義し、各カテゴリクラスは各カテゴリごとに収集すべき情報項目がプロパティとして設定されるとともに、それぞれのプロパティごとに情報取得方法や情報の加工処理方法などを記述したメソッドを有し、要求入力をシステムが理解できる要求入力形式としたのち、その要求入力を前記カテゴリクラスに分類し、その要求入力に対し、その要求入力が属するクラスのプロパティに基づき、かつ、前記メソッドに記述された内容に基づいて、前記収集すべき情報項目に関する情報を検索して収集するとともに、その収集結果を要求入力に応じた包括的な情報として出力することを特徴としている。
【0011】
そして、前記収集すべき情報項目を表現するタイトルクラスを定義し、それぞれのタイトルクラスは、それぞれの情報項目ごとにそれぞれの情報項目に対する情報の内容がプロパティとして設定されるとともに、それぞれの情報の内容ごとにデータ取得方法やデータの加工処理方法などを記述したメソッドを有するようなクラス構造を持つようにしてもよい。
【0012】
さらに、前記情報の内容を表現する情報形式クラスを定義し、それぞれの情報形式クラスは、それぞれの情報の内容ごとにそれぞれの情報内容に対する情報の表し方がプロパティとして設定されるとともに、それぞれの情報の表し方ごとにデータ取得方法やデータの加工処理方法などを記述したメソッドを有するようなクラス構造を持つようにしてもよい。
【0013】
さらにまた、このような情報検索収集方法において、前記各カテゴリごとのプロパティを表示し、その表示されたプロパティの中から任意のプロパティを選択可能とするようにしてもよい。
【0014】
また、本発明の情報検索収集システムは、要求入力に基づいて情報を検索して収集する情報検索収集システムにおいて、要求入力をシステムが理解できる要求入力形式とする要求解析手段と、この要求解析手段により得られた要求入力形式に基づき、当該要求入力に関連した情報を収集する情報収集手段と、その収集した結果を解析して、必要なコンテンツを取り出すコンテンツ解析・収集手段と、このコンテンツ解析・収集手段により取り出されたコンテンツを要求入力に応じた包括的な情報として編集して出力する情報編集・出力手段とを有することを特徴としている。
【0015】
さらに具体的には、要求入力に基づいて情報を検索して収集する情報検索収集システムにおいて、要求入力をシステムが理解できる要求入力形式とする要求解析手段と、この要求解析手段により得られた要求入力形式に基づき、当該要求入力に関連した情報を収集する情報収集手段と、その収集した結果を解析して、必要なコンテンツを取り出すコンテンツ解析・収集手段と、このコンテンツ解析・収集手段により取り出されたコンテンツを要求入力に応じた包括的な情報として編集して出力する情報編集・出力手段とを有し、オブジェクト指向プログラミングに基づいてそれぞれのコンテンツのカテゴリを表現するカテゴリクラスを定義し、各カテゴリクラスは各カテゴリごとに収集すべき情報項目がプロパティとして設定されるとともに、それぞれのプロパティごとに情報取得方法や情報の加工処理方法などを記述したメソッドを有し、要求入力をシステムが理解できる要求入力形式としたのち、その要求入力を前記カテゴリクラスに分類し、その要求入力に対し、その要求入力が属するクラスのプロパティに基づき、かつ、前記メソッドに記述された内容に基づいて、前記収集すべき情報項目に関する情報を検索して収集するとともに、その収集した結果を要求入力に応じた包括的な情報として出力することを特徴としている。
【0016】
そして、このような情報検索収集システムにおいて、前記収集すべき情報項目をタイトルクラスとして定義し、それぞれのタイトルクラスは、それぞれの情報項目ごとにそれぞれの情報項目に対する情報の内容がプロパティとして設定されるとともに、それぞれの情報の内容ごとにデータ取得方法やデータの加工処理方法などを記述したメソッドを有するようなクラス構造を持つようにしてもよい。さらに、前記情報の内容を情報形式クラスとして定義し、それぞれの情報形式クラスは、それぞれの情報の内容ごとにそれぞれの情報内容に対する情報の表し方がプロパティとして設定されるとともに、それぞれの情報の表し方ごとにデータ取得方法やデータの加工処理方法などを記述したメソッドを有するようなクラス構造を持つようにしてもよい。
【0017】
さらにまた、このような情報検索収集システムにおいて、前記各カテゴリごとのプロパティを表示し、その表示されたプロパティの中から任意のプロパティを選択可能としてもよい。
また、本発明の情報検索収集プログラムを記憶した記憶媒体は、要求入力に基づいて情報を検索して収集する処理を実行する情報検索収集プログラムを記憶した記憶媒体において、前記情報検索収集プログラムが、
要求入力をシステムが理解できる要求入力形式とする要求解析ステップと、
この要求解析ステップにより得られた要求入力形式に基づき、当該要求入力に関連した情報を収集する情報収集ステップと、
その収集した結果を解析して、必要なコンテンツを取り出すコンテンツ解析・収集ステップと、
このコンテンツ解析・収集ステップにより取り出されたコンテンツを要求入力に応じた包括的な情報として編集して出力する情報編集・出力ステップと、
を実行することを特徴としている。
さらに具体的には、要求入力に基づいて情報を検索して収集する処理を実行する情報検索収集プログラムを記憶した記憶媒体において、前記情報検索収集プログラムが、
要求入力をシステムが理解できる要求入力形式とする要求解析ステップと、
この要求解析ステップにより得られた要求入力形式に基づき、当該要求入力に関連した情報を収集する情報収集ステップと、
その収集した結果を解析して、必要なコンテンツを取り出すコンテンツ解析・収集ステップと、
このコンテンツ解析・収集ステップにより取り出されたコンテンツをユーザからの要求入力に応じた包括的な情報として編集して出力する情報編集・出力ステップと、を有し、
オブジェクト指向プログラミングに基づいてそれぞれのコンテンツのカテゴリを表現するカテゴリクラスを定義し、各カテゴリクラスは各カテゴリごとに収集すべき情報項目がプロパティとして設定されるとともに、それぞれのプロパティごとに情報取得方法や情報の加工処理方法などを記述したメソッドを有し、ユーザからの要求入力をシステムが理解できる要求入力形式としたのち、その要求入力を前記カテゴリクラスに分類し、その要求入力に対し、その要求入力が属するクラスのプロパティに基づき、かつ、前記メソッドに記述された内容に基づいて、前記収集すべき情報項目に関する情報を検索して収集するとともに、その収集した結果をユーザの要求入力に応じた包括的な情報として出力する処理を実行することを特徴としている。
【0018】
上述したように、本発明は、ユーザからの要求入力をシステムが理解できる要求入力形式としたのち、その要求入力をカテゴリクラスに分類し、その要求入力に対し、その要求入力が属するクラスのプロパティに基づき、かつ、各プロパティごとのメソッドに記述された内容に基づいて情報を検索して収集するとともに、収集結果をユーザの要求入力に応じた包括的な情報として出力するようにしている。これにより、システム側では、ユーザの入力するキーワードに基づいて、予め定められたアルゴリズムにしたがって処理するだけでユーザの所望とする情報の検索収集を行うことができ、効率の良い情報検索・収集が可能となる。また、収集された情報は、ユーザの要求入力に応じた1つのまとまった情報として取り出すことができる。
【0019】
また、情報項目をタイトルクラスとして定義し、それぞれのタイトルクラスごとに、情報内容をプロパティとして設定し、そのメソッドを決めていることにより、前記情報項目ごとの情報内容の情報収集の仕方や情報の加工の仕方などを示すメソッドを、ユーザからのキーワードで分類されるカテゴリクラスごとに設定する必要が無くなり、アルゴリズムを簡素化することができ、処理の効率化が図れる。
【0020】
さらに、それぞれの情報の内容ごとに、情報の表し方をプロパティとして設定するとともに、それぞれの情報の表し方ごとにデータ取得方法やデータの加工処理方法などを記述したメソッドを有するようにしているので、異なったクラスにおいて同じ形式の情報である場合などに、共通のアルゴリズムで処理を行うことができ、処理の効率化が図れる。
【0021】
また、各カテゴリごとのプロパティをユーザに対して表示し、その表示されたプロパティの中から任意のプロパティをユーザが選択可能としているので、ユーザカスタマイズが実現でき、ユーザの好みに応じた情報のみに対して検索収集するということも可能となり処理の効率化が図れる。
【0022】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照して説明する。
【0023】
本発明の概略的な処理としては、図1に示すように、ユーザからの検索要求を受け付けると、その検索要求の解析を行い(ステップs1)、システムが理解できる形式にする。そして、ユーザからの要求入力に基づいて、たとえばサーチエンジンにかけてその検索要求に関連した情報報収集を行い(ステップs2)、コンテンツ解析を行って、必要な情報の収集を行う(ステップs3)。そして、収集した情報の編集を行いユーザに対してその情報を表示する(ステップs4)。以上の処理の流れは本発明が行おうとする概略的な処理であり、個々の処理について具体的に説明する。
【0024】
たとえば、ユーザが世界的に有名な人物(この人物を「A」と呼ぶ)について、その人物の情報を収集しようとする場合について説明する。この人物Aは、技術者としても経営者としても、また、他の分野においても世界的に有名な人物であるとし、ここでは、ユーザは、予め定義されたカテゴリクラス構造に基づいて、人物Aの技術者ならびに経営者としての情報を収集しようとするものとする。ユーザが必要とする人物Aの技術者および経営者としての情報としては、たとえば、人物Aの顔写真、経歴、技術者としての技術論文、経営者としての資産などであるとする。
【0025】
今、ユーザが人物Aの技術者および経営者としての情報を得ようとした場合、その情報要求入力方法は種々の方法が考えられるが、その1つの方法として、たとえば、キーボードから人物Aの氏名「A」を入力する。この段階では、システム側は、その入力を解析すると、ユーザの要求は「Aという名前の人物」について何らかの情報検索要求であることを理解する。次に、ユーザがこの人物Aについて収集しようとする情報を入力する。ここでは、ユーザは「A」という人物の技術者および経営者としての情報を収集しようとしているので、技術者および経営者というような内容を入力する。
【0026】
これにより、システム側では、ユーザからの要求は、「人物、技術者であり経営者、氏名はA」であるというように、予め定義されたカテゴリクラス構造に基づいた入力形式とする。
【0027】
すなわち、本発明は、図2に示すようなオブジェクト指向プログラミングによるクラス構造(これをクラス構造1という)を有する。図2からもわかるように、コンテンツとしてカテゴリがあって、そのカテゴリとしては、たとえば、施設、人物、製品などのカテゴリクラスがあって、そのカテゴリクラスのサブクラスとして、人物の場合は、技術者、経営者、さらには、図示されていないが、スポーツ選手、政治家などというようなクラスを持っている。
【0028】
このようなクラス構造において、たとえば、「A」は、人物クラスのサブクラスである経営者クラスと技術者クラスを継承した技術者/経営者のインスタンスということになる。
【0029】
ユーザの要求入力は、カテゴリクラスの1つのクラスのインスタンスの場合もあるが、上述の例のように、複数のカテゴリクラスを継承したインスタンスとなる場合もある。
【0030】
そして、カテゴリの中のどのクラスかが決まれば、それぞれのクラスごとに、収集すべき情報の項目が決まるようになっている。たとえば、図3に示すように、クラスが人物クラスであれば、たとえば、顔、経歴、職業などがプロパティとして設定され、経営者クラスであれば、たとえば、資産がそのプロパティとして設定され、技術者クラスであれば、たとえば、論文がそのプロパティとして設定されるというように、それぞれのクラスごとに収集すべき情報の項目をプロパティとして予め設定しておく。
【0031】
さらに、それぞれのプロパティに対して、その情報収集の仕方(constructor)とユーザに対する情報表示の仕方(show)をメソッドとして予め記述しておく。
【0032】
たとえば、人物クラスのプロパティである「顔」に対しては、「A」という氏名をキーワードとしてサーチエンジンにかけられて収集された情報の中で、顔画像ファイルで、かつ、タイトルがその人物の名前である画像を取り出すというように、それぞれの項目ごとに情報収集の仕方を記述しておく。
【0033】
このように、この実施の形態では、たとえば、人物名、経営者/技術者というようなユーザの入力したキーワードを、システムが予め持っているカテゴリクラス構造に基づいた入力形式としたのち、それぞれのカテゴリクラスに対して、予め設定されたプロパティ(人物クラスに対しては、顔、経歴など、経営者クラスに対しては資産など、技術者クラスに対しては論文など)ごとに予め定められた情報収集の仕方に基づいて情報収集をして、収集された情報を包括的な情報としてユーザに出力するようにしている。
【0034】
つまり、この場合、ユーザがカテゴリを特定するだけで、たとえば、「A」という人物に対して、その顔写真、経歴、論文、資産など、人物Aの経営者/技術者としての情報が1つのページにまとめられた形でユーザに対して表示される。ところで、図2に示したクラス構造1は、コンテンツの中身としてカテゴリのそれぞれのクラスあるいはそのサブクラスを設定するクラス構造の一例であり、それぞれのカテゴリクラスおよびそのサブクラスについての情報収集項目をプロパティとして設定し、それぞれのプロパティごとに情報の収集方法や情報の加工処理などについてをメソッドとして記述した例について示したが、コンテンツの中身として、タイトルクラスに対する収集項目をプロパティとして設定し、そのプロパティごとに、メソッドを定めるということもできる。
【0035】
つまり、クラス構造1におけるプロパティ(たとえば、顔、経歴、資産、論文など)は、ユーザに対して表示すべきページを作成するときに、それぞれの項目のタイトルとなるもので、これをタイトルクラスとして、このタイトルクラスについてのプロパティを予め定め、それぞれのプロパティごとに、情報の収集の仕方(constructor)とユーザに対する情報表示の仕方(show)をメソッドとして予め記述しておく。
【0036】
図4に示すクラス構造(クラス構造2という)の例では、タイトルクラスとして、顔クラス、経歴クラス、論文クラス、資産クラスなどを定めた例を示し、それぞれのタイトルクラスについて、図5に示すように、たとえば、顔クラスに対しては、その顔クラスの情報の内容として、たとえば、写真とその写真をインターネット上のどこから取り出したかを示す情報ソースURLをプロパティとして設定し、また、経歴クラスに対しては、その情報の内容として、テキスト、リストなどをプロパティとして設定し、論文クラスに対しては、その情報の内容として、たとえば、リストをプロパティとして設定し、それぞれのプロパティごとに、その情報の収集の仕方(constructor)とユーザに対する情報表示の仕方(show)をメソッドとして予め記述しておく。
【0037】
このように、それぞれのタイトルクラスごとに、各タイトルクラスに対する情報の内容などを表すプロパティを定め、それぞれのプロパティについて、1つ1つの情報内容ごとに予め定められた情報の収集の仕方(constructor)と、予め定められた情報表示の仕方(show)を定めておく。
【0038】
このような方法を採用することによって、異なったカテゴリクラスで共通するプロパティが存在するような場合、それぞれのカテゴリクラスごとに、それぞれのタイトルについての情報の収集の仕方などのメソッドを記述する必要がなくなる。
【0039】
さらに、前記クラス構造2で示した写真、テキスト、リストなど情報の内容ごとに情報の表し方を示すプロパティについて情報形式クラスを定義することもできる。
【0040】
たとえば、タイトルを表すそれぞれの項目の情報の内容について、図6に示すように、テキスト、グラフィック、表、リスト、動画、音などというようにそれぞれの情報形式を表すクラス構造(クラス構造3という)を設定する。そして、図7に示すように、たとえば、テキストクラスであれば、フォーマット、サイズなどをプロパティとして設定し、情報取得方法や情報の加工処理方法などをメソッドに記述しておく。このメソッドには、テキストであれば、テキストをどのように収集して、フォーマットやサイズをどのようにするか、あるいは内容を要約するかなどに関しての記述がなされている。
【0041】
このように、タイトルを表す項目の情報内容を情報形式クラスとしてクラス構造で表すことにより、異なったカテゴリクラスで、同じ形式の情報を取り出すような場合、情報収集処理を共通化することも可能である。
【0042】
たとえば、カテゴリクラスが人物クラスであった場合、その人物クラスにおいて収集すべき情報にはその人物に関するテキスト情報も存在し、また、カテゴリクラスが施設クラスの場合もその施設の概要を表すテキスト情報もある。このように、異なったカテゴリクラスであっても、それぞれのカテゴリクラスに対応する情報項目の中身を表す情報形式(情報内容)が共通する場合も多い。したがって、情報項目の中身を表す形式に対する情報収集処理の仕方を共通化することにより、より一層、情報収集の効率化が図れる。
【0043】
以上説明した実施の形態は、ユーザが人物「A」について、経営者/技術者としての情報を収集しようとして、システム側にキーワードとして、人物「A」の氏名として「A」と「経営者/技術者」というようなキーワードを入力した場合における情報検索・収集処理である。
【0044】
このように、ユーザが所定のキーワードを入力すると、まず、そのキーワードに基づいてシステム側が理解できるような要求入力形式にするが、この場合は、ユーザの入力した「A」と「経営者/技術者」を解析して、ユーザの検索要求は「或る人物であり、その人物は経営者であり技術者であって、その名前はAである」というような形式、つまり、「人物・経営者/技術者・A」というようなシステムが理解できるような形に変換する。
【0045】
そして、それぞれのカテゴリクラス(人物クラス、経営者クラス、技術者クラス)について予め設定されたプロパティ(人物クラス:顔、経歴、職業など、経営者クラス:資産など、技術者クラス:論文など)について予め定められたメソッドにより情報収集を行ったのち、収集した情報をユーザの要求に応じて所定の形式として表示する。図8はこのようにして収集された情報の表示例を示すものである。この場合、その表示ページにおける各項目ごとのタイトルともなるカテゴリクラスのプロパティ(この場合、顔、経歴、論文、資産)は、図4に示すようなクラス構造2にもとづいて図5の例のようにして情報収集することができる。さらに、それぞれのタイトルクラスのそれぞれの形式(テキストクラス、グラフィッククラス、写真クラスなど)ごとに図6のようなクラス構造3にもとづいて図7の例のようにして情報収集することもできる。
【0046】
この図8の例では、人物「A」の顔写真とその情報ソースURLが表示され、経歴として経歴の要約、経歴リストが表示され、論文としては論文リスト、資産としてはその概要が表示される。このように、ユーザの入力したキーワードに基づいて検索された数多くの情報の中からユーザの要求に応じた情報のみが取り出され、それらが1つのまとまった情報として出力される。
【0047】
なお、ユーザからの要求の受け付けの仕方としては、前記実施の形態では、キーボードからユーザが一方的に入力する例について説明したが、これに限られるものではなく、たとえば、対話方式としてもよい。以下、この対話方式について概略的に説明する。
【0048】
まず、ユーザが「Aという人物について知りたい」というような入力を行う。これにより、システム側ではユーザからの入力に基づいて、入力解析を行い、この段階では、「人物、−?−、A」というような解析結果であり、システム側から、「Aについて知っていることは有りますか」または「どのようなことについて知りたいですか」というような表示を行う。
【0049】
これにより、ユーザは「Aは情報産業では、ビジョナリーといわれています」というような応答を行うと、そこで、システムはユーザの要求を「人物・経営者/技術者、A」という形式に変換して、これに基づいて検索処理を行う。また、この対話方式は、キーボードと画面表示による対話方式ではなく、自然言語による対話方式でも可能である。
【0050】
また、入力されたキーワードがインスタンスとなるようなカテゴリクラスのプロパティをユーザに表示して、その表示されたプロパティのうちユーザがプロパティを選択するようにしてもよい。さらに、システムの画面上に図2で示したようなクラス構造を表示し、ユーザがそのカテゴリクラスの中から必要なカテゴリクラスをクリックして選択するようにし、さらに、そのカテゴリクラスのプロパティを表示して、その表示されたプロパティからユーザが選択するというように、表示された内容からユーザが選択するようにしてもよい。
【0051】
このように、ユーザが必要なプロパティを選択したり、クラスを選択するようにして、それに基づいた処理を行わせるようにすることにより、必要な検索項目だけについて処理を行えばよいため、処理の効率化が図れ、高速なデータ検索収集処理が可能となる。
【0052】
図9は本発明のシステムの概略構成を示すもので、要求解析手段11、情報収集手段12、コンテンツ解析・収集手段13、情報編集手段14、情報表示手段15などを主な構成要素としている。
【0053】
要求解析手段11はユーザが入力したキーワードをシステムが理解できる形式にするものである。つまり、前記したように、ユーザの入力した内容に基づいて、たとえば、「人物・経営者/技術者・A」というような形式にする。
【0054】
このような要求形式に基づいて、情報収集手段12により、インターネット上において、関連する情報を収集し、その収集した情報の中からコンテンツ解析・収集手段13により、必要な情報を収集する。この情報の収集の仕方は、前記したように、たとえば、人物クラスであれば、そのプロパティとしての顔、経歴、職業などを、それぞれのプロパティごとに定められたメソッドにもとづいて収集する。
【0055】
そして、収集されたそれぞれの情報を情報編集手段14により所定のフォーマットに編集して情報表示手段15により情報表示を行う。この編集作業は、単に決められたフォーマットにするというだけではなく、たとば、テキストデータであれば、場合によっては内容を要約したり、グラフィックデータであれば、データ圧縮したり縮小したりというような処理も含むものであり、このような編集作業ののち、図8に示すようなフォーマットのページの情報として出力される。
【0056】
ところで、本発明は、サーバだけではなく、クライアントソフトでも実現できる。この場合、たとえば、これまで説明したカテゴリクラスのようなものをクライアントソフトとして持っていて、ユーザがそのカテゴリクラスのクラス構造に基づいてキーワード入力して、最終的な結果をサーバから取り出すというように、一部の処理をクライアントソフトで行い、処理の多い部分をサーバで行うというようなクライアントソフトとサーバとで処理を分散して行うことも可能であるし、また、すべての処理をクライアントソフトで行わせることも可能である。
【0057】
なお、本発明の処理を行う処理プログラムは、フロッピィディスク、光ディスク、ハードディスクなどの記憶媒体に記憶させておくことができ、本発明は、それらの記憶媒体をも含むものであり、また、ネットワークからデータを得る形式でもよい。
【0058】
【発明の効果】
本発明によれば、ユーザからの要求入力をシステムが理解できる要求入力形式としたのち、その要求入力をカテゴリクラスに分類し、その要求入力に対し、その要求入力が属するクラスのプロパティに基づき、かつ、各プロパティごとのメソッドに記述された内容に基づいて情報を検索して収集するとともに、収集結果をユーザの要求入力に応じた包括的な情報として出力するようにしている。これにより、システム側では、ユーザの入力するキーワードに対して、予め定められたアルゴリズムにしたがって処理するだけでユーザの所望とする情報の検索収集が行え、効率の良い情報検索・収集が可能となる。そして、収集された情報は、ユーザの要求入力に応じた1つのまとまった情報として取り出すことができる。たとえば、人物に対する情報収集であれば、その人物の経歴や仕事の内容などの項目をタイトルとし、タイトル別にそれぞれの情報が編集された状態で情報提供することができる。
【0059】
また、ユーザからの要求入力に対してシステムが出力する情報の項目ごとにタイトルクラスを定義し、それぞれのタイトルクラスは、それぞれの項目ごとにそれぞれの項目に対する情報の内容がプロパティとして設定されるとともに、それぞれの情報内容ごとにデータ取得方法やデータの加工処理方法などを記述したメソッドを有するようにしている。このように、タイトルクラスごとに、情報内容をプロパティとして設定し、そのメソッドを決めていることにより、前記項目(タイトル)に対する情報内容の情報収集の仕方や情報の加工の仕方などを示すメソッドを、ユーザからのキーワードで分類されるカテゴリごとに設定する必要が無くなり、アルゴリズムを簡素化することができ、処理の効率化が図れる。
【0060】
さらに、前記情報の内容ごとに情報の表し方を示す情報形式クラスを定義し、それぞれの情報形式クラスは、それぞれの情報の内容ごとにそれぞれの内容に対する情報の表し方がプロパティとして設定されるとともに、それぞれの情報の表し方ごとにデータ取得方法やデータの加工処理方法などを記述したメソッドを有すりようにしている。これにより、異なったクラスにおいて同じ形式の情報である場合などに、共通のアルゴリズムで処理を行うことができ、処理の効率化が図れる。
【0061】
また、各カテゴリごとのプロパティをユーザに対して表示し、その表示されたプロパティの中から任意のプロパティをユーザが選択可能とすることにより、ユーザカスタマイズが実現でき、ユーザの好みに応じた情報のみに対して検索収集するということも可能となり、処理の効率化が図れ、有料の検索サービスである場合には、安価な料金でサービスを受けることができる。
【0062】
以上のように本発明によれば、ユーザからの要求入力に基づいてインターネット上の情報を検索・収集する際、従来のように、膨大な検索結果からユーザ自身が情報の絞り込みを行う必要が無くなり、所定のアルゴリズムに従ってユーザの必要とする情報が項目ごとに1つのまとまった情報として効率よく取り出すことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態における情報検索収集処理手順を概略的に説明するフローチャート。
【図2】本発明の実施の形態における情報検索収集処理においてユーザの要求入力に対応するカテゴリクラスのクラス構造を示す図。
【図3】図2で示したカテゴリクラス構造におけるプロパティとメソッドの一例を説明する図。
【図4】図3で示したカテゴリクラスにおけるプロパティをタイトルクラスとしたクラス構造を示す図。
【図5】図4で示したタイトルクラス構造におけるプロパティとメソッドの一例を説明する図。
【図6】図4で示したタイトルクラスにおけるプロパティを情報形式クラスとしたクラス構造を示す図。
【図7】図6で示した情報形式クラス構造におけるプロパティとメソッドの一例を説明する図。
【図8】本発明の実施の形態における情報検索収集処理によって出力される情報のフォーマットの一例を説明する図。
【図9】本発明の実施の形態における概略的なシステム構成図。
【符号の説明】
11 要求解析手段
12 情報収集手段
13 コンテンツ解析・収集手段
14 情報編集手段
15 情報表示手段
[0001]
BACKGROUND OF THE INVENTION
When collecting specific information from the Internet, the present invention collects information that meets a user's request from a large number of information related to a keyword input by the user, and collects the collected information as one comprehensive. The present invention relates to an information search and collection method and system for outputting as simple information.
[0002]
[Prior art]
Recently, it has become possible to search and collect various information using the Internet. In order to search and collect information from the Internet, for example, there is a search method in which a keyword input by a user is applied to a search engine and addresses of all pages hit by the keyword are output. For example, if information about a famous person is collected and the name of the person is input as a keyword, all addresses of pages hit with the keyword are output. As a result, in order to obtain the information that the user needs among various information related to the person, the user accesses a page where the information is likely to exist and retrieves only the necessary information. By doing so, the desired information is obtained.
[0003]
[Problems to be solved by the invention]
However, in the search / collection method as described above, if the person whose information is to be collected is a person who is active in many fields, when searching with a keyword of only the name, the number of pages searched is Sometimes it can be hundreds of pages. This is not only for people, but for example, if you are trying to get information about a certain facility, it is highly likely that information about the facility exists in various fields in the case of a famous facility. If an attempt is made to search and collect the facility name as a keyword, a huge number of pages are searched.
[0004]
As a method to improve the search and collection effort as much as possible, for example, it is possible to input a plurality of keywords representing the information to be collected and output the address of the page hit for all the keywords. In some cases, information is narrowed down to some extent, such as outputting addresses only for pages where a certain number of keywords appear.
[0005]
As a specific example, when collecting information on a person's main occupation and various related information as information on a famous person active in a wide field, the person's name and main occupation are used as keywords. By inputting, the addresses of only the pages that hit both keywords are output, thereby greatly reducing the number of pages to be extracted.
[0006]
However, even if a certain degree of narrowing is performed in this way, the information that the user really needs is not all of the retrieved pages, but is often a part of them. It is necessary to perform an operation in which the user selects necessary information from the extracted pages.
[0007]
As described above, in the current search service, even if the information is narrowed down to some extent, the user eventually searches for necessary information from a large amount of searched information and edits it as one information page. It is necessary and there is room for further improvement in terms of usability.
[0008]
Therefore, the present invention analyzes the user input request based on the keyword from the user, converts the user request into a format that can be understood by the system, and searches and collects information based on a preset algorithm. The purpose is to be able to provide comprehensive information according to user request input.
[0009]
[Means for Solving the Problems]
The information search and collection method of the present invention is an information search and collection method for searching and collecting information based on a request input. The request input is a request input format that can be understood by the system, and the request input is based on the request input format. It is characterized by collecting related information, analyzing the collected results, extracting necessary contents, and outputting the extracted contents as comprehensive information according to a request input.
[0010]
More specifically, in an information search and collection method for searching and collecting information based on a request input, a category class that represents each content category is defined based on object-oriented programming. Information items to be collected for each category are set as properties, and each property has a method that describes the information acquisition method and information processing method, etc. After that, the requested input is classified into the category class, and the information items to be collected are based on the properties of the class to which the requested input belongs and the contents described in the method. Search and collect information about the It is characterized by outputting a comprehensive information.
[0011]
Then, title classes representing the information items to be collected are defined, and each title class is set with information content for each information item as a property for each information item, and each information content Each class structure may have a method describing a data acquisition method, a data processing method, and the like.
[0012]
Furthermore, an information format class that expresses the content of the information is defined, and each information format class is set as a property how to represent information for each information content, and each information Each of the representation methods may have a class structure having a method describing a data acquisition method, a data processing method, and the like.
[0013]
Furthermore, in such an information search and collection method, the property for each category may be displayed so that an arbitrary property can be selected from the displayed properties.
[0014]
Also, the information search and collection system of the present invention is a request analysis means for making a request input a request input format that can be understood by the system in the information search and collection system for searching and collecting information based on the request input, and the request analysis means. Information collection means for collecting information related to the request input, content analysis / collection means for analyzing the collected results and extracting necessary content, and the content analysis / collection means. It is characterized by having information editing / outputting means for editing and outputting the content extracted by the collecting means as comprehensive information corresponding to the request input.
[0015]
More specifically, in an information search and collection system that searches and collects information based on a request input, a request analysis unit that makes the request input a request input format that can be understood by the system, and a request obtained by the request analysis unit Based on the input format, information collection means for collecting information related to the request input, content analysis / collection means for analyzing the collected results and extracting necessary contents, and the content analysis / collection means Information editing / output means for editing and outputting the content as comprehensive information corresponding to the requested input, and defining a category class that represents each content category based on object-oriented programming. In the class, information items to be collected for each category are set as properties. Each property has a method that describes the information acquisition method and information processing method, etc., and the request input is made into a request input format that can be understood by the system. Based on the properties of the class to which the requested input belongs and based on the contents described in the method, information related to the information item to be collected is retrieved and collected, and the collected result is requested. It is characterized by being output as comprehensive information according to the input.
[0016]
In such an information search and collection system, the information items to be collected are defined as title classes, and the content of information for each information item is set as a property in each title class for each information item. At the same time, each information content may have a class structure having a method describing a data acquisition method, a data processing method, and the like. Further, the information content is defined as an information format class, and each information format class is set with a property representing how to represent the information for each information content, and each information representation class. Each method may have a class structure having a method describing a data acquisition method, a data processing method, and the like.
[0017]
Furthermore, in such an information search and collection system, the property for each category may be displayed, and any property may be selected from the displayed properties.
In addition, the storage medium storing the information search and collection program of the present invention is a storage medium storing an information search and collection program that executes a process of searching and collecting information based on a request input.
A request analysis step for converting the request input into a request input format that the system can understand;
An information collecting step for collecting information related to the request input based on the request input format obtained by the request analysis step;
A content analysis / collection step that analyzes the collected results and retrieves the necessary content,
An information editing / output step for editing and outputting the content extracted by the content analysis / collection step as comprehensive information according to the request input,
It is characterized by performing.
More specifically, in a storage medium storing an information search collection program that executes processing for searching and collecting information based on a request input, the information search collection program includes:
A request analysis step for converting the request input into a request input format that the system can understand;
An information collecting step for collecting information related to the request input based on the request input format obtained by the request analysis step;
A content analysis / collection step that analyzes the collected results and retrieves the necessary content,
An information editing / output step for editing and outputting the content extracted by the content analysis / collection step as comprehensive information corresponding to a request input from the user;
Define category classes that represent each content category based on object-oriented programming. In each category class, information items to be collected for each category are set as properties. It has a method that describes the information processing method, etc., and after making the request input from the user into a request input format that can be understood by the system, the request input is classified into the category class, and the request input for the request input Based on the property of the class to which the input belongs and based on the contents described in the method, the information about the information item to be collected is searched and collected, and the collected result is determined according to the user's requested input. It is characterized by executing processing that outputs as comprehensive information. .
[0018]
As described above, according to the present invention, after the request input from the user is made into a request input format that can be understood by the system, the request input is classified into a category class, and the property of the class to which the request input belongs to the request input. In addition, information is retrieved and collected based on the contents described in the method for each property, and the collection result is output as comprehensive information corresponding to the user's request input. As a result, the system can search and collect information desired by the user simply by processing according to a predetermined algorithm based on a keyword input by the user, and efficient information search and collection can be performed. It becomes possible. The collected information can be taken out as a single piece of information corresponding to the user's request input.
[0019]
In addition, by defining information items as title classes, setting information contents as properties for each title class, and determining the method, information collection methods and information It is not necessary to set a method indicating the processing method for each category class classified by the keyword from the user, the algorithm can be simplified, and the processing efficiency can be improved.
[0020]
In addition, for each content of information, how to represent information is set as a property, and each information representation method has a method describing a data acquisition method, a data processing method, etc. When the information is in the same format in different classes, the processing can be performed with a common algorithm, and the processing efficiency can be improved.
[0021]
In addition, the property for each category is displayed to the user, and the user can select any property from the displayed properties, so user customization can be realized, and only information according to user preferences On the other hand, it is possible to collect data by searching, and the processing efficiency can be improved.
[0022]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0023]
As a schematic process of the present invention, as shown in FIG. 1, when a search request from a user is received, the search request is analyzed (step s1), and the system can understand it. Then, based on the request input from the user, for example, information information related to the search request is collected through a search engine (step s2), content analysis is performed, and necessary information is collected (step s3). Then, the collected information is edited and displayed to the user (step s4). The above process flow is a schematic process to be performed by the present invention, and each process will be specifically described.
[0024]
For example, a case will be described in which a user tries to collect information on a person who is famous around the world (this person is referred to as “A”). It is assumed that this person A is a person who is famous worldwide as an engineer, a manager, and in other fields. Here, the user A is based on a predefined category class structure. Suppose that it is going to collect information as an engineer and manager. It is assumed that the information as the engineer and manager of the person A required by the user includes, for example, a photograph of the face of the person A, a career history, a technical paper as the engineer, and an asset as the manager.
[0025]
Now, when the user tries to obtain information as an engineer and manager of the person A, there are various information request input methods. One method is, for example, the name of the person A from the keyboard. Enter “A”. At this stage, the system side analyzes the input and understands that the user's request is an information search request for “a person named A”. Next, the user inputs information to be collected about the person A. Here, since the user intends to collect information on the engineer and manager of the person “A”, the user inputs contents such as the engineer and manager.
[0026]
Thus, on the system side, the request from the user is in an input format based on a predefined category class structure, such as “person, engineer and manager, name is A”.
[0027]
In other words, the present invention has a class structure (referred to as class structure 1) by object-oriented programming as shown in FIG. As can be seen from FIG. 2, there is a category as content, and the category includes, for example, a category class such as facility, person, product, etc. As a subclass of the category class, There are managers and classes such as athletes and politicians, not shown.
[0028]
In such a class structure, for example, “A” is an instance of an engineer / manager who inherits the manager class and the engineer class which are subclasses of the person class.
[0029]
The user request input may be an instance of one class of the category class, but may be an instance inheriting a plurality of category classes as in the above example.
[0030]
When any class in the category is determined, items of information to be collected are determined for each class. For example, as shown in FIG. 3, if the class is a person class, for example, face, career, occupation, etc. are set as properties, and if it is a manager class, for example, an asset is set as that property, and the engineer If it is a class, for example, an item of information to be collected for each class is set in advance as a property such that a paper is set as the property.
[0031]
Further, for each property, a method of collecting information (constructor) and a method of displaying information to the user (show) are described in advance as methods.
[0032]
For example, for the face class property “face”, a face image file whose title is the name of the person in the information collected by the search engine using the name “A” as a keyword. The method of collecting information is described for each item, such as extracting an image.
[0033]
As described above, in this embodiment, for example, a keyword input by a user such as a person name or a manager / engineer is set in an input format based on a category class structure that the system has in advance. Pre-defined for each category class, such as face and career for the person class, assets for the manager class, papers for the engineer class, etc. Information is collected based on the information collection method, and the collected information is output to the user as comprehensive information.
[0034]
That is, in this case, the user only specifies the category. For example, for the person “A”, the information as the manager / engineer of the person A, such as the face photo, career, papers, and assets, is one. It is displayed to the user in a form organized on a page. By the way, the class structure 1 shown in FIG. 2 is an example of a class structure that sets each class of a category or its subclass as content contents, and sets information collection items for each category class and its subclass as properties. In the example, the information collection method and information processing processing are described as methods for each property. However, as the contents of the content, collection items for the title class are set as properties, and for each property, You can also define a method.
[0035]
In other words, the properties in the class structure 1 (for example, face, career, asset, paper, etc.) are the titles of each item when creating a page to be displayed to the user, and this is the title class. Properties for the title class are determined in advance, and for each property, a method for collecting information (constructor) and a method for displaying information to the user (show) are described in advance as methods.
[0036]
The example of the class structure (referred to as class structure 2) shown in FIG. 4 shows an example in which a face class, a career class, a thesis class, an asset class, etc. are defined as title classes, and each title class is shown in FIG. For example, for the face class, as the content of the information of the face class, for example, the information source URL indicating where the photograph and the photograph were taken from on the Internet is set as a property, and for the career class, For example, text, list, etc. are set as properties for the content of the information, and for the paper class, for example, a list is set as the property for each paper property. The method of collection (constructor) and the way of displaying information to the user (show) are described in advance as methods. To keep.
[0037]
In this way, for each title class, a property representing the content of information for each title class is defined, and for each property, a method of collecting information predetermined for each information content (constructor) And a predetermined information display method (show).
[0038]
By adopting such a method, when there are properties that are common to different category classes, it is necessary to describe methods such as how to collect information about each title for each category class. Disappear.
[0039]
Further, an information format class can be defined for a property indicating how to represent information for each content of information such as a photograph, text, list, etc. shown in the class structure 2.
[0040]
For example, as shown in FIG. 6, the content of information of each item representing a title is a class structure (referred to as class structure 3) representing each information format such as text, graphic, table, list, video, sound, and the like. Set. As shown in FIG. 7, for example, in the case of a text class, the format, size, etc. are set as properties, and the information acquisition method, information processing method, etc. are described in the method. In this method, if it is text, it describes how to collect the text, how to format and size, or to summarize the contents.
[0041]
In this way, by representing the information content of the item representing the title in the class structure as an information format class, it is possible to share information collection processing when extracting the same format information in different category classes. is there.
[0042]
For example, if the category class is a person class, the information to be collected in the person class includes text information about the person, and if the category class is a facility class, the text information indicating the outline of the facility is also included. is there. As described above, even in different category classes, information formats (information contents) representing the contents of information items corresponding to the respective category classes are often common. Therefore, the efficiency of information collection can be further improved by making the information collection processing method common to the format representing the contents of the information item.
[0043]
In the embodiment described above, the user tries to collect information as a manager / engineer for the person “A”, and the system side uses “A” and “manager / This is information retrieval / collection processing when a keyword such as “engineer” is input.
[0044]
In this way, when a user inputs a predetermined keyword, first, a request input format that can be understood by the system based on the keyword is set. In this case, “A” input by the user and “manager / technology” The search request of the user is “a person, the person is a manager and an engineer, and the name is A”, that is, “person / management” To a form that can be understood by a system such as “Engineer / Engineer / A”.
[0045]
And, for each category class (person class, manager class, engineer class), preset properties (person class: face, career, occupation, manager class: asset, engineer class: paper, etc.) After collecting information by a predetermined method, the collected information is displayed in a predetermined format in response to a user request. FIG. 8 shows a display example of information collected in this way. In this case, the property of the category class (in this case, face, career, paper, asset) as the title for each item on the display page is based on the class structure 2 as shown in FIG. It is possible to collect information. Further, information can be collected for each format (text class, graphic class, photo class, etc.) of each title class as shown in the example of FIG. 7 based on the class structure 3 as shown in FIG.
[0046]
In the example of FIG. 8, a face photograph of the person “A” and its information source URL are displayed, a summary of the history and a history list are displayed as a history, a paper list as a paper, and a summary as an asset. . In this way, only the information according to the user's request is extracted from the large number of information searched based on the keyword input by the user, and these are output as a single piece of information.
[0047]
In addition, although the example which the user inputs unilaterally from a keyboard was demonstrated as the method of receiving the request | requirement from a user, it is not restricted to this, For example, it is good also as an interactive system. Hereinafter, this interactive method will be schematically described.
[0048]
First, the user performs an input such as “I want to know about the person A”. As a result, the system side performs input analysis based on the input from the user. At this stage, an analysis result such as “person,-?-, A" is obtained. "Is there anything else?" Or "What do you want to know about?"
[0049]
As a result, when the user makes a response such as “A is said to be a visionary in the information industry,” the system converts the user's request into the form of “person / manager / engineer, A”. Based on this, search processing is performed. In addition, this interactive method is not an interactive method using a keyboard and a screen display, but an interactive method using a natural language.
[0050]
Alternatively, a category class property in which the input keyword becomes an instance may be displayed to the user, and the user may select a property from the displayed properties. Furthermore, the class structure as shown in Fig. 2 is displayed on the screen of the system, and the user clicks and selects the required category class from the category classes, and the properties of the category classes are displayed. Then, the user may select from the displayed contents such as the user selecting from the displayed property.
[0051]
In this way, by selecting the required property or selecting the class and allowing the processing based on it to be performed, only the necessary search items need to be processed. Efficiency can be improved, and high-speed data search and collection processing becomes possible.
[0052]
FIG. 9 shows a schematic configuration of the system of the present invention. The request analysis unit 11, the information collection unit 12, the content analysis / collection unit 13, the information editing unit 14, the information display unit 15 and the like are main components.
[0053]
The request analysis means 11 is a format in which the keyword input by the user can be understood by the system. That is, as described above, based on the contents input by the user, for example, the format is “person / manager / engineer / A”.
[0054]
Based on such a request format, related information is collected on the Internet by the information collecting means 12, and necessary information is collected by the content analysis / collecting means 13 from the collected information. As described above, as to the method of collecting this information, for example, in the case of a person class, the face, career, occupation, etc. as its properties are collected based on the method defined for each property.
[0055]
Then, the collected information is edited into a predetermined format by the information editing unit 14 and the information display unit 15 displays the information. This editing work is not just a fixed format. For example, if it is text data, the contents may be summarized, and if it is graphic data, the data may be compressed or reduced. Such processing is also included, and after such editing work, it is output as page information in a format as shown in FIG.
[0056]
By the way, the present invention can be realized not only by a server but also by client software. In this case, for example, you have something like the category class described so far as client software, the user inputs keywords based on the class structure of that category class, and retrieves the final result from the server. It is also possible to distribute the processing between the client software and the server, such that some processing is performed by the client software and the processing is performed by the server, and all processing is performed by the client software. It is also possible to do this.
[0057]
Note that the processing program for performing the processing of the present invention can be stored in a storage medium such as a floppy disk, an optical disk, or a hard disk, and the present invention also includes such a storage medium. A format for obtaining data may also be used.
[0058]
【The invention's effect】
According to the present invention, after the request input from the user is made into a request input format that can be understood by the system, the request input is classified into a category class, and for the request input, based on the property of the class to which the request input belongs, In addition, information is searched and collected based on the contents described in the method for each property, and the collection result is output as comprehensive information corresponding to the user's request input. As a result, the system side can search and collect information desired by the user simply by processing the keyword input by the user according to a predetermined algorithm, and can efficiently search and collect information. . The collected information can be extracted as a single piece of information corresponding to the user's request input. For example, in the case of collecting information on a person, items such as the person's background and work contents can be used as the title, and information can be provided in a state where each piece of information is edited for each title.
[0059]
In addition, a title class is defined for each item of information output by the system in response to a request input from the user, and each title class has the information content for each item set as a property for each item. Each information content has a method describing a data acquisition method, a data processing method, and the like. In this way, for each title class, the information content is set as a property, and by determining the method, a method that indicates how to collect information on the item (title), how to process the information, etc. Therefore, it is not necessary to set each category classified by the keyword from the user, the algorithm can be simplified, and the processing efficiency can be improved.
[0060]
Furthermore, an information format class indicating how to represent information is defined for each content of the information, and each information format class is set with a property representing how to represent information for each content of each information. Each method of representing information has a method describing a data acquisition method, a data processing method, and the like. As a result, when the information is in the same format in different classes, the processing can be performed with a common algorithm, and the processing efficiency can be improved.
[0061]
In addition, by displaying the properties for each category to the user and allowing the user to select any property from the displayed properties, user customization can be realized, and only information according to user preferences Thus, it is possible to search and collect the data, and the processing efficiency can be improved. In the case of a paid search service, the service can be received at a low price.
[0062]
As described above, according to the present invention, when searching for and collecting information on the Internet based on a request input from the user, it is not necessary for the user to narrow down information from a huge search result as in the past. The information required by the user can be efficiently extracted as one piece of information for each item according to a predetermined algorithm.
[Brief description of the drawings]
FIG. 1 is a flowchart schematically illustrating an information search collection processing procedure according to an embodiment of the present invention.
FIG. 2 is a diagram showing a class structure of a category class corresponding to a user request input in the information search / collection processing according to the embodiment of the present invention.
FIG. 3 is a view for explaining an example of properties and methods in the category class structure shown in FIG. 2;
4 is a diagram showing a class structure in which a property in the category class shown in FIG. 3 is a title class. FIG.
FIG. 5 is a view for explaining an example of properties and methods in the title class structure shown in FIG. 4;
6 is a diagram showing a class structure in which properties in the title class shown in FIG. 4 are information format classes. FIG.
7 is a diagram for explaining an example of properties and methods in the information format class structure shown in FIG. 6; FIG.
FIG. 8 is a diagram for explaining an example of a format of information output by information search collection processing in the embodiment of the present invention.
FIG. 9 is a schematic system configuration diagram according to the embodiment of the present invention.
[Explanation of symbols]
11 Requirements analysis means
12 Information collection means
13 Content analysis / collection means
14 Information editing means
15 Information display means

Claims (5)

予め定義されたクラス構造を備え、インスタンスとクラスに関する要求を含むユーザの要求入力に基づいて情報を検索する情報検索収集システムであって、
前記クラス構造は、複数の異なるクラスが一層または多層の階層構造で関連付けられて定義され、前記各クラス毎に収集すべきコンテンツの項目がプロパティとして設定され、前記各プロパティ毎に前記収集すべきコンテンツの収集方法、加工方法及び表示方法が設定されていて、
前記要求入力を前記クラス構造に基づいた形式の要求に変換する要求解析手段と、
前記要求に基づいて、前記収集方法に従って外部の関連する情報を収集する情報収集手段と、
収集された情報に含まれるコンテンツを前記クラス構造に基づいて解析・収集するコンテンツ解析・収集手段と、
解析・収集されたコンテンツを、前記加工方法及び表示方法に従って、予め定義されたフォーマットに包括的な情報として編集する情報編集手段と、
前記編集されたコンテンツを表示する情報表示手段と、
を備えていることを特徴とする情報検索収集システム。
An information retrieval and collection system that has a predefined class structure and retrieves information based on a user request input including requests for instances and classes,
The class structure is defined by associating a plurality of different classes in a one-layer or multi-layer hierarchical structure, and an item of content to be collected for each class is set as a property, and the content to be collected for each property Collection method, processing method and display method are set,
Request analysis means for converting the request input into a request in a format based on the class structure;
Information collecting means for collecting external related information according to the collection method based on the request;
Content analysis / collection means for analyzing / collecting content included in the collected information based on the class structure;
Information editing means for editing the analyzed and collected content as comprehensive information in a predefined format according to the processing method and the display method;
Information display means for displaying the edited content;
An information search and collection system characterized by comprising:
請求項1において、
前記クラス構造は、コンテンツのカテゴリを表現するカテゴリクラス構造であることを特徴とする情報検索収集システム。
In claim 1,
The information retrieval and collection system according to claim 1, wherein the class structure is a category class structure that represents a category of content.
請求項1において、
前記クラス構造は、コンテンツのタイトルを表現するタイトルクラス構造であることを特徴とする情報検索収集システム。
In claim 1,
The information search and collection system according to claim 1, wherein the class structure is a title class structure expressing a title of content.
請求項1において、
前記クラス構造は、コンテンツの情報形式を表現する情報形式クラス構造であることを特徴とする情報検索収集システム。
In claim 1,
The information search and collection system, wherein the class structure is an information format class structure that represents an information format of content.
予め定義されたクラス構造を備え、インスタンスとクラスに関する要求を含むユーザの要求入力に基づいてコンピュータに情報を検索させる情報検索収集プログラムを記憶した記憶媒体であって、前記情報検索収集プログラムは、コンピュータに、
前記クラス構造は、複数の異なるクラスが一層または多層の階層構造で関連付けられて定義され、前記各クラス毎に収集すべきコンテンツの項目がプロパティとして設定され、前記各プロパティ毎に前記収集すべきコンテンツの収集方法、加工方法及び表示方法が設定されていて、
前記要求入力を前記クラス構造に基づいた形式の要求に変換する要求解析ステップと、
前記要求に基づいて、前記収集方法に従って外部の関連する情報を収集する情報収集ステップと、
収集された情報に含まれるコンテンツを前記クラス構造に基づいて解析・収集するコンテンツ解析・収集ステップと、
解析・収集されたコンテンツを、前記加工方法及び表示方法に従って、予め定義されたフォーマットに包括的な情報として編集する情報編集ステップと、
前記編集されたコンテンツを表示する情報表示ステップと、
を実行させることを特徴とする、コンピュータに情報を検索させる情報検索収集プログラムを記憶した記憶媒体。
A storage medium having a predefined class structure and storing an information search and collection program for causing a computer to search for information based on a user request input including requests for instances and classes, wherein the information search and collection program is a computer In addition,
The class structure is defined by associating a plurality of different classes in a one-layer or multi-layer hierarchical structure, and an item of content to be collected for each class is set as a property, and the content to be collected for each property Collection method, processing method and display method are set,
A request analysis step for converting the request input into a request in a format based on the class structure;
An information collecting step of collecting external related information according to the collection method based on the request;
A content analysis / collection step of analyzing / collecting content included in the collected information based on the class structure;
An information editing step of editing the analyzed / collected content as comprehensive information in a predefined format according to the processing method and the display method;
An information display step for displaying the edited content;
A storage medium storing an information search and collection program for causing a computer to search for information.
JP27131497A 1996-12-10 1997-10-03 Information search and collection system and storage medium storing information search and collection program Expired - Fee Related JP3711710B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27131497A JP3711710B2 (en) 1996-12-10 1997-10-03 Information search and collection system and storage medium storing information search and collection program

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP8-330077 1996-12-10
JP33007796 1996-12-10
JP27131497A JP3711710B2 (en) 1996-12-10 1997-10-03 Information search and collection system and storage medium storing information search and collection program

Publications (2)

Publication Number Publication Date
JPH10228488A JPH10228488A (en) 1998-08-25
JP3711710B2 true JP3711710B2 (en) 2005-11-02

Family

ID=26549645

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27131497A Expired - Fee Related JP3711710B2 (en) 1996-12-10 1997-10-03 Information search and collection system and storage medium storing information search and collection program

Country Status (1)

Country Link
JP (1) JP3711710B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107256260A (en) * 2017-06-13 2017-10-17 浪潮软件股份有限公司 A kind of intelligent semantic recognition methods, searching method, apparatus and system

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100343854B1 (en) * 1999-08-10 2002-07-20 주승철 Classification diagram type displaying - information retrieval system
KR20010069137A (en) * 2000-01-12 2001-07-23 이만성 System for analysing data
KR20010076048A (en) * 2000-01-24 2001-08-11 강희종 Internet e-secretary system
KR100754157B1 (en) * 2000-05-31 2007-09-03 삼성전자주식회사 Database building method for multimedia contents
JP6157244B2 (en) * 2013-06-28 2017-07-05 株式会社日立システムズ Content management system, content management method and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107256260A (en) * 2017-06-13 2017-10-17 浪潮软件股份有限公司 A kind of intelligent semantic recognition methods, searching method, apparatus and system

Also Published As

Publication number Publication date
JPH10228488A (en) 1998-08-25

Similar Documents

Publication Publication Date Title
US5907838A (en) Information search and collection method and system
US7428705B2 (en) Web map tool
US6073170A (en) Information filtering device and information filtering method
JP4893243B2 (en) Image summarization method, image display device, k-tree display system, k-tree display program, and k-tree display method
US6845369B1 (en) System, apparatus and method for using and managing digital information
US20040125143A1 (en) Display system and method for displaying a multi-dimensional file visualizer and chooser
US20070094245A1 (en) Computer-implemented system and method for obtaining customized information related to media content
JP2005122689A (en) Information retrieval method
JP2003044491A (en) Knowledge analytic system. method for setting analytic condition, saving analytic condition and re-analyzing processing in the system
US20080313158A1 (en) Database file management system, integration module and browsing interface of database file management system, database file management method
MXPA04006410A (en) File system shell.
US20190286669A1 (en) Search system, apparatuse, and method
US7921127B2 (en) File management apparatus, control method therefor, computer program, and computer-readable storage medium
JP2005107688A (en) Information display method and system and information display program
JP3601675B2 (en) Information retrieval apparatus, information retrieval method, and recording medium
JP2004362451A (en) Method and system for displaying retrieving keyword information, and retrieving keyword information display program
JPH11282875A (en) Information filtering device
JP3711710B2 (en) Information search and collection system and storage medium storing information search and collection program
US8904272B2 (en) Method of multi-document aggregation and presentation
JP5271920B2 (en) Using structured data for online searching
KR100643979B1 (en) Information providing method for information searching result in an internet
JP4836069B2 (en) Content processing apparatus, content processing program, and content processing method
JP2000231569A (en) Internet information retrieving device, internet information retrieving method and computer readable recording medium with program making computer execute method recorded therein
US20140059051A1 (en) Apparatus and system for an integrated research library
KR100844949B1 (en) A Video Search System

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041026

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050125

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050419

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050726

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050808

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080826

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090826

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090826

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100826

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110826

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120826

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130826

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees