JP2006048384A - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP2006048384A
JP2006048384A JP2004228689A JP2004228689A JP2006048384A JP 2006048384 A JP2006048384 A JP 2006048384A JP 2004228689 A JP2004228689 A JP 2004228689A JP 2004228689 A JP2004228689 A JP 2004228689A JP 2006048384 A JP2006048384 A JP 2006048384A
Authority
JP
Japan
Prior art keywords
information
text data
file
genre
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004228689A
Other languages
English (en)
Inventor
Naofumi Nakazawa
直文 中澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2004228689A priority Critical patent/JP2006048384A/ja
Publication of JP2006048384A publication Critical patent/JP2006048384A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】
インターネットその他デジタル情報が存在するメディアは、情報が存在するファイルごとに、情報の記載の方法、様式が異なるため、従来のウェブ検索サービスで検索した検索結果の画面を見ただけでは、ユーザーが求める情報を一覧することができなかった。
【解決手段】
上記問題を解決するために、本発明は、入力情報の項目情報及び検索方法が記述されたデータベースを用い、必要な情報の抜き出しが行えるようにしたことを最大の特徴とする。
すなわち、本発明は、デジタル情報を検索し取得するに際し、デジタル情報の入力情報の項目情報及び検索方法が記述されたデータベースを用い、取り込んだ情報を検索、編集し、ユーザーの指定する形式に編集・加工することによって、それぞれのジャンルの項目に適切な内容を割り振ることができるようになり、その結果、フォームが統一されたデータベースを作成することが出来るようになった。
【選択図】 図1

Description

本発明は、インターネット、LAN、その他あらゆる場所に存在する、電子的な形で存在する情報から必要な情報を検索し編集する装置及びその方法に関するものである。
近年のネットワーク技術の発展等のため、多くのコンピュータユーザーが、世界的に普及したインターネットに接続し、情報を得るようになっている。また、インターネットのほか、いわゆるLANといった狭い範囲のネットワークも広く普及しており、さらに、ハードディスク、FD、CD−ROM等、いわゆるデジタルデータはあらゆる場所に存在する。特に、インターネットにおいては、いわゆるワールドワイドウェブ(WWW)が広く用いられ、世界中の様々な個人、企業、政府機関、国際機関、NGO等がWWWを介して情報を発信し、多くの人が容易にその情報にアクセスすることが可能となっている。
そして、ネットワーク上に存在するウェブサイトの数が飛躍的に増大している今日においては、ユーザーが、自己が欲する情報を効率的に発見するため、各種の検索サービスを利用することが多い。さらには、ハードディスク、FD、CD−ROM、DVD等の記憶容量の爆発的増大により、個人が保有するデジタル情報の量も劇的に増大してきた。そのため、インターネットのみならず、LANにおいても、また、個人が保有するデジタル情報の中からも、必要な情報を見出すため、何らかの検索手段を利用する必要がある。
この点、従来の技術としては、特許文献1のように複数のデータベースから検索して得られた情報を関連度でユーザーに提示できる装置や、特許文献2のようにメールなどに書かれたスケジュール情報を解析して、スケジュールに反映させる装置、特許文献3のようにインターネットホームページ情報から情報収集を行い新たなページデータを作成する装置等があった。
また、一般的なインターネット上のWWWを検索するウェブサイトとして、いわゆる全文検索型又はロボット検索型といわれる、自動的にインターネットを巡回して収集したウェブサイトの中に含まれるキーワードによって検索を行うサービスや、人為的に、ウェブサイト内の情報を整理し、カテゴリーに分けて階層的に管理する、いわゆるディレクトリー型と呼ばれるサービスがある。
特開平9−185632 特開平10−240818 特開2000−148766
以上のとおり、インターネット等のデジタル情報が存在するメディアから、必要な情報を調べることは一般的に行われているが、問題点があった。
例えば、あるユーザーが、レストランを探そうとして、特定のあるジャンルに属する店の情報などを複数検索し、メモをしておこうとする場合がある。この場合、ユーザーが求める情報の主なものは、店名、料理のジャンル、電話番号、営業時間、予算、最寄り駅等であろう。
しかし、インターネットその他デジタル情報が存在するメディアは、その場所ごとに、また、ウェブサイトごとに、また、情報が存在するファイルごとに、情報の記載の方法、様式が異なるため、例えば従来のウェブ検索サービスで検索した検索結果の画面を見ただけでは、検索したキーワードが存在していることは分かるが、それ以上に、前記ユーザーが求める情報を一覧することはできなかった。そのため、ユーザーが必要な情報を見つけるには、検索結果の画面にリンクされた当該ウェブサイトを見くらべる、という手数を要することが多かった。
また、特許文献1の技術でも、データベースから検索したデータを関連付けてユーザーに提示できるが、フォームを整える機能がないため、一覧性に欠けるという問題点があった。
さらに、特許文献2の技術では、スケジュールの内容の解析をしてスケジュールのフォームに反映させることができるが、スケジュール機能に特化したものであり、様々な内容を持つ情報の整理には使用できず、特許文献3の技術では、インターネットホームページ情報から情報収集を行い新たなページデータを作成する機能があるが、タグ情報をもとに処理を行うためインターネット情報以外の情報を扱うことができない、という問題点がそれぞれあった。
上記問題を解決するために、本発明は、入力情報の項目情報及び検索方法が記述されたデータベースを用い、必要な情報の抜き出しが行えるようにしたことを最大の特徴とする。
すなわち、本発明は、インターネット、LAN、HD等からデジタル情報を検索し取得するに際し、デジタル情報の入力情報の項目情報及び検索方法が記述されたデータベースを用い、取り込んだ情報を検索、編集し、ユーザーの指定する形式に編集・加工することによって、それぞれのジャンルの項目に適切な内容を割り振ることができるようになり、その結果、フォームが統一されたデータベースを作成することが出来るようになった。
以下に本件発明の実施形態を説明する。実施形態と、請求項との関係はおおむね次のようなものである。
実施形態1は、主に、請求項1について説明している。
実施形態2は、主に、請求項2について説明している。
実施形態3は、主に、請求項3について説明している。
実施形態4は、主に、請求項4について説明している。
実施形態5は、主に、請求項5について説明している。
以下に、各実施の形態を説明する。なお、本発明はこれら実施の形態に何ら限定されるものではなく、その要旨を逸脱しない範囲において、種々なる態様で実施しうる。
また、以下に記載する各機能ブロックは、ハードウェア、又はメモリ上に展開しハードウェアを制御することでその作用が得られるソフトウェア、又はハードウェア及びソフトウェアの両方として実現され得る。具体的には、コンピュータを利用するものであれば、CPUやメモリ、ハードディスクドライブ、CD−ROMやDVD−ROMなどの読取ドライブ、各種通信用の送受信ポート、インターフェイス、その他の周辺装置などのハードウェア構成部や、それらハードウェアを制御するためのドライバプログラムやその他アプリケーションプログラムなどが挙げられる。
また、この発明は装置またはシステムとして実現できるのみでなく、方法としても実現可能である。また、このような発明の一部をソフトウェアとして構成することができることもできる。さらに、そのようなソフトウェアをコンピュータに実行させるために用いるソフトウェア製品、及び同製品を記録媒体に固定した記録媒体も、当然にこの発明の技術的な範囲に含まれる。
「テキストデータ」とは、電子的に作成、修正、保存又は管理されうるものであり、ディスプレーその他の表示装置に文字として表示される一切のデータをいう。また、「ウェブページ」とは、インターネット等のネットワークに接続されているサーバ等のコンピュータ装置に蓄積され、前記ネットワークに接続する端末からの要求に対して同端末に対して提供する電子的なドキュメントであり、テキスト、動画又は静止画、音声、書式若しくは制御命令その他の電子データの一又は一以上の組合せでなるものをいう。ウェブページは、HTML、SGML、XML、CHTMLなど、現行においてウェブページを記述するために一般的に用いられている言語が用いられることが多いが、本発明で用いることができるものはこれに限定されることはなく、本発明時において未知のものも含め、あらゆるウェブページ記述言語を用いることができる。(以上は本明細書の全体を通じて同様である。)
<<実施形態1>>
<実施形態1の概念>
実施形態1は、情報を検索するための目的のジャンルを特定するジャンル情報を取得するジャンル情報取得部と、テキストデータを含むファイルに関する情報であるファイル情報を取得するファイル情報取得部と、テキストデータパターンをジャンルと関連付けて保持するテキストデータパターン保持部と、前記ファイル情報取得部で取得したファイル情報によって特定されるファイルに含まれるテキストデータが、前記ジャンル情報取得部で取得したジャンル情報と関連付けられているテキストデータパターンと合致するか判断する第一判断部と、前記第一判断部での判断結果が合致するとの判断結果である場合には、前記テキストデータを、前記ファイル情報と関連付けて保存するテキストデータ保存部とを有するテキストデータ保存装置である。
<実施形態1:各構成要件の説明>
以下、図1を用いて、各構成要件を説明する。
<構成要件:ジャンル情報取得部>
ジャンル情報取得部102は、テキストデータ保存装置101において、情報を検索するための目的のジャンルを特定するジャンル情報を取得する部分である。
すなわち、ジャンル情報取得部102は、本発明の目的である、あるジャンルに関連した情報を検索するにあたり、ジャンル情報を取得する部分である。
ジャンル情報の取得の方法は、2つの方法が考えられ、そのいずれの方法を用いてもよい。
ひとつの方法は、ファイル情報取得部104がファイル情報を取得するに先立ち、ジャンル情報取得部が、あらかじめユーザーに対し、一又は一以上のジャンル情報を指定するよう求め、ユーザーにジャンル情報を指定させる方法である。
その方法としては、端末から手入力させたりするほか、音声による指定、電子メールによる指定、その他任意の方法を用いることができる。
別の方法としては、あらかじめ、ジャンル情報取得部又はこれに接続された記憶装置に、一又は一以上のジャンル情報を保存しておく方法である。この場合、ジャンル情報取得部102が、具体的な検索の実施に際し、ユーザーに対し、ジャンル情報取得部が保存している複数のジャンル情報から一つのジャンル情報を指定させることができる。また、ユーザーに指定させず、ジャンル情報取得部に保存されているすべてのジャンル情報に関連したデータを検索することも可能である。
<構成要件:ファイル情報取得部>
ファイル情報取得部104は、テキストデータ保存装置101において、テキストデータを含むファイルに関する情報であるファイル情報を取得する部分である。
すなわち、テキストデータ保存装置101が、ネットワーク107上のデジタルデータが保存されている目的の場所(例えば図1では記憶装置108など)、及び/又は、テキストデータ保存装置101に接続された記憶装置上のデジタルデータが保存されている目的の場所(例えば図1では記憶装置110など)において、当該場所に保存されているファイルにテキストデータが含まれるか否かを判定し、テキストデータが含まれていると判断すると、そのファイルの所在情報を取得する。
ファイルの所在情報とは、さまざまな形式が考えられ、ファイルの所在が一義的に決せられるものであればどんな形式でもよい。例えば、インターネットであれば、当該ファイルが所在する記憶装置が存在するIPアドレス、当該記憶装置の中のパス名又はディレクトリー名、及びファイル名の組合せで定義されることが多いと考えられる(例:http://www.*****.co.jp/******/*******.html)。また、テキストデータ保存装置に接続された記憶装置であれば、当該記憶装置の中のパス名又はディレクトリー名、及びファイル名の組合せで定義されることが多いと考えられる(例:d:\****\****.txt)。
本例では、ファイル情報取得部104は、記憶装置108から、図2のようなテキストデータを含むファイルの存在を認定しファイルの所在情報をファイル情報として、http://www.petitfrancais.co.jp/index.htmという情報を取得した。
<構成要件:テキストデータパターン保持部>
テキストデータパターン保持部103は、テキストデータパターンをジャンルと関連付けて保持する部分である。
「ジャンル」とは、多数の情報を、その種類に分けるための分類の指標であり、例えば、「レストラン」、「プロ野球」、「自動車販売」といったものが考えられる。「テキストデータパターン」とは、あるジャンルに関連付けられた一又は一以上のデータを識別し、表示するための書式である。本発明を実施する場合、テキストデータパターン保持部103に、必要と思われるジャンル、及び当該ジャンルに関するデータを取り出すために必要なテキストデータパターンをあらかじめ入力する必要がある。どのジャンルについて、いかなるデータを取り出すかを定めてこれと関連付けるテキストデータパターンをどのように設定するかは、発明の実施において自由に決定できる。また、ジャンル、テキストデータパターンは、テキストデータパターン保持部にあらかじめ保持されているものでもよく、テキストデータ保存装置101に接続された外部記憶装置から取得するものでもよい。例えば、レストランの情報の検索を可能とするため、ジャンルの一つに「レストラン」を選定した場合、取得する必要のあるデータの例としては、店名、料理のジャンル、電話番号、住所、営業時間、定休日、最寄り駅等が考えられる。以下は考えられるテキストデータパターンの例であるが、もちろん、テキストデータパターンが以下のものに限定されるものでないことはいうまでもない。例えば、「電話番号」に関するデータを取り出したい場合、保持されるテキストデータパターンとしては、図4(1)のような形のものを用意することが考えられる。そして、テキストデータパターンと、対象ファイルに含まれる数字及び文字列データを照合することができる。そのほか、「住所」に関するデータを取り出したい場合、例えば、図4(2)のような形のテキストデータパターンを用意することが考えられる。さらに、営業時間に関するテキストデータパターンとしては、図4(3)のようなものが考えられる。
また、料理名に関するテキストデータパターンとして考えられる例は、図4(4)のような方法が考えられ、定休日に関するテキストデータパターンとしては、対象ファイルに「定休日」という文字列があったとき、その後にくる文字列とする、という方法が考えられる。
<構成要件:第一判断部>
第一判断部105は、前記ファイル情報取得部104で取得した前記ファイル情報によって特定されたファイルに含まれるテキストデータが、前記ジャンル情報取得部102で取得したジャンル情報と関連付けられているテキストデータパターンと合致するか判断する部分である。
本実施例においては、前記ジャンル情報取得部102で取得したジャンル情報が「レストラン」であったので、第一判断部105は、前記テキストデータパターン保持部より、例えば、図3に示される項目データとこれに対応する各テキストデータパターンを参照し、ファイル109に含まれるテキストデータの中に、前記各テキストデータパターンのいずれかと合致するものがあるかどうかを判断した。
その結果、第一判断部105は、例えば、図3にあるような項目データとこれに対応する各テキストデータパターンを参照し、ファイル109に含まれるテキストデータの中に、図7のとおり、テキストデータパターンに合致するものを抽出した。
<構成要件:テキストデータ保存部>
テキストデータ保存部106は、前記第一判断部105での判断結果が合致するとの判断結果である場合には、前記テキストデータを、前記ファイル情報と関連付けて保存する部分である。
本実施例では、第一判断部105が、図7のとおり、テキストデータパターンに合致するものを抽出したが、テキストデータ保存部106は、テキストデータ保存装置101の中にある、または、これに接続された記憶装置に、前記ファイル情報と関連付けて保存した。図8は、保存形式の一例であるが、保存形式が、図8に示されるような形に限定されるものではないことはいうまでもない。
<実施形態1:処理の流れ>
以下、図9及び図10において、本テキストデータ保存装置における処理の流れを示す。以下に示す処理の流れは、方法、計算機に実行させるためのプログラム、またはそのプログラムが記録された読み取り可能な記録媒体として実施されうる(これは、本明細書のその他の処理の流れについても同様である)。図9は、実施形態1の処理の流れを示したものである。S1は、ジャンル情報取得部102が、ジャンル情報を取得するステップである。S2は、ファイル情報取得部104がファイル情報を取得するステップ、S3は、テキストデータパターン保持部103が、テキストデータパターンをジャンルと関連付けて保持するステップ、S4は、ジャンル情報取得部102が、ジャンル情報を取得するステップ、S5は、第一判断部105が、ファイル情報によって特定されたファイルに含まれるテキストデータが、前記ジャンル情報と関連付けられているテキストデータパターンと合致するか判断するステップ、S6は、テキストデータ保存部106が、前記第一判断部105での判断結果が合致するとの判断結果である場合には、前記テキストデータを、前記ファイル情報と関連付けて保存するステップである。
また、図10は、第一判断部105及びテキストデータ保存部106の処理の流れの一例を示した図である。もちろん、第一判断部105及びテキストデータ保存部106の処理の流れが、図10に限定されるわけではないことはいうまでもない。
<実施形態1:効果の簡単な説明>
以上のとおり、実施形態1によれば、インターネット、LAN、HD等の情報源からデジタル情報を検索し取得するに際し、それぞれの情報源に記載されている情報の記述の形式に左右されず、必要なジャンルに関する必要な情報を、フォームが統一された形式で取り出すことが可能となり、検索などが効果的に行えるようになるとともに、データベースの構築を容易に行うことができる。
<<実施形態2>>
<実施形態2の概念>
実施形態2は、前記テキストデータ保存部が、前記テキストデータを前記ジャンル情報と関連付けて保存することを特徴とするほかは、実施形態1と同様のテキストデータ保存装置である。
すなわち、実施形態2においては、実施形態1におけるテキストデータ保存部106において、前記第一判断部105での判断結果が合致するとの判断結果である場合には、前記テキストデータを、前記ジャンル情報と関連付けて保存する部分である。図11は、テキストデータを、ファイル情報とジャンル情報に関連付けて保存した一例である。図11では、ファイル情報、ジャンル情報、テキストデータの順に並んでいるが、必ずこのような順序にしなければならないわけではない。実施形態2の処理の流れは、図9及び図10と同様であり、S5において、テキストデータ保存部106が、前記第一判断部105での判断結果が合致するとの判断結果である場合には、前記テキストデータを、前記ファイル情報及び/又は前記ジャンル情報と関連付けて保存するステップであるところが、実施形態1と異なるのみである。
<実施形態2:効果の簡単な説明>
実施形態2においても実施形態1と同様の効果を有するが、実施形態2においては、テキストデータを、ファイル情報及び/又はジャンル情報と関連付けて保存することにより、保存後のデータをジャンルごとにデータベース化するなどをより効率的に行うことができる。
<<実施形態3>>
<実施形態3の概念>
実施形態3は、前記テキストデータパターンが、テキストデータパターンを類別するテキストデータパターン類別情報と関連付けられて前記テキストデータパターン保持部に保持されており、前記テキストデータ保存部が、前記テキストデータを、さらに前記テキストデータパターンと関連付けられているテキストデータパターン類別情報とも関連付けて前記保存を行うことを特徴とする、実施形態1又は2と同様のテキストデータ保存装置である。
すなわち、実施形態3においては、テキストデータパターン保持部103において、前記テキストデータパターンが、テキストデータパターンを類別するテキストデータパターン類別情報と関連付けられて前記テキストデータパターン保持部に保持される。もちろん、前記テキストデータパターンを保持するにあたっては、関連付ける情報として、前記テキストデータパターンと、ジャンル及びテキストデータパターン類別情報の両者と関連付けて保存することも可能である。
例えば、本例で考えると、レストランの情報の検索を可能とするようにする場合、例えば、ジャンルの一つに「レストラン」を選定した場合、取得する必要のあるデータの項目としては、店名、料理のジャンル、電話番号、住所、営業時間、定休日、最寄り駅等が考えられる。この場合、テキストデータパターン類別情報とは、前記項目を示すテキストデータとなる。例えば、前記店名に関してのテキストデータパターン類別情報は、「店名」「Name」などが考えられる。また、前記電話番号に関しては、テキストデータパターン類別情報は、「電話番号」「Tel」といったものが考えられる。そして、テキストデータパターン保持部103は、テキストデータパターン類別情報と、テキストデータパターンを関連付けて保持する。図12は、その一例である。
どのテキストデータパターン類別情報に、いかなるジャンルに、いかなるテキストデータパターンを関連付けるかは、発明の実施において自由に決定できる。また、テキストデータパターン類別情報も、保持部にあらかじめ保持されているものでもよく、テキストデータ保存装置101に接続された外部記憶装置から取得するものでもよい。さらに、実施形態3においては、前記テキストデータ保存部において、前記テキストデータを、前記テキストデータパターン類別情報とも関連付けて前記保存を行うことを特徴とする。もちろん、前記テキストデータを保存するにあたっては、関連付ける情報として、前記テキストデータパターン類別情報のほか、ジャンル情報及び/又はファイル情報の両者と関連付けて保存することも可能である。すなわち、本実施例では、図13のとおり、前記テキストデータを、前記テキストデータパターン類別情報、ジャンル情報及びファイル情報と関連付けて保存した。なお、データの保存の順序が、厳格に図13に示されるような形に限定されるものではないことはいうまでもない。実施形態3の処理の流れは、図9及び図10と同様であり、S3において、テキストデータパターン保持部103が、前記テキストデータパターンを、ジャンル及び前記テキストデータパターン類別情報と関連付けて同テキストデータパターン保持部103に保持する点、及びS5において、テキストデータ保存部106が、前記第一判断部105での判断結果が合致するとの判断結果である場合には、前記テキストデータを、前記ファイル情報及び/又は前記ジャンル情報と、テキストデータパターン類別情報とを関連付けて保存するステップであるところが、実施形態1と異なるのみである。
<実施形態3:効果の簡単な説明>
実施形態3においても実施形態1、2と同様の効果を有するが、実施形態3においては、テキストデータを、テキストデータパターン類別情報とも関連付けて保存することにより、保存後のデータのジャンルにおける意味を容易に識別することができ、より汎用性の高いデータ形式を得ることができる。
<<実施形態4>>
<実施形態4の概念、構成、効果>
実施形態4は、前記ファイルが、ウェブページを構成するためのファイル、電子メールを構成するためのファイルのいずれか又は両者である実施形態1から3のいずれか一に記載のテキストデータ保存装置である。
実施形態4の概念、構成、効果は、前記ファイルがウェブページを構成するためのファイル、電子メールを構成するためのファイルのいずれか又は両者であることを除けば、実施形態1から3と同様である。
<<実施形態5>>
<実施形態5の概念>
図14は、本実施形態の一例の概念と機能を示すものである。
実施形態5は、前記ファイルにはさらに映像データが含まれており、映像データの種類を示す情報である、ジャンルと関連付けて保持する映像データ種類パターン情報を保持する映像データ種類パターン保持部と、前記ファイル情報取得部で取得した前記ファイル情報によって特定されたファイルに含まれる映像データが、前記ジャンル情報取得部で取得したジャンル情報と関連付けられている前記映像データ種類パターン保持部に保持されている映像データ種類パターンと合致するか判断する第二判断部と、前記第二判断部での判断結果が合致するとの判断結果である場合には、前記映像データを、前記ファイルと関連付けて保存する映像データ保存部とをさらに有する実施形態1から4のいずれか一に記載のテキストデータ保存装置である。
<実施形態5:各構成要件の説明>
以下、図14を用いて、実施形態5に特有の構成要件を説明する。
<構成要件:映像データ種類パターン保持部>
映像データ種類パターン保持部112は、映像データ種類パターンをジャンルと関連付けて保持する部分である。
「映像データ種類パターン」とは、あるジャンルに関連付けられた一又は一以上の映像を識別し、表示するためのパターンである。本発明を実施する場合、映像データ種類パターン保持部112に、必要と思われるジャンル、及び当該ジャンルに関する映像を取り出すために必要な映像データ種類パターンを保持する必要がある。どのジャンルについて、いかなる映像を取り出すかを定めてこれと関連付ける映像データ種類パターンをどのように設定するかは、発明の実施において自由に決定できる。また、ジャンル、映像データ種類パターンは、映像データ種類パターン保持部にあらかじめ保持されているものでもよく、テキストデータ保存装置101に接続された外部記憶装置から取得するものでもよい。例えば、日本国歴代首相の情報の検索を可能とするようにする場合、例えば、ジャンルの一つに「日本国首相」を選定した場合、関連付ける映像データとしては、顔写真などが考えられるが、この場合、映像データ種類パターンとしては、日本国歴代首相の顔写真のような形が考えられる。
<構成要件:第二判断部>
第二判断部113は、前記ファイル情報取得部104で取得した前記ファイル情報によって特定されたファイルに含まれる映像データが、前記ジャンル情報取得部102で取得したジャンル情報と関連付けられている映像データ種類パターンと合致するか判断する部分である。
この場合の判断方法としては、既知の、又は将来使用されうる画像パターン認識の技術等を使用することができる。
本実施例における先の例においては、前記ジャンル情報取得部102で取得したジャンル情報が「日本国首相」であったとすると、第二判断部113は、前記映像データ種類パターン保持部112より、映像データ種類パターンを参照し、ファイル109に含まれる映像データの中に、前記各映像データ種類パターンのいずれかと合致するものがあるかどうかを判断した。
その結果、第二判断部113は、ファイル109に含まれる映像データの中に映像データ種類パターンに合致するものを抽出した。
<構成要件:映像データ保存部>
映像データ保存部114は、前記第二判断部113での判断結果が合致するとの判断結果である場合には、前記映像データを、前記ファイル情報と関連付けて保存する部分である。
本実施例では、第二判断部113が、映像データ種類パターンに合致するものを抽出したが、映像データ保存部114は、テキストデータ保存装置101の中にある、または、これに接続された記憶装置に、前記ファイル情報と関連付けて保存した。
なお、映像データ保存部に保存される映像データは、テキストデータ保存部106で保存されるデータと関連付けて、又は、これと一体として保存することもできる。
<実施形態5:処理の流れ>
以下、図15において、本テキストデータ保存装置における処理の流れを示す。以下に示す処理の流れは、方法、計算機に実行させるためのプログラム、またはそのプログラムが記録された読み取り可能な記録媒体として実施されうる(これは、本明細書のその他の処理の流れについても同様である)。図9は、実施形態5の処理の流れを示したものである。以下、本実施形態に特有のものについて説明する。S2は、映像データ種類パターン保持部112が、映像データ種類パターンをジャンルと関連付けて保持するステップ、S41は、第二判断部113が、ファイル情報によって特定されたファイルに含まれる映像データが、前記ジャンル情報と関連付けられている映像データ種類パターンと合致するか判断するステップ、S51は、映像データ保存部114が、前記第二判断部113での判断結果が合致するとの判断結果である場合には、前記映像データを、前記ファイル情報と関連付けて保存するステップである。
<実施形態5:効果の簡単な説明>
実施形態5においても実施形態1〜4と同様の効果を有するが、実施形態5においては、インターネット、LAN、HD等の情報源から容易に必要な映像データを検索し、データベースの構築を容易に行うことができる。
本発明は、デジタル情報を検索する装置、又はデジタル情報を検索しデータベースを構築する装置等への利用が可能である。
実施形態1の構成図 テキストデータを含むファイルの例を示す図 登録データ名の例を示す図 テキストデータパターンの例を示す図 図2のファイルのHTMLファイルの例を示す図 図5からHTMLタグを抜いたデータを示す図 第一判断部の判断結果の例を示す図 テキストデータ保存部による保存情報の例を示す図 実施形態1のブロック図の例を示す図 第1判断部及びテキストデータ保存部のブロック図の例を示す図 実施形態2のテキストデータ保存部による保存情報の例を示す図 テキストデータパターンとテキストデータパターン類別情報を関連付けて保持した例(電話番号)を示す図 実施形態3によるテキストデータ保存部における保存の一例を示す図 実施形態5の構成図を示す図 実施形態5のブロック図
符号の説明
101 テキストデータ保存装置
102 ジャンル情報取得部
103 テキストデータパターン保持部
104 ファイル情報取得部
105 第一判断部
106 テキストデータ保存部
107 ネットワーク
108 記憶装置
109 ファイル
110 記憶装置
111 ファイル
112 映像データ種類パターン保持部
113 第二判断部
114 映像データ保存部

Claims (5)

  1. 情報を検索するための目的のジャンルを特定するジャンル情報を取得するジャンル情報取得部と、
    テキストデータを含むファイルに関する情報であるファイル情報を取得するファイル情報取得部と、
    テキストデータパターンをジャンルと関連付けて保持するテキストデータパターン保持部と、
    前記ファイル情報取得部で取得した前記ファイル情報によって特定されたファイルに含まれるテキストデータが、前記ジャンル情報取得部で取得したジャンル情報と関連付けられているテキストデータパターンと合致するか判断する第一判断部と、
    前記第一判断部での判断結果が合致するとの判断結果である場合には、前記テキストデータを、前記ファイル情報と関連付けて保存するテキストデータ保存部と、
    を有するテキストデータ保存装置。
  2. 前記テキストデータ保存部は、前記テキストデータを前記ジャンル情報と関連付けて保存する請求項1に記載のテキストデータ保存装置。
  3. 前記テキストデータパターンは、テキストデータパターンを類別するテキストデータパターン類別情報と関連付けられて前記テキストデータパターン保持部に保持されており、
    前記テキストデータ保存部は、前記テキストデータを、さらに前記テキストデータパターンと関連付けられているテキストデータパターン類別情報とも関連付けて前記保存を行う請求項1又は2に記載のテキストデータ保存装置。
  4. 前記ファイルは、ウェブページを構成するためのファイル、電子メールを構成するためのファイルのいずれか又は両者である請求項1から3のいずれか一に記載のテキストデータ保存装置。
  5. 前記ファイルにはさらに映像データが含まれており、
    映像データの種類を示す情報である、ジャンルと関連付けて保持する映像データ種類パターン情報を保持する映像データ種類パターン保持部と、
    前記ファイル情報取得部で取得した前記ファイル情報によって特定されたファイルに含まれる映像データが、前記ジャンル情報取得部で取得したジャンル情報と関連付けられている前記映像データ種類パターン保持部に保持されている映像データ種類パターンと合致するか判断する第二判断部と、
    前記第二判断部での判断結果が合致するとの判断結果である場合には、前記映像データを、前記ファイルと関連付けて保存する映像データ保存部と、
    をさらに有する請求項1から4のいずれか一に記載のテキストデータ保存装置。
JP2004228689A 2004-08-04 2004-08-04 情報処理装置 Pending JP2006048384A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004228689A JP2006048384A (ja) 2004-08-04 2004-08-04 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004228689A JP2006048384A (ja) 2004-08-04 2004-08-04 情報処理装置

Publications (1)

Publication Number Publication Date
JP2006048384A true JP2006048384A (ja) 2006-02-16

Family

ID=36026860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004228689A Pending JP2006048384A (ja) 2004-08-04 2004-08-04 情報処理装置

Country Status (1)

Country Link
JP (1) JP2006048384A (ja)

Similar Documents

Publication Publication Date Title
KR101659097B1 (ko) 복수의 저장된 디지털 이미지들을 탐색하기 위한 방법 및 장치
US9229992B2 (en) Automatic identification of digital content related to a block of text, such as a blog entry
US8311999B2 (en) System and method for knowledge research
JP5550765B2 (ja) 関連タグの作成および利用
JP5671557B2 (ja) クライアント・コンピューティング・デバイスを含むシステム、メディア・オブジェクトにタグ付けする方法、および音声タグ付きメディア・オブジェクトを含むデジタル・データベースをサーチする方法
US9576057B2 (en) User interface for navigating a keyword space
US8135739B2 (en) Online relevance engine
JP4437500B2 (ja) データをタグ情報に対応付けて管理する技術
US20080109422A1 (en) Personalized search
US11989244B2 (en) Shared user driven clipping of multiple web pages
US8527490B2 (en) Structuring and searching data in a hierarchical confidence-based configuration
Jansen et al. Searching for multimedia: analysis of audio, video and image Web queries
WO2004072757A2 (en) Text and attribute searches of data stores that include business object
CN103827852B (zh) 在搜索引擎结果页面上聚集web页面
US20070055699A1 (en) Photo image retrieval system and program
US11709881B2 (en) Visual menu
JP2003173280A (ja) データベース生成装置、データベース生成方法及びデータベース生成プログラム
JP2006285515A (ja) 電子メール宛先入力支援プログラム
US20080114789A1 (en) Data item retrieval method and apparatus
US7475059B2 (en) Adapting business objects for searches and searching adapted business objects
JPH06301732A (ja) 文書検索処理方法
JP2006309509A (ja) 閲覧画面再利用装置、閲覧画面再利用プログラム、及び記録媒体
JP2006048384A (ja) 情報処理装置
JP2007011721A (ja) 文書検索装置
JP2009217499A (ja) 文書分類プログラム及び文書分類装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090609

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091016