JP2003248685A - 情報検索システム - Google Patents

情報検索システム

Info

Publication number
JP2003248685A
JP2003248685A JP2002045333A JP2002045333A JP2003248685A JP 2003248685 A JP2003248685 A JP 2003248685A JP 2002045333 A JP2002045333 A JP 2002045333A JP 2002045333 A JP2002045333 A JP 2002045333A JP 2003248685 A JP2003248685 A JP 2003248685A
Authority
JP
Japan
Prior art keywords
information
image
unit
search
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002045333A
Other languages
English (en)
Inventor
Hisao Matsuda
久夫 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2002045333A priority Critical patent/JP2003248685A/ja
Publication of JP2003248685A publication Critical patent/JP2003248685A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】 【課題】 十分な画像音声認識処理を行い、この処理結
果を利用して迅速かつ正確に所望の情報を検索できる検
索情報を自動的に生成するとともに、通信回線の混雑を
防止することを目的とする。 【解決手段】 画像音声情報生成装置1と、画像認識処
理及び音声認識処理を行うのに必要な画像音声情報の情
報量である必要情報量を決定する情報量決定部6gと、
必要情報量の各画像音声情報に対して、画像認識処理及
び音声認識処理を行い、認識結果に基づいて、第1検索
情報を生成するサーバ装置4と、各第1検索情報と、各
画像音声情報とを対応づけて格納する格納装置5と、入
力部7cにより入力された第2検索情報と、各第1検索
情報とを比較する比較部6bと、比較結果に基づいて、
第2検索情報に対応する画像音声情報を、ユーザに提示
する提示部7aとを有する。

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は、ユーザが所望する
画像情報や音声情報を検索することできる情報検索シス
テムに関するものである。 【0002】 【従来の技術】近年、撮影機材の変化により、デジタル
画像情報や音声情報が、撮影装置自体にセットされた格
納装置に格納されるだけでなく、ネットワークを通じ
て、該ネットワークに接続されたデータベース等の格納
装置に格納されるようになってきている。例えば、ある
携帯電話で撮影された静止画像情報、動画像情報が、ネ
ットワーク等を介して上記格納装置に格納されるように
なっている。 【0003】このように撮影機材が変化するに従い、例
えば、家庭用ビデオで撮影した画像情報や音声情報だけ
でなく、デジタルカメラのスチル画像情報、テレビ放送
の録画画像情報等の種々の画像情報、音声情報を上記格
納装置に格納することが可能となる。このような種々の
画像情報や音声情報を上記格納装置に格納するには、上
記格納装置の容量を大きくする必要がある。 【0004】このように格納装置の大容量化を図れば、
格納装置に格納される画像情報・音声情報の量を多くす
ることができる。しかし、格納装置に格納される情報量
が多くなると、ユーザが所望する画像情報や音声情報を
迅速に取得することが困難となる。このため、せっかく
撮影したユーザの家族に関する画像情報等が上記格納装
置に格納されても、必要に応じて迅速に取得することが
できなくなってしまう。近年のテレビ放送の多チャンネ
ル化やインターネットに代表されるコンピュータネット
ワークの急速な普及に伴い膨大な画像情報や音声情報が
家庭を含めた社会に流通し、上記格納装置に格納される
情報量は増加する傾向にある。 【0005】このため、格納装置に格納された大量の画
像情報、音声情報の中からユーザーが所望する画像情
報、音声情報を迅速かつ正確に取り出すためのシステム
が必要になる。このようなシステムの実現のためには、
複数の情報のうちから、所望の情報を検索することがで
きる検索情報の生成機能が必要となる。 【0006】そこで、従来では、画像情報、音声情報を
検索するための検索情報を生成し、検索情報も画像情
報、音声情報とともに格納装置に格納し、ユーザにより
入力された検索情報と、格納された検索情報とを比較し
て、一致した検索情報に対応する画像情報、音声情報を
ユーザに提示するという技術がある。 【0007】ここで、検索情報の生成の方法として、ユ
ーザが入力した情報に基づいて生成するという方法(特
開平10−171739号公報及び特開平11−556
45号公報等)がある。 【0008】しかし、このような検索情報の生成の仕方
には、以下のような問題があった。 【0009】ユーザ又はユーザの家族に関する1つ1つ
の画像情報、音声情報に対して、それぞれ、ユーザが検
索情報の生成に必要な情報を入力していくことは、ユー
ザにとって、入力作業の負担が大きくなってしまう。 【0010】このようなユーザの負担を低減するには、
検索情報を自動で生成することが必要となる。検索情報
を自動で生成する方法としては、従来、以下のような技
術があった。 【0011】先ず、画像認識技術(例えば、特開200
0−113097号公報で示されている画像認識技術
等)を用い、画像の特徴抽出を行い、抽出された特徴量
を用いて、検索情報を自動的に生成する方法がある。ま
た、音声認識技術を用い、検索情報を自動的に生成する
方法がある。また、出演者、監督、作曲者、歌手、題名
などの著作物等を示す文字情報から、検索情報を自動的
に生成する方法がある。 【0012】ここで、文字情報から検索情報を自動的に
生成する方法については、例えば、テレビ放送の信号に
は、放送番組に関する情報(EPG等)が含まれ、これ
を利用して、検索情報を自動で生成するという方法があ
る。しかし、上記放送番組に関する情報に、ある場面の
雰囲気など、細やかな情報が含まれていることは考えに
くい。このため、放送番組に関する情報に関する文字情
報を利用して、検索情報を自動で生成し、この検索情報
を用いて検索を行ったとしても、十分な検索ができない
可能性がある。例えば、2つの似た画像情報がある場
合、細やかな情報まで、検索情報に含まれていないと、
上記2つの画像情報の区別ができなくなってしまう。 【0013】一方、画像認識技術や音声認識技術を用い
て検索情報を自動で生成するという方法については以下
のとおりである。即ち、近年、人工知能等を応用した高
度なシステムの開発等が盛んに行われ、非常に高度な音
声認識や画像認識が可能となってきている。このため、
上記音声認識や画像認識を行って、画像や音声に関する
細やかな情報を抽出し、これを検索情報に含めることが
可能となっている。 【0014】このため、格納装置に格納された複数の画
像情報、音声情報のうち、ユーザが所望する情報を迅速
かつ正確に検索するためには、画像認識技術や音声認識
技術を用いて、検索情報を自動的に生成する必要があ
る。 【0015】従来において、画像認識技術を用いて、検
索情報を自動的に生成する技術には、種々の技術(特開
平10−240774号公報等)があるが、ユーザ個人
やユーザの家族に関する画像情報、音声情報の検索情報
を自動生成するシステムとして、以下のような従来技術
がある。 【0016】図11は、ユーザが所望する画像情報、音
声情報を検索するための検索情報を自動生成するための
第1の従来技術を示す構成図である。システムは、複数
の画像音声情報生成装置50と、インターネット51を
介して接続された複数のクライアントサブシステム52
とを有する。クライアントサブシステム52は、サブシ
ステム管理装置52a、提示装置52b、格納装置52
c、画像音声認識装置52dとを有する。 【0017】このように構成されたシステムの動作を以
下に説明する。あるユーザの画像音声情報生成装置50
により、ある画像が撮影されるとともに、音声も入力さ
れて画像情報及び音声情報からなる画像音声情報が生成
される。この画像音声情報がインターネット51を介し
て、上記ユーザが保有するクライアントサブシステム5
2に送られる。 【0018】クライアントサブシステム52のサブシス
テム管理装置52aは、上記画像音声情報を画像音声認
識装置52dに送る。画像音声認識装置52dは、送ら
れた画像音声情報に対して、画像認識処理及び音声認識
処理を行い、検索情報(以下、第1検索情報という)を
生成する。生成された検索情報は、サブシステム管理装
置52aに送られる。サブシステム管理装置52aは、
生成された第1検索情報を上記画像音声情報と対応づけ
る。そして、サブシステム管理装置52aは、画像音声
情報及び第1検索情報を格納装置52cに送り、格納さ
せる。 【0019】そして、ユーザが所望する画像音声情報を
提示したいと考えた場合、提示装置52bの入力部(図
示せず)から、上記所望する画像音声情報を検索するた
めに必要な情報である第2検索情報を入力すると、その
第2検索情報は、サブシステム管理装置52aへ送られ
る。 【0020】サブシステム管理装置52aは、格納装置
52cから、ローカルネットワーク53を介して、第1
検索情報を読み出す。そして、サブシステム管理装置5
2aは、入力された第2検索情報と、各第1検索情報を
比較し、入力された第2検索情報に対応する画像音声情
報を格納装置52cから読み出す。そして、サブシステ
ム管理装置52aは、読み出した画像音声情報を提示装
置52bへ送り、提示させる。 【0021】また、第2の従来技術として、特開平20
00−236494号公報に記載された技術がある。こ
の従来技術では、音声認識技術を利用することにより検
索情報を自動生成し、ユーザーが所望する画像・音声シ
ーンを高速に検索できるシステムが示されている。この
従来技術では、サーバ装置に格納された画像音声情報に
ついて、音声認識処理及び画像認識処理をサーバ装置で
行い、検索情報を自動生成している。そして、各ユーザ
の所望に応じて、画像音声情報及び検索情報を各ユーザ
端末装置に提供している。 【0022】 【発明が解決しようとする課題】しかしながら、上述し
た従来技術には、以下のような問題点があった。先ず、
図11に示す第1の従来技術では、音声認識処理及び画
像認識機能をユーザの保有するサブシステムで行わせて
いるので、ユーザが負担するコストが大きくなってしま
う。 【0023】上述したように、近年、非常に高度な音声
認識、画像認識を行うことも可能となっているが、この
ような認識を行うためには、十分な処理能力を持つCP
U等が必要である。このようなCPU等を上記サブシス
テムに設けると、そのコスト負担は大きくなる。 【0024】一方、画像認識処理や音声認識処理をユー
ザが保有するサブシステムで頻繁に行う必要があれば、
コストが高くても、その分の代償があるといえる。しか
し、ユーザによっては、必ずしも、頻繁に行う必要があ
るとは限らないし、むしろ、ユーザ個人や家族に関する
画像情報や音声情報に対して、検索情報を生成する機会
は、通常、多くて週に数回といえる。 【0025】従って、第1の従来技術によれば、各ユー
ザの保有するクライアント装置やクライアントサブシス
テムに細やかな情報を含む検索情報が生成できるような
画像認識機能や音声認識機能を設けることは、一般のユ
ーザにとってコスト負担が大きくなってしまうという問
題がある。 【0026】これに対して、特開2000−23649
4号公報の技術によれば、音声認識処理、画像認識処理
は、サーバ装置が行うため、上述のような問題はない。 【0027】しかし、この従来技術では、以下のような
問題点がある。即ち、サーバ装置が音声認識、画像認識
を行うのは、予め、サーバ装置に保存された画像情報、
音声情報に限られている。このため、各ユーザが自由に
生成した画像情報、音声情報に対して、サーバ装置が音
声認識、画像認識を行い、検索情報を自動的に生成する
ことができなかった。 【0028】従って、従来においては、各ユーザのコス
ト負担を軽減するとともに、各ユーザが自由に生成した
画像音声情報に対しても、十分な画像認識処理及び音声
認識処理を行い、この処理結果を利用して迅速かつ正確
に所望の画像音声情報を検索できる検索情報を自動的に
生成することができるシステムの開発が望まれていた。 【0029】また、検索情報の生成に必要な画像認識や
音声認識に必要なデータ量は、画像音声情報の全てのデ
ータ量が必要とは限らない。このため、全てのデータ量
が装置間でやりとりされると、装置間の通信回線の混雑
を招くという問題もある。 【0030】本発明は、上記問題点を解決するためにな
されたものであり、各ユーザのコスト負担を軽減するこ
と、各ユーザが自由に生成した画像音声情報に対して
も、十分な画像音声認識処理を行い、この処理結果を利
用して迅速かつ正確に所望の情報を検索できる検索情報
を自動的に生成すること、通信回線の混雑を防止するこ
とができる情報検索システムの提供を目的とする。 【0031】 【課題を解決するための手段】上記課題を解決するため
に、本発明に係る情報検索システムは、画像情報及び該
画像情報に対応する音声情報からなる画像音声情報に対
して、所定の解像度で、画像認識処理及び音声認識処理
を行い、認識結果に基づいて前記画像音声情報を検索す
るための第1検索情報を生成し、該第1検索情報を用い
て、ユーザが所望する画像音声情報を検索するシステム
であって、各ユーザの操作に基づいて、それぞれ、画像
音声情報を生成する各画像音声情報生成装置1と、所定
量の画像音声情報に対して、前記所定の解像度で、画像
認識処理及び音声認識処理を行うのに必要な画像音声情
報の情報量である第1情報量と、前記各画像音声情報生
成装置により生成された画像音声情報の情報量である第
2情報量とに基づいて、前記第2情報量の画像音声情報
に対して、前記所定の解像度で、画像認識処理及び音声
認識処理を行うのに必要な画像音声情報の情報量である
必要情報量を決定する情報量決定手段6gと、前記情報
量決定手段により決定された必要情報量で、前記各画像
音声情報生成装置により生成された画像音声情報を送信
する送信手段6cと、前記送信手段により送信された各
画像音声情報に対して、前記所定の解像度で、画像認識
処理及び音声認識処理を行い、認識結果に基づいて、前
記第1検索情報を、前記各画像音声情報に対応づけて生
成する検索情報生成装置4と、前記検索情報生成装置に
より生成された各第1検索情報と、前記送信手段により
送信された各画像音声情報とをそれぞれ対応づけて、格
納する格納手段5と、ユーザが所望の画像音声情報を検
索するための第2検索情報を入力する入力手段7cと、
前記入力手段7cにより入力された第2検索情報と、前
記格納手段5に格納された各第1検索情報とを比較する
比較手段6bと、前記比較手段6bによる比較結果に基
づいて、前記格納手段5から前記第2検索情報に対応す
る画像音声情報を読み出し、その読み出した画像音声情
報を、前記ユーザに提示する提示手段7aとを有するこ
とを特徴とするものである。 【0032】 【発明の実施の形態】実施の形態1. (情報検索システムの構成)図1は、本実施の形態であ
る情報検索システムの構成を示すブロック図である。情
報検索システムは、複数の画像音声情報生成装置1と、
複数のクライアントサブシステム2と、公衆ネットワー
ク(例えば、インターネット)3を介して、上記複数の
画像音声情報生成装置1や複数のクライアントサブシス
テム2と接続されているサーバ装置(検索情報生成装
置)4とを有する。 【0033】各画像音声情報生成装置1は、それぞれ、
各ユーザの入力操作や撮影操作に基づいて、画像音声情
報を生成する。画像音声情報生成装置1は、各種の画像
を撮影する撮影部1aと、ユーザにより各種の音声を入
力するための音声入力部1bと、撮影部1aにより撮影
された画像及び音声入力部1bにより入力された音声に
基づいて、画像情報及びこれに対応する音声情報からな
る画像音声情報を生成する画像音声情報生成部1cと、
画像音声情報生成装置1を保有するユーザの識別情報
等、各種のデータを格納する格納部1dと、公衆ネット
ワーク3を介して、サーバ装置4やクライアントサブシ
ステム2との通信を行う通信部1eと、各種情報を表示
する表示部(図示せず)と、ユーザにより各種情報を入
力するための入力部(図示せず)と、各部を制御する制
御部1fとを有する。 【0034】サーバ装置4は、画像認識部4aと音声認
識部4bと検索情報生成部4cを有する。画像認識部4
aは、画像音声情報生成装置1から送信された画像音声
情報の画像情報に対して、画像認識処理を行い、画像認
識情報を出力する。 【0035】画像認識部4aには、画像情報がストリー
ムの形で送信されるとともに、上記画像情報に対応する
ユーザの識別情報(ユーザが保有する画像音声情報生成
装置1の識別情報)も送られる。 【0036】画像認識部4aは、送信された画像ストリ
ームに対して、所定時間ごとに画像の特徴情報(例え
ば、位置に対する輝度値)を抽出する抽出部(図示せ
ず)と、各基準画像(例えば、ユーザの父親の画像)の
特徴情報及びこの基準画像を識別する基準画像識別情報
(例えば、ユーザの父親の名前)が格納された特徴情報
格納部(図示せず)とを有する。 【0037】ここで、特徴情報格納部に格納された基準
画像の特徴情報及び基準画像識別情報は、ユーザの識別
情報(ユーザの画像音声情報生成装置1の識別情報及び
上記ユーザのクライアントサブシステム2の識別情報)
と対応づけられている。 【0038】画像認識部4aは、抽出部により抽出され
た特徴情報と、特徴情報格納部により格納された各特徴
情報(送信されたユーザの識別情報に対応する各特徴情
報)と、比較して、抽出された特徴情報との差分情報が
一定値以内の特徴情報(送信されたユーザの識別情報に
対応する特徴情報)が特徴情報格納部に格納されている
か否かを判定する特徴情報比較部(図示せず)と、差分
情報が一定値以内の特徴情報が格納されていると判定さ
れた場合には、上記特徴情報に対応する基準画像識別情
報を画像認識情報として出力する出力部(図示せず)と
を有する。 【0039】音声認識部4bは、画像音声情報生成装置
1から送信された音声情報に対して、音声認識処理を行
い、音声認識情報を出力する。音声認識部4bには、音
声情報がストリームの形で送信されるとともに、上記音
声情報に対応するユーザの識別情報(ユーザが保有する
画像音声情報生成装置1の識別情報)も送られる。 【0040】音声認識部4bは、送信された音声ストリ
ームに対して、ワードを抽出する抽出部(図示せず)
と、予め決められた複数のワード(例えば、名詞、形容
詞及び名詞等)群からなるテーブルが格納されているテ
ーブル格納部(図示せず)とを有する。ここで、上記テ
ーブルは、複数格納されている。そして、各テーブル
は、それぞれ、ユーザの識別情報(ユーザの画像音声情
報生成装置1の識別情報及び上記ユーザのクライアント
サブシステム2の識別情報)と対応づけられている。 【0041】また、音声認識部4bは、抽出部により抽
出されたワードと、送信されたユーザ識別情報に対応す
るテーブルに含まれているワードを比較して、一致する
か否かを判定するワード比較部(図示せず)と、ワード
比較部により一致すると判定された場合、テーブルに記
録されているワード及びその類似ワードを音声認識情報
として出力する出力部(図示せず)とを有する。 【0042】検索情報生成部4cは、画像認識部4aに
より出力された画像認識情報と、音声認識部4bにより
認識された音声認識情報とに基づいて、検索情報(以
下、第1検索情報という)を生成する。この際、検索情
報生成部4cは、第1検索情報を画像音声情報及びユー
ザの識別情報と対応づける。 【0043】また、サーバ装置4は、各種のデータが格
納された格納部4dと、公衆ネットワーク3を介して、
各画像音声情報生成装置1や各クライアントサブシステ
ム2と通信を行う通信部4eと各部を制御する制御部4
fとを有する。 【0044】クライアントサブシステム2は、格納装置
5と、サブシステム管理装置6と、提示装置7とを有す
る。 【0045】格納装置5は、各種の画像音声情報や、こ
れと対応づけられた第1検索情報を格納する格納部5a
と、ローカルネットワーク8を介して提示装置7やサブ
システム管理装置6と通信を行う通信部5bと、各部を
制御する制御部5cとを有する。 【0046】サブシステム管理装置6は、公衆ネットワ
ーク3とクライアントサブシステム2内の各装置とのゲ
ートウェイ的役割を果たす。サブシステム管理装置6
は、クライアントサブシステム2を保有するユーザの識
別情報等各種のデータを格納する格納部6aと、ユーザ
が提示装置の入力部7cを用いて入力した所望の画像音
声情報を検索するための情報(以下、第2検索情報とい
う)と、格納装置5に格納されている第1検索情報とを
比較し、一致するか否かを判定する比較部6bと、サー
バ装置4等と公衆ネットワーク3を介して通信を行う第
1通信部6cと、提示装置7や格納装置5とローカルネ
ットワーク8を介して通信を行う第2通信部6dと、各
部を制御する制御部6eとを有する。 【0047】ここで、制御部6eは、比較部6bにより
第2検索情報と一致した第1検索情報があったと判定さ
れた場合、その第1検索情報に対応する画像音声情報を
送信するように格納装置5に指示する。そして、格納装
置5から画像音声情報が送信されると、制御部6eは、
提示装置7に上記画像音声情報を送信する。 【0048】また、比較部6bは、第2検索情報と各第
1検索情報が一致しないと判定した場合、第2検索情報
が、第1検索情報と直接比較できる情報であるか否かを
判定する。比較部6bは、名詞テーブル及び形容詞テー
ブルを保持し、第2検索情報が、格納装置5に格納され
ている第1検索情報と比較できる情報であるか否かを判
定する。 【0049】また、サブシステム管理装置6は、第2検
索情報と一致した第1検索情報がないと判定された場合
であって、第2検索情報が、第1検索情報と直接比較で
きる情報でないと判定された場合、新たな第2検索情報
を生成するサブシステム検索情報生成部6fを有する。 【0050】サブシステム検索情報生成部6fは、第2
検索情報から名詞となるワードを抽出する名詞抽出部
(図示せず)と、第2検索情報から形容詞となるワード
を抽出する形容詞抽出部(図示せず)と、名詞抽出部及
び形容詞抽出部から抽出されたワードに対して、順番デ
ータを生成する順番データ生成部(図示せず)と、生成
された順番データと、抽出されたワードに基づいて、格
納されている第1検索情報と直接比較できる新たな第2
検索情報を生成する検索情報生成部(図示せず)とを有
する。 【0051】ここで、名詞抽出部は、複数の名詞ワー
ド、これに類似するワードが記録されたテーブルを有す
る。名詞抽出部は、このテーブルを参照して、第2検索
情報から名詞ワードを抽出する。同じく、形容詞抽出部
は、複数の形容詞ワード、これに類似するワードが記録
されたテーブルを有する。形容詞抽出部は、このテーブ
ルを参照して、第2検索情報から形容詞ワードを抽出す
る。 【0052】サブシステム検索情報生成部6fの具体的
な動作は後述する。 【0053】提示装置7は、サブシステム管理装置6か
ら送信された画像音声情報を提示する提示部7aと、ロ
ーカルネットワーク8を介して格納装置5やサブシステ
ム管理装置6と通信を行う通信部7bと、ユーザが各種
のデータを入力するための入力部7cと、各部を制御す
る制御部7dとを有する。 【0054】(情報検索システムの動作) (1)検索情報の生成、格納動作について 図2は、本実施の形態である情報検索システムにおける
第1検索情報の生成、格納動作を示すフローチャート図
である。 【0055】先ず、サーバ装置4の管理者は、各ユーザ
の画像音声情報生成装置1の識別情報(例えば、パスワ
ード情報等)及びクライアントサブシステム2の識別情
報をサーバ装置4の格納部4dに格納しておく。この識
別情報としては、画像音声情報生成装置1やクライアン
トサブシステム2のサブシステム管理装置6の識別番号
(装置番号)を用いてもよい。 【0056】また、各ユーザは、サブシステム管理装置
6の格納部6aにクライアントサブシステム2の識別情
報を格納しておく。 【0057】また、サーバ装置4の管理者は、サーバ装
置4の画像認識部4aの特徴情報格納部に格納されてい
る各基準画像や基準画像識別情報に対して、それぞれ、
各ユーザの識別情報と対応させておく。また、サーバ装
置4の管理者は、音声認識部4bのテーブル格納部に格
納された各テーブルに対して、それぞれ各ユーザの識別
情報と対応させておく。 【0058】また、サーバ装置4の制御部4fは、公衆
ネットワーク3に接続された各画像音声情報生成装置1
やクライアントサブシステム2のアドレス情報を保持し
ている。画像音声情報生成装置1の制御部1fは、公衆
ネットワーク3に接続されたサーバ装置4やクライアン
トサブシステム2のアドレス情報を保持している。 【0059】同じく、クライアントサブシステム2のサ
ブシステム管理装置6の制御部6eは、公衆ネットワー
ク3に接続された画像音声情報生成装置1やサーバ装置
4のアドレス情報を保持している。 【0060】また、サブシステム管理装置6の制御部6
eや格納装置5の制御部5cは、ローカルネットワーク
8上の自装置以外の装置のアドレス情報を保持してい
る。 【0061】ステップS100では、例えば、ユーザX
が自分の画像音声情報生成装置1を用いて、画像の撮
影、音声の入力処理を行い、画像音声情報生成部2を用
いて画像音声情報を生成する。 【0062】ここで、ユーザXは、撮影部1aを用いて
所定の画像の撮影処理を行いながら、音声入力部1bを
用いて、音声も入力する。すると、撮影部1aにより撮
影された画像及び音声入力部1bにより入力された音声
は、画像音声情報生成部1cに送られる。画像音声情報
生成部1cは、送られた画像及び音声に基づいて、画像
音声情報を生成する。生成された画像音声情報は、制御
部1fを介して、いったん、格納部1dに格納される。
この際、画像音声情報には、ユーザXの画像音声情報の
識別情報が対応づけられる。また、画像情報には、画像
情報である旨の情報が、音声情報には、音声情報である
旨の情報が与えられる。 【0063】そして、画像音声情報生成装置1の制御部
1fは、上記画像音声情報の第1検索情報の生成要求を
通信部1e、公衆ネットワーク3等を介して、サーバ装
置4の制御部4fへ送る。 【0064】この際、ユーザXは、入力部を用いて、画
像音声情報及び第1検索情報は、上記ユーザのクライア
ントサブシステム2に送信し格納するように指示する旨
を入力する。すると、上記指示は、通信部1e、公衆ネ
ットワーク3等を介して、サーバ装置4の制御部4fへ
送られる。上記指示を受けたサーバ装置4の制御部4f
は、ステップS110やS120の認証処理が正当な
ら、検索情報生成部4cにより第1検索情報が生成され
た場合には、画像音声情報及び第1検索情報を上記ユー
ザのクライアントサブシステム2に送信する。 【0065】ステップS110では、サーバ装置4は、
ユーザXの画像音声情報生成装置1に対する認証処理を
行う。 【0066】サーバ装置4の制御部4fは、ユーザXの
画像音声情報生成装置1に対して、識別情報を送信する
旨の要求を通信部4e等を介して、画像音声情報生成装
置1の制御部1fへ送る。画像音声情報生成装置1の制
御部1fは、図示しない表示部に識別情報を入力するよ
うに指示する旨(ログイン処理を行うように指示する
旨)を表示させる。 【0067】ユーザXが図示しない入力部を用いて、ロ
グイン処理を実行し、パスワード等の識別情報を入力す
ると、上記識別情報は、制御部1f等を介して、サーバ
装置4の制御部4fへ送られる。 【0068】サーバ装置4の制御部4fは、送られてき
たユーザXの画像音声情報生成装置1の識別情報と、格
納部4dに格納されているユーザXの画像音声情報生成
装置1の識別情報とを比較し、一致する場合には、ユー
ザXの画像音声情報生成装置1は正当なものと判断す
る。一致しない場合には、ユーザXの画像音声情報生成
装置1は不当なものと判断し、その後の処理を行わな
い。 【0069】ステップS120では、サーバ装置4は、
ユーザXのクライアントサブシステム2に対する認証処
理を行う。 【0070】サーバ装置4の制御部4fは、ユーザXの
クライアントサブシステム2に対して、識別情報を送信
する旨の情報を通信部4e等を介して、サブシステム管
理装置6の制御部6eへ送る。サブシステム管理装置6
の制御部6eは、格納部6aから、クライアントサブシ
ステム2の識別情報を読み出し、第1通信部6c等を介
して、サーバ装置4へ送る。 【0071】サーバ装置4の制御部4fは、送られてき
たユーザXのクライアントサブシステム2の識別情報
と、格納部4dに格納されているユーザXのクライアン
トサブシステム2の識別情報とを比較し、一致する場合
には、ユーザXのクライアントサブシステム2は正当な
ものと判断する。一致しない場合には、ユーザXのクラ
イアントサブシステム2は不当なものと判断し、その後
の処理を行わない。 【0072】ステップS130では、サーバ装置4の制
御部4fは、ユーザXの画像音声情報を送信するように
指示する。そして、サーバ装置4の制御部4fは、画像
音声情報のうち、画像情報を画像認識部4aへ、音声情
報を音声認識部4bへ送る。なお、制御部4fは、画像
音声情報を保持している。 【0073】この処理を具体的に説明する。即ち、サー
バ装置4の制御部4fは、ユーザXの画像音声情報送信
の要求を通信部4e等を介して、ユーザXの画像音声情
報生成装置1の制御部1fへ送る。 【0074】ユーザXの画像音声情報生成装置1の制御
部1fは、上記要求に基づいて、格納部1dから、画像
音声情報を読み出し、通信部1e等を介して、サーバ装
置4の制御部4fへ送る。 【0075】サーバ装置4の制御部4fは、画像音声情
報のうち、音声情報である旨の情報に基づいて、音声情
報を音声認識部4bへ送るとともに、画像情報である旨
の情報に基づいて、画像情報を画像認識部4aへ送る。
なお、サーバ装置4の制御部4fは、ユーザXの識別情
報、ユーザXのクライアントサブシステム2のアドレス
情報を保持する。 【0076】ステップS140では、音声認識部4bは
音声認識処理を行い、音声認識情報を検索情報生成部4
cに出力する。また、画像認識部4aは、画像認識処理
を行い、画像認識情報を検索情報生成部4cへ出力す
る。この動作について以下に具体的に説明する。 【0077】先ず、ユーザXの識別情報がサーバ装置4
の制御部4fから、画像認識部4a及び音声認識部4b
に送られる。画像認識部4aの特徴情報比較部は、ユー
ザXの識別情報に対応する各基準画像の特徴情報及び基
準画像識別情報を読み出す。また、音声認識部4bのワ
ード比較部は、ユーザXの識別情報に対応するテーブル
をテーブル格納部から読み出す。 【0078】先ず、音声認識について説明する。 【0079】制御部4fから、音声ストリームが音声認
識部4bの抽出部へ送られると、抽出部は、ワードを抽
出する。抽出部は、音声情報から、50音の各母音や子
音、濁音等を判断することができる。そして、抽出部
は、判断した母音や子音等から、ワードを抽出する。例
えば、抽出部は、2文字以上のワードを抽出する。 【0080】そして、抽出部は、抽出した各抽出ワード
をワード比較部へ送る。ワード比較部は、ユーザXの識
別情報に対応するテーブルに記録されているワードと一
致するワードを出力部へ送る。 【0081】ここで、テーブルには、名詞ワード、この
名詞ワードに類似するワード、形容詞及び名詞からなる
ワード、このワードに類似するワードが複数記録されて
いる。 【0082】例えば、抽出部からワード(きょう)、ワ
ード(いい)、ワード(てんき)が送られた場合であっ
て、テーブルに、名詞ワード(きょう)、類似名詞ワー
ド(ほんじつ、..)、形容詞及び名詞からなるワード
(よいてんき)、類似ワード(いいてんき...)が記
録されている場合、ワード比較部は、抽出したワード
(きょう)は、記録されている名詞ワード(きょう)に
一致し、抽出したワード(いいてんき)は、記録されて
いる類似ワード(いいてんき)に一致すると判定し、ワ
ード(きょう)及びワード(いいてんき)を音声認識情
報として出力する。 【0083】この際、テーブルに記録された類似ワード
も、音声認識情報に含めておく。例えば、ワード(きょ
う)に対して、テーブルに記録されている類似ワード
(ほんじつ..)を対応づけておく。これは、ユーザが
検索情報と似た情報を入力した場合でも、ユーザが所望
する画像音声情報を検索できるようにするためである。 【0084】なお、音声認識方法には、種々の公知の方
法があり、上述の例は、その一例を示すものであり、本
実施の形態では、特に限定しない。 【0085】次に、画像認識について説明する。制御部
4fから画像ストリームが画像認識部4aの抽出部に送
られると、抽出部は、画像の特徴情報を抽出し、抽出し
た特徴情報を特徴情報比較部へ送る。特徴情報比較部
は、ユーザXの識別情報に対応する各基準画像の特徴情
報と、抽出した特徴情報と、を所定時間ごとに比較す
る。特徴情報比較部は、抽出された特徴情報との差分情
報が一定値以内の特徴情報(送信されたユーザの識別情
報に対応する特徴情報)が特徴情報格納部に存在するか
否かを判定し、一定値以内の特徴情報が存在すると判定
した場合には、上記特徴情報に対応する基準画像識別情
報を画像認識情報として出力部に送る。 【0086】例えば、抽出された画像情報がある人の上
半身部分を示す画像情報であって、特徴情報比較部は、
上記画像情報の特徴情報と、ユーザXの識別情報に対応
するある基準画像(ユーザXの父親の画像)の特徴情報
とを比較し、上記画像情報の特徴情報と、上記基準画像
の特徴情報との差分情報が一定値内の場合には、画像認
識部4aにより与えられる画像認識情報は、ユーザXの
父親という情報となる。 【0087】なお、画像認識方法の仕方は、種々の公知
の方法があり、上述の例は、その一例を示すものであ
り、本実施の形態では、特に限定しない。 【0088】ステップS150では、音声認識部4bに
より出力された音声認識情報、画像認識部4aにより出
力された画像認識情報は、検索情報生成部4cへ送られ
る。検索情報生成部4cは、出力された音声認識情報
と、出力された画像認識情報とに基づいて、検索情報を
生成する。 【0089】具体的には、音声認識情報として、きょ
う、いいてんきが出力され、画像認識情報として、ユー
ザXの父親が出力された場合、検索情報生成部4cは、
きょう、いいてんき、父親を組み合わせて第1検索情報
を生成する。この際、検索情報生成部4cは、きょうの
類似ワード、いいてんきの類似ワードも第1検索情報に
含める。 【0090】なお、公知である人工知能等を応用した高
度なシステムを用いれば、例えば、大勢の人と△○さん
が写っている場面、山と湖が写っている写真、○○への
家族旅行のビデオ等のような感性的なワードを用いた検
索情報の生成も可能である。 【0091】ステップS160では、検索情報生成部4
cから生成された第1検索情報が送られたサーバ装置4
の制御部4fは、保持していた画像音声情報を、上記第
1検索情報及びユーザXの識別情報と対応づける。そし
て、制御部4fは、通信部4e等を介して、ユーザXの
識別情報に対応するクライアントサブシステム2のアド
レス情報に基づいて、ユーザXのクライアントサブシス
テム2のサブシステム管理装置6へ送る。 【0092】ステップS170では、クライアントサブ
システム2のサブシステム管理装置6の制御部6eは、
保持している格納装置5のアドレス情報に基づいて、第
2通信部6d及びローカルネットワーク8等を介して、
格納装置5へ画像音声情報及びこれに対応する第1検索
情報を送る。すると、格納装置5の制御部5cは、送ら
れてきた画像音声情報及びこれに対応する第1検索情報
を格納部5aに格納する。 【0093】格納装置5の制御部5cは、画像音声情報
及びその第1検索情報が格納部5aに格納された旨を、
サブシステム管理装置6、公衆ネットワーク3等を介し
て、画像音声情報生成装置1の表示部に送る。画像音声
情報生成装置1の表示部にて、その旨が表示される。 【0094】(2)ユーザXが所望する画像音声情報の
提示動作 図3,図4は、本実施の形態である情報検索システムに
おけるユーザXが所望する画像音声情報の提示動作を示
すフローチャート図である。 【0095】ステップS200では、ユーザXは、クラ
イアントサブシステム2の提示装置7の入力部7cか
ら、所望の音声画像情報を検索を行うのに必要な情報を
入力する。以下、この情報を第2検索情報という。 【0096】ここで、入力にあたっては、格納部5aに
格納されている検索情報に対応する情報を入力すること
もできるし、より感性的な情報を入力することもでき
る。例えば、ユーザXが、以前撮影した公園に関する画
像音声情報を所望する場合、春の、のどかな、明るい公
園と入力部7cを用いて入力できる。入力部7cにより
入力される情報は、文字情報として、本実施の形態では
説明する。 【0097】ステップS210では、提示装置7の入力
部7cにより入力された第2検索情報は、制御部7d、
通信部7b等を介して、サブシステム管理装置6へ送ら
れる。 【0098】ステップS220では、サブシステム管理
装置6の制御部6eは、保持している格納装置5のアド
レス情報に基づいて、第1検索情報を送信する旨の指示
を第2通信部6d等を介して、格納装置5へ送る。 【0099】ステップS230では、格納装置5の制御
部5cは、上記指示に基づいて、格納部5aから第1検
索情報を読み出し、通信部5b等を介して、サブシステ
ム管理装置6の制御部6eへ送る。 【0100】ステップS240では、サブシステム管理
装置6の制御部6eは、第1検索情報及び第2検索情報
を比較部6bへ送る。 【0101】ステップS250では、比較部6bは、入
力部7cにより入力された第2検索情報と、格納部5a
に格納されていた各第1検索情報とを比較し、一致する
第1検索情報があるか否かを判定する。この際の判定に
おいて、第2検索情報(よいてんき)と比較する対象
は、各第1検索情報に含まれる類似ワードも含まれる。
例えば、第2検索情報(よいてんき)が第1検索情報
(いいてんき)と一致していなくとも、第1検索情報に
含まれる類似ワード(よいてんき)と一致していれば、
比較部6bは、一致する第1検索情報があると判定す
る。 【0102】一致する第1検索情報がある場合には、ス
テップSS280へ移行する。一致する第1検索情報が
ない場合には、ステップS255へ移行する。 【0103】ステップS255では、比較部6bは、第
2検索情報が、格納されている第1検索情報と直接比較
できる情報であるか否かを判定する。この判定の仕方の
一例を以下に示す。 【0104】比較部6bは、保持している名詞テーブル
及び形容詞テーブルに基づいて、第2検索情報が、格納
部5aに格納されている第1検索情報と比較できる情報
であるか否かを判定する。例えば、格納部5aに格納さ
れている第1検索情報が名詞ワード、形容詞及び名詞ワ
ードの場合には、比較部6bは、第2検索情報が名詞ワ
ード、形容詞及び名詞ワードであるか否かを判定する。 【0105】直接比較できない情報である場合には、ス
テップS260へ移行する。直接比較できる情報である
場合には、ステップS257へ移行する。 【0106】ステップS257では、サブシステム管理
装置6の制御部6eは、ユーザXが入力した第2検索情
報に対応する画像映像情報はない旨を提示するように、
第2通信部6d等を介して、提示装置7に指示する。提
示装置7の制御部7dは、その旨を提示部7aに提示さ
せる。 【0107】ステップS260では、第2検索情報が、
比較部6bから制御部6eを介して、サブシステム検索
情報生成部6fへ送られる。サブシステム検索情報生成
部6fは、第2検索情報から新たな第2検索情報(第1
検索情報と直接比較できる情報)を生成する。 【0108】この動作について以下に具体的に説明す
る。サブシステム検索情報生成部6fの名詞抽出部は、
第2検索情報から、名詞ワードを抽出する。この際、名
詞抽出部は、保持している名詞ワードテーブルを参照し
て、名詞ワードを抽出する。また、形容詞抽出部は、第
2検索情報から形容詞ワードを抽出する。この際、形容
詞抽出部は、保持している形容詞ワードテーブルを参照
して、形容詞ワードを抽出する。 【0109】ここで、名詞抽出部及び形容詞抽出部は、
並行して抽出処理を行う。そして、各抽出部は、抽出動
作を行った場合、その抽出時刻を、名詞ワードや形容詞
ワードに与える。その抽出時刻は、名詞ワードや形容詞
ワードに対応づけられて、順番データ生成部へ送られ
る。順番データ生成部は、送られた抽出時刻に基づい
て、名詞ワードや形容詞ワードに対して、順番データを
生成する。 【0110】例えば、第2検索情報が、春の、のどか
な、明るい公園である場合を考える。名詞抽出部は、名
詞ワードテーブルを参照して春、公園を抽出する。そし
て、名詞抽出部は、抽出した時刻を抽出した名詞ワード
と対応づけて、順番データ生成部へ送る。同じく、形容
詞抽出部は、形容詞ワードテーブルを参照してのどか
な、明るいを抽出する。そして、形容詞抽出部は、抽出
した時刻を抽出した形容詞ワードと対応づけて、順番デ
ータ生成部へ送る。 【0111】順番データ生成部は、送られてきた各時刻
に基づいて、抽出した各ワードに対して、順番データを
生成する。例えば、順番データ生成部は、上記第2検索
情報の場合には、春、のどかな、明るい、公園の順で、
各抽出部により抽出されるので、春に対しては、順番デ
ータNo1,のどかなに対しては、順番データNo2、
明るいに対しては、順番データNo3、公園に対して
は、順番データNo4のように、順番データを生成して
いく。 【0112】そして、名詞抽出部により抽出された各名
詞ワード、形容詞抽出部により抽出された各形容詞ワー
ド、これらの対応する順番データが、検索情報生成部へ
送られる。検索情報生成部は、各名詞ワードや各形容詞
ワード、順番データに基づいて、検索情報を生成する。 【0113】例えば、上述の第2検索情報の場合、検索
情報生成部は、名詞ワードの順番の前の順番に形容詞ワ
ードが有る場合、形容詞ワードを後に続く名詞ワードに
修飾させて、形容詞及び名詞ワードを生成する。 【0114】上述の例の場合には、新たな第2検索情報
1(春、のどかな公園)、新たな第2検索情報2(春、
明るい公園)が生成される。 【0115】このようにして、第2検索情報から、格納
装置5に格納されている第1検索情報と直接比較できる
新たな第2検索情報が生成される。サブシステム検索情
報生成部6fにより生成された新たな第2検索情報は、
再び、比較部6bに送られる。 【0116】ステップS270では、比較部6bは、生
成された新たな第2検索情報と、格納部5aから読み出
された各第1検索情報とを比較し、新たな第2検索情報
と一致する第1検索情報があるか否かを判定する。 【0117】ある場合には、ステップS280へ移行す
る。ない場合には、ステップS257へ移行する。 【0118】ステップS280では、サブシステム管理
装置6の制御部6eは、第2検索情報又はサブシステム
検索情報生成部6fにより生成された新たな第2検索情
報と一致する第1検索情報に対応する画像音声情報を送
信するように要求する旨を第2通信部6d等を介して、
格納装置5に送る。 【0119】ステップS290では、格納装置5の制御
部5cは、送信された第1検索情報と対応する画像音声
情報を読み出し、通信部5b等を介して、サブシステム
管理装置6の制御部6eへ送る。 【0120】ステップS300では、サブシステム管理
装置6の制御部6eは、送信された画像音声情報を、第
2通信部6d等を介して、提示装置7のアドレス情報に
基づいて、提示装置7に送る。 【0121】ステップS310では、提示装置7の制御
部7dは、送信された画像音声情報を提示部7aに提示
させる。 【0122】なお、ステップS290で、送信された第
1検索情報に対応する画像音声情報が複数存在する場合
には、提示装置7の提示部7aに、各画像音声情報を特
定する情報を提示させ、ユーザXに入力部7cにより選
択させるようにしてもよい。 【0123】(作用効果)本実施の形態によれば、各ユ
ーザが所有するクライアントサブシステム2ではなく、
サーバ装置4(検索情報生成装置)が、各ユーザの操作
により生成された画像音声情報に対して、画像認識処理
及び音声認識処理を行い、第1検索情報を自動的に生成
する。このため、各ユーザが保有するクライアントサブ
システム2が画像認識処理、音声認識処理を行う機能を
有する必要はない。従って、クライアントサブシステム
2から画像認識処理や音声認識処理に関する機能を省略
することができる。そして、本システムでは、ユーザの
操作に基づいて、画像音声情報生成装置1により画像音
声情報を生成した場合に、サーバ装置4が、画像認識処
理等を行うようにしている。このため、高度な検索を行
うために必要な画像認識等に関する各ユーザによるコス
トの負担は、例えば、サーバ装置4が画像認識処理を行
った分だけのコストを負担すればよいので、画像認識処
理機能及び音声認識処理に関するユーザのコスト負担の
軽減を図ることができる。 【0124】また、本システムによれば、生成された画
像音声情報、第1検索情報、をクライアントサブシステ
ム2の格納装置5が格納する。そして、ユーザが所望の
画像音声情報を検索するための情報である第2検索情報
を入力部7cにより、入力すると、比較部6bは、入力
された第2検索情報と、格納された各第1検索情報とを
比較する。そして、比較結果に基づいて、入力された第
2検索情報に対応する画像音声情報が、前記ユーザに提
示部7aを介して提示される。 【0125】このため、本実施の形態によれば、各ユー
ザのコスト負担を軽減するとともに、各ユーザが自由に
生成した画像音声情報に対しても、十分な画像音声認識
処理を行い、この処理結果を利用して迅速かつ正確に所
望の情報を検索できる検索情報を自動的に生成すること
ができる。 【0126】従って、本システムによれば、ユーザの利
便性を一層考慮して、ユーザが所望する画像音声情報を
高度に検索して提示することが可能となる。 【0127】また、画像認識機能等をサーバ装置4で一
元管理することが出来るため、画像認識等のバージョン
アップ作業においても、各ユーザの負担は軽くなる。 【0128】さらに、サーバ装置4に対して、認識能力
を高めるためにスーパーコンピュータ、多CPUを有す
るコンピュータなどの高性能コンピュータなどを導入す
ることにより、ユーザーにとって、より高度な画像認識
機能及び音声認識処理の利用が可能となる。 【0129】なお、本実施の形態では、画像音声情報
は、クライアントサブシステム2の格納装置5に格納す
るようにしたが、これに限定されるわけでなく、必要に
応じて、サーバ装置4の格納部4dに格納するようにし
てもよい。例えば、クライアントサブシステム2の格納
装置5に格納されている情報量が多いため、容量に余裕
がないときや、クライアントサブシステム2の格納装置
5に故障があったような場合には、サーバ装置4の格納
部4dに一時的にユーザの画像音声情報を格納するよう
にしてもよい。 【0130】この場合、サブシステム管理装置6の制御
部6eは、サーバ装置4の格納部4dに格納されている
画像音声情報の格納位置情報を保持する必要がある。そ
して、制御部4fは、提示装置7に提示する画像音声情
報を、格納装置5の格納部5a及びサーバ装置4の格納
部4dのいずれからも読みだせるようにする必要があ
る。 【0131】また、本実施の形態では、画像音声情報生
成装置1は、画像情報と、これに対応する音声情報とか
らなる画像音声情報に対して、第1検索情報を生成する
ようにしたが、これに限定されるわけでない。例えば、
画像音声情報生成装置1は、画像情報に対して、第1検
索情報を生成し、音声情報に対して上記第1検索情報と
は別の第1検索情報を生成するようにしてもよい。 【0132】また、本実施の形態の情報検索システム
は、以下のように変形することもできる。 【0133】(変形例1) (構成)図5は、変形例1の情報検索システムの構成を
示す図である。図において、図1に示す情報検索システ
ムと同一構成については同一符号を付してその説明を省
略する。 【0134】サーバ装置4の画像認識部4aは、画像音
声情報のうち、画像情報について、第1の所定の解像度
で、画像認識処理を行う。サーバ装置4の音声認識部4
bは、画像音声情報のうち、音声情報について、第2の
所定の解像度で、音声認識処理を行う。 【0135】ここでいう解像度は、例えば、画像認識や
音声認識を行うのに必要な単位時間当たりの情報量で表
すものとする。但し、解像度の定義の仕方はほかにも種
々の仕方があり、ここでいう解像度は、その一例を示し
たものである。 【0136】そして、変形例1のクライアントサブシス
テム2は、情報量決定部6gを有する。情報量決定部6
gは、画像認識処理の各解像度と、所定量の画像情報に
対して上記各解像度で画像認識処理を行うのに必要な画
像情報の情報量とが対応づけられた第1テーブルを保持
している。 【0137】そして、情報量決定部6gは、サーバ装置
から送られてきた第1の所定の解像度と、保持している
第1テーブルを参照して、所定量の画像情報に対して、
上記第1の所定の解像度で、画像認識処理を行うのに必
要な画像情報の情報量である第1画像情報量を決定す
る。 【0138】情報量決定部6gは、音声認識処理の各解
像度と、所定量の音声情報に対して上記各解像度で音声
認識処理を行うのに必要な音声情報の情報量とが対応づ
けられた第2テーブルを保持している。 【0139】そして、情報量決定部は、サーバ装置から
送られてきた第2の所定の解像度と、保持している第2
テーブルを参照して、所定量の音声情報に対して、上記
第2の所定の解像度で、音声認識処理を行うのに必要な
音声情報の情報量である第1音声情報量を決定する。 【0140】そして、情報量決定部6gは、画像音声情
報生成装置1により生成された画像音声情報のうち、画
像情報の情報量である第2画像情報量と、上記決定した
第1画像情報量とを参照する。そして、情報量決定部6
gは、参照結果に基づいて、画像音声情報生成装置1に
より生成された第2画像情報量の画像情報に対して、第
1の所定の解像度で、画像認識処理を行うのに必要な画
像情報の情報量である必要画像情報量を決定する。詳し
い動作は、後述する。 【0141】また、情報量決定部6gは、画像音声情報
生成装置1により生成された画像音声情報のうち、音声
情報の情報量である第2音声情報量と、上記決定した第
1音声情報量とを参照する。そして、情報量決定部6g
は、参照結果に基づいて、画像音声情報生成装置1によ
り生成された第2音声情報量の音声情報に対して、第2
の所定の解像度で、音声認識処理を行うのに必要な音声
情報の情報量である必要音声情報量を決定する。 【0142】制御部6eは、画像音声情報生成装置1に
より生成された画像音声情報のうち、画像情報について
は、第2画像情報量より少ない情報量である上記必要画
像情報量の画像情報にする。 【0143】同じく、制御部6eは、画像音声情報生成
装置1により生成された画像音声情報のうち、音声情報
については、第2音声情報量より少ない情報量である必
要音声情報量の音声情報にする。 【0144】ここで、制御部6eは、例えば、MPEG
等の画像圧縮を行ったり、画像情報中の画素データを間
引くことで、画像情報量を少なくする。また、制御部
は、例えば、音声圧縮を行ったりすることで、音声情報
量を少なくする。 【0145】第1通信部(送信部)は、制御部6eから
送られた画像情報及び音声情報をサーバ装置4に送信す
る。 【0146】サーバ装置4の制御部4fは、送信された
画像音声情報のうち、画像情報、音声情報をそれぞれ、
画像認識部4a、音声認識部4bへ送る。 【0147】(動作)変形例1の情報検索システムの動
作について、図2,3、4に示すフローチャート図を用
いて説明する。 【0148】ステップS100で、ユーザXが自分の画
像音声情報生成装置1を用いて、画像音声情報の生成を
行った後、以下の処理が行われる。 【0149】画像音声情報生成装置1の制御部1fは、
通信部1e等を介して、サブシステム管理装置6のアド
レス情報に基づいて、生成された画像音声情報を送信す
る。 【0150】サブシステム管理装置6の制御部6eは、
第2通信部6d等を介して、格納装置5に上記画像音声
情報を送信する。この際、サブシステム管理装置6の制
御部6eは、一時的に、画像音声情報を保持する。 【0151】格納装置5の制御部5cは、画像音声情報
を格納部5aに格納させる。制御部5cは、画像音声情
報が格納される前の空き容量と、格納された後の空き容
量に基づいて、画像情報の情報量、音声情報の情報量を
算出する。そして、格納装置5の制御部5cは、上記画
像音声情報が格納された旨及び画像情報の情報量、音声
情報量を通信部5b等を介して、サブシステム管理装置
6の制御部6eへ送る。制御部6eは、画像情報の情報
量及び音声情報の情報量を保持する。そして、制御部6
eは、上記画像音声情報に対して、画像認識及び音声認
識を行う要求を第1通信部6c等を介して、サーバ装置
4へ送る。 【0152】サーバ装置4の制御部4fは、ユーザXの
クライアントサブシステム2に対する認証処理を行う。
この処理は、ステップS120と同じである。 【0153】サーバ装置4の制御部4fは、ユーザXの
クライアントサブシステム2の正当性を判断した場合、
画像認識部4a及び音声認識部4bからそれぞれ、第1
の所定の解像度を示す情報、第2の所定の解像度を示す
情報を取得する。 【0154】そして、第1の所定の解像度を示す情報及
び第2の所定の解像度を示す情報は、通信部4e等を介
して、クライアントサブシステムの制御部6eへ送られ
る。 【0155】制御部6eは、第1の所定の解像度を示す
情報及び第2の所定の解像度を示す情報、保持している
画像情報の情報量、音声情報の情報量を情報量決定部6
gへ送る。 【0156】情報量決定部6gは、サーバ装置4から送
られてきた第1の所定の解像度と、保持している第1テ
ーブルを参照して、所定量の画像情報に対して、上記第
1の所定の解像度で、画像認識処理を行うのに必要な画
像情報の情報量である第1画像情報量を決定する。 【0157】そして、情報量決定部6gは、サーバ装置
4から送られてきた第2の所定の解像度と、保持してい
る第2テーブルを参照して、所定量の音声情報に対し
て、上記第2の所定の解像度で、音声認識処理を行うの
に必要な音声情報の情報量である第1音声情報量を決定
する。 【0158】そして、情報量決定部6gは、画像音声情
報生成装置1により生成された画像音声情報のうち、画
像情報の情報量である第2画像情報量と、上記決定した
第1画像情報量とを参照する。そして、情報量決定部6
gは、参照結果に基づいて、画像音声情報生成装置1に
より生成された第2画像情報量の画像情報に対して、第
1の所定の解像度で、画像認識処理を行うのに必要な画
像情報の情報量である必要画像情報量を決定する。 【0159】例えば、必要画像情報量は、第2画像情報
量*(第1画像情報量/所定量)で算出される。 【0160】また、情報量決定部6gは、画像音声情報
生成装置1により生成された画像音声情報のうち、音声
情報の情報量である第2音声情報量と、上記決定した第
1音声情報量とを参照する。そして、情報量決定部6g
は、参照結果に基づいて、画像音声情報生成装置1によ
り生成された第2音声情報量の音声情報に対して、第2
の所定の解像度で、音声認識処理を行うのに必要な音声
情報の情報量である必要音声情報量を決定する。 【0161】例えば、必要音声情報量は、第2音声情報
量*(第1音声情報量/所定量)で算出される。 【0162】情報量決定部6gは、決定した必要画像情
報量及び必要音声情報量を制御部6eへ送る。 【0163】制御部6eは、保持している画像音声情報
のうち、画像情報については、画像情報量を上記決定さ
れた必要画像情報量にする。制御部6eは、保持してい
る画像音声情報のうち、音声情報については、音声情報
量を上記決定された必要音声情報量にする。 【0164】制御部6eは、必要画像情報量の画像情
報、必要音声情報量の音声情報を第1通信部(送信部)
6c等を介して、サーバ装置4へ送る。 【0165】その後、ステップS130以降の処理が行
われる。 【0166】変形例1においても、実施の形態1の効果
が得られる。また、本変形例では、情報量決定部6g
は、所定の解像度で、画像認識及び音声認識を行うのに
必要な情報量を決定できる。このため、送信部6cが、
サーバ装置4に対して、画像音声情報生成装置1で生成
された全ての情報量ではなく、画像認識や音声認識を所
定の解像度で行うのに必要な情報量だけ画像音声情報を
サーバ装置4に送信すれば、サーバ装置4は、所定の解
像度で、画像認識及び音声認識処理を行える。この結
果、画像認識や音声認識に影響を与えることなく、公衆
ネットワーク3の回線の混雑緩和や転送時間の短縮化を
図れることができる。 【0167】(変形例2)図1に示す情報検索システム
の同一構成、機能についてはその説明を省略する。 【0168】(構成)変形例2に係るサーバ装置4で
は、格納部4dに、各種の素材画像情報(例えば、背景
画像)や素材音声情報(例えば、効果音)が格納されて
いる。 【0169】クライアントサブシステム2は、図6に示
すように、格納装置5に格納された画像音声情報に対し
て、上記素材画像情報や素材音声情報を合成する合成編
集装置10を有する。 【0170】(動作)変形例2のシステムでは、ステッ
プS310やS257の処理の後、または、しばらくし
てから、以下の動作を行うこともできる。 【0171】ユーザXは、提示装置7の入力部7cによ
り、各素材画像情報、素材音声情報の一覧を示す情報を
送る要求を入力する。 【0172】上記要求は、提示装置7の制御部7d等を
介して、サーバ装置4の制御部4fへ送られる。 【0173】サーバ装置4の制御部4fは、保持してい
る上記一覧情報を通信部4e等を介して、提示装置7の
提示部7aに提示させる。 【0174】ユーザXは、一覧情報に基づいて、提示装
置7の入力部7cにより所望の素材画像情報、素材音声
情報を特定する情報、これらの画像情報、素材画像情報
の配置情報、素材音声情報を挿入するタイミング情報等
のコマンド列情報を入力する。 【0175】上記コマンド列情報のうち、素材画像情報
や素材音声情報を特定する情報は、提示装置7の制御部
7d等を介して、サーバ装置4の制御部4fへ送られ
る。画像情報の配置情報やタイミング情報は、合成編集
装置10へ送られる。 【0176】サーバ装置4の制御部4fは、送信された
上記特定する情報に基づいて、素材画像情報、素材音声
情報を格納部4dから読み出し、通信部4e等を介し
て、サブシステム管理装置6の制御部6eへ送る。制御
部6eは、いったん、素材画像情報、素材音声情報を保
持する。 【0177】サブシステム管理装置6の制御部6eは、
第2通信部6d等を介して、提示装置7の提示部7a
に、合成編集を行う対象の画像音声情報を検索するため
の第2検索情報を入力するように提示させる。 【0178】その後、ステップS200からステップS
290の動作が行われる。 【0179】サブシステム管理装置6の制御部6eは、
送信された画像音声情報、いったん保持していた素材音
声情報、素材画像情報を合成編集装置10へ送る。 【0180】合成編集装置10は、画像音声情報に対し
て、保持している配置情報やタイミング情報に基づい
て、素材画像情報や素材音声情報を合成編集して、新た
な画像音声情報を生成する。 【0181】新たな画像音声情報は、サブシステム管理
装置6の制御部6eを介して、格納装置5の格納部5a
に格納される。この際、新たな画像音声情報は、編集前
の画像音声情報に対応づけられていた第1検索情報と対
応づけられる。 【0182】変形例2によれば、既に生成された画像音
声情報に対して、効果音や背景画像を付け加えるような
合成編集ができ、より一層ユーザの利便性を考慮するこ
とができる。また、サーバ装置4の格納部4dに格納さ
れている素材画像情報や素材音声情報をすべてクライア
ントサブシステム2に送信する必要がなくなる。 【0183】なお、素材画像情報や素材音声情報に文字
情報等が対応づけられている場合には、サブシステム管
理装置6の検索情報生成部6fは、編集前の画像音声情
報に対応づけられていた第1検索情報と、上記文字情報
等を考慮して、新たな第1検索情報を生成するようにし
てもよい。そして、検索情報生成部6fは、この新たな
第1検索情報を合成編集後の画像音声情報と対応づける
ようにしてもよい。 【0184】(変形例3)変形例2のシステムをさらに
以下のように変形することもできる。 【0185】合成編集装置10が、合成編集処理をし
て、新たな画像音声情報を生成した後、以下のようにす
ることも可能である。 【0186】生成された新たな画像音声情報がサブシス
テム管理装置6の制御部6eを介して、提示装置7の提
示部7aにて提示される。 【0187】ユーザXは、提示された新たな画像音声情
報に満足する場合には、その旨を入力部7cにより入力
する。 【0188】この場合には、新たな画像音声情報は、サ
ブシステム管理装置6の制御部6eを介して、格納装置
5の格納部5aに格納される。この際、新たな画像音声
情報は、例えば、編集前の画像音声情報に対応づけられ
ていた第1検索情報と対応づけられる。 【0189】一方、ユーザXが提示された新たな画像音
声情報に満足しない場合には、ユーザXが入力部7cを
用いてその旨を入力し、再度、上記変形例2の動作を行
わせるようにしてもよい。そして、ユーザXが満足する
新たな画像音声情報が得られるまで、上述の動作を繰り
返すようにしてもよい。 【0190】なお、変形例2では、合成編集機能はクラ
イアントサブシステム2に設けたが、サーバ装置4に設
け、サーバ装置4が、新たな画像音声情報を生成するよ
うにし、それを提示装置7の提示部7aに提示させ、ユ
ーザが満足不満足を判断するようにしてもよい。 【0191】(変形例4)図1に示す情報検索システム
と同一構成、機能についてはその説明を省略する。 【0192】変形例4の画像認識部4aは、シーンチェ
ンジ管理部(図示せず)を有する。シーンチェンジ管理
部は、抽出部により抽出された特徴情報を所定時間ごと
に監視し、特徴情報に変化があった場合には、変化する
前後のタイミングで、シーンチェンジがあったとして、
シーンチェンジタイミング情報を生成する。 【0193】そして、サーバ装置4の制御部4fは、画
像情報とともにシーンチェンジタイミング情報をクライ
アントサブシステム2に送信する。 【0194】クライアントサブシステム2のサブシステ
ム管理装置6は、画像情報及びシーンチェンジタイミン
グ情報を提示装置7の提示部7aに提示させる。この
際、画像情報はストリーム形式で提示される。 【0195】ユーザXは、提示装置7の入力部7cを用
いて、シーンチェンジタイミングの採用、不採用の旨を
入力する。入力された採用不採用の旨は、サーバ装置4
の制御部4fへ送られる。 【0196】画像認識部4aは、送られたシーンチェン
ジタイミングの採用、不採用に基づいて、画像音声情報
生成装置1で生成された画像情報を、複数の画像情報に
分ける。検索情報生成部4cは、分けられた画像情報ご
とに第1検索情報を生成する。 【0197】(動作)変形例4の情報検索システムの動
作について、図2,3、4に示すフローチャート図を用
いて説明する。 【0198】ステップS100からステップS130の
処理の後、ステップS140で、画像認識部4aは、以
下の処理を行う。即ち、画像ストリームに対して、抽出
部により抽出された特徴情報が、シーンチェンジ管理部
へ送られる。シーンチェンジ管理部が、特徴情報が変化
したと判断した場合には、変化する前後のタイミング
で、シーンチェンジがあったとして、シーンチェンジタ
イミング情報を生成する。 【0199】そして、シーンチェンジ管理部は、画像情
報及びこの画像情報の場面区切りのタイミングを示すシ
ーンチェンジタイミング情報をサーバ装置4の制御部4
fへ送る。 【0200】サーバ装置4の制御部4fは、通信部4e
等を介して、上記画像情報及びシーンチェンジタイミン
グ情報を提示装置7に送信する。 【0201】提示装置7の制御部7dは、提示部7aに
上記画像情報及びシーンチェンジタイミング情報を提示
させる。 【0202】ユーザXは、提示部7aにより提示される
上記画像情報及びシーンチェンジタイミング情報を参照
して、入力部7cを用いて、シーンチェンジするタイミ
ングが適当と判断した場合には、シーンチェンジタイミ
ング情報に採用という情報を与え、シーンチェンジする
タイミングが不適当と判断した場合には、シーンチェン
ジタイミング情報に不採用という情報を与える。 【0203】ユーザXにより入力された採用、不採用の
情報は、画像情報、シーンチェンジタイミング情報とと
もに、通信部7b等を介して、サーバ装置4の制御部4
fへ送られる。 【0204】サーバ装置4の制御部4fは、上記採用不
採用等の情報を画像認識部4aの特徴情報比較部及び検
索情報生成部4cへ送る。 【0205】画像認識部4aの特徴情報比較部は、実施
の形態1で示したように、一定の場合には、画像認識情
報を検索情報生成部4cへ出力する。そして、画像認識
部4aの特徴情報比較部による上記処理は、採用された
シーンチェンジタイミングの画像まで行われる。 【0206】そして、音声認識部4bにより出力された
音声認識情報、画像認識部4aにより出力された画像認
識情報は、検索情報生成部4cへ送られる。検索情報生
成部4cは、出力された音声認識情報と、出力された画
像認識情報とに基づいて、第1検索情報を生成する。 【0207】同様にして、次に採用されたシーンチェン
ジタイミングの画像まで画像認識部4aの特徴情報比較
部による上記処理が行われ、検索情報生成部4cにより
第1検索情報が生成される。以降、画像認識部4aに画
像情報が入力されなくなるまで、上述の動作が行われ
る。 【0208】このようにして、画像音声情報生成装置1
で生成された画像情報が、シーンチェンジを考慮して、
複数の画像情報に分けられる。そして、画像情報及び音
声情報からなる画像音声情報に対して、第1検索情報が
生成される。 【0209】以降の処理は、ステップS160以降の処
理と同じである。 【0210】変形例4のシステムは、画像音声情報生成
装置1により生成された画像情報に対して、シーンチェ
ンジを考慮して複数の画像情報に分け、それぞれに対し
て第1検索情報が生成できる。このため、より一層ユー
ザの利便性を考慮することができる。 【0211】(変形例5)変形例5のシステムは、放送
信号受信装置(図示せず)を有する。 【0212】サーバ装置4は、放送信号として、画像情
報や音声情報のほか、文字情報(例えば、EPG情報)
も受信する放送信号受信部(図示せず)を有する。 【0213】また、サーバ装置4は、文字情報を認識す
る文字情報認識部(図示せず)を有する。 【0214】文字認識部による文字認識処理は、例え
ば、以下のようにして行われる。文字認識部は、予め、
所定の複数のワード(名詞等)が記録されたテーブルを
保持している。そして、入力された文字情報に対して、
テーブルに記録されたワードと一致するワードを文字認
識情報として出力する。 【0215】(動作)先ず、放送信号受信部は、画像情
報、音声情報、文字情報を含む放送信号を受信する。こ
の放送信号は、サーバ装置4の制御部4fへ送られる。 【0216】サーバ装置4の制御部4fは、画像情報を
画像認識部4aへ、音声情報を音声認識部4bへ、文字
情報を文字認識部へ送る。 【0217】画像認識部4aにより認識処理されて出力
された画像認識情報、音声認識部4bにより認識処理さ
れて出力された音声認識情報、文字認識部により認識処
理されて出力された文字認識情報が検索情報生成部4c
へ送られる。 【0218】検索情報生成部4cは、各認識情報に基づ
いて第1検索情報を生成する。 【0219】そして、サーバ装置4の制御部4fは、生
成した第1検索情報と、対応する画像音声情報を格納部
4dに格納する。 【0220】そして、サーバ装置4の制御部4fは、通
信部4eを介して、各クライアントサブシステム2に対
して、上記格納した画像音声情報に関する情報、画像音
声情報を特定する情報を送信する。そして、送信された
上記情報は、提示装置7の提示部7aにて提示される。 【0221】ユーザXが上記画像音声情報を取得したい
と判断した場合は、取得要求、画像音声情報を特定する
情報を入力部7cにより入力する。その取得要求等は、
通信部7b、サブシステム管理装置6の制御部6e等を
介して、サーバ装置4の制御部4fへ送られる。 【0222】サーバ装置4の制御部4fは、取得要求及
び画像音声情報を特定する情報に基づいて、格納部4d
に格納されている画像音声情報を読み出し、通信部4e
等を介して、ユーザXのクライアントサブシステム2に
送信する。 【0223】クライアントサブシステム2のサブシステ
ム管理装置6の制御部6eは、第2通信部6dを介し
て、格納装置5の格納部5aに格納させる。 【0224】これにより、ユーザが希望する放送信号の
画像や音声の情報をユーザのサブシステム2に格納する
ことができ、必要に応じて提示させることができる。 【0225】(変形例6)本システムは、また、以下の
ように変形することもできる。 【0226】サーバ装置4の制御部4fは、画像認識処
理や音声認識処理の変更、更新があった場合等、各ユー
ザに提供するサービス内容の変更があった場合、その変
更、更新内容を各クライアントサブシステム2に送る。 【0227】クライアントサブシステム2のサブシステ
ム管理装置6の制御部6eは、変更、更新内容を第2通
信部6d等を介して、提示装置7の提示部7aに提示さ
せる。 【0228】ユーザは、提示部7aにより提示された変
更、更新内容に基づいて、サービスを継続して受けるか
否かを判断する。 【0229】現在受けているサービスを変更するような
場合には、その旨を入力部7cにより入力すると、通信
部7b等を介して、サーバ装置4の制御部4fへ送られ
る。 【0230】サーバ装置4の制御部4fは、変更要求し
てきたユーザの画像音声情報生成装置1やサブシステム
からの情報に対しては、変更要求に基づいてサービスを
行うようにする。 【0231】また、現在受けているサービスを継続する
ような場合には、その旨を入力部7cにより入力する
と、通信部7b等を介して、サーバ装置4の制御部4f
へ送られる。 【0232】サーバ装置4の制御部4fは、上記ユーザ
の画像音声情報生成装置1やクライアントサブシステム
2からの情報に対しては、継続してきたサービスを行う
ようにする。 【0233】(変形例7)本システムは、また、以下の
ように変形することもできる。 【0234】サーバ装置4の画像認識処理や音声認識処
理に変更、更新があった場合(例えば、画像認識処理の
精度を上げたような場合)には、その旨が通信部4e等
を介して、各ユーザのクライアントサブシステム2に送
られる。 【0235】提示装置7の提示部7aにより提示された
変更、更新内容をユーザが見て、変更、更新後の認識処
理サービスを希望する旨を入力部7cにより入力した場
合、その旨は通信部7b等を介して、サーバ装置4の制
御部4fへ送られる。 【0236】サーバ装置4の制御部4fは、送信された
希望する旨に基づいて、上記ユーザの画像音声情報に対
して、新たに第1検索情報を生成するように判断する。
そして、制御部4fは、画像情報音声情報の送信要求
を、クライアントサブシステム2に送信する。 【0237】サブシステム管理装置6の制御部6eは、
第2通信部6d等を介して、格納装置5の格納部5aか
ら全ての画像音声情報を読み出し、サーバ装置4へ送
る。 【0238】サーバ装置4の制御部4fは、送信された
画像音声情報のうち、画像情報を画像認識部4aへ、音
声情報を音声認識部4bへ送り、検索情報生成部4cに
新たな第1検索情報を生成させる。 【0239】そして、制御部4fは、新たな第1検索情
報を画像音声情報と対応づけて、通信部4e等を介し
て、クライアントサブシステム2に送る。 【0240】クライアントサブシステム2では、サブシ
ステム管理装置6を介して、画像音声情報が上記新たな
第1検索情報と対応づけられて格納装置5の格納部5a
に格納される。 【0241】本変形例によれば、サーバ装置4が、一元
的に、画像音声認識サービスを行っているので、画像音
声認識サービスの変更、更新があった場合でも、速やか
に、各ユーザが保有する画像音声情報に対する変更更新
後の画像音声認識処理を行い、新たな第1検索情報を生
成できる。 【0242】(変形例8)また、サーバ装置4の格納部
4dに、各ユーザに対して提供するための画像情報、音
声情報、検索情報が格納されるようにしてもよい。 【0243】この画像情報、音声情報としては、サーバ
装置4が管理する放送信号に関するものでもよいし、各
ユーザが他のユーザに対して、提供してもよいとして提
供した画像情報、音声情報(効果音や背景画像が合成編
集された画像情報も含む)でもよい。 【0244】そして、これらの提供用の画像情報、音声
情報に関する情報を各クライアントサブシステム2に送
信し、各ユーザのサブシステム2から所定の画像情報、
音声情報について送信要求があった場合には、サーバ装
置4は、上記送信要求があった画像情報、音声情報を上
記サブシステム2に提供するようにしてもよい。 【0245】例えば、Video−CD、DVD等の記
録メディア(パッケージメディア)に記録したいという
要求がユーザからあった場合等である。 【0246】(変形例9)サーバ装置4が各ユーザのク
ライアントサブシステム2に種々のサービスを提供する
場合、提供するサービスの内容に応じて、各ユーザから
徴収する料金を決め、サービスを提供する際、又は提供
後に、そのサービスの提供に必要な料金を各サブシステ
ム2から徴収することも可能である。 【0247】各クライアントサブシステム2に料金を請
求する方法には、種々の方法があり、ここでは、特に限
定しない。例えば、以下のような請求方法がある。即
ち、サーバ装置4の格納部4dは、各サービスと、サー
ビスの提供に必要な料金との対応テーブルを格納してい
る。そして、サーバ装置4の制御部4fは、所定のユー
ザに対して、サービスを提供する際に上記対応テーブル
を参照して、料金を示す情報を送信する。 【0248】なお、サービスの提供にあたって、サービ
スの回数によらず、受けるサービスの種類で料金を定め
ることもできる。また、同じサービスであっても、サー
ビスを受ける回数によって、料金を定めることもでき
る。 【0249】また、サーバ装置4の格納部4dに格納さ
れている画像情報、音声情報、素材画像情報、素材音声
情報が、所定のユーザから提供されたものであるとき、
サーバ装置4があるユーザのクライアントサブシステム
2に上記情報のいずれかを提供して、料金を徴収した場
合、上記所定のユーザに料金の一部を返金するようにし
てもよい。なお、返金する金額は、所定ユーザとサーバ
装置4の管理者との事前にやりとり等で決められる。 【0250】(適用例)本実施の形態における検索シス
テムは、以下のようなシステムに適用することも可能で
ある。 【0251】図7は、本実施の形態の情報検索システム
の適用例を示す構成図である。ここで、図1に示すシス
テムと同一構成、同一機能については、同一符号を付し
てその説明を簡略又は省略する。 【0252】適用例に係るシステムでは、クライアント
サブシステム2は、サブシステム管理装置6、テレビ受
像装置12、格納装置5を有する。各部は、ローカルネ
ットワーク8で接続されている。また、サブシステム管
理装置6とテレビ受像装置12との間、テレビ受像装置
12と格納装置5との間、サブシステム管理装置6と格
納装置との間は、AVケーブル9で接続されている。こ
のAVケーブル9は、画像情報や音声情報の送受信に使
う回線である。 【0253】サブシステム管理装置6は、以下に示す点
を除いて、図1に示すサブシステム管理装置6の構成、
機能と同じである。サブシステム管理装置6の格納部
(図示せず)には、格納装置5に記録されている画像音
声情報に対応する第1検索情報が格納されている。 【0254】また、サブシステム管理装置6は、テレビ
受像装置12等との間で、画像情報、音声情報の通信を
行うAV通信部(図示せず)を有する。 【0255】テレビ受像装置12は、図1に示す提示装
置7に対応するものである。テレビ受像装置12の構成
は以下の点を除いて、図1に示す構成と同じである。 【0256】テレビ受像装置12は、サブシステム管理
装置6との間で、画像情報、音声情報の通信を行う第1
AV通信部(図示せず)と、格納装置5との間で、画像
情報、音声情報の通信を行う第2AV通信部(図示せ
ず)を有する。 【0257】格納装置5は、図1に示す格納装置に対応
するものである。格納装置の構成は以下の点を除いて、
図1に示す構成と同じである。格納装置5は、テレビ受
像装置12等との間で、画像音声情報の通信を行うAV
通信部(図示せず)を有する。 【0258】格納装置5は、例えば、DVDーRAMデ
ィスク記録装置、VIDEO−CD,DVD等の記録メ
ディアで構成することが可能である。 【0259】(動作)図2,3,4に示すフローチャー
ト図を用いて適用例のシステムの動作について説明す
る。 【0260】ステップS100〜S160の処理の後、
ステップS170では、以下の処理が行われる。 【0261】ステップS170では、クライアントサブ
システム2のサブシステム管理装置6の制御部6eは、
保持している格納装置5のアドレス情報に基づいて、A
V通信部及びAVケーブル9等を介して、格納装置5へ
画像音声情報を送る。画像音声情報は、格納装置5の格
納部5aに格納される。 【0262】一方、サブシステム管理装置6の制御部6
eは、格納装置5へ送った画像音声情報と対応づけて第
1検索情報を、サブシステム管理装置6の格納部6aに
格納する。 【0263】サブシステム管理装置6の制御部6eは、
画像音声情報及びその第1検索情報が格納された旨を、
ローカルネットワーク8等を介して、テレビ受像装置1
2の表示部(図示せず)に送る。テレビ受像装置12の
表示部にて、上記旨が表示される。 【0264】(2)ユーザXが所望する画像音声情報の
提示動作については、図3,4のステップS200から
S310の処理が行われる。この際、サブシステム管理
装置6の制御部6eは、第1検索情報を格納装置5では
なく、サブシステム管理装置6の格納部6aから読み出
す。また、画像音声情報についての通信は、AVケーブ
ル9やAV通信部を介して行う。それ以外の点は、実施
の形態1のシステムの動作と同じである。 【0265】また、実施の形態1の変形例1から変形例
9については、適用例のシステムについても同様に適用
できる。図8は、適用例のシステムを実施の形態1の変
形例2のように変形した場合の構成を示す図である。 【0266】実施の形態2. (構成)図9は、本発明の実施の形態2である情報検索
システムの構成を示す図である。 【0267】実施の形態2のシステムにおいて、実施の
形態1の構成と同一構成については、同一符号を付して
その説明を省略する。情報検索システムにおいて、実施
の形態1のシステムと異なる点は、以下の点にある。 【0268】情報検索システムは、サーバ装置4等と公
衆ネットワーク3を介して接続された無線局20を有す
る。無線局20は、複数の携帯電話型画像音声情報生成
装置21と無線ネットワーク22を介して接続される。
この携帯電話型画像音声情報生成装置21は、例えば、
携帯電話等で構成され、その構成は、実施の形態1の画
像音声情報生成装置1の構成と同じである。但し、通信
部1eは、無線局20とデータ通信を行う。 【0269】本システムでは、クライアントサブシステ
ム2の代わりに、クライアントPC端末装置30が設け
られている。 【0270】クライアントPC端末装置30は、メモリ
部30a(例えば、ハードディスク等)、提示部30b
(例えば、CRT等)、入力部30c(例えば、キーボ
ード、マウス等)、通信部30d、CPU30eを有す
る。 【0271】メモリ部30aには、クライアントPC端
末装置30のユーザの識別情報や、CPU30eに各種
の動作を実行させるための実行プログラム、画像音声情
報、これらに対応する第1検索情報等各種のデータが格
納されている。 【0272】入力部30cには、ユーザにより各種のデ
ータが入力される。通信部30dは、サーバ装置4や無
線局20と公衆ネットワーク3を介して、データ通信を
行う。 【0273】CPU30eは、メモリ部30aの実行プ
ログラムを解読して、後述する比較部41等に比較動作
を行わせたり、制御部42に各種の動作を行わせるよう
に命令する解読命令部40と、解読命令部40により命
令された指示に基づいて、ユーザにより入力された第2
検索情報と、メモリ部30aに格納されている第1検索
情報とを比較する比較部41と、各部を制御する制御部
42とを有する。 【0274】ここで、上記比較部41は、第2検索情報
と各第1検索情報が一致しないと判定した場合、第2検
索情報が、第1検索情報と直接比較できる情報であるか
否かを判定する。 【0275】また、CPU30eは、第2検索情報と一
致した第1検索情報がないと判定された場合であって、
第2検索情報が、第1検索情報と直接比較できる情報で
ないと判定された場合、第2検索情報から、新たな第2
検索情報(第1検索情報と直接比較できる情報)を生成
する検索情報生成部43を有する。 【0276】(動作)実施の形態2の情報検索システム
の動作について、図2,3,4に示すフローチャート図
を用いて説明する。実施の形態1に示す動作と同一動作
については、その説明を省略する。 【0277】ここで、クライアントPC端末装置30
は、電源がオンされると、CPU30eがメモリ部30
aから実行プログラムを読み出し、解読命令部40が解
読して、各部に対して、それぞれ、各種の動作を実行で
きるように命令する。すると、CPU30e内の各部
は、各種の動作が実行できるように設定される。 【0278】ステップS100、S110の処理におい
て、携帯電話型画像音声情報生成装置21とサーバ装置
4との間の通信は、無線局20を介して行われる。 【0279】ステップS120では、サーバ装置4は、
ユーザXのクライアントPC端末装置30に対する認証
処理を行う。 【0280】サーバ装置4の制御部4fは、ユーザXの
クライアントPC端末装置30に対して、識別情報を送
信する旨の情報を通信部4e等を介して、PC端末装置
30のCPU30eの制御部42へ送る。制御部42
は、メモリ部30aから識別情報を読み出し、通信部3
0d等を介して、サーバ装置4の制御部4fへ送信す
る。制御部4fは、送られてきた識別情報と、格納部4
dに格納されているユーザXのPC端末装置30の識別
情報とを比較し、一致する場合には、ユーザXのPC端
末装置30は正当なものと判断する。 【0281】この後、ステップS130、S140、S
150の処理が行われる。この際、携帯電話型画像音声
情報生成装置21とサーバ装置4との間の通信は、無線
局20を介して行われる。 【0282】ステップS160では、検索情報生成部4
cから生成された第1検索情報が送られたサーバ装置4
の制御部4fは、保持していた画像音声情報を、上記第
1検索情報及びユーザXの識別情報と対応づけて、通信
部4e等を介して、ユーザXのPC端末装置30へ送
る。 【0283】ステップS170では、PC端末装置30
のCPU30eの制御部42は、メモリ部30aに画像
音声情報及びこれに対応する第1検索情報を送り、格納
させる。制御部42は、画像音声情報及びその第1検索
情報がメモリ部30aに格納された旨を提示部30bに
提示させる。 【0284】次に、ユーザXが所望する画像音声情報の
提示動作について、図3,4を用いて、説明する。 【0285】ステップS200では、ユーザXは、PC
端末装置30の入力部30cから、所望の音声画像情報
を検索を行うのに必要な情報である第2検索情報を入力
する。 【0286】ステップS210では、PC端末装置30
の入力部30cにより入力された第2検索情報は、制御
部42へ送られる。 【0287】ステップS220、S230では、PC端
末装置30の制御部42は、メモリ部30aから第1検
索情報を読み出す。 【0288】ステップS240では、PC端末装置30
の制御部42は、第1検索情報及び第2検索情報を比較
部41へ送る。 【0289】ステップS250では、比較部41は、第
2検索情報と、各第1検索情報とを比較し、一致するか
否かを判定する。 【0290】一致する第1検索情報がある場合には、ス
テップSS280へ移行する。一致する第1検索情報が
ない場合には、ステップS255へ移行する。 【0291】ステップS255では、比較部41は、第
2検索情報が、格納されている第1検索情報と直接比較
できる情報であるか否かを判定する。 【0292】直接比較できない情報である場合には、ス
テップS260へ移行する。直接比較できる情報である
場合には、ステップS257へ移行する。 【0293】ステップS257では、PC端末装置30
の制御部42は、ユーザXが入力した第2検索情報に対
応する画像映像情報はない旨を提示するように、提示部
30bに指示する。提示部30bは、その旨を提示す
る。 【0294】ステップS260では、第2検索情報が、
比較部41から制御部42を介して、検索情報生成部4
3へ送られる。検索情報生成部43は、第2検索情報か
ら新たな第2検索情報を生成する。検索情報生成部43
により生成された新たな第2検索情報は、再び、比較部
41に送られる。 【0295】ステップS270では、比較部41は、生
成された新たな第2検索情報と、メモリ部30aから読
み出された各第1検索情報とを比較し、生成された新た
な第2検索情報と一致する第1検索情報があるか否かを
判定する。 【0296】ある場合には、ステップS280へ移行す
る。ない場合には、ステップS257へ移行する。 【0297】ステップS280、S290では、CPU
30eの制御部42は、第2検索情報又は,検索情報生
成部43により生成された新たな第2検索情報と一致す
る第1検索情報に対応する画像音声情報をメモリ部30
aから読み出す。 【0298】ステップS300では、CPU30eの制
御部42は、読み出した画像音声情報を、提示部30b
に送る。 【0299】ステップS310では、提示部30bは、
送信された画像音声情報を提示する。 【0300】本実施の形態においても、実施の形態1の
効果が得られる。また、本実施の形態においても、実施
の形態1で示した変形例1から9までの変形が可能であ
る。この際、画像音声情報生成装置1を携帯画像音声情
報生成装置1に代え、提示装置7の通信部7b、制御部
7d、格納装置5の通信部5b、制御部5cに関する動
作をなくし、提示装置7の提示部7aを提示部30bに
代え、提示装置7の入力部7cを入力部30cに代え、
格納装置5の格納部5aをメモリ部30aに代える。 【0301】また、クライアントサブシステム2、サブ
システム管理装置6をPC端末装置30に代え、サブシ
ステム管理装置6の第1通信部6c,第2通信部6dに
関する動作をなくす。そして、サブシステム管理装置6
の格納部6aは、メモリ部30aに代える。 【0302】実施の形態2において、実施の形態1で示
した変形例1を適用した情報検索システムの構成を図1
0に示す。実施の形態1で示した情報量決定部43は、
CPU30e内に設けられている。 【0303】そして、通信部30d(送信部)は、情報
量決定部43により決定された必要情報量で、携帯電話
型画像音声情報生成装置21により生成された画像音声
情報をサーバ装置4に送信する。 【0304】 【発明の効果】本発明によれば、各ユーザのコスト負担
を軽減するとともに、各ユーザが自由に生成した画像音
声情報に対しても、十分な画像音声認識処理を行い、こ
の処理結果を利用して迅速かつ正確に所望の情報を検索
できる検索情報を自動的に生成することができる。従っ
て、本システムによれば、ユーザの利便性を一層考慮し
て、ユーザが所望する画像音声情報を高度に検索して提
示することが可能となる。 【0305】また、本システムの情報量決定手段は、所
定の解像度で、画像認識及び音声認識を行うのに必要な
情報量を決定できる。このため、送信手段が、画像音声
情報生成装置で生成された全ての情報量ではなく、画像
認識や音声認識を所定の解像度で行うのに必要な情報量
だけ、画像音声情報を検索情報生成装置に送信すれば、
検索情報生成装置は、所定の解像度で、画像認識及び音
声認識処理を行える。この結果、画像認識や音声認識に
影響を与えることなく、回線の混雑緩和や転送時間の短
縮化を図れることができる。
【図面の簡単な説明】 【図1】実施の形態1である情報検索システムの構成を
示す図である。 【図2】実施の形態1である情報検索システムの動作の
一部を示すフローチャート図である。 【図3】実施の形態1である情報検索システムの動作の
一部を示すフローチャート図である。 【図4】実施の形態1である情報検索システムの動作の
一部を示すフローチャート図である。 【図5】実施の形態1の変形例1の情報検索システムの
構成を示す図である。 【図6】実施の形態1の変形例2の情報検索システムの
構成を示す図である。 【図7】実施の形態1の適用例の情報検索システムの構
成を示す図である。 【図8】実施の形態1の適用例を変形した情報検索シス
テムの構成を示す図である。 【図9】実施の形態2である情報検索システムの構成を
示す図である。 【図10】実施の形態2の変形例1の情報検索システム
の構成を示す図である。 【図11】従来の情報検索システムの構成を示す図であ
る。 【符号の説明】 1、50 画像音声情報生成装置、1a 撮影部、1b
音声入力部、1c 画像音声情報生成部、1d,4
d,5a,6a 格納部、1e、4e,5b,7b,3
0d 通信部,1f,4f,5c,6e、7d,42
制御部、2 クライアントサブシステム、3、51 公
衆ネットワーク、4 サーバ装置、4a 画像認識部、
4b 音声認識部、4c,43 検索情報生成部、5,
52c 格納装置、6、52a サブシステム管理装
置、6b,41 比較部、6c 第1通信部、6d 第
2通信部、6f サブシステム検索情報生成部、6g、
43 情報量決定部、7,52b 提示装置、7a,3
0b 提示部、7c,30c 入力部、8 ローカルネ
ットワーク、9 AVケーブル、10 合成編集装置、
20 無線局、21 携帯電話型画像音声情報生成装
置、30 クライアントPC端末装置、30a メモリ
部、30e CPU、40 解読命令部、52d 画像
音声認識装置
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/00 G10L 3/00 551G 551A Fターム(参考) 5B050 AA08 CA07 CA08 EA04 EA18 FA02 FA10 FA13 GA08 5B075 KK07 ND06 ND14 NK02 NK07 NK10 NK25 NK39 PP22 PP24 PQ02 5D015 KK01

Claims (1)

  1. 【特許請求の範囲】 【請求項1】 画像情報及び該画像情報に対応する音声
    情報からなる画像音声情報に対して、所定の解像度で、
    画像認識処理及び音声認識処理を行い、認識結果に基づ
    いて前記画像音声情報を検索するための第1検索情報を
    生成し、該第1検索情報を用いて、ユーザが所望する画
    像音声情報を検索するシステムであって、 各ユーザの操作に基づいて、それぞれ、画像音声情報を
    生成する各画像音声情報生成装置と、 所定量の画像音声情報に対して、前記所定の解像度で、
    画像認識処理及び音声認識処理を行うのに必要な画像音
    声情報の情報量である第1情報量と、前記各画像音声情
    報生成装置により生成された画像音声情報の情報量であ
    る第2情報量とに基づいて、前記第2情報量の画像音声
    情報に対して、前記所定の解像度で、画像認識処理及び
    音声認識処理を行うのに必要な画像音声情報の情報量で
    ある必要情報量を決定する情報量決定手段と、 前記情報量決定手段により決定された必要情報量で、前
    記各画像音声情報生成装置により生成された画像音声情
    報を送信する送信手段と、 前記送信手段により送信された各画像音声情報に対し
    て、前記所定の解像度で、画像認識処理及び音声認識処
    理を行い、認識結果に基づいて、前記第1検索情報を、
    前記各画像音声情報に対応づけて生成する検索情報生成
    装置と、 前記検索情報生成装置により生成された各第1検索情報
    と、前記送信手段により送信された各画像音声情報とを
    それぞれ対応づけて、格納する格納手段と、 ユーザが所望の画像音声情報を検索するための第2検索
    情報を入力する入力手段と、 前記入力手段により入力された第2検索情報と、前記格
    納手段に格納された各第1検索情報とを比較する比較手
    段と、 前記比較手段による比較結果に基づいて、前記格納手段
    から前記第2検索情報に対応する画像音声情報を読み出
    し、その読み出した画像音声情報を、前記ユーザに提示
    する提示手段とを有することを特徴とする情報検索シス
    テム。
JP2002045333A 2002-02-21 2002-02-21 情報検索システム Pending JP2003248685A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002045333A JP2003248685A (ja) 2002-02-21 2002-02-21 情報検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002045333A JP2003248685A (ja) 2002-02-21 2002-02-21 情報検索システム

Publications (1)

Publication Number Publication Date
JP2003248685A true JP2003248685A (ja) 2003-09-05

Family

ID=28659268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002045333A Pending JP2003248685A (ja) 2002-02-21 2002-02-21 情報検索システム

Country Status (1)

Country Link
JP (1) JP2003248685A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013225319A (ja) * 2006-06-28 2013-10-31 Microsoft Corp 視覚的な多次元の検索

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013225319A (ja) * 2006-06-28 2013-10-31 Microsoft Corp 視覚的な多次元の検索

Similar Documents

Publication Publication Date Title
US11356714B2 (en) Apparatus, systems and methods for a content commentary community
US7616840B2 (en) Techniques for using an image for the retrieval of television program information
US7181757B1 (en) Video summary description scheme and method and system of video summary description data generation for efficient overview and browsing
US20030014758A1 (en) System and method for providing summary video information of video data
US20050165613A1 (en) Methods for constructing multimedia database and providing mutimedia-search service and apparatus therefor
KR101123370B1 (ko) 휴대단말용 객체기반 콘텐츠 제공방법 및 장치
JP2002108892A (ja) データ管理システム、データ管理方法、及び、記録媒体
US20040192382A1 (en) Personal digest delivery system and method
KR101850501B1 (ko) 역사 컨텐츠 제공 시스템
JP5306550B2 (ja) 映像解析情報送信装置、映像解析情報配信システム及び配信方法、映像視聴システム及び映像視聴方法
US20080065695A1 (en) System and method for nondeterministic media playback selected from a plurality of distributed media libraries
JP5198643B1 (ja) 映像解析情報アップロード装置及び映像視聴システム及び方法
JP4506270B2 (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2003248685A (ja) 情報検索システム
JP2021005390A (ja) コンテンツ管理機器、および、制御方法
JP2002304420A (ja) 視聴覚コンテンツ配信システム
KR100944958B1 (ko) 특정 구간의 멀티미디어 데이터 및 캡션 데이터를 제공하는장치 및 서버
KR100671147B1 (ko) 명장면 체험 서비스 장치 및 그 방법
JP2007104326A (ja) コンテンツ作成装置及びコンテンツ作成方法
JP2010283707A (ja) 車載用電子装置および車載用電子装置の画像更新システム
JP2002175298A (ja) データ管理システム、データ管理方法、及び、プログラム
JP2005328218A (ja) 録画処理装置、録画予約処理システム、記事管理システム、および録画処理方法、並びにコンピュータ・プログラム
KR100507028B1 (ko) 멀티미디어 콘텐츠에 관한 자막 파일 등의 보조 콘텐츠 관리 시스템 및 그 방법
KR20060102641A (ko) 연기자의 대본 연습을 위한 전자 대본 제공 시스템 및 방법
JP2007048334A (ja) データ記録システム、端末装置、データ記録装置、データ記録方法、制御プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体