JP2001092838A - マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体 - Google Patents
マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体Info
- Publication number
- JP2001092838A JP2001092838A JP26835799A JP26835799A JP2001092838A JP 2001092838 A JP2001092838 A JP 2001092838A JP 26835799 A JP26835799 A JP 26835799A JP 26835799 A JP26835799 A JP 26835799A JP 2001092838 A JP2001092838 A JP 2001092838A
- Authority
- JP
- Japan
- Prior art keywords
- information
- multimedia
- recognition
- multimedia information
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/41—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99948—Application of database or data structure, e.g. distributed, multimedia, or image
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
の編集、抽出、関連付けなどを自動的に行って、データ
ベース化することができるようすること。 【解決手段】各種メディアの情報を収集するマルチメデ
ィア情報収集手段1と、このマルチメディア情報収集手
段により収集された各種メディアの情報を所要の関連の
あるものについては対応付けて前記マルチメディア対応
記憶手段に記憶させるマルチメディア対応記憶手段2
と、このマルチメディア対応記憶手段に対応づけられて
記憶されている情報を抽出して認識し、解析してその抽
出した情報に関係する個人を特定する情報認識/解析手
段3と、この情報認識/解析手段が解析した情報を前記
マルチメディア対応記憶手段に記憶された情報と対応さ
せて蓄積するマルチメディアデータベース11とを具備
する。
Description
報を整理、抽出して関連のあるものについては関連付け
を行い、利用し易い構造のデータベースにデータベース
化するようにしたマルチメディア情報収集管理装置に関
するものである。
ば、デジタルスチルカメラがある。そして、デジタルス
チルカメラの中には静止画に対して記録日時やサウンド
などの注釈を付けられるものがある。また、動画を記録
する機器としては、デジタルムービなどがあり、動画と
サウンドを記録できるだけでなく、記録日時やタイトル
などの注釈を付けられるものがある。
メディア情報収集機器では、各種マルチメディア情報を
収集することはしても、その整理と情報の編集、抽出、
関連付けなどデータベース化するための作業は人手に頼
らねばならない。従って、データベース化に当たっては
大きな労力を裂かねばならない。
マルチメディア情報収集機器では、各種マルチメディア
情報を収集することはしても、それをデータベース化す
るためにはその収集情報の整理や情報の編集、抽出、関
連付けなど、人手に多くを頼らねばならないなど作業の
負担が多く、データベース化に当たって費やさねばなら
ない労力は大変なものがある。
ーザに負担をかけることなく収集、整理および関連付け
を行って、多様な検索を可能にするようなデータベース
の構築が行えるようにする技術の開発が嘱望されてい
る。
収集した各種マルチメディア情報について、その情報の
整理や情報の編集、抽出、関連付けなどを自動的に行っ
て、データベース化することができるようにしたマルチ
メディア情報収集装置を提供することにある。
め、本発明は次のように構成する。すなわち、各種メデ
ィアの情報を収集するマルチメディア情報収集手段と、
このマルチメディア情報収集手段により収集された各種
メディアの情報を所要の関連のあるものについては対応
付けて前記マルチメディア対応記憶手段に記憶させるマ
ルチメディア対応記憶手段と、このマルチメディア対応
記憶手段に対応づけられて記憶されている情報を抽出し
て認識し、解析してその抽出した情報に関係する個人を
特定する情報認識/解析手段と、前記情報認識/解析手
段が解析した情報を前記マルチメディア対応記憶手段に
記憶された情報と対応させて蓄積するマルチメディアデ
ータベースとを具備することを特徴とする。
には、撮像手段を設けると共に、この撮像手段にて撮像
した被写体の画像をマルチメディア情報として収集し、
この収集した画像のマルチメディア情報を表示手段に画
像表示させる機能手段と、この表示させた画像の所望領
域に人為的指示に基づいて認識領域を示すマークを付与
する機能手段と、この付与したマークを当該マルチメデ
ィア情報中に記録させるべく制御する機能手段とを設
け、また、前記情報認識/解析手段には、前記マルチメ
ディア情報収集手段が情報収集時にマルチメディア情報
中に記録したマークをもとに、認識/解析対象を抽出す
る対象抽出手段を具備する。
アの情報を記憶するマルチメディア対応記憶手段があ
り、各種メディアの情報を収集するマルチメディア情報
収集手段は各種メディアの情報を収集すると共に、所要
の関連のあるものについては対応付けて前記マルチメデ
ィア対応記憶手段に記憶させる。
ア対応記憶手段に対応づけられて記憶されている情報を
抽出して認識し、解析してその抽出した情報に関係する
個人を特定する。そして、この情報認識/解析手段にて
解析した情報を前記マルチメディア対応記憶手段に記憶
された情報および対応付け情報と共にマルチメディアデ
ータベースに蓄積する。
ータを集め、集めたこれらの情報について、個人別、そ
して、イベント別に情報を検索可能なように各情報につ
いて関係のあるもの同士のリンクを張った構造のデータ
ベースを自動作成することができるようになるものであ
る。
には、撮像手段を設けてあり、この撮像手段にて撮像し
た被写体の画像をマルチメディア情報として収集し、こ
の収集した画像のマルチメディア情報を表示手段に画像
表示させることができる。そして、この表示させた画像
の所望領域に人為的指示に基づいて認識領域を示すマー
クを付与することにより、これを当該マルチメディア情
報中に記録させることができる。そして、情報認識/解
析手段は、マルチメディア情報中に記録したマークをも
とに、認識/解析対象を抽出する。
管理装置では、画像の認識対象の領域を特定形状のマー
クで囲むことにより、認識領域と認識処理内容を特定す
るようにすると共に、マルチメディア情報収集の際に画
像については認識対象の領域に、所望とする認識処理内
容対応の形状でマークを付けることにより、認識領域を
特定でき、そのマークの属性に応じた認識を行う他のメ
ディアと対応付けて記録して、その認識結果を手掛かり
に検索を行うことができるなど、ユーザに負担をかける
ことなく、マルチメディア情報の収集および検索を行う
ことができるようにしたマルチメディア情報収集管理装
置を提供できる。
合、例えば、会議を開催した場合に、会議名や議題、開
催場所、開催日時、出席者名、資料などが記載された会
議資料があればそれを撮像手段で撮像して、関係資料と
してデータ化して取得し、また、会議出席者の画像を一
人一人撮像手段で撮像して、その出席者各人の顔画像を
収集し、その顔画像中の認識領域を設定すべく、画像上
にマークすることで顔画像の特徴を抽出し、また、その
際に、例えば、その人個人の名刺の提供を受けて当該名
刺の画像を撮像して文字認識によりその人の名前や所属
など個人情報をテキストデータ化して収集し、また、自
己紹介などで音声情報を取得して音声認識するなどし
て、個人を特定できる基礎的なデータを集めると、集め
たこれらの情報について、個人別、会議別に情報を検索
可能なように各情報について関係のあるもの同士のリン
クを張った構造のデータベースを自動作成することがで
きるものである。
マルチメディア情報の収集とその収集データのデータベ
ース化ができ、しかも、データベースは関連情報はイベ
ント単位、個人単位でリンクが張られるので検索も容易
に行うことができるようになるマルチメディア情報収集
管理装置を提供できる。
図面を参照して説明する。
音声情報、文字情報、画像情報などのマルチメディア情
報を収集してその情報を関連のあるもの同士を関連付け
て整理し、データベース化する技術について説明する。
収集方式を採用して構成したマルチメディア情報収集装
置の実施形態をブロック図で示したものである。
ア情報収集装置は、マルチメディア情報収集部1、マル
チメディア対応記憶部2、情報認識/解析部3、対象抽
出部4、解析制御部5、文字認識部6、音声認識部7、
顔認識部8、話者認識部9、人名抽出部10、マルチメ
ディアデータベース部11から構成されている。
1は画像、音声、文字、図形などのマルチメディア情報
を収集するためのものであり、画像取得用としてデジタ
ルカメラやデジタルムービ、音声情報取得用としてマイ
クロフォン、図形/文字取得用として例えば、ペン入力
装置の操作による図形情報やパターン認識技術による文
字認識機能など備えている。そして、マルチメディア情
報収集部1には更に、収集した各種メディアの情報を、
所要の関連のあるものについては情報同士、対応付けて
マルチメディア対応記憶部2に記憶させるべく制御する
機能を有している。
ディア情報収集部1の収集した画像、音声、図形、文字
(テキスト)などの各メディアの情報を、関連のあるも
の同士についてはそれぞれ対応させて記憶するためのも
のである。
ア対応記憶部2に対応づけられて記憶されている情報部
分を抽出し、認識/解析するものであって、マルチメデ
ィア対応記憶手段に対応づけられて記憶されている情報
を抽出して認識処理し、解析してその抽出した情報に関
係する個人を特定する機能を有する。また、解析された
情報をマルチメディア対応記憶部2に記憶された情報お
よび対応情報と対応させてマルチメディアデータベース
部11へ蓄積させる制御を司る。
報収集部1が情報を収集した際に、ユーザの操作によっ
てマルチメディア情報中に記録された認識領域枠のマー
クをもとに、その認識領域枠内の画像情報をマーク属性
に従って認識し、解析対象を抽出するものである。
が抽出した認識/解析対象のマークの属性に対応して、
使用する認識/解析に用いる知識辞書や認識/解析方法
を制御するものであり、文字認識部6は、画像中の文字
を認識するためのものであり、音声認識部7は、画像や
他のメディアに対応して収集された音声を認識するもの
であり、音声情報を音声認識処理することで、文字情報
に変換すると云った機能を有する。
ためのものであり、画像中の顔部分の特徴点を認識する
ことで、個人個人の顔の特徴から個人を識別することが
できるものである。また、話者認識部9は、画像や他の
メディアに対応して収集された音声より話者を認識する
ものであり、人名抽出部10は、文字認識部6が認識し
た結果より人名情報部分を抽出するものである。
は、解析された情報をマルチメディア対応記憶部2に記
憶された情報および対応情報と対応させて蓄積するベー
スである。このようなマルチメディアデータベース部1
1への情報蓄積の制御は、情報認識/解析部3によって
行われる。
収集装置の処理動作を説明するためのフローチャートで
ある。また、図3は、マルチメディア情報収集装置の前
面操作部の構成を示したものであり、マルチメディア情
報収集部1の構成要素の一部である。
収集装置の前面操作部は、ディスプレイ部とカメラ部、
そしてスピーカとマイクロフォンおよび操作ボタンなど
がレイアウトされている。ディスプレイ部は例えば、液
晶パネルディスプレイで作られており、デジタルカメラ
が撮影している映像または既に撮影した映像を表示さ
せ、また情報収集の際の操作等を行うアプリケーション
の表示画面を表示して画面上で操作を行うための情報操
作部21となっている。
は送りボタンやポイントボタン、文字入力ボタン図形入
力ボタン、図形入力ボタン、認識領域指定ボタンなどが
画面の端部に表示され、マウスなどのポインティングデ
バイスで位置を指定してクリックすると、そのボタンが
示す処理内容の機能を画面上で実行することができる。
例えば、27が文字入力ボタン、28が図形入力ボタ
ン、29が認識領域指定ボタン部(四角形領域)、30
が認識領域指定ボタン部(円形領域)、31が情報表示
部であり、情報表示部31は画像や文字などの表示のた
めの領域として用いられる。
状態で、ポインティングデバイスで画像上の位置を指定
し、認識領域指定ボタン部(四角形領域)29を押し、
表れた四角形をポインティングデバイスにてドラッグし
て範囲を所望に調整し、定めるとその四角形領域を文字
認識領域としてアプリケーションに認識処理させること
ができる。
態で、ポインティングデバイスで画像上の位置を指定
し、認識領域指定ボタン部(円形領域)30を押し、表
れた円形をポインティングデバイスにてドラッグして範
囲を調整し、定めるとその円形領域内を画像の認識領域
としてアプリケーションに認識処理させることができ
る。
イル機能、編集機能、表示機能、挿入機能、ツール機能
でヘルプ機能などの各機能を指定するためのメニューボ
タンが表示されていてポインティングデバイスで必要に
応じて選択指定することでこれらの機能を利用できるよ
うになっている。
ルカメラのレンズ部であり、このレンズ部22を通し
て、得られる画像がデジタルカメラにて撮像されて画像
データになる。23は前面操作部に設けられているデジ
タルカメラのシャッタボタン部であり、このシャッタボ
タン部23をユーザが押すことで、デジタルカメラのシ
ャッタを切り、画像を撮像できる。
ロフォン部であり、また、25はマイクロフォン部24
を機能させて録音を行うための録音ボタン部である。2
6は前面操作部に設けられているスピーカ部であり、録
音音声をはじめ音声出力に用いられる。前記デジタルカ
メラやマイクロフォン部24は、マルチメディア情報収
集部1のデバイスを構成している。
合、会議名や議題、開催場所、開催日時、出席者名、資
料などが記載された会議資料があればそれをデジタルカ
メラで撮像して、関係資料としてデータ化して取得し、
また、会議出席者の画像を一人一人デジタルカメラで撮
像して、その出席者各人の顔画像を収集し、その顔画像
中の認識領域を設定すべく、画像上にマークすることで
顔画像の特徴を抽出し、また、その際に、例えば、その
人個人の名刺の提供を受けて当該名刺の画像を撮像して
文字認識によりその人の名前や所属など個人情報をテキ
ストデータ化して収集し、また、自己紹介などで音声情
報を取得して音声認識するなどして、個人を特定できる
基礎的なデータを集め、集めたこれらの情報について、
個人別、会議別に情報を検索可能なように各情報につい
て関係のあるもの同士のリンクを張った構造のデータベ
ースを自動作成する。また、会議録や発言内容を取得し
て、収録したデータベースを自動作成する。
表示させた状態で認識対象領域について領域枠をマーク
し、文字情報の収集はその画像をディスプレイに表示さ
せた状態で認識対象領域について領域枠をマークすると
いったことで、領域指定して行うようにするが、マーク
する領域枠の形状を顔画像の認識と、文字認識とでは違
うものを使用する。例えば、領域枠形状が円形なら顔画
像の認識とし、方形ならば文字認識とすると云った具合
に領域枠の形状属性(マークの形状属性)対応に、何を
認識するかが一義的定まるようにする。
の内容が定まるようにすることで、操作の手間を簡略化
する。このようにして、カメラによる対象物の画像取得
と、当該画像に対して特定形状の枠線を使用しての画像
認識対象領域の指定と云った簡単な操作で、関連情報を
取得でき、また、収集した情報は、顔特徴や音声の特徴
などを含めて個人認識に利用することで、個人認識でき
るようにし、その結果を利用して個人と関連を持つもの
同士を自動的に関連付けることができるようにしてデー
タベース化する。また、音声情報は音声認識により文字
データ化してデータベースに収録し、個人認識されれ
ば、その個人の情報としてリンクが張られるようにす
る。
によりマルチメディア情報について、関連情報のデータ
ベース化を自動的に行えるようにする。
ースを作成する場合、少なくとも、図3に示したマルチ
メディア情報収集装置の前面操作部(すなわち、マルチ
メディア情報収集部1に相当)は、会議場の出席者席の
例えば、テーブル上に各人別に設置しておくと良い。勿
論、数人毎に共用として運用することも可能であるが、
処理の単純化のため、個別に設置して情報収集する構成
を採用して話を進めていくことにする。
3の構成のマルチメディア情報収集装置の処理動作の詳
細を説明する。
情報収集部1は入力待ち状態となる(図2のステップS
1)。当該入力待ち状態では、前面操作部における情報
操作部21内の情報表示部31にはデジタルカメラが撮
影している映像が表示される。マルチメディア情報収集
部1が個人別に設置してある場合、デジタルカメラが撮
影している映像はそのマルチメディア情報収集部1が設
置してある席に着席している人個人の画像である。
メディア情報収集部1における前記の前面操作部にある
シャッタボタン23を押したとする。すると、デジタル
カメラに画像撮影の指示が送られ、その人の画像が撮影
される(図2のステップS2)。
る前面操作部にある情報表示部31にはこのシャッタ操
作によりデジタルカメラにて撮影された画像が表示さ
れ、また、当該撮影された画像のデータはマルチメディ
ア対応記憶部2に一時的に記憶され(図2のステップS
6)、再び入力待ち状態(図2のステップS1)とな
る。
の入力持ち状態では、音声入力(図2のステップS
3)、図形/文字入力(図2のステップS4)、認識領
域指定(図2のステップS5)、および新規画像撮影
(図2のステップS2)が行える状態となる。
について説明する。
態からマルチメディア情報収集部1における前面操作部
にある図3の録音ボタン部25を押すことにより、マル
チメディア情報収集部1の一構成要素である音声情報取
得用のマイクロフォン部24に対して音声録音の指示が
送られ、これによってマルチメディア情報収集部1はユ
ーザが録音ボタン部25を押している間だけマイクロフ
ォンから音声信号を取り込んで音声データ化し、これを
マルチメディア対応記憶部2に一時的に記憶させること
で録音する(図2のステップS3)。
が終了すると、この音声データをマルチメディア対応記
憶部2に既に記憶されているマルチメディア情報と対応
づけて正規に記憶させ(図2のステップS6)、再び入
力待ち状態(図2のステップS1)となる。これまでの
経緯によれば、マルチメディア対応記憶部2に既に記憶
されているマルチメディア情報はデジタルカメラで撮像
した前述の画像であるから、この画像のデータとこの音
声データとが対応付けることになる。
行う場合について説明する。
態から、マルチメディア情報収集部1における前面操作
部にある図3の情報操作部21内の文字入力ボタン27
または図形入力ボタン28を選択することにより、図形
/文字入力状態となる(図2のステップS4)。
の一構成要素として用意された何らかの図形/文字入力
手段(例えば、ペン入力装置やマウス入力装置、タブレ
ット、トラックボールなど)を操作することにより、画
像中の任意の場所に入力するよう、マルチメディア情報
収集部1は制御する。従って、図形/文字入力手段とし
て例えば、ペン入力装置が用意されていたとして、ユー
ザ(マルチメディア情報収集部1が設置された席に着席
の個人)が画像入力ボタン28を操作することで図形入
力モードとし、当該ユーザがこのペン入力装置を手に持
って画面上でペンを操作することにより、画面に表示さ
れている画像中の所望の場所に、所望の図形を入力する
ことができる。
画面上でペンを操作することにより、画面上の文字入力
ボタン27を操作したとすると、文字入力モードとな
り、ユーザが画面上でペンを操作して手書き文字を入力
すると、パターン認識処理技術によりその手書き文字が
パターン認識されて該当の文字の情報を得ることができ
る。
入力操作により入力された図形情報または文字情報は、
マルチメディア対応記憶部2に既に記憶されている当該
ユーザにかかわりのある前述のマルチメディア情報と対
応付けられて記憶され(図2のステップS6)、再び入
力待ち状態となる(図2のステップS1)。
場合について説明する。
とその設定した認識領域の形状に応じてその領域内の画
像について文字認識をしたり、画像認識する機能を有し
ている。
入力持ち状態から、マルチメディア情報収集部1におけ
る前面操作部にある情報操作部21に表示されている図
3の認識領域指定ボタン(四角形領域)29か、また
は、認識領域指定ボタン(円形領域)30のいずれかを
選択して操作することにより、マルチメディア情報収集
部1は認識領域指定の状態となる(図2のステップS
5)。
れているので、この状態でポインティングデバイス(ペ
ン入力装置やマウス、トラックボールなど)等で認識領
域指定ボタン部(四角形領域)29を押し、さらに画像
上の位置を指定すると、その位置に四角形の領域枠マー
クが表れる。この四角形の領域枠マークを、大きさの調
整や位置調整が必要ならば、ポインティングデバイス等
にてドラッグして位置や範囲を調整し、所望に領域を定
めるか、ペン入力装置のペンを手に持ってユーザが画像
上の所望領域の2点をペンで指定するなどしてその2点
を対角位置とする方形を表示させるなどして領域を定め
る。
てアプリケーションに認識処理させることができるよう
になる。
より認識領域指定ボタン部(円形領域)30を押し、さ
らに画像上の位置を指定すると、その位置に円形の領域
枠マークが表示される。
調整が必要ならば、画面上に表れた円形の領域枠マーク
をポインティングデバイスにてドラッグして範囲や位置
を調整し、領域を定める。あるいは、ポインティングデ
バイスによりユーザが画像上の所望領域の中心点と半径
位置を指定するなどして中心位置と半径を定めることで
決まる2点で規定される円形を表示させるなどして領域
を定める。
の円形領域(円形の領域枠マーク)内を画像の認識領域
としてアプリケーションに認識処理させることができる
ようになる。
かにより、所望に領域枠マークを設定すると、この領域
枠マークの情報は関連するマルチメディア情報と関連付
けられてマルチメディア対応記憶部2に記憶されること
になる。
と、認識処理用のアプリケーションはプログラムを実行
し、領域枠マークで指定された領域内画像を領域枠マー
クの枠形状に対応した所要の認識処理をして所要の情報
を抽出することになる。そして、指定領域内画像を認識
処理するアプリケーションが解析制御部5の機能であ
り、この解析制御部5は、操作された認識領域指定ボタ
ンが四角形領域用の認識領域指定ボタン29であるか、
円形領域用の認識領域指定ボタン30であるかにより、
指定された領域に対して行う認識/解析方法が異なる。
よって、認識の目的に応じて各ボタンを使い分ける。
尚、認識/解析方法については後で詳しく説明する。
た認識領域の情報はマルチメディア対応記憶部2に既に
記憶されているマルチメディア情報と対応づけられて記
憶され(図2のステップS6)、再び入力待ち状態とな
る(図2のステップS1)。
たに画像が撮影され、情報表示部31には撮影された画
像が表示される。新規画像はマルチメディア対応記憶部
2によって、以前に収集したマルチメディア情報と関連
あるものは対応づけられ、記憶されてから(図2のステ
ップS6)、入力待ち状態となる(図2のステップS
1)。
チメディア情報をそれぞれ対応付けながら入力する。
ば、ユーザは入力終了の指示操作を行う。そして、ユー
ザからの入力終了の指示があると(図2のステップS
7)、情報認識/解析部3はマルチメディア対応記憶部
2に対応づけられて記憶されている情報を抽出し、認識
/解析を行う。その際、対象抽出部4は情報収集の際に
認識領域として指定されて設定された領域枠マークをも
とに認識/解析対象の抽出を行い、また、解析制御部5
はマークの属性に対応して使用する認識/解析に用いる
知識辞書や認識/解析方法の制御を行う(図2のステッ
プS8)。
表示部31に表示されている撮影済みの画像に認識領域
指定のための領域枠マークがつけられた例を表してい
る。図4と図5が画像中に四角形の領域枠マークを設定
した例であり、図6は画像中に円形の領域枠マークを設
定した例である。
領域枠マークである場合には領域内の文字認識を行うも
のとすると、図4のように例えば会議名の文字の周囲を
四角形枠41で囲むことにより、文字認識部6が画像中
の文字を抽出し認識する(ステップS9)ことになる。
ューを開いて抽出対象属性選択の機能を指定し、図7に
示すように抽出対象属性選択のための属性選択窓51を
情報表示部31上に表示し、この属性選択窓51により
属性を選択する。この属性選択窓51には“日付”、
“会議名”、“開催場所”、“名刺”、“氏名”、“会
社名”、“電話番号”、“所属部署”、“住所”、“発
言内容”、……と云った具合に、予め各種の項目がその
項目内容対応の属性情報とともに設定されており、これ
らの設定された各種の項目を表示してその中から所望の
ものを選択すると、その項目と属性情報が選択でき、こ
れによって、認識させる文字列に適切な属性を選択付与
することができることにより、解析制御部5は認識/解
析に用いる知識辞書を制御することができる。
うち、この選択された属性対応の知識辞書を用いて認識
/解析することにより、領域枠マーク内の画像中に含ま
れる文字画像部分を文字認識する結果、正しい内容の文
字データに変換できる。そして、ここで認識/解析され
たテキスト情報は、文字認識の対象となったマルチメデ
ィア情報と対応づけられてマルチメディアデータベース
部11に蓄積される(ステップS13)。
合、認識/解析されたテキスト情報は、見出しとして、
文字認識の対象となったマルチメディア情報と対応づけ
られてマルチメディアデータベース部11に蓄積され
る。
領域を指定し、文字認識を行う場合の例である。この例
は、認識させる対象が例えば名刺43などの特定個人に
関する情報の場合である。この場合も、抽出対象属性選
択のための属性選択窓51を情報表示部31上に表示
し、この属性選択窓51により項目を選択することで属
性を選択する。すなわち、この属性選択窓51にて“名
刺”なる項目を選択する。
も用意してあり、従って、属性選択窓51では“名刺”
の属性も予め設定されていて、選択可能である。そのた
め、対象が名刺の場合、属性選択窓51により“名刺”
を選択すれば良いことになる。
を撮影した画像であれば、属性選択窓で“名刺”を選択
するだけで、領域は特に指定しなくても良いようにして
おくこともできる。)、文字認識部6は、知識辞書から
得られる知識に基づいて、名刺中の会社名、氏名、住
所、電話番号等をそれぞれ抽出し認識する(ステップS
9)。
がこの部分を人名として抽出する。氏名以外にここで抽
出および認識/解析されたテキスト情報は、特定個人に
関する情報として、文字認識の対象となったマルチメデ
ィア情報と対応付けられてマルチメディアデータベース
部11に蓄積される(ステップS13)。
で囲まれた状態の場合(つまり、属性が円形の領域枠マ
ークの場合)には領域内の画像の顔認識処理を行う構成
としてあるものとすると、図6のように、オペレータが
認識対象人物の顔の部分を円形枠44で囲む操作をする
ことにより、顔認識部8が画像中の円形枠44で囲まれ
た領域から顔を抽出し、顔の特徴を認識する(ステップ
S11)。そして、この認識した顔特徴情報をマルチメ
ディアデータベース部11に記憶する(ステップS1
3)。
人名が抽出された場合、あるいは、顔認識部8が顔を認
識した場合には、認識の対象となったマルチメディア情
報と対応づけられたマルチメディア情報に対し、人名抽
出部10の抽出結果を見出しとして、顔認識部8、文字
認識部6それぞれの認識結果を対応させてマルチメディ
アデータベース部11に記憶する(図2のステップS1
3)。
マルチメディア対応記憶部2に記憶されている音声情報
について、音声認識部7は音声認識を行う。すなわち、
音声認識部7は、画像や他のメデイアに対応して収集さ
れた音声を認識する(図2のステップS10)。そし
て、この音声認識による認識結果を見出しとして当該音
声認識の対象となったマルチメディア情報と対応づけら
れた情報をマルチメディアデータベース部11に蓄積す
る(図2のステップS13)。
に対応して収集された音声より話者を認識し(図2のス
テップS12)、その結果を特定個人の情報として、話
者認識の対象となったマルチメディア情報と対応付けて
マルチメディアデータベース部11に蓄積する(図2の
ステップS13)。
ディアに対応して収集された音声より話者を認識し、そ
の結果を特定個人の備報として、話者認識の対象となっ
たマルチメディア情報と対応付けてマルチメディアデー
タベース部11に蓄積することから、例えば、ある会議
が開催されたとして、その際に話者認識部9による会議
出席者の話者認識が一通り完了すると、音声認識部7に
より当該会議出席者の発言内容を認識し、各個人の発言
内容をその個人の名前に対応づけて記憶させると云った
処理が可能となる。
づけて記憶させる先はマルチメディアデータベース部1
1であるが、この処理は情報認識/解析部3が行うこと
になる。すなわち、話者認識部9による認識結果を受け
て情報認識/解析部3は各個人の発言内容をその個人の
名前に対応づけてマルチメディアデータベース部11に
記憶させるわけである。
言内容72を各個人名71に対応づけて記憶するという
ことを自動で行って、出席者の発言内容を記録した議事
録を自動編集するといったことが可能となる。
ア情報は、マルチメディアデータベース部11に例え
ば、図8の如きの形式で蓄積される。蓄積される情報
は、例えば、情報識別番号61、属性62、属性値63
から構成されるデータである。
報内容としては“氏名”、“会社名”、“住所”、“電
話”、“FAX”などがあるが、これらの各項目は、図
5にて名刺から認識した値が属性値63として与えら
れ、また、顔の項目には、図6にて認識/解析した顔画
像のファイル名が属性値63として与えられ、名刺の項
目には、図5にて認識/解析した名刺画像のファイル名
が属性値63として与えられ、会議の項目には、その人
物が過去に出席した会議名が属性値63として与えら
れ、発言の項目には、出席した会議においてその人物が
発言した内容の音声ファイル名と、音声認識部7により
音声認識され、テキストに変換されたファイル名とが属
性値63として与えられ、また、資料の項目には、会議
で配布された資料のファイル名が属性値63として与え
られ、メモの項目にはユーザがその人物についてステッ
プS4にて画像に対応づけて記入したメモを記録したフ
ァイル名が、それぞれ属性値63として与えられること
で得られている。
/解析部3の制御機能により、対応づけられてマルチメ
ディアデータベース部11に蓄積されている。
は、例えば、会議を開催した場合、会議名や議題、開催
場所、開催日時、出席者名、資料などが記載された会議
資料があればそれをデジタルカメラで撮像して、関係資
料としてデータ化して取得し、また、会議出席者の画像
を一人一人デジタルカメラで撮像して、その出席者各人
の顔画像を収集し、その顔画像中の認識領域を設定すべ
く、画像上にマークすることで顔画像の特徴を抽出し、
また、その際に、例えば、その人個人の名刺の提供を受
けて当該名刺の画像を撮像して文字認識によりその人の
名前や所属など個人情報をテキストデータ化して収集
し、また、自己紹介などで音声情報を取得して音声認識
するなどして、個人を特定できる基礎的なデータを集
め、集めたこれらの情報について、個人別、会議別に情
報を検索可能なように各情報について関係のあるもの同
士のリンクを張った構造のデータベースを自動作成する
ようにしたものである。また、会議録や発言内容を取得
して、収録したデータベースを自動作成するようにした
ものである。
レイに表示させた状態で認識対象領域について領域枠を
マークし、文字情報の収集はその画像をディスプレイに
表示させた状態で認識対象領域について領域枠をマーク
するといったことで、領域指定して行うようにするが、
マークする領域枠の形状を顔画像の認識と、文字認識と
では違うものを使用するようにした。例えば、領域枠形
状が円形なら顔画像の認識とし、方形ならば文字認識と
すると云った具合であり、領域枠の形状属性(マークの
形状属性)対応に、何を認識するかが一義的定まるよう
にした。
認識処理の内容が定まるようにしたことで、操作の手間
を簡略化するようにした。
と、当該画像に対して特定形状の枠線を使用しての画像
認識対象領域の指定と云った簡単な操作で、関連情報を
取得でき、また、収集した情報は、顔特徴や音声の特徴
などを含めて個人認識に利用することで、個人認識でき
るようにし、その結果を利用して個人と関連を持つもの
同士を自動的に関連付けることができるようにしてデー
タベース化し、また、音声情報は音声認識により文字デ
ータ化してデータベースに収録し、個人認識されれば、
その個人の情報としてリンクが張られるようにするの
で、これらによって、簡単な操作と最小の手間によりマ
ルチメディア情報について、関連情報のデータベース化
を自動的に行えるようになる。
像をもとに、関連する様々なマルチメディア情報をそれ
ぞれ対応づけてマルチメディアデータベース部11に蓄
積することができ、これにより、マルチメディア情報を
簡単に特定の目的情報に対応させて記憶することができ
るようになる。
すマークをもとに認識/解析対象を抽出する対象抽出部
4、マークの属性に応じて、使用する認識/解析に用い
る知識辞書や認識/解析方法を制御する解析制御部5に
より、複雑な操作なしに、高度な認識/解析方法の使い
分けが可能となる。
報を関連づけする方法として、画像(静止画)を中心と
したアプローチを例にとり説明したが、この場合に限ら
ず、例えば動画像、音声、テキストデータ等でもよく、
その際の処理形態も上記実施形態と同様である。
情報の関連づけを行った例として、会議を中心に説明し
たが、必ずしもこれに限定されるわけではない。例え
ば、旅行、展示・博覧会、日常の家庭生活等、幅広い応
用が可能であり、その際の処理形態も上記実施形態と同
様である。
ルチメディア情報を収集してその情報を関連のあるもの
同士を関連付けて整理し、データベース化する技術に関
するものであった。しかしデータベースがあっても、こ
のままでは活用の途は閉ざされる。すなわち、データベ
ース化されたマルチメディア情報を後で活用できるよう
にするには、目的の情報を検索する手段が必要である。
そこで、第2の実施形態では、収集したマルチメディア
情報を検索する手法について説明する。
ディア情報収集装置の構成例を示したものである。基本
構成は図1と変わらないので、図1と同一部分には同一
符号を付し、ここでは異なる部分についてのみ説明す
る。
ィア情報収集装置は、例えば、ユーザからの検索要求を
受け取り、その意味内容の解析を行うことによって、ユ
ーザから与えられた検索文の意味合いを知る対話制御部
13と、この対話制御部13の解析結果から検索条件を
知り、マルチメディアデータベース部11から目的のマ
ルチメディア情報を検索するための検索制御部12と、
検索結果をユーザヘ提示するマルチメディア情報提示部
14とを図1の構成に追加した構成である。
然言語形態で受け取ることができ、自然言語形態の検索
文の意味内容を解析してどのような検索をするのかを検
索制御部12に指示することができる。また、マルチメ
ディア情報提示部14は、検索制御部12から受け取っ
たデータベースの検索結果やユーザの検索要求内容につ
いて、適切な形態に変換してユーザヘ提示する機能を持
たせてある。
集装置において、第1の実施形態と同様の処理動作によ
り収集/対応付けされたマルチメディア情報を、マルチ
メディアデータベース部11から検索する際の処理動作
を説明するためのフローチャートである。
マルチメディア情報収集部1が収集したマルチメディア
情報が、情報認識/解析部3によりそれぞれ対応付けら
れて、例えば、上記第1の実施形態にて述べた図8のよ
うな形式で蓄積されている。
ば、音声による自然言語入力)により検索文を入力する
と(図11のステップS21)、対話制御部13が検索
文を解析し、解析結果を検索制御部12へ送る(図11
のステップS22)。
もとに、マルチメディアデータベース部11を検索し、
目的のマルチメディア情報を搬出する(図11のステッ
プS23)。検索されたマルチメディア情報は、マルチ
メディア情報提示部14により、検索文に応じて適切な
提示形態に変換されてユーザヘ提示される(図11のス
テップS24)。
者はだれ?”という検索文が対話制御部13に入力され
たとする。すると対話制御部13ではこの自然言語形態
の検索文の内容を解析して、当該“丸閥さんが出た企画
会議の出席者はだれ?”という内容から、“丸閥さんが
出た企画会議の出席者を検索する”と云う意味であるこ
とを検索制御部12に知らせる。当該検索制御部12は
対話制御部13によるこのような解析結果を知って、そ
の条件に当てはまるデータの検索を開始する。
に、マルチメディアデータベース部11から“丸閥さん
のデータベース(図8参照)”を抽出する。図8に示す
内容を持つこの“丸閥さんのデータベース”の内容か
ら、検索制御部12は検索文中の“企画会議”は“7月
12日の新規事業企画会議”であると判断し、次に“7
月12日の新規事業企画会議”というキーワードですべ
てのデータベースを検索し、出席者のデータを抽出す
る。
マルチメディア情報提示部14に渡す。
されてきた複数のデータを、検索要求に対して適切な提
示形態に変換して表示する。図12はその一例である。
内容である。この検索文81に対する検索結果として、
会議の情報82、顔写真付きの各出席者の情報83が一
覧表示される。各出席者の顔写真または氏名を選択する
と、その出席者に関する情報を参照することができる。
91、氏名および所属92、過去の出席会議の一覧9
3、各会議における関連情報へのリンクボタン94など
が表示される。
去に収集した情報を参照することができる。例えば、発
言内容を選択すると、会議中のその人物の発言内容がそ
のまま再生されるか、またはテキストに変換されたもの
が表示され、撮影画像を選択すると、会議中にその人物
を撮影した、文字/図形メモ付きの画像が表示される。
をしたのはだれ?”という別の検索文101が入力され
た場合、対話制御部13は“意見交換会でO×Δの発言
をした人を検索する”と云う意味であることを知り、こ
れを検索制御部12に知らせる。当該検索制御部12は
対話制御部13によるこのような解析結果を知って、そ
の条件に当てはまるデータの検索を開始する。
会”、“O×Δの発言をした人”と云う条件でデータベ
ース部11のデータを検索し、これらのキーワードに関
係する項目とその内容を引き出して、マルチメディア情
報提示部14に渡す。
“意見交換会”で、発言内容が“O×Δ”である人の氏
名や所属情報などの個人情報がその人の顔写真と共に関
連付けられて保存されているので、検索制御部12は、
“意見交換会”、“O×Δの発言をした人”に該当する
人の名を抽出することができ、また、その人の顔写真を
抽出することができる。
をマルチメディア情報提示部14に与えるので、当該マ
ルチメディア情報提示部14は例えば、図14に示すよ
うに、発言者を顔写真102付きで表示することとな
る。また、その時の議題となっていた資料と、その発言
の前後の会話等へのリンク情報も検索制御部12は抽出
してマルチメディア情報提示部14に与えるので、当該
マルチメディア情報提示部14は図14のように、発言
者氏名(この例では発言者氏名として“鹿九五郎”なる
人名がその人の所属情報“株式会社……”と共に表示さ
れている)とその顔写真102の他に、その時の議題と
なっていた資料へのリンクのためのボタン103aや、
その発言の前後の会話等へのリンクのための操作ボタン
103bや、議事録へのリンクのための操作ボタン10
3cも画面表示することとなる。
タン103a〜103cを必要に応じて操作することに
より、当該リンクを利用することができ、この操作ボタ
ンの操作により、検索制御部12はリンク先の情報をマ
ルチメディアデータベース部11から読み出してマルチ
メディア情報提示部14に画面表示するように制御する
ので、これによりユーザは必要に応じて資料を参照した
り、会議を再生することが簡単にできるようになる。
によれば、マルチメディアデータベースは収集した情報
に関連性に基づくリンクが張られた構成としており、デ
ータベースの検索のための検索制御部と検索結果の表示
等を行うマルチメディア情報提示部を設けて第1の実施
形態同様の処理動作にてマルチメディア情報を収集対応
づけしたマルチメディアデータベース部は、1または複
数の条件により検索することが可能である。
語形態の検索文を解析し、その解析結果を検索制御部1
2に渡して当該解析結果の内容に基づいてデータベース
の検索を行い、マルチメディア情報提示部14が検索要
求内容や検索結果について、適切な形態に変換してユー
ザヘ提示する。
かけで、様々なメディアの情報をデータベースから検索
することができるので、従来の情報収集・検索装置以上
の非常に有用な道具となる。
任意の記憶媒体に記憶されているものをユーザが別途入
手し、本発明のマルチメディア情報収集装置に組み込
み、いは内部記憶装置に複写することにより構成されて
も良い。また、上記各実施形態に記載した手法は、コン
ピュータに実行させることのできるプログラムとして、
磁気ディスク(フロッピーディスク、ハードディスクな
ど)、光ディスク(CD−ROM、DVDなど)、半導
体メモリなどの記録媒体に格納して頒布することもでき
る。また、サーバなどにこのプログラムを格納してお
き、ネットワークを介して接続されたコンピュータに転
送することで、そのコンピュータにプログラムを頒布す
る頒布形態にも当然、適用することができる。
の例としてテキストによる自然言語文章を中心に説明し
たが、必ずしもこれに限定されるわけではない。例え
ば、顔画像や音声であっても良い。ただし、顔画像の場
合には、図10の検索制御部12に顔認識部を、音声の
場合には音声認識部を、それぞれ付け加える必要があ
る。
いて、認識領域指定の図形の描画を行う際には、例えば
ペン入力等の図形入力手段を用いることを例に説明して
きたが、指に何らかの動き検出手段を装着して指の動作
で描画する方法、音声により描画を制御する方法、あら
かじめ描画されている図形に認識領域をあわせて画像を
撮影する方法など、ペン入力による図形描画以外の方法
による認識領域指定方法であっても良い。
ば、マルチメディア情報収集の際にマークを付けること
により、認識領域を特定すると共に、そのマークの属性
に応じた認識を行う他のメディアと対応付けて記録し、
また、その認識結果を手掛かりに検索を行うことができ
るなど、ユーザに負担をかけることなく、マルチメディ
ア情報の収集および検索を行うことができるようにした
マルチメディア情報収集装置およびそのプログラムを記
録した媒体を提供できる。
第1の実施形態に係るマルチメディア情報収集装置の構
成を示すブロック図。
ルチメディア情報収集装置の処理動作を説明するための
フローチャート。
ルチメディア情報収集装置の前面操作部の構成例を示し
た図。
おける情報表示部に表示されている撮影済みの画像に指
定認識領域として枠形状が四角形のマークをつけた例を
示した図。
おける情報表示部に表示されている撮影済みの画像に指
定認識領域として四角形をつけた例を示した図。
おける情報表示部に表示されている撮影済みの画像に指
定認識領域として円をつけた例を示した図
おける指定された認識領域の属性を選択する属性選択部
の例を示した図。
おけるマルチメディアデータベース部に格納されている
情報の例を示した図。
おける話者認識部、音声認識部により、会談出席者の発
言内容を自動で記憶する例を示した図。
の第2の実施形態に係るマルチメディア情報収集管理装
置の構成を示すブロック図。
の第2の実施形態における図10のマルチメディア情報
収集管理装置の処理動作を説明するためのフローチャー
ト。
の第2の実施形態においてマルチメディア情報提示部
が、検索結果を一覧表示した例を示した図。
の第2の実施形態においてマルチメディア情報提示部
が、検索結果の詳細を表示した例を示した図。
の第2の実施形態においてマルチメディア情報提示部
が、検索結果を表示した例を示した図。
ン
Claims (10)
- 【請求項1】各種メディアの情報を収集するマルチメデ
ィア情報収集手段と、 このマルチメディア情報収集手段により収集された各種
メディアの情報を所要の関連のあるものについては対応
付けて前記マルチメディア対応記憶手段に記憶させるマ
ルチメディア対応記憶手段と、 このマルチメディア対応記憶手段に対応づけられて記憶
されている情報を抽出して認識し、解析してその抽出し
た情報に関係する個人を特定する情報認識/解析手段
と、 前記情報認識/解析手段が解析した情報を前記マルチメ
ディア対応記憶手段に記憶された情報と対応させて蓄積
するマルチメディアデータベースと、を具備したことを
特徴とするマルチメディア情報収集管理装置。 - 【請求項2】前記マルチメディア情報収集手段には、撮
像手段を設けると共に、この撮像手段にて撮像した被写
体の画像をマルチメディア情報として収集し、この収集
した画像のマルチメディア情報を表示手段に画像表示さ
せる機能手段と、この表示させた画像の所望領域に人為
的指示に基づいて認識領域を示すマークを付与する機能
手段と、この付与したマークを当該マルチメディア情報
中に記録させるべく制御する機能手段とを設け、 また、前記情報認識/解析手段には、前記マルチメディ
ア情報収集手段が情報収集時にマルチメディア情報中に
記録したマークをもとに、認識/解析対象を抽出する対
象抽出手段を具備したことを特徴とする請求項1に記載
のマルチメディア情報収集管理装置。 - 【請求項3】前記マルチメディア情報収集手段により付
与する前記マークは形状に応じて属性を持たせると共
に、 前記対象抽出手段は抽出したマークの属性に対応して、
認識/解析対象の認識解析に使用する知識辞書や認識/
解析法を変更制御する解析制御手段を具備したことを特
徴とする請求項2に記載のマルチメディア情報収集管理
装置。 - 【請求項4】前記解析制御手段には画像中の文字を認識
するための文字認識手段を具備させ、前記文字認識手段
が抽出した結果を見出しとして、文字認識の対象となっ
たマルチメディア情報と対応づけられた情報を前記マル
チメディアデータベースに蓄積することを特徴とする請
求項3に記載のマルチメディア情報収集管理装置。 - 【請求項5】前記解析制御手段には、画像や他のメデイ
アに対応して収集された音声を認識する音声認識手段を
具備させ、当該音声認識手段が抽出した結果を見出しと
して、音声認識の対象となったマルチメディア情報と対
応づけられた情報を前記マルチメディアデータベースに
蓄積する構成とすることを特徴とする請求項3に記載の
マルチメディア情報収集管理装置。 - 【請求項6】前記解析制御手段には、画像中の顔を認識
するための顔認織手段を具備させ、当該顔認識手段が認
識した結果に基づき、前記マルチメディアデータベース
への蓄積を制御する構成とすることを特徴とする請求項
3に記載のマルチメディア情報収集管理装置。 - 【請求項7】前記解析制御手段には、画像中の文字を認
識するための文字認識手段と、前記文字認識手段が認識
した結果より、人名を抽出する人名抽出手段とを具備さ
せ、前記文字認識手段による認識の対象となったマルチ
メディア情報と対応づけられたマルチメディア情報に対
し、前記顔認識手段が顔を認識した時、前記人名抽出手
段の抽出結果を見出しとして、顔認識手段、文字認識手
段それぞれの認識結果を対応させて前記マルチメディア
データベースに記憶する構成とすることを特徴とする請
求項6に記載のマルチメディア情報収集管理装置。 - 【請求項8】前記情報認識/解析手段には、画像や他の
メディアに対応して収集された音声より話者を認識する
話者認識手段を具備させ、当該話者認識手段が抽出した
詰果を見出しとして、話者認識の対象となったマルチメ
ディア情報と対応づけられた情報を前記マルチメディア
データベースに蓄積する構成とすることを特徴とする請
求項3に記載のマルチメディア情報収集管理装置。 - 【請求項9】各種メディアの情報を収集するステップ
と、 この収集した各種メディアの情報を、所要の関連のある
ものについては対応付けてマルチメディア対応記憶手段
に記憶させるステップと、 前記マルチメディア対応記憶手段に対応づけられて記憶
されている情報を抽出して認識し、解析してその抽出し
た情報に関係する個人を特定する情報認識/解析ステッ
プと、 前記情報認識/解析ステップにて解析した情報を前記マ
ルチメディア対応記憶手段に記憶された情報および対応
付け情報と共にマルチメディアデータベースに蓄積する
ステップと、を具備したことを特徴とするコンピュータ
で読み取り及び実行可能なプログラムを格納した媒体。 - 【請求項10】前記各種メディアの情報を収集するステ
ップにおいて、被写体の画像をマルチメディア情報のひ
とつとして収集させ、この収集させた画像のマルチメデ
ィア情報を表示手段に画像表示させると共に、この表示
させた画像の所望領域に人為的指示に基づいて認識領域
を示すマークを付与させることにより、得たこの付与マ
ークを当該マルチメディア情報中に記録させ、 また、前記情報認識/解析手ステップにおいては、前記
マルチメディア情報中に記録したマークをもとに、認識
/解析対象を抽出させる機能を、更に備えることを特徴
とする請求項9に記載のコンピュータで読み取り及び実
行可能なプログラムを格納した媒体。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26835799A JP3895892B2 (ja) | 1999-09-22 | 1999-09-22 | マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体 |
US09/667,784 US6629107B1 (en) | 1999-09-22 | 2000-09-22 | Multimedia information collection control apparatus and method |
US10/634,768 US7099894B2 (en) | 1999-09-22 | 2003-08-06 | Multimedia information collection control apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26835799A JP3895892B2 (ja) | 1999-09-22 | 1999-09-22 | マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001092838A true JP2001092838A (ja) | 2001-04-06 |
JP3895892B2 JP3895892B2 (ja) | 2007-03-22 |
Family
ID=17457408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26835799A Expired - Fee Related JP3895892B2 (ja) | 1999-09-22 | 1999-09-22 | マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体 |
Country Status (2)
Country | Link |
---|---|
US (2) | US6629107B1 (ja) |
JP (1) | JP3895892B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005505080A (ja) * | 2001-10-12 | 2005-02-17 | コミサリア・ア・レネルジー・アトミーク | マルチメディアデータベースを管理するための方法およびシステム |
JP2007034710A (ja) * | 2005-07-27 | 2007-02-08 | Sony Corp | 画像処理装置 |
JPWO2005031612A1 (ja) * | 2003-09-26 | 2007-11-15 | 株式会社ニコン | 電子画像蓄積方法、電子画像蓄積装置、及び電子画像蓄積システム |
WO2008078624A1 (ja) * | 2006-12-22 | 2008-07-03 | Panasonic Corporation | 映像出力装置 |
JP2012160023A (ja) * | 2011-01-31 | 2012-08-23 | Toshiba Corp | 文字抽出装置、表示方法及び文字抽出方法 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3895892B2 (ja) * | 1999-09-22 | 2007-03-22 | 株式会社東芝 | マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体 |
JP3835679B2 (ja) * | 2001-10-26 | 2006-10-18 | ソニー株式会社 | 情報処理システムおよび情報処理方法、情報処理装置および情報処理方法、記録媒体、並びにプログラム |
US6925197B2 (en) * | 2001-12-27 | 2005-08-02 | Koninklijke Philips Electronics N.V. | Method and system for name-face/voice-role association |
AU2003210027A1 (en) * | 2002-03-06 | 2003-09-16 | Chung-Tae Kim | Methods for constructing multimedia database and providing multimedia-search service and apparatus therefor |
JP2003283925A (ja) * | 2002-03-20 | 2003-10-03 | Sony Corp | 画像合成装置及び方法 |
JP4086580B2 (ja) * | 2002-07-30 | 2008-05-14 | キヤノン株式会社 | 画像処理装置、プログラム及び方法 |
JP3990253B2 (ja) * | 2002-10-17 | 2007-10-10 | 埼玉日本電気株式会社 | 携帯電話装置 |
US7761505B2 (en) * | 2002-11-18 | 2010-07-20 | Openpeak Inc. | System, method and computer program product for concurrent performance of video teleconference and delivery of multimedia presentation and archiving of same |
JP2005122128A (ja) * | 2003-09-25 | 2005-05-12 | Fuji Photo Film Co Ltd | 音声認識システム及びプログラム |
US20050240909A1 (en) * | 2004-04-26 | 2005-10-27 | Reckoningboard Communications, Inc. | System and method for compiling multi-media applications |
JP2006065477A (ja) * | 2004-08-25 | 2006-03-09 | Fuji Xerox Co Ltd | 文字認識装置 |
JP4081056B2 (ja) * | 2004-08-30 | 2008-04-23 | 株式会社東芝 | 情報処理装置、情報処理方法及びプログラム |
KR100664931B1 (ko) * | 2004-11-20 | 2007-01-04 | 삼성전자주식회사 | 홈 네트워크에서 컨텐츠 리스트를 제공하는 장치, 시스템,및 그 방법 |
US20070050396A1 (en) * | 2005-05-05 | 2007-03-01 | Perception Digital Limited | Fast algorithm for building multimedia library database |
TWI301590B (en) * | 2005-12-30 | 2008-10-01 | Ibm | Handwriting input method, apparatus, system and computer recording medium with a program recorded thereon of capturing video data of real-time handwriting strokes for recognition |
KR101406799B1 (ko) | 2007-10-02 | 2014-06-12 | 삼성전자주식회사 | 얼굴 인식 마크를 디스플레이하는 디지털 영상 처리장치 및그 제어방법 |
KR102016545B1 (ko) * | 2013-10-25 | 2019-10-21 | 한화테크윈 주식회사 | 검색 시스템 및 그의 동작 방법 |
KR102279674B1 (ko) * | 2014-09-02 | 2021-07-20 | 삼성전자주식회사 | 전자 장치의 멀티미디어 데이터 처리 방법 및 그 전자 장치 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6337487A (ja) * | 1986-08-01 | 1988-02-18 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JPH05151388A (ja) * | 1991-11-28 | 1993-06-18 | Ricoh Co Ltd | 処理領域及び処理条件の指定方式 |
JPH06121310A (ja) * | 1992-10-05 | 1994-04-28 | Ricoh Co Ltd | テレビ会議装置 |
JPH07182365A (ja) * | 1993-12-24 | 1995-07-21 | Hitachi Ltd | マルチメディア会議録作成支援装置および方法 |
JPH07226931A (ja) * | 1994-02-15 | 1995-08-22 | Toshiba Corp | マルチメディア会議装置 |
JPH0855133A (ja) * | 1994-08-16 | 1996-02-27 | Nippon Telegr & Teleph Corp <Ntt> | 顔画像による登録データ検索装置 |
JPH09271006A (ja) * | 1996-04-01 | 1997-10-14 | Ricoh Co Ltd | 多地点テレビ会議装置 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9100732D0 (en) | 1991-01-14 | 1991-02-27 | Xerox Corp | A data access system |
US5802314A (en) * | 1991-12-17 | 1998-09-01 | Canon Kabushiki Kaisha | Method and apparatus for sending and receiving multimedia messages |
US6076068A (en) * | 1992-09-17 | 2000-06-13 | Ad Response Micromarketing Corporation | Coupon delivery system |
US5761340A (en) * | 1993-04-28 | 1998-06-02 | Casio Computer Co., Ltd. | Data editing method and system for a pen type input device |
JP3175399B2 (ja) * | 1993-05-18 | 2001-06-11 | セイコーエプソン株式会社 | カードデータ管理装置 |
NL9301004A (nl) * | 1993-06-11 | 1995-01-02 | Oce Nederland Bv | Inrichting voor het bewerken en reproduceren van digitale beeldinformatie. |
US5613032A (en) * | 1994-09-02 | 1997-03-18 | Bell Communications Research, Inc. | System and method for recording, playing back and searching multimedia events wherein video, audio and text can be searched and retrieved |
WO1996018258A2 (en) * | 1994-12-02 | 1996-06-13 | Voice Control Systems, Inc. | Intelligent call processing platform for home telephone system |
US5717869A (en) * | 1995-11-03 | 1998-02-10 | Xerox Corporation | Computer controlled display system using a timeline to control playback of temporal data representing collaborative activities |
JPH09330336A (ja) * | 1996-06-11 | 1997-12-22 | Sony Corp | 情報処理装置 |
US6054990A (en) * | 1996-07-05 | 2000-04-25 | Tran; Bao Q. | Computer system with handwriting annotation |
US5832499A (en) * | 1996-07-10 | 1998-11-03 | Survivors Of The Shoah Visual History Foundation | Digital library system |
US5862223A (en) * | 1996-07-24 | 1999-01-19 | Walker Asset Management Limited Partnership | Method and apparatus for a cryptographically-assisted commercial network system designed to facilitate and support expert-based commerce |
JP3758754B2 (ja) | 1996-08-02 | 2006-03-22 | 富士ゼロックス株式会社 | 情報蓄積再生装置および情報蓄積再生方法 |
US6202060B1 (en) * | 1996-10-29 | 2001-03-13 | Bao Q. Tran | Data management system |
JP3702978B2 (ja) * | 1996-12-26 | 2005-10-05 | ソニー株式会社 | 認識装置および認識方法、並びに学習装置および学習方法 |
JP3402100B2 (ja) * | 1996-12-27 | 2003-04-28 | カシオ計算機株式会社 | 音声制御ホスト装置 |
US6148304A (en) * | 1997-03-19 | 2000-11-14 | Microsoft Corporation | Navigating multimedia content using a graphical user interface with multiple display regions |
US5897616A (en) * | 1997-06-11 | 1999-04-27 | International Business Machines Corporation | Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases |
US6363380B1 (en) * | 1998-01-13 | 2002-03-26 | U.S. Philips Corporation | Multimedia computer system with story segmentation capability and operating program therefor including finite automation video parser |
US6199044B1 (en) * | 1998-05-27 | 2001-03-06 | Intermec Ip Corp. | Universal data input and processing device, such as universal point-of-sale device for inputting and processing bar code symbols, document images, and other data |
US6470096B2 (en) * | 1998-11-13 | 2002-10-22 | Xerox Corporation | Method for locating user interface tags in a document processing system |
US6396963B2 (en) * | 1998-12-29 | 2002-05-28 | Eastman Kodak Company | Photocollage generation and modification |
US6425525B1 (en) * | 1999-03-19 | 2002-07-30 | Accenture Llp | System and method for inputting, retrieving, organizing and analyzing data |
JP3895892B2 (ja) * | 1999-09-22 | 2007-03-22 | 株式会社東芝 | マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体 |
-
1999
- 1999-09-22 JP JP26835799A patent/JP3895892B2/ja not_active Expired - Fee Related
-
2000
- 2000-09-22 US US09/667,784 patent/US6629107B1/en not_active Expired - Lifetime
-
2003
- 2003-08-06 US US10/634,768 patent/US7099894B2/en not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6337487A (ja) * | 1986-08-01 | 1988-02-18 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JPH05151388A (ja) * | 1991-11-28 | 1993-06-18 | Ricoh Co Ltd | 処理領域及び処理条件の指定方式 |
JPH06121310A (ja) * | 1992-10-05 | 1994-04-28 | Ricoh Co Ltd | テレビ会議装置 |
JPH07182365A (ja) * | 1993-12-24 | 1995-07-21 | Hitachi Ltd | マルチメディア会議録作成支援装置および方法 |
JPH07226931A (ja) * | 1994-02-15 | 1995-08-22 | Toshiba Corp | マルチメディア会議装置 |
JPH0855133A (ja) * | 1994-08-16 | 1996-02-27 | Nippon Telegr & Teleph Corp <Ntt> | 顔画像による登録データ検索装置 |
JPH09271006A (ja) * | 1996-04-01 | 1997-10-14 | Ricoh Co Ltd | 多地点テレビ会議装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005505080A (ja) * | 2001-10-12 | 2005-02-17 | コミサリア・ア・レネルジー・アトミーク | マルチメディアデータベースを管理するための方法およびシステム |
JPWO2005031612A1 (ja) * | 2003-09-26 | 2007-11-15 | 株式会社ニコン | 電子画像蓄積方法、電子画像蓄積装置、及び電子画像蓄積システム |
JP4569471B2 (ja) * | 2003-09-26 | 2010-10-27 | 株式会社ニコン | 電子画像蓄積方法、電子画像蓄積装置、及び電子画像蓄積システム |
JP2007034710A (ja) * | 2005-07-27 | 2007-02-08 | Sony Corp | 画像処理装置 |
WO2008078624A1 (ja) * | 2006-12-22 | 2008-07-03 | Panasonic Corporation | 映像出力装置 |
JP2012160023A (ja) * | 2011-01-31 | 2012-08-23 | Toshiba Corp | 文字抽出装置、表示方法及び文字抽出方法 |
Also Published As
Publication number | Publication date |
---|---|
US7099894B2 (en) | 2006-08-29 |
JP3895892B2 (ja) | 2007-03-22 |
US20050080789A1 (en) | 2005-04-14 |
US6629107B1 (en) | 2003-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3895892B2 (ja) | マルチメディア情報収集管理装置およびプログラムを格納した記憶媒体 | |
JP4466564B2 (ja) | 文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム | |
JP3185505B2 (ja) | 会議録作成支援装置 | |
US8027998B2 (en) | Minutes production device, conference information management system and method, computer readable medium, and computer data signal | |
US20150269236A1 (en) | Systems and methods for adding descriptive metadata to digital content | |
Nagao et al. | Discussion mining: Annotation-based knowledge discovery from real world activities | |
US20050114357A1 (en) | Collaborative media indexing system and method | |
KR20070118038A (ko) | 정보처리 장치 및 정보처리 방법과 컴퓨터·프로그램 | |
JP2007052565A (ja) | 情報処理システム及び情報処理方法 | |
US20060036441A1 (en) | Data-managing apparatus and method | |
JP2005341015A (ja) | 議事録作成支援機能を有するテレビ会議システム | |
JP4674508B2 (ja) | 情報処理システムおよび情報処理プログラム | |
US20130094697A1 (en) | Capturing, annotating, and sharing multimedia tips | |
JP2008048204A (ja) | 情報処理装置、情報処理システム及び情報処理プログラム | |
JP5320913B2 (ja) | 撮像装置およびキーワード作成プログラム | |
JP2002288178A (ja) | マルチメディア情報収集管理装置およびプログラム | |
JP2007207031A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
JP3234083B2 (ja) | 検索装置 | |
CN111522992A (zh) | 题目入库方法、装置、设备及存储介质 | |
JP2012053855A (ja) | コンテンツ閲覧装置、コンテンツ表示方法及びコンテンツ表示プログラム | |
JP4233362B2 (ja) | 情報配信装置、情報配信方法、および情報配信プログラム | |
JP2004023661A (ja) | 記録情報処理方法、記録媒体及び記録情報処理装置 | |
JP2006350550A (ja) | アルバムコンテンツ自動作成方法及びシステム | |
JP2005065191A (ja) | 動画メタデータ自動作成装置及び動画メタデータ自動作成プログラム | |
KR101843135B1 (ko) | 영상 처리 방법, 장치 및 컴퓨터 프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060516 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060718 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060822 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060922 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061215 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091222 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101222 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111222 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121222 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121222 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131222 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |