JP2002190009A - 電子アルバム装置および電子アルバムプログラムを記録したコンピュータ読取可能な記録媒体 - Google Patents

電子アルバム装置および電子アルバムプログラムを記録したコンピュータ読取可能な記録媒体

Info

Publication number
JP2002190009A
JP2002190009A JP2000389820A JP2000389820A JP2002190009A JP 2002190009 A JP2002190009 A JP 2002190009A JP 2000389820 A JP2000389820 A JP 2000389820A JP 2000389820 A JP2000389820 A JP 2000389820A JP 2002190009 A JP2002190009 A JP 2002190009A
Authority
JP
Japan
Prior art keywords
image
person
specifying
electronic album
specified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000389820A
Other languages
English (en)
Inventor
Yusuke Nakano
雄介 中野
Kyoko Nakamura
恭子 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minolta Co Ltd
Original Assignee
Minolta Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minolta Co Ltd filed Critical Minolta Co Ltd
Priority to JP2000389820A priority Critical patent/JP2002190009A/ja
Publication of JP2002190009A publication Critical patent/JP2002190009A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 画像の表示に加えて音声で情報を出力するこ
と。 【解決手段】 電子アルバム装置は、画像を表示する画
像表示部と、表示された画像内で任意の人物を指定する
指定手段(S21)と、指定された人物を特定する特定
手段(S25)と、特定された人物の声紋データを読出
す読出手段(S28)と、読出された人物の声紋データ
に基づいて、コメントを読み上げる出力手段(S32)
とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、電子アルバム装
置および電子アルバムプログラムを記録したコンピュー
タ読取可能な記録媒体に関し、特に、画像の表示に加え
て音声情報を出力することが可能な電子アルバム装置お
よび電子アルバムプログラムを記録したコンピュータ読
取可能な記録媒体に関する。
【0002】
【従来の技術】近年、デジタルカメラ等の普及により、
デジタルカメラで撮影された画像をデジタルデータとし
てパーソナルコンピュータ等に取込み、画像を閲覧した
り、検索したりする電子アルバムが知られている。パー
ソナルコンピュータで実行される電子アルバムに関する
技術として、特開平10−124655号公報がある。
これは、複数の画像の検索効率を向上させるための技術
である。
【0003】このように、パーソナルコンピュータで実
行される電子アルバムは、複数の画像の中から、所望す
る画像を検索し、閲覧するのに便利である。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
電子アルバム装置においては、複数の画像の中から所望
する画像を検索して閲覧することはできるが、視覚情報
として画像を表示するにとどまるものであった。
【0005】この発明は、上述の問題点を解決するため
になされたもので、この発明の目的の1つは、画像の表
示に加えて音声で情報を出力することが可能な電子アル
バム装置および電子アルバムプログラムを記録したコン
ピュータ読取可能な記録媒体を提供することである。
【0006】この発明の他の目的は、画像の表示に加え
て人物の区分に適した音声で情報を出力することが可能
な電子アルバム装置および電子アルバムプログラムを記
録したコンピュータ読取可能な記録媒体を提供すること
である。
【0007】この発明のさらに他の目的は、画像の表示
に加えて画像に含まれる人物の音声で情報を出力するこ
とが可能な電子アルバム装置および電子アルバムプログ
ラムを記録したコンピュータ読取可能な記録媒体を提供
することである。
【0008】この発明のさらに他の目的は、画像の表示
に加えて画像内に含まれる人物が録音した音声を出力す
ることが可能な電子アルバム装置および電子アルバムプ
ログラムを記録したコンピュータ読取可能な記録媒体を
提供することである。
【0009】
【課題を解決するための手段】上述の目的を達成するた
めにこの発明のある局面によれば、電子アルバム装置
は、画像を表示する表示手段と、表示された画像内で任
意の人物を指定する指定手段と、指定された人物を特定
する特定手段と、特定された人物の音声情報を読出す読
出手段と、読出された人物の音声情報に基づいて、所定
の情報を出力する出力手段とを備える。
【0010】この発明に従えば、表示された画像内の任
意の人物の音声情報に基づいて、所定の情報が出力され
るので、画像の表示に加えて音声で情報を出力すること
が可能な電子アルバム装置を提供することができる。
【0011】好ましくは、電子アルバム装置の特定手段
は、多数の顔画像の圧縮データを記憶した記憶手段を含
み、指定手段により人物が指定されると、指定された人
物を特定するために、指定された人物の顔画像を記憶手
段に記憶された顔画像と統計的手法を適用して比較す
る。
【0012】この発明に従えば、人物が指定されると、
人物を特定するために、指定された人物の顔画像を記憶
手段に記憶された顔画像と統計的手法を適用して比較す
る。このため、人物を正確に特定することができる。
【0013】好ましくは、電子アルバム装置の読出手段
が読出す音声データは、予め人物ごとに記憶された声紋
データである。
【0014】この発明に従えば、予め人物ごとに記憶さ
れた声紋データが読出される。このため、画像内で指定
された人物の声紋データに基づいて、所定の情報が出力
されるので、指定された人物の声で所定の情報を出力す
ることができる。
【0015】好ましくは、電子アルバム装置の出力手段
が出力する所定の情報は、画像に付随した情報である。
【0016】この発明に従えば、予めユーザが登録した
情報が出力手段より出力されるので、ユーザが所望する
情報を出力することができる。
【0017】好ましくは、電子アルバム装置の出力手段
が出力する所定の情報は、画像に付随した情報である。
【0018】この発明に従えば、画像に付随した情報が
出力されるので、その画像に付随した情報を検索する必
要がない。
【0019】この発明の他の局面によれば、電子アルバ
ム装置は、画像を表示する表示手段と、表示された画像
内で任意の人物を指定する指定手段と、指定された人物
の区分を特定する特定手段と、特定された区分に適した
音声情報を読出す読出手段と、読出された音声情報に基
づいて、所定の情報を出力する出力手段とを備える。
【0020】この発明に従えば、画像内で指定された人
物の区分に適した音声情報に基づいて所定の情報が出力
されるので、画像の表示に加えて人物の区分に適した音
声情報を出力することが可能な電子アルバム装置を提供
することができる。
【0021】好ましくは、電子アルバム装置の特定手段
は、少なくとも性別を特定する。この発明に従えば、画
像内で指定された人物の性別に適した音声情報に基づい
て、所定の情報が出力される。このため、指定された人
物が男性であれば男性の声で、女性であれば女性の声で
所定の情報が出力される。その結果、ユーザが所望する
性別の声で情報を出力することができる。
【0022】好ましくは、電子アルバム装置の特定手段
は、多数の顔画像の圧縮データを記憶した記憶手段を含
み、指定手段により人物が指定されると、指定された人
物を特定するために、指定された人物の顔画像を記憶手
段に記憶された顔画像と統計的手法を適用して比較す
る。
【0023】この発明に従えば、人物が指定されると、
人物を特定するために、指定された人物の顔画像を記憶
手段に記憶された顔画像と統計的手法を適用して比較す
る。このため、指定された人物を正確に特定することが
できる。
【0024】この発明のさらに他の局面によれば、電子
アルバム装置は、画像を指定する指定手段と、指定され
た画像内から特定の人物を抽出する抽出手段と、抽出さ
れた人物を特定する特定手段と、特定された人物の音声
情報を読出す読出手段と、読出された音声情報に基づい
て、所定の情報を出力する出力手段とを備える。
【0025】この発明に従えば、指定された画像から抽
出された特定の人物の音声データに基づいて、所定の情
報が出力されるので、画像の表示に加えて画像に含まれ
る人物の音声で情報を出力することが可能な電子アルバ
ム装置を提供することができる。
【0026】好ましくは、電子アルバム装置の抽出手段
は、指定された画像内で一番面積の大きい顔を有する人
物を抽出する。
【0027】この発明に従えば、指定された画像内で一
番面積の大きい顔を有する人物が抽出されるので、画像
内から特定の人物を容易に抽出することができる。
【0028】この発明のさらに他の局面によれば、電子
アルバム装置は、画像を指定する指定手段と、指定され
た画像内から特定の人物を抽出する抽出手段と、抽出さ
れた人物の区分を特定する特定手段と、特定された区分
に適した音声情報を読出す読出手段と、読出された音声
情報に基づいて、所定の情報を出力する出力手段とを備
える。
【0029】この発明に従えば、画像内で指定された人
物の区分に適した音声情報に基づいて、所定の情報が出
力されるので、画像に加えて人物の区分に適した音声で
情報を出力することが可能な電子アルバム装置を提供す
ることができる。
【0030】この発明のさらに他の局面によれば、電子
アルバム装置は、画像を表示する表示手段と、表示され
た画像内で任意の人物を指定する指定手段と、指定され
た人物を特定する特定手段と、特定された人物が録音し
た音声を再生する再生手段とを備える。
【0031】この発明に従えば、表示された画像内で任
意の人物が指定され、指定された人物が特定され、特定
された人物が録音した音声が再生される。このため、画
像の表示に加えて画像内に含まれる人物が録音した音声
を出力することが可能な電子アルバム装置を提供するこ
とができる。
【0032】この発明のさらに他の局面によれば、電子
アルバム装置は、画像を指定する指定手段と、指定され
た画像内から特定の人物を抽出する抽出手段と、抽出さ
れた人物を特定する特定手段と、特定された人物が録音
した音声を再生する再生手段とを備える。
【0033】この発明に従えば、指定された画像内から
特定の人物が抽出され、抽出された人物が特定され、特
定された人物が録音した音声が再生される。このため、
画像の表示に加えて、画像内に含まれる人物が録音した
音声を出力することが可能な電子アルバム装置を提供す
ることができる。
【0034】この発明のさらに他の局面によれば、電子
アルバムプログラムを記録したコンピュータ読取可能な
記録媒体は、画像を表示するステップと、表示された画
像内で任意の人物の指定を受付けるステップと、指定さ
れた人物を特定するステップと、特定された人物の音声
情報を読出すステップと、読出された人物の音声情報に
基づいて、所定の情報を出力するステップとをコンピュ
ータに実行させるための電子アルバムプログラムを記録
する。
【0035】この発明に従えば、表示された画像内の任
意の人物の音声データに基づいて、所定の情報が出力さ
れるので、画像の表示に加えて音声で情報を出力させる
ことが可能な電子アルバムプログラムを記録したコンピ
ュータ読取可能な記録媒体を提供することができる。
【0036】この発明のさらに他の局面によれば、電子
アルバムプログラムを記録したコンピュータ読取可能な
記録媒体は、画像を表示するステップと、表示された画
像内で任意の人物の指定を受付けるステップと、指定さ
れた人物の区分を特定する特定手段と、特定された区分
に適した音声情報を読出すステップと、読出された音声
情報に基づいて、所定の情報を出力するステップとをコ
ンピュータに実行させるための電子アルバムプログラム
を記録する。
【0037】この発明に従えば、画像内で指定された人
物の区分に適した音声情報に基づいて、所定の情報が出
力されるので、画像の表示に加えて人物の区分に適した
音声で情報を出力させることが可能な電子アルバムプロ
グラムを記録したコンピュータ読取可能な記録媒体を提
供することができる。
【0038】この発明のさらに他の局面によれば、電子
アルバムプログラムを記録したコンピュータ読取可能な
記録媒体は、画像の指定を受付けるステップと、指定さ
れた画像内から特定の人物を抽出するステップと、抽出
された人物を特定するステップと、特定された人物の音
声情報を読出すステップと、読出された音声情報に基づ
いて、所定の情報を出力するステップとをコンピュータ
に実行させるための電子アルバムプログラムを記録す
る。
【0039】この発明に従えば、指定された画像から抽
出された特定の人物の音声情報に基づいて、所定の情報
が出力されるので、画像の表示に加えて画像に含まれる
人物の音声で情報を出力させることが可能な電子アルバ
ムプログラムを記録したコンピュータ読取可能な記録媒
体を提供することができる。
【0040】この発明のさらに他の局面によれば、電子
アルバムプログラムを記録したコンピュータ読取可能な
記録媒体は、画像の指定を受付けるステップと、指定さ
れた画像内から特定の人物を抽出するステップと、抽出
された人物の区分を特定するステップと、特定された区
分に適した音声情報を読出すステップと、読出された音
声情報に基づいて、所定の情報を出力するステップとを
コンピュータに実行させるための電子アルバムプログラ
ムを記録する。
【0041】この発明に従えば、画像内で指定された人
物の区分に適した音声情報に基づいて、所定の情報が出
力されるので、画像の表示に加えて人物の区分に適した
音声で情報を出力させることが可能な電子アルバムプロ
グラムを記録したコンピュータ読取可能な記録媒体を提
供することができる。
【0042】この発明のさらに他の局面によれば、電子
アルバムプログラムを記録したコンピュータ読取可能な
記録媒体は、画像を表示するステップと、表示された画
像内で任意の人物を指定するステップと、指定された人
物を特定するステップと、特定された人物が録音した音
声を再生するステップとをコンピュータに実行させるた
めの電子アルバムプログラムを記録する。
【0043】この発明に従えば、表示された画像内で任
意の人物が指定され、指定された人物が特定され、特定
された人物が録音した音声が再生される。このため、画
像の表示に加えて、画像内に含まれる人物が録音した音
声を出力させることが可能な電子アルバムプログラムを
記録したコンピュータ読取可能な記録媒体を提供するこ
とができる。
【0044】この発明のさらに他の局面によれば、電子
アルバムプログラムを記録したコンピュータ読取可能な
記録媒体は、画像の指定を受付けるステップと、指定さ
れた画像内から特定の人物を抽出するステップと、抽出
された人物を特定するステップと、特定された人物が録
音した音声を再生するステップとをコンピュータに実行
させるための電子アルバムプログラムを記録する。
【0045】この発明に従えば、指定された画像内から
特定の人物が抽出され、抽出された人物が特定され、特
定された人物が録音した音声が再生される。このため、
画像の表示に加えて、画像内に含まれる人物が録音した
音声を出力させることが可能な電子アルバムプログラム
を記録したコンピュータ読取可能な記録媒体を提供する
ことができる。
【0046】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。なお、図中同一符号は同一または
相当する部材を示し、説明は繰返さない。
【0047】本発明における電子アルバム装置は、パー
ソナルコンピュータ等で構成される。図1は、本発明の
実施の形態の1つにおける電子アルバム装置のハード構
成の概略を示す図である。図1を参照して、電子アルバ
ム装置100は、電子アルバム装置100の全体の制御
をするための制御部101と、電子アルバム装置100
へのデータの入力を制御するためのデータ入力制御部1
03と、データの出力を制御するためのデータ出力制御
部105と、所定の情報を記憶するための記憶部107
と、外部の記録媒体125から所定の情報を入力した
り、所定の情報を出力したりする外部入出力部109と
を含む。
【0048】データ入力制御部103は、音声情報を入
力するためのマイク111と、画像データを入力するた
めのカメラ112およびスキャナ113と、所定の指示
を入力するためのキーボード114と、ポインティング
デバイスであるマウス115とが接続されている。デー
タ入力制御部103は、マイク111、カメラ112、
スキャナ113、キーボード114およびマウス115
から入力された音声情報、画像情報、指示情報を受信
し、制御部101へ送信する。カメラ112は、デジタ
ルカメラまたはデジタルビデオカメラであり、撮影した
画像をデジタルデータとして出力する。スキャナ113
は、写真等を読取った画像をデジタルデータとして出力
する。
【0049】データ出力制御部105は、音声情報を出
力するためのスピーカ121と、画像や文字情報を出力
するためのディスプレイ122とが接続されている。デ
ィスプレイ122は、CRTや液晶表示装置で構成され
る。また、ディスプレイ122の代わりに、プリンタを
用いるようにしてもよい。
【0050】記憶部107は、磁気ディスク装置や、光
磁気ディスク装置等の記憶装置であり、制御部101の
制御下で所定の情報を記録することができる。
【0051】外部入出力部109は、記録媒体125に
記録された制御部101で実行するためのプログラムま
たは2次元の静止画像データを読込むための光磁気ディ
スクドライブ、または、デジタルビデオディスクドライ
ブなどである。制御部101では、外部入出力部109
で記録媒体125から読取った電子アルバムプログラム
を実行することにより、以下に示す登録処理および閲覧
処理を実行することができる。
【0052】また、制御部101は、記録媒体125に
記録された画像データを、外部入出力部109で読取る
ことにより、記憶部107へ読取った画像データを記録
することもできる。
【0053】なお、記録媒体125としては、磁気テー
プやカセットテープなどのテープ系、磁気ディスク(フ
レキシブルディスク、ハードディスク)や光ディスク
(CD−ROM/MO/MD/DVD等)などのディス
ク系、ICカード(メモリカードを含む)や光カードな
どのカード系、あるいはマスクROM、EPROM、E
EPROM、フラッシュメモリなどの半導体メモリ等の
固定的にプログラムを担持する媒体を用いることもでき
る。また、ネットワークからプログラムがダウンロード
されるように、流動的にプログラムを担持する媒体であ
ってもよい。外部入出力部109は、このような記録媒
体125から情報を読込または書込できるように記録媒
体125に対応する。
【0054】図2は、本実施の形態における電子アルバ
ム装置100の記憶部107に記憶されるデータベース
を示す図である。図2を参照して、記憶部107には、
静止画像を記憶するための画像データベース131と、
人物の顔の画像を記憶するための顔画像データベース1
37と、複数の顔画像に統計的処理を施して作成される
顔モデルを記憶するための顔モデルデータベース133
と、顔モデルにおいて顔の表情を変化させるための表情
データを記憶する表情データベース135と、人物の声
紋を記憶するための声紋データベース139と、音声合
成に必要な音声データを記憶するための音声データベー
ス141と、画像に関連するコメントを記憶するための
コメントデータベース143と、人の音声を記録するた
めの録音データベース145とを含む。
【0055】画像データベース131は、カメラ112
で撮影された画像、スキャナ113で読取られた画像、
または、外部入出力部109で記録媒体125から読取
られた画像データが記憶される。画像データベース13
1に記憶される画像データは、画像データのファイル名
と画像データに付随する情報とが関連付けられて記憶さ
れる。画像データに付随する情報としては、たとえば、
カメラ112で撮影して得られる画像データについて
は、撮影時のシャッタ速度、絞り情報、撮影年月日およ
び日時情報などである。
【0056】これらの情報は、カメラ112で撮影され
るときに、自動的に画像に付随され、カメラ112から
出力される。また、スキャナ113で画像が入力される
場合には、キーボード114からその画像に関連する情
報が入力される。このように、画像データベース131
には、画像データ自体と、その画像データに付随する情
報とが関連づけられて記憶されている。
【0057】この画像データに付随する情報は、画像デ
ータとは別に、画像データのファイル名と付随情報とを
関連づけた関連付けデータとして記憶するようにしても
よい。
【0058】顔モデルデータベース133は、顔画像を
位置情報とテクスチャ情報とで表されるベクトルで表
し、複数の顔画像のベクトルに主成分分析を施して、求
められるモデルを記憶する。モデルは、複数の顔画像に
統計的処理を施すことにより圧縮して求められる。顔モ
デルデータベース133は、このように複数の顔画像を
圧縮して作成されるモデルを記憶する。このような複数
の顔画像に統計的処理を施して作成されるモデルについ
ては、T.F. Cootes et al.,“Active Appearancemodel
s”,“In Burkhardt and Neumann, editors, Computer
Vision-ECCV '98”, Vo1. II, Frieburg, Germany, 199
9に記載されている。
【0059】このコートらが提案するアクティブ・アピ
アランス・モデル(AAM)は、入力された2次元の顔
画像をモデルに射影することにより、入力された顔画像
のモデルにおけるパラメータを求めることができる。よ
り具体的には、入力画像ごとにモデルパラメータを用い
てモデルで生成された推定モデルとの残差が求められ、
求められた残差とモデルパラメータの残差をなくすため
の変動量との関連を予め学習しておくことにより、高速
に入力された顔画像に対するパラメータを導出するもの
である。このAAMによれば、1つの顔画像に対してモ
デルにおけるパラメータが一意に定まり、求められたパ
ラメータで顔画像を特定することができる。
【0060】また、このAAMを用いることにより、所
定のパラメータを変動させることにより、顔画像の表情
を変化させることができる。このパラメータの変動量と
表情との関連を記憶するのが表情データベース135で
ある。顔画像の表情を変えることにより、たとえば、顔
画像のうち口の部分だけを動かすことができ、口の部分
の形が異なる顔画像を複数組合わせることにより、人が
話している動画像を組立てることができる。
【0061】表情データベース135には、このように
動画像を作成するためのパラメータの変動量の組も記憶
される。
【0062】顔画像データベース137は、人物ごとの
顔画像と、その顔画像のモデルにおけるパラメータと、
その顔画像の識別子とを関連づけて記憶する。顔画像の
識別子は、シリアルな番号でよく、人物名であってもよ
い。
【0063】声紋データベース139は、上述した人物
の識別子別にその人物の声紋データを記憶する。人物の
識別子は、顔画像データベース137の識別子と同じ識
別子が用いられる。したがって、同じ識別子における顔
画像データベース137の顔画像およびパラメータで表
わされる人物と、声紋データベース139の声紋データ
の人物とは同一人物となる。
【0064】音声データベース141は、声紋情報と組
合わせることにより話者適用した音声信号を作成するた
めに必要な音声データを記憶する。この声紋データから
話者適用した音声信号を合成する音質変換技術について
は後述する。
【0065】コメントデータベース143は、画像デー
タベース131に記憶されている画像データに関連づけ
られたコメントを記憶する。具体的には、画像データの
ファイル名とテキストのコメントとが関連づけられて記
憶される。
【0066】録音データベース145は、画像データベ
ース131に記憶されている画像データに関連づけられ
た音声情報を記憶する。具体的には、予め特定の人物が
マイク111から入力した音声が、画像データのファイ
ル名と関連づけて記憶される。したがって、録音データ
ベースには、画像データごとに、かつ、人物ごとに、音
声が記憶される。したがって、1つの画像データに複数
の人物の音声が記憶されることもあり得る。
【0067】図3は、本実施の形態における電子アルバ
ム装置100の制御部101の概略機能を示す機能ブロ
ック図である。図3を参照して、制御部101は、画像
データをディスプレイ122等に表示させるための画像
表示部151と、表示された画像の中から所定の顔画像
を抽出するための顔画像抽出部153と、抽出された顔
画像を特定するための人物特定部155と、抽出された
顔画像の表情を変化させるための顔画像作成部157
と、特定された人物の声でコメントを再生するための音
声合成部159と、表情が変化された顔画像を画像表示
部151に表示されている画像と合成するための画像合
成部161とを含む。
【0068】画像表示部151は、キーボード114ま
たはマウス115で指示された画像データを画像データ
ベース131より読込み、ディスプレイ122に表示す
るとともに、画像データを顔画像抽出部153へ送信す
る。
【0069】顔画像抽出部153は、受信した画像デー
タのうち、キーボード114またはマウス115で指定
された人物の顔画像を抽出する。この抽出には、既知の
技術が用いられ、キーボード114またはマウス115
で指定された画素を含む人物の顔画像が抽出される。た
とえば、顔画像は、肌色の領域を抽出し、その輪郭内に
含まれる画像を抽出する。顔画像抽出部153で抽出さ
れた顔画像は、人物特定部155へ送信される。
【0070】図4は、制御部101の人物特定部155
の詳細な機能を示す機能ブロック図である。図4を参照
して、人物特定部は、パラメータ作成部163とパラメ
ータ比較部165とを含む。パラメータ作成部163
は、顔画像抽出部153より受信した顔画像を、顔モデ
ルデータベース133に記憶されるモデルに射影するこ
とにより、その顔画像のパラメータを作成する。作成さ
れたパラメータは、パラメータ比較部165に送信され
る。
【0071】パラメータ比較部165は、パラメータ作
成部163より受信したパラメータと、顔画像データベ
ース137に記憶されている顔画像のパラメータと比較
する。そして、パラメータ作成部163より受信したパ
ラメータと最も類似するパラメータを有する顔画像を検
出する。顔画像データベース137には、人物の識別
子、その人物の顔画像、その顔画像を顔モデルデータベ
ース133に記憶されているモデルに射影したパラメー
タとが関連づけられて記憶されている。
【0072】パラメータ比較部165により、顔画像デ
ータベース137に記憶されている顔画像のうち、パラ
メータ作成部163より受信したパラメータに最も類似
するパラメータを有する顔画像が検出され、その顔画像
に関連づけられた識別子(以下「ID」とも言う)が得
られる。
【0073】なお、パラメータ比較部165で、顔画像
データベース137からパラメータ作成部163より受
信したパラメータに類似するパラメータを有する顔画像
を検出できない場合には、パラメータ作成部163で受
信したパラメータを用いて、そのパラメータで表わされ
る顔画像の区分が検出される。
【0074】ここでいう区分とは、顔画像の性別または
年代である。年代は、たとえば、幼児、少年、青年、壮
年または老年などに区分される。区分は、性別単独の区
分でもよく、年代単独の区分でもよく、性別と年代を組
合せた区分でもよい。ここでは、性別と年代を組合せた
区分を例に説明する。この区分は、顔モデルデータベー
ス133に記憶されているモデルの所定の基底のパラメ
ータから判別される。これの区分を決定するためのモデ
ルの基底は、モデルにより定められる。
【0075】パラメータ比較部165では、顔画像デー
タベース137より得られたIDを、音声合成部159
へ送信する。パラメータ比較部165において、パラメ
ータ作成部163より受信したパラメータに類似するパ
ラメータを有する顔画像が検出されなかった場合には、
顔画像の区分が音声合成部159へ送信される。
【0076】また、パラメータ比較部165は、パラメ
ータ作成部163より受信したパラメータを顔画像作成
部157へ送信する。
【0077】図5は、制御部101の音声合成部159
の詳細な機能を示す機能ブロック図である。図5を参照
して、音声合成部159は、人物特定部155よりID
または顔画像の区分を受信する。また、画像表示部15
1で表示された画像データのファイル名を画像表示部1
51より受信する。音声合成部159は、人物特定部1
55より受信したIDを用いて、声紋データベース13
9から、IDに対応する声紋データを受信する。一方、
画像表示部151から受信したファイル名を用いて、コ
メントデータベース143に画像のファイル名に対応づ
けて記憶されているコメントデータを受信する。
【0078】そして、音声データベース141に記憶さ
れている音声データ、得られた声紋データおよびコメン
トデータを用いて、声紋データから話者適用した音声信
号を合成し、スピーカ121へ出力する。声紋情報から
話者適用した音声信号を合成する音質変換技術について
は、Moulines, Sagisaka,“Voice conversion: Stateof
the art and perspectives,” Speech, Communicatio
n, Vol.16, No.3, 1995 や H. Mizuno and M. Abe,“Vo
ice conversion algorithm based on piecewise linear
conversion rules of format frequency and spectrum
tilt,” Speech Communication, 16(1995)pp.153-16
4.(1995.2)などに記載された技術を用いることができ
る。
【0079】これにより、人物特定部155より受信し
たIDで特定される人物の声でコメントデータの内容が
スピーカ121より再生される。
【0080】一方、人物特定部155で人物が特定でき
ない場合には、顔画像の区分が受信される。ここでは、
区分が男性の青年の場合について説明する。声紋データ
ベース139より、予め定められた青年の男性の声紋デ
ータが検出され、音声合成部で受信される。そして、音
声データベース141より得られる音声データとコメン
トデータベース143より得られるコメントデータとを
用いて、青年の男性の声紋データから話者適用した音声
信号がスピーカ121へ送信される。
【0081】このように、本実施の形態における電子ア
ルバム装置では、人物の声紋データに基づき、音声信号
が合成されてスピーカ121より出力される。
【0082】また、画像データのファイル名ごとにコメ
ントがコメントデータベース143に記録されているの
で、画像データのファイル名ごとに異なるコメントが再
生される。
【0083】図6は、制御部101の顔画像作成部15
7の詳細な機能を示す機能ブロック図である。図6を参
照して、顔画像作成部157には、人物特定部155よ
り顔画像のパラメータが入力される。また、予め定めら
れた表情データが入力される。表情データは、ここで
は、顔の口の部分だけを動かすコマンドとする。このコ
マンドは、予め使用者が指定することにより定められ
る。
【0084】顔画像作成部157は、受信した表情デー
タに基づき、表情データベース135から、パラメータ
変動量の組を受信する。パラメータ変動量の組は、口の
部分だけを動かす動画像を作成するために必要な複数の
静止画像を作成するためのデータである。
【0085】顔画像作成部157は、顔モデルデータベ
ース133において、受信したパラメータを用いて顔画
像を合成する。そして、表情データベース135より受
信したパラメータ変動量を用いて、パラメータを変動さ
せて複数の表情の顔画像を生成する。そして、生成され
た顔画像を順に画像合成部161へ送信する。これによ
り、口を閉じた顔画像から口を大きくあけた顔画像ま
で、口の大きさが変化する顔画像が作成され、順に画像
合成部161へ送信される。このため、画像合成部16
1へ送信される画像を組合わせることにより、口の部分
だけを動かした動画像を画像合成部161へ送信するこ
とになる。
【0086】画像合成部161では、顔画像作成部15
7より受信した顔画像を、画像表示部151より受信し
た画像データの所定の位置に合成する。これにより、顔
画像作成部157より受信した顔画像の口の部分だけを
動かした動画像をディスプレイ122へ表示することが
できる。
【0087】図7は、本実施の形態における電子アルバ
ム装置100で行なわれる登録処理の流れを示すフロー
チャートである。図8は、登録処理で表示される登録画
面の一例を示す図である。以下、図7および図8を用い
て登録処理について説明する。
【0088】図7を参照して、画像データベース131
へ登録する画像がディスプレイ122に表示される(ス
テップS1)。この画像は、カメラ112で撮影された
画像、スキャナ113で読込まれた画像、または、外部
入出力部109で記録媒体125より読込まれた画像で
ある。
【0089】図8を参照して、登録画面180は、画像
を表示する領域181と、画像を選択するために前後の
画像に切換えるための切換ボタン182,183と、顔
指定をするためのチェックボックス184と、声紋入力
を指示するためのチェックボックス185と、コメント
を入力するためのコメント入力欄186と、実行ボタン
187とを含む。また、登録画面180には、マウスポ
インタ189が表示されている。
【0090】電子アルバム装置100で登録処理が開始
されると、登録画面180がディスプレイ122に表示
される。そして、ステップS1では、領域181に画像
が表示される。
【0091】ステップS2で実行ボタン187がマウス
ポインタ189で指示され、マウスがクリックされる
と、ステップS3に進む。実行ボタン187がマウスポ
インタ189で指示されてマウスがクリックされるま
で、登録処理は待機状態となる。この間、指示ボタン1
82,183をユーザがマウスポインタで指示してマウ
スをクリックすることにより、領域181に表示される
画像を変更することができる。これにより、登録処理を
行なう画像を選択することができる。
【0092】また、ユーザは、実行ボタン187をマウ
スポインタ189で指示してマウスをクリックする前
に、顔指定のチェックボックス184と声紋入力のチェ
ックボックス185とをクリックすることができる。
【0093】顔指定のチェックボックス184をマウス
ポインタ189で指示してマウスをクリックした場合に
は、顔指定のチェックボックス184がチェックされ、
×の印が表示される。
【0094】声紋入力のチェックボックス185をマウ
スポインタ189で指示してマウスをクリックした場合
には、声紋入力のチェックボックス185がチェックさ
れ、×の印が表示される。
【0095】ステップS3において、顔指定のチェック
ボックス184がチェックされているか否かが判断され
(ステップS3)、チェックされている場合にはステッ
プS4に進み、チェックされていない場合にはステップ
S9に進む。
【0096】ステップS4では、領域181に表示され
ている画像の中から、顔の指定が行なわれる。顔の指定
は、マウスポインタ189を領域181に表示されてい
る画像の顔の部分に合わせた状態で、マウスをクリック
することにより行なわれる。顔の指定により、マウスポ
インタ189が位置する画素を含む顔の領域が画像の中
から切り出される。この処理は、顔画像抽出部153で
行なわれる。
【0097】そして、切り出された顔画像が、顔モデル
データベース133に記憶されているモデルに射影さ
れ、切り出された顔画像のパラメータが計算される(ス
テップS5)。
【0098】そして、計算されたパラメータが、顔画像
データベース137に既に登録されているか否かが判断
される(ステップS6)。登録されている場合にはステ
ップS9に進む。登録されていない場合には、その顔画
像の人物の識別子(ID)が付与され、ステップS7に
進む。
【0099】ステップS7では、声紋入力のチェックボ
ックス185がチェックされているか否かが判断され
る。チェックされている場合にはステップS8に進み、
そうでない場合にはステップS9に進む。
【0100】ステップS8では、ステップS4で顔指定
された人物の声紋の入力処理が行なわれる。声紋の入力
は、マイク111より顔画像の人物が所定の音声を入力
することにより行なわれる。また、予め録音された音声
を入力するようにしてもよい。
【0101】そして、ステップS9では、コメントの入
力が行なわれる。コメントは、図8の登録画面180の
コメント入力欄186にキーボード114から入力され
る。ここには、領域181に表示されている画像に関連
するコメントを入力するのが望ましい。コメントとは、
領域181に表示されている画像のファイル名に関連す
る文字情報である。
【0102】次のステップS10では、入力されたデー
タがそれぞれのデータベースに登録される。切り出され
た顔画像が未登録の場合には、切り出された顔画像と新
たに付与されたIDとが関連づけられて顔画像データベ
ース137に記憶される。声紋データが入力された場合
には、IDと声紋データとが関連づけられて声紋データ
ベース139に登録される。また、コメント入力欄18
6にコメントが入力された場合には、入力されたコメン
トと領域181に表示されている画像のファイル名とが
関連づけられてコメントデータベース143に登録され
る(ステップS10)。
【0103】なお、領域181に表示される画像中に複
数の人物が含まれる場合には、ステップS3〜ステップ
S8までの処理を、表示されている人物の数だけ繰返し
行なわれる。これにより、表示されている複数の人物す
べてについて顔画像データベース137と声紋データベ
ース139とに複数の人物全員のデータを登録すること
ができる。
【0104】図9は、本実施の形態における電子アルバ
ム装置100で行なわれる閲覧処理の流れを示すフロー
チャートである。図10は、閲覧処理で表示される閲覧
画面の一例を示す図である。以下、閲覧処理について図
9および図10を用いて説明する。閲覧処理が開始され
ると、閲覧画面190がディスプレイ122に表示され
る。
【0105】図10を参照して、閲覧画面190は、閲
覧している画像を表示する領域191と、閲覧する画像
を切換るためのボタン192,193と、閲覧モードを
選択するためのモード選択ボタン194,195,19
6とを含む。モード選択ボタン194は、Mode1を
選択するためのボタンであり、モード選択ボタン195
は、Mode2を選択するためのボタンであり、モード
選択ボタン196は、Mode3を選択するためのボタ
ンである。
【0106】Mode1は、コメントを読み上げるモー
ドであり、Mode2は既存情報を読み上げるモードで
あり、Mode3は、録音された音声を再生するモード
である。
【0107】コメントとは、コメントデータベース14
3に画像データと対応付けられて記憶されたコメントで
ある。既存情報とは、画像データベース131に画像デ
ータに対応して記憶された情報であり、その画像の撮影
された時点でのシャッタ速度、絞り情報、撮影年月日、
撮影場所などの情報である。録音された音声とは、録音
データベース145に画像データのファイル名ごと、か
つ、人物ごとに対応づけられて記憶された音声データで
ある。
【0108】図9を参照して、マウスがクリックされた
か否かが判断される(ステップS21)。ステップS2
1では、マウスがクリックされるまで待機状態となる。
【0109】次のステップS22では、マウスがクリッ
クされた時点でのマウスポインタ189の位置が検出さ
れ、検出された位置が領域191に表示された画像の人
物の領域に該当するか否かが判断される。人物の領域に
該当する場合には、ステップS25に進み、そうでない
場合にはステップS23に進む。人物の領域とは、ここ
では、人物の顔の領域とするのが好ましい。顔領域は、
肌色領域を抽出することにより、容易に検出することが
できるからである。
【0110】ステップS23では、マウスがクリックさ
れた時点でのマウスポインタ189の位置が、領域19
1内であるか否かが判断される。マウスポインタ189
の位置が領域191を外れる場合には、ステップS21
に進み、そうでない場合にはステップS24に進む。
【0111】ステップS24では、画像上の主要人物が
自動的に抽出される。主要人物の抽出は、画像に1人の
人物しか映っていない場合には、その人物が抽出され
る。画像に複数の人物が映っている場合には、たとえ
ば、顔の面積が一番大きい人物が抽出される。
【0112】ステップS25では、ステップS22で特
定された人物の顔画像、または、ステップS24で抽出
された主要人物の顔画像のパラメータが計算される。パ
ラメータの計算は、人物特定部155で行なわれる。計
算されたパラメータが、顔画像データベース137に登
録されている顔画像のパラメータと一致するか否かが、
パラメータ比較部165において判断される(ステップ
S26)。登録されている顔画像がある場合には認識可
能と判断してその顔画像に対応するIDが取得され、ス
テップS28に進む。認識できない場合にはステップS
27に進む。
【0113】ステップS27では、ステップS25で計
算されたパラメータを用いて、そのパラメータで表わさ
れる人物の区分が判別される。区分とは、男女別の年代
である。
【0114】ステップS26で認識可能と判断された場
合には、ステップS25で計算されたパラメータに対応
する人物の声紋が、ステップS26で取得されたIDに
基づき、声紋データベース139より読出される(ステ
ップS28)。一方、ステップS26で認識できないと
判断された場合には、ステップS27で判別された区分
に該当する声紋が声紋データベース139より読出され
る(ステップS28)。
【0115】そして、選択されたモードがMode1で
あるか否かが判断され(ステップS29)、Mode1
である場合にはステップS30に進み、そうでない場合
にはステップS33に進む。ステップS33では、Mo
de2が選択されているか否かが判断され、選択されて
いる場合にはステップS34に進み、そうでない場合に
はステップS35に進む。モードの選択は、閲覧画面1
90のモード選択ボタン194,195,196のいず
れがチェックされているかを判別することにより行なわ
れる。
【0116】ステップS30では、領域191に表示さ
れている画像データのファイル名に対応するコメントが
コメントデータベース143に登録されているか否かが
判断される。登録されている場合にはステップS32に
進み、そうでない場合にはステップS31に進む。ステ
ップS32では、ステップS28で読出した声紋データ
に基づいて、音声データベース141より得られる音声
データと得られたコメントデータとを用いて音声合成さ
れてスピーカ121より出力される。
【0117】ステップS31では、コメントデータベー
ス143に対応するコメントデータが登録されていない
旨をディスプレイ122に表示してステップS29に進
む。
【0118】一方でMode2が選択されている場合に
は、既存情報がステップS28で読出された声紋データ
と音声データベース141より得られる音声データを用
いて読み上げられる(ステップS34)。
【0119】Mode3が選択されている場合には、ス
テップS26における判断と同様に、ステップS25で
計算されたパラメータの顔画像が顔画像データベース1
37に登録されている顔画像のパラメータと一致するか
否かが判断される。一致するとされた場合にはその顔画
像に対応するIDが取得され、ステップS36に進む。
一致しない場合にはステップS38に進む。
【0120】ステップS36では、録音データベース1
45に、対応する録音データが登録されているか否かが
判断される。録音データとは、ステップS35で取得さ
れたIDと領域191に表示されている画像データのフ
ァイル名とに対応付けて録音データベース145に記憶
されたデータである。録音データベース145に対応す
る録音データが記録されている場合にはステップS37
に進み、そうでない場合にはステップS38に進む。
【0121】ステップS37では、対応する録音データ
の再生が行なわれ、スピーカ121より出力される。ス
テップS38では、再生不可の表示がディスプレイ12
2に行なわれ、ステップS29に進む。
【0122】以上説明したように本実施の形態における
電子アルバム装置では、閲覧時に表示された画像内の任
意の人物の声で、表示されている画像に関連するコメン
トが再生されるので、画像の表示に加えて表示された人
物の音声でコメントを出力することができる。
【0123】また、人物が特定できない場合であって
も、その人物の性別および年代に適した音声でその画像
に対応するコメントが再生される。このため、表示され
る画像を一層興味深く鑑賞することができる。
【0124】さらに、画像別および人物別にに予めコメ
ントを録音しておくことにより、表示された画像に関連
するコメントを、指定された人物の声で再生することが
できる。
【0125】なお、本実施の形態においては、電子アル
バム装置について説明したが、図7に示した登録処理お
よび図9に示した閲覧処理をコンピュータに実行させる
ためのプログラムで記載し、そのプログラムを記録した
記録媒体としても捉えることができるのは言うまでもな
い。
【0126】今回開示された実施の形態はすべての点で
例示であって制限的なものではないと考えられるべきで
ある。本発明の範囲は上記した説明ではなくて特許請求
の範囲によって示され、特許請求の範囲と均等の意味お
よび範囲内でのすべての変更が含まれることが意図され
る。
【図面の簡単な説明】
【図1】 本発明の実施の形態の1つにおける電子アル
バム装置のハード構成の概略を示す図である。
【図2】 本実施の形態における電子アルバム装置の記
憶部に記憶されるデータベースを示す図である。
【図3】 本実施の形態における電子アルバム装置の制
御部の概略機能を示す機能ブロック図である。
【図4】 制御部の人物特定部の詳細な機能を示す機能
ブロック図である。
【図5】 制御部の音声合成部の詳細な機能を示す機能
ブロック図である。
【図6】 制御部の顔画像作成部の詳細な機能を示す機
能ブロック図である。
【図7】 本実施の形態における電子アルバム装置で行
なわれる登録処理の流れを示すフローチャートである。
【図8】 登録処理で表示される登録画面の一例を示す
図である。
【図9】 本実施の形態における電子アルバム装置で行
なわれる閲覧処理の流れを示すフローチャートである。
【図10】 閲覧処理で表示される閲覧画面の一例を示
す図である。
【符号の説明】
100 電子アルバム装置、101 制御部、103
データ入力制御部、105 データ出力制御部、107
記憶部、109 外部入出力部、111 マイク、1
12 カメラ、113 スキャナ、114 キーボー
ド、115 マウス、121 スピーカ、122 ディ
スプレイ、125 記録媒体、131 画像データベー
ス、133 顔モデルデータベース、135 表情デー
タベース、137 顔画像データベース、139 声紋
データベース、141 音声データベース、143 コ
メントデータベース、145 録音データベース、15
1画像表示部、153 顔画像抽出部、155 人物特
定部、157 顔画像作成部、159 音声合成部、1
61 画像合成部、163 パラメータ作成部、165
パラメータ比較部、180 登録画面、186 コメ
ント入力欄、187実行ボタン、189 マウスポイン
タ、190 閲覧画面。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 21/06 G10L 3/00 545F 17/00 545C 15/00 551P 15/28 Fターム(参考) 5B050 AA09 BA10 BA12 BA15 CA06 CA07 DA01 EA04 EA10 FA02 FA10 FA13 FA19 GA08 5B075 ND06 ND14 PP03 PP13 PQ02 PQ04 UU40 5D015 AA03 5D045 AB01

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 画像を表示する表示手段と、 表示された画像内で任意の人物を指定する指定手段と、 指定された人物を特定する特定手段と、 特定された人物の音声情報を読出す読出手段と、 読出された人物の音声情報に基づいて、所定の情報を出
    力する出力手段とを備えた、電子アルバム装置。
  2. 【請求項2】 前記特定手段は、多数の顔画像の圧縮デ
    ータを記憶した記憶手段を含み、 前記指定手段により人物が指定されると、指定された人
    物を特定するために、指定された人物の顔画像を前記記
    憶手段に記憶された顔画像と統計的手法を適用して比較
    する、請求項1に記載の電子アルバム装置。
  3. 【請求項3】 前記読出手段が読出す音声情報は、予め
    人物ごとに記憶された声紋データである、請求項1に記
    載の電子アルバム装置。
  4. 【請求項4】 前記出力手段が出力する所定の情報は、
    予めユーザが登録した情報である、請求項1に記載の電
    子アルバム装置。
  5. 【請求項5】 前記出力手段が出力する所定の情報は、
    画像に付随した情報である、請求項1に記載の電子アル
    バム装置。
  6. 【請求項6】 画像を表示する表示手段と、 表示された画像内で任意の人物を指定する指定手段と、 指定された人物の区分を特定する特定手段と、 特定された区分に適した音声情報を読出す読出手段と、 読出された音声情報に基づいて、所定の情報を出力する
    出力手段とを備えた、電子アルバム装置。
  7. 【請求項7】 前記特定手段は、少なくとも性別を特定
    する、請求項6に記載の電子アルバム装置。
  8. 【請求項8】 前記特定手段は、多数の顔画像の圧縮デ
    ータを記憶した記憶手段を含み、 前記指定手段により人物が指定されると、指定された人
    物を特定するために、指定された人物の顔画像を前記記
    憶手段に記憶された顔画像と統計的手法を適用して比較
    する、請求項6に記載の電子アルバム装置。
  9. 【請求項9】 画像を指定する指定手段と、 指定された画像内から特定の人物を抽出する抽出手段
    と、 抽出された人物を特定する特定手段と、 特定された人物の音声情報を読出す読出手段と、 読出された音声情報に基づいて、所定の情報を出力する
    出力手段とを備えた、電子アルバム装置。
  10. 【請求項10】 前記抽出手段は、指定された画像内で
    一番面積の大きい顔を有する人物を抽出する、請求項9
    に記載の電子アルバム装置。
  11. 【請求項11】 画像を指定する指定手段と、 指定された画像内から特定の人物を抽出する抽出手段
    と、 抽出された人物の区分を特定する特定手段と、 特定された区分に適した音声情報を読出す読出手段と、 読出された音声情報に基づいて、所定の情報を出力する
    出力手段とを備えた、電子アルバム装置。
  12. 【請求項12】 画像を表示する表示手段と、 表示された画像内で任意の人物を指定する指定手段と、 指定された人物を特定する特定手段と、 特定された人物が録音した音声を再生する再生手段とを
    備えた、電子アルバム装置。
  13. 【請求項13】 画像を指定する指定手段と、 指定された画像内から特定の人物を抽出する抽出手段
    と、 抽出された人物を特定する特定手段と、 特定された人物が録音した音声を再生する再生手段とを
    備えた、電子アルバム装置。
  14. 【請求項14】 画像を表示するステップと、 表示された画像内で任意の人物の指定を受付けるステッ
    プと、 指定された人物を特定するステップと、 特定された人物の音声情報を読出すステップと、 読出された人物の音声情報に基づいて、所定の情報を出
    力するステップとをコンピュータに実行させるための電
    子アルバムプログラムを記録したコンピュータ読取可能
    な記録媒体。
  15. 【請求項15】 画像を表示するステップと、 表示された画像内で任意の人物の指定を受付けるステッ
    プと、 指定された人物の区分を特定する特定手段と、 特定された区分に適した音声情報を読出すステップと、 読出された音声情報に基づいて、所定の情報を出力する
    ステップとをコンピュータに実行させるための電子アル
    バムプログラムを記録したコンピュータ読取可能な記録
    媒体。
  16. 【請求項16】 画像の指定を受付けるステップと、 指定された画像内から特定の人物を抽出するステップ
    と、 抽出された人物を特定するステップと、 特定された人物の音声情報を読出すステップと、 読出された音声情報に基づいて、所定の情報を出力する
    ステップとをコンピュータに実行させるための電子アル
    バムプログラムを記録したコンピュータ読取可能な記録
    媒体。
  17. 【請求項17】 画像の指定を受付けるステップと、 指定された画像内から特定の人物を抽出するステップ
    と、 抽出された人物の区分を特定するステップと、 特定された区分に適した音声情報を読出すステップと、 読出された音声情報に基づいて、所定の情報を出力する
    ステップとをコンピュータに実行させるための電子アル
    バムプログラムを記録したコンピュータ読取可能な記録
    媒体。
  18. 【請求項18】 画像を表示するステップと、 表示された画像内で任意の人物を指定するステップと、 指定された人物を特定するステップと、 特定された人物が録音した音声を再生するステップとを
    コンピュータに実行させるための電子アルバムプログラ
    ムを記録したコンピュータ読取可能な記録媒体。
  19. 【請求項19】 画像の指定を受付けるステップと、 指定された画像内から特定の人物を抽出するステップ
    と、 抽出された人物を特定するステップと、 特定された人物が録音した音声を再生するステップとを
    コンピュータに実行させるための電子アルバムプログラ
    ムを記録したコンピュータ読取可能な記録媒体。
JP2000389820A 2000-12-22 2000-12-22 電子アルバム装置および電子アルバムプログラムを記録したコンピュータ読取可能な記録媒体 Withdrawn JP2002190009A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000389820A JP2002190009A (ja) 2000-12-22 2000-12-22 電子アルバム装置および電子アルバムプログラムを記録したコンピュータ読取可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000389820A JP2002190009A (ja) 2000-12-22 2000-12-22 電子アルバム装置および電子アルバムプログラムを記録したコンピュータ読取可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2002190009A true JP2002190009A (ja) 2002-07-05

Family

ID=18856291

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000389820A Withdrawn JP2002190009A (ja) 2000-12-22 2000-12-22 電子アルバム装置および電子アルバムプログラムを記録したコンピュータ読取可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2002190009A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007208351A (ja) * 2006-01-31 2007-08-16 Noritsu Koki Co Ltd 画像表示装置及び画像表示プログラム
JP2011223173A (ja) * 2010-04-06 2011-11-04 Olympus Imaging Corp 撮影装置、顔画像合成装置、顔画像合成方法、およびプログラム
US8238566B2 (en) 2004-03-15 2012-08-07 Samsung Electronics Co., Ltd. Apparatus for providing sound effects according to an image and method thereof
JP2014035541A (ja) * 2012-08-10 2014-02-24 Casio Comput Co Ltd コンテンツ再生制御装置、コンテンツ再生制御方法及びプログラム
KR20170100593A (ko) * 2014-12-30 2017-09-04 페이스북, 인크. 미디어 컨텐츠 상에 오버레이된 텍스트로 된 소셜 발언을 제공하기 위한 시스템 및 방법

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8238566B2 (en) 2004-03-15 2012-08-07 Samsung Electronics Co., Ltd. Apparatus for providing sound effects according to an image and method thereof
JP2007208351A (ja) * 2006-01-31 2007-08-16 Noritsu Koki Co Ltd 画像表示装置及び画像表示プログラム
JP2011223173A (ja) * 2010-04-06 2011-11-04 Olympus Imaging Corp 撮影装置、顔画像合成装置、顔画像合成方法、およびプログラム
JP2014035541A (ja) * 2012-08-10 2014-02-24 Casio Comput Co Ltd コンテンツ再生制御装置、コンテンツ再生制御方法及びプログラム
KR20170100593A (ko) * 2014-12-30 2017-09-04 페이스북, 인크. 미디어 컨텐츠 상에 오버레이된 텍스트로 된 소셜 발언을 제공하기 위한 시스템 및 방법
JP2018502398A (ja) * 2014-12-30 2018-01-25 フェイスブック,インク. メディアコンテンツ上に重ね合わされるテキストのソーシャルリマークスを提供するためのシステムおよび方法
US10699454B2 (en) 2014-12-30 2020-06-30 Facebook, Inc. Systems and methods for providing textual social remarks overlaid on media content
KR102300162B1 (ko) * 2014-12-30 2021-09-10 페이스북, 인크. 미디어 컨텐츠 상에 오버레이된 텍스트로 된 소셜 발언을 제공하기 위한 시스템 및 방법

Similar Documents

Publication Publication Date Title
US6556775B1 (en) Image and sound reproduction system
US6112177A (en) Coarticulation method for audio-visual text-to-speech synthesis
JP4261644B2 (ja) マルチメディア編集方法及び装置
US5689618A (en) Advanced tools for speech synchronized animation
EP0890171B1 (en) Automated synchronization of video image sequences to new soundtracks
US6097381A (en) Method and apparatus for synthesizing realistic animations of a human speaking using a computer
JP5273042B2 (ja) 画像音響区間群対応付け装置と方法およびプログラム
JP4078677B2 (ja) 映画のコンピュータ化された自動オーディオビジュアルダビングのための方法
US20070165022A1 (en) Method and system for the automatic computerized audio visual dubbing of movies
US8078466B2 (en) Coarticulation method for audio-visual text-to-speech synthesis
US7109993B2 (en) Method and system for the automatic computerized audio visual dubbing of movies
US20100085363A1 (en) Photo Realistic Talking Head Creation, Content Creation, and Distribution System and Method
JP2002077592A (ja) 画像処理方法
JPH08265641A (ja) カスタムイメージ映像準備方法並びにそのための動画イメージ映像キットおよびカメラ
JP2007193824A (ja) 画像処理方法
WO2021039561A1 (ja) 動画生成方法、動画生成装置及び記憶媒体
US7554542B1 (en) Image manipulation method and system
JP2004056286A (ja) 画像表示方法
JP2013046151A (ja) プロジェクタ、投影システム及び情報検索表示方法
JP2003078868A (ja) メディア作品制作支援装置及びプログラム
US7117155B2 (en) Coarticulation method for audio-visual text-to-speech synthesis
JP2007101945A (ja) 音声付き映像データ処理装置、音声付き映像データ処理方法及び音声付き映像データ処理用プログラム
JP3757565B2 (ja) 音声認識画像処理装置
JP2002190009A (ja) 電子アルバム装置および電子アルバムプログラムを記録したコンピュータ読取可能な記録媒体
CN110728971B (zh) 一种音视频合成方法

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050613

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080304