JP2001273505A - ビジュアル言語分類システム - Google Patents

ビジュアル言語分類システム

Info

Publication number
JP2001273505A
JP2001273505A JP2000377686A JP2000377686A JP2001273505A JP 2001273505 A JP2001273505 A JP 2001273505A JP 2000377686 A JP2000377686 A JP 2000377686A JP 2000377686 A JP2000377686 A JP 2000377686A JP 2001273505 A JP2001273505 A JP 2001273505A
Authority
JP
Japan
Prior art keywords
image
face
size
shot
classified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000377686A
Other languages
English (en)
Other versions
JP2001273505A5 (ja
JP4612772B2 (ja
Inventor
Julie Rae Kowald
ラエ コウァルド ジュリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2001273505A publication Critical patent/JP2001273505A/ja
Publication of JP2001273505A5 publication Critical patent/JP2001273505A5/ja
Application granted granted Critical
Publication of JP4612772B2 publication Critical patent/JP4612772B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Television Signal Processing For Recording (AREA)
  • Image Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 ディジタル画像の自動分類方法及びシステム
を提供する。 【解決手段】本方法は、人間の顔の存在を知るために画
像を分析するものである。分類システム522において
は、画像サイズと比較した場合の表示された顔のサイズ
を考慮し、相対的な顔サイズに基づいて画像を分類す
る。もしくは、画像内の顔の位置を、その分類の判定に
用いてもよい。特に分類された連続画像の一部分を構成
するような分類画像に関し、その連続画像の編集514
を分類毎に実行して、所望の美的効果を達成してもよ
い。その編集は、編集テンプレートを用いて実行しても
よい。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は画像データの分類に
関し、特に、編集者が、自動的に画像データを情緒的に
表現できるようにした分類方法に関するものである。
【0002】
【従来の技術】画像(フィルム、ビデオ、スライド、シ
ョーなど)のビデオシーケンスの編集は、視聴者から所
望の反応を得るために、画像のシーケンスを単に時間的
に並べる以上の技術を備える人間の編集者による入力を
必要としている。その作品の意図するメッセージや目的
を視聴者に理解させるために、その編集者は人間的な理
解に基づいてそれらを引出し、それをシーケンスにした
動画や静止画に適応する。
【0003】映画会社は画像から所望の意味を得るため
に多くの技術を使用し、そのような技術には、種々のシ
ョット、動画及び静止画の識別や応用、種々のカメラア
ングルの使用、種々のレンズ、及びフィルム効果が含ま
れている。こうして作成された作品となる画像から意味
を獲得する処理は、フィルム制作者やフィルム編集者に
よってテンプレートとして使用されるストーリーボード
に翻訳されたストーリーやメッセージで開始される。一
度、フィルムが撮影されると、その編集者には結果とし
て得られた画像と、順番を示すショットリストが与えら
れる。スクリーンライタがその記述されたストーリーを
翻訳し、ストーリー順番を示すショットリストに記述す
る、その作品の初期の段階では、書かれた言語は目で見
える言語になっている。これは視聴者がそのストーリー
を告げられ、そのメッセージを理解しなければならない
という方法による。動画像の視覚特性は通常、その俳優
(出演者)の経験に関連した会話を有し、たいていの場
合、告げられたストーリーやそのストーリー内での俳優
の感情に関連した、明白な物語とは無縁である。従っ
て、そのスクリーンライタは種々のショットから得られ
た目に見える言語を用いて、付加情報を生成しなければ
ならない。
【0004】種々のショットタイプやイメージの例を図
1A乃至図1Gに示す。図1Aは、ある環境に置かれた
ている出演者を分かりやすくし、視聴者を特定の位置に
おくための極端に長い(引いた)ショット(ELS)の
例を示している。図1Bもまた、ある環境に置かれたて
いる出演者を分かりやすくし、視聴者を特定の位置にお
くための長い(引いた)ショット(LS)の例を示して
いる。ある場合には、ELSはLSよりも、よりドラマ
チックである。図1Cは、出演者達がより視聴者に近づ
いた状態で、この物語の重要な主題を示すための、長い
ショットからの途中経過である、中間ロングショット
(MLS)を示している。通常、人間を対象にしている
場合、MLSでは膝から上を写す。図1Dは、中間ショ
ット(MS)を示し、ここでは、人間は通常、腰から上
が映され、このショットでは、視聴者がその環境での反
応や、特別な話題が展開されるのが理解できる。図1E
は、中程度にクローズドアップした状態(MCU)を示
し、ここでは人間は胸から上が表示される。このMCU
は、話し中の出演者の感情を含む、話題やコミュニケー
ションの理解に有用である。図1Fは、クローズアップ
した状態(CU)を示し、人間にたいして、その顔や肩
を、そのショット内に入れており、その話題に関連した
出演者の感情を明瞭に理解するのに有効である。このク
ローズアップは、より大きなドラマ的な効果を達成する
ためにイメージされている出演者の立場に、視聴者を注
目させるのに有効である。図1Gは、更に極端にクロー
ズアップした状態(ECU)を示し、これは顔の一部を
非常に接近して撮影したもので、これは意図する感情の
ドラマ的な効果が、この話の内容を越えたものとなって
いる。このECUは時として、視聴者に嫌がられたり、
脅すことになるので、スリラー映画やホラー映画ではし
ばしば使用される。これら図1A乃至図1Gで示す画像
の順番において、種々のショットが明らかに異なる意味
を持つことが理解されるであろう。例えば、図1Fと図
1Gのいずれにおいても、飛んでいる凧が見えていな
い。また図1Dと図1Eでは、凧は、図1Aから図1C
に見られるような、牛によって示される農場の上を飛ん
でいることがわからない。更に、図1Aからは、その出
演者が微笑んでいるか、或は実際、目が開いているかど
うかは明らかではない。
【0005】人物の体全体を写した写真或は動画は、そ
の人物の顔のクローズアップである場合、正確に同じ人
間の写真であっても、別の意味があると視聴者に理解さ
れるかもしれない。完全に人物の身体を移すショット
は、一般的には、視聴者によって、有益であり、その出
演者の社会的要因、特定の環境と関連付けるのに有効で
あると解釈されている。
【0006】この例を図2A乃至図2Cを参照して説明
する。これらの図では、同じ人物が3種類のショットで
示されている。図2Aは、ある風景の中でのワイドショ
ットであり、その場所、人物、その場面内でなされる動
きに関して、より有効的に情報を提供する。図2Bは、
人物とその周辺内でのミッドショットで、その場所と動
きから、その人物の特性を強調するように変化してい
る。図2Cは、その人物のクローズアップを示し、視聴
者の注目をその人物に引き付けている。
【0007】パンは、スクリーンライタによってなされ
る技術で、視聴者があるシーンの情報に専心できるよう
に援助するものである。この技術は、広い風景や、映画
などであるショットを確定するのに使用される。カメラ
が動かない時に得られる、ストレートショットは、この
パンの効果に相反する。ストレートショットでは、視聴
者は、そのシーンに沿って目を移動させて情報を探さね
ばならないのに対し、このパンでは、視聴者は特定のメ
ッセージを探す必要がなくても、視聴者にその情報を提
供することができる。パンでのカメラの移動は、視聴者
に、そのシーンで見られるそれら要素を指示し、正しく
使用されれば、情報を解釈したり、その情報に専心した
りする人間の方法を模倣するようにできる。図3Aは、
複数の画像要素(例えば、太陽、家、牛、人間及び凧)
を含むスチルショットの一例を示す図で、視聴者はこれ
らを走査して情報を得ることが出来る。映画では、1つ
のスチルショットは、視聴者を、そのストーリーの場所
及び関係に位置付けるための、1つの確定するショット
として使用される。シーンライタは、このショットに基
づいて後続のシーンを意味のあるものにする。図3B
は、4つの連続したフレームでの、ズーム、スプレッド
を併用したパン技術の一例を示す図である。
【0008】更に、ダイレクト、ストレートショットと
は逆に、カメラのアングルを変えることは、その話だけ
では表現できない別の意味である、人物からの意味を生
成するのに使用される。例えば、新聞やテレビのジャー
ナリストは、しばしばカメラアングルを変更して、好ま
しい選挙候補者に関する宣伝を依頼する。例えば、ロウ
アングルで撮影された会見が、視聴者に優勢な人物を表
していたり、同一人物であっても、ハイアングルで撮影
されると、下に見られることがある。同様な技術が映画
においても使用され、敵対者とその被害者の効果をドラ
マ的に増大させている。ここで被害者がハイアングルで
撮影されると、弱くて攻撃を受けやすく見えるだけでな
く、視聴者はその人物に同情し、その恐怖をも体験する
ことになる。
【0009】図4Aは、目のレベルのショットを示し、
図4B乃至図4Eで見られるような他のショットで使用
されるアングルとは別の標準ショットである。図4B
は、ハイアングルショットを示し、人物を目下の位置に
おくのに使用される。図4Cは、ロウアングルショット
を示し、ここではカメラアングルはロウに保たれ、人物
を目上に見せている。図4Dは、傾いたカメラアングル
でのショットを示し、ここではカメラは中心から外れて
保持され、これにより視聴者は、その人物は通常とは違
う、或は性格的にアンバランスな状態にあると思う様に
なる。図4Eは、ダッチアングルショットを示し、これ
は「急げ時間がない」といった急ぎの状態を示すか、あ
るいはその人物に奇妙な効果を与えるのに使用される。
こうして、いい方向にも悪い方向にも、何か迷ってしま
うといったメッセージを視聴者が受取ることになる。
【0010】上述したのに加えて、特別なストーリーが
展開されていることを教示する多くの画像やショットが
ある。トラッキングショットは、出演者に続いて視聴者
が、その動きの一部を経験できるものである。パンは、
シーンをパノラマ的に描写すると共に、シーン内で人物
に対して意味付けや重要性を指示する。スイッシュ(swi
sh)パンも同様であるが、シーン内の遷移を表すのに、
より使用される。チルトショットは、カメラをある点か
らアップ或はダウンするもので、これは人が人物や、こ
れにより表された情報を含む垂直の物体を評価する方法
を真似たものである。携帯カメラによる映像は、視聴者
に撮影が直ちに行われているように描写し、カメラが支
持されていて(例えば、三脚や台で)撮影された映像に
関連している時、最良の効果を得るためにしばしば使用
される。
【0011】衝撃的な視覚言語を理解することは、イメ
ージをより意味のある方法で表すことである。同時期の
動画の結果と初期の映画制作との比較することが好まし
い。初期の動画の例は、舞台での動きの遷移を反映し
た、上からの人物の完全なショットをで構成されてい
る。例えば、チャーリチャップリンの映画制作とストー
リーテラーの時代は、ドラマチック、及び情緒に満ちた
動画と対照的である。先駆者である監督D.Wグリフス
(Griffths)は、映画にドラマを産み出さすためにショ
ットのパレットを使用することを初めて紹介した。これ
により視聴者は、その映画の人物の感情と同じ経験がで
きるようになった。
【0012】映画会社はまたそのストーリーを説明する
ために他の技術を使用している。その技術はレンズの選
択とフィルム効果を含んでいる。これらは視聴者に、そ
の映画の意図しているメッセージや目的を理解させやす
くする。視聴者は、どのようにして、或は気づいたとし
ても、これらの技術がどのようにイメージに適用されて
いるかを理解する必要がない。実際には、この技術が適
正に適用されれば、この方法は視聴者にとって明らかに
なることさえないであろう。
【0013】成功した映画会社によって必要とされたこ
のような技術は、成功した技術のメッセージを築き上げ
た多くの熟練者達の協動作業とともに、長年の教育や実
践を通して得られたものである。対照的に、アマチュア
映像制作者及び家庭でのビデオ制作者(home video make
rs)はそのような方法を理解又は適用するための技術及
び機会をしばしば欠いている。しかし、プロが制作した
映像作品によく接しているアマチュア及び家庭での映像
制作者は、莫大な費用を要するハリウッド作品のように
ではないにせよ、自分の作品をプロの制作作品にある程
度でも近づけるために洗練したいと思っている。現在、
そのような方法を用いて将来の映像制作者を教育するた
めのコースに特化した多くの映画学校があるけれども、
しばしばこのようなコースはアマチュア映像制作者の出
席を禁じている。アマチュア映像制作者を手助けするで
あろう現在利用可能な他の方法には、典型的には画像の
配列を助けるソフトウェア製品及び/又は将来の映像制
作者を教育するためのインタラクティブな教育技術が含
まれる。しかしながら、現在のソフトウェアアプローチ
は、小規模な(家庭での)作品に用いるには法外な費用
及び技術が必要なため広く用いられるには至っていな
い。
【0014】不慣れな編集者にとって、時間もまた現在
のフィルム編集技術に関する大きな要因である。典型的
には、ショットを計画し、その順番を考えるのに必要な
時間は平均的な家庭/アマチュア映像制作者の現実的な
範囲を十分に超えるものである。
【0015】従って、不慣れな(アマチュア)映画製作
者が広範な計画又はショット形式の試験を行うことな
く、所望の観衆に対して感情的な効果を伝える映像作品
を創作することのできる手段を提供することが望まし
い。
【0016】
【課題を解決するための手段】この必要性は、画像の自
動分類、及び/或いは、様々な感情的なカテゴリ別の撮
影を通して要求され、その上で、所望とする感情効果を
実現するための編集できるようにすることである。
【0017】本開示の第1の態様は、デジタル画像の自
動分類の方法を提供することにあるが、その方法は、人
間の顔の存在する画像を解析し、前記画像のサイズに関
する、配置された顔サイズを判定する判定し、前記画像
に対する前記顔の相対サイズに基づいて前記画像を分類
するステップを備える。
【0018】本開示の第2の態様は、デジタル画像の自
動分類の方法を提供することであるが、その方法は、デ
ジタル画像の自動分類方法であって、人間の顔の存在す
るイメージを解析し、前記画像のフレームに対する、配
置された顔の位置を判定し、前記画像のフレームに対す
る前記顔の相対位置に基づいて、前記画像を分類するス
テップを備える。
【0019】本開示の他の態様は、上記方法のいずれか
1つを実行する装置を提供することである。
【0020】また、本開示の他の態様は、上記方法のい
ずれか1つを実行するコンピュータプログラムを記憶し
たコンピュータ読み取り可能媒体を含むコンピュータプ
ログラムプロダクトを提供することにある。
【0021】
【発明の実施の形態】図5に、画像記録及び生成システ
ム500の模式図を示す。図において、シーン502
は、ディジタルビデオカメラ又はディジタルスチルカメ
ラのような画像記録装置504を用いてキャプチャされ
る。シーン502がスチルカメラによってキャプチャさ
れる場合、典型的には連続したスチル画像が記録され、
実際には、ビデオカメラによって記録されるような連続
した画像を補足する。画像の取り込みに関連して、カメ
ラ504から出力され、典型的には画像データ506
a、ビデオデータ506b、音声データ506c及び
「カメラ」メタデータ506dから構成されるキャプチ
ャデータ506が生成される。カメラメタデータ506
は通常カメラによって自動的に生成されるメタデータ又
はユーザによってカメラに手入力されるメタデータを表
す。このようなメタデータは、画像又はフレーム番号、
キャプチャの実時間(日付を含んでも良い)、カメラ設
定の詳細(絞り、露出等)及び、光量などの環境情報を
含むことができる。
【0022】好ましくは、カメラ504で記録されたキ
ャプチャデータ504は508として、典型的には演算
システムに付随する大容量記憶装置510に転送され、
すぐにビジュアル言語分類システム522への相互接続
520を介して利用可能になる。分類システム508は
映像制作者(film maker)の編集がしやすいように構成さ
れるメタデータを生成する。ビジュアル言語分類システ
ム522は、さらなるメタデータとして構成された分類
データ524を出力する。分類データ524は個々の画
像に関連し、大容量記憶装置526に記憶することがで
きる。記憶装置526に記憶された分類データ524
は、接続512を介した記憶装置510へのアクセスを
通じて編集モジュール514へ出力することができる。
編集モジュールは、プレゼンテーションユニット516
を介して、表示のためにテレビジョンディスプレイのよ
うなディスプレイユニット518に出力されるか、大容
量記憶装置519へ出力される、編集されたシーケンス
528の編成を提供する。いくつかの実装において、記
憶装置510、526及び519は統合的に形成されて
も良い。
【0023】分類システム522は記憶装置510にあ
る画像分析のためのコンテンツ分析を行う。分類システ
ム522で実行される分析は写真家が画像もしくは画像
シーケンスをキャプチャした時点における意図に関する
情報を提供するように構成される。このような分析は人
間の顔面検出及び、好ましくは空、草原、うす茶色又は
茶色の地面といった風景の特徴や、自動車、建造物など
他の特徴的形状を含む、視覚的にはっきりした特徴の検
出を含むことができる。また、例えば、人の会話、自動
車の通過、スポーツの試合における、ボールをバットで
打った際のバシッという音といった、画像シーケンス内
の具体的なイベントを特定するために、好ましくは音声
分析を用いることができる。分類システム522は、あ
る画像シーケンス又はシーケンス中の特定の画像におい
て特定されるコンテンツに関連する、又はコンテンツを
示すメタデータを提供する。
【0024】分類システム522によって適用可能なコ
ンテンツ分析の1つの具体例は顔面検出であり、これに
よって画像もしくはそのシーケンスにおける特定の人物
の同定及び追跡が可能になる。図5の装置に用いること
ができる顔面検出装置の一例が、Poggio等による米国特
許第5,642,431号に記載されている。また、別
の例がオーストラリア公開特許公報第AU-A-33982/99号
に記載されている。このような顔面検出装置は典型的に
は画像フレーム内において皮膚の色を有し、顔を表すで
あろう画素のグループもしくは領域を検出し、それによ
って検出したグループ又は領域、すなわち顔面に対する
メタデータによるタグ付け並びにモニタを可能にする。
このようなモニタリングは検出された顔面の高さ及び幅
に関する境界ボックス(boundary box)の確立及び、その
後複数の画像に渡るボックスの変化及び移動の追跡を含
むことができる。
【0025】図1Aから1Gの画像シーケンスにおい
て、図1A及び図1Bの細かなコンテンツは一般に正確
な顔面検出を行うには小さすぎる。そのため、これらの
フレームは顔のない画像(non-face images)として分類
される。しかし、図1Cから1Gの各々において、凧揚
げをしている人物の顔は非常によく認識でき、かつ個々
の画像の重要な特徴である。従って、これらの画像は自
動的に顔のある画像(face images)として分類され、こ
のような分類は分類システム522によって実行される
コンテンツ分析によって生成されるメタデータ524と
して同定されるほか、画像とともに提供されるメタデー
タ506dにリンク付けもしくは関連づけされる。
【0026】さらに、好ましい実施形態において、全体
の画像サイズに対する割合としての検出顔面サイズは、
ショットの形式確立及び記録に用いられる。例えば、シ
ョットの形式を同定するための簡単なルールを確立する
ことができる。第1のルールは、顔が検出されたが、画
面に対して検出された顔の大きさがかなり小さい場合、
その画像は遠景ショット(long shot)として分類すると
いうものでよい。同様のルールは、顔が検出され、その
大きさが画像とほぼ同じであるというものである。この
場合、画像はクローズアップとして分類されるであろ
う。極端なクローズアップの場合、顔面が画像全体を占
めるか、顔面が画像とほぼ同じ大きさだが、画像からは
み出ている。
【0027】別の例として、MLSである図1Cでは、
顔面が画像の約2%を表している。また、顔面が画像の
約4%を占める図1Dは、MSである。図1Eについて
は顔面が画像の約10%の大きさである、MCUとな
る。図1FのCUショットは顔面が画像の約60%の場
合、ECUについては顔面が画像の約80%を超える場
合である。このようにして、対象が顔であるか、いくつ
かの他の同定可能な画像構成(例えば、牛、家、自動車
等)であるかに関わらず、対象に関してショットの形式
を定義するための好ましいルールセットを確立すること
ができる。ルールの例を以下に示す。
【0028】ミディアムロングショット(MLS) 対
象が画像の2.5%未満 ミディアムショット(MS) 対象が画像の2.5%を超
え、10%未満 ミディアムクローズアップ(MCU) 対象が画像の10
%を超え、30%未満 クローズアップ(CU) 対象が画像の30%を超え、80%
未満 極端なクローズアップ(ECU) 対象が画像の80%超 ここで、映像制作者は、望むなら利用可能なソースの長
さの特定形式、又は達成したい特定の編集効果に依存し
てルールを変化させることができる。
【0029】分類のための内容分析に関する別の例とし
てカメラ傾斜角(チルト角)が挙げられる。これは、イ
メージフレーム中における検出された顔の相対位置を調
べることによって評価することができる。例えば、図4
Aに示されるように、顔がイメージフレーム中の中央部
に検出されている場合、これはアイレベルショット(ey
e-level shot)として分類され得る。また、図4Bで
は、主体がフレームの底部に配置されているが、このよ
うな場合は、ハイアングルショットに分類され得る。検
出された顔の位置決めは、所望の分類を提供するよう
に、イメージフレームのタイリング(tiling)と関連さ
せ得る。フレームの中のタイルは、アイレベル、ハイシ
ョット、ローショット、レフトサイド、ライトサイドに
前もって分類しておく。ある(複数の)タイルにおいて
検出された顔の位置は、次に、平均のタイル位置を決定
するのに使用され、その結果、平均した顔のタイルの位
置に従ってイメージを分類することができる。そのよう
な手法は容易に図4A〜4Dのイメージに適用され得
る。
【0030】図4Eのダッチショットは、イメージ内の
エッジを検出することによって判断され得る。そのよう
なエッジは、多くの既知のエッジ検出構成の1つを用い
て検出され得るものである。イメージにおけるエッジ
は、しばしば地平線或いは他の水平のエッジを示すか、
ビルディングの壁によって形成されるような垂直なエッ
ジを示す。その結果、実質的に非垂直で、非水平である
として検出されるエッジはダッチショットを示す可能性
がある。検出されたエッジの傾斜の角度をイメージフレ
ームと比較することによって、分類が実行されてもよ
い。その角度がおよそ0度かまたはおよそ90度である
場合、それぞれは地平線か垂直な壁を表していると考え
られる。従って、そのようなものはトラディショナルシ
ョットの可能性が高い。しかしながら、傾斜の角度が実
質的にそれらの値の間である場合には、ダッチショット
であることが示される。そのような検出のための好まし
い傾斜の角度は30〜60度であろうが、これは所望で
あればユーザによって決定されてもよい。
【0031】別の実施形態では、ビジュアル言語分類シ
ステムは、シーンによって伝えられる情緒的なメッセー
ジに関連する他の用語(term)でもって、ユーザが分類
を補うことを可能とする。そのようなマニュアルで入力
されるメタデータは、図1C〜1Gの例において、「幸
福」、「笑顔」、「レジャー」、および「楽しみ」など
の用語を用いることができる。また、「凧上げ」などの
ような、より複雑な説明文が入れられてもよい。このマ
ニュアルで入力されたメタデータは、自動的に生成され
たメタデータを補うことができ、自動的に生成されたメ
タデータとともに格納され得る。
【0032】そのような処理の結果、格納526は、最
終的な生成物を形成するのに使用されるべく、ソースイ
メージの内容を表すメタデータを含むように形成され
る。メタデータは、タイミング情報や順序づけ情報(例
えば、シーンの数など)を含むだけでなく、後続の編集
処理におけるプロンプト(指示メッセージ)として使用
することが可能な、イメージの内容及びショットタイプ
を表す情報をも含む。
【0033】データベース526が形成されると、次
に、ユーザは、選択されたイメージの編集を開始するこ
とができる。これは、記憶装置510から適切なイメー
ジ或いは適切な一連のイメージを抽出する編集システム
514を起動することによってなされる。メタデータ記
憶装置526の中に保管された情報を使用して、ユーザ
は容易に特定のイメージを編集することができる。デー
タベース情報は、多くの他のイメージの中から、ソース
かターゲットの一方もしくは両方として、フェードイン
とフェードアウトポイントを定義したり、ズームの変化
が必要なイメージを定義したり、個々のイメージの中の
ズーミング操作のためのフォーカス中心を表すことがで
きる興味あるポイントを定義したりするのに使用され得
る。
【0034】編集システム514によって実行される編
集は、さまざまな方法で分類部524を使用して動作す
ることができる。例えば、ユーザがロングショットでイ
メージシーケンスを開始させようと思った場合、従っ
て、全ロングショットをリスト化するべくシステム51
4に要求を入力するかもしれない。そして、システム5
14は、予めロングショットとして分類されたイメージ
のピック−リスト(pick-list)を形成するために、記
憶装置526に問い合わせを行なう。そして、ユーザ
は、編集シーケンスを開始するために、そのリストから
ロングショットを選択することができる。こうして、各
イメージ或いはショットシーケンスに関するサーチ可能
な情報として準備されたソースが提供されることによっ
て、分類のためにユーザが費やす編集時間を減少させ
る。別の例は、主体の顔にある「恐れ」の感情を示すこ
とを要求する場合である。顔は典型的には、ミディアム
ショットの下では、あらゆる重要な細部も検出されない
ので、記憶装置526の検索はすべてのミディアムショ
ット、クローズアップおよび極端なクローズアップのた
めになされる。対応するピックリストは、ユーザが一般
に、「恐れ」を示すものを決定するのに利用可能な全て
のイメージの数よりも少ない数のイメージをレビューす
ればよいように生成される。そして、「恐れ」などのユ
ーザ入力されたメタデータは、そのような感情を示すそ
れらのイメージに対する自動的に生成された分類を補う
ことができる。
【0035】上述したようなイメージの自動化された内
容分析は、イメージのシーケンスの迅速な処理を可能と
し、強化された編集結果の形成を容易にする。例えば、
ビデオソースが25フレーム/秒を有して提供される場
合、5秒間のショットは125個のフレームの編集を必
要とする。各フレームに手動による顔検出と焦点の確立
を実行することは、時間浪費的であるし、人間の非一貫
性による首尾一貫しない結果をもたらす傾向がある。内
容分析による自動化により、各フレームにおける顔の位
置が一貫して適用される規則に従って見つけられる。そ
の時に必要なことのすべては、始め、終わりのポイント
および対応する編集機能を、ユーザに選択させることで
ある(例えば、ズーム値、始めの0%、および終わりの
60%)。
【0036】ソース素材のメタデータ分析は以下を含む
ことができる。すなわち、 (i)タイムコードと日付データ; (ii)GPSデータ; (iii)画像品質分析(シャープネス、色、内容の品質
等); (iv)オリジナルのショットタイプ検出; (v)オブジェクト検出とカスタムオブジェクト検出(著
者によって決定された); (vi)動き検出; (vii)顔検出; (viii)オーディオ検出; (ix)衝突検出; (x)タイル(インターフレーム構造)分析;そして (xi)ユーザ入力されたメタデータ。
【0037】図5を参照する上述の方法は、図6に示さ
れるような従来の汎用コンピュータシステム600を使
用して実行されるのが好ましく、図6では、図5の処理
が、コンピュータシステム600内で実行するアプリケ
ーションプログラムのようなソフトウェアとして実現さ
れても良い。ソフトウェアは2つの部分に分割しても良
く、1つは、分類及び編集方法を実行し、もう1つは、
残りの部分とユーザ間のユーザインタフェースを管理す
る。ソフトウェアは、例えば、以下に説明するような記
憶装置を含むコンピュータ可読媒体に記憶されても良
い。ソフトウェアは、コンピュータ可読媒体からコンピ
ュータにロードされ、そして、コンピュータによって実
行される。このようなソフトウェアを有するコンピュー
タ可読媒体あるいはそのコンピュータ可読媒体に記憶さ
れたコンピュータプログラムは、コンピュータプログラ
ム製品である。コンピュータにおけるコンピュータプロ
グラム製品の使用は、画像あるいは画像シーケンスの分
類及び間接編集を行う装置に効果を与えるので好まし
い。
【0038】コンピュータシステム600は、コンピュ
ータモジュール601、キーボード602及びマウス6
03のような入力装置、プリンタ615、画像表示装置
614、スピーカ611を含む出力装置を備える。変調
−復調(モデム)トランシーバ装置616は、例えば、
電話回線621あるいは他の機能媒体を介して接続可能
な通信ネットワーク620へ及びから通信するコンピュ
ータモジュール601によって使用される。モデム61
6は、インターネット、かつローカルエリアネットワー
ク(LAN)あるいはワイドエリアネットワーク(WA
N)のような他のネットワークシステムへのアクセスを
実行するために使用することができる。
【0039】コンピュータモジュール601は、典型的
には、少なくとも1つのプロセッサユニット605、例
えば、半導体ランダムアクセスメモリ(RAM)及びリ
ードオンリメモリ(ROM)から構成されるメモリユニ
ット606、音声/画像インタフェース607、キーボ
ード602及びマウス603かつオプションのジョイス
ティック(不図示)用のI/Oインタフェース613、
モデム616用インタフェース608を含む入力/出力
(I/O)インタフェース群を含んでいる。提供される
記憶装置609は、典型的には、ハードディスクドライ
ブ610及びフロッピー(登録商標)ディスクドライブ
611を含んでいる。磁気テープドライブ(不図示)も
使用しても良い。CD−ROMドライブ612は、典型
的には、データの不揮発ソースとして提供される。コン
ピュータモジュール601の構成要素605から613
は、典型的には、当業者に知られるコンピュータシステ
ム600の従来の動作モードを得る方法で、内部接続バ
ス604を介して通信を行う。上述の構成を実行できる
コンピュータ例としては、IBM−PC互換機、サンス
パークステーションあるいはそれらを改良した同種のコ
ンピュータシステムが含まれる。
【0040】典型的には、アプリケーションプログラム
は、ハードディスクドライブ610上に常駐し、読み出
され、そして、プロセッサ605による自身の実行で制
御される。プログラムの中間記憶及びネットワーク62
0からフェッチされる任意のデータは、たいていはハー
ドディスクドライブ610と協同する半導体メモリ60
6を使用して達成される。いくつかの例では、アプリケ
ーションプログラムは、CD−ROMあるいはフロッピ
ーディスク上で符号化された状態でユーザに供給され、
かつ対応するドライブ612あるいは611を介して読
み出すことができ、あるいはモデム装置616を介して
ネットワーク620からユーザによって読み出すことが
できる。また、更に、ソフトウェアは、他のコンピュー
タ可読媒体からコンピュータシステム600にロードす
ることができ、この他のコンピュータ可読媒体は、磁気
テープ、ROMあるいは集積回路、光磁気ディスク、コ
ンピュータモジュール601と他の装置間の無線あるい
は赤外線送信チャネル、PCMCIAカードのようなコ
ンピュータ可読カード、ウェブサイト及びその類に記録
されたeメール送信及び情報を含むインターネット及び
イントラネットを含んでいる。上述の説明は、コンピュ
ータ可読媒体に関する単なる例である。他のコンピュー
タ可読媒体が使用されても良い。
【0041】図6を参照して説明される方法は、システ
ムの機能あるいは補助機能を実行する1つ以上の集積回
路のような専用ハードウェアで選択的あるいは補助的に
実現されも良い。このような専用ハードウェアは、グラ
フィックプロセッサ、デジタル信号プロセッサ、あるい
は1つ以上のマイクロプロセッサ及び付随メモリ群を含
めることができる。例えば、ズーム及び画像補間のよう
な特殊視覚効果は、そのような機能用に構成される専用
ハードウェア装置で実行されても良い。例えば、顔面検
出あるいは音声処理用に使用される他の処理モジュール
群は、専用DSP装置で実行されても良い。
【0042】図5に関する上述の説明は、画像内容から
導出される分類に基づく出力表示を生成するために編集
システム514がどのように使用できるかを示してい
る。編集に対する更なるアプローチは、図7のフローチ
ャートで示されるテンプレートに基づくアプローチ70
0を使用して達成されても良く、例えば、編集システム
514内で実行することができる。方法700は、ステ
ップ702で開始し、そこで、単一の開始−終了遷移間
長の部分である所望のクリップが処理対象として選択さ
れる。生成物を生成するために、いくつかのクリップが
シーケンス内で処理されても良い。これについては、所
望のテンプレートがクリップに適用するために選択され
るステップ704以降で行われる。これに関するテンプ
レートは、様々なショット及び所望の視覚効果を達成す
るクリップタイプに適用できる編集規則群である。選択
的には、テンプレートはクリップ部だけに適用する必要
があり、あるいはいくつかの場合では、所望の処理用に
抽出する1つ以上の静止画あるいは動画だけに適用する
必要がある。典型的には、いくつかのテンプレート70
6は、選択708に対して利用可能である。各テンプレ
ート706は、それぞれがいくかのデフォルト設定を有
するブール規則群として確立されても良い。テンプレー
ト例として、以下の表1を示し、ここでは、特定ショッ
トタイプに適用される先頭である特定視覚効果を定義し
ている。
【0043】
【表1】
【0044】表1のテンプレートでは、上述の顔面検出
条件に基づく様々なショットタイプが列挙されている。
2つの「その他」のショットタイプが示され、これらに
は、例えば、顔面が検出されないあるいはいくつかの検
出可能な被写体が判定可能である場合がある。このよう
な例としては、キャプチャされた他の色のレーシングカ
ーに対し、ユーザへの特定注目物が白色のレーシングカ
ーを含むフレームであっても良い。このようなレーシン
グカーは、分類システム522によって検出されても良
く、この分類システム522は、「その他#1」として
分類されるべき上記フレームを可能にすることによっ
て、実際の白色領域とその色の実際の移動の両方を検出
するように構成される。この移動は、連続する隣接フレ
ームを介するフレームを走査するレーシングカーの実際
の移動であっても良く、一方で、実際の背景の移動が発
生する。このような分類は、ECU、CU、MCU等の
上述のアプローチを別々にして生成されても良い。表1
に示されるように、ECU、CU、MCU及びその他#
1のそれぞれのショットタイプは、編集表示に含むよう
に選択される。
【0045】ステップ712におけるユーザの決定に従
って、選択されたテンプレート(すなわち、テンプレー
ト#2)は変わり得る。変更が要求されると、次に、ス
テップ714へ進み、ユーザがテンプレートテーブル内
のブール値を修正することが許可される。上述した通
り、選択されていないそれらのショットタイプ(すなわ
ち、MS,MLS、LS及びその他#2)は、テーブル
を使用不能とし、そこに陰が付けられて示される。それ
らの選択されたショットタイプは、その後、ユーザによ
って修正された、それぞれ対応する効果を有し得る。示
すように、複数の異なる再生速度が提供され、いずれか
一つのショットタイプの選択は、同じショットタイプの
ために他のものを不能にする。各ECU及びCUは、異
なる1/4速度で応答するように選択され、MCUは自
然な速度で再生する。その他#1のショットタイプで捕
捉されたレーシングカーは、顔のショットとモーターカ
ーのショットとの違いを強調し、ユーザの要求を満たす
ために、4倍速で再生するために選択される。カラーフ
ィルタは効果を発揮するようにされているが、選択され
た各ショットは、設定で選択されたモノクローム(B&
W)を有し、カラー変化が除去される。そのような効果
は、一定のオレンジ又はブラウンの薄色をフレーム全体
を提供し得、この例では、古いセピア色の効果で画像を
再生させる。音は、顔のショットでは不可能であるがレ
ーシングカーのショットでは可能となる。
【0046】隣接するショットタイプ間の転換のため
に、ズームされた特徴も提供される。テーブル1の例に
示すように、MCUショットは、”+2”のズームとさ
れ、これは、2秒間にわたって生じるズームを伴う、次
のショットタイプ(すなわちCU)に対するズームイン
を表している。通常、ズームの間、画像は、自動的にデ
ィスプレイのサイズに維持される。ズームアウトも可能
であり、マイナスシンボル(−)によって示される。期
間は、秒、フレーム若しくは瞬間(すなわち、++)で
特定され得、後者は、編集された製品に含めるための直
接新たなフレームを生成する。テーブル1におけるズー
ムの変化は、隣接するショットタイプ間で生じることに
より特定される。あるいは、ズームの程度及びズームの
期間は、各ショットタイプ(例えば、MCU:150
%:25フレーム;CU:200%:10フレーム;E
CU:30%:50フレーム)とは別々に特定され得
る。この手法では、編集された製品は、所定の期間にわ
たって、特定のショットタイプのために、製品の心情的
な効果を強調することにより、他のショットタイプに対
するズームを示し得る。例えば、MCUからECUへの
ズームは、”劇的な”テンプレートの一部を形成し得、
観る者の注意を中央のキャラクタに集中させるためにE
CUのものが用いられる。”賞賛される”テンプレート
は、MCUからCUへのズームに含まれ得る。
【0047】画像の編集効果の他の形式は、所望のテン
プレートに適用され得る。
【0048】一旦修正すると、テンプレートは保存さ
れ、制御はステップ704へ戻り、ユーザはちょうど修
正したテンプレートを選択することができる。一旦テン
プレートが選択されると、ステップ716へ進み、クリ
ップのシーケンスが、記憶装置718に維持されたカメ
ラメタデータから引き出される。一旦正しいシーケンス
が形成されると、シーケンスは、選択されたテンプレー
トを適用することにより、ステップ720において編集
される。このステップは、最初に、分類メタデータを記
憶装置718から供給してショットタイプを決定し、そ
の後、ショットが適用される様々な効果が選択されるビ
デオデータを供給することを含む。この結果、ステップ
722の出力が提示され、記憶装置に送られるか、直接
ディスプレイ装置へ再生される。
【0049】なお、多様なテンプレートが生成され、そ
の各々は、ソース画像上で、そこに含まれるショットタ
イプの分類に応じて感動的な編集スタイルを表現し得る
ことはいうまでもない。また、個々のクリップ又は場面
は、主題に基づく表現スタイルの変更により、異なるテ
ンプレートを用いて編集され得る。従って、モーターレ
ースへの家族的な見物は、MSのものやMLSのものに
限定されるが実質的に自然な場面を用いたピクニックの
ランチを描いた場面や、テーブル1に関して上述した手
法で編集されたアクション場面や、或いは、レース中の
クラッシュを強調するために用いられる実質的にスロー
モーションのスーパーアクション場面を含む。クラッシ
ュは、重要性を示すタグと共に、場面のその一部のメタ
データをユーザが捕捉することにおって分類され得る。
また、テーブル1のテンプレートは、他意部分は、ショ
ット距離に依存するが、上述したチルトアングルのよう
な他の分類は、代替的に又は追加的に含まれる。
【0050】[産業上の利用分野]画像編集や再生産の
分野、ショットや対象の識別、総合的な編集の厳しい訓
練を受けたアマチュアの映画会社が特別な応用を見つけ
るときにも適用可能である。
【0051】前述のものは、本発明のうちいくつかの実
施形態であって、変更及び/又は変化は本発明の趣旨を
損なうことなく行うことができる。又、記載された実施
形態は一例であって、これに限定されるものではない。
【図面の簡単な説明】
本発明の1又はそれ以上の実施の形態は、以下の図面を
参照して説明されている。
【図1A】フィルムメーカーによって用いられる複数の
ショットレンジを示す図である。
【図1B】フィルムメーカーによって用いられる複数の
ショットレンジを示す図である。
【図1C】フィルムメーカーによって用いられる複数の
ショットレンジを示す図である。
【図1D】フィルムメーカーによって用いられる複数の
ショットレンジを示す図である。
【図1E】フィルムメーカーによって用いられる複数の
ショットレンジを示す図である。
【図1F】フィルムメーカーによって用いられる複数の
ショットレンジを示す図である。
【図1G】フィルムメーカーによって用いられる複数の
ショットレンジを示す図である。
【図2A】フィルムメーカーによって用いられる3つの
異なる撮影タイプを示す図である。
【図2B】フィルムメーカーによって用いられる3つの
異なる撮影タイプを示す図である。
【図2C】フィルムメーカーによって用いられる3つの
異なる撮影タイプを示す図である。
【図3A】ビューワの心理状態に影響を与えるパンの効
果を示す図である。
【図3B】ビューワの心理状態に影響を与えるパンの効
果を示す図である。
【図4A】フィルムメーカーによって用いられる様々な
アングルのカメラ撮影を示す図である。
【図4B】フィルムメーカーによって用いられる様々な
アングルのカメラ撮影を示す図である。
【図4C】フィルムメーカーによって用いられる様々な
アングルのカメラ撮影を示す図である。
【図4D】フィルムメーカーによって用いられる様々な
アングルのカメラ撮影を示す図である。
【図4E】フィルムメーカーによって用いられる様々な
アングルのカメラ撮影を示す図である。
【図5】画像記録システム及び画像生成システムの概略
ブロック図である。
【図6】開示されたアレンジを実行可能な汎用コンピュ
ータシステムの概略ブロック図である。
【図7】ビデオ編集用テンプレートの使用を示すフロー
チャートである。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考)

Claims (83)

    【特許請求の範囲】
  1. 【請求項1】 デジタル画像の自動分類方法であって、 人間の顔の存在する画像を解析し、 前記画像のサイズに関する、配置された顔サイズを判定
    する判定し、 前記画像に対する前記顔の相対サイズに基づいて前記画
    像を分類するステップを備えることを特徴とする方法。
  2. 【請求項2】 前記画像は、前記画像を撮像した撮影者
    の意図についての情報を提供するタームを用いて分類さ
    れることを特徴とする請求項第1項に記載の方法。
  3. 【請求項3】 前記画像は、前記配置された顔サイズが
    前記画像のサイズよりも実質的に小さい場合に、遠隔シ
    ョットとして分類されることを特徴とする請求項第1項
    または第2項に記載の方法。
  4. 【請求項4】 前記画像は、前記配置された顔サイズが
    前記画像のサイズと実質的に一致する場合、クローズア
    ップとして分類されることを特徴とする請求項第1項ま
    たは第2項に記載の方法。
  5. 【請求項5】 前記画像は、前記配置された顔の一部分
    のみが前記画像内に現れている場合、極大クローズアッ
    プとして分類されることを特徴とする請求項第1項また
    は第2項に記載の方法。
  6. 【請求項6】 前記分類は、前記配置された顔サイズ
    と、人間の顔画像のサイズの所定の閾値とを結びつける
    工程を備えることを特徴とする請求項第1項または第2
    項に記載の方法。
  7. 【請求項7】 前記画像が顔を含み、前記配置された顔
    サイズが前記画像のサイズと比較される第1の所定閾値
    を下回る場合、遠隔ショットとして分類されることを特
    徴とする請求項第1項または第2項に記載の方法。
  8. 【請求項8】 前記画像は、前記配置された顔サイズ
    が、前記画像のサイズと比較される第2閾値を上まわる
    場合、極大クローズアップとして分類されることを特徴
    とする請求項第7項に記載の方法。
  9. 【請求項9】 前記画像は、前記配置された顔サイズが
    前記第2の閾値を下回り、前記画像と比較するための第
    3の閾値より上まわる場合、クローズアップとして分類
    されることを特徴とする請求項第8項に記載の方法。
  10. 【請求項10】 前記画像は、前記配置された顔サイズ
    が第1の閾値よりも大きく、前記第3の閾値より小さい
    場合、中間ショットとして分類されることを特徴とする
    請求項第9項に記載の方法。
  11. 【請求項11】 前記解析は、前記画像と共に供給され
    た情報を翻訳する工程を含むことを特徴とする請求項第
    1項に記載の方法。
  12. 【請求項12】 前記画像は、画像のデジタルビデオシ
    ーケンスの或るフレームであることを特徴とする請求項
    第11項に記載の方法。
  13. 【請求項13】 前記情報は、前記シーケンスの他のフ
    レームと結びつけられることを特徴とする請求項第12
    項に記載の方法。
  14. 【請求項14】 前記解析は、肌色画素が前記顔を配置
    するために配置されている前記画像の1以上の領域を検
    出する工程を有することを特徴とする請求項第1項に記
    載の方法。
  15. 【請求項15】 前記判定は、前記顔に包含する境界矩
    形の高さと幅によって、配置された顔の近似サイズを判
    定することを特徴とする請求項第1項に記載の方法。
  16. 【請求項16】 デジタル画像の自動分類方法であっ
    て、 人間の顔の存在するイメージを解析し、 前記画像のフレームに対する、配置された顔の位置を判
    定し、 前記画像のフレームに対する前記顔の相対位置に基づい
    て、前記画像を分類するステップを備えることを特徴と
    する方法。
  17. 【請求項17】 前記画像は、前記画像を撮像した撮影
    者の意図についての情報を提供するタームを用いて分類
    されることを特徴とする請求項第16項に記載の方法。
  18. 【請求項18】 前記画像は、前記配置された顔の位置
    が実質的に前記画像フレームの下端に向かっている場
    合、ハイショットとして分類されることを特徴とする請
    求項第16項または第17項に記載の方法。
  19. 【請求項19】 前記画像は、配置された顔の位置が実
    質的に前記画像のフレームの中心に実質的に一致する場
    合、目レベルショットとして分類されることを特徴とす
    る請求項第16項または第17項に記載の方法。
  20. 【請求項20】 前記画像は、配置された顔の位置が実
    質的に前記画像のフレームの上端に向かっている場合、
    ローショットとして分類されることを特徴とする請求項
    第16項または第17項に記載の方法。
  21. 【請求項21】 前記画像は、前記配置された顔の位置
    が実質的に前記画像のフレームの右手に向かっている場
    合、レフトショットとして分類されることを特徴とする
    請求項第16項または第17項に記載の方法。
  22. 【請求項22】 前記画像は、前記配置された顔の位置
    が実質的に前記画像のフレームの左手に向かっている場
    合、ライトショットとして分類されることを特徴とする
    請求項第16項または第17項に記載の方法。
  23. 【請求項23】 前記画像は、配置された顔の位置が実
    質的に前記画像のフレームの上端に向かっている場合、
    ローショットとして分類されることを特徴とする請求項
    第16項または第17項に記載の方法。
  24. 【請求項24】 前記解析は、前記画像に伴って供給さ
    れる情報を翻訳する工程を有することを特徴とする請求
    項第16項に記載の方法。
  25. 【請求項25】 前記画像は、画像のデジタルビデオシ
    ーケンスにおける或るフレームであることを特徴とする
    請求項第16項に記載の方法。
  26. 【請求項26】 前記情報は、前記シーケンスの他のフ
    レームと結びつけられることを特徴とする請求項第25
    項に記載の方法。
  27. 【請求項27】 更に、前記画像内のエッジを検出し、 前記エッジと前記画像フレームの軸の間の傾き角を判定
    し、 前記傾き角が、傾きについての所定角間にある場合に、
    ダッチショットとして分類するステップを有することを
    特徴とする請求項第1項に記載の方法。
  28. 【請求項28】 前記所定角は30°と60°であるこ
    とを特徴とする請求項第27項に記載の方法。
  29. 【請求項29】 更に、 所定の、人間ではない成分がある画像を解析し、 少なくとも1つの更なる基準に関して前記所定成分を評
    価することで、前記基準を満たし、前記所定成分の存在
    に基づいて前記画像を分類することを特徴とする請求項
    第16項に記載の方法。
  30. 【請求項30】 前記所定成分は、前記画像の識別可能
    な領域の色を含むことを特徴とする請求項29に記載の
    方法。
  31. 【請求項31】 前記基準は、前記画像内の前記所定成
    分の少なくとも相対的な動きを含むことを特徴とする請
    求項29に記載の方法。
  32. 【請求項32】 入力画像シーケンスの処理方法であっ
    て、 請求項1に記載の方法を用いて前記シーケンスの前記画
    像各々を分類する工程と、 前記分類を用いて前記シーケンスを編集し、出力画像シ
    ーケンスを形成する工程とを備えることを特徴とする方
    法。
  33. 【請求項33】 前記編集工程は、前記入力シーケンス
    の前記画像各々について編集機能を適用する工程を含
    み、前記画像のうち前記編集機能を満たさないものは前
    記出力シーケンスから割愛されることを特徴とする請求
    項31に記載の方法。
  34. 【請求項34】 前記編集工程は、前記シーケンスのた
    めの編集テンプレートをつくる工程を含み、前記編集機
    能の各々は、前記テンプレートの構成要素を形成し、か
    つ前記画像分類のひとつに対応することを特徴とする請
    求項34に記載の方法。
  35. 【請求項35】 前記編集機能は、画像に対して適用さ
    れる少なくともひとつの効果を含み、前記効果は可視的
    な効果及び可聴的な効果を含むグループから選択される
    ことを特徴とする請求項33に記載の方法。
  36. 【請求項36】 前記可視的効果は、再生速度のバリエ
    ーション、拡大/縮小、ぼかし、色のバリエーションを
    含むグループから選択されることを特徴とする請求項3
    5に記載の方法。
  37. 【請求項37】 デジタル画像の自動分類装置であっ
    て、 人の顔の存在について、前記画像を解析する解析手段
    と、 前記画像のサイズに関して、見出された顔のサイズを判
    定する判定手段と、 前記画像に関して前記見出された顔の相対サイズに基づ
    いて前記画像を分類する分類手段とを備えることを特徴
    とする装置。
  38. 【請求項38】 (i)前記画像は、前記見出された顔
    のサイズが実質的に前記画像のサイズよりも小さい場
    合、遠隔ショットに分類され、 (ii)前記画像は、前記見出された顔のサイズが実質
    的に前記画像のサイズに対応する場合、近接ショットに
    分類され、 (iii)前記画像は、前記見出された顔の一部のみが
    前記画像内に表れている場合、超近接ショットに分類さ
    れることを特徴とする請求項37に記載の装置。
  39. 【請求項39】 前記分類手段は、前記見出された顔の
    サイズを、人の顔の画像のサイズについての所定の閾値
    の集合と関連づけることを特徴とする請求項37に記載
    の装置。
  40. 【請求項40】 (i)前記画像は、前記画像がひとつ
    の顔を含み、その見出された顔のサイズが前記画像のサ
    イズと比較して第1の所定の閾値より下である場合、遠
    隔ショットに分類され、 (ii)前記画像は、前記見出された顔のサイズが前記
    画像のサイズと比較して第2の所定の閾値より上である
    場合、超近接ショットに分類され、 (iii)前記画像は、前記見出された顔のサイズが前
    記画像のサイズと比較して第2の所定の閾値より下であ
    り、かつ第3の所定の閾値よりも上である場合、近接シ
    ョットに分類され、 (iV)前記画像は、前記見出された顔のサイズが第1
    の所定の閾値より大きく、かつ第3の所定の閾値よりも
    小さい場合、中間ショットに分類されることを特徴とす
    る請求項39に記載の装置。
  41. 【請求項41】 前記解析手段は、前記画像により提供
    される情報を解釈する手段を含むことを特徴とする請求
    項37に記載の装置。
  42. 【請求項42】 前記画像は、デジタルビデオの画像シ
    ーケンスのフレームのひとつを含むことを特徴とする請
    求項41に記載の装置。
  43. 【請求項43】 前記解析手段は、前記顔を見いだすた
    めに、肌色の画素がおかれた、前記画像の1またはそれ
    以上の領域を検出することを特徴とする請求項41に記
    載の装置。
  44. 【請求項44】 前記判定手段は、前記見出された顔を
    囲む境界矩形の高さ及び幅により前記見出された顔のサ
    イズを概算することを特徴とする請求項43に記載の装
    置。
  45. 【請求項45】 デジタル画像の自動分類装置であっ
    て、 人の顔の存在について、前記画像を解析する解析手段
    と、 前記画像のフレームに関して、見出された顔の位置を判
    定する判定手段と、 前記画像フレームに関して、前記見出された顔の相対位
    置に基づいて前記画像を分類する分類手段とを備えるこ
    とを特徴とする装置。
  46. 【請求項46】 (i)前記画像は、前記見出された顔
    の位置が実質的に前記画像フレームの下近くにある場
    合、ハイショットに分類され、 (ii)前記画像は、前記見出された顔の位置が実質的
    に前記画像フレームの中央に対応する場合、アイレベル
    ショットに分類され、 (iii)前記画像は、前記見出された顔の位置が実質
    的に前記画像フレームの上近くにある場合、ロウショッ
    トに分類され、 (iV)前記画像は、前記見出された顔の位置が実質的
    に前記画像フレームの向かって右側にある場合、レフト
    ショットに分類され、 (V)前記画像は、前記見出された顔の位置が実質的に
    前記画像フレームの向かって左側にある場合、ライトシ
    ョットに分類され、 (Vi)前記画像は、前記見出された顔の位置が実質的
    に前記画像フレームの上近くにある場合、ロウショット
    に分類されることを特徴とする請求項45に記載の装
    置。
  47. 【請求項47】 前記解析手段は、前記画像により提供
    される情報を解釈する手段を含むことを特徴とする請求
    項46に記載の装置。
  48. 【請求項48】 前記画像は、デジタルビデオを画像シ
    ーケンスのフレームのひとつを含むことを特徴とする請
    求項46に記載の装置。
  49. 【請求項49】 前記情報は、前記シーケンスの他のフ
    レームに関連づけらていることを特徴とする請求項48
    に記載の装置。
  50. 【請求項50】 前記画像のエッジを検出する検出手段
    と、 前記エッジと前記画像フレームの軸の成す傾斜角を判定
    する判定手段と、 前記傾斜角が所定の傾斜角の間にある場合には、前記画
    像をダッチショットとして分類する分類手段とをさらに
    備えることを特徴とする請求項37に記載の装置。
  51. 【請求項51】 所定の人ではない成分の存在について
    画像を解析する解析手段と、 少なくともひとつの更なる基準に関して、所定の成分に
    アクセスする手段とをさらに備え、 前記基準は、前記所定の成分の存在に基づく前記画像の
    分類を満たすものであることを特徴とする請求項37に
    記載の装置。
  52. 【請求項52】 前記所定の成分は、前記画像の識別可
    能な領域の色を含むことを特徴とする請求項51に記載
    の装置。
  53. 【請求項53】 前記基準は、少なくとも、前記画像内
    における前記所定の成分の相対的な動きを含むことを特
    徴とする請求項51に記載の装置。
  54. 【請求項54】 画像シーケンスの処理装置であって、 前記シーケンスの前記画像各々についての分類を判定す
    る請求項37に記載の分類装置と、 前記分類を用いて前記シーケンスを編集し、出力画像シ
    ーケンスを形成する手段とを備えることを特徴とする装
    置。
  55. 【請求項55】 前記編集手段は、前記入力シーケンス
    の前記画像各々について編集機能の適用を含み、前記画
    像のうち前記編集機能を満たさないものは前記出力シー
    ケンスから割愛されることを特徴とする請求項54に記
    載の装置。
  56. 【請求項56】 前記編集手段は、前記シーケンスのた
    めの編集テンプレートをつくり、前記編集機能の各々
    は、前記テンプレートの構成要素を形成し、かつ前記画
    像分類のひとつに対応することを特徴とする請求項55
    に記載の装置。
  57. 【請求項57】 前記編集機能(edit function)は、 前記画像への応用のための少なくとも1つの効果(effec
    t)を備え、その効果は、視覚的な効果と音響的な効果と
    からなる前記グループから選択されることを特徴とする
    請求項56記載の装置。
  58. 【請求項58】 前記視覚的な効果は、再生速度のバリ
    エーション、ズーミング、ぼかし(blurring)、並びにカ
    ラーバリエーションからなる前記グループから選択され
    ることを特徴とする請求項57記載の装置。
  59. 【請求項59】 デジタル画像の自動化された分類(cla
    ssification)のためのコンピュータ装置を動作させるこ
    とが可能なコンピュータ・プログラム製品が格納された
    コンピュータ可読媒体であって、 人間の顔の存在のために前記画像を解析するためのコー
    ドと、 前記画像のサイズを考慮して、前記存在した顔のサイズ
    を判断するためのコードと、 前記画像のサイズを考慮された前記顔の相対的なサイズ
    に基づいて、前記画像を分類するためのコードと、を備
    えることを特徴とするコンピュータ可読媒体。
  60. 【請求項60】 (i)前記存在した顔のサイズが概ね
    前記画像のサイズ以下の場合に、前記画像は、遠隔撮影
    (far-shot)として分類され、 (ii)前記存在した顔のサイズが前記画像のサイズに概
    ね一致する場合に、前記画像は、クローズアップ(close
    -up)として分類され、 (iii)前記存在した顔の一部だけが前記画像内に現れ
    る場合に、前記画像は、極端なクローズアップ(extreme
    close-up)として分類されることを特徴とする請求項5
    9記載のコンピュータ可読媒体。
  61. 【請求項61】 前記分類では、前記存在した顔のサイ
    ズと、人間の顔画像のサイズのための1組の所定のしき
    い値との関連付けを行うことを特徴とする請求項60記
    載のコンピュータ可読媒体。
  62. 【請求項62】 (i)前記画像が顔を含み、且つ前記
    画像のサイズと比較して、前記存在した顔のサイズが第
    1の所定のしきい値より小さい場合に、前記画像は、遠
    隔撮影(far-shot)として分類され、 (ii)前記画像のサイズと比較して、前記存在した顔の
    サイズが第2の所定のしきい値より大きい場合に、前記
    画像は、極端なクローズアップとして分類され、 (iii)前記画像のサイズと比較して、前記存在した顔
    のサイズが前記第2の所定のしきい値より小さく、且つ
    第3の所定のしきい値より大きい場合に、前記画像は、
    クローズアップとして分類され、 (iv)前記存在した顔のサイズが前記第1の所定のしき
    い値以上であって、且つ前記第3の所定のしきい値より
    以下である場合に、前記画像は、中程度の撮影(medium
    shot)として分類されることを特徴とする請求項61記
    載のコンピュータ可読媒体。
  63. 【請求項63】 前記解析では、前記画像と共に与えら
    れる情報の補間を行うことを特徴とする請求項59記載
    のコンピュータ可読媒体。
  64. 【請求項64】 前記画像は、画像のデジタルビデオシ
    ーケンスのフレームを有することを特徴とする請求項6
    3記載のコンピュータ可読媒体。
  65. 【請求項65】 前記情報は、前記シーケンスの他のフ
    レームに関連付けされることを特徴とする請求項64記
    載のコンピュータ可読媒体。
  66. 【請求項66】 前記分類では、前記顔を存在させるべ
    く肌色化された画素が配置されたところの、前記画像の
    1つ或いはそれより多くの領域が検出されることを特徴
    とする請求項59記載のコンピュータ可読媒体。
  67. 【請求項67】 前記判断では、前記顔を取り囲む境界
    をなす長方形の高さ及び幅により、前記存在した顔の大
    まかなサイズを判断することを特徴とする請求項59記
    載のコンピュータ可読媒体。
  68. 【請求項68】 人間の顔の前記存在のために、前記画
    像を解析するためのコードと、 前記画像のフレームを考慮して、前記存在した顔の位置
    を判断するためのコードと、 前記画像フレームを考慮して、前記顔の相対的な位置に
    基づいて、前記画像を分類するためのコードと、 を更に備えることを特徴とする請求項59記載のコンピ
    ュータ可読媒体。
  69. 【請求項69】 (i)前記存在した顔の位置が、概ね
    前記画像フレームに面して下部である場合に、前記画像
    は、ハイ・ショット(high-shot)として分類され、 (ii)前記存在した顔の位置が、概ね前記画像フレーム
    の中央に位置する場合に、前記画像は、アイ・レベル・
    ショット(eye-level shot)として分類され、 (iii)前記存在した顔の位置が、前記画像フレームに
    面して概ね上部である場合に、前記画像は、ロー・ショ
    ット(low-shot)として分類され、 (iv)前記存在した顔の位置が、前記画像フレームに面
    して概ね右側に位置する場合に、前記画像は、レフト・
    ショット(left-shot)として分類され、 (V)前記存在した顔の位置が、前記画像フレームに面
    して概ね左側に位置する場合に、前記画像は、ライト・
    ショット(right-shot)として分類され、 (vi)前記存在した顔の位置が、前記画像フレームに面
    して概ね上部である場合に、前記画像は、ロー・ショッ
    ト(low-shot)として分類されることを特徴とする請求項
    68記載のコンピュータ可読媒体。
  70. 【請求項70】 前記解析では、前記画像と共に与えら
    れる情報の補間を行うことを特徴とする請求項69記載
    のコンピュータ可読媒体。
  71. 【請求項71】 前記画像は、画像のデジタルビデオシ
    ーケンスのフレームを有することを特徴とする請求項6
    9記載のコンピュータ可読媒体。
  72. 【請求項72】 前記情報は、前記シーケンスの他のフ
    レームに関連付けされることを特徴とする請求項71記
    載のコンピュータ可読媒体。
  73. 【請求項73】 前記画像内のエッジを検出するための
    コードと、 前記エッジと、前記画像フレームの軸との間の傾きがな
    す角を判断するためのコードと、 前記傾きがなす角が所定角度範囲の場合に、前記画像を
    ダッチ・ショット(Dutch shot)として分類するためのコ
    ードと、 を更に備えることを特徴とする請求項72記載のコンピ
    ュータ可読媒体。
  74. 【請求項74】 傾きの前記所定角度は30°乃至60
    °であることを特徴とする請求項73記載のコンピュー
    タ可読媒体。
  75. 【請求項75】 人間ではない所定の構成部分(compone
    nt)の存在のために前記画像を解析するためのコード
    と、 少なくとも1つの更なる基準(criteria)を考慮して、前
    記所定の構成部分を評価するためのコードとを更に備
    え、 前記基準は、前記所定の構成部分の存在に基づく前記画
    像の分類に合致することを特徴とする請求項74記載の
    コンピュータ可読媒体。
  76. 【請求項76】 前記所定の構成部分は、前記画像の異
    なった領域の色を有することを特徴とする請求項75記
    載のコンピュータ可読媒体。
  77. 【請求項77】 前記基準は、前記画像内の前記所定の
    構成部分の相対的な動きを少なくとも有することを特徴
    とする請求項76記載のコンピュータ可読媒体。
  78. 【請求項78】 画像の入力シーケンスを処理するため
    のコンピュータ・プログラム製品が格納されたコンピュ
    ータ可読媒体であって、 請求項77に記載のコンピュータ・プログラム製品を利
    用して、前記シーケンスの各画像を分類するためのコー
    ドと、 画像の出力シーケンスを形成すべく、前記分類を利用し
    て、前記シーケンスを編集するためのコードと、 を備えることを特徴とするコンピュータ可読媒体。
  79. 【請求項79】 前記編集では、前記入力シーケンスの
    前記各画像に対する編集機能が実施され、前記画像に関
    するそれら編集機能は、前記出力シーケンスから拒否さ
    れた前記編集機能を満足しないことを特徴とする請求項
    78記載のコンピュータ可読媒体。
  80. 【請求項80】 前記編集では、前記シーケンスのため
    の編集テンプレートを確立し、前記各編集機能は、前記
    テンプレートの構成部分を生成すると共に、前記画像分
    類の1つに対応することを特徴とする請求項79記載の
    コンピュータ可読媒体。
  81. 【請求項81】 前記編集機能は、前記画像に対する適
    用のための効果を少なくとも1つ有し、前記効果は、視
    覚的な効果と音響的な効果とからなる前記グループから
    選択されることを特徴とする請求項80記載のコンピュ
    ータ可読媒体。
  82. 【請求項82】 前記視覚的な効果は、再生速度のバリ
    エーション、ズーミング、ぼかし(blurring)、並びにカ
    ラーバリエーションからなる前記グループから選択され
    ることを特徴とする請求項81記載のコンピュータ可読
    媒体。
  83. 【請求項83】 前記請求項の何れかに記載の画像のシ
    リーズの実行によって生成されたことを特徴とする画像
    の編集されたシーケンス。
JP2000377686A 1999-12-14 2000-12-12 画像処理方法、画像処理装置、コンピュータ読み取り可能な記憶媒体 Expired - Fee Related JP4612772B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AU4640 1999-12-14
AUPQ4640A AUPQ464099A0 (en) 1999-12-14 1999-12-14 Emotive editing system

Publications (3)

Publication Number Publication Date
JP2001273505A true JP2001273505A (ja) 2001-10-05
JP2001273505A5 JP2001273505A5 (ja) 2010-04-15
JP4612772B2 JP4612772B2 (ja) 2011-01-12

Family

ID=3818781

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000377686A Expired - Fee Related JP4612772B2 (ja) 1999-12-14 2000-12-12 画像処理方法、画像処理装置、コンピュータ読み取り可能な記憶媒体

Country Status (3)

Country Link
US (1) US7606397B2 (ja)
JP (1) JP4612772B2 (ja)
AU (1) AUPQ464099A0 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2395853A (en) * 2002-11-29 2004-06-02 Sony Uk Ltd Association of metadata derived from facial images
WO2006025272A1 (ja) * 2004-09-01 2006-03-09 Nec Corporation 映像分類装置、映像分類プログラム、映像検索装置、および映像検索プログラム
JP2007206833A (ja) * 2006-01-31 2007-08-16 Toshiba Corp 生体照合方法および生体照合装置
JP2008084213A (ja) * 2006-09-28 2008-04-10 Sony Corp 画像処理装置、撮像装置、画像処理方法およびプログラム
JP2008227860A (ja) * 2007-03-12 2008-09-25 Matsushita Electric Ind Co Ltd コンテンツ撮影装置
JP2010244437A (ja) * 2009-04-08 2010-10-28 Sony Corp 画像処理装置、画像処理方法およびコンピュータプログラム
US7835551B2 (en) 2006-02-20 2010-11-16 Funai Electric Co., Ltd. Television set and authentication device
US9812173B2 (en) 2013-09-19 2017-11-07 Panasonic Intellectual Property Management Co., Ltd. Signal recording apparatus, camera recorder, and signal processing system
KR102095814B1 (ko) * 2018-10-22 2020-04-01 덕성여자대학교 산학협력단 샷 사이즈 변화패턴을 이용한 영상 데이터 분석 시스템 및 방법
KR20200105004A (ko) * 2019-02-28 2020-09-07 현대모비스 주식회사 자동 영상 합성 장치 및 방법

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPQ464099A0 (en) * 1999-12-14 2000-01-13 Canon Kabushiki Kaisha Emotive editing system
GB2370709A (en) * 2000-12-28 2002-07-03 Nokia Mobile Phones Ltd Displaying an image and associated visual effect
US20030133017A1 (en) * 2002-01-16 2003-07-17 Eastman Kodak Company Method for capturing metadata in a captured image
US7287222B2 (en) * 2002-01-31 2007-10-23 Canon Kabushiki Kaisha Information processing apparatus and method that determines effectiveness of metadata for editing information content
US7199805B1 (en) 2002-05-28 2007-04-03 Apple Computer, Inc. Method and apparatus for titling
US20040006567A1 (en) * 2002-07-02 2004-01-08 International Business Machines Corporation Decision support system using narratives for detecting patterns
GB2395781A (en) * 2002-11-29 2004-06-02 Sony Uk Ltd Face detection
JP3984175B2 (ja) * 2003-01-31 2007-10-03 富士フイルム株式会社 写真画像選別装置およびプログラム
US7620218B2 (en) * 2006-08-11 2009-11-17 Fotonation Ireland Limited Real-time face tracking with reference images
US7468735B2 (en) * 2003-07-24 2008-12-23 Sony Corporation Transitioning between two high resolution images in a slideshow
JP2007504697A (ja) * 2003-08-29 2007-03-01 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザプロフィールによるコンテンツ情報のレンダリングの制御
JP4428159B2 (ja) * 2003-11-05 2010-03-10 セイコーエプソン株式会社 画像データ生成装置、画質補正装置、画像データ生成方法および画質補正方法
US7555165B2 (en) * 2003-11-13 2009-06-30 Eastman Kodak Company Method for semantic scene classification using camera metadata and content-based cues
US7680340B2 (en) * 2003-11-13 2010-03-16 Eastman Kodak Company Method of using temporal context for image classification
US20050117798A1 (en) * 2003-12-02 2005-06-02 Eastman Kodak Company Method and apparatus for modifying a portion of an image frame in accordance with colorimetric parameters
US7705859B2 (en) * 2003-12-03 2010-04-27 Sony Corporation Transitioning between two high resolution video sources
WO2005091622A1 (en) * 2004-03-18 2005-09-29 Thomson Licensing Sa Device for capturing audio/video data and metadata
FR2875662A1 (fr) * 2004-09-17 2006-03-24 Thomson Licensing Sa Procede de visualisation de document audiovisuels au niveau d'un recepteur, et recepteur apte a les visualiser
JP4228320B2 (ja) * 2006-09-11 2009-02-25 ソニー株式会社 画像処理装置および方法、並びにプログラム
KR100828371B1 (ko) * 2006-10-27 2008-05-08 삼성전자주식회사 컨텐츠의 메타 데이터 생성 방법 및 장치
US20080159627A1 (en) * 2006-12-27 2008-07-03 Yahoo! Inc. Part-based pornography detection
WO2008111308A1 (ja) * 2007-03-12 2008-09-18 Panasonic Corporation コンテンツ撮影装置
JP4424389B2 (ja) * 2007-08-24 2010-03-03 ソニー株式会社 動画作成装置、動画作成方法、およびプログラム
JP5083090B2 (ja) * 2007-09-18 2012-11-28 ソニー株式会社 表示制御装置、撮像装置、表示制御方法およびプログラム
JP4929215B2 (ja) * 2008-03-27 2012-05-09 キヤノン株式会社 画像処理装置及び画像処理装置の制御方法
JP2011087183A (ja) * 2009-10-16 2011-04-28 Olympus Imaging Corp 撮影装置、画像処理装置、およびプログラム
JP5434569B2 (ja) * 2009-12-22 2014-03-05 ソニー株式会社 情報処理装置および方法、並びにプログラム
US8631047B2 (en) 2010-06-15 2014-01-14 Apple Inc. Editing 3D video
US8910046B2 (en) 2010-07-15 2014-12-09 Apple Inc. Media-editing application with anchored timeline
WO2012030869A2 (en) 2010-08-30 2012-03-08 Apple Inc. Multi-image face-based image processing
US8726161B2 (en) * 2010-10-19 2014-05-13 Apple Inc. Visual presentation composition
TW201227367A (en) * 2010-12-31 2012-07-01 Altek Corp Image management method of digital photography device
US8954477B2 (en) 2011-01-28 2015-02-10 Apple Inc. Data structures for a media-editing application
US8745499B2 (en) 2011-01-28 2014-06-03 Apple Inc. Timeline search and index
US9997196B2 (en) 2011-02-16 2018-06-12 Apple Inc. Retiming media presentations
US11747972B2 (en) 2011-02-16 2023-09-05 Apple Inc. Media-editing application with novel editing tools
JP5273208B2 (ja) * 2011-06-07 2013-08-28 オムロン株式会社 画像処理装置、画像処理方法、および制御プログラム
US9536564B2 (en) 2011-09-20 2017-01-03 Apple Inc. Role-facilitated editing operations
US9437247B2 (en) 2011-11-14 2016-09-06 Apple Inc. Preview display for multi-camera media clips
CN107005676A (zh) * 2014-12-15 2017-08-01 索尼公司 信息处理方法、影像处理装置和程序
KR102306538B1 (ko) 2015-01-20 2021-09-29 삼성전자주식회사 콘텐트 편집 장치 및 방법
TWI549499B (zh) * 2015-02-17 2016-09-11 Zan Quan Technology Co Ltd A system for automatically recording motion data and a method thereof
US10178341B2 (en) * 2016-03-01 2019-01-08 DISH Technologies L.L.C. Network-based event recording
US9905267B1 (en) * 2016-07-13 2018-02-27 Gracenote, Inc. Computing system with DVE template selection and video content item generation feature
KR20180028782A (ko) * 2016-09-09 2018-03-19 삼성전자주식회사 전자 장치 및 그 제어 방법
US10679669B2 (en) * 2017-01-18 2020-06-09 Microsoft Technology Licensing, Llc Automatic narration of signal segment
CN109165557A (zh) * 2018-07-25 2019-01-08 曹清 景别判断系统及景别判断方法
US10769543B2 (en) * 2018-08-01 2020-09-08 Forcepoint Llc Double-layered image classification endpoint solution
KR102605070B1 (ko) * 2020-07-06 2023-11-24 한국전자통신연구원 인식 모델 학습 장치, 촬영본 영상 분석 장치 및 촬영본 검색 서비스 제공 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07306483A (ja) * 1994-05-12 1995-11-21 Fuji Photo Film Co Ltd 撮影画面の顔領域検出方法
JPH10162020A (ja) * 1996-12-03 1998-06-19 Ricoh Co Ltd 画像データベースのブラウジング方法
JPH11239269A (ja) * 1998-02-23 1999-08-31 Fuji Photo Film Co Ltd 画像処理方法
JPH11265396A (ja) * 1998-03-18 1999-09-28 Nippon Telegr & Teleph Corp <Ntt> 音楽映像分類方法、装置および音楽映像分類プログラムを記録した記録媒体

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2701724B2 (ja) * 1993-12-28 1998-01-21 日本電気株式会社 シナリオ編集装置
US5642431A (en) 1995-06-07 1997-06-24 Massachusetts Institute Of Technology Network-based system and method for detection of faces and the like
US5850470A (en) * 1995-08-30 1998-12-15 Siemens Corporate Research, Inc. Neural network for locating and recognizing a deformable object
JPH0981309A (ja) * 1995-09-13 1997-03-28 Toshiba Corp 入力装置
US5969716A (en) * 1996-08-06 1999-10-19 Interval Research Corporation Time-based media processing system
US20020120925A1 (en) * 2000-03-28 2002-08-29 Logan James D. Audio and video program recording, editing and playback systems using metadata
JP3192663B2 (ja) * 1997-07-11 2001-07-30 三菱電機株式会社 動画収集装置
US6188777B1 (en) * 1997-08-01 2001-02-13 Interval Research Corporation Method and apparatus for personnel detection and tracking
US6686918B1 (en) * 1997-08-01 2004-02-03 Avid Technology, Inc. Method and system for editing or modifying 3D animations in a non-linear editing environment
JPH1191169A (ja) * 1997-09-19 1999-04-06 Fuji Photo Film Co Ltd 画像処理装置
US6118887A (en) * 1997-10-10 2000-09-12 At&T Corp. Robust multi-modal method for recognizing objects
US6324545B1 (en) * 1997-10-15 2001-11-27 Colordesk Ltd. Personalized photo album
US6173069B1 (en) * 1998-01-09 2001-01-09 Sharp Laboratories Of America, Inc. Method for adapting quantization in video coding using face detection and visual eccentricity weighting
US6593956B1 (en) * 1998-05-15 2003-07-15 Polycom, Inc. Locating an audio source
US6631208B1 (en) * 1998-05-29 2003-10-07 Fuji Photo Film Co., Ltd. Image processing method
US6535639B1 (en) * 1999-03-12 2003-03-18 Fuji Xerox Co., Ltd. Automatic video summarization using a measure of shot importance and a frame-packing method
US7554542B1 (en) * 1999-11-16 2009-06-30 Possible Worlds, Inc. Image manipulation method and system
US6549643B1 (en) * 1999-11-30 2003-04-15 Siemens Corporate Research, Inc. System and method for selecting key-frames of video data
US6754389B1 (en) * 1999-12-01 2004-06-22 Koninklijke Philips Electronics N.V. Program classification using object tracking
AUPQ464099A0 (en) * 1999-12-14 2000-01-13 Canon Kabushiki Kaisha Emotive editing system
US6671405B1 (en) * 1999-12-14 2003-12-30 Eastman Kodak Company Method for automatic assessment of emphasis and appeal in consumer images
US6748097B1 (en) * 2000-06-23 2004-06-08 Eastman Kodak Company Method for varying the number, size, and magnification of photographic prints based on image emphasis and appeal
US6738494B1 (en) * 2000-06-23 2004-05-18 Eastman Kodak Company Method for varying an image processing path based on image emphasis and appeal
US7034848B2 (en) * 2001-01-05 2006-04-25 Hewlett-Packard Development Company, L.P. System and method for automatically cropping graphical images
US20030161506A1 (en) * 2002-02-25 2003-08-28 Eastman Kodak Company Face detection computer program product for redeye correction
WO2003101097A1 (en) * 2002-05-28 2003-12-04 Yesvideo, Inc. Summarization of a visual recording
AU2003265318A1 (en) * 2002-08-02 2004-02-23 University Of Rochester Automatic soccer video analysis and summarization
US20040207743A1 (en) * 2003-04-15 2004-10-21 Nikon Corporation Digital camera system
JP4844053B2 (ja) * 2005-08-31 2011-12-21 セイコーエプソン株式会社 画像選択装置および画像選択方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07306483A (ja) * 1994-05-12 1995-11-21 Fuji Photo Film Co Ltd 撮影画面の顔領域検出方法
JPH10162020A (ja) * 1996-12-03 1998-06-19 Ricoh Co Ltd 画像データベースのブラウジング方法
JPH11239269A (ja) * 1998-02-23 1999-08-31 Fuji Photo Film Co Ltd 画像処理方法
JPH11265396A (ja) * 1998-03-18 1999-09-28 Nippon Telegr & Teleph Corp <Ntt> 音楽映像分類方法、装置および音楽映像分類プログラムを記録した記録媒体

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2395853A (en) * 2002-11-29 2004-06-02 Sony Uk Ltd Association of metadata derived from facial images
JP4973188B2 (ja) * 2004-09-01 2012-07-11 日本電気株式会社 映像分類装置、映像分類プログラム、映像検索装置、および映像検索プログラム
WO2006025272A1 (ja) * 2004-09-01 2006-03-09 Nec Corporation 映像分類装置、映像分類プログラム、映像検索装置、および映像検索プログラム
JPWO2006025272A1 (ja) * 2004-09-01 2008-07-31 日本電気株式会社 映像分類装置、映像分類プログラム、映像検索装置、および映像検索プログラム
JP2007206833A (ja) * 2006-01-31 2007-08-16 Toshiba Corp 生体照合方法および生体照合装置
US7835551B2 (en) 2006-02-20 2010-11-16 Funai Electric Co., Ltd. Television set and authentication device
JP2008084213A (ja) * 2006-09-28 2008-04-10 Sony Corp 画像処理装置、撮像装置、画像処理方法およびプログラム
JP2008227860A (ja) * 2007-03-12 2008-09-25 Matsushita Electric Ind Co Ltd コンテンツ撮影装置
JP2010244437A (ja) * 2009-04-08 2010-10-28 Sony Corp 画像処理装置、画像処理方法およびコンピュータプログラム
US9812173B2 (en) 2013-09-19 2017-11-07 Panasonic Intellectual Property Management Co., Ltd. Signal recording apparatus, camera recorder, and signal processing system
KR102095814B1 (ko) * 2018-10-22 2020-04-01 덕성여자대학교 산학협력단 샷 사이즈 변화패턴을 이용한 영상 데이터 분석 시스템 및 방법
KR20200105004A (ko) * 2019-02-28 2020-09-07 현대모비스 주식회사 자동 영상 합성 장치 및 방법
KR102190527B1 (ko) 2019-02-28 2020-12-14 현대모비스 주식회사 자동 영상 합성 장치 및 방법

Also Published As

Publication number Publication date
JP4612772B2 (ja) 2011-01-12
AUPQ464099A0 (en) 2000-01-13
US7606397B2 (en) 2009-10-20
US20030002715A1 (en) 2003-01-02

Similar Documents

Publication Publication Date Title
JP4612772B2 (ja) 画像処理方法、画像処理装置、コンピュータ読み取り可能な記憶媒体
US10706892B2 (en) Method and apparatus for finding and using video portions that are relevant to adjacent still images
US8692940B2 (en) Method for producing a blended video sequence
US8548249B2 (en) Information processing apparatus, information processing method, and program
Luo et al. Towards extracting semantically meaningful key frames from personal video clips: from humans to computers
US7904815B2 (en) Content-based dynamic photo-to-video methods and apparatuses
Walsh et al. Using digital video in field-based research with children: A primer
JP3708854B2 (ja) メディア作品制作支援装置及びプログラム
Zhang et al. Boosting-based multimodal speaker detection for distributed meeting videos
Stoll et al. Automatic camera selection, shot size and video editing in theater multi-camera recordings
Fassold et al. Towards automatic cinematography and annotation for 360° video
JP2010232813A (ja) 映像編集プログラムおよび映像編集装置
WO2013187796A1 (ru) Способ автоматического монтажа цифровых видеофайлов
US20220207851A1 (en) System and method for automatic video reconstruction with dynamic point of interest
WO2022145929A1 (en) System and method for automatic video reconstruction with dynamic point of interest
AU762419B2 (en) Visual language classification system
Wang et al. Lecture video enhancement and editing by integrating posture, gesture, and text
CN111800663B (zh) 一种视频合成方法及装置
Wohl Editing techniques with final cut pro
Rubin Constraint-based cinematic editing
WO2012153747A1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
US11837258B2 (en) Scene-creation using high-resolution video perspective manipulation and editing techniques
JP6830634B1 (ja) 情報処理方法、情報処理装置及びコンピュータプログラム
Adams et al. Weaving stories in digital media: when Spielberg makes home movies
Concepcion Video Storytelling Projects: A DIY Guide to Shooting, Editing and Producing Amazing Video Stories on the Go

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071212

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071212

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071212

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100303

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100716

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101008

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101016

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131022

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees