JP2016140029A - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP2016140029A
JP2016140029A JP2015015418A JP2015015418A JP2016140029A JP 2016140029 A JP2016140029 A JP 2016140029A JP 2015015418 A JP2015015418 A JP 2015015418A JP 2015015418 A JP2015015418 A JP 2015015418A JP 2016140029 A JP2016140029 A JP 2016140029A
Authority
JP
Japan
Prior art keywords
image
selection
unit
representative
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015015418A
Other languages
English (en)
Other versions
JP6063971B2 (ja
Inventor
貴紀 白石
Takanori Shiraishi
貴紀 白石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2015015418A priority Critical patent/JP6063971B2/ja
Priority to CN201610041865.1A priority patent/CN105847622B/zh
Priority to US15/010,283 priority patent/US9774758B2/en
Publication of JP2016140029A publication Critical patent/JP2016140029A/ja
Application granted granted Critical
Publication of JP6063971B2 publication Critical patent/JP6063971B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00132Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
    • H04N1/00167Processing or editing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • H04N1/00442Simultaneous viewing of a plurality of images, e.g. using a mosaic display arrangement of thumbnails
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40068Modification of image resolution, i.e. determining the values of picture elements at new relative positions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00132Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture in a digital photofinishing system, i.e. a system where digital photographic images undergo typical photofinishing processing, e.g. printing ordering
    • H04N1/00169Digital image input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00249Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a photographic apparatus, e.g. a photographic printer or a projector
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • H04N1/00461Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet marking or otherwise tagging one or more displayed image, e.g. for selective reproduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Television Signal Processing For Recording (AREA)
  • Image Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)

Abstract

【課題】ユーザーが意図した動画の特徴的な内容を表す画像を動画データから容易に抽出して出力する。
【解決手段】画像処理装置に、動画データの入力を受け付ける動画受付部と、受け付けられた動画データにおいて音声の音量が直前のサンプル点の音声の音量に対して基準音量差以上増大する一以上のサンプル点を基準サンプル点として検出する検出部と、基準サンプル点のそれぞれについて当該基準サンプル点に対応する基準画像を含む時系列に並んだ所定数の画像を当該基準サンプル点に対応するシーンを構成するフレーム画像として動画データから抽出する画像抽出部と、抽出された各シーンを構成するフレーム画像が一覧表示された操作画面を生成する画面生成部と、操作画面においてフレーム画像の中からシーンを代表する代表画像の選択を受け付ける選択受付部と、代表画像を出力する画像出力部と、を備える。
【選択図】図1

Description

本発明は、画像処理装置に関し、特に、動画の特徴的な内容を表す画像を出力する技術に関する。
従来から、例えば下記特許文献1乃至3に記載されているように、動画データから動画の特徴的な内容を表す代表画像を抽出し、当該抽出した代表画像をディスプレイに表示する、或いは、印刷する等して出力する技術が知られている。
特開2004−229160号公報 特開2004−248312号公報 特開2001−265378号公報
しかし、上記従来の技術では、動画データが表す動画の音声の音量や被写体の動きの変化量等、動画データから検出可能な所定の特徴量に基づき、特徴が見られると判断された時点の画像を代表画像として抽出する、或いは、一定時間おきに画像を代表画像として抽出する等して、自動的に代表画像が抽出されていた。
このため、ユーザーが、例えばスポーツ観戦時に撮影した動画から歓声が起こる直前の緊迫したシーン等、音量や被写体の動きに特徴が見られる前後のシーンの画像を代表画像として抽出することを望んでも、所望の画像が代表画像として抽出されない虞があった。
そこで、ディスプレイ等に動画を表示しながら、ユーザーに所望の画像を代表画像として随時抽出させる操作を行わせることが考えられる。しかし、この場合、代表画像を抽出するのに時間を要することとなり、ユーザーは当該操作を行う手間に煩わしさを感じる虞があった。
本発明は、上記の問題を解決するためになされたものであり、ユーザーが意図した、動画の特徴的な内容を表す画像を、動画データから容易に抽出して出力することができる画像処理装置を提供することを目的とする。
本発明による画像処理装置は、時系列に並べられた複数の画像を示す画像データ及び前記複数の画像に対応する複数の音声を示す音声データを含む動画データの入力を受け付ける動画受付部と、前記動画受付部により受け付けられた前記動画データである受付動画データにおいて、前記音声の音量が直前のサンプル点に対応する前記音声の音量に対して所定の基準音量差以上増大する一以上のサンプル点を基準サンプル点として検出する検出部と、前記検出部により検出された前記基準サンプル点のそれぞれについて、当該基準サンプル点に対応する基準画像を含む時系列に並んだ所定のサンプル数分の画像を、当該基準サンプル点に対応するシーンを構成するフレーム画像として、前記受付動画データから抽出する画像抽出部と、各前記シーンにおいて、前記画像抽出部により抽出された当該各シーンを構成するフレーム画像が一覧表示された操作画面を生成する画面生成部と、前記画面生成部により生成された前記操作画面において、一覧表示されている前記フレーム画像の中から前記シーンを代表する代表画像の選択を受け付ける選択受付部と、前記選択受付部により受け付けられた前記代表画像を出力する画像出力部と、を備える。
本構成によれば、受付動画データにおいて、音声の音量が直前のサンプル点に対応する音声の音量に対して所定の基準音量差以上増大している、音量変化に特徴が見られる一以上の基準サンプル点が検出される。また、各基準サンプル点に対応する基準画像を含む時系列に並んだ所定のサンプル数分の画像が、当該各基準サンプル点に対応する各シーンを構成するフレーム画像として抽出される。
つまり、本構成によれば、受付動画データが表す動画の特徴的な内容を表していると考えられる、音量変化に特徴が見られる一以上のシーンを、ユーザーに手間をかけさせることなく、自動的に検出することができる。また、当該検出した各シーンに対応する時系列に並んだ所定のサンプル数分の画像を、当該各シーンを構成するフレーム画像として、ユーザーに手間をかけさせることなく、自動的に抽出することができる。
そして、ユーザーは、当該抽出された各フレーム画像が一覧表示された操作画面を用いて、当該各フレーム画像の中から意図した画像を各シーンを代表する代表画像として選択し、当該選択した各代表画像を出力することができる。
このように、本構成によれば、ユーザーが意図した、動画の特徴的な内容を表す画像を、受付動画データから容易に抽出して出力することができる。
また、ユーザーによる前記基準音量差の入力を受け付ける第一受付部を更に備えてもよい。
本構成によれば、受付動画データが表す動画が全体的に音量変化が小さい動画であったとしても、ユーザーは、入力する基準音量差を小さくすることにより、検出部に基準サンプル点を検出させることができる。反対に、受付動画データが表す動画が全体的に音量変化が大きい動画であったとしても、ユーザーは、入力する基準音量差を大きくすることにより、検出部によって不要に多くの基準サンプル点が検出される虞を低減することができる。
このようにして、ユーザーは、入力する基準音量差を調整することにより、検出部によって検出される基準サンプル点の数を調整することができる。これにより、ユーザーは、各基準サンプル点に対応する各シーンを代表する代表画像の選択に用いる操作画面の数を調整することができ、選択する代表画像の数を調整することができる。
また、前記画像抽出部は、前記基準サンプル点から所定の基準時間おきに過去に遡ったサンプル点に対応する画像及び/又は前記基準サンプル点から前記基準時間おきに未来に進んだサンプル点に対応する画像を、前記フレーム画像として抽出してもよい。
本構成によれば、基準サンプル点よりも過去及び/又は未来へ所定の基準時間おきに離れたサンプル点に対応する画像が各フレーム画像に含まれる。このため、ユーザーは、各フレーム画像に含まれる基準時間おきに時系列に連続する画像の中から代表画像としての画像を選択する場合に、基準サンプル点との相対的な時間を意識しながら意図した画像を選択することができる。
また、ユーザーによる前記基準時間の入力を受け付ける第二受付部を更に備えてもよい。
本構成によれば、ユーザーは、入力する基準時間を小さくすることにより、基準サンプル点に時間的に近いサンプル点に対応する画像をフレーム画像に含めることができる。また、ユーザーは、入力する基準時間を大きくすることにより、基準サンプル点から時間的に離れたサンプル点に対応する画像をフレーム画像に含めることができる。このようにして、ユーザーは、入力する基準時間を調整することにより、フレーム画像に含める画像を調整することができる。
また、ユーザーによる前記サンプル数の入力を受け付ける第三受付部を更に備えてもよい。
本構成によれば、ユーザーは、入力するサンプル数を調整することにより、フレーム画像に含まれる画像の数を調整することができる。このため、ユーザーは、入力するサンプル数を小さくすることにより、フレーム画像に含める画像の数を少なくし、効率よく代表画像を選択することができる。これとは反対に、ユーザーは、入力するサンプル数を大きくすることにより、フレーム画像に含める画像の数を多くし、意図したものに近い代表画像を選択する可能性を高めることできる。
また、ユーザーによる開始時刻及び終了時刻の入力を受け付ける第四受付部を更に備え、前記検出部は、前記受付動画データのうち、前記第四受付部により受け付けられた前記開始時刻から前記第四受付部により受け付けられた前記終了時刻までの期間に対応する前記動画データにおいて、前記基準サンプル点を検出してもよい。
本構成によれば、ユーザーは、受付動画データが表す動画において、予め音量変化が大きい時間帯を知っている場合、当該時間帯の開始時刻と終了時刻とを入力することにより、検出部によって基準サンプル点を効率よく検出させることができる。
また、前記検出部は、検出した前記基準サンプル点の数が所定の制限数になる度に、前記基準サンプル点の検出を中断し、以降の前記基準サンプル点の検出を再開するか否かをユーザーに選択させ、前記基準サンプル点の検出を再開することが選択されたときは、以降の前記基準サンプル点の検出を再開する一方、前記基準サンプル点の検出を再開しないことが選択されたときは、前記基準サンプル点の検出を終了してもよい。
本構成によれば、ユーザーは、検出部により検出された基準サンプル点の数が所定の制限数になる度に、検出部による基準サンプル点の検出を継続させるか否かを選択することができる。このため、ユーザーは、検出部が制限なく基準サンプル点を検出し続けることにより、代表画像の数が不要に増大する虞を低減することができる。
また、前記操作画面は、前記代表画像を選択しないことを指示する非選択指示が入力可能であり、前記選択受付部は、前記操作画面において前記非選択指示が入力された場合、当該操作画面に対応する前記シーンを代表する前記代表画像の選択を受け付けないようにしてもよい。
本構成によれば、ユーザーは、フレーム画像の中に代表画像として選択したい画像が存在しない場合に、非選択指示を入力することにより、意図しない代表画像を選択することを回避することができる。
また、前記画像出力部は、前記選択受付部により受け付けられた各前記代表画像を所定のレイアウトで配置して出力してもよい。
本構成によれば、各代表画像が所定のレイアウトで配置して出力されるので、ユーザーは出力された各代表画像を視認しやすくなる。
また、ユーザーによる前記レイアウトの入力を受け付ける配置受付部を更に備えてもよい。
本構成によれば、ユーザーは、意図したレイアウトを入力することにより、各代表画像を意図したレイアウトで配置して出力することができる。
また、前記選択受付部により受け付けられた各前記代表画像の中から、個別に出力する対象の前記代表画像の選択を受け付ける画像受付部を更に備え、前記画像出力部は、前記画像受付部により受け付けられた前記代表画像を個別に出力してもよい。
本構成によれば、ユーザーは、選択受付部により受け付けられた各代表画像の中に個別に出力したい代表画像が含まれている場合に、当該代表画像を個別に出力する対象として選択し、当該代表画像を個別に出力することができる。
また、前記画像出力部は、前記代表画像のサイズを所定の出力サイズに変換して出力してもよい。
本構成によれば、複数の代表画像が出力された場合に、各代表画像のサイズが所定の出力サイズに揃っているので、ユーザーは当該複数の代表画像を視認しやすくなる。
画像の解像度と、当該解像度の画像を出力するときに最適な画像のサイズである最適サイズと、を予め対応付けて記憶するサイズ記憶部を更に備え、前記出力サイズは、前記代表画像の解像度と対応付けて前記サイズ記憶部に記憶されている前記最適サイズに定められていてもよい。
本構成によれば、代表画像が最適なサイズで出力されるので、ユーザーは代表画像を視認しやすくなる。
前記代表画像を出力するときの所望のサイズの入力を受け付けるサイズ受付部を更に備え、前記画像出力部は、前記サイズ受付部により受け付けられた前記所望のサイズを前記出力サイズとしてもよい。
本構成によれば、ユーザーは、入力するサイズを調整することにより、画像出力部によって出力される各代表画像のサイズを意図したサイズに調整することができる。
前記操作画面は、当該操作画面に対応する前記シーンを表す文字列であるシーン文字列の入力欄を備え、前記画像出力部は、前記シーンを代表する前記代表画像と、当該シーンに対応する前記操作画面の前記入力欄に入力された前記シーン文字列と、を対応付けて出力してもよい。
本構成によれば、シーンを代表する代表画像と、操作画面の入力欄に入力された当該シーンを表す文字列と、が対応付けて出力される。このため、ユーザーは、代表画像に対応するシーンの特徴を明確に表すような文字列を操作画面の入力欄に入力することにより、代表画像だけを出力する場合に比して、代表画像に対応するシーンの特徴をより明確にして出力することができる。
前記検出部により検出された前記基準サンプル点のそれぞれについて、当該基準サンプル点に対応する基準音声を含む時系列に連続する所定数分の音声を、当該基準サンプル点に対応する前記シーンを代表する代表音声として、前記受付動画データから抽出する音声抽出部と、前記音声抽出部により抽出された各前記代表音声に対して所定の音声認識処理を行うことにより認識した文字列を、当該各代表音声に対応する前記シーンに対応する前記操作画面の前記入力欄に入力する文字列認識部を更に備えてもよい。
本構成によれば、シーンを代表する代表画像と対応付けて出力されるシーン文字列が、文字列認識部によって、当該シーンに対応する操作画面の入力欄に自動的に入力される。このため、ユーザーが操作画面の入力欄にシーン文字列を入力する手間を軽減することができる。
前記画像出力部が、前記シーンを代表する前記代表画像と、当該シーンに対応する前記シーン文字列とを対応付けて出力するときの、当該代表画像に対する当該シーン文字列の相対的な出力位置の入力をユーザーから受け付ける位置受付部を更に備えてもよい。
本構成によれば、ユーザーは、意図した出力位置を入力することにより、シーン文字列を意図した位置に出力することができる。これにより、ユーザーは、シーン文字列の代表画像に対する相対的な出力位置が固定されている場合に比して、代表画像及びシーン文字列の見易さを向上することができる。
前記相対的な出力位置には、前記代表画像と重なる位置が含まれてもよい。
本構成によれば、シーン文字列を代表画像に重ねて出力することができる。この場合、代表画像とシーン文字列とによって占有されるスペースを軽減することができる。
前記選択受付部により受け付けられた各前記代表画像の中から、変更する対象の前記代表画像の選択を受け付ける変更受付部を更に備え、前記選択受付部は、前記変更受付部により前記変更する対象の前記代表画像が受け付けられた場合、当該変更する対象の前記代表画像の選択に用いた前記操作画面において、一覧表示されている前記フレーム画像の中から前記代表画像の再選択を受け付けてもよい。
本構成によれば、ユーザーは、代表画像を誤って選択した場合であっても、当該代表画像の選択に用いた操作画面において代表画像を再選択することができ、当該誤って選択した代表画像を意図した代表画像に変更することができる。
用紙に形成された画像を読み取る画像読取部と、前記選択受付部により受け付けられた各前記代表画像のうち何れかの前記代表画像を変更する変更指示の入力を受け付ける変更指示受付部と、前記変更指示受付部により前記変更指示が受け付けられた場合、前記選択受付部により受け付けられた各前記代表画像と、所定の選択マークを書き込み可能な選択欄と、当該各代表画像の選択に用いた前記操作画面の識別情報と、を対応付けた選択リスト画像が形成された用紙である選択用紙を出力する選択用紙出力部と、を備え、前記選択受付部は、前記選択用紙に形成された前記選択リスト画像が前記画像読取部によって読み取られた場合に、当該選択リスト画像に前記選択マークが書き込まれた前記選択欄が存在するときは、当該選択リスト画像において当該選択欄と対応付けられている前記識別情報によって識別される前記操作画面において、一覧表示されている前記フレーム画像の中から前記代表画像の再選択を受け付けるようにしてもよい。
本構成によれば、ユーザーは、変更指示を入力して選択用紙を出力させた後、都合のよいときに当該選択用紙において変更する対象の代表画像に対応する選択欄に選択マークを書き込むことができる。そして、ユーザーは、都合の良いときに当該選択用紙に形成されている選択リスト画像を画像読取部により読み取らせ、当該変更する対象の代表画像を意図した代表画像に変更することができる。
この発明によれば、ユーザーが意図した、動画の特徴的な内容を表す画像を、動画データから容易に抽出して出力することができる画像処理装置を提供することができる。
本発明の一実施形態に係る画像処理装置の電気的構成を示すブロック図である。 本発明の一実施形態に係る動画データの概略構成図である。 条件設定画面の一例を示す図である。 本発明の一実施形態に係る操作画面の一例を示す図である。 代表画像を生成する動作を示すフローチャートである。 代表画像を出力する動作を示すフローチャートである。 出力条件設定画面の一例を示す図である。 本発明の一実施形態に係るサイズ記憶部に記憶されている最適サイズの一例を示す図である。 (A)は、予め定められた出力条件を用いた場合のプレビュー画面の一例を示す図である。(B)は、レイアウトと相対出力位置を変更した場合のプレビュー画面の一例を示す図である。(C)は、出力サイズを変更した場合のプレビュー画面の一例を示す図である。(D)は、相対出力位置を変更した場合のプレビュー画面の一例を示す図である。 個別印刷出力画面の一例を示す図である。 代表画像を変更する動作を示すフローチャートである。 変更対象選択画面の一例を示す図である。 本発明の一実施形態に係る選択用紙の一例を示す図である。 選択用紙を用いて代表画像を変更する動作を示すフローチャートである。
以下、本発明に係る画像処理装置の一実施形態を図面に基づいて説明する。尚、本実施形態では、画像処理装置として複合機を例に説明するが、これに限定する趣旨ではなく、画像処理装置は、例えば、スキャナー又は複写機であってもよい。
図1は、複合機1の電気的構成を示すブロック図である。図1に示すように、複合機1は、画像読取部31と、画像形成部32と、操作部33と、記憶部34(サイズ記憶部)と、通信部35と、外部インターフェイス部36と、制御部10と、を備えている。
画像読取部31は、CCD(Charge Coupled Device)ラインセンサーや露光ランプ等を有する不図示の光学系ユニットを備えている。画像読取部31は、制御部10による制御の下、光学系ユニットに原稿の画像を読み取らせて、原稿の画像を表す画像データを生成し、当該画像データを制御部10へ出力するスキャン処理を行う。
画像形成部32は、制御部10による制御の下、制御部10に入力された画像データに基づいて用紙に画像を形成する印刷処理を行う。具体的には、画像形成部32は、感光体ドラム、感光体ドラムの周面に対向して配設された帯電部、帯電部の下流側であって感光体ドラムの周面に対向して配設された露光部、露光部の下流側であって感光体ドラムの周面に対向して配設された現像部、現像部の下流側であって感光体ドラムの周面に対向して配設されたクリーニング部等を備えた周知の構成を有する。
操作部33は、表示部331と、ユーザーに各種操作を行わせるための操作キー部332と、を備えている。表示部331は、例えばタッチパネル機能を有する液晶ディスプレイ等であり、各種情報を表示する。操作キー部332は、例えば、数値や記号を入力するためのテンキーや、表示部331に表示されたポインター(カーソル)を移動させるための方向キー等の各種キーを含む。
記憶部34は、HDD(Hard Disk Drive)やSSD(Solid State Drive)等の記憶装置によって構成されている。記憶部34には、画像読取部31によって生成された画像データや、通信部35によって受信されたデータや、後述の動画受付部11により受け付けられた動画データ等が記憶される。また、記憶部34には、制御部10が複合機1の制御に用いる各種設定値の初期値が予め記憶されている。
通信部35は、パソコン等の外部装置と制御部10との間でLAN(Local Area Network)等を介して通信を行うための通信インターフェイス回路である。
外部インターフェイス部36は、デジタルビデオカメラやスマートフォン等の外部機器に接続されたケーブルコネクターが着脱自在に接続されるソケットを備えている。外部インターフェイス部36は、外部機器に接続されたケーブルコネクターが当該ソケットに接続されている場合に、当該外部機器の内部の記憶装置との間で当該ケーブルコネクターを介してデータの入出力を行う。
制御部10は、例えば、所定の演算処理を実行する不図示のCPU(Central Processing Unit)と、所定の制御プログラムが記憶されたEEPROM等の不図示の不揮発性メモリーと、データを一時的に記憶するための不図示のRAM(Random Access Memory)と、これらの周辺回路等とを備えている。制御部10は、不揮発性メモリー等に記憶された制御プログラムをCPUに実行させることによって各種処理を実行し、複合機1の各部の動作を制御する。
制御部10は、特に、動画受付部11、検出部12、画像抽出部13、音声抽出部14、文字列認識部15、抽出条件受付部16(第一受付部、第二受付部、第三受付部、第四受付部)、画面生成部17、選択受付部18、画像出力部19、出力条件受付部20(配置受付部、サイズ受付部、位置受付部)、画像受付部21、変更受付部22、変更指示受付部23、及び選択用紙出力部24として動作する。
動画受付部11は、動画を表す動画データの入力を受け付ける。具体的には、動画受付部11は、通信部35によって外部装置から送信された動画データが受信された場合に、制御部10に入力された当該動画データを取得することにより、当該動画データの入力を受け付ける。
また、デジタルビデオカメラ等の外部機器に接続されたケーブルコネクターが外部インターフェイス部36のソケットに接続され、ユーザーによる操作部33の操作により、当該外部機器の内部の記憶装置に記憶されている動画データの取り込み指示が入力されたとする。この場合、動画受付部11は、当該取り込み指示に従い、外部インターフェイス部36を制御して、外部機器の内部の記憶装置に記憶されている当該動画データを取得する。これにより、動画受付部11は、当該動画データの入力を受け付ける。
検出部12は、動画受付部11により受け付けられた動画データである受付動画データにおいて、音声の音量が直前のサンプル点に対応する音声の音量に対して所定の基準音量差以上増大する一以上のサンプル点を基準サンプル点として検出する。
画像抽出部13は、検出部12により検出された基準サンプル点のそれぞれについて、当該基準サンプル点に対応する基準画像を含む時系列に並んだ所定のサンプル数分の画像を、当該基準サンプル点に対応するシーンを構成するフレーム画像として、受付動画データから抽出する。
音声抽出部14は、検出部12により検出された基準サンプル点のそれぞれについて、当該基準サンプル点に対応する基準音声を含む時系列に連続する所定数分の音声を、当該基準サンプル点に対応するシーンを代表する代表音声として、受付動画データから抽出する。
以下、動画データの構成、検出部12、画像抽出部13、及び音声抽出部14の詳細について図2を用いて説明する。図2は、動画データDMの概略構成図である。
図2に示すように、また、動画データDMは、動画の画像を所定の時間間隔でサンプリングして生成した画像データDDと、動画の音声を所定の時間間隔でサンプリングして生成した音声データDVと、を含んでいる。画像データDDは、時系列に並べられた複数のサンプル点に対応する複数の画像(複数の矩形部)からなる。音声データDVは、時系列に並べられた複数のサンプル点に対応する複数の音声(複数の矩形部)からなる。また、動画データDMは、当該動画データDMが示す動画の長さ(時間)や作成日時等の不図示のプロパティデータを含んでいる。
図2において、画像データDDの横軸は時刻を示し、縦軸は画像データDDに含まれる複数の画像それぞれの解像度を示す。画像データDDに含まれる複数の画像は、全て同じ解像度となっている。音声データDVの横軸は時刻を示し、縦軸は音声データDVに含まれる複数の音声(複数の矩形部)それぞれの音量を示す。図2に示す音声データDVに含まれる複数の音声の音量は、時系列に変化している。
また、図2に示す動画データDMにおいては、画像データDDに含める各画像をサンプリングするときに用いた時間間隔と、音声データDVに含める各音声をサンプリングするときに用いた時間間隔と、が同じであり、各サンプル点に対応する画像と各サンプル点に対応する音声とが一対一に対応している。
しかし、これに限らず、画像データDDに含める各画像をサンプリングするときに用いる時間間隔と、音声データDVに含める各音声をサンプリングするときに用いる時間間隔と、は互いに異なっていてもよい。つまり、各サンプル点に対応する画像と各サンプル点に対応する音声とが一対多又は多対一に対応する関係であってもよい。
以下、図2に示す動画データDMが動画受付部11により受け付けられたものとして説明する。また、動画受付部11により受け付けられた動画データDMを受付動画データDMと示す。
検出部12は、受付動画データDMに含まれる音声データDVを用いて、当該音声データDVに含まれる各サンプル点に対応する音声の音量が、当該サンプル点の直前のサンプル点に対応する音声の音量よりも増大しているサンプル点を検出する。そして、検出部12は、当該検出したサンプル点に対応する音声の音量と当該検出したサンプル点の直前のサンプル点に対応する音声の音量との音量差ΔVが、所定の基準音量差以上である場合、当該検出したサンプル点を基準サンプル点として検出する。
ここで、基準音量差は、直前のサンプル点に対応する音声の音量に対する比率で定められている。これに合わせて、検出部12は、上記音量差ΔVを直前のサンプル点に対応する音声の音量に対する比率で算出する。
例えば、基準音量差が30%に定められているとする。また、図2において、サンプル点BS1に対応する音声の音量が、サンプル点BS1の直前のサンプル点SP1に対応する音声の音量の4倍であるとする。
この場合、検出部12は、サンプル点BS1に対応する音声の音量とサンプル点SP1に対応する音声の音量との音量差ΔVを「300%」と算出する。この場合、検出部12は、当該算出した音量差ΔV「300%」が基準音量差「30%」以上であるので、サンプル点BS1を基準サンプル点として検出する。図2は、これと同様にして、検出部12がサンプル点BS2とサンプル点BS3とを基準サンプル点として検出したことを示している。
以下では、検出部12が基準サンプル点として検出した三個のサンプル点BS1、BS2、BS3をそれぞれ基準サンプル点BS1、BS2、BS3と記載する。尚、以下では、検出部12により検出された基準サンプル点を総称する場合、基準サンプル点BSと記載する。
このように、直前のサンプル点に対応する音声の音量に対する比率で基準音量差が定められ、これに合わせて、検出部12は、直前のサンプル点に対応する音声の音量に対する比率で音量差ΔVを算出する。これにより、検出部12は、音声の音量が全体的に小さい動画を示す動画データにおいても基準サンプル点を検出することができる。
ただし、基準音量差は、直前のサンプル点に対応する音声の音量に対する比率に限らず、音量を示す絶対値(例えば、デシベル値)で定めてもよい。これに合わせて、検出部12は、上記音量差ΔVを、サンプル点に対応する音声の音量を示す絶対値と当該サンプル点の直前に対応する音声の音量の絶対値との差として算出してもよい。
検出部12により基準サンプル点BSが検出されると、画像抽出部13は、当該検出された基準サンプル点BSのそれぞれについて、当該基準サンプル点BS1(BS2、BS3)に対応する基準画像D1(D2、D3)を、受付動画データDMに含まれる画像データDDから抽出する。
画像抽出部13は、検出部12が抽出した基準画像D1(D2、D3)を含む時系列に並んだ所定のサンプル数分の画像を、当該基準サンプル点BS1(BS2、BS3)に対応するシーンを構成するフレーム画像FD1(FD2、FD3)として、受付動画データDMに含まれる画像データDDから抽出する。つまり、基準サンプル点BSとシーンは、一対一の関係にある。
例えば、サンプル数が3に定められているとする。この場合、画像抽出部13は、図2に示すように、基準画像D1(D2、D3)と、基準サンプル点BS1(BS2、BS3)から過去へ所定の基準時間BT遡ったサンプル点B11(B21、B31)に対応する画像と、基準サンプル点BS1(BS2、BS3)から未来へ基準時間BT進んだサンプル点A11(A21、A31)に対応する画像とを、フレーム画像FD1(FD2、FD3)として抽出する。
サンプル数が5に定められている場合、画像抽出部13は、基準サンプル点BS1に対応するシーンを構成するフレーム画像として、基準画像D1と、基準サンプル点BS1から基準時間BTおきに過去に遡った二つのサンプル点B11、B12に対応する画像と、基準サンプル点BS1から基準時間BTおきに未来に進んだ二つのサンプル点A11、A12に対応する画像とを、抽出する。
尚、画像抽出部13は、例えばサンプル数が3に定められている場合に、上記とは異なり、基準サンプル点BS1に対応するシーンを構成するフレーム画像FD1として、基準画像D1と、基準サンプル点BS1から所定の基準時間BTおきに過去に遡った二つのサンプル点B11、B12に対応する画像を抽出してもよい。つまり、画像抽出部13が、フレーム画像FD1として、基準サンプル点BS1よりも未来のサンプル点に対応する画像を抽出しないようにしてもよい。
または、画像抽出部13は、例えばサンプル数が3に定められている場合に、上記とは異なり、基準サンプル点BS1に対応するシーンを構成するフレーム画像FD1として、基準画像D1と、基準サンプル点BS1から所定の基準時間BTおきに未来に進んだ二つのサンプル点A11、A12に対応する画像を抽出してもよい。つまり、画像抽出部13が、フレーム画像FD1として、基準サンプル点BS1よりも過去のサンプル点に対応する画像を抽出しないようにしてもよい。
つまり、画像抽出部13は、フレーム画像FD1(FD2、FD3)に含める画像として、基準画像D1(D2、D3)と、基準サンプル点BS1(BS2、BS3)から所定の基準時間BTおきに過去に遡ったサンプル点に対応する画像、及び/又は、基準サンプル点BS1(BS2、BS3)から基準時間BTおきに未来に進んだサンプル点に対応する画像と、を抽出する。
以下では、各シーンを構成するフレーム画像FD1、FD2、FD3を総称する場合、フレーム画像FDと記載する。また、各基準サンプル点BS1、BS2、BS3に対応する基準画像D1、D2、D3を総称する場合、基準画像Dと記載する。
音声抽出部14は、検出部12により基準サンプル点BSが検出されると、当該検出された基準サンプル点BSのそれぞれについて、当該基準サンプル点BS1(BS2、BS3)に対応する基準音声V1(V2、V3)を、受付動画データDMに含まれる音声データDVから抽出する。
そして、音声抽出部14は、当該抽出した基準音声V1(V2、V3)を含む時系列に連続する所定数分の音声を、当該基準サンプル点BS1(BS2、BS3)に対応するシーンを代表する代表音声SV1(SV2、SV3)として、受付動画データDMに含まれる音声データDVから抽出する。
具体的には、上記所定数が6に定められているとする。この場合、画像抽出部13は、図2に示すように、基準音声V1(V2、V3)と、基準サンプル点BS1(BS2、BS3)よりも未来の五つの連続するサンプル点に対応する音声と、を、当該基準サンプル点BS1(BS2、BS3)に対応するシーンを代表する代表音声SV1(SV2、SV3)として抽出する。
以下では、各シーンを代表する代表音声SV1、SV2、SV3を総称する場合、代表音声SVと記載する。
図1に参照を戻す。文字列認識部15は、音声抽出部14により抽出された各代表音声SVに対して、周知の所定の音声認識処理を行う。これにより、文字列認識部15は、各代表音声SVを表す文字列を認識する。文字列認識部15は、当該認識した文字列を、当該各代表音声SVに対応するシーンに対応する後述の代表画像選択画面W2の入力欄G22に入力する。
抽出条件受付部16は、ユーザーによる上記の基準音量差、基準時間BT、及びサンプル数の入力を受け付ける。また、抽出条件受付部16は、ユーザーによる開始時刻及び終了時刻の入力を受け付ける。これに合わせて、検出部12は、受付動画データDMのうち、抽出条件受付部16により受け付けられた開始時刻から抽出条件受付部16により受け付けられた終了時刻までの期間に対応する受付動画データDMにおいて、基準サンプル点BSを検出する。
例えば、図2に示すように、抽出条件受付部16により、開始時刻として時刻STが受け付けられ、終了時刻として時刻ETが受け付けられたとする。この場合、検出部12は、受付動画データDMのうち開始時刻STから終了時刻ETまでの期間に対応する動画データDMにおいて、基準サンプル点BS2のみを検出する。
以下、抽出条件受付部16がユーザーによる基準音量差、基準時間BT、サンプル数、開始時刻、及び終了時刻の入力を受け付ける方法について図3を用いて説明する。図3は、条件設定画面W1の一例を示す図である。
抽出条件受付部16は、図3に示す条件設定画面W1を表示部331に表示する。図3に示すように、条件設定画面W1には、開始時刻の入力欄G11、終了時刻の入力欄G12、基準音量差の入力欄G13、基準時間BTの入力欄G14及びサンプル数の入力欄G15が設けられている。条件設定画面W1には、更に、OKボタンK11及びキャンセルボタンK12が設けられている。
入力欄G11には、抽出条件受付部16によって、条件設定画面W1の表示当初に、受付動画データDMが表す動画の開始時刻「0:00:00」が入力される。また、入力欄G12には、抽出条件受付部16によって、条件設定画面W1の表示当初に、受付動画データDMが表す動画の終了時刻が入力される。
例えば、受付動画データDMが表す動画の長さが30分であり、当該受付動画データDMに、動画の長さ「0:30:00」を示すプロパティデータが含まれているとする。この場合、抽出条件受付部16は、条件設定画面W1の表示当初に、上記プロパティデータが示す動画の長さ「0:30:00」を入力欄G12に入力する。
その後、ユーザーは、操作部33を操作することにより、入力欄G11に入力された開始時刻、及び入力欄G12に入力された終了時刻を編集入力する。
入力欄G13には、抽出条件受付部16によって、条件設定画面W1の表示当初に、不揮発性メモリー等に予め記憶されている基準音量差が入力される。例えば、基準音量差が、30%に定められ、不揮発性メモリー等に記憶されているとする。この場合、抽出条件受付部16は、基準音量差「30」を入力欄G13に表示する。その後、ユーザーは、操作部33を操作することにより、入力欄G13に入力された基準音量差を編集入力する。
入力欄G14には、抽出条件受付部16によって、条件設定画面W1の表示当初に、不揮発性メモリー等に予め記憶されている基準時間BTが入力される。例えば、基準時間が、0.03秒に定められ、不揮発性メモリー等に記憶されているとする。この場合、抽出条件受付部16は、基準時間BT「0.03」を入力欄G14に入力する。その後、ユーザーは、操作部33を操作することにより、入力欄G14に入力された基準時間BTを編集入力する。
入力欄G15には、抽出条件受付部16によって、条件設定画面W1の表示当初に、不揮発性メモリー等に予め記憶されているサンプル数が入力される。例えば、サンプル数が3に定められ、不揮発性メモリー等に記憶されているとする。この場合、抽出条件受付部16は、サンプル数「3」を入力欄G15に入力する。その後、ユーザーは、操作部33を操作することにより、入力欄G15に入力されたサンプル数を編集入力する。
OKボタンK11は、入力欄G11〜G15における開始時刻、終了時刻、基準音量差、基準時間BT及びサンプル数の入力を確定するボタンである。つまり、OKボタンK11が押下された場合、抽出条件受付部16は、入力欄G11〜G15における開始時刻、終了時刻、基準音量差、基準時間BT及びサンプル数の入力が確定したと判断し、当該開始時刻、終了時刻、基準音量差、基準時間BT及びサンプル数の入力を受け付ける。そして、抽出条件受付部16は、表示部331への条件設定画面W1の表示を終了する。
抽出条件受付部16は、開始時刻、終了時刻、基準音量差、基準時間BT及びサンプル数の入力を受け付けると、当該受け付けた開始時刻、終了時刻、基準音量差、基準時間BT及びサンプル数によって、不揮発性メモリー等に予め記憶されている開始時刻、終了時刻、基準音量差、基準時間BT及びサンプル数を更新する。
キャンセルボタンK12は、入力欄G11〜G15における開始時刻、終了時刻、基準音量差、基準時間BT及びサンプル数の入力をキャンセルするボタンである。つまり、キャンセルボタンK12が押下された場合、抽出条件受付部16は、入力欄G11〜G15における開始時刻、終了時刻、基準音量差、基準時間BT及びサンプル数の入力がキャンセルされたと判断し、当該開始時刻、終了時刻、基準音量差、基準時間BT及びサンプル数の入力を受け付けず、表示部331への条件設定画面W1の表示を終了する。
図1に参照を戻す。画面生成部17は、各シーンにおいて、画像抽出部13により抽出された当該各シーンを構成するフレーム画像FDが一覧表示された代表画像選択画面(操作画面)を生成する。つまり、シーンと代表画像選択画面は、一対一の関係にある。
選択受付部18は、画面生成部17により生成された各代表画像選択画面において、一覧表示されているフレーム画像の中から、シーンを代表する代表画像の選択を受け付ける。
以下、画面生成部17及び選択受付部18の詳細について説明する。尚、以下では、図2に示すように、画像抽出部13によって、基準サンプル点BS1に対応するシーンを構成するフレーム画像FD1、基準サンプル点BS2に対応するシーンを構成するフレーム画像FD2、及び基準サンプル点BS3に対応するシーンを構成するフレーム画像FD3が抽出されたものとして説明する。
画面生成部17は、基準サンプル点BS1に対応するシーンを構成するフレーム画像FD1が一覧表示された代表画像選択画面と、基準サンプル点BS2に対応するシーンを構成するフレーム画像FD2が一覧表示された代表画像選択画面と、基準サンプル点BS3に対応するシーンを構成するフレーム画像FD3が一覧表示された代表画像選択画面と、を生成する。
選択受付部18は、画面生成部17により生成された三個の代表画像選択画面を順次表示部331に表示する。図4は、代表画像選択画面W2の一例を示す図である。以下では、当該三個の代表画像選択画面を代表して、基準サンプル点BS2に対応するシーンに対応する代表画像選択画面W2について説明する。
図4に示すように、代表画像選択画面W2には、基準サンプル点BS2に対応するシーンを代表する代表画像の選択欄G21、当該シーンを表す文字列(以下、シーン文字列と記載する)の入力欄G22、表示欄G23、表示欄G24、前へボタンK21、後へボタンK22、OKボタンK23、及びキャンセルボタンK24が設けられている。
選択欄G21には、画面生成部17によって、基準サンプル点BS2に対応するシーンを構成するフレーム画像FD2に含まれる画像B21、D2、A21(図2)が選択可能に一覧表示される。また、選択欄G21には、画面生成部17によって、基準サンプル点BS2に対応するシーンを代表する代表画像を選択しないことを指示する非選択指示を入力するための非選択指示画像NSが選択可能に表示される。
ユーザーは、操作部33を操作することにより、選択欄G21に一覧表示されたフレーム画像FD2に含まれる画像B21、D2、A21の何れかを基準サンプル点BS2に対応するシーンを構成する代表画像として選択する、または、非選択指示画像NSを選択する。
入力欄G22には、画面生成部17による代表画像選択画面W2の生成当初に、文字列認識部15によって、基準サンプル点BS2に対応するシーンに対応する代表音声SVを表す文字列がシーン文字列として入力される。ユーザーは、操作部33を操作することにより、当該代表画像選択画面W2の入力欄G22に入力されたシーン文字列を編集入力する。
表示欄G23には、画面生成部17によって、当該代表画像選択画面W2に対応するシーンをユーザーに識別させるための情報が表示される。図4では、画面生成部17は、当該代表画像選択画面W2に対応するシーンが、検出部12によって検出された三つの基準サンプル点BS1、BS2、BS3のうち、二番目に検出された基準サンプル点BS2に対応するシーンであることをユーザーに識別させるために、文字列「2/3」が表示欄G23に表示されている。
表示欄G24には、検出部12によって、基準サンプル点BSの検出が終了している受付動画データDMにおける時刻が表示される。例えば、検出部12は、受付動画データDMに含まれる時刻「hh:mm:ss」までの音声を用いた基準サンプル点BSの検出を終了しているとき、表示欄G24に当該時刻「hh:mm:ss」を表示する。
前へボタンK21は、当該代表画像選択画面W2に代えて、当該代表画像選択画面W2に対応するシーンの前のシーンに対応する代表画像選択画面W2を表示するためのボタンである。代表画像選択画面W2に対応するシーンの前のシーンとは、当該代表画像選択画面W2に対応するシーンに対応する基準サンプル点BSの前に検出部12により検出された基準サンプル点BSに対応するシーンを示す。
つまり、ユーザーによる操作部33の操作により、図4に示す代表画像選択画面W2の前へボタンK21が押下されたとする。この場合、選択受付部18は、図4に示す代表画像選択画面W2に代えて、基準サンプル点BS2の前に検出された基準サンプル点BS1に対応するシーンに対応する代表画像選択画面W2を表示部331に表示する。
後へボタンK22は、当該代表画像選択画面W2に代えて、当該代表画像選択画面W2に対応するシーンの後のシーンに対応する代表画像選択画面W2を表示するためのボタンである。代表画像選択画面W2に対応するシーンの後のシーンとは、当該代表画像選択画面W2に対応するシーンに対応する基準サンプル点BSの後に検出部12により検出された基準サンプル点BSに対応するシーンを示す。
つまり、ユーザーによる操作部33の操作により、図4に示す代表画像選択画面W2の後へボタンK22が押下されたとする。この場合、選択受付部18は、図4に示す代表画像選択画面W2に代えて、基準サンプル点BS2の後に検出された基準サンプル点BS3に対応するシーンに対応する代表画像選択画面W2を表示部331に表示する。
OKボタンK23は、画面生成部17によって生成された全ての代表画像選択画面W2の選択欄G21における代表画像又は非選択指示画像の選択と、画面生成部17によって生成された全ての代表画像選択画面W2の入力欄G22におけるシーン文字列の入力と、を確定するボタンである。
選択受付部18は、画面生成部17によって生成された少なくとも一つの代表画像選択画面W2の選択欄G21において、ユーザーによる代表画像又は非選択指示画像の選択が行われていない場合、OKボタンK23を押下不可能にする(グレー表示する)。
つまり、OKボタンK23が押下された場合、選択受付部18は、画面生成部17により生成された全ての代表画像選択画面W2において、各シーンを代表する代表画像又は非選択指示画像NSの選択と、各シーン文字列の入力が確定したと判断し、当該選択と当該入力とを受け付ける。そして、選択受付部18は、代表画像選択画面W2の表示部331への表示を終了する。
尚、選択受付部18は、非選択指示画像NSの選択を受け付けた場合、非選択指示が入力されたと判断し、当該非選択指示画像NSが表示された代表画像選択画面W2に対応するシーンを代表する代表画像の選択を受け付けない。
例えば、基準サンプル点BS1に対応するシーンに対応する代表画像選択画面W2の選択欄G21において基準画像D1が代表画像として選択されているとする。また、基準サンプル点BS2に対応するシーンに対応する代表画像選択画面W2の選択欄G21において画像B21が代表画像として選択されているとする。そして、基準サンプル点BS3に対応するシーンに対応する代表画像選択画面W2の選択欄G21において非選択指示画像NSが選択されているとする。この場合に、ユーザーによって、表示部331に表示されている代表画像選択画面W2のOKボタンK23が押下されたとする。
この場合、選択受付部18は、基準画像D1を基準サンプル点BS1に対応するシーンを代表する代表画像として受け付け、画像B21を基準サンプル点BS2に対応するシーンを代表する代表画像として受け付ける。しかし、選択受付部18は、基準サンプル点BS3に対応するシーンを代表する代表画像の選択を受け付けない。
キャンセルボタンK24は、画面生成部17によって生成された全ての代表画像選択画面W2の選択欄G21における代表画像又は非選択指示画像の選択と、画面生成部17によって生成された全ての代表画像選択画面W2の入力欄G22におけるシーン文字列の入力と、をキャンセルするボタンである。つまり、キャンセルボタンK24が押下された場合、選択受付部18は、代表画像の選択を一つも受け付けず、代表画像選択画面W2の表示部331への表示を終了する。
図1に参照を戻す。画像出力部19は、選択受付部18により受け付けられた各代表画像を出力する。画像出力部19の詳細については後述する。
出力条件受付部20、画像受付部21、変更受付部22、変更指示受付部23、及び選択用紙出力部24は、画像出力部19による各代表画像の出力に関連する動作を行う。これら各部の詳細についても後述する。
以下、受付動画データDMが示す動画の内容を表す代表画像を生成する動作について説明する。図5は、代表画像を生成する動作を示すフローチャートである。
図5に示すように、動画受付部11により、上述のように、外部装置から送信された動画データDMや、外部機器の内部の記憶装置に記憶されている動画データDMの入力が受け付けられたとする(S1)。この場合、制御部10は、当該受付動画データDMが示す動画の内容を表す代表画像を生成するか否かの選択が可能な不図示の操作画面を表示部331に表示する。
当該操作画面において代表画像を生成することが選択された場合(S2;YES)、抽出条件受付部16は、条件設定画面W1(図3)を表示部331に表示する。そして、抽出条件受付部16は、当該条件設定画面W1を用いて、上述のように基準音量差、基準時間BT、サンプル数、開始時刻、及び終了時刻の入力を受け付ける(S3)。一方、当該操作画面において代表画像を生成することがユーザーにより選択されなかった場合(S2;NO)、制御部10は、代表画像を生成する動作を行わず、受付動画データDMを記憶部34に記憶して処理を終了する。
ステップS3の実行後、検出部12は、上述のように、ステップS3で受け付けられた開始時刻から終了時刻までの期間に対応する受付動画データDMにおいて基準サンプル点BSを検出する(S4)。
音声抽出部14は、上述のように、検出部12により検出された基準サンプル点BSのそれぞれに対応するシーンを代表する代表音声SVを受付動画データDMに含まれる音声データDVから抽出する(S5)。文字列認識部15は、上述のように、ステップS5において抽出された各代表音声SVを表す文字列を認識する(S6)。
画像抽出部13は、上述のように、検出部12により検出された基準サンプル点BSのそれぞれに対応するシーンを構成するフレーム画像FDを受付動画データDMに含まれる画像データDDから抽出する(S7)。
検出部12は、ステップS3で受け付けられた開始時刻から終了時刻までの期間に対応する受付動画データDMにおいて基準サンプル点BSを検出することを終了していず(S8;NO)、且つ、検出した基準サンプル点BSの数が所定の制限数未満である場合(S9;YES)、基準サンプル点BSの検出を継続する(S4)。尚、上記の制限数は、不揮発性メモリー等に予め記憶されている。
一方、検出部12は、ステップS3で受け付けられた開始時刻から終了時刻までの期間に対応する受付動画データDMにおいて基準サンプル点BSを検出することを終了していず(S8;NO)、且つ、検出した基準サンプル点BSの数が上記制限数になった場合(S9;NO)、基準サンプル点BSの検出を中断する。その後、後述のステップS10以降の処理が実行される。
また、検出部12が、ステップS3で受け付けられた開始時刻から終了時刻までの期間に対応する受付動画データDMにおいて基準サンプル点BSを検出することを終了した場合(S8;YES)、後述のステップS10以降の処理が実行される。
ステップS10において、画面生成部17は、上述のように、画像抽出部13により抽出された各シーンを構成するフレーム画像FDを一覧表示した、当該各シーンに対応する各代表画像選択画面W2(図4)を生成する(S10)。
このとき、検出部12は、基準サンプル点BSの検出を中断している場合は、当該中断した時刻を各代表画像選択画面W2の表示欄G24に表示する。又は、検出部12は、基準サンプル点BSの検出を終了している場合は、ステップS3で受け付けられた終了時刻を各代表画像選択画面W2の表示欄G24に表示する。
ステップS10の実行後、選択受付部18は、上述のように、ステップS10で生成された各代表画像選択画面W2を順次表示部331に表示する。そして、選択受付部18は、上述のように、各代表画像選択画面W2に対応する各シーンを代表する代表画像又は非選択指示画像NSの選択と、各シーン文字列の入力を受け付けると、表示部331への各代表画像選択画面W2の表示を終了する(S11)。
検出部12は、基準サンプル点BSの検出を中断していた場合、ステップS11の終了後、当該中断していた時刻以降の基準サンプル点BSの検出を再開するか否かの選択が可能な不図示の操作画面を表示部331に表示する。
そして、ユーザーにより、基準サンプル点BSの検出を再開することが選択された場合(S12;YES)、検出部12は、検出した基準サンプル点BSの数を0に戻し、基準サンプル点BSを検出することを再開する(S4)。一方、ユーザーにより、基準サンプル点BSの検出を再開しないことが選択された場合(S12;NO)、検出部12は、基準サンプル点BSの検出を終了する。尚、検出部12は、基準サンプル点BSの検出を終了していた場合、ステップS11の終了後、基準サンプル点BSの検出を再開しない。
つまり、検出部12は、検出した基準サンプル点BSの数が所定の制限数になる度に(S9;NO)、基準サンプル点BSの検出を中断し、以降の基準サンプル点BSの検出を再開するか否かをユーザーに選択させ、基準サンプル点BSの検出を再開することが選択されたときは(S12;YES)、以降の基準サンプル点BSの検出を再開する一方、基準サンプル点BSの検出を再開しないことが選択されたときは(S12;NO)、基準サンプル点BSの検出を終了する。
以下、図5に示す動作により生成された各代表画像を出力する動作について説明する。当該説明の中で、画像出力部19、出力条件受付部20、画像受付部21、変更受付部22、変更指示受付部23、及び選択用紙出力部24の詳細について説明する。図6は、代表画像を出力する動作を示すフローチャートである。図7は、出力条件設定画面W3の一例を示す図である。
図5に示す動作が終了すると、図6に示すように、出力条件受付部20は、図7に示す出力条件設定画面W3を表示部331に表示し、各代表画像を出力するときの出力条件を、当該出力条件設定画面W3を用いてユーザーに入力させる(S21)。
出力条件には、各代表画像を出力するときに各代表画像を配置するレイアウト、各代表画像を出力するときの各代表画像のサイズ、及び代表画像と当該代表画像に対応するシーン文字列とを対応付けて出力するときの当該代表画像に対する当該文字列の相対的な出力位置が含まれる。
具体的には、図7に示すように、出力条件設定画面W3には、レイアウト選択欄G31、出力サイズ選択欄G32、出力位置選択欄G33、プレビューボタンK31、全印刷ボタンK32、個別印刷ボタンK33、画像変更ボタンK34及び終了ボタンK35が設けられている。
レイアウト選択欄G31には、出力条件受付部20によって、各代表画像を出力するときに各代表画像を配置する複数のレイアウトが選択可能に表示される。例えば、図7では、レイアウト選択欄G31に、各代表画像を順次縦に並べて配置するレイアウト「縦並び」と、各代表画像を順次横に並べて配置するレイアウト「横並び」と、が選択可能に表示されている。
尚、各代表画像を配置するレイアウトは、予め定められ、不揮発性メモリー等に予め記憶されている。出力条件受付部20は、出力条件設定画面W3の表示当初に、不揮発性メモリー等に予め記憶されているレイアウト(例えば、「縦並び」)を選択した状態で表示する。
その後、ユーザーは、操作部33を操作することにより、レイアウト選択欄G31に表示されたレイアウト「縦並び」又は「横並び」を選択入力する。
出力条件受付部20は、プレビューボタンK31、全印刷ボタンK32、個別印刷ボタンK33、及び画像変更ボタンK34のうちの何れかのボタンが押下された場合に、レイアウト選択欄G31において選択されているレイアウトを、各代表画像を配置するレイアウトとして受け付ける。出力条件受付部20は、ユーザーによる当該レイアウトの選択を受け付けると、当該レイアウトによって、不揮発性メモリー等に予め記憶されている各代表画像を配置するレイアウトを更新する。
出力サイズ選択欄G32には、出力条件受付部20によって、各代表画像を出力するときの各代表画像のサイズ(以下、出力サイズと記載する)の決定方法が択一的に選択できるように表示される。例えば、図7では、出力サイズの決定方法として、出力サイズを自動的に決定する「自動」又は出力サイズをユーザーが意図する所望のサイズに決定させる「手動」が選択可能なラジオボタンが表示されている。
更に、出力サイズ選択欄G32には、出力サイズの決定方法「手動」が選択された場合にのみ操作可能なリストボックスが出力条件受付部20によって表示される。当該リストボックスでは、所定の複数の変換率の中から一の変換率をユーザーに選択させることが可能となっている。
尚、出力サイズの決定方法は、予め定められ、不揮発性メモリー等に予め記憶されている。出力サイズの決定方法が予め「手動」に定められている場合は、更に、上記一の変換率が予め定められ、不揮発性メモリー等に予め記憶されている。
出力サイズの決定方法が予め「自動」に定められている場合、出力条件受付部20は、出力条件設定画面W3の表示当初に、不揮発性メモリー等に予め記憶されている出力サイズの決定方法「自動」を選択した状態で表示する。
出力サイズの決定方法が予め「手動」に定められている場合、出力条件受付部20は、出力条件設定画面W3の表示当初に、不揮発性メモリー等に予め記憶されている出力サイズの決定方法「手動」を選択した状態で表示する。この場合、出力条件受付部20は、不揮発性メモリー等に予め記憶されている上記一の変換率を選択した状態で上記リストボックスを表示する。例えば、図7は、上記リストボックスが、一の変換率「100%」を選択した状態で表示されていることを示している。
その後、ユーザーは、操作部33を操作することにより、出力サイズ選択欄G32に表示された出力サイズの決定方法を選択入力する。
プレビューボタンK31、全印刷ボタンK32、個別印刷ボタンK33、及び画像変更ボタンK34のうちの何れかのボタンが押下された場合に、出力サイズ選択欄G32において、出力サイズの決定方法「自動」が選択されていたとする。
この場合、出力条件受付部20は、出力サイズとして、当該代表画像の解像度に対応付けて予め記憶部34に記憶されている最適サイズが選択入力されたと判断する。そして、出力条件受付部20は、当該最適サイズを出力サイズとして受け付ける。この場合、出力条件受付部20は、当該出力サイズの決定方法「自動」によって、不揮発性メモリー等に予め記憶されている出力サイズの決定方法を更新する。
図8は、記憶部34に記憶されている最適サイズの一例を示す図である。図8に示すように、記憶部34には、画像の解像度と、当該解像度の画像を出力するときに最適な画像のサイズである最適サイズと、が予め対応付けて記憶されている。例えば、図8は、画像の解像度「X1」と、最適サイズ「h1×w1」と、が予め対応付けて記憶部34に記憶されていることを示している。
例えば、代表画像の解像度が解像度「X1」であるとする。この場合、出力条件受付部20は、代表画像の解像度「X1」に対応付けて予め記憶部34に記憶されている最適サイズ「h1×w1」を出力サイズとして受け付ける。
一方、ユーザーは、出力サイズの決定方法「手動」を選択した場合、更に上記リストボックスを用いて一の変換率を選択入力する。
プレビューボタンK31、全印刷ボタンK32、個別印刷ボタンK33、及び画像変更ボタンK34のうちの何れかのボタンが押下された場合に、出力サイズ選択欄G32において出力サイズの決定方法「手動」が選択され、上記リストボックスにおいて一の変換率が選択されていたとする。
この場合、出力条件受付部20は、当該代表画像のサイズを当該選択されている一の変換率で変換した後のサイズを算出し、当該算出したサイズが出力サイズとして選択されたと判断する。そして、出力条件受付部20は、当該算出したサイズを出力サイズとして受け付ける。
この場合、出力条件受付部20は、出力サイズの決定方法「手動」によって、不揮発性メモリー等に予め記憶されている出力サイズの決定方法を更新する。また、出力条件受付部20は、上記リストボックスにおいて選択されていた一の変換率によって、予め記憶部34に記憶されている一の変換率を更新する。
出力位置選択欄G33には、出力条件受付部20によって、代表画像と当該代表画像に対応するシーンを表すシーン文字列とを対応付けて出力するときの、当該代表画像に対する当該シーン文字列の相対的な出力位置(以下、相対出力位置と記載する)が選択可能に表示される。
例えば、図7では、出力位置選択欄G33に、シーン文字列を代表画像の上部、下部、左部及び右部のそれぞれに出力することを示す四個の相対出力位置「上」「下」「左」「右」と、シーン文字列を代表画像に重ねて出力することを示す相対出力位置「重ねる」と、が選択可能に表示されている。
尚、相対出力位置は、予め定められ、不揮発性メモリー等に予め記憶されている。出力条件受付部20は、出力条件設定画面W3の表示当初に、不揮発性メモリー等に予め記憶されている相対出力位置(例えば、「右」)を選択した状態で表示する。
その後、ユーザーは、操作部33を操作することにより、出力位置選択欄G33に表示された相対出力位置「上」「下」「左」「右」「重ねる」の中から何れか一の相対出力位置を選択入力する。
出力条件受付部20は、プレビューボタンK31、全印刷ボタンK32、個別印刷ボタンK33、及び画像変更ボタンK34のうちの何れかのボタンが押下された場合に、出力位置選択欄G33における相対出力位置の選択を受け付ける。出力条件受付部20は、ユーザーによる当該相対出力位置の選択を受け付けると、当該相対出力位置によって、不揮発性メモリー等に予め記憶されている相対出力位置を更新する。
プレビューボタンK31は、プレビュー出力処理を実行するためのボタンである。プレビュー出力処理とは、各代表画像と当該各代表画像に対応するシーンを表すシーン文字列とを対応付けて表示したプレビュー画面を表示部331に表示することにより、各代表画像を出力する処理である。
全印刷ボタンK32は、全印刷出力処理を実行するためのボタンである。全印刷出力処理とは、画像形成部32に全ての代表画像を用紙に形成する印刷処理を実行させることにより、各代表画像を出力する処理である。
個別印刷ボタンK33は、画像出力部19に後述の個別印刷出力画面を表示させるためのボタンである。画像変更ボタンK34は、画像出力部19に後述の変更対象選択画面を表示させるためのボタンである。終了ボタンK35は、画像出力部19による各代表画像の出力を終了するためのボタンである。
これら各ボタンK31〜K35が押下されたときの動作については後述する。
図6に参照を戻す。ステップS21において、各代表画像を出力するときの出力条件が入力された後、プレビューボタンK31が押下されたとする(S30;YES)。
この場合、出力条件受付部20は、ステップS21において入力された出力条件を受け付ける。画像出力部19は、当該受け付けられた出力条件を用いて、プレビュー出力処理を実行する(S31)。その後は、ステップS21以降の処理が行われる。
図9(A)は、予め定められた出力条件を用いた場合のプレビュー画面の一例を示す図である。図9(B)は、レイアウトと相対出力位置を変更した場合のプレビュー画面の一例を示す図である。図9(C)は、出力サイズを変更した場合のプレビュー画面の一例を示す図である。図9(D)は、相対出力位置を変更した場合のプレビュー画面の一例を示す図である。
図9(A)〜(D)に示すように、ステップS31のプレビュー出力処理において、表示部331に表示されるプレビュー画面W4には、プレビュー表示欄G41と、閉じるボタンK41と、が設けられている。プレビュー表示欄G41には、画像出力部19によって、出力条件受付部20により受け付けられた出力条件に従って、各代表画像DR1(DR2、DR3)と当該各代表画像DR1(DR2、DR3)に対応するシーンを表すシーン文字列C1、(C2、C3)とを対応付けて表示した画像が表示される。
例えば、出力条件設定画面W3の表示当初に入力された予め定められた出力条件が変更されずにプレビューボタンK31が押下され、出力条件受付部20が、当該予め定められた出力条件を受け付けたとする。尚、当該予め定められた出力条件は、各代表画像を順次縦に並べて配置するレイアウト「縦並び」、出力サイズを自動的に決定する出力サイズの決定方法「自動」及びシーン文字列を代表画像の右部に出力することを示す相対出力位置「右」であるとする。
この場合、画像出力部19は、図9(A)に示すように、上記予め定められた出力条件に従って、各代表画像のサイズを当該各代表画像の解像度に対応する最適サイズに変換し、当該最適サイズに変換された各代表画像DR1、DR2、DR3を順次縦に並べて表示した画像をプレビュー表示欄G41に表示する。また、画像出力部19は、プレビュー表示欄G41に表示した当該画像において、ステップS11(図5)で受け付けられた当該各代表画像DR1(DR2、DR3)に対応するシーンを表すシーン文字列C1(C2、C3)を、当該各代表画像DR1(DR2、DR3)の右部に表示する。
または、ステップS21において、出力条件設定画面W3を用いて、各代表画像を順次横に並べて配置するレイアウト「横並び」、出力サイズを自動的に決定する出力サイズの決定方法「自動」、及びシーン文字列を代表画像の下部に出力することを示す相対出力位置「下」が選択入力された後、プレビューボタンK31が押下され、出力条件受付部20が当該選択入力された出力条件を受け付けたとする。
この場合、画像出力部19は、図9(B)に示すように、当該受け付けられた出力条件に従って、各代表画像のサイズを当該各代表画像の解像度に対応する最適サイズに変換し、当該最適サイズに変換された各代表画像DR1、DR2、DR3を順次横に並べて表示した画像をプレビュー表示欄G41に表示する。また、画像出力部19は、プレビュー表示欄G41に表示した当該画像において、ステップS11(図5)で受け付けられた当該各代表画像DR1(DR2、DR3)に対応するシーンを表すシーン文字列C1(C2、C3)を、当該各代表画像DR1(DR2、DR3)の下部に表示する。
または、ステップS21において、出力条件設定画面W3を用いて、各代表画像を順次縦に並べて配置するレイアウト「縦並び」、出力サイズをユーザーに決定させる出力サイズの決定方法「手動」、一の変換率「130%」、及びシーン文字列を代表画像の右部に出力することを示す相対出力位置「右」が選択入力された後、プレビューボタンK31が押下され、出力条件受付部20が、当該選択入力された出力条件を受け付けたとする。
この場合、画像出力部19は、図9(C)に示すように、当該受け付けられた出力条件に従って、各代表画像のサイズを一の変換率「130%」で変換することにより拡大し、当該拡大後のサイズの各代表画像DR1、DR2、DR3を順次縦に並べて表示した画像をプレビュー表示欄G41に表示する。また、画像出力部19は、プレビュー表示欄G41に表示した当該画像において、ステップS11(図5)で受け付けられた当該各代表画像DR1(DR2、DR3)に対応するシーンを表すシーン文字列C1(C2、C3)を、当該各代表画像DR1(DR2、DR3)の右部に表示する。
または、ステップS21において、出力条件設定画面W3を用いて、各代表画像を順次縦に並べて配置するレイアウト「縦並び」、出力サイズを自動的に決定する出力サイズの決定方法「自動」、及びシーン文字列を代表画像に重ねて出力することを示す相対出力位置「重ねる」が選択入力された後、プレビューボタンK31が押下され、出力条件受付部20が、当該選択入力された出力条件を受け付けたとする。
この場合、画像出力部19は、図9(D)に示すように、当該受け付けられた出力条件に従って、各代表画像のサイズを当該各代表画像の解像度に対応する最適サイズに変換し、当該最適サイズに変換された各代表画像DR1、DR2、DR3を順次縦に並べて表示した画像をプレビュー表示欄G41に表示する。また、画像出力部19は、プレビュー表示欄G41に表示した当該画像において、ステップS11(図5)で受け付けられた当該各代表画像DR1(DR2、DR3)に対応するシーンを表すシーン文字列C1(C2、C3)を、当該各代表画像DR1(DR2、DR3)に重ねて表示する。
閉じるボタンK41が押下された場合、画像出力部19はプレビュー画面W4の表示部331への表示を終了する。
図6に参照を戻す。ステップS21において、各代表画像を出力するときの出力条件が入力された後、全印刷ボタンK32が押下されたとする(S30;NO、S40;YES)。
この場合、出力条件受付部20は、ステップS21において入力された出力条件を受け付ける。画像出力部19は、当該受け付けられた出力条件を用いて、全印刷出力処理を実行する(S41)。その後は、ステップS21以降の処理が行われる。
具体的には、ステップS41において、画像出力部19は、ステップS31のプレビュー出力処理で、出力条件受付部20により受け付けられた出力条件を用いてプレビュー画面W4のプレビュー表示欄G41に表示する画像と同じ画像を、用紙に形成する印刷処理を、画像形成部32に実行させる。
例えば、ステップS21において出力条件設定画面W3の表示当初に入力された、上記ステップS31において説明した予め定められた出力条件が変更されずに、全印刷ボタンK32が押下されたとする。これにより、出力条件受付部20が、当該予め定められた出力条件を受け付けたとする。この場合、画像出力部19は、ステップS31でプレビュー画面W4のプレビュー表示欄G41に表示する、図9(A)に示す画像と同じ画像を用紙に形成する印刷処理を画像形成部32に実行させる。
図6に参照を戻す。ステップS21において、各代表画像を出力するときの出力条件が入力された後、個別印刷ボタンK33が押下されたとする(S30;NO、S40;NO、S50;YES)。
この場合、出力条件受付部20は、ステップS21において入力された出力条件を受け付ける。画像受付部21は、個別印刷出力画面を表示部331に表示する。画像受付部21は、当該個別印刷出力画面を用いて、選択受付部18により受け付けられた各代表画像の中から、個別に出力する対象の代表画像の選択をユーザーから受け付ける(S51)。
図10は、個別印刷出力画面W5の一例を示す図である。具体的には、図10に示すように、個別印刷出力画面W5には、プレビュー表示欄G51と、印刷ボタンK51と、閉じるボタンK52と、が設けられている。
プレビュー表示欄G51には、プレビュー画面W4のプレビュー表示欄G41と同様に、画像出力部19によって、出力条件受付部20により受け付けられた出力条件を用いて、各代表画像DR1(DR2、DR3)と当該各代表画像DR1(DR2、DR3)に対応するシーンを表すシーン文字列C1(C2、C3)とを対応付けて表示した画像が表示される。更に、プレビュー表示欄G51に表示される画像には、画像出力部19によって、各代表画像DR1(DR2、DR3)と対応付けて選択欄CB1(CB2、CB3)が表示される。
尚、図10は、出力条件受付部20が、上記ステップS31において説明した予め定められた出力条件を受け付けた場合に表示される個別印刷出力画面W5を示している。つまり、図10に示す個別印刷出力画面W5のプレビュー表示欄G51には、図9(A)に示すプレビュー画面W4のプレビュー表示欄G41に表示された画像において、更に、各代表画像DR1(DR2、DR3)と対応付けて選択欄CB1(CB2、CB3)が表示されている。
ユーザーは、操作部33を操作することにより、プレビュー表示欄G51に表示された各代表画像DR1、DR2、DR3の中から、個別に出力する対象の代表画像に対応する選択欄CB1、CB2、CB3を選択入力する。例えば、図10は、ユーザーが選択欄CB2を選択入力したことを示している。画像受付部21は、ユーザーにより少なくとも一以上の選択欄が選択入力された場合、当該選択入力された各選択欄に対応する各代表画像を、個別に出力する対象の代表画像として受け付ける。
印刷ボタンK51は、個別印刷出力処理を実行するためのボタンである。個別印刷出力処理とは、画像形成部32に、画像受付部21により受け付けられた各代表画像を個別に用紙に形成する印刷処理を実行させることにより、各代表画像を出力する処理である。閉じるボタンK52は、個別印刷出力画面W5の表示部331への表示を終了するためのボタンである。
図6に参照を戻す。ステップS51において、画像受付部21により個別に出力する対象の代表画像が受け付けられた後、個別印刷出力画面W5の印刷ボタンK51が押下されたとする(S52;印刷)。この場合、画像出力部19は、個別印刷出力処理を実行する(S53)。つまり、画像出力部19は、ステップS53において、画像形成部32に、画像受付部21により受け付けられた各代表画像を個別に用紙に形成する印刷処理を実行させる。
例えば、ステップS51において、画像受付部21により、個別に出力する対象の代表画像として、図10に示す二つの代表画像DR1、DR2が受け付けられた後、個別印刷出力画面W5の印刷ボタンK51が押下されたとする。この場合、画像出力部19は、ステップS53における個別印刷出力処理において、画像形成部32に、代表画像DR1を用紙に形成する印刷処理と、代表画像DR2を用紙に形成する印刷処理と、を実行させる。これにより、画像出力部19は、画像形成部32に、画像受付部21により受け付けられた各代表画像DR1、DR2を個別に用紙に形成する印刷処理を実行させる。
一方、ステップS51において、個別印刷出力画面W5の閉じるボタンK52が押下された場合(S52;閉じる)、画像出力部19は、個別印刷出力処理を実行せず、画像受付部21は、個別印刷出力画面W5の表示部331への表示を終了する。その後は、ステップS21以降の処理が行われる。
また、個別印刷出力画面W5において終了ボタンK35が押下されたとする(S30;NO、S40;NO、S50;NO、S60;YES)。
この場合、画像出力部19は、ステップS1で受け付けられた受付動画データDMと、各代表画像を表す画像データ、当該各代表画像の選択に用いた代表画像選択画面W2を表す画面データ、及び当該画面データの識別情報と、を対応付けて記憶部34に記憶する(S61)。そして、出力条件受付部20は、出力条件設定画面W3の表示部331への表示を終了する。その後は、ステップS21以降の処理が行われる。
また、ステップS21において、各代表画像を出力するときの出力条件が入力された後、画像変更ボタンK34が押下されたとする(S30;NO、S40;NO、S50;NO、S60;NO)。この場合、出力条件受付部20は、ステップS21において入力された出力条件を受け付ける。図11は、代表画像を変更する動作を示すフローチャートである。
この場合、図11に示すように、変更受付部22は、変更対象選択画面を表示部331に表示する。変更受付部22は、当該変更対象選択画面を用いて、選択受付部18により受け付けられた各代表画像の中から、変更する対象の代表画像をユーザーに選択させる(S71)。
図12は、変更対象選択画面W6の一例を示す図である。具体的には、図12に示すように、変更対象選択画面W6には、プレビュー表示欄G61と、今すぐボタンK61と、後でボタンK62と、閉じるボタンK63と、が設けられている。
プレビュー表示欄G61には、個別印刷出力画面W5のプレビュー表示欄G51と同様に、画像出力部19によって、出力条件受付部20により受け付けられた出力条件を用いて、選択欄CB1(CB2a、CB3)と、各代表画像DR1(DR2a、DR3)と、当該各代表画像DR1(DR2a、DR3)に対応するシーンを表す文字列C1(C2、C3)とを対応付けて表示した画像が表示される。
尚、図12は、出力条件受付部20が上記ステップS31において説明した予め定められた出力条件を受け付けた場合に表示される変更対象選択画面W6を示している。また、図12は、上述の個別印刷出力画面W5のプレビュー表示欄G51(図10)等に表示される代表画像DR2に代えて、選択受付部18によって代表画像DR2aが受け付けられた場合を示している。
ユーザーは、操作部33を操作することにより、プレビュー表示欄G61に表示された各代表画像DR1、DR2a、DR3の中から、変更する対象の代表画像に対応する選択欄CB1、CB2a、CB3を選択する。例えば、図12は、プレビュー表示欄G61に表示されている代表画像DR2aが被写体の一部が欠けた画像となっているため、ユーザーが、代表画像DR2aを変更する対象の代表画像とするために選択欄CB2aを選択したことを示している。
変更受付部22は、今すぐボタンK61が押下された場合に、選択されている各選択欄に対応する各代表画像を、変更する対象の代表画像として受け付ける。
今すぐボタンK61は、選択受付部18に再選択処理を実行させるためのボタンである。再選択処理とは、変更受付部22により受け付けられた各代表画像の選択に用いた代表画像選択画面W2(図4)において、一覧表示されているフレーム画像FDの中から代表画像の再選択を受け付ける処理である。
尚、プレビュー表示欄G61に表示されている選択欄CB1、CB2a、CB3のうち、選択されている選択欄が存在しない場合、変更受付部22は、今すぐボタンK61を押下不可能にする(グレー表示する)。今すぐボタンK61は、ユーザーによって、プレビュー表示欄G61に表示されている代表画像のうちの何れかの代表画像を即時に変更したい場合等に押下される。
後でボタンK62は、プレビュー表示欄G61に表示されている、選択受付部18により受け付けられた各代表画像のうち何れかの代表画像を変更する変更指示を入力するためのボタンである。後でボタンK62は、ユーザーによって、プレビュー表示欄G61に表示されている代表画像の中から、変更する対象の代表画像を、即時ではなく後で選択したい場合等に押下される。
閉じるボタンK63は、変更対象選択画面W6の表示部331への表示を終了するためのボタンである。
図11に参照を戻す。ステップS71において、ユーザーにより、変更対象選択画面W6を用いて、変更する対象の代表画像に対応する選択欄が選択された後、今すぐボタンK61が押下されたとする(S72;今すぐ)。
この場合、変更受付部22は、当該選択入力された各選択欄に対応する各代表画像を変更する対象の代表画像として受け付け、変更対象選択画面W6の表示部331への表示を終了する。そして、選択受付部18は、上述の再選択処理を実行する。
つまり、選択受付部18は、再選択処理を開始すると、ステップS11(図5)と同様に、変更受付部22により受け付けられた各代表画像の選択に用いた代表画像選択画面W2を順次表示部331に表示する。そして、選択受付部18は、各代表画像選択画面W2に対応する各シーンを代表する代表画像又は非選択指示画像NSの再選択と、各シーンを表す文字列の再入力とを受け付けた後、表示部331への各代表画像選択画面W2の表示を終了する(S73)。その後は、ステップS21(図6)以降の処理が行われる。
一方、変更対象選択画面W6において、後でボタンK62が押下されたとする(S72;後で)。この場合、変更指示受付部23は、選択受付部18により受け付けられた各代表画像のうち何れかの代表画像を変更する上記変更指示の入力を受け付ける(S74)。この場合、選択用紙出力部24は、画像形成部32に、選択リスト画像を用紙に形成する印刷処理を行わせることにより、当該選択リスト画像が形成された選択用紙を出力する(S75)。
選択リスト画像とは、選択受付部18により受け付けられた各代表画像と、所定の選択マークを書き込み可能な選択欄と、当該各代表画像の選択に用いた代表画像選択画面W2の識別情報と、を対応付けた画像である。図13は、選択用紙Pの一例を示す図である。
具体的には、図13に示すように、ステップS75において、選択用紙出力部24は、画像出力部19によって変更対象選択画面W6のプレビュー表示欄G61に表示される画像(図12)と同様に、出力条件受付部20により受け付けられた出力条件を用いて、各代表画像DR1(DR2a、DR3)と、選択欄CB1(CB2a、CB3)と、当該各代表画像の選択に用いた代表画像選択画面W2の識別情報を表すQRコード(登録商標)Q1(Q2a、Q3)と、を対応付けて表示した選択リスト画像SLを生成する。
尚、選択用紙出力部24は、代表画像選択画面W2の識別情報を表すQRコードに代えて、当該識別情報を表す、地紋や一次元バーコード等の他の画像を選択リスト画像SLに表示するようにしてもよい。
そして、選択用紙出力部24は、画像形成部32に、当該生成した選択リスト画像SLを用紙に形成する印刷処理を行わせることにより、当該選択リスト画像SLが形成された選択用紙Pを出力する。尚、図13は、出力条件受付部20が、ステップS31において説明した上記予め定められた出力条件を受け付けた場合に出力される選択用紙Pを示している。
ステップS75の実行後は、変更受付部22により、変更対象選択画面W6の表示部331への表示が終了され、ステップS21(図6)以降の処理が行われる。
次に、ステップS75において出力された選択用紙Pを用いて代表画像を変更する動作について説明する。図14は、選択用紙Pを用いて代表画像を変更する動作を示すフローチャートである。尚、以下では、図13に示す選択用紙Pを用いるものとして説明する。
図14に示すように、ユーザーは、選択用紙Pに表示された各代表画像DR1、DR2a、DR3の中から、変更する対象の代表画像に対応する選択欄CB1、CB2a、CB3に選択マークを書き込む(S81)。選択欄に選択マークを書き込むとは、選択欄を塗り潰したり、或いは選択欄にチェックを書き込み、選択欄が選択されたことを識別可能な状態にすることをいう。
そして、ユーザーによる操作部33の操作により、選択用紙Pを用いて代表画像を変更する動作の実行指示が入力されると、変更指示受付部23は、当該実行指示を受け付ける(S82)。
変更指示受付部23によって上記実行指示が受け付けられると、選択受付部18は、選択用紙Pに形成された選択リスト画像SLを読み取らせるようユーザーに案内するメッセージを表示部331に表示する。当該メッセージは、例えば「選択用紙を原稿台に載置してスキャン処理を実行して下さい」等である。
これにより、ユーザーが、操作部33を操作して、選択用紙Pに形成された選択リスト画像SLを画像読取部31に読み取らせるスキャン処理の実行指示を入力すると、選択受付部18は、選択用紙Pに形成された選択リスト画像SLを読み取るスキャン処理を画像読取部31に実行させる(S83)。
ステップS83におけるスキャン処理の実行結果、選択リスト画像SLを表す画像データが制御部10に入力されると、選択受付部18は、当該画像データが表す選択リスト画像SLにおいて、選択マークが書き込まれた選択欄CB1、CB2a、CB3が存在するか否かを判定する(S84)。
そして、選択受付部18は、選択マークが書き込まれた選択欄CB1、CB2a、CB3が存在すると判定したとする(S84;YES)。この場合、選択受付部18は、当該選択リスト画像SLにおいて、当該選択マークが書き込まれた各選択欄CB1、CB2a、CB3と対応付けて表示されている各QRコードQ1、Q2a、Q3が表す識別情報を解読する。
そして、選択受付部18は、当該解読した各識別情報と対応付けて記憶部34に記憶されている各代表画像選択画面W2を表す画面データを取得する(S85)。つまり、選択受付部18は、ステップS85において、当該選択マークが書き込まれた各選択欄CB1、CB2a、CB3に対応する各代表画像の選択に用いた各代表画像選択画面W2を表す画面データを取得する。
そして、選択受付部18は、ステップS11(図5)と同様に、ステップS85で取得した各画面データが表す各代表画像選択画面W2を順次表示部331に表示する。そして、選択受付部18は、当該各代表画像選択画面W2に対応する各シーンを代表する代表画像又は非選択指示画像NSの再選択と、各シーンを表す文字列の再入力とを受け付けた後、表示部331への各代表画像選択画面W2の表示を終了する(S86)。その後は、ステップS21(図6)以降の処理が行われる。
一方、ステップS84において、選択受付部18は、選択リスト画像SLに選択マークが書き込まれた選択欄が存在しないと判定したとする(S84;NO)。
この場合、選択受付部18は、警告メッセージを表示部331に表示し(S87)、選択用紙Pを用いた代表画像を変更する動作を終了する。当該警告メッセージは、選択リスト画像SL内の何れかの選択欄に選択マークを入力後に、代表画像の変更動作を再実行するようユーザーに案内する旨のメッセージである。例えば、当該警告メッセージは、「変更したい代表画像のチェック欄にチェックを入れた後、再度実行してください。」等である。
このように、上記実施形態の構成によれば、以下に示す効果が得られる。
つまり、上記実施形態の構成によれば、受付動画データDMにおいて、音声の音量が直前のサンプル点に対応する音声の音量に対して所定の基準音量差以上増大している、音量変化に特徴が見られる一以上の基準サンプル点BSが検出される。また、各基準サンプル点BSに対応する基準画像Dを含む時系列に並んだ所定のサンプル数分の画像が、当該各基準サンプル点BSに対応する各シーンを構成するフレーム画像FDとして抽出される。
つまり、上記実施形態の構成によれば、受付動画データDMが表す動画の特徴的な内容を表していると考えられる、音量変化に特徴が見られる一以上のシーンを、ユーザーに手間をかけさせることなく、自動的に検出することができる。また、当該検出した各シーンに対応する時系列に並んだ所定のサンプル数分の画像を、当該各シーンを構成するフレーム画像FDとして、ユーザーに手間をかけさせることなく、自動的に抽出することができる。
そして、ユーザーは、当該抽出された各フレーム画像FDが一覧表示された代表画像選択画面W2(図4)を用いて、当該各フレーム画像FDの中から意図した画像を各シーンを代表する代表画像として選択し、当該選択した各代表画像を出力することができる。
このように、上記実施形態の構成によれば、ユーザーが意図した、動画の特徴的な内容を表す画像を、受付動画データDMから容易に抽出して出力することができる。
また、上記実施形態の構成によれば、受付動画データDMが表す動画が全体的に音量変化が小さい動画であったとしても、ユーザーは、条件設定画面W1の入力欄G13(図3)に入力する基準音量差を小さくすることにより、検出部12に基準サンプル点BSを検出させることができる。反対に、受付動画データDMが表す動画が全体的に音量変化が大きい動画であったとしても、ユーザーは、入力する基準音量差を大きくすることにより、検出部12によって不要に多くの基準サンプル点BSが検出される虞を低減することができる。
このようにして、ユーザーは、入力する基準音量差を調整することにより、検出部12によって検出される基準サンプル点BSの数を調整することができる。これにより、ユーザーは、各基準サンプル点BSに対応する各シーンを代表する代表画像の選択に用いる代表画像選択画面W2(図4)の数を調整することができ、選択する代表画像の数を調整することができる。
また、上記実施形態の構成によれば、基準サンプル点BSよりも過去及び/又は未来へ所定の基準時間BTおきに離れたサンプル点に対応する画像が各フレーム画像FDに含まれる。このため、ユーザーは、各フレーム画像FDに含まれる基準時間BTおきに時系列に連続する画像の中から代表画像としての画像を選択する場合に、基準サンプル点BSとの相対的な時間を意識しながら意図した画像を選択することができる。
また、上記実施形態の構成によれば、ユーザーは、条件設定画面W1の入力欄G14(図3)に入力する基準時間BTを小さくすることにより、基準サンプル点BSに時間的に近いサンプル点に対応する画像をフレーム画像FDに含めることができる。また、ユーザーは、入力する基準時間BTを大きくすることにより、基準サンプル点BSから時間的に離れたサンプル点に対応する画像をフレーム画像FDに含めることができる。このようにして、ユーザーは、入力する基準時間BTを調整することにより、フレーム画像FDに含める画像を調整することができる。
また、上記実施形態の構成によれば、ユーザーは、条件設定画面W1の入力欄G15(図3)に入力するサンプル数を調整することにより、フレーム画像FDに含まれる画像の数を調整することができる。このため、ユーザーは、入力するサンプル数を小さくすることにより、フレーム画像FDに含める画像の数を少なくし、効率よく代表画像を選択することができる。これとは反対に、ユーザーは、入力するサンプル数を大きくすることにより、フレーム画像FDに含める画像の数を多くし、意図したものに近い代表画像を選択する可能性を高めることできる。
また、上記実施形態の構成によれば、ユーザーは、受付動画データDMが表す動画において、予め音量変化が大きい時間帯を知っている場合、当該時間帯の開始時刻を条件設定画面W1の入力欄G11(図3)に入力し、当該時間帯の終了時刻を条件設定画面W1の入力欄G12(図3)に入力することにより、検出部12によって基準サンプル点BSを効率よく検出させることができる。
また、上記実施形態の構成によれば、ユーザーは、検出部12により検出された基準サンプル点BSの数が所定の制限数になる度に(S9;NO、図5)、検出部12による基準サンプル点BSの検出を継続させるか否かを選択することができる。このため、ユーザーは、検出部12が制限なく基準サンプル点BSを検出し続けることにより、代表画像の数が不要に増大する虞を低減することができる。
また、上記実施形態の構成によれば、ユーザーは、フレーム画像FDの中に代表画像として選択したい画像が存在しない場合に、非選択指示画像NS(図4)を選択することにより(非選択指示を入力することにより)、意図しない代表画像を選択することを回避することができる。
また、上記実施形態の構成によれば、各代表画像が所定のレイアウトで配置して出力されるので、ユーザーは出力された各代表画像を視認しやすくなる。
また、上記実施形態の構成によれば、ユーザーは、出力条件設定画面W3の選択欄G31(図7)において意図したレイアウトを選択することにより、各代表画像を意図したレイアウトで配置して出力することができる。
また、上記実施形態の構成によれば、ユーザーは、選択受付部18により受け付けられた各代表画像の中に個別に出力したい代表画像が含まれている場合に、個別印刷出力画面W5を用いて、当該代表画像を個別に出力する対象として選択し、当該代表画像を個別に出力することができる(S51〜S53、図6)。
また、上記実施形態の構成によれば、複数の代表画像が出力された場合に、各代表画像のサイズが所定の出力サイズに揃っているので、ユーザーは当該複数の代表画像を視認しやすくなる。
また、上記実施形態の構成によれば、出力条件設定画面W3の出力サイズ選択欄G32(図7)において、出力サイズの決定方法「自動」が選択されていた場合、代表画像が最適なサイズで出力されるので、ユーザーは代表画像を視認しやすくなる。
また、上記実施形態の構成によれば、ユーザーは、出力条件設定画面W3の出力サイズ選択欄G32(図7)において、出力サイズの決定方法「手動」を選択し、更に、リストボックスから選択する一の変換率を調整することにより、画像出力部19によって出力される各代表画像のサイズを意図したサイズに調整することができる。
また、上記実施形態の構成によれば、シーンを代表する代表画像と、代表画像選択画面W2(図4)の入力欄G22に入力された当該シーンを表すシーン文字列と、が対応付けて出力される。このため、ユーザーは、代表画像に対応するシーンの特徴を明確に表すような文字列を代表画像選択画面W2(図4)の入力欄G22に入力することにより、代表画像だけを出力する場合に比して、代表画像に対応するシーンの特徴をより明確にして出力することができる。
また、上記実施形態の構成によれば、シーンを代表する代表画像と対応付けて出力されるシーン文字列が、文字列認識部15によって、当該シーンに対応する代表画像選択画面W2(図4)の入力欄G22に自動的に入力される。このため、ユーザーが、代表画像選択画面W2(図4)の入力欄G22にシーン文字列を入力する手間を軽減することができる。
また、上記実施形態の構成によれば、ユーザーは、出力条件設定画面W3の出力位置選択欄G33(図7)において、意図した相対出力位置を選択することにより、シーン文字列を意図した位置に出力することができる。これにより、ユーザーは、シーン文字列の代表画像に対する相対的な出力位置が固定されている場合に比して、代表画像及びシーン文字列の見易さを向上することができる。
また、上記実施形態の構成によれば、出力条件設定画面W3の出力位置選択欄G33(図7)において、相対出力位置「重ねる」を選択しておくことにより、シーン文字列を代表画像に重ねて出力することができる。この場合、代表画像とシーン文字列とによって占有されるスペースを軽減することができる。
また、上記実施形態の構成によれば、ユーザーは、代表画像を誤って選択した場合であっても、当該代表画像の選択に用いた代表画像選択画面W2(図4)において代表画像を再選択することができ、当該誤って選択した代表画像を意図した代表画像に変更することができる(S71〜S73、図11)。
また、上記実施形態の構成によれば、ユーザーは、変更指示を入力して選択用紙Pを出力させた後(S74、S75、図11)、都合のよいときに当該選択用紙Pにおいて変更する対象の代表画像に対応する選択欄に選択マークを書き込むことができる。そして、ユーザーは、都合の良いときに当該選択用紙Pに形成されている選択リスト画像SL(図13)を画像読取部31により読み取らせ、当該変更する対象の代表画像を意図した代表画像に変更することができる(S81〜S86、図14)。
尚、上記実施形態は、本発明に係る実施形態の例示に過ぎず、本発明を上記実施形態に限定する趣旨ではない。例えば、以下に示す変形実施形態であってもよい。
(1)変更対象選択画面W6(図12)に後でボタンK62を設けないようにしてもよい。これに合わせて、制御部10が、変更指示受付部23及び選択用紙出力部24として動作しないようにし、図11に示すステップS74、S75及び図14に示す動作を省略してもよい。又は、変更対象選択画面W6(図12)に今すぐボタンK61を設けないようにし、図11に示すステップS73を省略してもよい。又は、出力条件設定画面W3(図7)に画像変更ボタンK34を設けないようにしてもよい。これに合わせて、制御部10が、変更受付部22、変更指示受付部23及び選択用紙出力部24として動作しないようにし、図11及び図14に示す動作を省略してもよい。
(2)出力条件受付部20が、出力条件設定画面W3(図7)の出力位置選択欄G33に相対出力位置「重ねる」を表示しないようにしてもよい。又は、出力条件設定画面W3(図7)に出力位置選択欄G33を設けないようにし、画像出力部19が、不揮発性メモリー等に予め記憶されている相対出力位置にシーン文字列を出力するようにしてもよい。
(3)制御部10が、音声抽出部14及び文字列認識部15として動作しないようにし、図5に示すステップS5、S6を省略してもよい。
(4)代表画像選択画面W2(図4)に入力欄G22を設けないようにして、画像出力部19が各代表画像に対応するシーンを表すシーン文字列を出力しないようにしてもよい。
(5)出力条件受付部20が、出力条件設定画面W3(図7)の出力サイズ選択欄G32に、出力サイズの決定方法「手動」及びリストボックスを表示しないようにしてもよい。又は、出力条件受付部20が、出力サイズ選択欄G32に、出力サイズの決定方法「自動」を表示しないようにしてもよい。これに合わせて、記憶部34に、画像の解像度と、当該解像度の画像を出力するときに最適な画像のサイズである最適サイズとを記憶しないようにしてもよい。又は、出力条件設定画面W3(図7)に出力サイズ選択欄G32を設けないようにし、画像出力部19が代表画像のサイズを変換せずに出力するようにしてもよい。
(6)画面生成部17が、代表画像選択画面W2(図4)の選択欄G21に非選択指示画像NSを表示しないようにしてもよい。
(7)図5に示すステップS9、S12を省略し、これに合わせて、検出部12が、ステップS3(図5)で受け付けられた開始時刻から終了時刻までの期間に対応する受付動画データDMにおいて基準サンプル点BSを検出することを終了していない場合に(S8;NO)、ステップS4を実行するようにしてもよい。つまり、検出部12が、基準サンプル点BSの検出を中断しないようにしてもよい。
(8)条件設定画面W1(図3)に、開始時刻の入力欄G11と、終了時刻の入力欄G12と、を設けないようにしてもよい。これに合わせて、検出部12が、ステップS4(図5)において、受付動画データDMの開始時刻から終了時刻までの全期間において基準サンプル点BSを検出するようにしてもよい。
(9)条件設定画面W1(図3)に、サンプル数の入力欄G15を設けないようにしてもよい。これに合わせて、画像抽出部13が、ステップS7(図5)において、不揮発性メモリー等に予め記憶されているサンプル数分の画像をフレーム画像FDとして抽出するようにしてもよい。
(10)条件設定画面W1(図3)に、基準時間BTの入力欄G14を設けないようにしてもよい。これに合わせて、画像抽出部13が、ステップS7(図5)において、基準サンプル点BSから不揮発性メモリー等に予め記憶されている基準時間BTおきに過去に遡ったサンプル点及び/又は基準サンプル点BSから当該基準時間BTおきに未来に進んだサンプル点に対応する画像を、フレーム画像FDとして抽出するようにしてもよい。又は、画像抽出部13が、ステップS7(図5)において、基準時間BTに関係なく、基準サンプル点BSに対応する基準画像Dを含む時系列に並んだ所定のサンプル数分の画像を任意に抽出するようにしてもよい。
(11)条件設定画面W1(図3)に、基準音量差の入力欄G13を設けないようにしてもよい。これに合わせて、検出部12が、ステップS4(図5)において、不揮発性メモリー等に予め記憶されている基準音量差を用いて基準サンプル点BSを検出するようにしてもよい。
(12)上記実施形態の構成において、画面生成部17は、シーン毎に代表画像選択画面W2(図4)を生成し、選択受付部18は、各代表画像選択画面W2において一の代表画像の選択を受け付けていた。しかし、これに代えて、画面生成部17が、複数のシーン毎に、当該複数のシーンのそれぞれを構成する複数のフレーム画像がそれぞれ一覧表示された一の代表画像選択画面を生成するようにしてもよい。これに合わせて、選択受付部18が、当該一の代表画像選択画面において、当該複数のシーンのそれぞれを代表する複数の代表画像の選択を受け付けるようにしてもよい。
1 複合機(画像処理装置)
11 動画受付部
12 検出部
13 画像抽出部
14 音声抽出部
15 文字列認識部
16 抽出条件受付部(第一受付部、第二受付部、第三受付部、第四受付部)
17 画面生成部
18 選択受付部
19 画像出力部
20 出力条件受付部(配置受付部、サイズ受付部、位置受付部)
21 画像受付部
22 変更受付部
23 変更指示受付部
24 選択用紙出力部
31 画像読取部
34 記憶部(サイズ記憶部)
BS、BS1、BS2、BS3 基準サンプル点
BT 基準時間
C1、C2、C3 シーン文字列
CB1、CB2a、CB3 選択欄
D、D1、D2、D3 基準画像
DD 画像データ
DM 受付動画データ
DV 音声データ
FD、FD1、FD2、FD3 フレーム画像
G22 入力欄
P 選択用紙
SL 選択リスト画像
SV、SV1、SV2、SV3 代表音声
V1、V2、V3 基準音声
W2 代表画像選択画面(操作画面)

Claims (20)

  1. 時系列に並べられた複数の画像を示す画像データ及び前記複数の画像に対応する複数の音声を示す音声データを含む動画データの入力を受け付ける動画受付部と、
    前記動画受付部により受け付けられた前記動画データである受付動画データにおいて、前記音声の音量が直前のサンプル点に対応する前記音声の音量に対して所定の基準音量差以上増大する一以上のサンプル点を基準サンプル点として検出する検出部と、
    前記検出部により検出された前記基準サンプル点のそれぞれについて、当該基準サンプル点に対応する基準画像を含む時系列に並んだ所定のサンプル数分の画像を、当該基準サンプル点に対応するシーンを構成するフレーム画像として、前記受付動画データから抽出する画像抽出部と、
    各前記シーンにおいて、前記画像抽出部により抽出された当該各シーンを構成するフレーム画像が一覧表示された操作画面を生成する画面生成部と、
    前記画面生成部により生成された前記操作画面において、一覧表示されている前記フレーム画像の中から前記シーンを代表する代表画像の選択を受け付ける選択受付部と、
    前記選択受付部により受け付けられた前記代表画像を出力する画像出力部と、
    を備える画像処理装置。
  2. ユーザーによる前記基準音量差の入力を受け付ける第一受付部を更に備える請求項1に記載の画像処理装置。
  3. 前記画像抽出部は、前記基準サンプル点から所定の基準時間おきに過去に遡ったサンプル点に対応する画像及び/又は前記基準サンプル点から前記基準時間おきに未来に進んだサンプル点に対応する画像を、前記フレーム画像として抽出する請求項1又は2に記載の画像処理装置。
  4. ユーザーによる前記基準時間の入力を受け付ける第二受付部を更に備える請求項3に記載の画像処理装置。
  5. ユーザーによる前記サンプル数の入力を受け付ける第三受付部を更に備える請求項1から4の何れか一項に記載の画像処理装置。
  6. ユーザーによる開始時刻及び終了時刻の入力を受け付ける第四受付部を更に備え、
    前記検出部は、前記受付動画データのうち、前記第四受付部により受け付けられた前記開始時刻から前記第四受付部により受け付けられた前記終了時刻までの期間に対応する前記動画データにおいて、前記基準サンプル点を検出する請求項1から5の何れか一項に記載の画像処理装置。
  7. 前記検出部は、検出した前記基準サンプル点の数が所定の制限数になる度に、前記基準サンプル点の検出を中断し、以降の前記基準サンプル点の検出を再開するか否かをユーザーに選択させ、前記基準サンプル点の検出を再開することが選択されたときは、以降の前記基準サンプル点の検出を再開する一方、前記基準サンプル点の検出を再開しないことが選択されたときは、前記基準サンプル点の検出を終了する請求項1から6の何れか一項に記載の画像処理装置。
  8. 前記操作画面は、前記代表画像を選択しないことを指示する非選択指示が入力可能であり、
    前記選択受付部は、前記操作画面において前記非選択指示が入力された場合、当該操作画面に対応する前記シーンを代表する前記代表画像の選択を受け付けない請求項1から7の何れか一項に記載の画像処理装置。
  9. 前記画像出力部は、前記選択受付部により受け付けられた各前記代表画像を所定のレイアウトで配置して出力する請求項1から8の何れか一項に記載の画像処理装置。
  10. ユーザーによる前記レイアウトの入力を受け付ける配置受付部を更に備える請求項9に記載の画像処理装置。
  11. 前記選択受付部により受け付けられた各前記代表画像の中から、個別に出力する対象の前記代表画像の選択を受け付ける画像受付部を更に備え、
    前記画像出力部は、前記画像受付部により受け付けられた前記代表画像を個別に出力する請求項9又は10に記載の画像処理装置。
  12. 前記画像出力部は、前記代表画像のサイズを所定の出力サイズに変換して出力する請求項1から11の何れか一項に記載の画像処理装置。
  13. 画像の解像度と、当該解像度の画像を出力するときに最適な画像のサイズである最適サイズと、を予め対応付けて記憶するサイズ記憶部を更に備え、
    前記出力サイズは、前記代表画像の解像度と対応付けて前記サイズ記憶部に記憶されている前記最適サイズに定められている請求項12に記載の画像処理装置。
  14. 前記代表画像を出力するときの所望のサイズの入力を受け付けるサイズ受付部を更に備え、
    前記画像出力部は、前記サイズ受付部により受け付けられた前記所望のサイズを前記出力サイズとする請求項12又は13に記載の画像処理装置。
  15. 前記操作画面は、当該操作画面に対応する前記シーンを表す文字列であるシーン文字列の入力欄を備え、
    前記画像出力部は、前記シーンを代表する前記代表画像と、当該シーンに対応する前記操作画面の前記入力欄に入力された前記シーン文字列と、を対応付けて出力する請求項1から14の何れか一項に記載の画像処理装置。
  16. 前記検出部により検出された前記基準サンプル点のそれぞれについて、当該基準サンプル点に対応する基準音声を含む時系列に連続する所定数分の音声を、当該基準サンプル点に対応する前記シーンを代表する代表音声として、前記受付動画データから抽出する音声抽出部と、
    前記音声抽出部により抽出された各前記代表音声に対して所定の音声認識処理を行うことにより認識した文字列を、当該各代表音声に対応する前記シーンに対応する前記操作画面の前記入力欄に入力する文字列認識部を更に備える請求項15に記載の画像処理装置。
  17. 前記画像出力部が、前記シーンを代表する前記代表画像と、当該シーンに対応する前記シーン文字列とを対応付けて出力するときの、当該代表画像に対する当該シーン文字列の相対的な出力位置の入力をユーザーから受け付ける位置受付部を更に備える請求項15又は16に記載の画像処理装置。
  18. 前記相対的な出力位置には、前記代表画像と重なる位置が含まれる請求項17に記載の画像処理装置。
  19. 前記選択受付部により受け付けられた各前記代表画像の中から、変更する対象の前記代表画像の選択を受け付ける変更受付部を更に備え、
    前記選択受付部は、前記変更受付部により前記変更する対象の前記代表画像が受け付けられた場合、当該変更する対象の前記代表画像の選択に用いた前記操作画面において、一覧表示されている前記フレーム画像の中から前記代表画像の再選択を受け付ける請求項1から18の何れか一項に記載の画像処理装置。
  20. 用紙に形成された画像を読み取る画像読取部と、
    前記選択受付部により受け付けられた各前記代表画像のうち何れかの前記代表画像を変更する変更指示の入力を受け付ける変更指示受付部と、
    前記変更指示受付部により前記変更指示が受け付けられた場合、前記選択受付部により受け付けられた各前記代表画像と、所定の選択マークを書き込み可能な選択欄と、当該各代表画像の選択に用いた前記操作画面の識別情報と、を対応付けた選択リスト画像が形成された用紙である選択用紙を出力する選択用紙出力部と、
    を備え、
    前記選択受付部は、前記選択用紙に形成された前記選択リスト画像が前記画像読取部によって読み取られた場合に、当該選択リスト画像に前記選択マークが書き込まれた前記選択欄が存在するときは、当該選択リスト画像において当該選択欄と対応付けられている前記識別情報によって識別される前記操作画面において、一覧表示されている前記フレーム画像の中から前記代表画像の再選択を受け付ける請求項1から19の何れか一項に記載の画像処理装置。
JP2015015418A 2015-01-29 2015-01-29 画像処理装置 Expired - Fee Related JP6063971B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2015015418A JP6063971B2 (ja) 2015-01-29 2015-01-29 画像処理装置
CN201610041865.1A CN105847622B (zh) 2015-01-29 2016-01-21 图像处理装置
US15/010,283 US9774758B2 (en) 2015-01-29 2016-01-29 Image processing apparatus that extracts image showing distinctive content of moving image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015015418A JP6063971B2 (ja) 2015-01-29 2015-01-29 画像処理装置

Publications (2)

Publication Number Publication Date
JP2016140029A true JP2016140029A (ja) 2016-08-04
JP6063971B2 JP6063971B2 (ja) 2017-01-18

Family

ID=56554978

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015015418A Expired - Fee Related JP6063971B2 (ja) 2015-01-29 2015-01-29 画像処理装置

Country Status (3)

Country Link
US (1) US9774758B2 (ja)
JP (1) JP6063971B2 (ja)
CN (1) CN105847622B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11838459B2 (en) 2019-06-07 2023-12-05 Canon Kabushiki Kaisha Information processing system, information processing apparatus, and information processing method

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1032773A (ja) * 1996-07-16 1998-02-03 Nippon Telegr & Teleph Corp <Ntt> 要約映像ブラウジング方法および装置
JP2004248312A (ja) * 2004-03-25 2004-09-02 Casio Comput Co Ltd 画像処理装置及び画像処理方法
JP2005303840A (ja) * 2004-04-14 2005-10-27 Sony Corp 動画編集装置及び動画編集方法
JP2010245983A (ja) * 2009-04-09 2010-10-28 Nippon Telegr & Teleph Corp <Ntt> 映像構造化装置,映像構造化方法および映像構造化プログラム
JP2012060238A (ja) * 2010-09-06 2012-03-22 Sony Corp 動画像処理装置、動画像処理方法およびプログラム
JP2012085227A (ja) * 2010-10-14 2012-04-26 Fujitsu Ten Ltd サムネイル画像生成方法、及びサムネイル画像生成装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001265378A (ja) 2000-03-22 2001-09-28 Canon Inc 情報処理装置、方法、システム及び記憶媒体
JP2004229160A (ja) 2003-01-27 2004-08-12 Canon Inc デジタル放送受信装置
JP4241228B2 (ja) * 2003-07-11 2009-03-18 キヤノン株式会社 撮像装置
KR20080101644A (ko) * 2006-03-14 2008-11-21 소니 가부시끼 가이샤 화상 처리 장치 및 화상 처리 방법
US7995901B2 (en) * 2007-03-23 2011-08-09 Eastman Kodak Company Facilitating video clip identification from a video sequence
JP5200483B2 (ja) * 2007-10-18 2013-06-05 ソニー株式会社 冊子型表示装置、冊子型表示装置を用いた動画編集方法
JP5390828B2 (ja) * 2008-10-17 2014-01-15 キヤノン株式会社 画像処理装置、及び、画像処理方法
US8244070B2 (en) * 2009-06-01 2012-08-14 Xerox Corporation Real-time image personalization
CN102685574A (zh) * 2011-03-09 2012-09-19 须泽中 从数字电视节目中自动抽取图像的系统及其应用
JP5920702B2 (ja) * 2012-02-07 2016-05-18 株式会社熊平製作所 デジタル録画装置
CN103428406B (zh) * 2012-05-23 2017-11-07 中兴通讯股份有限公司 监控录像分析方法和装置
KR102306538B1 (ko) * 2015-01-20 2021-09-29 삼성전자주식회사 콘텐트 편집 장치 및 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1032773A (ja) * 1996-07-16 1998-02-03 Nippon Telegr & Teleph Corp <Ntt> 要約映像ブラウジング方法および装置
JP2004248312A (ja) * 2004-03-25 2004-09-02 Casio Comput Co Ltd 画像処理装置及び画像処理方法
JP2005303840A (ja) * 2004-04-14 2005-10-27 Sony Corp 動画編集装置及び動画編集方法
JP2010245983A (ja) * 2009-04-09 2010-10-28 Nippon Telegr & Teleph Corp <Ntt> 映像構造化装置,映像構造化方法および映像構造化プログラム
JP2012060238A (ja) * 2010-09-06 2012-03-22 Sony Corp 動画像処理装置、動画像処理方法およびプログラム
JP2012085227A (ja) * 2010-10-14 2012-04-26 Fujitsu Ten Ltd サムネイル画像生成方法、及びサムネイル画像生成装置

Also Published As

Publication number Publication date
US9774758B2 (en) 2017-09-26
JP6063971B2 (ja) 2017-01-18
CN105847622B (zh) 2019-01-01
US20160227054A1 (en) 2016-08-04
CN105847622A (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
US9639242B2 (en) Image processing apparatus, method for controlling image processing apparatus, and storage medium
US20200267268A1 (en) Image forming apparatus, display control method, and recording medium
US20090138268A1 (en) Data processing device and computer-readable storage medium storing set of program instructions excutable on data processing device
US9600162B2 (en) Information processing apparatus, information processing method, and computer readable-recording medium
US10484550B2 (en) Display control apparatus that displays preview image, control method therefor, and storage medium
JP6063971B2 (ja) 画像処理装置
JP6354385B2 (ja) 表示装置、表示方法およびプログラム
JP2009301248A (ja) 言語処理装置
JP2015039095A (ja) 電子機器、方法およびプログラム
JP2007334025A (ja) 操作装置及び画像形成装置
US10114518B2 (en) Information processing system, information processing device, and screen display method
JP6245103B2 (ja) 画像処理装置
CN111131691A (zh) 电子设备、电子设备的控制方法以及存储介质
JP6953957B2 (ja) 画像処理装置及びプログラム
JP2016096393A (ja) 情報処理装置、システム、情報処理方法およびプログラム
JP6076320B2 (ja) 画像形成装置および入力方法
US10992830B2 (en) Information processing terminal having operable objects on a screen, information processing system having operable objects on a screen, and operation screen display method regarding operable object
JP2018205849A (ja) 携帯端末および電子システム
EP2296081A1 (en) Image processing apparatus and method of controlling the same
US20200236235A1 (en) Information processing system, information processing apparatus, and method
JP2017174286A (ja) プログラム及び端末装置
JP2008244545A (ja) 画像処理装置
US20240185628A1 (en) Client terminal, control method for client terminal, and storage medium
JP2013115691A (ja) 撮像装置及び撮像装置に用いる制御プログラム
JP6002646B2 (ja) 文字入力装置、文字入力プログラム及び画像形成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160603

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20160603

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20160726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161219

R150 Certificate of patent or registration of utility model

Ref document number: 6063971

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees