JP2006154626A - 画像提示装置、画像提示方法およびスライドショー提示装置 - Google Patents
画像提示装置、画像提示方法およびスライドショー提示装置 Download PDFInfo
- Publication number
- JP2006154626A JP2006154626A JP2004348446A JP2004348446A JP2006154626A JP 2006154626 A JP2006154626 A JP 2006154626A JP 2004348446 A JP2004348446 A JP 2004348446A JP 2004348446 A JP2004348446 A JP 2004348446A JP 2006154626 A JP2006154626 A JP 2006154626A
- Authority
- JP
- Japan
- Prior art keywords
- visual effect
- lyrics
- time
- correction
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
【課題】 楽曲の歌詞の内容に合わせて、動きを伴う視覚効果を付加することを可能とする画像提示装置等を提供する。
【解決手段】 歌詞単語抽出部101、出現時刻抽出部102を含んだ歌詞抽出部10、視覚効果データベース11、視覚効果検索部12、視覚効果付加部13、演奏特徴抽出部14を備え、視覚効果付加部13に視覚効果補正部131を設けることにより、複数の単語が短い区間に連続して出現するような場合においても、楽曲の歌詞の内容に合わせて、動きを伴う視覚効果を付加することが可能となる。
【選択図】 図1
【解決手段】 歌詞単語抽出部101、出現時刻抽出部102を含んだ歌詞抽出部10、視覚効果データベース11、視覚効果検索部12、視覚効果付加部13、演奏特徴抽出部14を備え、視覚効果付加部13に視覚効果補正部131を設けることにより、複数の単語が短い区間に連続して出現するような場合においても、楽曲の歌詞の内容に合わせて、動きを伴う視覚効果を付加することが可能となる。
【選択図】 図1
Description
本発明は、歌詞を伴う楽曲に合わせて視覚効果を付加する画像提示装置およびその方法に関し、さらに、上記の視覚効果付加機能を備えたスライドショー生成装置に関する。
デジタルカメラやカメラ付き携帯電話が広く普及することに伴い、デジタル画像が数多く撮影・保存されるようになってきている。
従来、デジタル画像を閲覧する方法の一つとして、画像を順番に切り換えて表示するスライドショーという機能がある。
最近になり、単純に画像を切り換えながら表示するだけでなく、BGMとして音楽を再生しつつ、画像に対してパンやズームといった様々な視覚効果を施して表示する、より娯楽性を高めたタイプのスライドショーが登場している。
一方、対象は異なるが、同じように音楽とともに画像の表示を行うアプリケーションにカラオケ装置がある。この分野の従来技術としては、歌詞などから抽出した雰囲気を表わす情報である雰囲気情報を生成し、生成された雰囲気情報に対応する表示を行うことにより、娯楽性を高めたカラオケ装置が提案されている(特許文献1参照)。
特許文献1に記載されたカラオケ装置4のうち、歌詞などに基づく雰囲気情報の生成と、生成された雰囲気情報に対応する表示に関する部分を抜粋した構成を図16に示す。本装置4は、歌詞抽出部30、感性語データベース31、感性語検索部32、表示制御部33、表示部34からなり、歌詞抽出部30は、歌詞単語抽出部301、出現時刻抽出部302を含む。
歌詞抽出部30は、入力された楽曲情報から、歌詞単語抽出部301によって歌詞に出現する単語を抽出し、出現時刻抽出部302によってその単語が歌詞中に出現する時刻を抽出する。
感性語データベース31は、単語とその感性情報との対応関係を保持している。感性語検索部32は、歌詞単語抽出部301によって抽出された単語が感性語データベース31に存在するか探索し、もし単語が存在した場合には、その単語に対応する感性情報を感性語データベース31から取得する。
表示制御部33は、感性語検索部32で取得された感性情報から雰囲気情報を生成し、生成された雰囲気情報に基づいて、出現時刻抽出部302で得られる歌詞の出現時刻における表示を制御する。例えば、背景などの表示色や、画面に表示される人物の顔の表情を制御する。表示部34は、表示制御部33の制御に従って画面に表示を行う。
上述した、BGMとして音楽を再生しつつ、画像に対して視覚効果を施して表示するタイプのスライドショーにおいても、音楽が歌詞のある楽曲の場合、上記特許文献1に記載のカラオケ装置と同様に、歌詞の内容に合わせて視覚効果を施すことが考えられる。
特開平9−212480号公報
しかしながら、上記特許文献1では、以下のような問題を有している。
上述のスライドショーにおける視覚効果には、パンやズームといった動きを伴う効果が存在する。これらの動きを伴う視覚効果の再生には、ある一定の時間が必要であるが、上記特許文献1では、視覚効果における所要時間が考慮されていない。
上述のスライドショーにおける視覚効果には、パンやズームといった動きを伴う効果が存在する。これらの動きを伴う視覚効果の再生には、ある一定の時間が必要であるが、上記特許文献1では、視覚効果における所要時間が考慮されていない。
ここで、図17に示すような場合を考える。図17では、感性語データベース31に存在する、歌詞中の単語A、B、Cが短い区間に連続して出現している。そして、各単語に対応する視覚効果に必要な時間が、各単語が出現する時間間隔よりも長くなっており、各視覚効果の時間が重なっている。したがって、単語A、B、Cに対応する各視覚効果を、それぞれの出現時刻に対してそのまま順に付加することができない。
すなわち、特許文献1で記載されているような、表示色や表情の制御のように瞬間的な表示の変化の場合は、感性語データベース31に存在する複数の単語が短い区間に連続して出現しても、各単語が出現した時点時点で表示を変化させればよく、特許文献1に記載の構成でも問題ない。しかし、動きを伴う視覚効果の場合には、一定の時間が必要となるため特許文献1の構成では対応できないということである。したがって、何らかの補正手段が必要となる。
本発明は、上記の課題を解決するものであり、楽曲の歌詞の内容に合わせて、動きを伴う視覚効果を適切に付加することを可能とする画像提示装置等を提供することを目的とする。
上記の目的を達成するために、本発明に係る画像提示装置は、歌詞を伴う楽曲の再生とともに歌詞と画像とを表示する画像提示装置であって、歌詞とその出現時間を含む楽曲データから歌詞を抽出する抽出手段と、抽出された歌詞の出現時間を特定する歌詞時間特定手段と、複数の視覚効果情報と視覚効果の表示に要する所要時間とを対応させて記憶する記憶手段と、抽出された歌詞に基づいて、画像に適用する視覚効果を決定する決定手段と、前記歌詞の出現時間に応じて、決定された視覚効果に対応する所要時間を補正する補正手段と、歌詞に合わせて、補正後の所要時間の間、視覚効果を制御する制御手段とを備えることを特徴とする。
これにより、複数の歌詞が短い区間に連続して出現するような場合においても、楽曲の歌詞の内容に合わせて、動きを伴う視覚効果を付加することが可能となる。
ここで、前記画像提示装置は、さらに、歌詞と視覚効果情報との対応関係を保持する保持手段を備え、前記決定手段は、前記抽出手段で抽出された歌詞が、前記保持手段に含まれているかを検索することによって視覚効果を決定してもよい。
この構成によれば、歌詞が保持手段に含まれていた場合に、視覚効果を当該視覚効果の所要時間情報を付加して決定される。
ここで、前記画像提示装置は、さらに、歌詞と属性とを対応づけて保持する第1保持手段と、属性と視覚効果との対応関係を保持する第2保持手段とを備え、前記決定手段は、前記抽出手段で抽出された歌詞が、前記第1保持手段に含まれているかを検索し、含まれていた場合に対応する属性を読み出し、さらに、前記第2保持手段を参照して、読み出した前記属性に対応する視覚効果検索することによって視覚効果を決定してもよい。
この構成によれば、歌詞が第1保持手段に含まれていた場合に属性を読み出され、読み出された属性に対応する視覚効果が当該視覚効果の所要時間情報を付加して決定される。
ここで、前記制御手段は、補正後の所要時間内に、視覚効果の表示を収めるように視覚効果の処理速度を調整してもよい。
この構成によれば、動作速度が調整され補正がおこなわれる。
ここで、前記制御手段は、補正後の所要時間の終了時刻に前記視覚効果の表示を打ち切ってもよい。
ここで、前記制御手段は、補正後の所要時間の終了時刻に前記視覚効果の表示を打ち切ってもよい。
この構成によれば、動作を打ち切られることにより補正がおこなわれる。
ここで、前記制御手段は、補正後の所要時間内に、一つの歌詞に対応する視覚効果を処理速度を調整して表示してもよい。
ここで、前記制御手段は、補正後の所要時間内に、一つの歌詞に対応する視覚効果を処理速度を調整して表示してもよい。
この構成によれば、何れか1つの歌詞に対する視覚効果が実施され補正がおこなわれる。
ここで、前記制御手段は、補正後の所要時間内に、出現時間が最も長い歌詞に対応する視覚効果を処理速度を調整して表示してもよい。
この構成によれば、出現時間がもっとも長い歌詞に対応する視覚効果が実施され補正がおこなわれる。
ここで、前記制御手段は、補正後の所要時間内に、最初に出現する単語に対応する視覚効果を処理速度を調整して表示してもよい。
この構成によれば、最初に出現する歌詞に対応する視覚効果が実施され補正がおこなわれる。
ここで、前記制御手段は、補正後の所要時間内に、最後に出現する単語に対応する視覚効果を処理速度を調整して表示してもよい。
この構成によれば、最後に出現する歌詞に対応する視覚効果が実施され補正がおこなわれる。
ここで、前記制御手段は、補正後の所要時間内に、最も多く出現する歌詞に対応する視覚効果を処理速度を調整して表示してよい。
この構成によれば、最も多く出現する歌詞に対応する視覚効果が実施され補正がおこなわれる。
ここで、前記制御手段は、補正後の所要時間内に、歌詞が対応する視覚効果として最も多い視覚効果処理速度を調整して表示してよい。
この構成によれば、最も多く出現する歌詞が対応する視覚効果が実施され補正がおこなわれる。
ここで、前記制御手段は、補正後の所要時間内に、歌詞が対応する属性に対応する視覚効果として最も多い視覚効果を処理速度を調整して表示してよい。
この構成によれば、歌詞が対応する属性に対応する視覚効果として最も多い視覚効果が実施され補正がおこなわれる。
ここで、前記画像提示装置は、さらに、楽曲の演奏情報の特徴情報を抽出する演奏特徴抽出手段を備え、前記制御手段は、補正後の所要時間内に、前記歌詞時間取得手段によって特定された歌詞が出現する時間における、前記演奏特徴抽出手段によって抽出された演奏情報の特徴情報に基づいて決定された視覚効果を処理速度を調整して表示してよい。
この構成によれば、演奏特徴抽出手段によって抽出された演奏情報の特徴情報を基準として補正がおこなわれる。
また、本発明に係るスライドショー生成装置は、歌詞を伴う楽曲の再生とともに静止画像に視覚効果を施してスライドショーを提示するスライドショー提示装置であって、楽曲データから歌詞を抽出する抽出手段と、抽出された前記歌詞が出現する時間を特定する文字列時間特定手段と、抽出された前記歌詞に基づいて、付加する視覚効果を決定する視覚効果決定手段と、前記歌詞の出現時間に応じて前記視覚効果の所要時間を補正する所要時間補正手段と、所要時間が補正された前記視覚効果を前記静止画像に配置する視覚効果配置手段と前記視覚効果が配置された静止画像を用いてスライドショーを提示する提示手段とを備える。
これにより、本発明に係る画像提示装置の機能を備え、BGMとして歌詞のある楽曲を再生しつつ、画像に対して視覚効果を施して表示するタイプのスライドショーにおいて、歌詞の内容に合わせて視覚効果を施すことが可能となる。したがって、従来に増して娯楽性の高いスライドショーを提供することができる。
なお、本視覚効果付加を行う方法、プログラムにおいても同様の手段、効果を有している。
以上のように、本発明の画像提示装置によれば、複数の単語が短い区間に連続して出現するような場合においても、楽曲の歌詞の出現時間を考慮することにより、動きを伴う視覚効果を適切に付加することが可能となる。
また、本発明のスライドショー生成装置によれば、BGMとして歌詞のある楽曲を再生しつつ、画像に対して視覚効果を施して表示するタイプのスライドショーにおいても、歌詞の出現時間を考慮しているため、視覚効果を適切に施すことが可能となり、従来に増して娯楽性の高いスライドショーを提供することができる。
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
本発明の実施の形態1における画像提示装置1の機能構成を図1に示す。本装置1は、歌詞抽出部10、視覚効果データベース11、視覚効果検索部12、視覚効果付加部13、演奏特徴抽出部14を備える。さらに、歌詞抽出部10は、歌詞単語抽出部101、出現時刻抽出部102を含み、視覚効果付加部13は、視覚効果補正部131を含む。
(実施の形態1)
本発明の実施の形態1における画像提示装置1の機能構成を図1に示す。本装置1は、歌詞抽出部10、視覚効果データベース11、視覚効果検索部12、視覚効果付加部13、演奏特徴抽出部14を備える。さらに、歌詞抽出部10は、歌詞単語抽出部101、出現時刻抽出部102を含み、視覚効果付加部13は、視覚効果補正部131を含む。
歌詞抽出部10は、入力された楽曲(「楽曲情報」ともいう。)5から歌詞単語抽出部101によって歌詞中に出現する単語を抽出し、出現時刻抽出部102によってその単語が楽曲5の提示中に出現する時刻を抽出する。
視覚効果データベース11は、単語と視覚効果とを対応づけて保持している。
図2は、視覚効果データベース11に保持されている、単語と視覚効果との対応関係を示す一例である。図2に示すように、視覚効果データベース11には、各視覚効果の所要時間についても保持されている。
図2は、視覚効果データベース11に保持されている、単語と視覚効果との対応関係を示す一例である。図2に示すように、視覚効果データベース11には、各視覚効果の所要時間についても保持されている。
視覚効果検索部12は、歌詞単語抽出部101によって抽出された歌詞中の単語が視覚効果データベース11に存在するか探索し、もし単語が存在した場合には、その単語に対応する視覚効果とその視覚効果の所要時間とを視覚効果データベース11から取得する。
視覚効果付加部13は、出現時刻抽出部102で得られる歌詞の出現時刻に対応する視覚効果として、視覚効果検索部12で取得された視覚効果を付加する。この際、視覚効果補正部131は、複数の単語に対応する視覚効果を付加することによって、提示すべき時間が重なった場合に、付加する視覚効果の提示時間について補正を行う。
視覚効果付加部13によって付加された視覚効果に関する情報は、例えば表示処理を行うブロックに送られて、視覚効果が施された表示がなされる。
演奏特徴抽出部14は、入力された楽曲情報から、演奏情報の特徴情報(例えば、演奏テンポなど)を抽出する。抽出された演奏情報の特徴情報は、視覚効果補正部131において使用される。
以下、視覚効果補正部131における処理について説明する。
図3は、視覚効果の所要時間についての補正(以下「視覚効果補正」という。)の様子の一例である。図3には、歌詞中に視覚効果データベース11に存在する単語A、B、Cが短い区間に連続して出現する例が示されている。そして、各単語に対応する視覚効果の所要時間が、各単語が出現する時間よりも長くなっており、各視覚効果が重なっている。そこで、この場合の補正として、単語A、B、Cに対応する各視覚効果を、通常よりも速く動作させることにより、各視覚効果の時間を対応する単語の出現時間内に収め、単語A、B、Cのすべてに対してタイミングを合わせて視覚効果を付加している。
図3は、視覚効果の所要時間についての補正(以下「視覚効果補正」という。)の様子の一例である。図3には、歌詞中に視覚効果データベース11に存在する単語A、B、Cが短い区間に連続して出現する例が示されている。そして、各単語に対応する視覚効果の所要時間が、各単語が出現する時間よりも長くなっており、各視覚効果が重なっている。そこで、この場合の補正として、単語A、B、Cに対応する各視覚効果を、通常よりも速く動作させることにより、各視覚効果の時間を対応する単語の出現時間内に収め、単語A、B、Cのすべてに対してタイミングを合わせて視覚効果を付加している。
図4は、視覚効果補正の他の一例である。補正前の様子は、図3と同じである。この場合の補正においても、各単語の出現時間の終了時刻で対応する視覚効果の動作を打ち切ることにより、単語A、B、Cのすべてに対してタイミングを合わせて対視覚効果を付加している。
上記図3、図4のような補正方法によると、単語A、B、Cのすべてに対して視覚効果がタイミングよく付加されるので、短い区間に単語が連続して出現してもこれに対応する視覚効果を提示することができる。
図5は、視覚効果補正のさらに他の一例である。補正前の様子は、上記図3、図4と同じである。この場合の補正では、単語A、B、Cのうちいずれか一つの単語に対応する視覚効果を全ての単語についても付加する補正を行う。図5は、最初に出現する単語(この場合は単語A)に対応する視覚効果を付加する場合の例である。また、図示はしないが、最初に出現する単語ではなく、最後に出現する単語(この場合は単語C)やその他の単語(例えば、中間に位置する単語B)に対応する視覚効果を付加してもよい。また、同じく図示はしないが、出現時間が最も長い単語(この場合は単語C)に対応する視覚効果を付加してもよい。
なお、図5では、単語Aに対応する視覚効果の時間を単語Cの出現時刻の終わりまで延長しているが、これは単語の区切りと視覚効果の区切りが一致することがより望ましいからである。ただし、必ずしも延長させなくともよい。
図5のように、いずれか一つの単語に対応する視覚効果を付加する補正を行うことにより、本来の提示速度にほぼ一致したタイミングで視覚効果を付加することができる。特に、最も出現時間が長い単語は、区間を最もよく代表していると考えることができる。また、最初に出現する単語に対応する視覚効果を付加する方法は、視覚効果の出だしの動きが歌詞の内容に一致する場合を想定したものであり、最初の単語が勢いよく歌われるような楽曲の場合に適している。また、最後に出現する単語に対応する視覚効果を付加する方法は、視覚効果の終わりの動きが歌詞に一致する場合を想定したものであり、最後の単語が長く伸ばして歌われるような楽曲の場合に適している。
図6は、視覚効果補正の、さらに他の一例である。補正前の状況は、歌詞中に視覚効果データベース11に存在する単語A、Bが短い区間に連続して出現しており、かつ、単語Aは複数回(図では2回)出現している。この場合の補正では、単語A、Bのうち、区間中の出現回数が最も多い単語(この場合は単語A)に対応する視覚効果の付加を行う。
図7は、視覚効果補正の様子の、さらに別の一例である。補正前の状況は、歌詞中に視覚効果データベース11に存在する単語A、B、Cが短い区間に連続して出現しており、かつ、単語Aと単語Cは同じ視覚効果に対応している。この場合の補正では、区間中で最も多くの単語が対応する視覚効果(この場合は単語A、Cが対応する視覚効果)を付加する。
上記図6、図7の場合、区間中に最も多く出現する単語に対応する視覚効果、あるいは、区間中で最も多くの単語が対応する視覚効果は、その区間で最も影響が大きいと考えられる。
すなわち、上記図6、図7の補正方法によると、最も影響が大きい視覚効果を付加することができる。
すなわち、上記図6、図7の補正方法によると、最も影響が大きい視覚効果を付加することができる。
さらに別の視覚効果補正(図示はしない)も考えられる。演奏特徴抽出部14で抽出された演奏情報の特徴情報を使用して、視覚効果補正部131が付加する視覚効果を決定する方法である。具体的には、歌詞中に単語が出現する時刻において、演奏の音量が最も大きな単語に対応する視覚効果を付加する方法である。なお、演奏情報の特徴情報として、演奏の音量以外を使用しても構わないことは勿論である。
以上、視覚効果補正部131における補正方法をいくつか説明したが、視覚効果補正部131における補正方法は上記のいずれか一つに限定されるものではない。すなわち、上記のような複数の補正方法の中から、一定の基準に従って補正方法を選択するような構成にすることもできる。
ところで、歌詞抽出部10における歌詞中の単語およびその出現時刻の抽出方法としては、例えば以下のような方法も考えられる。
まず、楽曲の演奏情報とは別途テキスト形式などで保存された歌詞情報から抽出する方法がある。この構成は、カラオケ装置などに適しており、歌詞情報が用意されているので実施が比較的容易なことが特徴である。
次に、音声中の単語を認識する音声認識部を設け、演奏情報に含まれる歌唱音声情報から音声認識部にて単語を認識する方法がある。この構成は、歌唱情報からの音声認識が必要なので実施が比較的困難であるが、歌詞情報を別途用意する必要がないことが特徴である。なお、以上の二つの方法に限られないのは勿論である。
ここで、本画像提示装置1における処理の流れを示すフローチャートを図8に示す。
最初に、歌詞抽出部10は、歌詞単語及び出現時間を抽出する(S81)。次に、視覚効果検索部12は、抽出した歌詞単語が視覚効果を必要とする単語であるかどうかを、視覚効果データベース11を参照して判断する(S82)。抽出した歌詞単語が視覚効果に対応付けられている単語である場合(S82でYES)、視覚効果と所要時間が取得される(S83)。
最初に、歌詞抽出部10は、歌詞単語及び出現時間を抽出する(S81)。次に、視覚効果検索部12は、抽出した歌詞単語が視覚効果を必要とする単語であるかどうかを、視覚効果データベース11を参照して判断する(S82)。抽出した歌詞単語が視覚効果に対応付けられている単語である場合(S82でYES)、視覚効果と所要時間が取得される(S83)。
さらに、視覚効果付加部13は、視覚効果を表示するにあたり、視覚効果の補正を必要とするか否かについて判断する(S84)。視覚効果の補正が必要であると判断された場合(S84でYES)、視覚効果補正部131は、楽曲の演奏の特徴を抽出し(S85)、これを参照して視覚効果の補正を行う(S86)。
最後に、視覚効果が付加されて(S87)、楽曲の再生とともに視覚効果が表示される(S88)。楽曲が終了した場合(S89でYES)、本処理を終了する。
なお、視覚効果データベース11において、一つの単語に対して複数の視覚効果を対応させ、視覚効果検索部12で、単語に対応する視覚効果のうちの一つを選択して返すようにしてもよい。こうすることで、同じ単語に対して毎回同じ視覚効果が付加されるのを防ぐことができ、多様性を増すことができる。
(実施の形態2)
本発明の実施の形態2における画像提示装置2の機能構成を図9に示す。本装置2は、歌詞抽出部10、視覚効果属性データベース15、視覚効果属性検索部16、視覚効果・属性対応保持部17、視覚効果取得部18、視覚効果付加部19、演奏特徴抽出部14を備える。さらに、歌詞抽出部10は、歌詞単語抽出部101、出現時刻抽出部102を含み、視覚効果付加部19は、視覚効果補正部191を含む。
本発明の実施の形態2における画像提示装置2の機能構成を図9に示す。本装置2は、歌詞抽出部10、視覚効果属性データベース15、視覚効果属性検索部16、視覚効果・属性対応保持部17、視覚効果取得部18、視覚効果付加部19、演奏特徴抽出部14を備える。さらに、歌詞抽出部10は、歌詞単語抽出部101、出現時刻抽出部102を含み、視覚効果付加部19は、視覚効果補正部191を含む。
図9において、上記実施の形態1の図1と同様の機能構成については同じ符号を用い、その説明は省略する。
視覚効果属性データベース15は、単語と視覚効果の属性とを対応づけて保持している。
図10は、視覚効果属性データベース15に保持されている、単語と視覚効果の属性との対応関係を示す一例である。
視覚効果属性検索部16は、歌詞単語抽出部101によって抽出された歌詞中の単語が視覚効果属性データベース15に存在するか探索し、もし単語が存在した場合には、その単語に対応する視覚効果の属性を視覚効果属性データベース15から取得する。
視覚効果・属性対応保持部17は、視覚効果の属性と視覚効果とを対応づけて保持している。
図11は、視覚効果・属性対応保持部17に保持されている、視覚効果の属性と視覚効果及び所要時間の対応関係を示す一例である。
視覚効果取得部18は、視覚効果属性検索部16で取得された視覚効果の属性に対応する視覚効果を、視覚効果・属性対応保持部17から取得する。
視覚効果付加部19は、上記実施の形態1の視覚効果付加部13とほぼ同じ機能を有している。すなわち、出現時刻抽出部102で得られる歌詞の出現時刻の視覚効果として、視覚効果取得部18で取得された視覚効果を付加する。この際、視覚効果補正部191は、複数の単語に対応する視覚効果を付加すべき時刻が重なった場合に、付加する視覚効果の提示時間の補正を行う。
本実施の形態2と上記実施の形態1との相違点は、実施の形態1では歌詞中の単語から直接視覚効果を取得しているのに対して、本実施の形態2では歌詞中の単語をいったん視覚効果の属性に変換し、視覚効果の属性から視覚効果と所要時間を取得している点である。
視覚効果補正部191における処理は、実施の形態1の視覚効果補正部131と同様である。したがって、実施の形態1で述べた視覚効果の補正方法は、実施の形態2でも適用することができる。詳細な説明は割愛する。
なお、上記では属性情報を「Dynamic」や「Static」、「In」や「Out」といった単語で表す例を示したが、例えば図12に示すような属性情報空間を定義し、その空間内の座標をもって属性情報としてもよい。この場合、各軸方向の座標値が属性の程度を表す。例えば単語「走り去る」は属性グループAに含まれる。単語「立ち止まる」は属性グループB含まれ、単語「振り返る」は属性グループA及びB両方に含まれる。この場合、各属性グループに対して視覚効果が対応付けられて、視覚効果・属性対応保持部17に格納される。
また、以上で述べた例では、歌詞中の単語を元に(いったん視覚効果の属性に変換する場合も含めて)視覚効果そのものを対応づけていたが、視覚効果の動作の速さや動きの大きさなど、視覚効果のパラメータだけを変化させてもよい。例えば、上記のように属性情報空間における座標をもって視覚効果の属性とする場合には、属性情報空間における座標値に応じて視覚効果のパラメータの変化量を決定することもできる。
ここで、本画像提示装置2における処理の流れを示すフローチャートを図13に示す。
最初に、歌詞抽出部10は、歌詞単語及び出現時間を抽出する(S131)。
最初に、歌詞抽出部10は、歌詞単語及び出現時間を抽出する(S131)。
次に、視覚効果属性検索部16は、抽出した歌詞単語が視覚効果を必要とする単語であるかどうかを、視覚効果属性データベース15を参照して判断する(S132)。抽出した歌詞単語が視覚効果を必要とする単語であった場合(S132でYES)、属性に変換される(S133)。
さらに、視覚効果取得部18は、視覚効果・属性対応保持部17を参照して視覚効果と所要時間とを取得する(S134)。視覚効果付加部19は、視覚効果を表示するにあたり、視覚効果の補正を必要とするか否かについて判断する(S135)。視覚効果の補正が必要であると判断された場合(S135でYES)、視覚効果補正部191は、楽曲の演奏の特徴を抽出し(S136)、これを参照して視覚効果の補正を行う(S137)。
視覚効果付加部19において視覚効果が付加された後(S138)、楽曲の再生とともに視覚効果が表示される(S139)。楽曲が終了した場合は(S140でYES)、本処理を終了する。
(実施の形態3)
本発明の実施の形態3におけるスライドショー生成装置3の構成を図14に示す。本装置3は、視覚効果配置部20、画像割り当て部21を備える。さらに、視覚効果配置部20は、上記実施の形態1又は実施の形態2で述べた画像提示装置1又は2が備える視覚効果付加部13又は19と同等の視覚効果付加機能部201を含む。
本発明の実施の形態3におけるスライドショー生成装置3の構成を図14に示す。本装置3は、視覚効果配置部20、画像割り当て部21を備える。さらに、視覚効果配置部20は、上記実施の形態1又は実施の形態2で述べた画像提示装置1又は2が備える視覚効果付加部13又は19と同等の視覚効果付加機能部201を含む。
視覚効果配置部20は、スライドショーの時間軸上に視覚効果を配置する。この際、視覚効果付加機能部201の機能により、楽曲の歌詞の内容に合わせて視覚効果を配置する。
画像割り当て部21は、視覚効果配置部20において時間軸上に配置された各視覚効果に対して、視覚効果を施す対象となる静止画像を割り当てる。
以下、本発明のスライドショー生成装置の動作について、図15を用いて説明する。
まず、視覚効果配置部20は、図15(a)に示すように、歌詞中に出現する単語(図では単語A、B、C、D)に合わせて、視覚効果付加機能部201の機能によって視覚効果を時間軸上に配置する。この図の場合では、単語C、Dが短い区間に連続して出現しているので、補正されて一つの視覚効果が付加されている。
まず、視覚効果配置部20は、図15(a)に示すように、歌詞中に出現する単語(図では単語A、B、C、D)に合わせて、視覚効果付加機能部201の機能によって視覚効果を時間軸上に配置する。この図の場合では、単語C、Dが短い区間に連続して出現しているので、補正されて一つの視覚効果が付加されている。
次に、視覚効果配置部20は、図15(b)に示すように、歌詞中の単語に対応した視覚効果が付加されていない時間軸上の区間に対して、視覚効果を配置する。この際、視覚効果をランダムに配置してもよいし、楽曲の演奏情報を何らかの基準で参照して配置してもよい。勿論これら二通りの方法に限定されるわけではない。
最後に、画像割り当て部21は、図15(c)に示すように、時間軸上の各視覚効果に対して、視覚効果を施す対象となる静止画像を割り当てる。
以上の手順により、スライドショーの再生シナリオ情報(どの静止画像に対して、どの順番にどのタイミングで視覚効果を施すのかを示す情報)が生成される。生成された再生シナリオ情報は、再生処理を行うブロックに送られてスライドショーの表示、または、後で再生するために保存される。
以上で述べたように、本発明に係る画像提示装置を用いることにより、複数の単語が短い区間に連続して出現するような場合においても、楽曲の歌詞の内容に合わせて、動きを伴う視覚効果を付加することが可能となる。
また、本発明に係るスライドショー生成装置を用いることにより、BGMとして歌詞のある楽曲を再生しつつ、画像に対して視覚効果を施して表示するタイプのスライドショーにおいて、歌詞の内容に合わせて視覚効果を施すことが可能となり、従来に増して娯楽性の高いスライドショーを提供することができる。
なお、以上の説明において図中などに、いくつかの視覚効果の具体例を挙げたが、本発明の対象となる視覚効果はこれらだけに限られず、視覚効果の動作に一定の時間が必要であれば、本発明の適用対象である。
また、静止画像に対して施すタイプの視覚効果にも限られず、視覚効果の動作に一定の時間が必要であれば、本発明の適用対象である。
なお、本発明において歌詞を伴うとは、音声として歌唱情報が演奏されるだけに限られず、カラオケのように歌詞が文字列として画面表示される場合も含む。
本発明に係る視覚効果生成装置は、歌詞を伴う楽曲に合わせて静止画像に対して視覚効果を付加するスライドショー生成装置として有用である。また、歌詞を伴う楽曲に合わせて画面表示を変化させるようなカラオケ装置にも応用できる。
5 楽曲
10 歌詞抽出部
101 歌詞単語抽出部
102 出現時刻抽出部
11 視覚効果データベース
12 視覚効果検索部
13 視覚効果付加部
131 視覚効果補正部
14 演奏特徴抽出部
15 視覚効果属性データベース
16 視覚効果属性検索部
17 視覚効果・属性対応保持部
18 視覚効果取得部
19 視覚効果付加部
191 視覚効果補正部
20 視覚効果配置部
201 視覚効果付加機能部
21 画像割り当て部
30 歌詞抽出部
301 歌詞単語抽出部
302 出現時刻抽出部
31 感性語データベース
32 感性語検索部
33 表示制御部
34 表示部
10 歌詞抽出部
101 歌詞単語抽出部
102 出現時刻抽出部
11 視覚効果データベース
12 視覚効果検索部
13 視覚効果付加部
131 視覚効果補正部
14 演奏特徴抽出部
15 視覚効果属性データベース
16 視覚効果属性検索部
17 視覚効果・属性対応保持部
18 視覚効果取得部
19 視覚効果付加部
191 視覚効果補正部
20 視覚効果配置部
201 視覚効果付加機能部
21 画像割り当て部
30 歌詞抽出部
301 歌詞単語抽出部
302 出現時刻抽出部
31 感性語データベース
32 感性語検索部
33 表示制御部
34 表示部
Claims (16)
- 歌詞を伴う楽曲の再生とともに画像を表示する画像提示装置であって、
歌詞とその出現時間を含む楽曲データから歌詞を抽出する抽出手段と、
抽出された歌詞の出現時間を特定する歌詞時間特定手段と、
複数の視覚効果情報と視覚効果の表示に要する所要時間とを対応させて記憶する記憶手段と、
抽出された歌詞に基づいて、画像に適用する視覚効果を決定する決定手段と、
前記歌詞の出現時間に応じて、決定された視覚効果に対応する所要時間を補正する補正手段と、
歌詞に合わせて、補正後の所要時間の間、視覚効果を制御する制御手段と
を備えることを特徴とする画像提示装置。 - 前記画像提示装置は、さらに、
歌詞と視覚効果情報との対応関係を保持する保持手段を備え、
前記決定手段は、前記抽出手段で抽出された歌詞が、前記保持手段に含まれているかを検索することによって視覚効果を決定する
ことを特徴とする請求項1記載の画像提示装置。 - 前記画像提示装置は、さらに、
歌詞と属性とを対応づけて保持する第1保持手段と、
属性と視覚効果との対応関係を保持する第2保持手段とを備え、
前記決定手段は、
前記抽出手段で抽出された歌詞が、前記第1保持手段に含まれているかを検索し、含まれていた場合に対応する属性を読み出し、さらに、前記第2保持手段を参照して、読み出した前記属性に対応する視覚効果検索することによって視覚効果を決定する
ことを特徴とする請求項1記載の画像提示装置。 - 前記制御手段は、補正後の所要時間内に、視覚効果の表示を収めるように視覚効果の処理速度を調整する
ことを特徴とする請求項1〜3の何れか1項に記載の画像提示装置。 - 前記制御手段は、補正後の所要時間の終了時刻に前記視覚効果の表示を打ち切る
ことを特徴とする請求項1〜3の何れか1項に記載の画像提示装置。 - 前記制御手段は、補正後の所要時間内に、一つの歌詞に対応する視覚効果を処理速度を調整して表示する
ことを特徴とする請求項1〜3の何れか1項に記載の画像提示装置。 - 前記制御手段は、補正後の所要時間内に、出現時間が最も長い歌詞に対応する視覚効果を処理速度を調整して表示する
ことを特徴とする請求項1〜3の何れか1項に記載の画像提示装置。 - 前記制御手段は、補正後の所要時間内に、最初に出現する歌詞に対応する視覚効果を処理速度を調整して表示する
ことを特徴とする請求項1〜3の何れか1項に記載の画像提示装置。 - 前記制御手段は、補正後の所要時間内に、最後に出現する歌詞に対応する視覚効果を処理速度を調整して表示する
ことを特徴とする請求項1〜3の何れか1項に記載の画像提示装置。 - 前記制御手段は、補正後の所要時間内に、最も多く出現する歌詞に対応する視覚効果を処理速度を調整して表示する
ことを特徴とする請求項1〜3の何れか1項に記載の画像提示装置。 - 前記制御手段は、補正後の所要時間内に、歌詞が対応する視覚効果として最も多い視覚効果を処理速度を調整して表示する
ことを特徴とする請求項2に記載の画像提示装置。 - 前記制御手段は、補正後の所要時間内に、歌詞が対応する属性に対応する視覚効果として最も多い視覚効果を処理速度を調整して表示する
ことを特徴とする請求項3に記載の画像提示装置。 - 前記画像提示装置は、さらに、
楽曲の演奏情報の特徴情報を抽出する演奏特徴抽出手段を備え、
前記制御手段は、補正後の所要時間内に、前記歌詞時間取得手段によって特定された歌詞が出現する時間における、前記演奏特徴抽出手段によって抽出された演奏情報の特徴情報に基づいて決定された視覚効果を処理速度を調整して表示する
ことを特徴とする請求項1〜3何れか1項記載の画像提示装置。 - 歌詞を伴う楽曲の再生とともに静止画像に視覚効果を施してスライドショーを提示するスライドショー提示装置であって、
楽曲データから歌詞を抽出する抽出手段と、
抽出された前記歌詞が出現する時間を特定する文字列時間特定手段と、
抽出された前記歌詞に基づいて、付加する視覚効果を決定する視覚効果決定手段と、
前記歌詞の出現時間に応じて前記視覚効果の所要時間を補正する所要時間補正手段と、
所要時間が補正された前記視覚効果を前記静止画像に配置する視覚効果配置手段と
前記視覚効果が配置された静止画像を用いてスライドショーを提示する提示手段と
を備えることを特徴とするスライドショー提示装置。 - 歌詞を伴う楽曲の再生とともに画像を表示する画像提示方法であって、
歌詞とその出現時間を含む楽曲データから歌詞を抽出する抽出ステップと、
抽出された歌詞の出現時間を特定する歌詞時間特定ステップと、
複数の視覚効果情報と視覚効果の表示に要する所要時間とを対応させて記憶する記憶ステップと、
抽出された歌詞に基づいて、画像に適用する視覚効果を決定する決定ステップと、
前記歌詞の出現時間に応じて、決定された視覚効果に対応する所要時間を補正する補正ステップと、
歌詞に合わせて、補正後の所要時間の間、視覚効果を制御する制御ステップと
を備えることを特徴とする画像提示方法。 - 歌詞を伴う楽曲の再生とともに画像を表示する画像提示装置のためのプログラムであって、
歌詞とその出現時間を含む楽曲データから歌詞を抽出する抽出ステップと、
抽出された歌詞の出現時間を特定する歌詞時間特定ステップと、
複数の視覚効果情報と視覚効果の表示に要する所要時間とを対応させて記憶する記憶ステップと、
抽出された歌詞に基づいて、画像に適用する視覚効果を決定する決定ステップと、
前記歌詞の出現時間に応じて、決定された視覚効果に対応する所要時間を補正する補正ステップと、
歌詞に合わせて、補正後の所要時間の間、視覚効果を制御する制御ステップと
をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004348446A JP2006154626A (ja) | 2004-12-01 | 2004-12-01 | 画像提示装置、画像提示方法およびスライドショー提示装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004348446A JP2006154626A (ja) | 2004-12-01 | 2004-12-01 | 画像提示装置、画像提示方法およびスライドショー提示装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006154626A true JP2006154626A (ja) | 2006-06-15 |
Family
ID=36632982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004348446A Pending JP2006154626A (ja) | 2004-12-01 | 2004-12-01 | 画像提示装置、画像提示方法およびスライドショー提示装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006154626A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008008954A (ja) * | 2006-06-27 | 2008-01-17 | Sony Ericsson Mobilecommunications Japan Inc | 携帯情報端末 |
JP2008085654A (ja) * | 2006-09-27 | 2008-04-10 | Casio Comput Co Ltd | 画像表示装置、及びそのプログラム |
WO2008114209A1 (en) * | 2007-03-21 | 2008-09-25 | Koninklijke Philips Electronics N.V. | Method and apparatus for enabling simultaneous reproduction of a first media item and a second media item |
CN104142934A (zh) * | 2013-05-07 | 2014-11-12 | 腾讯科技(深圳)有限公司 | 进行在线音频播放的方法、系统及客户端 |
-
2004
- 2004-12-01 JP JP2004348446A patent/JP2006154626A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008008954A (ja) * | 2006-06-27 | 2008-01-17 | Sony Ericsson Mobilecommunications Japan Inc | 携帯情報端末 |
JP2008085654A (ja) * | 2006-09-27 | 2008-04-10 | Casio Comput Co Ltd | 画像表示装置、及びそのプログラム |
WO2008114209A1 (en) * | 2007-03-21 | 2008-09-25 | Koninklijke Philips Electronics N.V. | Method and apparatus for enabling simultaneous reproduction of a first media item and a second media item |
CN104142934A (zh) * | 2013-05-07 | 2014-11-12 | 腾讯科技(深圳)有限公司 | 进行在线音频播放的方法、系统及客户端 |
CN104142934B (zh) * | 2013-05-07 | 2018-11-20 | 腾讯科技(深圳)有限公司 | 进行在线音频播放的方法、系统及客户端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20070101355A1 (en) | Device, method, and medium for expressing content dynamically | |
CN109862393B (zh) | 视频文件的配乐方法、系统、设备及存储介质 | |
WO2019114516A1 (zh) | 媒体信息的展示方法和装置、存储介质、电子装置 | |
US20150234833A1 (en) | Systems, methods, and apparatus for generating an audio-visual presentation using characteristics of audio, visual and symbolic media objects | |
US20120259634A1 (en) | Music playback device, music playback method, program, and data creation device | |
US9997153B2 (en) | Information processing method and information processing device | |
US20150053067A1 (en) | Providing musical lyrics and musical sheet notes through digital eyewear | |
US10468004B2 (en) | Information processing method, terminal device and computer storage medium | |
US11511200B2 (en) | Game playing method and system based on a multimedia file | |
CN106909548B (zh) | 基于服务器的图片加载方法及装置 | |
CN107170432B (zh) | 一种音乐产生方法和装置 | |
US11211074B2 (en) | Presentation of audio and visual content at live events based on user accessibility | |
EP2442299B1 (en) | Information processing apparatus, information processing method, and program | |
JP2013161205A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN111666445A (zh) | 一种情景歌词的显示方法、装置及音箱设备 | |
KR20120129015A (ko) | 어학 컨텐츠 생성 방법 및 이를 위한 단말기 | |
CN106909547B (zh) | 基于浏览器的图片加载方法及装置 | |
JP2008084021A (ja) | 動画シナリオ生成方法、プログラムおよび装置 | |
JP2006154626A (ja) | 画像提示装置、画像提示方法およびスライドショー提示装置 | |
KR20130076852A (ko) | 어학 컨텐츠 생성 방법 및 이를 위한 단말기 | |
JP2013092912A (ja) | 情報処理装置、情報処理方法、並びにプログラム | |
CN110767201A (zh) | 一种配乐生成方法、存储介质及终端设备 | |
JP6372577B2 (ja) | プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置 | |
WO2016067348A1 (ja) | プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置 | |
JP6821728B2 (ja) | テキストデータ音声再生装置およびテキストデータ音声再生プログラム |