JP2005148307A

JP2005148307A - 話速変換装置、話速変換方法、プログラム及び記録媒体

Info

Publication number: JP2005148307A
Application number: JP2003384097A
Authority: JP
Inventors: Satoshi Hikita; 聡疋田; Junichi Takami; 淳一鷹見; Yoshinaga Kato; 喜永加藤; Nozomi Takahashi; 望高橋
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2003-11-13
Filing date: 2003-11-13
Publication date: 2005-06-09

Abstract

【課題】検索機能と、音程を変えずに音声の速度を変えることができる話速変換機能とを組み合わせて、検索結果部分の話速変換速度とその他の部分の話速変換速度とを変えることにより、聴取効果を高めることができる話速変換装置を提供する。
【解決手段】コンテンツデータ４をコンテンツデータ入力部に入力し（Ｓ１）、そのコンテンツデータに対して検索処理を行い（Ｓ２）、検索された部分の話速を速く、または、遅くする処理を行い（Ｓ３）、コンテンツ出力部に変換後コンテンツを出力する（Ｓ４）。
【選択図】図２

Description

本発明は、話速変換装置に関し、さらに詳しくは、コンテンツの特定部分を検索して話速変換する装置及び方法に関するものである。

講演等を記録したマルチメディアコンテンツを聴取するとき、内容を理解しつつ短時間で聴取したいという要求がある。このような要求に応えるために、ピッチを変えずに話速のみを変える話速変換技術が従来から用いられている。しかしながら、話速変換技術を用いてコンテンツ全体の話速を速くしてしまうと、重要で正確に聞きたい部分も早口で再生されるため聞き難くなってしまう。また、音が小さくて聞き難い部分も速く再生されて余計に聞き難くなってしまうといった問題がある。
また、逆に外国語のマルチメディアコンテンツに対しては、話速を遅くして聞き易くする方法が考えられるが、全体の聴取時間が延びてしまい、話と話の間のポーズが間延びして聞き難くなるという問題がある。
これらの課題を解決するための従来技術として、特開平１１−２０２８９０号公報には、重要性の高いキーワードを指定し、そのキーワードでワードスポッティングによる音声検索を行う技術が開示されている。
また特開２００２−２９７１３１公報には、曲の一部を音声で入力することによって曲を検索し、検索した曲の販売を行う曲検索システムについて開示されている。
また特開２０００−２８５１４１公報には、画像検索を検索部に利用して、映像中の重要な部分を検出する技術が開示されている。
特開平１１−２０２８９０号公報特開２００２−２９７１３１公報特開２０００−２８５１４１公報

しかしながら、特許文献１に開示されている従来技術は、重要性の高いキーワードを指定し、そのキーワードでワードスポッティングによる音声検索を行うものであり、検索された音声の話速変換については言及していない。
また特許文献２に開示されている従来技術は、あくまでも曲を検索するための技術であり、特許文献１と同様に検索された曲の話速変換については言及していない。
また特許文献３に開示されている従来技術は、あくまでも画像を検索するための技術であり、特許文献１と同様に検索された画像に対応する音声の話速変換については言及していない。
本発明は、かかる課題に鑑み、検索機能と、音程を変えずに音声の速度を変えることができる話速変換機能とを組み合わせて、検索結果部分の話速変換速度とその他の部分の話速変換速度とを変えることにより、聴取効果を高めることができる話速変換装置を提供することを目的とする。

本発明はかかる課題を解決するために、請求項１は、音程を変えずに音声の速度を変える話速変換部と、話速変換する音声の対象部分を検索する検索部とを備えた話速変換装置であって、前記検索部により検索された音声の対象部分又は該対象部分の近傍の話速を前記話速変換部により変換することにより、前記音声の聴取効果を高めることを特徴とする。
本発明の特徴は、検索部により検索された音声の対象部分とその近傍の音声を、話速変換部により話速変換してより明瞭に音声を聞き取ることができるようにするものである。ここで、話速変換の速度は音声の種類により通常速度、通常より速く、或いは遅くする場合が考えられる。
かかる発明によれば、検索部により検索された音声の対象部分又はこの対象部分の近傍の話速を話速変換部により変換するので、音声の種類に応じた最適の速度を効率良く選択することができる。
請求項２は、前記検索部は、コンテンツの音声からキーワードが存在する部分を検出するキーワード検出部を備え、該キーワード検出部により前記コンテンツ内にキーワードが存在する部分を検出した場合、前記話速変換部は、検索された近傍の部分の話速を他の部分に比べて相対的に遅い速度に変換することを特徴とする。
講演等を記録したマルチメディアコンテンツに本発明を適用する場合は、重要性の高いキーワードを指定し、そのキーワードでワードスポッティングによる音声検索を行ってキーワードの位置を特定し、コンテンツ全体の話速を速くするが、キーワードの近辺は速度を速くする割合を下げるか、または元の速度のままにするなどして、全体の話速は速いが重要なキーワードの近辺はそれよりも遅くすることにより聞き易いコンテンツが作成できる。
かかる発明によれば、キーワード検出部によりコンテンツ内にキーワードが存在する部分を検出した場合、話速変換部は、このキーワード及び近傍の話速を通常の速度に変換するので、全体の話速は速いが重要なキーワードの近辺はそれよりも遅くすることにより、聞き易いコンテンツを作成することができる。

請求項３は、前記検索部は、コンテンツの無音部分を検出する無音部分検出部を備え、該無音部分検出部により前記コンテンツ内に無音部分を検出した場合、前記話速変換部は、検索された近傍の部分の話速を他の部分に比べて相対的に速い速度に変換することを特徴とする。
コンテンツには音声と音声の間に無音部分がある。この無音部分の検索を用いて無音の部分を特定し、有音の部分の話速は遅くし、無音の部分の話速は元のままや速くするなどして、全体を聞き易くしながら話と話の間のポーズが間延びすることを防ぐこともできる。
かかる発明によれば、無音部分検出部によりコンテンツ内に無音部分を検出した場合、話速変換部は、この無音部分の話速を通常の速度より速い速度に変換するので、全体を聞き易くしながら話と話の間のポーズが間延びすることを防ぐことができる。
請求項４は、前記検索部は、音楽コンテンツから所定のメロディーを検出するメロディー検出部を備え、該メロディー検出部により前記音楽コンテンツ内に所定のメロディーを検出した場合、前記話速変換部は、当該メロディー部分の話速を通常の速度に変換することを特徴とする。
鼻歌、ハミング、歌唱などのメロディーからそれに類似するメロディーを持つ音楽コンテンツを検索するメロディー検索を検索部に利用することにより、メロディー検索で検索された部分を通常の速度のままにし、他の部分は話速変換技術で音程を変えずに早回しで再生することにより、興味のない部分は速く聞いて、覚えていたサビの部分だけ通常の速度で聞くという使い方ができる。
かかる発明によれば、メロディー検出部により音楽コンテンツ内に所定のメロディーを検出した場合、話速変換部は、このメロディー部分の話速を通常の速度に変換するので、興味のない部分は速く聞いて、覚えていたサビの部分だけ通常の速度で聞くことができる。

請求項５は、前記検索部は、映像中の重要な部分を検出する映像検出部を備え、該映像検出部により重要な映像部分を検出した場合、前記話速変換部は、検索された近傍の部分の話速を他の部分に比べて相対的に遅い速度に変換することを特徴とする。
画像検索を検索部に利用して、映像中の重要な部分を検出し、対応する映像音声部分を話速変換で速度変化させることにより、重要な部分を聞き易くし、その他の部分を短時間で聴取することができる。話速に合わせて、映像の速度を変えることも当然可能である。
かかる発明によれば、話速変換部は、該当する映像部分に対応する音声部分の話速を通常の速度より遅い速度に変換するので、重要な部分を聞き易くし、その他の部分を短時間で聴取することができる。
請求項６は、前記検索部は、字幕つきのコンテンツの字幕部分を文字列検索して重要なキーワード部分を検出する字幕検出部を備え、該字幕検出部により重要なキーワード部分を検出した場合、前記話速変換部は、検索された近傍の部分の話速を他の部分に比べて相対的に遅い速度に変換することを特徴とする。
かかる発明によれば、話速変換部は、該当するキーワード部分に対応する音声部分の話速を通常の速度より遅い速度に変換するので、重要な部分を聞き易くし、その他の部分を短時間で聴取することができる。

請求項７は、前記検索部は、請求項２乃至６の何れか一項に記載の検索部の機能を少なくとも２つ以上組み合わせたことを特徴とする。
請求項２乃至６の検索部は、それぞれ個別に機能する以外に、複数の機能が組み合わさっても可能である。例えば、キーワード検出部と無音部分検出部を組合わせることにより、キーワードを検出するまでの無音部分の話速を速くして、キーワード検出の所要時間を短くすることができる。
かかる発明によれば、検索部の機能を少なくとも２つ以上組み合わせるので、装置全体の検索効率を高めることができる。
請求項８は、音程を変えずに音声の速度を変える話速変換ステップと、話速変換する音声の対象部分を検索する検索ステップとを備えた話速変換方法であって、前記ステップにより検索された音声の対象部分又は該対象部分の近傍の話速を前記話速変換ステップにより変換することにより、前記音声の聴取効果を高めることを特徴とする。
かかる発明によれば、請求項１と同様の作用効果を奏する。
請求項９は、前記検索ステップは、コンテンツの音声からキーワードが存在する部分を検出するキーワード検出ステップを備え、該キーワード検出ステップ部により前記コンテンツ内にキーワードが存在する部分を検出した場合、前記話速変換ステップは、検索された近傍の部分の話速を他の部分に比べて相対的に遅いに変換することを特徴とする。
かかる発明によれば、請求項２と同様の作用効果を奏する。
請求項１０は、前記検索ステップは、コンテンツの無音部分を検出する無音部分検出ステップを備え、該無音部分検出ステップにより前記コンテンツ内に無音部分を検出した場合、前記話速変換ステップは、検索された近傍の部分の話速を他の部分に比べて相対的に速い速度に変換することを特徴とする。
かかる発明によれば、請求項３と同様の作用効果を奏する。

請求項１１は、前記検索ステップは、音楽コンテンツから所定のメロディーを検出するメロディー検出ステップを備え、該メロディー検出ステップにより前記音楽コンテンツ内に所定のメロディーを検出した場合、前記話速変換ステップは、当該メロディー部分の話速を通常の速度に変換することを特徴とする。
かかる発明によれば、請求項４と同様の作用効果を奏する。
請求項１２は、前記検索ステップは、映像中の重要な部分を検出する映像検出ステップを備え、該映像検出ステップにより重要な映像部分を検出した場合、前記話速変換ステップは、検索された近傍の部分の話速を他の部分に比べて相対的に遅い速度に変換することを特徴とする。
かかる発明によれば、請求項５と同様の作用効果を奏する。
請求項１３は、前記検索ステップは、字幕つきのコンテンツの字幕部分を文字列検索して重要なキーワード部分を検出する字幕検出ステップを備え、該字幕検出ステップにより重要なキーワード部分を検出した場合、前記話速変換ステップは、検索された近傍の部分の話速を他の部分に比べて相対的に遅い速度に変換することを特徴とする。
かかる発明によれば、請求項６と同様の作用効果を奏する。
請求項１４は、前記検索ステップは、請求項８乃至１３の何れか一項に記載の検索ステップの機能を少なくとも２つ以上組み合わせたことを特徴とする。
かかる発明によれば、請求項７と同様の作用効果を奏する。
請求項１５は、請求項８乃至１４の何れか一項に記載の話速変換方法をコンピュータが制御可能にプログラミングしたことを特徴とする。
かかる発明によれば、本発明の話速変換方法をコンピュータが制御可能なＯＳに従ってプログラミングすることにより、そのＯＳを備えたコンピュータであれば同じ処理方法により制御することができる。
請求項１６は、請求項１５に記載の話速変換プログラムをコンピュータが読み取り可能な形式で記録したことを特徴とする。
かかる発明によれば、話速変換プログラムをコンピュータが読み取り可能な形式で記録媒体に記録することにより、この記録媒体を持ち運ぶことにより何処でもプログラムを稼動することができる。

以上記載のごとく請求項１、８の発明によれば、検索部により検索された音声の対象部分又はこの対象部分の近傍の話速を話速変換部により変換するので、音声の種類に応じた最適の速度を効率良く選択することができる。
また請求項２、９では、キーワード検出部によりコンテンツ内にキーワードが存在する部分を検出した場合、話速変換部は、このキーワード及び近傍の話速を通常の速度に変換するので、全体の話速は速いが重要なキーワードの近辺はそれよりも遅くすることにより、聞き易いコンテンツを作成することができる。
また請求項３、１０では、無音部分検出部によりコンテンツ内に無音部分を検出した場合、話速変換部は、この無音部分の話速を通常の速度より速い速度に変換するので、全体を聞き易くしながら話と話の間のポーズが間延びすることを防ぐことができる。
また請求項４、１１では、メロディー検出部により音楽コンテンツ内に所定のメロディーを検出した場合、話速変換部は、このメロディー部分の話速を通常の速度に変換するので、興味のない部分は速く聞いて、覚えていたサビの部分だけ通常の速度で聞くことができる。
また請求項５、１２では、話速変換部は、該当する映像部分に対応する音声部分の話速を通常の速度より遅い速度に変換するので、重要な部分を聞き易くし、その他の部分を短時間で聴取することができる。
また請求項６、１３では、話速変換部は、該当するキーワード部分に対応する音声部分の話速を通常の速度より遅い速度に変換するので、重要な部分を聞き易くし、その他の部分を短時間で聴取することができる。
また請求項７、１４では、検索部の機能を少なくとも２つ以上組み合わせるので、装置全体の検索効率を高めることができる。
また請求項１５では、本発明の話速変換方法をコンピュータが制御可能なＯＳに従ってプログラミングすることにより、そのＯＳを備えたコンピュータであれば同じ処理方法により制御することができる。
また請求項１６では、話速変換プログラムをコンピュータが読み取り可能な形式で記録媒体に記録することにより、この記録媒体を持ち運ぶことにより何処でもプログラムを稼動することができる。

以下、本発明を図に示した実施形態を用いて詳細に説明する。但し、この実施形態に記載される構成要素、種類、組み合わせ、形状、その相対配置などは特定的な記載がない限り、この発明の範囲をそれのみに限定する主旨ではなく単なる説明例に過ぎない。
図１は本発明の話速変換装置の概略構成図である。この話速変換装置１は、音程を変えずに音声の速度を変える話速変換部２と、話速変換する音声の対象部分を検索する検索部３とを備えて構成される。
本発明の話速変換装置１は、検索機能と音程を変えずに音声の速度を変えることができる話速変換機能とを組み合わせて、検索結果部分の話速変換速度と、その他の部分の話速変換速度とを変えることにより聴取効果を高めることができる。即ち、検索機能を用いて、データ中から重要な内容の部分や重要でない部分、聞き取り易い部分や聞き取り難い部分等を検出し、それらの位置に応じて話速を速くしたり遅くしたりする割合を変更して話速変換を行うことにより、重要な部分を聞き易くでき、重要でない部分を聴取する時間を節約することができる。さらに、話速変換と組み合わせる検索方式としては、上記に限定されず、メロディー検索、画像検索、テキスト検索など様々な手法を利用することが可能である。
図２は本発明の話速変換装置１の動作フローチャートであり、コンテンツデータ４をコンテンツデータ入力部に入力し（Ｓ１）、そのコンテンツデータに対して検索処理を行い（Ｓ２）、検索された部分の話速を速く、または、遅くする処理を行い（Ｓ３）、コンテンツ出力部に変換後コンテンツを出力する（Ｓ４）。

図３は本発明の第１の実施形態の話速変換装置の構成図である。本実施形態はコンテンツ入力部５と、重要性の高いキーワードを検索するキーワードスポッティング部６と、音程を変えずに音声の速度を変える話速変換部７と、コンテンツ出力部８とを備えて構成される。この構成による話速変換装置は、講演等を記録したマルチメディアコンテンツに本実施形態を適用する場合は、重要性の高いキーワードを指定し、そのキーワードでワードスポッティングによる音声検索を行ってキーワードの位置を特定し、コンテンツ全体の話速を速くするが、キーワードの近辺は速度を速くする割合を下げるまたは元の速度のままにするなどして、全体の話速は速いが重要なキーワードの近辺はそれよりも遅いので聞き易くなっているコンテンツが作成できる。また、音のパワーと音声特徴を組み合わせた検索により、話声だが音量の小さいを特定して、コンテンツ全体の話速を速くするが、その部分は速度を速くする割合を下げるか、元の速度より遅くするなどして、全体の話速は速いが音が、小さくて聞き難い部分はそれより話速が遅く聞き易くなっているコンテンツが作成できる。尚、ピッチを変えずに話速のみを変える話速変換手法の例としては、PICOLA (Pointer Interval Controlled OverLap and Add)などが利用できる。
図４は本発明の第２の実施形態の話速変換装置の構成図である。同じ構成要素には同じ参照番号が付されている。本実施形態はコンテンツ入力部５と、コンテンツの無音部分を検出する無音部分検出部９と、音程を変えずに音声の速度を変える話速変換部７と、コンテンツ出力部８とを備えて構成される。この構成による話速変換装置は、外国語のマルチメディアコンテンツに対して本方式を適用する場合は、重要性の高いキーワードを指定し、そのキーワードでワードスポッティングによる音声検索を行ってキーワードの位置を特定し、コンテンツ全体の話速を遅くする代わりに、キーワードの近辺の話速のみ遅くすることにより、全体の聴取時間が延びるのを抑えて、重要な部分が聞き易くなったコンテンツが作成できる。また、無音部分の検索を用いて無音の部分を特定し、有音の部分の話速は遅くし、無音の部分の話速は元のままや速くするなどして、全体を聞き易くしながら話と話の間のポーズが間延びすることを防ぐこともできる。

図５は本発明の第３の実施形態の話速変換装置の構成図である。同じ構成要素には同じ参照番号が付されている。本実施形態はコンテンツ入力部５と、音楽コンテンツから所定のメロディーを検出するメロディー検出部１０と、音程を変えずに音声の速度を変える話速変換部７と、コンテンツ出力部８とを備えて構成される。この構成による話速変換装置は、鼻歌、ハミング、歌唱などのメロディーからそれに類似するメロディーを持つ音楽コンテンツを検索するメロディー検索を検索部に利用することにより、メロディー検索で検索された部分を通常の速度のままにし、他の部分は話速変換技術で音程を変えずに早回しで再生することにより、あまり興味のない部分は速く聞いて、覚えていたサビの部分だけ通常の速度で聞くという使い方ができる。また、特開２００２−２９７１３１公報のような曲検索システムと組み合わせて使うことも可能である。尚、話速変換手法PICOLAは、人の声だけでなく音楽にも適用でき、ピッチを変えずに速度を早くすることができる。
図６は本発明の第４の実施形態の話速変換装置の構成図である。同じ構成要素には同じ参照番号が付されている。本実施形態はコンテンツ入力部５と、映像中の重要な部分を検出する映像検出部１１と、音程を変えずに音声の速度を変える話速変換部７と、コンテンツ出力部８とを備えて構成される。この構成による話速変換装置は、映像検索（特開２０００−２８５１４１公報参照）を検索部に利用して、映像中の重要な部分を検出し、対応する映像音声部分を話速変換で速度変化させることにより、重要な部分を聞き易くし、その他の部分を短時間で聴取することができる。話速に合わせて、映像の速度を変えることも当然可能である。

図７は本発明の第５の実施形態の話速変換装置の構成図である。同じ構成要素には同じ参照番号が付されている。本実施形態はコンテンツ入力部５と、字幕つきのコンテンツの字幕部分を文字列検索して重要なキーワード部分を検出する字幕検出部１２と、音程を変えずに音声の速度を変える話速変換部７と、コンテンツ出力部８とを備えて構成される。この構成による話速変換装置は、コンテンツに字幕が付いていれば、音声からキーワードスポッティングする代わりに、字幕の部分を文字列検索して重要なキーワードがある部分を検出し、対応する映像音声部分を話速変換で速度変化させることにより、重要な部分を聞き易くし、その他の部分を短時間で聴取することができる。
図８は本発明のキーワード検索を利用した話速変換の例を示す図である。即ち、元のコンテンツ３０が非キーワード部分２０、キーワードＡ２１、非キーワード部分２２、キーワードＢ２３、非キーワード部分２４により構成されているとすると、キーワード検索を利用した話速変換後のコンテンツ３１が非キーワード部分２０、２２、２４を高速化して２０ａ、２２ａ、２４ａとし、キーワードＡ２１、キーワードＢ２３の部分はそのままの速度２１ａ、２３ａとすることにより、全体の聴取時間を節約しながら、キーワード近辺の重要な部分が聞き取り易くなり、音が小さくて聞き難い部分も聞き取り易くなるという効果がある。また、外国語のマルチメディアコンテンツに対しても、全体の聴取時間が延びる量を減らしながら、キーワード近辺の重要な部分が聞き取り易くなり、音声が間延びすることを防止できるという効果がある。また、コンテンツに応じた検索手法を選択することにより、重要な部分を聞き易くでき、重要でない部分を聴取する時間を節約することができるという効果がある。

本発明の話速変換装置の概略構成図である。本発明の話速変換装置１の動作フローチャートである。本発明の第１の実施形態の話速変換装置の構成図である。本発明の第２の実施形態の話速変換装置の構成図である。本発明の第３の実施形態の話速変換装置の構成図である。本発明の第４の実施形態の話速変換装置の構成図である。本発明の第５の実施形態の話速変換装置の構成図である。本発明のキーワード検索を利用した話速変換の例を示す図である。

符号の説明

５コンテンツ入力部、６キーワードスポッティング部、７話速変換部、８コンテンツ出力部、９無音部分検出部、１０メロディー検出部、１１映像検出部、１２字幕検出部

Claims

音程を変えずに音声の速度を変える話速変換部と、話速変換する音声の対象部分を検索する検索部とを備えた話速変換装置であって、
前記検索部により検索された音声の対象部分又は該対象部分の近傍の話速を前記話速変換部により変換することにより、前記音声の聴取効果を高めることを特徴とする話速変換装置。
前記検索部は、コンテンツの音声からキーワードが存在する部分を検出するキーワード検出部を備え、該キーワード検出部により前記コンテンツ内にキーワードが存在する部分を検出した場合、前記話速変換部は、検索された近傍の部分の話速を他の部分に比べて相対的に遅い速度に変換することを特徴とする請求項１に記載の話速変換装置。
前記検索部は、コンテンツの無音部分を検出する無音部分検出部を備え、該無音部分検出部により前記コンテンツ内に無音部分を検出した場合、前記話速変換部は、検索された近傍の部分の話速を他の部分に比べて相対的に速い速度に変換することを特徴とする請求項１に記載の話速変換装置。
前記検索部は、音楽コンテンツから所定のメロディーを検出するメロディー検出部を備え、該メロディー検出部により前記音楽コンテンツ内に所定のメロディーを検出した場合、前記話速変換部は、当該メロディー部分の話速を通常の速度に変換することを特徴とする請求項１に記載の話速変換装置。
前記検索部は、映像中の重要な部分を検出する映像検出部を備え、該映像検出部により重要な映像部分を検出した場合、前記話速変換部は、検索された近傍の部分の話速を他の部分に比べて相対的に遅い速度に変換することを特徴とする請求項１に記載の話速変換装置。
前記検索部は、字幕つきのコンテンツの字幕部分を文字列検索して重要なキーワード部分を検出する字幕検出部を備え、該字幕検出部により重要なキーワード部分を検出した場合、前記話速変換部は、検索された近傍の部分の話速を他の部分に比べて相対的に遅い速度に変換することを特徴とする請求項１に記載の話速変換装置。
前記検索部は、請求項２乃至６の何れか一項に記載の検索部の機能を少なくとも２つ以上組み合わせたことを特徴とする話速変換装置。
音程を変えずに音声の速度を変える話速変換ステップと、話速変換する音声の対象部分を検索する検索ステップとを備えた話速変換方法であって、
前記ステップにより検索された音声の対象部分又は該対象部分の近傍の話速を前記話速変換ステップにより変換することにより、前記音声の聴取効果を高めることを特徴とする話速変換方法。
前記検索ステップは、コンテンツの音声からキーワードが存在する部分を検出するキーワード検出ステップを備え、該キーワード検出ステップ部により前記コンテンツ内にキーワードが存在する部分を検出した場合、前記話速変換ステップは、検索された近傍の部分の話速を他の部分に比べて相対的に遅いに変換することを特徴とする請求項８に記載の話速変換方法。
前記検索ステップは、コンテンツの無音部分を検出する無音部分検出ステップを備え、該無音部分検出ステップにより前記コンテンツ内に無音部分を検出した場合、前記話速変換ステップは、検索された近傍の部分の話速を他の部分に比べて相対的に速い速度に変換することを特徴とする請求項８に記載の話速変換方法。
前記検索ステップは、音楽コンテンツから所定のメロディーを検出するメロディー検出ステップを備え、該メロディー検出ステップにより前記音楽コンテンツ内に所定のメロディーを検出した場合、前記話速変換ステップは、当該メロディー部分の話速を通常の速度に変換することを特徴とする請求項８に記載の話速変換方法。
前記検索ステップは、映像中の重要な部分を検出する映像検出ステップを備え、該映像検出ステップにより重要な映像部分を検出した場合、前記話速変換ステップは、検索された近傍の部分の話速を他の部分に比べて相対的に遅い速度に変換することを特徴とする請求項８に記載の話速変換方法。
前記検索ステップは、字幕つきのコンテンツの字幕部分を文字列検索して重要なキーワード部分を検出する字幕検出ステップを備え、該字幕検出ステップにより重要なキーワード部分を検出した場合、前記話速変換ステップは、検索された近傍の部分の話速を他の部分に比べて相対的に遅い速度に変換することを特徴とする請求項８に記載の話速変換方法。
前記検索ステップは、請求項８乃至１３の何れか一項に記載の検索ステップの機能を少なくとも２つ以上組み合わせたことを特徴とする話速変換方法。
請求項８乃至１４の何れか一項に記載の話速変換方法をコンピュータが制御可能にプログラミングしたことを特徴とする話速変換プログラム。
請求項１５に記載の話速変換プログラムをコンピュータが読み取り可能な形式で記録したことを特徴とする記録媒体。