JP4390289B2 - 再生装置 - Google Patents

再生装置 Download PDF

Info

Publication number
JP4390289B2
JP4390289B2 JP2007068900A JP2007068900A JP4390289B2 JP 4390289 B2 JP4390289 B2 JP 4390289B2 JP 2007068900 A JP2007068900 A JP 2007068900A JP 2007068900 A JP2007068900 A JP 2007068900A JP 4390289 B2 JP4390289 B2 JP 4390289B2
Authority
JP
Japan
Prior art keywords
link
reproduction
information
data
destination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007068900A
Other languages
English (en)
Other versions
JP2008233208A (ja
Inventor
弘太 ▲高▼橋
康生 政木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
THE UNIVERSITY OF ELECTRO-COMUNICATINS
Funai Electric Co Ltd
Original Assignee
THE UNIVERSITY OF ELECTRO-COMUNICATINS
Funai Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by THE UNIVERSITY OF ELECTRO-COMUNICATINS, Funai Electric Co Ltd filed Critical THE UNIVERSITY OF ELECTRO-COMUNICATINS
Priority to JP2007068900A priority Critical patent/JP4390289B2/ja
Priority to US12/048,297 priority patent/US8165888B2/en
Publication of JP2008233208A publication Critical patent/JP2008233208A/ja
Application granted granted Critical
Publication of JP4390289B2 publication Critical patent/JP4390289B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/01Correction of time axis

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、再生装置に関する。
従来、話速を変化させるために時間軸の拡大縮小を単純に行うと、音声のピッチ(声の高さ)が変化してしまって聴き苦しい等の問題があった。
そこで、ピッチを変化させることなく話速を変化させることによって、話速をユーザにとって聴き易く修正する話速変換技術が提案された。
具体的には、例えば、音声データの波形スタイルが右上がりであるか右下がりであるか等をチェックして、波形スタイルが同じもの同士を接合することによって、ピッチを変化させることなく話速を変化させる処理を行う再生装置が提案された(例えば、特許文献1参照)。
また、音声データを前半ブロックと後半ブロックとに分割し、前半ブロックの音声データに対しては減衰率が次第に大きくなるように減衰処理を施すとともに、後半ブロックの音声データに対しては減衰率が次第に小さくなるように減衰処理を施して、当該減衰処理が施された前半ブロックと後半ブロックとをオーバーラップさせることによって、ピッチを変化させることなく話速を変化させる処理を行う再生装置が提案された(例えば、特許文献2参照)。
また、音声データのうちの、右上がりに変化する窓関数を乗算した部分と、右下がりに変化する窓関数を乗算した部分と、をオーバーラップさせることによって、ピッチを変化させることなく話速を変化させる処理を行う再生装置が提案された(例えば、特許文献3及び非特許文献1参照)。
特開平06−259093号公報 特開2006−127647号公報 特許第2955247号公報 ICASSP−93,Vol.2,pp.554−577,1993
しかしながら、特許文献1〜3及び非特許文献1の発明では、音声データの再生時に上記ピッチを変化させることなく話速を変化させる処理を実行するため、当該再生時に再生装置の計算負荷が増大するという問題があり、また、音声データの中から厳選された部分同士が接合されたりオーバーラップされるわけではないため、必ずしも再生された音声がユーザにとって聴き易いとはいえないという問題もある。
本発明の課題は、再生時の計算負荷を抑えつつ、ユーザにとって視聴し易い状態で再生データの可変速再生を行うことができる再生装置を提供することにある。
上記課題を解決するために、請求項1に記載の発明は、
音声データ及び/又は映像データからなる再生データを再生する再生手段と、
前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
前記再生データの再生速度を指定する指定手段と、
前記リンク先毎に、前記選択手段により選択された回数を記憶する記憶手段と、を備え、
前記リンク情報は、前記再生データにおける前記リンク先の位置に関するリンク先位置情報と、前記リンク元と前記リンク先との波形の不一致度に関する不一致度情報と、前記再生ポイントを前記リンク元から前記リンク先へ移動させることによって生じる信号エネルギーの損失に関する損失情報と、を含み、
前記選択手段は、前記再生データにおける前記指定手段により指定された再生速度に応じた指定再生ポイントと、前記リンク情報に含まれるリンク先位置情報に基づくリンク先ポイントと、の時間的誤差に関する誤差情報を取得し、当該取得した誤差情報と当該誤差情報に設定された誤差情報用重み付けとの積と、前記リンク情報に含まれる不一致度情報と当該不一致度情報に設定された不一致度情報用重み付けとの積と、前記リンク情報に含まれる損失情報と当該損失情報に設定された損失情報用重み付けとの積と、の和である前記評価値を算出して、前記複数のリンク先のうちの、前記記憶手段に記憶された回数が所定の閾値を下回るリンク先の中から、当該評価値が最も小さいリンク先を選択することを特徴とする。
請求項2に記載の発明は、
請求項1に記載の再生装置において、
前記リンク情報を作成するリンク作成手段を備えることを特徴とする。
請求項3に記載の発明は、
音声データ及び/又は映像データからなる再生データを再生する再生手段と、
前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
前記再生データの再生速度を指定する指定手段と、
を備え、
前記リンク情報は、前記再生データにおける前記リンク先の位置に関するリンク先位置情報と、前記リンク元と前記リンク先との波形の不一致度に関する不一致度情報と、前記再生ポイントを前記リンク元から前記リンク先へ移動させることによって生じる信号エネルギーの損失に関する損失情報と、を含み、
前記選択手段は、前記再生データにおける前記指定手段により指定された再生速度に応じた指定再生ポイントと、前記リンク情報に含まれるリンク先位置情報に基づくリンク先ポイントと、の時間的誤差に関する誤差情報を取得し、当該取得した誤差情報と、前記リンク情報に含まれる不一致度情報及び損失情報のうちの少なくとも1つの情報と、に基づいて前記評価値を算出することを特徴とする。
請求項4に記載の発明は、
請求項3に記載の再生装置において、
前記評価値は、前記誤差情報と当該誤差情報に設定可能な誤差情報用重み付けとの積と、前記不一致度情報と当該不一致度情報に設定可能な不一致度情報用重み付けとの積及び前記損失情報と当該損失情報に設定可能な損失情報用重み付けとの積のうちの少なくとも1つの積と、の和であり、
前記評価値における評価が最も高いリンク先は、当該評価値が最も小さいリンク先であることを特徴とする。
請求項5に記載の発明は、
請求項4に記載の再生装置において、
前記リンク元よりも時間的に未来方向にある前記リンク先に関するリンク情報から取得される誤差情報と、前記リンク元よりも時間的に過去方向にある前記リンク先に関するリンク情報から取得される誤差情報と、には別個の前記誤差情報用重み付けが設定可能であり、
前記リンク元よりも時間的に未来方向にある前記リンク先に関するリンク情報に含まれる不一致度情報と、前記リンク元よりも時間的に過去方向にある前記リンク先に関するリンク情報に含まれる不一致度情報と、には別個の前記不一致度情報用重み付けが設定可能であり、
前記リンク元よりも時間的に未来方向にある前記リンク先に関するリンク情報に含まれる損失情報と、前記リンク元よりも時間的に過去方向にある前記リンク先に関するリンク情報に含まれる損失情報と、には別個の前記損失情報用重み付けが設定可能であることを特徴とする。
請求項6に記載の発明は、
音声データ及び/又は映像データからなる再生データを再生する再生手段と、
前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
前記リンク先毎に、前記選択手段により選択された回数を記憶する記憶手段と、
を備え、
前記選択手段は、前記複数のリンク先のうちの、前記記憶手段に記憶された回数が所定の閾値を下回るリンク先の中から、前記評価値における評価が最も高いリンク先を選択することを特徴とする。
請求項7に記載の発明は、
音声データ及び/又は映像データからなる再生データを再生する再生手段と、
前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
を備え、
前記再生データは、当該再生データに対して予め設定された前記リンク情報とともに所定の記録媒体に記録されていることを特徴とする。
請求項8に記載の発明は、
音声データ及び/又は映像データからなる再生データを再生する再生手段と、
前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
前記リンク情報に基づいて作成された前記リンク元と前記各リンク先との時間的な対応付けを表示するためのリンク表示データに基づくリンク画像を、表示装置に表示させる表示制御手段と、
を備えることを特徴とする。
請求項9に記載の発明は、
音声データ及び/又は映像データからなる再生データを再生する再生手段と、
前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
を備え、
前記再生データは音声データであり、
前記再生データ中の無音領域内に前記リンク元が位置する場合、当該リンク元の前記リンク情報は、当該無音領域の開始点及び終了点を前記リンク先とした無音内リンク情報を含むことを特徴とする。
請求項10に記載の発明は、
音声データ及び/又は映像データからなる再生データを再生する再生手段と、
前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
を備え、
前記再生データは音声データであり、
前記再生データ中の無音領域内に前記リンク元が位置する場合、当該リンク元の前記リンク情報は、当該無音領域とは異なる当該再生データ中の無音領域の終了点を前記リンク先とした無音間リンク情報を含むことを特徴とする。
請求項11に記載の発明は、
音声データ及び/又は映像データからなる再生データを再生する再生手段と、
前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
を備え、
前記再生データは音声データであり、
前記再生データ中の周期音領域の開始点又は終了点に前記リンク元が位置する場合、当該リンク元の前記リンク情報は、それぞれ当該周期音領域の終了点及び開始点を前記リンク先とした周期音リンク情報を含むことを特徴とする。
請求項12に記載の発明は、
音声データ及び/又は映像データからなる再生データを再生する再生手段と、
前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
を備え、
前記リンク元の前記リンク情報は、ユーザにより指定された指定リンク先を前記リンク先とした主観的リンク情報を含むことを特徴とする。
請求項13に記載の発明は、
音声データ及び/又は映像データからなる再生データを再生する再生手段と、
前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
前記リンク情報を作成するリンク作成手段と、
を備えることを特徴とする。
請求項14に記載の発明は、
請求項3〜13の何れか一項に記載の再生装置において、
前記リンク元の前記リンク情報は、当該リンク元の位置から所定の検索範囲内にある任意点のうちの、前記不一致度情報に基づく不一致度が最も小さい不一致度最小点を前記リンク先とした単純リンク情報を含むことを特徴とする。
請求項1に記載の発明によれば、選択手段によって、再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択することができ、再生制御手段によって、再生手段による再生データの再生ポイントがリンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、再生手段に当該再生データを再生させることができる。
すなわち、予め設定されたリンク情報に基づいて再生データを再生することができるため、再生時の計算負荷を抑えることができ、さらに、リンク情報に基づいて複数のリンク先の中から最適なリンク先を選択することができるため、ユーザにとって視聴し易い状態で再生データの可変速再生を行うことができる。
また、記憶手段によって、リンク先毎に、選択手段により選択された回数を記憶することができ、リンク情報は、再生データにおけるリンク先の位置に関するリンク先位置情報と、リンク元とリンク先との波形の不一致度に関する不一致度情報と、再生ポイントをリンク元からリンク先へ移動させることによって生じる信号エネルギーの損失に関する損失情報と、を含み、選択手段は、再生データにおける指定手段により指定された再生速度に応じた指定再生ポイントと、リンク情報に含まれるリンク先位置情報に基づくリンク先ポイントと、の時間的誤差に関する誤差情報を取得し、当該取得した誤差情報と当該誤差情報に設定された誤差情報用重み付けとの積と、リンク情報に含まれる不一致度情報と当該不一致度情報に設定された不一致度情報用重み付けとの積と、リンク情報に含まれる損失情報と当該損失情報に設定された損失情報用重み付けとの積と、の和である評価値を算出して、複数のリンク先のうちの、記憶手段に記憶された回数が所定の閾値を下回るリンク先の中から、当該評価値が最も小さいリンク先を選択することができる。
したがって、誤差情報(リンク先と指定再生ポイントとの時間的誤差)と、不一致度情報(リンク元とリンク先との波形の不一致度)と、損失情報(再生ポイントの移動によって生じる信号エネルギーの損失)と、を加味して、最適なリンク先を選択して再生データを再生するため、より一層ユーザにとって視聴し易い状態で再生データを再生できる。
また、誤差情報、不一致度情報、損失情報にはそれぞれ重み付けが設定可能であるため、ユーザの好みに応じた重み付けを設定することによって、ユーザの好みに応じたリンク先を決定することができる。
また、記憶手段に記憶された回数が所定の閾値を下回るリンク先の中から、評価値が最も小さいリンク先を選択することができるため、同じリンク先を繰り返して選択することを防止できることとなって、ユーザは不快感をおぼえることなく視聴することができる。
請求項2に記載の発明によれば、請求項1に記載の発明と同様の効果が得られることは無論のこと、リンク情報を作成するリンク情報作成手段を備えている。
したがって、リンク情報を作成して、そのリンク情報に基づいて再生データを再生することができる。
請求項3に記載の発明によれば、選択手段によって、再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択することができ、再生制御手段によって、再生手段による再生データの再生ポイントがリンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、再生手段に当該再生データを再生させることができる。
すなわち、予め設定されたリンク情報に基づいて再生データを再生することができるため、再生時の計算負荷を抑えることができ、さらに、リンク情報に基づいて複数のリンク先の中から最適なリンク先を選択することができるため、再生データをユーザにとって視聴し易い状態で再生できる。
また、選択手段は、再生データにおける指定手段により指定された再生速度に応じた指定再生ポイントと、リンク情報に含まれるリンク先位置情報に基づくリンク先ポイントと、の時間的誤差に関する誤差情報を取得し、当該取得した誤差情報と、リンク情報に含まれる不一致度情報及び損失情報のうちの少なくとも1つの情報と、に基づいて評価値を算出することができる。
したがって、誤差情報(リンク先と指定再生ポイントとの時間的誤差)と、不一致度情報(リンク元とリンク先との波形の不一致度)又は損失情報(再生ポイントの移動によって生じる信号エネルギーの損失)と、を加味して、最適なリンク先を選択して再生データを再生するため、より一層ユーザにとって視聴し易い状態で再生データを再生できる。
請求項4に記載の発明によれば、請求項に記載の発明と同様の効果が得られることは無論のこと、評価値は、誤差情報と当該誤差情報に設定可能な誤差情報用重み付けとの積と、不一致度情報と当該不一致度情報に設定可能な不一致度情報用重み付けとの積及び損失情報と当該損失情報に設定可能な損失情報用重み付けとの積のうちの少なくとも1つの積と、の和である。
したがって、誤差情報、不一致度情報、損失情報にはそれぞれ重み付けが設定可能であるため、ユーザの好みに応じた重み付けを設定することによって、ユーザの好みに応じたリンク先を決定することができる。
請求項5に記載の発明によれば、請求項4に記載の発明と同様の効果が得られることは無論のこと、リンク元よりも時間的に未来方向にあるリンク先に関するリンク情報から取得される誤差情報と、リンク元よりも時間的に過去方向にあるリンク先に関するリンク情報から取得される誤差情報と、には別個の誤差情報用重み付けが設定可能であり、リンク元よりも時間的に未来方向にあるリンク先に関するリンク情報に含まれる不一致度情報と、リンク元よりも時間的に過去方向にあるリンク先に関するリンク情報に含まれる不一致度情報と、には別個の不一致度情報用重み付けが設定可能であり、リンク元よりも時間的に未来方向にあるリンク先に関するリンク情報に含まれる損失情報と、リンク元よりも時間的に過去方向にあるリンク先に関するリンク情報に含まれる損失情報と、には別個の損失情報用重み付けが設定可能である。
したがって、リンク元よりも時間的に未来方向にあるリンク先を選択する場合(すなわち、再生データを高速再生する場合)と、リンク元よりも時間的に過去方向にあるリンク先を選択する場合(すなわち、再生データをスロー再生する場合)と、で別個の重み付けが設定可能であるため、より一層ユーザの好みに応じたリンク先を決定することができる。
請求項6に記載の発明によれば、選択手段によって、再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択することができ、再生制御手段によって、再生手段による再生データの再生ポイントがリンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、再生手段に当該再生データを再生させることができる。
すなわち、予め設定されたリンク情報に基づいて再生データを再生することができるため、再生時の計算負荷を抑えることができ、さらに、リンク情報に基づいて複数のリンク先の中から最適なリンク先を選択することができるため、再生データをユーザにとって視聴し易い状態で再生できる。
また、記憶手段によって、リンク先毎に、選択手段により選択された回数を記憶することができ、選択手段は、複数のリンク先のうちの、記憶手段に記憶された回数が所定の閾値を下回るリンク先の中から、評価値における評価が最も高いリンク先を選択することができる。
したがって、同じリンク先を繰り返して選択することを防止できるため、ユーザは不快感をおぼえることなく視聴することができる。
請求項7に記載の発明によれば、選択手段によって、再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択することができ、再生制御手段によって、再生手段による再生データの再生ポイントがリンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、再生手段に当該再生データを再生させることができる。
すなわち、予め設定されたリンク情報に基づいて再生データを再生することができるため、再生時の計算負荷を抑えることができ、さらに、リンク情報に基づいて複数のリンク先の中から最適なリンク先を選択することができるため、再生データをユーザにとって視聴し易い状態で再生できる。
また、再生データは、当該再生データに対して予め設定されたリンク情報とともに所定の記録媒体に記録されている。
したがって、記録媒体に記録されたリンク情報に基づいて再生データを再生することができる。
請求項8に記載の発明によれば、選択手段によって、再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択することができ、再生制御手段によって、再生手段による再生データの再生ポイントがリンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、再生手段に当該再生データを再生させることができる。
すなわち、予め設定されたリンク情報に基づいて再生データを再生することができるため、再生時の計算負荷を抑えることができ、さらに、リンク情報に基づいて複数のリンク先の中から最適なリンク先を選択することができるため、再生データをユーザにとって視聴し易い状態で再生できる。
また、表示制御手段によって、リンク情報に基づいて作成されたリンク元と各リンク先との時間的な対応付けを表示するためのリンク表示データに基づくリンク画像を、表示装置に表示させることができる。
すなわち、リンクを可視化してユーザに呈することができるので、ユーザに予め再生データのどの位置にリンクが張られているかを一望させることができ、ユーザ操作の支援になるため、使い勝手が良い。
請求項9に記載の発明によれば、選択手段によって、再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択することができ、再生制御手段によって、再生手段による再生データの再生ポイントがリンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、再生手段に当該再生データを再生させることができる。
すなわち、予め設定されたリンク情報に基づいて再生データを再生することができるため、再生時の計算負荷を抑えることができ、さらに、リンク情報に基づいて複数のリンク先の中から最適なリンク先を選択することができるため、再生データをユーザにとって視聴し易い状態で再生できる。
また、再生データ中の無音領域内にリンク元が位置する場合、当該リンク元のリンク情報は、当該無音領域の開始点及び終了点をリンク先とした無音内リンク情報を含む。
すなわち、無音内リンク情報に基づくリンクは、無音領域内で移動するリンクであるため、当該リンクを利用すると、例えば、高速再生時に無音領域を省略したり、或いは、スロー再生時に無音領域で時間つぶしをすることができることとなって、有効である。
請求項10に記載の発明によれば、選択手段によって、再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択することができ、再生制御手段によって、再生手段による再生データの再生ポイントがリンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、再生手段に当該再生データを再生させることができる。
すなわち、予め設定されたリンク情報に基づいて再生データを再生することができるため、再生時の計算負荷を抑えることができ、さらに、リンク情報に基づいて複数のリンク先の中から最適なリンク先を選択することができるため、再生データをユーザにとって視聴し易い状態で再生できる。
また、再生データ中の無音領域内にリンク元が位置する場合、当該リンク元のリンク情報は、当該無音領域とは異なる当該再生データ中の無音領域の終了点をリンク先とした無音間リンク情報を含む。
すなわち、無音間リンク情報に基づくリンクは、異なる無音領域間を移動するためのリンクであるため、当該リンクを利用すると、例えば、高速再生時に1単語を省略すること等ができることとなって、有効である。
請求項11に記載の発明によれば、選択手段によって、再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択することができ、再生制御手段によって、再生手段による再生データの再生ポイントがリンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、再生手段に当該再生データを再生させることができる。
すなわち、予め設定されたリンク情報に基づいて再生データを再生することができるため、再生時の計算負荷を抑えることができ、さらに、リンク情報に基づいて複数のリンク先の中から最適なリンク先を選択することができるため、再生データをユーザにとって視聴し易い状態で再生できる。
また、再生データ中の周期音領域の開始点又は終了点にリンク元が位置する場合、当該リンク元のリンク情報は、それぞれ当該周期音領域の終了点及び開始点をリンク先とした周期音リンク情報を含む。
すなわち、周期音リンク情報に基づくリンクは、周期音領域内でのリンクであるため、当該リンクを利用すると、例えば、高速再生時に周期音領域を省略したり、或いは、スロー再生時に周期音領域で時間つぶしをすることができることとなって、有効である。
請求項12に記載の発明によれば、選択手段によって、再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択することができ、再生制御手段によって、再生手段による再生データの再生ポイントがリンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、再生手段に当該再生データを再生させることができる。
すなわち、予め設定されたリンク情報に基づいて再生データを再生することができるため、再生時の計算負荷を抑えることができ、さらに、リンク情報に基づいて複数のリンク先の中から最適なリンク先を選択することができるため、再生データをユーザにとって視聴し易い状態で再生できる。
また、リンク元のリンク情報は、ユーザにより指定された指定リンク先をリンク先とした主観的リンク情報を含む。
すなわち、主観的リンク情報に基づくリンクは、ユーザが主観的に判断して設けるリンクであるため、当該リンクを利用すると、例えば、ユーザが重要であると判断した領域を省略することなく再生したり、或いは、ユーザが不要であると判断した領域は省略することができることとなって、有効である。
ここで、ユーザとは、リンク情報を作成する者であり、例えば、再生データDを作成した者(例えば、再生データDが映画であれば映画監督、再生データDがドキュメンタリー番組であれば編集者)であってもよいし、再生データDを鑑賞する者(再生データDの視聴者)であってもよい。
請求項13に記載の発明によれば、選択手段によって、再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択することができ、再生制御手段によって、再生手段による再生データの再生ポイントがリンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、再生手段に当該再生データを再生させることができる。
すなわち、予め設定されたリンク情報に基づいて再生データを再生することができるため、再生時の計算負荷を抑えることができ、さらに、リンク情報に基づいて複数のリンク先の中から最適なリンク先を選択することができるため、再生データをユーザにとって視聴し易い状態で再生できる。
また、リンク情報を作成するリンク情報作成手段を備えている。
したがって、リンク情報を作成して、そのリンク情報に基づいて再生データを再生することができる。
請求項14に記載の発明によれば、請求項3〜13の何れか一項に記載の発明と同様の効果が得られることは無論のこと、リンク元のリンク情報は、当該リンク元の位置から所定の検索範囲内にある任意点のうちの、不一致度情報に基づく不一致度が最も小さい不一致度最小点をリンク先とした単純リンク情報を含む。
すなわち、単純リンク情報に基づくリンクは、リンク元の波形とリンク先の波形との不一致度が小さいリンクであるため、当該リンクを利用すると、再生ポイントを移動させても、再生データの波形の連続性を好適に維持することができることとなって、再生ポイントを移動させることによって生じる不快な音声の出力を抑えることができる。
以下、図を参照して、本発明にかかる再生装置の最良の形態を詳細に説明する。なお、発明の範囲は、図示例に限定されない。
[第1の実施の形態]
まず、第1の実施の形態における再生装置1について説明する。
図12に示す再生装置1は、例えば、所定の記録媒体Mに記録された音声データからなる再生データDを再生するための装置である。
再生データDは、例えば、図1〜3に示すように、再生データDに対して予め設定されたリンク情報及びリンク表示データとともに記録媒体Mに記録されており、再生装置1は、例えば、当該リンク情報に基づいてピッチを変化させることなく再生データDの時間軸を変更して再生データDを再生するとともに、図14に示すように、当該リンク表示データに基づいて再生中の再生データDに応じたリンク画像G2(詳しくはリンク画像G2が合成された音声画像配置図G1)を表示する。
再生データDは、例えば、予め記録媒体Mに記録されている。
リンク情報は、例えば、図6に示すリンク情報作成装置3により、記録媒体Mに記録された再生データDに基づいて作成されて、記録媒体Mに記録されるようになっている。
リンク表示データは、例えば、図10に示すリンク表示データ作成装置5により、記録媒体Mに記録された再生データD及びリンク情報に基づいて作成されて、記録媒体Mに記録されるようになっている。
なお、記録媒体Mは、例えば、CDや、DVD、HDD、半導体メモリ、メモリカードなど、データの読み書きが可能な記録媒体であれば任意である。
再生データDは、一定のサンプリング周波数で、例えば、図1に示すように、固定長のフレームに区切られて、記録媒体Mに記録されている。
なお、サンプリング周波数及びフレームの長さは任意であるが、本実施の形態では、サンプリング周波数を44.1kHzとし、1フレームの長さを1/30秒とする。したがって、本実施の形態では、図2(a)に示すように、1フレームの幅Wは1470サンプルとなる。
ここで、各フレームには、先頭からフレーム番号F(F=0,1,…,Fmax(フレームの総数)−1)が付与されているとともに、再生データ中の各サンプル(各信号)には、先頭からサンプル番号P(P=0,1,…,Pmax(サンプルの総数)−1)が付与されていることとする。
リンク元L1は、例えば、各フレーム内の所定位置にそれぞれ設けられている。
なお、リンク元L1は、フレーム内の任意の位置に設けることが可能であるが、フレームの末尾近くに設けることで、アクセスした情報を最大限に活用できるようになる。
ここで、再生データDの再生の際、再生装置1は、例えば、リンク情報に基づいて、リンク元L1に対応する複数のリンク先L2の中から一のリンク先L2を選択して、そのリンク元L1を当該選択されたリンク先L2にリンクさせるようになっているが、このリンク部分(継ぎ接ぎ部分)では、リンク元L1を開始点とする波形と、リンク先L2を開始点とする波形と、を所定の幅Wでオーバーラップするようになっている。本実施の形態では、例えば、図2(a)に示すように、オーバーラップ領域(図2(a)において斜線で示した領域)の幅Wを490サンプルとするため、リンク元L1をフレームの末尾近くに設けるのが好都合である点も考慮して、リンク元L1の位置を、フレームの末尾よりも時間的に489サンプル前の位置に設けることとする。
したがって、本実施の形態では、フレーム番号Fのフレーム内にあるリンク元L1のサンプル番号は、P=((F+1)×W−1)−(W−1)=(F+1)×W−Wとなる。
具体的には、例えば、図2(a)に示すように、フレーム番号F=20のフレーム内にあるリンク元L1のサンプル番号は、P=30380(=(20+1)×1470−490)となり、フレーム番号Fのフレーム内にあるリンク元L1のオーバーラップ領域は、P=30380〜30869の490サンプルとなる。
リンク先L2は、例えば、再生データDの波形の連続性を維持するために、リンク元L1のオーバーラップ領域とリンク先L2のオーバーラップ領域との波形の類似度は高い必要があるので、フレーム内の任意の位置に設けることができるようにしておく必要がある。
ここで、オーバーラップについて説明する。
リンク元L1のサンプル番号をP1とし、リンク先L2のサンプル番号をP2とし、サンプル番号Pの再生データD(音声データ)をdata[P]としたときのオーバーラップ領域の出力波形のi番目のサンプル値out[i]は、加重平均(以下の式(1))で算出される。
ここで、式(1)中のW[i]は窓関数であり、以下の式(2)で定義される。
Figure 0004390289
具体的には、例えば、図3に示すように、右下がりに変化する窓関数W[i]が乗算されたリンク元L1のオーバーラップ領域と、右上がりに変化する窓関数W[i]が乗算されたリンク先L2のオーバーラップ領域と、がオーバーラップされる。
リンク情報は、例えば、リンク数Kmax[F]と、恒等リンク情報、単純リンク情報、無音内リンク情報、無音間リンク情報、周期音リンク情報及び/又は主観的リンク情報と、などにより構成される。
恒等リンク情報、単純リンク情報、無音内リンク情報、無音間リンク情報、周期音リンク情報及び主観的リンク情報は、例えば、カテゴリctgry[F][K]と、リンク先サンプル番号link[F][K]と、不一致度err[F][K]と、損失loss[F][K]と、などにより構成される。なお、恒等リンク情報、単純リンク情報、無音内リンク情報、無音間リンク情報、周期音リンク情報及び主観的リンク情報は、後述で示すように、カテゴリctgry[F][K]によってそれぞれ識別される。
具体的には、例えば、図2(a)に示すフレーム番号F=20のフレーム内にあるリンク元L1に対応するリンク先L2に関するリンク情報は、例えば、図2(b)に示すような情報となる。
リンク数Kmax[F]は、例えば、フレーム番号Fのフレーム内にあるリンク元L1に対応するリンク先L2の個数を示す情報、すなわち、フレーム番号Fのフレーム内にあるリンク元L1に張られたリンクの本数を示す情報である。
例えば、図2(a)では、リンク元L1に対応するリンク先L2の個数は6個、すなわち、リンク元L1に張られたリンクの本数は6本であるため、図2(b)では、リンク数Kmax[20]=6となっている。
カテゴリctgry[F][K]は、例えば、フレーム番号Fのフレーム内にあるリンク元L1に張られたリンク番号K(K=0,1,…,リンク数Kmax[F]−1)のリンクの種類を示す情報、すなわち、フレーム番号Fのフレーム内にあるリンク元L1に対応するリンク先L2がどのような根拠で採用されたかを示す情報である。
リンクの種類には、例えば、恒等リンクと、単純リンクと、無音内リンクと、無音間リンクと、周期音リンクと、主観的リンクと、などがあり、例えば、図4に示すように、カテゴリctgry[F][K]=0は恒等リンクを示し、カテゴリctgry[F][K]=1は単純リンクを示し、カテゴリctgry[F][K]=2は無音内リンクを示し、カテゴリctgry[F][K]=3は無音間リンクを示し、カテゴリctgry[F][K]=4は周期音リンクを示し、カテゴリctgry[F][K]=5は主観的リンクを示す。
恒等リンクは、例えば、同一位置へのリンク、具体的には、例えば、リンク元L1と同一の位置をリンク先L2として採用したリンクである。
このように再生ポイントを移動させないことをリンクとしておくことで、再生データDの再生時には最適なリンク先L2を探すという操作に一本化できるので、再生装置1のソフトウエアが単純化できる。
単純リンクは、例えば、所定の検索範囲内から波形が一致するものとして単純に選択されたリンク、具体的には、例えば、リンク元L1の位置から所定の検索範囲内にある任意点のうちの、不一致度err[F][K]が最も小さい不一致度最小点をリンク先L2として採用したリンクである。
無音内リンクは、例えば、無音領域内で移動するためのリンク、具体的には、例えば、再生データD中の無音領域内にリンク元L1が位置する場合、当該無音領域の開始点及び終了点をリンク先L2として採用したリンクである。
無音間リンクは、例えば、異なる無音領域間を移動するためのリンク、具体的には、例えば、再生データD中の無音領域内にリンク元L1が位置する場合、当該無音領域とは異なる再生データD中の無音領域の終了点をリンク先L2として採用したリンクである。
周期音リンクは、例えば、周期信号内でのリンク、具体的には、例えば、再生データD中の周期音領域の開始点又は終了点にリンク元L1が位置する場合、それぞれ当該周期音領域の終了点及び開始点をリンク先L2として採用したリンクである。
すなわち、例えば、周期音リンクには、周期音領域の開始点がリンク元L1であり当該周期音領域の終了点がリンク先L2である周期音リンクと、周期音領域の終了点がリンク元L1であり当該周期音領域の開始点がリンク先L2である周期音リンクと、がある。
主観的リンクは、例えば、ユーザが手作業で付けたリンク、具体的には、例えば、ユーザにより指定された指定リンク先をリンク先L2として採用したリンクである。
ここで、ユーザとは、リンク情報作成装置3を操作してリンク情報を作成する者であり、例えば、再生データDを作成した者であってもよいし、再生データDを鑑賞する者であってもよい。
例えば、図2(b)では、カテゴリctgry[20][0]=0であるので、リンク番号K=0のリンクは、恒等リンクであることが分かる。
また、図2(b)では、カテゴリctgry[20][1]=1,カテゴリctgry[20][2]=1,カテゴリctgry[20][3]=1であるので、リンク番号K=1,2,3のリンクは、単純リンクであることが分かる。
また、図2(b)では、カテゴリctgry[20][4]=5,カテゴリctgry[20][5]=5であるので、リンク番号K=4,5のリンクは、主観的リンクであることが分かる。
ここで、例えば、恒等リンク情報は、カテゴリctgry[F][K]=0を含んで構成される情報であり、単純リンク情報は、カテゴリctgry[F][K]=1を含んで構成される情報であり、無音内リンク情報は、カテゴリctgry[F][K]=2を含んで構成される情報であり、無音間リンク情報は、カテゴリctgry[F][K]=3を含んで構成される情報であり、例えば、周期音リンク情報は、カテゴリctgry[F][K]=4を含んで構成される情報であり、主観的リンク情報は、カテゴリctgry[F][K]=5を含んで構成される情報である。
したがって、図2に示すフレーム番号F=20のフレーム内にあるリンク元L1のリンク情報は、リンク番号K=0のリンクに係る1組の恒等リンク情報と、リンク番号K=1,2,3のリンクに係る3組の単純リンク情報と、リンク番号K=4,5のリンクに係る2組の主観的リンク情報と、を含んでいることになる。
リンク先サンプル番号link[F][K]は、例えば、再生データDにおけるリンク先L2の位置に関するリンク先位置情報であり、例えば、フレーム番号Fのフレーム内にあるリンク元L1とリンク番号Kのリンクで連結されるリンク先L2のサンプル番号Pである。
例えば、図2(a)では、リンク番号K=1のリンクのリンク先L2は、サンプル番号P=32456であるため、図2(b)では、リンク先サンプル番号link[20][1]=32456となっている。
不一致度err[F][K]は、例えば、リンク元L1のオーバーラップ領域と、リンク先L2のオーバーラップ領域と、の波形の不一致度に関する不一致度情報であり、フレーム番号Fのフレーム内にあるリンク元L1のオーバーラップ領域と、そのリンク元L1とリンク番号Kのリンクで連結されたリンク先L2のオーバーラップ領域と、の波形の不一致度を示す値である。
ここで、不一致度err[F][K]は、リンク元L1のサンプル番号をP1=(F+1)×W−Wとし、リンク先L2のサンプル番号をP2=link[F][K]とすると、以下の式(3)で定義することができる。
Figure 0004390289
ここで、式(3)中のW[i]は、窓関数W[i]による重み付け加算の影響を考慮した評価重みであり、例えば、以下の式(4)とするとよい。
式(3)中のW[i]を式(4)とすることで、不一致度err[F][K]は、以下の式(5)に示すように、リンク元信号からの修正量のエネルギーと、リンク先信号からの修正量のエネルギーと、をそれぞれに対する窓関数W[i]で重み付けして加算した量と等しくなる。
Figure 0004390289
例えば、図2(a)では、リンク番号K=0のリンクは恒等リンクであるので、例えば、図2(b)では不一致度err[20][0]=0となっている。
また、例えば、図2(a)では、リンク番号K=2のリンクのリンク先L2のオーバーラップ領域は、リンク番号K=1のリンクのリンク先L2のオーバーラップ領域よりも、リンク元L1のオーバーラップ領域に波形が一致しているため、例えば、図2(b)では、リンク番号K=2の不一致度err[20][2]=1.38は、リンク番号K=1の不一致度err[20][1]=2.77よりも小さい値となっている。
損失loss[F][K]は、例えば、再生ポイントをリンク元L1からリンク先L2へ移動させることによって生じる信号エネルギーの損失に関する損失情報であり、例えば、フレーム番号Fのフレーム内にあるリンク元L1から、そのリンク元L1とリンク番号Kのリンクで連結されたリンク先L2へ移動することによって損失する波形の信号エネルギー値である。
ここで、再生ポイントの移動先として、再生データDの再生速度が標準速度よりも高い場合(高速再生の場合)には、リンク元L1よりも時間的に未来方向にあるリンク先L2が選択され、再生データDの再生速度が標準速度よりも低い場合(スロー再生の場合)には、リンク元L1よりも時間的に過去方向にあるリンク先L2が選択されることになる。そして、損失loss[F][K]は、リンク先L2がリンク元L1よりも時間的に未来方向にある場合と時間的に過去方向にある場合とで定義の仕方が異なる。
具体的には、例えば、リンク先L2がリンク元L1よりも時間的に未来方向にある場合、すなわち、リンク元L1のサンプル番号P1がリンク先L2のサンプル番号P2よりも小さい場合、損失loss[F][K]は、リンク元L1とリンク先L2との間の信号を省略することによって損失する信号エネルギーとして、以下の式(6)で定義され、例えば、リンク先L2がリンク元L1よりも時間的に過去方向にある場合、すなわち、リンク元L1のサンプル番号P1がリンク先L2のサンプル番号P2よりも大きい場合、損失loss[F][K]は、リンク元L1とリンク先L2との間の信号を繰り返すことによって損失する信号エネルギーとして、以下の式(7)で定義される。
Figure 0004390289
式(6)及び式(7)によれば信号の物理量から信号エネルギーの損失を決定できる。
さらに、損失loss[F][K]は、ユーザによって決定可能である。すなわち、ユーザは、例えば、再生ポイントがリンク元L1からリンク先L2に移動することによって聴き逃してしまう音声があることに重大な問題があれば損失loss[F][K]を増加させてより大きな値になるように変更したり、或いは逆に、語句等の重要性を主観的に判断した結果、不要な部分を省略するリンクであると判断した場合には、損失loss[F][K]を減少させてより小さな値になるように変更することができる。さらに、ユーザは、語句等の重要性を主観的に判断した結果、不要な部分を省略するリンクを張りたいと判断した場合には、その他のリンクの損失loss[F][K]との相対的関係を考慮して、その不要な部分を省略するリンクの損失loss[F][K]を設定することができる。このようにユーザによって損失loss[F][K]が決定されたリンクが主観的リンクになる。
なお、ユーザによる損失loss[F][K]の決定に際しては、式(6)及び式(7)で定義される客観的損失との相対的関係に注意する必要がある。
ここで、再生データD(音声データ(波形情報))とリンク情報の、記録媒体Mへの記録形態は任意である。
具体的には、例えば、図5(a)に示すように、再生データDとリンク情報とを別々にして、記録媒体Mに記録するようにしてもよい。この場合、再生データDの再生直前に、リンク情報のみを再生装置1のメモリ18に転送できるため、使い勝手がよい。
また、例えば、図5(b)に示すように、再生データDがフレーム毎に区切られている場合には、一のフレームに対応するリンク情報を当該一のフレームの前に挿入するようにして、記録媒体Mに記録するようにしてもよい。
また、例えば、図5(c)に示すように、再生データDがフレーム毎に区切られており、且つ、帯域(バンド)毎に分割されている場合には、一のフレーム及び一のバンドに対応するリンク情報を、当該一のフレーム及び当該一のバンドの前に挿入するようにして、記録媒体Mに記録するようにしてもよい。
なお、本実施の形態では、例えば、図5(a)に示すように、再生データDとリンク情報とを別々にして、記録媒体Mに記録することとする。
<リンク情報作成装置>
リンク情報作成装置3は、例えば、図6に示すように、読取部31と、デコーダ32と、リンク情報作成部33と、エンコーダ34と、再生データ出力制御部35と、操作部36と、制御部37と、などを備えて構成される。
また、リンク情報作成装置3は、例えば、再生データ出力制御部35を介して音声出力装置3a及び表示装置3bを接続している。
読取部31は、例えば、制御部37から入力される制御信号に従って、リンク情報作成装置3に挿入等された記録媒体Mに記録された再生データDを読み取って、デコーダ32に出力する。
デコーダ32は、例えば、制御部37から入力される制御信号に従って、読取部31から入力された再生データDにデコード等の所定の処理を施して、リンク情報作成部33及び再生データ出力制御部35に出力する。
リンク情報作成部33は、例えば、制御部37が、デコーダ32から入力された再生データDに基づいて、無音領域情報、周期音領域情報及びリンク情報を作成する際に使用される。
エンコーダ34は、例えば、制御部37から入力される制御信号に従って、リンク情報作成部33において作成されたリンク情報にエンコード等の所定の処理を施して、リンク情報作成装置3に挿入等された記録媒体Mに出力する。
再生データ出力制御部35は、例えば、制御部37が、デコーダ32から入力された再生データDを音声出力装置3aに出力する際や、デコーダ32から入力された再生データDから音声波形のエンベロープ(包絡線)データを作成して表示装置3bに出力する際に使用される。
音声出力装置3aは、例えば、スピーカ機器等であり、例えば、再生データ出力制御部35から入力された再生データD(音声データ)に基づく音声を出力する。
表示装置3bは、例えば、液晶表示機器等であり、例えば、再生データ出力制御部35から入力されたエンベロープデータに基づいて、再生データD(音声データ)に基づく音声波形のエンベロープを表示する。
操作部36は、例えば、リンク情報作成装置3の外面に設けられた操作ボタン(図示省略)や、リンク情報作成装置3用のリモートコントローラ(図示省略)及び当該リモートコントローラと通信可能なリモコン受信部(図示省略)などにより構成され、例えば、ユーザにより操作されて、当該操作に伴う各種信号を制御部37に出力する。
また、操作部36は、必要に応じてマウス等のポインティングデバイスやジョグダイヤルなどその他の操作装置を備えるものとしてもよい。
制御部37は、例えば、図6に示すように、CPU(Central Processing Unit)371と、RAM(Random Access Memory)372と、記憶部373と、などを備えて構成される。
CPU371は、例えば、記憶部373に記憶されたリンク情報作成装置3用の各種処理プログラムに従って各種の制御動作を行う。
RAM372は、例えば、CPU371によって実行される処理プログラムなどを展開するためのプログラム格納領域や、入力データや上記処理プログラムが実行される際に生じる処理結果などを格納するデータ格納領域などを備える。
記憶部373は、例えば、リンク情報作成装置3で実行可能なシステムプログラム、当該システムプログラムで実行可能な各種処理プログラム、これら各種処理プログラムを実行する際に使用されるデータ、CPU371によって演算処理された処理結果のデータなどを記憶する。なお、プログラムは、コンピュータが読み取り可能なプログラムコードの形で記憶部373に記憶されている。
具体的には、記憶部373は、例えば、無音領域検出プログラム373aと、周期音領域検出プログラム373bと、リンク情報作成プログラム373cと、リンク情報記録制御プログラム373dと、などを記憶している。
無音領域検出プログラム373aは、例えば、再生データD中の無音領域を検出する機能を、CPU371に実現させる。
具体的には、CPU371は、例えば、記録媒体Mに記録された再生データDを、読取部31に読み取らせて、デコーダ32を介して、リンク情報作成部33に出力させる。
次いで、CPU371は、例えば、リンク情報作成部33において、再生データDの全部もしくは一部の信号エネルギー分布から、無音であると判定するための判定閾値を求める。この判定閾値を求める処理は、背景雑音の小さな再生データDと背景雑音の大きな再生データDとでは無音であるか否かの判定閾値が異なるため、必要な処理である。
次いで、CPU371は、例えば、リンク情報作成部33において、再生データD中の信号エネルギーが当該求めた判定閾値以下である領域を無音領域であると判定することによって、再生データD中の無音領域を検出する。
次いで、CPU371は、例えば、リンク情報作成部33において、当該検出した無音領域毎に無音領域情報を作成して、当該検出した無音領域の総数Mmaxをカウントする。
ここで、m(m=0,1,…,Mmax−1)番目の無音領域の無音領域情報には、例えば、当該無音領域の開始点のサンプル番号MA[m]と、当該無音領域の終了点のサンプル番号MB[m]と、などが含まれている。
周期音領域検出プログラム373bは、例えば、再生データD中の周期音領域を検出する機能を、CPU371に実現させる。
具体的には、CPU371は、例えば、記録媒体Mに記録された再生データDを、読取部31に読み取らせて、デコーダ32を介して、リンク情報作成部33に出力させる。
次いで、CPU371は、例えば、リンク情報作成部33において、再生データD中の信号エネルギーが一定の周期で変化している一定幅以上の領域を周期音領域であると判定することによって、再生データD中の周期音領域を検出する。
次いで、CPU371は、例えば、リンク情報作成部33において、当該検出した周期音領域毎に周期音領域情報を作成して、当該検出した周期音領域の総数Nmaxをカウントする。
ここで、n(n=0,1,…,Nmax−1)番目の周期音領域の周期音領域情報には、例えば、当該周期音領域の開始点のサンプル番号NA[n]と、当該周期音領域の終了点のサンプル番号NB[n]と、などが含まれている。
リンク情報作成プログラム373bは、例えば、再生データDに基づいてリンク情報を作成する機能を、CPU371に実現させる。
具体的には、CPU371は、まず、リンク数Kmax[F](F=0,1,2,…,Fmax−1)を初期化することによって、リンク数Kmax[F]=0を設定する。
次に、CPU371は、例えば、恒等リンク情報を作成する処理(恒等リンク情報作成処理)を実行する。
まず、CPU371は、例えば、記録媒体Mに記録された再生データDを、読取部31に読み取らせて、デコーダ32を介して、リンク情報作成部33に出力させる。
次いで、CPU371は、例えば、リンク情報作成部33において、全てのフレーム(フレーム番号F=0〜Fmax−1)について、カテゴリctgry[F][0]=0、リンク先サンプル番号link[F][0]=リンク元L1のサンプル番号、不一致度err[F][0]=0、損失loss[F][0]=0、とした恒等リンク情報を作成し、そして、恒等リンク情報を作成する度に当該恒等リンクに対応するリンク数Kmax[F]をインクリメントする。
次に、CPU371は、例えば、単純リンク情報を作成する処理(単純リンク情報作成処理)を実行する。
単純リンク情報とは、例えば、リンク元L1の位置から所定の検索範囲内にある任意点のうちの、不一致度err[F][K]が最も小さい不一致度最小点をリンク先L2とした情報である。
ここで、例えば、平均再生速度が略同一であっても、リンク元L1からリンク先L2までのサンプル数(リンク長)によって1秒間にアクセスしなければならないフレームの数(アクセス率)が異なってくることがある。具体的には、例えば、リンク長が短い場合には、1秒間にアクセスしなければならないフレーム数が多く、リンク長が長い場合には、1秒間にアクセスしなければならないフレーム数が少ない。そして、同じ再生速度であれば、アクセス率は低い方が効率がよい。
図7(a)に、リンク元L1からリンク先L2までのサンプル数(リンク長)と、対応するリンク長となるリンク先L2を選択し続けたときの平均再生速度の逆数と、の関係を示し、図7(b)に、図7(a)における同じ平均再生速度を示すリンク長に関して、アクセス率の低い領域(図7(b)における斜線部)を示す。
そして、図8(a)に、図7(b)の斜線部をテーブル化したものを示す。単純リンクのリンク先L2を探す際、図8(a)のそれぞれの検索範囲内で、不一致度err[F][K]が最も小さくなる不一致度最小点をリンク先L2として探すとよい。その際、図8(a)の“種別7”は平均再生速度が標準速度に近いため、重要であり、且つ、使われる頻度が高い。したがって、“種別7”の検索範囲を2〜3つに分割すると、単純リンクの数が増えてリンク先L2の候補が増えるため、再生時に好ましい結果が得られる。そこで、図8(b)に、図8(a)の“種別7”の検索範囲を3つに分割したものを示す。
また、図8(b)には、“種別12”として、リンク元L1とリンク先L2との時間差が2秒程度の長距離リンクも加えてある。このような長距離リンクは、高速再生において、ユーザにより指定された指定再生ポイントとの時間的誤差が大きくなってしまって、短距離の単純リンクだけではその差を取り戻すことができず、且つ、無音領域が全く存在しないので長距離の移動ができないような再生データDに対しては大変有効である。
まず、CPU371は、例えば、記録媒体Mに記録された再生データDを、読取部31に読み取らせて、デコーダ32を介して、リンク情報作成部33に出力させる。
次いで、CPU371は、例えば、リンク情報作成部33において、全てのフレーム(フレーム番号F=0〜Fmax−1)内にあるリンク元L1について、図8(b)に示す各種別の検索範囲内から、それぞれ不一致度err[F][K]が最も小さくなる不一致度最小点を探し、そして、当該探した不一致度最小点毎に、カテゴリctgry[F][Kmax[F]]=1、リンク先サンプル番号link[F][Kmax[F]]=不一致度最小点のサンプル番号、不一致度err[F][Kmax[F]]=式(3)から求めた値、損失loss[F][Kmax[F]]=式(6)又は式(7)から求めた値、とした単純リンク情報を作成し、そして、単純リンク情報を作成する度に当該単純リンクに対応するリンク数Kmax[F]をインクリメントする。
ここで、検索範囲(例えば、図8(b))は、予めリンク情報作成装置3に記憶されていることとする。
次に、CPU371は、例えば、無音内リンク情報を作成する処理(無音内リンク情報作成処理)を実行する。
無音内リンク情報とは、例えば、再生データD中の無音領域内にリンク元L1が位置する場合、当該無音領域の開始点及び終了点をリンク先L2とした情報である。
まず、CPU371は、例えば、記録媒体Mに記録された再生データDを、読取部31に読み取らせて、デコーダ32を介して、リンク情報作成部33に出力させる。
次いで、CPU371は、例えば、m=0,1,…,(Mmax−1)の順に、無音領域検出プログラム373aを実行したCPU371により検出されたm番目の無音領域内にある全てのフレームについて、カテゴリctgry[F][Kmax[F]]=2、リンク先サンプル番号link[F][Kmax[F]]=m番目の無音領域の終了点のサンプル番号MB[m]、不一致度err[F][Kmax[F]]=式(3)から求めた値、損失loss[F][Kmax[F]]=式(6)又は式(7)から求めた値、とした無音内リンク情報を作成するとともに、カテゴリctgry[F][Kmax[F]]=2、リンク先サンプル番号link[F][Kmax[F]]=m番目の無音領域の開始点のサンプル番号MA[m]、不一致度err[F][Kmax[F]]=式(3)から求めた値、損失loss[F][Kmax[F]]=式(6)又は式(7)から求めた値、とした無音内リンク情報を作成し、そして、無音内リンク情報を作成する度に当該無音内リンク情報に対応するリンク数Kmax[F]をインクリメントする。
ここで、無音内リンクは無音領域内でのリンクであるため、式(6)又は式(7)から求められる損失loss[F][K]は“0”になる。
次に、CPU371は、例えば、無音間リンク情報を作成する処理(無音間リンク情報作成処理)を実行する。
無音間リンク情報とは、例えば、再生データD中の無音領域内にリンク元L1が位置する場合、当該無音領域とは異なる再生データD中の無音領域の終了点をリンク先L2とした情報である。
まず、CPU371は、例えば、記録媒体Mに記録された再生データDを、読取部31に読み取らせて、デコーダ32を介して、リンク情報作成部33に出力させる。
次いで、CPU371は、m=0,1,…,(Mmax−1)の順に、無音領域検出プログラム373aを実行したCPU371により検出されたm番目の無音領域内にある全てのフレームについて、カテゴリctgry[F][Kmax[F]]=3、リンク先サンプル番号link[F][Kmax[F]]=m番目の無音領域以外の無音領域の終了点のサンプル番号MB[m]、不一致度err[F][Kmax[F]]=式(3)から求めた値、損失loss[F][Kmax[F]]=式(6)又は式(7)から求めた値、とした無音間リンク情報を作成し、そして、無音間リンク情報を作成する度に当該無音間リンク情報に対応するリンク数Kmax[F]をインクリメントする。
次に、CPU371は、例えば、周期音リンク情報を作成する処理(周期音リンク情報作成処理)を実行する。
周期音リンク情報とは、例えば、再生データD中の周期音領域の開始点又は終了点にリンク元L1が位置する場合、それぞれ当該周期音領域の終了点及び開始点をリンク先L2とした情報である。
まず、CPU371は、例えば、記録媒体Mに記録された再生データDを、読取部31に読み取らせて、デコーダ32を介して、リンク情報作成部33に出力させる。
次いで、CPU371は、例えば、n=0,1,…,(Nmax−1)の順に、周期音領域検出プログラム373bを実行したCPU371により検出されたn番目の周期音領域内にあって当該周期音領域の開始点に最も近いフレームについて、カテゴリctgry[F][Kmax[F]]=4、リンク先サンプル番号link[F][Kmax[F]]=n番目の周期音領域の終了点のサンプル番号NB[m]、不一致度err[F][Kmax[F]]=式(3)から求めた値、損失loss[F][Kmax[F]]=式(6)又は式(7)から求めた値、とした周期音リンク情報を作成するとともに、周期音領域検出プログラム373bを実行したCPU371により検出されたn番目の周期音領域内にあって当該周期音領域の終了点に最も近いフレームについて、カテゴリctgry[F][Kmax[F]]=4、リンク先サンプル番号link[F][Kmax[F]]=n番目の周期音領域の開始点のサンプル番号NA[m]、不一致度err[F][Kmax[F]]=式(3)から求めた値、損失loss[F][Kmax[F]=式(6)又は式(7)から求めた値、とした周期音リンク情報を作成し、そして、周期音リンク情報を作成する度に当該周期音リンク情報に対応するリンク数Kmax[F]をインクリメントする。
さらに、CPU371は、例えば、ユーザによる操作部36の操作に従って、主観的リンク情報を作成する処理(主観的リンク情報作成処理)を実行する。
主観的リンク情報とは、例えば、ユーザによる操作部36の操作により指定された指定リンク先をリンク先L2とした情報である。
なお、主観的リンク情報は、予め作成された単純リンク情報、無音内リンク情報、無音間リンク情報、周期音リンク情報のうち、ユーザによる操作部36の操作により損失loss[F][K]が変更された情報であってもよい。
ここで、ユーザは、主観的リンク情報の作成を指示すると、表示装置3bに表示される音声波形のエンベロープを見ながら音声出力装置3aから出力される音声を聴くことができるとともに、操作部36のジョグダイヤル等を操作して再生データDの再生ポイントをコントロールすることができる。そして、ユーザは、例えば、単語の重要度や会話の重要度、話者の重要度などに応じて、不要な部分を省略するリンクが張られるように操作部36を操作して指定リンク元や指定リンク先を指定することができるとともに、そのリンクの損失loss[F][K]を入力することができる。
まず、CPU371は、例えば、記録媒体Mに記録された再生データDを、読取部31に読み取らせて、デコーダ32を介して、リンク情報作成部33及び再生データ出力制御部35に出力させる。
次いで、CPU371は、例えば、再生データ出力制御部35において、再生データDを音声出力装置3aに出力するとともに、再生データDに基づいて音声波形のエンベロープデータを作成して表示装置3bに出力する。これにより、音声出力装置3aから再生データD(音声データ)に基づく音声が出力され、表示装置3bから再生データD(音声データ)に基づく音声波形のエンベロープが表示されることになる。なお、表示装置3bには、例えば、音声出力装置3aから出力されている現時点での音声を含む過去から未来の音声に対応した音声波形のエンベロープが表示される。
次いで、CPU371は、例えば、ユーザにより指定リンク元と指定リンク先が指定されると、指定リンク元に最も近いフレーム内にあるリンク元L1から主観的リンクを張るよう決定するとともに、指定リンク先の位置を、その指定リンク先の位置から所定の範囲内にあり、且つ、主観的リンクを張るよう決定されたリンク元L1との波形の不一致度err[F][K]が小さくなる位置に変更し、そして、指定リンク元に最も近いフレームについて、カテゴリctgry[F][Kmax[F]]=5、リンク先サンプル番号link[F][Kmax[F]]=位置が変更された指定リンク先のサンプル番号、不一致度err[F][Kmax[F]]=式(3)から求めた値、損失loss[F][Kmax[F]]=ユーザにより入力された値、とした主観的リンク情報を作成し、そして、主観的リンク情報を作成する度に当該主観的リンク情報に対応するリンク数Kmax[F]をインクリメントする。
また、CPU371は、例えば、既に作成された情報の中に、ユーザにより指定された指定リンク元と指定リンク先とを連結するリンクに関する単純リンク情報、無音内リンク情報、無音間リンク情報及び周期音リンク情報がある場合には、その情報を構成するカテゴリctgry[F][Kmax[F]]を“5”に変更するとともに損失loss[F][K]を“ユーザにより入力された値”に変更することによって、その情報を主観的リンク情報に変更する。
リンク情報記録制御プログラム373dは、例えば、リンク情報作成プログラム373cを実行したCPU371によりリンク情報作成部33において作成されたリンク情報を、エンコーダ34を介して記録媒体Mに記録させる機能を、CPU371に実現させる。
(リンク情報作成処理)
リンク情報作成装置3によるリンク情報の作成に関する処理について、図9のフローチャートを参照して説明する。
例えば、ユーザによる操作部36の操作によって、自動でリンク情報を作成するよう指示されると、CPU371は、無音領域検出プログラム373aを実行して、無音領域検出処理を実行する(ステップS11)。
具体的には、CPU371は、例えば、リンク情報作成部33において、再生データD中の無音領域を検出して、無音領域の開始点のサンプル番号MA[m]と、無音領域の終了点のサンプル番号MB[m]と、などを含む無音領域情報を作成する。
次いで、CPU371は、周期音領域検出プログラム373bを実行して、周期音領域検出処理を実行する(ステップS12)。
具体的には、CPU371は、例えば、リンク情報作成部33において、再生データD中の周期音領域を検出して、周期音領域の開始点のサンプル番号NA[n]と、周期音領域の終了点のサンプル番号NB[n]と、などを含む周期音領域情報を作成する。
次いで、CPU371は、リンク情報作成プログラム373cを実行して、リンク数Kmax[F]=0を設定する(ステップS13)。
次いで、CPU371は、恒等リンク情報作成処理を実行する(ステップS14)。
具体的には、CPU371は、例えば、リンク情報作成部33において、恒等リンク情報を作成するとともに、当該恒等リンクに対応するリンク数Kmax[F]をインクリメントする。
次いで、CPU371は、単純リンク情報作成処理を実行する(ステップS15)。
具体的には、CPU371は、例えば、リンク情報作成部33において、単純リンク情報を作成するとともに、当該単純リンクに対応するリンク数Kmax[F]をインクリメントする。
次いで、CPU371は、無音内リンク情報作成処理を実行する(ステップS16)。
具体的には、CPU371は、例えば、リンク情報作成部33において、ステップS11にて得られた無音領域情報に基づいて、無音内リンク情報を作成するとともに、当該無音内リンクに対応するリンク数Kmax[F]をインクリメントする。
次いで、CPU371は、無音間リンク情報作成処理を実行する(ステップS17)。
具体的には、CPU371は、例えば、リンク情報作成部33において、ステップS11にて得られた無音領域情報に基づいて、無音間リンク情報を作成するとともに、当該無音間リンクに対応するリンク数Kmax[F]をインクリメントする。
次いで、CPU371は、周期音リンク情報作成処理を実行する(ステップS18)。
具体的には、CPU371は、例えば、リンク情報作成部33において、ステップS12にて得られた周期音領域情報に基づいて、周期音リンク情報を作成するとともに、当該無音間リンクに対応するリンク数Kmax[F]をインクリメントする。
次いで、CPU371は、ユーザによる操作部36の操作によって、手動でリンク情報を作成する旨が入力されたか否かを判断する(ステップS19)。
ステップS19で、ユーザによる操作部36の操作によって、手動でリンク情報を作成する旨が入力されていないと判断すると(ステップS19;No)、CPU371は、ステップS21の処理に移行する。
一方、ステップS19で、ユーザによる操作部36の操作によって、手動でリンク情報を作成する旨が入力されたと判断すると(ステップS19;Yes)、CPU371は、主観的リンク情報作成処理を実行する(ステップS20)。
具体的には、CPU371は、例えば、再生データ出力制御部35において、音声出力装置3aを介して再生データD(音声データ)に基づく音声を出力させるとともに、表示装置3bを介して再生データD(音声データ)に基づく音声波形のエンベロープを表示させ、そして、リンク情報作成部33において、主観的リンク情報を作成するとともに、必要があれば当該主観的リンクに対応するリンク数Kmax[F]をインクリメントする。
次いで、CPU371は、リンク情報記録制御プログラム373dを実行して、リンク情報作成部33において作成されたリンク情報を、エンコーダ34を介して記録媒体Mに記録させて(ステップS21)、本処理を終了する。
なお、ステップS21の後に、ユーザによる操作部36の操作によって、作成されたリンク情報の中から、不要なリンクに係る情報を取り除くようにしてもよい。
<リンク表示データ作成装置>
リンク表示データ作成装置5は、例えば、図10に示すように、読取部51と、デコーダ52と、リンク表示データ作成部53と、エンコーダ54と、操作部56と、制御部57と、などを備えて構成される。
読取部51は、例えば、制御部57から入力される制御信号に従って、リンク表示データ作成装置5に挿入等された記録媒体Mに記録された再生データD及びリンク情報を読み取って、デコーダ52に出力する。
デコーダ52は、例えば、制御部57から入力される制御信号に従って、読取部51から入力された再生データD及びリンク情報にデコード等の所定の処理を施して、リンク表示データ作成部53に出力する。
リンク表示データ作成部53は、例えば、制御部57が、デコーダ52から入力された再生データD及びリンク情報に基づいて、リンク表示データを作成する際に使用される。
エンコーダ54は、例えば、制御部57から入力される制御信号に従って、リンク表示データ作成部53において作成されたリンク表示データにエンコード等の所定の処理を施して、リンク表示データ作成装置5に挿入等された記録媒体Mに出力する。
操作部56は、例えば、リンク表示データ作成装置5の外面に設けられた操作ボタン(図示省略)や、リンク表示データ作成装置5用のリモートコントローラ(図示省略)及び当該リモートコントローラと通信可能なリモコン受信部(図示省略)などにより構成され、例えば、ユーザにより操作されて、当該操作に伴う各種信号を制御部57に出力する。
制御部57は、例えば、図10に示すように、CPU571と、RAM572と、記憶部573と、などを備えて構成される。
CPU571は、例えば、記憶部573に記憶されたリンク表示データ作成装置5用の各種処理プログラムに従って各種の制御動作を行う。
RAM572は、例えば、CPU571によって実行される処理プログラムなどを展開するためのプログラム格納領域や、入力データや上記処理プログラムが実行される際に生じる処理結果などを格納するデータ格納領域などを備える。
記憶部573は、例えば、リンク表示データ作成装置5で実行可能なシステムプログラム、当該システムプログラムで実行可能な各種処理プログラム、これら各種処理プログラムを実行する際に使用されるデータ、CPU571によって演算処理された処理結果のデータなどを記憶する。なお、プログラムは、コンピュータが読み取り可能なプログラムコードの形で記憶部573に記憶されている。
具体的には、記憶部573は、例えば、分析プログラム573aと、再生データ画像化プログラム573bと、音声画像配置図作成プログラム573cと、リンク表示データ作成プログラム573dと、リンク表示データ記録制御プログラム573eと、などを記憶している。
分析プログラム573aは、例えば、再生データD(音声データ)を所定の分析条件に従って分析する機能を、CPU571に実現させる。
具体的には、CPU571は、例えば、記録媒体Mに記録された再生データDを、読取部51に読み取らせて、デコーダ52を介して、リンク表示データ作成部53に出力させる。
次いで、CPU571は、例えば、リンク表示データ作成部53において、再生データDを所定の分析条件に従って分析する。
ここで、分析条件は、例えば、短時間フーリエ変換(FFT)、ケプストラム分析、ウイグナー分析による時間周波数平面表現、ARモデル当てはめによる極位置の推定などである。また、分析条件は、理論的な最適性などの裏付けがなくても、人間の直感に一致している経験的な条件であってもよい。
再生データ画像化プログラム573bは、例えば、分析プログラム573aを実行したCPU571による分析結果を、分析結果に対応して予め設定された画像データに変換する機能を、CPU571に実現させる。
具体的には、CPU571は、例えば、リンク表示データ作成部53において、分析プログラム573aを実行したCPU571による分析結果を、分析によって得られたパラメータ値に対応するRGB値及び画素数(画像の大きさ)に変換することにより、RGB値で表現された色を有する画素集団として画素小片化することによって、音声画像Bの画像データに変換する。
音声画像配置図作成プログラム573cは、例えば、リンク表示データ作成部53において、再生データ画像化プログラム573bを実行したCPU571により画像化された画像データに基づく音声画像Bを、所定の時間軸に対応付けて配置した音声画像配置図G1を作成する機能を、CPU571に実現させる。
リンク表示データ作成プログラム573dは、例えば、リンク情報に基づいて、音声画像配置図作成プログラム573cを実行したCPU571により作成された音声画像配置図G1の時間軸に対応付けて、リンク元L1とそのリンク元L1に対応するリンク先L2とを連結するリンクを示すリンク画像G2を音声画像配置図G1に合成することによって、リンク元L1と各リンク先L2との時間的な対応付けを表示するためのリンク表示データを作成する機能を、CPU571に実現させる。
具体的には、CPU571は、例えば、記録媒体Mに記録されたリンク情報を、読取部51に読み取らせて、デコーダ52を介して、リンク表示データ作成部53に出力させる。
次いで、CPU571は、例えば、リンク表示データ作成部53において、リンク情報に基づいて、リンク表示データを作成する。
ここで、CPU571は、例えば、リンク長(リンク元L1からリンク先L2までのサンプル数)が所定サンプル数以上(例えば、1万サンプル以上)のリンクを示すリンク画像G2のみを音声画像配置図G1に合成することとする。
リンク表示データ記録制御プログラム573eは、例えば、リンク表示データ作成プログラム573dを実行したCPU571によりリンク表示データ作成部53において作成されたリンク表示データを、エンコーダ54を介して記録媒体Mに記録させる機能を、CPU571に実現させる。
(リンク表示データ作成処理)
リンク表示データ作成装置5によるリンク表示データの作成に関する処理について、図11のフローチャートを参照して説明する。
例えば、ユーザによる操作部56の操作によって、リンク表示データを作成するよう指示されると、CPU571は、分析プログラム573aを実行して、再生データDを所定の分析条件に従って分析する(ステップS31)。
次いで、CPU571は、再生データ画像化プログラム573bを実行して、ステップS31において得られた分析結果を、分析結果に対応して予め設定された画像データに変換する(ステップS32)。
次いで、CPU571は、例えば、音声画像配置図作成プログラム573cを実行して、ステップS32において画像化された画像データに基づく音声画像Bを、所定の時間軸に対応付けて配置した音声画像配置図G1を作成する(ステップS33)。
次いで、CPU571は、リンク表示データ作成プログラム573dを実行して、リンク情報に基づいて、ステップS33において作成された音声画像配置図G1の時間軸に対応付けて、リンク元L1とそのリンク元L1に対応するリンク先L2とを連結するリンクを示すリンク画像G2を音声画像配置図G1に合成することによって、リンク元L1と各リンク先L2との時間的な対応付けを表示するためのリンク表示データを作成する(ステップS34)。
次いで、CPU571は、リンク表示データ記録制御プログラム573eを実行して、ステップS34において作成されたリンク表示データを、エンコーダ54を介して記録媒体Mに記録させて(ステップS35)、本処理を終了する。
<再生装置>
再生装置1は、例えば、図12に示すように、再生部Rと、リンク表示データ時間軸変更部15と、操作部16と、制御部17と、メモリ18と、などを備えて構成される。
また、再生装置1は、例えば、再生部Rの再生データ時間軸変更部13を介して音声出力装置3aを接続するとともに、リンク表示データ時間軸変更部15を介して表示装置3bを接続している。
再生部Rは、例えば、図12に示すように、読取部11と、デコーダ12と、再生データ時間軸変更部13と、などを備えて構成され、例えば、再生手段として、音声データからなる再生データDを再生する。
読取部11は、例えば、制御部17から入力される制御信号に従って、再生装置1に挿入等された記録媒体Mに記録された再生データD、リンク情報及びリンク表示データを読み取って、デコーダ12に出力する。
デコーダ12は、例えば、制御部17から入力される制御信号に従って、読取部11から入力された再生データD及びリンク情報にデコード等の所定の処理を施して、再生データ時間軸変更部12に出力するとともに、読取部11から入力されたリンク表示データにデコード等の所定の処理を施して、リンク表示データ時間軸変更部15に出力する。
再生データ時間軸変更部13は、例えば、制御部17が、デコーダ12から入力されたリンク情報に基づいてピッチを変化させることなく再生データDの時間軸を変更して、音声出力装置3aに出力する際に使用される。
音声出力装置1aは、例えば、スピーカ機器等であり、例えば、再生データ時間軸変更部13から入力された再生データD(音声データ)に基づく音声を出力する。
リンク表示データ時間軸変更部15は、例えば、制御部17が、再生データ時間軸変更部13における再生データDの時間軸の変更に応じてデコーダ12から入力されたリンク表示データの時間軸を変更して、表示装置1bに出力する際に使用される。
表示装置1bは、例えば、液晶表示機器等であり、例えば、リンク表示データ時間軸変更部15から入力されたリンク表示データに基づいて、リンク画像G2が合成された音声画像配置図G1を表示する。
操作部16は、例えば、再生装置1の外面に設けられた操作ボタン(図示省略)や、再生装置1用のリモートコントローラ(図示省略)及び当該リモートコントローラと通信可能なリモコン受信部(図示省略)などにより構成され、例えば、ユーザにより操作されて、当該操作に伴う各種信号を制御部17に出力する。
具体的には、操作部16は、例えば、指定手段として、ユーザが、再生データDの再生速度を指定する際に操作される。
メモリ18は、例えば、データの読み書きが可能な半導体メモリなどにより構成され、制御部17から入力される制御信号に従って、所与のデータを記憶する。
具体的には、メモリ18は、例えば、記憶手段として、リンク先L2毎に、選択プログラム173bを実行したCPU171により選択された回数を記憶する。
より具体的には、制御部17は、例えば、フレーム番号Fのフレーム内にあるリンク元L1について選択プログラム173bを実行したCPU171により一のリンク先L2が選択されると、当該フレーム番号Fと、当該リンク元L1と当該選択された一のリンク先L2とを連結するリンクのリンク番号Kと、の組{F,K}をメモリ18に記憶させる。
ここで、メモリ18には、例えば、最新の{F,K}が、所定数(例えば、100個)記憶されるようになっている。
なお、制御部17は、例えば、選択プログラム173bを実行したCPU171により選択された一のリンク先L2が、リンク元L1と恒等リンクで連結されたリンク先L2である場合には、メモリ18に{F,K}を記憶しないようになっている。
リンクを利用して再生ポイントを移動させるとき、特にスロー再生の場合は、同じリンクを繰り返し利用してしまうことが起こりがちであり、ユーザは、その繰り返しの周期を強く感じてしまって不快感をおぼえることがある。そこで、これを防止するために、メモリ18に{F,K}を記憶するようになっている。しかしながら、恒等リンクの場合は、再生ポイントの実質的な移動を伴わないため、繰り返し利用してもユーザは不快感をおぼえることがなく、メモリ18に{F,K}を記録する実益がない。そのため、本実施の形態では、恒等リンクの場合には、メモリ18に{F,K}を記録しないようになっている。
また、メモリ18は、例えば、再生部Rによる再生データDの再生直前に、記録媒体Mに記録されたリンク情報を記憶する。
より具体的には、制御部17は、例えば、ユーザによる操作部16の操作により再生データDを再生するよう指示されると、記録媒体Mに記録されたリンク情報を、読取部11に読み取らせて、デコーダ12を介して、メモリ18に出力させ、メモリ18にリンク情報を記憶させる。
制御部17は、例えば、図12に示すように、CPU171と、RAM172と、記憶部173と、などを備えて構成される。
CPU171は、例えば、記憶部173に記憶された再生装置1用の各種処理プログラムに従って各種の制御動作を行う。
RAM172は、例えば、CPU171によって実行される処理プログラムなどを展開するためのプログラム格納領域や、入力データや上記処理プログラムが実行される際に生じる処理結果などを格納するデータ格納領域などを備える。
記憶部173は、例えば、再生装置1で実行可能なシステムプログラム、当該システムプログラムで実行可能な各種処理プログラム、これら各種処理プログラムを実行する際に使用されるデータ、CPU171によって演算処理された処理結果のデータなどを記憶する。なお、プログラムは、コンピュータが読み取り可能なプログラムコードの形で記憶部173に記憶されている。
具体的には、記憶部173は、例えば、図12に示すように、指定再生ポイント検出プログラム173aと、選択プログラム173bと、再生制御プログラム173cと、表示制御プログラム173dと、などを記憶している。
指定再生ポイント検出プログラム173aは、例えば、再生データDにおけるユーザによる操作部16の操作により指定された再生速度に応じた指定再生ポイントを検出する機能を、CPU171に実現させる。
具体的には、CPU171は、例えば、再生部Rによる再生データDの再生ポイントがリンク元L1に対応する位置に対して所定のポイントに達すると、再生データ時間軸変更部13において、再生データDの再生開始から現時点までのユーザにより指定された再生速度に基づいて、再生データDの中から、ユーザにより指定された現時点での再生速度に応じた次の時点の再生ポイント(指定再生ポイント)のサンプル番号を検出する。
ここで、所定のポイントは、リンク元L1に対応する位置であってもよいし、リンク元L1に対応する位置から所定のサンプル数だけ過去方向に離れた位置であってもよい。本実施の形態では、所定のポイントを、リンク元L1に対応する位置とする。
すなわち、CPU171は、再生部Rによる再生データDの再生ポイントがリンク元L1に対応する位置に達すると、指定再生ポイントのサンプル番号を検出する。
より具体的には、例えば、図13に示すように、横軸を再生データDの再生開始からの再生時間として、縦軸をユーザにより指定された再生速度に応じた再生ポイントのサンプル番号とすると、再生データDの再生開始から現時点までのユーザにより指定された再生速度は、例えば、図13の太線のように示される。また、ユーザにより指定された現時点での再生速度は、例えば、現時点にて「0.5倍速」から「2倍速」に切り替わった場合には、例えば、図13の破線のように示される。
そして、CPU171は、例えば、再生データDの再生開始から現時点までのユーザにより指定された再生速度(例えば、図13の太線)に基づいて、再生データDの中から、ユーザにより指定された現時点での再生速度(例えば、図13の破線)に応じた指定再生ポイントのサンプル番号を検出する。
無論、図13において、現時点での再生速度は、例えば、現時点にて「0.5倍速」から「2倍速」に切り替わる限りではなく、「0.5倍速」のまま一定であってもよいし、「2倍速」以外の倍速に切り替わってもよい。例えば、図13において、現時点での再生速度が「0.5倍速」のまま一定であれば、CPU171は、再生データDの再生開始から現時点までのユーザにより指定された再生速度(例えば、図13の太線)に基づいて、再生データDの中から、ユーザにより指定された現時点での再生速度(例えば、図13の太線の延長線)に応じた指定再生ポイントのサンプル番号を検出することになる。
選択プログラム173bは、例えば、再生データDに対して予め設定されたリンク元L1に対応する複数のリンク先L2に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元L1と各リンク先L2との間の評価値Eを算出し、当該複数のリンク先L2の中から評価値Eにおける評価が最も高いリンク先L2を選択する機能を、CPU171に実現させる。
具体的には、CPU171は、例えば、まず、指定再生ポイント検出プログラム173aを実行したCPU171により指定再生ポイントが検出されると、再生データ時間軸変更部13において、当該検出された指定再生ポイントと、リンク情報に含まれるリンク先位置情報(リンク先サンプル番号link[F][K])に基づくリンク先ポイントと、の時間的誤差に関する誤差情報Eを取得する。
次いで、CPU171は、例えば、再生データ時間軸変更部13において、当該取得した誤差情報Eと、リンク情報に含まれる不一致度情報E(E=不一致度err[F][K])と、リンク情報に含まれる損失情報E(E=損失loss[F][K])と、に基づいて評価値Eを算出する。
評価値Eは、例えば、以下の式(8)に示すように、誤差情報Eと誤差情報Eに設定可能な誤差情報用重み付けCとの積と、不一致度情報Eと不一致度情報Eに設定可能な不一致度情報用重み付けCとの積と、損失情報Eと損失情報Eに設定可能な損失情報用重み付けCとの積と、の和で算出される。
Figure 0004390289
ここで、誤差情報用重み付けCと、不一致度情報用重み付けCと、損失情報用重み付けCとは、例えば、以下の式(9)のように設定可能である。
Figure 0004390289
すなわち、リンク元L1よりも時間的に未来方向にあるリンク先L2(正方向リンクのリンク先L2)に関するリンク情報から取得される誤差情報Eと、リンク元L1よりも時間的に過去方向にあるリンク先L2(逆方向リンクのリンク先L2)に関するリンク情報から取得される誤差情報Eと、には別個の誤差情報用重み付けCが設定可能である。
また、リンク元L1よりも時間的に未来方向にあるリンク先L2(正方向リンクのリンク先L2)に関するリンク情報に含まれる不一致度情報Eと、リンク元L1よりも時間的に過去方向にあるリンク先L2(逆方向リンクのリンク先L2)に関するリンク情報に含まれる不一致度情報Eと、には別個の不一致度情報用重み付けCが設定可能である。
また、リンク元L1よりも時間的に未来方向にあるリンク先L2(正方向リンクのリンク先L2)に関するリンク情報に含まれる損失情報Eと、リンク元L1よりも時間的に過去方向にあるリンク先L2(逆方向リンクのリンク先L2)に関するリンク情報に含まれる損失情報Eと、には別個の損失情報用重み付けCが設定可能である。
なお、例えば、式(9)に示すように、高速再生の際に選択されるリンク先L2、すなわち、リンク元L1よりも時間的に未来方向にあるリンク先L2については、不一致度情報用重み付けCよりも、損失情報用重み付けCを大きくして、スロー再生の際に選択されるリンク先L2、すなわち、リンク元L1よりも時間的に過去方向にあるリンク先L2については、不一致度情報用重み付けCよりも、損失情報用重み付けCを小さくすることで、ユーザにとって聴き易い音声が得られるようになる。
誤差情報用重み付けCと、不一致度情報用重み付けCと、損失情報用重み付けCとは、例えば、再生装置1に予め設定されていてもよいし、ユーザによる操作部16の操作によって設定できるようにしてもよい。さらに、誤差情報用重み付けCと、不一致度情報用重み付けCと、損失情報用重み付けCとは、例えば、再生装置1に予め設定されていてそれをユーザによる操作部16の操作によって変更できるようにしてもよい。
なお、誤差情報用重み付けCと、不一致度情報用重み付けCと、損失情報用重み付けCとは、リンク元L1よりも時間的に未来方向にあるリンク先L2と、リンク元L1よりも時間的に過去方向にあるリンク先L2と、で変化させる限りではなく、例えば、リンクの種類によって変化させてもよい。
無論、誤差情報用重み付けCの値、不一致度情報用重み付けCの値及び損失情報用重み付けCの値は、式(9)に示す限りでなく任意である。
次いで、CPU171は、例えば、再生データ時間軸変更部13において、複数のリンク先L2のうちの、メモリ18に記憶された回数が所定の閾値を下回るリンク先L2の中から、評価値Eにおける評価が最も高いリンク先L2、すなわち、評価値Eが最も小さいリンク先L2を選択する。
具体的には、CPU171は、例えば、フレーム番号Fのフレーム内にあるリンク元L1について選択プログラム173bを実行したCPU171により一のリンク先L2が選択されると、メモリ18に記憶された、当該フレーム番号Fと、当該リンク元L1と当該選択された一のリンク先L2とを連結するリンクのリンク番号Kと、の組{F,K}の個数が、所定の閾値を下回るか否かを判断して、下回ると判断したリンク先L2の中から、評価値Eが最も小さいリンク先L2を選択する。
なお、所定の閾値は、例えば、リンクの種類毎に設定されていることとする。
CPU171は、かかる選択プログラム173bを実行することによって、選択手段として機能する。
再生制御プログラム173cは、例えば、記録媒体Mに記録された再生データDを再生部Rに再生させて、再生データDに基づく音声を音声出力装置1aから出力させる機能を、CPU171に実現させる。
さらに、再生制御プログラム173cは、例えば、再生部Rによる再生データDの再生ポイントがリンク元L1に対応する位置に対して所定のポイントに達すると、リンク元L1を選択プログラム173bを実行したCPU171により選択されたリンク先L2にリンクさせることによって当該再生ポイントをリンク先L2に対応する位置に移動させ、再生部Rに再生データDを再生させて、再生データDに基づく音声を音声出力装置1aから出力させる機能を、CPU171に実現させる。
ここで、所定のポイントは、リンク元L1に対応する位置であってもよいし、リンク元L1に対応する位置から所定のサンプル数だけ過去方向に離れた位置であってもよい。本実施の形態では、所定のポイントを、リンク元L1に対応する位置とする。
すなわち、CPU171は、再生部Rによる再生データDの再生ポイントがリンク元L1に対応する位置に達すると、メモリ18に転送されたリンク情報に基づいてピッチを変化させることなく再生データDの時間軸を変更するよう、再生部Rに再生データDを再生させて、再生データDに基づく音声を音声出力装置1aから出力させる。
具体的には、CPU171は、例えば、再生ポイントがリンク元L1の位置に達して、選択プログラム173bを実行したCPU171によりリンク先L2が選択されると、再生データ時間軸変更部13において、再生ポイントが当該選択されたリンク先L2の位置に移動するよう、再生データDの時間軸を変更する。
より具体的には、CPU171は、例えば、前述の式(1)を用いて、リンク元L1のオーバーラップ領域と、選択されたリンク先L2のオーバーラップ領域と、をオーバーラップさせることによって、再生データDの時間軸を変更する。
CPU171は、かかる再生制御プログラム173cを実行することによって、再生制御手段として機能する。
表示制御プログラム173dは、例えば、記録媒体Mに記録されたリンク表示データに基づくリンク画像G2が合成された音声画像配置図G1を表示装置1bに表示させる機能を、CPU171に実現させる。
具体的には、CPU171は、例えば、記録媒体Mに記録されたリンク表示データを、読取部11に読み取らせて、デコーダ12を介して、リンク表示データ時間軸変更部15に出力させる。
次いで、CPU571は、例えば、リンク表示データ時間軸変更部15において、再生データ時間軸変更部13における再生データDの時間軸の変更に応じて、リンク表示データの時間軸を変更して、表示装置1bに出力する。これにより、表示装置1bからは、音声出力装置1bから出力されている音声に対応した、リンク画像G2が合成された音声画像配置図G1が表示されることになる。なお、表示装置1bには、例えば、音背出力装置1aから出力されている現時点での音声を含む過去から未来の音声に対応した、リンク画像G2が合成された音声画像配置図G1が表示される。
ここで、表示装置1bに表示された、リンク画像G2が合成された音声画像配置図G1の一例を図14に示す。
図14に示すリンク画像G2が合成された音声画像配置図G1では、例えば、横軸は時間経過を示す現時点を起点とした相対的な時間軸となっており、当該時間軸に沿って配置された各音声画像Bの大きさによって音声の強度が表現され、各音声画像Bの形によって音声の音色(例えば、前述のFTT解析によって得られる倍音成分の構成比)が表現され、各音声画像Bの色によって音声の基本周波数(例えば、前述のケプストラム分析によって得られる基本周波数)が表現され、現時点を示す指標Sが表現されている。
さらに、図14に示すリンク画像G2が合成された音声画像配置図G1では、例えば、リンク元L1とそのリンク元L1に対応するリンク先L2とを連結するリンクを示すリンク画像G2が、例えば、リンク元L1を起点とした矢印によって表現されている。
(再生処理)
次に、再生装置1による再生データDの再生に関する処理について、図15及び図16のフローチャートを参照して説明する。
例えば、ユーザによる操作部16の操作によって、記録媒体Mに記録された再生データDを再生するよう指示されると、CPU171は、メモリ18に記憶された{F,K}をクリアする(例えば、ステップS51)。
次いで、CPU171は、記録媒体Mに記憶されたリンク情報を、読取部11に読み取らせてデコーダ12を介してメモリ18に転送して、メモリ18に記憶させる(ステップS52)。
次いで、CPU171は、再生制御プログラム173cを実行して、記録媒体Mに記録された再生データDの再生を開始するとともに、表示制御プログラム173dを実行して、リンク表示データに基づくリンク画像G2(リンク画像G2が合成された音声画像配置図G1)の表示を開始させる(ステップS53)。
次いで、CPU171は、メモリ18に記憶されたリンク情報に基づいて、再生部Rによる再生データDの再生ポイントがリンク元L1に対応する位置に達したか否かを判断する(ステップS54)。
ステップS54で、再生部Rによる再生データDの再生ポイントがリンク元L1に対応する位置に達していないと判断すると(ステップS54;No)、CPU171は、再生部Rによる再生データDの再生ポイントが、再生データDの末尾を越えるか否かを判断する(ステップS55)。
ステップS55で、再生部Rによる再生データDの再生ポイントが、再生データDの末尾を越えると判断すると(ステップS55;Yes)、CPU171は、本処理を終了する。
一方、ステップS55で、再生部Rによる再生データDの再生ポイントが、再生データDの末尾を越えないと判断すると(ステップS55;No)、CPU171は、ステップS54以降の処理を繰り返して行う。
また、ステップS54で、再生部Rによる再生データDの再生ポイントがリンク元L1に対応する位置に達したと判断すると(ステップS54;Yes)、CPU171は、指定再生ポイント検出プログラム173aを実行して、再生データ時間軸変更部13において、再生データDにおけるユーザによる操作部16の操作により指定された現時点での再生速度に応じた指定再生ポイントのサンプル番号を検出する(ステップS56)。
次いで、CPU171は、ステップS56で検出された指定再生ポイントが、再生データDの末尾を越えるか否かを判断する(ステップS57)。
ステップS57で、ステップS56で検出された指定再生ポイントが、再生データDの末尾を越えると判断すると(ステップS57;Yes)、CPU171は、本処理を終了する。
一方、ステップS57で、ステップS56で検出された指定再生ポイントが、再生データDの末尾を越えないと判断すると(ステップS57;No)、CPU171は、ステップS58〜S64の処理を行って、リンク先L2を選択する。
具体的には、CPU171は、RAM172の「フレーム番号F」記憶領域に再生部Rによる再生データDの“再生ポイント(リンク元L1)が位置するフレームのフレーム番号”を設定し、RAM172の「リンク番号K」記憶領域に“0(ゼロ)”を設定し、RAM172の「最良のリンクのリンク番号Kopt」記憶領域に“0(ゼロ)”を設定し、RAM172の「最良の評価値Eopt」記憶領域に“∞(無限大)”を設定する(ステップS58)。
次いで、CPU171は、選択プログラム173bを実行して、再生データ時間軸変更部13において、リンク先サンプル番号link[F][K]のリンク先L2について、ステップS56において検出された指定再生ポイントと、ステップS52においてメモリ18に転送されたリンク情報に含まれるリンク先サンプル番号link[F][K]に基づくリンク先ポイントと、の時間的誤差に関する誤差情報Eを取得して、当該取得した誤差情報Eと、ステップS52においてメモリ18に転送されたリンク情報に含まれる不一致度情報E(E=不一致度err[F][K])と、ステップS52においてメモリ18に転送されたリンク情報に含まれる損失情報E(E=損失loss[F][K])と、に基づいて評価値Eを算出する(ステップS59)。
次いで、CPU171は、ステップS59で算出された評価値Eが、RAM172の「最良の評価値Eopt」に記憶された値(最良の評価値Eopt)よりも小さいか否かを判断する(ステップS60)。
ステップS60で、ステップS59で算出された評価値Eが、RAM172の「最良の評価値Eopt」に記憶された値(最良の評価値Eopt)よりも小さくないと判断すると(ステップS60;No)、CPU171は、ステップS64の処理に移行する。
一方、ステップS60で、ステップS59で算出された評価値Eが、RAM172の「最良の評価値Eopt」に記憶された値(最良の評価値Eopt)よりも小さいと判断すると(ステップS60;Yes)、CPU171は、メモリ18に記憶された{F,K}の個数が、所定の閾値を下回るか否かを判断する(ステップS61)。
ステップS61で、メモリ18に記憶された{F,K}の個数が、所定の閾値を下回らないと判断すると(ステップS61;No)、CPU171は、ステップS64の処理に移行する。
一方、ステップS61で、メモリ18に記憶された{F,K}の個数が、所定の閾値を下回ると判断すると(ステップS61;Yes)、CPU171は、RAM172の「最良の評価値Eopt」記憶領域にステップS59で算出された評価値Eを設定して、RAM172の「最良のリンクのリンク番号Kopt」記憶領域にRAM172の「リンク番号K」記憶領域に設定されている値(リンク番号K)を設定する(ステップS62)。
次いで、CPU171は、RAM17の「リンク番号K」記憶領域に“K+1”を設定して(ステップS63)、RAM172の「リンク番号K」記憶領域に記憶された値(リンク番号K)が、ステップS52においてメモリ18に転送されたリンク情報に含まれるリンク数Kmax[F]を超えるか否かを判断する(ステップS64)。
ステップS64で、RAM172の「リンク番号K」記憶領域に記憶された値(リンク番号K)が、リンク情報に含まれるリンク数Kmax[F]を超えないと判断すると(ステップS64;No)、CPU171は、ステップS59以降の処理を繰り返して行う。
一方、ステップS64で、RAM172の「リンク番号K」記憶領域に記憶された値(リンク番号K)が、リンク情報に含まれるリンク数Kmax[F]を超えると判断すると(ステップS64;Yes)、CPU171は、再生制御プログラム173cを実行して、再生部Rによる再生データDの再生ポイントをリンク先サンプル番号link[F][Kopt]のリンク先L2に移動させる(ステップS65)。
具体的には、CPU171は、再生部Rによる再生データDの再生ポイント(リンク元L1)のオーバーラップ領域と、リンク先サンプル番号link[F][Kopt]のリンク先L2のオーバーラップ領域と、をオーバーラップさせる。
次いで、CPU171は、ステップS52においてメモリ18に転送されたリンク情報に含まれるカテゴリctgry[F][Kopt]が、カテゴリctgry[F][Kopt]=0(恒等リンク)であるか否かを判断する(ステップS66)。
ステップS66で、カテゴリctgry[F][Kopt]=0(恒等リンク)であると判断すると(ステップS66;Yes)、CPU171は、ステップS54以降の処理を繰り返して行う。
一方、ステップS66で、カテゴリctgry[F][Kopt]=0(恒等リンク)でないと判断すると(ステップS66;No)、CPU171は、メモリ18に{F,Kopt}を記憶させて(ステップS67)、ステップS54以降の処理を繰り返して行う。
以上説明した第1の実施の形態における再生装置1によれば、再生部Rによって、音声データからなる再生データDを再生することができ、選択プログラム173bを実行したCPU171によって、再生データDに対して予め設定されたリンク元L1に対応する複数のリンク先L2に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元L1と各リンク先L1との間の評価値Eを算出し、複数のリンク先L1の中から評価値Eにおける評価が最も高いリンク先L2を選択することができ、再生制御プログラム173cを実行したCPU171によって、再生部Rによる再生データDの再生ポイントがリンク元L1に対応する位置に達すると、リンク元L1を選択プログラム173bを実行したCPU171により選択されたリンク先L1にリンクさせることによって当該再生ポイントをリンク先L2に対応する位置に移動させ、再生部Rに再生データDを再生させることができる。
すなわち、予め設定されたリンク情報に基づいて再生データD(音声データ)を再生することができるため、再生時の計算負荷を抑えつつ、ピッチを変化させることなく再生データDの時間軸を変更して再生ポイントを移動することができ、さらに、リンク情報に基づいて複数のリンク先L2の中から最適なリンク先L2を選択することができるため、ユーザにとって視聴し易い状態で再生データDの可変速再生を行うことができる。
また、操作部16によって、ユーザは再生データDの再生速度を指定することができ、リンク情報は、再生データDにおけるリンク先L2の位置に関するリンク先位置情報(リンク先サンプル番号link[F][K])と、リンク元L1とリンク先L2との波形の不一致度に関する不一致度情報E(E=不一致度err[F][K])と、再生ポイントをリンク元L1からリンク先L2へ移動させることによって生じる信号エネルギーの損失に関する損失情報E(E=損失loss[F][K])と、を含み、選択プログラム173bを実行したCPU171は、再生データDにおけるユーザによる操作部16の操作により指定された再生速度に応じた指定再生ポイントと、リンク情報に含まれるリンク先位置情報(リンク先サンプル番号link[F][K])に基づくリンク先ポイントと、の時間的誤差に関する誤差情報Eを取得し、当該取得した誤差情報Eと、リンク情報に含まれる不一致度情報Eと、リンク情報に含まれる損失情報Eと、に基づいて評価値Eを算出することができる。
したがって、誤差情報E(リンク先L2と指定再生ポイントとの時間的誤差)と、不一致度情報E(リンク元L1のオーバーラップ領域とリンク先L2のオーバーラップ領域との波形の不一致度)と、損失情報E(再生ポイントの移動によって生じる信号エネルギーの損失)と、を加味して、最適なリンク先L2を選択して再生データDを再生するため、より一層ユーザにとって視聴し易い状態で再生データDを再生できる。
また、評価値Eは、誤差情報Eと誤差情報Eに設定可能な誤差情報用重み付けCとの積と、不一致度情報Eと不一致度情報Eに設定可能な不一致度情報用重み付けCとの積と、損失情報Eと損失情報Eに設定可能な損失情報用重み付けCとの積と、の和であり、評価値Eにおける評価が最も高いリンク先L2は、評価値Eが最も小さいリンク先L2である。
したがって、誤差情報E、不一致度情報E、損失情報Eにはそれぞれ重み付けが設定可能であるため、ユーザの好みに応じた重み付けを設定することによって、ユーザの好みに応じたリンク先L2を決定することができる。
また、リンク元L1よりも時間的に未来方向にあるリンク先L1に関するリンク情報から取得される誤差情報Eと、リンク元L1よりも時間的に過去方向にあるリンク先L1に関するリンク情報から取得される誤差情報Eと、には別個の誤差情報用重み付けCが設定可能であり、リンク元L1よりも時間的に未来方向にあるリンク先L2に関するリンク情報に含まれる不一致度情報Eと、リンク元L1よりも時間的に過去方向にあるリンク先L2に関するリンク情報に含まれる不一致度情報Eと、には別個の不一致度情報用重み付けCが設定可能であり、リンク元L1よりも時間的に未来方向にあるリンク先L2に関するリンク情報に含まれる損失情報Eと、リンク元L1よりも時間的に過去方向にあるリンク先L2に関するリンク情報に含まれる損失情報Eと、には別個の損失情報用重み付けCが設定可能である。
したがって、リンク元L1よりも時間的に未来方向にあるリンク先L2を選択する場合(すなわち、再生データDを高速再生する場合)と、リンク元L1よりも時間的に過去方向にあるリンク先L2を選択する場合(すなわち、再生データDをスロー再生する場合)と、で別個の重み付けが設定可能であるため、より一層ユーザの好みに応じたリンク先L2を決定することができる。
また、メモリ18によって、リンク先L2毎に、選択プログラム173bを実行したCPU171により選択された回数を記憶することができ、選択プログラム173bを実行したCPU171は、複数のリンク先L2のうちの、メモリ18に記憶された回数(メモリ18に記憶された{F,K}の個数)が所定の閾値を下回るリンク先L2の中から、評価値Eにおける評価が最も高いリンク先L2を選択することができる。
したがって、同じリンク先L2を繰り返して選択することを防止できるため、ユーザは不快感をおぼえることなく視聴することができる。
また、再生データDは、再生データDに対して予め設定されたリンク情報とともに記録媒体Mに記録されている。
したがって、記録媒体Mに記録されたリンク情報に基づいて再生データDを再生することができる。
また、表示制御プログラム173dを実行したCPU171によって、リンク情報に基づいて作成されたリンク元L1と各リンク先L2との時間的な対応付けを表示するためのリンク表示データに基づくリンク画像G2を、表示装置1bに表示させることができる。
すなわち、リンクを可視化してユーザに呈することができるため、ユーザは予め再生データのどの位置にリンクが張られているかが分かることとなって、使い勝手が良い。
具体的には、例えば、主観的リンクを呈することによって、重要でない時間区間が再生データDの中にどのように分布しているかをユーザに一望させることができ、ユーザ操作の支援になる。
また、リンク元L1のリンク情報は、そのリンク元L1の位置から所定の検索範囲内にある任意点のうちの、不一致度err[F][K]が最も小さい不一致度最小点をリンク先L2とした単純リンク情報を含む。
すなわち、単純リンク情報に基づくリンクは、リンク元L1のオーバーラップ領域の波形とリンク先L2のオーバーラップ領域の波形との不一致度が小さいリンクであるため、当該リンクを利用すると、再生ポイントを移動させても、再生データDの波形の連続性を好適に維持することができることとなって、再生ポイントを移動させることによって生じる不快な音声の出力を抑えることができる。
また、再生データD中の無音領域内にリンク元L1が位置する場合、そのリンク元L1のリンク情報は、当該無音領域の開始点MA[m]及び終了点MB[m]をリンク先L2とした無音内リンク情報を含む。
すなわち、無音内リンク情報に基づくリンクは、無音領域内で移動するリンクであるため、当該リンクを利用すると、例えば、高速再生時に無音領域を省略したり、或いは、スロー再生時に無音領域で時間つぶしをすることができることとなって、有効である。
また、再生データD中の無音領域内のリンク元L1が位置する場合、そのリンク元L1のリンク情報は、当該無音領域とは異なる再生データD中の無音領域の終了点MB[m]をリンク先L2とした無音間リンク情報を含む。
すなわち、無音間リンク情報に基づくリンクは、異なる無音領域間を移動するためのリンクであるため、当該リンクを利用すると、例えば、高速再生時に1単語を省略すること等ができることとなって、有効である。
また、再生データD中の周期音領域の開始点NB[n]又は終了点NB[n]にリンク元L1が位置する場合、そのリンク元L1のリンク情報は、それぞれ当該周期音領域の終了点NB[n]及び開始点NB[n]をリンク先L2とした周期音リンク情報を含む。
すなわち、周期音リンク情報に基づくリンクは、周期音領域内でのリンクであるため、当該リンクを利用すると、例えば、高速再生時に周期音領域を省略したり、或いは、スロー再生時に周期音領域で時間つぶしをすることができることとなって、有効である。
また、リンク元L1のリンク情報は、ユーザにより指定された指定リンク先をリンク先L2とした主観的リンク情報を含む。
すなわち、主観的リンク情報に基づくリンクは、ユーザが主観的に判断して設けるリンクであるため、当該リンクを利用すると、例えば、ユーザが重要であると判断した領域を省略することなく再生したり、或いは、ユーザが不要であると判断した領域は省略することができることとなって、有効である。
[第2の実施の形態]
次に、第2の実施の形態における再生装置1Aについて説明する。
なお、第2の実施の形態の再生装置1Aは、第1の実施の形態の再生装置1に、リンク情報作成装置3とリンク表示データ作成装置5とを含んで構成される装置である。したがって、異なる箇所のみについて説明し、その他の共通する部分は同一符号を付して説明する。
<再生装置>
再生装置1Aは、例えば、所定の記録媒体MAに記録された音声データからなる再生データDに基づいてリンク情報を作成して記録媒体MAに記録し、その後、記録媒体MAに記録されたリンク情報に基づいて記録媒体MAに記録された再生データDを再生すると同時に、記録媒体MAに記録された再生データD及びリンク情報に基づいてリンク表示データを作成して表示する。
具体的には、再生装置1Aは、例えば、図17に示すように、読取部11Aとデコーダ12Aと再生データ時間軸変更部13とを備える再生部RAと、リンク情報作成部33と、エンコーダ34と、再生データ出力制御部35と、リンク表示データ作成部15Aと、操作部16Aと、制御部17Aと、メモリ18と、などを備えて構成される。
また、再生装置1Aは、例えば、再生データ出力制御部35及び再生データ時間軸変更部13を介して音声出力装置1aAを接続するとともに、再生データ出力制御部35及びリンク表示データ作成部15Aを介して表示装置1bAを接続している。
音声出力装置1aAは、例えば、第1の実施の形態の再生装置1に接続された音声出力装置1aの機能と、リンク情報作成装置3に接続された音声出力装置3aの機能と、などを有している。
表示装置1bAは、例えば、第1の実施の形態の再生装置1に接続された表示装置1bの機能と、リンク情報作成装置3に接続された表示装置3bの機能と、などを有している。
読取部11Aは、例えば、第1の実施の形態の再生装置1の読取部11の機能と、リンク情報作成装置3の読取部31の機能と、リンク表示データ作成装置5の読取部51の機能と、などを有している。
デコーダ12Aは、例えば、第1の実施の形態の再生装置1のデコーダ12の機能と、リンク情報作成装置3のデコーダ32の機能と、リンク表示データ作成装置5のデコーダ52の機能と、などを有している。
リンク表示データ作成部15Aは、例えば、第1の実施の形態の再生装置1のリンク表示データ時間軸変更部15の機能と、リンク表示データ作成装置5のリンク表示データ作成部53の機能と、などを有している。
操作部16Aと、例えば、第1の実施の形態の再生装置1の操作部16の機能と、リンク情報作成装置3の操作部36の機能と、リンク表示データ作成装置5の操作部56の機能と、などを有している。
制御部17Aは、例えば、図18に示すように、CPU171と、RAM172と、記憶部173Aと、などを備えて構成される。
記憶部173Aは、例えば、再生装置1Aで実行可能なシステムプログラム、当該システムプログラムで実行可能な各種処理プログラム、これら各種処理プログラムを実行する際に使用されるデータ、CPU171によって演算処理された処理結果のデータなどを記憶する。なお、プログラムは、コンピュータが読み取り可能なプログラムコードの形で記憶部173Aに記憶されている。
具体的には、記憶部173Aは、例えば、図18に示すように、無音領域検出プログラム373aと、周期音領域検出プログラム373bと、リンク情報作成プログラム373cと、リンク情報記録制御プログラム373dと、分析プログラム573aと、再生データ画像化プログラム573bと、音声画像配置図作成プログラム573cと、リンク表示データ作成プログラム573dと、指定再生ポイント検出プログラム173aと、選択プログラム173bと、再生制御プログラム173cと、表示制御プログラム173dAと、などを記憶している。
ここで、リンク情報を作成するリンク情報作成手段は、例えば、リンク情報作成部33と、無音領域検出プログラム373aを実行したCPU171と、周期音領域検出プログラム373bを実行したCPU171と、リンク情報作成プログラム373cを実行したCPU171と、などにより構成される。
表示制御プログラム173dAは、例えば、リンク表示データ作成プログラム573dを実行したCPU171によりリンク表示データ作成部15Aにおいて作成されたリンク表示データに基づくリンク画像G2が合成された音声画像配置図G1を表示装置1bAに表示させる機能を、CPU171に実現させる。
以上説明した第2の実施の形態における再生装置1Aによれば、リンク情報を作成する、リンク情報作成部33と、無音領域検出プログラム373aを実行したCPU171と、周期音領域検出プログラム373bを実行したCPU171と、リンク情報作成プログラム373cを実行したCPU171と、などを備えているため、リンク情報を作成して、そのリンク情報に基づいて再生データDを再生することができる。
また、再生装置1Aは、再生データDの再生時においても主観的リンク情報を作成することができる。
すなわち、例えば、再生データDの再生時にユーザにより早送り再生がされると、その早送り再生がされた領域を省略するように主観的リンクを張ることができる。
この場合、早送り再生が開始された位置に最も近いフレーム内にあるリンク元L1から主観的リンクを張るよう決定するとともに、早送り再生が終了された位置を、その早送り再生が終了された位置から所定の範囲内にあり、且つ、主観的リンクを張るよう決定されたリンク元L1との波形の不一致度err[F][K]が小さくなる位置に変更するとよい。また、この場合、損失loss[F][K]は、ユーザにより入力された値であってもよいし、早送り再生時に作成する主観的リンク用として予め設定された値であってもよいし、早送り再生をするユーザ毎に設定された値であってもよい。
また、再生装置1Aは、再生データDの再生時に作成して表示することができるため、予めリンク表示データを作成する必要がない。
なお、本発明は、上記した実施の形態のものに限るものではなく、その要旨を逸脱しない範囲で適宜変更可能である。
第1及び第2の実施の形態において、再生データDは、音声データのみからなる限りではなく、音声データ及び映像データからなってもよい。この場合、音声データに関するリンク情報だけでなく、映像データに関するリンク情報も作成して、音声データの時間軸と映像データの時間軸とを別個に変更してもよいし、音声データに関するリンク情報のみを作成して、音声データの時間軸の変更に応じて映像データの時間軸を変更するようにしてもよい。
また、第1及び第2の実施の形態において、映像データDは、映像データのみからなってもよい。この場合、音声データに関するリンク情報に代えて、映像データに関するリンク情報を作成する必要がある。
第1及び第2の実施の形態において、リンク情報は、リンク先位置情報(リンク先サンプル番号link[F][K])と、不一致度情報(不一致度err[F][K])と、損失情報(損失loss[F][K])と、を含む限りではなく、リンク情報に基づいて予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択することができるものであれば任意である。
第1及び第2の実施の形態において、ユーザにより指定された再生データDの再生時間から、再生速度を算出して指定再生ポイントを検出してもよい。
すなわち、例えば、1時間分の再生データDを、15分で再生するようユーザによる操作部16,16Aの操作により指定された場合、ユーザによる操作部16,16Aの操作により指定された再生速度が“4倍速”であるとして、指定再生ポイントを検出し、そして、リンク先L2を選択して、再生ポイントを当該選択されたリンク先L2に移動させて再生データDを再生するようにしてもよい。これにより、再生装置1,1Aは、ユーザにとって視聴し易い状態で再生データDのダイジェスト再生を行うことができる。
第1の実施の形態において、再生装置1と、リンク情報作成装置3と、は別体ではなく、一体であってもよい。この場合、再生データDの再生時においても主観的リンク情報を作成することができる。
第1の実施の形態において、再生装置1と、リンク表示データ作成装置5と、は別体ではなく、一体であってもよい。この場合、リンク表示データは予め作成する必要はなく、再生データDの再生時に作成して表示することができる。
第1及び第2の実施の形態において、リンク画像G2は、図14に示すように、音声画像配置図G1に合成される必要はなく、また、リンク元L1を起点とした矢印でなくてもよく、リンク元L1と各リンク先L2との時間的な対応付けが可視化できるのであれば、任意であり、例えば、グラフ等であってもよい。
音声データからなる再生データを説明するための図である。 リンク元及びリンク先を説明するための図(a)と、リンク情報を示す図(b)と、である。 リンク元のオーバーラップ領域と、リンク先のオーバーラップ領域と、のオーバーラップについて説明するための図である。 リンクの種類とカテゴリctgry[F][K]との関係を示す図である。 再生データ及びリンク情報の記録媒体への記録形態について説明するための図である。 リンク情報を作成するリンク情報作成装置の機能的構成を示すブロック図である。 リンク長と、対応するリンク長となるリンク先を選択し続けたときの平均再生速度の逆数と、の関係を示す図である。 リンク先の検索範囲と、対応する検索範囲内からリンク先を選択し続けたときに実現する平均再生速度と、の関係を示す図である。 リンク情報作成装置によるリンク情報の作成に関する処理について説明するためのフローチャートである。 リンク表示データを作成するリンク表示データ作成装置の機能的構成を示すブロック図である。 リンク表示データ作成装置によるリンク表示データの作成に関する処理について説明するためのフローチャートである。 第1の実施の形態における再生装置の機能的構成を示すブロック図である。 再生データの再生開始から現時点までのユーザにより指定された再生速度の変化の一例を示す図である。 表示装置に表示された、リンク画像が合成された音声画像配置図の一例を示す図である。 再生装置による再生データの再生に関する処理について説明するための第1フローチャートである。 再生装置による再生データの再生に関する処理について説明するための第2フローチャートである。 第2の実施の形態における再生装置の機能的構成を示すブロック図である。 図17に示す制御部の機能的構成を示すブロック図である。
符号の説明
1,1A 再生装置
1b,1bA 表示装置
16,16A 操作部(指定手段)
18 メモリ(記憶手段)
171 CPU(選択手段、再生制御手段、表示制御手段、リンク情報作成手段)
173b 選択プログラム(選択手段)
173c 再生制御プログラム(再生制御手段)
173d 表示制御プログラム(表示制御手段)
373a 無音領域検出プログラム(リンク情報作成手段)
373b 周期音領域検出プログラム(リンク情報作成手段)
373c リンク情報作成プログラム(リンク情報作成手段)
D 再生データ
G2 リンク画像
L1 リンク元
L2 リンク先
M,MA 記録媒体
R,RA 再生部(再生手段)

Claims (14)

  1. 音声データ及び/又は映像データからなる再生データを再生する再生手段と、
    前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
    前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
    前記再生データの再生速度を指定する指定手段と、
    前記リンク先毎に、前記選択手段により選択された回数を記憶する記憶手段と、を備え、
    前記リンク情報は、前記再生データにおける前記リンク先の位置に関するリンク先位置情報と、前記リンク元と前記リンク先との波形の不一致度に関する不一致度情報と、前記再生ポイントを前記リンク元から前記リンク先へ移動させることによって生じる信号エネルギーの損失に関する損失情報と、を含み、
    前記選択手段は、前記再生データにおける前記指定手段により指定された再生速度に応じた指定再生ポイントと、前記リンク情報に含まれるリンク先位置情報に基づくリンク先ポイントと、の時間的誤差に関する誤差情報を取得し、当該取得した誤差情報と当該誤差情報に設定された誤差情報用重み付けとの積と、前記リンク情報に含まれる不一致度情報と当該不一致度情報に設定された不一致度情報用重み付けとの積と、前記リンク情報に含まれる損失情報と当該損失情報に設定された損失情報用重み付けとの積と、の和である前記評価値を算出して、前記複数のリンク先のうちの、前記記憶手段に記憶された回数が所定の閾値を下回るリンク先の中から、当該評価値が最も小さいリンク先を選択することを特徴とする再生装置。
  2. 請求項1に記載の再生装置において、
    前記リンク情報を作成するリンク作成手段を備えることを特徴とする再生装置。
  3. 音声データ及び/又は映像データからなる再生データを再生する再生手段と、
    前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
    前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
    前記再生データの再生速度を指定する指定手段と、
    を備え、
    前記リンク情報は、前記再生データにおける前記リンク先の位置に関するリンク先位置情報と、前記リンク元と前記リンク先との波形の不一致度に関する不一致度情報と、前記再生ポイントを前記リンク元から前記リンク先へ移動させることによって生じる信号エネルギーの損失に関する損失情報と、を含み、
    前記選択手段は、前記再生データにおける前記指定手段により指定された再生速度に応じた指定再生ポイントと、前記リンク情報に含まれるリンク先位置情報に基づくリンク先ポイントと、の時間的誤差に関する誤差情報を取得し、当該取得した誤差情報と、前記リンク情報に含まれる不一致度情報及び損失情報のうちの少なくとも1つの情報と、に基づいて前記評価値を算出することを特徴とする再生装置。
  4. 請求項3に記載の再生装置において、
    前記評価値は、前記誤差情報と当該誤差情報に設定可能な誤差情報用重み付けとの積と、前記不一致度情報と当該不一致度情報に設定可能な不一致度情報用重み付けとの積及び前記損失情報と当該損失情報に設定可能な損失情報用重み付けとの積のうちの少なくとも1つの積と、の和であり、
    前記評価値における評価が最も高いリンク先は、当該評価値が最も小さいリンク先であることを特徴とする再生装置。
  5. 請求項4に記載の再生装置において、
    前記リンク元よりも時間的に未来方向にある前記リンク先に関するリンク情報から取得される誤差情報と、前記リンク元よりも時間的に過去方向にある前記リンク先に関するリンク情報から取得される誤差情報と、には別個の前記誤差情報用重み付けが設定可能であり、
    前記リンク元よりも時間的に未来方向にある前記リンク先に関するリンク情報に含まれる不一致度情報と、前記リンク元よりも時間的に過去方向にある前記リンク先に関するリンク情報に含まれる不一致度情報と、には別個の前記不一致度情報用重み付けが設定可能であり、
    前記リンク元よりも時間的に未来方向にある前記リンク先に関するリンク情報に含まれる損失情報と、前記リンク元よりも時間的に過去方向にある前記リンク先に関するリンク情報に含まれる損失情報と、には別個の前記損失情報用重み付けが設定可能であることを特徴とする再生装置。
  6. 音声データ及び/又は映像データからなる再生データを再生する再生手段と、
    前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
    前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
    前記リンク先毎に、前記選択手段により選択された回数を記憶する記憶手段と、
    を備え、
    前記選択手段は、前記複数のリンク先のうちの、前記記憶手段に記憶された回数が所定の閾値を下回るリンク先の中から、前記評価値における評価が最も高いリンク先を選択することを特徴とする再生装置。
  7. 音声データ及び/又は映像データからなる再生データを再生する再生手段と、
    前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
    前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
    を備え、
    前記再生データは、当該再生データに対して予め設定された前記リンク情報とともに所定の記録媒体に記録されていることを特徴とする再生装置。
  8. 音声データ及び/又は映像データからなる再生データを再生する再生手段と、
    前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
    前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
    前記リンク情報に基づいて作成された前記リンク元と前記各リンク先との時間的な対応付けを表示するためのリンク表示データに基づくリンク画像を、表示装置に表示させる表示制御手段と、
    を備えることを特徴とする再生装置。
  9. 音声データ及び/又は映像データからなる再生データを再生する再生手段と、
    前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
    前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
    を備え、
    前記再生データは音声データであり、
    前記再生データ中の無音領域内に前記リンク元が位置する場合、当該リンク元の前記リンク情報は、当該無音領域の開始点及び終了点を前記リンク先とした無音内リンク情報を含むことを特徴とする再生装置。
  10. 音声データ及び/又は映像データからなる再生データを再生する再生手段と、
    前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
    前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
    を備え、
    前記再生データは音声データであり、
    前記再生データ中の無音領域内に前記リンク元が位置する場合、当該リンク元の前記リンク情報は、当該無音領域とは異なる当該再生データ中の無音領域の終了点を前記リンク先とした無音間リンク情報を含むことを特徴とする再生装置。
  11. 音声データ及び/又は映像データからなる再生データを再生する再生手段と、
    前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
    前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
    を備え、
    前記再生データは音声データであり、
    前記再生データ中の周期音領域の開始点又は終了点に前記リンク元が位置する場合、当該リンク元の前記リンク情報は、それぞれ当該周期音領域の終了点及び開始点を前記リンク先とした周期音リンク情報を含むことを特徴とする再生装置。
  12. 音声データ及び/又は映像データからなる再生データを再生する再生手段と、
    前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
    前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
    を備え、
    前記リンク元の前記リンク情報は、ユーザにより指定された指定リンク先を前記リンク先とした主観的リンク情報を含むことを特徴とする再生装置。
  13. 音声データ及び/又は映像データからなる再生データを再生する再生手段と、
    前記再生データに対して予め設定されたリンク元に対応する複数のリンク先に関するリンク情報に基づいて、予め決められた所定の演算式によりリンク元と各リンク先との間の評価値を算出し、当該複数のリンク先の中から当該評価値における評価が最も高いリンク先を選択する選択手段と、
    前記再生手段による前記再生データの再生ポイントが前記リンク元に対応する位置に対して所定のポイントに達すると、当該リンク元を前記選択手段により選択されたリンク先にリンクさせることによって当該再生ポイントを当該リンク先に対応する位置に移動させ、前記再生手段に当該再生データを再生させる再生制御手段と、
    前記リンク情報を作成するリンク作成手段と、
    を備えることを特徴とする再生装置。
  14. 請求項3〜13の何れか一項に記載の再生装置において、
    前記リンク元の前記リンク情報は、当該リンク元の位置から所定の検索範囲内にある任意点のうちの、前記不一致度情報に基づく不一致度が最も小さい不一致度最小点を前記リンク先とした単純リンク情報を含むことを特徴とする再生装置。
JP2007068900A 2007-03-16 2007-03-16 再生装置 Expired - Fee Related JP4390289B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007068900A JP4390289B2 (ja) 2007-03-16 2007-03-16 再生装置
US12/048,297 US8165888B2 (en) 2007-03-16 2008-03-14 Reproducing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007068900A JP4390289B2 (ja) 2007-03-16 2007-03-16 再生装置

Publications (2)

Publication Number Publication Date
JP2008233208A JP2008233208A (ja) 2008-10-02
JP4390289B2 true JP4390289B2 (ja) 2009-12-24

Family

ID=39775636

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007068900A Expired - Fee Related JP4390289B2 (ja) 2007-03-16 2007-03-16 再生装置

Country Status (2)

Country Link
US (1) US8165888B2 (ja)
JP (1) JP4390289B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011223097A (ja) * 2010-04-05 2011-11-04 Sony Corp 画像処理装置、画像処理方法及び画像処理プログラム
US10051279B2 (en) * 2014-07-01 2018-08-14 Samsung Display Co., Ltd. High quality display system combining compressed frame buffer and temporal compensation technique
US10878835B1 (en) * 2018-11-16 2020-12-29 Amazon Technologies, Inc System for shortening audio playback times

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
JPH06259093A (ja) 1993-03-08 1994-09-16 Fujitsu Ltd デジタル音声データの再生速度変換方法及び装置
US5611018A (en) * 1993-09-18 1997-03-11 Sanyo Electric Co., Ltd. System for controlling voice speed of an input signal
JP3178505B2 (ja) * 1995-07-31 2001-06-18 日本ビクター株式会社 伝送再生装置
ES2267135T3 (es) 1996-11-11 2007-03-01 Matsushita Electric Industrial Co., Ltd. Convertidor de velocidad de reproduccion de sonido.
JP2955247B2 (ja) 1997-03-14 1999-10-04 日本放送協会 話速変換方法およびその装置
JP2003223199A (ja) * 2002-01-28 2003-08-08 Telecommunication Advancement Organization Of Japan 字幕用書き起こしテキストの作成支援システム及び半自動型字幕番組制作システム
JP2003241800A (ja) 2003-02-10 2003-08-29 Yamaha Corp ディジタル信号の時間軸圧伸方法及び装置
JP2005352047A (ja) * 2004-06-09 2005-12-22 Victor Co Of Japan Ltd 学習装置
JP2006127647A (ja) 2004-10-29 2006-05-18 Sharp Corp 音声高速再生装置及び方法
EP1840877A4 (en) * 2005-01-18 2008-05-21 Fujitsu Ltd ELOCUTION SPEED CHANGING METHOD AND ELOCUTION SPEED CHANGING DEVICE

Also Published As

Publication number Publication date
JP2008233208A (ja) 2008-10-02
US8165888B2 (en) 2012-04-24
US20080235010A1 (en) 2008-09-25

Similar Documents

Publication Publication Date Title
KR100775176B1 (ko) 동영상 정보를 썸네일로 재생하는 방법 및 이를 이용한단말기
US8744244B2 (en) Reproducing apparatus, reproducing method, and storage medium
JP5045670B2 (ja) 音声データ要約再生装置、音声データ要約再生方法および音声データ要約再生用プログラム
US8306812B2 (en) Method and apparatus to vary audio playback speed
US8818163B2 (en) Motion picture playing method, motion picture playing apparatus and recording medium
JP2019068300A (ja) ダイジェストデータ生成装置、ダイジェストデータ再生装置、ダイジェストデータ生成システム、ダイジェストデータ生成方法及びプログラム
US20190254572A1 (en) Auditory training device, auditory training method, and program
US9336823B2 (en) Playing audio in trick-modes
JP2017129720A (ja) 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム
JP4390289B2 (ja) 再生装置
JP2010283605A (ja) 映像処理装置及び方法
US8761567B2 (en) Moving image reproducer reproducing moving image in synchronization with musical piece
JP6641045B1 (ja) コンテンツ生成システム、及びコンテンツ生成方法
JP6295381B1 (ja) 表示タイミング決定装置、表示タイミング決定方法、及びプログラム
US20130216210A1 (en) Systems and Methods of Providing Modified Media Content
JP2005512134A (ja) リアルタイム時間伸縮用パラメータ付きデジタルオーディオ
WO2019229936A1 (ja) 情報処理システム
CN108028055A (zh) 信息处理装置、信息处理系统和程序
KR20170068795A (ko) 소리의 시각화 방법 및 이를 이용한 모바일 단말
JP4985152B2 (ja) 情報処理装置、信号処理方法およびプログラム
US20230145547A1 (en) Decoding device, decoding method, program, encoding device, and encoding method
KR100619291B1 (ko) 재생 속도 가변 방법 및 장치
JP2008154258A (ja) 動画再生装置、動画再生方法及びそのコンピュータ・プログラム
JP2006157692A (ja) 映像再生方法及び装置及びプログラム
Braithwaite 2020 Sound

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070328

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070601

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090915

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091005

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121016

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121016

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131016

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees