JPWO2009040950A1 - 音信号制御装置 - Google Patents

音信号制御装置 Download PDF

Info

Publication number
JPWO2009040950A1
JPWO2009040950A1 JP2009534135A JP2009534135A JPWO2009040950A1 JP WO2009040950 A1 JPWO2009040950 A1 JP WO2009040950A1 JP 2009534135 A JP2009534135 A JP 2009534135A JP 2009534135 A JP2009534135 A JP 2009534135A JP WO2009040950 A1 JPWO2009040950 A1 JP WO2009040950A1
Authority
JP
Japan
Prior art keywords
speed
sound
input data
change
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009534135A
Other languages
English (en)
Other versions
JP5141689B2 (ja
Inventor
敏郎 大櫃
敏郎 大櫃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2009040950A1 publication Critical patent/JPWO2009040950A1/ja
Application granted granted Critical
Publication of JP5141689B2 publication Critical patent/JP5141689B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/4147PVR [Personal Video Recorder]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/432Content retrieval operation from a local storage medium, e.g. hard-disk
    • H04N21/4325Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4396Processing of audio elementary streams by muting the audio signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440281Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the temporal resolution, e.g. by frame skipping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44209Monitoring of downstream path of the transmission network originating from a server, e.g. bandwidth variations of a wireless network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/907Television signal recording using static stores, e.g. storage tubes or semiconductor memories
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

一致度が高い動画像が続いている場合に、音出力をミュートし、再生速度を切り替えることにより、ノイズの発生を抑える技術を提供する。このため、音及び動画像の再生装置が、動画信号及び音信号を含む入力データの再生速度の変更を決定し、前記再生中に前記変更決定部が異なる再生速度への変更を決定した場合に、動画像の一致度が所定値以上の期間を切り替えタイミングとして検出し、前記入力データに基づいて音及び動画像を再生し、前記変更決定部によって再生速度の変更が決定された場合に、前記切り替えタイミングで再生速度を切り替え、前記切り替えタイミングで前記音信号に基づく音出力をミュートする。

Description

本発明は、動画再生時の音出力を制御する技術に関する。
動画像を倍速やスローなど1倍速以外に変倍して再生する場合、この動画像に合わせて音出力も制御していた。このため、再生速度を変倍から1倍へ戻す(切り替える)場合にも音出力を通常状態に戻す制御を行っていた。このとき、音量や音の周波数に大きな変動があると、ノイズが発生することがあった。
このノイズの発生を避けるため、再生速度を切り替える場合に、無音期間を待って切り替えを実行する手法も提案されている。
また、本願発明に関連する先行技術として、例えば、下記の特許文献に開示される技術がある。
特開2004−214902号公報 特開平06−337696号公報 特開平07−212319号公報
しかし、上記のように無音期間を待って再生速度の切り替えを行う場合、通常の動画では、BGM(back ground music)や効果音が絶えず流れ、完全に無音になることが稀であるため、適切なタイミングで切り替えを行えないという問題があった。
そこで本発明は、一致度が高い動画像が続いている場合に、音出力の変動が少ないと類推し、このタイミングで音出力をミュートし、再生速度を切り替えることにより、ノイズの発生を抑える技術を提供する。
上記課題を解決するため、本発明は、以下の構成を採用した。
即ち、本発明の音信号制御装置は、
動画信号及び音信号を含む入力データの再生速度の変更を決定する変更決定部と、
前記再生中に前記変更決定部が異なる再生速度への変更を決定した場合に、動画像の一致度が所定値以上の期間を切り替えタイミングとして検出する切り替え検出部と、
前記入力データに基づいて音及び動画像を再生し、前記変更決定部によって再生速度の変更が決定された場合に、前記切り替えタイミングで再生速度を切り替える再生部と、
前記切り替えタイミングで前記音信号に基づく音出力をミュートする音制御部と、
を備えた。
前記検出部は、動画信号のうち、Nフレームと該Nフレームから所定フレーム後のN+xフレームまでを比較して一致度が所定値以上の場合に、N+1フレームからN+xフレームまでを切り替えタイミングとして検出しても良い。
前記変更決定部が、1倍未満の再生速度から1倍速へ変更、或は1倍を超えた再生速度から1倍速へ変更した場合に、前記音制御部は、音出力をミュートしても良い。
前記音信号制御装置は、
前記入力データの欠落を検出する欠落検出部と、
前記欠落検出部によって前記入力データの欠落が検出された場合に、欠落が検出された部分を除く、欠落部分の前方の入力データおよび後方の入力データのうち少なくとも何れか一方の入力データを、該入力データに係る再生時間と該欠落部分に係る再生時間とを合わせた再生時間分のデータとして平均化することで代替データを生成する代替データ生成部と、を更に備え、
前記検出部によって前記入力データの欠落が検出された場合に、前記変更決定部が1倍未満の再生速度への変更を決定し、前記再生部が、前記画像信号と前記代替データに基づいて音及び動画像を再生し、前記検出部によって前記入力データの欠落が検出されなくなった場合に、前記変更決定部が1倍の再生速度への変更を決定しても良い。
また、本発明の音信号制御方法は、
音及び動画像の再生装置が、
動画信号及び音信号を含む入力データの再生速度の変更を決定するステップと、
前記再生中に前記変更決定部が異なる再生速度への変更を決定した場合に、動画像の一致度が所定値以上の期間を切り替えタイミングとして検出するステップと、
前記入力データに基づいて音及び動画像を再生し、前記変更決定部によって再生速度の変更が決定された場合に、前記切り替えタイミングで再生速度を切り替えるステップ、
前記切り替えタイミングで前記音信号に基づく音出力をミュートするステップと、
を実行する。
前記音信号制御方法において、前記動画信号のうち、Nフレームと該Nフレームから所定フレーム後のN+xフレームまでを比較して一致度が所定値以上の場合に、N+1フレームからN+xフレームまでを切り替えタイミングとして検出しても良い。
前記音信号制御方法において、前記再生速度を1倍未満の再生速度から1倍速へ変更、或は1倍を超えた再生速度から1倍速へ変更した場合に、前記音出力をミュートしても良い。
前記音信号制御方法において、前記入力データの欠落を検出するステップと、
前記欠落検出部によって前記入力データの欠落が検出された場合に、欠落が検出された部分を除く、欠落部分の前方の入力データおよび後方の入力データのうち少なくとも何れか一方の入力データを、該入力データに係る再生時間と該欠落部分に係る再生時間とを合わせた再生時間分のデータとして平均化することで代替データを生成するステップと、を更に備え、
前記入力データの欠落が検出された場合に、1倍未満の再生速度への変更を決定し、前記画像信号と前記代替データに基づいて音及び動画像を再生し、前記入力データの欠落が検出されなくなった場合に、1倍の再生速度への変更を決定しても良い。
また、本発明は、上記音信号制御方法をコンピュータに実行させる音信号制御プログラムであっても良い。更に、本発明は、この音信号制御プログラムをコンピュータが読み取り可能な記録媒体に記録したものであっても良い。コンピュータに、この記録媒体のプログラムを読み込ませて実行させることにより、その機能を提供させることができる。
ここで、コンピュータが読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータから読み取ることができる記録媒体をいう。このような記録媒体の内コンピュータから取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、CD-ROM、CD-R/W、DVD、DAT、8mmテープ、メモリカード等がある。
また、コンピュータに固定された記録媒体としてハードディスクやROM(リードオンリーメモリ)等がある。
本発明によれば、一致度が高い動画像が続いている場合に、音出力をミュートし、再生速度を切り替えることにより、ノイズの発生を抑える技術を提供できる。
本実施形態の概要を示す図である。 実施形態に係るパーソナルコンピュータの機能構成図である。 実施形態に係るパーソナルコンピュータの詳細構成の例を示す図である。 実施形態における代替データ生成処理の概要を示す図である。 実施形態における代替データ生成処理の概要を示す図である。 図5に示す代替データ生成処理を行った場合に表示される映像の例を示す図である。 実施形態における信号出力処理の全体の流れを示すフローチャートである。 実施形態における代替データ生成処理の流れを示すフローチャートである。 実施形態における代替データ生成処理及び再生速度切替処理の流れを示すフローチャートである。 ユーザ操作に応じた再生速度切替処理の説明図である。 音声ポップノイズの発生原因の説明図である。 音声ポップノイズの発生原因の説明図である。 音声ポップノイズの発生原因の説明図である。 H.264/AVCのデータ構成を示す図である。
符号の説明
14 放送受信部
18 操作部
21 出力制御部
22 検知部
23 出力信号生成部
26 バッファ部
27 検出部
28 代替データ生成部
40 表示部
〈概要〉
動画信号及び音信号を含む入力データに基づいて動画を再生する装置において、動画の再生中に、早送り、コマ送りなど、1倍速以外の変倍速度に切り替えることがある。この場合、音信号についても動画像の変倍に合わせた制御となる。例えば、1倍未満の再生速度であれば、音を伸長して再生時間を延ばし、1倍以上の再生速度であれば無音期間を省くなどして再生時間を短くすることによって動画像に合わせる制御を行う。このため、再生速度を変更した場合、変更前と変更後とで音の状態が急激に変化するので音声ノイズが発生することがある。
ここで再生スピードの急激な変更によって発生する音声ポップノイズについて、図11を参照して説明する。なお、以下の説明において、音信号は、どのような音の信号であっても良いが、テレビ放送等においては、人の声が主要な要素であり、また、BGMや効果音が統合された音響であることが一般的であるので、便宜上、音声信号、音響信号とも記す。同様に、音信号に基づく音を音声或は音響とも記す。
図11中、期間3Aは1倍速未満の低速再生している部分、期間3Bは1倍速で通常再生している部分である。”Nxx”は1秒間のフレームN01〜N15を示す。
期間Aでは、音声の再生速度も1倍速未満として周波数を低くする、或は音声を所定単位でサンプリングして該単位毎の再生時間を延ばすことで周波数を変えずに音声を再生する。何れにしても期間3Aの音声と期間3Bの音声とでは異なる状態となる。図12Aと図12Bは、1/2倍の速度で再生した音声の周波数と、通常(1倍)の速度で再生した音声の周波数との違いを示している。図12A,B中、横軸が周波数、縦軸が音の大きさ(dB)を示している。
そして、この1倍速未満の再生から1倍速に変更するポイントを”3C”とする。即ち、ポイント3Cで突然に音声の周波数が変更される。従来ではこの期間をミュートすることはない。よって、大きな音声レベルの違いが発生する。ここで周波数の隔たりは音質の変化として現れ、デシベル[dB]の隔たりは音量の変化として現れる。従って、これらがある時間を持って現れると音声ノイズとして聞こえる。
そこで、本実施形態では、図1に示すように再生速度の切り替え時に音出力をミュートしてノイズの発生を抑えた。図1は本実施形態の概略の説明図である。
まず、入力データに基づいて動画を再生している際に、ユーザの操作或いは装置によって再生速度の変更を決定する。例えば、変倍速から1倍速への切り替えを決定する。
この場合、入力データをサーチし、動画を構成する各フレーム(動画像)の一致度が所定値以上の期間4Cを検出する。このように同じようなフレームが続いている場合には、音声も同じ状況が続いており、変化が少ないことが類推できるので、ここを再生スピードの切り替えタイミングとする。
そして、この切り替えタイミングで、音声のミュート及び再生速度の切り替えを行う。このミュート及び再生速度の切り替えは、図1に示すように、ミュートの開始時101に、時間軸に対して、レベルを漸減しながら無音声にする。よって、いきなり無音になることがないため、これによる音声ノイズは発生しない。
その後、再生速度の切り替え102を行い、音声レベルを漸増してミュートを解除103する。
この切り替えタイミングでは、N frameと(N+1) frameから(N+5) frame(図1では、N06〜N10)までが所定以上の画面の一致があるため急激な音声の音圧或いは周波数の変動はない。即ち、ここでは同じシーンが続くため、爆発音等の激しい音の切り替わりはない。よってアプリケーションによる一時的な無音声区間を作成してもその動画を視聴するときに違和感はない。このため、短い期間でミュートの開始及びミュートの解除を行ってもノイズとして認識されない。
従って、本実施形態によれば、ノイズの発生を抑えつつ適時に再生速度の切り替えを行うことができる。
ここで記述した所定以上の動画像の一致とは、決まった値ではなく、アプリ(音制御プログラム)の設計者がその再生コンテンツによって設定するものである。
例えば動画を構成する各フレームを画素単位で比較し、所定値(本例では90%)以上の画素が一致するか否かによって判定する。即ち、一致度が90%以上の映像が続く場合に再生速度を1倍に切り替える。
〈実施形態1〉
以下にデジタルテレビ(ワンセグ)放送の視聴機能を備えるコンピュータ(パーソナルコンピュータ)として実施した場合の実施の形態を説明する。以下の実施形態の構成は例示であり、本実施形態は実施形態の構成には限定されない。
ワンセグ放送では、動画データの圧縮符号化方式としてH.264/AVC(レベル1.2、320x240または320x180、最小フレーム間隔1/15秒)が用いられている。この方式では、圧縮された動画データよりピクチャを生成する方法として、フレーム間予測によるピクチャ生成が採用されている。
図13は、H.264/AVCのデータ構成を示す図である。H.264/AVCのデータには、シーケンス全体の符号に関わる情報が含まれるヘッダであるSPS(Sequence Parameter Set)、ピクチャ全体の符号化モードを示すヘッダであるPPS(Picture Parameter Set)、必要な場合に付加されるSEI(Supplemental Enhancement Information)、IDRピクチャ(Instantaneous Decoding Refresh Picture)等が含まれる。ワンセグ放送では、3枚以内の参照ピクチャからフレーム間予測が行われ、Pピクチャ(Predictive Picture)が生成される。また、IDRピクチャによって区切られる、ひとまとまりのフレーム群は、GOP(Group Of Picture)と呼ばれる。本実施形態では、GOPは原則として再生時間にして1秒分の15フレームとする。
本実施形態に係るパーソナルコンピュータは、ワンセグ放送の受信チューナ、および復号手段を備え、表示部(ディスプレイ)に復号した映像信号に基づく画像を表示し、復号した音響信号に基づく音響を再生することによってワンセグ放送を視聴することが可能なパーソナルコンピュータである。このようなパーソナルコンピュータでは、パーソナルコンピュータに備えられた機器自体が発する電波や周囲の電波の状況等により、一時的にフレームの受信等に失敗し、データに欠落が発生することが考えられる。
ここで、従来のワンセグ放送視聴装置では、データに欠落が発生した場合、そのまま情報不足の映像または音響が出力されるか、映像または音響が出力されない(ブラックアウト)という問題が発生する。
そこで、本実施形態に係るパーソナルコンピュータは、再生時間にして3秒分のデータをバッファ(即ち、コンピュータ上のメモリから削除しない)しつつ遅延出力を行い、動画データまたは音響データに欠落がある場合には、バッファされたデータに基づいてスロー再生を行うことで、欠落部分に映像途切れや音途切れ等が発生しないようにする。
即ち、本実施形態に係るパーソナルコンピュータに拠れば、動画データまたは音響データに欠落が発生した場合でも、情報不足の映像が出力されたり、映像がブラックアウトしたり、音声が途切れたりすることなく、視聴者に違和感を殆ど与えない映像が表示され、音響が再生されるような映像信号および音響信号を出力することが可能である。
本実施形態において、バッファされる入力データの量は、動画および音響として再生する場合の時間に換算して3秒分とする。例えば、動画データでは、ワンセグ放送は毎秒15フレームであるため、おおよそ45フレームの動画データがバッファされる。このバッファ量および遅延時間は、可能な限り多くすることが好ましいが、実際に視聴する際の遅延の許容範囲や、パーソナルコンピュータ上に確保できるバッファ領域のサイズを考慮して、本実施形態では3秒とした。但し、このバッファ量および遅延時間は、実施の形態毎に適宜最適な値に設定されることが好ましい。例えば、常駐するアプリケーションや不要なアプリケーションを終了させるか、メインメモリの一部をビデオメモリとして使用しない(単独のビデオメモリを設ける)ことで確保可能なメインメモリの容量を増やし、バッファ量を増やすこと等が考えられる。
また、本実施形態に係るパーソナルコンピュータは、このバッファを利用して3秒間の遅延出力を行う。遅延出力を行うことによって、データの欠落によって動画データまたは音響データが欠落している場合にも、欠落している映像信号または音響信号をそのまま出力してしまうことなく、バッファされた未出力のデータをスロー再生することで、欠落部分の映像または音響を補間することが可能となる。
<パーソナルコンピュータの機能構成>
図2は、本実施形態に係るパーソナルコンピュータ10の機能構成図である。本パーソナルコンピュータ10は、ユーザの操作を受けて、パーソナルコンピュータ10を操作する操作部18と、操作部18における操作を検知する検知部22と、テレビジョン放送を受信する放送受信部14と、放送受信部14より出力されたデータに基づいて復号された映像信号および音響信号を表示部(音出力部を含む)40へ出力する信号出力装置10Aと、入力された映像信号に基づいて放送受信部14で受信された放送番組を表示する表示部40、とを有する。
さらに、信号出力装置10Aは、放送受信部14より出力されたデータを一定量記憶するバッファ部26と、放送受信部14より出力されたデータを復号することで映像信号および音響信号を生成する出力信号生成部23と、データの欠落を検出する検出部(欠落検出部)27と、検出部27によって欠落が検出された場合に代替データを生成する代替データ生成部28と、映像信号および音響信号を表示部40へ出力する出力制御部(再生部に相当)21と、入力データの再生速度の変更を決定する変更決定部31と、切り替えタイミングを検出する切り替え検出部32と、音出力をミュートする音制御部33を有する。
これらの各機能部は、CPU、メモリ等を含むコンピュータとコンピュータ上で実行されるプログラムによって実現することができる。
ここで、操作部18は、コンピュータの入力装置や、赤外線受光部と赤外線リモコンとの組み合わせによるリモコン操作部、チャンネル操作用のつまみ、操作ボタン等である。
検知部22は、操作部18とCPUとのインターフェースと、インターフェースの信号を処理するデバイスドライバと、デバイスドライバを通じて操作部18との間で信号を授受するOS(オペレーティングシステム)と、を通じて、操作部18への操作(例えば、受信チャンネルの切り替え)を検知する。ただし、検知部22として、専用のハードウェアを設けてもよい。例えば、操作部用の入力信号処理回路を設けて、CPUの処理を分担してもよい。このような処理回路としては、キーボードコントローラ、マウスコントローラ等が知られている。
また、例えば、操作部18からの信号を処理する専用の入力制御プロセッサを別途設けてもよい。入力制御プロセッサは、操作部18の信号を所定の信号に変換し、出力制御部21に信号を伝達すればよい。
放送受信部14は、所謂ワンセグチューナである。放送受信部14は、アンテナで放送波を受信し、受信した放送波に基づいたデータストリーム(例えば、TS信号)を出力する。
出力信号生成部23は、放送受信部14より出力されたデータを、直接またはバッファ部26を介して取得し、取得したデータに基づいて、映像信号および音響信号を生成する。出力信号生成部23は、CPU上で実行されるコンピュータプログラムとして構成すればよい。ただし、出力信号生成部23は、入力データに基づいて映像信号および音響信号を生成し、生成した映像信号および音響信号を出力する専用プロセッサとして構成されてもよい。
バッファ部26は、入力されたデータを一時的に記憶する。バッファ部26は、放送受信部14より出力されたデータの入力を受け付け、再生時間にして3秒分の入力データをバッファする。バッファ部26は、CPU上で実行されるコンピュータプログラムによって制御される電源バックアップされた揮発性メモリ、フラッシュメモリ等の不揮発性のメモリ、ハードディスクあるいは可搬媒体等の記録媒体として構成すればよい。ただし、バッファ部26は、入力された入力データをバッファする専用メモリとして構成されてもよい。
出力制御部21は、表示部40とのインターフェースを有し、表示部40へ出力する映像信号および音響信号を制御する。出力制御部21は、検知部22によって検知された信号に従って、出力信号生成部23によって生成された映像信号および音響信号を、表示部40へ出力する。この際、出力制御部21は、放送が受信された時間から3秒遅延させて出力を行う。また、出力制御部21は、変更決定部31から通知された再生速度に基づいて出力を制御する。即ち、1倍速未満であれば各フレームの出力時間を延ばし、1倍速以上であればフレームを間引くなどして動画像の再生速度を変更する。これに伴い音響信号も伸長或は間引いて動画像に合わせる。出力制御部21は、CPU上で実行されるコンピュータプログラムとして構成すればよい。ただし、出力制御部21は、映像信号および音響信号を出力する専用プロセッサとして構成されてもよい。
検出部27は、放送受信部14より入力されたデータ(入力データ)の完全性を監視し、データの欠落を検出する。欠落が検出された場合、検出部27は、欠落の発生しているデータブロック(動画であればGOP)を特定し、代替データ生成部28及び変更決定部31へ通知する。代替データ生成部28は、この通知を受けて、代替データ生成処理を開始する。
代替データ生成部28は、検出部27によってデータの欠落が通知された場合に、変換用データブロックを取得し、これを平均化することで、欠落部分の映像または音響を補間するための代替データを生成する。代替データ生成部28による処理の詳細については、図4および図5を用いて説明する。また、表示部40は、いわゆるモニタおよびスピーカであり、出力制御部21より出力された映像信号および音響信号の入力を受けて映像を表示し、音響を再生する。
変更決定部31は、ユーザの操作或は変更決定部31の通知に基づき動画信号及び音信号を含む入力データの再生速度の変更を決定する。例えば、ユーザが操作部18の操作により早送りやスロー再生等の変倍を指示した場合に、検知部22で検知した該指示に応じて再生速度を決定して出力制御部21に通知する。また、検出部27によってデータの欠落が検出された場合、動画像が代替データによって平均化され、1倍未満の再生速度になるため、この再生速度を欠落したフレーム数に応じて求めて出力制御部21に通知する。また、検出部27によってデータの欠落が検出されなくなった場合、再生速度を1倍に決定する、即ち1倍速に戻す(変更する)ことを決定し、出力制御部12へ通知する。
切り替え検出部32は、前記再生中に前記変更決定部が異なる再生速度への変更を決定した場合に、映像信号をサーチし、フレーム(動画像)の一致度が所定値以上の期間を切り替えタイミングとして検出する。この一致度の検出としては、例えば、出力信号生成部23で生成した映像信号のうち、あるフレーム(Nフレーム)と該Nフレームから所定フレーム後のN+xフレームまでを画素単位で比較して相関を求め、一致度が所定値以上(例えば90%以上)の場合に、N+1フレームからN+xフレームまでを切り替えタイミングとして検出する。また、放送受信部14で受信した入力データのうち、IBPフレームのPピクチャのデータ量(差分量)をモニタし、連続する所定数(例えば5枚)のPピクチャのデータ量が所定数以下或はGOP内で最も少なくなる期間を求め、この期間のピクチャに基づくフレームN+1フレームからN+xの再生期間を切り替えタイミングとしても良い。
音制御部33は、前記切り替え検出部32で検出した切り替えタイミングに基づき、前記音信号に基づく音出力をミュートする。具体的には、出力制御部21から表示部40のスピーカに出力される音響信号を減衰させる構成でも良いし、出力制御部21にミュートのタイミングを通知して音響信号をミュートさせる構成でも良い。
<パーソナルコンピュータの構成>
図3は、本発明の一実施形態に係るパーソナルコンピュータ10の詳細構成の例を示す図である。図3のように、パーソナルコンピュータ10は、コンピュータプログラムを実行し、パーソナルコンピュータ10を制御するCPU11と、CPU11で実行されるコンピュータプログラム、あるいはCPU11が処理するデータを記憶するメモリ12と、CPU11を各種の装置に接続するインターフェース13と、インターフェース13を通じて接続される放送受信部14、通信部15、ハードディスク駆動装置16、可搬媒体駆動装置17、操作部18、および表示部40等の装置を有している。
ここで、CPU11は、コンピュータプログラム(音信号制御プログラム等)を実行し、パーソナルコンピュータ10の各部を制御することで、パーソナルコンピュータ10を、検知部22、放送受信部14、出力制御部21、出力信号生成部23、バッファ部26、検出部27、代替データ生成部28、出力制御部21、変更決定部31、切り替え検出部32、及び音制御部33等の各機能部を有する装置として機能させる。メモリ12は、CPU11で実行されるプログラム、およびCPU11で処理されるデータを記憶する。メモリ12は、揮発性のRAM(Random Access Memory)と、不揮発性のROM(Read Only Memory)を含む。ROMには、フラッシュメモリ、EPROM(Erasable Programmable Read-Only Memory)、EEPROM(Electrically Erasable Programmable Read-Only Memory)のような書き換え可能な半導体メモリを含む。
インターフェース13は、USB等のシリアルインターフェース、あるいは、PCI(Peripheral Component Interconnect)、ISA(Industry Standard Architecture)、EISA(Extended ISA)、ATA(AT Attachment)、IDE(Integrated Drive Electronics)、IEEE1394、SCSI(Small Computer System Interface)等のパラレルインターフェースのいずれでもよい。
なお、図3では、インターフェース13と記載されているが、CPU11と各装置との間を異なるインターフェースで接続してもよい。また、複数のインターフェースをブリッジ接続してもよい。
放送受信部14は、ワンセグ放送用のテレビジョンチューナである。放送受信部14は、同調回路と増幅器を含む高周波部の他、デジタル信号の復号器(OFDM(Orthogonal Frequency Division Multiplexing)の復調器)等を含む。
ここで、高周波部は、高周波の電磁波をベースバンド信号に変換する。また、OFDMの復調器は、FFT(Fast Fourier Transform)処理回路および直交復調器を含み、ベースバンド信号からデジタル信号を生成する。これらの処理は、積和演算を実行する専用のデジタル回路で構成されてもよい。また、DSPのようなプロセッサとプログラムで構成されてもよい。また、テレビジョン放送の規格にしたがって製造され販売されている復調用LSIを用いてもよい。
通信部15は、ブロードバンドネットワークとのインターフェースである。ブロードバンドネットワークは、例えば、LAN(Local Area Network )、ケーブルテレビネットワーク、xDSL(x Digital Subscriber Line)、ADSL、光ネットワーク等の有線ネットワーク、あるいは、無線LAN、固定無線アクセス(FWA)等の無線アクセス可能なネットワークである。通信部15は、例えば、ネットワーク上のサーバから、ハードディスク駆動装置16にインストールされるコンピュータプログラムや、テレビジョン放送の電子番組表等を取得する。これらのブロードバンドネットワークは、一般的には、インターネットに接続可能である。
ハードディスク駆動装置16は、メモリ12にロードされるプログラムを格納する。また、ハードディスク駆動装置16は、CPU11で処理されるデータを記憶する。
なお、ハードディスク駆動装置16は、1台に限定されず、複数台設けられてもよい。また、例えば、ハードディスク駆動装置16は、ネットワーク上の他のコンピュータ、例えば、ディスクサーバが管理するものであってもよい。その場合には、CPU11が、通信部15を介してディスクサーバと通信するようにすればよい。そして、CPU11が、ディスクサーバから取得したEPG等を表示部40に表示すればよい。
可搬媒体駆動装置17は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disk)、HD−DVD、ブルーレイディスク等の駆動装置である。また、可搬媒体駆動装置17は、フラッシュメモリ等の不揮発性メモリを有するカード媒体の入出力装置であってもよい。可搬媒体駆動装置17が駆動する媒体は、例えば、ハードディスク駆動装置16にインストールされるコンピュータプログラム、入力データ等を保持する。
操作部18は、コンピュータの入力装置、例えば、キーボード、ポインティングデバイス等である。また、操作部18として、赤外線受光部と赤外線リモコンとの組み合わせによるリモコン操作部や、各種のスイッチ、チャンネル操作用のつまみ等が含まれる。ポインティングデバイスの種類には特に限定はなく、マウス、トラックボール、ダイヤル式操作部、スティック形式で表示部40上のポインタを移動する装置、静電容量によってユーザの指の操作を検出するデバイス、タッチパネル、ジョイスティック等、パーソナルコンピュータ10の特性、ユーザのニーズ等に応じて、適切なものを使用すればよい。
キーボードは、ユーザの入力操作に応じて、入力されたキーに対応する電気信号を不図示のキーボードコントローラに送信する。キーボードコントローラは、その電気信号に対応する符号をCPU11に送信する。
ポインティングデバイスは、ユーザ操作を検知して、操作信号を不図示のポインティングデバイス制御装置(例えば、不図示のマウスコントローラ、または、インターフェース13等)に送信する。操作信号を受けたポインティングデバイス制御装置は、操作の方向および操作量を生成するための情報をCPU11に送信する。CPU11のデバイスドライバは、ポインティングデバイス制御装置からの操作信号に基づき、表示部40上の画面にポインタを表示し、画面上を移動させる。
また、CPU11のOSは、ポインタと、画面上のオブジェクト(ウィンドウ、ボタン、メニュー、リスト等)との位置関係を判定する。そして、そして、ポインタが存在する位置にあるオブジェクトを選択状態、あるいは、フォーカス状態にする。さらに、ポインティングデバイスに対する選択確定操作、例えば、マウスボタンの押下によって、そのオブジェクトの選択を確定する。
表示部40は、例えば、液晶表示装置、プラズマディスプレイパネル、CRT(Cathode Ray Tube)、エレクトロルミネッセンスパネル等である。なお、図示されていないが、表示部40には、画像データを格納するRAM、およびRAMのデータに基づき表示部40を駆動する駆動回路が含まれる。ただし、画像データを格納するRAM、表示部40を駆動する駆動回路等は、画像処理基板として独立に設けても良い。その場合に、画像処理基板には、CPU11からの画面情報を構成するデータが入力される。
また、表示部40には、スピーカ(音出力部)が付属し、出力制御部21より出力された音響信号に基づく音響、ハードディスク駆動装置16または可搬媒体駆動装置17から読み出され、不図示の音声合成基板で再生された音を出力する。音声合成基板は、例えば、MP3等のデジタルデータを音に変換する。
本発明に係る情報機器は、以上のようなパーソナルコンピュータ10として構成できる。ただし、本発明に係る情報機器は、パーソナルコンピュータに限定されず、同等の機能を有する他の装置、例えば、テレビジョン受信装置であってもよい。また、テレビジョン放送受信用のチューナ、セットトップボックス、テレビジョン放送受信機能付きの携帯電話、携帯情報端末(PDA)、ゲーム機、テレビジョン放送受信機能付きの車載器等によっても実現できる。
図4は、本実施形態における代替データ生成処理(1)の概要を示す図である。代替データ生成処理は、代替データ生成部28によって行われる。図4の(a)は、正常な入力データが受信され、出力されている状態を示す。図中の長方形は1秒分のデータブロックを表し、N1、N2、N3・・・の順に入力される。本実施形態に係るパーソナルコンピュータは、3秒分のデータをバッファするため、N4が入力される時に、3秒前に入力されたN1が出力される。
図4の(b)は、(a)から1秒後の状態を示す。ここで、入力されるN5のデータが正常でない場合、このまま処理を続けると3秒後に正常でないデータが出力されてしまう。そこで、本実施形態では、正常でないN5よりも後方、且つ現在の出力ポイントであるN2よりも前方のデータブロックN3およびN4を、N3−N5の代替となる代替データブロックM3−M5へ平均化する。
図4の(c)は、(b)から1秒後の状態を示す。ここでは、N3に代えて、M3に基づいて生成された出力信号(映像信号および音響信号)が出力される。出力、再生された動画および音響は、代替データ生成処理(1)が行われなかった場合の2/3の速度のスロー再生となる。以降、M4、M5が続いて出力される。M4およびM5が出力されて表示された動画および音響についても、通常の2/3の速度のスロー再生である。
上記説明した代替データ生成処理(1)によって、欠落したデータブロック分の再生時間を補間することが可能である。但し、このまま通常の再生処理に戻り、入力されたデータに基づく出力を行うこととすると、欠落したデータブロック(図4におけるN5)分の動きがスキップされてしまい、また、通常の2/3倍の速度のスロー再生から瞬時に通常の等倍の再生に戻るため、表示される動画および音響を視聴する視聴者に与える違和感が大きくなってしまう。このため、本実施形態では、代替データ生成処理(1)に続いて、以下に説明する代替データ生成処理(2)を実行する。
図5は、本実施形態における代替データ生成処理の概要を示す図である。また、図6は、図5に示す代替データ生成処理を行った場合に表示される映像の例を示す図である。図5に示す処理では、代替データ生成処理(1)において、N3が欠落し、N1およびN2がM1−M3へ平均化されたものとする。ここで、正常なN4が入力されるが、上記した理由から視聴者に与える違和感が大きくなってしまうため、データブロックN4はそのまま出力されない。代替データ生成部28は、代替データ生成処理(1)で平均化された代替データブロックM2、M3およびデータブロックN4のデータを、代替データブロックM4へ平均化する。なお、平均化処理の際、欠落したデータブロックN3に係るピクチャまたは音響は、平均化処理に伴う予測処理によって生成される。例えば、動画データの平均化処理においては、先述したフレーム間予測と同様の予測処理によって、欠落した動き(フレーム)が補完される。
このとき、代替データブロックM2およびM3の情報量は、通常のデータブロックに比較して2/3であるため、M4の情報量は、通常のデータブロックの(2/3+2/3+1)/3=7/9倍となる。即ち、M4に基づく出力は、代替データ生成処理が行われなかった場合の7/9倍の速度のスロー再生となる。この速度は、M1からM3に基づく出力信号が再生された場合の見た目の速度が通常の2/3倍であったのと比較して若干速い。以降、同様の方法で、代替データブロックM5、M6への平均化を行う。この際、再び入力データに欠落が発生しない限り、平均化に使用される新規入力データは常に通常の等倍の情報量を有するため、代替データブロックは徐々に通常の情報量、即ち、通常の速度に近づいていく(図6を参照)。本実施形態の場合、代替データブロックM5は通常の23/27倍の情報量(速度)、代替データブロックM6は通常の73/81倍の情報量(速度)となる(図5の計算式を参照)。
なお、図5に示す計算式では、再計算された代替データブロックを、「´(ダッシュ)」を付して示している。例えば、代替データブロックM5の生成に用いられているM3´は、代替データブロックM4の生成に伴う平均化処理において生成されたデータブロックである。このため、M3´の情報量は、代替データブロックM3の情報量が通常の2/3倍であるのと異なり、通常の7/9倍である。
上記代替データ生成処理(2)によって新規入力データを追加しながら代替データブロックへの平均化を行ったとしても、代替データブロックの生成方法がデータの平均化である以上、生成される代替データブロックの情報量が通常の等倍となることはない。即ち、見た目の再生速度が通常の再生速度に追いつかない状態が継続してしまうこととなる。そこで、本実施形態では、再生速度が所定速度(例えば73/81倍)以上となった場合、動画を構成するフレームの一致度をモニタし、一致度が所定値(例えば90%)以上のフレームが所定数(例えば5フレーム)続く期間を切り替えタイミングとして検出し、この切り替えタイミングで1倍速に変更する。これを代替データ生成処理(3)と称する。例えば、図5の例に拠れば、代替データブロックM6で73/81倍速に達するので、データブロックN7のフレームをサーチし、あるフレーム(Nフレーム)と該N+1以降のフレームとを比較し、一致度が90%から所定フレーム後のN+xフレームまでを画素単位で比較して相関を求め、一致度が所定値以上(例えば90%以上)の場合に、N+1フレームからN+xフレームまでを切り替えタイミングとして検出する。
該切り替えタイミングが検出された場合には、前述のとおり、音出力をミュートし、1倍速に切り替える。以降、次にデータの欠落が検出されるまで代替データ生成処理は行われず、入力データに基づく出力信号が出力される。
<処理フロー>
図7〜図9に、パーソナルコンピュータ10の処理フローを示す。図7は、本実施形態における信号出力処理の全体の流れを示すフローチャートである。本フローチャートに示される信号出力処理は、操作部18におけるテレビジョン視聴開始操作を検知部22が受信し、検知部22によって信号出力処理の開始指示が出力制御部21に対して出されたことによって実行される。
ステップS101では、放送受信部14より出力された3秒分のデータがバッファされる。バッファ部26は、放送受信部14より出力されたデータを、再生時間にして3秒分バッファする。その後、処理はステップS102へ進む。
ステップS102では、出力信号が生成される。出力信号生成部23は、バッファ部26より入力データを取得し、取得した入力データに基づいて、映像信号および音響信号を生成する。ここで、映像信号とは、動画表示に必要な各フレームのピクチャを含む情報である。その後、処理はステップS103へ進む。
ステップS103では、映像信号が遅延出力される。出力制御部21は、3秒分の入力データがバッファされた状態で、出力信号生成部23によって生成された映像信号および音響信号を、放送が受信された時間から3秒遅延させて、表示部40へ出力する。即ち、出力制御部21は、バッファ部26を利用して3秒間の遅延出力を行う。その後、処理はステップS104へ進む。
ステップS104では、データの欠落が監視される。検出部27は、バッファ部26によってバッファされた入力データに、情報不足のデータブロックがあるか否か、即ち、データの欠落の有無を監視する。データの欠落が発見されない場合、ステップS101からステップS104に示された処理が繰り返される。データの欠落が発見された場合、処理はステップS105へ進む。
ステップS105では、欠落を有するデータブロックが1つ(即ち、1秒分)であるか否かが判定される。検出部27は、ステップS104で検出された欠落部分を含むデータブロックを特定して、代替データ生成部28及び変更決定部31へ通知する。また、欠落の通知を受けた変更決定部31は、該欠落部分を含むデータブロックが1つであるか否かを判定する。ここで、欠落したデータブロックが1つであると判定した場合、スロー再生(本例では2/3倍)への再生速度の変更を決定し、ステップS108へ進む。一方、欠落したデータブロックが1つではない(2つ以上である)と判定した場合、これを出力制御部21に通知し、ステップS106へ進む。
ステップS106では、正常な表示が出来ない旨のメッセージが表示される。出力制御部21は、代替データ生成部28において代替データの生成ができないことを検知して、表示部40へ正常な表示が出来ない旨のメッセージを含む映像信号を出力する。これをうけて表示部40には正常な表示が出来ない旨のメッセージが表示され、視聴者は何らかの要因により視聴が出来ない状況となっていることを把握することが出来る。その後、処理はステップS107へ進む。
ステップS107では、正常なデータが受信されるまでの待機処理が行われる。放送受信部14によって正常なデータが受信された場合、処理はステップS101へ進み、映像の出力および表示が再開される。
ステップS108では、代替データ生成処理が行われる。代替データ生成部28は、バッファ部26によってバッファされた入力データより、欠落データブロックの後方、且つ出力制御部のその時点の出力に係るデータブロックの前方のデータブロックを変換用データブロックとして取得し、この変換用データブロックを、変換用データブロックに係る再生時間(本実施形態では2秒)に欠落部分のデータブロックの再生時間(本実施形態では1秒)を加えた再生時間(本実施形態では3秒)分の代替データブロックへ平均化し、代替データの生成を行う。代替データ生成処理の詳細については、図8を用いて後述する。その後、処理はステップS101へ進む。
図8,9は、本実施形態における代替データ生成処理の流れを示すフローチャートである。本フローチャートに示される代替データ生成処理は、図7に示されたステップS108に相当する。
ステップS201では、変換用データブロックが取得される。代替データ生成部28は、バッファ部26によってバッファされた入力データより、欠落しているデータブロックの1つ前および2つ前のデータブロック(即ち、2秒分のデータブロック)を、変換用データブロックとして取得する。図4を例として用いて説明すると、データブロックN5が欠落している場合、変換用データブロックとしてN3およびN4を取得する。その後、処理はステップS202へ進む。
ステップS202では、取得した変換用データブロックが使用可能であるか否かが判定される。代替データ生成部28は、ステップS201で取得した変換用データブロックが代替データの生成に使用可能な正常なデータブロックであるか否かを判定する。取得された変換用データブロックがデータの欠落部分を含む等、変換用データブロックとして使用出来ないと判定された場合、処理はステップS213へ進む。取得されたデータブロックが変換用データブロックとして使用出来ると判定された場合、処理はステップS203へ進む。
ステップS203では、変換用データブロックとして取得された2秒分のデータブロックが、3秒分の代替データブロックへ平均化される。代替データ生成部28は、変換用データブロックとして取得された2秒分のデータブロックを、変換用データブロックに係る再生時間(本実施形態では2秒)に欠落部分のデータブロックの再生時間(本実施形態では1秒)を加えた再生時間(本実施形態では3秒)分の代替データブロックへ平均化する。図4の例に拠れば、合わせて2秒分(2ブロック分)のデータブロックN3およびN4を、3秒分の代替データブロックM3、M4、M5へ平均化する。その後、処理はステップS204へ進む。
ステップS204では、代替データブロックに基づく映像信号が出力される。代替データ生成部28は、ステップS203で得られた代替データブロックM3、M4、M5に基づいて出力信号を生成する。生成された出力信号は、順次出力制御部21によって映像信号および音響信号として表示部40へ出力される。その後、処理はステップS205へ進む。
ステップS205では、次のデータブロックが取得される。代替データ生成部28は、バッファ部26より次に出力の対象となるデータブロックを取得する。その後、処理はステップS206へ進む。
ステップS206では、再生速度が所定値(例えば73/81倍)に達したか否かを変更決定部31が判定する。ここで、所定値は、スロー再生を終了しても視聴者に違和感を起こさせない程度の値に設定される。所定値以上の再生速度の場合、変更決定部31は、1倍速へ変更することを決定し、ステップS209へ進む。一方、再生速度が所定値未満である場合、変更決定部は、ステップS207へ進み、代替データ生成処理(2)を行って速度を上げる、即ち再生速度を1倍に近づけることを決定する。
ステップS207では、次の変換用データブロックが取得される。代替データ生成部28は、前回の代替データ生成処理で得られた3つの代替データブロックのうち前方(即ち、出力対象データブロックに近い側)の2つの代替データブロックを取得する。図5の例に拠れば、ステップS205で取得されたデータブロックN4に代えて出力される代替データブロックM4を得るために、代替データ生成部28は、前回の代替データ生成処理で得られた代替データブロックM2およびM3を取得する。その後、処理はステップS208へ進む。
ステップS208では、変換用データブロックおよび出力対象データブロックが、3秒分の代替データブロックへ平均化される。代替データ生成部28は、ステップS205およびステップS207で取得されたデータブロックを平均化することで、次の出力対象データブロックに代えて出力される代替データブロックを得る。図5の例に拠れば、データブロックN4に代えて出力される代替データブロックM4を得るために、代替データ生成部28は、データブロックN4、前回の代替データ生成処理で得られた代替データブロックM2およびM3を取得し、これらの3つのデータブロックを平均化することで、直前に出力された代替データブロックM3に連続して出力された場合に、視聴者にとって違和感を与えない代替データブロックM4を得る。その後、処理はステップS204へ進む。
そして、代替データ生成処理(2)を繰り返し、ステップS206で、再生速度が所定値以上と判定された場合、ステップS209で、切り替え検出部32がステップS205で取得したデータブロック(例えばN7)をサーチし、該データブロックの各フレーム(動画像)の一致度が所定値以上の期間を検出する(S210)。このように同じようなフレームが続いている場合には、音声も同じ状況が続いており、変化が少ないことが類推できるので、ここを再生スピードの切り替えタイミングとする。なお、切り替えタイミングを検出できなかった場合は、ステップS207へ進み、代替データ生成処理(2)を行い、次のデータブロックをサーチし(S209)、再度切り替えタイミングを検出する。
そして、この検出した期間内、即ち一致度が所定値以上のフレームの再生時に、ミュートを開始し(S211)、再生速度を1倍に切り替え(S212)、ミュートを解除する(S213)。即ち、ここで代替データ生成処理は終了し、以降は再びデータ欠落が発生するまで通常の出力処理が行われる。その後、本フローチャートに示された処理は終了し、図7のステップS101へ進む。
<変形例>
なお、本実施形態では、入力データは1秒単位のデータブロックを有し、3秒分のバッファを行い、代替データ生成は3ブロック単位で行われることとしているが、これらの値は、実施の形態によって適宜最適な値が選択されることが好ましい。例えば、入力データが0.5秒単位のデータブロックを有する場合、バッファ時間を2秒、代替データ生成を4ブロック単位とすれば、データの欠落を受けて生成される代替データブロックの初期情報量が通常の3/4倍となり、より視聴者に違和感を与えにくい補間を行うことが可能となる。
図7〜図9では、図2に示したパーソナルコンピュータ10の内部構成、すなわち、検知部22、放送受信部14、出力制御部21、出力信号生成部23、バッファ部26、検出部27、代替データ生成部28、および出力制御部21等をCPU11で実行されるプログラムで実現する例を示した。しかし、このような構成に代えて、<パーソナルコンピュータの概要構成>で説明したように、パーソナルコンピュータ10の内部構成のいずれか1以上をCPU11とは異なるプロセッサ、ハードウェア回路等によって実現してもよい。すなわち、CPU11の処理能力と、処理量によっては、図2のそれぞれの構成要素を異なるプロセッサ、あるいは、デジタル回路で構成すればよい。CPU11以外のプロセッサあるいはデジタル回路を含む場合であっても、それらの処理手順は、図7および図8に示したものと同様である。すなわち、本実施形態のパーソナルコンピュータ10は、CPU11のプログラムとして、あるいは、専用プロセッサによって、さらには、専用のデジタル回路によって実現できる。
<ユーザの操作による再生速度の切替え例>
上述の例では、データの欠落を検知して自動的に再生速度の切り替えを検出した場合に音出力をミュートしたが、ユーザの操作に応じて再生速度を切り替える場合にも音出力のミュートを行う。
図10はユーザ操作に応じた切り替え方法の説明図である。
まず、装置を起動し、入力データに基づいて動画を再生する(S301)。
次に、検知部22がユーザの操作、例えば再生(1倍)、早送り、スロー再生のボタンが押されたこと等を検知し、変更決定部31に通知する(S302)。
変更決定部31は、通知された操作が、現在の再生速度と異なる速度の再生であれば、再生速度の変更を決定し、切替検出部32及び出力制御部22に通知する(S303)。例えば、変倍速から1倍速、1倍速から変倍速、変倍速から異なる変倍速への切り替えを通知する。
この通知を契機に切替検出部32は、入力データをサーチし(S304)、動画を構成する各フレーム(動画像)の一致度が所定値以上の期間を切り替えタイミングとして検出し、これを出力制御部22へ通知する(S305)。なお、検出できなかった場合にはステップ304に戻って次のデータブロックをサーチする。
そして、これらフレームの再生を開始する際に、音制御部33が音出力のミュートを開始(フェードアウト)し(S306)、該ミュート開始後、出力制御部22が変更決定部から通知に従い再生速度を変更する(S307)。
出力制御部22は、このタイミングで、例えば、動画信号を1フレームおきに間引いて2倍速で再生している状態から、間引かずに全てのフレームを出力することに変えて1倍速にする、或は2フレームおきに出力することに変えて3倍速にする。また、同じフレームを2度づつ出力して1/2倍速で再生している状態から、各フレームを1度づつ出力することに変えて1倍速にする、或は各フレームを3度づつ出力することに変えて1/3倍速にする。
該再生速度の切り替え後、再生音制御部33が音出力のミュートを終了(フェードイン)させる(S308)。
このように本例によれば、再生速度を変更する際、一致度の高いフレームが連続する期間内に、ミュート開始、再生速度の切り替え、そしてミュートの解除を行うので、ノイズを発生させること無く適時に切り替えを行うことができる。
即ち、音のミュート中に切り替えを行うので、ノイズの発生が無い。そして、従来のように無音期間を待つのでは無く、一致度の高いフレームの連続を検出してミュートを行う、即ち無音期間を作成するので、適時に切り替えを行うことができる。更に、一致度の高いフレームの連続を検出して切り替えを行うので、違和感なく切り替えを行うことができる。また、一致度の高いフレームの連続している場合には、音声についても同じような状態がつづき、変動が少ないため、ミュート開始及びミュート解除を短い期間で行っても違和感が少なく、ノイズとして認識されることがない。
〈その他〉
本発明は、上述の図示例にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。また、上記構成要素は可能な限り組み合わせることができる。

Claims (12)

  1. 動画信号及び音信号を含む入力データの再生速度の変更を決定する変更決定部と、
    前記再生中に前記変更決定部が異なる再生速度への変更を決定した場合に、動画像の一致度が所定値以上の期間を切り替えタイミングとして検出する切り替え検出部と、
    前記入力データに基づいて音及び動画像を再生し、前記変更決定部によって再生速度の変更が決定された場合に、前記切り替えタイミングで再生速度を切り替える再生部と、
    前記切り替えタイミングで前記音信号に基づく音出力をミュートする音制御部と、
    を備えた音信号制御装置。
  2. 前記検出部が、動画信号のうち、Nフレームと該Nフレームから所定フレーム後のN+xフレームまでを比較して一致度が所定値以上の場合に、N+1フレームからN+xフレームまでを切り替えタイミングとして検出する請求項1に記載の音信号制御装置。
  3. 前記変更決定部が、1倍未満の再生速度から1倍速へ変更、或は1倍を超えた再生速度から1倍速へ変更した場合に、
    前記音制御部が、音出力をミュートする請求項1又は2に記載の音信号制御装置。
  4. 前記入力データの欠落を検出する欠落検出部と、
    前記欠落検出部によって前記入力データの欠落が検出された場合に、欠落が検出された部分を除く、欠落部分の前方の入力データおよび後方の入力データのうち少なくとも何れか一方の入力データを、該入力データに係る再生時間と該欠落部分に係る再生時間とを合わせた再生時間分のデータとして平均化することで代替データを生成する代替データ生成部と、を更に備え、
    前記検出部によって前記入力データの欠落が検出された場合に、前記変更決定部が1倍未満の再生速度への変更を決定し、前記再生部が、前記画像信号と前記代替データに基づいて音及び動画像を再生し、前記検出部によって前記入力データの欠落が検出されなくなった場合に、前記変更決定部が1倍の再生速度への変更を決定する請求項1から3の何れか1項に記載の音信号制御装置。
  5. 音及び動画像の再生装置が、
    動画信号及び音信号を含む入力データの再生速度の変更を決定するステップと、
    前記再生中に前記変更決定部が異なる再生速度への変更を決定した場合に、動画像の一致度が所定値以上の期間を切り替えタイミングとして検出するステップと、
    前記入力データに基づいて音及び動画像を再生し、前記変更決定部によって再生速度の変更が決定された場合に、前記切り替えタイミングで再生速度を切り替えるステップ、
    前記切り替えタイミングで前記音信号に基づく音出力をミュートするステップと、
    を実行する音信号制御方法。
  6. 前記動画信号のうち、Nフレームと該Nフレームから所定フレーム後のN+xフレームまでを比較して一致度が所定値以上の場合に、N+1フレームからN+xフレームまでを切り替えタイミングとして検出する請求項5に記載の音信号制御方法。
  7. 前記再生速度を1倍未満の再生速度から1倍速へ変更、或は1倍を超えた再生速度から1倍速へ変更した場合に、
    前記音出力をミュートする請求項5又は6に記載の音信号制御方法。
  8. 前記入力データの欠落を検出するステップと、
    前記欠落検出部によって前記入力データの欠落が検出された場合に、欠落が検出された部分を除く、欠落部分の前方の入力データおよび後方の入力データのうち少なくとも何れか一方の入力データを、該入力データに係る再生時間と該欠落部分に係る再生時間とを合わせた再生時間分のデータとして平均化することで代替データを生成するステップと、を更に備え、
    前記入力データの欠落が検出された場合に、1倍未満の再生速度への変更を決定し、前記画像信号と前記代替データに基づいて音及び動画像を再生し、前記入力データの欠落が検出されなくなった場合に、1倍の再生速度への変更を決定する請求項5から7の何れか1項に記載の音信号制御方法。
  9. 音及び動画像の再生装置に、
    動画信号及び音信号を含む入力データの再生速度の変更を決定するステップと、
    前記再生中に前記変更決定部が異なる再生速度への変更を決定した場合に、動画像の一致度が所定値以上の期間を切り替えタイミングとして検出するステップと、
    前記入力データに基づいて音及び動画像を再生し、前記変更決定部によって再生速度の変更が決定された場合に、前記切り替えタイミングで再生速度を切り替えるステップ、
    前記切り替えタイミングで前記音信号に基づく音出力をミュートするステップと、
    を実行させる音信号制御プログラム。
  10. 前記動画信号のうち、Nフレームと該Nフレームから所定フレーム後のN+xフレームまでを比較して一致度が所定値以上の場合に、N+1フレームからN+xフレームまでを切り替えタイミングとして検出する請求項9に記載の音信号制御プログラム。
  11. 前記再生速度を1倍未満の再生速度から1倍速へ変更、或は1倍を超えた再生速度から1倍速へ変更した場合に、
    前記音出力をミュートする請求項9又は10に記載の音信号制御プログラム。
  12. 前記入力データの欠落を検出するステップと、
    前記欠落検出部によって前記入力データの欠落が検出された場合に、欠落が検出された部分を除く、欠落部分の前方の入力データおよび後方の入力データのうち少なくとも何れか一方の入力データを、該入力データに係る再生時間と該欠落部分に係る再生時間とを合わせた再生時間分のデータとして平均化することで代替データを生成するステップと、を更に備え、
    前記入力データの欠落が検出された場合に、1倍未満の再生速度への変更を決定し、前記画像信号と前記代替データに基づいて音及び動画像を再生し、前記入力データの欠落が検出されなくなった場合に、1倍の再生速度への変更を決定する請求項9から11の何れか1項に記載の音信号制御プログラム。
JP2009534135A 2007-09-28 2007-09-28 音信号制御装置 Expired - Fee Related JP5141689B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2007/069053 WO2009040950A1 (ja) 2007-09-28 2007-09-28 音信号制御装置

Publications (2)

Publication Number Publication Date
JPWO2009040950A1 true JPWO2009040950A1 (ja) 2011-01-13
JP5141689B2 JP5141689B2 (ja) 2013-02-13

Family

ID=40510863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009534135A Expired - Fee Related JP5141689B2 (ja) 2007-09-28 2007-09-28 音信号制御装置

Country Status (6)

Country Link
US (1) US8634697B2 (ja)
EP (1) EP2202973A4 (ja)
JP (1) JP5141689B2 (ja)
KR (1) KR101189733B1 (ja)
CN (1) CN101809999B (ja)
WO (1) WO2009040950A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5701017B2 (ja) * 2010-11-09 2015-04-15 キヤノン株式会社 動画再生装置、動画再生方法、コンピュータプログラム、記憶媒体
JP6732547B2 (ja) * 2016-06-10 2020-07-29 キヤノン株式会社 撮像装置及びその制御方法
CN109845245B (zh) * 2016-08-19 2021-10-22 韩国斯诺有限公司 动态影像处理方法及计算机可读记录介质
US10119469B2 (en) 2016-09-15 2018-11-06 General Electric Company Method and apparatus for modularized inlet silencer baffles
US10722990B2 (en) 2016-09-15 2020-07-28 General Electric Company Method for installing and removing modularized silencer baffles
CN108278157B (zh) 2017-01-06 2022-08-02 通用电气公司 用于改进的入口消音挡板的系统和方法
CN108278158B (zh) 2017-01-06 2022-05-13 通用电气公司 用于改进的入口消音挡板的系统和方法
JP7490330B2 (ja) 2018-06-27 2024-05-27 三菱重工サーマルシステムズ株式会社 フィルタ清掃ユニット及び空気調和機
JP2022077231A (ja) * 2020-11-11 2022-05-23 キヤノン株式会社 音響処理装置、音響処理方法、およびプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06337696A (ja) 1993-05-28 1994-12-06 Matsushita Electric Ind Co Ltd 速度変換制御装置と速度変換制御方法
JPH0779411A (ja) * 1993-09-06 1995-03-20 Sony Corp 画像信号再生方法および画像信号再生装置、ならびに 画像信号記録媒体
JPH07212319A (ja) 1994-01-17 1995-08-11 Nec Eng Ltd ディジタル音声信号切替ノイズ抑圧装置
JPH0855384A (ja) * 1994-08-17 1996-02-27 Sony Corp 電子情報装置
US5915066A (en) * 1995-02-16 1999-06-22 Kabushiki Kaisha Toshiba Output control system for switchable audio channels
JP3602635B2 (ja) * 1995-02-16 2004-12-15 株式会社東芝 音声切換方法および再生装置
JP2004214902A (ja) 2002-12-27 2004-07-29 Matsushita Electric Ind Co Ltd ストリーミング再生携帯端末、ストリーミング再生方法、コンピュータプログラム、並びにコンピュータ読み取り可能な記録媒体
US7990479B2 (en) * 2004-05-21 2011-08-02 Panasonic Corporation Communication system and communication method
JP4501808B2 (ja) * 2005-08-02 2010-07-14 船井電機株式会社 再生装置
CN1992846A (zh) * 2005-12-30 2007-07-04 乐金电子(南京)有限公司 影像显示装置及其控制方法
US20090002556A1 (en) * 2007-06-11 2009-01-01 Picongen Wireless Inc. Method and Apparatus for Packet Insertion by Estimation

Also Published As

Publication number Publication date
EP2202973A4 (en) 2012-01-11
CN101809999A (zh) 2010-08-18
US8634697B2 (en) 2014-01-21
JP5141689B2 (ja) 2013-02-13
KR20100049655A (ko) 2010-05-12
WO2009040950A1 (ja) 2009-04-02
EP2202973A1 (en) 2010-06-30
KR101189733B1 (ko) 2012-10-10
US20100172633A1 (en) 2010-07-08
CN101809999B (zh) 2012-07-18

Similar Documents

Publication Publication Date Title
JP5141689B2 (ja) 音信号制御装置
JP5222543B2 (ja) テレビジョン装置
US20090154890A1 (en) Content replay apparatus, content playback apparatus, content replay method, content playback method, program, and recording medium
US20230186938A1 (en) Audio signal processing device and operating method therefor
JP5093233B2 (ja) 信号出力装置、情報機器、信号出力方法および信号出力プログラム
JP2009094796A (ja) テレビジョン受信機
JP2008177907A (ja) 動画データ復号装置、情報機器、動画データ復号方法および動画データ復号プログラム
JP4900246B2 (ja) タイムシフト視聴時に即時に提供すべき放送を優先する放送受信装置
JP2010152281A (ja) 音声再生装置
JP5071040B2 (ja) 情報処理装置、情報処理方法、プログラム並びに記録媒体
EP2568471A1 (en) A method for playing multimedia content, a related system and related playback module
JP5213630B2 (ja) 映像信号再生装置
JP2010258776A (ja) 音声信号処理装置
JP4323814B2 (ja) 映像処理装置
JP7314102B2 (ja) 制御信号生成回路、受信装置、システム、生成方法、およびプログラム
JP2005167423A (ja) 放送受信装置及び放送受信方法、音声出力装置及び音声出力方法
JP4385710B2 (ja) 音声信号処理装置及び音声信号処理方法
JP2006139829A (ja) 要約再生装置、要約再生方法、要約再生プログラムおよびそのプログラムが記録された情報記録媒体
JP2012244319A (ja) デジタル放送受信機
JP5228623B2 (ja) 放送映像再生方法、システム及び装置
JP5590018B2 (ja) 動画データ復号装置、情報機器、動画データ復号方法、動画データ復号プログラム
JP2008016882A (ja) 表示装置、表示制御方法、及び、表示制御プログラム
JP2006148194A (ja) 信号調整装置、信号調整方法、信号調整プログラム
JP2008301320A (ja) 記録再生装置及びプログラム
JP2012130077A (ja) 記録再生装置及びプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121023

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121105

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151130

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5141689

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees