JP6953771B2 - 再生装置 - Google Patents

再生装置 Download PDF

Info

Publication number
JP6953771B2
JP6953771B2 JP2017078106A JP2017078106A JP6953771B2 JP 6953771 B2 JP6953771 B2 JP 6953771B2 JP 2017078106 A JP2017078106 A JP 2017078106A JP 2017078106 A JP2017078106 A JP 2017078106A JP 6953771 B2 JP6953771 B2 JP 6953771B2
Authority
JP
Japan
Prior art keywords
audio data
data
sampling frequency
additional
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017078106A
Other languages
English (en)
Other versions
JP2018181391A (ja
Inventor
中田 英治
英治 中田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Funai Electric Co Ltd
Original Assignee
Funai Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Funai Electric Co Ltd filed Critical Funai Electric Co Ltd
Priority to JP2017078106A priority Critical patent/JP6953771B2/ja
Priority to US15/918,202 priority patent/US10871936B2/en
Publication of JP2018181391A publication Critical patent/JP2018181391A/ja
Application granted granted Critical
Publication of JP6953771B2 publication Critical patent/JP6953771B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Description

本発明は、BD(Blu−ray(登録商標) Disc)プレイヤー、DVD(Digital Versatile Disc)プレイヤー、HDD(hard disk drive)等の再生装置に関する。
米国のFCC(Federal Communications Commission:連邦通信委員会)では、全盲又は弱視者がデジタルビデオプレイヤー、デジタルビデオレコーダ等の映像機器に搭載された各機能を利用することができるように、OSD(On Screen Display:画面)のテキストデータメニューおよびシステムの状態を音声で読み上げるTTS(Text−to−Speech)と呼ばれる機能の搭載を義務付けている。このため、映像機器には、TTS機能の実装が要求される。
映像機器は、このTTS機能により、例えば、リモートコントローラ等を介してテレビの電源がオンされた際に、電源オンを示す音声を出力することができ、チャンネルが選択されたときに選択されたチャンネル番号および当該チャンネルで現在放送されている番組の内容等を示す音声を出力することができる。
特開2007−257701号公報
しかしながら、映像機器が再生するBD等のビデオデータに含まれる主音声データと、TTS機能による付加音声データとを混合する場合に、主音声データの再生速度と付加音声データの再生速度とが異なってしまうことがある。
そこで、本発明は、付加音声データの再生速度を主音声データの再生速度に同期させることができる再生装置を提供する。
上記目的を達成するため、本発明の一態様に係る再生装置は、主音声データを復号して第1音声データを出力する第1復号部と、付加音声データを復号して第2音声データを出力する第2復号部と、前記第1音声データと、前記第2音声データとを混合する合成部とを備え、前記第2復号部は、前記主音声データのサンプリング周波数と前記付加音声データのサンプリング周波数とが異なる場合に、前記主音声データのサンプリング周波数に対する前記付加音声データのサンプリング周波数の割合に基づいて前記付加音声データの再生速度を調節する。
このように、主音声データのサンプリング周波数と付加音声データのサンプリング周波数とが異なる場合に、第2復号部が主音声データのサンプリング周波数に基づいて付加音声データの再生速度を調節する。このため、この再生装置では、第1音声データと第2音声データとを合成部で混合する際に、主音声データの再生速度に付加音声データの再生速度を同期させた音声データを出力させることができる。
したがって、付加音声データの再生速度を主音声データの再生速度に同期させることができる。
また、本発明の一態様に係る再生装置において、前記第2復号部は、前記付加音声データのサンプリング周波数が前記主音声データのサンプリング周波数よりも大きい場合、前記付加音声データの再生速度を速くする。
この構成によれば、第2復号部は、付加音声データの再生速度を速くするため、主音声データと付加音声データとの再生速度を同期させることができる。
また、本発明の一態様に係る再生装置において、前記第2復号部は、前記付加音声データのサンプリング周波数が前記主音声データのサンプリング周波数よりも小さい場合、前記付加音声データの再生速度を遅くする。
この構成によれば、第2復号部は、付加音声データの再生速度を遅くするため、主音声データと付加音声データとの再生速度を同期させることができる。
また、本発明の一態様に係る再生装置において、さらに、前記付加音声データのサンプリング周波数を、前記主音声データのサンプリング周波数に調節できるか否かを判断する制御部を備え、前記付加音声データのサンプリング周波数を、前記主音声データのサンプリング周波数に調節できない場合、前記制御部は、前記主音声データのサンプリング周波数に対する前記付加音声データのサンプリング周波数の割合に基づいて前記付加音声データの再生速度を調節する。
このように、制御部が主音声データのサンプリング周波数に基づいて付加音声データの再生速度を調節することで、再生装置は、付加音声データの再生速度を主音声データの再生速度に同期させることができる。
また、本発明の一態様に係る再生装置において、前記合成部は、前記付加音声データの音声レベルが第1閾値以下である場合に、前記付加音声データの音声レベルを上げた前記第2音声データを生成する変換部を有する。
このように、付加音声データの音声レベルが第1閾値以下である場合に、第2プロセッサが付加音声データの音声レベルを上げた第2音声データを第1プロセッサに出力する。このため、付加音声データの音声レベルが主音声データの音声レベルよりも低い場合、第2プロセッサは、主音声データの音声レベルに近づくように、付加音声データの音声レベルを上げる。このため、全盲又は弱視者は、付加音声を聞き取りやすくなる。
また、本発明の一態様に係る再生装置において、前記付加音声データの音声レベルが前記第1閾値よりも高い第2閾値以上である場合に、前記変換部は、さらに、前記付加音声データの音声レベルを下げた前記第2音声データを生成する。
この構成によれば、付加音声データの音声レベルが主音声データの音声レベルに比べて高い場合、第2プロセッサは、主音声データの音声レベルに近づくように、付加音声データの音声レベルを下げる。このため、全盲又は弱視者は、主音声及び付加音声を聞き取りやすくなる。
なお、本発明は、このような特徴的な処理部を備える再生装置として実現することができるだけでなく、再生装置に含まれる特徴的な処理部が実行する処理をステップとする再生方法として実現することができる。また、再生装置に含まれる特徴的な処理部としてコンピュータを機能させるためのプログラムまたは再生方法に含まれる特徴的なステップをコンピュータに実行させるプログラムとして実現することもできる。そして、そのようなプログラムを、CD−ROM(Compact Disc−Read Only Memory)等のコンピュータ読み取り可能な非一時的な記録媒体やインターネット等の通信ネットワークを介して流通させることができるのは、言うまでもない。
本発明によれば、付加音声データの再生速度を主音声データの再生速度に同期させることができる。
図1は、実施の形態1、3に係る映像システムを示すブロック図である。 図2は、実施の形態1〜3に係る再生装置の制御部、第1復号部、第2復号部、合成部及び出力部を示すブロック図である。 図3は、実施の形態1〜3に係る映像システムの動作を示すシーケンス図である。 図4は、実施の形態2に係る再生装置を示すブロック図である。 図5は、実施の形態3に係る再生装置の動作を示すフローチャートである。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、独立請求項に記載されていない構成要素については、任意の構成要素として説明される。各図は、必ずしも各寸法または各寸法比等を厳密に図示したものではない。
なお、各図において、実質的に同一の構成に対しては同一の符号を付しており、重複する説明は省略又は簡略化する。
(実施の形態1)
[構成]
図1は、実施の形態1に係る映像システム1を示すブロック図である。図2は、実施の形態1に係る再生装置3の制御部10、第1復号部21、第2復号部22、合成部30及び出力部40を示すブロック図である。
図1に示すように、映像システム1は、再生装置3と、外部機器5とを備える。
再生装置3は、例えばブルーレイディスクプレイヤーであり、BD等に格納されたデータを再生する装置である。なお、再生装置3は、録画機能を有していてもよく、BD、DVD、HDD等の記憶媒体に記憶されているデータを再生するだけの機能に限定されない。外部機器5は、例えばテレビである。なお、外部機器5は、少なくとも音声を出力することが可能なオーディオ機器であればよく、テレビに限定されない。
再生装置3と外部機器5とは、例えばHDMI(登録商標)(High−Definition Multimedia Interface)ケーブルを介して相互に接続されている。HDMIケーブルは、HDMI規格に準拠したケーブルである。HDMI規格とは、映像および音声をデジタル信号で伝送する通信インタフェースの標準規格である。
再生装置3は、外部機器5を制御するための制御信号、外部機器5に音声および映像を出力させる属性情報を示す信号を外部機器5に送信する。制御信号は、例えば電源オン又は電源オフするためのコマンドを含む。このコマンドは、例えば再生装置3が有する後述するTTS機能の付加音声データに対応している。属性情報を示す信号には、TTS機能によりテキストデータが音声に変換された付加音声データが記憶媒体に記憶されている、主音声データおよび映像データを含む。なお、コマンドには、必ずしも対応するテキストデータが存在している訳ではない。
ここで、主音声データは、例えばMP3やAAC等の国際標準規格の圧縮方式によって圧縮されており、映像データは、H.264やMPEG4等のメディア統合系映像圧縮の映像データの圧縮方式によって圧縮されている。なお、主音声データ及び映像データは、これらの圧縮されたデータに限定されず、非圧縮のデータであってもよい。また、付加音声データは、PCM形式、WAV形式等の非圧縮音声データであってもよく、圧縮されたデータであってもよい。
図1及び図2に示すように、再生装置3は、制御部10と、第1復号部21と、第2復号部22と、合成部30と、入力部50と、出力部40と、図示しないドライバと、記憶部60とを有する。
制御部10は、ドライバ、第1復号部21、第2復号部22、合成部30、入力部50、記憶部60等の動作を制御する。
制御部10は、外部機器5又は入力部50から制御信号を受信した場合に、制御信号に基づいて再生装置3を制御する。制御信号は、例えば、HDMI規格における、複数のHDMI機器間でリンクするためのCEC(Consumer Electronics Control)に従って、複数のHDMI機器間で双方向にCEC通信される。このCEC通信により、例えば再生装置3の電源オンに連動して、外部機器5の電源オン及び入力切り替えを実現することができる。また、例えば、外部機器5のリモートコントローラで再生装置3を操作することもできる。
制御部10は、判断部11を有する。 判断部11は、記憶媒体から再生したデータに含まれる主音声データのサンプリング周波数と、記憶部60に記憶されている付加音声データのサンプリング周波数とから、第1復号部21が復号(デコード)した主音声データのサンプリング周波数に基づいて、付加音声データの再生速度を調節させる倍数を決定する。ここでいう付加音声データの再生速度の調節には、付加音声データの再生速度を主音声データの再生速度と一致させる場合だけでなく、付加音声データの再生速度を主音声データの再生速度に近づける場合も含む。
制御部10は、記憶媒体から再生したデータに含まれる主音声データから、主音声データを復号する種類を指定する第1デコードデータを生成する。制御部10は、ドライバが記憶媒体から再生したデータに含まれる主音声データと、第1デコードデータとを第1復号部21に出力する。
制御部10は、判断部11が決定した付加音声データの再生速度を調節させる倍数に関する情報と、付加音声データを復号する種類を指定する情報とを含めた第2デコードデータを生成する。制御部10は、制御信号に含まれるテキストデータに対応する付加音声データを記憶部60から決定し、この付加音声データと、第2デコードデータとを第2復号部22に出力する。
制御部10は、記憶媒体の動作を制御することが可能なプロセッサであり、記憶部60からロードされる、OSおよびプレーヤアプリケーションを実行する。制御部10は、具体的には、プロセッサ、マイクロコンピュータ、または専用回路などによって実現される。
第1デコードデータおよび第2デコードデータには、予め決められた複数種類の復号の中から、制御部10が指定した第1復号部21及び第2復号部22に所定の復号をさせるべきコマンドが含まれる。また、第2デコードデータには、さらに、主音声データのサンプリング周波数に基づいて、第2復号部22に付加音声データの再生速度を調節させるコマンドが含まれる。
第1復号部21は、ドライバから制御部10を介して入力された主音声データを復号して第1音声データを出力するデコーダである。ここで、主音声データは、予め決められた複数種類の圧縮符号化の中の任意の一つを用いて圧縮符号化されている。第1復号部21は、複数種類の圧縮符号化のそれぞれに対応するデコード機能を有している。第1復号部21は、制御部10が指定した復号をさせるべき種類の第1デコードデータを受信する。第1復号部21は、この第1デコードデータに基づいて、圧縮符号化の種類に対応したデコード機能を用いて復号し、第1音声データを生成する。第1復号部21は、生成した第1音声データを、合成部30の後述する第1プロセッサ31に出力する。
一例をあげると、第1復号部21に入力される主音声データのサンプリング周波数は、例えば32KHz、44.1KHz、48KHz、96KHz等である。第1復号部21は、主音声データのサンプリング周波数が48KHzである場合、第1デコードデータに基づいて、主音声データのサンプリング周波数を48KHzから96KHzに上げ(アップコンバート)てもよい。この場合、96KHzにサンプリング周波数が上げられた主音声データが第1音声データとなる。
第2復号部22は、制御部10から出力された付加音声データを復号して第2音声データを出力する。つまり、第2復号部22は、ドライバから制御部10を介して入力された付加音声データを、音声データに復号するデコーダである。
第2復号部22は、複数種類の圧縮符号化のそれぞれに対応するデコード機能を有している。第2復号部22は、制御部10が指定した復号をさせるべき種類の第2デコードデータを受信する。第2復号部22は、この第2デコードデータに基づいて、圧縮符号化の種類に対応したデコード機能を用いて復号し、第2音声データを生成する。具体的には、第2復号部22は、主音声データのサンプリング周波数と付加音声データのサンプリング周波数とが異なる場合に、主音声データのサンプリング周波数に基づいて付加音声データの再生速度を調節した第2音声データを生成する。第2復号部22は、生成した第2音声データを、合成部30の後述する図2の第2プロセッサ32に出力する。
第2復号部22は、付加音声データのサンプリング周波数が主音声データのサンプリング周波数よりも大きい場合、主音声データのサンプリング周波数に基づいて付加音声データの再生速度を速くする。また、第2復号部22は、付加音声データのサンプリング周波数が主音声データのサンプリング周波数よりも小さい場合、主音声データのサンプリング周波数に基づいて付加音声データの再生速度を遅くする。
一例をあげると、第2復号部22に入力される付加音声データのサンプリング周波数は、例えば12KHzである。第2復号部22は、主音声データのサンプリング周波数が96KHzである場合、付加音声データのサンプリング周波数を主音声データのサンプリング周波数に合わせるように96KHzにする。この場合、付加音声データの再生速度が8倍に速められてしまう。このため、第2復号部22は、第2デコードデータに基づいて、主音声データのサンプリング周波数に基づいて、付加音声データの再生速度を1/8倍にした第2音声データを生成する。
合成部30は、第1復号部21から出力される第1音声データと、第2復号部22から出力される第2音声データとを合成するミキシング処理を実行してオーディオ出力信号を生成する。
図1及び図2に示すように、合成部30は、第1復号部21から出力された第1音声データに所定の処理を行う第1プロセッサ31と、第2復号部22から出力された第2音声データに所定の処理を行う第2プロセッサ32とを有する。
第1プロセッサ31では第1復号部21から出力された第1音声データと、第2復号部22から第2プロセッサ32を介して出力された第2音声データとを合成し、ミキシング処理を施してオーディオ出力信号を生成する。合成部30が生成したオーディオ出力信号は、出力部40に送出され、出力部40からHDMIケーブルを介して外部機器5に出力される。
入力部50は、外部機器5の画面に表示された操作メニューの一覧の中から、利用者からの指示を受け付ける。入力部50は、例えば再生装置3の操作パネル又はリモートコントローラから出力されたコマンドを受付ける装置等でもある。
出力部40は、例えばAV(Audio−Visual)インタフェース(HDMI等)であり、外部機器5に属性情報等を送受信する。属性情報は、例えば、音声データおよび映像データを含む。
ドライバは、記憶媒体の規格に対応するオーディオ・ビデオコンテンツが格納された記憶媒体を駆動するためのドライブユニットであり、記憶媒体に対してデータの再生及び記録を行う。具体的には、ドライバは、記憶媒体にレーザを出射するレーザ光源、記憶媒体で反射したレーザを検出する光検出部等を有する光ピックアップ、記憶媒体を回転させるスピンドルモータ等の動作を制御する。ドライバは、例えば記憶媒体から再生したデータを制御部10に出力する。
記憶部60は、付加音声データ、プレーヤアプリケーション、オペレーティングシステム等を記憶している記憶媒体である。記憶部60内の記憶領域の一部は、ビデオメモリ(VRAM)として使用される。なお、必ずしも記憶部60内の記憶領域の一部をVRAMとして使用する必要はなく、記憶部60とは独立した専用のメモリをVRAMとして使用してもよい。
外部機器5は、再生装置3から制御信号を受信した場合に、制御信号に基づいて動作する。さらに、外部機器5は、再生装置3から制御信号に対応する音声データおよび映像データを受信した場合に、当該音声データおよび映像データに基づいて音声および映像を出力する。
[動作]
次に、以上のように構成された映像システム1の動作について、図1〜図3を用いて説明する。
図3は、実施の形態1〜3に係る映像システム1の動作を示すシーケンス図である。
図1〜図3に示すように、まず、制御部10は、再生装置3又は入力部50から制御信号を受信する。制御部10は、制御信号に対応する付加音声データを選択する(S1)。
次に、制御部10は、第1デコードデータと、ドライバが記憶媒体から再生したデータからオーディオの主音声データとを第1復号部21に出力し、第2デコードデータと、記憶部60の付加音声ファイルから選択された付加音声データとを第2復号部22に出力する(S2)。
次に、第1復号部21には、第1デコードデータと、ドライバが記憶媒体から再生したデータからオーディオの主音声データとが入力される(S11)。また、第2復号部22には、第2デコードデータと、記憶部60の付加音声ファイルから選択された付加音声データとが入力される(S21)。
次に、第1復号部21は、第1デコードデータに基づいて主音声データを復号し、第1音声データを出力する(S12)。また、第2復号部22は、第2デコードデータに基づいて付加音声データを復号し、第2音声データを出力する(S22)。ここで、第2復号部22は、第2デコードデータに基づいて付加音声データを復号するため、付加音声データの再生速度を主音声データのサンプリング周波数に基づいて再生速度を調節した第2音声データを出力する。
次に、第1音声データは、合成部30の第1プロセッサ31に入力され、第1プロセッサ31によって所定の処理が施される(S13)。また、第2音声データは、合成部30の第2プロセッサ32に入力され、第2プロセッサ32によって所定の処理が施されて、第1プロセッサ31に出力される(S23)。
次に、合成部30の第1プロセッサ31は、第1音声データと第2プロセッサ32から入力された第2音声データとを合成する(S14)。そして、第1プロセッサ31は、オーディオ出力信号を生成し、合成部30がオーディオ出力信号を出力する(S15)。
このオーディオ出力信号は、出力部40及びHDMIケーブルを介して外部機器5に入力される。そして、外部機器5は、オーディオ出力信号に基づいて音声を出力する(S3)。ここで外部機器5から出力された音声は、主音声データに付加音声データが付加された音声である。そして、このフローを終了する。
このように、第2復号部22が主音声データのサンプリング周波数に基づいて付加音声データの再生速度を調節するため、この再生装置3では、付加音声データの再生速度が主音声データの再生速度よりも速くなったり、遅くなったりすることが生じ難い。このため、全盲又は弱視者によるデジタル機器の操作をサポートするためのTTS機能を損ね難くなる。その結果、全盲又は弱視者は、確実に主音声データ及び付加音声データを認識することができる。
[作用効果]
次に、本実施の形態おける再生装置3の作用効果について説明する。
上述したように、本実施の形態に係る再生装置3は、主音声データを復号して第1音声データを出力する第1復号部21と、付加音声データを復号して第2音声データを出力する第2復号部22と、第1音声データと、第2音声データとを混合する合成部30とを備える。そして、第2復号部22は、主音声データのサンプリング周波数と付加音声データのサンプリング周波数とが異なる場合に、主音声データのサンプリング周波数に基づいて付加音声データの再生速度を調節する。
このように、主音声データのサンプリング周波数と付加音声データのサンプリング周波数とが異なる場合に、第2復号部22が主音声データのサンプリング周波数に基づいて付加音声データの再生速度を調節する。このため、この再生装置3では、第1音声データと第2音声データとを合成部30で混合する際に、主音声データの再生速度に付加音声データの再生速度を同期させた音声データを出力させることができる。
したがって、付加音声データの再生速度を主音声データの再生速度に同期させることができる。このため、全盲又は弱視者が再生装置3及び外部機器5を正しく操作することができる。
また、本実施の形態に係る再生装置3において、第2復号部22は、付加音声データのサンプリング周波数が主音声データのサンプリング周波数よりも大きい場合、付加音声データの再生速度を速くする。
この構成によれば、第2復号部22は、付加音声データの再生速度を速くするため、主音声データと付加音声データとの再生速度を同期させることができる。
また、本実施の形態に係る再生装置3において、第2復号部22は、付加音声データのサンプリング周波数が主音声データのサンプリング周波数よりも小さい場合、付加音声データの再生速度を遅くする。
この構成によれば、第2復号部22は、付加音声データの再生速度を遅くするため、主音声データと付加音声データとの再生速度を同期させることができる。
(実施の形態2)
[構成]
実施の形態2に係る映像システム1の構成について、図4を用いて説明する。
図4は、実施の形態2に係る再生装置300を示すブロック図である。
本実施の形態では、実施の形態1の第2復号部22の代わりに、TTSエンジン12のパラメータで付加音声データの再生速度を調節している点で実施の形態1と相違している。また、本実施の形態の映像システム1は、特に明記しない場合は、実施の形態1の映像システム1と同様であり、同一の構成については同一の符号を付して構成に関する詳細な説明を省略する。
図4に示すように、制御部10は、判断部11の他に、TTSエンジン12と、調節部313とを有する。
TTSエンジン12は、制御部10が予め有しているファームウェアに設けられ、複数のテキストデータのそれぞれを音声データに変換するプログラムである。TTSエンジン12は、外部機器5又は入力部50からの制御信号に含まれるテキストデータを付加音声データに変換して、合成部30に出力する。
TTSエンジン12は、TTS機能を有する。ここで、TTS機能とは、テキストデータを音声データに変換し、当該音声データを出力する機能である。本実施の形態では、TTS機能は、全盲又は弱視者によるデジタル機器の操作をサポートするための音声出力機能を意味する。より具体的には、TTS機能とは、再生装置300及び外部機器5との間で送受信される制御信号に対応する付加音声データを出力する機能を意味する。
判断部11は、記憶媒体から再生したデータに含まれる主音声データのサンプリング周波数と、TTSエンジン12が作成した付加音声データのサンプリング周波数とから、付加音声データの再生速度を主音声データのサンプリング周波数に基づいて、付加音声データの再生速度を調節させる倍数を決定する。
判断部11は、付加音声データのサンプリング周波数を、主音声データのサンプリング周波数に調節できるか否かを判断する。判断部11は、付加音声データのサンプリング周波数を、主音声データのサンプリング周波数に調節できないと判断した場合に、調節部313に主音声データのサンプリング周波数に関するデータを出力する。
調節部313は、第2音声データの再生速度を調節する周波数変換回路、プログラム等である。調節部313は、入力された主音声データのサンプリング周波数に関するデータに基づいて、第1音声データのサンプリング周波数に基づいて第2音声データの再生速度を調節する。
第2音声データの再生速度を調節について説明する。TTSエンジン12は、API(Application Programming Interface)を用いて、付加音声データを、文字列をPCM(pulse code modulation)音声データに変換する。具体的には、TTSエンジン12は、付加音声データにおける、文字列、音量、再生速度、音高、サンプリング周波数、言語(日本語、英語等)等を指定することで、所望のPCM音声データを出力する。出力されたPCM音声データは、合成部30に入力される。本実施の形態において、TTSエンジン12は、第2復号部の一例である。
制御部10の判断部11は、TTSエンジン12が付加音声データのサンプリング周波数を変換することができるか否かを判断する。具体的には、判断部11は、制御部10のTTSエンジン12のライブラリを用いて、主音声データのサンプリング周波数の倍数となる付加音声データを作成できない場合がある。これは、制御部10のメモリ容量の制限等から、テキストデータから付加音声データに調節できるサンプリング周波数は限られているため、全ての主音声データのサンプリング周波数に調節するように付加音声データのサンプリング周波数を変換することは困難である。
このため、付加音声データのサンプリング周波数を主音声データのサンプリング周波数に調節できないと、判断部11が判断した場合に、制御部10のTTSエンジン12は、主音声データのサンプリング周波数に基づいて付加音声データの再生速度を調節する。付加音声データの再生速度の調節は、TTSエンジン12のライブラリによって行われる。
[作用効果]
次に、本実施の形態おける再生装置300の作用効果について説明する。
上述したように、本実施の形態に係る再生装置300は、さらに、付加音声データのサンプリング周波数を主音声データのサンプリング周波数に調節できるか否かを判断する制御部10を備える。そして、付加音声データのサンプリング周波数を主音声データのサンプリング周波数に調節できない場合、制御部10は、主音声データのサンプリング周波数に基づいて付加音声データの再生速度を調節する。
このように、制御部10のTTSエンジン12が主音声データのサンプリング周波数に基づいて付加音声データの再生速度を調節することで、再生装置300は、付加音声データの再生速度を主音声データの再生速度に同期させることができる。
本実施の形態における他の作用効果についても、実施の形態1等と同様の作用効果を奏する。
(実施の形態3)
[構成]
実施の形態3に係る映像システム1の構成について図1及び図2を用いて説明する。
本実施の形態では、第2プロセッサ32が付加音声データの音声レベルを調節する点で実施の形態1と相違している。また、本実施の形態の映像システム1は、特に明記しない場合は、実施の形態1の映像システム1と同様であり、同一の構成については同一の符号を付して構成に関する詳細な説明を省略する。
第2復号部22は、付加音声データの音声レベルを算出して音声レベルを示す情報と、第2音声データとを生成し、音声レベルを示す情報及び第2音声データを第2プロセッサ32に出力する。ここでいう音声レベルとは、音声のボリュームである。
合成部30は、付加音声データの音声レベルが第1閾値以下である場合に、付加音声データの音声レベルを上げた第2音声データを生成する第2プロセッサ32を有する。第2プロセッサ32は、付加音声データの音声レベルが第1閾値以下であるか否かを判断し、音声レベルを調節した第2音声データを生成する。
具体的には、音声レベルを示す情報に基づいて付加音声データの音声レベルが第1閾値以下であると、第2プロセッサ32が判断した場合、第2プロセッサ32は、付加音声データの音声レベルを上げた第2音声データを生成し、この第2音声データを出力する。つまり、付加音声データの音声レベルが小さく、聞き取り辛くなっていることが考えられるため、第2プロセッサ32は、付加音声データの音声レベルを上げる。
また、音声レベルを示す情報に基づいて付加音声データの音声レベルが第1閾値よりも高い第2閾値以上であると、第2プロセッサ32が判断した場合、第2プロセッサ32は、付加音声データの音声レベルを下げた第2音声データを生成し、この第2音声データを出力する。つまり、付加音声データの音声レベルが大きすぎることが考えられるため、第2プロセッサ32は、付加音声データの音声レベルを下げる。
[動作]
次に、以上のように構成された再生装置3における第2復号部22と第2プロセッサ32の動作について図1、図2及び図5を用いて説明する。ここでは、第2復号部22に入力された付加音声データから第2プロセッサ32が音声レベルを調節した第2音声データを出力するまでの動作を示す。図5は、実施の形態3に係る再生装置3の動作を示すフローチャートである。
図1、図2及び図5に示すように、まず、第2復号部22は、制御部10から入力された付加音声データの音声レベルを算出して音声レベルを示す情報と、第2音声データとを生成し、音声レベルを示す情報及び第2音声データを出力する(S31)。
次に、音声レベルを示す情報及び第2音声データは、第2プロセッサ32に入力される。そして、第2プロセッサ32は、付加音声データの音声レベルが第1閾値以下であるか否かを判断する(S32)。
次に、付加音声データの音声レベルが第1閾値以下であると、第2プロセッサ32が判断した場合(S32ではYES)、第2プロセッサ32は、付加音声データの音声レベルを上げた第2音声データを生成し、第2音声データを出力する(S33)。このステップでは、例えば第2プロセッサ32は、付加音声データの音声レベルを、主音声データの音声レベル程度まで上げてもよい。そして、付加音声データの音声レベルを調節した第2音声データは、第1プロセッサ31に入力され、このフローは終了する。
一方、付加音声データの音声レベルが第1閾値よりも高いと、第2プロセッサ32が判断した場合(S32ではNO)、第2プロセッサ32は、付加音声データの音声レベルが第2閾値以下であるか否かを判断する(S34)。
付加音声データの音声レベルが第2閾値よりも高いと、第2プロセッサ32が判断した場合(S34ではNO)、第2プロセッサ32は、付加音声データの音声レベルを下げた第2音声データを生成し、第2音声データを出力する(S35)。このステップS35では、例えば第2プロセッサ32は、付加音声データの音声レベルを、主音声データの音声レベル程度まで下げてもよい。そして、第2プロセッサ32が付加音声データの音声レベルを調節した第2音声データは、第1プロセッサ31に入力され、このフローは終了する。
一方、付加音声データの音声レベルが第2閾値以下であると、第2プロセッサ32が判断した場合(S34ではYES)、第2プロセッサ32が付加音声データの音声レベルを調節せずに、第2音声データを生成し、第2音声データを第1プロセッサ31に出力し、このフローは終了する。
なお、このフローは、図3のステップS21及びステップS22の間で行われてもよい。
[作用効果]
次に、本実施の形態おける再生装置3の作用効果について説明する。
上述したように、本実施の形態に係る再生装置3において、合成部30は、付加音声データの音声レベルが第1閾値以下である場合に、付加音声データの音声レベルを上げた第2音声データを生成する第2プロセッサ32を有する。
このように、付加音声データの音声レベルが第1閾値以下である場合に、第2プロセッサ32が付加音声データの音声レベルを上げた第2音声データを第1プロセッサ31に出力する。このため、付加音声データの音声レベルが主音声データの音声レベルよりも低い場合、第2プロセッサ32は、主音声データの音声レベルに近づくように、付加音声データの音声レベルを上げる。このため、全盲又は弱視者は、付加音声を聞き取りやすくなる。
また、本実施の形態に係る再生装置3において、付加音声データの音声レベルが第1閾値よりも高い第2閾値以上である場合に、第2プロセッサ32は、さらに、付加音声データの音声レベルを下げた第2音声データを生成する。
この構成によれば、付加音声データの音声レベルが主音声データの音声レベルに比べて高い場合、第2プロセッサ32は、主音声データの音声レベルに近づくように、付加音声データの音声レベルを下げる。このため、全盲又は弱視者は、主音声及び付加音声を聞き取りやすくなる。
本実施の形態における他の作用効果についても、実施の形態1等と同様の作用効果を奏する。
(その他変形例等)
以上、本発明の1つまたは複数の態様に係る再生装置について、実施の形態に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の1つまたは複数の態様の範囲内に含まれてもよい。
例えば、上記各実施の形態3において、第2プロセッサは、主音声データの音声レベルに対する付加音声データの音声レベルの比が所定の閾値以下であれば、付加音声データの音量を上げるように第2復号部を制御してもよい。この場合、主音声データの音声レベルに対して、付加音声データの音量が小さすぎると考えられるため、第2プロセッサは、付加音声データの音声レベルを、主音声データの音声レベル程度まで上げてもよい。
また、上記各実施の形態1〜3において、付加音声の再生速度が早い場合又は遅い場合、音量が大きい場合又は小さい場合により、付加音声を聞き取りにくい場合には、ユーザが入力部又はリモートコントローラを介して付加音声の再生速度を調節したり、付加音声の音量を調節したりすることができてもよい。
また、上記各実施の形態1〜3において、制御装置及び外部機器は、有線接続されていたが、無線接続であってもよい。
また、上記各実施の形態1〜3において、再生装置及び外部機器は、HDMI規格に従って接続されていたが、HDMI規格とは異なる規格等に従って接続されてもよい。例えば、再生装置及び外部機器は、HDMI規格の代わりに、DLNA(登録商標)(Digital Living Network Alliance)ガイドラインに従って接続されてもよい。
また、上記の各装置は、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクドライブ、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムとして構成されても良い。RAMまたはハードディスクドライブには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
さらに、上記の各装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしても良い。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、例えば、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムを含む。この場合、ROMには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、システムLSIは、その機能を達成する。
さらにまた、上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されているとしても良い。ICカードまたはモジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。ICカードまたはモジュールは、上記の超多機能LSIを含むとしても良い。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、ICカードまたはモジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしても良い。
また、本発明は、上記に示す方法であるとしても良い。また、本発明は、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしても良いし、上記コンピュータプログラムからなるデジタル信号であるとしても良い。
さらに、本発明は、上記コンピュータプログラムまたは上記デジタル信号をコンピュータ読み取り可能な非一時的な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray Disc)、半導体メモリなどに記録したものとしても良い。また、これらの非一時的な記録媒体に記録されている上記デジタル信号であるとしても良い。
また、本発明は、上記コンピュータプログラムまたは上記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしても良い。
また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、上記メモリは、上記コンピュータプログラムを記憶しており、上記マイクロプロセッサは、上記コンピュータプログラムに従って動作するとしても良い。
また、上記プログラムまたは上記デジタル信号を上記非一時的な記録媒体に記録して移送することにより、または上記プログラムまたは上記デジタル信号を、上記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしても良い。
さらに、上記実施の形態及び上記変形例をそれぞれ組み合わせるとしても良い。
本発明に係る再生装置は、テレビにケーブルで接続されるデジタルビデオプレイヤー等に利用することができる。
3、300 再生装置
10 制御部
12 TTSエンジン(第2復号部)
21 第1復号部
22 第2復号部
30 合成部
32 第2プロセッサ(変換部)

Claims (6)

  1. 主音声データを復号して第1音声データを出力する第1復号部と、
    付加音声データを復号して第2音声データを出力する第2復号部と、
    前記第1音声データと、前記第2音声データとを混合する合成部とを備え、
    前記第2復号部は、前記主音声データのサンプリング周波数と前記付加音声データのサンプリング周波数とが異なる場合に、前記主音声データのサンプリング周波数に対する前記付加音声データのサンプリング周波数の割合に基づいて前記付加音声データの再生速度を調節する
    再生装置。
  2. 前記第2復号部は、前記付加音声データのサンプリング周波数が前記主音声データのサンプリング周波数よりも大きい場合、前記付加音声データの再生速度を速くする
    請求項1に記載の再生装置。
  3. 前記第2復号部は、前記付加音声データのサンプリング周波数が前記主音声データのサンプリング周波数よりも小さい場合、前記付加音声データの再生速度を遅くする
    請求項1に記載の再生装置。
  4. さらに、前記付加音声データのサンプリング周波数を、前記主音声データのサンプリング周波数に調節できるか否かを判断する制御部を備え、
    前記付加音声データのサンプリング周波数を、前記主音声データのサンプリング周波数に調節できない場合、前記制御部は、前記主音声データのサンプリング周波数に対する前記付加音声データのサンプリング周波数の割合に基づいて前記付加音声データの再生速度を調節する
    請求項1〜3のいずれか1項に記載の再生装置。
  5. 前記合成部は、前記付加音声データの音声レベルが第1閾値以下である場合に、前記付加音声データの音声レベルを上げた前記第2音声データを生成する変換部を有する
    請求項1〜4のいずれか1項に記載の再生装置。
  6. 前記付加音声データの音声レベルが前記第1閾値よりも高い第2閾値以上である場合に、前記変換部は、さらに、前記付加音声データの音声レベルを下げた前記第2音声データを生成する
    請求項5に記載の再生装置。
JP2017078106A 2017-04-11 2017-04-11 再生装置 Active JP6953771B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017078106A JP6953771B2 (ja) 2017-04-11 2017-04-11 再生装置
US15/918,202 US10871936B2 (en) 2017-04-11 2018-03-12 Playback device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017078106A JP6953771B2 (ja) 2017-04-11 2017-04-11 再生装置

Publications (2)

Publication Number Publication Date
JP2018181391A JP2018181391A (ja) 2018-11-15
JP6953771B2 true JP6953771B2 (ja) 2021-10-27

Family

ID=63710957

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017078106A Active JP6953771B2 (ja) 2017-04-11 2017-04-11 再生装置

Country Status (2)

Country Link
US (1) US10871936B2 (ja)
JP (1) JP6953771B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6930185B2 (ja) * 2017-04-04 2021-09-01 船井電機株式会社 制御方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4896337A (en) * 1988-04-08 1990-01-23 Ampex Corporation Adjustable frequency signal generator system with incremental control
KR920002000B1 (ko) * 1989-06-05 1992-03-09 삼성전자 주식회사 오디오 메모리디스크 재생장치
EP0598514B1 (en) * 1992-11-18 1999-12-29 Canon Information Systems, Inc. Method and apparatus for extracting text from a structured data file and converting the extracted text to speech
JP3462603B2 (ja) * 1994-11-24 2003-11-05 パイオニア株式会社 ミキシング装置及びミキシング方法
JPH11213557A (ja) * 1998-01-26 1999-08-06 Sony Corp 再生装置
US7024363B1 (en) * 1999-12-14 2006-04-04 International Business Machines Corporation Methods and apparatus for contingent transfer and execution of spoken language interfaces
JP2002093055A (ja) * 2000-07-10 2002-03-29 Matsushita Electric Ind Co Ltd 信号処理装置、信号処理方法、及び光ディスク再生装置
JP3973522B2 (ja) * 2002-09-19 2007-09-12 三洋電機株式会社 コンテンツ編集装置
JP3761522B2 (ja) * 2003-01-22 2006-03-29 パイオニア株式会社 音声信号処理装置および音声信号処理方法
JP2005003795A (ja) * 2003-06-10 2005-01-06 Nissan Motor Co Ltd 車載情報提供装置
US7609947B2 (en) * 2004-09-10 2009-10-27 Panasonic Corporation Method and apparatus for coordinating playback from multiple video sources
JP4968506B2 (ja) * 2005-03-04 2012-07-04 ソニー株式会社 再生装置、再生方法、およびプログラム
EP1739676A1 (en) * 2005-06-29 2007-01-03 Hitachi, Ltd. Digital broadcasting receiving device and digital information receiving device, and playback method
JP2007013358A (ja) * 2005-06-29 2007-01-18 Hitachi Ltd デジタル放送受信装置
TWI314015B (en) * 2005-10-28 2009-08-21 Novatek Microelectronics Corp Digital audio/video playback system capable of controlling audio and video playback speed
JP2007257701A (ja) 2006-03-22 2007-10-04 Toshiba Corp 再生装置
KR101334366B1 (ko) * 2006-12-28 2013-11-29 삼성전자주식회사 오디오 배속 재생 방법 및 장치
JP4952469B2 (ja) * 2007-09-19 2012-06-13 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
EP2404444A4 (en) * 2009-03-03 2013-09-04 Ct De Rech Inf De Montreal Crim ADAPTIVE VIDEO DESCRIPTION PLAYER
JP2011064961A (ja) * 2009-09-17 2011-03-31 Toshiba Corp 音声再生装置および方法
WO2013102799A1 (en) * 2012-01-06 2013-07-11 Sony Ericsson Mobile Communications Ab Smart automatic audio recording leveler
JP2017021882A (ja) * 2015-07-15 2017-01-26 パイオニア株式会社 再生制御装置、再生制御方法及び再生制御用プログラム

Also Published As

Publication number Publication date
US20180293046A1 (en) 2018-10-11
JP2018181391A (ja) 2018-11-15
US10871936B2 (en) 2020-12-22

Similar Documents

Publication Publication Date Title
CN101129069B (zh) 转发器装置及其控制方法
EP2346045A2 (en) Multi-channel audio data output control apparatus, output controlling method, program, and output control system
RU2437141C2 (ru) Композиция локального интерфейса пользователя с удаленно сгенерированным интерфейсом пользователя и аудиовизуальными данными
JPWO2019069482A1 (ja) 映像表示システム及び映像表示方法
EP3654656B1 (en) Video display system and video display method
JP6953771B2 (ja) 再生装置
JP7226335B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP6930185B2 (ja) 制御方法
US7535516B2 (en) Data reproduction apparatus reducing power consumption of equipment reproducing video image and method of controlling the same
WO2010038607A1 (ja) 映像音声再生システム、av増幅装置およびプログラム
EP2720472A9 (en) Recording and reproduction device and method for controlling the same
KR100408297B1 (ko) 영상신호 처리 시스템에서의 특수 효과 발생 방법 및 장치
JP4391450B2 (ja) 再生装置、コンテンツ記録媒体、再生装置の制御方法、制御プログラムおよび記録媒体
JP2019121037A (ja) 情報処理装置、情報処理方法およびプログラム
KR102128907B1 (ko) Dsd 오디오 파일을 재생하기 위한 장치 및 그 방법
JP2008058369A (ja) 映像信号出力装置及び音声信号出力装置
JP4551372B2 (ja) コンテンツ記録装置およびコンテンツ記録方法
JP2008130118A (ja) 音声再生システムおよびこれを構成するパーソナルコンピュータ、制御プログラム
KR100597009B1 (ko) 메뉴화면을 일관성 있게 생성할 수 있는 영상재생장치 및그 메뉴화면 생성방법
KR101619878B1 (ko) I2s 전송 방식을 이용하여 dsd 오디오 파일을 재생하기 위한 장치 및 그 방법
KR100598070B1 (ko) 포토 앨범 작성 기능을 갖는 광 기록기기 및 그 방법
JP2008098959A (ja) 再生装置および放送受信装置
KR20050119281A (ko) 부팅음악을 출력하는 디지털전자기기 및 그 방법
JP2007221814A (ja) 再生装置、記録媒体、及びこれらを用いた文字表示方法
JP2009182884A (ja) 無線機器、受信機器及び無線通信システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210913

R150 Certificate of patent or registration of utility model

Ref document number: 6953771

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150