JPWO2012104952A1 - 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法 - Google Patents

音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法 Download PDF

Info

Publication number
JPWO2012104952A1
JPWO2012104952A1 JP2012555583A JP2012555583A JPWO2012104952A1 JP WO2012104952 A1 JPWO2012104952 A1 JP WO2012104952A1 JP 2012555583 A JP2012555583 A JP 2012555583A JP 2012555583 A JP2012555583 A JP 2012555583A JP WO2012104952 A1 JPWO2012104952 A1 JP WO2012104952A1
Authority
JP
Japan
Prior art keywords
voice
audio
reading
output
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012555583A
Other languages
English (en)
Other versions
JP5677470B2 (ja
Inventor
拓真 足立
拓真 足立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2012555583A priority Critical patent/JP5677470B2/ja
Publication of JPWO2012104952A1 publication Critical patent/JPWO2012104952A1/ja
Application granted granted Critical
Publication of JP5677470B2 publication Critical patent/JP5677470B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • H04N5/602Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for digital sound signals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3626Details of the output of route guidance instructions
    • G01C21/3629Guidance using speech or audio output, e.g. text-to-speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • H04N21/4363Adapting the video stream to a specific local network, e.g. a Bluetooth® network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4398Processing of audio elementary streams involving reformatting operations of audio signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L2013/021Overlap-add techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4396Processing of audio elementary streams by muting the audio signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

テレビは、シアター機器が音声ミュート状態であるか否かを、音声ミュート状態取得コマンドおよび音声ミュート状態通知コマンドを用いて検出する。シアター機器が音声ミュート状態であると、音声ミュート状態でなくなるまで、読上げ音声信号を含まない放送音声信号のみからなる合成音声信号をシアター機器へ出力する。音声ミュート状態でなくなると、合成音声信号に読上げ音声信号を重畳してシアター機器へ出力する。合成音声信号をテレビからシアター機器へ出力中に、シアター機器が音声ミュート状態に切り替わると、テレビは読上げ音声信号を含まない合成音声信号の出力に切り替え、シアター機器が音声ミュート状態でなくなると、読上げ音声信号を所定部分から重畳した合成音声信号をシアター機器へ出力する。

Description

テレビまたはレコーダ等の音声読上げ装置をホームシアターシステム(以下、単にシアター機器と記載)等の音声出力装置に接続して、音声出力装置が音声読上げ装置から入力された合成音声信号を出力する技術に関し、特に、合成音声信号に重畳された読上げ音声信号を途切れなく出力することのできる技術に関する。
テレビとシアター機器とを光デジタルケーブルで接続して、テレビの音声をシアター機器のスピーカから出力するシステムが近年増えている。たとえば、特許文献1(特開2010−205136号公報)は、文字を音声読上げする音声読上げ装置を開示する。この特許文献1には、音声出力装置と音声読上げ装置とを専用線またはネットワークを介して接続する場合は、音声読上げ装置が、音声出力したい読上げ音声信号を専用線またはネットワークを介して外部の音声出力装置へ出力すればよいことを開示する。このような技術を、音声読上げ装置であるテレビと音声出力装置であるシアター機器とに適用することが考えられる。
日本国公開特許公報「特開2010−205136号公報」
しかしながら、特許文献1に開示された技術では、音声読上げ装置(テレビ)と音声出力装置(シアター機器)とは非同期で動作しており、音声読上げ装置は音声出力装置の音声出力状態を考慮しないで、放送等の音声信号に読上げ音声信号を重畳して合成音声信号として音声出力装置へ送信する。音声出力装置においては、音声読上げ装置から入力される合成音声信号が、たとえばAAC(Advanced Audio Coding)からリニアPCM(Pulse Code Modulation)へ変化した場合は、音声出力装置の内部に設けられたデコーダの設定をAACからPCMに切り替えるために音声が出力できない音声ミュート状態になる。このように音声読み上げ装置が出力する合成音声信号の圧縮の種類または有無が変化し得る場合の典型例として、同じチャンネルでの番組の切替わりや、チャンネルを切換えることにより生じる番組の切替わりに伴う場合が挙げられる。上述のように非同期で動作すると、このような音声ミュート状態であっても、読上げ音声信号は合成音声信号に重畳されて音声出力装置へ送信されるために、音声出力装置から出力される読上げ音声信号に頭切れが発生してしまう。このように、従来の技術では、送信した読上げ音声信号の一部が音声出力されない問題(頭切れしてしまう問題)、または、送信した読上げ音声信号全部が音声出力されない問題がある。
本発明は、上述した問題点を解決するためになされたものであって、その目的は、テレビまたはレコーダ等の音声読上げ装置をシアター機器等の音声出力装置に接続した場合に、途切れさせることなく読上げ音声信号を出力する技術を提供することである。
本発明の第1の局面に係る音声出力システムは、以下の音声読上げ装置および音声出力装置を含む。
音声読上げ装置は、読上げ音声信号を出力する音声出力装置とネットワークで接続される。この音声読上げ装置は、文字情報から読上げ音声信号を生成する音声信号生成部と、ネットワークを介して、音声出力装置から音声出力可否情報を受信する第1情報受信部と、ネットワークを介して、音声信号生成部が生成した読上げ音声信号を音声出力装置へ送信する第1情報送信部と、第1情報受信部が音声出力不可を示す音声出力可否情報を受信した場合に、音声出力可を示す音声出力可否情報を受信するまで第1情報送信部に読上げ音声信号の送信を待機させ、第1情報受信部が音声出力可を示す音声出力可否情報を受信した場合に、第1情報送信部に前記読上げ音声信号を送信させる第1制御部と、を具備することを特徴とする。
音声出力装置は、合成音声信号を出力する音声読上げ装置とネットワークで接続される。この音声出力装置は、音声読上げ装置から合成音声信号を受信する音声信号入力部と、音声読上げ装置から音声状態取得要求を受信する第2情報受信部と、音声出力可否情報を音声読上げ装置へ送信する第2情報送信部と、音声信号入力部が受信した合成音声信号をデコードするデコード部と、デコード部がデコードした合成音声信号を出力する音声出力部と、第2情報受信部が音声状態取得要求を受信した場合に、デコード部が合成音声信号をデコードできるか否かに応じて音声出力可否情報を生成して第2情報送信部に送信させるとともに、音声出力可否情報に応じて音声出力部の合成音声信号の出力を制御する第2制御部と、を具備することを特徴とする。
本発明の第2の局面に係る音声出力システムは、以下の音声読上げ装置および音声出力装置を含む。
音声読上げ装置は、読上げ音声信号を出力する音声出力装置とネットワークで接続される。この音声読上げ装置は、ネットワークを介して、音声出力装置へ文字情報及び読上げ状態通知要求を送信する第1情報送信部と、ネットワークを介して、音声出力装置から読上げ状態通知応答を受信する第1情報受信部と、第1情報受信部が文字情報受理を示す読上げ状態通知応答を受信するまで第1情報送信部に文字情報を送信させ続け、第1情報受信部が読上げ完了を示す読上げ状態通知応答を受信するまで第1情報送信部に読上げ状態通知要求を送信させ続ける第1制御部と、を具備することを特徴とする。
音声出力装置は、文字情報を出力する音声読上げ装置とネットワークで接続される。この音声出力装置は、放送音声信号を受信する音声信号入力部と、ネットワークを介して、音声読上げ装置から文字情報及び読上げ状態通知要求を受信する第2情報受信部と、ネットワークを介して、音声読上げ装置へ読上げ状態通知応答を送信する第2情報送信部と、音声信号入力部が受信した放送音声信号をデコードするデコード部と、第2情報受信部が受信した文字情報から読上げ音声信号を生成する音声信号生成部と、デコード部がデコードした放送音声信号と音声信号生成部が生成した読上げ音声信号を合成して合成音声信号を生成する合成音声信号生成部と、合成音声信号生成部が生成した合成音声信号を出力する音声出力部と、第2情報受信部が読上げ状態通知要求を受信した場合において文字情報の受信が完了した場合は文字情報受理を示す読上げ状態通知応答を第2情報送信部に送信させ、音声出力部が読上げ音声信号の出力を完了させた場合は読上げ完了を示す読上げ状態通知応答を第2情報送信部に送信させる第2制御部と、を具備することを特徴とする。
上述した第1の局面に係る音声出力システムによると、音声出力装置が音声出力可能な場合にのみ、音声読上げ装置から読上げ音声信号が音声出力装置へ送信される。音声出力装置は、音声出力が可能な場合にのみ読上げ音声信号を出力する。上述した第2の局面に係る音声出力システムによると、音声読上げ装置は音声出力装置が音声出力可能であるか否かに関わらず、音声読上げ装置から文字情報が音声出力装置へ送信される。音声出力装置は音声出力が可能な場合にのみ文字情報から読上げ音声信号を生成して出力する。このため、いずれのシステムにおいても、テレビまたはレコーダ等の音声読上げ装置をシアター機器等の音声出力装置に接続した場合に、途切れさせることなく音声出力装置から読上げ音声信号を出力することができる。
図1は、本発明の第1の実施の形態に係る音声出力システムの全体構成図である。 図2は、図1の音声読上げ装置(テレビ1000)の制御ブロック図である。 図3は、図1の音声出力装置(シアター機器3000)の制御ブロック図である。 図4は、図1の音声出力システムにおける通信シーケンスを示す図である。 図5は、図1の音声読上げ装置(テレビ1000)および音声出力装置(シアター機器3000)のクレームがで実行されるプログラムの制御構造を示すフローチャート(その1)である。 図6は、図1の音声読上げ装置(テレビ1000)および音声出力装置(シアター機器3000)の制御部で実行されるプログラムの制御構造を示すフローチャート(その2)である。 図7は、本発明の第2の実施の形態に係る音声出力システムの全体構成図である。 図8は、図7の音声読上げ装置(テレビ1100)の制御ブロック図である。 図9は、図7の音声出力装置(シアター機器3100)の制御ブロック図である。 図10は、図7の音声出力システムにおける通信シーケンスを示す図である。 図11は、図7の音声読上げ装置(テレビ1100)および音声出力装置(シアター機器3100)の制御部で実行されるプログラムの制御構造を示すフローチャート(その1)である。 図12は、図7の音声読上げ装置(テレビ1100)および音声出力装置(シアター機器3100)の制御部で実行されるプログラムの制御構造を示すフローチャート(その2)である。
以下、図面を参照して、本発明の実施の形態に係る音声出力システムについて説明する。なお、以下の説明においては、同一の構成については同一の符号を付してある。それらの名称および機能は同じである。従って、それらについての詳細な説明は繰り返さない。
<第1の実施の形態>
図1〜図6を参照して、本発明の第1の実施の形態に係る音声出力システムについて説明する。本実施の形態に係る音声出力システムにおいては、実際に音声をスピーカから出力する音声出力装置(たとえばシアター機器、テレビ)の音声ミュート状態を、音声読上げ装置(たとえばレコーダ、テレビ)に通知して、読上げ音声を読上げるタイミングを調整する。
(全体システム構成)
本実施の形態に係る音声出力システムは、限定されるものではないが、図1に示す(A)および(B)の2つの態様が考えられる。図1(A)に示す音声出力システムは、音声出力装置がシアター機器3000であって、音声読上げ装置がテレビ1000およびレコーダ2000である。図1(B)に示す音声出力システムは、音声出力装置がテレビ1001、音声読上げ装置がレコーダ2000である。このように、スピーカを備えるテレビは、音声出力装置としても、音声を読み上げる音声読上げ装置(この場合には音声出力装置はシアター機器)としても機能する。これらの装置は、ネットワーク接続され、放送等の音声信号(放送の音声信号、録画された放送の音声信号、メディアを再生した音声信号などを含む。以下、放送音声信号と記載する。)に読上げ音声信号を重畳した合成音声信号、ならびに、音声出力装置の音声出力可能状態であるか否かを示す情報(音声出力可否情報、後述するコマンド、フラグに対応する)を送受信する。ここで、放送音声信号の符号化方式が、たとえばAACからリニアPCMに切り替わった場合、音声読上げ装置は、リニアPCMの放送音声信号に読上げ音声信号を重畳したリニアPCMの合成音声信号を音声出力装置へ出力する。ところが合成音声信号がAACからリニアPCMへ切り替わった場合に音声出力装置では音声ミュートするため、読上げ音声信号を重畳した合成音声信号が音声ミュートで出力されなかったり、頭切れしたりする。本実施の形態に係る音声出力システムは、このような問題を解決する。
図1(A)に示す場合には、
(1)シアター機器3000は、音声ミュート状態に対応する音声ミュート状態通知コマンド(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。
(2)テレビ1000およびレコーダ2000は、読上げ音声の読上げ前にシアター機器3000の音声ミュート状態を確認する。このとき、テレビ1000およびレコーダ2000はシアター機器3000へ音声ミュート状態を取得する音声ミュート状態取得コマンドを送信する。シアター機器3000は、音声ミュート状態取得コマンドを受信すると、自己の音声ミュート状態に対応する音声ミュート状態通知コマンドを送信する。
(3)テレビ1000およびレコーダ2000は、シアター機器3000が音声ミュート状態であれば、放送音声信号のみから構成される合成音声信号をシアター機器3000へ出力し、音声ミュート状態が解除されると(非音声ミュート状態になると)、読上げ音声信号を放送音声信号に重畳した合成音声信号をシアター機器3000へ出力する。
(4)テレビ1000およびレコーダ2000は、音声読上げ途中にシアター機器3000から音声ミュート状態通知コマンド(音声ミュート状態[Mute ON])を受信すると、読上げ音声の読上げを一時的に停止し(この状態では放送音声信号のみから構成される合成音声信号を出力する)、音声ミュート状態が解除されると、読上げ音声信号を放送音声信号に重畳した合成音声信号をシアター機器3000へ出力して読上げ音声の読上げを再開(途中から読上げ)またはリトライ(最初から読上げ)する。
図1(B)に示す場合には、
(1)テレビ1001は、音声ミュート状態に対応する音声ミュート状態通知コマンド(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。
(2)レコーダ2000は、読上げ音声の読上げ前にテレビ1001の音声ミュート状態を確認する。このとき、レコーダ2000はテレビ1001へ音声ミュート状態を取得する音声ミュート状態取得コマンドを送信する。テレビ1001は、音声ミュート状態取得コマンドを受信すると、自己の音声ミュート状態に対応する音声ミュート状態通知コマンドを送信する。
(3)レコーダ2000は、テレビ1001が音声ミュート状態であれば、放送音声信号のみから構成される合成音声信号をテレビ1001へ出力し、音声ミュート状態が解除されると(非音声ミュート状態になると)、読上げ音声信号を放送音声信号に重畳した合成音声信号をテレビ1001へ出力する。
(4)レコーダ2000は、音声読上げ途中にテレビ1001から音声ミュート状態通知コマンド(音声ミュート状態[Mute ON])を受信すると、読上げ音声の読上げを一時的に停止し(この状態では放送音声信号のみから構成される合成音声信号を出力する)、音声ミュート状態が解除されると、読上げ音声信号を放送音声信号に重畳した合成音声信号をテレビ1001へ出力して読上げ音声の読上げを再開(途中から読上げ)またはリトライ(最初から読上げ)する。
なお、音声読上げ装置と音声出力装置との間で通知するコマンドは、音声読上げ許可および音声読上げ禁止フラグ等であっても、同じ機能が実現できる。また、音声読上げ装置と音声出力装置との間の通信線は、HDMI(High−Definition Multimedia Interface)、住宅内LAN(Local Area Network)等である。なお、HDMIで接続する場合、HDMIで規格化されている機器制御信号および制御プロトコルであるCEC(Consumer Electronics Control)を用いることができる。
以下においては、図1(A)の態様であって、音声読上げ装置がテレビ1000であり、音声出力装置がシアター機器3000であるとして説明する。なお、図1(A)のレコーダ2000は、音声読上げ装置としての部分はテレビ1000と同じ構成であるため、説明を繰り返さない。
(ハードウェア構成:制御ブロック図)
図2に音声読上げ装置の一例であるテレビ1000の制御ブロック図を示す。このテレビ1000は、デジタル放送信号を受信してデコードして映像および音声を出力する機能を実現する。このような機能を実現する構成に加えて、このテレビ1000は、図2に示す制御ブロックを備える。
図2に示すように、テレビ1000は、このテレビ1000を制御するCPU(Cen
tral Processing Unit)等で構成される制御部1010(第1制御部
)と、その制御部1010に接続された複数のユニットで構成される。これらのユニットは、たとえば、ユーザからの音声の読上げ指示を制御部1010へ入力するユーザインターフェイス1020と、設定された時間になると音声の読上げ指示を制御部1010へ入力するタイマ1022と、制御部1010からの要求に従い音声出力装置(ここではシアター機器3000)のミュート状態を取得する制御コマンド(音声ミュート状態取得コマンド)を送信する制御コマンド送信部1030と、音声ミュート状態取得コマンドに応答して音声出力装置のミュート状態を示す制御コマンド(音声ミュート状態通知コマンド)を受信して制御部1010へ通知する制御コマンド受信部1032(第1情報受信部)と、を含む。
さらに、これらのユニットは、シアター機器3000で読上げるテキストデータを記憶した読上げテキストデータ記憶部1040と、制御部1010からの指令(読上げテキスト音声信号生成・出力要求)に従って読上げテキストデータから読上げ音声信号を生成する音声信号生成部1050と、制御部1010からの指令(合成要求)に従ってオーディオソース1060から入力された放送音声信号と音声信号生成部1050から入力された読上げ音声信号とを合成する音声合成部1070と、制御部1010からの指令(音声信号出力要求)に従って音声合成部1070から入力された合成音声信号を音声出力装置へ出力する音声信号出力部1090(第1情報送信部)と、を含む。
図3に音声出力装置の一例であるシアター機器3000の制御ブロック図を示す。このシアター機器3000は、合成音声信号を受信してデコードして合成音声(放送音声および読上げ音声)を出力する機能を実現する。このような機能を実現するために、このシアター機器3000は、図3に示す制御ブロックを備える。
図3に示すように、シアター機器3000は、このシアター機器3000を制御するCPU等で構成される制御部3010(第2制御部)と、その制御部3010に接続された複数のユニットで構成される。これらのユニットは、たとえば、音声読上げ装置(ここではテレビ1000)からの制御コマンド(音声ミュート状態取得コマンド)を受信する制御コマンド受信部3020(第2情報受信部)と、シアター機器3000の音声ミュート状態を示す制御コマンド(音声ミュート状態通知コマンド)をテレビ1000へ送信する制御コマンド送信部3022(第2情報送信部)とを含む。
さらに、これらのユニットは、ネットワークを介してテレビ1000から合成音声信号を受信し、合成音声信号の状態を制御部3010へ通知する音声信号入力部3030と、制御部3010からの指令(デコード要求)に従って音声信号入力部3030から入力された合成音声信号をデコードするデコーダ3050(デコード部)と、制御部3010からの指令(音声ミュート制御要求)に従ってデコーダ3050から入力されたデコードされた合成音声信号を音声ミュートする音声ミュート部3060と、制御部3010からの指令(音声出力制御要求)に従って音声ミュート部3060から入力されたデコードされた合成音声信号をスピーカ3080へ出力する音声出力部3070と、を含む。
制御部3010は、音声信号入力部3030へ入力された合成音声信号の状態を取得する。AACからリニアPCMへ合成音声信号の符号化が変化した場合には、デコーダ3050の符号化設定を切り替える必要がある。デコーダ3050では符号化設定を切り替えている間は正規のデコード処理ができないので、デコーダ3050での符号化設定の切替が完了するまで、制御部3010は、音声ミュートをオンすることを示す音声ミュート制御要求を音声ミュート部3060へ出力して、デコーダ3050から入力されるデコードされた合成音声信号を音声出力部3070へ出力させないようにする。この状態において、テレビ1000から音声ミュート状態取得コマンドを受信した場合、制御部3010は、制御コマンド送信部3022を介して音声ミュート状態通知コマンドとして[Mute
ON]コマンドをテレビ1000へ送信する。デコーダ3050での符号化設定情報の切替が完了すると、制御部3010は、音声ミュートを解除することを示す音声ミュート制御要求を音声ミュート部3060に出力して、デコーダ3050から入力された合成音声信号を音声出力部3070へ出力させる。この状態において、テレビ1000から音声ミュート状態取得コマンドを受信した場合、制御部3010は、制御コマンド送信部3022を介して音声ミュート状態通知コマンドとして[Mute OFF]コマンドをテレビ1000へ送信する。
なお、テレビ1000の制御部1010およびシアター機器3000の制御部3010のいずれも、フラグ等を記憶するフラグ記憶部および後述するプログラムを記憶するプログラム記憶部を備える。
(通信シーケンス)
図4を参照して、本実施の形態に係る音声出力システムにおける通信シーケンスについて説明する。図4に示す音声読上げ装置は、テレビ1000であったりレコーダ2000であったりして、音声出力装置は、シアター機器3000であったりテレビ1001であったりする。ここでは、音声読上げ装置がテレビ1000であり、音声出力装置がシアター機器3000であるとして説明する。
テレビ1000は、定期的にまたは不定期的に音声ミュート状態取得コマンドをシアター機器3000へ送信する。シアター機器3000は、受信した音声ミュート状態取得コマンドに応答して、音声ミュート状態通知コマンドをテレビ1000へ送信する。このとき、シアター機器3000が、音声ミュート状態であると音声ミュート状態通知コマンドとして[Mute ON]コマンドをテレビ1000へ送信する。シアター機器3000が、音声ミュート状態でなくなると音声ミュート状態通知コマンドとして[Mute OFF]コマンドをテレビ1000へ送信する。
テレビ1000は、音声ミュート状態通知コマンドとして[Mute ON]コマンドを受信すると、音声ミュート状態通知コマンドとして[Mute OFF]コマンドを受信するまで、読上げ音声信号の出力をポーリングする。すなわち、[Mute ON]コマンドを受信している間は、放送音声信号のみからなる合成音声信号をシアター機器3000へ出力する。そして、音声ミュート状態通知コマンドとして[Mute OFF]コマンドを受信すると、読上げ音声信号を放送音声信号に重畳した合成音声信号をシアター機器3000へ出力する(読上げ音声信号出力)。
読上げ音声信号が合成音声信号に重畳されてテレビ1000からシアター機器3000へ出力されている間において、シアター機器3000が音声ミュート状態になると音声ミュート状態通知コマンドとして[Mute ON]コマンドをテレビ1000へ送信する。テレビ1000は、この状態では読上げ音声信号を放送音声信号に合成せず(読上げ音声信号出力停止)、放送音声信号のみから構成される合成音声信号をシアター機器3000に出力する。
シアター機器3000が、音声ミュート状態でなくなると音声ミュート状態通知コマンドとして[Mute OFF]コマンドをテレビ1000へ送信する。テレビ1000は、[Mute OFF]コマンドを受信すると、読上げ音声信号を放送音声信号に重畳した合成音声信号のシアター機器3000への出力を再開する(読上げ音声信号出力再開)。このように、テレビ1000は、合成音声信号の出力中に音声ミュート状態通知コマンドとして[Mute ON]コマンドを受信すると、[Mute OFF]コマンドを受信するまで、読上げ音声信号を合成音声信号に重畳せずに放送音声信号のみから構成される合成音声信号をシアター機器3000へ出力し続ける。
(フローチャート構成)
図5および図6を参照して、本実施の形態に係る音声出力システムを構成する音声読上げ装置であるテレビ1000および音声出力装置であるシアター機器3000で実行される音声出力処理の制御構造について説明する。ここでは、図1(A)に示すように、音声読上げ装置がテレビ1000であり、音声出力装置がシアター機器3000であり、レコーダ2000が存在しないものとして説明する。なお、以下においては、通信トラブル等に起因する通信タイムアウトエラーは想定しないものとする。
図5の左側のフローチャートを参照して、ステップ(以下、ステップをSと記載)3000にて、シアター機器3000の制御部3010(以下、単に制御部3010と記載)は、音声ミュート設定するか否かを判定する。このとき、制御部3010は、音声信号入力部3030に入力された合成音声信号の符号化がAACからリニアPCMへ切り替わったと判断した場合、シアター機器3000を音声ミュート状態に設定する。音声ミュートが設定されると(S3000にてYES)、処理はS3002へ移される。一方、音声信号入力部3030に入力された合成音声信号の符号化に変更がないと判断した場合、あるいはデコーダ3050において符号化設定の切替が完了したと判断した場合は、音声ミュート状態が解除されるので(S3000にてNO)、この処理はS3004へ移される。
S3002にて、制御部3010は、音声ミュート状態通知コマンドを[Mute ON]に設定する。その後、この処理はS3006へ移される。S3004にて、制御部3010は、音声ミュート状態通知コマンドを[Mute OFF]に設定する。その後、この処理はS3006へ移される。
S3006にて、制御部3010は、制御コマンド受信部3020が音声ミュート状態取得コマンドをテレビ1000から受信したか否かを判定する。音声ミュート状態取得コマンドをテレビ1000から受信すると(S3006にてYES)、処理はS3008へ移される。もしそうでないと(S3006にてNO)、この処理はS3000へ移される。
S3008にて、制御部3010は、制御コマンド送信部3022に音声ミュート状態通知コマンド([Mute ON]または[Mute OFF])をテレビ1000へ送信させる。
図5の右側のフローチャートを参照して、S1000にて、テレビ1000の制御部1010(以下、単に制御部1010と記載)は、たとえば一定の時間間隔で、制御コマンド送信部1030に音声ミュート状態通知コマンドをシアター機器3000へ送信させる。
S1002にて、制御部1010は、制御コマンド受信部1032が音声ミュート状態通知コマンド([Mute ON])をシアター機器3000から受信したか否かを判定する。音声ミュート状態通知コマンド([Mute ON])をシアター機器3000から受信すると(S1002にてYES)、処理はS1004へ移される。もしそうでないと(S1002にてNO)、この処理はS1006へ移される。S1004にて、制御部1010は、フラグ記憶部に記憶された音声ミュートフラグ(以下、単にミュートフラグまたはフラグと記載する場合がある)をオンにセットする。その後、処理はS1000へ移される。
S1006にて、制御部1010は、制御コマンド受信部1032が音声ミュート状態通知コマンド([Mute OFF])をシアター機器3000から受信したか否かを判定する。音声ミュート状態通知コマンド([Mute OFF])をシアター機器3000から受信すると(S1006にてYES)、処理はS1008へ移される。もしそうでないと(S1006にてNO)、この処理はS1000へ移される。S1008にて、制御部1010は、フラグ記憶部に記憶されたミュートフラグをオフにセットする。その後、処理はS1000へ移される。
図6の左側のフローチャートを参照して、S1020にて、制御部1010は、音声読上げ指示を検出したか否かを判定する。このとき、制御部1010は、ユーザインターフェイス1020を介して音声読上げ指示を検出したり、タイマ1022から指示に基づいて音声読上げ指示を検出したりする。音声読上げ指示を検出すると(S1020にてYES)、処理はS1022へ移される。もしそうでないと(S1020にてNO)、この処理はS1020へ移される。
S1022にて、制御部1010は、フラグ記憶部に記憶されたミュートフラグの状態を判定する。ミュートフラグがオン状態であれば(S1022にてYES)、放送音声信号のみから構成される合成音声信号を生成させて出力させる(S1023)。一方、ミュートフラグがオフ状態であれば(S1022にてNO)、放送音声信号に読上げ音声信号を重畳した合成音声信号を生成させて出力させる(S1024)。なお、このとき、制御部1010は、タイムアウト前の読上げ音声信号のみを合成音声信号に重畳してシアター機器3000へ出力する。読上げ音声信号の中にはある時間までに読上げを終了しないと意味がない読上げ音声もあるため、シアター機器3000で、タイムアウト前のみの読上げ音声を読み上げて、意味のないタイムアウト後の読上げ音声は読上げないようにする。
S1026にて、制御部1010は、ミュートフラグが切り替わったか否かを判定する。図5および図6に示すフローチャートは同時に実行されており、S1023、S1024の処理中であっても、S1000〜S1008の処理が実行されているので、合成音声信号の出力中であっても、ミュートフラグが切り替わることがある。ミュートフラグが切り替わると(S1026にてYES)、処理はS1028へ移される。もしそうでないと(S1026にてNO)、この処理はS1032へ移される。
S1028にて、制御部1010は、ミュートフラグがオン状態からオフ状態に切り替わったか否かを判定する。ミュートフラグがオン状態からオフ状態に切り替わると(S1028にてYES)、処理はS1030へ移される。ミュートフラグがオフ状態からオン状態に切り替わると(S1028にてNO)、この処理はS1031へ移される。
S1030にて、制御部1010は、放送音声信号に読上げ音声信号を重畳した合成音声信号を生成させて出力させる。このとき、制御部1010は、テレビ1000からシアター機器3000へ読上げ音声信号を再伝送する。ここで、音声読上げ文章の最初から、段落の最初から、または、単語の最初から等の予め定められた部分から、再伝送される。なお、再伝送する開始部分は特に限定されない。S1031にて、制御部1010は、放送音声信号のみから構成される合成音声信号を生成させて出力させる。
S1032にて、制御部1010は、合成音声信号の出力が終了したか否かを判定する。送信すべき合成音声信号の出力が終了すると(S1032にてYES)、処理はS1020へ移される。もしそうでないと(S1032にてNO)、この処理はS1022へ移され、ミュート状態に応じた合成音声信号の出力が継続される。
図6の右側のフローチャートを参照して、S3020にて、制御部3010は、テレビ1000から合成音声信号を受信したか否かを判定する。合成音声信号を受信すると(S3020にてYES)、処理はS3022へ移される。もしそうでないと(S3020にてNO)、この処理はS3020へ移される。
S3022にて、制御部3010は、テレビ1000から受信した合成音声信号をデコードしてスピーカ3080から合成音声を出力させる。
(動作)
以上のような構造およびフローチャートに基づく本実施の形態に係る音声出力システムの動作について説明する。
・音声ミュートフラグがオフを維持している場合
この動作の説明においては、たとえば、シアター機器3000へ送信される合成音声信号の符号化がAACからリニアPCMへ変化しない場合を説明する。テレビ1000のリモコンでユーザが音声読上げを指示すると(S1020にてYES)、音声ミュートフラグがオンであるか否かが検出され、この場合、音声ミュートフラグがオフであるので(S1022にてNO)、テレビ1000からシアター機器3000へ読上げ音声信号を重畳した合成音声信号が出力される(S1024)。
このとき、シアター機器3000においては音声ミュート設定されていない(S3000にてNO、S3004)。シアター機器3000は、テレビ1000から音声ミュート状態取得コマンドを受信すると(S3006にてYES)、音声ミュート状態通信コマンド([Mute OFF])をテレビ1000へ送信する(S3008)。テレビ1000は、音声ミュート状態取得コマンドを送信すると(S1000)、音声ミュート状態通知コマンドとして[Mute OFF]を受信するので(S1006にてYES)、音声ミュートフラグをオフの状態として維持する(S1008)。つまり、合成音声信号の出力中において、音声ミュートフラグがオンにならない(S1032にてYESになるまでS1026にてNO)。
音声出力装置であるシアター機器3000には、読上げ音声信号と放送音声信号とを重畳した合成音声信号が途切れることなく送信されてくるとともに、シアター機器3000へ送信された合成音声信号の符号化も変化しないので音声ミュート状態にならない。このため、テレビ1000から送信された読上げ音声信号は、シアター機器3000で途切れることなく出力される。
・音声ミュートフラグがオンを維持している場合
この動作の説明においては、たとえば、シアター機器3000へ送信される合成音声信号の符号化がAACからリニアPCMへ変化し、シアター機器3000のデコーダ3050での符号化設定の切替が完了するまでの間の処理を説明する。この場合、音声ミュートフラグがオンであるので(S1022にてYES)、放送音声信号のみから構成される合成音声信号(読上げ音声信号が重畳されていない合成音声信号)の出力が行われている(S1023)。
このとき、シアター機器3000においては音声ミュート設定されている(S3000にてYES、S3002)。シアター機器3000は、テレビ1000から音声ミュート状態取得コマンドを受信すると(S3006にてYES)、音声ミュート状態通信コマンド([Mute ON])をテレビ1000へ送信する(S3008)。テレビ1000は、音声ミュート状態取得コマンドを送信すると(S1000)、音声ミュート状態通知コマンドとして[Mute ON]を受信するので(S1002にてYES)、音声ミュートフラグがオンの状態となる(S1004)。
つまり、シアター機器3000のデコーダ3050での符号化設定の切替が完了するまでの間は、音声ミュートフラグはオンを維持する。このため、合成音声信号の出力中において、音声ミュートフラグがオフにならない(S1032にてYESになるまでS1026にてNO)。
音声出力装置であるシアター機器3000には、放送音声信号のみから構成される合成音声信号が途切れることなく送信されてくるが、音声ミュート状態であるので、受信した合成音声信号は音声ミュートされ音声出力されない。
・合成音声信号の出力後に、音声ミュートフラグが変化する場合
この動作の説明においては、たとえば、合成音声信号出力中に、シアター機器3000へ送信される放送音声信号の符号化がAACからリニアPCMへ変化した場合(すなわち、音声ミュートフラグがオフからオンに変化し、その後、オンからオフに変化する場合)を説明する。この場合、まず、テレビ1000が合成音声信号の出力中に音声ミュートフラグがオフからオンへ変化する(S1032にてYESになる前にS1026にてYES)。このため、読上げ音声信号を重畳した合成放送信号の出力(S1024)から、読上げ音声信号を重畳しない合成音声信号の出力に切り替わる(S1031)。
このとき、テレビ1000がシアター機器3000へ合成音声信号を出力している最中に、シアター機器3000において音声ミュート設定される(S3000にてYES、S3002)。シアター機器3000は、テレビ1000から音声ミュート状態取得コマンドを受信し(S3006にてYES)、応答として音声ミュート状態通信コマンド([Mute ON])をテレビ1000へ送信する(S3008)。テレビ1000は、音声ミュート状態取得コマンドを送信すると(S1000)、音声ミュート状態通知コマンドとして[Mute ON]を受信するので(S1002にてYES)、音声ミュートフラグをオンの状態に切り替える(S1004)。音声出力装置であるシアター機器3000には、放送音声信号のみから構成される合成音声信号が途切れることなく送信されてくるが、音声ミュート状態であるので、受信した合成音声信号は音声ミュートされ音声出力されない。
その後、デコーダ3050での符号化設定の切替が完了したときにシアター機器3000において音声ミュート設定されなくなる(S3000にてNO、S3004)。シアター機器3000は、テレビ1000から音声ミュート状態取得コマンドを受信すると(S3006にてYES)、音声ミュート状態通信コマンド([Mute OFF])をテレビ1000へ送信する(S3008)。テレビ1000は、音声ミュート状態取得コマンドを送信すると(S1000)、音声ミュート状態通知コマンドとして[Mute OFF]を受信するので(S1006にてYES)、音声ミュートフラグがオンからオフの状態へ切り替わる(S1008)。
合成音声信号の出力が開始されてから(S01023、S1024)、音声ミュートフラグがオフからオンになり(S1028にてNO)、音声ミュートフラグがオンからオフになるまで(S1028にてYES)、読上げ音声信号の合成出力は中断状態になるが、音声ミュートフラグがオンからオフへ切り替わると(S1028にてYES)、読上げ音声信号の合成出力は再開される。
音声出力装置であるシアター機器3000では、テレビ1000から読上げ音声信号と放送音声信号を重畳した合成音声信号が出力された後において、合成音声信号の符号化がAACからリニアPCMへ切り替わり音声ミュート設定されると、テレビ1000からの読上げ音声信号の合成出力が一時的に停止される。その後、シアター機器3000での音声ミュート状態が解除されると、テレビ1000からの読上げ音声信号の合成出力が再開される。このため、シアター機器3000が音声ミュート設定されていて音声出力できない場合には、テレビ1000は読上げ音声信号の送信を一時的に停止して、シアター機器3000が音声ミュート設定されなくなり音声出力できるようになると、テレビ1000は読上げ音声信号の送信を再開して、読上げ音声信号を再伝送する。このため、シアター機器3000は、音声ミュート状態であるときにテレビ1000から読上げ音声信号を受信しないで、音声ミュート状態でなくなるとテレビ1000から読上げ音声信号を受信するので、テレビ1000から送信された読上げ音声は、シアター機器3000で途切れることなく出力される。
以上のようにして、本実施の形態に係る音声出力システムによると、音声出力装置であるシアター機器が音声ミュート状態(音声出力不可能)であるか否かを音声読上げ装置であるテレビまたは/およびレコーダが、放送等の音声信号および読上げ音声信号を含む合成音声信号を出力する前に検出しておく。シアター機器が音声ミュート状態でないと、この合成音声信号をシアター機器へ出力して、シアター機器が音声ミュート状態であると、読上げ音声信号を含まない合成音声信号をシアター機器へ出力する。合成音声信号をシアター機器へ出力中に、シアター機器が音声ミュート状態に切り替わると、読上げ音声信号のシアター機器への合成出力を一時的に停止して、シアター機器が音声ミュート状態でなくなると、読上げ合成音声信号のシアター機器への合成出力を再開する。このように、一時的な停止を含めて、シアター機器が音声出力可能な状態であるときにのみ、テレビが読上げ音声信号を含む合成音声信号をシアター機器へ出力するので、シアター機器は特別な制御を行うことなく受信した合成音声信号に基づき合成音声を出力する。その結果、テレビから送信された読上げ音声を含む合成音声は、シアター機器で途切れることなく、全ての読上げ音声が放送等の音声とともに出力される。
なお、本実施の形態に係る音声出力システムは、以下のように変形することができる。音声ミュート状態だけでなく、音量、サラウンド等の音声設定状態を通知することにより、設定状態を最適な音声読上げ状態に変更した後で読上げ音声を出力する。さらに、音声ミュート状態を通知する信号線および読上げ音声を出力する信号線は、有線として説明したが、有線である必要はなく、無線であっても構わない。さらに、音声出力装置は、音声読上げ装置と別体で説明したが、一体であってもよい。
<第2の実施の形態>
図7〜図12を参照して、本発明の第2の実施の形態に係る音声出力システムについて説明する。本実施の形態に係る音声出力システムにおいては、読上げるテキストを、音声読上げ装置(たとえばレコーダ、テレビ)から、実際に音声をスピーカから出力する音声出力装置(たとえばシアター機器、テレビ)にテキストデータとして通知し、音声出力装置がタイミングを調整して読上げ音声を出力する。なお、以下の本実施の形態についての説明において、上述した第1の実施の形態と同じ構成については、ここでは説明を繰り返さない。
(全体システム構成)
本実施の形態に係る音声出力システムは、限定されるものではないが、図7に示す(A)および(B)の2つの態様が考えられる。図7(A)に示す音声出力システムは、音声出力装置がシアター機器3100であって、音声読上げ装置がテレビ1100およびレコーダ2100である。図7(B)に示す音声出力システムは、音声出力装置がテレビ1101であって、音声読上げ装置がレコーダ2100である。このように、第1の実施の形態と同様に、スピーカを備えるテレビは、音声出力装置としても、音声を読み上げる音声読上げ装置(この場合には音声出力装置はシアター機器)としても機能する。これらの装置は、ネットワーク接続され、放送等の音声信号(放送の音声信号、録画された放送の音声信号、メディアを再生した音声信号などを含む。以下、放送音声信号と記載する。)、読上げ音声のテキストデータ、および、音声出力装置におけるテキストデータの受信状態または読上げ完了状態を示す情報を送受信する。
図7(A)に示す場合には、
(1)テレビ1100およびレコーダ2100は、シアター機器3100へ、読上げ音声の読上げテキスト通知コマンド(テキストデータ)を通知する。
(2)シアター機器3100は、音声ミュート状態に対応する音声ミュート状態を示すミュートフラグ(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。シアター機器3100は、自己が音声ミュート状態であれば、通知されたテキストデータを音声データに変換して出力することも、テレビ1100から入力された放送音声信号をスピーカから出力することもしない。音声ミュート状態が解除されると(非音声ミュート状態になると)、入力されたテキストデータを読み上げ音声信号に変換して、変換した読上げ音声信号と入力された放送音声信号とを合成して合成音声信号としてスピーカから出力する。なお、シアター機器3100は、自己が音声ミュート状態でなく、テキストデータが通知されていなければ、入力された放送音声信号をスピーカから出力している。
(3)テレビ1100、レコーダ2100、または複数のレコーダ2100などの複数の音声読上げ装置から、複数のテキストデータがシアター機器3100に通知された場合には、テキストデータをバッファしておいて、順次読上げることもできる。なお、テレビ1100、レコーダ2100がテキストデータを通知する際、遅延許容量(タイムアウト時間)なども通知して、その通知されたデータに基づいて音声を出力するようにしてもよい。
図7(B)に示す場合には、
(1)レコーダ2100は、テレビ1101へ、読上げ音声の読上げテキスト通知コマンド(テキストデータ)を通知する。
(2)テレビ1101は、音声ミュート状態に対応する音声ミュート状態を示すミュートフラグ(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。テレビ1101は、自己が音声ミュート状態であれば、通知されたテキストデータを音声データに変換して出力することも、レコーダ1101から入力された放送音声信号をスピーカから出力することもしない。音声ミュート状態が解除されると(非音声ミュート状態になると)、入力されたテキストデータを読上げ音声信号に変換して、変換した読上げ音声信号と入力された放送音声信号とを合成して合成音声信号としてスピーカから出力する。なお、テレビ1101は、自己が音声ミュート状態でなく、テキストデータが通知されていなければ、入力された放送音声信号をスピーカから出力している。
以下においては、図7(A)の態様であって、音声読上げ装置がテレビ1100であり、音声出力装置がシアター機器3100であるとして説明する。なお、図7(A)のレコーダ2100は、音声読上げ装置としての部分はテレビ1100と同じ構成であるため、説明を繰り返さない。
(ハードウェア構成:制御ブロック図)
図8に音声読上げ装置の一例であるテレビ1100の制御ブロック図を示す。このテレビ1100は、デジタル放送信号を受信してデコードして映像および音声を出力する機能を実現する。このような機能を実現する構成に加えて、このテレビ1100は、図8に示す制御ブロックを備える。
図8に示すように、テレビ1100は、このテレビ1100を制御するCPU等で構成される制御部1110(第1制御部)と、その制御部1110に接続された複数のユニットで構成される。これらのユニットは、たとえば、音声出力装置であるシアター機器3100へ読上げテキストデータを送信する読上げテキスト送信部1130(第1情報送信部)と、シアター機器3100から音声読上げ状態および音声読上げ結果を受信する音声出力装置状態通知受信部1132(第1情報受信部)と、シアター装置3100で読上げるテキストデータを記憶した読上げテキストデータ記憶部1040と、を含む。なお、読上げテキスト送信部1130(第1情報送信部)は、シアター機器3100へ読上げ状態取得コマンドも送信する。
図9に音声出力装置の一例であるシアター機器3100の制御ブロック図を示す。このシアター機器3100は、音声読上げ装置であるテレビ1100から読上げ音声テキストデータを受信して、テキストデータを読上げ音声信号に変換し、変換した読上げ音声信号を放送音声信号に重畳した合成音声信号を出力する機能を実現する。このような機能を実現するために、このシアター機器3100は、図9に示す制御ブロックを備える。
図9に示すように、シアター機器3100は、このシアター機器3000を制御するCPU等で構成される制御部3110(第2制御部)と、その制御部3110に接続された複数のユニットで構成される。これらのユニットは、たとえば、音声読上げ装置(ここではテレビ1100)からの読上げ音声テキストデータを受信する読上げテキスト受信部3120(第2情報受信部)と、音声読上げ状態および読上げ結果をテレビ1100へ送信する読上げ装置への状態通知送信部3122(第2情報送信部)と、を含む。なお、読上げテキスト受信部3120(第2情報受信部)は、音声読上げ装置(ここではテレビ1100)からの読上げ状態取得コマンドも受信する。
さらに、これらのユニットは、制御部3110からの指令(読上げテキスト音声信号生成・出力/停止要求)に従ってテレビ1100から送信された読上げテキストデータから読上げ音声信号を生成して出力したり読上げ音声信号の生成を停止したりする音声信号生成部3130と、テレビ1100から送信された放送音声信号をデコードするデコーダ3050からの音声信号と音声信号生成部3130からの音声信号とを合成して、合成音声信号を生成する音声合成部3140と、を含む。音声合成部3140で合成された合成音声信号は、音声ミュート部3060および音声出力部3070を経由してスピーカ3080から合成音声として出力される。
なお、テレビ1100の制御部1110およびシアター機器3100の制御部3110のいずれも、フラグ等を記憶するフラグ記憶部および後述するプログラムを記憶するプログラム記憶部を備える。さらに制御部3110は、テレビ1100から受信したデータを一時的に記憶するデータ一時記憶部を備える。
(通信シーケンス)
図10を参照して、本実施の形態に係る音声出力システムにおける通信シーケンスについて説明する。図10に示す音声読上げ装置は、テレビ1100であったりレコーダ2100であったりして、音声出力装置は、シアター機器3100であったりテレビ1101であったりする。ここでは、音声読上げ装置がテレビ1100であり、音声出力装置がシアター機器3100であるとして説明する。
テレビ1100は、音声読上げ指示を検出すると、読上げテキスト通知コマンドをシアター機器3100へ出力する。この読上げテキスト通知コマンドは、たとえば、[機器識別子][優先順位][テキストid][page番号][page数][text]から構成される。なお、通知するコマンドが1コマンドに収まらない場合は複数の読上げテキスト通知コマンドに分割して出力しても構わない。なお、[機器識別子]は、音声出力システムに複数の音声読上げ装置を含む場合、複数の中の1台を特定するための識別データである。
シアター機器3100は、テレビ1100から読上げテキスト通知コマンドを受信すると、読上げ状態通知コマンド([テキストid][受理])をテレビ1100へ送信する。テレビ1100は、シアター機器3100から読上げ状態通知コマンド([テキストid][受理])(読上げ状態通知応答)を受信するまでは読上げテキスト通知コマンドの出力をリトライすることが好ましい。
テレビ1100は、読上げ状態通知コマンド([テキストid][受理])をシアター機器3100から受信すると、読上げ状態取得コマンド([機器識別子][テキストid])(読上げ状態通知要求)をシアター機器3100へ送信する。
シアター機器3100は、テレビ1100から読上げ状態取得コマンド([機器識別子][テキストid])を受信すると、読上げテキスト通知コマンドの[text]として入力されたテキストを読上げ音声として読上げたか否かをテレビ1100へ送信する。シアター機器3100は、音声ミュート設定されていると音声出力できないので、テキストデータを読上げ音声として読上げていない。この場合には、読上げ状態通知コマンド([テキストid][受理])をテレビ1100へ送信する。一方、音声ミュート設定されておらず音声出力できる場合は、テキストを読上げ音声として読上げている。この場合には、読上げ状態通知コマンド([テキストid][完了])(読上げ状態通知応答)をテレビ1100へ送信する。この音声出力システムの中に複数のテレビ1100があっても、読上げ状態通知コマンドの送信先であるテレビ1100は、機器識別子により特定できる。
(フローチャート構成)
図11および図12を参照して、本実施の形態に係る音声出力システムを構成する音声読上げ装置であるテレビ1100および音声出力装置であるシアター機器3100で実行される音声出力処理の制御構造について説明する。ここでは、図7(A)に示すように、音声読上げ装置がテレビ1100であり、音声出力装置がシアター機器3100であり、レコーダ2100が存在しないものとして説明する。
図11のフローチャートを参照して、S3100にて、シアター機器3100の制御部3110(以下、単に制御部3110と記載)は、音声ミュート設定するか否かを判定する。このとき、制御部3110は、音声信号入力部3030に入力された放送音声信号の符号化がAACからリニアPCMへ切り替わったと判断した場合、シアター機器3100を音声ミュート状態に設定する。音声ミュートが設定されると(S3100にてYES)、処理はS3102へ移される。一方、音声信号入力部3030に入力された放送音声信号の符号化に変更がないと判断した場合、あるいはデコーダ3050において符号化設定の切替が完了したと判断した場合は、音声ミュート状態が解除されるので(S3100にてNO)、この処理はS3104へ移される。
S3102にて、制御部3110は、フラグ記憶部に記憶されたミュートフラグをオンにセットする。これで、[Mute ON]状態になる。その後、処理はS3100へ移される。S3104にて、制御部3110は、フラグ記憶部に記憶されたミュートフラグをオフにセットする。これで、[Mute OFF]状態になる。その後、処理はS3100へ移される。
図12の右側のフローチャートを参照して、S1120にて、制御部1110は、音声読上げ指示を検出したか否かを判定する。このとき、制御部1110は、ユーザインターフェイス1020を介して音声読上げ指示を検出したり、タイマ1022から指示に基づいて音声読上げ指示を検出したりする。音声読上げ指示を検出すると(S1120にてYES)、処理はS1122へ移される。もしそうでないと(S1120にてNO)、この処理はS1120へ移される。
S1122にて、制御部1110は、読上げテキストデータ記憶部1040から読上げテキストデータを取得し、読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])を作成して、読上げテキスト送信部1130を介してシアター機器3100へ送信する。
S1126にて、制御部1110は、音声出力装置状態通知受信部1132を介して読上げ状態通知コマンド([テキストid][受理])をシアター機器3100から受信したか否かを判定する。読上げ状態通知コマンド([テキストid][受理])を受信すると(S1126にてYES)、処理はS1130へ移される。もしそうでないと(S1126にてNO)、この処理はS1128へ移される。
S1128にて、制御部1110は、読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])をシアター機器3100へ再送信(リトライ)するか否かを判定する。このとき、制御部1110は、予め定められたリトライ回数に到達するまではリトライすると判定する。リトライすると判定されると(S1128にてYES)、処理はS1122へ移される。もしそうでないと(S1128にてNO)、この処理はS1130へ移される。なお、本実施の形態の説明においては、テレビ1100が、予め定められたリトライ回数だけ読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])をシアター機器3100へ送信しても、テレビ1100が、読上げ状態通知コマンド([テキストid][受理])をシアター機器3100から受信しないことは想定しないものとする。
S1130にて、制御部1110は、読上げ状態取得コマンド([機器識別子][テキストid])を作成して、読上げテキスト送信部1130を介してシアター機器3100へ送信する。
S1132にて、制御部1110は、音声出力装置状態通知受信部1132を介して読上げ状態通知コマンド([テキストid][完了])をシアター機器3100から受信したか否かを判定する。読上げ状態通知コマンド([テキストid][完了])を受信すると(S1132にてYES)、処理はS1120へ移される。もしそうでないと(S1132にてNO)、この処理はS1130へ移される。なお、本実施の形態の説明においては、読上げ状態通知コマンド([テキストid][完了])をシアター機器3100から受信しないことは想定しないものとする。さらに、S1132にてNOの場合、処理をS1132へ移すようにしても構わない。すなわち、読上げ状態取得コマンド([機器識別子][テキストid])をシアター機器3100へ再送信しないで、読上げ状態通知コマンド([テキストid][完了])の受信を待つ。
図12の左側のフローチャートを参照して、S3120にて、制御部3110は、読上げテキスト受信部3120を介して読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])をテレビ1100から受信したか否かを判定する。読上げテキスト通知コマンドを受信すると(S3120にてYES)、処理はS3122へ移される。もしそうでないと(S3120にてNO)、この処理はS3120へ移される。
S3122にて、制御部3110は、テレビ1100からの読上げテキスト通知コマンドの受信が完了すると、読上げ状態通知コマンド([テキストid][受理])を作成し、読上げ装置への状態通知送信部3122を介して、機器識別子で特定されるテレビ1100へ送信する。
S3124にて、制御部3110は、フラグ記憶部に記憶されたミュートフラグがオン状態であるか否かを判定する。ミュートフラグがオン状態であると判定されると(S3124にてYES)、処理はS3126へ移される。もしそうでないと(S3124にてNO)、この処理はS3132へ移される。S3126にて、制御部3110は、テレビ1100から受信した読上げテキスト通知コマンドのテキストデータをデータ一時記憶部に一時的に記憶させる。
S3128にて、制御部3110は、データ一時記憶部に複数のテキストデータを記憶したか否かを判定する。このとき、通知するテキストが長くて複数のコマンドに分割して送信されたテキストデータは1つのデータとして扱う。複数のテキストデータを記憶したと判定されると(S3128にてYES)、処理はS3130へ移される。もしそうでないと(S3128にてNO)、この処理はS3124へ移される。
S3130にて、制御部3110は、複数のテキストデータの音声出力優先順位を決定する。このとき、たとえば、制御部3110は、読上げテキスト通知コマンドの優先順位に従って、テキストデータの音声出力優先順位を決定する。そして決定した音声出力優先順位をデータ一時記憶部に記憶しておく。その後、この処理はS3124へ移される。なお、音声読上げ装置の種類による優先順位(たとえばテレビ1110からのテキストデータはレコーダ2100からのテキストデータよりも優先順位が高い)に従って、[機器識別子]で音声読上げ装置とレコーダとを区別して、テキストデータの音声出力優先順位を決定することもできる。
S3132にて、制御部3110は、データ一時記憶部に音声出力優先順位が記憶されている場合は記憶された音声出力優先順位に従って、読上げテキスト受信部3120から入力されたテキストデータのうちタイムアウト前のみのテキストデータを抽出し、音声信号生成部3130に対応する読上げ音声信号を生成させ、スピーカ3080から読上げ音声信号が重畳された合成音声信号を出力させる。ここで、タイムアウトについて説明する。タイムアウトは、たとえば複数の音声読上げ装置(テレビ1100、レコーダ2100)から音声出力装置(シアター機器3100)に対して、同時に読上げテキストが通知された場合、音声出力装置は(音声出力優先順位があればその順位に従って)順次読上げ処理を実行する。読上げテキストの中にはある時間までに読上げを終了しないと意味がないテキストデータもあるため、タイムアウト前のみのテキストデータのみを読み上げて、意味のないタイムアウト後のテキストデータは読上げないようにする。なお、タイムアウト時間は、テレビ1100から読上げテキスト通知コマンドに付随するデータとしてシアター機器へ出力される。
S3134にて、制御部3110は、読上げテキスト(複数のテキストがあれば全てのテキストを)の音声出力が完了して、かつ、テレビ1100からの読上げ状態取得コマンド([機器識別子][テキストid])を受信すると、読上げ状態通知コマンド([テキストid][完了])を読上げ装置への状態通知送信部3122を介して機器識別子で特定されるテレビ1100へ送信する。その後、処理はS3120へ移される。
(動作)
以上のような構造およびフローチャートに基づく本実施の形態に係る音声出力システムの動作について説明する。なお、以下の説明においても、上述した第1の実施の形態における動作と同じ説明は繰り返さない。また、以下においては、通信トラブル等に起因する通信タイムアウトエラーは想定しないものとする。
・音声ミュートフラグがオフを維持している場合
この動作の説明においては、たとえば、シアター機器3100へ送信される放送音声信号の符号化がAACからリニアPCMへ変更しない場合を説明する。テレビ1100のリモコンでユーザが音声読上げを指示すると(S1120にてYES)、シアター機器3100の音声ミュートフラグがオンであるか否かに関わらず、読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])が、テレビ1100からシアター機器3100へ送信される(S1122)。
シアター機器3100は、読上げテキスト通知コマンドを受信する(S3120にてYES)。そして、テレビ1100からの読上げ状態取得コマンド([機器識別子][テキストid])の受信が完了すると、読上げ状態通知コマンド([テキストid][受理])が、シアター機器3100からテレビ1100へ送信される(S3122)。
テレビ1100が読上げ状態通知コマンド([テキストid][受理])を受信すると(S1126にてYES)、読上げテキスト通知コマンドがシアター機器3100へ再送信されることなく、読上げ状態取得コマンド([機器識別子][テキストid])がテレビ1100からシアター機器3100へ送信される(S1130)。その後、テレビ1100は、読上げ状態通知コマンド([テキストid][完了])がシアター機器3100から送信されるのを待つ(S1132)。
一方、読上げテキスト通知コマンドを受信したシアター機器3100は、ミュートフラグがオンではないので(S3124にてNO)、読上げテキスト通知コマンドと受信したテキストデータから音声信号生成部3130で読上げ音声信号を生成し、生成した読上げ音声信号を放送音声信号に重畳した合成音声信号をスピーカ3080から出力する(S3132)。スピーカ3080からの合成音声の出力が完了すると、読上げ状態通知コマンド([テキストid][完了])がテレビ1100からシアター機器3100へ送信される(S3134)。
音声出力装置であるシアター機器3100へ送信された放送音声信号の符号化が変化しないので音声ミュート状態にならない。音声読上げ装置であるテレビ1100から送信されてきたテキストデータから読上げ音声データが生成されて、放送音声信号に重畳されて合成音声信号として出力される。このため、テレビ1100から送信されたテキストデータは、シアター機器3100で途切れることなく音声信号へ変換されて、合成音声信号に含まれる読上げ音声信号として出力される。
・音声ミュートフラグがオンの場合
この動作の説明においては、シアター機器3100へ入力されたテレビ1100からの放送音声信号の符号化がAACからリニアPCMへ切り替わり、シアター機器3100のデコーダ3050での符号化設定の切替が完了するまでの間の処理を説明する。上述のように、シアター機器3100の音声ミュート状態に関係なく、読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])が、テレビ1100からシアター機器3100へ送信される(S1122)。
一方、シアター機器3100においては、音声ミュートが設定され(S3100にてYES)、音声ミュートフラグがオンにセットされている(S3102)。読上げテキスト通知コマンドをテレビ1100から受信したシアター機器3100においては、音声ミュートフラグがオンにセットされているので(S3124にてYES)、受信したテキストデータを一時的にデータ一時記憶部に記憶する(S3126)。なお、音声ミュートフラグがオンにセットされている状態においては、シアター機器3100が受信したテキストデータの全てが一時的にデータ一時記憶部に記憶される(S3124にてNOになるまでS3126〜S3130)。このような状態で複数のテキストデータを記憶すると(S3128にてYES)、音声出力優先順位が決定される(S3130)。
シアター機器3100のデコーダ3050の内部処理が終わると、音声ミュートが解除され(S3100にてNO、S3104)、ミュートフラグがオンからオフに切り替わる(S3124にてNO)。音声ミュートフラグがオフになると、シアター機器3100で、データ一時記憶部に記憶した1または複数のテキストデータから対応する1または複数の読上げ音声信号を生成して、読上げ音声信号の出力が開始される(S3132)。このとき、音声出力優先順位およびタイムアウト時間を考慮して、読上げ音声信号が出力される。テキストデータ(複数のテキストがあれば全てのテキストを)の音声を出力が完了すると、読上げ状態通知コマンド([テキストid][完了])がテレビ1100からシアター機器3100へ送信される(S3134)。
音声出力装置であるシアター機器3100へ送信された放送音声信号の符号化が変化して音声ミュート状態であるときには、テキストデータは一時的に記憶される。音声ミュート状態でなくなると、一時的に記憶しておいたテキストデータから読上げ音声信号が生成されて出力される。このため、テレビ1100から送信されたテキストデータは、シアター機器3000で途切れることなく読上げ音声信号へ変換されて、合成音声信号に含まれる読上げ音声信号として出力される。
以上のようにして、本実施の形態に係る音声出力システムによると、音声出力装置であるシアター機器が音声ミュート状態(音声出力不可能)であるか否かに関わらず、音声読上げ装置であるテレビまたは/およびレコーダは、読上げテキストデータをシアター機器へ送信する。シアター機器が音声ミュート状態でないと、テキストデータから読上げ音声信号を生成してシアター機器から合成音声(放送音声および読上げ音声)を出力する。シアター機器が音声ミュート状態であると、音声ミュート状態でなくなるまで、受信したテキストデータを一時的に記憶しておく。シアター機器が音声ミュート状態から音声ミュート状態でなくなると、一時的に記憶したテキストデータから読上げ音声信号を生成してシアター機器から合成音声(放送音声および読上げ音声)を出力する。その結果、テレビから送信されたテキストデータは、シアター機器で途切れることなく読上げ音声信号に変換されて、合成音声信号に含まれる読上げ音声信号として出力される。
なお、本実施の形態に係る音声出力システムは、以下のように変形することができる。音声ミュート状態を通知する信号線および読上げ音声を出力する信号線は、有線として説明したが、有線である必要はなく、無線であっても構わない。さらに、音声出力装置は、音声読上げ装置と別体で説明したが、一体であってもよい。さらに、音声読上げ装置は、音声読上げテキストだけでなく、たとえば、アクセント、話速、音量等の音声読上げ設定データを送信するようにしてもよい。
本発明は、例えば、音声出力できないタイミングが発生する音声出力装置であっても、読上げ装置からの読上げ音声信号を途切れることなく出力可能な音声出力システムに好適に利用できる。
1000、1001、1100、1101 テレビ
2000、2100 レコーダ
3000、3100 シアター機器
1010、1110 テレビ制御部
3010、3110 シアター機器制御部
テレビまたはレコーダ等の音声読上げ装置をホームシアターシステム(以下、単にシアター機器と記載)等の音声出力装置に接続して、音声出力装置が音声読上げ装置から入力された合成音声信号を出力する技術に関し、特に、合成音声信号に重畳された読上げ音声信号を途切れなく出力することのできる技術に関する。
テレビとシアター機器とを光デジタルケーブルで接続して、テレビの音声をシアター機器のスピーカから出力するシステムが近年増えている。たとえば、特許文献1(特開2010−205136号公報)は、文字を音声読上げする音声読上げ装置を開示する。この特許文献1には、音声出力装置と音声読上げ装置とを専用線またはネットワークを介して接続する場合は、音声読上げ装置が、音声出力したい読上げ音声信号を専用線またはネットワークを介して外部の音声出力装置へ出力すればよいことを開示する。このような技術を、音声読上げ装置であるテレビと音声出力装置であるシアター機器とに適用することが考えられる。
特開2010−205136号公報
しかしながら、特許文献1に開示された技術では、音声読上げ装置(テレビ)と音声出力装置(シアター機器)とは非同期で動作しており、音声読上げ装置は音声出力装置の音声出力状態を考慮しないで、放送等の音声信号に読上げ音声信号を重畳して合成音声信号として音声出力装置へ送信する。音声出力装置においては、音声読上げ装置から入力される合成音声信号が、たとえばAAC(Advanced Audio Coding)からリニアPCM(Pulse Code Modulation)へ変化した場合は、音声出力装置の内部に設けられたデコーダの設定をAACからPCMに切り替えるために音声が出力できない音声ミュート状態になる。このように音声読み上げ装置が出力する合成音声信号の圧縮の種類または有無が変化し得る場合の典型例として、同じチャンネルでの番組の切替わりや、チャンネルを切換えることにより生じる番組の切替わりに伴う場合が挙げられる。上述のように非同期で動作すると、このような音声ミュート状態であっても、読上げ音声信号は合成音声信号に重畳されて音声出力装置へ送信されるために、音声出力装置から出力される読上げ音声信号に頭切れが発生してしまう。このように、従来の技術では、送信した読上げ音声信号の一部が音声出力されない問題(頭切れしてしまう問題)、または、送信した読上げ音声信号全部が音声出力されない問題がある。
本発明は、上述した問題点を解決するためになされたものであって、その目的は、テレビまたはレコーダ等の音声読上げ装置をシアター機器等の音声出力装置に接続した場合に、途切れさせることなく読上げ音声信号を出力する技術を提供することである。
本発明の第1の局面に係る音声出力システムは、以下の音声読上げ装置および音声出力装置を含む。
音声読上げ装置は、読上げ音声信号を出力する音声出力装置とネットワークで接続される。この音声読上げ装置は、文字情報から読上げ音声信号を生成する音声信号生成部と、ネットワークを介して、音声出力装置から音声出力可否情報を受信する第1情報受信部と、ネットワークを介して、音声信号生成部が生成した読上げ音声信号を音声出力装置へ送信する第1情報送信部と、第1情報受信部が音声出力不可を示す音声出力可否情報を受信した場合に、音声出力可を示す音声出力可否情報を受信するまで第1情報送信部に読上げ音声信号の送信を待機させ、第1情報受信部が音声出力可を示す音声出力可否情報を受信した場合に、第1情報送信部に前記読上げ音声信号を送信させる第1制御部と、を具備することを特徴とする。
音声出力装置は、合成音声信号を出力する音声読上げ装置とネットワークで接続される。この音声出力装置は、音声読上げ装置から合成音声信号を受信する音声信号入力部と、音声読上げ装置から音声状態取得要求を受信する第2情報受信部と、音声出力可否情報を音声読上げ装置へ送信する第2情報送信部と、音声信号入力部が受信した合成音声信号をデコードするデコード部と、デコード部がデコードした合成音声信号を出力する音声出力部と、第2情報受信部が音声状態取得要求を受信した場合に、デコード部が合成音声信号をデコードできるか否かに応じて音声出力可否情報を生成して第2情報送信部に送信させるとともに、音声出力可否情報に応じて音声出力部の合成音声信号の出力を制御する第2制御部と、を具備することを特徴とする。
本発明の第2の局面に係る音声出力システムは、以下の音声読上げ装置および音声出力装置を含む。
音声読上げ装置は、読上げ音声信号を出力する音声出力装置とネットワークで接続される。この音声読上げ装置は、ネットワークを介して、音声出力装置へ文字情報及び読上げ状態通知要求を送信する第1情報送信部と、ネットワークを介して、音声出力装置から読上げ状態通知応答を受信する第1情報受信部と、第1情報受信部が文字情報受理を示す読上げ状態通知応答を受信するまで第1情報送信部に文字情報を送信させ続け、第1情報受信部が読上げ完了を示す読上げ状態通知応答を受信するまで第1情報送信部に読上げ状態通知要求を送信させ続ける第1制御部と、を具備することを特徴とする。
音声出力装置は、文字情報を出力する音声読上げ装置とネットワークで接続される。この音声出力装置は、放送音声信号を受信する音声信号入力部と、ネットワークを介して、音声読上げ装置から文字情報及び読上げ状態通知要求を受信する第2情報受信部と、ネットワークを介して、音声読上げ装置へ読上げ状態通知応答を送信する第2情報送信部と、音声信号入力部が受信した放送音声信号をデコードするデコード部と、第2情報受信部が受信した文字情報から読上げ音声信号を生成する音声信号生成部と、デコード部がデコードした放送音声信号と音声信号生成部が生成した読上げ音声信号を合成して合成音声信号を生成する合成音声信号生成部と、合成音声信号生成部が生成した合成音声信号を出力する音声出力部と、第2情報受信部が読上げ状態通知要求を受信した場合において文字情報の受信が完了した場合は文字情報受理を示す読上げ状態通知応答を第2情報送信部に送信させ、音声出力部が読上げ音声信号の出力を完了させた場合は読上げ完了を示す読上げ状態通知応答を第2情報送信部に送信させる第2制御部と、を具備することを特徴とする。
上述した第1の局面に係る音声出力システムによると、音声出力装置が音声出力可能な場合にのみ、音声読上げ装置から読上げ音声信号が音声出力装置へ送信される。音声出力装置は、音声出力が可能な場合にのみ読上げ音声信号を出力する。上述した第2の局面に係る音声出力システムによると、音声読上げ装置は音声出力装置が音声出力可能であるか否かに関わらず、音声読上げ装置から文字情報が音声出力装置へ送信される。音声出力装置は音声出力が可能な場合にのみ文字情報から読上げ音声信号を生成して出力する。このため、いずれのシステムにおいても、テレビまたはレコーダ等の音声読上げ装置をシアター機器等の音声出力装置に接続した場合に、途切れさせることなく音声出力装置から読上げ音声信号を出力することができる。
図1は、本発明の第1の実施の形態に係る音声出力システムの全体構成図である。 図2は、図1の音声読上げ装置(テレビ1000)の制御ブロック図である。 図3は、図1の音声出力装置(シアター機器3000)の制御ブロック図である。 図4は、図1の音声出力システムにおける通信シーケンスを示す図である。 図5は、図1の音声読上げ装置(テレビ1000)および音声出力装置(シアター機器3000)で実行されるプログラムの制御構造を示すフローチャート(その1)である。 図6は、図1の音声読上げ装置(テレビ1000)および音声出力装置(シアター機器3000)の制御部で実行されるプログラムの制御構造を示すフローチャート(その2)である。 図7は、本発明の第2の実施の形態に係る音声出力システムの全体構成図である。 図8は、図7の音声読上げ装置(テレビ1100)の制御ブロック図である。 図9は、図7の音声出力装置(シアター機器3100)の制御ブロック図である。 図10は、図7の音声出力システムにおける通信シーケンスを示す図である。 図11は、図7の音声読上げ装置(テレビ1100)および音声出力装置(シアター機器3100)の制御部で実行されるプログラムの制御構造を示すフローチャート(その1)である。 図12は、図7の音声読上げ装置(テレビ1100)および音声出力装置(シアター機器3100)の制御部で実行されるプログラムの制御構造を示すフローチャート(その2)である。
以下、図面を参照して、本発明の実施の形態に係る音声出力システムについて説明する。なお、以下の説明においては、同一の構成については同一の符号を付してある。それらの名称および機能は同じである。従って、それらについての詳細な説明は繰り返さない。
<第1の実施の形態>
図1〜図6を参照して、本発明の第1の実施の形態に係る音声出力システムについて説明する。本実施の形態に係る音声出力システムにおいては、実際に音声をスピーカから出力する音声出力装置(たとえばシアター機器、テレビ)の音声ミュート状態を、音声読上げ装置(たとえばレコーダ、テレビ)に通知して、読上げ音声を読上げるタイミングを調整する。
(全体システム構成)
本実施の形態に係る音声出力システムは、限定されるものではないが、図1に示す(A)および(B)の2つの態様が考えられる。図1(A)に示す音声出力システムは、音声出力装置がシアター機器3000であって、音声読上げ装置がテレビ1000およびレコーダ2000である。図1(B)に示す音声出力システムは、音声出力装置がテレビ1001、音声読上げ装置がレコーダ2000である。このように、スピーカを備えるテレビは、音声出力装置としても、音声を読み上げる音声読上げ装置(この場合には音声出力装置はシアター機器)としても機能する。これらの装置は、ネットワーク接続され、放送等の音声信号(放送の音声信号、録画された放送の音声信号、メディアを再生した音声信号などを含む。以下、放送音声信号と記載する。)に読上げ音声信号を重畳した合成音声信号、ならびに、音声出力装置の音声出力可能状態であるか否かを示す情報(音声出力可否情報、後述するコマンド、フラグに対応する)を送受信する。ここで、放送音声信号の符号化方式が、たとえばAACからリニアPCMに切り替わった場合、音声読上げ装置は、リニアPCMの放送音声信号に読上げ音声信号を重畳したリニアPCMの合成音声信号を音声出力装置へ出力する。ところが合成音声信号がAACからリニアPCMへ切り替わった場合に音声出力装置では音声ミュートするため、読上げ音声信号を重畳した合成音声信号が音声ミュートで出力されなかったり、頭切れしたりする。本実施の形態に係る音声出力システムは、このような問題を解決する。
図1(A)に示す場合には、
(1)シアター機器3000は、音声ミュート状態に対応する音声ミュート状態通知コマンド(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。
(2)テレビ1000およびレコーダ2000は、読上げ音声の読上げ前にシアター機器3000の音声ミュート状態を確認する。このとき、テレビ1000およびレコーダ2000はシアター機器3000へ音声ミュート状態を取得する音声ミュート状態取得コマンドを送信する。シアター機器3000は、音声ミュート状態取得コマンドを受信すると、自己の音声ミュート状態に対応する音声ミュート状態通知コマンドを送信する。
(3)テレビ1000およびレコーダ2000は、シアター機器3000が音声ミュート状態であれば、放送音声信号のみから構成される合成音声信号をシアター機器3000へ出力し、音声ミュート状態が解除されると(非音声ミュート状態になると)、読上げ音声信号を放送音声信号に重畳した合成音声信号をシアター機器3000へ出力する。
(4)テレビ1000およびレコーダ2000は、音声読上げ途中にシアター機器3000から音声ミュート状態通知コマンド(音声ミュート状態[Mute ON])を受信すると、読上げ音声の読上げを一時的に停止し(この状態では放送音声信号のみから構成される合成音声信号を出力する)、音声ミュート状態が解除されると、読上げ音声信号を放送音声信号に重畳した合成音声信号をシアター機器3000へ出力して読上げ音声の読上げを再開(途中から読上げ)またはリトライ(最初から読上げ)する。
図1(B)に示す場合には、
(1)テレビ1001は、音声ミュート状態に対応する音声ミュート状態通知コマンド(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。
(2)レコーダ2000は、読上げ音声の読上げ前にテレビ1001の音声ミュート状態を確認する。このとき、レコーダ2000はテレビ1001へ音声ミュート状態を取得する音声ミュート状態取得コマンドを送信する。テレビ1001は、音声ミュート状態取得コマンドを受信すると、自己の音声ミュート状態に対応する音声ミュート状態通知コマンドを送信する。
(3)レコーダ2000は、テレビ1001が音声ミュート状態であれば、放送音声信号のみから構成される合成音声信号をテレビ1001へ出力し、音声ミュート状態が解除されると(非音声ミュート状態になると)、読上げ音声信号を放送音声信号に重畳した合成音声信号をテレビ1001へ出力する。
(4)レコーダ2000は、音声読上げ途中にテレビ1001から音声ミュート状態通知コマンド(音声ミュート状態[Mute ON])を受信すると、読上げ音声の読上げを一時的に停止し(この状態では放送音声信号のみから構成される合成音声信号を出力する)、音声ミュート状態が解除されると、読上げ音声信号を放送音声信号に重畳した合成音声信号をテレビ1001へ出力して読上げ音声の読上げを再開(途中から読上げ)またはリトライ(最初から読上げ)する。
なお、音声読上げ装置と音声出力装置との間で通知するコマンドは、音声読上げ許可および音声読上げ禁止フラグ等であっても、同じ機能が実現できる。また、音声読上げ装置と音声出力装置との間の通信線は、HDMI(登録商標)(High−Definition Multimedia Interface)、住宅内LAN(Local Area Network)等である。なお、HDMI(登録商標)で接続する場合、HDMI(登録商標)で規格化されている機器制御信号および制御プロトコルであるCEC(Consumer Electronics Control)を用いることができる。
以下においては、図1(A)の態様であって、音声読上げ装置がテレビ1000であり、音声出力装置がシアター機器3000であるとして説明する。なお、図1(A)のレコーダ2000は、音声読上げ装置としての部分はテレビ1000と同じ構成であるため、説明を繰り返さない。
(ハードウェア構成:制御ブロック図)
図2に音声読上げ装置の一例であるテレビ1000の制御ブロック図を示す。このテレビ1000は、デジタル放送信号を受信してデコードして映像および音声を出力する機能を実現する。このような機能を実現する構成に加えて、このテレビ1000は、図2に示す制御ブロックを備える。
図2に示すように、テレビ1000は、このテレビ1000を制御するCPU(Cen
tral Processing Unit)等で構成される制御部1010(第1制御部
)と、その制御部1010に接続された複数のユニットで構成される。これらのユニットは、たとえば、ユーザからの音声の読上げ指示を制御部1010へ入力するユーザインターフェイス1020と、設定された時間になると音声の読上げ指示を制御部1010へ入力するタイマ1022と、制御部1010からの要求に従い音声出力装置(ここではシアター機器3000)のミュート状態を取得する制御コマンド(音声ミュート状態取得コマンド)を送信する制御コマンド送信部1030と、音声ミュート状態取得コマンドに応答して音声出力装置のミュート状態を示す制御コマンド(音声ミュート状態通知コマンド)を受信して制御部1010へ通知する制御コマンド受信部1032(第1情報受信部)と、を含む。
さらに、これらのユニットは、シアター機器3000で読上げるテキストデータを記憶した読上げテキストデータ記憶部1040と、制御部1010からの指令(読上げテキスト音声信号生成・出力要求)に従って読上げテキストデータから読上げ音声信号を生成する音声信号生成部1050と、制御部1010からの指令(合成要求)に従ってオーディオソース1060から入力された放送音声信号と音声信号生成部1050から入力された読上げ音声信号とを合成する音声合成部1070と、制御部1010からの指令(音声信号出力要求)に従って音声合成部1070から入力された合成音声信号を音声出力装置へ出力する音声信号出力部1090(第1情報送信部)と、を含む。
図3に音声出力装置の一例であるシアター機器3000の制御ブロック図を示す。このシアター機器3000は、合成音声信号を受信してデコードして合成音声(放送音声および読上げ音声)を出力する機能を実現する。このような機能を実現するために、このシアター機器3000は、図3に示す制御ブロックを備える。
図3に示すように、シアター機器3000は、このシアター機器3000を制御するCPU等で構成される制御部3010(第2制御部)と、その制御部3010に接続された複数のユニットで構成される。これらのユニットは、たとえば、音声読上げ装置(ここではテレビ1000)からの制御コマンド(音声ミュート状態取得コマンド)を受信する制御コマンド受信部3020(第2情報受信部)と、シアター機器3000の音声ミュート状態を示す制御コマンド(音声ミュート状態通知コマンド)をテレビ1000へ送信する制御コマンド送信部3022(第2情報送信部)とを含む。
さらに、これらのユニットは、ネットワークを介してテレビ1000から合成音声信号を受信し、合成音声信号の状態を制御部3010へ通知する音声信号入力部3030と、制御部3010からの指令(デコード要求)に従って音声信号入力部3030から入力された合成音声信号をデコードするデコーダ3050(デコード部)と、制御部3010からの指令(音声ミュート制御要求)に従ってデコーダ3050から入力されたデコードされた合成音声信号を音声ミュートする音声ミュート部3060と、制御部3010からの指令(音声出力制御要求)に従って音声ミュート部3060から入力されたデコードされた合成音声信号をスピーカ3080へ出力する音声出力部3070と、を含む。
制御部3010は、音声信号入力部3030へ入力された合成音声信号の状態を取得する。AACからリニアPCMへ合成音声信号の符号化が変化した場合には、デコーダ3050の符号化設定を切り替える必要がある。デコーダ3050では符号化設定を切り替えている間は正規のデコード処理ができないので、デコーダ3050での符号化設定の切替が完了するまで、制御部3010は、音声ミュートをオンすることを示す音声ミュート制御要求を音声ミュート部3060へ出力して、デコーダ3050から入力されるデコードされた合成音声信号を音声出力部3070へ出力させないようにする。この状態において、テレビ1000から音声ミュート状態取得コマンドを受信した場合、制御部3010は、制御コマンド送信部3022を介して音声ミュート状態通知コマンドとして[Mute
ON]コマンドをテレビ1000へ送信する。デコーダ3050での符号化設定情報の切替が完了すると、制御部3010は、音声ミュートを解除することを示す音声ミュート制御要求を音声ミュート部3060に出力して、デコーダ3050から入力された合成音声信号を音声出力部3070へ出力させる。この状態において、テレビ1000から音声ミュート状態取得コマンドを受信した場合、制御部3010は、制御コマンド送信部3022を介して音声ミュート状態通知コマンドとして[Mute OFF]コマンドをテレビ1000へ送信する。
なお、テレビ1000の制御部1010およびシアター機器3000の制御部3010のいずれも、フラグ等を記憶するフラグ記憶部および後述するプログラムを記憶するプログラム記憶部を備える。
(通信シーケンス)
図4を参照して、本実施の形態に係る音声出力システムにおける通信シーケンスについて説明する。図4に示す音声読上げ装置は、テレビ1000であったりレコーダ2000であったりして、音声出力装置は、シアター機器3000であったりテレビ1001であったりする。ここでは、音声読上げ装置がテレビ1000であり、音声出力装置がシアター機器3000であるとして説明する。
テレビ1000は、定期的にまたは不定期的に音声ミュート状態取得コマンドをシアター機器3000へ送信する。シアター機器3000は、受信した音声ミュート状態取得コマンドに応答して、音声ミュート状態通知コマンドをテレビ1000へ送信する。このとき、シアター機器3000が、音声ミュート状態であると音声ミュート状態通知コマンドとして[Mute ON]コマンドをテレビ1000へ送信する。シアター機器3000が、音声ミュート状態でなくなると音声ミュート状態通知コマンドとして[Mute OFF]コマンドをテレビ1000へ送信する。
テレビ1000は、音声ミュート状態通知コマンドとして[Mute ON]コマンドを受信すると、音声ミュート状態通知コマンドとして[Mute OFF]コマンドを受信するまで、読上げ音声信号の出力をポーリングする。すなわち、[Mute ON]コマンドを受信している間は、放送音声信号のみからなる合成音声信号をシアター機器3000へ出力する。そして、音声ミュート状態通知コマンドとして[Mute OFF]コマンドを受信すると、読上げ音声信号を放送音声信号に重畳した合成音声信号をシアター機器3000へ出力する(読上げ音声信号出力)。
読上げ音声信号が合成音声信号に重畳されてテレビ1000からシアター機器3000へ出力されている間において、シアター機器3000が音声ミュート状態になると音声ミュート状態通知コマンドとして[Mute ON]コマンドをテレビ1000へ送信する。テレビ1000は、この状態では読上げ音声信号を放送音声信号に合成せず(読上げ音声信号出力停止)、放送音声信号のみから構成される合成音声信号をシアター機器3000に出力する。
シアター機器3000が、音声ミュート状態でなくなると音声ミュート状態通知コマンドとして[Mute OFF]コマンドをテレビ1000へ送信する。テレビ1000は、[Mute OFF]コマンドを受信すると、読上げ音声信号を放送音声信号に重畳した合成音声信号のシアター機器3000への出力を再開する(読上げ音声信号出力再開)。このように、テレビ1000は、合成音声信号の出力中に音声ミュート状態通知コマンドとして[Mute ON]コマンドを受信すると、[Mute OFF]コマンドを受信するまで、読上げ音声信号を合成音声信号に重畳せずに放送音声信号のみから構成される合成音声信号をシアター機器3000へ出力し続ける。
(フローチャート構成)
図5および図6を参照して、本実施の形態に係る音声出力システムを構成する音声読上げ装置であるテレビ1000および音声出力装置であるシアター機器3000で実行される音声出力処理の制御構造について説明する。ここでは、図1(A)に示すように、音声読上げ装置がテレビ1000であり、音声出力装置がシアター機器3000であり、レコーダ2000が存在しないものとして説明する。なお、以下においては、通信トラブル等に起因する通信タイムアウトエラーは想定しないものとする。
図5の左側のフローチャートを参照して、ステップ(以下、ステップをSと記載)3000にて、シアター機器3000の制御部3010(以下、単に制御部3010と記載)は、音声ミュート設定するか否かを判定する。このとき、制御部3010は、音声信号入力部3030に入力された合成音声信号の符号化がAACからリニアPCMへ切り替わったと判断した場合、シアター機器3000を音声ミュート状態に設定する。音声ミュートが設定されると(S3000にてYES)、処理はS3002へ移される。一方、音声信号入力部3030に入力された合成音声信号の符号化に変更がないと判断した場合、あるいはデコーダ3050において符号化設定の切替が完了したと判断した場合は、音声ミュート状態が解除されるので(S3000にてNO)、この処理はS3004へ移される。
S3002にて、制御部3010は、音声ミュート状態通知コマンドを[Mute ON]に設定する。その後、この処理はS3006へ移される。S3004にて、制御部3010は、音声ミュート状態通知コマンドを[Mute OFF]に設定する。その後、この処理はS3006へ移される。
S3006にて、制御部3010は、制御コマンド受信部3020が音声ミュート状態取得コマンドをテレビ1000から受信したか否かを判定する。音声ミュート状態取得コマンドをテレビ1000から受信すると(S3006にてYES)、処理はS3008へ移される。もしそうでないと(S3006にてNO)、この処理はS3000へ移される。
S3008にて、制御部3010は、制御コマンド送信部3022に音声ミュート状態通知コマンド([Mute ON]または[Mute OFF])をテレビ1000へ送信させる。
図5の右側のフローチャートを参照して、S1000にて、テレビ1000の制御部1010(以下、単に制御部1010と記載)は、たとえば一定の時間間隔で、制御コマンド送信部1030に音声ミュート状態通知コマンドをシアター機器3000へ送信させる。
S1002にて、制御部1010は、制御コマンド受信部1032が音声ミュート状態通知コマンド([Mute ON])をシアター機器3000から受信したか否かを判定する。音声ミュート状態通知コマンド([Mute ON])をシアター機器3000から受信すると(S1002にてYES)、処理はS1004へ移される。もしそうでないと(S1002にてNO)、この処理はS1006へ移される。S1004にて、制御部1010は、フラグ記憶部に記憶された音声ミュートフラグ(以下、単にミュートフラグまたはフラグと記載する場合がある)をオンにセットする。その後、処理はS1000へ移される。
S1006にて、制御部1010は、制御コマンド受信部1032が音声ミュート状態通知コマンド([Mute OFF])をシアター機器3000から受信したか否かを判定する。音声ミュート状態通知コマンド([Mute OFF])をシアター機器3000から受信すると(S1006にてYES)、処理はS1008へ移される。もしそうでないと(S1006にてNO)、この処理はS1000へ移される。S1008にて、制御部1010は、フラグ記憶部に記憶されたミュートフラグをオフにセットする。その後、処理はS1000へ移される。
図6の左側のフローチャートを参照して、S1020にて、制御部1010は、音声読上げ指示を検出したか否かを判定する。このとき、制御部1010は、ユーザインターフェイス1020を介して音声読上げ指示を検出したり、タイマ1022から指示に基づいて音声読上げ指示を検出したりする。音声読上げ指示を検出すると(S1020にてYES)、処理はS1022へ移される。もしそうでないと(S1020にてNO)、この処理はS1020へ移される。
S1022にて、制御部1010は、フラグ記憶部に記憶されたミュートフラグの状態を判定する。ミュートフラグがオン状態であれば(S1022にてYES)、放送音声信号のみから構成される合成音声信号を生成させて出力させる(S1023)。一方、ミュートフラグがオフ状態であれば(S1022にてNO)、放送音声信号に読上げ音声信号を重畳した合成音声信号を生成させて出力させる(S1024)。なお、このとき、制御部1010は、タイムアウト前の読上げ音声信号のみを合成音声信号に重畳してシアター機器3000へ出力する。読上げ音声信号の中にはある時間までに読上げを終了しないと意味がない読上げ音声もあるため、シアター機器3000で、タイムアウト前のみの読上げ音声を読み上げて、意味のないタイムアウト後の読上げ音声は読上げないようにする。
S1026にて、制御部1010は、ミュートフラグが切り替わったか否かを判定する。図5および図6に示すフローチャートは同時に実行されており、S1023、S1024の処理中であっても、S1000〜S1008の処理が実行されているので、合成音声信号の出力中であっても、ミュートフラグが切り替わることがある。ミュートフラグが切り替わると(S1026にてYES)、処理はS1028へ移される。もしそうでないと(S1026にてNO)、この処理はS1032へ移される。
S1028にて、制御部1010は、ミュートフラグがオン状態からオフ状態に切り替わったか否かを判定する。ミュートフラグがオン状態からオフ状態に切り替わると(S1028にてYES)、処理はS1030へ移される。ミュートフラグがオフ状態からオン状態に切り替わると(S1028にてNO)、この処理はS1031へ移される。
S1030にて、制御部1010は、放送音声信号に読上げ音声信号を重畳した合成音声信号を生成させて出力させる。このとき、制御部1010は、テレビ1000からシアター機器3000へ読上げ音声信号を再伝送する。ここで、音声読上げ文章の最初から、段落の最初から、または、単語の最初から等の予め定められた部分から、再伝送される。なお、再伝送する開始部分は特に限定されない。S1031にて、制御部1010は、放送音声信号のみから構成される合成音声信号を生成させて出力させる。
S1032にて、制御部1010は、合成音声信号の出力が終了したか否かを判定する。送信すべき合成音声信号の出力が終了すると(S1032にてYES)、処理はS1020へ移される。もしそうでないと(S1032にてNO)、この処理はS1022へ移され、ミュート状態に応じた合成音声信号の出力が継続される。
図6の右側のフローチャートを参照して、S3020にて、制御部3010は、テレビ1000から合成音声信号を受信したか否かを判定する。合成音声信号を受信すると(S3020にてYES)、処理はS3022へ移される。もしそうでないと(S3020にてNO)、この処理はS3020へ移される。
S3022にて、制御部3010は、テレビ1000から受信した合成音声信号をデコードしてスピーカ3080から合成音声を出力させる。
(動作)
以上のような構造およびフローチャートに基づく本実施の形態に係る音声出力システムの動作について説明する。
・音声ミュートフラグがオフを維持している場合
この動作の説明においては、たとえば、シアター機器3000へ送信される合成音声信号の符号化がAACからリニアPCMへ変化しない場合を説明する。テレビ1000のリモコンでユーザが音声読上げを指示すると(S1020にてYES)、音声ミュートフラグがオンであるか否かが検出され、この場合、音声ミュートフラグがオフであるので(S1022にてNO)、テレビ1000からシアター機器3000へ読上げ音声信号を重畳した合成音声信号が出力される(S1024)。
このとき、シアター機器3000においては音声ミュート設定されていない(S3000にてNO、S3004)。シアター機器3000は、テレビ1000から音声ミュート状態取得コマンドを受信すると(S3006にてYES)、音声ミュート状態通信コマンド([Mute OFF])をテレビ1000へ送信する(S3008)。テレビ1000は、音声ミュート状態取得コマンドを送信すると(S1000)、音声ミュート状態通知コマンドとして[Mute OFF]を受信するので(S1006にてYES)、音声ミュートフラグをオフの状態として維持する(S1008)。つまり、合成音声信号の出力中において、音声ミュートフラグがオンにならない(S1032にてYESになるまでS1026にてNO)。
音声出力装置であるシアター機器3000には、読上げ音声信号と放送音声信号とを重畳した合成音声信号が途切れることなく送信されてくるとともに、シアター機器3000へ送信された合成音声信号の符号化も変化しないので音声ミュート状態にならない。このため、テレビ1000から送信された読上げ音声信号は、シアター機器3000で途切れることなく出力される。
・音声ミュートフラグがオンを維持している場合
この動作の説明においては、たとえば、シアター機器3000へ送信される合成音声信号の符号化がAACからリニアPCMへ変化し、シアター機器3000のデコーダ3050での符号化設定の切替が完了するまでの間の処理を説明する。この場合、音声ミュートフラグがオンであるので(S1022にてYES)、放送音声信号のみから構成される合成音声信号(読上げ音声信号が重畳されていない合成音声信号)の出力が行われている(S1023)。
このとき、シアター機器3000においては音声ミュート設定されている(S3000にてYES、S3002)。シアター機器3000は、テレビ1000から音声ミュート状態取得コマンドを受信すると(S3006にてYES)、音声ミュート状態通信コマンド([Mute ON])をテレビ1000へ送信する(S3008)。テレビ1000は、音声ミュート状態取得コマンドを送信すると(S1000)、音声ミュート状態通知コマンドとして[Mute ON]を受信するので(S1002にてYES)、音声ミュートフラグがオンの状態となる(S1004)。
つまり、シアター機器3000のデコーダ3050での符号化設定の切替が完了するまでの間は、音声ミュートフラグはオンを維持する。このため、合成音声信号の出力中において、音声ミュートフラグがオフにならない(S1032にてYESになるまでS1026にてNO)。
音声出力装置であるシアター機器3000には、放送音声信号のみから構成される合成音声信号が途切れることなく送信されてくるが、音声ミュート状態であるので、受信した合成音声信号は音声ミュートされ音声出力されない。
・合成音声信号の出力後に、音声ミュートフラグが変化する場合
この動作の説明においては、たとえば、合成音声信号出力中に、シアター機器3000へ送信される放送音声信号の符号化がAACからリニアPCMへ変化した場合(すなわち、音声ミュートフラグがオフからオンに変化し、その後、オンからオフに変化する場合)を説明する。この場合、まず、テレビ1000が合成音声信号の出力中に音声ミュートフラグがオフからオンへ変化する(S1032にてYESになる前にS1026にてYES)。このため、読上げ音声信号を重畳した合成放送信号の出力(S1024)から、読上げ音声信号を重畳しない合成音声信号の出力に切り替わる(S1031)。
このとき、テレビ1000がシアター機器3000へ合成音声信号を出力している最中に、シアター機器3000において音声ミュート設定される(S3000にてYES、S3002)。シアター機器3000は、テレビ1000から音声ミュート状態取得コマンドを受信し(S3006にてYES)、応答として音声ミュート状態通信コマンド([Mute ON])をテレビ1000へ送信する(S3008)。テレビ1000は、音声ミュート状態取得コマンドを送信すると(S1000)、音声ミュート状態通知コマンドとして[Mute ON]を受信するので(S1002にてYES)、音声ミュートフラグをオンの状態に切り替える(S1004)。音声出力装置であるシアター機器3000には、放送音声信号のみから構成される合成音声信号が途切れることなく送信されてくるが、音声ミュート状態であるので、受信した合成音声信号は音声ミュートされ音声出力されない。
その後、デコーダ3050での符号化設定の切替が完了したときにシアター機器3000において音声ミュート設定されなくなる(S3000にてNO、S3004)。シアター機器3000は、テレビ1000から音声ミュート状態取得コマンドを受信すると(S3006にてYES)、音声ミュート状態通信コマンド([Mute OFF])をテレビ1000へ送信する(S3008)。テレビ1000は、音声ミュート状態取得コマンドを送信すると(S1000)、音声ミュート状態通知コマンドとして[Mute OFF]を受信するので(S1006にてYES)、音声ミュートフラグがオンからオフの状態へ切り替わる(S1008)。
合成音声信号の出力が開始されてから(S1023、S1024)、音声ミュートフラグがオフからオンになり(S1028にてNO)、音声ミュートフラグがオンからオフになるまで(S1028にてYES)、読上げ音声信号の合成出力は中断状態になるが、音声ミュートフラグがオンからオフへ切り替わると(S1028にてYES)、読上げ音声信号の合成出力は再開される。
音声出力装置であるシアター機器3000では、テレビ1000から読上げ音声信号と放送音声信号を重畳した合成音声信号が出力された後において、合成音声信号の符号化がAACからリニアPCMへ切り替わり音声ミュート設定されると、テレビ1000からの読上げ音声信号の合成出力が一時的に停止される。その後、シアター機器3000での音声ミュート状態が解除されると、テレビ1000からの読上げ音声信号の合成出力が再開される。このため、シアター機器3000が音声ミュート設定されていて音声出力できない場合には、テレビ1000は読上げ音声信号の送信を一時的に停止して、シアター機器3000が音声ミュート設定されなくなり音声出力できるようになると、テレビ1000は読上げ音声信号の送信を再開して、読上げ音声信号を再伝送する。このため、シアター機器3000は、音声ミュート状態であるときにテレビ1000から読上げ音声信号を受信しないで、音声ミュート状態でなくなるとテレビ1000から読上げ音声信号を受信するので、テレビ1000から送信された読上げ音声は、シアター機器3000で途切れることなく出力される。
以上のようにして、本実施の形態に係る音声出力システムによると、音声出力装置であるシアター機器が音声ミュート状態(音声出力不可能)であるか否かを音声読上げ装置であるテレビまたは/およびレコーダが、放送等の音声信号および読上げ音声信号を含む合成音声信号を出力する前に検出しておく。シアター機器が音声ミュート状態でないと、この合成音声信号をシアター機器へ出力して、シアター機器が音声ミュート状態であると、読上げ音声信号を含まない合成音声信号をシアター機器へ出力する。合成音声信号をシアター機器へ出力中に、シアター機器が音声ミュート状態に切り替わると、読上げ音声信号のシアター機器への合成出力を一時的に停止して、シアター機器が音声ミュート状態でなくなると、読上げ音声信号のシアター機器への合成出力を再開する。このように、一時的な停止を含めて、シアター機器が音声出力可能な状態であるときにのみ、テレビが読上げ音声信号を含む合成音声信号をシアター機器へ出力するので、シアター機器は特別な制御を行うことなく受信した合成音声信号に基づき合成音声を出力する。その結果、テレビから送信された読上げ音声を含む合成音声は、シアター機器で途切れることなく、全ての読上げ音声が放送等の音声とともに出力される。
なお、本実施の形態に係る音声出力システムは、以下のように変形することができる。音声ミュート状態だけでなく、音量、サラウンド等の音声設定状態を通知することにより、設定状態を最適な音声読上げ状態に変更した後で読上げ音声を出力する。さらに、音声ミュート状態を通知する信号線および読上げ音声を出力する信号線は、有線として説明したが、有線である必要はなく、無線であっても構わない。さらに、音声出力装置は、音声読上げ装置と別体で説明したが、一体であってもよい。
<第2の実施の形態>
図7〜図12を参照して、本発明の第2の実施の形態に係る音声出力システムについて説明する。本実施の形態に係る音声出力システムにおいては、読上げるテキストを、音声読上げ装置(たとえばレコーダ、テレビ)から、実際に音声をスピーカから出力する音声出力装置(たとえばシアター機器、テレビ)にテキストデータとして通知し、音声出力装置がタイミングを調整して読上げ音声を出力する。なお、以下の本実施の形態についての説明において、上述した第1の実施の形態と同じ構成については、ここでは説明を繰り返さない。
(全体システム構成)
本実施の形態に係る音声出力システムは、限定されるものではないが、図7に示す(A)および(B)の2つの態様が考えられる。図7(A)に示す音声出力システムは、音声出力装置がシアター機器3100であって、音声読上げ装置がテレビ1100およびレコーダ2100である。図7(B)に示す音声出力システムは、音声出力装置がテレビ1101であって、音声読上げ装置がレコーダ2100である。このように、第1の実施の形態と同様に、スピーカを備えるテレビは、音声出力装置としても、音声を読み上げる音声読上げ装置(この場合には音声出力装置はシアター機器)としても機能する。これらの装置は、ネットワーク接続され、放送等の音声信号(放送の音声信号、録画された放送の音声信号、メディアを再生した音声信号などを含む。以下、放送音声信号と記載する。)、読上げ音声のテキストデータ、および、音声出力装置におけるテキストデータの受信状態または読上げ完了状態を示す情報を送受信する。
図7(A)に示す場合には、
(1)テレビ1100およびレコーダ2100は、シアター機器3100へ、読上げ音声の読上げテキスト通知コマンド(テキストデータ)を通知する。
(2)シアター機器3100は、音声ミュート状態に対応する音声ミュート状態を示すミュートフラグ(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。シアター機器3100は、自己が音声ミュート状態であれば、通知されたテキストデータを音声データに変換して出力することも、テレビ1100から入力された放送音声信号をスピーカから出力することもしない。音声ミュート状態が解除されると(非音声ミュート状態になると)、入力されたテキストデータを読み上げ音声信号に変換して、変換した読上げ音声信号と入力された放送音声信号とを合成して合成音声信号としてスピーカから出力する。なお、シアター機器3100は、自己が音声ミュート状態でなく、テキストデータが通知されていなければ、入力された放送音声信号をスピーカから出力している。
(3)テレビ1100、レコーダ2100、または複数のレコーダ2100などの複数の音声読上げ装置から、複数のテキストデータがシアター機器3100に通知された場合には、テキストデータをバッファしておいて、順次読上げることもできる。なお、テレビ1100、レコーダ2100がテキストデータを通知する際、遅延許容量(タイムアウト時間)なども通知して、その通知されたデータに基づいて音声を出力するようにしてもよい。
図7(B)に示す場合には、
(1)レコーダ2100は、テレビ1101へ、読上げ音声の読上げテキスト通知コマンド(テキストデータ)を通知する。
(2)テレビ1101は、音声ミュート状態に対応する音声ミュート状態を示すミュートフラグ(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。テレビ1101は、自己が音声ミュート状態であれば、通知されたテキストデータを音声データに変換して出力することも、レコーダ2100から入力された放送音声信号をスピーカから出力することもしない。音声ミュート状態が解除されると(非音声ミュート状態になると)、入力されたテキストデータを読上げ音声信号に変換して、変換した読上げ音声信号と入力された放送音声信号とを合成して合成音声信号としてスピーカから出力する。なお、テレビ1101は、自己が音声ミュート状態でなく、テキストデータが通知されていなければ、入力された放送音声信号をスピーカから出力している。
以下においては、図7(A)の態様であって、音声読上げ装置がテレビ1100であり、音声出力装置がシアター機器3100であるとして説明する。なお、図7(A)のレコーダ2100は、音声読上げ装置としての部分はテレビ1100と同じ構成であるため、説明を繰り返さない。
(ハードウェア構成:制御ブロック図)
図8に音声読上げ装置の一例であるテレビ1100の制御ブロック図を示す。このテレビ1100は、デジタル放送信号を受信してデコードして映像および音声を出力する機能を実現する。このような機能を実現する構成に加えて、このテレビ1100は、図8に示す制御ブロックを備える。
図8に示すように、テレビ1100は、このテレビ1100を制御するCPU等で構成される制御部1110(第1制御部)と、その制御部1110に接続された複数のユニットで構成される。これらのユニットは、たとえば、音声出力装置であるシアター機器3100へ読上げテキストデータを送信する読上げテキスト送信部1130(第1情報送信部)と、シアター機器3100から音声読上げ状態および音声読上げ結果を受信する音声出力装置状態通知受信部1132(第1情報受信部)と、シアター装置3100で読上げるテキストデータを記憶した読上げテキストデータ記憶部1040と、を含む。なお、読上げテキスト送信部1130(第1情報送信部)は、シアター機器3100へ読上げ状態取得コマンドも送信する。
図9に音声出力装置の一例であるシアター機器3100の制御ブロック図を示す。このシアター機器3100は、音声読上げ装置であるテレビ1100から読上げ音声テキストデータを受信して、テキストデータを読上げ音声信号に変換し、変換した読上げ音声信号を放送音声信号に重畳した合成音声信号を出力する機能を実現する。このような機能を実現するために、このシアター機器3100は、図9に示す制御ブロックを備える。
図9に示すように、シアター機器3100は、このシアター機器3000を制御するCPU等で構成される制御部3110(第2制御部)と、その制御部3110に接続された複数のユニットで構成される。これらのユニットは、たとえば、音声読上げ装置(ここではテレビ1100)からの読上げ音声テキストデータを受信する読上げテキスト受信部3120(第2情報受信部)と、音声読上げ状態および読上げ結果をテレビ1100へ送信する読上げ装置への状態通知送信部3122(第2情報送信部)と、を含む。なお、読上げテキスト受信部3120(第2情報受信部)は、音声読上げ装置(ここではテレビ1100)からの読上げ状態取得コマンドも受信する。
さらに、これらのユニットは、制御部3110からの指令(読上げテキスト音声信号生成・出力/停止要求)に従ってテレビ1100から送信された読上げテキストデータから読上げ音声信号を生成して出力したり読上げ音声信号の生成を停止したりする音声信号生成部3130と、テレビ1100から送信された放送音声信号をデコードするデコーダ3050からの音声信号と音声信号生成部3130からの音声信号とを合成して、合成音声信号を生成する音声合成部3140と、を含む。音声合成部3140で合成された合成音声信号は、音声ミュート部3060および音声出力部3070を経由してスピーカ3080から合成音声として出力される。
なお、テレビ1100の制御部1110およびシアター機器3100の制御部3110のいずれも、フラグ等を記憶するフラグ記憶部および後述するプログラムを記憶するプログラム記憶部を備える。さらに制御部3110は、テレビ1100から受信したデータを一時的に記憶するデータ一時記憶部を備える。
(通信シーケンス)
図10を参照して、本実施の形態に係る音声出力システムにおける通信シーケンスについて説明する。図10に示す音声読上げ装置は、テレビ1100であったりレコーダ2100であったりして、音声出力装置は、シアター機器3100であったりテレビ1101であったりする。ここでは、音声読上げ装置がテレビ1100であり、音声出力装置がシアター機器3100であるとして説明する。
テレビ1100は、音声読上げ指示を検出すると、読上げテキスト通知コマンドをシアター機器3100へ出力する。この読上げテキスト通知コマンドは、たとえば、[機器識別子][優先順位][テキストid][page番号][page数][text]から構成される。なお、通知するコマンドが1コマンドに収まらない場合は複数の読上げテキスト通知コマンドに分割して出力しても構わない。なお、[機器識別子]は、音声出力システムに複数の音声読上げ装置を含む場合、複数の中の1台を特定するための識別データである。
シアター機器3100は、テレビ1100から読上げテキスト通知コマンドを受信すると、読上げ状態通知コマンド([テキストid][受理])をテレビ1100へ送信する。テレビ1100は、シアター機器3100から読上げ状態通知コマンド([テキストid][受理])(読上げ状態通知応答)を受信するまでは読上げテキスト通知コマンドの出力をリトライすることが好ましい。
テレビ1100は、読上げ状態通知コマンド([テキストid][受理])をシアター機器3100から受信すると、読上げ状態取得コマンド([機器識別子][テキストid])(読上げ状態通知要求)をシアター機器3100へ送信する。
シアター機器3100は、テレビ1100から読上げ状態取得コマンド([機器識別子][テキストid])を受信すると、読上げテキスト通知コマンドの[text]として入力されたテキストを読上げ音声として読上げたか否かをテレビ1100へ送信する。シアター機器3100は、音声ミュート設定されていると音声出力できないので、テキストデータを読上げ音声として読上げていない。この場合には、読上げ状態通知コマンド([テキストid][受理])をテレビ1100へ送信する。一方、音声ミュート設定されておらず音声出力できる場合は、テキストを読上げ音声として読上げている。この場合には、読上げ状態通知コマンド([テキストid][完了])(読上げ状態通知応答)をテレビ1100へ送信する。この音声出力システムの中に複数のテレビ1100があっても、読上げ状態通知コマンドの送信先であるテレビ1100は、機器識別子により特定できる。
(フローチャート構成)
図11および図12を参照して、本実施の形態に係る音声出力システムを構成する音声読上げ装置であるテレビ1100および音声出力装置であるシアター機器3100で実行される音声出力処理の制御構造について説明する。ここでは、図7(A)に示すように、音声読上げ装置がテレビ1100であり、音声出力装置がシアター機器3100であり、レコーダ2100が存在しないものとして説明する。
図11のフローチャートを参照して、S3100にて、シアター機器3100の制御部3110(以下、単に制御部3110と記載)は、音声ミュート設定するか否かを判定する。このとき、制御部3110は、音声信号入力部3030に入力された放送音声信号の符号化がAACからリニアPCMへ切り替わったと判断した場合、シアター機器3100を音声ミュート状態に設定する。音声ミュートが設定されると(S3100にてYES)、処理はS3102へ移される。一方、音声信号入力部3030に入力された放送音声信号の符号化に変更がないと判断した場合、あるいはデコーダ3050において符号化設定の切替が完了したと判断した場合は、音声ミュート状態が解除されるので(S3100にてNO)、この処理はS3104へ移される。
S3102にて、制御部3110は、フラグ記憶部に記憶されたミュートフラグをオンにセットする。これで、[Mute ON]状態になる。その後、処理はS3100へ移される。S3104にて、制御部3110は、フラグ記憶部に記憶されたミュートフラグをオフにセットする。これで、[Mute OFF]状態になる。その後、処理はS3100へ移される。
図12の右側のフローチャートを参照して、S1120にて、制御部1110は、音声読上げ指示を検出したか否かを判定する。このとき、制御部1110は、ユーザインターフェイス1020を介して音声読上げ指示を検出したり、タイマ1022から指示に基づいて音声読上げ指示を検出したりする。音声読上げ指示を検出すると(S1120にてYES)、処理はS1122へ移される。もしそうでないと(S1120にてNO)、この処理はS1120へ移される。
S1122にて、制御部1110は、読上げテキストデータ記憶部1040から読上げテキストデータを取得し、読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])を作成して、読上げテキスト送信部1130を介してシアター機器3100へ送信する。
S1126にて、制御部1110は、音声出力装置状態通知受信部1132を介して読上げ状態通知コマンド([テキストid][受理])をシアター機器3100から受信したか否かを判定する。読上げ状態通知コマンド([テキストid][受理])を受信すると(S1126にてYES)、処理はS1130へ移される。もしそうでないと(S1126にてNO)、この処理はS1128へ移される。
S1128にて、制御部1110は、読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])をシアター機器3100へ再送信(リトライ)するか否かを判定する。このとき、制御部1110は、予め定められたリトライ回数に到達するまではリトライすると判定する。リトライすると判定されると(S1128にてYES)、処理はS1122へ移される。もしそうでないと(S1128にてNO)、この処理はS1130へ移される。なお、本実施の形態の説明においては、テレビ1100が、予め定められたリトライ回数だけ読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])をシアター機器3100へ送信しても、テレビ1100が、読上げ状態通知コマンド([テキストid][受理])をシアター機器3100から受信しないことは想定しないものとする。
S1130にて、制御部1110は、読上げ状態取得コマンド([機器識別子][テキストid])を作成して、読上げテキスト送信部1130を介してシアター機器3100へ送信する。
S1132にて、制御部1110は、音声出力装置状態通知受信部1132を介して読上げ状態通知コマンド([テキストid][完了])をシアター機器3100から受信したか否かを判定する。読上げ状態通知コマンド([テキストid][完了])を受信すると(S1132にてYES)、処理はS1120へ移される。もしそうでないと(S1132にてNO)、この処理はS1130へ移される。なお、本実施の形態の説明においては、読上げ状態通知コマンド([テキストid][完了])をシアター機器3100から受信しないことは想定しないものとする。さらに、S1132にてNOの場合、処理をS1132へ移すようにしても構わない。すなわち、読上げ状態取得コマンド([機器識別子][テキストid])をシアター機器3100へ再送信しないで、読上げ状態通知コマンド([テキストid][完了])の受信を待つ。
図12の左側のフローチャートを参照して、S3120にて、制御部3110は、読上げテキスト受信部3120を介して読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])をテレビ1100から受信したか否かを判定する。読上げテキスト通知コマンドを受信すると(S3120にてYES)、処理はS3122へ移される。もしそうでないと(S3120にてNO)、この処理はS3120へ移される。
S3122にて、制御部3110は、テレビ1100からの読上げテキスト通知コマンドの受信が完了すると、読上げ状態通知コマンド([テキストid][受理])を作成し、読上げ装置への状態通知送信部3122を介して、機器識別子で特定されるテレビ1100へ送信する。
S3124にて、制御部3110は、フラグ記憶部に記憶されたミュートフラグがオン状態であるか否かを判定する。ミュートフラグがオン状態であると判定されると(S3124にてYES)、処理はS3126へ移される。もしそうでないと(S3124にてNO)、この処理はS3132へ移される。S3126にて、制御部3110は、テレビ1100から受信した読上げテキスト通知コマンドのテキストデータをデータ一時記憶部に一時的に記憶させる。
S3128にて、制御部3110は、データ一時記憶部に複数のテキストデータを記憶したか否かを判定する。このとき、通知するテキストが長くて複数のコマンドに分割して送信されたテキストデータは1つのデータとして扱う。複数のテキストデータを記憶したと判定されると(S3128にてYES)、処理はS3130へ移される。もしそうでないと(S3128にてNO)、この処理はS3124へ移される。
S3130にて、制御部3110は、複数のテキストデータの音声出力優先順位を決定する。このとき、たとえば、制御部3110は、読上げテキスト通知コマンドの優先順位に従って、テキストデータの音声出力優先順位を決定する。そして決定した音声出力優先順位をデータ一時記憶部に記憶しておく。その後、この処理はS3124へ移される。なお、音声読上げ装置の種類による優先順位(たとえばテレビ1100からのテキストデータはレコーダ2100からのテキストデータよりも優先順位が高い)に従って、[機器識別子]で音声読上げ装置とレコーダとを区別して、テキストデータの音声出力優先順位を決定することもできる。
S3132にて、制御部3110は、データ一時記憶部に音声出力優先順位が記憶されている場合は記憶された音声出力優先順位に従って、読上げテキスト受信部3120から入力されたテキストデータのうちタイムアウト前のみのテキストデータを抽出し、音声信号生成部3130に対応する読上げ音声信号を生成させ、スピーカ3080から読上げ音声信号が重畳された合成音声信号を出力させる。ここで、タイムアウトについて説明する。タイムアウトは、たとえば複数の音声読上げ装置(テレビ1100、レコーダ2100)から音声出力装置(シアター機器3100)に対して、同時に読上げテキストが通知された場合、音声出力装置は(音声出力優先順位があればその順位に従って)順次読上げ処理を実行する。読上げテキストの中にはある時間までに読上げを終了しないと意味がないテキストデータもあるため、タイムアウト前のみのテキストデータのみを読み上げて、意味のないタイムアウト後のテキストデータは読上げないようにする。なお、タイムアウト時間は、テレビ1100から読上げテキスト通知コマンドに付随するデータとしてシアター機器へ出力される。
S3134にて、制御部3110は、読上げテキスト(複数のテキストがあれば全てのテキストを)の音声出力が完了して、かつ、テレビ1100からの読上げ状態取得コマンド([機器識別子][テキストid])を受信すると、読上げ状態通知コマンド([テキストid][完了])を読上げ装置への状態通知送信部3122を介して機器識別子で特定されるテレビ1100へ送信する。その後、処理はS3120へ移される。
(動作)
以上のような構造およびフローチャートに基づく本実施の形態に係る音声出力システムの動作について説明する。なお、以下の説明においても、上述した第1の実施の形態における動作と同じ説明は繰り返さない。また、以下においては、通信トラブル等に起因する通信タイムアウトエラーは想定しないものとする。
・音声ミュートフラグがオフを維持している場合
この動作の説明においては、たとえば、シアター機器3100へ送信される放送音声信号の符号化がAACからリニアPCMへ変更しない場合を説明する。テレビ1100のリモコンでユーザが音声読上げを指示すると(S1120にてYES)、シアター機器3100の音声ミュートフラグがオンであるか否かに関わらず、読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])が、テレビ1100からシアター機器3100へ送信される(S1122)。
シアター機器3100は、読上げテキスト通知コマンドを受信する(S3120にてYES)。そして、テレビ1100からの読上げ状態取得コマンド([機器識別子][テキストid])の受信が完了すると、読上げ状態通知コマンド([テキストid][受理])が、シアター機器3100からテレビ1100へ送信される(S3122)。
テレビ1100が読上げ状態通知コマンド([テキストid][受理])を受信すると(S1126にてYES)、読上げテキスト通知コマンドがシアター機器3100へ再送信されることなく、読上げ状態取得コマンド([機器識別子][テキストid])がテレビ1100からシアター機器3100へ送信される(S1130)。その後、テレビ1100は、読上げ状態通知コマンド([テキストid][完了])がシアター機器3100から送信されるのを待つ(S1132)。
一方、読上げテキスト通知コマンドを受信したシアター機器3100は、ミュートフラグがオンではないので(S3124にてNO)、読上げテキスト通知コマンドと受信したテキストデータから音声信号生成部3130で読上げ音声信号を生成し、生成した読上げ音声信号を放送音声信号に重畳した合成音声信号をスピーカ3080から出力する(S3132)。スピーカ3080からの合成音声の出力が完了すると、読上げ状態通知コマンド([テキストid][完了])がシアター機器3100からテレビ1100へ送信される(S3134)。
音声出力装置であるシアター機器3100へ送信された放送音声信号の符号化が変化しないので音声ミュート状態にならない。音声読上げ装置であるテレビ1100から送信されてきたテキストデータから読上げ音声データが生成されて、放送音声信号に重畳されて合成音声信号として出力される。このため、テレビ1100から送信されたテキストデータは、シアター機器3100で途切れることなく音声信号へ変換されて、合成音声信号に含まれる読上げ音声信号として出力される。
・音声ミュートフラグがオンの場合
この動作の説明においては、シアター機器3100へ入力されたテレビ1100からの放送音声信号の符号化がAACからリニアPCMへ切り替わり、シアター機器3100のデコーダ3050での符号化設定の切替が完了するまでの間の処理を説明する。上述のように、シアター機器3100の音声ミュート状態に関係なく、読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])が、テレビ1100からシアター機器3100へ送信される(S1122)。
一方、シアター機器3100においては、音声ミュートが設定され(S3100にてYES)、音声ミュートフラグがオンにセットされている(S3102)。読上げテキスト通知コマンドをテレビ1100から受信したシアター機器3100においては、音声ミュートフラグがオンにセットされているので(S3124にてYES)、受信したテキストデータを一時的にデータ一時記憶部に記憶する(S3126)。なお、音声ミュートフラグがオンにセットされている状態においては、シアター機器3100が受信したテキストデータの全てが一時的にデータ一時記憶部に記憶される(S3124にてNOになるまでS3126〜S3130)。このような状態で複数のテキストデータを記憶すると(S3128にてYES)、音声出力優先順位が決定される(S3130)。
シアター機器3100のデコーダ3050の内部処理が終わると、音声ミュートが解除され(S3100にてNO、S3104)、ミュートフラグがオンからオフに切り替わる(S3124にてNO)。音声ミュートフラグがオフになると、シアター機器3100で、データ一時記憶部に記憶した1または複数のテキストデータから対応する1または複数の読上げ音声信号を生成して、読上げ音声信号の出力が開始される(S3132)。このとき、音声出力優先順位およびタイムアウト時間を考慮して、読上げ音声信号が出力される。テキストデータ(複数のテキストがあれば全てのテキストを)の音声を出力が完了すると、読上げ状態通知コマンド([テキストid][完了])がテレビ1100からシアター機器3100へ送信される(S3134)。
音声出力装置であるシアター機器3100へ送信された放送音声信号の符号化が変化して音声ミュート状態であるときには、テキストデータは一時的に記憶される。音声ミュート状態でなくなると、一時的に記憶しておいたテキストデータから読上げ音声信号が生成されて出力される。このため、テレビ1100から送信されたテキストデータは、シアター機器3000で途切れることなく読上げ音声信号へ変換されて、合成音声信号に含まれる読上げ音声信号として出力される。
以上のようにして、本実施の形態に係る音声出力システムによると、音声出力装置であるシアター機器が音声ミュート状態(音声出力不可能)であるか否かに関わらず、音声読上げ装置であるテレビまたは/およびレコーダは、読上げテキストデータをシアター機器へ送信する。シアター機器が音声ミュート状態でないと、テキストデータから読上げ音声信号を生成してシアター機器から合成音声(放送音声および読上げ音声)を出力する。シアター機器が音声ミュート状態であると、音声ミュート状態でなくなるまで、受信したテキストデータを一時的に記憶しておく。シアター機器が音声ミュート状態から音声ミュート状態でなくなると、一時的に記憶したテキストデータから読上げ音声信号を生成してシアター機器から合成音声(放送音声および読上げ音声)を出力する。その結果、テレビから送信されたテキストデータは、シアター機器で途切れることなく読上げ音声信号に変換されて、合成音声信号に含まれる読上げ音声信号として出力される。
なお、本実施の形態に係る音声出力システムは、以下のように変形することができる。音声ミュート状態を通知する信号線および読上げ音声を出力する信号線は、有線として説明したが、有線である必要はなく、無線であっても構わない。さらに、音声出力装置は、音声読上げ装置と別体で説明したが、一体であってもよい。さらに、音声読上げ装置は、音声読上げテキストだけでなく、たとえば、アクセント、話速、音量等の音声読上げ設定データを送信するようにしてもよい。
本発明は、例えば、音声出力できないタイミングが発生する音声出力装置であっても、読上げ装置からの読上げ音声信号を途切れることなく出力可能な音声出力システムに好適に利用できる。
1000、1001、1100、1101 テレビ
2000、2100 レコーダ
3000、3100 シアター機器
1010、1110 テレビ制御部
3010、3110 シアター機器制御部

Claims (14)

  1. 読上げ音声信号を出力する音声出力装置とネットワークで接続された音声読上げ装置であって、
    文字情報から前記読上げ音声信号を生成する音声信号生成部と、
    前記ネットワークを介して、前記音声出力装置から音声出力可否情報を受信する第1情報受信部と、
    前記ネットワークを介して、前記音声信号生成部が生成した前記読上げ音声信号を前記音声出力装置へ送信する第1情報送信部と、
    前記第1情報受信部が音声出力不可を示す音声出力可否情報を受信した場合に、音声出力可を示す音声出力可否情報を受信するまで前記第1情報送信部に前記読上げ音声信号の送信を待機させ、前記第1情報受信部が音声出力可を示す音声出力可否情報を受信した場合に、前記第1情報送信部に前記読上げ音声信号を送信させる第1制御部と、
    を具備することを特徴とする音声読上げ装置。
  2. 前記音声信号生成部が生成した前記読上げ音声信号と放送音声信号を合成して合成音声信号を生成する合成音声信号生成部、を更に備え、
    前記第1情報送信部は、前記合成音声信号生成部が生成した前記合成音声信号を前記音声出力装置へ出力し、
    前記第1制御部は、前記第1情報受信部が音声出力不可を示す音声出力可否情報を受信した場合に、音声出力可を示す音声出力可否情報を受信するまで前記合成音声信号生成部に前記放送音声信号のみから構成される合成音声信号を生成させて前記第1情報送信部に送信させ、前記第1情報受信部が音声出力可を示す音声出力可否情報を受信した場合に、前記合成音声信号生成部に前記読上げ音声信号と前記放送音声信号を合成した合成音声信号を生成させて前記第1情報送信部に送信させる、ことを特徴とする請求項1に記載の音声読上げ装置。
  3. 前記第1制御部は、前記第1情報送信部が前記読上げ音声信号を送信中に前記第1情報受信部が音声出力不可を示す音声出力可否情報を受信した場合に、音声出力可を示す音声出力可否情報を受信するまで前記第1情報送信部に前記読上げ音声信号の送信を待機させ、前記第1情報受信部が音声出力可を示す音声出力可否情報を受信した場合に、前記第1情報送信部に前記読上げ音声信号の送信を所定の部分から再開する、ことを特徴とする請求項1に記載の音声読上げ装置。
  4. 合成音声信号を出力する音声読上げ装置とネットワークで接続された音声出力装置であって、
    前記音声読上げ装置から前記合成音声信号を受信する音声信号入力部と、
    前記音声読上げ装置から音声状態取得要求を受信する第2情報受信部と、
    音声出力可否情報を前記音声読上げ装置へ送信する第2情報送信部と、
    前記音声信号入力部が受信した前記合成音声信号をデコードするデコード部と、
    前記デコード部がデコードした前記合成音声信号を出力する音声出力部と、
    前記第2情報受信部が前記音声状態取得要求を受信した場合に、前記デコード部が前記合成音声信号をデコードできるか否かに応じて前記音声出力可否情報を生成して前記第2情報送信部に送信させるとともに、前記音声出力可否情報に応じて前記音声出力部の前記合成音声信号の出力を制御する第2制御部と、
    を具備することを特徴とする音声出力装置。
  5. 読上げ音声信号を出力する音声出力装置とネットワークで接続された音声読上げ装置であって、
    前記ネットワークを介して、前記音声出力装置へ文字情報及び読上げ状態通知要求を送信する第1情報送信部と、
    前記ネットワークを介して、前記音声出力装置から読上げ状態通知応答を受信する第1情報受信部と、
    前記第1情報受信部が文字情報受理を示す前記読上げ状態通知応答を受信するまで前記第1情報送信部に前記文字情報を送信させ続け、前記第1情報受信部が読上げ完了を示す前記読上げ状態通知応答を受信するまで前記第1情報送信部に前記読上げ状態通知要求を送信させ続ける第1制御部と、
    を具備することを特徴とする音声読上げ装置。
  6. 文字情報を出力する音声読上げ装置とネットワークで接続された音声出力装置であって、
    放送音声信号を受信する音声信号入力部と、
    前記ネットワークを介して、前記音声読上げ装置から前記文字情報及び読上げ状態通知要求を受信する第2情報受信部と、
    前記ネットワークを介して、前記音声読上げ装置へ読上げ状態通知応答を送信する第2情報送信部と、
    前記音声信号入力部が受信した前記放送音声信号をデコードするデコード部と、
    前記第2情報受信部が受信した前記文字情報から読上げ音声信号を生成する音声信号生成部と、
    前記デコード部がデコードした前記放送音声信号と前記音声信号生成部が生成した前記読上げ音声信号を合成して合成音声信号を生成する合成音声信号生成部と、
    前記合成音声信号生成部が生成した前記合成音声信号を出力する音声出力部と、
    前記第2情報受信部が前記読上げ状態通知要求を受信した場合において前記文字情報の受信が完了した場合は文字情報受理を示す前記読上げ状態通知応答を前記第2情報送信部に送信させ、前記音声出力部が前記読上げ音声信号の出力を完了させた場合は読上げ完了を示す前記読上げ状態通知応答を前記第2情報送信部に送信させる第2制御部と、
    を具備することを特徴とする音声出力装置。
  7. 前記第2情報受信部が受信した前記文字情報を記憶するデータ一時記憶部、を更に備え、
    前記第2制御部は、前記デコード部が前記放送音声信号をデコードできるか否かを判断し、デコードできないと判断した場合は前記データ一時記憶部に前記文字情報を記憶させるとともに前記音声信号生成部に前記読上げ音声信号の生成を停止させ、デコードできると判断した場合は前記音声信号生成部に前記第2情報受信部が受信した前記文字情報または前記データ一時記憶部が記憶した前記文字情報から前記読上げ音声信号を生成させる、ことを特徴とする請求項6に記載の音声出力装置。
  8. 前記第2情報受信部は、複数の前記音声読上げ装置から前記文字情報及び前記読上げ状態通知要求を受信し、
    前記第2情報送信部は、複数の前記音声読上げ装置へ読上げ状態通知応答を送信し、
    前記データ一時記憶部は、複数の前記文字情報を記憶し、
    前記第2制御部は、前記デコード部が前記放送音声信号をデコードできると判断した場合は、前記音声信号生成部に前記第2情報受信部が受信した複数の前記文字情報または前記データ一時記憶部が記憶した複数の前記文字情報を所定の優先順位に従って順次複数の前記読上げ音声信号に変換させる、ことを特徴とする請求項7に記載の音声出力装置。
  9. 請求項1〜請求項3のいずれかに記載の音声読上げ装置と、請求項4に記載の音声出力装置とを含む、音声出力システム。
  10. 請求項5に記載の音声読上げ装置と、請求項6〜請求項8のいずれかに記載の音声出力装置とを含む、音声出力システム。
  11. 読上げ音声信号を出力する音声出力装置とネットワークで接続された音声読上げ装置における音声読上げ方法であって、
    文字情報から前記読み上げ音声信号を生成する生成ステップと、
    前記ネットワークを介して、前記音声出力装置から音声出力可否情報を受信する受信ステップと、
    前記ネットワークを介して、生成された前記読上げ音声信号を前記音声出力装置へ送信する送信ステップと、
    前記受信ステップにおいて音声出力不可を示す音声出力可否情報が受信された場合に、音声出力可を示す音声出力可否情報を受信するまで前記送信ステップに前記読上げ音声信号の送信を待機させ、前記受信ステップが音声出力可を示す音声出力可否情報を受信した場合に、前記送信ステップに前記読上げ音声信号を送信させる制御ステップと、
    を有することを特徴とする音声読上げ方法。
  12. 合成音声信号を出力する音声読上げ装置とネットワークで接続された音声出力装置における音声出力方法であって、
    前記音声読上げ装置から前記合成音声信号を受信する第1受信ステップと、
    前記音声読上げ装置から音声状態取得要求を受信する第2受信ステップと、
    音声出力可否情報を前記音声読上げ装置へ送信する送信ステップと、
    受信された前記合成音声信号をデコードするデコードステップと、
    デコードされた前記合成音声信号を出力する音声出力ステップと、
    前記第2受信ステップにおいて前記音声状態取得要求を受信した場合に、前記デコードステップが前記合成音声信号をデコードできるか否かに応じて前記音声出力可否情報を生成して前記送信ステップに送信させるとともに、前記音声出力可否情報に応じて前記音声出力ステップの前記合成音声信号の出力を制御する制御ステップと、
    を有することを特徴とする音声出力方法。
  13. 読上げ音声信号を出力する音声出力装置とネットワークで接続された音声読上げ装置における音声読上げ方法であって、
    前記ネットワークを介して、前記音声出力装置へ文字情報を送信するステップと、
    前記ネットワークを介して、前記音声出力装置へ文字情報及び読上げ状態通知要求を送信する送信ステップと、
    前記ネットワークを介して、前記音声出力装置から読上げ状態通知応答を受信する受信ステップと、
    前記受信ステップが文字情報受理を示す前記読上げ状態通知応答を受信するまで前記送信ステップに前記文字情報を送信させ続け、前記受信ステップが読上げ完了を示す前記読上げ状態通知応答を受信するまで前記送信ステップに前記読上げ状態通知要求を送信させ続ける制御ステップと、
    を有することを特徴とする音声読上げ方法。
  14. 文字情報を出力する音声読上げ装置とネットワークで接続された音声出力装置における音声出力方法であって、
    放送音声信号を受信する第1受信ステップと、
    前記ネットワークを介して、前記音声読上げ装置から前記文字情報及び読上げ状態通知要求を受信する第2受信ステップと、
    前記ネットワークを介して、前記音声読上げ装置へ読上げ状態通知応答を送信する送信ステップと、
    受信された前記放送音声信号をデコードするデコードステップと、
    受信された前記文字情報から読上げ音声信号を生成する第1生成ステップと、
    デコードされた前記放送音声信号と生成された前記読上げ音声信号を合成して合成音声信号を生成する第2生成ステップと、
    生成された前記合成音声信号を出力する音声出力ステップと、
    前記第2受信ステップが前記読上げ状態通知要求を受信した場合において前記文字情報の受信が完了した場合は文字情報受理を示す前記読上げ状態通知応答を前記送信ステップに送信させ、前記音声出力ステップが前記読上げ音声信号の出力を完了させた場合は読上げ完了を示す前記読上げ状態通知応答を前記送信ステップに送信させる制御ステップと、を有することを特徴とする音声出力方法。
JP2012555583A 2011-02-03 2011-12-28 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法 Expired - Fee Related JP5677470B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012555583A JP5677470B2 (ja) 2011-02-03 2011-12-28 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2011022162 2011-02-03
JP2011022162 2011-02-03
PCT/JP2011/007331 WO2012104952A1 (ja) 2011-02-03 2011-12-28 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法
JP2012555583A JP5677470B2 (ja) 2011-02-03 2011-12-28 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法

Publications (2)

Publication Number Publication Date
JPWO2012104952A1 true JPWO2012104952A1 (ja) 2014-07-03
JP5677470B2 JP5677470B2 (ja) 2015-02-25

Family

ID=46602200

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012555583A Expired - Fee Related JP5677470B2 (ja) 2011-02-03 2011-12-28 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法

Country Status (3)

Country Link
US (1) US9472181B2 (ja)
JP (1) JP5677470B2 (ja)
WO (1) WO2012104952A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012104952A1 (ja) * 2011-02-03 2012-08-09 パナソニック株式会社 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法
US9892723B2 (en) * 2013-11-25 2018-02-13 Rovi Guides, Inc. Systems and methods for presenting social network communications in audible form based on user engagement with a user device
CN107657951B (zh) * 2017-08-24 2020-10-30 深圳依偎控股有限公司 一种在直播过程中处理声音的方法及终端设备

Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61103200A (ja) * 1984-10-26 1986-05-21 日本電気株式会社 音声蓄積再生装置
JPS61274534A (ja) * 1985-05-30 1986-12-04 Toshiba Corp 音声伝達システム
JPH03214984A (ja) * 1990-01-19 1991-09-20 Ricoh Co Ltd 文字放送受信装置
JPH04103192U (ja) * 1991-03-19 1992-09-04 ダイコク電機株式会社 パチンコホール用店内放送システム
JPH09281988A (ja) * 1996-04-11 1997-10-31 Fujitsu Ten Ltd 音声合成装置
JP2002536693A (ja) * 1999-02-08 2002-10-29 クゥアルコム・インコーポレイテッド 可変率音声符号化に基づいた音声合成装置
JP2003223179A (ja) * 2002-01-30 2003-08-08 Sharp Corp インテリジェントスピーカ
JP2004108908A (ja) * 2002-09-18 2004-04-08 Denso Corp オーディオ連携ナビゲーション装置
JP2004177634A (ja) * 2002-11-27 2004-06-24 Brother Ind Ltd 文章読み上げ装置、同装置用プログラム及び記録媒体
JP2005300783A (ja) * 2004-04-08 2005-10-27 Zyyx:Kk 音声変換装置
JP2007086316A (ja) * 2005-09-21 2007-04-05 Mitsubishi Electric Corp 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP2007226793A (ja) * 2007-02-16 2007-09-06 Mitsubishi Electric Corp 車載マルチメディア装置
JP2008129412A (ja) * 2006-11-22 2008-06-05 Seiko Epson Corp 半導体集積回路装置、電子機器
JP2008130118A (ja) * 2006-11-17 2008-06-05 Onkyo Corp 音声再生システムおよびこれを構成するパーソナルコンピュータ、制御プログラム
JP2008310238A (ja) * 2007-06-18 2008-12-25 Akuseru:Kk 音声符号化装置、音声復号化装置、音声符号化プログラムおよび音声復号化プログラム
JP2009204815A (ja) * 2008-02-27 2009-09-10 Kyocera Corp 無線通信装置、無線通信方法および無線通信システム
JP2009223307A (ja) * 2008-02-20 2009-10-01 Ntt Docomo Inc 音声合成用音声データベース構築のための通信システム、中継装置および中継方法
JP2009265278A (ja) * 2008-04-23 2009-11-12 Konica Minolta Business Technologies Inc 音声出力管理システムおよび音声出力装置
JP2009289385A (ja) * 2008-06-02 2009-12-10 Nec Electronics Corp デジタルオーディオ信号処理装置、及び方法
JP2009294310A (ja) * 2008-06-03 2009-12-17 Mitsubishi Electric Corp 発話権調整システムおよび発話可能機器
JP2010166324A (ja) * 2009-01-15 2010-07-29 Nec Corp 携帯端末、音声合成方法、及び音声合成用プログラム
JP2012027070A (ja) * 2010-07-20 2012-02-09 Denso Corp 車室内通信システム、車載端末、および携帯端末
WO2012104952A1 (ja) * 2011-02-03 2012-08-09 パナソニック株式会社 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5677739A (en) 1995-03-02 1997-10-14 National Captioning Institute System and method for providing described television services
JPH10322673A (ja) 1997-05-15 1998-12-04 Canon Inc 通信装置及び方法及び記憶媒体
US6603632B1 (en) 2000-03-07 2003-08-05 International Business Machines Corporation Magnetic wear debris collector for air bearing of a spindle motor in a hard disk drive
US7908172B2 (en) * 2000-03-09 2011-03-15 Impulse Radio Inc System and method for generating multimedia accompaniments to broadcast data
JP3993751B2 (ja) 2000-03-30 2007-10-17 富士通株式会社 テキスト情報読み上げ装置と、これを組み込んだ音楽音声再生装置、媒体、およびプログラム
EP1860918B1 (en) * 2006-05-23 2017-07-05 Harman Becker Automotive Systems GmbH Communication system and method for controlling the output of an audio signal
JP2008191292A (ja) 2007-02-02 2008-08-21 Oki Electric Ind Co Ltd 音声合成方法、プログラム及び音声合成装置並びに音楽音声再生装置
WO2009090702A1 (ja) * 2008-01-17 2009-07-23 Mitsubishi Electric Corporation 車載用ガイダンス装置
JP5316189B2 (ja) 2008-05-23 2013-10-16 ヤマハ株式会社 Avシステム
US8898568B2 (en) * 2008-09-09 2014-11-25 Apple Inc. Audio user interface
JP2010066675A (ja) 2008-09-12 2010-03-25 Fuji Xerox Co Ltd 音声情報処理システム及び音声情報処理プログラム
JP2010205136A (ja) 2009-03-05 2010-09-16 Fujitsu Ltd 音声読み上げ装置、携帯電話機及びコンピュータプログラム

Patent Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61103200A (ja) * 1984-10-26 1986-05-21 日本電気株式会社 音声蓄積再生装置
JPS61274534A (ja) * 1985-05-30 1986-12-04 Toshiba Corp 音声伝達システム
JPH03214984A (ja) * 1990-01-19 1991-09-20 Ricoh Co Ltd 文字放送受信装置
JPH04103192U (ja) * 1991-03-19 1992-09-04 ダイコク電機株式会社 パチンコホール用店内放送システム
JPH09281988A (ja) * 1996-04-11 1997-10-31 Fujitsu Ten Ltd 音声合成装置
JP2002536693A (ja) * 1999-02-08 2002-10-29 クゥアルコム・インコーポレイテッド 可変率音声符号化に基づいた音声合成装置
JP2003223179A (ja) * 2002-01-30 2003-08-08 Sharp Corp インテリジェントスピーカ
JP2004108908A (ja) * 2002-09-18 2004-04-08 Denso Corp オーディオ連携ナビゲーション装置
JP2004177634A (ja) * 2002-11-27 2004-06-24 Brother Ind Ltd 文章読み上げ装置、同装置用プログラム及び記録媒体
JP2005300783A (ja) * 2004-04-08 2005-10-27 Zyyx:Kk 音声変換装置
JP2007086316A (ja) * 2005-09-21 2007-04-05 Mitsubishi Electric Corp 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP2008130118A (ja) * 2006-11-17 2008-06-05 Onkyo Corp 音声再生システムおよびこれを構成するパーソナルコンピュータ、制御プログラム
JP2008129412A (ja) * 2006-11-22 2008-06-05 Seiko Epson Corp 半導体集積回路装置、電子機器
JP2007226793A (ja) * 2007-02-16 2007-09-06 Mitsubishi Electric Corp 車載マルチメディア装置
JP2008310238A (ja) * 2007-06-18 2008-12-25 Akuseru:Kk 音声符号化装置、音声復号化装置、音声符号化プログラムおよび音声復号化プログラム
JP2009223307A (ja) * 2008-02-20 2009-10-01 Ntt Docomo Inc 音声合成用音声データベース構築のための通信システム、中継装置および中継方法
JP2009204815A (ja) * 2008-02-27 2009-09-10 Kyocera Corp 無線通信装置、無線通信方法および無線通信システム
JP2009265278A (ja) * 2008-04-23 2009-11-12 Konica Minolta Business Technologies Inc 音声出力管理システムおよび音声出力装置
JP2009289385A (ja) * 2008-06-02 2009-12-10 Nec Electronics Corp デジタルオーディオ信号処理装置、及び方法
JP2009294310A (ja) * 2008-06-03 2009-12-17 Mitsubishi Electric Corp 発話権調整システムおよび発話可能機器
JP2010166324A (ja) * 2009-01-15 2010-07-29 Nec Corp 携帯端末、音声合成方法、及び音声合成用プログラム
JP2012027070A (ja) * 2010-07-20 2012-02-09 Denso Corp 車室内通信システム、車載端末、および携帯端末
WO2012104952A1 (ja) * 2011-02-03 2012-08-09 パナソニック株式会社 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法

Also Published As

Publication number Publication date
WO2012104952A1 (ja) 2012-08-09
US20130311188A1 (en) 2013-11-21
JP5677470B2 (ja) 2015-02-25
US9472181B2 (en) 2016-10-18

Similar Documents

Publication Publication Date Title
JP4753880B2 (ja) リピータ装置およびその制御方法
US8351624B2 (en) Audio output apparatus, audio input apparatus, audio control apparatus, audio control system, and audio control method
JP4868225B2 (ja) 情報処理装置および方法、並びにプログラム
US8175298B2 (en) Audio output system control method and audio output system
JP5145633B2 (ja) 音響再生装置及び映像音声視聴システム
JPWO2007052625A1 (ja) 映像音声視聴システム
EP2104351A1 (en) Video/audio output device, audio output device, video/audio reproducing device, video/audio data reproducing system, and video/audio data reproducing method
JPWO2009084139A1 (ja) タイムシフト視聴システム、表示装置およびタイムシフト視聴方法
JP5677470B2 (ja) 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法
JP5070996B2 (ja) 音声制御装置及び音声制御システム
JP2008252834A (ja) 音声再生装置
US8411132B2 (en) System and method for real-time media data review
US20180075858A1 (en) System, apparatus and method for transmitting continuous audio data
JP5843856B2 (ja) ビットストリーム送信装置、ビットストリーム送受信システム、ビットストリーム受信装置、ビットストリーム送信方法及びビットストリーム受信方法
JP2008301454A (ja) オーディオデータ中継装置
JP2013150079A (ja) 再生装置、音声出力装置、制御方法、音声出力方法、テレビジョン受像機、音声再生システム、プログラム、及び、記録装置
JP2007235519A (ja) 映像音声同期方法及び映像音声同期システム
KR20150059483A (ko) 영상표시장치 및 영상표시장치의 구동방법, 음향출력장치 및 음향출력장치의 구동방법
JP5113732B2 (ja) データ放送送信装置
KR100961172B1 (ko) 오디오/비디오 중계 장치 및 방법
JP2007200415A (ja) 再生装置及び再生方法
CN102656616A (zh) 用于控制电子系统的方法和装置
JP2007287199A (ja) 再生装置
JP4270136B2 (ja) 映像・音声受信装置及びテレビジョン受像機
JP2019154072A (ja) 記録再生装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140926

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20141009

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20141016

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141226

R151 Written notification of patent or utility model registration

Ref document number: 5677470

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees