JPWO2012104952A1 - 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法 - Google Patents
音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法 Download PDFInfo
- Publication number
- JPWO2012104952A1 JPWO2012104952A1 JP2012555583A JP2012555583A JPWO2012104952A1 JP WO2012104952 A1 JPWO2012104952 A1 JP WO2012104952A1 JP 2012555583 A JP2012555583 A JP 2012555583A JP 2012555583 A JP2012555583 A JP 2012555583A JP WO2012104952 A1 JPWO2012104952 A1 JP WO2012104952A1
- Authority
- JP
- Japan
- Prior art keywords
- voice
- audio
- reading
- output
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 111
- 230000005236 sound signal Effects 0.000 claims abstract description 392
- 230000005540 biological transmission Effects 0.000 claims description 85
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 12
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 238000004891 communication Methods 0.000 description 30
- 238000010586 diagram Methods 0.000 description 28
- 230000015572 biosynthetic process Effects 0.000 description 12
- 238000003786 synthesis reaction Methods 0.000 description 12
- 238000013500 data storage Methods 0.000 description 10
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/60—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
- H04N5/602—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for digital sound signals
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3626—Details of the output of route guidance instructions
- G01C21/3629—Guidance using speech or audio output, e.g. text-to-speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/436—Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
- H04N21/4363—Adapting the video stream to a specific local network, e.g. a Bluetooth® network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4398—Processing of audio elementary streams involving reformatting operations of audio signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440236—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L2013/021—Overlap-add techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4396—Processing of audio elementary streams by muting the audio signal
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
図1〜図6を参照して、本発明の第1の実施の形態に係る音声出力システムについて説明する。本実施の形態に係る音声出力システムにおいては、実際に音声をスピーカから出力する音声出力装置(たとえばシアター機器、テレビ)の音声ミュート状態を、音声読上げ装置(たとえばレコーダ、テレビ)に通知して、読上げ音声を読上げるタイミングを調整する。
本実施の形態に係る音声出力システムは、限定されるものではないが、図1に示す(A)および(B)の2つの態様が考えられる。図1(A)に示す音声出力システムは、音声出力装置がシアター機器3000であって、音声読上げ装置がテレビ1000およびレコーダ2000である。図1(B)に示す音声出力システムは、音声出力装置がテレビ1001、音声読上げ装置がレコーダ2000である。このように、スピーカを備えるテレビは、音声出力装置としても、音声を読み上げる音声読上げ装置(この場合には音声出力装置はシアター機器)としても機能する。これらの装置は、ネットワーク接続され、放送等の音声信号(放送の音声信号、録画された放送の音声信号、メディアを再生した音声信号などを含む。以下、放送音声信号と記載する。)に読上げ音声信号を重畳した合成音声信号、ならびに、音声出力装置の音声出力可能状態であるか否かを示す情報(音声出力可否情報、後述するコマンド、フラグに対応する)を送受信する。ここで、放送音声信号の符号化方式が、たとえばAACからリニアPCMに切り替わった場合、音声読上げ装置は、リニアPCMの放送音声信号に読上げ音声信号を重畳したリニアPCMの合成音声信号を音声出力装置へ出力する。ところが合成音声信号がAACからリニアPCMへ切り替わった場合に音声出力装置では音声ミュートするため、読上げ音声信号を重畳した合成音声信号が音声ミュートで出力されなかったり、頭切れしたりする。本実施の形態に係る音声出力システムは、このような問題を解決する。
(1)シアター機器3000は、音声ミュート状態に対応する音声ミュート状態通知コマンド(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。
(2)テレビ1000およびレコーダ2000は、読上げ音声の読上げ前にシアター機器3000の音声ミュート状態を確認する。このとき、テレビ1000およびレコーダ2000はシアター機器3000へ音声ミュート状態を取得する音声ミュート状態取得コマンドを送信する。シアター機器3000は、音声ミュート状態取得コマンドを受信すると、自己の音声ミュート状態に対応する音声ミュート状態通知コマンドを送信する。
(3)テレビ1000およびレコーダ2000は、シアター機器3000が音声ミュート状態であれば、放送音声信号のみから構成される合成音声信号をシアター機器3000へ出力し、音声ミュート状態が解除されると(非音声ミュート状態になると)、読上げ音声信号を放送音声信号に重畳した合成音声信号をシアター機器3000へ出力する。
(4)テレビ1000およびレコーダ2000は、音声読上げ途中にシアター機器3000から音声ミュート状態通知コマンド(音声ミュート状態[Mute ON])を受信すると、読上げ音声の読上げを一時的に停止し(この状態では放送音声信号のみから構成される合成音声信号を出力する)、音声ミュート状態が解除されると、読上げ音声信号を放送音声信号に重畳した合成音声信号をシアター機器3000へ出力して読上げ音声の読上げを再開(途中から読上げ)またはリトライ(最初から読上げ)する。
(1)テレビ1001は、音声ミュート状態に対応する音声ミュート状態通知コマンド(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。
(2)レコーダ2000は、読上げ音声の読上げ前にテレビ1001の音声ミュート状態を確認する。このとき、レコーダ2000はテレビ1001へ音声ミュート状態を取得する音声ミュート状態取得コマンドを送信する。テレビ1001は、音声ミュート状態取得コマンドを受信すると、自己の音声ミュート状態に対応する音声ミュート状態通知コマンドを送信する。
(3)レコーダ2000は、テレビ1001が音声ミュート状態であれば、放送音声信号のみから構成される合成音声信号をテレビ1001へ出力し、音声ミュート状態が解除されると(非音声ミュート状態になると)、読上げ音声信号を放送音声信号に重畳した合成音声信号をテレビ1001へ出力する。
(4)レコーダ2000は、音声読上げ途中にテレビ1001から音声ミュート状態通知コマンド(音声ミュート状態[Mute ON])を受信すると、読上げ音声の読上げを一時的に停止し(この状態では放送音声信号のみから構成される合成音声信号を出力する)、音声ミュート状態が解除されると、読上げ音声信号を放送音声信号に重畳した合成音声信号をテレビ1001へ出力して読上げ音声の読上げを再開(途中から読上げ)またはリトライ(最初から読上げ)する。
図2に音声読上げ装置の一例であるテレビ1000の制御ブロック図を示す。このテレビ1000は、デジタル放送信号を受信してデコードして映像および音声を出力する機能を実現する。このような機能を実現する構成に加えて、このテレビ1000は、図2に示す制御ブロックを備える。
tral Processing Unit)等で構成される制御部1010(第1制御部
)と、その制御部1010に接続された複数のユニットで構成される。これらのユニットは、たとえば、ユーザからの音声の読上げ指示を制御部1010へ入力するユーザインターフェイス1020と、設定された時間になると音声の読上げ指示を制御部1010へ入力するタイマ1022と、制御部1010からの要求に従い音声出力装置(ここではシアター機器3000)のミュート状態を取得する制御コマンド(音声ミュート状態取得コマンド)を送信する制御コマンド送信部1030と、音声ミュート状態取得コマンドに応答して音声出力装置のミュート状態を示す制御コマンド(音声ミュート状態通知コマンド)を受信して制御部1010へ通知する制御コマンド受信部1032(第1情報受信部)と、を含む。
ON]コマンドをテレビ1000へ送信する。デコーダ3050での符号化設定情報の切替が完了すると、制御部3010は、音声ミュートを解除することを示す音声ミュート制御要求を音声ミュート部3060に出力して、デコーダ3050から入力された合成音声信号を音声出力部3070へ出力させる。この状態において、テレビ1000から音声ミュート状態取得コマンドを受信した場合、制御部3010は、制御コマンド送信部3022を介して音声ミュート状態通知コマンドとして[Mute OFF]コマンドをテレビ1000へ送信する。
図4を参照して、本実施の形態に係る音声出力システムにおける通信シーケンスについて説明する。図4に示す音声読上げ装置は、テレビ1000であったりレコーダ2000であったりして、音声出力装置は、シアター機器3000であったりテレビ1001であったりする。ここでは、音声読上げ装置がテレビ1000であり、音声出力装置がシアター機器3000であるとして説明する。
図5および図6を参照して、本実施の形態に係る音声出力システムを構成する音声読上げ装置であるテレビ1000および音声出力装置であるシアター機器3000で実行される音声出力処理の制御構造について説明する。ここでは、図1(A)に示すように、音声読上げ装置がテレビ1000であり、音声出力装置がシアター機器3000であり、レコーダ2000が存在しないものとして説明する。なお、以下においては、通信トラブル等に起因する通信タイムアウトエラーは想定しないものとする。
以上のような構造およびフローチャートに基づく本実施の形態に係る音声出力システムの動作について説明する。
この動作の説明においては、たとえば、シアター機器3000へ送信される合成音声信号の符号化がAACからリニアPCMへ変化しない場合を説明する。テレビ1000のリモコンでユーザが音声読上げを指示すると(S1020にてYES)、音声ミュートフラグがオンであるか否かが検出され、この場合、音声ミュートフラグがオフであるので(S1022にてNO)、テレビ1000からシアター機器3000へ読上げ音声信号を重畳した合成音声信号が出力される(S1024)。
この動作の説明においては、たとえば、シアター機器3000へ送信される合成音声信号の符号化がAACからリニアPCMへ変化し、シアター機器3000のデコーダ3050での符号化設定の切替が完了するまでの間の処理を説明する。この場合、音声ミュートフラグがオンであるので(S1022にてYES)、放送音声信号のみから構成される合成音声信号(読上げ音声信号が重畳されていない合成音声信号)の出力が行われている(S1023)。
この動作の説明においては、たとえば、合成音声信号出力中に、シアター機器3000へ送信される放送音声信号の符号化がAACからリニアPCMへ変化した場合(すなわち、音声ミュートフラグがオフからオンに変化し、その後、オンからオフに変化する場合)を説明する。この場合、まず、テレビ1000が合成音声信号の出力中に音声ミュートフラグがオフからオンへ変化する(S1032にてYESになる前にS1026にてYES)。このため、読上げ音声信号を重畳した合成放送信号の出力(S1024)から、読上げ音声信号を重畳しない合成音声信号の出力に切り替わる(S1031)。
図7〜図12を参照して、本発明の第2の実施の形態に係る音声出力システムについて説明する。本実施の形態に係る音声出力システムにおいては、読上げるテキストを、音声読上げ装置(たとえばレコーダ、テレビ)から、実際に音声をスピーカから出力する音声出力装置(たとえばシアター機器、テレビ)にテキストデータとして通知し、音声出力装置がタイミングを調整して読上げ音声を出力する。なお、以下の本実施の形態についての説明において、上述した第1の実施の形態と同じ構成については、ここでは説明を繰り返さない。
本実施の形態に係る音声出力システムは、限定されるものではないが、図7に示す(A)および(B)の2つの態様が考えられる。図7(A)に示す音声出力システムは、音声出力装置がシアター機器3100であって、音声読上げ装置がテレビ1100およびレコーダ2100である。図7(B)に示す音声出力システムは、音声出力装置がテレビ1101であって、音声読上げ装置がレコーダ2100である。このように、第1の実施の形態と同様に、スピーカを備えるテレビは、音声出力装置としても、音声を読み上げる音声読上げ装置(この場合には音声出力装置はシアター機器)としても機能する。これらの装置は、ネットワーク接続され、放送等の音声信号(放送の音声信号、録画された放送の音声信号、メディアを再生した音声信号などを含む。以下、放送音声信号と記載する。)、読上げ音声のテキストデータ、および、音声出力装置におけるテキストデータの受信状態または読上げ完了状態を示す情報を送受信する。
(1)テレビ1100およびレコーダ2100は、シアター機器3100へ、読上げ音声の読上げテキスト通知コマンド(テキストデータ)を通知する。
(2)シアター機器3100は、音声ミュート状態に対応する音声ミュート状態を示すミュートフラグ(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。シアター機器3100は、自己が音声ミュート状態であれば、通知されたテキストデータを音声データに変換して出力することも、テレビ1100から入力された放送音声信号をスピーカから出力することもしない。音声ミュート状態が解除されると(非音声ミュート状態になると)、入力されたテキストデータを読み上げ音声信号に変換して、変換した読上げ音声信号と入力された放送音声信号とを合成して合成音声信号としてスピーカから出力する。なお、シアター機器3100は、自己が音声ミュート状態でなく、テキストデータが通知されていなければ、入力された放送音声信号をスピーカから出力している。
(3)テレビ1100、レコーダ2100、または複数のレコーダ2100などの複数の音声読上げ装置から、複数のテキストデータがシアター機器3100に通知された場合には、テキストデータをバッファしておいて、順次読上げることもできる。なお、テレビ1100、レコーダ2100がテキストデータを通知する際、遅延許容量(タイムアウト時間)なども通知して、その通知されたデータに基づいて音声を出力するようにしてもよい。
(1)レコーダ2100は、テレビ1101へ、読上げ音声の読上げテキスト通知コマンド(テキストデータ)を通知する。
(2)テレビ1101は、音声ミュート状態に対応する音声ミュート状態を示すミュートフラグ(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。テレビ1101は、自己が音声ミュート状態であれば、通知されたテキストデータを音声データに変換して出力することも、レコーダ1101から入力された放送音声信号をスピーカから出力することもしない。音声ミュート状態が解除されると(非音声ミュート状態になると)、入力されたテキストデータを読上げ音声信号に変換して、変換した読上げ音声信号と入力された放送音声信号とを合成して合成音声信号としてスピーカから出力する。なお、テレビ1101は、自己が音声ミュート状態でなく、テキストデータが通知されていなければ、入力された放送音声信号をスピーカから出力している。
図8に音声読上げ装置の一例であるテレビ1100の制御ブロック図を示す。このテレビ1100は、デジタル放送信号を受信してデコードして映像および音声を出力する機能を実現する。このような機能を実現する構成に加えて、このテレビ1100は、図8に示す制御ブロックを備える。
図10を参照して、本実施の形態に係る音声出力システムにおける通信シーケンスについて説明する。図10に示す音声読上げ装置は、テレビ1100であったりレコーダ2100であったりして、音声出力装置は、シアター機器3100であったりテレビ1101であったりする。ここでは、音声読上げ装置がテレビ1100であり、音声出力装置がシアター機器3100であるとして説明する。
図11および図12を参照して、本実施の形態に係る音声出力システムを構成する音声読上げ装置であるテレビ1100および音声出力装置であるシアター機器3100で実行される音声出力処理の制御構造について説明する。ここでは、図7(A)に示すように、音声読上げ装置がテレビ1100であり、音声出力装置がシアター機器3100であり、レコーダ2100が存在しないものとして説明する。
以上のような構造およびフローチャートに基づく本実施の形態に係る音声出力システムの動作について説明する。なお、以下の説明においても、上述した第1の実施の形態における動作と同じ説明は繰り返さない。また、以下においては、通信トラブル等に起因する通信タイムアウトエラーは想定しないものとする。
この動作の説明においては、たとえば、シアター機器3100へ送信される放送音声信号の符号化がAACからリニアPCMへ変更しない場合を説明する。テレビ1100のリモコンでユーザが音声読上げを指示すると(S1120にてYES)、シアター機器3100の音声ミュートフラグがオンであるか否かに関わらず、読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])が、テレビ1100からシアター機器3100へ送信される(S1122)。
この動作の説明においては、シアター機器3100へ入力されたテレビ1100からの放送音声信号の符号化がAACからリニアPCMへ切り替わり、シアター機器3100のデコーダ3050での符号化設定の切替が完了するまでの間の処理を説明する。上述のように、シアター機器3100の音声ミュート状態に関係なく、読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])が、テレビ1100からシアター機器3100へ送信される(S1122)。
2000、2100 レコーダ
3000、3100 シアター機器
1010、1110 テレビ制御部
3010、3110 シアター機器制御部
図1〜図6を参照して、本発明の第1の実施の形態に係る音声出力システムについて説明する。本実施の形態に係る音声出力システムにおいては、実際に音声をスピーカから出力する音声出力装置(たとえばシアター機器、テレビ)の音声ミュート状態を、音声読上げ装置(たとえばレコーダ、テレビ)に通知して、読上げ音声を読上げるタイミングを調整する。
本実施の形態に係る音声出力システムは、限定されるものではないが、図1に示す(A)および(B)の2つの態様が考えられる。図1(A)に示す音声出力システムは、音声出力装置がシアター機器3000であって、音声読上げ装置がテレビ1000およびレコーダ2000である。図1(B)に示す音声出力システムは、音声出力装置がテレビ1001、音声読上げ装置がレコーダ2000である。このように、スピーカを備えるテレビは、音声出力装置としても、音声を読み上げる音声読上げ装置(この場合には音声出力装置はシアター機器)としても機能する。これらの装置は、ネットワーク接続され、放送等の音声信号(放送の音声信号、録画された放送の音声信号、メディアを再生した音声信号などを含む。以下、放送音声信号と記載する。)に読上げ音声信号を重畳した合成音声信号、ならびに、音声出力装置の音声出力可能状態であるか否かを示す情報(音声出力可否情報、後述するコマンド、フラグに対応する)を送受信する。ここで、放送音声信号の符号化方式が、たとえばAACからリニアPCMに切り替わった場合、音声読上げ装置は、リニアPCMの放送音声信号に読上げ音声信号を重畳したリニアPCMの合成音声信号を音声出力装置へ出力する。ところが合成音声信号がAACからリニアPCMへ切り替わった場合に音声出力装置では音声ミュートするため、読上げ音声信号を重畳した合成音声信号が音声ミュートで出力されなかったり、頭切れしたりする。本実施の形態に係る音声出力システムは、このような問題を解決する。
(1)シアター機器3000は、音声ミュート状態に対応する音声ミュート状態通知コマンド(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。
(2)テレビ1000およびレコーダ2000は、読上げ音声の読上げ前にシアター機器3000の音声ミュート状態を確認する。このとき、テレビ1000およびレコーダ2000はシアター機器3000へ音声ミュート状態を取得する音声ミュート状態取得コマンドを送信する。シアター機器3000は、音声ミュート状態取得コマンドを受信すると、自己の音声ミュート状態に対応する音声ミュート状態通知コマンドを送信する。
(3)テレビ1000およびレコーダ2000は、シアター機器3000が音声ミュート状態であれば、放送音声信号のみから構成される合成音声信号をシアター機器3000へ出力し、音声ミュート状態が解除されると(非音声ミュート状態になると)、読上げ音声信号を放送音声信号に重畳した合成音声信号をシアター機器3000へ出力する。
(4)テレビ1000およびレコーダ2000は、音声読上げ途中にシアター機器3000から音声ミュート状態通知コマンド(音声ミュート状態[Mute ON])を受信すると、読上げ音声の読上げを一時的に停止し(この状態では放送音声信号のみから構成される合成音声信号を出力する)、音声ミュート状態が解除されると、読上げ音声信号を放送音声信号に重畳した合成音声信号をシアター機器3000へ出力して読上げ音声の読上げを再開(途中から読上げ)またはリトライ(最初から読上げ)する。
(1)テレビ1001は、音声ミュート状態に対応する音声ミュート状態通知コマンド(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。
(2)レコーダ2000は、読上げ音声の読上げ前にテレビ1001の音声ミュート状態を確認する。このとき、レコーダ2000はテレビ1001へ音声ミュート状態を取得する音声ミュート状態取得コマンドを送信する。テレビ1001は、音声ミュート状態取得コマンドを受信すると、自己の音声ミュート状態に対応する音声ミュート状態通知コマンドを送信する。
(3)レコーダ2000は、テレビ1001が音声ミュート状態であれば、放送音声信号のみから構成される合成音声信号をテレビ1001へ出力し、音声ミュート状態が解除されると(非音声ミュート状態になると)、読上げ音声信号を放送音声信号に重畳した合成音声信号をテレビ1001へ出力する。
(4)レコーダ2000は、音声読上げ途中にテレビ1001から音声ミュート状態通知コマンド(音声ミュート状態[Mute ON])を受信すると、読上げ音声の読上げを一時的に停止し(この状態では放送音声信号のみから構成される合成音声信号を出力する)、音声ミュート状態が解除されると、読上げ音声信号を放送音声信号に重畳した合成音声信号をテレビ1001へ出力して読上げ音声の読上げを再開(途中から読上げ)またはリトライ(最初から読上げ)する。
図2に音声読上げ装置の一例であるテレビ1000の制御ブロック図を示す。このテレビ1000は、デジタル放送信号を受信してデコードして映像および音声を出力する機能を実現する。このような機能を実現する構成に加えて、このテレビ1000は、図2に示す制御ブロックを備える。
tral Processing Unit)等で構成される制御部1010(第1制御部
)と、その制御部1010に接続された複数のユニットで構成される。これらのユニットは、たとえば、ユーザからの音声の読上げ指示を制御部1010へ入力するユーザインターフェイス1020と、設定された時間になると音声の読上げ指示を制御部1010へ入力するタイマ1022と、制御部1010からの要求に従い音声出力装置(ここではシアター機器3000)のミュート状態を取得する制御コマンド(音声ミュート状態取得コマンド)を送信する制御コマンド送信部1030と、音声ミュート状態取得コマンドに応答して音声出力装置のミュート状態を示す制御コマンド(音声ミュート状態通知コマンド)を受信して制御部1010へ通知する制御コマンド受信部1032(第1情報受信部)と、を含む。
ON]コマンドをテレビ1000へ送信する。デコーダ3050での符号化設定情報の切替が完了すると、制御部3010は、音声ミュートを解除することを示す音声ミュート制御要求を音声ミュート部3060に出力して、デコーダ3050から入力された合成音声信号を音声出力部3070へ出力させる。この状態において、テレビ1000から音声ミュート状態取得コマンドを受信した場合、制御部3010は、制御コマンド送信部3022を介して音声ミュート状態通知コマンドとして[Mute OFF]コマンドをテレビ1000へ送信する。
図4を参照して、本実施の形態に係る音声出力システムにおける通信シーケンスについて説明する。図4に示す音声読上げ装置は、テレビ1000であったりレコーダ2000であったりして、音声出力装置は、シアター機器3000であったりテレビ1001であったりする。ここでは、音声読上げ装置がテレビ1000であり、音声出力装置がシアター機器3000であるとして説明する。
図5および図6を参照して、本実施の形態に係る音声出力システムを構成する音声読上げ装置であるテレビ1000および音声出力装置であるシアター機器3000で実行される音声出力処理の制御構造について説明する。ここでは、図1(A)に示すように、音声読上げ装置がテレビ1000であり、音声出力装置がシアター機器3000であり、レコーダ2000が存在しないものとして説明する。なお、以下においては、通信トラブル等に起因する通信タイムアウトエラーは想定しないものとする。
以上のような構造およびフローチャートに基づく本実施の形態に係る音声出力システムの動作について説明する。
この動作の説明においては、たとえば、シアター機器3000へ送信される合成音声信号の符号化がAACからリニアPCMへ変化しない場合を説明する。テレビ1000のリモコンでユーザが音声読上げを指示すると(S1020にてYES)、音声ミュートフラグがオンであるか否かが検出され、この場合、音声ミュートフラグがオフであるので(S1022にてNO)、テレビ1000からシアター機器3000へ読上げ音声信号を重畳した合成音声信号が出力される(S1024)。
この動作の説明においては、たとえば、シアター機器3000へ送信される合成音声信号の符号化がAACからリニアPCMへ変化し、シアター機器3000のデコーダ3050での符号化設定の切替が完了するまでの間の処理を説明する。この場合、音声ミュートフラグがオンであるので(S1022にてYES)、放送音声信号のみから構成される合成音声信号(読上げ音声信号が重畳されていない合成音声信号)の出力が行われている(S1023)。
この動作の説明においては、たとえば、合成音声信号出力中に、シアター機器3000へ送信される放送音声信号の符号化がAACからリニアPCMへ変化した場合(すなわち、音声ミュートフラグがオフからオンに変化し、その後、オンからオフに変化する場合)を説明する。この場合、まず、テレビ1000が合成音声信号の出力中に音声ミュートフラグがオフからオンへ変化する(S1032にてYESになる前にS1026にてYES)。このため、読上げ音声信号を重畳した合成放送信号の出力(S1024)から、読上げ音声信号を重畳しない合成音声信号の出力に切り替わる(S1031)。
図7〜図12を参照して、本発明の第2の実施の形態に係る音声出力システムについて説明する。本実施の形態に係る音声出力システムにおいては、読上げるテキストを、音声読上げ装置(たとえばレコーダ、テレビ)から、実際に音声をスピーカから出力する音声出力装置(たとえばシアター機器、テレビ)にテキストデータとして通知し、音声出力装置がタイミングを調整して読上げ音声を出力する。なお、以下の本実施の形態についての説明において、上述した第1の実施の形態と同じ構成については、ここでは説明を繰り返さない。
本実施の形態に係る音声出力システムは、限定されるものではないが、図7に示す(A)および(B)の2つの態様が考えられる。図7(A)に示す音声出力システムは、音声出力装置がシアター機器3100であって、音声読上げ装置がテレビ1100およびレコーダ2100である。図7(B)に示す音声出力システムは、音声出力装置がテレビ1101であって、音声読上げ装置がレコーダ2100である。このように、第1の実施の形態と同様に、スピーカを備えるテレビは、音声出力装置としても、音声を読み上げる音声読上げ装置(この場合には音声出力装置はシアター機器)としても機能する。これらの装置は、ネットワーク接続され、放送等の音声信号(放送の音声信号、録画された放送の音声信号、メディアを再生した音声信号などを含む。以下、放送音声信号と記載する。)、読上げ音声のテキストデータ、および、音声出力装置におけるテキストデータの受信状態または読上げ完了状態を示す情報を送受信する。
(1)テレビ1100およびレコーダ2100は、シアター機器3100へ、読上げ音声の読上げテキスト通知コマンド(テキストデータ)を通知する。
(2)シアター機器3100は、音声ミュート状態に対応する音声ミュート状態を示すミュートフラグ(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。シアター機器3100は、自己が音声ミュート状態であれば、通知されたテキストデータを音声データに変換して出力することも、テレビ1100から入力された放送音声信号をスピーカから出力することもしない。音声ミュート状態が解除されると(非音声ミュート状態になると)、入力されたテキストデータを読み上げ音声信号に変換して、変換した読上げ音声信号と入力された放送音声信号とを合成して合成音声信号としてスピーカから出力する。なお、シアター機器3100は、自己が音声ミュート状態でなく、テキストデータが通知されていなければ、入力された放送音声信号をスピーカから出力している。
(3)テレビ1100、レコーダ2100、または複数のレコーダ2100などの複数の音声読上げ装置から、複数のテキストデータがシアター機器3100に通知された場合には、テキストデータをバッファしておいて、順次読上げることもできる。なお、テレビ1100、レコーダ2100がテキストデータを通知する際、遅延許容量(タイムアウト時間)なども通知して、その通知されたデータに基づいて音声を出力するようにしてもよい。
(1)レコーダ2100は、テレビ1101へ、読上げ音声の読上げテキスト通知コマンド(テキストデータ)を通知する。
(2)テレビ1101は、音声ミュート状態に対応する音声ミュート状態を示すミュートフラグ(音声ミュート状態[Mute ON]/非音声ミュート状態[Mute OFF])を保持する。テレビ1101は、自己が音声ミュート状態であれば、通知されたテキストデータを音声データに変換して出力することも、レコーダ2100から入力された放送音声信号をスピーカから出力することもしない。音声ミュート状態が解除されると(非音声ミュート状態になると)、入力されたテキストデータを読上げ音声信号に変換して、変換した読上げ音声信号と入力された放送音声信号とを合成して合成音声信号としてスピーカから出力する。なお、テレビ1101は、自己が音声ミュート状態でなく、テキストデータが通知されていなければ、入力された放送音声信号をスピーカから出力している。
図8に音声読上げ装置の一例であるテレビ1100の制御ブロック図を示す。このテレビ1100は、デジタル放送信号を受信してデコードして映像および音声を出力する機能を実現する。このような機能を実現する構成に加えて、このテレビ1100は、図8に示す制御ブロックを備える。
図10を参照して、本実施の形態に係る音声出力システムにおける通信シーケンスについて説明する。図10に示す音声読上げ装置は、テレビ1100であったりレコーダ2100であったりして、音声出力装置は、シアター機器3100であったりテレビ1101であったりする。ここでは、音声読上げ装置がテレビ1100であり、音声出力装置がシアター機器3100であるとして説明する。
図11および図12を参照して、本実施の形態に係る音声出力システムを構成する音声読上げ装置であるテレビ1100および音声出力装置であるシアター機器3100で実行される音声出力処理の制御構造について説明する。ここでは、図7(A)に示すように、音声読上げ装置がテレビ1100であり、音声出力装置がシアター機器3100であり、レコーダ2100が存在しないものとして説明する。
以上のような構造およびフローチャートに基づく本実施の形態に係る音声出力システムの動作について説明する。なお、以下の説明においても、上述した第1の実施の形態における動作と同じ説明は繰り返さない。また、以下においては、通信トラブル等に起因する通信タイムアウトエラーは想定しないものとする。
この動作の説明においては、たとえば、シアター機器3100へ送信される放送音声信号の符号化がAACからリニアPCMへ変更しない場合を説明する。テレビ1100のリモコンでユーザが音声読上げを指示すると(S1120にてYES)、シアター機器3100の音声ミュートフラグがオンであるか否かに関わらず、読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])が、テレビ1100からシアター機器3100へ送信される(S1122)。
この動作の説明においては、シアター機器3100へ入力されたテレビ1100からの放送音声信号の符号化がAACからリニアPCMへ切り替わり、シアター機器3100のデコーダ3050での符号化設定の切替が完了するまでの間の処理を説明する。上述のように、シアター機器3100の音声ミュート状態に関係なく、読上げテキスト通知コマンド([機器識別子][優先順位][テキストid][page番号][page数][text])が、テレビ1100からシアター機器3100へ送信される(S1122)。
2000、2100 レコーダ
3000、3100 シアター機器
1010、1110 テレビ制御部
3010、3110 シアター機器制御部
Claims (14)
- 読上げ音声信号を出力する音声出力装置とネットワークで接続された音声読上げ装置であって、
文字情報から前記読上げ音声信号を生成する音声信号生成部と、
前記ネットワークを介して、前記音声出力装置から音声出力可否情報を受信する第1情報受信部と、
前記ネットワークを介して、前記音声信号生成部が生成した前記読上げ音声信号を前記音声出力装置へ送信する第1情報送信部と、
前記第1情報受信部が音声出力不可を示す音声出力可否情報を受信した場合に、音声出力可を示す音声出力可否情報を受信するまで前記第1情報送信部に前記読上げ音声信号の送信を待機させ、前記第1情報受信部が音声出力可を示す音声出力可否情報を受信した場合に、前記第1情報送信部に前記読上げ音声信号を送信させる第1制御部と、
を具備することを特徴とする音声読上げ装置。 - 前記音声信号生成部が生成した前記読上げ音声信号と放送音声信号を合成して合成音声信号を生成する合成音声信号生成部、を更に備え、
前記第1情報送信部は、前記合成音声信号生成部が生成した前記合成音声信号を前記音声出力装置へ出力し、
前記第1制御部は、前記第1情報受信部が音声出力不可を示す音声出力可否情報を受信した場合に、音声出力可を示す音声出力可否情報を受信するまで前記合成音声信号生成部に前記放送音声信号のみから構成される合成音声信号を生成させて前記第1情報送信部に送信させ、前記第1情報受信部が音声出力可を示す音声出力可否情報を受信した場合に、前記合成音声信号生成部に前記読上げ音声信号と前記放送音声信号を合成した合成音声信号を生成させて前記第1情報送信部に送信させる、ことを特徴とする請求項1に記載の音声読上げ装置。 - 前記第1制御部は、前記第1情報送信部が前記読上げ音声信号を送信中に前記第1情報受信部が音声出力不可を示す音声出力可否情報を受信した場合に、音声出力可を示す音声出力可否情報を受信するまで前記第1情報送信部に前記読上げ音声信号の送信を待機させ、前記第1情報受信部が音声出力可を示す音声出力可否情報を受信した場合に、前記第1情報送信部に前記読上げ音声信号の送信を所定の部分から再開する、ことを特徴とする請求項1に記載の音声読上げ装置。
- 合成音声信号を出力する音声読上げ装置とネットワークで接続された音声出力装置であって、
前記音声読上げ装置から前記合成音声信号を受信する音声信号入力部と、
前記音声読上げ装置から音声状態取得要求を受信する第2情報受信部と、
音声出力可否情報を前記音声読上げ装置へ送信する第2情報送信部と、
前記音声信号入力部が受信した前記合成音声信号をデコードするデコード部と、
前記デコード部がデコードした前記合成音声信号を出力する音声出力部と、
前記第2情報受信部が前記音声状態取得要求を受信した場合に、前記デコード部が前記合成音声信号をデコードできるか否かに応じて前記音声出力可否情報を生成して前記第2情報送信部に送信させるとともに、前記音声出力可否情報に応じて前記音声出力部の前記合成音声信号の出力を制御する第2制御部と、
を具備することを特徴とする音声出力装置。 - 読上げ音声信号を出力する音声出力装置とネットワークで接続された音声読上げ装置であって、
前記ネットワークを介して、前記音声出力装置へ文字情報及び読上げ状態通知要求を送信する第1情報送信部と、
前記ネットワークを介して、前記音声出力装置から読上げ状態通知応答を受信する第1情報受信部と、
前記第1情報受信部が文字情報受理を示す前記読上げ状態通知応答を受信するまで前記第1情報送信部に前記文字情報を送信させ続け、前記第1情報受信部が読上げ完了を示す前記読上げ状態通知応答を受信するまで前記第1情報送信部に前記読上げ状態通知要求を送信させ続ける第1制御部と、
を具備することを特徴とする音声読上げ装置。 - 文字情報を出力する音声読上げ装置とネットワークで接続された音声出力装置であって、
放送音声信号を受信する音声信号入力部と、
前記ネットワークを介して、前記音声読上げ装置から前記文字情報及び読上げ状態通知要求を受信する第2情報受信部と、
前記ネットワークを介して、前記音声読上げ装置へ読上げ状態通知応答を送信する第2情報送信部と、
前記音声信号入力部が受信した前記放送音声信号をデコードするデコード部と、
前記第2情報受信部が受信した前記文字情報から読上げ音声信号を生成する音声信号生成部と、
前記デコード部がデコードした前記放送音声信号と前記音声信号生成部が生成した前記読上げ音声信号を合成して合成音声信号を生成する合成音声信号生成部と、
前記合成音声信号生成部が生成した前記合成音声信号を出力する音声出力部と、
前記第2情報受信部が前記読上げ状態通知要求を受信した場合において前記文字情報の受信が完了した場合は文字情報受理を示す前記読上げ状態通知応答を前記第2情報送信部に送信させ、前記音声出力部が前記読上げ音声信号の出力を完了させた場合は読上げ完了を示す前記読上げ状態通知応答を前記第2情報送信部に送信させる第2制御部と、
を具備することを特徴とする音声出力装置。 - 前記第2情報受信部が受信した前記文字情報を記憶するデータ一時記憶部、を更に備え、
前記第2制御部は、前記デコード部が前記放送音声信号をデコードできるか否かを判断し、デコードできないと判断した場合は前記データ一時記憶部に前記文字情報を記憶させるとともに前記音声信号生成部に前記読上げ音声信号の生成を停止させ、デコードできると判断した場合は前記音声信号生成部に前記第2情報受信部が受信した前記文字情報または前記データ一時記憶部が記憶した前記文字情報から前記読上げ音声信号を生成させる、ことを特徴とする請求項6に記載の音声出力装置。 - 前記第2情報受信部は、複数の前記音声読上げ装置から前記文字情報及び前記読上げ状態通知要求を受信し、
前記第2情報送信部は、複数の前記音声読上げ装置へ読上げ状態通知応答を送信し、
前記データ一時記憶部は、複数の前記文字情報を記憶し、
前記第2制御部は、前記デコード部が前記放送音声信号をデコードできると判断した場合は、前記音声信号生成部に前記第2情報受信部が受信した複数の前記文字情報または前記データ一時記憶部が記憶した複数の前記文字情報を所定の優先順位に従って順次複数の前記読上げ音声信号に変換させる、ことを特徴とする請求項7に記載の音声出力装置。 - 請求項1〜請求項3のいずれかに記載の音声読上げ装置と、請求項4に記載の音声出力装置とを含む、音声出力システム。
- 請求項5に記載の音声読上げ装置と、請求項6〜請求項8のいずれかに記載の音声出力装置とを含む、音声出力システム。
- 読上げ音声信号を出力する音声出力装置とネットワークで接続された音声読上げ装置における音声読上げ方法であって、
文字情報から前記読み上げ音声信号を生成する生成ステップと、
前記ネットワークを介して、前記音声出力装置から音声出力可否情報を受信する受信ステップと、
前記ネットワークを介して、生成された前記読上げ音声信号を前記音声出力装置へ送信する送信ステップと、
前記受信ステップにおいて音声出力不可を示す音声出力可否情報が受信された場合に、音声出力可を示す音声出力可否情報を受信するまで前記送信ステップに前記読上げ音声信号の送信を待機させ、前記受信ステップが音声出力可を示す音声出力可否情報を受信した場合に、前記送信ステップに前記読上げ音声信号を送信させる制御ステップと、
を有することを特徴とする音声読上げ方法。 - 合成音声信号を出力する音声読上げ装置とネットワークで接続された音声出力装置における音声出力方法であって、
前記音声読上げ装置から前記合成音声信号を受信する第1受信ステップと、
前記音声読上げ装置から音声状態取得要求を受信する第2受信ステップと、
音声出力可否情報を前記音声読上げ装置へ送信する送信ステップと、
受信された前記合成音声信号をデコードするデコードステップと、
デコードされた前記合成音声信号を出力する音声出力ステップと、
前記第2受信ステップにおいて前記音声状態取得要求を受信した場合に、前記デコードステップが前記合成音声信号をデコードできるか否かに応じて前記音声出力可否情報を生成して前記送信ステップに送信させるとともに、前記音声出力可否情報に応じて前記音声出力ステップの前記合成音声信号の出力を制御する制御ステップと、
を有することを特徴とする音声出力方法。 - 読上げ音声信号を出力する音声出力装置とネットワークで接続された音声読上げ装置における音声読上げ方法であって、
前記ネットワークを介して、前記音声出力装置へ文字情報を送信するステップと、
前記ネットワークを介して、前記音声出力装置へ文字情報及び読上げ状態通知要求を送信する送信ステップと、
前記ネットワークを介して、前記音声出力装置から読上げ状態通知応答を受信する受信ステップと、
前記受信ステップが文字情報受理を示す前記読上げ状態通知応答を受信するまで前記送信ステップに前記文字情報を送信させ続け、前記受信ステップが読上げ完了を示す前記読上げ状態通知応答を受信するまで前記送信ステップに前記読上げ状態通知要求を送信させ続ける制御ステップと、
を有することを特徴とする音声読上げ方法。 - 文字情報を出力する音声読上げ装置とネットワークで接続された音声出力装置における音声出力方法であって、
放送音声信号を受信する第1受信ステップと、
前記ネットワークを介して、前記音声読上げ装置から前記文字情報及び読上げ状態通知要求を受信する第2受信ステップと、
前記ネットワークを介して、前記音声読上げ装置へ読上げ状態通知応答を送信する送信ステップと、
受信された前記放送音声信号をデコードするデコードステップと、
受信された前記文字情報から読上げ音声信号を生成する第1生成ステップと、
デコードされた前記放送音声信号と生成された前記読上げ音声信号を合成して合成音声信号を生成する第2生成ステップと、
生成された前記合成音声信号を出力する音声出力ステップと、
前記第2受信ステップが前記読上げ状態通知要求を受信した場合において前記文字情報の受信が完了した場合は文字情報受理を示す前記読上げ状態通知応答を前記送信ステップに送信させ、前記音声出力ステップが前記読上げ音声信号の出力を完了させた場合は読上げ完了を示す前記読上げ状態通知応答を前記送信ステップに送信させる制御ステップと、を有することを特徴とする音声出力方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012555583A JP5677470B2 (ja) | 2011-02-03 | 2011-12-28 | 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011022162 | 2011-02-03 | ||
JP2011022162 | 2011-02-03 | ||
PCT/JP2011/007331 WO2012104952A1 (ja) | 2011-02-03 | 2011-12-28 | 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法 |
JP2012555583A JP5677470B2 (ja) | 2011-02-03 | 2011-12-28 | 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012104952A1 true JPWO2012104952A1 (ja) | 2014-07-03 |
JP5677470B2 JP5677470B2 (ja) | 2015-02-25 |
Family
ID=46602200
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012555583A Expired - Fee Related JP5677470B2 (ja) | 2011-02-03 | 2011-12-28 | 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9472181B2 (ja) |
JP (1) | JP5677470B2 (ja) |
WO (1) | WO2012104952A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012104952A1 (ja) * | 2011-02-03 | 2012-08-09 | パナソニック株式会社 | 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法 |
US9892723B2 (en) * | 2013-11-25 | 2018-02-13 | Rovi Guides, Inc. | Systems and methods for presenting social network communications in audible form based on user engagement with a user device |
CN107657951B (zh) * | 2017-08-24 | 2020-10-30 | 深圳依偎控股有限公司 | 一种在直播过程中处理声音的方法及终端设备 |
Citations (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61103200A (ja) * | 1984-10-26 | 1986-05-21 | 日本電気株式会社 | 音声蓄積再生装置 |
JPS61274534A (ja) * | 1985-05-30 | 1986-12-04 | Toshiba Corp | 音声伝達システム |
JPH03214984A (ja) * | 1990-01-19 | 1991-09-20 | Ricoh Co Ltd | 文字放送受信装置 |
JPH04103192U (ja) * | 1991-03-19 | 1992-09-04 | ダイコク電機株式会社 | パチンコホール用店内放送システム |
JPH09281988A (ja) * | 1996-04-11 | 1997-10-31 | Fujitsu Ten Ltd | 音声合成装置 |
JP2002536693A (ja) * | 1999-02-08 | 2002-10-29 | クゥアルコム・インコーポレイテッド | 可変率音声符号化に基づいた音声合成装置 |
JP2003223179A (ja) * | 2002-01-30 | 2003-08-08 | Sharp Corp | インテリジェントスピーカ |
JP2004108908A (ja) * | 2002-09-18 | 2004-04-08 | Denso Corp | オーディオ連携ナビゲーション装置 |
JP2004177634A (ja) * | 2002-11-27 | 2004-06-24 | Brother Ind Ltd | 文章読み上げ装置、同装置用プログラム及び記録媒体 |
JP2005300783A (ja) * | 2004-04-08 | 2005-10-27 | Zyyx:Kk | 音声変換装置 |
JP2007086316A (ja) * | 2005-09-21 | 2007-04-05 | Mitsubishi Electric Corp | 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体 |
JP2007226793A (ja) * | 2007-02-16 | 2007-09-06 | Mitsubishi Electric Corp | 車載マルチメディア装置 |
JP2008129412A (ja) * | 2006-11-22 | 2008-06-05 | Seiko Epson Corp | 半導体集積回路装置、電子機器 |
JP2008130118A (ja) * | 2006-11-17 | 2008-06-05 | Onkyo Corp | 音声再生システムおよびこれを構成するパーソナルコンピュータ、制御プログラム |
JP2008310238A (ja) * | 2007-06-18 | 2008-12-25 | Akuseru:Kk | 音声符号化装置、音声復号化装置、音声符号化プログラムおよび音声復号化プログラム |
JP2009204815A (ja) * | 2008-02-27 | 2009-09-10 | Kyocera Corp | 無線通信装置、無線通信方法および無線通信システム |
JP2009223307A (ja) * | 2008-02-20 | 2009-10-01 | Ntt Docomo Inc | 音声合成用音声データベース構築のための通信システム、中継装置および中継方法 |
JP2009265278A (ja) * | 2008-04-23 | 2009-11-12 | Konica Minolta Business Technologies Inc | 音声出力管理システムおよび音声出力装置 |
JP2009289385A (ja) * | 2008-06-02 | 2009-12-10 | Nec Electronics Corp | デジタルオーディオ信号処理装置、及び方法 |
JP2009294310A (ja) * | 2008-06-03 | 2009-12-17 | Mitsubishi Electric Corp | 発話権調整システムおよび発話可能機器 |
JP2010166324A (ja) * | 2009-01-15 | 2010-07-29 | Nec Corp | 携帯端末、音声合成方法、及び音声合成用プログラム |
JP2012027070A (ja) * | 2010-07-20 | 2012-02-09 | Denso Corp | 車室内通信システム、車載端末、および携帯端末 |
WO2012104952A1 (ja) * | 2011-02-03 | 2012-08-09 | パナソニック株式会社 | 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5677739A (en) | 1995-03-02 | 1997-10-14 | National Captioning Institute | System and method for providing described television services |
JPH10322673A (ja) | 1997-05-15 | 1998-12-04 | Canon Inc | 通信装置及び方法及び記憶媒体 |
US6603632B1 (en) | 2000-03-07 | 2003-08-05 | International Business Machines Corporation | Magnetic wear debris collector for air bearing of a spindle motor in a hard disk drive |
US7908172B2 (en) * | 2000-03-09 | 2011-03-15 | Impulse Radio Inc | System and method for generating multimedia accompaniments to broadcast data |
JP3993751B2 (ja) | 2000-03-30 | 2007-10-17 | 富士通株式会社 | テキスト情報読み上げ装置と、これを組み込んだ音楽音声再生装置、媒体、およびプログラム |
EP1860918B1 (en) * | 2006-05-23 | 2017-07-05 | Harman Becker Automotive Systems GmbH | Communication system and method for controlling the output of an audio signal |
JP2008191292A (ja) | 2007-02-02 | 2008-08-21 | Oki Electric Ind Co Ltd | 音声合成方法、プログラム及び音声合成装置並びに音楽音声再生装置 |
WO2009090702A1 (ja) * | 2008-01-17 | 2009-07-23 | Mitsubishi Electric Corporation | 車載用ガイダンス装置 |
JP5316189B2 (ja) | 2008-05-23 | 2013-10-16 | ヤマハ株式会社 | Avシステム |
US8898568B2 (en) * | 2008-09-09 | 2014-11-25 | Apple Inc. | Audio user interface |
JP2010066675A (ja) | 2008-09-12 | 2010-03-25 | Fuji Xerox Co Ltd | 音声情報処理システム及び音声情報処理プログラム |
JP2010205136A (ja) | 2009-03-05 | 2010-09-16 | Fujitsu Ltd | 音声読み上げ装置、携帯電話機及びコンピュータプログラム |
-
2011
- 2011-12-28 WO PCT/JP2011/007331 patent/WO2012104952A1/ja active Application Filing
- 2011-12-28 US US13/983,305 patent/US9472181B2/en not_active Expired - Fee Related
- 2011-12-28 JP JP2012555583A patent/JP5677470B2/ja not_active Expired - Fee Related
Patent Citations (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61103200A (ja) * | 1984-10-26 | 1986-05-21 | 日本電気株式会社 | 音声蓄積再生装置 |
JPS61274534A (ja) * | 1985-05-30 | 1986-12-04 | Toshiba Corp | 音声伝達システム |
JPH03214984A (ja) * | 1990-01-19 | 1991-09-20 | Ricoh Co Ltd | 文字放送受信装置 |
JPH04103192U (ja) * | 1991-03-19 | 1992-09-04 | ダイコク電機株式会社 | パチンコホール用店内放送システム |
JPH09281988A (ja) * | 1996-04-11 | 1997-10-31 | Fujitsu Ten Ltd | 音声合成装置 |
JP2002536693A (ja) * | 1999-02-08 | 2002-10-29 | クゥアルコム・インコーポレイテッド | 可変率音声符号化に基づいた音声合成装置 |
JP2003223179A (ja) * | 2002-01-30 | 2003-08-08 | Sharp Corp | インテリジェントスピーカ |
JP2004108908A (ja) * | 2002-09-18 | 2004-04-08 | Denso Corp | オーディオ連携ナビゲーション装置 |
JP2004177634A (ja) * | 2002-11-27 | 2004-06-24 | Brother Ind Ltd | 文章読み上げ装置、同装置用プログラム及び記録媒体 |
JP2005300783A (ja) * | 2004-04-08 | 2005-10-27 | Zyyx:Kk | 音声変換装置 |
JP2007086316A (ja) * | 2005-09-21 | 2007-04-05 | Mitsubishi Electric Corp | 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体 |
JP2008130118A (ja) * | 2006-11-17 | 2008-06-05 | Onkyo Corp | 音声再生システムおよびこれを構成するパーソナルコンピュータ、制御プログラム |
JP2008129412A (ja) * | 2006-11-22 | 2008-06-05 | Seiko Epson Corp | 半導体集積回路装置、電子機器 |
JP2007226793A (ja) * | 2007-02-16 | 2007-09-06 | Mitsubishi Electric Corp | 車載マルチメディア装置 |
JP2008310238A (ja) * | 2007-06-18 | 2008-12-25 | Akuseru:Kk | 音声符号化装置、音声復号化装置、音声符号化プログラムおよび音声復号化プログラム |
JP2009223307A (ja) * | 2008-02-20 | 2009-10-01 | Ntt Docomo Inc | 音声合成用音声データベース構築のための通信システム、中継装置および中継方法 |
JP2009204815A (ja) * | 2008-02-27 | 2009-09-10 | Kyocera Corp | 無線通信装置、無線通信方法および無線通信システム |
JP2009265278A (ja) * | 2008-04-23 | 2009-11-12 | Konica Minolta Business Technologies Inc | 音声出力管理システムおよび音声出力装置 |
JP2009289385A (ja) * | 2008-06-02 | 2009-12-10 | Nec Electronics Corp | デジタルオーディオ信号処理装置、及び方法 |
JP2009294310A (ja) * | 2008-06-03 | 2009-12-17 | Mitsubishi Electric Corp | 発話権調整システムおよび発話可能機器 |
JP2010166324A (ja) * | 2009-01-15 | 2010-07-29 | Nec Corp | 携帯端末、音声合成方法、及び音声合成用プログラム |
JP2012027070A (ja) * | 2010-07-20 | 2012-02-09 | Denso Corp | 車室内通信システム、車載端末、および携帯端末 |
WO2012104952A1 (ja) * | 2011-02-03 | 2012-08-09 | パナソニック株式会社 | 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2012104952A1 (ja) | 2012-08-09 |
US20130311188A1 (en) | 2013-11-21 |
JP5677470B2 (ja) | 2015-02-25 |
US9472181B2 (en) | 2016-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4753880B2 (ja) | リピータ装置およびその制御方法 | |
US8351624B2 (en) | Audio output apparatus, audio input apparatus, audio control apparatus, audio control system, and audio control method | |
JP4868225B2 (ja) | 情報処理装置および方法、並びにプログラム | |
US8175298B2 (en) | Audio output system control method and audio output system | |
JP5145633B2 (ja) | 音響再生装置及び映像音声視聴システム | |
JPWO2007052625A1 (ja) | 映像音声視聴システム | |
EP2104351A1 (en) | Video/audio output device, audio output device, video/audio reproducing device, video/audio data reproducing system, and video/audio data reproducing method | |
JPWO2009084139A1 (ja) | タイムシフト視聴システム、表示装置およびタイムシフト視聴方法 | |
JP5677470B2 (ja) | 音声読上げ装置、音声出力装置、音声出力システム、音声読上げ方法および音声出力方法 | |
JP5070996B2 (ja) | 音声制御装置及び音声制御システム | |
JP2008252834A (ja) | 音声再生装置 | |
US8411132B2 (en) | System and method for real-time media data review | |
US20180075858A1 (en) | System, apparatus and method for transmitting continuous audio data | |
JP5843856B2 (ja) | ビットストリーム送信装置、ビットストリーム送受信システム、ビットストリーム受信装置、ビットストリーム送信方法及びビットストリーム受信方法 | |
JP2008301454A (ja) | オーディオデータ中継装置 | |
JP2013150079A (ja) | 再生装置、音声出力装置、制御方法、音声出力方法、テレビジョン受像機、音声再生システム、プログラム、及び、記録装置 | |
JP2007235519A (ja) | 映像音声同期方法及び映像音声同期システム | |
KR20150059483A (ko) | 영상표시장치 및 영상표시장치의 구동방법, 음향출력장치 및 음향출력장치의 구동방법 | |
JP5113732B2 (ja) | データ放送送信装置 | |
KR100961172B1 (ko) | 오디오/비디오 중계 장치 및 방법 | |
JP2007200415A (ja) | 再生装置及び再生方法 | |
CN102656616A (zh) | 用于控制电子系统的方法和装置 | |
JP2007287199A (ja) | 再生装置 | |
JP4270136B2 (ja) | 映像・音声受信装置及びテレビジョン受像機 | |
JP2019154072A (ja) | 記録再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140926 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20141009 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20141016 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141216 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141226 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5677470 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |