JPWO2015097818A1 - テレビシステムとサーバ装置及びテレビ装置 - Google Patents
テレビシステムとサーバ装置及びテレビ装置 Download PDFInfo
- Publication number
- JPWO2015097818A1 JPWO2015097818A1 JP2015554405A JP2015554405A JPWO2015097818A1 JP WO2015097818 A1 JPWO2015097818 A1 JP WO2015097818A1 JP 2015554405 A JP2015554405 A JP 2015554405A JP 2015554405 A JP2015554405 A JP 2015554405A JP WO2015097818 A1 JPWO2015097818 A1 JP WO2015097818A1
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- source separation
- server
- television
- server device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8106—Monomedia components thereof involving special audio data, e.g. different tracks for different languages
- H04N21/8113—Monomedia components thereof involving special audio data, e.g. different tracks for different languages comprising music, e.g. song in MP3 format
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
本実施形態の音源分離部114Aは、非負行列因子分解を用いた技術であり、非音声信号が含まれる蓋然性が高い区間における音響信号のスペクトログラム(スペクトル特徴)から、非音声信号の特徴を表す第1の基底行列を作成する。そして、音声信号が含まれる尤もらしさを表す音声尤度を利用して、第1の基底行列から音声信号との関連性が高い成分を除外して第2の基底行列を作成する。この第2の基底行列を用いて音声信号の特徴を表す第3の基底行列と第1の係数行列を計算し、第3の基底行列と第1の係数行列の積により、音声信号のスペクトログラムを推定する。最後に、推定された音声信号のスペクトログラムを時間信号に変換することで、音響信号から音声信号を分離する。
Claims (9)
- 複数のコンテンツを選択的に提供するコンテンツ提供手段と、前記コンテンツの音響信号から音声成分と非音声成分を分離して別々の音量に設定する音源分離手段とを備えるサーバ装置と、
前記サーバ装置とネットワークを通じて接続され、前記サーバ装置のコンテンツ提供手段に前記コンテンツの選択を指示すると共に、前記音源分離手段に対して音源分離の処理実行を指示する指示手段と、前記指示に応答して前記サーバ装置から提供されるコンテンツを再生する再生手段とを備えるテレビ装置と
を具備するテレビシステム。 - 前記サーバ装置の音源分離手段は、前記音声成分と非音声成分の音量の比率を段階的に変更する比率変更手段を備え、前記テレビ装置の指示手段は、前記音声成分と非音声成分の音量の比率を段階的に指示する比率指示手段を備える請求項1記載のテレビシステム。
- 前記サーバ装置は、前記テレビ装置にサーバ搭載機能として音源分離手段を備えることを示すサーバ管理情報を提供し、
前記テレビ装置は、前記サーバ管理情報から前記音源分離手段の有無を判別しサーバ機能メニューとして提示する請求項1記載のテレビシステム。 - ネットワークを通じてテレビ装置と接続されるサーバ装置であって、
前記テレビ装置に複数のコンテンツを選択的に提供するコンテンツ提供手段と、
前記テレビ装置からの要求に応じて前記テレビ装置に提供するコンテンツの音響信号から音声成分と非音声成分を分離して別々の音量に設定する音源分離手段と
を備えるサーバ装置。 - 前記音源分離手段は、前記音声成分と非音声成分の音量の比率を段階的に変更する比率変更手段を備え、前記テレビ装置からの比率指示に従って前記音声成分と非音声成分の音量を指示された比率で設定する請求項4記載のサーバ装置。
- 前記テレビ装置にサーバ搭載機能として音源分離手段を備えることを示すサーバ管理情報を提供し、前記テレビ装置に、前記サーバ管理情報を通じて前記音源分離手段の有無を判別させ、サーバ機能メニューとして提示させる請求項4記載のサーバ装置。
- 複数のコンテンツを選択的に提供するコンテンツ提供手段と、前記コンテンツの音響信号から音声成分と非音声成分を分離して別々の音量に設定する音源分離手段とを備えるサーバ装置とネットワークを通じて接続されるテレビ装置であって、
前記サーバ装置のコンテンツ提供手段に前記コンテンツの選択を指示すると共に、前記音源分離手段に対して音源分離の処理実行を指示する指示手段と、
前記指示に応答して前記サーバ装置から提供されるコンテンツを再生する再生手段と
を備えるテレビ装置。 - 前記サーバ装置の音源分離手段が、前記音声成分と非音声成分の音量の比率を段階的に変更する比率変更手段を備えるとき、前記指示手段は、前記音声成分と非音声成分の音量の比率を段階的に指示する比率指示手段を備える請求項7記載のテレビ装置。
- 前記サーバ装置が、サーバ搭載機能として音源分離手段を備えることを示すサーバ管理情報を提供するとき、前記指示手段は、前記サーバ管理情報から前記音源分離手段の有無を判別しサーバ機能メニューとして提示する請求項7記載のテレビ装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2013/084927 WO2015097818A1 (ja) | 2013-12-26 | 2013-12-26 | テレビシステムとサーバ装置及びテレビ装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2015097818A1 true JPWO2015097818A1 (ja) | 2017-03-23 |
JP6290260B2 JP6290260B2 (ja) | 2018-03-07 |
Family
ID=53477754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015554405A Expired - Fee Related JP6290260B2 (ja) | 2013-12-26 | 2013-12-26 | テレビシステムとサーバ装置及びテレビ装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10102867B2 (ja) |
JP (1) | JP6290260B2 (ja) |
WO (1) | WO2015097818A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101958664B1 (ko) * | 2017-12-11 | 2019-03-18 | (주)휴맥스 | 멀티미디어 콘텐츠 재생 시스템에서 다양한 오디오 환경을 제공하기 위한 장치 및 방법 |
JP7389070B2 (ja) * | 2021-01-25 | 2023-11-29 | トヨタ自動車株式会社 | 情報処理装置、情報処理方法、およびプログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003259245A (ja) * | 2002-03-06 | 2003-09-12 | Funai Electric Co Ltd | テレビジョン受信装置 |
JP2005071090A (ja) * | 2003-08-25 | 2005-03-17 | Hideyoshi Tominaga | コンテンツ処理装置および配信システム |
JP2009128906A (ja) * | 2007-11-19 | 2009-06-11 | Mitsubishi Electric Research Laboratories Inc | 音響信号と雑音信号とを含む混成信号の雑音を除去するための方法およびシステム |
JP2010512042A (ja) * | 2006-12-01 | 2010-04-15 | エルジー エレクトロニクス インコーポレイティド | 命令入力装置及び方法、メディア信号のユーザインタフェース表示方法及びその具現装置、並びにミックス信号処理装置及びその方法 |
JP2012208737A (ja) * | 2011-03-30 | 2012-10-25 | Toshiba Corp | 医用システム |
JP2013050604A (ja) * | 2011-08-31 | 2013-03-14 | Nippon Hoso Kyokai <Nhk> | 音響処理装置およびそのプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002159099A (ja) | 2000-11-20 | 2002-05-31 | Matsushita Electric Ind Co Ltd | 音場制御装置 |
US20070044137A1 (en) * | 2005-08-22 | 2007-02-22 | Bennett James D | Audio-video systems supporting merged audio streams |
CN102362507A (zh) | 2009-03-27 | 2012-02-22 | 松下电器产业株式会社 | 网络控制设备、网络控制系统、网络控制方法及程序 |
JP5662276B2 (ja) | 2011-08-05 | 2015-01-28 | 株式会社東芝 | 音響信号処理装置および音響信号処理方法 |
-
2013
- 2013-12-26 JP JP2015554405A patent/JP6290260B2/ja not_active Expired - Fee Related
- 2013-12-26 WO PCT/JP2013/084927 patent/WO2015097818A1/ja active Application Filing
-
2016
- 2016-02-02 US US15/013,440 patent/US10102867B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003259245A (ja) * | 2002-03-06 | 2003-09-12 | Funai Electric Co Ltd | テレビジョン受信装置 |
JP2005071090A (ja) * | 2003-08-25 | 2005-03-17 | Hideyoshi Tominaga | コンテンツ処理装置および配信システム |
JP2010512042A (ja) * | 2006-12-01 | 2010-04-15 | エルジー エレクトロニクス インコーポレイティド | 命令入力装置及び方法、メディア信号のユーザインタフェース表示方法及びその具現装置、並びにミックス信号処理装置及びその方法 |
JP2009128906A (ja) * | 2007-11-19 | 2009-06-11 | Mitsubishi Electric Research Laboratories Inc | 音響信号と雑音信号とを含む混成信号の雑音を除去するための方法およびシステム |
JP2012208737A (ja) * | 2011-03-30 | 2012-10-25 | Toshiba Corp | 医用システム |
JP2013050604A (ja) * | 2011-08-31 | 2013-03-14 | Nippon Hoso Kyokai <Nhk> | 音響処理装置およびそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20160148623A1 (en) | 2016-05-26 |
WO2015097818A1 (ja) | 2015-07-02 |
US10102867B2 (en) | 2018-10-16 |
JP6290260B2 (ja) | 2018-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6253671B2 (ja) | 電子機器、制御方法およびプログラム | |
JP4913038B2 (ja) | 音声レベル制御 | |
JP2019525571A (ja) | ライブ音楽実演のマルチメディア・コンテンツのネットワーク・ベースの処理および配送 | |
JP2002123295A (ja) | 消費者電化製品に関連する装置をボイス制御する方法及び装置 | |
JP5085769B1 (ja) | 音響制御装置、音響補正装置、及び音響補正方法 | |
JP6945130B2 (ja) | 音声提示方法、音声提示プログラム、音声提示システム及び端末装置 | |
US20230009878A1 (en) | Adjusting audio and non-audio features based on noise metrics and speech intelligibility metrics | |
US20160267925A1 (en) | Audio processing apparatus that outputs, among sounds surrounding user, sound to be provided to user | |
JP2012032447A (ja) | 音質制御装置及び音質制御方法 | |
JP6290260B2 (ja) | テレビシステムとサーバ装置及びテレビ装置 | |
JP2005530213A (ja) | 音声信号処理装置 | |
JP2010283605A (ja) | 映像処理装置及び方法 | |
KR20130139074A (ko) | 오디오 신호 처리 방법 및 이를 적용한 오디오 신호 처리 장치 | |
WO2014141413A1 (ja) | 情報処理装置、出力方法およびプログラム | |
JP4982617B1 (ja) | 音響制御装置、音響補正装置、及び音響補正方法 | |
WO2016051534A1 (ja) | 音響システム、通信機器及びプログラム | |
US20200111475A1 (en) | Information processing apparatus and information processing method | |
KR102160756B1 (ko) | 디스플레이 장치 및 디스플레이 장치의 제어 방법 | |
KR101573868B1 (ko) | 노래 가사 자동 디스플레이 방법, 노래 가사를 인식하는 서버 및 이 서버를 포함하는 노래 가사 자동 디스플레이 시스템 | |
JP6690200B2 (ja) | 端末装置、通信方法 | |
JP6610195B2 (ja) | 端末装置、通信方法 | |
JP7453712B2 (ja) | オーディオ再生方法、装置、コンピュータ可読記憶媒体及び電子機器 | |
JP6822540B2 (ja) | 端末装置、通信方法及び通信プログラム | |
US11594113B2 (en) | Decoding device, decoding method, and program | |
CN113096674B (zh) | 一种音频处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170523 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170724 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20170914 Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20170914 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6290260 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |