JP6253671B2 - 電子機器、制御方法およびプログラム - Google Patents
電子機器、制御方法およびプログラム Download PDFInfo
- Publication number
- JP6253671B2 JP6253671B2 JP2015554418A JP2015554418A JP6253671B2 JP 6253671 B2 JP6253671 B2 JP 6253671B2 JP 2015554418 A JP2015554418 A JP 2015554418A JP 2015554418 A JP2015554418 A JP 2015554418A JP 6253671 B2 JP6253671 B2 JP 6253671B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- voice
- source separation
- sound source
- scene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 25
- 238000000926 separation method Methods 0.000 claims description 116
- 238000012545 processing Methods 0.000 claims description 89
- 230000005236 sound signal Effects 0.000 claims description 89
- 238000012937 correction Methods 0.000 claims description 27
- 230000001629 suppression Effects 0.000 claims description 11
- 239000002131 composite material Substances 0.000 claims 3
- 230000006870 function Effects 0.000 description 73
- 238000001514 detection method Methods 0.000 description 16
- 230000000694 effects Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000002708 enhancing effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000019629 palatability Nutrition 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 235000019640 taste Nutrition 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0356—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for synchronising with other signals, e.g. video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/15—Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
本実施形態のテレビジョン装置100は、図1に示すように、デジタル放送の放送波を受信し、受信した放送波から取り出した映像信号を用いて番組の映像を表示する据置型の映像表示装置であり、録画再生機能も備えている。
実施形態2では、テレビジョン装置100は、実施形態1の機能に加え、ユーザの嗜好、番組情報、字幕情報に基づいて、音源分離機能の制御を行っている。
実施形態3では、テレビジョン装置100は、実施形態1の機能に加え、ユーザによる字幕表示機能の設定に応じて音源分離機能の実行を制御している。
Claims (7)
- 入力される音声信号を、声信号と背景音信号とに分離して、前記声信号または前記背景音信号のいずれかを強調する音源分離機能を実行する音源分離処理部と、
映像に含まれるシーンに関するシーン情報に基づいて、前記シーンを表示する際における前記音源分離機能の実行を制御するとともに、前記声信号または前記背景音信号の強調または抑制に関するパラメータを含むパラメータ指令を前記音源分離処理部に出力する音声制御部と、
を備え、
前記音源分離処理部は、
前記音声信号を前記声信号と前記背景音信号とに分離する音源分離部と、
前記声信号を前記パラメータ指令に基づいて補正して、補正後の声信号を出力する声補正フィルタと、
前記背景音信号を前記パラメータ指令に基づいて補正して、補正後の背景音信号を出力する背景音補正フィルタと、
前記補正後の声信号に前記パラメータ指令に基づいたゲインを乗算したものと、前記補正後の背景音信号に前記パラメータ指令に基づいたゲインを乗算しものと、を加算して合成信号を出力する加算部と、
を有する電子機器。 - 前記音声制御部は、前記シーン情報において声が主体でない第1シーンが含まれている場合には、前記第1シーンの表示中に、前記声信号の強調を行わないように前記音源分離処理部を制御する、
請求項1に記載の電子機器。 - 前記音声制御部は、前記シーン情報において声が主体である第2シーンが含まれている場合には、前記第2シーンの表示中に、前記声信号の強調を行うように前記音源分離処理部を制御する、
請求項1に記載の電子機器。 - 前記音声制御部は、前記声信号の強調および抑制を行わない場合に、前記音源分離機能を実行しないように前記音源分離処理部を制御する、
請求項1〜3のいずれか一つに記載の電子機器。 - 前記音声制御部は、前記パラメータを調整することにより、前記声信号の強調および抑制を制御する、
請求項1〜3のいずれか一つに記載の電子機器。 - 入力される音声信号を、声信号と背景音信号とに分離して、前記声信号または前記背景音信号のいずれかを強調する音源分離機能を実行する音源分離工程と、
映像に含まれるシーンに関するシーン情報に基づいて制御する制御工程と、
を含み、
前記音源分離工程は、
入力される音声信号を、声信号と背景音信号とに分離する工程と、
前記声信号または前記背景音信号の強調または抑制に関するパラメータを含むパラメータ指令に基づいて、前記声信号を補正して、補正後の声信号を出力する工程と、
前記パラメータ指令に基づいて、前記背景音信号を補正して、補正後の背景音信号を出力する工程と、
前記補正後の声信号に前記パラメータ指令に基づいたゲインを乗算したものと、前記補正後の背景音信号に前記パラメータ指令に基づいたゲインを乗算しものと、を加算して合成信号を出力する工程と、
を含む制御方法。 - 入力される音声信号を、声信号と背景音信号とに分離して、前記声信号または前記背景音信号のいずれかを強調する音源分離機能を実行する音源分離手順と、
映像に含まれるシーンに関するシーン情報に基づいて制御する制御手順と、
をコンピュータに実行させ、
前記音源分離手順では、
入力される音声信号を、声信号と背景音信号とに分離する手順と、
前記声信号または前記背景音信号の強調または抑制に関するパラメータを含むパラメータ指令に基づいて、前記声信号を補正して、補正後の声信号を出力する手順と、
前記パラメータ指令に基づいて、前記背景音信号を補正して、補正後の背景音信号を出力する手順と、
前記補正後の声信号に前記パラメータ指令に基づいたゲインを乗算したものと、前記補正後の背景音信号に前記パラメータ指令に基づいたゲインを乗算しものと、を加算して合成信号を出力する手順と、
を含むプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2013/084997 WO2015097831A1 (ja) | 2013-12-26 | 2013-12-26 | 電子機器、制御方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2015097831A1 JPWO2015097831A1 (ja) | 2017-03-23 |
JP6253671B2 true JP6253671B2 (ja) | 2017-12-27 |
Family
ID=53477767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015554418A Expired - Fee Related JP6253671B2 (ja) | 2013-12-26 | 2013-12-26 | 電子機器、制御方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10176825B2 (ja) |
JP (1) | JP6253671B2 (ja) |
WO (1) | WO2015097831A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017038543A1 (ja) | 2015-09-03 | 2017-03-09 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
US10297269B2 (en) * | 2015-09-24 | 2019-05-21 | Dolby Laboratories Licensing Corporation | Automatic calculation of gains for mixing narration into pre-recorded content |
WO2017098949A1 (ja) * | 2015-12-10 | 2017-06-15 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
CN105657530A (zh) * | 2015-12-30 | 2016-06-08 | 深圳Tcl数字技术有限公司 | 声效模式同步方法及装置 |
KR102531886B1 (ko) * | 2016-08-17 | 2023-05-16 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
EP3324406A1 (en) * | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a variable threshold |
CN107316641B (zh) * | 2017-06-30 | 2021-06-15 | 联想(北京)有限公司 | 一种语音控制方法及电子设备 |
CN108257596B (zh) * | 2017-12-22 | 2021-07-23 | 北京小蓦机器人技术有限公司 | 一种用于提供目标呈现信息的方法与设备 |
US10540985B2 (en) | 2018-01-31 | 2020-01-21 | Ford Global Technologies, Llc | In-vehicle media vocal suppression |
WO2020074959A1 (en) * | 2018-10-12 | 2020-04-16 | Monitoreal Limited | System, device and method for object detection in video feeds |
CN110970056B (zh) * | 2019-11-18 | 2022-03-11 | 清华大学 | 一种从视频中分离音源的方法 |
JP2024536082A (ja) * | 2021-10-01 | 2024-10-04 | ソニーグループ株式会社 | オーディオソース分離 |
CN115278352A (zh) * | 2022-06-22 | 2022-11-01 | 北京字跳网络技术有限公司 | 一种视频播放方法、装置、设备及存储介质 |
WO2024161995A1 (ja) * | 2023-02-02 | 2024-08-08 | パナソニックIpマネジメント株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3381510B2 (ja) * | 1996-03-27 | 2003-03-04 | ヤマハ株式会社 | カラオケ装置 |
JP3157769B2 (ja) * | 1998-03-02 | 2001-04-16 | 静岡日本電気株式会社 | Tv音声制御装置 |
US7099821B2 (en) * | 2003-09-12 | 2006-08-29 | Softmax, Inc. | Separation of target acoustic signals in a multi-transducer arrangement |
JP2005315802A (ja) * | 2004-04-30 | 2005-11-10 | Olympus Corp | ユーザ支援装置 |
US20060059510A1 (en) * | 2004-09-13 | 2006-03-16 | Huang Jau H | System and method for embedding scene change information in a video bitstream |
JP2006093918A (ja) * | 2004-09-22 | 2006-04-06 | Sharp Corp | デジタル放送受信装置、デジタル放送受信方法、デジタル放送受信プログラム及びプログラム記録媒体 |
US8428443B2 (en) * | 2007-03-12 | 2013-04-23 | At&T Intellectual Property I, L.P. | Systems and methods of providing modified media content |
JP4488091B2 (ja) * | 2008-06-24 | 2010-06-23 | ソニー株式会社 | 電子機器、映像コンテンツ編集方法及びプログラム |
JP4364288B1 (ja) * | 2008-07-03 | 2009-11-11 | 株式会社東芝 | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム |
JP5435221B2 (ja) | 2009-09-25 | 2014-03-05 | 日本電気株式会社 | 音源信号分離装置、音源信号分離方法及びプログラム |
JP2011239141A (ja) * | 2010-05-10 | 2011-11-24 | Sony Corp | 情報処理方法、情報処理装置、情景メタデータ抽出装置、欠損補完情報生成装置及びプログラム |
JP2011254400A (ja) * | 2010-06-03 | 2011-12-15 | Olympus Imaging Corp | 画像音声記録装置 |
JP5737808B2 (ja) * | 2011-08-31 | 2015-06-17 | 日本放送協会 | 音響処理装置およびそのプログラム |
JP2013121096A (ja) * | 2011-12-08 | 2013-06-17 | Sharp Corp | 音声調整装置およびデジタル放送受信装置 |
-
2013
- 2013-12-26 JP JP2015554418A patent/JP6253671B2/ja not_active Expired - Fee Related
- 2013-12-26 WO PCT/JP2013/084997 patent/WO2015097831A1/ja active Application Filing
-
2016
- 2016-02-29 US US15/056,831 patent/US10176825B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO2015097831A1 (ja) | 2015-07-02 |
JPWO2015097831A1 (ja) | 2017-03-23 |
US10176825B2 (en) | 2019-01-08 |
US20160180861A1 (en) | 2016-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6253671B2 (ja) | 電子機器、制御方法およびプログラム | |
US9865279B2 (en) | Method and electronic device | |
EP3108672B1 (en) | Content-aware audio modes | |
KR101249239B1 (ko) | 오디오 레벨 제어 | |
US8265301B2 (en) | Audio signal processing apparatus, audio signal processing method, program, and input apparatus | |
JP4327886B1 (ja) | 音質補正装置、音質補正方法及び音質補正用プログラム | |
US9747923B2 (en) | Voice audio rendering augmentation | |
JP5085769B1 (ja) | 音響制御装置、音響補正装置、及び音響補正方法 | |
WO2015144243A1 (en) | Image display device with automatic sound enhancement function | |
US9905245B2 (en) | Electronic device and control method | |
JP2009296274A (ja) | 映像音声信号処理装置 | |
JP2008160232A (ja) | 映像音声再生装置 | |
JP2002027352A (ja) | デジタル放送受信装置 | |
JP2015012374A (ja) | 映像再生装置、映像再生装置の制御方法及び制御プログラム | |
JP6290260B2 (ja) | テレビシステムとサーバ装置及びテレビ装置 | |
JP2006186920A (ja) | 情報再生装置および情報再生方法 | |
JP2010258776A (ja) | 音声信号処理装置 | |
WO2011013669A1 (ja) | 表示装置、プログラム及びプログラムが記録されたコンピュータ読み取り可能な記憶媒体 | |
KR100499032B1 (ko) | 텔레비젼 수신기를 기반으로 하는 오디오 및 비디오 합성편집장치 | |
JP2006093918A (ja) | デジタル放送受信装置、デジタル放送受信方法、デジタル放送受信プログラム及びプログラム記録媒体 | |
WO2011037204A1 (ja) | コンテンツ再生装置、音声パラメータ設定方法、プログラム、および記録媒体 | |
JP4716833B2 (ja) | 映像再生装置 | |
JP2001238299A (ja) | 放送受信装置 | |
JP2010191302A (ja) | 音声出力装置 | |
WO2017211400A1 (en) | Image display device with conditional volume level adjustment function |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170526 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20170913 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20170914 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6253671 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |