JP2021101252A - 情報処理方法、情報処理装置およびプログラム - Google Patents
情報処理方法、情報処理装置およびプログラム Download PDFInfo
- Publication number
- JP2021101252A JP2021101252A JP2021043105A JP2021043105A JP2021101252A JP 2021101252 A JP2021101252 A JP 2021101252A JP 2021043105 A JP2021043105 A JP 2021043105A JP 2021043105 A JP2021043105 A JP 2021043105A JP 2021101252 A JP2021101252 A JP 2021101252A
- Authority
- JP
- Japan
- Prior art keywords
- content
- scene type
- information processing
- sound
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 63
- 238000003672 processing method Methods 0.000 title claims description 18
- 238000012545 processing Methods 0.000 claims abstract description 75
- 238000004458 analytical method Methods 0.000 claims abstract description 29
- 238000000034 method Methods 0.000 claims description 28
- 238000013179 statistical model Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 description 30
- 230000008569 process Effects 0.000 description 19
- 238000009826 distribution Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 238000010801 machine learning Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 7
- 239000000203 mixture Substances 0.000 description 6
- 239000004065 semiconductor Substances 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/57—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/72—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for transmitting results of analysis
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Stereophonic System (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
Description
図1は、本発明の第1実施形態に係るAV(Audio-Visual)システム10のブロック図である。第1実施形態のAVシステム10は、映像と音響とを含むコンテンツを再生するためのコンピュータシステムである。コンテンツは、例えば映画,スポーツ映像,ライブ映像,ミュージックビデオまたはゲーム等の映像作品である。図1に例示される通り、第1実施形態のAVシステム10は、情報処理装置100と信号供給装置11と放音システム12と表示装置13とを具備する。
本発明の第2実施形態を説明する。なお、以下に例示する各形態において、機能または作用が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
図5は、第3実施形態における情報処理装置200のブロック図である。情報処理装置200は、第1実施形態または第2実施形態で利用される識別モデルMを生成するコンピュータシステム(識別モデル生成装置)である。例えば、携帯電話機およびスマートフォン等の可搬型の端末装置またはパーソナルコンピュータ等の情報機器が情報処理装置200として利用される。
以上に例示した各態様は多様に変形されてもよい。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2個以上の態様を、相互に矛盾しない範囲で適宜に併合してもよい。
Claims (12)
- 映像と音響とを含むコンテンツにおける前記音響の特徴量に応じて当該コンテンツのシーン種別を特定する、
コンピュータにより実現される情報処理方法。 - 前記シーン種別の特定においては、音響の特徴量とシーン種別との関係を表す識別モデルを利用して、前記コンテンツにおける前記音響の特徴量から当該コンテンツのシーン種別を特定する
請求項1の情報処理方法。 - 前記識別モデルは、前記コンテンツにおける前記音響の特徴量からひとつの前記シーン種別を特定する統計モデルである
請求項2の情報処理方法。 - 前記コンテンツの再生を制御するための再生制御データを、前記特定したシーン種別に応じて設定する
請求項1から請求項3の何れかの情報処理方法。 - 前記再生制御データは、前記コンテンツの音響で形成される音場を制御するための音響制御データを含む
請求項4の情報処理方法。 - 前記特定したシーン種別を端末装置に通知する
請求項1から請求項5の何れかの情報処理方法。 - 映像と音響とを含むコンテンツにおける前記音響の特徴量から特定された当該コンテンツのシーン種別に応じて、前記コンテンツの再生を制御するための再生制御データを設定する
情報処理方法。 - 映像と音響とを含むコンテンツにおける前記音響の特徴量から、当該コンテンツが複数のシーン種別の各々に該当する尤度を統計モデルにより特定する
情報処理方法。 - 前記特徴量は、前記コンテンツの音響を表す複数のチャンネルにそれぞれ対応する複数の要素を含むベクトルであり、前記複数の要素の各々は、前記複数のチャンネルのうち当該要素に対応するチャンネルの周波数特性に応じた数値である
請求項1から請求項8の何れかの情報処理方法。 - 前記シーン種別は、前記コンテンツで表現される場面の分類である
請求項1から請求項9の何れかの情報処理方法。 - 映像と音響とを含むコンテンツにおける前記音響の特徴量に応じて当該コンテンツのシーン種別を特定する解析処理部
を具備する情報処理装置。 - 前記解析処理部が特定したシーン種別に応じて、前記コンテンツの再生を制御するための再生制御データを設定する設定処理部と、
前記設定処理部が設定した再生制御データに応じて前記コンテンツを再生する再生制御部と
を具備する請求項11の情報処理装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017035366 | 2017-02-27 | ||
JP2017035366 | 2017-02-27 | ||
JP2019501368A JP6856115B2 (ja) | 2017-02-27 | 2018-02-21 | 情報処理方法および情報処理装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019501368A Division JP6856115B2 (ja) | 2017-02-27 | 2018-02-21 | 情報処理方法および情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021101252A true JP2021101252A (ja) | 2021-07-08 |
JP7140221B2 JP7140221B2 (ja) | 2022-09-21 |
Family
ID=63253283
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019501368A Active JP6856115B2 (ja) | 2017-02-27 | 2018-02-21 | 情報処理方法および情報処理装置 |
JP2021043105A Active JP7140221B2 (ja) | 2017-02-27 | 2021-03-17 | 情報処理方法、情報処理装置およびプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019501368A Active JP6856115B2 (ja) | 2017-02-27 | 2018-02-21 | 情報処理方法および情報処理装置 |
Country Status (3)
Country | Link |
---|---|
US (2) | US11087779B2 (ja) |
JP (2) | JP6856115B2 (ja) |
WO (1) | WO2018155480A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110880328B (zh) * | 2019-11-20 | 2022-11-15 | Oppo广东移动通信有限公司 | 到站提醒方法、装置、终端及存储介质 |
CN111009261B (zh) * | 2019-12-10 | 2022-11-15 | Oppo广东移动通信有限公司 | 到站提醒方法、装置、终端及存储介质 |
CN111354371B (zh) * | 2020-02-26 | 2022-08-05 | Oppo广东移动通信有限公司 | 交通工具运行状态的预测方法、装置、终端及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016523006A (ja) * | 2013-03-26 | 2016-08-04 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ボリューム平準化器コントローラおよび制御方法 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002086818A2 (en) * | 2001-04-20 | 2002-10-31 | Koninklijke Philips Electronics N.V. | Image processing apparatus for and method of improving an image and an image display apparatus comprising the image processing apparatus |
WO2004081719A2 (en) * | 2003-03-07 | 2004-09-23 | Chaoticom, Inc. | Methods and systems for digital rights management of protected content |
JP4192841B2 (ja) | 2004-05-17 | 2008-12-10 | ヤマハ株式会社 | ミキサエンジン制御装置及びプログラム |
US8200063B2 (en) | 2007-09-24 | 2012-06-12 | Fuji Xerox Co., Ltd. | System and method for video summarization |
US8780209B2 (en) * | 2008-05-07 | 2014-07-15 | Evertz Microsystems Ltd. | Systems and methods for comparing media signals |
JP2009296274A (ja) | 2008-06-04 | 2009-12-17 | Toshiba Corp | 映像音声信号処理装置 |
JP2010011409A (ja) * | 2008-06-30 | 2010-01-14 | Nippon Telegr & Teleph Corp <Ntt> | 映像ダイジェスト装置及び映像編集プログラム |
JP2010230972A (ja) * | 2009-03-27 | 2010-10-14 | Pioneer Electronic Corp | 音信号処理装置、その方法、そのプログラム、および、再生装置 |
RU2494566C2 (ru) * | 2009-04-30 | 2013-09-27 | Сони Корпорейшн | Устройство и способ управления отображением |
JP2011095680A (ja) | 2009-11-02 | 2011-05-12 | Nec Corp | 音響モデル適応装置、音響モデル適応方法および音響モデル適応用プログラム |
JP2011223287A (ja) | 2010-04-09 | 2011-11-04 | Sony Corp | 情報処理装置、情報処理方法、及び、プログラム |
WO2011161820A1 (ja) * | 2010-06-25 | 2011-12-29 | 富士通株式会社 | 映像処理装置、映像処理方法及び映像処理プログラム |
US20120050570A1 (en) | 2010-08-26 | 2012-03-01 | Jasinski David W | Audio processing based on scene type |
CN102368297A (zh) | 2011-09-14 | 2012-03-07 | 北京英福生科技有限公司 | 一种用于识别被检测对象动作的设备、系统及方法 |
JP2013243619A (ja) | 2012-05-22 | 2013-12-05 | Toshiba Corp | 音響処理装置及び音響処理方法 |
JP5994974B2 (ja) * | 2012-05-31 | 2016-09-21 | サターン ライセンシング エルエルシーSaturn Licensing LLC | 情報処理装置、プログラム及び情報処理方法 |
US9195649B2 (en) * | 2012-12-21 | 2015-11-24 | The Nielsen Company (Us), Llc | Audio processing techniques for semantic audio recognition and report generation |
US10102850B1 (en) * | 2013-02-25 | 2018-10-16 | Amazon Technologies, Inc. | Direction based end-pointing for speech recognition |
US20150058877A1 (en) | 2013-08-21 | 2015-02-26 | Harman International Industries, Incorporated | Content-based audio/video adjustment |
CN104794606A (zh) | 2014-01-20 | 2015-07-22 | 琉璃奥图码科技股份有限公司 | 事件提示系统、事件提示方法以及情境播放单元 |
WO2016095218A1 (en) * | 2014-12-19 | 2016-06-23 | Dolby Laboratories Licensing Corporation | Speaker identification using spatial information |
KR20170009037A (ko) | 2015-07-15 | 2017-01-25 | 삼성전자주식회사 | 영상 컨텐츠 제공 장치 및 영상 컨텐츠 제공 방법 |
JP6532021B2 (ja) * | 2015-09-29 | 2019-06-19 | 本田技研工業株式会社 | 音声処理装置及び音声処理方法 |
US9668073B2 (en) | 2015-10-07 | 2017-05-30 | Robert Bosch Gmbh | System and method for audio scene understanding of physical object sound sources |
US10003895B2 (en) | 2015-12-10 | 2018-06-19 | Cisco Technology, Inc. | Selective environmental classification synchronization |
US10241748B2 (en) * | 2016-12-13 | 2019-03-26 | EVA Automation, Inc. | Schedule-based coordination of audio sources |
JP7086521B2 (ja) | 2017-02-27 | 2022-06-20 | ヤマハ株式会社 | 情報処理方法および情報処理装置 |
-
2018
- 2018-02-21 WO PCT/JP2018/006171 patent/WO2018155480A1/ja active Application Filing
- 2018-02-21 JP JP2019501368A patent/JP6856115B2/ja active Active
-
2019
- 2019-08-26 US US16/550,833 patent/US11087779B2/en active Active
-
2021
- 2021-03-17 JP JP2021043105A patent/JP7140221B2/ja active Active
- 2021-07-01 US US17/365,705 patent/US11756571B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016523006A (ja) * | 2013-03-26 | 2016-08-04 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ボリューム平準化器コントローラおよび制御方法 |
Non-Patent Citations (1)
Title |
---|
桑原 光孝 MITSUTAKA KUWABARA: "革新的な液晶テレビ CELLレグザ", 東芝レビュー 第65巻 第4号 TOSHIBA REVIEW, vol. 第65巻, JPN6022002393, 1 April 2010 (2010-04-01), JP, pages 23 - 26, ISSN: 0004690439 * |
Also Published As
Publication number | Publication date |
---|---|
US20190378535A1 (en) | 2019-12-12 |
WO2018155480A1 (ja) | 2018-08-30 |
US20210327458A1 (en) | 2021-10-21 |
US11087779B2 (en) | 2021-08-10 |
JP7140221B2 (ja) | 2022-09-21 |
US11756571B2 (en) | 2023-09-12 |
JPWO2018155480A1 (ja) | 2020-01-23 |
JP6856115B2 (ja) | 2021-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7283496B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP7140221B2 (ja) | 情報処理方法、情報処理装置およびプログラム | |
CN105074822B (zh) | 用于音频分类和处理的装置和方法 | |
CN110473525B (zh) | 获取语音训练样本的方法和装置 | |
CN104079247A (zh) | 均衡器控制器和控制方法 | |
US20180137425A1 (en) | Real-time analysis of a musical performance using analytics | |
CN104080024A (zh) | 音量校平器控制器和控制方法 | |
US11511200B2 (en) | Game playing method and system based on a multimedia file | |
JP6306528B2 (ja) | 音響モデル学習支援装置、音響モデル学習支援方法 | |
JP7069819B2 (ja) | コード特定方法、コード特定装置およびプログラム | |
JP2023527473A (ja) | オーディオ再生方法、装置、コンピュータ可読記憶媒体及び電子機器 | |
CN111105776A (zh) | 有声播放装置及其播放方法 | |
WO2022264461A1 (ja) | 情報処理システム及び情報処理方法 | |
US20210151030A1 (en) | Information processing device and information processing method | |
JP7230085B2 (ja) | 音声を処理するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
KR102570222B1 (ko) | 청능 수준 평가 및 청능 훈련 서비스 제공 방법, 장치 및 컴퓨터 프로그램 | |
KR102583986B1 (ko) | 목소리에 기반한 감정 분류가 반영된 음성 메시지의 말풍선 표현 방법 및 시스템 | |
US20230419932A1 (en) | Information processing device and control method thereof | |
US20230230609A1 (en) | Training machine learning frameworks to generate studio-quality recordings through manipulation of noisy audio signals | |
US20230395064A1 (en) | Application software and services with register classification capabilities | |
KR20240038503A (ko) | 배경음악 매칭 장치, 드로잉 데이터에 대응되는 배경음악을 매칭하는 방법 및 컴퓨터 프로그램 | |
CN118045358A (zh) | 游戏音频处理方法、游戏音频处理装置、电子设备、介质 | |
CN114781401A (zh) | 一种数据处理方法、装置、设备和存储介质 | |
CN118077222A (zh) | 信息处理装置、信息处理方法和程序 | |
KR20210027982A (ko) | 음향효과를 제공하는 전자책 서비스 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210402 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210402 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220809 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220822 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7140221 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |