JP2008197650A - 音データ記録再生装置および音データ記録再生方法 - Google Patents
音データ記録再生装置および音データ記録再生方法 Download PDFInfo
- Publication number
- JP2008197650A JP2008197650A JP2008025678A JP2008025678A JP2008197650A JP 2008197650 A JP2008197650 A JP 2008197650A JP 2008025678 A JP2008025678 A JP 2008025678A JP 2008025678 A JP2008025678 A JP 2008025678A JP 2008197650 A JP2008197650 A JP 2008197650A
- Authority
- JP
- Japan
- Prior art keywords
- data
- sound
- stream
- time
- sound data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】本装置は、音データ取得部(101)と、音源定位部(103)と、音源分離部(105)と、時系列データ格納部(109)と、ストリームデータ格納部(111)と、前記2個の格納部に接続され、データの処理を行うデータ処理部(115)と、を備える。本装置は、音データを再生する音データ再生部(119)と、ストリームデータを表示する表示部(117)と、をさらに備え、前記表示部によって表示されたストリームデータが選択されると、前記音データ再生部が、選択されたストリームデータに関する音データを再生するように構成される。
【選択図】図1
Description
Microphone Array on Mobile Robot, Proceedings of the Ninth European Conference
on Speech Communication and Technology (Interspeech-2005), 249-252, Lisboa, Sep. 2005 p.10) 。Steered beam formerによる定位は、以下のステップにより、マイクペア間での相互相関に基づいた定位を行う。
2)各点に対して、全てのマイクのペアについて相互相関の和を求める。この和が最大となる点の方向が音源の方向であると推定する。
3)推定された相互相関の値を全て0とする。
4)2)および3)を繰り返し、全ての音源方向を推定する。これにより、推定した音源方向を時間軸上で走査し、方向の近いものを1つの音源としてラベル付けする。
Source Separation(GSS)による音源分離を行いPost-Filterによって雑音抑圧処理を行う
(J.-M. Valin, J. Rouat, F. Michaud: Enhanced Robot Audition Based on Microphone Array Source Separation with Post-Filter, Proc. IEEE/RSJ International
Conference on Intelligent Robots and Systems (IROS), pp.2123-2128, 2004.)。
Claims (14)
- 音データを取得する音データ取得部と、
音源が存在する方向を特定する音源定位部と、
音源ごとの音データを分離する音源分離部と、
音源ごとの時系列の音データを格納する時系列データ格納部と、
所定の時間において、所定の音源の方向を示す、音に関するストリームデータを格納するストリームデータ格納部と、
前記時系列データ格納部および前記ストリームデータ格納部に接続され、データの処理を行うデータ処理部と、
音データを再生する音データ再生部と、
ストリームデータを表示する表示部と、を備え、前記表示部によって表示されたストリームデータが選択されると、前記音データ再生部が、選択されたストリームデータに関する音データを再生する音データ記録再生装置。 - ストリームデータのリストを格納するストリームリスト格納部をさらに備える請求項1に記載の音データ記録再生装置。
- ストリームデータが、時系列の音データへのリンクに関するデータを含む請求項1または2に記載の音データ記録再生装置。
- 音データから音声を認識し音声のテキスト情報を生成する音声認識部をさらに備え、前記表示部が前記音声のテキスト情報をさらに表示する請求項1から3のいずれか1項に記載の音データ記録再生装置。
- 前記表示部が、ストリームデータとともに時間軸を表示し、前記表示部によって表示された時間軸上の点が選択されると、前記データ処理部が、対応するストリームデータを前記ストリームデータ格納部から取り出し、前記表示部が、該対応するストリームデータに基づいて、選択された所定の時刻における音源およびその方向を表示する請求項1から4のいずれか1項に記載の音データ記録再生装置。
- 前記表示部に表示された所定の時刻における音源から所定の音源が選択されると、前記データ処理部が、該所定の音源の音データを前記時系列データ格納部から取り出し、前記音データ再生部が、該対応する音データを再生する請求項5に記載の音データ記録再生装置。
- 画像データを取得する画像データ取得部をさらに備え、前記時系列データ格納部が、時系列の画像データをさらに格納し、前記ストリームデータ格納部に格納されるデータが、所定の時間において、所定の対象の方向を示す画像に関するストリームデータをさらに含む請求項1から6のいずれかに記載の音データ記録再生装置。
- 音データ記録再生装置によって音データを再生する方法であって、
音データを取得し、
音源が存在する方向を特定し、
音源ごとの音データを分離し、
音源ごとの時系列の音データを、時系列データ格納部に格納し、
所定の時間において、所定の音源の方向を示す、音に関するストリームデータを作成し、ストリームデータ格納部に格納し、
ストリームデータを表示し、
表示されたストリームデータが選択されると、選択されたストリームデータに関する音データを再生する、音データ記録再生方法。 - 音に関するストリームデータを作成し、ストリームデータ格納部に格納した後に、ストリームデータのリストを作成し、ストリームリスト格納部に格納する、請求項8に記載の音データ記録再生方法。
- ストリームデータが、時系列の音データへのリンクに関するデータを含む請求項8または9に記載の音データ記録再生方法。
- 音データから音声を認識し音声のテキスト情報を生成し、前記音声のテキスト情報を表示する請求項8から10のいずれか1項に記載の音データ記録再生方法。
- ストリームデータとともに時間軸を表示し、表示された時間軸上の点が選択されると、対応するストリームデータを前記ストリームデータ格納部から取り出し、該対応するストリームデータに基づいて、選択された所定の時刻における音源およびその方向を表示する請求項8から11のいずれか1項に記載の音データ記録再生方法。
- 前記表示部に表示された所定の時刻における音源から所定の音源が選択されると、該所定の音源の音データを前記時系列データ格納部から取り出し、該対応する音データを再生する請求項12に記載の音データ記録再生方法。
- 画像データを取得し、時系列の画像データを前記時系列データ格納部に格納し、前記ストリームデータ格納部に格納されるデータが、所定の時間において、所定の対象の方向を示す画像に関するストリームデータをさらに含む請求項8から13のいずれかに記載の音データ記録再生方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US90108107A | 2007-02-14 | 2007-02-14 | |
US60/901,081 | 2007-02-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008197650A true JP2008197650A (ja) | 2008-08-28 |
JP5383056B2 JP5383056B2 (ja) | 2014-01-08 |
Family
ID=39756590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008025678A Expired - Fee Related JP5383056B2 (ja) | 2007-02-14 | 2008-02-05 | 音データ記録再生装置および音データ記録再生方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5383056B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010145524A (ja) * | 2008-12-16 | 2010-07-01 | Casio Hitachi Mobile Communications Co Ltd | 記録装置、再生装置及びプログラム |
JP2010231089A (ja) * | 2009-03-27 | 2010-10-14 | Yamaha Corp | 録音装置および録音再生装置 |
US8886530B2 (en) | 2011-06-24 | 2014-11-11 | Honda Motor Co., Ltd. | Displaying text and direction of an utterance combined with an image of a sound source |
JPWO2014097748A1 (ja) * | 2012-12-18 | 2017-01-12 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 特定の話者の音声を加工するための方法、並びに、その電子装置システム及び電子装置用プログラム |
US9664772B2 (en) | 2013-08-30 | 2017-05-30 | Honda Motor Co., Ltd. | Sound processing device, sound processing method, and sound processing program |
US9723402B2 (en) | 2014-08-27 | 2017-08-01 | Samsung Electronics Co., Ltd. | Audio data processing method and electronic device supporting the same |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08297624A (ja) * | 1995-02-28 | 1996-11-12 | Toshiba Corp | 電子会議システム |
JPH11143460A (ja) * | 1997-11-12 | 1999-05-28 | Nippon Telegr & Teleph Corp <Ntt> | 音楽演奏に含まれる旋律の分離方法、分離抽出方法および分離除去方法 |
JP2001056700A (ja) * | 1999-08-20 | 2001-02-27 | Olympus Optical Co Ltd | 音声記録再生装置 |
JP2001134613A (ja) * | 1999-08-26 | 2001-05-18 | Sony Corp | 音響検索処理方法、音響情報検索装置、音響情報蓄積方法、音響情報蓄積装置および音響映像検索処理方法、音響映像情報検索装置、音響映像情報蓄積方法、音響映像情報蓄積装置 |
JP2003270034A (ja) * | 2002-03-15 | 2003-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 音情報解析方法、装置、プログラム、および記録媒体 |
JP2004185514A (ja) * | 2002-12-05 | 2004-07-02 | Ricoh Co Ltd | 音声記録装置、音声記録方法、音声記録プログラム及び記録媒体 |
JP2005043628A (ja) * | 2003-07-28 | 2005-02-17 | Toshiba Corp | 対話記録装置および対話記録方法 |
JP2005295015A (ja) * | 2004-03-31 | 2005-10-20 | Hitachi Kokusai Electric Inc | 映像会議システム |
JP2006123161A (ja) * | 2004-09-30 | 2006-05-18 | Samsung Electronics Co Ltd | 位置把握、追跡および分離のためのオーディオビデオセンサー融合装置および融合方法 |
WO2006137732A1 (en) * | 2005-06-24 | 2006-12-28 | Nederlandse Organisatie Voor Toegepast-Natuurwetenschappelijk Onderzoek Tno | System and method for extracting acoustic signals from signals emitted by a plurality of sources |
JP2007329702A (ja) * | 2006-06-08 | 2007-12-20 | Toyota Motor Corp | 受音装置と音声認識装置とそれらを搭載している可動体 |
-
2008
- 2008-02-05 JP JP2008025678A patent/JP5383056B2/ja not_active Expired - Fee Related
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08297624A (ja) * | 1995-02-28 | 1996-11-12 | Toshiba Corp | 電子会議システム |
JPH11143460A (ja) * | 1997-11-12 | 1999-05-28 | Nippon Telegr & Teleph Corp <Ntt> | 音楽演奏に含まれる旋律の分離方法、分離抽出方法および分離除去方法 |
JP2001056700A (ja) * | 1999-08-20 | 2001-02-27 | Olympus Optical Co Ltd | 音声記録再生装置 |
JP2001134613A (ja) * | 1999-08-26 | 2001-05-18 | Sony Corp | 音響検索処理方法、音響情報検索装置、音響情報蓄積方法、音響情報蓄積装置および音響映像検索処理方法、音響映像情報検索装置、音響映像情報蓄積方法、音響映像情報蓄積装置 |
JP2003270034A (ja) * | 2002-03-15 | 2003-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 音情報解析方法、装置、プログラム、および記録媒体 |
JP2004185514A (ja) * | 2002-12-05 | 2004-07-02 | Ricoh Co Ltd | 音声記録装置、音声記録方法、音声記録プログラム及び記録媒体 |
JP2005043628A (ja) * | 2003-07-28 | 2005-02-17 | Toshiba Corp | 対話記録装置および対話記録方法 |
JP2005295015A (ja) * | 2004-03-31 | 2005-10-20 | Hitachi Kokusai Electric Inc | 映像会議システム |
JP2006123161A (ja) * | 2004-09-30 | 2006-05-18 | Samsung Electronics Co Ltd | 位置把握、追跡および分離のためのオーディオビデオセンサー融合装置および融合方法 |
WO2006137732A1 (en) * | 2005-06-24 | 2006-12-28 | Nederlandse Organisatie Voor Toegepast-Natuurwetenschappelijk Onderzoek Tno | System and method for extracting acoustic signals from signals emitted by a plurality of sources |
JP2007329702A (ja) * | 2006-06-08 | 2007-12-20 | Toyota Motor Corp | 受音装置と音声認識装置とそれらを搭載している可動体 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010145524A (ja) * | 2008-12-16 | 2010-07-01 | Casio Hitachi Mobile Communications Co Ltd | 記録装置、再生装置及びプログラム |
JP2010231089A (ja) * | 2009-03-27 | 2010-10-14 | Yamaha Corp | 録音装置および録音再生装置 |
US8886530B2 (en) | 2011-06-24 | 2014-11-11 | Honda Motor Co., Ltd. | Displaying text and direction of an utterance combined with an image of a sound source |
JPWO2014097748A1 (ja) * | 2012-12-18 | 2017-01-12 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 特定の話者の音声を加工するための方法、並びに、その電子装置システム及び電子装置用プログラム |
US9664772B2 (en) | 2013-08-30 | 2017-05-30 | Honda Motor Co., Ltd. | Sound processing device, sound processing method, and sound processing program |
US9723402B2 (en) | 2014-08-27 | 2017-08-01 | Samsung Electronics Co., Ltd. | Audio data processing method and electronic device supporting the same |
Also Published As
Publication number | Publication date |
---|---|
JP5383056B2 (ja) | 2014-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6464449B2 (ja) | 音源分離装置、及び音源分離方法 | |
US20220159403A1 (en) | System and method for assisting selective hearing | |
Donley et al. | Easycom: An augmented reality dataset to support algorithms for easy communication in noisy environments | |
Tan et al. | Audio-visual speech separation and dereverberation with a two-stage multimodal network | |
JP6841229B2 (ja) | 音声処理装置および方法、並びにプログラム | |
KR101238586B1 (ko) | 녹화된 미팅 타임라인에서 사용하기 위한 자동 얼굴 추출 | |
JP5383056B2 (ja) | 音データ記録再生装置および音データ記録再生方法 | |
Zmolikova et al. | Neural target speech extraction: An overview | |
US20170188173A1 (en) | Method and apparatus for presenting to a user of a wearable apparatus additional information related to an audio scene | |
JP2007221300A (ja) | ロボット及びロボットの制御方法 | |
JP5618043B2 (ja) | 映像音響処理システム、映像音響処理方法及びプログラム | |
CN112637529B (zh) | 一种录像处理方法、装置、存储介质及电子设备 | |
US11496830B2 (en) | Methods and systems for recording mixed audio signal and reproducing directional audio | |
US20210281739A1 (en) | Information processing device and method, and program | |
JP2020520576A5 (ja) | ||
JP2020520576A (ja) | 空間オーディオの提示のための装置および関連する方法 | |
JP2005274707A (ja) | 情報処理装置および方法、プログラム、並びに記録媒体 | |
CN113099031B (zh) | 声音录制方法及相关设备 | |
US20230164509A1 (en) | System and method for headphone equalization and room adjustment for binaural playback in augmented reality | |
Navarathna et al. | Multiple cameras for audio-visual speech recognition in an automotive environment | |
EP2503545A1 (en) | Arrangement and method relating to audio recognition | |
JP4490076B2 (ja) | 物体追跡方法、物体追跡装置、プログラム、および、記録媒体 | |
CN105979469B (zh) | 一种录音处理方法及终端 | |
EP3742185B1 (en) | An apparatus and associated methods for capture of spatial audio | |
CN112487246A (zh) | 一种多人视频中发言人的识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120321 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131001 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5383056 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |