JP2022104006A - センサ装置、センシング方法、データ処理装置、データ処理方法及びデータ処理プログラム - Google Patents
センサ装置、センシング方法、データ処理装置、データ処理方法及びデータ処理プログラム Download PDFInfo
- Publication number
- JP2022104006A JP2022104006A JP2020218964A JP2020218964A JP2022104006A JP 2022104006 A JP2022104006 A JP 2022104006A JP 2020218964 A JP2020218964 A JP 2020218964A JP 2020218964 A JP2020218964 A JP 2020218964A JP 2022104006 A JP2022104006 A JP 2022104006A
- Authority
- JP
- Japan
- Prior art keywords
- data processing
- utterance
- data
- section
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 10
- 238000003672 processing method Methods 0.000 title claims description 9
- 241000282414 Homo sapiens Species 0.000 claims abstract description 18
- 230000005236 sound signal Effects 0.000 claims description 24
- 241000282412 Homo Species 0.000 claims description 11
- 230000001360 synchronised effect Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 abstract description 8
- 238000004891 communication Methods 0.000 description 7
- 238000002372 labelling Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 206010011224 Cough Diseases 0.000 description 1
- WSMOXQBLJXEQNX-UHFFFAOYSA-N Olguine Natural products CC(=O)OC(C)C(OC(C)=O)C=CC1OC1C1C(OC(C)=O)C=CC(=O)O1 WSMOXQBLJXEQNX-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 206010041232 sneezing Diseases 0.000 description 1
Images
Landscapes
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
Description
入力音声信号として入力される音波を音電気変換して、音電気信号とし、
前記音電気信号を一定時間の間だけピークホールドして、ピークホールド信号とし、
前記ピークホールド信号を時刻同期のとれた単位期間の周期でAD変換して、ディジタル音声信号とする
ことを特徴とする。
入力されたディジタル音声信号が、設定された閾値以上のとき発話であり、設定された前記閾値未満のときに無音と判断して、話者データとし、
複数の人間の前記話者データを時系列に並べて、いずれかの人間が発話している区間を発話区間とし、いずれの人間も発話していない区間を無音区間と判断し、
前記発話区間の中で、一定期間以下の発話を無音区間に修正して、発話区間データとし、
前記話者データ及び前記発話区間データから、各発話区間の中で発話と判断された期間の長い人間を各発話区間の発話者と推定する
ことを特徴とする。
本開示のデータ処理装置及びデータ処理方法は、人集団内の会話の中で、誰が、どのようなタイミングで発話しているのかを精度高く検出することができる。
本開示の発話者推定システムは、複数の人間が集まった人集団内の会話の中で、誰が、どのようなタイミングで発話しているのかを精度高く検出することができる。
本実施形態のセンサ装置の使用方法の一例を図1に示す。センサ装置10は、複数の人間、ここでは、「Aさん」、「Bさん」及び「Cさん」の3人が保持している。Aさんが話していると、Aさんの声がAさんの保持するセンサ装置10に記録される。同時に、Bさん及びCさんの保持するセンサ装置10にも、声の大きさは小さいが記録される。
本実施形態のデータ処理装置の構成の一例を図3に示す。データ処理装置20は、推定前処理部21、発話区間推定部22及び発話者推定部23を備える。データ処理装置の動作の一例を図4に示す。図4は、各データを時刻で同期させ、相対的な時間で17秒後から47秒後までの動作を示したものである。
11:集音部
12:増幅回路
13:ピークホールド回路
14:同期信号生成回路
15:AD変換回路
16:記憶回路
20:データ処理装置
21:推定前処理部
211:ラベル付け回路
212:ゼロ点補正回路
22:発話区間推定部
221:穴埋め回路
222:パルスノイズ除去回路
223:発話論理回路
224:発話区間データ生成回路
23:発話者推定部
Claims (8)
- 入力音声信号として入力される音波を音電気変換して、音電気信号とし、
前記音電気信号を一定時間の間だけピークホールドして、ピークホールド信号とし、
前記ピークホールド信号を時刻同期のとれた単位期間の周期でAD変換して、ディジタル音声信号とする
ことを特徴とするセンサ装置。 - 入力されたディジタル音声信号が、設定された閾値以上のとき発話であり、前記設定された閾値未満のときに無音と判断して、話者データとし、
複数の人間の前記話者データを時系列に並べて、いずれかの人間が発話している区間を発話区間とし、いずれの人間も発話していない区間を無音区間と判断し、
前記発話区間の中で、一定期間以下の発話を無音区間に修正して、発話区間データとし、
前記話者データ及び前記発話区間データから、各発話区間の中で発話と判断された期間の長い人間を各発話区間の発話者と推定する
ことを特徴とするデータ処理装置。 - 前記データ処理装置は、入力されたディジタル音声信号の過去の一定期間内における大きさの平均値の一定割合を前記設定された閾値と設定することを特徴とする請求項2に記載のデータ処理装置。
- 前記データ処理装置は、前記話者データの中で、前後所定の数の単位期間が発話で、1単位期間だけ無音と判断されたときは、当該1単位期間も発話と訂正し、
前後所定の数の単位期間が無音で、1単位期間だけ発話と判断されたときは、当該1単位期間も無音と訂正することを特徴とする請求項2又は3に記載のデータ処理装置。 - 複数の請求項1に記載のセンサ装置及び請求項2から4に記載のいずれかのデータ処理装置を備える発話者推定システム。
- 入力音声信号として入力される音波を音電気変換して、音電気信号とし、
前記音電気信号を一定時間の間だけピークホールドして、ピークホールド信号とし、
前記ピークホールド信号を時刻同期のとれた単位期間の周期でAD変換して、ディジタル音声信号とする
ことを特徴とするセンシング方法。 - 入力されたディジタル音声信号が、設定された閾値以上のとき発話であり、前記設定された閾値未満のときに無音と判断して、話者データとし、
複数の人間の前記話者データを時系列に並べて、いずれかの人間が発話していると判断された区間を発話区間とし、いずれの人間も発話していないと判断された区間を無音区間とし、
前記発話区間の中で、一定期間以下の発話を無音区間に修正して、発話区間データとし、
前記話者データ及び前記発話区間データから、各発話区間の中で発話と判断された期間の長い人間を各発話区間の発話者と推定する
ことを特徴とするデータ処理方法。 - 請求項7に記載のデータ処理方法をコンピュータに実行させるデータ処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020218964A JP2022104006A (ja) | 2020-12-28 | 2020-12-28 | センサ装置、センシング方法、データ処理装置、データ処理方法及びデータ処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020218964A JP2022104006A (ja) | 2020-12-28 | 2020-12-28 | センサ装置、センシング方法、データ処理装置、データ処理方法及びデータ処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022104006A true JP2022104006A (ja) | 2022-07-08 |
Family
ID=82279482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020218964A Pending JP2022104006A (ja) | 2020-12-28 | 2020-12-28 | センサ装置、センシング方法、データ処理装置、データ処理方法及びデータ処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022104006A (ja) |
-
2020
- 2020-12-28 JP JP2020218964A patent/JP2022104006A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9516408B2 (en) | Method and apparatus for wind noise detection | |
JP5607627B2 (ja) | 信号処理装置及び信号処理方法 | |
AU2011201312B2 (en) | Estimating own-voice activity in a hearing-instrument system from direct-to-reverberant ratio | |
DK2306457T3 (en) | Automatic audio recognition based on binary time frequency units | |
KR20060044629A (ko) | 신경 회로망을 이용한 음성 신호 분리 시스템 및 방법과음성 신호 강화 시스템 | |
EP2881948A1 (en) | Spectral comb voice activity detection | |
CN106664486A (zh) | 用于风噪声检测的方法和装置 | |
US20190164567A1 (en) | Speech signal recognition method and device | |
JP2010232862A (ja) | 音声処理装置、音声処理方法、及び、プログラム | |
JP6641832B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP5027127B2 (ja) | 背景雑音に応じてバイブレータの動作を制御することによる移動通信装置の音声了解度の向上 | |
EP1429314A1 (en) | Correction of energy as input feature for speech processing | |
CN110364175B (zh) | 语音增强方法及系统、通话设备 | |
US11551707B2 (en) | Speech processing method, information device, and computer program product | |
JP5782402B2 (ja) | 音声品質客観評価装置及び方法 | |
JP2022104006A (ja) | センサ装置、センシング方法、データ処理装置、データ処理方法及びデータ処理プログラム | |
Granqvist | The self-to-other ratio applied as a phonation detector for voice accumulation | |
JP7284570B2 (ja) | 音声再生システムおよびプログラム | |
JP4500458B2 (ja) | 音声及びオーディオ信号用リアルタイム品質アナライザ | |
CN109672787A (zh) | 一种设备智能提醒方法 | |
Chinaev et al. | Long-term synchronization of wireless acoustic sensor networks with nonpersistent acoustic activity using coherence state | |
US20220189498A1 (en) | Signal processing device, signal processing method, and program | |
JP5044581B2 (ja) | 複数信号強調装置とその方法と、プログラム | |
KR101151746B1 (ko) | 오디오 신호용 잡음제거 방법 및 장치 | |
JP2009025025A (ja) | 音源方向推定装置およびこれを用いた音源分離装置、ならびに音源方向推定方法およびこれを用いた音源分離方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20210329 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230608 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240423 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240530 |