JP6589041B1 - 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム - Google Patents
音声分析装置、音声分析方法、音声分析プログラム及び音声分析システムInfo
- Publication number
- JP6589041B1 JP6589041B1 JP2018502280A JP2018502280A JP6589041B1 JP 6589041 B1 JP6589041 B1 JP 6589041B1 JP 2018502280 A JP2018502280 A JP 2018502280A JP 2018502280 A JP2018502280 A JP 2018502280A JP 6589041 B1 JP6589041 B1 JP 6589041B1
- Authority
- JP
- Japan
- Prior art keywords
- sound
- participants
- unit
- participant
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 181
- 238000003384 imaging method Methods 0.000 claims description 22
- 238000000034 method Methods 0.000 description 48
- 238000004891 communication Methods 0.000 description 40
- 230000008569 process Effects 0.000 description 33
- 230000004807 localization Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
図1は、本実施形態に係る音声分析システムSの模式図である。音声分析システムSは、音声分析装置100と、集音装置10と、通信端末20とを含む。音声分析システムSが含む集音装置10及び通信端末20の数は限定されない。音声分析システムSは、その他のサーバ、端末等の機器を含んでもよい。
図2は、本実施形態に係る音声分析システムSのブロック図である。図2において、矢印は主なデータの流れを示しており、図2に示していないデータの流れがあってよい。図2において、各ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図2に示すブロックは単一の装置内に実装されてよく、あるいは複数の装置内に別れて実装されてよい。ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてよい。
図3は、本実施形態に係る音声分析システムSが行う音声分析方法の模式図である。まず音声分析装置100の位置設定部111は、後述の位置設定処理によって、分析対象とする議論における各参加者の位置を設定する(a)。位置設定部111は、後述の位置設定処理において特定した各参加者の位置を位置記憶部131に記憶させることにより、各参加者の位置を設定する。
まず、図4のステップS1に示した位置設定処理について説明する。図5は、設定画面Aを表示している通信端末20の表示部21の前面図である。位置設定処理は、分析者が通信端末20を操作することによって各参加者の位置を設定する手動設定処理と、各参加者が自身の位置を特定するための情報を集音装置10に入力する自動設定処理とを含む。
図6(a)〜図6(c)は、それぞれ本実施形態に係る音声分析装置100が行う自動設定処理の模式図である。音声分析装置100は、自動設定処理が指示されると、図6(a)〜図6(c)に示す処理のうち少なくとも1つによって参加者Uの位置を設定する。
次に、図4のステップS4に示した追従処理について説明する。図8は、本実施形態に係る音声分析装置100が行う追従処理の模式図である。追従処理は、音源定位部113及び分析部115による分析対象の音声の途中で、位置記憶部131に記憶された各参加者Uの位置を更新する処理である。
本実施形態に係る音声分析装置100は、各グループに配置される集音装置10において参加者の発する音声、参加者の顔の画像、参加者が提示するカードの情報等の各参加者に関する情報を取得し、取得した情報に基づいて自動的に各参加者の位置を設定する。そのため、議論の音声を分析する際に各グループについて各参加者の位置を設定する手間を削減できる。
100 音声分析装置
110 制御部
111 位置設定部
112 音声取得部
114 追従部
115 分析部
10 集音装置
20 通信端末
Claims (8)
- 集音装置から、前記集音装置を取り囲む複数の参加者が発した音声を取得する取得部と、
前記複数の参加者それぞれに対して設定された位置に基づいて、前記複数の参加者それぞれが発した前記音声を分析する分析部と、
前記分析部が分析している前記音声の途中において、前記分析部が分析している前記音声を発した音源の前記集音装置を基準とする向きが、前記複数の参加者に対して設定された前記位置のいずれにも対応しない場合に、前記複数の参加者に対して設定された前記位置を更新する追従部と、
を有し、
前記追従部は、前記分析部が分析している前記音声を発した前記音源の前記集音装置を基準とする向きから、前記集音装置を基準とする所定の角度内の前記位置に設定された前記参加者を選択し、選択した前記参加者の位置を、前記分析部が分析している前記音声を発した前記音源の前記集音装置を基準とする向きに更新する、音声分析装置。 - 前記集音装置から音声を取得し、取得した前記音声を発した前記音源の前記集音装置を基準とする向きを特定することによって、前記複数の参加者それぞれの位置を設定する設定部をさらに有する、請求項1に記載の音声分析装置。
- 前記集音装置上に設けられた撮像部が撮像した画像を取得し、取得した前記画像に含まれる前記複数の参加者の顔を認識することによって、前記複数の参加者それぞれの位置を設定する設定部をさらに有する、請求項1又は2に記載の音声分析装置。
- 前記集音装置は、カードに記録された情報を読み取る複数の読取部を有し、
前記複数の読取部が読み取った前記カードに記録された情報を取得し、前記カードに記録された情報が前記複数の読取部のいずれに読み取られたかに従って前記複数の参加者それぞれの位置を設定する設定部をさらに有する、請求項1から3のいずれか一項に記載の音声分析装置。 - 前記複数の参加者それぞれに対して設定された位置は、前記集音装置を基準とした複数の角度範囲のいずれかを示しており、
前記追従部は、前記分析部が分析している前記音声が属する角度範囲から所定の角度内の角度範囲に設定された前記参加者を選択し、選択した前記参加者の角度範囲を、前記分析部が分析している前記音声を発した前記音源の前記集音装置を基準とする向きが属する角度範囲に更新する、請求項1から4のいずれか一項に記載の音声分析装置。 - プロセッサが、
集音装置から、前記集音装置を取り囲む複数の参加者が発した音声を取得するステップと、
前記複数の参加者それぞれに対して設定された位置に基づいて、前記複数の参加者それぞれが発した前記音声を分析するステップと、
前記分析するステップが分析している前記音声の途中において、前記分析するステップが分析している前記音声を発した音源の前記集音装置を基準とする向きが、前記複数の参加者に対して設定された前記位置のいずれにも対応しない場合に、前記複数の参加者に対して設定された前記位置を更新するステップと、
を実行し、
前記更新するステップは、前記分析するステップが分析している前記音声を発した前記音源の前記集音装置を基準とする向きから、前記集音装置を基準とする所定の角度内の前記位置に設定された前記参加者を選択し、選択した前記参加者の位置を、前記分析するステップが分析している前記音声を発した前記音源の前記集音装置を基準とする向きに更新する、音声分析方法。 - コンピュータに、
集音装置から、前記集音装置を取り囲む複数の参加者が発した音声を取得するステップと、
前記複数の参加者それぞれに対して設定された位置に基づいて、前記複数の参加者それぞれが発した前記音声を分析するステップと、
前記分析するステップが分析している前記音声の途中において、前記分析するステップが分析している前記音声を発した音源の前記集音装置を基準とする向きが、前記複数の参加者に対して設定された前記位置のいずれにも対応しない場合に、前記複数の参加者に対して設定された前記位置を更新するステップと、
を実行させ、
前記更新するステップは、前記分析するステップが分析している前記音声を発した前記音源の前記集音装置を基準とする向きから、前記集音装置を基準とする所定の角度内の前記位置に設定された前記参加者を選択し、選択した前記参加者の位置を、前記分析するステップが分析している前記音声を発した前記音源の前記集音装置を基準とする向きに更新する、音声分析プログラム。 - 音声分析装置と、前記音声分析装置と通信可能な集音装置と、を備え、
前記集音装置は、前記集音装置を取り囲む複数の参加者が発した音声を取得するように構成され、
前記音声分析装置は、
前記集音装置から前記音声を取得する取得部と、
前記複数の参加者それぞれに対して設定された位置に基づいて、前記複数の参加者それぞれが発した前記音声を分析する分析部と、
前記分析部が分析している前記音声の途中において、前記分析部が分析している前記音声を発した音源の前記集音装置を基準とする向きが、前記複数の参加者に対して設定された前記位置のいずれにも対応しない場合に、前記複数の参加者に対して設定された前記位置を更新する追従部と、
を有し、
前記追従部は、前記分析部が分析している前記音声を発した前記音源の前記集音装置を基準とする向きから、前記集音装置を基準とする所定の角度内の前記位置に設定された前記参加者を選択し、選択した前記参加者の位置を、前記分析部が分析している前記音声を発した前記音源の前記集音装置を基準とする向きに更新する、音声分析システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019166859A JP6975755B2 (ja) | 2018-01-16 | 2019-09-13 | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/000943 WO2019142232A1 (ja) | 2018-01-16 | 2018-01-16 | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019166859A Division JP6975755B2 (ja) | 2018-01-16 | 2019-09-13 | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6589041B1 true JP6589041B1 (ja) | 2019-10-09 |
JPWO2019142232A1 JPWO2019142232A1 (ja) | 2020-01-23 |
Family
ID=67301394
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018502280A Active JP6589041B1 (ja) | 2018-01-16 | 2018-01-16 | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6589041B1 (ja) |
WO (1) | WO2019142232A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005274707A (ja) * | 2004-03-23 | 2005-10-06 | Sony Corp | 情報処理装置および方法、プログラム、並びに記録媒体 |
US20160064002A1 (en) * | 2014-08-29 | 2016-03-03 | Samsung Electronics Co., Ltd. | Method and apparatus for voice recording and playback |
JP2017173768A (ja) * | 2016-03-25 | 2017-09-28 | グローリー株式会社 | 議事録作成システム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3367682B2 (ja) * | 1991-12-09 | 2003-01-14 | 戸田建設株式会社 | 音声反応マイクロホン |
JP3195920B2 (ja) * | 1999-06-11 | 2001-08-06 | 科学技術振興事業団 | 音源同定・分離装置及びその方法 |
JP2006189626A (ja) * | 2005-01-06 | 2006-07-20 | Fuji Photo Film Co Ltd | 記録装置及び音声記録プログラム |
JP6464465B2 (ja) * | 2017-03-06 | 2019-02-06 | 本田技研工業株式会社 | 会話支援装置、会話支援装置の制御方法、及び会話支援装置のプログラム |
-
2018
- 2018-01-16 WO PCT/JP2018/000943 patent/WO2019142232A1/ja active Application Filing
- 2018-01-16 JP JP2018502280A patent/JP6589041B1/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005274707A (ja) * | 2004-03-23 | 2005-10-06 | Sony Corp | 情報処理装置および方法、プログラム、並びに記録媒体 |
US20160064002A1 (en) * | 2014-08-29 | 2016-03-03 | Samsung Electronics Co., Ltd. | Method and apparatus for voice recording and playback |
JP2017173768A (ja) * | 2016-03-25 | 2017-09-28 | グローリー株式会社 | 議事録作成システム |
Non-Patent Citations (1)
Title |
---|
木田祐介 他: ""会議の効率的な振返りを支援する話者クラスタリング技術"", 東芝レビュー, vol. 70, no. 4, JPN6019005808, 1 April 2015 (2015-04-01), pages 26 - 29, ISSN: 0003981763 * |
Also Published As
Publication number | Publication date |
---|---|
JPWO2019142232A1 (ja) | 2020-01-23 |
WO2019142232A1 (ja) | 2019-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11600191B2 (en) | System and method for validating honest test taking | |
CN110991381B (zh) | 一种基于行为和语音智能识别的实时课堂学生状态分析与指示提醒系统和方法 | |
CN105354543A (zh) | 视频处理方法及装置 | |
JP7453714B2 (ja) | 議論分析装置及び議論分析方法 | |
CN110741377A (zh) | 人脸图像处理方法、装置、存储介质及电子设备 | |
CN112148922A (zh) | 会议记录方法、装置、数据处理设备及可读存储介质 | |
CN110134235B (zh) | 一种引导式互动的方法 | |
JP6646134B2 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
JP6819194B2 (ja) | 情報処理システム、情報処理装置およびプログラム | |
KR102478558B1 (ko) | 고객 만족도 조사 수행 시스템 | |
CN110545386B (zh) | 用于拍摄图像的方法和设备 | |
JP6589041B1 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
CN110298684B (zh) | 车型匹配方法、装置、计算机设备及存储介质 | |
JP6975755B2 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
JP6589042B1 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
TWI667054B (zh) | 飛行器飛行控制方法、裝置、飛行器及系統 | |
JP6589040B1 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
WO2022079777A1 (ja) | 分析装置、分析システム、分析方法、およびプログラムが格納された非一時的なコンピュータ可読媒体 | |
Miguel-Hurtado et al. | Voice and face interaction evaluation of a mobile authentication platform | |
US20230230277A1 (en) | Object position estimation device, object position estimation method, and recording medium | |
JP7427274B2 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
CN113646800A (zh) | 物体状况判断系统、物体状况判断方法以及程序 | |
JP7261462B2 (ja) | 音声分析装置、音声分析システム及び音声分析方法 | |
JP2017068592A (ja) | ロボット、ロボット制御装置、ロボット制御方法、及びプログラム | |
CN114067451A (zh) | 点名方法、装置、存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180501 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190827 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190913 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6589041 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |