JP6646134B2 - 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム - Google Patents
音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム Download PDFInfo
- Publication number
- JP6646134B2 JP6646134B2 JP2018502278A JP2018502278A JP6646134B2 JP 6646134 B2 JP6646134 B2 JP 6646134B2 JP 2018502278 A JP2018502278 A JP 2018502278A JP 2018502278 A JP2018502278 A JP 2018502278A JP 6646134 B2 JP6646134 B2 JP 6646134B2
- Authority
- JP
- Japan
- Prior art keywords
- participant
- transition
- participants
- unit
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 174
- 230000007704 transition Effects 0.000 claims description 126
- 238000004891 communication Methods 0.000 claims description 56
- 230000008859 change Effects 0.000 claims description 16
- 238000000034 method Methods 0.000 description 20
- 230000004807 localization Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 10
- 238000012545 processing Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
図1は、本実施形態に係る音声分析システムSの模式図である。音声分析システムSは、音声分析装置100と、集音装置10と、通信端末20とを含む。音声分析システムSが含む集音装置10及び通信端末20の数は限定されない。音声分析システムSは、その他のサーバ、端末等の機器を含んでもよい。
図2は、本実施形態に係る音声分析システムSのブロック図である。図2において、矢印は主なデータの流れを示しており、図2に示していないデータの流れがあってよい。図2において、各ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図2に示すブロックは単一の装置内に実装されてよく、あるいは複数の装置内に別れて実装されてよい。ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてよい。
図3は、本実施形態に係る音声分析システムSが行う音声分析方法の模式図である。まず分析者は、通信端末20の操作部22を操作することによって、分析条件の設定を行う。例えば分析条件は、分析対象とする議論の参加者の人数と、集音装置10を基準とした各参加者(すなわち、複数の参加者それぞれ)が位置する向きとを示す情報である。通信端末20は、分析者から分析条件の設定を受け付け、設定情報として音声分析装置100に送信する(a)。音声分析装置100の設定部111は、通信端末20から設定情報を取得して設定情報記憶部131に記憶させる。
出力部115は、表示情報を通信端末20に送信することによって、分析部114による分析結果を表示部21上に表示させる制御を行う(f)。出力部115による分析結果の表示制御方法を、図6〜図8を用いて以下に説明する。
図9は、本実施形態に係る音声分析システムSが行う音声分析方法のシーケンス図である。まず通信端末20は、分析者から分析条件の設定を受け付け、設定情報として音声分析装置100に送信する(S11)。音声分析装置100の設定部111は、通信端末20から設定情報を取得して設定情報記憶部131に記憶させる。
本実施形態に係る音声分析装置100は、複数の集音部を有する集音装置10を用いて取得した音声に基づいて、自動的に複数の参加者の議論を分析する。そのため、非特許文献1に記載のハークネス法のように記録者が議論を監視する必要がなく、またグループごとに記録者を配置する必要がないため、低コストである。
100 音声分析装置
110 制御部
112 音声取得部
114 分析部
115 出力部
10 集音装置
20 通信端末
21 表示部
Claims (8)
- 複数の参加者が発した音声を取得する取得部と、
前記音声における、前記複数の参加者のうち第1参加者の発言から、前記複数の参加者のうち第2参加者の発言への遷移を検出する分析部と、
表示部上で、前記遷移の発生時間から所定期間、前記第1参加者に対応する位置と前記第2参加者に対応する位置とを結ぶ線を生成し、前記遷移の発生時間から所定期間後に、前記線を消去する出力部と、
を有し、
前記出力部は、前記音声を取得した集音装置を基準とした前記第1参加者の相対的な位置と、前記集音装置を基準とした前記第2参加者の相対的な位置とを結ぶ前記線を生成する音声分析装置。 - 前記出力部は、前記第1参加者と前記第2参加者との組み合わせに応じて、前記線の表示態様を変更する、請求項1に記載の音声分析装置。
- 前記出力部は、前記遷移が発生した回数に応じて、前記線の表示態様を変更する、請求項1又は2に記載の音声分析装置。
- 前記分析部は、前記音声に基づいて前記複数の参加者のそれぞれが発言している期間を特定し、前記第1参加者が発言している前記期間から前記第2参加者が発言している前記期間に切り替わった場合に前記遷移を検出する、請求項1から3のいずれか一項に記載の音声分析装置。
- 前記出力部は、前記線に加えて、前記複数の参加者のそれぞれに対応する位置に、前記複数の参加者のそれぞれの発言量に応じた長さ又は大きさの棒状の領域を、前記表示部に表示させる、請求項1から4のいずれか一項に記載の音声分析装置。
- プロセッサが、
複数の参加者が発した音声を取得するステップと、
前記音声における、前記複数の参加者のうち第1参加者の発言から、前記複数の参加者のうち第2参加者の発言への遷移を検出するステップと、
表示部上で、前記遷移の発生時間から所定期間、前記第1参加者に対応する位置と前記第2参加者に対応する位置とを結ぶ線を生成するステップと、
前記遷移の発生時間から所定期間後に、前記線を消去するステップと、
を実行し、
前記生成するステップは、前記音声を取得した集音装置を基準とした前記第1参加者の相対的な位置と、前記集音装置を基準とした前記第2参加者の相対的な位置とを結ぶ前記線を生成する音声分析方法。 - コンピュータに、
複数の参加者が発した音声を取得するステップと、
前記音声における、前記複数の参加者のうち第1参加者の発言から、前記複数の参加者のうち第2参加者の発言への遷移を検出するステップと、
表示部上で、前記遷移の発生時間から所定期間、前記第1参加者に対応する位置と前記第2参加者に対応する位置とを結ぶ線を生成するステップと、
前記遷移の発生時間から所定期間後に、前記線を消去するステップと、
を実行させ、
前記生成するステップは、前記音声を取得した集音装置を基準とした前記第1参加者の相対的な位置と、前記集音装置を基準とした前記第2参加者の相対的な位置とを結ぶ前記線を生成する音声分析プログラム。 - 音声分析装置と、前記音声分析装置と通信可能な通信端末と、を備え、
前記通信端末は、情報を表示する表示部を有し、
前記音声分析装置は、
複数の参加者が発した音声を取得する取得部と、
前記音声における、前記複数の参加者のうち第1参加者の発言から、前記複数の参加者のうち第2参加者の発言への遷移を検出する分析部と、
前記表示部上で、前記遷移の発生時間から所定期間、前記第1参加者に対応する位置と前記第2参加者に対応する位置とを結ぶ線を生成し、前記遷移の発生時間から所定期間後に、前記線を消去する出力部と、
を有し、
前記出力部は、前記音声を取得した集音装置を基準とした前記第1参加者の相対的な位置と、前記集音装置を基準とした前記第2参加者の相対的な位置とを結ぶ前記線を生成する、音声分析システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/000941 WO2019142230A1 (ja) | 2018-01-16 | 2018-01-16 | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019194938A Division JP7168223B2 (ja) | 2019-10-28 | 2019-10-28 | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019142230A1 JPWO2019142230A1 (ja) | 2020-02-06 |
JP6646134B2 true JP6646134B2 (ja) | 2020-02-14 |
Family
ID=67301369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018502278A Active JP6646134B2 (ja) | 2018-01-16 | 2018-01-16 | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6646134B2 (ja) |
WO (1) | WO2019142230A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7168223B2 (ja) * | 2019-10-28 | 2022-11-09 | ハイラブル株式会社 | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム |
WO2023209898A1 (ja) * | 2022-04-27 | 2023-11-02 | ハイラブル株式会社 | 音声分析装置、音声分析方法及び音声分析プログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004350134A (ja) * | 2003-05-23 | 2004-12-09 | Nippon Telegr & Teleph Corp <Ntt> | 多地点電子会議システムにおける会議概要把握支援方法、多地点電子会議システム用サーバ、会議概要把握支援プログラム、および該プログラムを記録した記録媒体 |
JP5433760B2 (ja) * | 2012-10-18 | 2014-03-05 | 株式会社日立製作所 | 会議分析システム |
-
2018
- 2018-01-16 JP JP2018502278A patent/JP6646134B2/ja active Active
- 2018-01-16 WO PCT/JP2018/000941 patent/WO2019142230A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JPWO2019142230A1 (ja) | 2020-02-06 |
WO2019142230A1 (ja) | 2019-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5685702B2 (ja) | 音声認識結果管理装置および音声認識結果表示方法 | |
US11462213B2 (en) | Information processing apparatus, information processing method, and program | |
CN110473525B (zh) | 获取语音训练样本的方法和装置 | |
JP7453714B2 (ja) | 議論分析装置及び議論分析方法 | |
JP2018124604A (ja) | 接客支援システム、接客支援装置及び接客支援方法 | |
JP6646134B2 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
CN108833991A (zh) | 视频字幕显示方法及装置 | |
US20230317095A1 (en) | Systems and methods for pre-filtering audio content based on prominence of frequency content | |
CN110459223A (zh) | 数据跟踪处理方法、设备、存储介质及装置 | |
JP6589042B1 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
JP7427274B2 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
JP6589040B1 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
JP6733452B2 (ja) | 音声分析プログラム、音声分析装置、及び音声分析方法 | |
US20230370565A1 (en) | Visual image management | |
JP7452299B2 (ja) | 会話支援システム、会話支援方法及びプログラム | |
JP6975755B2 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
JP6589041B1 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
JP7414319B2 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
JP6975756B2 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
WO2021134592A1 (zh) | 语音处理方法、装置、设备以及存储介质 | |
JP2020173415A (ja) | 教材提示システム及び教材提示方法 | |
JP7149019B2 (ja) | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム | |
US20240241632A1 (en) | Information presentation method, information presentation device, and information presentation program | |
WO2020051893A1 (zh) | 互动系统、方法及处理装置 | |
CN115440231A (zh) | 说话人识别方法、装置、存储介质、客户端和服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190213 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190730 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191028 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20191108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6646134 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |