JP2013225003A - 音声データ分析装置、音声データ分析方法および音声データ分析プログラム - Google Patents
音声データ分析装置、音声データ分析方法および音声データ分析プログラム Download PDFInfo
- Publication number
- JP2013225003A JP2013225003A JP2012096504A JP2012096504A JP2013225003A JP 2013225003 A JP2013225003 A JP 2013225003A JP 2012096504 A JP2012096504 A JP 2012096504A JP 2012096504 A JP2012096504 A JP 2012096504A JP 2013225003 A JP2013225003 A JP 2013225003A
- Authority
- JP
- Japan
- Prior art keywords
- section
- morpheme
- speech
- speaker
- conversation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
Abstract
【解決手段】音声データ分析装置2であって、対象ユーザおよび他者の音声データが形態素区間と非発声音区間とに分類されたデータについて、非発声音区間の長さが所定の時間を越える場合、当該非発声音区間を発話区間の区切りと判別し、発話区間を切り出す発話区間切り出し手段2cと、あいづちの形態素区間を検出するあいづち検出手段2dと、各発話区間毎に、あいづちの形態素区間の話者が対象ユーザか他者かを判別するあいづち話者判別手段2fと、1つの発話区間の中で、あいづちの形態素区間の話者が対象ユーザと他者の両方が含まれる場合、当該発話区間を会話区間であると識別する会話識別手段2hと、を有する。
【選択図】図1
Description
図1は、第1の実施形態における音声データ分析装置1の構成を示す構成図である。図示する音声データ分析装置1は、音声データ受信部1aと、形態素解析部1bと、発話区間切り出し部1cと、あいづち検出部1dと、あいづち辞書部1eと、役割分類部1fと、会話識別部1gと、出力部1hと、記憶部1iとを備える。
文献2:「SpeechRec ソリューションパッケージ」、http://www.ntt-it.co.jp/goods/vcj/v-series/speechrec/solution_package.html
ここで、形態素解析部1bは、各形態素の始まりの時刻を参照し、1つの形態素の開始時刻からその次の形態素の開始時刻までを1つの形態素区間とする。発話をしていない場面や発話中に見られる「間」の部分等、形態素区間に含まれない部分を非発声音とし、2つの形態素区間に挟まれた非発声音の開始時刻から終了時刻までを一つの非発声音区間とする。そして、形態素解析部1bは、形態素区間および非発声音区間のそれぞれの開始時刻と終了時刻で構成されるテーブルを生成し、記憶部1iに格納する。
また、出力部1hは、「発話」区間の数に対する、「会話」区間の数の割合をコミュニケーション度合いとして算出する。すなわち、出力部1hは、会話識別部1gで識別した「会話」区間の数を、発話区間切り出し部1cで切り出した「発話」区間の数で割ることでコミュニケーション度合いを算出する。
図8は、本実施形態の処理におけるデータを説明するための説明図である。
図9は、第2の実施形態における音声データ分析装置2の構成を示す構成図である。図示する音声データ分析装置2は、音声データ受信部2aと、形態素解析部2bと、発話区間切り出し部2cと、あいづち検出部2dと、あいづち辞書部2e(あいづち記憶手段)と、あいづち話者判別部2fと、会話識別部2gと、出力部2h(算出手段)と、記憶部2iと、本人音声モデル記録部2jを備える。
あいづちの音声データが、本人音声モデル記録部2jの音声モデルと照合した場合(照合が取れた場合)、あいづち話者判別部2fは、当該あいづちの話者を対象ユーザ本人であると判別し、照合しなかった場合(照合が取れなかった場合)は、当該あいづちの話者を他者と判別する。そして、判別結果である「本人」または「他者」をタグ付けし、記憶部2iに記憶されたテーブルを更新する。
1a :音声データ受信部
1b :形態素解析部
1c :発話区間切り出し部
1d :あいづち検出部
1e :あいづち辞書部
1f :役割分類部
1g :会話識別部
1h :出力部
1i :記憶部
2 :音声データ分析装置
2a :音声データ受信部
2b :形態素解析部
2c :発話区間切り出し部
2d :あいづち検出部
2e :あいづち辞書部
2f :あいづち話者判別部
2g :会話識別部
2h :出力部
2i :記憶部
2j :本人音声モデル記憶部
Claims (8)
- 対象ユーザおよび他者の音声データが形態素区間と非発声音区間とに分類されたデータについて、非発声音区間の長さが所定の時間を越える場合、当該非発声音区間を発話区間の区切りと判別し、発話区間を切り出す発話区間切り出し手段と、
あいづちの形態素区間を検出するあいづち検出手段と、
前記発話区間切り出し手段が切り出した各発話区間毎に、あいづちの形態素区間の話者が対象ユーザか他者かを判別するあいづち話者判別手段と、
1つの発話区間の中で、あいづちの形態素区間の話者が対象ユーザと他者の両方が含まれる場合、当該発話区間を会話区間であると識別する会話識別手段と、を有し、
前記あいづち話者判別手段は、対象ユーザの音声モデルと、あいづちの形態素区間に対応する音声データとを比較し、前記音声モデルと照合した音声データのあいづちの形態素区間については対象ユーザが話者であると判別し、前記音声モデルと照合しない音声データのあいづちの形態素区間については他者が話者であると判別すること
を特徴とする音声データ分析装置。 - 請求項1記載の音声データ分析装置であって、
前記会話識別手段が識別した会話区間の合計時間または会話区間数に基づいて、対象ユーザのコミュニケーション度合いを算出する算出手段を、さらに有すること
を特徴とする音声データ分析装置。 - 請求項1または2記載の音声データ分析装置であって、
前記音声データを形態素に解析し、形態素が含まれる前記形態素区間と、それ以外の前記非発声区間とに分類する形態素解析手段を、さらに有すること
を特徴とする音声データ分析装置。 - 請求項1から3のいずれか1項に記載の音声データ分析装置であって、
複数のあいづちデータを記憶するあいづち記憶手段を、さらに備え、
前記あいづち検出手段は、各形態素区間の形態素が前記あいづち記憶手段のいずれかのあいづちデータと一致する場合、当該形態素区間をあいづちの形態素区間であると判別すること
を特徴とする音声データ分析装置。 - 音声データ分析装置が行う音声データ分析方法であって、
対象ユーザおよび他者の音声データが形態素区間と非発声音区間とに分類されたデータについて、非発声音区間の長さが所定の時間を越える場合、当該非発声音区間を発話区間の区切りと判別し、発話区間を切り出す発話区間切り出しステップと、
あいづちの形態素区間を検出するあいづち検出ステップと、
前記発話区間切り出しステップで切り出した各発話区間毎に、あいづちの形態素区間の話者が対象ユーザか他者かを判別するあいづち話者判別ステップと、
1つの発話区間の中で、あいづちの形態素区間の話者が対象ユーザと他者の両方が含まれる場合、当該発話区間を会話区間であると識別する会話識別ステップと、を行い、
前記あいづち話者判別ステップは、対象ユーザの音声モデルと、あいづちの形態素区間に対応する音声データとを比較し、前記音声モデルと照合した音声データのあいづちの形態素区間については対象ユーザが話者であると判別し、前記音声モデルと照合しない音声データのあいづちの形態素区間については他者が話者であると判別すること
を特徴とする音声データ分析方法。 - 請求項5記載の音声データ分析方法であって、
前記会話識別ステップで識別した会話区間の合計時間または会話区間数に基づいて、対象ユーザのコミュニケーション度合いを算出する算出ステップを、さらに行うこと
を特徴とする音声データ分析方法。 - 請求項5または6記載の音声データ分析方法であって、
前記データ分析装置は、複数のあいづちデータを記憶するあいづち記憶部を、さらに備え、
前記あいづち検出ステップは、各形態素区間の形態素が前記あいづち記憶部のいずれかのあいづちデータと一致する場合、当該形態素区間をあいづちの形態素区間であると判別すること
を特徴とする音声データ分析方法。 - 請求項1から請求項4のいずれか1項に記載の音声データ分析装置としてコンピュータを機能させるための音声データ分析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012096504A JP5749213B2 (ja) | 2012-04-20 | 2012-04-20 | 音声データ分析装置、音声データ分析方法および音声データ分析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012096504A JP5749213B2 (ja) | 2012-04-20 | 2012-04-20 | 音声データ分析装置、音声データ分析方法および音声データ分析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013225003A true JP2013225003A (ja) | 2013-10-31 |
JP5749213B2 JP5749213B2 (ja) | 2015-07-15 |
Family
ID=49595101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012096504A Expired - Fee Related JP5749213B2 (ja) | 2012-04-20 | 2012-04-20 | 音声データ分析装置、音声データ分析方法および音声データ分析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5749213B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015169827A (ja) * | 2014-03-07 | 2015-09-28 | 富士通株式会社 | 音声処理装置、音声処理方法および音声処理プログラム |
EP3136388A1 (en) | 2015-08-31 | 2017-03-01 | Fujitsu Limited | Utterance condition determination apparatus and method |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000259389A (ja) * | 1999-03-09 | 2000-09-22 | Fuji Xerox Co Ltd | 対話記録システム及び対話記録合成装置 |
JP2005202035A (ja) * | 2004-01-14 | 2005-07-28 | Toshiba Corp | 対話情報分析装置 |
JP2008242318A (ja) * | 2007-03-28 | 2008-10-09 | Toshiba Corp | 対話を検出する装置、方法およびプログラム |
JP2010266522A (ja) * | 2009-05-12 | 2010-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 対話状態分割装置とその方法、そのプログラムと記録媒体 |
WO2011105003A1 (ja) * | 2010-02-25 | 2011-09-01 | パナソニック株式会社 | 信号処理装置及び信号処理方法 |
JP2012003702A (ja) * | 2010-06-21 | 2012-01-05 | Nomura Research Institute Ltd | トークスクリプト利用状況算出システムおよびトークスクリプト利用状況算出プログラム |
-
2012
- 2012-04-20 JP JP2012096504A patent/JP5749213B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000259389A (ja) * | 1999-03-09 | 2000-09-22 | Fuji Xerox Co Ltd | 対話記録システム及び対話記録合成装置 |
JP2005202035A (ja) * | 2004-01-14 | 2005-07-28 | Toshiba Corp | 対話情報分析装置 |
JP2008242318A (ja) * | 2007-03-28 | 2008-10-09 | Toshiba Corp | 対話を検出する装置、方法およびプログラム |
JP2010266522A (ja) * | 2009-05-12 | 2010-11-25 | Nippon Telegr & Teleph Corp <Ntt> | 対話状態分割装置とその方法、そのプログラムと記録媒体 |
WO2011105003A1 (ja) * | 2010-02-25 | 2011-09-01 | パナソニック株式会社 | 信号処理装置及び信号処理方法 |
JP2012003702A (ja) * | 2010-06-21 | 2012-01-05 | Nomura Research Institute Ltd | トークスクリプト利用状況算出システムおよびトークスクリプト利用状況算出プログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015169827A (ja) * | 2014-03-07 | 2015-09-28 | 富士通株式会社 | 音声処理装置、音声処理方法および音声処理プログラム |
EP3136388A1 (en) | 2015-08-31 | 2017-03-01 | Fujitsu Limited | Utterance condition determination apparatus and method |
US10096330B2 (en) | 2015-08-31 | 2018-10-09 | Fujitsu Limited | Utterance condition determination apparatus and method |
Also Published As
Publication number | Publication date |
---|---|
JP5749213B2 (ja) | 2015-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7384877B2 (ja) | コロケーション情報を使用した話者照合 | |
CN110136727B (zh) | 基于说话内容的说话者身份识别方法、装置及存储介质 | |
CN108694958B (zh) | 一种安防报警方法及装置 | |
JP6857581B2 (ja) | 成長型対話装置 | |
CN107810529A (zh) | 语言模型语音端点确定 | |
US20150310877A1 (en) | Conversation analysis device and conversation analysis method | |
JP5332798B2 (ja) | 通信制御装置、通信制御方法、及び通信制御プログラム | |
CN112102850B (zh) | 情绪识别的处理方法、装置、介质及电子设备 | |
CN108010513B (zh) | 语音处理方法及设备 | |
KR20170139650A (ko) | 계정 추가 방법, 단말, 서버, 및 컴퓨터 저장 매체 | |
Atassi et al. | A speaker independent approach to the classification of emotional vocal expressions | |
Wang et al. | Speaker segmentation using deep speaker vectors for fast speaker change scenarios | |
CN111768789B (zh) | 电子设备及其语音发出者身份确定方法、装置和介质 | |
JP6087542B2 (ja) | 話者認識装置、話者認識方法及び話者認識プログラム | |
JP5749213B2 (ja) | 音声データ分析装置、音声データ分析方法および音声データ分析プログラム | |
JP2012073361A (ja) | 音声認識装置及び音声認識方法 | |
JP5749212B2 (ja) | データ分析装置、データ分析方法およびデータ分析プログラム | |
US9875236B2 (en) | Analysis object determination device and analysis object determination method | |
CN113744742A (zh) | 对话场景下的角色识别方法、装置和系统 | |
KR102131724B1 (ko) | 사용자 단말의 알람 제어 방법 및 서버의 알람 해제 미션 결정 방법 | |
CN113724693B (zh) | 语音判别方法、装置、电子设备及存储介质 | |
KR20110079161A (ko) | 이동 단말기에서 화자 인증 방법 및 장치 | |
KR101864824B1 (ko) | 발화자에 대한 신뢰도 측정 장치 및 방법 | |
WO2014155652A1 (ja) | 話者検索システム、プログラム | |
Tong et al. | Fusion of acoustic and tokenization features for speaker recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140707 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150403 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150511 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150513 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5749213 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |