JPWO2017085815A1 - 困惑状態判定装置、困惑状態判定方法、及びプログラム - Google Patents
困惑状態判定装置、困惑状態判定方法、及びプログラム Download PDFInfo
- Publication number
- JPWO2017085815A1 JPWO2017085815A1 JP2017551446A JP2017551446A JPWO2017085815A1 JP WO2017085815 A1 JPWO2017085815 A1 JP WO2017085815A1 JP 2017551446 A JP2017551446 A JP 2017551446A JP 2017551446 A JP2017551446 A JP 2017551446A JP WO2017085815 A1 JPWO2017085815 A1 JP WO2017085815A1
- Authority
- JP
- Japan
- Prior art keywords
- period
- utterance
- voice
- threshold
- call
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/428—Arrangements for placing incoming calls on hold
- H04M3/4285—Notifying, informing or entertaining a held party while on hold, e.g. Music On Hold
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5175—Call or contact centers supervision arrangements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Psychiatry (AREA)
- Child & Adolescent Psychology (AREA)
- Hospice & Palliative Care (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Telephonic Communication Services (AREA)
- Electrically Operated Instructional Devices (AREA)
- Telephone Function (AREA)
Abstract
Description
基本周波数=Fs/pr …(1)
サンプリング周波数Fsは、例えば、8,000Hzである。
疑問発話の頻度=Q/L …(2)
次に、開示の技術の実施形態の一例である第2実施形態を説明する。第1実施形態と同様の構成及び作用については説明を省略する。
次に、開示の技術の実施形態の一例である第3実施形態を説明する。第1実施形態及び第2実施形態と同様の構成及び作用については説明を省略する。
次に、開示の技術の実施形態の一例である第4実施形態を説明する。第1実施形態〜第3実施形態と同様の構成及び作用については説明を省略する。
[第5実施形態]
次に、開示の技術の実施形態の一例である第5実施形態を説明する。第1実施形態〜第4実施形態と同様の構成及び作用については説明を省略する。
[第6実施形態]
次に、開示の技術の実施形態の一例である第6実施形態を説明する。第1実施形態〜第5実施形態と同様の構成及び作用については説明を省略する。
困惑閾値=Fave*Ca
なお、疑問発話頻度の平均値Faveに代えて、疑問発話頻度の中央値、又は最小値などを使用してもよいし、所定値を乗算することに代えて、所定値を加算するようにしてもよい。
Claims (24)
- 通話音声の入力を受け付ける音声受付部と、
通話音声の通話保留期間内における疑問発話を検出し、前記通話保留期間内に検出した前記疑問発話の頻度を算出し、前記算出した前記疑問発話の頻度が第1閾値以上である場合にユーザが困惑状態であると判定する制御部と、
を含む困惑状態判定装置。 - 前記制御部は、前記第1閾値を前記通話保留期間が長くなるに従って小さくなるように変更する、
請求項1に記載の困惑状態判定装置。 - 前記制御部は、前記第1閾値を過去の通話保留期間において取得された前記疑問発話の頻度に基づいて算出する、
請求項1に記載の困惑状態判定装置。 - 前記制御部は、発話期間の末尾における音声の基本周波数の傾きが第2閾値より大きい場合に、前記発話期間の音声を疑問発話として検出する、
請求項1〜請求項3の何れか1項に記載の困惑状態判定装置。 - 前記制御部は、発話期間の冒頭及び末尾の少なくとも一方に所定の語句を含む場合に、前記発話期間の音声を疑問発話として検出する、請求項1〜請求項4の何れか1項に記載の困惑状態判定装置。
- 前記制御部は、通話相手の音声を表す音声信号に基づいて前記通話保留期間を検出する、
請求項1〜請求項5の何れか1項に記載の困惑状態判定装置。 - 前記制御部は、前記通話相手の音声を表す音声信号に含まれる無音期間が第3閾値よりも長い前記無音期間を前記通話保留期間として検出する、
請求項6に記載の困惑状態判定装置。 - 前記制御部は、前記通話相手の音声を表す音声信号に含まれる楽音期間が第3閾値よりも長い前記楽音期間を前記通話保留期間として検出する、
請求項6に記載の困惑状態判定装置。 - コンピュータが、
ユーザの音声に含まれる疑問発話を検出し、
通話保留期間内に検出した前記疑問発話の単位時間毎の数である前記疑問発話の頻度を取得し、
取得した前記疑問発話の頻度が第1閾値以上である場合に前記ユーザが困惑状態であると判定する、
困惑状態判定方法。 - 前記第1閾値は、前記通話保留期間が長くなるに従って小さくなるように変更される、
請求項9に記載の困惑状態判定方法。 - 前記第1閾値は、過去の通話保留期間において取得された前記疑問発話の頻度に基づいて算出される、
請求項9に記載の困惑状態判定方法。 - 発話期間の末尾における前記音声の基本周波数の傾きが第2閾値より大きい場合に、前記発話期間の音声を疑問発話として検出する、
請求項9〜請求項11の何れか1項に記載の困惑状態判定方法。 - 発話期間の冒頭及び末尾の少なくとも一方に所定の語句を含む場合に、前記発話期間の音声を疑問発話として検出する、請求項9〜請求項11の何れか1項に記載の困惑状態判定方法。
- 前記コンピュータは、
通話相手の音声を表す音声信号に基づいて前記通話保留期間を検出する、
ことをさらに含む、
請求項9〜請求項13の何れか1項に記載の困惑状態判定方法。 - 前記通話相手の音声を表す音声信号に含まれる無音期間が第3閾値よりも長い前記無音期間を前記通話保留期間として検出する、
請求項14に記載の困惑状態判定方法。 - 前記通話相手の音声を表す音声信号に含まれる楽音期間が第3閾値よりも長い前記楽音期間を前記通話保留期間として検出する、
請求項14に記載の困惑状態判定方法。 - ユーザの音声に含まれる疑問発話を検出し、
通話保留期間内に検出した前記疑問発話の単位時間毎の数である前記疑問発話の頻度を取得し、
取得した前記疑問発話の頻度が第1閾値以上である場合に前記ユーザが困惑状態であると判定する、
困惑状態判定処理をコンピュータに実行させるためのプログラム。 - 前記第1閾値は、前記通話保留期間が長くなるに従って小さくなるように変更される、
請求項17に記載のプログラム。 - 前記第1閾値は、過去の通話保留期間において取得された前記疑問発話の頻度に基づいて算出される、
請求項17に記載のプログラム。 - 発話期間の末尾における前記音声の基本周波数の傾きが第2閾値より大きい場合に、前記発話期間の音声を疑問発話として検出する、
請求項17〜請求項19の何れか1項に記載のプログラム。 - 発話期間の冒頭及び末尾の少なくとも一方に所定の語句を含む場合に、前記発話期間の音声を疑問発話として検出する、請求項17〜請求項19の何れか1項に記載のプログラム。
- 前記困惑状態判定処理は、
通話相手の音声を表す音声信号に基づいて前記通話保留期間を検出する、
ことをさらに含む、
請求項17〜請求項21の何れか1項に記載のプログラム。 - 前記通話相手の音声を表す音声信号に含まれる無音期間が第3閾値よりも長い前記無音期間を前記通話保留期間として検出する、
請求項22に記載のプログラム。 - 前記通話相手の音声を表す音声信号に含まれる楽音期間が第3閾値よりも長い前記楽音期間を前記通話保留期間として検出する、
請求項22に記載のプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/082437 WO2017085815A1 (ja) | 2015-11-18 | 2015-11-18 | 困惑状態判定装置、困惑状態判定方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017085815A1 true JPWO2017085815A1 (ja) | 2018-09-13 |
JP6544439B2 JP6544439B2 (ja) | 2019-07-17 |
Family
ID=58718644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017551446A Active JP6544439B2 (ja) | 2015-11-18 | 2015-11-18 | 困惑状態判定装置、困惑状態判定方法、及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US10679645B2 (ja) |
JP (1) | JP6544439B2 (ja) |
CN (1) | CN108352169B (ja) |
WO (1) | WO2017085815A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10938867B2 (en) * | 2018-12-03 | 2021-03-02 | Avaya Inc. | Automatic on hold communication session state management in a contact center |
JP7380006B2 (ja) | 2019-09-26 | 2023-11-15 | サクサ株式会社 | 電話システム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004226881A (ja) * | 2003-01-27 | 2004-08-12 | Casio Comput Co Ltd | 会話システム及び会話処理プログラム |
JP2007004000A (ja) * | 2005-06-27 | 2007-01-11 | Tokyo Electric Power Co Inc:The | コールセンターにおけるオペレータ業務支援システム |
WO2012120656A1 (ja) * | 2011-03-08 | 2012-09-13 | 富士通株式会社 | 通話支援装置、通話支援方法 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2808906B2 (ja) | 1991-02-07 | 1998-10-08 | 日本電気株式会社 | 音声認識装置 |
JP2000066691A (ja) | 1998-08-21 | 2000-03-03 | Kdd Corp | オーディオ情報分類装置 |
US6804670B2 (en) * | 2001-08-22 | 2004-10-12 | International Business Machines Corporation | Method for automatically finding frequently asked questions in a helpdesk data set |
US7197460B1 (en) * | 2002-04-23 | 2007-03-27 | At&T Corp. | System for handling frequently asked questions in a natural language dialog service |
JP2004252668A (ja) | 2003-02-19 | 2004-09-09 | Fujitsu Ltd | コンタクトセンタ運用管理プログラム、装置および方法 |
EP1649419A4 (en) * | 2003-08-29 | 2007-04-25 | Siemens Med Solutions Health | CUSTOMER SUPPORT SYSTEM |
US20050108094A1 (en) * | 2003-11-18 | 2005-05-19 | Philippe Hugron | Method for making a decision according to customer needs |
JP4354299B2 (ja) | 2004-02-27 | 2009-10-28 | 富士通株式会社 | 事例検索プログラム、事例検索方法及び事例検索装置 |
US20060206818A1 (en) * | 2005-03-10 | 2006-09-14 | Epson America Inc. | Dynamic frequently asked question system |
JP4587854B2 (ja) | 2005-03-23 | 2010-11-24 | 東京電力株式会社 | 感情解析装置、感情解析プログラム、プログラム格納媒体 |
JP4677548B2 (ja) | 2005-09-16 | 2011-04-27 | 株式会社国際電気通信基礎技術研究所 | パラ言語情報検出装置及びコンピュータプログラム |
US7904449B2 (en) * | 2006-11-09 | 2011-03-08 | Panasonic Corporation | Content searching apparatus |
JP2008134557A (ja) | 2006-11-29 | 2008-06-12 | Fujitsu Ltd | 携帯端末装置 |
US8014512B2 (en) * | 2007-04-18 | 2011-09-06 | International Business Machines Corporation | Method and system for user interaction within a queue |
JP5381982B2 (ja) | 2008-05-28 | 2014-01-08 | 日本電気株式会社 | 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体 |
US20150095267A1 (en) * | 2013-09-30 | 2015-04-02 | Avaya Inc. | Techniques to dynamically generate real time frequently asked questions from forum data |
US20160225273A1 (en) * | 2015-01-29 | 2016-08-04 | Xerox Corporation | Methods and systems for evaluating user |
-
2015
- 2015-11-18 WO PCT/JP2015/082437 patent/WO2017085815A1/ja active Application Filing
- 2015-11-18 CN CN201580084621.5A patent/CN108352169B/zh active Active
- 2015-11-18 JP JP2017551446A patent/JP6544439B2/ja active Active
-
2018
- 2018-05-15 US US15/980,226 patent/US10679645B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004226881A (ja) * | 2003-01-27 | 2004-08-12 | Casio Comput Co Ltd | 会話システム及び会話処理プログラム |
JP2007004000A (ja) * | 2005-06-27 | 2007-01-11 | Tokyo Electric Power Co Inc:The | コールセンターにおけるオペレータ業務支援システム |
WO2012120656A1 (ja) * | 2011-03-08 | 2012-09-13 | 富士通株式会社 | 通話支援装置、通話支援方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108352169B (zh) | 2022-06-24 |
WO2017085815A1 (ja) | 2017-05-26 |
US20180261238A1 (en) | 2018-09-13 |
JP6544439B2 (ja) | 2019-07-17 |
CN108352169A (zh) | 2018-07-31 |
US10679645B2 (en) | 2020-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107910014B (zh) | 回声消除的测试方法、装置及测试设备 | |
JP6171617B2 (ja) | 応答対象音声判定装置、応答対象音声判定方法および応答対象音声判定プログラム | |
US9196247B2 (en) | Voice recognition method and voice recognition apparatus | |
KR102196400B1 (ko) | 핫워드 적합성을 결정하는 방법 및 장치 | |
JP5664480B2 (ja) | 異常状態検出装置、電話機、異常状態検出方法、及びプログラム | |
CN108346425B (zh) | 一种语音活动检测的方法和装置、语音识别的方法和装置 | |
JP6078964B2 (ja) | 音声対話システム及びプログラム | |
JP2018156044A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
US8473282B2 (en) | Sound processing device and program | |
MX2008016354A (es) | Deteccion de una maquina contestadora utilizando reconocimiento de dialogo. | |
EP2806415B1 (en) | Voice processing device and voice processing method | |
JP6098149B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP2015222847A (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP6565500B2 (ja) | 発話状態判定装置、発話状態判定方法、及び判定プログラム | |
JP6544439B2 (ja) | 困惑状態判定装置、困惑状態判定方法、及びプログラム | |
JP2015169827A (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP2015161718A (ja) | 発話検出装置、発話検出方法及び発話検出プログラム | |
JP6183147B2 (ja) | 情報処理装置、プログラム、及び方法 | |
JP6526602B2 (ja) | 音声認識装置、その方法、及びプログラム | |
JP2015087557A (ja) | 発話様式検出装置および発話様式検出方法 | |
JP2019032400A (ja) | 発話判定プログラム、発話判定方法、及び発話判定装置 | |
JP7113719B2 (ja) | 発話末タイミング予測装置およびプログラム | |
JP4745837B2 (ja) | 音響分析装置及びコンピュータプログラム、音声認識システム | |
JP7143574B2 (ja) | 評価プログラム、評価方法および評価装置 | |
KR20040082756A (ko) | 비음성 제거에 의한 음성 추출 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180523 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180523 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190603 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6544439 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |