JP6171617B2 - 応答対象音声判定装置、応答対象音声判定方法および応答対象音声判定プログラム - Google Patents
応答対象音声判定装置、応答対象音声判定方法および応答対象音声判定プログラム Download PDFInfo
- Publication number
- JP6171617B2 JP6171617B2 JP2013131650A JP2013131650A JP6171617B2 JP 6171617 B2 JP6171617 B2 JP 6171617B2 JP 2013131650 A JP2013131650 A JP 2013131650A JP 2013131650 A JP2013131650 A JP 2013131650A JP 6171617 B2 JP6171617 B2 JP 6171617B2
- Authority
- JP
- Japan
- Prior art keywords
- silence
- voice
- silence interval
- utterance
- duration threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Description
以下、本発明の第1の実施形態を図面を参照して説明する。
L ≦ Th 応答を保留 ・・・式(3)
以下、本発明の第2の実施形態を図面を参照して説明する。
以下、本発明の第3の実施形態を図面を参照して説明する。
以下、本発明の第4の実施形態を図面を参照して説明する。
以下、本発明の第5の実施形態を図面を参照して説明する。
P_2 = 2/8 ・・・式(9)
P_3 = 1/8 ・・・式(10)
S = − P_1 log(P_1) − P_2 log(P_2) − P_3 log(P_3)・・・式(11)
以下、本発明の第6の実施形態を図面を参照して説明する。
D≧Th かつ L≦Th 応答保留 ・・・式(13)
D≧Th かつ L>Th 直前の音声区間を応答対象音声と判定し応答 ・・・式(14)
12 音声区間判定部
13 特徴量算出部
14 第二の沈黙区間継続長閾値算出部
15 対話活性度算出部
16 最大遅延時間格納部
101 入力音信号取得部
102 入力音信号切り出し部
103 音声区間判定閾値格納部
104 音声区間判定部
105 音声区間音信号保存部
106 沈黙区間継続長閾値格納部
107 応答対象発声判定部
201 音声特徴量算出部
202 音声特徴量閾値・重み格納部
203 第二の沈黙区間継続長閾値算出部
301 映像信号取得部
302 映像特徴量算出部
303 映像特徴量閾値・重み格納部
304 第二の沈黙区間継続長閾値算出部
401 対話活性度算出部
402 対話活性度閾値・重み格納部
403 第二の沈黙区間継続長閾値算出部
501 複数音信号取得部
502 入力音信号切り出し部
503 音声区間判定部
504 対話活性度算出部
505 対話活性度閾値・重み格納部
506 第二の沈黙区間継続長閾値算出部
601 最大遅延時間格納部
Claims (10)
- ユーザによる発声後に続く沈黙区間の長さである沈黙区間継続長が、所定の沈黙区間継続長閾値よりも長くなることを検知し、当該発声をユーザがシステムに対して行った発声であると判定し、前記沈黙区間継続長が前記沈黙区間継続長閾値よりも短くなることを検知し、当該発声をユーザがシステム以外に対して行った発声であると判定する応答対象発声判定部を備える
ことを特徴とする応答対象音声判定装置。 - 音声入力装置が集音した音信号の時系列に対し、音声区間および沈黙区間を判定する音声区間判定部と、
前記音声区間、前記沈黙区間、またはその両方の区間に対応する特徴量を抽出する特徴量算出部と、
前記特徴量と、予め定められた特徴量の閾値および重みと、予め定められた第一の沈黙区間継続長閾値から、第二の沈黙区間継続長閾値を求める第二の沈黙区間継続長閾値算出部とを備え、
応答対象発声判定部が、前記第二の沈黙区間継続長閾値を用いて判定を行う
請求項1に記載の応答対象音声判定装置。 - 特徴量算出部が、音声区間に対応する音信号から音声特徴量を1つ以上抽出し、
第二の沈黙区間継続長閾値算出部が、前記音声特徴量を用いる
請求項2に記載の応答対象音声判定装置。 - 特徴量算出部が、音声区間に対応する映像から映像特徴量を抽出し、または沈黙区間に対応する映像から映像特徴量を抽出し、または両方の区間に対応する映像から映像特徴量を抽出し、
第二の沈黙区間継続長閾値算出部が、前記映像特徴量を1つ以上用いる
請求項2に記載の応答対象音声判定装置。 - 対話活性度算出部を備え、
音声区間判定部が、複数の音声入力装置が集音した複数チャネルの音信号の時系列それぞれに対し、音声区間および沈黙区間を判定し、
前記対話活性度算出部が、前記複数チャネルの音声区間および沈黙区間の時間的関係性から対話活性度を算出し、
第二の沈黙区間継続長閾値算出部が、前記対話活性度と、予め定められた対話活性度の閾値および重みと、予め定められた第一の沈黙区間継続長閾値とから、第二の沈黙区間継続長閾値を算出する
請求項2に記載の応答対象音声判定装置。 - システムがユーザに応答するまでの遅延時間の最大値である最大遅延時間を予め格納する最大遅延時間格納部を備え、
応答対象発声判定部が、第二の沈黙区間継続長閾値が前記最大遅延時間よりも長くなることを検知し、ユーザによる発声を応答対象外発声として棄却する
請求項2から請求項5のうちのいずれか1項に記載の応答対象音声判定装置。 - ユーザによる発声後に続く沈黙区間の長さである沈黙区間継続長が、所定の沈黙区間継続長閾値よりも長くなることを検知し、当該発声をユーザがシステムに対して行った発声であると判定し、前記沈黙区間継続長が前記沈黙区間継続長閾値よりも短くなることを検知し、当該発声をユーザがシステム以外に対して行った発声であると判定する
ことを特徴とする応答対象音声判定方法。 - 音声入力装置が集音した音信号の時系列に対し、音声区間および沈黙区間を判定し、
前記音声区間、前記沈黙区間、またはその両方の区間に対応する特徴量を抽出し、
前記特徴量と、予め定められた特徴量の閾値および重みと、予め定められた第一の沈黙区間継続長閾値から、第二の沈黙区間継続長閾値を求め、
前記第二の沈黙区間継続長閾値を用いて、ユーザによる発声の判定処理を行う
請求項7に記載の応答対象音声判定方法。 - コンピュータに、
ユーザによる発声後に続く沈黙区間の長さである沈黙区間継続長が、所定の沈黙区間継続長閾値よりも長くなることを検知し、当該発声をユーザがシステムに対して行った発声であると判定し、前記沈黙区間継続長が前記沈黙区間継続長閾値よりも短くなることを検知し、当該発声をユーザがシステム以外に対して行った発声であると判定する処理を実行させる
ための応答対象音声判定プログラム。 - コンピュータに、
音声入力装置が集音した音信号の時系列に対し、音声区間および沈黙区間を判定する処理と、
前記音声区間、前記沈黙区間、またはその両方の区間に対応する特徴量を抽出する処理と、
前記特徴量と、予め定められた特徴量の閾値および重みと、予め定められた第一の沈黙区間継続長閾値から、第二の沈黙区間継続長閾値を求める処理と、
前記第二の沈黙区間継続長閾値を用いて、ユーザによる発声の判定処理を行う
処理とを実行させる
請求項9に記載の応答対象音声判定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013131650A JP6171617B2 (ja) | 2013-06-24 | 2013-06-24 | 応答対象音声判定装置、応答対象音声判定方法および応答対象音声判定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013131650A JP6171617B2 (ja) | 2013-06-24 | 2013-06-24 | 応答対象音声判定装置、応答対象音声判定方法および応答対象音声判定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015004928A JP2015004928A (ja) | 2015-01-08 |
JP6171617B2 true JP6171617B2 (ja) | 2017-08-02 |
Family
ID=52300849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013131650A Active JP6171617B2 (ja) | 2013-06-24 | 2013-06-24 | 応答対象音声判定装置、応答対象音声判定方法および応答対象音声判定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6171617B2 (ja) |
Families Citing this family (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
EP3809407A1 (en) | 2013-02-07 | 2021-04-21 | Apple Inc. | Voice trigger for a digital assistant |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US11236192B2 (en) | 2015-09-30 | 2022-02-01 | Sekisui Chemical Co., Ltd. | Flame-retardant rigid polyurethane foam |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
JP2017117371A (ja) * | 2015-12-25 | 2017-06-29 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 制御方法、制御装置およびプログラム |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
EP3486900A1 (en) * | 2017-11-16 | 2019-05-22 | Softbank Robotics Europe | System and method for dialog session management |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
JP7172120B2 (ja) * | 2018-04-27 | 2022-11-16 | 日産自動車株式会社 | 音声認識装置及び音声認識方法 |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
CN111739506B (zh) * | 2019-11-21 | 2023-08-04 | 北京汇钧科技有限公司 | 一种应答方法、终端及存储介质 |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3378595B2 (ja) * | 1992-09-30 | 2003-02-17 | 株式会社日立製作所 | 音声対話システムおよびその対話進行制御方法 |
JP2003308079A (ja) * | 2002-04-15 | 2003-10-31 | Nissan Motor Co Ltd | 音声入力装置 |
JP4433704B2 (ja) * | 2003-06-27 | 2010-03-17 | 日産自動車株式会社 | 音声認識装置および音声認識用プログラム |
US7860718B2 (en) * | 2005-12-08 | 2010-12-28 | Electronics And Telecommunications Research Institute | Apparatus and method for speech segment detection and system for speech recognition |
JP5607627B2 (ja) * | 2010-02-25 | 2014-10-15 | パナソニック株式会社 | 信号処理装置及び信号処理方法 |
-
2013
- 2013-06-24 JP JP2013131650A patent/JP6171617B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015004928A (ja) | 2015-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6171617B2 (ja) | 応答対象音声判定装置、応答対象音声判定方法および応答対象音声判定プログラム | |
US10269374B2 (en) | Rating speech effectiveness based on speaking mode | |
CN108346425B (zh) | 一种语音活动检测的方法和装置、语音识别的方法和装置 | |
US9293133B2 (en) | Improving voice communication over a network | |
JP5381988B2 (ja) | 対話音声認識システム、対話音声認識方法および対話音声認識用プログラム | |
WO2008069187A1 (ja) | プレゼンテーション支援装置および方法並びにプログラム | |
JP5387416B2 (ja) | 発話分割システム、発話分割方法および発話分割プログラム | |
WO2017085992A1 (ja) | 情報処理装置 | |
JP4587854B2 (ja) | 感情解析装置、感情解析プログラム、プログラム格納媒体 | |
CN109994129B (zh) | 语音处理系统、方法和设备 | |
JP5385876B2 (ja) | 音声区間検出方法、音声認識方法、音声区間検出装置、音声認識装置、そのプログラム及び記録媒体 | |
JP4791857B2 (ja) | 発話区間検出装置及び発話区間検出プログラム | |
JP2015169827A (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP5375423B2 (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
JP2008052178A (ja) | 音声認識装置と音声認識方法 | |
JP5988077B2 (ja) | 発話区間検出装置及び発話区間検出のためのコンピュータプログラム | |
Arsikere et al. | Computationally-efficient endpointing features for natural spoken interaction with personal-assistant systems | |
Zelenák et al. | Speaker overlap detection with prosodic features for speaker diarisation | |
CN110661923A (zh) | 一种在会议中记录发言信息的方法和装置 | |
WO2017085815A1 (ja) | 困惑状態判定装置、困惑状態判定方法、及びプログラム | |
JP6183147B2 (ja) | 情報処理装置、プログラム、及び方法 | |
JP6526602B2 (ja) | 音声認識装置、その方法、及びプログラム | |
JP7113719B2 (ja) | 発話末タイミング予測装置およびプログラム | |
Hjalmarsson et al. | Measuring final lengthening for speaker-change prediction | |
CN111354358B (zh) | 控制方法、语音交互装置、语音识别服务器、存储介质和控制系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160512 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170525 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170619 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6171617 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |