JP7172120B2 - 音声認識装置及び音声認識方法 - Google Patents
音声認識装置及び音声認識方法 Download PDFInfo
- Publication number
- JP7172120B2 JP7172120B2 JP2018086720A JP2018086720A JP7172120B2 JP 7172120 B2 JP7172120 B2 JP 7172120B2 JP 2018086720 A JP2018086720 A JP 2018086720A JP 2018086720 A JP2018086720 A JP 2018086720A JP 7172120 B2 JP7172120 B2 JP 7172120B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- data
- utterance
- input
- analysis unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Navigation (AREA)
- Traffic Control Systems (AREA)
Description
本実施形態の音声認識装置1は、当該音声認識装置1を搭載した自車両を含む複数の車両Vを用いて、対話装置2に対する発話データ、他の乗員(電話相手を含む)に対する発話データ、孤立発話データの解析結果をデータセンタ3のホストデータベースDBHに蓄積し、複数の車両の、各音声入力部11に入力された発話データと、各音声解析部12により解析された発話データの発話対象との関係を機械学習モデルにより解析する。そして、自車両V1は、データセンタ3のホストデータベースDBHから自車両V1の車載データベースDBVへ、ホストデータベースDBHに蓄積された学習データをダウンロードして定期的に更新する。
図7は、本実施形態の音声認識装置1で実行される音声認識時の制御手順を示すフローチャートである。この音声認識時には、自車両V1が備える出力制御部13及び車載データベースDBVも使用するので、図1の下図と図7を参照して制御手順を説明する。
11…音声入力部
12…音声解析部
121…ピッチ周波数解析部
122…音声認識部
123…発話文章解析部
124…第1記憶部
125…第2記憶部
126…第3記憶部
127…第4記憶部
13…出力制御部
14…乗員検出部
15…通話検出部
DBV…車載データベース
2…対話装置
3…データセンタ
DBH…ホストデータベース
V…自車両を含む車両
V1…自車両
Claims (12)
- 車両の乗員の発話データを入力する音声入力部と、
前記音声入力部に入力された発話データからピッチ周波数の時間的な変化を抽出するとともに、前記ピッチ周波数の時間的な変化に基づいて、前記音声入力部に入力された発話データの発話対象が、対話装置であるか否かを解析する音声解析部と、
前記音声解析部により、入力された発話データの発話対象が前記対話装置であると解析された場合に限り、前記発話データに対する応答データを生成し、当該応答データを出力する出力制御部と、を備える音声認識装置。 - 前記音声解析部は、前記ピッチ周波数の時間的な変化に基づいて、前記音声入力部に入力された発話データの発話対象が、対話装置、発話者以外の乗員、又はこれら以外の孤立発話のいずれであるかを解析する請求項1に記載の音声認識装置。
- 前記出力制御部は、前記音声解析部により、入力された発話データの発話対象が、前記発話者以外の乗員及び前記孤立発話であると解析された場合には、前記応答データを出力しない請求項2に記載の音声認識装置。
- 前記音声解析部は、前記発話データに含まれる発話の時間的間隔が所定値より大きい場合には、前記対話装置に対する発話ではなく、孤立発話であると解析する請求項1~3のいずれか一項に記載の音声認識装置。
- 前記音声解析部は、前記発話データに含まれる発話の速度が所定値より遅い場合には、前記発話対象は前記対話装置であると解析する請求項1~4のいずれか一項に記載の音声認識装置。
- 前記音声解析部は、前記ピッチ周波数の時間的な変化が所定の範囲内である場合には、前記発話対象は前記対話装置であると解析する請求項1~5のいずれか一項に記載の音声認識装置。
- 前記音声解析部は、第1の乗員による発話データが入力されてから所定時間内に、第2の乗員による発話データが入力された場合には、発話者以外の乗員に対する発話であると解析する請求項1~6のいずれか一項に記載の音声認識装置。
- 前記車両の乗員を検出する乗員検出部をさらに備え、
前記音声解析部は、複数の乗員が検出された場合に、一の乗員による発話データが検出されてから所定時間内に、他の乗員による発話データが入力された場合には、発話対象は発話者以外の乗員であると解析する請求項1~6のいずれか一項に記載の音声認識装置。 - 前記車両の乗員が電話機を使用しているか否かを検出する通話検出部をさらに備え、
前記音声解析部は、前記乗員が前記電話機を使用している場合に、一の乗員による発話データが検出されてから所定時間内に、他の乗員による発話データが入力された場合には、発話者以外の乗員に対する発話であると解析する請求項1~6のいずれか一項に記載の音声認識装置。 - 前記音声解析部は、前記音声入力部に入力された発話データの音量が所定値より大きい場合には、前記発話対象は前記対話装置であると解析する請求項8又は9に記載の音声認識装置。
- 複数の車両の、各音声入力部に入力された発話データと、各音声解析部により解析された発話対象との関係データを蓄積するデータベースをさらに備え、
前記ピッチ周波数の時間的な変化は、前記関係データを機械学習モデルにより解析された特性を用いる請求項1~10のいずれか一項に記載の音声認識装置。 - プログラムにより動作するコンピュータを用いて音声を認識する方法であって、
前記コンピュータは、
車両の乗員の発話データを入力し、
前記入力された発話データからピッチ周波数の時間的な変化を抽出するとともに、前記ピッチ周波数の時間的な変化に基づいて、前記入力された発話データの発話対象が、対話装置であるか否かを解析し、
前記入力された発話データの発話対象が前記対話装置であると解析された場合に限り、前記発話データに対する応答データを生成し、当該応答データを出力する音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018086720A JP7172120B2 (ja) | 2018-04-27 | 2018-04-27 | 音声認識装置及び音声認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018086720A JP7172120B2 (ja) | 2018-04-27 | 2018-04-27 | 音声認識装置及び音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019191477A JP2019191477A (ja) | 2019-10-31 |
JP7172120B2 true JP7172120B2 (ja) | 2022-11-16 |
Family
ID=68387687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018086720A Active JP7172120B2 (ja) | 2018-04-27 | 2018-04-27 | 音声認識装置及び音声認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7172120B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022172393A1 (ja) * | 2021-02-12 | 2022-08-18 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003308079A (ja) | 2002-04-15 | 2003-10-31 | Nissan Motor Co Ltd | 音声入力装置 |
JP2005323139A (ja) | 2004-05-10 | 2005-11-17 | Fuji Xerox Co Ltd | 会議記録装置、会議記録方法、設計方法およびプログラム |
WO2014141574A1 (ja) | 2013-03-14 | 2014-09-18 | 日本電気株式会社 | 音声制御システム、音声制御方法、音声制御用プログラムおよび耐雑音音声出力用プログラム |
JP2015004928A (ja) | 2013-06-24 | 2015-01-08 | 日本電気株式会社 | 応答対象音声判定装置、応答対象音声判定方法および応答対象音声判定プログラム |
JP2016042293A (ja) | 2014-08-18 | 2016-03-31 | 株式会社デンソー | 情報提案システム |
-
2018
- 2018-04-27 JP JP2018086720A patent/JP7172120B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003308079A (ja) | 2002-04-15 | 2003-10-31 | Nissan Motor Co Ltd | 音声入力装置 |
JP2005323139A (ja) | 2004-05-10 | 2005-11-17 | Fuji Xerox Co Ltd | 会議記録装置、会議記録方法、設計方法およびプログラム |
WO2014141574A1 (ja) | 2013-03-14 | 2014-09-18 | 日本電気株式会社 | 音声制御システム、音声制御方法、音声制御用プログラムおよび耐雑音音声出力用プログラム |
JP2015004928A (ja) | 2013-06-24 | 2015-01-08 | 日本電気株式会社 | 応答対象音声判定装置、応答対象音声判定方法および応答対象音声判定プログラム |
JP2016042293A (ja) | 2014-08-18 | 2016-03-31 | 株式会社デンソー | 情報提案システム |
Non-Patent Citations (1)
Title |
---|
杉山 貴昭,多人数対話ロボットのためのユーザの挙動を利用した応答義務の推定,第75回 言語・音声理解と対話処理研究会資料,日本,一般社団法人人工知能学会,2015年10月26日,pp7-14 |
Also Published As
Publication number | Publication date |
---|---|
JP2019191477A (ja) | 2019-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6447578B2 (ja) | 音声対話装置および音声対話方法 | |
US7801726B2 (en) | Apparatus, method and computer program product for speech processing | |
CN106796786B (zh) | 语音识别系统 | |
JP3674990B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
CN108346425B (zh) | 一种语音活动检测的方法和装置、语音识别的方法和装置 | |
KR101614756B1 (ko) | 음성 인식 장치, 그를 포함하는 차량, 및 그 차량의 제어 방법 | |
US20190355352A1 (en) | Voice and conversation recognition system | |
KR100826875B1 (ko) | 온라인 방식에 의한 화자 인식 방법 및 이를 위한 장치 | |
US9418653B2 (en) | Operation assisting method and operation assisting device | |
US20170229120A1 (en) | Motor vehicle operating device with a correction strategy for voice recognition | |
CN110223711B (zh) | 基于麦克风信号的语音交互唤醒电子设备、方法和介质 | |
US11848029B2 (en) | Method and device for detecting audio signal, and storage medium | |
KR20080086791A (ko) | 음성 기반 감정 인식 시스템 | |
EP1494208A1 (en) | Method for controlling a speech dialog system and speech dialog system | |
EP3567586B1 (en) | Voice interaction system, voice interaction method, and program | |
CN112585674B (zh) | 信息处理装置、信息处理方法和存储介质 | |
JP5045486B2 (ja) | 対話装置及びプログラム | |
JP2004199053A (ja) | 絶対音量を使用して音声信号を処理する方法 | |
JP2018013549A (ja) | 発話内容認識装置 | |
JP6459330B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
JP2005283647A (ja) | 感情認識装置 | |
JP7172120B2 (ja) | 音声認識装置及び音声認識方法 | |
JP2008275987A (ja) | 音声認識装置および会議システム | |
US7177806B2 (en) | Sound signal recognition system and sound signal recognition method, and dialog control system and dialog control method using sound signal recognition system | |
US10950227B2 (en) | Sound processing apparatus, speech recognition apparatus, sound processing method, speech recognition method, storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220520 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221017 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7172120 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |