JP6984420B2 - 対話装置 - Google Patents
対話装置 Download PDFInfo
- Publication number
- JP6984420B2 JP6984420B2 JP2018001495A JP2018001495A JP6984420B2 JP 6984420 B2 JP6984420 B2 JP 6984420B2 JP 2018001495 A JP2018001495 A JP 2018001495A JP 2018001495 A JP2018001495 A JP 2018001495A JP 6984420 B2 JP6984420 B2 JP 6984420B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speaker
- dialogue
- cpu
- dialogue device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/8003—Diversity systems specially adapted for direction finding
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/802—Systems for determining direction or deviation from predetermined direction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/403—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers loud-speakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
Description
請求項2に記載の対話装置は、発話者が発した音声から前記発話者の方向を特定する特定部と、前記発話者に音声を出力する場合、前記特定部で特定した方向への音声の指向性が、他の方向における音声の指向性より高くなるように、スピーカから出力される音声の指向性を制御する制御部と、を備え、前記制御部は、スピーカから前記発話者に音声を出力する場合、複数のスピーカのうち、前記特定部によって特定された前記発話者が存在する方向に音声を出力するスピーカの音量が、他の方向に向けて音声を出力するスピーカの音量より大きくなるように、前記複数のスピーカにおける各々の音量を制御すると共に、前記発話者の各々について、聞き取りやすい周波数帯域の情報を収集し、前記周波数帯域に含まれる音声強度が、基準となる予め定めた音質を有する音声の前記周波数帯域に含まれる音声強度より大きくなるように、前記発話者に応じて前記予め定めた音質を変調する制御を行う。
図1に、第1実施形態に係る対話装置10の外観例を表す図を示す。対話装置10は、AI(Artificial Intelligence)スピーカ、又はスマートスピーカとも呼ばれることがあり、図1に示すように、対話装置10の側面には、例えば対話装置10を取り囲むように、360度に亘って複数のマイク11及び複数のスピーカ12が配置されている。
第1実施形態に係る対話装置10では、スピーカから出力される音声の指向性を制御して、対話装置10との対話相手にとって、対話装置10からの応答が聞き取りやすくなるようにした。ここでは、発話者が聞き取りやすい周波数帯域の音声をスピーカ12から出力することで、対話装置10からの応答を更に聞き取りやすくする対話装置10について説明する。
第1実施形態では、対話装置10を利用する場所について特に制約を設けていなかったが、第2実施形態では、車両40で利用される対話装置10Aについて説明する。
第1実施形態及び第2実施形態では、発話者と対話装置10又は対話装置10Aが対話を行う例について説明した。しかしながら、例えば車内で運転手と後部座席に乗車している同乗者とが対話を行う場合、周囲の騒音で対話相手の話が聞き取れないことがある。
10(10A、10B)・・・対話装置
11・・・マイク
12・・・スピーカ
13・・・特定部
14(14A、14B)・・・生成部
15・・・通信部
16・・・出力部
17(17A、17B)・・・制御部
18・・・入力部
20・・・コンピュータ
21・・・CPU
22・・・ROM
23・・・RAM
24・・・不揮発性メモリ
27・・・通信ユニット
28・・・入力ユニット
30・・・通信回線
31・・・知能サーバ
40・・・車両
T0・・・測定タイマの閾値
T1・・・対話タイマの閾値
Claims (6)
- 発話者が発した音声から前記発話者の方向を特定する特定部と、
前記発話者に音声を出力する場合、前記特定部で特定した方向への音声の指向性が、他の方向における音声の指向性より高くなるように、スピーカから出力される音声の指向性を制御する制御部と、
を備え、
前記制御部は、前記発話者の各々について、聞き取りやすい周波数帯域の情報を収集すると共に、複数のスピーカのうち、前記特定部によって特定された前記発話者が存在する方向に音声を出力するスピーカを選択し、選択したスピーカから前記発話者に音声を出力する場合、前記周波数帯域に含まれる音声強度が、基準となる予め定めた音質を有する音声の前記周波数帯域に含まれる音声強度より大きくなるように、前記発話者に応じて前記予め定めた音質を変調する制御を行う
対話装置。 - 発話者が発した音声から前記発話者の方向を特定する特定部と、
前記発話者に音声を出力する場合、前記特定部で特定した方向への音声の指向性が、他の方向における音声の指向性より高くなるように、スピーカから出力される音声の指向性を制御する制御部と、
を備え、
前記制御部は、スピーカから前記発話者に音声を出力する場合、複数のスピーカのうち、前記特定部によって特定された前記発話者が存在する方向に音声を出力するスピーカの音量が、他の方向に向けて音声を出力するスピーカの音量より大きくなるように、前記複数のスピーカにおける各々の音量を制御すると共に、前記発話者の各々について、聞き取りやすい周波数帯域の情報を収集し、前記周波数帯域に含まれる音声強度が、基準となる予め定めた音質を有する音声の前記周波数帯域に含まれる音声強度より大きくなるように、前記発話者に応じて前記予め定めた音質を変調する制御を行う
対話装置。 - 前記特定部は、車両を運転する運転手の方向を音声から特定し、
前記制御部は、前記車両の運転を支援する運転支援装置から前記車両の運転に関する情報を取得した場合、前記情報を通知する音声の指向性が、他の方向に比べて前記特定部で特定した前記運転手が存在する方向で高くなるように、スピーカから出力される音声の指向性を制御する
請求項1又は請求項2に記載の対話装置。 - 前記運転支援装置は、前記車両に予め設置されているカーナビゲーション装置、又はカーナビゲーション機能を有する携帯型の情報機器である
請求項3記載の対話装置。 - 前記特定部は、スピーカから出力される音声の到達範囲内にいる複数の人の方向を音声から特定し、
前記制御部は、前記特定部で方向が特定された前記複数の人のうち少なくとも2人の対話をそれぞれ中継する場合、言葉を発した前記発話者の音声の指向性が、他の方向に比べて対話相手が存在する方向で高くなるように、スピーカから出力される音声の指向性を制御する
請求項1又は請求項2に記載の対話装置。 - 前記制御部は、対話相手を指定する語句を含む音声を受け付けてから対話が終了するまで、それぞれの対話相手の音声を中継する制御を行う
請求項5記載の対話装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018001495A JP6984420B2 (ja) | 2018-01-09 | 2018-01-09 | 対話装置 |
CN201811616264.4A CN110035339B (zh) | 2018-01-09 | 2018-12-28 | 对话装置 |
US16/234,912 US10971146B2 (en) | 2018-01-09 | 2018-12-28 | Speech interaction device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018001495A JP6984420B2 (ja) | 2018-01-09 | 2018-01-09 | 対話装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019121970A JP2019121970A (ja) | 2019-07-22 |
JP6984420B2 true JP6984420B2 (ja) | 2021-12-22 |
Family
ID=67141019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018001495A Active JP6984420B2 (ja) | 2018-01-09 | 2018-01-09 | 対話装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10971146B2 (ja) |
JP (1) | JP6984420B2 (ja) |
CN (1) | CN110035339B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11302317B2 (en) * | 2017-03-24 | 2022-04-12 | Sony Corporation | Information processing apparatus and information processing method to attract interest of targets using voice utterance |
US11140479B2 (en) | 2019-02-04 | 2021-10-05 | Biamp Systems, LLC | Integrated loudspeaker and control device |
KR20220000182A (ko) * | 2020-06-25 | 2022-01-03 | 현대자동차주식회사 | 차량용 다중 대화 모드 지원 방법 및 시스템 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006270876A (ja) * | 2005-03-25 | 2006-10-05 | Yamaha Corp | 音声入出力装置 |
WO2007052726A1 (ja) * | 2005-11-02 | 2007-05-10 | Yamaha Corporation | 遠隔会議装置 |
JP2007208828A (ja) * | 2006-02-03 | 2007-08-16 | Denso Corp | 車両用音声入出力制御装置 |
JP4867516B2 (ja) * | 2006-08-01 | 2012-02-01 | ヤマハ株式会社 | 音声会議システム |
JP4228010B2 (ja) * | 2006-09-29 | 2009-02-25 | Necエンジニアリング株式会社 | テレビ会議装置 |
EP2045140B1 (en) | 2007-10-01 | 2010-01-27 | Harman/Becker Automotive Systems GmbH | Adjustment of vehicular elements by speech control |
JP2010187363A (ja) * | 2009-01-16 | 2010-08-26 | Sanyo Electric Co Ltd | 音響信号処理装置及び再生装置 |
JP2010283506A (ja) * | 2009-06-03 | 2010-12-16 | Mitsubishi Electric Corp | 車載用音響処理装置 |
US8649533B2 (en) * | 2009-10-02 | 2014-02-11 | Ford Global Technologies, Llc | Emotive advisory system acoustic environment |
JP5060631B1 (ja) * | 2011-03-31 | 2012-10-31 | 株式会社東芝 | 信号処理装置及び信号処理方法 |
US9060224B1 (en) * | 2012-06-01 | 2015-06-16 | Rawles Llc | Voice controlled assistant with coaxial speaker and microphone arrangement |
US10318016B2 (en) * | 2014-06-03 | 2019-06-11 | Harman International Industries, Incorporated | Hands free device with directional interface |
CN104270693A (zh) * | 2014-09-28 | 2015-01-07 | 电子科技大学 | 虚拟耳机 |
US9552816B2 (en) | 2014-12-19 | 2017-01-24 | Amazon Technologies, Inc. | Application focus in speech-based systems |
CN106067996B (zh) * | 2015-04-24 | 2019-09-17 | 松下知识产权经营株式会社 | 语音再现方法、语音对话装置 |
US9875081B2 (en) | 2015-09-21 | 2018-01-23 | Amazon Technologies, Inc. | Device selection for providing a response |
JP2017193207A (ja) * | 2016-04-18 | 2017-10-26 | アイシン精機株式会社 | 車室内会話支援装置 |
US10026403B2 (en) * | 2016-08-12 | 2018-07-17 | Paypal, Inc. | Location based voice association system |
US10475454B2 (en) * | 2017-09-18 | 2019-11-12 | Motorola Mobility Llc | Directional display and audio broadcast |
-
2018
- 2018-01-09 JP JP2018001495A patent/JP6984420B2/ja active Active
- 2018-12-28 US US16/234,912 patent/US10971146B2/en active Active
- 2018-12-28 CN CN201811616264.4A patent/CN110035339B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019121970A (ja) | 2019-07-22 |
CN110035339A (zh) | 2019-07-19 |
US20190214003A1 (en) | 2019-07-11 |
US10971146B2 (en) | 2021-04-06 |
CN110035339B (zh) | 2021-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6984420B2 (ja) | 対話装置 | |
JP2019032479A (ja) | 音声アシストシステム、サーバ装置、デバイス、その音声アシスト方法、及びコンピュータが実行するためのプログラム | |
JP6202041B2 (ja) | 車両用音声対話システム | |
KR102445365B1 (ko) | 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법 | |
JP2017138536A (ja) | 音声処理装置 | |
JP2014219617A (ja) | 音声案内システム及び音声案内方法 | |
JP2022101663A (ja) | ヒューマンコンピュータインタラクション方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
KR101989127B1 (ko) | 번역 장치, 번역 방법 및 번역 컴퓨터 프로그램 | |
JP6281202B2 (ja) | 応答制御システム、およびセンター | |
KR20200099380A (ko) | 음성 인식 서비스를 제공하는 방법 및 그 전자 장치 | |
CN110737422B (zh) | 一种声音信号采集方法及装置 | |
US10884700B2 (en) | Sound outputting device, sound outputting method, and sound outputting program storage medium | |
KR20210066651A (ko) | 전자 장치 및 이의 제어 방법 | |
JP2020144264A (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
RU2764958C1 (ru) | Устройство управления агентом, энергонезависимый носитель данных и способ управления агентом | |
JP7002823B2 (ja) | 案内音声出力制御システムおよび案内音声出力制御方法 | |
KR20220118698A (ko) | 사용자와 대화하는 인공 지능 에이전트 서비스를 지원하는 전자 장치 | |
JP7336928B2 (ja) | 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム | |
CN113035181A (zh) | 语音数据处理方法、设备和系统 | |
JP2019212168A (ja) | 音声認識システムおよび情報処理装置 | |
US20240075944A1 (en) | Localized voice recognition assistant | |
US20230419971A1 (en) | Dynamic voice assistant system for a vehicle | |
JP2015052749A (ja) | 音声認識システム | |
KR102441066B1 (ko) | 차량의 음성생성 시스템 및 방법 | |
JP4623278B2 (ja) | 音声対話装置、支援装置、生成装置、音声対話方法、支援方法、生成方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200728 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210608 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210630 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211026 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211108 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6984420 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |