JP2006181651A - 対話型ロボット、対話型ロボットの音声認識方法および対話型ロボットの音声認識プログラム - Google Patents
対話型ロボット、対話型ロボットの音声認識方法および対話型ロボットの音声認識プログラム Download PDFInfo
- Publication number
- JP2006181651A JP2006181651A JP2004374946A JP2004374946A JP2006181651A JP 2006181651 A JP2006181651 A JP 2006181651A JP 2004374946 A JP2004374946 A JP 2004374946A JP 2004374946 A JP2004374946 A JP 2004374946A JP 2006181651 A JP2006181651 A JP 2006181651A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- interactive robot
- sound source
- target voice
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 149
- 238000000034 method Methods 0.000 title claims description 55
- 230000003321 amplification Effects 0.000 claims description 43
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 43
- 238000012545 processing Methods 0.000 claims description 35
- 230000005236 sound signal Effects 0.000 claims description 27
- 238000011156 evaluation Methods 0.000 claims description 17
- 230000009471 action Effects 0.000 claims description 6
- 238000003384 imaging method Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims 1
- 230000008569 process Effects 0.000 description 37
- 238000001514 detection method Methods 0.000 description 16
- 230000007246 mechanism Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 11
- 238000013459 approach Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 241000282412 Homo Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004800 psychological effect Effects 0.000 description 1
- 239000005871 repellent Substances 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Manipulator (AREA)
Abstract
【解決手段】音声認識可能な対話型ロボット400であって、音声認識の対象となる目的音声の音源方向を推定する音源方向推定手段と、音源方向推定手段が推定した音源方向に当該対話型ロボット自身を移動させる移動手段と、移動手段による移動後の位置において、目的音声を取得する目的音声取得手段と、目的音声取得手段が取得した目的音声に対して音声認識を行う音声認識手段とを備えた。
【選択図】図1
Description
この事実を利用したものが話者の口元にマイクロホンを持っていく方法である。例えば、パソコンに実装されている音声認識システムの多くは、話者がヘッドセット型マイクロホンを装着するものである。このように、音源の至近距離にマイクロホンを配置することにより、S/N比の向上を図っている。
図1は、実施の形態1にかかる対話型ロボット400の外観図である。対話型ロボット400は、人間が命令内容を発話すると、音声認識により命令内容を認識する。そして、命令内容を実行する。例えば、「右に移動」と命令すると、右に移動というフレーズを音声認識し、実際に右に移動する。
次に、実施の形態2にかかる対話型ロボット400について説明する。実施の形態2にかかる対話型ロボット400は、CCDカメラ411,412が得たカメラ画像において対話者を捕らえる。そして、画像中の対話者の口の動きに基づいて発話中か否かを判断する。この点で、実施の形態2にかかる対話型ロボット400は、音声認識により発話中か否かを判断する実施の形態1にかかる対話型ロボット400と異なっている。
52 ROM
53 RAM
57 通信I/F
62 バス
100 処理部
102 命令音声DB
104 誤認通知音声DB
110 音声認識部
112 命令内容実行指示部
120 音源方向推定部
122 音源距離推定部
124 移動指示部
130 S/N比算出部
132 信号強度評価部
134 増幅ゲイン調整指示部
140 増幅ゲイン値取得部
142 飽和評価部
160 画像取得部
162 口動作検出部
164 発話判断部
200 信号増幅用OPアンプ
202 A/D変換部
300 コントローラ
400 対話型ロボット
411,412 CCDカメラ
430 マイクロホンアレイ
432 音声マイク
440 超音波センサ
451,452 移動用車輪
460 車輪駆動機構
Claims (18)
- 音声認識可能な対話型ロボットであって、
音声認識の対象となる目的音声の音源方向を推定する音源方向推定手段と、
前記音源方向推定手段が推定した前記音源方向に当該対話型ロボット自身を移動させる移動手段と、
前記移動手段による移動後の位置において、前記目的音声を取得する目的音声取得手段と、
前記目的音声取得手段が取得した前記目的音声に対して前記音声認識を行う音声認識手段と
を備えたことを特徴とする対話型ロボット。 - 前記移動手段が前記音源方向に移動した後に、前記目的音声の音源に対して発音を指示する発音指示手段をさらに備え、
前記音声認識手段は、前記発音指示手段の指示に応じて発音された前記目的音声に対して音声認識を行うことを特徴とする請求項1に記載の対話型ロボット。 - 前記目的音声取得手段が取得した前記目的音声のS/N比を算出するS/N比算出手段と、
前記S/N比算出手段が算出した前記S/N比と予め定められたS/N比閾値とを比較するS/N比評価手段と
をさらに備え、
前記移動手段は、さらに前記S/N比評価手段が算出した前記S/N比が前記S/N比閾値よりも小さい場合に、当該対話型ロボット自身を前記音源方向に移動させることを特徴とする請求項1または2に記載の対話型ロボット。 - 前記目的音声は、当該対話型ロボットと対話する対話者の発声であって、
前記目的音声の音源である前記対話者を含む画像を取得する画像取得手段と、
前記画像取得手段が取得した画像から前記対話者の発声に伴う口動作を検出する口動作検出手段と
をさらに備え、
前記移動手段は、前記S/N比評価手段が算出した前記S/N比が前記S/N比閾値よりも小さく、かつ前記口動作検出手段が前記対話者の口動作を検出した場合に、当該対話型ロボット自身を前記音源方向に移動させることを特徴とする請求項3に記載の対話型ロボット。 - 前記目的音声は、当該対話型ロボットと対話する対話者の発声であって、
前記目的音声の音源である前記対話者を含む画像を取得する画像取得手段と、
前記画像取得手段が取得した画像から前記対話者の発声に伴う口動作を検出する口動作検出手段と
をさらに備え、
前記移動手段は、前記S/N比評価手段が算出した前記S/N比が前記S/N比閾値以上であって、かつ前記口動作検出手段が前記対話者の口動作を検出しない場合に、当該対話型ロボット自身を前記音源方向に移動させることを特徴とする請求項3に記載の対話型ロボット。 - 前記音声認識手段による認識結果の精度を算出する認識精度評価手段をさらに備え、
前記移動手段は、さらに前記音声認識手段が前記目的音声に対して音声認識を行った結果の認識精度が予め定めた認識精度閾値よりも小さい場合に、当該対話型ロボット自身を前記音源方向に移動させることを特徴とする請求項1に記載の対話型ロボット。 - 前記目的音声は、当該対話型ロボットと対話する対話者の発声であって、
前記目的音声の音源である前記対話者を含む画像を取得する画像取得手段と、
前記画像取得手段が取得した画像から前記対話者の発声に伴う口動作を検出する口動作検出手段と
をさらに備え、
前記移動手段は、前記認識精度が前記認識精度閾値よりも小さく、かつ前記口動作検出手段が前記対話者の口動作を検出した場合に、当該対話型ロボット自身を前記音源方向に移動させることを特徴とする請求項6に記載の対話型ロボット。 - 前記目的音声は、当該対話型ロボットと対話する対話者の発声であって、
前記目的音声の音源である前記対話者を含む画像を取得する画像取得手段と、
前記画像取得手段が取得した画像から前記対話者の発声に伴う口動作を検出する口動作検出手段と
をさらに備え、
前記移動手段は、前記認識精度が前記認識精度閾値以上であって、かつ前記口動作検出手段が前記対話者の口動作を検出しない場合に、当該対話型ロボット自身を前記音源方向に移動させることを特徴とする請求項6に記載の対話型ロボット。 - 前記目的音声の音声パターンを保持する目的音声保持手段をさらに備え、
前記音声認識手段は、前記目的音声保持手段が保持している前記目的音声の音声パターンと前記目的音声取得手段が取得した前記目的音声とのパターンマッチングにより音声認識を行い、
前記認識精度評価手段は、前記目的音声保持手段に保持されている前記目的音声の音声パターンとの一致度を前記認識精度として算出することを特徴とする請求項6に記載の対話型ロボット。 - 前記目的音声は、前記音声認識手段による音声認識が誤っていることを示す誤認通知音声であって、
前記目的音声保持手段は、前記誤認通知音声の音声パターンを保持し、
前記移動手段は、さらに前記音声認識手段が前記目的音声保持手段が保持している前記誤認通知音声を認識した場合に、当該対話型ロボット自身を前記音源方向に移動させることを特徴とする請求項9に記載の対話型ロボット。 - 前記目的音声は、当該対話型ロボットと対話する対話者の発声であって、
前記目的音声の音源である前記対話者を含む画像を取得する画像取得手段と、
前記画像取得手段が取得した画像から前記対話者の発声に伴う口動作を検出する口動作検出手段と
をさらに備え、
前記移動手段は、前記口動作検出手段が前記口動作を検出し、かつ前記目的音声取得手段が前記目的音声を取得しない場合に、当該対話型ロボットを前記音源方向に移動させることを特徴とする請求項1に記載の対話型ロボット。 - 前記目的音声は、当該対話型ロボットと対話する対話者の発話であって、
前記目的音声の音源である前記対話者を含む画像を取得する画像取得手段と、
前記画像取得手段が取得した画像から前記対話者の口の動きを検出する口動作検出手段と
をさらに備え、
前記移動手段は、前記口動作検出手段が前記口動作を検出せず、かつ前記目的音声取得手段が前記目的音声を取得した場合に、当該対話型ロボットを前記音源方向に移動させることを特徴とする請求項1に記載の対話型ロボット。 - 前記目的音声を収音する複数の音声マイクを有するマイクロホンアレイをさらに備え、
前記マイクロホンアレイの各音声マイクが収音した前記目的音声の平面波の到達時間の差分値に基づいて前記音源方向を推定することを特徴とする請求項1から12のいずれか一項に記載の対話型ロボット。 - 前記目的音声と、当該対話型ロボットとの距離を測定する測距センサをさらに備え、
前記音源方向推定手段は、前記測距センサによる測定結果に基づいて前記音源方向を推定することを特徴とする請求項1から12のいずれか一項に記載の対話型ロボット。 - 前記目的音声の音源の画像を撮像する撮像ユニットをさらに備え、
前記音源方向推定手段は、前記撮像ユニットが前記画像を撮像した方向を前記音源方向として推定することを特徴とする請求項12のいずれか一項に記載の対話型ロボット。 - 前記移動手段による移動後の位置において、前記目的音声取得手段が取得した前記目的音声の信号強度を測定する信号強度測定手段と、
前記信号強度測定手段が測定した前記信号強度の値に基づいて、前記目的音声の音声信号を増幅する増幅ゲインの値を調整する増幅ゲイン調整手段と
をさらに備え、
前記音声認識手段は、前記増幅ゲイン調整手段が前記増幅ゲインの値を調整した後に前記目的音声取得手段が取得した前記目的音声に対して、音声認識を行うことを特徴とする請求項1から15のいずれか一項に記載の対話型ロボット。 - 音声認識可能な対話型ロボットの音声認識方法であって、
音声認識の対象となる目的音声の音源方向を推定する音源方向推定ステップと、
前記音源方向推定ステップにおいて推定した前記音源方向に当該対話型ロボットを移動させる移動ステップと、
前記対話型ロボットが前記移動ステップにおける移動後の位置に存在するときに、前記目的音声を取得する目的音声取得ステップと、
前記目的音声取得ステップにおいて取得した前記目的音声に対して前記音声認識を行う音声認識ステップと
を有することを特徴とする対話型ロボットの音声認識方法。 - 音声認識可能な対話型ロボットの音声認識処理をコンピュータに実行させる音声認識プログラムであって、
音声認識の対象となる目的音声の音源方向を推定する音源方向推定ステップと、
前記音源方向推定ステップにおいて推定した前記音源方向に当該対話型ロボットを移動させる移動ステップと、
前記対話型ロボットが前記移動ステップにおける移動後の位置に存在するときに、前記目的音声を取得する目的音声取得ステップと、
前記目的音声取得ステップにおいて抽出した前記目的音声に対して前記音声認識を行う音声認識ステップと
を有することを特徴とする対話型ロボットの音声認識プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004374946A JP4204541B2 (ja) | 2004-12-24 | 2004-12-24 | 対話型ロボット、対話型ロボットの音声認識方法および対話型ロボットの音声認識プログラム |
US11/311,429 US7680667B2 (en) | 2004-12-24 | 2005-12-20 | Interactive robot, speech recognition method and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004374946A JP4204541B2 (ja) | 2004-12-24 | 2004-12-24 | 対話型ロボット、対話型ロボットの音声認識方法および対話型ロボットの音声認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006181651A true JP2006181651A (ja) | 2006-07-13 |
JP4204541B2 JP4204541B2 (ja) | 2009-01-07 |
Family
ID=36612889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004374946A Expired - Fee Related JP4204541B2 (ja) | 2004-12-24 | 2004-12-24 | 対話型ロボット、対話型ロボットの音声認識方法および対話型ロボットの音声認識プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7680667B2 (ja) |
JP (1) | JP4204541B2 (ja) |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009192942A (ja) * | 2008-02-15 | 2009-08-27 | Toshiba Corp | 音声対話装置及び支援方法 |
JP2010020165A (ja) * | 2008-07-11 | 2010-01-28 | Fujitsu Ltd | 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム |
JP2010204266A (ja) * | 2009-03-02 | 2010-09-16 | Fujitsu Ltd | 音響信号変換装置、方法、及びプログラム |
JP2011000681A (ja) * | 2009-06-19 | 2011-01-06 | Advanced Telecommunication Research Institute International | コミュニケーションロボット |
JP2016076007A (ja) * | 2014-10-03 | 2016-05-12 | 株式会社Nttドコモ | 対話装置および対話方法 |
WO2017145929A1 (ja) * | 2016-02-25 | 2017-08-31 | シャープ株式会社 | 姿勢制御装置、ロボット及び姿勢制御方法 |
JP2018034221A (ja) * | 2016-08-29 | 2018-03-08 | Kddi株式会社 | ロボットシステム |
WO2018043235A1 (ja) * | 2016-08-29 | 2018-03-08 | Groove X株式会社 | 音源の方向を認識する自律行動型ロボット |
JP2018511962A (ja) * | 2015-08-31 | 2018-04-26 | 深▲せん▼前海達闥科技有限公司Cloudminds (Shenzhen) Technologies Co., Ltd. | 声を受信する処理方法、装置、記憶媒体、携帯端末及びロボット |
JP2018126808A (ja) * | 2017-02-06 | 2018-08-16 | 日本信号株式会社 | ブース付ロボット |
JP2018202567A (ja) * | 2017-06-07 | 2018-12-27 | シャープ株式会社 | 動作制御装置およびその制御方法、ロボットならびに制御プログラム |
CN109141620A (zh) * | 2017-06-23 | 2019-01-04 | 卡西欧计算机株式会社 | 声源分离信息检测装置、机器人、声源分离信息检测方法和存储介质 |
JP2019505047A (ja) * | 2016-01-28 | 2019-02-21 | クアルコム,インコーポレイテッド | ドローン飛行制御 |
JP2019036174A (ja) * | 2017-08-17 | 2019-03-07 | ヤフー株式会社 | 制御装置、入出力装置、制御方法、および制御プログラム |
KR101965530B1 (ko) * | 2018-04-10 | 2019-04-03 | 이화여자대학교 산학협력단 | 이동형 스피커 장치 및 이동형 스피커 장치의 음향 출력 방법 |
JP2019096365A (ja) * | 2019-03-19 | 2019-06-20 | ヤフー株式会社 | 制御装置、入出力装置、制御方法、および制御プログラム |
JP2019123055A (ja) * | 2018-01-18 | 2019-07-25 | 株式会社ユピテル | 装置 |
WO2019187834A1 (ja) * | 2018-03-30 | 2019-10-03 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP2019219509A (ja) * | 2018-06-20 | 2019-12-26 | カシオ計算機株式会社 | ロボット、ロボットの制御方法及びプログラム |
JP2020046478A (ja) * | 2018-09-14 | 2020-03-26 | 株式会社フュートレック | ロボットシステム |
WO2020170489A1 (ja) * | 2019-02-19 | 2020-08-27 | パナソニックIpマネジメント株式会社 | 無人飛行体、情報処理方法およびプログラム |
WO2020170510A1 (ja) * | 2019-02-19 | 2020-08-27 | パナソニックIpマネジメント株式会社 | 無人飛行体、情報処理方法およびプログラム |
JPWO2020202621A1 (ja) * | 2019-03-29 | 2020-10-08 | ||
WO2020213198A1 (ja) * | 2019-04-18 | 2020-10-22 | パナソニックIpマネジメント株式会社 | 無人飛行体、制御方法及びプログラム |
KR20200129934A (ko) * | 2019-05-10 | 2020-11-18 | 네이버 주식회사 | 오디오-비주얼 데이터에 기반한 화자 분리 방법 및 장치 |
JPWO2019087495A1 (ja) * | 2017-10-30 | 2020-12-10 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
WO2022236002A1 (en) * | 2021-05-06 | 2022-11-10 | Bear Robotics, Inc. | Method, system, and non-transitory computer-readable recording medium for controlling a robot |
Families Citing this family (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7697827B2 (en) | 2005-10-17 | 2010-04-13 | Konicek Jeffrey C | User-friendlier interfaces for a camera |
KR20080111290A (ko) * | 2007-06-18 | 2008-12-23 | 삼성전자주식회사 | 원거리 음성 인식을 위한 음성 성능을 평가하는 시스템 및방법 |
WO2009044509A1 (ja) * | 2007-10-01 | 2009-04-09 | Panasonic Corporation | 音源方向検知装置 |
US8676581B2 (en) * | 2010-01-22 | 2014-03-18 | Microsoft Corporation | Speech recognition analysis via identification information |
US8482859B2 (en) | 2010-02-28 | 2013-07-09 | Osterhout Group, Inc. | See-through near-eye display glasses wherein image light is transmitted to and reflected from an optically flat film |
KR20130000401A (ko) | 2010-02-28 | 2013-01-02 | 오스터하우트 그룹 인코포레이티드 | 대화형 머리장착식 아이피스 상의 지역 광고 컨텐츠 |
US8488246B2 (en) | 2010-02-28 | 2013-07-16 | Osterhout Group, Inc. | See-through near-eye display glasses including a curved polarizing film in the image source, a partially reflective, partially transmitting optical element and an optically flat film |
US20120249797A1 (en) | 2010-02-28 | 2012-10-04 | Osterhout Group, Inc. | Head-worn adaptive display |
US9097891B2 (en) | 2010-02-28 | 2015-08-04 | Microsoft Technology Licensing, Llc | See-through near-eye display glasses including an auto-brightness control for the display brightness based on the brightness in the environment |
US9229227B2 (en) | 2010-02-28 | 2016-01-05 | Microsoft Technology Licensing, Llc | See-through near-eye display glasses with a light transmissive wedge shaped illumination system |
US8477425B2 (en) | 2010-02-28 | 2013-07-02 | Osterhout Group, Inc. | See-through near-eye display glasses including a partially reflective, partially transmitting optical element |
US9128281B2 (en) | 2010-09-14 | 2015-09-08 | Microsoft Technology Licensing, Llc | Eyepiece with uniformly illuminated reflective display |
US9182596B2 (en) | 2010-02-28 | 2015-11-10 | Microsoft Technology Licensing, Llc | See-through near-eye display glasses with the optical assembly including absorptive polarizers or anti-reflective coatings to reduce stray light |
US9091851B2 (en) | 2010-02-28 | 2015-07-28 | Microsoft Technology Licensing, Llc | Light control in head mounted displays |
US9285589B2 (en) | 2010-02-28 | 2016-03-15 | Microsoft Technology Licensing, Llc | AR glasses with event and sensor triggered control of AR eyepiece applications |
US9341843B2 (en) | 2010-02-28 | 2016-05-17 | Microsoft Technology Licensing, Llc | See-through near-eye display glasses with a small scale image source |
US20150309316A1 (en) | 2011-04-06 | 2015-10-29 | Microsoft Technology Licensing, Llc | Ar glasses with predictive control of external device based on event input |
US8467133B2 (en) | 2010-02-28 | 2013-06-18 | Osterhout Group, Inc. | See-through display with an optical assembly including a wedge-shaped illumination system |
US9366862B2 (en) | 2010-02-28 | 2016-06-14 | Microsoft Technology Licensing, Llc | System and method for delivering content to a group of see-through near eye display eyepieces |
US9097890B2 (en) | 2010-02-28 | 2015-08-04 | Microsoft Technology Licensing, Llc | Grating in a light transmissive illumination system for see-through near-eye display glasses |
US9134534B2 (en) | 2010-02-28 | 2015-09-15 | Microsoft Technology Licensing, Llc | See-through near-eye display glasses including a modular image source |
US9759917B2 (en) | 2010-02-28 | 2017-09-12 | Microsoft Technology Licensing, Llc | AR glasses with event and sensor triggered AR eyepiece interface to external devices |
US9129295B2 (en) | 2010-02-28 | 2015-09-08 | Microsoft Technology Licensing, Llc | See-through near-eye display glasses with a fast response photochromic film system for quick transition from dark to clear |
US9223134B2 (en) | 2010-02-28 | 2015-12-29 | Microsoft Technology Licensing, Llc | Optical imperfections in a light transmissive illumination system for see-through near-eye display glasses |
US10180572B2 (en) | 2010-02-28 | 2019-01-15 | Microsoft Technology Licensing, Llc | AR glasses with event and user action control of external applications |
US8472120B2 (en) | 2010-02-28 | 2013-06-25 | Osterhout Group, Inc. | See-through near-eye display glasses with a small scale image source |
US9634855B2 (en) | 2010-05-13 | 2017-04-25 | Alexander Poltorak | Electronic personal interactive device that determines topics of interest using a conversational agent |
FR2962048A1 (fr) * | 2010-07-02 | 2012-01-06 | Aldebaran Robotics S A | Robot humanoide joueur, methode et systeme d'utilisation dudit robot |
US20120260167A1 (en) * | 2011-04-07 | 2012-10-11 | Sony Corporation | User interface for audio video display device such as tv |
US8183997B1 (en) | 2011-11-14 | 2012-05-22 | Google Inc. | Displaying sound indications on a wearable computing system |
WO2014157757A1 (ko) * | 2013-03-29 | 2014-10-02 | 엘지전자 주식회사 | 이동식 입력 장치 및 그를 이용한 명령 입력 방법 |
US9310800B1 (en) * | 2013-07-30 | 2016-04-12 | The Boeing Company | Robotic platform evaluation system |
US9753119B1 (en) * | 2014-01-29 | 2017-09-05 | Amazon Technologies, Inc. | Audio and depth based sound source localization |
EP2933067B1 (en) * | 2014-04-17 | 2019-09-18 | Softbank Robotics Europe | Method of performing multi-modal dialogue between a humanoid robot and user, computer program product and humanoid robot for implementing said method |
EP3202125B1 (en) * | 2014-09-30 | 2019-07-31 | Hewlett-Packard Development Company, L.P. | Sound conditioning |
JP6551507B2 (ja) * | 2015-02-17 | 2019-07-31 | 日本電気株式会社 | ロボット制御装置、ロボット、ロボット制御方法およびプログラム |
US20160267075A1 (en) * | 2015-03-13 | 2016-09-15 | Panasonic Intellectual Property Management Co., Ltd. | Wearable device and translation system |
US10152476B2 (en) * | 2015-03-19 | 2018-12-11 | Panasonic Intellectual Property Management Co., Ltd. | Wearable device and translation system |
KR20180037543A (ko) * | 2016-10-04 | 2018-04-12 | 삼성전자주식회사 | 음성 인식 전자 장치 |
US10120386B2 (en) | 2016-11-18 | 2018-11-06 | Robert Bosch Start-Up Platform North America, LLC, Series 1 | Robotic creature and method of operation |
KR102549465B1 (ko) * | 2016-11-25 | 2023-06-30 | 삼성전자주식회사 | 마이크 파라미터를 조절하는 전자 장치 |
CN110495190B (zh) * | 2017-04-10 | 2021-08-17 | 雅马哈株式会社 | 语音提供设备、语音提供方法和程序记录介质 |
CN108235745B (zh) * | 2017-05-08 | 2021-01-08 | 深圳前海达闼云端智能科技有限公司 | 机器人唤醒方法、装置和机器人 |
US10824870B2 (en) * | 2017-06-29 | 2020-11-03 | Accenture Global Solutions Limited | Natural language eminence based robotic agent control |
CN107742516B (zh) * | 2017-09-29 | 2020-11-17 | 上海望潮数据科技有限公司 | 智能识别方法、机器人及计算机可读存储介质 |
CN109877842A (zh) * | 2017-12-06 | 2019-06-14 | 湘潭宏远电子科技有限公司 | 一种机器人交互系统 |
KR102228866B1 (ko) * | 2018-10-18 | 2021-03-17 | 엘지전자 주식회사 | 로봇 및 그의 제어 방법 |
US10723017B1 (en) * | 2019-04-01 | 2020-07-28 | Shenzhen Wangrui Technology Co., Ltd. | Robotic eye systems |
WO2020218634A1 (ko) * | 2019-04-23 | 2020-10-29 | 엘지전자 주식회사 | 응답 기기 결정 방법 및 장치 |
US11651759B2 (en) * | 2019-05-28 | 2023-05-16 | Bose Corporation | Gain adjustment in ANR system with multiple feedforward microphones |
CN110164443B (zh) * | 2019-06-28 | 2021-09-14 | 联想(北京)有限公司 | 用于电子设备的语音处理方法、装置以及电子设备 |
WO2021015308A1 (ko) * | 2019-07-19 | 2021-01-28 | 엘지전자 주식회사 | 로봇 및 그의 기동어 인식 방법 |
CN112925235A (zh) * | 2021-01-21 | 2021-06-08 | 深圳市普渡科技有限公司 | 交互时的声源定位方法、设备和计算机可读存储介质 |
CN114242072A (zh) * | 2021-12-21 | 2022-03-25 | 上海帝图信息科技有限公司 | 一种用于智能机器人的语音识别系统 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01118900A (ja) * | 1987-11-01 | 1989-05-11 | Ricoh Co Ltd | 雑音抑圧装置 |
US5638487A (en) * | 1994-12-30 | 1997-06-10 | Purespeech, Inc. | Automatic speech recognition |
US5774841A (en) * | 1995-09-20 | 1998-06-30 | The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration | Real-time reconfigurable adaptive speech recognition command and control apparatus and method |
US6098040A (en) * | 1997-11-07 | 2000-08-01 | Nortel Networks Corporation | Method and apparatus for providing an improved feature set in speech recognition by performing noise cancellation and background masking |
JP2000099722A (ja) | 1998-09-22 | 2000-04-07 | Toshiba Corp | 人物顔認識装置及び人物顔認識方法 |
JP3484112B2 (ja) | 1999-09-27 | 2004-01-06 | 株式会社東芝 | 雑音成分抑圧処理装置および雑音成分抑圧処理方法 |
JP3797047B2 (ja) | 1999-12-08 | 2006-07-12 | 富士通株式会社 | ロボット装置 |
CN1283428C (zh) * | 2000-03-31 | 2006-11-08 | 索尼公司 | 机器人设备、控制机器人设备动作的方法 |
JP2001296883A (ja) * | 2000-04-14 | 2001-10-26 | Sakai Yasue | 音声認識方法および装置、音声合成方法および装置、記録媒体 |
JP4027565B2 (ja) | 2000-04-19 | 2007-12-26 | 株式会社ケンウッド | ディジタル受信機 |
JP2001312292A (ja) | 2000-04-28 | 2001-11-09 | Sharp Corp | 音声処理装置 |
JP4815661B2 (ja) * | 2000-08-24 | 2011-11-16 | ソニー株式会社 | 信号処理装置及び信号処理方法 |
EP1375084A4 (en) * | 2001-03-09 | 2009-10-21 | Japan Science & Tech Agency | AUDIOVISUAL ROBOT SYSTEM |
JP2003131683A (ja) * | 2001-10-22 | 2003-05-09 | Sony Corp | 音声認識装置および音声認識方法、並びにプログラムおよび記録媒体 |
JP2003195886A (ja) | 2001-12-26 | 2003-07-09 | Sony Corp | ロボット |
JP3529049B2 (ja) | 2002-03-06 | 2004-05-24 | ソニー株式会社 | 学習装置及び学習方法並びにロボット装置 |
JP4195267B2 (ja) * | 2002-03-14 | 2008-12-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声認識装置、その音声認識方法及びプログラム |
JP4281286B2 (ja) | 2002-03-18 | 2009-06-17 | ソニー株式会社 | ロボット装置及びその制御方法 |
JP4131392B2 (ja) | 2003-01-28 | 2008-08-13 | ソニー株式会社 | ロボット装置およびロボット制御方法、記録媒体、並びにプログラム |
JP2004283927A (ja) | 2003-03-20 | 2004-10-14 | Sony Corp | ロボット制御装置および方法、記録媒体、並びにプログラム |
JP4239635B2 (ja) | 2003-03-20 | 2009-03-18 | ソニー株式会社 | ロボット装置、その動作制御方法、及びプログラム |
JP2005049153A (ja) | 2003-07-31 | 2005-02-24 | Toshiba Corp | 音声方向推定装置及びその方法 |
-
2004
- 2004-12-24 JP JP2004374946A patent/JP4204541B2/ja not_active Expired - Fee Related
-
2005
- 2005-12-20 US US11/311,429 patent/US7680667B2/en not_active Expired - Fee Related
Cited By (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8155968B2 (en) | 2008-02-15 | 2012-04-10 | Kabushiki Kaisha Toshiba | Voice recognition apparatus and method for performing voice recognition comprising calculating a recommended distance range between a user and an audio input module based on the S/N ratio |
JP2009192942A (ja) * | 2008-02-15 | 2009-08-27 | Toshiba Corp | 音声対話装置及び支援方法 |
JP2010020165A (ja) * | 2008-07-11 | 2010-01-28 | Fujitsu Ltd | 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム |
US9135924B2 (en) | 2008-07-11 | 2015-09-15 | Fujitsu Limited | Noise suppressing device, noise suppressing method and mobile phone |
JP2010204266A (ja) * | 2009-03-02 | 2010-09-16 | Fujitsu Ltd | 音響信号変換装置、方法、及びプログラム |
JP2011000681A (ja) * | 2009-06-19 | 2011-01-06 | Advanced Telecommunication Research Institute International | コミュニケーションロボット |
JP2016076007A (ja) * | 2014-10-03 | 2016-05-12 | 株式会社Nttドコモ | 対話装置および対話方法 |
JP2018511962A (ja) * | 2015-08-31 | 2018-04-26 | 深▲せん▼前海達闥科技有限公司Cloudminds (Shenzhen) Technologies Co., Ltd. | 声を受信する処理方法、装置、記憶媒体、携帯端末及びロボット |
US10306360B2 (en) | 2015-08-31 | 2019-05-28 | Cloudminds (Shenzhen) Technologies Co., Ltd. | Method and device for processing received sound and memory medium, mobile terminal, robot having the same |
JP2019505047A (ja) * | 2016-01-28 | 2019-02-21 | クアルコム,インコーポレイテッド | ドローン飛行制御 |
JPWO2017145929A1 (ja) * | 2016-02-25 | 2018-10-25 | シャープ株式会社 | 姿勢制御装置、ロボット及び姿勢制御方法 |
CN108698231A (zh) * | 2016-02-25 | 2018-10-23 | 夏普株式会社 | 姿势控制装置、机器人及姿势控制方法 |
WO2017145929A1 (ja) * | 2016-02-25 | 2017-08-31 | シャープ株式会社 | 姿勢制御装置、ロボット及び姿勢制御方法 |
WO2018043235A1 (ja) * | 2016-08-29 | 2018-03-08 | Groove X株式会社 | 音源の方向を認識する自律行動型ロボット |
JPWO2018043235A1 (ja) * | 2016-08-29 | 2018-12-20 | Groove X株式会社 | 音源の方向を認識する自律行動型ロボット |
JP2019162714A (ja) * | 2016-08-29 | 2019-09-26 | Groove X株式会社 | 音源の方向を認識するロボット |
GB2567600B (en) * | 2016-08-29 | 2022-05-04 | Groove X Inc | Autonomously acting robot that recognizes direction of sound source |
JP2018034221A (ja) * | 2016-08-29 | 2018-03-08 | Kddi株式会社 | ロボットシステム |
US11376740B2 (en) | 2016-08-29 | 2022-07-05 | Groove X, Inc. | Autonomously acting robot that recognizes direction of sound source |
GB2567600A (en) * | 2016-08-29 | 2019-04-17 | Groove X Inc | Autonomous behavior robot recognizing direction of sound source |
JP2018126808A (ja) * | 2017-02-06 | 2018-08-16 | 日本信号株式会社 | ブース付ロボット |
JP2018202567A (ja) * | 2017-06-07 | 2018-12-27 | シャープ株式会社 | 動作制御装置およびその制御方法、ロボットならびに制御プログラム |
JP2019008134A (ja) * | 2017-06-23 | 2019-01-17 | カシオ計算機株式会社 | 音源分離情報検出装置、ロボット、音源分離情報検出方法及びプログラム |
CN109141620B (zh) * | 2017-06-23 | 2021-01-22 | 卡西欧计算机株式会社 | 声源分离信息检测装置、机器人、声源分离信息检测方法和存储介质 |
US10665249B2 (en) | 2017-06-23 | 2020-05-26 | Casio Computer Co., Ltd. | Sound source separation for robot from target voice direction and noise voice direction |
CN109141620A (zh) * | 2017-06-23 | 2019-01-04 | 卡西欧计算机株式会社 | 声源分离信息检测装置、机器人、声源分离信息检测方法和存储介质 |
JP2019036174A (ja) * | 2017-08-17 | 2019-03-07 | ヤフー株式会社 | 制御装置、入出力装置、制御方法、および制御プログラム |
JPWO2019087495A1 (ja) * | 2017-10-30 | 2020-12-10 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP2019123055A (ja) * | 2018-01-18 | 2019-07-25 | 株式会社ユピテル | 装置 |
EP3778151A4 (en) * | 2018-03-30 | 2021-06-16 | Sony Corporation | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING PROCESS AND PROGRAM |
JP7259843B2 (ja) | 2018-03-30 | 2023-04-18 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
US11468891B2 (en) | 2018-03-30 | 2022-10-11 | Sony Corporation | Information processor, information processing method, and program |
CN111788043A (zh) * | 2018-03-30 | 2020-10-16 | 索尼公司 | 信息处理装置、信息处理方法和程序 |
WO2019187834A1 (ja) * | 2018-03-30 | 2019-10-03 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
CN111788043B (zh) * | 2018-03-30 | 2024-06-14 | 索尼公司 | 信息处理装置、信息处理方法和程序 |
JPWO2019187834A1 (ja) * | 2018-03-30 | 2021-07-15 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
KR101965530B1 (ko) * | 2018-04-10 | 2019-04-03 | 이화여자대학교 산학협력단 | 이동형 스피커 장치 및 이동형 스피커 장치의 음향 출력 방법 |
JP7176244B2 (ja) | 2018-06-20 | 2022-11-22 | カシオ計算機株式会社 | ロボット、ロボットの制御方法及びプログラム |
JP2019219509A (ja) * | 2018-06-20 | 2019-12-26 | カシオ計算機株式会社 | ロボット、ロボットの制御方法及びプログラム |
JP2020046478A (ja) * | 2018-09-14 | 2020-03-26 | 株式会社フュートレック | ロボットシステム |
WO2020170489A1 (ja) * | 2019-02-19 | 2020-08-27 | パナソニックIpマネジメント株式会社 | 無人飛行体、情報処理方法およびプログラム |
WO2020170510A1 (ja) * | 2019-02-19 | 2020-08-27 | パナソニックIpマネジメント株式会社 | 無人飛行体、情報処理方法およびプログラム |
US11928974B2 (en) | 2019-02-19 | 2024-03-12 | Panasonic Intellectual Property Management Co., Ltd. | Unmanned aircraft, information processing method, and recording medium |
JPWO2020170489A1 (ja) * | 2019-02-19 | 2021-12-16 | パナソニックIpマネジメント株式会社 | 無人飛行体、情報処理方法およびプログラム |
JPWO2020170510A1 (ja) * | 2019-02-19 | 2021-12-16 | パナソニックIpマネジメント株式会社 | 無人飛行体、情報処理方法およびプログラム |
CN112912309A (zh) * | 2019-02-19 | 2021-06-04 | 松下知识产权经营株式会社 | 无人飞行体、信息处理方法以及程序 |
JP7442147B2 (ja) | 2019-02-19 | 2024-03-04 | パナソニックIpマネジメント株式会社 | 無人飛行体、情報処理方法およびプログラム |
EP3929074A4 (en) * | 2019-02-19 | 2022-06-01 | Panasonic Intellectual Property Management Co., Ltd. | UNMANNED AIRCRAFT, INFORMATION PROCESSING METHOD AND PROGRAM |
JP7296554B2 (ja) | 2019-02-19 | 2023-06-23 | パナソニックIpマネジメント株式会社 | 無人飛行体、情報処理方法およびプログラム |
JP2019096365A (ja) * | 2019-03-19 | 2019-06-20 | ヤフー株式会社 | 制御装置、入出力装置、制御方法、および制御プログラム |
EP3950498A4 (en) * | 2019-03-29 | 2022-04-27 | Panasonic Intellectual Property Management Co., Ltd. | MOBILE BODY WITHOUT PILOT AND INFORMATION PROCESSING METHOD |
JPWO2020202621A1 (ja) * | 2019-03-29 | 2020-10-08 | ||
WO2020202621A1 (ja) * | 2019-03-29 | 2020-10-08 | パナソニックIpマネジメント株式会社 | 無人移動体及び情報処理方法 |
JP7426631B2 (ja) | 2019-03-29 | 2024-02-02 | パナソニックIpマネジメント株式会社 | 無人移動体及び情報処理方法 |
WO2020213198A1 (ja) * | 2019-04-18 | 2020-10-22 | パナソニックIpマネジメント株式会社 | 無人飛行体、制御方法及びプログラム |
CN113056419A (zh) * | 2019-04-18 | 2021-06-29 | 松下知识产权经营株式会社 | 无人飞行体、控制方法以及程序 |
US12045069B2 (en) | 2019-04-18 | 2024-07-23 | Panasonic Intellectual Property Management Co., Ltd. | Unmanned aerial vehicle, control method, and recording medium |
KR20200129934A (ko) * | 2019-05-10 | 2020-11-18 | 네이버 주식회사 | 오디오-비주얼 데이터에 기반한 화자 분리 방법 및 장치 |
KR102230667B1 (ko) * | 2019-05-10 | 2021-03-22 | 네이버 주식회사 | 오디오-비주얼 데이터에 기반한 화자 분리 방법 및 장치 |
WO2022236002A1 (en) * | 2021-05-06 | 2022-11-10 | Bear Robotics, Inc. | Method, system, and non-transitory computer-readable recording medium for controlling a robot |
KR20220151517A (ko) * | 2021-05-06 | 2022-11-15 | 베어 로보틱스, 인크. | 로봇을 제어하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 |
KR102506113B1 (ko) * | 2021-05-06 | 2023-03-03 | 베어 로보틱스, 인크. | 로봇을 제어하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 |
US11934203B2 (en) | 2021-05-06 | 2024-03-19 | Bear Robotics, Inc. | Method, system, and non-transitory computer-readable recording medium for controlling a robot |
Also Published As
Publication number | Publication date |
---|---|
US7680667B2 (en) | 2010-03-16 |
JP4204541B2 (ja) | 2009-01-07 |
US20060143017A1 (en) | 2006-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4204541B2 (ja) | 対話型ロボット、対話型ロボットの音声認識方法および対話型ロボットの音声認識プログラム | |
JP4847022B2 (ja) | 発声内容認識装置 | |
JP4986433B2 (ja) | 物体を認識および追跡する装置及び方法 | |
JP6230726B2 (ja) | 音声認識装置および音声認識方法 | |
KR100754384B1 (ko) | 잡음에 강인한 화자위치 추정방법 및 장치와 이를 이용한카메라 제어시스템 | |
JP2018049143A (ja) | 音声取得システムおよび音声取得方法 | |
JP4715738B2 (ja) | 発話検出装置及び発話検出方法 | |
JP6467736B2 (ja) | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム | |
JP2006251266A (ja) | 視聴覚連携認識方法および装置 | |
JP4825552B2 (ja) | 音声認識装置、周波数スペクトル取得装置および音声認識方法 | |
JP2007264473A (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
JP2011191423A (ja) | 発話認識装置、発話認識方法 | |
KR100822880B1 (ko) | 지능형 로봇 환경에서 오디오-비디오 기반 음원추적을 통한화자 인식 시스템 및 방법 | |
WO2017000775A1 (zh) | 一种机器人语音寻向转动系统及方法 | |
KR20070061056A (ko) | 로봇 환경에서 음원 추적 시스템 및 방법 | |
JP6374936B2 (ja) | 音声認識方法、音声認識装置及びプログラム | |
JP6827536B2 (ja) | 音声認識装置および音声認識方法 | |
WO2020250828A1 (ja) | 発話区間検出装置、発話区間検出方法、および発話区間検出プログラム | |
US20150039314A1 (en) | Speech recognition method and apparatus based on sound mapping | |
JP2001067098A (ja) | 人物検出方法と人物検出機能搭載装置 | |
JP6916130B2 (ja) | 話者推定方法および話者推定装置 | |
US12051412B2 (en) | Control device, system, and control method | |
JP2021162685A (ja) | 発話区間検知装置、音声認識装置、発話区間検知システム、発話区間検知方法及び発話区間検知プログラム | |
JP5535746B2 (ja) | 音データ処理装置及び音データ処理方法 | |
JP5465166B2 (ja) | 発声内容認識装置および発声内容認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080624 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080825 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081007 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081014 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111024 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4204541 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111024 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111024 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121024 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131024 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |