JP7473002B2 - 情報処理装置及び情報処理方法 - Google Patents
情報処理装置及び情報処理方法 Download PDFInfo
- Publication number
- JP7473002B2 JP7473002B2 JP2022557209A JP2022557209A JP7473002B2 JP 7473002 B2 JP7473002 B2 JP 7473002B2 JP 2022557209 A JP2022557209 A JP 2022557209A JP 2022557209 A JP2022557209 A JP 2022557209A JP 7473002 B2 JP7473002 B2 JP 7473002B2
- Authority
- JP
- Japan
- Prior art keywords
- information processing
- operated
- voice data
- processing device
- gaze
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 80
- 238000003672 processing method Methods 0.000 title claims description 18
- 238000004378 air conditioning Methods 0.000 claims description 2
- 238000000034 method Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 12
- 238000001514 detection method Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000004397 blinking Effects 0.000 description 1
- 210000005252 bulbus oculi Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
- G10L15/25—Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60K—ARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
- B60K35/00—Instruments specially adapted for vehicles; Arrangement of instruments in or on vehicles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/013—Eye tracking input arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04845—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60K—ARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
- B60K2360/00—Indexing scheme associated with groups B60K35/00 or B60K37/00 relating to details of instruments or dashboards
- B60K2360/146—Instrument input by gesture
- B60K2360/1464—3D-gesture
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60K—ARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
- B60K2360/00—Indexing scheme associated with groups B60K35/00 or B60K37/00 relating to details of instruments or dashboards
- B60K2360/149—Instrument input by detecting viewing direction not otherwise provided for
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Mechanical Engineering (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Transportation (AREA)
- User Interface Of Digital Computer (AREA)
Description
図1を参照して、本実施形態に係る情報処理装置1の構成例を説明する。情報処理装置1は一例として車両に搭載される。図1に示すように情報処理装置1は、視線データ受付部21と、音声データ受付部22と、コントローラ100とを備える。その他、情報処理装置1は、記憶部25と、報知部300とを備えるものであってもよい。
次に、本実施形態に係る情報処理装置1の処理手順を、図2のフローチャートを参照して説明する。図2に示す情報処理装置1の処理は、所定の周期で繰り返し実行されるものであってもよいし、車両が走行中である場合にのみ実行されるものであってもよい。
以上詳細に説明したように、本実施形態に係る情報処理装置及び情報処理方法は、ユーザの視線方向に関する視線データを記憶し、音声データを取得した際、記憶された視線データに基づいて、複数の機器から操作対象機器を特定し、音声データに基づいて操作対象機器に対する制御コマンドを生成し、制御コマンドを操作対象機器に送信する。
11 視線検知装置
12 音声認識装置
21 視線データ受付部
22 音声データ受付部
25 記憶部
100 コントローラ
110 機器特定部
120 制御コマンド生成部
130 送信部
300 報知部
400 機器群
Claims (14)
- 視線データ受付部によって取得した、ユーザの視線方向に関する視線データを記憶する記憶装置と、
音声データが入力される音声データ受付部と、
コントローラと、を備え、
前記コントローラは、
前記音声データを取得した際、前記音声データに基づいて操作対象機器を特定できない場合に、前記視線データに基づいて前記操作対象機器を特定し、
前記音声データに基づいて前記操作対象機器に対する制御コマンドを生成し、
前記制御コマンドを前記操作対象機器に送信すること
を特徴とする情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記コントローラは、
前記音声データが入力されたタイミングの前記視線方向に基づいて、前記操作対象機器を特定すること
を特徴とする情報処理装置。 - 請求項1又は2に記載の情報処理装置であって、
前記コントローラは、
前記音声データが入力されたタイミングよりも過去の前記視線方向に基づいて、前記操作対象機器を特定すること
を特徴とする情報処理装置。 - 請求項3に記載の情報処理装置であって、
前記コントローラは、
前記音声データが入力されたタイミングよりも所定時間だけ過去の前記視線方向に基づいて、前記操作対象機器を特定すること
を特徴とする情報処理装置。 - 請求項1~4のいずれか一項に記載の情報処理装置であって、
前記コントローラは、
前記音声データが入力されたタイミングの前記視線方向に基づいて、前記操作対象機器を特定することができないと判定された場合に、前記音声データが入力されたタイミングよりも過去の前記視線方向に基づいて、前記操作対象機器を特定すること
を特徴とする情報処理装置。 - 請求項5に記載の情報処理装置であって、
前記コントローラは、
前記視線方向に基づいて前記操作対象機器として特定されうる機器が複数存在すると判定された場合に、前記視線方向よりも過去のタイミングにおける前記視線方向に基づいて、前記操作対象機器を特定すること
を特徴とする情報処理装置。 - 請求項1~6のいずれか一項に記載の情報処理装置であって、
前記コントローラは、複数の機器から前記操作対象機器を特定すること
を特徴とする情報処理装置。 - 請求項1~7のいずれか一項に記載の情報処理装置であって、
前記コントローラは、
前記視線方向に位置する機器を前記操作対象機器として特定すること
を特徴とする情報処理装置。 - 請求項1~8のいずれか一項に記載の情報処理装置であって、
前記コントローラは、
機器が前記視線方向に位置する頻度を算出し、
前記頻度に基づいて、前記機器を前記操作対象機器として特定すること
を特徴とする情報処理装置。 - 請求項1~9のいずれか一項に記載の情報処理装置であって、
前記コントローラは、
機器が前記視線方向に位置する時間を算出し、
前記時間に基づいて、前記機器を前記操作対象機器として特定すること
を特徴とする情報処理装置。 - 請求項1~10のいずれか一項に記載の情報処理装置であって、
前記操作対象機器は、ナビゲーション機器、ドアのロック制御機器、ウィンドウの開閉制御機器、撮像画像の表示機器、計器表示機器、空調装置、サンルーフ、サンシェード、オーディオ装置のうち少なくともいずれか1つを含むこと
を特徴とする情報処理装置。 - 請求項1~11のいずれか一項に記載の情報処理装置であって、
前記制御コマンドは、前記操作対象機器に表示される画像の拡大、縮小、回転、もしくは、移動、又は、前記操作対象機器のロックの解除、もしくは、施錠であること
を特徴とする情報処理装置。 - 請求項1~12のいずれか一項に記載の情報処理装置であって、
前記音声データは、前記操作対象機器に表示される画像の拡大、縮小、回転、もしくは、移動、又は、前記操作対象機器のロックの解除、もしくは、施錠のうち少なくともいずれか1つを指示するデータであること
を特徴とする情報処理装置。 - 視線データ受付部によって取得した、ユーザの視線方向に関する視線データを記憶し、
音声データ受付部から音声データを取得した際、前記音声データに基づいて操作対象機器を特定できない場合に、記憶された前記視線データに基づいて前記操作対象機器を特定し、
前記音声データに基づいて前記操作対象機器に対する制御コマンドを生成し、
前記制御コマンドを前記操作対象機器に送信すること
を特徴とする情報処理方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/IB2020/000891 WO2022084708A1 (ja) | 2020-10-22 | 2020-10-22 | 情報処理装置及び情報処理方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2022084708A1 JPWO2022084708A1 (ja) | 2022-04-28 |
JPWO2022084708A5 JPWO2022084708A5 (ja) | 2023-09-12 |
JP7473002B2 true JP7473002B2 (ja) | 2024-04-23 |
Family
ID=81290139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022557209A Active JP7473002B2 (ja) | 2020-10-22 | 2020-10-22 | 情報処理装置及び情報処理方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230377578A1 (ja) |
EP (1) | EP4234338A4 (ja) |
JP (1) | JP7473002B2 (ja) |
CN (1) | CN116323324A (ja) |
WO (1) | WO2022084708A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007038790A (ja) | 2005-08-02 | 2007-02-15 | Murakami Corp | 車両用ミラーの鏡面角度調整方法およびその装置 |
CN105204628A (zh) | 2015-09-01 | 2015-12-30 | 涂悦 | 一种基于视觉唤醒的语音控制方法 |
WO2017081960A1 (ja) | 2015-11-09 | 2017-05-18 | 三菱自動車工業株式会社 | 音声認識制御システム |
WO2019026616A1 (ja) | 2017-08-01 | 2019-02-07 | ソニー株式会社 | 情報処理装置および方法 |
WO2019142295A1 (ja) | 2018-01-18 | 2019-07-25 | 三菱電機株式会社 | 機器操作装置、機器操作システムおよび機器操作方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6739907B2 (ja) * | 2015-06-18 | 2020-08-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器特定方法、機器特定装置及びプログラム |
JP2017159692A (ja) | 2016-03-07 | 2017-09-14 | トヨタ自動車株式会社 | 車両用入力装置 |
-
2020
- 2020-10-22 EP EP20958582.7A patent/EP4234338A4/en active Pending
- 2020-10-22 WO PCT/IB2020/000891 patent/WO2022084708A1/ja active Application Filing
- 2020-10-22 JP JP2022557209A patent/JP7473002B2/ja active Active
- 2020-10-22 CN CN202080105925.6A patent/CN116323324A/zh active Pending
- 2020-10-22 US US18/030,382 patent/US20230377578A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007038790A (ja) | 2005-08-02 | 2007-02-15 | Murakami Corp | 車両用ミラーの鏡面角度調整方法およびその装置 |
CN105204628A (zh) | 2015-09-01 | 2015-12-30 | 涂悦 | 一种基于视觉唤醒的语音控制方法 |
WO2017081960A1 (ja) | 2015-11-09 | 2017-05-18 | 三菱自動車工業株式会社 | 音声認識制御システム |
WO2019026616A1 (ja) | 2017-08-01 | 2019-02-07 | ソニー株式会社 | 情報処理装置および方法 |
WO2019142295A1 (ja) | 2018-01-18 | 2019-07-25 | 三菱電機株式会社 | 機器操作装置、機器操作システムおよび機器操作方法 |
Also Published As
Publication number | Publication date |
---|---|
US20230377578A1 (en) | 2023-11-23 |
EP4234338A1 (en) | 2023-08-30 |
JPWO2022084708A1 (ja) | 2022-04-28 |
EP4234338A4 (en) | 2023-12-20 |
CN116323324A (zh) | 2023-06-23 |
WO2022084708A1 (ja) | 2022-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7522177B2 (ja) | マルチモーダルユーザインターフェース | |
US10417510B2 (en) | System, methods, and apparatus for in-vehicle fiducial mark tracking and interpretation | |
EP3237256B1 (en) | Controlling a vehicle | |
CN110166896B (zh) | 语音提供方法、语音提供系统和服务器 | |
EP3168839B1 (en) | Voice recognition device and voice recognition system | |
JP6584731B2 (ja) | ジェスチャ操作装置及びジェスチャ操作方法 | |
JPWO2015125243A1 (ja) | 表示制御装置、表示制御装置の表示制御方法、視線方向検出システムおよび視線方向検出システムのキャリブレーション制御方法 | |
US9275274B2 (en) | System and method for identifying handwriting gestures in an in-vehicle information system | |
KR101736109B1 (ko) | 음성인식 장치, 이를 포함하는 차량, 및 그 제어방법 | |
JP7091983B2 (ja) | 機器制御装置 | |
US10490188B2 (en) | System and method for language selection | |
US10655981B2 (en) | Method for updating parking area information in a navigation system and navigation system | |
CN110556113A (zh) | 基于声纹识别的车辆控制方法与云端服务器 | |
US11996099B2 (en) | Dialogue system, vehicle, and method of controlling dialogue system | |
JP7473002B2 (ja) | 情報処理装置及び情報処理方法 | |
CN113157080A (zh) | 用于车辆的指令输入方法、存储介质、系统及车辆 | |
KR20160117403A (ko) | 차량 및 그 제어방법 | |
CN107848489B (zh) | 借助移动设备激活交通工具动作 | |
CN115649109B (zh) | 基于智能汽车手环的汽车控制方法、系统及存储介质 | |
US20230365141A1 (en) | Information processing device and information processing method | |
JP2018501998A (ja) | 自動車の機器を制御するためのシステムおよび方法 | |
CN113990318A (zh) | 控制方法、装置、车载终端、车辆和存储介质 | |
US20200218347A1 (en) | Control system, vehicle and method for controlling multiple facilities | |
US20230206918A1 (en) | Speech Recognition System and Method for Providing Speech Recognition Service | |
EP4174636A1 (en) | Information processing device and information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A5211 Effective date: 20230411 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230411 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7473002 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |