WO2013153583A1 - 車載用音声入力装置 - Google Patents

車載用音声入力装置 Download PDF

Info

Publication number
WO2013153583A1
WO2013153583A1 PCT/JP2012/002588 JP2012002588W WO2013153583A1 WO 2013153583 A1 WO2013153583 A1 WO 2013153583A1 JP 2012002588 W JP2012002588 W JP 2012002588W WO 2013153583 A1 WO2013153583 A1 WO 2013153583A1
Authority
WO
WIPO (PCT)
Prior art keywords
unit
voice
voice acquisition
acquisition control
passenger
Prior art date
Application number
PCT/JP2012/002588
Other languages
English (en)
French (fr)
Inventor
尚嘉 竹裏
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to JP2014509908A priority Critical patent/JPWO2013153583A1/ja
Priority to PCT/JP2012/002588 priority patent/WO2013153583A1/ja
Publication of WO2013153583A1 publication Critical patent/WO2013153583A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Definitions

  • the present invention relates to an in-vehicle voice input device such as a car navigation device that can accept a voice input of a passenger in a vehicle.
  • Patent Document 1 An audio processing apparatus that collects audio with low noise is known (see, for example, Patent Document 1).
  • Patent Document 2 also discloses a voice recognition system using a camera.
  • Patent Documents 1 and 2 for example, a camera, which is an expensive device, is required to specify the direction and position of the speaker in the vehicle. There is a problem that the configuration of the system becomes complicated.
  • the present invention has been made to solve the above-described problems, eliminates the need for adding an expensive device such as a camera, and is obtained from a touch panel or a switch that is a general component of a car navigation system or the like. It is an object of the present invention to provide an in-vehicle voice input device that can specify the direction of a speaker using information that can be performed and control the sound collection direction of a microphone according to the specified direction.
  • an in-vehicle audio input device starts an audio acquisition unit that acquires audio uttered by a passenger in a vehicle interior and controls the audio acquisition unit according to the operation of the passenger
  • a voice acquisition control start instruction unit that outputs an instruction to perform
  • an operator position specifying unit that specifies the position of the passenger who operated the voice acquisition control start instruction unit
  • an instruction from the voice acquisition control start instruction unit And a voice acquisition control unit that controls a sound collection direction or gain of the voice acquisition unit according to the position of the passenger specified by the operator position specifying unit.
  • the position (direction) of the operator (speaker) is determined using information that can be acquired from a touch panel, a switch (button), or the like, which is a general component such as a car navigation system. Since the sound collection direction or gain is controlled according to the specified position, it is possible to collect low-noise sound without adding expensive devices or complicated configurations. The S / N ratio can be increased.
  • FIG. 1 is a block diagram showing a general configuration example of an in-vehicle voice input device capable of receiving a passenger's voice input in a vehicle and a car navigation system using the same. It is an example of a screen which shows the state by which the audio
  • FIG. 7 is an example of the inside of a vehicle on which the car navigation system shown in FIG. 6 is mounted, and is a diagram showing a relationship with a sound collection direction when a passenger in the passenger seat operates a button.
  • FIG. 12 is an example of the inside of a vehicle in which the car navigation system shown in FIG.
  • FIG. 12 is another example inside the vehicle on which the car navigation system shown in FIG. 11 is mounted, and is a diagram showing the relationship between the position of the operator, the sound collection direction and the gain (gain) of the sound acquisition unit.
  • FIG. 12 is still another example of the interior of the vehicle on which the car navigation system shown in FIG.
  • FIG. 11 is mounted, and is a diagram showing the relationship between the position of the operator, the sound collection direction and the gain (gain) of the sound acquisition unit.
  • 10 is a flowchart for explaining processing of a voice acquisition control unit in the in-vehicle voice input device according to the second embodiment. It is a block diagram which shows the structural example of the vehicle-mounted audio
  • FIG. 19 is an example of the inside of a vehicle in which the car navigation system shown in FIG.
  • FIG. 19 is another example inside the vehicle on which the car navigation system shown in FIG. 18 is mounted, and is a diagram showing a relationship between the position of the operator, the sound collection direction of the sound acquisition unit, and the gain.
  • FIG. 22 is an example of the inside of the vehicle on which the car navigation system shown in FIG. 21 is mounted, and is a diagram showing the relationship between the position of the operator and the sound collection direction of the sound acquisition unit.
  • 14 is a flowchart for explaining processing of a voice acquisition control unit in the in-vehicle voice input device according to the fourth embodiment.
  • FIG. 22 it is a figure which shows the relationship with the audio
  • FIG. 26 is an example of the inside of the vehicle on which the car navigation system shown in FIG. 25 is mounted, and is a diagram showing the relationship between the position of the operator and the sound collection direction of the sound acquisition unit. It is the table which matched the position of an operator, and a voice acquisition part. 10 is a flowchart illustrating processing of a voice acquisition control unit in the in-vehicle voice input device according to the fifth embodiment.
  • FIG. 1 is a block diagram illustrating a general configuration example of an in-vehicle voice input device capable of receiving a voice input of a passenger in a vehicle and a car navigation system using the same.
  • the car navigation system includes a display unit 1, a voice acquisition control start instruction unit 2, a voice acquisition unit 4, a voice recognition unit 6, a voice output unit 7, and a navigation unit 8.
  • the display unit 1, the voice acquisition control start instruction unit 2, the voice acquisition unit 4, and the voice recognition unit 6 constitute an in-vehicle voice input device 10.
  • the display unit 1 is a display-integrated touch panel, and includes, for example, an LCD (Liquid Crystal Display) and a touch sensor. A map and a vehicle position are displayed according to a display signal sent from a navigation unit 8 described later. An indication to the navigation unit 8 can be input by displaying a mark or the like, or by directly touching the display unit (touch panel) 1 by the passenger.
  • the voice acquisition control start instruction unit 2 outputs a recognition start instruction signal to the voice recognition unit 6 to be described later in accordance with the operation of the passenger.
  • the voice acquisition control start instruction unit 2 displays a voice acquisition control start button 9 on the display unit (touch panel) 1 as shown in FIG. 2, for example, and outputs a signal when the touch type button is pressed. To do.
  • the voice recognition unit 6 is a telephone device such as a mobile phone
  • the voice acquisition control start instruction unit 2 outputs a call start instruction signal.
  • the voice acquisition unit 4 is a microphone that acquires (sound collection) the voice uttered by the passenger in the passenger compartment.
  • the voice acquisition unit 4 collects the passenger utterance and performs A / D conversion (Analog / Digital Conversion), for example, PCM ( Pulse (Code Modulation) format.
  • a / D conversion Analog / Digital Conversion
  • PCM Pulse (Code Modulation) format.
  • an array microphone in which a plurality of omnidirectional (or omnidirectional) microphones are arranged in an array to adjust the directivity, and the directivity is only in one direction. Some unidirectional microphones cannot be adjusted.
  • these microphones increase the voice gain by increasing the gain when the distance to the passenger is far, and lower the gain by reducing the gain to prevent howling when the distance to the passenger is close. For example, the gain can be adjusted.
  • the voice recognition unit 6 has a recognition dictionary (not shown), detects a voice section corresponding to the content spoken by the passenger from the voice data converted by the voice acquisition unit 4, extracts a feature amount, Based on the feature amount, speech recognition processing is performed using a recognition dictionary.
  • the voice output unit 7 is a speaker, and outputs a guidance voice or a synthesized voice according to a voice signal transmitted from the navigation unit 8.
  • the navigation unit 8 controls the entire car navigation system. For example, in response to an instruction from a remote control (not shown) or a touch button on the display unit (touch panel) 1, a route search to a destination or a facility search is performed, a vehicle speed sensor or a gyro sensor (not shown). ) On the basis of information from the vehicle, the map position or the vehicle position mark display signal is transmitted to the display unit (touch panel) 1, or the recognition result output by the voice recognition unit 6. The operation corresponding to is identified and executed.
  • FIG. 3 is a diagram showing an example of the interior of the vehicle on which the car navigation system shown in FIG. 1 is mounted.
  • voice acquisition part 4 may be installed on the dashboard as shown, for example in FIG. 3, for example, may be installed in the rear-view mirror.
  • the sound collection direction of the voice acquisition unit 4 is fixed and set in the direction of the driver as shown in FIG.
  • the S / N ratio of the collected voice is increased and the recognition rate in the voice recognition unit 6 is increased. Get higher.
  • the voice acquisition unit 4 collects sound as shown in FIG. Speaking from a direction different from the direction, and many voices other than the voice uttered by the passenger seat are collected, so the S / N ratio of the collected voice becomes small and the passenger seat person The recognition rate of the emitted voice in the voice recognition unit 6 is low.
  • the sound collection direction of the sound acquisition unit 4 is one direction, depending on the operator of the sound acquisition control start instruction unit 2 (operated passenger), the S of the sound collected by the sound acquisition unit 4 The / N ratio becomes smaller and the recognition rate in the speech recognition unit 6 becomes lower.
  • the invention according to the first embodiment is based on the position of the passenger who operated the voice acquisition control start instruction unit 2 (whether it is a passenger seat or a driver seat, or in the case of a driver seat, a position close to the microphone).
  • the voice acquisition unit 4 controls the sound collection direction to be the direction of the specified position, and the voice acquisition control.
  • the voice uttered by the operator (operating passenger) of the start unit 2 can be recognized with a high recognition rate.
  • FIG. 6 is a block diagram showing an example of a vehicle-mounted voice input device and a car navigation system using the same according to Embodiment 1 of the present invention.
  • the in-vehicle voice input device 20 in the first embodiment includes a display unit (touch panel) 1, a voice acquisition control start instruction unit 22, a voice acquisition control unit 23, a voice acquisition unit 24, and an operator position specifying unit 21. And a voice recognition unit 6.
  • the sound acquisition unit 24 is an array microphone in which a plurality of omnidirectional (or omnidirectional) microphones are arranged in an array so that directivity characteristics can be adjusted, or unidirectional having directivity only in one direction.
  • the microphone is a microphone in which the directivity can be adjusted by providing a rotation mechanism in which the sound collection unit of the microphone can rotate or swing.
  • these microphones increase the gain by increasing the gain when the distance to the passenger is long, and increase the gain to prevent howling when the distance to the passenger is short. Adjustment may also be possible.
  • FIG. 7 is a diagram illustrating an example of a case where the sound acquisition unit 24 is a unidirectional microphone including a rotation mechanism that can rotate or swing. This is because the unidirectional microphone has a neck portion 11, and the neck portion 11 includes a rotation mechanism such as an appropriate gear and a motor (not shown), and is rotated or rocked by the rotation mechanism. is there.
  • the operator position specifying unit 21 detects a change in the output value of the touch sensor due to the proximity and contact of the passenger's finger with respect to the voice acquisition control start button or the like displayed on the display unit (touch panel) 1, and detects the detected information.
  • the position of the passenger (finger operator) is specified by determining the arrival direction of the passenger's finger based on the determination. That is, for example, when the display unit (touch panel) 1 of the car navigation system is provided near the center of the dashboard in the vehicle, the passenger who operates the display unit (touch panel) 1 sits in the driver seat or the passenger seat. Therefore, the passenger determines which seat the driver's finger has come from, based on the change in the output value of the touch sensor. It is possible to specify whether the passenger is located in the area.
  • the voice acquisition control start instruction unit 22 is a process different from the voice acquisition control start instruction unit 2, and outputs a recognition start instruction signal to the voice recognition unit 6 and A control start instruction signal to be described later is output.
  • the voice acquisition control unit 23 receives the signal output from the voice acquisition control start instruction unit 22, the voice acquisition control start instruction unit 22 specified by the operator position specifying unit 21 indicates the sound collection direction of the voice acquisition unit 24. The direction is controlled according to the position of the operator. If the sound acquisition unit 24 is an array microphone whose directivity characteristics can be adjusted, the sound acquisition control unit 23 may control the sound collection direction or gain based on the characteristics of the array microphone. Good.
  • the sound acquisition unit 24 is a unidirectional microphone whose sound collection unit can rotate or swing as shown in FIG.
  • the sound acquisition control unit 23 sets the neck 11 to the operator.
  • the sound collection direction or gain of the microphone is controlled by rotating or swinging the sound collection unit of the microphone by rotating the operator in the direction of the operator acquired from the position specifying unit 21 by a predetermined angle. do it.
  • the change angle of the sound collection direction of the voice acquisition unit 24 may be registered for each operator, and the change angle may be changed according to the operator.
  • FIG. 8 is a flowchart for explaining processing of the operator position specifying unit 21 in the in-vehicle voice input device 20 according to the first embodiment.
  • FIG. 9 is a flowchart for explaining processing of the voice acquisition control unit 23 in the in-vehicle voice input device 20 according to the first embodiment.
  • the voice acquisition control unit 23 acquires the operator's position from the operator position specifying unit 21 (step S11). ST12).
  • the process waits until the position of the operator can be acquired.
  • the voice acquisition control unit 23 sets the sound collection direction of the voice acquisition unit 24 to the operator's position direction acquired from the operator position specifying unit 21. Change (step ST13).
  • the operator position is specified by the operator position specifying unit 21 as “driver's seat (left)”. Is identified.
  • the sound acquisition control unit 23 changes the sound collection direction of the sound acquisition unit 24 by a predetermined angle that is predetermined in the left direction (the direction of the driver's seat) as viewed from the sound acquisition unit 24.
  • the position of the operator is specified as “front passenger seat (right)” by the operator position specifying section 21.
  • the sound collection direction of the sound acquisition unit 24 is predetermined by the sound acquisition control unit 23 in the right direction (passenger seat direction) as viewed from the sound acquisition unit 24. It is changed by a predetermined angle.
  • one voice acquisition control start instruction unit 22 is provided on the display unit (touch panel) 1 and is operated from the driver's seat side.
  • the operator position specifying unit 21 specifies whether the operation is performed from the passenger seat side, and the sound acquisition control unit 23 changes the sound collection direction of the sound acquisition unit 24 according to the specified position of the operator.
  • the recognition rate of voices uttered by passengers in the front passenger seat is not lowered as in the past, and speech recognition is performed at a high recognition rate even when the user speaks by operating from any position (direction). be able to.
  • the sound acquisition unit 24 is capable of adjusting the sound collection direction, and the sound acquisition unit 24 is described as adjusting the sound collection direction according to the position of the operator.
  • the sound acquisition unit 24 is a unidirectional microphone. Even so long as the gain can be adjusted.
  • the sound acquisition unit 24 is installed with the sound collection direction directed toward the driver's seat as shown in FIG. 4, and the operator's position (direction) is the driver's seat. If the direction is the direction, the gain (gain) is decreased, and if the direction is the passenger seat direction, the gain (gain) is increased, so that the recognition rate of the voice uttered by the passenger seat can be increased. (See Embodiment 3 below)
  • the position (direction) of the operator (speaker) using information that can be acquired from the touch panel, which is a general component of the car navigation system.
  • the sound collection direction or gain of the microphone is controlled according to the specified position, so it is possible to collect low-noise sound without adding an expensive device or a complicated configuration.
  • the sound can be increased and the S / N ratio can be increased.
  • FIG. FIG. 11 is a block diagram showing a configuration example of an in-vehicle voice input device and a car navigation system using the same according to Embodiment 2 of the present invention.
  • the in-vehicle voice input device 30 includes a voice acquisition control start instruction unit 32 (32 (a), 32 (b),...), A voice acquisition control unit 33, and a voice acquisition unit 34.
  • the operator position specifying unit 31 is configured.
  • the voice acquisition control start instruction unit 32 includes a plurality (two or more) of voice acquisition control start instruction units 32 (a), 32 (b),... (A), 32 (b),..., In the same way as the voice acquisition control start instruction unit 22 in the first embodiment, a recognition start instruction signal to the voice recognition unit 6 according to the operation of the passenger. In addition to outputting, an instruction signal for starting voice acquisition control is output to the voice acquisition controller 33.
  • the operator position specifying unit 31 holds a table in which the position of the operator is associated with each voice acquisition control start instruction unit, and is output by the voice acquisition control start instruction unit 32.
  • a signal is received, which of the plurality (two or more) of voice acquisition control start instruction units 32 (a), 32 (b),... Has been pressed. Based on the above, the position of the operator is specified with reference to the table.
  • the voice acquisition control unit 33 holds a table in which the position of the operator is associated with the sound collection direction and gain of the voice acquisition unit 34, and the voice acquisition control start instruction unit
  • the sound collection direction and gain corresponding to the position specified by the operator position specifying unit 31 are acquired with reference to the table, and the sound acquisition of the sound acquisition unit 34 is acquired.
  • Control of the sound collection direction for changing the direction to the acquired direction and control of the gain for changing the gain of the sound acquisition unit 34 to the acquired state are performed.
  • the sound collection direction is represented by, for example, the amount of change in angle from the front of the sound acquisition unit 34 as 0 degree.
  • the sound acquisition unit 34 is an array microphone in which a plurality of omnidirectional (or omnidirectional) microphones are arranged in an array and the directivity characteristics can be adjusted, or a single microphone having directivity only in one direction.
  • a microphone that can adjust the directivity by providing a rotating mechanism that can rotate or swing the unidirectional microphone's sound collection unit, and by increasing the gain when the distance to the passenger is long Although it is assumed that the gain can be adjusted by increasing the voice gain and reducing the gain to prevent howling when the distance to the passenger is short, at least directivity (sound collecting direction) or gain (gain) Any one of these can be adjusted.
  • the table (FIG. 13) held by the voice acquisition control unit 33 is also in the position of the operator.
  • the sound acquisition control unit 33 may control any one (adjustable one) acquired from the table.
  • FIG. 14 shows an example of the interior of the vehicle in which the car navigation system shown in FIG. 11 is installed.
  • the voice acquisition control start instruction unit 32 is a physical operation button (voice acquisition control) provided near the screen on the passenger seat side.
  • the position and sound collection direction of the operator in the case of the start instruction unit 32 (a)) and physical operation buttons (sound acquisition control start instruction unit 32 (b)) provided near the screen on the driver's seat side It is a figure which shows the relationship with gain (gain).
  • gain gain
  • the voice acquisition control unit 33 controls the sound collection direction of the voice acquisition unit 34 to be the direction indicated by the arrow B at 30 degrees to the left.
  • the expressions “right” and “left” refer to the right and left as viewed from the voice acquisition unit 34. Therefore, in FIG. 14, the arrow A is 30 degrees to the left from the 0 degree line, and the arrow B Is 30 degrees to the right from the 0 degree line.
  • FIG. 15 shows another example of the interior of the vehicle on which the car navigation system shown in FIG. 11 is mounted.
  • the voice acquisition control start instruction unit 32 is a physical operation button (voice) provided near the passenger side screen.
  • the position and sound collection of the operator in the case of the acquisition control start instruction unit 32 (a)) and physical operation buttons (sound acquisition control start instruction unit 32 (c)) provided on the driver's side handle It is a figure which shows the relationship between a direction and a gain (gain).
  • the voice acquisition control start instruction unit 32 (a) for passengers in the passenger seat is pressed, the sound collection direction of the voice acquisition unit 34 is the direction indicated by the arrow A of 30 degrees to the left, and for the driver.
  • the voice acquisition direction of the voice acquisition unit 34 is the direction indicated by the arrow C at 45 degrees to the right (in FIG. 15). Is controlled by the voice acquisition control unit 33 so that the direction is 45 degrees to the right.
  • the lengths of arrows A and C indicate the respective gains. That is, when an operation button (32 (a) provided near the screen or 32 (b) shown in FIG. 14) is pressed, it is considered that the operator is slightly close to the microphone. When the operation button (32 (c)) provided on the handle is pressed down so that the microphone gain is reduced, the operator (driver) remains facing the front without approaching the microphone. Since it is considered that the user is speaking, control is performed to increase the gain of the microphone so that sound can be acquired firmly.
  • the microphone gain when the operation button (32 (c)) provided on the handle is pressed is set as a default value, and the operation button (32 (a) provided near the screen or shown in FIG. When 32 (b)) is pressed, the control is performed to lower the default value (see the table in FIG. 13).
  • FIG. 16 shows still another example of the interior of the vehicle on which the car navigation system shown in FIG. 11 is mounted.
  • the voice acquisition control start instruction unit 32 is a physical operation button (near the screen on the driver's seat side).
  • the voice acquisition control start instruction unit 32 (b)) and the physical operation buttons (sound acquisition control start instruction unit 32 (c)) provided on the driver's seat side handle It is a figure which shows the relationship between a sound direction and a gain (gain).
  • the voice acquisition control start instruction unit 32 (b) provided near the screen is pressed, the sound collection direction of the voice acquisition unit 34 is the direction indicated by the arrow B at 30 degrees to the left and is provided on the handle.
  • the voice acquisition control start instruction unit 32 (c) When the voice acquisition control start instruction unit 32 (c) is pressed, the voice acquisition control unit 33 controls the sound collection direction of the voice acquisition unit 34 to be the direction indicated by the arrow C at 45 degrees to the left.
  • the voice acquisition control start instruction unit 32 is a physical operation button (near the screen
  • the lengths of the arrows B and C indicate the respective gains. That is, when the operation button 32 (b) provided near the screen is pressed, the gain of the microphone is lowered, and when the operation button 32 (c) provided on the handle is pressed, the microphone gain is reduced. Is controlled to raise.
  • the sound collection direction and the gain (gain) of the sound acquisition unit 34 are controlled according to the operator position, but at least the sound collection direction or the gain (gain) is described. If any one of them is controlled, the effect of the present invention can be obtained, and either one or both may be controlled in accordance with the function of the voice acquisition unit 34.
  • FIG. 17 is a flowchart for explaining processing of the voice acquisition control unit 33 in the in-vehicle voice input device according to the second embodiment.
  • step ST21 and step ST22 are the same as step ST11 and step ST12 in FIG. 9 of Embodiment 1, description is abbreviate
  • the voice acquisition control unit 33 refers to the table in FIG.
  • the sound collection direction and gain corresponding to the operator's position acquired from the specifying unit 31 are acquired (step ST23).
  • step ST24 If the corresponding sound collection direction or gain (gain) can be acquired (YES in step ST24), the sound acquisition control unit 33 changes the sound collection direction of the sound acquisition unit 34 to the acquired sound collection direction, and / or Alternatively, the gain of the voice acquisition unit 34 is adjusted to the acquired gain (gain) (step ST25). On the other hand, if the corresponding sound collection direction and gain (gain) cannot be acquired (NO in step ST24), the process is terminated as it is.
  • the sound acquisition unit 34 is an array microphone that can control directivity, but for example, the sound acquisition unit 34 is a unidirectional microphone that cannot control directivity.
  • 7 has a neck portion, and the neck portion is rotated by an appropriate gear, a motor, or the like (not shown), and the voice acquisition control unit 33 acquires the neck portion from the operator position specifying unit 31. It is good also as a structure rotated only a predetermined angle to the operator direction.
  • the sound collection direction of the voice acquisition unit 34 may be registered for each operator, and the sound collection direction may be changed according to the operator.
  • a plurality of voice acquisition control start instructing units 32 are provided, and depending on which operation button is pressed, whether the operation is performed from the passenger seat side or driving Whether it is operated from the seat side, or if the operator is a driver, is operating at a position approaching the voice acquisition unit 34, or is operating at a position facing the front without approaching the voice acquisition unit
  • the operator position specifying unit 31 specifies and the sound acquisition control unit 33 changes the sound collection direction and / or gain (gain) of the sound acquisition unit 34 according to the specified operator position,
  • the recognition rate of voices uttered by passengers in the front passenger seat is not lowered as in the past, and speech recognition is performed at a high recognition rate even when speaking from any position (direction). Can do.
  • the operator can use information that can be acquired from the voice acquisition control start instruction unit (operation button) that is a general component of the car navigation system.
  • the position (direction) of the (speaker) is specified, the sound collection direction or gain of the voice acquisition unit is associated with the specified position, and the voice acquisition control start instruction unit (operation button) is operated.
  • the sound acquisition direction of the sound acquisition unit is changed to the corresponding direction, or the gain (gain) of the sound acquisition unit is controlled to be changed to the corresponding gain.
  • the voice acquisition control start instruction units 32 (a) and 32 (b) are described as physical operation buttons provided in the vicinity of the screen. Needless to say, it may be a soft switch provided on the display unit (touch panel) 1 as in the third embodiment.
  • FIG. FIG. 18 is a block diagram showing a configuration example of an in-vehicle voice input device and a car navigation system using the same according to Embodiment 3 of the present invention.
  • the in-vehicle voice input device 40 includes a display unit (touch panel) 1, a voice acquisition control start instruction unit 32 (32 (a), 32 (b),...), And a voice acquisition control unit. 43, a voice acquisition unit 44, and an operator position specifying unit 31.
  • the voice acquisition unit 44 is a unidirectional microphone whose directivity cannot be controlled, and the third embodiment is a device dedicated to voice input by a driver. That is, the voice acquisition unit 44 is a microphone that is installed in advance so that the sound collection direction faces the direction of the driver's seat, and can adjust only the gain. Then, the voice acquisition control unit 43 faces the front of the driver who is the operator of the voice acquisition control start instruction unit 32 (a position approaching the voice acquisition unit 44 or not approaching the voice acquisition unit 44. Position), that is, according to the position of the operator specified by the operator position specifying unit 31, the gain of the voice acquisition unit 44 is controlled.
  • FIG. 19 is an example of the inside of a vehicle on which a car navigation system is mounted.
  • two voice acquisition control start instruction units 32 are provided, one (voice acquisition control start instruction unit 32 (b)) is displayed on the display unit (touch panel) 1 and the other (voice acquisition control start unit 32).
  • the start instruction unit 32 (c) is installed on the handle.
  • the sound collection direction of the voice acquisition unit 44 is fixed and set in the direction of the driver as shown in FIG. Note that the voice acquisition control start instruction unit 32 (b) does not need to be displayed on the display unit (touch panel) 1, and may be installed in the car navigation body as a hard key, for example.
  • the driver presses the voice acquisition control start instruction unit 32 (b) on the display unit (touch panel) 1 to perform voice operation and speaks, the driver acquires the voice acquisition unit 44 as shown in FIG. Speaking in the direction of sound collection.
  • the driver presses the voice acquisition control start instruction unit 32 (c) on the steering wheel to perform a voice operation and speaks, the driver usually speaks facing the front as shown in FIG.
  • the S / N ratio of the collected voice becomes small and the recognition rate in the voice recognition unit 6 becomes low.
  • the voice acquisition control start unit 32 since the direction in which the operator speaks is changed by the voice acquisition control start unit 32 to be operated, the S / N ratio of the voice collected by the voice acquisition unit 44 is reduced, and the recognition rate in the voice recognition unit 6 is increased. In some cases, it becomes lower.
  • the gain of the voice acquisition unit 44 is lowered, as shown in FIG.
  • the gain of the voice acquisition unit 44 is controlled so as to increase the gain of the voice acquisition unit 44.
  • arrows B and C ′ in FIGS. 19 and 20 indicate the sound collection direction and the magnitude of the gain (gain) of the sound acquisition unit 44, and both have the same sound collection direction, but the gain ( The magnitude of the gain) is larger in the arrow C ′ than in the arrow B.
  • the gain of the voice acquisition unit 44 is set. By raising it, the speech recognition rate can be increased.
  • the operator can use information that can be acquired from the voice acquisition control start instruction unit (operation button) that is a general component of the car navigation system.
  • the voice acquisition control start instruction unit (operation button) When the position (direction) of the (speaker) is specified, the gain (gain) of the voice acquisition unit is associated with the specified position, and the voice acquisition control start instruction unit (operation button) is operated, The gain (gain) of the voice acquisition unit was changed to the corresponding gain and controlled so as to be able to collect sound, so noise was not added without adding an expensive device or a complicated configuration. Less voice can be collected and the S / N ratio can be increased.
  • FIG. FIG. 21 is a block diagram showing a configuration example of an in-vehicle voice input device and a car navigation system using the same according to Embodiment 4 of the present invention.
  • each of the voice acquisition units is a unidirectional microphone whose directivity characteristics cannot be controlled, and a plurality of voice acquisition units 54 (54 (a), 54 (b),. ⁇ ⁇ ).
  • the processing of the voice acquisition control unit 53 is also different from the processing of the voice acquisition control unit 23 in the first embodiment (described later).
  • the voice acquisition unit 54 includes a plurality of voice acquisition units 54 (a), 54 (b),..., Each of which is a unidirectional microphone that cannot control directivity characteristics. And each audio
  • the voice acquisition control unit 53 holds a table (not shown) in which the position of the operator and the voice acquisition unit 54 are associated with each other.
  • a signal for validating the voice data collected by the voice acquisition unit 54 corresponding to the position specified by the operator position specifying unit 21 is output.
  • the voice recognition unit 6 receives the signal for starting recognition, the voice recognition unit 6 is the voice data acquired by the voice acquisition units 54 (a), 54 (b),..., And has been validated by the voice acquisition control unit 53. Recognize using the object.
  • FIG. 23 is a flowchart for explaining processing of the voice acquisition control unit 53 in the in-vehicle voice input device according to the fourth embodiment.
  • step ST31 and step ST32 are the same as step ST11 and step ST12 in FIG. 9 of Embodiment 1, description is abbreviate
  • the voice acquisition control start instructing unit 22 being pressed, if the operator position is specified by the operator position specifying unit 21, the voice acquisition control unit 53 refers to the table (not shown). Then, a signal for validating the voice data collected by the voice acquisition unit 54 corresponding to the position of the operator acquired from the operator position specifying unit 21 is output (step ST33).
  • the operator position specifying unit 21 specifies the position of the operator as “left”. Then, a voice acquisition unit corresponding to the position of the operator, that is, a voice acquisition unit 54 (b) installed in advance so that the sound collection direction is the “left” driver direction B, is a voice acquisition control unit. A signal for validating the voice data collected by the head 53 is output.
  • the voice acquisition unit 54 can adjust the gain, the sound collection direction or gain (gain) of the voice acquisition units 54 (a), 54 (b),.
  • the position of the operator specified by the operator position specifying unit 21 by arranging the sound collecting direction or gain corresponding to the position of the operator specified by the operator position specifying unit 21. The gain (gain) can be adjusted accordingly.
  • the position (direction) of the operator (speaker) using information that can be acquired from the touch panel, which is a general component of the car navigation system.
  • the audio data collected from the microphone corresponding to the specified position is controlled to be effective, so noise can be added without adding an expensive device or a complicated configuration. Therefore, it is possible to use a voice with a small S / N ratio.
  • FIG. FIG. 25 is a block diagram showing a configuration example of an in-vehicle voice input device and a car navigation system using the same according to the fifth embodiment of the present invention.
  • the same components as those described in the first to fourth embodiments are denoted by the same reference numerals, and redundant description is omitted.
  • the fifth embodiment may be a unidirectional microphone in which the directivity characteristics cannot be controlled even if the voice acquisition unit is an array microphone. (64 (a), 64 (b),). Accordingly, the processing of the voice acquisition control unit 63 is also different from the processing of the voice acquisition control unit 33 in the second and third embodiments (described later).
  • the voice acquisition unit 64 is composed of a plurality of voice acquisition units 64 (a), 64 (b),..., Each of which is a single directivity whose directivity characteristics cannot be controlled even with an array microphone as described above. It may be a sex microphone.
  • Each voice acquisition unit 64 (64 (a), 64 (b),%) Corresponds to each voice acquisition control start instruction unit 32 (32 (a), 32 (b),). Is installed. Further, each of the sound acquisition units 64 (a), 64 (b),... May be capable of adjusting a gain (gain).
  • “installed so as to correspond to the voice acquisition control start instruction unit 32” means that when the voice acquisition control start instruction unit 32 is operated, the face of the operated operator faces and the sound collection direction is It is to be installed so that it faces the direction of the operator.
  • voice acquisition control start instruction units 32 (b) and 32 (c) are arranged.
  • the driver operator of the voice acquisition control start instruction unit 32
  • the voice acquisition control start instruction unit 32 (b) operates the voice acquisition control start instruction unit 32 (b) on the display unit (touch panel) 1
  • the driver is in the direction of the screen (display unit 1). Therefore, the voice acquisition unit 64 (b) is installed so that the driver's face faces and the sound collection direction faces the driver's direction (B direction).
  • the driver operates the voice acquisition control start instruction unit 32 (c) provided on the steering wheel, the driver faces the front, so that the driver's face faces and the sound collection direction is the driving direction.
  • the voice acquisition unit 64 (c) is installed so as to face the hand (C ′′ direction).
  • the voice acquisition control unit 63 holds a table representing the correspondence between the operator position and the voice acquisition unit 64, and the signal output by the voice acquisition control start instruction unit 32. Is received, a signal for validating the voice data collected by the corresponding voice acquisition unit 64 is output with reference to the table.
  • the voice acquisition control start instruction unit 32 (b) does not need to be displayed on the display unit (touch panel) 1, and may be, for example, installed in a car navigation body near the screen as a hard key. .
  • FIG. 28 is a flowchart for explaining processing of the voice acquisition control unit 63 in the in-vehicle voice input device according to the fifth embodiment.
  • step ST41 and step ST42 are the same as step ST11 and step ST12 in FIG. 9 of Embodiment 1, description is abbreviate
  • the voice acquisition control unit 63 refers to the table in FIG.
  • the voice acquisition unit 64 corresponding to the position of the operator acquired from 31 is specified (step ST43).
  • the voice acquisition control unit 63 When the corresponding voice acquisition unit 64 can be identified (YES in step ST44), the voice acquisition control unit 63 outputs a signal that validates the voice data collected by the identified voice acquisition unit 64. (Step ST45). On the other hand, if the corresponding voice acquisition unit 64 cannot be specified (NO in step ST44), the process is terminated as it is.
  • the voice acquisition unit 64 is prepared for each voice acquisition control start instruction unit 32 operated by the operator, and the voice acquisition unit is in a direction in which the operator's face is expected to face when the operator speaks. Since the sound acquisition unit 64 is arranged in a state where the sound collection direction is set in the direction of the operator, the sound is collected by the optimum sound acquisition unit 64 according to the position of the operator. The voice recognition rate can be increased by using the voice data. If the voice acquisition unit 64 can adjust the gain, the sound collection direction or gain (gain) of the voice acquisition units 64 (a), 64 (b),. The position of the operator specified by the operator position specifying unit 31 by arranging the sound collecting direction or gain corresponding to the position of the operator specified by the operator position specifying unit 31. The gain (gain) can be adjusted accordingly.
  • the operator can use information that can be acquired from the voice acquisition control start instruction unit (operation button) that is a general component of the car navigation system. Since the position (direction) of the (speaker) is specified and the microphone corresponding to the specified position is controlled to be able to collect sound, an expensive device is added, or a complicated configuration Therefore, it is possible to use a voice with less noise and a large S / N ratio.
  • operation button the voice acquisition control start instruction unit
  • the in-vehicle voice input device of the present invention can be applied to a system capable of receiving a passenger's voice input in a vehicle such as a car navigation system.

Landscapes

  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Navigation (AREA)

Abstract

 車両内における搭乗者の音声入力を受け付ける車載用音声入力装置において、車室内の搭乗者の発話した音声を取得する音声取得部24と、搭乗者の操作に応じて音声取得部24に対する制御を開始する指示を出力する音声取得制御開始指示部22と、音声取得制御開始指示部22を操作した搭乗者の位置を特定する操作者位置特定部21と、音声取得制御開始指示部22からの指示を受けると、操作者位置特定部21により特定された搭乗者の位置に応じて音声取得部24の集音方向または利得を制御する音声取得制御部23とを備えるようにしたことにより、高価なデバイスを追加したり、複雑な構成としなくとも、ノイズが少ない音声を集音でき、S/N比を大きくすることができる。

Description

車載用音声入力装置
 この発明は、カーナビゲーション装置など、車両内における搭乗者の音声入力を受け付けることが可能な車載用音声入力装置に関するものである。
 近年、カーナビゲーションシステムなどは、マイクにより集音された搭乗者発話、すなわち、入力された音声を認識して、その認識結果に基づいて所定の動作をする機能や、ハンズフリーでの通話機能などを備えている。
 このような装置においては、マイクにより集音される音声にノイズ(搭乗者発話以外の音声)が含まれていると、S/N比(signal-to-noise ratio)が小さくなり認識率が低下するなどの問題が生じるため、ノイズが少ない音声を集音する必要がある。
 そこで、アレイマイクとカメラを備え、カメラにより撮影された撮像画像を用いて動的に変化する発話者の方向を特定し、その特定された方向にアレイマイクの集音方向を制御することで、ノイズが少ない音声を集音する音声処理装置が知られている(例えば、特許文献1参照)。また、例えば特許文献2にも、カメラを利用した音声認識システムが開示されている。
特開2009-225379号公報 特開2004-354930号公報 特開2010-191692号公報
 しかしながら、例えば特許文献1,2に示すような従来の装置では、車両内の発話者の方向や位置を特定するために高価なデバイスであるカメラが必要となるため、コストが増加するとともに、装置の構成が複雑になるという課題があった。
 この発明は、上記のような課題を解決するためになされたものであり、カメラ等の高価なデバイスの追加を不要とし、カーナビゲーションシステムなどの一般的な構成要素であるタッチパネルやスイッチ等から取得できる情報を用いて発話者の方向を特定し、その特定された方向に応じてマイクの集音方向を制御することができる車載用音声入力装置を提供することを目的とする。
 上記目的を達成するため、この発明の車載用音声入力装置は、車室内の搭乗者の発話した音声を取得する音声取得部と、前記搭乗者の操作に応じて前記音声取得部に対する制御を開始する指示を出力する音声取得制御開始指示部と、前記音声取得制御開始指示部を操作した前記搭乗者の位置を特定する操作者位置特定部と、前記音声取得制御開始指示部からの指示を受けると、前記操作者位置特定部により特定された前記搭乗者の位置に応じて前記音声取得部の集音方向または利得を制御する音声取得制御部とを備えることを特徴とする。
 この発明の車載用音声入力装置によれば、カーナビゲーションシステムなどの一般的な構成要素であるタッチパネルやスイッチ(ボタン)等から取得できる情報を用いて操作者(発話者)の位置(方向)を特定し、その特定された位置に応じてマイクの集音方向または利得を制御するようにしたので、高価なデバイスを追加したり、複雑な構成としなくとも、ノイズが少ない音声を集音でき、S/N比を大きくすることができる。
車両内における搭乗者の音声入力を受け付けることが可能な車載用音声入力装置およびそれを用いたカーナビゲーションシステムの一般的な構成例を示すブロック図である。 表示部(タッチパネル)に音声取得制御開始ボタンが表示されている状態を示す画面例である。 図1に示すカーナビゲーションシステムが搭載された車両内部の一例を示す図である。 図3において、運転手がボタンを操作した場合の集音方向との関係を示す図である。 図3において、助手席の人がボタンを操作した場合の集音方向との関係を示す図である。 実施の形態1による車載用音声入力装置およびそれを用いたカーナビゲーションシステムの構成例を示すブロック図である。 音声取得部が回転機構を備えた単一指向性マイクである場合の一例を示す図である。 実施の形態1の車載用音声入力装置における操作者位置特定部の処理を説明するフローチャートである。 実施の形態1の車載用音声入力装置における音声取得制御部の処理を説明するフローチャートである。 図6に示すカーナビゲーションシステムが搭載された車両内部の一例であり、助手席の人がボタンを操作した場合の集音方向との関係を示す図である。 実施の形態2による車載用音声入力装置およびそれを用いたカーナビゲーションシステムの構成例を示すブロック図である。 音声取得制御開始指示部と、操作者の位置を対応付けたテーブルである。 操作者の位置と、音声取得部の集音方向およびゲイン(利得)を対応付けたテーブルである。 図11に示すカーナビゲーションシステムが搭載された車両内部の一例であり、操作者の位置と、音声取得部の集音方向およびゲイン(利得)との関係を示す図である。 図11に示すカーナビゲーションシステムが搭載された車両内部の別の例であり、操作者の位置と、音声取得部の集音方向およびゲイン(利得)との関係を示す図である。 図11に示すカーナビゲーションシステムが搭載された車両内部のさらに別の例であり、操作者の位置と、音声取得部の集音方向およびゲイン(利得)との関係を示す図である。 実施の形態2の車載用音声入力装置における音声取得制御部の処理を説明するフローチャートである。 実施の形態3による車載用音声入力装置およびそれを用いたカーナビゲーションシステムの構成例を示すブロック図である。 図18に示すカーナビゲーションシステムが搭載された車両内部の一例であり、操作者の位置と、音声取得部の集音方向およびゲイン(利得)との関係を示す図である。 図18に示すカーナビゲーションシステムが搭載された車両内部の別の例であり、操作者の位置と、音声取得部の集音方向およびゲイン(利得)との関係を示す図である。 実施の形態4による車載用音声入力装置およびそれを用いたカーナビゲーションシステムの構成例を示すブロック図である。 図21に示すカーナビゲーションシステムが搭載された車両内部の一例であり、操作者の位置と、音声取得部の集音方向との関係を示す図である。 実施の形態4の車載用音声入力装置における音声取得制御部の処理を説明するフローチャートである。 図22において、運転手がボタンを操作した場合に集音可能となる音声取得部との関係を示す図である。 実施の形態5による車載用音声入力装置およびそれを用いたカーナビゲーションシステムの構成例を示すブロック図である。 図25に示すカーナビゲーションシステムが搭載された車両内部の一例であり、操作者の位置と、音声取得部の集音方向との関係を示す図である。 操作者の位置と、音声取得部を対応付けたテーブルである。 実施の形態5の車載用音声入力装置における音声取得制御部の処理を説明するフローチャートである。
 以下、この発明の実施の形態について、図面を参照しながら詳細に説明する。
実施の形態1.
 図1は、車両内における搭乗者の音声入力を受け付けることが可能な車載用音声入力装置およびそれを用いたカーナビゲーションシステムの一般的な構成例を示すブロック図である。このカーナビゲーションシステムは、表示部1、音声取得制御開始指示部2、音声取得部4、音声認識部6、音声出力部7およびナビゲーション部8により構成されている。なお、表示部1、音声取得制御開始指示部2、音声取得部4および音声認識部6により、車載用音声入力装置10を構成する。
 表示部1は、表示一体型のタッチパネルであり、例えばLCD(Liquid Crystal Display)とタッチセンサから構成されており、後述するナビゲーション部8から送られてくる表示信号に応じて、地図、自車位置マークなどを表示したり、搭乗者が表示部(タッチパネル)1に直接触れることで、ナビゲーション部8への指示を入力したりすることができる。
 音声取得制御開始指示部2は、搭乗者の操作に応じて、後述する音声認識部6への認識開始の指示信号を出力する。ここで、音声取得制御開始指示部2は、例えば図2に示すように表示部(タッチパネル)1に音声取得制御開始ボタン9が表示されており、このタッチ式ボタンが押下されると信号を出力するものである。
 なお、音声認識部6が例えば携帯電話のように通話機器である場合は、音声取得制御開始指示部2は、通話開始の指示信号を出力する。
 音声取得部4は、車室内の搭乗者の発話した音声を取得(集音)するマイクであり、搭乗者発話を集音し、A/D変換(Analog/Digital Conversion)して、例えばPCM(Pulse Code Modulation)形式に変換する。マイクには、例えば複数の全指向性(または無指向性)のマイクをアレイ状に配列して指向特性を調整可能としたアレイマイクや、一方向のみに指向性を有しており指向特性を調整できない単一指向性マイクなどがある。また、これらのマイクは、搭乗者との距離が遠い場合にはゲインを上げることにより音声利得を上げ、搭乗者との距離が近い場合にはハウリング防止のためにゲインを下げて音声利得を下げる等、利得の調整も可能としたものであってもよい。
 音声認識部6は、認識辞書(図示せず)を有し、音声取得部4により変換された音声データから、搭乗者が発話した内容に該当する音声区間を検出し、特徴量を抽出し、その特徴量に基づいて認識辞書を用いて音声認識処理を行う。
 音声出力部7は、スピーカであり、ナビゲーション部8から送信される音声信号に応じて、案内音声や合成音声を出力する。
 ナビゲーション部8は、このカーナビゲーションシステム全体を制御する。例えば、リモコン(図示せず)や表示部(タッチパネル)1上のタッチ式ボタン等からの指示を受け、目的地への経路の探索や施設検索を行ったり、車速センサやジャイロセンサ(図示せず)からの情報に基づいて、車両の現在位置を特定したり、表示部(タッチパネル)1に地図の表示や自車位置マークの表示信号を送信したり、音声認識部6により出力された認識結果に対応する操作を特定して実行したりする。
 次に、カーナビゲーションシステムが搭載された車両内部について説明する。図3は、図1に示すカーナビゲーションシステムが搭載された車両内部の一例を示す図である。
 なお、音声取得部4は、例えば図3に示すようにダッシュボード上に設置されていてもよいし、例えばバックミラーに設置されていてもよい。
 この際、音声取得部4の集音方向は、図4に示すように運転手の方向に固定して設定されている。
 ここで、運転手が音声操作を行うために表示部(タッチパネル)1上の音声取得制御開始指示部2を押下して発話した場合は、図4に示すように運転者は音声取得部4の集音方向に対して発話することになり、主に運転手が発した音声が集音されるため、その集音された音声のS/N比は大きくなり音声認識部6での認識率が高くなる。
 一方、助手席の人が音声操作を行うために表示部(タッチパネル)1上の音声取得制御開始指示部2を押下して発話した場合は、図5に示すように音声取得部4の集音方向とは異なる方向から発話することになり、助手席の人が発した音声以外の音声が多く集音されるため、その集音された音声のS/N比は小さくなり助手席の人が発した音声の音声認識部6での認識率は低くなる。
 このように、音声取得部4の集音方向が一方向であるため、音声取得制御開始指示部2の操作者(操作した搭乗者)によっては、音声取得部4により集音される音声のS/N比は小さくなり音声認識部6での認識率は低くなる。
 そこで、この実施の形態1に係る発明は、音声取得制御開始指示部2を操作した搭乗者の位置(助手席か運転席か、ということや、運転席の場合にはマイクに近づいた位置で発話しているか近づかずに正面を向いて発話しているか、ということなど)を特定し、音声取得部4の集音方向をその特定された位置の方向となるように制御し、音声取得制御開始部2の操作者(操作した搭乗者)が発話した音声を高い認識率で認識できるようにするものである。
 図6は、この発明の実施の形態1による車載用音声入力装置およびそれを用いたカーナビゲーションシステムの一例を示すブロック図である。なお、図1で説明したものと同様の構成には、同一の符号を付して重複した説明を省略する。この実施の形態1における車載用音声入力装置20は、表示部(タッチパネル)1と、音声取得制御開始指示部22と、音声取得制御部23と、音声取得部24と、操作者位置特定部21および音声認識部6により構成されている。
 音声取得部24は、複数の全指向性(または無指向性)のマイクをアレイ状に配列し、指向特性を調整可能としたアレイマイク、または、一方向にのみ指向性を有する単一指向性マイクの集音部が回動または揺動可能な回転機構を備えることにより、指向特性を調整可能としたマイクである。また、これらのマイクには、搭乗者との距離が遠い場合にはゲインを上げることにより音声利得を上げ、搭乗者との距離が近い場合にはハウリング防止のためにゲインを下げる等、利得の調整も可能とするものであってもよい。
 図7は、音声取得部24が回動または揺動可能な回転機構を備えた単一指向性マイクである場合の一例を示す図である。これは、単一指向性マイクがネック部11を有し、そのネック部11が適切なギアおよびモータ等(図示せず)の回転機構を備え、当該回転機構により回動または揺動するものである。
 操作者位置特定部21は、表示部(タッチパネル)1に表示された音声取得制御開始ボタン等に対する搭乗者の指の近接および接触によるタッチセンサの出力値の変化を検出し、検出された情報を基に搭乗者の指の到来方向を判定することにより、その搭乗者(指の操作者)の位置を特定する。すなわち、例えば車両内のダッシュボード中央付近にカーナビゲーションシステムの表示部(タッチパネル)1が設けられている場合には、その表示部(タッチパネル)1を操作する搭乗者は運転席または助手席に座っている搭乗者であると考えられるので、タッチセンサの出力値の変化から運転席または助手席のいずれの方向から搭乗者の指が到来したかを判定することにより、その搭乗者がいずれの座席に位置する搭乗者であるかを特定することができる。ここで、タッチパネルに搭乗者の指等が近接および接触することによるタッチセンサの出力値の変化から操作者方向を特定することについては、例えば特許文献3等に開示されているように公知の技術であるため、ここでは説明を省略する。
 音声取得制御開始指示部22は、音声取得制御開始指示部2とは異なる処理となっており、音声認識部6への認識開始の指示信号を出力するとともに、音声取得制御部23に対して、後述する制御開始の指示信号を出力する。
 音声取得制御部23は、音声取得制御開始指示部22により出力された信号を受信すると、音声取得部24の集音方向を、操作者位置特定部21により特定された音声取得制御開始指示部22の操作者の位置に応じた方向となるように制御する。
 なお、音声取得部24が指向特性を調整可能としたアレイマイクである場合には、音声取得制御部23は、当該アレイマイクの特性に基づいてその集音方向または利得を制御するようにすればよい。また、音声取得部24が図7に示すような、その集音部が回動または揺動可能な単一指向性マイクである場合には、音声取得制御部23は、ネック部11を操作者位置特定部21から取得された操作者方向へ、所定の角度だけ回転させることにより、そのマイクの集音部を回動または揺動することにより、マイクの集音方向または利得を制御するようにすればよい。また、操作者ごとに音声取得部24の集音方向の変更角度を登録しておき、操作者に応じて変更角度を変えることができるようにしてもよい。
 次に、動作について説明する。図8は、実施の形態1の車載用音声入力装置20における操作者位置特定部21の処理を説明するフローチャートである。また、図9は、実施の形態1の車載用音声入力装置20における音声取得制御部23の処理を説明するフローチャートである。
 まず初めに、表示部(タッチパネル)1上の音声取得制御開始指示部22が操作されると、操作者位置特定部21はタッチセンサの出力値を検出する(ステップST01)。
 次に、検出したセンサの出力値に基づいて音声取得制御開始指示部22を操作した操作者の方向(位置)を特定し(ステップST02)、その特定された方向(位置)を出力する(ステップST03)。
 一方、表示部1上の音声取得制御開始指示部22が押下されると、音声取得制御開始指示部22は認識開始信号および音声取得制御開始信号を出力する。
 そして、音声取得制御部23は、音声取得制御開始指示部22から音声取得制御開始信号を受信すると(ステップST11のYESの場合)、操作者位置特定部21から操作者の位置を取得する(ステップST12)。ここで、図8のフローチャートで説明した操作者の位置を特定する処理が完了していない場合(ステップST12のNOの場合)には、操作者の位置が取得できるまで待つ。
 操作者の位置を取得できた場合(ステップST12のYESの場合)、音声取得制御部23は、音声取得部24の集音方向を、操作者位置特定部21から取得した操作者の位置方向に変更する(ステップST13)。
 例えば、図4に示すのと同様に運転手が表示部(タッチパネル)1上の音声取得制御開始指示部22を操作すると、操作者位置特定部21により操作者の位置は「運転席(左)」と特定される。そして、音声取得制御部23により、音声取得部24の集音方向は、音声取得部24から見て左方向(運転席の方向)に予め定められた所定の角度分だけ変更される。また、例えば図5に示すのと同様に、助手席の人が音声取得制御開始指示部22を操作すると、操作者位置特定部21により操作者の位置は「助手席(右)」と特定される。そして、この場合には図10に示すように、音声取得制御部23により、音声取得部24の集音方向は、音声取得部24から見て右方向(助手席の方向)に予め定められた所定の角度分だけ変更される。
 このように、実施の形態1の車載用音声入力装置20では、表示部(タッチパネル)1上に1つの音声取得制御開始指示部22が設けられており、それを運転席側から操作したか、助手席側から操作したかを操作者位置特定部21が特定し、特定された操作者の位置に応じて、音声取得制御部23が音声取得部24の集音方向を変更するようにしたので、従来のように助手席の人が発した音声の認識率が低くなることはなく、いずれの位置(方向)から操作をして発話する場合であっても、高い認識率で音声認識を行うことができる。
 なお、ここでは音声取得部24が集音方向を調整可能なものであり、操作者の位置に応じて集音方向を調整するものとして説明したが、音声取得部24は単一指向性のマイクであっても、ゲイン(利得)を調整可能なものであればよい。この場合には、集音方向は変更できないが、例えば、音声取得部24を集音方向が図4に示すように運転席の方向を向けて設置し、操作者の位置(方向)が運転席方向であればゲイン(利得)を下げ、助手席方向であればゲイン(利得)を上げることにより、助手席の人が発した音声の認識率も高くすることができる。(後述の実施の形態3参照)
 以上のように、この実施の形態1の車載用音声入力装置によれば、カーナビゲーションシステムの一般的な構成要素であるタッチパネルから取得できる情報を用いて操作者(発話者)の位置(方向)を特定し、その特定された位置に応じてマイクの集音方向または利得を制御するようにしたので、高価なデバイスを追加することや、複雑な構成とすることなく、ノイズが少ない音声を集音でき、S/N比を大きくすることができる。
実施の形態2.
 図11は、この発明の実施の形態2による車載用音声入力装置およびそれを用いたカーナビゲーションシステムの構成例を示すブロック図である。なお、実施の形態1で説明したものと同様の構成には、同一の符号を付して重複した説明を省略する。この実施の形態2における車載用音声入力装置30は、音声取得制御開始指示部32(32(a),32(b),・・・)と、音声取得制御部33と、音声取得部34と、操作者位置特定部31により構成されている。
 音声取得制御開始指示部32は、複数(2つ以上)の音声取得制御開始指示部32(a),32(b),・・・で構成されており、それぞれの音声取得制御開始指示部32(a),32(b),・・・は、実施の形態1における音声取得制御開始指示部22と同様に、搭乗者の操作に応じて、音声認識部6への認識開始の指示信号を出力するとともに、音声取得制御部33に対して、音声取得制御開始の指示信号を出力する。
 操作者位置特定部31は、図12に示すように、音声取得制御開始指示部ごとに、操作者の位置を対応付けたテーブルを保持しており、音声取得制御開始指示部32により出力された信号を受信すると、複数(2つ以上)の音声取得制御開始指示部32(a),32(b),・・・のうちのいずれの音声取得制御開始指示部(操作ボタン)が押下されたかに基づいて、当該テーブルを参照して、操作者の位置を特定する。
 音声取得制御部33は、図13に示すように、操作者の位置と、音声取得部34の集音方向およびゲイン(利得)を対応付けたテーブルを保持しており、音声取得制御開始指示部32により出力された信号を受信すると、当該テーブルを参照して、操作者位置特定部31により特定された位置に応じた集音方向およびゲイン(利得)を取得し、音声取得部34の集音方向を取得した方向に変更する集音方向の制御、および、音声取得部34のゲインを取得した状態に変更する利得の制御を行う。
 ここで、集音方向は、例えば音声取得部34の正面を0度として、そこからの角度の変化量で表されるものとする。
 なお、音声取得部34は、複数の全指向性(または、無指向性)のマイクをアレイ状に配列し、指向特性を調整可能としたアレイマイク、または、一方向にのみ指向性を有する単一指向性マイクの集音部が回動または揺動可能な回転機構を備えることにより、指向性を調整可能としたマイクであるとともに、搭乗者との距離が遠い場合にはゲインを上げることにより音声利得を上げ、搭乗者との距離が近い場合にはハウリング防止のためにゲインを下げる等、利得の調整も可能なものとして説明するが、少なくとも指向性(集音方向)またはゲイン(利得)のいずれか一方を調整可能なものであればよい。
 また、音声取得部34が調整可能なものがいずれか一方である場合には、それに合わせて、音声取得制御部33が保持するテーブル(図13)も、操作者の位置に、音声取得部34の集音方向またはゲイン(利得)のいずれか一方を対応付けたテーブルであればよく、音声取得制御部33は、そのテーブルから取得したいずれか一方(調整可能な一方)を制御すればよい。
 図14は、図11に示すカーナビゲーションシステムが搭載された車両内部の一例であり、音声取得制御開始指示部32が、助手席側の画面付近に設けられた物理的な操作ボタン(音声取得制御開始指示部32(a))と、運転席側の画面付近に設けられた物理的な操作ボタン(音声取得制御開始指示部32(b))である場合の、操作者の位置と集音方向およびゲイン(利得)との関係を示す図である。そして、助手席の同乗者用の音声取得制御開始指示部32(a)が押下された場合は、音声取得部34の集音方向は右に30度の矢印Aで示す方向となり、運転手用の音声取得制御開始指示部32(b)が押下された場合は、音声取得部34の集音方向は左に30度の矢印Bに示す方向となるように、音声取得制御部33により制御される。なお、「右」および「左」という表現は、音声取得部34から見て右、左のことであるので、図14においては矢印Aは0度のラインから向かって左に30度、矢印Bは0度のラインから向かって右に30度の方向である。
 図15は、図11に示すカーナビゲーションシステムが搭載された車両内部の別の例であり、音声取得制御開始指示部32が、助手席側の画面付近に設けられた物理的な操作ボタン(音声取得制御開始指示部32(a))と、運転席側のハンドルに設けられた物理的な操作ボタン(音声取得制御開始指示部32(c))である場合の、操作者の位置と集音方向およびゲイン(利得)との関係を示す図である。そして、助手席の同乗者用の音声取得制御開始指示部32(a)が押下された場合は、音声取得部34の集音方向は左に30度の矢印Aで示す方向となり、運転手用のハンドルに設けられた音声取得制御開始指示部32(c)が押下された場合は、音声取得部34の集音方向は集音方向は右に45度の矢印Cに示す方向(図15においては向かって右に45度の方向)となるように、音声取得制御部33により制御される。
 また、矢印Aと矢印Cの長さは、それぞれのゲインを示している。すなわち、画面付近に設けられた操作ボタン(32(a)や図14に示す32(b))を押下する場合には、操作者はマイクに少し近づいている状態であると考えられるため、ハウリングを防止できるよう、マイクのゲインを下げるようにし、ハンドルに設けられた操作ボタン(32(c))を押下する場合には、操作者(運転手)はマイクに近づくことなく正面を向いたまま発話している状態であると考えられるため、音声をしっかりと取得できるよう、マイクのゲインを上げるように制御される。なお、ここでは、ハンドルに設けられた操作ボタン(32(c))を押下する場合のマイクのゲインをデフォルト値としておき、画面付近に設けられた操作ボタン(32(a)や図14に示す32(b))を押下する場合には、そのデフォルト値よりも下げるという制御を行うものとする(図13のテーブル参照)。
 図16は、図11に示すカーナビゲーションシステムが搭載された車両内部のさらに別の例であり、音声取得制御開始指示部32が、運転席側の画面付近に設けられた物理的な操作ボタン(音声取得制御開始指示部32(b))と、運転席側のハンドルに設けられた物理的な操作ボタン(音声取得制御開始指示部32(c))である場合の、操作者の位置と集音方向およびゲイン(利得)との関係を示す図である。そして、画面付近に設けられた音声取得制御開始指示部32(b)が押下された場合は、音声取得部34の集音方向は左に30度の矢印Bに示す方向となり、ハンドルに設けられた音声取得制御開始指示部32(c)が押下された場合は、音声取得部34の集音方向は左に45度の矢印Cに示す方向となるように、音声取得制御部33により制御される。
 また、ここでも矢印Bと矢印Cの長さは、それぞれのゲインを示している。すなわち、画面付近に設けられた操作ボタン32(b)を押下する場合には、マイクのゲインを下げるようにし、ハンドルに設けられた操作ボタン32(c)を押下する場合には、マイクのゲインを上げるように制御される。
 なお、図15,図16の例では、操作者位置に応じて、音声取得部34の集音方向およびゲイン(利得)を制御するものとして説明したが、少なくとも集音方向またはゲイン(利得)のいずれか一方を制御するものであればこの発明の効果を奏するものであり、音声取得部34が備える機能に合わせて、いずれか一方または両方を制御するようにすればよい。
 次に、動作について説明する。図17は、実施の形態2の車載用音声入力装置における音声取得制御部33の処理を説明するフローチャートである。
 ここで、ステップST21およびステップST22は、実施の形態1の図9におけるステップST11およびステップST12と同一であるので、説明を省略する。そして、音声取得制御開始指示部32が押下された結果、操作者位置特定部31により操作者の位置が特定されたら、音声取得制御部33は、図13のテーブルを参照して、操作者位置特定部31から取得した操作者の位置に対応する集音方向およびゲイン(利得)を取得する(ステップST23)。
 対応する集音方向またはゲイン(利得)を取得できた場合(ステップST24のYESの場合)、音声取得制御部33は、音声取得部34の集音方向を取得した集音方向に変更、および/または、音声取得部34の利得を取得したゲイン(利得)に調整する(ステップST25)。
 一方、対応する集音方向やゲイン(利得)を取得できなかった場合(ステップST24のNOの場合)には、そのまま処理を終了する。
 なお、本実施の形態では、音声取得部34は指向特性を制御可能なアレイマイクとしたが、例えば、音声取得部34は、指向特性を制御できない単一指向性マイクであって、例えば、図7のようにネック部を有し、そのネック部が適切なギアおよびモータ等(図示しない)により回転するものとし、音声取得制御部33は、ネック部を操作者位置特定部31から取得された操作者方向へ、所定の角度だけ回転させる構成としてもよい。
 また、操作者ごとに音声取得部34の集音方向を登録しておき、操作者に応じて集音方向を変えることができるようにしてもよい。
 このように、実施の形態2の車載用音声入力装置30では、音声取得制御開始指示部32が複数設けられており、いずれの操作ボタンが押下されたかにより、助手席側から操作したか、運転席側から操作したか、さらに操作者が運転手の場合には音声取得部34に近づいた位置で操作しているか、音声取得部には近づかずに正面を向いた位置で操作しているかを操作者位置特定部31が特定し、特定された操作者の位置に応じて、音声取得制御部33が音声取得部34の集音方向および/またはゲイン(利得)を変更するようにしたので、従来のように助手席の人が発した音声の認識率が低くなることはなく、いずれの位置(方向)から操作をして発話する場合であっても、高い認識率で音声認識を行うことができる。
 以上のように、この実施の形態2の車載用音声入力装置によれば、カーナビゲーションシステムの一般的な構成要素である音声取得制御開始指示部(操作ボタン)から取得できる情報を用いて操作者(発話者)の位置(方向)を特定し、その特定された位置に音声取得部の集音方向またはゲイン(利得)を対応付けておき、音声取得制御開始指示部(操作ボタン)が操作された場合は、音声取得部の集音方向を対応する方向に変更、または、音声取得部のゲイン(利得)を対応する利得に変更するよう制御するようにしたので、高価なデバイスを追加することや、複雑な構成とすることなく、ノイズが少ない音声を集音でき、S/N比を大きくすることができる。
 なお、実施の形態2においては、音声取得制御開始指示部32(a)および32(b)は画面付近に設けられた物理的な操作ボタンであるものとして説明したが、実施の形態1や後述する実施の形態3と同様に、表示部(タッチパネル)1上に設けられたソフトスイッチであっても構わないことは言うまでもない。
実施の形態3.
 図18は、この発明の実施の形態3による車載用音声入力装置およびそれを用いたカーナビゲーションシステムの構成例を示すブロック図である。なお、実施の形態1,2で説明したものと同様の構成には、同一の符号を付して重複した説明を省略する。この実施の形態3における車載用音声入力装置40は、表示部(タッチパネル)1と、音声取得制御開始指示部32(32(a),32(b),・・・)と、音声取得制御部43と、音声取得部44と、操作者位置特定部31により構成されている。
 音声取得部44は、指向特性を制御できない単一指向性マイクであり、この実施の形態3は、運転手による音声入力専用の装置である。すなわち、音声取得部44は、予め集音方向が運転席の方向を向くように設置されており、ゲイン(利得)のみ調整可能なマイクである。
 そして、音声取得制御部43は、音声取得制御開始指示部32の操作者である運転者の位置(音声取得部44に近づいた位置か、音声取得部44には近づかずに正面を向いている位置か)により、すなわち、操作者位置特定部31が特定した操作者の位置に応じて、音声取得部44のゲイン(利得)を制御する。
 次に、カーナビゲーションシステムが搭載された車両内部について説明する。図19は、カーナビゲーションシステムが搭載された車両内部の一例である。
 ここでは、音声取得制御開始指示部32は2つ備わっており、1つ(音声取得制御開始指示部32(b))は表示部(タッチパネル)1上に表示されており、他方(音声取得制御開始指示部32(c))はハンドルに設置されている。
 そして、音声取得部44の集音方向は図14のように運転手の方向に固定して設定されている。
 なお、音声取得制御開始指示部32(b)は表示部(タッチパネル)1上に表示されている必要はなく、例えば、ハードキーとしてカーナビ本体に設置されていてもよい。
 ここで、運転手が音声操作を行うために表示部(タッチパネル)1上の音声取得制御開始指示部32(b)を押下し発話した場合は、図19のように運転者は音声取得部44の集音方向に対して発話することになる。
 しかし、運転手が音声操作を行うためにハンドル上の音声取得制御開始指示部32(c)を押下し発話した場合は、図20のように通常、運転手は正面を向いて発話することになり、運転手が発した音声以外の音声が多く集音されるため、その集音された音声のS/N比は小さくなり音声認識部6での認識率が低くなる。
 このように、操作する音声取得制御開始部32よって操作者が発話する方向が変わるため、音声取得部44により集音される音声のS/N比が小さくなり音声認識部6での認識率が低くなる場合が生じる。
 そこで、図19のように表示部(タッチパネル)1上の音声取得制御開始指示部32(b)が押下された場合には、音声取得部44のゲイン(利得)を下げ、図20のようにハンドル上の音声取得制御開始指示部32(c)が押下された場合には、音声取得部44のゲイン(利得)を上げるよう、音声取得部44の利得を制御する。なお、図19および図20における矢印Bおよび矢印C’は、音声取得部44の集音方向およびゲイン(利得)の大きさを示しており、どちらも集音方向は同じであるが、ゲイン(利得)の大きさは矢印Bよりも矢印C’の方が大きくなっている。
 このように、操作者が音声取得部44の方向を向いて発話しておらず音声取得部44に近づいていない図20のような場合であっても、音声取得部44のゲイン(利得)を上げてあげることにより、音声認識率を高めることができる。
 以上のように、この実施の形態3の車載用音声入力装置によれば、カーナビゲーションシステムの一般的な構成要素である音声取得制御開始指示部(操作ボタン)から取得できる情報を用いて操作者(発話者)の位置(方向)を特定し、その特定された位置に音声取得部のゲイン(利得)を対応付けておき、音声取得制御開始指示部(操作ボタン)が操作された場合は、音声取得部のゲイン(利得)を対応する利得に変更し、集音可能な状態にするよう制御するようにしたので、高価なデバイスを追加することや、複雑な構成とすることなく、ノイズが少ない音声を集音でき、S/N比を大きくすることができる。
実施の形態4.
 図21は、この発明の実施の形態4による車載用音声入力装置およびそれを用いたカーナビゲーションシステムの構成例を示すブロック図である。なお、実施の形態1~3で説明したものと同様の構成には、同一の符号を付して重複した説明を省略する。この実施の形態4は、実施の形態1と比べると、音声取得部それぞれを指向特性を制御できない単一指向性マイクとし、複数の音声取得部54(54(a),54(b),・・・)を備える構成としたものである。また、それに伴って、音声取得制御部53の処理も実施の形態1における音声取得制御部23とは異なる処理になっている(後述)。
 音声取得部54は、複数の音声取得部54(a),54(b),・・・で構成されており、それぞれは指向特性を制御できない単一指向性マイクである。そして、それぞれの音声取得部54(a),54(b),・・・は、予め集音方向が所定の方向を向くように設置されている。例えば、図22に示すように、一の音声取得部54(a)は、その集音方向が助手席を向くようにA方向に設置されており、他の音声取得部54(b)は、その集音方向が運転席を向くようにB方向に設置されている。また、それぞれの音声取得部54(a),54(b),・・・は、ゲイン(利得)を調整できるものであってもよい。
 音声取得制御部53は、操作者の位置と、音声取得部54とを対応付けたテーブル(図示せず)を保持しており、音声取得制御開始指示部22により出力された信号を受信すると、当該テーブルを参照して、操作者位置特定部21により特定された位置に応じた音声取得部54により集音された音声データを有効とする信号を出力する。
 音声認識部6は、認識開始の信号を受けると、音声取得部54(a),54(b),・・・により取得された音声データであって、音声取得制御部53により有効とされたものを使用して認識処理を行う。
 次に、動作について説明する。図23は、実施の形態4の車載用音声入力装置における音声取得制御部53の処理を説明するフローチャートである。
 ここで、ステップST31およびステップST32は、実施の形態1の図9におけるステップST11およびステップST12と同一であるので、説明を省略する。そして、音声取得制御開始指示部22が押下された結果、操作者位置特定部21により操作者の位置が特定されたら、音声取得制御部53は、前述のテーブル(図示せず)を参照して、操作者位置特定部21から取得した操作者の位置に対応する音声取得部54により集音された音声データを有効とする信号を出力する(ステップST33)。
 例えば、図24に示すように運転手が表示部1上の音声取得制御開始指示部22を操作すると、操作者位置特定部21により操作者の位置は「左」と特定される。そして、その操作者の位置に対応する音声取得部、すなわち、あらかじめ集音方向が「左」の運転手方向Bとなるように設置されている音声取得部54(b)が、音声取得制御部53により集音された音声データを有効とする信号を出力する。
 なお、音声取得部54がゲイン(利得)を調整可能なものである場合には、音声取得部54(a),54(b),・・・の集音方向またはゲイン(利得)をそれぞれ、操作者位置特定部21により特定された操作者の位置に対応した集音方向またはゲイン(利得)となるように配置しておくことにより、操作者位置特定部21により特定された操作者の位置に応じて、ゲイン(利得)の調整も行うことができる。
 以上のように、この実施の形態4の車載用音声入力装置によれば、カーナビゲーションシステムの一般的な構成要素であるタッチパネルから取得できる情報を用いて操作者(発話者)の位置(方向)を特定し、その特定された位置に対応するマイクより集音された音声データを有効とするよう制御するようにしたので、高価なデバイスを追加することや、複雑な構成とすることなく、ノイズが少なくS/N比が大きい音声を使用することができる。
実施の形態5.
 図25は、この発明の実施の形態5による車載用音声入力装置およびそれを用いたカーナビゲーションシステムの構成例を示すブロック図である。なお、実施の形態1~4で説明したものと同様の構成には、同一の符号を付して重複した説明を省略する。この実施の形態5は、実施の形態2,3と比べると、音声取得部はアレイマイクであっても指向特性を制御できない単一指向性マイクであってもよいが、複数の音声取得部64(64(a),64(b),・・・)を備える構成としたものである。また、それに伴って、音声取得制御部63の処理も実施の形態2,3における音声取得制御部33とは異なる処理になっている(後述)。
 音声取得部64は、複数の音声取得部64(a),64(b),・・・で構成されており、それぞれは前述のとおり、アレイマイクであっても指向特性を制御できない単一指向性マイクであってもよい。そして、各音声取得部64(64(a),64(b),・・・)は各音声取得制御開始指示部32(32(a),32(b),・・・)に対応するように設置されている。また、それぞれの音声取得部64(a),64(b),・・・は、ゲイン(利得)を調整できるものであってもよい。
 ここで、「音声取得制御開始指示部32に対応するように設置」とは、音声取得制御開始指示部32を操作したときに、操作した操作者の顔が向く方向、かつ、集音方向がその操作者の方向を向くように設置することである。
 例えば、図26のように、音声取得制御開始指示部32(b)と32(c)が配置されているとする。運転手(音声取得制御開始指示部32の操作者)が、表示部(タッチパネル)1上の音声取得制御開始指示部32(b)を操作する場合、運転手は画面(表示部1)の方向を向くので、その運転手の顔が向く方向、かつ、集音方向が運転手の方向(B方向)を向くように音声取得部64(b)を設置する。同様に、運転手がハンドルに設けられた音声取得制御開始指示部32(c)を操作する場合、運転手は正面を向くので、その運転手の顔が向く方向、かつ、集音方向が運転手の方向(C”方向)を向くように音声取得部64(c)を設置する。
 音声取得制御部63は、例えば図27に示すように、操作者の位置と、音声取得部64との対応関係を表すテーブルを保持しており、音声取得制御開始指示部32により出力された信号を受信すると、当該テーブルを参照して、対応する音声取得部64により集音された音声データを有効とする信号を出力する。
 なお、音声取得制御開始指示部32(b)は表示部(タッチパネル)1上に表示されている必要はなく、例えば、ハードキーとして画面付近のカーナビ本体に設置されているものであってもよい。
 次に、動作について説明する。図28は、実施の形態5の車載用音声入力装置における音声取得制御部63の処理を説明するフローチャートである。
 ここで、ステップST41およびステップST42は、実施の形態1の図9におけるステップST11およびステップST12と同一であるので、説明を省略する。そして、音声取得制御開始指示部32が押下された操作者位置特定部31により操作者の位置が特定されたら、音声取得制御部63は、図27のテーブルを参照して、操作者位置特定部31から取得した操作者の位置に対応する音声取得部64を特定する(ステップST43)。
 そして、対応する音声取得部64を特定できた場合(ステップST44のYESの場合)、音声取得制御部63は特定された音声取得部64により集音された音声データを有効とする信号を出力する(ステップST45)。
 一方、対応する音声取得部64を特定できなかった場合(ステップST44のNOの場合)には、そのまま処理を終了する。
 このように、操作者が操作をする音声取得制御開始指示部32ごとに音声取得部64を用意するとともに、操作者が発話するときに操作者の顔が向くと予測される方向に音声取得部64を配置し、かつ、その操作者の方向に集音方向を設定した状態で音声取得部64を配置するようにしたので、操作者の位置に応じて最適な音声取得部64により集音された音声データを使用して、音声認識率を高めることができる。
 なお、音声取得部64がゲイン(利得)を調整可能なものである場合には、音声取得部64(a),64(b),・・・の集音方向またはゲイン(利得)をそれぞれ、操作者位置特定部31により特定された操作者の位置に対応した集音方向またはゲイン(利得)となるように配置しておくことにより、操作者位置特定部31により特定された操作者の位置に応じて、ゲイン(利得)の調整も行うことができる。
 以上のように、この実施の形態5の車載用音声入力装置によれば、カーナビゲーションシステムの一般的な構成要素である音声取得制御開始指示部(操作ボタン)から取得できる情報を用いて操作者(発話者)の位置(方向)を特定し、その特定された位置に対応するマイクを集音可能な状態とするよう制御するようにしたので、高価なデバイスを追加することや、複雑な構成とすることなく、ノイズが少なくS/N比が大きい音声を使用することができる。
 なお、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。
 この発明の車載用音声入力装置は、カーナビゲーションシステムなど、車両内における搭乗者の音声入力を受け付けることが可能なシステムに適用することができる。
 1 表示部(タッチパネル)、2,22,32 音声取得制御開始指示部(操作ボタン)、23,33,43,53,63 音声取得制御部、4,24,34,44,54,64 音声取得部、6 音声認識部、7 音声出力部、8 ナビゲーション部、9 音声取得制御開始ボタン、10,20,30,40,50,60 車載用音声入力装置、11 ネック部、21,31 操作者位置特定部。

Claims (6)

  1.  車室内の搭乗者の発話した音声を取得する音声取得部と、
     前記搭乗者の操作に応じて前記音声取得部に対する制御を開始する指示を出力する音声取得制御開始指示部と、
     前記音声取得制御開始指示部を操作した前記搭乗者の位置を特定する操作者位置特定部と、
     前記音声取得制御開始指示部からの指示を受けると、前記操作者位置特定部により特定された前記搭乗者の位置に応じて前記音声取得部の集音方向または利得を制御する音声取得制御部とを備える
     ことを特徴とする車載用音声入力装置。
  2.  前記音声取得部は、アレイマイクであり、
     前記音声取得制御部は、前記アレイマイクの特性に基づいてその集音方向または利得を制御する
     ことを特徴とする請求項1記載の車載用音声入力装置。
  3.  前記音声取得部は、その集音部が回動または揺動可能なマイクであり、
     前記音声取得制御部は、前記集音部を回動または揺動することにより前記マイクの集音方向または利得を制御する
     ことを特徴とする請求項1記載の車載用音声入力装置。
  4.  車室内の搭乗者の音声を取得する複数の音声取得部と、
     前記搭乗者の操作に応じて前記音声取得部に対する制御を開始する指示を出力する音声取得制御開始指示部と、
     前記音声取得制御開始指示部を操作した前記搭乗者の位置を特定する操作者位置特定部と、
     前記音声取得制御開始指示部からの指示を受けると、前記操作者位置特定部により特定された前記搭乗者の位置に対応する前記音声取得部により取得された音声データを有効とする音声取得制御部とを備え、
     前記複数の音声取得部の集音方向または利得はそれぞれ、前記操作者位置特定部により特定された前記搭乗者の位置に対応した集音方向または利得となるように配置されている
     ことを特徴とする車載用音声入力装置。
  5.  前記音声取得制御開始指示部が複数の場合に、前記操作者位置特定部は、いずれの前記音声取得制御開始指示部が操作されたかに基づいて、当該操作した搭乗者の位置を特定する
     ことを特徴とする請求項1または請求項4記載の車載用音声入力装置。
  6.  前記音声取得部が取得した搭乗者の発話音声を認識する音声認識部を備えた
     ことを特徴とする請求項1または請求項4記載の車載用音声入力装置。
PCT/JP2012/002588 2012-04-13 2012-04-13 車載用音声入力装置 WO2013153583A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014509908A JPWO2013153583A1 (ja) 2012-04-13 2012-04-13 車載用音声入力装置
PCT/JP2012/002588 WO2013153583A1 (ja) 2012-04-13 2012-04-13 車載用音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/002588 WO2013153583A1 (ja) 2012-04-13 2012-04-13 車載用音声入力装置

Publications (1)

Publication Number Publication Date
WO2013153583A1 true WO2013153583A1 (ja) 2013-10-17

Family

ID=49327196

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/002588 WO2013153583A1 (ja) 2012-04-13 2012-04-13 車載用音声入力装置

Country Status (2)

Country Link
JP (1) JPWO2013153583A1 (ja)
WO (1) WO2013153583A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017171193A (ja) * 2016-03-25 2017-09-28 マツダ株式会社 車両検査方法
WO2019163060A1 (ja) * 2018-02-22 2019-08-29 三菱電機株式会社 操作制限制御装置及び操作制限制御方法
US11004450B2 (en) 2018-07-03 2021-05-11 Hyundai Motor Company Dialogue system and dialogue processing method
JP2021078042A (ja) * 2019-11-12 2021-05-20 本田技研工業株式会社 車両用装置、車両、車両用装置の動作方法およびプログラム
KR102331882B1 (ko) * 2020-05-28 2021-11-29 주식회사대성엘텍 음성 인식 기반의 차량 제어 방법 및 장치
JP2021190986A (ja) * 2020-05-29 2021-12-13 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 超音波レーダアレイ、障害物検出方法及びシステム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007286136A (ja) * 2006-04-13 2007-11-01 Alpine Electronics Inc 車載用音声認識装置及び音声認識方法
JP2008015974A (ja) * 2006-07-10 2008-01-24 Nippon Signal Co Ltd:The 駅務機器用入力装置
JP2010191692A (ja) * 2009-02-18 2010-09-02 Mitsubishi Electric Corp タッチパネル装置および入力方向検知装置
JP2010283506A (ja) * 2009-06-03 2010-12-16 Mitsubishi Electric Corp 車載用音響処理装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0521300U (ja) * 1991-08-30 1993-03-19 株式会社ケンウツド 車載音声認識装置
JP4694017B2 (ja) * 2001-03-27 2011-06-01 クラリオン株式会社 車載用音声認識装置
JP4556586B2 (ja) * 2004-09-22 2010-10-06 トヨタ自動車株式会社 運転支援装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007286136A (ja) * 2006-04-13 2007-11-01 Alpine Electronics Inc 車載用音声認識装置及び音声認識方法
JP2008015974A (ja) * 2006-07-10 2008-01-24 Nippon Signal Co Ltd:The 駅務機器用入力装置
JP2010191692A (ja) * 2009-02-18 2010-09-02 Mitsubishi Electric Corp タッチパネル装置および入力方向検知装置
JP2010283506A (ja) * 2009-06-03 2010-12-16 Mitsubishi Electric Corp 車載用音響処理装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017171193A (ja) * 2016-03-25 2017-09-28 マツダ株式会社 車両検査方法
WO2019163060A1 (ja) * 2018-02-22 2019-08-29 三菱電機株式会社 操作制限制御装置及び操作制限制御方法
JPWO2019163060A1 (ja) * 2018-02-22 2020-07-02 三菱電機株式会社 操作制限制御装置及び操作制限制御方法
CN111801249A (zh) * 2018-02-22 2020-10-20 三菱电机株式会社 操作限制控制装置以及操作限制控制方法
US11004450B2 (en) 2018-07-03 2021-05-11 Hyundai Motor Company Dialogue system and dialogue processing method
CN112866871A (zh) * 2019-11-12 2021-05-28 本田技研工业株式会社 车辆用装置、车辆、车辆用装置的动作方法以及存储介质
JP2021078042A (ja) * 2019-11-12 2021-05-20 本田技研工業株式会社 車両用装置、車両、車両用装置の動作方法およびプログラム
JP7078594B2 (ja) 2019-11-12 2022-05-31 本田技研工業株式会社 車両用装置、車両、車両用装置の動作方法およびプログラム
US11521615B2 (en) 2019-11-12 2022-12-06 Honda Motor Co., Ltd. Vehicular apparatus, vehicle, operation method of vehicular apparatus, and storage medium
CN112866871B (zh) * 2019-11-12 2023-11-03 本田技研工业株式会社 车辆用装置、车辆、车辆用装置的动作方法以及存储介质
KR102331882B1 (ko) * 2020-05-28 2021-11-29 주식회사대성엘텍 음성 인식 기반의 차량 제어 방법 및 장치
JP2021190986A (ja) * 2020-05-29 2021-12-13 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 超音波レーダアレイ、障害物検出方法及びシステム
JP7174030B2 (ja) 2020-05-29 2022-11-17 阿波▲羅▼智▲聯▼(北京)科技有限公司 超音波レーダアレイ、障害物検出方法及びシステム
US11631420B2 (en) 2020-05-29 2023-04-18 Apollo Intelligent Connectivity (Beijing) Technology Co., Ltd. Voice pickup method for intelligent rearview mirror, electronic device and storage medium

Also Published As

Publication number Publication date
JPWO2013153583A1 (ja) 2015-12-17

Similar Documents

Publication Publication Date Title
WO2013153583A1 (ja) 車載用音声入力装置
US10170111B2 (en) Adaptive infotainment system based on vehicle surrounding and driver mood and/or behavior
JP6284331B2 (ja) 会話支援装置、会話支援方法及び会話支援プログラム
JP6198432B2 (ja) 音声認識制御装置
JP4779748B2 (ja) 車両用音声入出力装置および音声入出力装置用プログラム
US8738368B2 (en) Speech processing responsive to a determined active communication zone in a vehicle
KR101546709B1 (ko) 음성 인식 장치, 그를 가지는 차량 및 그 방법
JP2016161754A (ja) 車載装置
JPWO2008084575A1 (ja) 車載用音声認識装置
JP2010185975A (ja) 車載音声認識装置
CN101437064A (zh) 车辆用通话装置及通话方法
JP4005203B2 (ja) 車載用音声認識装置
JP6214297B2 (ja) ナビゲーション装置および方法
JP2010023639A (ja) 車内会話補助装置
JP4410378B2 (ja) 音声認識方法および装置
JP4478146B2 (ja) 音声認識システム、音声認識方法およびそのプログラム
US20220415318A1 (en) Voice assistant activation system with context determination based on multimodal data
JP4632974B2 (ja) 車載オーディオシステム
JP2020144264A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020514171A (ja) 自動車運転者の支援のための方法及び装置
JP4624825B2 (ja) 音声対話装置および音声対話方法
JP2009098217A (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置、音声認識方法、音声認識プログラム、および記録媒体
JP2003084795A (ja) 車載用音声認識システム
JP7407665B2 (ja) 音声出力制御装置および音声出力制御プログラム
JP2003345389A (ja) 音声認識装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12874134

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014509908

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12874134

Country of ref document: EP

Kind code of ref document: A1