WO2021192518A1 - 音声処理装置 - Google Patents

音声処理装置 Download PDF

Info

Publication number
WO2021192518A1
WO2021192518A1 PCT/JP2021/000984 JP2021000984W WO2021192518A1 WO 2021192518 A1 WO2021192518 A1 WO 2021192518A1 JP 2021000984 W JP2021000984 W JP 2021000984W WO 2021192518 A1 WO2021192518 A1 WO 2021192518A1
Authority
WO
WIPO (PCT)
Prior art keywords
orientation
voice processing
tablet terminal
terminal device
unit
Prior art date
Application number
PCT/JP2021/000984
Other languages
English (en)
French (fr)
Inventor
文伸 加来
Original Assignee
パイオニア株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パイオニア株式会社 filed Critical パイオニア株式会社
Priority to JP2022509296A priority Critical patent/JPWO2021192518A1/ja
Publication of WO2021192518A1 publication Critical patent/WO2021192518A1/ja

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R11/00Arrangements for holding or mounting articles, not otherwise provided for
    • B60R11/02Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control

Definitions

  • the present invention relates to an audio processing device that performs a predetermined process on an audio related to a content output from a speaker arranged in a predetermined space.
  • a function of adjusting the delay of each speaker installed in the vehicle in order to localize the sound of music or the like to an occupant sitting in a seat such as a driver's seat is known as time alignment or the like. (See Patent Document 1).
  • correction such as localization of sound at an appropriate position even when a mobile terminal device is used can be mentioned.
  • the invention according to claim 1 comprises a position detection unit that detects the position of a mobile terminal device having a display screen on which information about the content is displayed, and the detected position of the mobile terminal device. Based on the above, a correction unit for correcting the sound related to the content output from the speakers arranged in a predetermined space is provided.
  • the invention according to claim 7 is a voice processing method executed by a voice processing device that performs a predetermined process on a voice related to a content output from a speaker arranged in a predetermined space, and displays information about the content.
  • a position detection step of detecting the position of the mobile terminal device having the display screen to be displayed, and a correction step of correcting the sound related to the content output from the speaker based on the detected position of the mobile terminal device are included. It is characterized by that.
  • the invention according to claim 8 is characterized in that the voice processing method according to claim 7 is executed by a computer.
  • the invention according to claim 9 is characterized in that the voice processing program according to claim 8 is stored.
  • FIG. It is external perspective view of the apparatus provided with the voice processing apparatus which concerns on one Example of this invention.
  • FIG. It is a block diagram of the receiver part shown in FIG.
  • FIG. It is a flowchart of the operation of the receiver part shown in FIG.
  • the position detection unit detects the position of the portable terminal device having a display screen on which information about the content is displayed
  • the correction unit detects the position of the portable terminal device. Based on this, the sound related to the content output from the speaker arranged in the predetermined space is corrected. By doing so, the sound output from the speaker can be corrected based on the position of the mobile terminal device, so that the sound is localized at an appropriate position even when the mobile terminal device is used. Etc. can be corrected.
  • the correction unit may make corrections based on the position of the mobile terminal device and the orientation of the display screen. By doing so, the orientation of the display screen can be taken into consideration. Therefore, it is possible to estimate where the user is with respect to the mobile terminal device, and it is possible to make a more appropriate correction.
  • the correction unit may set a speaker that outputs at least the left channel and right channel audio among the audio related to the content based on the orientation of the display screen.
  • a tilt acquisition unit for acquiring the inclination of the mobile terminal device with respect to the floor surface may be provided, and the correction unit may make corrections based on the position of the mobile terminal device, the orientation of the display screen, and the inclination with respect to the floor surface. By doing so, it is possible to determine whether the mobile terminal device is fixed to the attachment member or the like, hold it in the hand, or the like, and make corrections such as determining the localization position of the sound.
  • the orientation detection unit acquires detection results from the first geomagnetic sensor provided in the portable terminal device and the second geomagnetic sensor provided separately from the first geomagnetic sensor, respectively, and the first geomagnetic sensor and the first geomagnetic sensor are obtained.
  • the orientation of the display screen may be detected based on the detection result of the geomagnetic sensor. By doing so, the orientation of the display screen of the mobile terminal device can be specified from the orientation of the first geomagnetic sensor with reference to the second geomagnetic sensor. Therefore, even in a moving body such as a vehicle, the orientation of the display screen can be specified by using the geomagnetic sensor.
  • the speaker may be provided in the passenger compartment of the vehicle. By doing so, it is possible to correct the localization of the sound image of the speaker provided in the vehicle interior.
  • the position of the portable terminal device having a display screen on which information about the content is displayed is detected in the position detection step, and the detected mobile terminal is detected in the correction step.
  • the sound related to the content output from the speaker arranged in the predetermined space is corrected.
  • the sound output from the speaker can be corrected based on the position of the mobile terminal device, so that the sound is localized at an appropriate position even when the mobile terminal device is used. Etc. can be corrected.
  • the above-mentioned voice processing method is executed by a computer.
  • the sound output from the speaker can be corrected based on the position of the mobile terminal device using a computer, so that the sound output from the speaker can be corrected to an appropriate position even when the mobile terminal device is used. Corrections such as localization of sound can be made.
  • the above-mentioned voice processing program may be stored in a computer-readable storage medium.
  • the program can be distributed as a single unit in addition to being incorporated in the device, and version upgrades and the like can be easily performed.
  • FIG. 1 shows an external perspective view of the device provided with the voice processing device according to the present embodiment.
  • the device shown in FIG. 1 includes a tablet terminal 10 and a receiver unit 20.
  • the tablet terminal 10 is a well-known flat-plate computer and is a mobile terminal device.
  • the tablet terminal 10 is detachable from the receiver unit 20.
  • the tablet terminal 10 will be described as the mobile terminal device, but other portable terminal devices such as smartphones may be used.
  • the tablet terminal 10 can output the sound or the like of the content reproduced by itself from a speaker installed in a predetermined space such as a vehicle interior.
  • the audio of the content in this embodiment is not limited to video, music, etc., but includes all sounds output by the tablet terminal 10, such as warning sounds emitted from an OS (Operating System), an application, or the like.
  • the receiver unit 20 is installed in the room of a moving body such as a vehicle, and when the tablet terminal 10 is attached, the tablet terminal 10 is fixed.
  • the receiver unit 20 is installed on an instrument panel or the like in the vehicle interior.
  • the receiver unit 20 may be further configured so that the tablet terminal 10 can be charged by a wired, wireless or electrical contact with the terminal.
  • FIG. 2 shows the functional configuration of the tablet terminal 10.
  • the tablet terminal 10 includes a display unit 11, a geomagnetic sensor 12, a gyro sensor 13, a control unit 14, a wireless communication unit 15, and a storage unit 16.
  • the display unit 11 is composed of, for example, a liquid crystal display or the like, and displays information related to video content, an icon indicating an application, an operation screen of the application, or the like. That is, the display unit 11 functions as a display screen on which information about the content is displayed. Further, a touch panel is superimposed on the liquid crystal display constituting the display unit 11, and the tablet terminal 10 is operated by a touch operation.
  • the geomagnetic sensor 12 is a well-known sensor that detects geomagnetism.
  • the geomagnetic sensor 12 may use any method such as a Hall sensor, an MR (Magneto Resistance) sensor, and an MI (Magneto Impedance) sensor, and is not particularly limited.
  • the gyro sensor 13 is a well-known sensor that detects the angular velocity.
  • the gyro sensor 13 is not particularly limited as long as a well-known type of sensor such as a vibration type or an optical type is used.
  • the control unit 14 is composed of, for example, a CPU (Central Processing Unit) or the like, and controls the entire tablet terminal 10.
  • the control unit 14 displays, for example, the content stored in the storage unit 16 or the content acquired from the wireless communication unit 15 on the display unit 11, or executes a process corresponding to an operation performed from the touch panel of the display unit 11. .. Further, the control unit 14 causes the wireless communication unit 15 to transmit the detection results of the geomagnetic sensor 12 and the gyro sensor 13 to the receiver unit 20.
  • a CPU Central Processing Unit
  • the wireless communication unit 15 includes an antenna for wireless communication, a communication circuit, and the like.
  • the wireless communication unit 15 wirelessly communicates with the receiver unit 20 by Bluetooh (registered trademark).
  • the wireless communication unit 15 transmits the detection results of the geomagnetic sensor 12 and the gyro sensor 13 to the receiver unit 20. Further, the wireless communication unit 15 outputs a reference signal such as a predetermined packet in order to detect the distance and direction (angle) from the receiver unit 20 to itself.
  • the measurement of distance and direction by this reference signal is known as a direction detection function of Bluetooh (registered trademark) 5.1.
  • the wireless communication unit 15 may be capable of communicating with an external network (public line or the like) other than the receiver unit 20.
  • the storage unit 16 is composed of a storage device such as an SSD (Solid State Drive), for example, and stores information such as an OS, an application, and contents operating on the tablet terminal 10.
  • SSD Solid State Drive
  • FIG. 3 shows the functional configuration of the receiver unit 20.
  • the receiver unit 20 includes a wireless communication unit 21, a control unit 22, a correction unit 23, an amplifier 24, and a geomagnetic sensor 25.
  • the wireless communication unit 21 includes an antenna for wireless communication, a communication circuit, and the like.
  • the wireless communication unit 21 wirelessly communicates with the tablet terminal 10 by using Bluetoo (registered trademark).
  • the wireless communication unit 21 receives the detection results of the geomagnetic sensor 12 and the gyro sensor 13 from the receiver unit 20.
  • the wireless communication unit 21 receives the reference signal transmitted from the tablet terminal 10 and detects the distance and direction (angle) from the tablet terminal 10.
  • the control unit 22 is composed of, for example, a CPU or the like, and controls the entire receiver unit 20. Further, the control unit 22 estimates the position of the tablet terminal 10 based on the distance and direction from the tablet terminal 10, and further estimates the position, the detection result of the geomagnetic sensor 12 and the gyro sensor 13, and the detection result of the geomagnetic sensor 25. Based on the above, the position to be localized when the sound related to the content being played on the tablet terminal 10 is output from the plurality of speakers in the vehicle is determined.
  • the correction unit 23 is composed of, for example, a DSP (Digital Signal Processor) or the like, and corrects the delay time of the audio signal supplied to each speaker so as to be localized at the position determined by the control unit 22. That is, the correction unit 23 corrects the sound related to the content output from the speaker arranged in the predetermined space based on the detected position of the tablet terminal 10 (portable terminal device).
  • a well-known technique such as time alignment described in the prior art may be used.
  • the amplifier 24 amplifies the audio signal output from the correction unit 23 and outputs it from the speaker 26 installed in the vehicle.
  • the geomagnetic sensor 25 is a well-known sensor that detects the geomagnetism like the geomagnetic sensor 12.
  • the geomagnetic sensor 25 detects a reference orientation when detecting the orientation of the display unit 11 described above.
  • correction unit 23 and the amplifier 24 are included in the receiver unit 20 in the configuration of FIG. 3, they may be separately configured.
  • FIG. 4 is a flowchart of the operation of the tablet terminal 10.
  • a voice processing program that executes a voice processing method can be used.
  • this audio processing program is not limited to being stored in a memory or the like included in the receiver unit 20 or the like, and may be stored in a storage medium such as a memory card or an optical disk.
  • the orientation is detected by the geomagnetic sensor 12 (step S11).
  • the angular velocity is detected by the gyro sensor 13 (step S12).
  • the wireless communication unit 15 generates a reference signal such as a predetermined packet in order to detect the distance and direction (angle) from the receiver unit 20 to itself (step S13).
  • step S14 the direction, angular velocity, and reference signal acquired / generated in steps S11 to S13 are transmitted to the receiver unit 20 (step S14).
  • FIG. 5 is a flowchart of the operation of the receiver unit 20.
  • the wireless communication unit 21 receives the directional signal, the angular velocity, and the reference signal transmitted from the tablet terminal 10 (step S21).
  • the control unit 22 detects the orientation of the display unit 11 based on the received orientation by a method described later. Further, the inclination value of the tablet terminal 10 with respect to the floor surface (ground) is detected based on the received angular velocity. In this embodiment, the tilt value is detected by the tablet terminal 10, but it may be detected by the receiver unit 20 and transmitted.
  • control unit 22 detects the position of the tablet terminal 10 based on the received reference signal (step S22).
  • the position of the tablet terminal 10 is detected based on the direction detection function of Bluetooh (registered trademark) as described above.
  • control unit 22 acquires the received directional direction and angular velocity (step S23).
  • the correction unit 23 estimates the position of the user of the tablet terminal 10 based on the positions acquired / detected in steps S22 to S23, the orientation of the display unit 11, and the inclination of the tablet terminal 10, and the estimated positions.
  • the sound field is corrected for the audio signal of the content so that the sound is localized (step S24). That is, the correction unit 23 corrects based on the position of the tablet terminal 10 (portable terminal device), the orientation of the display unit 11, and the inclination with respect to the floor surface.
  • the contents of the sound field correction include the above-mentioned time alignment, right channel / left channel setting, and the like, but equalization and the like for optimizing the frequency characteristics at the position may be performed.
  • FIG. 6 (a) shows that the direction of the receiver 20 and the display unit 11 of the tablet terminal 10 are in the same direction
  • FIG. 6 (a) shows that the direction of the receiver 20 and the display unit 11 of the tablet terminal 10 are opposite. If this is the case.
  • FIG. 6 it is assumed that the direction detected by the geomagnetic sensor 25 of the receiver unit 20 indicates the direction of arrow A1 (referred to as reference 0 °).
  • reference 0 ° the orientation detected by the geomagnetic sensor 12 of the tablet terminal 10 indicates the direction of arrow A2 (reference 0 °) (FIG. 6A)
  • the orientations detected by the two geomagnetic sensors are the same. It is estimated that the user U of the tablet terminal 10 is at the position shown in FIG. 6 (a).
  • the orientation detected by the geomagnetic sensor 12 of the tablet terminal 10 indicates the direction of arrow A3 (reference 0 ° to 200 °) (FIG. 6B)
  • the orientation detected by the two geomagnetic sensors is approximately the same. Since the directions are opposite, it is estimated that the user U of the tablet terminal 10 is in the position shown in FIG. 6 (b). That is, in FIG. 6 (b), it can be estimated that the display unit 11 is oriented substantially opposite to that in FIG. 6 (a).
  • the detection direction of the geomagnetic sensor 25 of the receiver unit 20 is set to 0 ° as a reference, and the directions detected by the tablet terminal 10 are the same directions from ⁇ 90 ° to + 90 ° with respect to the reference 0 ° (FIG. 6 (a)). ), + 90 ° to + 270 ° may be determined to be in the opposite direction (state of FIG. 6B). That is, the control unit 22 (orientation detection unit) is provided separately from the geomagnetic sensor 12 (first geomagnetic sensor) provided on the tablet terminal 10 (portable terminal device) and the geomagnetic sensor 12 (first geomagnetic sensor).
  • the detection results are acquired from the geomagnetic sensor 25 (second geomagnetic sensor), and the orientation of the display unit 11 is determined based on the detection results of the geomagnetic sensor 12 (first geomagnetic sensor) and the geomagnetic sensor 25 (second geomagnetic sensor). It is being detected.
  • the sound field-corrected audio signal in step S24 is digitally / analog-converted (DA-converted) by the correction unit 23 (step S25), amplified by the amplifier 24 (step S26), and output from the speaker 26 (step S27). ).
  • step S22 functions as a position detection step and step S24 functions as a correction step.
  • FIG. 7 is a diagram schematically showing the passenger compartment of the vehicle.
  • a driver's seat S1, a passenger seat S2, and rear seats S3 and S4 are provided in the vehicle interior.
  • the receiver unit 20 is installed on the instrument panel in the middle front of the driver's seat S1 and the passenger seat S2.
  • front speakers 26a and 26b and rear speakers 26c and 26d are installed in the vehicle interior.
  • the front side and the rear side are described in association with the front side and the rear side of the vehicle for convenience.
  • FIG. 7A shows a state in which the user U is seated in the driver's seat S1 and the tablet terminal 10 is attached to the receiver unit 20.
  • the sound of the right channel is output from the speakers 26a and 26c
  • the sound of the left channel is output from the speakers 26b and 26d.
  • the audio has four channels
  • the audio corresponding to the rear audio channel is output from the speakers 26c and 26d.
  • the tablet terminal 10 is detected as having substantially the same position as the receiver unit 20, and both the tablet terminal 10 and the receiver unit 20 are detected as having the same orientation. Therefore, in this case, the sound image is corrected so as to be localized in the driver's seat S1.
  • the sound image may be corrected so as to be localized between the driver's seat S1 and the passenger seat S2 instead of the driver's seat S1. That is, it suffices to localize to a predetermined position based on the detected position, and it is not necessary to localize near the tablet terminal 10.
  • FIG. 7B shows a state in which the user U is seated in the rear seat S4 and the tablet terminal 10 is fixed to a mounting member or the like provided on the seat back or the like of the passenger seat S2.
  • the position of the tablet terminal 10 is detected as the seat back of the passenger seat S2, and both the tablet terminal 10 and the receiver unit 20 are detected as having the same orientation. Therefore, in this case, the sound image is corrected so as to be localized in the rear seat S4.
  • the user U1 is seated in the rear seat S4, the user U2 is seated in the rear seat S3, and the tablet terminal 10 is provided on the ceiling or the like in the middle of the rear seats S3 and S4. It is in a fixed state.
  • the position of the tablet terminal 10 is detected as the middle front of the rear seats S3 and S4, and both the tablet terminal 10 and the receiver unit 20 are detected as having the same orientation. Therefore, in this case, the sound image is corrected so as to be localized between the rear seats S3 and S4.
  • FIG. 7 (d) shows that the position of the user U is the same as that of FIG. 7 (b), and the tablet terminal 10 is in a state held by the user U.
  • the position of the tablet terminal 10 is detected as the passenger seat S2, and both the tablet terminal 10 and the receiver unit 20 are detected to have the same orientation.
  • the tablet terminal 10 was in an inclined state unlike FIGS. 7 (a) to 7 (c), and the user U handed it. Can be presumed to have in. Therefore, fine adjustment is made so that the localization position is closer to the user U than the localization position in FIG. 7B according to this inclination.
  • the vertical direction (top-bottom direction) is raised (or lowered) according to the inclination.
  • FIG. 7 (e) assumes, for example, an overnight stay in a car, a camper, an autonomous vehicle whose seats can rotate backward, and the like.
  • the tablet terminal 10 is arranged at the rear of the vehicle in a state where the user U lies at an intermediate position between S3 and S4 of the flattened seat, and the direction is arrow A5, that is, FIG.
  • the directions are opposite to those of 7 (a) to (d).
  • the position of the tablet terminal 10 is detected as the rear position of the rear seats S3 and S4, but the orientation of the tablet terminal 10 is detected as opposite to the orientation of the receiver unit 20. Therefore, in this case, the sound image is corrected so as to be localized at a position near the user U shown in the figure.
  • the left and right channels of the stereo sound are inverted. That is, the right channel is output from the speakers 26d and 26b, and the left channel is output from the speakers 26c and 26a.
  • the front sound and the rear sound are also changed. By doing so, even if the display unit 11 is oriented in the opposite direction, an appropriate sound can be output accordingly.
  • FIG. 7E shows a case in which the display unit 11 is oriented in the opposite direction.
  • the present embodiment can be used. can do.
  • This is a case where the orientation of the display unit 11 changes by about 90 °, as shown in FIG. 7A and the like.
  • the position of the tablet terminal 10 and the orientation of the display unit 11 are detected. Therefore, the position of the user may be estimated based on the position and orientation, and the sound image may be localized.
  • the speaker 26a is the left front audio channel
  • the speaker 26c is the right front audio channel
  • the speaker 26b is the left rear audio channel
  • the speaker 26d is the right rear audio channel.
  • the orientation of the display unit 11 is detected by the geomagnetic sensor 12 and the geomagnetic sensor 25, and the inclination of the tablet terminal 10 is detected by the gyro sensor 13, but even if only the position is detected. good.
  • it may be only the position and orientation.
  • the state shown in FIG. 7 (e) cannot be dealt with, but at least in the normal seated state, the localization of the sound image and the like can be corrected.
  • the state of FIG. 7 (d) cannot be determined only by the position and the orientation, but in this case, the minimum correction can be made by making the same correction as in FIG. 7 (b).
  • the tablet terminal 10 may detect the state shown in FIG. 7A by detecting a physical connection such as being electrically connected to the receiver unit 20.
  • the state shown in FIG. 7B may be detected by detecting the physical connection with the mounting member provided on the seat back or the like.
  • the control unit 22 detects the position of the tablet terminal 10 having the display unit 11 on which information about the content is displayed, and the correction unit 23 detects the position of the detected tablet terminal 10. Based on the position, the sound related to the content output from the speaker arranged in the predetermined space is corrected. By doing so, the sound output from the speaker 26 can be corrected based on the position of the tablet terminal 10, so that the sound can be localized at an appropriate position even when the tablet terminal 10 is used. It is possible to make corrections such as making it.
  • control unit 22 detects the orientation of the display unit 11, and the correction unit 23 corrects based on the position of the tablet terminal 10 and the orientation of the display unit 11. By doing so, the orientation of the display unit 11 can also be taken into consideration. Therefore, it is possible to estimate where the user U is with respect to the tablet terminal 10, and it is possible to make a more appropriate correction.
  • the correction unit 23 sets a speaker 26 that outputs at least the sound of the right channel and the sound of the left channel among the sounds related to the content based on the orientation of the display unit 11. By doing so, for example, when the orientation of the display unit 11 is reversed, the left and right sounds can be exchanged. Therefore, it is possible to view the content or the like with a sound that does not give a sense of discomfort.
  • control unit 22 acquires the inclination of the tablet terminal 10, and the correction unit 23 corrects based on the position of the tablet terminal 10, the orientation of the display unit 11, and the inclination of the tablet terminal 10. By doing so, it is possible to determine whether the tablet terminal 10 is fixed to the mounting member or the like, hold it in the hand, or the like, and make corrections such as determining the localization position of the sound.
  • the detection results are acquired from the geomagnetic sensor 12 and the geomagnetic sensor 25 provided on the tablet terminal 10, respectively, and the orientation of the display unit 11 is detected based on the detection results of the geomagnetic sensor 12 and the geomagnetic sensor 25.
  • the orientation of the display unit 11 of the tablet terminal 10 can be specified from the orientation of the geomagnetic sensor 12 with reference to the geomagnetic sensor 25. Therefore, even in a moving body such as a vehicle, the orientation of the display unit 11 can be specified by using the geomagnetic sensor.
  • the receiver unit 20 functions as a voice processing device, but the tablet terminal 10 may function as a voice processing device. Since the direction detection function of Bluetooth (registered trademark) can also be performed on the terminal side, if the tablet terminal 10 acquires the detection information of the geomagnetic sensor 25, the position of itself (tablet terminal 10) is estimated and localized. Is possible to calculate. However, the calculation result needs to be transmitted to an in-vehicle device (not limited to the receiver unit 20) in order to be reflected in the output from the speaker 26.
  • an in-vehicle device not limited to the receiver unit 20
  • the position detection of the tablet terminal 10 is not limited to the direction detection function of Bluetooh (registered trademark).
  • the tablet terminal 10 may be detected by image recognition from the camera image.
  • both the tablet terminal 10 and the receiver unit 20 may be provided with GNSS (Global Navigation Satellite System) receivers to detect relative distances, angles, and the like from the positions (latitudes and longitudes) detected by both.
  • GNSS Global Navigation Satellite System
  • the position of the mobile terminal device such as the tablet terminal 10 is used to localize the sound image at a predetermined position in the vehicle, but the tablet terminal 10 is used, for example, in the rear seat.
  • the sound related to the content of the tablet may be heard well.
  • a technique capable of reproducing different sources in the front seat and the rear seat in a vehicle and listening to them well in each seat is known by Japanese Patent Application Laid-Open No. 2014-165569 and the like. That is, when the position of the tablet terminal 10 is estimated to be in the front, the content being played on the tablet terminal 10 is used as the source on the front seat side, and the position of the tablet terminal 10 is estimated to be in the rear.
  • the above-mentioned technique of the document may be applied using the content being reproduced on the tablet terminal 10 as the source on the rear seat side.
  • the outdoor tablet terminal 10 may be processed so that the sound from the vehicle speaker or the indoor speaker is localized.
  • the tablet terminal reproduces the content information
  • the present invention is not limited to this.
  • the receiver is provided with a television / radio wave receiving unit and a playback unit such as a CD or DVD, and content information is transmitted by communication.
  • the content information is video
  • the video is transmitted to the tablet terminal and the audio is output from the amplifier.
  • the present invention is not limited to the above examples. That is, those skilled in the art can carry out various modifications according to conventionally known knowledge within a range that does not deviate from the gist of the present invention. Even with such a modification, as long as the voice processing apparatus of the present invention is provided, it is, of course, included in the category of the present invention.
  • Tablet terminal mobile terminal device
  • Display display screen
  • Geomagnetic sensor (1st geomagnetic sensor)
  • Receiver unit 21
  • Wireless communication unit 22
  • Control unit position detection unit, orientation detection unit, tilt acquisition unit
  • Correction unit 24
  • Amplifier 25
  • Geomagnetic sensor second geomagnetic sensor

Abstract

携帯端末装置を使用している場合であっても適切な位置に音を定位させる等の補正をする。 レシーバ部(20)は、制御部(22)が、コンテンツに関する情報が表示される表示部(11)を有するタブレット端末(10)の位置を検出し、補正部(23)が、検出されたタブレット端末(10)の位置に基づいて、所定の空間に配置されたスピーカから出力されるコンテンツに関する音声を補正する。

Description

音声処理装置
 本発明は、所定の空間に配置されたスピーカから出力されるコンテンツに関する音声に所定の処理を施す音声処理装置に関する。
 例えば、車両において、運転席等の座席に座っている乗員等に楽曲等の音を定位させるため、車内に設置された各スピーカの遅延等を調整する機能はタイムアライメント等と称されて知られている(特許文献1を参照)。
 このようなタイムアライメントを行う場合、乗員の有無を検出し、乗員の座っている座席の近傍に音を定位させるのが望ましい。この際の乗員の検出方法としては、カメラにより検出することが知られている(特許文献2、3を参照)。
特開2019-54326号公報 特開2019-139582号公報 特開2018-164144号公報
 カメラにより乗員を検出する方法の場合、画像認識等の複雑な処理が必要となる。また、処理の精度により乗員の検出が不正確となる場合もある。また、近年タブレット端末やスマートフォン等の携帯端末装置によりコンテンツを視聴等することが増えている。このような携帯端末装置の使用者(視聴者)に音を定位させる場合、携帯端末装置は車内で移動自在であるので、単に乗員を検出するだけでは、端末の使用者と他の乗員との区別がつかず所望の場所に音を定位させることができない。
 本発明が解決しようとする課題としては、携帯端末装置を使用している場合であっても適切な位置に音を定位させる等の補正をすることが一例として挙げられる。
 上記課題を解決するために、請求項1に記載の発明は、コンテンツに関する情報が表示される表示画面を有する携帯端末装置の位置を検出する位置検出部と、検出された前記携帯端末装置の位置に基づいて、所定の空間に配置されたスピーカから出力される前記コンテンツに関する音声を補正する補正部と、を備えることを特徴としている。
 請求項7に記載の発明は、所定の空間に配置されたスピーカから出力されるコンテンツに関する音声に所定の処理を施す音声処理装置で実行される音声処理方法であって、前記コンテンツに関する情報が表示される表示画面を有する携帯端末装置の位置を検出する位置検出工程と、検出された前記携帯端末装置の位置に基づいて、前記スピーカから出力される前記コンテンツに関する音声を補正する補正工程と、含むことを特徴としている。
 請求項8に記載の発明は、請求項7に記載の音声処理方法をコンピュータにより実行させることを特徴としている。
 請求項9に記載の発明は、請求項8に記載の音声処理プログラムを格納したことを特徴としている。
本発明の一実施例にかかる音声処理装置を備えた機器の外観斜視図である。 図1に示されたタブレット端末のブロック図である。 図1に示されたレシーバ部のブロック図である。 図2に示されたタブレット端末の動作のフローチャートである。 図3に示されたレシーバ部の動作のフローチャートである。 タブレット端末の表示部の向きを特定する方法の説明図である。 タブレット端末で表示等されているコンテンツの音声を定位させる位置の説明図である。
 以下、本発明の一実施形態にかかる音声処理装置を説明する。本発明の一実施形態にかかる音声処理装置は、位置検出部がコンテンツに関する情報が表示される表示画面を有する携帯端末装置の位置を検出し、補正部が検出された前記携帯端末装置の位置に基づいて、所定の空間に配置されたスピーカから出力される前記コンテンツに関する音声を補正する。このようにすることにより、携帯端末装置の位置に基づいてスピーカから出力される音声を補正することができるので、携帯端末装置を使用している場合であっても適切な位置に音を定位させる等の補正をすることができる。
 また、表示画面の向きを検出する向き検出部を備え、補正部は、携帯端末装置の位置及び表示画面の向きに基づいて補正をしてもよい。このようにすることにより、表示画面に向きも考慮することができる。したがって、携帯端末装置に対してどこに使用者がいるのかを推定することも可能となり、より適切な補正をすることができる。
 また、補正部は、表示画面の向きに基づいて、コンテンツに関する音声のうち、少なくとも左チャンネル及び右チャンネルの音声を出力するスピーカを設定してもよい。このようにすることにより、例えば、表示画面の向きが表裏反転した場合に、左右の音声を入れ替えることができるようになる。したがって、違和感のない音声でコンテンツを視聴等することが可能となる。
 また、携帯端末装置の床面に対する傾きを取得する傾き取得部を備え、補正部は、携帯端末装置の位置、表示画面の向き及び床面に対する傾きに基づいて補正をしてもよい。このようにすることにより、携帯端末装置を取り付け部材等に固定しているか、手に持っているか等を判別して、音の定位位置等を決定する等の補正をすることができる。
 また、向き検出部は、携帯端末装置に設けられた第1地磁気センサと、第1地磁気センサとは別に設けられた第2地磁気センサと、からそれぞれ検出結果を取得し、第1地磁気センサと第2地磁気センサの検出結果に基づいて表示画面の向きを検出してもよい。このようにすることにより、第2地磁気センサを基準として、第1地磁気センサの方位から携帯端末装置の表示画面の向きを特定することができる。そのため、車両等の移動体であっても、地磁気センサを用いて表示画面の向きを特定することができる。
 また、スピーカは車両の車室内に設けられていてもよい。このようにすることにより、車室内の設けられたスピーカについての音像の定位等の補正をすることができる。
 また、本発明の一実施形態にかかる音声処理方法は、位置検出工程で、コンテンツに関する情報が表示される表示画面を有する携帯端末装置の位置を検出し、補正工程で、検出された前記携帯端末装置の位置に基づいて、所定の空間に配置されたスピーカから出力される前記コンテンツに関する音声を補正する。このようにすることにより、携帯端末装置の位置に基づいてスピーカから出力される音声を補正することができるので、携帯端末装置を使用している場合であっても適切な位置に音を定位させる等の補正をすることができる。
 また、上述した音声処理方法を、コンピュータにより実行させている。このようにすることにより、コンピュータを用いて携帯端末装置の位置に基づいてスピーカから出力される音声を補正することができるので、携帯端末装置を使用している場合であっても適切な位置に音を定位させる等の補正をすることができる。
 また、上述した音声処理プログラムをコンピュータ読み取り可能な記憶媒体に格納してもよい。このようにすることにより、当該プログラムを機器に組み込む以外に単体でも流通させることができ、バージョンアップ等も容易に行える。
 本発明の一実施例にかかる音声処理装置を図1~図7を参照して説明する。図1に本実施例にかかる音声処理装置を備えた機器の外観斜視図を示す。図1に示した機器は、タブレット端末10と、レシーバ部20と、を備えている。
 タブレット端末10は、周知の平板状のコンピュータであり、携帯端末装置である。タブレット端末10は、レシーバ部20と着脱自在となっている。本実施例では、携帯端末装置としてタブレット端末10で説明するが、スマートフォン等他の携帯可能な端末装置であってもよい。
 タブレット端末10は、レシーバ部20と通信をすることで、自己で再生等されたコンテンツの音声等を車室内等の所定の空間に設置されたスピーカから出力させることができる。本実施例におけるコンテンツの音声とは、映像や音楽等に限らず、OS(Operating System)やアプリ等から発せられる警告音等、タブレット端末10が出力する全ての音を含む。
 レシーバ部20は、例えば車両等の移動体の室内に設置され、タブレット端末10が装着された場合には当該タブレット端末10を固定する。レシーバ部20は、例えば車両であれば車室内のインストルメントパネル等に設置される。レシーバ部20はさらに、有線、無線乃至端末との電気的接点によって、タブレット端末10へ充電が可能に構成されてもよい。
 図2にタブレット端末10の機能構成を示す。タブレット端末10は、表示部11と、地磁気センサ12と、ジャイロセンサ13と、制御部14と、無線通信部15と、記憶部16と、を備えている。
 表示部11は、例えば液晶ディスプレイ等で構成され、映像コンテンツや、アプリを示すアイコン、あるいはアプリの操作画面等のコンテンツに関する情報が表示される。即ち、表示部11は、コンテンツに関する情報が表示される表示画面として機能する。また、表示部11を構成する液晶ディスプレイにタッチパネルが重ねられ、タッチ操作にてタブレット端末10が操作される。
 地磁気センサ12は、地磁気を検出する周知のセンサである。地磁気センサ12は、ホールセンサやMR(Magneto Resistance)センサ、MI(Magneto Impedance)センサ等、いずれの方式を用いてもよく特に限定されない。
 ジャイロセンサ13は、角速度を検出する周知のセンサである。ジャイロセンサ13は、振動式、光学式等の周知の方式のセンサを用いればよく特に限定されない。
 制御部14は、例えばCPU(Central Processing Unit)等で構成され、タブレット端末10の全体制御を司る。制御部14は、例えば記憶部16に記憶されているコンテンツや無線通信部15から取得したコンテンツ等を表示部11に表示させたり、表示部11のタッチパネルからなされた操作に対応する処理を実行する。また、制御部14は、地磁気センサ12及びジャイロセンサ13の検出結果を無線通信部15にレシーバ部20へ送信させる。
 無線通信部15は、無線通信用のアンテナ及び通信回路等を備えている。無線通信部15は、本実施例ではBluetooh(登録商標)によりレシーバ部20と無線通信をする。無線通信部15は、地磁気センサ12及びジャイロセンサ13の検出結果をレシーバ部20へ送信する。また、無線通信部15は、レシーバ部20から自己までの距離や方向(角度)を検出するために所定のパケット等の基準信号を出力する。この基準信号による距離や方向の測定は、Bluetooh(登録商標)5.1の方向検出機能として公知である。なお、無線通信部15は、レシーバ部20以外の外部ネットワーク(公衆回線等)とも通信可能としてもよい。
 記憶部16は、例えばSSD(Solid State Drive)等の記憶装置で構成され、タブレット端末10で動作するOSやアプリ及びコンテンツ等の情報が記憶されている。
 図3にレシーバ部20の機能構成を示す。レシーバ部20は、無線通信部21と、制御部22と、補正部23と、アンプ24と、地磁気センサ25を備えている。
 無線通信部21は、無線通信用のアンテナ及び通信回路等を備えている。無線通信部21は、本実施例ではBluetooh(登録商標)によりタブレット端末10と無線通信をする。無線通信部21は、地磁気センサ12及びジャイロセンサ13の検出結果をレシーバ部20から受信する。また、無線通信部21は、タブレット端末10から送信された基準信号を受信して、タブレット端末10との距離や方向(角度)を検出する。
 制御部22は、例えばCPU等で構成され、レシーバ部20の全体制御を司る。また、制御部22は、タブレット端末10との距離や方向に基づいてタブレット端末10の位置を推定し、さらに推定された位置、地磁気センサ12及びジャイロセンサ13の検出結果及び地磁気センサ25の検出結果に基づいて、タブレット端末10で再生等されているコンテンツにかかる音声を車内の複数のスピーカから出力する際に定位させる位置を決定する。
 補正部23は、例えばDSP(Digital Signal Processor)等で構成され、制御部22で決定された位置に定位するように各スピーカへ供給する音声信号の遅延時間等を補正する。即ち、補正部23は、検出されたタブレット端末10(携帯端末装置)の位置に基づいて、所定の空間に配置されたスピーカから出力されるコンテンツに関する音声を補正する。補正方法は、従来技術に記載したタイムアライメント等の周知技術を用いればよい。
 アンプ24は、補正部23から出力された音声信号を増幅して車内に設置されたスピーカ26から出力する。
 地磁気センサ25は、地磁気センサ12と同様に地磁気を検出する周知のセンサである。地磁気センサ25は、上述する表示部11の向きを検出する際の基準となる方位を検出する。
 なお、図3の構成では補正部23とアンプ24はレシーバ部20に含まれているが、それぞれ別体で構成してもよい。
 次に、上述した構成のタブレット端末10及びレシーバ部20の動作(音声処理方法)について図4及び図5を参照して説明する。図4は、タブレット端末10の動作のフローチャートである。なお、図4及び図5に示したフローチャートをコンピュータで実行されるプログラムとすることで、音声処理方法を実行する音声処理プログラムとすることができる。また、この音声処理プログラムは、レシーバ部20等が有するメモリ等に記憶するに限らず、メモリカードや光ディスク等の記憶媒体に格納してもよい。
 まず、地磁気センサ12により方位を検出する(ステップS11)。そして、ジャイロセンサ13により角速度を検出する(ステップS12)。
 次に、無線通信部15がレシーバ部20から自己までの距離や方向(角度)を検出するために所定のパケット等の基準信号を生成する(ステップS13)。
 そして、ステップS11~S13で取得・生成された方位、角速度や基準信号をレシーバ部20に送信する(ステップS14)。
 図5は、レシーバ部20の動作のフローチャートである。まず、無線通信部21が、タブレット端末10から送信された方位、角速度や基準信号を受信する(ステップS21)。本ステップでは、受信した方位に基づいて、後述する方法で制御部22が表示部11の向きを検出する。また、受信した角速度に基づいてタブレット端末10の床面(地面)に対する傾き値を検出する。なお、本実施例では、傾き値はタブレット端末10で検出しているが、レシーバ部20で検出して送信してもよい。
 次に、制御部22が、受信した基準信号に基づいてタブレット端末10の位置を検出する(ステップS22)。タブレット端末10の位置の検出については、上述したようにBluetooh(登録商標)の方向検出機能に基づいて行われる。次に、受信した方位と角速度を制御部22が取得する(ステップS23)。
 次に、補正部23が、ステップS22~S23で取得・検出した位置及び表示部11の向きやタブレット端末10の傾きに基づいてタブレット端末10の使用者の位置を推定し、その推定された位置に音が定位するようにコンテンツの音声信号について音場補正をする(ステップS24)。即ち、補正部23は、タブレット端末10(携帯端末装置)の位置、表示部11の向き及び床面に対する傾きに基づいて補正をしている。音場補正の内容としては、上述したタイムアライメントや、右チャンネル/左チャンネルの設定等が挙げられるが、当該位置での周波数特性を適正化するイコライジング等を行ってもよい。
 ここで、ステップS24における位置推定の際にタブレット端末10の表示部11の向きを特定する方法について図6を参照して説明する。図6(a)はレシーバ部20とタブレット端末10の表示部11の向きが同方向である場合、図6(a)はレシーバ部20とタブレット端末10の表示部11の向きが逆方向である場合である。図6において、レシーバ部20の地磁気センサ25が検出した方位が矢印A1の方向(基準0°とする)を示しているとする。このとき、タブレット端末10の地磁気センサ12が検出した方位が矢印A2の方向(基準0°)を示している場合(図6(a))は、2つの地磁気センサが検出した方位が同じなので、タブレット端末10の使用者Uは図6(a)に示した位置にいると推定する。
 一方、タブレット端末10の地磁気センサ12が検出した方位が矢印A3の方向(基準0°から200°)を示している場合(図6(b))は、2つの地磁気センサが検出した方位が略反対向きなので、タブレット端末10の使用者Uは図6(b)に示した位置にいると推定する。つまり、図6(b)は、図6(a)に対して表示部11が略反対向きになっていると推定することができる。
 本実施例では、レシーバ部20の地磁気センサ25の検出方位を基準0°として、タブレット端末10で検出された方位が基準0°に対して-90°~+90°は同じ向き(図6(a)の状態)、+90°~+270°は反対向き(図6(b)の状態)と判定すればよい。即ち、制御部22(向き検出部)は、タブレット端末10(携帯端末装置)に設けられた地磁気センサ12(第1地磁気センサ)と、地磁気センサ12(第1地磁気センサ)とは別に設けられた地磁気センサ25(第2地磁気センサ)と、からそれぞれ検出結果を取得し、地磁気センサ12(第1地磁気センサ)と地磁気センサ25(第2地磁気センサ)の検出結果に基づいて表示部11の向きを検出している。
 図5の説明に戻る。ステップS24で音場補正された音声信号は、補正部23でデジタル/アナログ変換(DA変換)され(ステップS25)、アンプ24で増幅されて(ステップS26)、スピーカ26から出力される(ステップS27)。
 上述した説明から明らかなように、ステップS22が位置検出工程、ステップS24が補正工程として機能する。
 ここで、図4及び図5で説明した動作によりタブレット端末10で表示等されているコンテンツの音声を定位させる位置の例について、図7を参照して説明する。図7は、車両の車室を模式的に示した図である。図7においては、車室内には運転席S1、助手席S2、後部座席S3、S4が設けられている。そして、レシーバ部20は、運転席S1、助手席S2の中間前方のインストルメントパネルに設置されている。また、車室内には、前側スピーカ26a、26b、後側スピーカ26c、26dが設置されている。この前側、後側は、便宜上車両の前方や後方に対応付けて記載している。
 図7(a)は、使用者Uが運転席S1に着席し、タブレット端末10がレシーバ部20に装着された状態である。この場合、右チャンネルの音声はスピーカ26a、26cから出力され、左チャンネルの音声はスピーカ26b、26dから出力される。なお、音声が4チャンネルである場合は、後方音声チャンネルに対応した音声がスピーカ26c、26dから出力される。そして、タブレット端末10はレシーバ部20と略同じ位置と検出され、タブレット端末10、レシーバ部20共に同じ方位と検出される。したがって、この場合は、運転席S1に音像が定位するように補正する。なお、運転席S1ではなく、運転席S1と助手席S2の中間に音像が定位するように補正してもよい。つまり、検出された位置に基づいて、所定の位置に定位させればよく、タブレット端末10の近くに定位させなくてもよい。
 図7(b)は、使用者Uが後部座席S4に着席し、タブレット端末10が助手席S2のシートバック等に設けられた取り付け部材等に固定された状態である。この場合、タブレット端末10の位置は助手席S2のシートバックと検出され、タブレット端末10、レシーバ部20共に同じ方位と検出される。したがって、この場合は、後部座席S4に音像が定位するように補正する。
 図7(c)は、使用者U1が後部座席S4に着席し、使用者U2が後部座席S3に着席し、タブレット端末10が後部座席S3、S4の中間前方の天井等に設けられた取り付け部材等に固定された状態である。この場合、タブレット端末10の位置は後部座席S3、S4の中間前方と検出され、タブレット端末10、レシーバ部20共に同じ方位と検出される。したがって、この場合は、後部座席S3とS4の中間に音像が定位するように補正する。
 図7(d)は、図7(b)と使用者Uの位置は同じであって、タブレット端末10は使用者Uが手に持っている状態である。この場合、タブレット端末10の位置は助手席S2と検出され、タブレット端末10、レシーバ部20共に同じ方位と検出される。さらに、ジャイロセンサ13により検出されたタブレット端末10の車両床面に対する傾きから図7(a)~(c)とは異なり、タブレット端末10が傾斜した状態であることが分かり、使用者Uが手に持っていると推定することができる。したがって、この傾きに応じて図7(b)の定位位置よりも定位位置が使用者Uに近くなるように微調整する。例えば、上下方向(天地方向)を傾きに応じて高く(あるいは低く)する。
 図7(e)は、例えば車中泊やキャンピングカー、座席が後方向きに回転可能な自動運転車等を想定したものである。図7(e)は、使用者Uは、フラットにしたシートのS3とS4の中間位置に横になる等の状態で、タブレット端末10が車両後方に配置され、向きが矢印A5、つまり、図7(a)~(d)とは反対向きになっている。この場合、タブレット端末10の位置は後部座席S3、S4の後方位置と検出されるが、タブレット端末10の方位が、レシーバ部20の方位と反対向きと検出される。したがって、この場合は、図示した使用者Uの近傍位置に音像が定位するように補正する。さらに、図7(e)では、ステレオ音声の左右チャンネルを反転させる。つまり、右チャンネルがスピーカ26d、26bから出力され、左チャンネルがスピーカ26c、26aから出力されるようにする。4チャンネルの場合は、前方の音声と後方の音声も変転させる。このようにすることにより、表示部11の向きが反対方向となっても、それに合わせて適切な音声を出力することができる。
 なお、図7(e)は、表示部11の向きが反対向きになるケースであるが、例えば、スピーカ26a、26cが設けられている側(側面)に配置される場合でも本実施例により対応することができる。これは、図7(a)等とは、約90°表示部11の向きが変化するケースである。この場合であっても、少なくともタブレット端末10の位置と表示部11の向きが検出されるので、その位置と向きに基づいて使用者の位置を推定し、音像を定位させればよい。また、音声チャンネルは、スピーカ26aが左前方の音声チャンネル、スピーカ26cが右前方の音声チャンネル、スピーカ26bが左後方の音声チャンネル、スピーカ26dが右後方の音声チャンネルとする。
 なお、上述した実施例では、地磁気センサ12と地磁気センサ25により表示部11の向きを検出し、ジャイロセンサ13によりタブレット端末10の傾きを検出していたが、位置のみを検出するようにしてもよい。あるいは、位置と向きのみであってもよい。位置のみの場合は、図7(e)の状態には対応できないが、少なくとも通常の着席状態では音像の定位等の補正をすることができる。また、位置と向きのみであっても図7(d)の状態は判別できないが、この場合は、図7(b)と同様の補正をすれば最低限の補正をすることはできる。また、タブレット端末10はレシーバ部20と電気的に接続されるなど、物理的な接続を検出して図7(a)の状態を検出してもよい。さらに、シートバック等に設けられた取り付け部材との物理的な接続を検出して図7(b)などの状態を検出してもよい。
 本実施例によれば、レシーバ部20は、制御部22が、コンテンツに関する情報が表示される表示部11を有するタブレット端末10の位置を検出し、補正部23が、検出されたタブレット端末10の位置に基づいて、所定の空間に配置されたスピーカから出力されるコンテンツに関する音声を補正する。このようにすることにより、タブレット端末10の位置に基づいてスピーカ26から出力される音声を補正することができるので、タブレット端末10を使用している場合であっても適切な位置に音を定位させる等の補正をすることができる。
 また、制御部22が、表示部11の向きを検出し、補正部23は、タブレット端末10の位置及び表示部11の向きに基づいて補正をしている。このようにすることにより、表示部11に向きも考慮することができる。したがって、タブレット端末10に対してどこに使用者Uがいるのかを推定することも可能となり、より適切な補正をすることができる。
 また、補正部23は、表示部11の向きに基づいて、コンテンツに関する音声のうち、少なくとも右側チャンネル及び左側チャンネルの音声を出力するスピーカ26を設定している。このようにすることにより、例えば、表示部11の向きが表裏反転した場合に、左右の音声を入れ替えることができるようになる。したがって、違和感のない音声でコンテンツを視聴等することが可能となる。
 また、制御部22は、タブレット端末10の傾きを取得し、補正部23は、タブレット端末10の位置、表示部11の向き及びタブレット端末10の傾きに基づいて補正をしている。このようにすることにより、タブレット端末10を取り付け部材等に固定しているか、手に持っているか等を判別して、音の定位位置等を決定する等の補正をすることができる。
 また、タブレット端末10に設けられた地磁気センサ12と地磁気センサ25からそれぞれ検出結果を取得し、地磁気センサ12と地磁気センサ25の検出結果に基づいて表示部11の向きを検出している。このようにすることにより、地磁気センサ25を基準として、地磁気センサ12の方位からタブレット端末10の表示部11の向きを特定することができる。そのため、車両等の移動体であっても、地磁気センサを用いて表示部11の向きを特定することができる。
 なお、上述した実施例では、レシーバ部20が音声処理装置として機能したが、タブレット端末10が音声処理装置として機能してもよい。Bluetooth(登録商標)の方向検出機能は、端末側でも実施可能であるので、地磁気センサ25の検出情報をタブレット端末10が取得すれば、自己(タブレット端末10)の位置を推定して定位させる位置を算出することは可能である。ただし、算出結果は、スピーカ26からの出力に反映させるために、車載機器(レシーバ部20に限らない)に送信する必要がある。
 また、タブレット端末10の位置検出はBluetooh(登録商標)の方向検出機能に限らない。例えば既に車室内にカメラが設置されているのであればカメラ画像からタブレット端末10を画像認識により検知してもよい。あるいは、タブレット端末10とレシーバ部20の両方にGNSS(Global Navigation Satellite System)受信機を設けて、双方で検出した位置(緯度経度)から相対的な距離や角度等を検出してもよい。
 また、上述した実施例では、車内の所定位置に音像を定位させることにタブレット端末10等の携帯端末装置の位置を利用していたが、当該位置を利用して、例えば後席でタブレット端末10のコンテンツに関する音が良好に聴取できるようにしてもよい。車内で前席と後席とで異なるソースを再生して、それぞれの座席で良好に聴くことができる技術は、特開2014-165569等により公知である。つまり、タブレット端末10の位置が前方にあると推定された場合は、タブレット端末10で再生等されているコンテンツを前席側のソースとし、タブレット端末10の位置が後方にあると推定された場合は、タブレット端末10で再生等されているコンテンツを後席側のソースとして、前記した文献の技術を適用すればよい。
 また、上述した実施例では、車両の車室内で説明したが、住宅等の室内であってもよい。また、屋外のタブレット端末10に対して車両のスピーカや室内のスピーカからの音が定位するように処理を行ってもよい。
 また、上述した実施例では、タブレット端末がコンテンツ情報を再生するとしているが、これに限定されない。例えば、レシーバがテレビ・ラジオ波受信部や、CDまたはDVD等の再生部を備え、通信によってコンテンツ情報を送信する構成も考えられる。レシーバで再生を行う場合、コンテンツ情報が映像であれば、映像をタブレット端末へ送信し、音声はアンプから出力する。
 また、本発明は上記実施例に限定されるものではない。即ち、当業者は、従来公知の知見に従い、本発明の骨子を逸脱しない範囲で種々変形して実施することができる。かかる変形によってもなお本発明の音声処理装置を具備する限り、勿論、本発明の範疇に含まれるものである。
  10   タブレット端末(携帯端末装置)
  11   表示部(表示画面)
  12   地磁気センサ(第1地磁気センサ)
  20   レシーバ部
  21   無線通信部
  22   制御部(位置検出部、向き検出部、傾き取得部)
  23   補正部
  24   アンプ
  25   地磁気センサ(第2地磁気センサ)
  26   スピーカ

Claims (9)

  1.  コンテンツに関する情報が表示される表示画面を有する携帯端末装置の位置を検出する位置検出部と、
     検出された前記携帯端末装置の位置に基づいて、所定の空間に配置されたスピーカから出力される前記コンテンツに関する音声を補正する補正部と、
    を備えることを特徴とする音声処理装置。
  2.  前記表示画面の向きを検出する向き検出部を備え、
     前記補正部は、前記携帯端末装置の位置及び前記表示画面の向きに基づいて前記補正をすることを特徴とする請求項1に記載の音声処理装置。
  3.  前記補正部は、前記表示画面の向きに基づいて、前記コンテンツに関する音声のうち、少なくとも左側及び右側の音声を出力する前記スピーカを設定することを特徴とする請求項2に記載の音声処理装置。
  4.  前記携帯端末装置の床面に対する傾きを取得する傾き取得部を備え、
     前記補正部は、前記携帯端末装置の位置、前記表示画面の向き及び前記床面に対する傾きに基づいて前記補正をすることを特徴とする請求項2または3に記載の音声処理装置。
  5.  前記向き検出部は、前記携帯端末装置に設けられた第1地磁気センサと、前記第1地磁気センサとは別に設けられた第2地磁気センサと、からそれぞれ検出結果を取得し、前記第1地磁気センサと前記第2地磁気センサの前記検出結果に基づいて前記表示画面の向きを検出することを特徴とする請求項2から4のうちいずれか一項に記載の音声処理装置。
  6.  前記スピーカは車両の車室内に設けられていることを特徴とする請求項1から5のうちいずれか一項に記載の音声処理装置。
  7.  所定の空間に配置されたスピーカから出力されるコンテンツに関する音声に所定の処理を施す音声処理装置で実行される音声処理方法であって、
     前記コンテンツに関する情報が表示される表示画面を有する携帯端末装置の位置を検出する位置検出工程と、
     検出された前記携帯端末装置の位置に基づいて、前記スピーカから出力される前記コンテンツに関する音声を補正する補正工程と、
    含むことを特徴とする音声処理方法。
  8.  請求項7に記載の音声処理方法をコンピュータにより実行させることを特徴とする音声処理プログラム。
  9.  請求項8に記載の音声処理プログラムを格納したことを特徴とするコンピュータ読み取り可能な記憶媒体。
PCT/JP2021/000984 2020-03-24 2021-01-14 音声処理装置 WO2021192518A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022509296A JPWO2021192518A1 (ja) 2020-03-24 2021-01-14

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020052368 2020-03-24
JP2020-052368 2020-03-24

Publications (1)

Publication Number Publication Date
WO2021192518A1 true WO2021192518A1 (ja) 2021-09-30

Family

ID=77891320

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/000984 WO2021192518A1 (ja) 2020-03-24 2021-01-14 音声処理装置

Country Status (2)

Country Link
JP (1) JPWO2021192518A1 (ja)
WO (1) WO2021192518A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008151766A (ja) * 2006-11-22 2008-07-03 Matsushita Electric Ind Co Ltd 立体音響制御装置及び立体音響制御方法
JP2016171405A (ja) * 2015-03-11 2016-09-23 アルパイン株式会社 聴取位置設定装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008151766A (ja) * 2006-11-22 2008-07-03 Matsushita Electric Ind Co Ltd 立体音響制御装置及び立体音響制御方法
JP2016171405A (ja) * 2015-03-11 2016-09-23 アルパイン株式会社 聴取位置設定装置

Also Published As

Publication number Publication date
JPWO2021192518A1 (ja) 2021-09-30

Similar Documents

Publication Publication Date Title
US11629971B2 (en) Audio processing apparatus
JP4407571B2 (ja) 車載システム、車室内音場調整システムおよび携帯端末
US9237393B2 (en) Headset with accelerometers to determine direction and movements of user head and method
US9332371B2 (en) Estimation of loudspeaker positions
KR101175303B1 (ko) 음장(音場)보정장치, 음장(音場)보정방법
JP4617351B2 (ja) ナビゲーション装置
US8831761B2 (en) Method for determining a processed audio signal and a handheld device
US7492667B2 (en) Location recognition system using stereophonic sound, transmitter and receiver therein, and method thereof
CN109565629B (zh) 用于控制音频信号的处理的方法和装置
US9774978B2 (en) Position determination apparatus, audio apparatus, position determination method, and program
US8120713B2 (en) Television apparatus
JP2015186072A (ja) 音声信号出力装置
US20090267828A1 (en) GPS Signal Receiving Apparatus
JP2017138277A (ja) 音声ナビゲーションシステム
WO2021192518A1 (ja) 音声処理装置
US10492044B2 (en) Entertaining system of vehicle, method for connecting wireless, and processing sound using the same
JP4518142B2 (ja) 音場補正装置、音場補正方法
KR100667001B1 (ko) 이중 스피커 핸드폰에서의 입체음향 청취 스위트 스폿 유지방법 및 그 장치
JP6532284B2 (ja) 音響特性測定装置、方法およびプログラム
JP7063353B2 (ja) 音声ナビゲーションシステムおよび音声ナビゲーション方法
US20230199426A1 (en) Audio signal output method, audio signal output device, and audio system
JP2016171405A (ja) 聴取位置設定装置
JP7443877B2 (ja) 音声出力制御装置、音声出力システム、音声出力制御方法およびプログラム
US10638249B2 (en) Reproducing apparatus
KR20080005036U (ko) 네비게이션과 미디어의 사운드가 동시에 출력 가능한차량용 사운드 시스템

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21777132

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022509296

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21777132

Country of ref document: EP

Kind code of ref document: A1