WO2016009850A1 - 音声信号再生装置、音声信号再生方法、プログラム、および、記録媒体 - Google Patents

音声信号再生装置、音声信号再生方法、プログラム、および、記録媒体 Download PDF

Info

Publication number
WO2016009850A1
WO2016009850A1 PCT/JP2015/069163 JP2015069163W WO2016009850A1 WO 2016009850 A1 WO2016009850 A1 WO 2016009850A1 JP 2015069163 W JP2015069163 W JP 2015069163W WO 2016009850 A1 WO2016009850 A1 WO 2016009850A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio signal
priority
audio
unit
virtual output
Prior art date
Application number
PCT/JP2015/069163
Other languages
English (en)
French (fr)
Inventor
健明 末永
純生 佐藤
永雄 服部
拓人 市川
Original Assignee
シャープ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シャープ株式会社 filed Critical シャープ株式会社
Publication of WO2016009850A1 publication Critical patent/WO2016009850A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control

Definitions

  • the present invention relates to an audio signal reproducing apparatus and an audio signal reproducing method capable of reproducing a plurality of audio signals.
  • the present invention also relates to a program for operating a computer as an audio signal reproduction device, and a recording medium on which such a program is recorded.
  • Patent Document 1 discloses a glasses-type image information display terminal.
  • Patent Literature 2 discloses a stereophonic sound control apparatus that gives directions to a listener by voice.
  • Japanese Patent Publication Japanese Patent Laid-Open No. 2006-209144 (published on August 10, 2006)” Japanese Patent Publication “JP 2008-151766 (July 3, 2008)”
  • Patent Document 2 an apparatus for notifying information using an audio signal as disclosed in Patent Document 2 is premised on information presentation from one application, and efficiently provides information transmitted from a plurality of applications to a user as audio. There is a problem that can not be.
  • the present invention has been made in view of such circumstances, and a main object of the present invention is to provide an audio signal reproducing apparatus that allows a user to easily recognize the audio indicated by each of a plurality of audio signals.
  • an audio signal reproduction device includes an audio signal acquisition unit that acquires a plurality of audio signals, and a priority of each audio signal acquired by the audio signal acquisition unit.
  • an audio signal processing unit that performs stereophonic processing on each audio signal, and each audio signal that has been subjected to stereoacoustic processing by the audio signal processing unit is reproduced.
  • an audio signal reproducing unit is included in an audio signal reproducing unit.
  • the audio signal reproduction device acquires a plurality of audio signals, determines the priority of each audio signal, and further determines the virtual output position of the audio indicated by each audio signal according to the priority. . Then, the audio signal reproduction device performs stereophonic processing on each audio signal according to the determined virtual output position, and reproduces those audio signals.
  • the audio signal reproduction device is such that the user who listens to the sound indicated by the audio signal output from the audio signal reproduction device perceives that the audio indicated by each audio signal is output from the virtual output position.
  • the signal can be reproduced.
  • the user since the user can hear the sound indicated by the audio signal reproduced by the audio signal reproducing device as if it was output from the virtual output position, the user can respond according to the distance and direction of the virtual output position. Can distinguish multiple voices.
  • the audio signal reproduction device can reproduce the audio indicated by each of the plurality of audio signals so that the user can easily recognize them even when the audio indicated by the plurality of audio signals is simultaneously reproduced.
  • the sound indicated by the sound signal reproduced in the sound signal reproducing device may be output as sound from, for example, a speaker, headphones, or earphones, but is not particularly limited.
  • An audio signal reproduction device includes an audio signal acquisition unit that acquires a plurality of audio signals, and a virtual output position designation that designates a virtual output position from which the sound indicated by each of the audio signals is virtually output According to the information acquisition unit that acquires information, the position determination unit that determines the virtual output position according to the virtual output position designation information acquired by the information acquisition unit, and each virtual output position determined by the position determination unit An audio signal processing unit that performs stereophonic sound processing on each audio signal, and an audio signal reproduction unit that reproduces each audio signal that has been subjected to stereophonic sound processing by the audio signal processing unit.
  • the audio signal reproduction device acquires the virtual output position designation information, and determines the priority of each audio signal based on the information. Therefore, the audio signal reproduction device reproduces the audio indicated by the plurality of audio signals so that the audio is output from the virtual output position corresponding to the priority determined according to the virtual output position designation information of each audio signal. Can do.
  • An audio signal reproduction method is an audio signal reproduction method of an audio signal reproduction device, in which an audio signal acquisition step for acquiring a plurality of audio signals and each audio acquired in the audio signal acquisition step A priority determination step for determining the priority of the signal, and a position determination for determining a virtual output position at which the sound indicated by each of the audio signals is virtually output according to the priority determined in the priority determination step An audio signal processing step for performing stereophonic sound processing on each audio signal according to each virtual output position determined in the step, and in the position determining step, and stereophonic sound processing is performed in the audio signal processing step. An audio signal reproduction step for reproducing each audio signal.
  • An audio signal reproduction method is an audio signal reproduction method of an audio signal reproduction device, in which an audio signal acquisition step of acquiring a plurality of audio signals and the audio indicated by each of the audio signals are virtually An information acquisition step for acquiring virtual output position specification information for specifying a virtual output position to be output; a position determination step for determining the virtual output position according to the virtual output position specification information acquired in the information acquisition step; According to each virtual output position determined in the position determination step, an audio signal processing step for performing stereophonic sound processing on each of the audio signals, and each audio signal subjected to stereophonic processing in the audio signal processing step. An audio signal reproduction step for reproduction.
  • Embodiment 1 The audio signal reproduction device according to Embodiment 1 of the present invention acquires a plurality of audio signals, determines the priority of each audio signal, and arranges each audio signal at a plurality of preset positions according to the priority. To do. Then, after applying the stereophonic sound processing to each audio signal according to the position, each audio signal is output. Details of the first embodiment will be described below.
  • the audio signal reproduction device is an audio system including, for example, a tuner, a deck (player), a speaker, and the like (each component may be a separate body or formed integrally. May be realized by a deck (player) that outputs an audio signal to a speaker or the like.
  • the audio system can include, for example, a portable player, and is not particularly limited.
  • FIG. 1 is a block diagram showing a configuration of an audio signal reproduction device 1 according to the present embodiment.
  • the audio signal reproduction device 1 includes an audio signal acquisition unit 11, a control unit 12, an audio signal reproduction unit 13, and a storage unit 14.
  • the control unit 12 controls the audio signal acquisition unit 11, the audio signal reproduction unit 13, and the storage unit 14, and inputs / outputs data to / from these units.
  • a CPU Central Processing Unit
  • the storage unit 14 stores data from the control unit 12 and reads the stored data, and is realized by a nonvolatile storage device such as an HDD (Hard Disk Drive) and an SSD (Solid State Drive).
  • the HDD Hard Disk Drive
  • SSD Solid State Drive
  • control unit 12 includes a priority determination unit 121, a position determination unit 122, and an audio signal processing unit 123 as functional blocks.
  • the audio signal acquisition unit 11 acquires a plurality of audio signals from the outside.
  • the priority determination unit 121 included in the control unit 12 determines the priority of each audio signal, and the position determination unit 122 virtually outputs the sound indicated by each audio signal based on the priority.
  • the output position is determined, and the audio signal processing unit 123 performs acoustic effect processing on each audio signal according to the virtual output position.
  • the audio signal reproduction unit 13 reproduces and outputs each audio signal subjected to the acoustic effect processing to the outside.
  • FIG. 2 is a diagram showing an outline of the configuration of the audio signal reproduction system 100 including the audio signal reproduction device 1.
  • the audio signal reproduction system 100 includes a signal reception device 3, a digital-analog conversion device (DAC) 4, an amplification device 5, and an earphone 6 in addition to the audio signal reproduction device 1. .
  • DAC digital-analog conversion device
  • the audio signal acquisition unit 11 acquires one or a plurality of audio signals from the outside of the audio signal reproduction device 1, and passes these audio signals to the priority determination unit 121. More specifically, the audio signal acquisition unit 11 acquires an audio signal via the signal receiving device 3 that receives the audio signal from the outside by wired communication or wireless communication from the outside. For example, as illustrated in FIG. 2, the audio signal acquisition unit 11 receives an audio signal from the mobile terminal 2 such as a smartphone via the signal reception device 3.
  • a wireless transmission technology such as Bluetooth (registered trademark) or Wi-Fi (Wireless Fidelity; registered trademark) can be used, but it is not particularly limited.
  • the audio signal may be one monaural audio signal or the like.
  • the audio signal is acquired by wireless communication using Bluetooth (registered trademark), and the audio signal acquired by the audio signal acquisition unit 11 is a digital signal. A case will be described.
  • the audio signal acquisition unit 11 demultiplexes into a plurality of monaural audio signals when input to the audio signal acquisition unit 11. Interleave.
  • the priority determination unit 121 gives priority to each of one or a plurality of audio signals acquired by the audio signal acquisition unit 11 and notifies the position determination unit 122 of the priority of each audio signal.
  • the priority is an index when the position determination unit 122 positions each audio signal.
  • the priority determination unit 121 specifies the time when the gain is equal to or higher than the predetermined value Th as the audio reproduction start time, specifies the time when the gain is lower than the predetermined value Th as the audio reproduction end time,
  • the audio reproduction start time and the audio reproduction end time are stored in the storage unit 14 in association with the corresponding audio signal, and a priority according to the audio reproduction start time is given to the audio signal, and the priority is assigned to the corresponding audio signal.
  • the data are stored in the storage unit 14 in association with each other. The priority is updated every moment, and the lowest priority is assigned to the audio signal after the end time of the audio reproduction has elapsed.
  • the position determination unit 122 determines a virtual output position based on the priority of each audio signal determined by the priority determination unit 121. Further, the position determination unit 122 may determine the virtual output position of each audio signal based on the preconditions stored in advance in the storage unit 14 in addition to the priority. The position determination unit 112 assigns the determined virtual output position to each audio signal, and notifies the audio signal processing unit 123 of the virtual output position of each audio signal.
  • the listener perceives the sound represented by each sound signal as a sound output from a virtual sound source set by the sound effect processing of the sound signal processing unit 123, not an actual sound source such as an earphone (or a speaker). Therefore, hereinafter, the sound source in which the sound indicated by each sound signal is virtually output is referred to as “virtual sound source”, and the position of the sound source is referred to as “virtual sound source position” (virtual output position).
  • the virtual sound source position is a relative position of the virtual sound source arranged around the listener with respect to the listener, and is specified by, for example, three-dimensional coordinates having an origin at an intermediate position between the right ear and the left ear of the listener.
  • the above preconditions are, for example, the number and positions of virtual sound sources arranged around the listener who listens to the sound.
  • the audio signal processing unit 123 applies a head-related transfer function (HRTF) to an arbitrary number of audio signals received by the audio signal acquisition unit 11 and converts the audio signal into a stereophonic audio signal (performs stereo audio processing).
  • HRTF head-related transfer function
  • the converted audio signal is transferred to the audio signal reproduction unit 13.
  • Equation 1 after multiplied by the HL n (z) and HR n (z) is a head-related transfer function (HRTF) to N input signal I n (z)
  • the signal is summed to generate a left ear signal L OUT and a right ear signal R OUT .
  • HL n (z) is the HRTF for the left ear at the virtual sound source position where the input signal I n (z) is set, and HR n (z) is set for the input signal I n (z), respectively.
  • HRTF for the right ear at the virtual sound source position are stored in advance in the storage unit 14 as discrete table information.
  • the audio signal reproduction unit 13 converts the audio signals L OUT and R OUT calculated by the audio signal processing unit 123 into an arbitrary audio format, and reproduces and outputs the same to the outside.
  • the digital-analog converter (DAC) 4 converts the digital audio signal reproduced and output by the audio signal reproducing device 1 into an analog audio signal
  • the amplifying device 5 appropriately converts the analog audio signal.
  • the audio signal reproducing unit 13 reproduces and outputs an audio signal in, for example, an Inter-IC Sound (I 2 S) format.
  • I 2 S Inter-IC Sound
  • FIGS. 3 and 4 are diagrams showing the priority of audio signals at a predetermined time.
  • the audio signal I1 has an audio reproduction start time t and an audio reproduction end time t + 4.
  • the audio signal I2 has an audio reproduction start time of t + 1 and an audio reproduction end time of t + 6.
  • the audio signal I3 has an audio reproduction start time of t + 2 and an audio reproduction end time of t + 5.
  • the priority determination unit 121 sets the audio signal to have a higher priority when the audio reproduction start time is earlier.
  • the priority is higher when the numerical value is smaller.
  • the time t is a reference time when the audio signal reproduction device 1 handles a plurality of audio signals in a predetermined time zone.
  • the time t is determined by the timing at which the audio signal is received from the outside.
  • the time t is determined as the timing for starting the output of the audio signal.
  • the priority is the lowest.
  • the priority determination unit 121 sets 999 as the lowest rank priority for the audio signal I1. Since the audio signal I2 having the highest priority among the audio signals being reproduced at this time is the audio signal I2, the audio signal I2 has the highest priority, and then the audio signal I3 has the highest priority. .
  • FIG. 4 is a diagram illustrating an example in which the priority of the audio signal that has been most recently started to be reproduced is set to be the highest at an arbitrary time.
  • the priority determination unit 121 sets the highest priority 1 to the audio signal I1, and is the lowest for the audio signals I2 and I3 that have not yet been played back.
  • the priority 999 is set.
  • the priority determination unit 121 sets the highest priority 1 to the audio signal I2 for which audio reproduction has been started most recently, and sets the audio signal I1 that has been reproduced first.
  • the priority may be set to be lower than the audio signal I2.
  • FIG. 5 is a flowchart showing the flow of the sound source virtual sound source position determination process, and particularly shows the process of changing the virtual sound source position whenever the priority of the sound signal is changed.
  • the position determination unit 122 determines whether or not the priority of any audio signal In has been changed (S101). If the priority of the audio signal In has not changed (NO in S101), the determination is repeated until there is a change in the priority of the same audio signal or another audio signal. When there is a change in the priority of the audio signal In (YES in S101), the position determination unit 122 determines whether or not the virtual sound source position is set in the audio signal In and the virtual according to the priority. A sound source position is set (S102).
  • FIG. 6 is a diagram showing a listener and virtual sound source positions arranged around the listener. The process of FIG. 5 will be specifically described with reference to FIG.
  • FIG. 6A is a plan view schematically showing the virtual sound source positions P1, P2, P3 and the listener P4.
  • the position and number of virtual sound sources are determined in advance. For example, it is assumed that three virtual sound sources are arranged at equal intervals on the same circumference around the listener P4. explain.
  • the order in which the virtual sound sources are arranged at the virtual sound source positions that is, the positions at which the virtual sound sources of the high-priority audio signals are arranged is determined in advance.
  • the number of audio signals and the number of virtual sound sources acquired by the audio signal acquisition unit 11 are 3, respectively, and virtual sound sources with high priority audio signals are arranged in the order of P1, P2, and P3. It is assumed that information indicating the above preconditions is stored in the storage unit 14 in advance.
  • the audio signal I2 is arranged at P2
  • the priority of the audio signals I2 and I3 is updated with the end of the reproduction of the audio signal I1, so that the position determination unit 122 performs the operation shown in FIG.
  • the virtual sound source position of the audio signal I2 is changed to P1
  • the virtual sound source position of the audio signal I3 is changed to P2.
  • FIG. 7 is a flowchart showing processing that is not changed once the virtual sound source position of each audio signal is determined.
  • the position determination unit 122 determines whether or not the priority of any audio signal In has been changed (S201).
  • the audio signal In indicates one audio signal among one or a plurality of audio signals received by the audio signal acquisition unit 11. If the priority of the audio signal In does not change (NO in S201), the determination is repeated until the priority of the same audio signal or another audio signal changes (YES in S201).
  • the priority of the audio signal In changes at the reproduction start time of each audio signal, but may change under other conditions.
  • the position determination unit 122 determines whether or not the virtual sound source position is not set for the audio signal In (S202). If there is (YES in S202), the virtual sound source position is set in the audio signal In (S203). On the other hand, if the virtual sound source position has already been set in the audio signal In (NO in S202), the position determination unit 122 has determined whether the virtual sound source positions of all the audio signals received by the audio signal acquisition unit 11 have been determined. Is determined (S204), and if it is determined that the virtual sound source positions of all the audio signals have been determined (YES in S204), the process ends.
  • the position determination unit 122 detects a change in priority for the audio signal for which the virtual sound source position is not set. (YES in S201), the determination process is continued.
  • the audio signal I1 is arranged at P1
  • the audio signal at time T t + 2 as shown in FIG. 6 (d).
  • I3 is placed at P3.
  • the present invention is not limited to the above description, and the user may determine the priority of the position of the virtual sound source and the position where the virtual sound source is to be arranged as a precondition for the virtual sound source position determination process.
  • the determined value may be set for the audio signal reproduction device 1 through an interface such as a button to be connected or an external device such as a smartphone.
  • FIG. 8 is a block diagram showing the overall configuration of the audio signal reproduction device 1a according to the second embodiment.
  • the audio signal reproduction device 1a includes, as hardware, an audio signal acquisition unit 11, a control unit 12a, an audio signal reproduction unit 13, a storage unit 14, and an additional information acquisition unit 15 (information acquisition unit).
  • the control unit 12a includes a priority determination unit 121a, a position determination unit 122a, and an audio signal processing unit 123 as functional blocks.
  • the audio signal reproduction device 1a further includes an additional information acquisition unit 15. Accordingly, the processes of the priority determination unit 121a and the position determination unit 122a are different from the processes of the first embodiment, but the processes of the other parts given the same numbers as in FIG. 1 are the same as those of the first embodiment. , Omit the explanation.
  • the audio signal acquisition unit 11 acquires a plurality of audio signals from the outside, and the additional information acquisition unit 15 is attached to each audio signal. Acquire additional information.
  • the priority determination unit 121a included in the control unit 12 determines the priority of each audio signal based on each additional information, and the position determination unit 122a determines each audio signal according to each additional information and each priority. Determine the virtual sound source position.
  • the additional information acquisition unit 15 acquires additional information (so-called metadata) accompanying the audio signal input to the audio signal acquisition unit 11. More specifically, the additional information acquisition unit 15 acquires additional information accompanying the audio signal from the outside separately from the acquisition of the audio signal by the audio signal acquisition unit 11. Note that the additional information acquisition unit 15 may acquire additional information via either a wired or wireless transmission path.
  • FIG. 9 is a diagram illustrating a configuration example of additional information according to the second embodiment.
  • FIG. 9A shows the virtual sound source position where the virtual power source of each audio signal is localized
  • FIG. 9B shows the notification importance, which is the degree of importance of the audio content indicated by the audio signal. It is assumed that the actual additional information includes one or both of these pieces of information.
  • FIG. 9C shows additional information including virtual sound source position designation information (“virtual sound source position” in FIG. 9C) that designates an audio signal name, notification importance, and virtual sound source position.
  • voice signal name expresses the content of an audio
  • “Normal” is set as the notification importance of the audio signal I6 and the audio signal I7 whose audio signal name is “News / Weather”.
  • “Important” is set as the notification importance level of the audio signal I2 whose voice signal name is “call notification” and the audio signal I4 whose name is “schedule alert”.
  • the notification importance of the audio signal I5 whose audio signal name is “emergency earthquake early warning” is set to “emergency”.
  • the additional information is configured in the above-described format, for example, and the additional information acquired by the additional information acquisition unit 15 is notified to the priority determination unit 121a.
  • the virtual sound source positions shown in FIGS. 9A and 9C are arranged on the same circumference centered on the listener and having a predetermined length as the radius, for example, as in FIG. 6A. Alternatively, other arrangements may be used.
  • the additional information changes from moment to moment, and is transmitted as appropriate from an external device such as a smartphone at predetermined time intervals or when the content of the additional information changes. It will be explained as a thing. However, this is not limited to the case where the additional information takes only a fixed value. For example, it may be sent once at the time of initial setting. In the second embodiment, the description will be made assuming that the audio signal and the additional information are input separately.
  • the audio signal and the additional information may be input as integrated information (hereinafter referred to as input data).
  • the audio signal reproduction device 1 b may further include an input data separation unit 16.
  • the input data separation unit 16 obtains input data from the outside, separates the input data into an audio signal and additional information, passes the audio signal to the audio signal acquisition unit 11, and transmits the additional information to the additional information acquisition unit 15. Pass to.
  • the input data separation unit 16 may be connected to the outside of the audio signal reproduction device 1b.
  • the priority determination unit 121a uses a plurality of audio signals acquired by the audio signal acquisition unit 11 and additional information associated with each audio signal acquired by the additional information acquisition unit 15 in a position determination unit 122a described later. Priorities used when positioning the virtual sound source are determined and assigned to each audio signal.
  • the priority determination unit 121a determines the priority as shown in FIG. 11 according to the notification importance.
  • the notification importance is divided into three stages, and among the notification priorities, priority 1 is assigned to “emergency”, priority 2 is assigned to “important”, and “normal” is assigned. Assign priority 3.
  • the priority given here indicates that the smaller the numerical value, the higher the priority.
  • notification importance assignment is not limited to the simple assignment as described above, and other methods may be used.
  • the following formula 2 may be used to calculate the priority A that takes a continuous value in consideration of the passage of time in addition to the importance shown in FIG.
  • a (T) is a priority at time T
  • is an arbitrary coefficient set in advance
  • H (x) is a priority with respect to the notification importance x described above.
  • the position determination unit 122a determines the virtual output position based on the virtual output position designation information included in the additional information acquired by the additional information acquisition unit 15. Furthermore, the position determination unit 112a according to the present embodiment adjusts the virtual output position determined according to the virtual output position designation information based on the priority. In addition to the virtual output position designation information and the priority, the position determination unit 122a may determine the virtual sound source position based on a precondition set in the storage unit 14 in advance.
  • FIG. 12 is a flowchart showing a flow of the virtual sound source position determination process of the audio signal.
  • FIG. 12A shows an outline of the flow of a virtual sound source position determination process for an audio signal.
  • the position determination unit 122a determines whether or not the additional information of any audio signal In has changed (S301). If the additional information of the audio signal In does not change (NO in S301), the determination is repeated until the additional information of the same audio signal or another audio signal changes. When the additional information (for example, notification importance level) of the audio signal In changes (YES in S301), the virtual sound source position of the audio signal is updated (S302).
  • the position determination unit 122a is configured to perform a virtual sound signal virtual so that the listener who listens to the sound indicated by each sound signal is positioned in a different direction. Set the sound source position.
  • the process of updating the virtual sound source position in accordance with the change of the additional information of the arbitrary audio signal In is continued while the audio signal reproduction device 1a is operating as a system (NO in S303).
  • the update process is terminated at the same time as (NO in S303).
  • FIG. 12B shows the flow of the virtual sound source position update process for each audio signal In.
  • the audio signal having the low priority among the arbitrary two audio signals. Is changed to a position that is separated from the virtual output position related to the other audio signal by a predetermined distance or more.
  • the predetermined distance indicates a distance that ensures that the sounds output from the two virtual sound sources can be heard and distinguished from different directions for the listener.
  • the position determination unit 122a sets the virtual sound source position of the audio signal included in the additional information for the audio signal In (S3021). Next, it is determined whether another audio signal Im exists in the vicinity of the audio signal In (S3022).
  • the virtual sound source position of the audio signal In is (x n , y n , z n ) and the virtual sound source position of the audio signal Im is (x m , y m , z m )
  • the following Expression 3 is satisfied. In this case, it is defined that “the audio signal Im exists in the vicinity of the audio signal In”.
  • is a value preset in the storage unit 14.
  • the position determination unit 122a compares the priorities of the two preset audio signals (S3023). Then, when the priority of the audio signal In is higher than the priority of the audio signal Im (YES in S3023), the virtual sound source of the audio signal Im is moved from the original position to a position that does not satisfy Expression 3 (S3024). .
  • the movement method of the virtual sound source position for example, by adding or multiplying preset coefficients ⁇ x , ⁇ y , ⁇ z to the x coordinate, y coordinate, z coordinate of the virtual sound source position to be moved, respectively,
  • the position shall be changed.
  • the position of the movement destination is set so that no other virtual sound source exists near the position after moving the virtual sound source.
  • each virtual sound source may move so as to be arranged on the same circumference centered on the listener, and in that case, when it is difficult to set the interval between the virtual sound sources to be equal to or greater than the predetermined distance ⁇ .
  • the radius of the circumference may be increased.
  • the position determination unit 122a of the audio signal reproduction device 1a determines the positional relationship of the virtual sound source based on the additional information associated with each audio signal, particularly the notification importance and the virtual sound source position in this embodiment. decide. For example, it is assumed that additional information as shown in FIG.
  • the position determination unit 122a when the virtual sound source positions of the two audio signals are in a positional relationship satisfying the following expression 4 (YES in S3022), the notification importance level Since the priority of the audio signal I1 “music” is lower than the priority of the audio signal I2 “call notification” (NO in S3023), the virtual sound source position of the audio signal I1 “music” is set to (x 1 + ⁇ ). x , y 1 + ⁇ y , z 1 + ⁇ z ) (S3025).
  • is a value preset in the storage unit 14.
  • the virtual sound source of the audio signal I1 “music” is continuously placed at the updated position while the reproduction of the audio signal I2 “incoming call notification” continues, but the audio signal I2 “incoming call notification” is reproduced. Since the virtual sound source does not exist near the original position of the audio signal I1 “music” (NO in S3022), based on the virtual sound source position given as additional information to the audio signal I1 “music”, The original position (x 1 , y 1 , z 1 ) is reset (S3021).
  • the virtual sound source position of the audio signal is determined based on the notification importance level of the audio signal, but the position importance level indicating the degree of importance related to the virtual sound source position itself is taken into consideration.
  • the virtual sound source position may be determined.
  • FIG. 13 is a diagram showing additional information including an audio signal name, a virtual sound source position, and position importance. For example, “high” is set as the position importance for an audio signal that is desired to be fixed as much as possible to the designated virtual sound source position. On the other hand, “low” is set as the position importance for an audio signal that is not particularly concerned with the virtual sound source position.
  • a configuration for acquiring an audio signal from the outside has been described.
  • the present invention is not limited to this, and a configuration for acquiring data that can be converted from the outside and generating an audio signal from the data is described. It can also be adopted.
  • a configuration of an audio signal reproduction device 1c that acquires data that can be converted into an audio signal and generates an audio signal from the data will be described below with reference to FIG.
  • FIG. 14 is a block diagram showing the overall configuration of the audio signal reproduction device 1c according to the third embodiment.
  • the audio signal reproduction device 1c includes a voice synthesis unit 17, a control unit 12, an audio signal reproduction unit 13, and a storage unit 14 as hardware.
  • the control unit 12 includes a priority determination unit 121, a position determination unit 122, and an audio signal processing unit 123 as functional blocks.
  • the configuration different from the configuration of the first embodiment is a configuration in which the audio signal reproduction device 1 c includes the audio synthesis unit 17 instead of the audio signal acquisition unit 11.
  • the processing of the other parts given the same numbers as in FIG. 1 is the same as that of the first embodiment, and thus the description thereof is omitted.
  • the voice synthesizing unit 17 acquires a plurality of notification signals that are a plurality of notification signals (convertible data) and are different from the voice signals, and performs a voice synthesis process on each of the acquired plurality of notification signals. An audio signal corresponding to each of the plurality of audio signals is generated.
  • information indicated by the notification signal is also referred to as notification information.
  • the notification information is, for example, information in a text format.
  • the voice synthesizer 17 delivers the voice signal generated (converted into a voice signal) by the voice synthesis process to the priority determination unit 121.
  • the notification information does not necessarily have to be in text format.
  • the storage unit 14 stores correspondence data including a predetermined flag value and a reading voice associated with the flag value.
  • the speech synthesizer 17 acquires a flag value from the outside, refers to the corresponding data in the storage unit 14, identifies the speech to be read from the flag value, and outputs the speech to be read to the priority determination unit 121.
  • the notification information input means may use either a wired or wireless transmission path.
  • the audio signal reproduction device 1d according to the fourth exemplary embodiment of the present invention can set the notification importance level depending on whether or not a keyword is included in data that can be converted into an audio signal.
  • the configuration of the audio signal reproduction device 1c according to this embodiment will be described with reference to FIG.
  • FIG. 15 is a block diagram illustrating a configuration of an audio signal reproduction device 1d according to the fourth embodiment.
  • the audio signal reproduction device 1d includes a voice synthesis unit 17, a control unit 12d, an audio signal reproduction unit 13, and a storage unit 14 as hardware.
  • the control unit 12d includes a priority determination unit 121a, a position determination unit 122a, an audio signal processing unit 123, and an additional information generation unit 124 (detection unit) as functional blocks.
  • control unit 12d further includes an additional information generation unit 124 as a functional block.
  • additional information generation unit 124 as a functional block.
  • the audio signal reproducing device 1d acquires one or more pieces of notification information from the outside, for example, in a text format. These pieces of notification information are input not only to the speech synthesis unit 17 but also to the additional information generation unit 124.
  • the additional information generation unit 124 detects a predetermined keyword from text information acquired from the outside, and sets a notification importance level based on the detected keyword. Specifically, the additional information generation unit 124 checks whether the text information includes a keyword preset by the user and stored in the storage unit 14. If the keyword is included, the notification importance level of the corresponding audio signal is set to “important”, and if the keyword is not included, the notification importance level of the corresponding audio signal is set to “normal” Additional information including the association is generated, stored in the storage unit 14, and transferred to the priority determination unit 121a. The priority determination unit 121a determines the priority of the audio signal based on the notification importance set based on the keyword detected by the additional information generation unit 124.
  • FIG. 16 is a block diagram illustrating a configuration of an audio signal reproduction device 1e according to the fourth embodiment.
  • the audio signal reproduction device 1e As shown in FIG. 16, the audio signal reproduction device 1e according to this modification is replaced with the audio synthesis unit 17 and the additional information generation unit 124 of the audio signal reproduction device 1d shown in FIG. A signal analysis unit 17 (detection unit) is provided. Since the audio signal acquisition unit 11 is as described above, the description thereof is omitted here.
  • the audio signal analysis unit 125 detects a predetermined keyword from the audio signal acquired by the audio information acquisition unit 11, and sets the notification importance based on the detected keyword. Specifically, the audio signal analysis unit 125 analyzes the audio signal acquired by the audio signal acquisition unit 11 to generate text data, and determines whether a preset keyword is included in the converted data. To do. Then, the audio signal analysis unit 125 sets the notification importance of the corresponding audio signal to “important” when the keyword is included, and sets the notification importance of the corresponding audio signal when the keyword is not included. In addition to being set to “normal”, additional information including the association is generated, stored in the storage unit 14, and transferred to the priority determination unit 121a. The priority determination unit 121a determines the priority of the audio signal based on the notification importance set based on the keyword detected by the audio signal analysis unit 125.
  • an audio signal reproduction device provides an audio signal acquisition unit that acquires a plurality of audio signals, and a priority of each audio signal acquired by the audio signal acquisition unit.
  • an audio signal processing unit that performs stereophonic processing on each audio signal, and each audio signal that has been subjected to stereoacoustic processing by the audio signal processing unit is reproduced.
  • an audio signal reproducing unit is provided.
  • the audio signal reproduction device acquires a plurality of audio signals, determines the priority of each audio signal, and further determines the virtual output position of the audio indicated by each audio signal according to the priority. . Then, the audio signal reproduction device performs stereophonic processing on each audio signal according to the determined virtual output position, and reproduces those audio signals.
  • the audio signal reproduction device is such that the user who listens to the sound indicated by the audio signal output from the audio signal reproduction device perceives that the audio indicated by each audio signal is output from the virtual output position.
  • the signal can be reproduced.
  • the user since the user can hear the sound indicated by the audio signal reproduced by the audio signal reproducing device as if it was output from the virtual output position, the user can respond according to the distance and direction of the virtual output position. Can distinguish multiple voices.
  • the audio signal reproduction device can reproduce the audio indicated by each of the plurality of audio signals so that the user can easily recognize them even when the audio indicated by the plurality of audio signals is simultaneously reproduced.
  • the sound indicated by the sound signal reproduced in the sound signal reproducing device may be output as sound from, for example, a speaker, headphones, or earphones, but is not particularly limited.
  • An audio signal reproduction device is the audio signal reproduction apparatus according to aspect 1, wherein the position determination unit is configured to receive a sound indicated by each audio signal whose virtual output position is reproduced by the audio signal reproduction unit.
  • the virtual output positions may be determined so as to be located in different directions.
  • the audio signal reproduction device determines each virtual output position so as to be in a different direction when viewed from the user, performs stereophonic sound processing on each audio signal according to the position, Output audio signals. Therefore, the audio signal reproduction device can reproduce the audio indicated by each of the plurality of audio signals as if they were output from different virtual output positions. In addition, this allows the user to listen to the sound indicated by each sound signal from different directions, so that a plurality of sounds reproduced by each sound signal reproducing device can be easily distinguished.
  • the priority determination unit may determine the priority of the audio signal according to the reproduction start time of the audio signal. .
  • the audio signal reproduction device when determining the priority, the audio signal reproduction device reflects whether the reproduction start time of each audio signal is early or late in the priority. According to this, the audio signal reproduction device can determine the virtual output position of each audio signal according to the priority according to the reproduction start order. Therefore, the audio signal reproduction device can reproduce a plurality of audio signals as if they were output from the virtual output position determined according to the reproduction start time.
  • An audio signal reproduction device includes an audio signal acquisition unit that acquires a plurality of audio signals, and a virtual output position specification that specifies a virtual output position at which the sound indicated by each of the audio signals is virtually output According to the information acquisition unit that acquires information, the position determination unit that determines the virtual output position according to the virtual output position designation information acquired by the information acquisition unit, and each virtual output position determined by the position determination unit An audio signal processing unit that performs stereophonic sound processing on each audio signal, and an audio signal reproduction unit that reproduces each audio signal that has been subjected to stereophonic sound processing by the audio signal processing unit.
  • the audio signal reproduction device acquires the virtual output position designation information, and determines the priority of each audio signal based on the information. Therefore, the audio signal reproduction device reproduces the audio indicated by the plurality of audio signals so that the audio is output from the virtual output position corresponding to the priority determined according to the virtual output position designation information of each audio signal. Can do.
  • the audio signal reproduction device further includes a priority determination unit that determines the priority of each audio signal in the above aspect 4, and the information acquisition unit includes the audio content indicated by the audio signal. Notification priority indicating the degree of importance is further acquired, the priority determination unit determines the priority of each audio signal according to the notification importance, and the position determination unit determines the virtual output position.
  • the virtual output position may be determined according to the designation information and the priority.
  • the audio signal reproduction device determines the priority according to the importance of notifying the user of the sound indicated by each audio signal by acquiring the notification importance. Then, the audio signal reproduction device determines the virtual output position according to the virtual output position designation information and the priority. According to this, it is possible to determine the virtual output position related to the audio signal in consideration of not only the virtual output position designation information but also the priority.
  • the audio signal reproduction device is the audio signal reproduction apparatus according to Aspect 5, wherein the position determination unit adjusts the virtual output position determined according to the virtual output position designation information according to the priority. It is good.
  • the audio signal reproduction device acquires the virtual output position and the notification importance of each audio signal, determines the priority of each audio signal according to the notification importance, and determines the virtual output position and the priority.
  • the virtual output position of the audio signal is determined according to the above.
  • the virtual output position of the audio signal can be arranged at the position intended by the application provider. If there is a problem with the virtual output position, the arrangement of the audio signals can be adjusted according to the priority.
  • the audio signal reproduction device is the audio signal reproduction device according to aspect 6, wherein the position determination unit is configured such that the distance between virtual output positions of any two audio signals of the plurality of audio signals is less than a predetermined distance.
  • the virtual output position of the low-priority audio signal of the two arbitrary audio signals may be adjusted to a position more than the predetermined distance from the virtual output position of the other audio signal. Good.
  • the audio signal reproduction device moves so that the virtual output position corresponding to the audio signal having the lower priority of the two audio signals is more than a predetermined distance away. According to this, by making the virtual output positions of the two sounds different from each other when viewed from the user, the user can hear the sound indicated by each sound signal.
  • the audio signal reproduction device further includes a detection unit that detects a predetermined keyword from the audio signal or the notification signal acquired by the audio signal acquisition unit in the above-described aspects 5 to 7, and the priority level
  • the determination unit may set the priority according to the keyword detected by the detection unit.
  • the audio signal reproduction device is the audio signal reproduction device according to aspects 1 to 8, in which the audio signal acquisition unit acquires a plurality of notification signals different from the audio signal, and each of the acquired notification signals Alternatively, the plurality of voice signals may be acquired by performing voice synthesis processing to generate a voice signal corresponding to each of the plurality of notification signals.
  • An audio signal reproduction method is an audio signal reproduction method of an audio signal reproduction device, in which an audio signal acquisition step for acquiring a plurality of audio signals and each audio acquired in the audio signal acquisition step A priority determination step for determining the priority of the signal, and a position determination for determining a virtual output position at which the sound indicated by each of the audio signals is virtually output according to the priority determined in the priority determination step An audio signal processing step for performing stereophonic sound processing on each audio signal according to each virtual output position determined in the step, and in the position determining step, and stereophonic sound processing is performed in the audio signal processing step. An audio signal reproduction step for reproducing each audio signal.
  • An audio signal reproduction method is an audio signal reproduction method of an audio signal reproduction device, in which an audio signal acquisition step of acquiring a plurality of audio signals and the audio indicated by each of the audio signals are virtually An information acquisition step for acquiring virtual output position specification information for specifying a virtual output position to be output; a position determination step for determining the virtual output position according to the virtual output position specification information acquired in the information acquisition step; According to each virtual output position determined in the position determination step, an audio signal processing step for performing stereophonic sound processing on each of the audio signals, and each audio signal subjected to stereophonic processing in the audio signal processing step. An audio signal reproduction step for reproduction.
  • the audio signal reproduction device may be realized by a computer.
  • the audio signal reproduction device is operated by operating the computer as each unit included in the audio signal reproduction device.
  • a computer-readable recording medium on which the program is recorded fall within the scope of the present invention.
  • Each block of the audio signal reproducing device shown in FIGS. 1, 8, 10, 14, 15, and 16 may be realized by a logic circuit (hardware) formed in an integrated circuit (IC chip) or the like. Alternatively, it may be realized by software using a CPU (Central Processing Unit).
  • a logic circuit hardware
  • IC chip integrated circuit
  • CPU Central Processing Unit
  • the audio signal reproduction device includes a CPU that executes instructions of a program that is software that realizes each function, and a ROM (Read Only Memory) in which the program and various data are recorded so as to be readable by the computer (or CPU).
  • a storage device (these are referred to as “recording media”), a RAM (Random Access Memory) for expanding the program, and the like are provided.
  • the objective of this invention is achieved when a computer (or CPU) reads the said program from the said recording medium and runs it.
  • a “non-temporary tangible medium” such as a tape, a disk, a card, a semiconductor memory, a programmable logic circuit, or the like can be used.
  • the program may be supplied to the computer via an arbitrary transmission medium (such as a communication network or a broadcast wave) that can transmit the program.
  • a transmission medium such as a communication network or a broadcast wave
  • the present invention can also be realized in the form of a data signal embedded in a carrier wave in which the program is embodied by electronic transmission.
  • the present invention can be used in a system that acquires audio signals transmitted by a plurality of applications, makes the sound represented by the plurality of audio signals easy to be heard by a listener, and reproduces and outputs the audio signals.
  • Audio signal reproduction device 1, 1a, 1b, 1c, 1d, 1e Audio signal reproduction device 11 Audio signal acquisition unit 12 Control unit 13 Audio signal reproduction unit 14 Storage unit 15 Additional information acquisition unit (information acquisition unit) 17 speech synthesis unit 121 priority determination unit 122 position determination unit 123 audio signal processing unit 124 additional information generation unit (detection unit) 125 Audio signal analysis unit (detection unit)

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

 複数の音声信号の各々の示す音声をユーザが容易に聞き分けることができるようにする。複数の音声信号を取得する音声信号取得部(11)と、取得された各音声信号の優先度を決定する優先度決定部(121)と、決定された優先度によって上記各音声信号の示す音声の仮想出力位置を決定する位置決定部(122)と、決定された各仮想出力位置に応じて各音声信号に立体音響処理を施す音声信号処理部(123)と、立体音響処理の施された各音声信号を再生する音声信号再生部(13)を備える音声信号再生装置(1)。

Description

音声信号再生装置、音声信号再生方法、プログラム、および、記録媒体
 本発明は、複数の音声信号を再生可能な音声信号再生装置、および、音声信号再生方法に関する。また、音声信号再生装置としてコンピュータを動作させるためのプログラム、および、そのようなプログラムが記録されている記録媒体に関する。
 昨今、スマートフォンなどに代表される、個人向けの情報端末の普及により、各個人が受け取る情報量が増大しつつある。これらの情報端末では、通常複数のアプリケーションが非同期に動作しており、各アプリケーションが不定期かつ高頻度に情報を発信している。
 このような、情報端末(又はアプリケーション)により発信される情報が例えば画像情報や文字情報などである場合、当該情報端末本体に具備されるディスプレイ又は情報端末と接続された外部の表示端末に画像又は文字として表示されることにより、ユーザに提供される。例えば、特許文献1には、眼鏡型の画像情報表示端末が開示されている。
 また、上記のような情報が音声信号である場合、情報端末に具備されるスピーカ又は情報端末に接続されたヘッドホンまたはイヤホンなどを通じて、ステレオ形式または立体音響形式などにより音声として出力され、ユーザに提供される。例えば、特許文献2には、音声により聴取者に方向の指示を与える立体音響制御装置が開示されている。
日本国公開特許公報「特開2006-209144号公報(2006年8月10日公開)」 日本国公開特許公報「特開2008-151766号公報(2008年7月3日公開)」
 しかしながら、特許文献1に示されるような、情報端末から通知された情報を画像として表示する端末では、ユーザはディスプレイなどの画像表示部を注視するために、直前まで行っていた作業を中断する必要があるなど、手間が発生する。
 これに対し、作業の中断を回避するために、画像や文字を表示するのではなく、音声信号を利用することが考えられる。しかし、特許文献2に示されるような、音声信号で情報を通知する装置は、1つのアプリケーションからの情報提示を前提としており、複数のアプリケーションから発信される情報を音声として効率よくユーザに提供することができないという問題がある。
 本発明はかかる事情に鑑みてなされたものであり、その主たる目的は、複数の音声信号の各々の示す音声をユーザが容易に聞き分けることができる音声信号再生装置を提供することである。
 上記課題を解決するために、本発明の一態様に係る音声信号再生装置は、複数の音声信号を取得する音声信号取得部と、上記音声信号取得部により取得された各音声信号の優先度を決定する優先度決定部と、上記優先度決定部により決定された優先度に応じて、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を決定する位置決定部と、上記位置決定部により決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理部と、上記音声信号処理部により立体音響処理の施された各音声信号を再生する音声信号再生部と、を備えている。
 上記の構成によれば、音声信号再生装置は、複数の音声信号を取得し、各音声信号の優先度を決定し、さらに優先度に応じて各音声信号の示す音声の仮想出力位置を決定する。そして、音声信号再生装置は、決定した仮想出力位置に応じて各音声信号に立体音響処理を施すとともに、それらの音声信号を再生する。
 これにより、音声信号再生装置は、当該音声信号再生装置から出力された音声信号の示す音声を聴取するユーザが、仮想出力位置から各音声信号の示す音声が出力されていると知覚するような音声信号を再生することができる。つまり、ユーザには、音声信号再生装置において再生される音声信号の示す音声が、あたかも仮想出力位置から出力されているように聴こえることになるため、ユーザは、仮想出力位置の距離や方向に応じて複数の音声を聞き分けることができる。
 したがって、音声信号再生装置は、同時に複数の音声信号の示す音声を再生する場合であっても、これらの複数の音声信号の各々の示す音声をユーザが容易に聞き分けられるように再生することができる。なお、音声信号再生装置において再生される音声信号の示す音声は、例えば、スピーカ、ヘッドホン又はイヤホンなどから音声として出力されればよいが、特に限定されるものではない。
 本発明の一態様に係る音声信号再生装置は、複数の音声信号を取得する音声信号取得部と、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を指定する仮想出力位置指定情報を取得する情報取得部と、上記情報取得部により取得された仮想出力位置指定情報に従って、上記仮想出力位置を決定する位置決定部と、上記位置決定部により決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理部と、上記音声信号処理部により立体音響処理の施された各音声信号を再生する音声信号再生部と、を備えている。
 上記の構成によれば、音声信号再生装置は、仮想出力位置指定情報を取得し、その情報によって各音声信号の優先度を決定する。従って、音声信号再生装置は、複数の音声信号の示す音声を、各音声信号の仮想出力位置指定情報に応じて決定された優先度に対応する仮想出力位置から出力されているように再生することができる。
 本発明の一態様に係る音声信号再生方法は、音声信号再生装置の音声信号再生方法であって、複数の音声信号を取得する音声信号取得ステップと、上記音声信号取得ステップにおいて取得された各音声信号の優先度を決定する優先度決定ステップと、上記優先度決定ステップにおいて決定された優先度に応じて、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を決定する位置決定ステップと、上記位置決定ステップにおいて決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理ステップと、上記音声信号処理ステップにおいて立体音響処理の施された各音声信号を再生する音声信号再生ステップと、を含んでいる。
 本発明の一態様に係る音声信号再生方法は、音声信号再生装置の音声信号再生方法であって、複数の音声信号を取得する音声信号取得ステップと、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を指定する仮想出力位置指定情報を取得する情報取得ステップと、上記情報取得ステップにおいて取得された仮想出力位置指定情報に従って、上記仮想出力位置を決定する位置決定ステップと、上記位置決定ステップにおいて決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理ステップと、上記音声信号処理ステップにおいて立体音響処理の施された各音声信号を再生する音声信号再生ステップと、を含んでいる。
 本発明の一態様によれば、複数の音声信号の各々の示す音声をユーザが容易に聞き分けることができるという効果を奏する。
本発明の実施形態1に係る音声信号再生装置の構成を示すブロック図である。 本発明の実施形態1に係る音声信号再生システムの構成を示すブロック図である。 本発明の実施形態1に係る所定時刻における音声信号の優先度を示す図であり、(a)は時刻T=t+2での各音声信号の優先度を示し、(b)は時刻T=t+4での各音声信号の優先度を示す。 本発明の実施形態1に係る所定時刻における音声信号の優先度を示す図であり、(a)は時刻T=tでの各音声信号の優先度を示し、(b)は時刻T=t+1での各音声信号の優先度を示す。 本発明の実施形態1に係る音声信号の仮想音源位置決定処理の流れを示すフローチャートであり、音声信号の優先度に変化がある度に仮想音源位置を変更する処理を示す。 本発明の実施形態1に係る聴取者と、その周囲に配置される仮想音源位置を示す図である。 本発明の実施形態1の変形例に係る音声信号の仮想音源位置決定処理の流れを示すフローチャートであり、各音声信号の仮想音源位置が一度決定されると、変更されない処理を示す。 本発明の実施形態2に係る音声信号再生装置の構成を示すブロック図である。 実施形態2に係る付加情報の構成例を示す図であり、(a)は仮想音源位置を含む付加情報を示し、(b)は通知重要度を含む付加情報を示し、(c)は音声信号名、通知重要度および仮想音源位置を含む付加情報を示す。 本発明の実施形態2に係る音声信号再生装置の構成を示すブロック図である。 本発明の実施形態2に係る通知重要度と、優先度との対応付けを示す図である。 本発明の実施形態2に係る音声信号の仮想音源位置決定処理の流れを示すフローチャートであり、(a)は音声信号の仮想音源位置決定処理の流れの概要を示し、(b)は各音声信号の仮想音源位置更新処理の流れを示す。 本発明の実施形態2に係る音声信号名、仮想音源位置および位置重要度を含む付加情報を示す図である。 本発明の実施形態3に係る音声信号再生装置の構成を示すブロック図である。 本発明の実施形態4に係る音声信号再生装置の構成を示すブロック図である。 本発明の実施形態4に係る音声信号再生装置の構成を示すブロック図である。
 以下、本発明の実施の形態について、詳細に説明する。ただし、この実施形態に記載されている構成は、特に特定的な記載がない限り、この発明の範囲をそれのみに限定する趣旨ではなく、単なる説明例に過ぎない。
 〔実施形態1〕
 本発明の実施形態1に係る音声信号再生装置は、複数の音声信号を取得し、各音声信号の優先度を決定し、その優先度に従って、予め設定された複数の位置に各音声信号を配置する。そして、当該位置に応じて各音声信号に立体音響処理を施した上で、各音声信号を出力する。以下、実施形態1の詳細について説明する。
 なお、本実施形態に係る音声信号再生装置は、例えば、チューナ、デッキ(プレーヤ)およびスピーカなどにより構成されるオーディオシステム(各構成要素は別体であってもよいし、一体に形成されていてもよい)において、スピーカなどに音声信号を出力するデッキ(プレーヤ)により実現することができる。なお、オーディオシステムとしては、例えば、ポータブルプレーヤなどを挙げることもできるし、特に限定されるものではない。
 〈装置の構成と概要〉
 まず、本実施形態に係る音声信号再生装置1について、図1を参照して説明する。図1は、本実施形態に係る音声信号再生装置1の構成を示すブロック図である。音声信号再生装置1は、音声信号取得部11、制御部12、音声信号再生部13および記憶部14を備える。制御部12は、音声信号取得部11、音声信号再生部13および記憶部14を制御し、それら各部との間でデータの入出力を行うものであり、例えばCPU(Central Processing Unit)が所定のメモリに格納されたプログラムを実行することによって実現される。記憶部14は、制御部12からデータを記憶したり、記憶したデータを読み出したりするものであり、例えば、HDD(Hard Disk Drive)およびSSD(Solid State Drive)などの不揮発性記憶装置によって実現される。
 また、図1に示すように、制御部12は、機能ブロックとして、優先度決定部121、位置決定部122および音声信号処理部123を備える。
 音声信号再生装置1の各部の概要を簡単に説明すると、音声信号取得部11は、外部から複数の音声信号を取得する。次に、制御部12の備える優先度決定部121は、各音声信号の優先度を決定し、位置決定部122が、優先度に基づいて各音声信号の示す音声が仮想的に出力される仮想出力位置を決定し、音声信号処理部123は、仮想出力位置に応じて各音声信号に音響効果処理を施す。そして、音声信号再生部13は、音響効果処理の施された各音声信号を外部に再生出力する。
 以下に、音声信号再生装置1の備える音声信号取得部11、優先度決定部121、位置決定部122、音声信号処理部123および音声信号再生部13の処理の詳細について、図1および図2を参照して説明する。図2は、音声信号再生装置1を備える音声信号再生システム100の構成の概要を示す図である。図2に示すように、音声信号再生システム100は、音声信号再生装置1に加え、信号受信装置3、デジタル-アナログ変換装置(DAC)4、増幅装置5およびイヤホン6を含んで構成されている。
 (音声信号取得部)
 音声信号取得部11は、音声信号再生装置1の外部から1つまたは複数の音声信号を取得し、それらの音声信号を優先度決定部121に受け渡す。より具体的には、音声信号取得部11は、外部から有線通信又は無線通信により外部から音声信号を受信する信号受信装置3を介して音声信号を取得する。例えば、図2に示すように、音声信号取得部11は、スマートフォンなどの携帯端末2から、信号受信装置3を介して、音声信号を受信する。無線通信としては、Bluetooth(登録商標)やWi-Fi(Wireless Fidelity;登録商標)等の無線伝送技術を用いることができるが、特に限定されるものではない。ここで、音声信号は、1つのモノラル音声信号などであればよい。
 なお、説明の簡単のため、本実施形態では、特に断りがない限り、音声信号はBluetooth(登録商標)を用いた無線通信により取得され、音声信号取得部11の取得する音声信号がデジタル信号である場合について説明する。また、音声信号取得部11は、入力される音声信号が複数の音声信号をインタリーブした形の音声信号である場合には、音声信号取得部11に入力された場合、複数のモノラル音声信号にデインタリーブする。
 (優先度決定部)
 優先度決定部121は、音声信号取得部11が取得した1または複数の音声信号それぞれに優先度を付与し、各音声信号の優先度を位置決定部122に通知する。優先度は、位置決定部122が各音声信号の位置決めを行う際の指標となる。
 優先度決定部121は、各音声信号に関して、ゲインが所定値Th以上になった時刻を音声再生開始時刻として特定し、ゲインが所定値Thより低くなった時刻を音声再生終了時刻として特定し、音声再生開始時刻および音声再生終了時刻を対応する音声信号に関連付けて記憶部14に記憶するとともに、音声再生開始時刻に応じた優先度を音声信号に付与し、当該優先度を対応する音声信号に関連付けて記憶部14に記憶する。なお、優先度は、時々刻々と更新されるものであり、音声再生の終了時刻が経過した後の音声信号には、最低の優先度が割り当てられる。
 (位置決定部)
 位置決定部122は、優先度決定部121により決定された各音声信号の優先度に基づいて、仮想出力位置を決定する。また、位置決定部122は、優先度に加え、予め記憶部14に記憶された前提条件に基づいて、各音声信号の仮想出力位置を決定してもよい。位置決定部112は、決定した仮想出力位置を各音声信号に付与し、各音声信号の仮想出力位置を音声信号処理部123に通知する。
 聴取者は、各音声信号の表す音声を、イヤホン(又はスピーカ)などの実際の音源ではなく、音声信号処理部123の音響効果処理により設定される仮想的な音源から出力される音声として知覚することになるため、以下、各音声信号の示す音声が仮想的に出力される音源を「仮想音源」と呼び、その音源の位置を「仮想音源位置」(仮想出力位置)と呼ぶ。仮想音源位置は、聴取者の周囲に配置される仮想音源の、聴取者に対する相対位置であり、例えば、聴取者の右耳および左耳の中間位置を原点とする3次元座標により特定される。なお、上記の前提条件は、例えば、音声を聴く聴取者の周囲に配置される仮想音源の個数、位置などである。
 (音声信号処理部)
 音声信号処理部123は、音声信号取得部11が受け取った任意の個数の音声信号に頭部伝達関数(HRTF)を適用し、立体音響方式の音声信号に変換し(立体音響処理を施し)、変換後の音声信号を音声信号再生部13に受け渡す。具体的には、下記の式1に示すように、N個の入力信号I(z)に頭部伝達関数(HRTF)であるHL(z)及びHR(z)を乗算した上で合算し、左耳用信号LOUTおよび右耳用信号ROUTを生成する。
Figure JPOXMLDOC01-appb-M000001
 ただし、HL(z)は、それぞれ入力信号I(z)の設定された仮想音源位置における左耳用HRTFであり、HR(z)は、それぞれ入力信号I(z)の設定された仮想音源位置における右耳用のHRTFである。本実施形態1では、これらHRTFは、離散的なテーブル情報として、記憶部14に予め記憶されているものとする。
 (音声信号再生部)
 音声信号再生部13は、音声信号処理部123が算出した音声信号LOUTおよびROUTを、任意の音声フォーマットに変換し、外部に再生出力する。図2に示すように、音声信号再生装置1が再生出力したデジタル音声信号を、デジタル-アナログ変換装置(DAC)4がアナログ音声信号に変換し、さらに増幅装置5が当該アナログ音声信号を適切に信号増幅した上で、イヤホン6が出力するような構成であるとき、音声信号再生部13は、例えばInter-IC Sound(IS)フォーマットで音声信号を再生出力する。
 〈音声信号の優先度〉
 次に、音声信号の優先度およびその変化について、図3および図4を参照して説明する。図3および図4は、所定時刻における音声信号の優先度を示す図である。図3(a)は、時刻T=t+2での各音声信号の優先度を示す。音声信号I1は、音声再生開始時刻がtであり、音声再生終了時刻がt+4である。音声信号I2は、音声再生開始時刻がt+1であり、音声再生終了時刻がt+6である。音声信号I3は、音声再生開始時刻がt+2であり、音声再生終了時刻がt+5である。図示のように、優先度決定部121は、音声再生開始時刻が早い方の、音声信号の優先度が高くなるように設定する。ここでの優先度は、数値の小さい方が高いものとする。
 なお、時刻tは、音声信号再生装置1が所定の時間帯において複数の音声信号を取り扱う際に、基準となる時刻である。音声信号取得部11においては、最初の音声信号の取得を開始した時刻が時刻tであり、その時刻tは外部から音声信号を受信したタイミングにより決まる。一方、音声信号再生部13においては、最初の音声信号の再生出力を開始すべき時刻が時刻tであり、その時刻tは音声信号の出力を開始するタイミングとして決められる。
 図3(b)は、時刻T=t+4での各音声信号の優先度を示す。図示のように、時刻T=t+4においては、音声信号I1の再生が終了しているため、優先度が最も低くなる。このとき、優先度決定部121は、音声信号I1に対して、999を最低ランクの優先度として設定する。この時点で再生状態にある音声信号の中で優先度が最も高いものは音声信号I2となるので、音声信号I2の優先度が最も高く設定され、次いで音声信号I3の優先度が高く設定される。
 上記においては、音声再生開始時刻が早い音声信号の優先度が高くなるように設定されるが、他の条件により優先度を決定することにしてもよい。図4は、任意の時刻において、最も直近に音声再生が開始された音声信号の優先度が最も高くなるように設定する例を示す図である。図4(a)は、時刻T=tでの各音声信号の優先度を示す。図示のように、時刻T=tにおいて、優先度決定部121は、音声信号I1に最も高い優先度1を設定し、まだ再生が開始されていない音声信号I2およびI3に対しては、最も低い優先度999を設定する。図4(b)は、時刻T=t+1での各音声信号の優先度を示す。図示のように、時刻T=t+1において、優先度決定部121は、直近に音声再生が開始された音声信号I2に最も高い優先度1を設定し、先に再生が始まっていた音声信号I1の優先度を音声信号I2より下げるように設定してもよい。
 〈仮想音源位置決定処理〉
 図5は、音声信号の仮想音源位置決定処理の流れを示すフローチャートであり、特に、音声信号の優先度に変化がある度に仮想音源位置を変更する処理を示す。図示のように、まず、位置決定部122は、任意の音声信号Inについて、その優先度に変更があったか否かを判定する(S101)。音声信号Inの優先度が変化していない場合に(S101のNO)、同音声信号または別の音声信号の優先度の変化があるまで判定を繰り返す。音声信号Inの優先度の変化があった場合に(S101のYES)、位置決定部122は、音声信号Inに仮想音源位置が設定されているか否かに関わらず、その優先度に応じた仮想音源位置を設定する(S102)。以上のように、音声信号再生装置1がシステムとして動作している間は(S103のNO)、任意の音声信号の優先度の変化に伴って仮想音源位置の更新を行う処理を継続し、システムの終了(S103のYES)と共に更新処理を終了する。
 図6は、聴取者と、その周囲に配置される仮想音源位置を示す図である。図6を用いて、図5の処理を具体的に説明する。
 図6(a)は、仮想音源位置P1、P2、P3および聴取者P4を模式的に示した平面図である。本実施形態の前提条件として、仮想音源の位置および個数は予め決定されており、例えば、3つの仮想音源が、聴取者P4を中心とする同一円周上に等間隔で配置されているものとして説明する。また、仮想音源位置に仮想音源を配置する順序、すなわち、優先度の高い音声信号の仮想音源をP1~P3のいずれの位置に配置するかについても、予め決定されているものとする。ここでは、音声信号取得部11が取得する音声信号の個数および仮想音源の個数をそれぞれ3とし、P1、P2、P3の順に優先度の高い音声信号の仮想音源が配置されるものとする。なお、上記の前提条件を示す情報が、予め記憶部14に記憶されているものとする。
 このとき、位置決定部122は、図6(b)に示すように、時刻T=tにおいて優先度の最も高い音声信号I1の仮想音源をP1に配置し、図6(c)に示すように、時刻T=t+1において音声信号I2をP2に配置し、図6(d)に示すように、時刻T=t+2では音声信号I3をP3に配置する。時刻T=t+4においては、図3(b)に示すように、音声信号I1の再生終了に伴って、音声信号I2およびI3の優先度が更新されるため、位置決定部122は、図6(e)に示すように、音声信号I2の仮想音源位置をP1に変更し、音声信号I3の仮想音源位置をP2に変更する。
 <変形例>
 上記の実施形態では、音声信号の優先度に変化がある度に仮想音源位置を変更する処理を説明したが、これに限定されるものではない。例えば、各音声信号について仮想音源位置が一度決定されると、その位置を変更しない構成としてもよい。その場合の処理の詳細を、図7を参照して説明する。
 図7は、各音声信号の仮想音源位置が一度決定されると、変更されない処理を示すフローチャートである。
 音声信号再生装置1において、まず、位置決定部122は、任意の音声信号Inについて、その優先度に変更があったか否かを判定する(S201)。ここで、音声信号Inは、音声信号取得部11が受け取った1つまたは複数の音声信号のうち、ある1つの音声信号を示す。音声信号Inの優先度が変化しない場合に(S201のNO)、同音声信号または別の音声信号の優先度が変化する(S201のYES)まで判定を繰り返す。本実施形態では音声信号Inの優先度は、図3を用いて説明したように、各音声信号の再生開始時刻に変化するものとするが、他の条件で変化するものとしてもよい。
 音声信号Inの優先度の変化があった場合に(S201のYES)、位置決定部122は、音声信号Inに対して仮想音源位置が未設定か否かを判定し(S202)、未設定であれば(S202のYES)、音声信号Inに仮想音源位置を設定する(S203)。一方で、音声信号Inに既に仮想音源位置が設定されていれば(S202のNO)、位置決定部122は、音声信号取得部11が受け取った音声信号すべての仮想音源位置を決定したか否かを判定し(S204)、音声信号すべての仮想音源位置を決定したと判定した場合(S204のYES)、処理を終了する。すべての音声信号にはまだ仮想音源位置が付与されていないと判定した場合(S204のNO)、位置決定部122は、仮想音源位置の設定されていない音声信号について、優先度の変化が検知されるまで(S201のYES)判定処理を続ける。
 図6を用いて、図7の示す処理を具体的に説明する。なお、音源に関する前提条件は、図5の示す処理を説明した際の前提条件と同様である。
 このとき、位置決定部122は、音声再生開始時刻の早い音声信号の優先度が高くなるように設定する場合に、図6(b)に示すように、時刻T=tにおいて優先度の最も高い音声信号I1をP1に配置し、図6(c)に示すように、時刻T=t+1において音声信号I2をP2に配置し、図6(d)に示すように、時刻T=t+2において音声信号I3をP3に配置する。そして、図6(e)に示すように、時刻T=t+4においては、音声信号I1の再生が終了するので、音声信号I2およびI3をそれぞれP1およびP2に配置変更する。
 以上、図7の示すフローチャートを用いて説明した実施形態においては、各音声信号の仮想音源位置は一度決定されると、そのときの音声信号に対する仮想音源位置決定処理が終了するまで変更されることはない。
 なお、上記の説明に限ることなく、ユーザが、仮想音源位置決定処理の前提条件として仮想音源の位置および仮想音源を配置すべき位置の優先順位を決定してもよく、音声信号再生装置1に接続されるボタンなどのインタフェース、スマートフォンなどの外部機器を通じて、当該決定した値を音声信号再生装置1に対して設定してもよい。
 〔実施形態2〕
 実施形態1では、各音声信号の再生開始時刻に応じて各音声信号の優先度を決定する構成を例に説明したが、本発明はこれに限定されるものではない。本実施形態では、各音声信号に付随する付加情報に基づいて各音声信号の優先度を決定する構成について、図8から図13を参照して説明する。
 〈音声信号再生装置の概要〉
 まず、図8を参照して本実施形態に係る音声信号再生装置の構成の概要について説明する。図8は、実施形態2に係る音声信号再生装置1aの全体構成を示すブロック図である。
 音声信号再生装置1aは、図8に示すように、ハードウェアとして、音声信号取得部11、制御部12a、音声信号再生部13、記憶部14および付加情報取得部15(情報取得部)を備える。制御部12aは、機能ブロックとして、優先度決定部121a、位置決定部122aおよび音声信号処理部123を備える。
 なお、実施形態1の構成と異なるのは、音声信号再生装置1aが、付加情報取得部15をさらに備える構成である。これに伴って、優先度決定部121aおよび位置決定部122aの処理が実施形態1の処理とは異なるが、図1と同じ番号を付した他部の処理については、実施形態1と同様のため、説明を割愛する。
 また、図8の矢印が示すデータの流れに従って説明すると、音声信号再生装置1aにおいて、音声信号取得部11が外部から複数の音声信号を取得すると共に、付加情報取得部15が各音声信号に付随する付加情報を取得する。次に、制御部12の備える優先度決定部121aが、各付加情報に基づいて各音声信号の優先度を決定し、位置決定部122aが、各付加情報、および、各優先度によって各音声信号の仮想音源位置を決定する。
 以下、付加情報取得部15、優先度決定部121aおよび位置決定部122aの詳細について説明する。
 (付加情報取得部)
 付加情報取得部15は、音声信号取得部11に入力される音声信号に付随する付加情報(所謂メタデータ)を取得する。より具体的には、付加情報取得部15は、音声信号に付随する付加情報を、音声信号取得部11による音声信号の取得とは別に外部から取得する。なお、付加情報取得部15は、有線および無線のいずれの伝送経路を介して付加情報を取得してもよい。
 ここで、付加情報について図9を参照して説明する。図9は、実施形態2に係る付加情報の構成例を示す図である。図9(a)は各音声信号の仮想電源を定位させる仮想音源位置を示し、図9(b)は音声信号の示す音声の内容の重要性の度合いである通知重要度を示す。実際の付加情報は、これらの情報のいずれか一方または両方を含むように構成されるものとする。例えば、図9(c)は、音声信号名、通知重要度および仮想音源位置を指定する仮想音源位置指定情報(図9(c)における「仮想音源位置」)を含む付加情報を示す。なお、音声信号名は、例えば、音声の内容を端的に表すものであることが好ましいが、とくに限定されるものではない。
 図9(c)に示すように、音声信号名(音声の内容)が「音楽」である音声信号I1、音声信号名が「SNS新着通知」である音声信号I3、音声信号名が「ラジオ」である音声信号I6および音声信号名が「ニュース・天気」である音声信号I7の通知重要度には、「通常」が設定されている。音声信号名が「電話着信通知」である音声信号I2および音声信号名が「スケジュールアラート」である音声信号I4の通知重要度には、「重要」が設定されている。また、音声信号名が「緊急地震速報」である音声信号I5の通知重要度には、「緊急」に設定されている。
 付加情報は、例えば上述のような形式で構成されており、付加情報取得部15により取得された付加情報は、優先度決定部121aに通知される。なお、図9(a)および(c)に示す仮想音源位置は、例えば、図6(a)と同様に、聴取者を中心とし、所定長を半径とする同一円周上に配置されていてもよいし、その他の配置になっていてもよい。
 なお、実施形態2において、付加情報は時々刻々と変化するものであり、所定時間ごとに、または、付加情報の内容に変化があった時点で、例えば、スマートフォンなどの外部機器から適宜送信されるものとして説明する。ただし、付加情報が固定値しかとらない場合には、この限りではなく、例えば、初期設定時に一度送られるだけであってもよい。また、実施形態2において、音声信号と、付加情報とは別々に入力されるものとして説明を行う。
 ただし、音声信号および付加情報が統合された情報(以下、入力データと呼ぶ)として入力されてもよい。この場合、図10に示すように、音声信号再生装置1bが入力データ分離部16をさらに設けてもよい。このとき、入力データ分離部16は、外部から入力データを取得し、その入力データを音声信号および付加情報に分離し、音声信号を音声信号取得部11に受け渡し、付加情報を付加情報取得部15に受け渡す。なお、入力データ分離部16は、音声信号再生装置1bの外部に接続されていてもよい。
 (優先度決定部)
 優先度決定部121aは、音声信号取得部11が取得した複数の音声信号と、付加情報取得部15が取得した、各音声信号に付随する付加情報とに応じて、後述する位置決定部122aにおいて仮想音源の位置決めの際に用いられる優先度を決定し、各音声信号に付与する。
 図9(b)に示すような音声信号それぞれの通知重要度が与えられた場合に、優先度決定部121aは、その通知重要度に応じて、図11に示すような優先度を決定する。本実施形態では、通知重要度を3段階とし、当該通知優先度のうち、「緊急」に対して優先度1を割り当て、「重要」に対して優先度2を割り当て、「通常」に対して優先度3を割り当てる。ここで与えられる優先度は、実施形態1と同様、数値が小さいほど優先度が高いことを示すものとする。
 なお、通知重要度の割り当ては、上記のような単純な割り当てに限らず、それ以外の手法を用いてもよい。例えば、下記の式2を用いて、図11に示した重要度に加えて、時間の経過を加味した、連続値をとる優先度Aを算出することとしてもよい。
Figure JPOXMLDOC01-appb-M000002
 ここで、A(T)は時刻Tでの優先度、αは予め設定された任意の係数、H(x)は、上記した通知重要度xに対する優先度である。
 (位置決定部)
 位置決定部122aは、付加情報取得部15により取得される付加情報に含まれる仮想出力位置指定情報に基づき、仮想出力位置を決定する。さらに、本実施形態に係る位置決定部112aは、仮想出力位置指定情報に従って決定した仮想出力位置を、優先度に基づいて調整する。また、位置決定部122aは、仮想出力位置指定情報および優先度に加え、予め記憶部14に設定された前提条件に基づいて、仮想音源位置を決定してもよい。
 〈仮想音源位置決定処理〉
 次に、仮想音源位置決定処理の流れについて、図12を参照して説明する。図12は、音声信号の仮想音源位置決定処理の流れを示すフローチャートである。図12(a)は、音声信号の仮想音源位置決定処理の流れの概要を示す。
 まず、位置決定部122aは、任意の音声信号Inについて、その付加情報が変化したか否かを判定する(S301)。音声信号Inの付加情報が変化しない場合には(S301のNO)、同音声信号または別の音声信号の付加情報が変化がするまで判定を繰り返す。音声信号Inの付加情報(例えば、通知重要度)が変化した場合に(S301のYES)、当該音声信号の仮想音源位置を更新する(S302)。
 音声信号再生装置1aの仮想音源位置更新処理では、位置決定部122aが、各音声信号の示す音声を聴く聴取者にとって、当該各音声の仮想音源が異なる方向に位置付くように、音声信号の仮想音源位置を設定する。以上のように、任意の音声信号Inの付加情報の変化に伴って仮想音源位置の更新を行う処理は、音声信号再生装置1aがシステムとして動作している間(S303のNO)継続し、システムの終了(S303のYES)と共に更新処理を終了する。
 図12(b)は、各音声信号Inの仮想音源位置更新処理の流れを示す。本処理は、複数の音声信号のうちの任意の2つの音声信号の仮想音源位置間の距離が所定の距離未満である場合に、当該任意の2つの音声信号のうち上記優先度の低い音声信号に係る仮想出力位置を、他方の音声信号に係る仮想出力位置から所定の距離以上離れた位置に変更する。ここで、所定の距離とは、2個の仮想音源の出力する音声が聴取者にとって異なる方向から聴こえて、区別できることが担保されるような距離を示す。
 まず、位置決定部122aは、音声信号Inに対して、付加情報に含まれる当該音声信号の仮想音源位置を設定する(S3021)。次に、音声信号Inの付近に別の音声信号Imが存在するか否かを判定する(S3022)。ここで、音声信号Inの仮想音源位置を(x, y, z)、音声信号Imの仮想音源位置を(x, y, z)とするとき、下記の式3を満たす場合に「音声信号Inの付近に音声信号Imが存在する」ものと定義する。
Figure JPOXMLDOC01-appb-M000003
 ただし、βは記憶部14に予め設定された値である。
 音声信号Inの付近に別の音声信号Imが存在しない場合に(S3022のNO)、すべての音声信号をチェックしたときに(S3026のYES)、音声信号の仮想音源位置更新処理を終了する(リターン)。すべての音声信号をチェックしていないときに(S3026のNO)、付近に別の音声信号が存在する音声信号について処理を続ける。
 音声信号Inの付近に別の音声信号Imが存在する場合に(S3022のYES)、音声信号Inの仮想音源と、音声信号Imの仮想音源とが近い位置にあるため、聴取者が、音声信号Inが表す音声の方向と、音声信号Imが表す音声の方向との区別が付かず、聞き分けることが難しい可能性がある。そこで、位置決定部122aが、予め設定されている2つの音声信号の優先度を比較する(S3023)。そして、音声信号Inの優先度が音声信号Imの優先度より高い場合に(S3023のYES)、音声信号Imの仮想音源を本来の位置から上記の式3を満たさなくなる位置まで移動させる(S3024)。一方、音声信号Inの優先度が音声信号Imの優先度以下の場合(S3023のNO)、音声信号Inの仮想音源位置を本来の位置から上記の式3を満たさなくなる位置まで移動させる(S3025)。その後、S3022の判定に戻る。
 仮想音源位置の移動方法については、例えば予め設定された係数γ、γ、γをそれぞれ移動対象の仮想音源位置のx座標、y座標、z座標に加算又は乗算することにより、仮想音源位置を変更するものとする。また、仮想音源を移動した後の位置の付近に、他の仮想音源が存在しないように、移動先の位置を設定するものとする。さらに、各仮想音源が聴取者を中心とする同一円周上に配置されるように移動してもよいし、その場合において、各仮想音源の間隔を所定距離β以上とするのが困難なときには、上記円周の半径を長くしてもよい。
 上記に示した通り、音声信号再生装置1aの位置決定部122aは、各音声信号に紐づけられた付加情報、特に本実施形態では通知重要度および仮想音源位置に基づいて仮想音源の位置関係を決定する。例えば、図9(c)に示すような付加情報を受け取ったと仮定する。そして、音声信号I1「音楽」が仮想音源位置(x1, y1, z1)で再生されている最中に、音声信号I2「電話着信通知」の再生が仮想音源位置(x2, y2, z2)で開始されたとする。上記に示した処理の流れによれば、位置決定部122aは、上記の2つの音声信号の仮想音源位置が下記の式4を満たす位置関係であるときに(S3022のYES)、その通知重要度を比較すると、音声信号I1「音楽」の優先度が音声信号I2「電話着信通知」の優先度より低くなるので(S3023のNO)、音声信号I1「音楽」の仮想音源位置を(x+γ,y+γ,z1+γz)に更新する(S3025)。
Figure JPOXMLDOC01-appb-M000004
 ただし、βは記憶部14に予め設定された値である。
 音声信号I1「音楽」の仮想音源は、音声信号I2「電話着信通知」の再生が続く間には、更新された位置に継続して配置されるが、音声信号I2「電話着信通知」の再生が終了した後には、音声信号I1「音楽」の元位置の付近に仮想音源が存在しなくなるため(S3022のNO)、音声信号I1「音楽」に付加情報として与えられた仮想音源位置に基づき、元の位置 (x1, y1, z1)に再設定される(S3021)。
 また、上記の説明では、音声信号の通知重要度に基づいて音声信号の仮想音源位置を変更するか否かを決定したが、仮想音源位置自体に関する重要性の度合いを示す位置重要度を加味して仮想音源位置を決定してもよい。
 図13は、音声信号名、仮想音源位置および位置重要度を含む付加情報を示す図である。例えば、指定した仮想音源位置に可能な限り固定したいと考える音声信号に対しては、位置重要度に「高」を設定する。一方、仮想音源位置にあまりこだわらない音声信号に対しては、位置重要度に「低」を設定する。
 図13に示すように、音声信号I1「音楽」の位置重要度が「低」であり、音声信号I2「ナビゲーション」の位置重要度が「高」であった場合に、これらの2つの音声信号の仮想音源が上記の式4を満たす位置関係であったときに、音声信号I2「ナビゲーション」の仮想音源位置を(x2, y2, z2)の位置に固定することが優先されるため、音声信号I1「音楽」の仮想音源位置が移動することになり、(x1+γx, y1+γy, z1+γz)に更新される。
 〔実施形態3〕
 実施形態1では、外部から音声信号を取得する構成について説明したが、本発明はこれに限定されるものではなく、外部から変換可能なデータを取得し、そのデータから音声信号を生成する構成を採用することもできる。本実施形態では、音声信号に変換可能なデータを取得し、そのデータから音声信号を生成する音声信号再生装置1cの構成について、図14を参照して以下に説明する。
 図14は、実施形態3に係る音声信号再生装置1cの全体構成を示すブロック図である。音声信号再生装置1cは、ハードウェアとして、音声合成部17、制御部12、音声信号再生部13および記憶部14を備える。制御部12は、機能ブロックとして、優先度決定部121、位置決定部122および音声信号処理部123を備える。
 実施形態1の構成と異なるのは、音声信号再生装置1cが、音声信号取得部11の代わりに音声合成部17を備える構成である。図1と同じ番号を付した他部の処理については、実施形態1と同様のため、説明を割愛する。
 以下、音声合成部17の詳細について説明する。
 (音声合成部)
 音声合成部17は、複数の通知信号(変換可能なデータ)であって音声信号とは異なる複数の通知信号を取得すると共に、取得した複数の通知信号の各々に対して音声合成処理を施して上記複数の音声信号の各々に対応した音声信号を生成する。なお、以降では、通知信号が示す情報を通知情報とも呼称する。ここで、通知情報は、例えばテキスト形式の情報である。そして、音声合成部17は、音声合成処理により生成(音声信号に変換)した音声信号を、優先度決定部121に受け渡す。
 なお、通知情報は、必ずしもテキスト形式である必要はなく、例えば、外部からの通知情報としてフラグ値だけを通知するようにしてもよい。この場合、記憶部14は、予め決められたフラグ値と、当該フラグ値に対応付けられた読み上げ音声とを含む対応データを記憶しておく。そして、音声合成部17は、外部からフラグ値を取得し、記憶部14の対応データを参照してフラグ値から読み上げ音声を特定し、その読み上げ音声を優先度決定部121に出力する。
 また、実施形態1、2と同様に、通知情報の入力手段は、有線および無線のいずれの伝送経路を使用してもよい。
 〔実施形態4〕
 本発明の実施形態4に係る音声信号再生装置1dは、音声信号に変換可能なデータにキーワードが含まれているか否かに応じて、通知重要度を設定することもできる。本実施形態に係る音声信号再生装置1cの構成について、図15を参照して説明する。
 図15は、実施形態4に係る音声信号再生装置1dの構成を示すブロック図である。音声信号再生装置1dは、ハードウェアとして、音声合成部17、制御部12d、音声信号再生部13および記憶部14を備える。制御部12dは、機能ブロックとして、優先度決定部121a、位置決定部122a、音声信号処理部123および付加情報生成部124(検出部)を備える。
 実施形態3の構成と異なるのは、制御部12dが、機能ブロックとして付加情報生成部124をさらに備える構成である。図1および図14と同じ番号を付した他の処理部の動作については同図を用いて説明した実施形態1および3と同様のため、説明を割愛する。
 音声信号再生装置1dは、外部から1つまたは複数の通知情報を、例えばテキスト形式により取得する。これらの通知情報は、音声合成部17だけでなく、付加情報生成部124にも入力される。
 (付加情報生成部)
 付加情報生成部124は、外部から取得したテキスト情報から所定のキーワードを検出すると共に、検出したキーワードに基づいて通知重要度を設定する。具体的には、付加情報生成部124は、テキスト情報に、ユーザによって予め設定されて記憶部14に記憶されているキーワードが含まれるか否かをチェックする。キーワードが含まれる場合に、対応する音声信号の通知重要度を「重要」に設定し、キーワードが含まれていない場合に、対応する音声信号の通知重要度を「通常」に設定するとともに、その対応付けを含む付加情報を生成し、記憶部14に記憶し、優先度決定部121aに受け渡す。なお、優先度決定部121aは、付加情報生成部124により検出されたキーワードに基づいて設定された通知重要度によって、音声信号の優先度を決定する。
 <変形例>
 また、本実施形態に係る音声信号再生装置1eは、音声信号からキーワードを抽出することもできる。本変形例に係る音声信号再生装置1eについて、図16を参照して説明する。図16は、実施形態4に係る音声信号再生装置1eの構成を示すブロック図である。
 図16に示すように、本変形例に係る音声信号再生装置1eは、図14に示す音声信号再生装置1dの音声合成部17及び付加情報生成部124に替えて、音声信号取得部11及び音声信号解析部17(検出部)を備えている。なお、音声信号取得部11については上述の通りであるため、ここではその説明は省略する。
 (音声信号解析部)
 音声信号解析部125は、音声情報取得部11により取得された音声信号から所定のキーワードを検出すると共に、検出したキーワードに基づいて通知重要度を設定する。具体的には、音声信号解析部125は、音声信号取得部11が取得した音声信号を解析してテキストデータ化し、テキストデータ化されたデータに予め設定されたキーワードが含まれるか否かを判定する。そして、音声信号解析部125は、キーワードが含まれる場合に、対応する音声信号の通知重要度を「重要」に設定し、キーワードが含まれていない場合に、対応する音声信号の通知重要度を「通常」に設定するとともに、その対応付けを含む付加情報を生成し、記憶部14に記憶し、優先度決定部121aに受け渡す。なお、優先度決定部121aは、音声信号解析部125により検出されたキーワードに基づいて設定された通知重要度によって、音声信号の優先度を決定する。
 〔まとめ〕
 上記課題を解決するために、本発明の態様1に係る音声信号再生装置は、複数の音声信号を取得する音声信号取得部と、上記音声信号取得部により取得された各音声信号の優先度を決定する優先度決定部と、上記優先度決定部により決定された優先度に応じて、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を決定する位置決定部と、上記位置決定部により決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理部と、上記音声信号処理部により立体音響処理の施された各音声信号を再生する音声信号再生部と、を備えている。
 上記の構成によれば、音声信号再生装置は、複数の音声信号を取得し、各音声信号の優先度を決定し、さらに優先度に応じて各音声信号の示す音声の仮想出力位置を決定する。そして、音声信号再生装置は、決定した仮想出力位置に応じて各音声信号に立体音響処理を施すとともに、それらの音声信号を再生する。
 これにより、音声信号再生装置は、当該音声信号再生装置から出力された音声信号の示す音声を聴取するユーザが、仮想出力位置から各音声信号の示す音声が出力されていると知覚するような音声信号を再生することができる。つまり、ユーザには、音声信号再生装置において再生される音声信号の示す音声が、あたかも仮想出力位置から出力されているように聴こえることになるため、ユーザは、仮想出力位置の距離や方向に応じて複数の音声を聞き分けることができる。
 したがって、音声信号再生装置は、同時に複数の音声信号の示す音声を再生する場合であっても、これらの複数の音声信号の各々の示す音声をユーザが容易に聞き分けられるように再生することができる。なお、音声信号再生装置において再生される音声信号の示す音声は、例えば、スピーカ、ヘッドホン又はイヤホンなどから音声として出力されればよいが、特に限定されるものではない。
 本発明の態様2に係る音声信号再生装置は、上記態様1において、上記位置決定部が、上記各仮想出力位置が上記音声信号再生部により再生される各音声信号の示す音声を聴く聴取者から互いに異なる方向に位置するように、上記各仮想出力位置を決定することとしてもよい。
 上記の構成によれば、音声信号再生装置は、ユーザから見て異なる方向になるように各仮想出力位置を決定し、それらの位置に応じて各音声信号に立体音響処理を施して、それらの音声信号を出力する。したがって、音声信号再生装置は、複数の音声信号の各々の示す音声があたかも異なる仮想出力位置から出力されているように再生することができる。また、これにより、ユーザは、各音声信号の示す音声を異なる方向から聴くことができるので、各音声信号再生装置において再生される複数の音声を容易に聞き分けることができる。
 本発明の態様3に係る音声信号再生装置は、上記態様1および2において、上記優先度決定部が、上記音声信号の再生開始時刻に応じて当該音声信号の優先度を決定することとしてもよい。
 上記の構成によれば、音声信号再生装置は、優先度を決定する際に、各音声信号の再生開始時刻が早いか、遅いかを優先度に反映する。これによれば、音声信号再生装置は、再生開始の順序に応じた優先度に応じて各音声信号の仮想出力位置が決定することができる。したがって、音声信号再生装置は、複数の音声信号を、再生開始時刻に応じて決定した仮想出力位置から出力されているように再生することができる。
 本発明の態様4に係る音声信号再生装置は、複数の音声信号を取得する音声信号取得部と、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を指定する仮想出力位置指定情報を取得する情報取得部と、上記情報取得部により取得された仮想出力位置指定情報に従って、上記仮想出力位置を決定する位置決定部と、上記位置決定部により決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理部と、上記音声信号処理部により立体音響処理の施された各音声信号を再生する音声信号再生部と、を備えている。
 上記の構成によれば、音声信号再生装置は、仮想出力位置指定情報を取得し、その情報によって各音声信号の優先度を決定する。従って、音声信号再生装置は、複数の音声信号の示す音声を、各音声信号の仮想出力位置指定情報に応じて決定された優先度に対応する仮想出力位置から出力されているように再生することができる。
 本発明の態様5に係る音声信号再生装置は、上記態様4において、上記各音声信号の優先度を決定する優先度決定部をさらに備え、上記情報取得部が、上記音声信号の示す音声の内容の重要性の度合いを示す通知重要度をさらに取得し、上記優先度決定部が、上記通知重要度に応じて上記各音声信号の優先度を決定し、上記位置決定部が、上記仮想出力位置指定情報、及び、上記優先度に応じて、上記仮想出力位置を決定することとしてもよい。
 上記の構成によれば、音声信号再生装置は、通知重要度を取得することにより、各音声信号の示す音声をユーザに通知すべき重要性に応じて優先度を決定する。そして、音声信号再生装置は、仮想出力位置指定情報、及び、優先度に応じて、仮想出力位置を決定する。これによれば、仮想出力位置指定情報だけでなく、優先度を含めて考慮して、音声信号に係る仮想出力位置を決定することができる。
 本発明の態様6に係る音声信号再生装置は、上記態様5において、上記位置決定部が、上記仮想出力位置指定情報に応じて決定した上記仮想出力位置を、上記優先度に応じて調整することとしてもよい。
 上記の構成によれば、音声信号再生装置は、各音声信号の仮想出力位置および通知重要度を取得し、通知重要度に応じて各音声信号の優先度を決定し、仮想出力位置および優先度に応じて音声信号の仮想出力位置を決定する。
 これによれば、アプリケーションの提供者が意図する位置に音声信号の仮想出力位置を配置することができる。そして、仮想出力位置に支障があれば、優先度に応じて音声信号の配置を調整することができる。
 本発明の態様7に係る音声信号再生装置は、上記態様6において、上記位置決定部が、上記複数の音声信号のうちの任意の2つの音声信号の仮想出力位置間の距離が所定の距離未満である場合に、当該任意の2つの音声信号のうち上記優先度の低い音声信号の仮想出力位置を、他方の音声信号の仮想出力位置から上記所定の距離以上離れた位置に調整することとしてもよい。
 2個の音声信号の示す音声の仮想出力位置の間が所定距離未満である場合には、ユーザから見て2つの仮想出力位置の距離や方向があまり変わらないため、ユーザが聞き分けられない可能性がある。上記の構成によれば、音声信号再生装置は、そのような場合に、2個の音声信号のうち、優先度が低い方の音声信号に対応する仮想出力位置を所定距離以上離れるように移動する。これによれば、ユーザから見て2つの音声の仮想出力位置を異なる方向にすることにより、ユーザが各音声信号の示す音声を聞き分けることができる。
 本発明の態様8に係る音声信号再生装置は、上記態様5から7において、上記音声信号取得部により取得された音声信号または通知信号から所定のキーワードを検出する検出部をさらに備え、上記優先度決定部が、上記検出部により検出されたキーワードに応じて上記優先度を設定することとしてもよい。
 本発明の態様9に係る音声信号再生装置は、上記態様1から8において、上記音声信号取得部が、音声信号とは異なる複数の通知信号を取得すると共に、取得した複数の通知信号の各々に対して音声合成処理を施して上記複数の通知信号の各々に対応した音声信号を生成することによって、上記複数の音声信号を取得することとしてもよい。
 本発明の態様10に係る音声信号再生方法は、音声信号再生装置の音声信号再生方法であって、複数の音声信号を取得する音声信号取得ステップと、上記音声信号取得ステップにおいて取得された各音声信号の優先度を決定する優先度決定ステップと、上記優先度決定ステップにおいて決定された優先度に応じて、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を決定する位置決定ステップと、上記位置決定ステップにおいて決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理ステップと、上記音声信号処理ステップにおいて立体音響処理の施された各音声信号を再生する音声信号再生ステップと、を含んでいる。
 本発明の態様11に係る音声信号再生方法は、音声信号再生装置の音声信号再生方法であって、複数の音声信号を取得する音声信号取得ステップと、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を指定する仮想出力位置指定情報を取得する情報取得ステップと、上記情報取得ステップにおいて取得された仮想出力位置指定情報に従って、上記仮想出力位置を決定する位置決定ステップと、上記位置決定ステップにおいて決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理ステップと、上記音声信号処理ステップにおいて立体音響処理の施された各音声信号を再生する音声信号再生ステップと、を含んでいる。
 なお、本発明の各態様に係る音声信号再生装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記音声信号再生装置が備える各部として動作させることにより上記音声信号再生装置をコンピュータにて実現させるプログラム、及びそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
 〔ソフトウェアによる実現例〕
 図1、図8、図10、図14、図15および図16に示す音声信号再生装置の各ブロックは、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
 後者の場合、音声信号再生装置は、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラム及び各種データがコンピュータ(又はCPU)で読み取り可能に記録されたROM(Read Only Memory)又は記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)等を備えている。そして、コンピュータ(又はCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路等を用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
 本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
 本発明は、複数のアプリケーションが発信する音声信号を取得し、複数の音声信号が表す音声を聴取者が聴きやすい形式にして、音声信号を再生出力するシステムに利用することができる。
 1、1a、1b、1c、1d、1e 音声信号再生装置
 11 音声信号取得部
 12 制御部
 13 音声信号再生部
 14 記憶部
 15 付加情報取得部(情報取得部)
 17 音声合成部
 121 優先度決定部
 122 位置決定部
 123 音声信号処理部
 124 付加情報生成部(検出部)
 125 音声信号解析部(検出部)

Claims (13)

  1.  複数の音声信号を取得する音声信号取得部と、
     上記音声信号取得部により取得された各音声信号の優先度を決定する優先度決定部と、
     上記優先度決定部により決定された優先度に応じて、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を決定する位置決定部と、
     上記位置決定部により決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理部と、
     上記音声信号処理部により立体音響処理の施された各音声信号を再生する音声信号再生部と、
     を備えることを特徴とする音声信号再生装置。
  2.  上記位置決定部は、
     上記各仮想出力位置が上記音声信号再生部により再生される各音声信号の示す音声を聴く聴取者から互いに異なる方向に位置するように、上記各仮想出力位置を決定する
     ことを特徴とする請求項1に記載の音声信号再生装置。
  3.  上記優先度決定部は、
     上記音声信号の再生開始時刻に応じて当該音声信号の優先度を決定する
     ことを特徴とする請求項1または2に記載の音声信号再生装置。
  4.  複数の音声信号を取得する音声信号取得部と、
     上記各音声信号の示す音声が仮想的に出力される仮想出力位置を指定する仮想出力位置指定情報を取得する情報取得部と、
     上記情報取得部により取得された仮想出力位置指定情報に従って、上記仮想出力位置を決定する位置決定部と、
     上記位置決定部により決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理部と、
     上記音声信号処理部により立体音響処理の施された各音声信号を再生する音声信号再生部と、
     を備えることを特徴とする音声信号再生装置。
  5.  上記各音声信号の優先度を決定する優先度決定部をさらに備え、
     上記情報取得部は、上記音声信号の示す音声の内容の重要性の度合いを示す通知重要度をさらに取得し、
     上記優先度決定部は、上記通知重要度に応じて上記各音声信号の優先度を決定し、
     上記位置決定部は、上記仮想出力位置指定情報、及び、上記優先度に応じて、上記仮想出力位置を決定する
     ことを特徴とする請求項4に記載の音声信号再生装置。
  6.  上記位置決定部は、上記仮想出力位置指定情報に応じて決定した上記仮想出力位置を、上記優先度に応じて調整する、
     ことを特徴とする請求項5に記載の音声信号再生装置。
  7.  上記位置決定部は、
     上記複数の音声信号のうちの任意の2つの音声信号の仮想出力位置間の距離が所定の距離未満である場合に、当該任意の2つの音声信号のうち上記優先度の低い音声信号の仮想出力位置を、他方の音声信号の仮想出力位置から上記所定の距離以上離れた位置に調整する
     ことを特徴とする請求項6に記載の音声信号再生装置。
  8.  上記音声信号取得部により取得された音声信号または通知信号から所定のキーワードを検出する検出部をさらに備え、
     上記優先度決定部は、上記検出部により検出されたキーワードに応じて上記優先度を設定する
     ことを特徴とする請求項5から7のいずれか一項に記載の音声信号再生装置。
  9.  上記音声信号取得部は、音声信号とは異なる複数の通知信号を取得すると共に、取得した複数の通知信号の各々に対して音声合成処理を施して上記複数の通知信号の各々に対応した音声信号を生成することによって、上記複数の音声信号を取得する
     ことを特徴とする請求項1から8のいずれか一項に記載の音声信号再生装置。
  10.  音声信号再生装置の音声信号再生方法であって、
     複数の音声信号を取得する音声信号取得ステップと、
     上記音声信号取得ステップにおいて取得された各音声信号の優先度を決定する優先度決定ステップと、
     上記優先度決定ステップにおいて決定された優先度に応じて、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を決定する位置決定ステップと、
     上記位置決定ステップにおいて決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理ステップと、
     上記音声信号処理ステップにおいて立体音響処理の施された各音声信号を再生する音声信号再生ステップと、
     を含むことを特徴とする音声信号再生方法。
  11.  音声信号再生装置の音声信号再生方法であって、
     複数の音声信号を取得する音声信号取得ステップと、
     上記各音声信号の示す音声が仮想的に出力される仮想出力位置を指定する仮想出力位置指定情報を取得する情報取得ステップと、
     上記情報取得ステップにおいて取得された仮想出力位置指定情報に従って、上記仮想出力位置を決定する位置決定ステップと、
     上記位置決定ステップにおいて決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理ステップと、
     上記音声信号処理ステップにおいて立体音響処理の施された各音声信号を再生する音声信号再生ステップと、
     を含むことを特徴とする音声信号再生方法。
  12.  請求項1から9のいずれか一項に記載の音声信号再生装置としてコンピュータを機能させるためのプログラムであって、コンピュータを前記各部として機能させるためのプログラム。
  13.  請求項12に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
PCT/JP2015/069163 2014-07-16 2015-07-02 音声信号再生装置、音声信号再生方法、プログラム、および、記録媒体 WO2016009850A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014-146029 2014-07-16
JP2014146029 2014-07-16

Publications (1)

Publication Number Publication Date
WO2016009850A1 true WO2016009850A1 (ja) 2016-01-21

Family

ID=55078348

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/069163 WO2016009850A1 (ja) 2014-07-16 2015-07-02 音声信号再生装置、音声信号再生方法、プログラム、および、記録媒体

Country Status (1)

Country Link
WO (1) WO2016009850A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021161722A1 (ja) * 2020-02-10 2021-08-19 ソニーグループ株式会社 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006115364A (ja) * 2004-10-18 2006-04-27 Hitachi Ltd 音声出力制御装置
WO2010109918A1 (ja) * 2009-03-26 2010-09-30 パナソニック株式会社 復号化装置、符号化復号化装置および復号化方法
JP2011205617A (ja) * 2010-03-05 2011-10-13 Ricoh Co Ltd 伝送管理システム、伝送管理方法、及び伝送管理プログラム
JP2013214948A (ja) * 2012-03-06 2013-10-17 Panasonic Corp 信号処理装置
JP2014011509A (ja) * 2012-06-27 2014-01-20 Sharp Corp 音声出力制御装置、音声出力制御方法、プログラム及び記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006115364A (ja) * 2004-10-18 2006-04-27 Hitachi Ltd 音声出力制御装置
WO2010109918A1 (ja) * 2009-03-26 2010-09-30 パナソニック株式会社 復号化装置、符号化復号化装置および復号化方法
JP2011205617A (ja) * 2010-03-05 2011-10-13 Ricoh Co Ltd 伝送管理システム、伝送管理方法、及び伝送管理プログラム
JP2013214948A (ja) * 2012-03-06 2013-10-17 Panasonic Corp 信号処理装置
JP2014011509A (ja) * 2012-06-27 2014-01-20 Sharp Corp 音声出力制御装置、音声出力制御方法、プログラム及び記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021161722A1 (ja) * 2020-02-10 2021-08-19 ソニーグループ株式会社 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム

Similar Documents

Publication Publication Date Title
CN108141696B (zh) 用于空间音频调节的系统和方法
EP3364638B1 (en) Recording method, recording playing method and apparatus, and terminal
US20230300532A1 (en) Fully customizable ear worn devices and associated development platform
EP2885786B1 (en) Transforming audio content for subjective fidelity
CN105679345B (zh) 一种音频处理方法及电子设备
US9769585B1 (en) Positioning surround sound for virtual acoustic presence
WO2020182020A1 (zh) 一种音频信号播放方法及显示设备
AU2014295217B2 (en) Audio processor for orientation-dependent processing
US20170195817A1 (en) Simultaneous Binaural Presentation of Multiple Audio Streams
US20150049879A1 (en) Method of audio processing and audio-playing device
US20230122545A1 (en) Bit stream generation method, encoding device, and decoding device
JP6522105B2 (ja) 音声信号再生装置、音声信号再生方法、プログラム、および記録媒体
JP2020030571A (ja) 情報処理装置、コンピュータプログラムおよび情報処理方法
WO2020022154A1 (ja) 通話端末、通話システム、通話端末の制御方法、通話プログラム、および記録媒体
WO2016009850A1 (ja) 音声信号再生装置、音声信号再生方法、プログラム、および、記録媒体
JP2016067817A (ja) シミュレーションゲームシステム、情報処理方法及びプログラム
KR20150073538A (ko) 음향 광고 또는 음향 데이터를 재생하는 보청기
CN112307161B (zh) 用于播放音频的方法和装置
JP6765697B1 (ja) 情報処理装置、情報処理方法およびコンピュータプログラム
CN115550831A (zh) 通话音频的处理方法、装置、设备、介质及程序产品
JP2021071663A (ja) 音声再生デバイス、音声再生システム、音声再生方法および音声再生プログラム
KR101060546B1 (ko) 사용자의 청력에 맞게 오디오 재생파일을 변환하는 장치
JP2022161881A (ja) 音声処理方法及び音声処理装置
JP2020030788A (ja) 情報処理装置、コンピュータプログラムおよび情報処理方法
CN117931116A (en) Volume adjusting method, electronic equipment and medium

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15822120

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

NENP Non-entry into the national phase

Ref country code: JP

122 Ep: pct application non-entry in european phase

Ref document number: 15822120

Country of ref document: EP

Kind code of ref document: A1