WO2022215187A1 - 音声再生システム、音声再生方法およびコンピュータプログラム - Google Patents

音声再生システム、音声再生方法およびコンピュータプログラム Download PDF

Info

Publication number
WO2022215187A1
WO2022215187A1 PCT/JP2021/014739 JP2021014739W WO2022215187A1 WO 2022215187 A1 WO2022215187 A1 WO 2022215187A1 JP 2021014739 W JP2021014739 W JP 2021014739W WO 2022215187 A1 WO2022215187 A1 WO 2022215187A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio
audio reproduction
sound
switching
mode
Prior art date
Application number
PCT/JP2021/014739
Other languages
English (en)
French (fr)
Inventor
健太郎 山本
Original Assignee
株式会社ネイン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ネイン filed Critical 株式会社ネイン
Priority to PCT/JP2021/014739 priority Critical patent/WO2022215187A1/ja
Priority to TW111107239A priority patent/TW202303381A/zh
Publication of WO2022215187A1 publication Critical patent/WO2022215187A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control

Definitions

  • the present invention relates to an audio reproduction system, an audio reproduction method, and a computer program.
  • Patent Document 1 discloses a technique related to a noise canceling function.
  • an object of the present disclosure is to provide technical improvements that solve or mitigate at least part of the above problems in technology related to audio playback devices equipped with various functions.
  • a sound reproduction system is a sound reproduction system for reproducing sound
  • the sound reproduction system includes at least an information processing device and a sound reproduction device connectable to the information processing device
  • the sound reproduction system includes
  • the one or more computer processors include a reception unit that receives an audio reproduction mode switching operation in the audio reproduction device, and a switching unit that switches the audio reproduction mode according to the operation received by the reception unit.
  • the sound quality setting regarding the sound quality of the sound output from the audio reproduction device can be automatically changed.
  • the audio compression method of the audio data transmitted from the information processing device to the audio playback device can be changed.
  • Audio playback modes include a first playback mode, a second playback mode, and a third playback mode.
  • the external sound setting of the third reproduction mode can be set large
  • the sound field setting of the first reproduction mode can be set narrow
  • the connection setting of the third reproduction mode can be set wide.
  • Audio playback modes include a first playback mode, a second playback mode, and a third playback mode.
  • an audio compression method that emphasizes low-delay playback is applied as the sound quality setting
  • an audio compression method that emphasizes connection stability is applied as the sound quality setting. can be done.
  • the one or more computer processors included in the audio reproduction system further include a device type identification unit that identifies the type of the information processing device to which the audio reproduction device is connected, and the switching unit identifies the result of identification by the device type identification unit.
  • the audio playback mode can be automatically switched accordingly.
  • the one or more computer processors included in the audio reproduction system further include an audio type identification unit that identifies the type of audio received by the audio reproduction device from the information processing device, and the switching unit is the result of identification by the audio type identification unit. Depending on the situation, the audio playback mode can be switched automatically.
  • the one or more computer processors included in the audio reproduction system further include an application type identification unit that identifies the type of application being executed in the information processing device to which the audio reproduction device is connected, and the switching unit identifies the application type.
  • the audio playback mode can be automatically switched according to the result of identification by the unit.
  • An audio reproduction method is an audio reproduction method executed in an audio reproduction system for reproducing audio, wherein the audio reproduction system includes at least an information processing device and an audio reproduction device connectable to the information processing device.
  • a computer program is a computer program executed in an audio reproduction system for reproducing audio, the audio reproduction system comprising at least an information processing device and an audio reproduction device connectable to the information processing device,
  • One or more computer processors included in the audio reproduction system have a reception function that receives an audio reproduction mode switching operation in the audio reproduction device, and a switching function that switches the audio reproduction mode according to the operation received by the reception function.
  • the audio reproduction device in the present disclosure is an audio reproduction device for reproducing audio, and includes a reception unit that receives an operation for switching the audio reproduction mode, and the audio reproduction mode according to the operation received by the reception unit.
  • FIG. 1 is a system configuration diagram showing an example of an embodiment of an audio reproduction system according to the present disclosure
  • FIG. FIG. 2 is a system configuration diagram showing another example of an embodiment of an audio reproduction system according to the present disclosure
  • FIG. 1 is a hardware configuration diagram showing an example of a hardware configuration of an audio reproduction system according to the present disclosure
  • FIG. 1 is a functional configuration diagram showing an example of a functional configuration of an audio reproduction system according to the present disclosure
  • FIG. FIG. 2 is an image diagram showing an image of a reproduction mode applied in the audio reproduction system of the present disclosure
  • FIG. FIG. 4 is a functional configuration diagram showing another example of the functional configuration of the audio reproduction system according to the present disclosure
  • FIG. 4 is a flow diagram showing an example of the flow of the audio reproduction method in the present disclosure
  • 1 is a circuit configuration diagram showing an example of a circuit configuration of a computer program according to the present disclosure
  • FIG. 1 is a functional configuration diagram showing an example of a functional configuration of an audio reproducing device according to the present disclosure
  • FIG. 1 is a functional configuration diagram showing an example of a functional configuration of an audio reproducing device according to the present disclosure
  • a sound reproduction system 1000 is for reproducing sound, and includes at least an information processing device 200 and a sound reproduction device 100 connectable to the information processing device 200. Be prepared.
  • the audio reproduction device 100 may be a device capable of realizing at least the functions described later, and may be a hearable terminal such as an earphone or headphone, an information processing terminal such as a smartphone, a tablet terminal, a personal computer, or a head mounted display (HMD). , wearable terminals such as smart glasses, and other devices capable of reproducing audio.
  • a hearable terminal such as an earphone or headphone
  • an information processing terminal such as a smartphone, a tablet terminal, a personal computer, or a head mounted display (HMD).
  • HMD head mounted display
  • wearable terminals such as smart glasses, and other devices capable of reproducing audio.
  • the information processing device 200 can be a smart phone, a tablet terminal, a personal computer, or the like.
  • the audio reproduction device 100 can be a device that can be connected to the information processing device 200 by wire or wirelessly. As an example, it is assumed that the audio reproduction device 100 and the information processing device 200 are connected by short-range wireless communication such as Bluetooth (registered trademark).
  • the audio reproduction system 1000 in the present disclosure may include a server device 300 that can be connected to the audio reproduction device 100 and/or the information processing device 200 via the Internet.
  • Audio reproduction device 100 includes processor 101 , memory 102 , storage 103 , input/output interface (input/output I/F) 104 , and communication interface (communication I/F) 105 . Each component is interconnected via a bus B.
  • FIG. 1 A bus B.
  • the audio reproduction device 100 can realize the functions and methods described in the present embodiment through the cooperation of the processor 101, the memory 102, the storage 103, the input/output I/F 104, and the communication I/F 105. can.
  • the processor 101 executes functions and/or methods implemented by codes or instructions included in programs stored in the storage 103 .
  • the processor 101 includes, for example, a central processing unit (CPU), MPU (Micro Processing Unit), GPU (Graphics Processing Unit), microprocessor, processor core, multiprocessor, ASIC (Application- Specific Integrated Circuit), FPGA (Field Programmable Gate Array), etc., implemented by logic circuits (hardware) and dedicated circuits formed in integrated circuits (IC (Integrated Circuit) chip, LSI (Large Scale Integration)), etc.
  • IC Integrated Circuit
  • LSI Large Scale Integration
  • the memory 102 temporarily stores programs loaded from the storage 103 and provides a work area for the processor 101 .
  • the memory 102 also temporarily stores various data generated while the processor 101 is executing the program.
  • the memory 102 includes, for example, RAM (Random Access Memory), ROM (Read Only Memory), and the like.
  • the storage 103 stores programs.
  • the storage 103 includes, for example, a HDD (Hard Disk Drive), SSD (Solid State Drive), flash memory, and the like.
  • the input/output I/F 104 includes an input device for inputting various operations to the audio reproduction device 100 and an output device for outputting processing results processed by the audio reproduction device 100 .
  • the input/output I/F 104 may be integrated with the input device and the output device, or may be separated into the input device and the output device.
  • the input device is realized by any one or a combination of all types of devices that can receive input from the user and transmit information related to the input to the processor 101 .
  • the input device includes, for example, hardware keys such as a touch panel, a touch display, and a keyboard, a pointing device such as a mouse, a camera (operation input via images), a microphone (operation input by voice), and the like.
  • the output device outputs the processing results processed by the processor 101 .
  • Output devices include, for example, displays, speakers, and the like.
  • the communication I/F 105 is implemented as hardware such as a network adapter, communication software, or a combination thereof, and transmits and receives various data via the network.
  • the communication may be performed by wire or wirelessly, and any communication protocol may be used as long as mutual communication can be performed.
  • Communication I/F 105 communicates with other information processing apparatuses via a network.
  • Communication I/F 105 transmits various data to other information processing apparatuses according to instructions from processor 101 .
  • Communication I/F 105 also receives various data transmitted from other information processing apparatuses and transmits the data to processor 101 .
  • the information processing device 200 and the server device 300 in the present disclosure can also be configured with the same hardware configuration as in FIG. 3, except for special cases.
  • the description is given assuming that the audio reproduction device 100 included in the audio reproduction system 1000 is a headphone connected to the information processing device 200 via Bluetooth, but is not limited to this.
  • One or more computer processors included in the audio reproduction system 1000 according to the present disclosure include a reception unit 210 and a switching unit 220, as shown in FIG. 4 as an example.
  • reception unit 210 and the switching unit 220 are described as being included in the information processing apparatus 200, but are not limited to this.
  • the reception unit 210 receives an operation for switching the audio reproduction mode in the audio reproduction device 100 .
  • a plurality of audio reproduction modes can be prepared according to the content of the audio, the location where the audio is reproduced, and/or the situation of the user listening to the audio.
  • the audio playback mode will be described as having a first mode, a second mode, and a third mode, but the number of modes is not particularly limited as long as there are at least two modes.
  • the operation for switching the audio reproduction mode may be a user operation on an operation reception unit (not shown) included in the audio reproduction device 100, or a user operation on an operation reception unit (not shown) included in the information processing device 200. It may be an operation.
  • the switching unit 220 switches the audio reproduction mode according to the operation accepted by the accepting unit 210 .
  • the switching unit 220 may switch to the audio playback mode specified according to the number of touch operations by the user, or may switch the audio playback mode in order for each touch operation by the user.
  • the audio reproduction system 1000 is characterized in that the external sound setting and the sound field setting are automatically changed by switching the audio reproduction mode by the switching unit 220 .
  • the external sound setting relates to capturing external sound in the audio reproduction device 100 .
  • the outside sound setting here is not only ON/OFF of the outside sound reproduction, but also the reproduction volume of the outside sound in the case of ON can be set.
  • the sound field setting relates to the sound field of the sound output from the sound reproduction device 100.
  • a sound field means a space in which sound spreads, and is assumed to be, for example, a movie theater, studio, stage, living room, cafe, etc.
  • the sound field setting here reproduces the state of listening to sound in the above sound field using virtual surround technology, and it is possible to set not only ON/OFF but also the type of sound field when it is ON. shall be
  • the types of sound fields include, for example, a movie mode that achieves a powerful and three-dimensional surround effect with clear dialogue, a TV mode that achieves a surround effect that does not cause fatigue even when listening for a long time, and an original sound source.
  • Music mode provides a surround effect that preserves quality as much as possible; Sports mode provides a surround effect that makes you feel as if you are in a venue; Game mode provides a surround effect with excellent localization; It is assumed that a BGM mode or the like that realizes a surround effect as if listening to the music is prepared.
  • the audio reproduction mode, the external sound setting, and the sound field setting are pre-stored in association with a storage unit (not shown) of the audio reproduction device 100 or the information processing device 200. shall be Details will be described later.
  • the associated external sound setting and sound field setting are applied to the audio reproduction device 100 .
  • the appropriate external sound settings and sound field settings are automatically changed, thereby reducing the complexity of setting various functions and enabling audio playback with suitable settings. can be played.
  • the sound quality setting can be automatically changed.
  • the sound quality setting relates to the sound quality of the sound output from the sound reproduction device 100.
  • the sound quality of voice here refers to the sound quality that changes due to changes in the voice compression method.
  • the amount of data that can be transmitted at one time is not large (because the bandwidth is not wide). and transmitted from the information processing device 200 to the audio reproduction device 100 .
  • Audio compression methods include, for example, SBC (SubBand Codec), AAC (Advanced Audio Coding), aptX (registered trademark), and the like. Details will be described later.
  • the audio reproduction device 100 and the information processing device 200 according to the present disclosure are compatible with multiple audio compression methods as described above. Conventionally, it has been common to automatically adopt the highest quality compression method among audio compression methods that can be supported by both the audio reproduction device and the information processing device.
  • the audio compression method of audio data transmitted from the information processing device 200 to the audio reproduction device 100 can be changed by changing the sound quality setting. .
  • the sound quality of the voice referred to here may include the sound quality that changes depending on the sound (equalizer) setting, in addition to the sound quality that changes due to the change of the voice compression method.
  • Acoustic settings are, for example, settings such as acoustic, hip-hop, jazz, pop, rock, bass enhancement/suppression, and treble enhancement/suppression.
  • the first mode is music mode
  • the second mode is game mode
  • the third mode is work mode
  • the external sound setting in the first mode is set to be small, and the external sound setting in the third mode is set to be large.
  • the sound field setting in the first mode is set narrow (just right), and the sound field setting in the third mode is set wide (like BGM). .
  • the original sound is reproduced as it is.
  • External sound reproduction can be set to OFF or external sound cancellation, and the sound field can be set to a state in which the surround effect is OFF.
  • Ambient sound reproduction can be set to ON (smaller than the third mode), and the sound field can be set to a state in which the surround effect is ON (game mode).
  • the sound source is placed far away or behind, so that you can get the feeling of being in a cafe.
  • Ambient sound reproduction can be set to ON (larger than the second mode), and the sound field can be set to a state in which the surround effect is ON (BGM mode).
  • an audio compression method that emphasizes sound quality is applied as the sound quality setting.
  • turning on the high-resolution support realizes a sound reproduction environment suitable for music reproduction.
  • an audio compression method that emphasizes low-delay playback is applied as the sound quality setting. It also emphasizes high-pitched sounds to create a sound reproduction environment suitable for playing games.
  • an audio compression method that emphasizes connection stability is applied as the sound quality setting.
  • high-pitched sounds are suppressed to realize a sound reproduction environment suitable for work.
  • the audio compression method applied here is selectively applied from audio compression methods that can be supported by both the information processing device 200 and the audio reproduction device 100 .
  • audio compression methods include aptX LL (aptX Low Latency), aptX HD, aptX Adaptive, LDAC (registered trademark), UAT (Ultra Audio Transmission), Samsung Scalable Codec, HWA (High -Res Wireless Audio), but not limited to these.
  • the sound quality, the low delay in reproduction, and the stability of the connection are optimal in consideration of the relative characteristics of the audio compression methods.
  • An audio compression method is selected.
  • the audio reproduction mode, the external sound setting, the sound field setting, and the sound quality setting are pre-stored in association with the storage unit (not shown) of the audio reproducing apparatus 100 or the information processing apparatus 200.
  • These associations are not limited to the examples described above, and it is preferable to prepare various combinations assuming various scenes (sound reproduction modes).
  • one or more computer processors included in the audio reproduction system 1000 can further include a device type identification unit 230, as shown in FIG.
  • the device type identification unit 230 identifies the type of the information processing device 200 to which the audio reproduction device 100 is connected.
  • the device type identification unit 230 identifies whether the type of the information processing device 200 is a device for playing music, a device for playing games, or a device for doing work. do.
  • devices for playing back music include smartphones and music players.
  • Devices for playing games include personal computers (PCs) and game machines.
  • PCs personal computers
  • a PC is mentioned as a device for working.
  • the switching unit 220 can automatically switch the audio reproduction mode according to the result of identification by the device type identification unit 230 .
  • the switching unit 220 can automatically switch the audio reproduction mode to the first reproduction mode. .
  • the switching unit 220 can automatically switch the audio reproduction mode to the second reproduction mode.
  • the switching unit 220 can automatically switch the audio reproduction mode to the third reproduction mode.
  • automatic switching of the audio reproduction mode by the switching unit 220 is performed before the reception unit 210 described above receives an operation for switching the audio reproduction mode in the audio reproduction device 100 . That is, it is assumed that after receiving an operation for switching the audio reproduction mode in the audio reproduction device 100, the switching of the audio reproduction mode by the user is prioritized.
  • one or more computer processors included in the audio reproduction system 1000 can further include an audio type identification unit 240, as shown in FIG.
  • the audio type identification unit 240 identifies the type of audio that the audio reproducing apparatus 100 receives from the information processing apparatus 200 (audio transmitted from the audio reproducing apparatus 100).
  • the sound type identifying unit 240 determines whether the type of sound received by the sound reproduction device 100 from the information processing device 200 is music, sound effects of a game, voice chat sound during a game, telephone conference, or the like. Identify whether it is the speech of the conversation in
  • the switching unit 220 can automatically switch the audio reproduction mode according to the result of identification by the audio type identification unit 240 .
  • the switching unit 220 automatically changes the sound reproduction mode to the first reproduction mode. You can switch.
  • the switching unit 220 switches the sound reproduction mode to the second mode. It can automatically switch between two playback modes.
  • the switching unit 220 switches the sound reproduction mode to the third reproduction mode. can be automatically switched to
  • automatic switching of the audio reproduction mode by the switching unit 220 is performed before the reception unit 210 described above receives an operation for switching the audio reproduction mode in the audio reproduction device 100 . That is, it is assumed that after receiving an operation for switching the audio reproduction mode in the audio reproduction device 100, priority is given to switching the audio reproduction mode by the user.
  • one or more computer processors included in the audio reproduction system 1000 can further include an application type identification unit 250, as shown in FIG.
  • the application type identification unit 250 identifies the type of application being executed in the information processing device to which the audio reproduction device 100 is connected.
  • the application type identification unit 250 determines whether the type of application being executed in the information processing device 200 to which the audio reproduction device 100 is connected is a music reproduction application or a game play application. Identifies whether the application is for teleconferencing.
  • the switching unit 220 can automatically switch the audio reproduction mode according to the identification result of the application type identification unit 250 .
  • switching unit 220 switches the audio reproduction mode to It can automatically switch to the first playback mode.
  • the switching unit 220 switches the audio reproduction mode to the second mode. can automatically switch to playback mode.
  • switching unit 220 switches the audio reproduction mode to the third mode. can automatically switch to playback mode.
  • automatic switching of the audio reproduction mode by the switching unit 220 is performed before the reception unit 210 described above receives an operation for switching the audio reproduction mode in the audio reproduction device 100 . That is, it is assumed that after receiving an operation for switching the audio reproduction mode in the audio reproduction device 100, priority is given to switching the audio reproduction mode by the user.
  • the device type identification unit 230, the audio type identification unit 240, and the application type identification unit 250 described above are provided in the information processing device 200, but may be provided in the audio reproduction device 100.
  • the audio reproducing apparatus 100 may be configured to transmit the identification result to the information processing apparatus 200 and change the audio compression method in the information processing apparatus 200 .
  • the audio reproduction method according to the present disclosure is an audio reproduction method executed in the audio reproduction system 1000 for reproducing audio.
  • the audio reproduction system 1000 includes at least the information processing device 200 and the audio reproduction device 100 connectable to the information processing device 200 .
  • the audio reproduction method causes one or more computer processors included in the audio reproduction system 1000 to execute the receiving step S210 and the switching step S220, as shown in FIG.
  • reception step S210 an operation for switching the audio reproduction mode in the audio reproduction device 100 is received.
  • Such receiving step S210 can be executed by the receiving unit 210 described above.
  • the audio reproduction mode is switched according to the operation accepted in the accepting step S210.
  • the switching step S220 can be performed by the switching unit 220 described above.
  • step S230 By switching the audio reproduction mode in the switching step S220, the external sound setting regarding the capture of the external sound in the audio reproducing apparatus 100 and the sound field setting regarding the sound field of the audio output from the audio reproducing apparatus are automatically changed. (S230).
  • Such step S230 can be executed by one or more computer processors included in the audio reproduction device 100 .
  • a computer program in the present disclosure is a computer program executed in the audio reproduction system 1000 for reproducing audio.
  • the audio reproduction system 1000 includes at least the information processing device 200 and the audio reproduction device 100 connectable to the information processing device 200 .
  • the computer program according to the present disclosure causes one or more computer processors included in the audio reproduction system 1000 to perform the reception function and the switching function.
  • the reception function receives an operation for switching the audio reproduction mode in the audio reproduction device 100 .
  • the switching function switches the audio playback mode according to the operation accepted by the acceptance function.
  • the external sound setting regarding the capture of the external sound in the audio reproducing apparatus 100 and the sound field setting regarding the sound field of the audio output from the audio reproducing apparatus are automatically changed.
  • Receiving circuit 1110 and switching circuit 1120 are implemented by receiving unit 210 and switching unit 220 described above, respectively. The details of each part are as described above.
  • the audio reproducing device is an audio reproducing device 100 for reproducing audio, and is characterized by comprising a receiving unit 110, a switching unit 120, and a changing unit 130. do.
  • the reception unit 110 receives an operation for switching the audio reproduction mode.
  • the switching unit 120 switches the audio reproduction mode according to the operation accepted by the accepting unit 110 .
  • the changing unit 130 automatically changes the external sound setting related to capturing the external sound and the sound field setting related to the sound field of the output audio according to the switching of the audio reproduction mode by the switching unit 120 .
  • an information processing device such as a computer or a mobile phone can be suitably used to function as the server device or the terminal device according to the above-described embodiment.
  • Such an information processing device stores a program describing processing details for realizing each function of the server device or the terminal device according to the embodiment in the storage unit of the information processing device, and executes the program by the CPU of the information processing device. It can be realized by reading and executing.
  • the method described in the embodiment can be executed by a computer (computer), for example, magnetic disk (floppy (registered trademark) disk, hard disk, etc.), optical disk (CD-ROM, DVD, MO, etc.), It can be stored in a recording medium such as a semiconductor memory (ROM, RAM, flash memory, etc.), or can be transmitted and distributed via a communication medium.
  • the programs stored on the medium also include a setting program for configuring software means (including not only execution programs but also tables and data structures) to be executed by the computer.
  • a computer that realizes this apparatus reads a program recorded on a recording medium, and in some cases, builds software means by a setting program, and executes the above-described processes by controlling the operation by this software means.
  • recording medium is not limited to those for distribution, and includes storage media such as magnetic disks and semiconductor memories provided in computers or devices connected via a network.
  • the storage unit may function, for example, as a main storage device, an auxiliary storage device, or a cache memory.
  • audio playback system 100 audio playback device 110 reception unit 120 switching unit 130 change unit 200 information processing device 210 reception unit 220 switching unit 230 device type identification unit 240 audio type identification unit 250 and application type identification unit 300 server device

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】 様々な機能が搭載される音声再生装置に関する技術において、上記課題の少なくとも一部を解決又は緩和する技術的な改善を提供する。 【解決手段】 本開示における音声再生システムは、音声を再生するための音声再生システムであって、音声再生システムは、少なくとも情報処理装置および当該情報処理装置と接続可能な音声再生装置を備え、音声再生システムが備える一または複数のコンピュータプロセッサは、音声再生装置における音声の再生モードの切り替え操作を受け付ける受付部と、受付部により受け付けられた操作に応じて、音声の再生モードを切り替える切替部とを備え、切替部による音声の再生モードの切り替えによって、音声再生装置における外音の取り込みに関する外音設定および音声再生装置から出力される音声の音場に関する音場設定が、自動的に変更されることを特徴とする。

Description

音声再生システム、音声再生方法およびコンピュータプログラム
 本発明は、音声再生システム、音声再生方法およびコンピュータプログラムに関する。
 近年、イヤホンやヘッドホン等の音声再生装置の技術分野において、音質向上に関する技術に加え、外音取込およびノイズキャンセリングに関する技術の開発が盛んに行われている。
 例えば、特許文献1には、ノイズキャンセリング機能に関する技術が開示されている。
特開2019-164357号公報
 音声再生装置に搭載される機能が増加するのに伴い、ユーザが自ら各機能について個別の設定を行うのは煩雑であるとともに、最適な再生環境を作り上げるのは難易度が高いという問題があった。
 そのため、本開示の目的は、様々な機能が搭載される音声再生装置に関する技術において、上記課題の少なくとも一部を解決又は緩和する技術的な改善を提供することにある。
 本開示における音声再生システムは、音声を再生するための音声再生システムであって、音声再生システムは、少なくとも情報処理装置および当該情報処理装置と接続可能な音声再生装置を備え、音声再生システムが備える一または複数のコンピュータプロセッサは、音声再生装置における音声の再生モードの切り替え操作を受け付ける受付部と、受付部により受け付けられた操作に応じて、音声の再生モードを切り替える切替部とを備え、切替部による音声の再生モードの切り替えによって、音声再生装置における外音の取り込みに関する外音設定および音声再生装置から出力される音声の音場に関する音場設定が、自動的に変更されることを特徴とする。
 切替部による音声の再生モードの切り替えによって、さらに、音声再生装置から出力される音声の音質に関する音質設定が、自動的に変更されることができる。
 音質設定が変更されることにより、情報処理装置から音声再生装置へ伝送される音声データの音声圧縮方式が変更されることができる。
 音声の再生モードには、第一の再生モード、第二の再生モードおよび第三の再生モードがあり、第二の再生モードを基準とした場合に、第一の再生モードの外音設定は小さく、第三の再生モードの外音設定は大きく設定され、第一の再生モードの音場設定は狭く、第三の再生モードの接続設定は広く設定されることができる。
 音声の再生モードには、第一の再生モード、第二の再生モードおよび第三の再生モードがあり、第一の再生モードでは、音質設定として、音質を重視した音声圧縮方式が適用され、第二の再生モードでは、音質設定として、再生の低遅延性を重視した音声圧縮方式が適用され、第三の再生モードでは、音質設定として、接続安定性を重視した音声圧縮方式が適用されることができる。
 音声再生システムが備える一または複数のコンピュータプロセッサは、さらに、音声再生装置が接続された情報処理装置の種別を識別する装置種別識別部を備え、切替部は、装置種別識別部による識別の結果に応じて、自動的に、音声の再生モードを切り替えることができる。
 音声再生システムが備える一または複数のコンピュータプロセッサは、さらに、音声再生装置が情報処理装置から受信する音声の種別を識別する音声種別識別部を備え、切替部は、音声種別識別部による識別の結果に応じて、自動的に、音声の再生モードを切り替えることができる。
 音声再生システムが備える一または複数のコンピュータプロセッサは、さらに、音声再生装置が接続された情報処理装置で実行されているアプリケーションの種別を識別するアプリケーション種別識別部を備え、切替部は、アプリケーション種別識別部による識別の結果に応じて、自動的に、音声の再生モードを切り替えることができる。
 本開示における音声再生方法は、音声を再生するための音声再生システムにおいて実行される音声再生方法であって、音声再生システムは、少なくとも情報処理装置および当該情報処理装置と接続可能な音声再生装置を備え、音声再生システムが備える一または複数のコンピュータプロセッサに、音声再生装置における音声の再生モードの切り替え操作を受け付ける受付ステップと、受付ステップにおいて受け付けられた操作に応じて、音声の再生モードを切り替える切替ステップとを実行させ、切替ステップにおける音声の再生モードの切り替えによって、音声再生装置における外音の取り込みに関する外音設定および音声再生装置から出力される音声の音場に関する音場設定が、自動的に変更されることを特徴とする。
 本開示におけるコンピュータプログラムは、音声を再生するための音声再生システムにおいて実行されるコンピュータプログラムであって、音声再生システムは、少なくとも情報処理装置および当該情報処理装置と接続可能な音声再生装置を備え、音声再生システムが備える一または複数のコンピュータプロセッサに、音声再生装置における音声の再生モードの切り替え操作を受け付ける受付機能と、受付機能により受け付けられた操作に応じて、音声の再生モードを切り替える切替機能とを実現させ、切替機能により音声の再生モードの切り替えによって、音声再生装置における外音の取り込みに関する外音設定および音声再生装置から出力される音声の音場に関する音場設定が、自動的に変更されることを特徴とする。
 本開示における音声再生装置は、音声を再生するための音声再生装置であって、音声の再生モードの切り替え操作を受け付ける受付部と、受付部により受け付けられた操作に応じて、音声の再生モードを切り替える切替部と、切替部による音声の再生モードの切り替えに応じて、外音の取り込みに関する外音設定および出力される音声の音場に関する音場設定を自動的に変更する変更部とを備えることを特徴とする。
 そのため、本開示によれば、様々な機能が搭載される音声再生装置に関する技術において、上記課題の少なくとも一部を解決又は緩和する技術的な改善を提供することが可能となる。
本開示における音声再生システムの実施形態の一例を示すシステム構成図である。 本開示における音声再生システムの実施形態の他の例を示すシステム構成図である。 本開示における音声再生システムのハードウェア構成の一例を示すハードウェア構成図である。 本開示における音声再生システムの機能構成の一例を示す機能構成図である。 本開示における音声再生システムにおいて適用される再生モードのイメージを示すイメージ図である。 本開示における音声再生システムの機能構成の他の例を示す機能構成図である。 本開示における音声再生方法のフローの一例を示すフロー図である。 本開示におけるコンピュータプログラムの回路構成の一例を示す回路構成図である。 本開示における音声再生装置の機能構成の一例を示す機能構成図である。
 本開示における音声再生システムの実施形態について、図面を参照しながら説明を行う。
<システム構成>
 図1に一例として示されるように、本開示における音声再生システム1000は、音声を再生するためのものであって、少なくとも情報処理装置200および当該情報処理装置200と接続可能な音声再生装置100を備えるものとである。
 このとき、音声再生装置100は、少なくとも後述する機能が実現可能な装置であればよく、イヤホンやヘッドホン等のヒアラブル端末、スマートフォン、タブレット端末、パーソナルコンピュータ等の情報処理端末、ヘッドマウントディスプレイ(HMD)やスマートグラス等のウェアラブル端末、および、これら以外の、音声を再生可能な装置とすることができる。
 また、情報処理装置200は、スマートフォン、タブレット端末、パーソナルコンピュータ等とすることができる。
 そして、音声再生装置100は、情報処理装置200と有線または無線により接続可能な装置とすることができる。一例として、音声再生装置100と情報処理装置200との接続はBluetooth(登録商標)などの近距離無線通信により行われるものとする。
 また、図2に一例として示されるように、本開示における音声再生システム1000は、音声再生装置100および/または情報処理装置200とインターネットを介して接続可能なサーバ装置300を備えるものとしてもよい。
<ハードウェア構成>
 ここで、図3を用いて、音声再生システム1000に含まれる音声再生装置100のハードウェア構成について説明する。音声再生装置100は、プロセッサ101と、メモリ102と、ストレージ103と、入出力インターフェース(入出力I/F)104と、通信インターフェース(通信I/F)105とを含む。各構成要素は、バスBを介して相互に接続される。
 音声再生装置100は、プロセッサ101と、メモリ102と、ストレージ103と、入出力I/F104と、通信I/F105との協働により、本実施形態に記載される機能、方法を実現することができる。
 プロセッサ101は、ストレージ103に記憶されるプログラムに含まれるコード又は命令によって実現する機能、及び/又は、方法を実行する。プロセッサ101は、例えば、中央処理装置(CPU)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、マイクロプロセッサ(microprocessor)、プロセッサコア(processor core)、マルチプロセッサ(multiprocessor)、ASIC(Application-Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等を含み、集積回路(IC(Integrated Circuit)チップ、LSI(Large Scale Integration))等に形成された論理回路(ハードウェア)や専用回路によって各実施形態に開示される各処理を実現してもよい。また、これらの回路は、1又は複数の集積回路により実現されてよく、各実施形態に示す複数の処理を1つの集積回路により実現されることとしてもよい。また、LSIは、集積度の違いにより、VLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
 メモリ102は、ストレージ103からロードしたプログラムを一時的に記憶し、プロセッサ101に対して作業領域を提供する。メモリ102には、プロセッサ101がプログラムを実行している間に生成される各種データも一時的に格納される。メモリ102は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)等を含む。
 ストレージ103は、プログラムを記憶する。ストレージ103は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等を含む。
 入出力I/F104は、音声再生装置100に対する各種操作を入力する入力装置、及び、音声再生装置100で処理された処理結果を出力する出力装置を含む。入出力I/F104は、入力装置と出力装置が一体化していてもよいし、入力装置と出力装置とに分離していてもよい。
 入力装置は、ユーザからの入力を受け付けて、当該入力に係る情報をプロセッサ101に伝達できる全ての種類の装置のいずれか、又は、その組み合わせにより実現される。入力装置は、例えば、タッチパネル、タッチディスプレイ、キーボード等のハードウェアキーや、マウス等のポインティングデバイス、カメラ(画像を介した操作入力)、マイク(音声による操作入力)等を含む。
 出力装置は、プロセッサ101で処理された処理結果を出力する。出力装置は、例えば、ディスプレイ、スピーカ等を含む。
 通信I/F105は、ネットワークアダプタ等のハードウェアや通信用ソフトウェア、及びこれらの組み合わせとして実装され、ネットワークを介して各種データの送受信を行う。当該通信は、有線、無線のいずれで実行されてもよく、互いの通信が実行できるのであれば、どのような通信プロトコルを用いてもよい。通信I/F105は、ネットワークを介して、他の情報処理装置との通信を実行する。通信I/F105は、各種データをプロセッサ101からの指示に従って、他の情報処理装置に送信する。また、通信I/F105は、他の情報処理装置から送信された各種データを受信し、プロセッサ101に伝達する。
 また、本開示における情報処理装置200およびサーバ装置300についても、特筆すべき場合を除き、図3と同様のハードウェア構成で構成されることができる。
 なお、ここでは、音声再生システム1000が備える音声再生装置100が、情報処理装置200とBluetooth接続されたヘッドホンであるものとして説明を行うが、これに限られるものではない。
<機能構成>
 本開示における音声再生システム1000が備える一または複数のコンピュータプロセッサは、図4に一例として示されるように、受付部210および切替部220を備える。
 ここでは受付部210および切替部220は情報処理装置200が備えるものとして説明を行うが、これに限られるものではない。
 受付部210は、音声再生装置100における音声の再生モードの切り替え操作を受け付けるものである。
 音声の再生モードは、音声の内容、音声を再生する場所、および/または、音声を聴くユーザの状況等に応じて複数用意されることができる。
 一例として、音声の再生モードには、第一のモード、第二のモードおよび第三のモードがあるものとして説明を行うが、少なくとも二つのモードがあればモードの数については特に限定されない。
 音声の再生モードの切り替え操作は、音声再生装置100が備える操作受付部(図示せず)に対するユーザ操作であるものとしてもよいし、情報処理装置200が備える操作受付部(図示せず)に対するユーザ操作であるものとしてもよい。
 切替部220は、受付部210により受け付けられた操作に応じて、音声の再生モードを切り替えるものである。
 一例として、切替部220は、ユーザによるタッチ操作の回数に応じて特定された音声の再生モードへ切り替えるものとしてもよいし、ユーザによるタッチ操作毎に音声の再生モードを順に切り替えるものとしてもよい。
 そして、本開示における音声再生システム1000は、切替部220による音声の再生モードの切り替えによって、外音設定および音場設定が、自動的に変更されることを特徴とする。
 外音設定は、音声再生装置100における外音の取り込みに関するものである。
 外音の取り込みとは、音声再生装置100が備えるマイクロホンにより外音を収音し、収音された外音を再生、および/または、外音(ノイズ)をキャンセルするための音を再生するものである。ここでいう外音設定は、外音再生のON/OFFのみならず、ONの場合における外音の再生音量も設定可能であるものとする。
 音場設定は、音声再生装置100から出力される音声の音場に関するものである。
 音場とは、音が広がる空間を意味し、例えば、映画館、スタジオ、ステージ、リビング、カフェ等を想定するものである。ここでいう音場設定は、上記音場で音を聴いているような状態をバーチャルサラウンドの技術により再現するものであり、ON/OFFのみならず、ONの場合における音場の種類も設定可能であるものとする。
 音場の種類には、一例として、セリフが明瞭であると共に迫力と立体感のあるサラウンド効果を実現するムービーモード、長時間視聴しても聞き疲れしないサラウンド効果を実現するテレビモード、元音源のクオリティーを極力失わないサラウンド効果を実現するミュージックモード、会場にいるような包囲感が感じられるサラウンド効果を実現するスポーツモード、定位に優れたサラウンド効果を実現するゲームモード、カフェなどの広い空間で音楽を聴いているようなサラウンド効果を実現するBGMモードなどが用意されるものとする。
 本開示の音声再生システム1000において、音声の再生モードと外音設定および音場設定とは、音声再生装置100または情報処理装置200の記憶部(図示せず)に予め対応付けて記憶されているものとする。詳細については後述する。
 そして、音声の再生モードが指定されることにより、対応付けられた外音設定および音場設定が音声再生装置100に適用されることとなる。
 以上の構成によれば、様々な機能が搭載される音声再生装置100に関する技術において、上記課題の少なくとも一部を解決又は緩和する技術的な改善を提供することが可能となる。
 具体的には、音声の再生モードを指定するだけで、適切な外音設定および音場設定が自動的に変更されることにより、各種機能に対する設定の煩雑さを軽減し、好適な設定で音声を再生することができるようになる。
 切替部220による音声の再生モードの切り替えによって、さらに、音質設定が自動的に変更されるものとすることができる。
 音質設定は、音声再生装置100から出力される音声の音質に関するものである。
 ここでいう音声の音質は、一例として、音声圧縮方式の変更により変化する音質をいうものとする。
 音声再生装置100と情報処理装置200とがBluetoothにより接続される場合、一度に伝送できるデータ量が多くないため(帯域幅が広くないため)、音声データは、所定の音声圧縮方式に基づいて圧縮されて情報処理装置200から音声再生装置100へ伝送される。
 音声圧縮方式は、例えば、SBC(SubBand Codec)、AAC(Advanced Audio Coding)、aptX(登録商標)等が挙げられる。詳細については後述する。
 本開示における音声再生装置100および情報処理装置200は、上記のような複数の音声圧縮方式に対応するものである。従来は、音声再生装置および情報処理装置の両方が対応可能な音声圧縮方式の中で最も高品質な圧縮方式が自動的に採用されるのが一般的であった。
 一方で、本開示における音声再生システム1000では、音質設定が変更されることにより、情報処理装置200から音声再生装置100へ伝送される音声データの音声圧縮方式が変更されるものとすることができる。
 なお、ここでいう音声の音質には、上記音声圧縮方式の変更により変化する音質の他、音響(イコライザ)設定により変化する音質を含むものとしてもよい。音響設定は、一例として、アコースティック、ヒップホップ、ジャズ、ポップ、ロック、低音強調/抑制、高音強調/抑制などの設定をいうものとする。
 続いて、音声の再生モードの具体例について図5を参照しながら説明を行う。
 上述したように、音声の再生モードには、第一のモード、第二のモードおよび第三のモードがあるものとする。
 一例として、第一のモードは音楽モード、第二のモードはゲームモード、第三のモードはワークモードであるものとする。
 そして、第二のモードを基準とした場合に、第一のモードの外音設定は小さく、第三のモードの外音設定は大きく設定されるものとする。
 同様に、第二のモードを基準とした場合に、第一のモードの音場設定は狭く(ちょうどよく)、第三のモードの音場設定は広く(BGM感覚に)設定されるものとする。
 具体的には、第一のモードでは、一例として、原音がそのまま再生されるものとする。外音再生はOFFもしくは外音キャンセル、音場はサラウンド効果がOFFの状態に設定されることができる。
 そして、第二のモードでは、一例として、左右や上下の音の変化を捉えやすい設定(高音域を強調する、サラウンドで音場を拡げるなど)とする。外音再生はON(第三のモードより小さい)、音場はサラウンド効果がON(ゲームモード)の状態に設定されることができる。
 そして、第三のモードでは、一例として、音の発生源を遠くや、後方に配置するなどで、カフェにいるような感覚を得られるようにする。外音再生はON(第二のモードより大きい)、音場はサラウンド効果がON(BGMモード)の状態に設定されることができる。
 そして、第一の再生モードでは、音質設定として、音質を重視した音声圧縮方式が適用される。また、ハイレゾ対応をONとして音楽の再生に適した音声の再生環境を実現する。
 第二の再生モードでは、音質設定として、再生の低遅延性を重視した音声圧縮方式が適用される。また、高音を強調して、ゲームのプレイに適した音声の再生環境を実現する。
 第三の再生モードでは、音質設定として、接続の安定性を重視した音声圧縮方式が適用される。また、高音を抑制して、仕事に適した音声の再生環境を実現する。
 ここで適用される音声圧縮方式は、情報処理装置200および音声再生装置100のいずれもが対応可能な音声圧縮方式の中から選択的に適用されるものである。
 音声圧縮方式としては、上述したSBC、AAC、aptXの他、aptX LL(aptX Low Latency)、aptX HD、aptX Adaptive、LDAC(登録商標)、UAT(Ultra Audio Transmission)、Samsung Scalable Codec、HWA(High-Res Wireless Audio)などの音声圧縮方式が挙げられるが、これらに限られるものではない。
 情報処理装置200および音声再生装置100が対応する音声圧縮方式が複数ある場合には、上記音質、再生の低遅延性、接続の安定性は、音声圧縮方式の特性を相対的に鑑みて最適な音声圧縮方式が選択される。
 以上、音声の再生モードと、外音設定、音場設定および音質設定とは、音声再生装置100または情報処理装置200の記憶部(図示せず)に予め対応付けて記憶されているものとする。これらの対応付けは、上述した例に限られるものではなく、様々なシーン(音声の再生モード)を想定して多様な組み合わせを用意しておくのが好ましい。
 また、音声再生システム1000が備える一または複数のコンピュータプロセッサは、図6に示されるように、さらに、装置種別識別部230を備えることができる。
 装置種別識別部230は、音声再生装置100が接続された情報処理装置200の種別を識別するものである。
 一例として、装置種別識別部230は、情報処理装置200の種別が、音楽を再生するための装置であるのか、ゲームをするための装置であるのか、仕事をするための装置であるのかを識別する。具体的には、音楽を再生するための装置としてはスマートフォンや音楽プレイヤが挙げられる。ゲームをするための装置としては、パーソナルコンピュータ(PC)やゲーム機が挙げられる。また、仕事をするための装置としては、PCが挙げられる。
 このとき、切替部220は、装置種別識別部230による識別の結果に応じて、自動的に、音声の再生モードを切り替えることができる。
 具体的には、情報処理装置200の種別が音楽を再生するための装置であると識別された場合、切替部220は、音声の再生モードを第一の再生モードに自動的に切り替えることができる。
 同様に、情報処理装置200の種別がゲームをするための装置であると識別された場合、切替部220は、音声の再生モードを第二の再生モードに自動的に切り替えることができる。
 同様に、情報処理装置200の種別が仕事をするための装置であると識別された場合、切替部220は、音声の再生モードを第三の再生モードに自動的に切り替えることができる。
 かかる構成によれば、ユーザが音声の再生モードを切り替える操作を行う必要がなくなるという効果を奏することができる。
 なお、上記切替部220による音声の再生モードの自動切り換えは、上述した受付部210が、音声再生装置100における音声の再生モードの切り替え操作を受け付ける前に行われるものとする。すなわち、音声再生装置100における音声の再生モードの切り替え操作を受け付け後は、ユーザによる音声の再生モードの切り替えが優先されるものとする。
 また、音声再生システム1000が備える一または複数のコンピュータプロセッサは、図6に示されるように、さらに、音声種別識別部240を備えることができる。
 音声種別識別部240は、音声再生装置100が情報処理装置200から受信する音声(音声再生装置100から送信される音声)の種別を識別するものである。
 一例として、音声種別識別部240は、音声再生装置100が情報処理装置200から受信する音声の種別が、音楽であるのか、ゲームの効果音やゲーム中のボイスチャット音声であるのか、電話会議等における会話の音声であるのかを識別する。
 このとき、切替部220は、音声種別識別部240による識別の結果に応じて、自動的に、音声の再生モードを切り替えることができる。
 具体的には、音声再生装置100が情報処理装置200から受信する音声の種別が、音楽であると識別された場合、切替部220は、音声の再生モードを第一の再生モードに自動的に切り替えることができる。
 同様に、音声再生装置100が情報処理装置200から受信する音声の種別が、ゲームの効果音やゲーム中のボイスチャット音声であると識別された場合、切替部220は、音声の再生モードを第二の再生モードに自動的に切り替えることができる。
 同様に、音声再生装置100が情報処理装置200から受信する音声の種別が、電話会議等における会話の音声であると識別された場合、切替部220は、音声の再生モードを第三の再生モードに自動的に切り替えることができる。
 かかる構成によれば、ユーザが音声の再生モードを切り替える操作を行う必要がなくなるという効果を奏することができる。
 なお、上記切替部220による音声の再生モードの自動切り換えは、上述した受付部210が、音声再生装置100における音声の再生モードの切り替え操作を受け付ける前に行われるものとする。すなわち、音声再生装置100における音声の再生モードの切り替え操作を受け付けた後は、ユーザによる音声の再生モードの切り替えが優先されるものとする。
 また、音声再生システム1000が備える一または複数のコンピュータプロセッサは、図6に示されるように、さらに、アプリケーション種別識別部250を備えることができる。
 アプリケーション種別識別部250は、音声再生装置100が接続された情報処理装置で実行されているアプリケーションの種別を識別するものである。
 一例として、アプリケーション種別識別部250は、音声再生装置100が接続された情報処理装置200で実行されているアプリケーションの種別が、音楽再生用のアプリケーションであるのか、ゲームプレイ用のアプリケーションであるのか、電話会議用のアプリケーションであるのかを識別する。
 このとき、切替部220は、アプリケーション種別識別部250による識別の結果に応じて、自動的に、音声の再生モードを切り替えることができる。
 具体的には、音声再生装置100が接続された情報処理装置200で実行されているアプリケーションの種別が、音楽再生用のアプリケーションであると識別された場合、切替部220は、音声の再生モードを第一の再生モードに自動的に切り替えることができる。
 同様に、音声再生装置100が接続された情報処理装置200で実行されているアプリケーションの種別が、ゲームプレイ用のアプリケーションであると識別された場合、切替部220は、音声の再生モードを第二の再生モードに自動的に切り替えることができる。
 同様に、音声再生装置100が接続された情報処理装置200で実行されているアプリケーションの種別が、電話会議用のアプリケーションであると識別された場合、切替部220は、音声の再生モードを第三の再生モードに自動的に切り替えることができる。
 かかる構成によれば、ユーザが音声の再生モードを切り替える操作を行う必要がなくなるという効果を奏することができる。
 なお、上記切替部220による音声の再生モードの自動切り換えは、上述した受付部210が、音声再生装置100における音声の再生モードの切り替え操作を受け付ける前に行われるものとする。すなわち、音声再生装置100における音声の再生モードの切り替え操作を受け付けた後は、ユーザによる音声の再生モードの切り替えが優先されるものとする。
 以上の構成によれば、様々な機能が搭載される音声再生装置100に関する技術において、上記課題の少なくとも一部を解決又は緩和する技術的な改善を提供することが可能となる。
 上述した装置種別識別部230、音声種別識別部240およびアプリケーション種別識別部250は、情報処理装置200が備えるものとして説明を行ったが、音声再生装置100が備えるものとして構成してもよい。このとき、音声再生装置100は、識別の結果を情報処理装置200へと送信し、情報処理装置200において音声圧縮方式を変更する構成とすればよい。
 続いて、本開示における音声再生方法の実施形態について、図面を参照しながら説明を行う。
 本開示における音声再生方法は、音声を再生するための音声再生システム1000において実行される音声再生方法である。
 上述したとおり、音声再生システム1000は、少なくとも情報処理装置200および当該情報処理装置200と接続可能な音声再生装置100を備えるものである。
 そして、本開示における音声再生方法は、図7に示されるように、音声再生システム1000が備える一または複数のコンピュータプロセッサに、受付ステップS210および切替ステップS220を実行させる。
 受付ステップS210では、音声再生装置100における音声の再生モードの切り替え操作を受け付ける。かかる受付ステップS210は、上述した受付部210により実行されることができる。
 切替ステップS220では、受付ステップS210において受け付けられた操作に応じて、音声の再生モードを切り替える。かかる切替ステップS220は、上述した切替部220により実行されることができる。
 そして、切替ステップS220における音声の再生モードの切り替えによって、音声再生装置100における外音の取り込みに関する外音設定および音声再生装置から出力される音声の音場に関する音場設定が、自動的に変更される(S230)。かかるステップS230は、音声再生装置100が備える一または複数のコンピュータプロセッサにより実行されることができる。
 以上の構成によれば、様々な機能が搭載される音声再生装置100に関する技術において、上記課題の少なくとも一部を解決又は緩和する技術的な改善を提供することが可能となる。
 続いて、本開示におけるコンピュータプログラムの実施形態について、図面を参照しながら説明を行う。
 本開示におけるコンピュータプログラムは、音声を再生するための音声再生システム1000において実行されるコンピュータプログラムである。
 上述したとおり、音声再生システム1000は、少なくとも情報処理装置200および当該情報処理装置200と接続可能な音声再生装置100を備えるものである。
 そして、本開示におけるコンピュータプログラムは、音声再生システム1000が備える一または複数のコンピュータプロセッサに、受付機能および切替機能を実行させる。
 受付機能は、音声再生装置100における音声の再生モードの切り替え操作を受け付ける。
 切替機能は、受付機能により受け付けられた操作に応じて、音声の再生モードを切り替える。
 そして、切替機能による音声の再生モードの切り替えによって、音声再生装置100における外音の取り込みに関する外音設定および音声再生装置から出力される音声の音場に関する音場設定が、自動的に変更される。
 上記機能は、図8に示す受付回路1110および切替回路1120により実現されることができる。受付回路1110および切替回路1120は、それぞれ上述した受付部210および切替部220により実現されるものとする。各部の詳細については上述したとおりである。
 以上の構成によれば、様々な機能が搭載される音声再生装置100に関する技術において、上記課題の少なくとも一部を解決又は緩和する技術的な改善を提供することが可能となる。
 最後に、本開示における音声再生装置の実施形態について図面を参照しながら説明を行う。
 本開示における音声再生装置は、図9に示されるように、音声を再生するための音声再生装置100であって、受付部110と、切替部120と、変更部130とを備えることを特徴とする。
 受付部110は、音声の再生モードの切り替え操作を受け付ける。
 切替部120は、受付部110により受け付けられた操作に応じて、音声の再生モードを切り替える。
 変更部130は、切替部120による音声の再生モードの切り替えに応じて、外音の取り込みに関する外音設定および出力される音声の音場に関する音場設定を自動的に変更する。
 また、上述した実施形態に係るサーバ装置又は端末装置として機能させるために、コンピュータ又は携帯電話などの情報処理装置を好適に用いることができる。このような情報処理装置は、実施形態に係るサーバ装置又は端末装置の各機能を実現する処理内容を記述したプログラムを、情報処理装置の記憶部に格納し、情報処理装置のCPUによって当該プログラムを読み出して実行させることによって実現可能である。 
 本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
 また、実施形態に記載した手法は、計算機(コンピュータ)に実行させることができるプログラムとして、例えば磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD-ROM、DVD、MO等)、半導体メモリ(ROM、RAM、フラッシュメモリ等)等の記録媒体に格納し、また通信媒体により伝送して頒布することもできる。なお、媒体側に格納されるプログラムには、計算機に実行させるソフトウェア手段(実行プログラムのみならずテーブルやデータ構造も含む)を計算機内に構成させる設定プログラムをも含む。本装置を実現する計算機は、記録媒体に記録されたプログラムを読み込み、また場合により設定プログラムによりソフトウェア手段を構築し、このソフトウェア手段によって動作が制御されることにより上述した処理を実行する。なお、本明細書でいう記録媒体は、頒布用に限らず、計算機内部あるいはネットワークを介して接続される機器に設けられた磁気ディスクや半導体メモリ等の記憶媒体を含むものである。記憶部は、例えば主記憶装置、補助記憶装置、又はキャッシュメモリとして機能してもよい。
 1000  音声再生システム
  100  音声再生装置
  110  受付部
  120  切替部
  130  変更部
  200  情報処理装置
  210  受付部
  220  切替部
  230  装置種別識別部
  240  音声種別識別部
  250  およびアプリケーション種別識別部
  300  サーバ装置

 

Claims (11)

  1.  音声を再生するための音声再生システムであって、
     前記音声再生システムは、少なくとも情報処理装置および当該情報処理装置と接続可能な音声再生装置を備え、
     前記音声再生システムが備える一または複数のコンピュータプロセッサは、
     前記音声再生装置における音声の再生モードの切り替え操作を受け付ける受付部と、
     前記受付部により受け付けられた操作に応じて、前記音声の再生モードを切り替える切替部と
    を備え、
     前記切替部による前記音声の再生モードの切り替えによって、前記音声再生装置における外音の取り込みに関する外音設定および前記音声再生装置から出力される音声の音場に関する音場設定が、自動的に変更される音声再生システム。
  2.  前記切替部による前記音声の再生モードの切り替えによって、さらに、前記音声再生装置から出力される音声の音質に関する音質設定が、自動的に変更されることを特徴とする請求項1に記載の音声再生システム。
  3.  前記音質設定が変更されることにより、前記情報処理装置から前記音声再生装置へ伝送される音声データの音声圧縮方式が変更されることを特徴とする請求項2に記載の音声再生システム。
  4.  前記音声の再生モードには、第一の再生モード、第二の再生モードおよび第三の再生モードがあり、
     前記第二の再生モードを基準とした場合に、
     前記第一の再生モードの外音設定は小さく、前記第三の再生モードの外音設定は大きく設定され、
     前記第一の再生モードの音場設定は狭く、前記第三の再生モードの接続設定は広く設定されることを特徴とする請求項1、2または3に記載の音声再生システム。
  5.  前記音声の再生モードには、第一の再生モード、第二の再生モードおよび第三の再生モードがあり、
     前記第一の再生モードでは、前記音質設定として、音質を重視した音声圧縮方式が適用され、
     前記第二の再生モードでは、前記音質設定として、再生の低遅延性を重視した音声圧縮方式が適用され、
     前記第三の再生モードでは、前記音質設定として、接続安定性を重視した音声圧縮方式が適用されることを特徴とする請求項2または3に記載の音声再生システム。
  6.  前記音声再生システムが備える一または複数のコンピュータプロセッサは、さらに、
     前記音声再生装置が接続された情報処理装置の種別を識別する装置種別識別部を備え、
     前記切替部は、前記装置種別識別部による識別の結果に応じて、自動的に、前記音声の再生モードを切り替えることを特徴とする請求項1から5のいずれか一項に記載の音声再生システム。
  7.  前記音声再生システムが備える一または複数のコンピュータプロセッサは、さらに、
     前記音声再生装置が前記情報処理装置から受信する音声の種別を識別する音声種別識別部を備え、
     前記切替部は、前記音声種別識別部による識別の結果に応じて、自動的に、前記音声の再生モードを切り替えることを特徴とする請求項1から6のいずれか一項に記載の音声再生システム。
  8.  前記音声再生システムが備える一または複数のコンピュータプロセッサは、さらに、
     前記音声再生装置が接続された情報処理装置で実行されているアプリケーションの種別を識別するアプリケーション種別識別部を備え、
     前記切替部は、前記アプリケーション種別識別部による識別の結果に応じて、自動的に、前記音声の再生モードを切り替えることを特徴とする請求項1から7のいずれか一項に記載の音声再生システム。
  9.  音声を再生するための音声再生システムにおいて実行される音声再生方法であって、
     前記音声再生システムは、少なくとも情報処理装置および当該情報処理装置と接続可能な音声再生装置を備え、
     前記音声再生システムが備える一または複数のコンピュータプロセッサに、
     前記音声再生装置における音声の再生モードの切り替え操作を受け付ける受付ステップと、
     前記受付ステップにおいて受け付けられた操作に応じて、前記音声の再生モードを切り替える切替ステップと
    を実行させ、
     前記切替ステップにおける前記音声の再生モードの切り替えによって、前記音声再生装置における外音の取り込みに関する外音設定および前記音声再生装置から出力される音声の音場に関する音場設定が、自動的に変更される音声再生方法。
  10.  音声を再生するための音声再生システムにおいて実行されるコンピュータプログラムであって、
     前記音声再生システムは、少なくとも情報処理装置および当該情報処理装置と接続可能な音声再生装置を備え、
     前記音声再生システムが備える一または複数のコンピュータプロセッサに、
     前記音声再生装置における音声の再生モードの切り替え操作を受け付ける受付機能と、
     前記受付機能により受け付けられた操作に応じて、前記音声の再生モードを切り替える切替機能と
    を実現させ、
     前記切替機能により前記音声の再生モードの切り替えによって、前記音声再生装置における外音の取り込みに関する外音設定および前記音声再生装置から出力される音声の音場に関する音場設定が、自動的に変更されるコンピュータプログラム。
  11.  音声を再生するための音声再生装置であって、
     音声の再生モードの切り替え操作を受け付ける受付部と、
     前記受付部により受け付けられた操作に応じて、前記音声の再生モードを切り替える切替部と、
     前記切替部による前記音声の再生モードの切り替えに応じて、外音の取り込みに関する外音設定および出力される音声の音場に関する音場設定を自動的に変更する変更部と
    を備える音声再生装置。
PCT/JP2021/014739 2021-04-07 2021-04-07 音声再生システム、音声再生方法およびコンピュータプログラム WO2022215187A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2021/014739 WO2022215187A1 (ja) 2021-04-07 2021-04-07 音声再生システム、音声再生方法およびコンピュータプログラム
TW111107239A TW202303381A (zh) 2021-04-07 2022-03-01 音訊播放系統、音訊播放方法及電腦程式產品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/014739 WO2022215187A1 (ja) 2021-04-07 2021-04-07 音声再生システム、音声再生方法およびコンピュータプログラム

Publications (1)

Publication Number Publication Date
WO2022215187A1 true WO2022215187A1 (ja) 2022-10-13

Family

ID=83545254

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/014739 WO2022215187A1 (ja) 2021-04-07 2021-04-07 音声再生システム、音声再生方法およびコンピュータプログラム

Country Status (2)

Country Link
TW (1) TW202303381A (ja)
WO (1) WO2022215187A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03285500A (ja) * 1990-03-31 1991-12-16 Mazda Motor Corp 音響装置
JP2013048412A (ja) * 2011-07-28 2013-03-07 Apple Inc オーディオエンハンス型装置
JP2015039104A (ja) * 2013-07-09 2015-02-26 寶トク科技股フン有限公司 ヘッドホン装置及びその制御方法
WO2017038260A1 (ja) * 2015-08-28 2017-03-09 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03285500A (ja) * 1990-03-31 1991-12-16 Mazda Motor Corp 音響装置
JP2013048412A (ja) * 2011-07-28 2013-03-07 Apple Inc オーディオエンハンス型装置
JP2015039104A (ja) * 2013-07-09 2015-02-26 寶トク科技股フン有限公司 ヘッドホン装置及びその制御方法
WO2017038260A1 (ja) * 2015-08-28 2017-03-09 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
TW202303381A (zh) 2023-01-16

Similar Documents

Publication Publication Date Title
JP6883636B2 (ja) ダッキング制御のためのメタデータ
US10979842B2 (en) Methods and systems for providing a composite audio stream for an extended reality world
US7931537B2 (en) Voice input in a multimedia console environment
US6359994B1 (en) Portable computer expansion base with enhancement speaker
US10834503B2 (en) Recording method, recording play method, apparatuses, and terminals
CN109165005B (zh) 音效增强方法、装置、电子设备及存储介质
WO2016150316A1 (zh) 音频输出控制方法及装置
US11176956B2 (en) Application directed latency control for wireless audio streaming
US9704497B2 (en) Method and system of audio power reduction and thermal mitigation using psychoacoustic techniques
US20090089813A1 (en) Method and system for dynamic audio stream redirection
JP2022083443A (ja) オーディオと関連してユーザカスタム型臨場感を実現するためのコンピュータシステムおよびその方法
TWM526238U (zh) 可依據使用者年齡調整等化器設定之電子裝置及聲音播放裝置
US20210390971A1 (en) Method and apparatus and telephonic system for acoustic scene conversion
WO2020107201A1 (zh) 立体声播放方法、装置、存储介质及电子设备
US10291759B2 (en) Data return type voice input/output device for smart phone
WO2022215187A1 (ja) 音声再生システム、音声再生方法およびコンピュータプログラム
US20180332423A1 (en) Personalization of spatial audio for streaming platforms
KR101611843B1 (ko) 음성신호 재입력형 스마트기기용 이어폰
JP2024534274A (ja) 振動モータの制御方法、振動モータの制御装置、記憶媒体及び電子機器
KR20230117572A (ko) 멀티미디어 재생 동기화
TW200816850A (en) An audio media player with multiport
TWI784594B (zh) 會議終端及聲音浮水印的嵌入方法
WO2022185551A1 (ja) 音声アシストシステム、音声アシスト方法およびコンピュータプログラム
US20240029755A1 (en) Intelligent speech or dialogue enhancement
EP4336343A1 (en) Device control

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21935991

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21935991

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP