WO2021132852A1 - Audio data output method and electronic device supporting same - Google Patents

Audio data output method and electronic device supporting same Download PDF

Info

Publication number
WO2021132852A1
WO2021132852A1 PCT/KR2020/012910 KR2020012910W WO2021132852A1 WO 2021132852 A1 WO2021132852 A1 WO 2021132852A1 KR 2020012910 W KR2020012910 W KR 2020012910W WO 2021132852 A1 WO2021132852 A1 WO 2021132852A1
Authority
WO
WIPO (PCT)
Prior art keywords
electronic device
user
processor
speakers
audio data
Prior art date
Application number
PCT/KR2020/012910
Other languages
French (fr)
Korean (ko)
Inventor
고성환
김기훈
박영현
박의순
박진우
방경호
송은정
정문식
조준영
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Publication of WO2021132852A1 publication Critical patent/WO2021132852A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Definitions

  • Various embodiments of the present disclosure relate to a method of outputting audio data and an electronic device supporting the same.
  • An electronic device such as a smart phone may provide various functions.
  • the electronic device may receive a user's voice through a microphone and may provide a function of outputting voice data through a speaker.
  • the electronic device may transmit the user's voice received through the microphone to the external electronic device, and may output the other's voice through the speaker.
  • Existing electronic devices support only dual mono sound transmission and reception during a call. For example, even if the electronic device is equipped with a stereo speaker, the electronic device does not output stereo sound audio data during communication, but outputs dual mono audio data. Since most of the recently released electronic devices are equipped with stereo speakers, a function of outputting stereo audio data during a call is required.
  • Various embodiments of the present disclosure may provide an audio data output method for selecting and outputting audio data based on a positional relationship between an electronic device and a user, and an electronic device supporting the same.
  • An electronic device includes a plurality of microphones, a plurality of speakers, a sensor, a memory, and a processor operatively connected to the plurality of microphones, the plurality of speakers, the sensor, and the memory. including, wherein the processor receives the user's voice through each of the plurality of microphones, and based on a difference in reception time of the user's voice received through each of the plurality of microphones, the electronic device and determine the positional relationship between the users, determine the posture of the electronic device based on sensor information measured through the sensor, and determine the posture of the electronic device based on the determined positional relationship and the determined posture of the electronic device, the electronic device may be set to determine audio data output through the plurality of speakers included in the .
  • the method for outputting audio data of an electronic device includes an operation of receiving a user's voice through each of a plurality of microphones included in the electronic device, and each of the plurality of microphones An operation of determining a positional relationship between the electronic device and the user based on a difference in the reception time of the received user's voice, and the posture of the electronic device based on sensor information measured through a sensor included in the electronic device and determining the audio data to be output through the plurality of speakers included in the electronic device based on the determined positional relationship and the determined posture of the electronic device.
  • the electronic device is operatively configured with a plurality of microphones, a plurality of speakers, a camera, a memory, and the plurality of microphones, the plurality of speakers, the camera, and the memory.
  • a connected processor wherein the processor receives a user's voice through each of the plurality of microphones, obtains an image captured by the camera, and obtains a position value of an object corresponding to the user from the image and determining a positional relationship between the electronic device and the user based on a difference in reception time of the user's voice received through each of the plurality of microphones and a position value of the object, and based on the determined positional relationship
  • the processor may be set to determine the audio data output through the plurality of speakers.
  • high-quality audio sound may be provided to the user by selectively outputting audio data based on a positional relationship between the electronic device and the user.
  • FIG. 1 is a block diagram of an electronic device in a network environment according to various embodiments of the present disclosure
  • FIG. 2 is a block diagram of an electronic device related to output of audio data according to an embodiment of the present invention.
  • FIG. 3 is a diagram illustrating a method of outputting audio data according to an embodiment of the present invention.
  • FIG. 4 is a diagram illustrating a method of selectively outputting audio data based on a positional relationship between an electronic device and a user and a posture of the electronic device, according to an embodiment of the present invention.
  • FIG. 5 is a diagram illustrating another method of selectively outputting audio data based on a positional relationship between an electronic device and a user and a posture of the electronic device, according to an embodiment of the present invention.
  • FIG. 6 is a diagram illustrating another method of selectively outputting audio data based on a positional relationship between an electronic device and a user and a posture of the electronic device, according to an embodiment of the present invention.
  • FIG. 7 is a diagram illustrating a method of selectively outputting audio data based on a positional relationship between an electronic device and a user, according to an embodiment of the present invention.
  • FIG. 8 is a diagram illustrating another method of selectively outputting audio data based on a positional relationship between an electronic device and a user, according to an embodiment of the present invention.
  • FIG. 9 is a view for explaining a preset area according to an arrangement position of a plurality of speakers, according to an embodiment of the present invention.
  • FIG. 1 is a block diagram of an electronic device 101 in a network environment 100 according to various embodiments.
  • the electronic device 101 communicates with the electronic device 102 through a first network 198 (eg, a short-range wireless communication network) or a second network 199 . It may communicate with the electronic device 104 or the server 108 through (eg, a long-distance wireless communication network). According to an embodiment, the electronic device 101 may communicate with the electronic device 104 through the server 108 .
  • a first network 198 eg, a short-range wireless communication network
  • a second network 199 e.g., a second network 199 . It may communicate with the electronic device 104 or the server 108 through (eg, a long-distance wireless communication network). According to an embodiment, the electronic device 101 may communicate with the electronic device 104 through the server 108 .
  • the electronic device 101 includes a processor 120 , a memory 130 , an input device 150 , a sound output device 155 , a display device 160 , an audio module 170 , and a sensor module ( 176 , interface 177 , haptic module 179 , camera module 180 , power management module 188 , battery 189 , communication module 190 , subscriber identification module 196 , or antenna module 197 . ) may be included. In some embodiments, at least one of these components (eg, the display device 160 or the camera module 180 ) may be omitted or one or more other components may be added to the electronic device 101 . In some embodiments, some of these components may be implemented as one integrated circuit. For example, the sensor module 176 (eg, a fingerprint sensor, an iris sensor, or an illuminance sensor) may be implemented while being embedded in the display device 160 (eg, a display).
  • the sensor module 176 eg, a fingerprint sensor, an iris sensor, or an illuminance sensor
  • the processor 120 executes software (eg, the program 140) to execute at least one other component (eg, a hardware or software component) of the electronic device 101 connected to the processor 120 . It can control and perform various data processing or operations. According to one embodiment, as at least part of data processing or operation, the processor 120 converts commands or data received from other components (eg, the sensor module 176 or the communication module 190 ) to the volatile memory 132 . may be loaded into the volatile memory 132 , process commands or data stored in the volatile memory 132 , and store the resulting data in the non-volatile memory 134 .
  • software eg, the program 140
  • the processor 120 converts commands or data received from other components (eg, the sensor module 176 or the communication module 190 ) to the volatile memory 132 .
  • the volatile memory 132 may be loaded into the volatile memory 132 , process commands or data stored in the volatile memory 132 , and store the resulting data in the non-volatile memory 134 .
  • the processor 120 includes a main processor 121 (eg, a central processing unit or an application processor), and a secondary processor 123 (eg, a graphic processing unit, an image signal processor) that can operate independently or together with the main processor , a sensor hub processor, or a communication processor). Additionally or alternatively, the auxiliary processor 123 may be configured to use less power than the main processor 121 or to be specialized for a designated function. The auxiliary processor 123 may be implemented separately from or as a part of the main processor 121 .
  • a main processor 121 eg, a central processing unit or an application processor
  • a secondary processor 123 eg, a graphic processing unit, an image signal processor
  • the auxiliary processor 123 may be configured to use less power than the main processor 121 or to be specialized for a designated function.
  • the auxiliary processor 123 may be implemented separately from or as a part of the main processor 121 .
  • the auxiliary processor 123 may be, for example, on behalf of the main processor 121 while the main processor 121 is in an inactive (eg, sleep) state, or when the main processor 121 is active (eg, executing an application). ), together with the main processor 121, at least one of the components of the electronic device 101 (eg, the display device 160, the sensor module 176, or the communication module 190) It is possible to control at least some of the related functions or states.
  • the coprocessor 123 eg, an image signal processor or a communication processor
  • may be implemented as part of another functionally related component eg, the camera module 180 or the communication module 190. have.
  • the memory 130 may store various data used by at least one component (eg, the processor 120 or the sensor module 176 ) of the electronic device 101 .
  • the data may include, for example, input data or output data for software (eg, the program 140 ) and instructions related thereto.
  • the memory 130 may include a volatile memory 132 or a non-volatile memory 134 .
  • the program 140 may be stored as software in the memory 130 , and may include, for example, an operating system 142 , middleware 144 , or an application 146 .
  • the input device 150 may receive a command or data to be used by a component (eg, the processor 120 ) of the electronic device 101 from the outside (eg, a user) of the electronic device 101 .
  • the input device 150 may include, for example, a microphone, a mouse, a keyboard, or a digital pen (eg, a stylus pen).
  • the sound output device 155 may output a sound signal to the outside of the electronic device 101 .
  • the sound output device 155 may include, for example, a speaker or a receiver.
  • the speaker can be used for general purposes such as multimedia playback or recording playback, and the receiver can be used to receive incoming calls. According to one embodiment, the receiver may be implemented separately from or as part of the speaker.
  • the display device 160 may visually provide information to the outside (eg, a user) of the electronic device 101 .
  • the display device 160 may include, for example, a display, a hologram device, or a projector and a control circuit for controlling the corresponding device.
  • the display device 160 may include a touch circuitry configured to sense a touch or a sensor circuit (eg, a pressure sensor) configured to measure the intensity of a force generated by the touch. have.
  • the audio module 170 may convert a sound into an electric signal or, conversely, convert an electric signal into a sound. According to an embodiment, the audio module 170 acquires a sound through the input device 150 , or an external electronic device (eg, a sound output device 155 ) connected directly or wirelessly with the electronic device 101 .
  • the electronic device 102) eg, a speaker or headphones
  • the electronic device 102 may output a sound.
  • the sensor module 176 detects an operating state (eg, power or temperature) of the electronic device 101 or an external environmental state (eg, user state), and generates an electrical signal or data value corresponding to the sensed state. can do.
  • the sensor module 176 may include, for example, a gesture sensor, a gyro sensor, a barometric sensor, a magnetic sensor, an acceleration sensor, a grip sensor, a proximity sensor, a color sensor, an IR (infrared) sensor, a biometric sensor, It may include a temperature sensor, a humidity sensor, or an illuminance sensor.
  • the interface 177 may support one or more specified protocols that may be used by the electronic device 101 to directly or wirelessly connect with an external electronic device (eg, the electronic device 102 ).
  • the interface 177 may include, for example, a high definition multimedia interface (HDMI), a universal serial bus (USB) interface, an SD card interface, or an audio interface.
  • the connection terminal 178 may include a connector through which the electronic device 101 can be physically connected to an external electronic device (eg, the electronic device 102 ).
  • the connection terminal 178 may include, for example, an HDMI connector, a USB connector, an SD card connector, or an audio connector (eg, a headphone connector).
  • the haptic module 179 may convert an electrical signal into a mechanical stimulus (eg, vibration or movement) or an electrical stimulus that the user can perceive through tactile or kinesthetic sense.
  • the haptic module 179 may include, for example, a motor, a piezoelectric element, or an electrical stimulation device.
  • the camera module 180 may capture still images and moving images. According to an embodiment, the camera module 180 may include one or more lenses, image sensors, image signal processors, or flashes.
  • the power management module 188 may manage power supplied to the electronic device 101 .
  • the power management module 188 may be implemented as, for example, at least a part of a power management integrated circuit (PMIC).
  • PMIC power management integrated circuit
  • the battery 189 may supply power to at least one component of the electronic device 101 .
  • the battery 189 may include, for example, a non-rechargeable primary cell, a rechargeable secondary cell, or a fuel cell.
  • the communication module 190 is a direct (eg, wired) communication channel or a wireless communication channel between the electronic device 101 and an external electronic device (eg, the electronic device 102, the electronic device 104, or the server 108). It can support establishment and communication through the established communication channel.
  • the communication module 190 may include one or more communication processors that operate independently of the processor 120 (eg, an application processor) and support direct (eg, wired) communication or wireless communication.
  • the communication module 190 is a wireless communication module 192 (eg, a cellular communication module, a short-range wireless communication module, or a global navigation satellite system (GNSS) communication module) or a wired communication module 194 (eg, : It may include a local area network (LAN) communication module, or a power line communication module).
  • a wireless communication module 192 eg, a cellular communication module, a short-range wireless communication module, or a global navigation satellite system (GNSS) communication module
  • GNSS global navigation satellite system
  • wired communication module 194 eg, : It may include a local area network (LAN) communication module, or a power line communication module.
  • a corresponding communication module may be a first network 198 (eg, a short-range communication network such as Bluetooth, WiFi direct, or infrared data association (IrDA)) or a second network 199 (eg, a cellular network, the Internet, or It may communicate with an external electronic device via a computer network (eg, a telecommunication network such as a LAN or WAN).
  • a computer network eg, a telecommunication network such as a LAN or WAN.
  • These various types of communication modules may be integrated into one component (eg, a single chip) or may be implemented as a plurality of components (eg, multiple chips) separate from each other.
  • the wireless communication module 192 uses subscriber information (eg, International Mobile Subscriber Identifier (IMSI)) stored in the subscriber identification module 196 within a communication network such as the first network 198 or the second network 199 .
  • subscriber information eg, International Mobile Subscriber Identifier (IMSI)
  • IMSI International Mobile Subscriber Identifier
  • the antenna module 197 may transmit or receive a signal or power to the outside (eg, an external electronic device).
  • the antenna module 197 may include one antenna including a conductor formed on a substrate (eg, a PCB) or a radiator formed of a conductive pattern.
  • the antenna module 197 may include a plurality of antennas. In this case, it may be selected from the first plurality of antennas.
  • a signal or power may be transmitted or received between the communication module 190 and an external electronic device through the selected at least one antenna.
  • other components eg, RFIC
  • other than the radiator may be additionally formed as a part of the antenna module 197 .
  • peripheral devices eg, a bus, general purpose input and output (GPIO), serial peripheral interface (SPI), or mobile industry processor interface (MIPI)
  • GPIO general purpose input and output
  • SPI serial peripheral interface
  • MIPI mobile industry processor interface
  • the command or data may be transmitted or received between the electronic device 101 and the external electronic device 104 through the server 108 connected to the second network 199 .
  • Each of the electronic devices 102 and 104 may be the same or a different type of the electronic device 101 .
  • all or a part of operations executed in the electronic device 101 may be executed in one or more of the external electronic devices 102 , 104 , or 108 .
  • the electronic device 101 may perform the function or service itself instead of executing the function or service itself.
  • one or more external electronic devices may be requested to perform at least a part of the function or the service.
  • the one or more external electronic devices that have received the request may execute at least a part of the requested function or service, or an additional function or service related to the request, and transmit a result of the execution to the electronic device 101 .
  • the electronic device 101 may process the result as it is or additionally and provide it as at least a part of a response to the request.
  • cloud computing, distributed computing, or client-server computing technology may be used.
  • FIG. 2 is a block diagram of an electronic device related to output of audio data according to an embodiment of the present invention.
  • the electronic device 200 converts audio data output through the plurality of speakers 202 to stereo sound or mono sound based on the positional relationship between the electronic device 200 and the user. (mono sound) can be provided.
  • the electronic device 200 may selectively provide stereo sound or mono sound in order to provide a better sound quality call environment to the user during a call in a hands-free situation.
  • the electronic device 200 determines a positional relationship between the electronic device 200 and the user to provide stereo sound when the user is located within a preset area, and provides mono sound when the user is located outside the preset area.
  • the preset area is an area set according to the positions of the plurality of speakers 202 disposed on the electronic device 200, and is a sweet spot that provides stereo sound to the user and provides the best sound quality. may include.
  • the electronic device 200 for providing the above-described function includes a plurality of microphones 201 , a plurality of speakers 202 , a sensor 203 , a camera 204 , a memory 205 and It may include a processor 206 .
  • the configuration of the electronic device 200 is not limited thereto. According to various embodiments, the electronic device 200 may omit at least one component among the above-described components, and may further include at least one other component.
  • the plurality of microphones 201 may receive a user's voice. Also, the plurality of microphones 201 may provide the received voice to the processor 206 . In FIG. 2 , it has been described that the plurality of microphones 201 include a first microphone 201a and a second microphone 201b, but the number of microphones included in the electronic device 200 is limited thereto. no. According to an embodiment, the electronic device 200 may further include at least one other microphone.
  • the plurality of speakers 202 may output audio data received from the processor 206 .
  • the plurality of speakers 202 may output audio data selected by the processor 206 to provide sound to the user.
  • FIG. 2 it has been described that the plurality of speakers 202 include the first speaker 202a and the second speaker 202b, but the number of speakers included in the electronic device 200 is limited thereto. no.
  • the sensor 203 may be disposed inside the electronic device 200 to detect an operating state of the electronic device 200 or an external environmental state, and may generate an electrical signal or data value corresponding to the sensed state. According to an embodiment, the sensor 203 may acquire sensor information related to the posture of the electronic device 200 . For example, whenever the posture of the electronic device 200 is changed, the sensor 203 measures the change angle of the electronic device 200 and provides the measured change angle to the processor 206 as sensor information. can
  • the sensor 203 may measure a change angle of the electronic device 200 based on an imaginary line passing through the plurality of speakers 202 disposed in the electronic device 200 , and measure The changed angle of the electronic device 200 may be provided to the processor 206 as sensor information.
  • the sensor 203 may include, for example, at least one of a gyro sensor and an acceleration sensor. However, the type of the sensor 203 is not limited thereto.
  • the camera 204 may acquire image data by photographing an object (eg, a user).
  • the image data may include at least one of still image data and moving image data.
  • the memory 205 may store various data used by at least one component of the electronic device 200 .
  • the memory 205 stores various data such as voice acquired from a plurality of microphones 201 , audio data output through a plurality of speakers 202 , and a captured image acquired from the camera 204 . can be saved
  • the processor 206 may be operatively connected to other components of the electronic device 200 to control operations of the other components.
  • the processor 206 is operatively connected to a plurality of microphones 201 , a plurality of speakers 202 , a sensor 203 , a camera 204 , and a memory 205 to enable the plurality of microphones ( 201 ), the plurality of speakers 202 , the sensor 203 , the camera 204 , and the memory 205 .
  • the processor 206 may receive a user's voice through the plurality of microphones 201 . Also, the processor 206 may determine the positional relationship between the electronic device 200 and the user based on a difference in reception time of the user's voice received through each of the plurality of microphones 201 . For example, when receiving the user's voice through the first microphone 201a and the second microphone 201b included in the plurality of microphones 201 , the processor 206 controls the first microphone 201a A positional relationship between the electronic device 200 and the user based on a difference between a first time when the user's voice is received through ) and a second time when the user's voice is received through the second microphone 201b can be judged
  • the processor 206 compares the received first time with the second time, and based on the first threshold value and the compared value, a position between the electronic device 200 and the user relationship can be judged.
  • the electronic device 200 may determine whether the user is within a preset area based on the determined positional relationship.
  • the processor compares the first time with the second time, and a comparison value of 3 can confirm.
  • the processor 206 may compare the obtained comparison value 3 with a first threshold value 5, in which case, if the comparison value is equal to or greater than the first threshold value, The processor 206 may determine that the user is not located in the preset region, and when the comparison value is less than the first threshold value, determine that the user is located in the preset region.
  • the processor 206 may determine that the current user is within the preset area. That is, the first threshold value may be referred to as reference information for determining the positional relationship between the electronic device 200 and the user based on the time of the received voice. However, the first threshold value may be changed according to a size of the electronic device 200 and a location where each of the plurality of speakers 202 disposed in the electronic device 200 is disposed.
  • the processor 206 may obtain sensor information related to the posture of the electronic device 200 through the sensor 203 . According to an embodiment, the processor 206 may determine the posture of the electronic device 200 based on angle information of the electronic device 200 measured by the sensor 203 . For example, the processor 206 may determine whether the electronic device is disposed along the vertical axis (or vertically) or horizontally (or horizontally) based on the angle information of the electronic device 200 .
  • the processor 206 measures a change angle of the electronic device to obtain and obtain sensor information The one piece of information may be compared with the second threshold value. According to an embodiment, the processor 206 may determine that the change angle of the electronic device 200 is 49 degrees based on the sensor information acquired through the sensor 203 . In this case, when the second threshold value is 45 degrees, the processor 206 may determine the posture of the electronic device 200 by comparing the change angle of 49 degrees with the second threshold value of 45 degrees.
  • the processor 206 determines that the user is not located in an area in which the positional relationship between the electronic device 200 and the user is preset.
  • the second threshold value is reference information for determining whether the postures of the processor 206 and the current electronic device 200 are postures capable of providing stereo audio data to the user, and is changed for each electronic device 200 . It can be considered as standard information.
  • the processor 206 is configured to generate audio output through the plurality of speakers 202 based on the positional relationship between the electronic device 200 and the user and the posture of the electronic device 200 . data can be determined. The processor 206 may determine audio data to be output through each of the plurality of speakers 202 according to whether the user is located in a preset area.
  • the processor 206 may output at least partially different audio data to each of the plurality of speakers 202 to provide stereo sound.
  • the processor 206 may output the same audio data to each of the plurality of speakers 202 to provide mono sound. That is, the processor 206 determines whether the user is located in a preset area in which the stereo sound can be provided from the electronic device 200 based on the first threshold value and the second threshold value, and determines the result of the determination. Based on this, you can decide whether to provide stereo sound or mono sound to the user.
  • the preset area may be changed according to the location of each of the plurality of speakers 202 disposed in the electronic device 200 and/or the size of the electronic device 200 .
  • the first area and the third area may be set as preset areas according to the positions of the first speaker located above the electronic device 200 and the second speaker located below the electronic device 200 .
  • the processor 206 determines that the user is in the preset area. It is determined that it is located, and in order to provide an optimal sound to the user, at least a portion of different audio data may be output to each of the plurality of speakers 202 to provide stereo sound to the user.
  • the processor 206 may provide a mono sound instead of a stereo sound.
  • the processor 206 may receive a user's voice through each of the plurality of microphones 201 , and determine whether to provide a mono sound to the user based on a difference in reception time of the received voice. For example, the processor 206 may determine a positional relationship between the electronic device 200 and the user based on a difference in reception time of a voice received through each of the plurality of microphones 201 . At this time, if it is determined that the user is located outside a preset area based on the arrangement positions of the plurality of speakers 202 included in the electronic device 200 , the processor 206 provides a mono sound to the user. can
  • the processor 206 may acquire an image obtained by photographing the object from the camera 204 . Also, the processor 206 may more accurately determine the positional relationship between the electronic device 200 and the user based on the captured image, the time difference between the identified voice signals, and the determined posture of the electronic device. The processor 206 may determine audio data to be output through the plurality of speakers 202 based on the determined positional relationship between the electronic device 200 and the user.
  • the processor 206 uses the first threshold value, the second threshold value, and the camera 204 to operate the electronic device ( 200) and the user may be determined, and audio data to be output through each of the plurality of speakers 202 may be set based on the determined positional relationship.
  • the processor 206 determines that the electronic device 200 is lying down through the sensor 203, The positional relationship between the electronic device 200 and the user is determined again based on the user's voice received through each of the plurality of microphones 201 and the image captured by the camera 204, and the plurality of Audio data to be output through each of the speakers 202 may be reset.
  • the processor 206 may determine audio data to be output through the plurality of speakers 202 according to whether the user is located in a preset area. For example, when the user is located in the preset area, the processor 206 may output at least partially different audio data to each of the plurality of speakers 202 to provide stereo sound. As another example, when the user is located outside the preset area, the processor 206 may output the same audio data to each of the plurality of speakers 202 to provide mono sound.
  • the reason that the processor 206 determines that the user is not located inside the preset area and provides the mono sound to the user is that when stereo sound is provided to the user located outside the preset area, the plurality of At least a portion of the audio data output through each of the speakers 202 may cause an extremely aggravated interference phenomenon. Accordingly, since the sound quality of the stereo sound deteriorated due to the interference phenomenon is inferior to that of the mono sound, the processor 206 performs the same through each of the plurality of speakers 202 if the user is not located within the preset area. A mono sound can be provided by outputting audio data.
  • the preset area may be determined according to a location of a plurality of speakers 202 disposed in the electronic device 200 or a size of the electronic device 200 .
  • the preset area may include a sweet spot that provides the best sound quality when stereo sound is provided to the user based on the arrangement positions of the plurality of speakers 202 .
  • the processor 206 when the processor 206 outputs stereo sound through each of the plurality of speakers 202 , the processor 206 uses a filter to prevent crosstalk, which is a phenomenon that occurs when audio data interferes with each other.
  • a filter to prevent crosstalk, which is a phenomenon that occurs when audio data interferes with each other.
  • a filter may be applied to the stereo sound output by the processor 206 through each of the plurality of speakers 202 to cancel crosstalk.
  • the electronic device includes a plurality of microphones (eg, the first microphone 201a and the second microphone 201b) and a plurality of speakers.
  • a plurality of microphones eg, the first microphone 201a and the second microphone 201b
  • a plurality of speakers eg, first speaker 202a and second speaker 202b
  • sensor eg, sensor 203
  • memory eg, memory 205
  • a processor eg, processor 206 operatively coupled to the sensor and the memory, wherein the processor receives, through each of the plurality of microphones, a user's voice, and each of the plurality of microphones based on a difference in reception time of the user's voice received through the user, determine a positional relationship between the electronic device and the user, and determine the posture of the electronic device based on sensor information measured through the sensor
  • Audio data output through the plurality of speakers included in the electronic device may be determined based on the determined positional relationship and
  • the processor determines whether the user is located in a preset area based on the determined positional relationship and the determined posture of the electronic device, and determines that the user is not located in the preset area. When it is determined that the same audio data is output through each of the plurality of speakers, and when it is determined that the user is located in the preset area, at least some different audio data are output through each of the plurality of speakers can be set.
  • the processor may set the preset area based on a location where the plurality of speakers are disposed in the electronic device.
  • the electronic device further includes a camera (eg, a camera 204 ), and the processor includes an image captured by the camera and a voice of the user received through each of the plurality of microphones. It may be configured to determine a positional relationship between the electronic device and the user based on a reception time difference of .
  • a camera eg, a camera 204
  • the processor includes an image captured by the camera and a voice of the user received through each of the plurality of microphones. It may be configured to determine a positional relationship between the electronic device and the user based on a reception time difference of .
  • the electronic device further includes at least one other microphone
  • the processor is configured to include a reception time of the user's voice received through each of the plurality of microphones and the at least one other microphone. It may be configured to determine a positional relationship between the electronic device and the user based on a reception time of the received user's voice.
  • the electronic device may further include a filter for preventing a crosstalk phenomenon occurring between the audio data output through each of the plurality of speakers.
  • the processor outputs the same audio data through each of the plurality of speakers when the value indicating the difference in the reception time of the user's voice is greater than or equal to a preset first threshold value, When a value indicating a difference in reception time of a user's voice is smaller than the first threshold value, at least a portion of the audio data may be set to output different audio data through each of the plurality of speakers.
  • the processor calculates the angle of the electronic device based on the sensor information, and when the calculated angle of the electronic device is greater than or equal to a preset second threshold value, the plurality of speakers The same audio data may be output through each, and when the calculated angle of the electronic device is smaller than the second threshold value, at least some of the different audio data may be output through each of the plurality of speakers.
  • the electronic device further includes a camera (eg, a camera 204 ), the processor acquires an image captured by the camera, and a position of an object corresponding to the user in the image It may be configured to obtain a value and reconstruct the determined audio data based on the determined positional relationship, the determined posture of the electronic device, and the position value of the object.
  • a camera eg, a camera 204
  • the processor acquires an image captured by the camera, and a position of an object corresponding to the user in the image It may be configured to obtain a value and reconstruct the determined audio data based on the determined positional relationship, the determined posture of the electronic device, and the position value of the object.
  • the electronic device includes a plurality of microphones (eg, the first microphone 201a and the second microphone 201b) and a plurality of speakers.
  • a plurality of microphones eg, the first microphone 201a and the second microphone 201b
  • a plurality of speakers eg, first speaker 202a and second speaker 202b
  • camera eg, camera 204
  • memory eg, memory 205
  • the processor receives a user's voice through each of the plurality of microphones, and an image captured by the camera to obtain the position value of the object corresponding to the user in the image, and based on the reception time difference of the user's voice received through each of the plurality of microphones and the position value of the object, the electronic and determine a positional relationship between the device and the user, and determine the audio data to be output through the plurality of speakers based on
  • the processor selects at least two of the plurality of speakers based on the determined positional relationship, and outputs at least partially different audio data through each of the selected at least two speakers. can be set to
  • FIG. 3 is a diagram illustrating a method of outputting audio data according to an embodiment of the present invention.
  • the processor eg, the processor 206 performs each of a plurality of microphones (eg, the plurality of microphones 201 ) disposed in the electronic device (eg, the electronic device 200 ). It is possible to receive the user's voice signal through the electronic device (eg, the electronic device 200 ).
  • the processor may determine a positional relationship between the electronic device and the user based on a received time difference of a voice signal received through each of the plurality of microphones.
  • a first microphone eg, a first microphone 201a among the plurality of microphones is disposed on one side (eg, a left side) of the electronic device
  • a second microphone eg, a second microphone among the plurality of microphones 2
  • the microphone 201b is disposed on the other side (eg, the right side) of the electronic device, when a user located in the direction of one side (eg, the left side) of the electronic device speaks, the first microphone located closer to the user will 2 Can receive voice faster than microphone.
  • the processor compares T1, which is the time of the voice signal received by the first microphone 201a, with T2, which is the time of the voice signal received by the second microphone 201b, based on the cross-correlation, and receives the voice You can see the time difference.
  • the processor may determine a positional relationship between the electronic device and the user based on a difference in reception time of the received voice.
  • the processor may determine the posture of the electronic device based on sensor information received from a sensor (eg, the sensor 203).
  • the sensor may include a gyro sensor and an acceleration sensor, and is not limited thereto as long as sensor information for determining the posture of the electronic device can be obtained.
  • the sensor may measure a change angle of the electronic device based on a virtual line passing through the plurality of speakers disposed in the electronic device, and provide the measured change angle of the electronic device as sensor information to the processor.
  • the processor may determine the posture of the electronic device based on the sensor information.
  • the processor may determine and output audio data output through each of a plurality of speakers (eg, a plurality of speakers 202) based on the positional relationship and the determined posture of the electronic device. .
  • a plurality of speakers eg, a plurality of speakers 202
  • the processor may output stereo sound through the plurality of speakers.
  • the processor may output a mono sound through the plurality of speakers.
  • FIG. 4 is a diagram illustrating a method of selectively outputting audio data based on a positional relationship between an electronic device and a user and a posture of the electronic device, according to an embodiment of the present invention.
  • the processor may compare the voice received through each of the plurality of microphones (eg, the plurality of microphones 201) based on the cross-correlation. , it is possible to check the difference in reception time of the received voice based on the comparison result.
  • the processor may compare a first threshold value that is preset reference information for determining the positional relationship between the electronic device and the user and a difference in reception time of the received voice. When the difference in the reception time of the received voice is greater than or equal to the first threshold value, the processor may determine that the user is not located in the preset area.
  • the processor when the processor determines that the user is not located within the preset area, in operation 403 , the processor outputs the same audio data through each of the plurality of speakers (eg, the plurality of speakers 202 ).
  • a mono sound can be provided to the user. If the processor provides stereo sound when the user's location is outside the preset area, interference may occur between audio data that is at least partially different from each other outputted through each of the plurality of speakers. Accordingly, when the user's location is outside the preset area, the processor may provide a mono sound outputting the same audio data through the plurality of speakers.
  • the processor may compare the angle of the electronic device determined based on sensor information received from a sensor (eg, the sensor 203) with a preset second threshold value.
  • the processor may determine the posture of the electronic device based on the comparison result. For example, when the angle of the electronic device is smaller than the second threshold value, the processor may determine that the electronic device is disposed along the vertical axis. Also, when the angle of the electronic device is greater than or equal to the second threshold value, the processor may determine that the electronic device is arranged in a horizontal axis.
  • the processor determines a preset area according to positions of a plurality of speakers disposed in the electronic device. It is determined that the user is not located inside the , and in operation 403 , the same audio data may be output through each of the plurality of speakers to provide a mono sound to the user.
  • the processor determines the positions of the plurality of speakers disposed in the electronic device It is determined that the user is located in the preset area according to , and in operation 404 , at least some different audio data may be output through each of the plurality of speakers to provide stereo sound to the user.
  • FIG. 5 is a diagram illustrating another method of selectively outputting audio data based on a positional relationship between an electronic device and a user and a posture of the electronic device, according to an embodiment of the present invention.
  • the processor determines a difference between the reception time of the received voice and the preset first Thresholds can be compared.
  • the processor may determine that the user is not located in the preset area.
  • the processor when it is determined that the user is not located inside the preset area, in operation 503 , the processor outputs the same audio data through each of a plurality of speakers (eg, a plurality of speakers 202 ). Thus, a mono sound can be provided to the user.
  • a plurality of speakers eg, a plurality of speakers 202
  • the processor may compare an angle of the electronic device determined based on sensor information received from a sensor (eg, the sensor 203) with a preset second threshold value.
  • the processor may determine the posture of the electronic device based on the comparison result. For example, when the angle of the electronic device is smaller than the second threshold value, the processor may determine that the electronic device is disposed along the vertical axis. Also, when the angle of the electronic device is greater than or equal to the second threshold value, the processor may determine that the electronic device is arranged in a horizontal axis.
  • the processor determines a preset area according to positions of a plurality of speakers disposed in the electronic device. It is determined that the user is not located inside the , and in operation 503 , the same audio data may be output through each of the plurality of speakers to provide a mono sound to the user.
  • the processor determines the positions of the plurality of speakers disposed in the electronic device It is determined that the user is located in the preset area according to , and in operation 504 , stereo audio data to be output through each of the plurality of speakers may be configured. For example, the processor may configure audio data that is at least partially different from each other output through each of the plurality of speakers.
  • the processor may specify a positional relationship between the electronic device and the user based on an image captured by a camera (eg, the camera 204). For example, the processor may obtain an image obtained by photographing an object (eg, a user) through the camera, and determine the position of the object in the image. Also, the processor may specify a positional relationship between the electronic device and the user based on a difference in reception time of a voice received through each of the plurality of microphones and a position of an object in the image. In more detail, the processor may roughly determine a positional relationship between the electronic device and the user based on a difference in reception time of a voice received through each of the plurality of microphones in operation 501 .
  • the positional relationship between the electronic device and the user determined based on the difference in the reception time of the voice may include information on the distance and the direction between the electronic device and the user.
  • the processor checks the position value of the object corresponding to the user in the image captured by the user through the camera, and the electronic device and a direction between the user and the user may be specified in any one direction.
  • the processor may apply a filter to the stereo audio data based on the specified positional relationship between the electronic device and the user.
  • the processor filters the at least partly different audio data to prevent a crosstalk phenomenon in which the at least partly different audio data interferes with each other.
  • XTC filter can be applied.
  • the processor may provide stereo sound to a user located in the preset area by outputting audio data to which at least a portion to which the filter is applied is different through the plurality of speakers.
  • the processor transmits at least partially different audio data based on the determined positional relationship and the posture of the electronic device.
  • a stereo sound may be provided to the user by outputting the output through each of the plurality of speakers.
  • the processor may reconstruct the stereo sound based on the specified positional relationship between the electronic device and the user. For example, the processor may reconstruct audio data that is at least partially different from the audio data output through the plurality of speakers based on the specified positional relationship between the electronic device and the user.
  • FIG. 6 is a diagram illustrating another method of selectively outputting audio data based on a positional relationship between an electronic device and a user and a posture of the electronic device, according to an embodiment of the present invention.
  • the processor compares the reception time difference of the voice received through each of the plurality of microphones (eg, the plurality of microphones 201 ) with a preset first threshold value to the electronic device and a positional relationship between the user and the user may be determined.
  • the processor compares the sensor information received from the sensor (eg, the sensor 203 ) with the second threshold value in operation 602 when the difference in the reception time of the received voice is smaller than a preset first threshold value to the electronic device position can be judged.
  • the processor may determine that the user is located in a preset area.
  • the processor configures at least partly different audio data based on the determined positional relationship and the determined posture of the electronic device in order to provide stereo sound to the user.
  • the processor determines the reception time of the voice received through the plurality of microphones and the at least one By comparing each of the reception times of the voices received through the other microphones based on the cross-correlation, the difference in the reception times of the received voices can be confirmed.
  • the processor may perform trilateration based on a difference in reception time of the received voice to more accurately identify a positional relationship between the electronic device and the user.
  • a reception time of a voice signal received by each of the plurality of microphones eg, the first microphone 201a and the second microphone 201b
  • the at least one other microphone eg, :
  • T3 the reception time of the voice signal received through the third microphone (not shown)
  • T3 trilateration is performed based on the time difference between T1, T2, and T3 to determine the positional relationship between the electronic device and the user. can be specified.
  • the processor may output the stereo audio data configured in operation 604 through the plurality of speakers.
  • the processor may apply a filter to the stereo audio data based on the specified positional relationship between the electronic device and the user.
  • the processor filters the at least partly different audio data to prevent a crosstalk phenomenon in which the at least partly different audio data interferes with each other.
  • XTC filter can be applied.
  • the processor may provide stereo sound to a user located in the preset area by outputting audio data to which at least a portion of which the filter is applied is different through the plurality of speakers.
  • the processor may reconstruct the stereo sound based on the specified positional relationship between the electronic device and the user. For example, the processor may reconstruct audio data that is at least partially different from the audio data output through the plurality of speakers based on the specified positional relationship between the electronic device and the user.
  • FIG. 7 is a diagram illustrating a method of selectively outputting audio data based on a positional relationship between an electronic device and a user, according to an embodiment of the present invention.
  • the processor may receive the user's voice through each of the plurality of microphones (eg, the plurality of microphones 201).
  • the processor may obtain an image of an object (eg, a user) from a camera (eg, the camera 204).
  • an object eg, a user
  • a camera eg, the camera 204
  • the processor may determine a positional relationship between the electronic device and the user based on a difference in reception time of a voice received through each of the plurality of microphones and an image acquired through the camera. For example, the processor may determine a difference in reception time of the received voice by comparing the reception times of the voice signals received through each of the plurality of microphones based on the cross-correlation. Also, the processor may obtain a position value of an object corresponding to the user in the captured image. The processor may determine the positional relationship between the electronic device and the user based on a difference between the position value of the object corresponding to the user and the reception time of the received voice.
  • the processor may roughly determine a positional relationship between the electronic device and the user based on a difference in reception time of the voice received through each of the plurality of microphones in operation 701 .
  • the positional relationship between the electronic device and the user determined based on the difference in the reception time of the voice may include information on the distance and the direction between the electronic device and the user.
  • the processor checks the position value of the object corresponding to the user in the image captured by the user through the camera, and the electronic device and a direction between the user and the user may be specified in any one direction.
  • the processor may determine audio data to be output through each of the plurality of speakers based on the determined positional relationship. According to an embodiment, when the user is located inside a preset area according to the arrangement positions of the plurality of speakers based on the determined positional relationship, the processor may at least partially use different audio By outputting data, stereo sound can be provided to the user. According to an embodiment, when the user is not located inside the preset area, the processor may output the same audio data through each of the plurality of speakers to provide a mono sound to the user.
  • FIG. 8 is a diagram illustrating another method of selectively outputting audio data based on a positional relationship between an electronic device and a user, according to an embodiment of the present invention.
  • the plurality of microphones may include at least three or more microphones.
  • the processor eg, the processor 206 may receive the user's voice through each of the plurality of microphones (eg, the plurality of microphones 201).
  • the processor may determine a positional relationship between the electronic device and the user based on a difference in reception time of a voice received through each of the plurality of microphones. For example, the processor may determine a positional relationship between the electronic device and the user by trilaterating the reception time difference of the voice received through each of the plurality of microphones. According to an embodiment, the processor compares the time of the voice signal received through each of the plurality of microphones based on the cross-correlation to determine the difference in the reception time of the received voice.
  • the processor may determine and output audio data output through a plurality of speakers (eg, a plurality of speakers 202) based on the determined positional relationship. For example, when the user is located in a predetermined area according to the arrangement position of the plurality of speakers, at least a part of different audio data may be output through each of the plurality of speakers to provide stereo sound to the user. As another example, when the user is not located in the preset area, the processor may output the same audio data through each of the plurality of speakers to provide a mono sound to the user.
  • a plurality of speakers eg, a plurality of speakers 202
  • a method of outputting audio data of an electronic device includes a plurality of microphones (eg, the first microphone 201a) included in the electronic device and A positional relationship between the electronic device and the user based on an operation of receiving a user's voice through each of the second microphones 201b) and a difference in reception time of the user's voice received through each of the plurality of microphones an operation of determining a posture of the electronic device based on sensor information measured through a sensor (eg, sensor 203) included in the electronic device, an operation of determining the posture of the electronic device, and the determined positional relationship and the determined determining the audio data to be output through the plurality of speakers (eg, the first speaker 202a and the second speaker 202b) included in the electronic device based on the posture of the electronic device have.
  • a sensor eg, sensor 203
  • the determining of the audio data may include determining whether the user is located within a preset area based on the determined positional relationship and the determined posture of the electronic device; outputting the same audio data through each of the plurality of speakers when it is determined that the user is not located within the preset area; and when it is determined that the user is located within the preset area, at least through each of the plurality of speakers Some may include an operation of outputting other audio data.
  • the method of outputting the audio data may further include setting the preset region based on a position where the plurality of speakers are arranged in the electronic device.
  • the determining of the positional relationship between the electronic device and the user may include using an image captured by a camera (eg, camera 204 ) included in the electronic device and each of the plurality of microphones. and determining a positional relationship between the electronic device and the user based on a difference in reception time of the received user's voice.
  • a camera eg, camera 204
  • the determining of the positional relationship between the electronic device and the user may include a reception time of the user's voice received through each of the plurality of microphones and at least one other microphone included in the electronic device. and determining a positional relationship between the electronic device and the user based on the reception time of the user's voice received through the .
  • the method of outputting the audio data may further include preventing a crosstalk phenomenon occurring between the audio data output through each of the plurality of speakers through a filter included in the electronic device.
  • the determining of the audio data may include, when a value representing a difference in reception time of the user's voice is greater than or equal to a preset first threshold value, audio outputted through each of the plurality of speakers Determining data as the same audio data, and when a value indicating a difference in reception time of the user's voice is less than the first threshold value, at least partially different audio data output through each of the plurality of speakers It may include an operation to determine with data.
  • the determining of the posture of the electronic device includes calculating the angle of the electronic device based on the sensor information, and the determining of the audio data includes the calculated electronic device determining that the audio data output through each of the plurality of speakers is the same audio data when the angle of is greater than or equal to a preset second threshold value, and the calculated angle of the electronic device is the second threshold value
  • the method may include determining, at least in part, audio data output through each of the plurality of speakers as different audio data.
  • the method of outputting the audio data includes an operation of acquiring an image photographed through a camera of the electronic device, an operation of acquiring a position value of an object corresponding to the user from the image, and the determined
  • the method may further include reconstructing the determined audio data based on the positional relationship, the determined posture of the electronic device, and the position value of the object.
  • FIG. 9 is a view for explaining a preset area according to an arrangement position of a plurality of speakers (eg, a plurality of speakers 202) according to an embodiment of the present invention.
  • the processor may set a preset area based on a location where the plurality of speakers are disposed in the electronic device (eg, the electronic device 200 ).
  • the preset area is an area set according to the positions of the plurality of speakers disposed on the electronic device, and may include a sweet spot that provides stereo sound to the user and provides the best sound quality.
  • the first area and the third area are preset areas according to the positions of the first speaker 901 located above the electronic device and the second speaker 902 located below the electronic device.
  • the processor may provide stereo sound to the user by outputting at least partially different audio data through a plurality of speakers.
  • the processor when the user is located in the second area and the fourth area, the processor outputs the same audio data through the first speaker 901 located above and the second speaker 902 located below the user. can provide mono sound.
  • the processor determines the positions of the electronic device and the user. Based on the relationship, at least two or more of the plurality of microphones may be selected to provide stereo sound to the user. For example, when the user is located in the first area (or the third area), the processor is at least capable of providing stereo sound to the user located in the first area (or the third area) among the plurality of speakers. More than one speaker can be selected. For example, the processor outputs stereo sound to the first region (or the third region) by outputting at least partially different audio data through the first and second speakers 901 and 902 disposed above and below the electronic device.
  • the processor may provide at least stereo sound to the user located in the second area (or fourth area) among the plurality of speakers. More than one speaker can be selected.
  • the processor outputs stereo sound to the second region (or the second region) by outputting at least partially different audio data through a third speaker (not shown) and a fourth speaker (not shown) disposed on both sides of the electronic device. It can be provided to users located in area 4).
  • the electronic device may have various types of devices.
  • the electronic device may include, for example, a portable communication device (eg, a smart phone), a computer device, a portable multimedia device, a portable medical device, a camera, a wearable device, or a home appliance device.
  • a portable communication device eg, a smart phone
  • a computer device e.g., a smart phone
  • a portable multimedia device e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a wearable device e.g., a smart bracelet
  • a home appliance device e.g., a home appliance
  • first, second, or “first”, “second” may simply be used to distinguish the element from other elements in question, and may refer to elements in other aspects (e.g., importance or order) is not limited. It is said that one (eg, first) component is “coupled” or “connected” to another (eg, second) component, with or without the terms “functionally” or “communicatively”. When referenced, it means that one component can be connected to the other component directly (eg by wire), wirelessly, or through a third component.
  • module may include a unit implemented in hardware, software, or firmware, and may be used interchangeably with terms such as, for example, logic, logic block, component, or circuit.
  • a module may be an integrally formed part or a minimum unit or a part of the part that performs one or more functions.
  • the module may be implemented in the form of an application-specific integrated circuit (ASIC).
  • ASIC application-specific integrated circuit
  • Various embodiments of the present document include one or more stored in a storage medium (eg, the internal memory 136 or the external memory 138) readable by a machine (eg, the electronic device 101). It may be implemented as software (eg, program 140) including instructions.
  • the processor eg, the processor 120
  • the device may call at least one of one or more instructions stored from a storage medium and execute it. This makes it possible for the device to be operated to perform at least one function according to the at least one command called.
  • the one or more instructions may include code generated by a compiler or code executable by an interpreter.
  • the device-readable storage medium may be provided in the form of a non-transitory storage medium.
  • 'non-transitory' only means that the storage medium is a tangible device and does not contain a signal (eg, electromagnetic wave), and this term refers to the case where data is semi-permanently stored in the storage medium and It does not distinguish between temporary storage cases.
  • a signal eg, electromagnetic wave
  • the method according to various embodiments disclosed in this document may be provided as included in a computer program product.
  • Computer program products may be traded between sellers and buyers as commodities.
  • the computer program product is distributed in the form of a device-readable storage medium (eg compact disc read only memory (CD-ROM)), or via an application store (eg Play Store TM ) or on two user devices ( It can be distributed (eg downloaded or uploaded) directly, online between smartphones (eg: smartphones).
  • a part of the computer program product may be temporarily stored or temporarily created in a machine-readable storage medium such as a memory of a server of a manufacturer, a server of an application store, or a relay server.
  • each component eg, a module or a program of the above-described components may include a singular or a plurality of entities.
  • one or more components or operations among the above-described corresponding components may be omitted, or one or more other components or operations may be added.
  • a plurality of components eg, a module or a program
  • the integrated component may perform one or more functions of each component of the plurality of components identically or similarly to those performed by the corresponding component among the plurality of components prior to the integration. .
  • operations performed by a module, program, or other component are executed sequentially, in parallel, repeatedly, or heuristically, or one or more of the operations are executed in a different order, or omitted. or one or more other operations may be added.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • Stereophonic System (AREA)

Abstract

Disclosed is an electronic device comprising: multiple microphones; multiple speakers; a sensor; a memory; and a processor operatively connected to the multiple microphones, the multiple speakers, the sensor, and the memory, wherein the processor is configured to: receive a voice of a user through each of the multiple microphones; determine a position relation between the electronic device and the user on the basis of a difference in a reception time at which the voice of the user is received through each of the multiple microphones; determine the posture of the electronic device on the basis of sensor information measured through the sensor; and determine audio data output through the multiple speakers included in the electronic device on the basis of the determined position relation and the determined posture of the electronic device. Various other embodiments inferred from the present document are also possible.

Description

오디오 데이터의 출력 방법 및 이를 지원하는 전자 장치Audio data output method and electronic device supporting the same
본 발명의 다양한 실시예들은, 오디오 데이터의 출력 방법 및 이를 지원하는 전자 장치에 관한 것이다.Various embodiments of the present disclosure relate to a method of outputting audio data and an electronic device supporting the same.
스마트 폰과 같은 전자 장치는 다양한 기능을 제공할 수 있다. 일 예로, 전자 장치는 마이크를 통해 사용자 음성을 수신할 수 있으며, 스피커를 통해 음성 데이터를 출력하는 기능을 제공할 수 있다. 예를 들어, 전자 장치는 통화 시 마이크를 통해 수신된 사용자의 음성을 외부 전자 장치로 전송할 수 있고, 상대방의 음성을 스피커를 통해 출력할 수 있다.An electronic device such as a smart phone may provide various functions. For example, the electronic device may receive a user's voice through a microphone and may provide a function of outputting voice data through a speaker. For example, during a call, the electronic device may transmit the user's voice received through the microphone to the external electronic device, and may output the other's voice through the speaker.
기존 전자 장치는 통화 시, 듀얼 모노 사운드(dual mono sound) 송수화만 지원하고 있다. 예컨대, 전자 장치에 스테레오 스피커가 탑재되어도, 전자 장치는 송수화 시 스테레오 사운드(stereo sound) 음성 데이터를 출력하지 않고 듀얼 모노 음성 데이터를 출력하였다. 최근에 출시되는 대부분의 전자 장치는 스테레오 스피커가 탑재되어 있어, 통화 시 스테레오 오디오 데이터를 출력하는 기능이 요구되고 있다.Existing electronic devices support only dual mono sound transmission and reception during a call. For example, even if the electronic device is equipped with a stereo speaker, the electronic device does not output stereo sound audio data during communication, but outputs dual mono audio data. Since most of the recently released electronic devices are equipped with stereo speakers, a function of outputting stereo audio data during a call is required.
본 발명의 다양한 실시예들은, 전자 장치와 사용자 간의 위치 관계에 기반하여 오디오 데이터를 선택하여 출력하는 오디오 데이터 출력 방법 및 이를 지원하는 전자 장치를 제공할 수 있다.Various embodiments of the present disclosure may provide an audio data output method for selecting and outputting audio data based on a positional relationship between an electronic device and a user, and an electronic device supporting the same.
본 발명의 다양한 실시예에 따른 전자 장치는, 복수 개의 마이크들, 복수 개의 스피커들, 센서, 메모리, 및 상기 복수 개의 마이크들, 상기 복수 개의 스피커들, 상기 센서 및 상기 메모리와 작동적으로 연결된 프로세서를 포함하고, 상기 프로세서는, 상기 복수 개의 마이크들 각각을 통해, 사용자의 음성을 수신하고, 상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 차이를 기반으로, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하고, 상기 센서를 통해 측정된 센서 정보에 기반하여, 상기 전자 장치의 자세를 판단하고, 상기 판단된 위치 관계 및 상기 판단된 전자 장치의 자세에 기반하여, 상기 전자 장치에 포함된 상기 복수 개의 스피커들을 통해 출력하는 오디오 데이터를 결정하도록 설정될 수 있다.An electronic device according to various embodiments of the present disclosure includes a plurality of microphones, a plurality of speakers, a sensor, a memory, and a processor operatively connected to the plurality of microphones, the plurality of speakers, the sensor, and the memory. including, wherein the processor receives the user's voice through each of the plurality of microphones, and based on a difference in reception time of the user's voice received through each of the plurality of microphones, the electronic device and determine the positional relationship between the users, determine the posture of the electronic device based on sensor information measured through the sensor, and determine the posture of the electronic device based on the determined positional relationship and the determined posture of the electronic device, the electronic device may be set to determine audio data output through the plurality of speakers included in the .
또한, 본 발명의 다양한 실시예에 따른 전자 장치의 오디오 데이터의 출력 방법은, 상기 전자 장치에 포함된 복수 개의 마이크들 각각을 통해, 사용자의 음성을 수신하는 동작, 상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 차이를 기반으로, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하는 동작, 상기 전자 장치에 포함된 센서를 통해 측정된 센서 정보에 기반하여, 상기 전자 장치의 자세를 판단하는 동작, 및 상기 판단된 위치 관계 및 상기 판단된 전자 장치의 자세에 기반하여, 상기 전자 장치에 포함된 상기 복수 개의 스피커들을 통해 출력하는 오디오 데이터를 결정하는 동작을 포함할 수 있다.In addition, the method for outputting audio data of an electronic device according to various embodiments of the present disclosure includes an operation of receiving a user's voice through each of a plurality of microphones included in the electronic device, and each of the plurality of microphones An operation of determining a positional relationship between the electronic device and the user based on a difference in the reception time of the received user's voice, and the posture of the electronic device based on sensor information measured through a sensor included in the electronic device and determining the audio data to be output through the plurality of speakers included in the electronic device based on the determined positional relationship and the determined posture of the electronic device.
또한, 본 발명의 다양한 실시예에 따른 전자 장치는, 복수 개의 마이크들, 복수 개의 스피커들, 카메라, 메모리, 및 상기 복수 개의 마이크들, 상기 복수 개의 스피커들, 상기 카메라 및 상기 메모리와 작동적으로 연결된 프로세서를 포함하고, 상기 프로세서는, 상기 복수 개의 마이크들 각각을 통해 사용자의 음성을 수신하고, 상기 카메라를 통해 촬영된 영상을 획득하고, 상기 영상에서 상기 사용자에 대응하는 오브젝트의 위치 값을 획득하고, 상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 차이 및 상기 오브젝트의 위치 값을 기반으로, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하고, 상기 판단된 위치 관계에 기반하여, 상기 복수 개의 스피커들을 통해 출력하는 상기 오디오 데이터를 결정하도록 설정될 수 있다.In addition, the electronic device according to various embodiments of the present disclosure is operatively configured with a plurality of microphones, a plurality of speakers, a camera, a memory, and the plurality of microphones, the plurality of speakers, the camera, and the memory. A connected processor, wherein the processor receives a user's voice through each of the plurality of microphones, obtains an image captured by the camera, and obtains a position value of an object corresponding to the user from the image and determining a positional relationship between the electronic device and the user based on a difference in reception time of the user's voice received through each of the plurality of microphones and a position value of the object, and based on the determined positional relationship Thus, it may be set to determine the audio data output through the plurality of speakers.
본 발명의 다양한 실시예들에 따르면, 전자 장치와 사용자 간의 위치 관계에 기반하여 선택적으로 오디오 데이터를 출력함으로써, 사용자에게 고품질의 오디오 사운드를 제공할 수 있다.According to various embodiments of the present disclosure, high-quality audio sound may be provided to the user by selectively outputting audio data based on a positional relationship between the electronic device and the user.
이 외에, 본 문서를 통해 직접적 또는 간접적으로 파악되는 다양한 효과들이 제공될 수 있다.In addition, various effects directly or indirectly identified through this document may be provided.
도 1은 본 발명의 다양한 실시예들에 따른 네트워크 환경 내의 전자 장치의 블록도이다.1 is a block diagram of an electronic device in a network environment according to various embodiments of the present disclosure;
도 2는 본 발명의 일 실시예에 따른 오디오 데이터의 출력과 관련된 전자 장치의 블록도이다.2 is a block diagram of an electronic device related to output of audio data according to an embodiment of the present invention.
도 3은 본 발명의 일 실시예에 따른, 오디오 데이터의 출력 방법에 관한 도면이다.3 is a diagram illustrating a method of outputting audio data according to an embodiment of the present invention.
도 4는 본 발명의 일 실시예에 따른, 전자 장치와 사용자 간의 위치 관계 및 전자 장치의 자세에 기반하여 오디오 데이터를 선택적으로 출력하는 방법에 관한 도면이다.4 is a diagram illustrating a method of selectively outputting audio data based on a positional relationship between an electronic device and a user and a posture of the electronic device, according to an embodiment of the present invention.
도 5는 본 발명의 일 실시예에 따른, 전자 장치와 사용자 간의 위치 관계 및 전자 장치의 자세에 기반하여 오디오 데이터를 선택적으로 출력하는 다른 방법에 관한 도면이다.5 is a diagram illustrating another method of selectively outputting audio data based on a positional relationship between an electronic device and a user and a posture of the electronic device, according to an embodiment of the present invention.
도 6은 본 발명의 일 실시예에 따른, 전자 장치와 사용자 간의 위치 관계 및 전자 장치의 자세에 기반하여 오디오 데이터를 선택적으로 출력하는 또 다른 방법에 관한 도면이다.6 is a diagram illustrating another method of selectively outputting audio data based on a positional relationship between an electronic device and a user and a posture of the electronic device, according to an embodiment of the present invention.
도 7은 본 발명의 일 실시예에 따른, 전자 장치와 사용자 간의 위치 관계에 기반하여 오디오 데이터를 선택적으로 출력하는 방법에 관한 도면이다.7 is a diagram illustrating a method of selectively outputting audio data based on a positional relationship between an electronic device and a user, according to an embodiment of the present invention.
도 8은 본 발명의 일 실시예에 따른, 전자 장치와 사용자 간의 위치 관계에 기반하여 오디오 데이터를 선택적으로 출력하는 다른 방법에 관한 도면이다.8 is a diagram illustrating another method of selectively outputting audio data based on a positional relationship between an electronic device and a user, according to an embodiment of the present invention.
도 9는 본 발명의 일 실시예에 따른, 복수 개의 스피커들의 배치 위치에 따른 기설정된 영역을 설명하기 위한 도면이다.9 is a view for explaining a preset area according to an arrangement position of a plurality of speakers, according to an embodiment of the present invention.
이하, 첨부된 도면을 참조하여 본 발명의 다양한 실시예들이 설명된다. 설명의 편의를 위하여 도면에 도시된 구성요소들은 그 크기가 과장 또는 축소될 수 있으며, 본 발명이 반드시 도시된 바에 의해 한정되는 것은 아니다.Hereinafter, various embodiments of the present invention will be described with reference to the accompanying drawings. For convenience of description, the sizes of the components shown in the drawings may be exaggerated or reduced, and the present invention is not necessarily limited to the illustrated ones.
도 1은 다양한 실시예들에 따른, 네트워크 환경(100) 내의 전자 장치(101)의 블록도이다.1 is a block diagram of an electronic device 101 in a network environment 100 according to various embodiments.
도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108)와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 장치(150), 음향 출력 장치(155), 표시 장치(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 표시 장치(160) 또는 카메라 모듈(180))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들은 하나의 통합된 회로로 구현될 수 있다. 예를 들면, 센서 모듈(176)(예: 지문 센서, 홍채 센서, 또는 조도 센서)은 표시 장치(160)(예: 디스플레이)에 임베디드된 채 구현될 수 있다.Referring to FIG. 1 , in a network environment 100 , the electronic device 101 communicates with the electronic device 102 through a first network 198 (eg, a short-range wireless communication network) or a second network 199 . It may communicate with the electronic device 104 or the server 108 through (eg, a long-distance wireless communication network). According to an embodiment, the electronic device 101 may communicate with the electronic device 104 through the server 108 . According to an embodiment, the electronic device 101 includes a processor 120 , a memory 130 , an input device 150 , a sound output device 155 , a display device 160 , an audio module 170 , and a sensor module ( 176 , interface 177 , haptic module 179 , camera module 180 , power management module 188 , battery 189 , communication module 190 , subscriber identification module 196 , or antenna module 197 . ) may be included. In some embodiments, at least one of these components (eg, the display device 160 or the camera module 180 ) may be omitted or one or more other components may be added to the electronic device 101 . In some embodiments, some of these components may be implemented as one integrated circuit. For example, the sensor module 176 (eg, a fingerprint sensor, an iris sensor, or an illuminance sensor) may be implemented while being embedded in the display device 160 (eg, a display).
프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일 실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 로드하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(134)에 저장할 수 있다. 일 실시예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 어플리케이션 프로세서), 및 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 추가적으로 또는 대체적으로, 보조 프로세서(123)는 메인 프로세서(121)보다 저전력을 사용하거나, 또는 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.The processor 120, for example, executes software (eg, the program 140) to execute at least one other component (eg, a hardware or software component) of the electronic device 101 connected to the processor 120 . It can control and perform various data processing or operations. According to one embodiment, as at least part of data processing or operation, the processor 120 converts commands or data received from other components (eg, the sensor module 176 or the communication module 190 ) to the volatile memory 132 . may be loaded into the volatile memory 132 , process commands or data stored in the volatile memory 132 , and store the resulting data in the non-volatile memory 134 . According to an embodiment, the processor 120 includes a main processor 121 (eg, a central processing unit or an application processor), and a secondary processor 123 (eg, a graphic processing unit, an image signal processor) that can operate independently or together with the main processor , a sensor hub processor, or a communication processor). Additionally or alternatively, the auxiliary processor 123 may be configured to use less power than the main processor 121 or to be specialized for a designated function. The auxiliary processor 123 may be implemented separately from or as a part of the main processor 121 .
보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 표시 장치(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일 실시예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다.The auxiliary processor 123 may be, for example, on behalf of the main processor 121 while the main processor 121 is in an inactive (eg, sleep) state, or when the main processor 121 is active (eg, executing an application). ), together with the main processor 121, at least one of the components of the electronic device 101 (eg, the display device 160, the sensor module 176, or the communication module 190) It is possible to control at least some of the related functions or states. According to an embodiment, the coprocessor 123 (eg, an image signal processor or a communication processor) may be implemented as part of another functionally related component (eg, the camera module 180 or the communication module 190). have.
메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서 모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비휘발성 메모리(134)를 포함할 수 있다.The memory 130 may store various data used by at least one component (eg, the processor 120 or the sensor module 176 ) of the electronic device 101 . The data may include, for example, input data or output data for software (eg, the program 140 ) and instructions related thereto. The memory 130 may include a volatile memory 132 or a non-volatile memory 134 .
프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다.The program 140 may be stored as software in the memory 130 , and may include, for example, an operating system 142 , middleware 144 , or an application 146 .
입력 장치(150)는, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 장치(150)는, 예를 들면, 마이크, 마우스, 키보드, 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.The input device 150 may receive a command or data to be used by a component (eg, the processor 120 ) of the electronic device 101 from the outside (eg, a user) of the electronic device 101 . The input device 150 may include, for example, a microphone, a mouse, a keyboard, or a digital pen (eg, a stylus pen).
음향 출력 장치(155)는 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 장치(155)는, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있고, 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일 실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.The sound output device 155 may output a sound signal to the outside of the electronic device 101 . The sound output device 155 may include, for example, a speaker or a receiver. The speaker can be used for general purposes such as multimedia playback or recording playback, and the receiver can be used to receive incoming calls. According to one embodiment, the receiver may be implemented separately from or as part of the speaker.
표시 장치(160)는 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 표시 장치(160)는, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일 실시예에 따르면, 표시 장치(160)는 터치를 감지하도록 설정된 터치 회로(touch circuitry), 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 센서 회로(예: 압력 센서)를 포함할 수 있다.The display device 160 may visually provide information to the outside (eg, a user) of the electronic device 101 . The display device 160 may include, for example, a display, a hologram device, or a projector and a control circuit for controlling the corresponding device. According to an embodiment, the display device 160 may include a touch circuitry configured to sense a touch or a sensor circuit (eg, a pressure sensor) configured to measure the intensity of a force generated by the touch. have.
오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일 실시예에 따르면, 오디오 모듈(170)은, 입력 장치(150)를 통해 소리를 획득하거나, 음향 출력 장치(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.The audio module 170 may convert a sound into an electric signal or, conversely, convert an electric signal into a sound. According to an embodiment, the audio module 170 acquires a sound through the input device 150 , or an external electronic device (eg, a sound output device 155 ) connected directly or wirelessly with the electronic device 101 . The electronic device 102) (eg, a speaker or headphones) may output a sound.
센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일 실시예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.The sensor module 176 detects an operating state (eg, power or temperature) of the electronic device 101 or an external environmental state (eg, user state), and generates an electrical signal or data value corresponding to the sensed state. can do. According to an embodiment, the sensor module 176 may include, for example, a gesture sensor, a gyro sensor, a barometric sensor, a magnetic sensor, an acceleration sensor, a grip sensor, a proximity sensor, a color sensor, an IR (infrared) sensor, a biometric sensor, It may include a temperature sensor, a humidity sensor, or an illuminance sensor.
인터페이스(177)는 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일 실시예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.The interface 177 may support one or more specified protocols that may be used by the electronic device 101 to directly or wirelessly connect with an external electronic device (eg, the electronic device 102 ). According to an embodiment, the interface 177 may include, for example, a high definition multimedia interface (HDMI), a universal serial bus (USB) interface, an SD card interface, or an audio interface.
연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일 실시예에 따르면, 연결 단자(178)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.The connection terminal 178 may include a connector through which the electronic device 101 can be physically connected to an external electronic device (eg, the electronic device 102 ). According to an embodiment, the connection terminal 178 may include, for example, an HDMI connector, a USB connector, an SD card connector, or an audio connector (eg, a headphone connector).
햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일 실시예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.The haptic module 179 may convert an electrical signal into a mechanical stimulus (eg, vibration or movement) or an electrical stimulus that the user can perceive through tactile or kinesthetic sense. According to an embodiment, the haptic module 179 may include, for example, a motor, a piezoelectric element, or an electrical stimulation device.
카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일 실시예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.The camera module 180 may capture still images and moving images. According to an embodiment, the camera module 180 may include one or more lenses, image sensors, image signal processors, or flashes.
전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일 실시예에 따르면, 전력 관리 모듈(188)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.The power management module 188 may manage power supplied to the electronic device 101 . According to an embodiment, the power management module 188 may be implemented as, for example, at least a part of a power management integrated circuit (PMIC).
배터리(189)는 전자 장치(101)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일 실시예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.The battery 189 may supply power to at least one component of the electronic device 101 . According to one embodiment, the battery 189 may include, for example, a non-rechargeable primary cell, a rechargeable secondary cell, or a fuel cell.
통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108))간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일 실시예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제1 네트워크(198)(예: 블루투스, WiFi direct 또는 IrDA(infrared data association) 같은 근거리 통신 네트워크) 또는 제2 네트워크(199)(예: 셀룰러 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부 전자 장치와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제1 네트워크(198) 또는 제2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 및 인증할 수 있다.The communication module 190 is a direct (eg, wired) communication channel or a wireless communication channel between the electronic device 101 and an external electronic device (eg, the electronic device 102, the electronic device 104, or the server 108). It can support establishment and communication through the established communication channel. The communication module 190 may include one or more communication processors that operate independently of the processor 120 (eg, an application processor) and support direct (eg, wired) communication or wireless communication. According to one embodiment, the communication module 190 is a wireless communication module 192 (eg, a cellular communication module, a short-range wireless communication module, or a global navigation satellite system (GNSS) communication module) or a wired communication module 194 (eg, : It may include a local area network (LAN) communication module, or a power line communication module). Among these communication modules, a corresponding communication module may be a first network 198 (eg, a short-range communication network such as Bluetooth, WiFi direct, or infrared data association (IrDA)) or a second network 199 (eg, a cellular network, the Internet, or It may communicate with an external electronic device via a computer network (eg, a telecommunication network such as a LAN or WAN). These various types of communication modules may be integrated into one component (eg, a single chip) or may be implemented as a plurality of components (eg, multiple chips) separate from each other. The wireless communication module 192 uses subscriber information (eg, International Mobile Subscriber Identifier (IMSI)) stored in the subscriber identification module 196 within a communication network such as the first network 198 or the second network 199 . The electronic device 101 may be identified and authenticated.
안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일 실시예에 따르면, 안테나 모듈(197)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 하나의 안테나를 포함할 수 있다. 일 실시예에 따르면, 안테나 모듈(197)은 복수의 안테나들을 포함할 수 있다. 이런 경우, 제1 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC)이 추가로 안테나 모듈(197)의 일부로 형성될 수 있다.The antenna module 197 may transmit or receive a signal or power to the outside (eg, an external electronic device). According to an embodiment, the antenna module 197 may include one antenna including a conductor formed on a substrate (eg, a PCB) or a radiator formed of a conductive pattern. According to an embodiment, the antenna module 197 may include a plurality of antennas. In this case, it may be selected from the first plurality of antennas. A signal or power may be transmitted or received between the communication module 190 and an external electronic device through the selected at least one antenna. According to some embodiments, other components (eg, RFIC) other than the radiator may be additionally formed as a part of the antenna module 197 .
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.At least some of the components are connected to each other through a communication method between peripheral devices (eg, a bus, general purpose input and output (GPIO), serial peripheral interface (SPI), or mobile industry processor interface (MIPI)) and a signal ( e.g. commands or data) can be exchanged with each other.
일 실시예에 따르면, 명령 또는 데이터는 제2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104)간에 송신 또는 수신될 수 있다. 전자 장치(102, 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 일 실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부 전자 장치들(102, 104, 또는 108) 중 하나 이상의 외부 전자 장치들에서 실행될 수 있다. According to an embodiment, the command or data may be transmitted or received between the electronic device 101 and the external electronic device 104 through the server 108 connected to the second network 199 . Each of the electronic devices 102 and 104 may be the same or a different type of the electronic device 101 . According to an embodiment, all or a part of operations executed in the electronic device 101 may be executed in one or more of the external electronic devices 102 , 104 , or 108 .
예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다.For example, when the electronic device 101 needs to perform a function or service automatically or in response to a request from a user or other device, the electronic device 101 may perform the function or service itself instead of executing the function or service itself. Alternatively or additionally, one or more external electronic devices may be requested to perform at least a part of the function or the service. The one or more external electronic devices that have received the request may execute at least a part of the requested function or service, or an additional function or service related to the request, and transmit a result of the execution to the electronic device 101 . The electronic device 101 may process the result as it is or additionally and provide it as at least a part of a response to the request. For this purpose, for example, cloud computing, distributed computing, or client-server computing technology may be used.
도 2는 본 발명의 일 실시예에 따른 오디오 데이터의 출력과 관련된 전자 장치의 블록도이다.2 is a block diagram of an electronic device related to output of audio data according to an embodiment of the present invention.
본 발명의 다양한 실시예에 따른 전자 장치(200)는 전자 장치(200)와 사용자 간의 위치 관계에 기반하여 복수 개의 스피커들(202)을 통해 출력되는 오디오 데이터를 스테레오 사운드(stereo sound) 또는 모노 사운드(mono sound)로 제공할 수 있다. 예컨대, 전자 장치(200)는 사용자가 핸즈프리(hands-free) 상황에서 통화 중 사용자에게 보다 좋은 음질의 통화 환경을 제공하기 위해 스테레오 사운드 또는 모노 사운드를 선택적으로 제공할 수 있다. The electronic device 200 according to various embodiments of the present disclosure converts audio data output through the plurality of speakers 202 to stereo sound or mono sound based on the positional relationship between the electronic device 200 and the user. (mono sound) can be provided. For example, the electronic device 200 may selectively provide stereo sound or mono sound in order to provide a better sound quality call environment to the user during a call in a hands-free situation.
일 실시예에 따르면, 전자 장치(200)는 전자 장치(200)와 사용자 간의 위치 관계를 판단하여 사용자가 기설정된 영역 내에 위치하면 스테레오 사운드를 제공하고, 사용자가 기설정된 영역 외부에 위치하면 모노 사운드를 제공할 수 있다. 여기서, 상기 기설정된 영역은 전자 장치(200) 상에 배치되는 복수 개의 스피커들(202)의 위치에 따라 설정되는 영역으로, 사용자에게 스테레오 사운드를 제공하여 최상의 음질을 제공하는 스위트 스팟(sweet spot)을 포함할 수 있다.According to an embodiment, the electronic device 200 determines a positional relationship between the electronic device 200 and the user to provide stereo sound when the user is located within a preset area, and provides mono sound when the user is located outside the preset area. can provide Here, the preset area is an area set according to the positions of the plurality of speakers 202 disposed on the electronic device 200, and is a sweet spot that provides stereo sound to the user and provides the best sound quality. may include.
상술한 기능을 제공하기 위한 전자 장치(200)는 도 2를 참조하여, 복수 개의 마이크들(201), 복수 개의 스피커들(202), 센서(203), 카메라(204), 메모리(205) 및 프로세서(206)를 포함할 수 있다. 그러나, 전자 장치(200)의 구성이 이에 한정되는 것은 아니다. 다양한 실시예에 따르면, 전자 장치(200)는 상술한 구성요소들 중 적어도 하나의 구성요소를 생략할 수 있으며, 적어도 하나의 다른 구성요소를 더 포함할 수 있다.Referring to FIG. 2 , the electronic device 200 for providing the above-described function includes a plurality of microphones 201 , a plurality of speakers 202 , a sensor 203 , a camera 204 , a memory 205 and It may include a processor 206 . However, the configuration of the electronic device 200 is not limited thereto. According to various embodiments, the electronic device 200 may omit at least one component among the above-described components, and may further include at least one other component.
상기 복수 개의 마이크들(201)은 사용자의 음성을 수신할 수 있다. 또한, 상기 복수 개의 마이크들(201)은 수신한 음성을 프로세서(206)에 제공할 수 있다. 도 2에서, 상기 복수 개의 마이크들(201)이 제 1 마이크(201a) 및 제 2 마이크(201b)를 포함하고 있는 것으로 설명하였지만, 전자 장치(200)에 포함되는 마이크의 개수가 이에 한정되는 것은 아니다. 일 실시예에 따르면, 전자 장치(200)는 적어도 하나의 다른 마이크를 더 포함할 수 있다.The plurality of microphones 201 may receive a user's voice. Also, the plurality of microphones 201 may provide the received voice to the processor 206 . In FIG. 2 , it has been described that the plurality of microphones 201 include a first microphone 201a and a second microphone 201b, but the number of microphones included in the electronic device 200 is limited thereto. no. According to an embodiment, the electronic device 200 may further include at least one other microphone.
상기 복수 개의 스피커들(202)은 상기 프로세서(206)로부터 전달받은 오디오 데이터를 출력할 수 있다. 예컨대, 상기 복수 개의 스피커들(202)은 상기 프로세서(206)에 의해 선택된 오디오 데이터를 출력하여 사용자에게 사운드를 제공할 수 있다. 도 2에서는, 상기 복수 개의 스피커들(202)이 제 1 스피커(202a) 및 제 2 스피커(202b)를 포함하고 있는 것으로 설명하였지만, 전자 장치(200)에 포함되는 스피커의 개수가 이에 한정되는 것은 아니다.The plurality of speakers 202 may output audio data received from the processor 206 . For example, the plurality of speakers 202 may output audio data selected by the processor 206 to provide sound to the user. In FIG. 2 , it has been described that the plurality of speakers 202 include the first speaker 202a and the second speaker 202b, but the number of speakers included in the electronic device 200 is limited thereto. no.
상기 센서(203)는 전자 장치(200)의 내부에 배치되어 전자 장치(200)의 작동 상태 또는 외부의 환경 상태를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일 실시예에 따르면, 상기 센서(203)는 전자 장치(200)의 자세와 관련된 센서 정보를 획득할 수 있다. 예컨대, 상기 센서(203)는 전자 장치(200)의 자세가 변경될 때마다, 전자 장치(200)의 변경 각도를 측정하고, 상기 측정된 변경 각도를 상기 프로세서(206)에 센서 정보로 제공할 수 있다. The sensor 203 may be disposed inside the electronic device 200 to detect an operating state of the electronic device 200 or an external environmental state, and may generate an electrical signal or data value corresponding to the sensed state. According to an embodiment, the sensor 203 may acquire sensor information related to the posture of the electronic device 200 . For example, whenever the posture of the electronic device 200 is changed, the sensor 203 measures the change angle of the electronic device 200 and provides the measured change angle to the processor 206 as sensor information. can
일 실시예에 따르면, 상기 센서(203)는 전자 장치(200)에 배치된 상기 복수 개의 스피커(202)들을 지나는 가상의 선을 기준으로 전자 장치(200)의 변경 각도를 측정할 수 있고, 측정된 전자 장치(200)의 변경 각도를 상기 프로세서(206)에 센서 정보로 제공할 수 있다. 상기 센서(203)는 예를 들어, 자이로 센서 및 가속도 센서 중 적어도 하나를 포함할 수 있다. 그러나, 상기 센서(203)의 종류가 이에 한정되는 것은 아니다.According to an embodiment, the sensor 203 may measure a change angle of the electronic device 200 based on an imaginary line passing through the plurality of speakers 202 disposed in the electronic device 200 , and measure The changed angle of the electronic device 200 may be provided to the processor 206 as sensor information. The sensor 203 may include, for example, at least one of a gyro sensor and an acceleration sensor. However, the type of the sensor 203 is not limited thereto.
상기 카메라(204)는 오브젝트(예: 사용자)를 촬영하여 이미지 데이터를 획득할 수 있다. 이미지 데이터는 정지 영상 데이터 및 동영상 데이터 중 적어도 하나를 포함할 수 있다. The camera 204 may acquire image data by photographing an object (eg, a user). The image data may include at least one of still image data and moving image data.
상기 메모리(205)는 전자 장치(200)의 적어도 하나의 구성요소에 의해 사용되는 다양한 데이터를 저장할 수 있다. 예를 들어, 상기 메모리(205)는 복수 개의 마이크들(201)로부터 획득하는 음성, 복수 개의 스피커들(202)를을 통해 출력되는 오디오 데이터, 카메라(204)로부터 획득하는 촬영 영상 등 다양한 데이터를 저장할 수 있다.The memory 205 may store various data used by at least one component of the electronic device 200 . For example, the memory 205 stores various data such as voice acquired from a plurality of microphones 201 , audio data output through a plurality of speakers 202 , and a captured image acquired from the camera 204 . can be saved
상기 프로세서(206)는 전자 장치(200)의 다른 구성요소와 작동적으로 연결되어 상기 다른 구성요소의 동작을 제어할 수 있다. 예컨대, 상기 프로세서(206)는 복수 개의 마이크들(201), 복수 개의 스피커들(202), 센서(203), 카메라(204) 및 메모리(205)와 작동적으로 연결되어 상기 복수 개의 마이크들(201), 상기 복수 개의 스피커들(202), 상기 센서(203), 상기 카메라(204) 및 상기 메모리(205)의 동작을 제어할 수 있다.The processor 206 may be operatively connected to other components of the electronic device 200 to control operations of the other components. For example, the processor 206 is operatively connected to a plurality of microphones 201 , a plurality of speakers 202 , a sensor 203 , a camera 204 , and a memory 205 to enable the plurality of microphones ( 201 ), the plurality of speakers 202 , the sensor 203 , the camera 204 , and the memory 205 .
상기 프로세서(206)는 상기 복수 개의 마이크들(201)을 통해 사용자의 음성을 수신할 수 있다. 또한, 상기 프로세서(206)는 상기 복수 개의 마이크들(201) 각각을 통해 수신된 상기 사용자의 음성의 수신 시간의 차이에 기반하여 상기 전자 장치(200)와 사용자 간의 위치 관계를 판단할 수 있다. 예를 들어, 상기 복수 개의 마이크들(201)에 포함된 제1 마이크(201a) 및 제2 마이크(201b)를 통해 상기 사용자의 음성을 수신하면, 상기 프로세서(206)는 상기 제1 마이크(201a)를 통해 상기 사용자의 음성을 수신한 제1 시간과 상기 제2 마이크(201b)를 통해 상기 사용자의 음성을 수신한 제2 시간의 차이에 기반하여 상기 전자 장치(200)와 상기 사용자 간의 위치 관계를 판단할 수 있다.The processor 206 may receive a user's voice through the plurality of microphones 201 . Also, the processor 206 may determine the positional relationship between the electronic device 200 and the user based on a difference in reception time of the user's voice received through each of the plurality of microphones 201 . For example, when receiving the user's voice through the first microphone 201a and the second microphone 201b included in the plurality of microphones 201 , the processor 206 controls the first microphone 201a A positional relationship between the electronic device 200 and the user based on a difference between a first time when the user's voice is received through ) and a second time when the user's voice is received through the second microphone 201b can be judged
일 실시예에 따르면, 상기 프로세서(206)는 상기 수신한 제1시간과 상기 제2시간을 비교하고, 제1임계 값과 상기 비교된 값을 기반으로, 전자 장치(200)와 상기 사용자 간의 위치 관계를 판단할 수 있다. 상기 전자 장치(200)는 상기 판단된 위치 관계를 기반으로, 상기 사용자가 기설정된 영역 내에 있는지 판단할 수 있다.According to an embodiment, the processor 206 compares the received first time with the second time, and based on the first threshold value and the compared value, a position between the electronic device 200 and the user relationship can be judged. The electronic device 200 may determine whether the user is within a preset area based on the determined positional relationship.
일 실시예에 따르면, 상기 수신한 제1시간의 값이 5이고, 상기 수신한 제2시간의 값이 8인 경우, 상기 프로세서는 상기 제1시간과 상기 제2시간을 비교하여, 비교 값 3을 확인할 수 있다. 상기 제1임계 값이 5로 설정되어 있는 경우, 상기 프로세서(206)는 상기 획득한 비교 값 3과 제1임계 값 5를 비교할 수 있는데, 이때, 상기 비교 값이 상기 제1임계 값 이상이면, 상기 프로세서(206)가 사용자가 기설정된 영역에 위치하지 않은 것을 판단할 수 있으며, 상기 비교 값이 상기 제1임계 값 미만이면, 사용자가 기설정된 영역 내부에 위치하고 있다는 것을 판단할 수 있다. According to an embodiment, when the value of the received first time is 5 and the value of the received second time is 8, the processor compares the first time with the second time, and a comparison value of 3 can confirm. When the first threshold value is set to 5, the processor 206 may compare the obtained comparison value 3 with a first threshold value 5, in which case, if the comparison value is equal to or greater than the first threshold value, The processor 206 may determine that the user is not located in the preset region, and when the comparison value is less than the first threshold value, determine that the user is located in the preset region.
따라서, 상기 프로세서(206)는 현재 상기 사용자가 기설정된 영역 내부에 있다는 것을 판단할 수 있다. 즉, 제1임계 값은 수신한 음성의 시간을 기반으로 상기 전자 장치(200)와 상기 사용자 간의 위치 관계를 판단할 수 있는 기준정보라고 할 수 있다. 다만, 상기 제1임계 값은 상기 전자 장치(200)의 크기 및 상기 전자 장치(200)에 배치된 복수 개의 스피커들(202) 각각이 배치된 위치에 따라서 변경될 수 있다. Accordingly, the processor 206 may determine that the current user is within the preset area. That is, the first threshold value may be referred to as reference information for determining the positional relationship between the electronic device 200 and the user based on the time of the received voice. However, the first threshold value may be changed according to a size of the electronic device 200 and a location where each of the plurality of speakers 202 disposed in the electronic device 200 is disposed.
일 실시예에 따르면, 상기 프로세서(206)는 상기 센서(203)를 통해 전자 장치(200)의 자세와 관련된 센서 정보를 획득할 수 있다. 일 실시예에 따르면, 상기 프로세서(206)는 상기 센서(203)를 통해 측정된 전자 장치(200)의 각도 정보를 기반으로 전자 장치(200)의 자세를 판단할 수 있다. 예컨대, 상기 프로세서(206)는 상기 전자 장치(200)의 각도 정보에 기반하여 상기 전자 장치가 종축으로 배치(또는 세로 방향 배치)되었는지 횡축으로 배치(또는 가로 방향 배치)되었는지를 판단할 수 있다.According to an embodiment, the processor 206 may obtain sensor information related to the posture of the electronic device 200 through the sensor 203 . According to an embodiment, the processor 206 may determine the posture of the electronic device 200 based on angle information of the electronic device 200 measured by the sensor 203 . For example, the processor 206 may determine whether the electronic device is disposed along the vertical axis (or vertically) or horizontally (or horizontally) based on the angle information of the electronic device 200 .
일 실시예에 따르면, 상기 프로세서(206)는 상기 센서(203)를 통해 상기 전자 장치(200)의 자세가 변경될 때마다, 상기 전자 장치의 변경 각도를 측정하여, 센서 정보를 획득하고, 획득한 정보와 제2 임계 값을 비교할 수 있다. 일 실시예에 따르면, 상기 프로세서(206)는 상기 센서(203)를 통해 획득한 상기 센서 정보를 기반으로 상기 전자 장치(200)의 변경 각도가 49도인 것을 확인할 수 있다. 이 때, 제2임계 값이 45도 인 경우, 상기 프로세서(206)는 상기 변경 각도 49도와 상기 제2임계 값 45도를 비교하여, 상기 전자 장치(200)의 자세를 판단할 수 있다.According to an embodiment, whenever the posture of the electronic device 200 is changed through the sensor 203 , the processor 206 measures a change angle of the electronic device to obtain and obtain sensor information The one piece of information may be compared with the second threshold value. According to an embodiment, the processor 206 may determine that the change angle of the electronic device 200 is 49 degrees based on the sensor information acquired through the sensor 203 . In this case, when the second threshold value is 45 degrees, the processor 206 may determine the posture of the electronic device 200 by comparing the change angle of 49 degrees with the second threshold value of 45 degrees.
일 실시예에 따르면, 상기 변경 각도가 상기 제2임계 값보다 작은 경우, 상기 프로세서(206)는 상기 전자 장치(200)와 상기 사용자의 위치 관계가 기설정된 영역 내에 사용자가 위치하고 있지 않다는 것을 판단할 수 있다. 반면에 상기 변경 각도가 상기 제2임계 값보다 큰 경우, 상기 위치 관계가 기설정된 영역 내에 사용자가 위치하고 있는 것으로 판단할 수 있다. 즉, 상기 제2임계 값은 상기 프로세서(206)와 현재 전자 장치(200)의 자세가 상기 사용자에게 스테레오 오디오 데이터를 제공할 수 있는 자세인지 판단하기 위한 기준 정보이며, 전자 장치(200)마다 변경되는 기준 정보라고 할 수 있다.According to an embodiment, when the change angle is smaller than the second threshold value, the processor 206 determines that the user is not located in an area in which the positional relationship between the electronic device 200 and the user is preset. can On the other hand, when the change angle is greater than the second threshold value, it may be determined that the user is located in the region in which the positional relationship is preset. That is, the second threshold value is reference information for determining whether the postures of the processor 206 and the current electronic device 200 are postures capable of providing stereo audio data to the user, and is changed for each electronic device 200 . It can be considered as standard information.
일 실시예에 따르면, 상기 프로세서(206)는 상기 전자 장치(200)와 상기 사용자의 위치 관계 및 상기 전자 장치(200)의 자세에 기반하여, 상기 복수 개의 스피커들(202)을 통해 출력되는 오디오 데이터를 결정할 수 있다. 상기 프로세서(206)는 사용자가 기설정된 영역 내부에 위치하고 있는지 여부에 따라서, 복수 개의 스피커들(202) 각각을 통해 출력할 오디오 데이터를 결정할 수 있다. According to an embodiment, the processor 206 is configured to generate audio output through the plurality of speakers 202 based on the positional relationship between the electronic device 200 and the user and the posture of the electronic device 200 . data can be determined. The processor 206 may determine audio data to be output through each of the plurality of speakers 202 according to whether the user is located in a preset area.
일 예로, 상기 프로세서(206)는 사용자가 상기 기설정된 영역 내부에 위치하는 경우, 상기 복수 개의 스피커들(202) 각각에 적어도 일부가 다른 오디오 데이터를 출력하여 스테레오 사운드를 제공할 수 있다. 다른 예로, 상기 프로세서(206)는 사용자가 상기 기설정된 영역 외부에 위치하는 경우, 상기 복수 개의 스피커들(202) 각각에 동일한 오디오 데이터를 출력하여 모노 사운드를 제공할 수 있다. 즉, 상기 프로세서(206)는 제1 임계 값과 제2 임계 값을 기반으로, 상기 전자 장치(200)로부터 스테레오 사운드를 제공받을 수 있는 기설정된 영역 내부에 사용자가 위치하는지 판단하여, 판단한 결과를 기반으로 사용자에게 스테레오 사운드를 제공할 지 모노 사운드를 제공할 지 결정할 수 있다.For example, when the user is located in the preset area, the processor 206 may output at least partially different audio data to each of the plurality of speakers 202 to provide stereo sound. As another example, when the user is located outside the preset area, the processor 206 may output the same audio data to each of the plurality of speakers 202 to provide mono sound. That is, the processor 206 determines whether the user is located in a preset area in which the stereo sound can be provided from the electronic device 200 based on the first threshold value and the second threshold value, and determines the result of the determination. Based on this, you can decide whether to provide stereo sound or mono sound to the user.
또한, 상기 기설정된 영역은 상기 전자 장치(200)에 배치된 상기 복수 개의 스피커들(202) 각각의 위치 및/또는 상기 전자 장치(200)의 크기에 따라 변경될 수 있다. 아래에서 설명하겠지만, 도 9를 참조하면, 상기 전자 장치(200)의 상부에 위치한 제 1 스피커 및 하부에 위치한 제 2 스피커의 위치에 따라 제 1 영역 및 제 3 영역을 기설정된 영역으로 설정할 수 있다. 상기 프로세서(206)가 판단한 상기 전자 장치(200)와 사용자 간의 위치관계가 상기 제 1 영역 및/또는 상기 제 3 영역에 사용자가 위치한 경우, 상기 프로세서(206)는 상기 기설정된 영역 내부에 사용자가 위치하고 있다고 판단하고, 최적의 음향을 사용자에게 제공하기 위해 상기 복수 개의 스피커들(202) 각각에 적어도 일부가 다른 오디오 데이터를 출력하여 사용자에게 스테레오 사운드를 제공할 수 있다. Also, the preset area may be changed according to the location of each of the plurality of speakers 202 disposed in the electronic device 200 and/or the size of the electronic device 200 . As will be described below, referring to FIG. 9 , the first area and the third area may be set as preset areas according to the positions of the first speaker located above the electronic device 200 and the second speaker located below the electronic device 200 . . When the positional relationship between the electronic device 200 and the user determined by the processor 206 is that the user is located in the first area and/or the third area, the processor 206 determines that the user is in the preset area. It is determined that it is located, and in order to provide an optimal sound to the user, at least a portion of different audio data may be output to each of the plurality of speakers 202 to provide stereo sound to the user.
반면에, 상기 프로세서(206)가 상기 전자 장치(200)와 사용자 간의 위치관계가 상기 기설정된 영역에 사용자가 위치하지 않다고 판단한 경우, 스테레오 사운드가 아닌 모노 사운드를 제공할 수 있다. On the other hand, when the processor 206 determines that the user is not located in the preset region in the positional relationship between the electronic device 200 and the user, the processor 206 may provide a mono sound instead of a stereo sound.
일 실시예에 따르면, 프로세서(206)는 복수 개의 마이크들(201) 각각을 통해 사용자의 음성을 수신하고, 수신된 음성의 수신 시간 차이에 기반하여 사용자에게 모노 사운드를 제공할 지 결정할 수 있다. 예컨대, 상기 프로세서(206)는 상기 복수 개의 마이크들(201) 각각을 통해 수신된 음성의 수신 시간 차이에 기반하여 상기 전자 장치(200)와 사용자의 위치 관계를 판단할 수 있다. 이때, 상기 사용자가 상기 전자 장치(200)에 포함된 복수 개의 스피커들(202)의 배치 위치에 기반하여 기설정된 영역 외부에 위치하고 있다고 판단되면, 상기 프로세서(206)는 사용자에게 모노 사운드를 제공할 수 있다.According to an embodiment, the processor 206 may receive a user's voice through each of the plurality of microphones 201 , and determine whether to provide a mono sound to the user based on a difference in reception time of the received voice. For example, the processor 206 may determine a positional relationship between the electronic device 200 and the user based on a difference in reception time of a voice received through each of the plurality of microphones 201 . At this time, if it is determined that the user is located outside a preset area based on the arrangement positions of the plurality of speakers 202 included in the electronic device 200 , the processor 206 provides a mono sound to the user. can
일 실시예에 따르면, 상기 프로세서(206)는 카메라(204)로부터 상기 오브젝트를 촬영한 영상을 획득할 수 있다. 또한, 상기 프로세서(206)는 상기 촬영된 영상, 상기 확인된 음성 신호의 시간 차이 및 상기 판단된 전자 장치의 자세에 기반하여 전자 장치(200)와 사용자 간의 위치 관계를 보다 정확하게 판단할 수 있다. 상기 프로세서(206)는 판단된 상기 전자 장치(200)와 사용자 간의 위치 관계에 기반하여, 상기 복수 개의 스피커들(202)을 통해 출력할 오디오 데이터를 결정할 수 있다.According to an embodiment, the processor 206 may acquire an image obtained by photographing the object from the camera 204 . Also, the processor 206 may more accurately determine the positional relationship between the electronic device 200 and the user based on the captured image, the time difference between the identified voice signals, and the determined posture of the electronic device. The processor 206 may determine audio data to be output through the plurality of speakers 202 based on the determined positional relationship between the electronic device 200 and the user.
일 실시예에 따르면, 상기 전자 장치(200)가 거치대에 거치되어 있는 경우, 상기 프로세서(206)는 상기 제1임계 값, 상기 제2 임계 값 및 상기 카메라(204)를 이용하여 상기 전자 장치(200)와 사용자 간의 위치관계를 판단하고, 판단한 위치관계를 기반으로 상기 복수 개의 스피커들(202) 각각을 통해 출력될 오디오 데이터를 설정할 수 있다. 다만, 거치대에 거치되어 있던 전자 장치(200)의 자세가 지면에 누운 자세로 변경될 경우, 상기 프로세서(206)는 상기 센서(203)를 통해 전자 장치(200)가 누워있는 것을 판단하고, 상기 복수 개의 마이크들(201) 각각을 통해 수신되는 사용자의 음성과 상기 카메라(204)로부터 상기 오브젝트를 촬영한 영상을 기반으로 상기 전자 장치(200)와 사용자 간의 위치 관계를 다시 판단하여, 상기 복수 개의 스피커들(202) 각각을 통해 출력될 오디오 데이터를 재설정할 수 있다. According to an embodiment, when the electronic device 200 is mounted on a cradle, the processor 206 uses the first threshold value, the second threshold value, and the camera 204 to operate the electronic device ( 200) and the user may be determined, and audio data to be output through each of the plurality of speakers 202 may be set based on the determined positional relationship. However, when the posture of the electronic device 200 mounted on the cradle is changed to a posture lying on the ground, the processor 206 determines that the electronic device 200 is lying down through the sensor 203, The positional relationship between the electronic device 200 and the user is determined again based on the user's voice received through each of the plurality of microphones 201 and the image captured by the camera 204, and the plurality of Audio data to be output through each of the speakers 202 may be reset.
일 실시예에 따르면, 상기 프로세서(206)는 기설정된 영역 내부에 사용자가 위치하고 있는지 여부에 따라 상기 복수 개의 스피커들(202)을 통해 출력할 오디오 데이터를 결정할 수 있다. 일 예로, 상기 프로세서(206)는 사용자가 상기 기설정된 영역 내부에 위치하는 경우, 상기 복수 개의 스피커들(202) 각각에 적어도 일부가 다른 오디오 데이터를 출력하여 스테레오 사운드를 제공할 수 있다. 다른 예로, 상기 프로세서(206)는 사용자가 상기 기설정된 영역 외부에 위치하는 경우, 상기 복수 개의 스피커들(202) 각각에 동일한 오디오 데이터를 출력하여 모노 사운드를 제공할 수 있다. According to an embodiment, the processor 206 may determine audio data to be output through the plurality of speakers 202 according to whether the user is located in a preset area. For example, when the user is located in the preset area, the processor 206 may output at least partially different audio data to each of the plurality of speakers 202 to provide stereo sound. As another example, when the user is located outside the preset area, the processor 206 may output the same audio data to each of the plurality of speakers 202 to provide mono sound.
일 실시예에 따르면, 상기 프로세서(206)가 기설정된 영역 내부에 사용자가 위치하지 않은 것을 판단하여 사용자에게 모노 사운드를 제공하는 이유는 상기 기설정된 영역 외부에 위치한 사용자에게 스테레오 사운드를 제공하면 상기 복수 개의 스피커들(202)들 각각을 통해 출력되는 적어도 일부가 다른 오디오 데이터의 간섭 현상이 극도로 악화되는 현상이 발생할 수 있다. 따라서, 상기 프로세서(206)는 상기 간섭 현상으로 인해 악화된 스테레오 사운드의 음질이 모노 사운드의 음질보다 뒤떨어지므로, 사용자가 기설정된 영역 내에 위치하지 않으면, 상기 복수 개의 스피커들(202) 각각을 통해 동일한 오디오 데이터를 출력하여 모노 사운드를 제공할 수 있다.According to an embodiment, the reason that the processor 206 determines that the user is not located inside the preset area and provides the mono sound to the user is that when stereo sound is provided to the user located outside the preset area, the plurality of At least a portion of the audio data output through each of the speakers 202 may cause an extremely aggravated interference phenomenon. Accordingly, since the sound quality of the stereo sound deteriorated due to the interference phenomenon is inferior to that of the mono sound, the processor 206 performs the same through each of the plurality of speakers 202 if the user is not located within the preset area. A mono sound can be provided by outputting audio data.
일 실시예에 따르면, 상기 기설정된 영역은 전자 장치(200)에 배치된 복수 개의 스피커들(202)의 위치 또는 전자 장치(200)의 크기에 따라 결정될 수 있다. 예를 들어, 상기 기설정된 영역은 상기 복수 개의 스피커들(202)의 배치 위치에 기반하여, 사용자에게 스테레오 사운드를 제공하였을 때 최상의 음질을 제공하는 스위트 스팟(sweet spot)을 포함할 수 있다. According to an embodiment, the preset area may be determined according to a location of a plurality of speakers 202 disposed in the electronic device 200 or a size of the electronic device 200 . For example, the preset area may include a sweet spot that provides the best sound quality when stereo sound is provided to the user based on the arrangement positions of the plurality of speakers 202 .
일 실시예에 따르면, 상기 프로세서(206)는 복수 개의 스피커들(202) 각각을 통해 스테레오 사운드를 출력할 때, 오디오 데이터가 서로 간섭하여 발생하는 현상인 크로스 토크(crosstalk) 현상을 방지하기 위해 필터(예: XTC filter)를 적용할 수 있다. 상기 프로세서(206)에 의해 복수 개의 스피커들(202) 각각을 통해 출력하는 스테레오 사운드는 필터가 적용되어 크로스 토크가 제거(crosstalk cancellation)될 수 있다.According to an embodiment, when the processor 206 outputs stereo sound through each of the plurality of speakers 202 , the processor 206 uses a filter to prevent crosstalk, which is a phenomenon that occurs when audio data interferes with each other. (Example: XTC filter) can be applied. A filter may be applied to the stereo sound output by the processor 206 through each of the plurality of speakers 202 to cancel crosstalk.
상술한 바와 같이, 다양한 실시예에 따르면, 전자 장치(예: 전자 장치(200))는, 복수 개의 마이크들(예: 제1 마이크(201a) 및 제2 마이크(201b)), 복수 개의 스피커들(예: 제1 스피커(202a) 및 제2 스피커(202b)), 센서(예: 센서(203)), 메모리(예: 메모리(205)), 및 상기 복수 개의 마이크들, 상기 복수 개의 스피커들, 상기 센서 및 상기 메모리와 작동적으로 연결된 프로세서(예: 프로세서(206))를 포함하고, 상기 프로세서는, 상기 복수 개의 마이크들 각각을 통해, 사용자의 음성을 수신하고, 상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 차이를 기반으로, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하고, 상기 센서를 통해 측정된 센서 정보에 기반하여, 상기 전자 장치의 자세를 판단하고, 상기 판단된 위치 관계 및 상기 판단된 전자 장치의 자세에 기반하여, 상기 전자 장치에 포함된 상기 복수 개의 스피커들을 통해 출력하는 오디오 데이터를 결정하도록 설정될 수 있다.As described above, according to various embodiments, the electronic device (eg, the electronic device 200) includes a plurality of microphones (eg, the first microphone 201a and the second microphone 201b) and a plurality of speakers. (eg, first speaker 202a and second speaker 202b), sensor (eg, sensor 203), memory (eg, memory 205), and the plurality of microphones, the plurality of speakers , a processor (eg, processor 206 ) operatively coupled to the sensor and the memory, wherein the processor receives, through each of the plurality of microphones, a user's voice, and each of the plurality of microphones based on a difference in reception time of the user's voice received through the user, determine a positional relationship between the electronic device and the user, and determine the posture of the electronic device based on sensor information measured through the sensor, Audio data output through the plurality of speakers included in the electronic device may be determined based on the determined positional relationship and the determined posture of the electronic device.
다양한 실시예에 따르면, 상기 프로세서는, 상기 판단된 위치 관계 및 상기 판단된 전자 장치의 자세에 기반하여, 상기 사용자가 기설정된 영역 내에 위치하는지를 판단하고, 상기 사용자가 상기 기설정된 영역 내에 위치하지 않는다고 판단된 경우, 상기 복수 개의 스피커들 각각을 통해 동일한 오디오 데이터를 출력하고, 상기 사용자가 상기 기설정된 영역 내에 위치한다고 판단된 경우, 상기 복수 개의 스피커들 각각을 통해 적어도 일부가 다른 오디오 데이터를 출력하도록 설정될 수 있다.According to various embodiments, the processor determines whether the user is located in a preset area based on the determined positional relationship and the determined posture of the electronic device, and determines that the user is not located in the preset area. When it is determined that the same audio data is output through each of the plurality of speakers, and when it is determined that the user is located in the preset area, at least some different audio data are output through each of the plurality of speakers can be set.
다양한 실시예에 따르면, 상기 프로세서는, 상기 복수 개의 스피커들이 상기 전자 장치에 배치되는 위치에 기반하여 상기 기설정된 영역을 설정할 수 있다.According to various embodiments, the processor may set the preset area based on a location where the plurality of speakers are disposed in the electronic device.
다양한 실시예에 따르면, 상기 전자 장치는 카메라(예: 카메라(204))를 더 포함하고, 상기 프로세서는, 상기 카메라를 통해 촬영된 영상 및 상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 차이를 기반으로, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하도록 설정될 수 있다.According to various embodiments, the electronic device further includes a camera (eg, a camera 204 ), and the processor includes an image captured by the camera and a voice of the user received through each of the plurality of microphones. It may be configured to determine a positional relationship between the electronic device and the user based on a reception time difference of .
다양한 실시예에 따르면, 상기 전자 장치는 적어도 하나의 다른 마이크를 더 포함하고, 상기 프로세서는, 상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 및 상기 적어도 하나의 다른 마이크를 통해 수신된 상기 사용자의 음성의 수신 시간에 기반하여, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하도록 설정될 수 있다.According to various embodiments of the present disclosure, the electronic device further includes at least one other microphone, and the processor is configured to include a reception time of the user's voice received through each of the plurality of microphones and the at least one other microphone. It may be configured to determine a positional relationship between the electronic device and the user based on a reception time of the received user's voice.
다양한 실시예에 따르면, 상기 전자 장치는 상기 복수 개의 스피커들 각각을 통해 출력되는 상기 오디오 데이터 간에 발생하는 크로스 토크 현상을 방지하는 필터를 더 포함할 수 있다.According to various embodiments, the electronic device may further include a filter for preventing a crosstalk phenomenon occurring between the audio data output through each of the plurality of speakers.
다양한 실시예에 따르면, 상기 프로세서는, 상기 사용자의 음성의 수신 시간 차이를 나타내는 값이 미리 설정된 제 1 임계 값보다 크거나 같은 경우, 상기 복수 개의 스피커들 각각을 통해 동일한 오디오 데이터를 출력하고, 상기 사용자의 음성의 수신 시간 차이를 나타내는 값이 상기 제 1 임계 값보다 작은 경우, 상기 복수 개의 스피커들 각각을 통해 적어도 일부가 다른 오디오 데이터를 출력하도록 설정될 수 있다.According to various embodiments, the processor outputs the same audio data through each of the plurality of speakers when the value indicating the difference in the reception time of the user's voice is greater than or equal to a preset first threshold value, When a value indicating a difference in reception time of a user's voice is smaller than the first threshold value, at least a portion of the audio data may be set to output different audio data through each of the plurality of speakers.
다양한 실시예에 따르면, 상기 프로세서는, 상기 센서 정보에 기반하여 상기 전자 장치의 각도를 산출하고, 상기 산출된 전자 장치의 각도가 미리 설정된 제 2 임계 값보다 크거나 같은 경우, 상기 복수 개의 스피커들 각각을 통해 동일한 오디오 데이터를 출력하고, 상기 산출된 전자 장치의 각도가 상기 제 2 임계 값보다 작은 경우, 상기 복수 개의 스피커들 각각을 통해 적어도 일부가 다른 오디오 데이터를 출력하도록 설정될 수 있다.According to various embodiments, the processor calculates the angle of the electronic device based on the sensor information, and when the calculated angle of the electronic device is greater than or equal to a preset second threshold value, the plurality of speakers The same audio data may be output through each, and when the calculated angle of the electronic device is smaller than the second threshold value, at least some of the different audio data may be output through each of the plurality of speakers.
다양한 실시예에 따르면, 상기 전자 장치는 카메라(예: 카메라(204))를 더 포함하고, 상기 프로세서는, 상기 카메라를 통해 촬영된 영상을 획득하고, 상기 영상에서 상기 사용자에 대응하는 오브젝트의 위치 값을 획득하고, 상기 판단된 위치 관계, 상기 판단된 전자 장치의 자세 및 상기 오브젝트의 위치 값에 기반하여 상기 결정된 오디오 데이터를 재구성하도록 설정될 수 있다.According to various embodiments, the electronic device further includes a camera (eg, a camera 204 ), the processor acquires an image captured by the camera, and a position of an object corresponding to the user in the image It may be configured to obtain a value and reconstruct the determined audio data based on the determined positional relationship, the determined posture of the electronic device, and the position value of the object.
상술한 바와 같이, 다양한 실시예에 따르면, 전자 장치(예: 전자 장치(200))는, 복수 개의 마이크들(예: 제1 마이크(201a) 및 제2 마이크(201b)), 복수 개의 스피커들(예: 제1 스피커(202a) 및 제2 스피커(202b)), 카메라(예: 카메라(204)), 메모리(예: 메모리(205)), 및 상기 복수 개의 마이크들, 상기 복수 개의 스피커들, 상기 카메라 및 상기 메모리와 작동적으로 연결된 프로세서(예: 프로세서(206))를 포함하고, 상기 프로세서는, 상기 복수 개의 마이크들 각각을 통해 사용자의 음성을 수신하고, 상기 카메라를 통해 촬영된 영상을 획득하고, 상기 영상에서 상기 사용자에 대응하는 오브젝트의 위치 값을 획득하고, 상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 차이 및 상기 오브젝트의 위치 값을 기반으로, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하고, 상기 판단된 위치 관계에 기반하여, 상기 복수 개의 스피커들을 통해 출력하는 상기 오디오 데이터를 결정하도록 설정될 수 있다.As described above, according to various embodiments, the electronic device (eg, the electronic device 200) includes a plurality of microphones (eg, the first microphone 201a and the second microphone 201b) and a plurality of speakers. (eg, first speaker 202a and second speaker 202b), camera (eg, camera 204), memory (eg, memory 205), and the plurality of microphones, the plurality of speakers , the camera and a processor (eg, processor 206 ) operatively connected to the memory, wherein the processor receives a user's voice through each of the plurality of microphones, and an image captured by the camera to obtain the position value of the object corresponding to the user in the image, and based on the reception time difference of the user's voice received through each of the plurality of microphones and the position value of the object, the electronic and determine a positional relationship between the device and the user, and determine the audio data to be output through the plurality of speakers based on the determined positional relationship.
다양한 실시예에 따르면, 상기 프로세서는, 상기 판단된 위치 관계에 기반하여, 상기 복수 개의 스피커들 중 적어도 두 개를 선택하고, 상기 선택된 적어도 두 개의 스피커들 각각을 통해 적어도 일부가 다른 오디오 데이터를 출력하도록 설정될 수 있다.According to various embodiments, the processor selects at least two of the plurality of speakers based on the determined positional relationship, and outputs at least partially different audio data through each of the selected at least two speakers. can be set to
도 3은 본 발명의 일 실시예에 따른, 오디오데이터의 출력 방법에 관한 도면이다. 3 is a diagram illustrating a method of outputting audio data according to an embodiment of the present invention.
도 3을 참조하면, 동작 301에서, 프로세서(예: 프로세서(206))는 전자 장치(예: 전자 장치(200))에 배치된 복수 개의 마이크들(예: 복수 개의 마이크들(201)) 각각을 통하여 사용자의 음성 신호를 수신할 수 있다. Referring to FIG. 3 , in operation 301 , the processor (eg, the processor 206 ) performs each of a plurality of microphones (eg, the plurality of microphones 201 ) disposed in the electronic device (eg, the electronic device 200 ). It is possible to receive the user's voice signal through the
동작 303에서, 프로세서는 복수 개의 마이크들 각각을 통해 수신된 음성 신호의 수신된 시간 차이를 기반으로 전자 장치와 사용자 간의 위치 관계를 판단할 수 있다. 예를 들어, 상기 복수 개의 마이크들 중 제1 마이크(예: 제1 마이크(201a))가 전자 장치의 일측(예: 좌측)에 배치되고, 상기 복수 개의 마이크들 중 제2 마이크(예: 제2 마이크(201b))가 전자 장치의 타측(예: 우측)에 배치된 경우, 전자 장치의 일측(예: 좌측) 방향에 위치한 사용자가 발화하면, 사용자와 보다 가깝게 위치한 상기 제1 마이크는 상기 제2 마이크보다 빠른 시간에 음성을 수신할 수 있다. 즉, 교차 상관 관계에 기반하여 프로세서가 제 1 마이크(201a)가 수신한 음성 신호의 시간인 T1과 제 2 마이크(201b)가 수신한 음성 신호의 시간인 T2를 비교하여, 수신된 음성의 수신 시간 차이를 확인할 수 있다. 상기 프로세서는 상기 수신된 음성의 수신 시간 차이에 기반하여, 전자 장치와 사용자 간의 위치 관계를 판단할 수 있다.In operation 303, the processor may determine a positional relationship between the electronic device and the user based on a received time difference of a voice signal received through each of the plurality of microphones. For example, a first microphone (eg, a first microphone 201a) among the plurality of microphones is disposed on one side (eg, a left side) of the electronic device, and a second microphone (eg, a second microphone) among the plurality of microphones 2 When the microphone 201b) is disposed on the other side (eg, the right side) of the electronic device, when a user located in the direction of one side (eg, the left side) of the electronic device speaks, the first microphone located closer to the user will 2 Can receive voice faster than microphone. That is, based on the cross-correlation, the processor compares T1, which is the time of the voice signal received by the first microphone 201a, with T2, which is the time of the voice signal received by the second microphone 201b, based on the cross-correlation, and receives the voice You can see the time difference. The processor may determine a positional relationship between the electronic device and the user based on a difference in reception time of the received voice.
동작 305에서, 프로세서는 센서(예: 센서(203))로부터 수신한 센서 정보에 기반하여 전자 장치의 자세를 판단할 수 있다. 센서는 자이로 센서, 가속도 센서를 포함할 수 있으며, 전자 장치의 자세를 판단할 수 있는 센서 정보를 획득할 수 있으면 이에 한정되지 않는다. 상기 센서는 전자 장치에 배치된 상기 복수 개의 스피커들을 지나는 가상의 선을 기준으로 전자 장치의 변경 각도를 측정하여, 측정된 전자 장치의 변경 각도를 센서 정보로 상기 프로세서에 제공할 수 있다. 상기 프로세서는 센서 정보에 기반하여, 상기 전자 장치의 자세를 판단할 수 있다.In operation 305, the processor may determine the posture of the electronic device based on sensor information received from a sensor (eg, the sensor 203). The sensor may include a gyro sensor and an acceleration sensor, and is not limited thereto as long as sensor information for determining the posture of the electronic device can be obtained. The sensor may measure a change angle of the electronic device based on a virtual line passing through the plurality of speakers disposed in the electronic device, and provide the measured change angle of the electronic device as sensor information to the processor. The processor may determine the posture of the electronic device based on the sensor information.
동작 307에서, 상기 프로세서는 상기 위치 관계 및 판단된 전자 장치의 자세에 기반하여, 복수 개의 스피커(예: 복수 개의 스피커들(202))들 각각을 통해 출력되는 오디오 데이터를 결정하고 출력할 수 있다. 상기 프로세서는 상기 위치 관계 및 판단된 전자 장치의 자세에 기반하여, 사용자가 기설정된 영역 내에 위치하고 있는 것을 판단한 경우, 상기 복수 개의 스피커들을 통해 스테레오 사운드를 출력하도록 할 수 있다. 프로세서가 사용자가 기설정된 영역 외부에 위치하고 있는 것을 판단한 경우, 상기 복수 개의 스피커들을 통해 모노 사운드를 출력하도록 할 수 있다.In operation 307, the processor may determine and output audio data output through each of a plurality of speakers (eg, a plurality of speakers 202) based on the positional relationship and the determined posture of the electronic device. . When it is determined that the user is located in a preset area based on the positional relationship and the determined posture of the electronic device, the processor may output stereo sound through the plurality of speakers. When the processor determines that the user is located outside the preset area, the processor may output a mono sound through the plurality of speakers.
도 4는 본 발명의 일 실시예에 따른, 전자 장치와 사용자 간의 위치 관계 및 전자 장치의 자세에 기반하여 오디오 데이터를 선택적으로 출력하는 방법에 관한 도면이다.4 is a diagram illustrating a method of selectively outputting audio data based on a positional relationship between an electronic device and a user and a posture of the electronic device, according to an embodiment of the present invention.
도 4를 참조하면, 동작 401에서 프로세서(예: 프로세서(206))는 복수 개의 마이크들(예: 복수 개의 마이크들(201)) 각각을 통해 수신한 음성을 교차 상관 관계에 기반하여 비교할 수 있고, 비교된 결과에 기반하여 수신된 음성의 수신 시간 차이를 확인할 수 있다. 상기 프로세서는 상기 전자 장치와 사용자 간의 위치 관계를 판단하기 위해 미리 설정되는 기준 정보인 제 1 임계 값과 상기 수신된 음성의 수신 시간 차이를 비교할 수 있다. 상기 수신된 음성의 수신 시간 차이가 상기 제 1 임계 값보다 크거나 같은 경우, 상기 프로세서는 기설정된 영역 내에 사용자가 위치하지 않은 것을 판단할 수 있다.Referring to FIG. 4 , in operation 401, the processor (eg, the processor 206) may compare the voice received through each of the plurality of microphones (eg, the plurality of microphones 201) based on the cross-correlation. , it is possible to check the difference in reception time of the received voice based on the comparison result. The processor may compare a first threshold value that is preset reference information for determining the positional relationship between the electronic device and the user and a difference in reception time of the received voice. When the difference in the reception time of the received voice is greater than or equal to the first threshold value, the processor may determine that the user is not located in the preset area.
일 실시예에 따르면, 프로세서는 사용자가 기설정된 영역 내부에 위치하지 않다고 판단한 경우, 동작 403과 같이, 복수 개의 스피커들(예: 복수 개의 스피커들(202)) 각각을 통해 동일한 오디오 데이터를 출력하여 사용자에게 모노 사운드를 제공할 수 있다. 사용자의 위치가 기설정된 영역 외부에 위치할 때, 프로세서가 스테레오 사운드를 제공하면, 복수 개의 스피커들 각각을 통해 출력되는 적어도 일부가 다른 오디오 데이터 간에 간섭이 발생할 수 있다. 이에 따라, 상기 프로세서는 사용자의 위치가 기설정된 영역 외부에 위치할 때, 상기 복수 개의 스피커들을 통해 동일한 오디오 데이터를 출력하는 모노 사운드를 제공할 수 있다.According to an embodiment, when the processor determines that the user is not located within the preset area, in operation 403 , the processor outputs the same audio data through each of the plurality of speakers (eg, the plurality of speakers 202 ). A mono sound can be provided to the user. If the processor provides stereo sound when the user's location is outside the preset area, interference may occur between audio data that is at least partially different from each other outputted through each of the plurality of speakers. Accordingly, when the user's location is outside the preset area, the processor may provide a mono sound outputting the same audio data through the plurality of speakers.
동작 402에서, 상기 프로세서는 센서(예: 센서(203))로부터 수신한 센서 정보에 기반하여 판단된 전자 장치의 각도와 미리 설정된 제 2 임계 값을 비교할 수 있다. 상기 프로세서는 상기 비교 결과에 기반하여 상기 전자 장치의 자세를 판단할 수 있다. 예컨대, 상기 프로세서는 상기 전자 장치의 각도가 상기 제 2 임계 값보다 작은 경우, 상기 전자 장치가 종축으로 배치되어 있다고 판단할 수 있다. 또한, 상기 프로세서는 상기 전자 장치의 각도가 상기 제 2 임계 값보다 크거나 같은 경우, 상기 전자 장치가 횡축으로 배치되어 있다고 판단할 수 있다.In operation 402, the processor may compare the angle of the electronic device determined based on sensor information received from a sensor (eg, the sensor 203) with a preset second threshold value. The processor may determine the posture of the electronic device based on the comparison result. For example, when the angle of the electronic device is smaller than the second threshold value, the processor may determine that the electronic device is disposed along the vertical axis. Also, when the angle of the electronic device is greater than or equal to the second threshold value, the processor may determine that the electronic device is arranged in a horizontal axis.
일 실시예에 따르면, 상기 전자 장치의 각도가 미리 설정된 제 2 임계 값보다 작은 경우(상기 전자 장치가 종축으로 배치된 경우), 프로세서는 전자 장치에 배치된 복수 개의 스피커들의 위치에 따른 기설정된 영역의 내부에 사용자가 위치하지 않은 것으로 판단하여, 동작 403과 같이, 복수 개의 스피커들 각각을 통해 동일한 오디오 데이터를 출력하여 사용자에게 모노 사운드를 제공할 수 있다.According to an embodiment, when the angle of the electronic device is smaller than a preset second threshold value (when the electronic device is disposed in a vertical axis), the processor determines a preset area according to positions of a plurality of speakers disposed in the electronic device. It is determined that the user is not located inside the , and in operation 403 , the same audio data may be output through each of the plurality of speakers to provide a mono sound to the user.
일 실시예에 따르면, 상기 전자 장치의 각도가 미리 설정된 제 2 임계 값보다 크거나 같은 경우(상기 전자 장치가 횡축으로 배치된 경우), 상기 프로세서는 상기 전자 장치에 배치된 상기 복수 개의 스피커들의 위치에 따른 기설정된 영역의 내부에 사용자가 위치하고 있다고 판단하여, 동작 404와 같이, 복수 개의 스피커들 각각을 통해 적어도 일부가 다른 오디오 데이터를 출력하여, 사용자에게 스테레오 사운드를 제공할 수 있다.According to an embodiment, when the angle of the electronic device is greater than or equal to a preset second threshold value (when the electronic device is disposed in a horizontal axis), the processor determines the positions of the plurality of speakers disposed in the electronic device It is determined that the user is located in the preset area according to , and in operation 404 , at least some different audio data may be output through each of the plurality of speakers to provide stereo sound to the user.
도 5는 본 발명의 일 실시예에 따른, 전자 장치와 사용자 간의 위치 관계 및 전자 장치의 자세에 기반하여 오디오 데이터를 선택적으로 출력하는 다른 방법에 관한 도면이다.5 is a diagram illustrating another method of selectively outputting audio data based on a positional relationship between an electronic device and a user and a posture of the electronic device, according to an embodiment of the present invention.
동작 501에서, 사용자의 음성이 복수 개의 마이크들(예: 복수 개의 마이크들(201)) 각각으로 수신되면, 프로세서(예: 프로세서(206))는 수신된 음성의 수신 시간 차이와 미리 설정된 제 1 임계 값을 비교할 수 있다. 상기 수신된 음성의 수신 시간 차이가 상기 제 1 임계 값보다 크거나 같은 경우, 상기 프로세서는 기설정된 영역 내에 사용자가 위치하지 않은 것을 판단할 수 있다.In operation 501 , when the user's voice is received through each of the plurality of microphones (eg, the plurality of microphones 201 ), the processor (eg, the processor 206 ) determines a difference between the reception time of the received voice and the preset first Thresholds can be compared. When the difference in the reception time of the received voice is greater than or equal to the first threshold value, the processor may determine that the user is not located in the preset area.
일 실시예에 따르면, 사용자가 기설정된 영역 내부에 위치하지 않다고 판단한 경우, 동작 503과 같이, 상기 프로세서는 복수 개의 스피커들(예: 복수 개의 스피커들(202)) 각각을 통해 동일한 오디오 데이터를 출력하여 사용자에게 모노 사운드를 제공할 수 있다.According to an embodiment, when it is determined that the user is not located inside the preset area, in operation 503 , the processor outputs the same audio data through each of a plurality of speakers (eg, a plurality of speakers 202 ). Thus, a mono sound can be provided to the user.
동작 502에서, 상기 프로세서는 센서(예: 센서(203))로부터 수신한 센서 정보에 기반하여 판단된 전자 장치의 각도와 미리 설정된 제 2 임계 값을 비교할 수 있다. 상기 프로세서는 상기 비교 결과에 기반하여 상기 전자 장치의 자세를 판단할 수 있다. 예컨대, 상기 프로세서는 상기 전자 장치의 각도가 상기 제 2 임계 값보다 작은 경우, 상기 전자 장치가 종축으로 배치되어 있다고 판단할 수 있다. 또한, 상기 프로세서는 상기 전자 장치의 각도가 상기 제 2 임계 값보다 크거나 같은 경우, 상기 전자 장치가 횡축으로 배치되어 있다고 판단할 수 있다.In operation 502, the processor may compare an angle of the electronic device determined based on sensor information received from a sensor (eg, the sensor 203) with a preset second threshold value. The processor may determine the posture of the electronic device based on the comparison result. For example, when the angle of the electronic device is smaller than the second threshold value, the processor may determine that the electronic device is disposed along the vertical axis. Also, when the angle of the electronic device is greater than or equal to the second threshold value, the processor may determine that the electronic device is arranged in a horizontal axis.
일 실시예에 따르면, 상기 전자 장치의 각도가 미리 설정된 제 2 임계 값보다 작은 경우(상기 전자 장치가 종축으로 배치된 경우), 프로세서는 전자 장치에 배치된 복수 개의 스피커들의 위치에 따른 기설정된 영역의 내부에 사용자가 위치하지 않은 것으로 판단하여, 동작 503과 같이, 복수 개의 스피커들 각각을 통해 동일한 오디오 데이터를 출력하여 사용자에게 모노 사운드를 제공할 수 있다.According to an embodiment, when the angle of the electronic device is smaller than a preset second threshold value (when the electronic device is disposed in a vertical axis), the processor determines a preset area according to positions of a plurality of speakers disposed in the electronic device. It is determined that the user is not located inside the , and in operation 503 , the same audio data may be output through each of the plurality of speakers to provide a mono sound to the user.
일 실시예에 따르면, 상기 전자 장치의 각도가 미리 설정된 제 2 임계 값보다 크거나 같은 경우(상기 전자 장치가 횡축으로 배치된 경우), 상기 프로세서는 상기 전자 장치에 배치된 상기 복수 개의 스피커들의 위치에 따른 기설정된 영역의 내부에 사용자가 위치하고 있다고 판단하여, 동작 504와 같이, 복수 개의 스피커들 각각을 통해 출력될 스테레오 오디오 데이터를 구성할 수 있다. 예컨대, 상기 프로세서는 상기 복수 개의 스피커들 각각을 통해 출력된 적어도 일부가 다른 오디오 데이터를 구성할 수 있다.According to an embodiment, when the angle of the electronic device is greater than or equal to a preset second threshold value (when the electronic device is disposed in a horizontal axis), the processor determines the positions of the plurality of speakers disposed in the electronic device It is determined that the user is located in the preset area according to , and in operation 504 , stereo audio data to be output through each of the plurality of speakers may be configured. For example, the processor may configure audio data that is at least partially different from each other output through each of the plurality of speakers.
동작 505에서 상기 프로세서는 카메라(예: 카메라(204))로 촬영한 영상에 기반하여 전자 장치와 사용자의 위치 관계를 특정할 수 있다. 예컨대, 상기 프로세서는 상기 카메라를 통해 오브젝트(예: 사용자)를 촬영한 영상을 획득하고, 상기 영상에서 오브젝트의 위치를 확인할 수 있다. 또한, 상기 프로세서는 상기 복수 개의 마이크들 각각을 통해 수신된 음성의 수신 시간 차이 및 상기 영상에서의 오브젝트의 위치에 기반하여 상기 전자 장치와 사용자 간의 위치 관계를 특정할 수 있다. 이를 보다 상세히 하면, 상기 프로세서는 동작 501에서 복수 개의 마이크들 각각을 통해 수신된 음성의 수신 시간 차이에 기반하여, 상기 전자 장치와 사용자 간의 위치 관계를 대략적으로 판단할 수 있다. In operation 505, the processor may specify a positional relationship between the electronic device and the user based on an image captured by a camera (eg, the camera 204). For example, the processor may obtain an image obtained by photographing an object (eg, a user) through the camera, and determine the position of the object in the image. Also, the processor may specify a positional relationship between the electronic device and the user based on a difference in reception time of a voice received through each of the plurality of microphones and a position of an object in the image. In more detail, the processor may roughly determine a positional relationship between the electronic device and the user based on a difference in reception time of a voice received through each of the plurality of microphones in operation 501 .
예컨대, 음성의 수신 시간 차이에 기반하여 판단된 상기 전자 장치와 사용자 간의 위치 관계는 상기 전자 장치와 상기 사용자 간의 거리 및 방향에 대한 정보를 포함할 수 있다. 여기서 상기 전자 장치와 상기 사용자 간의 방향은 어느 한 방향으로 특정되지 않을 수 있기 때문에, 상기 프로세서는 상기 카메라를 통해 사용자를 촬영한 영상에서 상기 사용자에 대응하는 오브젝트의 위치 값을 확인하여, 상기 전자 장치와 상기 사용자 간의 방향을 어느 한 방향으로 특정할 수 있다.For example, the positional relationship between the electronic device and the user determined based on the difference in the reception time of the voice may include information on the distance and the direction between the electronic device and the user. Here, since the direction between the electronic device and the user may not be specified in any one direction, the processor checks the position value of the object corresponding to the user in the image captured by the user through the camera, and the electronic device and a direction between the user and the user may be specified in any one direction.
동작 506에서 프로세서는 상기 특정된 전자 장치와 사용자 간의 위치 관계에 기반하여 스테레오 오디오 데이터에 필터를 적용할 수 있다. 상기 프로세서는 상기 복수 개의 스피커들 각각을 통해 적어도 일부가 다른 오디오 데이터를 출력할 때, 상기 적어도 일부가 다른 오디오 데이터가 서로 간섭하는 크로스 토크 현상을 방지하기 위하여, 상기 적어도 일부가 다른 오디오 데이터에 필터(예: XTC filter)를 적용할 수 있다.In operation 506, the processor may apply a filter to the stereo audio data based on the specified positional relationship between the electronic device and the user. When the at least partly different audio data is output through each of the plurality of speakers, the processor filters the at least partly different audio data to prevent a crosstalk phenomenon in which the at least partly different audio data interferes with each other. (Example: XTC filter) can be applied.
동작 507에서, 상기 프로세서는 상기 필터가 적용된 적어도 일부가 다른 오디오 데이터를 상기 복수 개의 스피커들을 통해 출력함으로써, 상기 기설정된 영역 내에 위치한 사용자에게 스테레오 사운드를 제공할 수 있다.In operation 507, the processor may provide stereo sound to a user located in the preset area by outputting audio data to which at least a portion to which the filter is applied is different through the plurality of speakers.
일 실시예에 따르면, 상기 카메라가 사용자를 인식하지 못하거나 2명 이상 인식한 경우, 상기 프로세서는 상기 판단된 위치 관계 및 상기 전자 장치의 자세에 기반하여 기존에 구성했던 적어도 일부가 다른 오디오 데이터를 복수 개의 스피커들 각각을 통해 출력하여 사용자에게 스테레오 사운드를 제공할 수 있다.According to an embodiment, when the camera does not recognize a user or recognizes two or more users, the processor transmits at least partially different audio data based on the determined positional relationship and the posture of the electronic device. A stereo sound may be provided to the user by outputting the output through each of the plurality of speakers.
일 실시예에 따르면, 상기 프로세서는 상기 특정된 전자 장치와 사용자 간의 위치 관계에 기반하여 스테레오 사운드를 재구성할 수 있다. 예컨대, 상기 프로세서는 상기 특정된 전자 장치와 사용자 간의 위치 관계에 기반하여 상기 복수 개의 스피커들을 통해 출력되는 적어도 일부가 다른 오디오 데이터를 재구성할 수 있다.According to an embodiment, the processor may reconstruct the stereo sound based on the specified positional relationship between the electronic device and the user. For example, the processor may reconstruct audio data that is at least partially different from the audio data output through the plurality of speakers based on the specified positional relationship between the electronic device and the user.
도 6은 본 발명의 일 실시예에 따른, 전자 장치와 사용자 간의 위치 관계 및 전자 장치의 자세에 기반하여 오디오 데이터를 선택적으로 출력하는 또 다른 방법에 관한 도면이다.6 is a diagram illustrating another method of selectively outputting audio data based on a positional relationship between an electronic device and a user and a posture of the electronic device, according to an embodiment of the present invention.
동작 601에서 프로세서(예: 프로세서(206))는 복수 개의 마이크들(예: 복수 개의 마이크들(201)) 각각을 통해 수신된 음성의 수신 시간 차이와 미리 설정된 제 1 임계 값을 비교하여 전자 장치와 사용자 간의 위치 관계를 판단할 수 있다. 상기 프로세서는 수신된 음성의 수신 시간 차이가 미리 설정된 제 1 임계 값보다 작은 경우, 동작 602와 같이, 센서(예: 센서(203))로부터 수신한 센서 정보와 제 2 임계 값을 비교하여 전자 장치의 자세를 판단할 수 있다. In operation 601 , the processor (eg, the processor 206 ) compares the reception time difference of the voice received through each of the plurality of microphones (eg, the plurality of microphones 201 ) with a preset first threshold value to the electronic device and a positional relationship between the user and the user may be determined. The processor compares the sensor information received from the sensor (eg, the sensor 203 ) with the second threshold value in operation 602 when the difference in the reception time of the received voice is smaller than a preset first threshold value to the electronic device position can be judged.
일 실시예에 따르면, 프로세서는 상기 전자 장치의 각도가 미리 설정된 제 2 임계 값보다 크거나 같은 경우, 동작 604와 같이, 기설정된 영역에 사용자가 위치하고 있다는 것을 판단할 수 있다. 상기 프로세서가 기설정된 영역에 사용자가 위치하고 있는 것을 판단한 경우, 상기 프로세서는 사용자에게 스테레오 사운드를 제공하기 위해, 판단된 위치 관계 및 판단된 전자 장치의 자세에 기반하여 적어도 일부가 다른 오디오 데이터를 구성할 수 있다.According to an embodiment, when the angle of the electronic device is greater than or equal to a preset second threshold value, in operation 604 , the processor may determine that the user is located in a preset area. When the processor determines that the user is located in the preset area, the processor configures at least partly different audio data based on the determined positional relationship and the determined posture of the electronic device in order to provide stereo sound to the user. can
일 실시예에 따르면, 상기 전자 장치에 복수 개의 마이크들과 더불어, 적어도 하나의 다른 마이크가 추가적으로 구성되어 있는 경우, 동작 605에서 프로세서는 상기 복수 개의 마이크를 통해 수신된 음성의 수신 시간과 상기 적어도 하나의 다른 마이크를 통해 수신된 음성의 수신 시간 각각을 교차 상관 관계를 기반으로 비교하여 수신된 음성의 수신 시간 차이를 확인할 수 있다.According to an embodiment, when at least one other microphone is additionally configured in the electronic device in addition to the plurality of microphones, in operation 605, the processor determines the reception time of the voice received through the plurality of microphones and the at least one By comparing each of the reception times of the voices received through the other microphones based on the cross-correlation, the difference in the reception times of the received voices can be confirmed.
일 실시예에 따르면, 상기 프로세서는 상기 수신된 음성의 수신 시간 차이를 기반으로 삼변 측량을 실시하여, 전자 장치와 사용자 간의 위치 관계를 보다 정확하게 확인할 수 있다. 예를 들어, 상기 복수 개의 마이크들(예: 제1 마이크(201a) 및 제2 마이크(201b)) 각각이 수신한 음성 신호의 수신 시간을 T1 및 T2라 하고, 상기 적어도 하나의 다른 마이크(예: 제3 마이크(미도시))를 통해 수신한 음성 신호의 수신 시간을 T3라 할 때, 상기 T1, T2, 및 T3의 시간 차이를 기반으로 삼변 측량하여 상기 전자 장치와 상기 사용자의 위치 관계를 특정할 수 있다.According to an embodiment, the processor may perform trilateration based on a difference in reception time of the received voice to more accurately identify a positional relationship between the electronic device and the user. For example, a reception time of a voice signal received by each of the plurality of microphones (eg, the first microphone 201a and the second microphone 201b) is referred to as T1 and T2, and the at least one other microphone (eg, : When the reception time of the voice signal received through the third microphone (not shown) is T3, trilateration is performed based on the time difference between T1, T2, and T3 to determine the positional relationship between the electronic device and the user. can be specified.
일 실시예에 따르면, 상기 전자 장치와 상기 사용자의 위치 관계가 특정되지 않으면, 동작 607에서, 상기 프로세서는 동작 604에서 구성한 스테레오 오디오 데이터를 상기 복수 개의 스피커들을 통해 출력할 수 있다.According to an embodiment, if the positional relationship between the electronic device and the user is not specified, in operation 607, the processor may output the stereo audio data configured in operation 604 through the plurality of speakers.
일 실시예에 따르면, 상기 전자 장치와 상기 사용자의 위치 관계가 특정되면, 동작 606에서, 상기 프로세서는 상기 특정된 전자 장치와 사용자 간의 위치 관계에 기반하여 스테레오 오디오 데이터에 필터를 적용할 수 있다. 상기 프로세서는 상기 복수 개의 스피커들 각각을 통해 적어도 일부가 다른 오디오 데이터를 출력할 때, 상기 적어도 일부가 다른 오디오 데이터가 서로 간섭하는 크로스 토크 현상을 방지하기 위하여, 상기 적어도 일부가 다른 오디오 데이터에 필터(예: XTC filter)를 적용할 수 있다.According to an embodiment, if the positional relationship between the electronic device and the user is specified, in operation 606, the processor may apply a filter to the stereo audio data based on the specified positional relationship between the electronic device and the user. When the at least partly different audio data is output through each of the plurality of speakers, the processor filters the at least partly different audio data to prevent a crosstalk phenomenon in which the at least partly different audio data interferes with each other. (Example: XTC filter) can be applied.
동작 607에서, 상기 프로세서는 상기 필터가 적용된 적어도 일부가 다른 오디오 데이터를 상기 복수 개의 스피커들을 통해 출력함으로써, 상기 기설정된 영역 내에 위치한 사용자에게 스테레오 사운드를 제공할 수 있다.In operation 607, the processor may provide stereo sound to a user located in the preset area by outputting audio data to which at least a portion of which the filter is applied is different through the plurality of speakers.
일 실시예에 따르면, 상기 프로세서는 상기 특정된 전자 장치와 사용자 간의 위치 관계에 기반하여 스테레오 사운드를 재구성할 수 있다. 예컨대, 상기 프로세서는 상기 특정된 전자 장치와 사용자 간의 위치 관계에 기반하여 상기 복수 개의 스피커들을 통해 출력되는 적어도 일부가 다른 오디오 데이터를 재구성할 수 있다.According to an embodiment, the processor may reconstruct the stereo sound based on the specified positional relationship between the electronic device and the user. For example, the processor may reconstruct audio data that is at least partially different from the audio data output through the plurality of speakers based on the specified positional relationship between the electronic device and the user.
도 7은 본 발명의 일 실시예에 따른, 전자 장치와 사용자 간의 위치 관계에 기반하여 오디오 데이터를 선택적으로 출력하는 방법에 관한 도면이다.7 is a diagram illustrating a method of selectively outputting audio data based on a positional relationship between an electronic device and a user, according to an embodiment of the present invention.
동작 701에서 프로세서(예: 프로세서(206))는 복수 개의 마이크들(예: 복수 개의 마이크들(201)) 각각을 통해 사용자의 음성을 수신할 수 있다.In operation 701, the processor (eg, the processor 206) may receive the user's voice through each of the plurality of microphones (eg, the plurality of microphones 201).
동작 702에서 상기 프로세서는 카메라(예: 카메라(204))로부터 오브젝트(예: 사용자)가 촬영된 영상을 획득할 수 있다.In operation 702, the processor may obtain an image of an object (eg, a user) from a camera (eg, the camera 204).
동작 703에서 상기 프로세서는 상기 복수 개의 마이크들 각각을 통해 수신된 음성의 수신 시간 차이 및 상기 카메라를 통해 획득한 영상에 기반하여 상기 전자 장치와 상기 사용자의 위치 관계를 판단할 수 있다. 예를 들어, 상기 프로세서는 상기 복수 개의 마이크들 각각을 통해 수신된 음성 신호의 수신 시간을 교차 상관 관계를 기반으로 비교하여 수신된 음성의 수신 시간 차이를 확인할 수 있다. 또한, 상기 프로세서는 촬영된 영상에서 상기 사용자에 대응하는 오브젝트의 위치 값을 획득할 수 있다. 상기 프로세서는 상기 사용자에 대응하는 오브젝트의 위치 값과 수신된 음성의 수신 시간 차이를 기반으로 전자 장치와 사용자 간의 위치 관계를 판단할 수 있다.In operation 703, the processor may determine a positional relationship between the electronic device and the user based on a difference in reception time of a voice received through each of the plurality of microphones and an image acquired through the camera. For example, the processor may determine a difference in reception time of the received voice by comparing the reception times of the voice signals received through each of the plurality of microphones based on the cross-correlation. Also, the processor may obtain a position value of an object corresponding to the user in the captured image. The processor may determine the positional relationship between the electronic device and the user based on a difference between the position value of the object corresponding to the user and the reception time of the received voice.
이를 보다 상세히 하면, 동작 703에서 상기 프로세서는 동작 701에서 복수 개의 마이크들 각각으로 수신된 음성의 수신 시간 차이에 기반하여, 상기 전자 장치와 사용자 간의 위치 관계를 대략적으로 판단할 수 있다. 예컨대, 음성의 수신 시간 차이에 기반하여 판단된 상기 전자 장치와 사용자 간의 위치 관계는 상기 전자 장치와 상기 사용자 간의 거리 및 방향에 대한 정보를 포함할 수 있다. 여기서 상기 전자 장치와 상기 사용자 간의 방향은 어느 한 방향으로 특정되지 않을 수 있기 때문에, 상기 프로세서는 상기 카메라를 통해 사용자를 촬영한 영상에서 상기 사용자에 대응하는 오브젝트의 위치 값을 확인하여, 상기 전자 장치와 상기 사용자 간의 방향을 어느 한 방향으로 특정할 수 있다.In more detail, in operation 703 , the processor may roughly determine a positional relationship between the electronic device and the user based on a difference in reception time of the voice received through each of the plurality of microphones in operation 701 . For example, the positional relationship between the electronic device and the user determined based on the difference in the reception time of the voice may include information on the distance and the direction between the electronic device and the user. Here, since the direction between the electronic device and the user may not be specified in any one direction, the processor checks the position value of the object corresponding to the user in the image captured by the user through the camera, and the electronic device and a direction between the user and the user may be specified in any one direction.
동작 704에서 상기 프로세서는 상기 판단된 위치 관계에 기반하여 복수 개의 스피커들 각각을 통해 출력하는 오디오 데이터를 결정할 수 있다. 일 실시예에 따르면, 상기 판단된 위치 관계에 기반하여, 상기 사용자가 상기 복수 개의 스피커들의 배치 위치에 따른 기설정된 영역 내부에 위치한 경우, 상기 프로세서는 복수 개의 스피커들 각각을 통해 적어도 일부가 다른 오디오 데이터를 출력하여 사용자에게 스테레오 사운드를 제공할 수 있다. 일 실시예에 따르면, 사용자가 상기 기설정된 영역 내부에 위치하고 있지 않는 경우, 상기 프로세서는 상기 복수 개의 스피커들 각각을 통해 동일한 오디오 데이터를 출력하여 사용자에게 모노 사운드를 제공할 수 있다.In operation 704, the processor may determine audio data to be output through each of the plurality of speakers based on the determined positional relationship. According to an embodiment, when the user is located inside a preset area according to the arrangement positions of the plurality of speakers based on the determined positional relationship, the processor may at least partially use different audio By outputting data, stereo sound can be provided to the user. According to an embodiment, when the user is not located inside the preset area, the processor may output the same audio data through each of the plurality of speakers to provide a mono sound to the user.
도 8은 본 발명의 일 실시예에 따른, 전자 장치와 사용자 간의 위치 관계에 기반하여 오디오 데이터를 선택적으로 출력하는 다른 방법에 관한 도면이다.8 is a diagram illustrating another method of selectively outputting audio data based on a positional relationship between an electronic device and a user, according to an embodiment of the present invention.
도 8에서의 복수 개의 마이크들(예: 복수 개의 마이크들(201))은 적어도 3개 이상의 마이크들을 포함할 수 있다. 동작 801에서 프로세서(예: 프로세서(206))는 복수 개의 마이크들(예: 복수 개의 마이크들(201)) 각각을 통해 사용자의 음성을 수신할 수 있다.The plurality of microphones (eg, the plurality of microphones 201 ) in FIG. 8 may include at least three or more microphones. In operation 801, the processor (eg, the processor 206) may receive the user's voice through each of the plurality of microphones (eg, the plurality of microphones 201).
동작 803에서, 상기 프로세서는 복수 개의 마이크들 각각을 통해 수신된 음성의 수신 시간 차이에 기반하여 전자 장치와 사용자의 위치 관계를 판단할 수 있다. 예를 들어, 상기 프로세서는 상기 복수 개의 마이크들 각각을 통해 수신된 음성의 수신 시간 차이를 삼변 측량하여, 전자 장치와 사용자 간의 위치 관계를 판단할 수 있다. 일 실시예에 따르면, 상기 프로세서는 상기 복수 개의 마이크들 각각을 통해 수신된 음성 신호의 시간을 교차 상관 관계에 기반하여 비교하여, 수신된 음성의 수신 시간 차이를 확인할 수 있다.In operation 803, the processor may determine a positional relationship between the electronic device and the user based on a difference in reception time of a voice received through each of the plurality of microphones. For example, the processor may determine a positional relationship between the electronic device and the user by trilaterating the reception time difference of the voice received through each of the plurality of microphones. According to an embodiment, the processor compares the time of the voice signal received through each of the plurality of microphones based on the cross-correlation to determine the difference in the reception time of the received voice.
동작 805에서 상기 프로세서는 상기 판단된 위치 관계에 기반하여, 복수 개의 스피커들(예: 복수 개의 스피커들(202))을 통해 출력되는 오디오 데이터를 결정 및 출력할 수 있다. 일 예로, 사용자가 상기 복수 개의 스피커들의 배치 위치에 따른 기설정된 영역 내부에 위치하는 경우, 적어도 일부가 다른 오디오 데이터를 상기 복수 개의 스피커들 각각을 통해 출력하여 사용자에게 스테레오 사운드를 제공할 수 있다. 다른 예로, 사용자가 기설정된 영역 내부에 위치하지 않는 경우, 상기 프로세서는 상기 복수 개의 스피커들 각각을 통해 동일한 오디오 데이터를 출력하여 사용자에게 모노 사운드를 제공할 수 있다.In operation 805, the processor may determine and output audio data output through a plurality of speakers (eg, a plurality of speakers 202) based on the determined positional relationship. For example, when the user is located in a predetermined area according to the arrangement position of the plurality of speakers, at least a part of different audio data may be output through each of the plurality of speakers to provide stereo sound to the user. As another example, when the user is not located in the preset area, the processor may output the same audio data through each of the plurality of speakers to provide a mono sound to the user.
상술한 바와 같이, 다양한 실시예에 따르면, 전자 장치(예: 전자 장치(200))의 오디오 데이터의 출력 방법은, 상기 전자 장치에 포함된 복수 개의 마이크들(예: 제1 마이크(201a) 및 제2 마이크(201b)) 각각을 통해, 사용자의 음성을 수신하는 동작, 상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 차이를 기반으로, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하는 동작, 상기 전자 장치에 포함된 센서(예: 센서(203))를 통해 측정된 센서 정보에 기반하여, 상기 전자 장치의 자세를 판단하는 동작, 및 상기 판단된 위치 관계 및 상기 판단된 전자 장치의 자세에 기반하여, 상기 전자 장치에 포함된 상기 복수 개의 스피커들(예: 제1 스피커(202a) 및 제2 스피커(202b))을를 통해 출력하는 오디오 데이터를 결정하는 동작을 포함할 수 있다.As described above, according to various embodiments, a method of outputting audio data of an electronic device (eg, the electronic device 200) includes a plurality of microphones (eg, the first microphone 201a) included in the electronic device and A positional relationship between the electronic device and the user based on an operation of receiving a user's voice through each of the second microphones 201b) and a difference in reception time of the user's voice received through each of the plurality of microphones an operation of determining a posture of the electronic device based on sensor information measured through a sensor (eg, sensor 203) included in the electronic device, an operation of determining the posture of the electronic device, and the determined positional relationship and the determined determining the audio data to be output through the plurality of speakers (eg, the first speaker 202a and the second speaker 202b) included in the electronic device based on the posture of the electronic device have.
다양한 실시예에 따르면, 상기 오디오 데이터를 결정하는 동작은, 상기 판단된 위치 관계 및 상기 판단된 전자 장치의 자세에 기반하여, 상기 사용자가 기설정된 영역 내에 위치하는지를 판단하는 동작, 상기 사용자가 상기 기설정된 영역 내에 위치하지 않는다고 판단된 경우, 상기 복수 개의 스피커들 각각을 통해 동일한 오디오 데이터를 출력하는 동작, 및 상기 사용자가 상기 기설정된 영역 내에 위치한다고 판단된 경우, 상기 복수 개의 스피커들 각각을 통해 적어도 일부가 다른 오디오 데이터를 출력하는 동작을 포함할 수 있다.According to various embodiments, the determining of the audio data may include determining whether the user is located within a preset area based on the determined positional relationship and the determined posture of the electronic device; outputting the same audio data through each of the plurality of speakers when it is determined that the user is not located within the preset area; and when it is determined that the user is located within the preset area, at least through each of the plurality of speakers Some may include an operation of outputting other audio data.
다양한 실시예에 따르면, 상기 오디오 데이터의 출력 방법은, 상기 복수 개의 스피커들이 상기 전자 장치에 배치되는 위치에 기반하여 상기 기설정된 영역을 설정하는 동작을 더 포함할 수 있다.According to various embodiments of the present disclosure, the method of outputting the audio data may further include setting the preset region based on a position where the plurality of speakers are arranged in the electronic device.
다양한 실시예에 따르면, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하는 동작은, 상기 전자 장치에 포함된 카메라(예: 카메라(204))를 통해 촬영된 영상 및 상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 차이를 기반으로, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하는 동작을 포함할 수 있다.According to various embodiments, the determining of the positional relationship between the electronic device and the user may include using an image captured by a camera (eg, camera 204 ) included in the electronic device and each of the plurality of microphones. and determining a positional relationship between the electronic device and the user based on a difference in reception time of the received user's voice.
다양한 실시예에 따르면, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하는 동작은, 상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 및 상기 전자 장치에 포함된 적어도 하나의 다른 마이크를 통해 수신된 상기 사용자의 음성의 수신 시간에 기반하여, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하는 동작을 포함할 수 있다.According to various embodiments, the determining of the positional relationship between the electronic device and the user may include a reception time of the user's voice received through each of the plurality of microphones and at least one other microphone included in the electronic device. and determining a positional relationship between the electronic device and the user based on the reception time of the user's voice received through the .
다양한 실시예에 따르면, 상기 오디오 데이터의 출력 방법은, 상기 전자 장치에 포함된 필터를 통해 상기 복수 개의 스피커들 각각을 통해 출력되는 상기 오디오 데이터 간에 발생하는 크로스 토크 현상을 방지하는 동작을 더 포함할 수 있다.According to various embodiments, the method of outputting the audio data may further include preventing a crosstalk phenomenon occurring between the audio data output through each of the plurality of speakers through a filter included in the electronic device. can
다양한 실시예에 따르면, 상기 오디오 데이터를 결정하는 동작은, 상기 사용자의 음성의 수신 시간 차이를 나타내는 값이 미리 설정된 제 1 임계 값보다 크거나 같은 경우, 상기 복수 개의 스피커들 각각을 통해 출력하는 오디오 데이터를 동일한 오디오 데이터로 결정하는 동작, 및 상기 사용자의 음성의 수신 시간 차이를 나타내는 값이 상기 제 1 임계 값보다 작은 경우, 상기 복수 개의 스피커들 각각을 통해 출력하는 오디오 데이터를 적어도 일부가 다른 오디오 데이터로 결정하는 동작을 포함할 수 있다.According to various embodiments, the determining of the audio data may include, when a value representing a difference in reception time of the user's voice is greater than or equal to a preset first threshold value, audio outputted through each of the plurality of speakers Determining data as the same audio data, and when a value indicating a difference in reception time of the user's voice is less than the first threshold value, at least partially different audio data output through each of the plurality of speakers It may include an operation to determine with data.
다양한 실시예에 따르면, 상기 전자 장치의 자세를 판단하는 동작은, 상기 센서 정보에 기반하여 상기 전자 장치의 각도를 산출하는 동작을 포함하고, 상기 오디오 데이터를 결정하는 동작은, 상기 산출된 전자 장치의 각도가 미리 설정된 제 2 임계 값보다 크거나 같은 경우, 상기 복수 개의 스피커들 각각을 통해 출력하는 오디오 데이터를 동일한 오디오 데이터로 결정하는 동작, 및 상기 산출된 전자 장치의 각도가 상기 제 2 임계 값보다 작은 경우, 상기 복수 개의 스피커들 각각을 통해 출력하는 오디오 데이터를 적어도 일부가 다른 오디오 데이터로 결정하는 동작을 포함할 수 있다.According to various embodiments, the determining of the posture of the electronic device includes calculating the angle of the electronic device based on the sensor information, and the determining of the audio data includes the calculated electronic device determining that the audio data output through each of the plurality of speakers is the same audio data when the angle of is greater than or equal to a preset second threshold value, and the calculated angle of the electronic device is the second threshold value In a smaller case, the method may include determining, at least in part, audio data output through each of the plurality of speakers as different audio data.
다양한 실시예에 따르면, 상기 오디오 데이터의 출력 방법은, 상기 전자 장치의 카메라를 통해 촬영된 영상을 획득하는 동작, 상기 영상에서 상기 사용자에 대응하는 오브젝트의 위치 값을 획득하는 동작, 및 상기 판단된 위치 관계, 상기 판단된 전자 장치의 자세 및 상기 오브젝트의 위치 값에 기반하여 상기 결정된 오디오 데이터를 재구성하는 동작을 더 포함할 수 있다.According to various embodiments of the present disclosure, the method of outputting the audio data includes an operation of acquiring an image photographed through a camera of the electronic device, an operation of acquiring a position value of an object corresponding to the user from the image, and the determined The method may further include reconstructing the determined audio data based on the positional relationship, the determined posture of the electronic device, and the position value of the object.
도 9는 본 발명의 일 실시예에 따른, 복수 개의 스피커들(예: 복수 개의 스피커들(202))의 배치 위치에 따른 기설정된 영역을 설명하기 위한 도면이다.9 is a view for explaining a preset area according to an arrangement position of a plurality of speakers (eg, a plurality of speakers 202) according to an embodiment of the present invention.
일 실시예에 따르면, 프로세서(예: 프로세서(206))는 상기 복수 개의 스피커들이 전자 장치(예: 전자 장치(200))에 배치되는 위치에 기반하여 기설정된 영역을 설정할 수 있다. 상기 기설정된 영역은 전자 장치 상에 배치되는 상기 복수 개의 스피커들의 위치에 따라 설정되는 영역으로, 사용자에게 스테레오 사운드를 제공하여 최상의 음질을 제공하는 스위트 스팟(sweet spot)을 포함할 수 있다.According to an embodiment, the processor (eg, the processor 206 ) may set a preset area based on a location where the plurality of speakers are disposed in the electronic device (eg, the electronic device 200 ). The preset area is an area set according to the positions of the plurality of speakers disposed on the electronic device, and may include a sweet spot that provides stereo sound to the user and provides the best sound quality.
도 9를 참조하면, 제 1 영역 및 제 3 영역은 상기 전자 장치의 상부에 위치한 제 1 스피커(901) 및 하부에 위치한 제 2 스피커(902)의 위치에 따라 기설정된 영역으로, 상기 제 1 스피커(901) 및 상기 제 2 스피커(902)를 통해 스테레오 사운드를 제공할 때, 상기 제 1 영역 또는 상기 제 3 영역에서 상기 스테레오 사운드를 효과적으로 청취할 수 있다. 이에 따라, 상기 프로세서는 제 1 영역 및 제 3 영역 내부에 사용자가 위치하는 경우, 복수 개의 스피커들을 통해 적어도 일부가 다른 오디오 데이터를 출력하여 사용자에게 스테레오 사운드를 제공할 수 있다. Referring to FIG. 9 , the first area and the third area are preset areas according to the positions of the first speaker 901 located above the electronic device and the second speaker 902 located below the electronic device. When stereo sound is provided through 901 and the second speaker 902, the stereo sound can be effectively heard in the first area or the third area. Accordingly, when the user is located in the first area and the third area, the processor may provide stereo sound to the user by outputting at least partially different audio data through a plurality of speakers.
일 실시예에 따르면, 사용자가 제 2 영역 및 제 4 영역에 위치한 경우, 상기 프로세서는 상부에 위치한 제 1 스피커(901) 및 하부에 위치한 제 2 스피커(902)를 통해 동일한 오디오 데이터를 출력하여 사용자에게 모노 사운드를 제공할 수 있다.According to an embodiment, when the user is located in the second area and the fourth area, the processor outputs the same audio data through the first speaker 901 located above and the second speaker 902 located below the user. can provide mono sound.
본 발명의 다양한 실시예에 따른, 전자 장치(예: 전자 장치(200))에 복수 개의 스피커들이 전자 장치의 상부, 하부, 양측부에 각각 배치되어 있을 경우, 상기 프로세서는 전자 장치와 사용자의 위치 관계에 기반하여, 복수 개의 마이크들 중 적어도 두 개 이상을 선택하여 사용자에게 스테레오 사운드를 제공할 수 있다. 일 예로, 사용자가 제 1 영역(또는 제 3 영역)에 위치할 경우, 상기 프로세서는 상기 복수 개의 스피커들 중 상기 제 1 영역(또는 제 3 영역)에 위치한 사용자에게 스테레오 사운드를 제공할 수 있는 적어도 두 개 이상의 스피커들을 선택할 수 있다. 예컨대, 상기 프로세서는 상기 전자 장치의 상부 및 하부에 배치된 제 1 스피커(901) 및 제 2 스피커(902)를 통해 적어도 일부가 다른 오디오 데이터를 출력하여 스테레오 사운드를 상기 제 1 영역(또는 제 3 영역)에 위치한 사용자에게 제공할 수 있다. 다른 예로, 사용자가 제 2 영역(또는 제 4 영역)에 위치할 경우, 상기 프로세서는 상기 복수 개의 스피커들 중 상기 제 2 영역(또는 제 4 영역)에 위치한 사용자에게 스테레오 사운드를 제공할 수 있는 적어도 두 개 이상의 스피커들을 선택할 수 있다. 예컨대, 상기 프로세서는 상기 전자 장치의 양측부에 배치된 제 3 스피커(미도시) 및 제 4 스피커(미도시)를 통해 적어도 일부가 다른 오디오 데이터를 출력하여 스테레오 사운드를 상기 제 2 영역(또는 제 4 영역)에 위치한 사용자에게 제공할 수 있다.According to various embodiments of the present disclosure, when a plurality of speakers are respectively disposed on upper, lower, and both sides of an electronic device (eg, the electronic device 200), the processor determines the positions of the electronic device and the user. Based on the relationship, at least two or more of the plurality of microphones may be selected to provide stereo sound to the user. For example, when the user is located in the first area (or the third area), the processor is at least capable of providing stereo sound to the user located in the first area (or the third area) among the plurality of speakers. More than one speaker can be selected. For example, the processor outputs stereo sound to the first region (or the third region) by outputting at least partially different audio data through the first and second speakers 901 and 902 disposed above and below the electronic device. area) can be provided to users located in As another example, when the user is located in the second area (or fourth area), the processor may provide at least stereo sound to the user located in the second area (or fourth area) among the plurality of speakers. More than one speaker can be selected. For example, the processor outputs stereo sound to the second region (or the second region) by outputting at least partially different audio data through a third speaker (not shown) and a fourth speaker (not shown) disposed on both sides of the electronic device. It can be provided to users located in area 4).
본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치(예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.The electronic device according to various embodiments disclosed in this document may have various types of devices. The electronic device may include, for example, a portable communication device (eg, a smart phone), a computer device, a portable multimedia device, a portable medical device, a camera, a wearable device, or a home appliance device. The electronic device according to the embodiment of the present document is not limited to the above-described devices.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나", "A, B 또는 C", "A, B 및 C 중 적어도 하나", 및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제1", "제2", 또는 "첫째", "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제1) 구성요소가 다른(예: 제2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.It should be understood that the various embodiments of this document and the terms used therein are not intended to limit the technical features described in this document to specific embodiments, and include various modifications, equivalents, or substitutions of the embodiments. In connection with the description of the drawings, like reference numerals may be used for similar or related components. The singular form of the noun corresponding to the item may include one or more of the item, unless the relevant context clearly dictates otherwise. As used herein, "A or B", "at least one of A and B", "at least one of A or B", "A, B or C", "at least one of A, B and C", and "A , B, or C" each may include any one of, or all possible combinations of, items listed together in the corresponding one of the phrases. Terms such as "first", "second", or "first", "second" may simply be used to distinguish the element from other elements in question, and may refer to elements in other aspects (e.g., importance or order) is not limited. It is said that one (eg, first) component is "coupled" or "connected" to another (eg, second) component, with or without the terms "functionally" or "communicatively". When referenced, it means that one component can be connected to the other component directly (eg by wire), wirelessly, or through a third component.
본 문서에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로 등의 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일 실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.As used herein, the term “module” may include a unit implemented in hardware, software, or firmware, and may be used interchangeably with terms such as, for example, logic, logic block, component, or circuit. A module may be an integrally formed part or a minimum unit or a part of the part that performs one or more functions. For example, according to an embodiment, the module may be implemented in the form of an application-specific integrated circuit (ASIC).
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(101))에 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(136) 또는 외장 메모리(138))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(140))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(101))의 프로세서(예: 프로세서(120))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장 매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.Various embodiments of the present document include one or more stored in a storage medium (eg, the internal memory 136 or the external memory 138) readable by a machine (eg, the electronic device 101). It may be implemented as software (eg, program 140) including instructions. For example, the processor (eg, the processor 120 ) of the device (eg, the electronic device 101 ) may call at least one of one or more instructions stored from a storage medium and execute it. This makes it possible for the device to be operated to perform at least one function according to the at least one command called. The one or more instructions may include code generated by a compiler or code executable by an interpreter. The device-readable storage medium may be provided in the form of a non-transitory storage medium. Here, 'non-transitory' only means that the storage medium is a tangible device and does not contain a signal (eg, electromagnetic wave), and this term refers to the case where data is semi-permanently stored in the storage medium and It does not distinguish between temporary storage cases.
일 실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory(CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두개의 사용자 장치들(예: 스마트폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.According to one embodiment, the method according to various embodiments disclosed in this document may be provided as included in a computer program product. Computer program products may be traded between sellers and buyers as commodities. The computer program product is distributed in the form of a device-readable storage medium (eg compact disc read only memory (CD-ROM)), or via an application store (eg Play Store TM ) or on two user devices ( It can be distributed (eg downloaded or uploaded) directly, online between smartphones (eg: smartphones). In the case of online distribution, at least a part of the computer program product may be temporarily stored or temporarily created in a machine-readable storage medium such as a memory of a server of a manufacturer, a server of an application store, or a relay server.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.According to various embodiments, each component (eg, a module or a program) of the above-described components may include a singular or a plurality of entities. According to various embodiments, one or more components or operations among the above-described corresponding components may be omitted, or one or more other components or operations may be added. Alternatively or additionally, a plurality of components (eg, a module or a program) may be integrated into one component. In this case, the integrated component may perform one or more functions of each component of the plurality of components identically or similarly to those performed by the corresponding component among the plurality of components prior to the integration. . According to various embodiments, operations performed by a module, program, or other component are executed sequentially, in parallel, repeatedly, or heuristically, or one or more of the operations are executed in a different order, or omitted. or one or more other operations may be added.

Claims (15)

  1. 전자 장치에 있어서,In an electronic device,
    복수 개의 마이크들;a plurality of microphones;
    복수 개의 스피커들;a plurality of speakers;
    센서;sensor;
    메모리; 및Memory; and
    상기 복수 개의 마이크들, 상기 복수 개의 스피커들, 상기 센서 및 상기 메모리와 작동적으로 연결된 프로세서를 포함하고,a processor operatively coupled to the plurality of microphones, the plurality of speakers, the sensor, and the memory;
    상기 프로세서는,The processor is
    상기 복수 개의 마이크들 각각을 통해, 사용자의 음성을 수신하고,Receive a user's voice through each of the plurality of microphones,
    상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 차이를 기반으로, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하고,determining a positional relationship between the electronic device and the user based on a difference in reception time of the user's voice received through each of the plurality of microphones;
    상기 센서를 통해 측정된 센서 정보에 기반하여, 상기 전자 장치의 자세를 판단하고,determining the posture of the electronic device based on the sensor information measured through the sensor,
    상기 판단된 위치 관계 및 상기 판단된 전자 장치의 자세에 기반하여, 상기 전자 장치에 포함된 상기 복수 개의 스피커들을 통해 출력하는 오디오 데이터를 결정하도록 설정된 전자 장치.an electronic device configured to determine audio data output through the plurality of speakers included in the electronic device based on the determined positional relationship and the determined posture of the electronic device.
  2. 청구항 1에 있어서,The method according to claim 1,
    상기 프로세서는,The processor is
    상기 판단된 위치 관계 및 상기 판단된 전자 장치의 자세에 기반하여, 상기 사용자가 기설정된 영역 내에 위치하는지를 판단하고,determining whether the user is located within a preset area based on the determined positional relationship and the determined posture of the electronic device;
    상기 사용자가 상기 기설정된 영역 내에 위치하지 않는다고 판단된 경우, 상기 복수 개의 스피커들 각각을 통해 동일한 오디오 데이터를 출력하고,When it is determined that the user is not located within the preset area, the same audio data is output through each of the plurality of speakers,
    상기 사용자가 상기 기설정된 영역 내에 위치한다고 판단된 경우, 상기 복수 개의 스피커들 각각을 통해 적어도 일부가 다른 오디오 데이터를 출력하도록 설정된 전자 장치.An electronic device configured to output at least partially different audio data through each of the plurality of speakers when it is determined that the user is located within the preset area.
  3. 청구항 2에 있어서,3. The method according to claim 2,
    상기 프로세서는,The processor is
    상기 복수 개의 스피커들이 상기 전자 장치에 배치되는 위치에 기반하여 상기 기설정된 영역을 설정하는 전자 장치.An electronic device configured to set the preset area based on positions where the plurality of speakers are disposed in the electronic device.
  4. 청구항 1에 있어서,The method according to claim 1,
    카메라를 더 포함하고,further including a camera,
    상기 프로세서는,The processor is
    상기 카메라를 통해 촬영된 영상 및 상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 차이를 기반으로, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하도록 설정된 전자 장치.An electronic device configured to determine a positional relationship between the electronic device and the user based on a difference in reception time between the image captured by the camera and the user's voice received through each of the plurality of microphones.
  5. 청구항 1에 있어서,The method according to claim 1,
    적어도 하나의 다른 마이크를 더 포함하고,at least one other microphone,
    상기 프로세서는,The processor is
    상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 및 상기 적어도 하나의 다른 마이크를 통해 수신된 상기 사용자의 음성의 수신 시간에 기반하여, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하도록 설정된 전자 장치.Based on the reception time of the user's voice received through each of the plurality of microphones and the reception time of the user's voice received through the at least one other microphone, a positional relationship between the electronic device and the user is determined An electronic device set up to do so.
  6. 청구항 1에 있어서,The method according to claim 1,
    상기 복수 개의 스피커들 각각을 통해 출력되는 상기 오디오 데이터 간에 발생하는 크로스 토크(crosstalk) 현상을 방지하는 필터를 더 포함하는 전자 장치.and a filter for preventing a crosstalk phenomenon occurring between the audio data output through each of the plurality of speakers.
  7. 청구항 1에 있어서,The method according to claim 1,
    상기 프로세서는,The processor is
    상기 사용자의 음성의 수신 시간 차이를 나타내는 값이 미리 설정된 제 1 임계 값보다 크거나 같은 경우, 상기 복수 개의 스피커들 각각을 통해 동일한 오디오 데이터를 출력하고,outputting the same audio data through each of the plurality of speakers when the value representing the difference in the reception time of the user's voice is greater than or equal to a preset first threshold value;
    상기 사용자의 음성의 수신 시간 차이를 나타내는 값이 상기 제 1 임계 값보다 작은 경우, 상기 복수 개의 스피커들 각각을 통해 적어도 일부가 다른 오디오 데이터를 출력하도록 설정된 전자 장치.The electronic device is configured to output at least partially different audio data through each of the plurality of speakers when the value indicating the difference in reception time of the user's voice is smaller than the first threshold value.
  8. 청구항 1에 있어서,The method according to claim 1,
    상기 프로세서는,The processor is
    상기 센서 정보에 기반하여 상기 전자 장치의 각도를 산출하고,calculating the angle of the electronic device based on the sensor information,
    상기 산출된 전자 장치의 각도가 미리 설정된 제 2 임계 값보다 크거나 같은 경우, 상기 복수 개의 스피커들 각각을 통해 동일한 오디오 데이터를 출력하고,outputting the same audio data through each of the plurality of speakers when the calculated angle of the electronic device is greater than or equal to a preset second threshold value;
    상기 산출된 전자 장치의 각도가 상기 제 2 임계 값보다 작은 경우, 상기 복수 개의 스피커들 각각을 통해 적어도 일부가 다른 오디오 데이터를 출력하도록 설정된 전자 장치.an electronic device configured to output at least partially different audio data through each of the plurality of speakers when the calculated angle of the electronic device is smaller than the second threshold value.
  9. 청구항 1에 있어서,The method according to claim 1,
    카메라를 더 포함하고,further including a camera,
    상기 프로세서는,The processor is
    상기 카메라를 통해 촬영된 영상을 획득하고,Obtaining an image taken through the camera,
    상기 영상에서 상기 사용자에 대응하는 오브젝트의 위치 값을 획득하고,obtaining a position value of an object corresponding to the user in the image,
    상기 판단된 위치 관계, 상기 판단된 전자 장치의 자세 및 상기 오브젝트의 위치 값에 기반하여 상기 결정된 오디오 데이터를 재구성하도록 설정된 전자 장치.The electronic device is configured to reconstruct the determined audio data based on the determined positional relationship, the determined posture of the electronic device, and the position value of the object.
  10. 전자 장치의 오디오 데이터의 출력 방법에 있어서,A method of outputting audio data from an electronic device, the method comprising:
    상기 전자 장치에 포함된 복수 개의 마이크들 각각을 통해, 사용자의 음성을 수신하는 동작;receiving a user's voice through each of the plurality of microphones included in the electronic device;
    상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 차이를 기반으로, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하는 동작;determining a positional relationship between the electronic device and the user based on a difference in reception time of the user's voice received through each of the plurality of microphones;
    상기 전자 장치에 포함된 센서를 통해 측정된 센서 정보에 기반하여, 상기 전자 장치의 자세를 판단하는 동작; 및determining a posture of the electronic device based on sensor information measured through a sensor included in the electronic device; and
    상기 판단된 위치 관계 및 상기 판단된 전자 장치의 자세에 기반하여, 상기 전자 장치에 포함된 상기 복수 개의 스피커들을 통해 출력하는 오디오 데이터를 결정하는 동작을 포함하는 오디오 데이터의 출력 방법.and determining audio data to be output through the plurality of speakers included in the electronic device based on the determined positional relationship and the determined posture of the electronic device.
  11. 청구항 10에 있어서,11. The method of claim 10,
    상기 오디오 데이터를 결정하는 동작은,The operation of determining the audio data includes:
    상기 판단된 위치 관계 및 상기 판단된 전자 장치의 자세에 기반하여, 상기 사용자가 기설정된 영역 내에 위치하는지를 판단하는 동작;determining whether the user is located in a preset area based on the determined positional relationship and the determined posture of the electronic device;
    상기 사용자가 상기 기설정된 영역 내에 위치하지 않는다고 판단된 경우, 상기 복수 개의 스피커들 각각을 통해 동일한 오디오 데이터를 출력하는 동작; 및outputting the same audio data through each of the plurality of speakers when it is determined that the user is not located within the preset area; and
    상기 사용자가 상기 기설정된 영역 내에 위치한다고 판단된 경우, 상기 복수 개의 스피커들 각각을 통해 적어도 일부가 다른 오디오 데이터를 출력하는 동작을 포함하는 오디오 데이터의 출력 방법.and outputting at least partially different audio data through each of the plurality of speakers when it is determined that the user is located within the preset area.
  12. 청구항 11에 있어서,12. The method of claim 11,
    상기 복수 개의 스피커들이 상기 전자 장치에 배치되는 위치에 기반하여 상기 기설정된 영역을 설정하는 동작을 더 포함하는 오디오 데이터의 출력 방법.The method of outputting audio data further comprising the operation of setting the preset area based on positions where the plurality of speakers are arranged in the electronic device.
  13. 청구항 10에 있어서,11. The method of claim 10,
    상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하는 동작은,The operation of determining the positional relationship between the electronic device and the user includes:
    상기 전자 장치에 포함된 카메라를 통해 촬영된 영상 및 상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 차이를 기반으로, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하는 동작을 포함하는 오디오 데이터의 출력 방법.and determining a positional relationship between the electronic device and the user based on a difference in reception time between an image captured by a camera included in the electronic device and the user's voice received through each of the plurality of microphones How to output audio data.
  14. 전자 장치에 있어서,In an electronic device,
    복수 개의 마이크들;a plurality of microphones;
    복수 개의 스피커들;a plurality of speakers;
    카메라;camera;
    메모리; 및Memory; and
    상기 복수 개의 마이크들, 상기 복수 개의 스피커들, 상기 카메라 및 상기 메모리와 작동적으로 연결된 프로세서를 포함하고,a processor operatively coupled to the plurality of microphones, the plurality of speakers, the camera, and the memory;
    상기 프로세서는,The processor is
    상기 복수 개의 마이크들 각각을 통해 사용자의 음성을 수신하고,Receive a user's voice through each of the plurality of microphones,
    상기 카메라를 통해 촬영된 영상을 획득하고,Obtaining an image taken through the camera,
    상기 영상에서 상기 사용자에 대응하는 오브젝트의 위치 값을 획득하고,obtaining a position value of an object corresponding to the user in the image,
    상기 복수 개의 마이크들 각각을 통해 수신된 상기 사용자의 음성의 수신 시간 차이 및 상기 오브젝트의 위치 값을 기반으로, 상기 전자 장치와 상기 사용자 간의 위치 관계를 판단하고,determining a positional relationship between the electronic device and the user based on a difference in reception time of the user's voice received through each of the plurality of microphones and a position value of the object,
    상기 판단된 위치 관계에 기반하여, 상기 복수 개의 스피커들을 통해 출력하는 상기 오디오 데이터를 결정하도록 설정된 전자 장치.The electronic device is configured to determine the audio data to be output through the plurality of speakers based on the determined positional relationship.
  15. 청구항 14에 있어서,15. The method of claim 14,
    상기 프로세서는,The processor is
    상기 판단된 위치 관계에 기반하여, 상기 복수 개의 스피커들 중 적어도 두 개를 선택하고,Based on the determined positional relationship, selecting at least two of the plurality of speakers,
    상기 선택된 적어도 두 개의 스피커들 각각을 통해 적어도 일부가 다른 오디오 데이터를 출력하도록 설정된 전자 장치.An electronic device configured to output at least a portion of different audio data through each of the selected at least two speakers.
PCT/KR2020/012910 2019-12-26 2020-09-24 Audio data output method and electronic device supporting same WO2021132852A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190175666A KR20210083059A (en) 2019-12-26 2019-12-26 Outputting method of audio data and electronic device supporting the same
KR10-2019-0175666 2019-12-26

Publications (1)

Publication Number Publication Date
WO2021132852A1 true WO2021132852A1 (en) 2021-07-01

Family

ID=76574863

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/012910 WO2021132852A1 (en) 2019-12-26 2020-09-24 Audio data output method and electronic device supporting same

Country Status (2)

Country Link
KR (1) KR20210083059A (en)
WO (1) WO2021132852A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023040515A1 (en) * 2021-09-16 2023-03-23 Oppo广东移动通信有限公司 Audio control method and audio playback device

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230023494A (en) * 2021-08-10 2023-02-17 삼성전자주식회사 Electronic device adjusting sound signal and method for controlling the same

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170022727A (en) * 2015-08-21 2017-03-02 삼성전자주식회사 Method for processing sound of electronic device and electronic device thereof
US20180204574A1 (en) * 2012-09-26 2018-07-19 Amazon Technologies, Inc. Altering Audio to Improve Automatic Speech Recognition
KR20180108878A (en) * 2013-11-22 2018-10-04 애플 인크. Handsfree beam pattern configuration
KR20180132276A (en) * 2017-06-02 2018-12-12 네이버 주식회사 Method and apparatus for providing appropriate information for location and space of user actively
KR20190119948A (en) * 2018-04-13 2019-10-23 삼성전자주식회사 Electronic device and method for processing stereo audio siginal

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180204574A1 (en) * 2012-09-26 2018-07-19 Amazon Technologies, Inc. Altering Audio to Improve Automatic Speech Recognition
KR20180108878A (en) * 2013-11-22 2018-10-04 애플 인크. Handsfree beam pattern configuration
KR20170022727A (en) * 2015-08-21 2017-03-02 삼성전자주식회사 Method for processing sound of electronic device and electronic device thereof
KR20180132276A (en) * 2017-06-02 2018-12-12 네이버 주식회사 Method and apparatus for providing appropriate information for location and space of user actively
KR20190119948A (en) * 2018-04-13 2019-10-23 삼성전자주식회사 Electronic device and method for processing stereo audio siginal

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023040515A1 (en) * 2021-09-16 2023-03-23 Oppo广东移动通信有限公司 Audio control method and audio playback device

Also Published As

Publication number Publication date
KR20210083059A (en) 2021-07-06

Similar Documents

Publication Publication Date Title
WO2020204365A1 (en) Electronic device and method for communicating with external device through power source line
WO2020204611A1 (en) Method for detecting wearing of acoustic device and acoustic device supporting the same
WO2019045394A1 (en) Electronic device for checking proximity of external object by using signal in specified frequency band, and control method of electronic device
WO2020096413A1 (en) Pop-up and rotational camera and electronic device including the same
WO2020141793A1 (en) Electronic device with foldable display and control method thereof
WO2020067639A1 (en) Electronic device for pairing with stylus pen and method thereof
WO2019221466A1 (en) Electronic device and method for transmitting information to external device for adjusting wireless power to be transmitted from external device on basis of proximity of external object
WO2021085902A1 (en) Electronic device for outputting audio data of plurality of applications, and method for operating same
WO2019208930A1 (en) Electronic device for providing wi-fi communication and mobile hotspot communication and method thereof
WO2021132852A1 (en) Audio data output method and electronic device supporting same
WO2019172518A1 (en) Apparatus and method for determining beam index of antenna array
WO2019209075A1 (en) Electronic device and method for controlling external electronic device
WO2019164079A1 (en) Method for performing biometric authentication according to display of object related to biometric authentication and electronic device therefor
WO2020153738A1 (en) Electronic device and method for connecting ground node to camera module
WO2019231296A1 (en) An electronic device and method for preventing corrosion of an audio jack
WO2020171342A1 (en) Electronic device for providing visualized artificial intelligence service on basis of information about external object, and operating method for electronic device
WO2019172610A1 (en) Electronic device and method for making payment by using audio module
WO2019172723A1 (en) Interface connected to image sensor and electronic device comprising interfaces connected among plurality of processors
WO2019151604A1 (en) Apparatus and method for performing antenna function by using usb connector
WO2021112500A1 (en) Electronic device and method for correcting image in camera switching
WO2020256318A1 (en) Electronic device and method for identifying object inserted into earphone jack
WO2020262835A1 (en) Electronic device and method for determining audio device for processing audio signal by means of same
WO2021033921A1 (en) Camera module including printed circuit board, and electronic device comprising same
WO2020130729A1 (en) Foldable electronic device for providing event-related information, and operating method therefor
WO2019203425A1 (en) Device and method for processing signal of electronic pen having changed resonant frequency

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20905729

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20905729

Country of ref document: EP

Kind code of ref document: A1