WO2022177183A1 - 오디오 데이터 처리 방법 및 이를 지원하는 전자 장치 - Google Patents
오디오 데이터 처리 방법 및 이를 지원하는 전자 장치 Download PDFInfo
- Publication number
- WO2022177183A1 WO2022177183A1 PCT/KR2022/001107 KR2022001107W WO2022177183A1 WO 2022177183 A1 WO2022177183 A1 WO 2022177183A1 KR 2022001107 W KR2022001107 W KR 2022001107W WO 2022177183 A1 WO2022177183 A1 WO 2022177183A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- electronic device
- audio data
- external electronic
- audio
- wireless communication
- Prior art date
Links
- 238000003672 processing method Methods 0.000 title description 2
- 238000004891 communication Methods 0.000 claims abstract description 130
- 230000005236 sound signal Effects 0.000 claims abstract description 75
- 230000006870 function Effects 0.000 claims abstract description 72
- 238000000034 method Methods 0.000 claims description 66
- 230000008569 process Effects 0.000 claims description 26
- 238000012544 monitoring process Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 description 35
- 238000001514 detection method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 9
- 230000003321 amplification Effects 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003155 kinesthetic effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1083—Reduction of ambient noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2460/00—Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
- H04R2460/01—Hearing devices using active noise cancellation
Definitions
- the electronic device may provide various functions to the user by using data obtained from a plurality of input devices.
- the electronic device may obtain audio data using a plurality of audio input devices (eg, a microphone, a Bluetooth receiving circuit, or a USB circuit) to provide various functions (eg, video chatting and/or media playback).
- a plurality of audio input devices eg, a microphone, a Bluetooth receiving circuit, or a USB circuit
- functions eg, video chatting and/or media playback.
- an echo and/or a howling may be formed to generate an amplified roar.
- the user may be restricted in call function due to echo and/or howling. For example, an echo phenomenon in which a user's speech input reproduced through a speaker is inputted back into a microphone may occur. When the echo phenomenon continues, it may be difficult for the electronic device to normally perform a call function due to a howling phenomenon between the microphone and the speaker.
- the electronic device may perform an echo canceling and/or a howling canceling operation by itself.
- data processing time may increase due to a performance difference between the electronic devices, and the quality of a call provided to a user may deteriorate.
- Various embodiments disclosed in this document may provide an electronic device and method for solving the above-described problems.
- An electronic device may include a wireless communication circuit, a processor, and a memory operatively connected to the processor.
- the memory may be configured such that, when executed, the processor receives first audio data from a first external electronic device through the wireless communication circuit, and at least one associated with an audio signal level based on the first audio data generates a condition of , transmits the first audio data to a second external electronic device and a third external electronic device, and receives the first audio data from the second external electronic device and the third external electronic device through the wireless communication circuit, respectively Receive second audio data and third audio data, identify audio data exceeding a threshold value included in the at least one condition among the second audio data and the third audio data, and communicate with the second external electronic device
- One of the third external electronic devices that identifies at least one external electronic device corresponding to the identified audio data and performs an echo cancellation function on audio data associated with the identified at least one external electronic device
- the above instructions may be stored.
- An electronic device for relaying audio data between a plurality of external electronic devices may include a wireless communication circuit, a processor, and a memory operatively connected to the processor.
- the processor receives first audio data from a first external electronic device through the wireless communication circuit, and uses the first audio data to set an echo level threshold. threshold), transmitting the first audio data to a second external electronic device and a third external electronic device, and an echo level of the second audio data and the third audio data exceeds the echo level threshold.
- Identifies data identifies at least one external electronic device corresponding to the identified audio data among the second external electronic device and the third external electronic device, and audio data associated with the identified at least one external electronic device
- One or more instructions for selectively performing an echo cancellation function may be stored.
- a method for an electronic device to process audio data includes receiving first audio data from a first external electronic device through the wireless communication circuit, based on the first audio data to generate at least one condition related to an audio signal level, transmitting the first audio data to a second external electronic device and a third external electronic device, and through the wireless communication circuit, the second external electronic device and receiving second audio data and third audio data, respectively, from the third external electronic device, and audio data exceeding a threshold value included in the at least one condition of the second audio data and the third audio data.
- identifying at least one external electronic device corresponding to the identified audio data from among the second external electronic device and the third external electronic device It may include an operation of performing an echo cancellation function on the associated audio data.
- An electronic device processes audio data transmitted and/or received between a plurality of electronic devices in one electronic device (eg, a server) end in a process of performing a multi-party call function. This can improve call quality.
- FIG. 1 is a block diagram of an electronic device in a network environment, according to various embodiments of the present disclosure
- FIG. 2 is a block diagram of an audio module, according to various embodiments.
- FIG. 3 is a block diagram illustrating components included in an electronic device according to an exemplary embodiment.
- FIG. 4 is a flowchart illustrating an audio data processing operation of an electronic device according to an exemplary embodiment.
- FIG. 5 is a block diagram illustrating an audio data processing process of an electronic device according to an exemplary embodiment.
- FIG. 6 is a flowchart illustrating an audio data processing operation of an electronic device according to an exemplary embodiment.
- FIG. 7 is a block diagram illustrating an audio data processing process of an electronic device according to an exemplary embodiment.
- FIG. 1 is a block diagram of an electronic device 101 in a network environment 100, according to various embodiments.
- an electronic device 101 communicates with an electronic device 102 through a first network 198 (eg, a short-range wireless communication network) or a second network 199 . It may communicate with the electronic device 104 or the server 108 through (eg, a long-distance wireless communication network). According to an embodiment, the electronic device 101 may communicate with the electronic device 104 through the server 108 .
- a first network 198 eg, a short-range wireless communication network
- a second network 199 e.g., a second network 199
- the electronic device 101 may communicate with the electronic device 104 through the server 108 .
- the electronic device 101 includes a processor 120 , a memory 130 , an input module 150 , a sound output module 155 , a display module 160 , an audio module 170 , and a sensor module ( 176), interface 177, connection terminal 178, haptic module 179, camera module 180, power management module 188, battery 189, communication module 190, subscriber identification module 196 , or an antenna module 197 .
- at least one of these components eg, the connection terminal 178
- some of these components are integrated into one component (eg, display module 160 ). can be
- the processor 120 for example, executes software (eg, a program 140) to execute at least one other component (eg, a hardware or software component) of the electronic device 101 connected to the processor 120. It can control and perform various data processing or operations. According to one embodiment, as at least part of data processing or operation, the processor 120 converts commands or data received from other components (eg, the sensor module 176 or the communication module 190 ) to the volatile memory 132 . may be stored in , process commands or data stored in the volatile memory 132 , and store the result data in the non-volatile memory 134 .
- software eg, a program 140
- the processor 120 converts commands or data received from other components (eg, the sensor module 176 or the communication module 190 ) to the volatile memory 132 .
- the volatile memory 132 may be stored in , process commands or data stored in the volatile memory 132 , and store the result data in the non-volatile memory 134 .
- the processor 120 is the main processor 121 (eg, a central processing unit or an application processor) or a secondary processor 123 (eg, a graphic processing unit, a neural network processing unit (eg, a graphic processing unit, a neural network processing unit) a neural processing unit (NPU), an image signal processor, a sensor hub processor, or a communication processor).
- the main processor 121 eg, a central processing unit or an application processor
- a secondary processor 123 eg, a graphic processing unit, a neural network processing unit (eg, a graphic processing unit, a neural network processing unit) a neural processing unit (NPU), an image signal processor, a sensor hub processor, or a communication processor.
- the main processor 121 e.g, a central processing unit or an application processor
- a secondary processor 123 eg, a graphic processing unit, a neural network processing unit (eg, a graphic processing unit, a neural network processing unit) a neural processing unit (NPU), an image signal processor, a
- the secondary processor 123 may, for example, act on behalf of the main processor 121 while the main processor 121 is in an inactive (eg, sleep) state, or when the main processor 121 is active (eg, executing an application). ), together with the main processor 121, at least one of the components of the electronic device 101 (eg, the display module 160, the sensor module 176, or the communication module 190) It is possible to control at least some of the related functions or states.
- the coprocessor 123 eg, an image signal processor or a communication processor
- may be implemented as part of another functionally related component eg, the camera module 180 or the communication module 190 ). have.
- the auxiliary processor 123 may include a hardware structure specialized for processing an artificial intelligence model.
- Artificial intelligence models can be created through machine learning. Such learning may be performed, for example, in the electronic device 101 itself on which artificial intelligence is performed, or may be performed through a separate server (eg, the server 108).
- the learning algorithm may include, for example, supervised learning, unsupervised learning, semi-supervised learning, or reinforcement learning, but in the above example not limited
- the artificial intelligence model may include a plurality of artificial neural network layers.
- Artificial neural networks include deep neural networks (DNNs), convolutional neural networks (CNNs), recurrent neural networks (RNNs), restricted boltzmann machines (RBMs), deep belief networks (DBNs), bidirectional recurrent deep neural networks (BRDNNs), It may be one of deep Q-networks or a combination of two or more of the above, but is not limited to the above example.
- the artificial intelligence model may include, in addition to, or alternatively, a software structure in addition to the hardware structure.
- the memory 130 may store various data used by at least one component (eg, the processor 120 or the sensor module 176 ) of the electronic device 101 .
- the data may include, for example, input data or output data for software (eg, the program 140 ) and instructions related thereto.
- the memory 130 may include a volatile memory 132 or a non-volatile memory 134 .
- the program 140 may be stored as software in the memory 130 , and may include, for example, an operating system 142 , middleware 144 , or an application 146 .
- the input module 150 may receive a command or data to be used by a component (eg, the processor 120 ) of the electronic device 101 from the outside (eg, a user) of the electronic device 101 .
- the input module 150 may include, for example, a microphone, a mouse, a keyboard, a key (eg, a button), or a digital pen (eg, a stylus pen).
- the sound output module 155 may output a sound signal to the outside of the electronic device 101 .
- the sound output module 155 may include, for example, a speaker or a receiver.
- the speaker can be used for general purposes such as multimedia playback or recording playback.
- the receiver can be used to receive incoming calls. According to one embodiment, the receiver may be implemented separately from or as part of the speaker.
- the display module 160 may visually provide information to the outside (eg, a user) of the electronic device 101 .
- the display module 160 may include, for example, a control circuit for controlling a display, a hologram device, or a projector and a corresponding device.
- the display module 160 may include a touch sensor configured to sense a touch or a pressure sensor configured to measure the intensity of a force generated by the touch.
- the audio module 170 may convert a sound into an electric signal or, conversely, convert an electric signal into a sound. According to an embodiment, the audio module 170 acquires a sound through the input module 150 , or an external electronic device (eg, a sound output module 155 ) connected directly or wirelessly with the electronic device 101 .
- the electronic device 102) eg, a speaker or headphones
- the electronic device 102 may output a sound.
- the sensor module 176 detects an operating state (eg, power or temperature) of the electronic device 101 or an external environmental state (eg, a user state), and generates an electrical signal or data value corresponding to the sensed state. can do.
- the sensor module 176 may include, for example, a gesture sensor, a gyro sensor, a barometric pressure sensor, a magnetic sensor, an acceleration sensor, a grip sensor, a proximity sensor, a color sensor, an IR (infrared) sensor, a biometric sensor, It may include a temperature sensor, a humidity sensor, or an illuminance sensor.
- the interface 177 may support one or more specified protocols that may be used by the electronic device 101 to directly or wirelessly connect with an external electronic device (eg, the electronic device 102 ).
- the interface 177 may include, for example, a high definition multimedia interface (HDMI), a universal serial bus (USB) interface, an SD card interface, or an audio interface.
- the connection terminal 178 may include a connector through which the electronic device 101 can be physically connected to an external electronic device (eg, the electronic device 102 ).
- the connection terminal 178 may include, for example, an HDMI connector, a USB connector, an SD card connector, or an audio connector (eg, a headphone connector).
- the haptic module 179 may convert an electrical signal into a mechanical stimulus (eg, vibration or movement) or an electrical stimulus that the user can perceive through tactile or kinesthetic sense.
- the haptic module 179 may include, for example, a motor, a piezoelectric element, or an electrical stimulation device.
- the camera module 180 may capture still images and moving images. According to an embodiment, the camera module 180 may include one or more lenses, image sensors, image signal processors, or flashes.
- the power management module 188 may manage power supplied to the electronic device 101 .
- the power management module 188 may be implemented as, for example, at least a part of a power management integrated circuit (PMIC).
- PMIC power management integrated circuit
- the battery 189 may supply power to at least one component of the electronic device 101 .
- battery 189 may include, for example, a non-rechargeable primary cell, a rechargeable secondary cell, or a fuel cell.
- the communication module 190 is a direct (eg, wired) communication channel or a wireless communication channel between the electronic device 101 and an external electronic device (eg, the electronic device 102, the electronic device 104, or the server 108). It can support establishment and communication performance through the established communication channel.
- the communication module 190 may include one or more communication processors that operate independently of the processor 120 (eg, an application processor) and support direct (eg, wired) communication or wireless communication.
- the communication module 190 is a wireless communication module 192 (eg, a cellular communication module, a short-range communication module, or a global navigation satellite system (GNSS) communication module) or a wired communication module 194 (eg, : It may include a local area network (LAN) communication module, or a power line communication module).
- a wireless communication module 192 eg, a cellular communication module, a short-range communication module, or a global navigation satellite system (GNSS) communication module
- GNSS global navigation satellite system
- wired communication module 194 eg, : It may include a local area network (LAN) communication module, or a power line communication module.
- a corresponding communication module among these communication modules is a first network 198 (eg, a short-range communication network such as Bluetooth, wireless fidelity (WiFi) direct, or infrared data association (IrDA)) or a second network 199 (eg, legacy It may communicate with the external electronic device 104 through a cellular network, a 5G network, a next-generation communication network, the Internet, or a computer network (eg, a telecommunication network such as a LAN or a WAN).
- a first network 198 eg, a short-range communication network such as Bluetooth, wireless fidelity (WiFi) direct, or infrared data association (IrDA)
- a second network 199 eg, legacy It may communicate with the external electronic device 104 through a cellular network, a 5G network, a next-generation communication network, the Internet, or a computer network (eg, a telecommunication network such as a LAN or a WAN).
- a telecommunication network
- the wireless communication module 192 uses subscriber information (eg, International Mobile Subscriber Identifier (IMSI)) stored in the subscriber identification module 196 within a communication network such as the first network 198 or the second network 199 .
- subscriber information eg, International Mobile Subscriber Identifier (IMSI)
- IMSI International Mobile Subscriber Identifier
- the electronic device 101 may be identified or authenticated.
- the wireless communication module 192 may support a 5G network after a 4G network and a next-generation communication technology, for example, a new radio access technology (NR).
- NR access technology includes high-speed transmission of high-capacity data (eMBB (enhanced mobile broadband)), minimization of terminal power and access to multiple terminals (mMTC (massive machine type communications)), or high reliability and low latency (URLLC (ultra-reliable and low-latency) -latency communications)).
- eMBB enhanced mobile broadband
- mMTC massive machine type communications
- URLLC ultra-reliable and low-latency
- the wireless communication module 192 may support a high frequency band (eg, mmWave band) to achieve a high data rate, for example.
- a high frequency band eg, mmWave band
- the wireless communication module 192 uses various techniques for securing performance in a high-frequency band, for example, beamforming, massive multiple-input and multiple-output (MIMO), all-dimensional multiplexing. It may support technologies such as full dimensional MIMO (FD-MIMO), an array antenna, analog beam-forming, or a large scale antenna.
- the wireless communication module 192 may support various requirements defined in the electronic device 101 , an external electronic device (eg, the electronic device 104 ), or a network system (eg, the second network 199 ).
- the wireless communication module 192 may include a peak data rate (eg, 20 Gbps or more) for realizing eMBB, loss coverage (eg, 164 dB or less) for realizing mMTC, or U-plane latency for realizing URLLC ( Example: Downlink (DL) and uplink (UL) each 0.5 ms or less, or round trip 1 ms or less) can be supported.
- a peak data rate eg, 20 Gbps or more
- loss coverage eg, 164 dB or less
- U-plane latency for realizing URLLC
- the antenna module 197 may transmit or receive a signal or power to the outside (eg, an external electronic device).
- the antenna module 197 may include an antenna including a conductor formed on a substrate (eg, a PCB) or a radiator formed of a conductive pattern.
- the antenna module 197 may include a plurality of antennas (eg, an array antenna). In this case, at least one antenna suitable for a communication method used in a communication network such as the first network 198 or the second network 199 is connected from the plurality of antennas by, for example, the communication module 190 . can be selected. A signal or power may be transmitted or received between the communication module 190 and an external electronic device through the selected at least one antenna.
- other components eg, a radio frequency integrated circuit (RFIC)
- RFIC radio frequency integrated circuit
- the antenna module 197 may form a mmWave antenna module.
- the mmWave antenna module comprises a printed circuit board, an RFIC disposed on or adjacent to a first side (eg, bottom side) of the printed circuit board and capable of supporting a designated high frequency band (eg, mmWave band); and a plurality of antennas (eg, an array antenna) disposed on or adjacent to a second side (eg, top or side) of the printed circuit board and capable of transmitting or receiving signals of the designated high frequency band. can do.
- peripheral devices eg, a bus, general purpose input and output (GPIO), serial peripheral interface (SPI), or mobile industry processor interface (MIPI)
- GPIO general purpose input and output
- SPI serial peripheral interface
- MIPI mobile industry processor interface
- the command or data may be transmitted or received between the electronic device 101 and the external electronic device 104 through the server 108 connected to the second network 199 .
- Each of the external electronic devices 102 or 104 may be the same as or different from the electronic device 101 .
- all or a part of operations executed in the electronic device 101 may be executed in one or more external electronic devices 102 , 104 , or 108 .
- the electronic device 101 may perform the function or service itself instead of executing the function or service itself.
- one or more external electronic devices may be requested to perform at least a part of the function or the service.
- One or more external electronic devices that have received the request may execute at least a part of the requested function or service, or an additional function or service related to the request, and transmit a result of the execution to the electronic device 101 .
- the electronic device 101 may process the result as it is or additionally and provide it as at least a part of a response to the request.
- cloud computing, distributed computing, mobile edge computing (MEC), or client-server computing technology may be used.
- the electronic device 101 may provide an ultra-low latency service using, for example, distributed computing or mobile edge computing.
- the external electronic device 104 may include an Internet of things (IoT) device.
- the server 108 may be an intelligent server using machine learning and/or neural networks.
- the external electronic device 104 or the server 108 may be included in the second network 199 .
- the electronic device 101 may be applied to an intelligent service (eg, smart home, smart city, smart car, or health care) based on 5G communication technology and IoT-related technology.
- the electronic device may have various types of devices.
- the electronic device may include, for example, a portable communication device (eg, a smart phone), a computer device, a portable multimedia device, a portable medical device, a camera, a wearable device, or a home appliance device.
- a portable communication device eg, a smart phone
- a computer device e.g., a smart phone
- a portable multimedia device e.g., a portable medical device
- a camera e.g., a portable medical device
- a camera e.g., a portable medical device
- a camera e.g., a portable medical device
- a wearable device e.g., a smart bracelet
- a home appliance device e.g., a home appliance
- first, second, or first or second may simply be used to distinguish an element from other elements in question, and may refer elements to other aspects (e.g., importance or order) is not limited. It is said that one (eg, first) component is “coupled” or “connected” to another (eg, second) component, with or without the terms “functionally” or “communicatively”. When referenced, it means that one component can be connected to the other component directly (eg by wire), wirelessly, or through a third component.
- module used in various embodiments of this document may include a unit implemented in hardware, software, or firmware, and is interchangeable with terms such as, for example, logic, logic block, component, or circuit.
- a module may be an integrally formed part or a minimum unit or a part of the part that performs one or more functions.
- the module may be implemented in the form of an application-specific integrated circuit (ASIC).
- ASIC application-specific integrated circuit
- Various embodiments of the present document include one or more instructions stored in a storage medium (eg, internal memory 136 or external memory 138) readable by a machine (eg, electronic device 101).
- a storage medium eg, internal memory 136 or external memory 138
- the processor eg, the processor 120
- the device eg, the electronic device 101
- the one or more instructions may include code generated by a compiler or code executable by an interpreter.
- the device-readable storage medium may be provided in the form of a non-transitory storage medium.
- 'non-transitory' only means that the storage medium is a tangible device and does not contain a signal (eg, electromagnetic wave), and this term is used in cases where data is semi-permanently stored in the storage medium and It does not distinguish between temporary storage cases.
- a signal eg, electromagnetic wave
- the method according to various embodiments disclosed in this document may be provided in a computer program product (computer program product).
- Computer program products may be traded between sellers and buyers as commodities.
- the computer program product is distributed in the form of a device-readable storage medium (eg compact disc read only memory (CD-ROM)), or via an application store (eg Play StoreTM) or on two user devices ( It can be distributed (eg downloaded or uploaded) directly, online between smartphones (eg: smartphones).
- a portion of the computer program product may be temporarily stored or temporarily created in a machine-readable storage medium such as a memory of a server of a manufacturer, a server of an application store, or a relay server.
- each component eg, a module or a program of the above-described components may include a singular or a plurality of entities, and some of the plurality of entities may be separately disposed in other components. have.
- one or more components or operations among the above-described corresponding components may be omitted, or one or more other components or operations may be added.
- a plurality of components eg, a module or a program
- the integrated component may perform one or more functions of each component of the plurality of components identically or similarly to those performed by the corresponding component among the plurality of components prior to the integration. .
- operations performed by a module, program, or other component are executed sequentially, in parallel, repeatedly, or heuristically, or one or more of the operations are executed in a different order, or omitted. , or one or more other operations may be added.
- the audio module 170 includes, for example, an audio input interface 210 , an audio input mixer 220 , an analog to digital converter (ADC) 230 , an audio signal processor 240 , and a DAC. It may include a digital to analog converter 250 , an audio output mixer 260 , or an audio output interface 270 .
- ADC analog to digital converter
- the audio input interface 210 is acquired from the outside of the electronic device 101 as part of the input module 150 or through a microphone (eg, a dynamic microphone, a condenser microphone, or a piezo microphone) configured separately from the electronic device 101 .
- An audio signal corresponding to the sound may be received.
- the audio input interface 210 is directly connected to the external electronic device 102 through the connection terminal 178 . , or wirelessly (eg, via Bluetooth communication) through the wireless communication module 192 to receive an audio signal.
- the audio input interface 210 may receive a control signal (eg, a volume adjustment signal received through an input button) related to an audio signal obtained from the external electronic device 102 .
- the audio input interface 210 may include a plurality of audio input channels, and may receive a different audio signal for each corresponding audio input channel among the plurality of audio input channels.
- the audio input interface 210 may receive an audio signal from another component of the electronic device 101 (eg, the processor 120 or the memory 130 ).
- the audio input mixer 220 may synthesize a plurality of input audio signals into at least one audio signal.
- the audio input mixer 220 may synthesize a plurality of analog audio signals input through the audio input interface 210 into at least one analog audio signal.
- the ADC 230 may convert an analog audio signal into a digital audio signal.
- the ADC 230 converts an analog audio signal received via the audio input interface 210, or additionally or alternatively, an analog audio signal synthesized via the audio input mixer 220 to digital audio. can be converted into a signal.
- the audio signal processor 240 may perform various processing on the digital audio signal input through the ADC 230 or the digital audio signal received from other components of the electronic device 101 .
- the audio signal processor 240 may change a sampling rate for one or more digital audio signals, apply one or more filters, perform interpolation processing, amplify or attenuate all or part of a frequency band, You can perform noise processing (such as noise or echo reduction), changing channels (such as switching between mono and stereo), mixing, or specified signal extraction.
- one or more functions of the audio signal processor 240 may be implemented in the form of an equalizer.
- the DAC 250 may convert a digital audio signal into an analog audio signal.
- the DAC 250 is a digital audio signal processed by the audio signal processor 240 , or another component of the electronic device 101 (eg, the processor 120 or the memory 130 ). ))) can be converted into an analog audio signal.
- the audio output mixer 260 may synthesize a plurality of audio signals to be output into at least one audio signal.
- the audio output mixer 260 may include an audio signal converted to analog through the DAC 250 and another analog audio signal (eg, an analog audio signal received through the audio input interface 210 ). ) can be synthesized into at least one analog audio signal.
- the audio output interface 270 transmits an analog audio signal converted through the DAC 250 or an analog audio signal synthesized by the audio output mixer 260 additionally or alternatively through the audio output module 155 to the electronic device 101 . ) can be printed out.
- the sound output module 155 may include, for example, a speaker such as a dynamic driver or a balanced armature driver, or a receiver.
- the sound output module 155 may include a plurality of speakers.
- the audio output interface 270 may output an audio signal having a plurality of different channels (eg, stereo or 5.1 channel) through at least some of the plurality of speakers.
- the audio output interface 270 is directly connected to the external electronic device 102 (eg, an external speaker or headset) through the connection terminal 178 or wirelessly through the wireless communication module 192 . to output an audio signal.
- the audio module 170 does not separately include the audio input mixer 220 or the audio output mixer 260 , and uses at least one function of the audio signal processor 240 to provide a plurality of digital audio signals. At least one digital audio signal may be generated by synthesizing them.
- the audio module 170 is an audio amplifier (not shown) capable of amplifying an analog audio signal input through the audio input interface 210 or an audio signal to be output through the audio output interface 270 . (eg speaker amplification circuit).
- the audio amplifier may be configured as a module separate from the audio module 170 .
- FIG. 3 is a block diagram illustrating components included in an electronic device according to an exemplary embodiment.
- the electronic device 300 (eg, the server 108 of FIG. 1 ) includes a processor 320 (eg, the processor 120 of FIG. 1 ), a memory 330 ( may include: memory 130 of FIG. 1 ), echo cancellation module 351 , howling cancellation module 352 , and/or wireless communication circuitry 390 (eg, communication module 190 of FIG. 1 ). have.
- Processor 320 is operatively with memory 330 , echo canceling module 351 , howling canceling module 352 , and/or wireless communication circuitry 390 . can be connected
- the configuration of the electronic device 300 illustrated in FIG. 3 is exemplary, and embodiments of the present document are not limited thereto.
- the echo cancellation module 351 and/or the howling cancellation module 352 is illustrated as being implemented separately from the processor 320 , but may be implemented as a part and/or included in the main processor 321 .
- the electronic device 300 may further include components not shown in FIG. 3 (eg, the interface 177 of FIG. 1 ).
- the processor 320 includes a main processor (eg, a central proceeding unit (CPU)) that processes various processes executed in the electronic device (eg, the main processor 121 of FIG. 1 ) and audio data It may include a coprocessor (eg, a digital signal processor (DSP)) (eg, the coprocessor 123 of FIG. 1 ) that processes processes related to transmission and reception of .
- the processor 320 may be implemented as a system on chip (SoC).
- the processor 320 is operatively coupled to the memory 330 , the echo cancellation module 351 , the howling cancellation module 352 , and/or the wireless communication circuitry 390 , according to one embodiment. can do.
- the processor 320 may process an audio data processing function provided by the electronic device 300 using information stored in the memory 330 .
- the processor 320 may transmit and/or receive various data from the outside (eg, the external electronic device 301 ) through the wireless communication circuit 390 .
- the memory 330 may store one or more instructions that, when executed, cause the processor 320 to cause the electronic device 300 to perform various operations.
- the memory 330 may be operatively connected to the processor 320 , and may transmit stored data to the processor 320 or store data transmitted from the processor 320 .
- the memory 330 may store a parameter related to a data processing operation of the electronic device 300 .
- the memory 330 may store various applications and/or application managers required for the electronic device 300 to perform an audio data processing operation.
- the memory 330 may store a recording application and/or a media application.
- the recording application may provide a function of recording a plurality of audio data.
- the media application may provide a function of outputting audio data stored in the memory 330 to the outside.
- the echo cancellation module 351 may remove an echo signal included in audio data, according to an embodiment.
- the echo cancellation module 351 may include an echo canceller.
- the electronic device 300 may use the echo canceller to remove an echo signal generated when audio data or a voice signal output from the electronic device 300 is input again to an input device (eg, a microphone).
- the echo cancellation module 351 may set audio data or a voice signal output from an output device (eg, a speaker) of the electronic device 300 as echo reference data.
- the echo cancellation module 351 generates at least one condition related to an audio signal level (eg, an echo level) based on the set echo reference data, and identifies a frequency characteristic of an audio signal included in the audio data.
- the echo cancellation module 351 may identify a signal having a specified frequency characteristic as an echo signal using the echo reference data, and remove the identified echo signal from the audio data. For example, the echo cancellation module 351 may configure the audio data exceeding a threshold value included in the at least one condition among audio data received by the electronic device 300 from the outside (eg, the external electronic device 301 ). can be identified.
- the threshold value may be an echo level threshold value generated by calculating a root mean square (RMS) level of at least a portion of the received audio data.
- RMS root mean square
- the howling removal module 352 detects a howling that occurs while a plurality of external electronic devices (eg, the external electronic device 301) performs a voice call (eg, a conference call), and , it is possible to perform an operation to remove the generated howling.
- the howling removal module 352 may include a howling detection circuit.
- the howling detection circuit may identify a frequency included in the audio data and detect a frequency band estimated to be emitted.
- the howling detection circuit may detect the howling based on energy ratio information for each frequency band obtained by analyzing audio data. For example, when the energy change rate of the designated frequency band is large, the howling detection circuit may determine that the howling has occurred in the designated frequency band and detect the howling.
- the howling detection circuit may detect one of an audio signal waveform or a reference signal included in the specific audio data. At least one may be used to detect howling.
- the howling detection circuit may identify the designated frequency band as a frequency band in which the howling occurs as a result of monitoring based on the designated period.
- the howling removal module 352 may include a howling removal circuit. The howling removal circuit may remove the howling based on detection information transmitted from the howling detection circuit.
- the detection information transmitted from the howling detection circuit may include at least one of a peak value or an energy value of various frequency bands. For example, a filtering operation of adjusting a gain of a specified frequency band detected by the howling detection circuit to a range in which the howling divergence does not occur may be performed. As another example, the howling detection circuit may perform a filtering operation of changing the audio signal level of the audio data causing the howling to occur to a range in which the howling divergence does not occur.
- the howling canceling module 352 may operate after the echo canceling module 351 performs an echo canceling function.
- the howling canceling module 352 may control data received while the electronic device 300 performs wireless communication with a plurality of external electronic devices.
- the howling removal function may be terminated.
- the howling removal module 352 may monitor audio data based on a specified period.
- the howling canceling function is finished, the howling removing module 352 may monitor the echo level of audio data received from a plurality of external electronic devices based on a specified period.
- the wireless communication circuit 390 may perform an operation of electrically connecting the electronic device 300 to the outside (eg, the external electronic device 301 ).
- the electronic device 300 may receive audio data from the external electronic device 301 through the wireless communication circuit 390 .
- the audio data may be data corresponding to a user's speech input obtained by the external electronic device 301 using an input device (eg, a microphone).
- the electronic device 300 performs wireless communication with the external electronic device 301 through the wireless communication circuit 390 for a delay time (eg, a network delay time and/or an electrical path delay time). delay)) may be compensated for.
- a delay time eg, a network delay time and/or an electrical path delay time. delay
- the electronic device 300 may calculate a path delay time based on various data received by performing wireless communication with a plurality of external electronic devices through the wireless communication circuit 390 .
- the electronic device 300 may continuously perform wireless communication with a plurality of external electronic devices after compensating for each calculated path delay time.
- the external electronic device 301 (eg, the electronic device 101 of FIG. 1 ) includes a processor 322 (eg, the processor 120 of FIG. 1 ) and a memory 332 . ) (eg, the memory 130 of FIG. 1 ), an audio circuit 372 (eg, the audio module 170 of FIG. 1 ), an input/output device 382 (eg, the input module 150 of FIG. 1 ) and sound output module 155 ), and/or wireless communication circuitry 392 (eg, communication module 190 of FIG. 1 ).
- a processor 322 eg, the processor 120 of FIG. 1
- a memory 332 eg, the memory 130 of FIG. 1
- an audio circuit 372 eg, the audio module 170 of FIG. 1
- an input/output device 382 eg, the input module 150 of FIG. 1
- sound output module 155 e.g, the wireless communication circuitry 392 (eg, communication module 190 of FIG. 1 ).
- the processor 322 may be operatively coupled to the memory 332 , the audio circuitry 372 , the input/output device 382 , and/or the wireless communication circuitry 392 .
- the configuration of the external electronic device 301 illustrated in FIG. 3 is exemplary, and embodiments of the present document are not limited thereto.
- the external electronic device 302 may further include components not shown in FIG. 3 (eg, the display module 160, the interface 177, and/or the antenna module 197 of FIG. 1 ). can
- Processor 322 configured as part of an input module included in external electronic device 302 or separately from external electronic device 302 (eg, a dynamic microphone, condenser microphone, or piezo microphone) Receives a voice signal corresponding to a sound (eg, a song sound) acquired from the outside (eg, a user) of the external electronic device 301 through the can be obtained
- the external electronic device 301 is connected wirelessly (eg, Bluetooth communication) through the wireless communication circuit 392 (eg, the wireless communication module 192 of FIG.
- the processor 322 converts a voice signal into audio data using an analog-to-digital converter (ADC) included in the input/output device 382 (eg, the ADC 230 of FIG. 2 ). can be converted.
- ADC analog-to-digital converter
- the processor 322 converts audio data into voice using a digital-to-analog converter (DAC) (eg, the DAC 250 of FIG. 2 ) included in the input/output device 382 .
- DAC digital-to-analog converter
- the processor 322 may output a voice signal using a sound output module included in the input/output device 382 .
- the sound output module may include a speaker (SPK) or a receiver (RCV) such as a dynamic driver or a balanced armature driver.
- SPK speaker
- RCV receiver
- the processor 322 outputs an audio signal having a plurality of different channels (eg, stereo or 5.1 channel) through at least some of the plurality of speakers.
- An audio output interface (eg, the audio output interface 270 of FIG. 2 ) may be controlled.
- the audio output interface may be directly connected to an external (eg, external speaker or headset) through a connection terminal or wirelessly through a wireless communication circuit 392 to output a voice signal.
- the memory 332 may store one or more instructions that, when executed, cause the processor 322 to perform various operations of the electronic device 301 .
- the memory 332 is operatively connected to the processor 322 , and may transmit stored data to the processor 322 or store data transmitted from the processor 322 .
- the memory 332 may store a parameter related to a data processing operation of the external electronic device 301 .
- the memory 332 may store various applications and/or application managers required for the external electronic device 301 to perform an audio data processing operation.
- the memory 332 may store a recording application and/or a media application.
- the recording application may provide a function of recording audio data corresponding to a voice signal input to the external electronic device through the input/output device 382 .
- the media application may provide a function of outputting audio data stored in the memory 332 to the outside.
- Audio circuitry 372 may, according to one embodiment, include an audio input interface (eg, audio input interface 210 of FIG. 2 ), an audio output interface (eg, audio output interface 270 of FIG. 2 ), and/or It may include an audio signal processor (eg, the audio signal processor 240 of FIG. 2 ).
- the audio circuit 372 may perform various processing operations on audio data.
- the audio circuit 372 may further include an audio amplification circuit (eg, a speaker amplification circuit).
- the audio amplification circuit may amplify the voice acquired or output from the input/output device 382 .
- the audio amplification circuit may be configured as a separate module from the audio circuit 372 .
- an audio amplification circuit (eg, a speaker amplification circuit) may be included in the processor 322 or the input/output device 382 .
- the input/output device 382 may obtain audio data from the outside (eg, a user) or output a voice corresponding to the audio data to the outside, according to an embodiment.
- the processor 322 may obtain audio data corresponding to a voice (eg, a user's utterance) sensed from the outside (eg, a user) by using the input/output device 382 .
- Audio data obtained by the input/output device 382 may be referred to as data obtained by converting a voice received from the outside into an electrical signal.
- the processor 322 may control the input/output device 382 to convert the sensed voice using an analog-to-digital conversion circuit and obtain the converted audio data.
- the processor 322 may control the input/output device 382 to convert audio data using a digital-to-analog conversion circuit, obtain a converted voice, and output the converted voice to the outside.
- the input/output device 382 may include an audio or a device configured to receive an audio signal (eg, a microphone, a Bluetooth receiving circuit, or a USB circuit).
- the input/output device 382 may include a circuit (eg, a speaker, a Bluetooth transmission circuit, a USB circuit) configured to output an electrical signal as an audio or audio signal.
- the wireless communication circuit 392 may perform an operation of electrically connecting the external electronic device 301 to the outside (eg, the electronic device 300 ), according to an embodiment.
- the description of the wireless communication circuit 392 included in the external electronic device 301 may be replaced with the description of the wireless communication circuit 390 included in the electronic device 300 described above.
- FIG. 4 is a flowchart illustrating an audio data processing operation of an electronic device according to an exemplary embodiment.
- the description may be replaced with the description by the external electronic device 301 of FIG. 3 .
- the first external electronic device 401 may acquire first audio data.
- the first external electronic device 401 may obtain various audio data input from the outside (eg, the first user) using an input device (eg, the input module 150 of FIG. 1 ).
- the first audio data may be referred to as data including the first user's speech input obtained by the first external electronic device 401 using at least one audio input device.
- the first external electronic device 401 may transmit the acquired first audio data to the outside.
- the first external electronic device 401 may transmit the first audio data to the electronic device 400 through a wireless communication circuit (eg, the wireless communication circuit 392 of FIG. 3 ).
- the electronic device 400 receives a second message from the first external electronic device 401 through a wireless communication circuit (eg, the wireless communication circuit 390 of FIG. 3 ).
- 1 Audio data can be received.
- the electronic device 400 may generate various data based on the first audio data.
- the electronic device 400 may generate at least one condition related to an audio signal level based on the first audio data.
- the at least one condition may include a threshold value associated with an echo level of audio data.
- the threshold value may be an echo level threshold value generated by calculating a root mean square (RMS) level of the first audio data.
- RMS root mean square
- the electronic device 400 may transmit the first audio data to the second external electronic device 402 , the third external electronic device 403 , and/or the fourth external electronic device 404 .
- the electronic device 400 may transmit the first audio data to the plurality of external electronic devices 402 , 403 , and 404 through a wireless communication circuit.
- the plurality of external electronic devices 402 , 403 , and 404 may output the received first audio data and acquire the audio data output through the input device.
- the second external electronic device 402, the third external electronic device 403, and/or the fourth external electronic device 404 outputs the first audio data through at least one audio output device, The output audio data may be acquired using at least one input device.
- the second external electronic device 402 , the third external electronic device 403 , and/or the fourth external electronic device 404 is connected to an external (eg, a second user, a third user, and/or It is also possible to obtain various audio data input from the fourth user).
- the plurality of external electronic devices 402 , 403 , and 404 may transmit audio data to the electronic device 400 through a wireless communication circuit.
- the second external electronic device 402 may transmit the second audio data to the electronic device 400 .
- the second audio data may include the second user's speech input obtained by the second external electronic device 402 using the audio input device and at least a portion of the first audio data output through the audio output device.
- the third external electronic device 403 may transmit third audio data to the electronic device 400 .
- the third audio data may include a third user's utterance input obtained by the third external electronic device 403 using the audio input device and at least a portion of the first audio data output through the audio output device.
- the fourth external electronic device 404 may transmit fourth audio data to the electronic device 400 .
- the fourth audio data may include the fourth user's utterance input obtained by the fourth external electronic device 404 using the audio input device and at least a portion of the first audio data output through the audio output device.
- the electronic device 400 may identify audio data exceeding a specified condition from among the plurality of received audio data. For example, the electronic device 400 may identify audio data exceeding a threshold value included in the at least one condition generated in operation 430 . For example, the electronic device 400 may identify audio data exceeding a threshold value included in the at least one condition among the second audio data, the third audio data, and the fourth audio data.
- the threshold value may be an echo level threshold value generated by calculating the RMS level of the first audio data.
- the echo level threshold value may be a condition related to the audio signal level generated by the electronic device 400 based on preset echo reference data. For example, the electronic device 400 may identify a signal having a specified frequency characteristic as an echo signal by using the echo reference data.
- the electronic device may identify audio data exceeding a threshold value among audio data received from the outside.
- the threshold value may be an echo level threshold value generated by calculating a root mean square (RMS) level of at least a portion of the received audio data.
- RMS root mean square
- the electronic device 400 may identify at least one external electronic device corresponding to the identified audio data based on the identification result in operation 470 .
- the electronic device 400 may include at least one external device corresponding to the identified audio data among the second external electronic device 402 , the third external electronic device 403 , and the fourth external electronic device 404 .
- the electronic device may be identified.
- the electronic device 400 may perform an echo cancellation function on audio data associated with the identified at least one external electronic device by using an echo cancellation module (eg, the echo cancellation module 351 of FIG. 3 ).
- FIG. 5 is a block diagram illustrating an audio data processing process of an electronic device according to an exemplary embodiment.
- the first external electronic device 501 may transmit 510 various audio data to the electronic device 500 .
- reference numeral 501-1 may be referred to as a processing path of audio data acquired by the first external electronic device 501 .
- the first external electronic device 501 may acquire the first audio data 551 input from the outside (eg, the first user) using an input device (eg, the input module 150 of FIG. 1 ).
- the first audio data 551 may be referred to as data including the first user's speech input obtained by the first external electronic device 501 using at least one audio input device.
- the first external electronic device 501 may transmit the acquired first audio data 551 to the electronic device 500 .
- the electronic device 500 may generate at least one condition related to the audio signal level based on the first audio data 551 received from the first external electronic device 501 .
- the at least one condition may include the RMS level of the first audio data 551 .
- the electronic device 500 may transmit the first audio data 551 received from the first external electronic device 501 to the outside (eg, a plurality of external electronic devices 502 ).
- the electronic device 500 transmits the first audio data 551 to the second external electronic device (eg, the second external electronic device 402 of FIG. 4 ) and the third external electronic device (eg, the third external electronic device (eg, the second external electronic device 402 of FIG.
- the data may be transmitted to the third external electronic device 403) and the fourth external electronic device (eg, the fourth external electronic device 404 of FIG. 4 ).
- Reference numeral 502-1 denotes a data processing path between the electronic device 500 and a second external electronic device
- reference numeral 502-2 denotes a data processing path between the electronic device 500 and a third external electronic device
- reference numeral 502-2 denotes a data processing path between the electronic device 500 and a third external electronic device.
- 3 may be referred to as a data processing path between the electronic device 500 and the fourth external electronic device, respectively.
- the calculated and generated echo level threshold may be included.
- the plurality of external electronic devices 502 outputs the first audio data 551 received from the electronic device 500 through an audio output device, and uses the audio input device to output the first audio data 551 .
- One audio data 551 may be acquired.
- the plurality of external electronic devices 502 may acquire the output first audio data 551 and various audio data received from the outside.
- the second external electronic device may acquire second audio data 552 .
- the second audio data 552 may include a second user's speech input obtained by the external electronic device using the audio input device and at least a portion of the first audio data 551 output through the audio output device.
- the third external electronic device may acquire third audio data 553 .
- the third audio data 553 may include a third user's speech input obtained by the third external electronic device using the audio input device and at least a portion of the first audio data 551 output through the audio output device. have.
- the fourth external electronic device may acquire fourth audio data 554 .
- the fourth audio data 554 may include the fourth user's speech input obtained by the fourth external electronic device using the audio input device and at least a portion of the first audio data 551 output through the audio output device. have.
- different delay times eg, network delay time or electrical path delay may occur.
- a first path delay time D1 between the second external electronic devices and a second path delay time D1 between the second external electronic devices and the third external electronic devices A second path delay time D2 and a third path delay time D3 may occur between the forty-third external electronic device.
- the plurality of external electronic devices 502 may use audio data (second audio data 552 , third audio data 553 , and fourth audio data 554 ) obtained based on different path delay times. Each may be transmitted to the electronic device 500 .
- the electronic device 500 may receive various audio data from a plurality of external electronic devices 502 through a wireless communication circuit. For example, the electronic device 500 performs a first path delay time D1 and a second path delay time D1 based on the second audio data 552 , the third audio data 553 , and the fourth audio data 554 , respectively. A path delay time D2 and a third path delay time D32 may be calculated. The electronic device 500 may perform wireless communication with the plurality of external electronic devices 502 by compensating for the calculated path delay times. For example, the electronic device 500 generates a specified condition generated based on the first audio data 551 among the second audio data 552 , the third audio data 553 , and the fourth audio data 554 .
- Audio data exceeding can be identified.
- the electronic device 500 may identify at least one external electronic device (eg, a fourth external electronic device) corresponding to the identified at least one piece of audio data.
- the electronic device 500 may perform an echo cancellation function on audio data associated with at least one identified external electronic device.
- the electronic device 500 may perform an echo cancellation function on audio data associated with the identified at least one external electronic device using an echo cancellation module (eg, the echo cancellation module 351 of FIG. 3 ). have.
- FIG. 6 is a flowchart illustrating an audio data processing operation of an electronic device according to an exemplary embodiment.
- FIG. 6 the description of the same or similar operations as those of FIG. 4 may be replaced by the description of FIG. 4 .
- the description of operations 610 to 650 of FIG. 6 may be replaced with the description of operations 410 through 450 of FIG. 4 .
- the fourth external electronic device 604 may transmit fourth audio data to the electronic device 600 .
- the fourth audio data transmitted by the fourth external electronic device 604 is output through the fourth user's speech input and the audio output device acquired by the fourth external electronic device 604 using the audio input device. It may include at least a portion of the first audio data.
- at least a portion of the first audio data output through the audio output device may be referred to as an echo signal, and a howling may be generated in the course of performing a multi-party call function between a plurality of electronic devices. .
- the electronic device 600 may receive fourth audio data and determine whether the fourth audio data exceeds a specified condition.
- the electronic device 600 uses a howling removal module (eg, the howling removal module 352 of FIG. 3 ) to designate echo levels of a plurality of audio data (eg, an echo level threshold). value) may correspond to an operation of determining whether or not the value is exceeded.
- a howling removal module eg, the howling removal module 352 of FIG. 3
- the electronic device 600 uses at least one of an audio signal waveform or a reference signal included in the specific audio data. Howling can be detected.
- the electronic device 600 may determine whether the echo level of the fourth audio data exceeds an echo level threshold.
- the electronic device 600 When the echo level of the fourth audio data exceeds the echo level threshold, the electronic device 600 identifies a fourth external electronic device 604 corresponding to the fourth audio data, and the fourth external electronic device 604 ) may perform a howling removal function on audio data associated with the .
- the description of the howling removal function performed by the electronic device 600 may be replaced with the description of the howling removal module 352 of FIG. 3 described above.
- the description of operation 670 is disclosed separately from the description of operations 470 and 480 of FIG. 4 , but embodiments of the present document are not limited thereto.
- the electronic device 600 may perform operations 670 in the process of transmitting and/or receiving audio data through wireless communication with the plurality of external electronic devices 601 to 604 .
- the electronic device 600 may perform operation 670 after omitting operations 470 and 480 .
- FIG. 7 is a block diagram 700 illustrating an audio data processing process of an electronic device according to an exemplary embodiment.
- the electronic device 700 transmits various data through a plurality of external electronic devices 701 to 704 and a wireless communication circuit (eg, the communication module 190 of FIG. 1 ). may transmit and/or receive.
- the electronic device 700 may process and/or operate on audio data processed while the plurality of external electronic devices 701 to 704 perform a multi-party call function.
- an operation of the electronic device 700 processing audio data will be sequentially described.
- the electronic device 700 may receive audio data from the first external electronic device 701 through a wireless communication circuit.
- audio data transmitted by the first external electronic device 701 may be acquired by the first external electronic device 701 using at least one audio input device (eg, the input module 150 of FIG. 1 ). It may be referred to as data including the first user's utterance input.
- the electronic device 700 may receive the first audio data and generate at least one condition related to the audio signal level based on the first audio data.
- the at least one condition related to the audio signal level may include a threshold value (eg, an echo level threshold value).
- the electronic device 700 stores the generated echo level threshold in a memory (eg, the memory 130 of FIG. 1 ), and compares the echo levels of audio data other than the first audio data with the stored echo level threshold. action can be performed.
- the electronic device 700 may transmit the first audio data to the second external electronic device 702 , the third external electronic device 703 , and the fourth external electronic device 704 .
- the plurality of external electronic devices 701 to 704 may output the received first audio data through at least one audio output device (eg, the sound output module 155 of FIG. 1 ).
- the plurality of external electronic devices 701 to 704 may acquire audio data including a part of the output first audio data and an external input acquired using at least one audio input device.
- the fourth external electronic device 704 may transmit audio data obtained by reference number 720 to the electronic device 700 .
- the fourth external electronic device 704 may transmit fourth audio data to the electronic device 700 .
- the fourth audio data may include a fourth user utterance input obtained by the fourth external electronic device 704 using the audio input device and at least a portion of the first audio data output through the audio output device.
- the electronic device 700 may analyze the received fourth audio data based on the threshold value generated by reference number 710 .
- the electronic device 700 may determine whether the echo level of the fourth audio data exceeds a pre-generated echo level threshold.
- the electronic device 700 may detect a howling generated by the audio signal waveform included in the first audio data or the fourth audio data transmitted by the fourth reference signal external electronic device 704 .
- the electronic device 700 performs a specified function using the echo cancellation module 751 and/or the howling cancellation module 752, and then transmits audio data to an external (eg, a first external electronic device ( 701), the second external electronic device 702, and the third external electronic device 703).
- an external eg, a first external electronic device ( 701), the second external electronic device 702, and the third external electronic device 703
- the electronic device 700 performs the howling removal module 752 with respect to the audio data associated with the fourth external electronic device 704 .
- the electronic device 700 may change an audio signal level of audio data associated with the fourth external electronic device 704 and transmit audio data including the changed audio signal level to the outside.
- An electronic device may include a wireless communication circuit, a processor, and a memory operatively connected to the processor.
- the memory may be configured such that, when executed, the processor receives first audio data from a first external electronic device through the wireless communication circuit, and at least one associated with an audio signal level based on the first audio data generates a condition of , transmits the first audio data to a second external electronic device and a third external electronic device, and receives the first audio data from the second external electronic device and the third external electronic device through the wireless communication circuit, respectively Receive second audio data and third audio data, identify audio data exceeding a threshold value included in the at least one condition among the second audio data and the third audio data, and communicate with the second external electronic device
- One of the third external electronic devices that identifies at least one external electronic device corresponding to the identified audio data and performs an echo cancellation function on audio data associated with the identified at least one external electronic device
- the above instructions may be stored.
- the threshold value may be an echo level threshold value generated by calculating a root mean square (RMS) level of the first audio data.
- RMS root mean square
- the first audio data includes a first user's speech input obtained by the first external electronic device using at least one audio input device
- the second audio data includes the second audio data.
- an external electronic device includes at least a portion of a second user's speech input acquired using an audio input device and at least a portion of the first audio data output through an audio output device
- the third audio data includes:
- the electronic device may include a third user's utterance input obtained using the audio input device and at least a portion of the first audio data output through the audio output device.
- a first path delay that occurs while the processor performs wireless communication with the second external electronic device based on the second audio data calculating a time, calculating a second path delay time generated while performing wireless communication with the third external electronic device based on the third audio data, and calculating the calculated first path delay time and the second path delay time It may be configured to perform wireless communication with the second external electronic device and the third external electronic device by compensating for a path delay time.
- an echo level of audio data received from the identified at least one external electronic device is designated. Monitoring is performed based on a period, and when the echo level of the monitored audio data exceeds the echo level threshold, howling canceling the audio data associated with the identified at least one external electronic device It can be set to perform a function.
- the processor monitors audio data received from the second electronic device and the third electronic device based on the specified period, and , when the echo level of the monitored audio data is equal to or less than the threshold value, the howling removal function may be set to end.
- the one or more instructions may be executed by the processor when the echo level of the audio data received from the identified at least one external electronic device exceeds the threshold value.
- the method may be configured to detect howling generated by the identified at least one external electronic device by using at least one of an audio signal waveform or a reference signal included in the first audio data.
- the one or more instructions when executed, control the processor to change an audio signal level of audio data associated with the identified at least one external electronic device, and configure the wireless communication circuitry. It can be set to be transmitted to the outside through
- An electronic device for relaying audio data between a plurality of external electronic devices may include a wireless communication circuit, a processor, and a memory operatively connected to the processor.
- the processor receives first audio data from a first external electronic device through the wireless communication circuit, and uses the first audio data to set an echo level threshold. threshold), transmitting the first audio data to a second external electronic device and a third external electronic device, and an echo level of the second audio data and the third audio data exceeds the echo level threshold.
- Identifies data identifies at least one external electronic device corresponding to the identified audio data among the second external electronic device and the third external electronic device, and audio data associated with the identified at least one external electronic device
- One or more instructions for selectively performing an echo cancellation function may be stored.
- a first path delay that occurs while the processor performs wireless communication with the second external electronic device based on the second audio data calculating a time, calculating a second path delay time generated while performing wireless communication with the third external electronic device based on the third audio data, and calculating the calculated first path delay time and the second path delay time It may be configured to perform wireless communication with the second external electronic device and the third external electronic device by compensating for a path delay time.
- the one or more instructions when executed, cause the processor to:
- an echo level of audio data received from the identified at least one external electronic device is monitored based on a specified period, and the echo level of the monitored audio data is determined to be the echo level
- the threshold value When the threshold value is exceeded, it may be set to perform a howling canceling function on the audio data.
- the one or more instructions when executed, control the processor to change an audio signal level of the audio data associated with the identified at least one external electronic device, the wireless communication circuitry It may be set to transmit to the outside through .
- a method for an electronic device to process audio data includes receiving first audio data from a first external electronic device through the wireless communication circuit, based on the first audio data to generate at least one condition related to an audio signal level, transmitting the first audio data to a second external electronic device and a third external electronic device, and through the wireless communication circuit, the second external electronic device and receiving second audio data and third audio data, respectively, from the third external electronic device, and audio data exceeding a threshold value included in the at least one condition of the second audio data and the third audio data.
- identifying at least one external electronic device corresponding to the identified audio data from among the second external electronic device and the third external electronic device It may include an operation of performing an echo cancellation function on the associated audio data.
- a first path delay occurring while performing wireless communication with the second external electronic device based on the second audio data calculating a time, calculating a second path delay time that occurs while performing wireless communication with the third external electronic device based on the third audio data, and the calculated first path delay time;
- Compensating for the second path delay time may further include performing wireless communication with the second external electronic device and the third external electronic device.
- an echo level of the audio data associated with the identified at least one external electronic device is designated
- the method may further include an operation of monitoring based on a period and performing a howling canceling function on the audio data when the echo level of the monitored audio data exceeds the echo level threshold value.
- the audio data received from the second electronic device and the third electronic device are The method may further include an operation of monitoring based on a period and an operation of terminating execution of the howling removal function when the echo level of the monitored audio data is equal to or less than the threshold value.
- the monitoring (monitoring) of the echo level of the audio data received from the at least one identified external electronic device based on a specified period may include: When the echo level of the audio data exceeds the threshold, a howling generated by the identified at least one external electronic device is performed using at least one of an audio signal waveform or a reference signal included in the first audio data. It may include a sensing motion.
- performing a howling canceling function on the identified audio data associated with the at least one external electronic device may include: It may include controlling to change the signal level and transmitting the signal to the outside through the wireless communication circuit.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
Abstract
무선 통신 회로, 프로세서, 및 프로세서에 작동적으로 연결되는 메모리를 포함하는 전자 장치가 개시된다. 전자 장치는 무선 통신 회로를 통하여, 제1 외부 전자 장치로부터 제1 오디오 데이터를 수신하고, 제1 오디오 데이터에 기반하여 오디오 신호 레벨에 연관된 적어도 하나의 조건을 생성하고, 제1 오디오 데이터를 제2 외부 전자 장치 및 제3 외부 전자 장치로 전송하고, 무선 통신 회로를 통하여, 제2 외부 전자 장치 및 제3 외부 전자 장치로부터 각각 제2 오디오 데이터 및 제3 오디오 데이터를 수신하고, 적어도 하나의 조건에 포함된 임계 값을 초과하는 오디오 데이터를 식별하고, 식별된 오디오 데이터에 대응하는 적어도 하나의 외부 전자 장치를 식별하고, 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터에 대하여, 에코 제거 기능을 수행할 수 있다.
Description
본 문서에서 개시되는 다양한 실시 예들은, 오디오 데이터 처리 방법 및 이를 지원하는 전자 장치에 관한 것이다.
최근 디지털 기술의 발달과 함께, 이동 통신 단말기, 스마트 폰, 태블릿 PC(personal computer) 등과 같이 이동하면서 통신 및 개인 정보 처리가 가능한 다양한 전자 장치들이 출시되고 있다.
전자 장치는 복수의 입력 장치들로부터 획득한 데이터를 이용하여 사용자에게 다양한 기능을 제공할 수 있다. 예를 들어, 전자 장치는 복수의 오디오 입력 장치들(예: 마이크, Bluetooth 수신 회로, 또는 USB 회로)을 이용하여 오디오 데이터를 획득하여 다양한 기능(예: 화상 채팅 및/또는 미디어 재생)을 제공할 수 있다.
통신 기술의 발달과 함께, 복수의 사용자가 참여할 수 있는 다자간 통화 기능이 대중화 되고 있다. 나아가, 수백 명이 참여할 수 있는 PPT(Push To Talk) 서비스가 연구되고 있다.
복수의 전자 장치들이 다자간 통화 기능을 수행하는 경우, 에코(echo) 및/또는 하울링(howling)이 형성되어 증폭 굉음이 발생할 수 있다. 사용자는 에코 및/또는 하울링으로 인하여 통화 기능에 제약을 받을 수 있다. 예를 들어, 스피커로 재생되는 사용자의 발화 입력이 다시 마이크로 입력되는 에코 현상이 발생할 수 있다. 에코 현상이 지속될 경우, 마이크와 스피커의 하울링 현상으로 인하여 전자 장치는 정상적으로 통화 기능을 수행하는 것이 어려울 수 있다.
종래 기술에 따라 전자 장치는 자체적으로 에코 캔슬링 및/또는 하울링 캔슬링 동작을 수행할 수 있다. 그러나, 다자간 통화 기능에 참여하는 전자 장치들의 개수가 증가함에 따라 전자 장치들 간의 성능 차이로 인하여 데이터 처리 시간이 증가하고, 사용자가 제공받는 통화 품질이 저하될 수 있다.
본 문서에 개시된 다양한 실시 예들은, 상술한 문제들을 해결하기 위한 전자 장치 및 방법을 제공할 수 있다.
본 문서에 개시되는 일 실시 예에 따른 전자 장치는, 무선 통신 회로, 프로세서, 및 상기 프로세서에 작동적으로(operatively) 연결되는 메모리를 포함할 수 있다. 예를 들어, 상기 메모리는, 실행 되었을 때 상기 프로세서가 상기 무선 통신 회로를 통하여, 제1 외부 전자 장치로부터 제1 오디오 데이터를 수신하고, 상기 제1 오디오 데이터에 기반하여 오디오 신호 레벨에 연관된 적어도 하나의 조건을 생성하고, 상기 제1 오디오 데이터를 제2 외부 전자 장치 및 제3 외부 전자 장치로 전송하고, 상기 무선 통신 회로를 통하여, 상기 제2 외부 전자 장치 및 상기 제3 외부 전자 장치로부터 각각 제2 오디오 데이터 및 제3 오디오 데이터를 수신하고, 상기 제2 오디오 데이터 및 상기 제3 오디오 데이터 중 상기 적어도 하나의 조건에 포함된 임계 값을 초과하는 오디오 데이터를 식별하고, 상기 제2 외부 전자 장치와 상기 제3 외부 전자 장치 중, 상기 식별된 오디오 데이터에 대응하는 적어도 하나의 외부 전자 장치를 식별하고, 상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터에 대하여, 에코 제거 기능을 수행하도록 하는 하나 이상의 인스트럭션들(instructions)을 저장할 수 있다.
본 문서에 개시되는 일 실시 예에 따른 복수의 외부 전자 장치들 간의 오디오 데이터 중계를 위한 전자 장치는, 무선 통신 회로, 프로세서, 및 상기 프로세서에 작동적으로(operatively) 연결되는 메모리를 포함할 수 있다. 예를 들어, 상기 메모리는, 실행 되었을 때 상기 프로세서가 상기 무선 통신 회로를 통하여, 제1 외부 전자 장치로부터 제1 오디오 데이터를 수신하고, 상기 제1 오디오 데이터를 이용하여 에코 레벨 임계 값(echo level threshold)을 생성한 후 상기 제1 오디오 데이터를 제2 외부 전자 장치 및 제3 외부 전자 장치로 전송하고, 상기 제2 오디오 데이터 및 상기 제3 오디오 데이터 중 에코 레벨이 상기 에코 레벨 임계 값을 초과하는 데이터를 식별하고, 상기 제2 외부 전자 장치 및 상기 제3 외부 전자 장치 중 상기 식별된 오디오 데이터에 대응하는 적어도 하나의 외부 전자 장치를 식별하고, 상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터에 대하여 선택적으로 에코 제거 기능을 수행하도록 하는 하나 이상의 인스트럭션들(instructions)을 저장할 수 있다.
본 문서에 개시되는 일 실시 예에 따른 전자 장치가 오디오 데이터를 처리하는 방법은, 상기 무선 통신 회로를 통하여, 제1 외부 전자 장치로부터 제1 오디오 데이터를 수신하는 동작, 상기 제1 오디오 데이터에 기반하여 오디오 신호 레벨에 연관된 적어도 하나의 조건을 생성하는 동작, 상기 제1 오디오 데이터를 제2 외부 전자 장치 및 제3 외부 전자 장치로 전송하는 동작, 상기 무선 통신 회로를 통하여, 상기 제2 외부 전자 장치 및 상기 제3 외부 전자 장치로부터 각각 제2 오디오 데이터 및 제3 오디오 데이터를 수신하는 동작, 상기 제2 오디오 데이터 및 상기 제3 오디오 데이터 중 상기 적어도 하나의 조건에 포함된 임계 값을 초과하는 오디오 데이터를 식별하는 동작, 상기 제2 외부 전자 장치와 상기 제3 외부 전자 장치 중, 상기 식별된 오디오 데이터에 대응하는 적어도 하나의 외부 전자 장치를 식별하는 동작, 및 상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터에 대하여, 에코 제거 기능을 수행하는 동작을 포함할 수 있다.
본 문서에 개시되는 일 실시 예에 따른 전자 장치는, 다자간 통화 기능 수행 과정에서, 복수의 전자 장치들 간에 송신 및/또는 수신되는 오디오 데이터들을 하나의 전자 장치(예: 서버) 단에서 종합하여 처리함으로써 통화 품질을 개선할 수 있다.
서로 다른 복수의 전자 장치들의 특성을 식별하고, 통신 상태를 모니터링(monitoring) 하여 에코 제거(echo canceling) 및/또는 하울링 제거(howling canceling) 기능을 선택적으로 수행하여 최적화 된 오디오 서비스를 효율적으로 제공할 수 있다.
이 외에, 본 문서를 통해 직접적 또는 간접적으로 파악되는 다양한 효과들이 제공될 수 있다.
도 1은 다양한 실시 예들에 따른, 네트워크 환경 내의 전자 장치의 블록도이다.
도 2는, 다양한 실시에 따른, 오디오 모듈의 블록도이다.
도 3은 일 실시예에 따른 전자 장치에 포함된 구성 요소들의 블록도를 도시한다.
도 4는 일 실시예에 따른 전자 장치의 오디오 데이터 처리 동작 순서도를 도시한다.
도 5는 일 실시 예에 따른 전자 장치의 오디오 데이터 처리 과정을 나타내는 블록도를 도시한다.
도 6은 일 실시 예에 따른 전자 장치의 오디오 데이터 처리 동작 순서도를 도시한다.
도 7은 일 실시 예에 따른 전자 장치의 오디오 데이터 처리 과정을 나타내는 블록도를 도시한다.
도면의 설명과 관련하여, 동일 또는 유사한 구성요소에 대해서는 동일 또는 유사한 참조 부호가 사용될 수 있다.
이하, 본 문서의 다양한 실시 예가 첨부된 도면을 참조하여 기재된다. 그러나, 이는 본 문서에 기재된 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 문서의 실시 예의 다양한 변경(modification), 균등물(equivalent), 및/또는 대체물(alternative)을 포함하는 것으로 이해되어야 한다.
도 1은, 다양한 실시예들에 따른, 네트워크 환경(100) 내의 전자 장치(101)의 블록도이다. 도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제 1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제 2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 모듈(150), 음향 출력 모듈(155), 디스플레이 모듈(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 연결 단자(178), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 연결 단자(178))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들(예: 센서 모듈(176), 카메라 모듈(180), 또는 안테나 모듈(197))은 하나의 구성요소(예: 디스플레이 모듈(160))로 통합될 수 있다.
프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 저장하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(134)에 저장할 수 있다. 일실시예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 어플리케이션 프로세서) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 신경망 처리 장치(NPU: neural processing unit), 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 예를 들어, 전자 장치(101)가 메인 프로세서(121) 및 보조 프로세서(123)를 포함하는 경우, 보조 프로세서(123)는 메인 프로세서(121)보다 저전력을 사용하거나, 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 디스플레이 모듈(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 신경망 처리 장치)는 인공지능 모델의 처리에 특화된 하드웨어 구조를 포함할 수 있다. 인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능이 수행되는 전자 장치(101) 자체에서 수행될 수 있고, 별도의 서버(예: 서버(108))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다.
메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서 모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비휘발성 메모리(134)를 포함할 수 있다.
프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다.
입력 모듈(150)은, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 모듈(150)은, 예를 들면, 마이크, 마우스, 키보드, 키(예: 버튼), 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.
음향 출력 모듈(155)은 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 모듈(155)은, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있다. 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
디스플레이 모듈(160)은 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 디스플레이 모듈(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일실시예에 따르면, 디스플레이 모듈(160)은 터치를 감지하도록 설정된 터치 센서, 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 압력 센서를 포함할 수 있다.
오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일실시예에 따르면, 오디오 모듈(170)은, 입력 모듈(150)을 통해 소리를 획득하거나, 음향 출력 모듈(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.
센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일실시예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.
인터페이스(177)는 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일실시예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일실시예에 따르면, 연결 단자(178)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일실시예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일실시예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일실시예에 따르면, 전력 관리 모듈(188)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(189)는 전자 장치(101)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일실시예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일실시예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(198)(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제 2 네트워크(199)(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부의 전자 장치(104)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 또는 인증할 수 있다.
무선 통신 모듈(192)은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB(enhanced mobile broadband)), 단말 전력 최소화와 다수 단말의 접속(mMTC(massive machine type communications)), 또는 고신뢰도와 저지연(URLLC(ultra-reliable and low-latency communications))을 지원할 수 있다. 무선 통신 모듈(192)은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈(192)은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO: full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다. 무선 통신 모듈(192)은 전자 장치(101), 외부 전자 장치(예: 전자 장치(104)) 또는 네트워크 시스템(예: 제 2 네트워크(199))에 규정되는 다양한 요구사항을 지원할 수 있다. 일실시예에 따르면, 무선 통신 모듈(192)은 eMBB 실현을 위한 Peak data rate(예: 20Gbps 이상), mMTC 실현을 위한 손실 Coverage(예: 164dB 이하), 또는 URLLC 실현을 위한 U-plane latency(예: 다운링크(DL) 및 업링크(UL) 각각 0.5ms 이하, 또는 라운드 트립 1ms 이하)를 지원할 수 있다.
안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 안테나를 포함할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다. 이런 경우, 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부의 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC(radio frequency integrated circuit))이 추가로 안테나 모듈(197)의 일부로 형성될 수 있다.
다양한 실시예에 따르면, 안테나 모듈(197)은 mmWave 안테나 모듈을 형성할 수 있다. 일실시예에 따르면, mmWave 안테나 모듈은 인쇄 회로 기판, 상기 인쇄 회로 기판의 제 1 면(예: 아래 면)에 또는 그에 인접하여 배치되고 지정된 고주파 대역(예: mmWave 대역)을 지원할 수 있는 RFIC, 및 상기 인쇄 회로 기판의 제 2 면(예: 윗 면 또는 측 면)에 또는 그에 인접하여 배치되고 상기 지정된 고주파 대역의 신호를 송신 또는 수신할 수 있는 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일실시예에 따르면, 명령 또는 데이터는 제 2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104)간에 송신 또는 수신될 수 있다. 외부의 전자 장치(102, 또는 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 일실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부의 전자 장치들(102, 104, 또는 108) 중 하나 이상의 외부의 전자 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부의 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부의 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 모바일 에지 컴퓨팅(MEC: mobile edge computing), 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다. 전자 장치(101)는, 예를 들어, 분산 컴퓨팅 또는 모바일 에지 컴퓨팅을 이용하여 초저지연 서비스를 제공할 수 있다. 다른 실시예에 있어서, 외부의 전자 장치(104)는 IoT(internet of things) 기기를 포함할 수 있다. 서버(108)는 기계 학습 및/또는 신경망을 이용한 지능형 서버일 수 있다. 일실시예에 따르면, 외부의 전자 장치(104) 또는 서버(108)는 제 2 네트워크(199) 내에 포함될 수 있다. 전자 장치(101)는 5G 통신 기술 및 IoT 관련 기술을 기반으로 지능형 서비스(예: 스마트 홈, 스마트 시티, 스마트 카, 또는 헬스 케어)에 적용될 수 있다.
본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치(예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나", "A, B 또는 C", "A, B 및 C 중 적어도 하나", 및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.
본 문서의 다양한 실시예들에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로와 같은 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(101)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(136) 또는 외장 메모리(138))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(140))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(101))의 프로세서(예: 프로세서(120))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장 매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory(CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어™)를 통해 또는 두 개의 사용자 장치들(예: 스마트 폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있으며, 복수의 개체 중 일부는 다른 구성요소에 분리 배치될 수도 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.
도 2는, 다양한 실시에 따른, 오디오 모듈(170)의 블록도(200)이다. 도 2를 참조하면, 오디오 모듈(170)은, 예를 들면, 오디오 입력 인터페이스(210), 오디오 입력 믹서(220), ADC(analog to digital converter)(230), 오디오 신호 처리기(240), DAC(digital to analog converter)(250), 오디오 출력 믹서(260), 또는 오디오 출력 인터페이스(270)를 포함할 수 있다.
오디오 입력 인터페이스(210)는 입력 모듈(150)의 일부로서 또는 전자 장치(101)와 별도로 구성된 마이크(예: 다이나믹 마이크, 콘덴서 마이크, 또는 피에조 마이크)를 통하여 전자 장치(101)의 외부로부터 획득한 소리에 대응하는 오디오 신호를 수신할 수 있다. 예를 들어, 오디오 신호가 외부의 전자 장치(102)(예: 헤드셋 또는 마이크)로부터 획득되는 경우, 오디오 입력 인터페이스(210)는 상기 외부의 전자 장치(102)와 연결 단자(178)를 통해 직접, 또는 무선 통신 모듈(192)을 통하여 무선으로(예: Bluetooth 통신) 연결되어 오디오 신호를 수신할 수 있다. 일실시예에 따르면, 오디오 입력 인터페이스(210)는 상기 외부의 전자 장치(102)로부터 획득되는 오디오 신호와 관련된 제어 신호(예: 입력 버튼을 통해 수신된 볼륨 조정 신호)를 수신할 수 있다. 오디오 입력 인터페이스(210)는 복수의 오디오 입력 채널들을 포함하고, 상기 복수의 오디오 입력 채널들 중 대응하는 오디오 입력 채널 별로 다른 오디오 신호를 수신할 수 있다. 일실시예에 따르면, 추가적으로 또는 대체적으로, 오디오 입력 인터페이스(210)는 전자 장치(101)의 다른 구성 요소(예: 프로세서(120) 또는 메모리(130))로부터 오디오 신호를 입력 받을 수 있다.
오디오 입력 믹서(220)는 입력된 복수의 오디오 신호들을 적어도 하나의 오디오 신호로 합성할 수 있다. 예를 들어, 일실시예에 따르면, 오디오 입력 믹서(220)는, 오디오 입력 인터페이스(210)를 통해 입력된 복수의 아날로그 오디오 신호들을 적어도 하나의 아날로그 오디오 신호로 합성할 수 있다.
ADC(230)는 아날로그 오디오 신호를 디지털 오디오 신호로 변환할 수 있다. 예를 들어, 일실시예에 따르면, ADC(230)는 오디오 입력 인터페이스(210)을 통해 수신된 아날로그 오디오 신호, 또는 추가적으로 또는 대체적으로 오디오 입력 믹서(220)를 통해 합성된 아날로그 오디오 신호를 디지털 오디오 신호로 변환할 수 있다.
오디오 신호 처리기(240)는 ADC(230)를 통해 입력받은 디지털 오디오 신호, 또는 전자 장치(101)의 다른 구성 요소로부터 수신된 디지털 오디오 신호에 대하여 다양한 처리를 수행할 수 있다. 예를 들어, 일실시예에 따르면, 오디오 신호 처리기(240)는 하나 이상의 디지털 오디오 신호들에 대해 샘플링 비율 변경, 하나 이상의 필터 적용, 보간(interpolation) 처리, 전체 또는 일부 주파수 대역의 증폭 또는 감쇄, 노이즈 처리(예: 노이즈 또는 에코 감쇄), 채널 변경(예: 모노 및 스테레오간 전환), 합성(mixing), 또는 지정된 신호 추출을 수행할 수 있다. 일실시예에 따르면, 오디오 신호 처리기(240)의 하나 이상의 기능들은 이퀄라이저(equalizer)의 형태로 구현될 수 있다.
DAC(250)는 디지털 오디오 신호를 아날로그 오디오 신호로 변환할 수 있다. 예를 들어, 일실시예에 따르면, DAC(250)는 오디오 신호 처리기(240)에 의해 처리된 디지털 오디오 신호, 또는 전자 장치(101)의 다른 구성 요소(예: 프로세서(120) 또는 메모리(130))로부터 획득한 디지털 오디오 신호를 아날로그 오디오 신호로 변환할 수 있다.
오디오 출력 믹서(260)는 출력할 복수의 오디오 신호들을 적어도 하나의 오디오 신호로 합성할 수 있다. 예를 들어, 일실시예에 따르면, 오디오 출력 믹서(260)는 DAC(250)를 통해 아날로그로 전환된 오디오 신호 및 다른 아날로그 오디오 신호(예: 오디오 입력 인터페이스(210)을 통해 수신한 아날로그 오디오 신호)를 적어도 하나의 아날로그 오디오 신호로 합성할 수 있다.
오디오 출력 인터페이스(270)는 DAC(250)를 통해 변환된 아날로그 오디오 신호, 또는 추가적으로 또는 대체적으로 오디오 출력 믹서(260)에 의해 합성된 아날로그 오디오 신호를 음향 출력 모듈(155) 를 통해 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 모듈(155)는, 예를 들어, dynamic driver 또는 balanced armature driver 같은 스피커, 또는 리시버를 포함할 수 있다. 일실시예에 따르면, 음향 출력 모듈(155)는 복수의 스피커들을 포함할 수 있다. 이런 경우, 오디오 출력 인터페이스(270)는 상기 복수의 스피커들 중 적어도 일부 스피커들을 통하여 서로 다른 복수의 채널들(예: 스테레오, 또는 5.1채널)을 갖는 오디오 신호를 출력할 수 있다. 일실시예에 따르면, 오디오 출력 인터페이스(270)는 외부의 전자 장치(102)(예: 외부 스피커 또는 헤드셋)와 연결 단자(178)를 통해 직접, 또는 무선 통신 모듈(192)을 통하여 무선으로 연결되어 오디오 신호를 출력할 수 있다.
일실시예에 따르면, 오디오 모듈(170)은 오디오 입력 믹서(220) 또는 오디오 출력 믹서(260)를 별도로 구비하지 않고, 오디오 신호 처리기(240)의 적어도 하나의 기능을 이용하여 복수의 디지털 오디오 신호들을 합성하여 적어도 하나의 디지털 오디오 신호를 생성할 수 있다.
일실시예에 따르면, 오디오 모듈(170)은 오디오 입력 인터페이스(210)를 통해 입력된 아날로그 오디오 신호, 또는 오디오 출력 인터페이스(270)를 통해 출력될 오디오 신호를 증폭할 수 있는 오디오 증폭기(미도시)(예: 스피커 증폭 회로)를 포함할 수 있다. 일실시예에 따르면, 상기 오디오 증폭기는 오디오 모듈(170)과 별도의 모듈로 구성될 수 있다.
도 3은 일 실시예에 따른 전자 장치에 포함된 구성 요소들의 블록도를 도시한다.
도 3을 참조하여, 일 실시예에 따르면, 전자 장치(300)(예: 도 1의 서버(108))는 프로세서(320)(예: 도 1의 프로세서(120)), 메모리(330)(예: 도 1의 메모리(130)), 에코 제거 모듈(351), 하울링 제거 모듈(352), 및/또는 무선 통신 회로(390)(예: 도 1의 통신 모듈(190))를 포함할 수 있다. 프로세서(320)는 메모리(330), 에코 제거 모듈(echo canceling module)(351), 하울링 제거 모듈(howling canceling module)(352), 및/또는 무선 통신 회로(390)와 작동적으로(operatively) 연결될 수 있다. 도 3에 도시된 전자 장치(300)의 구성은 예시적인 것으로서 본 문서의 실시 예들이 이에 제한되는 것은 아니다. 예를 들어, 에코 제거 모듈(351) 및/또는 하울링 제거 모듈(352)은 프로세서(320)와 별개로 구현되는 것으로 도시되어 있으나 메인 프로세서(321)의 일부 및/또는 포함되어 구현될 수 있다. 다른 예를 들어, 전자 장치(300)는 도 3에 미도시된 구성 요소들(예: 도 1의 인터페이스(177))을 더 포함할 수 있다.
본 발명의 다양한 실시 예들에 따르면, 프로세서(320)는 전자 장치에서 실행되는 다양한 프로세스들을 처리하는 메인 프로세서(예: CPU; central proceeding unit)(예: 도 1의 메인 프로세서(121)) 및 오디오 데이터의 송신 및 수신과 관련된 프로세스들을 처리하는 보조 프로세서)(예: DSP; digital signal processor)(예: 도 1의 보조 프로세서(123))를 포함할 수 있다. 프로세서(320)는 시스템 온 칩(SoC; System on Chip)으로 구현될 수 있다.
프로세서(320)는, 일 실시예에 따르면, 메모리(330), 에코 제거 모듈(351), 하울링 제거 모듈(352), 및/또는 무선 통신 회로(390)와 작동적으로(operatively) 연결되어 동작할 수 있다. 예를 들어, 프로세서(320)는 메모리(330)에 저장된 정보를 이용하여 전자 장치(300)가 제공하는 오디오 데이터 처리 기능을 처리할 수 있다. 프로세서(320)는 무선 통신 회로(390)를 통하여 외부(예: 외부 전자 장치(301))로부터 다양한 데이터들을 송신 및/또는 수신할 수 있다.
메모리(330)는 실행 되었을 때, 프로세서(320)로 하여금 전자 장치(300)가 다양한 동작들을 수행하도록 하는 하나 이상의 인스트럭션들(instructions)을 저장할 수 있다. 일 실시예에 따르면, 메모리(330)는 프로세서(320)와 작동적으로 연결되고, 저장된 데이터를 프로세서(320)로 송신하거나 프로세서(320)에서 전송하는 데이터를 저장할 수 있다. 예를 들어, 메모리(330)는 전자 장치(300)의 데이터 처리 동작과 연관된 파라미터를 저장할 수 있다. 일 실시예에 따르면, 메모리(330)는 전자 장치(300)가 오디오 데이터 처리 동작을 수행하기 위하여 요구되는 다양한 어플리케이션 및/또는 어플리케이션 매니저를 저장할 수 있다. 예를 들어, 메모리(330)는 레코딩(recording) 어플리케이션 및/또는 미디어(media) 어플리케이션을 저장할 수 있다. 레코딩 어플리케이션은 복수의 오디오 데이터들을 기록하는 기능을 제공할 수 있다. 미디어 어플리케이션은 메모리(330)에 저장된 오디오 데이터들을 외부로 출력하는 기능을 제공할 수 있다.
에코 제거 모듈(351)은, 일 실시 예에 따르면, 오디오 데이터에 포함된 에코 신호를 제거할 수 있다. 예를 들어, 에코 제거 모듈(351)은 에코 캔슬러(echo canceller)를 포함할 수 있다. 전자 장치(300)는 에코 캔슬러를 이용하여 전자 장치(300)에서 출력된 오디오 데이터 또는 음성 신호가 입력 장치(예: 마이크)로 다시 입력됨에 따라 발생하는 에코 신호를 제거할 수 있다. 일 예로, 에코 제거 모듈(351)은 전자 장치(300)의 출력 장치(예: 스피커)에서 출력된 오디오 데이터 또는 음성 신호를 에코 기준(echo reference) 데이터로 설정할 수 있다. 에코 제거 모듈(351)은 설정된 에코 기준 데이터를 기반으로 오디오 신호 레벨(예: 에코 레벨(echo level))에 연관된 적어도 하나의 조건을 생성하고, 오디오 데이터에 포함된 오디오 신호의 주파수 특성을 식별할 수 있다. 예를 들어, 에코 제거 모듈(351)은 에코 기준 데이터를 이용하여 지정된 주파수 특성을 가지는 신호를 에코 신호로 식별하고, 식별된 에코 신호를 오디오 데이터에서 제거할 수 있다. 예를 들어, 에코 제거 모듈(351)은 전자 장치(300)가 외부(예: 외부 전자 장치(301))로부터 수신한 오디오 데이터들 중 상기 적어도 하나의 조건에 포함된 임계 값을 초과하는 오디오 데이터를 식별할 수 있다. 상기 임계 값은, 수신한 오디오 데이터들 중 적어도 일부의 RMS(root mean square) 레벨을 산출하여 생성한 에코 레벨 임계값(threshold value)일 수 있다.
하울링 제거 모듈(352)은, 일 실시 예에 따르면, 복수의 외부 전자 장치들(예: 외부 전자 장치(301))이 음성 통화(예: 다자간 통화)를 수행하는 과정에서 발생하는 하울링을 검출하고, 발생한 하울링을 제거하는 동작을 수행할 수 있다. 예를 들어, 하울링 제거 모듈(352)은 하울링 검출 회로를 포함할 수 있다. 하울링 검출 회로는 오디오 데이터에 포함된 주파수를 식별하고, 발산하는 것으로 추정되는 주파수 대역을 검출할 수 있다. 하울링 검출 회로는 오디오 데이터를 분석하여 획득한 주파수 대역 별 에너지 비율 정보에 기반하여 하울링을 검출할 수 있다. 일 예로, 하울링 검출 회로는 지정된 주파수 대역의 에너지 변화율이 큰 경우 상기 지정된 주파수 대역에 하울링이 발생한 것으로 판단하고 하울링을 검출할 수 있다. 다른 예로, 복수의 외부 전자 장치들로부터 수신한 오디오 데이터의 에코 레벨이 지정된 값(예: 에코 레벨 임계 값)을 초과하는 경우, 하울링 검출 회로는 특정 오디오 데이터에 포함된 오디오 신호 파형 또는 참조 신호 중 적어도 하나를 이용하여 하울링을 감지할 수 있다. 하울링 검출 회로는 주파수 대역의 에너지 변화율이 주기적으로 변화하는 경우, 지정된 주기에 기반하여 모니터링 한 결과 상기 지정된 주파수 대역을 하울링이 발생하는 주파수 대역으로 식별할 수 있다. 예를 들어, 하울링 제거 모듈(352)은 하울링 제거 회로를 포함할 수 있다. 하울링 제거 회로는 하울링 검출 회로에서 전송한 검출 정보를 기반으로 하울링을 제거할 수 있다. 하울링 제거 회로는 하울링 검출 회로에서 전송한 검출 정보는 다양한 주파수 대역의 피크 값 또는 에너지 값 중 적어도 하나를 포함할 수 있다. 일 예로, 하울링 검출 회로에서 검출된 지정된 주파수 대역의 이득을 하울링 발산이 일어나지 않는 범위로 조절하는 필터링 동작을 수행할 수 있다. 다른 예로, 하울링 검출 회로는 하울링 발생을 야기하는 오디오 데이터의 오디오 신호 레벨을 변경하여 하울링 발산이 일어나지 않는 범위로 조절하는 필터링 동작을 수행할 수 있다. 하울링 제거 모듈(352)은 에코 제거 모듈(351)이 에코 제거 기능을 수행한 후 동작할 수 있다. 예를 들어, 하울링 제거 모듈(352)은 에코 제거 모듈(351)이 에코 제거 기능을 수행한 후, 전자 장치(300)가 복수의 외부 전자 장치들과 무선 통신을 수행하는 과정에서 수신한 데이터의 에코 레벨이 지정된 값(예: 에코 레벨 임계 값) 이하인 경우 하울링 제거 기능의 수행을 종료할 수 있다. 예를 들어, 하울링 제거 모듈(352)은 지정된 주기에 기반하여 오디오 데이터를 모니터링(monitoring) 할 수 있다. 하울링 제거 기능의 수행이 종료되면, 하울링 제거 모듈(352)은 복수의 외부 전자 장치들로부터 수신한 오디오 데이터의 에코 레벨을 지정된 주기에 기반하여 모니터링(monitoring) 할 수 있다.
무선 통신 회로(390)는, 일 실시 예에 따르면, 전자 장치(300)를 외부(예: 외부 전자 장치(301))와 전기적으로 연결하는 동작을 수행할 수 있다. 전자 장치(300)는 무선 통신 회로(390)를 통하여 외부 전자 장치(301)로부터 오디오 데이터를 수신할 수 있다. 상기 오디오 데이터는, 외부 전자 장치(301)가 입력 장치(예: 마이크)를 이용하여 획득한 사용자 발화 입력에 대응하는 데이터일 수 있다. 예를 들어, 전자 장치(300)는 외부 전자 장치(301)와 무선 통신 회로(390)를 통하여 무선 통신을 수행하는 동안 발생하는 지연 시간(예: 네트워크 지연 시간 및/또는 경로 지연 시간(electrical path delay))을 보상하는 동작을 수행할 수도 있다. 일 예로, 전자 장치(300)는 복수의 외부 전자 장치들과 무선 통신 회로(390)를 통해 무선 통신을 수행하여 수신한 다양한 데이터에 기반하여 경로 지연 시간을 산출할 수 있다. 전자 장치(300)는 산출된 경로 지연 시간을 각각 보상한 후 계속하여 복수의 외부 전자 장치들과 무선 통신을 수행할 수 있다.
도 3을 참조하여, 일 실시예에 따르면, 외부 전자 장치(301)(예: 도 1의 전자 장치(101))는 프로세서(322)(예: 도 1의 프로세서(120)), 메모리(332)(예: 도 1의 메모리(130)), 오디오 회로(372)(예: 도 1의 오디오 모듈(170)), 입출력 장치(382)(예: 도 1의 입력 모듈(150) 및 음향 출력 모듈(155)), 및/또는 무선 통신 회로(392)(예: 도 1의 통신 모듈(190))를 포함할 수 있다. 프로세서(322)는 메모리(332), 오디오 회로(372), 입출력 장치(382), 및/또는 무선 통신 회로(392)와 작동적으로(operatively) 연결될 수 있다. 도 3에 도시된 외부 전자 장치(301)의 구성은 예시적인 것으로서 본 문서의 실시 예들이 이에 제한되는 것은 아니다. 예를 들어, 외부 전자 장치(302)는 도 3에 미도시된 구성 요소들(예: 도 1의 디스플레이 모듈(160), 인터페이스(177), 및/또는 안테나 모듈(197))을 더 포함할 수 있다.
프로세서(322), 일 실시예에 따르면, 외부 전자 장치(302)에 포함된 입력 모듈의 일부로서 또는 외부 전자 장치(302)와 별개로 구성된 마이크(예: 다이나믹 마이크, 콘덴서 마이크, 또는 피에조 마이크)를 통하여 외부 전자 장치(301)의 외부(예: 사용자)로부터 획득한 소리(예: 노래 소리)에 대응하는 음성 신호를 수신하고, 오디오 회로(372)를 이용하여 상기 소리에 대응하는 오디오 데이터를 획득할 수 있다. 다른 예를 들어, 외부 전자 장치(301)는 무선 통신 회로(392)(예: 도 1의 무선 통신 모듈(192))을 통하여 무선으로(예: Bluetooth 통신) 연결되어 오디오 데이터를 송신 및/또는 수신할 수 있다. 예를 들어, 프로세서(322)는 입출력 장치(382)에 포함된 아날로그-디지털 변환 회로(analog to digital converter, ADC)(예: 도 2의 ADC(230))를 이용하여 음성 신호를 오디오 데이터로 변환할 수 있다. 다른 예를 들어, 프로세서(322)는 입출력 장치(382)에 포함된 디지털-아날로그 변환 회로(digital to analog converter, DAC)(예: 도 2의 DAC(250))를 이용하여 오디오 데이터가 음성으로 변환되도록 할 수 있다. 일 실시예에 따르면, 프로세서(322)는 입출력 장치(382)에 포함된 음향 출력 모듈을 이용하여 음성 신호를 출력할 수 있다. 예를 들어, 음향 출력 모듈은 dynamic driver 또는 balanced armature driver와 같은 스피커(SPK) 또는 리시버(RCV)를 포함할 수 있다. 음향 출력 모듈이 복수의 스피커들을 포함하는 경우, 프로세서(322)는 상기 복수의 스피커들 중 적어도 일부 스피커들을 통하여 서로 다른 복수의 채널들(예: 스테레오, 또는 5.1 채널)을 갖는 음성 신호를 출력하도록 오디오 출력 인터페이스(예: 도 2의 오디오 출력 인터페이스(270))를 제어할 수 있다. 일 예로, 오디오 출력 인터페이스는 외부(예: 외부 스피커 또는 헤드셋)와 연결 단자를 통해 직접, 또는 무선 통신 회로(392)를 통하여 무선으로 연결되어 음성 신호를 출력할 수도 있다.
메모리(332)는 실행 되었을 때, 프로세서(322)로 하여금 전자 장치(301)의 다양한 동작들을 수행하도록 하는 하나 이상의 인스트럭션들(instructions)을 저장할 수 있다. 일 실시예에 따르면, 메모리(332)는 프로세서(322)와 작동적으로 연결되고, 저장된 데이터를 프로세서(322)로 송신하거나 프로세서(322)에서 전송하는 데이터를 저장할 수 있다. 예를 들어, 메모리(332)는 외부 전자 장치(301)의 데이터 처리 동작과 연관된 파라미터를 저장할 수 있다. 일 실시예에 따르면, 메모리(332)는 외부 전자 장치(301)가 오디오 데이터 처리 동작을 수행하기 위하여 요구되는 다양한 어플리케이션 및/또는 어플리케이션 매니저를 저장할 수 있다. 예를 들어, 메모리(332)는 레코딩(recording) 어플리케이션 및/또는 미디어(media) 어플리케이션을 저장할 수 있다. 레코딩 어플리케이션은 입출력 장치(382)를 통하여 외부 전자 장치에 입력된 음성 신호에 대응하는 오디오 데이터들을 기록하는 기능을 제공할 수 있다. 미디어 어플리케이션은 메모리(332)에 저장된 오디오 데이터들을 외부로 출력하는 기능을 제공할 수 있다.
오디오 회로(372)는, 일 실시예에 따르면, 오디오 입력 인터페이스(예: 도 2의 오디오 입력 인터페이스(210)), 오디오 출력 인터페이스(예: 도 2의 오디오 출력 인터페이스(270)), 및/또는 오디오 신호 처리기(예: 도 2의 오디오 신호 처리기(240))를 포함할 수 있다. 오디오 회로(372)는 오디오 데이터에 대한 다양한 처리 동작을 수행할 수 있다. 예를 들어, 오디오 회로(372)는 오디오 증폭 회로(예: 스피커 증폭 회로)를 더 포함할 수 있다. 오디오 증폭 회로는 입출력 장치(382)에서 획득하거나 출력하는 음성을 증폭할 수 있다. 예를 들어, 오디오 증폭 회로는 오디오 회로(372)와 별개의 모듈로 구성될 수도 있다. 다른 실시예에 따르면, 오디오 증폭 회로(예: 스피커 증폭 회로)는 프로세서(322) 또는 입출력 장치(382)에 포함될 수도 있다.
입출력 장치(382)는, 일 실시예에 따르면, 외부(예: 사용자)로부터 오디오 데이터를 획득하거나 외부로 오디오 데이터에 대응하는 음성을 출력할 수 있다. 예를 들어, 프로세서(322)는 입출력 장치(382)를 이용하여 외부(예: 사용자)로부터 감지된 음성(예: 사용자 발화)에 대응되는 오디오 데이터를 획득할 수 있다. 입출력 장치(382)가 획득하는 오디오 데이터는 외부로부터 수신한 음성을 전기적 신호로 변환한 데이터로 참조될 수 있다. 일 예로, 프로세서(322)는 입출력 장치(382)가 감지된 음성을 아날로그-디지털 변환 회로를 이용하여 변환하고, 변환된 오디오 데이터를 획득하도록 제어할 수 있다. 다른 예로, 프로세서(322)는 입출력 장치(382)가 오디오 데이터를 디지털-아날로그 변환 회로를 이용하여 변환하고, 변환된 음성을 획득하여 외부로 출력하도록 제어할 수 있다. 예를 들어, 입출력 장치(382)는 오디오 또는 오디오 신호를 수신하도록 구성된 장치(예: 마이크, Bluetooth 수신 회로, 또는 USB 회로)를 포함할 수 있다. 다른 예를 들어, 입출력 장치(382)는 전기적 신호를 오디오 또는 오디오 신호로 출력하도록 구성된 회로(예: 스피커, Bluetooth 송신 회로, USB 회로)를 포함할 수 있다.
무선 통신 회로(392)는, 일 실시 예에 따르면, 외부 전자 장치(301)를 외부(예: 전자 장치(300))와 전기적으로 연결하는 동작을 수행할 수 있다. 외부 전자 장치(301)에 포함된 무선 통신 회로(392)에 대한 설명은 상술한 전자 장치(300)에 포함된 무선 통신 회로(390)에 대한 설명으로 대체될 수 있다.
도 4는 일 실시예에 따른 전자 장치의 오디오 데이터 처리 동작 순서도를 도시한다.
도 4에 도시된 제1 외부 전자 장치(401), 제2 외부 전자 장치(402), 제3 외부 전자 장치(403), 및/또는 제4 외부 전자 장치(404)가 포함하는 구성 요소들에 대한 설명은 도 3의 외부 전자 장치(301)에 의한 설명으로 대체될 수 있다.
동작 410에서, 제1 외부 전자 장치(401)는 제1 오디오 데이터를 획득할 수 있다. 예를 들어, 제1 외부 전자 장치(401)는 입력 장치(예: 도 1의 입력 모듈(150))을 이용하여 외부(예: 제1 사용자)로부터 입력되는 다양한 오디오 데이터들을 획득할 수 있다. 예를 들어, 제1 오디오 데이터는 제1 외부 전자 장치(401)가 적어도 하나의 오디오 입력 장치를 이용하여 획득한 제1 사용자의 발화 입력을 포함하는 데이터로 참조될 수 있다.
동작 420에서, 제1 외부 전자 장치(401)는 획득한 제1 오디오 데이터를 외부로 전송할 수 있다. 예를 들어, 제1 외부 전자 장치(401)는 제1 오디오 데이터를 무선 통신 회로(예: 도 3의 무선 통신 회로(392))를 통하여 전자 장치(400)로 전송할 수 있다.
동작 430에서, 전자 장치(400)(예: 도 3의 전자 장치(300))는 제1 외부 전자 장치(401)로부터 무선 통신 회로(예: 도 3의 무선 통신 회로(390))를 통하여 제1 오디오 데이터를 수신할 수 있다. 전자 장치(400)는 제1 오디오 데이터에 기반하여 다양한 데이터들을 생성할 수 있다. 예를 들어, 전자 장치(400)는 제1 오디오 데이터에 기반하여 오디오 신호 레벨에 연관된 적어도 하나의 조건을 생성할 수 있다. 일 예로, 상기 적어도 하나의 조건은 오디오 데이터의 에코 레벨과 연관된 임계 값을 포함할 수 있다. 상기 임계 값은 제1 오디오 데이터의 RMS(root mean square) 레벨을 산출하여 생성한 에코 레벨 임계 값(threshold value)일 수 있다.
동작 440에서, 전자 장치(400)는 제1 오디오 데이터를 제2 외부 전자 장치(402), 제3 외부 전자 장치(403), 및/또는 제4 외부 전자 장치(404)로 전송할 수 있다. 예를 들어, 전자 장치(400)는 무선 통신 회로를 통하여 복수의 외부 전자 장치들(402, 403, 및 404)로 제1 오디오 데이터를 전송할 수 있다.
동작 450에서, 복수의 외부 전자 장치들(402, 403, 및 404)은 수신한 제1 오디오 데이터를 출력하고, 입력 장치를 통해 출력된 오디오 데이터를 획득할 수 있다. 예를 들어, 제2 외부 전자 장치(402), 제3 외부 전자 장치(403), 및/또는 제4 외부 전자 장치(404)는 제1 오디오 데이터를 적어도 하나의 오디오 출력 장치를 통하여 출력하고, 출력된 오디오 데이터를 적어도 하나의 입력 장치를 이용하여 상기 출력된 오디오 데이터를 획득할 수 있다. 다른 예를 들어, 제2 외부 전자 장치(402), 제3 외부 전자 장치(403), 및/또는 제4 외부 전자 장치(404)는 외부(예: 제2 사용자, 제3 사용자, 및/또는 제4 사용자)로부터 입력되는 다양한 오디오 데이터들을 획득할 수도 있다.
동작 460에서, 복수의 외부 전자 장치들(402, 403, 및 404)은 무선 통신 회로를 통하여 오디오 데이터를 전자 장치(400)로 전송할 수 있다. 예를 들어, 제2 외부 전자 장치(402)는 제2 오디오 데이터를 전자 장치(400)로 전송할 수 있다. 제2 오디오 데이터는 제2 외부 전자 장치(402)가 오디오 입력 장치를 이용하여 획득한 제2 사용자의 발화 입력 및 오디오 출력 장치를 통하여 출력한 제1 오디오 데이터의 적어도 일부를 포함할 수 있다. 예를 들어, 제3 외부 전자 장치(403)는 제3 오디오 데이터를 전자 장치(400)로 전송할 수 있다. 제3 오디오 데이터는 제3 외부 전자 장치(403)가 오디오 입력 장치를 이용하여 획득한 제3 사용자의 발화 입력 및 오디오 출력 장치를 통하여 출력한 제1 오디오 데이터의 적어도 일부를 포함할 수 있다. 예를 들어, 제4 외부 전자 장치(404)는 제4 오디오 데이터를 전자 장치(400)로 전송할 수 있다. 제4 오디오 데이터는 제4 외부 전자 장치(404)가 오디오 입력 장치를 이용하여 획득한 제4 사용자의 발화 입력 및 오디오 출력 장치를 통하여 출력한 제1 오디오 데이터의 적어도 일부를 포함할 수 있다.
동작 470에서, 전자 장치(400)는 수신한 복수의 오디오 데이터들 중 지정된 조건을 초과하는 오디오 데이터를 식별할 수 있다. 예를 들어, 전자 장치(400)는 동작 430에서 생성한 적어도 하나의 조건에 포함된 임계 값을 초과하는 오디오 데이터를 식별할 수 있다. 예를 들어, 전자 장치(400)는 제2 오디오 데이터, 제3 오디오 데이터, 및 제4 오디오 데이터 중 상기 적어도 하나의 조건에 포함된 임계 값을 초과하는 오디오 데이터를 식별할 수 있다. 상기 임계 값은, 제1 오디오 데이터의 RMS 레벨을 산출하여 생성한 에코 레벨 임계 값일 수 있다. 에코 레벨 임계 값은 전자 장치(400)가 기 설정된 에코 기준(echo reference) 데이터를 기반으로 생성한 오디오 신호 레벨에 연관된 조건일 수 있다. 예를 들어, 전자 장치(400)는 에코 기준 데이터를 이용하여 지정된 주파수 특성을 가지는 신호를 에코 신호로 식별할 수 있다. 전자 장치는 외부로부터 수신한 오디오 데이터들 중 임계 값을 초과하는 오디오 데이터를 식별할 수 있다. 상기 임계 값은, 수신한 오디오 데이터들 중 적어도 일부의 RMS(root mean square) 레벨을 산출하여 생성한 에코 레벨 임계값(threshold value)일 수 있다.
동작 480에서, 전자 장치(400)는 동작 470의 식별 결과에 기반하여 상기 식별된 오디오 데이터에 대응하는 적어도 하나의 외부 전자 장치를 식별할 수 있다. 예를 들어, 전자 장치(400)는 제2 외부 전자 장치(402), 제3 외부 전자 장치(403), 및 제4 외부 전자 장치(404) 중 상기 식별된 오디오 데이터에 대응하는 적어도 하나의 외부 전자 장치를 식별할 수 있다. 전자 장치(400)는 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터에 대하여 에코 제거 모듈(예: 도 3의 에코 제거 모듈(351))을 이용하여 에코 제거 기능을 수행할 수 있다.
도 5는 일 실시 예에 따른 전자 장치의 오디오 데이터 처리 과정을 나타내는 블록도를 도시한다.
일 실시 예에 따르면, 제1 외부 전자 장치(501)(예: 도 4의 제1 외부 전자 장치(401))는 전자 장치(500)로 다양한 오디오 데이터들을 전송(510)할 수 있다. 예를 들어, 참조 번호 501-1은 제1 외부 전자 장치(501)가 획득한 오디오 데이터의 처리 경로로 참조될 수 있다. 제1 외부 전자 장치(501)는 입력 장치(예: 도 1의 입력 모듈(150))을 이용하여 외부(예: 제1 사용자)로부터 입력되는 제1 오디오 데이터(551)를 획득할 수 있다. 제1 오디오 데이터(551)는 제1 외부 전자 장치(501)가 적어도 하나의 오디오 입력 장치를 이용하여 획득한 제1 사용자의 발화 입력을 포함하는 데이터로 참조될 수 있다. 제1 외부 전자 장치(501)는 획득한 제1 오디오 데이터(551)를 전자 장치(500)로 전송할 수 있다.
일 실시 예에 따르면, 전자 장치(500)는 제1 외부 전자 장치(501)로부터 수신한 제1 오디오 데이터(551)에 기반하여 오디오 신호 레벨에 연관된 적어도 하나의 조건을 생성할 수 있다. 예를 들어, 상기 적어도 하나의 조건은 제1 오디오 데이터(551)의 RMS 레벨을 포함할 수 있다. 일 실시 예에 따르면, 전자 장치(500)는 제1 외부 전자 장치(501)로부터 수신한 제1 오디오 데이터(551)를 외부(예: 복수의 외부 전자 장치들(502))로 전송할 수 있다. 예를 들어, 전자 장치(500)는 제1 오디오 데이터(551)를 제2 외부 전자 장치(예: 도 4의 제2 외부 전자 장치(402)), 제3 외부 전자 장치(예: 도 4의 제3 외부 전자 장치(403)), 및 제4 외부 전자 장치(예: 도 4의 제4 외부 전자 장치(404))로 전송할 수 있다. 참조 번호 502-1은 전자 장치(500) 및 제2 외부 전자 장치 간의 데이터 처리 경로로, 참조 번호 502-2는 전자 장치(500) 및 제3 외부 전자 장치 간의 데이터 처리 경로로, 참조 번호 502-3은 전자 장치(500) 및 제4 외부 전자 장치 간의 데이터 처리 경로로 각각 참조될 수 있다. 산출하여 생성한 에코 레벨 임계 값을 포함할 수 있다.
일 실시 예에 따르면, 복수의 외부 전자 장치들(502)은 전자 장치(500)로부터 수신한 제1 오디오 데이터(551)를 오디오 출력 장치를 통하여 출력하고, 오디오 입력 장치를 이용하여 상기 출력된 제1 오디오 데이터(551)를 획득할 수 있다. 복수의 외부 전자 장치들(502)은 상기 출력된 제1 오디오 데이터(551) 및 외부로부터 수신되는 다양한 오디오 데이터들을 획득할 수 있다. 예를 들어, 제2 외부 전자 장치는 제2 오디오 데이터(552)를 획득할 수 있다. 제2 오디오 데이터(552)는 외부 전자 장치가 오디오 입력 장치를 이용하여 획득한 제2 사용자의 발화 입력 및 오디오 출력 장치를 통하여 출력한 제1 오디오 데이터(551)의 적어도 일부를 포함할 수 있다. 예를 들어, 제3 외부 전자 장치는 제3 오디오 데이터(553)를 획득할 수 있다. 제3 오디오 데이터(553)는 제3 외부 전자 장치가 오디오 입력 장치를 이용하여 획득한 제3 사용자의 발화 입력 및 오디오 출력 장치를 통하여 출력한 제1 오디오 데이터(551)의 적어도 일부를 포함할 수 있다. 예를 들어, 제4 외부 전자 장치는 제4 오디오 데이터(554)를 획득할 수 있다. 제4 오디오 데이터(554)는 제4 외부 전자 장치가 오디오 입력 장치를 이용하여 획득한 제4 사용자의 발화 입력 및 오디오 출력 장치를 통하여 출력한 제1 오디오 데이터(551)의 적어도 일부를 포함할 수 있다. 복수의 전자 장치들(502)이 전자 장치(500)와 무선 통신을 수행하는 과정에서, 위치, 성능의 차이, 및/또는 통신 상태 등의 차이로 인하여 서로 다른 지연 시간(예: 네트워크 지연 시간 또는 경로 지연 시간(electrical path delay))이 발생할 수 있다. 예를 들어, 전자 장치(500)가 복수의 외부 전자 장치들(502)과 무선 통신을 수행하는 과정에서, 제2 외부 전자 장치 간에 제1 경로 지연 시간(D1), 제3 외부 전자 장치 간에 제2 경로 지연 시간(D2), 및 제43 외부 전자 장치 간에 제3 경로 지연 시간(D3)이 발생할 수 있다. 복수의 외부 전자 장치들(502)은 서로 다른 경로 지연 시간에 기반하여 획득한 오디오 데이터들(제2 오디오 데이터(552), 제3 오디오 데이터(553), 및 제4 오디오 데이터(554))을 전자 장치(500)로 각각 전송할 수 있다.
일 실시 예에 따르면, 전자 장치(500)는 무선 통신 회로를 통하여 복수의 외부 전자 장치들(502)로부터 다양한 오디오 데이터들을 수신할 수 있다. 예를 들어, 전자 장치(500)는 제2 오디오 데이터(552), 제3 오디오 데이터(553), 및 제4 오디오 데이터(554)에 각각 기반하여, 제1 경로 지연 시간(D1), 제2 경로 지연 시간(D2), 및 제3 경로 지연 시간(D32)을 산출할 수 있다. 전자 장치(500)는 산출된 경로 지연 시간들을 보상하여 복수의 외부 전자 장치(502)들과 무선 통신을 수행할 수 있다. 예를 들어, 전자 장치(500)는 제2 오디오 데이터(552), 제3 오디오 데이터(553), 및 제4 오디오 데이터(554) 중, 제1 오디오 데이터(551)에 기반하여 생성한 지정된 조건(예: 에코 레벨 임계 값)을 초과하는 오디오 데이터를 식별할 수 있다. 전자 장치(500)는 식별된 적어도 하나의 오디오 데이터에 대응하는 적어도 하나의 외부 전자 장치(예: 제4 외부 전자 장치)를 식별할 수 있다. 전자 장치(500)는 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터에 대하여 에코 제거 기능을 수행할 수 있다. 일 예로, 전자 장치(500)는 에코 제거 모듈(예: 도 3의 에코 제거 모듈(351))을 이용하여 상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터에 대하여 에코 제거 기능을 수행할 수 있다.
도 6은 일 실시 예에 따른 전자 장치의 오디오 데이터 처리 동작 순서도를 도시한다.
도 6에서, 도 4와 동일 또는 유사한 동작들에 대한 설명은 상술한 도 4의 설명에 의하여 대체될 수 있다. 예를 들어, 도 6의 동작 610 내지 동작 650에 대한 설명은 도 4의 동작 410 내지 450에 대한 설명으로 대체될 수 있다.
동작 660에서, 제4 외부 전자 장치(604)는 제4 오디오 데이터를 전자 장치(600)로 전송할 수 있다. 예를 들어, 제4 외부 전자 장치(604)가 전송한 제4 오디오 데이터는 제4 외부 전자 장치(604)가 오디오 입력 장치를 이용하여 획득한 제4 사용자의 발화 입력 및 오디오 출력 장치를 통하여 출력한 상기 제1 오디오 데이터의 적어도 일부를 포함할 수 있다. 예를 들어, 상기 오디오 출력 장치를 통하여 출력한 제1 오디오 데이터의 적어도 일부는 에코(echo) 신호로 참조되고, 복수의 전자 장치들 간의 다자간 통화 기능 수행 과정에서 하울링(howling)을 발생시킬 수 있다.
동작 670에서, 전자 장치(600)는 제4 오디오 데이터를 수신하고, 제4 오디오 데이터가 지정된 조건을 초과하는지 여부를 판단할 수 있다. 상기 지정된 조건을 판단하는 동작은, 전자 장치(600)가 하울링 제거 모듈(예: 도 3의 하울링 제거 모듈(352))을 이용하여 복수의 오디오 데이터의 에코 레벨이 지정된 값(예: 에코 레벨 임계 값)을 초과하는지 여부를 판단하는 동작에 대응될 수 있다. 예를 들어, 복수의 외부 전자 장치들로부터 수신한 오디오 데이터의 에코 레벨이 지정된 값을 초과하는 경우, 전자 장치(600)는 특정 오디오 데이터에 포함된 오디오 신호 파형 또는 참조 신호 중 적어도 하나를 이용하여 하울링을 감지할 수 있다. 예를 들어, 전자 장치(600)는 제4 오디오 데이터의 에코 레벨이 에코 레벨 임계 값을 초과하는지 여부를 판단할 수 있다. 제4 오디오 데이터의 에코 레벨이 에코 레벨 임계 값을 초과하는 경우, 전자 장치(600)는 상기 제4 오디오 데이터에 대응하는 제4 외부 전자 장치(604)를 식별하고, 제4 외부 전자 장치(604)와 연관된 오디오 데이터에 대하여 하울링 제거 기능을 수행할 수 있다. 전자 장치(600)가 수행하는 하울링 제거 기능에 대한 설명은 상술한 도 3의 하울링 제거 모듈(352)에 대한 설명으로 대체될 수 있다.
도 6에서, 동작 670에 대한 설명은 도 4의 동작 470 및 480에 대한 설명과 구분하여 개시되어 있으나, 본 문서의 실시 예들이 이에 제한되는 것은 아니다. 예를 들어, 전자 장치(600)는 동작 470 및 480을 수행한 후 복수의 외부 전자 장치들(601 내지 604)과 무선 통신을 통하여 오디오 데이터를 송신 및/또는 수신하는 과정에서 동작 670을 수행할 수 있다. 다른 예를 들어, 전자 장치(600)는 동작 470 및 480의 수행을 생략한 후 동작 670을 수행할 수도 있다.
도 7은 일 실시 예에 따른 전자 장치의 오디오 데이터 처리 과정을 나타내는 블록도(700)를 도시한다.
도 7을 참조하여, 일 실시 예에 따르면, 전자 장치(700)는 복수의 외부 전자 장치들(701 내지 704)과 무선 통신 회로(예: 도 1의 통신 모듈(190))를 통하여 다양한 데이터들을 송신 및/또는 수신할 수 있다. 예를 들어, 전자 장치(700)는 복수의 외부 전자 장치들(701 내지 704)이 다자간 통화 기능을 수행하는 과정에서 처리하는 오디오 데이터들에 대한 처리 및/또는 연산을 수행할 수 있다. 이하에서, 전자 장치(700)가 오디오 데이터를 처리하는 동작에 대한 설명을 순차적으로 설명한다.
참조 번호 710을 참조하여, 전자 장치(700)는 무선 통신 회로를 통하여, 제1 외부 전자 장치(701)로부터 오디오 데이터를 수신할 수 있다. 예를 들어, 제1 외부 전자 장치(701)가 전송하는 오디오 데이터는 제1 외부 전자 장치(701)가 적어도 하나의 오디오 입력 장치(예: 도 1의 입력 모듈(150))를 이용하여 획득한 제1 사용자의 발화 입력을 포함하는 데이터로 참조될 수 있다. 전자 장치(700)는 제1 오디오 데이터를 수신하고, 제1 오디오 데이터에 기반하여 오디오 신호 레벨에 연관된 적어도 하나의 조건을 생성할 수 있다. 예를 들어, 오디오 신호 레벨에 연관된 적어도 하나의 조건은 임계 값(예: 에코 레벨 임계 값)을 포함할 수 있다. 전자 장치(700)는 생성한 에코 레벨 임계 값을 메모리(에: 도 1의 메모리(130))에 저장하고, 제1 오디오 데이터 외에 다른 오디오 데이터들의 에코 레벨을 상기 저장된 에코 레벨 임계 값과 상호 비교하는 동작을 수행할 수 있다.
참조 번호 720을 참조하여, 전자 장치(700)는 제1 오디오 데이터를 제2 외부 전자 장치(702), 제3 외부 전자 장치(703), 및 제4 외부 전자 장치(704)로 전송할 수 있다. 예를 들어, 복수의 외부 전자 장치들(701 내지 704)은 수신한 제1 오디오 데이터를 적어도 하나의 오디오 출력 장치(예: 도 1의 음향 출력 모듈(155))을 통하여 출력할 수 있다. 복수의 외부 전자 장치들(701 내지 704)은 출력한 제1 오디오 데이터의 일부 및 적어도 하나의 오디오 입력 장치를 이용하여 획득한 외부 입력을 포함하는 오디오 데이터를 획득할 수 있다.
참조 번호 730을 참조하여, 제4 외부 전자 장치(704)는 참조 번호 720에서 획득한 오디오 데이터를 전자 장치(700)로 전송할 수 있다. 예를 들어, 제4 외부 전자 장치(704)는 제4 오디오 데이터를 전자 장치(700)로 전송할 수 있다. 제4 오디오 데이터는, 제4 외부 전자 장치(704)가 오디오 입력 장치를 이용하여 획득한 제4 사용자 발화 입력 및 오디오 출력 장치를 통하여 출력한 제1 오디오 데이터의 적어도 일부를 포함할 수 있다. 전자 장치(700)는 수신한 제4 오디오 데이터를 참조 번호 710에서 생성한 임계 값을 기반으로 분석할 수 있다. 예를 들어, 전자 장치(700)는 제4 오디오 데이터의 에코 레벨이 기 생성된 에코 레벨 임계 값을 초과하는지 여부를 판단할 수 있다. 예를 들어, 전자 장치(700)는 제1 오디오 데이터에 포함된 오디오 신호 파형 또는 참조 신호 제4 외부 전자 장치(704)가 전송한 제4 오디오 데이터에 의해 발생한 하울링을 감지할 수 있다.
참조 번호 740을 참조하여, 전자 장치(700)는 에코 제거 모듈(751) 및/또는 하울링 제거 모듈(752)을 이용하여 지정된 기능을 수행한 후 오디오 데이터를 외부(예: 제1 외부 전자 장치(701), 제2 외부 전자 장치(702), 및 제3 외부 전자 장치(703))로 전송할 수 있다. 예를 들어, 제4 오디오 데이터의 에코 레벨이 에코 레벨 임계 값을 초과하는 것으로 판단된 경우, 전자 장치(700)는 제4 외부 전자 장치(704)와 연관된 오디오 데이터에 대하여 하울링 제거 모듈(752)(예: 도 3의 하울링 제거 모듈(352))을 이용하여 하울링 제거 동작을 수행할 수 있다. 일 예로, 전자 장치(700)는 제4 외부 전자 장치(704)에 연관된 오디오 데이터의 오디오 신호 레벨을 변경하고, 변경된 오디오 신호 레벨을 포함하는 오디오 데이터를 외부로 전송할 수 있다.
본 문서에 개시되는 일 실시 예에 따른 전자 장치는, 무선 통신 회로, 프로세서, 및 상기 프로세서에 작동적으로(operatively) 연결되는 메모리를 포함할 수 있다. 예를 들어, 상기 메모리는, 실행 되었을 때 상기 프로세서가 상기 무선 통신 회로를 통하여, 제1 외부 전자 장치로부터 제1 오디오 데이터를 수신하고, 상기 제1 오디오 데이터에 기반하여 오디오 신호 레벨에 연관된 적어도 하나의 조건을 생성하고, 상기 제1 오디오 데이터를 제2 외부 전자 장치 및 제3 외부 전자 장치로 전송하고, 상기 무선 통신 회로를 통하여, 상기 제2 외부 전자 장치 및 상기 제3 외부 전자 장치로부터 각각 제2 오디오 데이터 및 제3 오디오 데이터를 수신하고, 상기 제2 오디오 데이터 및 상기 제3 오디오 데이터 중 상기 적어도 하나의 조건에 포함된 임계 값을 초과하는 오디오 데이터를 식별하고, 상기 제2 외부 전자 장치와 상기 제3 외부 전자 장치 중, 상기 식별된 오디오 데이터에 대응하는 적어도 하나의 외부 전자 장치를 식별하고, 상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터에 대하여, 에코 제거 기능을 수행하도록 하는 하나 이상의 인스트럭션들(instructions)을 저장할 수 있다.
일 실시예에 따르면, 상기 임계 값은, 상기 제1 오디오 데이터의 RMS(root mean square) 레벨을 산출하여 생성한 에코 레벨 임계 값(threshold value)일 수 있다.
일 실시예에 따르면, 상기 제1 오디오 데이터는, 상기 제1 외부 전자 장치가 적어도 하나의 오디오 입력 장치를 이용하여 획득한 제1 사용자의 발화 입력을 포함하고, 상기 제2 오디오 데이터는, 상기 제2 외부 전자 장치가 오디오 입력 장치를 이용하여 획득한 제2 사용자의 발화 입력 및 오디오 출력 장치를 통하여 출력한 상기 제1 오디오 데이터의 적어도 일부를 포함하고, 상기 제3 오디오 데이터는, 상기 제3 외부 전자 장치가 오디오 입력 장치를 이용하여 획득한 제3 사용자의 발화 입력 및 오디오 출력 장치를 통하여 출력한 상기 제1 오디오 데이터의 적어도 일부를 포함할 수 있다.
일 실시예에 따르면, 상기 하나 이상의 인스트럭션들(instructions)은 실행 시에 상기 프로세서가, 상기 제2 오디오 데이터에 기반하여, 상기 제2 외부 전자 장치와 무선 통신을 수행하는 동안 발생하는 제1 경로 지연 시간을 산출하고, 상기 제3 오디오 데이터에 기반하여, 상기 제3 외부 전자 장치와 무선 통신을 수행하는 동안 발생하는 제2 경로 지연 시간을 산출하고, 산출된 상기 제1 경로 지연 시간 및 상기 제2 경로 지연 시간을 보상하여 상기 제2 외부 전자 장치 및 상기 제3 외부 전자 장치와 무선 통신을 수행하도록 설정될 수 있다.
일 실시예에 따르면, 상기 하나 이상의 인스트럭션들(instructions)은 실행 시에 상기 프로세서가, 상기 에코 제거 기능을 수행한 후, 상기 식별된 적어도 하나의 외부 전자 장치로부터 수신하는 오디오 데이터의 에코 레벨을 지정된 주기에 기반하여 모니터링(monitoring) 하고, 모니터링 한 상기 오디오 데이터의 에코 레벨이 상기 에코 레벨 임계 값을 초과하는 경우, 상기 식별된 적어도 하나의 외부 전자 장치와 연관된 오디오 데이터에 대하여 하울링 제거(howling canceling) 기능을 수행하도록 설정될 수 있다.
일 실시예에 따르면, 상기 하나 이상의 인스트럭션들(instructions)은 실행 시에 상기 프로세서가, 상기 제2 전자 장치 및 상기 제3 전자 장치로부터 수신하는 오디오 데이터를 상기 지정된 주기에 기반하여 모니터링(monitoring) 하고, 모니터링 한 상기 오디오 데이터의 에코 레벨이 상기 임계 값 이하인 경우, 상기 하울링 제거 기능의 수행을 종료하도록 설정될 수 있다.
일 실시예에 따르면, 상기 하나 이상의 인스트럭션들(instructions)은 실행 시에 상기 프로세서가, 상기 식별된 적어도 하나의 외부 전자 장치로부터 수신한 상기 오디오 데이터의 에코 레벨이 상기 임계 값을 초과하는 경우, 상기 제1 오디오 데이터에 포함된 오디오 신호 파형 또는 참조 신호 중 적어도 하나를 이용하여, 상기 식별된 적어도 하나의 외부 전자 장치에 의해 발생한 하울링을 감지하도록 설정될 수 있다.
일 실시예에 따르면, 상기 하나 이상의 인스트럭션들(instructions)은 실행 시에 상기 프로세서가, 상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터의 오디오 신호 레벨을 변경하도록 제어하고, 상기 무선 통신 회로를 통하여 외부로 전송하도록 설정될 수 있다.
본 문서에 개시되는 일 실시 예에 따른 복수의 외부 전자 장치들 간의 오디오 데이터 중계를 위한 전자 장치는, 무선 통신 회로, 프로세서, 및 상기 프로세서에 작동적으로(operatively) 연결되는 메모리를 포함할 수 있다. 예를 들어, 상기 메모리는, 실행 되었을 때 상기 프로세서가 상기 무선 통신 회로를 통하여, 제1 외부 전자 장치로부터 제1 오디오 데이터를 수신하고, 상기 제1 오디오 데이터를 이용하여 에코 레벨 임계 값(echo level threshold)을 생성한 후 상기 제1 오디오 데이터를 제2 외부 전자 장치 및 제3 외부 전자 장치로 전송하고, 상기 제2 오디오 데이터 및 상기 제3 오디오 데이터 중 에코 레벨이 상기 에코 레벨 임계 값을 초과하는 데이터를 식별하고, 상기 제2 외부 전자 장치 및 상기 제3 외부 전자 장치 중 상기 식별된 오디오 데이터에 대응하는 적어도 하나의 외부 전자 장치를 식별하고, 상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터에 대하여 선택적으로 에코 제거 기능을 수행하도록 하는 하나 이상의 인스트럭션들(instructions)을 저장할 수 있다.
일 실시예에 따르면, 상기 하나 이상의 인스트럭션들(instructions)은 실행 시에 상기 프로세서가, 상기 제2 오디오 데이터에 기반하여, 상기 제2 외부 전자 장치와 무선 통신을 수행하는 동안 발생하는 제1 경로 지연 시간을 산출하고, 상기 제3 오디오 데이터에 기반하여, 상기 제3 외부 전자 장치와 무선 통신을 수행하는 동안 발생하는 제2 경로 지연 시간을 산출하고, 산출된 상기 제1 경로 지연 시간 및 상기 제2 경로 지연 시간을 보상하여 상기 제2 외부 전자 장치 및 상기 제3 외부 전자 장치와 무선 통신을 수행하도록 설정될 수 있다.
일 실시예에 따르면, 상기 하나 이상의 인스트럭션들(instructions)은 실행 시에 상기 프로세서가:
상기 에코 제거 기능을 수행한 후, 상기 식별된 적어도 하나의 외부 전자 장치로부터 수신하는 오디오 데이터의 에코 레벨을 지정된 주기에 기반하여 모니터링(monitoring) 하고, 모니터링 한 상기 오디오 데이터의 에코 레벨이 상기 에코 레벨 임계 값을 초과하는 경우, 상기 오디오 데이터에 대하여 하울링 제거(howling canceling) 기능을 수행하도록 설정될 수 있다.
일 실시예에 따르면, 상기 하나 이상의 인스트럭션들(instructions)은 실행 시에 상기 프로세서가, 상기 식별된 적어도 하나의 외부 전자 장치에 연관된 상기 오디오 데이터의 오디오 신호 레벨을 변경하도록 제어하고, 상기 무선 통신 회로를 통하여 외부로 전송하도록 설정될 수 있다.
본 문서에 개시되는 일 실시 예에 따른 전자 장치가 오디오 데이터를 처리하는 방법은, 상기 무선 통신 회로를 통하여, 제1 외부 전자 장치로부터 제1 오디오 데이터를 수신하는 동작, 상기 제1 오디오 데이터에 기반하여 오디오 신호 레벨에 연관된 적어도 하나의 조건을 생성하는 동작, 상기 제1 오디오 데이터를 제2 외부 전자 장치 및 제3 외부 전자 장치로 전송하는 동작, 상기 무선 통신 회로를 통하여, 상기 제2 외부 전자 장치 및 상기 제3 외부 전자 장치로부터 각각 제2 오디오 데이터 및 제3 오디오 데이터를 수신하는 동작, 상기 제2 오디오 데이터 및 상기 제3 오디오 데이터 중 상기 적어도 하나의 조건에 포함된 임계 값을 초과하는 오디오 데이터를 식별하는 동작, 상기 제2 외부 전자 장치와 상기 제3 외부 전자 장치 중, 상기 식별된 오디오 데이터에 대응하는 적어도 하나의 외부 전자 장치를 식별하는 동작, 및 상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터에 대하여, 에코 제거 기능을 수행하는 동작을 포함할 수 있다.
일 실시예에 따르면, 전자 장치가 오디오 데이터를 처리하는 기능을 제공하기 위한 방법은, 상기 제2 오디오 데이터에 기반하여, 상기 제2 외부 전자 장치와 무선 통신을 수행하는 동안 발생하는 제1 경로 지연 시간을 산출하는 동작, 상기 제3 오디오 데이터에 기반하여, 상기 제3 외부 전자 장치와 무선 통신을 수행하는 동안 발생하는 제2 경로 지연 시간을 산출하는 동작, 및 산출된 상기 제1 경로 지연 시간 및 상기 제2 경로 지연 시간을 보상하여 상기 제2 외부 전자 장치 및 상기 제3 외부 전자 장치와 무선 통신을 수행하는 동작을 더 포함할 수 있다.
일 실시예에 따르면, 전자 장치가 오디오 데이터를 처리하는 기능을 제공하기 위한 방법은, 상기 에코 제거 기능을 수행한 후, 상기 식별된 적어도 하나의 외부 전자 장치에 연관된 상기 오디오 데이터의 에코 레벨을 지정된 주기에 기반하여 모니터링(monitoring) 하는 동작 및 모니터링 한 상기 오디오 데이터의 에코 레벨이 상기 에코 레벨 임계 값을 초과하는 경우, 상기 오디오 데이터에 대하여 하울링 제거(howling canceling) 기능을 수행하는 동작을 더 포함할 수 있다.
일 실시예에 따르면, 전자 장치가 오디오 데이터를 처리하는 기능을 제공하기 위한 방법은, 상기 하울링 제거 기능을 수행한 후, 상기 제2 전자 장치 및 상기 제3 전자 장치로부터 수신하는 오디오 데이터를 상기 지정된 주기에 기반하여 모니터링(monitoring) 하는 동작 및 모니터링 한 상기 오디오 데이터의 에코 레벨이 상기 임계 값 이하인 경우, 상기 하울링 제거 기능의 수행을 종료하는 동작을 더 포함할 수 있다.
일 실시예에 따르면, 지정된 주기에 기반하여, 상기 식별된 적어도 하나의 외부 전자 장치로부터 수신한 상기 오디오 데이터의 에코 레벨을 모니터링(monitoring) 하는 동작은, 상기 식별된 적어도 하나의 외부 전자 장치에 연관된 상기 오디오 데이터의 에코 레벨이 상기 임계 값을 초과하는 경우, 상기 제1 오디오 데이터에 포함된 오디오 신호 파형 또는 참조 신호 중 적어도 하나를 이용하여, 상기 식별된 적어도 하나의 외부 전자 장치에 의해 발생한 하울링을 감지하는 동작을 포함할 수 있다.
일 실시예에 따르면, 상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터에 대하여, 하울링 제거(howling canceling) 기능을 수행하는 동작은, 상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터의 오디오 신호 레벨을 변경하도록 제어하고, 상기 무선 통신 회로를 통하여 외부로 전송하는 동작을 포함할 수 있다.
Claims (15)
- 전자 장치에 있어서,무선 통신 회로;프로세서; 및상기 프로세서에 작동적으로(operatively) 연결되는 메모리; 를 포함하고, 상기 메모리는, 실행 되었을 때 상기 프로세서가:상기 무선 통신 회로를 통하여, 제1 외부 전자 장치로부터 제1 오디오 데이터를 수신하고,상기 제1 오디오 데이터에 기반하여 오디오 신호 레벨에 연관된 적어도 하나의 조건을 생성하고,상기 제1 오디오 데이터를 제2 외부 전자 장치 및 제3 외부 전자 장치로 전송하고,상기 무선 통신 회로를 통하여, 상기 제2 외부 전자 장치 및 상기 제3 외부 전자 장치로부터 각각 제2 오디오 데이터 및 제3 오디오 데이터를 수신하고,상기 제2 오디오 데이터 및 상기 제3 오디오 데이터 중 상기 적어도 하나의 조건에 포함된 임계 값을 초과하는 오디오 데이터를 식별하고,상기 제2 외부 전자 장치와 상기 제3 외부 전자 장치 중, 상기 식별된 오디오 데이터에 대응하는 적어도 하나의 외부 전자 장치를 식별하고,상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터에 대하여, 에코 제거 기능을 수행하도록 하는 하나 이상의 인스트럭션들(instructions)을 저장하는, 전자 장치.
- 청구항 1에 있어서,상기 임계 값은, 상기 제1 오디오 데이터의 RMS(root mean square) 레벨을 산출하여 생성한 에코 레벨 임계 값(threshold value)인, 전자 장치.
- 청구항 1에 있어서,상기 제1 오디오 데이터는, 상기 제1 외부 전자 장치가 적어도 하나의 오디오 입력 장치를 이용하여 획득한 제1 사용자의 발화 입력을 포함하고,상기 제2 오디오 데이터는, 상기 제2 외부 전자 장치가 오디오 입력 장치를 이용하여 획득한 제2 사용자의 발화 입력 및 오디오 출력 장치를 통하여 출력한 상기 제1 오디오 데이터의 적어도 일부를 포함하고,상기 제3 오디오 데이터는, 상기 제3 외부 전자 장치가 오디오 입력 장치를 이용하여 획득한 제3 사용자의 발화 입력 및 오디오 출력 장치를 통하여 출력한 상기 제1 오디오 데이터의 적어도 일부를 포함하는, 전자 장치.
- 청구항 1에 있어서,상기 하나 이상의 인스트럭션들(instructions)은 실행 시에 상기 프로세서가:상기 제2 오디오 데이터에 기반하여, 상기 제2 외부 전자 장치와 무선 통신을 수행하는 동안 발생하는 제1 경로 지연 시간을 산출하고,상기 제3 오디오 데이터에 기반하여, 상기 제3 외부 전자 장치와 무선 통신을 수행하는 동안 발생하는 제2 경로 지연 시간을 산출하고,산출된 상기 제1 경로 지연 시간 및 상기 제2 경로 지연 시간을 보상하여 상기 제2 외부 전자 장치 및 상기 제3 외부 전자 장치와 무선 통신을 수행하도록 설정된, 전자 장치.
- 청구항 1에 있어서,상기 하나 이상의 인스트럭션들(instructions)은 실행 시에 상기 프로세서가:상기 에코 제거 기능을 수행한 후, 상기 식별된 적어도 하나의 외부 전자 장치로부터 수신하는 오디오 데이터의 에코 레벨을 지정된 주기에 기반하여 모니터링(monitoring) 하고,모니터링 한 상기 오디오 데이터의 에코 레벨이 상기 에코 레벨 임계 값을 초과하는 경우, 상기 식별된 적어도 하나의 외부 전자 장치와 연관된 오디오 데이터에 대하여 하울링 제거(howling canceling) 기능을 수행하도록 설정된, 전자 장치.
- 청구항 5에 있어서,상기 하나 이상의 인스트럭션들(instructions)은 실행 시에 상기 프로세서가:상기 제2 전자 장치 및 상기 제3 전자 장치로부터 수신하는 오디오 데이터를 상기 지정된 주기에 기반하여 모니터링(monitoring) 하고,모니터링 한 상기 오디오 데이터의 에코 레벨이 상기 임계 값 이하인 경우, 상기 하울링 제거 기능의 수행을 종료하도록 설정된, 전자 장치.
- 청구항 5에 있어서,상기 하나 이상의 인스트럭션들(instructions)은 실행 시에 상기 프로세서가:상기 식별된 적어도 하나의 외부 전자 장치로부터 수신한 상기 오디오 데이터의 에코 레벨이 상기 임계 값을 초과하는 경우, 상기 제1 오디오 데이터에 포함된 오디오 신호 파형 또는 참조 신호 중 적어도 하나를 이용하여, 상기 식별된 적어도 하나의 외부 전자 장치에 의해 발생한 하울링을 감지하도록 설정된, 전자 장치.
- 청구항 5에 있어서,상기 하나 이상의 인스트럭션들(instructions)은 실행 시에 상기 프로세서가:상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터의 오디오 신호 레벨을 변경하도록 제어하고, 상기 무선 통신 회로를 통하여 외부로 전송하도록 설정된, 전자 장치.
- 전자 장치가 오디오 데이터를 처리하는 기능을 제공하기 위한 방법으로서,상기 무선 통신 회로를 통하여, 제1 외부 전자 장치로부터 제1 오디오 데이터를 수신하는 동작;상기 제1 오디오 데이터에 기반하여 오디오 신호 레벨에 연관된 적어도 하나의 조건을 생성하는 동작;상기 제1 오디오 데이터를 제2 외부 전자 장치 및 제3 외부 전자 장치로 전송하는 동작;상기 무선 통신 회로를 통하여, 상기 제2 외부 전자 장치 및 상기 제3 외부 전자 장치로부터 각각 제2 오디오 데이터 및 제3 오디오 데이터를 수신하는 동작;상기 제2 오디오 데이터 및 상기 제3 오디오 데이터 중 상기 적어도 하나의 조건에 포함된 임계 값을 초과하는 오디오 데이터를 식별하는 동작;상기 제2 외부 전자 장치와 상기 제3 외부 전자 장치 중, 상기 식별된 오디오 데이터에 대응하는 적어도 하나의 외부 전자 장치를 식별하는 동작; 및상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터에 대하여, 에코 제거 기능을 수행하는 동작; 을 포함하는, 방법.
- 청구항 9에 있어서,상기 임계 값은, 상기 제1 오디오 데이터의 RMS(root mean square) 레벨을 산출하여 생성한 에코 레벨 임계 값(threshold value)인, 방법.
- 청구항 9에 있어서,전자 장치가 오디오 데이터를 처리하는 기능을 제공하기 위한 방법은,상기 제2 오디오 데이터에 기반하여, 상기 제2 외부 전자 장치와 무선 통신을 수행하는 동안 발생하는 제1 경로 지연 시간을 산출하는 동작;상기 제3 오디오 데이터에 기반하여, 상기 제3 외부 전자 장치와 무선 통신을 수행하는 동안 발생하는 제2 경로 지연 시간을 산출하는 동작; 및산출된 상기 제1 경로 지연 시간 및 상기 제2 경로 지연 시간을 보상하여 상기 제2 외부 전자 장치 및 상기 제3 외부 전자 장치와 무선 통신을 수행하는 동작; 을 더 포함하는, 방법.
- 청구항 9에 있어서,전자 장치가 오디오 데이터를 처리하는 기능을 제공하기 위한 방법은,상기 에코 제거 기능을 수행한 후, 상기 식별된 적어도 하나의 외부 전자 장치로부터 수신하는 오디오 데이터의 에코 레벨을 지정된 주기에 기반하여 모니터링(monitoring) 하는 동작; 및모니터링 한 상기 오디오 데이터의 에코 레벨이 상기 에코 레벨 임계 값을 초과하는 경우, 상기 식별된 적어도 하나의 외부 전자 장치와 연관된 오디오 데이터에 대하여 하울링 제거(howling canceling) 기능을 수행하는 동작; 을 더 포함하는, 방법.
- 청구항 12에 있어서,전자 장치가 오디오 데이터를 처리하는 기능을 제공하기 위한 방법은,상기 제2 전자 장치 및 상기 제3 전자 장치로부터 수신하는 오디오 데이터를 상기 지정된 주기에 기반하여 모니터링(monitoring) 하는 동작; 및모니터링 한 상기 오디오 데이터의 에코 레벨이 상기 임계 값 이하인 경우, 상기 하울링 제거 기능의 수행을 종료하는 동작; 을 더 포함하는, 방법.
- 청구항 12에 있어서,지정된 주기에 기반하여, 상기 식별된 적어도 하나의 외부 전자 장치로부터 수신한 상기 오디오 데이터의 에코 레벨을 모니터링(monitoring) 하는 동작은,상기 식별된 적어도 하나의 외부 전자 장치로부터 수신한 상기 오디오 데이터의 에코 레벨이 상기 임계 값을 초과하는 경우, 상기 제1 오디오 데이터에 포함된 오디오 신호 파형 또는 참조 신호 중 적어도 하나를 이용하여, 상기 식별된 적어도 하나의 외부 전자 장치에 의해 발생한 하울링을 감지하는 동작; 을 포함하는, 방법.
- 청구항 12에 있어서,상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터에 대하여, 하울링 제거(howling canceling) 기능을 수행하는 동작은,상기 식별된 적어도 하나의 외부 전자 장치에 연관된 오디오 데이터의 오디오 신호 레벨을 변경하도록 제어하고, 상기 무선 통신 회로를 통하여 외부로 전송하는 동작; 을 포함하는, 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210022105A KR20220118224A (ko) | 2021-02-18 | 2021-02-18 | 오디오 데이터 처리 방법 및 이를 지원하는 전자 장치 |
KR10-2021-0022105 | 2021-02-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022177183A1 true WO2022177183A1 (ko) | 2022-08-25 |
Family
ID=82930900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2022/001107 WO2022177183A1 (ko) | 2021-02-18 | 2022-01-21 | 오디오 데이터 처리 방법 및 이를 지원하는 전자 장치 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20220118224A (ko) |
WO (1) | WO2022177183A1 (ko) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150088501A1 (en) * | 2013-09-24 | 2015-03-26 | Starkey Laboratories, Inc. | Methods and apparatus for signal sharing to improve speech understanding |
KR20190042918A (ko) * | 2017-10-17 | 2019-04-25 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
KR20190042903A (ko) * | 2017-10-17 | 2019-04-25 | 삼성전자주식회사 | 음성 신호를 제어하기 위한 전자 장치 및 방법 |
KR20190044912A (ko) * | 2017-10-23 | 2019-05-02 | 삼성전자주식회사 | 네트워크 연결 정보에 기반하여 잡음 제어 파라미터를 결정하는 전자 장치 및 그의 동작 방법 |
KR20210001646A (ko) * | 2019-06-28 | 2021-01-06 | 삼성전자주식회사 | 전자 장치 및 이를 이용한 오디오 신호를 처리하기 위한 음향 장치를 결정하는 방법 |
-
2021
- 2021-02-18 KR KR1020210022105A patent/KR20220118224A/ko unknown
-
2022
- 2022-01-21 WO PCT/KR2022/001107 patent/WO2022177183A1/ko active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150088501A1 (en) * | 2013-09-24 | 2015-03-26 | Starkey Laboratories, Inc. | Methods and apparatus for signal sharing to improve speech understanding |
KR20190042918A (ko) * | 2017-10-17 | 2019-04-25 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
KR20190042903A (ko) * | 2017-10-17 | 2019-04-25 | 삼성전자주식회사 | 음성 신호를 제어하기 위한 전자 장치 및 방법 |
KR20190044912A (ko) * | 2017-10-23 | 2019-05-02 | 삼성전자주식회사 | 네트워크 연결 정보에 기반하여 잡음 제어 파라미터를 결정하는 전자 장치 및 그의 동작 방법 |
KR20210001646A (ko) * | 2019-06-28 | 2021-01-06 | 삼성전자주식회사 | 전자 장치 및 이를 이용한 오디오 신호를 처리하기 위한 음향 장치를 결정하는 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20220118224A (ko) | 2022-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022154344A1 (ko) | 이어팁, 이어팁을 포함하는 전자 장치 및 이어팁의 제조 방법 | |
WO2022154363A1 (ko) | 오디오 데이터를 처리하기 위한 오디오 장치 및 그의 동작 방법 | |
WO2022098190A1 (ko) | 전자 장치 및 복수의 오디오 출력 장치와의 연결에 따른 오디오 출력 모드 설정 방법 | |
WO2022203456A1 (ko) | 음성 신호 처리를 위한 전자 장치 및 방법 | |
WO2022177183A1 (ko) | 오디오 데이터 처리 방법 및 이를 지원하는 전자 장치 | |
WO2021221440A1 (ko) | 음질 향상 방법 및 그 장치 | |
WO2022030771A1 (ko) | 전자 장치 및 그의 오디오 데이터를 출력하는 방법 | |
WO2022186470A1 (ko) | 오디오 처리 방법 및 이를 포함하는 전자 장치 | |
WO2021172893A1 (ko) | 에코 캔슬링을 위한 방법 및 그 장치 | |
WO2022030750A1 (ko) | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 | |
WO2022203179A1 (ko) | 오디오 데이터 처리 방법 및 이를 지원하는 전자 장치 | |
WO2022092609A1 (ko) | 오디오 데이터 처리 방법 및 그 장치 | |
WO2023128623A1 (ko) | 웨어러블 장치 | |
WO2022164023A1 (ko) | 오디오 데이터를 처리하는 방법 및 이를 지원하는 전자 장치 | |
WO2022030880A1 (ko) | 음성 신호를 처리하는 방법 및 이를 이용한 장치 | |
WO2023287023A1 (ko) | 음향 신호를 생성하는 전자 장치 및 방법 | |
WO2024080597A1 (ko) | 오디오 비트스트림을 적응적으로 처리하는 전자 장치, 방법, 및 비일시적 컴퓨터 판독가능 저장 매체 | |
WO2024080590A1 (ko) | 신호의 오류를 검출하기 위한 전자 장치 및 방법 | |
WO2024076043A1 (ko) | 진동 소리 신호를 생성하기 위한 전자 장치 및 방법 | |
WO2022154370A1 (ko) | 다중 장치 간 통신 방법 및 이를 위한 전자 장치 | |
WO2022098004A1 (ko) | 통신 연결을 통하여 데이터를 전송하는 전자 장치와 이의 동작 방법 | |
WO2022220479A1 (ko) | 전자 장치 및 전자 장치에서 객체의 근접 여부를 판단하는 방법 | |
WO2022146033A1 (ko) | 전자 장치 및 전자 장치의 음성 입출력 제어 방법 | |
WO2022186471A1 (ko) | 그룹 통화 서비스를 제공하기 위한 방법 및 이를 지원하는 전자 장치 | |
WO2023167511A1 (ko) | 소리를 출력하기 위한 전자 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22756387 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 22756387 Country of ref document: EP Kind code of ref document: A1 |