WO2022203456A1 - 음성 신호 처리를 위한 전자 장치 및 방법 - Google Patents

음성 신호 처리를 위한 전자 장치 및 방법 Download PDF

Info

Publication number
WO2022203456A1
WO2022203456A1 PCT/KR2022/004235 KR2022004235W WO2022203456A1 WO 2022203456 A1 WO2022203456 A1 WO 2022203456A1 KR 2022004235 W KR2022004235 W KR 2022004235W WO 2022203456 A1 WO2022203456 A1 WO 2022203456A1
Authority
WO
WIPO (PCT)
Prior art keywords
housing
voice signal
module
electronic device
folding
Prior art date
Application number
PCT/KR2022/004235
Other languages
English (en)
French (fr)
Inventor
박영수
김기원
양재모
김양수
송학훈
장근원
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Publication of WO2022203456A1 publication Critical patent/WO2022203456A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/02Casings; Cabinets ; Supports therefor; Mountings therein
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/01Hearing devices using active noise cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's

Definitions

  • Various embodiments of the present document relate to an electronic device and method for processing a voice signal.
  • a foldable flexible display may be disposed in the entire area of the housing structure separated to be foldable, and the housing structure may be implemented in a form including one or more speakers and a microphone.
  • the position of the microphone and speaker is changed and the relative distance between the microphone and the speaker is changed to process voice signals does not operate normally, and deterioration may occur.
  • noise or echo may be generated along with the speaker's voice signal due to ambient sound, resulting in severe sound quality degradation or the speaker's voice may not be clearly transmitted.
  • an electronic device and method for processing a voice signal to constantly maintain performance of processing a voice signal according to a change in the shape of the electronic device may be provided.
  • an electronic device includes a housing configured to have at least one portion folded, at least one microphone, at least one speaker, the at least one microphone, and an audio module electrically connected to the at least one speaker and at least one processor electrically connected to the audio module, wherein the at least one processor identifies a voice signal received through the microphone, obtains angle information related to folding of at least a portion of the housing, , identify a state in which at least a portion of the housing is being folded based on the angle information, and adjust control information of the audio module for processing the voice signal based on the angle information, It may be configured to control the audio module to process the voice signal based on the adjusted control information during folding.
  • a method of operating in an electronic device including at least one microphone and at least one speaker may include: receiving a voice signal through the at least one microphone; An operation of acquiring angle information related to folding, an operation of identifying a folding state of at least a portion of the housing based on the angle information, and an audio module of the electronic device for processing the voice signal based on the angle information It may include adjusting control information and processing the voice signal based on the adjusted control information while at least a portion of the housing is folded by the audio module.
  • a non-transitory storage medium storing a program
  • the processor when the program is executed by a processor, the processor receives a voice signal through the at least one microphone, the housing of the electronic device Obtaining angle information related to folding of at least a portion of and an instruction executable to execute an operation of adjusting control information of an audio module of the device and an operation of processing the voice signal based on the adjusted control information while at least a portion of the housing is folded by the audio module can
  • an echo that is introduced into the speaker's voice signal by adjusting control information for enhancing the performance of the voice signal processing according to a change in the shape of the electronic device And by removing noise, it is possible to maintain a constant performance without deterioration during audio signal processing, so that sound quality is not deteriorated and a more enhanced audio signal can be provided.
  • FIG. 1 is a block diagram of an electronic device in a network environment according to various embodiments of the present disclosure
  • FIGS. 2A and 2B are diagrams illustrating a configuration example of an electronic device according to various embodiments of the present disclosure
  • FIG. 3 is a diagram illustrating a configuration example of an electronic device according to various embodiments of the present disclosure
  • FIG. 4 is a diagram illustrating an example of a folded state of an electronic device according to various embodiments of the present disclosure
  • FIG. 5 is a diagram illustrating a configuration example of an audio module of an electronic device according to various embodiments of the present disclosure
  • FIG. 6 is a diagram illustrating a configuration example of an audio module of an electronic device according to various embodiments of the present disclosure
  • FIG. 7 is a diagram illustrating an example of an operation method in an electronic device according to various embodiments of the present disclosure.
  • FIG. 8 is a diagram illustrating an example of an operation method in an electronic device according to various embodiments of the present disclosure.
  • FIG. 9 is a diagram illustrating an example of an operation method in an electronic device according to various embodiments of the present disclosure.
  • the term user used in various embodiments may refer to a person who uses an electronic device or a device (eg, an artificial intelligence electronic device) using the electronic device.
  • a device eg, an artificial intelligence electronic device
  • FIG. 1 is a block diagram of an electronic device 101 in a network environment 100, according to various embodiments.
  • an electronic device 101 communicates with an electronic device 102 through a first network 198 (eg, a short-range wireless communication network) or a second network 199 . It may communicate with the electronic device 104 or the server 108 through (eg, a long-distance wireless communication network). According to an embodiment, the electronic device 101 may communicate with the electronic device 104 through the server 108 .
  • a first network 198 eg, a short-range wireless communication network
  • a second network 199 e.g., a second network 199 . It may communicate with the electronic device 104 or the server 108 through (eg, a long-distance wireless communication network). According to an embodiment, the electronic device 101 may communicate with the electronic device 104 through the server 108 .
  • the electronic device 101 includes a processor 120 , a memory 130 , an input module 150 , a sound output module 155 , a display module 160 , an audio module 170 , and a sensor module ( 176), interface 177, connection terminal 178, haptic module 179, camera module 180, power management module 188, battery 189, communication module 190, subscriber identification module 196 , or an antenna module 197 .
  • at least one of these components eg, the connection terminal 178
  • some of these components are integrated into one component (eg, display module 160 ). can be
  • the processor 120 for example, executes software (eg, a program 140) to execute at least one other component (eg, a hardware or software component) of the electronic device 101 connected to the processor 120. It can control and perform various data processing or operations. According to one embodiment, as at least part of data processing or operation, the processor 120 converts commands or data received from other components (eg, the sensor module 176 or the communication module 190 ) to the volatile memory 132 . may be stored in , process commands or data stored in the volatile memory 132 , and store the result data in the non-volatile memory 134 .
  • software eg, a program 140
  • the processor 120 converts commands or data received from other components (eg, the sensor module 176 or the communication module 190 ) to the volatile memory 132 .
  • the volatile memory 132 may be stored in , process commands or data stored in the volatile memory 132 , and store the result data in the non-volatile memory 134 .
  • the processor 120 is the main processor 121 (eg, a central processing unit or an application processor) or a secondary processor 123 (eg, a graphic processing unit, a neural network processing unit (eg, a graphic processing unit, a neural network processing unit) a neural processing unit (NPU), an image signal processor, a sensor hub processor, or a communication processor).
  • the main processor 121 eg, a central processing unit or an application processor
  • a secondary processor 123 eg, a graphic processing unit, a neural network processing unit (eg, a graphic processing unit, a neural network processing unit) a neural processing unit (NPU), an image signal processor, a sensor hub processor, or a communication processor.
  • the main processor 121 e.g, a central processing unit or an application processor
  • a secondary processor 123 eg, a graphic processing unit, a neural network processing unit (eg, a graphic processing unit, a neural network processing unit) a neural processing unit (NPU), an image signal processor, a
  • the secondary processor 123 may, for example, act on behalf of the main processor 121 while the main processor 121 is in an inactive (eg, sleep) state, or when the main processor 121 is active (eg, executing an application). ), together with the main processor 121, at least one of the components of the electronic device 101 (eg, the display module 160, the sensor module 176, or the communication module 190) It is possible to control at least some of the related functions or states.
  • the coprocessor 123 eg, an image signal processor or a communication processor
  • may be implemented as part of another functionally related component eg, the camera module 180 or the communication module 190 ). have.
  • the auxiliary processor 123 may include a hardware structure specialized for processing an artificial intelligence model.
  • Artificial intelligence models can be created through machine learning. Such learning may be performed, for example, in the electronic device 101 itself on which the artificial intelligence model is performed, or may be performed through a separate server (eg, the server 108).
  • the learning algorithm may include, for example, supervised learning, unsupervised learning, semi-supervised learning, or reinforcement learning, but in the above example not limited
  • the artificial intelligence model may include a plurality of artificial neural network layers.
  • Artificial neural networks include deep neural networks (DNNs), convolutional neural networks (CNNs), recurrent neural networks (RNNs), restricted boltzmann machines (RBMs), deep belief networks (DBNs), bidirectional recurrent deep neural networks (BRDNNs), It may be one of deep Q-networks or a combination of two or more of the above, but is not limited to the above example.
  • the artificial intelligence model may include, in addition to, or alternatively, a software structure in addition to the hardware structure.
  • the memory 130 may store various data used by at least one component (eg, the processor 120 or the sensor module 176 ) of the electronic device 101 .
  • the data may include, for example, input data or output data for software (eg, the program 140 ) and instructions related thereto.
  • the memory 130 may include a volatile memory 132 or a non-volatile memory 134 .
  • the program 140 may be stored as software in the memory 130 , and may include, for example, an operating system 142 , middleware 144 , or an application 146 .
  • the input module 150 may receive a command or data to be used by a component (eg, the processor 120 ) of the electronic device 101 from the outside (eg, a user) of the electronic device 101 .
  • the input module 150 may include, for example, a microphone, a mouse, a keyboard, a key (eg, a button), or a digital pen (eg, a stylus pen).
  • the sound output module 155 may output a sound signal to the outside of the electronic device 101 .
  • the sound output module 155 may include, for example, a speaker or a receiver.
  • the speaker can be used for general purposes such as multimedia playback or recording playback.
  • the receiver can be used to receive incoming calls. According to one embodiment, the receiver may be implemented separately from or as part of the speaker.
  • the display module 160 may visually provide information to the outside (eg, a user) of the electronic device 101 .
  • the display module 160 may include, for example, a control circuit for controlling a display, a hologram device, or a projector and a corresponding device.
  • the display module 160 may include a touch sensor configured to sense a touch or a pressure sensor configured to measure the intensity of a force generated by the touch.
  • the audio module 170 may convert a sound into an electric signal or, conversely, convert an electric signal into a sound. According to an embodiment, the audio module 170 acquires a sound through the input module 150 , or an external electronic device (eg, a sound output module 155 ) connected directly or wirelessly with the electronic device 101 .
  • the electronic device 102) eg, a speaker or headphones
  • the electronic device 102 may output a sound.
  • the sensor module 176 detects an operating state (eg, power or temperature) of the electronic device 101 or an external environmental state (eg, a user state), and generates an electrical signal or data value corresponding to the sensed state. can do.
  • the sensor module 176 may include, for example, a gesture sensor, a gyro sensor, a barometric pressure sensor, a magnetic sensor, an acceleration sensor, a grip sensor, a proximity sensor, a color sensor, an IR (infrared) sensor, a biometric sensor, It may include a temperature sensor, a humidity sensor, or an illuminance sensor.
  • the interface 177 may support one or more specified protocols that may be used by the electronic device 101 to directly or wirelessly connect with an external electronic device (eg, the electronic device 102 ).
  • the interface 177 may include, for example, a high definition multimedia interface (HDMI), a universal serial bus (USB) interface, an SD card interface, or an audio interface.
  • the connection terminal 178 may include a connector through which the electronic device 101 can be physically connected to an external electronic device (eg, the electronic device 102 ).
  • the connection terminal 178 may include, for example, an HDMI connector, a USB connector, an SD card connector, or an audio connector (eg, a headphone connector).
  • the haptic module 179 may convert an electrical signal into a mechanical stimulus (eg, vibration or movement) or an electrical stimulus that the user can perceive through tactile or kinesthetic sense.
  • the haptic module 179 may include, for example, a motor, a piezoelectric element, or an electrical stimulation device.
  • the camera module 180 may capture still images and moving images. According to an embodiment, the camera module 180 may include one or more lenses, image sensors, image signal processors, or flashes.
  • the power management module 188 may manage power supplied to the electronic device 101 .
  • the power management module 188 may be implemented as, for example, at least a part of a power management integrated circuit (PMIC).
  • PMIC power management integrated circuit
  • the battery 189 may supply power to at least one component of the electronic device 101 .
  • battery 189 may include, for example, a non-rechargeable primary cell, a rechargeable secondary cell, or a fuel cell.
  • the communication module 190 is a direct (eg, wired) communication channel or a wireless communication channel between the electronic device 101 and an external electronic device (eg, the electronic device 102, the electronic device 104, or the server 108). It can support establishment and communication performance through the established communication channel.
  • the communication module 190 may include one or more communication processors that operate independently of the processor 120 (eg, an application processor) and support direct (eg, wired) communication or wireless communication.
  • the communication module 190 is a wireless communication module 192 (eg, a cellular communication module, a short-range communication module, or a global navigation satellite system (GNSS) communication module) or a wired communication module 194 (eg, : It may include a local area network (LAN) communication module, or a power line communication module).
  • a wireless communication module 192 eg, a cellular communication module, a short-range communication module, or a global navigation satellite system (GNSS) communication module
  • GNSS global navigation satellite system
  • wired communication module 194 eg, : It may include a local area network (LAN) communication module, or a power line communication module.
  • a corresponding communication module among these communication modules is a first network 198 (eg, a short-range communication network such as Bluetooth, wireless fidelity (WiFi) direct, or infrared data association (IrDA)) or a second network 199 (eg, legacy It may communicate with the external electronic device 104 through a cellular network, a 5G network, a next-generation communication network, the Internet, or a computer network (eg, a telecommunication network such as a LAN or a WAN).
  • a first network 198 eg, a short-range communication network such as Bluetooth, wireless fidelity (WiFi) direct, or infrared data association (IrDA)
  • a second network 199 eg, legacy It may communicate with the external electronic device 104 through a cellular network, a 5G network, a next-generation communication network, the Internet, or a computer network (eg, a telecommunication network such as a LAN or a WAN).
  • a telecommunication network
  • the wireless communication module 192 uses subscriber information (eg, International Mobile Subscriber Identifier (IMSI)) stored in the subscriber identification module 196 within a communication network such as the first network 198 or the second network 199 .
  • subscriber information eg, International Mobile Subscriber Identifier (IMSI)
  • IMSI International Mobile Subscriber Identifier
  • the electronic device 101 may be identified or authenticated.
  • the wireless communication module 192 may support a 5G network after a 4G network and a next-generation communication technology, for example, a new radio access technology (NR).
  • NR access technology includes high-speed transmission of high-capacity data (eMBB (enhanced mobile broadband)), minimization of terminal power and access to multiple terminals (mMTC (massive machine type communications)), or high reliability and low latency (URLLC (ultra-reliable and low-latency) -latency communications)).
  • eMBB enhanced mobile broadband
  • mMTC massive machine type communications
  • URLLC ultra-reliable and low-latency
  • the wireless communication module 192 may support a high frequency band (eg, mmWave band) to achieve a high data rate, for example.
  • a high frequency band eg, mmWave band
  • the wireless communication module 192 uses various techniques for securing performance in a high-frequency band, for example, beamforming, massive multiple-input and multiple-output (MIMO), all-dimensional multiplexing. It may support technologies such as full dimensional MIMO (FD-MIMO), an array antenna, analog beam-forming, or a large scale antenna.
  • the wireless communication module 192 may support various requirements defined in the electronic device 101 , an external electronic device (eg, the electronic device 104 ), or a network system (eg, the second network 199 ).
  • the wireless communication module 192 may provide a peak data rate (eg, 20 Gbps or more) for realizing 1eMBB, loss coverage (eg, 164 dB or less) for realizing mMTC, or U-plane latency for realizing URLLC ( Example: Downlink (DL) and uplink (UL) each 0.5 ms or less, or round trip 1 ms or less) can be supported.
  • a peak data rate eg, 20 Gbps or more
  • loss coverage eg, 164 dB or less
  • U-plane latency for realizing URLLC
  • the antenna module 197 may transmit or receive a signal or power to the outside (eg, an external electronic device).
  • the antenna module 197 may include an antenna including a conductor formed on a substrate (eg, a PCB) or a radiator formed of a conductive pattern.
  • the antenna module 197 may include a plurality of antennas (eg, an array antenna). In this case, at least one antenna suitable for a communication method used in a communication network such as the first network 198 or the second network 199 is connected from the plurality of antennas by, for example, the communication module 190 . can be selected. A signal or power may be transmitted or received between the communication module 190 and an external electronic device through the selected at least one antenna.
  • other components eg, a radio frequency integrated circuit (RFIC)
  • RFIC radio frequency integrated circuit
  • the antenna module 197 may form a mmWave antenna module.
  • the mmWave antenna module comprises a printed circuit board, an RFIC disposed on or adjacent to a first side (eg, bottom side) of the printed circuit board and capable of supporting a designated high frequency band (eg, mmWave band); and a plurality of antennas (eg, an array antenna) disposed on or adjacent to a second side (eg, top or side) of the printed circuit board and capable of transmitting or receiving signals of the designated high frequency band. can do.
  • peripheral devices eg, a bus, general purpose input and output (GPIO), serial peripheral interface (SPI), or mobile industry processor interface (MIPI)
  • GPIO general purpose input and output
  • SPI serial peripheral interface
  • MIPI mobile industry processor interface
  • the command or data may be transmitted or received between the electronic device 101 and the external electronic device 104 through the server 108 connected to the second network 199 .
  • Each of the external electronic devices 102 or 104 may be the same as or different from the electronic device 101 .
  • all or a part of operations executed in the electronic device 101 may be executed in one or more external electronic devices 102 , 104 , or 108 .
  • the electronic device 101 may perform the function or service itself instead of executing the function or service itself.
  • one or more external electronic devices may be requested to perform at least a part of the function or the service.
  • One or more external electronic devices that have received the request may execute at least a part of the requested function or service, or an additional function or service related to the request, and transmit a result of the execution to the electronic device 101 .
  • the electronic device 101 may process the result as it is or additionally and provide it as at least a part of a response to the request.
  • cloud computing, distributed computing, mobile edge computing (MEC), or client-server computing technology may be used.
  • the electronic device 101 may provide an ultra-low latency service using, for example, distributed computing or mobile edge computing.
  • the external electronic device 104 may include an Internet of things (IoT) device.
  • the server 108 may be an intelligent server using machine learning and/or neural networks.
  • the external electronic device 104 or the server 108 may be included in the second network 199 .
  • the electronic device 101 may be applied to an intelligent service (eg, smart home, smart city, smart car, or health care) based on 5G communication technology and IoT-related technology.
  • FIGS. 2A and 2B are diagrams illustrating a configuration example of an electronic device according to various embodiments
  • FIG. 3 is a diagram illustrating a configuration example of an electronic device according to various embodiments
  • FIG. 4 is an electronic device according to various embodiments. It is a figure which shows an example of a folded state.
  • the housing 210 is deformed. It may be configured to be folded.
  • the housing 210 may be divided into a first housing region 211 and a second housing region 213 , and the front surface of the first housing region 211 (eg: The first housing area in a direction in which the display-exposed surface of the electronic device 101 and the front surface of the second housing area 213 (eg, the display-exposed surface of the electronic device 101) face each other or in opposite directions
  • At least one of 211 or second housing region 213 may be configured to be folded.
  • the electronic device 101 (eg, the electronic device 101 of FIG. 1 ) includes an audio module 301 (eg, the audio module 176 of FIG. 1 ) and at least one processor 120 . may be included.
  • the electronic device 101 is electrically connected to the at least one processor 120 so that when the at least one processor 120 is executed, a memory (eg, a memory (eg: The memory 130 of FIG. 1 ), at least one sensor (eg, the sensor module 176 of FIG. 1 ), and a communication module (eg, the communication module 190 of FIG. 1 ) may be configured.
  • a memory eg, a memory (eg: The memory 130 of FIG. 1 )
  • at least one sensor eg, the sensor module 176 of FIG. 1
  • a communication module eg, the communication module 190 of FIG. 1
  • the electronic device 101 includes at least one microphone 220 (eg, the input module 150 of FIG.
  • the electronic device 101 may include an acoustic component (not shown) in which a microphone structure and a speaker structure are implemented as an integrated structure.
  • the electronic device 101 may be configured to include acoustic components respectively disposed inside a portion of the first housing region 211 and the second housing region 213 .
  • At least one microphone 220 is disposed inside a portion of the first housing region 211 and/or the second housing region 213 of the housing 210 according to an embodiment.
  • the microphone 220 may be disposed at a position facing the speaker 230 as the first housing region 211 or the second housing region 213 of the housing 210 is folded.
  • the microphone 220 may receive a voice signal and transmit the received voice signal to the audio module 301 .
  • the voice signal received through the microphone 220 is a voice signal of a speaker located at a distance (eg, a far-end speaker) together with a voice signal of a speaker located at a short distance (eg, a speaker at the far end) and a signal output from the speaker 230.
  • the speaker 230 may be disposed in a part of the first housing area 211 or the second housing area 213 of the housing 210, and is formed to generate a sound based on an electrical signal. components and/or components configured to convert sound into electrical signals.
  • the at least one microphone 220 may be a beamforming microphone, and by adding and canceling voice signals having opposite phases, the voice signal of the near-end speaker may be strengthened and noise may be removed, and the directionality may be improved by processing the incoming voice signals. can have it
  • the at least one microphone 220 may adjust a beamforming operation factor to have directivity in a direction opposite to the mouth of the near-end speaker. For example, as shown in FIG.
  • the electronic device 101 may include a plurality of beamforming microphones 220 , and the plurality of beamforming microphones 220 may be implemented to have directivity in different directions. Therefore, interference may occur depending on the distance between the microphones 220 . In this case, when a part of the housing is folded, the distance of the microphones 220 is changed, so that the beamforming bandwidth according to the distance change (or angle change) can be adjusted in order to remove echo or noise introduced due to interference. .
  • At least one speaker 230 may be disposed inside a portion of the first housing area 211 or the second housing area 213 .
  • the at least one speaker 230 outputs sound in a direction toward the first housing region 211 , and the output sound travels through an acoustic waveguide (not shown) provided in the inner space of the housing 210 to the second housing.
  • One side of the region 213 may be radiated to the external space.
  • the speaker 230 may be provided as a speaker for a receiver that outputs a received sound in a voice call mode.
  • the speaker 230 may function as a loudspeaker, and may be combined with other speaker modules (not shown) to implement stereo sound.
  • the acoustic component may be configured such that a speaker structure and a receiver structure (eg, a microphone structure) are integrated, and may be disposed inside a portion of the first housing area 211 and the second housing area 213 .
  • the electronic device 101 may provide different acoustic operation modes according to an unfolded status and a folded status.
  • the acoustic component may operate in a speaker mode, and when the electronic device 101 is folded, the acoustic component may operate in a speaker mode according to a user's selection.
  • it may operate in a receiver mode (eg, a microphone mode).
  • speaker mode and/or receiver mode may each provide different output voltages.
  • the user transmits and receives data in any direction by the integrated acoustic components located in the first housing area 211 and the second housing area 213 . anger may be possible.
  • the electronic device 101 determines the state (eg, location) of the electronic device 101 by the sensor module 176 (eg, an acceleration sensor and/or a geomagnetic sensor) disposed therein, and transmits a short-distance transmission suitable for the user. Sign language can be provided.
  • the sensor module 176 determines the state of the electronic device, and The acoustic component located in the 211 may operate as a speaker, and the acoustic component located in the second housing area 213 may operate as a microphone.
  • the sensor module 176 determines the state of the electronic device 101 , and The acoustic component located in the housing area 211 may operate as a microphone, and the acoustic component located in the second housing area 213 may operate as a speaker.
  • the audio module 301 includes at least one processor 120 , a microphone 220 , and a speaker 230 (or an acoustic component) and electrical components. to process a voice signal input to the microphone 220 (or sound component) under the control of at least one processor 120 and to process a signal output to the speaker 230 (or sound component) can be configured.
  • the audio module 301 may include a control module 310 and a voice signal processing module 320 .
  • the control module 310 is electrically connected to the processor 120 and the voice signal processing module 320 , may operate according to a control command of the processor 120 , and may be configured as a software module or a hardware module.
  • control module 310 may be configured to be included in the processor 120 as a software module.
  • the control module 310 may include at least a portion of the housing 210 (eg, the first housing region 211 and/or the second housing region) sensed by at least one sensor (eg, the sensor module 176 of FIG. 1 ). (213)) may receive angle information related to folding from the processor 120.
  • the control module 310 may transmit a control signal for processing the received voice signal to the voice signal processing module 320 based on the received angle information.
  • the angle information may include at least a portion of the housing 210 (eg, the first housing area 211 ) and/or the angle information sensed by at least one sensor (eg, the sensor module 176 of FIG. 1 ) under the control of the processor 120 . Alternatively, it may be calculated by the processor 120 based on motion information of the second housing area 213).
  • the voice signal processing module 320 of the audio module 301 may perform an operation for processing the received voice signal under the control of at least one processor 120 .
  • the voice signal processing module 320 adjusts the control information based on the angle information under the control of the processor 120 , and removes an echo included in the received voice signal based on the adjusted control information. can be performed.
  • the voice signal processing module 320 may process a voice signal that removes noise from the received voice signal.
  • the control information may be information designated in response to angle information acquired while a part of the housing 210 is folded. For example, the control information is provided whenever a portion of the housing 210 is folded by the voice signal processing module 320 under the control of the processor 120 and the folding angle changes to an angle within a specified range (eg, 15 degrees). It may be adjusted at a certain rate in the previous control information.
  • the control information may be information designated in advance corresponding to the angle information, and may be stored in advance in the memory 130 in the form of a table.
  • At least one processor 120 of an electronic device 101 identifies a voice signal received through a microphone 220 and , obtains angular information related to folding of at least a portion of the housing 210 (eg, the first housing region 211 and/or the second housing region 213 ), and based on the obtained angular information, the housing 210 ) in which at least a portion of the folded state can be identified.
  • the folded state of at least a portion of the housing 210 is, for example, a first housing region 211 or/and a second housing region 213 rotated in an opposite or opposite direction about the hinge structure 215 ( or movement) may be in a state indicating the middle of the movement.
  • the at least one processor 120 is a part of the housing 210 , for example, at least one movement (or rotation) of the first housing region 211 . It is detected through a sensor (eg, the sensor module 176 of FIG. 1 ) of , and angle information according to the folding calculated based on the detected motion information may be obtained.
  • the received angle information may indicate an angle between the first housing area 211 and the second housing area 213 .
  • the at least one processor 120 may identify that the electronic device 101 is in an unfolded state. For example, as shown in FIG.
  • the at least one processor 120 provides a critical angle ( For example, if it is identified that the angle information is changed to 150 degrees as the rotation is greater than or equal to 30 degrees), it may be identified that the electronic device 101 is in a folded state from an unfolded state.
  • the at least one processor 120 may adjust the previous control information based on the control information specified in response to the angle information being 150 degrees or adjust the previous control information at a certain rate based on the change in the angle within a specified range. For example, the at least one processor 120 continues to rotate in a direction opposite to the second housing area 213 of the housing 210, as shown in FIG. 4(c) . Accordingly, when the angle information is identified as 90 degrees, a state in which the electronic device 101 is continuously being folded may be identified.
  • the at least one processor 120 may adjust the previous control information based on the control information specified in correspondence with the angle information of 90 degrees or adjust the previous control information at a certain rate based on the change in the angle within a specified range. For example, the at least one processor 120 continues to rotate in a direction opposite to the second housing area 213 of the housing 210, as shown in FIG. 4(d). Accordingly, when the angle information is identified as 0 degrees, it is identified that the first housing area 211 of the housing 210 is fully folded, and when a predetermined time elapses, the audio module 301 for removing the echo from the voice signal is stable. It is possible to identify the state and stop adjusting the control information.
  • the at least one processor 120 may remove the echo from the received voice signal by maintaining the adjusted control information.
  • the at least one processor 120 may display the first housing of the housing 210 as shown in FIG. 4(c). It is identified that the folding operation of the region 211 is completed to stop adjusting the control information, and when the angle information is 90 degrees, it is possible to remove the echo from the received voice signal by maintaining the adjusted control information.
  • the at least one processor 120 may obtain angle information between the first housing area 211 and the second housing area 213 and adjust control information based on the obtained angle information.
  • the at least one processor 120 identifies a state in which the first housing region 211 is folded, as at least a portion of the housing, and the first housing region 211 is folded.
  • the voice signal processing module 320 may be controlled to adjust control information for processing the received voice signal based on the angle information acquired during the operation.
  • the at least one processor 120 provides a voice signal while at least a portion of the housing 210 is folded based on the adjusted control information.
  • the control information may include at least one of operation parameter information (or factors) for processing a voice signal of the voice processing module 320 , weight information related to beamforming performance of the microphone 220 , or input sensitivity information of the microphone 220 .
  • the operation parameter information (or factor) for the speech signal processing includes the echo cancellation operation parameter (or factor) (eg, the intensity of the residual echo canceller (RES) (eg, the noise cancellation intensity), the linear/non-linear echo cancellation intensity, and the AGC (automatic gain control), coefficients of an adaptive filter (e.g. first filter) and at least one of convergence rate or echo path change detector) and/or noise rejection operation parameters (or factors) (e.g. beamforming bandwidth) can do.
  • the convergence speed of the adaptive filter may be a factor for controlling the adaptive speed by following the angle change according to the folding while a portion of the housing 210 is folded.
  • the intensity of the residual echo canceller (eg, the second filter) is an echo (eg, non-linear echo) caused by hardware characteristics of the microphone 220 and the speaker 230 while at least a portion of the housing 210 is folded. component) may be a factor for removing the
  • the control information may include parameter sets preset by mapping angle information designated to at least one of operation parameter information for voice signal processing, weight information, or input sensitivity information of a microphone, and the preset parameter sets include: It may be stored in the memory 130 in the form of a table.
  • the at least one processor 120 identifies a folding speed corresponding to an angle change based on angle information obtained while at least a portion of the housing 210 is being folded, and a threshold value to which the identified folding speed is specified. , it may be identified that at least a portion of the housing (eg, the first housing region 211 and/or the second housing region 213 ) is in a folded state.
  • the at least one processor 120 is in a state in which the folding speed identified in the folded state (or the unfolded state) is less than or equal to a specified threshold, and when the specified time elapses, the folding operation of at least a portion of the housing 210 is stopped ( For example, the folded state) can be identified.
  • the folding speed may indicate a degree to which an angle between the first housing region 211 and the second housing region 213 changes per second.
  • the at least one processor 120 receives a voice signal and receives angle information obtained while at least a portion of the housing 210 (eg, the first housing region 211 of FIG. 4 ) is folded. Based on the identification of the relative distance between the microphone 220 and the speaker 230, and when the relative distance changes to a small value over time and approaches, information related to directionality (eg, RES intensity) included in the control information is increased. It is possible to control the audio module 301 to do this.
  • directionality eg, RES intensity
  • the at least one processor 120 is configured to process a voice signal of the audio module 301 included in the control information in response to angle information continuously acquired while at least a portion of the housing 210 is being folded.
  • Parameter information eg, at least one of an echo cancellation operation parameter and a noise cancellation operation parameter
  • the at least one processor 120 identifies a distance value between the microphone 220 and the speaker 230 based on the angle information while at least a portion of the housing 210 is being folded, and the identified distance value is When the distance decreases below the specified distance threshold, the sensitivity of the microphone 220 may be adjusted to a specified low value. When the identified distance value exceeds a specified distance threshold, the at least one processor 120 may adjust the sensitivity of the microphone 220 to a specified high value.
  • the at least one processor 120 may perform the same operations while at least a portion of the housing 210 is unfolded.
  • the operations according to the above-described various embodiments may be equally applied even when a portion of the electronic device 101 has a folded or unfolded shape, such as a rollable or slideable shape. have.
  • FIGS. 1-10 In the description of FIGS.
  • the microphone 220 is disposed in the first housing area 211 and the speaker 230 is disposed in the second housing area 213 , but this Without limitation, microphones (eg, stereo microphones) are mounted in the first housing area 211 and the second housing area 213 , respectively, and speakers are provided in the first housing area 211 and the second housing area 213 , respectively. Each of them (eg, a stereo speaker) may be mounted.
  • microphones eg, stereo microphones
  • speakers are provided in the first housing area 211 and the second housing area 213 , respectively.
  • Each of them eg, a stereo speaker
  • FIG. 5 is a diagram illustrating a configuration example of an audio module 301 of an electronic device according to various embodiments of the present disclosure.
  • the voice signal processing module 320 of the audio module 301 may include an echo cancellation module 510 for canceling an echo from a received voice signal.
  • the voice signal processing module 320 performs an echo by the fared speech signal received from the microphone 220 or the fared speech input by the speaker 230 by the echo cancellation module 510 . can be removed.
  • the voice signal processing module 320 may remove noise from the voice signal by the noise removal module.
  • the echo cancellation module 510 may control an echo in a received voice signal based on an echo reference corresponding to a signal of a fared speech output to the speaker 230 . .
  • the echo cancellation module 510 may receive an echo reference through the control module 310 .
  • the echo control module 510 includes a first filter (eg, an adaptive filter) 511 and a subtractor 513 for removing an echo of a linear component based on an echo reference in the speech signal.
  • the echo control module 510 may further include a second filter (eg, residual echo suppressor: RES) 515 for removing nonlinear residual echo and nonlinear components.
  • the first filter 511 is a filter that linearly predicts the acoustic path, and generates a replica of the echo component based on the echo reference and transfers the linear echo component to the subtractor 513 , , by subtracting the linear echo component transmitted from the first filter 511 from the received speech signal in the subtractor 513 , an echo-removed speech signal may be obtained.
  • the second filter 515 includes a residual echo of nonlinearity in the speech signal from which the linear echo is removed by the first filter 511 and a component of nonlinearity due to the hardware characteristics of the microphone 220 and the speaker 230 . can be removed
  • FIG. 6 is a diagram illustrating a configuration example of an audio module 301 of an electronic device according to various embodiments of the present disclosure.
  • the voice signal processing module 320 of the audio module 301 may be configured to include a noise removal module 610 for removing noise from a received voice signal.
  • the noise canceling module 610 may remove noise from a voice signal output by removing an echo from the echo canceling module (eg, the echo canceling module 510 of FIG. 5 ).
  • the noise canceling module 610 removes noise from the voice signal received from the microphone 220 and the echo canceling module (eg, the echo cancellation module of FIG. 5 ) removes the echo from the noise-free voice signal. (510)), a noise-removed signal may be transmitted.
  • the noise removal module 610 may include a sound source localizer (not shown) that tracks the position or direction of the uttering near-end speaker and the near-end input from the tracked position or direction (target direction).
  • a beamformer 611 that improves the signal-to-noise ratio by removing (or attenuating) noise from other directions while preserving the speaker's voice signal and the near-end speaker's tracked direction (target direction)
  • a noise suppressor 613 may be included as a post-processing filter that removes noise input together in .
  • the noise canceling module 610 receives the voice signal from the microphone 220 in a different path from the beamformer 611 and removes the noise input together in the tracked direction (target direction) of the near-end speaker. (615) may be further included.
  • the noise removal module 610 outputs a first signal that is a voice signal from which noise has been removed through the first path 601 of the beamformer 611 and the noise canceller 613, and the noise canceller ( A second signal, which is a noise-removed voice signal, may be output through the second path 603 of 615 .
  • the noise removal module 610 may receive weight information set based on the angle information received from the control module 310 .
  • the noise removal module 610 may output a reinforced voice signal by mixing the first signal, the second signal, and weight information to prevent the signal output from changing rapidly as a part of the housing 210 is folded. have.
  • the noise removal module 610 applies a maximum weight value (1.0) to the second signal output from the second path 603 in the first stop state, and applies the maximum value (1.0) to the second signal output from the first path 601
  • a minimum weight value (0) may be applied to the first signal, and the first signal and the second signal to which the weight is applied may be mixed.
  • the weight when the weight is applied to 0, it may mean that 100% of the beamforming by the beamformer 611 is applied in the first path 601 .
  • the at least one processor 120 identifies that a part of the housing 210 is being folded, the weight applied to the second signal is increased based on the angle information, and the weight applied to the second signal is increased.
  • the at least one processor 120 calculates a weight to be applied to the first signal or the second signal at a specified rate whenever a change in angle information obtained while a part of the housing 210 is folded is changed to a specified range. can be adjusted As another example, the at least one processor 120 may adjust a weight to be applied to the first signal and/or the second signal with weight information designated in response to angle information obtained while a part of the housing 210 is folded. .
  • the at least one processor 120 increases the weight of the second signal output to the second path 603 when a state in which a portion of the housing 210 is folded is completed, and after a predetermined time elapses When it is confirmed that the beamformer 611 is stabilized, the weight of the second signal may be adjusted to the maximum value (1.0).
  • the noise removal module 610 receives weight information including the adjusted weight of the first signal and/or the second signal from the at least one processor 120 based on the angle information, and the received A more reinforced voice signal may be output by applying a weight to the first signal and/or the second signal based on the weight information to remove noise according to a change in angle during folding.
  • the electronic device 101 may generate echo and/or sound signals from a voice signal based on angle information obtained while at least a portion of the housing 210 is folded or unfolded.
  • a software module eg, the program 140 of FIG. 1
  • the memory 130 of the electronic device 101 may store instructions (eg, instructions) to implement a software module.
  • the at least one processor 120 may execute instructions stored in the memory 130 to implement the software module, and hardware associated with the function of the software module (eg, the sensor module 176 of FIG. 1 , the input module 150 ) ), the sound output module 155 , the audio module 170 or the communication module 190 ).
  • the software module may be configured to include an application (eg, a module, a manager, or a program) related to a call or voice recording.
  • the application may include an application received from an external electronic device (eg, the server 108 or the electronic devices 102 and 104).
  • the application may include a preloaded application or a third party application downloadable from a server.
  • Components of the software module according to the illustrated embodiment and names of components may vary depending on the type of the operating system.
  • at least a part of the software module may be implemented in software, firmware, hardware, or a combination of at least two or more thereof.
  • At least a part of the software module may be implemented (eg, executed) by, for example, a processor (eg, an AP).
  • a processor eg, an AP
  • At least a part of the software module may include, for example, a module, a program, a routine, a set of instructions, or a process for performing at least one function.
  • the main components of the electronic device have been described with reference to the electronic device 101 of FIGS. 1, 2, and 3 .
  • the components shown in FIGS. 1, 2 and 3 are not all essential components, and the electronic device 101 may be implemented by more components than the illustrated components.
  • the electronic device 101 may be implemented with fewer components.
  • positions of major components of the electronic device 101 described above with reference to FIGS. 1, 2, and 3 may be changeable according to various embodiments.
  • the electronic device (eg, the electronic device 101 of FIGS. 1, 2 and 3 ) includes a housing configured to have at least one portion folded, at least one microphone, at least one speaker, and the at least one an audio module electrically connected to a microphone and the at least one speaker, and at least one processor electrically connected to the audio module, wherein the at least one processor identifies a voice signal received through the microphone;
  • the audio module is configured to obtain angle information related to folding of at least a portion of the housing, identify a state in which at least a portion of the housing is being folded based on the angle information, and process the voice signal based on the angle information and control the audio module to process the voice signal based on the adjusted control information during folding of at least a portion of the housing.
  • the at least one processor identifies a folding speed corresponding to a folding angle change based on the angle information, and when the identified folding speed exceeds a specified threshold, at least one of the housing identify that the portion is in a folding state, and in the folding state, when a specified time elapses when the identified folding speed is below a specified threshold value, at least a portion of the housing is configured to identify a stationary state in which the folding is stopped.
  • the electronic device further includes at least one sensor configured to sense a folding motion of at least a portion of the housing with respect to a hinge structure to obtain the angle information
  • the audio module includes: A voice signal processing module that performs signal processing for removing echo or noise from a signal, and a control module that receives the angle information from the at least one processor and controls the voice signal processing module based on the received angle information may include.
  • control information includes at least one of operation parameter information for processing the audio signal of the audio module, the weight information, and input sensitivity information of the microphone, and the operation parameter information for processing the audio signal includes: It may include an echo cancellation operation parameter and a noise cancellation operation parameter.
  • the at least one processor may adjust the echo cancellation operation parameter included in the operation parameter information based on the angle information while at least a portion of the housing is being folded,
  • the audio module may be configured to control the audio module to remove an echo from the voice signal based on the echo cancellation operation parameter adjusted.
  • the at least one processor removes a linear echo component from the voice signal based on the echo cancellation operation parameter adjusted according to a change in the angle of the angle information while the at least one part of the housing is folded. and, based on the echo cancellation operation parameter adjusted according to a change in the relative distance between the at least one microphone and the at least one speaker during folding of at least a portion of the housing, residual echo and non-linear echo components from the voice signal It can be set to remove.
  • the at least one processor is included in the operation parameter information according to a change in the relative distance between the at least one microphone and the at least one speaker based on the angle information while at least a portion of the housing is being folded adjust the noise canceling operation parameter, and control the audio module to remove noise from the voice signal based on the noise canceling operation parameter adjusted while at least a portion of the housing is folded, the noise canceling operation parameter may include a beamforming bandwidth adjusted according to the angle information.
  • the audio module includes a noise canceling module
  • the noise control module is configured to receive a beamforming bandwidth from the voice signal through a first path of the noise canceling module while at least a portion of the housing is folded. outputting a first signal from which noise has been removed accordingly, and outputting a second signal from which noise has been removed from the audio signal through a second path of the noise removal module while folding at least a portion of the housing, and the angle information Receives weight information set based on the weight information, applies different weight information to each of the first signal and the second signal, and mixes the first signal and the second signal to obtain a noise-removed voice signal It can be configured to control the audio module to acquire.
  • the at least one processor may be configured to identify a relative distance between the at least one microphone and the at least one speaker based on the angle information while at least a portion of the housing is being folded, and the identified relative distance control the audio module to adjust the sensitivity of the microphone to a specified low value when it decreases below a specified distance threshold, and when the identified relative distance exceeds a specified distance threshold, set the sensitivity of the microphone to a specified It can be set to control the audio module to adjust to a high value.
  • the electronic device may further include a communication module configured to transmit the voice signal processed based on the adjusted control information to an external electronic device.
  • FIG. 7 is a diagram illustrating an example of an operation method in an electronic device according to various embodiments of the present disclosure.
  • an electronic device eg, the electronic device 101 of FIGS. 1, 2, and 3 ) according to various embodiments executes an application related to a voice call or voice recording, and through the executed application An operation for processing the received voice signal may be performed.
  • the electronic device may receive a voice signal through a microphone (eg, the input module 150 of FIG. 1 , and the microphone 220 of FIGS. 2 and 3 ).
  • the voice signal received through the microphone is a voice signal of a speaker located at a distance (eg, a far-end speaker) together with a voice signal of a speaker located at a short distance (eg, a far-end speaker) and echoes and noise for a signal output from the speaker 230 . this may be included.
  • the received voice signal may be transmitted to an audio module (eg, the audio module 301 of FIG. 3 ) and processed to obtain an enhanced voice signal by removing echo and/or noise included in the voice signal.
  • the electronic device may acquire angle information related to folding of at least a portion of the housing (eg, the housing 210 of FIG. 2 ).
  • the angle information may include at least a portion of the housing (eg, first housing region 211 and/or second housing region 213 in FIG. 2 ) sensed by at least one sensor (eg, sensor module 176 in FIG. 1 ). ) may be calculated by a processor (eg, the processor 120 of FIGS. 1 and 3 ) based on the motion information.
  • the electronic device may identify a state in which at least a portion of the housing is being folded based on the acquired angle information. For example, when the acquired angle information is less than a specified threshold or in an unfolded state (eg, the angle between the first housing region 211 and the second housing region 213 in FIGS. 2 and 4 is 180 degrees), The electronic device may identify that at least a portion of the housing is not being folded. For example, when the acquired angle information is an angle greater than or equal to a threshold value for the specified angle or when the folding speed identified based on the angle information exceeds the threshold value for the specified speed, the electronic device may It may be identified that the first housing region 211 and/or the second housing region 213 are in a folded state.
  • the electronic device in the folded state, when the identified folding speed is less than or equal to a specified threshold value, and when the specified time elapses, the electronic device is in a state in which the folding operation of at least a portion of the housing is completed (or stopped) (eg, the folding stopped state) can be identified as
  • the folding speed may indicate a degree to which an angle between the first housing region 211 and the second housing region 213 changes per second.
  • the electronic device may adjust control information for processing the received voice signal based on the acquired angle information.
  • the control information is transmitted by the voice signal processing module (eg, the voice signal processing module 320 of FIG. 3 ) whenever the folding angle changes to an angle (eg, 15 degrees) within a specified range while a part of the housing is folded. It may be adjusted at a certain rate in the previous control information.
  • the control information may be information designated in advance corresponding to the angle information, and may be stored in advance in a memory (eg, the memory 130 of FIG. 1 ) in the form of a table.
  • the control information may include at least one of operation parameter information (or factors) for processing a voice signal of the voice processing module 320 , weight information related to beamforming performance of the microphone 220 , or input sensitivity information of the microphone 220 .
  • the operation parameter information (or factor) for speech signal processing includes the echo cancellation operation parameter (or factor) (eg, intensity of the residual echo canceller (RES), linear/non-linear echo cancellation intensity (eg, noise cancellation intensity), AGC ( automatic gain control), coefficients of an adaptive filter (e.g. first filter) and at least one of convergence rate or echo path change detector) and/or denoising operation parameters (or factors) (e.g. beamforming bandwidth).
  • the echo cancellation operation parameter or factor
  • RES residual echo canceller
  • linear/non-linear echo cancellation intensity eg, noise cancellation intensity
  • AGC automatic gain control
  • coefficients of an adaptive filter e.g. first filter
  • convergence rate or echo path change detector e.g. beamforming bandwidth
  • the convergence speed of the adaptive filter may be a factor for controlling the adaptive speed by following the angle change according to the folding while a portion of the housing 210 is folded.
  • the intensity of the residual echo canceller (RES) eg, the second filter
  • component may be a factor for removing the
  • the control information may include parameter sets preset by mapping angle information designated to at least one of operation parameter information for voice signal processing, weight information, or input sensitivity information of a microphone, and the preset parameter sets include: It may be stored in the memory 130 in the form of a table.
  • the electronic device may perform an operation for obtaining an enhanced voice signal by removing echo and/or noise from the voice signal while at least a portion of the housing is being folded based on the adjusted control information. For example, the electronic device removes an echo of a linear component based on an echo reference from a voice signal by the voice signal processing module, and a non-linear residual echo and a microphone 220 and a speaker ( 230), it is possible to remove components of non-linearity due to the hardware characteristics. For example, the electronic device improves the signal to noise ratio by removing noise coming from another direction while preserving the voice signal coming from the position or direction of the near-end speaker in the voice signal by the voice signal processing module. , noise introduced from the position or direction of the near-end speaker can be removed.
  • the electronic device when performing operation 709, for example, performs an operation of removing an echo from the voice signal and then performing an operation of removing noise from the voice signal from which the echo has been removed to enhance the voice. signal can be obtained.
  • the electronic device may acquire an enhanced voice signal by performing an operation of removing noise from a voice signal and then performing an operation of removing an echo from the voice signal.
  • the electronic device may perform either an operation of removing an echo or an operation of removing noise from a voice signal.
  • the electronic device may end the control operation for voice processing.
  • FIG. 8 is a diagram illustrating an example of an operation method in an electronic device according to various embodiments of the present disclosure.
  • an electronic device eg, the electronic device 101 of FIGS. 1, 2, and 3 ) according to various embodiments includes, in operation 801 , a microphone (eg, the input module 150 of FIG. 1 ); A voice signal may be received through the microphone 220 of FIGS. 2 and 3 .
  • the voice signal received through the microphone is a voice signal of a speaker located at a distance (eg, a far-end speaker) together with a voice signal of a speaker located at a short distance (eg, a far-end speaker) and echoes and noise for a signal output from the speaker 230 . this may be included.
  • the electronic device may obtain angle information related to folding of at least a portion of the housing (eg, the housing 210 of FIG. 2 ).
  • the angle information may include at least a portion of the housing (eg, first housing region 211 and/or second housing region 213 in FIG. 2 ) sensed by at least one sensor (eg, sensor module 176 in FIG. 1 ). ) may be calculated by a processor (eg, the processor 120 of FIGS. 1 and 3 ) based on the motion information.
  • the electronic device determines whether a portion of the housing is being folded based on the acquired angle information, so that the angular velocity (hereinafter, folded) indicating the degree of change in the angle of the folded portion in a state in which the portion of the housing is folded (hereinafter, folded) It can be checked whether the speed) exceeds a specified threshold.
  • the electronic device identifies that a portion of the housing is in a stationary state in which it is not folded, and a voice signal processing module (eg, the voice signal processing module of FIG. 3 ) An operation of canceling the echo may be performed with the operation parameter set in ( 320 )).
  • a voice signal processing module eg, the voice signal processing module of FIG. 3
  • An operation of canceling the echo may be performed with the operation parameter set in ( 320 )).
  • the electronic device determines whether execution of an application related to a voice call or voice recording ends or completes the voice processing operation due to a specified event, and upon completion, the electronic device The device ends the voice processing operation. Otherwise, the electronic device may continue to perform operation 801 .
  • the electronic device performs a first filter (eg, the first filter included in the echo cancellation module included in the control information based on the angle information) (eg, the first filter of FIG. 5 )
  • a first filter eg, the first filter included in the echo cancellation module included in the control information based on the angle information
  • An operation factor eg, a parameter for an update (or convergence) speed of the first filter
  • the residual echo cancellation operation factor eg, RES intensity
  • the degree of angular change over time of the angular information decreases while a part of the housing is being folded, so that the folded part (eg, the first housing)
  • the operation of the first filter to follow the instantaneous rapid change eg, acoustic echo path change
  • a factor eg, a parameter for the update (or convergence) speed of the first filter
  • the first filter may adapt to the update (or convergence) speed quickly.
  • the electronic device has a housing
  • the degree of angular change over time of the angular information decreases while a portion of the angular information is folded, so that the relative distance between the folded portion (eg, the portion facing the first housing region 211 (eg, the second housing region 213 ))
  • the residual echo cancellation operation factor eg, RES intensity
  • the electronic device may remove a linear echo component from the speech signal through the first filter based on the adjusted operation factor of the first filter.
  • the electronic device performs a residual echo and a microphone and It is possible to remove the echo component of non-linearity due to the hardware characteristics of the speaker.
  • the residual echo cancellation operation factor eg, RES intensity
  • the residual echo canceller of the speech signal processing module becomes closer when the relative distance between the folded part and the facing part increases, compared to when the relative distance increases. They can all operate with a stronger RES intensity.
  • the electronic device may determine whether a portion of the housing is in a stationary state in which the portion facing each other is not folded. For example, as shown in (d) of FIG. 4 , when the angle information is identified as 0 degrees, the electronic device identifies the first housing area 211 of the housing 210 as a fully folded state, and a certain period of time When elapsed, it can be identified as being in a stationary state. In operation 815 , the electronic device determines that the state is stopped, and when the stable state of the voice signal processing module is identified, the voice signal processing operation may be terminated.
  • the electronic device may adjust the convergence speed of the echo cancellation module to a small extent or return it to an original state so as to adapt slowly. Otherwise, the electronic device may perform operation 801 to continuously perform the voice signal processing operation.
  • FIG. 9 is a diagram illustrating an example of an operation method in an electronic device according to various embodiments of the present disclosure.
  • an electronic device eg, the electronic device 101 of FIGS. 1, 2, and 3 ) according to various embodiments of the present disclosure includes, in operation 901 , a microphone (eg, the input module 150 of FIG. 1 ); A voice signal may be received through the microphone 220 of FIGS. 2 and 3 .
  • the voice signal received through the microphone is a voice signal of a speaker located at a distance (eg, a far-end speaker) together with a voice signal of a speaker located at a short distance (eg, a far-end speaker) and echoes and noise for a signal output from the speaker 230 . this may be included.
  • the electronic device may obtain angle information related to folding of at least a portion of the housing (eg, the housing 210 of FIG. 2 ).
  • the angle information may include at least a portion of the housing (eg, first housing region 211 and/or second housing region 213 in FIG. 2 ) sensed by at least one sensor (eg, sensor module 176 in FIG. 1 ). ) may be calculated by a processor (eg, the processor 120 of FIGS. 1 and 3 ) based on the motion information.
  • the electronic device may remove noise from a voice signal received by a noise removing module (eg, the noise removing module 610 of FIG. 6 ) included in the voice signal processing module 320 .
  • a noise removing module eg, the noise removing module 610 of FIG. 6
  • the electronic device uses a beamformer (eg, the beamformer 611 of FIG. 6 ) and a noise canceller (eg, the noise canceller 613 of FIG. ))), noise may be removed from the voice signal through the first path (eg, the first path 601 of FIG. 6 ), and the first signal from which the noise has been removed may be output using beamforming.
  • a beamformer eg, the beamformer 611 of FIG. 6
  • a noise canceller eg, the noise canceller 613 of FIG.
  • the electronic device may obtain weight information to be applied to each of the first signal and the second signal based on the obtained angle information.
  • the electronic device may mix the first signal, the second signal, and weight information to prevent a signal output from changing abruptly as a part of the electronic device is folded, and may output a mixed signal that is an enhanced voice signal.
  • the electronic device applies a maximum weight value (1.0) to the second signal output from the second path 603 in the first stop state by the noise removal module included in the voice processing module, and the first A minimum weight value (0) may be applied to the first signal output from the path 601 , and the weighted first signal and the second signal may be mixed.
  • the weight when the weight is applied to 0, it may mean that 100% of the beamforming by the beamformer 611 is applied in the first path 601 .
  • the electronic device may increase the weight applied to the first signal and decrease the weight applied to the second signal based on the angle information. For example, the electronic device may adjust a weight to be applied to the first signal or the second signal at a specified ratio whenever a change in angle information obtained while a part of the housing is folded is changed to a specified range. For another example, the electronic device may adjust a weight to be applied to the first signal and/or the second signal with weight information designated in response to angle information obtained while a part of the housing is folded.
  • the electronic device increases the weight of the second signal output to the second path when a state in which the part of the housing is folded is completed, and when it is confirmed that the beamformer is stabilized after a predetermined time has elapsed, the second The weight of the signal can be adjusted to the maximum value (1.0).
  • the noise removal module receives weight information including the adjusted weight of the first signal and/or the second signal from the processor based on the angle information, and based on the received weight information, the first signal and / Alternatively, by applying a weight to the second signal and removing noise according to a change in angle during folding, a more reinforced voice signal may be output.
  • the electronic device may end the control operation for voice processing.
  • the echo cancellation operation by the echo cancellation module of the voice processing module described with reference to FIG. 8 and the noise cancellation operation by the noise cancellation module of the voice processing module described with reference to FIG. 9 may be performed in combination or separately.
  • the electronic device may additionally perform the operation described with reference to FIG. 9 after performing the operation method described with reference to FIG. 8 .
  • the electronic device may additionally perform the operation described with reference to FIG. 8 after performing the operation described with reference to FIG. 9 .
  • an operation of adjusting the input sensitivity of the microphone according to angle information may be further performed.
  • the electronic device identifies a distance value between the microphone and the speaker based on angle information during folding of at least a portion of the housing, and when the identified distance value decreases below a specified distance threshold, the input sensitivity of the microphone can be adjusted to a specified low value. When the identified distance value exceeds a specified distance threshold, the electronic device may adjust the input sensitivity of the microphone to a specified high value.
  • At least one microphone eg, the microphone 220 of FIGS. 1, 2, and 3
  • at least one speaker eg, the speaker 230 of FIGS. 1, 2 and 3
  • An operating method in an electronic device eg, the electronic device 101 of FIGS.
  • 1, 2, and 3 including an operation of receiving a voice signal through the at least one microphone, at least one housing of the electronic device Acquiring angle information related to folding of a portion, identifying a state in which at least a portion of the housing is being folded based on the angle information, and audio of the electronic device for processing the voice signal based on the angle information It may include an operation of adjusting control information of a module and an operation of processing the voice signal based on the adjusted control information while at least a portion of the housing is folded by the audio module.
  • the operation of identifying a state in which at least a portion of the housing is being folded includes an operation of identifying a folding speed corresponding to a change in a folding angle based on the angle information, and a threshold value to which the identified folding speed is specified. when exceeded, identifying that at least a portion of the housing is in a folding state.
  • the method includes: when a predetermined time elapses at the identified folding speed below a predetermined threshold value while the at least one portion of the housing is being folded, the at least one portion of the housing is in a stationary state in which the folding is stopped It may further include an operation of identifying
  • the control information includes at least one of operation parameter information for processing a voice signal of the audio module, the weight information, and input sensitivity information of the microphone,
  • the operation parameter information may include an echo cancellation operation parameter and a noise cancellation operation parameter.
  • the processing of the voice signal based on the adjusted control information may include removing the echo that is adjusted according to an angle change of the angle information while folding of at least a portion of the housing by the audio module. Adjusting according to a change in the relative distance between the at least one microphone and the at least one speaker during an operation of removing a linear echo component from the voice signal based on an operation parameter and folding of at least a portion of the housing by the audio module and removing residual echo and nonlinear echo components from the speech signal based on the echo cancellation operation parameter.
  • the processing of the voice signal based on the adjusted control information may include a relative distance between the at least one microphone and the at least one speaker while at least a portion of the housing is folded by the audio module. and removing noise from the voice signal based on the noise canceling operation parameter adjusted according to a change, wherein the noise canceling operation parameter may include a beamforming bandwidth adjusted according to the angle information.
  • the processing of the voice signal based on the adjusted control information may include: a first path of the noise removal module in the voice signal while at least a portion of the housing is folded by the audio module. outputting a first signal from which noise has been removed according to a beamforming bandwidth through the audio module; outputting a second signal, receiving weight information set based on the angle information by the audio module, and applying different weighting information to each of the first signal and the second signal by the audio module and mixing the first signal and the second signal by the audio module to obtain a noise-removed voice signal.
  • the processing of the voice signal based on the adjusted control information may include: the at least one microphone identified based on the angle information during folding of at least a portion of the housing by the audio module; when the relative distance between the at least one speaker decreases below a specified distance threshold, adjusting the sensitivity of the microphone to a specified low value; and
  • the non-transitory storage medium storing the program may include, when the program is executed by a processor, the processor receives a voice signal through the at least one microphone;
  • the electronic device for obtaining angle information related to folding of at least a portion, identifying a state in which at least a portion of the housing is being folded based on the angle information, and processing the voice signal based on the angle information may include an instruction executable to execute an operation of adjusting control information of an audio module of have.
  • the electronic device may have various types of devices.
  • the electronic device may include, for example, a portable communication device (eg, a smart phone), a computer device, a portable multimedia device, a portable medical device, a camera, a wearable device, or a home appliance device.
  • a portable communication device eg, a smart phone
  • a computer device e.g., a smart phone
  • a portable multimedia device e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a wearable device e.g., a smart bracelet
  • a home appliance device e.g., a home appliance
  • first, second, or first or second may simply be used to distinguish an element from other elements in question, and may refer elements to other aspects (e.g., importance or order) is not limited. It is said that one (eg, first) component is “coupled” or “connected” to another (eg, second) component, with or without the terms “functionally” or “communicatively”. When referenced, it means that one component can be connected to the other component directly (eg by wire), wirelessly, or through a third component.
  • module used in various embodiments of this document may include a unit implemented in hardware, software, or firmware, and is interchangeable with terms such as, for example, logic, logic block, component, or circuit.
  • a module may be an integrally formed part or a minimum unit or a part of the part that performs one or more functions.
  • the module may be implemented in the form of an application-specific integrated circuit (ASIC).
  • ASIC application-specific integrated circuit
  • Various embodiments of the present document include one or more instructions stored in a storage medium (eg, internal memory 136 or external memory 138) readable by a machine (eg, electronic device 101).
  • a storage medium eg, internal memory 136 or external memory 138
  • the processor eg, the processor 120
  • the device eg, the electronic device 101
  • the one or more instructions may include code generated by a compiler or code executable by an interpreter.
  • the device-readable storage medium may be provided in the form of a non-transitory storage medium.
  • 'non-transitory' only means that the storage medium is a tangible device and does not contain a signal (eg, electromagnetic wave), and this term is used in cases where data is semi-permanently stored in the storage medium and It does not distinguish between temporary storage cases.
  • a signal eg, electromagnetic wave
  • the method according to various embodiments disclosed in this document may be provided in a computer program product (computer program product).
  • Computer program products may be traded between sellers and buyers as commodities.
  • the computer program product is distributed in the form of a machine-readable storage medium (eg compact disc read only memory (CD-ROM)), or via an application store (eg Play Store TM ) or on two user devices ( It can be distributed (eg downloaded or uploaded) directly or online between smartphones (eg: smartphones).
  • a portion of the computer program product may be temporarily stored or temporarily created in a machine-readable storage medium such as a memory of a server of a manufacturer, a server of an application store, or a relay server.
  • each component eg, a module or a program of the above-described components may include a singular or a plurality of entities, and some of the plurality of entities may be separately disposed in other components. have.
  • one or more components or operations among the above-described corresponding components may be omitted, or one or more other components or operations may be added.
  • a plurality of components eg, a module or a program
  • the integrated component may perform one or more functions of each component of the plurality of components identically or similarly to those performed by the corresponding component among the plurality of components prior to the integration. .
  • operations performed by a module, program, or other component are executed sequentially, in parallel, repeatedly, or heuristically, or one or more of the operations are executed in a different order, or omitted. , or one or more other operations may be added.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Telephone Function (AREA)

Abstract

본 문서는 음성 신호 처리를 위한 전자 장치 및 방법에 관한 것으로서, 다양한 실시예에 따르면, 전자 장치는, 적어도 일 부분이 접히도록 구성된 하우징, 적어도 하나의 마이크, 적어도 하나의 스피커, 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커와 전기적으로 연결되는 오디오 모듈 및 상기 오디오 모듈과 전기적으로 연결된 적어도 하나의 프로세서를 포함하며, 상기 적어도 하나의 프로세서는, 상기 마이크를 통해 수신되는 음성 신호를 식별하고, 상기 하우징의 적어도 일 부분의 접힘에 관련된 각도 정보를 획득하고, 상기 각도 정보를 기반하여 상기 하우징의 적어도 일부분이 접히는 중인 상태를 식별하고, 상기 각도 정보에 기반하여 상기 음성 신호를 처리하기 위한 상기 오디오 모듈의 제어 정보를 조절하고, 상기 하우징의 적어도 일 부분의 접히는 중 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하도록 상기 오디오 모듈을 제어하도록 설정될 수 있다. 다른 실시예도 가능하다.

Description

음성 신호 처리를 위한 전자 장치 및 방법
본 문서의 다양한 실시 예들은 음성 신호 처리를 위한 전자 장치 및 방법에 관한 것이다.
최근에는 전자 장치가 사용자의 편의를 위해 다양한 형태로 발전하고 있으며, 다양한 서비스 또는 기능을 제공하며, 휴대성을 가지면서도 멀티미디어 서비스에 적합한 전자 장치로 구현되고 있다.
전자 장치가 제공하는 다양한 서비스 또는 기능을 충분히 이용하기 위해서, 전자 장치의 디스플레이의 크기가 커질 수 있다. 이에 따라, 접힘(folding) 가능하도록 분리된 하우징 구조의 전 영역에 접힘(folding) 가능한 플렉서블 디스플레이가 배치될 수 있으며, 하우징 구조는 하나 이상의 스피커와 마이크를 포함하는 형태로 구현될 수 있다.
접힘 또는 펼침과 같이 형태 변형이 가능한 전자 장치(ex.휴대전화, IOT 스피커, TV 등)를 사용함에 있어 음성 신호를 처리할 때, 음성 신호에서 에코 및 잡음을 제거하는 음성 신호 처리를 수행할 수 있다.
형태의 변형이 가능한 전자 장치(예: 폴더블 전자 장치)에서 플렉서블 디스플레이의 접힘에 따라 하우징의 일부가 접히게 되면, 마이크 및 스피커의 위치가 변경되어 마이크 및 스피커 간의 상대적 거리가 변경되어 음성 신호 처리가 정상적으로 동작하지 않고 열화가 발생할 수 있다. 이로 인해 화자의 음성 신호와 함께 주변 음향에 의한 잡음 또는 에코가 발생하여 심각한 음질 저하가 발생하거나 화자의 음성이 명료하게 전달되지 않을 수 있다.
본 문서의 다양한 실시 예에 따르면, 전자 장치의 형태의 변형에 따라 음성 신호 처리의 성능을 일정하게 유지하도록 음성 신호를 처리하기 위한 전자 장치 및 방법이 제공될 수 있다.
본 문서의 다양한 실시예에 따르면, 전자 장치는, 적어도 일 부분이 접히도록 구성된 하우징, 적어도 하나의 마이크, 적어도 하나의 스피커, 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커와 전기적으로 연결되는 오디오 모듈 및 상기 오디오 모듈과 전기적으로 연결된 적어도 하나의 프로세서를 포함하며, 상기 적어도 하나의 프로세서는, 상기 마이크를 통해 수신되는 음성 신호를 식별하고, 상기 하우징의 적어도 일 부분의 접힘에 관련된 각도 정보를 획득하고, 상기 각도 정보를 기반하여 상기 하우징의 적어도 일부분이 접히는 중인 상태를 식별하고, 상기 각도 정보에 기반하여 상기 음성 신호를 처리하기 위한 상기 오디오 모듈의 제어 정보를 조절하고, 상기 하우징의 적어도 일 부분의 접히는 중 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하도록 상기 오디오 모듈을 제어하도록 설정될 수 있다.
다양한 실시 예에 따르면, 적어도 하나의 마이크 및 적어도 하나의 스피커를 포함하는 전자 장치에서의 동작 방법은, 상기 적어도 하나의 마이크를 통해 음성 신호를 수신하는 동작, 상기 전자 장치의 하우징의 적어도 일 부분의 접힘에 관련된 각도 정보를 획득하는 동작, 상기 각도 정보를 기반하여 상기 하우징의 적어도 일부분의 접히는 중인 상태를 식별하는 동작, 상기 각도 정보에 기반하여 상기 음성 신호를 처리하기 위한 상기 전자 장치의 오디오 모듈의 제어 정보를 조절하는 동작 및 상기 오디오 모듈에 의해 상기 하우징의 적어도 일 부분이 접히는 중 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하는 동작을 포함할 수 있다.
다양한 실시 예에 따르면, 프로그램을 저장한 비 일시적 저장 매체에 있어서, 상기 프로그램은, 프로세서에 의한 실행 시, 상기 프로세서가, 상기 적어도 하나의 마이크를 통해 음성 신호를 수신하는 동작, 상기 전자 장치의 하우징의 적어도 일 부분의 접힘에 관련된 각도 정보를 획득하는 동작, 상기 각도 정보를 기반하여 상기 하우징의 적어도 일부분의 접히는 중인 상태를 식별하는 동작, 상기 각도 정보에 기반하여 상기 음성 신호를 처리하기 위한 상기 전자 장치의 오디오 모듈의 제어 정보를 조절하는 동작 및 상기 오디오 모듈에 의해 상기 하우징의 적어도 일 부분이 접히는 중 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하는 동작을 실행하도록 실행 가능한 명령을 포함할 수 있다.
일 실시 예에 따르면, 음성 신호를 처리하기 위한 전자 장치 및 방법을 제공함으로써, 전자 장치의 형태의 변형에 따라 음성 신호 처리의 성능 강화를 위한 제어 정보를 조절하여 화자의 음성 신호에 함께 유입되는 에코 및 잡음을 제거함으로써, 음성 신호 처리 시 열화가 발생하지 않고 일정한 성능을 유지할 수 있으므로 음질이 저하되지 않고 보다 강화된 음성 신호를 제공할 수 있다.
도 1은 다양한 실시예들에 따른 네트워크 환경 내의 전자 장치의 블록도이다.
도 2a 및 도 2b는 다양한 실시예에 따른 전자 장치의 구성 예를 나타내는 도면이다.
도 3은 다양한 실시예에 따른 전자 장치의 구성 예를 나타내는 도면이다.
도 4는 다양한 실시 예에 따른 전자 장치의 접히는 상태의 예를 나타내는 도면이다.
도 5는 다양한 실시예들에 따른 전자 장치의 오디오 모듈의 구성 예를 도시한 도면이다.
도 6은 다양한 실시예들에 따른 전자 장치의 오디오 모듈의 구성 예를 도시한 도면이다.
도 7은 다양한 실시 예에 따른 전자 장치에서의 동작 방법의 예를 나타내는 도면이다.
도 8은 다양한 실시 예에 따른 전자 장치에서의 동작 방법의 예를 나타내는 도면이다.
도 9는 다양한 실시 예에 따른 전자 장치에서의 동작 방법의 예를 나타내는 도면이다.
도면의 설명과 관련하여, 동일 또는 유사한 구성요소에 대해서는 동일 또는 유사한 참조 부호가 사용될 수 있다.
이하, 첨부된 도면들을 참조하여 다양한 실시예에 따른 전자 장치에 대해서 살펴본다. 다양한 실시예에서 이용되는 사용자라는 용어는 전자 장치를 사용하는 사람 또는 전자 장치를 사용하는 장치(예를 들어, 인공지능 전자 장치)를 지칭할 수 있다.
도 1은, 다양한 실시예들에 따른, 네트워크 환경(100) 내의 전자 장치(101)의 블록도이다.
도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제 1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제 2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 모듈(150), 음향 출력 모듈(155), 디스플레이 모듈(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 연결 단자(178), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 연결 단자(178))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들(예: 센서 모듈(176), 카메라 모듈(180), 또는 안테나 모듈(197))은 하나의 구성요소(예: 디스플레이 모듈(160))로 통합될 수 있다.
프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 저장하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(134)에 저장할 수 있다. 일실시예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 어플리케이션 프로세서) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 신경망 처리 장치(NPU: neural processing unit), 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 예를 들어, 전자 장치(101)가 메인 프로세서(121) 및 보조 프로세서(123)를 포함하는 경우, 보조 프로세서(123)는 메인 프로세서(121)보다 저전력을 사용하거나, 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 디스플레이 모듈(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 신경망 처리 장치)는 인공지능 모델의 처리에 특화된 하드웨어 구조를 포함할 수 있다. 인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능 모델이 수행되는 전자 장치(101) 자체에서 수행될 수 있고, 별도의 서버(예: 서버(108))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다.
메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서 모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비휘발성 메모리(134)를 포함할 수 있다.
프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다.
입력 모듈(150)은, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 모듈(150)은, 예를 들면, 마이크, 마우스, 키보드, 키(예: 버튼), 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.
음향 출력 모듈(155)은 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 모듈(155)은, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있다. 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
디스플레이 모듈(160)은 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 디스플레이 모듈(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일실시예에 따르면, 디스플레이 모듈(160)은 터치를 감지하도록 설정된 터치 센서, 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 압력 센서를 포함할 수 있다.
오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일실시예에 따르면, 오디오 모듈(170)은, 입력 모듈(150)을 통해 소리를 획득하거나, 음향 출력 모듈(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.
센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일실시예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.
인터페이스(177)는 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일실시예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일실시예에 따르면, 연결 단자(178)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일실시예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일실시예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일실시예에 따르면, 전력 관리 모듈(188)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(189)는 전자 장치(101)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일실시예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일실시예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(198)(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제 2 네트워크(199)(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부의 전자 장치(104)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 또는 인증할 수 있다.
무선 통신 모듈(192)은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB(enhanced mobile broadband)), 단말 전력 최소화와 다수 단말의 접속(mMTC(massive machine type communications)), 또는 고신뢰도와 저지연(URLLC(ultra-reliable and low-latency communications))을 지원할 수 있다. 무선 통신 모듈(192)은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈(192)은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO: full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다. 무선 통신 모듈(192)은 전자 장치(101), 외부 전자 장치(예: 전자 장치(104)) 또는 네트워크 시스템(예: 제 2 네트워크(199))에 규정되는 다양한 요구사항을 지원할 수 있다. 일실시예에 따르면, 무선 통신 모듈(192)은 1eMBB 실현을 위한 Peak data rate(예: 20Gbps 이상), mMTC 실현을 위한 손실 Coverage(예: 164dB 이하), 또는 URLLC 실현을 위한 U-plane latency(예: 다운링크(DL) 및 업링크(UL) 각각 0.5ms 이하, 또는 라운드 트립 1ms 이하)를 지원할 수 있다.
안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 안테나를 포함할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다. 이런 경우, 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부의 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC(radio frequency integrated circuit))이 추가로 안테나 모듈(197)의 일부로 형성될 수 있다.
다양한 실시예에 따르면, 안테나 모듈(197)은 mmWave 안테나 모듈을 형성할 수 있다. 일실시예에 따르면, mmWave 안테나 모듈은 인쇄 회로 기판, 상기 인쇄 회로 기판의 제 1 면(예: 아래 면)에 또는 그에 인접하여 배치되고 지정된 고주파 대역(예: mmWave 대역)을 지원할 수 있는 RFIC, 및 상기 인쇄 회로 기판의 제 2 면(예: 윗 면 또는 측 면)에 또는 그에 인접하여 배치되고 상기 지정된 고주파 대역의 신호를 송신 또는 수신할 수 있는 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일실시예에 따르면, 명령 또는 데이터는 제 2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104) 간에 송신 또는 수신될 수 있다. 외부의 전자 장치(102, 또는 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 일실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부의 전자 장치들(102, 104, 또는 108) 중 하나 이상의 외부의 전자 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부의 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부의 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 모바일 에지 컴퓨팅(MEC: mobile edge computing), 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다. 전자 장치(101)는, 예를 들어, 분산 컴퓨팅 또는 모바일 에지 컴퓨팅을 이용하여 초저지연 서비스를 제공할 수 있다. 다른 실시예에 있어서, 외부의 전자 장치(104)는 IoT(internet of things) 기기를 포함할 수 있다. 서버(108)는 기계 학습 및/또는 신경망을 이용한 지능형 서버일 수 있다. 일실시예에 따르면, 외부의 전자 장치(104) 또는 서버(108)는 제 2 네트워크(199) 내에 포함될 수 있다. 전자 장치(101)는 5G 통신 기술 및 IoT 관련 기술을 기반으로 지능형 서비스(예: 스마트 홈, 스마트 시티, 스마트 카, 또는 헬스 케어)에 적용될 수 있다.
도 2a 및 도 2b는 다양한 실시예에 따른 전자 장치의 구성 예를 나타내는 도면이고, 도 3은 다양한 실시예에 따른 전자 장치의 구성 예를 나타내는 도면이고, 도 4는 다양한 실시 예에 따른 전자 장치의 접히는 상태의 예를 나타내는 도면이다.
도 1, 도 2a, 도 2b 및 도 3을 참조하면, 다양한 실시예에 따른 전자 장치(101)(예: 도 1의 전자 장치(101))는 하우징(210)의 적어도 일부분의 형태가 변형되어 접히도록(folding) 구성될 수 있다. 하우징(210)은 제1 하우징 영역(211) 및 제2 하우징 영역(213)으로 구분될 수 있으며, 힌지 구조(215)(또는 기준선)를 기준으로 제1 하우징 영역(211)의 전면(예: 전자 장치(101)의 디스플레이가 노출된 면) 및 제2 하우징 영역(213)의 전면(예: 전자 장치(101)의 디스플레이가 노출된 면)이 서로 마주보는 방향 또는 반대 방향으로 제1 하우징 영역(211) 또는 제2 하우징 영역(213) 중 적어도 하나가 접히도록 구성될 수 있다.
다양한 실시예에 따르면, 전자 장치(101)(예: 도 1의 전자 장치(101))는 오디오 모듈(301)(예: 도 1의 오디오 모듈(176)) 및 적어도 하나의 프로세서(120)를 포함하여 구성될 수 있다. 전자 장치(101)는 적어도 하나의 프로세서(120)와 전기적으로 연결되어 적어도 하나의 프로세서(120)가 실행될 때, 적어도 하나의 프로세서(120)로 하여금 수행되는 동작들의 명령을 저장하는 메모리(예: 도 1의 메모리(130)), 적어도 하나 센서(예: 도 1의 센서 모듈(176)) 및 통신 모듈(예: 도 1의 통신 모듈(190))을 포함하여 구성될 수 있다. 일 실시예에 따르면, 전자 장치(101)는 도 2a에 도시된 바와 같이, 별도 구성된 적어도 하나의 마이크(220)(예: 도 1의 입력 모듈(150)) 및 적어도 하나의 스피커(230)(예: 도 1의 음향 출력 모듈(155))를 포함하여 구성될 수 있다. 다른 실시예에 따르면, 전자 장치(101)는 마이크 구조 및 스피커 구조가 일체형 구조로 구현된 음향 부품(도시되지 않음)을 포함하여 구성될 수 있다. 다른 실시예에 따르면, 전자 장치(101)는 제1 하우징 영역(211) 및 제2 하우징 영역(213)의 일 부분의 내부에 각각 배치된 음향 부품들을 포함하여 구성될 수 있다.
도 2a 및 도 2b를 참조하면, 일 실시예에 따른 적어도 하나의 마이크(220)는 하우징(210)의 제1 하우징 영역(211) 및/또는 제2 하우징 영역(213)의 일부분의 내부에 배치될 수 있다. 예를 들어, 마이크(220)는 하우징(210)의 제1 하우징 영역(211) 또는 제2 하우징 영역(213)이 접힘에 따라 스피커(230)와 대향하는 위치에 배치될 수 있다. 마이크(220)는 음성 신호를 수신하고, 수신된 음성 신호를 오디오 모듈(301)로 전달할 수 있다. 마이크(220)를 통해 수신되는 음성 신호는 근거리에 위치한 화자(예: 근단 화자)의 음성 신호와 함께 원거리에 위치한 화자(예: 원단 화자)의 음성 신호 및 스피커(230)로부터 출력되는 신호에 대한 에코 및 잡음이 포함될 수 있다. 일 실시예에 따르면, 스피커(230)는 하우징(210)의 제1 하우징 영역(211) 또는 제2 하우징 영역(213)의 일부에 배치될 수 있으며, 전기적 신호에 기초하여 소리를 발생시키도록 형성된 구성 및/또는 소리를 전기적으로 신호로 변환하도록 형성된 구성을 포함할 수 있다. 적어도 하나의 마이크(220)는 빔포밍 마이크일 수 있으며, 서로 반대 위상을 갖는 음성 신호를 더하여 상쇄시켜서 근단 화자의 음성 신호를 강화하고 잡음을 제거할 수 있으며, 유입되는 음성 신호들을 처리하여 방향성을 갖도록 할 수 있다. 예를 들어, 적어도 하나의 마이크(220)는 도 2a에 도시된 바와 같이, 근단 화자의 입에 대향하는 방향으로 지향성을 갖도록 빔포밍 동작 인자를 조절할 수 있다. 예를 들어, 전자 장치(101)는 도 2b에 도시된 바와 같이, 복수의 빔포밍 마이크(220)를 포함할 수 있으며, 복수의 빔포밍 마이크(220)가 서로 다른 방향으로 지향성을 갖도록 구현될 수 있으므로 마이크들(220) 간의 거리에 따라 간섭이 발생할 수 있다. 이러한 경우, 하우징의 일 부분이 접히게 되면, 마이크들(220)의 거리가 변화되므로 간섭으로 인하여 유입되는 에코 또는 잡음을 제거하기 위해 거리 변화(또는 각도 변화)에 따른 빔포밍 대역폭을 조절할 수 있다.
다양한 실시예에 따르면, 적어 하나의 스피커(230)는 제1 하우징 영역(211) 또는 제2 하우징 영역(213)의 일부의 내부에 배치될 수 있다. 적어도 하나의 스피커(230)는 제1 하우징 영역(211)을 향하는 방향으로 음향을 출력하고, 출력된 음향은 하우징(210)의 내부 공간에 제공된 음향 도파로(도시되지 않음)를 진행하여 제2 하우징 영역(213)의 일측에서 외부 공간으로 방사될 수 있다. 예를 들어, 스피커(230)는 음성 통화 모드에서 수화음을 출력하는 수화부용 스피커로서 제공될 수 있다. 다른 예를 들어, 멀티미디어 모드에서, 스피커(230)는 라우드 스피커로서 기능할 수 있으며, 도시되지 않은 다른 스피커 모듈과 조합되어 스테레오 음향을 구현할 수 있다.
다른 실시예에 따른 음향 부품은 스피커 구조 및 리시버 구조(예: 마이크 구조)가 일체화되도록 구성되고, 제1 하우징 영역(211) 및 제2 하우징 영역(213)의 일부분의 내부에 배치될 수 있다. 예를 들어, 전자 장치(101)는 펼쳐진 상태(unfolded status) 및 접힌 상태(folded status)에 따라, 서로 다른 음향 동작 모드를 제공할 수 있다. 예를 들어, 전자 장치(101)가 펼쳐진 상태에서, 음향 부품은 스피커 모드(speaker mode)로 동작할 수 있으며, 전자 장치(101)가 접힌 상태에서, 음향 부품은 사용자의 선택에 따라, 스피커 모드 또는 리시버 모드(receiver mode)(예: 마이크 모드)로 동작할 수 있다. 예를 들어, 스피커 모드 및/또는 리시버 모드는 각각 서로 다른 출력 전압을 제공할 수 있다. 다른 실시예에 따르면, 통화를 위해 전자 장치(101)가 접힌 상태에서, 사용자는, 제1 하우징 영역(211) 및 제2 하우징 영역(213) 내에 위치한 일체형 음향 부품들에 의해 어느 방향으로도 송수화가 가능할 수 있다. 전자 장치(101)는 내부에 배치된 센서 모듈(176)(예: 가속도 센서 및/또는 지자기 센서)에 의해, 전자 장치(101)의 상태(예: 위치)를 판단하여, 사용자에게 적합한 근거리 송수화를 제공할 수 있다. 예를 들어, 사용자가 제2 하우징 영역(213)에 입이 위치하고, 제1 하우징 영역(211)에 귀가 위치한 경우, 상기 센서 모듈(176)이 전자 장치의 상태를 판단하고, 제1 하우징 영역(211)에 위치한 음향 부품은 스피커로 동작하고, 제2 하우징 영역(213)에 위치한 음향 부품은 마이크로 동작할 수 있다. 또 다른 예로, 사용자가 제2 하우징 영역(213)에 귀가 위치하고, 제1 하우징 영역(211)에 입이 위치한 경우, 상기 센서 모듈(176)이 전자 장치(101)의 상태를 판단하고, 제1 하우징 영역(211)에 위치한 음향 부품은 마이크로 동작하고, 제2 하우징 영역(213)에 위치한 음향 부품은 스피커로 동작할 수 있다.
도 1, 도 2a, 도 2b 및 도 3을 참조하면, 다양한 실시예에 따른 오디오 모듈(301)은 적어도 하나의 프로세서(120), 마이크(220) 및 스피커(230)(또는 음향 부품)와 전기적으로 연결될 수 있으며, 적어도 하나의 프로세서(120)의 제어에 따라 마이크(220)(또는 음향 부품)로 입력되는 음성 신호를 처리하고, 스피커(230)(또는 음향 부품)로 출력되는 신호를 처리하도록 구성될 수 있다. 한 실시예에 따르면, 오디오 모듈(301)은 제어 모듈(310) 및 음성 신호 처리 모듈(320)을 포함하여 구성될 수 있다. 제어 모듈(310)은 프로세서(120) 및 음성 신호 처리 모듈(320)에 전기적으로 연결되고, 프로세서(120)의 제어 명령에 따라 동작할 수 있으며, 소프트웨어 모듈 또는 하드웨어 모듈로서 구성될 수 있다. 다른 실시예에 따르면, 제어 모듈(310)은 소프트웨어 모듈로서 프로세서(120)에 포함되어 구성될 수 있다. 제어 모듈(310)은 적어도 하나의 센서(예: 도 1의 센서 모듈(176))에 의해 감지된 하우징(210)의 적어도 일부분(예: 제1 하우징 영역(211) 및/또는 제2 하우징 영역(213))의 접힘에 관련된 각도 정보를 프로세서(120)로부터 수신할 수 있다. 제어 모듈(310)은 수신된 각도 정보를 기반하여 수신된 음성 신호를 처리하기 위한 제어 신호를 음성 신호 처리 모듈(320)로 전송할 수 있다. 각도 정보는 프로세서(120)의 제어에 따라 적어도 하나의 센서(예: 도 1의 센서 모듈(176))에 의해 감지된 하우징(210)의 적어도 일부(예: 제1 하우징 영역(211) 및/또는 제2 하우징 영역(213))의 움직임 정보를 기반하여 프로세서(120)에 의해 산출될 수 있다.
다양한 실시예에 따르면, 오디오 모듈(301)의 음성 신호 처리 모듈(320)은 적어도 하나의 프로세서(120)의 제어에 따라 수신된 음성 신호를 처리하기 위한 동작을 수행할 수 있다. 음성 신호 처리 모듈(320)은 프로세서(120)의 제어에 따라 각도 정보를 기반하여 제어 정보를 조절하고, 조절된 제어 정보를 기반하여 수신된 음성 신호에 포함된 에코를 제거하는 음성 신호의 처리 동작을 수행할 수 있다. 음성 신호 처리 모듈(320)은 수신된 음성 신호에서 잡음을 제거하는 음성 신호의 처리를 수행할 수 있다. 제어 정보는 하우징(210)의 일부가 접히는 중에 획득한 각도 정보에 대응하여 지정된 정보일 수 있다. 예를 들어, 제어 정보는 프로세서(120)의 제어에 따라 음성 신호 처리 모듈(320)에 의해 하우징(210)의 일부가 접히는 중에 접힘 각도가 지정된 범위의 각도(예: 15도)로 변할 때마다 이전 제어 정보에서 일정 비율로 조절될 수 있다. 다른 예를 들어, 제어 정보는 각도 정보에 대응하여 미리 지정된 정보일 수 있으며, 테이블 형태로 메모리(130)에 미리 저장될 수 있다.
도 1, 도 2a, 도 2b, 도 3 및 도 4을 참조하면, 다양한 실시예에 따른 전자 장치(101)의 적어도 하나의 프로세서(120)는 마이크(220)를 통해 수신되는 음성 신호를 식별하고, 하우징(210)의 적어도 일 부분(예: 제1 하우징 영역(211) 또는/및 제2 하우징 영역(213))의 접힘에 관련된 각도 정보를 획득하고, 획득된 각도 정보를 기반하여 하우징(210)의 적어도 일부분이 접히는 상태를 식별할 수 있다. 하우징(210)의 적어도 일부분의 접히는 상태는 예를 들어, 제1 하우징 영역(211) 또는/및 제2 하우징 영역(213)이 힌지 구조(215)를 중심으로 마주보는 방향 또는 반대 방향으로 회전(또는 움직임)하는 도중을 나타내는 상태일 수 있다.
다양한 실시예에 따르면, 적어도 하나의 프로세서(120)는 도 4에 도시된 바와 같이, 하우징(210)의 일부분으로서, 예를 들어, 제1 하우징 영역(211)의 움직임(또는 회전)을 적어도 하나의 센서(예: 도 1의 센서 모듈(176))를 통해 감지하고, 감지된 움직임 정보를 기반하여 산출된 접힘에 따른 각도 정보를 획득할 수 있다. 수신된 각도 정보는 제1 하우징 영역(211) 및 제2 하우징 영역(213) 사이의 각도를 나타낼 수 있다. 예를 들어, 적어도 하나의 프로세서(120)는 도 4의 (a)와 같이, 각도 정보가 180도이면, 전자 장치(101)가 펼쳐진 상태인 것을 식별할 수 있다. 예를 들어, 적어도 하나의 프로세서(120)는 도 4의 (b)와 같이, 하우징(210)의 제1 하우징 영역(211)이 제2 하우징 영역(213)과 마주보는 방향으로 지정된 임계 각도(예: 30도) 이상으로 회전함에 따라 각도 정보가 150도로 변경되는 것이 식별되면, 전자 장치(101)가 펼쳐진 상태에서 접히는 중의 상태임을 식별할 수 있다. 적어도 하나의 프로세서(120)는 각도 정보가 150도에 대응하여 지정된 제어 정보에 기반하여 이전 제어 정보를 조절 또는 지정된 범위의 각도 변화에 기반하여 일정 비율로 이전 제어 정보를 조절할 수 있다. 예를 들어, 적어도 하나의 프로세서(120)는 도 4의 (c)와 같이, 하우징(210)의 제1 하우징 영역(211)이 제2 하우징 영역(213)과 마주보는 방향으로 계속해서 회전함에 따라 각도 정보가 90도로 식별되면, 전자 장치(101)가 계속해서 접히는 중인 상태를 식별할 수 있다. 적어도 하나의 프로세서(120)는 각도 정보가 90도에 대응하여 지정된 제어 정보를 기반하여 이전 제어 정보를 조절 또는 지정된 범위의 각도 변화에 기반하여 일정 비율로 이전 제어 정보를 조절할 수 있다. 예를 들어, 적어도 하나의 프로세서(120)는 도 4의 (d)와 같이, 하우징(210)의 제1 하우징 영역(211)이 제2 하우징 영역(213)과 마주보는 방향으로 계속해서 회전함에 따라 각도 정보가 0도로 식별되면, 하우징(210)의 제1 하우징 영역(211)이 완전히 접힌 상태로 식별하고, 일정 시간이 경과하면, 음성 신호에서 에코를 제거하기 위한 오디오 모듈(301)이 안정된 상태인 것을 식별하고, 제어 정보의 조절을 중단할 수 있다. 적어도 하나의 프로세서(120)는 각도 정보가 0도일 때, 조절된 제어 정보를 유지하여 수신되는 음성 신호에서 에코를 제거할 수 있다. 다른 예를 들어, 적어도 하나의 프로세서(120)는 도 4의 (c)와 같이, 각도 정보가 90도인 상태에서 일정 시간동안 획득된 각도 정보의 변화가 없는 경우, 하우징(210)의 제1 하우징 영역(211)이 접히는 동작이 완료된 것으로 식별하여 제어 정보의 조절을 중단하고, 각도 정보가 90도일 때, 조절된 제어 정보를 유지하여 수신되는 음성 신호에서 에코를 제거할 수 있다. 다른 예를 들어, 하우징(210)의 제2 하우징 영역(213)의 움직임이 감지된 경우 또는 제1 하우징 영역(211) 및 제2 하우징 영역(213)이 동시에 움직이는 경우에도 도 4에서 설명한 바와 같이, 적어도 하나의 프로세서(120)는 제1 하우징 영역(211) 및 제2 하우징 영역(213) 사이의 각도 정보를 획득하고, 획득된 각도 정보를 기반하여 제어 정보를 조절할 수 있다.
다양한 실시예에 따른 적어도 하나의 프로세서(120)는 도 4에 도시된 바와 같이, 하우징의 적어도 일부분으로서, 제1 하우징 영역(211)이 접히는 상태를 식별하고, 제1 하우징 영역(211)이 접히는 중에 획득한 각도 정보에 기반하여 수신되는 음성 신호를 처리하기 위한 제어 정보를 조절하도록 음성 신호 처리 모듈(320)을 제어할 수 있다.
다시, 도 1, 도 2a, 도 2b, 도 3을 참조하면, 다양한 실시예에 따른 적어도 하나의 프로세서(120)는 조절된 제어 정보를 기반하여, 하우징(210)의 적어도 일부분이 접히는 중에 음성 신호에서 선형성의 에코를 제거하고, 마이크(220) 및 스피커(230) 간의 상대적 거리 변화에 따른 비선형성의 에코를 수신된 음성 신호로부터 제거하도록 오디오 모듈(301)을 제어할 수 있다. 제어 정보는 음성 처리 모듈(320)의 음성 신호 처리를 위한 동작 파라미터 정보(또는 인자), 마이크(220)의 빔포밍 성능에 관련된 가중치 정보 또는 마이크(220)의 입력 감도 정보 중 적어도 하나를 포함할 수 있다. 여기서, 음성 신호 처리를 위한 동작 파라미터 정보(또는 인자)는 에코 제거 동작 파라미터(또는 인자)(예: 잔여 에코 제거기(RES)의 강도(예: 잡음 제거 강도), 선형/비선형 에코 제거 강도, AGC(automatic gain control), 적응형 필터(예: 제1 필터)의 계수 및 수렴 속도 또는 에코 패스 변경 감지기 중 적어도 하나) 및/또는 잡음 제거 동작 파라미터(또는 인자)(예: 빔포밍 대역폭)를 포함할 수 있다. 적응형 필터의 수렴 속도는 하우징(210)의 일 부분이 접히는 중에 접힘에 따른 각도 변화를 추종하여 적응 속도를 조절하기 위한 인자일 수 있다. 잔여 에코 제거기(RES)(예: 제2 필터)의 강도는 하우징(210)의 적어도 일 부분이 접히는 중에 마이크(220) 및 스피커(230)의 하드웨적인 특성에 의한 에코(예: 비선형성 에코 성분)를 제거하기 위한 인자일 수 있다. 예를 들어, 제어 정보는 음성 신호 처리를 위한 동작 파라미터 정보, 가중치 정보 또는 마이크의 입력 감도 정보 중 적어도 하나에 지정된 각도 정보를 매핑하여 미리 설정한 파라미터 세트들을 포함할 수 있으며, 미리 설정된 파라미터 세트들은 메모리(130)에 테이블 형태로 저장될 수 있다.
다양한 실시예에 따르면, 적어도 하나의 프로세서(120)는 하우징(210)의 적어도 일부분이 접히는 중에 획득한 각도 정보를 기반하여 각도 변화에 대응하는 접힘 속도를 식별하고, 식별된 접힘 속도가 지정된 임계값을 초과할 때, 하우징의 적어도 일부분(예: 제1 하우징 영역(211) 및/또는 제2 하우징 영역(213))이 접히는 상태임을 식별할 수 있다. 적어도 하나의 프로세서(120)는 접히는 상태(또는 펼쳐지는 상태)에서 식별된 접힘 속도가 지정된 임계값 이하이고, 지정된 시간이 경과될 때, 하우징(210)의 적어도 일부분이 접히는 동작이 중단된 상태(예: 접힘 중지 상태)를 식별할 수 있다. 여기서, 접힘 속도는 제1 하우징 영역(211) 및 제2 하우징 영역(213) 사이의 각도가 초당 변하는 정도를 나타낼 수 있다.
다양한 실시예들에 따르면, 적어도 하나의 프로세서(120)는 하우징(210)의 제1 하우징 영역(211)이 접히는 동작이 완료되고, 음성 통화 또는 음성 입력(또는 녹음)이 완료되면, 음성 처리를 위한 제어 동작을 종료할 수 있다. 예를 들어, 적어도 하나의 프로세서(120)는 음성 처리를 위한 제어 동작을 수행하기 위해, 음성 통화 또는 음성 입력(또는 녹음)과 관련된 어플리케이션을 실행할 수 있다.
다양한 실시예들에 따르면, 적어도 하나의 프로세서(120)는 음성 신호가 수신되고, 하우징(210)의 적어도 일부분(예: 도 4의 제1 하우징 영역(211))이 접히는 중 획득한 각도 정보를 기반하여 마이크(220) 및 스피커(230) 간의 상대적 거리를 식별하고, 상대적 거리가 시간에 따라 작은 값으로 변화하여 가까워질 때, 제어 정보에 포함된 방향성에 관련된 정보(예: RES 강도)를 증가시키도록 오디오 모듈(301)을 제어할 수 있다.
다양한 실시예들에 따르면, 적어도 하나의 프로세서(120)는 하우징(210)의 적어도 일부분이 접히는 중 지속적으로 획득한 각도 정보에 대응하여 제어 정보에 포함된 오디오 모듈(301)의 음성 신호 처리를 위한 파라미터 정보(예: 에코 제거 동작 파라미터 또는 잡음 제거 동작 파라미터 중 적어도 하나)를 조절할 수 있다.
다양한 실시예에 따르면, 적어도 하나의 프로세서(120)는 하우징(210)의 적어도 일부분이 접히는 중 각도 정보를 기반하여 마이크(220) 및 스피커(230) 간의 거리 값을 식별하고, 식별된 거리 값이 지정된 거리 임계값 이하로 감소할 때, 마이크(220)의 감도를 지정된 낮은 값으로 조절할 수 있다. 적어도 하나의 프로세서(120)는 식별된 거리 값이 지정된 거리 임계값을 초과할 때, 마이크(220)의 감도를 지정된 높은 값으로 조절할 수 있다.
상술한 다양한 실시예에 따르면, 적어도 하나의 프로세서(120)는 하우징(210)의 적어도 일부분이 펼쳐지는 중에도 동일한 동작들을 수행할 수 있다. 전자 장치(101)의 폴더블 형태 외에도 롤러블 또는 슬라이더블 형태와 같이, 전자 장치(101)의 일부 영역이 접힘 또는 펼쳐지는 형태인 경우에도 상술한 다양한 실시예에 따른 동작들을 동일하게 적용할 수 있다. 도 2a, 도 2b 및 도 4의 설명에서는 일 예로, 제1 하우징 영역(211)에 마이크(220)가 배치되고, 제2 하우징 영역(213)에 스피커(230)가 배치되는 것으로 설명하였으나, 이에 한정되지 않으며, 제1 하우징 영역(211) 및 제2 하우징 영역(213)에 마이크들(예: 스테레오 마이크)이 각각 실장되고, 제1 하우징 영역(211) 및 제2 하우징 영역(213)에 스피커들(예: 스테레오 스피커)이 각각 실장될 수 있다.
도 5는 다양한 실시예들에 따른 전자 장치의 오디오 모듈(301)의 구성 예를 도시한 도면이다.
도 3 및 도 5를 참조하면, 다양한 실시예에 따르면, 오디오 모듈(301)의 음성 신호 처리 모듈(320)은 수신되는 음성 신호에서 에코를 제거하기 위한 에코 제거 모듈(510)을 포함하여 구성될 수 있다. 음성 신호 처리 모듈(320)은 에코 제거 모듈(510)에 의해, 마이크(220)로부터 수신되는 원단 화자의 음성 신호 또는 스피커(230)에 의해 입력되는 음성 신호(fared speech)에 의한 에코(echo)를 제거할 수 있다. 음성 신호 처리 모듈(320)은 잡음 제거 모듈에 의해, 음성 신호에서 잡음(noise)을 제거할 수 있다. 예를 들어, 에코 제거 모듈(510)은 스피커(230)로 출력되는 음성 신호(fared speech)에 의한 신호에 상응하는 에코 레퍼런스(echo reference)를 기반하여 수신되는 음성 신호에서 에코를 제어할 수 있다. 에코 제거 모듈(510)은 에코 레퍼런스(echo reference)를 제어 모듈(310)을 통해 수신할 수 있다. 예를 들어, 에코 제어 모듈(510)은 음성 신호에서 에코 레퍼런스(echo reference)를 기반하여 선형 성분의 에코를 제거하기 위한 제1 필터(예: adaptive filter)(511) 및 차감기(513)를 포함할 수 있다. 에코 제어 모듈(510)은 비선형적인 잔여 에코(residual echo) 및 비선형적인 성분들을 제거하기 위한 제2 필터(예: RES: residual echo suppressor)(515)를 더 포함할 수 있다. 제1 필터(511)는 음향 경로를 선형적으로 예측하는 필터로서, 에코 레퍼런스(echo reference)를 기반하여 에코 성분의 복제본(replica)을 생성하여 선형적인 에코 성분을 차감기(513)로 전달하고, 차감기(513)에서 제1 필터(511)로부터 전달된 선형적인 에코 성분을 수신된 음성 신호에서 차감함으로써 에코가 제거된 음성 신호를 획득할 수 있다. 제2 필터(515)는 제1 필터(511)에 의해 선형적인 에코가 제거된 음성 신호에서 비선형성의 잔여 에코(residual echo) 및 마이크(220) 및 스피커(230)의 하드웨어 특징에 의한 비선형성의 성분들을 제거할 수 있다.
도 6은 다양한 실시예에 따른 전자 장치의 오디오 모듈(301)의 구성 예를 도시한 도면이다.
도 3 및 도 6을 참조하면, 다양한 실시예에 따르면, 오디오 모듈(301)의 음성 신호 처리 모듈(320)은 수신되는 음성 신호에서 잡음을 제거하기 위한 잡음 제거 모듈(610)을 포함하여 구성될 수 있다. 예를 들어, 잡음 제거 모듈(610)은 에코 제거 모듈(예: 도 5의 에코 제거 모듈(510))에서 에코가 제거되어 출력된 음성 신호에서 잡음을 제거할 수 있다. 다른 예를 들어, 잡음 제거 모듈(610)은 마이크(220)로부터 수신된 음성 신호에서 잡음을 제거하고, 잡음이 제거된 음성 신호에서 에코를 제거하도록 에코 제거 모듈(예: 도 5의 에코 제거 모듈(510))로 잡음이 제거된 신호를 전달할 수 있다.
다양한 실시예에 따르면, 잡음 제거 모듈(610)은 발화하는 근단 화자의 위치 또는 방향을 추적하는 방향 추적기(sound source localizer)(도시되지 않음) 및 추적된 위치 또는 방향(목적 방향)으로부터 입력되는 근단 화자의 음성 신호를 보전하면서 다른 방향에서 유입되는 잡음을 제거(또는 감쇄)하여 신호대 잡음비(signal to noise ratio)를 향상시키는 빔포머(beamformer)(611) 및 근단 화자의 추적된 방향(목적 방향)에서 함께 입력된 잡음을 제거하는 후처리 필터(post filter)로서 잡음 제거기(noise suppressor)(613)를 포함할 수 있다. 잡음 제거 모듈(610)은 빔포머(611)와 다른 경로로 마이크(220)로부터 음성 신호를 수신하여 근단 화자의 추적된 방향(목적 방향)에서 함께 입력된 잡음을 제거하는 잡음 제거기(noise suppressor)(615)를 더 포함할 수 있다.
다양한 실시예에 따르면, 잡음 제거 모듈(610)은 빔포머(611) 및 잡음 제거기(613)의 제1 경로(601)를 통해 잡음이 제거된 음성 신호인 제1 신호를 출력하고, 잡음 제거기(615)의 제2 경로(603)를 통해 잡음이 제거된 음성 신호인 제2 신호를 출력할 수 있다. 잡음 제거 모듈(610)은 제어 모듈(310)로부터 수신된 각도 정보를 기반하여 설정된 가중치 정보를 수신할 수 있다. 잡음 제거 모듈(610)은 하우징(210)의 일부분이 접힘에 따라 신호 출력이 급격하게 변하는 것을 방지하도록 제1 신호, 제2 신호 및 가중치 정보를 혼합(mixing)하여 강화된 음성 신호를 출력할 수 있다.
다양한 실시예에 따르면, 잡음 제거 모듈(610)은 최초 정지 상태에서 제2 경로(603)에서 출력되는 제2 신호에 가중치를 최대값(1.0)을 적용하고, 제1 경로(601)에서 출력되는 제1 신호에 가중치 최소값(0)을 적용하고, 가중치가 각각 적용된 제1 신호 및 제2 신호를 혼합할 수 있다. 여기서, 가중치가 0으로 적용되면, 제1 경로(601)에서 빔포머(611)에 의한 빔포밍이 100% 적용되는 것으로 의미할 수 있다. 다양한 실시예에 따르면, 적어도 하나의 프로세서(120)는 하우징(210)의 일부분이 접히는 중인 것으로 식별하면, 각도 정보를 기반하여 제1 신호에 적용되는 가중치를 증가시키고, 제2 신호에 적용되는 가중치를 감소시킬 수 있다. 예를 들어, 적어도 하나의 프로세서(120)는 하우징(210)의 일부분이 접히는 중 획득되는 각도 정보의 변화가 지정된 범위로 변경될 때마다 지정된 비율로 제1 신호 또는 제2 신호에 적용할 가중치를 조절할 수 있다. 다른 예를 들어, 적어도 하나의 프로세서(120)는 하우징(210)의 일부분이 접히는 중 획득되는 각도 정보에 대응하여 지정된 가중치 정보로 제1 신호 및/또는 제2 신호에 적용할 가중치를 조절할 수 있다. 다양한 실시예에 따르면, 적어도 하나의 프로세서(120)는 하우징(210)의 일부분이 접히는 상태가 완료되면, 제2 경로(603)로 출력되는 제2 신호의 가중치를 증가시키고, 일정 시간이 지난 후 빔포머(611)가 안정화된 것으로 확인되면, 제2 신호의 가중치를 최대 값(1.0)으로 조절할 수 있다. 다양한 실시예에 따르면, 잡음 제거 모듈(610)은 각도 정보를 기반하여 제1 신호 및/또는 제2 신호의 조절된 가중치를 포함하는 가중치 정보를 적어도 하나의 프로세서(120)로부터 수신하고, 수신된 가중치 정보를 기반하여 제1 신호 및/또는 제2 신호에 가중치를 적용하여 접히는 중 각도 변화에 따라 잡음을 제거함으로써, 보다 강화된 음성 신호를 출력할 수 있다.
도 1, 도 2 및 도 3을 참조하면, 다양한 실시 예에 따른 전자 장치(101)는 하우징(210)의 적어도 일부분이 접히는 또는 펼쳐지는 중에 획득한 각도 정보를 기반하여 음성 신호에서 에코 및/또는 잡음을 제거하여 강화된 음성 신호를 획득하도록 음성 신호 처리하기 위한 소프트웨어 모듈(예: 도 1의 프로그램(140))을 구현할 수 있다. 전자 장치(101)의 메모리(130)는 소프트웨어 모듈을 구현하기 위해 명령어들(예: 인스트럭션들(instructions))을 저장할 수 있다. 적어도 하나의 프로세서(120)는 소프트웨어 모듈을 구현하기 위해 메모리(130)에 저장된 명령어들을 실행시킬 수 있고, 소프트웨어 모듈의 기능과 연관된 하드웨어(예: 도 1의 센서 모듈(176), 입력 모듈(150), 음향 출력 모듈(155), 오디오 모듈(170) 또는 통신 모듈(190))를 제어할 수 있다. 일 실시 예에 따르면, 소프트웨어 모듈은 통화 또는 음성 녹음에 관련된 어플리케이션(예: 모듈, 매니저 또는 프로그램)을 포함하여 설정될 수 있다. 어플리케이션은 외부 전자 장치(예: 서버(108) 또는 전자 장치(102, 104))로부터 수신된 어플리케이션을 포함할 수 있다. 일 실시 예에 따르면, 어플리케이션은 프리로드 어플리케이션(preloaded application) 또는 서버로부터 다운로드 가능한 제3자 어플리케이션(third party application)을 포함할 수 있다. 도시된 실시 예에 따른 소프트웨어 모듈의 구성요소들 및 구성요소들의 명칭은 운영 체제의 종류에 따라서 달라질 수 있다. 일 실시 예에 따르면, 소프트웨어 모듈의 적어도 일부는 소프트웨어, 펌웨어, 하드웨어, 또는 이들 중 적어도 둘 이상의 조합으로 구현될 수 있다. 소프트웨어 모듈의 적어도 일부는, 예를 들면, 프로세서(예: AP)에 의해 구현(implement)(예: 실행)될 수 있다. 소프트웨어 모듈의 적어도 일부는 적어도 하나의 기능을 수행하기 위한, 예를 들면, 모듈, 프로그램, 루틴, 명령어 세트(sets of instructions) 또는 프로세스를 포함할 수 있다.
이와 같이, 다양한 실시 예에서는 도 1, 도 2 및 도 3의 전자 장치(101)를 통해 전자 장치의 주요 구성 요소에 대해 설명하였다. 그러나 다양한 실시 예에서는 도 1, 도 2 및 도 3을 통해 도시된 구성 요소가 모두 필수 구성 요소인 것은 아니며, 도시된 구성 요소보다 많은 구성 요소에 의해 전자 장치(101)가 구현될 수도 있고, 그 보다 적은 구성 요소에 의해 전자 장치(101)가 구현될 수도 있다. 또한, 도 1, 도 2 및 도 3을 통해 상술한 전자 장치(101)의 주요 구성 요소의 위치는 다양한 실시 예에 따라 변경 가능할 수 있다.
다양한 실시예에 따르면, 전자 장치(예, 도 1, 도 2 및 도 3의 전자 장치(101))는 적어도 일 부분이 접히도록 구성된 하우징, 적어도 하나의 마이크, 적어도 하나의 스피커, 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커와 전기적으로 연결되는 오디오 모듈 및 상기 오디오 모듈과 전기적으로 연결된 적어도 하나의 프로세서를 포함하며, 상기 적어도 하나의 프로세서는, 상기 마이크를 통해 수신되는 음성 신호를 식별하고, 상기 하우징의 적어도 일 부분의 접힘에 관련된 각도 정보를 획득하고, 상기 각도 정보를 기반하여 상기 하우징의 적어도 일부분이 접히는 중인 상태를 식별하고, 상기 각도 정보에 기반하여 상기 음성 신호를 처리하기 위한 상기 오디오 모듈의 제어 정보를 조절하고, 상기 하우징의 적어도 일 부분의 접히는 중 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하도록 상기 오디오 모듈을 제어하도록 설정될 수 있다.
다양한 실시예에 따르면, 상기 적어도 하나의 프로세서는, 상기 각도 정보를 기반하여 접힘 각도 변화에 대응하는 접힘 속도를 식별하고, 상기 식별된 접힘 속도가 지정된 임계값을 초과할 때, 상기 하우징의 적어도 일 부분이 접히는 중의 상태임을 식별하고, 상기 접히는 중의 상태에서 상기 식별된 접힘 속도가 지정된 임계값 이하에서 지정된 시간이 경과할 때, 상기 하우징의 적어도 일 부분이 접힘이 중단된 정지 상태를 식별하도록 설정될 수 있다.
다양한 실시예에 따르면, 상기 전자 장치는, 상기 각도 정보를 획득하도록 힌지 구조를 중심으로 상기 하우징의 적어도 일 부분의 접히는 움직임을 감지하는 적어도 하나의 센서를 더 포함하며, 상기 오디오 모듈은, 상기 음성 신호에서 에코 또는 잡음을 제거하기 위한 신호 처리를 수행하는 음성 신호 처리 모듈 및 상기 각도 정보를 상기 적어도 하나의 프로세서로부터 수신하고, 상기 수신된 각도 정보를 기반하여 상기 음성 신호 처리 모듈을 제어하는 제어 모듈을 포함할 수 있다.
다양한 실시예에 따르면, 상기 제어 정보는 상기 오디오 모듈의 음성 신호 처리를 위한 동작 파라미터 정보, 상기 가중치 정보 또는 상기 마이크의 입력 감도 정보 중 적어도 하나를 포함하며, 상기 음성 신호 처리를 위한 동작 파라미터 정보는 에코 제거 동작 파라미터 및 잡음 제거 동작 파라미터를 포함할 수 있다.
다양한 실시예에 따르면, 상기 적어도 하나의 프로세서는, 상기 하우징의 적어도 일부분이 접히는 중 상기 각도 정보를 기반하여 상기 동작 파라미터 정보에 포함된 상기 에코 제거 동작 파라미터를 조절하고, 상기 하우징의 적어도 일부분이 접히는 중 조절되는 상기 에코 제거 동작 파라미터를 기반하여 상기 음성 신호에서 에코를 제거하도록 상기 오디오 모듈을 제어하도록 설정될 수 있다.
다양한 실시예에 따르면, 상기 적어도 하나의 프로세서는, 상기 하우징의 적어도 일 부분의 접히는 중에 상기 각도 정보의 각도 변화에 따라 조절되는 상기 에코 제거 동작 파라미터를 기반하여 상기 음성 신호에서 선형성의 에코 성분을 제거하고, 상기 하우징의 적어도 일 부분의 접히는 중에 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커 간의 상대적 거리 변화에 따라 조절되는 상기 에코 제거 동작 파라미터를 기반하여 잔여 에코 및 비선형성의 에코 성분을 상기 음성 신호에서 제거하도록 설정될 수 있다.
다양한 실시예에 따르면, 상기 적어도 하나의 프로세서는, 상기 하우징의 적어도 일부분이 접히는 중 상기 각도 정보를 기반하여 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커 간의 상대적 거리 변화에 따라 상기 동작 파라미터 정보에 포함된 상기 잡음 제거 동작 파라미터를 조절하고, 상기 하우징의 적어도 일부분이 접히는 중 조절되는 상기 잡음 제거 동작 파라미터를 기반하여 상기 음성 신호에서 잡음을 제거하도록 상기 오디오 모듈을 제어하도록 설정되며, 상기 잡음 제거 동작 파라미터는 상기 각도 정보에 따라 조절된 빔포밍 대역폭을 포함할 수 있다.
다양한 실시예에 따르면, 상기 오디오 모듈은 잡음 제거 모듈을 포함하며, 상기 잡음 제어 모듈은, 상기 하우징의 적어도 일 부분이 접히는 중에 상기 음성 신호에서 상기 잡음 제거 모듈의 제1 경로를 거쳐 빔포밍 대역폭에 따라 잡음이 제거된 제1 신호를 출력하고, 상기 하우징의 적어도 일 부분의 접히는 중에 상기 음성 신호에서 상기 잡음 제거 모듈의 제2 경로를 거쳐 잡음이 제거된 제2 신호를 출력하고, 상기 각도 정보를 기반하여 설정된 가중치 정보를 수신하고, 상기 제1 신호 및 상기 제2 신호 각각에 서로 다른 가중치 정보를 적용하고, 상기 제1 신호 및 상기 제2 신호를 혼합(mixing)하여 잡음이 제거된 음성 신호를 획득하도록 상기 오디오 모듈을 제어하도록 설정될 수 있다.
다양한 실시예에 따르면, 상기 적어도 하나의 프로세서는, 상기 하우징의 적어도 일부분의 접히는 중 상기 각도 정보를 기반하여 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커 간의 상대적 거리를 식별하고, 상기 식별되는 상대적 거리가 지정된 거리 임계값 이하로 감소할 때, 상기 마이크의 감도를 지정된 낮은 값으로 조절하도록 상기 오디오 모듈을 제어하고, 상기 식별되는 상대적 거리가 지정된 거리 임계값을 초과할 때, 상기 마이크의 감도를 지정된 높은 값으로 조절하도록 상기 오디오 모듈을 제어하도록 설정될 수 있다.
다양한 실시예에 따르면, 상기 전자 장치는, 상기 조절된 제어 정보를 기반하여 처리된 상기 음성 신호를 외부 전자 장치로 전송하는 통신 모듈을 더 포함할 수 있다.
도 7은 다양한 실시 예에 따른 전자 장치에서의 동작 방법의 예를 나타내는 도면이다.
도 7을 참조하면, 다양한 실시 예에 따른 전자 장치(예: 도 1, 도 2 및 도 3의 전자 장치(101))는, 음성 통화 또는 음성 녹음에 관련된 어플리케이션을 실행하고, 실행된 어플리케이션을 통해 수신된 음성 신호를 처리하기 위한 동작을 수행할 수 있다.
701 동작에서, 다양한 실시 예에 따른 전자 장치는 마이크(예: 도 1의 입력 모듈(150), 도 2 및 도 3의 마이크(220))를 통해 음성 신호를 수신할 수 있다. 마이크를 통해 수신되는 음성 신호는 근거리에 위치한 화자(예: 근단 화자)의 음성 신호와 함께 원거리에 위치한 화자(예: 원단 화자)의 음성 신호 및 스피커(230)로부터 출력되는 신호에 대한 에코 및 잡음이 포함될 수 있다. 수신된 음성 신호는 오디오 모듈(예: 도 3의 오디오 모듈(301))로 전달되어 음성 신호에 포함된 에코 및/또는 잡음을 제거하여 강화된 음성 신호를 획득하도록 처리될 수 있다.
703 동작에서, 전자 장치는 하우징(예: 도 2의 하우징(210))의 적어도 일 부분의 접힘에 관련된 각도 정보를 획득할 수 있다. 각도 정보는 적어도 하나의 센서(예: 도 1의 센서 모듈(176))에 의해 감지된 하우징의 적어도 일부(예: 도 2의 제1 하우징 영역(211) 및/또는 제2 하우징 영역(213))의 움직임 정보를 기반하여 프로세서(예: 도 1 및 도 3의 프로세서(120))에 의해 산출될 수 있다.
705 동작에서, 전자 장치는 획득한 각도 정보를 기반하여 하우징의 적어도 일 부분이 접히는 중인 상태를 식별할 수 있다. 예를 들어, 획득한 각도 정보가 지정된 임계값 미만 또는 펼쳐진 상태(예: 도 2 및 도 4의 제1 하우징 영역(211) 및 제2 하우징 영역(213) 사이의 각도가 180도)인 경우, 전자 장치는 하우징의 적어도 일 부분이 접히는 중이 아닌 것으로 식별할 수 있다. 예를 들어, 획득한 각도 정보가 지정된 각도에 대한 임계 값 이상의 각도 또는 각도 정보를 기반하여 식별된 접힘 속도가 지정된 속도에 대한 임계 값을 초과할 때, 전자 장치는 하우징의 적어도 일부분(예: 제1 하우징 영역(211) 및/또는 제2 하우징 영역(213))이 접히는 상태임을 식별할 수 있다. 예를 들어, 접히는 상태에서 식별된 접힘 속도가 지정된 임계값 이하이고, 지정된 시간이 경과될 때, 전자 장치는 하우징의 적어도 일부분이 접히는 동작이 완료(또는 중단)된 상태(예: 접힘 중지 상태)로 식별할 수 있다. 여기서, 접힘 속도는 제1 하우징 영역(211) 및 제2 하우징 영역(213) 사이의 각도가 초당 변하는 정도를 나타낼 수 있다.
707 동작에서, 전자 장치는 획득한 각도 정보에 기반하여 수신되는 음성 신호를 처리하기 위한 제어 정보를 조절할 수 있다. 예를 들어, 제어 정보는 음성 신호 처리 모듈(예: 도 3의 음성 신호 처리 모듈(320))에 의해 하우징의 일부가 접히는 중에 접힘 각도가 지정된 범위의 각도(예: 15도)로 변할 때마다 이전 제어 정보에서 일정 비율로 조절될 수 있다. 다른 예를 들어, 제어 정보는 각도 정보에 대응하여 미리 지정된 정보일 수 있으며, 테이블 형태로 메모리(예: 도 1의 메모리(130))에 미리 저장될 수 있다. 제어 정보는 음성 처리 모듈(320)의 음성 신호 처리를 위한 동작 파라미터 정보(또는 인자), 마이크(220)의 빔포밍 성능에 관련된 가중치 정보 또는 마이크(220)의 입력 감도 정보 중 적어도 하나를 포함할 수 있다. 여기서, 음성 신호 처리를 위한 동작 파라미터 정보(또는 인자)는 에코 제거 동작 파라미터(또는 인자)(예: 잔여 에코 제거기(RES)의 강도선형/비선형 에코 제거 강도(예: 잡음 제거 강도), AGC(automatic gain control), 적응형 필터(예: 제1 필터)의 계수 및 수렴 속도 또는 에코 패스 변경 감지기 중 적어도 하나)및/또는 잡음 제거 동작 파라미터(또는 인자)(예: 빔포밍 대역폭)를 포함할 수 있다. 적응형 필터의 수렴 속도는 하우징(210)의 일 부분이 접히는 중에 접힘에 따른 각도 변화를 추종하여 적응 속도를 조절하기 위한 인자일 수 있다. 잔여 에코 제거기(RES)(예: 제2 필터)의 강도는 하우징(210)의 적어도 일 부분이 접히는 중에 마이크(220) 및 스피커(230)의 하드웨적인 특성에 의한 에코(예: 비선형성 에코 성분)를 제거하기 위한 인자일 수 있다. 예를 들어, 제어 정보는 음성 신호 처리를 위한 동작 파라미터 정보, 가중치 정보 또는 마이크의 입력 감도 정보 중 적어도 하나에 지정된 각도 정보를 매핑하여 미리 설정한 파라미터 세트들을 포함할 수 있으며, 미리 설정된 파라미터 세트들은 메모리(130)에 테이블 형태로 저장될 수 있다.
709 동작에서, 전자 장치는 조절된 제어 정보를 기반하여 하우징의 적어도 일 부분이 접히는 중 음성 신호에서 에코 및/또는 잡음을 제거하여 강화된 음성 신호를 획득하기 위한 동작을 수행할 수 있다. 예를 들어, 전자 장치는 음성 신호 처리 모듈에 의해 음성 신호에서 에코 레퍼런스(echo reference)를 기반하여 선형 성분의 에코를 제거하고, 비 선형성의 잔여 에코(residual echo) 및 마이크(220) 및 스피커(230)의 하드웨어적 특성에 의한 비 선형성의 성분들을 제거할 수 있다. 예를 들어, 전자 장치는 음성 신호 처리 모듈에 의해 음성 신호에서 근단 화자의 위치 또는 방향에서 유입되는 음성 신호를 보전하면서 다른 방향에서 유입되는 잡음을 제거하여 신호대 잡음비(signal to noise ratio)를 향상시키고, 근단 화자의 위치 또는 방향에서 유입되는 잡음을 제거할 수 있다.
다양한 실시예에 따르면, 709 동작을 수행할 때, 예를 들어, 전자 장치는 음성 신호에서 에코를 제거하는 동작을 수행한 후 에코가 제거된 음성 신호에서 잡음을 제거하는 동작을 수행하여 강화된 음성 신호를 획득할 수 있다. 다른 예를 들어, 전자 장치는 음성 신호에서 잡음을 제거하는 동작을 수행한 후 음성 신호에서 에코 제거하는 동작을 수행하여 강화된 음성 신호를 획득할 수 있다. 또 다른 예를 들어, 전자 장치는 음성 신호에서 에코를 제거하는 동작 또는 잡음을 제거하는 동작 중 어느 하나를 수행할 수 있다.
다양한 실시예들에 따르면, 전자 장치는 하우징의 일 부분이 접히는 동작이 완료되고, 음성 통화 또는 음성 입력(또는 녹음)이 완료되면, 음성 처리를 위한 제어 동작을 종료할 수 있다.
도 8은 다양한 실시 예에 따른 전자 장치에서의 동작 방법의 예를 나타내는 도면이다.
도 8을 참조하면, 다양한 실시 예에 따른 전자 장치(예: 도 1, 도 2 및 도 3의 전자 장치(101))는, 801 동작에서, 마이크(예: 도 1의 입력 모듈(150), 도 2 및 도 3의 마이크(220))를 통해 음성 신호를 수신할 수 있다. 마이크를 통해 수신되는 음성 신호는 근거리에 위치한 화자(예: 근단 화자)의 음성 신호와 함께 원거리에 위치한 화자(예: 원단 화자)의 음성 신호 및 스피커(230)로부터 출력되는 신호에 대한 에코 및 잡음이 포함될 수 있다.
803 동작에서, 전자 장치는 하우징(예: 도 2의 하우징(210))의 적어도 일 부분의 접힘에 관련된 각도 정보를 획득할 수 있다. 각도 정보는 적어도 하나의 센서(예: 도 1의 센서 모듈(176))에 의해 감지된 하우징의 적어도 일부(예: 도 2의 제1 하우징 영역(211) 및/또는 제2 하우징 영역(213))의 움직임 정보를 기반하여 프로세서(예: 도 1, 도 3의 프로세서(120))에 의해 산출될 수 있다.
805 동작에서, 전자 장치는 획득한 각도 정보를 기반하여 하우징의 일 부분이 접히는 중인지를 확인하기 위해, 하우징의 일 부분이 접히는 상태에서 접히는 일 부분의 각도의 초당 변하는 정도를 나타내는 각속도(이하, 접힘 속도라 칭함)가 지정된 임계 값을 초과하는 지를 확인할 수 있다.
805 동작에서 확인한 결과, 접힘 속도가 지정된 임계값을 이하이면, 807 동작에서, 전자 장치는 하우징의 일부분이 접히지 않는 정지 상태인 것을 식별하고, 음성 신호 처리 모듈(예: 도 3의 음성 신호 처리 모듈(320))에 설정된 동작 파라미터로 에코를 제거하는 동작을 수행할 수 있다. 807 동작을 수행한 후, 전자 장치는 815 동작에서, 예를 들어, 음성 통화 또는 음성 녹음과 관련된 어플리케이션의 실행이 종료 또는 지정된 이벤트에 의해 음성 처리 동작을 완료할 지를 확인하여, 완료하는 경우, 전자 장치는 음성 처리 동작을 종료하고, 그렇지 않은 경우, 전자 장치는 계속해서 801 동작을 수행할 수 있다.
805 동작에서 확인한 결과, 접힘 속도가 지정된 임계값을 초과하면, 809 동작에서, 전자 장치는 각도 정보를 기반하여 제어 정보에 포함된 에코 제거 모듈에 포함된 제1 필터(예: 도 5의 제1 필터(511)(adaptive filter)의 성능 강화를 위한 동작 인자(예: 제1 필터의 업데이트(또는 수렴) 속도에 대한 파라미터)를 조절할 수 있다. 전자 장치는 각도 정보를 기반하여 제어 정보에 포함된 잔여 에코 제거 동작 인자(예: RES 강도)를 조절할 수 있다. 예를 들어, 전자 장치는 하우징의 일부분이 접히는 중 각도 정보의 시간에 따른 각도 변화 정도가 감소하여 접히는 일 부분(예: 제1 하우징 영역(211)이 마주하는 부분(예: 제2 하우징 영역(213)) 사이의 상대적 거리가 가까워지면, 접히는 동작의 순간적인 빠른 변화(예: Acoustic echo path 변화)를 추종하도록 제1 필터의 동작 인자(예: 제1 필터의 업데이트(또는 수렴) 속도에 대한 파라미터)를 증가시킬 수 있다. 이에 따라 제1 필터는 업데이트(또는 수렴) 속도가 빠르게 적응할 수 있다. 예를 들어, 전자 장치는 하우징의 일부분이 접히는 중 각도 정보의 시간에 따른 각도 변화 정도가 감소하여 접히는 일 부분(예: 제1 하우징 영역(211)이 마주하는 부분(예: 제2 하우징 영역(213)) 사이의 상대적 거리가 가까워지면, 잔여 에코 제거 동작 인자(예: RES 강도)를 증가시킬 수 있다.
811 동작에서, 전자 장치는 조절된 제1 필터의 동작 인자를 기반하여 제1 필터를 통해 음성 신호에서 선형성의 에코 성분을 제거할 수 있다.
813 동작에서, 전자 장치는 음성 신호 처리 모듈의 잔여 에코 제거기(예: 도 5의 제2 필터(515))를 통해 제1 필터에 통해 선형성의 에코 성분이 제거된 음성 신호에서 잔여 에코 및 마이크 및 스피커의 하드웨어 특성에 의한 비 선형성의 에코 성분을 제거할 수 있다. 예를 들어, 잔여 에코 제거 동작 인자(예: RES 강도)가 증가됨에 따라 음성 신호 처리 모듈의 잔여 에코 제거기는 접히는 일 부분 및 마주하는 부분 사이의 상대적 거리가 가까워질 때, 상대적 거리가 멀어질 때보다 더 강한 RES 강도로 동작할 수 있다.
815 동작에서, 전자 장치는 하우징의 일 부분이 마주하는 부분으로 접히지 않는 정지 상태인지를 확인할 수 있다. 예를 들어, 도 4의 (d)에 도시된 바와 같이, 각도 정보가 0도로 식별되면, 전자 장치는 하우징(210)의 제1 하우징 영역(211)이 완전히 접힌 상태로 식별하고, 일정 시간이 경과하면, 정지 상태인 것으로 식별할 수 있다. 전자 장치는 815 동작에서 정지 상태로 확인하고, 음성 신호 처리 모듈이 안정적인 상태가 식별되면, 음성 신호 처리 동작을 종료할 수 있다. 예를 들어, 전자 장치는 음성 신호 처리 모듈의 에코 제거 모듈이 안정적인 상태가 되면, 에코 제거 모듈의 수렴 속도를 작게 조절 또는 원 상태로 되돌려서 천천히 적응하도록 할 수 있다. 그렇지 않으면, 전자 장치는 계속해서 음성 신호 처리 동작을 수행하도록 801 동작을 수행할 수 있다.
도 9는 다양한 실시 예에 따른 전자 장치에서의 동작 방법의 예를 나타내는 도면이다.
도 9를 참조하면, 다양한 실시 예에 따른 전자 장치(예: 도 1, 도 2 및 도 3의 전자 장치(101))는, 901 동작에서, 마이크(예: 도 1의 입력 모듈(150), 도 2 및 도 3의 마이크(220))를 통해 음성 신호를 수신할 수 있다. 마이크를 통해 수신되는 음성 신호는 근거리에 위치한 화자(예: 근단 화자)의 음성 신호와 함께 원거리에 위치한 화자(예: 원단 화자)의 음성 신호 및 스피커(230)로부터 출력되는 신호에 대한 에코 및 잡음이 포함될 수 있다.
903 동작에서, 전자 장치는 하우징(예: 도 2의 하우징(210))의 적어도 일 부분의 접힘에 관련된 각도 정보를 획득할 수 있다. 각도 정보는 적어도 하나의 센서(예: 도 1의 센서 모듈(176))에 의해 감지된 하우징의 적어도 일부(예: 도 2의 제1 하우징 영역(211) 및/또는 제2 하우징 영역(213))의 움직임 정보를 기반하여 프로세서(예: 도 1, 도 3의 프로세서(120))에 의해 산출될 수 있다.
전자 장치는 음성 신호 처리 모듈(320)에 포함된 잡음 제거 모듈(예: 도 6의 잡음 제거 모듈(610))에 의해 수신된 음성 신호에서 잡음을 제거할 수 있다.
905 동작에서, 전자 장치는 음성 신호에서 잡음을 제거하기 위해, 도 6에 도시된 바와 같이, 빔포머(예: 도 6의 빔포머(611) 및 잡음 제거기(예: 도 6의 잡음 제거기(613))의 제1 경로(예: 도 6의 제1 경로(601))를 거쳐 음성 신호에서 잡음을 제거하고, 빔포밍을 이용하여 잡음이 제거된 제1 신호를 출력할 수 있다. 이와 동시에 또는 순차적으로 905 동작과 별개로 907 동작에서, 전자 장치는 도 6에 도시된 바와 같이, 잡음 제거기(예: 도 6의 잡음 제거기(615))의 제2 경로(예: 도 6의 제2 경로(603))를 거쳐 음성 신호에서 잡음을 제거하고, 빔포밍을 이용하지 않고 잡음이 제거된 제2 신호를 출력할 수 있다.
909 동작에서, 전자 장치는 획득한 각도 정보를 기반하여 제1 신호 및 제2 신호 각각에 적용할 가중치 정보를 획득할 수 있다.
911 동작에서, 전자 장치는 일부분이 접힘에 따라 신호 출력이 급격하게 변하는 것을 방지하도록 제1 신호, 제2 신호 및 가중치 정보를 혼합하고, 보다 강화된 음성 신호인 혼합된 신호를 출력할 수 있다. 다양한 실시예에 따르면, 전자 장치는 음성 처리 모듈에 포함된 잡음 제거 모듈에 의해 최초 정지 상태에서 제2 경로(603)에서 출력되는 제2 신호에 가중치를 최대값(1.0)을 적용하고, 제1 경로(601)에서 출력되는 제1 신호에 가중치 최소값(0)을 적용하고, 가중치가 각각 적용된 제1 신호 및 제2 신호를 혼합할 수 있다. 여기서, 가중치가 0으로 적용되면, 제1 경로(601)에서 빔포머(611)에 의한 빔포밍이 100% 적용되는 것으로 의미할 수 있다.
다양한 실시예에 따르면, 전자 장치는 하우징의 일부분이 접히는 중인 것으로 식별하면, 각도 정보를 기반하여 제1 신호에 적용되는 가중치를 증가시키고, 제2 신호에 적용되는 가중치를 감소시킬 수 있다. 예를 들어, 전자 장치는 하우징의 일부분이 접히는 중 획득되는 각도 정보의 변화가 지정된 범위로 변경될 때마다 지정된 비율로 제1 신호 또는 제2 신호에 적용할 가중치를 조절할 수 있다. 다른 예를 들어, 전자 장치는 하우징의 일부분이 접히는 중 획득되는 각도 정보에 대응하여 지정된 가중치 정보로 제1 신호 및/또는 제2 신호에 적용할 가중치를 조절할 수 있다. 다양한 실시예에 따르면, 전자 장치는 하우징의 일부분이 접히는 상태가 완료되면, 제2 경로로 출력되는 제2 신호의 가중치를 증가시키고, 일정 시간이 지난 후 빔포머가 안정화된 것으로 확인되면, 제2 신호의 가중치를 최대 값(1.0)으로 조절할 수 있다. 다양한 실시예에 따르면, 잡음 제거 모듈은 각도 정보를 기반하여 제1 신호 및/또는 제2 신호의 조절된 가중치를 포함하는 가중치 정보를 프로세서로부터 수신하고, 수신된 가중치 정보를 기반하여 제1 신호 및/또는 제2 신호에 가중치를 적용하여 접히는 중 각도 변화에 따라 잡음을 제거함으로써, 보다 강화된 음성 신호를 출력할 수 있다.
다양한 실시예들에 따르면, 전자 장치는 하우징의 일 부분이 접히는 동작이 완료되고, 음성 통화 또는 음성 입력(또는 녹음)이 완료되면, 음성 처리를 위한 제어 동작을 종료할 수 있다.
도 8에서 설명한 음성 처리 모듈의 에코 제거 모듈에 의한 에코 제거 동작 및 도 9에서 설명한 음성 처리 모듈의 잡음 제거 모듈에 의한 잡음 제거 동작은 조합하여 또는 각각 수행될 수 있다. 예를 들어, 전자 장치의 음성 처리 모듈의 구성에 따라 전자 장치는 도 8에서 설명한 동작 방법을 수행한 후 도 9에서 설명한 동작을 추가로 수행할 수 있다. 다른 예를 들어, 전자 장치의 음성 처리 모듈의 구성에 따라 전자 장치는 도 9에서 설명한 동작을 수행한 후 도 8에서 설명한 동작을 추가로 수행할 수 있다.
상술한 도 7, 도 8 및 도 9 중 적어도 하나에서 설명한 동작을 수행할 때, 각도 정보에 따라 마이크의 입력 감도를 조절하는 동작을 더 수행할 수 있다.
다양한 실시예에 따르면, 전자 장치는 하우징의 적어도 일부분의 접히는 중 각도 정보를 기반하여 마이크 및 스피커 간의 거리 값을 식별하고, 식별된 거리 값이 지정된 거리 임계값 이하로 감소할 때, 마이크의 입력 감도를 지정된 낮은 값으로 조절할 수 있다. 전자 장치는 식별된 거리 값이 지정된 거리 임계값을 초과할 때, 마이크의 입력 감도를 지정된 높은 값으로 조절할 수 있다.
다양한 실시 예에 따르면, 적어도 하나의 마이크(예: 도 1, 도 2 및 도 3의 마이크(220)) 및 적어도 하나의 스피커(예: 도 1, 도 2 및 도 3의 스피커(230))를 포함하는 전자 장치(예: 도 1, 도 2 및 도 3의 전자 장치(101))에서의 동작 방법은, 상기 적어도 하나의 마이크를 통해 음성 신호를 수신하는 동작, 상기 전자 장치의 하우징의 적어도 일 부분의 접힘에 관련된 각도 정보를 획득하는 동작, 상기 각도 정보를 기반하여 상기 하우징의 적어도 일부분의 접히는 중인 상태를 식별하는 동작, 상기 각도 정보에 기반하여 상기 음성 신호를 처리하기 위한 상기 전자 장치의 오디오 모듈의 제어 정보를 조절하는 동작 및 상기 오디오 모듈에 의해 상기 하우징의 적어도 일 부분이 접히는 중 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하는 동작을 포함할 수 있다.
다양한 실시 예에 따르면, 상기 하우징의 적어도 일부분이 접히는 중인 상태를 식별하는 동작은, 상기 각도 정보를 기반하여 접힘 각도 변화에 대응하는 접힘 속도를 식별하는 동작 및 상기 식별된 접힘 속도가 지정된 임계값을 초과할 때, 상기 하우징의 적어도 일 부분이 접히는 중인 상태임을 식별하는 동작을 포함할 수 있다.
다양한 실시 예에 따르면, 상기 방법은, 상기 하우징의 적어도 일 부분이 접히는 중에 상기 식별된 접힘 속도가 지정된 임계값 이하에서 지정된 시간이 경과할 때, 상기 하우징의 적어도 일 부분이 접힘이 중단된 정지 상태를 식별하는 동작을 더 포함할 수 있다.
다양한 실시 예에 따르면, 상기 방법은, 상기 제어 정보는 상기 오디오 모듈의 음성 신호 처리를 위한 동작 파라미터 정보, 상기 가중치 정보 또는 상기 마이크의 입력 감도 정보 중 적어도 하나를 포함하며, 상기 음성 신호 처리를 위한 동작 파라미터 정보는 에코 제거 동작 파라미터 및 잡음 제거 동작 파라미터를 포함할 수 있다.
다양한 실시 예에 따르면, 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하는 동작은, 상기 오디오 모듈에 의해 상기 하우징의 적어도 일 부분의 접히는 중에 상기 각도 정보의 각도 변화에 따라 조절되는 상기 에코 제거 동작 파라미터를 기반하여 상기 음성 신호에서 선형성의 에코 성분을 제거하는 동작 및 상기 오디오 모듈에 의해 상기 하우징의 적어도 일 부분의 접히는 중에 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커 간의 상대적 거리 변화에 따라 조절되는 상기 에코 제거 동작 파라미터를 기반하여 잔여 에코 및 비선형성의 에코 성분을 상기 음성 신호에서 제거하는 동작을 포함할 수 있다.
다양한 실시 예에 따르면, 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하는 동작은, 상기 오디오 모듈에 의해 상기 하우징의 적어도 일부분이 접히는 중 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커 간의 상대적 거리 변화에 따라 조절되는 상기 잡음 제거 동작 파라미터를 기반하여 상기 음성 신호에서 잡음을 제거하는 동작을 포함하며, 상기 잡음 제거 동작 파라미터는 상기 각도 정보에 따라 조절된 빔포밍 대역폭을 포함할 수 있다.
다양한 실시 예에 따르면, 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하는 동작은, 상기 오디오 모듈에 의해 상기 하우징의 적어도 일 부분이 접히는 중에 상기 음성 신호에서 상기 잡음 제거 모듈의 제1 경로를 거쳐 빔포밍 대역폭에 따라 잡음이 제거된 제1 신호를 출력하는 동작, 상기 오디오 모듈에 의해 상기 하우징의 적어도 일 부분의 접히는 중에 상기 음성 신호에서 상기 잡음 제거 모듈의 제2 경로를 거쳐 잡음이 제거된 제2 신호를 출력하는 동작, 상기 오디오 모듈에 의해 상기 각도 정보를 기반하여 설정된 가중치 정보를 수신하는 동작, 상기 오디오 모듈에 의해 상기 제1 신호 및 상기 제2 신호 각각에 서로 다른 가중치 정보를 적용하는 동작 및 상기 오디오 모듈에 의해 상기 제1 신호 및 상기 제2 신호를 혼합(mixing)하여 잡음이 제거된 음성 신호를 획득하는 동작을 포함할 수 있다.
다양한 실시 예에 따르면, 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하는 동작은, 상기 오디오 모듈에 의해 상기 하우징의 적어도 일부분의 접히는 중 상기 각도 정보를 기반하여 식별되는 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커 간의 상대적 거리가 지정된 거리 임계값 이하로 감소할 때, 상기 마이크의 감도를 지정된 낮은 값으로 조절하는 동작 및
상기 오디오 모듈에 의해 상기 식별되는 상대적 거리가 지정된 거리 임계값을 초과할 때, 상기 마이크의 감도를 지정된 높은 값으로 조절하는 동작을 포함할 수 있다.
다양한 실시 예에 따르면, 프로그램을 저장한 비 일시적 저장 매체는, 상기 프로그램은, 프로세서에 의한 실행 시, 상기 프로세서가, 상기 적어도 하나의 마이크를 통해 음성 신호를 수신하는 동작, 상기 전자 장치의 하우징의 적어도 일 부분의 접힘에 관련된 각도 정보를 획득하는 동작, 상기 각도 정보를 기반하여 상기 하우징의 적어도 일부분의 접히는 중인 상태를 식별하는 동작, 상기 각도 정보에 기반하여 상기 음성 신호를 처리하기 위한 상기 전자 장치의 오디오 모듈의 제어 정보를 조절하는 동작 및 상기 오디오 모듈에 의해 상기 하우징의 적어도 일 부분이 접히는 중 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하는 동작을 실행하도록 실행 가능한 명령을 포함할 수 있다.
그리고 본 문서에 개시된 실시예는 개시된, 기술 내용의 설명 및 이해를 위해 제시된 것이며, 본 문서에서 기재된 기술의 범위를 한정하는 것은 아니다. 따라서, 본 문서의 범위는, 본 문서의 기술적 사상에 근거한 모든 변경 또는 다양한 다른 실시예를 포함하는 것으로 해석되어야 한다.
본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치(예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나", "A, B 또는 C", "A, B 및 C 중 적어도 하나", 및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.
본 문서의 다양한 실시예들에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로와 같은 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(101)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(136) 또는 외장 메모리(138))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(140))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(101))의 프로세서(예: 프로세서(120))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장 매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory(CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들(예: 스마트 폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있으며, 복수의 개체 중 일부는 다른 구성요소에 분리 배치될 수도 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.

Claims (15)

  1. 전자 장치에 있어서,
    적어도 일 부분이 접히도록 구성된 하우징;
    적어도 하나의 마이크;
    적어도 하나의 스피커;
    상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커와 전기적으로 연결되는 오디오 모듈; 및
    상기 오디오 모듈과 전기적으로 연결된 적어도 하나의 프로세서를 포함하며,
    상기 적어도 하나의 프로세서는,
    상기 마이크를 통해 수신되는 음성 신호를 식별하고,
    상기 하우징의 적어도 일 부분의 접힘에 관련된 각도 정보를 획득하고,
    상기 각도 정보를 기반하여 상기 하우징의 적어도 일부분이 접히는 중인 상태를 식별하고,
    상기 각도 정보에 기반하여 상기 음성 신호를 처리하기 위한 상기 오디오 모듈의 제어 정보를 조절하고,
    상기 하우징의 적어도 일 부분의 접히는 중 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하도록 상기 오디오 모듈을 제어하도록 설정된, 전자 장치.
  2. 제1항에 있어서, 상기 적어도 하나의 프로세서는,
    상기 각도 정보를 기반하여 접힘 각도 변화에 대응하는 접힘 속도를 식별하고,
    상기 식별된 접힘 속도가 지정된 임계값을 초과할 때, 상기 하우징의 적어도 일 부분이 접히는 중의 상태임을 식별하고,
    상기 접히는 중의 상태에서 상기 식별된 접힘 속도가 지정된 임계값 이하에서 지정된 시간이 경과할 때, 상기 하우징의 적어도 일 부분이 접힘이 중단된 정지 상태를 식별하도록 설정된, 전자 장치.
  3. 제1항에 있어서, 상기 전자 장치는,
    상기 각도 정보를 획득하도록 힌지 구조를 중심으로 상기 하우징의 적어도 일 부분의 접히는 움직임을 감지하는 적어도 하나의 센서; 및
    상기 조절된 제어 정보를 기반하여 처리된 상기 음성 신호를 외부 전자 장치로 전송하는 통신 모듈을 더 포함하며,
    상기 오디오 모듈은,
    상기 음성 신호에서 에코 또는 잡음을 제거하기 위한 신호 처리를 수행하는 음성 신호 처리 모듈; 및
    상기 각도 정보를 상기 적어도 하나의 프로세서로부터 수신하고, 상기 수신된 각도 정보를 기반하여 상기 음성 신호 처리 모듈을 제어하는 제어 모듈을 포함하는, 전자 장치.
  4. 제1항에 있어서, 상기 적어도 하나의 프로세서는,
    상기 하우징의 적어도 일부분이 접히는 중 상기 각도 정보를 기반하여 상기 제어 정보의 동작 파라미터 정보에 포함된 에코 제거 동작 파라미터를 조절하고,
    상기 하우징의 적어도 일부분이 접히는 중 조절되는 상기 에코 제거 동작 파라미터를 기반하여 상기 음성 신호에서 에코를 제거하도록 상기 오디오 모듈을 제어하도록 설정된, 전자 장치.
  5. 제1항에 있어서, 상기 적어도 하나의 프로세서는,
    상기 하우징의 적어도 일 부분의 접히는 중에 상기 각도 정보의 각도 변화에 따라 조절되는 상기 제어 정보의 동작 파라미터 정보에 포함된 에코 제거 동작 파라미터를 기반하여 상기 음성 신호에서 선형성의 에코 성분을 제거하고,
    상기 하우징의 적어도 일 부분의 접히는 중에 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커 간의 상대적 거리 변화에 따라 조절되는 상기 에코 제거 동작 파라미터를 기반하여 잔여 에코 및 비선형성의 에코 성분을 상기 음성 신호에서 제거하도록 설정된, 전자 장치.
  6. 제1항에 있어서, 상기 적어도 하나의 프로세서는,
    상기 하우징의 적어도 일부분이 접히는 중 상기 각도 정보를 기반하여 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커 간의 상대적 거리 변화에 따라 상기 제어 정보의 동작 파라미터 정보에 포함된 잡음 제거 동작 파라미터를 조절하고,
    상기 하우징의 적어도 일부분이 접히는 중 조절되는 상기 잡음 제거 동작 파라미터를 기반하여 상기 음성 신호에서 잡음을 제거하도록 상기 오디오 모듈을 제어하도록 설정되며,
    상기 잡음 제거 동작 파라미터는 상기 각도 정보에 따라 조절된 빔포밍 대역폭을 포함하는, 전자 장치.
  7. 제1항에 있어서,
    상기 오디오 모듈은 잡음 제거 모듈을 포함하며,
    상기 잡음 제어 모듈은,
    상기 하우징의 적어도 일 부분이 접히는 중에 상기 음성 신호에서 상기 잡음 제거 모듈의 제1 경로를 거쳐 빔포밍 대역폭에 따라 잡음이 제거된 제1 신호를 출력하고,
    상기 하우징의 적어도 일 부분의 접히는 중에 상기 음성 신호에서 상기 잡음 제거 모듈의 제2 경로를 거쳐 잡음이 제거된 제2 신호를 출력하고,
    상기 각도 정보를 기반하여 설정된 가중치 정보를 수신하고,
    상기 제1 신호 및 상기 제2 신호 각각에 서로 다른 가중치 정보를 적용하고,
    상기 제1 신호 및 상기 제2 신호를 혼합(mixing)하여 잡음이 제거된 음성 신호를 획득하도록 상기 오디오 모듈을 제어하도록 설정된, 전자 장치.
  8. 제1항에 있어서, 상기 적어도 하나의 프로세서는,
    상기 하우징의 적어도 일부분의 접히는 중 상기 각도 정보를 기반하여 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커 간의 상대적 거리를 식별하고,
    상기 식별되는 상대적 거리가 지정된 거리 임계값 이하로 감소할 때, 상기 마이크의 감도를 지정된 낮은 값으로 조절하도록 상기 오디오 모듈을 제어하고,
    상기 식별되는 상대적 거리가 지정된 거리 임계값을 초과할 때, 상기 마이크의 감도를 지정된 높은 값으로 조절하도록 상기 오디오 모듈을 제어하도록 설정된, 전자 장치.
  9. 적어도 하나의 마이크 및 적어도 하나의 스피커를 포함하는 전자 장치에서의 동작 방법에 있어서,
    상기 적어도 하나의 마이크를 통해 음성 신호를 수신하는 동작;
    상기 전자 장치의 하우징의 적어도 일 부분의 접힘에 관련된 각도 정보를 획득하는 동작;
    상기 각도 정보를 기반하여 상기 하우징의 적어도 일부분의 접히는 중인 상태를 식별하는 동작;
    상기 각도 정보에 기반하여 상기 음성 신호를 처리하기 위한 상기 전자 장치의 오디오 모듈의 제어 정보를 조절하는 동작; 및
    상기 오디오 모듈에 의해 상기 하우징의 적어도 일 부분이 접히는 중 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하는 동작을 포함하는, 방법.
  10. 제9항에 있어서, 상기 하우징의 적어도 일부분이 접히는 중인 상태를 식별하는 동작은,
    상기 각도 정보를 기반하여 접힘 각도 변화에 대응하는 접힘 속도를 식별하는 동작; 및
    상기 식별된 접힘 속도가 지정된 임계값을 초과할 때, 상기 하우징의 적어도 일 부분이 접히는 중인 상태임을 식별하는 동작을 포함하며,
    상기 방법은,
    상기 하우징의 적어도 일 부분이 접히는 중에 상기 식별된 접힘 속도가 지정된 임계값 이하에서 지정된 시간이 경과할 때, 상기 하우징의 적어도 일 부분이 접힘이 중단된 정지 상태를 식별하는 동작을 더 포함하는, 방법.
  11. 제9항에 있어서, 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하는 동작은,
    상기 오디오 모듈에 의해 상기 하우징의 적어도 일 부분의 접히는 중에 상기 각도 정보의 각도 변화에 따라 조절되는 에코 제거 동작 파라미터를 기반하여 상기 음성 신호에서 선형성의 에코 성분을 제거하는 동작; 및
    상기 오디오 모듈에 의해 상기 하우징의 적어도 일 부분의 접히는 중에 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커 간의 상대적 거리 변화에 따라 조절되는 에코 제거 동작 파라미터를 기반하여 잔여 에코 및 비선형성의 에코 성분을 상기 음성 신호에서 제거하는 동작을 포함하는, 방법.
  12. 제9항에 있어서, 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하는 동작은,
    상기 오디오 모듈에 의해 상기 하우징의 적어도 일부분이 접히는 중 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커 간의 상대적 거리 변화에 따라 조절되는 잡음 제거 동작 파라미터를 기반하여 상기 음성 신호에서 잡음을 제거하는 동작을 포함하며, 상기 잡음 제거 동작 파라미터는 상기 제어 정보에 포함된 상기 오디오 모듈의 음성 신호 처리를 위한 동작 파라미터 정보에 포함되며, 상기 각도 정보에 따라 조절된 빔포밍 대역폭을 포함하는, 방법.
  13. 제9항에 있어서, 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하는 동작은,
    상기 오디오 모듈에 의해 상기 하우징의 적어도 일 부분이 접히는 중에 상기 음성 신호에서 상기 잡음 제거 모듈의 제1 경로를 거쳐 빔포밍 대역폭에 따라 잡음이 제거된 제1 신호를 출력하는 동작;
    상기 오디오 모듈에 의해 상기 하우징의 적어도 일 부분의 접히는 중에 상기 음성 신호에서 상기 잡음 제거 모듈의 제2 경로를 거쳐 잡음이 제거된 제2 신호를 출력하는 동작;
    상기 오디오 모듈에 의해 상기 각도 정보를 기반하여 설정된 가중치 정보를 수신하는 동작;
    상기 오디오 모듈에 의해 상기 제1 신호 및 상기 제2 신호 각각에 서로 다른 가중치 정보를 적용하는 동작; 및
    상기 오디오 모듈에 의해 상기 제1 신호 및 상기 제2 신호를 혼합(mixing)하여 잡음이 제거된 음성 신호를 획득하는 동작을 포함하는, 방법.
  14. 제9항에 있어서, 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하는 동작은,
    상기 오디오 모듈에 의해 상기 하우징의 적어도 일부분의 접히는 중 상기 각도 정보를 기반하여 식별되는 상기 적어도 하나의 마이크 및 상기 적어도 하나의 스피커 간의 상대적 거리가 지정된 거리 임계값 이하로 감소할 때, 상기 마이크의 감도를 지정된 낮은 값으로 조절하는 동작; 및
    상기 오디오 모듈에 의해 상기 식별되는 상대적 거리가 지정된 거리 임계값을 초과할 때, 상기 마이크의 감도를 지정된 높은 값으로 조절하는 동작을 포함하는, 방법.
  15. 프로그램을 저장한 비 일시적 저장 매체에 있어서, 상기 프로그램은, 프로세서에 의한 실행 시, 상기 프로세서가,
    상기 적어도 하나의 마이크를 통해 음성 신호를 수신하는 동작;
    상기 전자 장치의 하우징의 적어도 일 부분의 접힘에 관련된 각도 정보를 획득하는 동작;
    상기 각도 정보를 기반하여 상기 하우징의 적어도 일부분의 접히는 중인 상태를 식별하는 동작;
    상기 각도 정보에 기반하여 상기 음성 신호를 처리하기 위한 상기 전자 장치의 오디오 모듈의 제어 정보를 조절하는 동작; 및
    상기 오디오 모듈에 의해 상기 하우징의 적어도 일 부분이 접히는 중 상기 조절된 제어 정보를 기반하여 상기 음성 신호를 처리하는 동작을 실행하도록 실행 가능한 명령을 포함하는, 비 일시적 저장 매체.
PCT/KR2022/004235 2021-03-26 2022-03-25 음성 신호 처리를 위한 전자 장치 및 방법 WO2022203456A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2021-0039810 2021-03-26
KR1020210039810A KR20220134308A (ko) 2021-03-26 2021-03-26 음성 신호 처리를 위한 전자 장치 및 방법

Publications (1)

Publication Number Publication Date
WO2022203456A1 true WO2022203456A1 (ko) 2022-09-29

Family

ID=83397640

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/004235 WO2022203456A1 (ko) 2021-03-26 2022-03-25 음성 신호 처리를 위한 전자 장치 및 방법

Country Status (2)

Country Link
KR (1) KR20220134308A (ko)
WO (1) WO2022203456A1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080004950A (ko) * 2006-07-07 2008-01-10 주식회사 이에이스 인터넷화상전화용 필기화상 송신장치
KR20140029931A (ko) * 2012-08-31 2014-03-11 삼성전자주식회사 스피커에서 출력되는 음성을 소멸시켜 에코 발생을 차단하는 전자 장치 및 방법
KR20140050916A (ko) * 2012-10-22 2014-04-30 삼성전자주식회사 마이크로폰 장치를 갖는 전자 장치 및 그 운용 방법
KR101967917B1 (ko) * 2012-10-30 2019-08-13 삼성전자주식회사 음성을 인식하는 전자 장치 및 방법
US20200294533A1 (en) * 2017-12-28 2020-09-17 Zte Corporation Terminal control method, terminal and computer readable storage medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080004950A (ko) * 2006-07-07 2008-01-10 주식회사 이에이스 인터넷화상전화용 필기화상 송신장치
KR20140029931A (ko) * 2012-08-31 2014-03-11 삼성전자주식회사 스피커에서 출력되는 음성을 소멸시켜 에코 발생을 차단하는 전자 장치 및 방법
KR20140050916A (ko) * 2012-10-22 2014-04-30 삼성전자주식회사 마이크로폰 장치를 갖는 전자 장치 및 그 운용 방법
KR101967917B1 (ko) * 2012-10-30 2019-08-13 삼성전자주식회사 음성을 인식하는 전자 장치 및 방법
US20200294533A1 (en) * 2017-12-28 2020-09-17 Zte Corporation Terminal control method, terminal and computer readable storage medium

Also Published As

Publication number Publication date
KR20220134308A (ko) 2022-10-05

Similar Documents

Publication Publication Date Title
WO2022014988A1 (ko) 전자 장치 및 전력 제어 방법
WO2022154546A1 (ko) 자동 음량 제어를 수행하는 웨어러블 장치
WO2022119287A1 (ko) 플렉서블 디스플레이를 포함하는 전자 장치 및 그 동작 방법
WO2022114599A1 (ko) 커넥터를 포함하는 전자 장치
WO2022203456A1 (ko) 음성 신호 처리를 위한 전자 장치 및 방법
WO2022025452A1 (ko) 전자 장치 및 전자 장치의 동작 방법
WO2021221440A1 (ko) 음질 향상 방법 및 그 장치
WO2024076061A1 (ko) 에코 발생을 감소시키기 위한 폴더블 형태의 전자 장치 및 방법
WO2022203179A1 (ko) 오디오 데이터 처리 방법 및 이를 지원하는 전자 장치
WO2022030880A1 (ko) 음성 신호를 처리하는 방법 및 이를 이용한 장치
WO2022146033A1 (ko) 전자 장치 및 전자 장치의 음성 입출력 제어 방법
WO2022225263A1 (ko) 전자 장치 및 그의 동작 방법
WO2024035240A1 (ko) 복수의 안테나들을 포함하는 전자 장치
WO2024076043A1 (ko) 진동 소리 신호를 생성하기 위한 전자 장치 및 방법
WO2024080667A1 (ko) 스피커의 공진 공간 변경을 검출하기 위한 전자 장치 및 방법
WO2023287023A1 (ko) 음향 신호를 생성하는 전자 장치 및 방법
WO2023033602A1 (ko) 소리를 출력하는 전자 장치와 이의 동작 방법
WO2023063627A1 (ko) 오디오 장면에 기초하여 주변 사운드를 제어하는 전자 장치 및 그 동작방법
WO2023249236A1 (ko) 센서를 포함하는 전자 장치 및 그 동작 방법
WO2024071686A1 (ko) 전자 장치 및 이의 오디오 신호 처리의 재설정 시간을 감소시키는 방법
WO2024106730A1 (ko) 전자 장치 및 상기 전자 장치를 이용하여 사운드 신호를 제어하는 방법
WO2022103176A1 (ko) 전자 장치의 멀티 레코딩 시 무선 오디오 장치에서 마이크 입출력을 제어하는 방법 및 장치
WO2022164023A1 (ko) 오디오 데이터를 처리하는 방법 및 이를 지원하는 전자 장치
WO2024080590A1 (ko) 신호의 오류를 검출하기 위한 전자 장치 및 방법
WO2023085749A1 (ko) 빔포밍을 제어하는 전자 장치 및 이의 동작 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22776156

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 22776156

Country of ref document: EP

Kind code of ref document: A1