WO2014119835A1 - 이동 단말기, 및 그 동작방법 - Google Patents

이동 단말기, 및 그 동작방법 Download PDF

Info

Publication number
WO2014119835A1
WO2014119835A1 PCT/KR2013/008131 KR2013008131W WO2014119835A1 WO 2014119835 A1 WO2014119835 A1 WO 2014119835A1 KR 2013008131 W KR2013008131 W KR 2013008131W WO 2014119835 A1 WO2014119835 A1 WO 2014119835A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio
speaker
mobile terminal
audio signal
camera
Prior art date
Application number
PCT/KR2013/008131
Other languages
English (en)
French (fr)
Inventor
신주연
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to US14/764,930 priority Critical patent/US9380262B2/en
Publication of WO2014119835A1 publication Critical patent/WO2014119835A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/69Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/12Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/52Details of telephonic subscriber devices including functional features of a camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • H04N2007/145Handheld terminals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Definitions

  • the present invention relates to a mobile terminal, and a method of operating the same, and more particularly, to a mobile terminal and a method of operating the same that can improve user convenience.
  • a mobile terminal is a portable device that is portable and has one or more functions of making voice and video calls, inputting and outputting information, and storing data.
  • the functions of the mobile terminals are diversified, they are equipped with complex functions such as taking pictures or videos, playing music files or video files, receiving games, broadcasting, wireless Internet, and sending and receiving messages. multimedia player).
  • new attempts have been variously applied in terms of hardware or software to implement complex functions.
  • An object of the present invention is to provide a mobile terminal and an operation method thereof, which can improve user convenience.
  • another object of the present invention is to provide a mobile terminal capable of receiving an optimal audio signal by forming an audio beam corresponding to a speaker's position, and an operation method thereof.
  • an operating method of a mobile terminal includes audio for collecting an audio signal from a speaker based on at least one of a captured image from a camera and motion information from a motion sensor. Forming a beam, receiving an audio signal from a speaker via a plurality of microphones, and processing a received audio signal based on the formed audio beam.
  • a method of operating a mobile terminal for achieving the above object, in the method of operating a mobile terminal having a camera, a motion sensor, and a plurality of microphones, the step of entering the audio reception mode; Activating a camera, a motion sensor and a plurality of microphones, and forming an audio beam for collecting an audio signal from the speaker based on at least one of the captured image from the camera and the motion information from the motion sensor; And upon completion of the audio beam formation, displaying an object representing this.
  • a mobile terminal for achieving the above object, the camera, a motion sensor for detecting the motion information of the mobile terminal, a plurality of microphones for collecting audio signals, and the captured image from the camera and Determine a speaker's position based on at least one of the motion information from the motion sensor, and form an audio beam for collecting an audio signal from the speaker, corresponding to the speaker's position, and receive through a plurality of microphones. And a beam processor for signal-processing the audio signal to be processed based on the formed audio beam.
  • the mobile terminal determines the location of the speaker based on at least one of the captured image from the camera and the motion information from the motion sensor, and corresponds to the location of the speaker, and audio from the speaker is determined.
  • An audio beam is formed for collecting a signal, and based on the formed audio beam, an audio signal from a speaker is received through a plurality of microphones, and the audio signal is processed to receive an optimal audio signal corresponding to the speaker's position. You can do it. As a result, the user's ease of use can be improved.
  • the audio beam formation can be completed before the speaker moves in correspondence with the speaker's mouth position in the image of the speaker, whereby from the moment the speaker outputs the audio signal, Optimum audio signal can be received.
  • the user's ease of use can be improved.
  • an audio beam for collecting an audio signal from the speaker based on the captured image of the moved speaker, or based on the captured image of the moved speaker, and the received audio signal is updated.
  • the mobile terminal when the mobile terminal is moved, based on the photographed image of the moved speaker and the received audio signal, or the captured image of the moved speaker, the motion information of the mobile terminal from the motion sensor, and the reception By updating the audio beam for collecting the audio signal from the speaker based on the audio signal, the optimal audio signal can be adaptively received. As a result, the user's ease of use can be improved.
  • a second audio beam is formed based on the captured image from the camera and the audio signal from the other speaker. Based on this, by receiving an audio signal and processing the signal, an optimal audio signal can be adaptively received. As a result, the user's ease of use can be improved.
  • FIG. 1 illustrates that an audio reception mode is performed in a mobile terminal of the present invention.
  • FIG. 2 is a block diagram of a mobile terminal according to an embodiment of the present invention.
  • FIG. 3 is a perspective view of the mobile terminal of FIG. 2 viewed from the front;
  • FIG. 4 is a rear perspective view of the mobile terminal shown in FIG. 3.
  • 5A-5C illustrate elements utilized in audio beamforming in connection with the present invention.
  • 5d shows a simplified block diagram for the audio beamforming process in accordance with the present invention.
  • FIG. 6 is a flowchart illustrating a method of operating a mobile terminal according to an embodiment of the present invention.
  • 7A to 15C are views referred to for describing various examples of an operating method of the mobile terminal of FIG. 6.
  • the mobile terminal described in the present specification includes a mobile phone, a smart phone, a notebook computer, a digital broadcasting terminal, a personal digital assistant (PDA), a portable multimedia player (PMP), a camera, a navigation, a tablet computer ( tablet computer, e-book terminal, and the like.
  • PDA personal digital assistant
  • PMP portable multimedia player
  • camera a navigation
  • tablet computer tablet computer, e-book terminal, and the like.
  • the suffixes "module” and “unit” for the components used in the following description are merely given in consideration of ease of preparation of the present specification, and do not give particular meanings or roles by themselves. Therefore, the “module” and “unit” may be used interchangeably.
  • FIG. 1 illustrates that an audio reception mode is performed in a mobile terminal of the present invention.
  • the mobile terminal 100 of FIG. 1 illustrates operating in a speaker mode among audio reception modes.
  • the speaker mode screen 530 according to the speaker mode, in particular, an object 535 indicating the speaker mode is displayed on the mobile terminal 100.
  • the mobile terminal 100 When operating in a speaker mode, the mobile terminal 100 may activate a plurality of microphones provided. At this time, the speaker 50 may make a call with the other party while looking at the display of the mobile terminal 100, for example, as shown in the drawing, while separating the mobile terminal 100 from the speaker 50 by a predetermined distance. have.
  • the mobile terminal 100 is a mobile terminal including a camera (121 of FIG. 2), a plurality of microphones (123 of FIG. 2), and a motion sensor (145 of FIG. 2).
  • the audio reception mode such as a speaker mode
  • an audio beam is formed in order to receive an optimal audio signal when receiving an audio signal from a speaker.
  • the mobile terminal 100 based on at least one of a photographed image of the speaker 50 and the motion information from the motion sensor, in the camera (121 of FIG. 2) to form an audio beam,
  • the position can be determined and an audio beam corresponding to the speaker's position can be formed.
  • the location of the speaker may be location information on the x, y, z axis, but may be the location of the speaker relative to the location of the mobile terminal 100.
  • the location information of the speaker includes a distance information between the mobile terminal 100 and the speaker 50 or angle information between the mobile terminal 100 and the speaker 50 based on the mobile terminal 100. Can be.
  • the mobile terminal 100 may form an audio beam for optimal signal processing on audio signals received from the plurality of microphones 123 of FIG. 2. Can be.
  • the speaker 50 when the speaker 50 is located at the front and orthogonal to the mobile terminal 100, in an audio field around the mobile terminal 100, at an angle (90 degrees) at which the speaker 50 is located.
  • the magnitude may be set to have the largest magnitude, and the other angle may be set to have a magnitude gradually decreasing.
  • Magnitude may be set to be the largest, and other angles may be set to have a magnitude that gradually decreases around an angle of about 105 degrees.
  • the mobile terminal 100 Before the speaker's mouth moves, the mobile terminal 100 generates such an audio beam, and when the speaker's mouth moves to receive an audio signal, the mobile terminal 100 performs audio signal processing through the formed audio beam. Can be. As a result, the optimum audio signal can be received from the moment when the speaker 50 outputs the voice. As a result, the user's ease of use can be improved.
  • the mobile terminal 100 when the speaker moves, when the mobile terminal is moving, or when a plurality of speakers are located, the captured image from the camera, the mobile terminal from the motion sensor
  • the audio beam By forming the audio beam on the basis of the motion information and the audio signal received from the microphone, it is possible to receive an optimal audio signal quickly and accurately. As a result, the user's ease of use can be improved.
  • FIG. 2 is a block diagram of a mobile terminal according to an embodiment of the present invention.
  • the mobile terminal according to an embodiment of the present invention will be described with reference to FIG.
  • the mobile terminal 100 includes a wireless communication unit 110, an A / V input unit 120, a user input unit 130, a sensing unit 140, an output unit 150, and a memory. 160, an interface unit 170, a processor 180, and a power supply unit 190 may be included. Such components may be configured by combining two or more components into one component, or by dividing one or more components into two or more components as necessary when implemented in an actual application.
  • the wireless communication unit 110 may include a broadcast receiving module 111, a mobile communication module 113, a wireless internet module 115, a short range communication module 117, and a GPS module 119.
  • the broadcast receiving module 111 receives at least one of a broadcast signal and broadcast related information from an external broadcast management server through a broadcast channel.
  • the broadcast channel may include a satellite channel, a terrestrial channel, and the like.
  • the broadcast management server may mean a server for generating and transmitting at least one of a broadcast signal and broadcast related information, or a server receiving at least one of the pre-generated broadcast signal and broadcast related information and transmitting the same to a terminal.
  • the broadcast signal may include not only a TV broadcast signal, a radio broadcast signal, and a data broadcast signal, but also a broadcast signal having a data broadcast signal combined with a TV broadcast signal or a radio broadcast signal.
  • the broadcast related information may mean information related to a broadcast channel, a broadcast program, or a broadcast service provider.
  • the broadcast related information may also be provided through a mobile communication network, and in this case, may be received by the mobile communication module 113.
  • Broadcast related information may exist in various forms.
  • the broadcast receiving module 111 receives broadcast signals using various broadcast systems, and in particular, digital multimedia broadcasting-terrestrial (DMB-T), digital multimedia broadcasting-satellite (DMB-S), and media forward link only (MediaFLO). ), Digital broadcast signals may be received using digital broadcasting systems such as DVB-H (Digital Video Broadcast-Handheld) and ISDB-T (Integrated Services Digital Broadcast-Terrestrial).
  • Digital broadcast signals may be received using digital broadcasting systems such as DVB-H (Digital Video Broadcast-Handheld) and ISDB-T (Integrated Services Digital Broadcast-Terrestrial).
  • the broadcast receiving module 111 may be configured to be suitable for all broadcast systems providing broadcast signals as well as such digital broadcast systems.
  • the broadcast signal and / or broadcast related information received through the broadcast receiving module 111 may be stored in the memory 160.
  • the mobile communication module 113 transmits and receives a radio signal with at least one of a base station, an external terminal, and a server on a mobile communication network.
  • the wireless signal may include various types of data according to voice call signal, video call signal, or text / multimedia message transmission and reception.
  • the wireless internet module 115 refers to a module for wireless internet access.
  • the wireless internet module 115 may be embedded or external to the mobile terminal 100.
  • Wireless Internet technologies may include Wireless LAN (Wi-Fi), Wireless Broadband (Wibro), World Interoperability for Microwave Access (Wimax), High Speed Downlink Packet Access (HSDPA), and the like.
  • the short range communication module 117 refers to a module for short range communication.
  • Bluetooth Radio Frequency Identification (RFID), Infrared Data Association (IrDA), Ultra Wideband (UWB), ZigBee, Near Field Communication (NFC), and the like may be used.
  • RFID Radio Frequency Identification
  • IrDA Infrared Data Association
  • UWB Ultra Wideband
  • ZigBee ZigBee
  • NFC Near Field Communication
  • the GPS (Global Position System) module 119 receives position information from a plurality of GPS satellites.
  • the A / V input unit 120 is for inputting an audio signal or a video signal, and may include a camera 121 and a microphone 123.
  • the camera 121 processes image frames such as still images or moving images obtained by the image sensor in the video call mode or the photographing mode.
  • the processed image frame may be displayed on the display 151.
  • the image frame processed by the camera 121 may be stored in the memory 160 or transmitted to the outside through the wireless communication unit 110. Two or more cameras 121 may be provided according to the configuration aspect of the terminal.
  • the microphone 123 receives an external audio signal by a microphone in an audio reception mode, for example, a call mode, a recording mode, or a voice recognition mode, and processes the external audio signal into electrical voice data.
  • the processed voice data may be converted into a form transmittable to the mobile communication base station through the mobile communication module 113 and output in the communication mode.
  • the microphone 123 may use various noise removing algorithms for removing noise generated in the process of receiving an external audio signal.
  • the microphone 123 may be arranged as a plurality in different positions.
  • the audio signal received by each microphone may be processed by the processor 180 or the like.
  • the user input unit 130 generates key input data input by the user for controlling the operation of the terminal.
  • the user input unit 130 may be configured of a key pad, a dome switch, a touch pad (constant voltage / capacitance), etc. that may receive a command or information by a user's pressing or touch manipulation.
  • the user input unit 130 may be configured as a jog wheel or a jog method or a joystick that rotates a key, a finger mouse, or the like.
  • the touch pad forms a mutual layer structure with the display 151 to be described later, this may be referred to as a touch screen.
  • the sensing unit 140 detects a current state of the mobile terminal 100 such as an open / closed state of the mobile terminal 100, a location of the mobile terminal 100, presence or absence of user contact, and the like to control the operation of the mobile terminal 100. Generate a sensing signal. For example, when the mobile terminal 100 is in the form of a slide phone, it may sense whether the slide phone is opened or closed. In addition, it may be responsible for sensing functions related to whether the power supply unit 190 is supplied with power, whether the interface unit 170 is coupled to an external device, and the like.
  • the sensing unit 140 may include a proximity sensor 141, a pressure sensor 143, a motion sensor 145, and the like.
  • the proximity sensor 141 may detect the presence or absence of an object approaching the mobile terminal 100 or an object present in the vicinity of the mobile terminal 100 without mechanical contact.
  • the proximity sensor 141 may detect a proximity object by using a change in an alternating magnetic field or a change in a static magnetic field, or by using a change rate of capacitance. Two or more proximity sensors 141 may be provided according to the configuration aspect.
  • the pressure sensor 143 may detect whether pressure is applied to the mobile terminal 100 and the magnitude of the pressure.
  • the pressure sensor 143 may be installed at a portion requiring the detection of pressure in the mobile terminal 100 according to the use environment. If the pressure sensor 143 is installed on the display 151, according to the signal output from the pressure sensor 143, a touch input through the display 151 and a pressure touch to which a greater pressure is applied than the touch input is applied. The input can be identified. In addition, according to the signal output from the pressure sensor 143, it is also possible to know the magnitude of the pressure applied to the display 151 when the pressure touch input.
  • the motion sensor 145 detects the position or movement of the mobile terminal 100 using an acceleration sensor, a gyro sensor, or the like.
  • the acceleration sensor that can be used for the motion sensor 145 is an element that converts an acceleration signal in one direction into an electrical signal, and is widely used with the development of micro-electromechanical systems (MEMS) technology.
  • MEMS micro-electromechanical systems
  • Accelerometers measure the acceleration of a large value embedded in an airbag system of a car and used to detect a collision, and to measure the acceleration of a minute value used as an input means such as a game by recognizing a minute motion of a human hand.
  • Accelerometers are usually configured by mounting two or three axes in one package. Depending on the environment, only one axis may be needed. Therefore, if for some reason it is necessary to use the acceleration sensor in the X-axis or Y-axis direction instead of the Z-axis direction, the acceleration sensor may be mounted on the main substrate using a separate engraving substrate.
  • the gyro sensor is a sensor for measuring the angular velocity, and may sense a direction returned to the reference direction.
  • the output unit 150 is for outputting an audio signal, a video signal, or an alarm signal.
  • the output unit 150 may include a display 151, an audio output module 153, an alarm unit 155, and a haptic module 157.
  • the display 151 displays and outputs information processed by the mobile terminal 100.
  • the mobile terminal 100 displays a user interface (UI) or a graphic user interface (GUI) related to the call.
  • UI user interface
  • GUI graphic user interface
  • the mobile terminal 100 may display captured or received images respectively or simultaneously, and display a UI and a GUI.
  • the display 151 and the touch pad form a mutual layer structure and constitute a touch screen
  • the display 151 may also be used as an input device capable of inputting information by a user's touch in addition to the output device. Can be.
  • the display 151 may include a touch screen panel, a touch screen panel controller, and the like.
  • the touch screen panel is a transparent panel attached to the outside and may be connected to the internal bus of the mobile terminal 100.
  • the touch screen panel keeps an eye on the contact result and sends corresponding signals to the touch screen panel controller when there is a touch input.
  • the touch screen panel controller processes the signals and then transmits corresponding data to the processor 180 so that the processor 180 knows whether there is a touch input and which area of the touch screen has been touched.
  • the display 151 may be composed of an electronic paper (e-Paper).
  • Electronic paper e-Paper
  • e-Paper is a kind of reflective display that has excellent visual characteristics with high resolution, wide viewing angle and bright white background like conventional paper and ink.
  • the e-paper can be implemented on any substrate such as plastic, metal, paper, etc., and the image is maintained even after the power is cut off, and there is no back light power, so the battery life of the mobile terminal 100 is long. Can be maintained.
  • As the electronic paper hemispherical twist balls filled with electrostatics may be used, or electrophoresis and microcapsules may be used.
  • the display 151 may be a liquid crystal display, a thin film transistor-liquid crystal display, an organic light-emitting diode, a flexible display, or a three-dimensional display. 3D display) may include at least one.
  • two or more displays 151 may exist according to an implementation form of the mobile terminal 100. For example, an external display (not shown) and an internal display (not shown) may be simultaneously provided in the mobile terminal 100.
  • the sound output module 153 outputs audio data received from the wireless communication unit 110 or stored in the memory 160 in a call signal reception, a call mode or a recording mode, a voice recognition mode, a broadcast reception mode, and the like. In addition, the sound output module 153 outputs an audio signal related to a function performed in the mobile terminal 100, for example, a call signal reception sound and a message reception sound.
  • the sound output module 153 may include a speaker, a buzzer, and the like.
  • the alarm unit 155 outputs a signal for notifying occurrence of an event of the mobile terminal 100.
  • events occurring in the mobile terminal 100 include call signal reception, message reception, and key signal input.
  • the alarm unit 155 outputs a signal for notifying occurrence of an event in a form other than an audio signal or a video signal.
  • the signal may be output in the form of vibration.
  • the alarm unit 155 may output a signal to inform the call signal when the call signal or the message is received.
  • the key signal when the key signal is input, the alarm unit 155 may output the signal as a feedback to the key signal input.
  • the user may recognize the occurrence of an event through the signal output from the alarm unit 155.
  • the signal for notifying the event occurrence in the mobile terminal 100 may also be output through the display 151 or the sound output module 153.
  • the haptic module 157 generates various haptic effects that a user can feel.
  • a representative example of the haptic effect generated by the haptic module 157 is a vibration effect.
  • the haptic module 157 When the haptic module 157 generates vibration by the tactile effect, the intensity and pattern of the vibration generated by the haptic module 157 may be converted, and may be output by combining different vibrations or sequentially.
  • the haptic module 157 may be operated by a pin array that vertically moves with respect to the contact skin surface, by the stimulation through the injection force or the suction force of the air through the injection or inlet, or by the stimulus that strikes the skin surface.
  • Various tactile effects can be generated, such as effects of stimulation through contact of electrodes, effects of stimulation using electrostatic force, and effects of reproducing cold / warm feeling using elements capable of endothermic or exothermic heat.
  • the haptic module 157 may not only deliver the haptic effect through direct contact, but also may realize the haptic effect through the muscle sensation of a user's finger or arm. Two or more haptic modules 157 may be provided according to a configuration aspect of the mobile terminal 100.
  • the memory 160 may store a program for processing and controlling the processor 180, and provides a function for temporarily storing input or output data (for example, a phone book, a message, a still image, a video, etc.). It can also be done.
  • input or output data for example, a phone book, a message, a still image, a video, etc.
  • the memory 160 may be a flash memory type, a hard disk type, a multimedia card micro type, a card type memory (for example, SD or XD memory), RAM
  • the storage medium may include at least one type of storage medium.
  • the mobile terminal 100 may operate a web storage that performs a storage function of the memory 150 on the Internet.
  • the interface unit 170 serves as an interface with all external devices connected to the mobile terminal 100.
  • external devices connected to the mobile terminal 100 include wired / wireless headsets, external chargers, wired / wireless data ports, memory cards, subscriber identification module (SIM) cards, and user identity module (UIM) cards.
  • SIM subscriber identification module
  • UIM user identity module
  • the interface unit 170 may receive data from such an external device or receive power and transfer the data to each component inside the mobile terminal 100, and allow the data inside the mobile terminal 100 to be transmitted to the external device. .
  • the interface unit 170 When the mobile terminal 100 is connected to an external cradle, the interface unit 170 becomes a passage through which power from the connected cradle is supplied to the mobile terminal 100, or various command signals input from the cradle are moved by the user. It may be a passage that is delivered to the terminal 100.
  • the processor 180 typically controls the operation of each unit to control the overall operation of the mobile terminal 100. For example, perform related control and processing for voice calls, data communications, video calls, and the like.
  • the processor 180 may include a multimedia playback module 181 for multimedia playback.
  • the multimedia playback module 181 may be configured in hardware within the processor 180 or may be configured in software separately from the processor 180.
  • the processor 180 may include an application processor (not shown) for driving an application. Alternatively, the application processor (not shown) may be provided separately from the processor 180.
  • the power supply unit 190 receives an external power source and an internal power source under the control of the processor 180 to supply power for operation of each component.
  • the mobile terminal 100 having such a configuration may be configured to be operable in a communication system capable of transmitting data through a frame or packet, including a wired / wireless communication system and a satellite based communication system. have.
  • FIG. 3 is a perspective view of the mobile terminal of FIG. 2 viewed from the front
  • FIG. 4 is a rear perspective view of the mobile terminal of FIG. 3. 3 and 4, the mobile terminal related to the present invention will be described in terms of components according to appearance.
  • a bar type mobile terminal having a front touch screen among various types of mobile terminals such as a folder type, a bar type, a swing type, a slider type, and the like will be described as an example.
  • the present invention is not limited to the bar type mobile terminal, but can be applied to all types of mobile terminals including the above-described type.
  • the case forming the exterior of the mobile terminal 100 is formed by the front case 100-1 and the rear case 100-2.
  • Various electronic components are embedded in the space formed by the front case 100-1 and the rear case 100-2.
  • the front case 100-1 a display 151, a first sound output module 153a, a first camera 121a, and first to third user input units 130a, 130b, and 130c are disposed.
  • the fourth user input unit 130d, the fifth user input unit 130e, and the first to third microphones 123a, 123b, and 123c may be disposed on the side surface of the rear case 100-2.
  • the display 151 may be configured such that the touch pad is overlapped in a layer structure so that the display 151 may operate as a touch screen to input information by a user's touch.
  • the first sound output module 153a may be implemented in the form of a receiver or a speaker.
  • the first camera 121a may be implemented in a form suitable for capturing an image or a video of a user or the like.
  • the microphone 123 may be implemented in a form suitable for receiving a user's voice or other sound.
  • the first to fifth user input units 130a, 130b, 130c, 130d, and 130e and the sixth and seventh user input units 130f and 130g to be described later may be collectively referred to as the user input unit 130, and the user may feel tactile. Any manner may be employed as long as it is a tactile manner.
  • the user input unit 130 may be implemented as a dome switch or a touch pad capable of receiving a command or information by a user's pressing or touch manipulation, or a manipulation method such as a wheel or jog or a joystick that rotates a key. Or the like.
  • the first to third user input units 130a, 130b, and 130c are for inputting commands such as start, end, scroll, and the like
  • the fourth user input unit 130d is for inputting a selection of an operation mode or the like. It is for.
  • the fifth user input unit 130e may operate as a hot-key for activating a special function in the mobile terminal 100.
  • the first to second microphones 123a and 123b are disposed above the rear case 100-2, that is, above the mobile terminal 100 to collect audio signals, and the third microphone 123c may include The rear case 100-2, that is, the lower side of the mobile terminal 100, may be arranged to collect audio signals.
  • a second camera 121b and a fourth microphone 123d may be additionally mounted on the rear of the rear case 100-2, and a sixth side of the rear case 100-2 may be mounted. And the seventh user input units 130f and 130g and the interface unit 170 may be disposed.
  • the second camera 121b may have a photographing direction substantially opposite to that of the first camera 121a, and may have different pixels from the first camera 121a.
  • a flash (not shown) and a mirror (not shown) may be further disposed adjacent to the second camera 121b.
  • another camera may be further provided adjacent to the second camera 121b to be used for capturing a 3D stereoscopic image.
  • the flash shines toward the subject when the subject is photographed with the second camera 121b.
  • the mirror allows the user to see his / her own face or the like when photographing (self-photographing) the user using the second camera 121b.
  • a second sound output module (not shown) may be further disposed on the rear case 100-2.
  • the second sound output module may implement a stereo function together with the first sound output module 153a and may be used for a call in the speakerphone mode.
  • the interface unit 170 may be used as a passage through which data is exchanged with an external device.
  • an antenna (not shown) for receiving a broadcast signal may be disposed in one region of the front case 100-1 and the rear case 100-2. The antenna may be installed to be pulled out of the rear case 100-2.
  • the power supply unit 190 for supplying power to the mobile terminal 100 may be mounted on the rear case 100-2 side.
  • the power supply unit 190 is, for example, a rechargeable battery, and may be detachably coupled to the rear case 100-2 for charging.
  • the fourth microphone 123d may be disposed at the front of the rear case 100-2, that is, at the rear of the mobile terminal 100 to collect audio signals.
  • the second camera 121b and the like have been described as being disposed in the rear case 100-2, but the present disclosure is not necessarily limited thereto.
  • the first camera 121a may be rotatably formed to be able to photograph up to the photographing direction of the second camera 121b.
  • 5A-5C illustrate elements utilized in audio beamforming in connection with the present invention.
  • FIG. 5A illustrates that the camera 121a is activated in the audio reception mode of the mobile terminal 100 to obtain a captured image 500 of the speaker 50.
  • FIG. 5A illustrates that the speaker mode is operated in the audio reception mode.
  • the mobile terminal 100 may display the speaker mode screen 530 including the object 535 indicating the speaker mode.
  • FIG. 5B illustrates a motion including (acceleration) velocity information Om according to movement of position information Ip of the x, y, z axis, rotation, etc. from the motion sensor 145 when the mobile terminal 100 moves.
  • An example of obtaining information Imot is illustrated.
  • FIG. 5C illustrates each microphone 123a, 123b, 123c, and 123d when the speaker 50 outputs a voice Va in an audio reception mode of the mobile terminal 100, particularly in a speaker mode. ), Collecting the corresponding audio signals Vm1, Vm2, Vm3, and Vm4, respectively.
  • a speaker's position, movement, movement of the mobile terminal, etc. are collected for optimal audio signal collection.
  • the audio beam is formed.
  • the photographed image obtained from the camera 121, the motion information Imot obtained from the motion sensor 145, and the microphones 123a, 123b, 123c and 123d are shown in FIGS. 5A to 5C.
  • the image processing apparatus 100 may be provided with a beam processor 175 for forming an audio beam.
  • the beam processor 175 receives the captured image obtained from the camera 121, the motion information Imot obtained from the motion sensor 145, and the audio signal collected from each of the microphones 123a, 123b, 123c, and 123d. can do.
  • the beam processing unit 175 does not capture motion from the motion sensor 145, and thus, based on the image of the speaker, in particular, the mouth position of the speaker, Beam formation can be completed.
  • the beam processing unit 175 is fixed to the mobile terminal, and when the speaker moves, the beam processor 175 is based on a captured image of the moved speaker, or a captured image of the moved speaker, and the received audio signal.
  • an audio beam for collecting the audio signal from the speaker can be formed.
  • the beam processing unit 175 may include a captured image photographing the moved speaker and a captured image photographing the moved speaker or a motion sensor based on the received audio signal. Based on the movement information of the mobile terminal and the received audio signal, an audio beam for collecting the audio signal from the speaker can be formed.
  • the beam processing unit 175 may form a plurality of audio beams corresponding to the positions of each speaker.
  • the beam processor 175 may be configured to capture a captured image from a camera and an audio signal from another speaker when a plurality of speakers are located and there is an audio signal input from another speaker other than the speaker on which the audio beam is already formed. Based on this, the second audio beam can be formed.
  • the beam processor 175 or the processor 180 may perform signal processing of the collected audio signal in each of the microphones 123a, 123b, 123c, and 123d in the audio reception mode based on the formed audio beam. For example, the magnitude of the received audio signal may be adjusted or the phase value may be adjusted according to the magnitude setting value according to the bandwidth and band of the audio beam.
  • the volume output module 153 may output an audio signal received and signaled according to the formed audio beam.
  • 5D illustrates that the beam processor 175 is separate from the processor 180, the beam processor 175 may be provided in the processor 180.
  • FIG. 6 is a flowchart illustrating a method of operating a mobile terminal according to an embodiment of the present invention
  • FIGS. 7A to 15C are diagrams for describing various examples of the method of operating the mobile terminal of FIG. 6.
  • the mobile terminal 100 receives a photographed image photographed through a camera in an audio reception mode (S610).
  • motion information is received from the motion sensor.
  • the mobile terminal 100 may activate the plurality of microphones 123a, 123b, 123c, and 123d of the camera 121 and the motion sensor 145 in the audio reception mode. In addition, the mobile terminal 100 receives motion information such as a photographed image, sensing position information, and speed information.
  • the speaker position is determined based on at least one of the captured image and the motion information (S640).
  • an audio beam for collecting the audio signal from the speaker is formed (S650).
  • the beam processing unit 175 in the mobile terminal 100 includes a captured image obtained from the camera 121, motion information Imot obtained from the motion sensor 145, and the microphones 123a, 123b, 123c, and 123d.
  • the audio signal to be collected can be received.
  • the beam processing unit 175 may include a captured image obtained from the camera 121, motion information Imot obtained from the motion sensor 145, and each microphone 123a, as in various examples described in the description of FIG. 5D.
  • an audio beam may be formed based on at least one of the collected audio signals.
  • the magnitude of the speaker at the angle at which the speaker 50 is located in the audio field around the mobile terminal 100 is measured. Is set to be the largest, and the other angle can be set to have a gradually decreasing magnitude.
  • the magnitude may be set to be the largest, and the other angle about the 15 degree angle may be set to have a gradually decreasing magnitude.
  • an audio signal is received from the speaker through the plurality of microphones (S660).
  • the received audio signal is signal processed based on the formed audio beam (S670).
  • the mobile terminal 100 may receive an audio signal from the speaker when the speaker outputs voice through the microphones 123a, 123b, 123c, and 123d.
  • the beam processing unit 175 or the processor 180 in the mobile terminal 100 based on the formed audio beam, in the audio reception mode, the microphones 123a, 123b, 123c, 123d, of the audio signal collected Signal processing can be performed.
  • the magnitude of the received audio signal may be adjusted or the phase value may be adjusted according to the magnitude setting value according to the bandwidth and band of the audio beam.
  • an optimum audio signal can be received in response to the position of the speaker 50, thus improving the user's ease of use.
  • FIG. 7A illustrates that when the mobile terminal and the speaker are fixed without movement, the camera 121a is activated in the audio reception mode of the mobile terminal 100 to obtain a captured image 500 of the speaker 50.
  • FIG. 7A illustrates that the speaker mode is operated in the audio reception mode.
  • the mobile terminal 100 may display the speaker mode screen 530 including the object 535 indicating the speaker mode.
  • the beam processing unit 175 in the mobile terminal 100 may calculate the position information of the speaker 50 based on the captured image 500 photographing the speaker 50. In particular, the position information of the mouth 520 of the speaker 510 in the captured image 500 may be calculated.
  • the location information may be location information on the x, y, and z axes as the location information of the speaker's mouth, compared to the mobile terminal 100.
  • FIG. 7B illustrates that the speaker, in particular the speaker's mouth, is positioned at the P position on the x, y, z axis space.
  • the beam processor 175 in the mobile terminal 100 may form an audio beam for collecting an audio signal from the speaker 50 based on the calculated position information of the speaker 50.
  • the audio beam may be formed corresponding to the position of the speaker, which is disposed on the x, y, z axis space.
  • the audio beam may be implemented as an audio field corresponding to the speaker's position with respect to the x, y, z axis-based rectangular coordinate system. This audio field may be set to have different magnitudes according to positions (x, y, z coordinates).
  • the audio beam may be implemented as an audio field corresponding to the speaker's position with respect to the mobile coordinates, which are expressed by distance and angle, with respect to the mobile terminal.
  • the rotation coordinate system is mainly described.
  • FIG. 8B illustrates an audio beam 806 around a rotational coordinate system.
  • the mobile terminal and the speaker make an angle of 90 degrees ⁇ 1 on the rotational coordinate system, and accordingly, the beam processor 175 in the mobile terminal 100. May form an audio beam 806, as shown in FIG. 8B. From the figure, it can be seen that the magnitude Am1 for processing the audio signal at the 90 degree angle is the largest, and gradually decreases at the other angle.
  • the processor 180 may display an object 710 indicating completion of audio beam formation on the speaker mode screen 530 as shown in FIG. 7C. Thereby, the speaker can recognize the completion of audio beam formation. Then, with the completion of the audio beam formation, the voice can be output.
  • the camera 121a may acquire an image 502 of the speaker. At this time, the photographed image 502 includes an open mouth image 522 of the speaker 512.
  • the beam processor 175 or the processor 180 may determine that the speaker is outputting audio based on the captured image 502 and the audio signal received through the microphones 123a,..., 123d. According to the formed audio beam 806, the audio signal received from each microphone 123a,..., 123d may be signal processed. For example, the gain (or magnitude) of the audio signal received from the microphones 123a and 123b disposed above the mobile terminal 100 is set high, and the microphone 123d disposed behind the mobile terminal 100. It is possible to set a low gain of the audio signal received from the.
  • the beam processor 175 or the processor 180 may perform post-processing such as noise removal after signal processing according to the formed audio beam. As a result, an optimal audio signal can be obtained.
  • the processor 180 may display an object 720 indicating that audio signal processing is being performed according to the formed audio beam on the speaker mode screen 530. This makes it possible to grasp that the audio reception mode is operating normally.
  • FIG. 8A illustrates that when the mobile terminal is fixed and the speaker moves to the left (moves to the right based on the mobile terminal), the camera 121a is activated and moves in the audio reception mode of the mobile terminal 100.
  • An example of acquiring a photographed image 501 photographing 50 is illustrated.
  • the processor 180 may detect the speaker movement based on the image 501 of the moving speaker and control to display the object 715 indicating the unformed audio beam as shown in the figure.
  • the beam processing unit 175 updates the audio beam in response to the speaker movement.
  • the beam processing unit 175 in the mobile terminal 100 may calculate the position information of the speaker 50 based on the captured image 501 of the speaker 50. In particular, the position information of the mouth 521 of the speaker 511 in the captured image 501 may be calculated.
  • the beam processing unit 175 determines that the speaker 50 has moved to the right relative to the mobile terminal based on the captured image 501 of the speaker 50, and FIG.
  • the same audio beam 808 can be formed.
  • the mobile terminal and the speaker make an angle of 105 degrees ( ⁇ 2) on the rotational coordinate system, and accordingly, the beam processing unit 175 in the mobile terminal 100. May form an audio beam 808, such as in FIG. 8B. From the figure, it can be seen that the magnitude Am2 for processing an audio signal at an angle of 105 degrees is the largest, and is sequentially reduced at other angles.
  • the processor 180 may display an object 710 indicating completion of audio beam formation on the speaker mode screen 530 as shown in FIG. 8C.
  • the speaker can recognize the completion of the audio beam formation corresponding to the speaker movement. Then, with the completion of the audio beam formation, the voice can be output.
  • the camera 121a may acquire an image 501 of the speaker. At this time, the photographed image 501 includes an open mouth image 522 of the speaker 511.
  • the beam processor 175 or the processor 180 may determine that the speaker is outputting audio based on the captured image 501 and the audio signal received through the microphones 123a,..., 123d. According to the formed audio beam 808, the audio signal received from each microphone 123a,..., 123d may be signal processed. For example, the gain (or magnitude) of the audio signal received from the first microphone 123a may be set higher than the second microphone 123b among the microphones disposed above the mobile terminal 100.
  • the beam processor 175 or the processor 180 may perform post-processing such as noise removal after signal processing according to the formed audio beam. As a result, an optimal audio signal can be obtained.
  • the processor 180 may display an object 720 indicating that audio signal processing is being performed according to the formed audio beam on the speaker mode screen 530. This makes it possible to grasp that the audio reception mode is operating normally.
  • FIG. 9A is similar to FIG. 8A except that there is a difference in the movement of the mobile terminal rather than the speaker movement.
  • FIG. 9A illustrates that when the mobile terminal 100 moves to the right, the camera 121a is activated in the audio reception mode of the mobile terminal 100 to obtain a captured image 501 of the moving speaker 50. To illustrate. In particular, it illustrates that the mobile terminal 100 has moved to the right by La.
  • the processor 180 detects the movement of the mobile terminal 100 based on the image 501 of the moving speaker and the motion information of the motion sensor 145, and indicates that the audio beam is not formed.
  • the object 715 may be controlled to be displayed as shown in the drawing.
  • the beam processing unit 175 updates the audio beam in response to the movement of the mobile terminal 100.
  • the beam processing unit 175 in the mobile terminal 100 may calculate the position information of the speaker 50 based on the captured image 501 of the speaker 50. In particular, the position information of the mouth 521 of the speaker 511 in the captured image 501 may be calculated.
  • the beam processor 175 may include a captured image 501 of the speaker 50 and a motion including right movement information obtained by the motion sensor 145. Based on the information, an audio beam 808 as shown in FIG. 8B can be formed.
  • the processor 180 may display an object 710 indicating completion of audio beam formation on the speaker mode screen 530 as shown in FIG. 9B.
  • the speaker can recognize the completion of the audio beam formation corresponding to the speaker movement. Then, with the completion of the audio beam formation, the voice can be output.
  • FIG. 9C illustrates that the speaker 50 outputs the voice 915 as the audio beam formation is completed.
  • the camera 121a may acquire an image 501 of the speaker.
  • the photographed image 501 includes an open mouth image 522 of the speaker 511.
  • the beam processor 175 or the processor 180 may determine that the speaker is outputting audio based on the captured image 501 and the audio signal received through the microphones 123a,..., 123d. According to the formed audio beam 808, the audio signal received from each microphone 123a,..., 123d may be signal processed. For example, the gain (or magnitude) of the audio signal received from the first microphone 123a may be set higher than the second microphone 123b among the microphones disposed above the mobile terminal 100.
  • the beam processor 175 or the processor 180 may perform post-processing such as noise removal after signal processing according to the formed audio beam. As a result, an optimal audio signal can be obtained.
  • the processor 180 may display an object 720 indicating that audio signal processing is being performed according to the formed audio beam on the speaker mode screen 530. This makes it possible to grasp that the audio reception mode is operating normally.
  • 10A to 10D are diagrams for comparing and explaining audio beams according to a speaker stop and a speaker move.
  • FIG. 10A illustrates operating in speaker mode when in speaker mode.
  • an audio beam as shown in FIG. 10C, may be formed.
  • FIG. 10B illustrates operating in speaker mode during speaker walking.
  • an audio beam as shown in FIG. 10D, may be formed based on the image 100 captured by the camera 121a and the motion information Imot from the motion sensor 145.
  • the bandwidth of the audio beam during speaker movement is larger. That is, it can be seen that the audio beam 1040 of FIG. 10D has a constant magnitude at most angles.
  • FIG. 10C shows that at a specific angle, there is a magnitude greater than or equal to a predetermined value.
  • the maximum magnitude Amy of the audio beam at the time of speaker movement is greater than the maximum magnitude Amx of the audio beam at the speaker stop. During speaker movement, audio collection is more difficult, so it is desirable to set the magnitude larger.
  • 11A to 11B are diagrams for explaining a case where a speaker holds a mobile terminal and a case where the speaker is placed on a table.
  • the mobile terminal 100 when the speaker 50 holds the mobile terminal 100 with the hand 55 and talks in the speaker mode, and as shown in FIG. 11B, the mobile terminal 100 is placed on the table 1105.
  • the audio beam may be formed based on the captured images 500 and 1100 using the camera.
  • the mobile terminal 100 includes a grip sensor (not shown), the mobile terminal 100 may detect this, and form an audio beam based on the detected grip information and the captured image.
  • the bandwidth of the audio beam is larger than that of FIG. That is, the bandwidth of the audio beam according to FIG. 11B may be smaller than the bandwidth illustrated in FIG. 10C.
  • 12A to 12F are diagrams referred to for explaining audio beam formation when there are a plurality of speakers.
  • FIG. 12A illustrates that when one speaker 50 picks up the mobile terminal 100 and talks in a speaker mode, audio beam formation centering on one speaker 50 is completed.
  • the mobile terminal 100 may display an object 710 indicating completion of audio beam formation.
  • the beam processor 175 forms an audio beam based on the image 500 captured by the camera 121a.
  • FIG. 12B illustrates that, when there are a plurality of speakers 50a and 50b, audio beam formation is completed based on any one speaker 50a.
  • the mobile terminal 100 may display an object 710 indicating completion of audio beam formation.
  • the beam processor 175 forms an audio beam based on the image 500 captured by the camera 121a.
  • the beam processor 175 detects the first speaker 50a disposed closer to the center of the plurality of speaker images 1220 and 1222 in the image 500, and the audio is based on the corresponding speaker 50a. It can form a beam.
  • FIG. 12C illustrates that the first speaker 50a outputs the voice 1215 according to the completion of the audio beam formation.
  • the beam processor 175 or the processor 180 outputs the audio by the first speaker 50a based on the captured image 502 and the audio signal received through the microphones 123a,..., 123d.
  • the audio signal received from each microphone 123a, ..., 123d can be signal processed according to the formed audio beam (806 in FIG. 12E).
  • the processor 180 may display an object 720 indicating that audio signal processing is being performed according to the formed audio beam on the speaker mode screen 530. This makes it possible to grasp that the audio reception mode is operating normally.
  • FIG. 12D illustrates that the second speaker 50b instead of the first speaker 50a outputs the voice 1216.
  • the beam processor 175 or the processor 180 may output the microphone 121 when the mouth 1224 in the second speaker image of the photographed image 1200 is opened and is not suitable for the formed audio beam. If received via, it may be determined to reconstruct the audio beam.
  • the processor 180 may display the object 1212 indicating that the audio beam is being variable as shown in FIG. 12D.
  • the beam processing unit 175 When the second speaker 50b outputs the voice 1216, the beam processing unit 175 immediately positions the second speaker 50b and the second speaker 50b in the captured image 1200. Based on the audio signal by the voice 1216, a second audio beam (806 in FIG. 12E) is generated. That is, the first audio beam (806 in FIG. 12E) is switched to the second audio beam (809 in FIG. 12E).
  • the mobile terminal 100 and the second speaker 50b form an angle of 75 degrees ⁇ 3 on the rotation coordinate system. Accordingly, the beam processor 175 in the mobile terminal 100 may form the audio beam 809, as shown in FIG. 12E. It can be seen from the figure that the magnitude Am3 for audio signal processing at the 75 degree angle is the largest, and gradually decreases at other angles.
  • FIG. 12F illustrates that the second speaker 50b outputs the voice 1217 as the second audio beam is formed.
  • the camera 121a may acquire an image 1200 of photographing a plurality of speakers.
  • the photographed image 1200 includes the opened mouth image 1224 of the second speaker 1222.
  • the beam processor 175 or the processor 180 outputs the audio by the second speaker 50b based on the captured image 1200 and the audio signal received through the microphones 123a,..., 123d.
  • the audio signal received from each microphone 123a,..., 123d can be signal processed according to the formed audio beam 809.
  • the gain (or magnitude) of the audio signal received from the second microphone 123b may be set higher than the first microphone 123a among the microphones disposed above the mobile terminal 100.
  • the beam processor 175 or the processor 180 may perform post-processing such as noise removal after signal processing according to the formed second audio beam. As a result, an optimal audio signal can be obtained.
  • the processor 180 may display an object 720 indicating that audio signal processing is being performed according to the formed second audio beam on the speaker mode screen. This makes it possible to grasp that the audio reception mode is operating normally.
  • the first speaker 50a when the first speaker 50a outputs the voice 1215, the first audio generated for the first speaker 50a based on the captured image 1200, the received audio signal, or the like. It is possible to signal-process an audio signal received on the basis of the beam.
  • 13A to 15C are diagrams illustrating another example of the audio reception mode.
  • the audio reception mode may include a call mode, a recording mode, or a voice recognition mode.
  • the call mode may include a speaker mode. 7A to 12F have been described based on the speaker mode in the call mode, the other modes will be described below.
  • FIG. 13A illustrates a voice talk mode.
  • the mobile terminal 100 may display the voice call mode screen 1430 including the object 1435 indicating the voice call mode.
  • the camera 121a may photograph the speaker 50 and form an audio beam based on the captured image.
  • the drawing illustrates that the speaker is looking at the screen of the mobile terminal, even when the mobile terminal is attached to the speaker's ear, the camera 121a may be activated and based on the speaker's ear image, an audio beam may be formed. Can be.
  • FIG. 13B illustrates that the audio beam formation is completed and an object 1413 indicating completion of the audio beam formation is displayed.
  • an audio signal such as a beep sound indicating the completion of the audio beam forming.
  • FIG. 13C illustrates that the speaker 50 outputs the voice 1415 in accordance with the completion of the audio beam formation.
  • the beam processor 175 or the processor 180 may signal-process an audio signal received from each microphone 123a,..., 123d according to the formed audio beam.
  • the mobile terminal 100 may display an object 1417 indicating that audio signal processing is being performed according to the formed audio beam.
  • an audio signal such as a beep sound indicating that audio signal processing is normally performed may be output.
  • the camera 121a may continuously acquire the image 1401 of the speaker.
  • the captured image 1401 may include the opened mouth image 1421 of the speaker image 1411.
  • FIG. 14A illustrates a voice recording mode.
  • the mobile terminal 100 may display the recording mode screen 1530 including the object 1535 indicating the recording mode.
  • the camera 121a may photograph the speaker 50 and form an audio beam based on the captured image.
  • FIG. 14B illustrates that the audio beam formation is completed and an object 1513 indicating completion of the audio beam formation is displayed.
  • FIG. 14C illustrates that the speaker 50 outputs the voice 1515 in accordance with the completion of the audio beam formation.
  • the beam processor 175 or the processor 180 may signal-process an audio signal received from each microphone 123a,..., 123d according to the formed audio beam.
  • the mobile terminal 100 may display an object 1517 indicating that audio signal processing is being performed according to the formed audio beam.
  • the camera 121a can continuously acquire the image 1501 which photographed the speaker.
  • the captured image 1501 may include an opening mouth image 1521 of the speaker image 1511.
  • FIG. 15A illustrates a voice recognition mode.
  • the mobile terminal 100 may display the voice recognition mode screen 1630 including the object 1635 indicating the voice recognition mode.
  • the camera 121a may photograph the speaker 50 and form an audio beam based on the captured image.
  • FIG. 15B illustrates that the audio beam formation is completed and an object 1613 indicating completion of the audio beam formation is displayed.
  • FIG. 15C illustrates that the speaker 50 outputs the voice 1615 as the audio beam formation is completed.
  • the beam processor 175 or the processor 180 may signal-process an audio signal received from each microphone 123a,..., 123d according to the formed audio beam.
  • the mobile terminal 100 may display an object 1617 indicating that audio signal processing is being performed according to the formed audio beam.
  • the camera 121a may continuously acquire the image 1601 of the speaker.
  • the captured image 1601 may include the opened mouth image 1621 of the speaker image 1611.
  • the speaker when the speaker is moved, the mobile terminal is moved, or when a plurality of speakers are located, as described above with reference to FIGS. The same or similar may apply.
  • the mobile terminal and its operation method according to the present invention are not limited to the configuration and method of the embodiments described as described above, but the embodiments are all or part of each embodiment so that various modifications can be made. May be optionally combined.
  • the audio beam forming method according to the embodiment of the present invention can be adopted in an image display device, especially a TV.
  • the TV may form an audio beam corresponding to the speaker's position.
  • the TV may form an audio beam corresponding to the speaker's position based on the captured image from the camera and the speaker's voice signal received by the microphone provided in the TV.
  • the remote controller forms an audio beam corresponding to the position of the speaker, based on the audio signal from the microphone provided in the remote control apparatus remotely controlling the TV and the motion information from the motion sensor included in the remote control apparatus. can do.
  • the TV or the remote controller may form an audio beam corresponding to the speaker's position based on the captured image from the camera and the speaker's voice signal received by the microphone provided in the TV.
  • the operating method of the mobile terminal of the present invention can be embodied as processor-readable codes on a processor-readable recording medium provided in the image display apparatus.
  • the processor-readable recording medium includes all kinds of recording devices that store data that can be read by the processor. Examples of the processor-readable recording medium include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, and the like, and may also be implemented in the form of a carrier wave such as transmission over the Internet. .
  • the processor-readable recording medium can also be distributed over network coupled computer systems so that the processor-readable code is stored and executed in a distributed fashion.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephone Function (AREA)

Abstract

본 발명은 이동 단말기, 및 그 동작방법에 관한 것이다. 본 발명의 실시예에 따른 이동 단말기의 동작 방법은, 카메라로부터의 촬영 이미지와, 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하는 단계와, 복수의 마이크를 통해, 화자로부터의 오디오 신호를 수신하는 단계와, 형성된 오디오 빔에 기초하여, 수신되는 오디오 신호를 신호 처리하는 단계를 포함한다. 이에 의해, 사용자의 이용 편의성을 향상시킬 수 있게 된다.

Description

이동 단말기, 및 그 동작방법
본 발명은 이동 단말기, 및 그 동작방법에 관한 것이며, 더욱 상세하게는 사용자의 이용 편의성을 향상시킬 수 있는 이동 단말기, 및 그 동작방법에 관한 것이다.
이동 단말기는 휴대가 가능하면서 음성 및 영상 통화를 수행할 수 있는 기능, 정보를 입,출력할 수 있는 기능 및 데이터를 저장할 수 있는 기능 등을 하나 이상 갖춘 휴대용 기기이다. 이러한 이동 단말기는 그 기능이 다양화됨에 따라, 사진이나 동영상의 촬영, 음악 파일이나 동영상 파일의 재생, 게임, 방송의 수신, 무선 인터넷, 메시지 송수신 등과 같은 복잡한 기능들을 갖추게 되었으며, 종합적인 멀티미디어 기기(multimedia player) 형태로 구현되고 있다. 이러한 멀티미디어 기기의 형태로 구현된 이동 단말기는, 복잡한 기능을 구현하기 위해 하드웨어나 소프트웨어적 측면에서 새로운 시도들이 다양하게 적용되고 있다.
본 발명의 목적은, 사용자의 이용 편의성을 향상시킬 수 있는 이동 단말기, 및 그 동작방법을 제공함에 있다.
한편, 본 발명의 다른 목적은, 화자의 위치에 대응하여, 오디오 빔을 형성하여, 최적의 오디오 신호를 수신할 수 있는 이동 단말기, 및 그 동작방법을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명의 실시예에 따른 이동 단말기의 동작 방법은, 카메라로부터의 촬영 이미지와, 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하는 단계와, 복수의 마이크를 통해, 화자로부터의 오디오 신호를 수신하는 단계와, 형성된 오디오 빔에 기초하여, 수신되는 오디오 신호를 신호 처리하는 단계를 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명의 실시예에 따른 이동 단말기의 동작 방법은, 카메라, 모션 센서, 및 복수개의 마이크를 구비하는 이동 단말기의 동작 방법에 있어서, 오디오 수신 모드로 진입하는 단계와, 카메라, 모션 센서 및 복수개의 마이크를 활성화하는 단계와, 카메라로부터의 촬영 이미지와 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하는 단계와, 오디오 빔 형성 완료시, 이를 나타내는 오브젝트를 표시하는 단계를 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명의 실시예에 따른 이동 단말기는, 카메라와, 이동 단말기의 움직임 정보를 감지하는 모션 센서와, 오디오 신호를 수집하는 복수개의 마이크와, 카메라로부터의 촬영 이미지와, 모션 센서로부터의 움직임 정보 중 적어도 하나에 기초하여, 화자의 위치를 결정하며, 화자의 위치에 대응하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하며, 복수의 마이크를 통해, 수신되는 오디오 신호를, 형성된 오디오 빔에 기초하여, 신호 처리하는 빔 처리부를 포함한다.
본 발명의 일실시예에 따르면, 이동 단말기는, 카메라로부터의 촬영 이미지와 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 화자의 위치를 결정하고, 화자의 위치에 대응하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하며, 형성된 오디오 빔에 기초하여, 복수의 마이크를 통해, 화자로부터의 오디오 신호를 수신하여, 오디오 신호 처리함으로써, 화자의 위치에 대응하는 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.
특히, 오디오 입력 모드에서, 화자를 촬영한 이미지 중 화자의 입 위치에 대응하여, 화자의 입이 움직이기 전에, 오디오 빔 형성을 완료할 수 있으며, 이에 의해, 화자가 오디오 신호 출력하는 순간부터, 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.
한편, 화자가 이동하는 경우, 이동된 화자를 촬영한 촬영 이미지에 기초하거나, 이동된 화자를 촬영한 촬영 이미지, 및 수신되는 오디오 신호에 기초하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트함으로써, 적응적으로 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.
한편, 이동 단말기가 이동하는 경우, 이동된 화자를 촬영한 촬영 이미지, 및 수신되는 오디오 신호에 기초에 기초하거나, 이동된 화자를 촬영한 촬영 이미지, 모션 센서로부터의 이동 단말기의 움직임 정보, 및 수신되는 오디오 신호에 기초하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트함으로써, 적응적으로 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.
한편, 이동 단말기에 대해, 복수의 화자가 위치하는 경우, 각 화자의 위치에 대응하는, 복수의 오디오 빔을 형성하고, 복수의 화자 중 입을 움직이는 화자에 대응하는, 오디오 빔을 활성화시킴으로써, 신속하고 정확하게, 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.
한편, 이동 단말기에 대해, 복수의 화자가 위치한 상태에서, 화자 외의 다른 화자의 오디오 신호 입력이 있는 경우, 카메라로부터의 촬영 이미지, 및 다른 화자로부터의 오디오 신호에 기초하여, 제2 오디오 빔을 형성하고, 이를 기반으로, 오디오 신호를 수신하여 신호 처리함으로써, 적응적으로 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.
도 1은 본 발명의 이동 단말기에서 오디오 수신 모드가 수행되는 것을 예시한다.
도 2는 본 발명의 일실시예에 따른 이동 단말기의 블럭도이다.
도 3은 도 2의 이동 단말기를 전면에서 바라본 사시도이다.
도 4는 도 3에 도시한 이동 단말기의 후면 사시도이다.
도 5a 내지 도 5c는 본 발명과 관련한, 오디오 빔포밍시 활용되는 요소들을 예시하는 도면이다.
도 5d는 본 발명과 관련한 오디오 빔포밍 처리를 위한 간략한 블록도를 도시한다.
도 6은 본 발명의 일 실시예에 따른 이동 단말기의 동작 방법을 보여주는 순서도이다.
도 7a 내지 도 15c는 도 6의 이동 단말기의 동작 방법의 다양한 예를 설명하기 위해 참조되는 도면이다.
이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.
본 명세서에서 기술되는 이동 단말기에는, 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(notebook computer), 디지털방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 카메라, 네비게이션, 타블렛 컴퓨터(tablet computer), 이북(e-book) 단말기 등이 포함된다. 또한, 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 단순히 본 명세서 작성의 용이함만이 고려되어 부여되는 것으로서, 그 자체로 특별히 중요한 의미 또는 역할을 부여하는 것은 아니다. 따라서, 상기 "모듈" 및 "부"는 서로 혼용되어 사용될 수도 있다.
도 1은 본 발명의 이동 단말기에서 오디오 수신 모드가 수행되는 것을 예시한다.
도면을 참조하면, 도 1의 이동 단말기(100)는, 오디오 수신 모드 중 스피커 모드(speaker mode)로 동작하는 것을 예시한다. 도면에서는 스피커 모드에 따른 스피커 모드 화면(530), 특히 스피커 모드를 나타내는 오브젝트(535)가 이동 단말기(100)에 표시되는 것을 예시한다.
스피커 모드(speaker mode)로 동작시, 이동 단말기(100)는, 구비되는 복수의 마이크를 활성화시킬 수 있다. 이때, 화자(50)는, 이동 단말기(100)를 화자(50)와 소정 거리 이격시키면서, 예를 들어, 도면과 같이, 이동 단말기(100)의 디스플레이를 보면서, 상대방과의 통화를 수행할 수 있다.
본 발명의 실시예에 따른, 이동 단말기(100)는, 카메라(도 2의 121), 복수의 마이크(도 2의 123), 및 모션 센서(도 2의 145)를 구비하는 이동 단말기로서, 스피커 모드(speaker mode)와 같은, 오디오 수신 모드 중, 화자로부터의 오디오 신호 수신시, 최적의 오디오 신호를 수신하기 위해, 오디오 빔을 형성하는 것으로 한다.
특히, 이동 단말기(100)는, 오디오 빔 형성을 위해, 카메라(도 2의 121)에서, 화자(50)를 촬영한 촬영 이미지와, 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 화자의 위치를 결정하고, 화자의 위치에 대응하는 오디오 빔을 형성할 수 있다. 여기서, 화자의 위치는, x,y,z축 상의 위치 정보일 수 있으나, 이동 단말기(100)의 위치 대비, 상대적인, 화자의 위치일 수 있다.
즉, 화자의 위치 정보는, 이동 단말기(100)와 화자(50)와의 거리 정보 또는 이동 단말기(100)를 기준으로, 이동 단말기(100)와 화자(50) 사이의 각도 정보 등을 포함하는 개념일 수 있다.
그리고, 이러한 화자의 위치 정보에 기초하여, 이동 단말기(100)는, 복수의 마이크(도 2의 123)에서 수신되는 오디오 신호에 대한 최적의 신호 처리를 위한, 오디오 빔(audio beam)을 형성할 수 있다.
예를 들어, 이동 단말기(100)를 기준으로, 화자(50)가 정면에 위치하여 직교하는 경우, 이동 단말기(100) 주변의 오디오 필드에서, 화자(50)가 위치하는 각도(90도)에서의, 매그니튜드(magnitude)가 가장 크도록 설정하고, 다른 각도는 점차 작아지는 매그니튜드를 가지도록 설정할 수 있다.
다른 예로, 이동 단말기(100)를 기준으로, 화자(50)가 정면이 아닌, 우측에 위치하는 경우, 이동 단말기(100) 주변의 오디오 필드에서, 화자가 위치하는, 대략 105도 각도에서의, 매그니튜드(magnitude)가 가장 크도록 설정하고, 대략 105도 각도를 중심으로 다른 각도는 점차 작아지는 매그니튜드를 가지도록 설정할 수 있다.
한편, 이동 단말기(100)는, 화자의 입이 움직이기 전에, 이러한 오디오 빔을, 생성하고, 화자의 입이 움직여서, 오디오 신호가 수신되는 경우, 형성된 오디오 빔을 통해, 오디오 신호 처리를 수행할 수 있다. 이에 의해, 화자(50)가 음성을 출력하는 순간부터, 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.
한편, 본 발명의 실시예에 따른 이동 단말기(100)는, 화자가 이동하는 경우, 이동 단말기가 이동하는 경우, 또는 복수의 화자가 위치하는 경우, 카메라로부터의 촬영 이미지, 모션 센서로부터의 이동 단말기의 움직임 정보, 및 마이크로부터 수신되는 오디오 신호에 기초하여, 오디오 빔을 형성함으로써, 신속하고 정확하게, 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.
본 발명의 실시예에 따른 이동 단말기(100)에서의 오디오 빔 형성의 다양한 방법에 대해서는, 도 5 이하를 참조하여 상세히 기술한다.
도 2는 본 발명의 일실시예에 따른 이동 단말기의 블럭도이다. 도 2를 참조하여 본 발명의 일 실시 예에 따른 이동 단말기를 기능에 따른 구성요소 관점에서 살펴보면 다음과 같다.
도 2를 참조하면, 이동 단말기(100)는 무선 통신부(110), A/V(Audio/Video) 입력부(120), 사용자 입력부(130), 센싱부(140), 출력부(150), 메모리(160), 인터페이스부(170), 프로세서(180), 및 전원 공급부(190)를 포함할 수 있다. 이와 같은 구성요소들은 실제 응용에서 구현될 때 필요에 따라 2 이상의 구성요소가 하나의 구성요소로 합쳐지거나, 혹은 하나의 구성요소가 2 이상의 구성요소로 세분되어 구성될 수 있다.
무선 통신부(110)는 방송수신 모듈(111), 이동통신 모듈(113), 무선 인터넷 모듈(115), 근거리 통신 모듈(117), 및 GPS 모듈(119) 등을 포함할 수 있다.
방송수신 모듈(111)은 방송 채널을 통하여 외부의 방송관리 서버로부터 방송 신호 및 방송관련 정보 중 적어도 하나를 수신한다. 이때, 방송 채널은 위성 채널, 지상파 채널 등을 포함할 수 있다. 방송관리 서버는, 방송 신호 및 방송 관련 정보 중 적어도 하나를 생성하여 송신하는 서버나, 기 생성된 방송 신호 및 방송관련 정보 중 적어도 하나를 제공받아 단말기에 송신하는 서버를 의미할 수 있다.
방송 신호는, TV 방송 신호, 라디오 방송 신호, 데이터 방송 신호를 포함할 뿐만 아니라, TV 방송 신호 또는 라디오 방송 신호에 데이터 방송 신호가 결합한 형태의 방송 신호도 포함할 수 있다. 방송관련 정보는, 방송 채널, 방송 프로그램 또는 방송 서비스 제공자에 관련한 정보를 의미할 수 있다. 방송관련 정보는, 이동통신망을 통하여도 제공될 수 있으며, 이 경우에는 이동통신 모듈(113)에 의해 수신될 수 있다. 방송관련 정보는 다양한 형태로 존재할 수 있다.
방송수신 모듈(111)은, 각종 방송 시스템을 이용하여 방송 신호를 수신하는데, 특히, DMB-T(Digital Multimedia Broadcasting-Terrestrial), DMB-S(Digital Multimedia Broadcasting-Satellite), MediaFLO(Media Forward Link Only), DVB-H(Digital Video Broadcast-Handheld), ISDB-T(Integrated Services Digital Broadcast-Terrestrial) 등의 디지털 방송 시스템을 이용하여 디지털 방송 신호를 수신할 수 있다. 또한, 방송수신 모듈(111)은, 이와 같은 디지털 방송 시스템뿐만 아니라 방송 신호를 제공하는 모든 방송 시스템에 적합하도록 구성될 수 있다. 방송수신 모듈(111)을 통해 수신된 방송 신호 및/또는 방송 관련 정보는 메모리(160)에 저장될 수 있다.
이동통신 모듈(113)은, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 여기서, 무선 신호는, 음성 호 신호, 화상 통화 호 신호, 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.
무선 인터넷 모듈(115)은 무선 인터넷 접속을 위한 모듈을 말하는 것으로, 무선 인터넷 모듈(115)은 이동 단말기(100)에 내장되거나 외장될 수 있다. 무선 인터넷 기술로는 WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 등이 이용될 수 있다.
근거리 통신 모듈(117)은 근거리 통신을 위한 모듈을 말한다. 근거리 통신 기술로 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), 지그비(ZigBee), NFC(Near Field Communication) 등이 이용될 수 있다.
GPS(Global Position System) 모듈(119)은 복수 개의 GPS 인공위성으로부터 위치 정보를 수신한다.
A/V(Audio/Video) 입력부(120)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 이에는 카메라(121)와 마이크(123) 등이 포함될 수 있다. 카메라(121)는 화상 통화모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 그리고, 처리된 화상 프레임은 디스플레이(151)에 표시될 수 있다.
카메라(121)에서 처리된 화상 프레임은 메모리(160)에 저장되거나 무선 통신부(110)를 통하여 외부로 전송될 수 있다. 카메라(121)는 단말기의 구성 태양에 따라 2개 이상이 구비될 수도 있다.
마이크(123)는, 오디오 수신 모드, 예를 들어, 통화모드, 녹음모드, 또는 음성인식 모드 등에서 마이크로폰(Microphone)에 의해 외부의 오디오 신호를 입력받아 전기적인 음성 데이터로 처리한다. 그리고, 처리된 음성 데이터는 통화 모드인 경우 이동통신 모듈(113)을 통하여 이동통신 기지국으로 송신 가능한 형태로 변환되어 출력될 수 있다. 마이크 (123)는 외부의 오디오 신호를 입력받는 과정에서 발생하는 잡음(noise)를 제거하기 위한 다양한 잡음 제거 알고리즘이 사용될 수 있다.
한편, 마이크(123)는, 서로 다른 위치에, 복수개로서 배치될 수 있다. 각 마이크에서 수신되는 오디오 신호는 프로세서(180) 등에서 오디오 신호 처리될 수 있다.
사용자 입력부(130)는 사용자가 단말기의 동작 제어를 위하여 입력하는 키 입력 데이터를 발생시킨다. 사용자 입력부(130)는 사용자의 누름 또는 터치 조작에 의해 명령 또는 정보를 입력받을 수 있는 키 패드(key pad), 돔 스위치(dome switch), 터치 패드(정압/정전) 등으로 구성될 수 있다. 또한, 사용자 입력부(130)는 키를 회전시키는 조그 휠 또는 조그 방식이나 조이스틱과 같이 조작하는 방식이나, 핑거 마우스 등으로 구성될 수 있다. 특히, 터치 패드가 후술하는 디스플레이(151)와 상호 레이어 구조를 이룰 경우, 이를 터치스크린(touch screen)이라 부를 수 있다.
센싱부(140)는 이동 단말기(100)의 개폐 상태, 이동 단말기(100)의 위치, 사용자 접촉 유무 등과 같이 이동 단말기(100)의 현 상태를 감지하여 이동 단말기(100)의 동작을 제어하기 위한 센싱 신호를 발생시킨다. 예를 들어 이동 단말기(100)가 슬라이드 폰 형태인 경우 슬라이드 폰의 개폐 여부를 센싱할 수 있다. 또한, 전원 공급부(190)의 전원 공급 여부, 인터페이스부(170)의 외부 기기 결합 여부 등과 관련된 센싱 기능을 담당할 수 있다.
센싱부(140)는 근접센서(141), 압력센서(143), 및 모션 센서(145) 등을 포함할 수 있다. 근접센서(141)는 이동 단말기(100)로 접근하는 물체나, 이동 단말기(100)의 근방에 존재하는 물체의 유무 등을 기계적 접촉이 없이 검출할 수 있도록 한다. 근접센서(141)는, 교류자계의 변화나 정자계의 변화를 이용하거나, 혹은 정전용량의 변화율 등을 이용하여 근접물체를 검출할 수 있다. 근접센서(141)는 구성 태양에 따라 2개 이상이 구비될 수 있다.
압력센서(143)는 이동 단말기(100)에 압력이 가해지는지 여부와, 그 압력의 크기 등을 검출할 수 있다. 압력센서(143)는 사용환경에 따라 이동 단말기(100)에서 압력의 검출이 필요한 부위에 설치될 수 있다. 만일, 압력센서(143)가 디스플레이(151)에 설치되는 경우, 압력센서(143)에서 출력되는 신호에 따라, 디스플레이(151)를 통한 터치 입력과, 터치 입력보다 더 큰 압력이 가해지는 압력터치 입력을 식별할 수 있다. 또한, 압력센서(143)에서 출력되는 신호에 따라, 압력터치 입력시 디스플레이(151)에 가해지는 압력의 크기도 알 수 있다.
모션 센서(145)는 가속도 센서, 자이로 센서 등을 이용하여 이동 단말기(100)의 위치나 움직임 등을 감지한다. 모션 센서(145)에 사용될 수 있는 가속도 센서는 어느 한 방향의 가속도 변화에 대해서 이를 전기 신호로 바꾸어 주는 소자로서, MEMS(micro-electromechanical systems) 기술의 발달과 더불어 널리 사용되고 있다.
가속도 센서에는, 자동차의 에어백 시스템에 내장되어 충돌을 감지하는데 사용하는 큰 값의 가속도를 측정하는 것부터, 사람 손의 미세한 동작을 인식하여 게임 등의 입력 수단으로 사용하는 미세한 값의 가속도를 측정하는 것까지 다양한 종류가 있다. 가속도 센서는 보통 2축이나 3축을 하나의 패키지에 실장하여 구성되며, 사용 환경에 따라서는 Z축 한 축만 필요한 경우도 있다. 따라서, 어떤 이유로 Z축 방향 대신 X축 또는 Y축 방향의 가속도 센서를 써야 할 경우에는 별도의 조각 기판을 사용하여 가속도 센서를 주 기판에 세워서 실장할 수도 있다.
또한, 자이로 센서는 각속도를 측정하는 센서로서, 기준 방향에 대해 돌아간 방향을 감지할 수 있다.
출력부(150)는 오디오 신호 또는 비디오 신호 또는 알람(alarm) 신호의 출력을 위한 것이다. 출력부(150)에는 디스플레이(151), 음향출력 모듈(153), 알람부(155), 및 햅틱 모듈(157) 등이 포함될 수 있다.
디스플레이(151)는 이동 단말기(100)에서 처리되는 정보를 표시 출력한다. 예를 들어 이동 단말기(100)가 통화 모드인 경우 통화와 관련된 UI(User Interface) 또는 GUI(Graphic User Interface)를 표시한다. 그리고 이동 단말기(100)가 화상 통화 모드 또는 촬영 모드인 경우, 촬영되거나 수신된 영상을 각각 혹은 동시에 표시할 수 있으며, UI, GUI를 표시한다.
한편, 전술한 바와 같이, 디스플레이(151)와 터치패드가 상호 레이어 구조를 이루어 터치스크린으로 구성되는 경우, 디스플레이(151)는 출력 장치 이외에 사용자의 터치에 의한 정보의 입력이 가능한 입력 장치로도 사용될 수 있다.
만일, 디스플레이(151)가 터치스크린으로 구성되는 경우, 터치스크린 패널, 터치스크린 패널 제어기 등을 포함할 수 있다. 이 경우, 터치스크린 패널은 외부에 부착되는 투명한 패널로서, 이동 단말기(100)의 내부 버스에 연결될 수 있다. 터치스크린 패널은 접촉 결과를 주시하고 있다가, 터치입력이 있는 경우 대응하는 신호들을 터치스크린 패널 제어기로 보낸다. 터치스크린 패널 제어기는 그 신호들을 처리한 다음 대응하는 데이터를 프로세서(180)로 전송하여, 프로세서(180)가 터치입력이 있었는지 여부와 터치스크린의 어느 영역이 터치 되었는지 여부를 알 수 있도록 한다.
디스플레이(151)는 전자종이(e-Paper)로 구성될 수도 있다. 전자종이(e-Paper)는 일종의 반사형 디스플레이로서, 기존의 종이와 잉크처럼 높은 해상도, 넓은 시야각, 밝은 흰색 배경으로 우수한 시각 특성을 가진다. 전자종이(e-Paper)는 플라스틱, 금속, 종이 등 어떠한 기판상에도 구현이 가능하고, 전원을 차단한 후에도 화상이 유지되고 백라이트(back light) 전원이 없어 이동 단말기(100)의 배터리 수명이 오래 유지될 수 있다. 전자종이로는 정전화가 충전된 반구형 트위스트 볼을 이용하거나, 전기영동법 및 마이크로 캡슐 등을 이용할 수 있다.
이외에도 디스플레이(151)는 액정 디스플레이(liquid crystal display), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display) 중에서 적어도 하나를 포함할 수도 있다. 그리고, 이동 단말기(100)의 구현 형태에 따라 디스플레이(151)가 2개 이상 존재할 수도 있다. 예를 들어, 이동 단말기(100)에 외부 디스플레이(미도시)와 내부 디스플레이(미도시)가 동시에 구비될 수 있다.
음향출력 모듈(153)은 호 신호 수신, 통화 모드 또는 녹음 모드, 음성인식 모드, 방송수신 모드 등에서 무선 통신부(110)로부터 수신되거나 메모리(160)에 저장된 오디오 데이터를 출력한다. 또한, 음향출력 모듈(153)은 이동 단말기(100)에서 수행되는 기능, 예를 들어, 호 신호 수신음, 메시지 수신음 등과 관련된 오디오 신호를 출력한다. 이러한 음향출력 모듈(153)에는 스피커(speaker), 버저(Buzzer) 등이 포함될 수 있다.
알람부(155)는 이동 단말기(100)의 이벤트 발생을 알리기 위한 신호를 출력한다. 이동 단말기(100)에서 발생하는 이벤트의 예로는 호 신호 수신, 메시지 수신, 키 신호 입력 등이 있다. 알람부(155)는 오디오 신호나 비디오 신호 이외에 다른 형태로 이벤트 발생을 알리기 위한 신호를 출력한다. 예를 들면, 진동 형태로 신호를 출력할 수 있다. 알람부(155)는 호 신호가 수신되거나 메시지가 수신된 경우, 이를 알리기 위해 신호를 출력할 수 있다. 또한, 알람부(155)는 키 신호가 입력된 경우, 키 신호 입력에 대한 피드백으로 신호를 출력할 수 있다. 이러한 알람부(155)가 출력하는 신호를 통해 사용자는 이벤트 발생을 인지할 수 있다. 이동 단말기(100)에서 이벤트 발생 알림을 위한 신호는 디스플레이(151)나 음향출력 모듈(153)를 통해서도 출력될 수 있다.
햅틱 모듈(haptic module)(157)은 사용자가 느낄 수 있는 다양한 촉각 효과를 발생시킨다. 햅틱 모듈(157)이 발생시키는 촉각 효과의 대표적인 예로는 진동 효과가 있다. 햅틱 모듈(157)이 촉각 효과로 진동을 발생시키는 경우, 햅택 모듈(157)이 발생하는 진동의 세기와 패턴 등은 변환가능하며, 서로 다른 진동을 합성하여 출력하거나 순차적으로 출력할 수도 있다.
햅틱 모듈(157)은 진동 외에도, 접촉 피부 면에 대해 수직 운동하는 핀 배열에 의한 자극에 의한 효과, 분사구나 흡입구를 통한 공기의 분사력이나 흡입력을 통한 자극에 의한 효과, 피부 표면을 스치는 자극에 의한 효과, 전극(eletrode)의 접촉을 통한 자극에 의한 효과, 정전기력을 이용한 자극에 의한 효과, 흡열이나 발열이 가능한 소자를 이용한 냉/온감 재현에 의한 효과 등 다양한 촉각 효과를 발생시킬 수 있다. 햅틱 모듈(157)은 직접적인 접촉을 통해 촉각 효과의 전달할 수 있을 뿐만 아니라, 사용자의 손가락이나 팔 등의 근감각을 통해 촉각 효과를 느낄 수 있도록 구현할 수도 있다. 햅틱 모듈(157)은 이동 단말기(100)의 구성 태양에 따라 2개 이상이 구비될 수 있다.
메모리(160)는 프로세서(180)의 처리 및 제어를 위한 프로그램이 저장될 수도 있고, 입력되거나 출력되는 데이터들(예를 들어, 폰북, 메시지, 정지영상, 동영상 등)의 임시 저장을 위한 기능을 수행할 수도 있다.
메모리(160)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램, 롬 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 또한, 이동 단말기(100)는 인터넷(internet)상에서 메모리(150)의 저장 기능을 수행하는 웹 스토리지(web storage)를 운영할 수도 있다.
인터페이스부(170)는 이동 단말기(100)에 연결되는 모든 외부기기와의 인터페이스 역할을 수행한다. 이동 단말기(100)에 연결되는 외부기기의 예로는, 유/무선 헤드셋, 외부 충전기, 유/무선 데이터 포트, 메모리 카드(Memory card), SIM(Subscriber Identification Module) 카드, UIM(User Identity Module) 카드 등과 같은 카드 소켓, 오디오 I/O(Input/Output) 단자, 비디오 I/O(Input/Output) 단자, 이어폰 등이 있다. 인터페이스부(170)는 이러한 외부 기기로부터 데이터를 전송받거나 전원을 공급받아 이동 단말기(100) 내부의 각 구성 요소에 전달할 수 있고, 이동 단말기(100) 내부의 데이터가 외부 기기로 전송되도록 할 수 있다.
인터페이스부(170)는 이동 단말기(100)가 외부 크래들(cradle)과 연결될 때 연결된 크래들로부터의 전원이 이동 단말기(100)에 공급되는 통로가 되거나, 사용자에 의해 크래들에서 입력되는 각종 명령 신호가 이동 단말기(100)로 전달되는 통로가 될 수 있다.
프로세서(180)는 통상적으로 상기 각부의 동작을 제어하여 이동 단말기(100)의 전반적인 동작을 제어한다. 예를 들어 음성 통화, 데이터 통신, 화상 통화 등을 위한 관련된 제어 및 처리를 수행한다. 또한, 프로세서(180)는 멀티 미디어 재생을 위한 멀티미디어 재생 모듈(181)을 구비할 수도 있다. 멀티미디어 재생 모듈(181)은 프로세서(180) 내에 하드웨어로 구성될 수도 있고, 프로세서(180)와 별도로 소프트웨어로 구성될 수도 있다. 한편, 프로세서(180)는, 애플리케이션 구동을 위한 애플리케이션 프로세서(미도시)를 구비할 수 있다. 또는 애플리케이션 프로세서(미도시)는 프로세서(180)와 별도로 마련되는 것도 가능하다.
그리고, 전원 공급부(190)는 프로세서(180)의 제어에 의해 외부의 전원, 내부의 전원을 인가받아 각 구성요소들의 동작에 필요한 전원을 공급한다.
이와 같은 구성의 이동 단말기(100)는 유무선 통신 시스템 및 위성 기반 통신 시스템을 포함하여, 프레임(frame) 또는 패킷(packet)을 통하여 데이터(data)를 전송할 수 있는 통신 시스템에서 동작 가능하도록 구성될 수 있다.
도 3은 도 2의 이동 단말기를 전면에서 바라본 사시도이고, 도 4는 도 3에 도시한 이동 단말기의 후면 사시도이다. 이하에서는 도 3 및 도 4를 참조하여, 본 발명과 관련된 이동 단말기를 외형에 따른 구성요소 관점에서 살펴 보기로 한다. 또한, 이하에서는 설명의 편의상, 폴더 타입, 바 타입, 스윙타입, 슬라이더 타입 등과 같은 여러 타입의 이동 단말기들 중에서 전면 터치스크린이 구비되어 있는, 바 타입의 이동 단말기를 예로 들어 설명한다. 그러나, 본 발명은 바 타입의 이동 단말기에 한정되는 것은 아니고 전술한 타입을 포함한 모든 타입의 이동 단말기에 적용될 수 있다.
도 3을 참조하면, 이동 단말기(100)의 외관을 이루는 케이스는, 프론트 케이스(100-1)와 리어 케이스(100-2)에 의해 형성된다. 프론트 케이스(100-1)와 리어 케이스(100-2)에 의해 형성된 공간에는 각종 전자부품들이 내장된다.
본체, 구체적으로 프론트 케이스(100-1)에는 디스플레이(151), 제1 음향출력모듈(153a), 제1 카메라(121a), 및 제1 내지 제3 사용자 입력부(130a, 130b, 130c)가 배치될 수 있다. 그리고, 리어 케이스(100-2)의 측면에는 제4 사용자 입력부(130d), 제5 사용자 입력부(130e), 및 제1 내지 제3 마이크(123a, 123b, 123c)가 배치될 수 있다.
디스플레이(151)는 터치패드가 레이어 구조로 중첩됨으로써, 디스플레이(151)가 터치스크린으로 동작하여 사용자의 터치에 의한 정보의 입력이 가능하도록 구성할 수도 있다.
제1 음향출력 모듈(153a)은 리시버 또는 스피커의 형태로 구현될 수 있다. 제1 카메라(121a)는 사용자 등에 대한 이미지 또는 동영상을 촬영하기에 적절한 형태로 구현될 수 있다. 그리고, 마이크(123)는 사용자의 음성, 기타 소리 등을 입력받기 적절한 형태로 구현될 수 있다.
제1 내지 제5 사용자 입력부(130a, 130b, 130c, 130d, 130e)와 후술하는 제6 및 제7 사용자 입력부(130f, 130g)는 사용자 입력부(130)라 통칭할 수 있으며, 사용자가 촉각적인 느낌을 주면서 조작하게 되는 방식(tactile manner)이라면 어떤 방식이든 채용될 수 있다.
예를 들어, 사용자 입력부(130)는 사용자의 누름 또는 터치 조작에 의해 명령 또는 정보를 입력받을 수 있는 돔 스위치 또는 터치 패드로 구현되거나, 키를 회전시키는 휠 또는 조그 방식이나 조이스틱과 같이 조작하는 방식 등으로도 구현될 수 있다. 기능적인 면에서, 제1 내지 제3 사용자 입력부(130a, 130b, 130c)는 시작, 종료, 스크롤 등과 같은 명령을 입력하기 위한 것이고, 제4 사용자 입력부(130d)는 동작 모드의 선택 등을 입력하기 위한 것이다. 또한, 제5 사용자 입력부(130e)는 이동 단말기(100) 내의 특수한 기능을 활성화하기 위한 핫 키(hot-key)로서 작동할 수 있다.
제1 내지 제2 마이크(123a, 123b)는, 리어 케이스(100-2)의 상측, 즉, 이동 단말기(100)의 상측에, 오디오 신호 수집을 위해 배치되며, 제3 마이크(123c)는, 리어 케이스(100-2)의 하측, 즉, 이동 단말기(100)의 하측에, 오디오 신호 수집을 위해 배치될 수 있다.
도 4를 참조하면, 리어 케이스(100-2)의 후면에는 제2 카메라(121b), 및 제4 마이크(123d)가 추가로 장착될 수 있으며, 리어 케이스(100-2)의 측면에는 제6 및 제7 사용자 입력부(130f, 130g)와, 인터페이스부(170)가 배치될 수 있다.
제2 카메라(121b)는 제1 카메라(121a)와 실질적으로 반대되는 촬영 방향을 가지며, 제1 카메라(121a)와 서로 다른 화소를 가질 수 있다. 제2 카메라(121b)에 인접하게는 플래쉬(미도시)와 거울(미도시)이 추가로 배치될 수도 있다. 또한, 제2 카메라(121b) 인접하게 다른 카메라를 더 설치하여 3차원 입체 영상의 촬영을 위해 사용할 수도 있다.
플래쉬는 제2 카메라(121b)로 피사체를 촬영하는 경우에 상기 피사체를 향해 빛을 비추게 된다. 거울은 사용자가 제2 카메라(121b)를 이용하여 자신을 촬영(셀프 촬영)하고자 하는 경우에, 사용자 자신의 얼굴 등을 비춰볼 수 있게 한다.
리어 케이스(100-2)에는 제2 음향출력 모듈(미도시)가 추가로 배치될 수도 있다. 제2 음향출력 모듈은 제1 음향출력 모듈(153a)와 함께 스테레오 기능을 구현할 수 있으며, 스피커폰 모드로 통화를 위해 사용될 수도 있다.
인터페이스부(170)는 외부 기기와 데이터가 교환되는 통로로 사용될 수 있다. 그리고, 프론트 케이스(100-1) 및 리어 케이스(100-2)의 일 영역에는 통화 등을 위한 안테나 외에 방송신호 수신용 안테나(미도시)가 배치될 수 있다. 안테나는 리어 케이스(100-2)에서 인출 가능하게 설치될 수 있다.
리어 케이스(100-2) 측에는 이동 단말기(100)에 전원을 공급하기 위한 전원공급부(190)가 장착될 수 있다. 전원공급부(190)는, 예를 들어 충전 가능한 배터리로서, 충전 등을 위하여 리어 케이스(100-2)에 착탈 가능하게 결합될 수 있다.
제4 마이크(123d)는, 리어 케이스(100-2)의 전면, 즉, 이동 단말기(100)의 뒷면에, 오디오 신호 수집을 위해 배치될 수 있다.
한편, 본 실시 예에서, 제2 카메라(121b) 등이 리어 케이스(100-2)에 배치되는 것으로 설명하였으나, 반드시 이에 제한되는 것은 아니다. 또한, 제2 카메라(121b)가 별도로 구비되지 않더라도, 제1 카메라(121a)를 회전 가능하게 형성되어 제2 카메라(121b)의 촬영 방향까지 촬영 가능하도록 구성될 수도 있다.
도 5a 내지 도 5c는 본 발명과 관련한, 오디오 빔포밍시 활용되는 요소들을 예시하는 도면이다.
먼저, 도 5a는, 이동 단말기(100)의 오디오 수신 모드에서, 카메라(121a)가 활성화되어, 화자(50)를 촬영한 촬영 이미지(500)를 획득하는 것을 예시한다. 특히, 도 5a는 오디오 수신 모드 중 스피커 모드(speaker mode)로 동작하는 것을 예시한다. 이에 따라, 이동 단말기(100)는, 스피커 모드를 나타내는 오브젝트(535)를 포함하는 스피커 모드 화면(530)을 표시할 수 있다.
다음, 도 5b는, 이동 단말기(100)의 이동시, 모션 센서(145)로부터 x,y,z 축의 위치 정보(Ip), 회전 등의 움직임에 따른 (가)속도 정보(Om)을 포함하는 모션 정보(Imot)를 획득하는 것을 예시한다.
다음, 도 5c는, 이동 단말기(100)의 오디오 수신 모드, 특히, 스피커 모드(speaker mode)에서, 화자(50)가 음성(Va)을 출력하는 경우, 각 마이크(123a,123b,123c,123d)에서, 각각 해당 오디오 신호(Vm1,Vm2,Vm3,Vm4)를 수집하는 것을 예시한다.
본 발명의 실시예에 따르면, 복수개의 마이크(123a,123b,123c,123d)를 구비하는 이동 단말기(100)에서, 최적의 오디오 신호 수집을 위해, 화자의 위치, 움직임, 이동 단말기의 움직임 등을 고려하여, 오디오 빔을 형성한다. 이를 위해, 도 5a 내지 도 5c는에서 도시한 바와 같이, 카메라(121)로부터 획득한 촬영 이미지, 모션 센서(145)로부터 획득한 모션 정보(Imot), 각 마이크(123a,123b,123c,123d)에서, 수집되는 오디오 신호 중 적어도 하나에 기초하여, 오디오 빔을 형성할 수 있다.
도 5d는 본 발명과 관련한 오디오 빔포밍 처리를 위한 간략한 블록도를 도시한다. 도면을 참조하면, 영상표시장치(100) 내에, 오디오 빔 형성 등을 위한 빔 처리부(175)가 구비될 수 있다.
빔 처리부(175)는, 카메라(121)로부터 획득한 촬영 이미지, 모션 센서(145)로부터 획득한 모션 정보(Imot), 각 마이크(123a,123b,123c,123d)에서, 수집되는 오디오 신호를 수신할 수 있다.
일예로, 빔 처리부(175)는, 이동 단말기와 화자가 이동 없이 고정된 경우, 모션 센서(145)로부터 움직임이 포착되지 않으므로, 화자를 촬영한 이미지, 특히, 화자의 입 위치에 기초하여, 오디오 빔 형성을 완료할 수 있다.
다른 예로, 빔 처리부(175)는, 이동 단말기는 고정이고, 화자가 이동하는 경우, 이동된 화자를 촬영한 촬영 이미지에 기초하거나, 이동된 화자를 촬영한 촬영 이미지, 및 수신되는 오디오 신호에 기초하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성할 수 있다.
또 다른 예로, 빔 처리부(175)는, 이동 단말기가 이동하는 경우, 이동된 화자를 촬영한 촬영 이미지, 및 수신되는 오디오 신호에 기초에 기초하거나, 이동된 화자를 촬영한 촬영 이미지, 모션 센서로부터의 이동 단말기의 움직임 정보, 및 수신되는 오디오 신호에 기초하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성할 수 있다.
또 다른 예로, 빔 처리부(175)는, 이동 단말기에 대해, 복수의 화자가 위치하는 경우, 각 화자의 위치에 대응하는, 복수의 오디오 빔을 형성할 수 있다.
또 다른 예로, 빔 처리부(175)는, 복수의 화자가 위치한 상태에서, 이미 오디오 빔이 형성된 화자 외의 다른 화자의 오디오 신호 입력이 있는 경우, 카메라로부터의 촬영 이미지, 및 다른 화자로부터의 오디오 신호에 기초하여, 제2 오디오 빔을 형성할 수 있다.
빔 처리부(175) 또는 프로세서(180)는 형성된 오디오 빔을 바탕으로, 오디오 수신 모드에서, 각 마이크(123a,123b,123c,123d)에서, 수집되는 오디오 신호의 신호 처리를 수행할 수 있다. 예를 들어, 오디오 빔의 대역폭, 대역에 따른 매그니튜드(magnitude) 설정값에 따라, 수신되는 오디오 신호의 매그니튜드(magnitude)를 조정하거나, 위상값(phase)을 조정할 수 있다.
한편, 스피커 모드에서, 음량 출력 모듈(153)은, 형성된 오디오 빔에 따라 수신되어 신호 처리된 오디오 신호를 출력할 수 있다.
한편, 도 5d는, 빔 처리부(175)가 프로세서(180)와 별도인 것을 예시하나, 빔 처리부(175)가 프로세서(180) 내에 구비되는 것도 가능하다.
도 6은 본 발명의 일 실시예에 따른 이동 단말기의 동작 방법을 보여주는 순서도이고, 도 7a 내지 도 15c는 도 6의 이동 단말기의 동작 방법의 다양한 예를 설명하기 위해 참조되는 도면이다.
먼저, 도 6을 참조하면, 이동 단말기(100)는, 오디오 수신 모드에서, 카메라를 통해 촬영되는 촬영 이미지를 수신한다(S610). 그리고, 모션 센서로부터 모션 정보를 수신한다(S630).
이동 단말기(100)는, 오디오 수신 모드에서, 카메라(121), 모션 센서(145) 복수의 마이크(123a,123b,123c,123d)를 활성화시킬 수 있다. 그리고, 이동 단말기(100)는, 촬영되는 이미지, 센싱되는 위치 정보, 속도 정보 등의 모션 정보를 수신한다.
다음, 촬영 이미지와 모션 정보 중 적어도 하나에 기초하여, 화자 위치를 결정한다(S640). 그리고, 화자의 위치에 대응하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성한다(S650).
이동 단말기(100) 내의 빔 처리부(175)는, 카메라(121)로부터 획득한 촬영 이미지, 모션 센서(145)로부터 획득한 모션 정보(Imot), 각 마이크(123a,123b,123c,123d)에서, 수집되는 오디오 신호를 수신할 수 있다.
그리고, 빔 처리부(175)는, 도 5d에 대한 설명에서 기술한 다양한 예와 같이, 카메라(121)로부터 획득한 촬영 이미지, 모션 센서(145)로부터 획득한 모션 정보(Imot), 각 마이크(123a,123b,123c,123d)에서, 수집되는 오디오 신호 중 적어도 하나에 기초하여, 오디오 빔(audio beam)을 형성할 수 있다.
예를 들어, 이동 단말기(100)를 기준으로, 화자(50)가 정면에 위치하는 경우, 이동 단말기(100) 주변의 오디오 필드에서, 화자(50)가 위치하는 각도에서의, 매그니튜드(magnitude)가 가장 크도록 설정하고, 다른 각도는 점차 작아지는 매그니튜드를 가지도록 설정할 수 있다.
다른 예로, 이동 단말기(100)를 기준으로, 화자(50)가 정면이 아닌, 대략 15도 각도에 위치하는 경우, 이동 단말기(100) 주변의 오디오 필드에서, 화자가 위치하는, 대략 15도 각도에서의, 매그니튜드(magnitude)가 가장 크도록 설정하고, 대략 15도 각도를 중심으로 다른 각도는 점차 작아지는 매그니튜드를 가지도록 설정할 수 있다.
다음, 복수의 마이크를 통해, 화자로부터 오디오 신호를 수신한다(S660). 그리고 형성된 오디오 빔에 기초하여, 수신되는 오디오 신호를 신호 처리한다(S670).
이동 단말기(100)는, 각 마이크(123a,123b,123c,123d)를 통해, 화자가 음성을 출력하는 경우, 화자로부터의 오디오 신호를 수신할 수 있다.
그리고, 이동 단말기(100) 내의 빔 처리부(175) 또는 프로세서(180)는, 형성된 오디오 빔을 바탕으로, 오디오 수신 모드에서, 각 마이크(123a,123b,123c,123d)에서, 수집되는 오디오 신호의 신호 처리를 수행할 수 있다. 예를 들어, 오디오 빔의 대역폭, 대역에 따른 매그니튜드(magnitude) 설정값에 따라, 수신되는 오디오 신호의 매그니튜드(magnitude)를 조정하거나, 위상값(phase)을 조정할 수 있다.
이에 의해, 화자(50)의 위치에 대응하여, 최적의 오디오 신호를 수신할 수 있게 되며, 따라서, 사용자의 이용 편의성을 향상시킬 수 있게 된다.
이하에서는, 도 7a 내지 도 12f를 참조하여, 도 6의 다양한 동작방법의 다양한 예를 설명한다.
도 7a는, 이동 단말기와 화자가 이동 없이 고정된 경우, 이동 단말기(100)의 오디오 수신 모드에서, 카메라(121a)가 활성화되어, 화자(50)를 촬영한 촬영 이미지(500)를 획득하는 것을 예시한다. 특히, 도 7a는 오디오 수신 모드 중 스피커 모드(speaker mode)로 동작하는 것을 예시한다. 이에 따라, 이동 단말기(100)는, 스피커 모드를 나타내는 오브젝트(535)를 포함하는 스피커 모드 화면(530)을 표시할 수 있다.
이동 단말기(100) 내의 빔 처리부(175)는, 화자(50)를 촬영한 촬영 이미지(500)에 기초하여, 화자(50)의 위치 정보를 연산할 수 있다. 특히, 촬영된 이미지(500) 내의 화자(510)의 입(520)의 위치 정보를 연산할 수 있다.
이러한 위치 정보는, 이동 단말기(100) 대비, 화자의 입의 위치 정보로서, x,y,z축 상의 위치 정보일 수 있다.
도 7b는, x,y,z축 공간상에, P 위치에, 화자, 특히 화자의 입이 위치하는 것을 예시한다.
이동 단말기(100) 내의 빔 처리부(175)는, 연산된 화자(50)의 위치 정보에 기초하여, 화자(50)로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성할 수 있다.
오디오 빔은, x,y,z 축 공간상에 배치되는, 화자의 위치에 대응하여 형성될 수 있다. 예를 들어, 오디오 빔은, x,y,z 축 기반의 직교 좌표계를 기준으로, 화자의 위치에 대응하는, 오디오 필드로 구현될 수 있다. 이러한 오디오 필드는, 위치(x,y,z 좌표)에 따른, 매그니튜드가 다른 것으로 설정될 수 있다.
다른 예로, 오디오 빔은, 이동 단말기를 중심으로, 거리 및 각도로 표현되는 회전 좌표계(cylindrical coordinates)를 기준으로, 화자의 위치에 대응하는 오디오 필드로 구현될 수 있다. 이하에서는, 회전 좌표계를 중심으로 기술한다.
도 8b는 회전 좌표계를 중심으로 한 오디오 빔(806)을 예시한다. 이동 단말기가 P0에 위치에 있고, 화자가 P1 위치에 있는 경우, 이동 단말기와 화자는 회전 좌표계 상에서, 90도(θ1)의 각도를 이루며, 그에 따라, 이동 단말기(100) 내의 빔 처리부(175)는, 도 8b와 같은, 오디오 빔(806)을 형성할 수 있다. 도면을 보면, 90도 각도에서의, 오디오 신호 처리를 위한 매그니튜드(Am1)가 가장 크고, 다른 각도에서는 순차적으로 작아지는 것을 알 수 있다.
도 8b의 오디오 빔(806)이 형성된 경우, 프로세서(180)는, 도 7c와 같이, 스피커 모드 화면(530)상에, 오디오 빔 형성 완료를 나타내는 오브젝트(710)를 표시할 수 있다. 이에 의해, 화자는, 오디오 빔 형성 완료를 인식할 수 있게 된다. 그리고, 오디오 빔 형성 완료와 함께, 음성을 출력할 수 있게 된다.
도 7d는 오디오 빔 형성 완료에 따라, 화자(50)가 음성(715)을 출력하는 것을 예시한다. 카메라(121a)는, 화자를 촬영한 이미지(502)를 획득할 수 있다. 이때 촬영된 이미지(502)는, 화자(512)의 개구된 입 이미지(522)를 포함한다.
빔 처리부(175) 또는 프로세서(180)는, 촬영된 이미지(502)와 마이크(123a,...,123d)를 통해 수신되는 오디오 신호에 기초하여, 화자가 오디오를 출력하고 있음을 파악할 수 있으며, 형성된 오디오 빔(806)에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다. 예를 들어, 이동 단말기(100)의 상측에 배치되는 마이크(123a,123b)에서 수신되는 오디오 신호의 게인(또는 매그니튜드)을 높게 설정하고, 이동 단말기(100)의 후면에 배치되는 마이크(123d)에서 수신되는 오디오 신호의 게인을 낮게 설정할 수 있다.
한편, 빔 처리부(175) 또는 프로세서(180)는, 형성된 오디오 빔에 따른, 신호 처리 후, 잡음 제거 등의 후처리를 수행할 수 있다. 이에 의해, 최적의 오디오 신호를 획득할 수 있게 된다.
한편, 프로세서(180)는, 도 7d와 같이, 스피커 모드 화면(530) 상에, 형성된 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(720)를 표시할 수 있다. 이에 의해, 오디오 수신 모드가 정상적으로 동작하고 있음을 파악할 수 있게 된다.
도 8a는, 이동 단말기는 고정이고, 화자가 좌측으로 이동(이동 단말기를 기준으로 우측으로 이동)하는 경우, 이동 단말기(100)의 오디오 수신 모드에서, 카메라(121a)가 활성화되어, 이동하는 화자(50)를 촬영한 촬영 이미지(501)를 획득하는 것을 예시한다.
도 7a 내지 도 7d에서, 90도 방향을 기준으로 오디오 빔(806)이 형성된 상태에서, 도 8a와 같이, 화자가 이동하는 경우, 오디오 빔을 업데이트할 필요가 발생한다.
이러한 경우, 프로세서(180)는, 이동하는 화자를 촬영한 이미지(501)를 기반으로, 화자 이동을 감지하고, 오디오 빔 미 형성을 나타내는 오브젝트(715)를 도면과 같이 표시하도록 제어할 수 있다.
그리고, 빔 처리부(175)는, 화자 이동에 대응하여, 오디오 빔을 업데이트한다.
이동 단말기(100) 내의 빔 처리부(175)는, 화자(50)를 촬영한 촬영 이미지(501)에 기초하여, 화자(50)의 위치 정보를 연산할 수 있다. 특히, 촬영된 이미지(501) 내의 화자(511)의 입(521)의 위치 정보를 연산할 수 있다.
화자(50)가 La 만큼 좌측으로 이동한 경우, 빔 처리부(175)는, 화자(50)를 촬영한 촬영 이미지(501)에 기초하여, 이동 단말기 대비 우측으로 이동한 것으로 판단하고, 도 8b와 같은 오디오 빔(808)을 형성할 수 있다.
이동 단말기가 P0에 위치에 있고, 화자가 P2 위치에 있는 경우, 이동 단말기와 화자는 회전 좌표계 상에서, 105도(θ2)의 각도를 이루며, 그에 따라, 이동 단말기(100) 내의 빔 처리부(175)는, 도 8b와 같은, 오디오 빔(808)을 형성할 수 있다. 도면을 보면, 105도 각도에서의, 오디오 신호 처리를 위한 매그니튜드(Am2)가 가장 크고, 다른 각도에서는 순차적으로 작아지는 것을 알 수 있다.
도 8b의 오디오 빔(808)이 형성된 경우, 프로세서(180)는, 도 8c와 같이, 스피커 모드 화면(530) 상에, 오디오 빔 형성 완료를 나타내는 오브젝트(710)를 표시할 수 있다. 이에 의해, 화자는, 화자 이동에 대응하는 오디오 빔 형성 완료를 인식할 수 있게 된다. 그리고, 오디오 빔 형성 완료와 함께, 음성을 출력할 수 있게 된다.
도 8d는 오디오 빔 형성 완료에 따라, 화자(50)가 음성(815)을 출력하는 것을 예시한다. 카메라(121a)는, 화자를 촬영한 이미지(501)를 획득할 수 있다. 이때 촬영된 이미지(501)는, 화자(511)의 개구된 입 이미지(522)를 포함한다.
빔 처리부(175) 또는 프로세서(180)는, 촬영된 이미지(501)와 마이크(123a,...,123d)를 통해 수신되는 오디오 신호에 기초하여, 화자가 오디오를 출력하고 있음을 파악할 수 있으며, 형성된 오디오 빔(808)에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다. 예를 들어, 이동 단말기(100)의 상측에 배치되는 마이크 중 제2 마이크(123b) 보다 제1 마이크(123a)에서 수신되는 오디오 신호의 게인(또는 매그니튜드)을 더 높게 설정할 수 있다.
한편, 빔 처리부(175) 또는 프로세서(180)는, 형성된 오디오 빔에 따른, 신호 처리 후, 잡음 제거 등의 후처리를 수행할 수 있다. 이에 의해, 최적의 오디오 신호를 획득할 수 있게 된다.
한편, 프로세서(180)는, 도 8d와 같이, 스피커 모드 화면(530) 상에, 형성된 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(720)를 표시할 수 있다. 이에 의해, 오디오 수신 모드가 정상적으로 동작하고 있음을 파악할 수 있게 된다.
도 9a는 도 8a와 유사하나, 화자 이동이 아닌 이동 단말기의 이동에서 그 차이가 있다. 도 9a는 이동 단말기(100)가 우측으로 이동하는 경우, 이동 단말기(100)의 오디오 수신 모드에서, 카메라(121a)가 활성화되어, 이동하는 화자(50)를 촬영한 촬영 이미지(501)를 획득하는 것을 예시한다. 특히, 이동 단말기(100)가 La 만큼 우측으로 이동한 것을 예시한다.
도 7a 내지 도 7d에서, 90도 방향을 기준으로 오디오 빔(806)이 형성된 상태에서, 도 9a와 같이, 이동 단말기(100)가 이동하는 경우, 오디오 빔을 업데이트할 필요가 발생한다.
이러한 경우, 프로세서(180)는, 이동하는 화자를 촬영한 이미지(501), 및 모션 센서(145)의 모션 정보를 기반으로, 이동 단말기(100)의 이동을 감지하고, 오디오 빔 미 형성을 나타내는 오브젝트(715)를 도면과 같이 표시하도록 제어할 수 있다.
그리고, 빔 처리부(175)는, 이동 단말기(100)의 이동에 대응하여, 오디오 빔을 업데이트한다.
이동 단말기(100) 내의 빔 처리부(175)는, 화자(50)를 촬영한 촬영 이미지(501)에 기초하여, 화자(50)의 위치 정보를 연산할 수 있다. 특히, 촬영된 이미지(501) 내의 화자(511)의 입(521)의 위치 정보를 연산할 수 있다.
이동 단말기(100)가 La 만큼 우측으로 이동한 경우, 빔 처리부(175)는, 화자(50)를 촬영한 촬영 이미지(501), 및 모션 센서(145)에서 획득되는 우측 이동 정보를 포함하는 모션 정보에 기초하여, 도 8b와 같은 오디오 빔(808)을 형성할 수 있다.
도 8b의 오디오 빔(808)이 형성된 경우, 프로세서(180)는, 도 9b와 같이, 스피커 모드 화면(530) 상에, 오디오 빔 형성 완료를 나타내는 오브젝트(710)를 표시할 수 있다. 이에 의해, 화자는, 화자 이동에 대응하는 오디오 빔 형성 완료를 인식할 수 있게 된다. 그리고, 오디오 빔 형성 완료와 함께, 음성을 출력할 수 있게 된다.
도 9c는 오디오 빔 형성 완료에 따라, 화자(50)가 음성(915)을 출력하는 것을 예시한다. 카메라(121a)는, 화자를 촬영한 이미지(501)를 획득할 수 있다. 이때 촬영된 이미지(501)는, 화자(511)의 개구된 입 이미지(522)를 포함한다.
빔 처리부(175) 또는 프로세서(180)는, 촬영된 이미지(501)와 마이크(123a,...,123d)를 통해 수신되는 오디오 신호에 기초하여, 화자가 오디오를 출력하고 있음을 파악할 수 있으며, 형성된 오디오 빔(808)에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다. 예를 들어, 이동 단말기(100)의 상측에 배치되는 마이크 중 제2 마이크(123b) 보다 제1 마이크(123a)에서 수신되는 오디오 신호의 게인(또는 매그니튜드)을 더 높게 설정할 수 있다.
한편, 빔 처리부(175) 또는 프로세서(180)는, 형성된 오디오 빔에 따른, 신호 처리 후, 잡음 제거 등의 후처리를 수행할 수 있다. 이에 의해, 최적의 오디오 신호를 획득할 수 있게 된다.
한편, 프로세서(180)는, 도 9c와 같이, 스피커 모드 화면(530) 상에, 형성된 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(720)를 표시할 수 있다. 이에 의해, 오디오 수신 모드가 정상적으로 동작하고 있음을 파악할 수 있게 된다.
도 10a 내지 도 10d는 화자 정지시와 화자 이동시에 따른 오디오 빔을 비교 설명하기 위한 도면이다.
도 10a는, 화자 정지시(standing mode), 스피커 모드(speaker mode)로 동작하는 것을 예시한다. 상술한 바에 따라, 카메라(121a)에서 촬영된 이미지(100)에 기초하여, 도 10c와 같은, 오디오 빔을 형성할 수 있다.
도 10b는, 화자 이동시(walking mode), 스피커 모드(speaker mode)로 동작하는 것을 예시한다. 상술한 바에 따다라, 카메라(121a)에서 촬영된 이미지(100), 및 모션 센서(145)로부터의 모션 정보(Imot)에 기초하여, 도 10d와 같은, 오디오 빔을 형성할 수 있다.
도 10c의 오디오 빔(1030)과 도 10d의 오디오 빔(1040)을 비교하면, 화자 이동시의 오디오 빔의 대역폭이, 더 큰 것을 알 수 있다. 즉, 도 10d의 오디오 빔(1040)이 대부분의 각도에서, 일정한, 매그니튜드를 가지는 것을 알 수 있다. 도 10c는 특정 각도에서, 소정값 이상의 매그니튜드를 가지는 것을 알 수 있다. 한편, 화자 이동시의 오디오 빔의 최대 매그니튜드(Amy) 값이, 화자 정지시의 오디오 빔의 최대 매그니튜드(Amx) 값보다 더 큰 것이 바람직하다. 화자 이동시에는, 오디오 수집이 더 어려우므로, 매그니튜드를 더 크게 설정하는 것이 바람직하다.
도 11a 내지 도 11b는 화자가 이동 단말기를 쥐고 있는 경우와 테이블 상에 놓고 있는 경우를 비교 설명하기 위한 도면이다.
도 11a와 같이, 화자(50)가 손(55)으로 이동 단말기(100)를 들고 스피커 모드로 통화하는 경우와, 도 11b와 같이, 이동 단말기(100)가 테이블(1105) 상에 놓인 상태에서, 스피커 모드로 통화하는 경우, 모두, 카메라를 이용한 촬영 이미지(500,1100)에 기초하여, 오디오 빔을 형성할 수 있다. 이동 단말기(100)가 그립 센서(미도시)를 구비하는 경우, 이를 감지하고, 감지된 그립 정보, 및 촬영된 이미지에 기초하여, 오디오 빔을 형성할 수 있다. 도 11a의 경우, 이동 단말기(100)가 조금씩 흔들릴 수 있으므로, 도 11b의 경우 보다, 오디오 빔의 대역폭이 더 큰 것이 바람직하다. 즉, 도 11b에 따른 오디오 빔의 대역폭은, 도 10c에서 예시된 대역폭보다 더 작을 수 있다.
도 12a 내지 도 12f는, 복수의 화자가 있는 경우의 오디오 빔 형성을 설명하기 위해 참조되는 도면이다.
도 12a는 도 10a와 같이, 한 명의 화자(50)가, 이동 단말기(100)를 들고, 스피커 모드로 통화하는 경우, 한 명의 화자(50)를 중심으로 한 오디오 빔 형성이 완료된 것을 예시한다. 이동 단말기(100)는, 오디오 빔 형성 완료를 나타내는 오브젝트(710)를 표시할 수 있다. 빔 처리부(175)는, 카메라(121a)에서 촬영된 이미지(500)에 기초하여, 오디오 빔을 형성한다.
다음, 도 12b는, 복수의 화자(50a,50b)가 있는 경우, 어느 한 화자(50a)를 기준으로 오디오 빔 형성이 완료된 것을 예시한다. 이동 단말기(100)는, 오디오 빔 형성 완료를 나타내는 오브젝트(710)를 표시할 수 있다.
빔 처리부(175)는, 카메라(121a)에서 촬영된 이미지(500)에 기초하여, 오디오 빔을 형성한다. 특히, 빔 처리부(175)는, 이미지(500) 내의 복수의 화자 이미지(1220,1222) 중 중앙에 더 가까이 배치된 제1 화자(50a)를 파악하고, 해당하는 화자(50a)를 기준으로 오디오 빔을 형성할 수 있다.
도 12c는 오디오 빔 형성 완료에 따라, 제1 화자(50a)가 음성(1215)을 출력하는 것을 예시한다. 빔 처리부(175) 또는 프로세서(180)는, 촬영된 이미지(502)와 마이크(123a,...,123d)를 통해 수신되는 오디오 신호에 기초하여, 제1 화자(50a)가 오디오를 출력하고 있음을 파악할 수 있으며, 형성된 오디오 빔(도 12e의 806)에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다
한편, 프로세서(180)는, 도 12c와 같이, 스피커 모드 화면(530) 상에, 형성된 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(720)를 표시할 수 있다. 이에 의해, 오디오 수신 모드가 정상적으로 동작하고 있음을 파악할 수 있게 된다.
다음, 도 12d는, 제1 화자(50a)가 아닌 제2 화자(50b)가 음성(1216)을 출력하는 것을 예시한다.
빔 처리부(175) 또는 프로세서(180)는, 촬영된 이미지(1200) 중 제2 화자 이미지 내의 입(1224)가 개구된 경우, 및 형성된 오디오 빔에 적합하지 않은, 오디오 신호가, 마이크(121)를 통해 수신되는 경우, 오디오 빔을 재형성할 것을 결정할 수 있다.
그리고, 프로세서(180)는, 도 12d와 같이, 오디오 빔 가변 중임을 나타내는 오브젝트(1212)를 표시할 수 있다.
빔 처리부(175)는, 제2 화자(50b)가 음성(1216)을 출력하는 경우, 바로, 촬영된 이미지(1200)에서, 제2 화자(50b)의 위치와, 제2 화자(50b)로부터의 음성(1216)에 의한 오디오 신호에 기초하여, 제2 오디오 빔(도 12e의 806)을 생성한다. 즉, 제1 오디오 빔(도 12e의 806)에서, 제2 오디오 빔(도 12e의 809)으로 전환한다.
즉, 제2 화자(50b)는, 제1 화자(50a) 대비 우측에 위치하므로, 이동 단말기(100)와 제2 화자(50b)는 회전 좌표계 상에서, 75도(θ3)의 각도를 이루며, 그에 따라, 이동 단말기(100) 내의 빔 처리부(175)는, 도 12e와 같은, 오디오 빔(809)을 형성할 수 있다. 도면을 보면, 75도 각도에서의, 오디오 신호 처리를 위한 매그니튜드(Am3)가 가장 크고, 다른 각도에서는 순차적으로 작아지는 것을 알 수 있다.
다음, 도 12f는, 제2 오디오 빔 형성 완료에 따라, 제2 화자(50b)가 음성(1217)을 출력하는 것을 예시한다. 카메라(121a)는, 복수 화자를 촬영한 이미지(1200)를 획득할 수 있다. 이때 촬영된 이미지(1200)는, 제2 화자(1222)의 개구된 입 이미지(1224)를 포함한다.
빔 처리부(175) 또는 프로세서(180)는, 촬영된 이미지(1200)와 마이크(123a,...,123d)를 통해 수신되는 오디오 신호에 기초하여, 제2 화자(50b)가 오디오를 출력하고 있음을 파악할 수 있으며, 형성된 오디오 빔(809)에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다. 예를 들어, 이동 단말기(100)의 상측에 배치되는 마이크 중 제1 마이크(123a) 보다 제2 마이크(123b)에서 수신되는 오디오 신호의 게인(또는 매그니튜드)을 더 높게 설정할 수 있다.
한편, 빔 처리부(175) 또는 프로세서(180)는, 형성된 제2 오디오 빔에 따른, 신호 처리 후, 잡음 제거 등의 후처리를 수행할 수 있다. 이에 의해, 최적의 오디오 신호를 획득할 수 있게 된다.
한편, 프로세서(180)는, 도 8d와 같이, 스피커 모드 화면상에, 형성된 제2 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(720)를 표시할 수 있다. 이에 의해, 오디오 수신 모드가 정상적으로 동작하고 있음을 파악할 수 있게 된다.
한편, 도 12b에서와 달리, 복수의 화자에 대해, 각각의 위치 정보에 기초하여, 각각의 오디오 빔을 형성하는 것도 가능하다. 즉, 제1 화자(50a)에 대해, 제1 오디오 빔(도 12e의 806)을 형성하고, 제2 화자(50b)에 대해, 제2 오디오 빔(도 12e의 809)를 형성한 후, 음성을 출력하는 화자에 대해, 대응하는 오디오 빔을 선택하여, 적용하는 것이 가능하다.
즉, 도 12c와 같이, 제1 화자(50a)가 음성(1215)를 출력하는 경우, 촬영 이미지(1200), 수신되는 오디오 신호 등에 기초하여, 제1 화자(50a)를 위해 생성된 제1 오디오 빔을 바탕으로 수신되는 오디오 신호를 신호 처리하는 것이 가능하다.
또는, 도 12d나 도 12f와 같이, 제2 화자(50b)가 음성(1216 또는 1217)를 출력하는 경우, 촬영 이미지(1200), 수신되는 오디오 신호 등에 기초하여, 제2 화자(50b)를 위해 생성된 제2 오디오 빔을 바탕으로 수신되는 오디오 신호를 신호 처리하는 것이 가능하다. 이러한 방법은, 즉각적인 대응이 가능하므로, 오디오 신호 손실 없이, 대응하는 오디오 빔에 따라 신호 처리가 가능하다는 장점이 있다.
다음, 도 13a 내지 도 15c는, 오디오 수신 모드의 다른 예를 예시하는 도면이다.
오디오 수신 모드는, 통화 모드, 녹음모드, 또는 음성인식 모드를 포함할 수 있다. 특히, 통화 모드는, 스피커 모드를 포함할 수 있다. 도 7a 내지 도 12f는 통화 모드 중 스피커 모드를 중심으로 기술하였는데, 이하에서는 다른 모드에 대해 기술한다.
먼저, 도 13a는 음성 통화(voice talk) 모드를 예시한다. 이에 따라, 이동 단말기(100)는 음성 통화 모드를 나타내는 오브젝트(1435)를 포함하는 음성 통화 모드 화면(1430)을 표시할 수 있다. 이때, 카메라(121a)가 화자(50)를 촬영할 수 있으며, 촬영된 이미지에 기초하여, 오디오 빔을 형성할 수 있다. 도면에서는, 화자가 이동 단말기 화면을 보고 있는 것을 예시하나, 화자의 귀에, 이동 단말기가 부착되는 경우에도, 카메라(121a)가 활성화될 수 있으며, 화자의 귀 이미지에 기초하여, 오디오 빔을 형성할 수 있다.
다음, 도 13b는, 오디오 빔 형성이 완료되어, 오디오 빔 형성 완료를 나타내는 오브젝트(1413)가 표시되는 것을 예시한다. 한편, 도면과 달리, 오디오 빔 형성 완료를 나타내는 비프(beep)음 등의 오디오 신호가 출력되는 것도 가능하다.
다음, 도 13c는, 오디오 빔 형성 완료에 따라, 화자(50)가 음성(1415)을 출력하는 것을 예시한다. 이때, 빔 처리부(175) 또는 프로세서(180)는, 형성된 오디오 빔에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다. 한편, 이동 단말기(100)는, 형성된 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(1417)를 표시할 수 있다. 또는, 도면과 달리, 오디오 신호 처리가 정상 수행되고 있음을 나타내는 비프(beep)음 등의 오디오 신호가 출력되는 것도 가능하다. 한편, 카메라(121a)는, 계속하여, 화자를 촬영한 이미지(1401)를 획득할 수 있다. 이때 촬영된 이미지(1401)는, 화자 이미지(1411)의 개구된 입 이미지(1421)를 포함할 수 있다.
다음, 도 14a는 녹음(voice recording) 모드를 예시한다. 이에 따라, 이동 단말기(100)는 녹음 모드를 나타내는 오브젝트(1535)를 포함하는 녹음 모드 화면(1530)을 표시할 수 있다. 이때, 카메라(121a)가 화자(50)를 촬영할 수 있으며, 촬영된 이미지에 기초하여, 오디오 빔을 형성할 수 있다.
다음, 도 14b는, 오디오 빔 형성이 완료되어, 오디오 빔 형성 완료를 나타내는 오브젝트(1513)가 표시되는 것을 예시한다.
다음, 도 14c는, 오디오 빔 형성 완료에 따라, 화자(50)가 음성(1515)을 출력하는 것을 예시한다. 이때, 빔 처리부(175) 또는 프로세서(180)는, 형성된 오디오 빔에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다. 한편, 이동 단말기(100)는, 형성된 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(1517)를 표시할 수 있다. 한편, 카메라(121a)는, 계속하여, 화자를 촬영한 이미지(1501)를 획득할 수 있다. 이때 촬영된 이미지(1501)는, 화자 이미지(1511)의 개구된 입 이미지(1521)를 포함할 수 있다.
다음, 도 15a는 음성 인식(voice recognition) 모드를 예시한다. 이에 따라, 이동 단말기(100)는 음성 인식 모드를 나타내는 오브젝트(1635)를 포함하는 음성 인식 모드 화면(1630)을 표시할 수 있다. 이때, 카메라(121a)가 화자(50)를 촬영할 수 있으며, 촬영된 이미지에 기초하여, 오디오 빔을 형성할 수 있다.
다음, 도 15b는, 오디오 빔 형성이 완료되어, 오디오 빔 형성 완료를 나타내는 오브젝트(1613)가 표시되는 것을 예시한다.
다음, 도 15c는, 오디오 빔 형성 완료에 따라, 화자(50)가 음성(1615)을 출력하는 것을 예시한다. 이때, 빔 처리부(175) 또는 프로세서(180)는, 형성된 오디오 빔에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다. 한편, 이동 단말기(100)는, 형성된 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(1617)를 표시할 수 있다. 한편, 카메라(121a)는, 계속하여, 화자를 촬영한 이미지(1601)를 획득할 수 있다. 이때 촬영된 이미지(1601)는, 화자 이미지(1611)의 개구된 입 이미지(1621)를 포함할 수 있다.
한편, 도 7a 내지 도 12f에서 상술한, 화자 이동히는 경우, 이동 단말기 이동하는 경우, 복수의 화자가 위치하는 경우 등은, 각각, 오디오 수신 모드 중 통화 모드, 녹음모드, 또는 음성인식 모드 하에서도 동일 또는 유사하게 적용될 수 있다.
본 발명에 따른 이동 단말기, 및 그 동작방법은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
예를 들어, 본 발명의 실시예에 따른 오디오 빔 형성 방법은, 영상표시장치, 특히, TV 등에도 채택이 가능하다. 카메라를 구비하는 TV에서, 카메라로부터의 촬영 이미지에 기초하여, TV는 화자의 위치에 대응하는 오디오 빔을 형성할 수 있다. 또는, 카메라로부터의 촬영 이미지 및 TV에 구비되는 마이크에서 수신되는 화자의 음성 신호에 기초하여, TV는 화자의 위치에 대응하는 오디오 빔을 형성할 수 있다. 또는, TV를 원격제어하는 원격제어장치에 구비되는 마이크에서의 오디오 신호, 원격제어장치에 구비되는 모션 센서로부터의 움직임 정보에 기초하여, 원격제어장치가, 화자의 위치에 대응하는 오디오 빔을 형성할 수 있다. 또는, 카메라로부터의 촬영 이미지 및 TV에 구비되는 마이크에서 수신되는 화자의 음성 신호에 기초하여, TV 또는 원격제어장치가, 화자의 위치에 대응하는 오디오 빔을 형성할 수 있다.
한편, 본 발명의 이동 단말기의 동작 방법은, 영상표시장치에 구비된 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한, 인터넷을 통한 전송 등과 같은 캐리어 웨이브의 형태로 구현되는 것도 포함한다. 또한, 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.

Claims (20)

  1. 카메라, 모션 센서, 및 복수개의 마이크를 구비하는 이동 단말기의 동작 방법에 있어서,
    상기 카메라로부터의 촬영 이미지와, 상기 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하는 단계;
    상기 복수의 마이크를 통해, 상기 화자로부터의 오디오 신호를 수신하는 단계; 및
    상기 형성된 오디오 빔에 기초하여, 상기 수신되는 오디오 신호를 신호 처리하는 단계;를 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
  2. 제1항에 있어서,
    상기 오디오 빔 형성 완료시, 이를 나타내는 오브젝트를 표시하는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
  3. 제1항에 있어서,
    오디오 수신 모드로 진입하는 단계; 및
    상기 오디오 수신 모드 진입시, 상기 카메라, 상기 모션 센서, 상기 복수의 마이크를 활성화하는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
  4. 제1항에 있어서,
    상기 오디오 빔 형성 단계는,
    상기 오디오 입력 모드에서, 상기 화자를 촬영한 이미지 중 상기 화자의 입 위치에 대응하여, 상기 오디오 빔을 형성하는 것을 특징으로 하는 이동 단말기의 동작 방법.
  5. 제1항에 있어서,
    상기 카메라로부터의 촬영 이미지와, 상기 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 화자의 위치를 결정하는 단계;를 더 포함하고,
    상기 오디오 빔을 형성 단계는, 상기 화자 위치에 대응하여, 상기 오디오 빔을 형성하는 것을 특징으로 하는 이동 단말기의 동작 방법.
  6. 제1항에 있어서,
    상기 오디오 빔 형성 이후, 상기 화자가 이동하는 경우, 상기 이동된 화자를 촬영한 촬영 이미지에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트하는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
  7. 제1항에 있어서,
    상기 오디오 빔 형성, 및 상기 오디오 신호 수신 이후, 상기 화자가 이동하는 경우, 상기 이동된 화자를 촬영한 촬영 이미지, 및 상기 수신되는 오디오 신호에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트하는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
  8. 제1항에 있어서,
    상기 오디오 빔 형성 이후, 상기 이동 단말기가 이동하는 경우, 상기 이동된 화자를 촬영한 촬영 이미지, 및 상기 모션 센서로부터의 상기 이동 단말기의 움직임 정보에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트하는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
  9. 제1항에 있어서,
    상기 오디오 빔 형성, 및 상기 오디오 신호 수신 이후, 상기 이동 단말기가 이동하는 경우, 상기 이동된 화자를 촬영한 촬영 이미지, 상기 모션 센서로부터의 상기 이동 단말기의 움직임 정보, 및 상기 수신되는 오디오 신호에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트하는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
  10. 제1항에 있어서,
    상기 오디오 빔 형성 단계는,
    상기 촬영된 이미지 내에 복수의 화자가 포함되는 경우, 상기 이미지 내의 중앙에 더 가까이 배치되는, 화자에, 대응하여, 오디오 빔을 형성하는 것을 특징으로 하는 이동 단말기의 동작 방법.
  11. 제1항에 있어서,
    상기 오디오 빔 형성 단계는,
    상기 촬영된 이미지 내에 복수의 화자가 포함되는 경우, 각 화자의 위치에 대응하는, 복수의 오디오 빔을 형성하고,
    상기 형성된 복수의 오디오 빔 중, 상기 복수의 화자 중 입을 움직이는 화자에 대응하는, 오디오 빔을 활성화시키는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
  12. 제1항에 있어서,
    상기 오디오 빔 형성 이후, 상기 화자 외에 다른 화자로부터의 오디오 신호 입력이 있는 경우, 상기 카메라로부터의 촬영 이미지, 및 상기 다른 화자로부터의 오디오 신호에 기초하여, 제2 오디오 빔을 형성하는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
  13. 제1항에 있어서,
    상기 화자가 이동하는 경우, 상기 화자 이동에 따른 오디오 빔을 업데이트하는 단계;를 더 포함하며,
    상기 화자 이동시의 오디오 빔의 대역폭은, 상기 화자의 정지시의 오디오 빔의 대역폭보다, 더 큰 것을 특징으로 하는 이동 단말기의 동작 방법.
  14. 카메라, 모션 센서, 및 복수개의 마이크를 구비하는 이동 단말기의 동작 방법에 있어서,
    오디오 수신 모드로 진입하는 단계;
    상기 카메라, 모션 센서 및 복수개의 마이크를 활성화하는 단계;
    상기 카메라로부터의 촬영 이미지와, 상기 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하는 단계; 및
    상기 오디오 빔 형성 완료시, 이를 나타내는 오브젝트를 표시하는 단계;를 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
  15. 카메라;
    이동 단말기의 움직임 정보를 감지하는 모션 센서;
    오디오 신호를 수집하는 복수개의 마이크; 및
    상기 카메라로부터의 촬영 이미지와, 상기 모션 센서로부터의 움직임 정보 중 적어도 하나에 기초하여, 화자의 위치를 결정하며, 상기 화자의 위치에 대응하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하며, 상기 복수의 마이크를 통해, 상기 수신되는 오디오 신호를, 상기 형성된 오디오 빔에 기초하여, 신호 처리하는 빔 처리부;를 포함하는 것을 특징으로 하는 이동 단말기.
  16. 제15항에 있어서,
    상기 오디오 빔 형성 완료시, 이를 나타내는 오브젝트를 표시하는 디스플레이;를 더 포함하는 것을 특징으로 하는 이동 단말기.
  17. 제15항에 있어서,
    오디오 수신 모드 진입시, 상기 카메라, 상기 모션 센서, 상기 복수의 마이크를 활성화시키는 프로세서;를 더 포함하는 것을 특징으로 하는 이동 단말기.
  18. 제15항에 있어서,
    상기 빔 처리부는,
    상기 오디오 빔 형성, 및 상기 오디오 신호 수신 이후, 상기 화자가 이동하는 경우, 상기 이동된 화자를 촬영한 촬영 이미지, 및 상기 수신되는 오디오 신호에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트하는 것을 특징으로 하는 이동 단말기.
  19. 제15항에 있어서,
    상기 빔 처리부는,
    상기 오디오 빔 형성, 및 상기 오디오 신호 수신 이후, 상기 이동 단말기가 이동하는 경우, 상기 이동된 화자를 촬영한 촬영 이미지, 상기 모션 센서로부터의 상기 이동 단말기의 움직임 정보, 및 상기 수신되는 오디오 신호에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트하는 것을 특징으로 하는 이동 단말기.
  20. 제15항에 있어서,
    상기 빔 처리부는,
    상기 오디오 빔 형성 이후, 상기 화자 외에 다른 화자로부터의 오디오 신호 입력이 있는 경우, 상기 카메라로부터의 촬영 이미지, 및 상기 다른 화자로부터의 오디오 신호에 기초하여, 제2 오디오 빔을 형성하는 것을 특징으로 하는 이동 단말기.
PCT/KR2013/008131 2013-01-31 2013-09-09 이동 단말기, 및 그 동작방법 WO2014119835A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US14/764,930 US9380262B2 (en) 2013-01-31 2013-09-09 Mobile terminal and method for operating same

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2013-0011278 2013-01-31
KR1020130011278A KR102060712B1 (ko) 2013-01-31 2013-01-31 이동 단말기, 및 그 동작방법

Publications (1)

Publication Number Publication Date
WO2014119835A1 true WO2014119835A1 (ko) 2014-08-07

Family

ID=51262523

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2013/008131 WO2014119835A1 (ko) 2013-01-31 2013-09-09 이동 단말기, 및 그 동작방법

Country Status (3)

Country Link
US (1) US9380262B2 (ko)
KR (1) KR102060712B1 (ko)
WO (1) WO2014119835A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107852440A (zh) * 2015-08-21 2018-03-27 三星电子株式会社 用于由电子设备处理声音的方法及其电子设备
JP2018511212A (ja) * 2015-02-13 2018-04-19 ヌープル, インコーポレーテッドNoopl, Inc. 聴力を改善するためのシステムおよび方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9432768B1 (en) 2014-03-28 2016-08-30 Amazon Technologies, Inc. Beam forming for a wearable computer
US10116151B2 (en) * 2015-09-22 2018-10-30 Bseng, Llc Battery charger rental kiosk system
US10467917B2 (en) * 2016-06-28 2019-11-05 Fountain Digital Labs Limited Interactive video system and a method of controlling an interactive video system based on a motion and a sound sensors
US10832695B2 (en) * 2019-02-14 2020-11-10 Microsoft Technology Licensing, Llc Mobile audio beamforming using sensor fusion
KR20210091003A (ko) * 2020-01-13 2021-07-21 삼성전자주식회사 전자 장치 및 그 제어 방법
CN113132863B (zh) * 2020-01-16 2022-05-24 华为技术有限公司 立体声拾音方法、装置、终端设备和计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060038001A (ko) * 2004-10-29 2006-05-03 주식회사 팬택 개인 휴대 단말기
KR20110100652A (ko) * 2008-12-16 2011-09-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 음성 신호 프로세싱
KR20110102466A (ko) * 2008-12-16 2011-09-16 코닌클리케 필립스 일렉트로닉스 엔.브이. 입자 필터링을 이용한 음원 위치를 추정

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9445193B2 (en) * 2008-07-31 2016-09-13 Nokia Technologies Oy Electronic device directional audio capture
KR101078998B1 (ko) * 2009-07-17 2011-11-01 엘지전자 주식회사 단말기에서의 음성 획득 방법 및 이를 적용한 단말기

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060038001A (ko) * 2004-10-29 2006-05-03 주식회사 팬택 개인 휴대 단말기
KR20110100652A (ko) * 2008-12-16 2011-09-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 음성 신호 프로세싱
KR20110102466A (ko) * 2008-12-16 2011-09-16 코닌클리케 필립스 일렉트로닉스 엔.브이. 입자 필터링을 이용한 음원 위치를 추정

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018511212A (ja) * 2015-02-13 2018-04-19 ヌープル, インコーポレーテッドNoopl, Inc. 聴力を改善するためのシステムおよび方法
EP3257266A4 (en) * 2015-02-13 2018-10-03 Noopl, Inc. System and method for improving hearing
US10856071B2 (en) 2015-02-13 2020-12-01 Noopl, Inc. System and method for improving hearing
CN107852440A (zh) * 2015-08-21 2018-03-27 三星电子株式会社 用于由电子设备处理声音的方法及其电子设备

Also Published As

Publication number Publication date
US9380262B2 (en) 2016-06-28
KR102060712B1 (ko) 2020-02-11
KR20140098511A (ko) 2014-08-08
US20150358579A1 (en) 2015-12-10

Similar Documents

Publication Publication Date Title
WO2014119835A1 (ko) 이동 단말기, 및 그 동작방법
WO2017188492A1 (ko) 이동단말기 및 그 제어방법
WO2020054883A1 (ko) 이동 단말기
WO2021060819A1 (ko) 각도 변화에 기반하여 센서 데이터를 처리하는 폴더블 전자 장치 및 그의 동작 방법
WO2014126283A1 (ko) 휴대 단말기의 동작 방법
WO2016195147A1 (ko) 헤드 마운티드 디스플레이
WO2020022780A1 (en) Method and apparatus for establishing device connection
WO2021085902A1 (ko) 복수의 어플리케이션들의 오디오 데이터를 출력하는 전자 장치 및 그 동작 방법
EP3808097A1 (en) Method and apparatus for establishing device connection
WO2020256168A1 (ko) 이동 단말기
WO2018139691A1 (ko) 이동 단말기
WO2021137475A1 (ko) 전자 장치 및 전자 장치의 동작 방법
WO2020196947A1 (ko) 이동 단말기
WO2019142958A1 (ko) 전자 기기 및 그 제어방법
WO2022030804A1 (ko) 화면 회전을 제어하기 위한 폴더블 전자 장치 및 그의 동작 방법
WO2021006371A1 (ko) 이동 단말기
WO2017039061A1 (ko) 웨어러블 디바이스 및 그 제어 방법
WO2017051961A1 (ko) 단말 장치 및 제어 방법
WO2016195144A1 (ko) 카메라 모듈 및 이를 구비하는 이동 단말기
WO2021015330A1 (ko) 플렉서블 디스플레이 장치 및 이의 제어 방법
WO2020138540A1 (ko) 플렉서블 디스플레이 장치
WO2022030910A1 (ko) 폴딩 각도에 따라 입력 모드를 제어하는 전자 장치 및 그의 방법
WO2022098204A1 (ko) 가상현실 서비스를 제공하는 전자 장치 및 방법
WO2022154440A1 (ko) 오디오 데이터를 처리하는 전자 장치 및 그 동작 방법
WO2013129860A1 (en) Mobile terminal and network system

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13873195

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 14764930

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13873195

Country of ref document: EP

Kind code of ref document: A1