WO2023022552A1 - 전자 장치 및 그 제어 방법 - Google Patents

전자 장치 및 그 제어 방법 Download PDF

Info

Publication number
WO2023022552A1
WO2023022552A1 PCT/KR2022/012389 KR2022012389W WO2023022552A1 WO 2023022552 A1 WO2023022552 A1 WO 2023022552A1 KR 2022012389 W KR2022012389 W KR 2022012389W WO 2023022552 A1 WO2023022552 A1 WO 2023022552A1
Authority
WO
WIPO (PCT)
Prior art keywords
external device
signal
privacy
communication interface
identified
Prior art date
Application number
PCT/KR2022/012389
Other languages
English (en)
French (fr)
Inventor
박혜은
김세현
이종인
최길수
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to EP22858789.5A priority Critical patent/EP4343758A1/en
Publication of WO2023022552A1 publication Critical patent/WO2023022552A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification

Definitions

  • the present invention relates to an electronic device and a control method thereof, and more particularly, to an electronic device outputting a response signal to a voice signal and a control method thereof.
  • a display device such as a TV that is currently popular has a function of recognizing a user's voice and outputting a response to the voice.
  • the user's voice may be input through various paths such as a remote control, an external microphone, an external speaker, and a headset as well as a speaker provided in the TV according to a use environment.
  • a remote control such as a remote control, an external microphone, an external speaker, and a headset as well as a speaker provided in the TV according to a use environment.
  • the present invention has been made in accordance with the above-described needs, and an object of the present invention is to provide an electronic device for identifying a device to output a response according to the type of an external device from which a user's voice has been received, and a method for controlling the same.
  • An electronic device for achieving the above object is a communication interface for communicating with an external device, a speaker, a memory for storing at least one command, and a connection between the communication interface, the speaker, and the memory. and at least one processor for controlling the electronic device, wherein the processor executes the at least one command so that when a user's voice signal is received from an external device through the communication interface, the external device controls privacy.
  • the external device if the external device is identified as a privacy device, a response signal to the voice signal is output to the external device through the communication interface, and if the external device is identified as not being the privacy device, the A response signal to the voice signal may be output through the speaker.
  • the at least one processor when a trigger signal for voice recognition is received from the external device, activates a voice recognition function, identifies whether the external device is a privacy device, and uses the external device identified as the privacy device for a user.
  • voice recognition is performed on the received signal, and the communication interface is controlled to output a response signal to the received signal to the external device based on the voice recognition result.
  • the electronic device further includes a first audio output unit connected to the communication interface and a second audio output unit connected to the speaker, and the at least one processor transmits an audio signal corresponding to the audio content to the first audio output unit.
  • the voice signal While outputting to at least one of the output unit and the second audio output unit, if the user's voice signal is received from the external device, it is identified whether the external device is a privacy device, and if the external device is identified as a privacy device, the voice signal Controls the first audio output unit to output a response signal to the audio signal as a first output volume having the same level as the output volume of the audio signal, and when the external device is identified as not being a privacy device, a response signal to the voice signal
  • the second audio output unit may be controlled to output a second output volume having a size different from that of the audio signal.
  • the second output volume may be greater than the size of the output volume of the audio signal.
  • the at least one processor identifies whether each of the plurality of external devices is a privacy device, and a first external device among the plurality of external devices If it is identified as a privacy device and the second external device is identified as not a privacy device, a response signal to the voice signal may be output to the first external device through the communication interface.
  • the at least one processor identifies one of the plurality of external devices based on the magnitude of the received voice signal when a user's voice signal is received from a plurality of external devices through the communication interface, and the identified When the external device is identified as a privacy device, the communication interface is controlled to output a response signal to the voice signal to the external device, and when the identified external device is identified as not being a privacy device, a response to the voice signal is controlled. A signal may be output to the speaker.
  • the at least one processor identifies whether each of the plurality of external devices is a privacy device, and among the plurality of external devices is not a privacy device.
  • a control signal for turning off the microphone of the device identified as being can be transmitted through the communication interface.
  • the at least one processor may identify whether the external device is a privacy device when a user's voice signal is received from the external device while an audio signal corresponding to game content is output to at least one of the external device and the speaker.
  • the at least one processor may identify whether the external device is a privacy device based on the identification information of the external device.
  • the external device may include at least one of a headset, a remote controller, a microphone, or a speaker.
  • a control method of an electronic device including a communication interface and a speaker identifies whether the external device is a privacy device when a user's voice signal is received from the external device through the communication interface. If the external device is identified as a privacy device, outputting a response signal to the voice signal to the external device through the communication interface, and if the external device is identified as not being the privacy device , outputting a response signal to the voice signal to the speaker.
  • the step of identifying whether the external device is the privacy device includes: activating a voice recognition function and identifying whether the external device is a privacy device when a trigger signal for voice recognition is received from the external device; and
  • the method may further include performing voice recognition on the received signal when a signal corresponding to the user's subsequent voice is received from the external device identified as
  • the outputting may further include outputting the received signal to the external device through the communication interface based on a result of the voice recognition.
  • the electronic device may further include a first audio output unit connected to the communication interface and a second audio output unit connected to the speaker, and the identifying whether the electronic device is the privacy device may include transmitting an audio signal corresponding to the audio content to the first audio output unit. While outputting to at least one of the first audio output unit and the second audio output unit, when a user's voice signal is received from the external device, it is identified whether the external device is a privacy device, and the response signal is transmitted to the external device through the communication interface.
  • Outputting the response signal to the speaker may include, when the external device is identified as not being a privacy device, outputting the response signal to the voice signal as a second output volume having a volume different from that of the audio signal. 2 You can control the audio output unit.
  • the second output volume may be greater than the output volume of the audio signal.
  • the control method may include identifying whether each of the plurality of external devices is a privacy device when a user's voice signal is received from a plurality of external devices through the communication interface, and a first external device among the plurality of external devices The method may further include outputting a response signal to the voice signal to the speaker when it is identified as a privacy device and the second external device is identified as not a privacy device.
  • the control method may include identifying one of the plurality of external devices based on the magnitude of the received voice signal when a user's voice signal is received from a plurality of external devices through the communication interface, and the identified one of the external devices. outputting a response signal to the voice signal to the external device when the external device is identified as a privacy device, and outputting a response signal to the voice signal to the speaker when the identified external device is identified as not being a privacy device Further steps may be included.
  • the method may further include transmitting a control signal for turning off the microphone through the communication interface.
  • the external device In the step of identifying whether the external device is the privacy device, when a user's voice signal is received from the external device while an audio signal corresponding to game content is output to at least one of the external device and the speaker, the external device can identify whether is a privacy device.
  • whether the external device is the privacy device may be identified based on identification information of the external device.
  • a non-transitory computer readable medium storing computer instructions that cause the electronic device to perform an operation when executed by a processor of an electronic device including a communication interface and a speaker
  • the operation is performed through the communication interface. Identifying whether the external device is a Privacy device when a user's voice signal is received from an external device; If the external device is identified as a Privacy device, a response signal to the voice signal is transmitted through the communication interface
  • the method may further include outputting to the external device, and outputting a response signal to the voice signal to the speaker when the external device is identified as not being the privacy device.
  • a device to output a response signal to a voice signal can be identified according to the type of an external device connected to the electronic device.
  • FIG. 1 is a diagram for explaining an implementation form of an electronic device according to an embodiment of the present disclosure.
  • FIG. 2 is a block diagram showing the configuration of an electronic device according to an embodiment of the present disclosure.
  • FIG. 3 is a diagram for explaining a method of identifying an output device of a response signal according to an external device type according to an embodiment of the present disclosure.
  • FIG. 4 is a diagram for explaining a method of identifying an output device of a response signal according to an external device type according to an embodiment of the present disclosure.
  • FIG. 5 is a diagram for explaining a method of controlling an output volume size of a response signal according to an embodiment of the present disclosure.
  • FIG. 6 is a diagram for explaining a method of controlling an output volume size of a response signal according to an embodiment of the present disclosure.
  • FIG. 7 is a diagram for explaining a method of controlling output of a response signal when voice signals are received from a plurality of external devices according to an embodiment of the present disclosure.
  • FIG. 8A is a diagram for explaining a method of identifying an external device based on the size of a voice signal according to an embodiment of the present disclosure.
  • 8B is a diagram for explaining a method of identifying an external device based on the size of a voice signal according to an embodiment of the present disclosure.
  • FIG. 9 is a diagram for explaining a method of controlling external devices according to types of a plurality of external devices according to an embodiment of the present disclosure.
  • FIG. 10 is a diagram for explaining a method of outputting a response signal according to the type of content being played according to an embodiment of the present disclosure.
  • FIG. 11 is a diagram illustrating an implementation example of an electronic device according to an embodiment of the present disclosure.
  • FIG. 12 is a flowchart illustrating a control method of an electronic device according to an embodiment of the present disclosure.
  • expressions such as “has,” “can have,” “includes,” or “can include” indicate the existence of a corresponding feature (eg, numerical value, function, operation, or component such as a part). , which does not preclude the existence of additional features.
  • a component e.g., a first component
  • another component e.g., a second component
  • connection to it should be understood that an element may be directly connected to another element, or may be connected through another element (eg, a third element).
  • a “module” or “unit” performs at least one function or operation, and may be implemented in hardware or software or a combination of hardware and software.
  • a plurality of “modules” or a plurality of “units” are integrated into at least one module and implemented by at least one processor (not shown), except for “modules” or “units” that need to be implemented with specific hardware. It can be.
  • FIG. 1 is a diagram for explaining an implementation form of an electronic device according to an embodiment of the present disclosure.
  • the electronic device 100 may be, for example, a TV, but is not limited thereto, and is not limited thereto, such as a near eye display (NED), a large format display (LFD), a digital signage, and a digital information display (DID). ), video walls, smartphones, laptops, tablets, and HMD (Head mounted Display).
  • NED near eye display
  • LFD large format display
  • DID digital information display
  • video walls smartphones, laptops, tablets, and HMD (Head mounted Display).
  • the electronic device 100 may perform a voice recognition function of providing a response signal corresponding to the user voice.
  • the user's voice may be received through the speaker 120 included in the electronic device 100, but according to another example, the user's voice may be received from the external device 200.
  • the external device 200 may be implemented as various types of devices such as a headset 200-1, a remote control 200-2, a microphone 200-3, and a speaker 200-4.
  • the electronic device 100 may output a response signal to a user's voice to a preset device.
  • the electronic device 100 is implemented as a public device such as a TV
  • a response signal is output through the TV speaker 120 while the content reproduction sound is output through the TV speaker 120
  • interference with the content reproduction sound occurs. This can happen
  • a response signal is output through the TV speaker 120 while content reproduction sound is output through a privacy device such as the headset 200-1, there may be a problem that the user cannot clearly hear the response signal.
  • FIG. 2 is a block diagram showing the configuration of an electronic device according to an embodiment of the present disclosure.
  • the electronic device 100 may include a communication interface 110, a speaker 120, a memory 130, and at least one processor 140.
  • the communication interface 110 may be implemented as various interfaces according to an implementation example of the electronic device 100 .
  • the communication interface 110 includes various types of digital interfaces, AP-based Wi-Fi (Wi-Fi, Wireless LAN network), Bluetooth, Zigbee, wired / wireless LAN (Local Area Network), WAN (Wide Area Network), Ethernet, IEEE 1394, HDMI (High-Definition Multimedia Interface), USB (Universal Serial Bus), MHL (Mobile High-Definition Link), AES/EBU (Audio Engineering Society/ European Broadcasting Union) ), optical, coaxial, etc., communication with the external device 200 may be performed.
  • Wi-Fi Wi-Fi, Wireless LAN network
  • Bluetooth Zigbee
  • wired / wireless LAN Local Area Network
  • WAN Wide Area Network
  • Ethernet IEEE 1394
  • HDMI High-Definition Multimedia Interface
  • USB Universal Serial Bus
  • MHL Mobile High-Definition Link
  • AES/EBU Audio Engineering Society/ European Broadcasting Union
  • the speaker 120 may output an audio signal processed by at least one processor 140 .
  • the speaker 120 may include at least one speaker unit.
  • At least one speaker unit functions to convert electric pulses into sound waves, and may be implemented as a coin type, that is, a dynamic type, which is distinguished according to a principle and method of converting an electric signal into sound waves. However, it is not limited thereto, and may be implemented as an electrostatic type, a dielectric type, or a magnetostrictive type within the scope of application of the present invention.
  • at least one speaker unit is implemented as a plurality of units, and can reproduce a plurality of channels, such as 2 channels, 2.1 channels, 3 channels, 3.1 channels, 5.1 channels, and 7.1 channels, respectively.
  • the plurality of speaker units may include a left (L) channel speaker and a right (R) channel speaker.
  • the memory 130 may store data required for various embodiments of the present disclosure.
  • the memory 130 may be implemented in the form of a memory embedded in the electronic device 100 or in the form of a removable memory in the electronic device 100 according to a data storage purpose. For example, data for driving the electronic device 100 is stored in a memory embedded in the electronic device 100, and data for an extended function of the electronic device 100 is detachable from the electronic device 100. It can be stored in available memory.
  • volatile memory eg, DRAM (dynamic RAM), SRAM (static RAM), SDRAM (synchronous dynamic RAM), etc.
  • non-volatile memory non-volatile memory
  • OTPROM one time programmable ROM
  • PROM programmable ROM
  • EPROM erasable and programmable ROM
  • EEPROM electrically erasable and programmable ROM
  • mask ROM flash ROM, flash memory (such as NAND flash or NOR flash, etc.)
  • flash memory such as NAND flash or NOR flash, etc.
  • SSD solid state drive
  • a memory card eg, a compact flash drive (CF)
  • SD secure digital
  • Micro-SD micro secure digital
  • Mini-SD mini secure digital
  • xD extreme digital
  • MMC multi-media card
  • the memory 130 may store device type information mapped for each identification information of the external device 200 .
  • the identification information may include at least one of a model name, device serial number, and manufacturer information.
  • the device type information may be a privacy device or a public device.
  • the memory 130 may store a lookup table in which device type information (private device or public device) corresponding to a device model name is mapped.
  • the memory 130 may store information related to voice recognition.
  • the memory 130 may store information corresponding to a trigger voice for voice recognition.
  • the memory 130 may store frequency information corresponding to the user's trigger voice.
  • the memory 130 may store template information for generating a basic response signal.
  • the memory 130 may store a voice recognition module for voice recognition.
  • the voice recognition module may include a Natural Language Understanding (NLU) module, an Automatic Speech Recognition (ASR) module, etc., but is not limited thereto.
  • the processor 140 is electrically connected to the communication interface 110, the speaker 120, and the memory 130 to control overall operations of the electronic device 100.
  • Processor 140 may be composed of one or a plurality of processors. Specifically, the processor 140 may perform the operation of the electronic device 100 according to various embodiments of the present disclosure by executing at least one instruction stored in the memory 130 .
  • the processor 140 includes a digital signal processor (DSP), a microprocessor, a graphics processing unit (GPU), an artificial intelligence (AI) processor, It may be implemented as a Neural Processing Unit (NPU) or Time controller (TCON), but is not limited thereto, such as a central processing unit (CPU), a micro controller unit (MCU), or a micro processing unit (MPU). ), a controller, an application processor (AP), or a communication processor (CP), or one or more of an ARM processor, or may be defined by the term.
  • a processor 140 may be implemented in the form of a System on Chip (SoC) with a built-in processing algorithm, a large scale integration (LSI), an application specific integrated circuit (ASIC), or a field programmable gate array (FPGA).
  • SoC System on Chip
  • SoC System on Chip
  • LSI large scale integration
  • ASIC application specific integrated circuit
  • FPGA field programmable gate array
  • At least one processor 140 may control the communication interface 110 to receive a voice signal from the external device 200 connected to the electronic device 100 .
  • the voice signal may be various user voice signals including a trigger signal for activating the voice recognition function, a voice command signal, and a signal for terminating the voice recognition function.
  • the processor 140 when a user's voice signal is received from the external device 200 through the communication interface 110, the processor 140 identifies whether the external device 200 is a privacy device. can Subsequently, when the external device 200 is identified as a privacy device, the processor 140 may output a response signal to the voice signal to the external device 200 through the communication interface 110 .
  • FIG. 3 is a diagram for explaining a method of identifying an output device of a response signal according to an external device type according to an embodiment of the present disclosure.
  • the external device 200 may be implemented as a headset and may include a microphone 210 and a speaker 220 .
  • the processor 140 may identify whether the external device 200 is a privacy device when a user's voice signal is received from the external device 200 through the communication interface 110 .
  • the processor 140 processes the identification information of the external device 200. Based on this, it is possible to identify whether the external device 200 is a privacy device.
  • the electronic device 100 and the external device 200 are connected through Bluetooth communication, it is possible to identify whether the external device 200 is a privacy device based on identification information of the external device 200 received according to Bluetooth communication pairing.
  • the external device 200 that is, the headset may be identified as a privacy device based on the mapping information stored in the memory 130.
  • the processor 140 may control the communication interface 110 to output a response signal corresponding to the user's voice signal to the external device 200 . For example, “What time is it?” When the user's voice is received, response information such as "It's 3:00 PM" may be output to the external device 200 through the communication interface 110 .
  • the processor 140 may output a response signal to the voice signal through the speaker 120 .
  • FIG. 4 is a diagram for explaining a method of identifying an output device of a response signal according to an external device type according to an embodiment of the present disclosure.
  • the processor 140 may output a response signal corresponding to the user's voice signal through the speaker 120 . For example, “What time is it?” When the user's voice is received, response information such as "It's 3:00 PM" may be output through the speaker 120 .
  • the processor 140 may activate a voice recognition function and identify whether the external device is a privacy device.
  • the trigger signal for voice recognition may be a voice signal set based on at least one of a manufacturer, product, or user, such as “Hi-Bixby”.
  • the processor 140 may perform voice recognition on the received signal. Also, the processor 140 may control the communication interface 110 to output a response signal to an external device based on a voice recognition result.
  • the processor 140 if the external device is identified as a privacy device, the processor 140 outputs a response signal to the voice signal to the external device with a first output volume equal to the output volume of the audio signal to the external device, and If it is identified as not being a privacy device, the speaker 120 may be controlled to output a response signal to the voice signal as a second output volume having a volume different from that of the audio signal.
  • the processor 140 outputs an audio signal corresponding to the audio content to at least one of a first audio output unit (not shown) and a second audio output unit (not shown), the user's When the voice signal is received, it is possible to identify whether the external device is a privacy device.
  • the first audio output unit (not shown) may process the audio signal and transmit it to the communication interface 110 .
  • the first audio output unit (not shown) may include a D/A converter and an audio amplifier, but is not limited thereto and may be implemented as part of the communication interface 110 .
  • the second audio output unit (not shown) may process the audio signal and deliver it to the speaker 130 .
  • the first audio output unit (not shown) may include a D/A converter and an audio amplifier, but is not limited thereto and may be implemented as a part of the communication speaker 130 .
  • the processor 140 uses a first audio output unit (not shown) to output a response signal to the voice signal as a first output volume having the same level as the output volume of the audio signal. You can control it.
  • the processor 140 configures a second audio output unit (not shown) to output a response signal to the voice signal as a second output volume having a size different from that of the audio signal. You can control it.
  • the second output volume may be greater than the size of the output volume of the audio signal.
  • 5 and 6 are diagrams for explaining a method of controlling an output volume size of a response signal according to an embodiment of the present disclosure.
  • the processor 140 while an audio signal corresponding to audio content is output to the speaker 220 of the external device 200, the processor 140, when a user's voice signal is received from the external device 200, the external device 200 ) can identify whether it is a privacy device. Subsequently, when the external device 200 is identified as a privacy device, the processor 140 outputs a response signal to the user's voice signal to the first output volume 222 having the same volume as the output volume 221 of the audio signal.
  • a first audio output unit (not shown) connected to the communication interface 110 may be controlled.
  • the output volume 221 of the audio signal and Response information may be output to the first output volume 222 having the same size.
  • the processor 140 converts a response signal to the user's voice signal to a second output volume having a size different from the output volume 521 of the audio signal (
  • a second audio output unit (not shown) may be controlled to output to 522).
  • response information "It's 3:00 PM" is outputted through the speaker 120 based on the user's voice "What time is it?"
  • the second output volume is greater than the output volume 521 of the audio signal.
  • Response information may be output to 522 .
  • the processor 140 may control the speaker 120 so that the output volume 521 of the audio signal is smaller than before the user's voice signal is input, but is not limited thereto.
  • the processor 140 may identify whether each of the plurality of external devices is a privacy device.
  • the processor 140 transmits a response signal to the voice signal through the communication interface 110 ), the communication interface 110 may be controlled to output to the first external device.
  • FIG. 7 is a diagram for explaining a method of controlling output of a response signal when voice signals are received from a plurality of external devices according to an embodiment of the present disclosure.
  • the processor 140 when a user's voice signal is received from the plurality of external devices 200-1 and 200-2 through the communication interface 110, the processor 140 based on mapping information stored in the memory 130 Among the plurality of external devices 200-1 and 200-2, the headset 200-1 can be identified as a privacy device and the remote controller 200-2 as a non-privacy device, that is, as a public device. In this case, the processor 140 may output a response signal to the user voice signal to the headset 200-1, which is a privacy device, through the communication interface 110, and may not output it to the remote control 200-2, which is a public device. there is.
  • the processor 140 selects one of the plurality of external devices based on the magnitude of the received voice signal. one can be identified.
  • the processor 140 may control the communication interface 110 to output a response signal to the voice signal to the identified external device. Also, if the identified external device is identified as not being a privacy device, the processor 140 may output a response signal to the voice signal to the speaker 120 .
  • FIGS. 8A and 8B are diagrams for explaining a method of identifying an external device based on the size of a voice signal according to an embodiment of the present disclosure.
  • the processor 140 transmits a plurality of external devices 200-1 and 200-2.
  • an external device having a relatively large received voice signal for example, the headset 200-1 is identified, and when the headset 200-1 is identified as a privacy device, a response signal to the user's voice signal is communicated. It can be output to the headset 200-1 through the interface 110.
  • the processor 140 transmits a plurality of external devices 200-1 and 200-2.
  • an external device having a relatively large received voice signal for example, the remote control 200-2 is identified, and if the remote control 200-2 is identified as not being a privacy device, a response to the user's voice signal A signal may be output to the speaker 120 .
  • the processor 140 identifies whether each of the plurality of external devices is a privacy device, and selects a privacy device among the plurality of external devices.
  • a control signal for turning off a microphone (not shown) of a device identified as non-device may be transmitted through the communication interface 110 .
  • FIG. 9 is a diagram for explaining a method of controlling external devices according to types of a plurality of external devices according to an embodiment of the present disclosure.
  • the processor 140 transmits a plurality of external devices 200-1 and 200-2.
  • the headset 200-1 can be identified as a privacy device
  • the remote controller 200-2 can be identified as a non-privacy device.
  • the processor 140 may output a response signal to the user's voice signal to the headset 200-1 identified as a privacy device through the communication interface 110.
  • the processor 140 may transmit a control signal for turning off the microphone 810 of the remote control 200-2 identified as not being a privacy device to the remote control 200-2 through the communication interface 110. there is.
  • the processor 140 may identify whether the external device is a privacy device when a user's voice signal is received from the external device while an audio signal corresponding to the game content is output to at least one of the external device and the speaker 120 . can That is, the processor 140 may identify whether the external device is a privacy device when a user's voice signal is received from the external device while an audio signal corresponding to a specific type of content is being output. However, it is not limited thereto, and when a user's voice signal is received from an external device while a specific display mode (eg, game mode) is provided, it may be identified whether the external device is a privacy device.
  • a specific display mode eg, game mode
  • FIG. 10 is a diagram for explaining a method of outputting a response signal according to the type of content being played according to an embodiment of the present disclosure.
  • the processor 140 receives a user's voice signal from the headset 200-1, and the headset 200-1 1) If it is identified as a privacy device and the headset 200-1 is identified as a privacy device, a response signal to the user's voice signal may be output to the headset 200-1 through the communication interface 110. That is, when a user voice signal is received from a privacy device while privacy content such as game content is being provided, a response signal may be output only to the corresponding device.
  • the processor 140 determines whether a user's voice signal is received from the headset 200-1, which is an external device, while an audio signal corresponding to broadcast content is output to the headset 200-1, whether it is a privacy device or not. and if the headset 200-1 is identified as a privacy device, a response signal to the user's voice signal may be output to the headset 200-1 or to the TV speaker 120 through the communication interface 110. there is. In this case, it may be simultaneously output from the headset 200-1 and the TV speaker 120. That is, even if a user's voice signal is received from a privacy device while public content such as broadcast content is being provided, a response signal can be output through the TV speaker 120 as well as the corresponding device.
  • the processor 140 may differently determine a device to output a response signal to the user's voice signal according to the type of currently provided content.
  • FIG. 11 is a diagram illustrating an implementation example of an electronic device according to an embodiment of the present disclosure.
  • the electronic device 100' includes a communication interface 110, a speaker 120, a memory 130, a processor 140, an audio output unit 150, a display 160, and a user interface 170. and a microphone 180.
  • a communication interface 110 includes a communication interface 110, a speaker 120, a memory 130, a processor 140, an audio output unit 150, a display 160, and a user interface 170. and a microphone 180.
  • FIG. 11 detailed descriptions of components overlapping with those shown in FIG. 2 will be omitted.
  • the audio output unit 150 may process and provide an audio signal.
  • the audio output unit 150 may process an audio signal and transmit it to the communication interface 110 or the speaker 130 .
  • the audio output unit 150 may include a D/A converter and an audio amplifier, but is not limited thereto.
  • the audio output unit 150 may include a first audio output unit (not shown) and a second audio output unit (not shown).
  • the first audio output unit (not shown) may process the audio signal and transfer it to the communication interface 110
  • the second audio output unit (not shown) may process the audio signal and transfer it to the speaker 130 .
  • the first audio output unit (not shown) and the second audio output unit (not shown) may include a D/A converter and an audio amplifier, but are not limited thereto.
  • the display 160 may be implemented as a display including a self-light emitting element or a display including a non-light emitting element and a backlight.
  • LCD Liquid Crystal Display
  • OLED Organic Light Emitting Diodes
  • LED Light Emitting Diodes
  • micro LED micro LED
  • Mini LED PDP (Plasma Display Panel)
  • QD Quantum dot
  • QLED Quadantum dot light-emitting diodes
  • the display 110 may also include a driving circuit, a backlight unit, and the like that may be implemented in the form of an a-si TFT, a low temperature poly silicon (LTPS) TFT, or an organic TFT (OTFT).
  • the display 110 is implemented as a touch screen combined with a touch sensor, a flexible display, a rollable display, a 3D display, a display in which a plurality of display modules are physically connected, and the like. It can be.
  • a program may be executed using a finger or a pen (eg, a stylus pen).
  • the user interface 170 may be implemented as a device such as a button, touch pad, mouse, or keyboard, or as a touch screen capable of performing the above-described display function and manipulation input function together, or a remote control transceiver.
  • the remote control transmitting/receiving unit may receive a remote control signal from an external remote control device or transmit a remote control signal through at least one of infrared communication, Bluetooth communication, and Wi-Fi communication.
  • the microphone 180 is a component for receiving a user's voice or other sounds and converting them into audio data. For example, a user voice command related to various embodiments of the present disclosure may be received through the microphone 180 .
  • the electronic device 100' may additionally include a tuner and a demodulator according to implementation examples.
  • a tuner (not shown) may receive an RF broadcast signal by tuning a channel selected by a user or all pre-stored channels among radio frequency (RF) broadcast signals received through an antenna.
  • the demodulator (not shown) may receive and demodulate the digital IF signal (DIF) converted by the tuner, and perform channel decoding.
  • DIF digital IF signal
  • an input image received through the tuner may be processed through a demodulation unit (not shown) and then provided to the processor 140 for tone mapping processing according to an embodiment of the present disclosure.
  • FIG. 12 is a flowchart illustrating a control method of an electronic device according to an embodiment of the present disclosure.
  • a user's voice signal is received from an external device through a communication interface (S1210), it is identified whether the external device is a privacy device (S1220). Then, when the external device is identified as a privacy device (S1220: Y), the communication interface is controlled to output a response signal to the voice signal to the external device (S1230).
  • a response signal to the voice signal is output to the speaker (S1240).
  • step S1220 when a trigger signal for voice recognition is received from the external device, activating the voice recognition function and identifying whether the external device is a privacy device, and a signal corresponding to the user's subsequent voice from the external device identified as a privacy device.
  • the method may further include performing voice recognition on the received signal.
  • step S1230 may further include outputting the signal received based on the voice recognition result to an external device through a communication interface.
  • the electronic device may further include a first audio output unit connected to the communication interface and a second audio output unit connected to the speaker.
  • step S1220 if a user's voice signal is received from the external device while outputting an audio signal corresponding to the audio content to at least one of the first audio output unit and the second audio output unit, it is possible to identify whether the external device is a privacy device.
  • the first audio output unit may be controlled to output a response signal to the voice signal with a first output volume equal to the output volume of the audio signal.
  • the second audio output unit may be controlled to output a response signal to the voice signal as a second output volume having a volume different from that of the audio signal.
  • the second audio output unit may be controlled so that the second output volume is greater than the output volume of the audio signal.
  • control method includes identifying whether each of the plurality of external devices is a privacy device when a user's voice signal is received from the plurality of external devices through a communication interface, and determining whether a first external device among the plurality of external devices is a privacy device. and if the second external device is identified as not being a privacy device, the method may further include outputting a response signal to the voice signal through a speaker.
  • control method may include identifying one of the plurality of external devices based on the magnitude of the received voice signal when a user's voice signal is received from a plurality of external devices through a communication interface, and the identified external device being a privacy device. , outputting a response signal to the voice signal to an external device, and outputting a response signal to the voice signal to a speaker when the identified external device is identified as not being a privacy device.
  • control method includes, when a user's voice signal is received from a plurality of external devices through a communication interface, identifying whether each of the plurality of external devices is a privacy device, and determining whether the device identified as not being a privacy device among the plurality of external devices
  • the method may further include transmitting a control signal for turning off the microphone through a communication interface.
  • step S1220 if a user's voice signal is received from the external device while an audio signal corresponding to the game content is output to at least one of the external device and the speaker, it may be identified whether the external device is a privacy device.
  • step S1220 it is possible to identify whether the external device is a privacy device based on the identification information of the external device.
  • a non-transitory computer readable medium storing computer instructions that cause an electronic device to perform an operation when executed by a processor of an electronic device including a communication interface and a speaker
  • the operation is performed by a user from an external device through a communication interface. Identifying whether the external device is a privacy device when the voice signal of is received, outputting a response signal to the voice signal to the external device through a communication interface when the external device is identified as a privacy device, and If the external device is identified as not being a privacy device, the method may further include outputting a response signal to the voice signal through a speaker.
  • the method according to the disclosed embodiments may be provided as a computer program product.
  • the computer program product may include a S/W program, a computer-readable storage medium in which the S/W program is stored, or a product traded between a seller and a buyer.
  • a computer program product is an electronic device or a product in the form of a S/W program (eg, a downloadable app) distributed electronically through an electronic device manufacturer or an electronic marketplace (eg, Google Play Store, App Store).
  • the storage medium may be a storage medium of a manufacturer or a server of an electronic market or a relay server.
  • a device to output a response signal to a voice signal can be identified according to the type of an external device connected to the electronic device, user convenience is increased.
  • the methods according to various embodiments of the present disclosure described above may be implemented in the form of an application that can be installed in an existing display device.
  • the above-described methods according to various embodiments of the present disclosure may be performed using a deep learning-based artificial neural network (or deep artificial neural network), that is, a learning network model.
  • various embodiments of the present disclosure described above may be performed through an embedded server included in the display device or an external server of the display device.
  • a device is a device capable of calling a stored command from a storage medium and operating according to the called command, and may include a display device (eg, the display device A) according to the disclosed embodiments.
  • the processor may perform a function corresponding to the command directly or by using other components under the control of the processor.
  • An instruction may include code generated or executed by a compiler or interpreter.
  • the device-readable storage medium may be provided in the form of a non-transitory storage medium.
  • 'non-temporary' only means that the storage medium does not contain a signal and is tangible, but does not distinguish whether data is stored semi-permanently or temporarily in the storage medium.
  • the method according to the various embodiments described above may be included in a computer program product and provided.
  • Computer program products may be traded between sellers and buyers as commodities.
  • the computer program product may be distributed in the form of a device-readable storage medium (eg compact disc read only memory (CD-ROM)) or online through an application store (eg Play StoreTM).
  • CD-ROM compact disc read only memory
  • application store eg Play StoreTM
  • at least part of the computer program product may be temporarily stored or temporarily created in a storage medium such as a manufacturer's server, an application store server, or a relay server's memory.
  • each of the components may be composed of a single object or a plurality of entities, and some sub-components among the aforementioned sub-components may be omitted, or other sub-components may be used. Components may be further included in various embodiments. Alternatively or additionally, some components (eg, modules or programs) may be integrated into one entity and perform the same or similar functions performed by each corresponding component prior to integration. According to various embodiments, operations performed by modules, programs, or other components may be executed sequentially, in parallel, repetitively, or heuristically, or at least some operations may be executed in a different order, may be omitted, or other operations may be added. can

Abstract

전자 장치가 개시된다. 전자 장치는, 외부 장치와 통신하는 통신 인터페이스, 스피커, 적어도 하나의 명령을 저장하는 메모리, 및 통신 인터페이스, 스피커, 및 메모리와 연결되어 전자 장치를 제어하는 적어도 하나의 프로세서를 포함한다. 이 경우, 적어도 하나의 프로세서는, 적어도 하나의 명령어를 실행함으로써, 통신 인터페이스를 통해 외부 장치로부터 사용자의 음성 신호가 수신되면 외부 장치가 프라이버시(Privacy) 기기인지 식별하고, 외부 장치가 프라이버시(Privacy) 기기로 식별되면, 음성 신호에 대한 응답 신호를 통신 인터페이스를 통해 외부 장치로 출력하고, 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 음성 신호에 대한 응답 신호를 스피커를 통해 출력할 수 있다.

Description

전자 장치 및 그 제어 방법
본 발명은 전자 장치 및 그 제어 방법에 관한 것으로, 더욱 상세하게는 음성 신호에 대한 응답신호를 출력하는 전자 장치 및 그 제어방법에 관한 것이다.
전자 기술의 발달에 힘입어 다양한 유형의 전자 기기가 개발 및 보급되고 있다. 특히, 가정에서 이용되는 TV와 같은 디스플레이 장치는 사용자의 니즈를 만족시키기 위하여 최근 수년 간 지속적으로 발전하고 있다.
특히, 현재 보급되는 TV와 같은 디스플레이 장치는 사용자의 음성을 인식하고 음성에 대한 응답을 출력하는 기능을 구비하고 있다. 여기서, 사용자의 음성은 사용 환경에 따라 TV에 구비된 스피커뿐 아니라, 리모콘, 외부 마이크, 외부 스피커, 헤드셋과 같은 다양한 경로를 통해 입력될 수 있다. 이 경우, 사용 환경에 적합하게 사용자 음성에 대한 응답을 출력할 필요성이 있다.
본 발명은 상술한 필요성에 따른 것으로, 본 발명의 목적은 사용자의 음성 이 수신된 외부 장치의 타입에 따라 응답을 출력할 장치를 식별하는 전자 장치 및 그 제어 방법을 제공함에 있다.
이상과 같은 목적을 달성하기 위한 본 개시의 일 실시 예에 따른 전자 장치는 외부 장치와 통신하는 통신 인터페이스, 스피커, 적어도 하나의 명령을 저장하는 메모리, 및 상기 통신 인터페이스, 상기 스피커 및 상기 메모리와 연결되어 상기 전자 장치를 제어하는 적어도 하나의 프로세서를 포함하며, 상기 프로세서는, 상기 적어도 하나의 명령어를 실행함으로써, 상기 통신 인터페이스를 통해 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 외부 장치가 프라이버시(Privacy) 기기인지 식별하고, 상기 외부 장치가 프라이버시 기기로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 통신 인터페이스를 통해 상기 외부 장치로 출력하고, 상기 외부 장치가 상기 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 스피커를 통해 출력할 수 있다.
여기서, 상기 적어도 하나의 프로세서는, 상기 외부 장치로부터 음성 인식을 위한 트리거 신호가 수신되면, 음성 인식 기능을 활성화시키고 상기 외부 장치가 프라이버시 기기인지 식별하고, 상기 프라이버시 기기로 식별된 상기 외부 장치로부터 사용자의 후속 음성에 대응되는 신호가 수신되면, 상기 수신된 신호에 대한 음성 인식을 수행하고, 음성 인식 결과에 기초하여 상기 수신된 신호에 대한 응답 신호를 상기 외부 장치로 출력하도록 상기 통신 인터페이스를 제어할 수 있다.
여기서, 상기 전자 장치는 상기 통신 인터페이스와 연결된 제1 오디오 출력부, 및 상기 스피커와 연결된 제2 오디오 출력부를 더 포함하며, 상기 적어도 하나의 프로세서는, 오디오 컨텐츠에 대응되는 오디오 신호를 상기 제1 오디오 출력부 또는 제2 오디오 출력부 중 적어도 하나로 출력하는 동안, 상기 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 외부 장치가 프라이버시 기기인지 식별하고, 상기 외부 장치가 프라이버시 기기로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 오디오 신호의 출력 볼륨과 동일한 크기의 제1 출력 볼륨으로 출력하도록 상기 제1 오디오 출력부를 제어하고, 상기 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 오디오 신호의 볼륨과 상이한 크기의 제2 출력 볼륨으로 출력하도록 상기 제2 오디오 출력부를 제어할 수 있다.
여기서, 상기 제2 출력 볼륨은, 상기 오디오 신호의 출력 볼륨 크기보다 클 수 있다.
또한, 상기 적어도 하나의 프로세서는, 상기 통신 인터페이스를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 복수의 외부 장치 각각이 프라이버시 기기인지 식별하고, 상기 복수의 외부 장치 중 제1 외부 장치가 프라이버시 기기로 식별되고 제2 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 통신 인터페이스를 통해 상기 제1 외부 장치로 출력할 수 있다.
또한, 상기 적어도 하나의 프로세서는, 상기 통신 인터페이스를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 수신된 음성 신호의 크기에 기초하여 상기 복수의 외부 장치 중 하나를 식별하고, 상기 식별된 외부 장치가 프라이버시 기기로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 외부 장치로 출력하도록 상기 통신 인터페이스를 제어하고, 상기 식별된 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 스피커로 출력할 수 있다.
또한, 상기 적어도 하나의 프로세서는, 상기 통신 인터페이스를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면, 상기 복수의 외부 장치 각각이 프라이버시 기기인지 식별하고, 상기 복수의 외부 장치 중 프라이버시 기기가 아닌 것으로 식별된 장치의 마이크를 턴 오프시키기 위한 제어 신호를 상기 통신 인터페이스를 통해 전송할 수 있다.
또한, 상기 적어도 하나의 프로세서는, 게임 컨텐츠에 대응되는 오디오 신호가 상기 외부 장치 또는 상기 스피커 중 적어도 하나로 출력되는 동안, 상기 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 외부 장치가 프라이버시 기기인지 식별할 수 있다.
또한, 상기 적어도 하나의 프로세서는, 상기 외부 장치의 식별 정보에 기초하여 상기 외부 장치가 프라이버시 기기인지 여부를 식별할 수 있다.
또한, 상기 외부 장치는, 헤드셋(headset), 리모콘(remote controller), 마이크(microphone) 또는 스피커(speaker) 중 적어도 하나를 포함할 수 있다.
한편, 본 개시의 일 실시 예에 따른 통신 인터페이스 및 스피커를 포함하는 전자 장치의 제어 방법은, 상기 통신 인터페이스를 통해 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 외부 장치가 프라이버시(Privacy) 기기인지 식별하는 단계, 상기 외부 장치가 프라이버시(Privacy) 기기로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 통신 인터페이스를 통해 상기 외부 장치로 출력하는 단계, 및 상기 외부 장치가 상기 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 스피커로 출력하는 단계를 더 포함할 수 있다.
여기서, 상기 외부 장치가 상기 프라이버시 기기인지 식별하는 단계는, 상기 외부 장치로부터 음성 인식을 위한 트리거 신호가 수신되면, 음성 인식 기능을 활성화시키고 상기 외부 장치가 프라이버시 기기인지 식별하는 단계, 및 상기 프라이버시 기기로 식별된 상기 외부 장치로부터 사용자의 후속 음성에 대응되는 신호가 수신되면, 상기 수신된 신호에 대한 음성 인식을 수행하는 단계를 더 포함할 수 있으며, 상기 응답 신호를 상기 통신 인터페이스를 통해 상기 외부 장치로 출력하는 단계는, 음성 인식 결과에 기초하여 상기 수신된 신호에 대한 상기 통신 인터페이스를 통해 상기 외부 장치로 출력하는 단계를 더 포함할 수 있다.
또한, 상기 전자 장치는, 상기 통신 인터페이스와 연결된 제1 오디오 출력부 및 상기 스피커와 연결된 제2 오디오 출력부를 더 포함하며, 상기 프라이버시 기기인지 식별하는 단계는, 오디오 컨텐츠에 대응되는 오디오 신호를 상기 제1 오디오 출력부 또는 제2 오디오 출력부 중 적어도 하나로 출력하는 동안, 상기 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 외부 장치가 프라이버시 기기인지 식별하고, 상기 응답 신호를 상기 통신 인터페이스를 통해 상기 외부 장치로 출력하는 단계는, 상기 외부 장치가 프라이버시 기기로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 오디오 신호의 출력 볼륨과 동일한 크기의 제1 출력 볼륨으로 출력하도록 상기 제1 오디오 출력부를 제어하고, 상기 응답 신호를 상기 스피커로 출력하는 단계는, 상기 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 오디오 신호의 볼륨과 상이한 크기의 제2 출력 볼륨으로 출력하도록 상기 제2 오디오 출력부를 제어할 수 있다.
또한, 상기 제2 출력 볼륨은, 상기 오디오 신호의 출력 볼륨 크기보다 클 수 있다.
또한, 상기 제어 방법은, 상기 통신 인터페이스를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 복수의 외부 장치 각각이 프라이버시 기기인지 식별하는 단계, 및 상기 복수의 외부 장치 중 제1 외부 장치가 프라이버시 기기로 식별되고 제2 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 스피커로 출력하는 단계를 더 포함할 수 있다.
또한, 상기 제어 방법은, 상기 통신 인터페이스를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 수신된 음성 신호의 크기에 기초하여 상기 복수의 외부 장치 중 하나를 식별하는 단계, 및 상기 식별된 외부 장치가 프라이버시 기기로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 외부 장치로 출력하고, 상기 식별된 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면 상기 음성 신호에 대한 응답 신호를 상기 스피커로 출력하는 단계를 더 포함할 수 있다.
또한, 상기 통신 인터페이스를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면, 상기 복수의 외부 장치 각각이 프라이버시 기기인지 식별하는 단계, 및 상기 복수의 외부 장치 중 프라이버시 기기가 아닌 것으로 식별된 장치의 마이크를 턴 오프시키기 위한 제어 신호를 상기 통신 인터페이스를 통해 전송하는 단계를 더 포함할 수 있다.
또한, 상기 외부 장치가 상기 프라이버시 기기인지 식별하는 단계는, 게임 컨텐츠에 대응되는 오디오 신호가 상기 외부 장치 또는 상기 스피커 중 적어도 하나로 출력되는 동안, 상기 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 외부 장치가 프라이버시 기기인지 식별할 수 있다.
또한, 상기 외부 장치가 상기 프라이버시 기기인지 식별하는 단계는, 상기 외부 장치의 식별 정보에 기초하여 상기 외부 장치가 프라이버시 기기인지 여부를 식별할 수 있다.
또한, 통신 인터페이스 및 스피커를 포함하는 전자 장치의 프로세서에 의해 실행되는 경우 상기 전자 장치가 동작을 수행하도록 하는 컴퓨터 명령을 저장하는 비일시적 컴퓨터 판독 가능 매체에 있어서, 상기 동작은, 상기 통신 인터페이스를 통해 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 외부 장치가 프라이버시(Privacy) 기기인지 식별하는 단계, 상기 외부 장치가 프라이버시(Privacy) 기기로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 통신 인터페이스를 통해 상기 외부 장치로 출력하는 단계, 및 상기 외부 장치가 상기 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 스피커로 출력하는 단계를 더 포함할 수 있다.
상술한 바와 같은 다양한 실시 예에 따르면 전자 장치와 연결된 외부 장치의 타입에 따라 음성 신호에 대한 응답 신호를 출력할 장치를 식별할 수 있게 되므로 사용자 편의성이 증대된다.
도 1은 본 개시의 일 실시 예에 따른 전자 장치의 구현 형태를 설명하기 위한 도면이다.
도 2는 본 개시의 일 실시 예에 따른 전자 장치의 구성을 나타내는 블럭도이다.
도 3은 본 개시의 일 실시 예에 따른 외부 장치의 타입에 따른 응답 신호의 출력 장치를 식별하는 방법을 설명하기 위한 도면이다.
도 4는 본 개시의 일 실시 예에 따른 외부 장치의 타입에 따른 응답 신호의 출력 장치를 식별하는 방법을 설명하기 위한 도면이다.
도 5는 본 개시의 일 실시 예에 따른 응답 신호의 출력 볼륨 크기를 제어하는 방법을 설명하기 위한 도면이다.
도 6은 본 개시의 일 실시 예에 따른 응답 신호의 출력 볼륨 크기를 제어하는 방법을 설명하기 위한 도면이다.
도 7은 본 개시의 일 실시 예에 따른 복수의 외부 장치로부터 음성 신호가 수신된 경우 응답 신호 출력을 제어하는 방법을 설명하기 위한 도면이다.
도 8a는 본 개시의 일 실시 예에 따른 음성 신호의 크기에 기초하여 외부 장치를 식별하는 방법을 설명하기 위한 도면이다.
도 8b는 본 개시의 일 실시 예에 따른 음성 신호의 크기에 기초하여 외부 장치를 식별하는 방법을 설명하기 위한 도면이다.
도 9는 본 개시의 일 실시 예에 따른 복수의 외부 장치의 타입에 따라 외부 장치를 제어하는 방법을 설명하기 위한 도면이다.
도 10은 본 개시의 일 실시 예에 따른 재생 중인 컨텐츠의 타입에 따른 응답 신호의 출력 방법을 설명하기 위한 도면이다.
도 11은 본 개시의 일 실시 예에 따른 전자 장치의 일 구현 예를 나타내는 도면이다.
도 12는 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법을 설명하기 위한 흐름도이다.
이하에서는 첨부 도면을 참조하여 본 개시를 상세히 설명한다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 개시에 대해 구체적으로 설명하기로 한다.
본 개시의 실시 예에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 개시의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.
본 명세서에서, "가진다," "가질 수 있다," "포함한다," 또는 "포함할 수 있다" 등의 표현은 해당 특징(예: 수치, 기능, 동작, 또는 부품 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다.
A 또는/및 B 중 적어도 하나라는 표현은 "A" 또는 "B" 또는 "A 및 B" 중 어느 하나를 나타내는 것으로 이해되어야 한다.
본 명세서에서 사용된 "제1," "제2," "첫째," 또는 "둘째,"등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다.
어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "(기능적으로 또는 통신적으로) 연결되어((operatively or communicatively) coupled with/to)" 있다거나 "접속되어(connected to)" 있다고 언급된 때에는, 어떤 구성요소가 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제3 구성요소)를 통하여 연결될 수 있다고 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "구성되다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 개시에서 "모듈" 혹은 "부"는 적어도 하나의 기능이나 동작을 수행하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 "모듈" 혹은 복수의 "부"는 특정한 하드웨어로 구현될 필요가 있는 "모듈" 혹은 "부"를 제외하고는 적어도 하나의 모듈로 일체화되어 적어도 하나의 프로세서(미도시)로 구현될 수 있다.
이하 첨부된 도면들을 참조하여 본 개시의 일 실시 예를 보다 상세하게 설명한다.
도 1은 본 개시의 일 실시 예에 따른 전자 장치의 구현 형태를 설명하기 위한 도면이다.
전자 장치(100)는 도시된 바와 같이 예를 들어 TV가 될 수 있으나, 이에 한정되는 것은 아니며 NED(Near Eye Display), LFD(large format display), Digital Signage(디지털 간판), DID(Digital Information Display), 비디오 월(video wall), 스마트폰, 노트북, 태블릿, HMD(Head mounted Display) 등 디스플레이가 가능한 다양한 장치로 구현가능하다.
일 예에 따라 전자 장치(100)는 사용자 음성이 수신되면, 사용자 음성에 대응되는 응답 신호를 제공하는 음성 인식 기능을 수행할 수 있다. 일 예에 따라 사용자 음성은 전자 장치(100)에 구비된 스피커(120)를 통해 수신될 수 있으나, 다른 예에 따라 사용자 음성은 외부 장치(200)로부터 수신될 수 있다. 예를 들어, 외부 장치(200)는 헤드셋(200-1), 리모콘(200-2), 마이크로폰(200-3) 및 스피커(200-4) 와 같은 다양한 타입의 장치로 구현될 수 있다.
일 예에 따라 전자 장치(100)는 사용자 음성에 대한 응답 신호를 미리 설정된 장치로 출력할 수 있다. 이 경우, 전자 장치(100)가 TV와 같은 퍼블릭 기기로 구현되는 경우 TV 스피커(120)를 통해 컨텐츠 재생 사운드가 출력되는 동안 TV 스피커(120)로 응답 신호가 출력되면, 컨텐츠 재생 사운드와의 간섭이 일어날 수 있다. 또한, 컨텐츠 재생 사운드가 헤드셋(200-1)과 같은 프라이버시 기기를 통해 출력되는 동안 TV 스피커(120)로 응답 신호가 출력되면 사용자가 응답 신호를 명확히 청취할 수 없다는 문제점이 있을 수 있다.
이에 따라, 이하에서는 전자 장치(100)에 연결된 외부 장치의 타입에 다라 사용자 음성에 대한 응답 신호를 상이한 외부 장치로 출력하는 다양한 실시 예에 대해 설명하도록 한다.
도 2는 본 개시의 일 실시 예에 따른 전자 장치의 구성을 나타내는 블럭도이다.
도 2에 따르면, 전자 장치(100)는 통신 인터페이스(110), 스피커(120), 메모리(130) 및 적어도 하나의 프로세서(140)를 포함할 수 있다.
통신 인터페이스(110)는 전자 장치(100)의 구현 예에 따라 다양한 인터페이스로 구현될 수 있다. 예를 들어 통신 인터페이스(110)는 다양한 타입의 디지털 인터페이스, AP 기반의 Wi-Fi(와이파이, Wireless LAN 네트워크), 블루투스(Bluetooth), 지그비(Zigbee), 유/무선 LAN(Local Area Network), WAN(Wide Area Network), 이더넷(Ethernet), IEEE 1394, HDMI(High-Definition Multimedia Interface), USB(Universal Serial Bus), MHL(Mobile High-Definition Link), AES/EBU(Audio Engineering Society/ European Broadcasting Union), 옵티컬(Optical), 코액셜(Coaxial) 등과 같은 통신 방식을 통해 외부 장치(200)와 통신을 수행할 수 있다.
스피커(120)는 적어도 하나의 프로세서(140)에서 처리된 오디오 신호를 출력할 수 있다. 여기서, 스피커(120)는 적어도 하나의 스피커 유닛을 포함할 수 있다. 적어도 하나의 스피커 유닛은 전기 펄스를 음파로 변환시키는 기능을 하며, 전기신호를 음파로 변환시키는 원리와 방법에 따라 구분되는 동전형(動電型) 즉, 다이내믹 형으로 구현될 수 있다. 다만, 이에 한정되는 것은 아니며 본 발명이 적용되는 범위 내에서 정전형(靜電型), 유전체형(誘電體型), 자기왜형(磁氣歪型) 등으로 구현될 수도 있다. 여기서, 적어도 하나의 스피커 유닛은 복수 개로 구현되어 2 채널, 2.1 채널, 3 채널, 3.1 채널, 5.1 채널, 7.1 채널 등과 같이 복수의 채널을 각각 담당하여 재생할 수 있다. 예를 들어, 복수의 스피커 유닛은 L(Left) 채널 스피커 및 R(Right) 채널 스피커를 포함할 수 있다.
메모리(130)는 본 개시의 다양한 실시 예를 위해 필요한 데이터를 저장할 수 있다. 메모리(130)는 데이터 저장 용도에 따라 전자 장치(100)에 임베디드된 메모리 형태로 구현되거나, 전자 장치(100)에 탈부착이 가능한 메모리 형태로 구현될 수도 있다. 예를 들어, 전자 장치(100)의 구동을 위한 데이터의 경우 전자 장치(100)에 임베디드된 메모리에 저장되고, 전자 장치(100)의 확장 기능을 위한 데이터의 경우 전자 장치(100)에 탈부착이 가능한 메모리에 저장될 수 있다. 한편, 전자 장치(100)에 임베디드된 메모리의 경우 휘발성 메모리(예: DRAM(dynamic RAM), SRAM(static RAM), 또는 SDRAM(synchronous dynamic RAM) 등), 비휘발성 메모리(non-volatile Memory)(예: OTPROM(one time programmable ROM), PROM(programmable ROM), EPROM(erasable and programmable ROM), EEPROM(electrically erasable and programmable ROM), mask ROM, flash ROM, 플래시 메모리(예: NAND flash 또는 NOR flash 등), 하드 드라이브, 또는 솔리드 스테이트 드라이브(solid state drive(SSD)) 중 적어도 하나로 구현될 수 있다. 또한, 전자 장치(100)에 탈부착이 가능한 메모리의 경우 메모리 카드(예를 들어, CF(compact flash), SD(secure digital), Micro-SD(micro secure digital), Mini-SD(mini secure digital), xD(extreme digital), MMC(multi-media card) 등), USB 포트에 연결 가능한 외부 메모리(예를 들어, USB 메모리) 등과 같은 형태로 구현될 수 있다.
본 개시의 일 실시 예에 따라 메모리(130)는 외부 장치(200)의 식별 정보 별로 맵핑된 기기 타입 정보를 저장할 수 있다. 여기서, 식별 정보는, 모델 명 및 기기 일련 번호, 제조사 정보 중 적어도 하나를 포함할 수 있다. 또한, 기기 타입 정보는 프라이버시 기기 또는 퍼블릭 기기일 수 있다. 일 예에 따라 메모리(130)는 기기 모델 명에 대응되는 기기 타입 정보(프라이버시 기기 또는 퍼블릭 기기)가 맵핑된 룩업 테이블을 저장할 수 있다.
또한, 메모리(130)는 음성 인식과 관련된 정보를 저장할 수 있다. 일 예로, 메모리(130)는 음성 인식을 위한 트리거 음성에 대응되는 정보가 저장할 수 있다. 예를 들어, 메모리(130)는 사용자의 트리거 음성에 대응되는 주파수 정보를 저장할 수 있다. 다른 예로, 메모리(130)는 기본적인 응답 신호를 생성하기 위한 템플릿 정보를 저장할 수 있다. 또 다른 예로, 메모리(130)는 음성 인식을 위한 음성 인식 모듈을 저장할 수 있다. 여기서, 음성 인식 모듈은 자연 언어 이해(Natural Language Understanding, NLU) 모듈, 자동 음성 인식(Automatic Speech Recognition, ASR) 모듈 등을 포함할 수 있으나 이에 한정되는 것은 아니다.
프로세서(140)는 통신 인터페이스(110), 스피커(120) 및 메모리(130)와 전기적으로 연결되어 전자 장치(100)의 전반적인 동작을 제어한다. 프로세서(140)는 하나 또는 복수의 프로세서로 구성될 수 있다. 구체적으로, 프로세서(140)는 메모리(130)에 저장된 적어도 하나의 인스트럭션(instruction)을 실행함으로써, 본 개시의 다양한 실시 예에 따른 전자 장치(100)의 동작을 수행할 수 있다.
본 개시의 일 실시 예에 따라 프로세서(140)는 디지털 영상 신호를 처리하는 디지털 시그널 프로세서(digital signal processor(DSP), 마이크로 프로세서(microprocessor), GPU(Graphics Processing Unit), AI(Artificial Intelligence) 프로세서, NPU (Neural Processing Unit), TCON(Time controller)으로 구현될 수 있다. 다만, 이에 한정되는 것은 아니며, 중앙처리장치(central processing unit(CPU)), MCU(Micro Controller Unit), MPU(micro processing unit), 컨트롤러(controller), 애플리케이션 프로세서(application processor(AP)), 또는 커뮤니케이션 프로세서(communication processor(CP)), ARM 프로세서 중 하나 또는 그 이상을 포함하거나, 해당 용어로 정의될 수 있다. 또한, 프로세서(140)는 프로세싱 알고리즘이 내장된 SoC(System on Chip), LSI(large scale integration)로 구현될 수도 있고, ASIC(application specific integrated circuit), FPGA(Field Programmable gate array) 형태로 구현될 수도 있다.
적어도 하나의 프로세서(140)는 통신 인터페이스(110)를 제어하여 전자 장치(100)와 연결된 외부 장치(200)로부터 음성 신호를 수신할 수 있다. 여기서, 음성 신호는 음성 인식 기능을 활성화시키는 트리거 신호, 음성 명령 신호, 음성 인식 기능을 종료하기 위한 신호 등을 포함하는 다양한 사용자 음성 신호가 될 수 있다.
본 개시의 일 실시 예에 따라 프로세서(140)는 통신 인터페이스(110)를 통해 외부 장치(200)로부터 사용자의 음성 신호가 수신되면 외부 장치(200)가 프라이버시 기기(Privacy) 기기인지 여부를 식별할 수 있다. 이어서, 프로세서(140)는 외부 장치(200)가 프라이버시 기기로 식별되면, 음성 신호에 대한 응답 신호를 통신 인터페이스(110)를 통해 외부 장치(200)로 출력할 수 있다.
도 3은 본 개시의 일 실시 예에 따른 외부 장치의 타입에 따른 응답 신호의 출력 장치를 식별하는 방법을 설명하기 위한 도면이다.
일 예에 따르면, 외부 장치(200)는 헤드셋으로 구현될 수 있고, 마이크(210) 및 스피커(220)를 포함할 수 있다.
일 실시 예에 따라 프로세서(140)는 통신 인터페이스(110)를 통해 외부 장치(200)로부터 사용자의 음성 신호가 수신되면 외부 장치(200)가 프라이버시(Privacy) 기기인지 식별할 수 있다.
도 3에 도시된 바와 같이 외부 장치(200)의 오디오 입력부(210)를 통해 수신된 사용자 음성 신호가 통신 인터페이스(110)를 통해 수신된 경우, 프로세서(140)는 외부 장치(200)의 식별 정보에 기초하여 외부 장치(200)가 프라이버시 기기인지 식별할 수 있다. 일 예에 따라 전자 장치(100) 및 외부 장치(200)가 블루투스 통신 연결된 경우, 블루투스 통신 페어링에 따라 수신된 외부 장치(200)의 식별 정보에 기초하여 외부 장치(200)가 프라이버시 기기인지 식별할 수 있다. 예를 들어, 메모리(130)에 저장된 저장된 맵핑 정보에 기초하여 외부 장치(200) 즉, 헤드셋이 프라이버시 기기인 것으로 식별할 수 있다.
이어서, 프로세서(140)는 외부 장치(200)가 프라이버시 기기로 식별되면, 사용자 음성 신호에 대응되는 응답 신호를 외부 장치(200)로 출력하도록 통신 인터페이스(110)를 제어할 수 있다. 예를 들어, “지금 몇 시야?” 라는 사용자 음성이 수신되면, “오후 3시 입니다”와 같은 응답 정보를 통신 인터페이스(110)를 통해 외부 장치(200)로 출력할 수 있다.
도 2로 돌아와서, 프로세서(140)는 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 음성 신호에 대한 응답 신호를 스피커(120)를 통해 출력할 수 있다.
도 4는 본 개시의 일 실시 예에 따른 외부 장치의 타입에 따른 응답 신호의 출력 장치를 식별하는 방법을 설명하기 위한 도면이다.
도 4에 도시된 바와 같이 프로세서(140)는 외부 장치(200)가 프라이버시 기기가 아닌 것으로 식별되면, 사용자 음성 신호에 대응되는 응답 신호를 스피커(120)를 통해 출력할 수 있다. 예를 들어, “지금 몇 시야?” 라는 사용자 음성이 수신되면, “오후 3시 입니다”와 같은 응답 정보를 스피커(120)로 출력할 수 있다.
도 2로 돌아와서, 프로세서(140)는 외부 장치로부터 음성 인식을 위한 트리거 신호가 수신되면, 음성 인식 기능을 활성화시키고 외부 장치가 프라이버시 기기인지 식별할 수 있다. 여기서, 음성 인식을 위한 트리거 신호는 “Hi - Bixby”와 같은 제조사, 제품 또는 사용자 중 적어도 하나에 기초하여 설정된 음성 신호일 수 있다.
일 실시 예에 따르면, 프로세서(140)는 프라이버시 기기로 식별된 외부 장치로부터 사용자의 후속 음성에 대응되는 신호가 수신되면, 수신된 신호에 대한 음성 인식을 수행할 수 있다. 또한, 프로세서(140)는 음성 인식 결과에 기초하여 수신된 신호에 대한 응답 신호를 외부 장치로 출력하도록 통신 인터페이스(110)를 제어할 수 있다.
일 실시 예에 따르면, 프로세서(140)는 외부 장치가 프라이버시 기기로 식별되면, 음성 신호에 대한 응답 신호를 오디오 신호의 출력 볼륨과 동일한 크기의 제 1 출력 볼륨으로 외부 장치로 출력하고, 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 음성 신호에 대한 응답 신호를 오디오 신호의 볼륨과 상이한 크기의 제2 출력 볼륨으로 출력하도록 스피커(120)를 제어할 수 있다.
일 실시 예에 따르면, 프로세서(140)는 오디오 컨텐츠에 대응되는 오디오 신호를 제1 오디오 출력부(미도시) 또는 제2 오디오 출력부(미도시) 중 적어도 하나로 출력하는 동안, 외부 장치로부터 사용자의 음성 신호가 수신되면 외부 장치가 프라이버시 기기인지를 식별할 수 있다. 여기서, 제1 오디오 출력부(미도시)는 오디오 신호를 처리하여 통신 인터페이스(110)로 전달할 수 있다. 제1 오디오 출력부(미도시)는 D/A 컨버터, 오디오 앰프(audio amplifier)을 포함할 수 있으나, 이에 한정되는 것은 아니며 통신 인터페이스(110)의 일부로 구현되는 것도 가능하다. 여기서, 제2 오디오 출력부(미도시)는 오디오 신호를 처리하여 스피커(130)로 전달할 수 있다. 제1 오디오 출력부(미도시)는 D/A 컨버터, 오디오 앰프(audio amplifier)을 포함할 수 있으나, 이에 한정되는 것은 아니며 통신 스피커(130)의 일부로 구현되는 것도 가능하다.
이 경우, 프로세서(140)는 외부 장치가 프라이버시 기기로 식별되면, 음성 신호에 대한 응답 신호를 오디오 신호의 출력 볼륨과 동일한 크기의 제 1 출력 볼륨으로 출력하도록 제1 오디오 출력부(미도시)를 제어할 수 있다.
또한, 프로세서(140)는 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 음성 신호에 대한 응답 신호를 오디오 신호의 볼륨과 상이한 크기의 제2 출력 볼륨으로 출력하도록 제2 오디오 출력부(미도시)를 제어할 수 있다. 여기서, 제2 출력 볼륨은 오디오 신호의 출력 볼륨 크기보다 클 수 있다.
도 5 및 도 6은 본 개시의 일 실시 예에 따른 응답 신호의 출력 볼륨 크기를 제어하는 방법을 설명하기 위한 도면들이다.
도 5에 따르면, 프로세서(140)는 오디오 컨텐츠에 대응되는 오디오 신호가 외부 장치(200)의 스피커(220)로 출력되는 동안, 외부 장치(200)로부터 사용자의 음성 신호가 수신되면 외부 장치(200)가 프라이버시 기기인지를 식별할 수 있다. 이어서, 프로세서(140)는 외부 장치(200)가 프라이버시 기기로 식별되면, 사용자의 음성 신호에 대한 응답 신호를 오디오 신호의 출력 볼륨(221)과 동일한 크기의 제1 출력 볼륨(222)으로 출력하도록 통신 인터페이스(110)와 연결된 제1 오디오 출력부(미도시)를 제어할 수 있다. 이에 따라, “지금 몇 시야?”라는 사용자 음성에 기초하여 “오후 세시입니다.”라는 응답 정보가 외부 장치(200)의 스피커(220)를 통해 출력되는 경우, 오디오 신호의 출력 볼륨(221)과 동일한 크기의 제1 출력 볼륨(222)으로 응답 정보가 출력될 수 있다.
도 6에 따르면, 프로세서(140)는 외부 장치(200)가 프라이버시 기기가 아닌 것으로 식별되면, 사용자의 음성 신호에 대한 응답 신호를 오디오 신호의 출력 볼륨(521)과 상이한 크기의 제2 출력 볼륨(522)으로 출력하도록 제2 오디오 출력부(미도시)를 제어할 수 있다. 이에 따라, “지금 몇 시야?”라는 사용자 음성에 기초하여 “오후 세시입니다.”라는 응답 정보가 스피커(120)를 통해 출력되는 경우, 오디오 신호의 출력 볼륨(521) 크기보다 큰 제2 출력 볼륨(522)으로 응답 정보가 출력될 수 있다. 예를 들어, 프로세서(140)는 오디오 신호의 출력 볼륨(521)이 사용자의 음성 신호가 입력되기 전보다 작게 출력되도록 스피커(120)를 제어할 수 있으나, 이에 한정되는 것은 아니다.
도 2로 돌아와서, 일 실시 예에 따라, 프로세서(140)는 통신 인터페이스(110)를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면 복수의 외부 장치 각각이 프라이버시 기기인지 식별할 수 있다.
일 실시 예에 따라, 프로세서(140)는 복수의 외부 장치 중 제1 외부 장치가 프라이버시 기기로 식별되고 제2 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 음성 신호에 대한 응답 신호를 통신 인터페이스(110)를 통해 제1 외부 장치로 출력하도록 통신 인터페이스(110)를 제어할 수 있다.
도 7은 본 개시의 일 실시 예에 따른 복수의 외부 장치로부터 음성 신호가 수신된 경우 응답 신호 출력을 제어하는 방법을 설명하기 위한 도면이다.
도 7에 따르면, 프로세서(140)는 통신 인터페이스(110)를 통해 복수의 외부 장치(200-1 및 200-2)로부터 사용자의 음성 신호가 수신되면, 메모리(130)에 저장된 맵핑 정보에 기초하여 복수의 외부 장치(200-1, 200-2) 중에 헤드셋(200-1)은 프라이버시 기기로, 리모콘(200-2)은 프라이버시 기기가 아닌 것 즉, 퍼블릭 기기인 것으로 식별할 수 있다. 이 경우, 프로세서(140)는 사용자 음성 신호에 대한 응답 신호를 통신 인터페이스(110)를 통해 프라이버시 기기인 헤드셋(200-1)으로 출력하고, 퍼블릭 기기인 리모콘(200-2)으로 출력하지 않을 수 있다.
도 2로 돌아와서, 일 실시 예에 따라, 프로세서(140)는 통신 인터페이스(110)를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면, 수신된 음성 신호의 크기에 기초하여 복수의 외부 장치 중 하나를 식별할 수 있다.
이어서, 프로세서(140)는 식별된 외부 장치가 프라이버시 기기로 식별되면, 음성 신호에 대한 응답 신호를 식별된 외부 장치로 출력하도록 통신 인터페이스(110)를 제어할 수 있다. 또한, 프로세서(140)는 식별된 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 음성 신호에 대한 응답 신호를 스피커(120)로 출력할 수 있다.
도 8a 및 도 8b는 본 개시의 일 실시 예에 따른 음성 신호의 크기에 기초하여 외부 장치를 식별하는 방법을 설명하기 위한 도면이다.
도 8a에 따르면, 프로세서(140)는 통신 인터페이스(110)를 통해 복수의 외부 장치(200-1, 200-2)로부터 사용자의 음성 신호가 수신되면, 복수의 외부 장치(200-1, 200-2) 중에서 수신된 음성 신호의 크기가 상대적으로 큰 외부 장치 예를 들어, 헤드셋(200-1)을 식별하고, 헤드셋(200-1)이 프라이버시 기기로 식별되면 사용자 음성 신호에 대한 응답 신호를 통신 인터페이스(110)를 통해 헤드셋(200-1)으로 출력할 수 있다.
도 8b에 따르면, 프로세서(140)는 통신 인터페이스(110)를 통해 복수의 외부 장치(200-1, 200-2)로부터 사용자의 음성 신호가 수신되면, 복수의 외부 장치(200-1, 200-2) 중에서 수신된 음성 신호의 크기가 상대적으로 큰 외부 장치 예를 들어, 리모콘(200-2)을 식별하고, 리모콘(200-2)이 프라이버시 기기가 아닌 것으로 식별되면, 사용자 음성 신호에 대한 응답 신호를 스피커(120)로 출력할 수 있다.
도 2로 돌아와서, 프로세서(140)는 통신 인터페이스(110)를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면, 복수의 외부 장치 각각이 프라이버시 기기인지 식별하고, 복수의 외부 장치 중 프라이버시 기기가 아닌 것으로 식별된 장치의 마이크(미도시)를 턴 오프시키기 위한 제어 신호를 통신 인터페이스(110)를 통해 전송할 수 있다.
도 9는 본 개시의 일 실시 예에 따른 복수의 외부 장치의 타입에 따라 외부 장치를 제어하는 방법을 설명하기 위한 도면이다.
도 9에 따르면, 프로세서(140)는 통신 인터페이스(110)를 통해 복수의 외부 장치(200-1 및 200-2)로부터 사용자의 음성 신호가 수신되면, 복수의 외부 장치(200-1 및 200-2) 중 헤드셋(200-1)은 프라이버시 기기로 식별하고, 리모콘(200-2)은 프라이버시 기기가 아닌 것으로 식별할 수 있다. 이어서, 프로세서(140)는 사용자 음성 신호에 대한 응답 신호를 통신 인터페이스(110)를 통해 프라이버시 기기로 식별된 헤드셋(200-1)으로 출력할 수 있다. 또한, 프로세서(140)는 프라이버시 기기가 아닌 것으로 것으로 식별된 리모콘(200-2)의 마이크(810)를 턴 오프시키기 위한 제어 신호를 통신 인터페이스(110)를 통해 리모콘(200-2)으로 전송할 수 있다.
도 2로 돌아와서, 프로세서(140)는 게임 컨텐츠에 대응되는 오디오 신호가 외부 장치 또는 스피커(120) 중 적어도 하나로 출력되는 동안, 외부 장치로부터 사용자의 음성 신호가 수신되면 외부 장치가 프라이버시 기기인지 식별할 수 있다. 즉, 프로세서(140)는 특정 타입의 컨텐츠에 대응되는 오디오 신호가 출력되는 동안, 외부 장치로부터 사용자의 음성 신호가 수신되면 외부 장치가 프라이버시 기기인지 식별할 수 있다. 다만, 이에 한정되는 것은 아니며 특정 디스플레이 모드(예를 들어, 게임 모드)가 제공되는 동안 외부 장치로부터 사용자의 음성 신호가 수신되면 외부 장치가 프라이버시 기기인지 식별할 수 있다.
도 10은 본 개시의 일 실시 예에 따른 재생 중인 컨텐츠의 타입에 따른 응답 신호의 출력 방법을 설명하기 위한 도면이다.
도 10에 따르면, 프로세서(140)는 게임 컨텐츠에 대응되는 오디오 신호가 외부 장치인 헤드셋(200-1)으로 출력되는 동안, 헤드셋(200-1)으로부터 사용자의 음성 신호가 수신되면 헤드셋(200-1)이 프라이버시 기기인지 식별하고, 헤드셋(200-1)이 프라이버시 기기로 식별되면, 사용자의 음성 신호에 대한 응답 신호를 통신 인터페이스(110)를 통하여 헤드셋(200-1)으로 출력할 수 있다. 즉, 게임 컨텐츠와 같은 프라이버시 컨텐츠가 제공되는 동안 프라이버시 기기로부터 사용자 음성 신호가 수신되면 응답 신호를 해당 기기로만 출력할 수 있다.
또한, 도 10에 따라 프로세서(140)는 방송 컨텐츠에 대응되는 오디오 신호가 외부 장치인 헤드셋(200-1)으로 출력되는 동안, 헤드셋(200-1)으로부터 사용자의 음성 신호가 수신되면 프라이버시 기기인지 식별하고, 헤드셋(200-1)이 프라이버시 기기로 식별되면, 사용자의 음성 신호에 대한 응답 신호를 통신 인터페이스(110)를 통하여 헤드셋(200-1)으로 출력하거나 TV 스피커(120)로 출력할 수 있다. 이 경우 헤드셋(200-1) 및 TV 스피커(120)에서 동시에 출력될 수도 있다. 즉, 방송 컨텐츠와 같은 퍼블릭 컨텐츠가 제공되는 동안 프라이버시 기기로부터 사용자 음성 신호가 수신되더라도 응답 신호를 해당 기기 뿐 아니라 TV 스피커(120)를 통해서도 출력할 수 있다.
상술한 바와 같이 프로세서(140)는 현재 제공되는 컨텐츠의 타입에 따라 사용자의 음성 신호에 대한 응답 신호를 출력할 장치를 상이하게 결정할 수 있다.
도 11은 본 개시의 일 실시 예에 따른 전자 장치의 일 구현 예를 나타내는 도면이다.
도 11에 따르면, 전자 장치(100')는 통신 인터페이스(110), 스피커(120), 메모리(130), 프로세서(140), 오디오 출력부(150), 디스플레이(160), 사용자 인터페이스(170) 및 마이크(180)를 포함할 수 있다. 도 11에 도시된 구성 중 도 2에 도시된 구성과 중복되는 구성에 대해서는 자세한 설명을 생략하도록 한다.
오디오 출력부(150)는 오디오 신호를 처리하여 제공할 수 있다.
일 예에 따라 오디오 출력부(150)는 오디오 신호를 처리하여 통신 인터페이스(110) 또는 스피커(130)로 전달할 수 있다. 여기서, 오디오 출력부(150)는 D/A 컨버터, 오디오 앰프(audio amplifier)을 포함할 수 있으나, 이에 한정되는 것은 아니다.
다른 예에 따라 오디오 출력부(150)는 제1 오디오 출력부(미도시) 및 제2 오디오 출력부(미도시)를 포함할 수 있다. 여기서, 제1 오디오 출력부(미도시)는 오디오 신호를 처리하여 통신 인터페이스(110)로 전달하고, 제2 오디오 출력부(미도시)는 오디오 신호를 처리하여 스피커(130)로 전달할 수 있다. 제1 오디오 출력부(미도시) 및 제2 오디오 출력부(미도시)는 D/A 컨버터, 오디오 앰프(audio amplifier)을 포함할 수 있으나, 이에 한정되는 것은 아니다.
디스플레이(160)는 자발광 소자를 포함하는 디스플레이 또는, 비자발광 소자 및 백라이트를 포함하는 디스플레이로 구현될 수 있다. 예를 들어, LCD(Liquid Crystal Display), OLED(Organic Light Emitting Diodes) 디스플레이, LED(Light Emitting Diodes), 마이크로 LED(micro LED), Mini LED, PDP(Plasma Display Panel), QD(Quantum dot) 디스플레이, QLED(Quantum dot light-emitting diodes) 등과 같은 다양한 형태의 디스플레이로 구현될 수 있다. 디스플레이(110) 내에는 a-si TFT, LTPS(low temperature poly silicon) TFT, OTFT(organic TFT) 등과 같은 형태로 구현될 수 있는 구동 회로, 백라이트 유닛 등도 함께 포함될 수 있다. 한편, 디스플레이(110)는 터치 센서와 결합된 터치 스크린, 플렉시블 디스플레이(flexible display), 롤러블 디스플레이(rollable display), 3차원 디스플레이(3D display), 복수의 디스플레이 모듈이 물리적으로 연결된 디스플레이 등으로 구현될 수 있다. 또한, 디스플레이(110)는 터치 스크린을 내장하고 있어, 손가락 또는 펜(예를 들어, 스타일러스 펜)을 이용하여 프로그램을 실행시킬 수 있도록 구현될 수 있다.
사용자 인터페이스(170)는 사용자 인터페이스(160)는 버튼, 터치 패드, 마우스 및 키보드와 같은 장치로 구현되거나, 상술한 디스플레이 기능 및 조작 입력 기능도 함께 수행 가능한 터치 스크린, 리모콘 송수신부 등으로 구현될 수 있다. 리모콘 송수신부는 적외선 통신, 블루투스 통신 또는 와이파이 통신 중 적어도 하나의 통신 방식을 통해 외부 원격 제어 장치로부터 리모콘 신호를 수신하거나, 리모콘 신호를 송신할 수 있다.
마이크(180)는 사용자 음성이나 기타 소리를 입력 받아 오디오 데이터로 변환하기 위한 구성이다. 예를 들어, 본 개시의 다양한 실시 예와 관련된 사용자 음성 명령이 마이크(180)를 통해 수신될 수 있다.
전자 장치(100')는 구현 예에 따라 튜너 및 복조부를 추가적으로 포함할 수 있다. 튜너(미도시)는 안테나를 통해 수신되는 RF(Radio Frequency) 방송 신호 중 사용자에 의해 선택된 채널 또는 기 저장된 모든 채널을 튜닝하여 RF 방송 신호를 수신할 수 있다. 복조부(미도시)는 튜너에서 변환된 디지털 IF 신호(DIF)를 수신하여 복조하고, 채널 복호화 등을 수행할 수도 있다. 일 실시 예에 따라 튜너를 통해 수신된 입력 영상은 복조부(미도시)를 통해 처리된 후, 본 개시의 일 실시 예에 따른 톤 맵핑 처리를 위해 프로세서(140)로 제공될 수 있다.
상술한 도 1 내지 도 12에 기초하여 설명된 다양한 실시 예는 상호 조합 가능함은 물론이다.
도 12는 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법을 설명하기 위한 흐름도이다.
도 12에 따른 전자 장치의 제어 방법에 따르면, 통신 인터페이스를 통해 외부 장치로부터 사용자의 음성 신호가 수신되면(S1210), 외부 장치가 프라이버시(Privacy) 기기인지 여부를 식별한다(S1220). 이 후, 외부 장치가 프라이버시 기기로 식별되면(S1220:Y), 음성 신호에 대한 응답 신호를 외부 장치로 출력하도록 통신 인터페이스를 제어한다.(S1230).
또한, 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면(S1220:N), 음성 신호에 대한 응답 신호를 스피커로 출력한다(S1240).
S1220 단계에서는, 외부 장치로부터 음성 인식을 위한 트리거 신호가 수신되면, 음성 인식 기능을 활성화시키고 외부 장치가 프라이버시 기기인지 식별하는 단계, 및 프라이버시 기기로 식별된 외부 장치로부터 사용자의 후속 음성에 대응되는 신호가 수신되면, 수신된 신호에 대한 음성 인식을 수행하는 단계를 더 포함할 수 있다. 이 경우, S1230 단계에서는, 음성 인식 결과에 기초하여 수신된 신호에 대한 통신 인터페이스를 통해 외부 장치로 출력하는 단계를 더 포함할 수 있다.
여기서, 전자 장치는 통신 인터페이스와 연결된 제1 오디오 출력부 및 스피커와 연결된 제2 오디오 출력부를 더 포함할 수 있다.
S1220 단계에서는, 오디오 컨텐츠에 대응되는 오디오 신호를 제1 오디오 출력부 또는 제2 오디오 출력부 중 적어도 하나로 출력하는 동안, 외부 장치로부터 사용자의 음성 신호가 수신되면 외부 장치가 프라이버시 기기인지 식별할 수 있다. 여기서, S1230 단계에서는, 외부 장치가 프라이버시 기기로 식별되면, 음성 신호에 대한 응답 신호를 오디오 신호의 출력 볼륨과 동일한 크기의 제1 출력 볼륨으로 출력하도록 상기 제1 오디오 출력부를 제어할 수 있다.
또한, S1240 단계에서는, 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 음성 신호에 대한 응답 신호를 오디오 신호의 볼륨과 상이한 크기의 제2 출력 볼륨으로 출력하도록 제2 오디오 출력부를 제어할 수 있다.
여기서, 제2 출력 볼륨은, 오디오 신호의 출력 볼륨 크기보다 크도록 제2 오디오 출력부를 제어할 수 있다.
이 경우, 제어 방법은, 통신 인터페이스를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면 복수의 외부 장치 각각이 프라이버시 기기인지 식별하는 단계, 및 복수의 외부 장치 중 제1 외부 장치가 프라이버시 기기로 식별되고 제2 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 음성 신호에 대한 응답 신호를 스피커로 출력하는 단계를 더 포함할 수 있다.
또한, 제어방법은, 통신 인터페이스를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면 수신된 음성 신호의 크기에 기초하여 복수의 외부 장치 중 하나를 식별하는 단계, 및 식별된 외부 장치가 프라이버시 기기로 식별되면, 음성 신호에 대한 응답 신호를 외부 장치로 출력하고, 식별된 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면 음성 신호에 대한 응답 신호를 스피커로 출력하는 단계를 더 포함할 수 있다.
또한, 제어 방법은 통신 인터페이스를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면, 복수의 외부 장치 각각이 프라이버시 기기인지 식별하는 단계, 및 복수의 외부 장치 중 프라이버시 기기가 아닌 것으로 식별된 장치의 마이크를 턴 오프시키기 위한 제어 신호를 통신 인터페이스를 통해 전송하는 단계를 더 포함할 수 있다.
S1220 단계에서는, 게임 컨텐츠에 대응되는 오디오 신호가 외부 장치 또는 스피커 중 적어도 하나로 출력되는 동안, 외부 장치로부터 사용자의 음성 신호가 수신되면 외부 장치가 프라이버시 기기인지 식별할 수 있다.
S1220 단계에서는, 외부 장치의 식별 정보에 기초하여 외부 장치가 프라이버시 기기인지 여부를 식별할 수 있다.
또한, 통신 인터페이스 및 스피커를 포함하는 전자 장치의 프로세서에 의해 실행되는 경우 전자 장치가 동작을 수행하도록 하는 컴퓨터 명령을 저장하는 비일시적 컴퓨터 판독 가능 매체에 있어서, 동작은 통신 인터페이스를 통해 외부 장치로부터 사용자의 음성 신호가 수신되면 외부 장치가 프라이버시(Privacy) 기기인지 식별하는 단계, 외부 장치가 프라이버시(Privacy) 기기로 식별되면, 음성 신호에 대한 응답 신호를 통신 인터페이스를 통해 외부 장치로 출력하는 단계, 및 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 음성 신호에 대한 응답 신호를 스피커로 출력하는 단계를 더 포함할 수 있다.
또한, 개시된 실시 예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)으로 제공될 수 있다. 컴퓨터 프로그램 제품은 S/W 프로그램, S/W 프로그램이 저장된 컴퓨터로 읽을 수 있는 저장 매체 또는 판매자 및 구매자 간에 거래되는 상품을 포함할 수 있다. 예를 들어, 컴퓨터 프로그램 제품은 전자 장치 또는 전자 장치의 제조사 또는 전자 마켓(예, 구글 플레이 스토어, 앱 스토어)을 통해 전자적으로 배포되는 S/W 프로그램 형태의 상품(예, 다운로더블 앱)을 포함할 수 있다. 전자적 배포를 위하여, S/W 프로그램의 적어도 일부는 저장 매체에 저장되거나, 임시적으로 생성될 수 있다. 이 경우, 저장 매체는 제조사 또는 전자 마켓의 서버, 또는 중계 서버의 저장 매체가 될 수 있다.
상술한 바와 같은 다양한 실시 예에 따르면 전자 장치와 연결된 외부 장치의 타입에 따라 음성 신호에 대한 응답 신호를 출력할 장치를 식별할 수 있게 되므로, 사용자 편의성이 증대된다.
한편, 상술한 본 개시의 다양한 실시 예들에 따른 방법들은, 기존 디스플레이 장치에 설치 가능한 어플리케이션 형태로 구현될 수 있다. 또는 상술한 본 개시의 다양한 실시 예들에 따른 방법들은 딥 러닝 기반의 인공 신경망(또는 심층 인공 신경망) 즉, 학습 네트워크 모델을 이용하여 수행될 수 있다.
또한, 상술한 본 개시의 다양한 실시 예들에 따른 방법들은, 기존 디스플레이 장치에 대한 소프트웨어 업그레이드, 또는 하드웨어 업그레이드 만으로도 구현될 수 있다.
또한, 상술한 본 개시의 다양한 실시 예들은 디스플레이 장치에 구비된 임베디드 서버, 또는 디스플레이 장치의 외부 서버를 통해 수행되는 것도 가능하다.
한편, 본 개시의 일시 예에 따르면, 이상에서 설명된 다양한 실시 예들은 기기(machine)(예: 컴퓨터)로 읽을 수 있는 저장 매체(machine-readable storage media)에 저장된 명령어를 포함하는 소프트웨어로 구현될 수 있다. 기기는, 저장 매체로부터 저장된 명령어를 호출하고, 호출된 명령어에 따라 동작이 가능한 장치로서, 개시된 실시 예들에 따른 디스플레이 장치(예: 디스플레이 장치(A))를 포함할 수 있다. 명령이 프로세서에 의해 실행될 경우, 프로세서가 직접, 또는 프로세서의 제어 하에 다른 구성요소들을 이용하여 명령에 해당하는 기능을 수행할 수 있다. 명령은 컴파일러 또는 인터프리터에 의해 생성 또는 실행되는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장매체가 신호(signal)를 포함하지 않으며 실재(tangible)한다는 것을 의미할 뿐 데이터가 저장매체에 반영구적 또는 임시적으로 저장됨을 구분하지 않는다.
또한, 본 개시의 일 실시 예에 따르면, 이상에서 설명된 다양한 실시 예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 온라인으로 배포될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
또한, 상술한 다양한 실시 예들에 따른 구성 요소(예: 모듈 또는 프로그램) 각각은 단수 또는 복수의 개체로 구성될 수 있으며, 전술한 해당 서브 구성 요소들 중 일부 서브 구성 요소가 생략되거나, 또는 다른 서브 구성 요소가 다양한 실시 예에 더 포함될 수 있다. 대체적으로 또는 추가적으로, 일부 구성 요소들(예: 모듈 또는 프로그램)은 하나의 개체로 통합되어, 통합되기 이전의 각각의 해당 구성 요소에 의해 수행되는 기능을 동일 또는 유사하게 수행할 수 있다. 다양한 실시 예들에 따른, 모듈, 프로그램 또는 다른 구성 요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱하게 실행되거나, 적어도 일부 동작이 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다.
이상에서는 본 개시의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 개시는 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 개시의 요지를 벗어남이 없이 당해 개시에 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 개시의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.

Claims (15)

  1. 전자 장치에 있어서,
    외부 장치와 통신하는 통신 인터페이스;
    스피커;
    적어도 하나의 명령을 저장하는 메모리; 및
    상기 통신 인터페이스, 상기 스피커 및 상기 메모리와 연결되어 상기 전자 장치를 제어하는 적어도 하나의 프로세서; 를 포함하며,
    상기 프로세서는,
    상기 적어도 하나의 명령어를 실행함으로써,
    상기 통신 인터페이스를 통해 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 외부 장치가 프라이버시(Privacy) 기기인지 식별하고,
    상기 외부 장치가 프라이버시(Privacy) 기기로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 통신 인터페이스를 통해 상기 외부 장치로 출력하고,
    상기 외부 장치가 상기 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 스피커를 통해 출력하는, 전자 장치.
  2. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 외부 장치로부터 음성 인식을 위한 트리거 신호가 수신되면, 음성 인식 기능을 활성화시키고 상기 외부 장치가 프라이버시 기기인지 식별하고,
    상기 프라이버시 기기로 식별된 상기 외부 장치로부터 사용자의 후속 음성에 대응되는 신호가 수신되면, 상기 수신된 신호에 대한 음성 인식을 수행하고,
    음성 인식 결과에 기초하여 상기 수신된 신호에 대한 응답 신호를 상기 외부 장치로 출력하도록 상기 통신 인터페이스를 제어하는, 전자 장치.
  3. 제1항에 있어서,
    상기 통신 인터페이스와 연결된 제1 오디오 출력부; 및
    상기 스피커와 연결된 제2 오디오 출력부;를 더 포함하며,
    상기 적어도 하나의 프로세서는,
    오디오 컨텐츠에 대응되는 오디오 신호를 상기 제1 오디오 출력부 또는 제2 오디오 출력부 중 적어도 하나로 출력하는 동안, 상기 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 외부 장치가 프라이버시 기기인지 식별하고,
    상기 외부 장치가 프라이버시 기기로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 오디오 신호의 출력 볼륨과 동일한 크기의 제1 출력 볼륨으로 출력하도록 상기 제1 오디오 출력부를 제어하고,
    상기 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 오디오 신호의 볼륨과 상이한 크기의 제2 출력 볼륨으로 출력하도록 상기 제2 오디오 출력부를 제어하는, 전자 장치.
  4. 제3항에 있어서,
    상기 제2 출력 볼륨은, 상기 오디오 신호의 출력 볼륨 크기보다 큰, 전자 장치.
  5. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 통신 인터페이스를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 복수의 외부 장치 각각이 프라이버시 기기인지 식별하고,
    상기 복수의 외부 장치 중 제1 외부 장치가 프라이버시 기기로 식별되고 제2 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 통신 인터페이스를 통해 상기 제1 외부 장치로 출력하는, 전자 장치.
  6. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 통신 인터페이스를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 수신된 음성 신호의 크기에 기초하여 상기 복수의 외부 장치 중 하나를 식별하고,
    상기 식별된 외부 장치가 프라이버시 기기로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 식별된 외부 장치로 출력하도록 상기 통신 인터페이스를 제어하고,
    상기 식별된 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 스피커로 출력하는, 전자 장치.
  7. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 통신 인터페이스를 통해 복수의 외부 장치로부터 사용자의 음성 신호가 수신되면, 상기 복수의 외부 장치 각각이 프라이버시 기기인지 식별하고,
    상기 복수의 외부 장치 중 프라이버시 기기가 아닌 것으로 식별된 장치의 마이크를 턴 오프시키기 위한 제어 신호를 상기 통신 인터페이스를 통해 전송하는, 전자 장치.
  8. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    게임 컨텐츠에 대응되는 오디오 신호가 상기 외부 장치 또는 상기 스피커 중 적어도 하나로 출력되는 동안, 상기 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 외부 장치가 프라이버시 기기인지 식별하는, 전자 장치.
  9. 제1항에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 외부 장치의 식별 정보에 기초하여 상기 외부 장치가 프라이버시 기기인지 여부를 식별하는, 전자 장치.
  10. 제1항에 있어서,
    상기 외부 장치는,
    헤드셋(headset), 리모콘(remote controller), 마이크(microphone) 또는 스피커(speaker) 중 적어도 하나를 포함하는, 전자 장치.
  11. 통신 인터페이스 및 스피커를 포함하는 전자 장치의 제어 방법에 있어서,
    상기 통신 인터페이스를 통해 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 외부 장치가 프라이버시(Privacy) 기기인지 식별하는 단계;
    상기 외부 장치가 프라이버시(Privacy) 기기로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 통신 인터페이스를 통해 상기 외부 장치로 출력하는 단계; 및
    상기 외부 장치가 상기 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 스피커로 출력하는 단계;를 포함하는 제어 방법.
  12. 제11항에 있어서,
    상기 외부 장치가 상기 프라이버시 기기인지 식별하는 단계는,
    상기 외부 장치로부터 음성 인식을 위한 트리거 신호가 수신되면, 음성 인식 기능을 활성화시키고 상기 외부 장치가 프라이버시 기기인지 식별하는 단계; 및
    상기 프라이버시 기기로 식별된 상기 외부 장치로부터 사용자의 후속 음성에 대응되는 신호가 수신되면, 상기 수신된 신호에 대한 음성 인식을 수행하는 단계;를 포함하며,
    상기 응답 신호를 상기 통신 인터페이스를 통해 상기 외부 장치로 출력하는 단계는,
    음성 인식 결과에 기초하여 상기 수신된 신호에 대한 상기 통신 인터페이스를 통해 상기 외부 장치로 출력하는 단계;를 포함하는, 제어 방법.
  13. 제11항에 있어서,
    상기 전자 장치는, 상기 통신 인터페이스와 연결된 제1 오디오 출력부 및 상기 스피커와 연결된 제2 오디오 출력부를 더 포함하며,
    상기 프라이버시 기기인지 식별하는 단계는,
    오디오 컨텐츠에 대응되는 오디오 신호를 상기 제1 오디오 출력부 또는 제2 오디오 출력부 중 적어도 하나로 출력하는 동안, 상기 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 외부 장치가 프라이버시 기기인지 식별하고,
    상기 응답 신호를 상기 통신 인터페이스를 통해 상기 외부 장치로 출력하는 단계는,
    상기 외부 장치가 프라이버시 기기로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 오디오 신호의 출력 볼륨과 동일한 크기의 제1 출력 볼륨으로 출력하도록 상기 제1 오디오 출력부를 제어하고,
    상기 응답 신호를 상기 스피커로 출력하는 단계는,
    상기 외부 장치가 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 오디오 신호의 볼륨과 상이한 크기의 제2 출력 볼륨으로 출력하도록 상기 제2 오디오 출력부를 제어하는, 제어 방법.
  14. 제13항에 있어서,
    상기 제2 출력 볼륨은, 상기 오디오 신호의 출력 볼륨 크기보다 큰, 제어 방법.
  15. 통신 인터페이스 및 스피커를 포함하는 전자 장치의 프로세서에 의해 실행되는 경우 상기 전자 장치가 동작을 수행하도록 하는 컴퓨터 명령을 저장하는 비일시적 컴퓨터 판독 가능 매체에 있어서, 상기 동작은,
    상기 통신 인터페이스를 통해 외부 장치로부터 사용자의 음성 신호가 수신되면 상기 외부 장치가 프라이버시(Privacy) 기기인지 식별하는 단계;
    상기 외부 장치가 프라이버시(Privacy) 기기로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 통신 인터페이스를 통해 상기 외부 장치로 출력하는 단계; 및
    상기 외부 장치가 상기 프라이버시 기기가 아닌 것으로 식별되면, 상기 음성 신호에 대한 응답 신호를 상기 스피커로 출력하는 단계;를 포함하는, 비일시적 컴퓨터 판독 가능 매체.
PCT/KR2022/012389 2021-08-19 2022-08-19 전자 장치 및 그 제어 방법 WO2023022552A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP22858789.5A EP4343758A1 (en) 2021-08-19 2022-08-19 Electronic device and control method therefor

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2021-0109726 2021-08-19
KR1020210109726A KR20230027673A (ko) 2021-08-19 2021-08-19 전자 장치 및 그 제어 방법

Publications (1)

Publication Number Publication Date
WO2023022552A1 true WO2023022552A1 (ko) 2023-02-23

Family

ID=85240875

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/012389 WO2023022552A1 (ko) 2021-08-19 2022-08-19 전자 장치 및 그 제어 방법

Country Status (3)

Country Link
EP (1) EP4343758A1 (ko)
KR (1) KR20230027673A (ko)
WO (1) WO2023022552A1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150087025A (ko) * 2014-01-21 2015-07-29 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
KR20150144547A (ko) * 2014-06-17 2015-12-28 엘지전자 주식회사 영상 표시 기기 및 그의 동작 방법
KR20180126946A (ko) * 2017-05-19 2018-11-28 네이버 주식회사 음성요청에 대응하는 정보 제공을 위한 미디어 선택
US20200074988A1 (en) * 2019-04-23 2020-03-05 Lg Electronics Inc. Method and apparatus for determining voice enable device
KR20200089412A (ko) * 2019-01-17 2020-07-27 (주)휴맥스 음성 인식 제어 시스템 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150087025A (ko) * 2014-01-21 2015-07-29 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
KR20150144547A (ko) * 2014-06-17 2015-12-28 엘지전자 주식회사 영상 표시 기기 및 그의 동작 방법
KR20180126946A (ko) * 2017-05-19 2018-11-28 네이버 주식회사 음성요청에 대응하는 정보 제공을 위한 미디어 선택
KR20200089412A (ko) * 2019-01-17 2020-07-27 (주)휴맥스 음성 인식 제어 시스템 및 방법
US20200074988A1 (en) * 2019-04-23 2020-03-05 Lg Electronics Inc. Method and apparatus for determining voice enable device

Also Published As

Publication number Publication date
KR20230027673A (ko) 2023-02-28
EP4343758A1 (en) 2024-03-27

Similar Documents

Publication Publication Date Title
WO2018044071A1 (en) Method for processing image and electronic device supporting the same
WO2019088793A1 (ko) 전자 장치 및 이를 이용한 화면 공유 방법
WO2020080746A1 (en) Display apparatus and control method thereof
WO2020166894A1 (en) Electronic device and method for recommending word in same
EP3714591A1 (en) Method for adaptively controlling low power display mode and electronic device thereof
WO2020184935A1 (en) Electronic apparatus and method for controlling thereof
WO2022124752A1 (ko) 전자 장치 및 전자 장치의 제어 방법
WO2019107719A1 (ko) 360 비디오에서 화자의 음성을 시각적으로 표시하기 위한 장치 및 방법
WO2023022552A1 (ko) 전자 장치 및 그 제어 방법
WO2015093754A1 (ko) 전자 장치에서 연결 정보를 공유하는 방법 및 장치
WO2020138909A1 (ko) 콘텐트 공유 방법 및 그 전자 장치
WO2020141769A1 (en) Display apparatus, display system having the same, and method thereof
WO2022092535A1 (ko) 전자 장치 및 그 제어 방법
WO2019059492A1 (en) ELECTRONIC APPARATUS, ITS CONTROL METHOD AND COMPUTER-READABLE RECORDING MEDIUM
WO2019035617A1 (en) DISPLAY APPARATUS AND METHOD FOR PROVIDING CONTENT THEREFOR
WO2017065522A1 (en) Display apparatus and the controlling method thereof
WO2021118184A1 (ko) 사용자 단말 및 그 제어방법
WO2017150841A1 (ko) 전자장치, 어플리케이션 실행 시스템 및 그 제어방법
WO2023113250A1 (ko) 디스플레이 장치 및 그 제어 방법
WO2021230421A1 (ko) 외부 장치로부터 획득된 정보를 바탕으로 통신 그룹의 장치에게 신호를 송신 또는 수신하는 전자 장치 및 이의 제어 방법
WO2022124560A1 (ko) 전자 장치 및 이의 제어 방법
WO2024010217A1 (ko) 특정 서비스를 수행하는 로봇 및 그 제어 방법
WO2021025274A1 (ko) 디스플레이장치 및 그 제어방법
WO2024101679A1 (ko) 전자 장치 및 이의 제어 방법
WO2023121265A1 (ko) 디스플레이 장치, 모듈러 디스플레이 장치 및 그 제어 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22858789

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2022858789

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2022858789

Country of ref document: EP

Effective date: 20231222

NENP Non-entry into the national phase

Ref country code: DE