WO2023003183A1 - Electronic device and real-time message generation method - Google Patents

Electronic device and real-time message generation method Download PDF

Info

Publication number
WO2023003183A1
WO2023003183A1 PCT/KR2022/008636 KR2022008636W WO2023003183A1 WO 2023003183 A1 WO2023003183 A1 WO 2023003183A1 KR 2022008636 W KR2022008636 W KR 2022008636W WO 2023003183 A1 WO2023003183 A1 WO 2023003183A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
electronic device
processor
graphic
message
Prior art date
Application number
PCT/KR2022/008636
Other languages
French (fr)
Korean (ko)
Inventor
안효인
강성훈
박예린
이재익
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Publication of WO2023003183A1 publication Critical patent/WO2023003183A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/50Business processes related to the communications industry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/10Multimedia information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements

Definitions

  • This document relates to an electronic device, and describes a method for generating a message based on a video or photo taken in real time by the electronic device, for example.
  • an electronic device With the development of mobile communication technology and hardware/software technology, a portable electronic device (hereinafter referred to as an electronic device) can implement various functions beyond a conventional call function.
  • An electronic device may exchange data by establishing a communication connection with an external device due to the development of communication technology.
  • Electronic devices enable real-time connection with external users using various message applications.
  • An electronic device may provide various message types usable in a message application.
  • the user may input text or emoticon into the electronic device using the provided keyboard UI.
  • an additional means of expression such as an emoticon, an emoji, or a memoji, the user can convey his or her emotions more intuitively.
  • An electronic device includes a display, a microphone, a camera, a memory, and a processor operatively connected to the display, the microphone, the camera, and the memory, wherein the processor executes a message application and , Based on a user input for a menu provided on the message application execution screen, input data received by at least one of the microphone and the camera is acquired, an emotional state of a person included in the input data is analyzed, and the analysis An electronic device configured to generate graphic data including at least one graphic object based on one emotional state, and generate a live message based on the input data and the graphic data.
  • a real-time message generation method of an electronic device includes an operation of executing a message application and obtaining input data received through at least one of a microphone and a camera based on a user input for a menu provided on a message application execution screen. operation of analyzing the emotional state of the person included in the input data, operation of generating graphic data including at least one graphic object based on the analyzed emotional state, operation of generating graphic data including the input data and the graphic data and generating a live message based on the
  • the electronic device may analyze the motion, voice, and facial expression of a photo or video and generate a graphic caption or emoticon accordingly.
  • the electronic device may provide a function of intuitively conveying the user's emotion by adding the generated graphic data to the generated input message.
  • the electronic device may classify generated content into several data types and determine a data type to transmit according to the type of an external device transmitting a live message. Through this, it is possible to provide a personalized means of expression that can faithfully implement an emotional exchange method in reality in an electronic device.
  • effects that can be obtained or predicted due to various embodiments of the present electronic device will be directly or implicitly disclosed in the detailed description of the embodiment of the electronic device.
  • effects predicted according to various embodiments of an electronic device will be disclosed within the detailed description to be described later.
  • FIG. 1 is a block diagram of an electronic device in a network environment, according to various embodiments.
  • FIGS. 2A and 2B are diagrams illustrating generating and transmitting a live message in an electronic device according to various embodiments.
  • FIG. 3 is a block diagram of an electronic device according to various embodiments.
  • FIG. 4 illustrates that an electronic device generates a live message based on video and audio data according to various embodiments.
  • FIG. 5 illustrates generating a live message based on image data by an electronic device according to various embodiments.
  • FIG. 6 illustrates generating a live message based on photo data by an electronic device according to various embodiments of the present disclosure.
  • FIG. 7A and 7B illustrate a graphic UI provided to generate a real-time message in an electronic device according to various embodiments.
  • FIG 8 illustrates data types according to types of external devices according to various embodiments.
  • FIG 9 illustrates generating a real-time message based on voice data in an electronic device according to various embodiments.
  • FIG. 10 is a flowchart of a method of generating a message in real time by an electronic device according to various embodiments.
  • FIG. 11 is a flowchart of a method of generating graphic data by an electronic device according to various embodiments.
  • FIG. 1 is a block diagram of an electronic device in a network environment, according to various embodiments.
  • an electronic device 101 communicates with an electronic device 102 through a first network 198 (eg, a short-range wireless communication network) or through a second network 199. It may communicate with at least one of the electronic device 104 or the server 108 through (eg, a long-distance wireless communication network). According to one embodiment, the electronic device 101 may communicate with the electronic device 104 through the server 108 .
  • the electronic device 101 includes a processor 120, a memory 130, an input module 150, an audio output module 155, a display module 160, an audio module 170, a sensor module ( 176), interface 177, connection terminal 178, haptic module 179, camera module 180, power management module 188, battery 189, communication module 190, subscriber identification module 196 , or the antenna module 197 may be included.
  • at least one of these components eg, the connection terminal 178) may be omitted or one or more other components may be added.
  • some of these components eg, sensor module 176, camera module 180, or antenna module 197) are integrated into a single component (eg, display module 160). It can be.
  • the processor 120 for example, executes software (eg, the program 140) to cause at least one other component (eg, hardware or software component) of the electronic device 101 connected to the processor 120. It can control and perform various data processing or calculations. According to one embodiment, as at least part of data processing or operation, processor 120 transfers instructions or data received from other components (e.g., sensor module 176 or communication module 190) to volatile memory 132. , processing commands or data stored in the volatile memory 132 , and storing resultant data in the non-volatile memory 134 .
  • software eg, the program 140
  • processor 120 transfers instructions or data received from other components (e.g., sensor module 176 or communication module 190) to volatile memory 132. , processing commands or data stored in the volatile memory 132 , and storing resultant data in the non-volatile memory 134 .
  • the processor 120 includes a main processor 121 (eg, a central processing unit or an application processor) or a secondary processor 123 (eg, a graphic processing unit, a neural network processing unit ( NPU: neural processing unit (NPU), image signal processor, sensor hub processor, or communication processor).
  • a main processor 121 eg, a central processing unit or an application processor
  • a secondary processor 123 eg, a graphic processing unit, a neural network processing unit ( NPU: neural processing unit (NPU), image signal processor, sensor hub processor, or communication processor.
  • NPU neural network processing unit
  • the secondary processor 123 may use less power than the main processor 121 or be set to be specialized for a designated function.
  • the secondary processor 123 may be implemented separately from or as part of the main processor 121 .
  • the secondary processor 123 may, for example, take the place of the main processor 121 while the main processor 121 is in an inactive (eg, sleep) state, or the main processor 121 is active (eg, running an application). ) state, together with the main processor 121, at least one of the components of the electronic device 101 (eg, the display module 160, the sensor module 176, or the communication module 190) It is possible to control at least some of the related functions or states.
  • the auxiliary processor 123 eg, image signal processor or communication processor
  • the auxiliary processor 123 may include a hardware structure specialized for processing an artificial intelligence model.
  • AI models can be created through machine learning. Such learning may be performed, for example, in the electronic device 101 itself where the artificial intelligence model is performed, or may be performed through a separate server (eg, the server 108).
  • the learning algorithm may include, for example, supervised learning, unsupervised learning, semi-supervised learning or reinforcement learning, but in the above example Not limited.
  • the artificial intelligence model may include a plurality of artificial neural network layers.
  • Artificial neural networks include deep neural networks (DNNs), convolutional neural networks (CNNs), recurrent neural networks (RNNs), restricted boltzmann machines (RBMs), deep belief networks (DBNs), bidirectional recurrent deep neural networks (BRDNNs), It may be one of deep Q-networks or a combination of two or more of the foregoing, but is not limited to the foregoing examples.
  • the artificial intelligence model may include, in addition or alternatively, software structures in addition to hardware structures.
  • the memory 130 may store various data used by at least one component (eg, the processor 120 or the sensor module 176) of the electronic device 101 .
  • the data may include, for example, input data or output data for software (eg, program 140) and commands related thereto.
  • the memory 130 may include volatile memory 132 or non-volatile memory 134 .
  • the program 140 may be stored as software in the memory 130 and may include, for example, an operating system 142 , middleware 144 , or an application 146 .
  • the input module 150 may receive a command or data to be used by a component (eg, the processor 120) of the electronic device 101 from the outside of the electronic device 101 (eg, a user).
  • the input module 150 may include, for example, a microphone, a mouse, a keyboard, a key (eg, a button), or a digital pen (eg, a stylus pen).
  • the sound output module 155 may output sound signals to the outside of the electronic device 101 .
  • the sound output module 155 may include, for example, a speaker or a receiver.
  • the speaker can be used for general purposes such as multimedia playback or recording playback.
  • a receiver may be used to receive an incoming call. According to one embodiment, the receiver may be implemented separately from the speaker or as part of it.
  • the display module 160 may visually provide information to the outside of the electronic device 101 (eg, a user).
  • the display module 160 may include, for example, a display, a hologram device, or a projector and a control circuit for controlling the device.
  • the display module 160 may include a touch sensor set to detect a touch or a pressure sensor set to measure the intensity of force generated by the touch.
  • the audio module 170 may convert sound into an electrical signal or vice versa. According to one embodiment, the audio module 170 acquires sound through the input module 150, the sound output module 155, or an external electronic device connected directly or wirelessly to the electronic device 101 (eg: Sound may be output through the electronic device 102 (eg, a speaker or a headphone).
  • the audio module 170 acquires sound through the input module 150, the sound output module 155, or an external electronic device connected directly or wirelessly to the electronic device 101 (eg: Sound may be output through the electronic device 102 (eg, a speaker or a headphone).
  • the sensor module 176 detects an operating state (eg, power or temperature) of the electronic device 101 or an external environmental state (eg, a user state), and generates an electrical signal or data value corresponding to the detected state. can do.
  • the sensor module 176 may include, for example, a gesture sensor, a gyro sensor, an air pressure sensor, a magnetic sensor, an acceleration sensor, a grip sensor, a proximity sensor, a color sensor, an IR (infrared) sensor, a bio sensor, It may include a temperature sensor, humidity sensor, or light sensor.
  • the interface 177 may support one or more designated protocols that may be used to directly or wirelessly connect the electronic device 101 to an external electronic device (eg, the electronic device 102).
  • the interface 177 may include, for example, a high definition multimedia interface (HDMI), a universal serial bus (USB) interface, an SD card interface, or an audio interface.
  • HDMI high definition multimedia interface
  • USB universal serial bus
  • SD card interface Secure Digital Card interface
  • audio interface audio interface
  • connection terminal 178 may include a connector through which the electronic device 101 may be physically connected to an external electronic device (eg, the electronic device 102).
  • the connection terminal 178 may include, for example, an HDMI connector, a USB connector, an SD card connector, or an audio connector (eg, a headphone connector).
  • the haptic module 179 may convert electrical signals into mechanical stimuli (eg, vibration or motion) or electrical stimuli that a user may perceive through tactile or kinesthetic senses.
  • the haptic module 179 may include, for example, a motor, a piezoelectric element, or an electrical stimulation device.
  • the camera module 180 may capture still images and moving images. According to one embodiment, the camera module 180 may include one or more lenses, image sensors, image signal processors, or flashes.
  • the power management module 188 may manage power supplied to the electronic device 101 .
  • the power management module 188 may be implemented as at least part of a power management integrated circuit (PMIC), for example.
  • PMIC power management integrated circuit
  • the battery 189 may supply power to at least one component of the electronic device 101 .
  • the battery 189 may include, for example, a non-rechargeable primary cell, a rechargeable secondary cell, or a fuel cell.
  • the communication module 190 is a direct (eg, wired) communication channel or a wireless communication channel between the electronic device 101 and an external electronic device (eg, the electronic device 102, the electronic device 104, or the server 108). Establishment and communication through the established communication channel may be supported.
  • the communication module 190 may include one or more communication processors that operate independently of the processor 120 (eg, an application processor) and support direct (eg, wired) communication or wireless communication.
  • the communication module 190 is a wireless communication module 192 (eg, a cellular communication module, a short-range wireless communication module, or a global navigation satellite system (GNSS) communication module) or a wired communication module 194 (eg, : a local area network (LAN) communication module or a power line communication module).
  • a wireless communication module 192 eg, a cellular communication module, a short-range wireless communication module, or a global navigation satellite system (GNSS) communication module
  • GNSS global navigation satellite system
  • wired communication module 194 eg, : a local area network (LAN) communication module or a power line communication module.
  • a corresponding communication module is a first network 198 (eg, a short-range communication network such as Bluetooth, wireless fidelity (WiFi) direct, or infrared data association (IrDA)) or a second network 199 (eg, legacy It may communicate with the external electronic device 104 through a cellular network, a 5G network, a next-generation communication network, the Internet, or a telecommunications network such as a computer network (eg, a LAN or a WAN).
  • a telecommunications network such as a computer network (eg, a LAN or a WAN).
  • These various types of communication modules may be integrated as one component (eg, a single chip) or implemented as a plurality of separate components (eg, multiple chips).
  • the wireless communication module 192 uses subscriber information (eg, International Mobile Subscriber Identifier (IMSI)) stored in the subscriber identification module 196 within a communication network such as the first network 198 or the second network 199.
  • subscriber information eg, International Mobile Subscriber Identifier (IMSI)
  • IMSI International Mobile Subscriber Identifier
  • the electronic device 101 may be identified or authenticated.
  • the wireless communication module 192 may support a 5G network after a 4G network and a next-generation communication technology, for example, NR access technology (new radio access technology).
  • NR access technologies include high-speed transmission of high-capacity data (enhanced mobile broadband (eMBB)), minimization of terminal power and access of multiple terminals (massive machine type communications (mMTC)), or high reliability and low latency (ultra-reliable and low latency (URLLC)).
  • eMBB enhanced mobile broadband
  • mMTC massive machine type communications
  • URLLC ultra-reliable and low latency
  • -latency communications can be supported.
  • the wireless communication module 192 may support a high frequency band (eg, mmWave band) to achieve a high data rate, for example.
  • the wireless communication module 192 uses various technologies for securing performance in a high frequency band, such as beamforming, massive multiple-input and multiple-output (MIMO), and full-dimensional multiplexing. Technologies such as input/output (FD-MIMO: full dimensional MIMO), array antenna, analog beam-forming, or large scale antenna may be supported.
  • the wireless communication module 192 may support various requirements defined for the electronic device 101, an external electronic device (eg, the electronic device 104), or a network system (eg, the second network 199).
  • the wireless communication module 192 is a peak data rate for eMBB realization (eg, 20 Gbps or more), a loss coverage for mMTC realization (eg, 164 dB or less), or a U-plane latency for URLLC realization (eg, Example: downlink (DL) and uplink (UL) each of 0.5 ms or less, or round trip 1 ms or less) may be supported.
  • eMBB peak data rate for eMBB realization
  • a loss coverage for mMTC realization eg, 164 dB or less
  • U-plane latency for URLLC realization eg, Example: downlink (DL) and uplink (UL) each of 0.5 ms or less, or round trip 1 ms or less
  • the antenna module 197 may transmit or receive signals or power to the outside (eg, an external electronic device).
  • the antenna module 197 may include an antenna including a radiator formed of a conductor or a conductive pattern formed on a substrate (eg, PCB).
  • the antenna module 197 may include a plurality of antennas (eg, an array antenna). In this case, at least one antenna suitable for a communication method used in a communication network such as the first network 198 or the second network 199 is selected from the plurality of antennas by the communication module 190, for example. can be chosen A signal or power may be transmitted or received between the communication module 190 and an external electronic device through the selected at least one antenna.
  • other components eg, a radio frequency integrated circuit (RFIC) may be additionally formed as a part of the antenna module 197 in addition to the radiator.
  • RFIC radio frequency integrated circuit
  • the antenna module 197 may form a mmWave antenna module.
  • the mmWave antenna module includes a printed circuit board, an RFIC disposed on or adjacent to a first surface (eg, a lower surface) of the printed circuit board and capable of supporting a designated high frequency band (eg, mmWave band); and a plurality of antennas (eg, array antennas) disposed on or adjacent to a second surface (eg, a top surface or a side surface) of the printed circuit board and capable of transmitting or receiving signals of the designated high frequency band. can do.
  • peripheral devices eg, a bus, general purpose input and output (GPIO), serial peripheral interface (SPI), or mobile industry processor interface (MIPI)
  • signal e.g. commands or data
  • commands or data may be transmitted or received between the electronic device 101 and the external electronic device 104 through the server 108 connected to the second network 199 .
  • Each of the external electronic devices 102 or 104 may be the same as or different from the electronic device 101 .
  • all or part of operations executed in the electronic device 101 may be executed in one or more external electronic devices among the external electronic devices 102 , 104 , or 108 .
  • the electronic device 101 when the electronic device 101 needs to perform a certain function or service automatically or in response to a request from a user or another device, the electronic device 101 instead of executing the function or service by itself.
  • one or more external electronic devices may be requested to perform the function or at least part of the service.
  • One or more external electronic devices receiving the request may execute at least a part of the requested function or service or an additional function or service related to the request, and deliver the execution result to the electronic device 101 .
  • the electronic device 101 may provide the result as at least part of a response to the request as it is or additionally processed.
  • cloud computing distributed computing, mobile edge computing (MEC), or client-server computing technology may be used.
  • the electronic device 101 may provide an ultra-low latency service using, for example, distributed computing or mobile edge computing.
  • the external electronic device 104 may include an internet of things (IoT) device.
  • Server 108 may be an intelligent server using machine learning and/or neural networks. According to one embodiment, the external electronic device 104 or server 108 may be included in the second network 199 .
  • the electronic device 101 may be applied to intelligent services (eg, smart home, smart city, smart car, or health care) based on 5G communication technology and IoT-related technology.
  • Electronic devices may be devices of various types.
  • the electronic device may include, for example, a portable communication device (eg, a smart phone), a computer device, a portable multimedia device, a portable medical device, a camera, a wearable device, or a home appliance.
  • a portable communication device eg, a smart phone
  • a computer device e.g., a smart phone
  • a portable multimedia device e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a portable medical device
  • a camera e.g., a camera
  • a wearable device e.g., a smart bracelet
  • first, second, or first or secondary may simply be used to distinguish a given component from other corresponding components, and may be used to refer to a given component in another aspect (eg, importance or order) is not limited.
  • a (e.g., first) component is said to be “coupled” or “connected” to another (e.g., second) component, with or without the terms “functionally” or “communicatively.”
  • the certain component may be connected to the other component directly (eg by wire), wirelessly, or through a third component.
  • module used in various embodiments of this document may include a unit implemented in hardware, software, or firmware, and is interchangeable with terms such as, for example, logic, logical blocks, parts, or circuits.
  • a module may be an integrally constructed component or a minimal unit of components or a portion thereof that performs one or more functions.
  • the module may be implemented in the form of an application-specific integrated circuit (ASIC).
  • ASIC application-specific integrated circuit
  • a storage medium eg, internal memory 136 or external memory 138
  • a machine eg, electronic device 101
  • a processor eg, the processor 120
  • a device eg, the electronic device 101
  • the one or more instructions may include code generated by a compiler or code executable by an interpreter.
  • the device-readable storage medium may be provided in the form of a non-transitory storage medium.
  • the storage medium is a tangible device and does not contain a signal (e.g. electromagnetic wave), and this term refers to the case where data is stored semi-permanently in the storage medium. It does not discriminate when it is temporarily stored.
  • a signal e.g. electromagnetic wave
  • the method according to various embodiments disclosed in this document may be included and provided in a computer program product.
  • Computer program products may be traded between sellers and buyers as commodities.
  • a computer program product is distributed in the form of a device-readable storage medium (e.g. compact disc read only memory (CD-ROM)), or through an application store (e.g. Play Store TM ) or on two user devices (e.g. It can be distributed (eg downloaded or uploaded) online, directly between smart phones.
  • a device e.g. compact disc read only memory (CD-ROM)
  • an application store e.g. Play Store TM
  • It can be distributed (eg downloaded or uploaded) online, directly between smart phones.
  • at least part of the computer program product may be temporarily stored or temporarily created in a storage medium readable by a device such as a manufacturer's server, an application store server, or a relay server's memory.
  • each component (eg, module or program) of the above-described components may include a single object or a plurality of entities, and some of the plurality of entities may be separately disposed in other components. there is.
  • one or more components or operations among the aforementioned corresponding components may be omitted, or one or more other components or operations may be added.
  • a plurality of components eg modules or programs
  • the integrated component may perform one or more functions of each of the plurality of components identically or similarly to those performed by a corresponding component of the plurality of components prior to the integration. .
  • the actions performed by a module, program, or other component are executed sequentially, in parallel, iteratively, or heuristically, or one or more of the actions are executed in a different order, or omitted. or one or more other actions may be added.
  • FIGS. 2A and 2B are diagrams illustrating generating and transmitting a live message in an electronic device according to various embodiments.
  • the electronic device may obtain input data 210 received through a microphone or camera.
  • the input data 210 may include at least one of voice, picture, and video.
  • the electronic device may recognize an object using a camera located on the front or rear of the housing and display a preview as shown in FIG. 2a(a) on one side of the display.
  • the electronic device may generate graphic data 220 based on input data 210 .
  • the electronic device may analyze the input data 210 and generate graphic data 220 corresponding to the emotion of a person included in the input data 210 .
  • the electronic device may generate graphic data 220 composed of “Really”, “good”, and a laughing emoticon by analyzing the smiley expression of the person of the input data 210 and the motion of raising the thumb of the right hand.
  • the electronic device may use an emotion deep learning module or a motion deep learning module to analyze the input data 210 .
  • the electronic device may determine emotion information of a character in the input data 210 by using an emotion deep learning module and generate graphic data 220 including an emoticon corresponding thereto.
  • the electronic device may generate a live message by synthesizing the input data 210 and the graphic data 220 .
  • FIG. 2A(B) illustrates a live message synthesized with graphic data 220 by analyzing the input data 210 of FIG. 2A(A) by the electronic device.
  • the electronic device may transmit a live message created through a message application.
  • the electronic device may execute the message application (230) and provide a preview screen for generating a live message on the message application.
  • the electronic device may operate a camera and a microphone based on a user input to receive input data 210 and generate graphic data 220 to generate a live message (240).
  • the electronic device may store the generated live message in a memory and transmit the live message to an external device through a message application based on a user input.
  • FIG. 3 is a block diagram of an electronic device according to various embodiments.
  • an electronic device 300 may include a display 320, a camera 340, a microphone 330, a communication module 350, a processor 310, and a memory 360, and in various implementations In examples, some of the illustrated components may be omitted or substituted.
  • the electronic device 300 may further include at least some of the configurations and/or functions of the electronic device 101 of FIG. 1 . At least some of the components of the illustrated (or not illustrated) electronic device 300 may be operatively, functionally, and/or electrically connected to each other.
  • the display 320 may display various images under the control of the processor 310 .
  • the display 320 may be a liquid crystal display (LCD), a light-emitting diode (LED) display, a micro LED display, a quantum dot (QD) display, or an organic light emitting diode (QD) display.
  • -Emitting diode (OLED)) may be implemented as any one of displays, but is not limited thereto.
  • the display 320 may be formed as a touch screen that senses a touch and/or proximity touch (or hovering) input using a user's body part (eg, a finger) or an input device (eg, a stylus pen).
  • the display 320 may include at least some of the components and/or functions of the display module 160 of FIG. 1 .
  • the display 320 may be flexible, and may be implemented as a foldable display or a rollable display.
  • the microphone 330 may collect an external sound such as a user's voice and convert it into a voice signal that is digital data.
  • the electronic device 300 may include a microphone 330 in a part of a housing (not shown) or may receive a voice signal collected from an external microphone connected wired/wireless.
  • the camera 340 may acquire external image data.
  • the camera 340 may acquire image data using various types of image sensors such as a charge coupled device (CCD) or a complementary metal oxide semiconductor (CMOS).
  • CMOS complementary metal oxide semiconductor
  • the camera 340 may include at least some of the components and/or functions of the camera module 180 of FIG. 1 .
  • the electronic device 300 may place one or more cameras 340 on the front and/or rear of the housing, and unless otherwise specified, image data including an external device is acquired using the rear camera 340. may have been
  • the memory 360 includes a volatile memory (eg, the volatile memory 132 of FIG. 1 ) and a non-volatile memory (eg, the non-volatile memory 134 of FIG. 1 ) to temporarily store various data. or stored permanently.
  • the memory 360 includes at least some of the configuration and/or functions of the memory 130 of FIG. 1 and may store the program 140 of FIG. 1 .
  • the memory 360 may store various instructions that may be executed by the processor 310 . These instructions may include control commands such as arithmetic and logical operations, data movement, input/output, and the like that may be recognized by the processor 310 .
  • the processor 310 may include components of the electronic device 300 (eg, the display 320, the camera 340, the microphone 330, the communication module 350, and the memory 360) and It may be a configuration that is operatively, functionally, and/or electrically connected to perform calculations or data processing related to control and/or communication of each component.
  • the processor 310 may include at least some of the components and/or functions of the processor 120 of FIG. 1 .
  • arithmetic and data processing functions that the processor 310 can implement on the electronic device 300 will not be limited, but hereinafter, a message based on an image or photo taken in real time by the electronic device 300 will be sent.
  • Various embodiments for generating will be described. Operations of the processor 310 to be described later may be performed by loading instructions stored in the memory 360.
  • the processor 310 may obtain input data (eg, input data 210 of FIG. 2 ) from the camera 340 or the microphone 330 .
  • the input data may include at least one of audio, video and pictures.
  • the processor 310 may obtain input data received through a user device connected to the electronic device 300 through short-range communication. For example, the processor 310 may establish a communication connection with a user device equipped with the microphone 330 and obtain voice data from the user device.
  • the processor 310 may analyze input data using an emotion deep learning module and a motion deep learning module.
  • the emotion deep learning module can determine the character's emotion information by analyzing the voice, facial expression, and voice data of the character appearing in the input data.
  • the processor 310 may determine at least one emotion information (eg, joy, sadness, excitement, anger, fear, tenderness) by controlling the emotion deep learning module.
  • the motion deep learning module can determine emotion information by analyzing motions of characters appearing in input data.
  • the processor 310 may map and store at least one word and at least one graphic element corresponding to the corresponding word in the memory 360 . If a word defined in advance is included in the input data, the processor 310 may generate a graphic element corresponding thereto. For example, the processor 310 may map the word 'sea' to a wave emoticon, a seagull emoticon, and a palm tree emoticon and store them in the memory 360 . When the word 'sea' is included in the obtained input data, the processor 310 may generate graphic data including at least one of a wave emoticon, a seagull emoticon, and a palm tree emoticon defined in advance.
  • processor 310 may identify facial features to determine emotional information of a character.
  • the deep emotion learning module may learn data by adopting various face recognition technologies.
  • face recognition algorithms include principal component analysis, which may include unique faces, linear discriminate analysis, and elastic bunch graph matching, which may additionally use Fisher's face algorithm. matching), hidden Markov models, multilinear subspace learning that can use tensor representations, and neuronal motivated dynamic link matching.
  • face recognition technologies are augmented by the use of pixel analysis or other contour tracking and classification techniques to enhance the accuracy of facial data, particularly when identifying contour lines around the eyes and mouth, as well as personal features as scars or dots.
  • three-dimensional facial recognition techniques may also be used to capture information about the shape of the face and the dimensions of the face.
  • three-dimensional facial recognition techniques may be useful for identifying distinctive features on the surface of the face, such as (but not limited to) eye sockets, nose and/or chin contours.
  • the processor 310 may generate graphic data (eg, graphic data 220 of FIG. 2 ).
  • the processor 310 may generate different graphic data according to the data type included in the input data.
  • the data type may include a voice data type, a text data type, an emoticon data type, and a camera data type.
  • the processor 310 may generate graphic data including graphic captions based on the audio data.
  • the processor 310 may visualize voice data using speech to text (STT) technology.
  • STT speech to text
  • the processor 310 may generate graphic data by inputting a caption having the same content as the voice data and adding various graphic effects.
  • the processor 310 may generate graphic data based on motion included in the image data. According to an embodiment, the processor 310 may analyze motion included in image data using a motion deep learning module.
  • the processor 310 may generate graphic data based on a facial expression of a person included in the photo data.
  • the processor 310 may determine emotion information from facial expressions using facial expression recognition technology.
  • the processor 310 may store the generated live message in the memory 360 .
  • the processor 310 may directly transmit the live message generated by executing the message application, or may select and transmit one of at least one live message stored in the memory 360 .
  • the processor 310 may generate at least a plurality of recommended graphic data based on previously generated graphic data.
  • the processor 310 may select one of a plurality of recommended graphic data based on a user input.
  • the processor 310 may provide an edit menu to guide the user to create a live message to which desired graphic effects are added.
  • the processor 310 may establish a communication connection with an external device (eg, a smart phone, a tablet, or a smart watch) using the communication module 350. there is.
  • the processor 310 may determine the type of external device that has established a communication connection and determine at least one data type to be included in a live message to be transmitted to the external device.
  • the processor 310 may determine the data type included in the live message according to the hardware configuration of the external device. For example, if the external device does not have a display, the live message generated by the processor 310 may not include camera data, text data, and emoticon data.
  • FIG. 4 illustrates that an electronic device generates a live message based on video and audio data according to various embodiments.
  • a processor may provide a camera preview to the preview area 410 of the execution screen of the message application.
  • the processor may execute a camera (eg, camera 340 of FIG. 3 ) function based on a user input to a camera button located in the message application.
  • the processor displays a graphic object 414 indicating that voice data is being received in the preview area 410 .
  • An image capture button 412 may be further included in the preview area 410 , and the processor may start and end image capture based on a user input to the capture button 412 .
  • the processor may generate graphic data (eg, graphic data 220 of FIG. 2 ) based on input data.
  • graphic data eg, graphic data 220 of FIG. 2
  • the processor may generate graphic data by visualizing audio of input data.
  • the processor may generate graphic data including a graphic caption 420 having the same content as the voice.
  • the processor may generate graphic subtitles 420 having various visual effects.
  • the processor may generate graphic data by determining emotion information of a person in input data using an emotion deep learning module and a motion deep learning module.
  • the processor may generate a live message 430 having a selected extension (eg, .jpg, .gif, or .mp4) by synthesizing the generated graphic data with the input data.
  • the live message 430 may include audio and video.
  • the processor may store the generated live message 430 in a memory (eg, the memory 360 of FIG. 3 ).
  • the processor may transmit the generated live message 430 to an external device through a message application.
  • the processor may provide at least one live message 430 stored in the memory to one area of the application execution screen based on a user input.
  • the processor may store all generated live messages 430 in one area of memory.
  • the processor may transmit the live message 430 through the message application based on user input.
  • FIG. 5 illustrates generating a live message based on image data by an electronic device according to various embodiments.
  • the processor eg, the processor 310 of FIG. 3
  • Graphic data may be generated by analyzing the generated motion.
  • the processor may analyze motion included in the image data 510 using a motion deep learning module.
  • the motion deep learning module may learn various motions in advance by capturing motions of objects in the image data 510 .
  • the processor may create a graphic object 520 corresponding to the motion analyzed through the motion deep learning module. For example, referring to FIG. 5 , the processor may receive image data 510 based on a user input for a photographing button.
  • the motion deep learning module can detect the corresponding motion.
  • the processor may create a heart-shaped graphic object 520 suitable for motion in the image data 510 .
  • the processor may generate and provide at least one graphic data on the preview screen of the message application, select the optimal graphic data among them based on a user input, and display the live message 530 (eg, the live message 430 of FIG. 4 ). )) can be created.
  • the processor may transmit a live message 530 generated based on a user input.
  • the live message 530 may be composed of a combination of image data 510 and graphic data.
  • the processor may set the position of the graphic data to change along with the motion of the object in the image.
  • FIG. 6 illustrates generating a live message based on photo data by an electronic device according to various embodiments of the present disclosure.
  • a processor may generate a live message 630 (eg, live message 430 of FIG. 4 ) based on a facial expression of a person in photo data.
  • the processor may determine emotion information by analyzing the expression 610 of the person using the deep emotion learning module.
  • the processor may generate a spatial learning model by learning a convolutional neural network (CNN) with respect to spatial features of the acquired photo data.
  • the processor may analyze the facial expression 610 using a recursive neural network including at least one of a recurrent neural network (RNN), a gated recurrent unit (GRU), and long short-term memory (LSTM). .
  • RNN recurrent neural network
  • GRU gated recurrent unit
  • LSTM long short-term memory
  • the processor may analyze a facial expression 610 of a person in a photo to recognize a smiling expression 610 and determine that the facial expression 610 is a happy emotion.
  • the processor may generate graphic data (eg, graphic data 220 of FIG. 2 ) including at least one graphic object 620 (eg, a laughing emoticon) corresponding to the analyzed facial expression 610 .
  • graphic data generated by a processor may be disposed in an area partially overlapping input data (eg, input data 210 of FIG. 2 ).
  • the graphic data generated by the processor may be fixed at a fixed location or the location may change over time.
  • the processor may generate a live message 630 by synthesizing the generated graphic data and input data, and transmit the live message 630 through a message application based on a user input.
  • FIG. 7A and 7B illustrate a graphic UI provided to generate a real-time message in an electronic device according to various embodiments.
  • a processor may provide a graphic UI for generating a live message (eg, live message 430 of FIG. 4 ) to a message application.
  • the processor may provide a live message creation button 710 on one side of the message input window.
  • the processor may provide a preview area 760 and various menus for generating a live message based on a user input to the live message creation button 710 .
  • the processor may display a menu bar including at least one button providing functionality for creating a live message.
  • the menu bar may include a camera button 720, and the processor may display a camera preview on one side of the message application execution screen based on a user input to the camera button 720.
  • the processor may further include at least one of a menu for generating an emoticon, a menu for generating an image, and a menu for receiving voice data in the menu bar.
  • the preview area 760 may include at least one button for starting camera capture.
  • the processor may receive input data (eg, input data 210 of FIG. 2 ) based on a user input for a photographing button.
  • the processor may further provide a full screen button 740 and a screen reduction button 750 in the preview area 760 .
  • the processor may adjust the size of the preview area 760 based on user inputs to the full screen button 740 and the screen reduction button 750 . For example, when the user touches the full screen button 740, the preview area 760 may be expanded to the entire display (eg, the display 320 of FIG. 3). Conversely, if the user touches the screen reduction button 750 in the full screen state, the preview area 760 may be reduced to a part of the message application execution screen again.
  • the processor may provide an edit menu 770 providing a function for editing graphic data to be generated (eg, graphic data 220 of FIG. 2 ).
  • the processor may display a collapse icon 730 of the edit menu 770 on one side of the preview area 760, and display the edit menu 770 on the display based on a user input for the collapse icon 730.
  • an edit menu 770 may include at least one of a font/size adjustment menu 772, a speech bubble menu 774, a music menu 776, and an effect menu 778.
  • a function of changing a size of a graphic object created by a processor or a font of graphic subtitles may be provided.
  • the processor may edit the graphic object based on a user input to the font/size adjustment menu 772 of the edit menu 770 . For example, when the processor generates graphic data including a graphic caption such as 'good morning', the user can change the size and font of the graphic caption using the font/size adjustment menu 772 .
  • the processor may generate graphic captions having various forms based on a user input to the speech bubble menu 774 .
  • the processor may generate a graphic caption based on acquired voice data, and may generate a live message by combining the graphic caption generated based on a user input to the speech bubble menu 774 with the input data.
  • the processor may generate a graphic caption and a speech bubble displaying the graphic caption together, and may provide speech bubbles of various shapes (eg, circle, rectangle, cloud shape).
  • the processor may determine background music for the live message based on user input to the music menu 776 .
  • the processor may store at least a portion of the sample music in a memory (eg, the memory 360 of FIG. 3 ).
  • the processor may determine background music in conjunction with a third party music application.
  • the processor may adjust the volume of the background music based on a user input, and may determine a low volume of the background music when voice data is included in the input data.
  • the processor may add various visual effects (VFXt) to graphic data based on a user input to the effects menu 778 .
  • Graphic effects that can be provided by the processor may include at least one of motion graphics, retouching, compositing, animation, lighting, and FX (effects).
  • the processor may analyze the motion of the image data and generate and synthesize an emoticon corresponding thereto.
  • the processor may further include a menu minimization button 779 in the edit menu 770 .
  • the processor may hide the edit menu 770 based on a user input to the menu minimization button 779 .
  • FIG 8 illustrates data types according to types of external devices according to various embodiments.
  • a processor may generate a live message (eg, the live message 430 of FIG. 4 ) including at least one data type.
  • the processor may classify the input data 810 (eg, the input data 210 of FIG. 2 ) received by the electronic device 800 into at least one data type and store the same.
  • the processor may establish a communication connection with the external device 820 using a communication module (eg, the communication module 350 of FIG. 3 ) and determine the data type to be included in the live message according to the type of the external device 820. .
  • the processor may determine the data type to be transmitted according to the hardware configuration included in the external device 820 .
  • the first live message 810a to be transmitted to the first external device 820a having a display and audio interface may include voice data, text data, emoticon data, and camera data.
  • the second live message 810b to be transmitted to the second external device 820b having only an audio interface may include only audio data.
  • the third live message 810c to be transmitted to the third external device 820c having only a display may include text data, emoticon data, and camera data.
  • a method of constructing data according to the hardware configuration of the external device 820 to which the processor is communicatively connected is not limited to the example of data shown in FIG. 8 .
  • FIG 9 illustrates generating a real-time message based on voice data in an electronic device according to various embodiments.
  • a processor receives input data 910 (eg, the input data 210 of FIG. 2 ) received from a user device 900 communicatively connected to the electronic device 930 . )), a live message 940 (eg, the live message 430 of FIG. 4) may be generated.
  • the user device 900 may transmit the received input data 910 to the electronic device 930 using a communication connection.
  • the processor may generate a live message 940 including at least one data type 920 of a voice data type, a text data type, an emoticon data type, and a camera data type based on the received input data 910 .
  • the processor may transmit the generated live message 940 to an external device (eg, the external device 820 of FIG. 8 ). Since the processor generates the live message 940 based on the input data 910 received from the user device 900, the data type 920 included in the live message 940 is hardware included in the user device 900. It can be determined according to the configuration.
  • the processor may receive voice data 910 from a user device 900 equipped with an audio interface.
  • the processor may generate graphic data including text data and emoticon data based on the received voice data 910 .
  • Text data generated by the processor may be data expressing voice data 910 as graphic captions, and emoticon data may be data corresponding to a situation analyzed based on the received voice data 910 .
  • the processor may generate a live message by synthesizing the generated graphic data and input data.
  • the processor may generate a live message 940 including data 920 of at least one of voice data, text data, emoticon data, and camera data.
  • the generated live message 940 may not include camera data.
  • the processor may transmit the live message 940 through the message application.
  • An electronic device includes a display, a microphone, a camera, a memory, and a processor operatively connected to the display, the microphone, the camera, and the memory, wherein the processor executes a message application and , Based on a user input for a menu provided on the message application execution screen, input data received by at least one of the microphone and the camera is acquired, an emotional state of a person included in the input data is analyzed, and the analysis An electronic device configured to generate graphic data including at least one graphic object based on one emotional state, and generate a live message based on the input data and the graphic data.
  • the electronic device further includes a communication module, and the processor establishes a communication connection with an external device using the communication module, and includes at least one message included in a live message based on the type of the external device.
  • An electronic device configured to determine one data type, generate a live message including the determined at least one data type, and transmit the live message to the external device.
  • an electronic device configured to generate a live message including at least one of camera data, text data, and emoticon data.
  • an electronic device configured to generate a live message including a voice data type when the external device includes an audio interface.
  • the processor is configured to generate graphic data including at least one of an emoticon, text, and graphic effect.
  • the processor is configured to store the live message in the memory and transmit the live message through a message application based on a user input.
  • the electronic device configured to generate graphic data based on STT (Speech To Text) based graphic subtitles and voice context when the input data includes voice.
  • STT Seech To Text
  • the electronic device configured to generate graphic data based on motion included in the image, when the input data includes an image.
  • the processor is configured to generate at least one graphic data and select one of the at least one graphic data based on a user input.
  • the electronic device configured to generate graphic data based on a pre-generated live message when a live message corresponding to the motion is pre-generated and stored in the memory.
  • the processor is configured to analyze at least one of a facial expression of a person included in a picture of the input data, a position of the person, and a surrounding object, and generate graphic data corresponding thereto.
  • the processor determines an emotional state by recognizing at least one of voice, motion, and facial expression of the person, and laughs based on the determined emotional state.
  • An electronic device configured to generate graphic data including at least an emoticon, and to generate a live message by synthesizing the input data and the graphic data.
  • FIG. 10 is a flowchart of a method of generating a message in real time by an electronic device according to various embodiments.
  • the method shown in FIG. 10 may be performed by the electronic device (e.g., the electronic device 101 of FIG. 1) described with reference to FIGS. 1 to 9, and descriptions of the technical features described above are omitted below. I'm going to do it.
  • the electronic device may execute a message application.
  • An electronic device may exchange messages with an external device (eg, the external device 820 of FIG. 8 ) connected through communication through a message application.
  • an external device eg, the external device 820 of FIG. 8
  • the electronic device receives input data (eg, input data of FIG. 2 (eg, the camera 340 of FIG. 3) or a microphone (eg, the microphone 330 of FIG. 3). 210)) can be received.
  • the electronic device may obtain input data received through a user device connected to the electronic device through short-range communication.
  • the input data may include at least one of audio, video and pictures.
  • the electronic device may analyze input data using an emotion deep learning module and a motion deep learning module.
  • the emotion deep learning module can determine the character's emotion information by analyzing the voice, facial expression, and voice data of the character appearing in the input data.
  • the electronic device may determine at least one emotion information (eg, joy, sadness, excitement, anger, fear, tenderness) by controlling the emotion deep learning module.
  • the motion deep learning module can determine emotion information by analyzing motions of characters appearing in input data.
  • the electronic device may generate a live message (eg, the live message 430 of FIG. 4 ) based on the input data and store it in a memory (eg, the memory 360 of FIG. 3 ). there is.
  • the electronic device may generate different graphic data (eg, graphic data 220 of FIG. 2 ) according to the type of data included in the input data.
  • the data type may include voice data, text data, emoticon data, and camera data.
  • the electronic device may generate graphic data including a graphic caption based on the audio data.
  • the electronic device may visualize voice data using speech to text (STT) technology.
  • STT speech to text
  • the electronic device may generate graphic data by inputting a caption having the same content as the audio data and adding various graphic effects.
  • the electronic device may generate graphic data based on motion included in the image data.
  • the electronic device may analyze motion included in image data using a motion deep learning module.
  • the electronic device may generate text or emoticon corresponding to the analyzed motion.
  • the electronic device may generate graphic data based on a facial expression of a person included in the photo data.
  • An electronic device may determine emotion information from a facial expression using facial expression recognition technology.
  • the electronic device may store the created live message in memory.
  • the electronic device may directly transmit a live message created by executing a message application, or select and transmit one of at least one live message stored in a memory.
  • the electronic device may generate at least a plurality of recommended graphic data based on previously generated graphic data.
  • the electronic device may select one of a plurality of recommended graphic data based on a user input.
  • the electronic device may provide an edit menu to guide the user to create a live message to which desired graphic effects are added.
  • the electronic device may transmit a live message based on a user input.
  • the electronic device may establish a communication connection with an external device using a communication module (eg, the communication module 350 of FIG. 3 ) and transmit a live message through a message application.
  • a communication module eg, the communication module 350 of FIG. 3
  • the electronic device identifies an external device to receive the live message, and in operation 1014, the electronic device determines a data type to be included in the live message according to the external device. According to an embodiment, the electronic device may determine the type of data included in the live message according to the hardware configuration of the external device. If the external device has a display, the live message generated by the electronic device may include camera data, text data, and emoticon data. If the external device has an audio interface, the live message generated by the electronic device may include voice data.
  • FIG. 11 is a flowchart of a method of generating live data by an electronic device according to various embodiments.
  • the electronic device may receive input data and check whether voice data is included in the input data in operation 1110. If audio data is included in the input data, in operation 1112, the electronic device may generate a graphic caption based on the audio data.
  • the graphic caption may have a form in which graphic effects are added based on the content of audio data.
  • the electronic device may map and store at least one word and at least one graphic element corresponding to the corresponding word in a memory.
  • the electronic device may generate a graphic element corresponding thereto.
  • the electronic device includes image data in the input data can check if there is.
  • the electronic device may analyze the emotion of a person appearing in the video data based on the motion included in the video data.
  • the electronic device may learn various motions using a motion deep learning module and analyze emotions of a person based on the learning.
  • the electronic device may analyze emotions based on facial expressions of characters in the input data.
  • Electronic devices may use various face recognition technologies.
  • the electronic device may generate a graphic element corresponding to emotion information analyzed based on motion and expression.
  • the electronic device may generate graphic data to which visual effects such as emoticons and texts are added based on emotion information analyzed using the emotion deep learning module and the motion deep learning module.
  • the electronic device may create an emoticon graphic element expressing the corresponding word. For example, if the word 'love' is included in the voice data, the processor may generate an emoticon including a shape (eg, a heart shape, a kiss, a rose) capable of expressing the word.
  • a shape eg, a heart shape, a kiss, a rose
  • the electronic device may express voice data including 'love' in the form of a graphic caption and display an emoticon such as a heart on one side of the graphic caption.
  • the electronic device may generate a live message by synthesizing graphic data and input data generated using various visual effects, and transmit the message to an external device through a message application.
  • a real-time message generation method of an electronic device includes an operation of executing a message application and obtaining input data received through at least one of a microphone and a camera based on a user input for a menu provided on a message application execution screen. operation of analyzing the emotional state of the person included in the input data, operation of generating graphic data including at least one graphic object based on the analyzed emotional state, operation of generating graphic data including the input data and the graphic data and generating a live message based on the
  • an operation of establishing a communication connection with an external device using the communication module an operation of determining at least one data type included in a live message based on the type of the external device, and The method further comprising generating and transmitting a live message including the determined at least one data type to the external device.
  • the generating of the live message may further include generating a live message including at least one of camera data, text data, and emoticon data when the external device includes a display. .
  • the generating of the live message may further include generating a live message including a voice data type when the external device includes an audio interface.
  • the transmitting of the live message may further include storing the live message in the memory and transmitting the live message through a message application based on a user input.
  • the generating of the graphic data may include generating graphic data based on STT (Speech To Text) based graphic subtitles and voice context when the input data includes voice. How to include more.
  • STT Speech To Text
  • the generating of the graphic data may further include, when the input data includes an image, generating the graphic data based on motion included in the image.
  • the generating of the graphic data may include analyzing at least one of a facial expression of a person included in a picture of the input data, a position of the person, and a surrounding object, and generating graphic data corresponding thereto. How to include more.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)
  • Operations Research (AREA)

Abstract

An electronic device according to various embodiments comprises a display, a microphone, a camera, memory, and a processor operatively connected with the display, the microphone, the camera, and the memory. The processor is set to: launch a messaging application; acquire input data received by at least one of the microphone or the camera on the basis of a user input to a menu provided on a messaging application launch screen; analyze an individual's emotional state included in the input data; generate graphic data including at least one graphic object on the basis of the analyzed emotional state; and generate a live message on the basis of the input data and the graphic data. Various other embodiments are possible.

Description

전자 장치 및 실시간 메시지 생성 방법Electronic devices and methods for generating real-time messages
본 문서는 전자 장치에 관한 것이며, 예를 들어 전자 장치에서 실시간으로 촬영한 영상 또는 사진에 기초한 메시지를 생성하는 방법에 대한 기술이다.This document relates to an electronic device, and describes a method for generating a message based on a video or photo taken in real time by the electronic device, for example.
이동통신 기술 및 하드웨어/소프트웨어 기술의 발달에 따라 휴대용 전자 장치(이하, 전자 장치)는 종래의 통화 기능에서 나아가 다양한 기능들을 구현할 수 있게 되었다. 전자 장치는 통신 기술의 발달로 외부 장치와 통신 연결을 수립하여 데이터를 주고받을 수 있다. 전자 장치는 다양한 메시지 어플리케이션을 이용하여 외부 사용자와의 실시간 연결을 가능하게 하고 있다.With the development of mobile communication technology and hardware/software technology, a portable electronic device (hereinafter referred to as an electronic device) can implement various functions beyond a conventional call function. An electronic device may exchange data by establishing a communication connection with an external device due to the development of communication technology. Electronic devices enable real-time connection with external users using various message applications.
전자 장치는 메시지 어플리케이션에서 사용할 수 있는 다양한 메시지 형태를 제공할 수 있다. 사용자는 제공된 키보드 UI를 이용하여 전자 장치에 문자 또는 이모티콘을 입력할 수 있다. 이모티콘, 이모지 또는 미모티콘과 같은 부가적 표현 수단을 이용하여, 사용자는 자신의 감정을 보다 직관적으로 전달할 수 있다.An electronic device may provide various message types usable in a message application. The user may input text or emoticon into the electronic device using the provided keyboard UI. Using an additional means of expression such as an emoticon, an emoji, or a memoji, the user can convey his or her emotions more intuitively.
종래의 전자 장치는 2D 및 3D 기술을 접목하여 생성된 이모티콘을 제공하였다. 사용자는 키보드 어플리케이션 상에서 제공된 이모티콘을 선택하여 전송할 수 있었다. 이는 사용자의 실제 감정이나 얼굴 표정을 사실적으로 구현하지 못하는 문제점이 있었다. 또한, 사용자 실제 얼굴에 기초하여 이모티콘을 생성하는 경우에도 생성에 많은 시간이 소요되어 즉각적인 의사소통을 하기에 어려움이 있었다.Conventional electronic devices provide emoticons created by combining 2D and 3D technologies. The user could select and transmit an emoticon provided on the keyboard application. This has a problem in that the user's actual emotion or facial expression cannot be realistically implemented. In addition, even when an emoticon is generated based on a user's real face, it takes a lot of time to create it, making it difficult to communicate immediately.
본 문서의 다양한 실시예들은 상기와 같이 전자 장치가 메시지 어플리케이션에서 실시간 메시지를 생성 및 전송하고자 할 경우, 현실에서의 교류 방식을 온디바이스(On-device) 모바일에서도 충실하게 구현하여 리얼리스틱 커뮤니케이션(realistic communication)을 구현함에 그 목적이 있다.Various embodiments of this document, as described above, when an electronic device wants to generate and transmit a real-time message in a message application, faithfully implements a real-life exchange method in on-device mobile to provide realistic communication. Its purpose is to realize communication).
다양한 실시예에 따른 전자 장치는, 디스플레이, 마이크, 카메라, 메모리 및 상기 디스플레이, 상기 마이크, 상기 카메라 및 상기 메모리와 작동적으로(operatively) 연결된 프로세서를 포함하고, 상기 프로세서는, 메시지 어플리케이션을 실행하고, 상기 메시지 어플리케이션 실행 화면에서 제공되는 메뉴에 대한 사용자 입력에 기초하여, 상기 마이크 및 상기 카메라 중 적어도 하나로 수신된 입력 데이터를 획득하고, 상기 입력 데이터에 포함된 인물의 감정 상태를 분석하고, 상기 분석한 감정 상태에 기초하여, 적어도 하나의 그래픽 객체를 포함하는 그래픽 데이터를 생성하고, 상기 입력 데이터 및 상기 그래픽 데이터에 기초하여 라이브 메시지를 생성하도록 설정된 전자 장치.An electronic device according to various embodiments includes a display, a microphone, a camera, a memory, and a processor operatively connected to the display, the microphone, the camera, and the memory, wherein the processor executes a message application and , Based on a user input for a menu provided on the message application execution screen, input data received by at least one of the microphone and the camera is acquired, an emotional state of a person included in the input data is analyzed, and the analysis An electronic device configured to generate graphic data including at least one graphic object based on one emotional state, and generate a live message based on the input data and the graphic data.
다양한 실시예에 따른 전자 장치의 실시간 메시지 생성 방법은, 메시지 어플리케이션을 실행하는 동작, 상기 메시지 어플리케이션 실행 화면에서 제공되는 메뉴에 대한 사용자 입력에 기초하여, 마이크 및 카메라 중 적어도 하나로 수신된 입력 데이터를 획득하는 동작, 상기 입력 데이터에 포함된 인물의 감정 상태를 분석하는 동작, 상기 분석한 감정 상태에 기초하여, 적어도 하나의 그래픽 객체를 포함하는 그래픽 데이터를 생성하는 동작, 상기 입력 데이터 및 상기 그래픽 데이터에 기초하여 라이브 메시지를 생성하는 동작을 포함하는 방법.A real-time message generation method of an electronic device according to various embodiments includes an operation of executing a message application and obtaining input data received through at least one of a microphone and a camera based on a user input for a menu provided on a message application execution screen. operation of analyzing the emotional state of the person included in the input data, operation of generating graphic data including at least one graphic object based on the analyzed emotional state, operation of generating graphic data including the input data and the graphic data and generating a live message based on the
다양한 실시예에 따르면, 전자 장치는 사진 또는 동영상의 모션, 목소리, 얼굴 표정을 분석하여 그에 따른 그래픽 자막 또는 이모티콘을 생성할 수 있다. 전자 장치는 생성한 입력 받은 메시지에 생성한 그래픽 데이터를 추가하여 사용자의 감정을 직관적으로 전달하는 기능을 제공할 수 있다.According to various embodiments, the electronic device may analyze the motion, voice, and facial expression of a photo or video and generate a graphic caption or emoticon accordingly. The electronic device may provide a function of intuitively conveying the user's emotion by adding the generated graphic data to the generated input message.
다양한 실시예에 따르면, 전자 장치는 생성한 컨텐츠를 여러 개의 데이터 타입으로 구분하고, 라이브 메시지를 전송하는 외부 장치의 종류에 따라서 전송할 데이터 타입을 결정할 수 있다. 이를 통하여 현실에서의 감정 교류 방식을 전자 장치에서도 충실하게 구현할 수 있는 개인 맞춤형 표현 수단을 제공할 수 있다.According to various embodiments, the electronic device may classify generated content into several data types and determine a data type to transmit according to the type of an external device transmitting a live message. Through this, it is possible to provide a personalized means of expression that can faithfully implement an emotional exchange method in reality in an electronic device.
그 외에 본 전자 장치의 다양한 실시예들로 인하여 얻을 수 있거나 예측되는 효과에 대해서는 전자 장치의 실시예에 대한 상세한 설명에서 직접적으로 또는 암시적으로 개시하도록 한다. 예컨대, 전자 장치의 다양한 실시예들에 따라 예측되는 다양한 효과에 대해서는 후술될 상세한 설명 내에서 개시될 것이다.In addition, effects that can be obtained or predicted due to various embodiments of the present electronic device will be directly or implicitly disclosed in the detailed description of the embodiment of the electronic device. For example, various effects predicted according to various embodiments of an electronic device will be disclosed within the detailed description to be described later.
도 1은 다양한 실시예들에 따른, 네트워크 환경 내의 전자 장치의 블록도이다.1 is a block diagram of an electronic device in a network environment, according to various embodiments.
도 2a 및 도 2b는 다양한 실시예에 따른 전자 장치에서 라이브 메시지를 생성하여 전송하는 것을 도시한 도면이다.2A and 2B are diagrams illustrating generating and transmitting a live message in an electronic device according to various embodiments.
도 3은 다양한 실시예에 따른 전자 장치의 블록도이다.3 is a block diagram of an electronic device according to various embodiments.
도 4는 다양한 실시예에 따른 전자 장치가 영상 및 음성 데이터에 기초하여 라이브 메시지를 생성하는 것을 도시한 것이다.4 illustrates that an electronic device generates a live message based on video and audio data according to various embodiments.
도 5는 다양한 실시예에 따른 전자 장치가 영상 데이터에 기초하여 라이브 메시지를 생성하는 것을 도시한 것이다.5 illustrates generating a live message based on image data by an electronic device according to various embodiments.
도 6은 다양한 실시예에 따른 전자 장치가 사진 데이터에 기초하여 라이브 메시지를 생성하는 것을 도시한 것이다.6 illustrates generating a live message based on photo data by an electronic device according to various embodiments of the present disclosure.
도 7a 및 도 7b는 다양한 실시예에 따른 전자 장치에서 실시간 메시지를 생성하기 위해서 제공되는 그래픽 UI를 도시한 것이다.7A and 7B illustrate a graphic UI provided to generate a real-time message in an electronic device according to various embodiments.
도 8은 다양한 실시예에 따른 외부 장치의 종류에 따른 데이터 타입을 도시한 것이다.8 illustrates data types according to types of external devices according to various embodiments.
도 9는 다양한 실시예에 따른 전자 장치에서 음성 데이터에 기초한 실시간 메시지를 생성하는 것을 도시한 것이다.9 illustrates generating a real-time message based on voice data in an electronic device according to various embodiments.
도 10은 다양한 실시예에 따른 전자 장치의 실시간 메시지 생성 방법의 순서도이다.10 is a flowchart of a method of generating a message in real time by an electronic device according to various embodiments.
도 11은 다양한 실시예에 따른 전자 장치가 그래픽 데이터를 생성하는 방법의 순서도이다.11 is a flowchart of a method of generating graphic data by an electronic device according to various embodiments.
이하, 본 발명의 실시 예를 첨부된 도면에 의거하여 상세히 설명한다. Hereinafter, embodiments of the present invention will be described in detail based on the accompanying drawings.
실시 예를 설명함에 있어서 본 발명이 속하는 기술분야에 익히 알려져 있고 본 발명과 직접적으로 관련이 없는 기술 내용에 대해서는 설명을 생략한다. 또한, 실질적으로 동일한 구성과 기능을 가진 구성 요소들에 대해서는 상세한 설명을 생략하도록 한다.In describing the embodiments, descriptions of technical contents that are well known in the art to which the present invention pertains and are not directly related to the present invention will be omitted. In addition, detailed descriptions of components having substantially the same configuration and function will be omitted.
마찬가지의 이유로 첨부 도면에 있어서 일부 구성요소는 과장되거나 생략되거나 또는 개략적으로 도시되었으며, 각 구성요소의 크기는 실제 크기를 전적으로 반영하는 것이 아니다. 따라서 본 발명은 첨부한 도면에 그려진 상대적인 크기나 간격에 의해 제한되어지지 않는다.For the same reason, some components in the accompanying drawings are exaggerated, omitted, or schematically illustrated, and the size of each component does not entirely reflect the actual size. Accordingly, the present invention is not limited by the relative size or spacing drawn in the accompanying drawings.
도 1은 다양한 실시예들에 따른, 네트워크 환경 내의 전자 장치의 블록도이다.1 is a block diagram of an electronic device in a network environment, according to various embodiments.
도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제 1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제 2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108) 중 적어도 하나와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 모듈(150), 음향 출력 모듈(155), 디스플레이 모듈(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 연결 단자(178), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 연결 단자(178))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들(예: 센서 모듈(176), 카메라 모듈(180), 또는 안테나 모듈(197))은 하나의 구성요소(예: 디스플레이 모듈(160))로 통합될 수 있다.Referring to FIG. 1 , in a network environment 100, an electronic device 101 communicates with an electronic device 102 through a first network 198 (eg, a short-range wireless communication network) or through a second network 199. It may communicate with at least one of the electronic device 104 or the server 108 through (eg, a long-distance wireless communication network). According to one embodiment, the electronic device 101 may communicate with the electronic device 104 through the server 108 . According to an embodiment, the electronic device 101 includes a processor 120, a memory 130, an input module 150, an audio output module 155, a display module 160, an audio module 170, a sensor module ( 176), interface 177, connection terminal 178, haptic module 179, camera module 180, power management module 188, battery 189, communication module 190, subscriber identification module 196 , or the antenna module 197 may be included. In some embodiments, in the electronic device 101, at least one of these components (eg, the connection terminal 178) may be omitted or one or more other components may be added. In some embodiments, some of these components (eg, sensor module 176, camera module 180, or antenna module 197) are integrated into a single component (eg, display module 160). It can be.
프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일 실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 저장하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(134)에 저장할 수 있다. 일 실시예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 어플리케이션 프로세서) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 신경망 처리 장치(NPU: neural processing unit), 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 예를 들어, 전자 장치(101)가 메인 프로세서(121) 및 보조 프로세서(123)를 포함하는 경우, 보조 프로세서(123)는 메인 프로세서(121)보다 저전력을 사용하거나, 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.The processor 120, for example, executes software (eg, the program 140) to cause at least one other component (eg, hardware or software component) of the electronic device 101 connected to the processor 120. It can control and perform various data processing or calculations. According to one embodiment, as at least part of data processing or operation, processor 120 transfers instructions or data received from other components (e.g., sensor module 176 or communication module 190) to volatile memory 132. , processing commands or data stored in the volatile memory 132 , and storing resultant data in the non-volatile memory 134 . According to one embodiment, the processor 120 includes a main processor 121 (eg, a central processing unit or an application processor) or a secondary processor 123 (eg, a graphic processing unit, a neural network processing unit ( NPU: neural processing unit (NPU), image signal processor, sensor hub processor, or communication processor). For example, when the electronic device 101 includes the main processor 121 and the auxiliary processor 123, the auxiliary processor 123 may use less power than the main processor 121 or be set to be specialized for a designated function. can The secondary processor 123 may be implemented separately from or as part of the main processor 121 .
보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 디스플레이 모듈(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 신경망 처리 장치)는 인공지능 모델의 처리에 특화된 하드웨어 구조를 포함할 수 있다. 인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능 모델이 수행되는 전자 장치(101) 자체에서 수행될 수 있고, 별도의 서버(예: 서버(108))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다. The secondary processor 123 may, for example, take the place of the main processor 121 while the main processor 121 is in an inactive (eg, sleep) state, or the main processor 121 is active (eg, running an application). ) state, together with the main processor 121, at least one of the components of the electronic device 101 (eg, the display module 160, the sensor module 176, or the communication module 190) It is possible to control at least some of the related functions or states. According to one embodiment, the auxiliary processor 123 (eg, image signal processor or communication processor) may be implemented as part of other functionally related components (eg, camera module 180 or communication module 190). there is. According to an embodiment, the auxiliary processor 123 (eg, a neural network processing device) may include a hardware structure specialized for processing an artificial intelligence model. AI models can be created through machine learning. Such learning may be performed, for example, in the electronic device 101 itself where the artificial intelligence model is performed, or may be performed through a separate server (eg, the server 108). The learning algorithm may include, for example, supervised learning, unsupervised learning, semi-supervised learning or reinforcement learning, but in the above example Not limited. The artificial intelligence model may include a plurality of artificial neural network layers. Artificial neural networks include deep neural networks (DNNs), convolutional neural networks (CNNs), recurrent neural networks (RNNs), restricted boltzmann machines (RBMs), deep belief networks (DBNs), bidirectional recurrent deep neural networks (BRDNNs), It may be one of deep Q-networks or a combination of two or more of the foregoing, but is not limited to the foregoing examples. The artificial intelligence model may include, in addition or alternatively, software structures in addition to hardware structures.
메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서 모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비휘발성 메모리(134)를 포함할 수 있다. The memory 130 may store various data used by at least one component (eg, the processor 120 or the sensor module 176) of the electronic device 101 . The data may include, for example, input data or output data for software (eg, program 140) and commands related thereto. The memory 130 may include volatile memory 132 or non-volatile memory 134 .
프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다. The program 140 may be stored as software in the memory 130 and may include, for example, an operating system 142 , middleware 144 , or an application 146 .
입력 모듈(150)은, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 모듈(150)은, 예를 들면, 마이크, 마우스, 키보드, 키(예: 버튼), 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다. The input module 150 may receive a command or data to be used by a component (eg, the processor 120) of the electronic device 101 from the outside of the electronic device 101 (eg, a user). The input module 150 may include, for example, a microphone, a mouse, a keyboard, a key (eg, a button), or a digital pen (eg, a stylus pen).
음향 출력 모듈(155)은 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 모듈(155)은, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있다. 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.The sound output module 155 may output sound signals to the outside of the electronic device 101 . The sound output module 155 may include, for example, a speaker or a receiver. The speaker can be used for general purposes such as multimedia playback or recording playback. A receiver may be used to receive an incoming call. According to one embodiment, the receiver may be implemented separately from the speaker or as part of it.
디스플레이 모듈(160)은 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 디스플레이 모듈(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일실시예에 따르면, 디스플레이 모듈(160)은 터치를 감지하도록 설정된 터치 센서, 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 압력 센서를 포함할 수 있다. The display module 160 may visually provide information to the outside of the electronic device 101 (eg, a user). The display module 160 may include, for example, a display, a hologram device, or a projector and a control circuit for controlling the device. According to one embodiment, the display module 160 may include a touch sensor set to detect a touch or a pressure sensor set to measure the intensity of force generated by the touch.
오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일실시예에 따르면, 오디오 모듈(170)은, 입력 모듈(150)을 통해 소리를 획득하거나, 음향 출력 모듈(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.The audio module 170 may convert sound into an electrical signal or vice versa. According to one embodiment, the audio module 170 acquires sound through the input module 150, the sound output module 155, or an external electronic device connected directly or wirelessly to the electronic device 101 (eg: Sound may be output through the electronic device 102 (eg, a speaker or a headphone).
센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일실시예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다. The sensor module 176 detects an operating state (eg, power or temperature) of the electronic device 101 or an external environmental state (eg, a user state), and generates an electrical signal or data value corresponding to the detected state. can do. According to one embodiment, the sensor module 176 may include, for example, a gesture sensor, a gyro sensor, an air pressure sensor, a magnetic sensor, an acceleration sensor, a grip sensor, a proximity sensor, a color sensor, an IR (infrared) sensor, a bio sensor, It may include a temperature sensor, humidity sensor, or light sensor.
인터페이스(177)는 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일실시예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.The interface 177 may support one or more designated protocols that may be used to directly or wirelessly connect the electronic device 101 to an external electronic device (eg, the electronic device 102). According to one embodiment, the interface 177 may include, for example, a high definition multimedia interface (HDMI), a universal serial bus (USB) interface, an SD card interface, or an audio interface.
연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일실시예에 따르면, 연결 단자(178)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.The connection terminal 178 may include a connector through which the electronic device 101 may be physically connected to an external electronic device (eg, the electronic device 102). According to one embodiment, the connection terminal 178 may include, for example, an HDMI connector, a USB connector, an SD card connector, or an audio connector (eg, a headphone connector).
햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일실시예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.The haptic module 179 may convert electrical signals into mechanical stimuli (eg, vibration or motion) or electrical stimuli that a user may perceive through tactile or kinesthetic senses. According to one embodiment, the haptic module 179 may include, for example, a motor, a piezoelectric element, or an electrical stimulation device.
카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일실시예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.The camera module 180 may capture still images and moving images. According to one embodiment, the camera module 180 may include one or more lenses, image sensors, image signal processors, or flashes.
전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일실시예에 따르면, 전력 관리 모듈(188)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.The power management module 188 may manage power supplied to the electronic device 101 . According to one embodiment, the power management module 188 may be implemented as at least part of a power management integrated circuit (PMIC), for example.
배터리(189)는 전자 장치(101)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일실시예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.The battery 189 may supply power to at least one component of the electronic device 101 . According to one embodiment, the battery 189 may include, for example, a non-rechargeable primary cell, a rechargeable secondary cell, or a fuel cell.
통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일실시예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(198)(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제 2 네트워크(199)(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부의 전자 장치(104)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 또는 인증할 수 있다. The communication module 190 is a direct (eg, wired) communication channel or a wireless communication channel between the electronic device 101 and an external electronic device (eg, the electronic device 102, the electronic device 104, or the server 108). Establishment and communication through the established communication channel may be supported. The communication module 190 may include one or more communication processors that operate independently of the processor 120 (eg, an application processor) and support direct (eg, wired) communication or wireless communication. According to one embodiment, the communication module 190 is a wireless communication module 192 (eg, a cellular communication module, a short-range wireless communication module, or a global navigation satellite system (GNSS) communication module) or a wired communication module 194 (eg, : a local area network (LAN) communication module or a power line communication module). Among these communication modules, a corresponding communication module is a first network 198 (eg, a short-range communication network such as Bluetooth, wireless fidelity (WiFi) direct, or infrared data association (IrDA)) or a second network 199 (eg, legacy It may communicate with the external electronic device 104 through a cellular network, a 5G network, a next-generation communication network, the Internet, or a telecommunications network such as a computer network (eg, a LAN or a WAN). These various types of communication modules may be integrated as one component (eg, a single chip) or implemented as a plurality of separate components (eg, multiple chips). The wireless communication module 192 uses subscriber information (eg, International Mobile Subscriber Identifier (IMSI)) stored in the subscriber identification module 196 within a communication network such as the first network 198 or the second network 199. The electronic device 101 may be identified or authenticated.
무선 통신 모듈(192)은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB(enhanced mobile broadband)), 단말 전력 최소화와 다수 단말의 접속(mMTC(massive machine type communications)), 또는 고신뢰도와 저지연(URLLC(ultra-reliable and low-latency communications))을 지원할 수 있다. 무선 통신 모듈(192)은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈(192)은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO: full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다. 무선 통신 모듈(192)은 전자 장치(101), 외부 전자 장치(예: 전자 장치(104)) 또는 네트워크 시스템(예: 제 2 네트워크(199))에 규정되는 다양한 요구사항을 지원할 수 있다. 일실시예에 따르면, 무선 통신 모듈(192)은 eMBB 실현을 위한 Peak data rate(예: 20Gbps 이상), mMTC 실현을 위한 손실 Coverage(예: 164dB 이하), 또는 URLLC 실현을 위한 U-plane latency(예: 다운링크(DL) 및 업링크(UL) 각각 0.5ms 이하, 또는 라운드 트립 1ms 이하)를 지원할 수 있다.The wireless communication module 192 may support a 5G network after a 4G network and a next-generation communication technology, for example, NR access technology (new radio access technology). NR access technologies include high-speed transmission of high-capacity data (enhanced mobile broadband (eMBB)), minimization of terminal power and access of multiple terminals (massive machine type communications (mMTC)), or high reliability and low latency (ultra-reliable and low latency (URLLC)). -latency communications)) can be supported. The wireless communication module 192 may support a high frequency band (eg, mmWave band) to achieve a high data rate, for example. The wireless communication module 192 uses various technologies for securing performance in a high frequency band, such as beamforming, massive multiple-input and multiple-output (MIMO), and full-dimensional multiplexing. Technologies such as input/output (FD-MIMO: full dimensional MIMO), array antenna, analog beam-forming, or large scale antenna may be supported. The wireless communication module 192 may support various requirements defined for the electronic device 101, an external electronic device (eg, the electronic device 104), or a network system (eg, the second network 199). According to one embodiment, the wireless communication module 192 is a peak data rate for eMBB realization (eg, 20 Gbps or more), a loss coverage for mMTC realization (eg, 164 dB or less), or a U-plane latency for URLLC realization (eg, Example: downlink (DL) and uplink (UL) each of 0.5 ms or less, or round trip 1 ms or less) may be supported.
안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 안테나를 포함할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다. 이런 경우, 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부의 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC(radio frequency integrated circuit))이 추가로 안테나 모듈(197)의 일부로 형성될 수 있다. The antenna module 197 may transmit or receive signals or power to the outside (eg, an external electronic device). According to one embodiment, the antenna module 197 may include an antenna including a radiator formed of a conductor or a conductive pattern formed on a substrate (eg, PCB). According to one embodiment, the antenna module 197 may include a plurality of antennas (eg, an array antenna). In this case, at least one antenna suitable for a communication method used in a communication network such as the first network 198 or the second network 199 is selected from the plurality of antennas by the communication module 190, for example. can be chosen A signal or power may be transmitted or received between the communication module 190 and an external electronic device through the selected at least one antenna. According to some embodiments, other components (eg, a radio frequency integrated circuit (RFIC)) may be additionally formed as a part of the antenna module 197 in addition to the radiator.
다양한 실시예에 따르면, 안테나 모듈(197)은 mmWave 안테나 모듈을 형성할 수 있다. 일실시예에 따르면, mmWave 안테나 모듈은 인쇄 회로 기판, 상기 인쇄 회로 기판의 제 1 면(예: 아래 면)에 또는 그에 인접하여 배치되고 지정된 고주파 대역(예: mmWave 대역)을 지원할 수 있는 RFIC, 및 상기 인쇄 회로 기판의 제 2 면(예: 윗 면 또는 측 면)에 또는 그에 인접하여 배치되고 상기 지정된 고주파 대역의 신호를 송신 또는 수신할 수 있는 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.According to various embodiments, the antenna module 197 may form a mmWave antenna module. According to one embodiment, the mmWave antenna module includes a printed circuit board, an RFIC disposed on or adjacent to a first surface (eg, a lower surface) of the printed circuit board and capable of supporting a designated high frequency band (eg, mmWave band); and a plurality of antennas (eg, array antennas) disposed on or adjacent to a second surface (eg, a top surface or a side surface) of the printed circuit board and capable of transmitting or receiving signals of the designated high frequency band. can do.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.At least some of the components are connected to each other through a communication method between peripheral devices (eg, a bus, general purpose input and output (GPIO), serial peripheral interface (SPI), or mobile industry processor interface (MIPI)) and signal ( e.g. commands or data) can be exchanged with each other.
일실시예에 따르면, 명령 또는 데이터는 제 2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104)간에 송신 또는 수신될 수 있다. 외부의 전자 장치(102, 또는 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 일실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부의 전자 장치들(102, 104, 또는 108) 중 하나 이상의 외부의 전자 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부의 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부의 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 모바일 에지 컴퓨팅(MEC: mobile edge computing), 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다. 전자 장치(101)는, 예를 들어, 분산 컴퓨팅 또는 모바일 에지 컴퓨팅을 이용하여 초저지연 서비스를 제공할 수 있다. 다른 실시예에 있어서, 외부의 전자 장치(104)는 IoT(internet of things) 기기를 포함할 수 있다. 서버(108)는 기계 학습 및/또는 신경망을 이용한 지능형 서버일 수 있다. 일실시예에 따르면, 외부의 전자 장치(104) 또는 서버(108)는 제 2 네트워크(199) 내에 포함될 수 있다. 전자 장치(101)는 5G 통신 기술 및 IoT 관련 기술을 기반으로 지능형 서비스(예: 스마트 홈, 스마트 시티, 스마트 카, 또는 헬스 케어)에 적용될 수 있다. According to an embodiment, commands or data may be transmitted or received between the electronic device 101 and the external electronic device 104 through the server 108 connected to the second network 199 . Each of the external electronic devices 102 or 104 may be the same as or different from the electronic device 101 . According to an embodiment, all or part of operations executed in the electronic device 101 may be executed in one or more external electronic devices among the external electronic devices 102 , 104 , or 108 . For example, when the electronic device 101 needs to perform a certain function or service automatically or in response to a request from a user or another device, the electronic device 101 instead of executing the function or service by itself. Alternatively or additionally, one or more external electronic devices may be requested to perform the function or at least part of the service. One or more external electronic devices receiving the request may execute at least a part of the requested function or service or an additional function or service related to the request, and deliver the execution result to the electronic device 101 . The electronic device 101 may provide the result as at least part of a response to the request as it is or additionally processed. To this end, for example, cloud computing, distributed computing, mobile edge computing (MEC), or client-server computing technology may be used. The electronic device 101 may provide an ultra-low latency service using, for example, distributed computing or mobile edge computing. In another embodiment, the external electronic device 104 may include an internet of things (IoT) device. Server 108 may be an intelligent server using machine learning and/or neural networks. According to one embodiment, the external electronic device 104 or server 108 may be included in the second network 199 . The electronic device 101 may be applied to intelligent services (eg, smart home, smart city, smart car, or health care) based on 5G communication technology and IoT-related technology.
본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치(예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.Electronic devices according to various embodiments disclosed in this document may be devices of various types. The electronic device may include, for example, a portable communication device (eg, a smart phone), a computer device, a portable multimedia device, a portable medical device, a camera, a wearable device, or a home appliance. An electronic device according to an embodiment of the present document is not limited to the aforementioned devices.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나", "A, B 또는 C", "A, B 및 C 중 적어도 하나", 및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.Various embodiments of this document and terms used therein are not intended to limit the technical features described in this document to specific embodiments, but should be understood to include various modifications, equivalents, or substitutes of the embodiments. In connection with the description of the drawings, like reference numbers may be used for like or related elements. The singular form of a noun corresponding to an item may include one item or a plurality of items, unless the relevant context clearly dictates otherwise. In this document, "A or B", "at least one of A and B", "at least one of A or B", "A, B or C", "at least one of A, B and C", and "A Each of the phrases such as "at least one of , B, or C" may include any one of the items listed together in that phrase, or all possible combinations thereof. Terms such as "first", "second", or "first" or "secondary" may simply be used to distinguish a given component from other corresponding components, and may be used to refer to a given component in another aspect (eg, importance or order) is not limited. A (e.g., first) component is said to be "coupled" or "connected" to another (e.g., second) component, with or without the terms "functionally" or "communicatively." When mentioned, it means that the certain component may be connected to the other component directly (eg by wire), wirelessly, or through a third component.
본 문서의 다양한 실시예들에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로와 같은 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다. The term "module" used in various embodiments of this document may include a unit implemented in hardware, software, or firmware, and is interchangeable with terms such as, for example, logic, logical blocks, parts, or circuits. can be used as A module may be an integrally constructed component or a minimal unit of components or a portion thereof that performs one or more functions. For example, according to one embodiment, the module may be implemented in the form of an application-specific integrated circuit (ASIC).
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(101)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(136) 또는 외장 메모리(138))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(140))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(101))의 프로세서(예: 프로세서(120))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, ‘비일시적’은 저장 매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.Various embodiments of this document provide one or more instructions stored in a storage medium (eg, internal memory 136 or external memory 138) readable by a machine (eg, electronic device 101). It may be implemented as software (eg, the program 140) including them. For example, a processor (eg, the processor 120 ) of a device (eg, the electronic device 101 ) may call at least one command among one or more instructions stored from a storage medium and execute it. This enables the device to be operated to perform at least one function according to the at least one command invoked. The one or more instructions may include code generated by a compiler or code executable by an interpreter. The device-readable storage medium may be provided in the form of a non-transitory storage medium. Here, 'non-temporary' only means that the storage medium is a tangible device and does not contain a signal (e.g. electromagnetic wave), and this term refers to the case where data is stored semi-permanently in the storage medium. It does not discriminate when it is temporarily stored.
일실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory(CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들(예: 스마트 폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.According to one embodiment, the method according to various embodiments disclosed in this document may be included and provided in a computer program product. Computer program products may be traded between sellers and buyers as commodities. A computer program product is distributed in the form of a device-readable storage medium (e.g. compact disc read only memory (CD-ROM)), or through an application store (e.g. Play Store TM ) or on two user devices (e.g. It can be distributed (eg downloaded or uploaded) online, directly between smart phones. In the case of online distribution, at least part of the computer program product may be temporarily stored or temporarily created in a storage medium readable by a device such as a manufacturer's server, an application store server, or a relay server's memory.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있으며, 복수의 개체 중 일부는 다른 구성요소에 분리 배치될 수도 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.According to various embodiments, each component (eg, module or program) of the above-described components may include a single object or a plurality of entities, and some of the plurality of entities may be separately disposed in other components. there is. According to various embodiments, one or more components or operations among the aforementioned corresponding components may be omitted, or one or more other components or operations may be added. Alternatively or additionally, a plurality of components (eg modules or programs) may be integrated into a single component. In this case, the integrated component may perform one or more functions of each of the plurality of components identically or similarly to those performed by a corresponding component of the plurality of components prior to the integration. . According to various embodiments, the actions performed by a module, program, or other component are executed sequentially, in parallel, iteratively, or heuristically, or one or more of the actions are executed in a different order, or omitted. or one or more other actions may be added.
도 2a 및 도 2b는 다양한 실시예에 따른 전자 장치에서 라이브 메시지를 생성하여 전송하는 것을 도시한 도면이다.2A and 2B are diagrams illustrating generating and transmitting a live message in an electronic device according to various embodiments.
도 2a를 참조하면, 전자 장치는 마이크 또는 카메라를 통해 수신한 입력 데이터(210)를 획득할 수 있다. 입력 데이터(210)는 음성, 사진, 및 영상 중 적어도 하나를 포함할 수 있다. 예를 들어, 전자 장치는 하우징의 전면 또는 후면에 위치한 카메라를 이용하여 오브젝트를 인식하고, 디스플레이의 일 측에 도2a(a)와 같은 프리뷰를 표시할 수 있다.Referring to FIG. 2A , the electronic device may obtain input data 210 received through a microphone or camera. The input data 210 may include at least one of voice, picture, and video. For example, the electronic device may recognize an object using a camera located on the front or rear of the housing and display a preview as shown in FIG. 2a(a) on one side of the display.
다양한 실시예에 따르면, 전자 장치는 입력 데이터(210)에 기초하여 그래픽 데이터(220)를 생성할 수 있다. 예를 들어, 전자 장치는 입력 데이터(210)를 분석하고, 입력 데이터(210)에 포함된 인물의 감정에 대응하는 그래픽 데이터(220)를 생성할 수 있다. 전자 장치는 입력 데이터(210)의 인물이 웃는 표정과 오른손 엄지를 치켜든 모션을 분석하여, "Really", "good", 웃음 이모티콘으로 구성된 그래픽 데이터(220)를 생성할 수 있다. 전자 장치는 입력 데이터(210)를 분석하기 위해 감정 딥러닝 모듈 또는 모션 딥러닝 모듈을 이용할 수 있다. 예를 들어, 전자 장치는 감정 딥러닝 모듈을 이용하여 입력 데이터(210)의 등장 인물의 감정 정보를 결정하고, 이에 대응하는 이모티콘을 포함하는 그래픽 데이터(220)를 생성할 수 있다. 전자 장치는 입력 데이터(210)와 그래픽 데이터(220)를 합성하여 라이브 메시지를 생성할 수 있다. 도 2a(b)는 전자 장치가 도 2a(a)의 입력 데이터(210)를 분석하여 그래픽 데이터(220)와 합성한 라이브 메시지를 도시한 것이다.According to various embodiments, the electronic device may generate graphic data 220 based on input data 210 . For example, the electronic device may analyze the input data 210 and generate graphic data 220 corresponding to the emotion of a person included in the input data 210 . The electronic device may generate graphic data 220 composed of “Really”, “good”, and a laughing emoticon by analyzing the smiley expression of the person of the input data 210 and the motion of raising the thumb of the right hand. The electronic device may use an emotion deep learning module or a motion deep learning module to analyze the input data 210 . For example, the electronic device may determine emotion information of a character in the input data 210 by using an emotion deep learning module and generate graphic data 220 including an emoticon corresponding thereto. The electronic device may generate a live message by synthesizing the input data 210 and the graphic data 220 . FIG. 2A(B) illustrates a live message synthesized with graphic data 220 by analyzing the input data 210 of FIG. 2A(A) by the electronic device.
도 2b를 참조하면, 전자 장치는 메시지 어플리케이션을 통해서 생성한 라이브 메시지를 전송할 수 있다. 전자 장치는 메시지 어플리케이션을 실행하고(230), 메시지 어플리케이션 상에서 라이브 메시지를 생성하기 위한 프리뷰 화면을 제공할 수 있다. 전자 장치는 사용자 입력에 기초하여 카메라 및 마이크를 작동하여 입력 데이터(210)를 수신하고, 그래픽 데이터(220)를 생성하여 라이브 메시지를 생성할 수 있다(240). 전자 장치는 생성한 라이브 메시지를 메모리에 저장할 수 있으며, 사용자 입력에 기초하여 라이브 메시지를 메시지 어플리케이션을 통해서 외부 장치로 전송할 수 있다. 전자 장치가 라이브 메시지를 생성하는 동작에 대해서는 이하 도 3 내지 도 10에서 자세히 설명하도록 한다.Referring to FIG. 2B , the electronic device may transmit a live message created through a message application. The electronic device may execute the message application (230) and provide a preview screen for generating a live message on the message application. The electronic device may operate a camera and a microphone based on a user input to receive input data 210 and generate graphic data 220 to generate a live message (240). The electronic device may store the generated live message in a memory and transmit the live message to an external device through a message application based on a user input. An operation of generating a live message by an electronic device will be described in detail with reference to FIGS. 3 to 10 below.
도 3은 다양한 실시예에 따른 전자 장치의 블록도이다.3 is a block diagram of an electronic device according to various embodiments.
도 3을 참조하면, 전자 장치(300)는 디스플레이(320), 카메라(340), 마이크(330), 통신 모듈(350), 프로세서(310) 및 메모리(360)를 포함할 수 있으며, 다양한 실시예에서, 도시된 구성 중 일부가 생략 또는 치환 될 수도 있다. 전자 장치(300)는 도 1의 전자 장치(101)의 구성 및/또는 기능 중 적어도 일부를 더 포함할 수 있다. 도시된(또는 도시되지 않은) 전자 장치(300)의 각 구성 중 적어도 일부는 상호 작동적으로(operatively), 기능적으로(functionally) 및/또는 전기적으로 (electrically) 연결될 수 있다.Referring to FIG. 3 , an electronic device 300 may include a display 320, a camera 340, a microphone 330, a communication module 350, a processor 310, and a memory 360, and in various implementations In examples, some of the illustrated components may be omitted or substituted. The electronic device 300 may further include at least some of the configurations and/or functions of the electronic device 101 of FIG. 1 . At least some of the components of the illustrated (or not illustrated) electronic device 300 may be operatively, functionally, and/or electrically connected to each other.
다양한 실시예에 따르면, 디스플레이(320)는 프로세서(310)의 제어에 따라 다양한 영상을 표시할 수 있다. 디스플레이(320)는 액정 디스플레이(liquid crystal display(LCD)), 발광 다이오드(light-emitting diode(LED)) 디스플레이, 마이크로 LED(micro LED) 디스플레이, QD(quantum dot) 디스플레이 또는 유기 발광 다이오드(organic light-emitting diode(OLED)) 디스플레이 중 어느 하나로 구현될 수 있으며, 이에 한정되지는 않는다. 디스플레이(320)는 사용자의 신체 일부(예: 손가락) 또는 입력 장치(예: 스타일러스 펜)를 이용한 터치 및/또는 근접 터치(또는 호버링) 입력을 감지하는 터치 스크린으로 형성될 수 있다. 디스플레이(320)는 도 1의 디스플레이 모듈(160)의 구성 및/또는 기능 중 적어도 일부를 포함할 수 있다.According to various embodiments, the display 320 may display various images under the control of the processor 310 . The display 320 may be a liquid crystal display (LCD), a light-emitting diode (LED) display, a micro LED display, a quantum dot (QD) display, or an organic light emitting diode (QD) display. -Emitting diode (OLED)) may be implemented as any one of displays, but is not limited thereto. The display 320 may be formed as a touch screen that senses a touch and/or proximity touch (or hovering) input using a user's body part (eg, a finger) or an input device (eg, a stylus pen). The display 320 may include at least some of the components and/or functions of the display module 160 of FIG. 1 .
다양한 실시예에 따르면, 디스플레이(320)는 적어도 일부가 플렉서블(flexible) 할 수 있으며, 폴더블(foldable) 디스플레이, 또는 롤러블(rollable) 디스플레이로 구현될 수도 있다.According to various embodiments, at least a portion of the display 320 may be flexible, and may be implemented as a foldable display or a rollable display.
다양한 실시예에 따르면, 마이크(330)는 사용자의 음성과 같은 외부의 사운드를 집음하고, 이를 디지털 데이터인 음성 신호로 변환할 수 있다. 다양한 실시예에 따르면, 전자 장치(300)는 하우징(미도시)의 일부에 마이크(330)를 포함하거나, 유/무선으로 연결된 외부 마이크에서 집음 된 음성신호를 수신할 수도 있다.According to various embodiments, the microphone 330 may collect an external sound such as a user's voice and convert it into a voice signal that is digital data. According to various embodiments, the electronic device 300 may include a microphone 330 in a part of a housing (not shown) or may receive a voice signal collected from an external microphone connected wired/wireless.
다양한 실시예에 따르면, 카메라(340)는 외부의 이미지 데이터를 획득할 수 있다. 카메라(340)는 CCD(charge coupled device), 또는 CMOS(complementary metal oxide semiconductor)와 같은 다양한 방식의 이미지 센서를 이용해 이미지 데이터를 획득할 수 있다. 카메라(340)는 도 1의 카메라 모듈(180)의 구성 및/또는 기능 중 적어도 일부를 포함할 수 있다. 전자 장치(300)는 하나 이상의 카메라(340)를 하우징의 전면 및/또는 후면에 배치할 수 있으며, 이하에서는 다른 설명이 없는 한 외부 장치를 포함하는 이미지 데이터는 후면의 카메라(340)를 이용해 획득된 것일 수 있다.According to various embodiments, the camera 340 may acquire external image data. The camera 340 may acquire image data using various types of image sensors such as a charge coupled device (CCD) or a complementary metal oxide semiconductor (CMOS). The camera 340 may include at least some of the components and/or functions of the camera module 180 of FIG. 1 . The electronic device 300 may place one or more cameras 340 on the front and/or rear of the housing, and unless otherwise specified, image data including an external device is acquired using the rear camera 340. may have been
다양한 실시예에 따르면, 메모리(360)는 휘발성 메모리(예: 도 1의 휘발성 메모리(132)) 및 비휘발성 메모리(예: 도 1의 비휘발성 메모리(134))를 포함하여, 다양한 데이터들을 일시적 또는 영구적으로 저장할 수 있다. 메모리(360)는 도 1의 메모리(130)의 구성 및/또는 기능 중 적어도 일부를 포함하고, 도 1의 프로그램(140)을 저장할 수 있다.According to various embodiments, the memory 360 includes a volatile memory (eg, the volatile memory 132 of FIG. 1 ) and a non-volatile memory (eg, the non-volatile memory 134 of FIG. 1 ) to temporarily store various data. or stored permanently. The memory 360 includes at least some of the configuration and/or functions of the memory 130 of FIG. 1 and may store the program 140 of FIG. 1 .
다양한 실시예에 따르면, 메모리(360)는 프로세서(310)에서 수행될 수 있는 다양한 인스트럭션(instruction)들을 저장할 수 있다. 이와 같은 인스트럭션들은 프로세서(310)에 의해 인식될 수 있는 산술 및 논리 연산, 데이터 이동, 입출력 등과 같은 제어 명령을 포함할 수 있다.According to various embodiments, the memory 360 may store various instructions that may be executed by the processor 310 . These instructions may include control commands such as arithmetic and logical operations, data movement, input/output, and the like that may be recognized by the processor 310 .
다양한 실시예에 따르면, 프로세서(310)는 전자 장치(300) 각 구성요소들(예: 디스플레이(320), 카메라(340), 마이크(330), 통신 모듈(350) 및 메모리(360))과 작동적으로(operatively), 기능적으로(functionally), 및/또는 전기적으로(electrically) 연결되어, 각 구성요소들의 제어 및/또는 통신에 관한 연산이나 데이터 처리를 수행할 수 있는 구성일 수 있다. 프로세서(310)는 도 1의 프로세서(120)의 구성 및/또는 기능 중 적어도 일부를 포함할 수 있다.According to various embodiments, the processor 310 may include components of the electronic device 300 (eg, the display 320, the camera 340, the microphone 330, the communication module 350, and the memory 360) and It may be a configuration that is operatively, functionally, and/or electrically connected to perform calculations or data processing related to control and/or communication of each component. The processor 310 may include at least some of the components and/or functions of the processor 120 of FIG. 1 .
다양한 실시예에 따르면, 프로세서(310)가 전자 장치(300) 상에서 구현할 수 있는 연산 및 데이터 처리 기능에는 한정됨이 없을 것이나, 이하에서는 전자 장치(300)에서 실시간으로 촬영한 영상 또는 사진에 기초한 메시지를 생성하기 위한 다양한 실시예에 대해 설명하기로 한다. 후술할 프로세서(310)의 동작들은 메모리(360)에 저장된 인스트럭션들을 로딩(loading)함으로써 수행될 수 있다.According to various embodiments, arithmetic and data processing functions that the processor 310 can implement on the electronic device 300 will not be limited, but hereinafter, a message based on an image or photo taken in real time by the electronic device 300 will be sent. Various embodiments for generating will be described. Operations of the processor 310 to be described later may be performed by loading instructions stored in the memory 360.
다양한 실시예에 따르면, 프로세서(310)는 카메라(340) 또는 마이크(330)로부터 입력 데이터(예: 도 2의 입력 데이터(210))를 획득할 수 있다. 입력 데이터는 음성, 영상 및 사진 중 적어도 하나를 포함할 수 있다. 프로세서(310)는 전자 장치(300)와 근거리 통신 연결된 사용자 디바이스를 통해서 수신된 입력 데이터를 획득할 수도 있다. 예를 들어, 프로세서(310)는 마이크(330)가 탑재된 사용자 디바이스와 통신 연결을 수립하고, 사용자 디바이스로부터 음성 데이터를 획득할 수도 있다.According to various embodiments, the processor 310 may obtain input data (eg, input data 210 of FIG. 2 ) from the camera 340 or the microphone 330 . The input data may include at least one of audio, video and pictures. The processor 310 may obtain input data received through a user device connected to the electronic device 300 through short-range communication. For example, the processor 310 may establish a communication connection with a user device equipped with the microphone 330 and obtain voice data from the user device.
다양한 실시예에 따르면, 프로세서(310)는 입력 데이터를 감정 딥러닝 모듈(emotion deep learning module) 및 모션 딥러닝 모듈(motion deep learning module)을 이용하여 분석할 수 있다. 감정 딥러닝 모듈은 입력 데이터에 등장하는 인물의 목소리, 표정, 음성 데이터를 분석하여 인물의 감정 정보를 결정할 수 있다. 프로세서(310)는 감정 딥러닝 모듈을 제어하여 적어도 하나의 감정 정보(예: 기쁨, 슬픔, 흥분, 화남, 무서움, 부드러움)를 결정할 수 있다. 모션 딥러닝 모듈은 입력 데이터에 등장하는 인물의 모션을 분석하여 감정 정보를 결정할 수 있다.According to various embodiments, the processor 310 may analyze input data using an emotion deep learning module and a motion deep learning module. The emotion deep learning module can determine the character's emotion information by analyzing the voice, facial expression, and voice data of the character appearing in the input data. The processor 310 may determine at least one emotion information (eg, joy, sadness, excitement, anger, fear, tenderness) by controlling the emotion deep learning module. The motion deep learning module can determine emotion information by analyzing motions of characters appearing in input data.
일 실시예에 따르면, 프로세서(310)는 적어도 하나의 단어 및 해당 단어에 대응하는 적어도 하나의 그래픽 요소를 맵핑하여 메모리(360)에 저장할 수 있다. 프로세서(310)는 입력 데이터에 사전에 정의한 단어가 포함되어 있으면 그에 대응하는 그래픽 요소를 생성할 수 있다. 예를 들어, 프로세서(310)는'바다'라는 단어와 파도 이모티콘, 갈매기 이모티콘 및 야자수 이모티콘을 맵핑하여 메모리(360)에 저장할 수 있다. 획득한 입력 데이터에 '바다'라는 단어가 포함된 경우, 프로세서(310)는 사전에 정의한 파도 이모티콘, 갈매기 이모티콘 및 야자수 이모티콘 중 적어도 하나를 포함하는 그래픽 데이터를 생성할 수 있다.According to an embodiment, the processor 310 may map and store at least one word and at least one graphic element corresponding to the corresponding word in the memory 360 . If a word defined in advance is included in the input data, the processor 310 may generate a graphic element corresponding thereto. For example, the processor 310 may map the word 'sea' to a wave emoticon, a seagull emoticon, and a palm tree emoticon and store them in the memory 360 . When the word 'sea' is included in the obtained input data, the processor 310 may generate graphic data including at least one of a wave emoticon, a seagull emoticon, and a palm tree emoticon defined in advance.
다양한 실시예에 따르면, 프로세서(310)는 등장 인물의 감정 정보를 결정하기 위해 얼굴 특징들을 식별할 수 있다. 일 실시예에 따르면, 감정 딥러닝 모듈은 다양한 얼굴 인식 기술을 채택하여 데이터를 학습할 수 있다. 예를 들어, 얼굴 인식 알고리즘은 고유한 얼굴들을 포함할 수 있는 주성분 분석(principal component analysis), 선형 판별 분석(linear discriminate analysis), 피셔 얼굴 알고리즘을 추가로 사용할 수 있는 탄성 번치 그래프 매칭(elastic bunch graph matching), 은닉 마르코프 모델(hidden Markov model), 텐서 표현을 사용할 수 있는 다중선형 서브공간 학습(multilinear subspace learning) 및 신경 자극 동적 링크 매칭(neuronal motivated dynamic link matching)을 포함하나, 이들로 제한되지 않는다. 이러한 얼굴 인식 기술들은 특히 흉터들 또는 점들로서의 개인 특성들뿐만 아니라 눈 및 입 주위의 윤곽 라인들을 식별할 때 얼굴 데이터의 정확도를 강화하기 위하여 픽셀 분석 또는 다른 윤곽 추적 및 분류 기술들의 사용에 의해 증대 (또는 대체)될 수 있다. 또 다른 예들에서는 얼굴의 형상 및 얼굴의 치수들에 대한 정보를 캡처하기 위해 3차원 얼굴 인식 기술들이 또한 사용될 수 있다. 예를 들어, 3차원 얼굴 인식 기술들은 눈 구멍, 코 및/또는 턱의 윤곽과 같은 (그러나, 이들로 제한 되지 않음) 얼굴의 표면상의 톡특한 특징들을 식별하는데 유용할 수 있다.According to various embodiments, processor 310 may identify facial features to determine emotional information of a character. According to an embodiment, the deep emotion learning module may learn data by adopting various face recognition technologies. For example, face recognition algorithms include principal component analysis, which may include unique faces, linear discriminate analysis, and elastic bunch graph matching, which may additionally use Fisher's face algorithm. matching), hidden Markov models, multilinear subspace learning that can use tensor representations, and neuronal motivated dynamic link matching. . These facial recognition technologies are augmented by the use of pixel analysis or other contour tracking and classification techniques to enhance the accuracy of facial data, particularly when identifying contour lines around the eyes and mouth, as well as personal features as scars or dots. (or alternatively) can be In still other examples, three-dimensional facial recognition techniques may also be used to capture information about the shape of the face and the dimensions of the face. For example, three-dimensional facial recognition techniques may be useful for identifying distinctive features on the surface of the face, such as (but not limited to) eye sockets, nose and/or chin contours.
다양한 실시예에 따르면, 프로세서(310)는 그래픽 데이터(예: 도 2의 그래픽 데이터(220))를 생성할 수 있다. 프로세서(310)는 입력 데이터에 포함된 데이터 타입에 따라서 다른 그래픽 데이터를 생성할 수 있다. 데이터 타입은 음성 데이터 타입, 텍스트 데이터 타입, 이모티콘 데이터 타입 및 카메라 데이터 타입을 포함할 수 있다.According to various embodiments, the processor 310 may generate graphic data (eg, graphic data 220 of FIG. 2 ). The processor 310 may generate different graphic data according to the data type included in the input data. The data type may include a voice data type, a text data type, an emoticon data type, and a camera data type.
다양한 실시예에 따르면, 입력 데이터에 음성 데이터가 있는 경우 프로세서(310)는 음성 데이터에 기초한 그래픽 자막을 포함하는 그래픽 데이터를 생성할 수 있다. 프로세서(310)는 STT(Speech to Text) 기술을 이용하여 음성 데이터를 시각화할 수 있다. 예를 들어, 프로세서(310)는 음성 데이터와 동일한 내용의 자막을 입력하고 다양한 그래픽 효과를 추가하여 그래픽 데이터를 생성할 수 있다.According to various embodiments, when there is audio data in the input data, the processor 310 may generate graphic data including graphic captions based on the audio data. The processor 310 may visualize voice data using speech to text (STT) technology. For example, the processor 310 may generate graphic data by inputting a caption having the same content as the voice data and adding various graphic effects.
다양한 실시예에 따르면, 입력 데이터에 영상 데이터가 있는 경우 프로세서(310)는 영상 데이터에 포함된 모션에 기초하여 그래픽 데이터를 생성할 수 있다. 일 실시예에 따르면, 프로세서(310)는 모션 딥러닝 모듈을 이용하여 영상 데이터에 포함된 모션을 분석할 수 있다.According to various embodiments, when there is image data in the input data, the processor 310 may generate graphic data based on motion included in the image data. According to an embodiment, the processor 310 may analyze motion included in image data using a motion deep learning module.
다양한 실시예에 따르면, 입력 데이터에 사진 데이터가 있는 경우 프로세서(310)는 사진 데이터에 포함된 인물의 얼굴 표정에 기초하여 그래픽 데이터를 생성할 수 있다. 프로세서(310)는 표정 인식 기술을 활용하여 얼굴 표정에서 감정 정보를 결정할 수 있다.According to various embodiments, when there is photo data in the input data, the processor 310 may generate graphic data based on a facial expression of a person included in the photo data. The processor 310 may determine emotion information from facial expressions using facial expression recognition technology.
다양한 실시예에 따르면, 프로세서(310)는 생성한 라이브 메시지를 메모리(360)에 저장할 수 있다. 프로세서(310)는 메시지 어플리케이션을 실행하여 생성한 라이브 메시지를 바로 전송할 수도 있고, 메모리(360)에 저장한 적어도 하나의 라이브 메시지 중에서 하나를 선택하여 전송할 수도 있다. 일 실시예에 따르면, 프로세서(310)는 입력 데이터에 대응하는 정보가 메모리(360)에 저장되어 있는 경우, 이전에 생성한 그래픽 데이터에 기초하여 적어도 복수의 추천 그래픽 데이터를 생성할 수 있다. 프로세서(310)는 사용자 입력에 기초하여 복수의 추천 그래픽 데이터 중 하나를 선택할 수 있다. 일 실시예에 따르면, 프로세서(310)는 편집 메뉴를 제공하여, 사용자가 원하는 그래픽 효과를 추가한 라이브 메시지를 생성하도록 안내할 수 있다.According to various embodiments, the processor 310 may store the generated live message in the memory 360 . The processor 310 may directly transmit the live message generated by executing the message application, or may select and transmit one of at least one live message stored in the memory 360 . According to an embodiment, when information corresponding to the input data is stored in the memory 360, the processor 310 may generate at least a plurality of recommended graphic data based on previously generated graphic data. The processor 310 may select one of a plurality of recommended graphic data based on a user input. According to an embodiment, the processor 310 may provide an edit menu to guide the user to create a live message to which desired graphic effects are added.
다양한 실시예에 따르면, 프로세서(310)는 통신 모듈(350)을 이용하여 외부 장치(예: 스마트폰(smart phone), 태블릿(tablet), 스마트워치(smart watch))와 통신 연결을 수립할 수 있다. 프로세서(310)는 통신 연결을 수립한 외부 장치의 종류를 확인하고, 외부 장치로 전송할 라이브 메시지에 포함될 적어도 하나의 데이터 타입을 결정할 수 있다. 일 실시예에 따르면, 프로세서(310)는 외부 장치의 하드웨어 구성에 따라 라이브 메시지에 포함되는 데이터 타입을 결정할 수 있다. 예를 들어, 외부 장치에 디스플레이가 없는 경우 프로세서(310)가 생성한 라이브 메시지는 카메라 데이터, 텍스트 데이터 및 이모티콘 데이터를 포함하지 않을 수 있다.According to various embodiments, the processor 310 may establish a communication connection with an external device (eg, a smart phone, a tablet, or a smart watch) using the communication module 350. there is. The processor 310 may determine the type of external device that has established a communication connection and determine at least one data type to be included in a live message to be transmitted to the external device. According to an embodiment, the processor 310 may determine the data type included in the live message according to the hardware configuration of the external device. For example, if the external device does not have a display, the live message generated by the processor 310 may not include camera data, text data, and emoticon data.
도 4는 다양한 실시예에 따른 전자 장치가 영상 및 음성 데이터에 기초하여 라이브 메시지를 생성하는 것을 도시한 것이다.4 illustrates that an electronic device generates a live message based on video and audio data according to various embodiments.
다양한 실시예에 따르면, 프로세서(예: 도 3의 프로세서(310))는 메시지 어플리케이션의 실행 화면의 프리뷰 영역(410)에 카메라 프리뷰를 제공할 수 있다. 프로세서는 메시지 어플리케이션 내에 위치하는 카메라 버튼에 대한 사용자 입력에 기초하여 카메라(예: 도 3의 카메라(340)) 기능을 실행할 수 있다. 일 실시예에 따르면, 입력 데이터(예: 도 2의 입력 데이터(210))에 음성 데이터가 포함된 경우, 프로세서는 음성 데이터가 수신 중임을 지시하는 그래픽 객체(414)를 프리뷰 영역(410)에 더 표시할 수 있다. 프리뷰 영역(410)에는 영상 촬영 버튼(412)이 더 포함될 수 있으며, 프로세서는 촬영 버튼(412)에 대한 사용자 입력에 기초하여 영상 촬영을 시작 및 종료할 수 있다.According to various embodiments, a processor (eg, the processor 310 of FIG. 3 ) may provide a camera preview to the preview area 410 of the execution screen of the message application. The processor may execute a camera (eg, camera 340 of FIG. 3 ) function based on a user input to a camera button located in the message application. According to an embodiment, when voice data is included in the input data (eg, the input data 210 of FIG. 2 ), the processor displays a graphic object 414 indicating that voice data is being received in the preview area 410 . more can be displayed. An image capture button 412 may be further included in the preview area 410 , and the processor may start and end image capture based on a user input to the capture button 412 .
다양한 실시예에 따르면, 프로세서는 입력 데이터에 기초하여 그래픽 데이터(예: 도 2의 그래픽 데이터(220))를 생성할 수 있다. 예를 들어 도 4를 참조하면, 프로세서는 입력 데이터의 음성을 시각화하는 방식으로 그래픽 데이터를 생성할 수 있다. 입력 데이터의 음성이 "in the mood for food"인 경우, 프로세서는 음성과 동일한 내용의 그래픽 자막(420)을 포함하는 그래픽 데이터를 생성할 수 있다. 프로세서는 다양한 시각적 효과를 갖는 그래픽 자막(420)을 생성할 수 있다. 또는, 프로세서는 감정 딥러닝 모듈 및 모션 딥러닝 모듈을 이용하여 입력 데이터의 인물의 감정 정보를 결정하여 그래픽 데이터를 생성할 수도 있다. 프로세서는 생성한 그래픽 데이터를 입력 데이터와 합성하여 선택한 확장자(예: .jpg, .gif, .mp4)를 갖는 라이브 메시지(430)를 생성할 수 있다. 라이브 메시지(430)는 음성 및 영상을 포함할 수 있다. 프로세서는 생성한 라이브 메시지(430)를 메모리(예: 도 3의 메모리(360))에 저장할 수 있다.According to various embodiments, the processor may generate graphic data (eg, graphic data 220 of FIG. 2 ) based on input data. For example, referring to FIG. 4 , the processor may generate graphic data by visualizing audio of input data. When the voice of the input data is "in the mood for food", the processor may generate graphic data including a graphic caption 420 having the same content as the voice. The processor may generate graphic subtitles 420 having various visual effects. Alternatively, the processor may generate graphic data by determining emotion information of a person in input data using an emotion deep learning module and a motion deep learning module. The processor may generate a live message 430 having a selected extension (eg, .jpg, .gif, or .mp4) by synthesizing the generated graphic data with the input data. The live message 430 may include audio and video. The processor may store the generated live message 430 in a memory (eg, the memory 360 of FIG. 3 ).
다양한 실시예에 따르면, 프로세서는 생성한 라이브 메시지(430)를 메시지 어플리케이션을 통해서 외부 장치로 전송할 수 있다. 프로세서는 메모리에 저장된 적어도 하나의 라이브 메시지(430)를 사용자 입력에 기초하여 어플리케이션 실행 화면의 일 영역에 제공할 수 있다. 프로세서는 생성한 모든 라이브 메시지(430)를 메모리의 일 영역에 저장할 수 있다. 프로세서는 사용자 입력에 기초하여 메시지 어플리케이션을 통해 라이브 메시지(430)를 전송할 수 있다.According to various embodiments, the processor may transmit the generated live message 430 to an external device through a message application. The processor may provide at least one live message 430 stored in the memory to one area of the application execution screen based on a user input. The processor may store all generated live messages 430 in one area of memory. The processor may transmit the live message 430 through the message application based on user input.
도 5는 다양한 실시예에 따른 전자 장치가 영상 데이터에 기초하여 라이브 메시지를 생성하는 것을 도시한 것이다.5 illustrates generating a live message based on image data by an electronic device according to various embodiments.
다양한 실시예에 따르면, 입력 데이터(예: 도 2의 입력 데이터(210))에 영상 데이터(510)가 포함된 경우 프로세서(예: 도 3의 프로세서(310))는 영상 데이터(510)에 포함된 모션을 분석하여 그래픽 데이터(예: 도 2의 그래픽 데이터(220))를 생성할 수 있다. 프로세서는 모션 딥러닝 모듈을 이용하여 영상 데이터(510)에 포함된 모션을 분석할 수 있다. 모션 딥러닝 모듈은 영상 데이터(510)의 오브젝트의 움직임을 포착하여 다양한 모션을 미리 학습할 수 있다. 프로세서는 모션 딥러닝 모듈을 통해서 분석한 모션에 대응하는 그래픽 객체(520)를 생성할 수 있다. 예를 들어, 도 5를 참조하면, 프로세서는 촬영 버튼에 대한 사용자 입력에 기초하여 영상 데이터(510)를 수신할 수 있다. 이 때, 영상 속 인물이 키스를 하는 모션을 하면 모션 딥러닝 모듈은 해당 움직임을 감지할 수 있다. 프로세서는 영상 데이터(510) 속 모션에 적합한 하트 모양의 그래픽 객체(520)를 생성할 수 있다. 프로세서는 메시지 어플리케이션의 프리뷰 화면에서 적어도 하나의 그래픽 데이터를 생성하여 제공할 수 있으며, 사용자 입력에 기초하여 그 중 최적의 그래픽 데이터를 선택하여 라이브 메시지(530) (예: 도 4의 라이브 메시지(430))를 생성할 수 있다.According to various embodiments, when the image data 510 is included in the input data (eg, the input data 210 of FIG. 2 ), the processor (eg, the processor 310 of FIG. 3 ) is included in the image data 510 . Graphic data (eg, graphic data 220 of FIG. 2 ) may be generated by analyzing the generated motion. The processor may analyze motion included in the image data 510 using a motion deep learning module. The motion deep learning module may learn various motions in advance by capturing motions of objects in the image data 510 . The processor may create a graphic object 520 corresponding to the motion analyzed through the motion deep learning module. For example, referring to FIG. 5 , the processor may receive image data 510 based on a user input for a photographing button. At this time, if the person in the video makes a kissing motion, the motion deep learning module can detect the corresponding motion. The processor may create a heart-shaped graphic object 520 suitable for motion in the image data 510 . The processor may generate and provide at least one graphic data on the preview screen of the message application, select the optimal graphic data among them based on a user input, and display the live message 530 (eg, the live message 430 of FIG. 4 ). )) can be created.
다양한 실시예에 따르면, 프로세서는 사용자 입력에 기초하여 생성한 라이브 메시지(530)를 전송할 수 있다. 라이브 메시지(530)는 영상 데이터(510) 및 그래픽 데이터의 합성으로 구성될 수 있다. 프로세서는 영상 속 오브젝트의 움직임에 따라서 그래픽 데이터의 위치도 함께 변하도록 설정할 수 있다.According to various embodiments, the processor may transmit a live message 530 generated based on a user input. The live message 530 may be composed of a combination of image data 510 and graphic data. The processor may set the position of the graphic data to change along with the motion of the object in the image.
도 6은 다양한 실시예에 따른 전자 장치가 사진 데이터에 기초하여 라이브 메시지를 생성하는 것을 도시한 것이다.6 illustrates generating a live message based on photo data by an electronic device according to various embodiments of the present disclosure.
다양한 실시예에 따르면, 프로세서(예: 도 3의 프로세서(310))는 사진 데이터의 인물 표정에 기초하여 라이브 메시지(630) (예: 도 4의 라이브 메시지(430))를 생성할 수 있다. 일 실시예에 따르면, 프로세서는 감정 딥러닝 모듈을 이용하여 인물의 표정(610)을 분석해 감정 정보를 결정할 수 있다. 프로세서는 획득한 사진 데이터의 공간적인 특징에 대하여 CNN(convolutional neural network)을 학습함으로써 공간적인 학습 모델을 생성할 수 있다. 일 실시예에 따르면, 프로세서는 RNN(recurrent neural network), GRU(gated recurrent unit), LSTM(long short-term memory) 중 적어도 하나를 포함하는 재귀 신경망을 이용하여 표정(610)을 분석할 수 있다. 예를 들어 도 6을 참조하면, 프로세서는 사진 속 인물의 표정(610)을 분석하여 웃는 표정(610)을 인식하고, 기쁜 감정인 것으로 결정할 수 있다. 프로세서는 분석한 표정(610)에 대응하는 적어도 하나의 그래픽 객체(620) (예: 웃음 이모티콘)를 포함하는 그래픽 데이터(예: 도 2의 그래픽 데이터(220))를 생성할 수 있다. 일 실시예에 따르면, 프로세서가 생성한 그래픽 데이터는 입력 데이터(예: 도 2의 입력 데이터(210))와 일부 중첩되는 영역에 배치될 수 있다. 프로세서가 생성한 그래픽 데이터는 정해진 위치에 고정될 수도 있고, 시간의 흐름에 따라 위치가 변할 수도 있다.According to various embodiments, a processor (eg, processor 310 of FIG. 3 ) may generate a live message 630 (eg, live message 430 of FIG. 4 ) based on a facial expression of a person in photo data. According to an embodiment, the processor may determine emotion information by analyzing the expression 610 of the person using the deep emotion learning module. The processor may generate a spatial learning model by learning a convolutional neural network (CNN) with respect to spatial features of the acquired photo data. According to an embodiment, the processor may analyze the facial expression 610 using a recursive neural network including at least one of a recurrent neural network (RNN), a gated recurrent unit (GRU), and long short-term memory (LSTM). . For example, referring to FIG. 6 , the processor may analyze a facial expression 610 of a person in a photo to recognize a smiling expression 610 and determine that the facial expression 610 is a happy emotion. The processor may generate graphic data (eg, graphic data 220 of FIG. 2 ) including at least one graphic object 620 (eg, a laughing emoticon) corresponding to the analyzed facial expression 610 . According to an embodiment, graphic data generated by a processor may be disposed in an area partially overlapping input data (eg, input data 210 of FIG. 2 ). The graphic data generated by the processor may be fixed at a fixed location or the location may change over time.
다양한 실시예에 따르면, 프로세서는 생성한 그래픽 데이터 및 입력 데이터를 합성하여 라이브 메시지(630)를 생성하고, 사용자 입력에 기초하여 메시지 어플리케이션을 통해 전송할 수 있다.According to various embodiments, the processor may generate a live message 630 by synthesizing the generated graphic data and input data, and transmit the live message 630 through a message application based on a user input.
도 7a 및 도 7b는 다양한 실시예에 따른 전자 장치에서 실시간 메시지를 생성하기 위해서 제공되는 그래픽 UI를 도시한 것이다.7A and 7B illustrate a graphic UI provided to generate a real-time message in an electronic device according to various embodiments.
다양한 실시예에 따르면, 프로세서(예: 도 3의 프로세서(310))는 메시지 어플리케이션에 라이브 메시지(예: 도 4의 라이브 메시지(430))를 생성하기 위한 그래픽 UI를 제공할 수 있다. 도 7a를 참조하면, 프로세서는 메시지 입력 창의 일 측에 라이브 메시지 생성 버튼(710)을 제공할 수 있다. 프로세서는 라이브 메시지 생성 버튼(710)에 대한 사용자 입력에 기초하여 프리뷰 영역(760) 및 라이브 메시지를 생성하기 위한 다양한 메뉴들을 제공할 수 있다. 프로세서는 라이브 메시지를 생성하기 위한 기능을 제공하는 적어도 하나의 버튼이 포함된 메뉴 표시줄을 표시할 수 있다. 메뉴 표시줄에는 카메라 버튼(720)이 포함될 수 있으며, 프로세서는 카메라 버튼(720)에 대한 사용자 입력에 기초하여 메시지 어플리케이션 실행 화면의 일 측에 카메라 프리뷰를 표시할 수 있다. 프로세서는 메뉴 표시줄에 이모티콘 생성을 위한 메뉴, 영상 생성을 위한 메뉴 및 음성 데이터를 수신하기 위한 메뉴 중 적어도 하나를 더 포함할 수 있다. 프리뷰 영역(760)에는 카메라 촬영을 시작하기 위한 적어도 하나의 버튼이 포함될 수 있다. 프로세서는 촬영 버튼에 대한 사용자 입력에 기초하여 입력 데이터(예: 도 2의 입력 데이터(210))를 수신할 수 있다.According to various embodiments, a processor (eg, processor 310 of FIG. 3 ) may provide a graphic UI for generating a live message (eg, live message 430 of FIG. 4 ) to a message application. Referring to FIG. 7A , the processor may provide a live message creation button 710 on one side of the message input window. The processor may provide a preview area 760 and various menus for generating a live message based on a user input to the live message creation button 710 . The processor may display a menu bar including at least one button providing functionality for creating a live message. The menu bar may include a camera button 720, and the processor may display a camera preview on one side of the message application execution screen based on a user input to the camera button 720. The processor may further include at least one of a menu for generating an emoticon, a menu for generating an image, and a menu for receiving voice data in the menu bar. The preview area 760 may include at least one button for starting camera capture. The processor may receive input data (eg, input data 210 of FIG. 2 ) based on a user input for a photographing button.
다양한 실시예에 따르면, 프로세서는 프리뷰 영역(760)에 전체 화면 버튼(740) 및 화면 축소 버튼(750)을 더 제공할 수 있다. 프로세서는 전체 화면 버튼(740) 및 화면 축소 버튼(750)에 대한 사용자 입력에 기초하여 프리뷰 영역(760)의 크기를 조절할 수 있다. 예를 들어, 사용자가 전체 화면 버튼(740)을 터치하면 프리뷰 영역(760)이 디스플레이(예: 도 3의 디스플레이(320))의 전체로 확장될 수 있다. 반대로, 전체 화면 상태에서 사용자가 화면 축소 버튼(750)을 터치하면 프리뷰 영역(760)이 다시 메시지 어플리케이션 실행 화면의 일부로 축소될 수 있다.According to various embodiments, the processor may further provide a full screen button 740 and a screen reduction button 750 in the preview area 760 . The processor may adjust the size of the preview area 760 based on user inputs to the full screen button 740 and the screen reduction button 750 . For example, when the user touches the full screen button 740, the preview area 760 may be expanded to the entire display (eg, the display 320 of FIG. 3). Conversely, if the user touches the screen reduction button 750 in the full screen state, the preview area 760 may be reduced to a part of the message application execution screen again.
다양한 실시예에 따르면, 프로세서는 생성할 그래픽 데이터(예: 도 2의 그래픽 데이터(220))를 편집할 수 있는 기능을 제공하는 편집 메뉴(770)를 제공할 수 있다. 프로세서는 프리뷰 영역(760)의 일 측에 편집 메뉴(770)의 축소 아이콘(730)을 표시하고, 축소 아이콘(730)에 대한 사용자 입력에 기초하여 편집 메뉴(770)를 디스플레이에 표시할 수 있다. 도 7b를 참조하면, 편집 메뉴(770)는 글꼴/사이즈 조절 메뉴(772), 말풍선 메뉴(774), 음악 메뉴(776) 및 효과 메뉴(778) 중 적어도 하나를 포함할 수 있다. According to various embodiments, the processor may provide an edit menu 770 providing a function for editing graphic data to be generated (eg, graphic data 220 of FIG. 2 ). The processor may display a collapse icon 730 of the edit menu 770 on one side of the preview area 760, and display the edit menu 770 on the display based on a user input for the collapse icon 730. . Referring to FIG. 7B , an edit menu 770 may include at least one of a font/size adjustment menu 772, a speech bubble menu 774, a music menu 776, and an effect menu 778.
다양한 실시예에 따르면, 프로세서가 생성한 그래픽 객체의 크기 또는 그래픽 자막의 글꼴을 변경하는 기능을 제공할 수 있다. 프로세서는 편집 메뉴(770) 중에서 글꼴/사이즈 조절 메뉴(772)에 대한 사용자 입력에 기초하여 그래픽 객체를 편집할 수 있다. 예를 들어, 프로세서가 'good morning'과 같은 그래픽 자막을 포함하는 그래픽 데이터를 생성한 경우, 사용자는 글꼴/사이즈 조절 메뉴(772)를 이용하여 그래픽 자막의 크기 및 글꼴을 변경할 수 있다.According to various embodiments, a function of changing a size of a graphic object created by a processor or a font of graphic subtitles may be provided. The processor may edit the graphic object based on a user input to the font/size adjustment menu 772 of the edit menu 770 . For example, when the processor generates graphic data including a graphic caption such as 'good morning', the user can change the size and font of the graphic caption using the font/size adjustment menu 772 .
다양한 실시예에 따르면, 프로세서는 말풍선 메뉴(774)에 대한 사용자 입력에 기초하여 다양한 형태를 가진 그래픽 자막을 생성할 수 있다. 예를 들어, 프로세서는 획득한 음성 데이터에 기초하여 그래픽 자막을 생성하고, 말풍선 메뉴(774)에 대한 사용자 입력에 기초하여 생성한 그래픽 자막을 입력 데이터와 합성하여 라이브 메시지를 생성할 수 있다. 일 실시예에 따르면, 프로세서는 그래픽 자막 및 그래픽 자막이 표시되는 말풍선을 함께 생성할 수 있으며, 다양한 형태(예: 원, 사각형, 구름 모양)의 말풍선을 제공할 수 있다.According to various embodiments, the processor may generate graphic captions having various forms based on a user input to the speech bubble menu 774 . For example, the processor may generate a graphic caption based on acquired voice data, and may generate a live message by combining the graphic caption generated based on a user input to the speech bubble menu 774 with the input data. According to an embodiment, the processor may generate a graphic caption and a speech bubble displaying the graphic caption together, and may provide speech bubbles of various shapes (eg, circle, rectangle, cloud shape).
다양한 실시예에 따르면, 프로세서는 음악 메뉴(776)에 대한 사용자 입력에 기초하여 라이브 메시지의 배경 음악을 결정할 수 있다. 프로세서는 샘플 음악의 적어도 일부를 메모리(예: 도 3의 메모리(360))에 저장할 수 있다. 일 실시예에 따르면, 프로세서는 써드 파티 음악 어플리케이션(Third Party Music Application)과 연동하여 배경 음악을 결정할 수 있다. 일 실시예에 따르면, 프로세서는 사용자 입력에 기초하여 배경 음악의 음량을 조절할 수 있고, 입력 데이터에 음성 데이터가 포함된 경우에는 배경 음악의 음량을 작게 결정할 수 있다.According to various embodiments, the processor may determine background music for the live message based on user input to the music menu 776 . The processor may store at least a portion of the sample music in a memory (eg, the memory 360 of FIG. 3 ). According to an embodiment, the processor may determine background music in conjunction with a third party music application. According to an embodiment, the processor may adjust the volume of the background music based on a user input, and may determine a low volume of the background music when voice data is included in the input data.
다양한 실시예에 따르면, 프로세서는 효과 메뉴(778)에 대한 사용자 입력에 기초하여 그래픽 데이터에 다양한 그래픽 효과(visual effects, VFXt)를 추가할 수 있다. 프로세서가 제공할 수 있는 그래픽 효과는 모션 그래픽(motion graphic), 리터치(retouch), 합성(compositing), 애니메이션(animation), 라이팅(lighting), 및 FX(effects) 중 적어도 하나를 포함할 수 있다. 예를 들어, 프로세서는 영상 데이터의 모션을 분석하여 이에 대응하는 이모티콘을 생성하여 합성할 수 있다.According to various embodiments, the processor may add various visual effects (VFXt) to graphic data based on a user input to the effects menu 778 . Graphic effects that can be provided by the processor may include at least one of motion graphics, retouching, compositing, animation, lighting, and FX (effects). For example, the processor may analyze the motion of the image data and generate and synthesize an emoticon corresponding thereto.
다양한 실시예에 따르면, 프로세서는 편집 메뉴(770)에 메뉴 최소화 버튼(779)을 더 포함할 수 있다. 프로세서는 메뉴 최소화 버튼(779)에 대한 사용자 입력에 기초하여 편집 메뉴(770)를 숨김 처리할 수 있다.According to various embodiments, the processor may further include a menu minimization button 779 in the edit menu 770 . The processor may hide the edit menu 770 based on a user input to the menu minimization button 779 .
도 8은 다양한 실시예에 따른 외부 장치의 종류에 따른 데이터 타입을 도시한 것이다.8 illustrates data types according to types of external devices according to various embodiments.
다양한 실시예에 따르면, 프로세서(예: 도 3의 프로세서(310))는 적어도 하나의 데이터 타입을 포함하는 라이브 메시지(예: 도 4의 라이브 메시지(430))를 생성할 수 있다. 프로세서는 전자 장치(800)가 수신한 입력 데이터(810) (예: 도 2의 입력 데이터(210))를 적어도 하나의 데이터 타입으로 구분하여 저장할 수 있다. 프로세서는 통신 모듈(예: 도 3의 통신 모듈(350))을 이용하여 외부 장치(820)와 통신 연결을 수립하고, 외부 장치(820)의 종류에 따라서 라이브 메시지에 포함될 데이터 타입을 결정할 수 있다.According to various embodiments, a processor (eg, the processor 310 of FIG. 3 ) may generate a live message (eg, the live message 430 of FIG. 4 ) including at least one data type. The processor may classify the input data 810 (eg, the input data 210 of FIG. 2 ) received by the electronic device 800 into at least one data type and store the same. The processor may establish a communication connection with the external device 820 using a communication module (eg, the communication module 350 of FIG. 3 ) and determine the data type to be included in the live message according to the type of the external device 820. .
다양한 실시예에 따르면, 프로세서는 외부 장치(820)에 포함된 하드웨어 구성에 따라서 전송할 데이터 타입을 결정할 수 있다. 예를 들어, 디스플레이 및 오디오 인터페이스가 있는 제1외부 장치(820a)에 전송할 제1라이브 메시지(810a)는 음성 데이터, 텍스트 데이터, 이모티콘 데이터 및 카메라 데이터를 포함할 수 있다. 오디오 인터페이스만 있는 제2외부 장치(820b)에 전송할 제2라이브 메시지(810b)는 오디오 데이터만 포함할 수 있다. 디스플레이만 있는 제3외부 장치(820c)에 전송할 제3라이브 메시지(810c)는 텍스트 데이터, 이모티콘 데이터 및 카메라 데이터를 포함할 수 있다. 프로세서가 통신 연결된 외부 장치(820)의 하드웨어 구성에 따라서 데이터를 구성하는 방법은 도 8에 도시한 데이터의 예시에 제한되지 않는다.According to various embodiments, the processor may determine the data type to be transmitted according to the hardware configuration included in the external device 820 . For example, the first live message 810a to be transmitted to the first external device 820a having a display and audio interface may include voice data, text data, emoticon data, and camera data. The second live message 810b to be transmitted to the second external device 820b having only an audio interface may include only audio data. The third live message 810c to be transmitted to the third external device 820c having only a display may include text data, emoticon data, and camera data. A method of constructing data according to the hardware configuration of the external device 820 to which the processor is communicatively connected is not limited to the example of data shown in FIG. 8 .
도 9는 다양한 실시예에 따른 전자 장치에서 음성 데이터에 기초한 실시간 메시지를 생성하는 것을 도시한 것이다.9 illustrates generating a real-time message based on voice data in an electronic device according to various embodiments.
다양한 실시예에 따르면, 프로세서(예: 도 3의 프로세서(310))는 전자 장치(930)와 통신 연결된 사용자 디바이스(900)에서 수신한 입력 데이터(910) (예: 도 2의 입력 데이터(210))에 기초하여 라이브 메시지(940) (예: 도 4의 라이브 메시지(430))를 생성할 수 있다. 사용자 디바이스(900)는 통신 연결을 이용하여 전자 장치(930)로 수신한 입력 데이터(910)를 전송할 수 있다. 프로세서는 수신한 입력 데이터(910)에 기초하여 음성 데이터 타입, 텍스트 데이터 타입, 이모티콘 데이터 타입 및 카메라 데이터 타입 중 적어도 하나의 데이터 타입(920)을 포함하는 라이브 메시지(940)를 생성할 수 있다. 프로세서는 생성한 라이브 메시지(940)를 외부 장치(예: 도 8의 외부 장치(820))로 전송할 수 있다. 프로세서는 사용자 디바이스(900)에서 수신된 입력 데이터(910)에 기초하여 라이브 메시지(940)를 생성하므로, 라이브 메시지(940)에 포함되는 데이터 타입(920)은 사용자 디바이스(900)에 포함되는 하드웨어 구성에 따라 결정될 수 있다.According to various embodiments, a processor (eg, the processor 310 of FIG. 3 ) receives input data 910 (eg, the input data 210 of FIG. 2 ) received from a user device 900 communicatively connected to the electronic device 930 . )), a live message 940 (eg, the live message 430 of FIG. 4) may be generated. The user device 900 may transmit the received input data 910 to the electronic device 930 using a communication connection. The processor may generate a live message 940 including at least one data type 920 of a voice data type, a text data type, an emoticon data type, and a camera data type based on the received input data 910 . The processor may transmit the generated live message 940 to an external device (eg, the external device 820 of FIG. 8 ). Since the processor generates the live message 940 based on the input data 910 received from the user device 900, the data type 920 included in the live message 940 is hardware included in the user device 900. It can be determined according to the configuration.
예를 들어, 도 9를 참조하면, 프로세서는 오디오 인터페이스를 탑재한 사용자 디바이스(900)로부터 음성 데이터(910)를 수신할 수 있다. 프로세서는 수신한 음성 데이터(910)에 기초하여 텍스트 데이터 및 이모티콘 데이터를 포함하는 그래픽 데이터를 생성할 수 있다. 프로세서가 생성하는 텍스트 데이터는 음성 데이터(910)를 그래픽 자막으로 표현한 데이터일 수 있으며, 이모티콘 데이터는 수신한 음성 데이터(910)에 기초하여 분석한 상황에 대응하는 데이터일 수 있다. 프로세서는 생성한 그래픽 데이터와 입력 데이터를 합성하여 라이브 메시지를 생성할 수 있다. 프로세서는 음성 데이터, 텍스트 데이터, 이모티콘 데이터 및 카메라 데이터 중 적어도 하나의 데이터(920)를 포함하는 라이브 메시지(940)를 생성할 수 있다. 이 때 전자 장치(930)의 카메라(예: 도 3의 카메라(340))로부터 받은 입력 데이터(910)가 없으므로, 생성한 라이브 메시지(940)는 카메라 데이터를 포함하지 않을 수 있다. 프로세서는 메시지 어플리케이션을 통하여 라이브 메시지(940)를 전송할 수 있다. For example, referring to FIG. 9 , the processor may receive voice data 910 from a user device 900 equipped with an audio interface. The processor may generate graphic data including text data and emoticon data based on the received voice data 910 . Text data generated by the processor may be data expressing voice data 910 as graphic captions, and emoticon data may be data corresponding to a situation analyzed based on the received voice data 910 . The processor may generate a live message by synthesizing the generated graphic data and input data. The processor may generate a live message 940 including data 920 of at least one of voice data, text data, emoticon data, and camera data. At this time, since there is no input data 910 received from the camera of the electronic device 930 (eg, the camera 340 of FIG. 3 ), the generated live message 940 may not include camera data. The processor may transmit the live message 940 through the message application.
다양한 실시예에 따른 전자 장치는, 디스플레이, 마이크, 카메라, 메모리 및 상기 디스플레이, 상기 마이크, 상기 카메라 및 상기 메모리와 작동적으로(operatively) 연결된 프로세서를 포함하고, 상기 프로세서는, 메시지 어플리케이션을 실행하고, 상기 메시지 어플리케이션 실행 화면에서 제공되는 메뉴에 대한 사용자 입력에 기초하여, 상기 마이크 및 상기 카메라 중 적어도 하나로 수신된 입력 데이터를 획득하고, 상기 입력 데이터에 포함된 인물의 감정 상태를 분석하고, 상기 분석한 감정 상태에 기초하여, 적어도 하나의 그래픽 객체를 포함하는 그래픽 데이터를 생성하고, 상기 입력 데이터 및 상기 그래픽 데이터에 기초하여 라이브 메시지를 생성하도록 설정된 전자 장치.An electronic device according to various embodiments includes a display, a microphone, a camera, a memory, and a processor operatively connected to the display, the microphone, the camera, and the memory, wherein the processor executes a message application and , Based on a user input for a menu provided on the message application execution screen, input data received by at least one of the microphone and the camera is acquired, an emotional state of a person included in the input data is analyzed, and the analysis An electronic device configured to generate graphic data including at least one graphic object based on one emotional state, and generate a live message based on the input data and the graphic data.
다양한 실시예에 따르면, 상기 전자 장치는 통신 모듈을 더 포함하고, 상기 프로세서는, 상기 통신 모듈을 이용하여 외부 장치와 통신 연결을 수립하고, 상기 외부 장치의 종류에 기초하여 라이브 메시지에 포함되는 적어도 하나의 데이터 타입(Data type)을 결정하고, 결정한 적어도 하나의 데이터 타입을 포함하는 라이브 메시지를 생성하여 상기 외부 장치로 전송하도록 설정된 전자 장치.According to various embodiments, the electronic device further includes a communication module, and the processor establishes a communication connection with an external device using the communication module, and includes at least one message included in a live message based on the type of the external device. An electronic device configured to determine one data type, generate a live message including the determined at least one data type, and transmit the live message to the external device.
다양한 실시예에 따르면, 상기 외부 장치가 디스플레이를 포함하는 경우, 카메라 데이터, 텍스트 데이터 및 이모티콘 데이터 중 적어도 하나를 포함하는 라이브 메시지를 생성하도록 설정된 전자 장치.According to various embodiments, when the external device includes a display, an electronic device configured to generate a live message including at least one of camera data, text data, and emoticon data.
다양한 실시예에 따르면, 상기 외부 장치가 오디오 인터페이스를 포함하는 경우, 음성 데이터 타입을 포함하는 라이브 메시지를 생성하도록 설정된 전자 장치.According to various embodiments, an electronic device configured to generate a live message including a voice data type when the external device includes an audio interface.
다양한 실시예에 따르면, 상기 프로세서는, 이모티콘, 텍스트 및 그래픽 효과 중 적어도 하나를 포함하는 그래픽 데이터를 생성하도록 설정된 전자 장치.According to various embodiments, the processor is configured to generate graphic data including at least one of an emoticon, text, and graphic effect.
다양한 실시예에 따르면, 상기 프로세서는, 상기 라이브 메시지를 상기 메모리에 저장하고, 사용자 입력에 기초하여 상기 라이브 메시지를 메시지 어플리케이션을 통해 전송하도록 설정된 전자 장치.According to various embodiments, the processor is configured to store the live message in the memory and transmit the live message through a message application based on a user input.
다양한 실시예에 따르면, 상기 프로세서는, 상기 입력 데이터에 음성이 포함된 경우, STT(Speech To Text)기반 그래픽 자막 및 음성 컨택스트(context)에 기초한 그래픽 데이터를 생성하도록 설정된 전자 장치.According to various embodiments, the electronic device configured to generate graphic data based on STT (Speech To Text) based graphic subtitles and voice context when the input data includes voice.
다양한 실시예에 따르면, 상기 프로세서는, 상기 입력 데이터에 영상이 포함된 경우, 상기 영상에 포함된 모션에 기초하여 그래픽 데이터를 생성하도록 설정된 전자 장치.According to various embodiments of the present disclosure, the electronic device configured to generate graphic data based on motion included in the image, when the input data includes an image.
다양한 실시예에 따르면, 상기 프로세서는, 적어도 하나의 그래픽 데이터를 생성하고, 사용자 입력에 기초하여 상기 적어도 하나의 그래픽 데이터 중 하나를 선택하도록 설정된 전자 장치.According to various embodiments, the processor is configured to generate at least one graphic data and select one of the at least one graphic data based on a user input.
다양한 실시예에 따르면, 상기 프로세서는, 상기 모션에 대응하는 라이브 메시지가 기 생성되어 상기 메모리에 저장되어 있는 경우, 기 생성된 라이브 메시지에 기초하여 그래픽 데이터를 생성하도록 설정된 전자 장치.According to various embodiments of the present disclosure, the electronic device configured to generate graphic data based on a pre-generated live message when a live message corresponding to the motion is pre-generated and stored in the memory.
다양한 실시예에 따르면, 상기 프로세서는, 상기 입력 데이터의 사진에 포함되는 인물의 표정, 인물의 위치 및 주변 오브젝트 중 적어도 하나를 분석하고, 이에 대응하는 그래픽 데이터를 생성하도록 설정된 전자 장치.According to various embodiments, the processor is configured to analyze at least one of a facial expression of a person included in a picture of the input data, a position of the person, and a surrounding object, and generate graphic data corresponding thereto.
다양한 실시예에 따르면, 상기 프로세서는, 상기 입력 데이터에 웃고 있는 인물이 포함된 경우, 상기 인물의 음성, 모션 및 얼굴 표정 중 적어도 하나를 인식하여 감정 상태를 결정하고, 결정한 감정 상태에 기초하여 웃음 이모티콘을 적어도 포함하는 그래픽 데이터를 생성하고, 상기 입력 데이터와 상기 그래픽 데이터를 합성하여 라이브 메시지를 생성하도록 설정된 전자 장치.According to various embodiments, when the input data includes a smiling person, the processor determines an emotional state by recognizing at least one of voice, motion, and facial expression of the person, and laughs based on the determined emotional state. An electronic device configured to generate graphic data including at least an emoticon, and to generate a live message by synthesizing the input data and the graphic data.
도 10은 다양한 실시예에 따른 전자 장치의 실시간 메시지 생성 방법의 순서도이다.10 is a flowchart of a method of generating a message in real time by an electronic device according to various embodiments.
도 10에 도시된 방법은 도 1 내지 도 9를 통해 설명한 전자 장치(예: 도 1의 전자 장치(101))에 의해 수행될 수 있으며, 이하에서는 앞서 설명한 바 있는 기술적 특징에 대해서는 그 설명을 생략하기로 한다.The method shown in FIG. 10 may be performed by the electronic device (e.g., the electronic device 101 of FIG. 1) described with reference to FIGS. 1 to 9, and descriptions of the technical features described above are omitted below. I'm going to do it.
다양한 실시예에 따르면, 동작 1002에서, 전자 장치는 메시지 어플리케이션을 실행할 수 있다. 전자 장치는 메시지 어플리케이션을 통해 통신 연결된 외부 장치(예: 도 8의 외부 장치(820))와 메시지를 주고받을 수 있다. According to various embodiments, in operation 1002, the electronic device may execute a message application. An electronic device may exchange messages with an external device (eg, the external device 820 of FIG. 8 ) connected through communication through a message application.
다양한 실시예에 따르면, 동작 1004에서, 전자 장치는 카메라(예: 도 3의 카메라(340)) 또는 마이크(예: 도 3의 마이크(330))로부터 입력 데이터(예: 도 2의 입력 데이터(210))를 수신할 수 있다. 일 실시예에 따르면, 전자 장치는 전자 장치와 근거리 통신 연결된 사용자 디바이스를 통해서 수신된 입력 데이터를 획득할 수도 있다. 입력 데이터는 음성, 영상 및 사진 중 적어도 하나를 포함할 수 있다.According to various embodiments, in operation 1004, the electronic device receives input data (eg, input data of FIG. 2 (eg, the camera 340 of FIG. 3) or a microphone (eg, the microphone 330 of FIG. 3). 210)) can be received. According to an embodiment, the electronic device may obtain input data received through a user device connected to the electronic device through short-range communication. The input data may include at least one of audio, video and pictures.
다양한 실시예에 따르면, 전자 장치는 입력 데이터를 감정 딥러닝 모듈(emotion deep learning module) 및 모션 딥러닝 모듈(motion deep learning module)을 이용하여 분석할 수 있다. 감정 딥러닝 모듈은 입력 데이터에 등장하는 인물의 목소리, 표정, 음성 데이터를 분석하여 인물의 감정 정보를 결정할 수 있다. 전자 장치는 감정 딥러닝 모듈을 제어하여 적어도 하나의 감정 정보(예: 기쁨, 슬픔, 흥분, 화남, 무서움, 부드러움)를 결정할 수 있다. 모션 딥러닝 모듈은 입력 데이터에 등장하는 인물의 모션을 분석하여 감정 정보를 결정할 수 있다.According to various embodiments, the electronic device may analyze input data using an emotion deep learning module and a motion deep learning module. The emotion deep learning module can determine the character's emotion information by analyzing the voice, facial expression, and voice data of the character appearing in the input data. The electronic device may determine at least one emotion information (eg, joy, sadness, excitement, anger, fear, tenderness) by controlling the emotion deep learning module. The motion deep learning module can determine emotion information by analyzing motions of characters appearing in input data.
다양한 실시예에 따르면, 동작 1006에서, 전자 장치는 입력 데이터에 기초하여 라이브 메시지(예: 도 4의 라이브 메시지(430))를 생성하고 메모리(예: 도 3의 메모리(360))에 저장할 수 있다. 전자 장치는 입력 데이터에 포함된 데이터의 종류에 따라서 다른 그래픽 데이터(예: 도 2의 그래픽 데이터(220))를 생성할 수 있다. 데이터 타입은 음성 데이터, 텍스트 데이터, 이모티콘 데이터 및 카메라 데이터를 포함할 수 있다.According to various embodiments, in operation 1006, the electronic device may generate a live message (eg, the live message 430 of FIG. 4 ) based on the input data and store it in a memory (eg, the memory 360 of FIG. 3 ). there is. The electronic device may generate different graphic data (eg, graphic data 220 of FIG. 2 ) according to the type of data included in the input data. The data type may include voice data, text data, emoticon data, and camera data.
다양한 실시예에 따르면, 입력 데이터에 음성 데이터가 있는 경우 전자 장치는 음성 데이터에 기초한 그래픽 자막을 포함하는 그래픽 데이터를 생성할 수 있다. 전자 장치는 STT(Speech to Text) 기술을 이용하여 음성 데이터를 시각화할 수 있다. 전자 장치는 음성 데이터와 동일한 내용의 자막을 입력하고 다양한 그래픽 효과를 추가하여 그래픽 데이터를 생성할 수 있다.According to various embodiments, when there is audio data in the input data, the electronic device may generate graphic data including a graphic caption based on the audio data. The electronic device may visualize voice data using speech to text (STT) technology. The electronic device may generate graphic data by inputting a caption having the same content as the audio data and adding various graphic effects.
다양한 실시예에 따르면, 입력 데이터에 영상 데이터가 있는 경우 전자 장치는 영상 데이터에 포함된 모션에 기초하여 그래픽 데이터를 생성할 수 있다. 일 실시예에 따르면, 전자 장치는 모션 딥러닝 모듈을 이용하여 영상 데이터에 포함된 모션을 분석할 수 있다. 전자 장치는 분석한 모션에 대응하는 텍스트 또는 이모티콘을 생성할 수 있다.According to various embodiments, when there is image data in the input data, the electronic device may generate graphic data based on motion included in the image data. According to an embodiment, the electronic device may analyze motion included in image data using a motion deep learning module. The electronic device may generate text or emoticon corresponding to the analyzed motion.
다양한 실시예에 따르면, 입력 데이터에 사진 데이터가 있는 경우 전자 장치는 사진 데이터에 포함된 인물의 얼굴 표정에 기초하여 그래픽 데이터를 생성할 수 있다. 전자 장치는 표정 인식 기술을 활용하여 얼굴 표정에서 감정 정보를 결정할 수 있다.According to various embodiments, when there is photo data in the input data, the electronic device may generate graphic data based on a facial expression of a person included in the photo data. An electronic device may determine emotion information from a facial expression using facial expression recognition technology.
다양한 실시예에 따르면, 전자 장치는 생성한 라이브 메시지를 메모리에 저장할 수 있다. 전자 장치는 메시지 어플리케이션을 실행하여 생성한 라이브 메시지를 바로 전송할 수도 있고, 메모리에 저장한 적어도 하나의 라이브 메시지 중에서 하나를 선택하여 전송할 수도 있다. 일 실시예에 따르면, 전자 장치는 입력 데이터에 대응하는 정보가 메모리에 저장되어 있는 경우, 이전에 생성한 그래픽 데이터에 기초하여 적어도 복수의 추천 그래픽 데이터를 생성할 수 있다. 전자 장치는 사용자 입력에 기초하여 복수의 추천 그래픽 데이터 중 하나를 선택할 수 있다. 일 실시예에 따르면, 전자 장치는 편집 메뉴를 제공하여, 사용자가 원하는 그래픽 효과를 추가한 라이브 메시지를 생성하도록 안내할 수 있다.According to various embodiments, the electronic device may store the created live message in memory. The electronic device may directly transmit a live message created by executing a message application, or select and transmit one of at least one live message stored in a memory. According to an embodiment, when information corresponding to input data is stored in a memory, the electronic device may generate at least a plurality of recommended graphic data based on previously generated graphic data. The electronic device may select one of a plurality of recommended graphic data based on a user input. According to an embodiment, the electronic device may provide an edit menu to guide the user to create a live message to which desired graphic effects are added.
다양한 실시예에 따르면, 동작 1010에서, 전자 장치는 사용자 입력에 기초하여 라이브 메시지를 전송할 수 있다. 전자 장치는 통신 모듈(예: 도 3의 통신 모듈(350))을 이용하여 외부 장치와 통신 연결을 수립하고, 메시지 어플리케이션을 통해서 라이브 메시지를 전송할 수 있다.According to various embodiments, in operation 1010, the electronic device may transmit a live message based on a user input. The electronic device may establish a communication connection with an external device using a communication module (eg, the communication module 350 of FIG. 3 ) and transmit a live message through a message application.
다양한 실시예에 따르면, 동작 1012에서, 전자 장치는 라이브 메시지를 수신할 외부 장치를 확인하고, 동작 1014에서, 전자 장치는 외부 장치에 따라 라이브 메시지에 포함될 데이터 타입을 결정할 수 있다. 일 실시예에 따르면, 전자 장치는 외부 장치의 하드웨어 구성에 따라 라이브 메시지에 포함되는 데이터 타입을 결정할 수 있다. 외부 장치에 디스플레이가 있는 경우 전자 장치가 생성한 라이브 메시지는 카메라 데이터, 텍스트 데이터 및 이모티콘 데이터를 포함할 수 있다. 외부 장치에 오디오 인터페이스가 있는 경우 전자 장치가 생성한 라이브 메시지는 음성 데이터를 포함할 수 있다.According to various embodiments, in operation 1012, the electronic device identifies an external device to receive the live message, and in operation 1014, the electronic device determines a data type to be included in the live message according to the external device. According to an embodiment, the electronic device may determine the type of data included in the live message according to the hardware configuration of the external device. If the external device has a display, the live message generated by the electronic device may include camera data, text data, and emoticon data. If the external device has an audio interface, the live message generated by the electronic device may include voice data.
도 11은 다양한 실시예에 따른 전자 장치가 라이브 데이터를 생성하는 방법의 순서도이다.11 is a flowchart of a method of generating live data by an electronic device according to various embodiments.
다양한 실시예에 따르면, 동작 1102에서, 전자 장치는 입력 데이터를 수신하고, 입력 데이터에 음성 데이터가 포함되어 있는지 동작 1110에서 확인할 수 있다. 입력 데이터에 음성 데이터가 포함되어 있는 경우, 동작 1112에서, 전자 장치는 음성 데이터에 기초하여 그래픽 자막을 생성할 수 있다. 그래픽 자막은 음성 데이터의 내용을 기초로 하여, 그래픽 효과를 추가한 형태일 수 있다.According to various embodiments, in operation 1102, the electronic device may receive input data and check whether voice data is included in the input data in operation 1110. If audio data is included in the input data, in operation 1112, the electronic device may generate a graphic caption based on the audio data. The graphic caption may have a form in which graphic effects are added based on the content of audio data.
다양한 실시예에 따르면, 전자 장치는 적어도 하나의 단어 및 해당 단어에 대응하는 적어도 하나의 그래픽 요소를 맵핑하여 메모리에 저장할 수 있다. 전자 장치는 동작 1114에서, 입력 데이터에 사전에 정의한 단어가 포함되어 있으면 그에 대응하는 그래픽 요소를 생성할 수 있다.다양한 실시예에 따르면, 동작 1120에서, 전자 장치는 입력 데이터에 영상 데이터가 포함되어 있는지 확인할 수 있다. 입력 데이터에 영상 데이터가 포함되어 있는 경우, 동작 1122에서, 전자 장치는 영상 데이터에 포함된 모션에 기초하여 영상 데이터에 등장하는 인물의 감정을 분석할 수 있다. 일 실시예에 따르면, 전자 장치는 모션 딥러닝 모듈을 이용하여 다양한 모션을 학습하고, 이에 기초하여 인물의 감정을 분석할 수 있다.According to various embodiments, the electronic device may map and store at least one word and at least one graphic element corresponding to the corresponding word in a memory. In operation 1114, if the input data includes a word defined in advance, the electronic device may generate a graphic element corresponding thereto. According to various embodiments, in operation 1120, the electronic device includes image data in the input data can check if there is. When video data is included in the input data, in operation 1122, the electronic device may analyze the emotion of a person appearing in the video data based on the motion included in the video data. According to an embodiment, the electronic device may learn various motions using a motion deep learning module and analyze emotions of a person based on the learning.
다양한 실시예에 따르면, 동작 1130에서, 전자 장치는 입력 데이터의 등장 인물의 얼굴 표정에 기초하여 감정을 분석할 수 있다. 전자 장치는 다양한 얼굴 인식 기술을 이용할 수 있다.According to various embodiments, in operation 1130, the electronic device may analyze emotions based on facial expressions of characters in the input data. Electronic devices may use various face recognition technologies.
다양한 실시예에 따르면, 동작 1140에서, 전자 장치는 모션 및 표정에 기반하여 분석한 감정 정보에 대응하는 그래픽 요소를 생성할 수 있다. 전자 장치는 감정 딥러닝 모듈 및 모션 딥러닝 모듈을 이용하여 분석한 감정 정보에 기초하여 이모티콘, 텍스트 등의 시각 효과를 추가한 그래픽 데이터를 생성할 수 있다. 일 실시예에 따르면, 전자 장치는 음성 데이터에 특정 단어가 포함되어 있으면 해당 단어를 표현하는 이모티콘 그래픽 요소를 생성할 수 있다. 예를 들어, '사랑'이라는 단어가 음성 데이터에 포함된 경우, 프로세서는 해당 단어를 표현할 수 있는 형태(예: 하트 모양, 키스, 장미)를 포함하는 이모티콘을 생성할 수 있다. 전자 장치는 '사랑'을 포함하는 음성 데이터를 그래픽 자막 형태로 표현하고, 하트 모양과 같은 이모티콘을 그래픽 자막의 일 측에 함께 표시할 수 있다. 전자 장치는 이 외에 다양한 시각적 효과를 활용하여 생성한 그래픽 데이터와 입력 데이터를 합성하여 라이브 메시지를 생성하고, 메시지 어플리케이션을 통해 이를 외부 장치로 전송할 수 있다.According to various embodiments, in operation 1140, the electronic device may generate a graphic element corresponding to emotion information analyzed based on motion and expression. The electronic device may generate graphic data to which visual effects such as emoticons and texts are added based on emotion information analyzed using the emotion deep learning module and the motion deep learning module. According to an embodiment, when a specific word is included in voice data, the electronic device may create an emoticon graphic element expressing the corresponding word. For example, if the word 'love' is included in the voice data, the processor may generate an emoticon including a shape (eg, a heart shape, a kiss, a rose) capable of expressing the word. The electronic device may express voice data including 'love' in the form of a graphic caption and display an emoticon such as a heart on one side of the graphic caption. In addition to this, the electronic device may generate a live message by synthesizing graphic data and input data generated using various visual effects, and transmit the message to an external device through a message application.
다양한 실시예에 따른 전자 장치의 실시간 메시지 생성 방법은, 메시지 어플리케이션을 실행하는 동작, 상기 메시지 어플리케이션 실행 화면에서 제공되는 메뉴에 대한 사용자 입력에 기초하여, 마이크 및 카메라 중 적어도 하나로 수신된 입력 데이터를 획득하는 동작, 상기 입력 데이터에 포함된 인물의 감정 상태를 분석하는 동작, 상기 분석한 감정 상태에 기초하여, 적어도 하나의 그래픽 객체를 포함하는 그래픽 데이터를 생성하는 동작, 상기 입력 데이터 및 상기 그래픽 데이터에 기초하여 라이브 메시지를 생성하는 동작을 포함하는 방법.A real-time message generation method of an electronic device according to various embodiments includes an operation of executing a message application and obtaining input data received through at least one of a microphone and a camera based on a user input for a menu provided on a message application execution screen. operation of analyzing the emotional state of the person included in the input data, operation of generating graphic data including at least one graphic object based on the analyzed emotional state, operation of generating graphic data including the input data and the graphic data and generating a live message based on the
다양한 실시예에 따르면, 상기 통신 모듈을 이용하여 외부 장치와 통신 연결을 수립하는 동작, 상기 외부 장치의 종류에 기초하여 라이브 메시지에 포함되는 적어도 하나의 데이터 타입(data type)을 결정하는 동작, 및 결정한 적어도 하나의 데이터 타입을 포함하는 라이브 메시지를 생성하여 상기 외부 장치로 전송하는 동작을 더 포함하는 방법.According to various embodiments, an operation of establishing a communication connection with an external device using the communication module, an operation of determining at least one data type included in a live message based on the type of the external device, and The method further comprising generating and transmitting a live message including the determined at least one data type to the external device.
다양한 실시예에 따르면, 상기 라이브 메시지를 생성하는 동작은, 상기 외부 장치가 디스플레이를 포함하는 경우, 카메라 데이터, 텍스트 데이터 및 이모티콘 데이터 중 적어도 하나를 포함하는 라이브 메시지를 생성하는 동작을 더 포함하는 방법.According to various embodiments, the generating of the live message may further include generating a live message including at least one of camera data, text data, and emoticon data when the external device includes a display. .
다양한 실시예에 따르면, 상기 라이브 메시지를 생성하는 동작은, 상기 외부 장치가 오디오 인터페이스를 포함하는 경우, 음성 데이터 타입을 포함하는 라이브 메시지를 생성하는 동작을 더 포함하는 방법. According to various embodiments, the generating of the live message may further include generating a live message including a voice data type when the external device includes an audio interface.
다양한 실시예에 따르면, 상기 라이브 메시지를 전송하는 동작은, 상기 라이브 메시지를 상기 메모리에 저장하고, 및 사용자 입력에 기초하여 상기 라이브 메시지를 메시지 어플리케이션을 통해 전송하는 동작을 더 포함하는 방법.According to various embodiments, the transmitting of the live message may further include storing the live message in the memory and transmitting the live message through a message application based on a user input.
다양한 실시예에 따르면, 상기 그래픽 데이터를 생성하는 동작은, 상기 입력 데이터에 음성이 포함된 경우, STT(Speech To Text)기반 그래픽 자막 및 음성 컨택스트(context)에 기초한 그래픽 데이터를 생성하는 동작을 더 포함하는 방법.According to various embodiments, the generating of the graphic data may include generating graphic data based on STT (Speech To Text) based graphic subtitles and voice context when the input data includes voice. How to include more.
다양한 실시예에 따르면, 상기 그래픽 데이터를 생성하는 동작은, 상기 입력 데이터에 영상이 포함된 경우, 상기 영상에 포함된 모션에 기초하여 그래픽 데이터를 생성하는 동작을 더 포함하는 방법.According to various embodiments, the generating of the graphic data may further include, when the input data includes an image, generating the graphic data based on motion included in the image.
다양한 실시예에 따르면, 상기 그래픽 데이터를 생성하는 동작은, 상기 입력 데이터의 사진에 포함되는 인물의 표정, 인물의 위치 및 주변 오브젝트 중 적어도 하나를 분석하고, 이에 대응하는 그래픽 데이터를 생성하는 동작을 더 포함하는 방법.According to various embodiments of the present disclosure, the generating of the graphic data may include analyzing at least one of a facial expression of a person included in a picture of the input data, a position of the person, and a surrounding object, and generating graphic data corresponding thereto. How to include more.

Claims (15)

  1. 전자 장치에 있어서,In electronic devices,
    디스플레이;display;
    마이크;MIC;
    카메라;camera;
    메모리; 및Memory; and
    상기 디스플레이, 상기 마이크, 상기 카메라 및 상기 메모리와 작동적으로(operatively) 연결된 프로세서를 포함하고,a processor operatively connected with the display, the microphone, the camera, and the memory;
    상기 프로세서는,the processor,
    메시지 어플리케이션을 실행하고,Launch the Messages application,
    상기 메시지 어플리케이션 실행 화면에서 제공되는 메뉴에 대한 사용자 입력에 기초하여, 상기 마이크 및 상기 카메라 중 적어도 하나로 수신된 입력 데이터를 획득하고,Obtaining input data received by at least one of the microphone and the camera based on a user input for a menu provided on the message application execution screen;
    상기 입력 데이터에 포함된 인물의 감정 상태를 분석하고,Analyzing the emotional state of the person included in the input data;
    상기 분석한 감정 상태에 기초하여, 적어도 하나의 그래픽 객체를 포함하는 그래픽 데이터를 생성하고,Based on the analyzed emotional state, graphic data including at least one graphic object is generated;
    상기 입력 데이터 및 상기 그래픽 데이터에 기초하여 라이브 메시지를 생성하도록 설정된 전자 장치.An electronic device configured to generate a live message based on the input data and the graphic data.
  2. 제 1항에 있어서,According to claim 1,
    상기 전자 장치는 통신 모듈을 더 포함하고,The electronic device further includes a communication module,
    상기 프로세서는,the processor,
    상기 통신 모듈을 이용하여 외부 장치와 통신 연결을 수립하고,Establishing a communication connection with an external device using the communication module;
    상기 외부 장치의 종류에 기초하여 라이브 메시지에 포함되는 적어도 하나의 데이터 타입(Data type)을 결정하고,Determine at least one data type included in the live message based on the type of the external device;
    결정한 적어도 하나의 데이터 타입을 포함하는 라이브 메시지를 생성하여 상기 외부 장치로 전송하도록 설정된 전자 장치.An electronic device configured to generate and transmit a live message including at least one determined data type to the external device.
  3. 제 2항에 있어서,According to claim 2,
    상기 외부 장치가 디스플레이를 포함하는 경우,If the external device includes a display,
    카메라 데이터, 텍스트 데이터 및 이모티콘 데이터 중 적어도 하나를 포함하는 라이브 메시지를 생성하도록 설정된 전자 장치.An electronic device configured to generate a live message containing at least one of camera data, text data and emoticon data.
  4. 제 2항에 있어서,According to claim 2,
    상기 외부 장치가 오디오 인터페이스를 포함하는 경우,If the external device includes an audio interface,
    음성 데이터 타입을 포함하는 라이브 메시지를 생성하도록 설정된 전자 장치.An electronic device configured to generate live messages containing voice data types.
  5. 제 1항에 있어서,According to claim 1,
    상기 프로세서는,the processor,
    이모티콘, 텍스트 및 그래픽 효과 중 적어도 하나를 포함하는 그래픽 데이터를 생성하도록 설정된 전자 장치.An electronic device configured to generate graphic data containing at least one of emoticons, text and graphic effects.
  6. 제 1항에 있어서,According to claim 1,
    상기 프로세서는,the processor,
    상기 라이브 메시지를 상기 메모리에 저장하고,store the live message in the memory;
    사용자 입력에 기초하여 상기 라이브 메시지를 메시지 어플리케이션을 통해 전송하도록 설정된 전자 장치.An electronic device configured to transmit the live message through a message application based on a user input.
  7. 제 1항에 있어서,According to claim 1,
    상기 프로세서는,the processor,
    상기 입력 데이터에 음성이 포함된 경우, STT(Speech To Text)기반 그래픽 자막 및 음성 컨택스트(context)에 기초한 그래픽 데이터를 생성하도록 설정된 전자 장치.An electronic device configured to generate graphic data based on STT (Speech To Text) based graphic subtitles and voice context when voice is included in the input data.
  8. 제 1항에 있어서,According to claim 1,
    상기 프로세서는,the processor,
    상기 입력 데이터에 영상이 포함된 경우, 상기 영상에 포함된 모션에 기초하여 그래픽 데이터를 생성하도록 설정된 전자 장치.An electronic device configured to generate graphic data based on motion included in the image when the input data includes an image.
  9. 제 8항에 있어서,According to claim 8,
    상기 프로세서는,the processor,
    적어도 하나의 그래픽 데이터를 생성하고,generate at least one graphic data;
    사용자 입력에 기초하여 상기 적어도 하나의 그래픽 데이터 중 하나를 선택하도록 설정된 전자 장치.An electronic device configured to select one of the at least one graphic data based on a user input.
  10. 제 9항에 있어서,According to claim 9,
    상기 프로세서는,the processor,
    상기 모션에 대응하는 라이브 메시지가 기 생성되어 상기 메모리에 저장되어 있는 경우, 기 생성된 라이브 메시지에 기초하여 그래픽 데이터를 생성하도록 설정된 전자 장치.An electronic device configured to generate graphic data based on a pre-generated live message when a live message corresponding to the motion is pre-generated and stored in the memory.
  11. 제 1항에 있어서,According to claim 1,
    상기 프로세서는,the processor,
    상기 입력 데이터의 사진에 포함되는 인물의 표정, 인물의 위치 및 주변 오브젝트 중 적어도 하나를 분석하고, 이에 대응하는 그래픽 데이터를 생성하도록 설정된 전자 장치.An electronic device configured to analyze at least one of a facial expression of a person included in a picture of the input data, a position of the person, and a surrounding object, and generate graphic data corresponding thereto.
  12. 제 1항에 있어서,According to claim 1,
    상기 프로세서는,the processor,
    상기 입력 데이터에 웃고 있는 인물이 포함된 경우,If the input data includes a laughing person,
    상기 인물의 음성, 모션 및 얼굴 표정 중 적어도 하나를 인식하여 감정 상태를 결정하고,determining an emotional state by recognizing at least one of voice, motion, and facial expression of the person;
    결정한 감정 상태에 기초하여 웃음 이모티콘을 적어도 포함하는 그래픽 데이터를 생성하고,Generating graphic data including at least a laughing emoticon based on the determined emotional state;
    상기 입력 데이터와 상기 그래픽 데이터를 합성하여 라이브 메시지를 생성하도록 설정된 전자 장치.An electronic device configured to generate a live message by synthesizing the input data and the graphic data.
  13. 전자 장치의 실시간 메시지 생성 방법에 있어서,A real-time message generation method of an electronic device,
    메시지 어플리케이션을 실행하는 동작,the operation of running a message application;
    상기 메시지 어플리케이션 실행 화면에서 제공되는 메뉴에 대한 사용자 입력에 기초하여, 마이크 및 카메라 중 적어도 하나로 수신된 입력 데이터를 획득하는 동작,Obtaining input data received through at least one of a microphone and a camera based on a user input for a menu provided on the message application execution screen;
    상기 입력 데이터에 포함된 인물의 감정 상태를 분석하는 동작,Analyzing the emotional state of a person included in the input data;
    상기 분석한 감정 상태에 기초하여, 적어도 하나의 그래픽 객체를 포함하는 그래픽 데이터를 생성하는 동작, generating graphic data including at least one graphic object based on the analyzed emotional state;
    상기 입력 데이터 및 상기 그래픽 데이터에 기초하여 라이브 메시지를 생성하는 동작을 포함하는 방법.and generating a live message based on the input data and the graphic data.
  14. 제 13항에 있어서,According to claim 13,
    상기 통신 모듈을 이용하여 외부 장치와 통신 연결을 수립하는 동작,Establishing a communication connection with an external device using the communication module;
    상기 외부 장치의 종류에 기초하여 라이브 메시지에 포함되는 적어도 하나의 데이터 타입(data type)을 결정하는 동작, 및determining at least one data type included in a live message based on the type of the external device; and
    결정한 적어도 하나의 데이터 타입을 포함하는 라이브 메시지를 생성하여 상기 외부 장치로 전송하는 동작을 더 포함하는 방법.The method further comprising generating and transmitting a live message including the determined at least one data type to the external device.
  15. 제 14항에 있어서,According to claim 14,
    상기 라이브 메시지를 생성하는 동작은,The operation of generating the live message,
    상기 외부 장치가 디스플레이를 포함하는 경우,If the external device includes a display,
    카메라 데이터, 텍스트 데이터 및 이모티콘 데이터 중 적어도 하나를 포함하는 라이브 메시지를 생성하는 동작을 더 포함하는 방법.The method further comprising generating a live message including at least one of camera data, text data, and emoticon data.
PCT/KR2022/008636 2021-07-20 2022-06-17 Electronic device and real-time message generation method WO2023003183A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2021-0095137 2021-07-20
KR1020210095137A KR20230013987A (en) 2021-07-20 2021-07-20 Electronic device and the method for generating live messages

Publications (1)

Publication Number Publication Date
WO2023003183A1 true WO2023003183A1 (en) 2023-01-26

Family

ID=84980273

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/008636 WO2023003183A1 (en) 2021-07-20 2022-06-17 Electronic device and real-time message generation method

Country Status (2)

Country Link
KR (1) KR20230013987A (en)
WO (1) WO2023003183A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080057030A (en) * 2006-12-19 2008-06-24 엘지전자 주식회사 Apparatus and method for image communication inserting emoticon
KR20100129122A (en) * 2009-05-28 2010-12-08 삼성전자주식회사 Animation system for reproducing text base data by animation
JP5172155B2 (en) * 2003-01-20 2013-03-27 アバイア インコーポレーテッド Messaging advice on presence-aware networks
KR20180057366A (en) * 2016-11-22 2018-05-30 엘지전자 주식회사 Mobile terminal and method for controlling the same
KR20200092207A (en) * 2019-01-24 2020-08-03 삼성전자주식회사 Electronic device and method for providing graphic object corresponding to emotion information thereof

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5172155B2 (en) * 2003-01-20 2013-03-27 アバイア インコーポレーテッド Messaging advice on presence-aware networks
KR20080057030A (en) * 2006-12-19 2008-06-24 엘지전자 주식회사 Apparatus and method for image communication inserting emoticon
KR20100129122A (en) * 2009-05-28 2010-12-08 삼성전자주식회사 Animation system for reproducing text base data by animation
KR20180057366A (en) * 2016-11-22 2018-05-30 엘지전자 주식회사 Mobile terminal and method for controlling the same
KR20200092207A (en) * 2019-01-24 2020-08-03 삼성전자주식회사 Electronic device and method for providing graphic object corresponding to emotion information thereof

Also Published As

Publication number Publication date
KR20230013987A (en) 2023-01-27

Similar Documents

Publication Publication Date Title
WO2019164266A1 (en) Electronic device for generating image including 3d avatar reflecting face motion through 3d avatar corresponding to face and method of operating same
US20200402304A1 (en) Electronic device and method for managing custom object on basis of avatar
WO2020130281A1 (en) Electronic device and method for providing avatar based on emotion state of user
WO2020153785A1 (en) Electronic device and method for providing graphic object corresponding to emotion information by using same
WO2020171541A1 (en) Electronic device and method of providing user interface for emoji editing while interworking with camera function by using said electronic device
WO2018124633A1 (en) Electronic device and method for delivering message by same
WO2020116868A1 (en) Electronic device for generating augmented reality emoji and method thereof
WO2022154270A1 (en) Method for generating highlight video and electronic device thereof
WO2022211271A1 (en) Electronic device for processing handwriting input on basis of learning, operation method thereof, and storage medium
WO2023003183A1 (en) Electronic device and real-time message generation method
WO2023106895A1 (en) Electronic device for using virtual input device and operating method in electronic device
WO2022240076A1 (en) Image processing method and electronic device supporting same
WO2022186646A1 (en) Electronic device for image generation, and operating method of electronic device
WO2022173164A1 (en) Method and electronic device for displaying ar object
WO2022154417A1 (en) Electronic device for identifying emotional state, and operation method therefor
WO2020130734A1 (en) Electronic device for providing reaction on basis of user state and operating method therefor
WO2021242022A1 (en) Electronic device for synthesizing two-dimensional object with three-dimensional object, operation method of electronic device, and non-transitory storage medium
WO2023287012A1 (en) Content generation method based on performance of external device, and electronic device
WO2021015582A1 (en) Electronic device for providing avatar, and operation method therefor
WO2022191494A1 (en) Electronic device for providing video conference, and method therefor
WO2022245174A1 (en) Electronic device and video call method based on reaction service
WO2023027297A1 (en) Method and device for generating emotional combination content
WO2023027308A1 (en) Method and device for processing speech by distinguishing speakers
WO2023219240A1 (en) Electronic device and method for controlling same
WO2023013894A1 (en) Method and apparatus for applying visual effect to captured image and configuring tag

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22846055

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 22846055

Country of ref document: EP

Kind code of ref document: A1