WO2020027442A1 - 카메라 모듈을 통해 획득한 영상에 기반하여 정보를 저장하는 방법 및 이를 사용하는 전자 장치 - Google Patents

카메라 모듈을 통해 획득한 영상에 기반하여 정보를 저장하는 방법 및 이를 사용하는 전자 장치 Download PDF

Info

Publication number
WO2020027442A1
WO2020027442A1 PCT/KR2019/007750 KR2019007750W WO2020027442A1 WO 2020027442 A1 WO2020027442 A1 WO 2020027442A1 KR 2019007750 W KR2019007750 W KR 2019007750W WO 2020027442 A1 WO2020027442 A1 WO 2020027442A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
electronic device
image
user
memo
Prior art date
Application number
PCT/KR2019/007750
Other languages
English (en)
French (fr)
Inventor
배수정
김소영
안희범
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to US17/265,141 priority Critical patent/US11449134B2/en
Publication of WO2020027442A1 publication Critical patent/WO2020027442A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/9201Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal
    • H04N5/9202Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal the additional signal being a sound signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/93Regeneration of the television signal or of selected parts thereof
    • H04N5/9305Regeneration of the television signal or of selected parts thereof involving the mixing of the reproduced video signal with a non-recorded signal, e.g. a text signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/24Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/04Architectural design, interior design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2219/00Indexing scheme for manipulating 3D models or images for computer graphics
    • G06T2219/004Annotating, labelling

Definitions

  • Various embodiments of the present disclosure relate to a method of storing information based on an image acquired through a camera module and an electronic device using the same.
  • Electronic devices may provide a new experience to the user through augmented reality (AR).
  • AR augmented reality
  • the electronic device may display a virtual image by overlaying a virtual object on the background of reality.
  • the user can use the memo to remember something. For example, the user can directly write on a memo sheet and paste it in a specific space.
  • a user may record a memo through a memo application of the electronic device. When the user utilizes the memo, the appearance of the memo may appear messy.
  • a user records an image (eg, moving image, still image, text, etc.) through a memo application, it is difficult to emphasize the relevance of a specific space of the memo. In this case, the memos are listed in chronological order, and a user may often forget a memo that he / she made in the past after the memo.
  • An electronic device may include a display; Camera module; And a processor, wherein the processor acquires, through the camera module, a first image including at least one object disposed in an arbitrary space, and based on the obtained first image, the at least one Storing information about an object corresponding to the arbitrary space, obtaining a second image including at least a portion of the arbitrary space through the camera module, and based on the obtained second image, In the case of the first object included in the at least one object of the first image among the objects included in the second image, information about the first object is displayed together with the second image through the display, and In the case of the second object which is not included in the at least one object of the first image among the objects included in the second image, information about the second object may be provided. At least one operation of the operation of storing in response to can be carried out.
  • a method of an electronic device may include: acquiring a first image including at least one object disposed in an arbitrary space through a camera module of the electronic device; Storing information about the at least one object corresponding to the arbitrary space based on the obtained first image; Acquiring, by the camera module, a second image including at least a portion of the arbitrary space; And a first object included in the at least one object of the first image among the objects included in the second image, based on the obtained second image, through the display. Displaying information together with the second image; And in the case of a second object among the objects included in the second image, which is not included in the at least one object of the first image, storing information about the second object corresponding to the arbitrary space.
  • the operation may include performing at least one operation.
  • the electronic device may provide a user with a memo function through augmented reality.
  • a user of the electronic device may record a memo associated with a specific space through augmented reality.
  • the memo does not exist in the background of reality and may be provided to the user through the electronic device. Accordingly, the surrounding environment of the user may be simpler in appearance.
  • a user of the electronic device may easily and easily record a hierarchical memo in a short time by using at least one of image capturing, a user's voice input, and internet of things information.
  • the electronic device may not only store the captured image itself, but also may recognize and store a plurality of objects included in the image.
  • the electronic device may more easily modify or update a memo by using at least one of image capturing, a user's voice input, and internet of things information.
  • the electronic device may compare an image utilized in an existing memo with a recently photographed image through artificial intelligence (AI), and may modify or update the existing memo only by contrasting the images. Accordingly, the user of the electronic device can easily and conveniently store the hierarchical memo associated with the specific space in a short time.
  • AI artificial intelligence
  • the user of the electronic device may intuitively check the memo information classified in a hierarchical manner by searching in front of the memo to check the memo or searching the memo of a plurality of memos.
  • the user may input information such as voice, text, and image into the electronic device to perform a search.
  • FIG. 1 is a block diagram of an electronic device in a network environment according to various embodiments of the present disclosure.
  • FIG. 2 is a diagram illustrating a smart home environment according to various embodiments of the present disclosure.
  • FIG. 3 is a block diagram schematically illustrating a memo providing system according to various embodiments of the present disclosure.
  • FIG. 4 is a diagram illustrating an example of hierarchically classifying information about a specific space where a user wants to record a memo according to various embodiments of the present disclosure.
  • 5A through 5D are diagrams for describing a method of hierarchically storing a memo through an image according to various embodiments of the present disclosure.
  • FIG. 6 is a flowchart illustrating a method for generating a memo by an electronic device according to various embodiments of the present disclosure through interaction with a user.
  • FIG. 7 is a flowchart illustrating a method for an electronic device to update a memo through interaction with a user according to various embodiments of the present disclosure.
  • FIG. 8 is a diagram illustrating a method of recognizing an object based on at least one of image and sensor information of an electronic device according to various embodiments of the present disclosure.
  • 9A to 9B illustrate a method of storing a memo associated with a specific space of an electronic device through augmented reality according to various embodiments of the present disclosure.
  • FIG. 10 is a diagram illustrating a method of showing a memo recorded through an augmented reality of an electronic device to a user according to various embodiments of the present disclosure.
  • FIG. 11 is a diagram illustrating a method of checking a memo through augmented reality of an electronic device according to various embodiments of the present disclosure.
  • FIG. 12 is a diagram illustrating a method for an electronic device to recognize a noteable area and to provide a virtual memo board in a corresponding area according to various embodiments of the present disclosure.
  • FIG. 13 is a diagram illustrating a method of searching for a memo centering on a user through an electronic device according to various embodiments of the present disclosure
  • FIG. 1 is a block diagram of an electronic device 101 in a network environment 100, according to various embodiments.
  • the electronic device 101 communicates with the electronic device 102 through a first network 198 (eg, a short-range wireless communication network) or the second network 199.
  • the electronic device 104 may communicate with the server 108 through a long range wireless communication network.
  • the electronic device 101 may communicate with the electronic device 104 through the server 108.
  • the electronic device 101 may include a processor 120, a memory 130, an input device 150, an audio output device 155, a display device 160, an audio module 170, and a sensor module ( 176, interface 177, haptic module 179, camera module 180, power management module 188, battery 189, communication module 190, subscriber identification module 196, or antenna module 197. ) May be included.
  • a sensor module 176, interface 177, haptic module 179, camera module 180, power management module 188, battery 189, communication module 190, subscriber identification module 196, or antenna module 197.
  • the components eg, the display device 160 or the camera module 180
  • the sensor module 176 may be implemented embedded in the display device 160 (eg, display).
  • the processor 120 executes software (eg, the program 140) to execute at least one other component (eg, hardware or software component) of the electronic device 101 connected to the processor 120. It can control and perform various data processing or operations. According to one embodiment, as at least part of the data processing or operation, the processor 120 may receive instructions or data received from another component (eg, the sensor module 176 or the communication module 190) from the volatile memory 132. Can be loaded into, processed in a command or data stored in the volatile memory 132, and stored in the non-volatile memory (134).
  • software eg, the program 140
  • the processor 120 may receive instructions or data received from another component (eg, the sensor module 176 or the communication module 190) from the volatile memory 132. Can be loaded into, processed in a command or data stored in the volatile memory 132, and stored in the non-volatile memory (134).
  • the processor 120 may include a main processor 121 (eg, a central processing unit or an application processor), and a coprocessor 123 (eg, a graphics processing unit, an image signal processor) that may be operated independently or together. , Sensor hub processor, or communication processor). Additionally or alternatively, the coprocessor 123 may be configured to use lower power than the main processor 121 or to be specialized for its designated function. The coprocessor 123 may be implemented separately from or as part of the main processor 121.
  • a main processor 121 eg, a central processing unit or an application processor
  • a coprocessor 123 eg, a graphics processing unit, an image signal processor
  • the coprocessor 123 may be configured to use lower power than the main processor 121 or to be specialized for its designated function.
  • the coprocessor 123 may be implemented separately from or as part of the main processor 121.
  • the coprocessor 123 may, for example, replace the main processor 121 while the main processor 121 is in an inactive (eg, sleep) state, or the main processor 121 may be active (eg, execute an application). At least one of the components of the electronic device 101 (eg, the display device 160, the sensor module 176, or the communication module 190) together with the main processor 121 while in the) state. Control at least some of the functions or states associated with the. According to one embodiment, the coprocessor 123 (eg, an image signal processor or communication processor) may be implemented as part of other functionally related components (eg, camera module 180 or communication module 190). have.
  • the memory 130 may store various data used by at least one component (eg, the processor 120 or the sensor module 176) of the electronic device 101.
  • the data may include, for example, software (eg, the program 140) and input data or output data for a command related thereto.
  • the memory 130 may include a volatile memory 132 or a nonvolatile memory 134.
  • the program 140 may be stored as software in the memory 130 and may include, for example, an operating system 142, middleware 144, or an application 146.
  • the input device 150 may receive a command or data to be used for a component (for example, the processor 120) of the electronic device 101 from the outside (for example, a user) of the electronic device 101.
  • the input device 150 may include, for example, a microphone, a mouse, a pen, or a keyboard.
  • the sound output device 155 may output a sound signal to the outside of the electronic device 101.
  • the sound output device 155 may include, for example, a speaker or a receiver.
  • the speaker may be used for general purposes such as multimedia playback or recording playback, and the receiver may be used to receive an incoming call.
  • the receiver may be implemented separately from or as part of a speaker.
  • the display device 160 may visually provide information to the outside (eg, a user) of the electronic device 101.
  • the display device 160 may include, for example, a display, a hologram device, or a projector and a control circuit for controlling the device.
  • the display device 160 may include touch circuitry configured to sense a touch, or a sensor circuit (eg, a pressure sensor) set to measure the strength of the force generated by the touch. have.
  • the audio module 170 may convert sound into an electric signal or, conversely, convert an electric signal into a sound. According to an embodiment of the present disclosure, the audio module 170 may acquire sound through the input device 150, or may output an external electronic device (for example, a sound output device 155 or directly or wirelessly connected to the electronic device 101). Sound may be output through the electronic device 102 (eg, a speaker or a headphone).
  • an external electronic device for example, a sound output device 155 or directly or wirelessly connected to the electronic device 101. Sound may be output through the electronic device 102 (eg, a speaker or a headphone).
  • the sensor module 176 detects an operating state (eg, power or temperature) or an external environmental state (eg, a user state) of the electronic device 101, and generates an electrical signal or data value corresponding to the detected state. can do.
  • the sensor module 176 may include, for example, a gesture sensor, a gyro sensor, an air pressure sensor, a magnetic sensor, an acceleration sensor, a grip sensor, a proximity sensor, a color sensor, an infrared sensor, a biometric sensor, It may include a temperature sensor, a humidity sensor, or an illuminance sensor.
  • the interface 177 may support one or more designated protocols that may be used for the electronic device 101 to be directly or wirelessly connected to an external electronic device (for example, the electronic device 102).
  • the interface 177 may include, for example, a high definition multimedia interface (HDMI), a universal serial bus (USB) interface, an SD card interface, or an audio interface.
  • HDMI high definition multimedia interface
  • USB universal serial bus
  • SD card interface Secure Digital Card interface
  • audio interface audio interface
  • connection terminal 178 may include a connector through which the electronic device 101 may be physically connected to an external electronic device (eg, the electronic device 102).
  • the connection terminal 178 may include, for example, an HDMI connector, a USB connector, an SD card connector, or an audio connector (eg, a headphone connector).
  • the haptic module 179 may convert an electrical signal into a mechanical stimulus (eg, vibration or movement) or an electrical stimulus that can be perceived by the user through tactile or kinesthetic senses.
  • the haptic module 179 may include, for example, a motor, a piezoelectric element, or an electrical stimulation device.
  • the camera module 180 may capture still images and videos.
  • the camera module 180 may include one or more lenses, image sensors, image signal processors, or flashes.
  • the camera module may be one or more modules for acquiring different signals such as RGB, IR, and time of flight (TOF), or a combination thereof.
  • the camera module may be a stereo camera type for acquiring two RGB images or a stereo camera in which RGB and TOF are combined.
  • the power management module 188 may manage power supplied to the electronic device 101.
  • the power management module 388 may be implemented as at least a part of a power management integrated circuit (PMIC), for example.
  • PMIC power management integrated circuit
  • the battery 189 may supply power to at least one component of the electronic device 101.
  • the battery 189 may include, for example, a non-rechargeable primary cell, a rechargeable secondary cell, or a fuel cell.
  • the communication module 190 may establish a direct (eg wired) communication channel or wireless communication channel between the electronic device 101 and an external electronic device (eg, the electronic device 102, the electronic device 104, or the server 108). Can establish and perform communication over established communication channels.
  • the communication module 190 may operate independently of the processor 120 (eg, an application processor) and include one or more communication processors supporting direct (eg, wired) or wireless communication.
  • the communication module 190 may include a wireless communication module 192 (eg, a cellular communication module, a near field communication module, or a global navigation satellite system (GNSS) communication module) or a wired communication module 194 (eg, A local area network (LAN) communication module, or a power line communication module).
  • GNSS global navigation satellite system
  • the corresponding communication module of these communication modules may be a first network 198 (e.g. a short range communication network such as Bluetooth, Wi-Fi direct or infrared data association) or a second network 199 (e.g. cellular network, the Internet). Or a telecommunication network such as a computer network (for example, a LAN or a WAN).
  • a first network 198 e.g. a short range communication network such as Bluetooth, Wi-Fi direct or infrared data association
  • a second network 199 e.g. cellular network, the Internet
  • a telecommunication network such as a computer network (for example, a LAN or a WAN).
  • These various types of communication modules may be integrated into one component (eg, a single chip) or may be implemented by a plurality of components (eg, a plurality of chips) separate from each other.
  • the wireless communication module 192 uses subscriber information (e.g., international mobile subscriber identifier (IMSI)) stored in the subscriber identification module 196 in a communication network such as the first network 198 or the second network 199.
  • subscriber information e.g., international mobile subscriber identifier (IMSI)
  • IMSI international mobile subscriber identifier
  • the antenna module 197 may transmit or receive a signal or power to an external (eg, an external electronic device) or from an external source.
  • antenna module 197 may include one or more antennas, from which at least one antenna suitable for a communication scheme used in a communication network, such as first network 198 or second network 199, For example, it may be selected by the communication module 190.
  • the signal or power may be transmitted or received between the communication module 190 and the external electronic device through the selected at least one antenna.
  • At least some of the components are connected to each other and connected to each other through a communication method (eg, a bus, a general purpose input and output (GPIO), a serial peripheral interface (SPI), or a mobile industry processor interface (MIPI)). For example, commands or data).
  • a communication method eg, a bus, a general purpose input and output (GPIO), a serial peripheral interface (SPI), or a mobile industry processor interface (MIPI)
  • a communication method eg, a bus, a general purpose input and output (GPIO), a serial peripheral interface (SPI), or a mobile industry processor interface (MIPI)
  • GPIO general purpose input and output
  • SPI serial peripheral interface
  • MIPI mobile industry processor interface
  • the command or data may be transmitted or received between the electronic device 101 and the external electronic device 104 through the server 108 connected to the second network 199.
  • Each of the electronic devices 102 and 104 may be a device of the same or different type as the electronic device 101.
  • all or part of operations executed in the electronic device 101 may be executed in one or more external devices among the external electronic devices 102, 104, or 108. For example, when the electronic device 101 needs to perform a function or service automatically or in response to a request from a user or another device, the electronic device 101 instead of executing the function or service itself.
  • one or more external electronic devices may be requested to perform at least a part of the function or the service.
  • the one or more external electronic devices that receive the request may execute at least a part of the requested function or service, or an additional function or service related to the request, and transmit a result of the execution to the electronic device 101.
  • the electronic device 101 may process the result as it is or additionally and provide it as at least part of the response to the request.
  • cloud computing distributed computing, or client-server computing technology may be used.
  • Electronic devices may be various types of devices.
  • the electronic device may include, for example, a portable communication device (eg, a smartphone), a computer device, a portable multimedia device, a portable medical device, a camera, a wearable device, or a home appliance device.
  • a portable communication device eg, a smartphone
  • a computer device e.g., a tablet, or a smart phone
  • a portable multimedia device e.g., a portable medical device
  • a camera e.g., a camera
  • a wearable device e.g., a smart watch, or a smart watch, or a smart watch, or a smart watch, or a smart watch, or a smart watch, or a smart watch, or a smart watch, or a smart watch, or a smart watch, or a smart watch, or a smart watch, or a smart watch, or a smart watch, or a smart watch, or a smart watch, or a smart watch, or a smart watch
  • first, second, or first or second may simply be used to distinguish a component from other corresponding components, and to separate the components from other aspects (e.g. Order).
  • Some (eg, first) component may be referred to as “coupled” or “connected” to another (eg, second) component, with or without the term “functionally” or “communicatively”.
  • any component can be connected directly to the other component (eg, by wire), wirelessly, or via a third component.
  • module may include a unit implemented in hardware, software, or firmware, and may be used interchangeably with terms such as logic, logic block, component, or circuit.
  • the module may be a minimum unit or part of an integrally configured component or part that performs one or more functions.
  • the module may be implemented in the form of an application-specific integrated circuit (ASIC).
  • ASIC application-specific integrated circuit
  • Various embodiments of this document may include one or more instructions stored on a storage medium (eg, internal memory 136 or external memory 138) that can be read by a machine (eg, electronic device 101). It may be implemented as software (eg, program 140) including the.
  • a processor eg, the processor 120 of the device (eg, the electronic device 101) may call and execute at least one command among one or more instructions stored from the storage medium. This enables the device to be operated to perform at least one function in accordance with the at least one command invoked.
  • the one or more instructions may include code generated by a compiler or code executable by an interpreter.
  • the device-readable storage medium may be provided in the form of a non-transitory storage medium.
  • 'non-transitory' means only that the storage medium is a tangible device and does not contain a signal (e.g. electromagnetic wave), which means that the data is stored semi-permanently on the storage medium. It does not distinguish cases where it is temporarily stored.
  • a signal e.g. electromagnetic wave
  • a method according to various embodiments of the present disclosure may be included in a computer program product.
  • the computer program product may be traded between the seller and the buyer as a product.
  • the computer program product may be distributed in the form of a device-readable storage medium (e.g. compact disc read only memory (CD-ROM)), or through an application store (e.g. Play StoreTM) or two user devices ( Example: smartphones) can be distributed (eg downloaded or uploaded) directly or online.
  • a device-readable storage medium e.g. compact disc read only memory (CD-ROM)
  • an application store e.g. Play StoreTM
  • smartphones two user devices
  • at least a portion of the computer program product may be stored at least temporarily or temporarily created on a device-readable storage medium such as a server of a manufacturer, a server of an application store, or a memory of a relay server.
  • each component (eg, module or program) of the above-described components may include a singular or plural object.
  • one or more components or operations of the above-described corresponding components may be omitted, or one or more other components or operations may be added.
  • a plurality of components eg, a module or a program
  • the integrated component may perform one or more functions of the component of each of the plurality of components the same as or similar to that performed by the corresponding component of the plurality of components before the integration. .
  • operations performed by a module, program, or other component may be executed sequentially, in parallel, repeatedly, or heuristically, or one or more of the operations may be executed in a different order, or may be omitted. Or one or more other operations may be added.
  • FIG. 2 is a diagram illustrating a smart home environment according to various embodiments of the present disclosure.
  • FIG. 2 illustrates a smart home environment 200.
  • the smart home environment may include one or more cameras 221, 223, 225, 227, 229, or 231, one or more sensors or devices including the sensors (eg, floor microphones 233, 235, 237, or 239), room objects (bed 241, stand 243), kitchen objects (refrigerator 251, coffee machine 253, lights 255), living room objects (TV 261, sofa 263, lights 265), door objects (door 271, Light 273, window 275, electronic device 280 (e.g., electronic device 101 of FIG. 1), network 285 (e.g., network 199 of FIG. 1), one or more external servers 291, 295 (e.g., FIG. 1 Server 108.
  • the electronic device 280 may correspond to an AI speaker, or may include an electronic device that operates or operates in conjunction with an AI speaker.
  • the electronic device 280 may detect where a person is located by using at least one of the one or more cameras 221 ⁇ 231. For example, the electronic device 280 may detect a person who enters or exits a home through a door through the camera 227. Alternatively, the electronic device 280 may detect a person entering, a person leaving, or a person staying at a designated location (eg, a room, a kitchen, a living room, a front door) through the cameras 223, 225, 229, and 231. According to another embodiment of the present disclosure, the electronic device 280 may detect a person who roams around or invades the house through the camera 221.
  • a designated location eg, a room, a kitchen, a living room, a front door
  • the electronic device 280 may identify a user by using at least one of the one or more cameras 221 ⁇ 231. For example, the electronic device 280 may identify whether it is a designated person (eg, a resident) or an unspecified person (eg, an intruder or a guest).
  • a designated person eg, a resident
  • an unspecified person eg, an intruder or a guest
  • the electronic device 280 may detect where a person is located through the plurality of floor microphones 233 to 239. For example, the electronic device 280 may determine that the person is in the home room based on the footstep sound obtained by the floor microphone 233. In addition, the electronic device 280 may identify a person by using the characteristics of the footstep sound acquired by the floor microphone 233 (eg, intensity, pattern, frequency, etc.), compared with the characteristics of the person's gait previously acquired. Can be. For example, assuming a family consisting of a dad, a mother, and a baby, the electronic device 280 may determine that the electronic device 280 is the dad when the sound is loudest and the time interval between steps is about 1 to 2 seconds.
  • the characteristics of the footstep sound acquired by the floor microphone 233 eg, intensity, pattern, frequency, etc.
  • the electronic device 280 may determine that the sound is medium and if the time interval between steps is about 2 to 3 seconds.
  • the electronic device 280 may determine that the sound is a baby when the sound is small and the time interval between steps is about 1 to 2 seconds.
  • a person may be distinguished using various features such as a distance between steps, a feature of going from left to right foot, and a feature of going from right to left foot.
  • the electronic device 280 may determine that an intruder may have entered.
  • the electronic device 280 may determine a location of a person using a plurality of floor microphones. For example, the electronic device 280 may determine a person's position in detail by obtaining a distance from the floor microphones 233, 235, and 237 through triangulation using the floor microphones 233, 235, and 237. For example, in the living room, the electronic device 280 may determine whether a person is closer or closer to the TV 261 or the sofa 263. Alternatively, in the kitchen, the electronic device 280 may determine which one of the refrigerator 251 or the coffee machine 253 is closer or closer to the person.
  • the electronic device 280 may determine a direction in which a person moves from the kitchen to the main room and from the kitchen to the living room.
  • the floor microphone is taken as an example, the microphone may be present in various objects. For example, it may be present in various places, such as ceiling-mounted, light-mounted, furniture-mounted, household appliances-mounted.
  • the electronic device 280 may determine a location of a user based on information received from various objects such as a bed 241, a stand 243, a refrigerator 251, a coffee machine 253, a TV 261, and a sofa 263.
  • the bed 241 or the sofa 263 may include at least one of a motion sensor, a weight sensor, an acceleration sensor, a capacitance sensor, and a pressure sensor.
  • the stand 243 may include a motion sensor and provide on / off information of the stand 243.
  • the refrigerator 251 may include a motion sensor, a camera, a door opening sensor, an acceleration sensor, and the like, and may provide door opening / closing information and information about what is inserted and removed.
  • the coffee machine 253 may include a motion sensor and may provide on / off information of the coffee machine 253, information on the type of coffee, information on the temperature of the coffee, and the like.
  • the lights 255, 265, and 273 may include a motion sensor and provide on / off information of the lights 255, 265, and 273.
  • the TV 261 may include a motion sensor, a camera, and a microphone, and may provide on / off information, content usage information, and the like of the TV 261.
  • the door 271 or the window 275 may include a motion sensor, an acceleration sensor, a door open sensor, a biometric information sensor, and the like, and may provide open / close information, object access information, external intrusion information, and the like.
  • one or more sensors or devices including the sensors may include a wireless communication device, and receive wireless signals received from a user's portable electronic device (eg, a mobile phone, a smart arm, etc.), Information can be provided.
  • a user's portable electronic device eg, a mobile phone, a smart arm, etc.
  • the electronic device 280 may determine the location of the user and identify the user by using various provided information.
  • the electronic device 280 may determine the location of the user and identify the user by using the server 291 with various provided information.
  • the electronic device 280 may provide the server 291 with various pieces of provided information.
  • the electronic device 280 may determine the setting of the sensor by using additional information such as a currently operating electronic device, a current time, and a learned user's life pattern. For example, if the electronic device 280 has a user in a room, the fire is turned off, and the user is lying down for a predetermined time through a sensor of a bed, the electronic device 280 may determine that the user is sleeping. The electronic device 280 may determine the setting of the sensor by a sleep setting (for example, about once every 20 minutes at early evening and about once every 5 minutes at dawn).
  • a sleep setting for example, about once every 20 minutes at early evening and about once every 5 minutes at dawn.
  • the electronic device 280 may determine the type of sensor to be sensed among the sensors associated with the home.
  • the electronic device 280 may determine the type of sensor to be sensed by using additional information such as a currently operating electronic device, time, and learned user's life pattern.
  • the electronic device 280 may apply sleep settings to the kitchen and the living room.
  • the living room and the kitchen may be set to the monitoring setting. Only one of the camera and the motion sensor can be set to sense.
  • the electronic device 280 may include a user's portable terminal, a tablet, or a wearable electronic device.
  • the electronic device 280 may be included in various electronic devices such as a TV, a refrigerator, a set top box, and a game machine.
  • a TV TV
  • a refrigerator a refrigerator
  • a set top box a set top box
  • a game machine a game machine
  • FIG. 2 illustrates an operation of an electronic device (eg, an AI speaker) in a smart home environment, but the present disclosure is not limited to the smart home, but may be applied in various environments (eg, inside a building or outdoors). This is possible.
  • an AI speaker it may include various electronic devices that are not bound by the term AI.
  • the servers 291 and 295 of FIG. 2 may correspond to 108 of FIG. 1, and the network 285 may correspond to 199 of FIG. 1.
  • a user may interact with at least one electronic device for generating, searching, and outputting a memo in a smart home environment.
  • the user uses voice input and a graphical user interface (GUI) to communicate with the electronic device, and electronic devices (eg, smart phones, smart TVs, security cameras, refrigerators, etc.) located in a smart home environment to obtain image information. ) Can use the camera.
  • GUI graphical user interface
  • electronic devices eg, smart phones, smart TVs, security cameras, refrigerators, etc.
  • an electronic device such as a mini robot may complement a user's moving line.
  • the user may input or obtain at least one information through the mini robot.
  • voice input can be mainly used, and a camera mounted on the mini-robot can be used to acquire image information for creating and updating a memo.
  • the information generated by the user may be stored in an electronic device such as a smart phone, or may be stored in an artificial intelligence hub device (eg, an artificial intelligence speaker) in a smart home environment. In this case, the corresponding information may be stored in the security area of the artificial intelligence hub device.
  • the AI hub device can compensate for the lack of computing resources of smart phones and mini robots, and it is also equipped with a recognition model necessary for voice recognition and image recognition to perform a recognition function using the recognition model.
  • the recognition result of the artificial intelligence hub device (eg, the electronic device 280 of FIG. 2) may be transmitted to an electronic device included in a smart home environment such as a smart phone and a mini robot.
  • the recognition model may be updated through an external server (eg, a cloud server, servers 291 and 295 of FIG.
  • Voice and video recognition may be performed by an external server.
  • the recognition result may be transmitted to the user smart device or IoT devices in the house through the artificial intelligence hub device. Or it can be delivered directly to the user's smart devices or IoT devices without going through an AI hub device.
  • FIG. 3 is a block diagram schematically illustrating a memo providing system according to various embodiments of the present disclosure.
  • the electronic device 101 may generate, update, search, and display a memo through the memo providing system 300.
  • the memo providing system 300 may include a memo generation module 310, a memo update module 320, a memo display module 330, and a memo search module 340.
  • the memo generation module 310 may generate a memo based on information of a user's voice input, an image, and the like.
  • the image may include a moving image or a still image.
  • the user may input voice information such as start and end of memo generation and information about an object to be included in the memo.
  • the memo generation module 310 may utilize a camera of an electronic device (eg, a smart phone, a smart TV, a security camera, a refrigerator, etc.) located in a smart home environment to obtain image information.
  • the memo generation module 310 may acquire at least one information (eg, an object region, an object category, an object image, an object hierarchy, etc.) about the object by recognizing the object included in the acquired image.
  • the memo generation module 310 may generate a memo based on automatically recognized information even if the user of the electronic device 101 does not directly record the memo contents.
  • the memo generation module 310 may classify and store recognized objects. For example, it can be stored including hierarchical information such as which room is located in which room, in which furniture, in which box, and so on.
  • the memo generation module 310 may generate a memo using augmented reality.
  • the memo generation module 310 may generate an augmented reality memo by selecting a memo area and a memo content corresponding to the memo area (eg, an object recognized in an image). The selection may be made sequentially or individually, and may use drag input or tap touch input. For details, refer to FIG. 8B.
  • the memo update module 320 may update a memo based on information such as a user's voice input and a photographed image.
  • the user may input voice information such as start and end of a memo update and information about an object to be updated in the memo.
  • the memo update module 320 may utilize a camera of an electronic device (eg, a smart phone, a smart TV, a security camera, a refrigerator, etc.) located in a smart home environment to obtain image information.
  • the memo update module 320 may recognize at least one object included in the acquired image and acquire at least one information (eg, an object area, an object category, an object image, an object hierarchy, etc.) about the object.
  • the memo update module 320 may acquire a new image in relation to a memo that is an update target.
  • the memo update module 320 may compare the object information included in the pre-stored memo with the object information included in the newly acquired image, and may check and store at least one change.
  • the memo update module 320 may automatically extract an area of an object and recognize a category of the object through a object recognition technology. In this way, the user may update the memo through the automatically recognized object information even if the user does not directly input and classify the contents of the object.
  • the memo display module 330 may provide at least one memo stored to the user.
  • the at least one memo may be stored in the user's smart phone (for example, the electronic device 101 of FIG. 1), and may be displayed by being coupled to a specific area through augmented reality.
  • augmented reality may refer to a technology for providing information by augmentation based on reality.
  • virtual reality shows an image, a surrounding background, and an object as a virtual image
  • augmented reality may virtually provide only additional information to a user.
  • augmented reality differs from virtual reality in that it is based on the actual appearance of the real world.
  • the at least one memo may be stored in an AI hub device in a smart home rather than the user's smartphone, and when the user activates the augmented reality memo function, the AI hub device transfers the smart phone to the smartphone.
  • the memo display module 330 may recognize a virtual area to display a memo in the image acquired using the camera module 180.
  • the memo display module 330 may obtain a depth map from an image acquired using the camera module 180, and check depth information of an object included in the image based on the depth map. Can be.
  • the memo display module 330 may obtain plane information for displaying an augmented reality memo based on the depth information.
  • the memo display module 330 may determine the acquired side information as a memo-capable area, and information corresponding to the memo of the user on the selected side (eg, an object image, an object name, an object type, an object category, an object hierarchy, etc.) May be displayed in augmented reality.
  • the memo display module 330 may first provide an image representing a specific area to a user when a plurality of display target objects exist in a specific area (eg, a closet). Subsequently, when the user selects the representative image, a plurality of object information included in a specific area may be displayed in detail.
  • the representative image may be an image of an object directly designated by a user, an image of an object of which a change is recently detected, or an image of an object disposed for the longest time.
  • the memo search module 340 may search a pre-stored memo based on information such as a user's voice input and a photographed image.
  • the memo search module 340 may search hierarchical information of a search target object by using a tree structure stored in the memo providing system 300.
  • the memo search module 340 may search for a memo by using at least one information (eg, location information, image information, etc.) from other things in the smart home environment.
  • FIG. 4 is a diagram illustrating an example of hierarchically classifying information about a specific space where a user wants to record a memo according to various embodiments of the present disclosure.
  • the electronic device 101 may classify and store a plurality of objects (for example, 400 to 432) to be included in a memo. At least one of video and audio input may be utilized to minimize user's effort in stratifying memo contents.
  • a category having a wider relationship may be set as a higher layer by using an inclusion relationship when hierarchizing, and memo information may be stored by using a hierarchical diagram (eg, a tree structure).
  • the room 400 may include a cabinet 410 and a bed 412.
  • the cabinet 410 may include a jacket 420, a blouse 422, a bag 424, and a storage box 426.
  • Compartment box 426 may include necklace 430 and earring 432.
  • the level, depth, or level of stratification may be configured differently according to the decision based on the artificial intelligence of the electronic device or the needs of the user. For certain objects, you can layer more levels than others, or simply classify them in one or two levels. Hierarchical information of the object disclosed in FIG. 4 will be described in more detail later with reference to FIGS. 5A through 5D.
  • 5A through 5D are diagrams for describing a method of hierarchically storing a memo through an image according to various embodiments of the present disclosure.
  • FIG. 5A may represent a first step of a memo hierarchy.
  • the electronic device 101 uses the camera module 180 to acquire an image related to the main room 400 and based on the image recognition of the acquired image, sets the main room as information of the first step. Can be set.
  • the electronic device 101 may store a hierarchical memo based on receiving a voice input related to a memo of the user. The electronic device 101 may set the 'home room' as the first step based on a voice input of “Here is my home room” from the user.
  • FIG. 5B may represent a second step of the hierarchical structure of the memo.
  • the user acquires an image related to the storage cabinet 410 by using the camera module 180 of the electronic device 101, and based on the image recognition of the acquired image, the user determines the 'cabinet' of the second step. Can be set as information.
  • the electronic device 101 may store a hierarchical memo based on receiving a voice input related to a memo of the user.
  • the electronic device 101 may set the 'cabinet' as the second step based on a voice input from the user, “the furniture located there is a storage cabinet”.
  • FIG. 5C may represent a third step of the hierarchical structure of the memo.
  • the user may use at least one object (eg, jacket 420, blouse 422, bag 424) included in the cabinet 410 using the camera module 180 of the electronic device 101.
  • the image of the storage box 426 may be obtained, and 'jacket', 'blouse', 'bag', and 'storage box' may be set as information of the third step based on image recognition of the acquired image.
  • the electronic device 101 may store a hierarchical memo based on receiving a voice input related to a memo of the user.
  • the electronic device 101 may set the 'jacket', 'blouse', 'bag', and 'box' in the third step based on a voice input from the user that "the cabinet includes a jacket, a blouse, a bag and a storage box.” have.
  • FIG. 5D may represent a fourth step of the hierarchical structure of the memo.
  • the user may use the camera module 180 of the electronic device 101 to view an image of at least one accessory (eg, the necklace 430 and the earring 432) included in the holder 426.
  • Acquiring, based on image recognition of the acquired image, 'necklace', 'earring' may be set as the information of the fourth step.
  • the electronic device 101 may store a hierarchical memo based on receiving a voice input related to a memo of the user.
  • the electronic device 101 may set the 'necklace' and the 'earring' in the fourth step based on a voice input from the user that "the necklace and the earring are in the storage box".
  • the electronic device 101 may store a memo in accordance with a user's intention by combining at least a portion of an image and an audio input.
  • a user of the electronic device 101 may easily check information of any node in a memo stored in a hierarchical structure through a search function.
  • the electronic device 101 may receive a voice command of “tell me where the earring is” from the user.
  • the electronic device 101 may provide a response to the user that “the earrings are in the storage box in the compartment of the room”.
  • the user of the electronic device 101 may further acquire information of a desired level according to his needs using this hierarchical structure. For example, the user of the electronic device 101 may obtain more detailed and systematic information while moving memo information from a higher level to a lower level.
  • FIG. 6 is a flowchart illustrating a method for generating a memo by an electronic device according to various embodiments of the present disclosure through interaction with a user.
  • the electronic device 101 may receive an input (eg, a voice input, a touch input, a button input, etc.) for generating a memo from the user.
  • an input eg, a voice input, a touch input, a button input, etc.
  • the electronic device 101 may receive a voice command “bixby, I will leave a note from now on” from the user.
  • the electronic device 101 may acquire an image for generating a memo in operation 620.
  • the electronic device 101 may activate at least one component, module, or the like necessary for generating a memo in response to an input of starting to generate a memo of the user.
  • the electronic device 101 may activate a camera module, a voice recognition module, an image recognition module, and the like.
  • the electronic device 101 may recognize an object based at least in part on the acquired image.
  • the electronic device 101 may segment at least one object included in the corresponding image through the image recognition module and recognize the corresponding object.
  • the electronic device 101 may acquire an image from the camera module and also receive at least one piece of information on a memo being recorded to recognize the object.
  • At least one piece of information about a memo being recorded may be a voice input of a user.
  • the electronic device 101 may recognize an object based on an image obtained from a camera module and a voice input of a user. For example, the electronic device 101 may receive a voice input from the user, "Here is my room, and there is a cabinet.” The user of the electronic device 101 may control the electronic device 101 to face in the direction of the storage closet together with the corresponding voice input.
  • the electronic device 101 may acquire an image through the camera module 180 and may recognize at least one object (for example, a room and a storage space disposed in the room) from the acquired image.
  • the electronic device 101 may receive a voice command from the user, "There are these things when the cabinet door is opened.” In response to receiving the voice command, the electronic device 101 may acquire an image through the camera module 180 and recognize at least one object included in the cabinet from the acquired image. For another example, the electronic device 101 may receive a voice command from the user, "That box is a box for storing accessories, which contains these things.” In response to receiving the voice command, the electronic device 101 may acquire an image through the camera module 180, and recognize at least one object included in the cabinet from the acquired image. You can see that at least one object corresponds to an accessory.
  • At least one piece of information regarding a memo being recorded may be thing information of the IoT apparatus.
  • the electronic device 101 may belong to a smart home environment and may receive thing information from at least one IoT apparatus included in the smart home environment.
  • the electronic device 101 may recognize the object by receiving a location where the image is captured and information on at least one object included in the image.
  • the electronic device 101 may determine a level of hierarchy of the recognized object and store information about the recognized object according to the determined hierarchy level.
  • the electronic device 101 may recognize a cabinet located in a home room based on at least a portion of a user's voice input, object information of the IoT apparatus, and an image obtained from a camera module. For example, the electronic device 101 determines a home as a first tier (for example, a type of room) and a storage cabinet as a second tier (for example, furniture placed in a room).
  • a first tier for example, a type of room
  • a storage cabinet for example, furniture placed in a room.
  • the electronic device 101 may store at least one object included in the storage closet as a third layer.
  • the electronic device 101 may determine a jacket, a blouse, a bag, and a storage box in the storage closet as a third step lower than the storage closet as the second step and store information about the recognized object in the determined layer.
  • the electronic device 101 may store at least one object included in the storage box as a fourth step hierarchy.
  • the electronic device 101 may determine the necklace and the earring in the storage box as the fourth step, which is a lower step than the storage box as the third step, and may store information about the recognized object in the determined layer.
  • FIG. 7 is a flowchart illustrating a method for an electronic device to update a memo through interaction with a user according to various embodiments of the present disclosure.
  • the electronic device 101 may receive an input (eg, a voice input, a touch input, a button input, etc.) for updating a memo.
  • an input eg, a voice input, a touch input, a button input, etc.
  • the electronic device 101 may receive a voice command "bixby, update if there are any changes" from the user.
  • the electronic device 101 may acquire an image for updating a memo.
  • the electronic device 101 may activate at least one component, module, or the like necessary for updating the memo in response to an input of starting the memo update of the user.
  • the electronic device 101 may activate a camera module, a voice recognition module, an image recognition module, and the like.
  • the electronic device 101 may recognize an object based on at least a part of the acquired image.
  • the electronic device 101 may segment at least one object included in the corresponding image through the image recognition module and recognize the corresponding object.
  • the electronic device 101 may acquire an image from the camera module and also receive at least one piece of information on the memo being updated to recognize the object.
  • At least one piece of information regarding the memo being updated may be a voice input of a user.
  • the electronic device 101 may recognize an object based on an image obtained from a camera module and a voice input of a user. For example, the electronic device 101 may receive a voice input of “I will open the room cabinet” from the user. In response to receiving the voice command, the electronic device 101 may acquire an image through the camera module 180, and recognize at least one object included in the cabinet from the acquired image.
  • At least one piece of information about the memo being updated may be thing information of the IoT apparatus.
  • the electronic device 101 may belong to a smart home environment and may receive thing information from at least one IoT apparatus included in the smart home environment.
  • the electronic device 101 may recognize the object by receiving a location where the image is captured and information on at least one object included in the image.
  • the electronic device 101 may determine the hierarchical level of the recognized object in operation 740.
  • the electronic device 101 may recognize a cabinet located in a home room based on at least a portion of a user's voice input, object information of the IoT apparatus, and an image obtained from a camera module.
  • the electronic device 101 may determine a room as a first-level hierarchy (for example, a type of room) and a storage cabinet as a second-level hierarchy (for example, furniture disposed in the room).
  • the electronic device 101 based on the determined hierarchical level of the object, selects a hierarchy (eg, a tree structure) of a memo in which an object included in the currently acquired image is pre-stored.
  • a hierarchy eg, a tree structure
  • the electronic device 101 may compare the image currently acquired through the camera module 180 with the objects included in the image stored in correspondence with the node, and check that the electronic device 101 has changed.
  • the electronic device 101 may transmit information about an object to be added to a memo and an object to be deleted, to the user. For example, the electronic device 101 may ask the user, "There are no bags and storage boxes. Did you leave it elsewhere?", And the user may also ask, "Skirt has been added. Do you want to update?”
  • the electronic device 101 may receive a user's voice input and receive feedback for updating a memo. For example, the electronic device 101 may receive a response from the user, "Yes, the bag is discarded and the box is moved to a small room desk" in response to the question of whether the bag and the storage box are placed elsewhere. In response to receiving the user's response, the electronic device 101 may delete the bag from the memo (for example, the third level hierarchy), and the storage box may be stored on a desk of a small room, and the tree structure may be changed and stored.
  • the memo for example, the third level hierarchy
  • the electronic device 101 may generate a node for the small room of the same level as the inner room, and may add a desk to the lower level of the small room. Finally, the storage box can be stored at a lower level for the desk.
  • the electronic device 101 may update the memo without the explicit request of the user. For example, based on an image acquired while the user is photographing another area through the camera module, the memo may be automatically compared with image information included in the memo previously stored. Alternatively, at least one image information may be obtained from IoT devices located in a smart home environment, and the memo may be automatically updated through the AI hub device. The electronic device 101 may notify the changes of the automatically detected memo, and may ask the user whether to update the corresponding changes. Thereafter, the electronic device 101 may receive an update approval input from the user and complete the memo update. Of course, the electronic device 101 may automatically update the memo without inputting the user's update approval.
  • FIG. 8 is a diagram illustrating a method of recognizing an object based on at least one of image and sensor information of an electronic device according to various embodiments of the present disclosure.
  • the electronic device 101 automatically detects an area of the objects 811 through 817 through an object recognition technology, and identifies a category (eg, a bag, Jackets, holders, blouses, etc.).
  • the electronic device 101 may determine a level of hierarchy of the recognized object and store information about the recognized object according to the determined hierarchy level. Through this, even if the user of the electronic device 101 does not directly input and classify the contents of the object, the memo may be easily stored, updated, and retrieved through automatically recognized object information (eg, category, hierarchy, etc.). have.
  • 9A to 9B illustrate a method of storing a memo associated with a specific space of an electronic device through augmented reality according to various embodiments of the present disclosure.
  • the electronic device 101 may acquire an image from the camera module 180.
  • the electronic device 101 may measure the depths of the objects included in the acquired image. In general, although the depth of the object is measured using a depth camera, it may not be easy to have a separate depth camera in the electronic device 101 such as a smart phone for miniaturization of a product.
  • the electronic device 101 may extract only the RGB image 910 from the image information and obtain a depth map 920 based on this.
  • the electronic device 101 may obtain plane information (eg, 931 to 939) existing in the image information, based on the obtained depth map 920.
  • the electronic device 101 may identify an area where the augmented reality memo may be attached using the acquired plane information.
  • the electronic device 101 may execute an augmented reality memo application.
  • a memo-capable area 941 and memo contents 943 (for example, an object extracted from image information) may be displayed.
  • the electronic device 101 may display the memo-capable area 941 and the memo contents 943 together on a screen as shown in FIG. 940.
  • the electronic device 101 may independently display the memotable area 941 or the memo contents 943, and then display the remaining items that are not displayed according to a subsequent user input.
  • the electronic device 101 may display memo contents 943 corresponding to the corresponding area in response to an input of the user selecting the memoable area 941. have. If the memo contents 943 are displayed first, the electronic device 101 may display a memo-capable area 941 for displaying the memo contents in response to an input of the user selecting the memo contents 943. have.
  • the electronic device 101 drags a plate and a cup 951 from the user to the kitchen shelf area 955 while the memoable area 941 and the memo contents 943 are displayed together. 953).
  • the input for connecting the memotable area 941 and the memo contents 943 is not limited to the drag input 953 described above.
  • the user may match the memo contents 943 and the memoable area 941 through a tap touch input. Accordingly, the electronic device 101 may provide the user with an augmented reality memo that the plate and the cup 951 are positioned in the kitchen shelf area 955.
  • FIG. 10 is a diagram illustrating a method of showing a memo recorded through an augmented reality of an electronic device to a user according to various embodiments of the present disclosure.
  • the electronic device 101 may provide at least one augmented reality memo to a user.
  • the electronic device 101 may store the augmented reality memo by matching the area where the object is located with the object through the memo generation module 310 and provide the same to the user.
  • the electronic device 101 may include winter clothes 1011 and 1019, autumn clothes 1013, kids clothes 1015, tissue and kitchen towels 1017, and cleaners 1020 to which augmented reality memos are attached. It can tell you that you are in an area.
  • the electronic device 101 may freely utilize text, emoticons, images, sounds, or vibrations in storing and storing the augmented reality memo in combination with a specific area.
  • the electronic device 101 may not only display a memo paper but also set a predetermined image or melody to be output.
  • FIG. 11 is a diagram illustrating a method of checking a memo in stages through an augmented reality of an electronic device according to various embodiments of the present disclosure.
  • the electronic device 101 may display a second step of augmented reality memo (for example, an image of a cabinet in a closed state or a text memo of a storage cabinet).
  • a second step of augmented reality memo for example, an image of a cabinet in a closed state or a text memo of a storage cabinet.
  • the electronic device 101 augments the third step in response to an input (for example, a gesture of touching a cabinet or expanding a cabinet) to enter a lower level of a user.
  • a reality memo eg, the cabinet images 1111 to 1117 with the door open or text information about each object with the door open
  • the electronic device 101 augments a fourth step in response to an input (for example, a gesture of touching a storage box or expanding a storage box) to enter a lower level of a user.
  • a real memo eg, the box image 1121 with the lid open or text information about each object with the lid open
  • the user of the electronic device 101 can check easily and easily what objects are located inside the user even if the user does not open the cabinet door or open the lid of the cabinet.
  • FIG. 12 is a diagram illustrating a method for an electronic device to recognize a noteable area and to provide a virtual memo board in a corresponding area according to various embodiments of the present disclosure.
  • the electronic device 101 may recognize a virtual area to display a memo. For example, the electronic device 101 may obtain a depth map and check the depth information of the background based on the depth map. The electronic device 101 may obtain plane information for displaying an augmented reality memo based on the depth information. The electronic device 101 may determine the obtained surface information as the memo area 1212 and 1214, and may provide virtual memo boards 1221 and 1223 to the selected surface. Although not the object information obtained by analyzing the image, the electronic device 101 may store and display the augmented reality memo boards 1221 and 1223 in association with a specific space.
  • the electronic device 101 may display a list of tasks to be performed by the user on the memo board 1221, and display calendar and schedule information on the memo board 1223.
  • a user of the electronic device 101 may share an augmented reality memo board with a user of another electronic device.
  • the augmented reality memo board may be controlled to be visible only by an electronic device (eg, an electronic device used by a family member) designated by the user by the user's setting.
  • the augmented reality memo board containing personal information may be checked only through the user's electronic device 101 to increase security. Since the augmented reality memo board is a virtual image that does not exist in the actual background, it may be very useful in maintaining cleanness and simplicity in appearance and allowing the user to easily check contents to be remembered.
  • FIG. 13 is a diagram illustrating a method of searching for a memo centering on a user through an electronic device according to various embodiments of the present disclosure
  • the user of the electronic device 101 may check the memo recorded at the current location of the user even if the user does not directly move to the space where the memo is left. That is, the user of the electronic device 101 can easily check the location of the object corresponding to the memo left by the user from the user's point of view.
  • the electronic device 101 may receive a voice input for confirming where the cleaner is. For example, the electronic device 101 may receive a voice input "Where is the cleaner?" From the user. The electronic device 101 may hierarchically check the location of the cleaner stored in the memo (eg, a house-balcony-cleaner) in response to a user's voice input and provide a response. For example, the electronic device 101 may reply, "The cleaner is on the balcony.” In addition, referring to FIG. 13, the electronic device 101 may display location information 1301 of a cleaner disposed on a balcony by utilizing a structural diagram of a house.
  • the electronic device 101 may display location information 1301 of a cleaner disposed on a balcony by utilizing a structural diagram of a house.
  • the structural diagram of the house may be stored in the memory 130 of the electronic device 101 or obtained through the electronic devices 102 and 104 or the server 108. If a structure diagram corresponding to the house where the user is located cannot be obtained, at least one piece of information obtained from the camera module 180 of the electronic device 101 or other object devices in the smart home environment is aggregated. A schematic may be generated, and the location of the cleaner may be displayed on the generated schematic.
  • the electronic device 101 may utilize a camera of an external electronic device (eg, a mini robot, a TV, a security camera, etc.) to check the augmented reality memo located in the home room despite the user being in the living room. can do.
  • the electronic device 101 may obtain image information from a camera of the external electronic device in response to a user input.
  • the electronic device 101 may provide a user with an augmented reality memo associated with a specific space included in the corresponding image. In this way, the user of the electronic device 101 may check the augmented reality memo combined with the reality background even if the user does not move directly.
  • the electronic device 101 may provide an augmented reality memo or a video memo to the user by utilizing the image information stored in the memo providing system 300.
  • An electronic device may include a display; Camera module; And a processor, wherein the processor acquires, through the camera module, a first image including at least one object disposed in an arbitrary space, and based on the obtained first image, the at least one Storing information about an object corresponding to the arbitrary space, obtaining a second image including at least a portion of the arbitrary space through the camera module, and based on the obtained second image, In the case of the first object included in the at least one object of the first image among the objects included in the second image, information about the first object is displayed together with the second image through the display, and In the case of the second object which is not included in the at least one object of the first image among the objects included in the second image, information about the second object may be provided. At least one operation of the operation of storing in response to can be carried out.
  • the information about the at least one object may include information obtained based on a voice input received from a user of the electronic device.
  • the information about the at least one object may include spatial information in which the at least one object is disposed, location information of the at least one object, category information, hierarchical information, color information, and user input information associated with the at least one object. It may include at least one of.
  • the processor may be configured to store the first pre-stored corresponding to the predetermined space in the case of a third object which is not included in the second image among the at least one object of the first image based on the acquired second image. 3 You can delete information about an object.
  • the processor When the processor stores the information about the second object in correspondence with the arbitrary space or deletes the information about the third object in correspondence with the arbitrary space, the processor checks whether the user permits it. And in response to receiving a confirmation from the user, information about the second object or the third object may be updated.
  • the processor may store the second object or the third object when storing information about the second object in correspondence with the arbitrary space or deleting information about the third object in correspondence with the arbitrary space. And update information regarding the second object or the third object to the user.
  • the processor through the camera module, recognizes a plurality of objects arranged in the arbitrary space, generates layered information of the plurality of objects, and the layered information is classified into the first layer by the plurality of objects. Or the plurality of objects may be classified into the first layer and a second layer different from the first layer.
  • the processor may recognize at a time through an object corresponding to the first layer and an object corresponding to the second layer through the camera module.
  • the processor is further configured to receive a hierarchical change input from a user and to receive the hierarchical change input while displaying information about an object corresponding to the first layer with the second image through the display.
  • the information on the object corresponding to the second layer is displayed instead of the information on the object corresponding to the first layer, and the layer change input includes the voice input of the user, the gesture input of the user, and the It may include at least one of the touch input associated with the information about the object corresponding to the first layer of the user.
  • the information about the object corresponding to the first layer or the second layer may include information about an object having a high frequency of use among at least one object classified into the first layer or the second layer, the first layer, or the second layer. And at least one of information about an object having a high frequency of search among at least one object classified as, and thumb nail information about at least one object classified as the first layer or the second layer. .
  • a method of an electronic device may include: acquiring a first image including at least one object disposed in an arbitrary space through a camera module of the electronic device; Storing information about the at least one object corresponding to the arbitrary space based on the obtained first image; Acquiring, by the camera module, a second image including at least a portion of the arbitrary space; And a first object included in the at least one object of the first image among the objects included in the second image, based on the obtained second image, through the display. Displaying information together with the second image; And in the case of a second object among the objects included in the second image, which is not included in the at least one object of the first image, storing information about the second object corresponding to the arbitrary space.
  • the operation may include performing at least one operation.
  • the information about the at least one object may include information obtained based on a voice input received from a user of the electronic device.
  • the information about the at least one object may include spatial information in which the at least one object is disposed, location information of the at least one object, category information, hierarchical information, color information, and user input information associated with the at least one object. It may include at least one of.
  • the third object may be stored in correspondence to the arbitrary space. It may include deleting information.
  • the second object or the third object when storing the information about the second object corresponding to the arbitrary space or deleting the information about the third object corresponding to the arbitrary space. Updating information about the object; And providing the user with update information about the second object or the third object.
  • the layering information includes information in which the plurality of objects are classified into a first layer, or wherein the plurality of objects are different from the first layer and the first layer.
  • the information classified into the second layer may be included.
  • the camera module may include an operation of recognizing an object corresponding to the first layer and an object corresponding to the second layer at a time.
  • the information about the object corresponding to the first layer or the second layer may include information about an object having a high frequency of use among at least one object classified into the first layer or the second layer, the first layer, or the second layer. And at least one of information about an object having a high frequency of search among at least one object classified as, and thumb nail information about at least one object classified as the first layer or the second layer. .

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computer Graphics (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

다양한 실시 예에 따른 전자 장치에 있어서, 디스플레이; 카메라 모듈; 및 프로세서를 포함하고, 상기 프로세서는, 상기 카메라 모듈을 통하여, 특정 영역을 포함하는 제1 영상을 획득하고, 상기 제1 영상을 기반으로, 상기 제1 영상에 포함된 적어도 하나의 객체에 관한 정보를 저장하고, 상기 카메라 모듈이 상기 특정 영역의 적어도 일부 영역을 포함하는 제2 영상을 획득하는 경우, 상기 제2 영상을 기반으로, 상기 제2 영상에 포함된 적어도 하나의 객체에 관한 정보를 획득하고, 상기 디스플레이를 통해, 상기 제1 영상에 포함된 적어도 하나의 객체에 관한 정보 중 상기 제2 영상에 포함된 적어도 하나의 객체에 대응하는 정보와 일치하는 정보를 상기 제2 영상과 함께 표시하고, 및 상기 제1 영상에 포함된 적어도 하나의 객체에 관한 정보 중 상기 제2 영상에 포함된 적어도 하나의 객체에 대응하는 정보와 일치하지 않은 정보를 상기 특정 영역의 적어도 일부 영역에 대응하여 저장하도록 설정될 수 있다. 이 밖의 다른 실시 예도 가능하다.

Description

카메라 모듈을 통해 획득한 영상에 기반하여 정보를 저장하는 방법 및 이를 사용하는 전자 장치
본 발명의 다양한 실시 예는 카메라 모듈을 통해 획득한 영상에 기반하여 정보를 저장하는 방법 및 이를 사용하는 전자 장치에 관한 것이다.
전자 장치(예: 스마트 폰, 스마트 글래스 등)는 증강 현실(augmented reality, AR)을 통해 사용자에게 새로운 경험을 제공할 수 있다. 예를 들어, 전자 장치는 현실의 배경에 가상의 객체를 겹쳐서 하나의 영상으로 보여줄 수 있다.
사용자는 무엇인가를 기억하기 위해 메모를 활용할 수 있다. 예를 들어, 사용자가 직접 손으로 메모지에 기록하여 특정 공간에 붙여놓을 수 있다. 다른 예를 들어, 사용자는 전자 장치의 메모 어플리케이션을 통해 메모를 기록할 수 있다. 사용자가 메모지를 활용하는 경우에는, 외관 상 메모지들이 붙어 있는 모습이 지저분하게 보일 수 있다. 사용자가 메모 어플리케이션을 통해 영상(예: 동적 영상(moving image), 정적 영상(still image), 텍스트 등을 기록하는 경우에는 해당 메모의 특정 공간과의 관련성을 강조하기 어려운 면이 있다. 일반적인 메모 어플리케이션의 경우, 메모된 시간 순으로 나열되며, 사용자는 과거에 자신이 했던 메모를 메모 이후에 잊어버리게 되는 경우가 종종 발생할 수 있다.
또한, 상기 메모지 또는 메모 어플리케이션을 활용하는 경우, 메모의 수정 또는 갱신이 어려운 면이 있다. 메모지를 활용하는 경우에는, 메모된 내용을 수정하려면 다른 도구(예: 지우개, 수정액 등)를 사용해야 하며 수정을 하더라도 수정된 메모지가 지저분하게 보여질 수 있다. 메모 어플리케이션을 활용하는 경우에는, 메모된 내용을 일일이 삭제 버튼을 통해 지우고, 사용자가 직접 재 입력해야 하는 번거로움이 발생할 수 있다. 더욱이, 메모 어플리케이션 상에서, 메모를 계층적으로 구분하여 저장하기에는 사용자가 직접 입력해야 하는 데이터의 양이 많으므로 상당한 시간이 소요될 수 있다. 결과적으로, 전자 장치의 사용자는 특정 공간과 연관된 계층적 메모를 짧은 시간 내 쉽고 간편하게 저장하고 관리하기에는 어려움이 따를 수 있다.
다양한 실시 예에 따른 전자 장치는 디스플레이; 카메라 모듈; 및 프로세서를 포함하고, 상기 프로세서는, 상기 카메라 모듈을 통하여, 임의의 공간에 배치된 적어도 하나의 객체를 포함하는 제1 영상을 획득하고, 상기 획득된 제1 영상을 기반으로, 상기 적어도 하나의 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하고, 상기 카메라 모듈을 통하여, 상기 임의의 공간의 적어도 일부를 포함하는 제2 영상을 획득하고, 및 상기 획득된 제2 영상을 기반으로, 상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함된 제1 객체의 경우, 상기 디스플레이를 통하여, 상기 제1 객체에 관한 정보를 상기 제2 영상과 함께 표시하고, 및 상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함되어 있지 않은 제2 객체의 경우, 상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작 중 적어도 하나의 동작을 수행할 수 있다.
다양한 실시 예에 따른 전자 장치의 방법은 상기 전자 장치의 카메라 모듈을 통하여, 임의의 공간에 배치된 적어도 하나의 객체를 포함하는 제1 영상을 획득하는 동작; 상기 획득된 제1 영상을 기반으로, 상기 적어도 하나의 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작; 상기 카메라 모듈을 통하여, 상기 임의의 공간의 적어도 일부를 포함하는 제2 영상을 획득하는 동작; 및 상기 획득된 제2 영상을 기반으로, 상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함된 제1 객체의 경우, 상기 디스플레이를 통하여, 상기 제1 객체에 관한 정보를 상기 제2 영상과 함께 표시하는 동작; 및 상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함되어 있지 않은 제2 객체의 경우, 상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작 중 적어도 하나의 동작을 수행하는 동작을 포함할 수 있다.
본 발명의 다양한 실시 예에 따르면, 전자 장치는 사용자에게 증강 현실을 통한 메모 기능을 제공할 수 있다. 전자 장치의 사용자는 증강 현실을 통해 특정 공간과 연관된 메모를 기록할 수 있다. 해당 메모는 현실의 배경에는 실존하지 않으며, 전자 장치를 통해 사용자에게 제공될 수 있다. 이에 따라, 사용자의 주변 환경이 외관 상 보다 심플해질 수 있다. 전자 장치의 사용자는 영상 촬영, 사용자의 음성 입력, 및 사물 인터넷(internet of things) 정보 중 적어도 하나를 활용하여 계층적 메모를 짧은 시간 내 쉽고 간편하게 기록할 수 있다.
전자 장치는 촬영된 영상 자체를 단순히 저장하는데 그치지 않고, 영상에 포함된 복수의 사물들을 객체화하여 인식 및 저장할 수 있다. 이와 더불어, 전자 장치는 영상 촬영, 사용자의 음성 입력, 및 사물 인터넷 정보 중 적어도 하나를 활용하여 메모의 수정 또는 갱신을 보다 간편하게 수행할 수 있다. 예를 들어, 전자 장치는 기존 메모에 활용된 영상과 최근에 촬영된 영상을 인공지능(artificial intelligence, AI)을 통해 비교할 수 있으며, 영상의 대조만으로 기존 메모를 수정 또는 갱신할 수 있다. 이에 따라, 전자 장치의 사용자는 특정 공간과 연관된 계층적 메모를 짧은 시간 내 쉽고 간편하게 저장할 수 있다.
전자 장치의 사용자는 메모를 확인하기 위해 반드시 해당 메모 앞에 찾아간다거나, 복수의 메모 중 어떤 메모가 필요한 정보인지 뒤적일 필요 없이 직관적으로 계층적으로 분류된 메모 정보를 검색을 통해 확인할 수 있다. 사용자는 음성, 텍스트, 영상 등의 정보를 전자 장치에 입력하여 검색을 수행할 수 있다.
도 1은 본 발명의 다양한 실시 예에 따른 네트워크 환경 내의 전자 장치의 블록도이다.
도 2는 본 발명의 다양한 실시 예에 따른 스마트 홈 환경에 관한 도면이다.
도 3은 본 발명의 다양한 실시 예에 따른 메모 제공 시스템을 개략적으로 나타낸 블록도이다.
도 4는 본 발명의 다양한 실시 예에 따른 사용자가 메모를 기록하려는 특정 공간에 관한 정보를 계층적으로 분류한 예를 나타낸 도면이다.
도 5A 내지 5D는 본 발명의 다양한 실시 예에 따른 영상을 통해 메모를 계층적으로 저장하는 방법을 설명하기 위한 도면이다.
도 6은 본 발명의 다양한 실시 예에 따른 전자 장치가 사용자와의 상호 작용을 통해 메모를 생성하기 위한 방법에 관한 흐름도이다.
도 7은 본 발명의 다양한 실시 예에 따른 전자 장치가 사용자와의 상호 작용을 통해 메모를 업데이트 하기 위한 방법에 관한 흐름도이다.
도 8은 본 발명의 다양한 실시 예에 따른 전자 장치의 영상 및 센서 정보 중 적어도 하나에 기반하여 객체를 인식하는 방법을 나타내는 도면이다.
도 9A 내지 9B는 본 발명의 다양한 실시 예에 따른 전자 장치의 특정 공간에 연관된 메모를 증강 현실을 통해 저장하는 방법을 나타낸 도면이다.
도 10은 본 발명의 다양한 실시 예에 따른 전자 장치의 증강 현실을 통해 기록된 메모를 사용자에게 보여주는 방법을 나타내는 도면이다.
도 11은 본 발명의 다양한 실시 예에 따른 전자 장치의 증강 현실을 통해 메모를 확인할 수 있는 방법을 나타내는 도면이다.
도 12는 본 발명의 다양한 실시 예에 따른 전자 장치가 메모 가능 영역을 인식하고, 해당 영역에 가상의 메모 보드를 제공하는 방법에 관한 도면이다.
도 13은 본 발명의 다양한 실시 예에 따른 전자 장치를 통해 사용자 중심으로 메모를 검색하는 방법을 나타낸 도면이다.
도 1은, 다양한 실시 예들에 따른, 네트워크 환경(100) 내의 전자 장치(101)의 블록도이다.
도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제 1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제 2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108)와 통신할 수 있다. 일 실시 예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 장치(150), 음향 출력 장치(155), 표시 장치(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에 서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 표시 장치(160) 또는 카메라 모듈(180))가 생략되거나, 하나 이상의 다른 구성 요소가 추가될 수 있다. 어떤 실시 예에서는, 이 구성요소들 중 일부들은 하나의 통합된 회로로 구현될 수 있다. 예를 들면, 센서 모듈(176)(예: 지문 센서, 홍채 센서, 또는 조도 센서)은 표시 장치(160)(예: 디스플레이)에 임베디드된 채 구현될 수 있다
프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)을 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일 실시 예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 로드하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비 휘발성 메모리(134)에 저장할 수 있다. 일 실시 예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 어플리케이션 프로세서), 및 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 추가적으로 또는 대체적으로, 보조 프로세서(123)은 메인 프로세서(121)보다 저전력을 사용하거나, 또는 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 표시 장치(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일 실시 예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성 요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다.
메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비 휘발성 메모리(134)를 포함할 수 있다.
프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다.
입력 장치(150)는, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 장치(150)은, 예를 들면, 마이크, 마우스, 펜, 또는 키보드를 포함할 수 있다.
음향 출력 장치(155)는 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 장치(155)는, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있고, 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일 실시 예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
표시 장치(160)는 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 표시 장치(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일 실시 예에 따르면, 표시 장치(160)는 터치를 감지하도록 설정된 터치 회로(touch circuitry), 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 센서 회로(예: 압력 센서)를 포함할 수 있다.
오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일 실시 예에 따르면, 오디오 모듈(170)은, 입력 장치(150)를 통해 소리를 획득하거나, 음향 출력 장치(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102)) (예: 스피커 또는 헤드폰))를 통해 소리를 출력할 수 있다.
센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일 실시 예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.
인터페이스(177)는 전자 장치(101)이 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일 실시 예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일 실시 예에 따르면, 연결 단자(178)은, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일 실시 예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일 실시 예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다. 카메라 모듈은 RGB, IR, TOF (time of flight) 등 각기 다른 신호를 획득하기 위한 하나 이상의 모듈 일 수 있으며, 이들의 조합 일 수 있다. 예를 들어, 카메라 모듈은 두 개의 RGB 영상을 획득하기 위한 스테레오 카메라 형태이거나 RGB와 TOF가 결합된 스테레오 카메라 일 수 있다.
전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일 실시 예에 따르면, 전력 관리 모듈(388)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(189)는 전자 장치(101)의 적어도 하나의 구성 요소에 전력을 공급할 수 있다. 일 실시 예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108))간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일 실시 예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(198)(예: 블루투스, Wi-Fi direct 또는 IrDA(infrared data association) 같은 근거리 통신 네트워크) 또는 제 2 네트워크(199)(예: 셀룰러 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부 전자 장치와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성 요소(예: 단일 칩)으로 통합되거나, 또는 서로 별도의 복수의 구성 요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 및 인증할 수 있다.
안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일 실시 예에 따르면, 안테나 모듈(197)은 하나 이상의 안테나들을 포함할 수 있고, 이로부터, 제 1 네트워크 198 또는 제 2 네트워크 199와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부 전자 장치 간에 송신되거나 수신될 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))를 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일 실시 예에 따르면, 명령 또는 데이터는 제 2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104)간에 송신 또는 수신될 수 있다. 전자 장치(102, 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 일 실시 예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부 전자 장치들(102, 104, or 108) 중 하나 이상의 외부 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다.
본 문서에 개시된 다양한 실시 예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치 (예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시 예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.
본 문서의 다양한 실시 예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시 예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나,""A, B 또는 C," "A, B 및 C 중 적어도 하나,"및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.
본 문서에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로 등의 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일 실시 예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 문서의 다양한 실시 예들은 기기(machine)(예: 전자 장치(101)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(136) 또는 외장 메모리(138))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(140))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(101))의 프로세서(예: 프로세서(120))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장매체 는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서,'비일시적'은 저장매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일 실시 예에 따르면, 본 문서에 개시된 다양한 실시 예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들(예: 스마트폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시 예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있다. 다양한 실시 예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시 예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.
도 2는 본 발명의 다양한 실시 예에 따른 스마트 홈 환경에 관한 도면이다.
다양한 실시 예에 따르면 도 2는 스마트 홈 환경 200을 도시한다.
다양한 실시 예에 따르면, 스마트 홈 환경은, 하나 이상의 카메라들(221, 223, 225, 227, 229, 또는 231), 하나 이상의 센서 또는 센서를 포함하는 장치들(예: 플로어 마이크(233, 235, 237, 또는 239), 안방 사물(침대 241, 스탠드 243), 주방 사물(냉장고 251, 커피 머신 253, 전등들 255), 거실 사물(TV 261, 쇼파 263, 전등 265), 현관 사물(문 271, 전등 273), 창문 275, 전자 장치 280 (예: 도 1의 전자 장치(101)), 네트워크 285 (예: 도 1의 네트워크(199)), 하나 이상의 외부 서버들 291, 295 (예: 도 1의 서버(108))를 포함할 수 있다. 예를 들어, 상기 전자 장치 280은 인공지능 스피커에 해당할 수 있다. 또는, 인공지능 스피커를 제어하거나 연동하여 동작하는 전자 장치를 포함할 수 있다.
다양한 실시 예에 따르면, 전자 장치 280은, 하나 이상의 카메라들(221~231) 중 적어도 하나를 이용해서, 사람이 어디에 위치하는지를 감지할 수 있다. 예컨대, 전자 장치 280은, 카메라 227을 통하여, 문을 통하여 집으로 들어오는 사람 또는 나가는 사람을 감지할 수 있다. 또는 전자 장치 280은, 카메라 223, 225, 229, 231을 통하여, 지정된 위치(예: 안방, 주방, 거실, 현관)에 들어오는 사람, 나가는 사람, 머무는 사람을 감지할 수 있다. 다른 실시 예에 따르면, 전자 장치 280은, 카메라 221을 통하여, 집 주변을 맴돌거나 집에 침입하는 사람을 감지할 수 있다. 또한, 전자 장치 280은, 하나 이상의 카메라들(221~231) 중 적어도 하나를 이용해서, 사용자를 식별할 수 있다. 예컨대, 전자 장치 280은, 지정된 사람(예: 거주자)인지, 또는 지정되지 않은 사람(예: 침입자 또는 손님)인지를 식별할 수 있다.
다양한 실시예에 따르면, 전자 장치 280은, 복수의 플로어 마이크들(233~239)을 통하여, 사람이 어디에 위치하는지를 감지할 수 있다. 예컨대, 전자 장치 280은, 플로어 마이크 233에서 획득되는 발자국 소리에 기반하여, 사람이 안방에 있다고 판단할 수 있다. 또한, 전자 장치 280은, 플로어 마이크 233에서 획득되는 발자국 소리의 특징(예: 강도, 패턴, 주파수 등)을 이용하여, 사전에 획득된 사람의 걸음걸이의 특징들과 비교하여, 사람을 식별할 수 있다. 예컨대, 아빠, 엄마, 아기로 구성된 가족이라 가정하면, 전자 장치 280은, 소리가 가장 크고, 걸음간의 시간 간격이 약 1~2초 내외이면, 아빠로 판단할 수 있다. 전자 장치 280은, 소리가 중간 크기이고, 걸음간의 시간 간격이 약 2~3초 내외이면 엄마로 판단할 수 있다. 전자 장치 280은, 소리가 작은 크기이고, 걸음간의 시간 간격이 약 1~2초 내외이면 아기로 판단할 수 있다. 예를 들면, 걸음간의 거리 간격, 왼발에서 오른발로 가는 특징과, 오른발에서 왼발로 가는 특징 등 다양한 특징들을 이용하여, 사람을 구별할 수 있다. 예를 들면, 학습되지 않은 발걸음 특징 또는 지정된 발걸음 특징이 획득되면, 전자 장치 280은, 침입자가 침입했을 수 있다고 판단할 수 있다.
다양한 실시 예에 따르면, 전자 장치 280은, 복수의 플로어 마이크를 이용하여, 사람의 위치를 판단할 수 있다. 예컨대, 전자 장치 280은, 플로어 마이크 233, 235, 237을 통해서 삼각 측량법을 이용하여, 플로어 마이크 233, 235, 237으로부터의 거리를 구하여, 사람의 위치를 보다 자세히 판단할 수 있다. 예컨대, 전자 장치 280은, 거실에서, 사람이 TV 261 또는 쇼파 263 중 어느 쪽에 더 가까이 위치 또는 접근하는지 판단할 수 있다. 또는, 전자 장치 280은, 주방에서, 사람이 냉장고 251 또는 커피머신 253 중 어느 쪽에 더 가까이 위치 또는 접근하는지 판단할 수 있다. 또는, 전자 장치 280은, 사람이 주방에서 안방으로, 주방에서 거실로 이동하는 방향을 판단할 수 있다. 한 실시 예에 따라, 플로어 마이크를 예시로 들었지만, 마이크는, 다양한 사물에 존재할 수 있다. 예를 들면, 천장 설치형, 조명 설치형, 가구 설치형, 가전 제품 설치형 등 다양한 곳에 존재할 수 있다.
다양한 실시 예에 따르면, 전자 장치 280은, 침대 241, 스탠드 243, 냉장고 251, 커피 머신 253, 티비 261, 쇼파 263 등 다양한 사물로부터 수신하는 정보에 기반하여, 사용자의 위치를 판단할 수 있다.
다양한 실시 예에 따르면, 침대 241 또는 소파 263은, 모션 센서, 무게 센서, 가속도 센서, 또는 커패시턴스 센서, 압력 센서 중 적어도 하나를 포함할 수 있다. 스탠드 243은 모션 센서를 포함할 수 있으며, 스탠드 243의 On/Off 정보를 제공할 수 있다. 냉장고 251은 모션 센서, 카메라, 문 열림 센서, 가속도 센서 등을 포함할 수 있으며, 문의 열림/닫힘 정보, 무엇을 넣고 빼내는지에 관한 정보 등을 제공할 수 있다. 커피 머신 253은 모션 센서를 포함할 수 있으며, 커피 머신 253의 On/Off 정보, 커피의 종류에 관한 정보, 커피의 온도에 관한 정보 등을 제공할 수 있다. 조명 255, 265, 273은, 모션 센서를 포함할 수 있으며 조명 255, 265, 273의 On/Off 정보를 제공할 수 있다. TV 261은 모션 센서, 카메라, 마이크를 포함할 수 있으며, TV 261의 On/Off 정보, 콘텐츠 이용 정보 등을 제공할 수 있다. 문 271 또는 창문 275은, 모션 센서, 가속도 센서, 문 열림 센서, 생체 정보 센서 등을 포함할 수 있으며, 열림/닫힘 정보, 객체의 출입 정보, 외부 침입 정보 등을 제공할 수 있다.
다양한 실시 예에 따르면, 하나 이상의 센서 또는 센서를 포함하는 장치들은, 무선 통신 장치를 포함할 수 있고, 사용자의 휴대 전자 장치(예: 핸드폰, 스마트 팔지 등)로부터 수신되는 무선 신호를 수신하여, 이에 대한 정보를 제공할 수 있다.
다양한 실시 예에 따르면, 전자 장치 280은, 다양한 제공된 정보를 이용하여, 사용자의 위치를 판단할 수 있고, 사용자를 식별할 수 있다. 전자 장치 280은, 다양한 제공된 정보를, 서버 291을 이용하여, 사용자의 위치를 판단할 수 있고, 사용자를 식별할 수 있다. 또한, 전자 장치 280은, 다양한 제공된 정보를, 서버 291에게 제공할 수 있다.
다양한 실시 예에 따르면, 전자 장치 280은, 현재 작동중인 전자 기기, 현재 시간, 학습된 사용자의 생활 패턴 등 추가적인 정보를 이용하여, 센서의 설정을 결정할 수 있다. 예컨대, 전자 장치 280은, 안방에 사용자가 있는데, 불은 꺼져있고, 침대의 센서를 통해서 사용자가 지정된 시간 이상 누워있다면, 사용자가 수면 중이라고 판단할 수 있다. 전자 장치 280은, 수면 설정(예: 초저녁엔 약 20분당 1회, 새벽녘엔 약 5분당 1회)으로 센서의 설정을 결정할 수 있다.
다양한 실시 예에 따르면, 전자 장치 280은, 안방에 연관된 센서들 중 센싱을 할 센서의 종류를 판단할 수 있다. 전자 장치 280은, 현재 작동중인 전자 기기, 시간과 학습된 사용자의 생활 패턴 등 추가적인 정보를 이용하여, 센싱을 할 센서의 종류를 판단할 수 있다. 예를 들면, 전자 장치 280은, 주방과 거실에도 수면 설정을 적용할 수 있다. 또한, 수면 설정 중일 때에는, 거실과 주방 등은 감시 설정으로 설정될 수 있다. 카메라와 모션 센서 중 하나만 센싱하도록 설정될 수 있다.
다양한 실시 예에 따르면, 전자 장치 280은, 사용자의 휴대 단말 또는 태블릿 또는 웨어러블 전자 장치를 포함할 수 있다. 또는 전자 장치 280은, TV, 냉장고, 셋탑 박스, 게임기 등 다양한 전자 장치에 포함될 수 있다. 또한, 설명의 편의를 위해서, 전자 장치 280이 별도로 구성된 예시를 들었지만, 전자 장치 280의 기능들은, 각각의 다양한 사물 또는 전자 장치에 각각 또는 적어도 하나에 포함될 수 있다.
다양한 실시 예에 따르면, 도 2는 스마트홈 환경에서의 전자 장치(예: 인공지능 스피커)의 동작을 예시하였지만, 이는 스마트홈에 제한되지 않고, 다양한 환경(예: 빌딩 내 또는 옥외 등)에서도 적용이 가능하다. 또한, 인공지능 스피커라 하였지만, 인공지능이라는 용어에 구속되지 않는 다양한 전자 기기를 포함할 수 있다. 또한, 도 2의 서버(291, 295)는 도 1의 108에, 네트워크(285)는 도 1의 199에 대응될 수 있다.
다양한 실시 예에 따르면, 사용자는 스마트 홈 환경에서, 메모의 생성, 검색, 출력을 위해 적어도 하나의 전자 장치와 인터랙션 할 수 있다. 사용자는 음성 입력, 그래픽 유저 인터페이스(graphic user interface, GUI)를 이용하여 전자 장치와 소통하고, 영상 정보를 얻기 위해서 스마트 홈 환경 내 위치한 전자 장치(예: 스마트 폰, 스마트 TV, 보안 카메라, 냉장고 등)의 카메라를 활용할 수 있다. 또한, 미니 로봇과 같은 전자 장치는 사용자의 동선을 보완할 수 있다. 사용자가 스마트 폰과 같은 전자 장치를 휴대하고 있지 않는 상황에서 사용자는 미니 로봇을 통해 적어도 하나의 정보를 입력 또는 획득할 수 있다. 미니 로봇과의 인터랙션은 음성 입력이 주가 될 수 있으며, 미니 로봇에 장착된 카메라를 활용하여 메모의 생성 및 업데이트에 사용할 영상 정보를 획득할 수 있다.
사용자가 생성한 정보들은 스마트 폰과 같은 전자 장치에 저장되거나 또는, 스마트 홈 환경 내의 인공지능 허브 기기(예: 인공지능 스피커)에 저장될 수도 있다. 이 경우, 해당 정보들은 인공지능 허브 기기의 보안 영역에 저장될 수 있다. 인공지능 허브 기기는 스마트 폰 및 미니 로봇의 부족한 컴퓨팅 리소스을 보완해줄 수 있으며, 음성 인식, 영상 인식에 필요한 인식 모델이 탑재되어 인식 모델을 이용한 인식 기능을 수행할 수도 있다. 인공지능 허브 기기(예: 도 2의 전자 장치 280)의 인식 결과는 스마트 폰 및 미니 로봇과 같은 스마트 홈 환경에 포함된 전자 장치에게 전송될 수 있다. 한편, 인식 모델은 외부 서버(예: 클라우드 서버, 도 2의 서버(291, 295))를 통해 업데이트 될 수 있다. 음성, 영상 인식은 외부 서버에서 인식 기능을 수행할 수도 있다. 이 경우 인식 결과는 인공지능 허브 기기를 통해 사용자 스마트기기 혹은 집안 내의 IoT 기기들에 전달 될 수 있다. 혹은 인공지능 허브 기기를 통하지 않고 사용자 스마트기기 혹은 IoT기기들에 직접 전달될 수 있다.
도 3은 본 발명의 다양한 실시 예에 따른 메모 제공 시스템을 개략적으로 나타낸 블록도이다.
다양한 실시 예에 따르면, 전자 장치(101)는 메모 제공 시스템(300)을 통해 메모를 생성하고, 업데이트 하며, 검색하고, 표시할 수 있다. 예를 들어, 메모 제공 시스템(300)은 메모 생성 모듈(310), 메모 업데이트 모듈(320), 메모 표시 모듈(330), 메모 검색 모듈(340)을 포함할 수 있다.
다양한 실시 예에 따르면, 메모 생성 모듈(310)은 사용자의 음성 입력, 영상 등의 정보를 기반으로 메모를 생성할 수 있다. 여기서, 영상은 동적 영상(moving image) 또는 정적 영상(still image)를 포함할 수 있다. 예를 들어, 사용자는 메모 생성의 시작과 종료, 메모에 포함될 객체에 관한 정보 등을 음성으로 입력할 수 있다. 예를 들어, 메모 생성 모듈(310)은 영상 정보를 얻기 위해서 스마트 홈 환경 내 위치한 전자 장치(예: 스마트 폰, 스마트 TV, 보안 카메라, 냉장고 등)의 카메라를 활용할 수 있다. 메모 생성 모듈(310)은 획득한 영상에 포함된 객체를 인식하여, 객체에 관한 적어도 하나의 정보(예: 객체 영역, 객체 카테고리, 객체 이미지, 객체 계층 등)를 획득할 수 있다. 이를 통해, 메모 생성 모듈(310)은 전자 장치(101)의 사용자가 직접 메모 내용을 일일이 기록하지 않더라도 자동으로 인식된 정보에 기반하여 메모를 생성할 수 있다. 메모 생성 모듈(310)은 인식된 객체를 계층적으로 구분하여 저장할 수 있다. 예를 들어, 특정 객체가 어느 방에 위치하는지, 어느 가구에 위치하는지, 어느 상자에 위치하는지 등의 계층 정보를 포함하여 저장할 수 있다.
다양한 실시 예에 따르면, 메모 생성 모듈(310)은 증강 현실을 이용한 메모를 생성할 수 있다. 예를 들어, 메모 생성 모듈(310)은 메모 가능 영역 및 메모 가능 영역에 대응하는 메모 내용(예: 영상에서 인식된 객체)을 선택하여 증강 현실 메모를 생성할 수 있다. 선택은 순차적 또는 개별적으로 이루어질 수 있으며, 드래그 입력 또는 탭 터치 입력 등을 이용할 수 있다. 이에 대한 구체적인 내용은 도 8B를 참조할 수 있다.
다양한 실시 예에 따르면, 메모 업데이트 모듈(320)은 사용자의 음성 입력, 촬영된 영상 등의 정보를 기반으로 메모를 업데이트 할 수 있다. 예를 들어, 사용자는 메모 업데이트의 시작과 종료, 메모에 업데이트 될 객체에 관한 정보 등을 음성으로 입력할 수 있다. 예를 들어, 메모 업데이트 모듈(320)은 영상 정보를 얻기 위해서 스마트 홈 환경 내 위치한 전자 장치(예: 스마트 폰, 스마트 TV, 보안 카메라, 냉장고 등)의 카메라를 활용할 수 있다. 메모 업데이트 모듈(320)은 획득한 영상에 포함된 객체를 인식하여, 객체에 관한 적어도 하나의 정보(예: 객체 영역, 객체 카테고리, 객체 이미지, 객체 계층 등)를 획득할 수 있다. 메모 업데이트 모듈(320)은 업데이트의 대상이 되는 메모와 관련하여, 새로운 영상을 획득할 수 있다. 메모 업데이트 모듈(320)은 기 저장된 메모에 포함된 객체 정보와 새롭게 획득한 영상에 포함된 객체 정보를 비교할 수 있으며, 적어도 하나의 변경 사항들을 확인하여 저장할 수 있다. 메모 업데이트 모듈(320)은 사물 인식 기술을 통해 자동으로 객체의 영역을 추출하고, 객체의 카테고리를 인식할 수 있다. 이를 통해, 사용자는 직접 객체의 내용을 입력하고 분류하지 않더라도, 자동으로 인식된 객체 정보를 통해 메모를 업데이트할 수 있다.
다양한 실시 예에 따르면, 메모 표시 모듈(330)은 사용자에게 저장된 적어도 하나의 메모를 제공할 수 있다. 예를 들어, 적어도 하나의 메모는 사용자의 스마트 폰(예: 도 1의 전자 장치(101))에 저장되어 있을 수 있으며, 증강 현실을 통해 특정 영역에 결합되어 표시될 수 있다. 여기서, 증강 현실은 현실(reality)에 기반하여 정보를 추가(augmentation)로 제공하는 기술을 의미할 수 있다. 가령, 가상 현실(Virtual Reality)이 이미지, 주변 배경, 객체 모두를 가상의 이미지로 만들어 보여 주는 반면, 증강 현실은 추가되는 정보만 가상으로 만들어 사용자에게 제공할 수 있다. 즉, 증강 현실은 현실 세계의 실제 모습에 기반한다는 점에서 가상 현실과 상이한 면이 있다.
다른 예를 들어, 적어도 하나의 메모는 사용자의 스마트 폰이 아닌 스마트 홈 내 인공지능 허브 기기에 저장되어 있을 수 있으며, 사용자가 증강 현실 메모 기능을 활성화 시키는 경우, 인공지능 허브 기기에서 스마트 폰으로 전달되어 표시될 수 있다. 메모 표시 모듈(330)은 카메라 모듈(180)을 이용하여 획득한 영상에서 메모를 표시할 가상의 영역을 인식할 수 있다. 예를 들어, 메모 표시 모듈(330)은 카메라 모듈(180)을 이용하여 획득한 영상으로부터 깊이 맵(depth map)을 획득할 수 있으며, 깊이 맵에 기반하여 영상에 포함된 객체의 깊이 정보를 확인할 수 있다. 메모 표시 모듈(330)은 깊이 정보에 기반하여 증강 현실 메모를 표시할 면(plane) 정보를 획득할 수 있다.
메모 표시 모듈(330)은 획득한 면 정보를 메모 가능 영역으로 판단할 수 있으며, 선택된 면에 사용자의 메모에 대응하는 정보(예: 객체 이미지, 객체 이름, 객체 종류, 객체 카테고리, 객체 계층 등)를 증강 현실로 표시할 수 있다. 메모 표시 모듈(330)은 특정 영역(예: 옷장)에 표시 대상 객체가 다수가 존재하는 경우, 우선 특정 영역을 대표하는 영상을 사용자에게 제공할 수 있다. 이후, 사용자가 해당 대표 영상을 선택하는 경우, 특정 영역에 포함된 복수의 객체 정보를 상세히 표시할 수 있다. 여기서, 대표 영상은 사용자가 직접 지정한 객체에 관한 영상일 수 있으며, 최근에 변화가 감지된 객체에 관한 영상, 가장 오랫동안 배치된 객체에 관한 영상일 수도 있다.
다양한 실시 예에 따르면, 메모 검색 모듈(340)은 사용자의 음성 입력, 촬영된 영상 등의 정보를 기반으로 기 저장된 메모를 검색할 수 있다. 메모 검색 모듈(340)은 메모 제공 시스템(300)에 저장된 트리 구조를 활용하여, 검색 대상 객체의 계층 정보를 검색할 수 있다. 메모 검색 모듈(340)은 스마트 홈 환경 내 다른 사물 기기들로부터 적어도 하나의 정보(예: 위치 정보, 영상 정보 등)을 활용하여 메모를 검색할 수 있다.
도 4는 본 발명의 다양한 실시 예에 따른 사용자가 메모를 기록하려는 특정 공간에 관한 정보를 계층적으로 분류한 예를 나타낸 도면이다.
다양한 실시 예에 따르면, 전자 장치(101)는 메모에 포함될 복수의 객체(예: 400 내지 432)를 계층적으로 분류하여 저장할 수 있다. 메모 내용을 계층화 하는데 소요되는 사용자의 노력을 최소화 하기 위해 영상 및 음성 입력 중 적어도 하나를 활용할 수 있다. 일 실시 예에 따르면, 계층화 시 포함 관계를 이용하여, 더 넓은 관계를 지니는 카테고리를 상위 계층으로 설정할 수 있으며, 계층도(예: 트리 구조)를 활용하여 메모 정보를 저장할 수 있다. 예를 들어, 안방(400)에는 수납장(410) 및 침대(412)가 포함될 수 있다. 수납장(410)에는 재킷(420), 블라우스(422), 가방(424) 및 수납함(426)이 포함될 수 있다. 수납함(426)은 목걸이(430) 및 귀걸이(432)를 포함할 수 있다. 계층화의 수준, 깊이 또는 레벨은 전자 장치의 인공지능에 기반한 결정 또는 사용자의 필요에 따라 상이하게 구성할 수 있다. 특정 객체에 대해 다른 객체보다 다수의 레벨로 계층화하거나, 한 두 단계로 단순하게 분류할 수도 있다. 도 4에 개시된 객체의 계층 정보는 이하 도 5A 내지 5D에서 보다 상세히 기술하도록 한다.
도 5A 내지 5D는 본 발명의 다양한 실시 예에 따른 영상을 통해 메모를 계층적으로 저장하는 방법을 설명하기 위한 도면이다.
다양한 실시 예에 따르면, 도 5A는 메모의 계층 구조 중 제1 단계를 나타낼 수 있다. 예를 들어, 전자 장치(101)는 카메라 모듈(180)을 이용하여, 안방(400)에 관한 영상을 획득하고, 획득된 영상에 대한 영상 인식에 기반하여 '안방'을 제1 단계의 정보로 설정할 수 있다. 다른 예를 들어, 전자 장치(101)는 사용자의 메모에 관한 음성 입력을 수신하는 것에 기반하여 계층형 메모를 저장할 수 있다. 전자 장치(101)는 사용자로부터 "여기가 내 안방이야"라는 음성 입력에 기초하여 '안방'을 제1 단계로 설정할 수 있다.
다양한 실시 예에 따르면, 도 5B는 메모의 계층 구조 중 제2 단계를 나타낼 수 있다. 예를 들어, 사용자는 전자 장치(101)의 카메라 모듈(180)을 이용하여, 수납장(410)에 관한 영상을 획득하고, 획득된 영상에 대한 영상 인식에 기반하여 '수납장'을 제2 단계의 정보로 설정할 수 있다. 다른 예를 들어, 전자 장치(101)는 사용자의 메모에 관한 음성 입력을 수신하는 것에 기반하여 계층형 메모를 저장할 수 있다. 전자 장치(101)는 사용자로부터 "저기 위치한 가구는 수납장이야"라는 음성 입력에 기초하여 '수납장'을 제2 단계로 설정할 수 있다.
다양한 실시 예에 따르면, 도 5C는 메모의 계층 구조 중 제3 단계를 나타낼 수 있다. 예를 들어, 사용자는 전자 장치(101)의 카메라 모듈(180)을 이용하여, 수납장(410) 내부에 포함된 적어도 하나의 객체(예: 재킷(420), 블라우스(422), 가방(424), 수납함(426))에 관한 영상을 획득하고, 획득된 영상에 대한 영상 인식에 기반하여 '재킷', '블라우스', '가방', '수납함'을 제3 단계의 정보로 설정할 수 있다. 다른 예를 들어, 전자 장치(101)는 사용자의 메모에 관한 음성 입력을 수신하는 것에 기반하여 계층형 메모를 저장할 수 있다. 전자 장치(101)는 사용자로부터 "수납장 안에는 재킷, 블라우스, 가방, 수납함이 들어 있어"라는 음성 입력에 기초하여 '재킷', '블라우스', '가방', '수납함'을 제3 단계로 설정할 수 있다.
다양한 실시 예에 따르면, 도 5D는 메모의 계층 구조 중 제4 단계를 나타낼 수 있다. 예를 들어, 사용자는 전자 장치(101)의 카메라 모듈(180)을 이용하여, 수납함(426) 내부에 포함된 적어도 하나의 액세서리(예: 목걸이(430), 귀걸이(432))에 관한 영상을 획득하고, 획득된 영상에 대한 영상 인식에 기반하여 '목걸이', '귀걸이'를 제4 단계의 정보로 설정할 수 있다. 다른 예를 들어, 전자 장치(101)는 사용자의 메모에 관한 음성 입력을 수신하는 것에 기반하여 계층형 메모를 저장할 수 있다. 전자 장치(101)는 사용자로부터 "수납함 안에는 목걸이, 귀걸이가 들어 있어"라는 음성 입력에 기초하여 '목걸이', '귀걸이'를 제4 단계로 설정할 수 있다.
다양한 실시 예에 따르면, 상기 도 5A 내지 5D의 실시 예에서, 전자 장치(101)는 영상 및 음성 입력 중 적어도 일부를 조합하여 사용자의 의도에 부합하는 메모를 저장할 수도 있다.
다양한 실시 예에 따르면, 전자 장치(101)의 사용자는 검색 기능을 통해, 계층 구조로 저장된 메모 내의 어떤 노드(node)의 정보도 간편하게 확인할 수 있다. 또한, 계층 구조를 통해 해당 노드 뿐만 아니라, 상위 계층의 정보도 함께 획득할 수 있어, 사용자가 알 수 있는 정보의 질과 양이 훨씬 더 풍부해질 수 있다. 예를 들어, 전자 장치(101)는 사용자로부터 "귀걸이가 어디에 있는지 알려줘"라는 음성 명령을 수신할 수 있다. 전자 장치(101)는 이러한 음성 명령에 대응하여, "안방의 수납장 안에 수납함 안에 귀걸이가 있습니다"라는 응답을 사용자에게 제공할 수 있다. 전자 장치(101)의 사용자는 이러한 계층 구조를 이용하여 자신의 니즈(needs)에 따라 원하는 레벨의 정보를 추가적으로 더 획득할 수 있다. 예를 들어, 전자 장치(101)의 사용자는 메모 정보를 상위 레벨에서부터 점차 하위 레벨로 이동하면서 보다 세부적이고 체계적인 정보를 획득할 수 있다.
도 6은 본 발명의 다양한 실시 예에 따른 전자 장치가 사용자와의 상호 작용을 통해 메모를 생성하기 위한 방법에 관한 흐름도이다.
다양한 실시 예에 따르면, 전자 장치(101)는 610 동작에서, 사용자로부터 메모 생성에 대한 입력(예: 음성 입력, 터치 입력, 버튼 입력 등)을 수신할 수 있다. 예를 들어, 전자 장치(101)는 사용자로부터 "빅스비(bixby), 이제부터 메모를 남길 거야"라는 음성 명령을 수신할 수 있다.
다양한 실시 예에 따르면, 전자 장치(101)는 620 동작에서, 메모 생성을 위한 영상을 획득할 수 있다. 전자 장치(101)는 사용자의 메모 생성을 시작하겠다는 입력에 대응하여, 메모를 생성하기 위해 필요한 적어도 하나의 컴포넌트, 모듈 등을 활성화 할 수 있다. 예를 들어, 전자 장치(101)는 카메라 모듈, 음성 인식 모듈, 영상 인식 모듈 등을 활성화 할 수 있다.
다양한 실시 예에 따르면, 전자 장치(101)는 630 동작에서, 획득한 영상에 적어도 일부 기초하여 객체를 인식할 수 있다. 전자 장치(101)는 영상 인식 모듈을 통해, 해당 영상에 포함된 적어도 하나의 객체들을 세그먼트하고 해당 객체를 인식할 수 있다.
다양한 실시 예에 따르면, 전자 장치(101)는 630 동작에서, 카메라 모듈로부터 영상을 획득하는 것과 더불어, 기록 중인 메모에 관한 적어도 하나의 정보를 수신하여 객체를 인식할 수도 있다.
다양한 실시 예에 따르면, 기록 중인 메모에 관한 적어도 하나의 정보는 사용자의 음성 입력일 수 있다. 전자 장치(101)는 카메라 모듈로부터 획득한 영상 및 사용자의 음성 입력에 기반하여 객체를 인식할 수 있다. 예를 들어, 전자 장치(101)는 사용자로부터 "여기는 내 안방이고, 저기 보이는 건 수납장이야"라는 음성 입력을 수신할 수 있다. 전자 장치(101)의 사용자는 해당 음성 입력과 함께, 전자 장치(101)를 안방의 수납장 방향으로 향하도록 제어할 수 있다. 전자 장치(101)는 카메라 모듈(180)을 통해, 영상을 획득할 수 있으며, 획득한 영상으로부터 적어도 하나의 객체(예: 안방 및 안방에 배치된 수납장)에 대해 인식할 수 있다.
다른 예를 들어, 전자 장치(101)는 사용자로부터 "수납장 문을 열면 이런 것들이 있어"라는 음성 명령을 수신할 수 있다. 상기 음성 명령을 수신하는 것에 대응하여, 전자 장치(101)는 카메라 모듈(180)을 통해 영상을 획득할 수 있으며, 획득한 영상으로부터 수납장 내 포함된 적어도 하나의 객체를 인식할 수 있다.. 또 다른 예를 들어, 전자 장치(101)는 사용자로부터 "저 수납함은 액세서리를 보관하는 상자인데, 이런 것들이 담겨 있어"라는 음성 명령을 수신할 수 있다. 상기 음성 명령을 수신하는 것에 대응하여, 전자 장치(101)는 카메라 모듈(180)을 통해 영상을 획득할 수 있고, 획득한 영상으로부터 수납장 내 포함된 적어도 하나의 객체를 인식할 수 있으며, 인식된 적어도 하나의 객체가 액세서리에 해당한다는 것을 확인할 수 있다.
다양한 실시 예에 따르면, 기록 중인 메모에 관한 적어도 하나의 정보는 사물 인터넷 기기의 사물 정보일 수 있다. 전자 장치(101)는 스마트 홈 환경에 속해 있을 수 있으며, 스마트 홈 환경 내 포함된 적어도 하나의 사물 인터넷 기기들로부터 사물 정보를 수신할 수 있다. 전자 장치(101)는 영상이 촬영되는 위치 및 영상에 포함된 적어도 하나의 객체에 관한 정보를 수신하여, 객체를 인식할 수도 있다.
다양한 실시 예에 따르면, 전자 장치(101)는 640 동작에서, 인식된 객체의 계층 수준(level of hierarchy)을 결정할 수 있으며, 인식된 객체에 관한 정보를 결정된 계층 수준에 따라 저장할 수 있다. 전자 장치(101)는 사용자의 음성 입력, 사물 인터넷 기기의 사물 정보, 및 카메라 모듈로부터 획득한 영상 중 적어도 일부에 기초하여 안방에 위치한 수납장을 인식할 수 있다. 예를 들어, 전자 장치(101)는 안방을 제1 단계 계층(예: 방의 종류)으로, 수납장을 제2 단계 계층(예: 방에 배치된 가구)으로 결정하고, 결정된 계층에 인식된 객체에 관한 정보를 저장할 수 있다.
다른 예를 들어, 전자 장치(101)는 수납장 내 포함된 적어도 하나의 객체를 제3 단계 계층으로 저장할 수 있다. 전자 장치(101)는 수납장 내 자켓, 블라우스, 가방, 수납함을 제2 단계인 수납장 보다 하위 단계인 제3 단계로 결정할 수 있으며, 결정된 계층에 인식된 객체에 관한 정보를 저장할 수 있다. 또 다른 예를 들어, 전자 장치(101)는 수납함 내 포함된 적어도 하나의 객체를 제4 단계 계층으로 저장할 수 있다. 전자 장치(101)는 수납함 내 목걸이, 귀걸이를 제3 단계인 수납함 보다 하위 단계인 제4 단계로 결정할 수 있으며, 결정된 계층에 인식된 객체에 관한 정보를 저장할 수 있다.
도 7은 본 발명의 다양한 실시 예에 따른 전자 장치가 사용자와의 상호 작용을 통해 메모를 업데이트 하기 위한 방법에 관한 흐름도이다.
다양한 실시 예에 따르면, 전자 장치(101)는 710 동작에서, 메모 업데이트에 대한 입력(예: 음성 입력, 터치 입력, 버튼 입력 등)을 수신할 수 있다. 예를 들어, 전자 장치(101)는 사용자로부터 "빅스비, 바뀐 것들이 있으면 업데이트 해줘"라는 음성 명령을 수신할 수 있다.
다양한 실시 예에 따르면, 전자 장치(101)는 720 동작에서, 메모 업데이트를 위한 영상을 획득할 수 있다. 전자 장치(101)는 사용자의 메모 업데이트를 시작하겠다는 입력에 대응하여, 메모를 업데이트 하기 위해 필요한 적어도 하나의 컴포넌트, 모듈 등을 활성화 할 수 있다. 예를 들어, 전자 장치(101)는 카메라 모듈, 음성 인식 모듈, 영상 인식 모듈 등을 활성화 할 수 있다.
다양한 실시 예에 따르면, 전자 장치(101)는 730 동작에서, 획득한 영상에 적어도 일부에 기초하여 객체를 인식할 수 있다. 전자 장치(101)는 영상 인식 모듈을 통해, 해당 영상에 포함된 적어도 하나의 객체들을 세그먼트하고 해당 객체를 인식할 수 있다.
다양한 실시 예에 따르면, 전자 장치(101)는 730 동작에서, 카메라 모듈로부터 영상을 획득하는 것과 더불어, 업데이트 중인 메모에 관한 적어도 하나의 정보를 수신하여 객체를 인식할 수도 있다.
다양한 실시 예에 따르면, 업데이트 중인 메모에 관한 적어도 하나의 정보는 사용자의 음성 입력일 수 있다. 전자 장치(101)는 카메라 모듈로부터 획득한 영상 및 사용자의 음성 입력에 기반하여 객체를 인식할 수 있다. 예를 들어, 전자 장치(101)는 사용자로부터 "안방 수납장을 열어보도록 할게"라는 음성 입력을 수신할 수 있다. 상기 음성 명령을 수신하는 것에 대응하여, 전자 장치(101)는 카메라 모듈(180)을 통해 영상을 획득할 수 있고, 획득한 영상으로부터 수납장 내 포함된 적어도 하나의 객체를 인식할 수 있다.
다양한 실시 예에 따르면, 업데이트 중인 메모에 관한 적어도 하나의 정보는 사물 인터넷 기기의 사물 정보일 수 있다. 전자 장치(101)는 스마트 홈 환경에 속해 있을 수 있으며, 스마트 홈 환경 내 포함된 적어도 하나의 사물 인터넷 기기들로부터 사물 정보를 수신할 수 있다. 전자 장치(101)는 영상이 촬영되는 위치 및 영상에 포함된 적어도 하나의 객체에 관한 정보를 수신하여, 객체를 인식할 수도 있다.
다양한 실시 예에 따르면, 전자 장치(101)는 740 동작에서, 인식된 객체의 계층 수준을 결정할 수 있다. 전자 장치(101)는 사용자의 음성 입력, 사물 인터넷 기기의 사물 정보, 및 카메라 모듈로부터 획득한 영상 중 적어도 일부에 기초하여 안방에 위치한 수납장을 인식할 수 있다. 예를 들어, 전자 장치(101)는 안방을 제1 단계 계층(예: 방의 종류)으로, 수납장을 제2 단계 계층(예: 방에 배치된 가구)으로 결정할 수 있다.
다양한 실시 예에 따르면, 전자 장치(101)는 740 동작에서, 결정된 객체의 계층 수준에 기반하여, 현재 획득한 영상에 포함된 객체가 기 저장된 메모의 계층도(예: 트리 구조)에서 어느 계층(예: 노드)에 해당하는지 확인할 수 있다. 예를 들어, 전자 장치(101)는 카메라 모듈(180)을 통해 현재 획득한 영상과 해당 노드에 대응하여 저장된 영상에 포함된 객체들을 비교하여 달라진 점을 확인할 수 있다.
다양한 실시 예에 따르면, 전자 장치(101)는 750 동작에서, 사용자에게 메모에 추가해야 될 객체 및 삭제해야 될 객체에 관한 정보를 전달할 수 있다. 예를 들어, 전자 장치(101)는 사용자에게 "가방과 수납함이 없습니다. 다른 곳에 두셨나요?"라고 문의할 수 있으며, "치마가 추가되었습니다. 업데이트 하시겠습니까?"라고도 문의할 수 있다.
다양한 실시 예에 따르면, 전자 장치(101)는 750 동작에서, 사용자의 음성 입력을 수신하여, 메모 업데이트에 필요한 피드백을 수신할 수 있다. 예를 들어, 전자 장치(101)는 가방과 수납함을 다른 곳에 두었냐는 질문에 대응하여, 사용자로부터 "응. 가방은 버렸고, 수납함은 작은방 책상으로 옮겼어"라는 응답을 수신할 수 있다. 전자 장치(101)는 사용자의 응답을 수신하는 것에 대응하여, 가방을 메모(예: 제3 단계 계층)에서 삭제할 수 있으며, 수납함은 작은방 책상에 위치하는 걸로 트리 구조를 변경하여 저장할 수 있다. 만약, 기존에 작은방과 관련된 메모 정보가 생성되지 않았다면, 전자 장치(101)는 안방과 동등한 레벨의 작은방에 관한 노드를 생성할 수 있으며, 작은방에 대한 하위 레벨로 책상을 추가할 수 있다. 마지막으로, 책상에 대한 하위 레벨로 수납함을 저장할 수 있다.
다양한 실시 예에 따르면, 전자 장치(101)는 750 동작에서, 사용자의 명시적인 요청 없이도 메모를 업데이트할 수도 있다. 예를 들어, 사용자가 카메라 모듈을 통해 다른 영역을 촬영하는 도중에 획득한 영상에 기반하여 자동으로 기 저장된 메모에 포함된 영상 정보와 비교하여 메모 업데이트를 수행할 수 있다. 또는, 스마트 홈 환경 내 위치한 사물 인터넷 기기들로부터 적어도 하나의 영상 정보를 획득할 수 있으며, 이를 인공지능 허브 기기를 통해 자동으로 메모 업데이트를 수행할 수 있다. 전자 장치(101)는 자동으로 감지된 메모의 변경 사항들을 알려줄 수 있으며, 사용자에게 해당 변경 사항들을 업데이트 하겠냐고 문의할 수 있다. 이후, 전자 장치(101)는 사용자로부터 업데이트 승인 입력을 수신하여 메모 업데이트를 완료할 수 있다. 물론, 전자 장치(101)는 사용자의 업데이트 승인 입력 없이 자동으로 메모 업데이트를 수행할 수도 있다.
도 8은 본 발명의 다양한 실시 예에 따른 전자 장치의 영상 및 센서 정보 중 적어도 하나에 기반하여 객체를 인식하는 방법을 나타내는 도면이다.
다양한 실시 예에 따르면, 도 8을 참조하면, 전자 장치(101)는 사물 인식 기술을 통해 자동으로 객체(811 내지 817)의 영역을 검출하고, 객체(811 내지 817)의 카테고리(예: 가방, 재킷, 수납함, 블라우스 등)를 인식할 수 있다. 전자 장치(101)는 인식된 객체의 계층 수준(level of hierarchy)을 결정할 수 있으며, 인식된 객체에 관한 정보를 결정된 계층 수준에 따라 저장할 수 있다. 이를 통해, 전자 장치(101)의 사용자는 직접 객체의 내용을 입력하고 분류하지 않더라도, 자동으로 인식된 객체 정보(예: 카테고리, 계층 등)를 통해 메모의 저장, 업데이트, 및 검색이 간편해질 수 있다.
도 9A 내지 9B는 본 발명의 다양한 실시 예에 따른 전자 장치의 특정 공간에 연관된 메모를 증강 현실을 통해 저장하는 방법을 나타낸 도면이다.
다양한 실시 예에 따르면, 도 9A를 참조하면, 전자 장치(101)는 카메라 모듈(180)로부터 영상을 획득할 수 있다. 전자 장치(101)는 획득한 영상에 포함된 객체들의 깊이를 측정할 수 있다. 일반적으로, 깊이 카메라(depth camera)를 사용하여 객체들의 깊이를 측정하지만, 스마트 폰과 같은 전자 장치(101)에서는 제품의 소형화를 위해 별도의 깊이 카메라를 구비하는 것이 용이하지 않을 수 있다. 전자 장치(101)는 영상 정보로부터 RGB 이미지(910)만을 추출하여, 이를 기반으로 깊이 맵(920)을 획득할 수 있다. 전자 장치(101)는 도 930을 참조하면, 획득한 깊이 맵(920)에 기반하여, 영상 정보 내 존재하는 평면(plane) 정보들(예: 931 내지 939)을 획득할 수 있다. 전자 장치(101)는 획득한 평면 정보를 이용하여, 증강 현실 메모를 붙일 수 있는 영역을 확인할 수 있다.
다양한 실시 예에 따르면, 도 9B를 참조하면, 전자 장치(101)는 도 940을 참조하면, 증강 현실 메모 어플리케이션을 실행할 수 있다. 전자 장치(101)의 디스플레이에는 메모 가능 영역(941) 및 메모 내용(943, 예: 영상 정보로부터 추출된 객체)이 표시될 수 있다. 예를 들어, 전자 장치(101)는 메모 가능 영역(941) 및 메모 내용(943)을 도 940과 같이 한 화면에 함께 표시될 수 있다. 다른 예를 들어, 전자 장치(101)는 메모 가능 영역(941) 또는 메모 내용(943)을 독자적으로 표시한 뒤, 이어지는 사용자의 입력에 따라, 표시되지 않은 나머지 항목들을 표시할 수 있다. 만약, 메모 가능 영역(941)이 먼저 표시되는 경우, 전자 장치(101)는 사용자가 메모 가능 영역(941)을 선택하는 입력에 대응하여, 해당 영역에 대응되는 메모 내용(943)을 표시할 수 있다. 만약, 메모 내용(943)이 먼저 표시되는 경우, 전자 장치(101)는 사용자가 메모 내용(943)을 선택하는 입력에 대응하여, 해당 메모 내용을 표시할 메모 가능 영역(941)을 표시할 수 있다.
전자 장치(101)는 도 950을 참조하면, 메모 가능 영역(941) 및 메모 내용(943)이 함께 표시된 상태에서, 사용자로부터 접시 및 컵(951)을 부엌 선반 영역(955)에 드래그하는 입력(953)을 수신할 수 있다. 여기서, 메모 가능 영역(941) 및 메모 내용(943)을 연결시키는 입력은 상기의 드래그 입력(953)에 국한되지는 않는다. 사용자는 탭 터치 입력을 통해 메모 내용(943)과 메모 가능 영역(941)을 매칭시킬 수 있다. 이에 따라, 전자 장치(101)는 사용자에게 부엌 선반 영역(955)에 접시 및 컵(951)이 위치한다는 증강 현실 메모를 사용자에게 제공할 수 있다.
도 10은 본 발명의 다양한 실시 예에 따른 전자 장치의 증강 현실을 통해 기록된 메모를 사용자에게 보여주는 방법을 나타내는 도면이다.
다양한 실시 예에 따르면, 도 10을 참조하면, 전자 장치(101)는 사용자에게 적어도 하나의 증강 현실 메모를 제공할 수 있다. 전자 장치(101)는 메모 생성 모듈(310)을 통해, 객체가 위치하는 영역과 객체를 매칭시켜 증강 현실 메모를 저장하고, 이를 사용자에게 제공할 수 있다. 예를 들어, 전자 장치(101)는 겨울 옷(1011, 1019), 가을 옷(1013), 아이 옷(1015), 휴지 및 키친 타올(1017), 청소기(1020)가 증강 현실 메모가 부착된 각 영역에 위치함을 알려줄 수 있다. 전자 장치(101)는 증강 현실 메모를 특정 영역과 결합하여 저장함에 있어서, 텍스트, 이모티콘, 영상, 사운드, 또는 진동 등을 자유롭게 활용할 수 있다. 예를 들어, 전자 장치(101)는 특정 영역으로 카메라 모듈이 향하는 경우, 메모지를 표시하는 것뿐만 아니라, 기 지정된 영상이나 멜로디가 출력되도록 설정할 수도 있다.
도 11은 본 발명의 다양한 실시 예에 따른 전자 장치의 증강 현실을 통해 단계적으로 메모를 확인할 수 있는 방법을 나타내는 도면이다.
다양한 실시 예에 따르면, 도 11을 참조하면, 전자 장치(101)는 제2 단계의 증강 현실 메모(예: 문이 닫힌 상태의 수납장 영상, 또는 수납장이라는 텍스트의 메모)를 표시할 수 있다.
다양한 실시 예에 따르면, 도 1110을 참조하면, 전자 장치(101)는 사용자의 하위 단계로 진입하려는 입력(예: 수납장을 터치하거나, 수납장에 대해 확대하려는 제스처)에 대응하여, 제3 단계의 증강 현실 메모(예: 문이 열린 상태의 수납장 영상(1111 내지 1117), 또는 문이 열린 상태의 각 객체에 대한 텍스트 정보)를 표시할 수 있다.
다양한 실시 예에 따르면, 도 1120을 참조하면, 전자 장치(101)는 사용자의 하위 단계로 진입하려는 입력(예: 수납함을 터치하거나, 수납함에 대해 확대하려는 제스처)에 대응하여, 제4 단계의 증강 현실 메모(예: 뚜껑이 열린 상태의 수납함 영상(1121), 또는 뚜껑이 열린 상태의 각 객체에 대한 텍스트 정보)를 표시할 수 있다. 이를 통해, 전자 장치(101)의 사용자는 사용자가 직접 수납장 문을 열어보거나, 수납함 뚜껑을 열지 않더라도, 내부에 어떠한 객체들이 위치하는지 매우 쉽고 간편하게 확인할 수 있다.
도 12는 본 발명의 다양한 실시 예에 따른 전자 장치가 메모 가능 영역을 인식하고, 해당 영역에 가상의 메모 보드를 제공하는 방법에 관한 도면이다.
다양한 실시 예에 따르면, 도 1210 및 1220을 참조하면, 전자 장치(101)는 메모를 표시할 가상의 영역을 인식할 수 있다. 예를 들어, 전자 장치(101)는 깊이 맵(depth map)을 획득할 수 있으며, 깊이 맵에 기반하여 배경의 깊이 정보를 확인할 수 있다. 전자 장치(101)는 깊이 정보에 기반하여 증강 현실 메모를 표시할 면(plane) 정보를 획득할 수 있다. 전자 장치(101)는 획득한 면 정보를 메모 가능 영역(1212, 1214)으로 판단할 수 있으며, 선택된 면에 가상의 메모 보드(1221, 1223)를 제공할 수 있다. 전자 장치(101)는 영상을 분석하여 획득한 객체 정보가 아니더라도, 증강 현실 메모 보드(1221, 1223)를 특정 공간과 연관시켜 저장 및 표시할 수 있다. 예를 들어, 전자 장치(101)는 메모 보드(1221)에 사용자가 해야 할 일의 목록을 표시할 수 있으며, 메모 보드(1223)에 캘린더 및 일정 정보를 표시할 수 있다. 전자 장치(101)의 사용자는 증강 현실 메모 보드를 다른 전자 장치의 사용자와 공유할 수 있다. 예를 들어, 증강 현실 메모 보드는 사용자의 설정에 의해 사용자가 기 지정한 전자 장치(예: 가족 구성원이 사용하는 전자 장치)에서만 보이도록 제어할 수 있다. 또한, 개인 정보가 담긴 증강 현실 메모 보드는 사용자의 전자 장치(101)를 통해서만 확인하도록 하여 보안성을 높일 수도 있다. 이러한, 증강 현실 메모 보드는 실제 배경에는 존재하지 않는 가상의 영상이므로, 외관 상 깔끔함 및 심플함을 유지함과 동시에, 사용자가 반드시 기억해야 할 내용들을 쉽게 확인할 수 있도록 한다는 점에서 매우 유용할 수 있다.
도 13은 본 발명의 다양한 실시 예에 따른 전자 장치를 통해 사용자 중심으로 메모를 검색하는 방법을 나타낸 도면이다.
다양한 실시 예에 따르면, 전자 장치(101)의 사용자는 메모가 남겨진 공간으로 직접 이동하지 않더라도 사용자의 현재 위치에서 기록된 메모를 확인할 수 있다. 즉, 전자 장치(101)의 사용자는 현재 어디에 있든지, 사용자가 남긴 메모에 해당하는 객체의 위치를 사용자 관점에서 쉽게 확인할 수 있다.
다양한 실시 예에 따르면, 전자 장치(101)는 사용자로부터 청소기가 어디 있는지 확인해달라는 음성 입력을 수신할 수 있다. 예를 들어, 전자 장치(101)는 사용자로부터 "청소기 어디 있지?"라는 음성 입력을 수신할 수 있다. 전자 장치(101)는 사용자의 음성 입력에 대응하여, 메모에 저장된 청소기의 위치를 계층적으로 확인(예: 집-발코니-청소기)하여 응답을 제공할 수 있다. 예를 들어, 전자 장치(101)는 "청소기는 발코니에 있습니다" 라고 응답할 수 있다. 또한, 도 13을 참조하면, 전자 장치(101)는 집의 구조도를 활용하여 발코니에 배치된 청소기의 위치 정보(1301)를 표시할 수 있다. 여기서, 집의 구조도는 전자 장치(101)의 메모리(130)에 저장되어 있거나, 전자 장치(102, 104) 또는 서버(108)를 통해 획득할 수 있다. 만약, 사용자가 위치한 집에 해당하는 구조도를 획득할 수 없는 경우에는, 전자 장치(101)의 카메라 모듈(180) 또는 스마트 홈 환경 내 다른 사물 기기들로부터 획득한 적어도 하나의 정보를 종합하여 집의 구조도를 생성할 수 있으며, 생성된 구조도에 청소기의 위치를 표시할 수도 있다.
다양한 실시 예에 따르면, 전자 장치(101)는 외부 전자 장치(예: 미니 로봇, TV, 보안 카메라 등)의 카메라를 활용하여, 사용자가 거실에 있음에도 불구하고, 안방에 위치한 증강 현실 메모를 확인하도록 할 수 있다. 전자 장치(101)는 사용자의 입력에 대응하여, 외부 전자 장치의 카메라로부터 영상 정보를 획득할 수 있다. 전자 장치(101)는 해당 영상 내 포함된 특정 공간과 연관된 증강 현실 메모를 사용자에게 제공될 수 있다. 이를 통해, 전자 장치(101)의 사용자는 직접 움직이지 않더라도, 현실 배경과 결합된 증강 현실 메모를 확인할 수 있다. 전자 장치(101)는 외부 전자 장치의 카메라를 활용할 수 없는 경우 메모 제공 시스템(300)에 저장되어 있는 영상 정보를 활용하여 증강 현실 메모 혹은 영상 메모를 사용자에게 제공할 수 있다.
다양한 실시 예에 따른 전자 장치는 디스플레이; 카메라 모듈; 및 프로세서를 포함하고, 상기 프로세서는, 상기 카메라 모듈을 통하여, 임의의 공간에 배치된 적어도 하나의 객체를 포함하는 제1 영상을 획득하고, 상기 획득된 제1 영상을 기반으로, 상기 적어도 하나의 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하고, 상기 카메라 모듈을 통하여, 상기 임의의 공간의 적어도 일부를 포함하는 제2 영상을 획득하고, 및 상기 획득된 제2 영상을 기반으로, 상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함된 제1 객체의 경우, 상기 디스플레이를 통하여, 상기 제1 객체에 관한 정보를 상기 제2 영상과 함께 표시하고, 및 상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함되어 있지 않은 제2 객체의 경우, 상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작 중 적어도 하나의 동작을 수행할 수 있다.
상기 적어도 하나의 객체에 관한 정보는 상기 전자 장치의 사용자로부터 수신된 음성 입력에 기반하여 획득한 정보를 포함할 수 있다.
상기 적어도 하나의 객체에 관한 정보는, 상기 적어도 하나의 객체가 배치된 공간 정보, 상기 적어도 하나의 객체의 위치 정보, 카테고리 정보, 계층 정보, 색상 정보 및 상기 적어도 하나의 객체와 관련된 사용자의 입력 정보 중 적어도 하나를 포함할 수 있다.
상기 프로세서는, 상기 획득된 제2 영상을 기반으로, 상기 제1 영상의 상기 적어도 하나의 객체 중 상기 제2 영상에 포함되지 않은 제3 객체의 경우, 상기 임의의 공간에 대응하여 기 저장된 상기 제3 객체에 관한 정보를 삭제할 수 있다.
상기 프로세서는, 상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하거나, 또는 상기 제3 객체에 관한 정보를 상기 임의의 공간에 대응하여 삭제하는 경우, 사용자로부터 허용 여부를 확인하고, 및 상기 사용자로부터 컨펌(confirm)을 수신하는 것에 대응하여, 상기 제2 객체 또는 제3 객체에 관한 정보를 업데이트 할 수 있다.
상기 프로세서는, 상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하거나, 또는 상기 제3 객체에 관한 정보를 상기 임의의 공간에 대응하여 삭제하는 경우, 상기 제2 객체 또는 제3 객체에 관한 정보를 업데이트 하고, 및 상기 제2 객체 또는 제3 객체에 관한 업데이트 정보를 상기 사용자에게 제공할 수 있다.
상기 프로세서는, 상기 카메라 모듈을 통하여, 상기 임의의 공간에 배치된 복수의 객체들을 인식하고, 및 상기 복수의 객체들의 계층화 정보를 생성하고, 상기 계층화 정보는 상기 복수의 객체들이 제1 계층으로 분류된 정보, 또는 상기 복수의 객체들이 상기 제1 계층 및 상기 제1 계층과 상이한 제2 계층으로 분류된 정보를 포함할 수 있다.
상기 프로세서는, 상기 카메라 모듈을 통하여, 상기 제1 계층에 대응하는 객체 및 상기 제2 계층에 해당하는 객체를 이시(異時)에 인식할 수 있다.
상기 프로세서는, 상기 디스플레이를 통하여, 상기 제1 계층에 대응하는 객체에 관한 정보를 상기 제2 영상과 함께 표시하는 중, 사용자로부터 계층 변경 입력을 수신하고, 및 상기 계층 변경 입력을 수신하는 것에 대응하여, 상기 제2 계층에 대응하는 객체에 관한 정보를 상기 제1 계층에 대응하는 객체에 관한 정보를 대신하여 표시하고, 상기 계층 변경 입력은 상기 사용자의 음성 입력, 상기 사용자의 제스처 입력, 및 상기 사용자의 상기 제1 계층에 대응하는 객체에 관한 정보와 연관된 터치 입력 중 적어도 하나를 포함할 수 있다.
상기 제1 계층 또는 제2 계층에 대응하는 객체에 관한 정보는, 상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체 중 사용 빈도가 높은 객체에 관한 정보, 상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체 중 검색 빈도가 높은 객체에 관한 정보, 및 상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체에 관한 섬 네일(thumb nail) 정보 중 적어도 하나를 포함할 수 있다.
다양한 실시 예에 따른 전자 장치의 방법은 상기 전자 장치의 카메라 모듈을 통하여, 임의의 공간에 배치된 적어도 하나의 객체를 포함하는 제1 영상을 획득하는 동작; 상기 획득된 제1 영상을 기반으로, 상기 적어도 하나의 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작; 상기 카메라 모듈을 통하여, 상기 임의의 공간의 적어도 일부를 포함하는 제2 영상을 획득하는 동작; 및 상기 획득된 제2 영상을 기반으로, 상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함된 제1 객체의 경우, 상기 디스플레이를 통하여, 상기 제1 객체에 관한 정보를 상기 제2 영상과 함께 표시하는 동작; 및 상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함되어 있지 않은 제2 객체의 경우, 상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작 중 적어도 하나의 동작을 수행하는 동작을 포함할 수 있다.
상기 적어도 하나의 객체에 관한 정보는 상기 전자 장치의 사용자로부터 수신된 음성 입력에 기반하여 획득한 정보를 포함할 수 있다.
상기 적어도 하나의 객체에 관한 정보는, 상기 적어도 하나의 객체가 배치된 공간 정보, 상기 적어도 하나의 객체의 위치 정보, 카테고리 정보, 계층 정보, 색상 정보 및 상기 적어도 하나의 객체와 관련된 사용자의 입력 정보 중 적어도 하나를 포함할 수 있다.
상기 획득된 제2 영상을 기반으로, 상기 제1 영상의 상기 적어도 하나의 객체 중 상기 제2 영상에 포함되지 않은 제3 객체의 경우, 상기 임의의 공간에 대응하여 기 저장된 상기 제3 객체에 관한 정보를 삭제하는 동작을 포함할 수 있다.
상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작, 또는 상기 제3 객체에 관한 정보를 상기 임의의 공간에 대응하여 삭제하는 동작을 수행하는 경우, 사용자로부터 허용 여부를 확인하는 동작; 및 상기 사용자로부터 컨펌(confirm)을 수신하는 것에 대응하여, 상기 제2 객체 또는 제3 객체에 관한 정보를 업데이트 하는 동작을 포함할 수 있다.
상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작, 또는 상기 제3 객체에 관한 정보를 상기 임의의 공간에 대응하여 삭제하는 동작을 수행하는 경우, 상기 제2 객체 또는 제3 객체에 관한 정보를 업데이트 하는 동작; 및 상기 제2 객체 또는 제3 객체에 관한 업데이트 정보를 상기 사용자에게 제공하도록 하는 동작을 포함할 수 있다.
상기 카메라 모듈을 통하여, 상기 임의의 공간에 배치된 복수의 객체들을 인식하는 동작; 및 상기 복수의 객체들의 계층화 정보를 생성하는 동작을 포함하고, 상기 계층화 정보는 상기 복수의 객체들이 제1 계층으로 분류된 정보, 또는 상기 복수의 객체들이 상기 제1 계층 및 상기 제1 계층과 상이한 제2 계층으로 분류된 정보를 포함할 수 있다.
상기 카메라 모듈을 통하여, 상기 제1 계층에 대응하는 객체 및 상기 제2 계층에 해당하는 객체를 이시(異時)에 인식하는 동작을 포함할 수 있다.
상기 디스플레이를 통하여, 상기 제1 계층에 대응하는 객체에 관한 정보를 상기 제2 영상과 함께 표시하는 중, 사용자로부터 계층 변경 입력을 수신하는 동작; 및 상기 계층 변경 입력을 수신하는 것에 대응하여, 상기 제2 계층에 대응하는 객체에 관한 정보를 상기 제1 계층에 대응하는 객체에 관한 정보를 대신하여 표시하는 동작을 포함하고, 상기 계층 변경 입력은 상기 사용자의 음성 입력, 상기 사용자의 제스처 입력, 및 상기 사용자의 상기 제1 계층에 대응하는 객체에 관한 정보와 연관된 터치 입력 중 적어도 하나를 포함할 수 있다.
상기 제1 계층 또는 제2 계층에 대응하는 객체에 관한 정보는, 상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체 중 사용 빈도가 높은 객체에 관한 정보, 상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체 중 검색 빈도가 높은 객체에 관한 정보, 및 상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체에 관한 섬 네일(thumb nail) 정보 중 적어도 하나를 포함할 수 있다.

Claims (15)

  1. 전자 장치에 있어서,
    디스플레이;
    카메라 모듈; 및
    프로세서를 포함하고, 상기 프로세서는,
    상기 카메라 모듈을 통하여, 임의의 공간에 배치된 적어도 하나의 객체를 포함하는 제1 영상을 획득하고,
    상기 획득된 제1 영상을 기반으로, 상기 적어도 하나의 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하고,
    상기 카메라 모듈을 통하여, 상기 임의의 공간의 적어도 일부를 포함하는 제2 영상을 획득하고, 및
    상기 획득된 제2 영상을 기반으로,
    상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함된 제1 객체의 경우, 상기 디스플레이를 통하여, 상기 제1 객체에 관한 정보를 상기 제2 영상과 함께 표시하고, 및
    상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함되어 있지 않은 제2 객체의 경우, 상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작 중 적어도 하나의 동작을 수행하도록 설정된 전자 장치.
  2. 제1 항에 있어서,
    상기 적어도 하나의 객체에 관한 정보는 상기 전자 장치의 사용자로부터 수신된 음성 입력에 기반하여 획득한 정보를 포함하는 전자 장치.
  3. 제1 항에 있어서,
    상기 적어도 하나의 객체에 관한 정보는,
    상기 적어도 하나의 객체가 배치된 공간 정보, 상기 적어도 하나의 객체의 위치 정보, 카테고리 정보, 계층 정보, 색상 정보 및 상기 적어도 하나의 객체와 관련된 사용자의 입력 정보 중 적어도 하나를 포함하는 전자 장치.
  4. 제1 항에 있어서,
    상기 프로세서는,
    상기 획득된 제2 영상을 기반으로,
    상기 제1 영상의 상기 적어도 하나의 객체 중 상기 제2 영상에 포함되지 않은 제3 객체의 경우, 상기 임의의 공간에 대응하여 기 저장된 상기 제3 객체에 관한 정보를 삭제하도록 설정된 전자 장치.
  5. 제4 항에 있어서,
    상기 프로세서는,
    상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하거나, 또는 상기 제3 객체에 관한 정보를 상기 임의의 공간에 대응하여 삭제하는 경우, 사용자로부터 허용 여부를 확인하고, 및
    상기 사용자로부터 컨펌(confirm)을 수신하는 것에 대응하여, 상기 제2 객체 또는 제3 객체에 관한 정보를 업데이트 하도록 설정된 전자 장치.
  6. 제4 항에 있어서,
    상기 프로세서는,
    상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하거나, 또는 상기 제3 객체에 관한 정보를 상기 임의의 공간에 대응하여 삭제하는 경우, 상기 제2 객체 또는 제3 객체에 관한 정보를 업데이트 하고, 및
    상기 제2 객체 또는 제3 객체에 관한 업데이트 정보를 상기 사용자에게 제공하도록 설정된 전자 장치.
  7. 제1 항에 있어서,
    상기 프로세서는,
    상기 카메라 모듈을 통하여, 상기 임의의 공간에 배치된 복수의 객체들을 인식하고, 및
    상기 복수의 객체들의 계층화 정보를 생성하고,
    상기 계층화 정보는 상기 복수의 객체들이 제1 계층으로 분류된 정보, 또는 상기 복수의 객체들이 상기 제1 계층 및 상기 제1 계층과 상이한 제2 계층으로 분류된 정보를 포함하도록 설정된 전자 장치.
  8. 제7 항에 있어서,
    상기 프로세서는,
    상기 카메라 모듈을 통하여, 상기 제1 계층에 대응하는 객체 및 상기 제2 계층에 해당하는 객체를 이시(異時)에 인식하도록 설정된 전자 장치.
  9. 제8 항에 있어서,
    상기 프로세서는,
    상기 디스플레이를 통하여, 상기 제1 계층에 대응하는 객체에 관한 정보를 상기 제2 영상과 함께 표시하는 중, 사용자로부터 계층 변경 입력을 수신하고, 및
    상기 계층 변경 입력을 수신하는 것에 대응하여, 상기 제2 계층에 대응하는 객체에 관한 정보를 상기 제1 계층에 대응하는 객체에 관한 정보를 대신하여 표시하고,
    상기 계층 변경 입력은 상기 사용자의 음성 입력, 상기 사용자의 제스처 입력, 및 상기 사용자의 상기 제1 계층에 대응하는 객체에 관한 정보와 연관된 터치 입력 중 적어도 하나를 포함하도록 설정된 전자 장치.
  10. 제9 항에 있어서,
    상기 제1 계층 또는 제2 계층에 대응하는 객체에 관한 정보는,
    상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체 중 사용 빈도가 높은 객체에 관한 정보,
    상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체 중 검색 빈도가 높은 객체에 관한 정보, 및
    상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체에 관한 섬 네일(thumb nail) 정보 중 적어도 하나를 포함하도록 설정된 전자 장치.
  11. 전자 장치의 방법에 있어서,
    상기 전자 장치의 카메라 모듈을 통하여, 임의의 공간에 배치된 적어도 하나의 객체를 포함하는 제1 영상을 획득하는 동작;
    상기 획득된 제1 영상을 기반으로, 상기 적어도 하나의 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작;
    상기 카메라 모듈을 통하여, 상기 임의의 공간의 적어도 일부를 포함하는 제2 영상을 획득하는 동작; 및
    상기 획득된 제2 영상을 기반으로,
    상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함된 제1 객체의 경우, 상기 디스플레이를 통하여, 상기 제1 객체에 관한 정보를 상기 제2 영상과 함께 표시하는 동작; 및
    상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함되어 있지 않은 제2 객체의 경우, 상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작 중 적어도 하나의 동작을 수행하는 동작을 포함하는 전자 장치의 방법.
  12. 제11 항에 있어서,
    상기 적어도 하나의 객체에 관한 정보는 상기 전자 장치의 사용자로부터 수신된 음성 입력에 기반하여 획득한 정보를 포함하는 전자 장치의 방법.
  13. 제11 항에 있어서,
    상기 적어도 하나의 객체에 관한 정보는,
    상기 적어도 하나의 객체가 배치된 공간 정보, 상기 적어도 하나의 객체의 위치 정보, 카테고리 정보, 계층 정보, 색상 정보 및 상기 적어도 하나의 객체와 관련된 사용자의 입력 정보 중 적어도 하나를 포함하는 전자 장치의 방법.
  14. 제11 항에 있어서,
    상기 획득된 제2 영상을 기반으로,
    상기 제1 영상의 상기 적어도 하나의 객체 중 상기 제2 영상에 포함되지 않은 제3 객체의 경우, 상기 임의의 공간에 대응하여 기 저장된 상기 제3 객체에 관한 정보를 삭제하는 동작을 포함하는 전자 장치의 방법.
  15. 제14 항에 있어서,
    상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작, 또는 상기 제3 객체에 관한 정보를 상기 임의의 공간에 대응하여 삭제하는 동작을 수행하는 경우, 사용자로부터 허용 여부를 확인하는 동작; 및
    상기 사용자로부터 컨펌(confirm)을 수신하는 것에 대응하여, 상기 제2 객체 또는 제3 객체에 관한 정보를 업데이트 하는 동작을 포함하는 전자 장치의 방법.
PCT/KR2019/007750 2018-08-01 2019-06-26 카메라 모듈을 통해 획득한 영상에 기반하여 정보를 저장하는 방법 및 이를 사용하는 전자 장치 WO2020027442A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/265,141 US11449134B2 (en) 2018-08-01 2019-06-26 Method for storing information on basis of image acquired through camera module, and electronic device using same

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020180089703A KR102592463B1 (ko) 2018-08-01 2018-08-01 카메라 모듈을 통해 획득한 영상에 기반하여 정보를 저장하는 방법 및 이를 사용하는 전자 장치
KR10-2018-0089703 2018-08-01

Publications (1)

Publication Number Publication Date
WO2020027442A1 true WO2020027442A1 (ko) 2020-02-06

Family

ID=69231234

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/007750 WO2020027442A1 (ko) 2018-08-01 2019-06-26 카메라 모듈을 통해 획득한 영상에 기반하여 정보를 저장하는 방법 및 이를 사용하는 전자 장치

Country Status (3)

Country Link
US (1) US11449134B2 (ko)
KR (1) KR102592463B1 (ko)
WO (1) WO2020027442A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108988995B (zh) * 2017-06-02 2020-07-24 华为技术有限公司 一种数据传输的方法和装置
JP7394542B2 (ja) * 2019-05-30 2023-12-08 キヤノン株式会社 撮像装置、通知装置、通知方法、及びプログラム
KR102476745B1 (ko) * 2021-12-21 2022-12-13 (주)웅진씽크빅 정리 습관 형성을 위한 가상 서비스 제공 장치 및 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120017870A (ko) * 2010-08-20 2012-02-29 주식회사 팬택 객체 정보 제공 단말 장치 및 그 방법
KR101289085B1 (ko) * 2012-12-12 2013-07-30 오드컨셉 주식회사 객체 기반 영상 검색시스템 및 검색방법
KR101293776B1 (ko) * 2010-09-03 2013-08-06 주식회사 팬택 객체 리스트를 이용한 증강 현실 제공 장치 및 방법
KR20160128119A (ko) * 2015-04-28 2016-11-07 엘지전자 주식회사 이동 단말기 및 이의 제어방법
KR20170062290A (ko) * 2015-11-27 2017-06-07 연세대학교 산학협력단 공간-물체 관계 그래프에 기반한 객체 인식 방법 및 그 장치

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100701290B1 (ko) * 2005-05-24 2007-03-29 엠텍비젼 주식회사 메모리 관리 기능을 구비한 교육용 완구
KR101324336B1 (ko) 2010-12-28 2013-10-31 주식회사 팬택 증강 현실 제공 단말기
KR101260483B1 (ko) 2011-11-15 2013-05-06 인천대학교 산학협력단 위치기반 가상 메모 시스템 및 방법
KR20130079962A (ko) 2012-01-03 2013-07-11 주식회사 인프라웨어 증강현실을 이용한 포스트잇 컨텐츠 표시 방법 및 이를 실행하는 장치
US20170169294A1 (en) 2015-12-11 2017-06-15 Leadot Innovation, Inc. Method of Tracking Locations of Stored Items
US10339715B2 (en) * 2016-08-31 2019-07-02 Factualvr, Inc. Virtual reality system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120017870A (ko) * 2010-08-20 2012-02-29 주식회사 팬택 객체 정보 제공 단말 장치 및 그 방법
KR101293776B1 (ko) * 2010-09-03 2013-08-06 주식회사 팬택 객체 리스트를 이용한 증강 현실 제공 장치 및 방법
KR101289085B1 (ko) * 2012-12-12 2013-07-30 오드컨셉 주식회사 객체 기반 영상 검색시스템 및 검색방법
KR20160128119A (ko) * 2015-04-28 2016-11-07 엘지전자 주식회사 이동 단말기 및 이의 제어방법
KR20170062290A (ko) * 2015-11-27 2017-06-07 연세대학교 산학협력단 공간-물체 관계 그래프에 기반한 객체 인식 방법 및 그 장치

Also Published As

Publication number Publication date
US11449134B2 (en) 2022-09-20
US20210311545A1 (en) 2021-10-07
KR102592463B1 (ko) 2023-10-23
KR20200014495A (ko) 2020-02-11

Similar Documents

Publication Publication Date Title
WO2020071712A1 (en) Method for controlling plurality of voice recognizing devices and electronic device supporting the same
WO2020027442A1 (ko) 카메라 모듈을 통해 획득한 영상에 기반하여 정보를 저장하는 방법 및 이를 사용하는 전자 장치
WO2019098797A1 (en) Apparatus and method for providing haptic feedback through wearable device
CN108810248A (zh) 共享概要图像的方法及实现该方法的电子设备
WO2020022780A1 (en) Method and apparatus for establishing device connection
WO2019125029A1 (ko) 증강 현실을 위한 객체를 표시하기 위한 전자 장치 및 그의 동작 방법
EP3808097A1 (en) Method and apparatus for establishing device connection
WO2016036143A1 (ko) 전자 장치의 멀티미디어 데이터 처리 방법 및 그 전자 장치
WO2020171541A1 (ko) 전자 장치 및 이를 이용한 카메라 기능과 연동하여 이모지 편집을 위한 사용자 인터페이스를 제공하는 방법
WO2019156480A1 (ko) 시선에 기반한 관심 영역 검출 방법 및 이를 위한 전자 장치
EP3747201A1 (en) Method for providing content and electronic device supporting the same
CN106603350A (zh) 信息展示方法及装置
WO2020032347A1 (ko) 드로잉 환경을 제공하는 전자 장치 및 방법
WO2021172832A1 (ko) 제스처 인식 기반의 영상 편집 방법 및 이를 지원하는 전자 장치
WO2021242005A1 (ko) 전자 장치 및 사용자 아바타 기반의 이모지 스티커를 생성하는 방법
WO2019209075A1 (ko) 외부 전자 장치를 제어하는 전자 장치 및 방법
WO2019103285A1 (ko) 전자 장치 및 전자 장치의 증강 현실 서비스 제공 방법
WO2020171567A1 (en) Method for recognizing object and electronic device supporting the same
WO2020153766A1 (en) Method for displaying visual information associated with voice input and electronic device supporting the same
WO2020159302A1 (ko) 증강 현실 환경에서 다양한 기능을 수행하는 전자 장치 및 그 동작 방법
WO2020116960A1 (en) Electronic device for generating video comprising character and method thereof
WO2021101276A1 (en) Electronic device for providing intelligent assistance service and operating method thereof
WO2020153818A1 (en) Method of controlling external electronic device and electronic device for supporting same
WO2019160269A1 (en) Method and interactive device for providing social interaction
WO2021107200A1 (ko) 이동 단말기 및 이동 단말기 제어 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19843521

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19843521

Country of ref document: EP

Kind code of ref document: A1