WO2020209693A1 - 인공지능 모델을 갱신하는 전자 장치, 서버 및 그 동작 방법 - Google Patents

인공지능 모델을 갱신하는 전자 장치, 서버 및 그 동작 방법 Download PDF

Info

Publication number
WO2020209693A1
WO2020209693A1 PCT/KR2020/004965 KR2020004965W WO2020209693A1 WO 2020209693 A1 WO2020209693 A1 WO 2020209693A1 KR 2020004965 W KR2020004965 W KR 2020004965W WO 2020209693 A1 WO2020209693 A1 WO 2020209693A1
Authority
WO
WIPO (PCT)
Prior art keywords
electronic device
gradient
information
model
local model
Prior art date
Application number
PCT/KR2020/004965
Other languages
English (en)
French (fr)
Inventor
러셀 제라치제임스
시비첸
로러아옹후스
스미스베리
헐리네일
동루이하이
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020190120851A external-priority patent/KR20200120469A/ko
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to CN202080010910.1A priority Critical patent/CN113366520A/zh
Priority to EP20788289.5A priority patent/EP3816917A4/en
Publication of WO2020209693A1 publication Critical patent/WO2020209693A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute

Definitions

  • the present disclosure relates to an electronic device, a server, and a method of operating the same for updating an artificial intelligence model stored in the electronic device.
  • the artificial intelligence model is continuously updated according to the changed situation information. Accordingly, the artificial intelligence model may be continuously updated based on various types of situation information collected in real time so that an appropriate operation can be performed by the artificial intelligence model according to the situation information.
  • the update of the artificial intelligence model may be performed in a server with better performance than the electronic device possessed by the user in terms of the amount of computation and data used for learning.
  • the artificial intelligence model stored in the electronic device may be additionally updated based on the result of updating the artificial intelligence model performed by the server. Accordingly, the electronic device may transmit context information of the electronic device to the server in order to update the artificial intelligence model.
  • the context information of the electronic device may include personal information, biometric information, secret information, financial information, etc., including the user's sensitive information, if the context information is leaked to the outside during the transmission process, serious damage to the user There is a problem that can occur.
  • the problem to be solved by the present disclosure is to solve the above-described problem, and to provide an electronic device, a server, and an operating method thereof for updating an artificial intelligence model stored in the electronic device.
  • FIG. 1 is a diagram illustrating a system for performing various operations using a local model of an electronic device according to an embodiment.
  • FIG. 2 is a diagram illustrating a system for performing various operations using a local model according to an embodiment.
  • FIG. 3 is a diagram illustrating a system for performing object recognition using a local model according to an exemplary embodiment.
  • FIG. 4 is a diagram illustrating a system for performing speech recognition using a local model according to an embodiment.
  • FIG. 5 is a diagram illustrating an example in which a local model and a global model are updated according to an embodiment.
  • FIG. 6 is a diagram illustrating an example of a local model or a global model according to an embodiment.
  • FIG. 7 is a diagram for describing an operation of an electronic device according to an exemplary embodiment.
  • FIG. 8 is a diagram illustrating an example in which a local model is updated according to the passage of time according to an embodiment.
  • FIG. 9 is a block diagram illustrating an internal configuration of an electronic device according to an exemplary embodiment.
  • FIG. 10 is a block diagram illustrating an internal configuration of an electronic device according to an embodiment.
  • FIG. 11 is a block diagram showing an internal configuration of a server according to an embodiment.
  • FIG. 12 is a flowchart illustrating a method of updating a local model according to an embodiment.
  • FIG. 13 is a flowchart illustrating a method of updating a global model in a server according to an embodiment.
  • FIG. 14 is a diagram illustrating a system for updating a local model and a global model according to an embodiment.
  • 15 is a diagram illustrating a system for updating a local model and a global model through an intermediary device according to an embodiment.
  • 16 is a flowchart illustrating a method of updating a global model and a local model according to a gradient according to an embodiment.
  • 17 is a flowchart illustrating a method of updating a global model, a first local model of an electronic device, and a second local model of an external device according to a gradient, according to an exemplary embodiment.
  • FIG. 18 is a flowchart illustrating a method of updating a global model, a first local model of an electronic device, and a second local model of an external device according to a gradient, according to an exemplary embodiment.
  • a first aspect of the present disclosure includes: detecting that information about a situation of the electronic device is changed, which is used to update a local model stored in the electronic device; Determining gradient information for updating the local model, based on the information on the changed situation; Updating the local model based on the determined gradient; Transmitting the gradient to a server; Receiving information on the updated global model based on the gradient from the server; And updating the local model based on the received information.
  • a method of updating an artificial intelligence model may be provided.
  • a second aspect of the present disclosure includes: a memory storing a local model; Detecting that information about the situation of the electronic device used to update the local model is changed, based on the information about the changed situation, determine a gradient for updating the local model, and based on the determined gradient At least one processor for updating the local model; And a communication unit configured to transmit the gradient to a server and receive information on a global model updated based on the gradient from the server, wherein the at least one processor is configured to generate the local model based on the received information.
  • An electronic device that updates and updates an artificial intelligence model may be provided.
  • a third aspect of the present disclosure may provide a recording medium in which a program for performing the method of the first aspect is stored.
  • the processor may be composed of one or a plurality of processors.
  • one or more processors may be a general-purpose processor such as a CPU, AP, or Digital Signal Processor (DSP), a graphics-only processor such as a GPU, a Vision Processing Unit (VPU), or an artificial intelligence-only processor such as an NPU.
  • DSP Digital Signal Processor
  • GPU Graphics Processing Unit
  • NPU Vision Processing Unit
  • One or more processors control to process input data according to a predefined operation rule or an artificial intelligence model stored in the memory.
  • the dedicated artificial intelligence processor may be designed with a hardware structure specialized for processing a specific artificial intelligence model.
  • a predefined motion rule or an artificial intelligence model is characterized by being created through learning.
  • learning means that a basic artificial intelligence model is learned using a plurality of learning data by a learning algorithm, so that a predefined motion rule or an artificial intelligence model set to perform a desired characteristic (or purpose) is created. Means Jim.
  • Such learning may be performed in the device itself on which the artificial intelligence according to the present disclosure is performed, or may be performed through a separate server and/or system. Examples of the learning algorithm include supervised learning, unsupervised learning, semi-supervised learning, or reinforcement learning, but are not limited to the above-described examples.
  • the artificial intelligence model may be composed of a plurality of neural network layers.
  • Each of the plurality of neural network layers has a plurality of nodes and weight values, and performs a neural network operation through an operation result of a previous layer and a plurality of weights.
  • the plurality of weights of the plurality of neural network layers can be optimized by the learning result of the artificial intelligence model. For example, a plurality of weights may be updated to reduce or minimize a loss value or a cost value acquired from an artificial intelligence model during a learning process. In addition, in order to minimize the loss value or the cost value, a plurality of weights may be updated in a direction to minimize the loss value or the gradient related to the cost value.
  • the artificial neural network may include a deep neural network (DNN), for example, CNN (Convolutional Neural Network), DNN (Deep Neural Network), RNN (Recurrent Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN (Bidirectional Recurrent Deep Neural Network), or deep Q-Networks (Deep Q-Networks), and the like, but is not limited to the above-described example.
  • DNN deep neural network
  • CNN Convolutional Neural Network
  • DNN Deep Neural Network
  • RNN Recurrent Neural Network
  • RBM Restricted Boltzmann Machine
  • DBN Deep Belief Network
  • BRDNN Bidirectional Recurrent Deep Neural Network
  • Deep Q-Networks Deep Q-Networks
  • FIG. 1 is a diagram illustrating a system for performing various operations using a local model of an electronic device according to an embodiment.
  • a system may include an electronic device 1000 and a server 2000.
  • the electronic device 1000 may be configured to output a result suitable for the situation of the electronic device 1000 based on information about the situation of the electronic device 1000 collected by the electronic device 1000. ), and various operations can be performed based on the updated local model.
  • the local model of the electronic device 1000 may be continuously updated in the electronic device 1000 based on information on the situation of the electronic device 1000 and may be used to perform various operations. It is an artificial intelligence model.
  • the electronic device 1000 may update a local model by optimizing a plurality of weights included in a plurality of neural network layers constituting the local model based on information about a situation. For example, the electronic device 1000 may update the local model so that a difference between prediction information that can be output through a local model and the prediction information and corresponding observation information can be minimized based on the information on the situation. I can.
  • the observation information is information indicating a correct answer to the prediction information, and may be determined based on various types of information related to the output result of the local model as well as information on the situation of the electronic device 1000 described above. have.
  • the information about the situation of the electronic device 1000 includes situation information collected by the electronic device 1000, information about the state of the electronic device 1000, information about the user of the electronic device 1000, and information about the electronic device 1000. It may include information about the surrounding environment.
  • the context information collected by the electronic device 1000 may include various pieces of information that can be used to update the local model so that a suitable result according to the current situation of the electronic device 1000 is output.
  • the context information may include information about a state of the electronic device 1000, information about a user of the electronic device 1000, information about a surrounding environment of the electronic device 1000, and the like.
  • observation information corresponding to prediction information that may be output to a local model may be obtained based on the situation information.
  • the electronic device 1000 may update the local model by modifying values constituting the local model so that a difference between the observation information and the prediction information is minimized.
  • the information on the state of the electronic device 1000 may include information on an operation state of the electronic device 1000, information on a network connection state in the electronic device 1000, and an OS installed in the electronic device 1000 (operating system) or information about the state of the application, information about the location of the electronic device 1000, information about the moving state of the electronic device 1000, information about the hardware state of the electronic device 1000, etc.
  • Various information on the state of the device 1000 may be included.
  • Information about a user of the electronic device 1000 is, for example, information about a user's characteristics, information about a user's personal information, information about an account of a service to which the user has subscribed, and It may include various types of user's privacy information, such as information on a pattern.
  • the information on the user is not limited to the above example, and may include various types of information on the user.
  • the information on the surrounding environment of the electronic device 1000 may include information on objects existing around the electronic device 1000, information on illumination of the surrounding environment of the electronic device 1000, etc. 1000) can contain various information about the surrounding environment.
  • operations that may be performed based on the local model may include various operations that may be performed by the electronic device 1000.
  • the operation may include an operation of recommending an item, an operation of recognizing an object around the electronic device 1000, an operation of performing voice recognition on an audio signal collected by the electronic device 1000, and the like.
  • the above-described example is not limited to, and operations that may be performed based on the local model according to an embodiment may include various operations that may be performed by the electronic device 1000 using the local model.
  • the electronic device 1000 not only performs an operation for performing various operations using the local model, but also determines the accuracy of the operation using the local model based on information about the situation of the electronic device 1000. Learning to improve can be performed.
  • the electronic device 1000 may perform learning on a local model, so that the electronic device 1000 may derive an operation result optimized for a usage pattern of the electronic device 1000 by using the learned local model. have.
  • there is at least one local model corresponding to each operation and each operation may be performed according to the at least one local model. For example, the electronic device 1000 acquires at least one local model corresponding to an operation (ex.
  • the operation may be performed.
  • the above-described example is not limited, and a plurality of different operations may be performed according to a single local model.
  • the electronic device 1000 may obtain the at least one local model described above from a memory provided in the electronic device 1000 or may receive it from the outside.
  • the electronic device 1000 may obtain a local model by reading a memory.
  • the electronic device 1000 may receive a global model from the external server 2000 and obtain the received global model as a local model of the electronic device 1000.
  • the embodiment is not limited to the above example, and the electronic device 1000 may obtain the local model through various methods.
  • the electronic device 1000 when a local model for performing a predetermined operation is not stored in the electronic device 1000, the electronic device 1000 stores information on a global model for performing the predetermined operation. Can be received from Also, the electronic device 1000 may acquire and store a local model based on information on the global model received from the server 2000.
  • the electronic device 1000 requests a global model for performing the predetermined operation from the server 2000, receives a global model from the server 2000, and transmits the received global model to the electronic device ( 1000) can be saved as a local model. Thereafter, based on the context information collected by the electronic device 1000, the local model stored in the electronic device 1000 may be continuously updated.
  • the local model stored in the electronic device 1000 may be continuously updated based on various data required for updating the local model as well as the context information collected by the electronic device 1000.
  • the electronic device 1000 is a device that performs various operations using a local model using artificial intelligence technology, and may be implemented in various forms.
  • the electronic device 1000 described in this specification includes a digital camera, a smart phone, a laptop computer, a tablet PC, an electronic book terminal, a digital broadcasting terminal, and personal digital assistants (PDAs). , Portable Multimedia Player (PMP), navigation, MP3 player, artificial intelligence speaker, robot cleaner, home appliance, etc., but the present invention is not limited thereto.
  • PMP Portable Multimedia Player
  • MP3 player Portable Multimedia Player
  • artificial intelligence speaker robot cleaner
  • home appliance etc.
  • the electronic device 1000 described in the present specification may be a device that can be worn by a user.
  • Wearable devices include accessory type devices (e.g. watches, rings, wristbands, ankle bands, necklaces, glasses, contact lenses), head-mounted-devices (HMD), textile or clothing integrated devices (e.g., Electronic clothing), a body-attached device (eg, a skin pad), or a living body implantable device (eg, an implantable circuit), but is not limited thereto.
  • updating of the local model may be performed in two steps.
  • the updating of the local model may include a first step of updating the local model based on information about a situation collected by the electronic device 1000.
  • the step of updating the local model includes a second step of updating the local model again based on the information received from the server 2000 as the gradient for the updated local model is transmitted to the server 2000. I can.
  • the gradient of the local model may include information for updating the local model.
  • the gradient may include information related to a case in which a difference between the above-described observation information and prediction information is minimized.
  • the electronic device 1000 may obtain a loss function representing a difference between observation information and the prediction information, and obtain a gradient including information related to a point at which a value of the loss function is minimum.
  • the minimum value of the loss function can be detected by finding a point at which the slope of the loss function becomes minimum.
  • the slope value of the loss function according to an embodiment may be obtained from a partial derivative value for each variable included in the prediction information.
  • the electronic device 1000 may determine prediction information of a local model corresponding to a point at which a value of a loss function is minimum, using a gradient.
  • the electronic device 1000 modifies parameters (eg, weights, biases, etc. for each node) constituting the local model so that the determined prediction information can be output by the local model. Can be updated.
  • the server 2000 updates the global model stored in the server 2000 based on the gradient transmitted from the electronic device 1000, and transmits information on the updated global model to the electronic device 1000.
  • the server 2000 may update the global model so that prediction information corresponding to slope information of a loss function included in the gradient may be output by the global model.
  • the observation information is information indicating a correct answer to the prediction information of the global model, and may be obtained based on various types of information related to the output result of the global model.
  • the electronic device 1000 may update the local model again based on the updated global model information received from the server 2000.
  • the global model may be updated according to the relatively excellent learning ability and computational ability of the server 2000 based on various information collected by the server 2000.
  • the global model may be continuously learned and stored based on various pieces of information collected by various methods in the server 2000.
  • the global model is not limited to the above example, and the global model is learned through various methods and may be stored in advance in the server 2000, and the global model stored in the server 2000 is updated with a local model according to an embodiment. Can be used.
  • Various information collected by the server 2000 described above may include, for example, information collected by external devices other than the electronic device 1000, information collected on the Internet, and the like. It is not limited to the above example, and various types of information collected by the server 2000 may include various types of information collected by various methods.
  • a global model according to an embodiment may have better performance than a local model in performing an operation according to an embodiment.
  • the electronic device 1000 according to an embodiment may update the local model again based on the global model updated by the server 2000 having more information and having relatively better learning performance.
  • the server 2000 may update the global model by using not only data received from the electronic device 1000 but also data received from other external devices 3000-1 and 3000-2.
  • the global model of the server 2000 according to an embodiment may be updated as information on the situation of the server 2000 changes. Therefore, according to an embodiment, even when data (ex. the gradient of the local model updated by the electronic device 1000 or another external device) is not received from the outside, based on the information on the situation of the server 2000 , The global model of the server 2000 may be updated. Accordingly, the electronic device 1000 according to an embodiment may provide a better service to a user by using a local model updated using information on the global model.
  • the global model updated in the server 2000 considers not only the electronic device 1000 but also context information of other external devices. Considering that it is an updated artificial intelligence model, it can be updated.
  • the local model may be updated so that a result that does not contradict the situation of the electronic device 1000 is output by the local model. Therefore, even if the local model according to an embodiment is updated again based on the information on the global model, a suitable operation can be performed according to individual context information of the electronic device 1000, which is different from that of other external devices. , Can be updated.
  • the electronic device 1000 may prevent the risk of leaking user sensitive information included in the context information to the outside by transmitting the gradient to the server 2000 instead of the context information. Also, as the amount of data transmitted to the server 2000 decreases, the time required for updating the local model may be reduced.
  • the local model may be updated based on current situation information collected by the electronic device 1000 so that a result suitable for the current situation of the electronic device 1000 is output by the local model.
  • the context information collected by the electronic device 1000 may include various pieces of information that can be used to update the local model so that a suitable result according to the current situation of the electronic device 1000 is output.
  • the context information is based on information about the state of the electronic device 1000, information about the user of the electronic device 1000, information about the surrounding environment of the electronic device 1000, and results output by the local model. It may include user feedback information, etc.
  • a user may provide feedback information on an operation performed by a local model.
  • the feedback information may include, for example, information input by a user indicating whether an item recommended based on a local model, an object recognition result, a voice recognition result, and the like are appropriate.
  • the feedback information may further include rating information on the recommended item input by the user.
  • the above-described example is not limited, and the feedback information may include various types of information including a user's opinion on an operation performed by the local model.
  • Feedback information may be collected as context information collected by the electronic device 1000 that can be used to update a local model, and is based on context information of the electronic device 1000 including feedback information.
  • the local model can be updated. For example, when feedback information is obtained from a user, it may be determined that context information has changed, and a local model may be updated according to the feedback information.
  • the situation information collected by the electronic device 1000 is not limited to the above example, and may include various types of situation information that may be used to update the local model.
  • the context information of the electronic device 1000 may be continuously collected by the electronic device 1000. According to an embodiment, the electronic device 1000 may continuously check the status of the electronic device 1000 and detect whether the status information of the electronic device 1000 has changed.
  • the local model may be updated based on the changed information.
  • a difference of a specific type of information about the situation of the electronic device 1000 collected by the electronic device 1000 by a reference value or more It may be changed so that it is changed, or a case in which new type of information about the situation of the electronic device 1000 is obtained as situation information may be included.
  • a new application is installed on the electronic device 1000, a new user using the electronic device 1000 is identified, an electronic device that has not been previously identified This may include a case where a new motion pattern of the device 1000 is identified, a case where a new type of object is recognized around the electronic device 1000, a case where the surrounding environment of the electronic device 1000 is changed, and the like. If it is not limited to the above-described example, and when it is detected that information on the situation of the electronic device 1000 is changed, various types of information about the user or the electronic device 1000 that can be used to update the local model May include cases of change.
  • the case in which the context information of the electronic device 1000 is changed may include a case in which the user's feedback information for an operation provided based on a local model is changed according to an embodiment.
  • the electronic device 1000 when it is detected that information about the situation of the electronic device 1000 is changed, it may be determined whether the electronic device 1000 performs an operation of updating a local model. For example, whether the electronic device 1000 is currently in an idle state, whether the memory space of the electronic device 1000 is sufficient for local model update, whether the battery of the electronic device 1000 is being charged, and the current time is late at night. Based on at least one of whether it is time or not, the local model may be updated.
  • the electronic device 1000 may update the local model based on the changed context information according to various preset conditions.
  • the electronic device 1000 determines that the state of the electronic device 1000 is suitable for updating the local model later. When it is determined, an operation of updating the local model can be performed.
  • the electronic device 1000 may transmit a gradient used to update the local model to the server 2000.
  • the gradient when the local model is updated based on the context information, in the process of deriving the weight and bias information of each node included in the local model, based on the changed context information, at least that can be generated It can contain one value.
  • the gradient may include information related to a point at which a loss function representing a difference between observation information and prediction information of a local model is minimized, based on information about a changed situation.
  • the server 2000 may update a global model provided in the server 2000 according to the gradient.
  • the global model corresponds to the local model of the electronic device 1000, but, unlike the local model, is provided in the server 2000 and is also updated by a gradient received from an external device other than the electronic device 1000. There are differences in what can be done.
  • the server 2000 may transmit the updated global model gradient to the electronic device 1000, and the electronic device 1000 updates the local model again based on the gradient received from the server 2000. can do.
  • the global model includes an artificial intelligence model corresponding to the local model of the electronic device 1000, but the local model and the global model are operations in which each model is updated in a device having different performance and specifications. As this is performed, some data of various types of data, such as weight values and bias values, constituting each model may be different from each other.
  • the global model may be updated based on a gradient received from the electronic device 1000.
  • the server 2000 considers that the gradient is obtained based on the new context information collected by the electronic device 1000, and configures the global model so that the new context information can be applied to the global model through the gradient. Can be updated.
  • the gradient for the updated global model may be transmitted to the electronic device 1000 and used to update the local model of the electronic device 1000.
  • a method of updating the global model and a method of updating the local model again based on a gradient for the updated global model will be described in more detail with reference to FIGS. 13, 16, and 17.
  • the electronic device 1000 after the local model is updated again based on the updated global model information, the electronic device 1000 performs a predetermined operation (eg, item recommendation, according to the finally updated local model). Object recognition, voice recognition) can be performed.
  • a predetermined operation eg, item recommendation, according to the finally updated local model.
  • Object recognition, voice recognition can be performed.
  • the electronic device 1000 may perform an operation according to the local model. For example, after the local model is updated based on information received from the server 2000 according to an embodiment, the electronic device 1000 performs an operation according to the updated local model according to the on-device AI technology. can do. For example, the electronic device 1000 continuously updates the local model according to an embodiment through data transmission and reception with the server 2000, but while the local model is not updated according to an embodiment , Can operate according to on-device AI technology.
  • the electronic device 1000 performs a predetermined operation based on a local model (ex. item recommendation, object recognition, voice recognition) on the electronic device 1000 without transmitting and receiving data with the server 2000. And print the results.
  • the electronic device 1000 may perform an operation using a local model based on various pieces of information collected by the electronic device 1000 in real time without the need to use big data stored in the server 2000. have.
  • the electronic device 1000 may make a self-determination based on the learned local model and various types of data collected by itself according to an embodiment.
  • the electronic device 1000 by the on-device AI technology does not transmit the collected data to the outside, but operates by itself, so there is an advantage in terms of user's personal information protection and data processing speed.
  • the electronic device according to the local model of the electronic device 1000 1000 may operate without connection to the server 2000 using on-device AI technology.
  • the electronic device 1000 is not limited to operating according to the on-device AI technology, and may perform an operation according to an embodiment through data transmission/reception with the server 2000 or an external device.
  • the electronic device 1000 may request the server 2000 to perform the operation instead of performing the operation according to the embodiment using a local model.
  • the server 2000 according to an embodiment may perform an operation according to an embodiment based on a global model according to a received request and transmit the result to the electronic device 1000.
  • the electronic device 1000 may perform an operation according to an embodiment by combining the above-described on-device AI technology and a method through data transmission/reception with the server 2000.
  • the operation through the server 2000 is more advantageous in terms of data processing speed, or data that does not include the user's personal information is transferred to the server 2000.
  • the method through the server 2000 is more advantageous than the on-device AI technology, such as the case of transmission, the operation according to an embodiment may be performed according to the method through the server 2000.
  • FIG. 2 is a diagram illustrating a system for performing various operations using a local model according to an embodiment.
  • the item recommendation system may include an electronic device 1000, a server 2000, an external device 1 (3000-1), and an external device 2 (3000-2). I can.
  • the electronic device 1000 and server 2000 of FIG. 2 correspond to the electronic device 1000 and server 2000 of FIG. 1.
  • the external device 1 (3000-1) and the external device 2 (3000-2) are the same as the electronic device 1000, each of the external device 1 (3000-1) and the external device 2 ( 3000-2), local models 1 and 2 can be used to perform various operations.
  • Each of the local models 1 and 2 stored in each of the external device 1 (3000-1) and the external device 2 (3000-2) is, according to an embodiment, each of the external device 1 (3000-1), and It may be updated based on the different context information collected by the device 2 (3000-2). Accordingly, each of the local models 1 and 2 may be an artificial intelligence model including different data suitable for the situation of each of the external device 1 (3000-1) and the external device 2 (3000-2).
  • users of the external device 1 (3000-1), the external device 2 (3000-2), and the electronic device 1000 may be different from each other.
  • the present invention is not limited thereto, and the external device 1 (3000-1), the external device 2 (3000-2), and the electronic device 1000 may be used by the same user.
  • the server 2000 may be configured from at least one of the external device 1 (3000-1) and the external device 2 (3000-2), and at least one of local models 1 and 2 updated in each device. At least one gradient obtained based on the model may be received.
  • the local model updated in each device may be updated as context information collected by each of the external device 1 (3000-1) and the external device 2 (3000-2) is changed.
  • the server 2000 in the same manner as in the case of updating the global model based on the gradient received from the electronic device 1000 described above, the server 2000 may be configured with external device 1 (3000-1) and external device 2 (3000). According to at least one gradient received from -2), the global model of the server 2000 may be updated.
  • the server 2000 is the electronic device 1000 From, the obtained gradient based on the updated local model may be received.
  • the server 2000 generates a global model updated according to the gradient received from at least one of the external device 1 (3000-1) and the external device 2 (300-2) based on the gradient received from the electronic device 1000, You can update again.
  • the server 2000 may transmit information on the updated global model to the electronic device 1000.
  • the electronic device 1000 may provide a better service to the user using the local model.
  • the server 2000 may update the global model whenever a gradient is received from the electronic device 1000, the external device 1 3000-1, and the external device 2 3000-2.
  • the server 2000 may transmit information on the updated global model to the device that transmitted the gradient to the server 2000.
  • the global model of the server 2000 may be updated as information on the situation of the server 2000 changes. Accordingly, according to an embodiment, even when data (ex. the gradient of the local model updated by the electronic device 1000 or other external devices 3000-1 and 3000-2) is not received from the outside, the server 2000 ), the global model of the server 2000 may be updated.
  • the global model may be continuously updated based on gradients continuously received from a plurality of devices, or based on a change in information about a situation of the server 2000.
  • the global model is not limited to the above example, and may be continuously updated according to various methods based on various types of data.
  • the local model may not be updated for a considerable period of time as the context information used to update the local model is not changed. Therefore, the difference between the local model and the global model may increase.
  • the server 2000 includes a gradient of a current global model and a gradient of the global model most recently transmitted from the server 2000 to the electronic device 1000. It can be determined whether or not there is a difference greater than or equal to the reference value. The determination may be periodically performed by the server 2000.
  • the server 2000 may transmit the gradient for the recently updated global model to the electronic device 1000.
  • the electronic device 1000 may update the local model based on information on the global model received from the server 2000, for example, a gradient of the global model.
  • the electronic device 1000 may receive the gradient for the most recently updated global model from the server 2000 without transmitting the gradient from the electronic device 1000 to the server 2000. have.
  • the electronic device 1000 according to an exemplary embodiment receives the gradient for the most recently updated global model from the server 2000 even if the context information collected by the electronic device 1000 is not changed, so that the global model is Based on the local model update operation can be continuously performed.
  • the server 2000 may transmit a gradient for the currently updated global model to the electronic device 1000 under various conditions. For example, when the server 2000 receives a gradient from at least one external device other than the electronic device 1000 by a reference number or more and updates the global model by a reference number or more, the server 2000 For example, the gradient may be transmitted to the electronic device 1000.
  • FIG. 3 is a diagram illustrating a system for performing object recognition using a local model according to an exemplary embodiment.
  • a system for performing an object recognition operation using a local model may include a server 2000 and at least one electronic device 3001, 3002, and 3003. At least one electronic device 3001, 3002, and 3003 illustrated in FIG. 3 may correspond to the electronic device 1000 illustrated in FIGS. 1 and 2.
  • Each of the electronic devices 3001, 3002, and 3003 may be a home appliance that is placed in a different home environment and can be used by different users. As each of the electronic devices 3001, 3002, and 3003 are placed in different home environments, recognizable objects may be different from each other.
  • Each of the electronic devices 3001, 3002, and 3003 according to an embodiment includes local object recognition models 1, 2, and 3, respectively, for performing object recognition, and each of the electronic devices 3001, 3002, and 3003 Object recognition can be performed using local object recognition models 1, 2, and 3.
  • each of the electronic devices 3001, 3002, and 3003 is based on the information on the surrounding environment of each of the electronic devices 3001, 3002, and 3003, according to the local object recognition models 1, 2, and 3 for object recognition. At least one of the local models can be updated. Accordingly, in the local object recognition models 1, 2, and 3 of each electronic device 3001, 3002, and 3003 according to an embodiment, an object recognition operation suitable for different surrounding environments of each electronic device 3001, 3002, and 3003 is performed. It can be updated so that it can be performed.
  • information on the surrounding environment used to update the local object recognition model includes state information, appearance information, shape information, etc. about objects that can be recognized by each electronic device (3001, 3002, 3003). can do.
  • the information on the surrounding environment is not limited to the above example, and may include various pieces of information that can be used to update a local object recognition model for object recognition.
  • the context information collected in relation to the local object recognition model for object recognition among the context information collected by the electronic device 1000 is Various information related to object recognition may be included, such as information and information on an object newly recognized by the electronic device 1000 among objects existing around the electronic device 1000.
  • the server 2000 recognizes the global object according to the gradient of the updated local object recognition model in each electronic device 3001, 3002, and 3003. You can update the model.
  • FIG. 4 is a diagram illustrating a system for performing speech recognition using a local model according to an embodiment.
  • a system for performing an operation for speech recognition using a local model may include a server 2000 and at least one electronic device 4001, 4002, and 4003. At least one electronic device 4001, 4002, and 4003 illustrated in FIG. 3 may correspond to the electronic device 1000 illustrated in FIGS. 1 and 2.
  • the server 2000 may include a global speech processing model that can be used to perform an operation for speech recognition among global models.
  • each electronic device 4001, 4002, 4003 according to an embodiment is a local model that can be used to perform an operation for speech recognition, and may include local speech processing models 1, 2, and 3, respectively. have.
  • Each of the electronic devices 4001, 4002, and 4003 may have different surrounding environments and may be electronic devices that may be used by different users. As each of the electronic devices 4001, 4002, and 4003 are placed in different surrounding environments, speech recognition may be performed based on noise information of different surrounding environments.
  • information collected in relation to a local model for voice recognition is information about noise generated in the surrounding environment of the electronic device 1000 .
  • Various information related to speech recognition may be included, such as information about a user's voice that can be recognized by the device 1000.
  • the electronic devices 4001, 4002, and 4003 may be located in a house, a company, or a bus, respectively. As the electronic devices 4001, 4002, and 4003 are placed in different surrounding environments, noise characteristics included in an audio signal to be recognized for speech may be different from each other.
  • each of the electronic devices 4001, 4002, and 4003 may more effectively perform speech recognition according to a local speech processing model by using noise information of a surrounding environment.
  • each electronic device 4001, 4002, 4003 recognizes the user's voice included in the audio signal based on the voice characteristic of the user who wants to perform speech recognition and the noise characteristic of the surrounding environment. Can be performed more effectively.
  • each electronic device 4001, 4002, 4003 acquires relationship information between the user's voice and at least one type of noise, and based on the obtained information, speech recognition is performed.
  • the local speech processing model can be updated so that it can be performed effectively.
  • each of the electronic devices 4001, 4002, and 4003 may update a local model for speech recognition according to information about noise in the surrounding environment of each of the electronic devices 4001, 4002, and 4003. . Accordingly, in the local speech processing model of each electronic device 4001, 4002, 4003 according to an embodiment, a speech recognition operation suitable for noise in different surrounding environments of each electronic device 4001, 4002, 4003 can be performed. So that it can be updated.
  • the information on noise of the surrounding environment used to update the local speech processing model is information on the characteristic of at least one type of noise that can be detected by each electronic device 4001, 4002, 4003, Relationship information between the user's voice and at least one type of noise may be included.
  • the above-described example is not limited, and the information on the noise of the surrounding environment may include various types of information that can be used to update a local speech processing model for speech recognition.
  • the local voice processing model according to the embodiment may be updated. For example, when a new type of noise appears, a case where new relationship information is acquired among the relationship information between the user's voice and at least one type of noise, etc., it may be determined that the situation information according to an embodiment is changed. I can.
  • the server 2000 updates the global speech processing model according to the updated local model in each electronic device 4001, 4002, and 4003. can do.
  • FIG. 5 is a diagram illustrating an example in which a local model and a global model are updated according to an embodiment.
  • the electronic device 1000 may include a local model 501, and the server 2000 may include a global model 502.
  • the horizontal arrow relates to an embodiment of performing an operation through each artificial intelligence model
  • the vertical arrow is an embodiment of updating each artificial intelligence model and Related.
  • the electronic device 1000 updates the local model 501 based on various information for updating the local model 501 collected by the electronic device 1000, and the updated local model 501 The gradient can be obtained based on.
  • the information for updating the local model 501 may include changed context information on the electronic device 1000.
  • the update information may include changed context information based on feedback information on a result of an operation performed by the local model 501.
  • the server 2000 updates the global model 502 based on information for updating the global model 502 collected by the server 2000, and the updated global model 502 You can obtain a gradient for.
  • information for updating the global model 502 is obtained as the server 2000 updates a local model stored in the electronic device 1000 or another external device through the network 100. It can be obtained by receiving the gradient.
  • the server 2000 may update the global model 502 based on the received gradient.
  • the server 2000 may transmit the updated gradient of the global model 502 to the electronic device 1000 or another external device that has transmitted the gradient of the local model to the server 2000.
  • the local model 501 and the global model 502 may output output information corresponding to the input information as input information is respectively input.
  • the electronic device 1000 when operating according to an on-device method, may perform an item recommendation operation, an object recognition operation, a voice recognition operation, or the like according to the local model 501.
  • the input information input to the local model 501 may include information necessary to perform the above-described item recommendation operation, object recognition operation, and voice recognition operation.
  • the input information on the item recommendation operation may include information on the type of an item to be recommended.
  • the input information on the object recognition operation may include sensor information (eg, image information, infrared detection information, etc.) currently detected by the electronic device 1000.
  • the input information on the speech recognition operation may include information on an audio signal currently received by the electronic device 1000.
  • the above-described input information may include context information used to update the local model. The input information is not limited to the above example, and the input information may include various pieces of information for performing an operation in the electronic device 1000.
  • the output information output from the local model 501 may include information on a result of performing the above-described item recommendation operation, object recognition operation, and voice recognition operation.
  • the output information on the item recommendation operation may include information on the recommended item and ranking information on the recommended item.
  • the output information on the object recognition operation may include identification information, status information, and the like about an object recognized based on sensor information.
  • the output information for the speech recognition operation may include text information obtained as a result of speech recognition of an audio signal input as input information.
  • the output information is not limited to the above-described example, and the output information may include various pieces of information indicating a result of performing an operation according to the local model 501 in the electronic device 1000.
  • the server 2000 when the electronic device 1000 operates according to a cloud method rather than an on-device method, the server 2000 performs various operations using the global model 502 according to the request of the electronic device 1000. , For example, an item recommendation operation, an object recognition operation, a voice recognition operation, and the like may be performed.
  • the above-described operation is performed while transmitting input information to be input to the local model 501 to the server 2000 instead of inputting to the local model 501 It is possible to request the server 2000 to perform.
  • the server 2000 may perform an operation using the global model 502 according to the request of the electronic device 1000 and transmit the result to the electronic device 1000.
  • FIG. 6 is a diagram illustrating an example of a local model or a global model according to an embodiment.
  • a local model or a global model may be configured as a neural network model that mimics a manner in which the human brain recognizes patterns.
  • the electronic device 1000 or the server 2000 may provide various services to a user using a local model or a global model composed of a neural network model.
  • the neural network model is a deep neural network (DNN), a convolutional neural network (CNN), a recurrent neural network (RNN), a bidirectional recurrent deep neural network (BRDNN), and a limited Boltzmann. It may be one of a Restricted Boltzmann Machine (RBM), a Deep Belief Network (DBN), or a Deep Q-Networks. Further, the present invention is not limited to the above example, and the local model or the global model according to an embodiment may be one of various types of neural networks.
  • a neural network model may include at least one layer including at least one node.
  • the neural network model may include layer 1 as an input layer and layer 2 as an output layer.
  • the neural network model according to an embodiment may further include at least one hidden layer (not shown) between the input layer and the output layer.
  • a neural network including an input layer and an output layer excluding a hidden layer will be described as an example.
  • At least one input value may be input to layer 1 of the neural network model.
  • values of I1 and I2 may be input to the nodes N11 and N12 of layer 1, respectively.
  • nodes N11, N12, N21, and N22 included in layers 1 and 2 of the neural network model may be processed.
  • a value output from the node of each layer may be used as an input value of the next layer.
  • a predetermined value may be input to the nodes N21 and N22 of the layer 2 based on the values obtained as the nodes N11 and N12 of the layer 1 are processed.
  • the value output from layer 2 may be output as an output value in the neural network model.
  • values O1 and O2 output from layer 2 may be output as output values of the neural network model.
  • the electronic device 1000 may input a value of input information into an input layer of a local model. Also, the electronic device 1000 may provide various services (eg, item recommendation, object recognition, and voice recognition) to a user based on a value output from the output layer of the local model.
  • various services eg, item recommendation, object recognition, and voice recognition
  • At least one edge data may be obtained from one node.
  • Edge data is data that can be obtained by applying at least one weight to one value output from one node.
  • Edge data may be obtained as many as the number of weights applied to one value.
  • a value output from each node of layer 1 may be converted into at least one edge data and input to a node of a next layer.
  • edge data to which different weights W11 and W12 are applied to a value output from node N11 may be input to nodes N21 and N22 of the next layer, respectively.
  • edge data to which different weights W21 and W22 are applied to a value output from node N12 may be input to nodes N21 and N22 of the next layer, respectively.
  • the local model when the local model is updated, at least one weight value applicable to each node may be changed.
  • the gradient according to an embodiment may include information obtained in an operation process for deriving an optimal weight value applied to each node.
  • a loss function or a cost function may be used.
  • the loss value that can be determined through the loss function may be determined based on a difference between prediction information that can be output by a local model and observation information indicating a correct answer to the prediction information.
  • the observation information may be determined as corresponding information of prediction information that can be output by a local model based on the currently collected situation information.
  • the local model may be updated by replacing the weight value W11 of the local model with the weight value W11' when the loss value is minimized.
  • a mean squared error function a cross entropy error function, or the like may be used.
  • the above-described example is not limited, and various types of functions may be used as the loss function.
  • Equation 1 The mean square error function and the cross entropy error function according to an embodiment may be expressed as Equation 1 below.
  • the first is a mean square error function
  • the second is a cross entropy error function.
  • y and t represent values of prediction information and observation information, respectively.
  • the electronic device 1000 minimizes the loss value obtained by the loss function (ex. the weight value of each node of the local model, and Bias value) can be determined.
  • the electronic device 1000 uses a first prediction value among a plurality of prediction values of the prediction information as a variable, and other prediction values as a constant in a graph of a loss function that has a minimum slope.
  • the loss value ie, the result of the loss function
  • the minimum value of the slope may be obtained as the first gradient.
  • the electronic device 1000 may obtain the gradient including the first to nth gradients as the updated local model gradient.
  • the electronic device 1000 may update the local model based on a parameter corresponding to at least one predicted value.
  • the gradient may include various types of values obtained in a process of deriving various types of information constituting the updated local model according to the update of the local model.
  • the gradient may include at least one weight value that can be applied to nodes constituting the updated local model, and difference values between weight values of the local model before the update.
  • the gradient of the global model may also be obtained, like the gradient of the local model described above.
  • prediction information that can be obtained by the updated global model and slope information of a loss function corresponding to the updated global model may be obtained as a gradient of the updated global model.
  • the gradient of the global model may include at least one weight value applicable to nodes constituting the updated global model and difference values between weight values of the global model before the update.
  • FIG. 7 is a diagram for describing an operation of the electronic device 1000 according to an exemplary embodiment.
  • the electronic device 1000 may perform an operation of recommending an item using the local model 701 and the context information 702.
  • a predetermined operation (ex. item recommendation, object recognition, voice recognition) may be performed in the electronic device 1000 by the local model 701, and based on the result of the performed operation, the situation Information 702 can be changed.
  • the context information 702 may be changed based on the user's feedback information on the result of the above-described operation.
  • the user's feedback information on the operation according to the local model 701 is changed context information 702 and may be used to update the local model 701.
  • the above-described predetermined operation (ex. item recommendation, object recognition, voice recognition) may be performed, but the context information ( When 702 is changed, the local model 701 may be updated based on the changed context information 702.
  • the operation is performed according to the local model 701
  • the context information 702 is changed based on the feedback information generated according to the result of the operation execution, and the changed context information 702 is converted to the local model 701 It is assumed that one step has been performed in the operation transmitted to the local model 701 as information for updating ).
  • At least one of updating the local model 701 and an operation performed by the local model 701 may be performed whenever one step is performed.
  • a gradient may be generated based on the finally updated local model 701 after repeatedly performing a predetermined number of steps.
  • the electronic device 1000 may receive information on the global model by transmitting the generated gradient to the server 2000 and update the local model 701 again based on the received information. have.
  • the gradient of a local model or a global model may further include information obtained based on information about a policy and a value.
  • the information on the policy of the local model may include information on which operation can be selected as an output value according to a value input to the local model.
  • the information on the policy ( ⁇ ) may include information for indicating at least one of a weight value and a bias value for each node described above.
  • information about the policy May be expressed as, a is an operation as an output value of the local model, s is a state information as an input value of the local model, t is time, and ⁇ is a parameter.
  • the information on the value of the local model may include information on the value indicating how appropriate the information on the policy is to perform an operation according to the local model.
  • the information on the value V may be expressed as V(S t , ⁇ v ).
  • information (L p ) on data about a policy of a local model and information (L v ) about data about a value may be obtained according to Equations 2 and 4 below, respectively.
  • Equation 2 H( ⁇ ( ⁇ )) denotes an entropy function for a policy that improves model exploration, and ⁇ denotes a parameter for adjusting the strength of an entropy regularization term.
  • Equation 2 A(s,a; ⁇ , ⁇ v ) of Equation 2 may be obtained according to Equation 2 below.
  • Equation 3 k represents the total number of times the local model has been updated, and ⁇ represents a discount factor.
  • Equation 4 R represents user feedback information.
  • the gradient may include various types of information that can be used to determine a value related to at least one node constituting the local model.
  • FIG. 8 is a diagram illustrating an example in which a local model is updated according to the passage of time according to an embodiment.
  • the electronic device 1000 performs an operation by inputting context information 801 into the local model 802, and obtains user feedback information 803 for the performed operation.
  • the context information 801 of the electronic device 1000 is input information, and is input to the local model 802 to perform a predetermined operation.
  • the above-described example is not limited, and various information required to perform an operation as well as the context information 801 may be input to the local model 802.
  • the context information collected in relation to the first artificial intelligence model for item recommendation is at least one that can be recommended by the first artificial intelligence model. It may include various information related to item recommendation, such as information on an item of, and information on an interaction between a user and at least one item.
  • Information on at least one item that can be recommended by the local model may include, for example, an application, a video, a still image, a text file, a web page, and the like.
  • the item may include link information or index information connected to an image of the item.
  • the item may be configured in the form of an object for service use.
  • An object for using a service refers to a user interface for using a service of a service provider.
  • the object for use of the service includes a user interface including icon, text, image, and link information, and description information on the function of the object, for using a service provided from a content provider. I can.
  • Information on the interaction between the user and at least one item is, for example, information on the history of using at least one item by the user, feedback information from the user on the item recommended by the local model, and at least one by the user. It may include information about a method, a time, a place, etc. in which the item of is used, information about a signal input to at least one item by a user, and the like.
  • the feedback information 803 may be generated based on information output according to an operation performed according to the local model 802.
  • the feedback information 803 may include information input by a user about a result of an operation performed according to the local model 802.
  • the feedback information 803 is output information of the local model 802, which is information about which item of the recommended items is selected, and whether the user has selected a recommended item. It may include information on, ranking information on a recommended item input by a user, and the like.
  • the feedback information 803 is output information of the local model 802 and may include information on the user's opinion on whether the object recognition or speech recognition result is appropriate. have.
  • the context information 804 may be changed based on the changed state 803-1 according to the user's feedback information 803. For example, based on the user's feedback information 803, the electronic device 1000 may change information on an interaction between the user and the item among the context information 804. Also, based on the result of the item recommendation operation, the electronic device 1000 provides information on whether each item is recommended to the user and is finally selected as feature information about each item in the context information 804. You can change it. In addition, the electronic device 1000 may change information on the object recognition or speech recognition result among the context information 804, based on the user's feedback information 803 on the result of performing the object recognition or speech recognition operation. have.
  • the situation information 804 is not limited to the above-described example, and may be changed by various methods based on the state 803-1 changed according to the user's feedback information 803.
  • the local model 805 may be updated based on the feedback information.
  • the electronic device 1000 may update the local model 805 by reflecting the user's feedback information.
  • the electronic device 1000 uses the changed situation information 804 as the local model, similarly to the time point T1.
  • An operation may be performed by inputting it into 805, and user feedback information 806 about the performed operation may be obtained.
  • the change of the context information 804 and the update of the local model 805 may be performed in the same manner as at the time points T1 and T2.
  • the context information 807 may be changed based on the changed state 805-1 according to the changed state 806-1 according to the user's feedback information 806.
  • the electronic device 1000 displays the changed situation information 807 as at the time points T1 and T2. ) Is input to the local model 808 to perform an operation, and user feedback information 809 for the performed operation may be obtained.
  • FIG. 9 is a block diagram illustrating an internal configuration of an electronic device 1000 according to an exemplary embodiment.
  • FIG. 10 is a block diagram illustrating an internal configuration of an electronic device 1000 according to an exemplary embodiment.
  • the electronic device 1000 may include a memory 1700, a processor 1300, and a communication unit 1500. However, not all of the components shown in FIG. 9 are essential components of the electronic device 1000.
  • the electronic device 1000 may be implemented by more components than the components illustrated in FIG. 9, or the electronic device 1000 may be implemented by fewer components than the components illustrated in FIG. 9.
  • the electronic device 1000 includes a user input unit 1100 in addition to the memory 1700, the processor 1300, and the communication unit 1500.
  • An output unit 1200, a sensing unit 1400, and an A/V input unit 1600 may be further included.
  • the user input unit 1100 refers to a means for a user to input data for controlling the electronic device 1000.
  • the user input unit 1100 includes a key pad, a dome switch, a touch pad (contact type capacitance method, pressure type resistive film method, infrared detection method, surface ultrasonic conduction method, integral type). Tension measurement method, piezo effect method, etc.), a jog wheel, a jog switch, and the like, but are not limited thereto.
  • the user input unit 1100 may receive a user input requesting a predetermined operation (eg, item recommendation, object recognition, voice recognition) that may be performed according to a local model. Also, the user input unit 110 may receive a user input including feedback information on an operation performed by the local model of the electronic device 1000.
  • a predetermined operation eg, item recommendation, object recognition, voice recognition
  • the output unit 1200 may output an audio signal, a video signal, or a vibration signal, and the output unit 1200 may include a display unit 1210, an audio output unit 1220, and a vibration motor 1230. have.
  • the output unit 1200 according to an embodiment may output a result of an operation performed by a local model.
  • the display 1210 displays and outputs information processed by the electronic device 1000. According to an embodiment, the display 1210 may display a result of an operation performed by the local model according to a user's input.
  • the display unit 1210 may be used as an input device in addition to an output device.
  • the display unit 1210 includes a liquid crystal display, a thin film transistor-liquid crystal display, an organic light-emitting diode, a flexible display, and a 3D display. It may include at least one of a 3D display and an electrophoretic display.
  • the electronic device 1000 may include two or more display units 1210.
  • the sound output unit 1220 outputs audio data received from the communication unit 1500 or stored in the memory 1700.
  • the sound output unit 1220 may output audio data indicating a result of an operation performed by the local model.
  • the vibration motor 1230 may output a vibration signal.
  • the vibration motor 1230 may output a vibration signal when a touch is input to the touch screen.
  • the vibration motor 1230 according to an embodiment may output a vibration signal representing a result of an operation performed by the local model.
  • the processor 1300 generally controls the overall operation of the electronic device 1000.
  • the processor 1300 executes programs stored in the memory 1700, so that the user input unit 1100, the output unit 1200, the sensing unit 1400, the communication unit 1500, the A/V input unit 1600 ) And so on.
  • the electronic device 1000 may include at least one processor 1300.
  • the processor 1300 may be configured to process instructions of a computer program by performing basic arithmetic, logic, and input/output operations.
  • the command may be provided to the processor 1300 from the memory 1700 or may be received through the communication unit 1500 and provided to the processor 1300.
  • the processor 1300 may be configured to execute an instruction according to a program code stored in a recording device such as a memory.
  • the at least one processor 1300 may detect that information about the situation of the electronic device 1000 used to update the local model is changed.
  • the information about the situation is information about the situation of the electronic device 1000.
  • the situation information includes information about the state of the electronic device 1000, information about the user of the electronic device 1000, and Information about the surrounding environment of the device 1000 may be included.
  • At least one processor 1300 may generate a gradient for updating the local model based on the changed context information. At least one processor 1300 according to an embodiment may update a local model using a gradient.
  • the at least one processor 1300 may update the local model of the electronic device 1000 again based on information on the global model received as the gradient is transmitted to the server.
  • the information on the global model may be a gradient of the global model generated based on the gradient transmitted from the electronic device 1000.
  • a gradient of the global model may be generated based on the gradient transmitted from the electronic device 1000, and the global model may be updated based on the gradient of the global model.
  • the sensing unit 1400 may detect a state of the electronic device 1000 or a state of an environment surrounding the electronic device 1000 and transmit the sensed information to the processor 1300.
  • context information used to update a local model may be obtained. For example, based on various types of sensing information about the user or surrounding environment sensed by the sensing unit 1400, information about the user or surrounding environment may be obtained from among the context information.
  • the sensing unit 1400 includes a magnetic sensor 1410, an acceleration sensor 1420, a temperature/humidity sensor 1430, an infrared sensor 1440, a gyroscope sensor 1450, and a position sensor.
  • a position sensor e.g, GPS
  • barometric pressure sensor 1470, proximity sensor 1480, and RGB sensor (illuminance sensor) 1490 may include at least one of, but is not limited thereto.
  • the communication unit 1500 may include one or more components that allow the electronic device 1000 to communicate with a server (not shown) or an external device (not shown).
  • the communication unit 1500 may include a short range communication unit 1510, a mobile communication unit 1520, and a broadcast reception unit 1530.
  • the short-range wireless communication unit 1510 includes a Bluetooth communication unit, a Bluetooth Low Energy (BLE) communication unit, a near field communication unit, a WLAN (Wi-Fi) communication unit, a Zigbee communication unit, and an infrared ( IrDA, infrared data association) communication unit, WFD (Wi-Fi Direct) communication unit, UWB (ultra wideband) communication unit, Ant+ communication unit, etc. may be included, but is not limited thereto.
  • the mobile communication unit 1520 transmits and receives a radio signal with at least one of a base station, an external terminal, and a server on a mobile communication network.
  • the wireless signal may include a voice call signal, a video call signal, or various types of data according to transmission/reception of text/multimedia messages.
  • the broadcast receiver 1530 receives a broadcast signal and/or broadcast-related information from outside through a broadcast channel.
  • Broadcast channels may include satellite channels and terrestrial channels.
  • the electronic device 1000 may not include the broadcast receiver 1530.
  • the communication unit 1500 may transmit the gradient generated by the electronic device 1000 to the server 2000, and receive information about the updated global model from the server 2000 based on the transmitted gradient. have.
  • the A/V (Audio/Video) input unit 1600 is for inputting an audio signal or a video signal, and may include a camera 1610 and a microphone 1620.
  • the camera 1610 may obtain an image frame such as a still image or a moving image through an image sensor in a video call mode or a photographing mode.
  • the image captured through the image sensor may be processed through the processor 1300 or a separate image processing unit (not shown).
  • the microphone 1620 receives an external sound signal and processes it as electrical voice data.
  • the electronic device 1000 may obtain context information based on an audio signal or a video signal input received through the audio/video (A/V) input unit 1600. For example, based on the audio signal or video signal input for the user or the surrounding environment, acquired by the A/V (Audio/Video) input unit 1600, information about the user or the surrounding environment is to be acquired. I can.
  • A/V Audio/Video
  • the memory 1700 may store a program for processing and controlling the processor 1300 and may store data input to the electronic device 1000 or output from the electronic device 1000.
  • the memory 1700 may store one or more instructions, and at least one processor 1300 of the electronic device 1000 described above executes the one or more instructions stored in the memory 1700, The operation according to the embodiment may be performed.
  • the memory 1700 may store at least one local model that can be used to perform at least one operation, and context information of the electronic device 1000 that can be used to update the local model. have.
  • the memory 1700 is a flash memory type, a hard disk type, a multimedia card micro type, a card type memory (for example, SD or XD memory), and RAM.
  • RAM Random Access Memory
  • SRAM Static Random Access Memory
  • ROM Read-Only Memory
  • EEPROM Electrically Erasable Programmable Read-Only Memory
  • PROM Programmable Read-Only Memory
  • magnetic memory magnetic disk And at least one type of storage medium among optical disks.
  • Programs stored in the memory 1700 may be classified into a plurality of modules according to their functions, for example, a UI module 1710, a touch screen module 1720, a notification module 1730, and the like. .
  • the UI module 1710 may provide a specialized UI, GUI, etc. that are interlocked with the electronic device 1000 for each application.
  • the touch screen module 1720 may detect a user's touch gesture on the touch screen and transmit information on the touch gesture to the processor 1300.
  • the touch screen module 1720 according to some embodiments may recognize and analyze a touch code.
  • the touch screen module 1720 may be configured as separate hardware including a controller.
  • Various sensors may be provided inside or near the touch screen to sense a touch or a proximity touch of the touch screen.
  • a sensor for sensing a touch on a touch screen there is a tactile sensor.
  • the tactile sensor refers to a sensor that detects contact with a specific object to the extent that a person feels it or more.
  • the tactile sensor can detect various information such as roughness of a contact surface, hardness of a contact object, and temperature of a contact point.
  • the user's touch gesture may include tap, touch & hold, double tap, drag, pan, flick, drag and drop, swipe, and the like.
  • the notification module 1730 may generate a signal to notify the occurrence of an event of the electronic device 1000.
  • FIG. 11 is a block diagram showing an internal configuration of a server according to an embodiment.
  • the server 2000 may include a memory 2100, a processor 2200, and a communication unit 2300, like components of the electronic device 1000 illustrated in FIG. 9. have.
  • the server 2000 may be implemented by more components than the components shown in FIG. 11, or the server 2000 may be implemented by fewer components than the components shown in FIG. 11.
  • the processor 2200 typically controls the overall operation of the server 2000.
  • the processor 2200 may overall control the server 2000 by executing programs stored in the memory 2100.
  • the server 2000 may include at least one processor 2200.
  • the processor 2200 may be configured to process instructions of a computer program by performing basic arithmetic, logic, and input/output operations.
  • the command may be provided to the processor 2200 from the memory 2100 or may be received through the communication unit 2300 and provided to the processor 2200.
  • the processor 2200 may be configured to execute an instruction according to a program code stored in a recording device such as a memory.
  • At least one processor 2200 may update the global model based on the gradient received from the electronic device 1000. Also, the at least one processor 2200 may generate information on the updated global model and transmit it to the electronic device 1000.
  • the at least one processor 2200 may update the global model based on gradients received from not only the electronic device 1000 but also a plurality of external devices. Accordingly, the global model according to an embodiment may be updated based on not only the gradient of the electronic device 1000 but also the gradients of a plurality of external devices transmitted to the server 2000.
  • the communication unit 2300 may include one or more components that allow the server 2000 to communicate with the electronic device 1000 or an external device.
  • the communication unit 2300 may receive a gradient from the electronic device 1000 and transmit information about an updated global model to the electronic device 1000 based on the received gradient.
  • the memory 2100 may store a program for processing and controlling the processor 2200 and may store data input to the server 2000 or output from the server 2000.
  • the memory 2100 may store one or more instructions, and at least one processor 2200 of the server 2000 described above executes the one or more instructions stored in the memory 2100. You can perform the operation by example.
  • the memory 2100 of the server 2000 may store a global model for performing a predetermined operation (eg, item recommendation, object recognition, voice recognition).
  • a predetermined operation eg, item recommendation, object recognition, voice recognition.
  • FIG. 12 is a flowchart illustrating a method of updating a local model according to an embodiment.
  • the electronic device 1000 may detect that context information of the electronic device 1000 used to update the local model is changed.
  • the context information of the electronic device 1000 may be used to update a local model provided in the electronic device 1000, and is inputted to the local model, whereby actions according to the local model (ex. item recommendation, object recognition, voice) Recognition) may be used to perform.
  • context information related to an usable item in the electronic device 1000 may be changed.
  • context information related to the place of the electronic device 1000 may be changed.
  • context information on the surrounding environment of the electronic device 1000 may be changed.
  • context information on the talker for which voice recognition can be performed by the electronic device 1000 may be changed.
  • the context information may be changed based on the user's feedback information on the result of performing the operation according to the local model.
  • the state information is not limited to the above-described example, and the state information may include information on the situation of various types of electronic devices 1000 that may be used to update the local model or perform an operation according to the local model.
  • the electronic device 1000 may determine a gradient for updating the local model according to the changed context information.
  • the gradient may be obtained based on the changed situation information, based on a loss function indicating a difference between prediction information that can be output to a local model and observation information indicating a correct answer to the prediction information.
  • the gradient may include information related to a point at which the loss function is minimized, for example, slope information of the loss function at the point.
  • the electronic device 1000 may update the local model based on the gradient.
  • the electronic device 1000 may transmit the gradient to the server 2000.
  • the electronic device 1000 may transmit a gradient to the server 2000 instead of state information of the electronic device 1000 that may include sensitive personal information of a user. Accordingly, according to an exemplary embodiment, a risk of leakage in the process of transmitting the user's sensitive personal information may be eliminated.
  • At least one of an operation of adding noise to the gradient and an operation of performing encryption may be additionally performed so that the gradient may be protected during a transmission process.
  • a randomly generated noise value may be added to at least one value representing data modified in the updated artificial intelligence model included in the gradient.
  • the noise value may be a value that is negligibly small compared to the at least one value. Accordingly, the electronic device 1000 or the server 2000 may update a local model or a global model according to an embodiment without identifying or removing the added noise, even if the above-described noise is added to the gradient. The operation can be performed.
  • the gradient may be protected from an external attack or a risk of external leakage.
  • the electronic device 1000 may receive information on a global model as the gradient is transmitted to the server 2000.
  • the global model of the server 2000 may be updated based on the gradient transmitted by the electronic device 1000, and information on the updated global model may be transmitted to the electronic device 1000.
  • the information on the updated global model may be a gradient of the updated global model.
  • the information on the global model received in operation 1205 may be a gradient of the global model including information constituting the global model.
  • the electronic device 1000 obtains the gradient of the updated global model of the server 2000 based on the gradient of the last updated global model, and in step 1206, updates the local model based on the obtained gradient of the global model. can do.
  • the gradient of the global model may be obtained based on difference values of weight values of the global model of the server 2000 in a fixed time interval.
  • the fixed time period may be set based on a time period in which communication between the electronic device 1000 and the server 2000 is performed.
  • the fixed time period may be set as a period between the most recent time point in which communication between the electronic device 1000 and the server 2000 is performed and a time point before it.
  • the above-described example is not limited, and the gradient of the global model may include various types of information used to update the global model.
  • the electronic device 1000 may perform an operation according to the updated local model based on the gradient of the global model.
  • FIG. 13 is a flowchart illustrating a method of updating a global model in a server according to an embodiment.
  • the server 2000 may receive a gradient from the electronic device 1000.
  • the electronic device 1000 may update the local model based on a change in information on the situation of the electronic device 1000, which is used to update the local model of the electronic device 1000.
  • the electronic device 1000 may transmit a gradient including information configuring the updated local model to the server 2000.
  • the server 2000 may receive the gradient from the electronic device 1000.
  • the server 2000 may update the global model based on the gradient.
  • the global model according to an embodiment is a model for performing a predetermined operation (ex. item recommendation, object recognition, voice recognition) corresponding to a local model, and based on a gradient received from the electronic device 1000, Can be updated.
  • the server 2000 may update the global model by updating various pieces of information constituting the global model based on the gradient.
  • the server 2000 may update the global model by updating a weight value and a bias value for each node constituting the global model.
  • the server 2000 may generate information on the updated global model, for example, a gradient, and in operation 1304, the server 2000 may transmit information on the generated global model to the electronic device 1000.
  • the electronic device 1000 may update the local model of the electronic device 1000 based on information on the global model received from the server 2000.
  • the electronic device 1000 may perform a predetermined operation (eg, item recommendation, object recognition, voice recognition) using the updated local model.
  • a predetermined operation eg, item recommendation, object recognition, voice recognition
  • the gradient of the current global model stored in the server 2000 is a first gradient
  • the gradient of the local model transmitted from the electronic device 1000 to the server 2000 is a second gradient.
  • a gradient for updating a current global model that can be obtained will be referred to as a third gradient.
  • the server 2000 obtains a first gradient for a current global model, and based on the first gradient and a second gradient received from the electronic device 1000, the current global model It is possible to obtain a third gradient for updating. Based on the third gradient, the current global model may be updated, and as the third gradient is transmitted to the electronic device 1000 as information on the updated global model, the local model of the electronic device 1000 is updated again. Can be.
  • At least one representative value for information corresponding to each other between the first gradient for the updated global model and the second gradient for the updated local model may be obtained.
  • the third gradient according to an embodiment may be composed of the obtained at least one representative value.
  • the representative value may be, for example, an arithmetic average value or a weighted average value between gradient values included in the first gradient and the second gradient, respectively.
  • the representative value may be obtained based on a value obtained by simply adding gradient values included in the first gradient and the second gradient, respectively.
  • the first gradient may include gradient information of the loss function of the global model
  • the second gradient may include gradient information of the loss function of the global model.
  • the slope information may include values obtained by partial differentiation of a loss function by using each prediction value included in the prediction information as a variable.
  • the gradient information may include values corresponding to points at which the value of the loss function is minimized.
  • a representative value of the gradient information of the global model and the gradient information of the local model may be obtained as a representative value of the third gradient.
  • an arithmetic mean value (ex. (a+b)/2) or a weighted average value (ex.(a*a1) of the first gradient (a) of the global model and the second gradient (b) of the local model) +b*b1)/2) may be obtained as a representative value of the third gradient.
  • the global model may be updated based on the second gradient received from the electronic device 1000.
  • a weight value applied to each value updates the global model, and may be determined as the most suitable value.
  • the weight value may be determined as a value most suitable for updating the global model according to a result of machine learning performed to determine the weight value.
  • the weight of the weighted average value may be determined according to whether or not it is a gradient with respect to a training result to which a greater weight is desired among the training result of the global model and the training result of the local model.
  • the server 2000 may obtain a third gradient used to update the global model as information about the updated global model.
  • the information on the updated global model generated by the server 2000 may include information necessary for updating the local model of the electronic device 1000.
  • the local model of the electronic device 1000 may be updated based on the updated global model information (eg, a third gradient) received from the server 2000.
  • the local model may be updated according to the changed context information, and then updated based on the third gradient received from the server 2000 and the second gradient of the local model. For example, based on the third gradient received from the server 2000 and the second gradient of the local model, a fourth gradient for updating the local model may be obtained. Based on the fourth gradient, an update operation of the local model by receiving the third gradient may be performed.
  • At least one representative value for information corresponding to each other between information included in the third gradient and the second gradient may be obtained.
  • the fourth gradient according to an embodiment may be composed of the obtained at least one representative value.
  • the representative value may be, for example, an arithmetic average value or a weighted average value between values included in the third gradient and the second gradient.
  • the third gradient may include information related to the loss function of the updated global model
  • the second gradient may include information related to the loss function of the local model.
  • a representative value eg, an arithmetic average value, a weighted average value
  • the first gradient of the updated global model and the second gradient of the local model may be obtained as a representative value of the fourth gradient.
  • the local model may be updated based on the third gradient received from the electronic device 1000 based on the fourth gradient including at least one representative value described above. For example, information related to the loss function of the local model is replaced based on representative values included in the fourth gradient, so that the local model may be updated.
  • Weight values (ex. c1, d1) applied to each value may be determined as the most suitable value for updating the local model.
  • the weight value may be determined as a value most suitable for updating the local model according to a result of machine learning performed to determine the weight value.
  • the operation by the local model updated according to the weight value does not contradict the state of the electronic device 1000 or the surrounding situation of the electronic device 1000. It can be performed so that a weight value that can be properly performed can be determined.
  • the weight value may be learned based on information about the situation of the electronic device 1000. The above-described example is not limited, and each weight value applied to each value may be determined as a suitable value according to various methods.
  • the information on the updated global model is not limited to the above-described third gradient, and may include various types of information necessary to update the local model based on the recently updated global model. .
  • FIG. 14 is a diagram illustrating a system for updating a local model and a global model according to an embodiment.
  • a system includes an electronic device 1000, a first server 2000-1, a second server 2000-2, an external device 1 3000-1, and It may include an external device 2 (3000-2).
  • the electronic device 1000, the first server 2000-1, and the second server 2000-2 of FIG. 14 correspond to the electronic device 1000 and the server 2000 of FIG. 1.
  • external device 1 (3000-1) and external device 2 (3000-2) of FIG. 13 correspond to external device 1 (3000-1) and external device 2 (3000-2) of FIG.
  • the external device 1 (3000-1) and the external device 2 (3000-2) according to an embodiment are the same as the electronic device 1000, each of the external device 1 (3000-1) and the external device 2 ( By using the local model provided in 3000-2), various services can be provided.
  • the electronic device 1000 identifies the first server 2000-1 and the second server 2000-2 that can receive information on the global model by transmitting the gradient of the local model. can do.
  • the electronic device 1000 receives information on the first server 2000-1 and the second server 2000-2 from the outside in advance, so that the first server 2000-1 and the second server 2000-2 ) Can be identified.
  • the electronic device 1000 may determine a suitable server based on information on each of the identified first and second servers 2000-1 and 2000-2.
  • the electronic device 1000 may transmit the gradient to the determined server and receive information on the updated global model based on the gradient.
  • the electronic device 1000 may determine a server whose physical location is close to the electronic device 1000 among the identified first server 2000-1 and second server 2000-2 as a server to transmit the gradient. I can.
  • the electronic device 1000 transmits a gradient to a server including a global model having the same or similar characteristics as the characteristics of the local model among the identified first server 2000-1 and the second server 2000-2. It can be decided by the server.
  • the global model of the server is suitable for performing various operations such as an operation of recommending an item under a specific condition, an operation of performing object recognition, and an operation of performing voice processing, depending on the location of the server or various characteristics.
  • the global model of a server located in the UK may be a model created in consideration of cultural characteristics of the UK, and may be suitably used for the electronic device 1000 located in the UK to perform an operation of recommending an item. have.
  • the electronic device 1000 updates the local model with the global model of the first server 2000-1 among the first server 2000-1 and the second server 2000-2. If it is determined that it is appropriate, the gradient may be transmitted to the first server 2000-1.
  • the external device 1 (3000-1), similarly to the electronic device 1000, determines that it is appropriate to update the local model to the global model of the first server (2000-1). ) To send the gradient.
  • the external device 2 (3000-2) may transmit the gradient to the second server (2000-2) as it determines that it is appropriate to update the local model to the global model of the second server (2000-2). .
  • 15 is a diagram illustrating a system for updating a local model and a global model through an intermediary device according to an embodiment.
  • a system may include an electronic device 1 (1000-2), an electronic device 2 (1000-3), an electronic device 3 (1000-4), and a server 2000. I can.
  • the server 2000 of FIG. 15 corresponds to the electronic device 1000 of FIG. 1.
  • the electronic device 1 (1000-2), the electronic device 2 (1000-3), and the electronic device 3 (1000-4) are respectively )
  • a local model included in the electronic device 3 (1000-4) various services (eg, item recommendation, object recognition, and voice recognition) may be provided to a user.
  • the electronic device 1 (1000-2 ), the electronic device 2 (1000-3) and the electronic device 3 (1000-4) may be classified into one group 1000-1.
  • the electronic device 1 (1000-2), the electronic device 2 (1000-3), and the electronic device 3 (1000-4) are determined as devices used in the user's premises by the same user, and thus one group It can be classified as (1000-1).
  • the electronic device 2 (1000-3) and the electronic device 3 (1000-4) are, among devices in the group 1000-1 to which each electronic device belongs, each electronic device 2 (1000-3) and an electronic device.
  • An intermediary device to transmit the gradient of the local model of the device 3 1000-4 to the server 2000 may be determined.
  • the intermediate device may transmit the updated local model gradient to the server 2000 according to the change of context information. Further, the intermediary device receives the gradient of global information from the server 2000 as it transmits the updated local model gradient, and transmits the received gradient of the global information to the electronic device 2 (1000-3) and the electronic device 3 (1000). -4).
  • the electronic device 2 (1000-3) and the electronic device 3 (1000-4) refer to an intermediary device among the devices in the group 1000-1 to which each electronic device belongs to the electronic device 1 (1000-2). You can decide.
  • the electronic device 1 1000-2 determined as an intermediary device may be a device having better performance or a network environment than the electronic device 2 1000-3 and the electronic device 3 1000-4.
  • the electronic device 1 1000-2 may be a smartphone having better performance than the other electronic devices 1000-3 and 1000-4.
  • Other electronic devices 1000-3 and 1000-4 may be home appliances (eg, robot cleaners, refrigerators, and smart TVs) having lower processing performance than smart phones.
  • the gradient generated by each device through the electronic device 1 (1000-2) is transmitted to the server rather than when the electronic device 2 (1000-3) and the electronic device 3 (1000-4) directly transmit the gradient to the server 2000.
  • the electronic device 2 (1000-3) and the electronic device 3 (1000-4) directly transmit the gradient to the server 2000.
  • information about the updated global model can be obtained more quickly.
  • the electronic device 1 (1000-2) may directly process the gradient received from the electronic device 2 (1000-3) and the electronic device 3 (1000-4) according to the edge computing method.
  • the electronic device 1 (1000-2) is based on the gradient received from the electronic device 2 (1000-3) or the electronic device 3 (1000-4), the local model of the electronic device 1 (1000-2) Is updated, and the gradient for the updated local model may be transmitted to the electronic device 2 (1000-3) or the electronic device 3 (1000-4).
  • the electronic device 1 1000-2 may transmit the updated gradient for the local model of itself to the server 2000 and receive the gradient for the global model from the server 2000.
  • the electronic device 1 1000-2 may update its own local model again by using the received gradient of the global model.
  • the electronic device 1 (1000-2) is based on a gradient received from the electronic device 2 (1000-3) and the electronic device 3 (1000-4) and a local model of the electronic device 1 (1000-2). At least one of the generated gradients may be transmitted to the server 2000.
  • the electronic device 1 (1000-2) includes the electronic device 2 (1000-3) and the electronic device within a preset time.
  • a gradient is received from at least one of the three devices 1000-4, it may be transmitted to the server 2000 together with the gradient of the electronic device 1 1000-2.
  • the server 2000 may update the global model based on at least one gradient received from the electronic device 1 1000-2.
  • the server 2000 may transmit information on the updated global model to the electronic device 1 1000-2.
  • the electronic device 1 (1000-2) may also transmit information on the global model received from the server 2000 to the electronic device 2 (1000-3) and the electronic device 3 (1000-4).
  • Each of the electronic device 1 (1000-2), the electronic device 2 (1000-3) and the electronic device 3 (1000-4) is based on the information on the global model received from the server 2000, a local model in each device. Can be updated.
  • 16 is a flowchart illustrating a method of updating a global model and a local model according to a gradient according to an embodiment.
  • the global model and the local model may be updated based on gradients for the global model and the local model.
  • the gradient of the current global model stored in the server 2000 is a first gradient
  • the local model transmitted from the electronic device 1000 to the server 2000 is the same as described in the description of FIG. 1.
  • the gradient for updating the current global model that can be obtained will be referred to as a third gradient.
  • the electronic device 1000 may update the local model as it detects that the context information of the electronic device 1000 is changed.
  • the electronic device 1000 may generate a second gradient for the updated local model.
  • the second gradient according to an embodiment is information used to update the local model, for example, information obtained in relation to a loss function in order to derive a weight value applicable to each node and a bias value (ex.
  • the slope value associated with the point at which the value of the loss function becomes minimum) can be included.
  • the electronic device 1000 may transmit a second gradient for the updated local model to the server 2000.
  • the server 2000 may update the global model based on the second gradient received from the electronic device 1000.
  • the server 2000 may obtain a first gradient for the global model currently stored in the server 2000. Then, in step 1604, the server 2000 may generate a third gradient based on the first gradient and the second gradient.
  • the third gradient may include at least one representative value of information corresponding to each other between information related to the loss function included in the first gradient and information related to the loss function included in the second gradient.
  • the representative value according to an embodiment may be obtained based on an arithmetic average value, a weighted average value, or a simple addition value between values included in each gradient.
  • the server 2000 may transmit the third gradient to the electronic device 1000. Also, in step 1607, the server 2000 may update the global model according to the third gradient. For example, a weight value and a bias value that can be applied to each node constituting the global model are modified based on information related to a loss function included in the third gradient, so that the global model may be updated.
  • the electronic device 1000 may update the local model based on the third gradient received from the server 2000.
  • the updating of the local model in step 1606 may be performed in the same manner as the operation of generating the third gradient in step 1604 and updating the global model according to the third gradient generated in step 1607.
  • a weight value and a bias value that can be applied to each node constituting the local model may be at least one representative value of information corresponding to each other between information included in the second gradient and the information included in the third gradient.
  • the local model may be updated by modifying the corresponding prediction information to be output by the local model.
  • the at least one representative value may be an arithmetic average value and a weighted average value between values included in the second gradient and the third gradient.
  • the weight applied to each value in the weighted average value may be determined as a learned value so that the operation according to the local model is suitable for the current situation of the electronic device 1000. For example, among weights applied to each information in the weighted average value, a weight applied to a value included in a gradient for a local model may be determined based on the context information of the electronic device 1000.
  • 17 is a flowchart illustrating a method of updating a global model, a first local model of the electronic device 1000, and a second local model of the external device 3000 according to a gradient, according to an exemplary embodiment.
  • the electronic device 1000 may update the first local model as the context information of the electronic device 1000 changes, and the external device 3000 changes the context information of the external device 3000.
  • the second local model may be updated.
  • the server 2000 of FIG. 17 may update the global model based on the gradient of the updated local model received from a plurality of devices. In addition, the server 2000 may transmit the updated global model gradient to each device that has transmitted the local model gradient to the server 2000.
  • the gradient for the current global model stored in the server 2000 is transmitted to the server 2000 from the external device 3000 in the same manner as described in the description of FIGS. 1 and 16.
  • the gradient of the local model will be referred to as a third gradient to update the current global model that can be obtained.
  • the gradient of the local model transmitted from the electronic device 1000 to the server 2000 will be referred to as a fourth gradient.
  • the gradient of the global model when the local model is updated is the third gradient
  • the gradient for updating the current global model that can be obtained based on the third gradient and the fourth gradient will be referred to as a fifth gradient. do.
  • the second local model of the external device 3000 can be updated. If the second local model is updated based on the changed context information, the external device 3000 may generate a second gradient for the updated local model in operation 1701.
  • the external device 3000 may transmit a second gradient for the updated local model to the server 2000.
  • the server 2000 may update the global model based on the second gradient received from the external device 3000.
  • the server 2000 may obtain a first gradient for the global model currently stored in the server 2000.
  • the first gradient may be information previously generated when the global model is updated and already stored in the server 2000.
  • the server 2000 may generate a third gradient based on the first gradient and the second gradient.
  • the server 2000 may transmit the third gradient to the external device 3000. Also, in step 1707, the server 2000 may update the global model according to the third gradient.
  • the external device 3000 may update the second local model based on the second gradient and the third gradient received from the server 2000.
  • the update of the second local model in step 1706 may be performed in the same manner as the operation of generating the third gradient in step 1704 and updating the global model according to the third gradient generated in step 1707 and the first gradient. .
  • step 1708 the electronic device 1000, in the same manner as the update of the second local model in step 1701, detects that the context information of the electronic device 1000 is changed, the first local model of the electronic device 1000 Can be updated.
  • the electronic device 1000 may generate a fourth gradient for the updated first local model in operation 1708.
  • the electronic device 1000 may transmit a fourth gradient for the updated first local model to the server 2000.
  • the fourth gradient may be received in the server 2000 after the global model is updated according to the third gradient in operation 1707.
  • the server 2000 may re-update the global model updated in operation 1707 based on the fourth gradient received from the electronic device 1000.
  • the global model may be updated based on a plurality of gradients for a local model updated in a plurality of devices.
  • the server 2000 may obtain a third gradient for the current global model.
  • the server 2000 may generate a fifth gradient based on the third gradient and the fourth gradient.
  • the fifth gradient according to an embodiment may be configured with at least one representative value for information corresponding to each other between the third gradient and the fourth gradient.
  • the representative value according to an embodiment may be obtained based on an arithmetic average value, a weighted average value, or a simple addition value between values included in each gradient.
  • the server 2000 may transmit the fifth gradient to the electronic device 1000.
  • the server 2000 may update the global model according to the fifth gradient.
  • the electronic device 1000 includes a fifth gradient and a fifth gradient received from the server 2000. 4
  • the first local model may be updated based on the gradient.
  • the update of the first local model in step 1713 may be performed in the same manner as the update of the second local model in step 1706.
  • FIG. 18 is a flowchart illustrating a method of updating a global model, a first local model of an electronic device, and a second local model of an external device, according to an exemplary embodiment.
  • Each of the steps of FIG. 18 partially corresponds to each of the steps of FIG. 17, but in FIG. 18, unlike the method illustrated in FIG. 17, the first local model, the second local model, and the global model may be updated.
  • the external device 3000 may generate a second gradient for the updated local model in operation 1801.
  • the external device 3000 may transmit a second gradient for the updated local model to the server 2000.
  • the server 2000 may update the global model based on the second gradient received from the external device 3000.
  • the server 2000 may obtain a first gradient for the global model currently stored in the server 2000.
  • the first gradient for the global model may be obtained based on difference values of weight values of the global model in a fixed time interval.
  • the fixed time period may be set as a period between the most recent time point in which communication between the electronic device 1000 or other external devices and the server 2000 is performed for updating a local model or a global model and a time point before it. I can.
  • the server 2000 may transmit the first gradient obtained in step 1803 to the external device 3000.
  • the server 2000 may update the global model based on the second gradient.
  • the server 2000 may generate a third gradient based on the first gradient and the second gradient, and may update the global model according to the third gradient.
  • the third gradient may be composed of at least one representative value for information corresponding to each other between the first gradient and the second gradient.
  • the above-described example is not limited, and the server 2000 may update the global model according to various methods based on the second gradient.
  • the external device 3000 may update the second local model based on the second gradient and the first gradient received from the server 2000.
  • the updating of the second local model in step 1806 may be performed in the same manner as the operation of generating the third gradient in step 1805 and updating the global model according to the generated third gradient and the first gradient.
  • the third gradient used to update the global model or the second local model based on the first gradient and the second gradient is based on a representative value suitable for updating the global model or the second local model, respectively.
  • the representative value suitable for updating the global model is a simple added value
  • the global model is based on a third gradient generated based on a value obtained by simply adding information corresponding to each other between the first gradient and the second gradient. Can be updated.
  • the global model and the second local model may be updated according to various methods, based on information obtained according to various methods, based on the first gradient and the second gradient.
  • step 1807 the electronic device 1000, in the same manner as the update of the second local model in step 1801, detects that the context information of the electronic device 1000 is changed, the first local model of the electronic device 1000 Can be updated.
  • the electronic device 1000 may generate a fourth gradient for the updated first local model in operation 1807.
  • the electronic device 1000 may transmit a fourth gradient for the updated first local model to the server 2000.
  • the fourth gradient may be received in the server 2000 after the global model is updated in step 1805.
  • the server 2000 according to an embodiment may re-update the global model updated in operation 1805 based on the fourth gradient received from the electronic device 1000.
  • the global model may be updated based on a plurality of gradients for a local model updated in a plurality of devices.
  • the server 2000 may obtain a fifth gradient for the current global model.
  • a fifth gradient for the global model at the current time is obtained.
  • I can.
  • the fifth gradient may be obtained based on difference values of weight values of the global model.
  • the fixed time period may be set as a period between the most recent time point in which communication between the electronic device 1000 or other external devices and the server 2000 is performed for updating a local model or a global model and a time point before it. I can.
  • the server 2000 may transmit the fifth gradient obtained in operation 1809 to the electronic device 1000 so that the first local model of the electronic device 1000 may be updated according to the current global model. .
  • the electronic device 1000 may update the first local model based on the fourth gradient and the fifth gradient received from the server 2000.
  • the updating of the first local model in step 1811 may be performed in the same manner as the operation of generating the sixth gradient in step 1812 and updating the global model according to the generated sixth gradient.
  • the server 2000 may update the global model based on the fourth gradient.
  • the server 2000 may generate a sixth gradient based on the fourth gradient and the fifth gradient, and update the global model according to the generated sixth gradient.
  • the sixth gradient according to an embodiment may be configured with at least one representative value for information corresponding to each other between the fourth gradient and the fifth gradient.
  • the representative value according to an embodiment may be obtained based on an arithmetic average value, a weighted average value, or a simple addition value between values included in each gradient.
  • the above-described example is not limited, and the server 2000 may update the global model according to various methods based on the fourth gradient.
  • the sixth gradient used to update the global model or the first local model based on the fourth gradient and the fifth gradient is based on a representative value suitable for updating the global model or the first local model, respectively.
  • a representative value suitable for updating the global model is a simple added value
  • the global model is based on a sixth gradient generated based on a simple added value of information corresponding to each other between the fourth and fifth gradients. Can be updated.
  • the global model and the first local model are not limited to the above-described examples, and may be updated according to various methods, based on information obtained according to various methods, based on the fourth gradient and the fifth gradient.
  • a gradient related to a local model updated based on the situation information is transmitted to the server, thereby increasing the risk of personal information leakage during the transmission process. Can be removed.
  • a gradient having a smaller data size than the situation information instead of the situation information may be transmitted to the server, so that the update of the local model is performed faster. Can be.
  • An embodiment may also be implemented in the form of a recording medium including instructions executable by a computer, such as a program module executed by a computer.
  • Computer-readable media can be any available media that can be accessed by a computer, and includes both volatile and nonvolatile media, removable and non-removable media. Further, the computer-readable medium may include both computer storage media and communication media.
  • Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.
  • Communication media typically include computer readable instructions, data structures, or program modules, and include any information delivery media.
  • the “unit” may be a hardware component such as a processor or a circuit, and/or a software component executed by a hardware configuration such as a processor.

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

본 개시는 딥러닝 등의 기계 학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 인공지능(AI) 시스템 및 그 응용에 관련된 것이다. 로컬 모델을 갱신하는데 이용되는 전자 장치의 상황에 관한 정보가 변경됨을 검출하고, 변경된 상황 정보에 기초하여, 로컬 모델을 갱신하기 위한 그래디언트를 획득하고, 그래디언트에 기초하여 로컬 모델을 갱신하고, 그래디언트를 서버로 전송하고, 서버로부터 그래디언트에 기초하여 갱신된 글로벌 모델에 관한 정보를 수신하고, 수신된 정보에 기초하여, 로컬 모델을 갱신하는, 전자 장치에서, 학습 모델을 갱신하는 방법이 제공된다.

Description

인공지능 모델을 갱신하는 전자 장치, 서버 및 그 동작 방법
본 개시는, 전자 장치에 저장된 인공지능 모델을 갱신하는 전자 장치, 서버 및 그 동작 방법에 관한 것이다.
사용자 또는 사용자가 소지한 전자 장치의 다양한 상황(context), 예를 들면, 전자 장치의 상태(state)에 관한 정보 및 전자 장치의 주변 환경에 관한 정보 등, 전자 장치의 상황을 나타내는 다양한 정보에 따라서, 다양한 동작을 수행하는, 기계학습을 활용한 인공지능 시스템이 제공되고 있다.
상술한 전자 장치의 상황에 관한 정보는, 시간이 지남에 따라 지속적으로 변경될 수 있으므로, 변경된 상황 정보에 따라서, 인공지능 모델도 지속적으로 갱신됨이 바람직하다. 따라서, 상황 정보에 따라 인공지능 모델에 의해 적합한 동작이 수행될 수 있도록, 상기 인공지능 모델은, 실시간으로 수집된 다양한 종류의 상황 정보에 기초하여 지속적으로 갱신될 수 있다.
상기 인공지능 모델의 갱신은, 사용자가 소지한 전자 장치보다, 연산량과 학습에 이용되는 데이터 규모에 있어서, 더 성능이 좋은 서버에서도 수행될 수 있다. 예를 들면, 서버에서 수행된 인공지능 모델의 갱신 결과에 기초하여, 전자 장치에 저장된 인공지능 모델도 추가적으로 갱신될 수 있다. 따라서, 전자 장치는, 인공지능 모델의 갱신을 위하여, 전자 장치의 상황 정보를 서버로 전송할 수 있다.
그러나, 전자 장치의 상황 정보는, 사용자의 민감한 정보를 포함하는 개인 정보, 생체 정보, 비밀 정보, 금융 정보 등을 포함할 수 있으므로, 전송 과정에서 상황 정보가 외부에 유출되는 경우, 사용자에게 심각한 피해가 발생될 수 있는 문제점이 존재한다.
본 개시가 해결하고자 하는 과제는 전술한 문제를 해결하기 위한 것으로서, 전자 장치에 저장된 인공지능 모델을 갱신하는 전자 장치, 서버 및 그 동작 방법을 제공하기 위한 것이다.
또한, 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다. 해결하려는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
도 1은 일 실시 예에 의한, 전자 장치의 로컬 모델을 이용하여 다양한 동작을 수행하는 시스템을 나타낸 도면이다.
도 2는 일 실시 예에 의한 로컬 모델을 이용하여 다양한 동작을 수행하는 시스템을 나타낸 도면이다.
도 3은 일 실시 예에 의한 로컬 모델을 이용하여 객체 인식을 수행하는 시스템을 나타낸 도면이다.
도 4는 일 실시 예에 의한 로컬 모델을 이용하여 음성 인식을 수행하는 시스템을 나타낸 도면이다.
도 5는 일 실시 예에 의한 로컬 모델 및 글로벌 모델이 갱신되는 일 예를 나타낸 도면이다.
도 6은 일 실시 예에 의한 로컬 모델 또는 글로벌 모델의 예시를 나타내는 도면이다.
도 7은 일 실시 예에 의한 전자 장치의 동작을 설명하기 위한 도면이다.
도 8은 일 실시 예에 의한 시간 흐름에 따라 로컬 모델이 갱신되는 일 예를 나타낸 도면이다.
도 9는 일 실시 예에 의한 전자 장치의 내부 구성을 도시한 블록도이다.
도 10은 일 실시 예에 의한 전자 장치의 내부 구성을 도시한 블록도이다.
도 11은 일 실시 예에 의한 서버의 내부 구성을 도시한 블록도이다.
도 12는 일 실시 예에 의한 로컬 모델을 갱신하는 방법을 나타낸 순서도이다.
도 13은 일 실시 예에 의한 서버에서 글로벌 모델을 갱신하는 방법을 나타낸 순서도이다.
도 14는 일 실시 예에 의한 로컬 모델 및 글로벌 모델을 갱신하는 시스템을 나타낸 도면이다.
도 15는 일 실시 예에 의한 중개 장치를 통해 로컬 모델 및 글로벌 모델을 갱신하는 시스템을 나타낸 도면이다.
도 16은 일 실시 예에 의한 그래디언트에 따라 글로벌 모델 및 로컬 모델을 갱신하는 방법을 나타낸 순서도이다.
도 17은 일 실시 예에 의한 그래디언트에 따라 글로벌 모델과, 전자 장치의 제1 로컬 모델 및 외부 장치의 제2 로컬 모델을 갱신하는 방법을 나타낸 순서도이다.
도 18은 일 실시 예에 의한 그래디언트에 따라 글로벌 모델과, 전자 장치의 제1 로컬 모델 및 외부 장치의 제2 로컬 모델을 갱신하는 방법을 나타낸 순서도이다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 개시의 제1 측면은, 전자 장치에 저장된 로컬 모델을 갱신하는데 이용되는, 상기 전자 장치의 상황에 관한 정보가 변경됨을 검출하는 단계; 상기 변경된 상황에 관한 정보에 기초하여, 상기 로컬 모델을 갱신하기 위한 그래디언트(gradient) 정보를 결정하는 단계; 상기 결정된 그래디언트에 기초하여, 상기 로컬 모델을 갱신하는 단계; 상기 그래디언트를 서버로 전송하는 단계; 상기 서버로부터 상기 그래디언트에 기초하여 갱신된 글로벌 모델에 관한 정보를 수신하는 단계; 및 상기 수신된 정보에 기초하여, 상기 로컬 모델을 갱신하는 단계를 포함하는, 전자 장치에서, 인공지능 모델을 갱신하는 방법을 제공할 수 있다.
또한, 본 개시의 제2 측면은, 로컬 모델을 저장하는 메모리; 상기 로컬 모델을 갱신하는데 이용되는 상기 전자 장치의 상황에 관한 정보가 변경됨을 검출하고, 상기 변경된 상황에 관한 정보에 기초하여, 상기 로컬 모델을 갱신하기 위한 그래디언트를 결정하고, 상기 결정된 그래디언트에 기초하여, 상기 로컬 모델을 갱신하는 적어도 하나의 프로세서; 및 상기 그래디언트를 서버로 전송하고, 상기 서버로부터 상기 그래디언트에 기초하여 갱신된 글로벌 모델에 관한 정보를 수신하는 통신부를 포함하고, 상기 적어도 하나의 프로세서는, 상기 수신된 정보에 기초하여 상기 로컬 모델을 갱신하는, 인공지능 모델을 갱신하는 전자 장치를 제공할 수 있다.
또한, 본 개시의 제3 측면은, 제1 측면의 방법을 수행하도록 하는 프로그램이 저장된 기록매체를 제공할 수 있다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
본 개시에 따른 인공지능과 관련된 기능은 프로세서와 메모리를 통해 동작된다. 프로세서는 하나 또는 복수의 프로세서로 구성될 수 있다. 이때, 하나 또는 복수의 프로세서는 CPU, AP, DSP(Digital Signal Processor) 등과 같은 범용 프로세서, GPU, VPU(Vision Processing Unit)와 같은 그래픽 전용 프로세서 또는 NPU와 같은 인공지능 전용 프로세서일 수 있다. 하나 또는 복수의 프로세서는, 메모리에 저장된 기 정의된 동작 규칙 또는 인공지능 모델에 따라, 입력 데이터를 처리하도록 제어한다. 또는, 하나 또는 복수의 프로세서가 인공지능 전용 프로세서인 경우, 인공지능 전용 프로세서는, 특정 인공지능 모델의 처리에 특화된 하드웨어 구조로 설계될 수 있다.
기 정의된 동작 규칙 또는 인공지능 모델은 학습을 통해 만들어진 것을 특징으로 한다. 여기서, 학습을 통해 만들어진다는 것은, 기본 인공지능 모델이 학습 알고리즘에 의하여 다수의 학습 데이터들을 이용하여 학습됨으로써, 원하는 특성(또는, 목적)을 수행하도록 설정된 기 정의된 동작 규칙 또는 인공지능 모델이 만들어짐을 의미한다. 이러한 학습은 본 개시에 따른 인공지능이 수행되는 기기 자체에서 이루어질 수도 있고, 별도의 서버 및/또는 시스템을 통해 이루어 질 수도 있다. 학습 알고리즘의 예로는, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)이 있으나, 전술한 예에 한정되지 않는다.
인공지능 모델은, 복수의 신경망 레이어들로 구성될 수 있다. 복수의 신경망 레이어들 각각은 복수의 노드들과 가중치들(weight values)을 갖고 있으며, 이전(previous) 레이어의 연산 결과와 복수의 가중치들 간의 연산을 통해 신경망 연산을 수행한다. 복수의 신경망 레이어들이 갖고 있는 복수의 가중치들은 인공지능 모델의 학습 결과에 의해 최적화될 수 있다. 예를 들어, 학습 과정 동안 인공지능 모델에서 획득한 로스(loss) 값 또는 코스트(cost) 값이 감소 또는 최소화되도록 복수의 가중치들이 갱신될 수 있다. 또한, 손실값 또는 코스트 값을 최소화하기 위해, 손실값 또는 코스트값과 관련된 그래디언트를 최소화하는 방향으로 복수의 가중치들이 갱신될 수 있다. 인공 신경망은 심층 신경망(DNN:Deep Neural Network)를 포함할 수 있으며, 예를 들어, CNN (Convolutional Neural Network), DNN (Deep Neural Network), RNN (Recurrent Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN(Bidirectional Recurrent Deep Neural Network) 또는 심층 Q-네트워크 (Deep Q-Networks) 등이 있으나, 전술한 예에 한정되지 않는다.
이하 첨부된 도면을 참고하여 본 발명을 상세히 설명하기로 한다.
도 1은 일 실시 예에 의한, 전자 장치의 로컬 모델을 이용하여 다양한 동작을 수행하는 시스템을 나타낸 도면이다.
도 1에 도시된 바와 같이, 일 실시 예에 따른 시스템은, 전자 장치(1000) 및 서버(2000)를 포함할 수 있다. 일 실시 예에 의한 전자 장치(1000)는, 전자 장치(1000)에서 수집된 전자 장치(1000)의 상황에 관한 정보에 기초하여 전자 장치(1000)의 상황에 적합한 결과가 출력되도록 전자 장치(1000)에 저장된 로컬 모델을 갱신하고, 갱신된 로컬 모델에 기초하여 다양한 동작을 수행할 수 있다.
일 실시 예에 의한, 전자 장치(1000)의 로컬 모델은 전자 장치(1000)의 상황에 관한 정보에 기초하여 전자 장치(1000) 내에서 지속적으로 갱신될 수 있고, 다양한 동작 수행을 위해 이용될 수 있는 인공지능 모델이다.
일 실시 예에 의한 전자 장치(1000)는, 상황에 관한 정보에 기초하여, 로컬 모델을 구성하는 복수의 신경망 레이어들에 포함된 복수의 가중치들을 최적화함으로써, 로컬 모델을 갱신할 수 있다. 예를 들면, 전자 장치(1000)는 상황에 관한 정보에 기초하여, 로컬 모델을 통해 출력될 수 있는 예측 정보와, 예측 정보와 대응되는 관측 정보 간의 차이가 최소화될 수 있도록, 로컬 모델을 갱신할 수 있다.
일 실시 예에 의한 관측 정보는, 예측 정보에 대한 정답을 나타내는 정보이며, 상술한 전자 장치(1000)의 상황에 관한 정보뿐만 아니라, 로컬 모델의 출력 결과와 관련된 다양한 종류의 정보에 기초하여 결정될 수 있다.
전자 장치(1000)의 상황에 관한 정보는 전자 장치(1000)에서 수집된 상황 정보, 전자 장치(1000)의 상태에 관한 정보, 전자 장치(1000)의 사용자에 관한 정보, 전자 장치(1000)의 주변 환경에 관한 정보 등을 포함할 수 있다.
일 실시 예에 의하면 전자 장치(1000)에서 수집된 상황 정보는, 현재의 전자 장치(1000)의 상황에 따른 적합한 결과가 출력되도록 로컬 모델을 갱신하는데 이용될 수 있는 다양한 정보들을 포함할 수 있다. 예를 들면, 상황 정보는, 전자 장치(1000)의 상태에 관한 정보, 전자 장치(1000)의 사용자에 관한 정보, 전자 장치(1000)의 주변 환경에 관한 정보 등을 포함할 수 있다.
일 실시 예에 의하면, 상기 상황 정보에 기초하여, 로컬 모델에 출력될 수 있는 예측 정보와 대응되는 관측 정보가 획득될 수 있다. 일 실시 예에 의한 전자 장치(1000)는, 상기 관측 정보와 예측 정보 간 차이가 최소화되도록, 로컬 모델을 구성하는 값들을 수정함으로써, 로컬 모델을 갱신할 수 있다.
일 실시 예에 의한 전자 장치(1000)의 상태에 관한 정보는, 전자 장치(1000)의 동작 상태에 관한 정보, 전자 장치(1000)에서 네트워크 연결 상태에 관한 정보, 전자 장치(1000)에 설치된 OS(operating system) 또는 어플리케이션의 상태에 관한 정보, 전자 장치(1000)의 위치에 관한 정보, 전자 장치(1000)의 이동 상태에 관한 정보, 전자 장치(1000)에 구비된 하드웨어 상태에 관한 정보 등 전자 장치(1000)의 상태에 관한 다양한 정보를 포함할 수 있다.
일 실시 예에 의한 전자 장치(1000)의 사용자에 관한 정보는, 예를 들면, 사용자의 특징에 관한 정보로서, 사용자의 신상에 관한 정보, 사용자가 가입된 서비스의 계정에 관한 정보, 사용자의 생활 패턴에 관한 정보 등 다양한 종류의 사용자의 개인적인 정보(privacy information)를 포함할 수 있다. 상술한 예에 한하지 않고, 사용자에 관한 정보는, 사용자에 관한 다양한 종류의 정보를 포함할 수 있다.
일 실시 예에 의한 전자 장치(1000)의 주변 환경에 관한 정보는, 전자 장치(1000)의 주변에 존재하는 객체에 관한 정보, 전자 장치(1000)의 주변 환경의 조도에 관한 정보 등 전자 장치(1000)의 주변 환경에 관한 다양한 정보를 포함할 수 있다.
일 실시 예에 따라 로컬 모델에 기초하여 수행될 수 있는 동작은, 전자 장치(1000)에서 수행될 수 있는 다양한 동작을 포함할 수 있다. 예를 들면, 상기 동작은, 아이템을 추천하는 동작, 전자 장치(1000) 주변의 객체를 인식하는 동작, 전자 장치(1000)에서 수집된 오디오 신호에 대하여 음성 인식을 수행하는 동작 등을 포함할 수 있다. 상술한 예에 한하지 않고, 일 실시 예에 따라 로컬 모델에 기초하여 수행될 수 있는 동작은 전자 장치(1000)에서 로컬 모델을 이용하여 수행될 수 있는 다양한 동작을 포함할 수 있다.
일 실시 예에 의한 전자 장치(1000)는 로컬 모델을 이용하여 다양한 동작을 수행하기 위한 연산을 수행할 뿐만 아니라, 전자 장치(1000)의 상황에 관한 정보에 기초하여 로컬 모델을 이용한 연산의 정확도를 개선하기 위한 학습을 수행할 수 있다. 일 실시 예에 의한 전자 장치(1000)는 로컬 모델에 대해 학습을 수행함으로써, 전자 장치(1000)는 학습된 로컬 모델을 이용하여 전자 장치(1000)의 사용 패턴에 최적화된 연산 결과를 도출할 수 있다. 일 실시 예에 의하면, 각각의 동작과 대응되는 적어도 하나의 로컬 모델이 존재하고, 상기 적어도 하나의 로컬 모델에 따라, 각각의 동작이 수행될 수 있다. 예를 들면, 전자 장치(1000)는 복수 개의 로컬 모델 중에서, 전자 장치(1000)에서 수행하고자 하는 동작(ex. 아이템 추천, 객체 인식, 음성 인식)과 대응되는 적어도 하나의 로컬 모델을 획득하고, 상기 획득된 로컬 모델에 기초하여, 상기 동작을 수행할 수 있다. 상술한 예에 한하지 않고, 단일한 로컬 모델에 따라 복수 개의 서로 다른 동작이 수행될 수도 있다.
일 실시 예에 의한 전자 장치(1000)는, 상술한 적어도 하나의 로컬 모델을 전자 장치(1000)에 구비된 메모리로부터 획득하거나, 외부로부터 수신할 수 있다. 예를 들면, 전자 장치(1000)는 메모리를 판독함으로써, 로컬 모델을 획득할 수 있다. 또한, 전자 장치(1000)는, 외부의 서버(2000)로부터 글로벌 모델을 수신하고, 수신된 글로벌 모델을 전자 장치(1000)의 로컬 모델로써 획득할 수 있다. 상술한 예에 한하지 않고, 전자 장치(1000)는 로컬 모델을 다양한 방법을 통해 획득할 수 있다.
예를 들면, 전자 장치(1000)는 소정의 동작을 수행하기 위한 로컬 모델이 전자 장치(1000)에 저장되어 있지 않은 경우, 상기 소정의 동작을 수행하기 위한 글로벌 모델에 관한 정보를 서버(2000)로부터 수신할 수 있다. 또한, 전자 장치(1000)는 서버(2000)로부터 수신된 글로벌 모델에 관한 정보에 기초하여 로컬 모델을 획득하고 저장할 수 있다.
일 실시 예에 의하면, 전자 장치(1000)는 서버(2000)에 상기 소정의 동작을 수행하기 위한 글로벌 모델을 요청하여, 서버(2000)로부터 글로벌 모델을 수신하고, 수신된 글로벌 모델을 전자 장치(1000)의 로컬 모델로서 저장할 수 있다. 이후 전자 장치(1000)에서 수집된 상황 정보에 기초하여, 전자 장치(1000)에 저장된 로컬 모델이 지속적으로 갱신될 수 있다. 상술한 예에 한하지 않고, 전자 장치(1000)에서 수집된 상황 정보뿐만 아니라, 로컬 모델이 갱신되는데 필요한 다양한 데이터에 기초하여, 전자 장치(1000)에 저장된 로컬 모델이 지속적으로 갱신될 수도 있다.
일 실시 예에 따른 전자 장치(1000)는 인공 지능 기술에 의한 로컬 모델을 이용하여 다양한 동작을 수행하는 장치로, 다양한 형태로 구현될 수 있다. 예를 들어, 본 명세서에서 기술되는 전자 장치(1000)는, 디지털 카메라, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 태블릿 PC, 전자북 단말기, 디지털방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션, MP3 플레이어, 인공지능 스피커, 로봇 청소기, 가전 기기(home appliance) 등이 있을 수 있으나, 이에 한정되는 것은 아니다.
또한, 본 명세서에서 기술되는 전자 장치(1000)는 사용자에 의해 착용될 수 있는 장치(wearable device)일 수 있다. 웨어러블 디바이스는 액세서리 형 장치(예컨대, 시계, 반지, 팔목 밴드, 발목 밴드, 목걸이, 안경, 콘택트 렌즈), 머리 착용형 장치(head-mounted-device(HMD)), 직물 또는 의류 일체형 장치(예: 전자 의복), 신체 부착형 장치(예컨대, 스킨 패드(skin pad)), 또는 생체 이식형 장치(예: implantable circuit) 중 적어도 하나를 포함할 수 있으나, 이에 한정되는 것은 아니다.
일 실시 예에 의한, 로컬 모델의 갱신은 2단계로 수행될 수 있다. 예를 들면, 로컬 모델을 갱신하는 단계는, 전자 장치(1000)에서 수집된 상황에 관한 정보에 기초하여, 로컬 모델을 갱신하는 첫번째 단계를 포함할 수 있다. 또한, 로컬 모델을 갱신하는 단계는, 갱신된 로컬 모델에 대한 그래디언트를 서버(2000)로 전송함에 따라, 서버(2000)로부터 수신된 정보에 기초하여, 로컬 모델을 다시 갱신하는 두번째 단계를 포함할 수 있다.
일 실시 예에서, 로컬 모델의 그래디언트는, 로컬 모델을 갱신하기 위한 정보를 포함할 수 있다. 예를 들면, 그래디언트는, 상술한 관측 정보 및 예측 정보 간 차이가 최소화되는 경우와 관련된 정보를 포함할 수 있다.
일 예로, 전자 장치(1000)는 관측 정보 및 상기 예측 정보 간 차이를 나타내는 손실 함수를 획득하고, 상기 손실 함수의 값이 최소가 되는 지점과 관련된 정보를 포함하는 그래디언트를 획득할 수 있다. 예를 들면, 손실 함수의 최소 값은, 손실 함수의 기울기가 최소가 되는 지점을 찾음으로써 검출될 수 있다. 일 실시 예에 의한 손실 함수의 기울기 값은, 예측 정보에 포함된 각 변수에 대하여 편미분한 값으로부터 획득될 수 있다.
일 실시 예에 의한 전자 장치(1000)는, 그래디언트를 이용하여, 손실 함수의 값이 최소가 되는 지점과 대응되는, 로컬 모델의 예측 정보를 결정할 수 있다. 또한, 전자 장치(1000)는 상기 결정된 예측 정보가 상기 로컬 모델에 의해 출력될 수 있도록, 상기 로컬 모델을 구성하는 매개 변수들(ex. 각 노드에 대한 가중치, 바이어스 등)을 수정함으로써, 로컬 모델을 갱신할 수 있다.
일 실시 예에 의한 서버(2000)는 전자 장치(1000)로부터 전송된 그래디언트에 기초하여, 서버(2000)에 저장된 글로벌 모델을 갱신하고, 갱신된 글로벌 모델에 관한 정보를 전자 장치(1000)에 전송할 수 있다. 예를 들면, 서버(2000)는, 그래디언트에 포함된 손실 함수의 기울기 정보와 대응되는 예측 정보가 글로벌 모델에 의해 출력될 수 있도록, 글로벌 모델을 갱신할 수 있다. 이 경우, 관측 정보는, 글로벌 모델의 예측 정보에 대한 정답을 나타내는 정보로서, 글로벌 모델의 출력 결과와 관련된 다양한 종류의 정보에 기초하여 획득될 수 있다. 따라서, 일 실시 예에 의한 전자 장치(1000)는 상술한 두번째 단계에서, 서버(2000)로부터 수신된, 갱신된 글로벌 모델에 관한 정보에 기초하여, 로컬 모델을 다시 갱신할 수 있다.
일 실시 예에 의한, 글로벌 모델은, 서버(2000)에서 수집된 다양한 정보에 기초하여, 서버(2000)의 상대적으로 우수한 학습 능력 및 연산 능력에 따라 갱신될 수 있다. 일 실시 예에 의한, 글로벌 모델은, 로컬 모델의 갱신 동작이 수행되기 전에, 서버(2000)에서 다양한 방법으로 수집된 다양한 정보들에 기초하여 지속적으로 학습되고, 저장될 수 있다. 상술한 예에 한하지 않고, 글로벌 모델은, 다양한 방법을 통해 학습되어, 서버(2000)에 미리 저장될 수 있고, 서버(2000)에 저장된 글로벌 모델은, 일 실시 예에 의한 로컬 모델이 갱신되는데 이용될 수 있다.
상술한 서버(2000)에서 수집된 다양한 정보는, 예를 들면, 전자 장치(1000) 외에 다른 외부 장치들에서 수집된 정보, 인터넷 상에서 수집된 정보 등을 포함할 수 있다. 상술한 예에 한하지 않고, 서버(2000)에서 수집된 다양한 정보는, 다양한 방법으로 수집된 다양한 종류의 정보를 포함할 수 있다.
따라서, 일 실시 예에 의한 글로벌 모델은 일 실시 예에 의한 동작을 수행하는데 로컬 모델보다 더 나은 성능을 가질 수 있다. 일 실시 예에 의한 전자 장치(1000)는 상대적으로 더 우수한 학습 성능을 가지고 더 많은 정보를 가진 서버(2000)에 의해 갱신된 글로벌 모델에 기초하여, 로컬 모델을 다시 갱신할 수 있다. 예를 들면, 서버(2000)는, 전자 장치(1000)로부터 수신한 데이터뿐만 아니라 다른 외부 장치(3000-1, 3000-2)로부터 수신한 데이터도 이용하여, 글로벌 모델을 갱신할 수 있다. 또한, 일 실시 예에 의한 서버(2000)의 글로벌 모델은, 서버(2000)의 상황에 관한 정보가 변화됨에 따라서, 갱신될 수도 있다. 따라서, 일 실시 예에 의하면, 외부로부터 데이터(ex. 전자 장치(1000) 또는 다른 외부 장치에서 갱신된 로컬 모델의 그래디언트)가 수신되지 않은 경우에도, 서버(2000)의 상황에 관한 정보에 기초하여, 서버(2000)의 글로벌 모델이 갱신될 수 있다. 따라서, 일 실시 예에 의한 전자 장치(1000)는 글로벌 모델에 관한 정보를 이용하여 갱신된 로컬 모델을 이용하여, 사용자에게 더 나은 서비스를 제공할 수 있다.
일 실시 예에 따라, 갱신된 글로벌 모델에 관한 정보에 기초하여 다시 갱신되는 로컬 모델은, 서버(2000)에서 갱신된 글로벌 모델이 전자 장치(1000)뿐만 아니라 다른 외부 장치들의 상황 정보도 함께 고려하여 갱신된 인공지능 모델인 점을 고려하여, 갱신될 수 있다. 예를 들면, 로컬 모델에 의해 전자 장치(1000)의 상황과 모순되지 않는 결과가 출력되도록, 로컬 모델이 갱신될 수 있다. 따라서, 일 실시 예에 의한 로컬 모델은, 글로벌 모델에 관한 정보에 기초하여 다시 갱신되더라도, 다른 외부 장치의 상황과는 다른, 전자 장치(1000)의 개별적인 상황 정보에 따라 적합한 동작이 수행될 수 있도록, 갱신될 수 있다.
일 실시 예에 의한 전자 장치(1000)는, 상황 정보 대신 그래디언트를 서버(2000)로 전송함으로써, 상황 정보에 포함된 사용자의 민감한 정보가 외부로 유출될 위험을 방지할 수 있다. 또한, 서버(2000)로 전송되는 데이터 양이 줄어듬에 따라, 로컬 모델 갱신을 위해 소요되는 시간이 줄어들 수 있다.
일 실시 예에 의하면, 로컬 모델에 의해 현재의 전자 장치(1000)의 상황에 적합한 결과가 출력되도록, 전자 장치(1000)에서 수집된 현재의 상황 정보에 기초하여, 로컬 모델이 갱신될 수 있다.
일 실시 예에 의하면 전자 장치(1000)에서 수집된 상황 정보는, 현재의 전자 장치(1000)의 상황에 따른 적합한 결과가 출력되도록 로컬 모델을 갱신하는데 이용될 수 있는 다양한 정보들을 포함할 수 있다. 예를 들면, 상황 정보는, 전자 장치(1000)의 상태에 관한 정보, 전자 장치(1000)의 사용자에 관한 정보, 전자 장치(1000)의 주변 환경에 관한 정보, 로컬 모델에 의해 출력된 결과에 대한 사용자의 피드백 정보 등을 포함할 수 있다.
일 실시 예에 의한 사용자는, 로컬 모델에 의해 수행된 동작에 대한 피드백 정보를 제공할 수 있다. 피드백 정보는, 예를 들면, 로컬 모델에 기초하여 추천된 아이템, 객체 인식 결과, 음성 인식 결과 등이 적절한지 여부를 나타내는, 사용자에 의해 입력된 정보를 포함할 수 있다. 또 다른 예로, 피드백 정보는, 사용자에 의해 입력된, 추천된 아이템에 대한 순위(rating) 정보를 더 포함할 수 있다. 상술한 예에 한하지 않고, 피드백 정보는, 로컬 모델에 의해 수행된 동작에 대한 사용자의 의견을 포함하는 다양한 종류의 정보를 포함할 수 있다.
일 실시 예에 의한 피드백 정보는, 로컬 모델이 갱신되는데 이용될 수 있는 전자 장치(1000)에서 수집된 상황 정보로서 수집될 수 있으며, 피드백 정보를 포함하는 전자 장치(1000)의 상황 정보에 기초하여, 로컬 모델이 갱신될 수 있다. 예를 들어, 사용자로부터 피드백 정보가 획득되면, 상황 정보가 변경된 것으로 판단될 수 있고, 상기 피드백 정보에 따라 로컬 모델이 갱신될 수 있다.
상술한 예에 한하지 않고, 전자 장치(1000)에서 수집된 상황 정보는, 로컬 모델을 갱신하는데 이용될 수 있는, 다양한 종류의 상황 정보를 포함할 수 있다.
일 실시 예에 의한 전자 장치(1000)의 상황 정보는 전자 장치(1000)에 의해 지속적으로 수집될 수 있다. 일 실시 예에 의하면, 전자 장치(1000)는, 지속적으로 전자 장치(1000)의 상황을 확인하고, 전자 장치(1000)의 상황 정보가 변경되었는지 여부를 검출할 수 있다.
일 실시 예에 의하면, 전자 장치(1000)는 전자 장치(1000)의 상황에 관한 정보가 변경됨을 검출함에 따라, 변경된 정보에 기초하여 로컬 모델을 갱신할 수 있다. 전자 장치(1000)의 상황에 관한 정보가 변경됨을 검출되는 경우는, 예를 들면, 전자 장치(1000)에서 수집된 전자 장치(1000)의 상황에 관한 정보 중 특정 종류의 정보가 기준값 이상 차이가 나도록 변경되거나, 전자 장치(1000)의 상황에 관한 새로운 종류의 정보가 상황 정보로서 획득되는 경우를 포함할 수 있다.
일 예로, 전자 장치(1000)의 상황 정보가 변경되는 경우는, 전자 장치(1000)에 새로운 어플리케이션이 설치되는 경우, 전자 장치(1000)를 이용하는 새로운 사용자가 식별된 경우, 기존에 식별되지 않았던 전자 장치(1000)의 새로운 동작 패턴이 식별되는 경우, 전자 장치(1000) 주변에 새로운 형태의 객체가 인식된 경우, 전자 장치(1000)의 주변 환경이 변경된 경우 등을 포함할 수 있다. 상술한 예에 한하지 않고, 전자 장치(1000)의 상황에 관한 정보가 변경됨을 검출되는 경우는, 로컬 모델을 갱신하는데 이용될 수 있는, 사용자 또는 전자 장치(1000)에 관한 다양한 종류의 정보가 변경되는 경우를 포함할 수 있다.
또한, 전자 장치(1000)의 상황 정보가 변경되는 경우는, 일 실시 예에 따라 로컬 모델에 기초하여 제공된 동작에 대한 사용자의 피드백 정보가 변경되는 경우를 포함할 수 있다.
일 실시 예에 의하면, 전자 장치(1000)의 상황에 관한 정보가 변경됨이 검출된 경우, 전자 장치(1000)가 로컬 모델을 갱신하는 동작을 수행할지 여부를 결정할 수 있다. 예를 들면, 전자 장치(1000)가 현재 유휴 상태인지 여부, 로컬 모델 갱신을 위한 전자 장치(1000)의 메모리 공간이 충분한지 여부, 전자 장치(1000)의 배터리가 충전 중인지 여부 및 현재 시간이 심야 시간인지 여부 중 적어도 하나에 기초하여, 로컬 모델이 갱신될 수 있다. 상술한 예에 한하지 않고, 미리 설정된 다양한 조건에 따라, 변경된 상황 정보에 기초하여, 전자 장치(1000)는 로컬 모델을 갱신할 수 있다.
일 실시 예에 따라 로컬 모델을 갱신하기에 전자 장치(1000)의 상태가 적합하지 않다고 판단되는 경우, 전자 장치(1000)는, 추후 전자 장치(1000)의 상태가 로컬 모델을 갱신하기에 적합하다고 판단될 때 로컬 모델을 갱신하는 동작을 수행할 수 있다.
일 실시 예에 따라, 변경된 상황 정보에 기초하여, 로컬 모델이 갱신되는 경우, 전자 장치(1000)는 로컬 모델을 갱신하기 위하여 이용된 그래디언트를 서버(2000)로 전송할 수 있다.
일 실시 예에 의한 그래디언트는, 로컬 모델이 상황 정보에 기초하여 갱신될 때, 로컬 모델에 포함된 각 노드의 가중치 및 바이어스 정보를 도출하는 과정에서, 변경된 상황 정보에 기초하여, 생성될 수 있는 적어도 하나의 값을 포함할 수 있다. 예를 들면, 그래디언트는, 변경된 상황에 관한 정보에 기초하여, 로컬 모델의 관측 정보 및 예측 정보 간 차이를 나타내는 손실 함수가 최소가 되는 지점과 관련된 정보를 포함할 수 있다.
일 실시 예에 의한, 서버(2000)는, 네트워크(100)를 통해, 전자 장치(1000)로부터 그래디언트를 수신하면, 그래디언트에 따라 서버(2000)에 구비된 글로벌 모델을 갱신할 수 있다. 일 실시 예에 의한 글로벌 모델은, 상기 전자 장치(1000)의 로컬 모델과 대응되나, 로컬 모델과는 달리 서버(2000)에 구비되어 전자 장치(1000) 외의 다른 외부 장치로부터 수신된 그래디언트에 의해서도 갱신될 수 있는 점에서 차이가 존재한다.
일 실시 예에 의한 서버(2000)는 갱신된 글로벌 모델의 그래디언트를 전자 장치(1000)로 전송할 수 있고, 전자 장치(1000)는 서버(2000)로부터 수신된 그래디언트에 기초하여, 로컬 모델을 다시 갱신할 수 있다.
일 실시 예에 의한 글로벌 모델은, 전자 장치(1000)의 로컬 모델과 대응되는 인공지능 모델을 포함하나, 로컬 모델과 글로벌 모델은, 각각 서로 다른 성능 및 사양을 가진 장치에서 각 모델이 갱신되는 동작이 수행됨에 따라서, 각 모델을 구성하는, 가중치 값, 바이어스 값 등 다양한 종류의 데이터 중 일부 데이터가 서로 다를 수 있다.
일 실시 예에 의하면, 글로벌 모델은, 전자 장치(1000)로부터 수신된 그래디언트에 기초하여, 갱신될 수 있다. 일 실시 예에 의한 서버(2000)는 그래디언트가 전자 장치(1000)에서 수집된 새로운 상황 정보에 기초하여 획득된 것임을 고려하여, 상기 새로운 상황 정보가 그래디언트를 통해 글로벌 모델에 적용될 수 있도록, 글로벌 모델을 갱신할 수 있다.
또한, 갱신된 글로벌 모델에 대한 그래디언트는, 전자 장치(1000)로 전달되어, 전자 장치(1000)의 로컬 모델이 갱신되는데 이용될 수 있다. 글로벌 모델을 갱신하는 방법 및 갱신된 글로벌 모델에 대한 그래디언트에 기초하여 로컬 모델을 다시 갱신하는 방법은 도 13, 도 16 및 도 17에서 보다 상세히 설명하기로 한다.
일 실시 예에 따라, 갱신된 글로벌 모델에 관한 정보에 기초하여, 로컬 모델이 다시 갱신된 후, 전자 장치(1000)는, 최종적으로 갱신된 로컬 모델에 따라서, 소정의 동작(ex. 아이템 추천, 객체 인식, 음성 인식)을 수행할 수 있다.
일 실시 예에 의하면, 온 디바이스(on-device) AI 기술에 따라서, 전자 장치(1000)가 로컬 모델에 따른 동작을 수행할 수 있다. 예를 들면, 전자 장치(1000)는, 로컬 모델이 일 실시 예에 따라 서버(2000)로부터 수신된 정보에 기초하여 갱신된 이후, 온 디바이스 AI 기술에 따라서, 갱신된 로컬 모델에 따른 동작을 수행할 수 있다. 예를 들면, 전자 장치(1000)는, 서버(2000)와의 데이터 송수신을 통해, 일 실시 예에 의한 로컬 모델의 갱신을 지속적으로 수행하되, 일 실시 예에 의한 로컬 모델의 갱신이 수행되지 않는 동안에는, 온 디바이스 AI 기술에 따라 동작할 수 있다.
온 디바이스 AI 기술에 따라, 전자 장치(1000)는, 서버(2000)와의 데이터 송수신 없이, 전자 장치(1000) 상에서, 로컬 모델에 기초한 소정의 동작(ex. 아이템 추천, 객체 인식, 음성 인식)을 수행하고, 그 결과를 출력할 수 있다. 일 실시 예에 따른, 전자 장치(1000)는 서버(2000)에 저장된 빅 데이터를 이용할 필요없이, 실시간으로 전자 장치(1000)에서 수집된 다양한 정보에 기초하여, 로컬 모델을 이용한 동작을 수행할 수 있다.
온 디바이스 AI 기술에 의하면, 전자 장치(1000)는 일 실시 예에 따라 학습된 로컬 모델과 스스로 수집한 다양한 종류의 데이터에 기초하여, 스스로 결정을 내릴 수 있다. 온 디바이스 AI 기술에 의한, 전자 장치(1000)는 수집된 데이터를 외부로 전달하지 않고, 스스로 운용하므로, 사용자의 개인 정보 보호 및 데이터 처리 속도 면에서, 장점이 존재한다.
예를 들면, 전자 장치(1000)의 네트워크(100)의 환경이 불안정하거나, 빅 데이터를 이용할 필요 없이, 전자 장치(1000)에서 수집된 정보만으로, 전자 장치(1000)의 로컬 모델에 따라 전자 장치(1000)는 온 디바이스 AI 기술을 이용하여, 서버(2000)와의 연결 없이, 동작할 수 있다.
다만, 전자 장치(1000)는, 온 디바이스 AI 기술에 따라 동작하는 것에 한하지 않고, 서버(2000) 또는 외부 장치와의 데이터 송수신을 통해, 일 실시 예에 의한 동작을 수행할 수도 있다. 예를 들면, 전자 장치(1000)는 로컬 모델을 이용하여 일 실시 예에 의한 동작을 수행하는 대신, 서버(2000)에 상기 동작의 수행을 요청할 수 있다. 일 실시 예에 의한 서버(2000)는, 수신된 요청에 따라 글로벌 모델에 기초하여, 일 실시 예에 의한 동작을 수행하고, 그 결과를 전자 장치(1000)로 전송할 수 있다. 또한, 전자 장치(1000)는 상술한 온 디바이스 AI 기술 및 서버(2000)와의 데이터 송수신을 통한 방식을 조합하여 일 실시 예에 의한 동작을 수행할 수도 있다.
예를 들어, 네트워크 환경 및 전자 장치(1000)의 연산 능력에 따라, 서버(2000)를 통한 동작이 데이터 처리 속도 면에서 더 유리하거나, 사용자의 개인 정보를 포함하지 않는 데이터가 서버(2000)로 전달되는 경우 등, 서버(2000)를 통한 방식이 온 디바이스 AI 기술보다 유리한 경우에는, 서버(2000)를 통한 방식에 따라, 일 실시 예에 의한 동작이 수행될 수 있다.
도 2는 일 실시 예에 의한 로컬 모델을 이용하여 다양한 동작을 수행하는 시스템을 나타낸 도면이다.
도 2에 도시된 바와 같이, 일 실시 예에 따른 아이템 추천 시스템은, 전자 장치(1000), 서버(2000), 외부 장치 1(3000-1), 및 외부 장치 2(3000-2)를 포함할 수 있다. 도 2의 전자 장치(1000) 및 서버(2000)는 도 1의 전자 장치(1000) 및 서버(2000)와 대응된다.
일 실시 예에 의한 외부 장치 1(3000-1), 및 외부 장치 2(3000-2)는, 전자 장치(1000)와 동일하게, 각각의 외부 장치 1(3000-1), 및 외부 장치 2(3000-2)에 저장된 로컬 모델 1, 2를 이용하여, 다양한 동작을 수행할 수 있다. 각각의 외부 장치 1(3000-1), 및 외부 장치 2(3000-2)에 저장된 각각의 로컬 모델 1, 2은, 일 실시 예에 따라, 각각의 외부 장치 1(3000-1), 및 외부 장치 2(3000-2)에서 수집된 서로 다른 상황 정보에 기초하여, 갱신될 수 있다. 따라서, 상기 각각의 로컬 모델 1, 2은, 각각의 외부 장치 1(3000-1), 및 외부 장치 2(3000-2)의 상황에 적합한, 서로 다른 데이터를 포함하는 인공지능 모델일 수 있다.
일 실시 예에 의한 각각의 외부 장치 1(3000-1), 외부 장치 2(3000-2), 및 전자 장치(1000)의 사용자는 서로 다를 수 있다. 그러나, 이에 한하지 않고, 외부 장치 1(3000-1), 외부 장치 2(3000-2), 및 전자 장치(1000)는 동일한 사용자에 의해 이용될 수도 있다.
일 실시 예에 의한 서버(2000)는 외부 장치 1(3000-1), 및 외부 장치 2(3000-2) 중 적어도 하나의 장치로부터, 각 장치에서 갱신된 로컬 모델 1, 2 중 적어도 하나의 로컬 모델에 기초하여 획득된 적어도 하나의 그래디언트를 수신할 수 있다. 일 실시 예에 의한 상기 각 장치에서 갱신되는 로컬 모델은, 각각의 외부 장치 1(3000-1) 및 외부 장치 2(3000-2)에서 수집된 상황 정보가 변경됨에 따라서, 갱신될 수 있다. 일 실시 예에 의하면, 상술한 전자 장치(1000)로부터 수신된 그래디언트에 기초하여, 글로벌 모델을 갱신하는 경우와 동일하게, 서버(2000)는 외부 장치 1(3000-1) 및 외부 장치 2(3000-2)로부터 수신된 적어도 하나의 그래디언트에 따라서, 서버(2000)의 글로벌 모델을 갱신할 수 있다.
일 실시 예에 의하면, 외부 장치 1(3000-1) 및 외부 장치 2(300-2) 중 적어도 하나로부터 수신된 그래디언트에 따라, 글로벌 모델이 갱신된 후, 서버(2000)는 전자 장치(1000)로부터, 갱신된 로컬 모델에 기초하여 획득된 그래디언트를 수신할 수 있다. 서버(2000)는, 외부 장치 1(3000-1) 및 외부 장치 2(300-2) 중 적어도 하나로부터 수신된 그래디언트에 따라 갱신된 글로벌 모델을 전자 장치(1000)로부터 수신된 그래디언트에 기초하여, 다시 갱신할 수 있다. 서버(2000)는 다시 갱신된 글로벌 모델에 관한 정보를 전자 장치(1000)로 전송할 수 있다.
일 실시 예에 의하면, 로컬 모델은, 다양한 장치로부터 수집된 정보가 반영된 글로벌 모델에 기초하여 갱신됨에 따라, 전자 장치(1000)는 로컬 모델을 이용하여 사용자에게 더 나은 서비스를 제공할 수 있다.
일 실시 예에 의한 서버(2000)는 전자 장치(1000), 외부 장치 1(3000-1), 및 외부 장치 2(3000-2)로부터 그래디언트가 수신될 때마다, 글로벌 모델을 갱신할 수 있다. 또한, 서버(2000)는 갱신된 글로벌 모델에 관한 정보를, 상기 그래디언트를 서버(2000)로 전송한 장치로 전송할 수 있다.
또한, 일 실시 예에 의한 서버(2000)의 글로벌 모델은, 서버(2000)의 상황에 관한 정보가 변화됨에 따라서, 갱신될 수도 있다. 따라서, 일 실시 예에 의하면, 외부로부터 데이터(ex. 전자 장치(1000) 또는 다른 외부 장치(3000-1, 3000-2)에서 갱신된 로컬 모델의 그래디언트)가 수신되지 않은 경우에도, 서버(2000)의 상황에 관한 정보에 기초하여, 서버(2000)의 글로벌 모델이 갱신될 수 있다.
일 실시 예에 의하면, 글로벌 모델은 복수의 장치로부터 지속적으로 수신되는 그래디언트에 기초하여, 또는, 서버(2000)의 상황에 관한 정보가 변화함에 기초하여, 지속적으로 갱신될 수 있다. 상술한 예에 한하지 않고, 글로벌 모델은, 다양한 종류의 데이터에 기초하여, 다양한 방법에 따라 지속적으로 갱신될 수 있다.
그러나, 지속적으로 갱신되는 글로벌 모델과는 달리 로컬 모델은, 로컬 모델이 갱신되는데 이용되는 상황 정보가 변경되지 않음에 따라, 상당 기간 갱신되지 않을 수 있다. 따라서, 로컬 모델과 글로벌 모델간의 차이가 커질 수 있다.
일 실시 예에 의한 서버(2000)는, 글로벌 모델이 지속적으로 갱신됨에 따라, 현재의 글로벌 모델의 그래디언트와 가장 최근에 상기 서버(2000)에서 상기 전자 장치(1000)로 전송된 상기 글로벌 모델의 그래디언트가 기준값 이상 차이가 있는지 여부를 판단할 수 있다. 상기 판단은, 주기적으로 서버(2000)에 의해 수행될 수 있다.
서버(2000)는 상기 두 개의 그래디언트 간의 차이가 기준 값 이상인 것으로 판단한 경우, 전자 장치(1000)로 최근에 갱신된 글로벌 모델에 대한 그래디언트를 전송할 수 있다. 전자 장치(1000)는 서버(2000)로부터 수신된 글로벌 모델에 관한 정보, 예를 들면, 글로벌 모델의 그래디언트에 기초하여 로컬 모델을 갱신할 수 있다.
따라서, 일 실시 예에 의한 전자 장치(1000)는, 전자 장치(1000)에서 그래디언트를 서버(2000)로 전송하지 않아도, 서버(2000)로부터 가장 최근에 갱신된 글로벌 모델에 대한 그래디언트를 수신할 수 있다. 일 실시 예에 의한 전자 장치(1000)는, 전자 장치(1000)에서 수집된 상황 정보가 변경되지 않더라도, 서버(2000)로부터 가장 최근에 갱신된 글로벌 모델에 대한 그래디언트를 수신함에 따라서, 글로벌 모델에 기초하여 로컬 모델을 갱신하는 동작을 지속적으로 수행할 수 있다.
또한, 상술한 예에 한하지 않고, 서버(2000)는 다양한 조건 하에서, 전자 장치(1000)로 현재 갱신된 글로벌 모델에 대한 그래디언트를 전송할 수 있다. 예를 들면, 서버(2000)가 전자 장치(1000)를 제외한 적어도 하나의 외부 장치로부터 기준 횟수 이상 그래디언트를 수신하여 글로벌 모델을 기준 횟수 이상 갱신한 경우, 서버(2000)는 현재 갱신된 글로벌 모델에 대한 그래디언트를 전자 장치(1000)로 전송할 수도 있다.
도 3은 일 실시 예에 의한 로컬 모델을 이용하여 객체 인식을 수행하는 시스템을 나타낸 도면이다.
도 3을 참조하면, 일 실시 예에 의한 로컬 모델을 이용하여 객체 인식을 위한 동작을 수행하는 시스템은, 서버(2000) 및 적어도 하나의 전자 장치(3001, 3002, 3003)를 포함할 수 있다. 도 3에 도시된 적어도 하나의 전자 장치(3001, 3002, 3003)는 도 1 및 도 2에 도시된 전자 장치(1000)와 대응될 수 있다.
일 실시 예에 의한 각각의 전자 장치(3001, 3002, 3003)는 서로 다른 집안 환경에 놓여 있고, 서로 다른 사용자에 의하여 사용될 수 있는 가전 기기일 수 있다. 각각의 전자 장치(3001, 3002, 3003)는 서로 다른 집안 환경에 놓임에 따라, 인식할 수 있는 객체가 서로 다를 수 있다. 일 실시 예에 의한 각각의 전자 장치(3001, 3002, 3003)는 객체 인식을 수행하기 위한, 로컬 객체 인식 모델 1, 2, 3을 각각 포함하고, 각각의 전자 장치(3001, 3002, 3003)는 로컬 객체 인식 모델 1, 2, 3을 이용하여 객체 인식을 수행할 수 있다.
일 실시 예에 의하면, 각 전자 장치(3001, 3002, 3003)는 각각의 전자 장치(3001, 3002, 3003)의 주변 환경에 관한 정보에 따라서, 객체 인식을 위한 로컬 객체 인식 모델 1, 2, 3 중 적어도 하나의 로컬 모델을 갱신할 수 있다. 따라서, 일 실시 예에 의한 각 전자 장치(3001, 3002, 3003)의 로컬 객체 인식 모델 1, 2, 3은, 각 전자 장치(3001, 3002, 3003)의 서로 다른 주변 환경에 적합한 객체 인식 동작이 수행될 수 있도록, 갱신될 수 있다.
예를 들어, 로컬 객체 인식 모델을 갱신하는데 이용되는 주변 환경에 관한 정보는, 각 전자 장치(3001, 3002, 3003)에 의해 인식될 수 있는 객체에 관한 상태 정보, 외관 정보, 형태 정보 등을 포함할 수 있다. 상술한 예에 한하지 않고, 주변 환경에 관한 정보는 객체 인식을 위한, 로컬 객체 인식 모델을 갱신하는데 이용될 수 있는 다양한 정보를 포함할 수 있다.
또한, 일 실시 예에 의한, 전자 장치(1000)에서 수집된 상황 정보 중 객체 인식을 위한 로컬 객체 인식 모델과 관련하여 수집된 상황 정보는, 전자 장치(1000)의 주변에 존재하는 객체 상태에 관한 정보, 전자 장치(1000)의 주변에 존재하는 객체 중 전자 장치(1000)에 의하여 새롭게 인식된 객체에 관한 정보 등, 객체 인식과 관련된 다양한 정보를 포함할 수 있다.
또한, 갱신된 로컬 객체 인식 모델의 그래디언트를 서버(2000)로 전송함으로써, 서버(2000)는, 각 전자 장치(3001, 3002, 3003)에서 갱신된 로컬 객체 인식 모델의 그래디언트에 따라, 글로벌 객체 인식 모델을 갱신할 수 있다. 각 전자 장치(3001, 3002, 3003)는 서버(2000)로부터 수신된 갱신된 글로벌 객체 인식 모델에 관한 정보, 예를 들면, 글로벌 객체 인식 모델의 그래디언트에 기초하여, 각 전자 장치(3001, 3002, 3003)에 저장된 서로 다른 로컬 객체 인식 모델을 갱신할 수 있다.
도 4는 일 실시 예에 의한 로컬 모델을 이용하여 음성 인식을 수행하는 시스템을 나타낸 도면이다.
도 4를 참조하면, 일 실시 예에 의한 로컬 모델을 이용하여 음성 인식을 위한 동작을 수행하는 시스템은, 서버(2000) 및 적어도 하나의 전자 장치(4001, 4002, 4003)를 포함할 수 있다. 도 3에 도시된 적어도 하나의 전자 장치(4001, 4002, 4003)는 도 1 및 도 2에 도시된 전자 장치(1000)와 대응될 수 있다.
일 실시 예에 의한 서버(2000)는 글로벌 모델 중 음성 인식을 위한 동작을 수행하는데 이용될 수 있는 글로벌 음성 처리 모델을 포함할 수 있다. 또한, 일 실시 예에 의한 각각의 전자 장치(4001, 4002, 4003)은, 음성 인식을 위한 동작을 수행하는데 이용될 수 있는 로컬 모델로서, 로컬 음성 처리 모델 1, 2, 3을 각각 포함할 수 있다.
일 실시 예에 의한 각각의 전자 장치(4001, 4002, 4003)는 서로 다른 주변 환경을 가질 수 있고, 서로 다른 사용자에 의하여 사용될 수 있는 전자 장치일 수 있다. 각각의 전자 장치(4001, 4002, 4003)는 서로 다른 주변 환경에 놓임에 따라, 서로 다른 주변 환경의 소음 정보에 기초하여, 음성 인식을 수행할 수 있다.
또한, 일 실시 예에 의한, 전자 장치(1000)에서 수집된 상황 정보 중 음성 인식을 위한 로컬 모델과 관련하여 수집된 정보는, 전자 장치(1000)의 주변 환경에서 발생되는 소음에 관한 정보, 전자 장치(1000)에서 인식될 수 있는 사용자의 음성에 관한 정보 등, 음성 인식과 관련된 다양한 정보를 포함할 수 있다.
예를 들면, 전자 장치(4001, 4002, 4003)들은 각각 집안, 회사, 버스 안에 위치할 수 있다. 각 전자 장치(4001, 4002, 4003)들은 서로 다른 주변 환경에 놓임에 따라, 음성 인식되는 오디오 신호에 포함된 소음의 특성도 서로 다를 수 있다.
일 실시 예에 의하면, 각각의 전자 장치(4001, 4002, 4003)는 주변 환경의 소음 정보를 이용하여, 로컬 음성 처리 모델에 따른 음성 인식을 더 효과적으로 수행할 수 있다. 예를 들면, 각각의 전자 장치(4001, 4002, 4003)는, 음성 인식을 수행하고자 하는 사용자의 음성 특성 및 주변 환경의 소음 특성에 기초하여, 오디오 신호에 포함된 사용자의 음성에 대해, 음성 인식을 더 효과적으로 수행할 수 있다. 일 예로, 주변 환경의 소음 정보를 이용하여, 각각의 전자 장치(4001, 4002, 4003)는 사용자의 음성과 적어도 한 종류의 소음 간의 관계 정보를 획득하고, 획득한 정보에 기초하여, 음성 인식이 효과적으로 수행될 수 있도록 로컬 음성 처리 모델을 갱신할 수 있다.
일 실시 예에 의하면, 각 전자 장치(4001, 4002, 4003)는 각각의 전자 장치(4001, 4002, 4003)의 주변 환경의 소음에 관한 정보에 따라서, 음성 인식을 위한 로컬 모델을 갱신할 수 있다. 따라서, 일 실시 예에 의한 각 전자 장치(4001, 4002, 4003)의 로컬 음성 처리 모델은, 각 전자 장치(4001, 4002, 4003)의 서로 다른 주변 환경의 소음에 적합한 음성 인식 동작이 수행될 수 있도록, 갱신될 수 있다.
예를 들어, 로컬 음성 처리 모델을 갱신하는데 이용되는 주변 환경의 소음에 관한 정보는, 각 전자 장치(4001, 4002, 4003)에 의해 감지될 수 있는 적어도 하나의 종류의 소음의 특성에 관한 정보, 사용자의 음성과 적어도 한 종류의 소음 간의 관계 정보 등을 포함할 수 있다. 상술한 예에 한하지 않고, 주변 환경의 소음에 관한 정보는 음성 인식을 위한, 로컬 음성 처리 모델을 갱신하는데 이용될 수 있는 다양한 정보를 포함할 수 있다.
일 실시 예에 의하면, 주변 환경의 소음과 관련된 정보가 변경됨에 따라, 상황 정보가 변경된 것으로 판단되어, 일 실시 예에 의한 로컬 음성 처리 모델이 갱신될 수 있다. 예를 들면, 새로운 종류의 소음이 출현하는 경우, 사용자의 음성과 적어도 한 종류의 소음 간의 관계 정보 중 새로운 관계 정보가 획득되는 경우 등이, 일 실시 예에 따른 상황 정보가 변경되는 경우로 판단될 수 있다.
또한, 갱신된 로컬 음성 처리 모델에 따라 그래디언트를 서버(2000)로 전송함으로써, 서버(2000)는, 각 전자 장치(4001, 4002, 4003)에서 갱신된 로컬 모델에 따라, 글로벌 음성 처리 모델을 갱신할 수 있다. 각 전자 장치(4001, 4002, 4003)는 서버(2000)로부터 수신된 갱신된 글로벌 음성 처리 모델에 관한 정보, 예를 들면, 글로벌 음성 처리 모델의 그래디언트에 기초하여, 각 전자 장치(4001, 4002, 4003)에 저장된 서로 다른 로컬 음성 처리 모델을 갱신할 수 있다.
도 5는 일 실시 예에 의한 로컬 모델 및 글로벌 모델이 갱신되는 일 예를 나타낸 도면이다.
도 5를 참조하면, 전자 장치(1000)는, 로컬 모델(501)을 포함하고, 서버(2000)는, 글로벌 모델(502)을 포함할 수 있다.
또한, 도 5에서 도시된 예에서, 가로 방향의 화살표는, 각각의 인공지능 모델을 통해 동작을 수행하는 실시예와 관련되며, 세로 방향의 화살표는, 각각의 인공지능 모델을 갱신하는 실시예와 관련된다.
일 실시 예에 의하면, 전자 장치(1000)는 전자 장치(1000)에서 수집된 로컬 모델(501) 갱신을 위한 다양한 정보에 기초하여, 로컬 모델(501)을 갱신하고, 갱신된 로컬 모델(501)에 기초하여 그래디언트를 획득할 수 있다.
일 실시 예에 의한 로컬 모델(501) 갱신을 위한 정보는, 전자 장치(1000)에 대한 변경된 상황 정보를 포함할 수 있다. 예를 들면, 상기 갱신을 위한 정보는, 로컬 모델(501)에 의한 동작이 수행된 결과에 대한 피드백 정보에 기초하여, 변경된 상황 정보를 포함할 수 있다.
또한, 일 실시 예에 의하면, 서버(2000)는, 서버(2000)에서 수집된 글로벌 모델(502) 갱신을 위한 정보에 기초하여, 글로벌 모델(502)을 갱신하고, 갱신된 글로벌 모델(502)에 대한 그래디언트를 획득할 수 있다.
일 실시 예에 의한 글로벌 모델(502)의 갱신을 위한 정보는, 서버(2000)가 네트워크(100)를 통해 전자 장치(1000) 또는 다른 외부 장치에 저장된 로컬 모델이 갱신됨에 따라 획득된 적어도 하나의 그래디언트를 수신함으로써 획득될 수 있다. 일 실시 예에 의한 서버(2000)는, 상기 수신된 그래디언트에 기초하여, 글로벌 모델(502)을 갱신할 수 있다.
또한, 일 실시 예에 의한 서버(2000)는 갱신된 글로벌 모델(502)의 그래디언트를, 서버(2000)로 로컬 모델의 그래디언트를 전송한 전자 장치(1000) 또는 다른 외부 장치로 전송할 수 있다. 서버(2000)로부터 갱신된 글로벌 모델(502)에 관한 정보를 수신한 전자 장치(1000) 또는 다른 외부 장치는, 갱신된 글로벌 모델(502)에 관한 정보에 기초하여, 로컬 모델(501)을 갱신할 수 있다.
일 실시 예에 의한 로컬 모델(501) 및 글로벌 모델(502)은 각각 입력 정보가 입력됨에 따라, 입력 정보에 대응하는 출력 정보를 출력할 수 있다.
일 실시 예에 의하면, 전자 장치(1000)는, 온 디바이스 방식에 따라 동작하는 경우, 로컬 모델(501)에 따라, 아이템 추천 동작, 객체 인식 동작, 음성 인식 동작 등을 수행할 수 있다.
일 실시 예에 따라 로컬 모델(501)에 입력되는 입력 정보는, 상술한 아이템 추천 동작, 객체 인식 동작, 음성 인식 동작 등을 수행하는데 필요한 정보를 포함할 수 있다. 예를 들어, 아이템 추천 동작에 대한 입력 정보는, 추천하고자 하는 아이템의 종류에 관한 정보를 포함할 수 있다. 또한, 객체 인식 동작에 대한 입력 정보는, 전자 장치(1000)에서 현재 감지된 센서 정보들(ex. 영상 정보, 적외선 감지 정보 등)을 포함할 수 있다. 또한, 음성 인식 동작에 대한 입력 정보는 전자 장치(1000)에서, 전자 장치(1000)에서 현재 수신된 오디오 신호에 관한 정보를 포함할 수 있다. 또한, 상술한 입력 정보는, 로컬 모델을 갱신하는데 이용되는 상황 정보를 포함할 수 있다. 상술한 예에 한하지 않고, 입력 정보는, 전자 장치(1000)에서 동작을 수행하기 위한 다양한 정보를 포함할 수 있다.
일 실시 예에 따라 로컬 모델(501)에서 출력되는 출력 정보는, 상술한 아이템 추천 동작, 객체 인식 동작, 음성 인식 동작 등을 수행한 결과에 관한 정보를 포함할 수 있다. 예를 들어, 아이템 추천 동작에 대한 출력 정보는, 추천된 아이템에 관한 정보 및 추천된 아이템의 순위 정보 등을 포함할 수 있다. 또한, 객체 인식 동작에 대한 출력 정보는, 센서 정보들에 기초하여 인식된 객체에 관한 식별 정보, 상태 정보 등을 포함할 수 있다. 또한, 음성 인식 동작에 대한 출력 정보는 입력 정보로 입력된 오디오 신호가 음성 인식된 결과로서 획득된 텍스트 정보를 포함할 수 있다. 상술한 예에 한하지 않고, 출력 정보는, 전자 장치(1000)에서 로컬 모델(501)에 따라 동작을 수행된 결과를 나타내는 다양한 정보를 포함할 수 있다.
일 실시 예에 의하면, 전자 장치(1000)가 온 디바이스 방식이 아닌 클라우드 방식에 따라 동작하는 경우, 서버(2000)는, 전자 장치(1000)의 요청에 따라 글로벌 모델(502)을 이용하여 다양한 동작, 예를 들면, 아이템 추천 동작, 객체 인식 동작, 음성 인식 동작 등을 수행할 수 있다.
예를 들면, 전자 장치(1000)가 클라우드 방식으로 동작하는 경우, 로컬 모델(501)에 입력될 입력 정보를 로컬 모델(501)에 입력하는 대신 서버(2000)로 전송하면서, 상술한 동작을 대신 수행하여 줄 것을 서버(2000)에 요청할 수 있다. 서버(2000)는, 전자 장치(1000)의 요청에 따라, 글로벌 모델(502)을 이용하여 동작을 수행하고, 그 결과를 전자 장치(1000)에 전송할 수 있다.
도 6은 일 실시 예에 의한 로컬 모델 또는 글로벌 모델의 예시를 나타내는 도면이다.
일 실시 예에 의한 로컬 모델 또는 글로벌 모델은, 인간의 뇌가 패턴을 인식하는 방식을 모사한 신경망 모델로 구성될 수 있다. 일 실시 예에 의한 전자 장치(1000) 또는 서버(2000)는, 신경망 모델로 구성된 로컬 모델 또는 글로벌 모델을 이용하여, 사용자에게 다양한 서비스를 제공할 수 있다.
일 실시 예에 의한 신경망 모델은 심층 신경망(Deep Neural Network, DNN), 합성곱 신경망(Convolutional Neural Network, CNN), 순환 신경망(Recurrent Neural Network, RNN), BRDNN(Bidirectional Recurrent Deep Neural Network), 제한 볼츠만 머신 (Restricted Boltzmann Machine, RBM), 심층 신뢰 신경망 (Deep Belief Network, DBN), 심층 Q-네트워크(Deep Q-Networks) 중 하나일 수 있다. 또한, 상술한 예에 한하지 않고, 일 실시 예에 의한 로컬 모델 또는 글로벌 모델은 이외 다양한 종류의 신경망 중 하나일 수 있다.
도 6을 참조하면, 일 실시 예에 의한 신경망 모델은, 적어도 하나의 노드를 포함한 적어도 하나의 레이어를 포함할 수 있다. 예를 들면, 신경망 모델은 입력 레이어인 레이어 1과, 출력 레이어인 레이어 2를 포함할 수 있다. 또한, 일 실시 예에 의한 신경망 모델은, 입력 레이어 및 출력 레이어 사이에 적어도 하나의 히든 레이어(미도시)를 더 포함할 수 있다. 이하에서는, 설명의 편의상, 히든 레이어를 제외한 입력 레이어 및 출력 레이어를 포함하는 신경망을 예로 들어 설명하기로 한다.
일 실시 예에 의하면, 신경망 모델의 레이어 1에 적어도 하나의 입력값이 입력될 수 있다. 예를 들면, 레이어 1의 노드(N11, N12)에 각각 I1, I2의 값이 입력될 수 있다. 일 실시 예에 의하면, 레이어 1에 입력값이 입력됨에 따라서, 신경망 모델의 레이어 1 및 레이어 2에 포함된 노드들(N11, N12, N21, N22)이 처리될 수 있다.
또한, 각 레이어의 노드에서 출력된 값은 다음 층의 입력 값으로 이용될 수 있다. 예를 들면, 레이어 1의 노드(N11, N12)가 처리됨에 따라 획득된 값에 기초하여, 레이어 2의 노드(N21, N22)에 소정 값이 입력될 수 있다. 레이어 2로부터 출력된 값은 신경망 모델에서 출력 값으로서 출력될 수 있다. 예를 들면, 레이어 2에서 출력된 값인 O1 및 O2는, 신경망 모델의 출력값으로서 출력될 수 있다.
일 실시 예에 의한 전자 장치(1000)는, 로컬 모델의 입력 레이어에 입력 정보의 값을 입력할 수 있다. 또한, 전자 장치(1000)는 로컬 모델의 출력 레이어에서 출력된 값에 기초하여, 사용자에게 다양한 서비스(ex. 아이템 추천, 객체 인식, 음성 인식)를 제공할 수 있다.
일 실시 예에 의하면, 하나의 노드로부터 출력된 하나의 값에 서로 다른 가중치가 적용됨으로써, 하나의 노드로부터 적어도 하나의 엣지 데이터가 획득될 수 있다. 엣지 데이터는, 하나의 노드로부터 출력된 하나의 값에 적어도 하나의 가중치가 적용됨으로써, 획득될 수 있는 데이터이다. 엣지 데이터는, 하나의 값에 적용된 가중치의 개수만큼, 획득될 수 있다. 따라서, 레이어 1의 각각의 노드로부터 출력된 값은, 적어도 하나의 엣지 데이터로 변환되어 다음 레이어의 노드로 입력될 수 있다. 예를 들면, 노드 N11로부터 출력된 값에 서로 다른 가중치인 W11 및 W12가 적용된 엣지 데이터는 다음 레이어의 노드인 N21 및 N22로 각각 입력될 수 있다. 또한, 노드 N12로부터 출력된 값에 서로 다른 가중치인 W21 및 W22가 적용된 엣지 데이터는 다음 레이어의 노드인 N21 및 N22로 각각 입력될 수 있다.
일 실시 예에 따라, 로컬 모델이 갱신되는 경우, 각 노드에 적용될 수 있는 적어도 하나의 가중치 값이 변경될 수 있다. 일 실시 예에 의한 그래디언트는, 각 노드에 적용되는 최적의 가중치 값을 도출하기 위한 연산 과정에서 획득된 정보를 포함할 수 있다.
일 실시 예에 의하면, 갱신 전 로컬 모델의 가중치 값(W11)에서 최적의 가중치 값(W11')을 도출하기 위해, 손실 함수(Loss Function) 또는 비용 함수(Cost Function)가 이용될 수 있다.
일 실시 예에 의하면, 손실 함수를 통해 결정될 수 있는 손실값은, 로컬 모델에 의해 출력될 수 있는 예측 정보와, 상기 예측 정보에 대한 정답을 나타내는 관측 정보 간의 차이에 기초하여, 결정될 수 있다. 일 실시 예에 의한 관측 정보는, 현재 수집된 상황 정보에 기초하여, 로컬 모델에 의해 출력될 수 있는 예측 정보의 대응되는 정보로서, 결정될 수 있다.
일 실시 예에 의하면, 로컬 모델의 가중치 값(W11)을 상기 손실값이 최소화되는 경우의, 가중치 값(W11')으로 교체함으로써, 로컬 모델을 갱신할 수 있다.
일 실시 예에 의하면, 손실 함수로서, 평균제곱오차(Mean Squared Error) 함수, 교차 엔트로피 오차(Cross Entropy Error) 함수 등이 이용될 수 있다. 상술한 예에 한하지 않고, 손실 함수로서 다양한 종류의 함수가 이용될 수 있다.
일 실시 예에 의한 평균제곱오차 함수 및 교차 엔트로피 오차 함수는 이하 수학식 1과 같이 나타낼 수 있다. 아래 수학식 1에서, 첫번째는 평균제곱오차 함수이고, 두번째는 교차 엔트로피 오차 함수이다. 수학식 1에서, y 및 t는 각각 예측 정보의 값 및 관측 정보의 값을 나타낸다.
Figure PCTKR2020004965-appb-img-000001
일 실시 예에 의한 전자 장치(1000)는 최적의 가중치 값(W11')을 도출하기 위해, 손실 함수에 의하여 획득된 손실 값을 최소화시키는 매개변수(ex. 로컬 모델의 각 노드의 가중치 값과, 바이어스 값)를 결정할 수 있다. 예를 들면, 전자 장치(1000)는, 예측 정보의 복수 개의 예측 값들 중 제1 예측 값을 변수로 하고, 이외 다른 예측 값들은 상수로 하여 표현될 수 있는 손실함수의 그래프에서, 기울기가 최소인 지점에서 손실값(즉, 손실 함수의 결과값)이 최소가 되는 경우, 상기 기울기의 최소값을 제1 그래디언트로서 획득할 수 있다.
또한, 일 실시 예에 의하면, 제2 내지 제n 예측값에 대하여도, 마찬가지로, 손실값이 최소가 될 때, 각각의 예측값과 대응되는 제2 내지 제n 그래디언트를 획득할 수 있다. 따라서, 전자 장치(1000)는 상기 제1 내지 제n 그래디언트를 포함하는 그래디언트를, 갱신된 로컬 모델의 그래디언트로서 획득할 수 있다.
또한, 일 실시 예에 의한 전자 장치(1000)는 손실값이 최소가 될 때, 적어도 하나의 예측 값과 대응되는 매개변수에 기초하여, 로컬 모델을 갱신할 수 있다.
상술한 예에 한하지 않고, 그래디언트는, 로컬 모델의 갱신에 따라 상기 갱신된 로컬 모델을 구성하는 다양한 종류의 정보를 도출하는 과정에서 획득된 다양한 종류의 값을 포함할 수 있다. 예를 들면, 그래디언트는, 갱신된 로컬 모델을 구성하는 노드들에 적용될 수 있는 적어도 하나의 가중치 값들과, 갱신전 로컬 모델의 가중치 값들의 차이값들을 포함할 수 있다.
일 실시 예에 의한 글로벌 모델의 그래디언트도, 상술한 로컬 모델의 그래디언트와 같이, 획득될 수 있다. 예를 들면, 글로벌 모델이 갱신된 후, 상기 갱신된 글로벌 모델에 의해 획득될 수 있는 예측 정보와 대응되는 손실 함수의 기울기 정보가, 상기 갱신된 글로벌 모델의 그래디언트로서 획득될 수 있다. 또한, 글로벌 모델의 그래디언트는, 갱신된 글로벌 모델을 구성하는 노드들에 적용될 수 있는 적어도 하나의 가중치 값들과, 갱신전 글로벌 모델의 가중치 값들의 차이값들을 포함할 수 있다.
도 7은 일 실시 예에 의한 전자 장치(1000)의 동작을 설명하기 위한 도면이다.
도 7을 참조하면, 전자 장치(1000)는 로컬 모델(701)과 상황 정보(702)를 이용하여, 아이템을 추천하는 동작을 수행할 수 있다.
일 실시 예에 의하면, 로컬 모델(701)에 의해 전자 장치(1000)에서 소정의 동작(ex. 아이템 추천, 객체 인식, 음성 인식)이 수행될 수 있고, 수행된 동작의 결과에 기초하여, 상황 정보(702)가 변경될 수 있다. 예를 들면, 상술한 동작의 결과에 대한 사용자의 피드백 정보에 기초하여, 상황 정보(702)가 변경될 수 있다.
또한, 일 실시 예에 의한 로컬 모델(701)에 따른 동작에 대한 사용자의 피드백 정보는 변경된 상황 정보(702)로서, 로컬 모델(701)을 갱신하는데 이용될 수 있다.
따라서, 일 실시 예에 의하면, 상황 정보(702)가 로컬 모델(701)에 입력됨으로써, 상술한 소정의 동작(ex. 아이템 추천, 객체 인식, 음성 인식)이 수행될 수 있으나, 상기 상황 정보(702)가 변경되는 경우, 상기 변경된 상황 정보(702)에 기초하여, 로컬 모델(701)이 갱신될 수도 있다.
일 실시 예에 있어서, 로컬 모델(701)에 따라 동작이 수행되고, 동작 수행 결과에 따라 생성된 피드백 정보에 기초하여 상황 정보(702)가 변경되고, 변경된 상황 정보(702)가 로컬 모델(701)의 갱신을 위한 정보로서 로컬 모델(701)에 전달되는 동작을 하나의 스텝이 수행된 것으로 가정한다.
일 실시 예에 의한, 로컬 모델(701)의 갱신 및 로컬 모델(701)에 의해 수행되는 동작 중 적어도 하나는, 하나의 스텝이 수행될 때마다, 수행될 수 있다.
일 실시 예에 의하면, 미리 결정된 개수의 스텝이 반복하여 수행된 후 최종적으로 갱신된 로컬 모델(701)에 기초하여, 그래디언트가 생성될 수 있다. 일 실시 예에 의한, 전자 장치(1000)는 생성된 그래디언트를 서버(2000)로 전송함으로써, 글로벌 모델에 관한 정보를 수신하고, 수신된 정보에 기초하여, 로컬 모델(701)을 다시 갱신할 수 있다.
일 실시 예에 따른 로컬 모델 또는 글로벌 모델의, 그래디언트는 정책(Policy) 및 가치(Value)에 관한 정보에 기초하여 획득된 정보를 더 포함할 수 있다.
로컬 모델의 정책에 관한 정보는, 로컬 모델에 입력된 값에 따라 어떤 동작이 출력 값으로 선택될 수 있는지에 관한 정보를 포함할 수 있다. 예를 들면, 상기 정책(π)에 관한 정보는, 상술한 각 노드에 대한 가중치 값 및 바이어스 값 중 적어도 하나를 나타내기 위한 정보를 포함할 수 있다. 예를 들면, 정책에 관한 정보는
Figure PCTKR2020004965-appb-img-000002
로 표시될 수 있으며, a는 로컬 모델의 출력 값으로서의 동작, s는 로컬 모델의 입력 값으로서의 상태 정보, t는 시간, θ는 파라미터를 나타낸다.
또한, 로컬 모델의 가치에 관한 정보는 상기 정책에 관한 정보가 로컬 모델에 따라 동작을 수행하는데 얼마나 적합한지를 나타내는 가치에 관한 정보를 포함할 수 있다. 예를 들면, 상기 가치(V)에 관한 정보는, V(S t, θ v)로 표시될 수 있다.
예를 들면, 로컬 모델의 정책에 대한 데이터에 정보(L p)와, 가치에 관한 데이터에 관한 정보(L v)는 각각 아래 수학식 2 및 4에 따라 각각 획득될 수 있다.
수학식 2에서, H(π(θ))는 모델 탐험(model exploration)을 개선시키는 정책에 대한 엔트로피 함수를 나타내고, β는 엔트로피 조직화 항(entropy regularization term)의 강도를 조절하기 위한 파라미터를 나타낸다.
Figure PCTKR2020004965-appb-img-000003
수학식 2의 A(s,a;θ,θ v)는 이하 수학식 2에 따라 획득될 수 있다. 수학식 3에서, k는 로컬 모델이 갱신된 총 횟수를 나타내고, γ은 할인 계수(discount factor)를 나타낸다.
Figure PCTKR2020004965-appb-img-000004
수학식 4에서, R은, 사용자의 피드백 정보를 나타낸다.
Figure PCTKR2020004965-appb-img-000005
상술한 예에 한하지 않고, 그래디언트는, 로컬 모델을 구성하는 적어도 하나의 노드와 관련된 값을 결정하는데 이용될 수 있는 다양한 종류의 정보를 포함할 수 있다.
도 8은 일 실시 예에 의한 시간 흐름에 따라 로컬 모델이 갱신되는 일 예를 나타낸 도면이다.
도 8을 참조하면, 전자 장치(1000)는 T1 시점에서, 상황 정보(801)를 로컬 모델(802)에 입력하여 동작을 수행하고, 수행된 동작에 대한 사용자의 피드백 정보(803)를 획득할 수 있다. 일 실시 예에 의하면, 전자 장치(1000)의 상황 정보(801)는 입력 정보로서, 로컬 모델(802)에 입력되어, 소정의 동작이 수행될 수 있다. 상술한 예에 한하지 않고, 로컬 모델(802)에는, 상황 정보(801)뿐만 아니라, 동작을 수행하는데 필요한 다양한 정보가 입력될 수 있다.
또한, 일 실시 예에 의한, 전자 장치(1000)에서 수집된 상황 정보 중 아이템 추천을 위한 제1 인공지능 모델과 관련하여 수집된 상황 정보는, 제1 인공지능 모델에 의해 추천될 수 있는 적어도 하나의 아이템에 관한 정보, 사용자 및 적어도 하나의 아이템 간의 인터랙션에 관한 정보 등, 아이템 추천과 관련된 다양한 정보를 포함할 수 있다.
로컬 모델에 의해 추천될 수 있는 적어도 하나의 아이템에 관한 정보는 예를 들면, 애플리케이션, 동영상, 정지 영상, 텍스트 파일, 웹 페이지 등을 포함할 수 있다. 또한, 상기 아이템은, 아이템의 이미지에 링크 정보 또는 인덱스 정보가 연결된 것일 수 있다. 또한, 상기 아이템은, 서비스 이용을 위한 객체 형태로 구성될 수도 있다. 일 실시 예에 의한 서비스 이용을 위한 객체는, 서비스 제공자의 서비스를 이용하기 위한 사용자 인터페이스를 의미한다. 예를 들면, 서비스 이용을 위한 객체는, 컨텐츠 제공자로부터 제공되는 서비스를 이용하기 위한, 아이콘, 텍스트, 이미지 및 링크 정보를 포함하는 사용자 인터페이스, 및 객체의 기능에 관한 설명 정보(description)를 포함할 수 있다.
사용자 및 적어도 하나의 아이템 간의 인터랙션에 관한 정보는 예를 들면, 사용자에 의해 적어도 하나의 아이템이 이용된 이력에 관한 정보, 로컬 모델에 의해 추천된 아이템에 대한 사용자의 피드백 정보, 사용자에 의해 적어도 하나의 아이템이 이용된 방법, 시간, 장소 등에 관한 정보, 사용자가 적어도 하나의 아이템에 대해 입력한 신호에 관한 정보 등을 포함할 수 있다.
일 실시 예에 의한 피드백 정보(803)는, 로컬 모델(802)에 따라 수행된 동작에 따라 출력된 정보에 기초하여 생성될 수 있다. 예를 들면, 피드백 정보(803)는, 로컬 모델(802)에 따라 수행된 동작의 결과에 대하여 사용자에 의해 입력된 정보를 포함할 수 있다. 예를 들어, 아이템 추천 동작의 경우, 피드백 정보(803)는 사용자가, 로컬 모델(802)의 출력 정보로서, 추천된 아이템 중 어떤 아이템을 선택하였는지에 관한 정보, 사용자가 추천된 아이템을 선택하였는지 여부에 관한 정보, 사용자에 의해 입력된 추천된 아이템에 대한 순위 정보 등을 포함할 수 있다. 또한, 객체 인식 동작 및 음성 인식 동작의 경우, 피드백 정보(803)는, 로컬 모델(802)의 출력 정보로서, 객체 인식 또는 음성 인식된 결과가 적합한지에 대한 사용자의 의견에 관한 정보를 포함할 수 있다.
T2 시점에서, 상황 정보(804)는, 사용자의 피드백 정보(803)에 따라 변경된 상태(803-1)에 기초하여, 변경될 수 있다. 예를 들면, 사용자의 피드백 정보(803)에 기초하여 전자 장치(1000)는 상황 정보(804) 중 사용자와 아이템 간의 인터랙션에 관한 정보를 변경할 수 있다. 또한, 전자 장치(1000)는 아이템 추천 동작이 수행된 결과에 기초하여, 상황 정보(804) 중 각각의 아이템에 관한 특징 정보로서, 각 아이템이 사용자에게 추천되어 최종적으로 선택되었는지 여부에 관한 정보를 변경할 수 있다. 또한, 전자 장치(1000)는 객체 인식 또는 음성 인식 동작이 수행된 결과에 대한 사용자의 피드백 정보(803)에 기초하여, 상황 정보(804) 중 객체 인식 또는 음성 인식된 결과에 관한 정보를 변경할 수 있다.
상술한 예에 한하지 않고, 상황 정보(804)는, 사용자의 피드백 정보(803)에 따라 변경된 상태(803-1)에 기초하여, 다양한 방법에 의해 변경될 수 있다.
또한, T2 시점에서, 로컬 모델(805)은, 피드백 정보에 기초하여, 갱신이 수행될 수 있다. 전자 장치(1000)는 사용자의 피드백 정보를 반영하여, 로컬 모델(805)을 갱신시킬 수 있다.
T2 시점에서, 상술한 상황 정보(801)의 변경과, 로컬 모델(802)의 갱신이 완료되면, T1 시점에서와 동일하게, 전자 장치(1000)는 변경이 완료된 상황 정보(804)를 로컬 모델(805)에 입력하여 동작을 수행하고, 수행된 동작에 대한 사용자의 피드백 정보(806)를 획득할 수 있다.
T3 시점에서도, T1, T2 시점에서와 동일하게, 상황 정보(804)의 변경과, 로컬 모델(805)의 갱신이 수행될 수 있다. 예를 들면, T3 시점에서, 상황 정보(807)는, 사용자의 피드백 정보(806)에 따라 변경된 상태(806-1)에 따라 변경된 상태(805-1)에 기초하여, 변경될 수 있다. 또한, T3 시점에서, 상술한 상황 정보(804)의 변경과, 로컬 모델(805)의 갱신이 완료되면, T1, T2 시점에서와 동일하게, 전자 장치(1000)는 변경이 완료된 상황 정보(807)를 로컬 모델(808)에 입력하여 동작을 수행하고, 수행된 동작에 대한 사용자의 피드백 정보(809)를 획득할 수 있다.
도 9은 일 실시 예에 의한 전자 장치(1000)의 내부 구성을 도시한 블록도이다.
도 10은 일 실시 예에 의한 전자 장치(1000)의 내부 구성을 도시한 블록도이다.
도 9를 참조하면, 전자 장치(1000)는, 메모리(1700), 프로세서(1300) 및 통신부(1500)를 포함할 수 있다. 그러나, 도 9에 도시된 구성 요소 모두가 전자 장치(1000)의 필수 구성 요소인 것은 아니다. 도 9에 도시된 구성 요소보다 많은 구성 요소에 의해 전자 장치(1000)가 구현될 수도 있고, 도 9에 도시된 구성 요소보다 적은 구성 요소에 의해 전자 장치(1000)가 구현될 수도 있다.
예를 들면, 전자 장치(1000)는 도 10에 도시된 바와 같이, 일부 실시예에 따른 전자 장치(1000)는, 메모리(1700), 프로세서(1300) 및 통신부(1500) 이외에 사용자 입력부(1100), 출력부(1200), 센싱부(1400) 및 A/V 입력부(1600)를 더 포함할 수도 있다.
사용자 입력부(1100)는, 사용자가 전자 장치(1000)를 제어하기 위한 데이터를 입력하는 수단을 의미한다. 예를 들어, 사용자 입력부(1100)에는 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드(접촉식 정전 용량 방식, 압력식 저항막 방식, 적외선 감지 방식, 표면 초음파 전도 방식, 적분식 장력 측정 방식, 피에조 효과 방식 등), 조그 휠, 조그 스위치 등이 있을 수 있으나 이에 한정되는 것은 아니다.
일 실시 예에 의하면, 사용자 입력부(1100)는, 로컬 모델에 따라 수행될 수 있는 소정의 동작(ex. 아이템 추천, 객체 인식, 음성 인식)을 요청하는 사용자의 입력을 수신할 수 있다. 또한, 사용자 입력부(110)는 전자 장치(1000)의 로컬 모델에 의해 수행된 동작에 대한 피드백 정보를 포함하는 사용자의 입력을 수신할 수 있다.
출력부(1200)는, 오디오 신호 또는 비디오 신호 또는 진동 신호를 출력할 수 있으며, 출력부(1200)는 디스플레이부(1210), 음향 출력부(1220), 및 진동 모터(1230)를 포함할 수 있다. 일 실시 예에 의한 출력부(1200)는, 로컬 모델에 의해 수행된 동작의 결과를 출력할 수 있다.
디스플레이부(1210)는 전자 장치(1000)에서 처리되는 정보를 표시 출력한다. 일 실시 예에 의하면, 디스플레이부(1210)는, 사용자의 입력에 따라 로컬 모델에 의해 수행된 동작의 결과를 표시할 수 있다.
한편, 디스플레이부(1210)와 터치패드가 레이어 구조를 이루어 터치 스크린으로 구성되는 경우, 디스플레이부(1210)는 출력 장치 이외에 입력 장치로도 사용될 수 있다. 디스플레이부(1210)는 액정 디스플레이(liquid crystal display), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display), 전기영동 디스플레이(electrophoretic display) 중에서 적어도 하나를 포함할 수 있다. 그리고 전자 장치(1000)의 구현 형태에 따라 전자 장치(1000)는 디스플레이부(1210)를 2개 이상 포함할 수도 있다.
음향 출력부(1220)는 통신부(1500)로부터 수신되거나 메모리(1700)에 저장된 오디오 데이터를 출력한다. 일 실시 예에 의한 음향 출력부(1220)는 로컬 모델에 의해 수행된 동작의 결과를 나타내는 오디오 데이터를 출력할 수 있다.
진동 모터(1230)는 진동 신호를 출력할 수 있다. 또한, 진동 모터(1230)는 터치스크린에 터치가 입력되는 경우 진동 신호를 출력할 수도 있다. 일 실시 예에 의한 진동 모터(1230)는 로컬 모델에 의해 수행된 동작의 결과를 나타내는 진동 신호를 출력할 수 있다.
프로세서(1300)는, 통상적으로 전자 장치(1000)의 전반적인 동작을 제어한다. 예를 들어, 프로세서(1300)는, 메모리(1700)에 저장된 프로그램들을 실행함으로써, 사용자 입력부(1100), 출력부(1200), 센싱부(1400), 통신부(1500), A/V 입력부(1600) 등을 전반적으로 제어할 수 있다. 전자 장치(1000)는 적어도 하나의 프로세서(1300)를 포함할 수 있다.
프로세서(1300)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(1700)로부터 프로세서(1300)에 제공되거나, 통신부(1500)를 통해 수신되어 프로세서(1300)로 제공될 수 있다. 예를 들면 프로세서(1300)는 메모리와 같은 기록 장치에 저장된 프로그램 코드에 따라 명령을 실행하도록 구성될 수 있다.
일 실시 예에 의한 적어도 하나의 프로세서(1300)는 로컬 모델을 갱신하는데 이용되는 전자 장치(1000)의 상황에 관한 정보가 변경됨을 검출할 수 있다. 상기 상황에 관한 정보는, 전자 장치(1000)의 상황에 관한 정보로서, 예를 들면, 상황 정보는, 전자 장치(1000)의 상태에 관한 정보, 전자 장치(1000)의 사용자에 관한 정보, 전자 장치(1000)의 주변 환경에 관한 정보 등을 포함할 수 있다.
또한, 적어도 하나의 프로세서(1300)는 변경된 상황 정보에 기초하여, 로컬 모델을 갱신하기 위한 그래디언트를 생성할 수 있다. 일 실시 예에 의한 적어도 하나의 프로세서(1300)는 그래디언트를 이용하여 로컬 모델을 갱신할 수 있다.
일 실시 예에 의한 적어도 하나의 프로세서(1300)는 그래디언트가 서버로 전송됨에 따라 수신된 글로벌 모델에 관한 정보에 기초하여, 전자 장치(1000)의 로컬 모델을 다시 갱신할 수 있다. 상기 글로벌 모델에 관한 정보는, 전자 장치(1000)로부터 전송된 그래디언트에 기초하여 생성된 글로벌 모델의 그래디언트일 수 있다. 일 실시 예에 의하면, 전자 장치(1000)로부터 전송된 그래디언트에 기초하여, 글로벌 모델의 그래디언트가 생성되고, 글로벌 모델의 그래디언트에 기초하여, 글로벌 모델이 갱신될 수 있다.
센싱부(1400)는, 전자 장치(1000)의 상태 또는 전자 장치(1000) 주변 환경의 상태를 감지하고, 감지된 정보를 프로세서(1300)로 전달할 수 있다.
일 실시 예에 의한 센싱부(1400)에 의해 감지된 다양한 정보에 기초하여, 로컬 모델을 갱신하는데 이용되는 상황 정보가 획득될 수 있다. 예를 들면, 센싱부(1400)에 의해 감지된 사용자 또는 주변환경에 관한 다양한 종류의 센싱 정보에 기초하여, 상황 정보 중 사용자 또는 주변 환경에 관한 정보가 획득될 수 있다.
센싱부(1400)는, 지자기 센서(Magnetic sensor)(1410), 가속도 센서(Acceleration sensor)(1420), 온/습도 센서(1430), 적외선 센서(1440), 자이로스코프 센서(1450), 위치 센서(예컨대, GPS)(1460), 기압 센서(1470), 근접 센서(1480), 및 RGB 센서(illuminance sensor)(1490) 중 적어도 하나를 포함할 수 있으나, 이에 한정되는 것은 아니다.
통신부(1500)는, 전자 장치(1000)가 서버(미도시) 또는 외부 장치(미도시)와 통신을 하게 하는 하나 이상의 구성요소를 포함할 수 있다. 예를 들어, 통신부(1500)는, 근거리 통신부(1510), 이동 통신부(1520), 방송 수신부(1530)를 포함할 수 있다.
근거리 통신부(short-range wireless communication unit)(1510)는, 블루투스 통신부, BLE(Bluetooth Low Energy) 통신부, 근거리 무선 통신부(Near Field Communication unit), WLAN(와이파이) 통신부, 지그비(Zigbee) 통신부, 적외선(IrDA, infrared Data Association) 통신부, WFD(Wi-Fi Direct) 통신부, UWB(ultra wideband) 통신부, Ant+ 통신부 등을 포함할 수 있으나, 이에 한정되는 것은 아니다.
이동 통신부(1520)는, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 여기에서, 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.
방송 수신부(1530)는, 방송 채널을 통하여 외부로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다. 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 구현 예에 따라서 전자 장치(1000)가 방송 수신부(1530)를 포함하지 않을 수도 있다.
일 실시 예에 의한 통신부(1500)는 전자 장치(1000)에서 생성된 그래디언트를 서버(2000)로 전송하고, 전송된 그래디언트에 기초하여 갱신된 글로벌 모델에 관한 정보를 서버(2000)로부터 수신할 수 있다.
A/V(Audio/Video) 입력부(1600)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 이에는 카메라(1610)와 마이크로폰(1620) 등이 포함될 수 있다. 카메라(1610)는 화상 통화모드 또는 촬영 모드에서 이미지 센서를 통해 정지영상 또는 동영상 등의 화상 프레임을 얻을 수 있다. 이미지 센서를 통해 캡쳐된 이미지는 프로세서(1300) 또는 별도의 이미지 처리부(미도시)를 통해 처리될 수 있다. 마이크로폰(1620)은, 외부의 음향 신호를 입력 받아 전기적인 음성 데이터로 처리한다.
일 실시 예에 의한 전자 장치(1000)는 A/V(Audio/Video) 입력부(1600)를 통해 수신된 오디오 신호 또는 비디오 신호 입력에 기초하여, 상황 정보를 획득할 수 있다. 예를 들면, A/V(Audio/Video) 입력부(1600)에 의해 획득된, 사용자 또는 주변 환경에 대한 오디오 신호 또는 비디오 신호 입력에 기초하여, 상황 정보 중 사용자 또는 주변 환경에 관한 정보가 획득될 수 있다.
메모리(1700)는, 프로세서(1300)의 처리 및 제어를 위한 프로그램을 저장할 수 있고, 전자 장치(1000)로 입력되거나 전자 장치(1000)로부터 출력되는 데이터를 저장할 수도 있다.
일 실시 예에 의한 메모리(1700)는 하나 이상의 인스트럭션을 저장할 수 있고, 상술한 전자 장치(1000)의 적어도 하나의 프로세서(1300)는 상기 메모리(1700)에 저장된 상기 하나 이상의 인스트럭션을 실행함으로써, 일 실시 예에 의한 동작을 수행할 수 있다.
또한, 일 실시 예에 의한 메모리(1700)는 적어도 하나의 동작을 수행하는데 이용될 수 있는 적어도 하나의 로컬 모델과, 로컬 모델을 갱신하는데 이용될 수 있는 전자 장치(1000)의 상황 정보를 저장할 수 있다.
메모리(1700)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory) SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.
메모리(1700)에 저장된 프로그램들은 그 기능에 따라 복수 개의 모듈들로 분류할 수 있는데, 예를 들어, UI 모듈(1710), 터치 스크린 모듈(1720), 알림 모듈(1730) 등으로 분류될 수 있다.
UI 모듈(1710)은, 애플리케이션 별로 전자 장치(1000)와 연동되는 특화된 UI, GUI 등을 제공할 수 있다. 터치 스크린 모듈(1720)은 사용자의 터치 스크린 상의 터치 제스처를 감지하고, 터치 제스처에 관한 정보를 프로세서(1300)로 전달할 수 있다. 일부 실시예에 따른 터치 스크린 모듈(1720)은 터치 코드를 인식하고 분석할 수 있다. 터치 스크린 모듈(1720)은 컨트롤러를 포함하는 별도의 하드웨어로 구성될 수도 있다.
터치스크린의 터치 또는 근접 터치를 감지하기 위해 터치스크린의 내부 또는 근처에 다양한 센서가 구비될 수 있다. 터치스크린의 터치를 감지하기 위한 센서의 일례로 촉각 센서가 있다. 촉각 센서는 사람이 느끼는 정도로 또는 그 이상으로 특정 물체의 접촉을 감지하는 센서를 말한다. 촉각 센서는 접촉면의 거칠기, 접촉 물체의 단단함, 접촉 지점의 온도 등의 다양한 정보를 감지할 수 있다.
사용자의 터치 제스처에는 탭, 터치&홀드, 더블 탭, 드래그, 패닝, 플릭, 드래그 앤드 드롭, 스와이프 등이 있을 수 있다.
알림 모듈(1730)은 전자 장치(1000)의 이벤트 발생을 알리기 위한 신호를 발생할 수 있다.
도 11은 일 실시 예에 의한 서버의 내부 구성을 도시한 블록도이다.
도 11을 참조하면, 일 실시 예에 의한 서버(2000)는 도 9에 도시된 전자 장치(1000)의 구성요소와 같이, 메모리(2100), 프로세서(2200) 및 통신부(2300)를 포함할 수 있다.
그러나, 도 11에 도시된 구성 요소 모두가 서버(2000)의 필수 구성 요소인 것은 아니다. 도 11에 도시된 구성 요소보다 많은 구성 요소에 의해 서버(2000)가 구현될 수도 있고, 도 11에 도시된 구성 요소보다 적은 구성 요소에 의해 서버(2000)가 구현될 수도 있다.
프로세서(2200)는, 통상적으로 서버(2000)의 전반적인 동작을 제어한다. 예를 들어, 프로세서(2200)는, 메모리(2100)에 저장된 프로그램들을 실행함으로써, 서버(2000)를 전반적으로 제어할 수 있다. 서버(2000)는 적어도 하나의 프로세서(2200)를 포함할 수 있다.
프로세서(2200)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(2100)로부터 프로세서(2200)에 제공되거나, 통신부(2300)를 통해 수신되어 프로세서(2200)로 제공될 수 있다. 예를 들면 프로세서(2200)는 메모리와 같은 기록 장치에 저장된 프로그램 코드에 따라 명령을 실행하도록 구성될 수 있다.
일 실시 예에 의한 적어도 하나의 프로세서(2200)는 전자 장치(1000)로부터 수신된 그래디언트에 기초하여 글로벌 모델을 갱신할 수 있다. 또한, 적어도 하나의 프로세서(2200)는 갱신된 글로벌 모델에 관한 정보를 생성하여, 전자 장치(1000)로 전송할 수 있다.
일 실시 예에 의한 적어도 하나의 프로세서(2200)는 전자 장치(1000)뿐만 아니라 복수의 외부 장치로부터 수신된 그래디언트에 기초하여 상기 글로벌 모델을 갱신할 수 있다. 따라서, 일 실시 예에 의한 글로벌 모델은, 전자 장치(1000)의 그래디언트뿐만 아니라 서버(2000)로 전송되는 복수의 외부 장치의 그래디언트에 기초하여, 갱신될 수 있다.
통신부(2300)는, 서버(2000)가 전자 장치(1000) 또는 외부 장치와 통신을 하게 하는 하나 이상의 구성요소를 포함할 수 있다.
일 실시 예에 의한 통신부(2300)는 전자 장치(1000)로부터 그래디언트를 수신하고, 수신된 그래디언트에 기초하여 갱신된 글로벌 모델에 관한 정보를 전자 장치(1000)로 전송할 수 있다.
메모리(2100)는, 프로세서(2200)의 처리 및 제어를 위한 프로그램을 저장할 수 있고, 서버(2000)로 입력되거나 서버(2000)로부터 출력되는 데이터를 저장할 수도 있다.
일 실시 예에 의한 메모리(2100)는 하나 이상의 인스트럭션을 저장할 수 있고, 상술한 서버(2000)의 적어도 하나의 프로세서(2200)는 상기 메모리(2100)에 저장된 상기 하나 이상의 인스트럭션을 실행함으로써, 일 실시 예에 의한 동작을 수행할 수 있다.
또한, 일 실시 예에 의한 서버(2000)의 메모리(2100)는 소정의 동작(ex. 아이템 추천, 객체 인식, 음성 인식)을 수행하기 위한 글로벌 모델을 저장할 수 있다.
도 12는 일 실시 예에 의한 로컬 모델을 갱신하는 방법을 나타낸 순서도이다.
도 12를 참조하면, 단계 1201에서, 전자 장치(1000)는 로컬 모델을 갱신하는데 이용되는 전자 장치(1000)의 상황 정보가 변경됨을 검출할 수 있다. 전자 장치(1000)의 상황 정보는 전자 장치(1000)에 구비된 로컬 모델이 갱신되는데 이용될 수 있고, 또한, 로컬 모델에 입력됨으로써, 로컬 모델에 따른 동작(ex. 아이템 추천, 객체 인식, 음성 인식)이 수행되는데 이용될 수도 있다.
예를 들면, 전자 장치(1000)에서 사용 가능한 새로운 아이템이 발생됨에 따라서, 전자 장치(1000)의 이용 가능한 아이템과 관련된 상황 정보가 변경될 수 있다. 또한, 전자 장치(1000)가 새로운 장소로 이동함에 따라서, 전자 장치(1000)의 장소와 관련된 상황 정보가 변경될 수 있다. 또한, 전자 장치(1000)의 주변 환경에 새로운 객체가 출현하거나, 기존 객체의 형태가 변화됨에 따라서, 전자 장치(1000)의 주변 환경에 관한 상황 정보가 변경될 수 있다. 또한, 전자 장치(1000)의 주변 환경에 새로운 발화자가 출현함에 따라서, 전자 장치(1000)에 의해 음성 인식이 수행될 수 있는 발화자에 관한 상황 정보가 변경될 수 있다.
또한, 로컬 모델에 따른 동작이 수행된 결과에 대한 사용자의 피드백 정보에 기초하여, 상황 정보가 변경될 수 있다.
상술한 예에 한하지 않고, 상태 정보는 로컬 모델을 갱신하거나, 로컬 모델에 따른 동작을 수행하는데 이용될 수 있는 다양한 종류의 전자 장치(1000)의 상황에 관한 정보를 포함할 수 있다.
단계 1202에서, 전자 장치(1000)는, 변경된 상황 정보에 따라 로컬 모델을 갱신하기 위한 그래디언트를 결정할 수 있다. 일 실시 예에 의한 그래디언트는, 변경된 상황 정보에 기초하여, 로컬 모델에 출력될 수 있는 예측 정보 및 상기 예측 정보에 대한 정답을 나타내는 관측 정보 간 차이를 나타내는 손실 함수에 기초하여 획득될 수 있다. 예를 들면, 그래디언트는, 상기 손실 함수가 최소가 되는 지점과 관련된 정보, 일 예로, 상기 지점에서의 손실 함수의 기울기 정보를 포함할 수 있다.
단계 1203에서, 전자 장치(1000)는 그래디언트에 기초하여, 로컬 모델을 갱신할 수 있다.
단계 1204에서, 전자 장치(1000)는 그래디언트를 서버(2000)로 전송할 수 있다.
일 실시 예에 의하면, 전자 장치(1000)는, 사용자의 민감한 개인 정보를 포함할 수 있는 전자 장치(1000)의 상태 정보 대신, 그래디언트를 서버(2000)로 전송할 수 있다. 따라서, 일 실시 예에 의하면, 사용자의 민감한 개인 정보가 전송되는 과정에서 유출되는 위험이 제거될 수 있다.
또한, 일 실시 예에 의하면, 그래디언트가 전송 과정에서 보호될 수 있도록, 그래디언트에 대해 노이즈를 추가하는 동작 및 암호화를 수행하는 동작 중 적어도 하나의 동작이 추가로 수행될 수 있다. 예를 들면, 그래디언트에 포함된, 갱신된 인공지능 모델에서 수정된 데이터를 나타내는 적어도 하나의 값에 대하여, 임의로 생성된 노이즈 값이 추가될 수 있다. 상기 노이즈 값은, 상기 적어도 하나의 값에 비해 무시될 수 있을 정도의 작은 값일 수 있다. 따라서, 전자 장치(1000) 또는 서버(2000)는, 상기 그래디언트에 상술한 노이즈가 추가되어 있어도, 상기 추가된 노이즈를 식별하거나 제거하는 동작 없이, 일 실시 예에 따라 로컬 모델 또는 글로벌 모델을 갱신하는 동작을 수행할 수 있다.
또한, 데이터에 노이즈가 추가됨에 따라 데이터 값 자체가 변경되므로, 외부로 그래디언트가 유출되더라도, 유출된 그래디언트에 포함된 데이터가 보호될 수 있다. 따라서, 일 실시 예에 의하면, 그래디언트 자체가 전송되는 대신, 노이즈가 추가되어 변형되거나 암호화된 그래디언트가 전송됨에 따라, 그래디언트가 외부 공격 또는 외부 유출될 위험으로부터 보호될 수 있다.
단계 1205에서, 전자 장치(1000)는 그래디언트를 서버(2000)로 전송함에 따라 글로벌 모델에 관한 정보를 수신할 수 있다. 서버(2000)의 글로벌 모델은, 전자 장치(1000)가 전송한 그래디언트에 기초하여 갱신될 수 있고, 갱신된 글로벌 모델에 관한 정보가 전자 장치(1000)로 전송될 수 있다. 예를 들면, 갱신된 글로벌 모델에 관한 정보는, 갱신된 글로벌 모델의 그래디언트일 수 있다.
단계 1205에서 수신되는 글로벌 모델에 관한 정보는, 글로벌 모델을 구성하는 정보를 포함하는 글로벌 모델의 그래디언트일 수 있다. 전자 장치(1000)는 최종 갱신된 글로벌 모델의 그래디언트에 기초하여, 서버(2000)의 갱신된 글로벌 모델의 그래디언트를 획득하고, 단계 1206에서, 획득된 글로벌 모델의 그래디언트에 기초하여, 로컬 모델을 갱신할 수 있다.
일 실시 예에 의한 글로벌 모델의 그래디언트는, 고정된 시간 구간에서 서버(2000)의 글로벌 모델의 가중치 값들의 차이값들에 기초하여 획득될 수 있다. 상기 고정된 시간 구간은 전자 장치(1000)와 서버(2000) 간 통신이 수행된 시간 구간에 기초하여 설정될 수 있다. 예를 들면, 고정된 시간 구간은, 전자 장치(1000)와 서버(2000) 간 통신이 수행된 가장 최근의 시점과 그 이전의 시점 간의 구간으로 설정될 수 있다. 상술한 예에 한하지 않고, 글로벌 모델의 그래디언트는, 글로벌 모델이 갱신되는데 이용된 다양한 종류의 정보를 포함할 수 있다.
전자 장치(1000)는 일 실시 예에 따라 글로벌 모델에 대한 그래디언트에 기초하여 갱신된 로컬 모델을 따라 동작을 수행할 수 있다.
도 13은 일 실시 예에 의한 서버에서 글로벌 모델을 갱신하는 방법을 나타낸 순서도이다.
도 13을 참조하면, 단계 1301에서, 서버(2000)는 전자 장치(1000)로부터 그래디언트를 수신할 수 있다.
일 실시 예에 의하면, 전자 장치(1000)는 전자 장치(1000)의 로컬 모델을 갱신하는데 이용되는, 전자 장치(1000)의 상황에 관한 정보가 변경됨에 기초하여 로컬 모델을 갱신할 수 있다. 또한, 전자 장치(1000)는, 갱신된 로컬 모델을 구성하는 정보를 포함하는 그래디언트를 서버(2000)로 전송할 수 있다.
따라서, 서버(2000)는 전자 장치(1000)에서 로컬 모델이 갱신됨에 따라, 전자 장치(1000)로부터 그래디언트를 수신받을 수 있다.
단계 1302에서, 서버(2000)는 그래디언트에 기초하여 글로벌 모델을 갱신할 수 있다. 일 실시 예에 의한 글로벌 모델은, 로컬 모델과 대응되는, 소정의 동작(ex. 아이템 추천, 객체 인식, 음성 인식)을 수행하기 위한 모델로, 전자 장치(1000)로부터 수신된 그래디언트에 기초하여, 갱신될 수 있다.
예를 들면, 서버(2000)는 그래디언트에 기초하여 글로벌 모델을 구성하는 다양한 정보를 갱신함으로써, 글로벌 모델을 갱신할 수 있다. 일 예로, 서버(2000)는 글로벌 모델을 구성하는, 각 노드에 대한 가중치 값 및 바이어스 값을 갱신함으로써, 글로벌 모델을 갱신할 수 있다.
단계 1303에서, 서버(2000)는 갱신된 글로벌 모델에 관한 정보, 예를 들면, 그래디언트를 생성하고, 단계 1304에서, 생성된 글로벌 모델에 관한 정보를 전자 장치(1000)로 전송할 수 있다.
일 실시 예에 의한 전자 장치(1000)는 서버(2000)로부터 수신된 글로벌 모델에 관한 정보에 기초하여, 전자 장치(1000)의 로컬 모델을 갱신할 수 있다. 전자 장치(1000)는 갱신된 로컬 모델을 이용하여 소정의 동작(ex. 아이템 추천, 객체 인식, 음성 인식)을 수행할 수 있다.
이하에서, 일 실시 예에 따라 갱신되기 전에 서버(2000)에 저장된 현재의 글로벌 모델에 대한 그래디언트를 제1 그래디언트, 전자 장치(1000)에서 서버(2000)로 전송되는 로컬 모델의 그래디언트를 제2 그래디언트, 제1 그래디언트 및 제2 그래디언트에 기초하여, 획득될 수 있는 현재의 글로벌 모델을 갱신하기 위한 그래디언트를 제3 그래디언트로 지칭하기로 한다.
일 실시 예에 의한, 서버(2000)는, 현재의 글로벌 모델에 대한 제1 그래디언트를 획득하고, 상기 제1 그래디언트와 전자 장치(1000)로부터 수신된 제2 그래디언트에 기초하여, 상기 현재의 글로벌 모델을 갱신하기 위한 제3 그래디언트를 획득할 수 있다. 제3 그래디언트에 기초하여, 현재의 글로벌 모델이 갱신될 수 있고, 제3 그래디언트가 갱신된 글로벌 모델에 관한 정보로서 전자 장치(1000)로 전송됨에 따라, 전자 장치(1000)의 로컬 모델이 다시 갱신될 수 있다.
예를 들면, 갱신된 글로벌 모델에 대한 제1 그래디언트와 및 갱신된 로컬 모델에 대한 제2 그래디언트 간에 서로 대응되는 정보에 대한 적어도 하나의 대표값이 획득될 수 있다. 일 실시 예에 의한 제3 그래디언트는, 상기 획득된 적어도 하나의 대표값으로 구성될 수 있다. 상기 대표값은, 예를 들면, 제1 그래디언트 및 제2 그래디언트에 각각 포함된 기울기 값 간의 산술 평균값 또는 가중 평균값일 수 있다. 또한, 상기 대표값은, 제1 그래디언트 및 제2 그래디언트에 각각 포함된 기울기 값들을 단순 덧셈한 값에 기초하여 획득될 수도 있다.
예를 들어, 제1 그래디언트는, 글로벌 모델의 손실 함수의 기울기 정보를 포함하고, 제2 그래디언트는 상기 글로벌 모델의 손실 함수의 기울기 정보를 포함할 수 있다. 일 실시 예에 의한 기울기 정보는, 예측 정보에 포함된 각각의 예측값을 변수로 하여 손실 함수를 편미분한 값들을 포함할 수 있다. 상기 그래디언트의 기울기 정보는 손실 함수의 값이 최소화되는 지점과 대응되는 값들을 포함할 수 있다.
이 경우, 상기 글로벌 모델의 기울기 정보 및 상기 로컬 모델의 기울기 정보에 대한 대표값이, 상기 제3 그래디언트의 대표값으로서, 획득될 수 있다. 예를 들면, 상기 글로벌 모델의 제1 그래디언트(a)과 상기 로컬 모델의 제2 그래디언트(b)의 산술 평균 값(ex. (a+b)/2) 또는 가중 평균값(ex. (a*a1+b*b1)/2)이 상기 제3 그래디언트의 대표값으로서, 획득될 수 있다.
일 실시 예에 의하면, 상술한 적어도 하나의 대표값을 포함한, 제3 그래디언트에 기초하여 글로벌 모델이 갱신됨으로써, 전자 장치(1000)로부터 수신된 제2 그래디언트에 기초한 글로벌 모델의 갱신이 수행될 수 있다.
상술한 대표값이, 제1 그래디언트 및 제2 그래디언트에 포함된 값들 간의 가중 평균값인 경우, 각 값에 적용되는 가중치 값은 상기 글로벌 모델을 갱신하는데, 가장 적합한 값으로 결정될 수 있다. 예를 들면, 상기 가중치 값은, 상기 가중치 값을 결정하기 위하여 기계 학습이 수행된 결과에 따라서, 상기 글로벌 모델을 갱신하는데 가장 적합한 값으로 결정될 수 있다. 또 다른 예로, 상기 가중 평균값의 가중치는, 글로벌 모델의 학습 결과와 로컬 모델의 학습 결과 중 더 큰 비중을 두고자 하는 학습 결과에 대한 그래디언트인지에 따라 결정될 수 있다.
일 실시 예에 따라 그래디언트에 기초하여, 글로벌 모델이 갱신됨에 따라, 서버(2000)는, 갱신된 글로벌 모델에 관한 정보로서, 글로벌 모델이 갱신되는데 이용된 제3 그래디언트를 획득할 수 있다.
일 실시 예에 따라 서버(2000)에서 생성된, 갱신된 글로벌 모델에 관한 정보는, 전자 장치(1000)의 로컬 모델이 갱신되는데 필요한 정보를 포함할 수 있다. 예를 들면, 전자 장치(1000)의 로컬 모델은, 서버(2000)로부터 수신된 갱신된 글로벌 모델에 관한 정보(ex. 제3 그래디언트)에 기초하여, 갱신될 수 있다.
일 실시 예에 의한 로컬 모델은, 변경된 상황 정보에 따라 갱신된 후, 서버(2000)로부터 수신된 제3 그래디언트와 로컬 모델의 제2 그래디언트에 기초하여 갱신될 수 있다. 예를 들면, 서버(2000)로부터 수신된 제3 그래디언트와 로컬 모델의 제2 그래디언트에 기초하여, 로컬 모델을 다시 갱신하기 위한 제4 그래디언트가 획득될 수 있다. 제4 그래디언트에 기초하여, 제3 그래디언트 수신에 의한 로컬 모델의 갱신 동작이 수행될 수 있다.
예를 들면, 제3 그래디언트에 및 제2 그래디언트에 포함된 정보 간에 서로 대응되는 정보에 대한 적어도 하나의 대표값이 획득될 수 있다. 일 실시 예에 의한 제4 그래디언트는, 상기 획득된 적어도 하나의 대표값으로 구성될 수 있다. 상기 대표값은, 예를 들면, 제3 그래디언트 및 제2 그래디언트에 포함된 값들 간의 산술 평균값 또는 가중 평균값일 수 있다.
예를 들어, 제3 그래디언트는, 갱신된 글로벌 모델의 손실 함수와 관련된 정보를 포함하고, 제2 그래디언트는 로컬 모델의 손실 함수와 관련된 정보를 포함할 수 있다. 이 경우, 상기 갱신된 글로벌 모델의 제 1 그래디언트 및 상기 로컬 모델의 제 2 그래디언트에 대한 대표값(ex. 산술 평균값, 가중 평균값)이, 상기 제4 그래디언트의 대표값으로서, 획득될 수 있다.
일 실시 예에 의하면, 상술한 적어도 하나의 대표값을 포함한, 제4 그래디언트에 기초하여, 전자 장치(1000)에서 수신된 제3 그래디언트에 기초한 로컬 모델의 갱신이 수행될 수 있다. 예를 들면, 로컬 모델의 손실 함수와 관련된 정보가, 제4 그래디언트에 포함된 대표값들을 기반으로 대체됨으로써, 로컬 모델에 대한 갱신이 수행될 수 있다.
일 실시 예에 의하면, 상술한 대표값이, 제3 그래디언트 및 제2 그래디언트에 포함된 값들(ex. c, d) 간의 가중 평균값(ex. (c*c1+d*d1)/2)인 경우, 각 값에 적용되는 가중치 값(ex. c1, d1)은, 상기 로컬 모델을 갱신하는데, 가장 적합한 값으로 결정될 수 있다. 예를 들면, 상기 가중치 값은, 상기 가중치 값을 결정하기 위하여 기계 학습이 수행된 결과에 따라서, 상기 로컬 모델을 갱신하는데 가장 적합한 값으로 결정될 수 있다.
일 실시 예에 의하면, 상기 가중치 값을 결정하기 위한 기계 학습은, 상기 가중치 값에 따라 갱신되는 로컬 모델에 의한 동작이 전자 장치(1000)의 상태 혹은 전자 장치(1000)의 주변 상황과 모순되지 않고 적합하게 수행될 수 있는 가중치 값이 결정될 수 있도록 수행될 수 있다. 예를 들면, 상기 가중치 값은 상기 전자 장치(1000)의 상황에 관한 정보에 기초하여 학습될 수 있다. 상술한 예에 한하지 않고, 상기 각 값에 적용되는 각각의 가중치 값은 다양한 방법에 따라, 적합한 값으로 결정될 수 있다.
일 실시 예에 의하면, 갱신된 글로벌 모델에 관한 정보는, 상술한 제3 그래디언트에 한하지 않고, 최근에 갱신된 글로벌 모델에 기초하여, 로컬 모델을 갱신하는데 필요한 다양한 종류의 정보를 포함할 수 있다.
도 14은 일 실시 예에 의한 로컬 모델 및 글로벌 모델을 갱신하는 시스템을 나타낸 도면이다.
도 14에 도시된 바와 같이, 일 실시 예에 따른 시스템은, 전자 장치(1000), 제1 서버(2000-1), 제2 서버(2000-2), 외부 장치 1(3000-1), 및 외부 장치 2(3000-2)를 포함할 수 있다.
도 14의 전자 장치(1000) 및 제1 서버(2000-1), 제2 서버(2000-2)는 도 1의 전자 장치(1000) 및 서버(2000)와 대응된다. 또한, 도 13의 외부 장치 1(3000-1), 및 외부 장치 2(3000-2)는 도 2의 외부 장치 1(3000-1), 및 외부 장치 2(3000-2)와 대응된다.
일 실시 예에 의한 외부 장치 1(3000-1), 및 외부 장치 2(3000-2)는, 전자 장치(1000)와 동일하게, 각각의 외부 장치 1(3000-1), 및 외부 장치 2(3000-2)에 구비된 로컬 모델을 이용하여, 다양한 서비스를 제공할 수 있다.
일 실시 예에 의한 전자 장치(1000)는, 로컬 모델의 그래디언트를 전송함에 따라, 글로벌 모델에 관한 정보를 제공받을 수 있는 제1 서버(2000-1), 제2 서버(2000-2)를 식별할 수 있다. 전자 장치(1000)는, 외부로부터 제1 서버(2000-1), 제2 서버(2000-2)에 관한 정보를 미리 수신함으로써, 제1 서버(2000-1), 제2 서버(2000-2)를 식별할 수 있다. 또한, 전자 장치(1000)는, 식별된 제1 서버(2000-1), 제2 서버(2000-2) 중 각 서버에 관한 정보에 기초하여, 적합한 서버를 결정할 수 있다. 전자 장치(1000)는 결정된 서버로 그래디언트를 전송하여, 그래디언트에 기초하여 갱신된 글로벌 모델에 관한 정보를 수신할 수 있다.
예를 들면, 전자 장치(1000)는, 식별된 제1 서버(2000-1), 제2 서버(2000-2) 중 전자 장치(1000)와 물리적인 위치가 가까운 서버를 그래디언트를 전송할 서버로 결정할 수 있다.
또한, 전자 장치(1000)는, 식별된 제1 서버(2000-1), 제2 서버(2000-2) 중 로컬 모델의 특성과 동일 또는 유사한 특성을 가지는 글로벌 모델을 포함하는 서버를 그래디언트를 전송할 서버로 결정할 수 있다.
일 실시 예에 의한 서버의 글로벌 모델은, 서버의 위치나 다양한 특성에 따라, 특정한 조건에서 아이템을 추천하는 동작, 객체 인식을 수행하는 동작, 음성 처리를 수행하는 동작 등 다양한 동작을 수행하는데 적합하게 이용될 수 있다. 예를 들면, 영국에 위치한 서버의 글로벌 모델은, 영국의 문화적인 특성을 고려하여 생성된 모델일 수 있으며, 영국에 위치한 전자 장치(1000)가 아이템을 추천하는 동작을 수행하는데 적합하게 이용될 수 있다.
도 14에 개시된 예에 있어서, 전자 장치(1000)는, 제1 서버(2000-1), 제2 서버(2000-2) 중 제1 서버(2000-1)의 글로벌 모델로 로컬 모델을 갱신하는 것이 적합하다고 판단함에 따라, 제1 서버(2000-1)로 그래디언트를 전송할 수 있다. 외부 장치 1(3000-1)도, 전자 장치(1000)와 동일하게, 제1 서버(2000-1)의 글로벌 모델로 로컬 모델을 갱신하는 것이 적합하다고 판단함에 따라, 제1 서버(2000-1)로 그래디언트를 전송할 수 있다.
반면, 외부 장치 2(3000-2)는, 제2 서버(2000-2)의 글로벌 모델로 로컬 모델을 갱신하는 것이 적합하다고 판단함에 따라, 제2 서버(2000-2)로 그래디언트를 전송할 수 있다.
도 15는 일 실시 예에 의한 중개 장치를 통해 로컬 모델 및 글로벌 모델을 갱신하는 시스템을 나타낸 도면이다.
도 15에 도시된 바와 같이, 일 실시 예에 따른 시스템은, 전자 장치 1(1000-2), 전자 장치 2(1000-3), 전자 장치 3(1000-4), 서버(2000)를 포함할 수 있다.
도 15의 서버(2000)는 도 1의 전자 장치(1000)와 대응된다. 일 실시 예에 의한 전자 장치 1(1000-2), 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)는 각각의 전자 장치 1(1000-2), 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)에 구비된 로컬 모델을 이용하여 사용자에게 다양한 서비스(ex. 아이템 추천, 객체 인식, 음성 인식)를 제공할 수 있다.
도 15를 참조하면, 전자 장치 1(1000-2), 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)은 하나의 그룹(1000-1)으로 분류될 수 있다. 예를 들면, 전자 장치 1(1000-2), 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)은 동일한 사용자에 의해 사용자의 댁내에서 사용되는 장치로 결정됨에 의해, 하나의 그룹(1000-1)으로 분류될 수 있다. 또한, 전자 장치 1(1000-2), 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)는, 서로 지리적으로 가까운 위치에 존재하는지 여부, 서로 동일한 계정에 의해 사용되는 장치인지 여부 등 다양한 기준에 따라, 하나의 그룹(1000-1)으로 분류될 수 있다. 일 실시 예에 의한 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)은 각 전자 장치가 속한 그룹(1000-1) 내의 장치 중에서, 각각의 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)의 로컬 모델의 그래디언트를 서버(2000)로 전송할 중개 장치를 결정할 수 있다. 일 실시 예에 의한 중개 장치는, 전자 장치 2(1000-3) 및 전자 장치 3(1000-4) 대신, 상황 정보 변경에 따라 갱신된 로컬 모델의 그래디언트를 서버(2000)로 전송할 수 있다. 또한, 중개 장치는, 갱신된 로컬 모델의 그래디언트를 전송함에 따라 서버(2000)로부터 글로벌 정보의 그래디언트를 수신하고, 수신된 글로벌 정보의 그래디언트를 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)로 전송할 수 있다.
일 실시 예에 의하면, 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)은 각 전자 장치가 속한 그룹(1000-1) 내의 장치 중 중개 장치를 전자 장치 1(1000-2)로 결정할 수 있다.
일 실시 예에 따른 중개 장치로 결정된 전자 장치 1(1000-2)은, 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)보다 성능 또는 네트워크 환경이 더 좋은 장치일 수 있다. 예를 들면, 전자 장치 1(1000-2)은 다른 전자 장치들(1000-3, 1000-4)보다 더 나은 성능을 가지는 스마트폰일 수 있다. 다른 전자 장치들(1000-3, 1000-4)은 스마트폰보다 처리 성능이 낮은 가전기기(ex. 로봇 청소기, 냉장고, 스마트 TV)일 수 있다.
따라서, 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)가 직접 그래디언트를 서버(2000)로 전송하는 경우보다 전자 장치 1(1000-2)을 통해 각 장치에서 생성된 그래디언트를 서버(2000)로 전송하는 경우에, 갱신된 글로벌 모델에 관한 정보를 더 빠르게 획득할 수 있다.
일 실시 예에 의한 전자 장치 1(1000-2)는, 엣지 컴퓨팅 방식에 따라, 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)로부터 수신된 그래디언트를 직접 처리할 수 있다. 예를 들면, 전자 장치 1(1000-2)는, 전자 장치 2(1000-3) 또는 전자 장치 3(1000-4)로부터 수신된 그래디언트에 기초하여, 전자 장치 1(1000-2)의 로컬 모델을 갱신하고, 갱신된 로컬 모델에 대한 그래디언트를 전자 장치 2(1000-3) 또는 전자 장치 3(1000-4)로 전송할 수 있다. 또한, 전자 장치 1(1000-2)는 갱신된 자신의 로컬 모델에 대한 그래디언트를 서버(2000)로 전송하고, 서버(2000)로부터 글로벌 모델에 대한 그래디언트를 수신할 수 있다. 전자 장치 1(1000-2)는 수신된 글로벌 모델의 그래디언트를 이용하여 자신의 로컬 모델을 다시 갱신할 수 있다.
일 실시 예에 의한 전자 장치 1(1000-2)는, 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)로부터 수신된 그래디언트와 전자 장치 1(1000-2)의 로컬 모델에 기초하여 생성된 그래디언트 중 적어도 하나를 서버(2000)로 전송할 수 있다.
예를 들면, 사용자의 행동 패턴이 변경되는 경우, 전자 장치 1(1000-2), 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)의 동작 패턴도 함께 바뀔 가능성이 높다. 따라서, 일 실시 예에 의한 상황 정보 중 사용자의 행동 패턴에 관한 정보가 변경됨에 따라, 전자 장치 1(1000-2)에서 로컬 모델이 갱신되는 경우, 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)에서도 로컬 모델이 갱신되어, 그래디언트가 각 장치에서 생성될 수 있다.
일 실시 예에 의하면, 전자 장치 1(1000-2)의 로컬 모델에 기초하여 그래디언트가 생성된 후, 전자 장치 1(1000-2)는 미리 설정된 시간 내에 전자 장치 2(1000-3) 및 전자 장치 3(1000-4) 중 적어도 하나의 장치로부터 그래디언트가 수신되면 전자 장치 1(1000-2)의 그래디언트와 함께 서버(2000)로 전송할 수 있다.
일 실시 예에 의한 서버(2000)는, 전자 장치 1(1000-2)부터 수신된 적어도 하나의 그래디언트에 기초하여 글로벌 모델을 갱신할 수 있다. 일 실시 예에 의한 서버(2000)는 갱신된 글로벌 모델에 관한 정보를 전자 장치 1(1000-2)로 전송할 수 있다.
일 실시 예에 의한 전자 장치 1(1000-2)는 서버(2000)로부터 수신한 글로벌 모델에 관한 정보를 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)로도 전송할 수 있다. 각각의 전자 장치 1(1000-2), 전자 장치 2(1000-3) 및 전자 장치 3(1000-4)은 서버(2000)로부터 수신된 글로벌 모델에 관한 정보에 기초하여, 각 장치 내의 로컬 모델을 갱신할 수 있다.
도 16은 일 실시 예에 의한 그래디언트에 따라 글로벌 모델 및 로컬 모델을 갱신하는 방법을 나타낸 순서도이다.
도 16을 참조하면, 글로벌 모델 및 로컬 모델에 대한 그래디언트에 기초하여, 글로벌 모델 및 로컬 모델이 갱신될 수 있다.
이하에서, 도 1과 관련한 설명에서 언급한 내용과 동일하게, 서버(2000)에 저장된 현재의 글로벌 모델에 대한 그래디언트를 제1 그래디언트, 전자 장치(1000)에서 서버(2000)로 전송되는 로컬 모델의 그래디언트를 제2 그래디언트, 제1 그래디언트 및 제2 그래디언트에 기초하여, 획득될 수 있는 현재의 글로벌 모델을 갱신하기 위한 그래디언트를 제3 그래디언트로 지칭하기로 한다.
일 실시 예에 따르면, 전자 장치(1000)는 전자 장치(1000)의 상황 정보가 변경됨을 검출함에 따라 로컬 모델을 갱신할 수 있다. 변경된 상황 정보에 기초하여, 로컬 모델이 갱신되면, 전자 장치(1000)는, 단계 1601에서, 갱신된 로컬 모델에 대한 제2 그래디언트를 생성할 수 있다.
일 실시 예에 의한 제2 그래디언트는, 로컬 모델을 갱신하는데 이용된 정보로서, 예를 들면, 각 노드에 적용될 수 있는 가중치 값과, 바이어스 값을 도출하기 위해 손실 함수와 관련하여 획득된 정보(ex. 손실함수의 값이 최소가 되는 지점과 관련된 기울기값)를 포함할 수 있다.
단계 1602에서, 전자 장치(1000)는 갱신된 로컬 모델에 대한 제2 그래디언트를 서버(2000)로 전송할 수 있다. 일 실시 예에 의한 서버(2000)는 전자 장치(1000)로부터 수신된 제2 그래디언트에 기초하여 글로벌 모델을 갱신할 수 있다.
단계 1603에서, 서버(2000)는 글로벌 모델을 갱신하기 전에, 현재 서버(2000)에 저장된 글로벌 모델에 대한 제1 그래디언트를 획득할 수 있다. 그리고, 단계 1604에서, 서버(2000)는 제1 그래디언트 및 제2 그래디언트에 기초하여, 제3 그래디언트를 생성할 수 있다. 일 실시 예에 의한 제3 그래디언트는, 제1 그래디언트에 포함된 손실 함수와 관련된 정보 및 제2 그래디언트에 포함된 손실 함수와 관련된 정보 간에 서로 대응되는 정보에 대한 적어도 하나의 대표값을 포함할 수 있다. 일 실시 예에 의한 대표값은, 각 그래디언트에 포함된 값들 간 산술 평균값, 가중 평균값 또는 단순 덧셈한 값에 기초하여 획득될 수 있다.
단계 1605에서, 서버(2000)는 제3 그래디언트를 전자 장치(1000)로 전송할 수 있다. 또한, 단계 1607에서, 서버(2000)는 제3 그래디언트에 따라 글로벌 모델을 갱신할 수 있다. 예를 들면, 글로벌 모델을 구성하는 각 노드에 적용될 수 있는 가중치 값 및 바이어스 값은, 제3 그래디언트에 포함된 손실 함수와 관련된 정보에 기초하여 수정됨으로써, 글로벌 모델이 갱신될 수 있다.
또한, 단계 1606에서, 전자 장치(1000)는, 서버(2000)로부터 수신된 제3 그래디언트에 기초하여 로컬 모델을 갱신할 수 있다. 단계 1606에서의 로컬 모델의 갱신은, 단계 1604에서 제3 그래디언트를 생성하고, 단계 1607에서 생성된 제3 그래디언트에 따라 글로벌 모델이 갱신되는 동작과 동일하게 수행될 수 있다.
예를 들면, 로컬 모델을 구성하는 각 노드에 적용될 수 있는 가중치 값 및 바이어스 값은, 제2 그래디언트에 포함된 정보 및 제3 그래디언트에 포함된 정보 간에 서로 대응되는 정보에 대한 적어도 하나의 대표값과 대응되는 예측 정보가 상기 로컬 모델에 의해 출력될 수 있도록 수정됨으로써, 로컬 모델이 갱신될 수 있다.
일 실시 예에서, 상기 적어도 하나의 대표 값은 제2 그래디언트 및 제3 그래디언트에 포함된 값들 간의 산술 평균값 및 가중 평균값일 수 있다. 또한, 가중 평균값에서 각 값에 적용되는 가중치는, 상기 로컬 모델에 따른 동작이 상기 전자 장치(1000)의 현재 상황에 적합하도록, 학습된 값으로 결정될 수 있다. 예를 들면, 가중 평균값에서 각 정보에 적용되는 가중치 중, 로컬 모델에 대한 그래디언트에 포함된 값에 적용되는 가중치는, 상기 전자 장치(1000)의 상황 정보에 기초하여, 결정될 수 있다.
도 17은 일 실시 예에 의한 그래디언트에 따라 글로벌 모델과, 전자 장치(1000)의 제1 로컬 모델 및 외부 장치(3000)의 제2 로컬 모델을 갱신하는 방법을 나타낸 순서도이다.
도 17을 참조하면, 전자 장치(1000)는 전자 장치(1000)의 상황 정보가 변화됨에 따라 제1 로컬 모델을 갱신할 수 있고, 외부 장치(3000)에서는 외부 장치(3000)의 상황 정보가 변화됨에 따라 제2 로컬 모델을 갱신할 수 있다.
도 17의 서버(2000)는 복수 개의 장치로부터 수신된, 갱신된 로컬 모델의 그래디언트에 기초하여, 글로벌 모델을 갱신할 수 있다. 또한, 서버(2000)는 갱신된 글로벌 모델에 대한 그래디언트를, 로컬 모델의 그래디언트를 서버(2000)로 전송한 각각의 장치로 전송할 수 있다.
이하에서, 도 1 및 도 16과 관련한 설명에서 언급한 내용과 동일하게, 서버(2000)에 저장된 현재의 글로벌 모델에 대한 그래디언트를 제1 그래디언트, 외부 장치(3000)에서 서버(2000)로 전송되는 로컬 모델의 그래디언트를 제2 그래디언트, 제1 그래디언트 및 제2 그래디언트에 기초하여, 획득될 수 있는 현재의 글로벌 모델을 갱신하기 위한 그래디언트를 제3 그래디언트로 지칭하기로 한다.
또한, 전자 장치(1000)에서 서버(2000)로 전송되는 로컬 모델의 그래디언트를 제4 그래디언트로 지칭하기로 한다. 로컬 모델이 갱신될 때의 글로벌 모델의 그래디언트가 제3 그래디언트인 경우, 제3 그래디언트 및 제4 그래디언트에 기초하여, 획득될 수 있는 현재의 글로벌 모델을 갱신하기 위한 그래디언트를 제5 그래디언트로 지칭하기로 한다.
일 실시 예에 따르면, 외부 장치(3000)는, 도 16에서의 로컬 모델의 갱신과 동일하게, 외부 장치(3000)의 상황 정보가 변경됨을 검출함에 따라, 외부 장치(3000)의 제2 로컬 모델을 갱신할 수 있다. 변경된 상황 정보에 기초하여, 제2 로컬 모델이 갱신되면, 외부 장치(3000)는, 단계 1701에서, 갱신된 로컬 모델에 대한 제2 그래디언트를 생성할 수 있다.
단계 1702에서, 외부 장치(3000)는 갱신된 로컬 모델에 대한 제2 그래디언트를 서버(2000)로 전송할 수 있다. 일 실시 예에 의한 서버(2000)는 외부 장치(3000)로부터 수신된 제2 그래디언트에 기초하여 글로벌 모델을 갱신할 수 있다.
단계 1703에서, 서버(2000)는 글로벌 모델을 갱신하기 전에, 현재 서버(2000)에 저장된 글로벌 모델에 대한 제1 그래디언트를 획득할 수 있다. 제1 그래디언트는, 글로벌 모델이 갱신될 때 미리 생성되어 서버(2000)에 이미 저장되어 있는 정보일 수 있다.
그리고, 단계 1704에서, 서버(2000)는 제1 그래디언트 및 제2 그래디언트에 기초하여, 제3 그래디언트를 생성할 수 있다.
단계 1705에서, 서버(2000)는 제3 그래디언트를 외부 장치(3000)로 전송할 수 있다. 또한, 단계 1707에서, 서버(2000)는 제3 그래디언트에 따라 글로벌 모델을 갱신할 수 있다.
또한, 단계 1706에서, 외부 장치(3000)는, 제2 그래디언트 및 서버(2000)로부터 수신된 제3 그래디언트에 기초하여 제2 로컬 모델을 갱신할 수 있다. 단계 1706에서의 제2 로컬 모델의 갱신은, 단계 1704에서 제3 그래디언트를 생성하고, 단계 1707에서 생성된 제3 그래디언트와, 제1 그래디언트에 따라 글로벌 모델이 갱신되는 동작과 동일하게 수행될 수 있다.
단계 1708에서, 전자 장치(1000)는, 단계 1701의 제2 로컬 모델의 갱신과 동일하게, 전자 장치(1000)의 상황 정보가 변경됨을 검출함에 따라, 전자 장치(1000)의 제1 로컬 모델을 갱신할 수 있다. 변경된 상황 정보에 기초하여, 제1 로컬 모델이 갱신되면, 전자 장치(1000)는, 단계 1708에서, 갱신된 제1 로컬 모델에 대한 제4 그래디언트를 생성할 수 있다.
단계 1709에서, 전자 장치(1000)는 갱신된 제1 로컬 모델에 대한 제4 그래디언트를 서버(2000)로 전송할 수 있다. 제4 그래디언트는, 단계 1707에서, 제3 그래디언트에 따라 글로벌 모델이 갱신된 이후에, 서버(2000)에서 수신될 수 있다. 일 실시 예에 의한 서버(2000)는 전자 장치(1000)로부터 수신된 제4 그래디언트에 기초하여, 단계 1707에서 갱신된 글로벌 모델을 재차 갱신할 수 있다.
따라서, 일 실시 예에 의한, 글로벌 모델은, 복수 개의 장치에서 갱신된 로컬 모델에 대한 복수 개의 그래디언트에 기초하여, 갱신이 수행될 수 있다.
단계 1710에서, 서버(2000)는 글로벌 모델을 갱신하기 전에, 현재의 글로벌 모델에 대한 제3 그래디언트를 획득할 수 있다.
그리고, 단계 1711에서, 서버(2000)는 제3 그래디언트 및 제4 그래디언트에 기초하여, 제5 그래디언트를 생성할 수 있다. 일 실시 예에 의한 제5 그래디언트는, 제3 그래디언트와 제4 그래디언트 간에 서로 대응되는 정보에 대한 적어도 하나의 대표값으로 구성될 수 있다. 일 실시 예에 의한 대표값은, 각 그래디언트에 포함된 값들 간 산술 평균값, 가중 평균값 또는 단순 덧셈한 값에 기초하여 획득될 수 있다.
단계 1712에서, 서버(2000)는 제5 그래디언트를 전자 장치(1000)로 전송할 수 있다. 또한, 단계 1714에서, 서버(2000)는 제5 그래디언트에 따라 글로벌 모델을 갱신할 수 있다.또한, 단계 1713에서, 전자 장치(1000)는, 서버(2000)로부터 수신된 제5 그래디언트와, 제4 그래디언트에 기초하여 제1 로컬 모델을 갱신할 수 있다. 단계 1713에서의 제1 로컬 모델의 갱신은, 단계 1706에서 제2 로컬 모델이 갱신되는 동작과 동일하게 수행될 수 있다.
도 18은 일 실시 예에 의한 글로벌 모델과, 전자 장치의 제1 로컬 모델 및 외부 장치의 제2 로컬 모델을 갱신하는 방법을 나타낸 순서도이다.
도 18의 각 단계들은 도 17의 각 단계들과 일부 대응되나, 도 18은, 도 17에 도시된 방법과는 다르게, 제1 로컬 모델, 제2 로컬 모델 및 글로벌 모델이 갱신될 수 있다.
일 실시 예에 따르면, 외부 장치(3000)는, 도 16 및 도 17에서의 로컬 모델의 갱신과 동일하게, 외부 장치(3000)의 상황 정보가 변경됨을 검출함에 따라, 외부 장치(3000)의 제2 로컬 모델을 갱신할 수 있다. 변경된 상황 정보에 기초하여, 제2 로컬 모델이 갱신되면, 외부 장치(3000)는, 단계 1801에서, 갱신된 로컬 모델에 대한 제2 그래디언트를 생성할 수 있다.
단계 1802에서, 외부 장치(3000)는 갱신된 로컬 모델에 대한 제2 그래디언트를 서버(2000)로 전송할 수 있다. 일 실시 예에 의한 서버(2000)는 외부 장치(3000)로부터 수신된 제2 그래디언트에 기초하여 글로벌 모델을 갱신할 수 있다.
단계 1803에서, 서버(2000)는 글로벌 모델을 갱신하기 전에, 현재 서버(2000)에 저장된 글로벌 모델에 대한 제1 그래디언트를 획득할 수 있다.
예를 들면, 글로벌 모델에 대한 제1 그래디언트는, 고정된 시간 구간에서, 글로벌 모델의 가중치 값들의 차이값들에 기초하여 획득될 수 있다. 상기 고정된 시간 구간은, 전자 장치(1000)또는 다른 외부 장치들과 로컬 모델 또는 글로벌 모델의 갱신을 위하여 서버(2000) 간 통신이 수행된 가장 최근의 시점과 그 이전의 시점 간의 구간으로 설정될 수 있다.
단계 1804에서, 서버(2000)는, 단계 1803에서 획득된, 제1 그래디언트를 외부 장치(3000)로 전송할 수 있다.
그리고, 단계 1805에서, 서버(2000)는 제2 그래디언트에 기초하여 글로벌 모델을 갱신할 수 있다. 예를 들면, 서버(2000)는 제1 그래디언트 및 제2 그래디언트에 기초하여, 제3 그래디언트를 생성할 수 있고, 제3 그래디언트에 따라 글로벌 모델을 갱신할 수 있다. 예를 들면, 제3 그래디언트는, 제1 그래디언트 및 제2 그래디언트 간에 서로 대응되는 정보에 대한 적어도 하나의 대표값으로 구성될 수 있다. 상술한 예에 한하지 않고, 서버(2000)는, 제2 그래디언트에 기초하여, 다양한 방법에 따라, 글로벌 모델을 갱신할 수 있다.
단계 1806에서, 외부 장치(3000)는, 제2 그래디언트 및 서버(2000)로부터 수신된 제1 그래디언트에 기초하여 제2 로컬 모델을 갱신할 수 있다. 단계 1806에서의 제2 로컬 모델의 갱신은, 단계 1805에서 제3 그래디언트를 생성하고, 상기 생성된 제3 그래디언트와, 제1 그래디언트에 따라 글로벌 모델이 갱신되는 동작과 동일하게 수행될 수 있다.
일 실시 예에 의하면, 제1 그래디언트 및 제2 그래디언트에 기초하여 글로벌 모델 또는 제2 로컬 모델이 갱신되는데 이용되는 제3 그래디언트는, 각각 글로벌 모델 또는 제2 로컬 모델이 갱신되는데 적합한 대표값에 기초하여 생성될 수 있다. 예를 들어, 글로벌 모델이 갱신되는데 적합한 대표값이 단순 덧셈한 값인 경우, 제1 그래디언트 및 제2 그래디언트 간 서로 대응되는 정보를 단순 덧셈한 값에 기초하여 생성된 제3 그래디언트에 기초하여, 글로벌 모델이 갱신될 수 있다.
상술한 예에 한하지 않고, 글로벌 모델 및 제2 로컬 모델은, 제1 그래디언트 및 제2 그래디언트에 기초하여, 다양한 방법에 따라 획득된 정보에 기초하여, 다양한 방법에 따라 갱신될 수 있다.
단계 1807에서, 전자 장치(1000)는, 단계 1801의 제2 로컬 모델의 갱신과 동일하게, 전자 장치(1000)의 상황 정보가 변경됨을 검출함에 따라, 전자 장치(1000)의 제1 로컬 모델을 갱신할 수 있다. 변경된 상황 정보에 기초하여, 제1 로컬 모델이 갱신되면, 전자 장치(1000)는, 단계 1807에서, 갱신된 제1 로컬 모델에 대한 제4 그래디언트를 생성할 수 있다.
단계 1808에서, 전자 장치(1000)는 갱신된 제1 로컬 모델에 대한 제4 그래디언트를 서버(2000)로 전송할 수 있다. 제4 그래디언트는, 단계 1805에서, 글로벌 모델이 갱신된 이후에, 서버(2000)에서 수신될 수 있다. 일 실시 예에 의한 서버(2000)는 전자 장치(1000)로부터 수신된 제4 그래디언트에 기초하여, 단계 1805에서 갱신된 글로벌 모델을 재차 갱신할 수 있다.
따라서, 일 실시 예에 의한, 글로벌 모델은, 복수 개의 장치에서 갱신된 로컬 모델에 대한 복수 개의 그래디언트에 기초하여, 갱신이 수행될 수 있다.
단계 1809에서, 서버(2000)는 글로벌 모델을 갱신하기 전에, 현재의 글로벌 모델에 대한 제5 그래디언트를 획득할 수 있다.
일 실시 예에 의하면, 단계 1805에서 글로벌 모델이 갱신된 이후에, 글로벌 모델이 다양한 요인으로 인해 갱신될 수 있는 경우를 고려하여, 단계 1809에서, 현재 시점의 글로벌 모델에 대한 제5 그래디언트가 획득될 수 있다. 예를 들면, 고정된 시간 구간에서의, 글로벌 모델의 가중치 값들의 차이값들에 기초하여 제5 그래디언트가 획득될 수 있다. 상기 고정된 시간 구간은, 전자 장치(1000)또는 다른 외부 장치들과 로컬 모델 또는 글로벌 모델의 갱신을 위하여 서버(2000) 간 통신이 수행된 가장 최근의 시점과 그 이전의 시점 간의 구간으로 설정될 수 있다.
단계 1810에서, 서버(2000)는, 전자 장치(1000)의 제1 로컬 모델이 현재의 글로벌 모델에 따라 갱신될 수 있도록, 단계 1809에서 획득된 제5 그래디언트를 전자 장치(1000)로 전송할 수 있다.
단계 1811에서, 전자 장치(1000)는, 제4 그래디언트 및 서버(2000)로부터 수신된 제5 그래디언트에 기초하여 제1 로컬 모델을 갱신할 수 있다. 단계 1811에서의 제1 로컬 모델의 갱신은, 이하 단계 1812에서 제6 그래디언트를 생성하고, 상기 생성된 제6 그래디언트에 따라 글로벌 모델이 갱신되는 동작과 동일하게 수행될 수 있다.
단계 1812에서, 서버(2000)는 제4 그래디언트에 기초하여 글로벌 모델을 갱신할 수 있다. 예를 들면, 서버(2000)는 제4 그래디언트 및 제5 그래디언트에 기초하여, 제6 그래디언트를 생성하고, 생성된 제6 그래디언트에 따라서, 글로벌 모델을 갱신할 수 있다. 일 실시 예에 의한 제6 그래디언트는, 제4 그래디언트와 제5 그래디언트 간에 서로 대응되는 정보에 대한 적어도 하나의 대표값으로 구성될 수 있다. 일 실시 예에 의한 대표값은, 각 그래디언트에 포함된 값들 간 산술 평균값, 가중 평균값 또는 단순 덧셈한 값에 기초하여 획득될 수 있다. 상술한 예에 한하지 않고, 서버(2000)는, 제4 그래디언트에 기초하여, 다양한 방법에 따라, 글로벌 모델을 갱신할 수 있다.
일 실시 예에 의하면, 제4 그래디언트 및 제5 그래디언트에 기초하여 글로벌 모델 또는 제1 로컬 모델이 갱신되는데 이용되는 제6 그래디언트는, 각각 글로벌 모델 또는 제1 로컬 모델이 갱신되는데 적합한 대표값에 기초하여 생성될 수 있다. 예를 들어, 글로벌 모델이 갱신되는데 적합한 대표값이 단순 덧셈한 값인 경우, 제4 그래디언트 및 제5 그래디언트 간 서로 대응되는 정보를 단순 덧셈한 값에 기초하여 생성된 제6 그래디언트에 기초하여, 글로벌 모델이 갱신될 수 있다.
상술한 예에 한하지 않고, 글로벌 모델 및 제1 로컬 모델은, 제4 그래디언트 및 제5 그래디언트에 기초하여, 다양한 방법에 따라 획득된 정보에 기초하여, 다양한 방법에 따라 갱신될 수 있다.일 실시 예에 의하면, 사용자의 민감한 정보를 포함할 수 있는 전자 장치의 상황에 관한 정보 대신, 상황 정보에 기초하여 갱신된 로컬 모델에 관한 그래디언트가 서버로 전송됨으로써, 전송 과정에서 개인 정보가 유출될 위험이 제거될 수 있다.
일 실시 예에 의하면, 전자 장치의 인공지능 모델을 갱신하기 위해, 상황에 관한 정보 대신 상황에 관한 정보보다 더 적은 데이터 크기를 가지는 그래디언트가 서버로 전송될 수 있어, 로컬 모델의 갱신이 더 빠르게 수행될 수 있다.
일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 또는 프로그램 모듈을 포함하며, 임의의 정보 전달 매체를 포함한다.
또한, 본 명세서에서, “부”는 프로세서 또는 회로와 같은 하드웨어 구성(hardware component), 및/또는 프로세서와 같은 하드웨어 구성에 의해 실행되는 소프트웨어 구성(software component)일 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (15)

  1. 전자 장치에서, 인공지능 모델을 갱신하는 방법에 있어서,
    상기 전자 장치에 저장된 로컬 모델을 갱신하는데 이용되는, 상기 전자 장치의 상황에 관한 정보가 변경됨을 검출하는 단계;
    상기 변경된 상황에 관한 정보에 기초하여, 상기 로컬 모델을 갱신하기 위한 그래디언트(gradient)를 결정하는 단계;
    상기 결정된 그래디언트에 기초하여, 상기 로컬 모델을 갱신하는 단계;
    상기 그래디언트를 서버로 전송하는 단계;
    상기 서버로부터, 상기 그래디언트에 기초하여 갱신된 글로벌 모델에 관한 정보를 수신하는 단계; 및
    상기 수신된 정보에 기초하여, 상기 로컬 모델을 갱신하는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 그래디언트를 결정하는 단계는
    상기 변경된 상황에 관한 정보에 기초하여, 상기 로컬 모델에 의해 출력될 수 있는 예측 정보 및 상기 예측 정보에 대한 정답을 나타내는 관측 정보를 획득하는 단계;
    상기 관측 정보 및 상기 예측 정보 간 차이를 나타내는 손실 함수를 획득하는 단계; 및
    상기 손실 함수의 값이 최소가 되는 지점과 관련된 정보를 포함하는 상기 그래디언트를 결정하는 단계를 포함하는, 방법.
  3. 제1항에 있어서, 상기 갱신된 글로벌 모델에 관한 정보는,
    상기 글로벌 모델을 갱신하는데 이용된, 상기 글로벌 모델에 대한 손실 함수의 값이 최소가 되는 지점과 관련된 정보를 포함하는, 그래디언트를 포함하는, 방법.
  4. 제3항에 있어서, 상기 수신된 정보에 기초하여, 상기 로컬 모델을 갱신하는 단계는
    상기 갱신된 글로벌 모델에 대한 그래디언트에 포함된 손실 함수와 관련된 정보와, 상기 갱신된 로컬 모델에 대한 그래디언트에 포함된 손실 함수와 관련된 정보 간에 서로 대응되는 정보에 대한 적어도 하나의 대표값을 획득하는 단계; 및
    상기 적어도 하나의 대표값에 기초하여, 상기 로컬 모델을 갱신하는 단계를 포함하는, 방법.
  5. 제4항에 있어서, 상기 적어도 하나의 대표값 중 적어도 하나의 값은
    상기 각각 대응되는 정보에 대한 산술 평균값 또는 가중 평균값인, 방법.
  6. 제5항에 있어서, 상기 가중 평균값은 상기 서로 대응되는 각각의 정보에 적어도 하나의 가중치가 적용됨으로써 획득되고,
    상기 적어도 하나의 가중치 중, 상기 갱신된 로컬 모델에 대한 그래디언트에 포함된 손실 함수와 관련된 정보에 적용되는 가중치는, 상기 전자 장치의 상황에 관한 정보에 기초하여, 결정되는, 방법.
  7. 제1항에 있어서, 상기 글로벌 모델은,
    적어도 하나의 외부 장치에 대한 각각의 로컬 모델이 갱신됨에 따라, 상기 각각의 로컬 모델에 대한 적어도 하나의 그래디언트에 기초하여 갱신된 후, 상기 전자 장치로부터 그래디언트가 수신됨에 따라 상기 전자 장치의 그래디언트에 기초하여 갱신되는, 방법.
  8. 제1항에 있어서, 상기 그래디언트는,
    상기 그래디언트에 대하여, 노이즈를 추가하는 동작 및 암호화를 수행하는 동작 중 적어도 하나의 동작이 수행된 후, 상기 서버로 전송되는, 방법.
  9. 제1항에 있어서, 상기 서버로 전송하는 단계는
    상기 전자 장치에서 상기 로컬 모델의 그래디언트를 전송할 중개 장치를 식별하는 단계;
    상기 중개 장치를 통해 상기 로컬 모델의 그래디언트를 상기 서버로 전송하는 단계를 포함하고,
    상기 중개 장치는, 적어도 하나의 전자 장치로부터 적어도 하나의 그래디언트를 수신하고, 상기 수신된 적어도 하나의 그래디언트를 상기 서버로 전송하는, 방법.
  10. 제1항에 있어서,
    현재의 글로벌 모델에 대한 그래디언트와, 이전에 상기 서버에서 상기 전자 장치로 전송된 상기 글로벌 모델의 그래디언트가 기준값 이상 차이가 존재함에 따라, 상기 서버로부터 상기 현재의 글로벌 모델에 대한 그래디언트를 수신하는 단계; 및
    상기 수신된 그래디언트에 기초하여, 상기 로컬 모델을 갱신하는 단계를 더 포함하는, 방법.
  11. 제1항에 있어서, 상기 전자 장치의 상황에 관한 정보가 변경됨이 검출되면,
    상기 전자 장치가 현재 유휴 상태인지 여부, 상기 로컬 모델을 갱신하기 위한 상기 전자 장치의 메모리 공간이 충분한지 여부, 상기 전자 장치의 배터리가 현재 충전 중인지 여부 및 현재 시간이 심야 시간인지 여부 중 적어도 하나에 기초하여, 상기 로컬 모델을 갱신하는, 방법.
  12. 인공지능 모델을 갱신하는 전자 장치에 있어서,
    로컬 모델을 저장하는 메모리;
    상기 로컬 모델을 갱신하는데 이용되는 상기 전자 장치의 상황에 관한 정보가 변경됨을 검출하고, 상기 변경된 상황에 관한 정보에 기초하여, 상기 로컬 모델을 갱신하기 위한 그래디언트를 결정하고, 상기 결정된 그래디언트에 기초하여, 상기 로컬 모델을 갱신하는 적어도 하나의 프로세서; 및
    상기 그래디언트를 서버로 전송하고, 상기 서버로부터 상기 그래디언트에 기초하여 갱신된 글로벌 모델에 관한 정보를 수신하는 통신부를 포함하고,
    상기 적어도 하나의 프로세서는, 상기 수신된 정보에 기초하여 상기 로컬 모델을 갱신하는, 전자 장치.
  13. 제12항에 있어서, 상기 적어도 하나의 프로세서는
    상기 변경된 상황에 관한 정보에 기초하여, 상기 로컬 모델에 의해 출력될 수 있는 예측 정보 및 상기 예측 정보에 대한 정답을 나타내는 관측 정보를 획득하고, 상기 관측 정보 및 상기 예측 정보 간 차이를 나타내는 손실 함수를 획득하고, 상기 손실 함수의 값이 최소가 되는 지점과 관련된 정보를 포함하는 상기 그래디언트를 결정하는, 전자 장치.
  14. 제12항에 있어서, 상기 글로벌 모델은,
    적어도 하나의 외부 장치에 대한 각각의 로컬 모델이 갱신됨에 따라, 상기 각각의 로컬 모델에 대한 적어도 하나의 그래디언트에 기초하여 갱신된 후, 상기 전자 장치로부터 상기 그래디언트가 수신됨에 따라 상기 전자 장치의 그래디언트에 기초하여 갱신되는, 전자 장치.
  15. 제 1항 내지 제 11항 중 어느 한 항의 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체.
PCT/KR2020/004965 2019-04-12 2020-04-13 인공지능 모델을 갱신하는 전자 장치, 서버 및 그 동작 방법 WO2020209693A1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202080010910.1A CN113366520A (zh) 2019-04-12 2020-04-13 用于更新人工智能模型的电子设备、服务器及其操作方法
EP20788289.5A EP3816917A4 (en) 2019-04-12 2020-04-13 ELECTRONIC DEVICE FOR UPDATING ARTIFICIAL INTELLIGENCE MODELS, SERVERS AND OPERATING PROCEDURES THEREFORE

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20190043309 2019-04-12
KR10-2019-0043309 2019-04-12
KR10-2019-0120851 2019-09-30
KR1020190120851A KR20200120469A (ko) 2019-04-12 2019-09-30 인공지능 모델을 갱신하는 전자 장치, 서버 및 그 동작 방법

Publications (1)

Publication Number Publication Date
WO2020209693A1 true WO2020209693A1 (ko) 2020-10-15

Family

ID=72751395

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/004965 WO2020209693A1 (ko) 2019-04-12 2020-04-13 인공지능 모델을 갱신하는 전자 장치, 서버 및 그 동작 방법

Country Status (2)

Country Link
KR (1) KR20200120557A (ko)
WO (1) WO2020209693A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347500A (zh) * 2021-01-11 2021-02-09 腾讯科技(深圳)有限公司 分布式系统的机器学习方法、装置、系统、设备及存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220057353A (ko) * 2020-10-29 2022-05-09 삼성전자주식회사 인공지능 모델을 갱신하는 전자 장치 및 그 동작 방법
KR102346142B1 (ko) * 2021-04-16 2022-01-03 주식회사 테스트웍스 선택적 데이터 수집 시스템 및 그 동작 방법
KR102660745B1 (ko) * 2021-06-15 2024-04-26 한국과학기술원 연합학습 및 비지도 학습 기반 뉴럴 네트워크를 이용한 개인정보를 보호하는 영상 변환 방법 및 그 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150002542A (ko) * 2013-06-28 2015-01-07 삼성전자주식회사 어플리케이션 업데이트 방법 및 장치
KR20170009991A (ko) * 2014-08-26 2017-01-25 구글 인코포레이티드 글로벌 모델로부터의 로컬화된 학습
KR20180037760A (ko) * 2016-10-05 2018-04-13 삼성전자주식회사 배터리 상태 추정 장치 및 방법
KR20180112653A (ko) * 2017-03-30 2018-10-12 삼성전자주식회사 데이터 학습 서버 및 이의 학습 모델 생성 및 이용 방법
JP2018169706A (ja) * 2017-03-29 2018-11-01 マツダ株式会社 車両運転支援システム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150002542A (ko) * 2013-06-28 2015-01-07 삼성전자주식회사 어플리케이션 업데이트 방법 및 장치
KR20170009991A (ko) * 2014-08-26 2017-01-25 구글 인코포레이티드 글로벌 모델로부터의 로컬화된 학습
KR20180037760A (ko) * 2016-10-05 2018-04-13 삼성전자주식회사 배터리 상태 추정 장치 및 방법
JP2018169706A (ja) * 2017-03-29 2018-11-01 マツダ株式会社 車両運転支援システム
KR20180112653A (ko) * 2017-03-30 2018-10-12 삼성전자주식회사 데이터 학습 서버 및 이의 학습 모델 생성 및 이용 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3816917A4 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347500A (zh) * 2021-01-11 2021-02-09 腾讯科技(深圳)有限公司 分布式系统的机器学习方法、装置、系统、设备及存储介质

Also Published As

Publication number Publication date
KR20200120557A (ko) 2020-10-21

Similar Documents

Publication Publication Date Title
WO2020209693A1 (ko) 인공지능 모델을 갱신하는 전자 장치, 서버 및 그 동작 방법
WO2020091210A1 (en) System and method of integrating databases based on knowledge graph
WO2016018004A1 (en) Method, apparatus, and system for providing translated content
WO2018088794A2 (ko) 디바이스가 이미지를 보정하는 방법 및 그 디바이스
WO2019107945A1 (en) Method of providing service based on location of sound source and speech recognition device therefor
WO2019225961A1 (en) Electronic device for outputting response to speech input by using application and operation method thereof
WO2019168383A1 (en) Electronic device
WO2016017970A1 (en) Method and device for encrypting or decrypting content
WO2015142023A1 (en) Method and wearable device for providing a virtual input interface
WO2019168380A1 (en) Electronic device
WO2016064250A2 (ko) 적응적으로 작업 수행의 주체를 변경하기 위한 장치 및 방법
WO2014119884A1 (en) Method and system for displaying object, and method and system for providing the object
WO2013069936A1 (en) Electronic apparatus and method for controlling thereof
WO2018117685A1 (en) System and method of providing to-do list of user
WO2016108660A1 (en) Method and device for controlling home device
WO2016047837A1 (ko) 와치 타입의 단말기 및 그 동작 방법
WO2017052043A1 (en) Mobile terminal and method for controlling the same
WO2019135621A1 (ko) 영상 재생 장치 및 그의 제어 방법
WO2021045447A1 (en) Apparatus and method for providing voice assistant service
WO2013129799A1 (en) Electronic device and method for controlling electronic device
WO2016089075A1 (en) Wearable device and method of transmitting message from the same
EP3552163A1 (en) System and method of providing to-do list of user
WO2015093665A1 (ko) 전자기기 및 전자기기의 제어방법
WO2021029457A1 (ko) 사용자에게 정보를 제공하는 인공 지능 서버 및 그 방법
WO2022075668A1 (ko) 인공지능 모델을 분산 처리하는 시스템 및 그 동작 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20788289

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE