WO2020153614A1 - Method and platform for providing ai entities evolving via reinforced learning - Google Patents

Method and platform for providing ai entities evolving via reinforced learning Download PDF

Info

Publication number
WO2020153614A1
WO2020153614A1 PCT/KR2019/018271 KR2019018271W WO2020153614A1 WO 2020153614 A1 WO2020153614 A1 WO 2020153614A1 KR 2019018271 W KR2019018271 W KR 2019018271W WO 2020153614 A1 WO2020153614 A1 WO 2020153614A1
Authority
WO
WIPO (PCT)
Prior art keywords
entity
user
learning
learning model
providing
Prior art date
Application number
PCT/KR2019/018271
Other languages
French (fr)
Korean (ko)
Inventor
강훈석
김다일
Original Assignee
㈜티비스톰
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ㈜티비스톰 filed Critical ㈜티비스톰
Publication of WO2020153614A1 publication Critical patent/WO2020153614A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Definitions

  • the present invention relates to a method and platform for providing an AI entity that evolves through reinforcement learning, and more specifically, a user creates an AI entity to continuously learn as he/she wants, and the user himself/herself through reinforcement learning.
  • a user By evolving into an independent entity, the user can act as a secretary, or enable independent SNS activities, and also use various household appliances instead of the user at home, school, or office at the time and method desired by the user.
  • It relates to a method and a platform for providing evolving AI entities through reinforcement learning to operate and set up various IoT devices to act as a kind of agent to maintain a pleasant environment.
  • an artificial intelligence system capable of recognizing a user's voice and searching and providing information desired by the user on the web according to the recognized voice or remotely controlling the plurality of IoT devices in real time.
  • the public interest in AI systems is increasing.
  • the artificial intelligence system continuously evolves into an independent entity by continuously learning the user's characteristics, so that the user can automatically control a plurality of IoT devices according to tastes or preferences, or provide information that the user actually needs. As described above, if a suitable service can be provided according to a user's characteristics, high satisfaction and convenience may be provided to the user.
  • the conventional artificial intelligence system is implemented not to provide a suitable service to the user according to the characteristics of the user, but simply to control the retrieved information or device according to predefined logic.
  • the conventional artificial intelligence system it is not learned to provide a specific service according to the characteristics of the user, but it is concentrated to recognize the user's voice through artificial intelligence technology including voice recognition technology, and the user's voice In the case of recognizing, it performs a preset logic according to the recognized user's voice to provide a service that the user wants to receive.
  • the artificial intelligence system when the user wants to be recommended for music, when the artificial intelligence system inputs a command for the music recommendation by voice, the artificial intelligence system recognizes the voice for the music recommendation. Later, it is only to search for a recently released sound source or a sound source used by a large number of users and output the sound source.
  • the conventional AI system is no longer evolved according to the user's tendency or characteristics in the initial state when it is provided in the home, and only provides a function for providing a service to the user using only simple logic or statistical values set in advance. I just apply.
  • an AI entity such as a character or an avatar corresponding to a specific user is generated, and the created AI entity is continuously reinforced learning according to the characteristics of the user, so that the individualized individual is independent of the specific user.
  • it can act as a secretary for the user, enable independent SNS activities, or operate various IoT devices at the time and method desired by the user, and at the same time music, news, schedule, weather, products
  • I would like to suggest a way to provide.
  • Korean Patent Publication No. 2019-0001059 (2019.01.04.) relates to an artificial intelligence platform providing device and a content service method using the same, receiving input data in a predetermined format from a user terminal, and included in the input data After extracting the request information related to the user's request, based on the request information, select one of a plurality of content servers that provide content, and provide an AI platform providing device corresponding to the request information to the user and the same It relates to a content service method used.
  • the prior art is to receive voice data from a user, recognize request information from the received voice data through speech recognition and natural language processing, and provide content corresponding to the recognized request information.
  • the prior art simply recognizes a user's voice through an AI platform and provides various contents according to the recognized user's voice.
  • the user creates an AI object including a desired character or avatar, and continuously learns the generated AI object according to a user's characteristics, so that the user can evolve into an independent object.
  • the prior art does not describe or suggest such technical features of the present invention.
  • Korean Registered Patent No. 1172002 (2012.08.01.) relates to an artificial intelligence digital device control system using a smartphone and a sensor, and a preset value set in advance by a comparison unit provided with the sensing value measured by the sensor.
  • the artificial intelligence digital device control system using a smartphone and a sensor to control the operation of the air-conditioning device fixedly installed at a specific location after determining whether or not the air-conditioning device is driven by comparing the sensing values with will be.
  • environmental conditions including temperature and humidity are set in advance through a smartphone, and sensing values for environmental conditions including temperature and humidity measured through a sensor are compared with the preset environmental conditions, and the air conditioning is performed.
  • the operation of the device is determined and the driving signal for the air conditioning device is transmitted through the IR transmitter according to the determination result, so that the air conditioning device can be automatically controlled.
  • the prior art simply compares a preset value and a sensing value, and determines whether to drive the air conditioning system according to the comparison result, and continuously reinforces and learns the characteristics of the user input from the user. It is not intended to control a specific IoT device according to the characteristics of the user, or to provide various recommended services such as music.
  • an AI object including a character, an avatar, etc. is generated, and user characteristic information is continuously input from a user, and a specific IoT device is controlled based on the received characteristic information or a service for each field is provided. Continuously reinforce learning by learning at least one or more learning models to provide the recommendation service suitable for the characteristics of the user who uses the AI object by evolving the generated AI object into an independent object, or by providing a specific IoT device. To be able to control it. Therefore, the prior art is clearly different from the technical features to be proposed in the present invention.
  • the present invention was created to solve the above problems, and the user creates an AI object including his avatar and character, and continuously strengthens the AI object through continuous interaction between the created AI and the user.
  • the user creates an AI object including his avatar and character, and continuously strengthens the AI object through continuous interaction between the created AI and the user.
  • Another object is to provide a method and platform for providing an evolving AI entity through reinforcement learning to advance the AI entity by enabling reinforcement learning for each learning model through interaction with the entity. Is done.
  • the present invention by performing the interaction between the user and the AI entity, when receiving a recommendation service in a specific field that is the result of the interaction, by applying the interaction result to the learning model for the specific field, to the AI entity
  • Another object is to provide a method and a platform for providing an evolving AI entity through reinforcement learning that enables the AI entity to gradually evolve by automatically performing reinforcement learning for Korea.
  • the present invention according to the user's selection or periodically from the user, the preferred TV channel, air conditioning temperature by location, hourly lighting control information, preferred news field, people, music, artists, products, etc.
  • the present invention provides the evolving AI entity through reinforcement learning that provides a recommendation service including control, news, music, etc. of a specific IoT device suitable for the user's preference.
  • Another object is to provide a method and platform.
  • the present invention by learning the user's schedule including the user's schedule, alarm time, anniversary, etc., to automatically inform the user of the schedule through the AI entity, so that it can act as a secretary for the user
  • Another object is to provide a method and platform for providing AI entities that evolve through reinforcement learning.
  • Another object is to provide a method and platform for providing an evolving AI entity through reinforcement learning to provide a propulsion service for IoT device 400 control, music, news, and the like.
  • the present invention is implemented so that the created AI entity can independently act on the SNS, and provides an AI entity that evolves through reinforcement learning to evolve into an entity independent of the user through interaction with other AI entities.
  • Another object is to provide a method and platform.
  • the AI object is gradually advanced and evolved into an independent object through a learning method including self-learning, participatory learning, supervised learning, and self-learning, so that a user can search for and provide information or a specific IoT device.
  • a learning method including self-learning, participatory learning, supervised learning, and self-learning, so that a user can search for and provide information or a specific IoT device.
  • a method of providing an AI entity that evolves through reinforcement learning includes: an AI entity generation step in which a user creates an AI entity, and a learning model for the created AI entity through machine learning When the user interacts with the AI entity through the learning model generation step and the generated learning model, by applying the result of the interaction to the learning model, and performing reinforcement learning for the learning model, the interaction behavior of the user Accordingly, it characterized in that it comprises an AI entity evolution step to cause the generated AI entity to evolve into an independent entity.
  • the method further comprises, through the AI entity evolution step, while the AI entity interacts with another AI entity, further evolving into an individual entity with the user.
  • the AI entity is generated by creating an account on a web server or a cloud platform on a specific device or internet that is configured with independent hardware that performs the method, and functions as a secretary desired by the user, or enables SNS activities,
  • the user operates at least one IoT device on behalf of the user at a desired time and method, or sets at least one IoT device to maintain the desired home, school, or office environment. Or a combination of these.
  • the method provides a user with an interface through which learning data can be input, and presents a method for learning to the user, thereby allowing the user to format learning data in a predetermined format. It characterized in that it further comprises a step of inputting the learning data to be input.
  • the learning model includes a learning model specialized for at least one field including CNN, RNN, or ANN, and the AI entity evolves by combining the at least one specialized learning model with each other, and the mutual coupling is related. It is characterized in that it is performed by quantifying and scaling the learning data according to the relevant degree in the field.
  • an AI entity generation unit that supports a user to create an AI entity, and learning about the created AI entity through machine learning
  • the learning model generation unit generating the model and the generated learning model, by applying the result of the interaction to the learning model, reinforcement learning for the learning model is performed.
  • it characterized in that it comprises a learning model evolution unit that allows the generated AI entity to evolve as an independent entity according to the user's interaction behavior.
  • the learning model evolution unit the AI entity through the process of evolving into the independent entity, while further interacting with other AI entities, characterized in that it further comprises to evolve into an independent entity with the user.
  • the platform when the learning model is generated by learning the learning model, the platform provides the user with an interface through which learning data can be input, and provides a user with a method to learn, thereby allowing the user to learn data in a predetermined format. It characterized in that it further comprises a learning data input unit for input.
  • the AI object reinforcement learning platform of the present invention allows the user to create an AI object including his alter ego or character or avatar, and the user can continuously reinforce the learned AI object according to his preference.
  • the created AI entity By evolving the created AI entity into an independent entity, the optimal service suitable for the user's tendency or needs is provided, and at the same time, it can serve as the personal assistant of the user, thereby providing convenience to the user. It has the effect.
  • FIG. 1 is a conceptual diagram schematically illustrating a method and platform for providing an AI entity that evolves through reinforcement learning according to an embodiment of the present invention.
  • FIG. 2 is a view illustrating a method for performing reinforcement learning on an AI entity according to an embodiment of the present invention.
  • FIG. 3 is a diagram illustrating a method of providing a recommendation service according to a user's request command through an AI entity according to an embodiment of the present invention.
  • FIG. 4 is a block diagram showing the configuration of an AI entity providing platform according to an embodiment of the present invention.
  • 5 is a flowchart illustrating a procedure for providing an AI entity that evolves through reinforcement learning according to an embodiment of the present invention.
  • an AI object is created by a user in a cyber space such as the Internet or a device in a real space, for example, a character or avatar (divided) as if creating an SNS account (connection window), and the corresponding character or avatar It refers to the sophistication and evolving of (divided) through the reinforcement learning according to artificial intelligence algorithms, by users or by activities on SNS.
  • FIG. 1 is a conceptual diagram schematically illustrating a method and platform for providing an AI entity that evolves through reinforcement learning according to an embodiment of the present invention.
  • an AI entity reinforcement learning platform (hereinafter referred to as an AI entity providing platform) 100 according to an embodiment of the present invention includes an AI entity (such as a character or avatar for each user). 200) and continuously performing reinforcement learning on the created AI object 200, thereby fostering the AI object 200 to evolve as a single independent object, so that the AI object 200 is applicable. It performs a function to search for various information according to the user's preference, to automatically control a specific IoT device, or to provide various services, including reporting on the user's schedule and recommendations such as music, news, and videos. .
  • an AI entity providing platform includes an AI entity (such as a character or avatar for each user). 200) and continuously performing reinforcement learning on the created AI object 200, thereby fostering the AI object 200 to evolve as a single independent object, so that the AI object 200 is applicable. It performs a function to search for various information according to the user's preference, to automatically control a specific IoT device, or to provide various services, including reporting on the user's schedule and recommendations such as music
  • the AI entity providing platform 100 receives the user's characteristic information from the user and uses the entered characteristic information to provide a specific service to the user. Create a plurality of learning models for each field to provide.
  • the characteristic information of the user becomes learning data for generating the learning model for each field.
  • the user installs the AI application provided from the AI object providing platform 100 to the user terminal 300 of the corresponding user, and executes the installed AI application to provide the AI object providing platform. After accessing (100), the AI entity 200 may be generated.
  • the AI entity providing platform 100 is for generating the AI entity 200 and for evolving the AI entity 200 through continuous reinforcement learning, thereby generating the AI entity 200 and allowing the user to It refers to a specific device that is provided in a public place such as a home, office, or school, and is composed of independent hardware. Meanwhile, the AI entity providing platform 100 may be implemented in the form of a cloud server or a web server.
  • the AI entity providing platform 100 interacts with the user through the created AI entity 200 to continuously evolve the AI entity 200, and the AI entity 200 To provide various services to users.
  • the created AI entity 200 is applied to the user terminal 300 of the corresponding user and can be implemented to perform the interaction anytime, anywhere, and a specific cloud platform or web server for providing an SNS service It can be applied to, and can be implemented to independently perform SNS activities according to user preferences.
  • the AI entity 200 applied to the cloud platform or web server for providing the SNS service is generated by creating an SNS account for the cloud platform or web server.
  • the learning model for each field may include a TV channel recommendation learning model, a music recommendation learning model, an IoT device 400 control learning model, a news recommendation learning model, and a schedule recommendation learning model, and the AI entity.
  • the 200 may provide the service to the user through the learning model for each field.
  • the learning model is not limited thereto, and may be subdivided into a plurality of learning models by the designer of the AI entity providing platform 100.
  • the authentication information of the user eg fingerprint, By providing voice, gesture
  • personal information eg, wallet information including user ID, name and account information, etc.
  • the creation of the AI entity 200 e.g., wallet information including user ID, name and account information, etc.
  • the AI entity 200 generated as described above is applied to the AI entity providing platform 100 and can also be applied to the user terminal 300 of the corresponding user according to the user's selection, and the cloud providing the SNS service. It can be applied to platforms or web servers.
  • the AI entity providing platform 100 may generate the AI entity 200 for each user by receiving the authentication information and personal information from at least one or more users.
  • the AI object providing platform 100 when the AI object providing platform 100 is provided in the user's home, the authentication information and personal information are input for each member of the user's family, and the AI object 200 for each member is generated. Can be implemented.
  • the authentication information to activate the AI entity 200, to use the AI entity 200, fingerprint recognition means provided in the user terminal 300 connected to the AI entity providing platform 100 , It may be input through a microphone or a camera, and the personal information may be input through an input means such as a keypad, a touch fan, etc. of the user terminal 300.
  • the fingerprint recognition means, microphone or camera and the input means may be provided in the AI entity providing platform 100, where the user is a fingerprint recognition means, microphone or The user's authentication information and personal information can be directly input through the camera and the input means.
  • the AI entity providing platform 100 provides customizing information for the AI entity 200, thereby allowing the AI entity 200 to be accessed by the user. It can be created by modeling according to the propensity.
  • the customizing information includes social elements including language and nationality to be applied to the AI entity 200, biological elements including gender and age, and appearance elements including face, hair and clothes, and emotions (eg, joy) , Facial expressions and gestures for sadness, etc.) and the name of the corresponding AI entity 200.
  • the user sets the social element, biological element, appearance element, emotion element, and name for the AI object 200 based on the customization information provided by the AI object reinforcement learning platform 100, so that the user By modeling the AI entity 200 according to taste, an AI entity 200 that is more user friendly can be generated.
  • the AI entity 200 is generated by including a unique identification code and a creation date for the corresponding AI entity 200, and access to the information of other members and the IoT device 400 is granted according to the user's selection. Is created.
  • the created AI entity 200 may be linked to a plurality of IoT devices 400 provided in the home, such as a user's home, office, or school, according to the user's setting. At this time, the user may set the access authority of the AI entity 200 to the IoT device 400.
  • the plurality of IoT devices 400 refers to various devices including lighting, TVs, and air conditioning units located in the home.
  • the plurality of IoT device 400 devices may be configured as a home network system.
  • the user continuously performs reinforcement learning on the AI entity 200 using his characteristic information in order to receive at least one recommendation service suitable for his/her needs, thereby allowing the AI entity 200 to perform himself/herself. It can be upgraded to suit your propensity.
  • the AI entity providing platform 100 when the AI entity providing platform 100 generates the AI entity 200, it learns user characteristic information (that is, learning data) provided from a user to generate a learning model for each field for providing the service. .
  • the AI object providing platform 100 provides the user characteristic information input data format for inputting the user characteristic information to the user terminal 300 of the corresponding user through the user interface, and the user is provided with the provided user characteristic By inputting user-specific information of the corresponding user based on the information input data format, it is possible to generate a field-specific learning model for the AI entity 200.
  • the AI entity providing platform 100 allows the user characteristic information to be input in a predetermined format, thereby providing a learning method for the learning model for each field according to a user's preference, thereby learning the learning model for each field. Is to create
  • the user characteristic information is the TV channel (eg, sports, culture, entertainment, drama, documentary, etc.) preferred by the user for each time zone, time, place (eg, living room, master room, calligraphy, kitchen, bathroom, etc.) and weather Lighting information including user's preferred lighting brightness, lighting color, lighting on/off time, user's preferred cooling/heating temperature by time, place and weather, and news areas preferred by the user (eg economy, sports, entertainment, etc.) ) And the music genre (e.g. popular music, classical music, etc.) and artists preferred by the user depending on the person, time, weather, or mood. ), schedule information including weather, bedtime, planned work (e.g. exercise, rest, study, etc.), anniversary (e.g. wedding anniversary, ritual, birthday, etc.), user's preferred product, and personality characteristics do.
  • TV channel eg, sports, culture, entertainment, drama, documentary, etc.
  • time zone eg, time, place (eg, living room, master room, calligraphy, kitchen, bathroom,
  • the AI entity providing platform 100 when the user characteristic information is input based on the user characteristic information input data format, the user characteristic information for each field so that the user characteristic information can be applied to the learning model for each field Classify.
  • the AI entity providing platform 100 generates the learning model for each field by learning the classified user characteristic information for each field through the reinforcement learning network for each field.
  • the user characteristic information is used as learning data of a field-specific learning model for the corresponding AI entity 200 in order to provide various services according to a user's preference.
  • the AI entity 200 automatically searches for and provides specific information (for example, news, people, weather) according to a preset time and a user's preference using the learning model for each field, or
  • the IoT device 400 may be automatically controlled, report on a specific schedule, expenditure history, or recommend music.
  • the AI entity 200 evolves into an independent entity through continuous reinforcement learning on the generated learning model, and the reinforcement learning is performed through interaction with a user.
  • the interaction refers to a process of recognizing a user's request command for the AI entity 200 and providing at least one service for each field for the recognized request command.
  • the reinforcement learning is performed based on the result.
  • the AI entity providing platform 100 performs an interaction between the user and the AI entity 200, based on the result of the interaction, the weight of the learning model for each field is adjusted to adjust the weight for the corresponding learning model.
  • the corresponding AI entity 200 can be gradually evolved.
  • the AI entity providing platform 100 advances the AI entity 200 to suit the user's propensity and provides a service suitable for the user's needs.
  • the reinforcement learning is also performed through self-learning, participatory learning, supervised learning, and autonomous learning of the AI entity 200, through which the AI entity 200 is more highly advanced and independent. It evolves into an individual.
  • the self-learning is automatically performed based on the interaction with the user, where the user's location and the frequency of selection of the provided service (for example, when at least one music is recommended, select and use specific music) Frequency of use), keywords frequently used by users (e.g. keywords for specific music genres (e.g. popular music), etc.) to provide users with services that users prefer to taste, music, etc. for their current location. It means learning to help.
  • the self-learning automatically collects other information related to the user's characteristic information and the user's characteristic information from the web, and applies the collected other information to the user's characteristic information to provide various information for the user. It can also be performed to provide services.
  • the AI entity 200 controls a specific IoT device 400 based on the user's preferred air-conditioning temperature or lighting information and music-specific information for each weather, or when recommending music,
  • the AI entity 200 collects weather information (ie, temperature, humidity, etc.) at the current time from the Korea Meteorological Administration or the web, and matches the collected weather information with the user's characteristic information to apply to the learning model.
  • weather information ie, temperature, humidity, etc.
  • the participatory learning means that the AI entity 200 analyzes and learns by analyzing the user's dietary preferences, music, and friend preferences, such as a predefined psychological test or taste game, and the AI The object 200 may be evolved to recommend food, products, music, friends, etc. suitable for the user through the participation learning.
  • the supervised learning is performed to learn user characteristic information received from the user and provide the service to the corresponding user according to the learned result.
  • the AI entity 200 that has learned the user characteristic information for a TV channel (eg, sports, culture, entertainment, drama, documentary, etc.) preferred by the user for each time zone, at least one preferred by the user at the current time
  • a TV channel eg, sports, culture, entertainment, drama, documentary, etc.
  • the above TV channels can be recommended.
  • the self-learning is performed by the AI entity 200 to autonomously learn and provide information to the user, based on the social networking information about the friend on the SNS provided by the user.
  • the AI entity 200 may be evolved to provide information to the user or to recommend news information, which is a recent issue.
  • the AI entity 200 may be implemented to learn the social network information on the user's SNS, analyze the family, work, school, location, and tastes of the social network that has a high frequency of interaction with the user and provide it to the user.
  • education for the corresponding network can be implemented to analyze the capabilities including intimacy and expertise and provide them to the user.
  • the AI entity 200 is evolved into a more advanced and independent entity through interaction with the user, self-learning, participatory learning, supervised learning, and autonomous learning.
  • the AI entity 200 may act as an independent entity on the SNS based on the characteristics of the user according to the result of the reinforcement learning, perform a recommendation activity for the SNS activity of another user, or another AI entity 200 ) To evolve into an entity independent of the user.
  • the AI entity 200 forms a network of only the AI entity 200 through an interaction with another user or another AI entity 200 based on the user's personal preferences or characteristics based on the user's social network information, or forms a community It can be evolved to do it.
  • the AI entity 200 automatically provides the service according to a preset time through the reinforcement learning, or when the user inputs a request command through interaction with a user, recognizes the request command and recognizes the service It is implemented to provide private service according to one request order.
  • the AI entity 200 inputs a preset condition (eg, current time information) into the learning model for each field using the learning model for each field according to a preset time, and the learning model for each field
  • a preset condition eg, current time information
  • the service may be automatically provided based on the output data output from.
  • the AI entity 200 when it is set to recommend news at a wake-up time (eg, 6 AM), the AI entity 200 inputs current time information into a learning model for recommending news. At this time, the learning model for recommending news outputs at least one news field and person preferred by the user according to the result of the reinforcement learning. Thereafter, the AI entity 200 searches for news on the news field and person on the web and provides the search result to the user, thereby providing a recommendation service for the news to the user.
  • a wake-up time eg, 6 AM
  • the AI entity 200 inputs current time information into a learning model for recommending news.
  • the learning model for recommending news outputs at least one news field and person preferred by the user according to the result of the reinforcement learning.
  • the AI entity 200 searches for news on the news field and person on the web and provides the search result to the user, thereby providing a recommendation service for the news to the user.
  • the AI entity 200 wants to provide a recommendation service through the interaction, the keyword is extracted from the user request command, and compared with the extracted keyword and at least one representative keyword for each preset recommended field. Depending on the result, it recognizes which recommendation service the user request command wants to receive.
  • the learning model for music recommendation outputs at least one music genre and artist preferred by the user according to the result of the reinforcement learning.
  • the AI entity 200 provides a recommendation service for the music to the user by retrieving and recommending the music genre and the music source for the artist for the music genre on the web, or recommending an existing stored sound source.
  • the user request command may be input by voice or text, and the AI entity 200 recognizes the input voice and text to extract the keyword.
  • extracting a keyword by recognizing the voice or text may be performed through a pre-built language model and a morpheme analysis, such as a hidden markov model (HMM) model.
  • HMM hidden markov model
  • the method for extracting keywords by recognizing the voice or text is not limited.
  • a predetermined gesture is performed through a camera, fingerprint sensor, microphone, or keypad provided in the AI device to which the AI entity 200 is applied, fingerprint authentication is performed, or the The name of the set AI entity 200 is called, and after activating the AI entity 200, the service may be provided by inputting the voice or text.
  • the AI entity 200 based on the result of performing the reinforcement learning, to automatically control the plurality of IoT devices 400 provided in the user's home, office, or school, displays current time information or weather information.
  • the learning model for controlling the IoT device to control and select the control information for controlling the IoT device 400 to the user, to control the IoT device 400, or according to the control information, the IoT device ( 400) can be controlled automatically.
  • the AI entity 200 accesses a home network gateway and transmits control information for controlling a specific IoT device 400 to the corresponding IoT device 400 according to the user's selection, so that the IoT device remotely It is possible to automatically control the 400.
  • the request command recognized through the interaction designates a target for a specific service or includes direct control information for the IoT device 400
  • the specified target is automatically searched for and provided, or the control information is provided. Based on this, it may be implemented to automatically control the IoT device 400.
  • the AI entity 200 may: By extracting the keywords "living room”, “temperature”, and “27 degrees” from the request command, control information for the heating device is generated to maintain the temperature of the living room at 27 degrees, and the generated control information is generated by the corresponding heating device. By transmitting, the temperature of the living room can be maintained at 27 degrees, or the sound source for the specific music title is searched to provide the searched sound source to the user.
  • the AI entity 200 recommends music desired by the user or operates at least one IoT device 400 on the user's home, office, or school on behalf of the user at a time and method desired by the user.
  • an operation for at least one IoT device 400 is set so that the user can maintain a desired home, office, or school environment.
  • the AI entity 200 is preset in the learning model for schedule recommendation. Enter the condition information (eg current time information). At this time, the schedule recommendation learning model outputs schedule information of the corresponding user according to the time and date according to the result of the reinforcement learning. Subsequently, the AI entity 200 selects at least one of the output schedule information according to a preset period (eg, one day, one week, one month) and provides it to the user, so that the corresponding user is connected to the schedule information. You will be recommended to follow.
  • a preset period eg, one day, one week, one month
  • the AI entity 200 extracts a keyword from the request command, and extracts the keyword (eg, "schedule", "schedule") and the plurality
  • the keyword eg, "schedule", "schedule”
  • the AI entity extracts the keywords "today” and "schedule” from the request command, and compares the representative keyword with the extracted keyword to recognize that the request command is for schedule recommendation.
  • the AI entity 200 recommends what to do today by inputting current time information into a schedule recommendation learning model to extract schedule information for today and providing schedule information for the extracted today to the user. Is done.
  • the learning model is generated through a machine learning algorithm including an artificial neural network (ANN), a convolutional neural network (CNN), or a recurrent neural network (RNN), and as described above, at least one or more specialized for a specific service Includes sectoral learning models.
  • ANN artificial neural network
  • CNN convolutional neural network
  • RNN recurrent neural network
  • the AI object providing platform 100 of the present invention is gradually advanced to suit the characteristics or inclinations of the user by continuously performing reinforcement learning on the created AI object 200. It will provide at least one service suitable for your needs.
  • FIG. 2 is a view illustrating a method for performing reinforcement learning on an AI entity according to an embodiment of the present invention.
  • the process of performing reinforcement learning on the AI entity 200 using the AI entity providing platform 100 is first, the user provides the AI entity ( After installing the artificial intelligence application provided from 100) to the user terminal 300, and running the installed artificial intelligence application to access the AI object providing platform 100, the authentication information and personal information of the user Provided to the AI entity providing platform 100, the creation request for creating the AI entity 200 is transmitted through the AI entity providing platform 100 (1).
  • the user may create an AI entity 200 implemented as a character or an avatar by performing a modeling process for the AI entity 200 using customizing information provided from the AI entity providing platform 100. To make.
  • the AI entity 200 is generated for a plurality of users according to a place (for example, a user's home, office, or school) provided in the AI entity providing platform 100, and the created AI entity 200 is Applied to the AI entity providing platform 100, the AI entity providing platform 100 may be implemented to perform the function of the AI entity 200.
  • a place for example, a user's home, office, or school
  • the created AI entity 200 is applied to the user terminal 300 or is applied to a cloud platform or web server providing SNS service, and the AI is provided through interworking with the AI entity providing platform 100. It may be implemented to perform the function of the object 200.
  • the AI entity providing platform 100 provides (2) a data format for inputting user characteristic information to the user terminal 300 through a user interface, and the user generates user characteristic information through the data format. To the AI entity providing platform 100 (3).
  • the AI entity 200 includes a learning model for each field of the AI entity 200, and the learning model for each field is generated to provide various services to a user, and the AI entity providing platform 100 , Learning user characteristic information input from a user for each field to generate a learning model for each field.
  • the reinforcement learning model is generated based on the user's characteristic information, and is generated by the user selecting his characteristic information or inputting it as text based on the data format provided from the AI entity providing platform 100 It is transmitted to the AI entity providing platform 100.
  • the learning model for each field is generated by learning user characteristic information that is initially input from the user terminal 300. Thereafter, the continuously input user characteristic information may be used as reinforcement learning data for performing reinforcement learning for the learning model for each field.
  • the user characteristic information is for a TV channel (eg, sports, culture, entertainment, drama, documentary, etc.) that includes a user's preference (score) for each time period
  • the user characteristic information is recommended for TV channel
  • a learning model for TV channel recommendation is generated to recommend TV channels to corresponding users by time zone.
  • the input of the learning channel for TV channel recommendation becomes preset condition information (eg, current time information), and the output becomes at least one TV channel having high preference.
  • preset condition information eg, current time information
  • the lighting control information or time wherein the user characteristic information includes preferences for preferred lighting brightness, lighting color, and on/off time by time and place (eg, living room, master room, study, kitchen, bathroom), and
  • time and place eg, living room, master room, study, kitchen, bathroom
  • temperature control information including preferences for heating and cooling temperature values for each place
  • control for controlling a specific IoT device 400 to the corresponding user Information will be recommended.
  • the input of the reinforcement learning network for controlling the IoT device 400 may be time information and weather information, and the output is control information for at least one IoT device 400 having high preference.
  • the learning network for recommending music to the user's characteristic information By learning through, a learning model for recommending music is generated to recommend at least one piece of music to a corresponding user.
  • the input of the learning model for music recommendation may be time information, weather information, emotion information, or a combination thereof, and the output may be at least one music genre and artist information having high preference.
  • the AI entity 200 accesses a sound source site linked to the AI entity 200 based on the output music genre and artist information to at least one or more music sources of the music genre and the artist for the music genre. Search by and recommend to the user.
  • the created AI entity 200 provides at least one of the services using the learning model for each field according to a preset condition (for example, time to receive the service, etc.), or the user
  • the service is provided in at least one according to a request command input from the user through interaction with (4).
  • the AI entity providing platform 100 provides a service for a specific field through interaction with the user through the AI entity 200
  • the interaction result is applied to a learning model for the specific field
  • the AI entity 200 can be advanced and evolved.
  • the AI entity 200 basically provides a service for the specific field through the supervised learning, but when interacting with a user, the user may directly designate an object to be serviced. That is, when the corresponding user requests "music containing a specific title" as a request command, the AI entity 200 retrieves music for the title from a server providing music, such as a sound source site, and provides it to the user.
  • the reinforcement learning can be performed by adjusting the weight of the learning model for recommending the music to recommend the corresponding music.
  • the AI entity 200 and the user interact with the AI entity providing platform 100, the result of the interaction is input (ie, applied) to the learning model for each field, so that the learning model for each field is It is to be reinforced learning, and accordingly, the AI entity 200 can be gradually evolved.
  • the reinforcement learning can be performed through self-learning, participatory learning, supervised learning, and autonomous learning on the AI entity 200 in addition to the interaction result.
  • the AI entity providing platform 100 automatically provides the service to the user according to a preset condition through supervised learning on the AI entity 200, the user selects a specific target for the service or , If the selection is rejected, it is as described above that reinforcement learning for the learning model can be performed by adjusting the weight for the specific object.
  • the user terminal 300 and the AI entity 200 applied on the SNS are implemented to provide the service using a learning model for each field in which the reinforcement learning is performed.
  • FIG 3 is a view illustrating a process of evolving an AI entity through an AI entity platform according to an embodiment of the present invention.
  • the user first uses the AI entity 200. In order to activate the corresponding AI entity 200 first.
  • the activation is performed by performing a preset gesture or by fingerprint recognition or calling the name of the AI entity 200 set in the corresponding AI entity.
  • the AI entity 200 when the AI entity 200 is activated, the corresponding user inputs a recommendation command for a service field that he or she wants to receive service.
  • the recommendation command may be input by voice or text, and when input by voice, may be performed through a microphone to the user terminal 300 to which the AI entity 200 is applied or the AI entity providing platform 100. .
  • the user may input the recommendation command as text through a chat function of the SNS account or a chat function provided by the AI entity 200 automatically through the chat with the AI entity 200.
  • the AI entity 200 participates in the chat as an independent entity.
  • the AI entity 200 recognizes a voice or text for the input recommendation command, extracts a keyword from the recognized recommendation command, and recognizes a service field required by the user based on the extracted keyword.
  • the AI entity 200 recognizes the recommended field according to the comparison result by comparing at least one keyword extracted from the recommendation command with a plurality of representative keywords for each predetermined field.
  • the AI entity 200 may recommend the recommendation command to the music recommendation service. Recognize as.
  • the AI entity 200 Means that the recommendation command is recognized as a schedule recommendation service.
  • the AI entity 200 recognizes the recommendation command as a TV channel recommendation service.
  • the AI entity 200 provides a service for the recognized service field to the user.
  • the AI entity 200 automatically turns on a specific sports channel or recommends at least one sports channel to select the user In accordance with this, it is possible to watch a specific sports channel.
  • the AI entity providing platform 100 when the provided service is equal to or more than a preset frequency, is applied to a learning model in a corresponding field, thereby performing reinforcement learning on the learning model, thereby providing the AI entity 200 ) To evolve.
  • the AI entity providing platform 100 performs reinforcement learning on the learning model by allowing the interaction result to be applied to the corresponding learning model. Through this, the AI entity providing platform 100 enables the AI entity 200 to evolve through the reinforcement learning.
  • FIG. 4 is a block diagram showing the configuration of an AI entity providing platform according to an embodiment of the present invention.
  • the AI object providing platform 100 generates the AI object 200 by modeling the avatar or character according to the user interface unit 110 and the user's selection.
  • the AI object generating unit 120 a learning data input unit 130 that provides a user with user characteristic information input data format to input learning data for user characteristic information, based on the inputted learning data, provides a learning model for each service field. It comprises a learning model generating unit 140 to generate and learning model evolution unit 150 to perform the reinforcement learning on the generated learning model, so that the generated AI entity 200 evolves.
  • the user interface unit 110 generates the AI entity 200 between the AI entity providing platform 100 and the user terminal 300, and related data for generating a learning model for the AI entity 200. It performs a function of providing a user interface to send and receive.
  • the AI object generating unit 120 automatically provides a specific service to the user, or an AI object 200 including an avatar, a character, etc. for providing at least one specific service through interaction with the user ).
  • the AI entity 200 receives authentication information and personal information of the corresponding user together with the request for creating the AI entity 200 from the user terminal 300, and issues a user account for the AI entity 200. Is created.
  • the AI entity generating unit 120 provides the customized information stored in advance to the user through the user interface unit 110, thereby allowing the user to select the customizing information, so that the characteristics of the avatar or character By setting the, it is possible to model the AI object 200 according to the user's preference.
  • the AI entity 200 is generated by having a specific set by the user according to the modeling result when applied on the user terminal 300 or the SNS or the AI entity providing platform 100.
  • the customizing information includes social elements including language and nationality to be applied to the AI entity 200, biological elements including gender and age, and appearance elements including emotions, faces, headers, and costumes, and emotional elements and AI entities. Contains the name for 200.
  • the AI entity providing platform 100 provides the customizing information through the user interface 110 to set a name for activating the corresponding AI entity 200, and the AI entity 200 Social elements, biological elements, appearance elements, and emotional elements to be applied to are sequentially provided, and selected to make it possible to model the AI entity 200 according to a user's preference.
  • the learning data input unit 130 provides a means for the user to input learning data (that is, user characteristic information) for generating a learning model for each service field for the created AI entity 200.
  • the learning data input unit 130 provides a user with a user characteristic information input data format previously defined through the user interface unit 110.
  • the learning data input unit 130 classifies the input user characteristic information into service fields, and performs memory (not shown). City).
  • the learning model generating unit 140 performs a function of learning user characteristic information classified for each recommended field for each service field and generating a learning model for each service field.
  • the learning model for each service field is generated by learning user characteristic information classified for each service field, a learning model for TV channel recommendation, a learning model for music recommendation, a learning model for controlling IoT device 400, and a news recommendation It may include a learning model, a learning model for schedule recommendation.
  • the learning model for each field may be extended to various fields by the designer of the AI entity providing platform 100.
  • the AI entity providing platform 100 allows the created AI entity 200 to be applied to the user terminal 300 of a corresponding user, or by creating an account for an SNS server that provides an SNS service, thereby being independent on the SNS. It can be implemented to perform SNS activities as individuals.
  • the created AI entity 200 may automatically provide at least one service to the user by using the learning model for each service field learned through supervised learning, and perform the interaction by interacting with the user. According to one interaction, various information may be searched on the web and provided to a user, a specific IoT device 400 may be controlled, a schedule of the user may be reported, music, videos, news, and the like may be recommended.
  • the learning model evolution unit 150 through the interaction with the user by performing reinforcement learning on the generated learning model for each service field according to the result of the interaction, so that the generated AI entity 200 to evolve To perform the function.
  • the learning model evolution unit 150 may further include a function that enables the AI entity 200 to evolve by combining the at least one learning model with each other.
  • the learning model evolution unit 150 combines at least one learning model specialized for a specific service according to a related degree of learning data for reinforcement learning so that the AI entity 200 can evolve.
  • a service and IoT recommending music by time zone for each weather It can be seen that the relevance of the service controlling the device 400 is high. That is, the learning data used for the learning model for recommending music or the learning model for controlling the IoT device includes weather and time, and it can be seen that the related degree of the learning data is high.
  • the learning model evolution unit 150 by combining the learning model for music recommendation and the learning model for controlling the IoT device by mutually providing services for controlling music and IoT devices for each time of weather,
  • the AI entity 200 can be evolved.
  • the combining is performed by quantifying the learning data into a characteristic value according to the degree of relevance for the related field and scaling it to have a value between 0 and 1.
  • the learning model evolution unit 150 continuously performs reinforcement learning on the learning model for each service field through self-learning, participatory learning, supervised learning, and self-learning in addition to the interaction, so that the AI entity 200 is an independent entity. Can evolve into
  • the learning model evolution unit 150 is not the first time the user characteristic information collected from the user characteristic information collection unit 130 is input, but by the service field for the AI entity 200 and the corresponding AI entity 200. As described above, when the learning model is generated and then input, it may further include performing reinforcement learning on the learning model for each service field using the corresponding user characteristic information.
  • 5 is a flowchart illustrating a procedure for providing an AI entity that evolves through reinforcement learning according to an embodiment of the present invention.
  • the procedure for providing an AI entity that evolves through reinforcement learning is first, the user accesses the AI entity providing platform 100 through the user terminal 300 , By requesting the AI entity providing platform 100 to create the AI entity 200, the AI entity 200 for the user is generated (S110 ).
  • the user inputs the user's authentication information and personal information to the AI entity providing platform 100 to perform a creation request for the AI entity 200, and the AI entity The providing platform 100 is performed by issuing an account for the AI entity 200.
  • the AI entity providing platform 100 can model the AI entity 200 according to a user's preference by providing predefined customization information to the user.
  • the AI entity providing platform 100 receives the user characteristic information of the corresponding user from the user (S120), by service field for the created AI entity 200 using the received user characteristic information Create a learning model (S120).
  • the AI object providing platform 100 provides a user characteristic information input data format through a user interface so that user characteristic information can be input in a preset format.
  • the AI entity providing platform 100 classifies the received user characteristic information for each service field, and learns each user characteristic information for each classified service field to generate a learning model for each service field.
  • the generated learning model for each service field is gradually advanced through reinforcement learning, and through this, the AI entity 200 is evolved into an independent entity.
  • the AI entity 200 provides the interaction result of the interaction to the user, and the AI entity providing platform 100 comprises:
  • the generated AI entity 200 is evolved by performing reinforcement learning on the generated learning model using the interaction result (S150).
  • a user creates an AI object and continuously learns it as he wants, and through reinforcement learning, the user evolves into an independent object that the user himself wants. You can control the IoT device, report the schedule of the user, or recommend music, products, news, etc.

Abstract

The present invention relates to a method and a platform for providing AI entities that evolve via reinforced learning. A user creates an AI entity and continuously trains same according to intentions of the user, and allows the AI entity to evolve into an independent entity desired by the user by means of reinforced learning, thereby allowing the AI entity to fill the role of an assistant desired by the user or to carry out SNS activities, and, additionally, in the home, school or office, allowing the AI entity to carry out the role a type of an agent that maintains a pleasant environment by, on behalf of the user, activating various electronic appliances at desired times using desired methods and configuring various IoT devices.

Description

강화학습을 통해 진화하는 AI 개체를 제공하는 방법 및 플랫폼Method and platform to provide evolving AI entities through reinforcement learning
본 발명은 강화학습을 통해 진화하는 AI 개체를 제공하는 방법 및 플랫폼에 관한 것으로, 더욱 상세하게는 사용자가 AI 개체를 생성하여 자신이 원하는 바대로 지속적으로 학습시키고, 강화학습을 통해서 사용자 자신이 원하는 하나의 독립적인 개체로 진화하도록 함으로써, 사용자 자신이 원하는 비서의 역할을 하거나, 독립적인 SNS 활동이 가능하도록 하고, 또한 가정, 학교 또는 사무실에서 사용자 대신에 각종 가전기기를 사용자가 원하는 시간과 방법으로 동작시키고 각종 IoT 기기를 설정하여 쾌적한 환경을 유지하도록 하는 일종의 에이전트 역할을 수행하도록 하는 강화학습을 통해 진화하는 AI 개체를 제공하기 위한 방법 및 플랫폼에 관한 것이다.The present invention relates to a method and platform for providing an AI entity that evolves through reinforcement learning, and more specifically, a user creates an AI entity to continuously learn as he/she wants, and the user himself/herself through reinforcement learning. By evolving into an independent entity, the user can act as a secretary, or enable independent SNS activities, and also use various household appliances instead of the user at home, school, or office at the time and method desired by the user. It relates to a method and a platform for providing evolving AI entities through reinforcement learning to operate and set up various IoT devices to act as a kind of agent to maintain a pleasant environment.
최근 산업기술과 정보통신기술이 발달함에 따라 딥 러닝(deep learning)을 포함하는 인공지능기술과 사용자의 음성을 인식하는 음성인식기술이 급속하게 발달하고 있으며, 이와 동시에 복수의 센서와 통신기능을 내장하여 사용자에게 다양한 정보와 편의성을 제공하기 위한 IoT 기기들이 보급되고 있다.Recently, with the development of industrial technology and information communication technology, artificial intelligence technology including deep learning and voice recognition technology for recognizing users' voices are rapidly developing, and at the same time, multiple sensors and communication functions are embedded. As a result, IoT devices for providing various information and convenience to users are spreading.
이러한 인공지능기술은 점점 고도화되고, 음성인식기술과 결합되면서 사용자의 음성을 인식하여, 사용자가 원하는 IoT 기기들을 원격에서 제어할 수 있도록 하는 기능을 지원함과 동시에 뉴스나 날씨 등과 같은 다양한 정보들을 웹상에서 검색하여 사용자에게 제공할 수 있는 수준까지 발달하고 있다.These artificial intelligence technologies are becoming more and more advanced, and when combined with voice recognition technology, it recognizes the user's voice and supports the ability to remotely control the IoT devices desired by the user, while at the same time providing various information such as news and weather on the web. It is developing to a level that can be searched and provided to users.
이에 따라 사용자의 음성을 인식하고, 상기 인식한 음성에 따라 사용자가 원하는 정보를 웹상에서 검색하여 제공하거나, 상기 복수의 IoT 기기들을 원격에서 실시간으로 제어할 수 있도록 하는 인공지능 시스템(artificial intelligence system, AI 시스템)에 대한 대중의 관심이 증대되고 있다.Accordingly, an artificial intelligence system capable of recognizing a user's voice and searching and providing information desired by the user on the web according to the recognized voice or remotely controlling the plurality of IoT devices in real time. The public interest in AI systems) is increasing.
이러한 인공지능 시스템은, 사용자의 특성을 지속적으로 학습하여 독립적인 개체로 진화됨으로서, 사용자가 취향이나 성향에 따라 복수의 IoT 기기들을 자동으로 제어하거나, 상기 사용자가 실질적으로 필요로 하는 정보를 제공하는 것과 같이 사용자의 특성에 따라 적합한 서비스를 제공할 수 있다면, 사용자에게 높은 만족감과 편의성을 제공할 수 있을 것이다.The artificial intelligence system continuously evolves into an independent entity by continuously learning the user's characteristics, so that the user can automatically control a plurality of IoT devices according to tastes or preferences, or provide information that the user actually needs. As described above, if a suitable service can be provided according to a user's characteristics, high satisfaction and convenience may be provided to the user.
그러나 종래의 인공지능 시스템은, 사용자의 특성에 따라 해당 사용자에게 적합한 서비스를 제공하는 것이 아니라, 단순히 미리 정의된 로직에 따라 검색된 정보나 디바이스를 제어하도록 구현된다.However, the conventional artificial intelligence system is implemented not to provide a suitable service to the user according to the characteristics of the user, but simply to control the retrieved information or device according to predefined logic.
즉, 종래의 인공지능 시스템은, 상기 사용자의 특성에 따라 특정 서비스를 제공하도록 학습되는 것이 아니라, 음성인식기술을 포함하는 인공지능기술을 통해 사용자의 음성을 인식하는 것이 집중되어 있고, 사용자의 음성을 인식한 경우 상기 인식한 사용자의 음성에 따라 미리 설정된 로직을 수행하여 사용자가 제공받고자하는 서비스를 제공하게 되는 것이다.That is, in the conventional artificial intelligence system, it is not learned to provide a specific service according to the characteristics of the user, but it is concentrated to recognize the user's voice through artificial intelligence technology including voice recognition technology, and the user's voice In the case of recognizing, it performs a preset logic according to the recognized user's voice to provide a service that the user wants to receive.
예를 들어, 종래의 인공지능 시스템은, 사용자가 음악을 추천받고자 하는 경우, 상기 음악 추천에 대한 명령을 음성으로 상기 인공지능 시스템이 입력하면, 상기 인공지능 시스템은 음악 추천에 대한 음성을 인식한 후, 최근에 발매된 음원이나 다수의 사용자가 이용한 음원을 검색하여 해당 음원을 출력하는 것에 그치고 있다.For example, in a conventional artificial intelligence system, when the user wants to be recommended for music, when the artificial intelligence system inputs a command for the music recommendation by voice, the artificial intelligence system recognizes the voice for the music recommendation. Later, it is only to search for a recently released sound source or a sound source used by a large number of users and output the sound source.
즉, 종래의 인공지능 시스템은, 댁내에 구비될 때의 초기 상태에서 사용자의 성향이나 특성에 따라 더 이상 진화되지 않고, 미리 설정된 단순 로직이나 통계적인 수치만을 이용하여 사용자에게 서비스를 제공하는 기능만을 지원할 뿐이다.That is, the conventional AI system is no longer evolved according to the user's tendency or characteristics in the initial state when it is provided in the home, and only provides a function for providing a service to the user using only simple logic or statistical values set in advance. I just apply.
이는, 사용자의 개별적인 성향이나 특성에 따라 해당 사용자의 니즈에 최적합한 서비스를 제공하지 못하며, 또한 해당 사용자에게 불필요한 서비스를 제공하는 문제점을 내포하고 있다.This does not provide a service that is optimal for the needs of the user according to the individual tendencies or characteristics of the user, and also implies the problem of providing unnecessary services to the user.
이에 따라 본 발명에서는, 특정 사용자와 대응되는 캐릭터 또는 아바타 등과 같은 AI 개체를 생성하고, 상기 생성한 AI 개체를 사용자의 특성에 따라 지속적으로 강화학습을 하도록 하여, 상기 특정 사용자에 따라 개인화된 독립적인 개체로 진화시킴으로서, 해당 사용자에 대한 비서 역할을 수행하도록 하거나, 독립적인 SNS 활동이 가능하도록 하거나, 또한 각종 IoT 기기들을 사용자가 원하는 시간과 방법으로 동작시킴과 동시에 음악, 뉴스, 스케줄, 날씨, 상품, 인물 등과 같은 다양한 추천 서비스를 제공할 수 있도록 하는 방안을 제시하고자 한다.Accordingly, in the present invention, an AI entity such as a character or an avatar corresponding to a specific user is generated, and the created AI entity is continuously reinforced learning according to the characteristics of the user, so that the individualized individual is independent of the specific user. By evolving into an entity, it can act as a secretary for the user, enable independent SNS activities, or operate various IoT devices at the time and method desired by the user, and at the same time music, news, schedule, weather, products In order to provide a variety of recommended services, such as people, I would like to suggest a way to provide.
다음으로 본 발명의 기술분야에 존재하는 선행기술에 대하여 간단하게 설명하고, 이어서 본 발명이 상기 선행기술에 비해서 차별적으로 이루고자 하는 기술적 사항에 대해서 기술하고자 한다.Next, the prior art existing in the technical field of the present invention will be briefly described, and then the technical matters to be achieved differently from the prior art will be described.
먼저 한국공개특허 제2019-0001059호(2019.01.04.)는 인공지능 플랫폼 제공 장치 및 이를 이용한 컨텐츠 서비스 방법에 관한 것으로, 사용자 단말로부터 기 정해진 포맷의 입력 데이터를 수신하고, 상기 입력 데이터에 포함된 사용자의 요청에 관한 요청정보를 추출한 후, 상기 요청정보에 기초하여 컨텐츠를 제공하는 복수의 컨텐츠 서버 중 하나를 선택하여, 상기 요청정보에 대응되는 컨텐츠를 사용자에게 제공하는 인공지능 플랫폼 제공 장치 및 이를 이용한 컨텐츠 서비스 방법에 관한 것이다.First, Korean Patent Publication No. 2019-0001059 (2019.01.04.) relates to an artificial intelligence platform providing device and a content service method using the same, receiving input data in a predetermined format from a user terminal, and included in the input data After extracting the request information related to the user's request, based on the request information, select one of a plurality of content servers that provide content, and provide an AI platform providing device corresponding to the request information to the user and the same It relates to a content service method used.
즉, 상기 선행기술은 사용자로부터 음성 데이터를 입력 받아, 음성 인식 및 자연어 처리를 통해 상기 입력받은 음성 데이터로부터 요청정보를 인식하고, 상기 인식한 요청정보에 대응하는 컨텐츠를 제공하는 것이다.That is, the prior art is to receive voice data from a user, recognize request information from the received voice data through speech recognition and natural language processing, and provide content corresponding to the recognized request information.
다시 말해, 상기 선행기술은 단순히 인공지능 플랫폼을 통해 사용자의 음성을 인식하고, 상기 인식한 사용자의 음성에 따라 다양한 컨텐츠를 제공하는 것이다.In other words, the prior art simply recognizes a user's voice through an AI platform and provides various contents according to the recognized user's voice.
반면에 본 발명은, 사용자가 원하는 캐릭터 또는 아바타를 포함하는 AI 개체를 생성하고, 상기 생성한 AI 개체를 사용자의 특성에 따라 지속적으로 학습시켜 하나의 독립적인 개체로 진화시킬 수 있도록 함으로서, 상기 사용자의 특성에 따라 해당 사용자에게 적합하고 효율적인 다양한 서비스를 제공하는 것으로, 상기 선행기술은 이러한 본 발명의 기술적 특징을 기재하거나 시사하고 있지 않다.On the other hand, according to the present invention, the user creates an AI object including a desired character or avatar, and continuously learns the generated AI object according to a user's characteristics, so that the user can evolve into an independent object. According to the characteristics of providing a variety of services suitable and efficient for the user, the prior art does not describe or suggest such technical features of the present invention.
또한 한국등록특허 제1172002호(2012.08.01.)는 스마트폰과 센서를 이용한 인공지능 디지털 기기 제어 시스템에 관한 것으로, 센서에서 측정된 센싱값을 스마트폰에 구비된 비교부에서 미리 설정한 설정값과 상기 센싱값을 비교하여 냉난방 장치 등의 구동여부를 스스로 판단한 후, 특정 위치에 고정적으로 설치되어 있는 냉난방 장치의 동작을 제어할 수 있도록 하는 스마트폰과 센서를 이용한 인공지능 디지털기기 제어시스템에 관한 것이다.In addition, Korean Registered Patent No. 1172002 (2012.08.01.) relates to an artificial intelligence digital device control system using a smartphone and a sensor, and a preset value set in advance by a comparison unit provided with the sensing value measured by the sensor. The artificial intelligence digital device control system using a smartphone and a sensor to control the operation of the air-conditioning device fixedly installed at a specific location after determining whether or not the air-conditioning device is driven by comparing the sensing values with will be.
상기 선행기술은 온도 및 습도를 포함하는 환경조건을 스마트폰을 통해 미리 설정해놓고, 센서를 통해 측정되는 온도 및 습도를 포함하는 환경조건에 대한 센싱값과 상기 미리 설정한 환경조건과 비교하여, 냉난방장치의 구동여부를 판단하여, 상기 판단결과에 따라 상기 냉난방장치에 대한 구동신호를 IR 송출기를 통해 전송함으로써, 상기 냉난방장치를 자동으로 제어할 수 있도록 하는 것이다.In the prior art, environmental conditions including temperature and humidity are set in advance through a smartphone, and sensing values for environmental conditions including temperature and humidity measured through a sensor are compared with the preset environmental conditions, and the air conditioning is performed. The operation of the device is determined and the driving signal for the air conditioning device is transmitted through the IR transmitter according to the determination result, so that the air conditioning device can be automatically controlled.
즉, 상기 선행기술은 단순히 미리 설정한 설정값과 센싱값을 비교하고, 비교한 결과에 따라 상기 냉난방장치에 대한 구동여부를 판단하는 것이지, 사용자로부터 입력되는 사용자의 특성을 지속적으로 강화학습하여 해당 사용자의 특성에 따라 특정 IoT 기기를 제어하도록 하거나, 음악 등과 같은 다양한 추천서비스를 제공하도록 하는 것이 아니다.That is, the prior art simply compares a preset value and a sensing value, and determines whether to drive the air conditioning system according to the comparison result, and continuously reinforces and learns the characteristics of the user input from the user. It is not intended to control a specific IoT device according to the characteristics of the user, or to provide various recommended services such as music.
반면에 본 발명은, 캐릭터, 아바타 등을 포함하는 AI 개체를 생성하고, 사용자로부터 사용자의 특성정보를 지속적으로 입력받아, 상기 입력받은 특성정보를 토대로 특정 IoT 기기를 제어하거나, 각 분야별 서비스를 제공하기 위한 적어도 하나 이상의 학습모델을 지속적으로 강화학습시켜, 상기 생성한 AI 개체를 독립적인 개체로 진화시키도록 함으로서, 상기 AI 개체를 이용하는 사용자의 특성에 적합한 추천 서비스를 제공하거나, 또는 특정 IoT 기기를 제어할 수 있도록 하는 것이다. 따라서 상기 선행기술은 본 발명에서 제안하고자 하는 기술적 특징과의 차이점이 명확하다.On the other hand, according to the present invention, an AI object including a character, an avatar, etc. is generated, and user characteristic information is continuously input from a user, and a specific IoT device is controlled based on the received characteristic information or a service for each field is provided. Continuously reinforce learning by learning at least one or more learning models to provide the recommendation service suitable for the characteristics of the user who uses the AI object by evolving the generated AI object into an independent object, or by providing a specific IoT device. To be able to control it. Therefore, the prior art is clearly different from the technical features to be proposed in the present invention.
본 발명은 상기와 같은 문제점을 해결하기 위해 창작된 것으로서, 사용자가 자신의 아바타, 캐릭터를 포함하는 AI 개체를 생성하고, 상기 생성한 AI와 상기 사용자 간의 지속적인 인터랙션을 통해 상기 AI 개체를 지속적으로 강화학습시켜, 상기 AI 개체를 독립적인 개체로 진화시킴으로써, 상기 AI 개체가 해당 사용자의 특성에 부합하는 서비스를 제공할 수 있도록 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 방법 및 플랫폼을 제공하는 것을 그 목적으로 한다.The present invention was created to solve the above problems, and the user creates an AI object including his avatar and character, and continuously strengthens the AI object through continuous interaction between the created AI and the user. By providing learning and evolving the AI entity as an independent entity, providing a method and platform for providing an AI entity that evolves through reinforcement learning that enables the AI entity to provide a service that meets the characteristics of the user. For that purpose.
또한 상기 AI 개체를 생성할 때, 음악, 상품, TV 채널, 뉴스 등을 추천하거나, IoT 기기 제어, 스케줄 관리 등을 포함하는 적어도 하나 이상의 분야에 대한 특화된 학습모델을 각각 생성하며, 상기 사용자가 AI 개체와의 인터랙션을 통해 상기 각 학습모델에 대한 강화학습을 수행할 수 있도록 함으로써, 상기 AI 개체를 고도화시키도록 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 방법 및 플랫폼을 제공하는 것을 또 다른 목적으로 한다.In addition, when creating the AI entity, music, products, TV channels, news, etc. are recommended, or learning models specialized for at least one field including IoT device control, schedule management, and the like are respectively generated, and the user generates AI. Another object is to provide a method and platform for providing an evolving AI entity through reinforcement learning to advance the AI entity by enabling reinforcement learning for each learning model through interaction with the entity. Is done.
또한 본 발명은, 상기 사용자와 상기 AI 개체간의 인터랙션을 수행하여, 상기 인터랙션 결과인 특정 분야의 추천 서비스를 제공받은 경우, 해당 인터랙션 결과를 상기 특정 분야에 대한 학습모델에 적용함으로써, 해당 AI 개체에 대한 강화학습을 자동으로 수행하여 상기 AI 개체를 점진적으로 진화할 수 있도록 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 방법 및 플랫폼을 제공하는 것을 또 다른 목적으로 한다.In addition, the present invention, by performing the interaction between the user and the AI entity, when receiving a recommendation service in a specific field that is the result of the interaction, by applying the interaction result to the learning model for the specific field, to the AI entity Another object is to provide a method and a platform for providing an evolving AI entity through reinforcement learning that enables the AI entity to gradually evolve by automatically performing reinforcement learning for Korea.
또한 본 발명은, 사용자의 선택에 따라 또는 주기적으로 사용자로부터 시간대별 선호하는 TV 채널, 시간별 장소별 냉난방 온도, 시간별 조명제어정보, 선호하는 뉴스분야, 인물, 음악, 아티스트, 상품 등을 포함하는 사용자의 특성정보를 입력받아 상기 AI 개체에 강화학습을 지속적으로 수행함으로서, 사용자의 성향에 적합한 특정 IoT 기기 제어, 뉴스, 음악 등을 포함하는 추천 서비스를 제공하는 강화학습을 통해 진화하는 AI 개체를 제공하는 방법 및 플랫폼을 제공하는 것을 또 다른 목적으로 한다.In addition, the present invention, according to the user's selection or periodically from the user, the preferred TV channel, air conditioning temperature by location, hourly lighting control information, preferred news field, people, music, artists, products, etc. By continuously performing reinforcement learning on the AI entity by receiving the characteristic information of the, it provides the evolving AI entity through reinforcement learning that provides a recommendation service including control, news, music, etc. of a specific IoT device suitable for the user's preference. Another object is to provide a method and platform.
또한 본 발명은, 사용자의 일정, 알람시간, 기념일 등을 포함하는 사용자의 스케줄을 학습하여 상기 AI 개체를 통해 사용자에게 상기 스케줄을 자동으로 알려줌으로써, 해당 사용자에 대한 비서 역할을 수행할 수 있도록 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 방법 및 플랫폼을 제공하는 것을 또 다른 목적으로 한다.In addition, the present invention, by learning the user's schedule including the user's schedule, alarm time, anniversary, etc., to automatically inform the user of the schedule through the AI entity, so that it can act as a secretary for the user Another object is to provide a method and platform for providing AI entities that evolve through reinforcement learning.
또한 본 발명은, 상기 인터랙션을 통해 사용자가 음성 또는 텍스트로 추천 서비스에 대한 요청을 AI 개체에 입력하면, 상기 AI 개체는 상기 요청을 인식하고, 상기 인식한 요청에 따라 상기 학습한 결과에 따라 스케줄, IoT 기기(400) 제어, 음악, 뉴스 등에 대한 추전 서비스를 제공할 수 있도록 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 방법 및 플랫폼을 제공하는 것을 또 다른 목적으로 한다.In addition, according to the present invention, when a user inputs a request for a recommendation service through voice or text into an AI entity through the interaction, the AI entity recognizes the request and schedules according to the learned result according to the recognized request. Another object is to provide a method and platform for providing an evolving AI entity through reinforcement learning to provide a propulsion service for IoT device 400 control, music, news, and the like.
또한 본 발명은, 상기 생성한 AI 개체가 SNS상에서 독립적으로 활동할 수 있도록 구현되며, 타 AI 개체와의 교류를 통해 사용자와 독립적인 개체로 진화할 수 있도록 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 방법 및 플랫폼을 제공하는 것을 또 다른 목적으로 한다.In addition, the present invention is implemented so that the created AI entity can independently act on the SNS, and provides an AI entity that evolves through reinforcement learning to evolve into an entity independent of the user through interaction with other AI entities. Another object is to provide a method and platform.
또한 상기 AI 개체가, 자가학습, 참여학습, 지도학습, 자율학습을 포함하는 학습방법을 통해 점진적으로 고도화되어 독립적인 개체로 진화되도록 함으로써, 사용자가 원하는 정보를 검색하여 제공하거나, 특정 IoT 기기를 자동으로 제어할 수 있도록 하거나, 스케줄 등을 보고하거나, 음악, 상품, 동영상 등을 추천하는 것을 포함하여 다양한 서비스를 제공할 수 있도록 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 방법 및 플랫폼을 제공하는 것을 또 다른 목적으로 한다.In addition, the AI object is gradually advanced and evolved into an independent object through a learning method including self-learning, participatory learning, supervised learning, and self-learning, so that a user can search for and provide information or a specific IoT device. Provides a method and platform for providing evolving AI entities through reinforcement learning that enables them to automatically control, report schedules, and provide various services including recommending music, products, videos, etc. To do it for another purpose.
본 발명의 일 실시예에 따른 강화학습을 통해 진화하는 AI 개체를 제공하는 방법은, 사용자가 AI 개체를 생성하는 AI 개체 생성 단계, 기계학습을 통해 상기 생성한 AI 개체에 대한 학습모델을 생성하는 학습모델 생성 단계 및 상기 생성한 학습모델을 통해서 사용자가 AI 개체와 인터랙션하면, 상기 인터랙션의 결과를 상기 학습모델에 적용하여, 해당 학습모델에 대한 강화학습을 수행하도록 함으로써, 상기 사용자의 인터랙션 행위에 따라 상기 생성한 AI 개체가 독립적인 개체로 진화하도록 하는 AI 개체 진화 단계를 포함하는 것을 특징으로 한다.A method of providing an AI entity that evolves through reinforcement learning according to an embodiment of the present invention includes: an AI entity generation step in which a user creates an AI entity, and a learning model for the created AI entity through machine learning When the user interacts with the AI entity through the learning model generation step and the generated learning model, by applying the result of the interaction to the learning model, and performing reinforcement learning for the learning model, the interaction behavior of the user Accordingly, it characterized in that it comprises an AI entity evolution step to cause the generated AI entity to evolve into an independent entity.
또한 상기 방법은, 상기 AI 개체 진화 단계를 통해, 상기 AI 개체가 다른 AI 개체와 교류하면서, 상기 사용자와 독집적인 개체로 진화하는 것을 더 포함하는 것을 특징으로 한다.In addition, the method further comprises, through the AI entity evolution step, while the AI entity interacts with another AI entity, further evolving into an individual entity with the user.
또한 상기 AI 개체는, 상기 방법을 수행하는 독립적인 하드웨어로 구성된 특정 디바이스나 인터넷상의 웹서버나 클라우드 플랫폼에서 계정을 만듦으로서 생성되며, 상기 사용자가 원하는 비서의 기능을 하거나, SNS 활동이 가능하거나, 가정, 학교 또는 사무실에서 사용자를 대신하여 적어도 하나 이상의 IoT 기기를 상기 사용자가 원하는 시간과 방법으로 동작시키거나, 적어도 하나 이상의 IoT 기기를 설정하여 사용자가 원하는 가정, 학교 또는 사무실 환경을 유지하도록 하거나, 또는 이들의 조합 중 적어도 하나 이상을 수행하는 것을 특징으로 한다.In addition, the AI entity is generated by creating an account on a web server or a cloud platform on a specific device or internet that is configured with independent hardware that performs the method, and functions as a secretary desired by the user, or enables SNS activities, In the home, school or office, the user operates at least one IoT device on behalf of the user at a desired time and method, or sets at least one IoT device to maintain the desired home, school, or office environment. Or a combination of these.
또한 상기 방법은, 상기 학습모델을 학습시켜 학습모델을 생성하는 과정에서, 사용자에게 학습 데이터를 입력할 수 있는 인터페이스를 제공하고, 사용자에게 학습시킬 방법을 제시함으로써, 사용자가 학습용 데이터를 미리 지정된 포맷으로 입력하도록 하는 학습데이터 입력 단계를 더 포함하는 것을 특징으로 한다.In addition, in the process of learning the learning model and generating a learning model, the method provides a user with an interface through which learning data can be input, and presents a method for learning to the user, thereby allowing the user to format learning data in a predetermined format. It characterized in that it further comprises a step of inputting the learning data to be input.
또한 상기 학습모델은, CNN, RNN 또는 ANN를 포함한 적어도 하나 이상의 분야에 대해서 특화된 학습모델을 포함하며, 상기 AI 개체는, 상기 적어도 하나 이상의 특화된 학습모델이 상호 결합되어 진화하며, 상기 상호 결합은 관련 분야에 대해서 학습 데이터를 관련 정도에 따라 계량화하여 스케일링함으로써 수행되는 것을 특징으로 한다.In addition, the learning model includes a learning model specialized for at least one field including CNN, RNN, or ANN, and the AI entity evolves by combining the at least one specialized learning model with each other, and the mutual coupling is related. It is characterized in that it is performed by quantifying and scaling the learning data according to the relevant degree in the field.
아울러 본 발명의 일 실시예에 따른 강화학습을 통해 진화하는 AI 개체를 제공하는 플랫폼은, 사용자에 의해 AI 개체를 생성하도록 지원하는 AI 개체 생성부, 기계학습을 통해 상기 생성한 AI 개체에 대한 학습모델을 생성하는 학습모델 생성부 및 상기 생성한 학습모델을 통해서 사용자가 상기 생성한 AI 개체와 인터랙션하면, 상기 인터랙션의 결과를 상기 학습모델에 적용하여, 해당 학습모델에 대한 강화학습을 수행하도록 함으로써, 상기 사용자의 인터랙션 행위에 따라 상기 생성한 AI 개체가 독립적인 개체로 진화하도록 하는 학습모델 진화부를 포함하는 것을 특징으로 한다.In addition, a platform for providing an AI entity that evolves through reinforcement learning according to an embodiment of the present invention, an AI entity generation unit that supports a user to create an AI entity, and learning about the created AI entity through machine learning When the user interacts with the generated AI entity through the learning model generation unit generating the model and the generated learning model, by applying the result of the interaction to the learning model, reinforcement learning for the learning model is performed. And, it characterized in that it comprises a learning model evolution unit that allows the generated AI entity to evolve as an independent entity according to the user's interaction behavior.
또한 상기 학습모델 진화부는, 상기 독립적인 개체로 진화하는 과정을 통해서 상기 AI 개체가 다른 AI 개체와 교류하면서, 상기 사용자와 독립적인 개체로 진화하도록 하는 것을 더 포함하는 것을 특징으로 한다.In addition, the learning model evolution unit, the AI entity through the process of evolving into the independent entity, while further interacting with other AI entities, characterized in that it further comprises to evolve into an independent entity with the user.
또한 상기 플랫폼은, 상기 학습모델을 학습시켜 학습모델을 생성할 때, 사용자에게 학습용 데이터를 입력할 수 있는 인터페이스를 제공하고, 사용자에게 학습시킬 방법을 제시함으로써, 사용자가 학습용 데이터를 미리 지정된 포맷으로 입력하도록 하는 학습 데이터 입력부를 더 포함하는 것을 특징으로 한다.Further, when the learning model is generated by learning the learning model, the platform provides the user with an interface through which learning data can be input, and provides a user with a method to learn, thereby allowing the user to learn data in a predetermined format. It characterized in that it further comprises a learning data input unit for input.
이상에서와 같이 본 발명의 AI 개체 강화학습 플랫폼은, 사용자가 자신의 분신이나 캐릭터 또는 아바타를 포함하는 AI 개체를 생성하고, 상기 생성한 AI 개체를 사용자 본인이 자신의 성향에 맞게 지속적으로 강화학습시켜 상기 생성한 AI 개체를 독립적인 하나의 개체로 진화시킴으로써, 사용자의 성향이나 니즈에 적합한 최적의 서비스를 제공하고, 이와 동시에 사용자의 개인적인 비서 역할을 수행할 수 있도록 하여, 사용자에게 편의성을 제공할 수 있는 효과가 있다.As described above, the AI object reinforcement learning platform of the present invention allows the user to create an AI object including his alter ego or character or avatar, and the user can continuously reinforce the learned AI object according to his preference. By evolving the created AI entity into an independent entity, the optimal service suitable for the user's tendency or needs is provided, and at the same time, it can serve as the personal assistant of the user, thereby providing convenience to the user. It has the effect.
도 1은 본 발명의 일 실시예에 따른 강화학습을 통해 진화하는 AI 개체를 제공하는 방법 및 플랫폼을 개략적으로 설명하기 위한 개념도이다.1 is a conceptual diagram schematically illustrating a method and platform for providing an AI entity that evolves through reinforcement learning according to an embodiment of the present invention.
도 2는 본 발명의 일 실시예에 따른 AI 개체에 대한 강화학습을 수행하는 방법을 설명하기 위해 나타낸 도면이다.2 is a view illustrating a method for performing reinforcement learning on an AI entity according to an embodiment of the present invention.
도 3은 본 발명의 일 실시예에 따른 AI 개체를 통해 사용자의 요청명령에 따른 추천 서비스를 제공하는 방법을 설명하기 위해 나타낸 도면이다.3 is a diagram illustrating a method of providing a recommendation service according to a user's request command through an AI entity according to an embodiment of the present invention.
도 4는 본 발명의 일 실시예에 따른 AI 개체 제공 플랫폼의 구성을 나타낸 블록도이다.4 is a block diagram showing the configuration of an AI entity providing platform according to an embodiment of the present invention.
도 5는 본 발명의 일 실시예에 따른 강화학습을 통해 진화하는 AI 개체를 제공하는 절차를 나타낸 흐름도이다.5 is a flowchart illustrating a procedure for providing an AI entity that evolves through reinforcement learning according to an embodiment of the present invention.
이하, 첨부한 도면을 참조하여 본 발명의 강화학습을 통해 진화하는 AI 개체를 제공하는 방법 및 플랫폼에 대한 바람직한 실시 예를 상세히 설명한다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다. 또한 본 발명의 실시 예들에 대해서 특정한 구조적 내지 기능적 설명들은 단지 본 발명에 따른 실시 예를 설명하기 위한 목적으로 예시된 것으로, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는 것이 바람직하다. AI 개체는 본 발명에서 사용자가 인터넷과 같은 사이버 공간이나 현실공간의 디바이스에서 특정 개체, 예를 들면 캐릭터나 아바타(분신)를 마치 SNS 계정(접속 창구)을 만드는 것과 같이 생성하고, 해당 캐릭터나 아바타(분신)를 인공지능 알고리즘에 따라 강화학습을 통해서 육성 및 활용함으로써, 사용자에 의해서 혹은 SNS상의 활동에 의해서 점점 고도화되고 진화해 나가는 것을 말한다.Hereinafter, exemplary embodiments of a method and platform for providing an AI entity that evolves through reinforcement learning of the present invention will be described in detail with reference to the accompanying drawings. The same reference numerals in each drawing denote the same members. Also, specific structural or functional descriptions of the embodiments of the present invention are exemplified for the purpose of describing the embodiments according to the present invention, and unless defined otherwise, all terms used herein, including technical or scientific terms. These have the same meaning as those generally understood by those of ordinary skill in the art. Terms such as those defined in a commonly used dictionary should be interpreted as having meanings consistent with meanings in the context of related technologies, and should not be interpreted as ideal or excessively formal meanings unless explicitly defined herein. It is desirable not to. In the present invention, an AI object is created by a user in a cyber space such as the Internet or a device in a real space, for example, a character or avatar (divided) as if creating an SNS account (connection window), and the corresponding character or avatar It refers to the sophistication and evolving of (divided) through the reinforcement learning according to artificial intelligence algorithms, by users or by activities on SNS.
도 1은 본 발명의 일 실시예에 따른 강화학습을 통해 진화하는 AI 개체를 제공하는 방법 및 플랫폼을 개략적으로 설명하기 위한 개념도이다.1 is a conceptual diagram schematically illustrating a method and platform for providing an AI entity that evolves through reinforcement learning according to an embodiment of the present invention.
도 1에 도시한 바와 같이, 본 발명의 일 실시예에 따른 AI 개체 강화학습 플랫폼(이하, AI 개체 제공 플랫폼으로 칭함)(100)은, 각 사용자에 대한 캐릭터 또는 아바타 등을 포함하는 AI 개체(200)를 생성하고, 상기 생성한 AI 개체(200)에 대한 강화학습을 지속적으로 수행하여, 상기 AI 개체(200)를 하나의 독립적인 개체로 진화되도록 육성함으로써, 상기 AI 개체(200)가 해당 사용자의 성향에 따라 다양한 정보를 검색하고, 특정 IoT 기기를 자동으로 제어하거나, 사용자의 스케줄에 대한 보고 및 음악, 뉴스, 동영상 등과 같은 추천을 포함하는 다양한 서비스를 제공할 수 있도록 하는 기능을 수행한다.As illustrated in FIG. 1, an AI entity reinforcement learning platform (hereinafter referred to as an AI entity providing platform) 100 according to an embodiment of the present invention includes an AI entity (such as a character or avatar for each user). 200) and continuously performing reinforcement learning on the created AI object 200, thereby fostering the AI object 200 to evolve as a single independent object, so that the AI object 200 is applicable. It performs a function to search for various information according to the user's preference, to automatically control a specific IoT device, or to provide various services, including reporting on the user's schedule and recommendations such as music, news, and videos. .
또한 상기 AI 개체 제공 플랫폼(100)은, 상기 사용자에 의해 상기 AI 개체(200)가 생성되는 경우, 상기 사용자로부터 해당 사용자의 특성정보를 입력 받아 상기 입력한 특성정보를 이용하여 상기 사용자에게 특정 서비스를 제공하기 위한 분야별 학습모델을 복수개로 생성한다.In addition, when the AI entity 200 is generated by the user, the AI entity providing platform 100 receives the user's characteristic information from the user and uses the entered characteristic information to provide a specific service to the user. Create a plurality of learning models for each field to provide.
즉, 상기 사용자의 특성정보는, 상기 분야별 학습모델을 생성하기 위한 학습데이터가 된다.That is, the characteristic information of the user becomes learning data for generating the learning model for each field.
이때, 상기 사용자는, 상기 AI 개체 제공 플랫폼(100)으로부터 제공되는 인공지능 애플리케이션(application)을 해당 사용자의 사용자 단말(300)에 설치하고, 상기 설치한 인공지능 애플리케이션을 실행하여 상기 AI 개체 제공 플랫폼(100)에 접속한 후, 상기 AI 개체(200)를 생성할 수 있다.In this case, the user installs the AI application provided from the AI object providing platform 100 to the user terminal 300 of the corresponding user, and executes the installed AI application to provide the AI object providing platform. After accessing (100), the AI entity 200 may be generated.
상기 AI 개체 제공 플랫폼(100)은, 상기 AI 개체(200)를 생성하고, 상기 생성한 AI 개체(200)를 지속적인 강화학습을 통해 해당 AI 개체(200)를 진화시키도록 하기 위한 것으로, 사용자의 가정이나 사무실 또는 학교 등과 같은 공공장소에 구비되고, 독립적인 하드웨어로 구성된 특정 디바이스를 의미하는 것이다. 한편 상기 AI 개체 제공 플랫폼(100)은, 클라우드 서버나 웹서버 형태로 구현될 수도 있다.The AI entity providing platform 100 is for generating the AI entity 200 and for evolving the AI entity 200 through continuous reinforcement learning, thereby generating the AI entity 200 and allowing the user to It refers to a specific device that is provided in a public place such as a home, office, or school, and is composed of independent hardware. Meanwhile, the AI entity providing platform 100 may be implemented in the form of a cloud server or a web server.
상기 AI 개체 제공 플랫폼(100)은, 상기 생성한 AI 개체(200)를 통해 상기 사용자와 인터랙션을 수행하여, 상기 AI 개체(200)를 지속적으로 진화시키실 수 있도록 하며, 상기 AI 개체(200)를 이용하여 사용자에게 다양한 서비스를 제공할 수 있도록 한다.The AI entity providing platform 100 interacts with the user through the created AI entity 200 to continuously evolve the AI entity 200, and the AI entity 200 To provide various services to users.
또한 상기 생성한 AI 개체(200)는, 해당 사용자의 사용자 단말(300)에 적용되어 언제 어디서나, 상기 인터랙션을 수행할 수 있도록 구현될 수 있으며, SNS 서비스를 제공하기 위한 특정 클라우드 플랫폼이나, 웹서버에 적용될 수 있으며, 사용자의 성향에 따라 독립적으로 SNS 활동을 수행할 수 있도록 구현될 수 있다. In addition, the created AI entity 200 is applied to the user terminal 300 of the corresponding user and can be implemented to perform the interaction anytime, anywhere, and a specific cloud platform or web server for providing an SNS service It can be applied to, and can be implemented to independently perform SNS activities according to user preferences.
한편, 상기 SNS 서비스를 제공하기 위한 클라우드 플랫폼이나 웹서버에 적용되는 AI 개체(200)는, 해당 클라우드 플랫폼이나 웹서버에 대한 SNS 계정을 만듦으로써, 생성된다.Meanwhile, the AI entity 200 applied to the cloud platform or web server for providing the SNS service is generated by creating an SNS account for the cloud platform or web server.
또한 상기 분야별 학습모델은, TV 채널 추천용 학습모델, 음악 추천용 학습모델, IoT 기기(400) 제어용 학습모델, 뉴스 추천용 학습모델, 스케줄 추천용 학습모델 등을 포함할 수 있으며, 상기 AI 개체(200)는 상기 각 분야별 학습모델을 통해 상기 서비스를 사용자에게 제공할 수 있다.In addition, the learning model for each field may include a TV channel recommendation learning model, a music recommendation learning model, an IoT device 400 control learning model, a news recommendation learning model, and a schedule recommendation learning model, and the AI entity. The 200 may provide the service to the user through the learning model for each field.
이러한 학습모델은 이에 한정하지 않으며, 상기 AI 개체 제공 플랫폼(100)의 설계자에 의해 복수의 학습모델로 세분화될 수 있다.The learning model is not limited thereto, and may be subdivided into a plurality of learning models by the designer of the AI entity providing platform 100.
또한 상기 사용자가 상기 AI 개체 제공 플랫폼(100)을 통해 AI 개체(200)를 생성하고자 할 때, 상기 AI 개체 제공 플랫폼(100)의 AI 개체 생성 절차에 따라 해당 사용자의 인증정보(예: 지문, 음성, 제스처) 및 개인정보(예: 사용자 ID, 이름과 계정정보를 포함하는 지갑(wallet)정보 등)를 제공함으로써, 상기 AI 개체(200)의 생성을 신청하며, 상기 AI 개체 제공 플랫폼(100)은 상기 사용자로부터 상기 인증정보 및 개인정보를 포함한 생성 신청이 있는 경우, 상기 사용자에 대한 계정을 생성함으로써, 해당 사용자에 대한 AI 개체(200)를 생성하게 된다.In addition, when the user wants to create the AI entity 200 through the AI entity providing platform 100, according to the AI entity creation procedure of the AI entity providing platform 100, the authentication information of the user (eg fingerprint, By providing voice, gesture) and personal information (eg, wallet information including user ID, name and account information, etc.), requesting the creation of the AI entity 200, and providing the AI entity providing platform 100 ) Generates an AI entity 200 for the user by creating an account for the user when there is an application for generation including the authentication information and personal information from the user.
이렇게 생성된 AI 개체(200)는, 상기 AI 개체 제공 플랫폼(100)에 적용되고, 또한 사용자의 선택에 따라 해당 사용자의 사용자 단말(300)에 적용될 수 있으며, 또한 상기 SNS 서비스를 제공하는 상기 클라우드 플랫폼이나 웹서버에 적용될 수 있다.The AI entity 200 generated as described above is applied to the AI entity providing platform 100 and can also be applied to the user terminal 300 of the corresponding user according to the user's selection, and the cloud providing the SNS service. It can be applied to platforms or web servers.
또한 상기 AI 개체 제공 플랫폼(100)은, 적어도 하나 이상의 사용자로부터 상기 인증정보 및 개인정보를 제공받아, 상기 각 사용자에 대한 AI 개체(200)를 생성할 수 있음은 당연하다.Also, it is natural that the AI entity providing platform 100 may generate the AI entity 200 for each user by receiving the authentication information and personal information from at least one or more users.
예를 들어, 상기 AI 개체 제공 플랫폼(100)에 사용자의 가정에 구비되는 경우, 해당 사용자의 가족 구성원별로 상기 인증정보 및 개인정보를 각각 입력받아, 각 구성원에 대한 AI 개체(200)를 생성할 수 있도록 구현될 수 있다.For example, when the AI object providing platform 100 is provided in the user's home, the authentication information and personal information are input for each member of the user's family, and the AI object 200 for each member is generated. Can be implemented.
또한 상기 인증정보는, 상기 AI 개체(200)를 활성화하여, 해당 AI 개체(200)를 이용하기 위한 것으로, 상기 AI 개체 제공 플랫폼(100)에 접속된 사용자 단말(300)에 구비되는 지문인식수단, 마이크 또는 카메라를 통해 입력될 수 있으며, 상기 개인정보는, 상기 사용자 단말(300)의 키패드, 터치 팬 등과 같은 입력수단을 통해 입력될 수 있다.In addition, the authentication information, to activate the AI entity 200, to use the AI entity 200, fingerprint recognition means provided in the user terminal 300 connected to the AI entity providing platform 100 , It may be input through a microphone or a camera, and the personal information may be input through an input means such as a keypad, a touch fan, etc. of the user terminal 300.
다만, 상기 지문인식수단, 마이크 또는 카메라 및 상기 입력수단은 상기 AI 개체 제공 플랫폼(100)에 구비될 수 있으며, 이때, 사용자는 상기 AI 개체 제공 플랫폼(100)에 구비되는 지문인식수단, 마이크 또는 카메라 및 상기 입력수단을 통해 상기 사용자의 인증정보 및 개인정보를 직접적으로 입력할 수 있다.However, the fingerprint recognition means, microphone or camera and the input means may be provided in the AI entity providing platform 100, where the user is a fingerprint recognition means, microphone or The user's authentication information and personal information can be directly input through the camera and the input means.
또한 상기 AI 개체 제공 플랫폼(100)은, 상기 AI 개체(200)를 생성하는 과정에 있어서, 상기 AI 개체(200)에 대한 커스터마이징(customizing) 정보를 제공하여, 상기 AI 개체(200)를 사용자의 성향에 따라 모델링함으로써, 생성할 수 있도록 한다.In addition, in the process of generating the AI entity 200, the AI entity providing platform 100 provides customizing information for the AI entity 200, thereby allowing the AI entity 200 to be accessed by the user. It can be created by modeling according to the propensity.
상기 커스터마이징 정보는, 해당 AI 개체(200)에 적용될 언어 및 국적을 포함하는 사회적 요소, 성별 및 나이 등을 포함하는 생물학적 요소 및 얼굴, 헤어 및 의상 등을 포함하는 외모적 요소, 감정(예: 기쁨, 슬픔 등에 대한 표정 및 제스처) 요소 및 해당 AI 개체(200)에 대한 명칭을 포함한다.The customizing information includes social elements including language and nationality to be applied to the AI entity 200, biological elements including gender and age, and appearance elements including face, hair and clothes, and emotions (eg, joy) , Facial expressions and gestures for sadness, etc.) and the name of the corresponding AI entity 200.
즉, 상기 사용자는, 상기 AI 개체 강화학습 플랫폼(100)에서 제공하는 커스터마이징 정보를 토대로 상기 AI 개체(200)에 대한 사회적 요소, 생물학적 요소, 외모적 요소, 감정 요소 및 명칭을 설정함으로써, 사용자의 취향에 따라 상기 AI 개체(200)를 모델링함으로써, 사용자에게 보다 친근한 AI 개체(200)를 생성할 수 있다.That is, the user sets the social element, biological element, appearance element, emotion element, and name for the AI object 200 based on the customization information provided by the AI object reinforcement learning platform 100, so that the user By modeling the AI entity 200 according to taste, an AI entity 200 that is more user friendly can be generated.
한편 상기 AI 개체(200)는, 해당 AI 개체(200)에 대한 고유식별코드 및 생성일자를 포함하여 생성되며, 사용자의 선택에 따라 타 구성원의 정보와 IoT 기기(400)에 대한 접근권한이 부여되어 생성된다.Meanwhile, the AI entity 200 is generated by including a unique identification code and a creation date for the corresponding AI entity 200, and access to the information of other members and the IoT device 400 is granted according to the user's selection. Is created.
또한 생성한 AI 개체(200)는 사용자의 설정에 따라 해당 사용자의 가정, 사무실 또는 학교 등과 같이 댁내에 구비되는 복수의 IoT 기기(400)와 연동될 수 있다. 이때, 상기 사용자는 해당 IoT 기기(400)에 대한 AI 개체(200)의 접근권한을 설정할 수 있다.In addition, the created AI entity 200 may be linked to a plurality of IoT devices 400 provided in the home, such as a user's home, office, or school, according to the user's setting. At this time, the user may set the access authority of the AI entity 200 to the IoT device 400.
또한 상기 복수의 IoT 기기(400)는, 상기 댁내에 위치하는 조명, TV, 냉난방장치를 포함한 다양한 디바이스를 의미한다. 이러한 복수의 IoT 기기(400) 기기는 홈 네트워크 시스템으로 구성될 수 있다.In addition, the plurality of IoT devices 400 refers to various devices including lighting, TVs, and air conditioning units located in the home. The plurality of IoT device 400 devices may be configured as a home network system.
또한 상기 사용자는 자신의 니즈에 적합한 적어도 하나 이상의 추천 서비스를 제공받기 위해, 자신의 특성정보를 이용하여 상기 AI 개체(200)에 대한 강화학습을 지속적으로 수행함으로써, 상기 AI 개체(200)를 자신의 성향에 적합하도록 고도화시킬 수 있다.In addition, the user continuously performs reinforcement learning on the AI entity 200 using his characteristic information in order to receive at least one recommendation service suitable for his/her needs, thereby allowing the AI entity 200 to perform himself/herself. It can be upgraded to suit your propensity.
또한 상기 AI 개체 제공 플랫폼(100)은, 상기 AI 개체(200)를 생성할 때, 사용자로부터 제공되는 사용자 특성정보(즉, 학습데이터)를 학습하여 상기 서비스를 제공하기 위한 분야별 학습모델을 생성한다.In addition, when the AI entity providing platform 100 generates the AI entity 200, it learns user characteristic information (that is, learning data) provided from a user to generate a learning model for each field for providing the service. .
이때, 상기 AI 개체 제공 플랫폼(100)은, 사용자 특성정보를 입력하기 위한 사용자 특성정보 입력 데이터 포맷을 사용자 인터페이스를 통해 해당 사용자의 사용자 단말(300)로 제공하며, 상기 사용자는 상기 제공받은 사용자 특성정보 입력 데이터 포맷을 토대로 해당 사용자의 사용자 특정정보를 입력함으로서, 상기 AI 개체(200)에 대한 분야별 학습모델을 생성할 수 있도록 한다.At this time, the AI object providing platform 100 provides the user characteristic information input data format for inputting the user characteristic information to the user terminal 300 of the corresponding user through the user interface, and the user is provided with the provided user characteristic By inputting user-specific information of the corresponding user based on the information input data format, it is possible to generate a field-specific learning model for the AI entity 200.
즉, 상기 AI 개체 제공 플랫폼(100)은 상기 사용자 특성정보를 미리 지정된 포맷으로 입력하도록 하여, 사용자의 성향에 따라 상기 각 분야별 학습모델에 대한 학습방법을 제시할 수 있도록 함으로써, 상기 각 분야별 학습모델을 생성하도록 하는 것이다. That is, the AI entity providing platform 100 allows the user characteristic information to be input in a predetermined format, thereby providing a learning method for the learning model for each field according to a user's preference, thereby learning the learning model for each field. Is to create
한편 상기 사용자 특성정보는, 시간대별로 사용자가 선호하는 TV 채널(예: 스포츠, 교양, 오락, 드라마, 다큐멘터리 등), 시간, 장소(예: 거실, 안방, 서제, 주방, 욕실 등) 및 날씨별로 사용자가 선호하는 조명밝기, 조명색, 조명의 온오프 시간 등을 포함하는 조명정보, 시간, 장소 및 날씨별로 사용자가 선호하는 냉난방온도, 상기 사용자가 선호하는 뉴스 분야(예: 경제, 스포츠, 연예 등) 및 인물, 시간 및 날씨 또는 기분에 따라 사용자가 선호하는 음악 장르(예: 대중음악, 클래식 등)와 아티스트, 주기적으로 금전을 지출해야 되는 지출정보(예: 모임 등으로 인한 정기적 회비, 관리비 등), 기상, 취침 시간, 계획한 일(예: 운동, 휴식, 공부 등), 기념일(예: 결혼기념일, 제사, 생일 등)을 포함하는 스케줄 정보, 사용자가 선호하는 상품, 인맥특성 등을 포함한다.On the other hand, the user characteristic information is the TV channel (eg, sports, culture, entertainment, drama, documentary, etc.) preferred by the user for each time zone, time, place (eg, living room, master room, calligraphy, kitchen, bathroom, etc.) and weather Lighting information including user's preferred lighting brightness, lighting color, lighting on/off time, user's preferred cooling/heating temperature by time, place and weather, and news areas preferred by the user (eg economy, sports, entertainment, etc.) ) And the music genre (e.g. popular music, classical music, etc.) and artists preferred by the user depending on the person, time, weather, or mood. ), schedule information including weather, bedtime, planned work (e.g. exercise, rest, study, etc.), anniversary (e.g. wedding anniversary, ritual, birthday, etc.), user's preferred product, and personality characteristics do.
또한 상기 AI 개체 제공 플랫폼(100)은, 상기 사용자 특성정보 입력 데이터 포맷을 토대로 상기 사용자 특성정보가 입력되는 경우, 상기 사용자 특성정보를 각 분야별 학습모델에 적용할 수 있도록 각 분야별로 상기 사용자 특성정보를 분류한다.In addition, the AI entity providing platform 100, when the user characteristic information is input based on the user characteristic information input data format, the user characteristic information for each field so that the user characteristic information can be applied to the learning model for each field Classify.
이후, 상기 AI 개체 제공 플랫폼(100)은, 상기 분류한 각 분야별 사용자 특성정보를 각 분야별 강화학습 네트워크를 통해 학습함으로써, 상기 각 분야별 학습모델을 생성하게 된다.Thereafter, the AI entity providing platform 100 generates the learning model for each field by learning the classified user characteristic information for each field through the reinforcement learning network for each field.
즉, 상기 사용자 특성정보는, 사용자의 성향에 따라 다양한 서비스를 제공하기 위해 해당 AI 개체(200)에 대한 분야별 학습모델의 학습데이터로 활용되는 것이다.That is, the user characteristic information is used as learning data of a field-specific learning model for the corresponding AI entity 200 in order to provide various services according to a user's preference.
이를 통해 상기 AI 개체(200)는, 상기 각 분야별 학습모델을 이용하여, 미리 설정한 시간 및 사용자의 성향에 따라 자동으로, 특정 정보(예: 뉴스, 인물, 날씨)를 검색하여 제공하거나, 특정 IoT 기기(400)를 자동으로 제어하거나, 특정 스케줄이나, 지출내역에 대한 보고를 수행하거나, 음악 등을 추천할 수 있다.Through this, the AI entity 200 automatically searches for and provides specific information (for example, news, people, weather) according to a preset time and a user's preference using the learning model for each field, or The IoT device 400 may be automatically controlled, report on a specific schedule, expenditure history, or recommend music.
상기 AI 개체(200)는, 상기 생성한 학습모델에 대한 지속적인 강화학습을 통해 독립적인 개체로 진화하게 되는데, 상기 강화학습은 사용자와의 인터랙션을 통해 수행된다.The AI entity 200 evolves into an independent entity through continuous reinforcement learning on the generated learning model, and the reinforcement learning is performed through interaction with a user.
상기 인터랙션은, 상기 AI 개체(200)에 대한 사용자의 요청명령을 인식하고, 상기 인식한 요청명령에 대한 상기 각 분야별 적어도 하나 이상의 서비스를 제공하는 과정을 의미하는 것으로, 상기 요청명령을 인식하여 상기 서비스를 제공한 경우, 이에 대한 결과를 토대로 상기 강화학습을 수행한다.The interaction refers to a process of recognizing a user's request command for the AI entity 200 and providing at least one service for each field for the recognized request command. When a service is provided, the reinforcement learning is performed based on the result.
즉, 상기 AI 개체 제공 플랫폼(100)은, 상기 사용자와 상기 AI 개체(200)사이의 인터랙션을 수행하면, 해당 인터랙션에 대한 결과를 토대로 상기 각 분야별 학습모델의 가중치를 조정하여 해당 학습모델에 대한 강화학습을 지속적으로 수행함으로써, 해당 AI 개체(200)를 점진적으로 진화시킬 수 있도록 한다.That is, when the AI entity providing platform 100 performs an interaction between the user and the AI entity 200, based on the result of the interaction, the weight of the learning model for each field is adjusted to adjust the weight for the corresponding learning model. By continuously performing reinforcement learning, the corresponding AI entity 200 can be gradually evolved.
이를 통해, 상기 AI 개체 제공 플랫폼(100)은 해당 사용자의 성향에 맞도록 상기 AI 개체(200)를 고도화시켜 가며, 해당 사용자의 니즈에 적합한 서비스를 제공할 수 있도록 한다.Through this, the AI entity providing platform 100 advances the AI entity 200 to suit the user's propensity and provides a service suitable for the user's needs.
한편 상기 강화학습은 상기 인터랙션결과를 이용하는 것 이외에, 상기 AI 개체(200)의 자가학습, 참여학습, 지도학습 및 자율학습을 통해서도 수행되며, 이를 통해 상기 AI 개체(200)는 더욱 고도화되고 독립적인 개체로 진화된다.Meanwhile, in addition to using the interaction result, the reinforcement learning is also performed through self-learning, participatory learning, supervised learning, and autonomous learning of the AI entity 200, through which the AI entity 200 is more highly advanced and independent. It evolves into an individual.
또한 상기 자가학습은, 상기 사용자와의 인터랙션을 토대로 자동으로 수행되는 것으로, 사용자의 위치, 상기 제공한 서비스의 선택빈도(예를 들어, 적어도 하나 이상의 음악을 추천한 경우, 특정 음악을 선택하여 사용한 사용빈도), 사용자가 자주 사용한 키워드(예: 특정 음악 장르(예: 대중음악)에 대한 키워드 등) 등을 학습하여 사용자에게 현재 위치에 대한 맛 집, 음악 등을 사용자가 선호하는 서비스를 제공할 수 있도록 학습하는 것을 의미한다.In addition, the self-learning is automatically performed based on the interaction with the user, where the user's location and the frequency of selection of the provided service (for example, when at least one music is recommended, select and use specific music) Frequency of use), keywords frequently used by users (e.g. keywords for specific music genres (e.g. popular music), etc.) to provide users with services that users prefer to taste, music, etc. for their current location. It means learning to help.
또한 상기 자가학습은, 상기 사용자의 특성정보와 해당 사용자의 특성정보와 관련된 또 다른 정보를 웹상으로부터 자동으로 수집하고, 상기 수집한 또 다른 정보를 상기 사용자의 특성정보에 적용하여 해당 사용자에 대한 다양한 서비스를 제공할 수 있도록 수행될 수 도 있다.In addition, the self-learning automatically collects other information related to the user's characteristic information and the user's characteristic information from the web, and applies the collected other information to the user's characteristic information to provide various information for the user. It can also be performed to provide services.
예를 들어, 특정 날씨 상기 AI 개체(200)가 날씨별로 사용자가 선호하는 냉난방온도 또는 조명정보 및 음악에 대한 사용자 특성정보를 토대로 특정 IoT 기기(400)를 제어하거나, 음악을 추천하고자 할 때, 상기 AI 개체(200)는 기상청이나, 웹상으로부터 현재 시간에서의 날씨정보(즉, 온도, 습도 등)를 수집하고, 상기 수집한 날씨정보와 상기 사용자의 특성정보를 매칭하여 상기 학습모델에 적용함으로써, 해당 사용자의 특성에 따라 복수의 IoT 기기(400)를 제어하거나, 특정 음악을 추천할 수 있도록 하는 것이다.For example, when a specific weather, the AI entity 200 controls a specific IoT device 400 based on the user's preferred air-conditioning temperature or lighting information and music-specific information for each weather, or when recommending music, The AI entity 200 collects weather information (ie, temperature, humidity, etc.) at the current time from the Korea Meteorological Administration or the web, and matches the collected weather information with the user's characteristic information to apply to the learning model. , To control a plurality of IoT devices 400 according to the characteristics of the user, or to recommend a specific music.
또한 상기 참여학습은, 상기 AI 개체(200)가 사전에 정의된 심리테스트 또는 취향게임 등과 같은 상기 사용자의 식성이나 선호하는 상품, 음악, 친구의 성향 등을 분석하여 학습하는 것을 의미하며, 상기 AI 개체(200)는, 상기 참여학습을 통해 해당 사용자에게 적합한 음식, 상품, 음악, 친구 등을 추천할 수 있도록 진화될 수 있다.In addition, the participatory learning means that the AI entity 200 analyzes and learns by analyzing the user's dietary preferences, music, and friend preferences, such as a predefined psychological test or taste game, and the AI The object 200 may be evolved to recommend food, products, music, friends, etc. suitable for the user through the participation learning.
또한 상기 지도학습은, 상기 사용자로부터 입력받은 사용자 특성정보를 학습하여, 학습한 결과에 따라 해당 사용자에게 상기 서비스를 제공하기 위해 수행된다.In addition, the supervised learning is performed to learn user characteristic information received from the user and provide the service to the corresponding user according to the learned result.
예를 들어, 시간대별로 사용자가 선호하는 TV 채널(예: 스포츠, 교양, 오락, 드라마, 다큐멘터리 등)에 대한 사용자 특성정보를 학습한 AI 개체(200)는, 현재 시간에서 사용자가 선호하는 적어도 하나 이상의 TV 채널을 추천할 수 있다.For example, the AI entity 200 that has learned the user characteristic information for a TV channel (eg, sports, culture, entertainment, drama, documentary, etc.) preferred by the user for each time zone, at least one preferred by the user at the current time The above TV channels can be recommended.
또한 상기 자율학습은, 상기 AI 개체(200)가 자율적으로 학습하여, 이에 대한 정보를 사용자에게 제공하기 위해 수행되는 것으로, 상기 사용자가 제공한 SNS 상에서의 친구에 대한 인맥정보를 토대로 특정 친구가 새 글이나 기념일등을 업데이트하는 경우, 이에 대한 정보를 상기 사용자에게 제공하거나, 최근 이슈가 되는 뉴스정보 등을 추천할 수 있도록 진화될 수 있다.In addition, the self-learning is performed by the AI entity 200 to autonomously learn and provide information to the user, based on the social networking information about the friend on the SNS provided by the user. When an article or anniversary is updated, it may be evolved to provide information to the user or to recommend news information, which is a recent issue.
또한 상기 AI 개체(200)는 사용자의 SNS 상의 인맥정보를 학습하여, 해당 사용자와 교류 빈도수가 높은 인맥에 대한 가족, 직장, 학교, 위치, 취향을 분석하여 상기 사용자에게 제공할 수 있도록 구현될 수 있으며, 해당 인맥에 대한 교육도, 친밀도, 전문성을 포함하는 역량을 분석하여 상기 사용자에게 제공할 수 있도록 구현될 수 있다.In addition, the AI entity 200 may be implemented to learn the social network information on the user's SNS, analyze the family, work, school, location, and tastes of the social network that has a high frequency of interaction with the user and provide it to the user. In addition, education for the corresponding network can be implemented to analyze the capabilities including intimacy and expertise and provide them to the user.
즉, 상기 AI 개체(200)는, 상기 사용자와의 인터랙션, 자가학습, 참여학습, 지도학습 및 자율학습을 통해 더욱 고도화되고 독립적인 개체로 진화되는 것이다.That is, the AI entity 200 is evolved into a more advanced and independent entity through interaction with the user, self-learning, participatory learning, supervised learning, and autonomous learning.
또한 상기 AI 개체(200)는, 상기 강화학습의 결과에 따라 사용자의 특성을 기반으로 SNS 상에서 독립적인 개체로 활동할 수 있으며, 타 사용자의 SNS 활동에 대한 추천활동을 수행하거나, 타 AI 개체(200)와의 교류를 통해 상기 사용자와 독립적인 개체로 진화할 수 있다.In addition, the AI entity 200 may act as an independent entity on the SNS based on the characteristics of the user according to the result of the reinforcement learning, perform a recommendation activity for the SNS activity of another user, or another AI entity 200 ) To evolve into an entity independent of the user.
즉, 상기 AI 개체(200)는, 사용자의 인맥정보를 토대로 사용자의 취향이나 특성에 따라 타 사용자 또는 타 AI 개체(200)와의 교류를 통해 AI 개체(200)만의 인맥을 형성하거나, 커뮤니티를 형성할 수 있도록 진화될 수 있다.That is, the AI entity 200 forms a network of only the AI entity 200 through an interaction with another user or another AI entity 200 based on the user's personal preferences or characteristics based on the user's social network information, or forms a community It can be evolved to do it.
또한 상기 AI 개체(200)는 상기 강화학습을 통해 미리 설정한 시간에 따라 자동으로 상기 서비스를 제공하거나, 사용자와의 인터랙션을 통해 상기 사용자가 요청명령을 입력하면, 해당 요청명령을 인식하여 상기 인식한 요청명령에 따라 사익 서비스를 제공할 수 있도록 구현된다.In addition, the AI entity 200 automatically provides the service according to a preset time through the reinforcement learning, or when the user inputs a request command through interaction with a user, recognizes the request command and recognizes the service It is implemented to provide private service according to one request order.
즉, 상기 AI 개체(200)는, 미리 설정한 시간에 따라 상기 각 분야별 학습모델을 이용하여, 미리 설정된 조건(예: 현재 시간정보)을 상기 각 분야별 학습모델에 입력하고, 상기 각 분야별 학습모델에서 출력되는 출력 데이터를 토대로 상기 서비스를 자동으로 제공할 수 있다.That is, the AI entity 200 inputs a preset condition (eg, current time information) into the learning model for each field using the learning model for each field according to a preset time, and the learning model for each field The service may be automatically provided based on the output data output from.
예를 들어, 기상 시간(예: 오전 6시)에 뉴스를 추천하도록 설정된 경우, 상기 AI 개체(200)는 뉴스 추천용 학습모델에 현재 시간정보를 입력한다. 이때, 상기 뉴스 추천용 학습모델은, 상기 강화학습의 결과에 따라 상기 사용자가 선호하는 적어도 하나 이상의 뉴스분야 및 인물을 출력하게 된다. 이후, 상기 AI 개체(200)는 해당 뉴스분야 및 인물에 대한 뉴스를 웹상에서 검색하여 해당 검색한 결과를 상기 사용자에게 제공함으로써, 해당 뉴스에 대한 추천 서비스를 사용자에게 제공하게 되는 것이다.For example, when it is set to recommend news at a wake-up time (eg, 6 AM), the AI entity 200 inputs current time information into a learning model for recommending news. At this time, the learning model for recommending news outputs at least one news field and person preferred by the user according to the result of the reinforcement learning. Thereafter, the AI entity 200 searches for news on the news field and person on the web and provides the search result to the user, thereby providing a recommendation service for the news to the user.
또한 상기 AI 개체(200)는 상기 인터랙션을 통해 추천 서비스를 제공하고자 하는 경우, 상기 사용자 요청명령으로부터 키워드를 추출하고, 상기 추출한 키워드와 미리 설정된 각 추천분야별 적어도 하나 이상의 대표 키워드와 비교하여 상기 비교한 결과에 따라 해당 사용자 요청명령이 어떠한 추천분야에 대한 추천서비스를 제공받고자 하는 지를 인식한다.In addition, when the AI entity 200 wants to provide a recommendation service through the interaction, the keyword is extracted from the user request command, and compared with the extracted keyword and at least one representative keyword for each preset recommended field. Depending on the result, it recognizes which recommendation service the user request command wants to receive.
예를 들어, 음악 추천을 위한 대표 키워드가 "음악", "노래", "음원"으로 설정되어 있고, 사용자가 "음악을 추천해죠"라는 요청명령을 입력한 경우, 상기 요청명령으로부터 "음악"이라는 키워드가 추출된 경우, 상기 비교과정을 통해 해당 사용자의 요청명령이 음악 추천을 받고자 하는 것임을 인식하게 되는 것이다.For example, if a representative keyword for recommending music is set to "music", "song", and "sound source", and the user inputs a request command "recommended music", "music" from the request command When the keyword "is extracted", the comparison process recognizes that the user's request command is to receive a music recommendation.
이때, 상기 음악 추천용 학습모델은 상기 강화학습의 결과에 따라 사용자가 선호하는 적어도 하나 이상의 음악 장르 및 아티스트를 출력하게 된다. 이후, 상기 AI 개체(200)는 해당 음악 장르 및 해당 음악 장르에 대한 아티스트에 대한 음원을 웹상에서 검색하여 추천 하거나, 기존에 저장된 음원을 추천함으로서, 해당 음악에 대한 추천 서비스를 사용자에게 제공하게 되는 것이다.At this time, the learning model for music recommendation outputs at least one music genre and artist preferred by the user according to the result of the reinforcement learning. Subsequently, the AI entity 200 provides a recommendation service for the music to the user by retrieving and recommending the music genre and the music source for the artist for the music genre on the web, or recommending an existing stored sound source. will be.
이때, 상기 사용자 요청명령은 음성 또는 텍스트로 입력될 수 있으며, 상기 AI 개체(200)는 상기 입력되는 음성 및 텍스트를 인식하여 상기 키워드를 추출하게 된다.At this time, the user request command may be input by voice or text, and the AI entity 200 recognizes the input voice and text to extract the keyword.
한편 상기 음성 또는 텍스트를 인식하여 키워드를 추출하는 것은, HMM(hidden markov model) 모델과 같이 미리 구축된 언어모델과 형태소 분석을 통해 수행될 수 있다. 다만, 본 발명에서 상기 음성 또는 텍스트를 인식하여 키워드를 추출하는 방법에 대해서는 그 제한을 두지 아니한다.Meanwhile, extracting a keyword by recognizing the voice or text may be performed through a pre-built language model and a morpheme analysis, such as a hidden markov model (HMM) model. However, in the present invention, the method for extracting keywords by recognizing the voice or text is not limited.
또한 상기 인터랙션을 통해 상기 서비스를 제공하는 경우, 상기 AI 개체(200)가 적용된 AI 디바이스에 구비되는 카메라, 지문센서, 마이크 또는 키패드를 통해 미리 설정된 특정 제스처를 취하거나, 지문인증을 수행하거나, 상기 설정한 AI 개체(200)의 호칭을 호명하여, 상기 AI 개체(200)를 활성화시킨 후, 상기 음성 또는 텍스트를 입력함으로서, 상기 서비스를 제공 받을 수 있다.In addition, when the service is provided through the interaction, a predetermined gesture is performed through a camera, fingerprint sensor, microphone, or keypad provided in the AI device to which the AI entity 200 is applied, fingerprint authentication is performed, or the The name of the set AI entity 200 is called, and after activating the AI entity 200, the service may be provided by inputting the voice or text.
또한 상기 AI 개체(200)는, 상기 강화학습을 수행한 결과를 토대로 사용자의 가정이나 사무실 또는 학교 등에 구비되는 복수의 IoT 기기(400)를 자동으로 제어하고자 하는 경우, 현재 시간정보 또는 날씨정보를 상기 IoT 기기 제어용 학습모델에 입력하여 상기 IoT 기기(400)를 제어하기 위한 제어정보를 상기 사용자에게 추천하여 선택하도록 함으로써, 상기 IoT 기기(400)를 제어하거나, 상기 제어정보에 따라 상기 IoT 기기(400)를 자동으로 제어할 수 있도록 한다.In addition, the AI entity 200, based on the result of performing the reinforcement learning, to automatically control the plurality of IoT devices 400 provided in the user's home, office, or school, displays current time information or weather information. By inputting the learning model for controlling the IoT device to control and select the control information for controlling the IoT device 400 to the user, to control the IoT device 400, or according to the control information, the IoT device ( 400) can be controlled automatically.
이때, 상기 AI 개체(200)는, 홈 네트워크 게이트웨이에 접속하여 상기 사용자의 선택에 따라 특정 IoT 기기(400)를 제어하기 위한 제어정보를 해당 IoT 기기(400)로 전송함으로서, 원격에서 상기 IoT 기기(400)를 자동으로 제어할 수 있도록 한다.At this time, the AI entity 200 accesses a home network gateway and transmits control information for controlling a specific IoT device 400 to the corresponding IoT device 400 according to the user's selection, so that the IoT device remotely It is possible to automatically control the 400.
한편 상기 인터랙션을 통해 인식되는 요청명령이 특정 서비스에 대한 대상을 지정하거나, IoT 기기(400)에 대한 직접적인 제어정보가 포함되어 있는 경우, 상기 지정한 대상을 자동으로 검색하여 제공하거나, 상기 제어정보를 토대로 상기 IoT 기기(400)를 자동으로 제어할 수 있도록 구현될 수 있다.On the other hand, when the request command recognized through the interaction designates a target for a specific service or includes direct control information for the IoT device 400, the specified target is automatically searched for and provided, or the control information is provided. Based on this, it may be implemented to automatically control the IoT device 400.
예를 들어, 상기 사용자가 음성이나 텍스트로 "거실의 온도를 27도로 설정"이라는 요청명령을 입력하거나, 특정 음악제목을 명시하여 음악을 요청하는 경우, 하는 경우, 상기 AI 개체(200)는, 상기 요청명령으로부터 "거실", "온도", "27도"라는 키워드를 추출하여, 거실의 온도를 27도로 유지하기 위해 난방장치에 대한 제어정보를 생성하여 해당 난방장치로 상기 생성한 제어정보를 전송함으로서, 상기 거실의 온도를 27도로 유지할 수 있도록 하거나, 상기 특정 음악제목에 대한 음원을 검색하여 상기 사용자에게 상기 검색한 음원을 제공할 수 있도록 하는 것이다.For example, when the user inputs a request command such as "Set the temperature of the living room to 27 degrees" by voice or text, or when requesting music by specifying a specific music title, the AI entity 200 may: By extracting the keywords "living room", "temperature", and "27 degrees" from the request command, control information for the heating device is generated to maintain the temperature of the living room at 27 degrees, and the generated control information is generated by the corresponding heating device. By transmitting, the temperature of the living room can be maintained at 27 degrees, or the sound source for the specific music title is searched to provide the searched sound source to the user.
이를 통해 상기 AI 개체(200)는, 사용자가 원하는 음악을 추천하거나, 사용자의 가정, 사무실 또는 학교에서 사용자를 대신하여 적어도 하나 이상의 IoT 기기(400)를 상기 사용자가 원하는 시간과 방법으로 동작시키도록 하거나, 또한 적어도 하나 이상의 IoT 기기(400)에 대한 동작을 설정하여 상기 사용자가 원하는 가정, 사무실 또는 학교의 환경을 유지할 수 있도록 한다. Through this, the AI entity 200 recommends music desired by the user or operates at least one IoT device 400 on the user's home, office, or school on behalf of the user at a time and method desired by the user. Alternatively, an operation for at least one IoT device 400 is set so that the user can maintain a desired home, office, or school environment.
또한 미리 설정한 시간(예: 아침 6시)에 따라 해당 사용자의 스케줄을 체크하여 해당 사용자가 해야 할 일을 추천하도록 설정된 경우, 상기 AI 개체(200)는, 스케줄 추천용 학습모델에 미리 설정한 조건정보(예: 현재 시간정보)를 입력한다. 이때, 상기 스케줄 추천용 학습모델은, 상기 강화학습의 결과에 따라 해당 사용자의 스케줄 정보를 시간별, 날짜별로 출력하게 된다. 이후, 상기 AI 개체(200)는 상기 출력한 스케줄 정보를 미리 설정한 기간(예: 하루, 일주일, 한 달)에 따라 적어도 하나 이상으로 선택하여 상기 사용자에게 제공함으로써, 해당 사용자가 상기 스케줄 정보에 따라 해야 할 일을 추천하게 된다.In addition, if the user's schedule is set according to a preset time (for example, 6 am) to set a recommendation for a task to be performed by the user, the AI entity 200 is preset in the learning model for schedule recommendation. Enter the condition information (eg current time information). At this time, the schedule recommendation learning model outputs schedule information of the corresponding user according to the time and date according to the result of the reinforcement learning. Subsequently, the AI entity 200 selects at least one of the output schedule information according to a preset period (eg, one day, one week, one month) and provides it to the user, so that the corresponding user is connected to the schedule information. You will be recommended to follow.
또한 상기 인터랙션을 통해 사용자가 스케줄 정보에 대한 요청명령을 수행하면, 상기 AI 개체(200)는 상기 요청명령으로부터 키워드를 추출하고, 상기 추출한 키워드(예: "스케줄", "일정")와 상기 복수의 대표 키워드를 비교하여 해당 요청명령이 스케줄 추천에 대한 요청인 것으로 인식하고, 시간정보를 상기 스케줄 추천용 학습모델에 입력함으로써, 해당 요청명령에 대한 스케줄 정보를 추출하여 상기 사용자에게 제공할 수 있다.In addition, when the user performs a request command for schedule information through the interaction, the AI entity 200 extracts a keyword from the request command, and extracts the keyword (eg, "schedule", "schedule") and the plurality By comparing the representative keywords of, it is recognized that the request command is a request for schedule recommendation, and by inputting time information into the learning model for schedule recommendation, schedule information for the request command can be extracted and provided to the user. .
예를 들어, 스케줄 추천에 대한 대표 키워드가 "스케줄", "일정", "기념일"로 설정되어 있고, 상기 사용자가 "오늘 스케줄 체크"라는 요청명령을 텍스트 또는 음성으로 입력하는 경우, 상기 AI 개체(200)는, "오늘", "스케줄"이라는 키워드를 상기 요청명령으로부터 추출하고, 상기 대표 키워드와 상기 추출한 키워드를 비교하여 해당 요청명령이 스케줄 추천에 대한 것임을 인식한다.For example, when the representative keyword for the schedule recommendation is set to "schedule", "schedule", and "anniversary", and the user inputs a request command "check today's schedule" by text or voice, the AI entity (200) extracts the keywords "today" and "schedule" from the request command, and compares the representative keyword with the extracted keyword to recognize that the request command is for schedule recommendation.
이후, 상기 AI 개체(200)는, 스케줄 추천용 학습모델에 현재 시간정보를 입력하여 오늘에 대한 스케줄 정보를 추출하고, 상기 추출한 오늘에 대한 스케줄 정보를 사용자에게 제공함으로써, 오늘 해야 할 일을 추천하게 된다.Subsequently, the AI entity 200 recommends what to do today by inputting current time information into a schedule recommendation learning model to extract schedule information for today and providing schedule information for the extracted today to the user. Is done.
한편 상기 학습모델은 ANN(artificial neural network), CNN(convolutional neural network) 또는 RNN(recurrent neural network)을 포함하는 기계학습 알고리즘을 통해 생성되며, 상기에서 설명한 봐와 같이, 특정 서비스에 특화된 적어도 하나 이상의 분야별 학습모델을 포함한다.Meanwhile, the learning model is generated through a machine learning algorithm including an artificial neural network (ANN), a convolutional neural network (CNN), or a recurrent neural network (RNN), and as described above, at least one or more specialized for a specific service Includes sectoral learning models.
상기에서 설명한 것과 같이, 본 발명의 AI 개체 제공 플랫폼(100)은, 상기 생성한 AI 개체(200)에 대한 강화학습을 지속적으로 수행함으로써, 해당 사용자의 특성이나 성향에 적합하도록 점점 고도화되어 사용자의 니즈에 적합한 적어도 하나 이상의 서비스를 제공하게 된다.As described above, the AI object providing platform 100 of the present invention is gradually advanced to suit the characteristics or inclinations of the user by continuously performing reinforcement learning on the created AI object 200. It will provide at least one service suitable for your needs.
도 2는 본 발명의 일 실시예에 따른 AI 개체에 대한 강화학습을 수행하는 방법을 설명하기 위해 나타낸 도면이다.2 is a view illustrating a method for performing reinforcement learning on an AI entity according to an embodiment of the present invention.
도 2에 도시한 바와 같이, 본 발명의 일 실시예에 따른 AI 개체 제공 플랫폼(100)을 이용하여 상기 AI 개체(200)에 대한 강화학습을 수행하는 과정은 우선, 상기 사용자는 AI 개체 제공(100)으로부터 제공되는 인공지능 애플리케이션을 사용자 단말(300)에 설치하고, 상기 설치한 인공지능 애플리케이션을 실행하여 상기 AI 개체 제공 플랫폼(100)에 접속한 후, 해당 사용자의 인증정보 및 개인정보를 상기 AI 개체 제공 플랫폼(100)으로 제공하여, 상기 AI 개체 제공 플랫폼(100)을 통해 AI 개체(200)를 생성하기 위한 생성요청을 전송한다(①).As shown in FIG. 2, the process of performing reinforcement learning on the AI entity 200 using the AI entity providing platform 100 according to an embodiment of the present invention is first, the user provides the AI entity ( After installing the artificial intelligence application provided from 100) to the user terminal 300, and running the installed artificial intelligence application to access the AI object providing platform 100, the authentication information and personal information of the user Provided to the AI entity providing platform 100, the creation request for creating the AI entity 200 is transmitted through the AI entity providing platform 100 (①).
이때, 상기 사용자는 상기 AI 개체 제공 플랫폼(100)으로부터 제공되는 커스터마이징 정보를 이용하여, AI 개체(200)에 대한 모델링 과정을 수행함으로서, 캐릭터 또는 아바타로 구현되는 AI 개체(200)를 생성할 수 있도록 한다.At this time, the user may create an AI entity 200 implemented as a character or an avatar by performing a modeling process for the AI entity 200 using customizing information provided from the AI entity providing platform 100. To make.
상기 AI 개체(200)는, 상기 AI 개체 제공 플랫폼(100)에 구비되는 장소(예: 사용자의 가정, 사무실 또는 학교 등)에 따라 복수의 사용자별로 생성되며, 상기 생성한 AI 개체(200)가 상기 AI 개체 제공 플랫폼(100)에 적용되어, 해당 AI 개체 제공 플랫폼(100)이 상기 AI 개체(200)의 기능을 수행하도록 구현될 수 있다.The AI entity 200 is generated for a plurality of users according to a place (for example, a user's home, office, or school) provided in the AI entity providing platform 100, and the created AI entity 200 is Applied to the AI entity providing platform 100, the AI entity providing platform 100 may be implemented to perform the function of the AI entity 200.
또한 상기 생성한 AI 개체(200)는, 상기 사용자 단말(300)에 적용되거나, SNS 서비스를 제공하는 클라우드 플랫폼이나 웹서버에 적용되어, 상기 AI 개체 제공 플랫폼(100)과의 연동을 통해 상기 AI 개체(200)의 기능을 수행할 수 있도록 구현될 수 있다.In addition, the created AI entity 200 is applied to the user terminal 300 or is applied to a cloud platform or web server providing SNS service, and the AI is provided through interworking with the AI entity providing platform 100. It may be implemented to perform the function of the object 200.
또한 상기 AI 개체 제공 플랫폼(100)은 사용자 특성정보를 입력하기 위한 데이터 포맷을 사용자 인터페이스를 통해 상기 사용자 단말(300)로 제공(②)하고, 상기 사용자는 상기 데이터 포맷을 통해 사용자 특성정보를 생성하여 상기 AI 개체 제공 플랫폼(100)으로 전송한다(③).In addition, the AI entity providing platform 100 provides (②) a data format for inputting user characteristic information to the user terminal 300 through a user interface, and the user generates user characteristic information through the data format. To the AI entity providing platform 100 (③).
한편 상기 AI 개체(200)는 해당 AI 개체(200)에 대한 분야별 학습모델을 포함하며, 상기 각 분야별 학습모델은 사용자에게 다양한 서비스를 제공하기 위해 생성되는 것으로, 상기 AI 개체 제공 플랫폼(100)은, 사용자로부터 입력되는 사용자 특성정보를 각 분야별로 학습하여 상기 각 분야별 학습모델을 생성한다.Meanwhile, the AI entity 200 includes a learning model for each field of the AI entity 200, and the learning model for each field is generated to provide various services to a user, and the AI entity providing platform 100 , Learning user characteristic information input from a user for each field to generate a learning model for each field.
즉, 상기 강화학습모델은, 사용자의 특성정보를 토대로 생성되는 것으로, 상기 AI 개체 제공 플랫폼(100)으로부터 제공된 데이터 포맷을 토대로 해당 사용자가 자신의 특성정보를 선택하거나, 텍스트로 입력함으로써, 생성되고 상기 AI 개체 제공 플랫폼(100)으로 전송된다.That is, the reinforcement learning model is generated based on the user's characteristic information, and is generated by the user selecting his characteristic information or inputting it as text based on the data format provided from the AI entity providing platform 100 It is transmitted to the AI entity providing platform 100.
한편, 상기 분야별 학습모델은, 상기 사용자 단말(300)로부터 최초 입력되는 사용자 특성정보를 학습하여 생성되는 것이다. 이후 지속적으로 입력되는 사용자 특성정보는 상기 생성한 각 분야별 학습모델에 대한 강화학습을 수행하기 위한 강화학습 데이터로써, 사용될 수 있다.Meanwhile, the learning model for each field is generated by learning user characteristic information that is initially input from the user terminal 300. Thereafter, the continuously input user characteristic information may be used as reinforcement learning data for performing reinforcement learning for the learning model for each field.
예를 들어, 상기 사용자 특성정보가, 시간대별로 사용자의 선호도(점수)를 포함하는 TV 채널(예: 스포츠, 교양, 오락, 드라마, 다큐멘터리 등)에 대한 것이면, 해당 사용자 특성정보를 TV 채널 추천용 학습 네트워크를 통해 학습함으로써, 해당 사용자에게 TV 채널을 시간대별로 추천하기 위한 TV 채널 추천용 학습모델을 생성하게 된다.For example, if the user characteristic information is for a TV channel (eg, sports, culture, entertainment, drama, documentary, etc.) that includes a user's preference (score) for each time period, the user characteristic information is recommended for TV channel By learning through a learning network, a learning model for TV channel recommendation is generated to recommend TV channels to corresponding users by time zone.
이때, 상기 TV 채널 추천용 학습 네트워크의 입력은 미리 설정한 조건정보(예: 현재 시간정보)가 되며, 출력은 선호도가 높은 적어도 하나 이상의 TV 채널이 된다.At this time, the input of the learning channel for TV channel recommendation becomes preset condition information (eg, current time information), and the output becomes at least one TV channel having high preference.
또 다른 예로써, 상기 사용자 특성정보가 시간 및 장소별(예: 거실, 안방, 서재, 주방, 욕실)로 선호하는 조명 밝기, 조명색, 온오프 시간 등에 대한 선호도를 포함하는 조명제어정보 또는 시간 및 장소별로 냉난방 온도값에 대한 선호도를 포함하는 온도제어정보인 경우, 해당 사용자의 특성정보를 IoT 기기(400) 제어용 학습 네트워크를 통해 학습함으로서, 해당 사용자에게 특정 IoT 기기(400)를 제어하기 위한 제어정보를 추천하게 된다.As another example, the lighting control information or time, wherein the user characteristic information includes preferences for preferred lighting brightness, lighting color, and on/off time by time and place (eg, living room, master room, study, kitchen, bathroom), and In the case of temperature control information including preferences for heating and cooling temperature values for each place, by controlling characteristic information of the user through a learning network for controlling the IoT device 400, control for controlling a specific IoT device 400 to the corresponding user Information will be recommended.
이때, 상기 IoT 기기(400) 제어용 강화학습 네트워크의 입력은 시간정보, 날씨정보가 될 수 있으며, 출력은 선호도가 높은 적어도 하나 이상의 IoT 기기(400)에 대한 제어정보가 된다.At this time, the input of the reinforcement learning network for controlling the IoT device 400 may be time information and weather information, and the output is control information for at least one IoT device 400 having high preference.
또 다른 예로써, 상기 특성정보가 시간대별, 날씨별 또는 사용자의 감성에 따라 선호하는 음악 장르(예: 대중음악, 클래식 등)에 대한 것인 경우, 해당 사용자의 특성정보를 음악 추천용 학습 네트워크를 통해 학습함으로써, 해당 사용자에게 적어도 하나 이상의 음악을 추천하기 위한 음악 추천용 학습모델을 생성한다.As another example, if the characteristic information is for a preferred music genre (eg, popular music, classical music, etc.) according to time, weather, or user's sensitivity, the learning network for recommending music to the user's characteristic information By learning through, a learning model for recommending music is generated to recommend at least one piece of music to a corresponding user.
이때, 상기 음악 추천용 학습모델의 입력은, 시간정보, 날씨정보, 감성정보 또는 이들이 조합이 될 수 있으며, 출력은 선호도가 높은 적어도 하나 이상의 음악 장르 및 아티스트 정보가 된다. 이후, 상기 AI 개체(200)는, 상기 출력한 음악 장르 및 아티스트 정보를 토대로 해당 AI 개체(200)와 연동된 음원 사이트에 접속하여 상기 음악 장르 및 해당 음악 장르에 대한 아티스트의 음원을 적어도 하나 이상으로 검색하여 상기 사용자에게 추천하게 된다.At this time, the input of the learning model for music recommendation may be time information, weather information, emotion information, or a combination thereof, and the output may be at least one music genre and artist information having high preference. Thereafter, the AI entity 200 accesses a sound source site linked to the AI entity 200 based on the output music genre and artist information to at least one or more music sources of the music genre and the artist for the music genre. Search by and recommend to the user.
또한 상기 생성한 AI 개체(200)는, 미리 설정한 조건(예를 들어, 상기 서비스를 제공받을 시간 등)에 따라 상기 분야별 학습모델을 이용하여 상기 서비스를 적어도 하나 이상으로 제공하거나, 또는 상기 사용자와의 인터랙션을 통해 상기 사용자로부터 입력되는 요청명령에 따라 상기 서비스를 적어도 하나 이상으로 제공한다(④).In addition, the created AI entity 200 provides at least one of the services using the learning model for each field according to a preset condition (for example, time to receive the service, etc.), or the user The service is provided in at least one according to a request command input from the user through interaction with (④).
또한 상기 AI 개체 제공 플랫폼(100)은 상기 AI 개체(200)를 통해 상기 사용자와의 인터랙션을 통해 특정 분야에 대한 서비스를 제공한 경우, 해당 인터랙션 결과를 상기 특정 분야에 대한 학습모델에 적용하여, 해당 학습모델에 대한 강화학습을 수행함으로써, 상기 AI 개체(200)가 고도화되고 진화될 수 있도록 한다.Further, when the AI entity providing platform 100 provides a service for a specific field through interaction with the user through the AI entity 200, the interaction result is applied to a learning model for the specific field, By performing reinforcement learning on the learning model, the AI entity 200 can be advanced and evolved.
예들 들어, 상기 AI 개체(200)는, 상기 지도학습을 통해 상기 특정 분야에 대한 서비스를 기본적으로 제공하지만, 사용자와 인터랙션을 하는 경우, 해당 사용자가 직접적으로 서비스 받고자 하는 대상을 지정할 수 있다. 즉, 해당 사용자가 요청명령으로 "특정 제목을 포함하는 음악을 요청"하는 경우 상기 AI 개체(200)는, 음원 사이트 등과 같이 음악을 제공하는 서버에서 상기 제목에 대한 음악을 검색하여 상기 사용자에게 제공하고, 해당 음악에 대한 사용자의 요청빈도가 높은 경우에는 해당 음악을 추천할 수 있도록 상기 음악 추천용 학습모델의 가중치를 조정함으로서, 상기 강화학습을 수행할 수 있다.For example, the AI entity 200 basically provides a service for the specific field through the supervised learning, but when interacting with a user, the user may directly designate an object to be serviced. That is, when the corresponding user requests "music containing a specific title" as a request command, the AI entity 200 retrieves music for the title from a server providing music, such as a sound source site, and provides it to the user In addition, when the user's request frequency for the corresponding music is high, the reinforcement learning can be performed by adjusting the weight of the learning model for recommending the music to recommend the corresponding music.
즉, 상기 AI 개체 제공 플랫폼(100)은 상기 AI 개체(200)와 상기 사용자가 인터랙션하면, 상기 인터랙션의 결과가 상기 각 분야별 학습모델에 입력(즉, 적용)되도록 함으로써, 상기 각 분야별 학습모델이 강화학습 되도록 하고, 이에 따라 상기 AI 개체(200)가 점진적으로 진화될 수 있도록 한다.That is, when the AI entity 200 and the user interact with the AI entity providing platform 100, the result of the interaction is input (ie, applied) to the learning model for each field, so that the learning model for each field is It is to be reinforced learning, and accordingly, the AI entity 200 can be gradually evolved.
한편, 상기 강화학습은, 상기 인터랙션 결과 이외에 AI 개체(200)에 대한 자가학습, 참여학습, 지도학습 및 자율학습을 통해 수행될 수 있음은 상술한 바와 같다.On the other hand, it is as described above that the reinforcement learning can be performed through self-learning, participatory learning, supervised learning, and autonomous learning on the AI entity 200 in addition to the interaction result.
또한 상기 AI 개체 제공 플랫폼(100)은, 상기 AI 개체(200)에 대한 지도학습을 통해 미리 설정한 조건에 따라 자동으로 상기 서비스를 사용자에게 제공하는 경우, 사용자가 서비스에 대한 특정 대상을 선택하거나, 선택 거절하는 경우, 상기 특정 대상에 대한 가중치를 조정함으로서, 상기 학습모델에 대한 강화학습을 수행할 수 있음은 상술한 바와 같다.In addition, when the AI entity providing platform 100 automatically provides the service to the user according to a preset condition through supervised learning on the AI entity 200, the user selects a specific target for the service or , If the selection is rejected, it is as described above that reinforcement learning for the learning model can be performed by adjusting the weight for the specific object.
또한 상기 사용자 단말(300)과 상기 SNS 상에 적용된 AI 개체(200)는 상기 강화학습을 수행한 각 분야별 학습모델을 이용하여 상기 서비스를 제공할 수 있도록 구현된다. In addition, the user terminal 300 and the AI entity 200 applied on the SNS are implemented to provide the service using a learning model for each field in which the reinforcement learning is performed.
도 3은 본 발명의 일 실시예에 따른 AI 개체 플랫폼을 통해 AI 개체를 진화시키는 과정을 설명하기 위해 나타낸 도면이다.3 is a view illustrating a process of evolving an AI entity through an AI entity platform according to an embodiment of the present invention.
도 3에 도시한 바와 같이, 본 발명의 일 실시예에 따른 AI 개체 플랫폼(100)을 통해 상기 생성한 AI 개체(200)를 진화시키는 과정은 우선, 사용자가 상기 AI 개체(200)를 이용하기 위해 우선적으로 해당 AI 개체(200)를 활성화 시킨다.As illustrated in FIG. 3, in the process of evolving the created AI entity 200 through the AI entity platform 100 according to an embodiment of the present invention, the user first uses the AI entity 200. In order to activate the corresponding AI entity 200 first.
상기 활성화는 미리 설정된 제스처를 수행하거나, 지문인식 또는 해당 AI 개체에 설정된 AI 개체(200)의 이름을 호명함으로써, 수행된다.The activation is performed by performing a preset gesture or by fingerprint recognition or calling the name of the AI entity 200 set in the corresponding AI entity.
다음으로, 상기 AI 개체(200)가 활성화 된 경우, 해당 사용자는 자신이 서비스 받고자 하는 서비스 분야에 대한 추천명령을 입력한다.Next, when the AI entity 200 is activated, the corresponding user inputs a recommendation command for a service field that he or she wants to receive service.
상기 추천명령은, 음성 또는 텍스트로 입력될 수 있으며, 음성으로 입력하고자 하는 경우, 상기 AI 개체(200)가 적용된 사용자 단말(300)이나 AI 개체 제공 플랫폼(100)에 마이크를 통해 수행될 수 있다.The recommendation command may be input by voice or text, and when input by voice, may be performed through a microphone to the user terminal 300 to which the AI entity 200 is applied or the AI entity providing platform 100. .
한편 사용자는 SNS 계정의 채팅기능이나, 상기 AI 개체(200)에서 자동으로 제공하는 채팅기능을 통해 상기 AI 개체(200)와의 채팅을 통해서 상기 추천명령을 텍스트로 입력할 수 있다. 이때, 상기 AI 개체(200)는 독립적인 개체로 상기 채팅에 참여하게 된다.Meanwhile, the user may input the recommendation command as text through a chat function of the SNS account or a chat function provided by the AI entity 200 automatically through the chat with the AI entity 200. At this time, the AI entity 200 participates in the chat as an independent entity.
다음으로 상기 AI 개체(200)는, 상기 입력되는 추천명령에 대한 음성 또는 텍스트를 인식하고, 상기 인식한 추천명령으로부터 키워드를 추출하여, 상기 추출한 키워드를 토대로 사용자가 요구하는 서비스 분야를 인식한다.Next, the AI entity 200 recognizes a voice or text for the input recommendation command, extracts a keyword from the recognized recommendation command, and recognizes a service field required by the user based on the extracted keyword.
즉, 상기 AI 개체(200)는, 상기 추천명령으로부터 추출한 적어도 하나 이상의 키워드와 미리 설정된 각 분야별 복수의 대표 키워드와 비교하여, 상기 비교결과에 따라 상기 추천 분야를 인식하는 것이다.That is, the AI entity 200 recognizes the recommended field according to the comparison result by comparing at least one keyword extracted from the recommendation command with a plurality of representative keywords for each predetermined field.
예를 들어, 음악 추천용 대표 키워드가 "노래", "음악"으로 설정되어 있고, 상기 추천명령으로부터 추출한 키워드가 "음악"인 경우, 상기 AI 개체(200)는, 상기 추천명령이 음악 추천 서비스로 인식한다.For example, when the representative keyword for recommending music is set to "song" and "music", and the keyword extracted from the recommendation command is "music", the AI entity 200 may recommend the recommendation command to the music recommendation service. Recognize as.
또 다른 예로써, 스케줄 추천용 대표 키워드가 "스케줄", "일정", "기념일" 등으로 설정되어 있고, 상기 추천명령으로부터 추출한 키워드가 "스케줄" 또는 "일정"인 경우, 상기 AI 개체(200)는 상기 추천명령이 스케줄 추천 서비스로 인식하게 되는 것이다.As another example, if the representative keyword for schedule recommendation is set to "schedule", "schedule", "anniversary", etc., and the keyword extracted from the recommendation command is "schedule" or "schedule", the AI entity 200 ) Means that the recommendation command is recognized as a schedule recommendation service.
또 다른 예로써, TV 채널 추천용 대표 키워드가 "채널", "TV", "드라마", "다큐멘터리", "오락" 등으로 설정되어 있고, 상기 추천명령으로부터 추출한 키워드가 "드라마"인 경우, 상기 AI 개체(200)는 상기 추천명령이 TV 채널 추천 서비스로 인식하게 되는 것이다.As another example, when the representative keyword for TV channel recommendation is set to "channel", "TV", "drama", "documentary", "entertainment", etc., and the keyword extracted from the recommendation command is "drama", The AI entity 200 recognizes the recommendation command as a TV channel recommendation service.
다음으로, 상기 AI 개체(200)는, 상기 인식한 서비스 분야에 대한 서비스를 사용자에게 제공한다.Next, the AI entity 200 provides a service for the recognized service field to the user.
예를 들어, 사용자가 "스포츠 채널 틀어"라는 요청명령을 음성이나 텍스트로 입력한 경우, 상기 AI 개체(200)는 특정 스포츠 채널을 자동으로 틀거나, 적어도 하나 이상의 스포츠 채널을 추천하여 사용자의 선택에 따라 특정 스포츠 채널을 시청할 수 있도록 하는 것이다.For example, when the user inputs a request command "Play sports channel" in voice or text, the AI entity 200 automatically turns on a specific sports channel or recommends at least one sports channel to select the user In accordance with this, it is possible to watch a specific sports channel.
이후, 상기 AI 개체 제공 플랫폼(100)은, 상기 제공한 서비스가 미리 설정한 빈도수 이상인 경우, 해당 분야의 학습모델에 적용되도록 함으로써, 해당 학습모델에 대한 강화학습을 수행하여, 상기 AI 개체(200)가 진화되도록 한다.Thereafter, the AI entity providing platform 100, when the provided service is equal to or more than a preset frequency, is applied to a learning model in a corresponding field, thereby performing reinforcement learning on the learning model, thereby providing the AI entity 200 ) To evolve.
즉, 상기 AI 개체 제공 플랫폼(100)은, 상기 인터랙션 결과가 해당 학습모델에 적용되도록 함으로써, 상기 학습모델에 대한 강화학습을 수행하도록 한다. 이를 통해 상기 AI 개체 제공 플랫폼(100)은, 상기 AI 개체(200)가 상기 강화학습을 통해 진화할 수 있도록 하는 것이다. That is, the AI entity providing platform 100 performs reinforcement learning on the learning model by allowing the interaction result to be applied to the corresponding learning model. Through this, the AI entity providing platform 100 enables the AI entity 200 to evolve through the reinforcement learning.
도 4는 본 발명의 일 실시예에 따른 AI 개체 제공 플랫폼의 구성을 나타낸 블록도이다.4 is a block diagram showing the configuration of an AI entity providing platform according to an embodiment of the present invention.
도 4에 도시한 바와 같이, 본 발명의 일 실시예에 따른 AI 개체 제공 플랫폼(100)은, 사용자 인터페이스부(110), 사용자의 선택에 따라 아바타 또는 캐릭터를 모델링하여 AI 개체(200)를 생성하는 AI 개체 생성부(120), 사용자에게 사용자 특성정보 입력 데이터 포맷을 제공하여 사용자 특성정보에 대한 학습데이터를 입력하도록 하는 학습데이터 입력부(130), 상기 입력한 학습데이터를 토대로 서비스 분야별 학습모델을 생성하는 학습모델 생성부(140) 및 상기 생성한 학습모델에 대한 강화학습을 수행함으로써, 상기 생성한 AI 개체(200)가 진화하도록 하는 학습모델 진화부(150)를 포함하여 구성된다.As shown in FIG. 4, the AI object providing platform 100 according to an embodiment of the present invention generates the AI object 200 by modeling the avatar or character according to the user interface unit 110 and the user's selection. The AI object generating unit 120, a learning data input unit 130 that provides a user with user characteristic information input data format to input learning data for user characteristic information, based on the inputted learning data, provides a learning model for each service field. It comprises a learning model generating unit 140 to generate and learning model evolution unit 150 to perform the reinforcement learning on the generated learning model, so that the generated AI entity 200 evolves.
사용자 인터페이스부(110)는, 상기 AI 개체 제공 플랫폼(100)과 상기 사용자 단말(300)사이의 AI 개체(200)를 생성하고, 해당 AI 개체(200)에 대한 학습모델을 생성하기 위한 관련 데이터를 송수신할 수 있도록 사용자 인터페이스를 제공하는 기능을 수행한다.The user interface unit 110 generates the AI entity 200 between the AI entity providing platform 100 and the user terminal 300, and related data for generating a learning model for the AI entity 200. It performs a function of providing a user interface to send and receive.
또한 AI 개체 생성부(120)는, 상기 사용자에게 자동으로 특정 서비스를 제공하거나, 상기 사용자와의 인터랙션을 통해 상기 특정 서비스를 적어도 하나 이상으로 제공하기 위한 아바타, 캐릭터 등을 포함하는 AI 개체(200)를 생성하는 기능을 수행한다.In addition, the AI object generating unit 120 automatically provides a specific service to the user, or an AI object 200 including an avatar, a character, etc. for providing at least one specific service through interaction with the user ).
한편 상기 AI 개체(200)는, 상기 사용자 단말(300)로부터 AI 개체(200) 생성요청과 함께 해당 사용자의 인증정보와 개인정보를 수신하고, 해당 AI 개체(200)에 대한 사용자 계정을 발급함으로서, 생성된다.On the other hand, the AI entity 200 receives authentication information and personal information of the corresponding user together with the request for creating the AI entity 200 from the user terminal 300, and issues a user account for the AI entity 200. Is created.
또한 AI 개체 생성부(120)는, 사전에 정의되어 저장된 커스터마이징 정보를 상기 사용자 인터페이스부(110)를 통해 사용자에게 제공하여, 사용자로 하여금 상기 커스터마이징 정보를 선택하도록 함으로써, 상기 아바타 또는 캐릭터에 대한 특성을 설정하도록 하여, 상기 AI 개체(200)를 사용자의 취향에 따라 모델링할 수 있도록 한다.In addition, the AI entity generating unit 120 provides the customized information stored in advance to the user through the user interface unit 110, thereby allowing the user to select the customizing information, so that the characteristics of the avatar or character By setting the, it is possible to model the AI object 200 according to the user's preference.
상기 AI 개체(200)는, 사용자 단말(300)이나 SNS 상 또는 상기 AI 개체 제공 플랫폼(100)에서 적용될 때, 상기 모델링한 결과에 따라 상기 사용자가 설정한 특정을 가짐으로써, 생성된다. The AI entity 200 is generated by having a specific set by the user according to the modeling result when applied on the user terminal 300 or the SNS or the AI entity providing platform 100.
한편 상기 커스터마이징 정보는, 상기 AI 개체(200)에 적용될 언어 및 국적을 포함하는 사회적 요소, 성별 및 나이를 포함하는 생물학적 요소와 얼굴, 헤서 및 의상 등을 포함하는 외모적 요소, 감정요소 및 AI 개체(200)에 대한 명칭을 포함한다.Meanwhile, the customizing information includes social elements including language and nationality to be applied to the AI entity 200, biological elements including gender and age, and appearance elements including emotions, faces, headers, and costumes, and emotional elements and AI entities. Contains the name for 200.
즉, 상기 AI 개체 제공 플랫폼(100)은, 상기 커스터마이징 정보를 상기 사용자 인터페이스부(110)를 통해 제공하여, 해당 AI 개체(200)를 활성화하기 위한 명칭을 설정하도록 하고, 상기 AI 개체(200)에 적용될 사회적 요소, 생물학적 요소, 외모적 요소 및 감정요소를 순차적으로 제공하여, 이를 선택하도록 함으로써, 사용자의 취향에 따라 상기 AI 개체(200)를 모델링할 수 있도록 한다.That is, the AI entity providing platform 100 provides the customizing information through the user interface 110 to set a name for activating the corresponding AI entity 200, and the AI entity 200 Social elements, biological elements, appearance elements, and emotional elements to be applied to are sequentially provided, and selected to make it possible to model the AI entity 200 according to a user's preference.
또한 상기 학습데이터 입력부(130)는, 상기 생성한 AI 개체(200)에 대한 서비스 분야별 학습모델을 생성하기 위한 학습데이터(즉, 사용자 특성정보)를 사용자기 입력할 수 있도록 하는 수단을 제공한다.In addition, the learning data input unit 130 provides a means for the user to input learning data (that is, user characteristic information) for generating a learning model for each service field for the created AI entity 200.
상기 학습데이터 입력부(130)는, 상기 사용자 인터페이스부(110)를 통해 사전에 정의된 사용자 특성정보 입력 데이터 포맷을 사용자에게 제공한다.The learning data input unit 130 provides a user with a user characteristic information input data format previously defined through the user interface unit 110.
이후, 상기 사용자가 상기 제공받은 사용자 특성정보 입력 데이터 포맷을 토대로 자신의 사용자 특성정보를 입력하면, 상기 학습데이터 입력부(130)는, 상기 입력한 사용자 특성정보를 서비스 분야별로 분류하여, 메모리(미도시)에 저장하는 한다.Thereafter, when the user inputs his/her user characteristic information based on the received user characteristic information input data format, the learning data input unit 130 classifies the input user characteristic information into service fields, and performs memory (not shown). City).
또한 상기 학습모델 생성부(140)는, 상기 추천 분야별로 분류한 사용자 특성정보를 서비스 분야별로 각각 학습하여 서비스 분야별 학습모델을 생성하는 기능을 수행한다.In addition, the learning model generating unit 140 performs a function of learning user characteristic information classified for each recommended field for each service field and generating a learning model for each service field.
한편 상기 서비스 분야별 학습모델은, 상기 서비스 분야별로 분류한 사용자 특성정보를 각각 학습하여 생성되는 것으로, TV 채널 추천용 학습모델, 음악 추천용 학습모델, IoT 기기(400) 제어용 학습모델, 뉴스 추천용 학습모델, 스케줄 추천용 학습모델을 포함할 수 있다.Meanwhile, the learning model for each service field is generated by learning user characteristic information classified for each service field, a learning model for TV channel recommendation, a learning model for music recommendation, a learning model for controlling IoT device 400, and a news recommendation It may include a learning model, a learning model for schedule recommendation.
다만, 상기 분야별 학습모델은, 상기 AI 개체 제공 플랫폼(100)의 설계자에 의해 다양한 분야로 확장될 수 있음은 당연하다.However, it is natural that the learning model for each field may be extended to various fields by the designer of the AI entity providing platform 100.
또한 상기 AI 개체 제공 플랫폼(100)은 상기 생성한 AI 개체(200)를 해당 사용자의 사용자 단말(300)에 적용되도록 하거나, SNS 서비스를 제공하는 SNS 서버에 대한 계정을 생성함으로써, SNS상에서 독립적인 개체로 SNS 활동을 수행할 수 있도록 구현될 수 있다.In addition, the AI entity providing platform 100 allows the created AI entity 200 to be applied to the user terminal 300 of a corresponding user, or by creating an account for an SNS server that provides an SNS service, thereby being independent on the SNS. It can be implemented to perform SNS activities as individuals.
또한 상기 생성한 AI 개체(200)는 지도학습을 통해 학습된 상기 서비스 분야별 학습모델을 이용하여 상기 사용자에게 적어도 하나 이상의 서비스를 자동으로 제공할 수 있으며, 상기 사용자와의 인터랙션을 수행하여, 상기 수행한 인터랙션에 따라 다양한 정보를 웹상에서 검색하여 사용자에게 제공하거나, 특정 IoT 기기(400)를 제어하거나, 해당 사용자의 스케줄을 보고하거나, 음악, 동영상, 뉴스 등을 추천할 수 있다.In addition, the created AI entity 200 may automatically provide at least one service to the user by using the learning model for each service field learned through supervised learning, and perform the interaction by interacting with the user. According to one interaction, various information may be searched on the web and provided to a user, a specific IoT device 400 may be controlled, a schedule of the user may be reported, music, videos, news, and the like may be recommended.
또한 상기 학습모델 진화부(150)는, 상기 사용자와의 인터랙션을 통해 해당 인터랙션의 결과에 따라 상기 생성한 서비스 분야별 학습모델에 대한 강화학습을 수행함으로서, 상기 생성한 AI 개체(200)가 진화하도록 하는 기능을 수행한다.In addition, the learning model evolution unit 150, through the interaction with the user by performing reinforcement learning on the generated learning model for each service field according to the result of the interaction, so that the generated AI entity 200 to evolve To perform the function.
또한 상기 학습모델 진화부(150)는, 상기 적어도 하나 이상의 학습모델을 상호 결합하여 상기 AI 개체(200)가 진화할 수 있도록 하는 기능을 더 포함할 수 있다.In addition, the learning model evolution unit 150 may further include a function that enables the AI entity 200 to evolve by combining the at least one learning model with each other.
즉, 상기 학습모델 진화부(150)는, 강화학습을 위한 학습데이터의 관련정도에 따라 특정 서비스에 특화된 적어도 하나 이상의 학습모델을 결합하여 상기 AI 개체(200)가 진화할 수 있도록 하는 것이다.That is, the learning model evolution unit 150 combines at least one learning model specialized for a specific service according to a related degree of learning data for reinforcement learning so that the AI entity 200 can evolve.
예를 들어, 날씨별 시간대별 음악을 추천하거나, 날씨별 시간대별로 댁내의 온도나 습도를 조정하기 위한 복수의 IoT 기기(400)를 제어하고자 하는 경우, 날씨별 시간대별로 음악을 추천하는 서비스와 IoT 기기(400)를 제어하는 서비스의 관련정도가 높은 것을 알 수 있다. 즉, 상기 음악 추천용 학습모델이나 IoT 기기 제어용 학습모델에 이용되는 학습데이터는 날씨 및 시간을 포함하는 것으로, 해당 학습데이터의 관련정도가 높은 것임을 알 수 있다.For example, when recommending music for each time zone by weather, or when controlling a plurality of IoT devices 400 for adjusting the temperature or humidity in the house for each time zone by weather, a service and IoT recommending music by time zone for each weather It can be seen that the relevance of the service controlling the device 400 is high. That is, the learning data used for the learning model for recommending music or the learning model for controlling the IoT device includes weather and time, and it can be seen that the related degree of the learning data is high.
따라서, 상기 학습모델 진화부(150)는, 상기 음악 추천용 학습모델과 상기 IoT 기기 제어용 학습모델을 상호 결합함으로써, 날씨별 시간대별로 음악 및 IoT 기기 제어를 위한 서비스를 동시에 제공할 수 있도록 함으로써, 상기 AI 개체(200)를 진화시킬 수 있다. 이때, 상기 결합은, 관련 분야에 대해서, 학습데이터를 관련정도에 따라 특성 수치로 계량화하여 0과 1사이의 값을 가지도록 스케일링함으로써, 수행된다.Therefore, the learning model evolution unit 150, by combining the learning model for music recommendation and the learning model for controlling the IoT device by mutually providing services for controlling music and IoT devices for each time of weather, The AI entity 200 can be evolved. In this case, the combining is performed by quantifying the learning data into a characteristic value according to the degree of relevance for the related field and scaling it to have a value between 0 and 1.
또한 학습모델 진화부(150)는 상기 인터랙션 이외에 자가학습, 참여학습, 지도학습 및 자율학습을 통해 상기 각 서비스 분야별 학습모델에 대한 강화학습을 지속적으로 수행하여 상기 AI 개체(200)가 독립적인 개체로 진화할 수 있도록 할 수 있다.In addition, the learning model evolution unit 150 continuously performs reinforcement learning on the learning model for each service field through self-learning, participatory learning, supervised learning, and self-learning in addition to the interaction, so that the AI entity 200 is an independent entity. Can evolve into
한편, 상기 자가학습, 참여학습, 지도학습 및 자율학습에 대해서는 도 1을 참조하여 설명하였으므로, 더 이상의 상세한 설명은 생략하도록 한다.On the other hand, since the self-learning, participatory learning, supervised learning, and autonomous learning were described with reference to FIG. 1, further detailed description will be omitted.
또한 상기 학습모델 진화부(150)는, 상기 사용자 특성정보 수집부(130)로부터 수집되는 사용자 특성정보가 최초로 입력된 것이 아니라, 상기 AI 개체(200) 및 해당 AI 개체(200)에 대한 서비스 분야별 학습모델이 생성된 후 입력되는 경우, 해당 사용자 특성정보를 이용하여 상기 각 서비스 분야별 학습모델에 대한 강화학습을 수행하는 것을 더 포함할 수 있음은 상술한 바와 같다.In addition, the learning model evolution unit 150 is not the first time the user characteristic information collected from the user characteristic information collection unit 130 is input, but by the service field for the AI entity 200 and the corresponding AI entity 200. As described above, when the learning model is generated and then input, it may further include performing reinforcement learning on the learning model for each service field using the corresponding user characteristic information.
도 5는 본 발명의 일 실시예에 따른 강화학습을 통해 진화하는 AI 개체를 제공하는 절차를 나타낸 흐름도이다.5 is a flowchart illustrating a procedure for providing an AI entity that evolves through reinforcement learning according to an embodiment of the present invention.
도 5에 도시한 바와 같이, 본 발명의 일 실시예에 따른 강화학습을 통해 진화하는 AI 개체를 제공하는 절차는 우선, 사용자는 사용자 단말(300)을 통해 AI 개체 제공 플랫폼(100)에 접속하여, 해당 AI 개체 제공 플랫폼(100)에 AI 개체(200)에 대한 생성을 요청함으로서, 해당 사용자에 대한 AI 개체(200)를 생성한다(S110).As illustrated in FIG. 5, the procedure for providing an AI entity that evolves through reinforcement learning according to an embodiment of the present invention is first, the user accesses the AI entity providing platform 100 through the user terminal 300 , By requesting the AI entity providing platform 100 to create the AI entity 200, the AI entity 200 for the user is generated (S110 ).
상기 AI 개체(200)를 생성하는 것은, 사용자가 해당 사용자의 인증정보 및 개인정보를 상기 AI 개체 제공 플랫폼(100)에 입력하여 상기 AI 개체(200)에 대한 생성요청을 수행하며, 상기 AI 개체 제공 플랫폼(100)은, 상기 AI 개체(200)에 대한 계정을 발급함으로써, 수행된다.Generating the AI entity 200, the user inputs the user's authentication information and personal information to the AI entity providing platform 100 to perform a creation request for the AI entity 200, and the AI entity The providing platform 100 is performed by issuing an account for the AI entity 200.
이때, 상기 AI 개체 제공 플랫폼(100)은, 상기 사용자에게 사전에 정의된 커스터마이징 정보를 제공함으로써, 사용자의 취향에 따라 상기 AI 개체(200)를 모델링할 수 있음은 상술한 바와 같다.At this time, as described above, the AI entity providing platform 100 can model the AI entity 200 according to a user's preference by providing predefined customization information to the user.
다음으로, 상기 AI 개체 제공 플랫폼(100)은, 상기 사용자로부터 해당 사용자의 사용자 특성정보를 입력받아(S120), 상기 입력 받은 사용자 특성정보를 이용하여 상기 생성한 AI 개체(200)에 대한 서비스 분야별 학습모델을 생성한다(S120).Next, the AI entity providing platform 100 receives the user characteristic information of the corresponding user from the user (S120), by service field for the created AI entity 200 using the received user characteristic information Create a learning model (S120).
이때, 상기 AI 개체 제공 플랫폼(100)은, 사용자 특성정보 입력 데이터 포맷을 사용자 인터페이스를 통해 제공하여, 미리 설정된 포맷으로 사용자 특성정보를 입력할 수 있도록 한다.At this time, the AI object providing platform 100 provides a user characteristic information input data format through a user interface so that user characteristic information can be input in a preset format.
또한 상기 AI 개체 제공 플랫폼(100)은, 상기 입력 받은 사용자 특성정보를 서비스 분야별로 분류하며, 상기 분류한 서비스 분야별 사용자 특성정보를 각각 학습하여, 각 서비스 분야별 학습모델을 생성하게 된다.In addition, the AI entity providing platform 100 classifies the received user characteristic information for each service field, and learns each user characteristic information for each classified service field to generate a learning model for each service field.
또한 상기에서 설명한 것과 같이, 또한 상기 생성한 서비스 분야별 학습모델은, 강화학습을 통해 점점 고도화되며, 이를 통해 상기 AI 개체(200)가 독립적인 개체로 진화된다.In addition, as described above, the generated learning model for each service field is gradually advanced through reinforcement learning, and through this, the AI entity 200 is evolved into an independent entity.
다음으로, 상기 생성한 AI 개체와 상기 사용자가 인터랙션을 수행(S140)하면, 상기 AI 개체(200)는 상기 인터랙션을 수행한 인터랙션 결과를 사용자에게 제공하고, 상기 AI 개체 제공 플랫폼(100)은, 상기 인터랙션 결과를 이용하여 상기 생성한 학습모델에 대한 강화학습을 수행함으로써, 상기 생성한 AI 개체(200)를 진화시킨다(S150).Next, when the created AI entity and the user perform an interaction (S140), the AI entity 200 provides the interaction result of the interaction to the user, and the AI entity providing platform 100 comprises: The generated AI entity 200 is evolved by performing reinforcement learning on the generated learning model using the interaction result (S150).
상기에서는 본 발명에 따른 바람직한 실시 예를 위주로 상술하였으나, 본 발명의 기술적 사상은 이에 한정되는 것은 아니며 본 발명의 각 구성요소는 동일한 목적 및 효과의 달성을 위하여 본 발명의 기술적 범위 내에서 변경 또는 수정될 수 있을 것이다.In the above, the preferred embodiment according to the present invention has been mainly described, but the technical spirit of the present invention is not limited thereto, and each component of the present invention is changed or modified within the technical scope of the present invention in order to achieve the same purpose and effect. It could be.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형 실시가 가능한 것은 물론이고, 이러한 변형 실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안 될 것이다.In addition, although the preferred embodiments of the present invention have been illustrated and described above, the present invention is not limited to the specific embodiments described above, and the technical field to which the present invention pertains without departing from the gist of the present invention claimed in the claims. In addition, various modifications may be implemented by a person having ordinary knowledge in the art, and these modifications should not be individually understood from the technical idea or prospect of the present invention.
본 발명은 사용자가 AI 개체를 생성하여 자신이 원하는 바대로 지속적으로 학습시키고, 강화학습을 통해서 사용자 자신이 원하는 하나의 독립적인 개체로 진화하도록 함으로써, 사용자의 성향에 따라 특정 정보를 검색하거나, 특정 IoT 기기를 제어하도록 하거나, 해당 사용자의 스케줄을 보고하거나, 음악, 상품, 뉴스 등을 추천할 수 있다.According to the present invention, a user creates an AI object and continuously learns it as he wants, and through reinforcement learning, the user evolves into an independent object that the user himself wants. You can control the IoT device, report the schedule of the user, or recommend music, products, news, etc.

Claims (10)

  1. 사용자가 AI 개체를 생성하는 AI 개체 생성 단계;An AI entity creation step in which the user creates an AI entity;
    기계학습을 통해 상기 생성한 AI 개체에 대한 학습모델을 생성하는 학습모델 생성 단계; 및A learning model generation step of generating a learning model for the created AI entity through machine learning; And
    상기 생성한 학습모델을 통해서 사용자가 AI 개체와 인터랙션하면, 상기 인터랙션의 결과를 상기 학습모델에 적용하여, 해당 학습모델에 대한 강화학습을 수행하도록 함으로써, 상기 사용자의 인터랙션 행위에 따라 상기 생성한 AI 개체가 독립적인 개체로 진화하도록 하는 AI 개체 진화 단계;를 포함하는 것을 특징으로 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 방법.When a user interacts with an AI entity through the generated learning model, the result of the interaction is applied to the learning model to perform reinforcement learning on the learning model, thereby generating the AI according to the user's interaction behavior. A method of providing an AI entity that evolves through reinforcement learning, comprising: an AI entity evolution step that causes the entity to evolve into an independent entity.
  2. 청구항 1에 있어서,The method according to claim 1,
    상기 방법은,The above method,
    상기 AI 개체 진화 단계를 통해, 상기 AI 개체가 다른 AI 개체와 교류하면서, 상기 사용자와 독집적인 개체로 진화하는 것을 더 포함하는 것을 특징으로 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 방법.A method of providing an AI entity evolving through reinforcement learning, further comprising evolving into an individual entity with the user while the AI entity interacts with other AI entities through the AI entity evolution step.
  3. 청구항 1에 있어서,The method according to claim 1,
    상기 AI 개체는,The AI entity,
    상기 방법을 수행하는 독립적인 하드웨어로 구성된 특정 디바이스나 인터넷상의 웹서버나 클라우드 플랫폼에서 계정을 만듦으로서 생성되며,It is created by creating an account on a specific device composed of independent hardware that performs the above method or on a web server or cloud platform on the Internet,
    상기 사용자가 원하는 비서의 기능을 하거나, SNS 활동이 가능하거나, 가정, 학교 또는 사무실에서 사용자를 대신하여 적어도 하나 이상의 IoT 기기를 상기 사용자가 원하는 시간과 방법으로 동작시키거나, 적어도 하나 이상의 IoT 기기를 설정하여 사용자가 원하는 가정, 학교 또는 사무실 환경을 유지하도록 하거나, 또는 이들의 조합 중 적어도 하나 이상을 수행하는 것을 특징으로 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 방법.To function as a secretary desired by the user, to enable SNS activities, to operate at least one IoT device on behalf of the user at home, school, or office in a time and manner desired by the user, or to operate at least one IoT device A method of providing an AI entity that evolves through reinforcement learning, characterized in that the user maintains a desired home, school, or office environment, or performs at least one or a combination of these.
  4. 청구항 1에 있어서,The method according to claim 1,
    상기 방법은, The above method,
    상기 학습모델을 학습시켜 학습모델을 생성하는 과정에서, 사용자에게 학습 데이터를 입력할 수 있는 인터페이스를 제공하고, 사용자에게 학습시킬 방법을 제시함으로써, 사용자가 학습용 데이터를 미리 지정된 포맷으로 입력하도록 하는 학습데이터 입력 단계;를 더 포함하는 것을 특징으로 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 방법.In the process of learning the learning model and generating a learning model, learning to allow a user to input learning data in a predetermined format by providing an interface for inputting learning data to a user and presenting a method for learning to the user Method for providing an AI entity evolving through reinforcement learning, characterized in that it further comprises a data input step.
  5. 청구항 1에 있어서,The method according to claim 1,
    상기 학습모델은, CNN, RNN 또는 ANN를 포함한 적어도 하나 이상의 분야에 대해서 특화된 학습모델을 포함하며,The learning model includes learning models specialized for at least one field including CNN, RNN, or ANN,
    상기 AI 개체는, 상기 적어도 하나 이상의 특화된 학습모델이 상호 결합되어 진화하며,The AI entity evolves by combining the at least one specialized learning model with each other,
    상기 상호 결합은 관련 분야에 대해서 학습 데이터를 관련 정도에 따라 계량화하여 스케일링함으로써 수행되는 것을 특징으로 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 방법.The method for providing an AI entity evolving through reinforcement learning, wherein the mutual coupling is performed by quantifying and scaling learning data according to a related degree in a related field.
  6. 사용자에 의해 AI 개체를 생성하도록 지원하는 AI 개체 생성부;An AI object creation unit supporting the user to create an AI object;
    기계학습을 통해 상기 생성한 AI 개체에 대한 학습모델을 생성하는 학습모델 생성부; 및A learning model generator for generating a learning model for the created AI object through machine learning; And
    상기 생성한 학습모델을 통해서 사용자가 상기 생성한 AI 개체와 인터랙션하면, 상기 인터랙션의 결과를 상기 학습모델에 적용하여, 해당 학습모델에 대한 강화학습을 수행하도록 함으로써, 상기 사용자의 인터랙션 행위에 따라 상기 생성한 AI 개체가 독립적인 개체로 진화하도록 하는 학습모델 진화부;를 포함하는 것을 특징으로 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 플랫폼.When a user interacts with the created AI entity through the generated learning model, the result of the interaction is applied to the learning model to perform reinforcement learning on the learning model, and according to the user's interaction behavior, A platform for providing AI entities that evolve through reinforcement learning, comprising: a learning model evolution unit that allows the generated AI entities to evolve into independent entities.
  7. 청구항 6에 있어서,The method according to claim 6,
    상기 학습모델 진화부는,The learning model evolution unit,
    상기 독립적인 개체로 진화하는 과정을 통해서 상기 AI 개체가 다른 AI 개체와 교류하면서, 상기 사용자와 독립적인 개체로 진화하도록 하는 것을 더 포함하는 것을 특징으로 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 플랫폼.Providing an AI entity evolving through reinforcement learning, further comprising allowing the AI entity to evolve as an independent entity while interacting with other AI entities through the process of evolving into the independent entity. platform.
  8. 청구항 6에 있어서,The method according to claim 6,
    상기 AI 개체는,The AI entity,
    상기 강화학습을 통해 진화하는 AI 개체를 제공하는 독립적인 하드웨어로 구성된 특정 디바이스나 인터넷상의 웹서버나 클라우드 플랫폼에서 계정을 만듦으로서 생성되며,It is created by creating an account on a web server or cloud platform on a specific device or on the Internet that is composed of independent hardware that provides AI objects that evolve through the reinforcement learning.
    상기 사용자가 원하는 비서의 기능을 하거나, SNS 활동이 가능하거나, 가정, 학교 또는 사무실에서 사용자를 대신하여 적어도 하나 이상의 IoT 기기를 상기 사용자가 원하는 시간과 방법으로 동작시키거나, 적어도 하나 이상의 IoT 기기를 설정하여 사용자가 원하는 가정, 학교 또는 사무실 환경을 유지하도록 하거나, 또는 이들의 조합 중 적어도 하나 이상을 수행하는 것을 특징으로 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 플랫폼.To function as a secretary desired by the user, to enable SNS activities, to operate at least one IoT device on behalf of the user at home, school, or office in a time and manner desired by the user, or to operate at least one IoT device A platform that provides evolving AI entities through reinforcement learning, characterized by setting up to maintain a user's desired home, school, or office environment, or performing at least one or a combination of these.
  9. 청구항 6에 있어서,The method according to claim 6,
    상기 플랫폼은,The platform,
    상기 학습모델을 학습시켜 학습모델을 생성할 때, 사용자에게 학습용 데이터를 입력할 수 있는 인터페이스를 제공하고, 사용자에게 학습시킬 방법을 제시함으로써, 사용자가 학습용 데이터를 미리 지정된 포맷으로 입력하도록 하는 학습 데이터 입력부;를 더 포함하는 것을 특징으로 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 플랫폼.When learning model is generated by learning the learning model, by providing an interface for inputting learning data to the user and presenting a method for learning to the user, learning data allowing the user to input learning data in a predetermined format. A platform for providing an AI entity that evolves through reinforcement learning, characterized by further comprising an input unit.
  10. 청구항 6에 있어서,The method according to claim 6,
    상기 학습모델은, CNN, RNN 또는 ANN를 포함한 적어도 하나 이상의 분야에 대해서 특화된 학습모델을 포함하며,The learning model includes a learning model specialized for at least one field including CNN, RNN, or ANN,
    상기 AI 개체는, 상기 적어도 하나 이상의 특화된 학습모델이 상호 결합되어 진화하며,The AI entity evolves by combining the at least one specialized learning model with each other,
    상기 상호 결합은 관련 분야에 대해서 학습 데이터를 관련 정도에 따라 계량화하여 스케일링함으로써 수행되는 것을 특징으로 하는 강화학습을 통해 진화하는 AI 개체를 제공하는 플랫폼.The mutual coupling is a platform for providing an AI entity that evolves through reinforcement learning, characterized in that it is performed by quantifying and scaling learning data according to a related degree in a related field.
PCT/KR2019/018271 2019-01-22 2019-12-23 Method and platform for providing ai entities evolving via reinforced learning WO2020153614A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190008141A KR102309682B1 (en) 2019-01-22 2019-01-22 Method and platform for providing ai entities being evolved through reinforcement machine learning
KR10-2019-0008141 2019-01-22

Publications (1)

Publication Number Publication Date
WO2020153614A1 true WO2020153614A1 (en) 2020-07-30

Family

ID=71735795

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/018271 WO2020153614A1 (en) 2019-01-22 2019-12-23 Method and platform for providing ai entities evolving via reinforced learning

Country Status (2)

Country Link
KR (1) KR102309682B1 (en)
WO (1) WO2020153614A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11301269B1 (en) 2020-10-14 2022-04-12 UiPath, Inc. Determining sequences of interactions, process extraction, and robot generation using artificial intelligence / machine learning models
KR102311787B1 (en) 2021-01-06 2021-10-08 한전케이디엔주식회사 Apparatus and method for preventing performance degradation of ai model
KR102368043B1 (en) 2021-01-06 2022-02-24 한전케이디엔주식회사 Apparatus and method for recommending news of user interest using user-defined topic modeling
US20220301250A1 (en) * 2021-03-17 2022-09-22 DMLab. CO., LTD Avatar-based interaction service method and apparatus

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8001063B2 (en) * 2006-01-23 2011-08-16 International Business Machines Corporation Method and apparatus for reward-based learning of improved policies for management of a plurality of application environments supported by a data processing system
US9177259B1 (en) * 2010-11-29 2015-11-03 Aptima Inc. Systems and methods for recognizing and reacting to spatiotemporal patterns
US20170024643A1 (en) * 2015-07-24 2017-01-26 Google Inc. Continuous control with deep reinforcement learning
WO2017177128A1 (en) * 2016-04-08 2017-10-12 The Trustees Of Columbia University In The City Of New York Systems and methods for deep reinforcement learning using a brain-artificial intelligence interface
KR101884609B1 (en) * 2017-05-08 2018-08-02 (주)헬스허브 System for diagnosing disease through modularized reinforcement learning

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8001063B2 (en) * 2006-01-23 2011-08-16 International Business Machines Corporation Method and apparatus for reward-based learning of improved policies for management of a plurality of application environments supported by a data processing system
US9177259B1 (en) * 2010-11-29 2015-11-03 Aptima Inc. Systems and methods for recognizing and reacting to spatiotemporal patterns
US20170024643A1 (en) * 2015-07-24 2017-01-26 Google Inc. Continuous control with deep reinforcement learning
WO2017177128A1 (en) * 2016-04-08 2017-10-12 The Trustees Of Columbia University In The City Of New York Systems and methods for deep reinforcement learning using a brain-artificial intelligence interface
KR101884609B1 (en) * 2017-05-08 2018-08-02 (주)헬스허브 System for diagnosing disease through modularized reinforcement learning

Also Published As

Publication number Publication date
KR20200094833A (en) 2020-08-10
KR102309682B1 (en) 2021-10-07

Similar Documents

Publication Publication Date Title
WO2020153614A1 (en) Method and platform for providing ai entities evolving via reinforced learning
WO2020067633A1 (en) Electronic device and method of obtaining emotion information
WO2019041856A1 (en) Home appliance control method, system and terminal, and storage medium
WO2017142116A1 (en) Activity-centric contextual modes of operation for electronic devices
WO2019194451A1 (en) Voice conversation analysis method and apparatus using artificial intelligence
WO2020158988A1 (en) Data trading method managed through blockchain, and platform therefor
CN106873773A (en) Robot interactive control method, server and robot
WO2021071231A1 (en) Message service providing device for actively building database of expression items including sub-expression items, and method thereof
WO2020153525A1 (en) Method for managing information about artificial intelligence entity by means of blockchain, and platform therefor
WO2019182265A1 (en) Artificial intelligence device and method for operating same
WO2020080834A1 (en) Electronic device and method for controlling the electronic device
WO2016133319A1 (en) Method and device for providing information
WO2019146942A1 (en) Electronic apparatus and control method thereof
WO2019125082A1 (en) Device and method for recommending contact information
WO2020141952A1 (en) Conversational control system and method for registering external device
WO2019231130A1 (en) Electronic device and control method therefor
EP3820369A1 (en) Electronic device and method of obtaining emotion information
WO2020153526A1 (en) Platform for collecting information about ai entity, and information collection method using same
WO2021132922A1 (en) Computing device and operation method thereof
EP3685279A1 (en) Method for content search and electronic device therefor
WO2021060728A1 (en) Electronic device for processing user utterance and method for operating same
WO2022119212A1 (en) Method for voice-based control of external device and electronic device thereof
WO2019221458A1 (en) Air conditioning apparatus and method for controlling same
WO2021075705A1 (en) Electronic device and control method therefor
WO2018164435A1 (en) Electronic apparatus, method for controlling the same, and non-transitory computer readable recording medium

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19911661

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19911661

Country of ref document: EP

Kind code of ref document: A1