WO2020060223A1 - 애플리케이션의 번역 정보를 제공하는 디바이스 및 방법 - Google Patents

애플리케이션의 번역 정보를 제공하는 디바이스 및 방법 Download PDF

Info

Publication number
WO2020060223A1
WO2020060223A1 PCT/KR2019/012138 KR2019012138W WO2020060223A1 WO 2020060223 A1 WO2020060223 A1 WO 2020060223A1 KR 2019012138 W KR2019012138 W KR 2019012138W WO 2020060223 A1 WO2020060223 A1 WO 2020060223A1
Authority
WO
WIPO (PCT)
Prior art keywords
application
text
execution screen
language
artificial intelligence
Prior art date
Application number
PCT/KR2019/012138
Other languages
English (en)
French (fr)
Inventor
김지완
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to US17/270,655 priority Critical patent/US11868739B2/en
Publication of WO2020060223A1 publication Critical patent/WO2020060223A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/454Multi-language systems; Localisation; Internationalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/086Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Definitions

  • the present disclosure relates to a device and method for providing translation information of an application, and more particularly, to a device and method for translating text in an execution screen of an application using an artificial intelligence model.
  • the Artificial Intelligence (AI) system is a computer system that realizes human-level intelligence, and unlike the existing Rule-based smart system, the machine learns, judges, and becomes intelligent. As the AI system is used, the recognition rate is improved and the user's taste can be understood more accurately, and the existing Rule-based smart system is gradually being replaced by the deep learning-based AI system.
  • Machine learning Deep learning
  • elemental technologies utilizing machine learning.
  • Machine learning is an algorithm technology that classifies / learns the characteristics of input data by itself
  • element technology is a technology that simulates functions such as cognition and judgment of the human brain by using machine learning algorithms such as deep learning. It consists of technical fields such as understanding, reasoning / prediction, knowledge expression, and motion control.
  • Linguistic understanding is a technology that recognizes and applies / processes human language / characters, and includes natural language processing, machine translation, conversation system, question and answer, and speech recognition / synthesis.
  • Visual understanding is a technology that recognizes and processes objects like human vision, and includes object recognition, object tracking, image search, human recognition, scene understanding, spatial understanding, and image improvement.
  • Inference prediction is a technique for logically inferring and predicting information by determining information, and includes knowledge / probability-based reasoning, optimization prediction, preference-based planning, and recommendation.
  • Knowledge expression is a technology that automatically processes human experience information into knowledge data, and includes knowledge building (data generation / classification), knowledge management (data utilization), and so on.
  • Motion control is a technique for controlling autonomous driving of a vehicle and movement of a robot, and includes motion control (navigation, collision, driving), operation control (behavior control) and the like.
  • the device does not provide translation data for a predetermined language in an application installed on the device, it is necessary to effectively translate text in the execution screen of the application.
  • Some embodiments may provide a device and method for a device's operating system to translate text within an application using an artificial intelligence model.
  • some embodiments may provide a device and method for generating an execution screen of an application including text translated in a predetermined language when the application does not provide translation data in a predetermined language.
  • some embodiments may provide devices and methods that enable devices to effectively learn and use artificial intelligence models for translating text within an application.
  • FIG. 1 is a diagram illustrating a system for translating text in an application installed on a device according to some embodiments.
  • FIG. 2 is a flowchart of a method for a device to translate text to be displayed on an execution screen of an application using an artificial intelligence model according to some embodiments.
  • FIG. 3 is a flow diagram of a method for performing a translation in consideration of whether a device according to some embodiments provides language data in a second language by an application.
  • FIG. 4 is a flowchart of a method for acquiring data to be applied to an artificial intelligence model by a device according to some embodiments.
  • FIG. 5 is a diagram illustrating an example in which text included in an execution screen of an application is translated according to some embodiments.
  • 6 to 10 are diagrams illustrating an example in which a device uses an artificial intelligence model according to some embodiments.
  • GUI graphical user interface
  • FIGS. 12 and 13 are diagrams illustrating an example in which a device displays a GUI for controlling translation of text on an application execution screen including translated text according to some embodiments.
  • 16 is a block diagram of a server according to some embodiments.
  • a first aspect of the present disclosure includes an operation of receiving a user input for executing an application installed on a device; In response to the user input, acquiring a resource file of the application through an operating system (OS) of the device; Translating text to be displayed on an execution screen of the application using an artificial intelligence model and the acquired resource file; Generating an execution screen of the application using the resource file and the translated text; And displaying the generated execution screen, wherein the translation operation includes at least a part of data in the resource file in the artificial intelligence model trained to translate text to be displayed on the execution screen of the application.
  • OS operating system
  • a second aspect of the present disclosure includes a display; Memory; And a processor that controls the display and the memory, wherein the processor receives a user input for executing an application installed on the device and, in response to the user input, operates the operating system (OS) of the device.
  • OS operating system
  • the application To generate an execution screen, display the generated execution screen, and the processor, to the artificial intelligence model trained to translate text to be displayed on the execution screen of the application, at least some of the data in the resource file
  • the first language It is possible to provide a device that is to translate the text of the second language.
  • the third aspect of the present disclosure can provide a computer program apparatus including a computer-readable recording medium on which a program for executing the method of the first aspect is executed on a computer.
  • FIG. 1 is a diagram illustrating a system for translating text in an application installed on a device according to some embodiments.
  • a system for translating text in an application may include a device 1000 and a server 2000.
  • the device 1000 may execute an application installed on the device 1000 and display an execution screen of the executed application.
  • the application may include text in the first language, and the second language may be set as the default language in the device 1000.
  • the text to be displayed in the execution screen of the application can be translated into the second language by analyzing the resource file of the application at the API (Application Program Interface) level.
  • the device 1000 may use at least one artificial intelligence model trained based on an artificial intelligence algorithm to translate text in an execution screen of the application.
  • the device 1000 may translate text in the execution screen of the application by applying the resource file or various information obtained from the resource file to the artificial intelligence model.
  • the artificial intelligence model may be provided by the device 1000 or the server 2000.
  • the artificial intelligence model may be stored as software in a memory in the device 1000, or may be implemented by a hardware processor in the device 1000.
  • the artificial intelligence model may be stored as software in a memory in the server 2000, or may be implemented by a hardware processor in the device 1000.
  • the device 1000 is a smart phone, tablet PC, PC, smart TV, mobile phone, personal digital assistant (PDA), laptop, media player, micro server, global positioning system (GPS) device, e-book terminal, digital broadcasting terminal, navigation , Kiosks, MP3 players, digital cameras, home appliances and other mobile or non-mobile computing devices, but is not limited thereto.
  • the device 1000 may be a wearable device such as a watch, glasses, hair band, and ring equipped with a communication function and a data processing function.
  • the present invention is not limited thereto, and the device 1000 may include all kinds of devices capable of installing and running an application.
  • the network includes a local area network (LAN), a wide area network (WAN), a value added network (VAN), a mobile radio communication network, a satellite communication network, and combinations thereof.
  • each network component shown in Figure 1 is a comprehensive data communication network that enables smooth communication with each other, and may include wired Internet, wireless Internet, and mobile wireless communication networks.
  • Wireless communication includes, for example, wireless LAN (Wi-Fi), Bluetooth, Bluetooth low energy, Zigbee, Wi-Fi Direct (WFD), ultra wideband (UWB), infrared data association (IrDA) ), NFC (Near Field Communication), and the like, but are not limited thereto.
  • the functions related to artificial intelligence according to the present disclosure are operated through a processor and memory.
  • the processor may consist of one or more processors.
  • the one or a plurality of processors may be a general-purpose processor such as a CPU, an AP, or a digital signal processor (DSP), a graphic processor such as a GPU or a vision processing unit (VPU), or an artificial intelligence processor such as an NPU.
  • DSP digital signal processor
  • VPU vision processing unit
  • an artificial intelligence processor such as an NPU.
  • One or a plurality of processors are controlled to process input data according to predefined operation rules or artificial intelligence models stored in the memory.
  • the AI-only processors may be designed with a hardware structure specialized for processing a specific AI model.
  • the predefined motion rules or artificial intelligence models are characterized by being created through learning.
  • the basic artificial intelligence model is learned using a plurality of training data by a learning algorithm, thereby creating a predefined operation rule or artificial intelligence model set to perform a desired characteristic (or purpose). It means Jim.
  • Such learning may be performed on a device on which artificial intelligence according to the present disclosure is performed, or may be performed through a separate server and / or system. Examples of learning algorithms include supervised learning, unsupervised learning, semi-supervised learning, or reinforcement learning, but are not limited to the examples described above.
  • the artificial intelligence model may be composed of a plurality of neural network layers.
  • Each of the plurality of neural network layers has a plurality of weight values, and performs a neural network operation through calculation between a result of calculation of a previous layer and a plurality of weights.
  • the plurality of weights of the plurality of neural network layers may be optimized by learning results of the artificial intelligence model. For example, a plurality of weights may be updated such that a loss value or a cost value obtained from the artificial intelligence model is reduced or minimized during the learning process.
  • the artificial neural network may include a deep neural network (DNN), for example, Convolutional Neural Network (CNN), Deep Neural Network (DNN), Recurrent Neural Network (RNN), Restricted Boltzmann Machine (RBM), There are Deep Belief Network (DBN), Bidirectional Recurrent Deep Neural Network (BRDNN) or Deep Q-Networks, but are not limited to the above-described examples.
  • DNN Deep neural network
  • FIG. 2 is a flowchart of a method for a device to translate text to be displayed on an execution screen of an application using an artificial intelligence model according to some embodiments.
  • the device 1000 may receive a user input for executing an application.
  • the device 1000 may receive a user input for an application to be executed in the device 1000.
  • the device 1000 may connect to an application providing server (not shown) for downloading an application, and receive a user input for selecting an application to download from among applications provided by the application providing server (not shown).
  • the device 1000 may receive a user input for installing an application.
  • the device 1000 may receive a user input for selecting an application to be executed from among applications installed on the device 1000.
  • the application installed or to be installed on the device 1000 may have the first language as the default language.
  • the device 1000 may obtain a resource file of the application through the operating system (OS).
  • the device 1000 may store the resource file of the installed application in a memory (not shown), and access the resource file stored in the memory (not shown) through the operating system of the device 1000.
  • the device 1000 may obtain an application resource file from an application downloaded from an application providing server (not shown).
  • the device 1000 may acquire a resource file of the application while installing the downloaded application.
  • the operating system (OS) of the device 1000 may extract information necessary to configure the execution screen of the application from the resource file of the application before generating the execution screen of the application.
  • the operating system may obtain images and text to be included in an execution screen of an application from a resource file.
  • the operating system can recognize text in the acquired image.
  • the operating system of the device 1000 may extract various information necessary to translate text to be displayed in the execution screen of the application from the resource file.
  • the operating system of the device 1000 includes the size of the image to be displayed in the execution screen, the location where the image will be displayed in the execution screen, the font of the text to be displayed in the execution screen, text color, spacing, line spacing, and the execution screen. The location where the text is to be displayed, and the category of the application can be extracted.
  • the operating system of the device 1000 may acquire information regarding the color of an image to be displayed in an execution screen and the type of object in the image.
  • the device 1000 may translate the text of the first language to be displayed on the execution screen of the application into the second language using the artificial intelligence model.
  • the artificial intelligence model may be a training model trained using artificial intelligence algorithms to translate text in the application.
  • the artificial intelligence model may be trained using at least one of a machine learning algorithm, a neural network algorithm, a genetic algorithm, a deep learning algorithm, and a classification algorithm.
  • the operating system of the device 1000 may translate the text of the first language to be displayed on the execution screen of the application into the second language by applying at least some of the data obtained in operation S210 to the artificial intelligence model.
  • the device 1000 may generate an execution screen of the application.
  • the operating system of the device 1000 may generate an execution screen of the application using the resource file of the application.
  • the operating system of the device 1000 may generate an execution screen of the application as an image at the API level.
  • the operating system of the device 1000 may generate an execution screen of the application using information for configuring the execution screen in the resource file and text of the second language obtained in operation S220.
  • the operating system of the device 1000 may take into account the size of the extracted image, the size of the translated text, the location of the image to be placed in the execution screen, and the location of the translated text to be placed in the execution screen, You can create an execution screen for your application.
  • the device 1000 may determine the translated text and the size of the translated text to maintain the layout of the execution screen of the application.
  • the device 1000 may display an execution screen of the application.
  • the execution screen of the application is described using the translated text using the artificial intelligence model, but is not limited thereto.
  • the operating system of the device 1000 may directly generate an application execution screen including translated text by applying the data obtained in operation S210 to the artificial intelligence model.
  • FIG. 3 is a flow diagram of a method for performing a translation in consideration of whether a device according to some embodiments provides language data in a second language by an application.
  • the device 1000 may obtain a resource file of the application.
  • the device 1000 may determine whether the application provides language data of the second language.
  • the operating system of the device 1000 may identify whether the application provides language data in the second language by analyzing the resource file.
  • the second language may be a language set as the default language in the device 1000.
  • the second language is a language in which the user wishes to be translated, and may be a language set based on user input.
  • the device 1000 may receive information on whether an application provides language data in a second language from an application providing server (not shown).
  • an application providing server not shown
  • the summary information of the application may be, for example, summary information provided when a predetermined application is selected from an application list provided by an application providing server (not shown), but is not limited thereto.
  • the device 1000 may execute the artificial intelligence model.
  • the operating system of the device 1000 may execute the artificial intelligence model.
  • the artificial intelligence model may be provided by the device 1000 or the server 2000.
  • the artificial intelligence model may be stored as software in a memory in the device 1000, or may be implemented by a hardware processor in the device 1000.
  • the artificial intelligence model may be stored as software in a memory in the server 2000, or may be implemented by a hardware processor in the device 1000.
  • the device 1000 may generate an execution screen including text in a second language using an artificial intelligence model.
  • the operating system of the device 1000 applies at least one of a resource file of an application, data related to the configuration of an application execution screen obtained from the resource file, and application information provided from an application providing server (not shown) to the artificial intelligence model. can do.
  • the operating system of the device 1000 may generate an application execution screen including the translated text using the translated text output from the artificial intelligence model.
  • the operating system of the device 1000 may acquire an application execution screen including translated text output from an artificial intelligence model.
  • the artificial intelligence model may include an artificial intelligence model that provides at least one of a screen analysis function, a text translation function, or a screen generation function.
  • the artificial intelligence model may include a model trained to analyze the execution screen of the application. In this case, information other than information on the screen configuration obtained from the resource file of the application may be obtained from the artificial intelligence model.
  • the artificial intelligence model may include a model trained to translate text in the execution screen of the application.
  • the artificial intelligence model may include a model generated by training criteria for generating an execution screen of an application including translated text. Criteria regarding what data to use to translate the text in the execution screen of the application and how to translate the text using the data may be set. In addition, criteria may be set as to what data to use to generate an execution screen of an application including translated text, and how to generate an application execution screen using text.
  • FIG. 4 is a flowchart of a method for acquiring data to be applied to an artificial intelligence model by a device according to some embodiments.
  • the device 1000 may obtain a resource file of the application.
  • the device 1000 may extract text to be displayed on the execution screen of the application from the resource file.
  • the device 1000 may extract text to be displayed on the application execution screen from among information related to configuring the application execution screen in the resource file.
  • the device 1000 may acquire text in the image by analyzing the image included in the application execution screen.
  • an artificial intelligence model trained to analyze the execution screen of the application may be used.
  • An artificial intelligence model trained to analyze an application's execution screen can identify text within the application's execution screen by analyzing an image of the application's execution screen.
  • the device 1000 may obtain character information of the extracted text.
  • the device 1000 may extract, for example, information about the font, font size, font spacing, font color, and line spacing of text to be displayed on the execution screen of the application from the resource file. If the device 1000 recognizes text from the image, the device 1000 may identify the font, text size, text spacing, text color, and line spacing of the text based on the recognized text shape.
  • the device 1000 may acquire location information of text in the execution screen of the application.
  • the device 1000 may obtain information about where text is placed in the execution screen of the application from a resource file. Also, the device 1000 may obtain information on an area of a portion where text is located in an execution screen of an application from a resource file.
  • the device 1000 recognizes text from the image, the device 1000 extracts information on the location and area of the image in the execution screen from the resource file, and extracts the position and extracted information of the text in the image. By using, it is possible to identify the position of the text in the execution screen.
  • the device 1000 may generate an execution screen translated into a second language while maintaining the layout of the application execution screen in the first language.
  • the device 1000 may generate an execution screen of the second language, which has a feeling similar to or substantially the same as the application execution screen of the first language.
  • the device 1000 may identify the category of the application.
  • the device 1000 may extract information about the category of the application from the resource file of the application.
  • the device 1000 may receive information regarding a category of an application from an application providing server (not shown).
  • the device 1000 may search the category of the application on the web using the identification value of the application.
  • the device 1000 may collect big data such as age, gender, and hobby of the main user of the application.
  • the device 1000 may translate the text using the artificial intelligence model.
  • the device 1000 may translate text to be displayed on the execution screen of the application by inputting at least some of the information obtained in operations S400 to S440 in the artificial intelligence model.
  • the device 1000 may translate text to be displayed on the execution screen of the application by inputting various information in addition to the information obtained in operations S400 to S440 in the artificial intelligence model.
  • the artificial intelligence model may be selected in consideration of application categories, user profiles, and the like.
  • the artificial intelligence model used for the translation of text may be learned using language information used in an application of a category similar to the application.
  • the artificial intelligence model used for the translation of text may be learned to translate text according to a preferred expression of the main user of the application.
  • FIG. 5 is a diagram illustrating an example in which text included in an execution screen of an application is translated according to some embodiments.
  • the execution screen of the application may include texts 50 and 51 of the first language.
  • the text 50 and the image 52 may be displayed in the execution screen of the application, and the image 50 may include a predetermined text 51.
  • the device 1000 may display an application execution screen including texts 55 and 56 translated into a second language.
  • the device 1000 may obtain text 50, text information of the text 50 and location information of the text 50 from the resource file of the application.
  • the device 1000 may acquire the text 55 translated into the second language by inputting the acquired text 50, text information of the text 50, and location information of the text 50 into the artificial intelligence model. You can.
  • the text 55 translated into the second language may be translated in consideration of the location and area where the text 55 translated into the second language will be displayed.
  • the text 50 of the first language may be translated into various expressions. In the application execution screen, in the area where the text 50 of the first language is placed, the translated text 55 may be placed. So that the text 50 can be translated.
  • the text 55 translated into the second language may have a font similar to the text 50 of the first language.
  • the font, font size, spacing, and line spacing of the text 55 translated into the second language may be determined in consideration of the location and area where the text 55 translated into the second language will be displayed.
  • the device 1000 may acquire the image 52 from the resource file of the application and recognize the text 51 in the image 52.
  • the device 1000 acquires the character information of the recognized text 51 and the location information of the text 51, and the artificial intelligence model of the text 51, the character information of the text 51 and the location information of the text 51
  • text 56 translated into the second language By inputting in, text 56 translated into the second language can be obtained.
  • the text 56 translated into the second language may be translated in consideration of the location and area where the text 56 translated into the second language will be displayed.
  • the text 51 of the first language may be translated into various expressions. In the region in which the text 52 of the first language is disposed in the execution screen of the application, the translated text 56 is placed. Text 52 can be translated so that
  • the text 56 translated into the second language may have a font similar to the text 51 of the first language.
  • the font, font size, spacing, and line spacing of the text 56 translated into the second language may be determined in consideration of the location and area where the text 56 translated into the second language will be displayed.
  • the device 1000 may generate an execution screen translated into a second language while maintaining the layout of the application execution screen in the first language.
  • the device 1000 may generate an execution screen of the second language, which has a feeling similar to or substantially the same as the application execution screen of the first language.
  • 6 to 10 are diagrams illustrating an example in which a device uses an artificial intelligence model according to some embodiments.
  • the basic language set in the device 1000 when the basic language set in the device 1000, text extracted from the resource file of the application, and text information of the extracted text are input to the first learning model 60, in the second language Translated text can be output.
  • the text output from the first learning model 60 may be used by the operating system of the device 1000 to generate an execution screen of the application.
  • the default language set in the device 1000 may be a second language.
  • the text translated into the second language may have fonts, font sizes, font colors, and font spacing, similar to the text extracted from the resource file, by reflecting the character information of the text extracted from the resource file.
  • the first learning model 60 may be an artificial intelligence model trained using an artificial intelligence algorithm to translate text in an execution screen of an application.
  • the first learning model 60 may be a model trained using the basic language set in the device 1000, text extracted from a resource file of an application, and text information of the extracted text as learning data.
  • the basic language set in the device 1000 text extracted from the resource file of the application, text information of the extracted text, category of the application, and location information of the text in the execution screen are second learning
  • text translated into the second language text information of the translated text, and location information in the execution screen of the translated text may be output.
  • text, character information, and location information output from the second learning model 70 may be used by the operating system of the device 1000 to generate an execution screen of the application.
  • the default language set in the device 1000 may be a second language.
  • the text translated into the second language reflects the character information of the text extracted from the resource file, the application category, and the location information of the text, and the font, font size, font color, and font similar to the text extracted from the resource file It may have an interval and may be displayed in a location similar to the location of text extracted from the resource file in the execution screen.
  • the second learning model 70 may be an artificial intelligence model trained using an artificial intelligence algorithm to translate text in an execution screen of an application.
  • the second learning model 70 includes, for example, a default language set in the device 1000, text extracted from an application resource file, text information of the extracted text, application category, and location information of text in an execution screen. It may be a trained model using as a training data.
  • the second learning model 70 may be, for example, a model trained using text of a second language used in other applications of the same or similar category as the application as training data.
  • the translation data may be language data conducive to the translation of text.
  • the translation data may include, for example, text in a second language used in other applications of the same or similar category to the category of the application.
  • the translation data may include cumulative data about the translated content translated in the same or similar category to the application category.
  • the text, character information, and location information output from the third learning model 80 may be used by the operating system of the device 1000 to generate an execution screen of the application.
  • the default language set in the device 1000 may be a second language.
  • the text before translation may be translated into a second language to have a feeling similar to the text before translation in the application execution screen, reflecting various information related to the configuration of the application execution screen in the resource file.
  • the third learning model 80 may be an artificial intelligence model trained using an artificial intelligence algorithm to translate text in an execution screen of an application.
  • the third learning model 80 may be, for example, a model trained using the basic language set in the device 1000, a resource file of an application, and translation data as learning data.
  • information output from the third learning model eg, text translated into a second language, text information of the translated text, and location information in an execution screen of the translated text
  • an application resource file When input to the fourth learning model 90, an execution screen of an application including translated text may be output.
  • the fourth learning model 90 may be an artificial intelligence model trained using an artificial intelligence algorithm to generate an execution screen of an application including translated text.
  • the fourth learning model 90 uses, for example, resource files of an application, text translated into a second language, text information of the translated text, and location information in an execution screen of the translated text as learning data It can be a trained model.
  • the fifth learning model 100 may be an artificial intelligence model trained using an artificial intelligence algorithm to translate text in an execution screen of the application and generate an application execution screen including the translated text.
  • the fourth learning model 80 may be, for example, a model trained using the basic language set in the device 1000, a resource file of an application, and translation data as learning data.
  • Examples of translating text or generating an application execution screen including translated text by using various information other than the text to be translated through various types of learning models have been described, but are not limited thereto. Does not. Different types and numbers of learning models than the learning models illustrated in FIGS. 6 to 10 may be used to translate text or to generate an application execution screen including translated text. In addition, different and more diverse information may be input to each learning model. Meanwhile, the artificial intelligence model may provide only a function for text translation. In this case, the device 1000 may acquire the translated text by inputting only the text requiring translation into the artificial intelligence model. In addition, the device 1000 may generate an execution screen of an application including the translated text by using various setting information related to the configuration of the application execution screen and the like with the translated text.
  • GUI graphical user interface
  • the device 1000 may generate an execution screen of the application through an API used by the operating system.
  • the device 1000 may configure an execution screen of the application to include translated text, and generate an application execution screen in an image format.
  • the device 1000 may set operation and link information corresponding to a predetermined object in the application execution screen using the resource file of the application.
  • the device 1000 may display the execution screen of the generated application.
  • the device 1000 may overlap the GUI for controlling the translation of text on the execution screen of the application.
  • the device 1000 may generate a GUI to modify the translated text in the execution screen of the application, and display the generated GUI by overlapping it on the execution screen of the application.
  • the GUI for controlling the translation of the text can be provided by the operating system of the device 1000 separately from the application.
  • the device 1000 may modify the translated text in the execution screen of the application according to user input through the overlapped GUI.
  • the operating system of the device 1000 may modify the translated text in the execution screen, and modify the application execution screen so that the application execution screen includes the modified text. have.
  • FIGS. 12 and 13 are diagrams illustrating an example in which a device displays a GUI for controlling translation of text on an application execution screen including translated text according to some embodiments.
  • a button 120 for calling a menu for controlling translation of text may be displayed on an application execution screen including translated text.
  • the user of the device 1000 may touch the button 120 to correct the translated text.
  • the device 1000 may display a menu 130 for controlling the translation of text.
  • the menu 130 may include an item for modifying the translation, an item for changing the language to be translated, and an item for viewing the original text.
  • the user may translate the translated text in the application's execution screen into another language, or view the original text of the translated text in the application's execution screen. Items within 130 may be touched.
  • the device 1000 may include a user input unit 1100, a display unit 1210, a control unit 1300, and a communication unit 1500. However, not all of the components illustrated in FIG. 14 are essential components of the device 1000. The device 1000 may be implemented by more components than those illustrated in FIG. 14, or the device 1000 may be implemented by fewer components than those illustrated in FIG. 14.
  • the device 1000 includes an output unit 1200 in addition to the user input unit 1100, the display unit 1210, the control unit 1300, and the communication unit 1500. ), A sensing unit 1400, an A / V input unit 1600, and a memory 1700 may be further included.
  • the user input unit 1100 refers to a means for a user to input data for controlling the device 1000.
  • the user input unit 1100 includes a key pad, a dome switch, and a touch pad (contact capacitive type, pressure resistive film type, infrared sensing type, surface ultrasonic conduction type, integral type) Tension measurement method, piezo effect method, etc.), a jog wheel, a jog switch, and the like, but are not limited thereto.
  • the user input unit 1100 may receive a user input for executing an application.
  • the output unit 1200 may output an audio signal, a video signal, or a vibration signal, and the output unit 1200 may include a display unit 1210, an audio output unit 1220, and a vibration motor 1230. have.
  • the display unit 1210 displays and outputs information processed by the device 1000.
  • the display 1210 may display an execution screen of the application and a GUI for translating and modifying text in the application.
  • the display unit 1210 may be used as an input device in addition to an output device.
  • the display unit 1210 includes a liquid crystal display, a thin film transistor-liquid crystal display, an organic light-emitting diode, a flexible display, and a three-dimensional display ( 3D display), and an electrophoretic display (electrophoretic display). Also, depending on the implementation form of the device 1000, the device 1000 may include two or more display units 1210.
  • the audio output unit 1220 outputs audio data received from the communication unit 1500 or stored in the memory 1700.
  • the vibration motor 1230 may output a vibration signal.
  • the vibration motor 1230 may output a vibration signal corresponding to the output of audio data or video data (eg, call signal reception sound, message reception sound, etc.).
  • the control unit 1300 typically controls the overall operation of the device 1000.
  • the control unit 1300 executes programs stored in the memory 1700, so that the user input unit 1100, the output unit 1200, the sensing unit 1400, the communication unit 1500, and the A / V input unit 1600 ) Etc. can be controlled overall.
  • the control unit 1300 may control the operation of the device 1000 in FIGS. 1 to 12 by executing an operating system (OS) program stored in the memory 1700.
  • the controller 1300 may include a processor that operates as an artificial intelligence model.
  • control unit 1300 may receive a user input for executing an application.
  • the control unit 1300 may receive a predetermined application from an application providing server (not shown) and install it in the device 1000, and may receive a user input for executing the installed application.
  • the application installed on the device 1000 may have the first language as the default language.
  • the control unit 1300 may obtain a resource file of the application through the operating system (OS).
  • the controller 1300 may store the resource file of the installed application in a memory (not shown), and access the resource file stored in the memory (not shown) through the operating system.
  • control unit 1300 may extract information necessary to configure the execution screen of the application from the resource file of the application before generating the execution screen of the application using the operating system (OS). For example, the control unit 1300 may acquire images and text to be included in an execution screen of an application from a resource file. Also, the control unit 1300 may recognize text in the acquired image.
  • OS operating system
  • the controller 1300 may extract various information necessary to translate text to be displayed in the execution screen of the application from the resource file. For example, the controller 1300 displays the size of the image to be displayed in the execution screen, the location where the image will be displayed in the execution screen, the font of the text to be displayed in the execution screen, text color, spacing, line spacing, and text in the execution screen. The location to be, and the category of the application can be extracted. In addition, for example, the controller 1300 may acquire information regarding a color of an image to be displayed in an execution screen and a type of object in the image.
  • the controller 1300 may translate the text of the first language to be displayed on the execution screen of the application into the second language using the artificial intelligence model.
  • the artificial intelligence model may be a learning model learned using an artificial intelligence algorithm for translation of an application.
  • the artificial intelligence model may be trained using at least one of a machine learning algorithm, a neural network algorithm, a genetic algorithm, a deep learning algorithm, and a classification algorithm.
  • the controller 1300 may translate the text of the first language to be displayed on the execution screen of the application into the second language by applying at least some of the data obtained in connection with the application to the artificial intelligence model.
  • the control unit 1300 may generate an execution screen of the application.
  • the controller 1300 may generate an execution screen of the application using the resource file of the application.
  • the controller 1300 may generate an execution screen of the application as an image at the API level.
  • the control unit 1300 may generate an execution screen of the application using information for configuring an execution screen in the resource file and the obtained text of the second language.
  • the controller 1300 executes the application in consideration of the size of the extracted image, the size of the translated text, the location of the image to be placed in the execution screen, and the location of the translated text to be placed in the execution screen. You can create a screen.
  • the controller 1300 may display an execution screen of the application.
  • the execution screen of the application is described using the translated text using the artificial intelligence model, but is not limited thereto.
  • the controller 1300 may directly generate an application execution screen including translated text by applying the acquired data to an artificial intelligence model.
  • control unit 1300 may determine whether the application provides language data in a second language.
  • the controller 1300 may identify whether the application provides language data in the second language by analyzing the resource file.
  • the second language may be a language set as the default language in the device 1000.
  • the second language is a language in which the user wishes to be translated, and may be a language set based on user input.
  • the control unit 1300 may execute an artificial intelligence model. As it is determined that the application does not provide language data of the second language, the controller 1300 can execute the artificial intelligence model. In this case, the artificial intelligence model may be provided by the device 1000 or the server 2000.
  • the controller 1300 may generate an execution screen including text in a second language using an artificial intelligence model.
  • the controller 1300 may apply at least one of a resource file of an application, data related to the configuration of an application execution screen obtained from the resource file, and application information provided from an application providing server (not shown) to the artificial intelligence model. .
  • control unit 1300 may generate an application execution screen including the translated text using the translated text output from the artificial intelligence model.
  • controller 1300 may acquire an application execution screen including translated text output from the artificial intelligence model.
  • the controller 1300 may generate an execution screen of the application through an API used by the operating system.
  • the control unit 1300 may configure an execution screen of the application to include translated text, and generate an application execution screen in an image format.
  • the control unit 1300 may set operation and link information corresponding to a predetermined object in the application execution screen using the resource file of the application.
  • the control unit 1300 may overlap a GUI for controlling the translation of text on the execution screen of the application.
  • the control unit 1300 may generate a GUI to modify the translated text in the execution screen of the application, and display the generated GUI by overlapping it on the execution screen of the application.
  • the GUI for controlling the translation of the text can be provided by the operating system of the device 1000 separately from the application.
  • the controller 1300 may modify the translated text in the execution screen of the application according to user input through the overlapped GUI.
  • the controller 1300 may modify the translated text in the execution screen, and modify the application execution screen so that the application execution screen includes the modified text.
  • the sensing unit 1400 may detect a state of the device 1000 or a state around the device 1000 and transmit the sensed information to the controller 1300.
  • the sensing unit 1400 includes a magnetic sensor 1410, an acceleration sensor 1420, a temperature / humidity sensor 1430, an infrared sensor 1440, a gyroscope sensor 1450, and a position sensor. (Eg, GPS) 1460, a barometric pressure sensor 1470, a proximity sensor 1480, and an RGB sensor (illuminance sensor) 1490, but may include at least one, but is not limited thereto.
  • GPS GPS
  • a barometric pressure sensor 1470 a proximity sensor 1480
  • RGB sensor luminance sensor
  • the communication unit 1500 may include one or more components to communicate with the server 2000 and other external devices.
  • the communication unit 1500 may include a short-range communication unit 1510, a mobile communication unit 1520, and a broadcast reception unit 1530.
  • the short-range wireless communication unit 151 includes a Bluetooth communication unit, a Bluetooth Low Energy (BLE) communication unit, a Near Field Communication unit, a WLAN (Wi-Fi) communication unit, a Zigbee communication unit, and an infrared ray ( IrDA, an infrared data association (WDA) communication unit, a WFD (Wi-Fi Direct) communication unit, a UWB (ultra wideband) communication unit, an Ant + communication unit, and the like, but are not limited thereto.
  • BLE Bluetooth Low Energy
  • Wi-Fi Wireless Fidelity
  • the mobile communication unit 1520 transmits and receives wireless signals to and from at least one of a base station, an external terminal, and a server on a mobile communication network.
  • the wireless signal may include various types of data according to transmission and reception of a voice call signal, a video call signal, or a text / multimedia message.
  • the broadcast receiving unit 1530 receives a broadcast signal and / or broadcast-related information from the outside through a broadcast channel.
  • the broadcast channel may include a satellite channel and a terrestrial channel.
  • the device 1000 may not include the broadcast receiving unit 1530.
  • the communication unit 1500 may transmit and receive information required to generate an execution screen of an application including translated text and translated text with the server 2000.
  • the A / V (Audio / Video) input unit 1600 is for inputting an audio signal or a video signal, which may include a camera 1610 and a microphone 1620.
  • the memory 1700 may store a program for processing and control of the control unit 1300, and may store data input to or output from the device 1000.
  • the memory 1700 is a flash memory type, a hard disk type, a multimedia card micro type, a card type memory (for example, SD or XD memory, etc.), RAM (RAM, Random Access Memory) SRAM (Static Random Access Memory), ROM (ROM, Read-Only Memory), EEPROM (Electrically Erasable Programmable Read-Only Memory), PROM (Programmable Read-Only Memory), magnetic memory, magnetic disk , It may include at least one type of storage medium of the optical disk.
  • Programs stored in the memory 1700 may be classified into a plurality of modules according to their functions.
  • the programs stored in the memory 1700 may be classified into a UI module 1710, a touch screen module 1720, and a notification module 1730. .
  • 16 is a block diagram of a server according to some embodiments.
  • the server 2000 may include a communication unit 2100, a storage unit 2200, and a processor 2300.
  • the communication unit 2100 may include one or more communication modules for communication with the device 1000.
  • the communication unit 2100 may include a short-range communication unit and a mobile communication unit.
  • Short-range wireless communication unit short-range wireless communication unit
  • Bluetooth communication unit Bluetooth Low Energy (BLE) communication unit
  • near field communication unit Near Field Communication unit
  • WLAN Wireless-Fi
  • Zigbee Zigbee
  • infrared IrDA, infrared
  • WTF WFD (Wi-Fi Direct) communication unit
  • UWB (ultra wideband) communication unit Ant + communication unit, and the like, but are not limited thereto.
  • the mobile communication unit transmits and receives wireless signals to and from at least one of a base station, an external terminal, and a server on a mobile communication network.
  • the wireless signal may include various types of data according to transmission and reception of a voice call signal, a video call signal, or a text / multimedia message.
  • the storage unit 2200 may store a program for controlling the operation of the server 2000.
  • the storage unit 2200 may include at least one instruction for controlling the operation of the server 2000.
  • the storage unit 2200 may include, for example, an artificial intelligence model for translating text in an application, language data regarding text of another application in the same category as the application category, data related to characteristics of the main user of the application, And translation history data of applications and other applications.
  • Programs stored in the storage unit 2200 may be classified into a plurality of modules according to their functions.
  • the processor 2300 may control the overall operation of the server 2000.
  • the processor 2300 may control the communication unit 2100 and the storage unit 2200 by executing programs stored in the storage unit 2200.
  • the processor 2300 may control the operation of the server 2000 in FIGS. 1 to 13 by controlling the communication unit 2100 and the storage unit 2200.
  • the processor 2300 may include a processor operating as an artificial intelligence model.
  • the processor 2300 may receive information for translating text in the execution screen of the application, and information for generating an application execution screen including the translated text from the device 1000.
  • the processor obtains or translates the translated text by applying the information for translating the text in the execution screen of the application and / or the information for generating the application execution screen including the translated text to the artificial intelligence model. It is possible to create an application execution screen including text.
  • the processor 2300 may apply information on text information of a text, a category of an application, a basic language of the device 1000, and attributes of a main user of the application to the artificial intelligence model.
  • the processor 2300 may provide the device 1000 with translated text, text information of the translated text, and information regarding the placement position of the translated text. Alternatively, the processor 2300 may provide an application execution screen including translated text to the device 1000.
  • the server 2000 may generate and manage an artificial intelligence model for translating text in the execution screen of the application or for generating an execution screen of the application including the translated text, and the device 1000 may include Using the artificial intelligence model managed by), it is possible to obtain an execution screen of an application including translated text.
  • the device 1000 may provide information regarding text that needs translation to the server 2000, and the server 2000 may provide information about the translated text to the device 1000.
  • the device 1000 may display the execution screen of the application including the translated text, using information about the translated text.
  • Computer readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media.
  • Computer readable media may include computer storage media and communication media.
  • Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.
  • Communication media may typically include computer readable instructions, data structures, or other data in a modulated data signal, such as a program module.
  • part may be a hardware component such as a processor or circuit, and / or a software component executed by a hardware component such as a processor.

Abstract

본 개시는 딥러닝 등의 기계 학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 인공지능(AI) 시스템 및 그 응용에 관련된 것이다. 디바이스가 애플리케이션의 번역 정보를 제공하는 방법은, 디바이스의 오퍼레이팅 시스템(OS)을 통하여 애플리케이션의 리소스 파일을 획득하는 동작; 인공 지능 모델을 이용하여, 상기 획득된 리소스 파일로부터 상기 애플리케이션의 실행 화면에 표시될 텍스트를 번역하는 동작; 상기 리소스 파일 및 상기 번역된 텍스트를 이용하여, 상기 애플리케이션의 실행 화면을 생성하는 동작; 및 상기 생성된 실행 화면을 디스플레이하는 동작;을 포함하며, 상기 번역하는 동작은, 상기 애플리케이션의 실행 화면에 표시될 텍스트를 번역하기 위하여 학습된 상기 인공 지능 모델에, 상기 리소스 파일 내의 데이터 중 적어도 일부를 적용함으로써, 제1 언어의 상기 텍스트를 제2 언어로 번역한다.

Description

애플리케이션의 번역 정보를 제공하는 디바이스 및 방법
본 개시는 애플리케이션의 번역 정보를 제공하는 디바이스 및 방법에 관한 것으로서, 보다 상세하게는 인공 지능 모델을 이용하여, 애플리케이션의 실행 화면 내의 텍스트를 번역하기 위한 디바이스 및 방법에 관한 것이다.
인공지능(Artificial Intelligence, AI) 시스템은 인간 수준의 지능을 구현하는 컴퓨터 시스템이며, 기존 Rule 기반 스마트 시스템과 달리 기계가 스스로 학습하고 판단하며 똑똑해지는 시스템이다. 인공지능 시스템은 사용할수록 인식률이 향상되고 사용자 취향을 보다 정확하게 이해할 수 있게 되어, 기존 Rule 기반 스마트 시스템은 점차 딥러닝 기반 인공지능 시스템으로 대체되고 있다.
인공지능 기술은 기계학습(딥러닝) 및 기계학습을 활용한 요소 기술들로 구성된다.
기계학습은 입력 데이터들의 특징을 스스로 분류/학습하는 알고리즘 기술이며, 요소기술은 딥러닝 등의 기계학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 기술로서, 언어적 이해, 시각적 이해, 추론/예측, 지식 표현, 동작 제어 등의 기술 분야로 구성된다.
인공지능 기술이 응용되는 다양한 분야는 다음과 같다. 언어적 이해는 인간의 언어/문자를 인식하고 응용/처리하는 기술로서, 자연어 처리, 기계 번역, 대화시스템, 질의 응답, 음성 인식/합성 등을 포함한다. 시각적 이해는 사물을 인간의 시각처럼 인식하여 처리하는 기술로서, 객체 인식, 객체 추적, 영상 검색, 사람 인식, 장면 이해, 공간 이해, 영상 개선 등을 포함한다. 추론 예측은 정보를 판단하여 논리적으로 추론하고 예측하는 기술로서, 지식/확률 기반 추론, 최적화 예측, 선호 기반 계획, 추천 등을 포함한다. 지식 표현은 인간의 경험정보를 지식데이터로 자동화 처리하는 기술로서, 지식 구축(데이터 생성/분류), 지식 관리(데이터 활용) 등을 포함한다. 동작 제어는 차량의 자율 주행, 로봇의 움직임을 제어하는 기술로서, 움직임 제어(항법, 충돌, 주행), 조작 제어(행동 제어) 등을 포함한다.
한편, 디바이스는 디바이스에 설치된 애플리케이션에서 소정의 언어에 대한 번역 데이터를 제공하지 않는 경우에, 애플리케이션의 실행 화면 내의 텍스트를 효과적으로 번역할 필요가 있다.
일부 실시예는, 디바이스의 오퍼레이팅 시스템(Operating System)이 인공 지능 모델을 이용하여 애플리케이션 내의 텍스트를 번역하기 위한 디바이스 및 방법을 제공할 수 있다.
또한, 일부 실시예는, 애플리케이션이 소정 언어의 번역 데이터를 제공하지 않는 경우에, 소정 언어로 번역된 텍스트를 포함하는 애플리케이션의 실행 화면을 생성하기 위한 디바이스 및 방법을 제공할 수 있다.
또한, 일부 실시예는, 디바이스가 애플리케이션 내의 텍스트를 번역하기 위한 인공 지능 모델을 효과적으로 학습시키고 이용할 수 있도록 하는, 디바이스 및 방법을 제공할 수 있다.
도 1은 일부 실시예에 따른 디바이스에 설치된 애플리케이션 내의 텍스트를 번역하기 위한 시스템을 나타내는 도면이다.
도 2는 일부 실시예에 따른 디바이스가 인공 지능 모델을 이용하여, 애플리케이션의 실행 화면에 표시될 텍스트를 번역하는 방법의 흐름도이다.
도 3은 일부 실시예에 따른 디바이스가 애플리케이션에 의해 제2 언어의 언어 데이터가 제공되는 지를 고려하여 번역을 실행하는 방법의 흐름도이다.
도 4는 일부 실시예에 따른 디바이스가 인공 지능 모델에 적용할 데이터를 획득하는 방법의 흐름도이다.
도 5는 일부 실시예에 따른 애플리케이션의 실행 화면에 포함된 텍스트가 번역되는 예시를 나타내는 도면이다.
도 6 내지 도 10은 일부 실시예에 따른 디바이스가 인공 지능 모델을 이용하는 예시를 나타내는 도면이다.
도 11은 일부 실시예에 따른 디바이스가 텍스트의 번역을 제어하기 위한 GUI (Graphical User Interface)를 제공하는 방법의 흐름도이다.
도 12 및 도 13은 일부 실시예에 따른 디바이스가 번역된 텍스트를 포함하는 애플리케이션 실행 화면 상에, 텍스트의 번역을 제어하기 위한 GUI를 디스플레이하는 예시를 나타내는 도면이다.
도 14 및 도 15는 일부 실시예에 따른 디바이스의 블록도이다.
도 16은 일부 실시예에 따른 서버의 블록도이다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 개시의 제 1 측면은, 디바이스에 설치된 애플리케이션을 실행하기 위한 사용자 입력을 수신하는 동작; 상기 사용자 입력에 응답하여, 상기 디바이스의 오퍼레이팅 시스템(OS)을 통하여 상기 애플리케이션의 리소스 파일을 획득하는 동작; 인공 지능 모델 및 상기 획득된 리소스 파일을 이용하여 상기 애플리케이션의 실행 화면에 표시될 텍스트를 번역하는 동작; 상기 리소스 파일 및 상기 번역된 텍스트를 이용하여, 상기 애플리케이션의 실행 화면을 생성하는 동작; 및 상기 생성된 실행 화면을 디스플레이하는 동작;을 포함하며, 상기 번역하는 동작은, 상기 애플리케이션의 실행 화면에 표시될 텍스트를 번역하기 위하여 학습된 상기 인공 지능 모델에, 상기 리소스 파일 내의 데이터 중 적어도 일부를 적용함으로써, 제1 언어의 상기 텍스트를 제2 언어로 번역하는 것인, 디바이스가 애플리케이션의 번역 정보를 제공하는 방법을 제공할 수 있다.
또한, 본 개시의 제2 측면은, 디스플레이; 메모리; 및 상기 디스플레이 및 상기 메모리를 제어하는 프로세서;를 포함하며,상기 프로세서는, 상기 디바이스에 설치된 애플리케이션을 실행하기 위한 사용자 입력을 수신하고, 상기 사용자 입력에 응답하여, 상기 디바이스의 오퍼레이팅 시스템(OS)을 통하여 상기 애플리케이션의 리소스 파일을 획득하고, 인공 지능 모델 및 상기 획득된 리소스 파일을 이용하여, 상기 애플리케이션의 실행 화면에 표시될 텍스트를 번역하고, 상기 리소스 파일 및 상기 번역된 텍스트를 이용하여, 상기 애플리케이션의 실행 화면을 생성하고, 상기 생성된 실행 화면을 디스플레이하며, 상기 프로세서는, 상기 애플리케이션의 실행 화면에 표시될 텍스트를 번역하기 위하여 학습된 상기 인공 지능 모델에, 상기 리소스 파일 내의 데이터 중 적어도 일부를 적용함으로써, 제1 언어의 상기 텍스트를 제2 언어로 번역하는 것인, 디바이스를 제공할 수 있다.
또한, 본 개시의 제3 측면은, 제 1 측면의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 포함하는 컴퓨터 프로그램 장치를 제공할 수 있다.
아래에서는 첨부한 도면을 참조하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 개시의 실시예를 상세히 설명한다. 그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
이하 첨부된 도면을 참고하여 본 개시를 상세히 설명하기로 한다.
도 1은 일부 실시예에 따른 디바이스에 설치된 애플리케이션 내의 텍스트를 번역하기 위한 시스템을 나타내는 도면이다.
도 1을 참조하면, 애플리케이션 내의 텍스트를 번역하기 위한 시스템은 디바이스(1000) 및 서버(2000)를 포함할 수 있다.
디바이스(1000)는 디바이스(1000)에 설치된 애플리케이션을 실행하고 실행된 애플리케이션의 실행 화면을 디스플레이할 수 있다. 애플리케이션은 제1 언어의 텍스트를 포함할 수 있으며, 디바이스(1000)에는 제2 언어가 기본 언어로 설정되어 있을 수 있다. 이 경우, 디바이스(1000)의 오퍼레이팅 시스템(Operating System)에서는 API (Application Program Interface) 레벨에서 애플리케이션의 리소스 파일을 분석함으로써, 애플리케이션의 실행 화면 내에 표시될 텍스트를 제2 언어로 번역할 수 있다.
디바이스(1000)는 애플리케이션의 실행 화면 내의 텍스트를 번역하기 위하여, 인공 지능 알고리즘에 기초하여 학습된 적어도 하나의 인공 지능 모델을 이용할 수 있다. 디바이스(1000)는 리소스 파일 또는 리소스 파일로부터 획득되는 각종 정보를 인공 지능 모델에 적용함으로써, 애플리케이션의 실행 화면 내의 텍스트를 번역할 수 있다.
인공 지능 모델은, 디바이스(1000) 또는 서버(2000)에 의해 제공될 수 있다. 인공 지능 모델은 디바이스(1000) 내의 메모리에 소프트웨어로 저장되거나, 디바이스(1000) 내의 하드웨어 프로세서에 의해 구현될 수 있다. 또는, 인공 지능 모델은 서버(2000) 내의 메모리에 소프트웨어로 저장되거나, 디바이스(1000) 내의 하드웨어 프로세서에 의해 구현될 수 있다.
디바이스(1000)는 스마트폰, 태블릿 PC, PC, 스마트 TV, 휴대폰, PDA(personal digital assistant), 랩톱, 미디어 플레이어, 마이크로 서버, GPS(global positioning system) 장치, 전자책 단말기, 디지털방송용 단말기, 네비게이션, 키오스크, MP3 플레이어, 디지털 카메라, 가전기기 및 기타 모바일 또는 비모바일 컴퓨팅 장치일 수 있으나, 이에 제한되지 않는다. 또한, 디바이스(1000)는 통신 기능 및 데이터 프로세싱 기능을 구비한 시계, 안경, 헤어 밴드 및 반지 등의 웨어러블 디바이스일 수 있다. 그러나, 이에 제한되지 않으며, 디바이스(1000)는 애플리케이션을 설치하고 실행할 수 있는 모든 종류의 기기를 포함할 수 있다.
네트워크는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN), 부가가치 통신망(Value Added Network; VAN), 이동 통신망(mobile radio communication network), 위성 통신망 및 이들의 상호 조합을 포함하며, 도 1에 도시된 각 네트워크 구성 주체가 서로 원활하게 통신을 할 수 있도록 하는 포괄적인 의미의 데이터 통신망이며, 유선 인터넷, 무선 인터넷 및 모바일 무선 통신망을 포함할 수 있다. 무선 통신은 예를 들어, 무선 랜(Wi-Fi), 블루투스, 블루투스 저 에너지(Bluetooth low energy), 지그비, WFD(Wi-Fi Direct), UWB(ultra wideband), 적외선 통신(IrDA, infrared Data Association), NFC(Near Field Communication) 등이 있을 수 있으나, 이에 한정되는 것은 아니다.
본 개시에 따른 인공 지능과 관련된 기능은 프로세서와 메모리를 통해 동작된다. 프로세서는 하나 또는 복수의 프로세서로 구성될 수 있다. 이때, 하나 또는 복수의 프로세서는 CPU, AP, DSP(Digital Signal Processor) 등과 같은 범용 프로세서, GPU, VPU(Vision Processing Unit)와 같은 그래픽 전용 프로세서 또는 NPU와 같은 인공지능 전용 프로세서일 수 있다. 하나 또는 복수의 프로세서는, 메모리에 저장된 기 정의된 동작 규칙 또는 인공지능 모델에 따라, 입력 데이터를 처리하도록 제어한다. 또는, 하나 또는 복수의 프로세서가 인공지능 전용 프로세서인 경우, 인공지능 전용 프로세서는, 특정 인공지능 모델의 처리에 특화된 하드웨어 구조로 설계될 수 있다.
기 정의된 동작 규칙 또는 인공지능 모델은 학습을 통해 만들어진 것을 특징으로 한다. 여기서, 학습을 통해 만들어진다는 것은, 기본 인공지능 모델이 학습 알고리즘에 의하여 다수의 학습 데이터들을 이용하여 학습됨으로써, 원하는 특성(또는, 목적)을 수행하도록 설정된 기 정의된 동작 규칙 또는 인공지능 모델이 만들어짐을 의미한다. 이러한 학습은 본 개시에 따른 인공지능이 수행되는 기기 자체에서 이루어질 수도 있고, 별도의 서버 및/또는 시스템을 통해 이루어 질 수도 있다. 학습 알고리즘의 예로는, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)이 있으나, 전술한 예에 한정되지 않는다.
인공지능 모델은, 복수의 신경망 레이어들로 구성될 수 있다. 복수의 신경망 레이어들 각각은 복수의 가중치들(weight values)을 갖고 있으며, 이전(previous) 레이어의 연산 결과와 복수의 가중치들 간의 연산을 통해 신경망 연산을 수행한다. 복수의 신경망 레이어들이 갖고 있는 복수의 가중치들은 인공지능 모델의 학습 결과에 의해 최적화될 수 있다. 예를 들어, 학습 과정 동안 인공지능 모델에서 획득한 로스(loss) 값 또는 코스트(cost) 값이 감소 또는 최소화되도록 복수의 가중치들이 갱신될 수 있다. 인공 신경망은 심층 신경망(DNN:Deep Neural Network)를 포함할 수 있으며, 예를 들어, CNN (Convolutional Neural Network), DNN (Deep Neural Network), RNN (Recurrent Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN(Bidirectional Recurrent Deep Neural Network) 또는 심층 Q-네트워크 (Deep Q-Networks) 등이 있으나, 전술한 예에 한정되지 않는다.
도 2는 일부 실시예에 따른 디바이스가 인공 지능 모델을 이용하여, 애플리케이션의 실행 화면에 표시될 텍스트를 번역하는 방법의 흐름도이다.
동작 S200에서 디바이스(1000)는, 애플리케이션을 실행하기 위한 사용자 입력을 수신할 수 있다. 디바이스(1000)는 디바이스(1000)에서 실행될 애플리케이션에 대한 사용자 입력을 수신할 수 있다. 디바이스(1000)는 애플리케이션을 다운로드하기 위한 애플리케이션 제공 서버(미도시)에 접속하고, 애플리케이션 제공 서버(미도시)에 의해 제공되는 애플리케이션들 중에서 다운로드할 애플리케이션을 선택하는 사용자 입력을 수신할 수 있다. 또는, 디바이스(1000)는 애플리케이션을 설치하기 위한 사용자 입력을 수신할 수 있다. 또는, 디바이스(1000)는 디바이스(1000)에 설치된 애플리케이션들 중에서 실행할 애플리케이션을 선택하는 사용자 입력을 수신할 수 있다. 디바이스(1000)에 설치된 또는 설치될 애플리케이션은 제1 언어를 기본 언어로 가질 수 있다.
동작 S210에서 디바이스(1000)는 오퍼레이팅 시스템(OS)을 통하여, 애플리케이션의 리소스 파일을 획득할 수 있다. 디바이스(1000)는 설치된 애플리케이션의 리소스 파일을 메모리(미도시)에 저장할 수 있으며, 디바이스(1000)의 오퍼레이팅 시스템을 통하여 메모리(미도시)에 저장된 리소스 파일에 액서스할 수 있다. 또한, 디바이스(1000)는 애플리케이션 제공 서버(미도시)로부터 다운로드된 애플리케이션으로부터 애플리케이션 리소스 파일을 획득할 수 있다. 또한, 디바이스(1000)는 다운로드된 애플리케이션을 설치하면서, 애플리케이션의 리소스 파일을 획득할 수 있다.
또한, 디바이스(1000)의 오퍼레이팅 시스템 (OS)은 애플리케이션의 실행 화면을 생성하기 이전에, 애플리케이션의 실행 화면을 구성하기 위하여 필요한 정보를 애플리케이션의 리소스 파일로부터 추출할 수 있다. 예를 들어, 오퍼레이팅 시스템은, 애플리케이션의 실행 화면 내에 포함될 이미지 및 텍스트를 리소스 파일로부터 획득할 수 있다. 또한, 오퍼레이팅 시스템은, 획득된 이미지 내의 텍스트를 인식할 수 있다.
또한, 디바이스(1000)의 오퍼레이팅 시스템은 리소스 파일로부터, 애플리케이션의 실행 화면 내에 표시될 텍스트를 번역하기 위하여 필요한 각종 정보를 추출할 수 있다. 예를 들어, 디바이스(1000)의 오퍼레이팅 시스템은 실행 화면 내에 표시될 이미지의 크기, 실행 화면 내에 이미지가 표시될 위치, 실행 화면 내에 표시될 텍스트의 폰트, 글자 색, 자간, 줄 간격, 실행 화면 내에 텍스트가 표시될 위치, 및 애플리케이션의 카테고리 등을 추출할 수 있다. 또한, 예를 들어, 디바이스(1000)의 오퍼레이팅 시스템은, 실행 화면 내에 표시될 이미지의 색상 및 이미지 내의 객체의 종류 등에 관한 정보를 획득할 수 있다.
동작 S220에서 디바이스(1000)는 인공 지능 모델을 이용하여, 애플리케이션의 실행 화면에 표시될 제1 언어의 텍스트를 제2 언어로 번역할 수 있다. 인공 지능 모델은, 애플리케이션 내의 텍스트를 번역을 위하여 인공 지능 알고리즘을 이용하여 훈련된 학습 모델일 수 있다. 예를 들어, 인공 지능 모델은, 기계 학습 알고리즘, 신경망 알고리즘, 유전자 알고리즘, 딥러닝 알고리즘 및 분류 알고리즘 중 적어도 하나를 이용하여 학습된 것일 수 있다.
디바이스(1000)의 오퍼레이팅 시스템은 동작 S210에서 획득된 데이터 중 적어도 일부를 인공 지능 모델에 적용함으로써, 애플리케이션의 실행 화면에 표시될 제1 언어의 텍스트를 제2 언어로 번역할 수 있다.
동작 S230에서 디바이스(1000)는 애플리케이션의 실행 화면을 생성할 수 있다. 디바이스(1000)의 오퍼레이팅 시스템은 애플리케이션의 리소스 파일을 이용하여 애플리케이션의 실행 화면을 생성할 수 있다. 예를 들어, 디바이스(1000)의 오퍼레이팅 시스템은 API 레벨에서 애플리케이션의 실행 화면을 이미지로 생성할 수 있다. 디바이스(1000)의 오퍼레이팅 시스템은, 리소스 파일 내의 실행 화면을 구성하기 위한 정보 및 동작 S220에서 획득된 제2 언어의 텍스트를 이용하여, 애플리케이션의 실행 화면을 생성할 수 있다. 또한, 예를 들어, 디바이스(1000)의 오퍼레이팅 시스템은 추출된 이미지의 크기, 번역된 텍스트의 크기, 실행 화면 내에 배치될 이미지의 위치, 및 실행 화면 내에 배치될 번역된 텍스트의 위치를 고려하여, 애플리케이션의 실행 화면을 생성할 수 있다. 이 경우, 디바이스(1000)는 애플리케이션의 실행 화면의 레이아웃을 유지할 수 있도록, 번역된 텍스트, 및 번역된 텍스트의 크기를 결정할 수 있다.
동작 S240에서 디바이스(1000)는 애플리케이션의 실행 화면을 디스플레이할 수 있다.
상기에서는 인공 지능 모델을 이용하여 번역된 텍스트를 이용하여 애플리케이션의 실행 화면을 생성하는 것으로 설명되었지만, 이에 제한되지 않는다. 디바이스(1000)의 오퍼레이팅 시스템은 동작 S210에서 획득된 데이터를 인공 지능 모델에 적용함으로써, 번역된 텍스트를 포함하는 애플리케이션 실행 화면을 바로 생성할 수도 있다.
도 3은 일부 실시예에 따른 디바이스가 애플리케이션에 의해 제2 언어의 언어 데이터가 제공되는 지를 고려하여 번역을 실행하는 방법의 흐름도이다.
동작 S300에서 디바이스(1000)는 애플리케이션의 리소스 파일을 획득할 수 있다.
동작 S310에서 디바이스(1000)는 애플리케이션이 제2 언어의 언어 데이터를 제공하는 지를 판단할 수 있다. 디바이스(1000)의 오퍼레이팅 시스템은 리소스 파일을 분석함으로써, 애플리케이션이 제2 언어의 언어 데이터를 제공하는 지를 식별할 수 있다. 이 경우, 예를 들어, 제2 언어는 디바이스(1000)에 기본 언어로 설정된 언어일 수 있다. 또는, 제2 언어는 사용자가 번역되기를 희망하는 언어로서, 사용자 입력에 기초하여 설정된 언어일 수 있다.
또는, 디바이스(1000)는 애플리케이션이 제2 언어의 언어 데이터를 제공하는 지에 관한 정보를 애플리케이션 제공 서버(미도시)로부터 수신할 수 있다. 이 경우, 애플리케이션 제공 서버(미도시)로부터 애플리케이션에 관련된 요약 정보를 수신하고, 요약 정보에 기초하여 애플리케이션이 제2 언어의 언어 데이터를 제공하는 지를 판단할 수 있다. 이 경우, 애플리케이션의 요약 정보는, 예를 들어, 애플리케이션 제공 서버(미도시)에 의해 제공되는 애플리케이션 리스트에서 소정 애플리케이션을 선택하였을 때 제공되는 요약 정보일 수 있으나, 이에 제한되지 않는다.
동작 S320에서 디바이스(1000)는 인공 지능 모델을 실행할 수 있다. 애플리케이션이 제2 언어의 언어 데이터를 제공하지 않는다고 판단됨에 따라, 디바이스(1000)의 오퍼레이팅 시스템은 인공 지능 모델을 실행할 수 있다. 이 경우, 인공 지능 모델은, 디바이스(1000) 또는 서버(2000)에 의해 제공될 수 있다. 인공 지능 모델은 디바이스(1000) 내의 메모리에 소프트웨어로 저장되거나, 디바이스(1000) 내의 하드웨어 프로세서에 의해 구현될 수 있다. 또는, 인공 지능 모델은 서버(2000) 내의 메모리에 소프트웨어로 저장되거나, 디바이스(1000) 내의 하드웨어 프로세서에 의해 구현될 수 있다.
동작 S330에서 디바이스(1000)는 인공 지능 모델을 이용하여, 제2 언어의 텍스트를 포함하는 실행 화면을 생성할 수 있다. 디바이스(1000)의 오퍼레이팅 시스템은, 애플리케이션의 리소스 파일, 리소스 파일로부터 획득되는 애플리케이션 실행 화면의 구성에 관련된 데이터, 및 애플리케이션 제공 서버(미도시)로부터 제공되는 애플리케이션 정보 중 적어도 하나를 인공 지능 모델에 적용할 수 있다.
또한, 디바이스(1000)의 오퍼레이팅 시스템은 인공 지능 모델로부터 출력되는 번역된 텍스트를 이용하여, 번역된 텍스트를 포함하는 애플리케이션 실행 화면을 생성할 수 있다. 또는, 디바이스(1000)의 오퍼레이팅 시스템은 인공 지능 모델로부터 출력되는 번역된 텍스트를 포함하는 애플리케이션 실행 화면을 획득할 수 있다.
한편, 인공 지능 모델은, 화면 분석 기능, 텍스트 번역 기능 또는 화면 생성 기능 중 적어도 하나의 기능을 제공하는 인공 지능 모델을 포함할 수 있다. 예를 들어, 인공 지능 모델은, 애플리케이션의 실행 화면을 분석하기 위하여 훈련된 모델을 포함할 수 있다. 이 경우, 애플리케이션의 리소스 파일로부터 획득되는 화면 구성에 관한 정보 이외의 다른 정보가 인공 지능 모델로부터 획득될 수 있다. 또한, 인공 지능 모델은, 애플리케이션의 실행 화면 내의 텍스트를 번역하기 위하여 훈련된 모델을 포함할 수 있다. 또한, 인공 지능 모델은 번역된 텍스트를 포함하는 애플리케이션의 실행 화면을 생성하기 위한 기준을 훈련함으로써 생성된 모델을 포함할 수 있다. 애플리케이션의 실행 화면 내의 텍스트를 번역하기 위하여 어떤 데이터를 이용할 지, 데이터를 이용하여 텍스트를 어떻게 번역할 지에 관한 기준이 설정될 수 있다. 또한, 번역된 텍스트를 포함하는 애플리케이션의 실행 화면을 생성하기 위하여 어떤 데이터를 이용할 지, 데이터를 이용하여 텍스트를 어떻게 애플리케이션 실행 화면을 생성할 지에 관한 기준이 설정될 수 있다.
도 4는 일부 실시예에 따른 디바이스가 인공 지능 모델에 적용할 데이터를 획득하는 방법의 흐름도이다.
동작 S400에서 디바이스(1000)는 애플리케이션의 리소스 파일을 획득할 수 있다.
동작 S410에서 디바이스(1000)는 리소스 파일로부터, 애플리케이션의 실행 화면에 표시될 텍스트를 추출할 수 있다. 디바이스(1000)는 리소스 파일 내의 애플리케이션 실행 화면을 구성에 관련된 정보들 중에서 애플리케이션 실행 화면에 표시될 텍스트를 추출할 수 있다. 또한, 디바이스(1000)는 애플리케이션 실행 화면에 포함되는 이미지를 분석함으로써 이미지 내의 텍스트를 획득할 수 있다. 이 경우, 애플리케이션의 실행 화면을 분석하기 위해 훈련된 인공 지능 모델이 이용될 수 있다. 애플리케이션의 실행 화면을 분석하기 위해 훈련된 인공 지능 모델은 애플리케이션의 실행 화면의 이미지를 분석함으로써 애플리케이션의 실행 화면 내의 텍스트를 식별할 수 있다.
동작 S420에서 디바이스(1000)는 추출된 텍스트의 글자 정보를 획득할 수 있다. 디바이스(1000)는, 예를 들어, 애플리케이션의 실행 화면에 표시될 텍스트의 폰트, 글자 크기, 글자 간격, 글자색, 줄 간격에 관한 정보를 리소스 파일로부터 추출할 수 있다. 만약, 디바이스(1000)가 이미지로부터 텍스트를 인식하였다면, 디바이스(1000)는 인식된 텍스트의 모양에 기초하여, 텍스트의 폰트, 글자 크기, 글자 간격, 글자색 및 줄 간격을 식별할 수 있다.
동작 S430에서 디바이스(1000)는 애플리케이션의 실행 화면 내의 텍스트의 위치 정보를 획득할 수 있다. 디바이스(1000)는 애플리케이션의 실행 화면 내에서 텍스트가 어느 위치에 배치되는 지에 관한 정보를, 리소스 파일로부터 획득할 수 있다. 또한, 디바이스(1000)가 애플리케이션의 실행 화면 내에서 텍스트가 위치하는 부분의 면적에 관한 정보를, 리소스 파일로부터 획득할 수 있다.
만약, 디바이스(1000)가 이미지로부터 텍스트를 인식하였다면, 디바이스(1000)는 실행 화면 내에서 이미지가 배치되는 위치 및 면적에 관한 정보를 리소스 파일로부터 추출하고, 이미지 내의 텍스트의 위치 및 추출된 정보를 이용하여, 실행 화면 내의 텍스트의 위치를 식별할 수 있다.
이에 따라, 디바이스(1000)는 제1 언어의 애플리케이션 실행 화면의 레이아웃을 유지하면서, 제2 언어로 번역된 실행 화면을 생성할 수 있게 된다. 또한, 디바이스(1000)는 제1 언어의 애플리케이션 실행 화면과 유사하거나 실질적으로 동일한 느낌을 가지는, 제2 언어의 실행 화면을 생성할 수 있게 된다.
동작 S440에서 디바이스(1000)는 애플리케이션의 카테고리를 식별할 수 있다. 디바이스(1000)는 애플리케이션의 리소스 파일로부터 애플리케이션의 카테고리에 관한 정보를 추출할 수 있다. 디바이스(1000)는 애플리케이션 제공 서버(미도시)로부터 애플리케이션의 카테고리에 관한 정보를 수신할 수 있다. 디바이스(1000)는 애플리케이션의 식별 값을 이용하여, 웹에서 애플리케이션의 카테고리를 검색할 수 있다.
한편, 디바이스(1000)는 애플리케이션의 주 사용자의 나이대, 성별, 및 취미 등의 빅 데이터를 수집할 수 있다.
동작 S450에서 디바이스(1000)는 인공 지능 모델을 이용하여 텍스트를 번역할 수 있다. 디바이스(1000)는 인공 지능 모델에 동작 S400 내지 S440에서 획득된 정보들 중 적어도 일부를 입력함으로써, 애플리케이션의 실행 화면에 표시될 텍스트를 번역할 수 있다.
한편, 디바이스(1000)는 인공 지능 모델에 동작 S400 내지 S440에서 획득된 정보 외에 다양한 정보를 입력함으로써, 애플리케이션의 실행 화면에 표시될 텍스트를 번역할 수도 있다.
이 경우, 인공 지능 모델은, 애플리케이션의 카테고리, 사용자 프로필 등을 고려하여, 선택된 것일 수 있다. 예를 들어, 텍스트의 번역에 이용되는 인공 지능 모델은, 애플리케이션과 유사한 카테고리의 애플리케이션에서 사용되는 언어 정보를 이용하여 학습된 것일 수 있다. 또한, 텍스트의 번역에 이용되는 인공 지능 모델은, 애플리케이션의 주 사용자가 선호하는 표현에 따라 텍스트를 번역할 수 있도록 학습된 것일 수 있다.
도 5는 일부 실시예에 따른 애플리케이션의 실행 화면에 포함된 텍스트가 번역되는 예시를 나타내는 도면이다.
도 5의 식별 번호 5-1을 참조하면, 애플리케이션의 실행 화면은, 제1 언어의 텍스트(50, 51)를 포함할 수 있다. 애플리케이션의 실행 화면 내에는 텍스트(50) 및 이미지(52)가 표시될 수 있으며, 이미지(50)는 소정의 텍스트(51)을 포함할 수 있다.
도 5의 식별 번호 5-2를 참조하면, 디바이스(1000)는 제2 언어로 번역된 텍스트(55, 56)를 포함하는 애플리케이션 실행 화면을 디스플레이할 수 있다.
디바이스(1000)는 애플리케이션의 리소스 파일로부터 텍스트(50), 텍스트(50)의 글자 정보 및 텍스트(50)의 위치 정보를 획득할 수 있다. 또한, 디바이스(1000)는 획득된 텍스트(50), 텍스트(50)의 글자 정보 및 텍스트(50)의 위치 정보를 인공 지능 모델에 입력함으로써, 제2 언어로 번역된 텍스트(55)를 획득할 수 있다. 이 경우, 제2 언어로 번역된 텍스트(55)는 제2 언어로 번역된 텍스트(55)가 표시될 위치 및 면적을 고려하여 번역된 것일 수 있다. 예를 들어, 제1 언어의 텍스트(50)은 여러 표현으로 번역될 수 있는데, 애플리케이션 실행 화면 내에서 제1 언어의 텍스트(50)가 배치된 영역에, 번역된 텍스트(55)가 배치될 수 있도록 텍스트(50)가 번역될 수 있다.
또한, 제2 언어로 번역된 텍스트(55)는 제1 언어의 텍스트(50)와 유사한 느낌의 폰트를 가질 수 있다. 또한, 제2 언어로 번역된 텍스트(55)가 표시될 위치 및 면적을 고려하여, 제2 언어로 번역된 텍스트(55)의 폰트, 글자 크기, 자간 및 줄 간격이 결정될 수 있다.
또한, 디바이스(1000)는 애플리케이션의 리소스 파일로부터 이미지(52)를 획득하고, 이미지(52) 내의 텍스트(51)을 인식할 수 있다. 디바이스(1000)는 인식된 텍스트(51)의 글자 정보 및 텍스트(51)의 위치 정보를 획득하고, 텍스트(51), 텍스트(51)의 글자 정보 및 텍스트(51)의 위치 정보를 인공 지능 모델에 입력함으로써, 제2 언어로 번역된 텍스트(56)를 획득할 수 있다. 이 경우, 제2 언어로 번역된 텍스트(56)는 제2 언어로 번역된 텍스트(56)가 표시될 위치 및 면적을 고려하여 번역된 것일 수 있다. 예를 들어, 제1 언어의 텍스트(51)은 여러 표현으로 번역될 수 있는데, 애플리케이션의 실행 화면 내에서 제1 언어의 텍스트(52)가 배치된 영역에, 번역된 텍스트(56)가 배치될 수 있도록 텍스트(52)가 번역될 수 있다.
또한, 제2 언어로 번역된 텍스트(56)는 제1 언어의 텍스트(51)와 유사한 느낌의 폰트를 가질 수 있다. 또한, 제2 언어로 번역된 텍스트(56)가 표시될 위치 및 면적을 고려하여, 제2 언어로 번역된 텍스트(56)의 폰트, 글자 크기, 자간 및 줄 간격이 결정될 수 있다.
이에 따라, 디바이스(1000)는 제1 언어의 애플리케이션 실행 화면의 레이아웃을 유지하면서, 제2 언어로 번역된 실행 화면을 생성할 수 있게 된다. 또한, 디바이스(1000)는 제1 언어의 애플리케이션 실행 화면과 유사하거나 실질적으로 동일한 느낌을 가지는, 제2 언어의 실행 화면을 생성할 수 있게 된다.
도 6 내지 도 10은 일부 실시예에 따른 디바이스가 인공 지능 모델을 이용하는 예시를 나타내는 도면이다.
도 6을 참조하면, 예를 들어, 디바이스(1000)에 설정된 기본 언어, 애플리케이션의 리소스 파일로부터 추출된 텍스트, 추출된 텍스트의 글자 정보가 제1 학습 모델(60)에 입력되면, 제2 언어로 번역된 텍스트가 출력될 수 있다. 또한, 제1 학습 모델(60)로부터 출력된 텍스트는 디바이스(1000)의 오퍼레이팅 시스템이 애플리케이션의 실행 화면을 생성하는데 이용될 수 있다.
이 경우, 디바이스(1000)에 설정된 기본 언어는 제2 언어일 수 있다. 제2 언어로 번역된 텍스트는, 리소스 파일로부터 추출된 텍스트의 글자 정보를 반영하여, 리소스 파일로부터 추출된 텍스트와 유사한 느낌의 폰트, 글자 크기, 글자 색상 및 글자 간격을 가질 수 있다.
제1 학습 모델(60)은, 애플리케이션의 실행 화면 내의 텍스트를 번역하기 위하여 인공 지능 알고리즘을 이용하여 학습된 인공 지능 모델일 수 있다. 제1 학습 모델(60)은, 디바이스(1000)에 설정된 기본 언어, 애플리케이션의 리소스 파일로부터 추출된 텍스트, 추출된 텍스트의 글자 정보를 학습 데이터로 이용하여 학습된 모델일 수 있다.
도 7을 참조하면, 예를 들어, 디바이스(1000)에 설정된 기본 언어, 애플리케이션의 리소스 파일로부터 추출된 텍스트, 추출된 텍스트의 글자 정보, 애플리케이션의 카테고리, 실행 화면 내의 텍스트의 위치 정보가 제2 학습 모델(70)에 입력되면, 제2 언어로 번역된 텍스트, 번역된 텍스트의 글자 정보 및 번역된 텍스트의 실행 화면 내에서의 위치 정보가 출력될 수 있다. 또한, 제2 학습 모델(70)로부터 출력된 텍스트, 글자 정보 및 위치 정보는 디바이스(1000)의 오퍼레이팅 시스템이 애플리케이션의 실행 화면을 생성하는데 이용될 수 있다.
이 경우, 디바이스(1000)에 설정된 기본 언어는 제2 언어일 수 있다. 제2 언어로 번역된 텍스트는, 리소스 파일로부터 추출된 텍스트의 글자 정보, 애플리케이션의 카테고리 및 텍스트의 위치 정보를 반영하여, 리소스 파일로부터 추출된 텍스트와 유사한 느낌의 폰트, 글자 크기, 글자 색상 및 글자 간격을 가질 수 있으며, 실행 화면 내에서 리소스 파일로부터 추출된 텍스트의 위치와 유사한 위치에 표시될 수 있다.
또한, 제2 학습 모델(70)은, 애플리케이션의 실행 화면 내의 텍스트를 번역하기 위하여 인공 지능 알고리즘을 이용하여 학습된 인공 지능 모델일 수 있다. 제2 학습 모델(70)은, 예를 들어, 디바이스(1000)에 설정된 기본 언어, 애플리케이션의 리소스 파일로부터 추출된 텍스트, 추출된 텍스트의 글자 정보, 애플리케이션의 카테고리, 실행 화면 내의 텍스트의 위치 정보 등을 학습 데이터로 이용하여 학습된 모델일 수 있다. 제2 학습 모델(70)은, 예를 들어, 애플리케이션과 동일하거나 유사한 카테고리의 다른 애플리케이션에서 사용된 제2 언어의 텍스트를 학습 데이터로 이용하여 학습된 모델일 수 있다.
도 8을 참조하면, 예를 들어, 애플리케이션의 리소스 파일, 번역 데이터가 제3 학습 모델(80)에 입력되면, 제2 언어로 번역된 텍스트, 번역된 텍스트의 글자 정보 및 번역된 텍스트의 실행 화면 내에서의 위치 정보가 출력될 수 있다. 번역 데이터는 텍스트의 번역에 도움이 되는 언어 데이터일 수 있다. 번역 데이터는, 예를 들어, 애플리케이션의 카테고리와 동일 또는 유사한 카테고리의 다른 애플리케이션에서 사용된 제2 언어의 텍스트를 포함할 수 있다. 또한, 번역 데이터는, 애플리케이션의 카테고리와 동일 또는 유사한 카테고리에서 번역된 번역 내용에 관한 누적 데이터를 포함할 수 있다. 제3 학습 모델(80)로부터 출력된 텍스트, 글자 정보 및 위치 정보는 디바이스(1000)의 오퍼레이팅 시스템이 애플리케이션의 실행 화면을 생성하는데 이용될 수 있다.
이 경우, 디바이스(1000)에 설정된 기본 언어는 제2 언어일 수 있다. 번역 전의 텍스트는, 리소스 파일 내의 애플리케이션 실행 화면의 구성에 관련된 다양한 정보를 반영하여, 애플리케이션 실행 화면 내에서 번역 전의 텍스트와 유사한 느낌을 가지도록 제2 언어로 번역될 수 있다.
또한, 제3 학습 모델(80)은, 애플리케이션의 실행 화면 내의 텍스트를 번역하기 위하여 인공 지능 알고리즘을 이용하여 학습된 인공 지능 모델일 수 있다. 제3 학습 모델(80)은, 예를 들어, 디바이스(1000)에 설정된 기본 언어, 애플리케이션의 리소스 파일, 번역 데이터를 학습 데이터로 이용하여 학습된 모델일 수 있다.
도 9를 참조하면, 제3 학습 모델로부터 출력된 정보들 (예컨대, 제2 언어로 번역된 텍스트, 번역된 텍스트의 글자 정보 및 번역된 텍스트의 실행 화면 내에서의 위치 정보) 및 애플리케이션 리소스 파일이 제4 학습 모델(90)에 입력되면, 번역된 텍스트를 포함하는 애플리케이션의 실행 화면이 출력될 수 있다.
제4 학습 모델(90)은, 번역된 텍스트를 포함하는 애플리케이션의 실행 화면을 생성하기 위하여 인공 지능 알고리즘을 이용하여 학습된 인공 지능 모델일 수 있다. 제4 학습 모델(90)은, 예를 들어, 애플리케이션의 리소스 파일, 제2 언어로 번역된 텍스트, 번역된 텍스트의 글자 정보 및 번역된 텍스트의 실행 화면 내에서의 위치 정보를 학습 데이터로 이용하여 학습된 모델일 수 있다.
도 10을 참조하면, 예를 들어, 애플리케이션의 리소스 파일, 번역 데이터가 제5 학습 모델(100)에 입력되면, 제2 언어로 번역된 텍스트를 포함하는 애플리케이션 실행 화면이 출력될 수 있다. 이 경우, 제5 학습 모델(100)은, 애플리케이션의 실행 화면 내의 텍스트를 번역하고 번역된 텍스트를 포함하는 애플리케이션 실행 화면을 생성하기 위하여 인공 지능 알고리즘을 이용하여 학습된 인공 지능 모델일 수 있다. 제4 학습 모델(80)은, 예를 들어, 디바이스(1000)에 설정된 기본 언어, 애플리케이션의 리소스 파일, 번역 데이터를 학습 데이터로 이용하여 학습된 모델일 수 있다.
도 6 내지 도 10에서는, 다양한 종류의 학습 모델을 통하여, 번역될 텍스트 이외의 다양한 정보를 활용하여, 텍스트를 번역하거나 번역된 텍스트를 포함하는 애플리케이션 실행 화면을 생성하는 예시를 설명하였지만, 이에 제한되지 않는다. 도 6 내지 도 10에 도시된 학습 모델과 상이한 종류 및 개수의 학습 모델이, 텍스트를 번역하거나 번역된 텍스트를 포함하는 애플리케이션 실행 화면을 생성하는데 이용될 수 있다. 또한, 각각의 학습 모델에는 상이하고 더욱 다양한 정보가 입력될 수 있다. 한편, 인공 지능 모델은 텍스트 번역을 위한 기능 만을 제공할 수도 있다. 이 경우, 디바이스(1000)는 번역이 필요한 텍스트만을 인공 지능 모델에 입력함으로써 번역된 텍스트를 획득할 수 있다. 또한, 디바이스(1000)는 애플리케이션 실행 화면의 구성 등에 관련된 각종 설정 정보를, 번역된 텍스트와 함게 이용함으로써, 번역된 텍스트를 포함하는 애플리케이션의 실행 화면을 생성할 수 있다.
도 11은 일부 실시예에 따른 디바이스가 텍스트의 번역을 제어하기 위한 GUI (Graphical User Interface)를 제공하는 방법의 흐름도이다.
동작 S1100에서 디바이스(1000)는 오퍼레이팅 시스템에 의해 이용되는 API를 통하여, 애플리케이션의 실행 화면을 생성할 수 있다. 디바이스(1000)는 번역된 텍스트를 포함하도록 애플리케이션의 실행 화면을 구성하고, 애플리케이션 실행 화면을 이미지 형식으로 생성할 수 있다. 또한, 디바이스(1000)는 애플리케이션의 리소스 파일을 이용하여 애플리케이션 실행 화면 내의 소정 객체에 대응되는 동작 및 링크 정보를 설정할 수 있다.
동작 S1110에서 디바이스(1000)는 생성된 애플리케이션의 실행 화면을 디스플레이할 수 있다.
동작 S1120에서 디바이스(1000)는 애플리케이션의 실행 화면 상에, 텍스트의 번역을 제어하기 위한 GUI를 오버랩할 수 있다. 디바이스(1000)는 애플리케이션의 실행 화면 내의 번역된 텍스트를 수정하기 위하여 GUI를 생성하고, 생성된 GUI를 애플리케이션의 실행 화면 상에 오버랩하여 표시할 수 있다. 텍스트의 번역을 제어하기 위한 GUI는 애플리케이션과 별개로 디바이스(1000)의 오퍼레이팅 시스템에 의해 제공될 수 있다.
동작 S1130에서 디바이스(1000)는 오버랩된 GUI를 통한 사용자 입력에 따라, 애플리케이션의 실행 화면 내의 번역된 텍스트를 수정할 수 있다. 번역된 텍스트를 수정하기 위한 사용자 입력이 GUI를 통해 수신되면, 디바이스(1000)의 오퍼레이팅 시스템은 실행 화면 내의 번역된 텍스트를 수정하고, 애플리케이션 실행 화면이 수정된 텍스트를 포함하도록 애플리케이션 실행 화면을 수정할 수 있다.
도 12 및 도 13은 일부 실시예에 따른 디바이스가 번역된 텍스트를 포함하는 애플리케이션 실행 화면 상에, 텍스트의 번역을 제어하기 위한 GUI를 디스플레이하는 예시를 나타내는 도면이다.
도 12를 참조하면, 번역된 텍스트를 포함하는 애플리케이션 실행 화면 상에, 텍스트의 번역을 제어하기 위한 메뉴를 호출하기 위한 버튼(120)이 디스플레이될 수 있다. 또한, 디바이스(1000)의 사용자는 번역된 텍스트를 수정하기 위하여 버튼(120)을 터치할 수 있다.
도 13을 참조하면, 버튼(120)을 터치하는 사용자 입력이 수신되면, 디바이스(1000)는 텍스트의 번역을 제어하기 위한 메뉴(130)를 디스플레이할 수 있다. 예를 들어, 메뉴(130)는 번역을 수정하기 위한 항목, 번역될 언어를 변경하기 위한 항목 및 원문을 보기 위한 항목을 포함할 수 있다.
사용자는, 애플리케이션의 실행 화면 내의 번역된 텍스트의 적어도 일부를 수정하기 위하여, 애플리케이션의 실행 화면 내의 번역된 텍스트를 다른 언어로 번역하기 위하여, 또는 애플리케이션 실행 화면 내의 번역된 텍스트의 원문을 보기 위하여, 메뉴(130) 내의 항목들을 터치할 수 있다.
도 14 및 도 15는 일부 실시예에 따른 디바이스의 블록도이다.
도 14에 도시된 바와 같이, 일부 실시예에 따른 디바이스(1000)는, 사용자 입력부(1100), 디스플레이부(1210), 제어부(1300), 및 통신부(1500)를 포함할 수 있다. 그러나, 도 14에 도시된 구성 요소 모두가 디바이스(1000)의 필수 구성 요소인 것은 아니다. 도 14에 도시된 구성 요소보다 많은 구성 요소에 의해 디바이스(1000)가 구현될 수도 있고, 도 14에 도시된 구성 요소보다 적은 구성 요소에 의해 디바이스(1000)가 구현될 수도 있다.
예를 들어, 도 15에 도시된 바와 같이, 일부 실시예에 따른 디바이스(1000)는, 사용자 입력부(1100), 디스플레이부(1210), 제어부(1300), 및 통신부(1500) 이외에 출력부(1200), 센싱부(1400), A/V 입력부(1600), 및 메모리(1700)를 더 포함할 수도 있다.
사용자 입력부(1100)는, 사용자가 디바이스(1000)를 제어하기 위한 데이터를 입력하는 수단을 의미한다. 예를 들어, 사용자 입력부(1100)에는 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드(접촉식 정전 용량 방식, 압력식 저항막 방식, 적외선 감지 방식, 표면 초음파 전도 방식, 적분식 장력 측정 방식, 피에조 효과 방식 등), 조그 휠, 조그 스위치 등이 있을 수 있으나 이에 한정되는 것은 아니다.
사용자 입력부(1100)는, 애플리케이션을 실행하기 위한 사용자 입력을 수신할 수 있다.
출력부(1200)는, 오디오 신호 또는 비디오 신호 또는 진동 신호를 출력할 수 있으며, 출력부(1200)는 디스플레이부(1210), 음향 출력부(1220), 및 진동 모터(1230)를 포함할 수 있다.
디스플레이부(1210)는 디바이스(1000)에서 처리되는 정보를 표시 출력한다. 예를 들어, 디스플레이부(1210)는, 애플리케이션의 실행 화면, 및 애플리케이션 내의 텍스트를 번역하고 수정하기 위한 GUI를 디스플레이할 수 있다.
한편, 디스플레이부(1210)와 터치패드가 레이어 구조를 이루어 터치 스크린으로 구성되는 경우, 디스플레이부(1210)는 출력 장치 이외에 입력 장치로도 사용될 수 있다. 디스플레이부(1210)는 액정 디스플레이(liquid crystal display), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display), 전기영동 디스플레이(electrophoretic display) 중에서 적어도 하나를 포함할 수 있다. 그리고 디바이스(1000)의 구현 형태에 따라 디바이스(1000)는 디스플레이부(1210)를 2개 이상 포함할 수도 있다.
음향 출력부(1220)는 통신부(1500)로부터 수신되거나 메모리(1700)에 저장된 오디오 데이터를 출력한다. 진동 모터(1230)는 진동 신호를 출력할 수 있다. 예를 들어, 진동 모터(1230)는 오디오 데이터 또는 비디오 데이터(예컨대, 호신호 수신음, 메시지 수신음 등)의 출력에 대응하는 진동 신호를 출력할 수 있다.
제어부(1300)는, 통상적으로 디바이스(1000)의 전반적인 동작을 제어한다. 예를 들어, 제어부(1300)는, 메모리(1700)에 저장된 프로그램들을 실행함으로써, 사용자 입력부(1100), 출력부(1200), 센싱부(1400), 통신부(1500), A/V 입력부(1600) 등을 전반적으로 제어할 수 있다. 예를 들어, 제어부(1300)는, 메모리(1700)에 저장된 OS (Operating System) 프로그램을 실행함으로써, 도 1 내지 도 12에서의 디바이스(1000)의 동작을 제어할 수 있다. 제어부(1300)는, 인공 지능 모델로 동작하는 프로세서를 포함할 수도 있다.
구체적으로, 제어부(1300)는, 애플리케이션을 실행하기 위한 사용자 입력을 수신할 수 있다. 제어부(1300)는 소정의 애플리케이션을 애플리케이션 제공 서버(미도시)로부터 수신하여 디바이스(1000) 내에 설치할 수 있으며, 설치된 애플리케이션을 실행하기 위한 사용자 입력을 수신할 수 있다. 디바이스(1000)에 설치된 애플리케이션은 제1 언어를 기본 언어로 가질 수 있다.
제어부(1300)는 오퍼레이팅 시스템(OS)을 통하여, 애플리케이션의 리소스 파일을 획득할 수 있다. 제어부(1300)는 설치된 애플리케이션의 리소스 파일을 메모리(미도시)에 저장할 수 있으며, 오퍼레이팅 시스템을 통하여 메모리(미도시)에 저장된 리소스 파일에 액서스할 수 있다.
또한, 제어부(1300)는 오퍼레이팅 시스템 (OS)을 이용하여 애플리케이션의 실행 화면을 생성하기 이전에, 애플리케이션의 실행 화면을 구성하기 위하여 필요한 정보를 애플리케이션의 리소스 파일로부터 추출할 수 있다. 예를 들어, 제어부(1300)는, 애플리케이션의 실행 화면 내에 포함될 이미지 및 텍스트를 리소스 파일로부터 획득할 수 있다. 또한, 제어부(1300)는, 획득된 이미지 내의 텍스트를 인식할 수 있다.
또한, 제어부(1300)는 리소스 파일로부터, 애플리케이션의 실행 화면 내에 표시될 텍스트를 번역하기 위하여 필요한 각종 정보를 추출할 수 있다. 예를 들어, 제어부(1300)는 실행 화면 내에 표시될 이미지의 크기, 실행 화면 내에 이미지가 표시될 위치, 실행 화면 내에 표시될 텍스트의 폰트, 글자 색, 자간, 줄 간격, 실행 화면 내에 텍스트가 표시될 위치, 및 애플리케이션의 카테고리 등을 추출할 수 있다. 또한, 예를 들어, 제어부(1300)는, 실행 화면 내에 표시될 이미지의 색상 및 이미지 내의 객체의 종류 등에 관한 정보를 획득할 수 있다.
제어부(1300)는 인공 지능 모델을 이용하여, 애플리케이션의 실행 화면에 표시될 제1 언어의 텍스트를 제2 언어로 번역할 수 있다. 인공 지능 모델은, 애플리케이션의 번역을 위하여 인공 지능 알고리즘을 이용하여 학습된 학습 모델일 수 있다. 예를 들어, 인공 지능 모델은, 기계 학습 알고리즘, 신경망 알고리즘, 유전자 알고리즘, 딥러닝 알고리즘 및 분류 알고리즘 중 적어도 하나를 이용하여 학습된 것일 수 있다.
제어부(1300)는 애플리케이션과 관련하여 획득된 데이터 중 적어도 일부를 인공 지능 모델에 적용함으로써, 애플리케이션의 실행 화면에 표시될 제1 언어의 텍스트를 제2 언어로 번역할 수 있다.
제어부(1300)는 애플리케이션의 실행 화면을 생성할 수 있다. 제어부(1300)는 애플리케이션의 리소스 파일을 이용하여 애플리케이션의 실행 화면을 생성할 수 있다. 예를 들어, 제어부(1300)는 API 레벨에서 애플리케이션의 실행 화면을 이미지로 생성할 수 있다. 제어부(1300)는, 리소스 파일 내의 실행 화면을 구성하기 위한 정보 및 획득된 제2 언어의 텍스트를 이용하여, 애플리케이션의 실행 화면을 생성할 수 있다. 또한, 예를 들어, 제어부(1300)는 추출된 이미지의 크기, 번역된 텍스트의 크기, 실행 화면 내에 배치될 이미지의 위치, 및 실행 화면 내에 배치될 번역된 텍스트의 위치를 고려하여, 애플리케이션의 실행 화면을 생성할 수 있다.
제어부(1300)는 애플리케이션의 실행 화면을 디스플레이할 수 있다.
상기에서는 인공 지능 모델을 이용하여 번역된 텍스트를 이용하여 애플리케이션의 실행 화면을 생성하는 것으로 설명되었지만, 이에 제한되지 않는다. 제어부(1300)는 획득된 데이터를 인공 지능 모델에 적용함으로써, 번역된 텍스트를 포함하는 애플리케이션 실행 화면을 바로 생성할 수도 있다.
한편, 제어부(1300)는 애플리케이션이 제2 언어의 언어 데이터를 제공하는 지를 판단할 수 있다. 제어부(1300)는 리소스 파일을 분석함으로써, 애플리케이션이 제2 언어의 언어 데이터를 제공하는 지를 식별할 수 있다. 이 경우, 예를 들어, 제2 언어는 디바이스(1000)에 기본 언어로 설정된 언어일 수 있다. 또는, 제2 언어는 사용자가 번역되기를 희망하는 언어로서, 사용자 입력에 기초하여 설정된 언어일 수 있다.
제어부(1300)는 인공 지능 모델을 실행할 수 있다. 애플리케이션이 제2 언어의 언어 데이터를 제공하지 않는다고 판단됨에 따라, 제어부(1300)는 인공 지능 모델을 실행할 수 있다. 이 경우, 인공 지능 모델은, 디바이스(1000) 또는 서버(2000)에 의해 제공될 수 있다.
제어부(1300)는 인공 지능 모델을 이용하여, 제2 언어의 텍스트를 포함하는 실행 화면을 생성할 수 있다. 제어부(1300)는, 애플리케이션의 리소스 파일, 리소스 파일로부터 획득되는 애플리케이션 실행 화면의 구성에 관련된 데이터, 및 애플리케이션 제공 서버(미도시)로부터 제공되는 애플리케이션 정보 중 적어도 하나를 인공 지능 모델에 적용할 수 있다.
또한, 제어부(1300)는 인공 지능 모델로부터 출력되는 번역된 텍스트를 이용하여, 번역된 텍스트를 포함하는 애플리케이션 실행 화면을 생성할 수 있다. 또는, 제어부(1300)는 인공 지능 모델로부터 출력되는 번역된 텍스트를 포함하는 애플리케이션 실행 화면을 획득할 수 있다.
한편, 제어부(1300)는 오퍼레이팅 시스템에 의해 이용되는 API를 통하여, 애플리케이션의 실행 화면을 생성할 수 있다. 제어부(1300)는 번역된 텍스트를 포함하도록 애플리케이션의 실행 화면을 구성하고, 애플리케이션 실행 화면을 이미지 형식으로 생성할 수 있다. 또한, 제어부(1300)는 애플리케이션의 리소스 파일을 이용하여 애플리케이션 실행 화면 내의 소정 객체에 대응되는 동작 및 링크 정보를 설정할 수 있다.
제어부(1300)는 애플리케이션의 실행 화면 상에, 텍스트의 번역을 제어하기 위한 GUI를 오버랩할 수 있다. 제어부(1300)는 애플리케이션의 실행 화면 내의 번역된 텍스트를 수정하기 위하여 GUI를 생성하고, 생성된 GUI를 애플리케이션의 실행 화면 상에 오버랩하여 표시할 수 있다. 텍스트의 번역을 제어하기 위한 GUI는 애플리케이션과 별개로 디바이스(1000)의 오퍼레이팅 시스템에 의해 제공될 수 있다.
제어부(1300)는 오버랩된 GUI를 통한 사용자 입력에 따라, 애플리케이션의 실행 화면 내의 번역된 텍스트를 수정할 수 있다. 번역된 텍스트를 수정하기 위한 사용자 입력이 GUI를 통해 수신되면, 제어부(1300)는 실행 화면 내의 번역된 텍스트를 수정하고, 애플리케이션 실행 화면이 수정된 텍스트를 포함하도록 애플리케이션 실행 화면을 수정할 수 있다.
센싱부(1400)는, 디바이스(1000)의 상태 또는 디바이스(1000) 주변의 상태를 감지하고, 감지된 정보를 제어부(1300)로 전달할 수 있다.
센싱부(1400)는, 지자기 센서(Magnetic sensor)(1410), 가속도 센서(Acceleration sensor)(1420), 온/습도 센서(1430), 적외선 센서(1440), 자이로스코프 센서(1450), 위치 센서(예컨대, GPS)(1460), 기압 센서(1470), 근접 센서(1480), 및 RGB 센서(illuminance sensor)(1490) 중 적어도 하나를 포함할 수 있으나, 이에 한정되는 것은 아니다. 각 센서들의 기능은 그 명칭으로부터 당업자가 직관적으로 추론할 수 있으므로, 구체적인 설명은 생략하기로 한다.
통신부(1500)는, 서버(2000) 및 다른 외부 장치와 통신을 하도록 하는 하나 이상의 구성요소를 포함할 수 있다. 예를 들어, 통신부(1500)는, 근거리 통신부(1510), 이동 통신부(1520), 방송 수신부(1530)를 포함할 수 있다.
근거리 통신부(short-range wireless communication unit)(151)는, 블루투스 통신부, BLE(Bluetooth Low Energy) 통신부, 근거리 무선 통신부(Near Field Communication unit), WLAN(와이파이) 통신부, 지그비(Zigbee) 통신부, 적외선(IrDA, infrared Data Association) 통신부, WFD(Wi-Fi Direct) 통신부, UWB(ultra wideband) 통신부, Ant+ 통신부 등을 포함할 수 있으나, 이에 한정되는 것은 아니다.
이동 통신부(1520)는, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 여기에서, 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.
방송 수신부(1530)는, 방송 채널을 통하여 외부로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다. 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 구현 예에 따라서 디바이스(1000)가 방송 수신부(1530)를 포함하지 않을 수도 있다.
또한, 통신부(1500)는, 텍스트의 번역 및 번역된 텍스트를 포함하는 애플리케이션의 실행 화면을 생성하기 위하여 필요한 정보를 서버(2000)와 송수신할 수 있다.
A/V(Audio/Video) 입력부(1600)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 이에는 카메라(1610)와 마이크로폰(1620) 등이 포함될 수 있다.
메모리(1700)는, 제어부(1300)의 처리 및 제어를 위한 프로그램을 저장할 수 있고, 디바이스(1000)로 입력되거나 디바이스(1000)로부터 출력되는 데이터를 저장할 수도 있다.
메모리(1700)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory) SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.
메모리(1700)에 저장된 프로그램들은 그 기능에 따라 복수 개의 모듈들로 분류할 수 있는데, 예를 들어, UI 모듈(1710), 터치 스크린 모듈(1720), 알림 모듈(1730) 등으로 분류될 수 있다.
도 16은 일부 실시예에 따른 서버의 블록도이다.
도 16을 참조하면, 일부 실시예에 따른 서버(2000)는 통신부(2100), 저장부(2200) 및 프로세서(2300)를 포함할 수 있다.
통신부(2100)는 디바이스(1000)와의 통신을 위한 하나 이상의 통신 모듈을 포함할 수 있다. 예를 들어, 통신부(2100)는, 근거리 통신부, 이동 통신부를 포함할 수 있다. 근거리 통신부(short-range wireless communication unit)는, 블루투스 통신부, BLE(Bluetooth Low Energy) 통신부, 근거리 무선 통신부(Near Field Communication unit), WLAN(와이파이) 통신부, 지그비(Zigbee) 통신부, 적외선(IrDA, infrared Data Association) 통신부, WFD(Wi-Fi Direct) 통신부, UWB(ultra wideband) 통신부, Ant+ 통신부 등을 포함할 수 있으나, 이에 한정되는 것은 아니다. 이동 통신부는, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 여기에서, 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.
저장부(2200)는 서버(2000)의 동작을 제어하기 위한 프로그램을 저장할 수 있다. 저장부(2200)는 서버(2000)의 동작을 제어하기 위한 적어도 하나의 인스트럭션을 포함할 수 있다. 또한, 저장부(2200)는, 예를 들어, 애플리케이션 내의 텍스트를 번역하기 위한 인공 지능 모델, 애플리케이션의 카테고리와 동일 카테고리의 다른 애플리케이션의 텍스트에 관한 언어 데이터, 애플리케이션의 주요 사용자의 특성에 관련된 데이터, 및 애플리케이션 및 다른 애플리케이션의 번역 이력 데이터를 저장할 수 있다. 저장부(2200)에 저장된 프로그램들은 그 기능에 따라 복수 개의 모듈들로 분류될 수 있다.
프로세서(2300)는, 통상적으로 서버(2000)의 전반적인 동작을 제어할 수 있다. 예를 들어, 프로세서(2300)는, 저장부(2200)에 저장된 프로그램들을 실행함으로써, 통신부(2100) 및 저장부(2200)를 제어할 수 있다. 프로세서(2300)는 통신부(2100) 및 저장부(2200)를 제어함으로써, 도 1 내지 도 13에서의 서버(2000)의 동작을 제어할 수 있다. 또한, 프로세서(2300)는 인공 지능 모델로 동작하는 프로세서를 포함할 수 있다.
프로세서(2300)는, 애플리케이션의 실행 화면 내의 텍스트를 번역하기 위한 정보, 및 번역된 텍스트를 포함하는 애플리케이션 실행 화면을 생성하기 위한 정보를 디바이스(1000)로부터 수신할 수 있다. 이 경우, 프로세서는 애플리케이션의 실행 화면 내의 텍스트를 번역하기 위한 정보, 및/또는 번역된 텍스트를 포함하는 애플리케이션 실행 화면을 생성하기 위한 정보를 인공 지능 모델에 적용함으로써, 번역된 텍스트를 획득하거나, 번역된 텍스트를 포함하는 애플리케이션 실행 화면을 생성할 수 있다.
또한, 프로세서(2300)는, 텍스트의 글자 정보, 애플리케이션의 카테고리, 디바이스(1000)의 기본 언어, 및 애플리케이션의 주 사용자의 속성에 관한 정보를 인공 지능 모델에 적용할 수도 있다.
프로세서(2300)는, 번역된 텍스트, 번역된 텍스트의 글자 정보 및 번역된 텍스트의 배치 위치에 관한 정보를 디바이스(1000)에게 제공할 수 있다. 또는, 프로세서(2300)는 번역된 텍스트를 포함하는 애플리케이션 실행 화면을 디바이스(1000)에게 제공할 수도 있다.
한편, 인공 지능 모델의 적어도 일부는 서버(2000)에 의해 관리될 수 있다. 이 경우, 서버(2000)는 애플리케이션의 실행 화면 내의 텍스트를 번역하거나 번역된 텍스트를 포함하는 애플리케이션의 실행 화면을 생성하기 위한 인공 지능 모델을 생성 및 관리할 수 있으며, 디바이스(1000)는 서버(2000)에 의해 관리되는 인공 지능 모델을 이용하여 번역된 텍스트를 포함하는 애플리케이션의 실행 화면을 획득할 수 있다. 예를 들어, 디바이스(1000)는 번역이 필요한 텍스트에 관한 정보를 서버(2000)로 제공하고, 서버(2000)는 번역된 텍스트에 관한 정보를 디바이스(1000)에게 제공할 수 있다. 또한, 디바이스(1000)는 번역된 텍스트에 관한 정보를 이용하여, 번역된 텍스트를 포함하는 애플리케이션의 실행 화면을 디스플레이할 수 있다.
일부 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 또는 프로그램 모듈과 같은 변조된 데이터 신호의 기타 데이터를 포함할 수 있다.
또한, 본 명세서에서, “부”는 프로세서 또는 회로와 같은 하드웨어 구성(hardware component), 및/또는 프로세서와 같은 하드웨어 구성에 의해 실행되는 소프트웨어 구성(software component)일 수 있다.
전술한 본 개시의 설명은 예시를 위한 것이며, 본 개시가 속하는 기술분야의 통상의 지식을 가진 자는 본 개시의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 개시의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 개시의 범위에 포함되는 것으로 해석되어야 한다.

Claims (15)

  1. 디바이스가 애플리케이션의 번역 정보를 제공하는 방법에 있어서,
    상기 디바이스에서 실행될 애플리케이션에 대한 사용자 입력을 수신하는 동작;
    상기 사용자 입력에 응답하여, 상기 디바이스의 오퍼레이팅 시스템(OS)을 통하여 상기 애플리케이션의 리소스 파일을 획득하는 동작;
    인공 지능 모델 및 상기 획득된 리소스 파일을 이용하여, 상기 애플리케이션의 실행 화면에 표시될 텍스트를 번역하는 동작;
    상기 리소스 파일 및 상기 번역된 텍스트를 이용하여, 상기 애플리케이션의 실행 화면을 생성하는 동작; 및
    상기 생성된 실행 화면을 디스플레이하는 동작;
    을 포함하며,
    상기 번역하는 동작은, 상기 애플리케이션의 실행 화면에 표시될 텍스트를 번역하기 위하여 학습된 상기 인공 지능 모델에, 상기 리소스 파일 내의 데이터 중 적어도 일부를 적용함으로써, 제1 언어의 상기 텍스트를 제2 언어로 번역하는 것인, 방법.
  2. 제1 항에 있어서,
    상기 사용자 입력에 응답하여, 상기 애플리케이션이 상기 제2 언어의 언어 파일을 제공하는 지를 식별하는 동작; 및
    상기 애플리케이션에 의해 상기 제2 언어의 언어 파일이 제공되지 않는다고 판단됨에 따라, 상기 인공 지능 모델을 호출하는 동작;
    을 더 포함하는, 방법.
  3. 제1 항에 있어서,
    상기 리소스 파일로부터 상기 제1 언어의 상기 텍스트를 획득하는 동작;
    상기 획득된 텍스트의 폰트 정보를 획득하는 동작;
    을 더 포함하며,
    상기 번역하는 동작은, 상기 획득된 텍스트 및 상기 폰트 정보를 상기 인공 지능 모델에 적용하는 것인, 방법.
  4. 제3 항에 있어서,
    상기 리소스 파일로부터 획득된 텍스트가 상기 애플리케이션의 실행 화면 상에서 차지하는 위치 및 면적 중 적어도 하나에 관한 정보를 획득하는 단계;
    를 더 포함하며,
    상기 번역하는 단계는, 상기 위치 및 면적 중 적어도 하나에 관한 정보를 상기 인공 지능 모델에 적용하는 것인, 방법.
  5. 제1 항에 있어서,
    상기 리소스 파일로부터 상기 애플리케이션의 카테고리를 식별하는 동작;
    을 더 포함하며,
    상기 번역하는 동작은, 상기 식별된 카테고리를 상기 인공 지능 모델에 적용하는 것인, 방법.
  6. 제1 항에 있어서,
    상기 애플리케이션의 실행 화면은, 상기 오퍼레이팅 시스템에 의해 이용되는 API (Application Program Interface)를 통하여 생성되는 것인, 방법.
  7. 제1 항에 있어서,
    상기 텍스트의 번역을 제어하기 위한 GUI(Graphic User Interface)를 상기 애플리케이션의 실행 화면 상에 오버랩하는 동작;
    을 더 포함하는, 방법.
  8. 제7 항에 있어서,
    상기 GUI는 상기 애플리케이션과 별개로 상기 오퍼레이팅 시스템에 의해 제공되는 것인, 방법.
  9. 제7 항에 있어서,
    상기 GUI는 상기 애플리케이션의 실행 화면 상에 표시된 상기 번역된 텍스트 중 적어도 일부를 선택하기 위한 오브젝트, 및 상기 번역된 텍스트 중 적어도 일부를 수정하기 위한 오브젝트를 포함하는 것인, 방법.
  10. 상기 GUI는 상기 제2 언어로 번역된 텍스트를 제3 언어로 변경하기 위한 오브젝트를 포함하는 것인, 방법.
  11. 애플리케이션의 번역 정보를 제공하는 디바이스에 있어서,
    디스플레이;
    메모리; 및
    상기 디스플레이 및 상기 메모리를 제어하는 프로세서;
    를 포함하며,
    상기 프로세서는,
    상기 디바이스에서 실행될 애플리케이션에 대한 사용자 입력을 수신하고, 상기 사용자 입력에 응답하여, 상기 디바이스의 오퍼레이팅 시스템(OS)을 통하여 상기 애플리케이션의 리소스 파일을 획득하고, 인공 지능 모델 및 상기 획득된 리소스 파일을 이용하여 상기 애플리케이션의 실행 화면에 표시될 텍스트를 번역하고, 상기 리소스 파일 및 상기 번역된 텍스트를 이용하여, 상기 애플리케이션의 실행 화면을 생성하고, 상기 생성된 실행 화면을 디스플레이하며,
    상기 프로세서는, 상기 애플리케이션의 실행 화면에 표시될 텍스트를 번역하기 위하여 학습된 상기 인공 지능 모델에, 상기 리소스 파일 내의 데이터 중 적어도 일부를 적용함으로써, 제1 언어의 상기 텍스트를 제2 언어로 번역하는 것인, 디바이스.
  12. 제11 항에 있어서,
    상기 프로세서는, 상기 사용자 입력에 응답하여, 상기 애플리케이션이 상기 제2 언어의 언어 파일을 제공하는 지를 식별하고, 상기 애플리케이션에 의해 상기 제2 언어의 언어 파일이 제공되지 않는다고 판단됨에 따라, 상기 인공 지능 모델을 호출하는, 디바이스.
  13. 제11 항에 있어서,
    상기 프로세서는, 상기 리소스 파일로부터 상기 제1 언어의 상기 텍스트를 획득하고, 상기 획득된 텍스트의 폰트 정보를 획득하며,
    상기 프로세서는, 상기 번역을 위하여, 상기 획득된 텍스트 및 상기 폰트 정보를 상기 인공 지능 모델에 적용하는 것인, 디바이스.
  14. 제13 항에 있어서,
    상기 프로세서는, 상기 리소스 파일로부터 획득된 텍스트가 상기 애플리케이션의 실행 화면 상에서 차지하는 위치 및 면적 중 적어도 하나에 관한 정보를 획득하며,
    상기 프로세서는, 상기 번역을 위하여, 상기 위치 및 면적 중 적어도 하나에 관한 정보를 상기 인공 지능 모델에 적용하는 것인, 디바이스.
  15. 제 1 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
PCT/KR2019/012138 2018-09-19 2019-09-19 애플리케이션의 번역 정보를 제공하는 디바이스 및 방법 WO2020060223A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/270,655 US11868739B2 (en) 2018-09-19 2019-09-19 Device and method for providing application translation information

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020180112377A KR102606287B1 (ko) 2018-09-19 2018-09-19 애플리케이션의 번역 정보를 제공하는 디바이스 및 방법
KR10-2018-0112377 2018-09-19

Publications (1)

Publication Number Publication Date
WO2020060223A1 true WO2020060223A1 (ko) 2020-03-26

Family

ID=69887533

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/012138 WO2020060223A1 (ko) 2018-09-19 2019-09-19 애플리케이션의 번역 정보를 제공하는 디바이스 및 방법

Country Status (3)

Country Link
US (1) US11868739B2 (ko)
KR (1) KR102606287B1 (ko)
WO (1) WO2020060223A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685202B (zh) * 2018-12-17 2023-03-21 腾讯科技(深圳)有限公司 数据处理方法及装置、存储介质和电子装置
US11494567B2 (en) * 2020-03-03 2022-11-08 Dell Products L.P. Content adaptation techniques for localization of content presentation
US11443122B2 (en) * 2020-03-03 2022-09-13 Dell Products L.P. Image analysis-based adaptation techniques for localization of content presentation
US20210279426A1 (en) * 2020-03-09 2021-09-09 Sos Software, Inc. Language customization for multitenant cloud-based software-as-a-service application
CN114253641A (zh) * 2020-09-25 2022-03-29 支付宝实验室(新加坡)有限公司 数据处理方法、移动终端及开放平台
US11934840B2 (en) * 2020-12-17 2024-03-19 Hewlett Packard Enterprise Development Lp Classification of hardware components
CN114139560B (zh) * 2021-12-03 2022-12-09 山东诗语信息科技有限公司 基于人工智能翻译系统
KR102586180B1 (ko) * 2023-04-14 2023-10-10 주식회사 어베어 텍스트의 스타일을 유지하면서 번역 이미지를 생성하는 방법 및 장치
CN116943232A (zh) * 2023-06-26 2023-10-27 广州三七极耀网络科技有限公司 一种应用程序的全球化处理方法及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070282594A1 (en) * 2006-06-02 2007-12-06 Microsoft Corporation Machine translation in natural language application development
US20090204385A1 (en) * 1999-09-17 2009-08-13 Trados, Inc. E-services translation utilizing machine translation and translation memory
JP2016110446A (ja) * 2014-12-08 2016-06-20 コニカミノルタ株式会社 Gui制御システム、gui制御方法、gui制御システム用プログラム、およびguiシステム用プログラムが記録されたコンピュータ読み取り可能な記録媒体
KR101695396B1 (ko) * 2016-08-31 2017-01-11 이은숙 인공지능 번역 소프트웨어를 이용하여 번역을 수행하는 방법
KR20180074567A (ko) * 2016-12-23 2018-07-03 삼성전자주식회사 사용자의 할일 목록을 제공하는 시스템 및 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003036163A (ja) 2001-07-25 2003-02-07 Hitachi Ltd 翻訳機能付きオペレーティングシステムおよびそれを搭載したシステム
US20080086694A1 (en) * 2006-09-11 2008-04-10 Rockwell Automation Technologies, Inc. Multiple language development environment using shared resources
US20100030549A1 (en) * 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US20140222413A1 (en) 2013-02-01 2014-08-07 Klip, Inc. Method and user interface for controlling language translations using touch sensitive display screens
US9195651B2 (en) * 2013-03-15 2015-11-24 Google Inc. Techniques for language translation localization for computer applications
US9977684B2 (en) * 2013-06-12 2018-05-22 Sap Se Self-learning localization service
WO2018117685A1 (en) 2016-12-23 2018-06-28 Samsung Electronics Co., Ltd. System and method of providing to-do list of user

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090204385A1 (en) * 1999-09-17 2009-08-13 Trados, Inc. E-services translation utilizing machine translation and translation memory
US20070282594A1 (en) * 2006-06-02 2007-12-06 Microsoft Corporation Machine translation in natural language application development
JP2016110446A (ja) * 2014-12-08 2016-06-20 コニカミノルタ株式会社 Gui制御システム、gui制御方法、gui制御システム用プログラム、およびguiシステム用プログラムが記録されたコンピュータ読み取り可能な記録媒体
KR101695396B1 (ko) * 2016-08-31 2017-01-11 이은숙 인공지능 번역 소프트웨어를 이용하여 번역을 수행하는 방법
KR20180074567A (ko) * 2016-12-23 2018-07-03 삼성전자주식회사 사용자의 할일 목록을 제공하는 시스템 및 방법

Also Published As

Publication number Publication date
KR102606287B1 (ko) 2023-11-27
KR20200036084A (ko) 2020-04-07
US11868739B2 (en) 2024-01-09
US20210224491A1 (en) 2021-07-22

Similar Documents

Publication Publication Date Title
WO2020060223A1 (ko) 애플리케이션의 번역 정보를 제공하는 디바이스 및 방법
WO2020080773A1 (en) System and method for providing content based on knowledge graph
WO2019182346A1 (ko) 인공지능 모델을 이용하여 사용자 음성을 변조하기 위한 전자 장치 및 이의 제어 방법
WO2018117428A1 (en) Method and apparatus for filtering video
KR102556492B1 (ko) 텍스트와 연관된 이미지 제공 방법 및 이를 위한 전자 장치
WO2018117704A1 (en) Electronic apparatus and operation method thereof
WO2018101694A1 (en) Electronic apparatus and method for summarizing content
WO2019093819A1 (ko) 전자 장치 및 그 동작 방법
WO2018182201A1 (ko) 사용자의 음성 입력에 대한 답변을 제공하는 방법 및 장치
WO2020141952A1 (en) Conversational control system and method for registering external device
WO2019132410A1 (en) Electronic device and control method thereof
WO2019231130A1 (ko) 전자 장치 및 그의 제어방법
WO2019125082A1 (en) Device and method for recommending contact information
EP3539056A1 (en) Electronic apparatus and operation method thereof
WO2019050137A1 (en) SYSTEM AND METHOD FOR DETERMINING INPUT CHARACTERS BASED ON SCAN INPUT
EP3652925A1 (en) Device and method for recommending contact information
WO2021020810A1 (en) Learning method of ai model and electronic apparatus
WO2020180001A1 (ko) 전자 장치 및 이의 제어 방법
WO2019190171A1 (ko) 전자 장치 및 그 제어 방법
EP3545401A1 (en) Electronic apparatus and method for summarizing content
EP3545685A1 (en) Method and apparatus for filtering video
WO2021149890A1 (ko) 사용자의 개인 모델을 학습하는 전자 장치 및 그 동작 방법
WO2018164435A1 (en) Electronic apparatus, method for controlling the same, and non-transitory computer readable recording medium
WO2019190243A1 (ko) 사용자와의 대화를 위한 정보를 생성하는 시스템 및 방법
WO2020130274A1 (ko) 영상에서 오브젝트를 인식하는 전자 장치 및 그 동작 방법

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19862039

Country of ref document: EP

Kind code of ref document: A1