WO2021107445A1 - 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치 - Google Patents

지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치 Download PDF

Info

Publication number
WO2021107445A1
WO2021107445A1 PCT/KR2020/015579 KR2020015579W WO2021107445A1 WO 2021107445 A1 WO2021107445 A1 WO 2021107445A1 KR 2020015579 W KR2020015579 W KR 2020015579W WO 2021107445 A1 WO2021107445 A1 WO 2021107445A1
Authority
WO
WIPO (PCT)
Prior art keywords
marketing
data
information
transliteration
knowledge graph
Prior art date
Application number
PCT/KR2020/015579
Other languages
English (en)
French (fr)
Inventor
이진형
장원홍
윤동준
Original Assignee
주식회사 데이터마케팅코리아
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020190152512A external-priority patent/KR20210063877A/ko
Priority claimed from KR1020190152511A external-priority patent/KR20210063876A/ko
Application filed by 주식회사 데이터마케팅코리아 filed Critical 주식회사 데이터마케팅코리아
Publication of WO2021107445A1 publication Critical patent/WO2021107445A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Definitions

  • the present invention relates to a service providing method and an apparatus therefor. More specifically, the present invention relates to a method and apparatus for providing a knowledge graph and transliteration-based neologism information service for each country.
  • the transliteration of English into Hangeul is a general method in which a person transliterates by hand according to the foreign language notation set by the National Institute of the Korean Language, or directly transliterates by referring to the usage examples of the language norms provided by the National Institute of the Korean Language.
  • the Korean transliteration work is being carried out in an inefficient way that takes time and human cost enough to have rules for transliteration of Hangul for each company.
  • the present invention has been devised to solve the above problems, and by effectively providing a marketing information analysis service based on a marketing specialized knowledge graph model based on analysis information for each marketing channel through artificial intelligence technology, marketing with low cost and high efficiency
  • An object of the present invention is to provide a method and apparatus for providing an efficient marketing analysis service that can support decision-making.
  • the present invention provides the marketing information service as a marketing information service based on the marketing specialized knowledge graph and transliteration based on each country by implementing a transliteration conversion process using an artificial neural network for marketing decision making and analysis as described above.
  • An object of the present invention is to provide a method for providing a service and an apparatus therefor.
  • a service providing apparatus for solving the above-described problems includes: a preprocessing unit for collecting and preprocessing foreign language transliteration learning data for learning a marketing-specialized knowledge graph model; a learning modeling unit for modeling vector-based learning data from the foreign language transliteration learning data; and a predictive modeling unit that generates a predictive model for transliteration conversion from the learning data, and converts and outputs the Korean transliteration data by applying foreign language transliteration data to the predictive model.
  • a service providing method for solving the above-described problems includes the steps of: collecting and pre-processing foreign language transliteration learning data for learning a marketing-specialized knowledge graph model; modeling vector-based learning data from the foreign language transliteration learning data; and generating a predictive model for transliteration conversion from the learning data, and applying foreign language transliteration data to the predictive model to convert and output the Korean transliteration data.
  • the method according to an embodiment of the present invention for solving the above problems may be implemented as a program for executing the method in a computer and a recording medium in which the program is recorded.
  • the marketing specialized knowledge graph and transliteration-based neologism information service for each country are provided as a marketing information service. It is possible to provide a service providing method and an apparatus therefor.
  • FIG. 1 is a block diagram schematically showing an entire system according to an embodiment of the present invention.
  • FIG. 2 is a block diagram illustrating in more detail an apparatus for providing a marketing service according to an embodiment of the present invention.
  • FIG. 3 is a flowchart illustrating an operation of an apparatus for providing a marketing service according to an embodiment of the present invention.
  • FIG. 4 is a block diagram for explaining in more detail a knowledge graph construction module according to an embodiment of the present invention.
  • FIG. 5 is a flowchart illustrating an operation of a knowledge graph building module according to an embodiment of the present invention.
  • FIG. 6 is a relationship diagram for explaining a knowledge graph construction and semantic mapping process according to an embodiment of the present invention.
  • FIG. 7 is a block diagram for explaining in more detail a neologism dictionary construction module according to an embodiment of the present invention.
  • FIGS. 9 to 12 are diagrams illustrating data processing according to the transliteration-based neologo information processing process for each country.
  • block diagrams herein are to be understood as representing conceptual views of illustrative circuitry embodying the principles of the present invention.
  • all flowcharts, state transition diagrams, pseudo code, etc. may be tangibly embodied on a computer-readable medium and be understood to represent various processes performed by a computer or processor, whether or not a computer or processor is explicitly shown.
  • processors may be provided by the use of dedicated hardware as well as hardware having the ability to execute software in association with appropriate software.
  • the functionality may be provided by a single dedicated processor, a single shared processor, or a plurality of separate processors, some of which may be shared.
  • DSP digital signal processor
  • ROM read-only memory
  • RAM random access memory
  • non-volatile memory Other common hardware may also be included.
  • a component expressed as a means for performing the function described in the detailed description includes, for example, any form of software including a combination of circuit elements or firmware/microcode for performing the above function. It is intended to include all methods of performing the functions that are combined with suitable circuitry for executing the software to perform the functions. Since the present invention defined by these claims is combined with the functions provided by the various enumerated means and in a manner required by the claims, any means capable of providing the functions are equivalent to those contemplated from the present specification. should be understood as
  • FIG. 1 is a conceptual diagram schematically illustrating an entire system according to an embodiment of the present invention.
  • the entire system includes a marketing information analysis service providing apparatus 100, a marketing platform 200 and one or more user terminals 300 connected through one or more mutually distinct channels, and a marketing information analysis service
  • the providing apparatus 100 may be connected to the machine learning module 400 or include the machine learning module 400 .
  • the marketing information analysis service providing apparatus 100 may be connected to each platform 200 and the user terminal 300 through a wired/wireless network to provide a marketing information analysis service, and to analyze marketing information based on learning and artificial intelligence
  • it may be connected to the machine learning module 400 or include the machine learning module 400, and devices or terminals connected to each network may perform mutual communication through a preset network channel.
  • each network is a local area network (LAN), a wide area network (WAN), a value added network (VAN), a personal area network (PAN), a mobile communication network ( It can be implemented in all types of wired/wireless networks such as mobile radiocommunication network) or satellite communication networks.
  • LAN local area network
  • WAN wide area network
  • VAN value added network
  • PAN personal area network
  • mobile communication network It can be implemented in all types of wired/wireless networks such as mobile radiocommunication network) or satellite communication networks.
  • the user terminal 300 may include various server devices, network devices, or terminal devices that access the marketing information analysis service providing apparatus 100 for the purpose of receiving a marketing analysis service for marketing decision making.
  • the user terminals 300 may be connected to the marketing information analysis service providing apparatus 100 through an individual security network, and the marketing information analysis service providing apparatus 100 may be connected to each user terminal 300 through each security network.
  • the security network may be an encryption network
  • the service-registered user terminal 300 stores in advance the decryption key information according to the company authentication, and stores the marketing analysis result information received from the marketing information analysis service providing apparatus 100, Decryption according to the decryption key information can be obtained and output.
  • the user terminals 300 may have completed the basic information registration process corresponding to the marketing information analysis service providing apparatus 100 .
  • the user terminal 300 may be a terminal that is provided with a marketing information analysis service as a member of each company.
  • it may be a terminal of a company that directly makes marketing decisions, a terminal of a company that provides marketing services in partnership with a plurality of companies, or a terminal of a network service company that mediates data between a plurality of networks.
  • the marketing information analysis service providing apparatus 100 receives company information from each user terminal 300 , collects marketing document data based on a marketing network channel classified in advance based on the received company information, and the document data By learning the unstructured data according to the processing of the machine learning module 400 through the machine learning module 400, and using the knowledge graph information and ontology information built in advance, the learning information and the structured data collected and analyzed in advance, a marketing-specialized knowledge graph model create
  • the marketing information analysis service providing apparatus 100 may process the marketing market trend and demand prediction analysis using the marketing specialized knowledge graph model, and transmit marketing analysis information according to the processed result information to the user terminal 300 . can provide
  • the marketing-specialized knowledge graph may be constructed by semantic mapping processing of pre-established knowledge graph model information according to a natural language analysis result of company information and marketing document collection information, and the marketing information analysis service providing apparatus 100 ) can collect, store and manage dictionary (DICTIONARY) information required for natural language processing and text analysis for such semantic mapping processing and ontology information for constructing a classification system in advance.
  • DITIONARY dictionary
  • the marketing information analysis service providing apparatus 100 collects and sets a dictionary and a classification system specialized for marketing in advance, and natural language analysis-based learning of marketing document information collected for each marketing channel in response to corporate information According to the processing, semantic mapping may be performed on the pre-established knowledge graph. Accordingly, the meaning-mapped marketing-specialized knowledge graph is specialized for marketing and includes the latest information and rich synonym information, and can include rich context (CONTEXT) and relationship (ASSOCIATION) information.
  • CONTEXT rich context
  • ASSOCIATION relationship
  • Such a marketing-specialized knowledge graph can include relationship information between keywords, can be used for various solutions such as marketing trend analysis and future predictive analysis, and can be used to individually create a subdivided dictionary and classification system for each marketing field.
  • the marketing-specialized knowledge graph is a graph-based data model including relationship information between knowledge keywords by setting keyword information, which is a marketing entity, as a node, and representing the relationship between each node as an edge.
  • keyword information which is a marketing entity
  • a relational data model may be exemplified, but the marketing information analysis service providing apparatus 100 according to an embodiment of the present invention is based on the recently proposed SEMANTIC WEB technology to overcome the complexity and performance limitations of the relational data model. Based on this, it is possible to create higher efficiencies, expand the knowledge expression method, and solve the problems of scalability of data models and interoperability between systems.
  • the dictionary and classification system for text analysis are manually created by experts in a specific field, and as described above, there is a problem of cost increase due to the increase in the amount of data. There is a problem that this falls, and the technology itself, such as a typical web ontology language (OWL, Ontology Web Language), has problems with low model complexity and reusability.
  • OWL Ontology Web Language
  • the marketing information analysis service providing apparatus 100 provides learning information learned through machine learning from unstructured data analysis information and knowledge extracted from structured data in order to construct a marketing-specialized knowledge graph.
  • the diversified marketing knowledge data is efficiently semantically mapped and processed to enable automation while Its accuracy and performance can be improved.
  • the marketing information analysis service providing apparatus 100 may provide keyword classification and system information based on a marketing specialized knowledge graph through the semantic mapping processing of the diversified marketing knowledge data, It facilitates the reflection of recent issue keywords or new words for marketing purposes, and it is possible to quickly build and process information on compatibility between languages for marketing purposes (eg, foreign language data corresponding to Korean transliteration, etc.).
  • the platform 200 may be a marketing target network platform, and may be connected to the marketing information analysis service providing apparatus 100 through each access channel.
  • Each channel may be, for example, site address information corresponding to a specific platform, and the marketing information analysis service providing apparatus 100 collects marketing document data for each platform channel determined in response to site address information, and collects the results can be stored and analyzed.
  • the machine learning module 400 used in the analysis may process parallel analysis of structured and unstructured data, and hybrid-type document classification processing for this may be performed in advance.
  • Hybrid document classification processing is marketing document data using a machine learning-based primary document classification process and secondary classification information using an ontology dictionary and a linguistic rule from classification information obtained from the primary document classification process. It may include a secondary classification process for classifying As such, the classification information according to the primary and secondary classification may be used as re-learning training information of the machine learning module 400 .
  • the marketing information analysis service providing apparatus 100 may provide an analysis information service for effective marketing to the user terminal 300 .
  • the marketing information analysis service providing apparatus 100 may provide a keyword dictionary construction service for market trend analysis, a digital influence quantification service for each keyword, a trend prediction information providing service according to a prediction model, etc. to the user terminal 300 .
  • the marketing information analysis service providing apparatus 100 analyzes text or voice-based request data received from the user terminal 300, and provides a marketing analysis information providing service using an artificial intelligence chatbot function. You may.
  • FIG. 2 is a block diagram illustrating in more detail an apparatus for providing a marketing service according to an embodiment of the present invention.
  • the apparatus 100 for providing a marketing information analysis service includes a control unit 110 , a communication unit 120 , and a user management unit 130 . ), a channel-based information collection unit 140 , an analysis data processing unit 150 , a dashboard configuration unit 160 , a service providing unit 170 , and a storage unit 190 .
  • the control unit 110 generally controls the execution of the operation and function of each component including the marketing document data information collection, analysis data processing, dashboard configuration, and marketing information analysis service provision of the marketing information analysis service providing device 100 .
  • the controller 110 may be implemented as a processor for controlling all or a part of a function of providing an analysis result of information collected from the platforms 200 to the user terminals 300 or a program for executing the same.
  • the communication unit 120 is a network between the marketing information analysis service providing apparatus 100 and a wireless communication system including a mobile communication network or Internet network or between the service providing apparatus 100 and the platform 200 or the user terminal 300 is located. It may include one or more communication modules that enable wired/wireless communication between them.
  • the communication unit 120 may include a modem that encodes and modulates a transmitted signal and demodulates and decodes a received signal, or an RF front end that processes an RF signal.
  • the user manager 130 performs user registration and account management for one or more user terminals 300 using the service providing apparatus 100 .
  • the user management unit 130 receives authentication information including at least one of account identification information and terminal identification information of a person in charge of a logged-in company or a marketing service provider from the user terminal 300, and uses the authentication information to store user information. Registration can be processed. Accordingly, the user management unit 130 may register and manage information on the platform 200 to provide or analyze a marketing service and information on the user terminal 300 corresponding thereto for each marketing channel.
  • the channel-based information collection unit 140 collects marketing document data through data channels connected from the platform 200 corresponding to the user terminals 300 managed by the user management unit 130, respectively, and for each channel.
  • the collected marketing document data is output to the analysis data processing unit 150 .
  • the marketing document data may form basic analysis information processed by the analysis data processing unit 150 according to an embodiment of the present invention.
  • the marketing document data may include, for example, web page document data collected for each channel from the platform 200 , keyword data collected corresponding to a preset format, or site source code information.
  • the channel-based information collection unit 140 stores a keyword crawler that collects and stores keywords classified by industry/subject/brand in response to each platform 200, a user request collection process, and A collection process manager that allocates a collection process for each channel, a collector for each channel that accesses the platform 200, performs collection by channel and stores the collection result in the storage unit 190, and a problem that collection is stopped due to site source change It may include a collection site source management manager that prepares for and periodically compares and reports newly updated information.
  • the channel-based information collection unit 140 may access the platform 200 through a specific channel according to channel information requested from the user terminal 300 or preset in response to the user terminal 300 .
  • the channel-based information collection unit 140 receives the marketing document data to be collected according to keyword information received from the user terminal 300 or preset corresponding to the user terminal 300 through a data channel connected to the platform 200 . It can be collected through the Star Collector.
  • the channel-specific collector of the channel-based information collection unit 140 may store the collected marketing document data in the collection result database of the storage unit 190 .
  • the channel-based information collection unit 140 identifies the channel information of the platforms 200 for each industry/subject/brand corresponding to the classification information requested from the user terminal 300, and through the channel, the user terminal ( 300), a suitable collection site may be determined, and marketing document data corresponding to preset keyword information may be collected and stored from the determined site.
  • the preset keyword information may be obtained from a marketing ontology-based knowledge graph processed by the analysis data processing unit 150 , which will be described in more detail later.
  • the channel-based information collection unit 140 may register and periodically monitor site information of the platform 200 on which marketing document data is collected, and when source code update information is generated, the information is sent to the user terminal 300 . It provides an alarm and can collect and store updated data.
  • analysis data processing unit 150 may perform document classification processing of the marketing document data collected by the channel-based information collection unit 140 , and may generate or construct a marketing-specialized knowledge graph model using the classified document data.
  • the marketing specialized knowledge graph model includes pre-built keyword-based knowledge graph information, pre-collected ontology information, machine learning learning information of the collected and classified document data, and structured data information.
  • the marketing-specialized knowledge graph model may be modular ontology model data, and the ontology model data includes a core ontology built from key concepts, relationship information, daily keywords and emotional keyword information, and real-time machine learning-based document classification to reflect the latest keywords. It can be designed as a layered domain ontology built from the data obtained from the data, and interoperability can be secured by the semantic web standard technology.
  • the semantic web standard technology may include, for example, a conversion processing technology into a standard protocol language corresponding to an ontology description query, and the converted ontology description query format is RDF (Resource Description Framework) format, OWL (Web Ontoyoly language) Format, Sparkle (SPARQL, Protocol and RDF Query Language) format, etc. may be exemplified.
  • RDF Resource Description Framework
  • OWL Web Ontoyoly language
  • Sparkle SPARQL, Protocol and RDF Query Language
  • the analysis data processing unit 150 includes a knowledge graph construction module 151 that processes knowledge graph construction, a dictionary construction module 152 corresponding to the domain ontology, and filtering classification of structured and unstructured documents It may include a document classification module 153 for each. Accordingly, the analysis data processing unit 150 may provide various service information based on the marketing ontology by using the generated or constructed marketing specialized knowledge graph model.
  • the knowledge graph construction module 151 may acquire machine learning-based marketing learning information, and the acquired marketing learning information may be used to build a marketing-specific knowledge graph model.
  • the dashboard configuration unit 160 may configure a marketing analysis dashboard interface to be provided to the user terminal 300 , and the dashboard may be in the form of a GUI (GRAPHIC USER INTERFACE) such as a web interface. may be visually or aurally output through the user terminal 300 .
  • GUI GUI USER INTERFACE
  • the dashboard configuration unit 160 may configure an artificial intelligence chatbot-based marketing interface dashboard for a user-friendly marketing information analysis service, and through this marketing interface dashboard, a request is made from the user terminal 300 . It can provide various services such as market trend analysis, demand prediction analysis, keyword influence analysis, new word keyword dictionary, and product competitiveness analysis.
  • the service providing unit 170 receives the service request of the user terminal 300, and through the dashboard interface configured in the dashboard configuration unit 160, the marketing information analysis service result corresponding to the service request, the user terminal ( 300), and may include a service manager provided by .
  • the storage unit 190 includes one or more storage media for storing program information for the operation of the above-described control unit 110 and the operation of the above-described components, and may include one or more databases according to each purpose. have.
  • FIG. 3 is a flowchart illustrating an operation of an apparatus for providing a marketing service according to an embodiment of the present invention.
  • the apparatus 100 for providing a marketing information analysis service first collects platform channel-based marketing document data according to a service request of the user terminal 300 ( S101 ).
  • the marketing information analysis service providing apparatus 100 performs hybrid document classification processing according to primary filtering of marketing document data and secondary filtering based on machine learning (S105).
  • the marketing information analysis service providing apparatus 100 extracts unstructured data from the marketing document data (S105), and obtains machine learning-based marketing learning information corresponding to the unstructured data (S107).
  • the marketing information analysis service providing apparatus 100 generates a specialized marketing knowledge graph model using pre-built knowledge graph information and pre-collected ontology information, and the marketing learning information and structured data (S109).
  • the marketing information analysis service providing apparatus 100 performs marketing market trend and demand prediction analysis based on the marketing specialized knowledge graph model (S111).
  • the marketing information analysis service providing apparatus 100 may perform an analysis corresponding to the service according to the request of the user terminal 300, and not only the market trend and demand prediction analysis, but also the construction of a neologism dictionary, keyword influence analysis, etc. This can be done further.
  • the marketing information analysis service providing apparatus 100 may provide marketing analysis information based on natural language processing according to the analysis result by using the dashboard interface (S113).
  • FIG. 4 is a block diagram for explaining in more detail a knowledge graph construction module according to an embodiment of the present invention.
  • the unstructured data for building a marketing-specialized knowledge graph model may be the original text of a marketing web page collected by the channel-based information collection unit 140, and the structured data may be a general-purpose file format or a structured data that can be collected through openAPI It may contain data.
  • the open knowledge graph data may be domestic and foreign data published in RDF format, and may be obtained by receiving an RDF file or a query response targeting a SPARQL endpoint.
  • the knowledge graph construction module 151 processes step-by-step through a two-stage pipeline module as shown in FIG. 4 , thereby effectively marketing specialized knowledge Graph model building processing can be performed.
  • the knowledge graph building module 151 includes an unstructured data processing unit 1511 , a structured data processing unit 1512 , an open knowledge graph management unit 1515 , and a relational database. 1517 , and may include a natural language analysis unit 1513 , a knowledge graph information conversion unit 1514 , a large-capacity knowledge graph processing unit 1516 , and an ontology information processing unit 1518 as the second pipeline module.
  • the data output from the second pipeline may be transmitted to the marketing specialized knowledge graph construction unit 1519 and used to generate marketing specialized knowledge graph model data or keyword analysis information.
  • the unstructured data processing unit 1511 may identify the unstructured data from the marketing document data collected in the first pipeline stage, and transmit it to the natural language analyzer 1513 .
  • the unstructured data may include, for example, text data identified from marketing document data.
  • the natural language analyzer 153 may extract main keywords using natural language processing technology from the unstructured data.
  • the natural language processing technology may be exemplified by techniques such as morpheme analysis and entity name recognition, and the natural language analysis unit 1513 may use classification information of the document classification module 153 for more accurate keyword extraction processing.
  • the knowledge graph information conversion unit 1514 is a marketing knowledge graph information that is mapped and integrated into the knowledge graph information in a preset format by a mapping technology such as rule-based marketing keyword mapping or machine learning algorithm-based mapping. Format conversion can be processed.
  • the open knowledge graph management unit 1515 may collect and store pre-built open knowledge graph information using an openAPI or the like.
  • the large-capacity knowledge graph processing unit 1516 pre-builds the large-capacity knowledge graph information prepared so that the collected open knowledge graph information can be mapped to the marketing knowledge graph information that has been format-converted from the natural language analysis information described above,
  • the knowledge graph information may be transmitted to the marketing specialized knowledge graph model building unit 1519 .
  • the relational database 1517 may collect and store ontology information for semantic mapping between the knowledge graph information converted by the knowledge graph information conversion unit 1514 and the knowledge graph information processed by the large capacity knowledge graph processing unit 1516, Among the stored ontology information, mutually compatible ontology information may be transmitted to the marketing specialized knowledge graph construction unit 1519 .
  • the marketing-specialized knowledge graph model building unit 1519 collects open knowledge graph information collected from an RDF file or SPARQL Endpoint as knowledge graph model information for processing a large-capacity knowledge graph, and the converted marketing knowledge graph information By building a mapping table between and the large-capacity knowledge graph information, a marketing-specific knowledge graph model can be built.
  • the marketing-specialized knowledge graph model building unit 1519 performs mapping processing based on the unique identifier assigned to each data item, but in the case of the same data whose identifiers do not match, the pre-collected ontology information-based relationship information and attributes After calculating the matching probability through the information, data mapping processing for preferentially mapping the high probability may be performed.
  • FIG. 5 is a flowchart illustrating an operation of a knowledge graph construction module according to an embodiment of the present invention
  • FIG. 6 is a relationship diagram illustrating a knowledge graph construction and semantic mapping process according to an embodiment of the present invention.
  • the knowledge graph building module 151 is a knowledge graph from OpenAPI or structured file data. Conversion rule information may be obtained (S201).
  • the conversion rule information may be obtained from a conversion rule file described in R2RML (RDB to RDF Mapping Language), which is a W3C international standard.
  • R2RML RDB to RDF Mapping Language
  • the transformation rule information may be converted into knowledge graph transformation rule data using transformation rules described in RML (RDF Mapping Language) from OpenAPI or formatted file data.
  • the knowledge graph construction module 151 obtains ontology transformation rule information from the relational database (S203), and transforms the natural language analysis information of the unstructured data according to the knowledge graph transformation rule information (S205).
  • the knowledge graph construction module 151 maps the transformed knowledge graph information to a pre-built large-capacity knowledge graph according to the ontology transformation rule information to build a marketing-specialized knowledge graph model (S207).
  • the knowledge graph construction module 151 may include a marketing-specific knowledge graph model construction unit 1519 for generating marketing-specific knowledge graph model data.
  • the marketing specialized knowledge graph model building unit 1519 may include the semantic mapping processing unit to efficiently perform the above-described mapping processing with high accuracy.
  • the semantic mapping processing unit may further include a fuzzy algorithm processing unit and a URI identifier processing unit.
  • the semantic mapping processing unit may process semantic mapping between items of data converted into a knowledge graph format (eg, RDF) and a pre-established large-capacity knowledge graph item.
  • a knowledge graph format eg, RDF
  • the semantic mapping processing unit may include a URI identifier processing unit for processing primary mapping by comparing URI identifiers assigned to all data items.
  • the semantic mapping processing unit applies a semantic mapping tool between words implemented based on the Levenshtein fuzzy metric algorithm developed according to the linguistic characteristics of Korean from the primary mapping-processed data to obtain automated meaning. Mapping can be handled.
  • the data for which the automatic mapping is completed may be subjected to sampling processing, and the processed sampling data may be used for subsequent mapping inspection and correction processing.
  • the knowledge graph construction module 151 may acquire knowledge graph model data on which semantic mapping is completed as marketing-specific knowledge graph model data.
  • the knowledge graph construction module 151 may integrally generate a knowledge graph model by importing the mapped knowledge graph data into a triplestore type database in which the large-capacity knowledge graph data previously built is stored. have.
  • the final knowledge graph model be described as an RDF (Resource Description Framework) data model, which improves compatibility and analysis efficiency.
  • RDF Resource Description Framework
  • the classification system for each item of the established large-capacity knowledge graph may be a marketing-specialized system created by a domain expert in the marketing field.
  • the open knowledge graph management unit 1515 manages the classification system for each field based on the public interest (can be calculated as a number of searches for each period of the main portal service) corresponding to each classification system keyword, and the classification system for each field may decide to keep or archive them.
  • the apparatus 100 for providing marketing information analysis service according to an embodiment of the present invention, the problem of not reflecting the latest keywords pointed out as a disadvantage of the general knowledge graph, the Korean-based knowledge graph and It solves the difficulty of building dictionary data for analysis, facilitates marketing trend and keyword analysis through the establishment of a marketing-specialized knowledge graph model, and makes accurate marketing at a lower cost by facilitating the reflection of new words and Korean keyword analysis in particular. It has the advantage of being able to provide information analysis services.
  • FIG. 7 is a block diagram for explaining in more detail a neologism dictionary construction module according to an embodiment of the present invention.
  • the analysis data processing unit 150 may construct neologism dictionary information that can be used for marketing analysis by using the knowledge graph for providing the marketing information service, and the constructed neologism dictionary information has the latest information and is to be updated in real time.
  • the analysis data processing unit 150 may include a neologism dictionary building module 152 .
  • the neologism dictionary building module 152 may learn and process neologism dictionary information from the marketing-specialized knowledge graph model data and output it.
  • the neologism dictionary building module 152 according to an embodiment of the present invention, in particular, through a machine learning-based learning process between transliterations for each country in which languages such as foreign words are different, such as foreign language neologisms through keyword analysis between different transliterations. Keyword data useful for marketing can be output.
  • the neologism dictionary construction module 152 converts keywords such as person names, brand names, and product names from various foreign keyword-based knowledge graphs into a knowledge graph of Korean name notation through transliteration conversion. can do.
  • the transliteration-converted knowledge graph may also be used as a Korean dictionary of neologisms as structured data for natural language processing of marketing document data processed by the analysis data processing unit 150 .
  • the neologism dictionary construction module 152 includes a data preprocessor 1521 , a learning modeling unit 1522 , and a predictive modeling unit 1523 .
  • the preprocessor 1521 collects and processes the notation data for each language for machine learning. For example, the preprocessor 1521 collects, stores, and manages transliteration data between languages from public knowledge graph data such as wiki data, and the interlingual transliteration data is a learning modeling unit 1522 and a predictive modeling unit 1523. It can be used as a training data set of
  • the preprocessing unit 1521 transmits a SPARQL query corresponding to the SPARQL endpoint, extracts required interlingual transliteration data from the SPARQL knowledge graph store (Triplestore), and transmits it to be used for learning by the learning modeling unit 1522.
  • the query information may include, for example, English transliteration information of an entity that is a target of a Korean transliteration, such as 'person', 'product', and 'brand'.
  • the preprocessor 1521 may filter the collected transliteration data into refined data for learning through preprocessing.
  • the learning modeling unit 1522 may drive the machine learning module 400 including the artificial neural network mechanism using the preprocessed refined data to process the modeling of the transliteration learning data.
  • the learning data modeling process includes a transliteration dictionary formation process according to string vectorization, a three-dimensional array formation process for learning corresponding to a transliteration dictionary, designating the size of a word set as a dimension of a vector, assigning 1 to an index of a required word, and other It may include a one-hot encoding process of configuring a one-hot vector by assigning 0 to the index, a vector characterization process of configuring the one-hot encoded vector as training data, and forming a dictionary in which the vector is characterized. have.
  • the predictive modeling unit 1523 may perform machine learning analysis and predictive processing to construct a predictive model using the training data.
  • the predictive modeling unit 1523 may encode the learning data by applying a combination of a recurrent neural network (RNN) analysis, a Long Short Term Memory (LSTM), or a GATED RECURRENT Unit (GRU) algorithm.
  • RNN recurrent neural network
  • LSTM Long Short Term Memory
  • GRU GATED RECURRENT Unit
  • the predictive modeling unit 1523 may request the machine learning module 400 to process an attention mechanism that applies a weight corresponding to the main vocabulary and learns a situation indicating the highest matching probability.
  • the predictive modeling unit 1523 may construct a cross entropy model, which is a loss function prediction model obtained through the prediction process, and set it to be used in the transliteration process thereafter.
  • the neologism dictionary building module 152 may generate transliteration-converted neologism dictionary information using the prediction model generated by the predictive modeling unit 1523, and the neologism dictionary information is used for natural language processing when constructing a knowledge graph. Or it can be used to build a knowledge graph-based marketing keyword dictionary.
  • FIGS. 9 to 12 are diagrams illustrating data processing according to the transliteration-based neologo information processing process for each country.
  • the neologism dictionary building module 152 collects transliteration data for pre-processing learning ( S301 ).
  • the transliteration data may include, for example, foreign language transliteration data of a knowledge graph collected from a foreign site.
  • the neologism dictionary building module 152 performs the primary preprocessing based on the regular function through the preprocessor 1521 (S303), and performs the secondary preprocessing for removing blanks and duplicate words (S305), the meaning A tertiary preprocessing based on word separation is performed (S307), and a quaternary preprocessing corresponding to the reversed word is performed (S309).
  • the preprocessor 1521 may perform the quaternary data preprocessing as described above to improve the accuracy of the Korean notation prediction modeling of the collected foreign language transliteration data.
  • the first preprocessing includes a process of removing characters that generate an error during encoding among special symbols, Chinese characters, Chinese characters, Russian characters, and Czech characters using regular expressions.
  • the secondary preprocessing includes preprocessing for removing duplicates of Korean and English names and spaces, which can improve data conversion speed and accuracy during Onehot encoding used when the machine learning module 400 is driven.
  • the tertiary preprocessing includes a meaning-based word matching process.
  • the tertiary preprocessing may include a process of 1:1 matching processing of English words with related meanings such as Duchess, Duke, King, Princess, Prince, Emperor, etc. based on a preset heuristic rule. have.
  • the quaternary preprocessing is reverse order processing for processing a language having a reverse order, such as Japanese, and overall accuracy can be improved through filtering processing for a reverse order language such as Kubo, Tsuda, and Hira, for example.
  • the learning modeling unit 1522 of the neologism dictionary building module 152 processes the modeling from the pre-processed data to the learning data for machine learning (S311).
  • the predictive modeling unit 1523 of the neologism dictionary building module 152 generates a neologism transliteration model through machine learning predictive modeling processing using the learning data (S313).
  • the predictive modeling unit 1523 may process LSTM or GRU encoding and decoding to apply front and rear and continuity of data to the learning model.
  • the predictive modeling unit 1523 may maximize the accuracy of transliteration conversion by giving weights corresponding to frequent words through an attention algorithm.
  • the predictive modeling unit 1523 can solve the problem of a large difference in translation accuracy depending on the length of an English word through a spatial split and a join process of training data. have.
  • the predictive modeling unit 1523 may separately model voice range data according to a spatial split as shown in FIG. By rejoining the information, a relatively accurate sound range as shown in FIG. 10(B) can be obtained.
  • the advantage of the attention algorithm can be maximized by learning to determine the accuracy according to the spatial split.
  • the predictive modeling unit 1523 may perform accuracy verification processing for each number of characters for the attention algorithm processing, and according to the results processed for each character section and the average accuracy
  • the weighting may be processed and used to generate a predictive model.
  • FIG. 12 shows the prediction result of the test model according to an embodiment of the present invention.
  • the prediction model is generated as shown in FIG. 12, when the knowledge graph or dictionary information in English or other language is built , it facilitates the conversion to Korean, and this has the advantage that it can be used as very useful information in the creation and utilization of the knowledge graph.
  • this embodiment of the present invention can be applied to a knowledge graph data set or application that requires a large amount of transliteration of Hangul, and even when the English pronunciation method is different or the context for each language is different, it can be extended and driven in the form of a translator.
  • the above-described method according to various embodiments of the present invention may be implemented as a program and provided to each server or device while being stored in various non-transitory computer readable media. Accordingly, the user terminal 100 may access the server or device and download the program.
  • the non-transitory readable medium refers to a medium that stores data semi-permanently, rather than a medium that stores data for a short moment, such as a register, cache, memory, etc., and can be read by a device.
  • a non-transitory readable medium such as a CD, DVD, hard disk, Blu-ray disk, USB, memory card, ROM, and the like.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 실시 예에 따른 서비스 제공 장치는, 서비스 제공 장치에 있어서, 마케팅 특화 지식 그래프 모델 학습을 위한 외국어 음역 학습 데이터를 수집하여 전처리하는 전처리부; 상기 외국어 음역 학습 데이터로부터 벡터 기반 학습 데이터를 모델링하는 학습 모델링부; 및 상기 학습 데이터로부터 음역 전환을 위한 예측 모델을 생성하며, 상기 예측 모델에 외국어 음역 데이터를 적용하여 국문 음역 데이터로 전환 출력하는 예측 모델링부를 포함한다.

Description

지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치
본 발명은 서비스 제공 방법 및 그 장치에 관한 것이다. 보다 구체적으로, 본 발명은 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치에 관한 것이다.
인터넷 기술이 발달함에 따라서, 교양, 쇼핑, 엔터테인먼트, 마케팅 등 다양한 분야에서 온라인 서비스가 제공되고 있다. 그 중, 온라인 마케팅은 최초 홈페이지를 통해서 기업 또는 제품의 정보를 사용자에게 일방적으로 전달하는 형식으로 시작되었으며, 최근에는 SNS 이용이 급증함에 따라서 SNS를 활용한 다양한 마케팅도 시도되고 있다.
특히 스마트 폰과 같은 고성능 단말 장치의 등장과, Wi-Fi 망과 같은 저렴하게 이용 가능한 무선 네트워크의 구축에 따라, 온라인 환경의 이용자는 급증하고 있는 추세이며, 이러한 온라인 환경에서 수집되는 다양한 정보들이 빅데이터로 활용되면서 마케팅 및 효과 분석에도 이용되고 있다.
그러나, 최근 분석 데이터량의 급격한 증가에 의해 이를 분석하기 위한 비용 및 시간 또한 급격히 증가되고 있다. 특히, 이러한 데이터량 증가로 인한 마케팅 환경은, 마케팅 비용 대비 효과 등을 분석하기 위한 분석 전문가와 마케터를 추가 고용하여야 하는 생산 인프라를 요구하고 있으며, 고용이 어려운 중소/중견 기업에서는 결과적으로 단편적이고 직관적인 일부 분석만이 가능할 뿐 저비용으로 효과적인 마케팅 분석 컨설팅을 제공받기는 매우 어려운 실정이다.
이에 따라, 현재로서는 중소/중견 기업에서는 마케터 직원의 직관과 감에 의존한 의사결정 마케팅이 주를 이루고 있으며, 분석할 수 있는 데이터량은 증가함에도 불구하고 그 흐름을 쫓아가기가 사실상 어려운 문제점이 있다.
따라서, 저비용으로도 정확한 근거에 기반하여 마케팅 의사결정을 용이하게 하는 효율적 마케팅 분석 서비스의 필요성이 대두되고 있다.
특히, 이러한 마케팅 의사결정에 있어서, 국가간 음역이 상이함으로 인한 차이점은 글로벌 마케팅의 가장 중요한 포인트일 수 있다.
그러나, 아직 다량의 특정 국가 키워드를 다른 국가의 언어로 음역하는 기능이나 어플리케이션은 부족한 상황이다. 특히, 영어 외의 외래어에 대한 한글 음역을 지원하는 일부 어플리케이션은 존재하고는 있으나, 반대로 영어의 한글 음역은 제공하지 않는 문제점도 존재하고 있다.
이에 따라, 영어의 한글 음역은 국립국어원이 정한 외래어 표기법에 따라 사람이 수기로 음역하거나 국립국어원이 제공하는 어문 규범의 용례를 참조하여 사람이 직직접 음역하는 것이 일반적인 방법으로 이용되고 있는 실정이다. 예를 들어, 출판 분야의 경우 회사별 한글 음역 규칙을 두고 있을 만큼 시간과 인적 비용이 소요되는 비효율적인 방식으로 한글 음역 작업이 진행되고 있는 실정인 것이다.
본 발명은 상기한 바와 같은 과제를 해결하기 위해 안출된 것으로, 마케팅 채널별 분석 정보에 기초한 마케팅 특화 지식 그래프 모델을 기반으로 하는 마케팅 정보 분석 서비스를 인공지능 기술을 통해 효과적으로 제공함으로써, 저비용 고효율로 마케팅 의사결정을 지원할 수 있는 효율적 마케팅 분석 서비스 제공 방법 및 그 장치를 제공하는데 그 목적이 있다.
또한, 본 발명은 상기한 바와 같은 마케팅 의사결정 및 분석을 위하여, 인공신경망을 활용한 음역 전환 프로세스를 구현함으로써, 상기 마케팅 특화 지식 그래프 및 국가별 음역 기반의 신조어 정보 서비스를 마케팅 정보 서비스로서 제공할 수 있는 서비스 제공 방법 및 그 장치를 제공하는데 그 목적이 있다.
상기한 바와 같은 과제를 해결하기 위한 본 발명의 실시 예에 따른 서비스 제공 장치는, 마케팅 특화 지식 그래프 모델 학습을 위한 외국어 음역 학습 데이터를 수집하여 전처리하는 전처리부; 상기 외국어 음역 학습 데이터로부터 벡터 기반 학습 데이터를 모델링하는 학습 모델링부; 및 상기 학습 데이터로부터 음역 전환을 위한 예측 모델을 생성하며, 상기 예측 모델에 외국어 음역 데이터를 적용하여 국문 음역 데이터로 전환 출력하는 예측 모델링부를 포함한다.
상기한 바와 같은 과제를 해결하기 위한 본 발명의 실시 예에 따른 서비스 제공 방법은, 마케팅 특화 지식 그래프 모델 학습을 위한 외국어 음역 학습 데이터를 수집하여 전처리하는 단계; 상기 외국어 음역 학습 데이터로부터 벡터 기반 학습 데이터를 모델링하는 단계; 및 상기 학습 데이터로부터 음역 전환을 위한 예측 모델을 생성하며, 상기 예측 모델에 외국어 음역 데이터를 적용하여 국문 음역 데이터로 전환 출력하는 단계를 포함한다.
한편, 상기한 바와 같은 과제를 해결하기 위한 본 발명의 실시 예에 따른 방법은, 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램 및 그 프로그램이 기록된 기록 매체로 구현될 수 있다.
본 발명의 실시 예에 따르면, 마케팅 채널별 분석 정보에 기초한 마케팅 특화 지식 그래프 모델을 기반으로 하는 마케팅 정보 분석 서비스를 인공지능 기술을 통해 효과적으로 제공함으로써, 저비용 고효율로 마케팅 의사결정을 지원할 수 있는 효율적 마케팅 분석 서비스 제공 방법 및 그 장치를 제공할 수 있다.
또한, 본 발명의 실시 예에 따르면, 인공신경망을 활용한 마케팅 문서 데이터의 전처리에 따른 음역 전환 프로세스를 구현함으로써, 상기 마케팅 특화 지식 그래프 및 국가별 음역 기반의 신조어 정보 서비스를 마케팅 정보 서비스로서 제공할 수 있는 서비스 제공 방법 및 그 장치를 제공할 수 있다.
도 1은 본 발명의 실시 예에 따른 전체 시스템 개략적으로 도시한 블록도이다.
도 2는 본 발명의 실시 예에 따른 마케팅 서비스 제공 장치를 보다 구체적으로 도시한 블록도이다.
도 3은 본 발명의 실시 예에 따른 마케팅 서비스 제공 장치의 동작을 설명하기 위한 흐름도이다.
도 4는 본 발명의 실시 예에 따른 지식 그래프 구축 모듈을 보다 구체적으로 설명하기 위한 블록도이다.
도 5는 본 발명의 실시 예에 따른 지식 그래프 구축 모듈의 동작을 설명하기 위한 흐름도이다.
도 6은 본 발명의 실시 예에 따른 지식그래프 구축 및 의미 매핑 과정을 설명하기 위한 관계도이다.
도 7은 본 발명의 실시 예에 따른 신조어 사전 구축 모듈을 보다 구체적으로 설명하기 위한 블록도이다.
도 8은 본 발명의 실시 예에 따른 국가별 음역 전환 기반 신조어 정보 처리 프로세스를 설명하기 위한 흐름도이며, 도 9 내지 도 12는 국가별 음역 전환 기반 신조어 정보 처리 프로세스에 따른 데이터 처리 예시도이다.
이하의 내용은 단지 본 발명의 원리를 예시한다. 그러므로 당업자는 비록 본 명세서에 명확히 설명되거나 도시되지 않았지만 본 발명의 원리를 구현하고 본 발명의 개념과 범위에 포함된 다양한 장치를 발명할 수 있는 것이다. 또한, 본 명세서에 열거된 모든 조건부 용어 및 실시예들은 원칙적으로, 본 발명의 개념이 이해되도록 하기 위한 목적으로만 명백히 의도되고, 이와 같이 특별히 열거된 실시예들 및 상태들에 제한적이지 않는 것으로 이해되어야 한다.
또한, 본 발명의 원리, 관점 및 실시예들 뿐만 아니라 특정 실시예를 열거하는 모든 상세한 설명은 이러한 사항의 구조적 및 기능적 균등물을 포함하도록 의도되는 것으로 이해되어야 한다. 또한 이러한 균등물들은 현재 공지된 균등물뿐만 아니라 장래에 개발될 균등물 즉 구조와 무관하게 동일한 기능을 수행하도록 발명된 모든 소자를 포함하는 것으로 이해되어야 한다.
따라서, 예를 들어, 본 명세서의 블럭도는 본 발명의 원리를 구체화하는 예시적인 회로의 개념적인 관점을 나타내는 것으로 이해되어야 한다. 이와 유사하게, 모든 흐름도, 상태 변환도, 의사 코드 등은 컴퓨터가 판독 가능한 매체에 실질적으로 나타낼 수 있고 컴퓨터 또는 프로세서가 명백히 도시되었는지 여부를 불문하고 컴퓨터 또는 프로세서에 의해 수행되는 다양한 프로세스를 나타내는 것으로 이해되어야 한다.
프로세서 또는 이와 유사한 개념으로 표시된 기능 블럭을 포함하는 도면에 도시된 다양한 소자의 기능은 전용 하드웨어뿐만 아니라 적절한 소프트웨어와 관련하여 소프트웨어를 실행할 능력을 가진 하드웨어의 사용으로 제공될 수 있다. 프로세서에 의해 제공될 때, 상기 기능은 단일 전용 프로세서, 단일 공유 프로세서 또는 복수의 개별적 프로세서에 의해 제공될 수 있고, 이들 중 일부는 공유될 수 있다.
또한 프로세서, 제어 또는 이와 유사한 개념으로 제시되는 용어의 명확한 사용은 소프트웨어를 실행할 능력을 가진 하드웨어를 배타적으로 인용하여 해석되어서는 아니되고, 제한 없이 디지털 신호 프로세서(DSP) 하드웨어, 소프트웨어를 저장하기 위한 롬(ROM), 램(RAM) 및 비 휘발성 메모리를 암시적으로 포함하는 것으로 이해되어야 한다. 주지관용의 다른 하드웨어도 포함될 수 있다.
본 명세서의 청구범위에서, 상세한 설명에 기재된 기능을 수행하기 위한 수단으로 표현된 구성요소는 예를 들어 상기 기능을 수행하는 회로 소자의 조합 또는 펌웨어/마이크로 코드 등을 포함하는 모든 형식의 소프트웨어를 포함하는 기능을 수행하는 모든 방법을 포함하는 것으로 의도되었으며, 상기 기능을 수행하도록 상기 소프트웨어를 실행하기 위한 적절한 회로와 결합된다. 이러한 청구범위에 의해 정의되는 본 발명은 다양하게 열거된 수단에 의해 제공되는 기능들이 결합되고 청구항이 요구하는 방식과 결합되기 때문에 상기 기능을 제공할 수 있는 어떠한 수단도 본 명세서로부터 파악되는 것과 균등한 것으로 이해되어야 한다.
상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.
도 1은 본 발명의 실시 예에 따른 전체 시스템을 개략적으로 도시한 개념도이다.
본 발명의 실시 예에 따른 전체 시스템은 마케팅 정보 분석 서비스 제공 장치(100), 상호 구분되는 하나 이상의 채널을 통해 연결된 마케팅 플랫폼(200) 및 하나 이상의 사용자 단말(300)을 포함하며, 마케팅 정보 분석 서비스 제공 장치(100)는, 머신 러닝 모듈(400)과 연결되거나, 상기 머신 러닝 모듈(400)을 포함할 수 있다.
마케팅 정보 분석 서비스 제공 장치(100)는, 마케팅 정보 분석 서비스 제공을 위해, 각 플랫폼(200) 및 사용자 단말(300)과 유/무선 네트워크를 통해 연결될 수 있으며, 학습 및 인공지능 기반의 마케팅 정보 분석을 위해 머신 러닝 모듈(400)과 연결되거나, 머신 러닝 모듈(400)을 포함할 수 있으며, 각 네트워크에 연결된 장치 또는 단말들은 사전 설정된 네트워크 채널을 통해 상호간 통신을 수행할 수 있다.
여기서 상기 각 네트워크는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN), 부가가치 통신망(Value Added Network; VAN), 개인 근거리 무선통신(Personal Area Network; PAN), 이동 통신망(mobile radiocommunication network) 또는 위성 통신망 등과 같은 모든 종류의 유/무선 네트워크로 구현될 수 있다.
사용자 단말(300)은 마케팅 의사결정을 위한 마케팅 분석 서비스를 제공 받기 위한 목적으로 마케팅 정보 분석 서비스 제공 장치(100)에 접속하는 다양한 서버 장치, 네트워크 장치 또는 단말 장치를 포함할 수 있다.
특히, 일반적으로 사용자 단말(300)들은 개별적인 보안 네트워크를 통해 마케팅 정보 분석 서비스 제공 장치(100)와 연결될 수 있으며, 마케팅 정보 분석 서비스 제공 장치(100)는 각각의 보안 네트워크를 통해 각 사용자 단말(300)들로부터 제공되는 기업 정보에 기초하여 채널 기반 마케팅 문서 데이터를 수집하고, 수집된 문서 데이터에 대응하는 분석 결과 정보를 상기 보안 네트워크를 통해 사용자 단말(300)로 제공할 수 있다. 여기서 보안 네트워크는 암호화 네트워크 일 수 있으며, 서비스 등록된 사용자 단말(300)은 기업 인증에 따른 복호화 키 정보를 사전 저장하고, 마케팅 정보 분석 서비스 제공 장치(100)로부터 수신되는 마케팅 분석 결과 정보를, 상기 복호화 키 정보에 따라 복호화하여 획득 및 출력할 수 있다.
이와 같은 본 발명의 실시 예에 따르면, 상기 사용자 단말(300)들은 마케팅 정보 분석 서비스 제공 장치(100)에 대응한 기본 정보 등록 프로세스가 완료된 상태일 수 있다.
예를 들어, 사용자 단말(300)은 각 기업 소속으로서 마케팅 정보 분석 서비스를 제공받는 단말일 수 있다. 예를 들어, 직접 마케팅 의사결정을 수행하는 기업의 단말이거나, 복수의 기업과 제휴하여 마케팅 서비스를 제공하는 기업의 단말이거나, 복수의 네트워크간 데이터를 중개하는 네트워크 서비스 기업의 단말일 수도 있다.
그리고, 마케팅 정보 분석 서비스 제공 장치(100)는 각 사용자 단말(300)로부터 기업 정보를 수신하고, 수신된 기업 정보에 기초하여 사전 분류된 마케팅 네트워크 채널 기반의 마케팅 문서 데이터를 수집하며, 상기 문서 데이터의 처리에 따른 비정형 데이터를 머신 러닝 모듈(400)을 통해 학습 처리하여, 미리 구축된 지식그래프 정보 및 온톨로지 정보와, 상기 학습 정보 및 미리 수집 및 분석된 정형 데이터를 이용하여, 마케팅 특화 지식 그래프 모델을 생성한다.
이에 따라, 마케팅 정보 분석 서비스 제공 장치(100)는 상기 마케팅 특화 지식 그래프 모델을 이용한 마케팅 시장 트렌드 및 수요 예측 분석을 처리할 수 있으며, 처리된 결과 정보에 따른 마케팅 분석 정보를 사용자 단말(300)로 제공할 수 있다.
여기서, 상기 마케팅 특화 지식그래프는, 기 구축된 지식그래프 모델 정보를 기업 정보 및 마케팅 문서 수집 정보의 자연어 분석 결과에 따라, 의미 매핑 처리하여 구축될 수 있는 것으로서, 상기 마케팅 정보 분석 서비스 제공 장치(100)는 이러한 의미 매핑 처리를 위한 자연어 처리 및 텍스트 분석에 필요한 사전(DICTIONARY) 정보와, 분류체계 구축을 위한 온톨로지 정보를 미리 수집하여 저장 및 관리할 수 있다.
보다 구체적으로, 마케팅 정보 분석 서비스 제공 장치(100)는 마케팅에 특화된 사전(DICTIONARY)과 분류 체계를 사전 수집 및 설정하고, 기업 정보에 대응하여 각 마케팅 채널별로 수집되는 마케팅 문서 정보의 자연어 분석 기반 학습 처리에 따라, 기 구축된 지식그래프에 의미 매핑을 수행할 수 있다. 이에 따라, 의미 매핑된 마케팅 특화 지식그래프는 마케팅에 특화되어 정보의 최신성과 풍부한 유의어 정보를 포함하고, 풍부한 맥락(CONTEXT)와 관계(ASSOCIATION) 정보를 포함할 수 있게 된다.
이러한 마케팅 특화 지식그래프는 키워드 간 관계 정보를 포함할 수 있으며, 마케팅 트랜드 분석 및 향후 예측 분석과 같은 다양한 솔루션에 이용될 수 있고, 세분화된 마케팅 분야별 사전 및 분류체계를 개별적으로 생성하는 데에도 이용될 수 있다.
본 발명의 실시 예에 따른 마케팅 특화 지식 그래프는 마케팅 개체인 키워드 정보를 노드로 설정하고, 각 노드 간 관계를 엣지로 나타냄으로써, 지식 키워드간 관계 정보를 포함하는 그래프 기반의 데이터 모델로서, 기본적으로는 관계형 데이터 모델이 예시될 수 있으나, 본 발명의 실시 예에 따른 마케팅 정보 분석 서비스 제공 장치(100)는 관계형 데이터 모델의 복잡성 및 성능 한계를 극복하기 위해 최근 제안된 시맨틱 웹(SEMANTIC WEB) 기술에 기반하여 보다 높은 효율성을 창출하고, 지식 표현 방법의 확장과, 데이터 모델의 확장성 및 시스템 간 상호 운용성 문제를 해결할 수 있다.
특히, 텍스트 분석을 위한 사전과 분류 체계는 특정 분야의 전문가에 의해 수동적으로 이루어져 전술한 바와 같은 데이터량 증가에 따른 비용증가의 문제점이 있으며, 단순히 일방적인 크롤링을 통해 구축되는 사전 및 분류 체계는 품질이 떨어지는 문제점이 있고, 통상의 웹 온톨로지 언어(OWL, Ontology Web Language)과 같은 기술 그 자체는 모델의 복잡성과 재활용성이 낮은 문제점이 있다.
이에 따라, 본 발명의 실시 예에 따른 마케팅 정보 분석 서비스 제공 장치(100)는, 마케팅 특화 지식 그래프 구축을 위해, 비정형 데이터 분석 정보로부터 머신 러닝을 통해 학습된 학습 정보와, 정형 데이터로부터 추출되는 지식 그래프 변환 규칙 정보와, 오픈 지식 그래프로부터 획득되는 기 구축 지식그래프 정보 및 사전 관리되는 관계 데이터베이스로부터 획득되는 온톨로지 규칙 정보에 기초하여, 다변화된 마케팅 지식 데이터를 효율적으로 의미 매핑 처리함으로써, 자동화가 가능하면서도 그 정확도 및 성능은 높일 수 있다.
특히, 본 발명의 실시 예에 따른 마케팅 정보 분석 서비스 제공 장치(100)는 이와 같은 다변화된 마케팅 지식 데이터의 의미 매핑 처리를 통해, 마케팅 특화 지식 그래프 기반의 키워드 분류 및 체계 정보를 제공할 수 있으며, 마케팅을 목적으로 하는 최근 이슈 키워드나 신조어 등의 반영을 용이하게 하며, 마케팅 목적의 언어간 호환 정보(예를 들어, 한글 음역에 대응하는 외래어 데이터 등)도 빠르게 구축 및 처리할 수 있다.
한편, 플랫폼(200)은 마케팅 대상이 되는 네트워크 플랫폼일 수 있으며, 각각의 접속 채널을 통해 마케팅 정보 분석 서비스 제공 장치(100)와 연결될 수 있다. 각 채널은 예를 들어, 특정 플랫폼에 대응하는 사이트 주소 정보일 수 있으며, 마케팅 정보 분석 서비스 제공 장치(100)는 사이트 주소 정보에 대응하여 결정된 각 플랫폼 채널별 마케팅 문서 데이터를 수집하고, 수집된 결과를 저장 및 분석할 수 있다.
또한, 분석에 있어서 사용되는 머신 러닝 모듈(400)은, 정형 및 비 정형 데이터의 병렬적 분석을 처리할 수 있으며, 이를 위한 하이브리드형 문서 분류 처리가 사전 수행될 수 있다. 하이브리드형 문서 분류 처리는, 머신 러닝 기반의 1차 문서 분류 프로세스와, 1차 문서 분류 프로세스로부터 획득되는 분류 정보로부터 온톨로지 사전 및 언어 법칙(Linguistic Rule)을 이용한 2차 분류 정보를 이용하여 마케팅 문서 데이터를 분류하는 2차 분류 프로세스를 포함할 수 있다. 이와 같이 1차 및 2차 분류에 따른 분류 정보는 머신 러닝 모듈(400)의 재학습 트레이닝 정보로서 이용될 수 있다.
그리고, 이러한 분류 및 분석 처리에 따라, 본 발명의 실시 예에 따른 마케팅 정보 분석 서비스 제공 장치(100)는 효과적인 마케팅을 위한 분석 정보 서비스를 사용자 단말(300)로 제공할 수 있다. 예를 들어, 마케팅 정보 분석 서비스 제공 장치(100)는 시장 트렌드 분석을 위한 키워드 사전 구축 서비스, 키워드별 디지털 영향력 정량화 서비스, 예측 모델에 따른 트렌드 예측 정보 제공 서비스 등을 사용자 단말(300)로 제공할 수 있다.
또한, 이러한 서비스 제공을 위해, 마케팅 정보 분석 서비스 제공 장치(100)는 사용자 단말(300)로부터 수신되는 텍스트 또는 음성 기반 요청 데이터를 분석하여, 인공지능 챗 봇 기능을 이용한 마케팅 분석 정보 제공 서비스를 제공할 수도 있다.
도 2는 본 발명의 실시 예에 따른 마케팅 서비스 제공 장치를 보다 구체적으로 도시한 블록도이다.
도 2를 참조하면, 본 발명의 실시 예에 따른 도 2를 참조하면, 본 발명의 실시 예에 따른 마케팅 정보 분석 서비스 제공 장치(100)는 제어부(110), 통신부(120), 사용자 관리부(130), 채널 기반 정보 수집부(140), 분석 데이터 처리부(150), 대시보드 구성부(160), 서비스 제공부(170) 및 저장부(190)를 포함하여 구성될 수 있다.
제어부(110)는 마케팅 정보 분석 서비스 제공 장치(100)의 마케팅 문서 데이터 정보 수집, 분석 데이터 처리, 대시보드 구성 및 마케팅 정보 분석 서비스 제공을 포함하는 각 구성요소의 동작 및 기능의 실행을 전반적으로 제어한다. 예를 들어, 제어부(110)는 플랫폼(200)들로부터 수집된 정보의 분석 결과를 사용자 단말(300)들로 제공하는 기능의 전부 또는 일부를 제어하기 위한 프로세서 또는 이를 실행하기 위한 프로그램으로 구현될 수 있다.
그리고, 통신부(120)는 마케팅 정보 분석 서비스 제공 장치(100)와 이동 통신망 또는 인터넷망을 포함하는 무선 통신 시스템 사이 또는 서비스 제공 장치(100)와 플랫폼(200) 또는 사용자 단말(300)이 위치한 네트워크 사이의 유무선 통신을 가능하게 하는 하나 이상의 통신 모듈을 포함할 수 있다. 예를 들어, 통신부(120)는 송신된 신호를 부호화 및 변조하고, 수신된 신호를 복조 및 복호화하는 모뎀(modem) 또는 RF 신호를 처리하는 RF 프론트 엔드 등을 포함할 수 있다.
한편, 사용자 관리부(130)는 서비스 제공 장치(100)를 이용하는 하나 이상의 사용자 단말(300)에 대한 사용자 등록 및 계정 관리를 수행한다.
사용자 관리부(130)는 사용자 단말(300)로부터 로그인한 기업의 담당자 또는 마케팅 서비스 제공자의 계정 식별 정보, 단말 식별 정보 중 적어도 하나를 포함하는 인증 정보를 수신하고, 상기 인증 정보를 이용하여 사용자 정보의 등록을 처리할 수 있다. 이에 따라, 사용자 관리부(130)는 마케팅 서비스를 제공하거나 분석할 플랫폼(200) 정보와 이에 대응하는 사용자 단말(300) 정보를 마케팅 채널별로 등록 및 관리할 수 있다.
그리고, 채널 기반 정보 수집부(140)는 상기 사용자 관리부(130)에서 관리되는 사용자 단말(300)들에 대응하는 플랫폼(200)으로부터 각각 연결된 데이터 채널을 통해 마케팅 문서 데이터를 수집하고, 각 채널별 수집된 마케팅 문서 데이터를 분석 데이터 처리부(150)로 출력한다.
여기서, 마케팅 문서 데이터는, 본 발명의 실시 예에 따른 분석 데이터 처리부(150)에서 처리되는 기본 분석 정보를 형성할 수 있다. 마케팅 문서 데이터는 예를 들어, 플랫폼(200)으로부터 각 채널 별로 수집되는 웹 페이지 문서 데이터이거나, 사전 설정된 포맷에 대응하여 수집되는 키워드 데이터이거나, 또는 사이트 소스 코드 정보를 포함할 수도 있다.
이와 같은 채널별 수집을 위해, 채널 기반 정보 수집부(140)는, 각 플랫폼(200)에 대응하여 산업/주제/브랜드별로 분류된 키워드를 수집 및 저장하는 키워드 크롤러, 사용자 요청 수집 프로세스를 저장하고 채널별 수집 프로세스를 할당하는 수집 프로세스 매니저, 플랫폼(200)에 접속하여 채널별 수집을 수행하고 수집 결과를 저장부(190)에 저장하는 채널별 수집기와, 사이트 소스 변경에 의해 수집이 중단되는 문제를 대비하고 주기적으로 새로 갱신된 정보를 비교 리포팅하는 수집 사이트 소스 관리 매니저를 포함할 수 있다.
이에 따라, 채널 기반 정보 수집부(140)는 사용자 단말(300)로부터 요청되거나, 상기 사용자 단말(300)에 대응하여 사전 설정된 채널 정보에 따라, 특정 채널을 통한 플랫폼(200)에 접속할 수 있다. 또한, 채널 기반 정보 수집부(140)는 사용자 단말(300)로부터 수신되거나 상기 사용자 단말(300)에 대응하셔 사전 설정된 키워드 정보에 따라, 수집할 마케팅 문서 데이터를 상기 플랫폼(200)에 연결된 데이터 채널별 수집기를 통해 수집할 수 있다.
그리고, 채널 기반 정보 수집부(140)의 상기 채널별 수집기는 각 수집 완료된 마케팅 문서 데이터를 저장부(190)의 수집 결과 데이터베이스에 저장할 수 있다.
예를 들어, 채널 기반 정보 수집부(140)는 사용자 단말(300)로부터 요청된 분류 정보에 대응하는 산업/주제/브랜드별 플랫폼(200)들의 채널 정보를 식별하고, 상기 채널을 통해 사용자 단말(300)에 적합한 수집 사이트를 결정하며, 결정된 사이트로부터 사전 설정된 키워드 정보에 대응하는 마케팅 문서 데이터를 수집 및 저장할 수 있다. 특히, 상기 사전 설정된 키워드 정보는 분석 데이터 처리부(150)에서 처리되는 마케팅 온톨로지 기반의 지식그래프로부터 획득될 수 있으며, 이에 대하여는 보다 구체적으로 후술하도록 한다.
또한, 상기 채널 기반 정보 수집부(140)는 마케팅 문서 데이터가 수집된 플랫폼(200)의 사이트 정보를 등록하고, 주기적으로 모니터링할 수 있으며, 소스 코드 갱신 정보가 발생된 경우 사용자 단말(300)로 알람을 제공하며, 갱신된 데이터를 수집 저장할 수 있다.
그리고, 분석 데이터 처리부(150)는 채널 기반 정보 수집부(140)에서 수집된 마케팅 문서 데이터의 문서 분류 처리를 수행하고, 분류된 문서 데이터를 이용한 마케팅 특화 지식 그래프 모델을 생성 또는 구축할 수 있다.
본 발명의 실시 예에 따르면, 상기 마케팅 특화 지식 그래프 모델은, 미리 구축된 키워드 기반 지식그래프 정보와, 사전 수집된 온톨로지 정보와, 상기 수집 및 분류된 문서 데이터의 머신러닝 학습 정보와, 정형 데이터 정보를 이용하여 구축될 수 있다. 마케팅 특화 지식 그래프 모델은, 모듈형 온톨로지 모델 데이터일 수 있으며, 온톨로지 모델 데이터는 주요 개념, 관계 정보, 일상 키워드 및 감성 키워드 정보로부터 구축되는 코어 온톨로지와, 최신 키워드 반영을 위한 실시간 머신러닝 기반 문서분류된 데이터로부터 구축되는 도메인 온톨로지로 계층화되어 설계될 수 있으며, 시맨틱 웹 표준기술에 의해 상호운용성이 확보될 수 있다. 시맨틱 웹 표준 기술은 예를 들어, 온톨로지 기술 질의에 대응한 표준 프로토콜 언어로의 변환 처리 기술을 포함할 수 있으며, 변환되는 온톨로지 기술 질의 포맷은 RDF(Resource Description Framework) 포맷, OWL(Web Ontoyoly language) 포맷, 스파클(SPARQL, Protocol and RDF Query Language) 포맷 등이 예시될 수 있다.
이러한 처리를 위해, 분석 데이터 처리부(150)는 지식 그래프 구축을 처리하는 지식그래프 구축 모듈(151), 상기 도메인 온톨로지에 대응하는 신조어 사전(Dictionary) 구축 모듈(152), 정형 및 비정형 문서의 필터링 분류를 위한 문서 분류 모듈(153)을 각각 포함할 수 있다. 이에 따라, 분석 데이터 처리부(150)는 생성 또는 구축된 마케팅 특화 지식 그래프 모델을 이용하여 마케팅 온톨로지 기반의 다양한 서비스 정보를 제공할 수 있다. 특히, 지식그래프 구축 모듈(151)은 머신 러닝 기반의 마케팅 학습 정보를 획득할 수 있으며, 획득된 마케팅 학습 정보는 마케팅 특화 지식 그래프 모델 구축에 이용될 수 있다.
마케팅 분석 정보 서비스 제공을 위해, 대시보드 구성부(160)는 사용자 단말(300)로 제공될 마케팅 분석 대시보드 인터페이스를 구성할 수 있으며, 상기 대시보드는 웹 인터페이스 등의 GUI(GRAPHIC USER INTERFACE) 형태로 사용자 단말(300)을 통해 시각적 또는 청각적으로 출력될 수 있다.
또한, 대시보드 구성부(160)는 사용자 친화적 마케팅 정보 분석 서비스를 위하여, 인공지능 챗 봇 기반의 마케팅 인터페이스 대시보드를 구성할 수 있으며, 이러한 마케팅 인터페이스 대시보드를 통해, 사용자 단말(300)에서 요청되는 마케팅 시장 트랜드 분석, 수요 예측 분석, 키워드 영향력 분석, 신조어 키워드 사전, 제품 경쟁력 분석 등의 다양한 서비스를 제공할 수 있다.
그리고, 서비스 제공부(170)는 사용자 단말(300)의 서비스 요청을 수신하며, 서비스 요청에 대응하는 마케팅 정보 분석 서비스 결과를 대시보드 구성부(160)에서 구성된 대시보드 인터페이스를 통해, 사용자 단말(300)로 제공하는 서비스 매니저를 포함할 수 있다.
한편, 저장부(190)는 전술한 제어부(110)의 동작 및 상기한 구성요소들의 동작을 위한 프로그램 정보를 저장하기 위한 하나 이상의 저장매체를 포함하며, 각 목적에 따른 하나 이상의 데이터베이스를 포함할 수 있다.
도 3은 본 발명의 실시 예에 따른 마케팅 서비스 제공 장치의 동작을 설명하기 위한 흐름도이다.
도 3을 참조하면, 본 발명의 실시 예에 따른 마케팅 정보 분석 서비스 제공 장치(100)는, 먼저 사용자 단말(300)의 서비스 요청에 따라, 플랫폼 채널 기반의 마케팅 문서 데이터를 수집한다(S101).
그리고, 마케팅 정보 분석 서비스 제공 장치(100)는 마케팅 문서 데이터의 1차 필터링 및 머신 러닝 기반의 2차 필터링에 따른 하이브리드 문서 분류 처리를 수행한다(S105).
그리고, 마케팅 정보 분석 서비스 제공 장치(100)는 마케팅 문서 데이터로부터 비정형 데이터를 추출하고(S105), 비정형 데이터에 대응하는 머신 러닝 기반 마케팅 학습 정보를 획득한다(S107).
이후, 마케팅 정보 분석 서비스 제공 장치(100)는, 미리 구축된 지식그래프 정보 및 사전 수집된 온톨로지 정보와, 상기 마케팅 학습 정보 및 정형 데이터를 이용한 마케팅 특화 지식 그래프 모델을 생성한다(S109).
그리고, 마케팅 정보 분석 서비스 제공 장치(100)는 마케팅 특화 지식 그래프 모델 기반의 마케팅 시장 트렌드 및 수요 예측 분석을 수행한다(S111).
여기서, 마케팅 정보 분석 서비스 제공 장치(100)는 사용자 단말(300)의 요청에 따른 서비스에 대응하는 분석을 수행할 수 있으며, 상기 시장 트렌드, 수요 예측 분석 뿐만 아니라, 신조어 사전 구축, 키워드 영향력 분석 등이 더 수행될 수 있다.
그리고, 마케팅 정보 분석 서비스 제공 장치(100)는 대시 보드 인터페이스를 이용하여, 자연어 처리 기반의 마케팅 분석 정보를 상기 분석 결과에 따라 제공할 수 있다(S113).
도 4는 본 발명의 실시 예에 따른 지식 그래프 구축 모듈을 보다 구체적으로 설명하기 위한 블록도이다.
도 4를 참조하면, 본 발명의 실시 예에 따른 마케팅 특화 지식 그래프 모델 데이터 생성을 위하여는, 채널 기반 정보 수집부(140)에서 수집된 마케팅 문서 데이터로부터 분류되는 비정형 데이터와, 사전 수집된 정형 데이터와, 오픈 지식 그래프로부터 획득되는 대용량 지식 그래프 및 온톨로지 정보가 필요할 수 있다.
예를 들어, 마케팅 특화 지식 그래프 모델 구축을 위한 비정형 데이터는 채널 기반 정보 수집부(140)에서 수집된 마케팅 웹페이지 원문 텍스트일 수 있으며, 정형 데이터는 범용적인 파일 포맷이거나, openAPI를 통해 수집 가능한 정형 데이터를 포함할 수 있다. 또한, 오픈 지식그래프 데이터는 RDF 형식으로 공개되어 있는 국내외의 데이터일 수 있으며, RDF 파일 또는 SPARQL Endpoint를 대상으로 한 쿼리 응답을 수신하여 획득할 수 있다.
그리고, 수집 또는 분류된 정보로부터 마케팅 특화 지식그래프 모델 데이터를 구축하기 위하여, 지식그래프 구축 모듈(151)은 도 4에 도시된 바와 같이 2단계 파이프라인 모듈을 통해 단계적으로 처리함으로써, 효과적인 마케팅 특화 지식그래프 모델 구축 처리를 수행할 수 있다.
보다 구체적으로, 도 4를 참조하면, 지식그래프 구축 모듈(151)은, 제1 파이프라인 모듈로서, 비정형 데이터 처리부(1511), 정형 데이터 처리부(1512), 오픈 지식그래프 관리부(1515) 및 관계 데이터베이스(1517)을 포함하며, 제2 파이프라인 모듈로서 자연어 분석부(1513), 지식그래프 정보 변환부(1514), 대용량 지식 그래프 처리부(1516) 및 온톨로지 정보 처리부(1518)를 포함할 수 있다.
그리고, 제2 파이프라인으로부터 출력되는 데이터는 마케팅 특화 지식그래프 구축부(1519)로 전달되어, 마케팅 특화 지식그래프 모델 데이터 생성 또는 키워드 분석 정보 생성에 이용될 수 있다.
먼저, 비정형 데이터 처리부(1511)는 제1 파이프라인 단계에서 수집된 마케팅 문서 데이터로부터 비정형 데이터를 식별하여, 자연어 분석부(1513)로 전달할 수 있다. 비정형 데이터는 예를 들어 마케팅 문서 데이터로부터 식별되는 텍스트 데이터를 포함할 수 있다.
그리고, 자연어 분석부(153)는 비정형 데이터로부터 자연어 처리 기술을 이용한 주요 키워드를 추출할 수 있다. 자연어 처리 기술은 형태소 분석, 개체명 인식 등의 기술이 예시될 수 있으며, 자연어 분석부(1513)는 보다 정확한 키워드 추출 처리를 위해나 문서 분류 모듈(153)의 분류 정보를 이용할 수 있다.
그리고, 추출된 키워드는 지식그래프 정보 변환부(1514)로 전달될 수 있다. 지식그래프 정보 변환부(1514)는, 규칙 기반(Rule-based) 마케팅 키워드 매핑 또는 머신 러닝 알고리즘 기반 매핑 등의 매핑 기술에 의해, 사전 설정된 포맷의 지식 그래프 정보에 매핑 통합되도록 하는 마케팅 지식그래프 정보로서 포맷 변환 처리될 수 있다.
그리고, 오픈 지식그래프 관리부(1515)는 openAPI 등을 이용하여 사전 구축된 오픈 지식그래프 정보를 수집 및 저장할 수 있다.
그리고, 대용량 지식 그래프 처리부(1516)는, 수집된 오픈 지식 그래프 정보가 전술한 자연어 분석 정보로부터 포맷 변환 처리된 마케팅 지식그래프 정보에 매핑될 수 있도록 준비된 대용량 지식 그래프 정보를 사전 구축하고, 구축된 대용량 지식 그래프 정보를 마케팅 특화 지식그래프 모델 구축부(1519)로 전달할 수 있다.
한편, 관계 데이터베이스(1517)는 지식 그래프 정보 변환부(1514)에서 변환된 지식 그래프 정보와 대용량 지식 그래프 처리부(1516)에서 처리된 지식 그래프 정보의 의미 매핑을 위한 온톨로지 정보를 수집 및 저장할 수 있으며, 저장된 온톨로지 정보 중 상호 호환이 가능한 온톨로지 정보를 마케팅 특화 지식그래프 구축부(1519)로 전달할 수 있다.
예를 들어, 마케팅 특화 지식그래프 모델 구축부(1519)는, RDF 파일 또는 SPARQL Endpoint로부터 수집된 오픈 지식그래프 정보를 대용량 지식그래프 처리를 위한 지식그래프 모델 정보로서 수집하고, 상기 변환된 마케팅 지식그래프 정보와 상기 대용량 지식그래프 정보간 매핑 테이블을 구축하여 마케팅 특화 지식그래프 모델을 구축할 수 있다.
이를 위해, 마케팅 특화 지식그래프 모델 구축부(1519)는, 데이터 항목마다 부여되어 있는 고유 식별자를 기준으로 매핑 처리하되, 식별자가 일치하지 않는 동일 데이터의 경우에는 사전 수집된 온톨로지 정보 기반 관계 정보와 속성 정보를 통해 일치 확률을 계산한 후, 높은 확률을 우선적으로 매핑하는 데이터 매핑 처리를 수행할 수 있다.
도 5는 본 발명의 실시 예에 따른 지식 그래프 구축 모듈의 동작을 설명하기 위한 흐름도이며, 도 6은 본 발명의 실시 예에 따른 지식그래프 구축 및 의미 매핑 과정을 설명하기 위한 관계도이다.
도 5 및 도 6은 마케팅 특화 지식 그래프 모델 데이터의 생성 프로세스를 보다 구체적으로 설명하기 위한 것으로, 지식 그래프 구축 모듈(151)은, 먼저 도 6에 도시된 바와 같이, OpenAPI 또는 정형 파일 데이터로부터 지식그래프 변환 규칙 정보를 획득할 수 있다(S201).
예를 들어, 변환 규칙 정보는 W3C 국제 표준인 R2RML(RDB to RDF Mapping Language)로 기술된 변환규칙 파일로부터 획득될 수 있다. 또한 변환 규칙 정보는 OpenAPI 또는 정형 파일 데이터로부터 RML(RDF Mapping Language)로 기술된 변환규칙을 사용하여 지식그래프 변환 규칙 데이터로 변환될 수도 있다.
이후, 지식 그래프 구축 모듈(151)은, 관계형 데이터베이스로부터 온톨로지 변환 규칙 정보를 획득하며(S203), 비정형 데이터의 자연어 분석 정보를 지식그래프 변환 규칙 정보에 따라 변환 처리한다(S205).
이후, 지식 그래프 구축 모듈(151)은 온톨로지 변환 규칙 정보에 따라, 상기 변환된 지식그래프 정보를 기 구축된 대용량 지식그래프에 매핑하여, 마케팅 특화 지식그래프 모델을 구축한다(S207).
도 6에 도시된 바와 같이, 지식 그래프 구축 모듈(151)은 마케팅 특화 지식그래프 모델 데이터를 생성하기 위한 마케팅 특화 지식그래프 모델 구축부(1519)을 포함할 수 있다. 마케팅 특화 지식그래프 모델 구축부(1519)는 의미 매핑 처리부를 포함하여, 전술한 매핑 처리를 보다 정확성이 높으면서도 효율적으로 수행할 수 있다. 여기서 의미 매핑 처리부는 퍼지(Fuzzy) 알고리즘 처리부 및 URI 식별자 처리부를 더 포함할 수 있다.
보다 구체적으로, 의미 매핑 처리부는, 지식그래프 포맷(예를 들어, RDF)으로 변환된 데이터의 항목과, 기 구축된 대용량 지식그래프 항목 간의 의미적 매핑을 처리할 수 있다.
이를 위해, 의미 매핑 처리부는 모든 데이터 항목에 할당되어 있는 URI 식별자를 비교하여 1차 매핑을 처리하는 URI 식별자 처리부를 포함할 수 있다.
그리고, 의미 매핑 처리부는 1차 매핑 처리된 데이터로부터 한국어의 언어적 특성에 맞춰 개발된 레펜슈타인 퍼지 알고리즘(Levenshtein fuzzy metric algorithm)를 기반으로 구현된 단어 간 의미적 매핑 도구를 적용하여, 자동화된 의미 매핑을 처리할 수 있다. 상기 자동 매핑이 완료된 데이터는 샘플링 처리될 수 있으며, 처리된 샘플링 데이터는 이후 매핑 검수 및 교정 처리에 이용될 수 있다.
한편, 지식 그래프 구축 모듈(151)은, 의미 매핑이 완료된 지식그래프 모델 데이터를 마케팅 특화 지식 그래프 모델 데이터로서 획득할 수 있다. 예를 들어, 지식 그래프 구축 모듈은(151)은 기 구축된 대용량 지식 그래프 데이터가 저장된 트리플스토어(Triplestore) 방식의 데이터베이스에 상기 매핑 처리된 지식그래프 데이터를 임포트시켜 지식그래프 모델을 통합적으로 생성할 수 있다.
이에 따라, 최종적인 지식그래프 모델은 RDF(Resource Description Framework) 데이터 모델로 기술되는 것이 바람직하며, 이는 호환성 및 분석 효율을 높일 수 있게 한다.
또한, 기 구축된 대용량 지식그래프의 항목별 분류 체계는 마케팅 분야 도메인 전문가에 의해 생성된 마케팅 특화 체계일 수 있으며, 이를 위해 오픈 지식 그래프 관리부(1515)는 국제적인 웹자원 식별체계인 schema.org와 국내 주요 포털 서비스의 브랜드 및 제품 분류체계 정보를 각각 수집하여 조합함으로써, 보다 효율적인 대용량 지식 그래프를 구축 처리할 수 있다. 이를 위해, 오픈 지식 그래프 관리부(1515)는 각 분류체계 키워드에 대응하는 대중 관심도(주요 포털서비스의 기간별 검색량 수치로 산출될 수 있음)를 기반으로 분야별 분류체계의 관리를 수행하고, 분야별 분류체계의 유지 또는 아카이브를 결정할 수 있다.
이와 같은 지식그래프 모델 구축에 따라, 본 발명의 실시 예에 따른 마케팅 정보 분석 서비스 제공 장치(100)는, 일반적인 지식그래프의 단점으로 지적되는 최신성 있는 키워드의 미 반영 문제와, 한국어 기반 지식그래프 및 분석용 사전(Dictionary) 데이터의 구축의 어려움을 해결하고, 마케팅 특화 지식그래프 모델 구축을 통한 마케팅 트렌드 및 키워드 분석을 용이하게 하며, 특히 신조어 반영 및 한글 키워드 분석을 용이하게 하여 보다 저비용으로도 정확한 마케팅 정보 분석 서비스를 제공할 수 있는 장점이 있다.
도 7은 본 발명의 실시 예에 따른 신조어 사전 구축 모듈을 보다 구체적으로 설명하기 위한 블록도이다.
분석 데이터 처리부(150)는, 마케팅 정보 서비스 제공을 위한 지식그래프를 이용하여, 마케팅 분석에 이용될 수 있는 신조어 사전 정보를 구축할 수 있으며, 구축된 신조어 사전 정보는 최신성을 가지며 실시간으로 업데이트 될 수 있다.
분석 데이터 처리부(150)는 신조어 사전 구축 모듈(152)을 포함할 수 있다. 신조어 사전 구축 모듈(152)은, 마케팅 특화 지식그래프 모델 데이터로부터 신조어 사전 정보를 학습 처리하여 출력할 수 있다.
특히, 본 발명의 실시 예에 따른 신조어 사전 구축 모듈(152)은, 특히 왜래어와 같은 언어가 상이한 국가별 음역간 머신 러닝 기반의 학습 프로세스를 통해, 서로 상이한 음역 간 키워드 분석을 통한 외국어 신조어와 같은 마케팅에 유용한 키워드 데이터들을 출력할 수 있다.
예를 들어, 한글 텍스트에 관한 자연어 처리 중 개체명 인식(Named Entity Recognition)의 정확도 향상을 위해서는 품질이 보장된 다량의 키워드 사전이 필요하나, 웹 상에 공개되어 조건없이 활용 가능한 다량의 지식그래프에는 자연어 처리와 개체명 인식에 활용할 수 있는 키워드는 대부분 영어로만 기술되어 있어 활용에 제약이 있는 실정이다.
그러나, 본 발명의 실시 예에 따른 신조어 사전 구축 모듈(152)은, 다양한 외국 키워드기반 지식그래프로부터 인물명, 브랜드명 및 제품명 등의 키워드들을 음역(transliteration) 전환을 통한 한글명 표기의 지식그래프로 변환 구축할 수 있다. 이렇게 음역 전환된 지식 그래프는, 분석 데이터 처리부(150)에서 처리되는 마케팅 문서 데이터의 자연어 처리를 위한 정형 데이터로서의 신조어 한글 사전으로서도 이용될 수 있다.
이와 같은 처리를 위해, 본 발명의 실시 예에 따른 신조어 사전 구축 모듈(152)는, 데이터 전처리부(1521), 학습 모델링부(1522) 및 예측 모델링부(1523)을 포함한다.
전처리부(1521)는, 머신 러닝을 위한 언어별 표기 데이터의 수집 및 가공 처리를 수행한다. 예를 들어, 전처리부(1521)는 위키데이터와 같은 공개된 지식그래프 데이터로부터 언어간 음역 데이터를 수집하여 저장 및 관리하며, 언어간 음역 데이터는 학습 모델링부(1522) 및 예측 모델링부(1523)의 학습 데이터 세트로 활용될 수 있다.
예를 들어, 전처리부(1521)는 SPARQL Endpoint에 대응하는 SPARQL 쿼리를 전송하여, SPARQL 지식그래프 저장소(Triplestore)에서 필요한 언어간 음역 데이터들을 추출하여 학습 모델링부(1522)의 학습에 이용되도록 전달할 수 있다. 쿼리 정보는 예를 들어 '인물', '제품', '브랜드' 등의 한글 음역의 대상이 되는 개체의 영문 음역 정보를 포함할 수 있다.
그리고, 전처리부(1521)는 수집된 음역 데이터의 전처리를 통해 학습을 위한 정제 데이터로 필터링할 수 있다.
그리고, 학습 모델링부(1522)는, 전처리된 정제 데이터를 이용하여 인공신경망 메커니즘을 포함하는 머신 러닝 모듈(400)을 구동시켜, 음역 전환 학습 데이터의 모델링을 처리할 수 있다.
여기서, 학습 데이터 모델링 프로세스는, 문자열 벡터화에 따른 음역 사전 형성 프로세스, 음역 사전에 대응하는 학습용 3차원 배열 형성 프로세스, 단어 집합의 크기를 벡터의 차원으로 지정하고 필요한 단어의 인덱스에는 1을 부여하며 다른 인덱스에는 0을 부여하여 원 핫(one-hot)벡터를 구성하는 원 핫 인코딩 프로세스, 상기 원 핫 인코딩된 벡터를 학습데이터로 구성하고, 벡터를 문자화한 사전을 형성하는 벡터 문자화 프로세스를 포함할 수 있다.
이에 따라, 예측 모델링부(1523)는, 학습 데이터을 이용한 예측 모델을 구축하는 머신러닝 분석 및 예측 처리를 수행할 수 있다.
이를 위해, 예측 모델링부(1523)는, 순환 신경망(RNN) 분석, LSTM(Long Short Term Memory) 또는 GRU(GATED RECURRENT UNIT) 알고리즘을 조합 적용하여, 학습 데이터를 인코딩할 수 있다. 그리고, 예측 모델링부(1523)는 주요 어휘에 대응하는 가중치(WEIGHT)를 부여하고, 가장 높은 매칭 확률을 나타내는 상황을 학습하는 어텐션(ATTENTION) 메커니즘 처리를 머신 러닝 모듈(400)로 요청할 수 있다.
그리고, 예측 모델링부(1523)는, 예측 처리를 통해 획득되는 손실함수 예측 모델인 크로스엔트로피(cross entropy) 모델을 구축하여, 이후 음역 전환 처리에 이용되도록 설정할 수 있다. 이에 따라, 신조어 사전 구축 모듈(152)은, 예측 모델링부(1523)에서 생성된 예측 모델을 이용하여 음역 전환된 신조어 사전 정보를 생성할 수 있으며, 신조어 사전 정보는 지식그래프 구축시의 자연어 처리에 이용되거나, 지식그래프 기반의 마케팅 키워드 사전 구축에 이용될 수 있다.
이와 같은 본 발명의 실시 예에 따르면, 특히 영문으로 기 구축된 풍부하고 다양한 지식그래프 및 사전 키워드 정보들로부터, 머신 러닝을 기반으로 한글 음역으로 전환된 지식그래프 및 신조어 사전을 구축할 수 있는 바, 수작업으로 인한 불편함과 비용을 절감시킬 수 있게 된다.
도 8은 본 발명의 실시 예에 따른 국가별 음역 전환 기반 신조어 정보 처리 프로세스를 설명하기 위한 흐름도이며, 도 9 내지 도 12는 국가별 음역 전환 기반 신조어 정보 처리 프로세스에 따른 데이터 처리 예시도이다.
도 8을 참조하면, 본 발명의 실시 예에 따른 신조어 사전 구축 모듈(152)은, 전처리 학습을 위한 음역 데이터를 수집한다(S301).
여기서 음역 데이터는, 예를 들어 외국 사이트에서 수집된 지식 그래프의 외국어 음역 데이터를 포함할 수 있다.
그리고, 신조어 사전 구축 모듈(152)은, 전처리부(1521)를 통해 정규 함수 기반의 1차 전처리를 수행하며(S303), 공백 및 중복 단어를 제고하는 2차 전처리를 수행하고(S305), 의미 단어 분리 기반의 3차 전처리를 수행하며(S307), 역순 단어에 대응하는 4차 전처리를 수행한다(S309).
보다 구체적으로, 본 발명의 실시 예에 따른 전처리부(1521)는 수집된 외국어 음역 데이터의 국문 표기법 예측 모델링의 정확도 향상을 위한 상기한 바와 같은 4차 데이터 전처리를 수행할 수 있다.
먼저, 상기 1차 전처리는, 특수기호, 한문, 중국어, 러시아어, 체코어 등의 문자들 중 인코딩시 오류를 발생하는 글자들을 정규식 등을 이용해 제거하는 처리를 포함한다.
그리고, 상기 2차 전처리는, 한영 이름 중복, 공백을 제거하는 전처리를 포함하며, 이는 머신 러닝 모듈(400) 구동시 사용되는 원 핫(Onehot) 인코딩시 데이터 변환 속도 및 정확도를 향상시킬 수 있다.
그리고, 3차 전처리는, 의미 기반의 단어 매칭 처리를 포함한다. 예를 들어, 3차 전처리는 Duchess, Duke, King, Princess, Prince, Emperor 등의 연관 의미를 가진 영문 단어들을 사전 설정된 휴리스틱 규칙(Heuristic rule) 기반으로 각각 1:1 매칭 처리하는 프로세스를 포함할 수 있다.
그리고, 4차 전처리는, 일어 등의 역순을 가진 언어를 처리하기 위한 역순 처리로서, 예를 들어 Kubo, Tsuda, Hira 등의 역순 언어에 대한 필터링 처리를 통해 전반적인 정확도 향상을 얻을 수 있다.
한편, 전처리가 완료되면 신조어 사전 구축 모듈(152)의 학습 모델링부(1522)는, 전처리된 데이터로부터 머신 러닝을 위한 학습데이터로의 모델링을 처리한다(S311).
그리고, 신조어 사전 구축 모듈(152)의 예측 모델링부(1523)는, 학습 데이터를 이용한 머신 러닝 예측 모델링 처리를 통해 신조어 음역 변환 모델을 생성한다(S313).
이와 같은 예측 모델링을 위해, 먼저 예측 모델링부(1523)는 LSTM 또는 GRU 부호화 및 복호화를 처리하여 데이터의 전후 및 연속성을 학습 모델에 적용할 수 있다. 그리고, 예측 모델링부(1523)는, 어텐션 알고리즘을 통해 빈도가 많은 단어들에 대응하는 가중치를 부여함으로써, 음역 전환의 정확도를 극대화시킬 수 있다.
특히, 본 발명의 실시 예에 따른 예측 모델링부(1523)는, 학습 데이터의 공간 스플릿(Spacing split)과 결합(join) 프로세스를 통해, 영어단어의 길이에 따라 번역정확도 차이가 큰 문제점을 해결할 수 있다.
예를 들어, 도 9를 참조하면 종래의 음역 전환은 사람이 직접 작업하므로, 글자와 스페이스간 연관성이 없으며 일관성있는 규칙 확인이 어려운 문제점이 있다.
그러나, 도 10에 도시된 바와 같이 본 발명의 실시 예에 따른 예측 모델링부(1523)는, 음역 데이터를 공간 스플릿에 따라 도 10(A)와 같이 각각 분리 모델링 처리할 수 있으며, 처리된 분리 모델링 정보를 다시 결합(Join)시킴으로써, 도 10(B)와 같은 비교적 정확한 음역을 획득할 수 있다. 또한, 이러한 공간 스플릿에 따른 정확도 판별 학습에 의해, 어텐션 알고리즘의 장점은 극대화될 수 있다.
도 11은 이러한 정확도 판별 학습 프로세스를 도시한 것으로, 예측 모델링부(1523)는, 어텐션 알고리즘 처리를 위한 글자수 별 정확도 검증 처리를 수행할 수 있으며, 각 글자 구간별로 처리된 결과 및 평균 정확도에 따른 가중치 부여가 처리되어, 예측 모델의 생성에 이용될 수 있다.
그리고, 도 12는 본 발명의 실시 예에 따른 테스트 모델의 예측 결과를 도시한 것으로, 도 12에 도시된 바와 같이 예측 모델이 생성되면, 영문 또는 다른 언어의 지식그래프 또는 사전 정보가 구축되어 있을 때, 국문으로의 전환을 용이하게 하며, 이는 지식그래프의 생성 및 활용에 있어서 매우 유용한 정보로서 이용될 수 있는 장점이 있다.
특히, 이와 같은 본 발명의 실시 예는 다량의 한글 음역이 필요한 지식그래프 데이터 세트나 어플리케이션에도 적용될 수 있으며, 영어 발음법이 다르거나 언어별 문맥이 상이한 경우에도 번역기과 같은 형태로도 확장 구동시킬 수 있는 장점이 있다.
한편, 상술한 본 발명의 다양한 실시 예들에 따른 방법은 프로그램으로 구현되어 다양한 비일시적 판독 가능 매체(non-transitory computer readable medium)에 저장된 상태로 각 서버 또는 기기들에 제공될 수 있다. 이에 따라, 사용자 단말(100)은 서버 또는 기기에 접속하여, 상기 프로그램을 다운로드할 수 있다.
비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 어플리케이션 또는 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.

Claims (14)

  1. 서비스 제공 장치에 있어서,
    마케팅 특화 지식 그래프 모델 학습을 위한 외국어 음역 학습 데이터를 수집하여 전처리하는 전처리부;
    상기 외국어 음역 학습 데이터로부터 벡터 기반 학습 데이터를 모델링하는 학습 모델링부; 및
    상기 학습 데이터로부터 음역 전환을 위한 예측 모델을 생성하며, 상기 예측 모델에 외국어 음역 데이터를 적용하여 국문 음역 데이터로 전환 출력하는 예측 모델링부를 포함하는
    서비스 제공 장치.
  2. 제1항에 있어서,
    상기 예측 모델링부는,
    순환 신경망(RNN) 분석, LSTM(Long Short Term Memory) 또는 GRU(GATED RECURRENT UNIT) 알고리즘을 조합 적용하여, 상기 벡터 기반 학습 데이터를 인코딩하는
    서비스 제공 장치.
  3. 제1항에 있어서,
    상기 예측 모델링부는,
    음역 전환 결과 주요 어휘에 대응하는 가중치(WEIGHT)를 부여하고, 가장 높은 매칭 확률을 나타내는 상황을 학습하는 어텐션(ATTENTION) 메커니즘 처리를 수행하는
    서비스 제공 장치.
  4. 제1항에 있어서,
    상기 생성된 예측 모델을 이용하여, 외국어 지식그래프 사전 정보로부터 국문 음역 전환된 신조어 사전 정보를 생성하는 신조어 사전 구축 모듈을 더 포함하는
    서비스 제공 장치.
  5. 제4항에 있어서,
    상기 신조어 사전 정보는 상기 마케팅 특화 지식그래프 구축시의 자연어 처리에 이용되는
    서비스 제공 장치.
  6. 제1항에 있어서,
    상기 학습 모델링부는,
    원 핫(one hot) 인코딩 방식을 이용하여, 상기 벡터 기반 학습 데이터를 생성하는
    서비스 제공 장치.
  7. 제1항에 있어서,
    상기 예측 모델링부는,
    상기 외국어 음역 학습 데이터를 공간 스플릿에 따라 분리 모델링 처리하고, 처리된 분리 모델링 정보의 학습 결과를 다시 결합(Join)시켜 정확도를 판별하는
    서비스 제공 장치.
  8. 서비스 제공 방법에 있어서,
    마케팅 특화 지식 그래프 모델 학습을 위한 외국어 음역 학습 데이터를 수집하여 전처리하는 단계;
    상기 외국어 음역 학습 데이터로부터 벡터 기반 학습 데이터를 모델링하는 단계; 및
    상기 학습 데이터로부터 음역 전환을 위한 예측 모델을 생성하며, 상기 예측 모델에 외국어 음역 데이터를 적용하여 국문 음역 데이터로 전환 출력하는 단계를 포함하는
    서비스 제공 방법.
  9. 제8항에 있어서,
    상기 전환 출력하는 단계는,
    순환 신경망(RNN) 분석, LSTM(Long Short Term Memory) 또는 GRU(GATED RECURRENT UNIT) 알고리즘을 조합 적용하여, 상기 벡터 기반 학습 데이터를 인코딩하는 단계를 포함하는
    서비스 제공 방법.
  10. 제8항에 있어서,
    상기 전환 출력하는 단계는,
    음역 전환 결과 주요 어휘에 대응하는 가중치(WEIGHT)를 부여하고, 가장 높은 매칭 확률을 나타내는 상황을 학습하는 어텐션(ATTENTION) 메커니즘 처리를 수행하는 단계를 포함하는
    서비스 제공 방법.
  11. 제8항에 있어서,
    상기 생성된 예측 모델을 이용하여, 외국어 지식그래프 사전 정보로부터 국문 음역 전환된 신조어 사전 정보를 생성하는 단계를 더 포함하는
    서비스 제공 방법.
  12. 제11항에 있어서,
    상기 신조어 사전 정보는 상기 마케팅 특화 지식그래프 구축시의 자연어 처리에 이용되는
    서비스 제공 방법.
  13. 제8항에 있어서,
    상기 모델링하는 단계는,
    원 핫(one hot) 인코딩 방식을 이용하여, 상기 벡터 기반 학습 데이터를 생성하는 단계를 포함하는
    서비스 제공 방법.
  14. 제8항에 있어서,
    상기 전환 출력하는 단계는,
    상기 외국어 음역 학습 데이터를 공간 스플릿에 따라 분리 모델링 처리하고, 처리된 분리 모델링 정보의 학습 결과를 다시 결합(Join)시켜 정확도를 판별하는 단계를 포함하는
    서비스 제공 방법.
PCT/KR2020/015579 2019-11-25 2020-11-09 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치 WO2021107445A1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2019-0152511 2019-11-25
KR10-2019-0152512 2019-11-25
KR1020190152512A KR20210063877A (ko) 2019-11-25 2019-11-25 신조어 정보 서비스 제공을 위한 프로그램 및 기록매체
KR1020190152511A KR20210063876A (ko) 2019-11-25 2019-11-25 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치

Publications (1)

Publication Number Publication Date
WO2021107445A1 true WO2021107445A1 (ko) 2021-06-03

Family

ID=76130357

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/015579 WO2021107445A1 (ko) 2019-11-25 2020-11-09 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치

Country Status (1)

Country Link
WO (1) WO2021107445A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641833A (zh) * 2021-08-17 2021-11-12 同济大学 服务需求匹配方法及装置
CN116630543A (zh) * 2023-05-25 2023-08-22 上海粟芯新能源科技有限公司 基于bs架构的三维实景一站式处理平台

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000003355A (ja) * 1998-06-16 2000-01-07 Toshiba Corp 中国語入力変換処理装置、同装置に用いられる新語登録方法及び記録媒体
US20090012775A1 (en) * 2007-05-21 2009-01-08 Sherikat Link Letatweer Elbarmagueyat S.A.E. Method for transliterating and suggesting arabic replacement for a given user input
US20110218796A1 (en) * 2010-03-05 2011-09-08 Microsoft Corporation Transliteration using indicator and hybrid generative features
JP5646792B2 (ja) * 2012-12-06 2014-12-24 楽天株式会社 単語分割装置、単語分割方法、及び単語分割プログラム
JP2018028848A (ja) * 2016-08-19 2018-02-22 日本放送協会 変換処理装置、音訳処理装置、およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000003355A (ja) * 1998-06-16 2000-01-07 Toshiba Corp 中国語入力変換処理装置、同装置に用いられる新語登録方法及び記録媒体
US20090012775A1 (en) * 2007-05-21 2009-01-08 Sherikat Link Letatweer Elbarmagueyat S.A.E. Method for transliterating and suggesting arabic replacement for a given user input
US20110218796A1 (en) * 2010-03-05 2011-09-08 Microsoft Corporation Transliteration using indicator and hybrid generative features
JP5646792B2 (ja) * 2012-12-06 2014-12-24 楽天株式会社 単語分割装置、単語分割方法、及び単語分割プログラム
JP2018028848A (ja) * 2016-08-19 2018-02-22 日本放送協会 変換処理装置、音訳処理装置、およびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641833A (zh) * 2021-08-17 2021-11-12 同济大学 服务需求匹配方法及装置
CN113641833B (zh) * 2021-08-17 2024-04-09 同济大学 服务需求匹配方法及装置
CN116630543A (zh) * 2023-05-25 2023-08-22 上海粟芯新能源科技有限公司 基于bs架构的三维实景一站式处理平台
CN116630543B (zh) * 2023-05-25 2024-03-08 上海粟芯新能源科技有限公司 基于bs架构的三维实景一站式处理平台

Similar Documents

Publication Publication Date Title
WO2021107449A1 (ko) 음역 전환 신조어를 이용한 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치
CN110110054B (zh) 一种基于深度学习的从非结构化文本中获取问答对的方法
JP4654776B2 (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
WO2020034526A1 (zh) 保险录音的质检方法、装置、设备和计算机存储介质
WO2021107445A1 (ko) 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치
CN112182229A (zh) 一种文本分类模型构建方法、文本分类方法及装置
Sahbi CNRS-TELECOM ParisTech at ImageCLEF 2013 Scalable Concept Image Annotation Task: Winning Annotations with Context Dependent SVMs.
WO2021100902A1 (ko) 문장 패러프레이즈 인식 기반 대화 시스템 답변 방법
WO2023108991A1 (zh) 模型的训练方法、知识分类方法、装置、设备、介质
WO2019093599A1 (ko) 사용자 관심 정보 생성 장치 및 그 방법
WO2021010744A1 (ko) 음성 인식 기반의 세일즈 대화 분석 방법 및 장치
WO2020085663A1 (ko) 인공지능 기반의 자동 로고생성 시스템 및 이를 이용한 로고생성 서비스 방법
WO2021107447A1 (ko) 마케팅 지식 그래프를 위한 문서 분류 처리 방법 및 그 장치
WO2021107448A1 (ko) 효율적 문서 분류 처리를 지원하는 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치
WO2021107444A1 (ko) 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치
WO2023078136A1 (zh) 数据集的构建方法、装置、设备、存储介质及计算机程序产品
WO2012046906A1 (ko) 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법
WO2020159140A1 (ko) 전자 장치 및 이의 제어 방법
WO2018212584A2 (ko) 딥 뉴럴 네트워크를 이용하여 문장이 속하는 클래스를 분류하는 방법 및 장치
KR20210063882A (ko) 효율적 문서 분류 처리를 지원하는 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치
KR20220074576A (ko) 마케팅 지식 그래프 구축을 위한 딥러닝 기반 신조어 추출 방법 및 그 장치
WO2021107446A1 (ko) 지식 그래프 기반 마케팅 정보 분석 챗봇 서비스 제공 방법 및 그 장치
WO2023195769A1 (ko) 신경망 모델을 활용한 유사 특허 문헌 추출 방법 및 이를 제공하는 장치
WO2014148784A1 (en) Linguistic model database for linguistic recognition, linguistic recognition device and linguistic recognition method, and linguistic recognition system
KR20210063876A (ko) 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20894266

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20894266

Country of ref document: EP

Kind code of ref document: A1