WO2024111681A1 - 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 방법 - Google Patents

금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 방법 Download PDF

Info

Publication number
WO2024111681A1
WO2024111681A1 PCT/KR2022/018399 KR2022018399W WO2024111681A1 WO 2024111681 A1 WO2024111681 A1 WO 2024111681A1 KR 2022018399 W KR2022018399 W KR 2022018399W WO 2024111681 A1 WO2024111681 A1 WO 2024111681A1
Authority
WO
WIPO (PCT)
Prior art keywords
financial
data
dependent variable
financial product
prediction function
Prior art date
Application number
PCT/KR2022/018399
Other languages
English (en)
French (fr)
Inventor
손상현
이유석
Original Assignee
주식회사 이노핀
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 이노핀 filed Critical 주식회사 이노핀
Priority to PCT/KR2022/018399 priority Critical patent/WO2024111681A1/ko
Publication of WO2024111681A1 publication Critical patent/WO2024111681A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Definitions

  • This disclosure relates to a financial product recommendation system and method through artificial intelligence learning on financial counseling data.
  • the purpose of this disclosure to solve these problems is to provide a financial product recommendation system and method through artificial intelligence learning on financial counseling data.
  • a financial product recommendation system through artificial intelligence learning on financial counseling data.
  • the system includes a data collection unit configured to obtain text data from collected financial counseling data; a data processing unit configured to construct a binary data set by counting words that are the target of an independent variable for each sentence of the text data with respect to a set dependent variable; a data learning unit configured to determine a prediction function for the dependent variable by performing regression analysis based on the binary data set; and a financial product recommendation unit configured to determine whether to provide financial product information linked to the dependent variable to the specific user based on a predicted value determined by the prediction function with respect to the financial counseling data of the specific user.
  • the noun word that is the target of the independent variable may be a representative noun word for a set similar noun group
  • the verb word that is the target of the independent variable may be a representative verb word for the set similar verb and derivative group.
  • the data processing unit counts the noun words included in the text data as representative noun words of the pseudo-noun group to which the corresponding noun word belongs, and counts the verb words included in the text data as the pseudo-verb and derivative group to which the corresponding verb word belongs. It can be configured to count as a representative verb word.
  • the data processing unit calculates the importance of each word included in the text data using TF-IDF (Term Frequency-Inverse Document Frequency), and if the calculated importance of the word is less than the set standard value, the word is deleted. It can be configured to exclude words that are the target of the independent variable.
  • TF-IDF Term Frequency-Inverse Document Frequency
  • the data learning unit determines the weight of each independent variable by performing a logistic regression analysis on the binary data set, and calculates the dependent variable as a linear function defined by each independent variable and the determined weight of the independent variable. It can be configured to determine a prediction function for a variable.
  • the data processing unit may be configured to build a new binary data set using newly collected financial counseling data at a predetermined cycle.
  • the data learning unit performs a stepwise logistic regression analysis on the entire binary data set to which the new binary data set is added at a predetermined period, thereby performing an update on the dependent variable in which the weight of the independent variable or the combination of the independent variable is updated. It can be configured to determine the predicted prediction function.
  • the financial product recommendation system defines a plurality of dependent variables, and each dependent variable may correspond to a specific financial event.
  • the data processing unit may be configured to construct the binary data set for each dependent variable, and the data learning unit may be configured to determine the prediction function for each dependent variable.
  • the financial product recommendation unit determines which dependent variable has the highest predicted value determined by the prediction function with respect to the financial counseling data of the specific user, and provides financial product information linked to the financial event corresponding to the dependent variable with the highest predicted value. It may be configured to determine which to provide to the specific user.
  • a method of recommending financial products through artificial intelligence learning on financial counseling data performed by a computing device includes obtaining text data from collected financial counseling data; Constructing a binary data set by counting words that are the target of an independent variable for each sentence of the text data with respect to a set dependent variable; determining a prediction function for the dependent variable by performing regression analysis based on the binary data set; And it may include a step of determining whether to provide financial product information linked to the dependent variable to the specific user based on a predicted value determined by the prediction function with respect to the financial counseling data of the specific user.
  • a computer program stored on a computer-readable medium may be presented, including computer-executable instructions for executing a method of recommending financial products through artificial intelligence learning on financial advice data.
  • FIG. 1 is a schematic diagram showing a financial product recommendation system and overall operating environment through artificial intelligence learning on financial counseling data according to an embodiment of the present disclosure.
  • FIG. 2 is a schematic diagram illustrating example components of a computing device according to an embodiment of the present disclosure.
  • FIG. 3 is a schematic diagram illustrating example functional modules of a processor according to one embodiment of the present disclosure.
  • FIG. 4 is an exemplary diagram illustrating a binary data set and prediction function for logical stick regression analysis according to an embodiment of the present disclosure.
  • Figure 5 is a schematic flowchart showing a method of recommending financial products through artificial intelligence learning on financial counseling data according to an embodiment of the present disclosure.
  • FIG. 1 is a schematic diagram showing a financial product recommendation system and overall operating environment through artificial intelligence learning on financial counseling data according to an embodiment of the present disclosure.
  • the financial product recommendation system 300 may operate in conjunction with the communication network 200 and the user terminal 100.
  • the user terminal 100 can access the financial product recommendation system 300 through the communication network 200 and receive non-face-to-face financial counseling.
  • the financial product system 300 can provide a call center, counseling site, counseling application (app), etc., and can provide financial counseling according to the response of a connected professional counselor or according to a financial counseling algorithm such as a chatbot.
  • a financial consultation algorithm when consultation is performed according to a financial consultation algorithm, when the user calls the call center of the financial product recommendation system 300 using the landline phone 110 or the mobile communication terminal 120, the financial product recommendation system ( 300) can respond to a customer's voice inquiry and provide the chatbot's response text to the user as a voice through text-to-speech conversion such as TTS (Text to Speech).
  • TTS Text to Speech
  • the user accesses the consultation site of the financial product recommendation system 300 using a mobile communication terminal 120 such as a smartphone or a personal computer 130. Then, the financial product recommendation system 300 may provide the chatbot's response text in response to the customer's inquiry text.
  • a mobile communication terminal 120 such as a smartphone or a personal computer 130.
  • the financial product recommendation system 300 may provide the chatbot's response text in response to the customer's inquiry text.
  • the communication network 200 may provide a communication path through which the financial product recommendation system 300 and the user terminal 100 can transmit and receive signals and data to each other, and may include a wired or wireless communication network.
  • the communication network 200 is not limited to a specific communication method, and an appropriate communication method may be used depending on the implementation.
  • the communication network 200 may be implemented as a wired telephone network for the wired phone 110, and if configured as an Internet Protocol (IP)-based system, the communication network 200 may be implemented as an Internet network, and may be implemented as an Internet network.
  • IP Internet Protocol
  • the communication network 200 may be implemented as a wireless network such as a cellular network or a wireless LAN (WLAN) network.
  • WLAN wireless LAN
  • the financial product recommendation system 300 can provide a financial product recommendation service through artificial intelligence learning on financial counseling data according to the present disclosure, and for this purpose, computing devices 400 such as servers and workstations and financial counseling data It may include a database (DB) 500.
  • DB database
  • the computing device 400 acquires text data from the collected financial counseling data, counts words that are the target of the independent variable for each sentence of the text data with respect to the set dependent variable, builds a binary data set, and based on the binary data set By performing a regression analysis, a prediction function for the dependent variable is determined, and financial product information linked to the dependent variable is provided to the specific user based on the predicted value determined by the prediction function for the financial counseling data of the specific user. It can be configured to decide whether to provide it or not.
  • the database 500 may be configured to store and manage financial counseling data collected from the user terminal 100, etc. through financial counseling.
  • Financial counseling data may include data (voice data and text data) generated by the financial product recommendation system 300 as well as data (voice data and text data) generated from the user terminal 100 during non-face-to-face financial counseling. there is.
  • the financial counseling data stored in the database 500 is voice data
  • the computing device 500 can obtain text data corresponding to the voice data through voice-to-text conversion to enable text analysis. .
  • FIG. 2 is a schematic diagram illustrating example components of a computing device according to an embodiment of the present disclosure.
  • computing device 400 may include a processor 410, a storage medium 420, a memory 430, and a network interface 440, which are connected to each other through a system bus 450. can be connected
  • the storage medium 420 may be equipped with an operating system 422 and a computer program 424.
  • the storage medium 420 may be a data storage device such as a hard disk or solid state drive (SSD) that can store computer programs and related data.
  • the operating system 422 may be operating system software such as Windows, IOS, Linux, etc. for operating the computing device 400.
  • Computer program 424 may include computer-executable instructions for executing the method of recommending financial products through artificial intelligence learning on financial advice data of the present disclosure.
  • the computer-executable instructions of the computer program 424 when executed by the processor 410, may cause the processor 410 to perform the method of recommending financial products through artificial intelligence learning on financial advice data of the present disclosure. there is.
  • Processor 410 may be configured to provide computing and control capabilities to support execution of the entire computing device 400.
  • the processor 410 may be a data processing device such as a Central Processing Unit (CPU), Microprocessor Unit (MPU), or Application Processor (AP), and may be comprised of one processor or a plurality of processors. When comprised of a plurality of processors, the processors 410 may operate as parallel processing processors.
  • the network interface 440 may be connected to an external device (eg, the user terminal 100 or a wired or wireless communication entity connectable through a network, etc.) and provide an interface for communicating data.
  • FIG. 3 is a schematic diagram illustrating example functional modules of a processor according to one embodiment of the present disclosure.
  • the processor 410 may include a data collection unit 411, a data processing unit 412, a data learning unit 413, and a financial product recommendation unit 414.
  • the data collection unit 411 may be configured to obtain text data from collected financial counseling data. Financial counseling data generated from non-face-to-face financial counseling provided by the financial product recommendation system 300 can be stored in the database 500, and the data collection unit 411 obtains text data from this and data processing unit 412 ) can be provided.
  • the data processing unit 412 can analyze the text data sentence by sentence and extract the words constituting the sentence, and counts the words that are the subject of the independent variable for each sentence of the text data with respect to the set dependent variable for data learning. It can be configured to build binary data sets. Artificial intelligence learning on financial counseling data according to the present disclosure can be performed based on a regression analysis method, and for this, it is necessary to predict the probability of occurrence of the dependent variable (Y) by the independent variable (X) through machine learning. . Accordingly, in the present disclosure, the independent variable may be a specific word included in financial counseling data, and the dependent variable may be a specific financial event (eg, a specific loan product, a specific insurance product, a specific credit card product, etc.).
  • a specific financial event eg, a specific loan product, a specific insurance product, a specific credit card product, etc.
  • the data processing unit 411 may set a noun word that can be the target of an independent variable as a representative noun word for a set similar noun group.
  • verb words that can be the subject of independent variables can be set as representative verb words for the set similar verb and derived group.
  • nouns such as 'loan', 'loan product', 'loan', and 'loan funds' belong to the similar noun group, and the representative noun word that can be the subject of an independent variable can be set as 'loan'. there is.
  • the verbs 'is', 'there are', 'is there', 'are', 'is', etc. belong to the similar verb and derived group
  • the representative verb word that can be the subject of an independent variable is ' It can be set to '.
  • the data processing unit 411 counts the noun word included in the text data as a representative noun word of the pseudo-noun group to which the corresponding noun word belongs, and calculates the verb word included in the text data as the pseudo-verb word to which the corresponding verb word belongs. It can be configured to build a binary data set by counting the representative verb words of the derived group.
  • the financial product recommendation system 300 selects words (i.e., stopwords) that have a high frequency of occurrence in the text data of the financial counseling data but have low importance for generating the dependent variable in order to increase the prediction accuracy of the prediction function. ) can be processed to exclude data.
  • the data processing unit 412 calculates the importance of each word included in the text data using TF-IDF (Term Frequency-Inverse Document Frequency), and if the calculated importance of the word is less than the set standard value, the It can be configured to exclude words from words that are the target of independent variables.
  • TF-IDF Term Frequency-Inverse Document Frequency
  • the total number of consultations subject to analysis is N
  • the frequency of word x appearing in the yth consultation case is tf x,y
  • the word If the number of consultations containing x is df x , the importance W x,y for word x can be calculated using the following formula:
  • the data processing unit 412 can construct a binary data set in which independent variables are composed of words whose importance exceeds a preset standard and provide it to the data learning unit 413.
  • the data learning unit 413 may be configured to determine a prediction function for the dependent variable by performing regression analysis based on the binary data set constructed in the data processing unit 412.
  • the dependent variable may have the outcome that the corresponding specific financial event occurs (i.e., 1) or does not occur (i.e., 0), and thus the present disclosure applies logistic regression analysis as a regression analysis. You can.
  • the data learning unit 413 determines the weight of each independent variable by performing a logistic regression analysis on the constructed binary data set, and calculates a linear function defined by each independent variable and the determined weight of the independent variable. It can be configured to determine the prediction function for the corresponding dependent variable.
  • the data learning unit 413 performs a logistic regression analysis on a binary data set consisting of a combination of specific words X 1 , X 2 ,..., X n as independent variables and the dependent variable Y, the following You can obtain a prediction function in the form of a linear function, such as the formula:
  • a i (i is a positive integer) is the weight of the independent variable It is a weight vector.
  • the data processing unit 412 may be configured to build a new binary data set using newly collected financial counseling data at a predetermined cycle.
  • the data learning unit 413 performs a stepwise logistic regression analysis on the entire binary data set to which new binary data sets are added at a predetermined period, thereby generating an updated combination of independent variables or an updated dependent variable with updated weights of the independent variables. It may be configured to determine a prediction function.
  • the financial product recommendation system 300 can predict whether a financial event corresponding to the dependent variable is likely to occur when analyzing financial counseling data of a specific user using a prediction function determined through logistic regression analysis for the dependent variable. To this end, the financial product recommendation unit 414 determines whether to provide financial product information linked to the dependent variable to a specific user based on the predicted value determined by the prediction function for the dependent variable with respect to the financial counseling data of the specific user. It can be configured to decide.
  • the financial product recommendation unit 414 may decide to provide financial product information (e.g., sending loan promotion DM, transmitting voice ARS, contacting a counselor by phone, etc.) linked to the 'intermediate loan' to the specific user. there is.
  • financial product information e.g., sending loan promotion DM, transmitting voice ARS, contacting a counselor by phone, etc.
  • the financial product recommendation system 300 may define a plurality of dependent variables, each dependent variable corresponding to a specific financial event (e.g., a specific loan product, a specific insurance product, a specific credit card product, etc.). can respond.
  • a specific financial event e.g., a specific loan product, a specific insurance product, a specific credit card product, etc.
  • the data processing unit 412 analyzes text data of financial counseling data for each dependent variable to build each binary data set.
  • the data learning unit 413 may determine each prediction function for each dependent variable based on the binary data set constructed for each dependent variable.
  • the financial product recommendation unit 141 determines which dependent variable has the highest predicted value determined by the prediction function for the financial counseling data of a specific user, and determines the financial product associated with the financial event corresponding to the dependent variable with the highest predicted value. It may be configured to determine which information to provide to the specific user. For example, in the case where prediction functions are determined for the financial events 'intermediate loan', 'car insurance', and 'airline mileage credit card', the independent variables (X) determined from the financial counseling data of a specific user If the predicted value calculated by inputting the combination into each prediction function is the largest for the financial event 'car insurance', the financial product recommendation unit 414 selects 'car insurance' for a specific user among the target financial events. It can be judged that there is the highest possibility of applying. In this case, the financial product recommendation unit 414 may decide to provide financial product information linked to 'car insurance' to the specific user.
  • FIG. 4 is an exemplary diagram illustrating a binary data set and prediction function for logical stick regression analysis according to an embodiment of the present disclosure.
  • the data processing unit 412 counts words that are the target of independent variables in the text data obtained from financial counseling data for each sentence (or for each preset text data unit) and sets the dependent variable for the sentence (or the text data unit).
  • One binary data set can be created with information on whether or not it occurs (1 when it occurs, 0 when it does not occur), and the same data processing is repeated sequentially for the next sentence (or the next text data unit) to generate a certain amount of data. You can build binary data sets.
  • Sentence #1 One One 0 0
  • Sentence #2 0
  • the data learning unit 413 can determine a prediction function for the dependent variable (Y) as illustrated in 610 of FIG. 4 by performing logistic regression analysis on binary data sets such as 600 in FIG. 4, which is shown in Table It is the same as the prediction function illustrated in 2.
  • Figure 5 is a schematic flowchart showing a method of recommending financial products through artificial intelligence learning on financial counseling data according to an embodiment of the present disclosure.
  • the computing device 400 of the financial product recommendation system 300 can obtain text data from financial counseling data collected from users' financial counseling, and voice financial counseling data can be converted into voice-text data.
  • Corresponding text data can be obtained through conversion (710).
  • the computing device 400 can build a binary data set by counting words that are the subject of an independent variable for each sentence of text data (or for each preset text data unit) with respect to a set dependent variable corresponding to a specific financial event. (720).
  • the computing device 400 calculates the importance of words through the TF-IDF technique for words included in the text data and processes words whose importance is less than a set threshold to be excluded from the independent variable. You can.
  • the computing device 400 may determine a prediction function for a set dependent variable by performing a logistic regression analysis based on the constructed binary data set (730). Additionally, the computing device 400 may periodically perform steps 710 to 730 to determine an updated prediction function for the dependent variable reflecting the newly collected financial counseling data (740). Once the prediction function for the set dependent variable is determined, the computing device 400 provides financial product information associated with the dependent variable to the specific user based on the predicted value determined by the prediction function for the financial counseling data of the specific user. You can decide whether to provide it or not (750).
  • a component may be, but is not limited to, a process running on a processor, a processor, an object, a thread of execution, a program, and/or a computer.
  • a component may be, but is not limited to, a process running on a processor, a processor, an object, a thread of execution, a program, and/or a computer.
  • an application running on a computing device and the computing device can be a component.
  • One or more components may reside within a processor and/or thread of execution, and a component may be localized within one computer, or distributed between two or more computers. Additionally, these components can execute from various computer-readable media having various data structures stored thereon.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Technology Law (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 개시 내용은 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 방법에 관한 것이다. 상기 시스템은, 수집되는 금융 상담 데이터로부터 텍스트 데이터를 획득하도록 구성되는 데이터 수집부; 설정된 종속변수에 대하여 상기 텍스트 데이터의 문장별로 독립변수의 대상이 되는 단어를 카운트하여 바이너리 데이터 세트를 구축하도록 구성되는 데이터 가공부; 상기 바이너리 데이터 세트에 기초하여 회귀 분석을 수행함으로써 상기 종속변수에 대한 예측함수를 결정하도록 구성되는 데이터 학습부; 및 특정 사용자의 금융 상담 데이터에 대하여 상기 예측함수에 의해 결정되는 예측값에 기초하여 상기 종속변수와 연계된 금융 상품 정보를 상기 특정 사용자에게 제공할지 여부를 결정하도록 구성되는 금융 상품 추천부를 포함할 수 있다. 본 개시 내용에 따르면, 비대면 채널을 통한 인공지능 기반 금융 상담의 타겟팅 정확도를 향상시킴으로써 사용자별로 맞춤화된 금융 상품 추천을 가능하게 하는 효과가 있다.

Description

금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 방법
본 개시 내용은 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 방법에 관한 것이다.
종래의 금융 대면채널의 서비스는 은행, 증권사, 보험사 등의 서비스 직원들이 가지고 있는 금융 상품 지식을 토대로 방문 고객들을 상담하면서 고객들의 취향과 니즈에 맞는 인기 투자 및 금융 상품을 추천하는 방식으로 이루어졌다. 그러나, 최근 인터넷은행, 로보어드바이저 증권추천 등 인공 지능 기술의 발달로 챗봇(chatbot)과 같은 머신 상담 수단을 통한 비대면 금융서비스의 제공이 증가하고 있다.
현재 이루어지고 있는 인공지능 기반 금융 상품 추천은 인터넷 상에 공유되고 있는 금융 상품 정보 및 금융전문가들의 투자 의견 및 투자상품 텍스트 정보들을 취합 분석하여 이를 특정 고객들의 니즈 및 관심 상품의 범위 안에서 추천하는 정도에 그치고 있다. 보다 정확하고 타 필요가 있으나, 이러한 상담 데이터는 표준 스키마가 일정하지 않은 비정형 정보들이기 때문에 이를 분석하여 의미를 파악하고 패턴을 분석하는데 어려움이 있다. 또한겟팅된 금융 상품 추천을 위해서는 고객들의 상담 데이터를 실시간으로 취합 및 분석할, 종래에는 음성 상담 데이터과 같은 텍스트화되지 않은 정보들을 텍스트 데이터로서 체계적으로 저장하지 못했기 때문에, 향후 고객들의 의미있는 실제 거래 이벤트 등을 예측하는데 있어 과거의 축적된 상담 데이터를 제대로 이용하지 못하는 한계가 있었다.
이에, 고객들의 음성 상담 내역과 같은 비정형 데이터로부터 텍스트 데이터를 체계적으로 획득 및 분석하여 인공지능 학습시키고 이를 통해 고객들에게 보다 정확하고 타겟팅된 금융 상품 추천을 제시할 수 있는 기술을 개발할 필요성이 있다.
이러한 문제점을 해결하기 위한 본 개시 내용은 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 방법을 제공하는 것을 목적으로 한다.
본 개시 내용의 일 실시예에 따르면, 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템이 제시될 수 있다. 상기 시스템은, 수집되는 금융 상담 데이터로부터 텍스트 데이터를 획득하도록 구성되는 데이터 수집부; 설정된 종속변수에 대하여 상기 텍스트 데이터의 문장별로 독립변수의 대상이 되는 단어를 카운트하여 바이너리 데이터 세트를 구축하도록 구성되는 데이터 가공부; 상기 바이너리 데이터 세트에 기초하여 회귀 분석을 수행함으로써 상기 종속변수에 대한 예측 함수를 결정하도록 구성되는 데이터 학습부; 및 특정 사용자의 금융 상담 데이터에 대하여 상기 예측함수에 의해 결정되는 예측값에 기초하여 상기 종속변수와 연계된 금융 상품 정보를 상기 특정 사용자에게 제공할지 여부를 결정하도록 구성되는 금융 상품 추천부를 포함할 수 있다.
또한, 상기 독립변수의 대상이 되는 명사 단어는 설정된 유사 명사 그룹에 대한 대표 명사 단어일 수 있고, 상기 독립변수의 대상이 되는 동사 단어는 설정된 유사 동사 및 파생형 그룹에 대한 대표 동사 단어일 수 있다. 상기 데이터 가공부는, 상기 텍스트 데이터에 포함된 명사 단어를 해당 명사 단어가 속하는 유사 명사 그룹의 대표 명사 단어로서 카운트하고, 상기 텍스트 데이터에 포함된 동사 단어를 해당 동사 단어가 속하는 유사 동사 및 파생형 그룹의 대표 동사 단어로서 카운트하도록 구성될 수 있다.
또한, 상기 데이터 가공부는, 상기 텍스트 데이터에 포함된 각각의 단어에 대하여 TF-IDF(Term Frequency-Inverse Document Frequency)를 이용하여 중요도를 계산하고, 계산된 단어의 중요도가 설정된 기준치 미만이면 해당 단어를 상기 독립변수의 대상이 되는 단어에서 제외하도록 구성될 수 있다.
또한, 상기 데이터 학습부는, 상기 바이너리 데이터 세트에 대한 로지스틱 회귀 분석을 수행함으로써 각각의 독립변수의 가중치를 결정하고, 각각의 독립변수 및 해당 독립변수의 결정된 가중치에 의해 정의되는 1차함수로서 상기 종속변수에 대한 예측 함수를 결정하도록 구성될 수 있다.
또한, 상기 데이터 가공부는 미리 결정된 주기로 신규 수집된 금융 상담 데이터를 이용하여 신규 바이너리 데이터 세트를 구축하도록 구성될 수 있다. 상기 데이터 학습부는, 상기 미리 결정된 주기로 상기 신규 바이너리 데이터 세트가 더해진 전체 바이너리 데이터 세트에 대한 단계적(stepwise) 로지스틱 회귀 분석을 수행함으로써 독립변수의 조합 또는 독립변수의 가중치가 업데이트된 상기 종속변수에 대한 업데이트된 예측 함수를 결정하도록 구성될 수 있다.
또한, 상기 금융 상품 추천 시스템은 복수의 종속변수들을 정의하고, 각각의 종속변수는 특정 금융 이벤트에 대응할 수 있다. 상기 데이터 가공부는 종속변수별로 상기 바이너리 데이터 세트를 구축하도록 구성될 수 있고, 상기 데이터 학습부는 종속변수별로 상기 예측함수를 결정하도록 구성될 수 있다. 상기 금융 상품 추천부는, 상기 특정 사용자의 금융 상담 데이터에 대하여 어떤 종속변수에 대한 예측함수에 의해 결정되는 예측값이 가장 높은지 결정하고, 가장 예측값이 높은 종속변수에 대응하는 금융 이벤트와 연계된 금융 상품 정보를 상기 특정 사용자로 제공할 것을 결정하도록 구성될 수 있다.
본 개시 내용의 일 실시예에 따르면, 컴퓨팅 장치에 의해 수행되는 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 방법이 제시될 수 있다. 상기 방법은, 수집되는 금융 상담 데이터로부터 텍스트 데이터를 획득하는 단계; 설정된 종속변수에 대하여 상기 텍스트 데이터의 문장별로 독립변수의 대상이 되는 단어를 카운트하여 바이너리 데이터 세트를 구축하는 단계; 상기 바이너리 데이터 세트에 기초하여 회귀 분석을 수행함으로써 상기 종속변수에 대한 예측 함수를 결정하는 단계; 및 특정 사용자의 금융 상담 데이터에 대하여 상기 예측함수에 의해 결정되는 예측값에 기초하여 상기 종속변수와 연계된 금융 상품 정보를 상기 특정 사용자에게 제공할지 여부를 결정하는 단계를 포함할 수 있다.
본 개시 내용의 일 실시예에 따르면, 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 방법을 실행하기 위한 컴퓨터-실행가능 명령들을 포함하는, 컴퓨터 판독가능 매체에 저장된 컴퓨터 프로그램이 제시될 수 있다.
본 개시 내용에 따르면, 비대면 채널을 통한 인공지능 기반 금융 상담의 타겟팅 정확도를 향상시킴으로써 사용자별로 맞춤화된 금융 상품 추천을 가능하게 하는 효과가 있다.
또한, 본 개시 내용에 따르면, 신규 고객의 비대면 음성 상담 데이터를 실시간으로 취합하여 특정 금융 상품에 대한 구매전환율이 높은 음성 상담 패턴을 보이는 고객인지 예측할 수 있으며, 이에 따라 해당 신규 고객에 대한 타겟 마켓팅을 제공할 수 있는 효과가 있다.
도 1은 본 개시 내용의 일 실시예에 따른 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 전체 운영 환경을 나타내는 개략적인 도면이다.
도 2는 본 개시 내용의 일 실시예에 따른 컴퓨팅 장치의 예시적인 구성요소들을 나타내는 개략적인 도면이다.
도 3은 본 개시 내용의 일 실시예에 따른 프로세서의 예시적인 기능 모듈들을 나타내는 개략적인 도면이다.
도 4는 본 개시 내용의 일 실시예에 따른 로직스틱 회귀 분석을 위한 바이너리 데이터 세트 및 예측함수를 나타내는 예시적인 도면이다.
도 5는 본 개시 내용의 일 실시예에 따른 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 방법을 나타내는 개략적인 순서도이다.
이하, 본 발명의 바람직한 실시예들을 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
본 발명의 다양한 양상들이 아래에서 설명된다. 여기에서 제시되는 발명들은 폭넓은 다양한 형태들로 구현될 수 있으며 여기에서 제시되는 임의의 특정한 구조, 기능 또는 이들 모두는 단지 예시적이라는 것을 이해하도록 한다. 여기에서 제시되는 발명들에 기반하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 여기에서 제시되는 하나의 양상이 임의의 다른 양상들과 독립적으로 구현될 수 있으며 둘 이상의 이러한 양상들이 다양한 방식들로 결합될 수 있다는 것을 이해할 것이다. 예를 들어, 여기에서 설명되는 임의의 수의 양상들을 이용하여 장치가 구현될 수 있거나 또는 방법이 실시될 수 있다. 또한, 여기에서 설명되는 하나 이상의 양상들에 더하여 또는 이들 양상들이 아닌 다른 구조, 기능 또는 구조 및 기능을 이용하여 이러한 장치가 구현될 수 있거나 또는 이러한 방법이 실시될 수 있다.
도 1은 본 개시 내용의 일 실시예에 따른 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 전체 운영 환경을 나타내는 개략적인 도면이다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 금융 상품 추천 시스템(300)은 통신망(200) 및 사용자 단말기(100)와 연계하여 동작할 수 있다.
사용자 단말기(100)는 통신망(200)을 통해 금융 상품 추천 시스템(300)에 접속하여 비대면 방식의 금융 상담을 제공받을 수 있다. 이를 위해, 금융 상품 시스템(300)은 콜센터, 상담 사이트, 상담 애플리케이션(app) 등을 제공할 수 있으며, 연결된 전문상담사의 응대에 따라 또는 챗봇과 같은 금융 상담 알고리즘에 따라 금융 상담을 제공할 수 있다. 예를 들어, 금융 상담 알고리즘에 따라 상담이 이루어지는 경우에, 유선전화(110) 또는 이동 통신 단말기(120)를 이용하여 사용자가 금융 상품 추천 시스템(300)의 콜센터에 전화하면, 금융 상품 추천 시스템(300)은 고객의 음성 문의에 응답하여 챗봇의 응답 텍스트를 TTS(Text to Speech) 등과 같은 텍스트-음성 변환을 통해 음성으로 사용자에게 제공할 수 있다. 또한, 예를 들어, 금융 상담 알고리즘에 따라 상담이 이루어지는 경우에, 스마트폰과 같은 이동 통신 단말기(120) 또는 개인용 컴퓨터(130)를 이용하여 사용자가 금융 상품 추천 시스템(300)의 상담 사이트에 접속하면, 금융 상품 추천 시스템(300)은 고객의 문의 텍스트에 응답하여 챗봇의 응답 텍스트를 제공할 수 있다.
통신망(200)은 금융 상품 추천 시스템(300) 및 사용자 단말기(100)가 서로 신호 및 데이터를 송수신할 수 있는 통신 경로를 제공할 수 있으며, 유선 또는 무선 통신망을 포함할 수 있다. 통신망(200)은 특정한 통신 방식에 한정되지 않으며, 구현예에 따라 적절한 통신 방식이 사용될 수 있다. 예를 들어, 통신망(200)은 유선전화(110)에 대하여 유선 전화망으로 구현될 수 있고, 인터넷 프로토콜(IP) 기반의 시스템으로 구성되는 경우 통신망(200)은 인터넷망으로 구현될 수 있으며, 이동 통신 시스템으로 구성되는 경우 통신망(200)은 셀룰러 네트워크 또는 WLAN(Wireless LAN) 네트워크 등과 같은 무선망으로 구현될 수 있다.
금융 상품 추천 시스템(300)은 본 개시 내용에 따른 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 서비스를 제공할 수 있으며, 이를 위해 서버, 워크스테이션 등과 같은 컴퓨팅 장치(400) 및 금융 상담 데이터 데이터베이스(DB)(500)를 포함할 수 있다.
컴퓨팅 장치(400)는 수집되는 금융 상담 데이터로부터 텍스트 데이터를 획득하고, 설정된 종속변수에 대하여 텍스트 데이터의 문장별로 독립변수의 대상이 되는 단어를 카운트하여 바이너리 데이터 세트를 구축하고, 바이너리 데이터 세트에 기초하여 회귀 분석을 수행함으로써 상기 종속변수에 대한 예측 함수를 결정하고, 특정 사용자의 금융 상담 데이터에 대하여 상기 예측함수에 의해 결정되는 예측값에 기초하여 상기 종속변수와 연계된 금융 상품 정보를 상기 특정 사용자에게 제공할지 여부를 결정하도록 구성될 수 있다.
데이터베이스(500)는 금융 상담을 통해 사용자 단말기(100) 등으로부터 수집되는 금융 상담 데이터를 저장 및 관리하도록 구성될 수 있다. 금융 상담 데이터는 비대면 금융 상담시 사용자 단말기(100)로부터 발생되는 데이터(음성 데이터 및 텍스트 데이터)뿐만 아니라 금융 상품 추천 시스템(300)에 의해 발생되는 데이터(음성 데이터 및 텍스트 데이터)를 포함할 수 있다. 전술한 바와 같이, 데이터베이스(500)에 저장된 금융 상담 데이터가 음성 데이터인 경우, 컴퓨팅 장치(500)는 텍스트 분석이 가능하도록 음성-텍스트 변환을 통해 해당 음성 데이터에 대응하는 텍스트 데이터를 획득할 수 있다.
도 2는 본 개시 내용의 일 실시예에 따른 컴퓨팅 장치의 예시적인 구성요소들을 나타내는 개략적인 도면이다.
도 2에 도시된 바와 같이, 컴퓨팅 장치(400)는 프로세서(410), 저장 매체(420), 메모리(430), 네트워크 인터페이스(440)를 포함할 수 있으며, 이들은 시스템 버스(450)를 통해 서로 연결될 수 있다.
저장 매체(420)에는 운영 시스템(422) 및 컴퓨터 프로그램(424)이 탑재될 수 있다. 저장 매체(420)는 컴퓨터 프로그램 및 관련 데이터들을 저장할 수 있는 하드디스크, SSD(Solid State Drive) 등과 같은 데이터 저장 장치일 수 있다. 운영 시스템(422)은 컴퓨팅 장치(400)를 동작시키기 위한 Windows, IOS, Linux 등과 같은 운영체재 소프트웨어일 수 있다. 컴퓨터 프로그램(424)은 본 개시 내용의 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 방법을 실행시키기 위한 컴퓨터-실행가능 명령들을 포함할 수 있다. 컴퓨터 프로그램(424)의 컴퓨터-실행가능 명령들은 프로세서(410)에 의해 실행될 때, 프로세서(410)로 하여금 본 개시 내용의 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 방법을 수행하게 할 수 있다. 프로세서(410)는 전체 컴퓨팅 장치(400)의 실행을 지원하기 위한 컴퓨팅 및 제어 능력들을 제공하도록 구성될 수 있다. 프로세서(410)는 CPU(Central Processing Unit), MPU(Microprocessor Unit), AP(Application Processor) 등과 같은 데이터 처리 장치일 수 있으며, 하나의 프로세서 또는 복수개의 프로세서들로 구성될 수 있다. 복수개의 프로세서들로 구성되는 경우, 프로세서들(410)은 병렬 처리 프로세서들로서 동작할 수 있다. 네트워크 인터페이스(440)는 외부 장치(예를 들어, 사용자 단말기(100) 또는 네트워크를 통해 연결가능한 유무선 통신 엔티티 등)와 연결되어 데이터를 통신할 수 있는 인터페이스를 제공할 수 있다.
도 3은 본 개시 내용의 일 실시예에 따른 프로세서의 예시적인 기능 모듈들을 나타내는 개략적인 도면이다.
본 개시 내용의 일 실시예에 따른 프로세서(410)는 데이터 수집부(411), 데이터 가공부(412), 데이터 학습부(413) 및 금융 상품 추천부(414)를 포함할 수 있다.
데이터 수집부(411)는 수집되는 금융 상담 데이터로부터 텍스트 데이터를 획득하도록 구성될 수 있다. 금융 상품 추천 시스템(300)에서 제공하는 비대면 금융 상담에서 발생하는 금융 상담 데이터는 데이터베이스(500)에 저장될 수 있으며, 데이터 수집부(411)는 이로부터 텍스트 데이터를 획득하여 데이터 가공부(412)로 제공할 수 있다.
데이터 가공부(412)는 텍스트 데이터를 문장별로 분석하고 해당 문장을 구성하는 단어들을 추출할 수 있으며, 설정된 종속변수에 대하여 텍스트 데이터의 문장별로 독립변수의 대상이 되는 단어를 카운트하여 데이터 학습을 위한 바이너리 데이터 세트를 구축하도록 구성될 수 있다. 본 개시 내용에 따른 금융 상담 데이터에 대한 인공지능 학습은 회귀 분석 방식에 기초하여 이루어질 수 있으며, 이를 위해 독립변수(X)에 의한 종속변수(Y)의 발생가능성을 기계 학습을 통해 예측할 필요가 있다. 따라서, 본 개시 내용에서 독립변수는 금융 상담 데이터에 포함된 특정 단어일 수 있으며, 종속변수는 특정 금융 이벤트(예를 들어, 특정 대출 상품, 특정 보험 상품, 특정 신용카드 상품 등)일 수 있다.
일 구현예에서, 유사한 의미의 단어들이 각각 별개의 독립변수로 처리되지 않도록, 데이터 가공부(411)는 독립변수의 대상이 될 수 있는 명사 단어를 설정된 유사 명사 그룹에 대한 대표 명사 단어로 설정할 수 있고, 독립변수의 대상이 될 수 있는 동사 단어를 설정된 유사 동사 및 파생형 그룹에 대한 대표 동사 단어로 설정할 수 있다. 예를 들어, 명사인 '대출', '대출상품', '융자', '융자자금' 등은 유사 명사 그룹에 속하고 독립변수의 대상이 될 수 있는 대표 명사 단어는 '대출'로 설정될 수 있다. 예를 들어, 동사인 '이다', '있습니다', '있나요', '있어', '있나' 등은 유사 동사 및 파생형 그룹에 속하고 독립변수의 대상이 될 수 있는 대표 동사 단어는 '이다'로 설정될 수 있다. 이에 따라, 데이터 가공부(411)은 텍스트 데이터에 포함된 명사 단어를 해당 명사 단어가 속하는 유사 명사 그룹의 대표 명사 단어로서 카운트하고, 텍스트 데이터에 포함된 동사 단어를 해당 동사 단어가 속하는 유사 동사 및 파생형 그룹의 대표 동사 단어로서 카운트하여 바이너리 데이터 세트를 구축하도록 구성될 수 있다.
일 구현예에서, 금융 상품 추천 시스템(300)은 예측함수의 예측 정확도를 높이기 위해 금융 상담 데이터의 텍스트 데이터에서 단어의 발생 빈도가 높지만 종속변수를 발생시킬 중요도는 낮은 단어(즉, 불용어(stopword))를 배제시키는 데이터 처리를 수행할 수 있다. 이를 위해, 데이터 가공부(412)는 텍스트 데이터에 포함된 각각의 단어에 대하여 TF-IDF(Term Frequency-Inverse Document Frequency)를 이용하여 중요도를 계산하고, 계산된 단어의 중요도가 설정된 기준치 미만이면 해당 단어를 독립변수의 대상이 되는 단어에서 제외하도록 구성될 수 있다.
예를 들어, TF-IDF를 적용시에, 텍스트 데이터를 상담건 별로 분류하였을 때, 분석대상인 전체 상담건수가 N개이고, y번째 상담건에서 단어 x가 나온 빈도를 tfx,y라 하고, 단어 x를 포함하는 상담건수를 dfx라고 하면, 단어 x에 대한 중요도 Wx,y는 다음의 수식과 같이 계산될 수 있다:
Figure PCTKR2022018399-appb-img-000001
이를 통해, 데이터 가공부(412)는 중요도가 미리 설정된 기준 이상이 되는 단어들로 독립변수를 구성한 바이너리 데이터 세트를 구축하여 데이터 학습부(413)로 제공할 수 있다.
데이터 학습부(413)는 데이터 가공부(412)에서 구축된 바이너리 데이터 세트에 기초하여 회귀 분석을 수행함으로써 종속변수에 대한 예측 함수를 결정하도록 구성될 수 있다. 이와 관련하여, 종속변수는 대응하는 특정 금융 이벤트가 발생(즉, 1) 또는 발생하지 않음(즉, 0)의 결과를 가질 수 있으며, 이에 따라 본 개시 내용은 회귀 분석으로서 로지스틱 회귀 분석을 적용할 수 있다.
따라서, 데이터 학습부(413)는 구축된 바이너리 데이터 세트에 대한 로지스틱 회귀 분석을 수행함으로써 각각의 독립변수의 가중치를 결정하고, 각각의 독립변수 및 해당 독립변수의 결정된 가중치에 의해 정의되는 1차함수로서 해당 종속변수에 대한 예측 함수를 결정하도록 구성될 수 있다.
예를 들어, 데이터 학습부(413)가 독립변수인 특정 단어들 X1, X2,..., Xn의 조합 및 종속변수 Y로 구성된 바이너리 데이터 세트에 대하여 로지스틱 회귀 분석을 수행하면 다음의 수식과 같은 1차함수 형태의 예측 함수를 획득할 수 있다:
Figure PCTKR2022018399-appb-img-000002
여기서, Ai(i는 양의 정수)는 로지스틱 회귀 분석을 통해 결정된 독립변수 Xi의 가중치이며, A는 [A1, A2,...,An]으로 표현될 수 있는 예측 함수의 가중치 벡터이다.
한편, 사용자들의 금융 상담 건수가 늘어날수록 데이터베이스(500)에는 금융 상담 데이터가 축적될 수 있으며, 금융 상품 추천 시스템(300)은 예측 함수의 정확도를 높이기 위해 추가로 축적된 금융 상담 데이터를 기초하여 예측 함수를 업데이트시킬 수 있다. 이를 위해, 데이터 가공부(412)는 미리 결정된 주기로 신규 수집된 금융 상담 데이터를 이용하여 신규 바이너리 데이터 세트를 구축하도록 구성될 수 있다. 데이터 학습부(413)는 미리 결정된 주기로 신규 바이너리 데이터 세트가 더해진 전체 바이너리 데이터 세트에 대한 단계적(stepwise) 로지스틱 회귀 분석을 수행함으로써 독립변수의 조합 또는 독립변수의 가중치가 업데이트된 종속변수에 대한 업데이트된 예측 함수를 결정하도록 구성될 수 있다.
금융 상품 추천 시스템(300)은 종속변수에 대하여 로지스틱 회귀 분석을 통해 결정된 예측 함수를 이용하여 특정 사용자의 금융 상담 데이터를 분석하였을 때 종속변수에 대응하는 금융 이벤트가 발생할 가능성이 높은지 예측할 수 있다. 이를 위해, 금융 상품 추천부(414)는 특정 사용자의 금융 상담 데이터에 대하여 종속변수에 대한 예측함수에 의해 결정되는 예측값에 기초하여 상기 종속변수와 연계된 금융 상품 정보를 특정 사용자에게 제공할지 여부를 결정하도록 구성될 수 있다.
예를 들어, 종속변수(Y)에 대응하는 금융 이벤트가 '사잇돌 대출'이고 종속변수(Y)가 발생할 가능성이 높다고 판단하기 위해 설정된 기준치가 Y=0.8인 경우에, 특정 사용자의 금융 상담 데이터로부터 결정된 독립변수(X)들의 조합을 표 2에 예시된 예측 함수에 입력하여 계산되는 예측값이 0.8보다 크면, 금융 상품 추천부(414)는 특정 사용자가 '사잇돌 대출'을 신청할 가능성이 높다고 판단할 수 있다. 이러한 경우, 금융 상품 추천부(414)는 '사잇돌 대출'과 연계된 금융 상품 정보(예를 들어, 대출 프로모션 DM 발송, 음성 ARS 송출, 상담사 전화 연락 등)를 해당 특정 사용자에게 제공하도록 결정할 수 있다.
일 구현예에서, 금융 상품 추천 시스템(300)은 복수의 종속변수들을 정의할 수 있으며, 각각의 종속변수는 특정 금융 이벤트(예를 들어, 특정 대출 상품, 특정 보험 상품, 특정 신용카드 상품 등)에 대응할 수 있다. 각각의 종속변수에 대한 금융 상담 데이터의 학습 및 회귀 분석을 통한 예측함수를 결정할 수 있도록, 데이터 가공부(412)는 종속변수별로 금융 상담 데이터의 텍스트 데이터를 분석하여 각각의 바이너리 데이터 세트를 구축할 수 있으며, 데이터 학습부(413)는 종속변수별로 구축된 바이너리 데이터 세트에 기초하여 각각의 종속변수에 대한 각각의 예측 함수를 결정할 수 있다.
금융 상품 추천부(141)는 특정 사용자의 금융 상담 데이터에 대하여 어떤 종속변수에 대한 예측함수에 의해 결정되는 예측값이 가장 높은지 결정하고, 가장 예측값이 높은 종속변수에 대응하는 금융 이벤트와 연계된 금융 상품 정보를 상기 특정 사용자로 제공할 것을 결정하도록 구성될 수 있다. 예를 들어, 금융 이벤트들 '사잇돌 대출', '자동차 보험' 및 '항공마일리지 신용카드'에 대하여 각각 예측 함수가 결정되어 있는 경우에, 특정 사용자의 금융 상담 데이터로부터 결정된 독립변수(X)들의 조합을 각각의 예측 함수에 입력하여 계산되는 예측값이 금융 이벤트 '자동차 보험'에 대하여 가장 큰 값이 나오면, 금융 상품 추천부(414)는 대상이 되는 금융 이벤트들 중에서 특정 사용자가 '자동차 보험'을 신청할 가능성이 가장 높다고 판단할 수 있다. 이러한 경우, 금융 상품 추천부(414)는 '자동차 보험'과 연계된 금융 상품 정보를 해당 특정 사용자에게 제공하도록 결정할 수 있다.
도 4는 본 개시 내용의 일 실시예에 따른 로직스틱 회귀 분석을 위한 바이너리 데이터 세트 및 예측함수를 나타내는 예시적인 도면이다.
데이터 가공부(412)는 금융 상담 데이터로부터 획득된 텍스트 데이터를 문장별로(또는 미리 설정된 텍스트 데이터 단위별로) 독립변수의 대상의 되는 단어를 카운트하고 해당 문장(또는 해당 텍스트 데이터 단위)에 대한 종속변수의 발생여부(발생시 1, 미발생시 0) 정보와 함께 하나의 바이너리 데이터 세트를 생성할 수 있으며, 다음 문장(또는 다음 텍스트 데이터 단위)에 대하여도 차례대로 동일한 방식의 데이터 처리를 반복하면서 일정 규모의 바이너리 데이터 세트를 구축할 수 있다.
예를 들어, 종속변수(Y) '사잇돌 대출'에 대하여 독립변수(X1 = 사잇돌, X2 = 대출, X3 = 담보 , X4 = 보험)를 2개의 텍스트 문장에 대하여 카운트하면 다음의 표와 같은 예시적인 2개의 바이너리 데이터 세트가 생성될 수 있다:
X1(사잇돌) X2(대출) X3(담보) X4(보험) Y(사잇돌 대출)
문장#1 1 1 0 0 1
문장#2 0 1 1 0 0
위와 같은 방식으로, 설정된 종속변수(Y)에 대하여 독립변수의 대상이 되는 단어가 n개 존재할 때(즉, X1, X2,....Xn), 금융 상담 데이터를 텍스트 문장별(또는 텍스트 데이터 단위별)로 데이터 처리를 반복하면 도 4의 600에 예시된 바와 같은 로지스틱 회귀 분석에 입력하기 위한 바이너리 데이터 세트들이 구축될 수 있다.
데이터 학습부(413)는 도 4의 600과 같은 바이너리 데이터 세트들에 대하여 로지스틱 회귀 분석을 수행함으로써 도 4의 610에 예시된 바와 같은 종속변수(Y)에 대한 예측 함수를 결정할 수 있으며, 이는 표 2에 예시된 예측 함수와 같다.
도 5는 본 개시 내용의 일 실시예에 따른 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 방법을 나타내는 개략적인 순서도이다.
도 5에 도시된 바와 같이, 금융 상품 추천 시스템(300)의 컴퓨팅 장치(400)는 사용자들의 금융 상담으로부터 수집되는 금융 상담 데이터로부터 텍스트 데이터를 획득할 수 있으며, 음성 금융 상담 데이터에 대하여는 음성-텍스트 변환을 통해 대응하는 텍스트 데이터를 획득할 수 있다(710). 컴퓨팅 장치(400)는 특정 금융 이벤트에 대응하는 설정된 종속변수에 대하여 텍스트 데이터의 문장별(또는 미리 설정된 텍스트 데이터 단위별로)로 독립변수의 대상이 되는 단어를 카운트하여 바이너리 데이터 세트를 구축할 수 있다(720). 선택적으로, 컴퓨팅 장치(400)는 단계 720을 수행하기 전에 텍스트 데이터에 포함된 단어들에 대하여 TF-IDF 기법을 통해 단어의 중요도를 계산하고 중요도가 설정된 기준치 미만인 단어를 독립변수에서 제외하도록 처리할 수 있다. 컴퓨팅 장치(400)는 구축된 바이너리 데이터 세트에 기초하여 로지스틱 회귀 분석을 수행함으로써 설정된 종속변수에 대한 예측 함수를 결정할 수 있다(730). 또한, 컴퓨팅 장치(400)는 주기적으로 단계 710 내지 730을 수행하면서 신규 수집된 금융 상담 데이터가 반영된 종속변수에 대한 업데이트된 예측 함수를 결정할 수 있다(740). 설정된 종속변수에 대한 예측 함수가 결정되면, 컴퓨팅 장치(400)는 특정 사용자의 금융 상담 데이터에 대하여 상기 예측 함수에 의해 결정되는 예측값에 기초하여 상기 종속변수와 연계된 금융 상품 정보를 상기 특정 사용자에게 제공할지 여부를 결정할 수 있다(750).
임의의 제시된 프로세스들에 있는 단계들의 임의의 특정한 순서 또는 계층 구조는 예시적인 접근들의 일례임을 이해하도록 한다. 설계 우선순위들에 기반하여, 본 발명의 범위 내에서 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조가 재배열될 수 있다는 것을 이해하도록 한다. 첨부된 방법 청구항들은 예시적인 순서로 다양한 단계들의 엘리먼트들을 제공하지만 제시된 특정한 순서 또는 계층 구조에 한정되는 것을 의미하지는 않는다.
본 명세서 사용되는 용어 "컴포넌트", "유닛(또는 부)", "모듈", "시스템" 등은 컴퓨터-관련 엔티티, 하드웨어, 펌웨어, 소프트웨어, 소프트웨어 및 하드웨어의 조합, 또는 소프트웨어의 실행을 지칭할 수 있다. 예를 들어, 컴포넌트는 프로세서상에서 실행되는 처리과정, 프로세서, 객체, 실행 스레드, 프로그램, 및/또는 컴퓨터일 수 있지만, 이들로 제한되는 것은 아니다. 예를 들어, 컴퓨팅 장치에서 실행되는 애플리케이션 및 컴퓨팅 장치 모두 컴포넌트일 수 있다. 하나 이상의 컴포넌트는 프로세서 및/또는 실행 스레드 내에 상주할 수 있고, 일 컴포넌트는 하나의 컴퓨터 내에 로컬화될 수 있고, 또는 2개 이상의 컴퓨터들 사이에 분배될 수 있다. 또한, 이러한 컴포넌트들은 그 내부에 저장된 다양한 데이터 구조들을 갖는 다양한 컴퓨터 판독가능한 매체로부터 실행할 수 있다.
제시된 실시예들에 대한 설명은 임의의 본 발명의 기술 분야에서 통상의 지식을 가진 자가 본 발명을 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이며, 여기에 정의된 일반적인 원리들은 본 발명의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 발명은 여기에 제시된 실시예들로 한정되는 것이 아니라, 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.
(부호의 설명)
100: 사용자 단말기
200: 통신망
300: 금융 상품 추천 시스템
400: 컴퓨팅 장치
410: 프로세서
411: 데이터 수집부
412: 데이터 가공부
413: 데이터 학습부
414: 금융 상품 추천부
420: 저장 매체
422: 운영 시스템
424: 컴퓨터 프로그램
430: 메모리
440: 네트워크 인터페이스
450: 시스템 버스

Claims (12)

  1. 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템으로서,
    수집되는 금융 상담 데이터로부터 텍스트 데이터를 획득하도록 구성되는 데이터 수집부;
    설정된 종속변수에 대하여 상기 텍스트 데이터의 문장별로 독립변수의 대상이 되는 단어를 카운트하여 바이너리 데이터 세트를 구축하도록 구성되는 데이터 가공부;
    상기 바이너리 데이터 세트에 기초하여 회귀 분석을 수행함으로써 상기 종속변수에 대한 예측 함수를 결정하도록 구성되는 데이터 학습부; 및
    특정 사용자의 금융 상담 데이터에 대하여 상기 예측함수에 의해 결정되는 예측값에 기초하여 상기 종속변수와 연계된 금융 상품 정보를 상기 특정 사용자에게 제공할지 여부를 결정하도록 구성되는 금융 상품 추천부를 포함하는,
    금융 상품 추천 시스템.
  2. 제 1 항에 있어서,
    상기 독립변수의 대상이 되는 명사 단어는 설정된 유사 명사 그룹에 대한 대표 명사 단어이고, 상기 독립변수의 대상이 되는 동사 단어는 설정된 유사 동사 및 파생형 그룹에 대한 대표 동사 단어이며,
    상기 데이터 가공부는,
    상기 텍스트 데이터에 포함된 명사 단어를 해당 명사 단어가 속하는 유사 명사 그룹의 대표 명사 단어로서 카운트하고, 상기 텍스트 데이터에 포함된 동사 단어를 해당 동사 단어가 속하는 유사 동사 및 파생형 그룹의 대표 동사 단어로서 카운트하도록 구성되는,
    금융 상품 추천 시스템.
  3. 제 1 항에 있어서,
    상기 데이터 가공부는,
    상기 텍스트 데이터에 포함된 각각의 단어에 대하여 TF-IDF(Term Frequency-Inverse Document Frequency)를 이용하여 중요도를 계산하고, 계산된 단어의 중요도가 설정된 기준치 미만이면 해당 단어를 상기 독립변수의 대상이 되는 단어에서 제외하도록 구성되는,
    금융 상품 추천 시스템.
  4. 제 1 항에 있어서,
    상기 데이터 학습부는,
    상기 바이너리 데이터 세트에 대한 로지스틱 회귀 분석을 수행함으로써 각각의 독립변수의 가중치를 결정하고, 각각의 독립변수 및 해당 독립변수의 결정된 가중치에 의해 정의되는 1차함수로서 상기 종속변수에 대한 예측 함수를 결정하도록 구성되는,
    금융 상품 추천 시스템.
  5. 제 4 항에 있어서,
    상기 데이터 가공부는 미리 결정된 주기로 신규 수집된 금융 상담 데이터를 이용하여 신규 바이너리 데이터 세트를 구축하도록 구성되고,
    상기 데이터 학습부는,
    상기 미리 결정된 주기로 상기 신규 바이너리 데이터 세트가 더해진 전체 바이너리 데이터 세트에 대한 단계적(stepwise) 로지스틱 회귀 분석을 수행함으로써 독립변수의 조합 또는 독립변수의 가중치가 업데이트된 상기 종속변수에 대한 업데이트된 예측 함수를 결정하도록 구성되는,
    금융 상품 추천 시스템.
  6. 제 1 항에 있어서,
    상기 금융 상품 추천 시스템은 복수의 종속변수들을 정의하고, 각각의 종속변수는 특정 금융 이벤트에 대응하며,
    상기 데이터 가공부는 종속변수별로 상기 바이너리 데이터 세트를 구축하도록 구성되고, 상기 데이터 학습부는 종속변수별로 상기 예측함수를 결정하도록 구성되며,
    상기 금융 상품 추천부는,
    상기 특정 사용자의 금융 상담 데이터에 대하여 어떤 종속변수에 대한 예측함수에 의해 결정되는 예측값이 가장 높은지 결정하고, 가장 예측값이 높은 종속변수에 대응하는 금융 이벤트와 연계된 금융 상품 정보를 상기 특정 사용자로 제공할 것을 결정하도록 구성되는,
    금융 상품 추천 시스템.
  7. 컴퓨팅 장치에 의해 수행되는 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 방법으로서,
    수집되는 금융 상담 데이터로부터 텍스트 데이터를 획득하는 단계;
    설정된 종속변수에 대하여 상기 텍스트 데이터의 문장별로 독립변수의 대상이 되는 단어를 카운트하여 바이너리 데이터 세트를 구축하는 단계;
    상기 바이너리 데이터 세트에 기초하여 회귀 분석을 수행함으로써 상기 종속변수에 대한 예측 함수를 결정하는 단계; 및
    특정 사용자의 금융 상담 데이터에 대하여 상기 예측함수에 의해 결정되는 예측값에 기초하여 상기 종속변수와 연계된 금융 상품 정보를 상기 특정 사용자에게 제공할지 여부를 결정하는 단계를 포함하는,
    금융 상품 추천 방법.
  8. 제 7 항에 있어서,
    상기 바이너리 데이터 세트를 구축하는 단계는,
    상기 텍스트 데이터에 포함된 각각의 단어에 대하여 TF-IDF를 이용하여 중요도를 계산하는 단계; 및
    계산된 단어의 중요도가 설정된 기준치 미만이면 해당 단어를 상기 독립변수의 대상이 되는 단어에서 제외하는 단계를 포함하는,
    금융 상품 추천 방법.
  9. 제 7 항에 있어서,
    상기 종속변수에 대한 예측 함수를 결정하는 단계는,
    상기 바이너리 데이터 세트에 대한 로지스틱 회귀 분석을 수행함으로써 각각의 독립변수의 가중치를 결정하는 단계; 및
    각각의 독립변수 및 해당 독립변수의 결정된 가중치에 의해 정의되는 1차함수로서 상기 종속변수에 대한 예측 함수를 결정하는 단계를 포함하는,
    금융 상품 추천 방법.
  10. 제 9 항에 있어서,
    상기 바이너리 데이터 세트를 구축하는 단계는, 미리 결정된 주기로 신규 수집된 금융 상담 데이터를 이용하여 신규 바이너리 데이터 세트를 구축하는 단계를 더 포함하고,
    상기 종속변수에 대한 예측 함수를 결정하는 단계는, 상기 미리 결정된 주기로 상기 신규 바이너리 데이터 세트가 더해진 전체 바이너리 데이터 세트에 대한 단계적 로지스틱 회귀 분석을 수행함으로써 독립변수의 조합 또는 독립변수의 가중치가 업데이트된 상기 종속변수에 대한 업데이트된 예측 함수를 결정하는 단계를 더 포함하는,
    금융 상품 추천 방법.
  11. 제 7 항에 있어서,
    상기 설정된 종속변수는 복수의 종속변수들을 포함하고, 각각의 종속변수는 특정 금융 이벤트에 대응하며,
    상기 바이너리 데이터 세트를 구축하는 단계는 종속변수별로 상기 바이너리 데이터 세트를 구축하도록 수행되고, 상기 종속변수에 대한 예측 함수를 결정하는 단계는 종속변수별로 상기 예측함수를 결정하도록 수행되며,
    상기 종속변수와 연계된 금융 상품 정보를 상기 특정 사용자에게 제공할지 여부를 결정하는 단계는,
    상기 특정 사용자의 금융 상담 데이터에 대하여 어떤 종속변수에 대한 예측함수에 의해 결정되는 예측값이 가장 높은지 결정하는 단계; 및
    가장 예측값이 높은 종속변수에 대응하는 금융 이벤트와 연계된 금융 상품 정보를 상기 특정 사용자로 제공할 것을 결정하는 단계를 포함하는,
    금융 상품 추천 방법.
  12. 제 7 항 내지 제 11 항 중 어느 한 항에 따른 방법을 실행하기 위한 컴퓨터-실행가능 명령들을 포함하는, 컴퓨터 판독가능 매체에 저장된 컴퓨터 프로그램.
PCT/KR2022/018399 2022-11-21 2022-11-21 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 방법 WO2024111681A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/KR2022/018399 WO2024111681A1 (ko) 2022-11-21 2022-11-21 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/KR2022/018399 WO2024111681A1 (ko) 2022-11-21 2022-11-21 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 방법

Publications (1)

Publication Number Publication Date
WO2024111681A1 true WO2024111681A1 (ko) 2024-05-30

Family

ID=91196292

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/018399 WO2024111681A1 (ko) 2022-11-21 2022-11-21 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 방법

Country Status (1)

Country Link
WO (1) WO2024111681A1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050131794A1 (en) * 2003-12-15 2005-06-16 Lifson Kalman A. Stock portfolio and method
KR20170072644A (ko) * 2015-12-17 2017-06-27 중소기업은행 상담정보 및 군집화에 기반한 금융상품추천장치 및 방법
KR20180002944A (ko) * 2016-06-29 2018-01-09 한밭대학교 산학협력단 개인 선호별 최적의 상품 제안을 위한 빅데이터 추천시스템 및 추천방법
KR101913591B1 (ko) * 2017-08-25 2018-12-28 경희대학교 산학협력단 비정형 데이터를 정형화하여 금융상품을 추천하는 방법
KR20190017105A (ko) * 2017-08-10 2019-02-20 장윤식 보험 가입 희망자와 추천 보험 상품을 매칭시키는 방법
KR20230000461A (ko) * 2021-06-24 2023-01-02 주식회사 이노핀 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050131794A1 (en) * 2003-12-15 2005-06-16 Lifson Kalman A. Stock portfolio and method
KR20170072644A (ko) * 2015-12-17 2017-06-27 중소기업은행 상담정보 및 군집화에 기반한 금융상품추천장치 및 방법
KR20180002944A (ko) * 2016-06-29 2018-01-09 한밭대학교 산학협력단 개인 선호별 최적의 상품 제안을 위한 빅데이터 추천시스템 및 추천방법
KR20190017105A (ko) * 2017-08-10 2019-02-20 장윤식 보험 가입 희망자와 추천 보험 상품을 매칭시키는 방법
KR101913591B1 (ko) * 2017-08-25 2018-12-28 경희대학교 산학협력단 비정형 데이터를 정형화하여 금융상품을 추천하는 방법
KR20230000461A (ko) * 2021-06-24 2023-01-02 주식회사 이노핀 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 방법

Similar Documents

Publication Publication Date Title
US11232365B2 (en) Digital assistant platform
US20180107945A1 (en) Emoji recommendation method and device thereof
WO2020213843A1 (ko) 사용자 맞춤형 의료정보 제공 시스템 및 이의 구동방법
CN107436875A (zh) 文本分类方法及装置
Wang et al. Methods for correcting inference based on outcomes predicted by machine learning
CN110377740A (zh) 情感极性分析方法、装置、电子设备及存储介质
WO2021235617A1 (ko) 과학기술 지식정보 추천 시스템 및 그 방법
CN113722483B (zh) 话题分类方法、装置、设备及存储介质
CN108228808B (zh) 确定热点事件的方法、装置和存储介质以及电子设备
WO2021174788A1 (zh) 信息匹配分析方法、装置、计算机系统及可读存储介质
CN111177319A (zh) 风险事件的确定方法、装置、电子设备和存储介质
CN108416375A (zh) 工单分类方法及装置
CN107634947A (zh) 限制恶意登录或注册的方法和装置
CN110866119A (zh) 一种文章质量的确定方法、装置、电子设备及存储介质
CN109947934A (zh) 针对短文本的数据挖掘方法及系统
CN112017042A (zh) 基于tweedie分布的资源配额确定方法、装置和电子设备
Wang et al. Modeling medical services with mobile health applications
WO2019039659A1 (ko) 감성 기반의 사용자 관리 방법 및 이를 수행하는 장치들
KR102517147B1 (ko) 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 방법
CN107291835A (zh) 一种搜索词的推荐方法和装置
WO2024111681A1 (ko) 금융 상담 데이터에 대한 인공지능 학습을 통한 금융 상품 추천 시스템 및 방법
Biggers et al. A deep semantic matching approach for identifying relevant messages for social media analysis
CN111209403B (zh) 数据处理方法、装置、介质及电子设备
CN117747087A (zh) 问诊大模型的训练方法、基于大模型的问诊方法和装置
CN111582649B (zh) 基于用户app独热编码的风险评估方法、装置和电子设备

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22966542

Country of ref document: EP

Kind code of ref document: A1