KR20230116144A - Consultation text summary system - Google Patents

Consultation text summary system Download PDF

Info

Publication number
KR20230116144A
KR20230116144A KR1020220012530A KR20220012530A KR20230116144A KR 20230116144 A KR20230116144 A KR 20230116144A KR 1020220012530 A KR1020220012530 A KR 1020220012530A KR 20220012530 A KR20220012530 A KR 20220012530A KR 20230116144 A KR20230116144 A KR 20230116144A
Authority
KR
South Korea
Prior art keywords
sentence
counseling
sentences
text
processor
Prior art date
Application number
KR1020220012530A
Other languages
Korean (ko)
Inventor
김경징
이영한
손현곤
Original Assignee
주식회사 부뜰정보시스템
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 부뜰정보시스템 filed Critical 주식회사 부뜰정보시스템
Priority to KR1020220012530A priority Critical patent/KR20230116144A/en
Publication of KR20230116144A publication Critical patent/KR20230116144A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3335Syntactic pre-processing, e.g. stopword elimination, stemming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06Q50/30
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/50Business processes related to the communications industry
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Computing Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Computation (AREA)
  • Human Computer Interaction (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Machine Translation (AREA)

Abstract

본 발명에 따른 상담 원문 요약 시스템은 입력 인터페이스; 및 상담 어플리케이션 프로그램이 실행되어 상담 화면이 디스플레이에 표시되도록 제어하는 프로세서를 포함한다. 상기 프로세서는 제1 콜의 상담 문장 전체를 형태소 분석하여 도출된 각 키워드별 중요도 가중치를 계산하고, 상기 계산된 중요도 가중치를 각 문장에 대입하여 각 문장별 가중치를 계산하고, 상기 문장별 가중치가 높은 순서대로 문장들을 나열하고, 선택된 요약율에 따라 상기 문장들로부터 요약 문장들을 발췌하는 제1 방식 및 발화 시간순의 제2 방식으로 상기 요약 문장들을 구성할 수 있다.A consultation text summary system according to the present invention includes an input interface; and a processor that executes the counseling application program and controls the counseling screen to be displayed on the display. The processor calculates the importance weight for each keyword derived by morphologically analyzing the entire counseling sentence of the first call, calculates the weight for each sentence by substituting the calculated importance weight for each sentence, and calculates the weight for each sentence. The summary sentences may be configured in a first method of arranging sentences in order and extracting summary sentences from the sentences according to a selected summary rate, and in a second method in order of utterance time.

Description

상담 원문 요약 시스템{Consultation text summary system}Consultation text summary system}

본 발명은 상담사에 의해 상담 서비스를 제공하는 상담 시스템에 관한 발명이다. 보다 상세하게는 상담 원문 요약 방법 및 상담 원문 요약 시스템에 관한 발명이다. 본 발명은 2021년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임 (No.2021-0-00052, 컨택센터 상담 어시스턴트의 지능화 플랫폼 개발 및 사업화)The present invention relates to a counseling system for providing a counseling service by a counselor. More specifically, the invention relates to a method for summarizing a consultation text and a system for summarizing a consultation text. The present invention is a research conducted with the support of the Information and Communication Planning and Evaluation Institute with financial resources from the government (Ministry of Science and ICT) in 2021 (No.2021-0-00052, development and commercialization of an intelligent platform for contact center counseling assistants)

최근 4차 산업혁명으로 인해 인공지능, 로봇 등 첨단 기술 기반의 서비스들이 봇물 터지듯이 생겨나고 있다. 실제 인공지능이 할 수 있는 일들로 많이 회자되는 것으로 콜 센터 상담사의 업무를 대체하는 것까지 거론되고 있으며 영국 옥스퍼드대학의 연구에서 인공지능으로 사라질 업무 1위로 텔레마케팅 상담사가 선정되었다. Recently, services based on advanced technologies such as artificial intelligence and robots are emerging like a flood due to the 4th industrial revolution. In fact, many people talk about what artificial intelligence can do, and even replacing the work of call center counselors is being discussed.

또한, 전화 상담 이외에 다양한 상담채널이 생겨남으로서, 더 이상 콜센터라는 용어보다 컨택센터라는 용어가 더 자연스러운 시대가 되었다.In addition, as various counseling channels have emerged in addition to telephone counseling, the term contact center has become more natural than the term call center.

이와 관련하여, 상담사가 상담한 내용 및 상담 태도 등에 대한 상담 평가가 요구된다. 한편, 상담 종료 후 상담 내용을 요약하여 기재할 때도 긴 통화의 경우 기억에 의존하다보면 누락되는 내용들이 많이 발생할 수 있다. 이러한 문제를 해결하기 위해, 본 발명에서는 상담사에게 리마인드 용도로 중요 문장만 추출하여 제공할 수 있다. 또는 상담 관리자가 상담 내용을 확인해야 되는 경우에도 중요 문장만 요약 제공하여 상담 내용 탐색 시간을 경감할 수 있다. In this regard, it is required to evaluate counseling on the content and counseling attitude of the counselor. On the other hand, even when summarizing and writing the contents of consultation after the end of consultation, in the case of a long call, many contents may be omitted if reliance on memory. In order to solve this problem, in the present invention, only important sentences can be extracted and provided to counselors for reminder purposes. Alternatively, even when the consultation manager needs to check the consultation contents, only important sentences are summarized so that the consultation contents search time can be reduced.

기존의 상담 평가 방법과 관련하여, 전날 녹음된 상담 내용을 평가하여 다음 날에 전날 수행하였던 상담 평가가 제시되는 경우 상담 중에 잘못된 상담 내용을 바로잡거나 또는 상담 태도를 바로잡는 것이 어렵다는 문제점이 있다. Regarding the existing counseling evaluation method, when the counseling evaluation performed the previous day is presented the next day after evaluating the counseling content recorded the previous day, there is a problem in that it is difficult to correct the wrong counseling content or correct the counseling attitude during counseling.

따라서 본 발명에서는 콜 종료가 된 바로 즉시 실시간 상담 평가 결과를 제시하기 위한 것이다. 또한, 본 발명에서는 문장, 문단, 또는 상담 내용 단위로 해당 단위가 종료가 된 바로 즉시 실시간 상담 평가 결과를 제시하기 위한 것이다.Therefore, in the present invention, the real-time counseling evaluation result is presented immediately after the call is terminated. In addition, in the present invention, real-time counseling evaluation results are presented immediately after the end of the corresponding unit in units of sentences, paragraphs, or consultation contents.

따라서 본 발명의 목적은 상담 원문 요약 방법 및 상담 원문 요약 시스템을 제공하기 위한 것이다.Accordingly, an object of the present invention is to provide a method for summarizing a consultation text and a system for summarizing a consultation text.

또한, 본 발명의 목적은 콜 종료가 된 바로 즉시 실시간 상담 평가 결과를 제시하기 위한 것이다. In addition, an object of the present invention is to present real-time counseling evaluation results immediately after a call is terminated.

또한, 본 발명의 목적은 문장, 문단, 또는 상담 내용 단위로 해당 단위가 종료가 된 바로 즉시 실시간 상담 평가 결과를 제시하기 위한 것이다.In addition, an object of the present invention is to present real-time counseling evaluation results immediately after the end of a corresponding unit in units of sentences, paragraphs, or counseling contents.

본 발명에 따른 상담 원문 요약 시스템은 마이크로폰을 통해 실시간 대화를 획득하도록 구성된 입력 인터페이스 및 상기 입력 인터페이스와 동작 가능하게 결합되고, 상담 어플리케이션 프로그램이 실행되어 상담 화면이 디스플레이에 표시되도록 제어하는 프로세서를 포함한다. 상기 프로세서는 제1 콜의 상담 문장 전체를 형태소 분석하여 도출된 각 키워드별 중요도 가중치를 계산하고, 상기 계산된 중요도 가중치를 각 문장에 대입하여 각 문장별 가중치를 계산하고, 상기 문장별 가중치가 높은 순서대로 문장들을 나열하고, 선택된 요약율에 따라 상기 문장들로부터 요약 문장들을 발췌하는 제1 방식 및 발화 시간순의 제2 방식으로 상기 요약 문장들을 구성할 수 있다. A consultation text summary system according to the present invention includes an input interface configured to acquire real-time conversation through a microphone and a processor operatively coupled to the input interface and controlling a consultation screen to be displayed on a display by executing a consultation application program. . The processor calculates the importance weight for each keyword derived by morphologically analyzing the entire counseling sentence of the first call, calculates the weight for each sentence by substituting the calculated importance weight for each sentence, and calculates the weight for each sentence. The summary sentences may be configured in a first method of arranging sentences in order and extracting summary sentences from the sentences according to a selected summary rate, and in a second method in order of utterance time.

일 실시 예에 따르면, 상기 프로세서는 STT 엔진으로부터 콜 종료 신호를 수신하면, 상기 상담 문장 전체에 대해 묵음 구간 인식, 종결 어미 인식 및 호응어 제거를 통해 각 문장의 종결문에 기초하여 전처리 파싱을 수행하고, 화자 별로 문장 단위 분리 및 문장 재구성을 수행하고, 상기 재구성된 문장에 대하여 형태소 분석, 명사 단위 추출 및 불용어 필터링을 통해 자연어 처리를 수행할 수 있다. According to an embodiment, upon receiving a call termination signal from the STT engine, the processor performs preprocessing and parsing on the entire counseling sentence based on the closing sentence of each sentence through recognizing the silent section, recognizing the ending sentence, and removing the corresponding word. Sentence unit separation and sentence reconstruction are performed for each speaker, and natural language processing may be performed on the reconstructed sentence through morpheme analysis, noun unit extraction, and stopword filtering.

일 실시 예에 따르면, 상기 프로세서는 상기 자연어 처리에 따라 상기 재구성된 문장을 명사 단위로 분류하고, 고객 질문과 연관된 발화 문장에 가중치를 부여하고, TF-IDF(Term Frequency-Inverse Document Frequency)에 기초하여 상기 재구성된 문장 내에서 상기 명사 단위의 특정 단어의 가중치를 계산할 수 있다.According to an embodiment, the processor classifies the reconstructed sentence into noun units according to the natural language processing, assigns a weight to a spoken sentence associated with a customer question, and based on term frequency-inverse document frequency (TF-IDF) Thus, it is possible to calculate the weight of a specific word in the noun unit within the reconstructed sentence.

일 실시 예에 따르면, 상기 프로세서는 상기 재구성된 문장에 대해 상기 특정 단어의 가중치와 연관된 문장-단어 행렬(Sentence-Term Matrix)을 생성하고, 상기 생성된 문장-단어 행렬에 따라 상관 행렬 기반 그래프를 생성할 수 있다.According to an embodiment, the processor generates a sentence-term matrix associated with the weight of the specific word for the reconstructed sentence, and constructs a correlation matrix-based graph according to the generated sentence-word matrix. can create

일 실시 예에 따르면, 상기 프로세서는 텍스트 랭크(Text Rank) 알고리즘에 따라 상기 문장별 가중치가 높은 순서대로 문장들을 나열하고, 선택된 요약율에 따라 상기 문장들로부터 요약 문장들을 발췌하는 제1 방식 및 발화 시간순의 제2 방식으로 문서의 요약 문장들을 구성할 수 있다.According to an embodiment, the processor lists the sentences in the order of the highest weight for each sentence according to a text rank algorithm, and extracts summarized sentences from the sentences according to a selected summary rate. A first method and utterance Summary sentences of the document may be constructed in a second manner in chronological order.

일 실시 예에 따르면, 상기 프로세서는 상기 요약 문장들에 따라 수행된 상담 문장 전체에 대한 콜 단위의 최종 평가 결과를 상기 상담 어플리케이션 프로그램의 API를 통해 반환하고, 상기 디스플레이에 상기 콜 단위의 최종 평가 결과와 상기 요약 문장들을 표시하도록 상기 상담 어플리케이션 프로그램을 제어할 수 있다.According to an embodiment, the processor returns the final evaluation result of the call unit for all counseling sentences performed according to the summary sentences through the API of the consultation application program, and displays the final evaluation result of the call unit on the display. And the counseling application program may be controlled to display the summary sentences.

일 실시 예에 따르면, 상기 프로세서는 키워드 패턴 기반 분석 모듈을 이용하여 형태소 분석, 키워드 분석, 자연어 처리 및 속성 분류를 수행하여, 상기 콜 단위의 최종 평가 결과와 상기 요약 문장들을 구성할 수 있다.According to an embodiment, the processor may configure the final evaluation result of the call unit and the summary sentences by performing morpheme analysis, keyword analysis, natural language processing, and attribute classification using a keyword pattern-based analysis module.

일 실시 예에 따르면, 상기 프로세서는 상기 키워드 패턴 기반 분석 모듈에서 출력되는 정보에 기초하여 상담 원문 요약을 수행하고, 상기 상담 원문 요약을 수행 시, AI 기반 분석 모듈 및 매칭율 분석 모듈과 연동되지 않고, 딥러닝 모듈은 텍스트 랭크(Text Rank) 알고리즘에 따라 상기 문장별 가중치가 높은 순서대로 문장들을 나열하는 경우에만 연동될 수 있다.According to an embodiment, the processor performs a summary of the original consultation text based on the information output from the keyword pattern-based analysis module, and when performing the summary of the original consultation text, the processor does not interwork with the AI-based analysis module and the matching rate analysis module. , The deep learning module can be interlocked only when the sentences are arranged in the order of the highest weight for each sentence according to the Text Rank algorithm.

본 발명의 실시예에 따르면, 상담 원문 요약 방법 및 상담 원문 요약 시스템을 인공 지능(AI) 기반으로 제공할 수 있다. According to an embodiment of the present invention, a method for summarizing a consultation text and a system for summarizing a consultation text may be provided based on artificial intelligence (AI).

또한, 본 발명의 실시예에 따르면, 문장별 가중치가 높은 순서대로 나열하여, 해당 문장을 정의된 요약율에 따라서 발췌하는 방식으로 실시간 상담 평가 결과를 제시할 수 있다. In addition, according to an embodiment of the present invention, real-time counseling evaluation results may be presented in a manner in which the sentences are listed in the order of highest weight and the corresponding sentences are extracted according to a defined summary rate.

도 1은 본 발명의 실시예에 따른 상담 원문 요약 시스템의 구성도이다.
도 2는 본 발명의 실시예에 따른 상담 원문 요약 시스템의 상세 구성도이다.
도 3은 본 발명에 따른 상담 원문 요약 시스템에서 수행되는 상담 원문 요약 방법의 흐름도를 나타낸다.
도 4는 본 발명에 따른 상담 원문 요약 시스템의 기술적 차별점의 개념도와 이를 구현하기 위한 일부 구성을 나타낸 것이다.
도 5는 본 발명에 따른 상담 원문 요약 시스템에서 상담 원문 요약을 위한 상세 모델 및 모듈 구성을 나타낸다.
도 6a 내지 도 6c는 본 발명에 따른 상담 원문 요약 시스템의 차별화되는 기술적 특징들과 관련된 구성들을 나타낸다.
1 is a block diagram of a consultation text summary system according to an embodiment of the present invention.
2 is a detailed configuration diagram of a consultation text summary system according to an embodiment of the present invention.
3 is a flowchart of a method for summarizing a consultation text performed in the consultation text summary system according to the present invention.
4 shows a conceptual diagram of technical differences of the counseling text summary system according to the present invention and some configurations for implementing the same.
5 shows a detailed model and module configuration for summarizing a counseling text in the counseling text summary system according to the present invention.
6a to 6c show configurations related to differentiated technical features of the consultation text summary system according to the present invention.

본 명세서에 개시되어 있는 본 발명의 개념에 따른 실시 예들에 대해서 특정한 구조적 또는 기능적 설명들은 단지 본 발명의 개념에 따른 실시 예들을 설명하기 위한 목적으로 예시된 것으로서, 본 발명의 개념에 따른 실시 예들은 다양한 형태들로 실시될 수 있으며 본 명세서에 설명된 실시 예들에 한정되지 않는다.Specific structural or functional descriptions of the embodiments according to the concept of the present invention disclosed in this specification are only illustrated for the purpose of explaining the embodiments according to the concept of the present invention, and the embodiments according to the concept of the present invention It can be embodied in various forms and is not limited to the embodiments described herein.

본 발명의 개념에 따른 실시 예들은 다양한 변경들을 가할 수 있고 여러 가지 형태들을 가질 수 있으므로 실시 예들을 도면에 예시하고 본 명세서에서 상세하게 설명하고자 한다. 그러나 이는 본 발명의 개념에 따른 실시 예들을 특정한 개시 형태들에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물, 또는 대체물을 포함한다.Embodiments according to the concept of the present invention can apply various changes and have various forms, so the embodiments are illustrated in the drawings and described in detail in this specification. However, this is not intended to limit the embodiments according to the concept of the present invention to specific disclosure forms, and includes all changes, equivalents, or substitutes included in the spirit and technical scope of the present invention.

제1 또는 제2 등의 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만, 예컨대 본 발명의 개념에 따른 권리 범위로부터 벗어나지 않은 채, 제1 구성 요소는 제2 구성 요소로 명명될 수 있고 유사하게 제2 구성 요소는 제1 구성 요소로도 명명될 수 있다.Terms such as first or second may be used to describe various components, but the components should not be limited by the terms. The above terms are used only for the purpose of distinguishing one component from another, e.g. without departing from the scope of rights according to the concept of the present invention, a first component may be termed a second component and similarly a second component may be termed a second component. A component may also be referred to as a first component.

어떤 구성 요소가 다른 구성 요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성 요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성 요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성 요소가 다른 구성 요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는 중간에 다른 구성 요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성 요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.It is understood that when an element is referred to as being "connected" or "connected" to another element, it may be directly connected or connected to the other element, but other elements may exist in the middle. It should be. On the other hand, when a component is referred to as “directly connected” or “directly connected” to another component, it should be understood that no other component exists in the middle. Other expressions describing the relationship between components, such as "between" and "directly between" or "adjacent to" and "directly adjacent to", etc., should be interpreted similarly.

본 명세서에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로서, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 본 명세서에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Terms used in this specification are used only to describe specific embodiments, and are not intended to limit the present invention. Singular expressions include plural expressions unless the context clearly dictates otherwise. In this specification, terms such as "comprise" or "having" are intended to indicate that there is a feature, number, step, operation, component, part, or combination thereof described in this specification, but one or more other features It should be understood that it does not preclude the possibility of the presence or addition of numbers, steps, operations, components, parts, or combinations thereof.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which the present invention belongs. Terms such as those defined in commonly used dictionaries should be interpreted as having a meaning consistent with the meaning in the context of the related art, and unless explicitly defined in this specification, it should not be interpreted in an ideal or excessively formal meaning. don't

이하, 본 명세서에 첨부된 도면들을 참조하여 본 발명의 실시 예들을 상세히 설명한다. 그러나 특허출원의 범위가 이러한 실시 예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. However, the scope of the patent application is not limited or limited by these examples. Like reference numerals in each figure indicate like elements.

도 1은 본 발명의 실시예에 따른 상담 원문 요약 시스템의 구성도이다. 도 1에 도시된 바와 같이 본 발명의 실시예에 따른 상담 원문 요약 시스템은 고객 단말(100), 서버(200) 및 상담사 컴퓨터(300) 및 통신 네트워크(400)로 이루어진 시스템이다. 통신 네트워크(400)는 고객 단말(100)과 상담사 컴퓨터(300)를 통신가능하게 연결하는 유선 및/또는 무선 통신 네트워크일 수 있다. 또한, 통신 네트워크(400)는 고객 단말(100)과 서버(200) 또는 서버(200)와 상담사 컴퓨터(300)를 통신가능하게 연결하는 유선 및/또는 무선 통신 네트워크일 수 있다. 1 is a block diagram of a consultation text summary system according to an embodiment of the present invention. As shown in FIG. 1 , the counseling text summary system according to an embodiment of the present invention is a system composed of a customer terminal 100 , a server 200 , a counselor computer 300 and a communication network 400 . The communication network 400 may be a wired and/or wireless communication network that communicatively connects the customer terminal 100 and the counselor computer 300 . In addition, the communication network 400 may be a wired and/or wireless communication network that communicatively connects the customer terminal 100 and the server 200 or the server 200 and the counselor computer 300 .

한편, 본 발명에 따른 상담 원문 요약 시스템이 구현된 상담사 컴퓨터(300)는 프로세서(330)가 STT 엔진(540)으로부터 콜 종료 신호를 수신하면 해당 콜 원문에 대한 요약문을 생성하는 것을 특징으로 한다. 이를 위해, 프로세서(330)는 STT 엔진(540)과 연동하여 콜 종료 시 상담 원문을 수신하여 화자별 문장 단위 분리 및 문장 재구성을 통해 문서 요약문을 생성하고 콜 단위 최종 평가를 수행한다. 또한, 상담 어플리케이션 프로그램(600)은 프로세서(330)와 연동하여 콜 단위 최종 평가를 수신할 수 있다. 이러한 일련의 절차에 대해서는 도 3에서 상세히 설명한다.Meanwhile, when the processor 330 receives a call termination signal from the STT engine 540, the counselor computer 300 implemented with the counseling text summary system according to the present invention generates a summary text for the corresponding call text. To this end, the processor 330 interworks with the STT engine 540 to receive the original counseling text when the call is terminated, generate a document summary through sentence-by-sentence separation and sentence reconstruction, and perform final evaluation on a call-by-call basis. In addition, the counseling application program 600 may receive a final evaluation for each call in association with the processor 330 . This series of procedures will be described in detail in FIG. 3 .

한편, 도 2는 본 발명의 실시예에 따른 상담 원문 요약 시스템의 상세 구성도이다.Meanwhile, FIG. 2 is a detailed configuration diagram of a consultation text summary system according to an embodiment of the present invention.

도 1 및 도 2를 참조하면, 상담사 컴퓨터(300)는 통신부(310), 입력 인터페이스(320), 프로세서(330), 디스플레이(340) 및 메모리(350)를 포함하도록 구성될 수 있다. 서버(200)는 복수의 고객 단말(100) 및 상담사 컴퓨터(300)와 동작 가능하게 결합되고, 복수의 서버로 구성될 수 있다.1 and 2, the counselor computer 300 may be configured to include a communication unit 310, an input interface 320, a processor 330, a display 340 and a memory 350. The server 200 is operably coupled with a plurality of customer terminals 100 and counselor computers 300 and may be composed of a plurality of servers.

통신부(310)는 복수의 고객 단말(100) 및 서버(200)와 통신 가능하게 결합되도록 구성될 수 있고, 유선 및/또는 무선 통신 네트워크로 구현될 수 있다. 입력 인터페이스(320)는 마이크로폰(321)을 통해 상담사 및/또는 고객의 실시간 대화를 획득하도록 구성될 수 있다. 입력 인터페이스(320)는 이에 한정되지 않고 상담사 컴퓨터(300)를 제어할 수 있는 다른 입력 수단들, 예컨대 키보드 및 마우스를 더 포함할 수도 있다.The communication unit 310 may be configured to be communicatively coupled with a plurality of customer terminals 100 and the server 200, and may be implemented as a wired and/or wireless communication network. The input interface 320 may be configured to acquire real-time conversations of the counselor and/or the customer through the microphone 321 . The input interface 320 is not limited thereto and may further include other input means capable of controlling the counselor computer 300, such as a keyboard and a mouse.

프로세서(330)는 입력 인터페이스(320)와 동작 가능하게 결합될 수 있다. 프로세서(330)는 상담 어플리케이션 프로그램이 실행되어 상담 화면이 디스플레이(340)에 표시되도록 제어할 수 있다. 메모리(350)는 상담 관련 정보를 저장하고 상담 어플리케이션 프로그램이 실행 시 해당 정보를 액세스하도록 구성될 수 있다.Processor 330 may be operably coupled with input interface 320 . The processor 330 may control a counseling application program to be executed so that the counseling screen is displayed on the display 340 . The memory 350 may be configured to store counseling-related information and to access the information when a counseling application program is executed.

본 발명에 따른 상담 원문 요약 시스템은 상담 진행 중 발화 문장과 관련된 상담 내용을 KMS (Knowledge Management Service) 시스템과 연동하여 평가할 수 있다. 이와 관련하여, 본 발명에서는 상담 종료 후 상담 내용 전체를 확인하는 시간을 단축하기 위해 중요한 대화 내용만 제공할 수 있다. The counseling text summary system according to the present invention can evaluate the counseling content related to the spoken sentence during the counseling process in conjunction with the KMS (Knowledge Management Service) system. In this regard, in the present invention, only important conversation contents may be provided in order to reduce the time required to check the entire contents of consultation after the end of consultation.

한편, 상담사가 상담 종료 후 상담 내용을 요약하여 기재할 때도 긴 통화의 경우 기억에 의존하다보면 누락되는 내용들이 많이 발생할 수 있다. 이러한 문제를 해결하기 위해, 상담사에게 리마인드 용도로 중요 문장만 추출하여 제공할 수 있다. On the other hand, even when the counselor summarizes and writes the counseling contents after the end of the consultation, in the case of a long call, many contents may be omitted if the counselor relies on memory. To solve this problem, only important sentences may be extracted and provided to the counselor for reminder purposes.

또한 상담 관리자가 상담 내용을 확인해야 되는 경우에도 중요 문장만 요약 제공하여 상담 내용 탐색 시간을 경감할 수 있다. In addition, even when the consultation manager needs to check the consultation contents, only the important sentences are summarized so that the consultation contents search time can be reduced.

본 발명에 따른 상담 원문 요약 시스템의 구현은 다음과 같이 구현될 수 있다. 1콜의 상담 문장 전체를 형태소 분석하고, 이를 통해 도출된 각 키워드별 중요도 가중치를 계산할 수 있다. 키워드 가중치가 계산되면 이를 다시 문장에 대입하여 각 문장별 가중치를 계산할 수 있다. 문장별 가중치가 높은 순서대로 나열하여, 해당 문장을 정의된 요약율에 따라서 발췌하는 방식(예. 원문이 100줄이고, 요약율 50%를 사용자가 선택하면 중요도가 높은 문장 순(1차 정렬), 발화 시간순(2차 정렬)으로 50줄의 대화 문장만 남게 된다. Implementation of the consultation text summary system according to the present invention can be implemented as follows. It is possible to analyze the morpheme of the entire counseling sentence of one call and calculate the importance weight for each keyword derived through this. After the keyword weight is calculated, the weight for each sentence can be calculated by substituting it into the sentence again. A method in which sentences are listed in the order of high weight for each sentence, and the sentences are extracted according to the defined summary rate (e.g., if the original text is 100 lines and the summary rate is 50%, the order of the most important sentences (primary sort), Only 50 dialogue sentences remain in chronological order of speech (secondary sorting).

구체적으로, 본 발명에는 1콜의 상담 문장 전체가 입력되면, 키워드 및 문장 가중치 계산이 이루어져, 사용자 선택에 따른 최종 요약 문장 제공이 출력된다. 이와 관련하여, 일 예시로 사용자 선택 요약율은 50%, 70%, 5줄 요약 등일 수 있다. Specifically, in the present invention, when an entire counseling sentence for one call is input, keywords and sentence weights are calculated, and a final summary sentence is provided according to the user's selection. In this regard, as an example, the user-selected summary rate may be 50%, 70%, or 5-line summary.

전술한 본 발명의 개념 및 구현 방법과 관련하여, 본 발명의 상담 원문 요약 시스템은 도 3과 같이 구성될 수 있다. 이와 관련하여, 도 3은 본 발명에 따른 상담 원문 요약 시스템에서 수행되는 상담 원문 요약 방법의 흐름도를 나타낸다.In relation to the concept and implementation method of the present invention described above, the counseling text summary system of the present invention may be configured as shown in FIG. 3 . In this regard, FIG. 3 shows a flow chart of a method for summarizing a consultation text performed in the system for summarizing a consultation text according to the present invention.

도 2 및 도 3을 참조하면, STT 엔진(540)과 연동하는 프로세서(330)는 상담 어플리케이션 프로그램(600)이 구동되어 NLP Pre-Processing, TextRank 분석 결합을 수행할 수 있다. 구체적으로, 프로세서(330)는 해당 콜 상담 원문의 일괄 요청, 문장 종결문 전처리 파싱 및 화자별 문장 단위 분리/재구성을 수행할 수 있다. Referring to FIGS. 2 and 3 , the processor 330 interworking with the STT engine 540 may run the counseling application program 600 to perform NLP Pre-Processing and TextRank analysis combination. Specifically, the processor 330 may perform a batch request of the original call counseling text, pre-processing and parsing of sentence ending sentences, and separation/reconstruction of sentence units for each speaker.

이후, 프로세서(330)는 자연어 처리(NLP)와 연관된 전처리, 분류/고객 질문 발화 문장 가중치 계산, TF-IDF(Term Frequency-Inverse Document Frequency) 키워드 가중치 계산 및 문장-단어 행렬 생성을 수행할 수 있다. TF-IDF는 정보 검색과 텍스트 마이닝에서 이용하는 가중치로, 여러 문서로 이루어진 문서군이 있을 때 어떤 단어가 특정 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치를 나타낸다.Thereafter, the processor 330 may perform preprocessing associated with natural language processing (NLP), classification/customer question utterance sentence weight calculation, term frequency-inverse document frequency (TF-IDF) keyword weight calculation, and sentence-word matrix generation. . TF-IDF is a weight used in information retrieval and text mining, and represents a statistical value that indicates how important a word is in a specific document when there is a document group consisting of several documents.

이후, 프로세서(330)는 상관 행렬(correlation matrix) 기반 그래프 생성, 텍스트 랭크(TextRank) 알고리즘 적용, 문서 요약문 생성 및 콜 단위 최종 평가 결과 반환을 API를 통해 상담 어플리케이션 프로그램(600)으로 전달할 수 있다. 한편, 전술한 동작들을 수행하는 프로세서(330)는 상담 어플리케이션 프로그램(600)에 의해 구동되거나 또는 상담 원문 요약을 수행하는 별도의 소프트웨어 모듈, 예컨대 도 5의 키워드 패턴 기반 분석 모듈(630)일 수 있다. Thereafter, the processor 330 may transfer the creation of a graph based on a correlation matrix, the application of the TextRank algorithm, the generation of a document summary, and the return of the final evaluation result in each call to the counseling application program 600 through an API. Meanwhile, the processor 330 performing the aforementioned operations may be driven by the counseling application program 600 or may be a separate software module that performs a summary of the counseling text, for example, the keyword pattern-based analysis module 630 of FIG. 5 . .

전술한 기술적 특징들을 참조하여 본 발명에 따른 상담 원문 요약 시스템에 대해 설명한다. 상담 원문 요약 시스템은 마이크로폰을 통해 실시간 대화를 획득하도록 구성된 입력 인터페이스(320)를 포함할 수 있다. 상담 원문 요약 시스템은 인터페이스(320)와 동작 가능하게 결합되는 프로세서(330)를 포함할 수 있다. 프로세서(330)는 상담 어플리케이션 프로그램(600)이 실행되어 상담 화면이 디스플레이(340)에 표시되도록 제어할 수 있다.Referring to the technical features described above, the counseling text summary system according to the present invention will be described. The text summary system may include an input interface 320 configured to acquire real-time conversation via a microphone. The consultation text summary system may include a processor 330 operatively coupled to an interface 320 . The processor 330 may control the counseling application program 600 to be executed so that the counseling screen is displayed on the display 340 .

프로세서(330)는 제1 콜의 상담 문장 전체를 형태소 분석하여 도출된 각 키워드별 중요도 가중치를 계산할 수 있다. 프로세서(330)는 상기 계산된 중요도 가중치를 각 문장에 대입하여 각 문장별 가중치를 계산할 수 있다. 프로세서(330)는 상기 문장별 가중치가 높은 순서대로 문장들을 나열하고, 선택된 요약율에 따라 상기 문장들로부터 요약 문장들을 발췌하는 제1 방식 및 발화 시간순의 제2 방식으로 상기 요약 문장들을 구성할 수 있다. The processor 330 may calculate an importance weight for each keyword derived by morphologically analyzing the entire counseling sentence of the first call. The processor 330 may calculate a weight for each sentence by substituting the calculated importance weight for each sentence. The processor 330 may configure the summary sentences in a first method of arranging the sentences in the order of the sentence-specific weight and extracting summary sentences from the sentences according to the selected summary rate and in a second method in order of utterance time. there is.

프로세서(330)는 STT 엔진(540)으로부터 콜 종료 신호를 수신하면, 상기 상담 문장 전체에 대해 묵음 구간 인식, 종결 어미 인식 및 호응어 제거를 통해 각 문장의 종결문에 기초하여 전처리 파싱을 수행할 수 있다. 프로세서(330)는 화자 별로 문장 단위 분리 및 문장 재구성을 수행하고, 상기 재구성된 문장에 대하여 형태소 분석, 명사 단위 추출 및 불용어 필터링을 통해 자연어 처리를 수행할 수 있다. When the processor 330 receives the call termination signal from the STT engine 540, the processor 330 performs preprocessing and parsing on the entire counseling sentence based on the closing sentence of each sentence through recognizing the silent section, recognizing the final sentence, and removing the corresponding word. can The processor 330 may perform sentence unit separation and sentence reconstruction for each speaker, and perform natural language processing on the reconstructed sentence through morpheme analysis, noun unit extraction, and stopword filtering.

프로세서(330)는 자연어 처리에 따라 상기 재구성된 문장을 명사 단위로 분류하고, 고객 질문과 연관된 발화 문장에 가중치를 부여할 수 있다. 프로세서(330)는 TF-IDF(Term Frequency-Inverse Document Frequency)에 기초하여 상기 재구성된 문장 내에서 상기 명사 단위의 특정 단어의 가중치를 계산할 수 있다.The processor 330 may classify the reconstructed sentences into noun units according to natural language processing and assign weights to spoken sentences associated with customer questions. The processor 330 may calculate a weight of a specific word in the noun unit within the reconstructed sentence based on term frequency-inverse document frequency (TF-IDF).

프로세서(330)는 상기 재구성된 문장에 대해 상기 특정 단어의 가중치와 연관된 문장-단어 행렬(Sentence-Term Matrix)을 생성할 수 있다. 프로세서(330)는 상기 생성된 문장-단어 행렬에 따라 상관 행렬 기반 그래프를 생성할 수 있다.The processor 330 may generate a sentence-term matrix associated with the weight of the specific word for the reconstructed sentence. The processor 330 may generate a correlation matrix-based graph according to the generated sentence-word matrix.

프로세서(330)는 텍스트 랭크(Text Rank) 알고리즘에 따라 상기 문장별 가중치가 높은 순서대로 문장들을 나열할 수 있다. 프로세서(330)는 선택된 요약율에 따라 상기 문장들로부터 요약 문장들을 발췌하는 제1 방식 및 발화 시간순의 제2 방식으로 문서의 요약 문장들을 구성할 수 있다. 선택된 요약율은 어플리케이션에서 사전 정의된 값이거나 또는 사용자에 의해 입력되도록 구성될 수 있다.The processor 330 may list the sentences in the order of the highest weight for each sentence according to a text rank algorithm. The processor 330 may compose summary sentences of the document in a first method of extracting summary sentences from the sentences according to the selected summary rate and in a second method in order of utterance times. The selected summary rate may be a predefined value in the application or configured to be input by the user.

프로세서(330)는 요약 문장들에 따라 수행된 상담 문장 전체에 대한 콜 단위의 최종 평가 결과를 상담 어플리케이션 프로그램(600)의 API를 통해 반환할 수 있다. 프로세서(330)는 디스플레이(340)에 상기 콜 단위의 최종 평가 결과와 상기 요약 문장들을 표시하도록 상담 어플리케이션 프로그램(600)을 제어할 수 있다. The processor 330 may return the final evaluation result of each call for all counseling sentences performed according to the summary sentences through the API of the counseling application program 600 . The processor 330 may control the counseling application program 600 to display the final evaluation result of the call unit and the summary sentences on the display 340 .

프로세서(330)는 키워드 패턴 기반 분석 모듈을 이용하여 형태소 분석, 키워드 분석, 자연어 처리 및 속성 분류를 수행하여, 상기 콜 단위의 최종 평가 결과와 상기 요약 문장들을 구성할 수 있다. The processor 330 may configure the final evaluation result of the call unit and the summary sentences by performing morpheme analysis, keyword analysis, natural language processing, and attribute classification using a keyword pattern-based analysis module.

본 발명에 따른 상담 원문 요약 시스템에 의해 수행되는 상담 원문 요약 방법은 일정 수준 이상의 만족도와 일정 수준 이상의 응답 성능을 목표로 할 수 있다. 이와 관련하여, 도 4는 본 발명에 따른 상담 원문 요약 시스템의 기술적 차별점의 개념도와 이를 구현하기 위한 일부 구성을 나타낸 것이다. 도 4를 참조하면, 본 발명에 따른 상담 원문 요약 방법의 만족도는 정성 평가를 통해 검증될 수 있고, 응답 성능은 1초 이내를 목표로 할 수 있지만, 이에 한정되는 것은 아니고 응용에 따라 변경할 수 있다.The method of summarizing the consultation text performed by the system for summarizing the consultation text according to the present invention may aim at a certain level of satisfaction or a certain level of response performance. In this regard, FIG. 4 shows a conceptual diagram of technical differences of the counseling text summary system according to the present invention and some configurations for implementing the same. Referring to FIG. 4, the satisfaction of the method for summarizing the original text according to the present invention can be verified through qualitative evaluation, and the response performance can be aimed at within 1 second, but is not limited thereto and can be changed according to the application. .

한편, 본 발명에 따른 상담 원문 요약 방법은 단순히 TestRank 문장 가중치 기반 축약에 한정되는 것은 아니다. 따라서 본 발명에 따른 상담 원문 요약 방법은 필터링 Ruleset 및 분절 문장 결합 등의 사전처리(PreProcessing) 후 TextRank 결합 등을 통해 이루어질 수 있다. Meanwhile, the method for summarizing the original text according to the present invention is not simply limited to the TestRank sentence weight-based reduction. Therefore, the counseling text summary method according to the present invention can be performed through TextRank combination after preprocessing such as filtering ruleset and segmented sentence combination.

이를 위해, 본 발명에서는 화자별 문장 단위 분리 및 문장 재구성이 이루어진 상태에서 자연어 전처리(NLP)(S310)를 수행할 수 있다. 이후, 분류/고객 질문 발화 문장 가중치 계산(S320), TF-IDF(Term Frequency-Inverse Document Frequency) 키워드 가중치 계산(S330) 및 문장-단어 행렬 생성(S340)이 수행될 수 있다. TF-IDF는 정보 검색과 텍스트 마이닝에서 이용하는 가중치로, 여러 문서로 이루어진 문서군이 있을 때 어떤 단어가 특정 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치를 나타낸다.To this end, in the present invention, natural language pre-processing (NLP) (S310) can be performed in a state in which sentence unit separation and sentence reconstruction have been performed for each speaker. Subsequently, classification/customer question utterance sentence weight calculation (S320), TF-IDF (Term Frequency-Inverse Document Frequency) keyword weight calculation (S330), and sentence-word matrix generation (S340) may be performed. TF-IDF is a weight used in information retrieval and text mining, and represents a statistical value that indicates how important a word is in a specific document when there is a document group consisting of several documents.

이후, 상관 행렬(correlation matrix) 기반 그래프 생성(S350), 텍스트 랭크(TextRank) 알고리즘 적용(S360), 문서 요약문 생성(S370) 및 콜 단위 최종 평가 결과 반환(S380)이 수행될 수 있다. 이러한 일련의 과정들을 통해 본 발명에서는 상담 원문 요약 시스템을 통해 상담 원문 요약 방법이 수행될 수 있다.Thereafter, generation of a graph based on a correlation matrix (S350), application of a TextRank algorithm (S360), generation of a document summary (S370), and return of final evaluation results in units of calls (S380) may be performed. Through these series of processes, in the present invention, the counseling text summary method can be performed through the counseling text summary system.

전술한 기술적 특징들을 참조하여 본 발명에 따른 상담 원문 요약 시스템에 대해 설명한다. 상담 원문 요약 시스템은 마이크로폰을 통해 실시간 대화를 획득하도록 구성된 입력 인터페이스(320)를 포함할 수 있다. 상담 원문 요약 시스템은 인터페이스(320)와 동작 가능하게 결합되는 프로세서(330)를 포함할 수 있다. 프로세서(330)는 상담 어플리케이션 프로그램(600)이 실행되어 상담 화면이 디스플레이(340)에 표시되도록 제어할 수 있다.Referring to the technical features described above, the counseling text summary system according to the present invention will be described. The text summary system may include an input interface 320 configured to acquire real-time conversation via a microphone. The consultation text summary system may include a processor 330 operatively coupled to an interface 320 . The processor 330 may control the counseling application program 600 to be executed so that the counseling screen is displayed on the display 340 .

한편, 본 발명에 따른 STT 엔진(540) 및 상담 어플리케이션 프로그램(600)을 포함하여 다양한 모듈들이 상담 원문 요약을 위해 구현될 수 있다. 이와 관련하여, 도 5는 본 발명에 따른 상담 원문 요약 시스템에서 상담 원문 요약을 위한 상세 모델 및 모듈 구성을 나타낸다.Meanwhile, various modules including the STT engine 540 and the counseling application program 600 according to the present invention may be implemented for summarizing the counseling text. In this regard, FIG. 5 shows a detailed model and module configuration for summarizing a counseling text in the counseling text summary system according to the present invention.

도 2 내지 도 5를 참조하면, 상담 어플리케이션 프로그램(600)이 프로세서(330)에 의해 구동되면, 상담 어플리케이션 프로그램(600)은 다음과 같이 계층화될 수 있다. 다른 예로, 상담 어플리케이션 프로그램(600)이 서버(200)에서 구현될 수도 있다.2 to 5 , when the counseling application program 600 is driven by the processor 330, the counseling application program 600 may be layered as follows. As another example, the counseling application program 600 may be implemented in the server 200 .

상담 어플리케이션 프로그램(600)은 입력 인터페이스(610), 학습/평가 모델(620), 키워드 패턴 기반 분석 모듈(630), AI 기반 분석 모듈(640) 및 실시간 처리/연동 모듈(650)을 포함하도록 구성될 수 있다. 키워드 패턴 기반 분석 모듈(630)은 KMP 매칭율 분석 모듈(631)을 포함하거나 또는 매칭율 분석 모듈(631)이 키워드 패턴 기반 분석 모듈(630)과 별도로 구성될 수 있다. AI 기반 분석 모듈(640)은 딥러닝 모듈(641)을 포함하거나 또는 딥러닝 모듈(641)이 AI 기반 분석 모듈(640)과 별도로 구성될 수 있다.The counseling application program 600 is configured to include an input interface 610, a learning/evaluation model 620, a keyword pattern-based analysis module 630, an AI-based analysis module 640, and a real-time processing/interworking module 650. It can be. The keyword pattern-based analysis module 630 may include the KMP matching rate analysis module 631 or the matching rate analysis module 631 may be configured separately from the keyword pattern-based analysis module 630 . The AI-based analysis module 640 may include the deep learning module 641 or the deep learning module 641 may be configured separately from the AI-based analysis module 640 .

입력 인터페이스(610)는 상담 원문, 어플리케이션 메타데이터, KMS 관련 데이터 및 관리자 정의 데이터를 획득하도록 구성될 수 있다. 학습/평가 모델(620)은 KMS 학습 모델로 지칭될 수 있다. 학습/평가 모델(620)은 지식 데이터를 학습하는 지식 데이터 학습 모델(621)을 포함할 수 있다. 학습/평가 모델(620)은 상담 원문을 분류하여 학습하는 분류 데이터 학습 모델(622) 및 스크립트와 평가 기준 모델을 포함하는 상담 평가 모델(623)을 포함하도록 구성될 수 있다.The input interface 610 may be configured to obtain consultation text, application metadata, KMS-related data, and administrator-defined data. The learning/evaluation model 620 may be referred to as a KMS learning model. The learning/evaluation model 620 may include a knowledge data learning model 621 that learns knowledge data. The learning/evaluation model 620 may be configured to include a classification data learning model 622 that classifies and learns original counseling texts and a counseling evaluation model 623 including a script and an evaluation criterion model.

프로세서(330)는 지식 데이터 학습 모델(621)을 이용하여 발화 문장의 형태소 분석, 키워드 분석, 자연어 처리 및 속성 분류를 수행하는 키워드 패턴 기반 분석을 수행할 수 있다. 프로세서(330)는 지식 데이터 학습 모델(621)을 이용하여 발화 문장의 워드 임베딩, 유사도 분석, 세부 튜닝을 통해 소정 범위 내에서 유사한 지식 컨텐츠가 추천되도록 제어할 수 있다. 이를 위해, 프로세서(330)는 AI 기반 분석 모듈(640)과 연동될 수 있다.The processor 330 may perform keyword pattern-based analysis for performing morphological analysis, keyword analysis, natural language processing, and attribute classification of spoken sentences using the knowledge data learning model 621 . The processor 330 may control similar knowledge contents to be recommended within a predetermined range through word embedding of spoken sentences, similarity analysis, and detailed tuning using the knowledge data learning model 621 . To this end, the processor 330 may interwork with the AI-based analysis module 640.

이와 관련하여, 상담 원문 요약 시스템과 연관된 KMP (Knowledge Management Platform)는 지식 데이터를 학습하는 지식 데이터 학습 모델(621)을 포함할 수 있다. KMP는 상담 원문을 분류하여 학습하는 분류 데이터 학습 모델(622) 및 스크립트와 평가 기준 모델을 포함하는 상담 평가 모델(623)을 포함하도록 구성될 수 있다.In this regard, a knowledge management platform (KMP) associated with the consultation text summary system may include a knowledge data learning model 621 for learning knowledge data. The KMP may be configured to include a classification data learning model 622 that classifies and learns counseling texts and a counseling evaluation model 623 including a script and an evaluation criterion model.

프로세서(330)는 키워드 패턴 기반 분석 모듈(630)을 이용하여 형태소 분석, 키워드 분석, 자연어 처리 및 속성 분류를 수행하여, 상기 콜 단위의 최종 평가 결과와 상기 요약 문장들을 구성할 수 있다.The processor 330 may perform morpheme analysis, keyword analysis, natural language processing, and attribute classification using the keyword pattern-based analysis module 630 to construct the final evaluation result of the call unit and the summary sentences.

프로세서(330)는 키워드 패턴 기반 분석 모듈(630)에서 출력되는 정보에 기초하여 상담 원문 요약을 수행할 수 있다. 상담 원문 요약을 수행 시, AI 기반 분석 모듈(640) 및 매칭율 분석 모듈(631)과 연동되지 않도록 구현될 수 있다. 이에 따라, 키워드 패턴 기반 분석 모듈(630)을 통해 상담 원문 요약을 수행하면서 동시에 AI 기반 분석 모듈(640) 및 매칭율 분석 모듈(631)을 통해 다른 서비스, 예컨대 지식 컨텐츠 추천, 실시간 상담 평가 또는 상담 유형 분류가 가능하다. 딥러닝 모듈(641)은 텍스트 랭크(Text Rank) 알고리즘에 따라 상기 문장별 가중치가 높은 순서대로 문장들을 나열하는 경우에만 프로세서(330)와 연동될 수 있다.The processor 330 may perform a summary of the consultation text based on the information output from the keyword pattern-based analysis module 630 . When performing the summary of the consultation text, it may be implemented so as not to interwork with the AI-based analysis module 640 and the matching rate analysis module 631. Accordingly, while performing a summary of the consultation text through the keyword pattern-based analysis module 630, at the same time through the AI-based analysis module 640 and the matching rate analysis module 631, other services, such as knowledge content recommendation, real-time consultation evaluation or consultation type can be classified. The deep learning module 641 may interwork with the processor 330 only when the sentences are arranged in the order of the sentence-specific weight according to a text rank algorithm.

따라서 본 발명에 따른 상담 원문 요약 시스템에 의한 상담 원문 요약 방법은 1)+5)+8)의 조합에 의해 수행될 수 있지만, 이에 한정되는 것은 아니다. Accordingly, the method of summarizing the consultation text by the system for summarizing the consultation text according to the present invention may be performed by a combination of 1) + 5) + 8), but is not limited thereto.

한편, 프로세서(330)는 AI 분석 엔진의 차별화 기술 적용을 통한 상담 원문 요약의 정확도를 보장할 수 있다. On the other hand, the processor 330 may ensure the accuracy of the consultation text summary through the application of the AI analysis engine's differentiation technology.

도 6a는 BERT + GPT 혼합 모델을 적용하는 구성을 나타낸 것이다. 도 6b는 문어체 데이터의 변환 구성과 토큰화 시 바이트 페어 인코딩과 형태소 분석의 결합을 위한 구성을 나타낸 것이다. 도 6c는 자유 발화 특성을 고려한 스트링 매칭 개선 알고리즘을 적용한 구성을 나타낸 것이다. 이를 위해, 상담 원문요약 알고리즘 내 문장 탐색 스크린(screen) 영역이 정의되고 이에 따라 자유 발화 특성을 고려한 스트링 매칭 개선 알고리즘이 구현될 수 있다.6A shows a configuration applying a BERT + GPT mixed model. 6B shows a configuration for combining byte pair encoding and morpheme analysis during conversion and tokenization of written language data. 6C shows a configuration to which a string matching improvement algorithm considering free speech characteristics is applied. To this end, a sentence search screen area within the counseling text summary algorithm is defined, and accordingly, a string matching improvement algorithm considering free speech characteristics may be implemented.

도 2 내지 도 6a를 참조하면, 프로세서(330)는 KMP와 연관된 매칭율 분석 모델을 이용하여 상기 KMP에서 정의된 필수 상담 항목과 연관된 키워드 패턴에 따라 매칭율을 분석할 수 있다. 프로세서(330)는 BERT(Bidirectional Encoder Representations from Transformers) 방식을 통해 획득된 가중치를 GPT (Generative Pre-trained Transformer) 방식에 적용할 수 있다. 프로세서(330)는 상담 내용과 연관된 각 문장에 대한 디코딩을 수행하여, 형태소 분석, 키워드 분석, 자연어 처리 및 속성 분류를 수행할 수 있다. 한편, BERT + GPT 혼합 모델을 적용 시, 상담 원문 또는 상담 원문의 특징 키워드는 STT 엔진(540)을 통해 수집된 상담사에 의해 발화된 원문일 수 있다. 따라서 본 발명에 따른 상담 원문 요약 방법은 AI 엔진 등에 의한 AI 처리 없이도 사전 모델 패턴 스트링과의 매칭을 통해 이루어질 수 있는 것이 원칙이다. Referring to FIGS. 2 to 6A , the processor 330 may analyze a matching rate according to a keyword pattern associated with essential counseling items defined in the KMP using a matching rate analysis model associated with the KMP. The processor 330 may apply the weight obtained through the Bidirectional Encoder Representations from Transformers (BERT) method to the Generative Pre-trained Transformer (GPT) method. The processor 330 may perform decoding on each sentence associated with the counseling contents, morpheme analysis, keyword analysis, natural language processing, and attribute classification. Meanwhile, when the BERT + GPT mixed model is applied, the original counseling text or the feature keyword of the original counseling text may be the original text collected by the STT engine 540 and uttered by the counselor. Therefore, in principle, the counseling text summary method according to the present invention can be performed through matching with a dictionary model pattern string without AI processing by an AI engine or the like.

BERT + GPT 혼합 모델을 적용하는 구성을 통해 상담 내용과 연관된 각 문장에 대한 디코딩을 수행하여, 형태소 분석, 키워드 분석, 자연어 처리 및 속성 분류 시, 상담 원문 요약의 정확도 개선과 속도 개선이 가능하다. Through the configuration of applying the BERT + GPT mixed model, it is possible to improve the accuracy and speed of the original text summary during morpheme analysis, keyword analysis, natural language processing, and attribute classification by performing decoding on each sentence related to the counseling content.

도 3 내지 도 5 및 도 6b를 참조하면, AI 모델 학습 엔진(510)은 상담 원문 문어체 데이터를 구어체 데이터로 데이터 인코딩할 수 있다. 또한, AI 모델 학습 엔진(510)은 인코딩된 상담 원문 데이터를 이미 훈련된 언어 모델을 이용하여 용어 확장 학습을 수행할 수 있다. 이와 관련하여, 본 발명에 따른 상담 원문 요약 방법을 수행 시 구어체 DATA는 STT 엔진(540)을 통해 수집된 상담사에 의해 발화된 원문일 수 있다. 따라서 본 발명에 따른 상담 원문 요약 방법은 AI 엔진 등에 의한 AI 처리 없이도 사전 모델 패턴 스트링과의 매칭을 통해 이루어질 수 있는 것이 원칙이다. Referring to FIGS. 3 to 5 and 6B , the AI model learning engine 510 may data-encode written data of the counseling text into colloquial data. In addition, the AI model learning engine 510 may perform term expansion learning using a language model that has already been trained on the encoded counseling text data. In this regard, when performing the method of summarizing the counseling text according to the present invention, colloquial data may be the original text collected by the counselor through the STT engine 540. Therefore, in principle, the counseling text summary method according to the present invention can be performed through matching with a dictionary model pattern string without AI processing by an AI engine or the like.

하지만, STT 엔진(540)으로부터 수집된 구어체를 상담 원문 문어체와의 용어 학습 및 특징 키워드 추출을 위해 AI 엔진이 활용될 수도 있다.However, the AI engine may be used to learn terms and extract feature keywords from the colloquial speech collected from the STT engine 540 with the original consultation text.

한편, 상담 원문 데이터에서 특징 키워드를 추출하여 AI 학습을 수행하는 과정은 AI 모델 학습 엔진(510) 및 분류/분석 모델(530)에 의해 수행되거나 또는 ruleset 모델(520) 및 분류/분석 모델(530)에 의해 수행될 수 있다. 키워드 추출 기반 AI 학습이 ruleset 모델(520) 및 분류/분석 모델(530)에 의해 수행되는 것에 대해 설명하면 다음과 같다. 이와 관련하여, ruleset 모델(520)을 통해 상담 원문 데이터에서 특징 키워드를 추출할 수 있다. 토큰 속성 추출을 위한 형태소 사전의 2차 탐색이 이루어질 수 있다. Ruleset 모델(520)을 통해 추출된 특징 키워드는 분류/분석 모델(530)에 기반하여 AI 학습이 수행될 수 있다. 이와 관련하여, 특징 키워드는 AI 모델 및 사전(dictionary) 모델에 개별 저장될 수 있다.Meanwhile, the process of performing AI learning by extracting feature keywords from the original text data is performed by the AI model learning engine 510 and the classification/analysis model 530, or the ruleset model 520 and the classification/analysis model 530 ) can be performed by Keyword extraction-based AI learning performed by the ruleset model 520 and the classification/analysis model 530 will be described as follows. In this regard, feature keywords may be extracted from original counseling text data through the ruleset model 520 . A secondary search of a morpheme dictionary for token attribute extraction may be performed. AI learning may be performed on the feature keywords extracted through the ruleset model 520 based on the classification/analysis model 530. In this regard, feature keywords may be separately stored in an AI model and a dictionary model.

도 6c를 참조하면, 본 발명에 따른 상담 원문 요약 방법은 상담 원문의 원문 스트링과 사전(dictionary) 모델에 저장된 패턴 스트링을 각 단계별로 매칭 구간을 달리하여 비교할 수 있다. 이와 관련하여 상담 원문 스트링은 STT 엔진(540)을 통해 수집된 상담사에 의해 발화된 원문이다. 따라서 본 발명에 따른 상담 원문 요약 방법은 AI 엔진 등에 의한 AI 처리 없이도 사전 모델 패턴 스트링과의 매칭을 통해 이루어질 수 있다. 패턴 스트링을 각 단계별로 매칭 구간을 달리하여 비교하는 것은 자유 발화 특성을 고려한 스트링 매칭 개선 알고리즘이 적용된 것이다. Referring to FIG. 6C , in the method of summarizing the original counseling text according to the present invention, the original text string of the counseling text and the pattern string stored in the dictionary model can be compared with different matching intervals for each stage. In this regard, the original counseling text string is the original text uttered by the counselor collected through the STT engine 540. Therefore, the counseling text summary method according to the present invention can be performed through matching with a dictionary model pattern string without AI processing by an AI engine or the like. The comparison of pattern strings with different matching intervals for each stage is applied with a string matching improvement algorithm considering free speech characteristics.

자유 발화 특성을 고려하여, 제1 단계(S100) 내지 제3 단계(S300)에서 상담 원문 스트링(S1 내지 S3)의 스트링 열은 일정 간격만큼 천이(shift)되게 구성될 수 있다. 다시 말해, 제1 단계(S100)의 제1 상담 원문 스트링(S1) 내지 제3 단계(S300)의 제3 상담 원문 스트링(S3)은 동일한 상담 문장을 일정 시간 간격만큼 천이시킨 형태이다. 일 예로, 제2 단계(S200)의 제2 상담 원문 스트링(S2)은 제1 단계(S100)의 제1 상담 원문 스트링(S1)을 특정 문자 간격, 예컨대 2문자 간격만큼 천이시킨 형태일 수 있다. 한편, 제3 단계(S300)의 제3 상담 원문 스트링(S3)은 제2 단계(S200)의 제2 상담 원문 스트링(S2)을 한 문자 간격 이내, 예컨대 0.5문자 간격만큼 천이시킨 형태일 수 있다. In consideration of free speech characteristics, the string columns of the original counseling text strings (S1 to S3) in the first step (S100) to the third step (S300) may be configured to be shifted by a predetermined interval. In other words, the first consultation text string (S1) of the first step (S100) to the third consultation text string (S3) of the third step (S300) are transitions of the same counseling sentence at a predetermined time interval. For example, the second counseling original text string S2 of the second step S200 may be obtained by shifting the first counseling original text string S1 of the first step S100 by a specific character interval, for example, a two-character interval. . Meanwhile, the third consultation original text string S3 of the third step S300 may be in the form of shifting the second consultation original text string S2 of the second step S200 within one character interval, for example, by a 0.5 character interval. .

제1 상담 원문 스트링(S1) 내지 제3 상담 원문 스트링(S3)의 제1 매칭 구간(M1) 내지 제3 매칭 구간(M3)을 서로 달리하여 상담 원문 요약 알고리즘 내 문장 탐색 스크린 영역이 서로 다르게 정의되어 구현될 수 있다. 일 예로, 제1 상담 원문 스트링(S1)의 제1 매칭 구간(M1)과 제2 상담 원문 스트링(S2)의 제2 매칭 구간(M2)은 상호 중첩되지 않게 구성되어, 상담 원문의 주요 문장이 발화되는 위치 탐색을 수행할 수 있다. 제2 상담 원문 스트링(S2)의 제2 매칭 구간(M2)과 제3 상담 원문 스트링(S3)의 제2 매칭 구간(M3)은 일부 중첩되게 구성되어, 상담 원문의 주요 문장이 발화되는 위치 탐색을 세부적으로 수행하고 패턴 일치 여부를 상세하게 검사할 수 있다. Sentence search screen areas within the counseling text summary algorithm are defined differently by differentiating the first matching section (M1) to the third matching section (M3) of the first counseling text string (S1) to the third counseling text string (S3) and can be implemented. For example, the first matching section M1 of the first counseling text string S1 and the second matching section M2 of the second counseling text string S2 are configured not to overlap each other, so that the main sentence of the counseling text is It is possible to search for a location where the ignition is fired. The second matching section (M2) of the second counseling text string (S2) and the second matching section (M3) of the third counseling text string (S3) are configured to partially overlap, so that the main sentence of the counseling text is uttered. and check pattern matching in detail.

이상에서는 본 발명에 따른 상담 원문 요약 방법 및 상담 원문 요약 시스템에 대해 살펴보았다. 본 발명에 따른 상담 원문 요약 방법 및 상담 원문 요약 시스템의 기술적 효과에 대해 살펴보면 다음과 같다.In the above, the counseling text summary method and the counseling text summary system according to the present invention have been reviewed. The technical effects of the consultation text summary method and the consultation text summary system according to the present invention are as follows.

본 발명의 실시예에 따르면, 상담 원문 요약 방법 및 상담 원문 요약 시스템을 인공 지능(AI) 기반으로 제공할 수 있다. According to an embodiment of the present invention, a method for summarizing a consultation text and a system for summarizing a consultation text may be provided based on artificial intelligence (AI).

또한, 본 발명의 실시예에 따르면, 콜의 상담 문장 전체를 형태소 분석하고, 이를 통해 도출된 각 키워드별 중요도 가중치를 계산할 수 있다. In addition, according to an embodiment of the present invention, it is possible to morpheme-analyze the entire counseling sentence of a call and calculate an importance weight for each keyword derived through the morpheme analysis.

상술한 본 발명의 특징 및 효과는 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. The features and effects of the present invention described above will become more apparent through the following detailed description in conjunction with the accompanying drawings, and accordingly, those skilled in the art to which the present invention belongs can easily practice the technical idea of the present invention. You will be able to.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시 예를 가질 수 있는바, 특정 실시 예들을 도면에 예시하고 상세한 설명에 구체적으로 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.Since the present invention can make various changes and have various embodiments, specific embodiments will be illustrated in the drawings and described in detail in the detailed description. However, this is not intended to limit the present invention to specific embodiments, and should be understood to include all modifications, equivalents, or substitutes included in the spirit and technical scope of the present invention.

소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능뿐만 아니라 각각의 구성 요소들에 대한 설계 및 파라미터 최적화는 별도의 소프트웨어 모듈로도 구현될 수 있다. 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션으로 소프트웨어 코드가 구현될 수 있다. 상기 소프트웨어 코드는 메모리에 저장되고, 제어부(controller) 또는 프로세서(processor)에 의해 실행될 수 있다.According to the software implementation, not only the procedures and functions described in this specification, but also the design and parameter optimization of each component may be implemented as a separate software module. The software code may be implemented as a software application written in any suitable programming language. The software code may be stored in a memory and executed by a controller or processor.

100: 고객 단말
200: 서버
300: 상담사 컴퓨터
310: 통신부
320: 입력 인터페이스
330: 프로세서
340: 디스플레이
350: 메모리
400: 통신 네트워크
540: STT 엔진
600: 상담 어플리케이션 프로그램
610: 입력 인터페이스
620: 학습/평가 모델
621: 지식 데이터 학습 모델
622: 분류 데이터 학습 모델
623: 상담 평가 모델
630: 키워드 패턴 기반 분석 모듈
640: AI 기반 분석 모듈
650: 실시간 처리/연동 모듈
100: customer terminal
200: server
300: counselor computer
310: communication department
320: input interface
330: processor
340: display
350: memory
400: communication network
540: STT engine
600: counseling application program
610: input interface
620: learning/evaluation model
621: knowledge data learning model
622: classification data learning model
623: consultation evaluation model
630: keyword pattern based analysis module
640: AI-based analysis module
650: real-time processing / interlocking module

Claims (8)

상담 원문 요약 시스템에서,
마이크로폰을 통해 실시간 대화를 획득하도록 구성된 입력 인터페이스; 및
상기 입력 인터페이스와 동작 가능하게 결합되고, 상담 어플리케이션 프로그램이 실행되어 상담 화면이 디스플레이에 표시되도록 제어하는 프로세서를 포함하고,
상기 프로세서는,
제1 콜의 상담 문장 전체를 형태소 분석하여 도출된 각 키워드별 중요도 가중치를 계산하고,
상기 계산된 중요도 가중치를 각 문장에 대입하여 각 문장별 가중치를 계산하고,
상기 문장별 가중치가 높은 순서대로 문장들을 나열하고, 선택된 요약율에 따라 상기 문장들로부터 요약 문장들을 발췌하는 제1 방식 및 발화 시간순의 제2 방식으로 상기 요약 문장들을 구성하는, 상담 원문 요약 시스템.
In the full text summary system,
an input interface configured to acquire a real-time conversation through a microphone; and
a processor operably coupled to the input interface and controlling a counseling application program to be executed and displayed on a display;
the processor,
Calculate the importance weight for each keyword derived by morphologically analyzing the entire counseling sentence of the first call,
Calculate the weight for each sentence by substituting the calculated importance weight for each sentence;
The counseling text summary system configures the summary sentences in a first method of arranging the sentences in the order of the highest weight for each sentence and extracting summary sentences from the sentences according to the selected summary rate and in a second method in order of utterance time.
제1항에 있어서,
상기 프로세서는,
STT 엔진으로부터 콜 종료 신호를 수신하면, 상기 상담 문장 전체에 대해 묵음 구간 인식, 종결 어미 인식 및 호응어 제거를 통해 각 문장의 종결문에 기초하여 전처리 파싱을 수행하고,
화자 별로 문장 단위 분리 및 문장 재구성을 수행하고,
상기 재구성된 문장에 대하여 형태소 분석, 명사 단위 추출 및 불용어 필터링을 통해 자연어 처리를 수행하는, 상담 원문 요약 시스템.
According to claim 1,
the processor,
When a call termination signal is received from the STT engine, pre-parsing is performed on the entire counseling sentence based on the closing sentence of each sentence through recognizing the silent section, recognizing the final ending, and removing the corresponding word,
Sentence unit separation and sentence reconstruction are performed for each speaker,
The counseling text summary system for performing natural language processing on the reconstructed sentence through morpheme analysis, noun unit extraction, and stopword filtering.
제2항에 있어서,
상기 프로세서는,
상기 자연어 처리에 따라 상기 재구성된 문장을 명사 단위로 분류하고, 고객 질문과 연관된 발화 문장에 가중치를 부여하고,
TF-IDF(Term Frequency-Inverse Document Frequency)에 기초하여 상기 재구성된 문장 내에서 상기 명사 단위의 특정 단어의 가중치를 계산하는, 상담 원문 요약 시스템.
According to claim 2,
the processor,
Classifying the reconstructed sentences into noun units according to the natural language processing, assigning weights to uttered sentences related to customer questions,
Based on TF-IDF (Term Frequency-Inverse Document Frequency), the counseling text summary system calculates the weight of the specific word of the noun unit within the reconstructed sentence.
제3항에 있어서,
상기 프로세서는,
상기 재구성된 문장에 대해 상기 특정 단어의 가중치와 연관된 문장-단어 행렬(Sentence-Term Matrix)을 생성하고,
상기 생성된 문장-단어 행렬에 따라 상관 행렬 기반 그래프를 생성하는, 상담 원문 요약 시스템.
According to claim 3,
the processor,
For the reconstructed sentence, a sentence-term matrix associated with the weight of the specific word is generated;
A counseling text summary system for generating a correlation matrix-based graph according to the generated sentence-word matrix.
제4항에 있어서,
상기 프로세서는,
텍스트 랭크(Text Rank) 알고리즘에 따라 상기 문장별 가중치가 높은 순서대로 문장들을 나열하고,
선택된 요약율에 따라 상기 문장들로부터 요약 문장들을 발췌하는 제1 방식 및 발화 시간순의 제2 방식으로 문서의 요약 문장들을 구성하는, 상담 원문 요약 시스템.
According to claim 4,
the processor,
Sentences are arranged in the order of highest weight for each sentence according to a text rank algorithm;
A system for compiling summary sentences of a document in a first method of extracting summary sentences from the sentences according to a selected summary rate and in a second method in order of utterance time.
제5항에 있어서,
상기 프로세서는,
상기 요약 문장들에 따라 수행된 상담 문장 전체에 대한 콜 단위의 최종 평가 결과를 상기 상담 어플리케이션 프로그램의 API를 통해 반환하고,
상기 디스플레이에 상기 콜 단위의 최종 평가 결과와 상기 요약 문장들을 표시하도록 상기 상담 어플리케이션 프로그램을 제어하는, 상담 원문 요약 시스템.
According to claim 5,
the processor,
Returning the final evaluation result of each call for all counseling sentences performed according to the summary sentences through the API of the counseling application program,
and controlling the counseling application program to display the final evaluation result of the call unit and the summary sentences on the display.
제6항에 있어서,
상기 프로세서는,
키워드 패턴 기반 분석 모듈을 이용하여 형태소 분석, 키워드 분석, 자연어 처리 및 속성 분류를 수행하여, 상기 콜 단위의 최종 평가 결과와 상기 요약 문장들을 구성하는, 상담 원문 요약 시스템.
According to claim 6,
the processor,
A counseling text summary system that configures the final evaluation result of the call unit and the summary sentences by performing morpheme analysis, keyword analysis, natural language processing, and attribute classification using a keyword pattern-based analysis module.
제7항에 있어서,
상기 프로세서는,
상기 키워드 패턴 기반 분석 모듈에서 출력되는 정보에 기초하여 상담 원문 요약을 수행하고,
상기 상담 원문 요약을 수행 시, AI 기반 분석 모듈 및 매칭율 분석 모듈과 연동되지 않고, 딥러닝 모듈은 텍스트 랭크(Text Rank) 알고리즘에 따라 상기 문장별 가중치가 높은 순서대로 문장들을 나열하는 경우에만 연동되는 것을 특징으로 하는, 상담 원문 요약 시스템.
According to claim 7,
the processor,
Performing a summary of the consultation text based on the information output from the keyword pattern-based analysis module;
When performing the summary of the counseling text, the AI-based analysis module and the matching rate analysis module are not interlocked, and the deep learning module interlocks only when the sentences are listed in the order of high weight for each sentence according to the Text Rank algorithm Characterized in that, the consultation text summary system.
KR1020220012530A 2022-01-27 2022-01-27 Consultation text summary system KR20230116144A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220012530A KR20230116144A (en) 2022-01-27 2022-01-27 Consultation text summary system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220012530A KR20230116144A (en) 2022-01-27 2022-01-27 Consultation text summary system

Publications (1)

Publication Number Publication Date
KR20230116144A true KR20230116144A (en) 2023-08-04

Family

ID=87568702

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220012530A KR20230116144A (en) 2022-01-27 2022-01-27 Consultation text summary system

Country Status (1)

Country Link
KR (1) KR20230116144A (en)

Similar Documents

Publication Publication Date Title
US11615799B2 (en) Automated meeting minutes generator
US11676067B2 (en) System and method for creating data to train a conversational bot
CN113255755B (en) Multi-modal emotion classification method based on heterogeneous fusion network
CN108388425B (en) Method for automatically completing codes based on LSTM
CN108711420A (en) Multilingual hybrid model foundation, data capture method and device, electronic equipment
CN112270379A (en) Training method of classification model, sample classification method, device and equipment
CN106407178A (en) Session abstract generation method and device
CN114580382A (en) Text error correction method and device
CN112084334B (en) Label classification method and device for corpus, computer equipment and storage medium
JP7290861B2 (en) Answer classifier and expression generator for question answering system and computer program for training the expression generator
CN111651996A (en) Abstract generation method and device, electronic equipment and storage medium
KR20200119410A (en) System and Method for Recognizing Emotions from Korean Dialogues based on Global and Local Contextual Information
CN111695338A (en) Interview content refining method, device, equipment and medium based on artificial intelligence
US8315874B2 (en) Voice user interface authoring tool
CN113178193A (en) Chinese self-defined awakening and Internet of things interaction method based on intelligent voice chip
CN114722832A (en) Abstract extraction method, device, equipment and storage medium
CN113627194A (en) Information extraction method and device, and communication message classification method and device
KR20230116145A (en) Counseling system that performs query analysis
US11989514B2 (en) Identifying high effort statements for call center summaries
KR20230116143A (en) Counseling Type Classification System
WO2022085533A1 (en) Text classifier for answer identification, background knowledge expression generator, training device therefor, and computer program
KR20230116144A (en) Consultation text summary system
CN111090720B (en) Hot word adding method and device
Ribeiro et al. Automatic recognition of the general-purpose communicative functions defined by the ISO 24617-2 standard for dialog act annotation
KR20230116141A (en) Knowledge content-based consulting system

Legal Events

Date Code Title Description
E902 Notification of reason for refusal