KR102260219B1 - Voice recognition automatic response system with a function to identify the vocal intention of the customer's voice and method thereof - Google Patents

Voice recognition automatic response system with a function to identify the vocal intention of the customer's voice and method thereof Download PDF

Info

Publication number
KR102260219B1
KR102260219B1 KR1020210000732A KR20210000732A KR102260219B1 KR 102260219 B1 KR102260219 B1 KR 102260219B1 KR 1020210000732 A KR1020210000732 A KR 1020210000732A KR 20210000732 A KR20210000732 A KR 20210000732A KR 102260219 B1 KR102260219 B1 KR 102260219B1
Authority
KR
South Korea
Prior art keywords
voice
customer
utterance
unit
scenario
Prior art date
Application number
KR1020210000732A
Other languages
Korean (ko)
Inventor
이현국
박도현
Original Assignee
주식회사 예스피치
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 예스피치 filed Critical 주식회사 예스피치
Application granted granted Critical
Publication of KR102260219B1 publication Critical patent/KR102260219B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5166Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

The present invention relates to a voice recognition automatic response system and method, and more specifically, to a voice recognition automatic response system and a method having a function to identify intention of a customer's voice, which interrupt a guidance voice being provided according to a state of the utterance, incoming from a customer terminal, which is the intention of the utterance, or retransmit the guidance voice to the customer terminal from an interrupted portion, or provide the guidance voice of a service item of a scenario corresponding to the utterance to the customer terminal.

Description

고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동 응답 시스템 및 방법{Voice recognition automatic response system with a function to identify the vocal intention of the customer's voice and method thereof}A voice recognition automatic response system with a function to identify the vocal intention of the customer's voice and method thereof

본 발명은 음성인식 자동 응답 시스템 및 방법에 관한 것으로, 더욱 상세하게는 시나리오에 따른 안내 음성이 제공되던 중에 고객 단말기 측에서 인입되는 발화음의 상태, 즉 발화음의 의도에 따라 상기 제공 중인 안내 음성을 중단하거나, 상기 중단된 부분부터 안내 음성을 상기 고객 단말기로 재전송하거나, 상기 고객 단말기로 상기 발화음에 대응하는 시나리오의 서비스 항목의 안내 음성을 제공하는 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동 응답 시스템 및 방법에 관한 것이다.The present invention relates to a voice recognition automatic response system and method, and more particularly, the guidance voice being provided according to the state of the utterance sound coming from the customer terminal side while the guidance voice according to the scenario is being provided, that is, the intention of the utterance sound. Speech recognition having a function of identifying the intention of a customer's voice for interrupting, retransmitting a guidance voice from the interrupted part to the customer terminal, or providing a guidance voice for a service item of a scenario corresponding to the utterance to the customer terminal It relates to an automated response system and method.

일반적으로, 고객이 어떤 제품의 구매, 또는 서비스의 만족을 결정하는 중요 요소 중 하나가 제품의 AS, 고객의 불만 해소 및 빠르고 신속한 사후 서비스 제공을 위한 기업 및 관공서 등의 대고객 서비스이다. 최근 대고객 서비스를 최전방에서 전담하는 창구역할을 수행하는 것이 자동응답시스템이다.In general, one of the important factors in determining a customer's purchase of a product or satisfaction of a service is customer service such as after-sales service of the product, resolving customer complaints and providing fast and prompt after-sales service. Recently, the automatic response system is performing the window role exclusively for customer service at the forefront.

자동응답시스템은 교환기와 자동응답시스템 기능에 의존했던 2세대, 전화와 컴퓨터를 결합한 3세대 CTI 자동응답시스템을 거쳐 전화, 컴퓨터, 음성인식 및 인공지능을 결합한 4세대 자동응답시스템으로 발전하였다.The automatic answering system has evolved into a fourth-generation automatic answering system that combines telephone, computer, voice recognition and artificial intelligence through the second-generation and third-generation CTI automatic answering systems that combine telephone and computer, which depended on switchboards and automatic answering system functions.

이러한 자동응답시스템은 기업 입장에서 고객 서비스 처리 비용을 절감할 수 있고, 지점의 역할을 수행할 뿐 아니라 고객정보를 신속하고 효율적으로 쉽게 입수할 수 있으며, 신속한 서비스를 제공할 수 있는 이점으로 인해 급속하게 발전하고 있다.Such an automatic response system can reduce the cost of customer service processing from the perspective of the company, perform the role of a branch, and quickly and efficiently obtain customer information quickly and efficiently. is developing rapidly.

특히, 음성인식 기술이 발달함에 따라 자동응답시스템에 음성인식 기능이 적용된 음성인 자동응답시스템이 급속도로 확산되고 있다.In particular, with the development of voice recognition technology, an automatic answering system, which is a voice in which a voice recognition function is applied to an automatic answering system, is rapidly spreading.

이런 음성인식 자동응답시스템은 고객이 발화한 음성을 인식하고, 인식된 음성에 대응하는 시나리오에 따른 음성안내를 수행함으로써 상담원의 수를 최소화할 수 있다.Such a voice recognition automatic response system can minimize the number of counselors by recognizing the voice uttered by the customer and performing voice guidance according to a scenario corresponding to the recognized voice.

통상 음성인식 자동응답시스템은 시나리오에 따른 음성안내를 효율적으로 수행하기 위해 고객 단말기로부터 일정 크기의 음이 감지되면 안내되던 안내 음성을 중단한 후 고객이 발화하는 음성에 대해서만 음성인식을 수행할 수 있도록 구성되고 있다.In order to efficiently perform voice guidance according to the scenario, the voice recognition automatic response system stops the guidance voice when a sound of a certain size is detected from the customer terminal and then performs voice recognition only for the voice the customer utters. is being composed.

그러나 종래 음성인식 자동응답시스템은 고객에게 제공 중이던 시나리오에 따른 안내 음성을 중단할 필요가 있는 의미를 가지는 발성을 수행하지 않았음에도 불구하고 고객 단말기로부터 일정 크기 이상의 음, 소리만 검출되면 안내되던 안내 음성을 중단시키므로 음성안내가 빈번하게 끊길 수 있는 문제점이 있었다.However, in the conventional voice recognition automatic answering system, the guidance voice that was guided when only a sound or a sound of a certain size or more was detected from the customer terminal despite not performing a vocalization that had the meaning that it was necessary to stop the guidance voice according to the scenario being provided to the customer. There was a problem that the voice guidance could be cut off frequently because it stopped.

또한, 종래 음성인식 자동응답시스템은 안내 음성이 중단되는 경우 처음부터 재출력하거나, 다음 안내 음성이 출력되도록 함으로써 고객에게 안내에 대한 지루함을 주거나, 들어야 할 안내를 듣지 못하여 고객의 만족도가 떨어지는 문제점이 있었다.In addition, the conventional voice recognition autoresponder system re-outputs from the beginning when the guidance voice is interrupted or outputs the next guidance voice, thereby giving the customer boredom for the guidance, or not hearing the guidance to be heard, resulting in a decrease in customer satisfaction. there was.

대한민국 등록특허 제10-1195870호(2012.10.30. 공고)Republic of Korea Patent Registration No. 10-1195870 (2012.10.30. Announcement)

따라서 본 발명의 목적은 시나리오에 따른 안내 음성이 제공되던 중에 고객 단말기 측에서 인입되는 발화음의 상태, 즉 발화음의 의도에 따라 상기 제공 중인 안내 음성을 중단하거나, 상기 중단된 부분부터 안내 음성을 상기 고객 단말기로 재전송하거나, 상기 고객 단말기로 상기 발화음에 대응하는 시나리오의 서비스 항목의 안내 음성을 제공하는 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동 응답 시스템 및 방법을 제공함에 있다.Therefore, it is an object of the present invention to stop the guidance voice being provided according to the state of the incoming utterance from the customer terminal while the guidance voice according to the scenario is being provided, that is, the intention of the uttered sound, or to stop the guidance voice from the interrupted part. An object of the present invention is to provide a voice recognition automatic response system and method having a function of identifying the intention of a customer's voice to be retransmitted to the customer terminal or to provide a guide voice of a service item of a scenario corresponding to the utterance to the customer terminal.

상기와 같은 목적을 달성하기 위한 본 발명에 따른 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템은: 고객 단말기로부터 호 착신 시 고객 단말기와 통화로를 형성하는 통화로 형성부; 및 상기 통화로 형성부를 통해 임의의 고객 단말기와 통화로를 형성하고, 형성된 통화로를 통해 시나리오에 따른 안내 음성을 상기 고객 단말기로 제공하고, 고객 단말기 측에서 인입되는 발화음의 상태에 따라 상기 제공 중인 안내 음성을 중단하거나, 상기 중단된 부분부터 안내 음성을 상기 고객 단말기로 재전송하거나, 상기 고객 단말기로 상기 발화음에 대응하는 시나리오의 서비스 항목의 안내 음성을 제공하는 자동 응답부를 포함하는 것을 특징으로 한다.In accordance with the present invention for achieving the above object, there is provided a voice recognition automatic answering system having a function of identifying the intention of a customer's voice, comprising: a call path forming unit forming a communication path with the customer terminal when a call is received from the customer terminal; and forming a communication path with any customer terminal through the communication path forming unit, providing a guide voice according to a scenario to the customer terminal through the established communication path, and providing the information according to the state of an incoming utterance sound from the customer terminal side and an automatic answering unit for interrupting the guidance voice in progress, retransmitting the guidance voice from the interrupted part to the customer terminal, or providing a guidance voice of a service item of a scenario corresponding to the utterance to the customer terminal do.

상기 자동 응답부는, 상기 발화음이 고객이 발성한 고객 발화음인지를 판단하여 고객 발화음인 경우에만 상기 안내 음성의 제공을 중단한 후 상기 고객 발화음을 분석하여 분석 실패 시 상기 시나리오의 중단된 부분부터 안내 음성을 상기 고객 단말기로 제공하고 분석 성공 시 분석된 고객 발화음에 대응하는 시나리오 항목의 안내 음성을 상기 고객 단말기로 제공하는 자동 응답부를 포함하는 것을 특징으로 한다.The automatic answering unit determines whether the utterance is a customer utterance uttered by a customer, stops providing the guide voice only when the utterance is a customer utterance, and analyzes the customer utterance, and when the analysis fails, the scenario is interrupted. It is characterized in that it comprises an automatic answering unit that provides a guide voice from the part to the customer terminal and provides a guide voice of a scenario item corresponding to the analyzed customer utterance sound when the analysis is successful to the customer terminal.

상기 자동 응답부는, 제공할 서비스에 따른 다수의 서비스 순서 및 항목별 안내 음성을 포함하는 시나리오를 저장하는 안내 시나리오 DB를 포함하는 저장부; 상기 통화로 형성부를 통해 통화로 설정을 수행하여 통화를 형성하고, 고객 단말기로부터 입력되는 발화음의 세기를 측정한 발화음 세기 신호를 출력하는 음성 송수신부; 및 상기 음성 송수신부 및 통화로 형성부를 통해 임의의 고객 단말기와 형성된 통화로로 시나리오에 따른 안내 음성을 상기 고객 단말기로 제공하고, 고객 단말기 측에서 발성되는 발화음에 대한 발화음 세기 신호의 입력 시 상기 발화음 세기 신호가 일정 세기 이상이면 고객이 발성한 고객 발화음인지를 판단하여 고객 발화음인 경우에만 상기 안내 음성의 제공을 중단한 후 상기 고객 발화음을 분석하여 분석 실패 시 상기 시나리오의 중단된 부분부터 안내 음성을 상기 고객 단말기로 제공하고 분석 성공 시 분석된 고객 발화음에 대응하는 시나리오의 서비스 항목의 안내 음성을 상기 고객 단말기로 제공하는 자동응답 제어부를 포함하는 것을 특징으로 한다.The automatic response unit may include: a storage unit including a guide scenario DB for storing scenarios including a plurality of service orders and a guide voice for each item according to a service to be provided; a voice transceiver configured to set up a call through the call path forming unit, form a call, and output a uttered sound intensity signal obtained by measuring the strength of a uttered sound input from a customer terminal; and a guide voice according to a scenario established with any customer terminal through the voice transceiver and communication path forming unit is provided to the customer terminal, and when the utterance sound intensity signal for the uttered sound produced by the customer terminal is input If the utterance strength signal is greater than a certain strength, it is determined whether the utterance is a customer utterance, and only when the utterance is a customer utterance, the guide voice is stopped, and then the scenario is stopped when the analysis fails by analyzing the customer utterance. It is characterized in that it comprises an automatic response control unit that provides a guide voice to the customer terminal from the selected part and provides a guide voice of a service item of a scenario corresponding to the analyzed customer utterance sound to the customer terminal when the analysis is successful.

상기 자동응답 제어부는, 상기 음성 송수신부로부터 고객 단말기 측에서 발성되는 발화음에 대한 일정 세기 이상의 발화음 세기 신호가 입력되는지를 모니터링하고, 상기 일정 세기 이상의 발화음 세기 신호가 입력되면 음성인식 구동 신호를 출력하는 발화음 모니터링부; 상기 음성인식 구동 신호의 입력 시 구동되어 상기 음성 송수신부를 통해 수신되는 고객의 발화음성을 인식하고, 인식된 음성인식 결과정보를 출력하는 음성인식부; 상기 음성인식 결과정보를 입력받고 상기 음성인식 결과정보가 고객이 발성한 음성인지를 판단하여 고객이 발성한 음성이면 고객 발성 신호를 출력하는 고객 발화 감지부; 안내 시나리오 DB로부터 서비스에 대한 안내 시나리오 항목을 선택하여 읽어드린 후 출력하는 안내 시나리오 선택부; 및 고객 발화 감지부로부터 고객 발성 신호의 입력 시 안내 시나리오 선택부로부터 입력되는 안내 시나리오 항목의 안내 음성 데이터를 송신에 필요한 안내 음성으로 변환하여 상기 음성 송수신부를 통해 전송하는 안내 음성 변환부를 포함하는 것을 특징으로 한다.The automatic response control unit monitors whether a utterance sound intensity signal of a predetermined strength or more is input from the voice transceiver to a utterance sound uttered at the customer terminal side, and when the utterance sound strength signal of a predetermined strength or more is input, a voice recognition driving signal a utterance monitoring unit that outputs a voice recognition unit driven when the voice recognition driving signal is input, recognizing a customer's spoken voice received through the voice transceiver, and outputting recognized voice recognition result information; a customer utterance detection unit receiving the voice recognition result information, determining whether the voice recognition result information is a voice uttered by the customer, and outputting a customer utterance signal if the voice is uttered by the customer; a guide scenario selection unit that selects and reads a guide scenario item for a service from the guide scenario DB and outputs it; and a guide voice conversion unit for converting the guide voice data of the guide scenario item input from the guide scenario selection unit when inputting the customer speech signal from the customer speech detection unit into a guide voice required for transmission and transmitting the information through the voice transceiver unit. do it with

상기 고객 발화 감지부는, 상기 음성인식 결과정보가 의미를 가지는 키워드를 포함하는 경우 상기 고객 발성 신호를 출력하는 것을 특징으로 한다.The customer utterance detection unit, when the voice recognition result information includes a keyword having a meaning, it is characterized in that the output of the customer utterance signal.

상기 고객 발화 감지부는, 상기 음성인식 결과정보가 고객의 안내 음성을 중지하기를 원하는 의미를 가지는 키워드를 포함하는 경우 상기 고객 발성 신호를 출력하는 것을 특징으로 한다.The customer utterance detection unit, when the voice recognition result information includes a keyword having a meaning of wanting to stop the customer's guidance voice, it is characterized in that the output of the customer utterance signal.

상기 저장부는, 적어도 하나 이상의 키워드를 포함하는 다수의 발성 의도 정보를 정의하는 발성의도 DB를 더 포함하고, 상기 안내 시나리오 DB는, 발성의도 별 안내 시나리오를 저장하고, 상기 자동응답 제어부는, 상기 음성인식 결과정보를 입력받고, 상기 발성의도 DB를 참조하여 입력된 음성인식 결과정보의 적어도 하나 이상의 키워드들에 대응하는 발성의도 정보를 찾아 상기 고객이 발화한 고객 발화음에 대한 발성의도를 분석하는 발성의도 분석부를 더 포함하되, 상기 안내 시나리오 선택부는, 상기 발성의도 분석부에서 분석된 발성의도에 대응하는 시나리오의 해당 항목을 선택하여 출력하는 것을 특징으로 한다.The storage unit further includes a speech intention DB defining a plurality of speech intention information including at least one or more keywords, wherein the guide scenario DB stores guide scenarios for each degree of speech, and the automatic response control unit comprises: The voice recognition result information is received, and the vocalization intention information corresponding to at least one or more keywords of the inputted voice recognition result information is searched for by referring to the vocalization intention DB, and the voice recognition for the customer utterance uttered by the customer is performed. Further comprising a vocalization degree analyzer for analyzing the diagram, wherein the guidance scenario selection unit selects and outputs a corresponding item of a scenario corresponding to the vocalization intention analyzed by the vocalization intention analysis unit.

상기 자동 응답부는, 상기 발화음이 인입되면 상기 안내 음성의 제공을 중단한 후, 상기 발화음을 분석하여 분석 실패 시 상기 시나리오의 중단된 부분부터 안내 음성을 상기 고객 단말기로 제공하고 분석 성공 시 분석된 고객 발화음에 대응하는 시나리오 항목의 안내 음성을 상기 고객 단말기로 제공하는 자동 응답부를 포함하는 것을 특징으로 한다.The automatic response unit, after stopping the provision of the guide voice when the utterance is received, analyzes the utterance and provides the guidance voice from the interrupted part of the scenario to the customer terminal when the analysis fails, and analyzes when the analysis is successful and an automatic answering unit for providing a guide voice of a scenario item corresponding to the uttered customer utterance to the customer terminal.

상기와 같은 목적을 달성하기 위한 본 발명에 따른 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답방법은: 통화로 형성부가 고객 단말기로부터 호 착신 시 고객 단말기와 통화로를 형성하는 통화로 형성 과정; 및 자동 응답부가 상기 통화로 형성부를 통해 임의의 고객 단말기와 통화로를 형성하고, 형성된 통화로를 통해 시나리오에 따른 안내 음성을 상기 고객 단말기로 제공하고, 고객 단말기 측에서 인입되는 발화음의 상태에 따라 상기 제공 중인 안내 음성을 중단하거나, 상기 중단된 부분부터 안내 음성을 상기 고객 단말기로 재전송하거나, 상기 고객 단말기로 상기 발화음에 대응하는 시나리오의 서비스 항목의 안내 음성을 제공하는 자동 응답 과정을 포함하는 것을 특징으로 한다.In accordance with the present invention for achieving the above object, there is provided a voice recognition automatic answering method having a function of identifying the intention of a customer's voice to be spoken: a call path forming process in which the call path forming unit forms a call path with the customer terminal when a call is received from the customer terminal ; and an automatic answering unit establishes a communication path with any customer terminal through the call path forming unit, provides a guide voice according to a scenario to the customer terminal through the established communication path, and responds to the state of the incoming utterance sound from the customer terminal side. according to the automatic response process of stopping the guidance voice being provided, retransmitting the guidance voice from the interrupted part to the customer terminal, or providing a guidance voice of a service item of a scenario corresponding to the utterance to the customer terminal characterized in that

상기 자동 응답 과정에서 자동 응답부가 상기 통화로 형성부를 통해 임의의 고객 단말기와 형성된 통화로를 통해 시나리오에 따른 안내 음성을 상기 고객 단말기로 제공하고, 고객 단말기 측에서 발성되는 발화음이 고객이 발성한 고객 발화음인지를 판단하여 고객 발화음인 경우에만 상기 안내 음성의 제공을 중단한 후 상기 고객 발화음을 분석하여 분석 실패 시 상기 시나리오의 중단된 부분부터 안내 음성을 상기 고객 단말기로 제공하고 분석 성공 시 분석된 고객 발화음에 대응하는 시나리오 항목의 안내 음성을 상기 고객 단말기로 제공하는 것을 특징으로 한다.In the automatic answering process, the automatic answering unit provides a guide voice according to the scenario to the customer terminal through the call path established with any customer terminal through the call path forming unit, and the utterance sound produced by the customer terminal is uttered by the customer. After determining whether it is a customer utterance, it stops providing the guidance voice only if it is a customer utterance, and analyzes the customer utterance. When the analysis fails, the guidance voice is provided to the customer terminal from the interrupted part of the scenario and the analysis succeeds It is characterized in that the guide voice of the scenario item corresponding to the analyzed customer utterance is provided to the customer terminal.

상기 자동 응답 과정은, 상기 자동 응답부의 발화음 모니터링부가 고객 단말기 측에서 발성되는 발화음에 대한 일정 세기 이상의 발화음 세기 신호가 입력되는지를 모니터링하고, 상기 일정 세기 이상의 발화음 세기 신호가 입력되면 음성인식 구동 신호를 출력하는 발화음 모니터링 단계; 상기 자동 응답부의 음성 인식부가 상기 음성인식 구동 신호의 입력 시 구동되어 음성 송수신부를 통해 수신되는 고객의 발화음성을 인식하고, 인식된 음성인식 결과정보를 출력하는 음성인식 단계; 상기 자동 응답부의 고객 발화 감지부가 상기 음성인식 결과정보를 입력받고 상기 음성인식 결과정보가 고객이 발성한 음성인지를 판단하여 고객이 발성한 음성이면 고객 발성 신호를 출력하는 고객 발화 감지 단계; 상기 자동 응답부의 안내 시나리오 선택부가 안내 시나리오 DB로부터 서비스에 대한 안내 시나리오 항목을 선택하여 읽어드린 후 출력하는 안내 시나리오 선택 단계; 및 상기 자동 응답부의 안내 음성 변환부가 고객 발화 감지부로부터 고객 발성 신호의 입력 시 안내 시나리오 선택부로부터 입력되는 안내 시나리오 항목의 안내 음성 데이터를 송신하기 위한 안내 음성으로 변환하여 상기 음성 송수신부를 통해 전송하는 안내 음성 변환 단계를 포함하는 것을 특징으로 한다.In the automatic answering process, the speech sound monitoring unit of the automatic answering unit monitors whether a speech sound intensity signal of a certain intensity or more is input with respect to a speech sound uttered from the customer terminal side, and when the speech sound intensity signal of a certain intensity or more is input, a voice a speech sound monitoring step of outputting a recognition driving signal; a voice recognition step of recognizing a customer's spoken voice received through a voice transceiver by driving the voice recognition unit of the automatic response unit when the voice recognition driving signal is input, and outputting recognized voice recognition result information; a customer utterance detection step of receiving the voice recognition result information by the customer utterance detection unit of the automatic response unit, determining whether the voice recognition result information is a voice uttered by the customer, and outputting a customer utterance signal if the voice is uttered by the customer; a guidance scenario selection step in which the guidance scenario selection unit of the automatic response unit selects, reads, and outputs a guidance scenario item for a service from the guidance scenario DB; and the voice guidance conversion unit of the automatic response unit converts the guidance voice data of the guidance scenario item input from the guidance scenario selection unit when inputting the customer utterance signal from the customer utterance sensing unit into a guidance voice for transmitting through the voice transceiver. It is characterized in that it comprises a voice guidance conversion step.

상기 고객 발화 감지 단계는, 상기 고객 발화 감지부가 상기 음성인식 결과정보가 의미를 가지는 키워드를 포함하는 경우 상기 고객 발성 신호를 출력하는 것을 특징으로 한다.The customer utterance detection step may include outputting the customer utterance signal when the customer utterance detection unit includes a keyword having a meaning in the voice recognition result information.

상기 고객 발화 감지 단계는, 상기 고객 발화 감지부가 상기 음성인식 결과정보가 고객의 안내 음성을 중지하기를 원하는 의미를 가지는 키워드를 포함하는 경우 상기 고객 발성 신호를 출력하는 것을 특징으로 한다.In the step of detecting customer speech, the customer speech detection unit outputs the customer speech signal when the voice recognition result information includes a keyword having a meaning of wanting to stop the guide voice of the customer.

상기 방법은: 상기 자동 응답부의 발성의도 분석부가 상기 음성인식 결과정보를 입력받고, 발성의도 DB를 참조하여 입력된 음성인식 결과정보의 적어도 하나 이상의 키워드들에 대응하는 발성의도 정보를 찾아 상기 고객이 발화한 고객 발화음에 대한 발성의도를 분석하는 발성의도 분석 과정을 더 포함하되, 상기 안내 시나리오 선택 과정에서 상기 안내 시나리오 선택부가 상기 발성의도 분석부에서 분석된 발성의도에 대응하는 시나리오의 해당 항목을 선택하여 출력하는 것을 특징으로 한다.The method includes: the vocalization intention analysis unit of the automatic response unit receives the speech recognition result information, refers to the vocalization intention DB, and finds the vocalization intention information corresponding to at least one or more keywords of the inputted speech recognition result information Further comprising a vocalization degree analysis process of analyzing the vocalization degree of the customer's utterances uttered by the customer, wherein in the guide scenario selection process, the guidance scenario selection unit determines the vocalization intention analyzed by the vocalization intention analysis unit. It is characterized in that the selected item of the corresponding scenario is selected and output.

상기 자동 응답 과정은, 상기 자동 응답부가 상기 발화음이 인입되면 상기 안내 음성의 제공을 중단하는 안내 음성 제공 중단 단계; 및 상기 자동 응답부가 상기 발화음을 분석하여 분석 실패 시 상기 시나리오의 중단된 부분부터 안내 음성을 상기 고객 단말기로 제공하고 분석 성공 시 분석된 고객 발화음에 대응하는 시나리오 항목의 안내 음성을 상기 고객 단말기로 제공하는 자동 응답 재개 단계를 포함하는 것을 특징으로 한다.The automatic answering process may include a step of stopping providing a guide voice in which the automatic answering unit stops providing the guide voice when the spoken sound is received; and when the automatic response unit analyzes the utterances and fails to analyze, provides a guide voice from the interrupted part of the scenario to the customer terminal, and when the analysis succeeds, provides a guide voice of a scenario item corresponding to the analyzed customer utterances to the customer terminal It is characterized in that it includes an automatic response resume step provided as

본 발명은 고객 단말기 측으로부터 인입되는 발화음의 상태에 따라 안내 음성의 전송 및 중지를 적응적으로 수행함으로써 불필요한 안내 음성의 중지를 방지하고 불필요하고 빈번한 안내 음성의 끊김을 방지할 수 있는 효과가 있다.The present invention has the effect of preventing unnecessary and frequent interruption of the guidance voice by adaptively performing transmission and stopping of the guidance voice according to the state of the incoming utterance from the customer terminal side. .

본 발명은 고객 단말기 측으로부터 발화음이 감지되어도 상기 발화음이 고객이 실질적으로 발성한 고객 발화음성인지 판단하여 시나리오에 따라 진행 중이던 안내 음성을 중지하므로 잡음 등에 의한 불필요한 안내 음성의 끊김을 방지하여 빠른 서비스를 제공하고 안내 음성의 끊김에 의해 시간 지연 및 반복된 안내 음성에 의한 지루함을 방지할 수 있는 효과가 있다.According to the present invention, even if a utterance is detected from the customer terminal, it is determined whether the uttered utterance is actually uttered by the customer and stops the guidance voice in progress according to the scenario. There is an effect of providing a service and preventing boredom caused by a time delay and repeated voice guidance due to the interruption of the guidance voice.

또한, 본 발명은 고객이 발성한 음성이고 그 고객 발화음성이 의미를 가지는 경우 의미를 분석하여 고객의 의도를 파악하고, 파악한 고객의 의도에 대응하는 시나리오의 안내 음성을 제공함으로써 고객이 원하는 서비스에 대한 빠른 안내 음성을 제공할 수 있는 효과가 있다.In addition, the present invention analyzes the meaning of a voice uttered by a customer and the customer's uttered voice has a meaning, analyzes the meaning of the customer's intention, and provides a guide voice for a scenario corresponding to the identified customer's intention to provide a service desired by the customer. It has the effect of providing a quick guide voice for information.

도 1은 본 발명에 따른 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템이 적용된 통신 시스템의 구성을 나타낸 도면이다.
도 2는 본 발명에 따른 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템의 자동 응답부의 구성을 나타낸 도면이다.
도 3은 본 발명의 제1실시 예에 따른 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템의 자동응답방법을 나타낸 흐름도이다.
도 4는 본 발명의 제2실시 예에 따른 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템의 자동응답방법을 나타낸 흐름도이다.
1 is a diagram showing the configuration of a communication system to which a voice recognition automatic response system having a function of identifying the intention of a customer's voice according to the present invention is applied.
2 is a diagram showing the configuration of an automatic answering unit of a voice recognition automatic answering system having a function of identifying the intention of a customer's voice according to the present invention.
3 is a flowchart illustrating an automatic answering method of a voice recognition automatic answering system having a function of identifying the intention of a customer's voice according to the first embodiment of the present invention.
4 is a flowchart illustrating an automatic answering method of a voice recognition automatic answering system having a function of determining the intention of a customer's voice according to a second embodiment of the present invention.

이하 첨부된 도면을 참조하여 본 발명에 따른 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템의 구성 및 동작을 설명하고, 상기 시스템에서의 자동응답방법을 설명한다.Hereinafter, with reference to the accompanying drawings, the configuration and operation of a voice recognition automatic answering system having a function of grasping the intention of a customer's voice according to the present invention will be described, and an automatic answering method in the system will be described.

도 1은 본 발명에 따른 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템이 적용된 통신 시스템의 구성을 나타낸 도면이다.1 is a diagram showing the configuration of a communication system to which a voice recognition automatic response system having a function of identifying the intention of a customer's voice according to the present invention is applied.

도 1을 참조하면 본 발명에 따른 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템(200)은 유무선 통신망(10)을 통해 다수의 고객 단말기(100)들과 연결되어 음성통신 및 음성 데이터통신을 수행한다.Referring to FIG. 1 , the voice recognition automatic response system 200 having a function of identifying the intention of a customer's voice according to the present invention is connected to a plurality of customer terminals 100 through a wired/wireless communication network 10 to provide voice communication and voice data. carry out communication

상기 유무선 통신망(10)은 인터넷망, 유선전화망(PSTN), 3세대(3 Generation: 3G), 4G, 5G 등의 이동통신망 등이 결합되어 있는 통신망일 수 있을 것이다.The wired/wireless communication network 10 may be a communication network in which the Internet network, a wired telephone network (PSTN), a mobile communication network such as 3G, 4G, 5G, etc. are combined.

고객 단말기(100)는 스마트폰, 스마트 패드 등과 같이 유무선 통신망(10)에 무선으로 연결되어 데이터통신을 수행하는 모바일 단말기(101) 및 상기 유무선 통신망(10)에 유선으로 연결되어 유선 음성통신을 수행하는 유선 전화기(102) 등이 될 수 있을 것이다.The customer terminal 100 is wirelessly connected to the wired/wireless communication network 10 such as a smart phone or a smart pad to perform data communication, and the wired/wireless communication network 10 is connected to the wired/wireless communication network 10 to perform wired voice communication. may be a landline phone 102 or the like.

본 발명에 따른 음성인식 자동응답시스템(200)은 구내교환망(Private Branch Exchange: PBX) 등과 같은 통화로 형성부(300) 및 자동 응답부(400)를 포함한다.The voice recognition automatic answering system 200 according to the present invention includes a call path forming unit 300 and an automatic answering unit 400 such as a private branch exchange (PBX).

상기 통화로 형성부(300) 및 자동 응답부(400)는 상기 유무선 통신망(10)에 연결되는 로컬망(Local Area Network: LAN)(20)을 통해 연결되어 상호 음성통신 및 데이터통신을 수행하고, 로컬망(20) 및 유무선 통신망(10)을 통해 고객 단말기(100)와 음성통신 및 데이터통신을 수행한다.The call path forming unit 300 and the automatic answering unit 400 are connected through a local area network (LAN) 20 connected to the wired/wireless communication network 10 to perform mutual voice communication and data communication, and , and performs voice communication and data communication with the customer terminal 100 through the local network 20 and the wired/wireless communication network 10 .

통화로 형성부(300)는 고객 단말기(100)로부터 착신되는 호의 처리 및 호를 관리하고, 착신된 호에 대해 고객 단말기(100)와 자동 응답부(400)간 통화로를 형성시킨다.The call path forming unit 300 processes and manages calls received from the customer terminal 100 , and forms a communication path between the customer terminal 100 and the answering machine 400 for the incoming call.

자동 응답부(400)는 상기 통화로 형성부(300)를 통해 임의의 고객 단말기(100)와 통화로를 형성하고, 형성된 통화로를 통해 시나리오에 따른 안내 음성을 상기 고객 단말기(100)로 제공한다.The automatic answering unit 400 establishes a call path with any customer terminal 100 through the call path forming unit 300 , and provides a guide voice according to a scenario to the customer terminal 100 through the established call path. do.

상기 자동 응답부(400)는 고객 단말기(100) 측에서 발성되는 발화음을 분석하여 발화음의 상태, 즉 발화음의 발성 의도에 따라 안내 음성을 전송하거나 차단하고, 발화음이 의미를 가지는 고객의 발화음성인 경우, 발화음성에 해당하는 시나리오의 해당 서비스 항목의 안내 음성을 고객 단말기(100)로 제공한다.The automatic response unit 400 analyzes the uttered sound uttered by the customer terminal 100, transmits or blocks the guide voice according to the state of the uttered sound, that is, the utterance intention of the uttered sound, and the customer whose uttered sound has meaning In the case of an uttered voice, a guide voice of a corresponding service item of a scenario corresponding to the uttered voice is provided to the customer terminal 100 .

일실시예에 따라 자동 응답부(400)는 일정 세기 이상의 발화음의 수신 즉시 제공되는 안내 음성을 중지한 후 발화음에 대해 음성인식을 수행하여 고객이 발성한 고객 발화음인지, 분석되고 의미를 가지는 발화음인지를 판단하여, 고객 발화음이 아니고, 분석되지 않거나 의미를 가지지 않는 발화음이면 전송 중이던 시나리오의 해당 서비스 항목의 안내 음성의 중지된 부분부터 다시 재생하여 고객 단말기(100)로 제공하도록 구성될 수 있을 것이다.According to an embodiment, the automatic response unit 400 stops the guidance voice provided immediately upon reception of a utterance of a certain intensity or more, and then performs voice recognition on the uttered sound to determine whether it is a customer utterance uttered by the customer, and analyzes the meaning. It is determined whether it is a utterance, and if it is a utterance that is not a customer utterance and has not been analyzed or has no meaning, it is played back from the stopped part of the guidance voice of the corresponding service item in the scenario being transmitted and provided to the customer terminal 100. could be configured.

반면 고객 발화음이고, 분석되거나 의미를 가지는 발화음이면, 자동 응답부(400)는 분석되고 의미에 해당하는 시나리오의 해당 서비스 항목의 안내 음성을 고객 단말기(100)로 제공할 것이다.On the other hand, if it is a customer utterance and is a utterance that is analyzed or has a meaning, the automatic response unit 400 will provide a guide voice of a corresponding service item of a scenario corresponding to the analysis and meaning to the customer terminal 100 .

또한, 다른 실시 예로 자동 응답부(400)는 일정 세기 이상의 발화음이 인입되더라도 안내 음성의 제공을 중단하지 않고 음성인식에 성공하고, 분석에 성공하는 경우에만 제공되던 안내 음성을 중지하도록 구성될 수도 있을 것이다.In addition, in another embodiment, the automatic answering unit 400 succeeds in voice recognition without stopping the provision of the guide voice even when a utterance of a certain intensity or more is introduced, and may be configured to stop the guidance voice provided only when the analysis succeeds. There will be.

또한, 다른 실시 예로 자동 응답부(400)는 분석에 성공하되, 분석 내용이 안내 음성 제공의 중지 의도를 가지는 경우에만 안내 음성의 전송을 중지하도록 구성될 수도 있을 것이다. 상기 중지 의도는 발화음에 "잠깐만요", "다시", "다음" 등의 내용이 포함되어 있을 경우일 수 있을 것이다.Also, in another embodiment, the automatic response unit 400 may be configured to succeed in the analysis, but to stop transmission of the guidance voice only when the analysis content has an intention to stop providing the guidance voice. The intention to stop may be a case in which contents such as “wait for a second”, “again”, and “next” are included in the utterance.

이 경우, 자동 응답부(400)는 상기 중지 의도의 내용 및 후속하는 의도에 대응하는 시나리오의 서비스 항목을 선택하고 선택된 서비스 항목에 대응하는 안내 음성을 고객 단말부(100)로 제공할 것이다.In this case, the automatic response unit 400 selects a service item of a scenario corresponding to the content of the suspension intention and a subsequent intention, and provides a guide voice corresponding to the selected service item to the customer terminal unit 100 .

도 2는 본 발명에 따른 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템의 자동 응답부의 구성을 나타낸 도면이다.2 is a diagram illustrating the configuration of an automatic answering unit of a voice recognition automatic answering system having a function of determining the intention of a customer's voice according to the present invention.

도 2를 참조하면, 본 발명에 따른 자동 응답부(400)는 저장부(410), 음성 송수신부(420), 자동응답 제어부(430)를 포함한다.Referring to FIG. 2 , the automatic answering unit 400 according to the present invention includes a storage 410 , a voice transceiver 420 , and an automatic answering controller 430 .

상기 저장부(410)는 본 발명에 따른 자동 응답부(400)의 전반적인 동작을 제어하기 위한 제어프로그램을 저장하는 프로그램영역, 상기 제어프로그램 수행 중에 발생되는 데이터를 일시 저장하는 임시영역, 상기 제어프로그램 수행에 필요한 데이터 및 수행 중에 발생되는 데이터를 반영구적으로 저장하는 데이터영역을 포함한다.The storage unit 410 includes a program area for storing a control program for controlling the overall operation of the automatic response unit 400 according to the present invention, a temporary area for temporarily storing data generated during execution of the control program, and the control program. It includes a data area for semi-permanently storing data necessary for execution and data generated during execution.

상기 데이터영역에는 본 발명의 실시 예에 따라 안내 시나리오 DB(411)만 구성될 수도 있고, 다른 실시 예에 따라 안내 시나리오 DB(411) 및 발성의도 DB(412)가 구성될 수 있을 것이다.According to an embodiment of the present invention, only the guidance scenario DB 411 may be configured in the data area, or the guidance scenario DB 411 and the vocal chart DB 412 may be configured according to another embodiment.

상기 안내 시나리오 DB(411)는 실시 예에 따라 서비스 항목(또는 "시나리오 코드"라 함)에 대한 안내 음성 제공 순서 및 키워드에 대응하는 서비스 항목(시나리오 코드)에 대한 안내 음성을 정의하는 안내 시나리오를 저장한다.The guide scenario DB 411 provides a guide scenario for defining a guide voice for a service item (scenario code) corresponding to a guide voice providing sequence and a keyword for a service item (or "scenario code") according to an embodiment. Save.

상기 안내 시나리오 DB(411)는 다른 실시 예에 따라 발성의도별 서비스 항목에 대한 안내 음성을 정의하는 안내 시나리오를 저장한다.The guide scenario DB 411 stores a guide scenario defining a guide voice for a service item for each vocalization degree according to another embodiment.

발성의도 DB(412)는 상기 다른 실시 예에 따라 적어도 하나의 키워드별 발성의도(정보)를 정의한다. 상기 발성의도정보는 "잠깐만요", "잠깐만" "잠시만" 등은 중지 의도로, "다시", "처음부터" 등은 현재 재생 중인 안내 음성의 재시작 의도, "다음" "다른" 등은 안내 음성 넘김 의도, 실제 서비스 항목 명은 서비스 이동 의도 등으로 정의될 수 있을 것이다.The vocalization degree DB 412 defines a vocalization degree (information) for at least one keyword according to the other exemplary embodiment. As for the vocal intention information, "Wait a minute", "Wait a minute", "Wait a minute", etc. are the intention to stop, "Restart", "From the beginning", etc. are the intention to restart the currently playing guidance voice, "Next", "Other", etc. The intention to pass the guidance voice and the actual service item name may be defined as the intention to move the service.

음성 송수신부(420)는 상기 통화로 형성부(300)와 연결되어 통화로 설정을 수행하고, 통화로가 형성된 경우 통화로를 통해 입력되는 발화음의 세기를 측정하고, 측정된 세기 값을 가지는 발화음 세기 신호를 자동응답 제어부(430)로 출력한다. 상기 발화음이란 고객 단말기(100)의 마이크를 통해 입력되는 모든 음, 즉 오디오를 의미한다.The voice transceiver 420 is connected to the call path forming unit 300 to set up a call, and when the call path is established, measures the intensity of the spoken sound input through the call path, and has the measured intensity value. The utterance sound strength signal is output to the automatic response control unit 430 . The utterance sound refers to all sounds input through the microphone of the customer terminal 100 , that is, audio.

자동응답 제어부(430)는 발화음 모니터링부(440), 음성인식부(450), 고객 발화 감지부(460), 발성의도 분석부(470), 안내 시나리오 선택부(480) 및 안내 음성 변환부(490)를 포함하여, 본 발명에 따른 자동 응답부(400)의 전반적인 동작을 제어한다.The automatic response control unit 430 includes the utterance sound monitoring unit 440 , the voice recognition unit 450 , the customer utterance detection unit 460 , the utterance intention analysis unit 470 , the guidance scenario selection unit 480 , and the guidance voice conversion Including the unit 490, it controls the overall operation of the automatic answering unit 400 according to the present invention.

구체적으로 설명하면, 발화음 모니터링부(440)는 음성 송신부(420)로부터 고객 단말기(100) 측에서 발성되는 발화음에 대한 일정 세기 이상의 발화음 세기 신호가 입력되는지를 모니터링하고, 발화음 세기 신호가 입력되면 입력된 발화음 세기 신호의 발화음 세기 값이 미리 설정된 기준 세기 값과 비교하여 큰지를 판단하고, 크면 음성인식 구동 신호를 음성 인식부(450)로 출력하고, 다른 실시예에 따라 안내 음성 변환부(490)로 출력한다.More specifically, the utterance monitoring unit 440 monitors whether a utterance sound intensity signal of a predetermined intensity or more is input from the voice transmitter 420 to the utterance sound uttered at the customer terminal 100 side, and the utterance sound strength signal When is input, it is determined whether the utterance strength value of the input utterance strength signal is large compared to a preset reference strength value, and if it is large, the voice recognition driving signal is output to the voice recognition unit 450 , and guidance according to another embodiment output to the voice conversion unit 490 .

음성 인식부(450)는 구동 시 음성 송수신부(420)로부터 입력되는 음성, 즉 발화음에 대해 음성인식을 수행하여 음성인식 결과정보를 생성하여 실시예에 따라 발성의도 분석부(470) 및 안내 시나리오 선택부(480) 중 어느 하나로 출력한다.The voice recognition unit 450 generates voice recognition result information by performing voice recognition on the voice input from the voice transceiver unit 420 at the time of operation, that is, the uttered sound, and according to an embodiment, the vocalization degree analyzer 470 and It is output to any one of the guide scenario selection unit 480 .

또한, 음성 인식부(450)는 음성인식 실패 시 음성인식 실패 신호를 안내 음성 변환부(490)로 출력한다.Also, the voice recognition unit 450 outputs a voice recognition failure signal to the guide voice conversion unit 490 when the voice recognition fails.

상기 음성 인식부(450)는 상기 발화음 모니터링부(440)로부터 음성인식 구동 신호의 입력 시 활성화되고, 고객 발화 감지부(460)로부터 음성인식 구동 종료 신호의 입력 시 비활성화되도록 구성되는 것이 바람직할 것이다.Preferably, the voice recognition unit 450 is activated when a voice recognition driving signal is input from the utterance sound monitoring unit 440 and is deactivated when a voice recognition driving end signal is input from the customer utterance detection unit 460 . will be.

고객 발화 감지부(460)는 상기 음성 인식부(450)로부터 음성인식 결과정보를 입력받고 상기 음성인식 결과정보가 고객이 발성한 음성인지를 판단하여 고객이 발성한 음성이면 고객 발성 신호를 출력한다.The customer speech detection unit 460 receives the voice recognition result information from the voice recognition unit 450, determines whether the voice recognition result information is a voice uttered by the customer, and outputs a customer utterance signal if the voice is uttered by the customer. .

상기 음성인식 결과정보가 고객이 발성한 음성인지의 판단은 안내 음성의 제공 중 최초 입력된 고객의 음성에 대한 특징정보인 고객 음성 특징정보를 추출하여 저장하고, 저장된 고객음성 특징정보와 실시간 입력되는 음성인식 결과정보에 포함된 음성 특징정보를 비교하여 판단할 수 있을 것이다.Determination of whether the voice recognition result information is the voice uttered by the customer is performed by extracting and storing customer voice characteristic information, which is characteristic information about the customer's voice first input during the provision of the guidance voice, and inputting the stored customer voice characteristic information and real-time input. It may be determined by comparing the voice characteristic information included in the voice recognition result information.

또한, 고객 발화 감지부(460)는 상기 음성 인식부(450)로부터 입력되는 음성인식 결과정보가 의미를 가지는 키워드를 포함하는지를 판단하여, 의미를 가지는 키워드를 포함할 경우 상기 고객 발성 신호를 출력하도록 구성될 수도 있을 것이다.In addition, the customer utterance detection unit 460 determines whether the voice recognition result information input from the voice recognition unit 450 includes a keyword having a meaning, and outputs the customer utterance signal when it includes a keyword having a meaning. may be configured.

또한, 고객 발화 감지부(460)는 상기 음성인식 결과정보가 고객의 안내 음성을 중지하기를 원하는 의미를 가지는 키워드를 포함하는 경우 상기 고객 발성 신호를 출력하도록 구성될 수도 있을 것이다.In addition, the customer utterance detection unit 460 may be configured to output the customer utterance signal when the voice recognition result information includes a keyword having a meaning desired to stop the customer's guidance voice.

상기 고객 발화 감지부(460)는 실시예에 따라 발화음이 고객이 발화한 고객 음성이 아니거나 의미를 가지지 않는 고객 음성인 경우 음성인식 구동 종료 신호를 상기 음성 인식부(450)로 출력하도록 구성되는 것이 바람직할 것이다.The customer speech detection unit 460 is configured to output a voice recognition driving end signal to the voice recognition unit 450 when the utterance sound is not a customer voice uttered by a customer or a customer voice that has no meaning according to an embodiment It would be preferable to be

발성의도 분석부(470)는 상기 음성인식 결과정보를 입력받고, 상기 발성의도 DB(412)를 참조하여 입력된 음성인식 결과정보의 적어도 하나 이상의 키워드들에 대응하는 발성의도 정보를 찾아 상기 고객이 발화한 고객 발화음에 대한 발성의도를 분석하고, 분석된 발성의도 정보를 안내 시나리오 선택부(480)로 출력한다.The vocalization intention analysis unit 470 receives the speech recognition result information, and finds the vocalization intention information corresponding to at least one or more keywords of the input speech recognition result information with reference to the vocalization intention DB 412 . The vocalization intention for the customer utterance uttered by the customer is analyzed, and the analyzed vocalization intention information is output to the guide scenario selection unit 480 .

안내 시나리오 선택부(480)는 실시예에 따라 음성 인식부(450)로부터 음성인식 결과정보를 입력받거나 상기 발성의도 분석부(470)로부터 발성의도 정보를 입력받아, 상기 음성인식 결과정보의 키워드에 대응하는 시나리오 서비스 항목의 안내 음성을 선택하여 안내 음성 변환부(490)로 출력하거나, 상기 발성의도 정보에 대응하는 시나리오 서비스 항목의 안내 음성 데이터를 선택하여 안내 음성 변환부(490)로 출력한다.The guidance scenario selection unit 480 receives voice recognition result information from the voice recognition unit 450 or the utterance intention information from the utterance intention analysis unit 470 according to an embodiment, and selects the voice recognition result information. The guide voice of the scenario service item corresponding to the keyword is selected and output to the guide voice conversion unit 490, or the guide voice data of the scenario service item corresponding to the vocalization intention information is selected and sent to the guide voice conversion unit 490 print out

안내 음성 변환부(490)는 안내 시나리오 선택부(480)로부터 입력되는 안내 음성 데이터를 전송을 위한 안내 음성으로 변환하여 음성 송수신부(420)로 출력한다. 출력된 안내 음성은 상기 음성 송수신부(420) 및 통화로 형성부(300)를 통해 고객 단말기(100)로 입력할 것이다. 상기 전송을 위한 안내 음성은 디지털 음성 데이터일 수도 있고, 아날로그 음성 신호일 수도 있을 것이다.The guidance voice conversion unit 490 converts the guidance voice data input from the guidance scenario selection unit 480 into a guidance voice for transmission and outputs it to the voice transceiver 420 . The output guide voice will be input to the customer terminal 100 through the voice transceiver 420 and the call path forming unit 300 . The guide voice for the transmission may be digital voice data or an analog voice signal.

상기 안내 음성 변환부(490)는 발화음의 상태에 따라 안내 음성의 제공 및 중지를 결정한다.The guide voice conversion unit 490 determines whether to provide or stop the guide voice according to the state of the spoken sound.

상기 안내 음성 변환부(490)는 실시 예에 따라 발화음 모니터링부(440)로부터 음성인식부 구동 신호의 입력 시 안내 음성의 제공을 중지할 수도 있고, 다른 실시 예에 따라 발화음에 대한 음성인식 및 분석에 성공하는 경우 상기 안내 음성의 전송을 중단하고, 중단된 안내 음성의 중단 위치정보를 저장하도록 구성될 수도 있을 것이다.The guide voice conversion unit 490 may stop providing a guide voice when the voice recognition unit driving signal is input from the utterance sound monitoring unit 440 according to an embodiment, and according to another embodiment, voice recognition for the utterance sound And if the analysis is successful, it may be configured to stop the transmission of the guide voice, and to store the stop position information of the interrupted guide voice.

또한, 안내 음성 변환부(490)는 안내 음성의 전송 중단 상태에서 음성인식에 실패하거나, 분석에 실패하는 경우 상기 중단 위치정보의 위치부터 해당 안내 음성을 음성 송수신부(420)를 통해 고객 단말기(100)로 전송한다. In addition, the guide voice conversion unit 490 transmits the guide voice through the voice transceiver 420 to the customer terminal ( ) from the location of the interrupted location information when the voice recognition fails or the analysis fails in the state where the transmission of the guide voice is interrupted. 100) is sent.

도 3은 본 발명의 제1실시 예에 따른 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템의 자동응답방법을 나타낸 흐름도로, 발화음 감지 시 전송되던 안내 음성을 중지하는 경우를 나타낸 흐름도이다.3 is a flowchart illustrating an automatic answering method of a voice recognition automatic answering system having a function of identifying the intention to utter a customer's voice according to the first embodiment of the present invention. to be.

도 3을 참조하면, 자동 응답 제어부(430)는 음성 송수신부(420)를 통해 통화로가 형성되는지를 모니터링한다(S111).Referring to FIG. 3 , the answering machine 430 monitors whether a call path is established through the voice transceiver 420 ( S111 ).

통화로가 형성되면 자동 응답 제어부(430)는 시나리오에 따른 초기 시나리오 서비스 항목(시나리오 코드)을 가지는 안내 음성을 음성 송수신부(420)를 통해 고객 단말기(100)로 제공한다(S113).When a call path is established, the automatic answering unit 430 provides a guide voice having an initial scenario service item (scenario code) according to the scenario to the customer terminal 100 through the voice transceiver 420 (S113).

상기 안내 음성이 제공되기 시작하면 자동 응답 제어부(430)는 통화가 종료되는지를 모니터링하고(S115), 통화가 종료되지 않으면 발화음 모니터링부(440)를 통해 발화음이 검출되는지를 모니터링한다(S117).When the guidance voice starts to be provided, the automatic answering unit 430 monitors whether the call is ended (S115), and if the call is not ended, monitors whether a spoken sound is detected through the spoken sound monitoring unit 440 (S117). ).

발화음이 감지되면 자동 응답 제어부(430)는 안내 음성 전송을 중지하고, 전송 중 중지된 안내 음성의 위치를 저장한다(S118).When the speech sound is detected, the automatic response control unit 430 stops transmitting the guide voice and stores the location of the guide voice stopped during transmission ( S118 ).

자동 응답 제어부(430)는 안내 음성의 중단된 위치에 대한 중단 위치정보를 저장한 후, 음성인식부(450)를 활성화하여 상기 발화음에 대한 음성인식 동작을 개시한다(S119).After the automatic response control unit 430 stores the stop position information on the position where the guidance voice is stopped, the voice recognition unit 450 is activated to start the voice recognition operation for the spoken sound (S119).

음성인식 동작이 개시되면 자동 응답 제어부(430)는 음성인식 성공 여부를 판단하고(S121), 음성인식에 실패하면 상기 중단된 안내 음성의 중단 위치정보에 대응하는 안내 음성 위치부터 고객 단말기(100)로 제공하고(S131), 상술한 S115 이후의 동작을 반복 수행한다.When the voice recognition operation is started, the automatic response control unit 430 determines whether the voice recognition succeeds (S121), and if the voice recognition fails, the customer terminal 100 from the position of the guidance voice corresponding to the interruption location information of the interrupted guidance voice. is provided (S131), and the above-described operations after S115 are repeatedly performed.

반면, 음성인식에 성공하면 자동 응답 제어부(430)는 인식된 음성이 고객 발화음성인지를 판단한다(S123).On the other hand, if the voice recognition is successful, the automatic response control unit 430 determines whether the recognized voice is a voice uttered by a customer (S123).

고객의 발화음성이 아닌 것으로 판단되면 자동 응답 제어부(430)는 음성인식 동작을 중지하고(S125), 상술한 S113 이후의 과정을 반복 수행한다.If it is determined that it is not the customer's uttered voice, the automatic response control unit 430 stops the voice recognition operation (S125), and repeats the above-described process after S113.

고객의 발화음성인 것으로 판단되면 자동 응답 제어부(430)는 음성인식 내용을 분석하고(S127), 분석에 성공하였는지를 판단한다(S129). 상기 분석은 실시 예에 따라 키워드 분석일 수도 있고, 발성 의도 분석일 수도 있을 것이다.If it is determined that the voice is uttered by the customer, the automatic response control unit 430 analyzes the voice recognition content (S127) and determines whether the analysis has been successful (S129). The analysis may be keyword analysis or utterance intention analysis according to an embodiment.

예를 들어 상기 음성인식 결과정보의 키워드가 분석될 수 없거나 의미를 가지지 않는 경우, 분석 실패로 판단할 수 있을 것이다. 예를 들어 분석된 키워드가 "음~""아~" 등과 같은 고객의 추임새인 경우, 상기 분석 성공 여부는 음성인식되어 분석된 내용에 대응하는 서비스 항목이 시나리오에 없는 경우, 분석 실패로 판단될 수도 있을 것이다.For example, when a keyword of the speech recognition result information cannot be analyzed or has no meaning, it may be determined as an analysis failure. For example, if the analyzed keyword is a customer's chumsae such as "Um~", "Ah~", etc., the success of the analysis is determined as an analysis failure if the service item corresponding to the analyzed content is not in the scenario by voice recognition. it might be

분석에 성공하면 자동 응답 제어부(430)는 분석된 해당 서비스 항목(시나리오 코드)에 대응하는 안내 음성을 안내 시나리오 DB(411)로부터 선택 및 읽은(S133) 후, 상술한 S113 이후의 과정을 반복 수행한다.If the analysis is successful, the automatic response control unit 430 selects and reads (S133) a guide voice corresponding to the analyzed corresponding service item (scenario code) from the guide scenario DB 411 (S133), and repeats the process after S113. do.

반면, 분석에 실패하면 자동 응답 제어부(430)는 상기 중단된 안내 음성의 중단 위치로부터 재생하여 고객 단말기(100)로 제공한다(S131). On the other hand, if the analysis fails, the automatic response control unit 430 reproduces the interrupted guidance voice from the interruption position and provides it to the customer terminal 100 (S131).

도 4는 본 발명의 제2실시 예에 따른 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템의 자동응답방법을 나타낸 흐름도이다. 도 4를 참조하여 설명함에 있어 상기 도 3과 동일한 일부 동작에 대해 도 3의 부호와 동일한 부호를 사용하였으며, 동일한 부호에 대해서는 설명을 생략하거나 간략하게 설명한다.4 is a flowchart illustrating an automatic answering method of a voice recognition automatic answering system having a function of determining the intention of a customer's voice according to a second embodiment of the present invention. In the description with reference to FIG. 4 , the same reference numerals as those of FIG. 3 are used for some operations identical to those of FIG. 3 , and the same reference numerals will be omitted or briefly described.

도 3의 S111 내지 S117과 동일한 동작을 수행하여 발화음이 감지되면 자동 응답 제어부(430)는 도 3과 다르게 안내 음성의 전송을 중단하지 않고, 음성인식 동작을 개시한다(S211).When a spoken sound is detected by performing the same operation as S111 to S117 of FIG. 3 , the automatic response control unit 430 starts the voice recognition operation without stopping the transmission of the guide voice unlike in FIG. 3 ( S211 ).

음성인식 동작이 개시되면 자동 응답 제어부(430)는 음성인식에 성공하는지를 판단한다(S211).When the voice recognition operation is started, the automatic response control unit 430 determines whether the voice recognition succeeds (S211).

자동 응답 제어부(430)는 음성인식에 실패하면 S113 이후의 과정을 반복 수행하고, 음성인식에 성공하면 상기 발화음이 고객 발화음성인지를 판단한다(S213)The automatic response control unit 430 repeats the process after S113 if the voice recognition fails, and determines whether the uttered sound is a customer uttered voice if the voice recognition is successful (S213)

고객 발화음이 아니면 자동 응답 제어부(430)는 음성인식 동작을 중지하고(S215), 고객 발화음성이면 음성인식 내용을 분석한(S217) 후, 분석에 성공했는지를 판단한다(S219).If it is not a customer utterance, the automatic response control unit 430 stops the voice recognition operation (S215), and if it is a customer uttered voice, analyzes the voice recognition content (S217), and then determines whether the analysis is successful (S219).

판단 결과, 분석에 실패했으면 자동 응답 제어부(430)는 S113 이후의 과정을 반복 수행하고, 분석에 성공했으면 분석된 고객 음성의 내용에 안내 음성에 대한 중지 의도가 포함되어 있는지를 판단한다(S2212). 상기 중지 의도를 포함하는 고객 발화음으로는 "잠깐만요", "다시~" 등이 될 수 있을 것이다.As a result of the determination, if the analysis fails, the automatic response control unit 430 repeats the process after S113, and if the analysis succeeds, it is determined whether the content of the analyzed customer voice includes the intention to stop the guidance voice (S2212) . A customer utterance including the intention to stop may be "wait a minute", "again", and the like.

안내 음성 중지 의도가 없으면 자동 응답 제어부(430)는 분석된 음성인식 내용에 대응하는 시나리오 항목을 선택하여 읽은(S227) 후 S113 이후의 과정을 반복해서 수행한다.If there is no intention to stop the voice guidance, the automatic response control unit 430 selects and reads a scenario item corresponding to the analyzed voice recognition content (S227) and repeats the process after S113.

그러나 중지 의도가 있는 것으로 판단되면 자동 응답 제어부(430)는 안내 음성 전송을 중지하고, 전송 중단된 위치인 중단 위치정보를 저장한(S223) 후, 중지 의도와 함께 음성인식 내용에 대응하는 시나리오가 존재하는지를 판단한다(S225).However, if it is determined that there is an intention to stop, the automatic response control unit 430 stops transmitting the guidance voice, stores the stop location information, which is the location where the transmission is stopped (S223), and then a scenario corresponding to the content of the voice recognition along with the intention to stop occurs It is determined whether it exists (S225).

음성인식 결과정보에 중지 의도와 함께 시나리오에 존재하는 서비스 항목에 대한 정보가 포함되어 있으면 자동 응답 제어부(430)는 분석된 음성인식 내용에 대응하는 시나리오 서비스 항목을 선택하여 읽은(S227) 후 상기 S113 이후의 과정을 반복 수행한다. If the voice recognition result information includes information on service items existing in the scenario along with the intention to stop, the automatic response control unit 430 selects and reads the scenario service items corresponding to the analyzed voice recognition contents (S227), and then reads (S227) the S113 Repeat the subsequent process.

반면 음성인식 내용에 대응하는 시나리오가 존재하지 않으면 자동 응답 제어부(430)는 상기 중지 의도가 있었으므로 중단된 서비스 항목의 다음 서비스 항목의 안내 음성을 선택 및 읽은(S229) 후 상술한 S113 이후의 과정을 반복 수행할 것이다.On the other hand, if there is no scenario corresponding to the voice recognition content, the automatic response control unit 430 selects and reads (S229) the voice guidance of the next service item of the stopped service item because there was the intention to stop, and then the process after S113 described above will be repeated.

한편, 본 발명은 전술한 전형적인 바람직한 실시예에만 한정되는 것이 아니라 본 발명의 요지를 벗어나지 않는 범위 내에서 여러 가지로 개량, 변경, 대체 또는 부가하여 실시할 수 있는 것임은 당해 기술분야에서 통상의 지식을 가진 자라면 용이하게 이해할 수 있을 것이다. 이러한 개량, 변경, 대체 또는 부가에 의한 실시가 이하의 첨부된 특허청구범위의 범주에 속하는 것이라면 그 기술사상 역시 본 발명에 속하는 것으로 보아야 한다.On the other hand, it is common knowledge in the art that the present invention is not limited to the typical preferred embodiments described above, but can be improved, changed, replaced or added in various ways without departing from the gist of the present invention. Those who have will be able to understand it easily. If implementation by such improvement, change, substitution or addition falls within the scope of the appended claims below, the technical idea should also be regarded as belonging to the present invention.

100: 고객 단말기 200: 음성인식 자동응답 시스템
300: 통화로 형성부 400: 자동 응답부
410: 저장부 411: 안내 시나리오 DB
412: 발성의도 DB 420: 음성 송수신부
430: 자동 응답 제어부 440: 발화음 모니터링부
450: 음성 인식부 460: 고객 발화 감지부
470: 발성의도 분석부 480: 안내 시나리오 선택부
490: 안내 음성 변환부
100: customer terminal 200: voice recognition automatic answering system
300: call forming unit 400: automatic answering unit
410: storage 411: guide scenario DB
412: vocalization diagram DB 420: voice transceiver
430: automatic response control unit 440: speech sound monitoring unit
450: voice recognition unit 460: customer speech detection unit
470: vocal intention analysis unit 480: guidance scenario selection unit
490: guidance voice conversion unit

Claims (15)

고객 단말기로부터 호 착신 시 고객 단말기와 통화로를 형성하는 통화로 형성부; 및
상기 통화로 형성부를 통해 임의의 고객 단말기와 통화로를 형성하고, 형성된 통화로를 통해 시나리오에 따른 안내 음성을 상기 고객 단말기로 제공하되, 발화음이 고객이 발성한 고객 발화음인지를 판단하여 고객 발화음인 경우에만 상기 안내 음성의 제공을 중단한 후 상기 고객 발화음을 분석하여 분석 실패 시 상기 시나리오의 중단된 부분부터 안내 음성을 상기 고객 단말기로 제공하고, 분석 성공 시 분석된 고객 발화음에 대응하는 시나리오 항목의 안내 음성을 상기 고객 단말기로 제공하고, 고객 단말기 측에서 인입되는 발화음의 상태에 따라 상기 제공 중인 안내 음성을 중단하거나, 상기 중단된 부분부터 안내 음성을 상기 고객 단말기로 재전송하거나, 상기 고객 단말기로 상기 발화음에 대응하는 시나리오의 서비스 항목의 안내 음성을 제공하는 자동 응답부를 포함하며,
상기 자동 응답부는,
제공할 서비스에 따른 다수의 서비스 순서 및 항목별 안내 음성을 포함하는 시나리오를 저장하는 안내 시나리오 DB를 포함하는 저장부;
상기 통화로 형성부를 통해 통화로 설정을 수행하여 통화를 형성하고, 고객 단말기로부터 입력되는 발화음의 세기를 측정한 발화음 세기 신호를 출력하는 음성 송수신부; 및
상기 음성 송수신부 및 통화로 형성부를 통해 임의의 고객 단말기와 형성된 통화로로 시나리오에 따른 안내 음성을 상기 고객 단말기로 제공하고, 고객 단말기 측에서 발성되는 발화음에 대한 발화음 세기 신호의 입력 시 상기 발화음 세기 신호가 일정 세기 이상이면 고객이 발성한 고객 발화음인지를 판단하여 고객 발화음인 경우에만 상기 안내 음성의 제공을 중단한 후 상기 고객 발화음을 분석하여 분석 실패 시 상기 시나리오의 중단된 부분부터 안내 음성을 상기 고객 단말기로 제공하고 분석 성공 시 분석된 고객 발화음에 대응하는 시나리오의 서비스 항목의 안내 음성을 상기 고객 단말기로 제공하는 자동응답 제어부를 포함하는 것을 특징으로 하는 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템.
a call path forming unit for forming a call path with the customer terminal when a call is received from the customer terminal; and
A call path is formed with an arbitrary customer terminal through the call path forming unit, and a guide voice according to a scenario is provided to the customer terminal through the formed call path, but it is determined whether the uttered sound is a customer uttered sound uttered by the customer. After stopping the provision of the guidance voice only in the case of utterances, the customer utterance is analyzed and, in the event of analysis failure, the guidance voice is provided to the customer terminal from the part where the scenario is interrupted, and when the analysis is successful, the analyzed customer utterance is A guide voice of a corresponding scenario item is provided to the customer terminal, and depending on the state of an incoming utterance from the customer terminal, the provided guidance voice is stopped, or the guidance voice is retransmitted to the customer terminal from the interrupted part, or , an automatic answering unit that provides a guide voice of a service item of a scenario corresponding to the utterance to the customer terminal,
The automatic response unit,
a storage unit including a guide scenario DB for storing scenarios including a plurality of service sequences according to a service to be provided and a guide voice for each item;
a voice transceiver configured to set up a call through the call path forming unit, form a call, and output a uttered sound intensity signal obtained by measuring the strength of a uttered sound input from a customer terminal; and
A guide voice according to a scenario is provided to the customer terminal through the voice transmission/reception unit and the communication path forming unit formed with any customer terminal, and when inputting the utterance sound intensity signal for the utterance sound uttered from the customer terminal side, the If the utterance strength signal is greater than a certain strength, it is determined whether the utterance is a customer utterance, and only when it is a customer utterance, the guidance voice is stopped, and then the customer utterance is analyzed and the scenario is interrupted when the analysis fails. Voice of customer voice, characterized in that it includes an automatic response control unit that provides a guide voice to the customer terminal from the first part and provides a guide voice of a service item of a scenario corresponding to the analyzed customer utterance to the customer terminal when the analysis is successful A voice recognition automatic response system with an intention detection function.
삭제delete 삭제delete 제1항에 있어서,
상기 자동응답 제어부는,
상기 음성 송수신부로부터 고객 단말기 측에서 발성되는 발화음에 대한 일정 세기 이상의 발화음 세기 신호가 입력되는지를 모니터링하고, 상기 일정 세기 이상의 발화음 세기 신호가 입력되면 음성인식 구동 신호를 출력하는 발화음 모니터링부;
상기 음성인식 구동 신호의 입력 시 구동되어 상기 음성 송수신부를 통해 수신되는 고객의 발화음성을 인식하고, 인식된 음성인식 결과정보를 출력하는 음성인식부;
상기 음성인식 결과정보를 입력받고 상기 음성인식 결과정보가 고객이 발성한 음성인지를 판단하여 고객이 발성한 음성이면 고객 발성 신호를 출력하는 고객 발화 감지부;
안내 시나리오 DB로부터 서비스에 대한 안내 시나리오 항목을 선택하여 읽어드린 후 출력하는 안내 시나리오 선택부; 및
고객 발화 감지부로부터 고객 발성 신호의 입력 시 안내 시나리오 선택부로부터 입력되는 안내 시나리오 항목의 안내 음성 데이터를 송신에 필요한 안내 음성으로 변환하여 상기 음성 송수신부를 통해 전송하는 안내 음성 변환부를 포함하는 것을 특징으로 하는 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템.
According to claim 1,
The automatic response control unit,
Speech sound monitoring for monitoring whether a utterance sound intensity signal of a certain intensity or more is input from the voice transceiver to a utterance sound uttered at the customer terminal side, and outputting a voice recognition driving signal when the utterance sound intensity signal of a certain intensity or more is input part;
a voice recognition unit driven when the voice recognition driving signal is input, recognizing a customer's spoken voice received through the voice transceiver, and outputting recognized voice recognition result information;
a customer utterance detection unit receiving the voice recognition result information, determining whether the voice recognition result information is a voice uttered by the customer, and outputting a customer utterance signal if the voice is uttered by the customer;
a guide scenario selection unit that selects and reads a guide scenario item for a service from the guide scenario DB and outputs it; and
When the customer speech signal is input from the customer speech detection unit, it comprises a guide voice conversion unit that converts the guide voice data of the guide scenario item input from the guide scenario selection unit into a guide voice required for transmission and transmits it through the voice transceiver. A voice recognition automatic response system that has a function to identify the intention of the customer's voice.
제4항에 있어서,
상기 고객 발화 감지부는,
상기 음성인식 결과정보가 의미를 가지는 키워드를 포함하는 경우 상기 고객 발성 신호를 출력하는 것을 특징으로 하는 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템.
5. The method of claim 4,
The customer speech detection unit,
A voice recognition automatic answering system having a function of identifying the intention of a customer's voice, characterized in that when the result information of the voice recognition includes a keyword having a meaning, the customer voice signal is output.
제4항에 있어서,
상기 고객 발화 감지부는,
상기 음성인식 결과정보가 고객의 안내 음성을 중지하기를 원하는 의미를 가지는 키워드를 포함하는 경우 상기 고객 발성 신호를 출력하는 것을 특징으로 하는 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템.
5. The method of claim 4,
The customer speech detection unit,
When the voice recognition result information includes a keyword having the meaning of wanting to stop the customer's guidance voice, the voice recognition automatic response system having a function of identifying the intention of the customer's voice, characterized in that outputting the customer's voice signal.
제4항에 있어서,
상기 저장부는,
적어도 하나 이상의 키워드를 포함하는 다수의 발성 의도 정보를 정의하는 발성의도 DB를 더 포함하고,
상기 안내 시나리오 DB는,
발성의도 별 안내 시나리오를 저장하고,
상기 자동응답 제어부는,
상기 음성인식 결과정보를 입력받고, 상기 발성의도 DB를 참조하여 입력된 음성인식 결과정보의 적어도 하나 이상의 키워드들에 대응하는 발성의도 정보를 찾아 상기 고객이 발화한 고객 발화음에 대한 발성의도를 분석하는 발성의도 분석부를 더 포함하되,
상기 안내 시나리오 선택부는,
상기 발성의도 분석부에서 분석된 발성의도에 대응하는 시나리오의 해당 항목을 선택하여 출력하는 것을 특징으로 하는 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답시스템.
5. The method of claim 4,
The storage unit,
Further comprising a speech intention DB defining a plurality of speech intention information including at least one or more keywords,
The guide scenario DB is,
Save the guidance scenario for each degree of vocalization,
The automatic response control unit,
The voice recognition result information is received, and the vocalization intention information corresponding to at least one or more keywords of the inputted voice recognition result information is searched for by referring to the vocalization intention DB, and the voice recognition for the customer utterance uttered by the customer is performed. Further comprising a vocalization analysis unit to analyze the degree,
The guide scenario selection unit,
A voice recognition automatic response system having a function of identifying the intention of a customer's voice, characterized in that the selected item of a scenario corresponding to the degree of speech analyzed by the speech intention analysis unit is outputted.
삭제delete 통화로 형성부가 고객 단말기로부터 호 착신 시 고객 단말기와 통화로를 형성하는 통화로 형성 과정; 및
자동 응답부가 상기 통화로 형성부를 통해 임의의 고객 단말기와 통화로를 형성하고, 형성된 통화로를 통해 시나리오에 따른 안내 음성을 상기 고객 단말기로 제공하되, 상기 통화로 형성부를 통해 임의의 고객 단말기와 형성된 통화로를 통해 시나리오에 따른 안내 음성을 상기 고객 단말기로 제공하되, 고객 단말기 측에서 발성되는 발화음이 고객이 발성한 고객 발화음인지를 판단하여 고객 발화음인 경우에만 상기 안내 음성의 제공을 중단한 후 상기 고객 발화음을 분석하여 분석 실패 시 상기 시나리오의 중단된 부분부터 안내 음성을 상기 고객 단말기로 제공하고 분석 성공 시 분석된 고객 발화음에 대응하는 시나리오 항목의 안내 음성을 상기 고객 단말기로 제공하고, 고객 단말기 측에서 인입되는 발화음의 상태에 따라 상기 제공 중인 안내 음성을 중단하거나, 상기 중단된 부분부터 안내 음성을 상기 고객 단말기로 재전송하거나, 상기 고객 단말기로 상기 발화음에 대응하는 시나리오의 서비스 항목의 안내 음성을 제공하는 자동 응답 과정을 포함하되,
상기 자동 응답 과정은,
상기 자동 응답부의 발화음 모니터링부가 고객 단말기 측에서 발성되는 발화음에 대한 일정 세기 이상의 발화음 세기 신호가 입력되는지를 모니터링하고, 상기 일정 세기 이상의 발화음 세기 신호가 입력되면 음성인식 구동 신호를 출력하는 발화음 모니터링 단계;
상기 자동 응답부의 음성 인식부가 상기 음성인식 구동 신호의 입력 시 구동되어 음성 송수신부를 통해 수신되는 고객의 발화음성을 인식하고, 인식된 음성인식 결과정보를 출력하는 음성인식 단계;
상기 자동 응답부의 고객 발화 감지부가 상기 음성인식 결과정보를 입력받고 상기 음성인식 결과정보가 고객이 발성한 음성인지를 판단하여 고객이 발성한 음성이면 고객 발성 신호를 출력하는 고객 발화 감지 단계;
상기 자동 응답부의 안내 시나리오 선택부가 안내 시나리오 DB로부터 서비스에 대한 안내 시나리오 항목을 선택하여 읽어드린 후 출력하는 안내 시나리오 선택 단계; 및
상기 자동 응답부의 안내 음성 변환부가 고객 발화 감지부로부터 고객 발성 신호의 입력 시 안내 시나리오 선택부로부터 입력되는 안내 시나리오 항목의 안내 음성 데이터를 송신하기 위한 안내 음성으로 변환하여 상기 음성 송수신부를 통해 전송하는 안내 음성 변환 단계를 포함하는 것을 특징으로 하는 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답방법.
a call path forming process in which the call path forming unit establishes a call path with the customer terminal when a call is received from the customer terminal; and
An automatic answering unit establishes a call path with any customer terminal through the call path forming unit, and provides a guide voice according to a scenario to the customer terminal through the established call path, and is formed with any customer terminal through the call path forming unit A guide voice according to a scenario is provided to the customer terminal through a call path, but it is determined whether the utterance uttered by the customer terminal is a customer utterance uttered by the customer, and only when it is a customer utterance, the provision of the guidance voice is stopped After analyzing the customer utterance, when the analysis fails, the guidance voice is provided to the customer terminal from the interrupted part of the scenario, and when the analysis is successful, the guidance voice of the scenario item corresponding to the analyzed customer utterance is provided to the customer terminal and, according to the state of the incoming utterance from the customer terminal side, stop the guidance voice being provided, retransmit the guidance voice from the stopped part to the customer terminal, or use the customer terminal to respond to the utterance. Including an automatic response process for providing a guide voice for service items,
The automatic response process is
The speech sound monitoring unit of the automatic answering unit monitors whether a speech sound intensity signal of a certain intensity or more for a speech sound uttered by the customer terminal is input, and outputs a voice recognition driving signal when the speech sound intensity signal of a certain intensity or more is input utterance monitoring step;
a voice recognition step of recognizing a customer's spoken voice received through a voice transceiver by driving the voice recognition unit of the automatic response unit when the voice recognition driving signal is input, and outputting recognized voice recognition result information;
a customer utterance detection step of receiving the voice recognition result information by the customer utterance detection unit of the automatic response unit, determining whether the voice recognition result information is a voice uttered by the customer, and outputting a customer utterance signal if the voice is uttered by the customer;
a guidance scenario selection step in which the guidance scenario selection unit of the automatic response unit selects and reads a guidance scenario item for a service from the guidance scenario DB and outputs it; and
When the guide voice conversion unit of the automatic response unit receives a customer speech signal from the customer speech detection unit, the guide is converted into a guide voice for transmitting the guide voice data of the guide scenario item input from the guide scenario selection unit and transmitted through the voice transceiver. A voice recognition automatic response method having a function of identifying the intention of a customer's voice, characterized in that it comprises a voice conversion step.
삭제delete 삭제delete 제9항에 있어서,
상기 고객 발화 감지 단계는,
상기 고객 발화 감지부가 상기 음성인식 결과정보가 의미를 가지는 키워드를 포함하는 경우 상기 고객 발성 신호를 출력하는 것을 특징으로 하는 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답방법.
10. The method of claim 9,
The customer speech detection step is,
The voice recognition automatic response method having a function of identifying the intention of the customer's voice, characterized in that the customer's utterance detection unit outputs the customer utterance signal when the voice recognition result information includes a meaningful keyword.
제9항에 있어서,
상기 고객 발화 감지 단계는,
상기 고객 발화 감지부가 상기 음성인식 결과정보가 고객의 안내 음성을 중지하기를 원하는 의미를 가지는 키워드를 포함하는 경우 상기 고객 발성 신호를 출력하는 것을 특징으로 하는 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답방법.
10. The method of claim 9,
The customer speech detection step is,
Speech recognition having a function of identifying the intention of customer voice, characterized in that the customer speech detection unit outputs the customer voice signal when the voice recognition result information includes a keyword having a meaning desired to stop the customer's guidance voice Automatic response method.
제9항에 있어서,
상기 자동 응답부의 발성의도 분석부가 상기 음성인식 결과정보를 입력받고, 발성의도 DB를 참조하여 입력된 음성인식 결과정보의 적어도 하나 이상의 키워드들에 대응하는 발성의도 정보를 찾아 상기 고객이 발화한 고객 발화음에 대한 발성의도를 분석하는 발성의도 분석 과정을 더 포함하되,
상기 안내 시나리오 선택 과정에서 상기 안내 시나리오 선택부가 상기 발성의도 분석부에서 분석된 발성의도에 대응하는 시나리오의 해당 항목을 선택하여 출력하는 것을 특징으로 하는 고객 음성의 발성 의도 파악 기능을 가지는 음성인식 자동응답방법.
10. The method of claim 9,
The vocalization intention analysis unit of the automatic response unit receives the speech recognition result information, finds the vocalization intention information corresponding to at least one or more keywords of the input speech recognition result information with reference to the vocalization intention DB, and the customer utters the utterance. Further comprising a vocalization analysis process of analyzing the vocalization intention for one customer utterance,
Speech recognition having a function of identifying the intention of a customer's voice, characterized in that in the guide scenario selection process, the guide scenario selection unit selects and outputs a corresponding item of a scenario corresponding to the speech intention analyzed by the speech intention analysis unit Automatic response method.
삭제delete
KR1020210000732A 2020-11-18 2021-01-05 Voice recognition automatic response system with a function to identify the vocal intention of the customer's voice and method thereof KR102260219B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20200154510 2020-11-18
KR1020200154510 2020-11-18

Publications (1)

Publication Number Publication Date
KR102260219B1 true KR102260219B1 (en) 2021-06-03

Family

ID=76396446

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210000732A KR102260219B1 (en) 2020-11-18 2021-01-05 Voice recognition automatic response system with a function to identify the vocal intention of the customer's voice and method thereof

Country Status (1)

Country Link
KR (1) KR102260219B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102581221B1 (en) * 2023-05-10 2023-09-21 주식회사 솔트룩스 Method, device and computer-readable recording medium for controlling response utterances being reproduced and predicting user intention
US11967340B2 (en) 2022-06-24 2024-04-23 Actionpower Corp. Method for detecting speech in audio data

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101121144B1 (en) * 2011-09-01 2012-03-20 주식회사 예스피치 Automatic response system for voice recognition with ability to induce customer's speech step-by-step and the method
KR101195870B1 (en) 2011-12-20 2012-10-30 주식회사 예스피치 Voice recognition automatic response system with differential scenario adaption function and method thereof
KR20140000943A (en) * 2012-06-26 2014-01-06 이철 System, method and computer readable recording medium for providing auto response by participation of teller

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101121144B1 (en) * 2011-09-01 2012-03-20 주식회사 예스피치 Automatic response system for voice recognition with ability to induce customer's speech step-by-step and the method
KR101195870B1 (en) 2011-12-20 2012-10-30 주식회사 예스피치 Voice recognition automatic response system with differential scenario adaption function and method thereof
KR20140000943A (en) * 2012-06-26 2014-01-06 이철 System, method and computer readable recording medium for providing auto response by participation of teller

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11967340B2 (en) 2022-06-24 2024-04-23 Actionpower Corp. Method for detecting speech in audio data
KR102581221B1 (en) * 2023-05-10 2023-09-21 주식회사 솔트룩스 Method, device and computer-readable recording medium for controlling response utterances being reproduced and predicting user intention

Similar Documents

Publication Publication Date Title
KR102260219B1 (en) Voice recognition automatic response system with a function to identify the vocal intention of the customer's voice and method thereof
US8701003B2 (en) Methods and apparatus for controlling a user interface based on the emotional state of a user
US7668710B2 (en) Determining voice recognition accuracy in a voice recognition system
USRE45289E1 (en) Selective noise/channel/coding models and recognizers for automatic speech recognition
US8000962B2 (en) Method and system for using input signal quality in speech recognition
US20030120486A1 (en) Speech recognition system and method
JP2011022600A (en) Method for operating speech recognition system
US20060095268A1 (en) Dialogue system, dialogue method, and recording medium
US8532279B2 (en) Method for increasing the efficiency of automated telephony systems
KR19980080615A (en) Voice activity detection method and apparatus
WO2011119168A1 (en) Context based voice activity detection sensitivity
JPH07502834A (en) Voice control communication device and processing method
US7167544B1 (en) Telecommunication system with error messages corresponding to speech recognition errors
CN1830025A (en) Method for driving a dialog system
EP2504745B1 (en) Communication interface apparatus and method for multi-user
JPH10504695A (en) Test method
CN1708783A (en) Method and system for speech recognition
US20070047708A1 (en) Voice call reply using voice recognition and text to speech
CN114026557A (en) Speech analysis device, speech analysis method, and program
JP6863179B2 (en) Call center system, call center device, dialogue method, and its program with customer complaint detection function
CN110197663B (en) Control method and device and electronic equipment
CN109841216B (en) Voice data processing method and device and intelligent terminal
US20130151248A1 (en) Apparatus, System, and Method For Distinguishing Voice in a Communication Stream
CN112435669B (en) Robot multi-wheel dialogue voice interaction method, system and terminal equipment
KR101021216B1 (en) Method and apparatus for automatically tuning speech recognition grammar and automatic response system using the same

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant