WO2022059852A1 - Stress response system and method for counselor - Google Patents

Stress response system and method for counselor Download PDF

Info

Publication number
WO2022059852A1
WO2022059852A1 PCT/KR2020/017259 KR2020017259W WO2022059852A1 WO 2022059852 A1 WO2022059852 A1 WO 2022059852A1 KR 2020017259 W KR2020017259 W KR 2020017259W WO 2022059852 A1 WO2022059852 A1 WO 2022059852A1
Authority
WO
WIPO (PCT)
Prior art keywords
customer terminal
voice data
central server
stress
customer
Prior art date
Application number
PCT/KR2020/017259
Other languages
French (fr)
Korean (ko)
Inventor
박종수
Original Assignee
주식회사 반디아이씨티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 반디아이씨티 filed Critical 주식회사 반디아이씨티
Publication of WO2022059852A1 publication Critical patent/WO2022059852A1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/70ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mental therapies, e.g. psychological therapy or autogenous training
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/165Evaluating the state of mind, e.g. depression, anxiety
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61MDEVICES FOR INTRODUCING MEDIA INTO, OR ONTO, THE BODY; DEVICES FOR TRANSDUCING BODY MEDIA OR FOR TAKING MEDIA FROM THE BODY; DEVICES FOR PRODUCING OR ENDING SLEEP OR STUPOR
    • A61M21/00Other devices or methods to cause a change in the state of consciousness; Devices for producing or ending sleep by mechanical, optical, or acoustical means, e.g. for hypnosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61MDEVICES FOR INTRODUCING MEDIA INTO, OR ONTO, THE BODY; DEVICES FOR TRANSDUCING BODY MEDIA OR FOR TAKING MEDIA FROM THE BODY; DEVICES FOR PRODUCING OR ENDING SLEEP OR STUPOR
    • A61M21/00Other devices or methods to cause a change in the state of consciousness; Devices for producing or ending sleep by mechanical, optical, or acoustical means, e.g. for hypnosis
    • A61M21/02Other devices or methods to cause a change in the state of consciousness; Devices for producing or ending sleep by mechanical, optical, or acoustical means, e.g. for hypnosis for inducing sleep or relaxation, e.g. by direct nerve stimulation, hypnosis, analgesia
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61MDEVICES FOR INTRODUCING MEDIA INTO, OR ONTO, THE BODY; DEVICES FOR TRANSDUCING BODY MEDIA OR FOR TAKING MEDIA FROM THE BODY; DEVICES FOR PRODUCING OR ENDING SLEEP OR STUPOR
    • A61M21/00Other devices or methods to cause a change in the state of consciousness; Devices for producing or ending sleep by mechanical, optical, or acoustical means, e.g. for hypnosis
    • A61M2021/0005Other devices or methods to cause a change in the state of consciousness; Devices for producing or ending sleep by mechanical, optical, or acoustical means, e.g. for hypnosis by the use of a particular sense, or stimulus
    • A61M2021/0027Other devices or methods to cause a change in the state of consciousness; Devices for producing or ending sleep by mechanical, optical, or acoustical means, e.g. for hypnosis by the use of a particular sense, or stimulus by the hearing sense

Definitions

  • the present invention relates to a technique for reducing the stress of a counselor working in a call center or the like.
  • the job of a call center worker is to provide a service that easily and conveniently assists various tasks from the customer's point of view.
  • the call center receives inquiries and claims from customers in the process of purchasing products through interaction and communication with customers. In this way, customers can easily, simply and conveniently call the call center and receive detailed explanations about usage through the call center agent or ARS. It provides a service that can minimize the hassle of waiting by notifying the delivery delay or cancellation process.
  • you have a question about how to use the product after purchasing the product by phone or other channels at the call center you can receive a detailed explanation through one-on-one contact with a professional counselor, or you can deliver or receive inconveniences and problems about use. .
  • call center counselors are emotional workers who can suffer emotionally during the counseling process.
  • the present invention has been devised to solve the above problems, and an object of the present invention is to provide a system method corresponding to the stress of a counselor working in a call center, etc. to be reduced.
  • the present invention for achieving the above object relates to a stress response system for a counselor, as a customer terminal possessed by a customer conducting a consultation with a counselor, and a device worn by a counselor to respond to a consultation with the customer , a headset device having a voice output unit for outputting a voice signal received from a customer terminal connected to counseling, and a voice input unit for receiving the counselor's voice and converting it into an electrical signal for transmission to the customer terminal, the customer terminal and the above It includes a central server that collects voice signals from the headset device, analyzes the collected voice signals to calculate a stress index, and outputs a voice signal for responding to a predetermined stress to the customer terminal according to the calculated stress index. .
  • the central server separates voice data including decibel, octave, utterance speed, and resonance frequency information from voice data collected from the customer terminal and the headset device and voice data including word information, and separates voice data and voice data can be analyzed to calculate the stress index.
  • the central server may analyze decibels, octaves, and utterance rates in the voice data of the customer terminal by comparing them with predetermined reference values.
  • the central server may analyze the voice data collected from the customer terminal and the headset device by checking whether the customer's resonant frequency and the counselor's resonant frequency overlap.
  • the central server may extract an emotion word, which is a word representing emotion, from the voice data of the customer terminal, and analyze the extracted emotion word by comparing it with a pre-stored emotion word grade to give a grade.
  • an emotion word which is a word representing emotion
  • the central server may extract an offensive word, which is an offensive word including abusive language and profanity, from the voice data of the customer terminal, and analyze it in a manner that confirms whether the extracted offensive word exists.
  • an offensive word which is an offensive word including abusive language and profanity
  • FIG. 1 conceptually illustrates the configuration of a stress response system for a counseling worker according to an embodiment of the present invention.
  • FIG. 2 is a flowchart illustrating a stress response method for a counseling worker according to an embodiment of the present invention.
  • FIG. 3 is a flowchart illustrating a process of calculating a stress index in a method for coping with stress for a counseling worker according to an embodiment of the present invention.
  • FIG. 4 is a diagram illustrating an emotion rating according to an embodiment of the present invention.
  • FIG. 5 is a diagram illustrating an attack word according to an embodiment of the present invention.
  • FIG. 6 is a diagram illustrating voice output according to a stress level in an embodiment of the present invention.
  • FIG. 7 is a diagram illustrating distance information set in an attack word according to an embodiment of the present invention.
  • the present invention relates to a stress response system for a counseling worker, a customer terminal possessed by a customer conducting a consultation with a counselor, and a device worn by a counselor to respond to a consultation with a customer, received from a customer terminal connected to counseling
  • a headset device having a voice output unit for outputting one voice signal, a voice input unit for receiving the counselor's voice, converting it into an electrical signal and transmitting it to the customer terminal, and collecting voice signals from the customer terminal and the headset device and a central server for calculating a stress index by analyzing the collected voice signals, and outputting a voice signal for responding to a predetermined stress according to the calculated stress index to the customer terminal.
  • the central server separates voice data including decibel, octave, utterance speed, and resonance frequency information from voice data collected from the customer terminal and the headset device and voice data including word information, and separates voice data and voice data can be analyzed to calculate the stress index.
  • unit refers to a hardware component such as software, FPGA, or ASIC, and “unit” performs certain roles. However, “part” is not meant to be limited to software or hardware.
  • a “unit” may be configured to reside on an addressable storage medium and may be configured to refresh one or more processors.
  • part includes components such as software components, object-oriented software components, class components and task components, processes, functions, properties, procedures, subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays and variables.
  • components and “parts” may be combined into a smaller number of components and “parts” or further divided into additional components and “parts”.
  • FIG. 1 conceptually illustrates the configuration of a stress response system for a counseling worker according to an embodiment of the present invention.
  • the stress response system for a counseling worker of the present invention includes a headset device 100 , a central server 200 , and a customer terminal 300 .
  • the headset device 100 , the central server 200 , and the customer terminal 300 may communicate through a wired/wireless network.
  • the headset device 100 is a device worn by a counselor to respond to a consultation with a customer, and includes a voice output unit that outputs a voice signal received from the customer terminal 300 connected to counseling, and an electrical signal that receives the counselor's voice. It has a voice input unit for converting and transmitting to the customer terminal (300).
  • the customer terminal 300 is a terminal possessed by a customer who conducts a consultation with a counselor.
  • the customer terminal 300 may be a concept including a mobile communication terminal including a mobile phone, a mobile phone, a smart phone, a tablet PC, etc. capable of communicating through a communication network, and a wired phone, an Internet phone, and the like.
  • the central server 200 collects voice signals from the customer terminal 300 and the headset device 100, analyzes the collected voice signals to calculate a stress index, and responds to a predetermined stress according to the calculated stress index. A voice signal is output to the customer terminal 300 .
  • the central server 200 receives voice data including decibels, octaves, speech rates, and resonance frequency information from the voice signals collected from the customer terminal 300 and the headset device 100, and word information. It is possible to classify the included voice data, and calculate the stress index by analyzing the voice data and the voice data, respectively.
  • the central server 200 may analyze the voice data of the customer terminal 300 by comparing decibels, octaves, and utterance rates with respective predetermined reference values.
  • the central server 200 may analyze the voice data collected from the customer terminal 300 and the headset device 100 by checking whether the customer's resonance frequency and the counselor's resonance frequency overlap.
  • the central server 200 may extract an emotion word, which is a word representing emotion, from the voice data of the customer terminal 300 , and compare the extracted emotion word with a pre-stored emotion word grade to give a grade.
  • An emotional word is a word that basically expresses the speaker's emotions.
  • the speaker's emotions can be classified as positive, negative, or neutral, and the emotional word graded as an emotional word is an emotional word classified as a negative emotion. As shown in FIG. 4 , it may be set that the degree of negative emotion increases as the grade of the emotional word increases.
  • the central server 200 may extract an offensive word, which is an offensive word including abusive language and profanity, from the voice data of the customer terminal 300 and analyze it in a manner that confirms the existence of the extracted offensive word.
  • offensive words may include profanity such as X-arm, XX year, etc., as well as profane words and phrases such as straight, out, responsible, etc. that make the listener feel coercive.
  • the central server 200 may be a concept including the database 210 .
  • FIG. 2 is a flowchart illustrating a stress response method for a counseling worker according to an embodiment of the present invention.
  • the central server 200 collects voice signals from the customer terminal 300 and the headset device 100 ( S201 ), and classifies the collected voice signals into voice data and voice data ( S203 ).
  • the voice data includes information on decibels, octaves, speech rates, and resonance frequencies, and the voice data includes information on words.
  • the central server 200 analyzes the decibels, octaves, and utterance rates in the voice data of the customer terminal 300 by comparing them with predetermined reference values (S205).
  • the central server 200 analyzes the voice data collected from the customer terminal and the headset device in a manner that confirms whether the customer's resonance frequency and the counselor's resonance frequency overlap (S207).
  • the central server 200 extracts an emotion word that is a word representing emotion from the voice data of the customer terminal 300 (S209), and compares the extracted emotion word with the pre-stored emotion word grade to give a grade. Analyze (S211).
  • the central server 200 extracts an offensive word, which is an offensive word including profanity and profanity, from the voice data of the customer terminal 300 (S209), and analyzes it in a manner that confirms the existence of the extracted offensive word (S209) ( S213).
  • an offensive word which is an offensive word including profanity and profanity
  • valid information of voice data includes decibel, octave, speech rate, and resonance frequency information.
  • valid information of voice data can be classified into emotional words (e.g. upset, tired, annoyed, angry, etc.) and offensive words (straight, change, responsible, X-arm, etc.).
  • emotional words e.g. upset, tired, annoyed, angry, etc.
  • offensive words straight, change, responsible, X-arm, etc.
  • the process of analyzing valid information of voice data is as follows.
  • the process of analyzing valid information of voice data is as follows.
  • the sentiment words extracted from the voice data are graded according to the pre-stored sentiment grades. Then, it is determined whether the average of the grades of the appraised words is equal to or greater than a predetermined reference value.
  • FIG. 4 is a diagram illustrating an emotion rating according to an embodiment of the present invention.
  • emotional words refer to words expressing emotions such as upset, difficult, annoyed, and angry.
  • the ratings for each emotional word are exemplified, 'I'm upset, upset, upset' is grade 1, 'it's hard, it's hard, it's hard' is grade 2, 'annoyed, annoyed, annoyed, 'Because I'm annoyed' is classified as grade 3, and 'because I'm angry, angry, upset', etc. is classified into grade 4.
  • the average of the emotional grades is 2.5.
  • the average of these 2.5 ratings is judged to be 2 or more, which is the standard value, and the stress index is calculated.
  • the central server 200 determines whether an attack word exists in the voice data.
  • FIG. 5 is a diagram illustrating an attack word according to an embodiment of the present invention.
  • FIG. 5 as an example of an attack word stored in the database 210, it illustrates an attack word such as straight, straight, properly, change, off, you, you, responsible, X arm, XX year, In addition to this, it is natural that various attack words can be set.
  • the method of determining the stress index in the central server 200 in the present invention is exemplified as follows.
  • Condition 3 Is the average of the extracted appraised words higher than the standard value?
  • the central server 200 checks the number of corresponding conditions from among the conditions 1 to 3, and calculates the stress index as 1 level 1 (good), 2 sides 2 steps (caution), and 3 sides 3 steps (warning) .
  • condition 4 the stress index is raised by one level.
  • the level 1 good is raised to level 2 (caution)
  • level 2 caution
  • level 3 warning
  • level 3 caution
  • level 4 line blocked).
  • the central server 200 outputs a corresponding voice message to the customer terminal 300 according to the calculated stress index.
  • FIG. 6 is a diagram illustrating voice output according to a stress level in an embodiment of the present invention.
  • step 3 warning
  • a voice is output to the customer terminal 300 saying 'Customer, if you do not continuously calm your excitement, the response will be automatically terminated.
  • step 4 line cutoff
  • a voice is output to the customer terminal 300 saying 'Customer, the line is cut off, and the customer center will not be available for the next 3 months.
  • FIG. 3 is a flowchart illustrating a process of calculating a stress index in a method for coping with stress for a counseling worker according to an embodiment of the present invention.
  • the central server 200 divides the voice data into time units (S303).
  • the central server 200 compares the decibel, octave, and utterance speed values of the input voice data with a reference value to calculate a comparison value (S305, S307).
  • the central server 200 determines the degree of overlap between the customer's resonant frequency and the counseling worker's resonant frequency from the input voice data to calculate the degree of redundancy (S309, S311).
  • the central server 200 calculates a stress index according to the voice characteristics by using the calculated comparison value and the degree of redundancy (S313).
  • the central server 200 divides the voice data into time units (S317).
  • the central server 200 converts the divided voice data into text data (S319).
  • the central server 200 separates the text data in sentence units (S321).
  • the central server 200 identifies each word in the sentence (S323).
  • the central server 200 extracts distance information between each word (S325).
  • the distance information between the emotional words/attack words may be the number of characters or words existing between the emotional words/attack words or a time interval between the emotional words/attack words.
  • the central server 200 checks whether the target word exists in the database 210 in which sentiment words or offensive words are set and stored in advance (S327).
  • the central server 200 calculates the stress index of the emotional word or the offensive word by using the distance information (S329).
  • sentiment words/attack words are stored in the database 210 in advance.
  • the central server 200 determines whether sentiment words/attack words exist in the text data with reference to the database 210, and if there are sentiment words/attack words, creates a list of corresponding sentiment words/attack words.
  • the sentiment word/attack word list includes distance information between the detected sentiment word/attack word.
  • the distance information may be composed of any one of information such as the number of characters or words existing between the emotional words/attack words, and a time interval between the emotional words/attack words. Alternatively, it may be configured by a combination thereof.
  • the central server 200 calculates the final stress index by synthesizing the stress index of the voice characteristic and the stress index of an emotional word or an offensive word (S331).
  • FIG. 7 is a diagram illustrating distance information set in an attack word according to an embodiment of the present invention.
  • the central server 200 sequentially detected the attack words from the text data in the order of "XX year, straight, X arm, responsible person, change".
  • the distance information of each of the offensive words is expressed as "3, 8, 5, 4", where each number is the number of words between the offensive words. That is, there are 3 words between "XX year” and “straight”, and there are 8 words between "straight” and "X arm”.
  • the offensive word list is configured to include the offensive words and distance information between each of the offensive words.
  • the central server 200 determines an offensive word stress index based on the generated offensive word list, and calculates an offensive word stress index based on distance information between the offensive words and the offensive words included in the offensive word list.
  • an intelligent server may be used.
  • the intelligent server can create an emotion DB and an attack word DB based on the text data.
  • the sentiment DB and the attack word DB may be generated by artificial intelligence (AI), where the artificial intelligence system is a rule-based system, a neural network-based system, for example: It may be a feedforward neural network (FNN), a recurrent neural network (RNN)).
  • AI artificial intelligence
  • FNN feedforward neural network
  • RNN recurrent neural network
  • the sentiment DB and the offensive word DB may be a predefined set or may be generated in real time by a user's request.
  • Intelligent servers are front end, natural language platform, capsule DB, execution engine, end user interface, management platform, big data It may include a big data platform, or an analytic platform.
  • the front end is a part that receives voice data from the user terminal.
  • the natural language platform creates an aggregate using the intention and parameters determined by the automatic speech recognition module that converts speech data into text data, the natural language understanding module that performs grammatical analysis and semantic analysis to determine the user's intention, and the natural language understanding module It consists of a planner module that
  • the capsule database is a database that stores information on relationships between a plurality of concepts and operations corresponding to a plurality of domains.
  • reference information for determining one DB is included. can do. For example, when voice data received from a plurality of domains is stored for the sentiment DB and the offensive language DB, one voice data is analyzed to determine whether each divided voice DB is the sentiment DB or the offensive language DB It is possible to generate reference information for
  • the execution engine produces the result, and the big data platform performs data collection and storage functions.
  • the process of extracting distance information by identifying words from text data of S321 to S325 in FIG. 3 may use supervised learning.
  • Supervised learning can be largely divided into symbolic learning and statistical-based learning.
  • the semiotic learning method extracts rules or learns a classification procedure from a marked corpus, then applies it to the unmarked corpus, and uses a decision tree, transformation-based error driven learning), a linear separator, instance-based learning, and the like may be used.
  • the statistical-based learning method extracts random variables (attributes) from within the learning corpus, builds a model that determines the probability distribution among random variables observed across multiple contexts, and typically uses a naive Bayes classifier, max There are entropy (maximum entropy principle), Markov model, and the like.
  • Statistical part-of-speech tagging using Markov model and transformation-based tagging applying learning by transformation-based error are effective supervised learning for solving the part-of-speech tagging problem among various natural language ambiguity problems.
  • a method of transforming the Markov model to fit the characteristics of Korean may be used, and a method of estimating the transition relationship between words in Korean using a morpheme uni-gram may be used.
  • Probabilistic syntax analysis can extract a context-free grammar (CFG) rule in which a probability value is specified by using a probability-free context (PCFG).
  • CFG context-free grammar
  • PCFG probability-free context
  • the CCG parser of Maximum Entropy Statistical Combinatory Categorical Grammar expresses unbounded dependencies and local function-argument structures, It learns using a corpus to which CCG vocabulary tags and vocabulary dependent structures are attached.
  • dependency structures are expressed as features, and the system can compute a model expressed as a set of dependency structures with the highest probability from a standard corpus marked with a marker.
  • the central server 200 generates a stress index model through machine learning using emotional words/attack words and distance information, and creates a stress index model through machine learning using voice characteristic data.
  • a reference value can be set with reference to previously received data.
  • SVM support vector machine

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Psychiatry (AREA)
  • Psychology (AREA)
  • Biomedical Technology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Hospice & Palliative Care (AREA)
  • Child & Adolescent Psychology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Anesthesiology (AREA)
  • Epidemiology (AREA)
  • Developmental Disabilities (AREA)
  • Social Psychology (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Signal Processing (AREA)
  • Hematology (AREA)
  • Databases & Information Systems (AREA)
  • Pain & Pain Management (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Educational Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

The present invention relates to a stress response system for a counselor, comprising: a customer terminal possessed by a customer receiving counseling from a counselor; a headset device, which is worn by the counselor in order to counsel the customer, has a verbal sound output unit for outputting a verbal sound signal received from the counseling-connected customer terminal and a verbal sound input unit for receiving the verbal sound input of the counselor, converting same into an electrical signal, and transmitting same to the customer terminal; and a central server, which collects verbal sound signals from the customer terminal and the headset device, analyzes the collected verbal sound signals to calculate a stress index, and outputs, to the customer terminal, a predetermined verbal sound signal for responding to stress according to the calculated stress index. According to the present invention, by warning a customer or providing a sound for lowering excitability during counseling at a call center and the like, a counselor becoming stressed can be directly prevented.

Description

상담 노동자를 위한 스트레스 대응 시스템 및 방법Stress Response System and Method for Counseling Workers
본 발명은 콜센터 등에서 근무하는 상담 노동자의 스트레스를 경감시키기 위한 기술에 관한 것이다.The present invention relates to a technique for reducing the stress of a counselor working in a call center or the like.
서비스 산업의 국가 경제 의존도가 높아지고 주도적인 산업으로 발전하면서 콜센터 산업은 지속적으로 성장세를 보이고 있으며, '2017 컨택센터 산업총람'에 따르면 2012년부터 2016년까지 콜센터에 종사하는 상담원 수는 약 7.8% 성장하였고, 사용 기업까지 포함하면 약 40만명이 넘는 것으로 나타났다. The call center industry continues to grow as the service industry becomes more dependent on the national economy and develops into a leading industry. Including the companies using it, it was found that there were more than 400,000 people.
콜센터 종사자의 업무는 고객의 관점에서 다양한 업무를 쉽고, 간편하게 도움을 주는 서비스를 제공하는 것이다. 콜센터는 고객과의 상호 작용과 소통을 통하여 고객이 제품을 구매하는 프로세스에서 문의 사항이나 클레임을 접수한다. 이처럼, 고객은 쉽고 간단하고 편리하게 콜센터에 전화를 걸어 콜센터 상담원이나 ARS를 통해 사용에 대한 상세한 설명을 들 수 있고, 제품이나 서비스 구매 후 상품 배달이 지연 또는 취소되는 경우에는 콜센터 상담원이 미리 상품의 배달 지연 여부나 취소과정을 알려줌으로써, 기다리는 번거로움을 최소화할 수 있는 서비스를 제공한다. 또한, 콜센터에 전화, 또는 다른 채널로 상품을 구입한 후 사용방법의 질문이 있는 경우 전문적인 상담원과 일대일 컨택을 통해 자세한 설명을 들을 수도 있고, 사용에 대한 불편함과 문제점을 전달할 수도 받을 수도 있다. The job of a call center worker is to provide a service that easily and conveniently assists various tasks from the customer's point of view. The call center receives inquiries and claims from customers in the process of purchasing products through interaction and communication with customers. In this way, customers can easily, simply and conveniently call the call center and receive detailed explanations about usage through the call center agent or ARS. It provides a service that can minimize the hassle of waiting by notifying the delivery delay or cancellation process. In addition, if you have a question about how to use the product after purchasing the product by phone or other channels at the call center, you can receive a detailed explanation through one-on-one contact with a professional counselor, or you can deliver or receive inconveniences and problems about use. .
이러한 콜센터는 최근 기업에 대한 급속히 성장·발전하고 있으며, 기존의 콜센터가 아닌 고객과의 접점의 용어로서 컨택센터로서의 용어로 변경되어 사용하고 있으며, 업무에 대한 비중도 늘어나고 있으며 과거의 사용계정을 통하여 상담원에게 신속하게 필요로 하는 정보를 제공할 수 있다.These call centers are rapidly growing and developing for companies in recent years, and are being used as a term for contact with customers rather than the existing call center. You can provide your agents with the information they need quickly.
그러나, 콜센터 상담원들은 상담과정에서 감정적으로 고통을 당할 수 있는 감정노동자이며, 국내의 경우 감정노동자의 고통을 방치한 사업주는 관련 법안에 따라 중징계를 피할 수 없다. However, call center counselors are emotional workers who can suffer emotionally during the counseling process.
고용노동부는 지난해 10월 18일부터 고객 응대 근로자 건강장해 방지 보호조치를 담은 '산업안전 보건법 시행령·시행규칙 일부개정안'을 국내 전 사업장에 시행 중이다. 즉, 폭언·성희롱 등 고객 갑질로 인한 감정노동자의 사직·자살사례가 증가하자 피해예방 및 사후조치를 의무화했으며, 사업주는 감정노동자에게 건강장애 발생 시, 위험장소에서 즉각 벗어날 수 있도록 업무를 일시 중단·전환 해야하고, 업무 복귀 전 신체적·정신적 안정을 취할 수 있도록 충분한 휴식시간을 줘야한다. Since October 18, last year, the Ministry of Employment and Labor has been implementing the 'Partial Amendments to the Enforcement Decree and Enforcement Rules of the Occupational Safety and Health Act' at all domestic workplaces, including protection measures to prevent health disorders of customer-facing workers. In other words, as the number of cases of resignation and suicide of emotional workers due to customer abuse such as verbal abuse and sexual harassment increased, damage prevention and follow-up measures were made mandatory. · Sufficient rest time should be given so that people can change their jobs and take physical and mental stability before returning to work.
최근 콜센터를 비롯한 서비스 산업에서 일하는 감정노동자들이 겪는 스트레스와 과도한 감정적 부담이 사회적 이슈로 떠오르고 있는 가운데, 지난 3월 '금융회사 감정노동자 보호법'이 국회 본회의를 통과하면서 소비자 인식 개선뿐만 아니라 국가 및 기업도 감정노동자들의 업무환경 개선 및 직무 스트레스 관리에 보다 적극적으로 나서야 한다는 요구가 높아지고 있다. Recently, the stress and excessive emotional burden experienced by emotional workers in call centers and other service industries is emerging as a social issue. In March, when the 'Financial Company Emotional Workers Protection Act' passed the National Assembly plenary session in March, not only improving consumer awareness, but also the nation and companies There is a growing demand for emotional workers to be more active in improving the work environment and managing job stress.
예를 들어, 콜센터 상담 전문회사인 H사의 경우, 8,000여명의 종사자 중 87%가 여성으로 20대 27%, 30대 37%, 40대 25% 기타 11%로 구성되고 있으며, 특히 30대, 40대는 경력단절 여성으로 육아 등을 위해 휴직 또는 퇴직 후 재입사를 통한 여성으로써 구나 손쉽게 재취업을 할 수 있는 직종으로 알려져 있으나, 업무의 특성으로 인하여 업무 중 퇴사하는 비중이 업무에 따라 월 2~11% 이상으로 많은 차이를 나타내고 있으며, 이를 통해 현재 콜센터 업계에서는 퇴직률 방어가 각 기업의 최고의 관심사로써 이는 각 기업의 비용을 절감하는 중요한 요소이다. For example, in the case of Company H, a company specializing in call center counseling, 87% of its 8,000 employees are women, 27% in their 20s, 37% in their 30s, 25% in their 40s, and 11% others, especially those in their 30s and 40s. As a woman with a career break, it is known as a woman who takes a leave of absence for childcare or re-enters the workforce after retirement. There are many differences as described above, and through this, in the current call center industry, protection of the retirement rate is the top concern of each company, which is an important factor in reducing each company's cost.
이들 중 대부분은 업무 부적응의 이유로 퇴사를 하고 있지만 대부분 직원들의 퇴사 사유는 고객들에 대한 스트레스가 가장 많은 것으로 파악되며, H사의 경우 연간 5,000여 명을 채용하고 있으나 전체 직원 수가 8,000여명인 것을 감안하면, 기업의 인재를 보호하고 유지하기 위해 스트레스로 이직하는 직원 수가 20~30%가 감소하면 각 기업에서 연간 수백 명에서 수천 명의 채용, 교육, 효율성 및 고용유지 및 제고 효과가 있다. Most of them leave due to maladjustment to work, but most of the employees leave the company because of the stress on customers. A 20-30% reduction in the number of stressful employees turning over to protect and retain the company's talent could result in hundreds to thousands of hiring, training, efficiency, and retention and retention benefits at each company per year.
대부분의 감정노동 종사 근로자는 장시간 동안 같은 일을 반복하고 정해진 공간, 고정된 위치 안에서 대기하면서 있어야 하는 경우가 많으며 근무시간 동안 손님 응대를 위해 계속 긴장된 상태(교감신경이 흥분된 상태)를 유지해야 한다. 그리고, 근무시간 동안은 계속해서 스트레스 반응을 보이며 심장은 평소보다 더 빨리 뛰고 혈압은 높게 유지되며, 스트레스 호르몬은 계속해서 분비되고 이런 스트레스 상태에서 자주 또는 강한 감정노동을 하거나 적절히 해소할 방안을 찾지 못한다면 신체건강 이상이 초래될 수 있다. Most emotional labor workers repeat the same work for a long time and often have to wait in a fixed space and fixed location, and they must maintain a tense state (sympathetic nervous system excited) to serve customers during working hours. And, if the stress response continues during working hours, the heart beats faster than usual, blood pressure remains high, stress hormones are continuously secreted, and in such a stressful state, frequent or strong emotional labor, or if there is no way to properly relieve it, Physical health problems may result.
또한, 감정노동이 직무스트레스 요인의 하나로 스트레스 반응을 유발하여 건강에 영향을 미친다는 점을 생각할 때, 지금까지 직무스트레스의 건강 영향으로 알려져 있는 작업 관련성 뇌심혈관계질환, 근골격계질환, 소화기질환 등의 다양한 건강문제를 유발할 수 있다는 문제점이 있다. In addition, considering that emotional labor affects health by inducing a stress response as one of the factors of job stress, work-related cerebro-cardiovascular disease, musculoskeletal disease, digestive disease, etc., which are known as health effects of job stress, There is a problem that can cause various health problems.
본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 콜센터 등에서 근무하는 상담 노동자의 스트레스를 경감시킬 수 있도록 대응하는 시스템 방법을 제공하는데 그 목적이 있다.The present invention has been devised to solve the above problems, and an object of the present invention is to provide a system method corresponding to the stress of a counselor working in a call center, etc. to be reduced.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.Objects of the present invention are not limited to the objects mentioned above, and other objects not mentioned will be clearly understood by those skilled in the art from the following description.
이와 같은 목적을 달성하기 위한 본 발명은 상담 노동자를 위한 스트레스 대응 시스템에 관한 것으로서, 상담원과의 상담을 진행하는 고객이 소지하고 있는 고객 단말, 고객과의 상담 응대를 위해 상담원이 착용하고 있는 장치로서, 상담 연결된 고객 단말로부터 수신한 음성 신호를 출력하는 음성출력부와, 상담원의 음성을 입력받아 전기 신호로 변환하여 상기 고객 단말에 전송하기 위한 음성입력부를 구비하고 있는 헤드셋 장치 및 상기 고객 단말 및 상기 헤드셋 장치로부터 음성신호를 수집하고, 수집된 음성신호를 분석하여 스트레스 지수를 산출하고, 산출된 스트레스 지수에 따라 미리 정해진 스트레스에 대응하기 위한 음성 신호를 상기 고객 단말에 출력하도록 하는 중앙 서버를 포함한다. The present invention for achieving the above object relates to a stress response system for a counselor, as a customer terminal possessed by a customer conducting a consultation with a counselor, and a device worn by a counselor to respond to a consultation with the customer , a headset device having a voice output unit for outputting a voice signal received from a customer terminal connected to counseling, and a voice input unit for receiving the counselor's voice and converting it into an electrical signal for transmission to the customer terminal, the customer terminal and the above It includes a central server that collects voice signals from the headset device, analyzes the collected voice signals to calculate a stress index, and outputs a voice signal for responding to a predetermined stress to the customer terminal according to the calculated stress index. .
상기 중앙 서버는 상기 고객 단말 및 상기 헤드셋 장치로부터 수집한 음성신호에서 데시벨, 옥타브, 발화 속도, 공명 주파수 정보를 포함하는 목소리 데이터와, 단어 정보를 포함하는 음성 데이터를 구분하고, 목소리 데이터와 음성 데이터를 각각 분석하여 스트레스 지수를 산출할 수 있다. The central server separates voice data including decibel, octave, utterance speed, and resonance frequency information from voice data collected from the customer terminal and the headset device and voice data including word information, and separates voice data and voice data can be analyzed to calculate the stress index.
상기 중앙 서버는 상기 고객 단말의 목소리 데이터에서 데시벨, 옥타브, 발화 속도를 각각의 미리 정해진 기준치와 비교하는 방식으로 분석할 수 있다. The central server may analyze decibels, octaves, and utterance rates in the voice data of the customer terminal by comparing them with predetermined reference values.
상기 중앙 서버는 상기 고객 단말 및 상기 헤드셋 장치로부터 수집한 목소리 데이터에서 고객의 공명 주파수와 상담원의 공명 주파수가 중복되는지 여부를 확인하는 방식으로 분석할 수 있다. The central server may analyze the voice data collected from the customer terminal and the headset device by checking whether the customer's resonant frequency and the counselor's resonant frequency overlap.
상기 중앙 서버는 상기 고객 단말의 음성 데이터에서 감정을 나타내는 단어인 감정어를 추출하고, 추출된 감정어를 미리 저장된 감정어 등급과 비교하여 등급을 부여하는 방식으로 분석할 수 있다.The central server may extract an emotion word, which is a word representing emotion, from the voice data of the customer terminal, and analyze the extracted emotion word by comparing it with a pre-stored emotion word grade to give a grade.
상기 중앙 서버는 상기 고객 단말의 음성 데이터에서 욕설 및 비속어를 포함하는 공격적인 단어인 공격어를 추출하고, 추출된 공격어의 존재 여부를 확인하는 방식으로 분석할 수 있다. The central server may extract an offensive word, which is an offensive word including abusive language and profanity, from the voice data of the customer terminal, and analyze it in a manner that confirms whether the extracted offensive word exists.
본 발명에 의하면, 콜센터 등에서의 상담 업무 시에 고객에게 경고하거나, 흥분도를 낮춰주는 소리를 제공함으로써, 상담 노동자의 스트레스 발생을 직접적으로 예방할 수 있는 효과가 있다. 이로써, 보다 안정적인 근무환경을 제고하고, 상담 노동자의 정신 건강을 보호할 수 있다. According to the present invention, there is an effect that can directly prevent the occurrence of stress in the counseling worker by providing a warning to the customer or a sound that lowers the level of excitement during consulting work in a call center or the like. In this way, it is possible to improve a more stable working environment and protect the mental health of counseling workers.
도 1은 본 발명의 일 실시 예에 따른 상담 노동자를 위한 스트레스 대응 시스템의 구성을 개념적으로 도시한 것이다. 1 conceptually illustrates the configuration of a stress response system for a counseling worker according to an embodiment of the present invention.
도 2는 본 발명의 일 실시 예에 따른 상담 노동자를 위한 스트레스 대응 방법을 보여주는 흐름도이다. 2 is a flowchart illustrating a stress response method for a counseling worker according to an embodiment of the present invention.
도 3은 본 발명의 일 실시 예에 따른 상담 노동자를 위한 스트레스 대응 방법에서 스트레스 지수를 산출하는 과정을 도시한 흐름도이다.3 is a flowchart illustrating a process of calculating a stress index in a method for coping with stress for a counseling worker according to an embodiment of the present invention.
도 4는 본 발명의 일 실시 예에 따른 감정어 등급을 예시한 도표이다. 4 is a diagram illustrating an emotion rating according to an embodiment of the present invention.
도 5는 본 발명의 일 실시 예에 따른 공격어를 예시한 도표이다. 5 is a diagram illustrating an attack word according to an embodiment of the present invention.
도 6은 본 발명의 일 실시 예에서 스트레스 정도에 따른 음성출력을 예시한 도표이다. 6 is a diagram illustrating voice output according to a stress level in an embodiment of the present invention.
도 7은 본 발명의 일 실시 예에 따른 공격어에 설정된 거리 정보를 예시한 도표이다.7 is a diagram illustrating distance information set in an attack word according to an embodiment of the present invention.
본 발명은 상담 노동자를 위한 스트레스 대응 시스템에 관한 것으로서, 상담원과의 상담을 진행하는 고객이 소지하고 있는 고객 단말, 고객과의 상담 응대를 위해 상담원이 착용하고 있는 장치로서, 상담 연결된 고객 단말로부터 수신한 음성 신호를 출력하는 음성출력부와, 상담원의 음성을 입력받아 전기 신호로 변환하여 상기 고객 단말에 전송하기 위한 음성입력부를 구비하고 있는 헤드셋 장치 및 상기 고객 단말 및 상기 헤드셋 장치로부터 음성신호를 수집하고, 수집된 음성신호를 분석하여 스트레스 지수를 산출하고, 산출된 스트레스 지수에 따라 미리 정해진 스트레스에 대응하기 위한 음성 신호를 상기 고객 단말에 출력하도록 하는 중앙 서버를 포함한다. The present invention relates to a stress response system for a counseling worker, a customer terminal possessed by a customer conducting a consultation with a counselor, and a device worn by a counselor to respond to a consultation with a customer, received from a customer terminal connected to counseling A headset device having a voice output unit for outputting one voice signal, a voice input unit for receiving the counselor's voice, converting it into an electrical signal and transmitting it to the customer terminal, and collecting voice signals from the customer terminal and the headset device and a central server for calculating a stress index by analyzing the collected voice signals, and outputting a voice signal for responding to a predetermined stress according to the calculated stress index to the customer terminal.
상기 중앙 서버는 상기 고객 단말 및 상기 헤드셋 장치로부터 수집한 음성신호에서 데시벨, 옥타브, 발화 속도, 공명 주파수 정보를 포함하는 목소리 데이터와, 단어 정보를 포함하는 음성 데이터를 구분하고, 목소리 데이터와 음성 데이터를 각각 분석하여 스트레스 지수를 산출할 수 있다. The central server separates voice data including decibel, octave, utterance speed, and resonance frequency information from voice data collected from the customer terminal and the headset device and voice data including word information, and separates voice data and voice data can be analyzed to calculate the stress index.
본 명세서에서 개시된 실시 예의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 개시에서 제안하고자 하는 실시 예는 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 당해 기술분야에서 통상의 지식을 가진 자에게 실시 예들의 범주를 완전하게 알려주기 위해 제공되는 것일 뿐이다.Advantages and features of the embodiments disclosed herein, and methods for achieving them will become apparent with reference to the embodiments described below in conjunction with the accompanying drawings. However, the embodiments to be proposed in the present disclosure are not limited to the embodiments disclosed below, but may be implemented in various different forms, and only the present embodiments are provided to those of ordinary skill in the art. It is only provided to fully indicate the category.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 개시된 실시 예에 대해 구체적으로 설명하기로 한다. Terms used in this specification will be briefly described, and the disclosed embodiments will be described in detail.
본 명세서에서 사용되는 용어는 개시된 실시 예들의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 관련 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 명세서의 상세한 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 명세서의 전반에 걸친 내용을 토대로 정의되어야 한다. The terms used in this specification have been selected as currently widely used general terms as possible while considering the functions of the disclosed embodiments, but may vary depending on the intention or precedent of a person skilled in the art, the emergence of new technology, and the like. In addition, in a specific case, there is a term arbitrarily selected by the applicant, and in this case, the meaning will be described in detail in the detailed description part of the corresponding specification. Therefore, the terms used in the present disclosure should be defined based on the meaning of the term and the contents of the entire specification, rather than the simple name of the term.
본 명세서에서의 단수의 표현은 문맥상 명백하게 단수인 것으로 특정하지 않는 한, 복수의 표현을 포함한다.References in the singular herein include plural expressions unless the context clearly dictates the singular.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에서 사용되는 "부"라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부"는 어떤 역할들을 수행한다. 그렇지만 "부"는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부"는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부"는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부"들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부"들로 결합되거나 추가적인 구성요소들과 "부"들로 더 분리될 수 있다.In the entire specification, when a part "includes" a certain element, this means that other elements may be further included, rather than excluding other elements, unless otherwise stated. Also, as used herein, the term “unit” refers to a hardware component such as software, FPGA, or ASIC, and “unit” performs certain roles. However, "part" is not meant to be limited to software or hardware. A “unit” may be configured to reside on an addressable storage medium and may be configured to refresh one or more processors. Thus, by way of example, “part” includes components such as software components, object-oriented software components, class components and task components, processes, functions, properties, procedures, subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays and variables. The functionality provided within components and “parts” may be combined into a smaller number of components and “parts” or further divided into additional components and “parts”.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.In addition, in the description with reference to the accompanying drawings, the same components are given the same reference numerals regardless of the reference numerals, and the overlapping description thereof will be omitted. In describing the present invention, if it is determined that a detailed description of a related known technology may unnecessarily obscure the gist of the present invention, the detailed description thereof will be omitted.
도 1은 본 발명의 일 실시 예에 따른 상담 노동자를 위한 스트레스 대응 시스템의 구성을 개념적으로 도시한 것이다. 1 conceptually illustrates the configuration of a stress response system for a counseling worker according to an embodiment of the present invention.
도 1을 참조하면, 본 발명의 상담 노동자를 위한 스트레스 대응 시스템은 헤드셋 장치(100), 중앙 서버(200), 고객 단말(300)을 포함한다. Referring to FIG. 1 , the stress response system for a counseling worker of the present invention includes a headset device 100 , a central server 200 , and a customer terminal 300 .
본 발명에서 헤드셋 장치(100), 중앙 서버(200), 고객 단말(300)은 유무선 네트워크를 통해 통신할 수 있다. In the present invention, the headset device 100 , the central server 200 , and the customer terminal 300 may communicate through a wired/wireless network.
헤드셋 장치(100)는 고객과의 상담 응대를 위해 상담원이 착용하고 있는 장치로서, 상담 연결된 고객 단말(300)로부터 수신한 음성 신호를 출력하는 음성출력부와, 상담원의 음성을 입력받아 전기 신호로 변환하여 고객 단말(300)에 전송하기 위한 음성입력부를 구비하고 있다. The headset device 100 is a device worn by a counselor to respond to a consultation with a customer, and includes a voice output unit that outputs a voice signal received from the customer terminal 300 connected to counseling, and an electrical signal that receives the counselor's voice. It has a voice input unit for converting and transmitting to the customer terminal (300).
고객 단말(300)은 상담원과의 상담을 진행하는 고객이 소지하고 있는 단말이다. 예를 들어, 고객 단말(300)은 통신망을 통해 통신가능한 핸드폰, 휴대폰, 스마트폰, 태블릿 PC 등을 포함하는 이동통신 단말기와, 유선 전화기, 인터넷 전화기 등을 포함하는 개념일 수 있다. The customer terminal 300 is a terminal possessed by a customer who conducts a consultation with a counselor. For example, the customer terminal 300 may be a concept including a mobile communication terminal including a mobile phone, a mobile phone, a smart phone, a tablet PC, etc. capable of communicating through a communication network, and a wired phone, an Internet phone, and the like.
중앙 서버(200)는 고객 단말(300) 및 헤드셋 장치(100)로부터 음성신호를 수집하고, 수집된 음성신호를 분석하여 스트레스 지수를 산출하고, 산출된 스트레스 지수에 따라 미리 정해진 스트레스에 대응하기 위한 음성 신호를 고객 단말(300)에 출력하도록 한다. The central server 200 collects voice signals from the customer terminal 300 and the headset device 100, analyzes the collected voice signals to calculate a stress index, and responds to a predetermined stress according to the calculated stress index. A voice signal is output to the customer terminal 300 .
본 발명의 일 실시예에서 중앙 서버(200)는 고객 단말(300) 및 헤드셋 장치(100)로부터 수집한 음성신호에서 데시벨, 옥타브, 발화 속도, 공명 주파수 정보를 포함하는 목소리 데이터와, 단어 정보를 포함하는 음성 데이터를 구분하고, 목소리 데이터와 음성 데이터를 각각 분석하여 스트레스 지수를 산출할 수 있다. In an embodiment of the present invention, the central server 200 receives voice data including decibels, octaves, speech rates, and resonance frequency information from the voice signals collected from the customer terminal 300 and the headset device 100, and word information. It is possible to classify the included voice data, and calculate the stress index by analyzing the voice data and the voice data, respectively.
중앙 서버(200)는 고객 단말(300)의 목소리 데이터에서 데시벨, 옥타브, 발화 속도를 각각의 미리 정해진 기준치와 비교하는 방식으로 분석할 수 있다. The central server 200 may analyze the voice data of the customer terminal 300 by comparing decibels, octaves, and utterance rates with respective predetermined reference values.
중앙 서버(200)는 고객 단말(300) 및 헤드셋 장치(100)로부터 수집한 목소리 데이터에서 고객의 공명 주파수와 상담원의 공명 주파수가 중복되는지 여부를 확인하는 방식으로 분석할 수 있다. The central server 200 may analyze the voice data collected from the customer terminal 300 and the headset device 100 by checking whether the customer's resonance frequency and the counselor's resonance frequency overlap.
중앙 서버(200)는 고객 단말(300)의 음성 데이터에서 감정을 나타내는 단어인 감정어를 추출하고, 추출된 감정어를 미리 저장된 감정어 등급과 비교하여 등급을 부여하는 방식으로 분석할 수 있다. 감정어는 기본적으로 화자의 감정을 나타내는 단어인데, 화자의 감정은 긍정, 부정, 중립으로 분류할 수 있고, 감정어 등급이 부여된 감정어는 부정적 감정으로 분류된 감정어이다. 도 4에 도시된 것과 같이, 감정어의 등급이 높아질수록 부정적 감정의 정도가 커지는 것으로 설정할 수 있다. The central server 200 may extract an emotion word, which is a word representing emotion, from the voice data of the customer terminal 300 , and compare the extracted emotion word with a pre-stored emotion word grade to give a grade. An emotional word is a word that basically expresses the speaker's emotions. The speaker's emotions can be classified as positive, negative, or neutral, and the emotional word graded as an emotional word is an emotional word classified as a negative emotion. As shown in FIG. 4 , it may be set that the degree of negative emotion increases as the grade of the emotional word increases.
중앙 서버(200)는 고객 단말(300)의 음성 데이터에서 욕설 및 비속어를 포함하는 공격적인 단어인 공격어를 추출하고, 추출된 공격어의 존재 여부를 확인하는 방식으로 분석할 수 있다. 공격어는 X팔, XX년 등과 같은 비속어와 청자로 하여금 강압적인 감정을 느끼도록 하는 똑바로, 꺼져, 책임자 등과 같은 비예의 단어와 문구를 포함할 수 있다. The central server 200 may extract an offensive word, which is an offensive word including abusive language and profanity, from the voice data of the customer terminal 300 and analyze it in a manner that confirms the existence of the extracted offensive word. Offensive words may include profanity such as X-arm, XX year, etc., as well as profane words and phrases such as straight, out, responsible, etc. that make the listener feel coercive.
본 발명의 일 실시예에서 중앙 서버(200)는 데이터베이스(210)를 포함하는 개념일 수 있다.In an embodiment of the present invention, the central server 200 may be a concept including the database 210 .
도 2는 본 발명의 일 실시 예에 따른 상담 노동자를 위한 스트레스 대응 방법을 보여주는 흐름도이다. 2 is a flowchart illustrating a stress response method for a counseling worker according to an embodiment of the present invention.
도 2를 참조하면, 중앙 서버(200)는 고객 단말(300) 및 헤드셋 장치(100)로부터 음성신호를 수집하고(S201), 수집된 음성신호를 목소리 데이터와 음성 데이터로 분류한다(S203). 여기서 목소리 데이터는 데시벨, 옥타브, 발화 속도, 공명 주파수 정보를 포함하고, 음성 데이터는 단어 정보를 포함한다. Referring to FIG. 2 , the central server 200 collects voice signals from the customer terminal 300 and the headset device 100 ( S201 ), and classifies the collected voice signals into voice data and voice data ( S203 ). Here, the voice data includes information on decibels, octaves, speech rates, and resonance frequencies, and the voice data includes information on words.
그리고, 중앙 서버(200)는 고객 단말(300)의 목소리 데이터에서 데시벨, 옥타브, 발화 속도를 각각의 미리 정해진 기준치와 비교하는 방식으로 분석한다(S205). Then, the central server 200 analyzes the decibels, octaves, and utterance rates in the voice data of the customer terminal 300 by comparing them with predetermined reference values (S205).
그리고, 중앙 서버(200)는 고객 단말 및 상기 헤드셋 장치로부터 수집한 목소리 데이터에서 고객의 공명 주파수와 상담원의 공명 주파수가 중복되는지 여부를 확인하는 방식으로 분석한다(S207). Then, the central server 200 analyzes the voice data collected from the customer terminal and the headset device in a manner that confirms whether the customer's resonance frequency and the counselor's resonance frequency overlap (S207).
그리고, 중앙 서버(200)는 고객 단말(300)의 음성 데이터에서 감정을 나타내는 단어인 감정어를 추출하고(S209), 추출된 감정어를 미리 저장된 감정어 등급과 비교하여 등급을 부여하는 방식으로 분석한다(S211). Then, the central server 200 extracts an emotion word that is a word representing emotion from the voice data of the customer terminal 300 (S209), and compares the extracted emotion word with the pre-stored emotion word grade to give a grade. Analyze (S211).
그리고, 중앙 서버(200)는 고객 단말(300)의 음성 데이터에서 욕설 및 비속어를 포함하는 공격적인 단어인 공격어를 추출하고(S209), 추출된 공격어의 존재 여부를 확인하는 방식으로 분석한다(S213). Then, the central server 200 extracts an offensive word, which is an offensive word including profanity and profanity, from the voice data of the customer terminal 300 (S209), and analyzes it in a manner that confirms the existence of the extracted offensive word (S209) ( S213).
본 발명에서 목소리 데이터의 유효 정보는 데시벨, 옥타브, 발화 속도, 공명 주파수 정보를 포함한다. In the present invention, valid information of voice data includes decibel, octave, speech rate, and resonance frequency information.
그리고, 음성 데이터의 유효 정보는 감정어(속상하다, 힘들다, 짜증난다, 화난다 등), 공격어(똑바로, 바꿔, 책임자, X팔 등)로 분류할 수 있다. In addition, valid information of voice data can be classified into emotional words (e.g. upset, tired, annoyed, angry, etc.) and offensive words (straight, change, responsible, X-arm, etc.).
목소리 데이터의 유효정보를 분석하는 과정을 다음과 같다. The process of analyzing valid information of voice data is as follows.
먼저 데시벨, 옥타브, 발화 속도 각각의 기준치를 설정한다. 그리고, 목소리 데이터의 데시벨, 옥타브, 발화 속도 중 2개 이상의 정보가 기준치 이상인지 여부를 확인한다. First, set the standards for each decibel, octave, and firing rate. Then, it is checked whether at least two pieces of information among decibels, octaves, and speech speed of voice data are greater than or equal to a reference value.
그리고, 고객 단말(300)로부터 수신한 고객 목소리 데이터의 공명주파수와 헤드셋 장치(100)로부터 수신한 상담원 목소리 데이터의 공명주파수가 중복되는지 여부를 확인한다. 가령, 개인의 고유하게 가지고 있는 공명 주파수를 분석하여, 고객이 상담원의 말을 끊고 있는지(안 듣고 있는지)를 판단하는 것이다. Then, it is checked whether the resonance frequency of the customer voice data received from the customer terminal 300 and the resonance frequency of the counselor voice data received from the headset device 100 overlap. For example, by analyzing an individual's unique resonant frequency, it is determined whether the customer is interrupting (or not listening to) the agent.
음성 데이터의 유효정보를 분석하는 과정은 다음과 같다. The process of analyzing valid information of voice data is as follows.
음성 데이터에서 추출된 감정어가 기저장된 감정어 등급에 따라 등급을 부여한다. 그리고, 감정어 등급의 평균이 미리 정해진 기준치 이상인지를 판단한다. The sentiment words extracted from the voice data are graded according to the pre-stored sentiment grades. Then, it is determined whether the average of the grades of the appraised words is equal to or greater than a predetermined reference value.
도 4는 본 발명의 일 실시 예에 따른 감정어 등급을 예시한 도표이다. 4 is a diagram illustrating an emotion rating according to an embodiment of the present invention.
도 4의 예시를 참조하면, 본 발명에서 감정어는 속상하다, 힘들다, 짜증난다, 화난다 등의 감정을 표현한 단어를 말한다. Referring to the example of FIG. 4 , in the present invention, emotional words refer to words expressing emotions such as upset, difficult, annoyed, and angry.
도 4의 실시예에서 감정어 별 등급이 예시되어 있는데, '속상하다, 속상해, 속상하니까' 등은 1등급, '힘들다, 힘들어, 힘드니까' 등은 2등급, '짜증난다, 짜증나, 짜증나게, 짜증나니까' 등은 3등급, '화난다, 화나게, 화나, 화나니까, 빡친다' 등은 4등급으로 분류된다. In the embodiment of Figure 4, the ratings for each emotional word are exemplified, 'I'm upset, upset, upset' is grade 1, 'it's hard, it's hard, it's hard' is grade 2, 'annoyed, annoyed, annoyed, 'Because I'm annoyed' is classified as grade 3, and 'because I'm angry, angry, upset', etc. is classified into grade 4.
예를 들어, 기준치가 2이고, 추출된 감정어가 '힘들다(2등급)', '화나(3등급)'라고 하면, 감정어 등급의 평균은 2.5가 된다. 이러한 2.5의 감정어 등급의 평균은 기준치인 2이상으로 판단되어 스트레스 지수를 산출하게 된다. For example, if the standard value is 2 and the extracted emotional words are 'difficult (2nd grade)' and 'angry (3rd grade)', the average of the emotional grades is 2.5. The average of these 2.5 ratings is judged to be 2 or more, which is the standard value, and the stress index is calculated.
중앙 서버(200)는 음성 데이터에서 공격어가 존재하는지 여부를 판단한다. The central server 200 determines whether an attack word exists in the voice data.
도 5는 본 발명의 일 실시 예에 따른 공격어를 예시한 도표이다. 5 is a diagram illustrating an attack word according to an embodiment of the present invention.
도 5의 도표에서는 데이터베이스(210)에 저장된 공격어를 예시한 것으로서, 똑바로, 똑바르게, 제대로, 바꿔, 꺼져, 니가, 너가, 책임자, X팔, XX년 등의 공격어를 예시하고 있으며, 이 외에도 다양한 공격어를 설정할 수 있음은 당연하다. In the diagram of FIG. 5, as an example of an attack word stored in the database 210, it illustrates an attack word such as straight, straight, properly, change, off, you, you, responsible, X arm, XX year, In addition to this, it is natural that various attack words can be set.
본 발명에서 중앙 서버(200)에서 스트레스 지수를 판단하는 방식을 예시하면 다음과 같다. The method of determining the stress index in the central server 200 in the present invention is exemplified as follows.
조건1: 데시벨, 옥타브, 발화 속도 중 2개 이상의 정보가 기준치 이상인가?Condition 1: Are two or more of decibels, octaves, and firing rates higher than the standard?
조건2: 고객의 공명주파수와 상담노동자의 공명주파수가 중복되는가? Condition 2: Does the customer's resonant frequency overlap with the counseling worker's resonant frequency?
조건3: 추출된 감정어 등급의 평균이 기준치 이상인가?Condition 3: Is the average of the extracted appraised words higher than the standard value?
조건4: 공격어가 존재하는가? Condition 4: Does the attack word exist?
중앙 서버(200)는 상기 조건1 내지 조건3 중에서 해당하는 조건의 개수를 확인하여 1개면 1단계(양호), 2개면 2단계(주의), 3개면 3단계(경고)로 스트레스 지수를 산출한다. The central server 200 checks the number of corresponding conditions from among the conditions 1 to 3, and calculates the stress index as 1 level 1 (good), 2 sides 2 steps (caution), and 3 sides 3 steps (warning) .
그리고, 조건4에 해당하면 스트레스 지수를 한 단계 높인다. 즉, 조건4에 해당하면, 1단계(양호)의 경우 2단계(주의)로 높이고, 2단계(주의)의 경우 3단계(경고)로 높이고, 3단계(주의)의 경우 4단계(회선 차단)로 높인다. And, if condition 4 is met, the stress index is raised by one level. In other words, if condition 4 is met, the level 1 (good) is raised to level 2 (caution), level 2 (caution) is raised to level 3 (warning), and level 3 (caution) is level 4 (line blocked). ) is raised to
중앙 서버(200)는 산출된 스트레스 지수에 따라 해당하는 음성 메시지를 고객 단말(300)에 출력하도록 한다. The central server 200 outputs a corresponding voice message to the customer terminal 300 according to the calculated stress index.
도 6은 본 발명의 일 실시 예에서 스트레스 정도에 따른 음성출력을 예시한 도표이다. 6 is a diagram illustrating voice output according to a stress level in an embodiment of the present invention.
도 6의 예시에서 1단계(양호)의 경우 고객 단말(300)에 음성을 출력하지 않고, 2단계(주의)의 경우 고객 단말(300)에 '고객님, 흥분을 가라앉혀 주시기 바랍니다'라는 음성을 출력한다. In the example of FIG. 6, in the case of the first step (good), the voice is not output to the customer terminal 300, and in the case of the second stage (attention), a voice saying 'Customer, please calm your excitement' is sent to the customer terminal 300 print out
그리고, 3단계(경고)의 경우 고객 단말(300)에 '고객님, 지속적으로 흥분을 가라앉히지 않으시면 자동적으로 응대가 종료됩니다.'라는 음성을 출력한다. And, in the case of step 3 (warning), a voice is output to the customer terminal 300 saying 'Customer, if you do not continuously calm your excitement, the response will be automatically terminated.'
그리고, 4단계(회선 차단)의 경우 고객 단말(300)에 '고객님, 회선이 차단되며, 향후 3개월간 고객 센터 이용이 불가합니다.'라는 음성을 출력한다.And, in the case of step 4 (line cutoff), a voice is output to the customer terminal 300 saying 'Customer, the line is cut off, and the customer center will not be available for the next 3 months.'
도 3은 본 발명의 일 실시 예에 따른 상담 노동자를 위한 스트레스 대응 방법에서 스트레스 지수를 산출하는 과정을 도시한 흐름도이다.3 is a flowchart illustrating a process of calculating a stress index in a method for coping with stress for a counseling worker according to an embodiment of the present invention.
도 3을 참조하면, 중앙 서버(200)는 목소리 데이터가 입력되면(S301), 목소리 데이터를 시간 단위로 분할한다(S303). Referring to FIG. 3 , when voice data is input (S301), the central server 200 divides the voice data into time units (S303).
그리고, 중앙 서버(200)는 입력된 목소리 데이터의 데시벨, 옥타브, 발화 속도값과 기준값을 비교하여 비교값을 산출한다(S305, S307). Then, the central server 200 compares the decibel, octave, and utterance speed values of the input voice data with a reference value to calculate a comparison value (S305, S307).
그리고, 중앙 서버(200)는 입력된 목소리 데이터에서 고객의 공명 주파수와 상담 노동자의 공명 주파수의 중복도를 판단하여 중복도를 산출한다(S309, S311). Then, the central server 200 determines the degree of overlap between the customer's resonant frequency and the counseling worker's resonant frequency from the input voice data to calculate the degree of redundancy (S309, S311).
그리고, 중앙 서버(200)는 산출된 비교값과 중복도를 이용하여 목소리 특성에 따른 스트레스 지수를 산출한다(S313). Then, the central server 200 calculates a stress index according to the voice characteristics by using the calculated comparison value and the degree of redundancy (S313).
그리고, 중앙 서버(200)는 음성 데이터가 입력되면(S315), 음성 데이터를 시간 단위로 분할한다(S317). Then, when voice data is input (S315), the central server 200 divides the voice data into time units (S317).
그리고, 중앙 서버(200)는 분할된 음성 데이터를 텍스트 데이터로 변환한다(S319). Then, the central server 200 converts the divided voice data into text data (S319).
그리고, 중앙 서버(200)는 텍스트 데이터를 문장 단위로 분리한다(S321). Then, the central server 200 separates the text data in sentence units (S321).
그리고, 중앙 서버(200)는 문장 내 각 단어를 식별한다(S323). Then, the central server 200 identifies each word in the sentence (S323).
그리고, 중앙 서버(200)는 각 단어 사이의 거리 정보를 추출한다(S325). Then, the central server 200 extracts distance information between each word (S325).
여기서, 감정어들/공격어들 간의 거리 정보는 감정어들/공격어들 사이에 존재하는 문자 또는 단어의 갯수 또는 감정어들/공격어들 사이의 시간 간격일 수 있다.Here, the distance information between the emotional words/attack words may be the number of characters or words existing between the emotional words/attack words or a time interval between the emotional words/attack words.
그리고, 중앙 서버(200)는 감정어 또는 공격어가 사전에 설정되어 저장되어 있는 데이터베이스(210)에 대상 단어가 존재하는지 여부를 확인한다(S327). Then, the central server 200 checks whether the target word exists in the database 210 in which sentiment words or offensive words are set and stored in advance (S327).
그리고, 중앙 서버(200)는 대상 단어가 감정어 또는 공격어가 저장된 데이터베이스(210)에 존재하면, 거리정보를 이용하여 감정어 또는 공격어의 스트레스 지수를 산출한다(S329). And, if the target word exists in the database 210 in which the emotional word or the offensive word is stored, the central server 200 calculates the stress index of the emotional word or the offensive word by using the distance information (S329).
여기서, 감정어/공격어는 미리 데이터베이스(210)에 저장되어 있다. 본 발명에서 중앙 서버(200)는 데이터베이스(210)를 참조하여 텍스트 데이터에 감정어/공격어가 존재하는지를 판별하고, 감정어/공격어가 존재하는 경우 해당 감정어/공격어에 대한 리스트를 생성한다. 감정어/공격어 리스트는 검출된 감정어/공격어 사이의 거리 정보를 포함한다.Here, sentiment words/attack words are stored in the database 210 in advance. In the present invention, the central server 200 determines whether sentiment words/attack words exist in the text data with reference to the database 210, and if there are sentiment words/attack words, creates a list of corresponding sentiment words/attack words. The sentiment word/attack word list includes distance information between the detected sentiment word/attack word.
여기에서, 거리 정보라 함은 감정어들/공격어들 사이에 존재하는 문자 또는 단어의 갯수, 감정어들/공격어들 사이의 시간 간격 등과 같은 정보 중의 어느 하나로 구성될 수 있다. 또는, 이들의 조합에 의해 구성될 수도 있다.Here, the distance information may be composed of any one of information such as the number of characters or words existing between the emotional words/attack words, and a time interval between the emotional words/attack words. Alternatively, it may be configured by a combination thereof.
그리고, 중앙 서버(200)는 목소리 특성 스트레스 지수와 감정어 또는 공격어의 스트레스 지수를 종합하여 최종 스트레스 지수를 산출한다(S331). Then, the central server 200 calculates the final stress index by synthesizing the stress index of the voice characteristic and the stress index of an emotional word or an offensive word (S331).
도 7은 본 발명의 일 실시 예에 따른 공격어에 설정된 거리 정보를 예시한 도표이다.7 is a diagram illustrating distance information set in an attack word according to an embodiment of the present invention.
도 7의 도표에서 중앙 서버(200)가 텍스트 데이터로부터 순차적으로 공격어인 "XX년, 똑바로, X팔, 책임자, 바꿔"의 순서로 검출하였음을 알 수 있다. 이 때, 각각의 공격어들의 거리 정보는 "3, 8, 5, 4"로 나타나 있는데, 여기서 각각의 숫자는 공격어들 사이의 단어의 갯수인 경우이다. 즉, "XX년"과 "똑바로"사이에 3개의 단어가 존재하고, "똑바로"와 "X팔"사이에는 8개의 단어가 존재한다.It can be seen from the diagram of FIG. 7 that the central server 200 sequentially detected the attack words from the text data in the order of "XX year, straight, X arm, responsible person, change". In this case, the distance information of each of the offensive words is expressed as "3, 8, 5, 4", where each number is the number of words between the offensive words. That is, there are 3 words between "XX year" and "straight", and there are 8 words between "straight" and "X arm".
이와 같이, 공격어 리스트는 공격어들과 각 공격어들 사이의 거리 정보를 포함하도록 구성된다.In this way, the offensive word list is configured to include the offensive words and distance information between each of the offensive words.
중앙 서버(200)는 생성된 공격어 리스트에 기초하여 공격어 스트레스 지수를 판단하는데, 공격어 리스트에 포함된 공격어와 공격어들간의 거리 정보에 기초하여 공격어 스트레스 지수를 산출한다.The central server 200 determines an offensive word stress index based on the generated offensive word list, and calculates an offensive word stress index based on distance information between the offensive words and the offensive words included in the offensive word list.
도 3에서 S315~S319의 음성 데이터를 텍스트 데이터로 변환하는 과정에 있어서, 지능형 서버(intelligent server)를 이용할 수 있다. In the process of converting the voice data of S315 to S319 in FIG. 3 into text data, an intelligent server may be used.
지능형 서버는 텍스트 데이터에 기초하여 감정어 DB, 공격어 DB를 생성할 수 있다. The intelligent server can create an emotion DB and an attack word DB based on the text data.
감정어 DB, 공격어 DB는 인공지능(Artificial Intelligent, AI)에 의해 생성될 수 있으며, 여기서 인공지능 시스템은 룰 베이스 시스템(rule-based system), 신경망 베이스 시스템(neural network-based system, 예: 피드포워드 신경망(feedforward neural network, FNN), 순환 신경망(recurrent neural network, RNN))일 수 있다. The sentiment DB and the attack word DB may be generated by artificial intelligence (AI), where the artificial intelligence system is a rule-based system, a neural network-based system, for example: It may be a feedforward neural network (FNN), a recurrent neural network (RNN)).
감정어 DB 및 공격어 DB는 미리 정의된 집합일 수 있고, 사용자의 요청에 의해 실시간으로 생성될 수도 있다. The sentiment DB and the offensive word DB may be a predefined set or may be generated in real time by a user's request.
지능형 서버는 프론트 엔드(front end), 자연어 플랫폼(natual language platform), 캡슐 데이터베이스(capsule DB), 실행 엔진(execution engine), 엔드 사용자 인터페이스(end user interface), 매니지먼트 플랫폼(management platform), 빅 데이터 플랫폼(big data platform), 또는 분석 플랫폼(analytic platform)을 포함할 수 있다. Intelligent servers are front end, natural language platform, capsule DB, execution engine, end user interface, management platform, big data It may include a big data platform, or an analytic platform.
여기서 프론트 엔드는 사용자 단말로부터 음성 데이터 수신하는 부분이다. Here, the front end is a part that receives voice data from the user terminal.
그리고, 자연어 플랫폼은 음성 데이터를 텍스트 데이터로 변환하는 자동 음성 인식 모듈, 문법적 분석, 의미적 분석을 수행하여 사용자 의도를 파악하는 자연어 이해 모듈, 자연어 이해 모듈에서 결정된 의도 및 파라미터를 이용하여 집합체를 생성하는 플래너 모듈로 구성된다. In addition, the natural language platform creates an aggregate using the intention and parameters determined by the automatic speech recognition module that converts speech data into text data, the natural language understanding module that performs grammatical analysis and semantic analysis to determine the user's intention, and the natural language understanding module It consists of a planner module that
그리고, 캡슐 데이터베이스는 복수의 도메인에 대응되는 복수의 컨셉과 동작들의 관계에 대한 정보를 저장하는 데이터베이스로서, 음성 입력에 대응되는 복수의 DB가 있는 경우, 하나의 DB를 결정하기 위한 기준 정보를 포함할 수 있다. 예를 들어, 복수의 도메인으로부터 수신된 음성 데이터를 이용하여 감정어 DB, 공격어 DB에 대해 저장된 경우, 하나의 음성 데이터를 분석하여 각각의 분할된 음성 DB가 감정어 DB인지 공격어 DB인지 결정하기 위한 기준 정보를 생성할 수 있다. In addition, the capsule database is a database that stores information on relationships between a plurality of concepts and operations corresponding to a plurality of domains. When there are a plurality of DBs corresponding to voice input, reference information for determining one DB is included. can do. For example, when voice data received from a plurality of domains is stored for the sentiment DB and the offensive language DB, one voice data is analyzed to determine whether each divided voice DB is the sentiment DB or the offensive language DB It is possible to generate reference information for
실행 엔진은 결과값을 산출하고, 빅데이터 플랫폼은 데이터 수집 및 저장 기능을 수행한다. The execution engine produces the result, and the big data platform performs data collection and storage functions.
도 3에서 S321~S325의 텍스트 데이터에서 단어를 식별하여 거리정보를 추출하는 과정은 지도학습(Supervised Learning)을 이용할 수 있다.The process of extracting distance information by identifying words from text data of S321 to S325 in FIG. 3 may use supervised learning.
지도학습은 크게 기호적 학습(symbolic learning)과 통계 기반 학습(statistical-based learning)으로 나눌 수 있다. Supervised learning can be largely divided into symbolic learning and statistical-based learning.
기호적 학습 방법은 표식이 부착된 말뭉치로부터 규칙을 추출하거나 분류절차를 학습한 후, 표식이 붙지 않은 말뭉치에 적용하며, 결정 트리(decision tree), 변형 기반 오류에 의한 학습(transformation-based error driven learning), 선형 분리기(linear separator), 사례 기반 학습(instance-based learning) 등이 이용될 수 있다. The semiotic learning method extracts rules or learns a classification procedure from a marked corpus, then applies it to the unmarked corpus, and uses a decision tree, transformation-based error driven learning), a linear separator, instance-based learning, and the like may be used.
통계 기반 학습 방법은 학습 말뭉치 내에서 확률 변수(속성)를 추출하고, 여러 문맥에 걸쳐 관찰되는 확률 변수들 간의 확률 분포를 결정하는 모델을 구축하며, 대표적으로 나이브 베이스 분류기(naive Bayes classifier), 최대 엔트로피(maximum entropy principle), 마코프 모델(Markov model) 등이 있다. The statistical-based learning method extracts random variables (attributes) from within the learning corpus, builds a model that determines the probability distribution among random variables observed across multiple contexts, and typically uses a naive Bayes classifier, max There are entropy (maximum entropy principle), Markov model, and the like.
마코프 모델을 이용한 통계적 품사 태깅, 변형 기반 오류에 의한 학습을 적용한 변형 기반 태깅은 여러가지 자연언어의 중의성 문제 중 품사 태깅 문제의 해결에 효율적인 지도학습이다. Statistical part-of-speech tagging using Markov model and transformation-based tagging applying learning by transformation-based error are effective supervised learning for solving the part-of-speech tagging problem among various natural language ambiguity problems.
마코프 모델을 한국어의 특성에 맞게 변형한 방법이 이용될 수 있으며, 한국어의 어절과 어절 간의 전이 관계를 형태소 uni-gram을 이용하여 추정하는 방법 등이 이용될 수 있다. A method of transforming the Markov model to fit the characteristics of Korean may be used, and a method of estimating the transition relationship between words in Korean using a morpheme uni-gram may be used.
확률적 구문 분석은 확률자유문맥문법(PCFG)을 이용하여 확률 값이 명기된 문맥자유문법(CFG) 규칙을 추출할 수 있다. Probabilistic syntax analysis can extract a context-free grammar (CFG) rule in which a probability value is specified by using a probability-free context (PCFG).
그 외에도, 최대 엔트로피 통계적 결합범주문법(Maximum Entropy Statistical Combinatory Categorical Grammar)의 결합범주문법(CCG) 구문 분석기는 무한의존구문(unbounded dependencies)과 국부적 기능-논항(function-argument) 구조를 표현하고 있으며, CCG 어휘 태그 및 어휘 의존구조가 부착된 말뭉치를 이용하여 학습한다. 여기서, 의존구조는 자질로서 표현되며 시스템은 표식이 달린 표준 말뭉치로부터 가장 확률이 높은 의존구조들의 집합으로 표현되는 모델을 계산할 수 있다. In addition, the CCG parser of Maximum Entropy Statistical Combinatory Categorical Grammar expresses unbounded dependencies and local function-argument structures, It learns using a corpus to which CCG vocabulary tags and vocabulary dependent structures are attached. Here, dependency structures are expressed as features, and the system can compute a model expressed as a set of dependency structures with the highest probability from a standard corpus marked with a marker.
도 3에서 S313, S329, S331에 있어서, 인공지능 기술을 이용한 목소리 특성 스트레스 지수와, 감정어/공격어 스트레스 지수를 합하여 최종 스트레스 지수를 산출하는 과정에 대해 설명하면 다음과 같다. In FIG. 3, in S313, S329, and S331, the process of calculating the final stress index by adding the voice characteristic stress index using artificial intelligence technology and the emotional word/aggressive word stress index is as follows.
본 발명에서 중앙 서버(200)는 감정어/공격어 및 거리 정보를 이용하여 기계학습을 통해 스트레스 지수 모델을 생성하고, 목소리 특성 데이터를 이용하여 기계학습을 통해 스트레스 지수 모델을 생성한다. In the present invention, the central server 200 generates a stress index model through machine learning using emotional words/attack words and distance information, and creates a stress index model through machine learning using voice characteristic data.
감정어/공격어 및 거리 정보에 기초한 스트레스 지수 모델링과 목소리 특성 데이터에 기초한 스트레스 지수 모델링을 통하여 스트레스 지수를 산출한 후, 최종 스트레스 지수 산출시, 이전에 수신된 데이터를 참조하여 기준값을 설정할 수 있다. After calculating the stress index through stress index modeling based on emotional words/aggressive words and distance information and stress index modeling based on voice characteristic data, when calculating the final stress index, a reference value can be set with reference to previously received data. .
스트레스 지수 산출시, 딥러닝, 결정 트리(decision tree), 나이브 베이즈 분류(naive bayes classification), 최소자승회귀(ordinary least squares regression), 로지스틱 회귀(logistic regression), 앙상블 메소드(ensemble method), 서포트 벡터 머신(support vector machine; SVM) 등과 같은 다양한 알고리즘에 기초하여 기계학습을 수행할 수 있다. When calculating the stress index, deep learning, decision tree, naive bayes classification, ordinary least squares regression, logistic regression, ensemble method, support Machine learning may be performed based on various algorithms, such as a support vector machine (SVM).
이상 본 발명을 몇 가지 바람직한 실시 예를 사용하여 설명하였으나, 이들 실시 예는 예시적인 것이며 한정적인 것이 아니다. 본 발명이 속하는 기술분야에서 통상의 지식을 지닌 자라면 본 발명의 사상과 첨부된 특허청구범위에 제시된 권리범위에서 벗어나지 않으면서 다양한 변화와 수정을 가할 수 있음을 이해할 것이다.The present invention has been described above using several preferred embodiments, but these embodiments are illustrative and not restrictive. Those of ordinary skill in the art to which the present invention pertains will understand that various changes and modifications can be made without departing from the spirit of the present invention and the scope of the rights set forth in the appended claims.

Claims (12)

  1. 상담원과의 상담을 진행하는 고객이 소지하고 있는 고객 단말;a customer terminal possessed by a customer conducting a consultation with an agent;
    고객과의 상담 응대를 위해 상담원이 착용하고 있는 장치로서, 상담 연결된 고객 단말로부터 수신한 음성 신호를 출력하는 음성출력부와, 상담원의 음성을 입력받아 전기 신호로 변환하여 상기 고객 단말에 전송하기 위한 음성입력부를 구비하고 있는 헤드셋 장치; 및A device worn by a counselor to respond to a consultation with a customer, and a voice output unit for outputting a voice signal received from a customer terminal connected to counseling, and for receiving the counselor's voice, converting it into an electrical signal and transmitting it to the customer terminal a headset device having an audio input unit; and
    상기 고객 단말 및 상기 헤드셋 장치로부터 음성신호를 수집하고, 수집된 음성신호를 분석하여 스트레스 지수를 산출하고, 산출된 스트레스 지수에 따라 미리 정해진 스트레스에 대응하기 위한 음성 신호를 상기 고객 단말에 출력하도록 하는 중앙 서버Collecting voice signals from the customer terminal and the headset device, calculating a stress index by analyzing the collected voice signals, and outputting a voice signal for responding to a predetermined stress according to the calculated stress index to the customer terminal central server
    를 포함하는 상담 노동자를 위한 스트레스 대응 시스템. A stress response system for counseling workers that includes
  2. 청구항 1에 있어서, The method according to claim 1,
    상기 중앙 서버는 상기 고객 단말 및 상기 헤드셋 장치로부터 수집한 음성신호에서 데시벨, 옥타브, 발화 속도, 공명 주파수 정보를 포함하는 목소리 데이터와, 단어 정보를 포함하는 음성 데이터를 구분하고, 목소리 데이터와 음성 데이터를 각각 분석하여 스트레스 지수를 산출하는 것을 특징으로 하는 상담 노동자를 위한 스트레스 대응 시스템. The central server separates voice data including decibel, octave, utterance speed, and resonance frequency information from voice data collected from the customer terminal and the headset device and voice data including word information, and separates voice data and voice data A stress response system for counseling workers, characterized in that it calculates a stress index by analyzing each.
  3. 청구항 2에 있어서, 3. The method according to claim 2,
    상기 중앙 서버는 상기 고객 단말의 목소리 데이터에서 데시벨, 옥타브, 발화 속도를 각각의 미리 정해진 기준치와 비교하는 방식으로 분석하는 것을 특징으로 하는 상담 노동자를 위한 스트레스 대응 시스템. The central server is a stress response system for counseling workers, characterized in that it analyzes the decibels, octaves, and utterance rates in the voice data of the customer terminal in a manner that compares them with each predetermined reference value.
  4. 청구항 3에 있어서, 4. The method according to claim 3,
    상기 중앙 서버는 상기 고객 단말 및 상기 헤드셋 장치로부터 수집한 목소리 데이터에서 고객의 공명 주파수와 상담원의 공명 주파수가 중복되는지 여부를 확인하는 방식으로 분석하는 것을 특징으로 하는 상담 노동자를 위한 스트레스 대응 시스템. The central server analyzes the voice data collected from the customer terminal and the headset device in a manner that confirms whether the customer's resonance frequency and the agent's resonance frequency overlap.
  5. 청구항 4에 있어서, 5. The method according to claim 4,
    상기 중앙 서버는 상기 고객 단말의 음성 데이터에서 감정을 나타내는 단어인 감정어를 추출하고, 추출된 감정어를 미리 저장된 감정어 등급과 비교하여 등급을 부여하는 방식으로 분석하는 것을 특징으로 하는 상담 노동자를 위한 스트레스 대응 시스템. The central server extracts an emotion word, which is a word representing emotion, from the voice data of the customer terminal, and compares the extracted emotion word with a pre-stored appraisal word grade to give a grade. stress response system for
  6. 청구항 5에 있어서, 6. The method of claim 5,
    상기 중앙 서버는 상기 고객 단말의 음성 데이터에서 욕설 및 비속어를 포함하는 공격적인 단어인 공격어를 추출하고, 추출된 공격어의 존재 여부를 확인하는 방식으로 분석하는 것을 특징으로 하는 상담 노동자를 위한 스트레스 대응 시스템. The central server extracts offensive words, which are aggressive words including profanity and profanity, from the voice data of the customer terminal, and analyzes the extracted offensive words in a manner that confirms the existence of the extracted offensive words. system.
  7. 고객이 소지하고 있는 고객 단말, 상담원이 착용하고 있는 헤드셋 장치 및 중앙 서버를 포함하는 스트레스 대응 시스템에서의 스트레스 대응 방법에서, In a stress response method in a stress response system including a customer terminal owned by a customer, a headset device worn by an agent, and a central server,
    상기 중앙 서버에서 고객 단말 및 상기 헤드셋 장치로부터 음성신호를 수집하는 단계;collecting voice signals from the customer terminal and the headset device in the central server;
    상기 중앙 서버에서 수집된 음성신호를 분석하여 스트레스 지수를 산출하는 단계; 및calculating a stress index by analyzing the voice signal collected by the central server; and
    상기 중앙 서버에서 산출된 스트레스 지수에 따라 미리 정해진 스트레스에 대응하기 위한 음성 신호를 상기 고객 단말에 출력하도록 하는 단계Outputting a voice signal for responding to a predetermined stress to the customer terminal according to the stress index calculated by the central server
    를 포함하는 상담 노동자를 위한 스트레스 대응 방법. Stress coping methods for counseling workers, including
  8. 청구항 7에 있어서, 8. The method of claim 7,
    상기 중앙 서버는 상기 고객 단말 및 상기 헤드셋 장치로부터 수집한 음성신호에서 데시벨, 옥타브, 발화 속도, 공명 주파수 정보를 포함하는 목소리 데이터와, 단어 정보를 포함하는 음성 데이터를 구분하고, 목소리 데이터와 음성 데이터를 각각 분석하여 스트레스 지수를 산출하는 것을 특징으로 하는 상담 노동자를 위한 스트레스 대응 방법. The central server separates voice data including decibel, octave, utterance speed, and resonance frequency information from voice data collected from the customer terminal and the headset device and voice data including word information, and separates voice data and voice data Stress response method for counseling workers, characterized in that by analyzing each of the stress index is calculated.
  9. 청구항 8에 있어서, 9. The method of claim 8,
    상기 중앙 서버는 상기 고객 단말의 목소리 데이터에서 데시벨, 옥타브, 발화 속도를 각각의 미리 정해진 기준치와 비교하는 방식으로 분석하는 것을 특징으로 하는 상담 노동자를 위한 스트레스 대응 방법.The central server analyzes the decibel, octave, and utterance speed in the voice data of the customer terminal in a manner that compares them with each predetermined reference value.
  10. 청구항 9에 있어서, 10. The method of claim 9,
    상기 중앙 서버는 상기 고객 단말 및 상기 헤드셋 장치로부터 수집한 목소리 데이터에서 고객의 공명 주파수와 상담원의 공명 주파수가 중복되는지 여부를 확인하는 방식으로 분석하는 것을 특징으로 하는 상담 노동자를 위한 스트레스 대응 방법. The central server analyzes the voice data collected from the customer terminal and the headset device in a manner that checks whether the customer's resonant frequency and the counselor's resonant frequency overlap.
  11. 청구항 10에 있어서, 11. The method of claim 10,
    상기 중앙 서버는 상기 고객 단말의 음성 데이터에서 감정을 나타내는 단어인 감정어를 추출하고, 추출된 감정어를 미리 저장된 감정어 등급과 비교하여 등급을 부여하는 방식으로 분석하는 것을 특징으로 하는 상담 노동자를 위한 스트레스 대응 방법. The central server extracts an emotion word, which is a word representing emotion, from the voice data of the customer terminal, and compares the extracted emotion word with a pre-stored appraisal word grade to give a grade. how to deal with stress.
  12. 청구항 11에 있어서, 12. The method of claim 11,
    상기 중앙 서버는 상기 고객 단말의 음성 데이터에서 욕설 및 비속어를 포함하는 공격적인 단어인 공격어를 추출하고, 추출된 공격어의 존재 여부를 확인하는 방식으로 분석하는 것을 특징으로 하는 상담 노동자를 위한 스트레스 대응 방법.The central server extracts offensive words, which are aggressive words including profanity and profanity, from the voice data of the customer terminal, and analyzes the extracted offensive words in a manner that confirms the existence of the extracted offensive words. method.
PCT/KR2020/017259 2020-09-21 2020-11-30 Stress response system and method for counselor WO2022059852A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2020-0121632 2020-09-21
KR1020200121632A KR102512285B1 (en) 2020-09-21 2020-09-21 Stress response system and method for counseling worker

Publications (1)

Publication Number Publication Date
WO2022059852A1 true WO2022059852A1 (en) 2022-03-24

Family

ID=80776881

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/017259 WO2022059852A1 (en) 2020-09-21 2020-11-30 Stress response system and method for counselor

Country Status (2)

Country Link
KR (1) KR102512285B1 (en)
WO (1) WO2022059852A1 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010054568A (en) * 2008-08-26 2010-03-11 Oki Electric Ind Co Ltd Emotional identification device, method and program
KR101795593B1 (en) * 2016-09-19 2017-11-08 주식회사 부뜰정보시스템 Device and method for protecting phone counselor
KR20190061585A (en) * 2017-11-28 2019-06-05 주식회사 위드마인드 System for emotion recognition based voice data and method for the same
KR20200025532A (en) * 2018-08-30 2020-03-10 주민성 An system for emotion recognition based voice data and method for applications thereof
KR20200080494A (en) * 2018-12-26 2020-07-07 한국전자통신연구원 Stress management apparatus for the emotional worker and operation method thereof
KR102212123B1 (en) * 2020-06-15 2021-02-05 주식회사 켄트피엘티 System for monitoring stress of counselor

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102061725B1 (en) 2018-01-05 2020-01-02 주식회사 옴니씨앤에스 Method, system and non-transitory computer-readable recording medium for diagnosing mental health
KR20200005753A (en) * 2020-01-06 2020-01-16 효성아이티엑스(주) Apparatus for analyzing customer emotion

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010054568A (en) * 2008-08-26 2010-03-11 Oki Electric Ind Co Ltd Emotional identification device, method and program
KR101795593B1 (en) * 2016-09-19 2017-11-08 주식회사 부뜰정보시스템 Device and method for protecting phone counselor
KR20190061585A (en) * 2017-11-28 2019-06-05 주식회사 위드마인드 System for emotion recognition based voice data and method for the same
KR20200025532A (en) * 2018-08-30 2020-03-10 주민성 An system for emotion recognition based voice data and method for applications thereof
KR20200080494A (en) * 2018-12-26 2020-07-07 한국전자통신연구원 Stress management apparatus for the emotional worker and operation method thereof
KR102212123B1 (en) * 2020-06-15 2021-02-05 주식회사 켄트피엘티 System for monitoring stress of counselor

Also Published As

Publication number Publication date
KR102512285B1 (en) 2023-03-22
KR20220039041A (en) 2022-03-29

Similar Documents

Publication Publication Date Title
WO2019168253A1 (en) Interactive counseling chatbot device and method for hierarchically understanding user's expression and generating answer
WO2018128238A1 (en) Virtual consultation system and method using display device
CN102623011B (en) Information processing apparatus, information processing method and information processing system
WO2020034526A1 (en) Quality inspection method, apparatus, device and computer storage medium for insurance recording
CN1117336C (en) Intelligent human/computer interface system
WO2020207035A1 (en) Crank call interception method, apparatus, and device, and storage medium
WO2015005679A1 (en) Voice recognition method, apparatus, and system
CN105261362A (en) Conversation voice monitoring method and system
WO2021010744A1 (en) Method and device for analyzing sales conversation based on speech recognition
EP3545487A1 (en) Electronic apparatus, controlling method of thereof and non-transitory computer readable recording medium
WO2018174443A1 (en) Electronic apparatus, controlling method of thereof and non-transitory computer readable recording medium
KR101795593B1 (en) Device and method for protecting phone counselor
WO2014106979A1 (en) Method for recognizing statistical voice language
US11895272B2 (en) Systems and methods for prioritizing emergency calls
KR20200125526A (en) Quality assurance method for consultation service using artifical neural network, and computer program performing the method
KR20150089168A (en) the language analisys method and system using the artificial intelligence
WO2020213785A1 (en) System for automatically generating text-based sentences on basis of deep learning to achieve improvement related to infinity of utterance patterns
JP6183841B2 (en) Call center term management system and method for grasping signs of NG word
WO2021137431A1 (en) Ai-based voice ordering system and method therefor
WO2022059852A1 (en) Stress response system and method for counselor
WO2021107448A1 (en) Method and apparatus for providing knowledge graph-based marketing information analysis service to support efficient document classification processing
CN112333355A (en) Tunnel inspection system
WO2020149541A1 (en) Method and device for automatically generating question-answer data set for specific topic
JP6733901B2 (en) Psychological analysis device, psychological analysis method, and program
WO2018084379A1 (en) Apparatus and method for measuring reliability of speaker

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20954246

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20954246

Country of ref document: EP

Kind code of ref document: A1