RU2781493C1 - Robotic question-answer system with a voice module "virtual assistant" - Google Patents

Robotic question-answer system with a voice module "virtual assistant" Download PDF

Info

Publication number
RU2781493C1
RU2781493C1 RU2021134732A RU2021134732A RU2781493C1 RU 2781493 C1 RU2781493 C1 RU 2781493C1 RU 2021134732 A RU2021134732 A RU 2021134732A RU 2021134732 A RU2021134732 A RU 2021134732A RU 2781493 C1 RU2781493 C1 RU 2781493C1
Authority
RU
Russia
Prior art keywords
module
dialogue
audiosocket
speech
voice
Prior art date
Application number
RU2021134732A
Other languages
Russian (ru)
Inventor
Леонид Александрович Вахрамеев
Николай Дмитриевич Обливальный
Original Assignee
Общество с ограниченной ответственностью фирма "Интерсвязь"
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью фирма "Интерсвязь" filed Critical Общество с ограниченной ответственностью фирма "Интерсвязь"
Application granted granted Critical
Publication of RU2781493C1 publication Critical patent/RU2781493C1/en

Links

Images

Abstract

FIELD: robotics.
SUBSTANCE: invention relates to interfaces for controlling telecommunication information systems. The technical result is achieved due to the system containing a telephone station module configured to redirect the received call to a module with the bidirectional sound transmission protocol AudioSocket, configured to intercept and redirect voice flow control through the silence detection module into the speech recognition module configured to convert oral speech into text and connected with a dialogue module connected with the reporting module via the virtual assistant database storing the information of the dialogue script and information on passing the script for each request; the dialogue module is also connected with the speech synthesis module connected, in turn, with the module of the bidirectional sound transmission protocol AudioSocket.
EFFECT: ensured speech recognition and interaction with the text communication channel.
1 cl, 1 dwg

Description

Техническое решение относится к области информационных технологий и систем связи, использующих, в частности, к интерфейс управления телекоммуникационными информационными системами, использующими IVR (Interactive Voice Response - голосовые меню), и может быть использована для автоматизированного предоставления разнообразных услуг в телекоммуникационной сети с использованием сервиса IVR.The technical solution relates to the field of information technology and communication systems, using, in particular, the interface for managing telecommunication information systems using IVR (Interactive Voice Response - voice menus), and can be used to automatically provide a variety of services in a telecommunications network using the IVR service .

Из уровня техники известна система (патент RU 95206, МПК H04L 12/00, опубл. 10.06.2010), содержащая функционал воспроизведения аудиозаписей в голосовом канале связи с возможностью частично или полностью закрывать входящие обращения поступающие в контакт-центр в голосовом канале. Также содержащая систему многоуровневого голосового меню, включающую модуль IVR (Interactive Voice Response - интерактивный голосовой ответ), которая связана с сервером сообщений, включающим в себя средства приема, обработки и хранения голосовых сообщений, средства формирования меню и очередности сообщений, модуль коммутации, связанный с модулем IVR. A system is known from the prior art (patent RU 95206, IPC H04L 12/00, published on 06/10/2010), containing the functionality of playing audio recordings in the voice channel with the ability to partially or completely close incoming calls coming to the contact center in the voice channel. Also containing a multi-level voice menu system, including an IVR (Interactive Voice Response - interactive voice response) module, which is connected to a message server, including means for receiving, processing and storing voice messages, means for creating a menu and message queue, a switching module associated with IVR module.

Недостатки данной системы: взаимодействие с системой осуществляется путем нажатия клавиш на телефоне в зависимости от озвученной информации, а также отсутствие возможности интегрироваться с текстовым каналом связи таким как чат-система или мессенджер. The disadvantages of this system: interaction with the system is carried out by pressing the keys on the phone, depending on the voiced information, as well as the inability to integrate with a text communication channel such as a chat system or messenger.

Из уровня техники известна роботизированная вопросно-ответная система с голосовым модулем (патент RU 2724600, МПК G10L15/22, G06F40/20, опубл. 25.06.2020), которая содержит модуль автоматического запуска соединения с электронным устройством пользователя, выполненный с возможностью взаимодействия с IVR-системой для обеспечения соединения с электронным устройством пользователя, причем система содержит модуль составления отчетов о взаимодействии роботизированной вопросно-ответной системы с IVR-системой, выполненный с возможностью заполнения отчета данными, полученными при взаимодействии роботизированной вопросно-ответной системы с IVR-системой в случае отсутствия установленного соединения системы с электронным устройством пользователя. A robotic question-answer system with a voice module is known from the prior art (patent RU 2724600, IPC G10L15 / 22, G06F40 / 20, publ. 06/25/2020), which contains a module for automatically starting a connection with a user's electronic device, configured to interact with an IVR - a system for providing connection with the user's electronic device, and the system contains a module for reporting on the interaction of the robotic question-answer system with the IVR system, configured to fill the report with data obtained during the interaction of the robotic question-answer system with the IVR system in the absence of established connection of the system with the user's electronic device.

Недостатки данной системы: отсутствие визуального интерфейса диалоговой для редактирования сценария диалога.Disadvantages of this system: lack of a visual dialog interface for editing the dialog script.

Техническая задача изобретения направлена на расширение функционала голосовой роботизированной вопросно-ответной системы.The technical problem of the invention is aimed at expanding the functionality of the voice robotic question-answer system.

Технический результат, на достижение которого направлено изобретение, заключается в обеспечении распознавания устной речи, и за счет ключевых слов или классификатора тематик воспроизводить определенный блок речевых фраз из диалогового сценария, а также в обеспечении взаимодействия с текстовым каналом коммуникации по принципу работы голосового канала за исключением модуля распознавания речи.The technical result, to which the invention is directed, is to provide recognition of oral speech, and, due to keywords or a classifier of topics, reproduce a certain block of speech phrases from a dialogue scenario, as well as to ensure interaction with a text communication channel according to the principle of operation of a voice channel, with the exception of the module speech recognition.

Технический результат достигается тем, что роботизированная вопросно-ответная система с голосовым модулем содержит модуль телефонной станции АТС Asterisk, выполненный с возможностью при поступлении звонка перенаправлять его на модуль с протоколом двунаправленной передачи звука AudioSocket, выполненный с возможностью перехвата управления голосовым потоком и перенаправления его через модуль детекции тишины в модуль распознавания речи, выполненный с возможностью преобразования устной речи в текст и соединенный с диалоговым модулем, который через базу данных виртуального ассистента, в которой хранится информация о сценарии диалога и информации по прохождению сценария для каждого обращения, соединен с модулем составления отчета, также диалоговый модуль соединен с модулем синтеза речи, который в свою очередь соединен с модулем протокола двунаправленной передачи звука AudioSocket.The technical result is achieved by the fact that the robotic question-answer system with a voice module contains an Asterisk PBX telephone exchange module, configured to redirect it to a module with an AudioSocket bidirectional audio protocol when a call arrives, configured to intercept control of the voice stream and redirect it through the module silence detection into a speech recognition module configured to convert oral speech into text and connected to the dialogue module, which is connected to the reporting module through the virtual assistant database, which stores information about the dialogue script and information on the passage of the script for each call, also, the dialog module is connected to the speech synthesis module, which in turn is connected to the AudioSocket bidirectional audio protocol module.

За счет наличия в системе модуля распознавания устной речи система может взаимодействовать с клиентом в голосовом канале. Due to the presence of a speech recognition module in the system, the system can interact with the client in the voice channel.

За счет наличия в системе модуля синтеза речи в системе осуществляется воспроизведение определенного блока речевых фраз без использования предварительно записанных аудио файлов.Due to the presence of a speech synthesis module in the system, the system reproduces a certain block of speech phrases without using pre-recorded audio files.

При помощи диалогового модуля обеспечиваются взаимодействия с текстовым каналом коммуникации по принципу работы голосового канала за исключением модуля распознавания речи за счет работы с текстовым представлением данных с использованием методов прохождения скрипта по ключевым словам или классификатора тематик.With the help of the dialog module, interactions with the text communication channel are provided according to the principle of the voice channel, with the exception of the speech recognition module, by working with the textual representation of data using the methods of passing the script by keywords or the classifier of topics.

Голосовая роботизированная вопросно-ответная система может быть представлена программно-аппаратным комплексом, выполненным с возможностью взаимодействия с электронным устройством пользователя по каналу цифровой связи, например, сервером, содержащим специализированное программное обеспечение и выполненным с возможностью вопросно-ответного взаимодействия с электронным устройством пользователя, а также загрузки, редактирования и удаления специализированного программного обеспечения администратором системы. Система может содержать базу сценариев взаимодействия с пользователем, которая может быть интегрирована в модуль автоматического запуска соединения с электронным устройством пользователя, либо она может быть размещена удаленно и может быть соединена с модулем автоматического запуска сценария любыми известными средствами обеспечения связи. The voice robotic question-and-answer system can be represented by a software and hardware system capable of interacting with the user's electronic device via a digital communication channel, for example, a server containing specialized software and configured for question-answer interaction with the user's electronic device, as well as loading, editing and removal of specialized software by the system administrator. The system may comprise a database of user interaction scripts that may be integrated into the auto-start module for connecting to the user's electronic device, or it may be hosted remotely and connected to the auto-script launch module by any known means of communication.

Сущность заявляемой системы поясняется графическим материалом, где на фиг. представлена блок-схема системы, где основным блокам/модулям присвоены следующие позиции:The essence of the proposed system is illustrated by graphic material, where in Fig. a block diagram of the system is presented, where the following positions are assigned to the main blocks / modules:

1. Телефон, устройство с которого поступает сигнал;1. Phone, the device from which the signal is received;

2. Модуль телефонной станции ATC Asterisk;2. ATC Asterisk telephone exchange module;

3. Модуль с протоколом двунаправленной передачи звука AudioSocket;3. Module with AudioSocket bidirectional audio protocol;

4. Модуль детекции тишины;4. Silence detection module;

5. Модуль распознавания речи;5. Speech recognition module;

6. Диалоговый модуль;6. Dialogue module;

7. База данных виртуального ассистента;7. Virtual assistant database;

8. Модуль составления отчетов;8. Reporting module;

9. Модуль синтеза речи.9. Speech synthesis module.

Система работает следующим образом. The system works as follows.

При реализации работы системы осуществляются следующие основные этапы (показаны на фиг.):When implementing the system operation, the following main stages are carried out (shown in Fig.):

10 - Осуществление вызова (звонка) с телефона пользователя 1 на модуль телефонной станции АТС Asterisk 2;10 - Making a call (call) from the user's phone 1 to the PBX Asterisk 2 module;

11 - Передача управления голосовым потоком АТС Asterisk 2 модуль с AudioSocket 3;11 - Transfer control of the voice flow of the PBX Asterisk 2 module with AudioSocket 3;

12 - Извлечение частей голосового потока, где пользователь произносил какие-либо фразы, в модуль с AudioSocket 3, с помощью модуля детекции тишины VAD 4;12 - Extracting parts of the voice stream, where the user spoke any phrases, to the module with AudioSocket 3, using the VAD 4 silence detection module;

13 - Преобразование голоса в текст из фразы, извлеченной благодаря модулю детекции тишины VAD 4, при помощи модуля распознавания речи 5;13 - Converting voice to text from a phrase extracted thanks to the VAD 4 silence detection module using the speech recognition module 5;

14 - Передача текстовой фразы из модуля распознавания речи 5 в диалоговый модуль 6;14 - Transferring a text phrase from the speech recognition module 5 to the dialog module 6;

15 - Сохранение необходимой информации в базу данных 7 из диалогового модуля 6, для формирования ответа пользователю;15 - Saving the necessary information to the database 7 from the dialog module 6, to form a response to the user;

16 - Формирование диалога, используя необходимую информацию из базы данных 7, обработанной модулем составления отчетов 8;16 - Formation of a dialogue using the necessary information from the database 7 processed by the reporting module 8;

17 - Сохранение текущего состояния диалога с пользователем в базу данных 7 из модуля составления отчетов 8;17 - Saving the current state of the dialogue with the user to the database 7 from the reporting module 8;

18 - Извлечение текстового ответа пользователю в диалоговый модуль 6 из базы данных 7;18 - Extracting a text response to the user in the dialog module 6 from the database 7;

19 - Преобразование текстовой фразы из диалогового модуля 6 в аудио сегмент при помощи модуля синтеза речи 9;19 - Converting a text phrase from a dialogue module 6 into an audio segment using a speech synthesis module 9;

20 - Добавление аудио фразы из модуля синтеза речи 9 в голосовой поток модуля с AudioSocket 3;20 - Adding an audio phrase from the speech synthesis module 9 to the voice stream of the module with AudioSocket 3;

21 - Передача голосового потока из модуля с AudioSocket 3 в модуль телефонной станции АТС Asterisk 2;21 - Transmission of a voice stream from the module with AudioSocket 3 to the module of the telephone exchange PBX Asterisk 2;

22 - Воспроизведение голосового потока в телефоне пользователя 1 из модуля телефонной станции АТС Asterisk 2.22 - Playback of the voice stream in the user's phone 1 from the PBX Asterisk 2 module.

Пример работы системы с входящими обращениями в голосовом канале по вопросам не работающего телевидения. An example of the operation of the system with incoming calls in the voice channel regarding non-working television.

В систему поступает вызов с устройства пользователя на модуль 2 телефонной станции АТС Asterisk. Затем осуществляется передача голосового потока из модуля 2 АТС Asterisk в модуль 3 с AudioSocket. Далее ожидается фраза от пользователя с причиной обращения. Пользователь голосом озвучивает причину «не показывает кабельное телевидение». С помощью модуля детекции тишины 4 определяется момент окончания фразы, после чего модуль детекции тишины 4 отправляет в модуль распознавания речи 5 запись фразы пользователя. Модель распознавания речи 5 переводит ее в текст и отправляет в диалоговый модуль 6. Диалоговый модуль 6 сохраняет в базу данных 7 виртуального ассистента распознанный текст фразы пользователя и определяет с помощью классификатора тематик тему обращения и берет из базы 7 данные, которые нужно озвучить в рамках сценария для определенной темы.The system receives a call from the user's device to module 2 of the telephone exchange Asterisk PBX. Then the voice stream is transferred from module 2 of Asterisk PBX to module 3 with AudioSocket. Next, a phrase is expected from the user with the reason for the request. The user voices the reason "does not show cable TV." With the help of the silence detection module 4, the moment of the end of the phrase is determined, after which the silence detection module 4 sends a record of the user's phrase to the speech recognition module 5. The speech recognition model 5 translates it into text and sends it to the dialog module 6. The dialog module 6 saves the recognized text of the user's phrase to the database 7 of the virtual assistant and determines the topic of the appeal using the topic classifier and takes from the database 7 the data that needs to be voiced within the scenario for a specific topic.

В случае темы «проблемы с кабельным телевидением» пользователю будет озвучена фраза с просьбой проверить плотность подключения кабеля к телевизору. Ответ отправляется в голосовой канал от диалогового модуля 6 в модуль 3 с AudioSocket через модуль синтеза речи 9, в котором происходит преобразование текста ответа в аудио. Далее от модуля 3 с AudioSocket передается голосовой поток в модуль 2 АТС Asterisk и воспроизводится в устройство пользователя. Далее ожидается ответ от пользователя.In the case of the topic “problems with cable TV”, a phrase will be heard asking the user to check the tightness of the cable connection to the TV. The response is sent to the voice channel from the dialog module 6 to the audio socket module 3 via the speech synthesis module 9, which converts the response text into audio. Further, from module 3 with AudioSocket, the voice stream is transmitted to module 2 of the Asterisk PBX and played back to the user's device. Next, a response from the user is expected.

Последующая обработка всех ответов от пользователя происходит по аналогичному сценарию обработки первой фразы. В текущем примере если, пользователь ответит, что у него плотно вставлен кабель в телевизор, то система предложит ему проверить целостность кабеля в квартире. В том случае, если пользователь подтверждает целостность кабеля в квартире, то озвучивается информация о том, что по адресу пользователя оформится выезд инженера для проверки целостности кабеля на прилегающей территории и разговор закончится. Модуль 2 АТС Asterisk завершит звонок.Subsequent processing of all responses from the user occurs according to a similar scenario for processing the first phrase. In the current example, if the user answers that he has a cable tightly inserted into the TV, the system will prompt him to check the integrity of the cable in the apartment. In the event that the user confirms the integrity of the cable in the apartment, then information is announced that an engineer will visit the address of the user to check the integrity of the cable in the adjacent territory and the conversation will end. Asterisk PBX module 2 will end the call.

Представленная система обеспечивает автоматическое информирование клиентов без участия оператора на входящих и исходящих звонках, чатах, а также выполнение сценариев автоматизации.The presented system provides automatic informing of clients without the participation of an operator on incoming and outgoing calls, chats, as well as the execution of automation scripts.

Данная система может быть использована в чат-ботах, или голосовых роботах, помогает обрабатывать входящие обращения клиентов, не прибегая к помощи операторов, и позволяет осуществлять автоматическое информирование клиентов, автоматическое закрытие обращения, а также автоматическое определение темы обращения и перевод обращения на нужного сотрудника компании.This system can be used in chat bots, or voice robots, helps to process incoming customer requests without the help of operators, and allows you to automatically inform customers, automatically close the call, as well as automatically determine the subject of the call and transfer the call to the right employee of the company .

Claims (1)

Роботизированная вопросно-ответная система с голосовым модулем, характеризующаяся тем, что содержит модуль телефонной станции АТС Asterisk, выполненный с возможностью при поступлении звонка перенаправлять его на модуль с протоколом двунаправленной передачи звука AudioSocket, выполненный с возможностью перехвата управления голосовым потоком и перенаправления его через модуль детекции тишины в модуль распознавания речи, выполненный с возможностью преобразования устной речи в текст и соединенный с диалоговым модулем, который через базу данных виртуального ассистента, в которой хранится информация о сценарии диалога и информации по прохождению сценария для каждого обращения, соединен с модулем составления отчета, также диалоговый модуль соединен с модулем синтеза речи, который в свою очередь соединен с модулем протокола двунаправленной передачи звука AudioSocket.A robotic question-answer system with a voice module, characterized in that it contains an Asterisk PBX telephone exchange module, configured to redirect it to a module with an AudioSocket bidirectional audio protocol when a call arrives, configured to intercept control of the voice stream and redirect it through the detection module silence into a speech recognition module configured to convert oral speech into text and connected to the dialogue module, which, through the database of the virtual assistant, which stores information about the dialogue script and information on the passage of the script for each call, is connected to the reporting module, also the dialog module is connected to the speech synthesis module, which in turn is connected to the AudioSocket bidirectional audio protocol module.
RU2021134732A 2021-11-27 Robotic question-answer system with a voice module "virtual assistant" RU2781493C1 (en)

Publications (1)

Publication Number Publication Date
RU2781493C1 true RU2781493C1 (en) 2022-10-12

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9336526B2 (en) * 2012-10-30 2016-05-10 Teletech Holdings, Inc. Method for providing support using answer engine and dialog rules
US9942401B2 (en) * 2002-03-15 2018-04-10 Intellisist, Inc. System and method for automated call center operation facilitating agent-caller communication
RU2653250C2 (en) * 2010-01-18 2018-05-07 Эппл Инк. Support of context information during interactions between user and voice assistant
US20180278751A1 (en) * 2005-08-19 2018-09-27 Nexstep, Inc. Consumer electronic registration, control and support concierge device and method
US10431220B2 (en) * 2008-08-07 2019-10-01 Vocollect, Inc. Voice assistant system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9942401B2 (en) * 2002-03-15 2018-04-10 Intellisist, Inc. System and method for automated call center operation facilitating agent-caller communication
US20180278751A1 (en) * 2005-08-19 2018-09-27 Nexstep, Inc. Consumer electronic registration, control and support concierge device and method
US10431220B2 (en) * 2008-08-07 2019-10-01 Vocollect, Inc. Voice assistant system
RU2653250C2 (en) * 2010-01-18 2018-05-07 Эппл Инк. Support of context information during interactions between user and voice assistant
US9336526B2 (en) * 2012-10-30 2016-05-10 Teletech Holdings, Inc. Method for providing support using answer engine and dialog rules

Similar Documents

Publication Publication Date Title
CN109413286B (en) Intelligent customer service voice response system and method
US10129394B2 (en) Telephonic communication routing system based on customer satisfaction
EP1414227B1 (en) Event detection for multiple voice channel communications
US7573985B2 (en) Systems and methods for facilitating communications involving hearing-impaired parties
CN1636384B (en) Method and system for conducting conference calls with optional voice to text translation
US6771746B2 (en) Method and apparatus for agent optimization using speech synthesis and recognition
CN110557451B (en) Dialogue interaction processing method and device, electronic equipment and storage medium
CN102017513B (en) Method for real time network communication as well as method and system for real time multi-lingual communication
US20200382634A1 (en) Call processing method and apparatus, server, storage medium, and system
CN1946107B (en) Interactive telephony trainer and exerciser
US6108410A (en) Methods and apparatus for automating the detection, reporting and correction of operator input errors
US20050232169A1 (en) System and method for providing telecommunication relay services
US20080232559A1 (en) Method for voice response and voice server
WO1998027711A2 (en) Intelligent services network test system
CN109417583A (en) It is a kind of by audio signal real time transcription be text system and method
CN111402881B (en) Intelligent dialogue robot system and method for realizing intelligent dialogue
CN112887194B (en) Interactive method, device, terminal and storage medium for realizing communication of hearing-impaired people
US20020087323A1 (en) Voice service system and method
CN111629110A (en) Voice interaction method and voice interaction system
US6427006B1 (en) Methods and apparatus for servicing directory assistance calls requesting non-published number information
RU2781493C1 (en) Robotic question-answer system with a voice module "virtual assistant"
US7180992B2 (en) Method and device for providing conferences
US6480598B1 (en) Methods and apparatus for automating the telephone operator services
CN114420130A (en) Telephone voice interaction method, device, equipment and storage medium
CN110534084A (en) Intelligent voice control method and system based on FreeWITCH