RU2781493C1 - Robotic question-answer system with a voice module "virtual assistant" - Google Patents
Robotic question-answer system with a voice module "virtual assistant" Download PDFInfo
- Publication number
- RU2781493C1 RU2781493C1 RU2021134732A RU2021134732A RU2781493C1 RU 2781493 C1 RU2781493 C1 RU 2781493C1 RU 2021134732 A RU2021134732 A RU 2021134732A RU 2021134732 A RU2021134732 A RU 2021134732A RU 2781493 C1 RU2781493 C1 RU 2781493C1
- Authority
- RU
- Russia
- Prior art keywords
- module
- dialogue
- audiosocket
- speech
- voice
- Prior art date
Links
- 238000004805 robotic Methods 0.000 title claims abstract description 9
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 9
- 238000001514 detection method Methods 0.000 claims abstract description 8
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 8
- 230000002194 synthesizing Effects 0.000 claims abstract description 8
- 230000002457 bidirectional Effects 0.000 claims abstract description 7
- 230000003993 interaction Effects 0.000 abstract description 8
- 238000004891 communication Methods 0.000 abstract description 7
- 230000005540 biological transmission Effects 0.000 abstract description 3
- 230000000694 effects Effects 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 230000002452 interceptive Effects 0.000 description 3
- 210000004544 DC2 Anatomy 0.000 description 2
- 230000002530 ischemic preconditioning Effects 0.000 description 2
- 241000950629 Icteria Species 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005755 formation reaction Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Abstract
Description
Техническое решение относится к области информационных технологий и систем связи, использующих, в частности, к интерфейс управления телекоммуникационными информационными системами, использующими IVR (Interactive Voice Response - голосовые меню), и может быть использована для автоматизированного предоставления разнообразных услуг в телекоммуникационной сети с использованием сервиса IVR.The technical solution relates to the field of information technology and communication systems, using, in particular, the interface for managing telecommunication information systems using IVR (Interactive Voice Response - voice menus), and can be used to automatically provide a variety of services in a telecommunications network using the IVR service .
Из уровня техники известна система (патент RU 95206, МПК H04L 12/00, опубл. 10.06.2010), содержащая функционал воспроизведения аудиозаписей в голосовом канале связи с возможностью частично или полностью закрывать входящие обращения поступающие в контакт-центр в голосовом канале. Также содержащая систему многоуровневого голосового меню, включающую модуль IVR (Interactive Voice Response - интерактивный голосовой ответ), которая связана с сервером сообщений, включающим в себя средства приема, обработки и хранения голосовых сообщений, средства формирования меню и очередности сообщений, модуль коммутации, связанный с модулем IVR. A system is known from the prior art (patent RU 95206, IPC
Недостатки данной системы: взаимодействие с системой осуществляется путем нажатия клавиш на телефоне в зависимости от озвученной информации, а также отсутствие возможности интегрироваться с текстовым каналом связи таким как чат-система или мессенджер. The disadvantages of this system: interaction with the system is carried out by pressing the keys on the phone, depending on the voiced information, as well as the inability to integrate with a text communication channel such as a chat system or messenger.
Из уровня техники известна роботизированная вопросно-ответная система с голосовым модулем (патент RU 2724600, МПК G10L15/22, G06F40/20, опубл. 25.06.2020), которая содержит модуль автоматического запуска соединения с электронным устройством пользователя, выполненный с возможностью взаимодействия с IVR-системой для обеспечения соединения с электронным устройством пользователя, причем система содержит модуль составления отчетов о взаимодействии роботизированной вопросно-ответной системы с IVR-системой, выполненный с возможностью заполнения отчета данными, полученными при взаимодействии роботизированной вопросно-ответной системы с IVR-системой в случае отсутствия установленного соединения системы с электронным устройством пользователя. A robotic question-answer system with a voice module is known from the prior art (patent RU 2724600, IPC G10L15 / 22, G06F40 / 20, publ. 06/25/2020), which contains a module for automatically starting a connection with a user's electronic device, configured to interact with an IVR - a system for providing connection with the user's electronic device, and the system contains a module for reporting on the interaction of the robotic question-answer system with the IVR system, configured to fill the report with data obtained during the interaction of the robotic question-answer system with the IVR system in the absence of established connection of the system with the user's electronic device.
Недостатки данной системы: отсутствие визуального интерфейса диалоговой для редактирования сценария диалога.Disadvantages of this system: lack of a visual dialog interface for editing the dialog script.
Техническая задача изобретения направлена на расширение функционала голосовой роботизированной вопросно-ответной системы.The technical problem of the invention is aimed at expanding the functionality of the voice robotic question-answer system.
Технический результат, на достижение которого направлено изобретение, заключается в обеспечении распознавания устной речи, и за счет ключевых слов или классификатора тематик воспроизводить определенный блок речевых фраз из диалогового сценария, а также в обеспечении взаимодействия с текстовым каналом коммуникации по принципу работы голосового канала за исключением модуля распознавания речи.The technical result, to which the invention is directed, is to provide recognition of oral speech, and, due to keywords or a classifier of topics, reproduce a certain block of speech phrases from a dialogue scenario, as well as to ensure interaction with a text communication channel according to the principle of operation of a voice channel, with the exception of the module speech recognition.
Технический результат достигается тем, что роботизированная вопросно-ответная система с голосовым модулем содержит модуль телефонной станции АТС Asterisk, выполненный с возможностью при поступлении звонка перенаправлять его на модуль с протоколом двунаправленной передачи звука AudioSocket, выполненный с возможностью перехвата управления голосовым потоком и перенаправления его через модуль детекции тишины в модуль распознавания речи, выполненный с возможностью преобразования устной речи в текст и соединенный с диалоговым модулем, который через базу данных виртуального ассистента, в которой хранится информация о сценарии диалога и информации по прохождению сценария для каждого обращения, соединен с модулем составления отчета, также диалоговый модуль соединен с модулем синтеза речи, который в свою очередь соединен с модулем протокола двунаправленной передачи звука AudioSocket.The technical result is achieved by the fact that the robotic question-answer system with a voice module contains an Asterisk PBX telephone exchange module, configured to redirect it to a module with an AudioSocket bidirectional audio protocol when a call arrives, configured to intercept control of the voice stream and redirect it through the module silence detection into a speech recognition module configured to convert oral speech into text and connected to the dialogue module, which is connected to the reporting module through the virtual assistant database, which stores information about the dialogue script and information on the passage of the script for each call, also, the dialog module is connected to the speech synthesis module, which in turn is connected to the AudioSocket bidirectional audio protocol module.
За счет наличия в системе модуля распознавания устной речи система может взаимодействовать с клиентом в голосовом канале. Due to the presence of a speech recognition module in the system, the system can interact with the client in the voice channel.
За счет наличия в системе модуля синтеза речи в системе осуществляется воспроизведение определенного блока речевых фраз без использования предварительно записанных аудио файлов.Due to the presence of a speech synthesis module in the system, the system reproduces a certain block of speech phrases without using pre-recorded audio files.
При помощи диалогового модуля обеспечиваются взаимодействия с текстовым каналом коммуникации по принципу работы голосового канала за исключением модуля распознавания речи за счет работы с текстовым представлением данных с использованием методов прохождения скрипта по ключевым словам или классификатора тематик.With the help of the dialog module, interactions with the text communication channel are provided according to the principle of the voice channel, with the exception of the speech recognition module, by working with the textual representation of data using the methods of passing the script by keywords or the classifier of topics.
Голосовая роботизированная вопросно-ответная система может быть представлена программно-аппаратным комплексом, выполненным с возможностью взаимодействия с электронным устройством пользователя по каналу цифровой связи, например, сервером, содержащим специализированное программное обеспечение и выполненным с возможностью вопросно-ответного взаимодействия с электронным устройством пользователя, а также загрузки, редактирования и удаления специализированного программного обеспечения администратором системы. Система может содержать базу сценариев взаимодействия с пользователем, которая может быть интегрирована в модуль автоматического запуска соединения с электронным устройством пользователя, либо она может быть размещена удаленно и может быть соединена с модулем автоматического запуска сценария любыми известными средствами обеспечения связи. The voice robotic question-and-answer system can be represented by a software and hardware system capable of interacting with the user's electronic device via a digital communication channel, for example, a server containing specialized software and configured for question-answer interaction with the user's electronic device, as well as loading, editing and removal of specialized software by the system administrator. The system may comprise a database of user interaction scripts that may be integrated into the auto-start module for connecting to the user's electronic device, or it may be hosted remotely and connected to the auto-script launch module by any known means of communication.
Сущность заявляемой системы поясняется графическим материалом, где на фиг. представлена блок-схема системы, где основным блокам/модулям присвоены следующие позиции:The essence of the proposed system is illustrated by graphic material, where in Fig. a block diagram of the system is presented, where the following positions are assigned to the main blocks / modules:
1. Телефон, устройство с которого поступает сигнал;1. Phone, the device from which the signal is received;
2. Модуль телефонной станции ATC Asterisk;2. ATC Asterisk telephone exchange module;
3. Модуль с протоколом двунаправленной передачи звука AudioSocket;3. Module with AudioSocket bidirectional audio protocol;
4. Модуль детекции тишины;4. Silence detection module;
5. Модуль распознавания речи;5. Speech recognition module;
6. Диалоговый модуль;6. Dialogue module;
7. База данных виртуального ассистента;7. Virtual assistant database;
8. Модуль составления отчетов;8. Reporting module;
9. Модуль синтеза речи.9. Speech synthesis module.
Система работает следующим образом. The system works as follows.
При реализации работы системы осуществляются следующие основные этапы (показаны на фиг.):When implementing the system operation, the following main stages are carried out (shown in Fig.):
10 - Осуществление вызова (звонка) с телефона пользователя 1 на модуль телефонной станции АТС Asterisk 2;10 - Making a call (call) from the user's phone 1 to the PBX Asterisk 2 module;
11 - Передача управления голосовым потоком АТС Asterisk 2 модуль с AudioSocket 3;11 - Transfer control of the voice flow of the PBX
12 - Извлечение частей голосового потока, где пользователь произносил какие-либо фразы, в модуль с AudioSocket 3, с помощью модуля детекции тишины VAD 4;12 - Extracting parts of the voice stream, where the user spoke any phrases, to the module with AudioSocket 3, using the VAD 4 silence detection module;
13 - Преобразование голоса в текст из фразы, извлеченной благодаря модулю детекции тишины VAD 4, при помощи модуля распознавания речи 5;13 - Converting voice to text from a phrase extracted thanks to the VAD 4 silence detection module using the speech recognition module 5;
14 - Передача текстовой фразы из модуля распознавания речи 5 в диалоговый модуль 6;14 - Transferring a text phrase from the speech recognition module 5 to the dialog module 6;
15 - Сохранение необходимой информации в базу данных 7 из диалогового модуля 6, для формирования ответа пользователю;15 - Saving the necessary information to the database 7 from the dialog module 6, to form a response to the user;
16 - Формирование диалога, используя необходимую информацию из базы данных 7, обработанной модулем составления отчетов 8;16 - Formation of a dialogue using the necessary information from the database 7 processed by the reporting module 8;
17 - Сохранение текущего состояния диалога с пользователем в базу данных 7 из модуля составления отчетов 8;17 - Saving the current state of the dialogue with the user to the database 7 from the reporting module 8;
18 - Извлечение текстового ответа пользователю в диалоговый модуль 6 из базы данных 7;18 - Extracting a text response to the user in the dialog module 6 from the database 7;
19 - Преобразование текстовой фразы из диалогового модуля 6 в аудио сегмент при помощи модуля синтеза речи 9;19 - Converting a text phrase from a dialogue module 6 into an audio segment using a speech synthesis module 9;
20 - Добавление аудио фразы из модуля синтеза речи 9 в голосовой поток модуля с AudioSocket 3;20 - Adding an audio phrase from the speech synthesis module 9 to the voice stream of the module with AudioSocket 3;
21 - Передача голосового потока из модуля с AudioSocket 3 в модуль телефонной станции АТС Asterisk 2;21 - Transmission of a voice stream from the module with AudioSocket 3 to the module of the telephone exchange PBX Asterisk 2;
22 - Воспроизведение голосового потока в телефоне пользователя 1 из модуля телефонной станции АТС Asterisk 2.22 - Playback of the voice stream in the user's phone 1 from the PBX Asterisk 2 module.
Пример работы системы с входящими обращениями в голосовом канале по вопросам не работающего телевидения. An example of the operation of the system with incoming calls in the voice channel regarding non-working television.
В систему поступает вызов с устройства пользователя на модуль 2 телефонной станции АТС Asterisk. Затем осуществляется передача голосового потока из модуля 2 АТС Asterisk в модуль 3 с AudioSocket. Далее ожидается фраза от пользователя с причиной обращения. Пользователь голосом озвучивает причину «не показывает кабельное телевидение». С помощью модуля детекции тишины 4 определяется момент окончания фразы, после чего модуль детекции тишины 4 отправляет в модуль распознавания речи 5 запись фразы пользователя. Модель распознавания речи 5 переводит ее в текст и отправляет в диалоговый модуль 6. Диалоговый модуль 6 сохраняет в базу данных 7 виртуального ассистента распознанный текст фразы пользователя и определяет с помощью классификатора тематик тему обращения и берет из базы 7 данные, которые нужно озвучить в рамках сценария для определенной темы.The system receives a call from the user's device to
В случае темы «проблемы с кабельным телевидением» пользователю будет озвучена фраза с просьбой проверить плотность подключения кабеля к телевизору. Ответ отправляется в голосовой канал от диалогового модуля 6 в модуль 3 с AudioSocket через модуль синтеза речи 9, в котором происходит преобразование текста ответа в аудио. Далее от модуля 3 с AudioSocket передается голосовой поток в модуль 2 АТС Asterisk и воспроизводится в устройство пользователя. Далее ожидается ответ от пользователя.In the case of the topic “problems with cable TV”, a phrase will be heard asking the user to check the tightness of the cable connection to the TV. The response is sent to the voice channel from the dialog module 6 to the
Последующая обработка всех ответов от пользователя происходит по аналогичному сценарию обработки первой фразы. В текущем примере если, пользователь ответит, что у него плотно вставлен кабель в телевизор, то система предложит ему проверить целостность кабеля в квартире. В том случае, если пользователь подтверждает целостность кабеля в квартире, то озвучивается информация о том, что по адресу пользователя оформится выезд инженера для проверки целостности кабеля на прилегающей территории и разговор закончится. Модуль 2 АТС Asterisk завершит звонок.Subsequent processing of all responses from the user occurs according to a similar scenario for processing the first phrase. In the current example, if the user answers that he has a cable tightly inserted into the TV, the system will prompt him to check the integrity of the cable in the apartment. In the event that the user confirms the integrity of the cable in the apartment, then information is announced that an engineer will visit the address of the user to check the integrity of the cable in the adjacent territory and the conversation will end. Asterisk
Представленная система обеспечивает автоматическое информирование клиентов без участия оператора на входящих и исходящих звонках, чатах, а также выполнение сценариев автоматизации.The presented system provides automatic informing of clients without the participation of an operator on incoming and outgoing calls, chats, as well as the execution of automation scripts.
Данная система может быть использована в чат-ботах, или голосовых роботах, помогает обрабатывать входящие обращения клиентов, не прибегая к помощи операторов, и позволяет осуществлять автоматическое информирование клиентов, автоматическое закрытие обращения, а также автоматическое определение темы обращения и перевод обращения на нужного сотрудника компании.This system can be used in chat bots, or voice robots, helps to process incoming customer requests without the help of operators, and allows you to automatically inform customers, automatically close the call, as well as automatically determine the subject of the call and transfer the call to the right employee of the company .
Claims (1)
Publications (1)
Publication Number | Publication Date |
---|---|
RU2781493C1 true RU2781493C1 (en) | 2022-10-12 |
Family
ID=
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9336526B2 (en) * | 2012-10-30 | 2016-05-10 | Teletech Holdings, Inc. | Method for providing support using answer engine and dialog rules |
US9942401B2 (en) * | 2002-03-15 | 2018-04-10 | Intellisist, Inc. | System and method for automated call center operation facilitating agent-caller communication |
RU2653250C2 (en) * | 2010-01-18 | 2018-05-07 | Эппл Инк. | Support of context information during interactions between user and voice assistant |
US20180278751A1 (en) * | 2005-08-19 | 2018-09-27 | Nexstep, Inc. | Consumer electronic registration, control and support concierge device and method |
US10431220B2 (en) * | 2008-08-07 | 2019-10-01 | Vocollect, Inc. | Voice assistant system |
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9942401B2 (en) * | 2002-03-15 | 2018-04-10 | Intellisist, Inc. | System and method for automated call center operation facilitating agent-caller communication |
US20180278751A1 (en) * | 2005-08-19 | 2018-09-27 | Nexstep, Inc. | Consumer electronic registration, control and support concierge device and method |
US10431220B2 (en) * | 2008-08-07 | 2019-10-01 | Vocollect, Inc. | Voice assistant system |
RU2653250C2 (en) * | 2010-01-18 | 2018-05-07 | Эппл Инк. | Support of context information during interactions between user and voice assistant |
US9336526B2 (en) * | 2012-10-30 | 2016-05-10 | Teletech Holdings, Inc. | Method for providing support using answer engine and dialog rules |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109413286B (en) | Intelligent customer service voice response system and method | |
US10129394B2 (en) | Telephonic communication routing system based on customer satisfaction | |
EP1414227B1 (en) | Event detection for multiple voice channel communications | |
US7573985B2 (en) | Systems and methods for facilitating communications involving hearing-impaired parties | |
CN1636384B (en) | Method and system for conducting conference calls with optional voice to text translation | |
US6771746B2 (en) | Method and apparatus for agent optimization using speech synthesis and recognition | |
CN110557451B (en) | Dialogue interaction processing method and device, electronic equipment and storage medium | |
CN102017513B (en) | Method for real time network communication as well as method and system for real time multi-lingual communication | |
US20200382634A1 (en) | Call processing method and apparatus, server, storage medium, and system | |
CN1946107B (en) | Interactive telephony trainer and exerciser | |
US6108410A (en) | Methods and apparatus for automating the detection, reporting and correction of operator input errors | |
US20050232169A1 (en) | System and method for providing telecommunication relay services | |
US20080232559A1 (en) | Method for voice response and voice server | |
WO1998027711A2 (en) | Intelligent services network test system | |
CN109417583A (en) | It is a kind of by audio signal real time transcription be text system and method | |
CN111402881B (en) | Intelligent dialogue robot system and method for realizing intelligent dialogue | |
CN112887194B (en) | Interactive method, device, terminal and storage medium for realizing communication of hearing-impaired people | |
US20020087323A1 (en) | Voice service system and method | |
CN111629110A (en) | Voice interaction method and voice interaction system | |
US6427006B1 (en) | Methods and apparatus for servicing directory assistance calls requesting non-published number information | |
RU2781493C1 (en) | Robotic question-answer system with a voice module "virtual assistant" | |
US7180992B2 (en) | Method and device for providing conferences | |
US6480598B1 (en) | Methods and apparatus for automating the telephone operator services | |
CN114420130A (en) | Telephone voice interaction method, device, equipment and storage medium | |
CN110534084A (en) | Intelligent voice control method and system based on FreeWITCH |