RU2783966C1 - Способ обработки входящих звонков - Google Patents
Способ обработки входящих звонков Download PDFInfo
- Publication number
- RU2783966C1 RU2783966C1 RU2021132495A RU2021132495A RU2783966C1 RU 2783966 C1 RU2783966 C1 RU 2783966C1 RU 2021132495 A RU2021132495 A RU 2021132495A RU 2021132495 A RU2021132495 A RU 2021132495A RU 2783966 C1 RU2783966 C1 RU 2783966C1
- Authority
- RU
- Russia
- Prior art keywords
- incoming call
- incoming
- user
- processing
- call
- Prior art date
Links
- 230000004044 response Effects 0.000 claims abstract description 10
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 7
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 7
- 230000002194 synthesizing Effects 0.000 claims abstract description 7
- 238000000034 method Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 6
- 230000000694 effects Effects 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 238000001514 detection method Methods 0.000 description 5
- 229920004880 RTP PEK Polymers 0.000 description 4
- 230000001755 vocal Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001537 neural Effects 0.000 description 2
- 230000000306 recurrent Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 241001025261 Neoraja caerulea Species 0.000 description 1
- 229940116821 SSD Drugs 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006011 modification reaction Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical Effects 0.000 description 1
- 229920002239 polyacrylonitrile Polymers 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Abstract
Изобретение относится к области вычислительной техники для обработки входящих звонков. Технический результат заключается в увеличении производительности вычислительных систем при решении поставленной задачи за меньшее количество времени, тем самым снижая нагрузку на центральные процессоры вычислительных устройств. Технический результат достигается за счет выполнения заранее заданного сценария на устройстве пользователя, результатом которого является осуществление переадресации входящего вызова на заранее выбранное устройство обработки входящих вызовов при помощи средств переадресации входящих вызовов, причем на устройстве обработки входящих вызовов осуществляют, в течение заранее заданного промежутка времени, обработку входящего вызова при помощи средств распознавания голосовых данных и синтеза речевых данных с использованием предварительно обученной подсистемы искусственного интеллекта, представляющей из себя комбинацию модуля распознавания, модуля синтеза речи и модуля диалогового менеджера и выполненной с возможностью распознавания входящего аудиопотока и генерации речевых ответов в соответствии с контекстом распознанного содержимого входящего аудиопотока, причем подсистема искусственного интеллекта, работающая в реальном времени, имеет ограничение 2 с на распознавание фразы и 60 с на весь диалог. 7 з.п. ф-лы, 2 ил.
Description
ОБЛАСТЬ ТЕХНИКИ
Настоящее техническое решение относится к области вычислительной техники, в частности, к способам обработки входящих вызовов.
УРОВЕНЬ ТЕХНИКИ
Из уровня техники известно решение, выбранное в качестве наиболее близкого аналога, RU 2439716 C2, опубл. 20.07.2010. Данное решение относится к способам и устройствам детектирования автоответчика, используемым для определения того, является ли получатель вызова реальной персоной или автоответчиком. Способ содержит этапы, на которых посредством процессора осуществляют:
прием звукового ответа от получателя вызова и обработку звукового ответа посредством распознавателя речи, имеющего языковую модель для преобразования звукового ответа в вывод, указывающий распознанную речь в текстовой форме; и
обработку вывода, указывающего распознанную речь, в текстовой форме со статистическим классификатором, настроенным по словесным фразам, обычно используемым реальными персонами, и по словесным фразам, обычно используемым автоматическими системами наряду с установлением несловесных особенностей, ассоциированных со звуковым ответом для предоставления вывода, указывающего, является ли получатель вызова реальной персоной или автоответчиком, при этом указанный классификатор является отдельным от указанной языковой модели, указанная обработка является основанной на статистическом анализе вывода, указывающего распознанную речь в текстовой форме наряду с несловесными особенностями, статистический анализ, проверяющий содержимое вывода, указывающего распознанную речь, и на основании этой проверки определение, является ли вывод, указывающий распознанную речь, более статистически согласуемым со словесными фразами, обычно используемыми реальными людьми, или со словесными фразами обычно используемыми автоматическими системами.
Предлагаемое техническое решение направлено на устранение недостатков современного уровня техники и отличается от известных ранее тем, что предложенное решение обеспечивает качественную и эффективную обработку принимаемых звонков, высокопроизводительное детектирование и классификацию входящих вызовов.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Технической проблемой, на решение которой направлено заявленное решение, является создание способа обработки входящих вызовов.
Технический результат заключается в повышении качества и эффективности детектирования и классификации входящих вызовов при предпросмотре телефонных звонков, поступающих на стационарный / мобильный телефон абонента.
Дополнительным техническим результатом является увеличение производительности вычислительных систем при решении поставленной задачи (т.е. решение позволяет производить обработку с получением результата (продукта) за меньшее количество времени), тем самым снижая нагрузку на центральные процессоры вычислительных устройств, за счет уменьшения количества обрабатываемых запросов.
Заявленные технические результаты достигаются за счет осуществления способа обработки входящих вызовов, который включает в себя следующие действия:
получение входящего вызова на устройство пользователя, выполнение заранее заданного сценария на устройстве пользователя результатом которого является осуществление переадресации входящего вызова на заранее выбранное устройство обработки входящих вызовов при помощи средств переадресации входящих вызовов, причем на устройстве обработки входящих вызовов осуществляют, в течении заранее заданного промежутка времени, обработку входящего вызова при помощи средств распознавания голосовых данных и синтеза речевых данных с использованием предварительно обученной подсистемы искусственного интеллекта, выполненной с возможностью распознавания входящего аудио потока и генерации речевых ответов в соответствии с контекстом распознанного содержимого входящего аудио потока, при этом в процессе обработки подсистемы искусственного интеллекта, либо завершает разговор либо переадресовывает входящий вызов на устройство пользователя, при этом весь процесс обработки входящего вызова сохраняют в формате аудио файла, после обработки входящего вызова осуществляют расшифровку полученного аудио файла и создают на ее основе текстовое сообщение, которое совместно с полученным аудио файлом пересылают на устройство пользователя.
В частном варианте реализации описываемого решения, устройством пользователя является мобильным телефоном, либо комбинацией стационарного телефона, с которого осуществляется переадресация и мобильного телефона или стационарного персонального компьютера, на котором осуществляется просмотр результата через мессенджер.
В частном варианте реализации описываемого решения, входящий вызов является аудио вызовом.
В другом частном варианте реализации описываемого решения, промежуток времени равен 60 секундам.
В другом частном варианте реализации описываемого решения, переадресацию входящего вызова осуществляют, используя настройки телефонного аппаратов, VoIP АТС или личный кабинет абонента оператора связи.
В другом частном варианте реализации описываемого решения, текстовое сообщение и аудио файл пересылают на устройство пользователя при помощи установленных на нем мессенджеров.
В другом частном варианте реализации описываемого решения, сценарий, выполняемый на устройстве пользователя, включает в себя сброс входящего вызова в случае неответа, по расписанию, ручном сбросе или попадании в черный список.
В другом частном варианте реализации описываемого решения, сценарий, выполняемый на устройстве пользователя, может включать в себя сброс входящего вызова, осуществляемый с помощью анти-спам приложения.
В другом частном варианте реализации описываемого решения, устройство обработки входящих вызовов определяет входящий и промежуточный телефонный номер, то есть с которого осуществляется входящий вызов и с которого осуществляется переадресация.
ОПИСАНИЕ ЧЕРТЕЖЕЙ
Реализация изобретения будет описана в дальнейшем в соответствии с прилагаемыми чертежами, которые представлены для пояснения сути изобретения и никоим образом не ограничивают область изобретения. К заявке прилагаются следующие чертежи:
Фиг. 1 иллюстрирует структурную схему способа обработки входящих вызовов.
Фиг. 2 иллюстрирует пример общей схемы вычислительного устройства.
ДЕТАЛЬНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
В приведенном ниже подробном описании реализации изобретения приведены многочисленные детали реализации, призванные обеспечить отчетливое понимание настоящего изобретения. Однако, квалифицированному в предметной области специалисту, будет очевидно каким образом можно использовать настоящее изобретение, как с данными деталями реализации, так и без них. В других случаях хорошо известные методы, процедуры и компоненты не были описаны подробно, чтобы не затруднять излишне понимание особенностей настоящего изобретения.
Кроме того, из приведенного изложения будет ясно, что изобретение не ограничивается приведенной реализацией. Многочисленные возможные модификации, изменения, вариации и замены, сохраняющие суть и форму настоящего изобретения, будут очевидными для квалифицированных в предметной области специалистов.
В настоящее время в стационарных / IP / мобильных телефонных аппаратах и станциях существует возможность настройки переадресации звонка по: неответу, расписанию или попаданию в черный список (отсутствие в списке контактов звонящего). Для детектирования и классификации входящих вызовов при предпросмотре телефонных звонков, поступающих на стационарный / мобильный телефон абонента, был реализован заявляемый способ обработки входящих вызовов.
Одним из компонентов настоящего технического решения является Телефонный Шлюз Сервиса (ТШС), представляющий из себя единый номер телефона для всех пользователей (или выделенный для конкретных операторов). Переадресация на ТШС реализуется путем настройки телефонных аппаратов, VoIP АТС или личный кабинет абонента оператора. Конечный пользователь имеет возможность самостоятельно формировать черные/белые списки, настройки переадресации, используя стандартные механизмы своего устройства и оператора.
ТШС принимает переадресованные вызовы и перенаправляет их на подсистему искусственного интеллекта (ПИИ), расположенную на серверном оборудовании.
ПИИ представляет собой — комбинацию модуля распознавания, модуля, синтеза речи и модуля диалогового менеджера.
ПИИ в режиме реального времени распознает речь звонящего при помощи модуля распознавания речи, и используя технологии синтеза речи (или проигрывания файлов) поддерживает диалог при помощи диалогового менеджера.
Модуль распознавания речи, посредством мощностей серверного оборудования, позволяет распознать речь на основании методов скрытых Марковских моделей, включает в себя декодер речи, акустические модели и гибридные языковые модели, использующие правила русского языка.
Модуль диалогового менеджера, посредством мощностей серверного оборудования, при диалоге со звонящим имитирует поведение человека и обеспечивают естественный способ получения информации, что позволяет вовлечь человека в телефонный разговор с целью получения у него информации о том, кто он и зачем совершает вызов пользователю системы. Диалоговый менеджер включает в себя NLU - обработка естественного языка и NLG - генератор ответов человеку в зависимости от контекста и полученной информации.
Модуль диалогового менеджера обучен на больших данных телефонных разговоров реальных людей с односложными диалогами и по сценариям аналогичным работе секретаря, собранными из микро-блогов. Эмпирическим путем установлено, что ПИИ способен генерировать правильные грамматические и уместные в данном контексте ответы на 95% поданных на вход текстов. На начальном этапе формализуется создание ответа, как процесс расшифровки, на основе скрытого представления входного текста, пока кодирование и декодирование реализуется с помощью рекуррентных нейросетей (Recurrent neural network; RNN).
Исходя из контекста звонка, ПИИ либо прекращает диалог, направляет запись и расшифровку звонка в сервис мгновенных сообщений, которым пользуется конечный пользователь сервиса (Telegram, Whatsapp, Viber и т.п.) (см. фиг. 1, ветка Б), либо перенаправляет вызов на конечного пользователя (см. фиг. 1, ветка А).
Источник информации, подробно раскрывающий используемые в настоящем решении алгоритмы, структуру и процесс обучения подсистемы искусственного интеллекта: «End-to-end LSTM-based dialog control optimized with supervised and reinforcement learning», Jason D. Williams and Geoffrey Zweig, 03.06.2016, https://arxiv.org/pdf/1606.01269.pdf.
Таким образом, при реализации настоящего технического решения реализуется сервис предпросмотра звонка (автоматическое определение контекста) без привязки к конкретному оператору, дополнительному оборудованию и специализированному ПО, тем самым повышая качество детектирования и классификации входящих вызовов и осуществляя увеличение производительности используемых вычислительных систем при решении поставленной задачи.
На Фиг. 1 далее будет представлена общая схема способа обработки входящих вызовов.
Осуществляемый звонящим звонок направляется на телефон клиента системы, который переадресует звонок на телефонный шлюз сервиса (используя стандартный механизм переадресации ОКС7). Телефонный шлюз сервиса принимает переадресованный вызов, получает номер звонящего и вызываемого абонента из сигнализации вызова, начинает запись и отправляет копию RTP потока в ПИИ. ПИИ на сервере производит распознавание RTP потока, и на основе данных, полученных от модуля распознавания речи и модуля диалогового менеджера, выдает результат в виде ответного RTP потока в сторону телефонного шлюза сервиса (и далее в сторону звонящего). По окончанию звонка, запись отправляется в подсистему расшифровки (которая не ограничена сверху во времени анализа RTP потока и выдает более качественную расшифровку, нежели ПИИ, работающая в реальном времени и с ограничением 2 секунды на распознавание фразы и 60 секунд на диалог). На конечном этапе осуществляется расшифровка разговора и отправка записи разговора клиенту сервиса в его сервис мгновенных сообщений (Telegram, Whatsapp, Viber и т.д.).
На Фиг. 2 далее будет представлена общая схема вычислительного устройства (200), обеспечивающего обработку данных, необходимую для реализации заявленного решения.
В общем случае устройство (200) содержит такие компоненты, как: один или более процессоров (201), по меньшей мере одну память (202), средство хранения данных (203), интерфейсы ввода/вывода (204), средство В/В (205), средства сетевого взаимодействия (206).
Процессор (201) устройства выполняет основные вычислительные операции, необходимые для функционирования устройства (200) или функциональности одного или более его компонентов. Процессор (201) исполняет необходимые машиночитаемые команды, содержащиеся в оперативной памяти (202).
Память (202), как правило, выполнена в виде ОЗУ и содержит необходимую программную логику, обеспечивающую требуемый функционал.
Средство хранения данных (203) может выполняться в виде HDD, SSD дисков, рейд массива, сетевого хранилища, флэш-памяти, оптических накопителей информации (CD, DVD, MD, Blue-Ray дисков) и т.п. Средство (203) позволяет выполнять долгосрочное хранение различного вида информации, например, вышеупомянутых файлов с наборами данных пользователей, базы данных, содержащих записи измеренных для каждого пользователя временных интервалов, идентификаторов пользователей и т.п.
Интерфейсы (204) представляют собой стандартные средства для подключения и работы с серверной частью, например, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire и т.п.
Выбор интерфейсов (204) зависит от конкретного исполнения устройства (200), которое может представлять собой персональный компьютер, мейнфрейм, серверный кластер, тонкий клиент, смартфон, ноутбук и т.п.
В качестве средств В/В данных (205) в любом воплощении системы, реализующей описываемый способ, должна использоваться клавиатура. Аппаратное исполнение клавиатуры может быть любым известным: это может быть, как встроенная клавиатура, используемая на ноутбуке или нетбуке, так и обособленное устройство, подключенное к настольному компьютеру, серверу или иному компьютерному устройству. Подключение при этом может быть, как проводным, при котором соединительный кабель клавиатуры подключен к порту PS/2 или USB, расположенному на системном блоке настольного компьютера, так и беспроводным, при котором клавиатура осуществляет обмен данными по каналу беспроводной связи, например, радиоканалу, с базовой станцией, которая, в свою очередь, непосредственно подключена к системному блоку, например, к одному из USB-портов. Помимо клавиатуры, в составе средств В/В данных также может использоваться: джойстик, дисплей (сенсорный дисплей), проектор, тачпад, манипулятор мышь, трекбол, световое перо, динамики, микрофон и т.п.
Средства сетевого взаимодействия (206) выбираются из устройства, обеспечивающий сетевой прием и передачу данных, например, Ethernet карту, WLAN/Wi-Fi модуль, Bluetooth модуль, BLE модуль, NFC модуль, IrDa, RFID модуль, GSM модем и т.п. С помощью средств (205) обеспечивается организация обмена данными по проводному или беспроводному каналу передачи данных, например, WAN, PAN, ЛВС (LAN), Интранет, Интернет, WLAN, WMAN или GSM.
Компоненты устройства (200) сопряжены посредством общей шины передачи данных (210).
В настоящих материалах заявки было представлено предпочтительное раскрытие осуществление заявленного технического решения, которое не должно использоваться как ограничивающее иные, частные воплощения его реализации, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники.
Claims (13)
1. Способ обработки входящих вызовов, включающий следующие действия:
получение входящего вызова на устройство пользователя,
выполнение заранее заданного сценария на устройстве пользователя, результатом которого является осуществление переадресации входящего вызова на заранее выбранное устройство обработки входящих вызовов при помощи средств переадресации входящих вызовов, причем на устройстве обработки входящих вызовов осуществляют, в течение заранее заданного промежутка времени, обработку входящего вызова при помощи средств распознавания голосовых данных и синтеза речевых данных с использованием предварительно обученной подсистемы искусственного интеллекта, представляющей из себя комбинацию модуля распознавания, модуля синтеза речи и модуля диалогового менеджера и выполненной с возможностью распознавания входящего аудиопотока и генерации речевых ответов в соответствии с контекстом распознанного содержимого входящего аудиопотока,
при этом в процессе обработки подсистема искусственного интеллекта либо завершает разговор, либо переадресовывает входящий вызов на устройство пользователя,
при этом весь процесс обработки входящего вызова сохраняют в формате аудиофайла, после обработки входящего вызова осуществляют расшифровку полученного аудиофайла и создают на ее основе текстовое сообщение, которое совместно с полученным аудиофайлом пересылают на устройство пользователя,
причем подсистема искусственного интеллекта, работающая в реальном времени, имеет ограничение 2 с на распознавание фразы и 60 с на весь диалог.
2. Способ по п. 1, характеризующийся тем, что устройство пользователя является мобильным телефоном либо комбинацией стационарного телефона, с которого осуществляется переадресация, и мобильного телефона или стационарного персонального компьютера, на котором осуществляется просмотр результата через мессенджер.
3. Способ по п. 1, характеризующийся тем, что входящий вызов является аудиовызовом.
4. Способ по п. 1, характеризующийся тем, что переадресацию входящего вызова осуществляют, используя настройки телефонного аппаратов, VoIP АТС или личный кабинет абонента оператора связи.
5. Способ по п. 1, характеризующийся тем, что текстовое сообщение и аудиофайл пересылают на устройство пользователя при помощи установленных на нем мессенджеров.
6. Способ по п. 1, характеризующийся тем, что сценарий, выполняемый на устройстве пользователя, включает в себя сброс входящего вызова в случае неответа, по расписанию, ручном сбросе или попадании в черный список.
7. Способ по п. 1, характеризующийся тем, что сценарий, выполняемый на устройстве пользователя, может включать в себя сброс входящего вызова, осуществляемый с помощью антиспам приложения.
8. Способ по п. 1, характеризующийся тем, что устройство обработки входящих вызовов определяет входящий и промежуточный телефонный номер, то есть с которого осуществляется входящий вызов и с которого осуществляется переадресация.
Publications (1)
Publication Number | Publication Date |
---|---|
RU2783966C1 true RU2783966C1 (ru) | 2022-11-22 |
Family
ID=
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080247529A1 (en) * | 2007-04-03 | 2008-10-09 | Microsoft Corporation | Incoming Call Classification And Disposition |
US20130016819A1 (en) * | 2011-07-13 | 2013-01-17 | Rajesh Cheethirala | Method and structure for controlling incoming communication notification |
US20160261742A1 (en) * | 2013-08-21 | 2016-09-08 | David William Offen | Systems and methods for managing incoming calls |
US20180018969A1 (en) * | 2016-07-15 | 2018-01-18 | Circle River, Inc. | Call Forwarding to Unavailable Party Based on Artificial Intelligence |
US20190066660A1 (en) * | 2017-08-28 | 2019-02-28 | Semantic Machines, Inc. | Robust expandable dialogue system |
RU2710851C2 (ru) * | 2019-05-17 | 2020-01-14 | Общество с ограниченной ответственностью "КВАНТУМ А РУС" | Способ уведомления о входящем вызове и устройство для его осуществления |
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080247529A1 (en) * | 2007-04-03 | 2008-10-09 | Microsoft Corporation | Incoming Call Classification And Disposition |
US20130016819A1 (en) * | 2011-07-13 | 2013-01-17 | Rajesh Cheethirala | Method and structure for controlling incoming communication notification |
US20160261742A1 (en) * | 2013-08-21 | 2016-09-08 | David William Offen | Systems and methods for managing incoming calls |
US20180018969A1 (en) * | 2016-07-15 | 2018-01-18 | Circle River, Inc. | Call Forwarding to Unavailable Party Based on Artificial Intelligence |
US20190066660A1 (en) * | 2017-08-28 | 2019-02-28 | Semantic Machines, Inc. | Robust expandable dialogue system |
RU2710851C2 (ru) * | 2019-05-17 | 2020-01-14 | Общество с ограниченной ответственностью "КВАНТУМ А РУС" | Способ уведомления о входящем вызове и устройство для его осуществления |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10276153B2 (en) | Online chat communication analysis via mono-recording system and methods | |
US11301628B2 (en) | Systems, methods, and apparatus for linguistic analysis and disabling of storage | |
US10057419B2 (en) | Intelligent call screening | |
US10194029B2 (en) | System and methods for analyzing online forum language | |
US8457964B2 (en) | Detecting and communicating biometrics of recorded voice during transcription process | |
WO2021051506A1 (zh) | 语音交互方法、装置、计算机设备及存储介质 | |
US9837079B2 (en) | Methods and apparatus for identifying fraudulent callers | |
US10242669B1 (en) | Enhanced transcription of audio data with punctuation markings based on silence durations | |
US9936068B2 (en) | Computer-based streaming voice data contact information extraction | |
CN109873907A (zh) | 呼叫处理方法、装置、计算机设备及存储介质 | |
US11843719B1 (en) | Analysis of customer interaction metrics from digital voice data in a data-communication server system | |
US20210110813A1 (en) | Z-vectors: speaker embeddings from raw audio using sincnet, extended cnn architecture and in-network augmentation techniques | |
US9444939B2 (en) | Treatment processing of a plurality of streaming voice signals for determination of a responsive action thereto | |
CN111128241A (zh) | 语音通话的智能质检方法及系统 | |
US20240040038A1 (en) | Detecting scam callers using conversational agent and machine learning systems and methods | |
EP2124425B1 (en) | System for handling a plurality of streaming voice signals for determination of responsive action thereto | |
JP7304627B2 (ja) | 留守番電話判定装置、方法及びプログラム | |
RU2783966C1 (ru) | Способ обработки входящих звонков | |
US11606461B2 (en) | Method for training a spoofing detection model using biometric clustering | |
US8751222B2 (en) | Recognition processing of a plurality of streaming voice signals for determination of a responsive action thereto | |
US11558506B1 (en) | Analysis and matching of voice signals | |
KR20230156599A (ko) | 컨택센터에서 통화 내용을 녹취하고 관리하는 시스템 | |
WO2024165844A1 (en) | Methods and apparatus for classifying a telecommunication call |