RU2766273C1 - Система и способ определения нежелательного звонка - Google Patents

Система и способ определения нежелательного звонка Download PDF

Info

Publication number
RU2766273C1
RU2766273C1 RU2020131448A RU2020131448A RU2766273C1 RU 2766273 C1 RU2766273 C1 RU 2766273C1 RU 2020131448 A RU2020131448 A RU 2020131448A RU 2020131448 A RU2020131448 A RU 2020131448A RU 2766273 C1 RU2766273 C1 RU 2766273C1
Authority
RU
Russia
Prior art keywords
call
record
unwanted
terminal device
media data
Prior art date
Application number
RU2020131448A
Other languages
English (en)
Inventor
Дмитрий Владимирович Швецов
Даниил Александрович Язовский
Виталий Сергеевич Воробьев
Original Assignee
Акционерное общество "Лаборатория Касперского"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Акционерное общество "Лаборатория Касперского" filed Critical Акционерное общество "Лаборатория Касперского"
Priority to RU2020131448A priority Critical patent/RU2766273C1/ru
Priority to US17/335,123 priority patent/US11388286B2/en
Priority to CN202111008341.XA priority patent/CN114257687A/zh
Priority to EP21196753.4A priority patent/EP3975517B1/en
Application granted granted Critical
Publication of RU2766273C1 publication Critical patent/RU2766273C1/ru
Priority to US17/834,132 priority patent/US11616879B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/436Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/436Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
    • H04M3/4365Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it based on information specified by the calling party, e.g. priority or subject
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2218Call detail recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/5307Centralised arrangements for recording incoming messages, i.e. mailbox systems for recording messages comprising any combination of audio and non-audio components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/41Electronic components, circuits, software, systems or apparatus used in telephone systems using speaker recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/6027Fraud preventions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/6045Identity confirmation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42221Conversation recording systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении информационной безопасности путем досрочного завершения нежелательного звонка. Система определения нежелательного звонка содержит: средство управления звонком, предназначенное для перехвата вызова от терминального устройства вызывающей стороны на терминальное устройство вызываемой стороны и досрочного завершения вызова путем прекращения передачи медиаданных в рамках установленного вызовом соединения; средство формирования записи, предназначенное для формирования записи медиаданных, передаваемых в рамках установленного вызовом соединения во время звонка; средство классификации, предназначенное для преобразования сформированной записи медиаданных в набор признаков и определения звонка как нежелательного на основании сформированного набора признаков с использованием заранее обученной модели классификации звонков. 2 н. и 10 з.п. ф-лы, 5 ил.

Description

Область техники
Изобретение относится к области обеспечения информационной безопасности.
Уровень техники
В настоящий момент практически любой обладатель универсального мобильного устройства (например, мобильного телефона, смартфона, планшета и т.д.) сталкивается с нежелательными звонками, SMS–сообщениями, электронными письмами из банков, медицинских центров, страховых фирм, салонов красоты и других компаний, использующих в своей работе телемаркетинг. Большинство из этих компаний неявно прописывают распространение рекламы через коммуникационные сети в договоре и тем самым обходят правовые нормы.
Компании, предоставляющие услуги телемаркетинга, активно используют интеллектуальных ботов, которые имитируют в процессе общения людей. Роботы определяют уровень раздражительности и зачастую специально выстраивают разговор так, чтобы маскировать искусственное происхождение беседы. Также коммуникационные сети нередко используют мошенники для получения конфиденциальной информации пользователя (например, данных о кредитных картах, номерах социального страхования и т.д.).
Для борьбы с описанными злоупотреблениями в коммуникационных сетях используют мобильные приложения, определяющие номера (например, TrueCaller). В большинстве случаев входящие вызовы проверяют по базе данных спам–номеров, которая постоянно обновляется на основании обратной связи от пользователей, и, если номер спамера или мошенника находится в этой базе, пользователя информируют о том, что вызывающая сторона была замечена в назойливом общении.
Ситуация усугубляется тем, что в настоящее время довольно просто сделать телефонный звонок анонимным или замаскировать телефонный номер при помощи технологии подмены номеров. Мошенники все чаще, используя данную технологию, звонят клиентам банков с номеров кредитных организаций и запрашивают необходимую для снятия средств информацию.
В патентной публикации US20050221840A1 описана технология присваивания репутации телефонному номеру, ассоциированному с неклассифицированной вызываемой стороной. На основании анализа определенных атрибутов входящего вызова (например, продолжительности звонка) неклассифицированной вызывающей стороне присваивают репутацию. Если вызывающую сторону определяют как нежелательную заранее установленное количество раз, ее помещают в черный список.
Хотя описанный выше способ работы хорошо справляется с задачей распознавания роботизированных звонков, он не позволяет классифицировать звонок от мошенников. К тому же в новых схемах мошенничества подмена номера дискредитирует легального абонента вместо злоумышленника. Блокировка таких номеров, к примеру, может привести к тому, что банки утратят возможность дозвониться своим клиентам.
Настоящее изобретение позволяет решать задачу обеспечения информационной безопасности путем досрочного завершения нежелательного звонка, в том числе мошеннического с подменными номерами.
Раскрытие изобретения
Изобретение предназначено для обеспечения информационной безопасности.
Технический результат настоящего изобретения заключается в обеспечении информационной безопасности путем досрочного завершения нежелательного звонка.
Данный результат достигается с помощью использования системы управления нежелательным звонком, которая содержит: средство управления звонком, предназначенное для перехвата вызова от терминального устройства вызывающей стороны на терминальное устройство вызываемой стороны, управления нежелательным звонком; средство формирования записи, предназначенное для формирования записи, содержащей медиа-данные, передаваемые в рамках установленного перехваченным вызовом соединения; средство классификации, предназначенное для определения атрибутов сформированной записи, классификации звонка на основании определенных атрибутов.
В другом частном случае реализации системы запись формируют в течение заданного промежутка времени, где промежуток времени задают по меньшей мере одним из способов: кратным заранее заданному значению; равным значению, при котором размер содержащихся медиа-данных кратен заранее заданному размеру.
Еще в одном частном случае реализации системы в качестве атрибута записи выступает по меньшей мере: множество слов; векторное представление слов; мультимножество слов, не учитывающих грамматику и порядок.
В другом частном случае реализации система дополнительно содержит средство автоматического распознавания речи, предназначенное для определения атрибутов записи.
Еще в одном частном случае реализации системы в качестве класса звонка выступает по меньшей мере: нежелательный; регулярный.
Еще в одном частном случае реализации системы к нежелательному классу относят звонки, инициированные вызывающей стороной для осуществления по меньшей мере: мошенничества; получения конфиденциальной информации; предложения товаров, причиняющих вред здоровью и развитию вызываемой стороны.
В другом частном случае реализации системы классификацию звонка осуществляют с использованием заранее обученной модели классификации звонков.
Еще в одном частном случае реализации системы в качестве алгоритма классификации выступает по меньшей мере: байесовские классификаторы; логистическая регрессия; MRF-классификатор; метод опорных векторов; методы ближайших соседей; дерево принятия решений.
В другом частном случае реализации система дополнительно содержит средство обучения, предназначенное обучения модели классификации звонков на атрибутах классифицированного ранее звонка, чей класс был подтвержден, таким образом, чтобы при следующей классификации звонка вероятность неверной классификации была меньше, чем при текущей.
Еще в одном частном случае реализации системы звонком управляют по меньшей мере: досрочно завершая звонок; информируя вызываемую сторону о нежелательном классе звонка.
Данные результаты достигаются с помощью использования способа управления нежелательным звонком, при этом способ содержит этапы, которые реализуются с помощью средств из системы управления нежелательным звонком, и на которых: перехватывают вызов от терминального устройства вызывающей стороны на терминальное устройство вызываемой стороны; формируют запись, содержащую медиа-данные, передаваемые в рамках установленного перехваченным вызовом соединения; определяют атрибуты сформированной записи; классифицируют звонок как нежелательный на основании определенных атрибутов; управляют звонком.
В другом частном случае реализации способа запись формируют в течение заданного промежутка времени, где промежуток времени задают по меньшей мере одним из способов: кратным заранее заданному значению; равным значению, при котором размер содержащихся медиа-данных кратен заранее заданному размеру.
Еще в одном частном случае реализации способа в качестве атрибута записи выступает по меньшей мере: множество слов; векторное представление слов; мультимножество слов, не учитывающих грамматику и порядок.
В другом частном случае реализации способа атрибуты записи дополнительно определяют с помощью средства автоматического распознавания речи.
В другом частном случае реализации способа в качестве класса звонка выступает по меньшей мере: нежелательный; регулярный.
Еще в одном частном случае реализации способа к нежелательному классу относят звонки, инициированные вызывающей стороной для осуществления по меньшей мере: мошенничества; получения конфиденциальной информации; предложения товаров, причиняющих вред здоровью и развитию вызываемой стороны.
В другом частном случае реализации способа классификацию звонка осуществляют с использованием заранее обученной модели классификации звонков.
Еще в одном частном случае реализации способа в качестве алгоритма классификации выступает по меньшей мере: байесовские классификаторы; логистическая регрессия; MRF-классификатор; метод опорных векторов; методы ближайших соседей; дерево принятия решений.
В другом частном случае реализации способа модель классификации звонков обучают на атрибутах классифицированного ранее звонка, чей класс был подтвержден, таким образом, чтобы при следующей классификации звонка вероятность неверной классификации была меньше, чем при текущей.
Еще в одном частном случае реализации способа звонком управляют по меньшей мере: досрочно завершая звонок; информируя вызываемую сторону о нежелательном классе звонка.
Краткое описание чертежей
Фиг. 1 иллюстрирует общее устройство коммуникационной сети.
Фиг. 2 иллюстрирует пример устройства интеллектуальной сети, построенной на базе коммуникационной сети.
Фиг. 3 иллюстрирует систему управления нежелательным звонком.
Фиг. 4 иллюстрирует способ управления нежелательным звонком.
Фиг. 5 представляет пример компьютерной системы общего назначения, персональный компьютер или сервер.
Хотя изобретение может иметь различные модификации и альтернативные формы, характерные признаки, показанные в качестве примера на чертежах, будут описаны подробно. Следует понимать, однако, что цель описания заключается не в ограничении изобретения конкретным его воплощением. Наоборот, целью описания является охват всех изменений, модификаций, входящих в рамки данного изобретения, как это определено приложенной формуле.
Описание вариантов осуществления изобретения
Объекты и признаки настоящего изобретения, способы для достижения этих объектов и признаков станут очевидными посредством отсылки к примерным вариантам осуществления. Однако настоящее изобретение не ограничивается примерными вариантами осуществления, раскрытыми ниже, оно может воплощаться в различных видах. Сущность, приведенная в описании, является ничем иным, как конкретными деталями, необходимыми для помощи специалисту в области техники в исчерпывающем понимании изобретения, и настоящее изобретение определяется в объеме приложенной формулы.
Фиг. 1 иллюстрирует общее устройство коммуникационной сети.
Структурная схема общего устройства коммуникационной сети содержит коммуникационную сеть 100, терминальное устройство вызывающей стороны 101, терминальное устройство вызываемой стороны 102, коммутационный узел 110, медиа-данные 111.
Коммуникационная сеть 100 представляет собой систему физических каналов связи и по меньшей мере одного коммутационного узла 110, реализующую протокол передачи медиа-данных 111 между терминальным устройством вызывающей стороны 101 и терминальным устройством вызываемой стороны 102.
Примерами коммуникационных сетей являются по меньшей мере:
• компьютерная сеть;
• телефонная сеть;
• сеть сотовой связи.
Терминальное устройство - это оборудование, преобразующее пользовательскую информацию в медиа-данные 111 для передачи по каналам связи и осуществляющее обратное преобразование.
Вызов - это попытка установления соединения с терминальным устройством вызываемой стороны 102, инициированная терминальным устройством вызывающей стороны 101.
Звонок - это процесс передачи медиа-данных 111 между терминальным устройством вызывающей стороны 101 и терминальным устройством вызываемой стороны 102 в рамках установленного соединения.
В качестве медиа-данных 111 выступают по меньшей мере:
• медиафайл;
• потоковые данные (медиа-данные, передаваемые в потоковом режиме).
К примеру, в качестве терминального устройства вызывающей стороны 101 и терминального устройства вызываемой стороны 102 могут выступать мобильные телефоны абонентов сети сотовой связи, где под звонком понимают обычный голосовой звонок.
Фиг. 2 иллюстрирует пример устройства интеллектуальной сети, построенной на базе коммуникационной сети.
Структурная схема примера устройства интеллектуальной сети содержит коммуникационную сеть 100, коммутационный узел 110, модуль коммутации услуг 220, узел управления услугами 230, узел разветвления 240.
Интеллектуальная сеть позволяет, модернизируя по меньшей мере один коммутационный узел 110 коммутационной сети 100, предоставлять дополнительные услуги связи. При этом не имеет значения, что используется разное оборудование коммутации, так как архитектура интеллектуальной сети независима от типа коммутационной сети 100.
Коммутационный узел 110 сохраняет функции по управлению процессом предоставления основных услуг, но также оснащается модулем коммутации услуг 220, который обеспечивает инициализацию различных алгоритмов обслуживания вызовов, выполняет директивы, поступающие от узла управления услугами 230, отслеживает процесс обслуживания вызовов интеллектуальной сети.
Узел управления услугами 230 реализует возможность предоставления услуг во всей интеллектуальной сети, обеспечивая протоколы взаимодействия с другими ее элементами.
В одном из вариантов реализации интеллектуальная сеть содержит узел разветвления 240, осуществляющий передачу копии медиа-данных 111 другим вспомогательным элементам интеллектуальной сети, делающим услуги интеллектуальной сети более удобными для пользователя (например, устройству распознавания речи).
К услугам, предоставляемым интеллектуальными сетями, относятся по меньшей мере:
• услуга бесплатного вызова, позволяющая бесплатно получать справочную информацию;
• телеголосование, позволяющее обеспечить голосование вызовом определенного номера;
• предоставление связи по предоплаченным картам.
Фиг. 3 иллюстрирует систему управления звонком.
Структурная схема системы управления звонком содержит коммуникационную сеть 100, терминальное устройство вызывающей стороны 101, терминальное устройство вызываемой стороны 102, средство управления звонком 310, медиа-данные 111, средство записи 320, запись звонка 321, средство автоматического распознавания речи 330, средство классификации 340, атрибуты записи 341, средство обучения 350, модель классификации 360.
Средство управления звонком 310 предназначено для перехвата вызова от терминального устройства вызывающей стороны 101 на терминальное устройство вызываемой стороны 102 в коммуникационной сети 100, передачи медиа-данных 111 средству записи 320, а также управления звонком на основании определенного класса звонка.
В одном из вариантов реализации системы в качестве коммуникационной сети 100 выступает интеллектуальная сеть, базирующаяся на ресурсах телефонных сетей общего пользования.
К примеру, терминальное устройство вызывающей стороны 101 инициирует звонок. После приема вызова модуль коммутации услуг 220 (см. Фиг. 2) коммутационного узла 110 (см. Фиг. 2) определяет, что соединение требует коммутации с узлом управления услугами 230 (см. Фиг. 2). Коммутационный узел 110 устанавливает соответствующее соединение.
Средство управления звонком 310 перехватывает вызов и уведомляет коммутационный узел 110 о необходимости маршрутизации перехваченного вызова через узел разветвления 240 (см. Фиг. 2), который устанавливает соединение по двум различным каналам: одно - с терминальным устройством вызываемой стороны 102, второе - со средством записи 320.
После того, как соединение установлено, медиа-данные 111 от каждого из терминальных устройств передаются через узел разветвления 240, где они дублируются. Один поток данных направляют принимающей стороне, другой - средству записи 320. Так продолжается до тех пор, пока звонок не будет завершен.
В одном из вариантов реализации системы коммутационный узел 110 не может установить соединение с терминальным устройством вызываемой стороны 102, по меньшей мере потому что:
• терминальное устройство вызываемой стороны 102 отвечает сигналом «занято»;
• терминальное устройство вызываемой стороны 102 недоступно;
• произошла ошибка установления соединения;
• терминальное устройство вызываемой стороны 102 отвечает отказом принять соединение.
В этом случае средство управления звонком 310 передает сигнал коммутационному узлу 110 о необходимости маршрутизации перехваченного вызова на средство записи 320.
Средство записи 320 предназначено для записи медиа-данных 111, передаваемых в течение установленного соединения, и направления по меньшей мере одной сформированной записи звонка 321 средству автоматического распознавания речи 330, где в качестве записи звонка 321 выступает медиафайл.
В одном из вариантов реализации системы средство записи 320 формирует запись звонка 321 в течение заданного промежутка времени, где промежуток времени задают по меньшей мере одним из способов:
• кратным заранее заданному значению;
• равным значению, при котором размер содержащихся медиа-данных кратен заранее заданному размеру.
Средство автоматического распознавания речи 330 предназначено для преобразования записи звонка 321, полученной от средства записи 320, в пригодную для анализа цифровую информацию (например, форматированный текст).
В одном из вариантов реализации системы средство автоматического распознавания речи 330 разделяет медиафайл на фрагменты. Каждый фрагмент подвергается ряду преобразований, в результате которых получаются коэффициенты, описывающие его частотные характеристики. На основании этих данных средство автоматического распознавания речи 330 может предположить с некоторой вероятностью, частью какой фонемы является фрагмент.
Средство автоматического распознавания речи 330 также дополнительно обучено на совокупности заранее отобранных текстов распознавать цепочки вероятных фонем. При необходимости средство автоматического распознавания речи 330 восстанавливает нераспознанные слова по смыслу, исходя из контекста и имеющейся статистики. Данные, полученные в ходе распознавания фонем и распознавания цепочек фонем, совмещаются, и средство автоматического распознавания речи 330 определяет наиболее вероятную последовательность слов.
К примеру, для двух равновероятных фонем «е» и «о» в слове «продать» средство автоматического распознавания речи 330 сделает вывод, что в слове, вероятнее всего, используется фонема «о», поскольку во время обучения ему часто встречалась последовательность «продать подписку» и реже - «предать подписку».
В одном из вариантов реализации системы на заключительном этапе числительные преобразуются в цифры, расставляются некоторые знаки препинания (например, дефисы). Этот преобразованный текст и является финальным результатом распознавания, который передается средству классификации 340.
Средство классификации 340 предназначено для вынесения решения о принадлежности записи звонка 321 к нежелательному классу на основании анализа содержания обработанной средством автоматического распознавания речи 330 записи звонка 321 с использованием обученной модели классификации 360.
В качестве класса звонка выступает по меньшей мере:
• нежелательный;
• регулярный.
В одном из вариантов реализации системы к нежелательному классу относят звонки, инициированные вызывающей стороной для осуществления по меньшей мере:
• мошенничества;
• получения конфиденциальной информации;
• спама.
Средство классификации 340 преобразует обработанную средством автоматического распознавания речи 330 запись звонка 321 в набор пригодных для классификации атрибутов 341. В качестве атрибутов 341 выступают по меньшей мере:
• множество слов (англ. n-grams);
• векторное представление слов (англ. word-embedding);
• мультимножество слов, не учитывающих грамматику и порядок (англ. bag-of-words).
В одном из вариантов реализации системы предварительно собирают атрибуты звонков, относящихся к заранее известному классу звонков (к примеру, нежелательный, неизвестный). На основании собранных данных обучают модель классификации 360 таким образом, чтобы схожие по своим атрибутам звонки могли быть классифицированы упомянутой моделью классификации 360 с точностью выше заданной.
С помощью модели классификации 360 средство классификации 340 классифицирует обработанную средством автоматического распознавания речи 330 запись звонка 321. В качестве алгоритма классификации выступает по крайней мере:
• байесовские классификаторы (англ. naive bayesian classifier);
• логистическая регрессия (англ. logistic regression);
• MRP-классификатор (англ. MRF classifier);
• метод опорных векторов (англ. SVM, support vector machine);
• методы ближайших соседей (англ. k-nearest neighbor);
• дерево принятия решений (англ. decision tree).
К примеру, модель классификации 360 средства классификации 340 обучают на большом количестве записей мошеннических звонков, где под разными предлогами (проверка данных, финансовые операции) злоумышленники просят указать некоторые персональные данные, например, номера банковских счетов или пароли. При этом каждая запись мошеннических звонков представлена в виде набора атрибутов. Тогда фраза «сообщите пароль из SMS», присутствующая в обработанной средством автоматического распознавания речи 330 записи звонка 321 в виде набора атрибутов, позволит средству классификации 340 отнести обработанную средством автоматического распознавания речи 330 запись звонка 321 к нежелательному классу с некоторой вероятностью.
Средство классификации 340 классифицирует звонок как нежелательный и уведомляет средство управления звонком 310. Средство управления звонком 310 по меньшей мере:
• досрочно завершает звонок;
• информирует вызываемую сторону о нежелательном классе звонка;
В одном из вариантов реализации системы используют приложение Kaspersky Who Calls, которое уведомляет пользователя о перехваченном вызове и определенном классе звонка после его завершения.
Средство обучения 350 предназначено для обучения модели классификации 360 на основании новых данных.
К примеру, если решение модели классификации 360 оказалось ложным, пользователь терминального устройства может переопределить класс звонка.
Средство обучения 350 на основании обратной связи от пользователя обучит модель классификации 360 так, что вероятность верного определения класса звонка повысится при последующем использовании модели.
Фиг. 4 иллюстрирует способ управления звонком.
Структурная схема способа управления звонком содержит этап 410, на котором перехватывают вызов от терминального устройства вызывающей стороны на терминальное устройство вызываемой стороны, этап 420, на котором формирую запись звонка, этап 430, на котором определяют атрибуты сформированной на этапе 420 записи звонка, этап 440, на котором классифицируют звонок как нежелательный на основании определенных на этапе 430 атрибутов, этап 450, на котором управляют звонком, этап 460, на котором обучают модель классификации 360.
На этапе 410 с помощью средства управления звонком 310 перехватывают вызов от терминального устройства вызывающей стороны 101 на терминальное устройство вызываемой стороны 102.
На этапе 420 с помощью средства записи 320 формируют запись звонка 321.
На этапе 430 с помощью средства автоматического распознавания речи 330, а также средства классификации 340 определяют атрибуты сформированной на этапе 420 записи звонка 321.
На этапе 440 с помощью средства классификации 340, а также модели классификации 360 классифицируют звонок как нежелательный.
На этапе 450 с помощью средства управления звонком 310 обеспечивают информационную безопасность звонка.
Дополнительно в одном из вариантов реализации системы на этапе 460 с помощью средства обучения 350 обучают модель классификации 360 таким образом, чтобы точность классификации повысилась в следующей итерации.
Фиг. 5 представляет пример компьютерной системы общего назначения, персональный компьютер или сервер 20, содержащий центральный процессор 21, системную память 22 и системную шину 23, которая содержит разные системные компоненты, в том числе память, связанную с центральным процессором 21. Системная шина 23 реализована, как любая известная из уровня техники шинная структура, содержащая в свою очередь память шины или контроллер памяти шины, периферийную шину и локальную шину, которая способна взаимодействовать с любой другой шинной архитектурой. Системная память содержит постоянное запоминающее устройство (ПЗУ) 24, память с произвольным доступом (ОЗУ) 25. Основная система ввода/вывода (BIOS) 26, содержит основные процедуры, которые обеспечивают передачу информации между элементами персонального компьютера 20, например, в момент загрузки операционной системы с использованием ПЗУ 24.
Персональный компьютер 20 в свою очередь содержит жесткий диск 27 для чтения и записи данных, привод магнитных дисков 28 для чтения и записи на сменные магнитные диски 29 и оптический привод 30 для чтения и записи на сменные оптические диски 31, такие как CD-ROM, DVD-ROM и иные оптические носители информации. Жесткий диск 27, привод магнитных дисков 28, оптический привод 30 соединены с системной шиной 23 через интерфейс жесткого диска 32, интерфейс магнитных дисков 33 и интерфейс оптического привода 34 соответственно. Приводы и соответствующие компьютерные носители информации представляют собой энергонезависимые средства хранения компьютерных инструкций, структур данных, программных модулей и прочих данных персонального компьютера 20.
Настоящее описание раскрывает реализацию системы, которая использует жесткий диск 27, сменный магнитный диск 29 и сменный оптический диск 31, но следует понимать, что возможно применение иных типов компьютерных носителей информации 56, которые способны хранить данные в доступной для чтения компьютером форме (твердотельные накопители, флеш карты памяти, цифровые диски, память с произвольным доступом (ОЗУ) и т.п.), которые подключены к системной шине 23 через контроллер 55.
Компьютер 20 имеет файловую систему 36, где хранится записанная операционная система 35, а также дополнительные программные приложения 37, другие программные модули 38 и данные программ 39. Пользователь имеет возможность вводить команды и информацию в персональный компьютер 20 посредством устройств ввода (клавиатуры 40, манипулятора «мышь» 42). Могут использоваться другие устройства ввода (не отображены): микрофон, джойстик, игровая консоль, сканер и т.п. Подобные устройства ввода по своему обычаю подключают к компьютерной системе 20 через последовательный порт 46, который в свою очередь подсоединен к системной шине, но могут быть подключены иным способом, например, при помощи параллельного порта, игрового порта или универсальной последовательной шины (USB). Монитор 47 или иной тип устройства отображения также подсоединен к системной шине 23 через интерфейс, такой как видеоадаптер 48. В дополнение к монитору 47, персональный компьютер может быть оснащен другими периферийными устройствами вывода (не отображены), например, колонками, принтером и т.п.
Персональный компьютер 20 способен работать в сетевом окружении, при этом используется сетевое соединение с другим или несколькими удаленными компьютерами 49. Удаленный компьютер (или компьютеры) 49 являются такими же персональными компьютерами или серверами, которые имеют большинство или все упомянутые элементы, отмеченные ранее при описании существа персонального компьютера 20, представленного на Фиг. 5. В вычислительной сети могут присутствовать также и другие устройства, например, маршрутизаторы, сетевые станции, пиринговые устройства или иные сетевые узлы.
Сетевые соединения могут образовывать локальную вычислительную сеть (LAN) 50 и глобальную вычислительную сеть (WAN). Такие сети применяются в корпоративных компьютерных сетях, внутренних сетях компаний и, как правило, имеют доступ к сети Интернет. В LAN- или WAN-сетях персональный компьютер 20 подключен к локальной сети 50 через сетевой адаптер или сетевой интерфейс 51. При использовании сетей персональный компьютер 20 может использовать модем 54 или иные средства обеспечения связи с глобальной вычислительной сетью, такой как Интернет. Модем 54, который является внутренним или внешним устройством, подключен к системной шине 23 посредством последовательного порта 46. Следует уточнить, что сетевые соединения являются лишь примерными и не обязаны отображать точную конфигурацию сети, т.е. в действительности существуют иные способы установления соединения техническими средствами связи одного компьютера с другим.
В заключение следует отметить, что приведенные в описании сведения являются примерами, которые не ограничивают объем настоящего изобретения, определенного формулой.

Claims (46)

1. Система определения нежелательного звонка, которая содержит:
а) средство управления звонком, предназначенное для:
• перехвата вызова от терминального устройства вызывающей стороны на терминальное устройство вызываемой стороны, при этом уведомляют коммутационный узел о маршрутизации перехваченного вызова через узел разветвления, который устанавливает соединение по двум различным каналам: одно – с терминальным устройством вызываемой стороны, второе – со средством записи для передачи медиаданных от каждого терминального устройства;
• досрочного завершения вызова путем прекращения передачи медиаданных в рамках установленного вызовом соединения;
б) средство формирования записи, предназначенное для формирования записи медиаданных, передаваемых в рамках установленного вызовом соединения во время звонка;
в) средство классификации, предназначенное для:
• преобразования сформированной записи медиаданных в набор признаков, где преобразование заключается в представлении записи в форматированный текст, при этом признаки включают:
- множество слов,
- векторное представление слов,
- мультимножество слов, не учитывающих грамматику и порядок;
• определения звонка как нежелательный на основании сформированного набора признаков с использованием заранее обученной модели классификации звонков, при этом к нежелательным относят звонки, инициированные вызывающей стороной для осуществления мошенничества, получения конфиденциальной информации, спама.
2. Система по п. 1, в которой запись формируют в течение заданного промежутка времени, где промежуток времени задают по меньшей мере одним из способов:
• кратным заранее заданному значению;
• равным значению, при котором размер содержащихся медиаданных кратен заранее заданному размеру.
3. Система по п. 1, в которой атрибуты записи определяют с помощью средства автоматического распознавания речи.
4. Система по п. 1, в которой в качестве алгоритма классификации выступает по меньшей мере:
• байесовские классификаторы;
• логистическая регрессия;
• MRF-классификатор;
• метод опорных векторов;
• методы ближайших соседей;
• дерево принятия решений.
5. Система по п. 1, в которой модель классификации звонков обучают на атрибутах классифицированного ранее звонка, чей класс был подтвержден, таким образом, чтобы при следующей классификации звонка вероятность неверной классификации была меньше, чем при текущей.
6. Система по п. 1, в которой после классификации пользователю терминального устройства вызываемой стороны предоставляют информацию о нежелательном классе звонка.
7. Способ определения нежелательного звонка, который содержит этапы, которые реализуются с помощью средств из системы по п. 1 и на которых:
а) перехватывают вызов от терминального устройства вызывающей стороны на терминальное устройство вызываемой стороны, при этом уведомляют коммутационный узел о маршрутизации перехваченного вызова через узел разветвления, который устанавливает соединение по двум различным каналам: одно – с терминальным устройством вызываемой стороны, второе – со средством записи для передачи медиаданных от каждого терминального устройства;
б) формируют запись медиаданных, передаваемых в рамках установленного вызовом соединения во время звонка;
в) преобразуют сформированную запись медиаданных в набор признаков, где преобразование включает представлении записи в виде форматированного текста, при этом признаки включают:
• множество слов,
• векторное представление слов,
• мультимножество слов, не учитывающих грамматику и порядок;
г) определяют звонок как нежелательный на основании сформированного набора признаков с использованием заранее обученной модели классификации звонков, при этом к нежелательным относят звонки, инициированные вызывающей стороной для осуществления мошенничества, получения конфиденциальной информации, предложения товаров, спама;
д) досрочно завершают вызов путем прекращения передачи медиаданных в рамках установленного вызовом соединения.
8. Способ по п. 7, по которому запись формируют в течение заданного промежутка времени, где промежуток времени задают по меньшей мере одним из способов:
• кратным заранее заданному значению;
• равным значению, при котором размер содержащихся медиаданных кратен заранее заданному размеру.
9. Способ по п. 7, по которому атрибуты записи определяют с помощью средства автоматического распознавания речи.
10. Способ по п. 7, по которому в качестве алгоритма классификации выступает по меньшей мере:
• байесовские классификаторы;
• логистическая регрессия;
• MRF-классификатор;
• метод опорных векторов;
• методы ближайших соседей;
• дерево принятия решений.
11. Способ по п. 7, по которому модель классификации звонков обучают на атрибутах классифицированного ранее звонка, чей класс был подтвержден, таким образом, чтобы при следующей классификации звонка вероятность неверной классификации была меньше, чем при текущей.
12. Способ по п. 7, по которому после классификации пользователю терминального устройства вызываемой стороны предоставляют информацию о нежелательном классе звонка.
RU2020131448A 2020-09-24 2020-09-24 Система и способ определения нежелательного звонка RU2766273C1 (ru)

Priority Applications (5)

Application Number Priority Date Filing Date Title
RU2020131448A RU2766273C1 (ru) 2020-09-24 2020-09-24 Система и способ определения нежелательного звонка
US17/335,123 US11388286B2 (en) 2020-09-24 2021-06-01 System and method for handling unwanted telephone calls
CN202111008341.XA CN114257687A (zh) 2020-09-24 2021-08-31 用于处理不需要的电话呼叫的系统和方法
EP21196753.4A EP3975517B1 (en) 2020-09-24 2021-09-15 System and method for handling unwanted telephone calls
US17/834,132 US11616879B2 (en) 2020-09-24 2022-06-07 System and method for handling unwanted telephone calls through a branching node

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2020131448A RU2766273C1 (ru) 2020-09-24 2020-09-24 Система и способ определения нежелательного звонка

Publications (1)

Publication Number Publication Date
RU2766273C1 true RU2766273C1 (ru) 2022-02-10

Family

ID=80214944

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2020131448A RU2766273C1 (ru) 2020-09-24 2020-09-24 Система и способ определения нежелательного звонка

Country Status (2)

Country Link
US (1) US11388286B2 (ru)
RU (1) RU2766273C1 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115426435A (zh) * 2022-11-07 2022-12-02 四川易景智能终端有限公司 骚扰电话拦截方法
RU2820329C2 (ru) * 2022-04-22 2024-06-03 Общество с ограниченной ответственностью Профессиональная коллекторская организация "АктивБизнесКонсалт" Способ и система определения мошеннических звонков и оповещения о них абонентов

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120078397A1 (en) * 2010-04-08 2012-03-29 Qualcomm Incorporated System and method of smart audio logging for mobile devices
US20160261468A1 (en) * 2013-10-18 2016-09-08 Telefonaktiebolaget Lm Ericsson (Publ) Alarm prediction in a telecommunication network
US20170134574A1 (en) * 2014-06-18 2017-05-11 Katia Sa Method and system for filtering undesirable incoming telephone calls
US20180121788A1 (en) * 2016-11-03 2018-05-03 Salesforce.Com, Inc. Deep Neural Network Model for Processing Data Through Mutliple Linguistic Task Hiearchies
US20200128126A1 (en) * 2018-10-23 2020-04-23 Capital One Services, Llc System and method detecting fraud using machine-learning and recorded voice clips
RU2724630C1 (ru) * 2019-06-13 2020-06-25 Сергей Олегович Крюков Способ фильтрации нежелательных входящих звонков на сотовые телефоны

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7944953B2 (en) * 2002-04-03 2011-05-17 Tvworks, Llc Method and apparatus for transmitting data in a data stream
JP4129442B2 (ja) 2004-03-24 2008-08-06 株式会社東芝 移動装置システム
WO2006003675A2 (en) * 2004-07-12 2006-01-12 Syed Ibrahim Abdul Hameed Khan System, method of generation and use of bilaterally generated variable instant passwords
US7653188B2 (en) 2005-07-20 2010-01-26 Avaya Inc. Telephony extension attack detection, recording, and intelligent prevention
CN100531328C (zh) * 2005-08-05 2009-08-19 鸿富锦精密工业(深圳)有限公司 一种具有拒听电话功能的电视装置及控制方法
US7992205B2 (en) * 2005-08-12 2011-08-02 Cisco Technology, Inc. Method and system device for deterring spam over internet protocol telephony and spam instant messaging
US20070041372A1 (en) * 2005-08-12 2007-02-22 Rao Anup V Method and system for deterring SPam over Internet Protocol telephony and SPam Instant Messaging
US8300798B1 (en) * 2006-04-03 2012-10-30 Wai Wu Intelligent communication routing system and method
US8583078B2 (en) * 2009-05-26 2013-11-12 Centurylink Intellectual Property Llc Femto cell service delivery platform usage compliance
US9307047B2 (en) * 2012-08-11 2016-04-05 Scott Lee Chung System and method for communication of an event through a call for media
US20150187019A1 (en) * 2013-12-31 2015-07-02 Hartford Fire Insurance Company Systems and method for autonomous vehicle data processing
US9232052B1 (en) * 2014-11-21 2016-01-05 Marchex, Inc. Analyzing voice characteristics to detect fraudulent call activity and take corrective action without using recording, transcription or caller ID
KR101574652B1 (ko) * 2015-01-14 2015-12-11 한국인터넷진흥원 모바일 침해사고 분석시스템 및 방법
CN105100366B (zh) * 2015-07-13 2018-03-20 小米科技有限责任公司 骚扰电话号码确定方法、装置和系统
US9692885B2 (en) * 2015-11-17 2017-06-27 Microsoft Technology Licensing, Llc Determining scam risk during a voice call
US10194022B2 (en) * 2016-07-05 2019-01-29 Dialogtech Inc. System and method for automatically detecting undesired calls
US10102868B2 (en) * 2017-02-17 2018-10-16 International Business Machines Corporation Bot-based honeypot poison resilient data collection
US10326886B1 (en) * 2017-08-31 2019-06-18 Amazon Technologies, Inc. Enabling additional endpoints to connect to audio mixing device
US10194023B1 (en) * 2017-08-31 2019-01-29 Amazon Technologies, Inc. Voice user interface for wired communications system
US10257349B1 (en) * 2017-11-17 2019-04-09 Charles Isgar Telephone call-back device
US11102347B1 (en) * 2017-11-17 2021-08-24 Charles Isgar Message back system
US10978095B2 (en) 2018-11-06 2021-04-13 International Business Machines Corporation Control of incoming calls
US10757252B1 (en) * 2019-06-25 2020-08-25 Youmail, Inc. Identifying, screening, and blocking of calls from problematic telecommunications carriers and number blocks
US10798241B1 (en) * 2019-06-25 2020-10-06 Youmail, Inc. System and method for determining unwanted call origination in communications networks
KR20190114932A (ko) * 2019-09-19 2019-10-10 엘지전자 주식회사 액션 아이템 제안 장치 및 방법
EP4026290A4 (en) * 2019-10-11 2022-10-26 Alipay (Hangzhou) Information Technology Co., Ltd. DECENTRALIZED AUTOMATIC MANAGEMENT OF PHONE FRAUD RISK
US10924609B1 (en) * 2019-12-30 2021-02-16 First Orion Corp. Call screening service for detecting fraudulent inbound/outbound communications with subscriber devices
US11076044B2 (en) * 2019-12-31 2021-07-27 First Orion Corp. Call traffic data monitoring and management
US11050879B1 (en) * 2019-12-31 2021-06-29 First Orion Corp. Call traffic data monitoring and management
RU2763047C2 (ru) * 2020-02-26 2021-12-27 Акционерное общество "Лаборатория Касперского" Система и способ классификации звонка

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120078397A1 (en) * 2010-04-08 2012-03-29 Qualcomm Incorporated System and method of smart audio logging for mobile devices
US20160261468A1 (en) * 2013-10-18 2016-09-08 Telefonaktiebolaget Lm Ericsson (Publ) Alarm prediction in a telecommunication network
US20170134574A1 (en) * 2014-06-18 2017-05-11 Katia Sa Method and system for filtering undesirable incoming telephone calls
US20180121788A1 (en) * 2016-11-03 2018-05-03 Salesforce.Com, Inc. Deep Neural Network Model for Processing Data Through Mutliple Linguistic Task Hiearchies
US20200128126A1 (en) * 2018-10-23 2020-04-23 Capital One Services, Llc System and method detecting fraud using machine-learning and recorded voice clips
RU2724630C1 (ru) * 2019-06-13 2020-06-25 Сергей Олегович Крюков Способ фильтрации нежелательных входящих звонков на сотовые телефоны

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2820329C2 (ru) * 2022-04-22 2024-06-03 Общество с ограниченной ответственностью Профессиональная коллекторская организация "АктивБизнесКонсалт" Способ и система определения мошеннических звонков и оповещения о них абонентов
CN115426435A (zh) * 2022-11-07 2022-12-02 四川易景智能终端有限公司 骚扰电话拦截方法

Also Published As

Publication number Publication date
US11388286B2 (en) 2022-07-12
US20220094784A1 (en) 2022-03-24

Similar Documents

Publication Publication Date Title
RU2763047C2 (ru) Система и способ классификации звонка
US10291646B2 (en) System and method for audio fingerprinting for attack detection
CN110310205A (zh) 一种区块链数据监控方法、装置、设备和介质
US20090083826A1 (en) Unsolicited communication management via mobile device
EP2645664A1 (en) Authentication system and method for operating an authentication system
US8954317B1 (en) Method and apparatus of processing user text input information
US10803154B2 (en) Multicomputer system for user data authentication and processing
CN106850931A (zh) 防骚扰电话的方法及移动智能终端
EP3873075A1 (en) System and method for call classification
RU2766273C1 (ru) Система и способ определения нежелательного звонка
US20220321611A1 (en) System and method of admission control of a communication session
US20140095169A1 (en) Voice authentication system and methods
US11616879B2 (en) System and method for handling unwanted telephone calls through a branching node
KR20200027090A (ko) 대화형 금융 거래 처리 방법 및 이를 수행하는 대화형 뱅킹 시스템
EP4009581A1 (en) System and method for anonymizing personal identification data in an audio / video conversation
US11606461B2 (en) Method for training a spoofing detection model using biometric clustering
US20230075097A1 (en) System and method for protecting subscriber data in the event of unwanted calls
RU2774054C1 (ru) Система и способ защиты данных абонента при нежелательном звонке
CN114567699A (zh) 反电信诈骗服务端建模系统
KR102611390B1 (ko) 음성전화 및 문자 트랩 서버를 이용한 피싱 감지시스템
EP3982620A1 (en) Communication terminal, information processing device, information processing system, information processing method, and program
RU2779932C1 (ru) Способ прерывания входящего вызова на мобильном устройстве
KR102690048B1 (ko) 불법 자동응답 서비스를 탐지하기 위한 탐지 장치 및 방법
KR102058558B1 (ko) 통화 중 서비스 요청 처리 장치와 방법 및 통화 중 인증 수행 장치
CN106332017A (zh) 一种基于网络电话实现语音短信的方法