WO2024049322A1 - Система определения краткосрочных интересов в2в пользователей - Google Patents

Система определения краткосрочных интересов в2в пользователей Download PDF

Info

Publication number
WO2024049322A1
WO2024049322A1 PCT/RU2022/000296 RU2022000296W WO2024049322A1 WO 2024049322 A1 WO2024049322 A1 WO 2024049322A1 RU 2022000296 W RU2022000296 W RU 2022000296W WO 2024049322 A1 WO2024049322 A1 WO 2024049322A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
product
interests
users
database
Prior art date
Application number
PCT/RU2022/000296
Other languages
English (en)
French (fr)
Inventor
Сергей Андреевич ПАВЛЮЧЕНКО
Александр Игоревич ГОРЛОВ
Original Assignee
Общество С Ограниченной Ответственностью "М16.Тех"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from RU2022123408A external-priority patent/RU2022123408A/ru
Application filed by Общество С Ограниченной Ответственностью "М16.Тех" filed Critical Общество С Ограниченной Ответственностью "М16.Тех"
Publication of WO2024049322A1 publication Critical patent/WO2024049322A1/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Definitions

  • This technical solution relates to the field of computer technology, in particular to methods for analyzing and processing user data.
  • the solution chosen as the closest analogue is known from the prior art, US 2012022930 A1, publ. 01/26/2012.
  • This solution relates to the field of electronic advertising.
  • the method includes: presenting a shareable offer on a first mobile device of a first consumer in an application associated with a media targeting system, wherein the shareable offer is targeted to the first consumer by the media targeting system; allowing the first consumer to transmit the shared offer to a second mobile device of the second consumer, wherein the first mobile device and the second mobile device collide to transmit the shared offer; allowing the second consumer to save the shared offer received after the collision and associate the loyalty card with the saved offer; and co-offer redemption when a second consumer uses the loyalty card at the retailer touchpoint.
  • the proposed technical solution is aimed at eliminating the shortcomings of the current level of technology and differs from previously known ones in that the proposed solution provides high-quality analysis of user data.
  • the technical problem that the claimed solution is aimed at is creating a method for analyzing and processing user data.
  • the technical result is to improve the quality of analysis and processing of user data.
  • An additional technical result is an increase in the performance of computing systems when solving the problem (i.e., the solution allows you to process data to obtain a result (product) in less time, due to complete automation of the process), thereby reducing the load on the central processors of computing devices (servers), by reducing the number of processed requests.
  • the claimed technical results are achieved by implementing a method for analyzing and processing user data, containing the stages of: collecting data about the user, and collecting data is carried out by recording the flow of events during the user’s work on a B2B resource; save the event flow log into a database, in the ClickHouse storage, in the form of a table containing a list of web pages visited by the user;
  • the type of product is determined using a neural network implemented in the python programming language and the keras library, in which the text of the page is transmitted to the input of the neural network, at the output the network classifies the product contained in the text, and the neural network uses : vector representation layer (Embedding); recurrent layer (LSTM); exception(Dropout); line layers for each feature; then, for each page of the resource viewed by the user, through the computing power of the server infrastructure, a table of interests is automatically filled in, which in turn is saved in the database and consists of the date, classified product and user ID of the
  • the recorded stream of events is the resources visited by the user and the products contained on the resource web page visited.
  • Fig. 1 illustrates a general flow diagram of the method.
  • Fig. 2 illustrates a block diagram of a neural network for identifying a product in a text.
  • Fig. 3 illustrates an example of a general circuit of a computing device.
  • the proposed method allows high-quality and efficient analysis and processing of user data/actions, due to which it appears the ability to offer site users exactly those offers that may interest them.
  • the result of the proposed method is the determination of a personal list of product names that may be of interest to the user.
  • the proposed method also allows you to generate lists of users who are interested in a given product.
  • server infrastructure capable of performing the necessary data processing can be used as a computing server.
  • the server infrastructure may consist of network equipment, server equipment, disk and other storage.
  • the method of analyzing and processing user data can be divided into the following parts.
  • Part 1 Data collection and product identification.
  • an interest table is automatically filled in, consisting of the date, product and user ID of the user who viewed the web page containing the name and description of the product.
  • Part 2 Search for users by product and interests of individual users (data analysis).
  • the search for users interested in a product is carried out using a table.
  • the product column searches for all users who were interested in the product.
  • the records are grouped by the user-identifier column and the number of rows is counted. Received quantity can be denoted as an indicator of interest.
  • the resulting sample is sorted by interest indicator in descending order.
  • the above sample is a list of interested users. Accordingly, we can conclude that the higher the user is on this list, the higher his interest.
  • the interests of a specific user can be obtained by selecting from a table.
  • the user ID column is used to search for all records of products that the user viewed on the pages of the B2B site.
  • the records are grouped by the product column and the number of rows is counted.
  • the number of lines can be denoted as an indicator of user interest in the product.
  • the resulting sample is sorted according to the user's interest in the product in descending order.
  • this sample is a list of the user’s possible interests in the products that he viewed on the B2B site.
  • the method is applicable for B2B resources (for example, for resources where users sell and buy products in bulk).
  • the proposed technical solution uses a neural network to identify the product in the text.
  • the network is built on the python programming language and the pytorch library.
  • the neural network contains:
  • a dataset is created to train the neural network.
  • the dataset contains the text of the pages and the corresponding product attributes. Words in the text and product attributes are replaced with identifiers.
  • the text length is set to a fixed length.
  • the model takes as input a sequence of word identifiers.
  • the vector representation layer replaces word identifiers with vectors.
  • the recurrent LSTM layer processes the sequence and returns the result.
  • the dropout layer excludes some neurons to reduce network overtraining. Linear layers classify each feature.
  • the output layer defines the product attribute ID.
  • the user visits a web resource.
  • an event is registered via the computing server, which contains information about the user, page and time of visit, and the event is saved in the ClickHouse table.
  • a product is determined by means of a computing server. In this case, the product is determined using a neural network based on the text of the page. This information is saved to the database. Based on this data, a table of interests is formed. Due to this, using the table it becomes possible to search for users who were interested in a specific product.
  • FIG. 3 will further present a general diagram of a computing device (300) that provides data processing necessary to implement the claimed solution.
  • the device (300) includes components such as: one or more processors (301), at least one memory (302), data storage means (303), input/output interfaces (304), I/O means ( 305), networking tools (306).
  • the device processor (301) performs basic computing operations necessary for the operation of the device (300) or the functionality of one or more components thereof.
  • the processor (301) executes the necessary machine-readable instructions contained in the RAM (302).
  • Memory (302) is made in the form of RAM and contains the necessary program logic that provides the required functionality.
  • the data storage medium (303) can be in the form of HDD, SSD drives, raid array, network storage, flash memory, optical storage devices (CD, DVD, MD, Blue-Ray disks), etc.
  • the means (303) allows long-term storage of various types of information, for example, the aforementioned files with user data sets, a database containing records of time intervals measured for each user, user IDs, etc.
  • Interfaces (304) are standard means for connecting and working with the server part, for example, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire, etc.
  • interfaces (304) depends on the specific design of the device (300), which can be a personal computer, mainframe, server cluster, thin client, smartphone, laptop, etc.
  • the data I/O means (305) in any embodiment of a system implementing the described method must use a keyboard.
  • the hardware design of the keyboard can be any known: it can be either a built-in keyboard used on a laptop or netbook, or a separate device connected to a desktop computer, server or other computer device.
  • the connection can be either wired, in which the keyboard connecting cable is connected to the PS/2 or USB port located on the system unit of the desktop computer, or wireless, in which the keyboard exchanges data via a wireless communication channel, for example, a radio channel, with base station, which, in turn, is directly connected to the system unit, for example, to one of the USB ports.
  • I/O data tools can also include: joystick, display (touch display), projector, touchpad, mouse, trackball, light pen, speakers, microphone, etc.
  • Network interaction means (306) are selected from a device that provides network reception and transmission of data, for example, an Ethernet card, WLAN/Wi-Fi module, Bluetooth module, BLE module, NFC module, IrDa, RFID module, GSM modem, etc.
  • a wired or wireless data transmission channel for example, WAN, PAN, LAN, Intranet, Internet, WLAN, WMAN or GSM.
  • the device components (300) are interfaced via a common data bus (310).
  • a common data bus (310) In these application materials, a preferred disclosure of the implementation of the claimed technical solution was presented, which should not be used as limiting other, private embodiments of its implementation, which do not go beyond the scope of the requested scope of legal protection and are obvious to specialists in the relevant field of technology.

Abstract

Способ анализа и обработки пользовательских данных содержит этапы, на которых: осуществляют сбор данных о пользователе путем регистрации потока событий в ходе работы пользователя на В2В ресурсе; осуществляют сохранение журнала потока событий в базу данных в виде таблицы, содержащей перечень посещаемых пользователем веб-страниц; осуществляют определение вида продукции, интересующей пользователей, с помощью нейронной сети, реализованной на языке программирования python и библиотеке keras; далее для каждой страницы ресурса осуществляют автоматическое заполнение таблицы интересов; на основе заполненной таблицы интересов осуществляют автоматическую выборку из базы данных пользователей, интересующихся продуктом; осуществляют сортировку полученной выборки по показателю интереса в убывающем порядке. Изобретение направлено на повышение качества анализа и обработки пользовательских данных.

Description

СИСТЕМА ОПРЕДЕЛЕНИЯ КРАТКОСРОЧНЫХ ИНТЕРЕСОВ В2В ПОЛЬЗОВАТЕЛЕЙ
ОБЛАСТЬ ТЕХНИКИ
Настоящее техническое решение относится к области вычислительной техники, в частности, к способам анализа и обработки пользовательских данных.
УРОВЕНЬ ТЕХНИКИ
Из уровня техники известно решение, выбранное в качестве наиболее близкого аналога, US 2012022930 А1, опубл. 26.01.2012. Данное решение относится к области электронной рекламы. Способ включает в себя: представление совместно используемого предложения на первом мобильном устройстве первого потребителя в приложении, связанном с системой таргетинга мультимедиа, при этом совместно используемое предложение нацелено на первого потребителя системой таргетинга мультимедиа; предоставление возможности первому потребителю передать совместно используемое предложение на второе мобильное устройство второго потребителя, при этом первое мобильное устройство и второе мобильное устройство сталкиваются для передачи совместно используемого предложения; предоставление второму потребителю возможности сохранить совместно используемое предложение, полученное после столкновения, и связать карту лояльности с сохраненным предложением; а также погашение совместного предложения, когда второй потребитель использует карту лояльности в точке взаимодействия с розничным продавцом.
Предлагаемое техническое решение направлено на устранение недостатков современного уровня техники и отличается от известных ранее тем, что предложенное решение обеспечивает качественный анализ пользовательских данных.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Технической задачей, на решение которой направлено заявленное решение, является создание способа анализа и обработки пользовательских данных.
Технический результат заключается в повышении качества анализа и обработки пользовательских данных.
Дополнительным техническим результатом является увеличение производительности вычислительных систем при решении поставленной задачи (т.е. решение позволяет производить обработку данных с получением результата (продукта) за меньшее количество времени, за счет полной автоматизации процесса), тем самым снижая нагрузку на центральные процессоры вычислительных устройств (серверов), за счет уменьшения количества обрабатываемых запросов.
Заявленные технические результаты достигаются за счет осуществления способа анализа и обработки пользовательских данных, содержащего этапы, на которых: осуществляют сбор данных о пользователе, причем сбор данных осуществляется путем регистрации потока событий в ходе работы пользователя на В2В ресурсе; осуществляют сохранение журнала потока событий в базу данных, в хранилище ClickHouse, в виде таблицы, содержащей перечень посещаемых пользователем веб-страниц; посредством вычислительных мощностей серверной инфраструктуры осуществляют определение вида продукции с помощью нейронной сети, реализованной на языке программирования python и библиотеке keras, в которой на вход нейронной сети передается текст страницы, на выходе сеть классифицирует продукт, содержащийся в тексте, причем нейронная сеть для классификации продукта использует: слой векторного представления (Embedding); рекуррентный слой (LSTM); исключение (Dropout); линейные слои для каждого признака; далее для каждой страницы ресурса, просматриваемой пользователем, посредством вычислительных мощностей серверной инфраструктуры осуществляют автоматическое заполнение таблицы интересов, которая в свою очередь сохраняется в базу данных, и состоит из даты, классифицированного продукта и идентификатора пользователя, который просматривал веб-страницу, содержащую наименование и описание продукта; на основе заполненной таблицы интересов, посредством вычислительных мощностей серверной инфраструктуры, осуществляют автоматическую выборку из базы данных пользователей, интересующихся продуктом; причем по колонке продукт, выявляются все пользователи, которые интересовались продуктом; по колонке идентификатор-пользователя осуществляется группировка записей и подсчет количества строк, представляющих количественный показатель интереса; осуществляется сортировка полученной выборки по показателю интереса в убывающем порядке.
В частном варианте реализации описываемого способа, регистрируемым потоком событий являются посещаемые пользователем ресурсы и продукция, содержащаяся на посещенной веб-странице ресурса.
ОПИСАНИЕ ЧЕРТЕЖЕЙ
Реализация изобретения будет описана в дальнейшем в соответствии с прилагаемым чертежом, который представлен для пояснения сути изобретения и никоим образом не ограничивает область изобретения. К заявке прилагается следующий чертеж:
Фиг. 1 иллюстрирует общую блок-схему способа.
Фиг. 2 иллюстрирует блок-схему нейросети определения продукта в тексте.
Фиг. 3 иллюстрирует пример общей схемы вычислительного устройства.
ДЕТАЛЬНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
В приведенном ниже подробном описании реализации изобретения приведены многочисленные детали реализации, призванные обеспечить отчетливое понимание настоящего изобретения. Однако, квалифицированному в предметной области специалисту, будет очевидно каким образом можно использовать настоящее изобретение, как с данными деталями реализации, так и без них. В других случаях хорошо известные методы, процедуры и компоненты не были описаны подробно, чтобы не затруднять излишне понимание особенностей настоящего изобретения.
Кроме того, из приведенного изложения будет ясно, что изобретение не ограничивается приведенной реализацией. Многочисленные возможные модификации, изменения, вариации и замены, сохраняющие суть и форму настоящего изобретения, будут очевидными для квалифицированных в предметной области специалистов.
Предлагаемый способ позволяет качественно и эффективно анализировать и обрабатывать пользовательские данные/действия, за счет чего появляется возможность предлагать пользователям сайта именно те предложения, которые могут их заинтересовать.
С помощью качественного анализа действий пользователя, можно понять, в какой именно продукции, публикуемой на интернет-ресурсе, заинтересован пользователь.
Результатом предлагаемого способа является определение персонального перечня названий товаров, которые могут интересовать пользователя. Предлагаемый способ также позволяет формировать списки пользователей, которые интересуются заданным продуктом.
В качестве вычислительного сервера может использоваться любая серверная инфраструктура, способная осуществлять необходимую обработку данных. Серверная инфраструктура может состоять из сетевого оборудования, серверного оборудования, дискового и иного хранилища.
Способ анализа и обработки пользовательских данных можно разделить на следующие части.
Часть 1 : Сбор данных и определение продуктов.
Сбор данных о пользователе в виде потока событий в ходе его работы на В2В сайте (Фиг. 1). Регистрируются события, какие веб-ресурсы/веб-страницы открываются пользователем и какую продукцию они содержат. Сохранение журнала производится в базу данных в хранилище ClickHouse, в таблицу, содержащую перечень открываемых пользователем веб-страниц. Определяется вид продукции посредством нейросети, реализованной на языке программирования python и библиотеке keras (Фиг. 2). На вход нейросети передается текст страницы, на выходе сеть классифицирует продукт, содержащийся в тексте.
Таким образом, для каждой страницы, просматриваемой пользователем, в автоматическом режиме заполняется таблица интересов, состоящая из даты, продукта и идентификатора пользователя, который просматривал веб-страницу, содержащую наименование и описание продукта.
Часть 2: Поиск пользователей по продукту и интересы отдельных пользователей (анализ данных).
Поиск пользователей, интересующихся продуктом, осуществляется по таблице. По колонке продукт осуществляется поиск всех пользователей, которые интересовались продуктом. Далее осуществляется группировка записей по колонке идентификатор-пользователя и подсчитывается количество строк. Полученное количество можно обозначить как - показатель интереса. Далее осуществляется сортировка полученной выборки по показателю интереса в убывающем порядке.
Таким образом, вышеуказанная выборка является списком заинтересованных пользователей. Соответственно, можно сделать вывод о том, что чем выше пользователь в данном списке, тем его интерес выше.
Интересы конкретного пользователя можно получить посредством выборки по таблице. По колонке идентификатор-пользователя осуществляется поиск всех записей по продуктам, которые пользователь просматривал на страницах В2В- сайта.
Осуществляется группировка записей по колонке продукт и подсчитывается количество строк. Количество строк можно обозначить как - показатель интереса пользователя к продукту. Осуществляется сортировка полученной выборки по показателю интереса пользователя к продукту в убывающем порядке.
Соответственно, данная выборка является списком возможных интересов пользователя к продуктам, которые он просматривал на В2В-сайте.
Способ применим для В2В-ресурсов (например, для ресурсов, где пользователи продают и покупают продукцию оптом).
Поля таблицы интересов могут отображать следующую информацию:
Дата - время посещения страницы пользователем;
Продукт - продукт, содержащийся в тексте страницы;
Идентификатор пользователя - пользователь, посетивший страницу.
Пример таблицы интересов.
(3 колонки: дата, продукт, id-пользователя): 15.08.2022 12:22 | Свинина, полутуша | 355 15.08.2022 12:23 | Свинина, шпик | 355, т.е. пользователь с id=355 сначала посетил страницу, где был выявлен продукт «Свинина, полутуша», затем открыл страницу с «Свинина, шпик».
В предлагаемом техническом решении используется нейронная сеть для определения продукта в тексте. Сеть построена на языке программирования python и библиотеке pytorch.
Нейронная сеть содержит:
•слой векторного представления (Embedding);
•рекуррентный слой (LSTM);
•исключение (Dropout);
•линейные слои для каждого признака.
Процесс работы нейронной сети. Для обучения нейронной сети создается датасет. Датасет содержит текст страниц и соответствующие признаки продукта. Слова в тексте и признаки продукта заменяются идентификаторами. Длина текста устанавливается фиксированной длины.
Модель принимает в качестве входных данных последовательность идентификаторов слов. Слой векторного представления заменяет идентификаторы слов на вектора. Рекуррентный слой LSTM обрабатывает последовательность и возвращает результат. Слой dropout исключает часть нейронов для уменьшения переобучения сети. Линейные слои классифицируют каждый признак. Выходной слой определяет идентификатор признака продукта.
Таким образом, пользователь, посредством своего вычислительного устройства, посещает веб-ресурс. При каждом посещении страницы, посредством вычислительного сервера, регистрируется событие, которое содержит информацию о пользователе, странице и времени посещения, при этом событие сохраняется в таблицу ClickHouse. Для каждой страницы, посредством вычислительного сервера, определяется продукт. При этом продукт определяется с использованием нейронной сети по тексту страницы. Эта информация сохраняется в базу. На основе этих данных формируется таблица интересов. За счет чего, по таблице появляется возможность осуществлять поиск пользователей, которые интересовались определенным продуктом.
На Фиг. 3 далее будет представлена общая схема вычислительного устройства (300), обеспечивающего обработку данных, необходимую для реализации заявленного решения.
В общем случае устройство (300) содержит такие компоненты, как: один или более процессоров (301), по меньшей мере одну память (302), средство хранения данных (303), интерфейсы ввода/вывода (304), средство В/В (305), средства сетевого взаимодействия (306).
Процессор (301) устройства выполняет основные вычислительные операции, необходимые для функционирования устройства (300) или функциональности одного или более его компонентов. Процессор (301) исполняет необходимые машиночитаемые команды, содержащиеся в оперативной памяти (302).
Память (302), как правило, выполнена в виде ОЗУ и содержит необходимую программную логику, обеспечивающую требуемый функционал. Средство хранения данных (303) может выполняться в виде HDD, SSD дисков, рейд массива, сетевого хранилища, флэш-памяти, оптических накопителей информации (CD, DVD, MD, Blue-Ray дисков) и т.п. Средство (303) позволяет выполнять долгосрочное хранение различного вида информации, например, вышеупомянутых файлов с наборами данных пользователей, базы данных, содержащих записи измеренных для каждого пользователя временных интервалов, идентификаторов пользователей и т.п.
Интерфейсы (304) представляют собой стандартные средства для подключения и работы с серверной частью, например, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire и т.п.
Выбор интерфейсов (304) зависит от конкретного исполнения устройства (300), которое может представлять собой персональный компьютер, мейнфрейм, серверный кластер, тонкий клиент, смартфон, ноутбук и т.п.
В качестве средств В/В данных (305) в любом воплощении системы, реализующей описываемый способ, должна использоваться клавиатура. Аппаратное исполнение клавиатуры может быть любым известным: это может быть как встроенная клавиатура, используемая на ноутбуке или нетбуке, так и обособленное устройство, подключенное к настольному компьютеру, серверу или иному компьютерному устройству. Подключение при этом может быть, как проводным, при котором соединительный кабель клавиатуры подключен к порту PS/2 или USB, расположенному на системном блоке настольного компьютера, так и беспроводным, при котором клавиатура осуществляет обмен данными по каналу беспроводной связи, например, радиоканалу, с базовой станцией, которая, в свою очередь, непосредственно подключена к системному блоку, например, к одному из USB-портов. Помимо клавиатуры, в составе средств В/В данных также может использоваться: джойстик, дисплей (сенсорный дисплей), проектор, тачпад, манипулятор мышь, трекбол, световое перо, динамики, микрофон и т.п.
Средства сетевого взаимодействия (306) выбираются из устройства, обеспечивающий сетевой прием и передачу данных, например, Ethernet карту, WLAN/Wi-Fi модуль, Bluetooth модуль, BLE модуль, NFC модуль, IrDa, RFID модуль, GSM модем и т.п. С помощью средств (305) обеспечивается организация обмена данными по проводному или беспроводному каналу передачи данных, например, WAN, PAN, ЛВС (LAN), Интранет, Интернет, WLAN, WMAN или GSM.
Компоненты устройства (300) сопряжены посредством общей шины передачи данных (310). В настоящих материалах заявки было представлено предпочтительное раскрытие осуществление заявленного технического решения, которое не должно использоваться как ограничивающее иные, частные воплощения его реализации, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники.

Claims

Формула
1. Способ анализа и обработки пользовательских данных, содержащий этапы, на которых: осуществляют сбор данных о пользователе, причем сбор данных осуществляется путем регистрации потока событий в ходе работы пользователя на В2В ресурсе; осуществляют сохранение журнала потока событий в базу данных, в хранилище ClickHouse, в виде таблицы, содержащей перечень посещаемых пользователем веб-страниц; посредством вычислительных мощностей серверной инфраструктуры осуществляют определение вида продукции с помощью нейронной сети, реализованной на языке программирования python и библиотеке keras, в которой на вход нейронной сети передается текст страницы, на выходе сеть классифицирует продукт, содержащийся в тексте, причем нейронная сеть для классификации продукта использует: слой векторного представления (Embedding); рекуррентный слой (LSTM); исключение (Dropout); линейные слои для каждого признака; далее для каждой страницы ресурса, просматриваемой пользователем, посредством вычислительных мощностей серверной инфраструктуры осуществляют автоматическое заполнение таблицы интересов, которая в свою очередь сохраняется в базу данных, и состоит из даты, классифицированного продукта и идентификатора пользователя, который просматривал веб-страницу, содержащую наименование и описание продукта; на основе заполненной таблицы интересов, посредством вычислительных мощностей серверной инфраструктуры, осуществляют автоматическую выборку из базы данных пользователей, интересующихся продуктом; причем по колонке продукт, выявляются все пользователи, которые интересовались продуктом; по колонке идентификатор-пользователя осуществляется группировка записей и подсчет количества строк, представляющих количественный показатель интереса; осуществляется сортировка полученной выборки по показателю интереса в убывающем порядке.
9
2. Способ по п.1 , в котором регистрируемым потоком событий являются посещаемые пользователем ресурсы и продукция, содержащаяся на посещенной веб-странице ресурса.
PCT/RU2022/000296 2022-09-01 2022-09-29 Система определения краткосрочных интересов в2в пользователей WO2024049322A1 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
RU2022123408A RU2022123408A (ru) 2022-09-01 Система определения краткосрочных интересов b2b пользователей
RU2022123408 2022-09-01

Publications (1)

Publication Number Publication Date
WO2024049322A1 true WO2024049322A1 (ru) 2024-03-07

Family

ID=90098362

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2022/000296 WO2024049322A1 (ru) 2022-09-01 2022-09-29 Система определения краткосрочных интересов в2в пользователей

Country Status (1)

Country Link
WO (1) WO2024049322A1 (ru)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180165745A1 (en) * 2016-12-09 2018-06-14 Alibaba Group Holding Limited Intelligent Recommendation Method and System
RU2693323C2 (ru) * 2017-11-24 2019-07-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для выбора элементов рекомендаций для пользователя
KR20210022194A (ko) * 2019-08-19 2021-03-03 주식회사 비주얼 주얼리 상품을 추천하기 위한 컴퓨터 프로그램
CN112464034A (zh) * 2020-12-08 2021-03-09 深圳市欢太科技有限公司 用户数据提取方法、装置、电子设备及计算机可读介质
CN113159881A (zh) * 2021-03-15 2021-07-23 杭州云搜网络技术有限公司 一种数据聚类及b2b平台客户偏好获取方法、系统
WO2021215758A1 (ko) * 2020-04-23 2021-10-28 오드컨셉 주식회사 추천 상품 광고 방법, 장치 및 컴퓨터 프로그램
KR20220111592A (ko) * 2021-02-02 2022-08-09 주식회사 패션에이드 인공지능에 의한 패션 코디네이션 스타일 추천 시스템 및 방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180165745A1 (en) * 2016-12-09 2018-06-14 Alibaba Group Holding Limited Intelligent Recommendation Method and System
RU2693323C2 (ru) * 2017-11-24 2019-07-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для выбора элементов рекомендаций для пользователя
KR20210022194A (ko) * 2019-08-19 2021-03-03 주식회사 비주얼 주얼리 상품을 추천하기 위한 컴퓨터 프로그램
WO2021215758A1 (ko) * 2020-04-23 2021-10-28 오드컨셉 주식회사 추천 상품 광고 방법, 장치 및 컴퓨터 프로그램
CN112464034A (zh) * 2020-12-08 2021-03-09 深圳市欢太科技有限公司 用户数据提取方法、装置、电子设备及计算机可读介质
KR20220111592A (ko) * 2021-02-02 2022-08-09 주식회사 패션에이드 인공지능에 의한 패션 코디네이션 스타일 추천 시스템 및 방법
CN113159881A (zh) * 2021-03-15 2021-07-23 杭州云搜网络技术有限公司 一种数据聚类及b2b平台客户偏好获取方法、系统

Similar Documents

Publication Publication Date Title
JP6419860B2 (ja) 特徴処理トレードオフ管理
US10963810B2 (en) Efficient duplicate detection for machine learning data sets
US11074250B2 (en) Technologies for implementing ontological models for natural language queries
US9646077B2 (en) Time-series analysis based on world event derived from unstructured content
US20150379429A1 (en) Interactive interfaces for machine learning model evaluations
Garg et al. Challenges and techniques for testing of big data
US10169730B2 (en) System and method to present a summarized task view in a case management system
JP7125900B2 (ja) 複合的ダイアディック又はマルチプルなカウンターパーティ関係を発見するために使用される多次元再帰的学習プロセス及びシステム
US11361030B2 (en) Positive/negative facet identification in similar documents to search context
US20150186808A1 (en) Contextual data analysis using domain information
US10891314B2 (en) Detection and creation of appropriate row concept during automated model generation
US20200250215A1 (en) Processing unstructured voice of customer feedback for improving content rankings in customer support systems
JP2023533475A (ja) キーワード推薦のための人工知能
US9996529B2 (en) Method and system for generating dynamic themes for social data
CN111444304A (zh) 搜索排序的方法和装置
Pickerill et al. PHANTOM: Curating GitHub for engineered software projects using time-series clustering
Hammond et al. Cloud based predictive analytics: text classification, recommender systems and decision support
CN111383072A (zh) 一种用户信用评分方法、存储介质及服务器
US9286349B2 (en) Dynamic search system
WO2024049322A1 (ru) Система определения краткосрочных интересов в2в пользователей
Trinks A classification of real time analytics methods. an outlook for the use within the smart factory
Ma et al. API prober–a tool for analyzing web API features and clustering web APIs
Kumbhar et al. Web mining: A Synergic approach resorting to classifications and clustering
US20160162821A1 (en) Comparative peer analysis for business intelligence
Khoshbakht et al. Big Data Framework for Analytics Business Intelligence

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22957554

Country of ref document: EP

Kind code of ref document: A1