FR3104781A1 - Device for detecting fake accounts on social networks - Google Patents

Device for detecting fake accounts on social networks Download PDF

Info

Publication number
FR3104781A1
FR3104781A1 FR1914568A FR1914568A FR3104781A1 FR 3104781 A1 FR3104781 A1 FR 3104781A1 FR 1914568 A FR1914568 A FR 1914568A FR 1914568 A FR1914568 A FR 1914568A FR 3104781 A1 FR3104781 A1 FR 3104781A1
Authority
FR
France
Prior art keywords
accounts
data
account
module
verified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR1914568A
Other languages
French (fr)
Other versions
FR3104781B1 (en
Inventor
Justine CHARLEY
Olivier MALLET
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bull Sas Fr
Original Assignee
Atos Consulting
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Atos Consulting filed Critical Atos Consulting
Priority to FR1914568A priority Critical patent/FR3104781B1/en
Publication of FR3104781A1 publication Critical patent/FR3104781A1/en
Application granted granted Critical
Publication of FR3104781B1 publication Critical patent/FR3104781B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud

Abstract

La présente invention concerne un dispositif (1) de détection de faux comptes sur des réseaux sociaux (11), caractérisé en ce qu’il comprend : Un module d’extraction (2) comprenant, ou configuré pour faire appel à des API (21) pour extraire des données desdits comptes à vérifier, Un module de prédiction comprenant au moins un programme implémentant un réseau neuronal artificiel (4) constituant un modèle d’apprentissage automatique, configuré pour analyser lesdites données extraites desdits comptes pour réaliser des prédictions pour fournir des informations sur la véracité d’un compte, ou une liste des faux followers d’un compte, par la détection de motifs, la prédiction étant basée sur les motifs détectés dans les données desdits faux comptes, les données extraites étant des données concernant le compte de l’utilisateur, ses publications, ses interactions avec d’autres membres du réseau social et/ou sa ligne de temps. Figure à publier avec l’abrégé : Fig. 1The present invention relates to a device (1) for detecting false accounts on social networks (11), characterized in that it comprises: An extraction module (2) comprising, or configured to call on APIs (21 ) to extract data from said accounts to be verified, A prediction module comprising at least one program implementing an artificial neural network (4) constituting a machine learning model, configured to analyze said data extracted from said accounts to make predictions to provide information on the veracity of an account, or a list of false followers of an account, by pattern detection, the prediction being based on the patterns detected in the data of said fake accounts, the extracted data being data relating to the account of the user, his publications, his interactions with other members of the social network and / or his time line. Figure to be published with the abstract: Fig. 1

Description

Dispositif de détection de faux comptes sur des réseaux sociauxDevice for detecting fake accounts on social networks

Domaine technique de l’inventionTechnical field of the invention

La présente invention concerne de manière générale le domaine des dispositifs de détection de robots, en particulier les faux comptes sur des réseaux sociaux issues de robots informatiques.The present invention generally relates to the field of robot detection devices, in particular fake accounts on social networks from computer robots.

état de la technique antérieureprior art

Il existe un grand nombre de logiciels «bots» qui réalisent de façon automatique des actions de types variées, dans des buts utiles ou délétères.There are a large number of software "bots" that automatically perform actions of various types, for useful or harmful purposes.

Les termes decrawler, robot de crawl, spider, ou scrapers (collecteurs en français) désignent dans le monde de l'informatique un robot d'indexation, un logiciel qui explore automatiquement le Web. Il est généralement conçu pour collecter les ressources (pages Web, images, vidéos, documents Word, PDF ou PostScript, etc.), afin de permettre à un moteur de recherche de les indexer. Fonctionnant sur le même principe, certains robots malveillants (spambots) sont utilisés pour archiver les ressources ou collecter des adresses électroniques auxquelles envoyer des courriels.The terms decrawler, crawl robot, spider, or scrapers (collecteurs in French) designate in the computer world an indexing robot, software that automatically explores the Web. It is generally designed to collect resources (web pages, images, videos, Word, PDF or PostScript documents, etc.), in order to allow a search engine to index them. Working on the same principle, some malicious bots (spambots) are used to archive resources or collect email addresses to send emails to.

Un bot informatique est un agent logiciel automatique ou semi-automatique qui interagit avec des serveurs informatiques. Un bot se connecte et interagit avec le serveur comme un programme client utilisé par un humain, d'où le terme « bot », qui est la contraction par aphérèse de « robot ».A computer bot is an automatic or semi-automatic software agent that interacts with computer servers. A bot connects and interacts with the server like a client program used by a human, hence the term "bot", which is an apheresis contraction of "robot".

Les logiciels d’écoute sociale (Social listening ou Social media measurement) réalisent le calcul de la popularité d’un thème ou d’une marque, et identifient des émotions relatives à ce thème à partir de données collectées sur les différents médias (réseaux sociaux, blogs, sites...). Ils réalisent une analyse de ces données afin d’en retirer des informations qualitatives et quantitatives portant sur le ressenti, ou l’intérêt.Social listening software (Social listening or Social media measurement) calculates the popularity of a theme or brand, and identifies emotions relating to this theme from data collected on the various media (social networks , blogs, websites, etc.). They carry out an analysis of this data in order to extract qualitative and quantitative information relating to the feeling, or the interest.

Ainsi, une étude de 2018 réalisée par Arizona State University & Carnegie Mellon University montre que 24% de tous les tweets sont générés par des bots.Thus, a 2018 study by Arizona State University & Carnegie Mellon University shows that 24% of all tweets are generated by bots.

Plusieurs documents de l’art antérieur proposent des solutions pour détecter les bots sur Internet, et plusieurs de ces solutions incorporent une Intelligence Artificielle (IA) et du Machine Learning.Several prior art documents propose solutions to detect bots on the Internet, and several of these solutions incorporate Artificial Intelligence (AI) and Machine Learning.

WO2019063389 enseigne l’identification de bots/non bots sur un site web par le traitement de requêtes Web, le classement de robots «bots» en plusieurs catégories préalablement déterminées (associées à un degré de confiance), par l’utilisation d’une IA pour identifier la source de requête web reçues. Ainsi, les données utilisées dans le modèle de Machine Learning de ce document sont construites autour de l’historique web ayant conduit au site web en question. Cette solution nécessite donc l’obtention d’un historique web suffisant pour détecter le bot.WO2019063389 teaches the identification of bots/non-bots on a website by the processing of web requests, the classification of robots "bots" into several previously determined categories (associated with a degree of confidence), by the use of an AI to identify the source of web requests received. Thus, the data used in the Machine Learning model of this document is built around the web history that led to the website in question. This solution therefore requires obtaining a sufficient web history to detect the bot.

US2011131652 enseigne l’interdiction d’accès à un service pour un robot «bot» par l’utilisation d’un service de prédictions, basé sur un jeu de données d’accès précédents indésirables analysé par une IA (Machine Learning) et une base de données comprenant une historisation des données. Le système permet ainsi l’analyse et la détection en temps réel de certains robots d’indexation (crawlers bots, scrapers) puis leur interdiction d’accès à des serveurs. Ainsi un robot d’indexation (Crawler/Scraper) collecte des informations de pages internet complètes afin de les stocker dans une base de données de capacité importante pour stocker toutes ces pages. Ces robots d’indexation vont venir plus ou moins régulièrement sur les pages pour remettre à jour ces informations. Ces robots d’indexation vont se nourrir de la structure HTML (utilisée pour construire un site) afin de récupérer le titre par la balise <title> titre ou encore la description par la balise <meta> métadonnée. Cette solution est totalement différente à plusieurs niveaux (technique et objectif) de celle de l’invention.US2011131652 teaches the denial of access to a service for a "bot" robot by the use of a prediction service, based on a set of unwanted previous access data analyzed by an AI (Machine Learning) and a database of data including a history of the data. The system thus allows the real-time analysis and detection of certain indexing robots (crawlers bots, scrapers) and then their access to servers is prohibited. Thus an indexing robot (Crawler/Scraper) collects information from complete internet pages in order to store them in a database of large capacity to store all these pages. These indexing robots will come more or less regularly to the pages to update this information. These indexing robots will feed on the HTML structure (used to build a site) in order to retrieve the title by the <title> title tag or the description by the metadata <meta> tag. This solution is totally different on several levels (technical and objective) from that of the invention.

US2018152465 enseigne la détection d’un bot par un vecteur analysé par une IA (avec des modèles ML supervisés). Le vecteur est sur un score idiosyncratique lié à l’activité du réseau de bots. En d’autres termes, le vecteur est basé sur un score lié aux actions de chaque machine virtuelle, et leur comportement individuel, dénué ou non d’actions potentiellement humaines.US2018152465 teaches the detection of a bot by a vector analyzed by an AI (with supervised ML models). The vector is on an idiosyncratic score related to botnet activity. In other words, the vector is based on a score linked to the actions of each virtual machine, and their individual behavior, devoid or not of potentially human actions.

WO2010143152 enseigne la détection d’un bot par réponse indiquant que c’est un browser (comparaison de la réponse à une question (identifiant de requête de page (PRID)) par rapport à la réponse attendue pour définir si le correspondant (client Internet) est un web crawler ou non. Ce procédé simple est utilisé pour screener, ou filtrer, les bots les plus basiques (crawlers).WO2010143152 teaches the detection of a bot by response indicating that it is a browser (comparison of the response to a question (page request identifier (PRID)) with respect to the expected response to define whether the correspondent (Internet client) is a web crawler or not.This simple process is used to screen, or filter, the most basic bots (crawlers).

Les robots présents sur les réseaux sociaux peuvent être plus complexes à détecter que les crawlers ou scrapers, et ne sont pas détectables par lesdits documents de l’art antérieur.Robots present on social networks can be more complex to detect than crawlers or scrapers, and are not detectable by said prior art documents.

La présente invention a donc pour objet de proposer un dispositif de détection de faux comptes sur des réseaux sociaux, permettant de palier au moins une partie des inconvénients de l’art antérieur.The object of the present invention is therefore to propose a device for detecting false accounts on social networks, making it possible to overcome at least some of the drawbacks of the prior art.

La présente invention permet de détecter des bots et des réseaux de bots au sein des réseaux sociaux, afin d’améliorer la lisibilité de ceux-ci, par l’amélioration des études de «social listening». En effet, beaucoup des données issues des réseaux sociaux, et donc analysées par les plateformes d’écoute sociales, sont issues de bots, c'est-à-dire de programmes agents automatisés capables d’intéragir avec des serveurs informatiques. Il existe donc un besoin de mieux repérer les réseaux de bots, d’être capable de savoir si un profil est un bot ou pas afin de pouvoir calculer la véritable popularité d’un objet ou d’une marque. Ces problématiques doivent être résolues avec des solutions fiables et automatisables, qui fonctionnement à grande échelle (grand nombre de données, Big Data) et en temps réel.The present invention makes it possible to detect bots and networks of bots within social networks, in order to improve their readability, by improving “social listening” studies. Indeed, many of the data from social networks, and therefore analyzed by social listening platforms, come from bots, i.e. automated agent programs capable of interacting with computer servers. There is therefore a need to better identify bot networks, to be able to know if a profile is a bot or not in order to be able to calculate the true popularity of an object or a brand. These issues must be resolved with reliable and automatable solutions, which operate on a large scale (large amount of data, Big Data) and in real time.

Ce but est atteint par un dispositif de détection de faux comptes sur des réseaux sociaux, le dispositif comprenant au moins des modules de codes exécutables sur un ou plusieurs composants hardware de traitement tels qu’un microprocesseur, et une base de données, le dispositif étant caractérisée en ce qu’il comprend:

  • Un module d’extraction connecté au réseau internet et comprenant des API pour extraire des données desdits comptes à vérifier,
  • Un module de prédiction comprenant au moins un ensemble de codes formant un ou plusieurs programmes, le(s) programme(s) implémentant un réseau neuronal artificiel constituant un modèle d’apprentissage automatique, de préférence par des modèles supervisés ou non supervisés, configuré pour analyser lesdites données extraites desdits comptes pour réaliser des prédictions pour fournir des informations sur la véracité d’un compte, une liste des faux comptes sur un hashtag / keyword ou une liste des faux followers, abonnés en français, d’un compte, le réseau neuronal artificiel étant entrainé sur des données de faux comptes pour détecter des motifs (patterns), la prédiction étant basée sur les motifs (patterns) détectés dans les données desdits faux comptes,
et en ce que les données extraites sont des données concernant le compte de l’utilisateur, ses publications, ses interactions avec d’autres membres du réseau social et/ou sa ligne de temps.This object is achieved by a device for detecting false accounts on social networks, the device comprising at least code modules executable on one or more processing hardware components such as a microprocessor, and a database, the device being characterized in that it comprises:
  • An extraction module connected to the internet network and comprising APIs to extract data from said accounts to be verified ,
  • A prediction module comprising at least one set of codes forming one or more programs, the program(s) implementing an artificial neural network constituting an automatic learning model, preferably by supervised or unsupervised models, configured to analyze said data extracted from said accounts to make predictions to provide information on the veracity of an account, a list of fake accounts on a hashtag / keyword or a list of fake followers, subscribers in French, of an account, the network artificial neural being trained on data from fake accounts to detect patterns, the prediction being based on the patterns (patterns) detected in the data from said fake accounts,
and in that the data extracted is data concerning the user's account, his publications, his interactions with other members of the social network and/or his timeline.

Selon une particularité, le dispositif comprend en outre un module de réception de coordonnées d’un compte à vérifier ou d’une liste de comptes à vérifier d’un ou plusieurs réseaux sociaux.According to one feature, the device further comprises a module for receiving contact details of an account to be verified or of a list of accounts to be verified from one or more social networks.

Selon une autre particularité, le réseau neuronal artificiel est entrainé, de façon automatisée, sur des données de faux comptes d’au moins une base de données, préférentiellement de la base de données du dispositif, les données des faux comptes étant classées manuellement à partir de comptes déjà identifiés comme étant des faux comptes.According to another feature, the artificial neural network is trained, in an automated manner, on fake account data from at least one database, preferably from the database of the device, the fake account data being classified manually from accounts already identified as fake accounts.

Selon une autre particularité, le dispositif comprend en outre un module d’enregistrement pour conserver les données desdits comptes à vérifier et faux comptes dans la base de données du dispositif.According to another feature, the device further comprises a recording module to store the data of said accounts to be verified and false accounts in the database of the device.

Selon une autre particularité, le dispositif comprend en outre une plateforme de requête client comprenant une interface et un module de requête configuré pour émettre une requête de comptes à vérifier comprenant au moins un identifiant de compte à vérifier que le module d’extraction traite pour extraire les données dudit compte.According to another feature, the device further comprises a client request platform comprising an interface and a request module configured to send a request for accounts to be verified comprising at least one account identifier to be verified that the extraction module processes to extract the data of said account.

Selon une autre particularité, le module prend en compte les données des faux comptes supplémentaires détectés et enregistrés dans la base de données du dispositif, pour améliorer ses prédictions.According to another feature, the module takes into account the data of the additional false accounts detected and recorded in the database of the device, to improve its predictions.

Selon une autre particularité, le dispositif comprend en outre un module statistique configuré pour extraire, trier et/ou présenter les données issues des comptes détectés, par exemple le ratio bot / humain, et/ou le nombre de bot par jour pour un hashtag.According to another feature, the device further comprises a statistics module configured to extract, sort and/or present the data from the detected accounts, for example the bot/human ratio, and/or the number of bots per day for a hashtag.

Selon une autre particularité, le dispositif comprend en outre un module émetteur configuré pour envoyer les résultats de l’analyse, la liste de comptes analysées ou des données liées aux comptes à vérifier à un destinataire à distance.According to another feature, the device further comprises a transmitter module configured to send the results of the analysis, the list of analyzed accounts or data related to the accounts to be verified to a remote recipient.

Selon une autre particularité, les prédictions du module de prédiction sont réalisées au moins en partie en fonction des résultats issus des données déjà présentes dans la base de données.According to another feature, the predictions of the prediction module are made at least in part according to the results from the data already present in the database.

Selon une autre particularité, le dispositif réalise des prédictions sur des comptes choisis aléatoirement sans que ledit module d’extraction dispose d’une liste de comptes à vérifier.According to another feature, the device makes predictions on randomly chosen accounts without said extraction module having a list of accounts to verify.

L’invention concerne aussi une plateforme d’écoute sociale, comprenant un logiciel d’écoute sociale apte à réaliser des calculs sur des données du réseau social afin de mettre en évidence des tendances, ou de récupérer des résultats qualitatifs ou quantitatifs, la plateforme d’écoute sociale comprenant en outre un dispositif de détection de faux comptes sur des réseaux sociaux tel que décrit précédemment, la plateforme étant apte à faire abstraction ou à se concentrer sur des données des faux comptes présents dans la base de données du dispositif.The invention also relates to a social listening platform, comprising social listening software capable of performing calculations on data from the social network in order to highlight trends, or to retrieve qualitative or quantitative results, the social listening further comprising a device for detecting fake accounts on social networks as described previously, the platform being capable of disregarding or focusing on data from the fake accounts present in the database of the device.

L’invention concerne aussi un procédé de détection de faux comptes sur des réseaux sociaux par un dispositif tel que décrit précédemment, dans lequel le procédé comprend les étapes suivantes:

  • Extraction de données d’un compte à vérifier par le module d’extraction à partir de coordonnées de compte à vérifier, d’une liste de comptes à vérifier ou de comptes choisis aléatoirement;
  • Optionnellement pré-traitement des données et calcul de variables supplémentaires,
  • Traitement des données par le réseau neuronal pré-entrainé du module de prédiction pour réaliser des prédictions pour fournir des informations sur la véracité d’un compte, une liste des faux comptes sur un hashtag / keyword ou une liste des faux followers, abonnés en français, d’un compte ;
  • Ajout de la prédiction du compte auxdites données et enregistrement et historisation des données dans la base de données du dispositif par le module d’enregistrement.
The invention also relates to a method for detecting false accounts on social networks by a device as described above, in which the method comprises the following steps:
  • Extraction of data from an account to be verified by the extraction module from account details of an account to be verified, from a list of accounts to be verified or from randomly chosen accounts;
  • Optionally pre-processing of data and calculation of additional variables,
  • Data processing by the pre-trained neural network of the prediction module to make predictions to provide information on the veracity of an account, a list of fake accounts on a hashtag / keyword or a list of fake followers, subscribers in French , of an account;
  • Addition of count prediction to said data and recording and logging of data in the device database by the recording module.

Selon une autre particularité, le procédé comprend une étape supplémentaired’analyse statistique, de tri et/ou de présentation desdites données analysées par le module statistique.According to another feature, the method includes an additional step of statistical analysis, sorting and/or presentation of said data analyzed by the statistical module.

Selon une autre particularité, le procédé comprend une étape supplémentaire:

  • Création d’une requête par un client sur une plateforme de requête client, par l’intermédiaire d’une interface et d’un module de requête;
  • Envoi de ladite requête par le module de requête au module de réception du dispositif de détection;
  • Réception par le module de réception,de coordonnées de compte à vérifier ou d’une liste de comptes à vérifier, puis envoi desdites coordonnées de compte à vérifier ou de ladite liste de comptes à vérifier au module d’extraction.
According to another feature, the method comprises an additional step:
  • Creation of a request by a customer on a customer request platform, through an interface and a request module;
  • Sending of said request by the request module to the reception module of the detection device;
  • Received by the module reception,account details to verify or a list of accounts to verify, then sending said account details to verify or said list of accounts to verify to the extraction module.

Selon une autre particularité, le procédé comprend en outre une étape d’entrainement sur la base de données actualisée, suite à l’enregistrement des données du ou des nouveaux comptes analysés.According to another feature, the method further comprises a step of training on the updated database, following the recording of the data of the new account(s) analysed.

Brève description des figuresBrief description of figures

D’autres caractéristiques, détails et avantages de l’invention ressortiront à la lecture de la description qui suit en référence aux figures annexées, qui illustre:
représente de façon schématique le dispositif de détection de faux comptes sur des réseaux sociaux selon certains modes de réalisation.
Other characteristics, details and advantages of the invention will become apparent on reading the following description with reference to the appended figures, which illustrates:
schematically represents the device for detecting fake accounts on social networks according to certain embodiments.

description detaillee de l’inventiondetailed description of the invention

De nombreuses combinaisons peuvent être envisagées sans sortir du cadre de l'invention ; l'homme de métier choisira l'une ou l'autre en fonction des contraintes économiques, ergonomiques, dimensionnelles ou autres qu'il devra respecter.Many combinations can be envisaged without departing from the scope of the invention; the person skilled in the art will choose one or the other depending on the economic, ergonomic, dimensional or other constraints that he will have to respect.

De manière générale, la présente invention comporte un dispositif (1) de détection de faux comptes sur des réseaux sociaux (11), le dispositif (1) comprenant au moins des modules de codes exécutables sur un ou plusieurs composants hardware de traitement tels qu’un microprocesseur, et une base de données (3), le dispositif (1) comprenant en outre:

  • Un module d’extraction (2) connecté au réseau internet et comprenant des API (21) pour extraire des données desdits comptes à vérifier
  • Un module de prédiction comprenant au moins un ensemble de codes formant un ou plusieurs programmes, le(s) programme(s) implémentant un réseau neuronal artificiel (4) constituant un modèle d’apprentissage automatique, de préférence par des modèles supervisés ou non supervisés, configuré pour analyser lesdites données extraites desdits comptes pour réaliser des prédictions sur la véracité du compte et indiquer pour chaque compte de la liste de faux compte reçue pour traitement si ledit compte est un faux compte, le réseau neuronal artificiel (4) étant entrainé sur des données de faux comptes pour détecter des motifs (patterns), la prédiction étant basée sur les motifs (patterns) détectés dans les données desdits faux comptes,
et en ce que les données extraites sont des données concernant le compte de l’utilisateur, ses publications, ses interactions avec d’autres membres du réseau social et/ou sa ligne de temps.In general, the present invention comprises a device (1) for detecting fake accounts on social networks (11), the device (1) comprising at least code modules executable on one or more processing hardware components such as a microprocessor, and a database (3), the device (1) further comprising:
  • An extraction module (2) connected to the internet network and comprising APIs (21) for extracting data from said accounts to be verified
  • A prediction module comprising at least one set of codes forming one or more programs, the program(s) implementing an artificial neural network (4) constituting an automatic learning model, preferably by supervised or unsupervised models , configured to analyze said data extracted from said accounts to make predictions on the veracity of the account and to indicate for each account of the list of false accounts received for processing whether said account is a false account, the artificial neural network (4) being trained on fake account data for detecting patterns, the prediction being based on the patterns (patterns) detected in the data of said fake accounts,
and in that the data extracted is data concerning the user's account, his publications, his interactions with other members of the social network and/or his timeline.

Par «faux comptes», on entend des comptes créés par un ou des robots de manière automatique, et non par un utilisateur humain individuel. Un robot, «bot» se connecte et interagit avec le serveur d’un réseau social comme un programme client utilisé par un humain, pour créer de façon automatique ou semi-automatique un compte.By “fake accounts” we mean accounts created by robot(s) automatically, and not by an individual human user. A robot, “bot” connects and interacts with the server of a social network like a client program used by a human, to automatically or semi-automatically create an account.

Dans certains modes de réalisation, les données extraites sont des données concernant le compte de l’utilisateur, ses publications, ses interactions avec d’autres membres du réseau social et/ou sa ligne de temps, ou d’autres variables supplémentaires, telles que par exemple les informations de création de comptes.In some embodiments, the extracted data is data regarding the user's account, posts, interactions with other members of the social network and/or timeline, or other additional variables, such as for example account creation information.

Dans certains modes de réalisation, le dispositif (1) comprend en outre un module de réception de coordonnées d’un compte à vérifier ou d’une liste de comptes à vérifier d’un ou plusieurs réseaux sociaux.In some embodiments, the device (1) further comprises a module for receiving contact details of an account to be verified or of a list of accounts to be verified from one or more social networks.

Dans certains modes de réalisation, la détection des faux comptes mise en œuvre par le réseau neuronal artificiel (4) est réalisée par la recherche de motifs dans les données des faux comptes. La détection n’est donc pas réalisée par la création d’un score idiosyncratique, la comparaison et/ou l’étude d’une réponse à une question ou encore le traitement de requêtes Web et le classement de bots en catégories préalablement déterminées associées à un degré de confiance comme ce qui est réalisé aujourd’hui pour la détection de bots plus basiques type crawlers et scrapers.In some embodiments, the fake account detection implemented by the artificial neural network (4) is performed by searching for patterns in the fake account data. The detection is therefore not carried out by the creation of an idiosyncratic score, the comparison and/or the study of an answer to a question or even the processing of Web requests and the classification of bots into previously determined categories associated with a degree of confidence like what is achieved today for the detection of more basic bots such as crawlers and scrapers.

Le réseau neuronal artificiel comprend par exemple une pluralité d’algorithmes, par exemple 8 algorithmes de Machine Learning et Deep learning. Dans certains modes de réalisation, certains algorithmes sont basés uniquement sur les données de profil et d’autres uniquement sur la timeline. Cela permet une nette amélioration de la détection au vu du nombre de variables utilisées. Cela permet également de guider l’utilisateur du dispositif à savoir si le compte étudié est un faux compte ou un compte alimenté par des posts (publications) automatisésThe artificial neural network comprises for example a plurality of algorithms, for example 8 Machine Learning and Deep learning algorithms. In some embodiments, some algorithms are based only on profile data and others only on the timeline. This allows a clear improvement in detection given the number of variables used. This also helps to guide the user of the device to know if the account studied is a fake account or an account powered by automated posts (publications).

L’apprentissage du réseau neuronal est ainsi réalisé et automatisé à partir d’au moins une base de données contenant des faux comptes déjà identifiés et leurs données, et de préférence au moins une base de données a été créée manuellement spécifiquement dans ce but. Les algorithmes du réseau neuronal lui permettent de repérer des motifs dans les valeurs des différents critères et variables disponibles pour chaque compte. Cela lui permet ensuite de pouvoir réaliser des prédictions fiables sur un compte afin de l’identifier comme un compte «Faux» ou «Robot», «Vrai» ou «Humain», ou «indéterminé».The training of the neural network is thus carried out and automated from at least one database containing already identified fake accounts and their data, and preferably at least one database has been created manually specifically for this purpose. The neural network's algorithms allow it to spot patterns in the values of the various criteria and variables available for each account. This then allows him to be able to make reliable predictions on an account in order to identify it as a “False” or “Robot”, “True” or “Human”, or “Undetermined” account.

Le dispositif (1) présente une architecture logicielle qui s’articule autour d’une Intelligence artificielle (IA), capable d’apprendre de manière automatique (par des modèles ML supervisés ou non, afin de détecter des patterns, ou motifs en français, permettant de détecter les bots et les réseaux de bots, à partir de données d’au moins un compte à vérifier, par exemple issues de l’extraction par des API de données suite à une requête envoyée par un utilisateur, un client ou une plateforme d’écoute sociale (12) par l’intermédiaire d’une plateforme dédiée. Des calculs peuvent optionnellement être effectués sur lesdites données avant que soient réalisées des prédictions des statuts des comptes et une historisation desdites données et statut. En effet, le dispositif (1) fait appel à des API (21) pour récupérer les données des profils sur les différents réseaux sociaux (11) à partir des informations brutes des comptes à vérifier qui lui ont été fournies, soit en batch, c'est-à-dire en liste, par une plateforme ou un client, soit individuellement par un client par l’intermédiaire de la plateforme de requête client (6) et son interface (60) comprenant un module de requête (61). Le résultat de la prédiction peut être affiché directement sur l’interface (60), ou envoyée au client d’une autre manière.The device (1) has a software architecture that revolves around an Artificial Intelligence (AI), capable of learning automatically (by supervised or unsupervised ML models, in order to detect patterns, or patterns in French, making it possible to detect bots and networks of bots, from data of at least one account to be verified, for example resulting from the extraction by data APIs following a request sent by a user, a customer or a platform social listening (12) via a dedicated platform. Calculations can optionally be performed on said data before predictions of account statuses and logging of said data and status are made. Indeed, the device ( 1) uses APIs (21) to retrieve profile data on the various social networks (11) from the raw information of the accounts to be verified which have been provided to it, either in batch, that is to say in a list, by a platform or a client, or individually by a client via the client request platform (6) and its interface (60) comprising a request module (61). The prediction result can be displayed directly on the interface (60), or sent to the client in another way.

L’extraction de données d’un compte se fait à partir de données publiques partagées par ledit comptes, telles que des données de profil, timeline (mur), contacts, actions, images, publications…The extraction of data from an account is done from public data shared by said accounts, such as profile data, timeline (wall), contacts, actions, images, publications…

Dans certains modes de réalisation, le réseau neuronal artificiel est entrainé, de façon automatisée, sur des données de faux comptes d’au moins une base de données, préférentiellement de la base de données (3) du dispositif (1), les données des faux comptes étant classées manuellement à partir de comptes déjà identifiés comme étant des faux comptes.In some embodiments, the artificial neural network is trained, in an automated manner, on fake account data from at least one database, preferably from the database (3) of the device (1), the data from the fake accounts being manually classified from accounts already identified as fake accounts.

Ainsi, à partir de comptes détectés et classés manuellement comme étant des faux comptes, le réseau neuronal du dispositif est entraîné automatique afin d’améliorer ses algorithmes par des mécanismes de Machine Learning, et Deep Learning, afin de pouvoir par la suite réaliser des prédictions sur des comptes à analyser.Thus, from accounts detected and classified manually as being fake accounts, the neural network of the device is automatically trained in order to improve its algorithms by Machine Learning mechanisms, and Deep Learning, in order to be able to subsequently make predictions. on accounts to analyze.

Dans certains modes de réalisation, le dispositif (1) comprend en outre un module de réception d’informations ou de listes de comptes d’un réseau social forcément à vérifier. Les comptes sont généralement identifiés par leur pseudo, mais il est possible de les identifier à partir d’un identifiant ou d’une adresse spécifique.In some embodiments, the device (1) further comprises a module for receiving information or lists of accounts from a social network that must be verified. Accounts are generally identified by their nickname, but it is possible to identify them from a specific identifier or address.

Dans certains modes de réalisation, le module d’extraction (2) est apte à extraire les données de comptes sur un site internet, par l’intermédiaire d’API (interface de programmation d'application ou interface de programmation applicative, en français). Avantageusement le module d’extraction fait des appels API afin de récupérer les données du compte à vérifier sur un ou plusieurs réseaux sociaux (11).In certain embodiments, the extraction module (2) is capable of extracting data from accounts on a website, via API (application programming interface or application programming interface, in French) . Advantageously, the extraction module makes API calls in order to retrieve the account data to be verified on one or more social networks (11).

Dans certains modes de réalisation, le module d’extraction (2) est apte à extraire des données envoyées d’une plateforme d’écoute sociale (12) à partir d’une liste de comptes à vérifier, de préférence en mode batch.In certain embodiments, the extraction module (2) is able to extract data sent from a social listening platform (12) from a list of accounts to be verified, preferably in batch mode.

Dans certains modes de réalisation, le dispositif comprend en outre un module d’enregistrement pour conserver les données desdits comptes à vérifier et faux comptes dans la base de données (3) du dispositif (1).In some embodiments, the device further comprises a registration module to store the data of said accounts to be verified and fake accounts in the database (3) of the device (1).

Dans certains modes de réalisation, le dispositif (1) comprend en outre une plateforme de requête client (6) comprenant une interface (60) et un module de requête (61) configuré pour émettre une requête de comptes à vérifier comprenant au moins un identifiant de compte à vérifier que le module d’extraction traite pour extraire les données dudit compte.In some embodiments, the device (1) further comprises a client request platform (6) comprising an interface (60) and a request module (61) configured to issue a request for accounts to be verified comprising at least one identifier account to verify that the extraction module is processing to extract the data from said account.

Dans certains modes de réalisation, le module prend en compte les données des faux comptes supplémentaires détectés et enregistrés dans la base de données (3) du dispositif (1), pour améliorer ses prédictions.In certain embodiments, the module takes into account the data of the additional false accounts detected and recorded in the database (3) of the device (1), to improve its predictions.

Dans certains modes de réalisation, le dispositif (1) comprend en outre un module statistique configuré pour extraire, trier et/ou présenter les données issues des comptes détectés.In some embodiments, the device (1) further comprises a statistics module configured to extract, sort and/or present the data from the detected accounts.

Dans certains modes de réalisation, le dispositif (1) comprend en outre un module émetteur configuré pour envoyer les résultats de l’analyse, la liste de comptes analysées ou des données liées aux comptes à vérifier à un destinataire à distance.In some embodiments, the device (1) further comprises a sender module configured to send the results of the analysis, the list of analyzed accounts or data related to the accounts to be verified to a remote recipient.

Dans certains modes de réalisation, les prédictions du module de prédiction sont réalisées au moins en partie en fonction des résultats issus des données déjà présentes dans la base de données (3).In certain embodiments, the predictions of the prediction module are made at least in part according to the results from the data already present in the database (3).

Dans certains modes de réalisation, le réseau neuronal du dispositif est configuré pour analyser des réseaux de bots agissant en groupe, le réseau neuronal artificiel (4) étant constitué de préférence par des modèles non supervisés.In certain embodiments, the neural network of the device is configured to analyze networks of bots acting in groups, the artificial neural network (4) preferably consisting of unsupervised models.

Dans certains modes de réalisation, les comptes sont choisis à partir d’identifiants uniques pour chaque compte, par exemple un pseudo, à partir d’un mot clé issu de leur publication, à partir d’un membre commun qu’ils suivent ou par lequel ils sont suivis, ou encore aléatoirement sans que ledit module d’extraction (2) dispose d’une liste de comptes à vérifier.In certain embodiments, the accounts are chosen from unique identifiers for each account, for example a nickname, from a keyword resulting from their publication, from a common member that they follow or by which they are followed, or even randomly without said extraction module (2) having a list of accounts to check.

Dans certains modes de réalisation, le dispositif (1) fait partie d’une plateforme d’écoute sociale (12), comprenant un logiciel d’écoute sociale (12) apte à réaliser des calculs sur des données du réseau social afin de mettre en évidence des tendances, ou de récupérer des résultats qualitatifs ou quantitatifs, la plateforme d’écoute sociale (12) comprenant en outre ledit dispositif (1) de détection de faux comptes sur des réseaux sociaux (11) tel que décrit précédemment, la plateforme étant apte à faire abstraction ou à se concentrer sur des données des faux comptes présents dans la base de données (3) du dispositif (1).In certain embodiments, the device (1) is part of a social listening platform (12), comprising social listening software (12) able to perform calculations on data from the social network in order to evidence of trends, or to retrieve qualitative or quantitative results, the social listening platform (12) further comprising said device (1) for detecting false accounts on social networks (11) as described previously, the platform being capable of disregarding or concentrating on the data of the false accounts present in the database (3) of the device (1).

L’invention concerne aussi un procédé de détection de faux comptes sur des réseaux sociaux (11) par un dispositif (1) tel que décrit précédemment, dans lequel le procédé comprend les étapes suivantes:

  • Extraction de données d’un compte à vérifier par le module d’extraction (2) à partir de coordonnées de compte à vérifier, d’une liste de comptes à vérifier ou de comptes choisis aléatoirement;
  • Optionnellement pré-traitement des données et calcul de variables supplémentaires,
  • Traitement des données par le réseau neuronal pré-entrainé du module de prédiction pour réaliser des prédictions pour fournir des informations sur la véracité d’un compte, une liste des faux comptes sur un hashtag / keyword ou une liste des faux followers, abonnés en français, d’un compte ;
  • Ajout de la prédiction du compte auxdites données et enregistrement et historisation des données dans la base de données (3) du dispositif (1) par le module d’enregistrement.
The invention also relates to a method for detecting fake accounts on social networks (11) by a device (1) as described previously, in which the method comprises the following steps:
  • Extraction of data from an account to be verified by the extraction module (2) from coordinates of account to be verified, from a list of accounts to be verified or from randomly selected accounts;
  • Optionally pre-processing of data and calculation of additional variables,
  • Data processing by the pre-trained neural network of the prediction module to make predictions to provide information on the veracity of an account, a list of fake accounts on a hashtag / keyword or a list of fake followers, subscribers in French , of an account;
  • Addition of the account prediction to said data and recording and archiving of the data in the database (3) of the device (1) by the recording module.

Par «réseau neuronal artificiel pré-entrainédu module de prédiction» on entend que le réseau neuronal artificiel est entrainé sur des données de faux comptes d’une base de données, préférentiellement de la base de données (3) du dispositif (1), les données des faux comptes étant classées manuellement comme étant des données de faux comptes. Cette étape de pré-entrainement permet au module de prédiction de réaliser des prédictions correctes lorsqu’il lui est fourni des données de comptes réels dont on veut connaitre la véracité.By “pre-trained artificial neural network of the prediction module” is meant that the artificial neural network is trained on data of false accounts from a database, preferably from the database (3) of the device (1), the fake account data being manually classified as fake account data. This pre-training step allows the prediction module to make correct predictions when it is provided with real account data whose veracity we want to know.

Dans certains modes de réalisation, le procédé comprend une étape supplémentaired’analyse statistique, de tri et/ou de présentation desdites données analysées par le module statistique.In certain embodiments, the method comprises an additional step of statistical analysis, sorting and/or presentation of said data analyzed by the statistics module.

Dans certains modes de réalisation, le procédé comprend une étape supplémentaire:

  • Réception par le module de réception, de coordonnées de compte à vérifier ou d’une liste de comptes à vérifier, puis envoi desdites coordonnées de compte à vérifier ou de ladite liste de comptes à vérifier au module d’extraction (2).
In some embodiments, the method includes an additional step:
  • Received by the module of receipt, account details to be verified or a list of accounts to be checked, then sending said account details to be checked or said list of accounts to be checked to the extraction module (2).

Dans certains modes de réalisation, l’étape de réception par le module de réception est précédée des étapes suivantes:

  • Création d’une requête par un client sur une plateforme de requête client (6), par l’intermédiaire d’une interface (60) et d’un module de requête (61)
  • Envoi de ladite requête par le module de requête (61) au module de réception du dispositif de détection (1)
In some embodiments, the reception step by the reception module is preceded by the following steps:
  • Creation of a request by a customer on a customer request platform (6), via an interface (60) and a request module (61)
  • Sending of said request by the request module (61) to the reception module of the detection device (1)

Dans certains modes de réalisation, le procédé comprend en outre une étape d’entrainement sur la base de données (3) actualisée, suite à l’enregistrement des données du ou des nouveaux comptes analysés.In certain embodiments, the method further comprises a step of training on the updated database (3), following the recording of the data of the new account(s) analysed.

Dans une variante, la base de données d’entrainement est complétée manuellement tous les 6 mois.Alternatively, the training database is completed manually every 6 months.

Dans certains modes de réalisation, comme par exemple illustré de manière non limitative à la figure 1, une plateforme d’écoute sociale (12) souhaite réaliser de l’écoute sociale et du suivi de tendances sur les réseaux sociaux (11). La plateforme (ou un tiers quelconque) transmet donc une liste de comptes à vérifier au dispositif (1) de détection de faux comptes sur des réseaux sociaux (11), qui peut les enregistrer dans la base de données (3) du dispositif (1). La base de données (3) est préférentiellement une base de données en nuage (Cloud) décentralisée. A partir de la liste de comptes à vérifier, le module d’extraction (2) du dispositif (1) se connecte aux réseaux sociaux (11) et extrait les données correspondantes à chaque compte dans les différents réseaux sociaux (11). Cette extraction de données peut concerner des données de profils, de la timeline (mur) d’un compte, ou toute autre information publique et/ou partagée par ledit compte. Le module d’extraction (2) peut utiliser des interfaces de programmation d’application (21), ou API (21) (application programming interface), pour récupérer lesdites données à partir du site ou de la page Web du réseau social. Une fois les données récupérées et conservées dans la base de données (3), le réseau neuronal artificiel (41) du module de prédiction (4) analyse lesdites données extraites pour statuer sur la véracité du compte. Il réalise ainsi une prédiction et indique si le compte est un «vrai» compte, en d’autres termes si c’est un utilisateur humain qui est responsable de la rédaction du contenu extrait, ou si le compte est un «faux» compte, en d’autres termes un compte crée et tenu par un robot informatique. Le module de prédiction peut ensuite associer le statut du compte, par exemple vrai ou faux concernant sa véracité, au compte à vérifier, et/ou auxdites données extraites, et conserver le résultat dans sa base de données (3). La plateforme d’écoute sociale est ici représentée séparée du dispositif (1), mais dans certains modes de réalisation, le dispositif est intégré dans la plateforme d’écoute sociale (12).In certain embodiments, as for example illustrated in a nonlimiting manner in FIG. 1, a social listening platform (12) wishes to carry out social listening and monitoring of trends on social networks (11). The platform (or any third party) therefore transmits a list of accounts to be verified to the device (1) for detecting false accounts on social networks (11), which can save them in the database (3) of the device (1 ). The database (3) is preferably a decentralized cloud database (Cloud). From the list of accounts to be verified, the extraction module (2) of the device (1) connects to the social networks (11) and extracts the data corresponding to each account in the different social networks (11). This data extraction may concern profile data, the timeline (wall) of an account, or any other information public and/or shared by said account. The extraction module (2) can use application programming interfaces (21), or API (21) (application programming interface), to retrieve said data from the site or the web page of the social network. Once the data has been retrieved and stored in the database (3), the artificial neural network (41) of the prediction module (4) analyzes said extracted data to decide on the veracity of the account. It thus makes a prediction and indicates if the account is a “real” account, in other words if it is a human user who is responsible for writing the extracted content, or if the account is a “fake” account, in other words an account created and maintained by a computer robot. The prediction module can then associate the status of the account, for example true or false concerning its veracity, with the account to be verified, and/or with said extracted data, and store the result in its database (3). The social listening platform is shown here separated from the device (1), but in some embodiments, the device is integrated into the social listening platform (12).

Dans certains modes de réalisation, le module de prédiction (4) est pré-entrainé sur des données d’une base de données de faux comptes, classés manuellement comme tel, jusqu’à ce qu’il présente une probabilité suffisante de reconnaissance d’un faux compte lors de l’analyse de faux comptes classés, avant d’être utilisé lors de l’utilisation du dispositif (1) pour détecter des faux comptes parmi une liste de comptes dont le statut et la véracité ne sont pas connus. Il peut en outre dans certains modes de réalisation être entrainé à nouveau sur la base de données (3) du dispositif (1) lorsque de nouveaux comptes sont détectés et évalués comme faux, afin d’améliorer les futures détections et prévisions du réseau neuronal artificiel (41) du module de prédiction (4).In some embodiments, the prediction module (4) is pre-trained on data from a database of fake accounts, manually classified as such, until it has a sufficient probability of recognizing a false account during the analysis of classified false accounts, before being used during the use of the device (1) to detect false accounts among a list of accounts whose status and veracity are not known. It can further in some embodiments be retrained on the database (3) of the device (1) when new counts are detected and evaluated as false, in order to improve future detections and predictions of the artificial neural network (41) of the prediction module (4).

Dans certains modes de réalisation, toute la solution est hébergée sur le cloud (script d’appel API, Base de données, dispositif comprenant le réseau neuronal, plateforme de requête et interface client).In some embodiments, the whole solution is hosted on the cloud (API call script, Database, device including the neural network, query platform and client interface).

Dans certains modes de réalisation, le dispositif utilise entre autres la technologie de «Text mining» et plus particulièrement Regex et l’analyse de similitude entre les dix dernières publications ainsi que l’analyse du nombre de langues utilisées dans les publications.In certain embodiments, the device uses, among other things, “Text mining” technology and more particularly Regex and the analysis of similarity between the last ten publications as well as the analysis of the number of languages used in the publications.

Le dispositif représente un modèle stable pour tous les bots(dans plusieurs domaines d’activité)s’adaptant à l’évolution technologique des bots grâce à notamment:The device represents a stable model for all bots (in several fields of activity) adapting to the technological evolution of bots thanks in particular to:

La base d’apprentissage qui peut être alimentée régulièrement (captant l’évolution technologique) de manière manuellement ou automatique;The learning base which can be fed regularly (capturing technological developments) manually or automatically;

Des algorithmes supplémentaires peuvent être ajoutés (on parle de features engineering standard pour tous les utilisateurs mais également spécifiques pour certains utilisateurs (algorithmes dérivés)). Par exemple, pour une marque de luxe, il est possible de créer une variable supplémentaire «le compte est présent en Thailande ou non». Il peut donc aussi être nécessaire de créer des variables spécifiques pour certains types de bots (inventés dans le futur par exemple) qui seraient non captés par le ou les algorithmes d’aujourd’hui;Additional algorithms can be added (we speak of standard engineering features for all users but also specific for certain users (derived algorithms)). For example, for a luxury brand, it is possible to create an additional variable “the account is present in Thailand or not”. It may therefore also be necessary to create specific variables for certain types of bots (invented in the future for example) which would not be captured by today's algorithm(s);

Des algorithmes non supervisées (fonctionnant comme une «détection d’anomalies», l’algorithme détectera des motifs (patterns) non préalablement identifiés / appris et donc nouveaux.Unsupervised algorithms (operating as "anomaly detection", the algorithm will detect patterns (patterns) not previously identified / learned and therefore new.

De plus, la possibilité d’apprentissage par renforcement (on parle aussi d’algorithme par renforcement) permet d’automatiser l’apprentissage au cours de l’utilisation du dispositif, le réseau neuronal affinant ses algorithmes en prenant comme données supplémentaires les comptes désignés comme des faux comptes.In addition, the possibility of reinforcement learning (also known as reinforcement algorithm) makes it possible to automate learning during the use of the device, the neural network refining its algorithms by taking as additional data the designated counts like fake accounts.

Le dispositif présente en outre une architecture stable, c'est-à-dire sans latence, où des milliers de comptes peuvent être récupérés en une seule fois. En effet, aujourd’hui, il existe énormément de restriction sur les API (sur le nombre de posts, nombre de consultations de compte ou encore sur le nombre de followers que l’on peut analyser sur des fenêtres de temps restreintes). Des scripts ont donc été conçus avec des fonctions «sleep» qui permettent de créer une file d’attente lorsque la limite est atteinte. L’avantage est de ne pas reconsulter deux fois le même compte, ce qui arriverait avec une sélection de comptes «random» (aléatoire) demandée deux fois par l’utilisateur.The device also has a stable architecture, that is to say without latency, where thousands of accounts can be recovered in one go. Indeed, today, there are a lot of restrictions on APIs (on the number of posts, number of account consultations or even on the number of followers that can be analyzed over limited time windows). Scripts have therefore been designed with “sleep” functions which allow a queue to be created when the limit is reached. The advantage is not to consult the same account twice, which would happen with a “random” (random) selection of accounts requested twice by the user.

Pour obtenir une architecture du dispositif «sans latence», les intermédiaires sont de préférence limités (appel, stockage, affichage, analyse). Il est aussi possible de jouer sur le stockage: stocker le moins de données possible pour rendre la lecture par l’interface plus rapide. Enfin l’utilisation de machines virtuelles de grande capacité permet d’obtenir une latence très réduite, voire inexistante.To obtain a “latency-free” device architecture, the intermediaries are preferably limited (call, store, display, analysis). It is also possible to play on the storage: store as little data as possible to make reading by the interface faster. Finally, the use of high-capacity virtual machines makes it possible to obtain very low or even non-existent latency.

Une des améliorations consiste à paralléliser les appels API et paralléliser la création des nouvelles variables puis la prédiction. Le premier point implique la possession de multiples tokens de connexion pour faire des appels sur plusieurs comptes différents en même temps.One of the improvements consists in parallelizing API calls and parallelizing the creation of new variables and then the prediction. The first point involves the possession of multiple connection tokens to make calls on several different accounts at the same time.

NomName DescriptionDescription CalculCalculation id_strid_str IdentifiantID screen_namescreen_name Pseudo identifiant le compteNickname identifying the account namename Nom de l’utilisateurUsername created_atcreated_at Date de création du compteAccount creation date descriptiondescription Biographie du compteAccount Biography followers_countfollowers_count Nombre de followersNumber of followers friends_countfriends_count Nombre de followingsNumber of followings statuses_countstatuses_count Nombre de tweets (retweets inclus)Number of tweets (including retweets) favourites_countfavourites_count Nombre de tweets «likés» par l’utilisateurNumber of tweets “liked” by the user account_ageaccount_age Age du compte en joursAccount age in days Date aujourd’hui – Date de créationDate today – Date created ff_ratioff_ratio Ratio entre le nb de followings et le carré du nb de followersRatio between the number of followings and the square of the number of followers friends_count / followers_count²friends_count / followers_count² reputationreputation Ratio entre le nb de followers et la somme du nb de followers et du nb de followingsRatio between the number of followers and the sum of the number of followers and the number of followings followers_count / (followers_count + friends_count)followers_count / (followers_count + friends_count) activityactivity Nombre moyen de tweets quotidiens depuis la création du compteAverage number of daily tweets since account creation statuses_count / age du comptestatuses_count / account age impactimpact Logorithme du nombre de followersLogorithm of the number of followers log(followers_count+1)log(followers_count+1) following_ratefollowing_rate Ratio entre le nb de followers et le nb de followingsRatio between the number of followers and the number of followings followers_count/friends_countfollowers_count/friends_count nb_url_descriptionnb_url_description Nombre d’urls dans la descriptionNumber of urls in the description nb_hashtag_descriptionnb_hashtag_description Nombre de hashtags dans la descriptionNumber of hashtags in the description alpha_ratio_screen_namealpha_ratio_screen_name Taux de caractère alpha (lettres) dans le pseudoAlpha character rate (letters) in nickname listed_countlisted_count Nombre de listes rattachées à ce compteNumber of lists attached to this account nb_namenb_name Nombre de termes dans le nom de l’utilisateurNumber of terms in username protectedprotected Compte non public (approve or denied)Non-public account (approve or denied) verifiedverified Compte certifié par Twitter (ensemble de critères)Account certified by Twitter (set of criteria) geo_enabledgeo_enabled Géolocalisation activeActive geolocation has_time_zonehas_time_zone Fuseau horaire définiTime zone set has_descriptionhas_description Présence d’une description (biographie)Presence of a description (biography) has_locationhas_location Présence d’une localisationPresence of a location has_urlhas_url L’utilisateur a renseigné une url dans le profil du compteThe user has entered a url in the account profile has_phone_nb_descriptionhas_phone_nb_description Présence de numéro de téléphone dans la bioPresence of phone number in the bio is_listedis_listed Appartenance à une listeMembership in a list

NomName DescriptionDescription CalculCalculation engagementcommitment Somme du nombre de likes et de retweets des nb_tweet extraits (uniquement les tweets de l’utilisateur)Sum of the number of likes and retweets of the extracted nb_tweet (user's tweets only) nb_tweetnb_tweet Nombre de Tweets extraitsNumber of Tweets retrieved n_langn_lang Nombre de langues utilisées dans les tweets extraitsNumber of languages used in extracted tweets mean_retweet_countmean_retweet_count Moyenne du nb de retweetsAverage number of retweets mean_favorite_countmean_favorite_count Moyenne du nb tweets «likés»Average number of “liked” tweets retweet_rateretweet_rate Taux de retweetsRetweet rate reply_ratereply_rate Taux de réponsesResponse rate tweet_ratetweet_rate Taux de tweetTweet rate quote_ratequote_rate Taux de citationQuote rate mean_urlmean_url Nb moyen d’URLsAverage number of URLs mean_hashtagmean_hashtag Nb moyen de hastagsAverage number of hashtags mean_mentionmean_mention Nb moyen de mentions (@)Average number of mentions (@) phone_nb_ratephone_nb_rate Taux de numéro de téléphone parmi les tweets extraitsPhone number rate among extracted tweets nb_tw_interval_inf_10snb_tw_interval_inf_10s Nb tweets avec une durée inf à 10sNb tweets with a duration less than 10s rate_tw_interval_inf_10srate_tw_interval_inf_10s Taux de tweet avec une durée inf à 10sTweet rate with duration less than 10s tweet_hour_ratetweet_hour_rate Taux de tweet par heure calculé sur les tweets extraitsTweet rate per hour calculated on extracted tweets similiraty_ratesimilarity_rate Taux de similarité moyen entre 2 tweets successifs (=> amélioration sur un l’ensemble des tweets extraits)Average similarity rate between 2 successive tweets (=> improvement over all the extracted tweets)

A titre d’exemple, et de façon non limitative, les tableaux Table 1 et Table 2 décrivent respectivement les variables User (Utilisateur) et Timeline (Ligne du temps, ou mur antéchronologique) pouvant être prises en compte par le réseau neuronal du dispositif de détection de bots sur le réseau social Twitter. Ainsi, le module d’analyse du réseau neuronal analyse des données issues du profil du compte, de son fil d’actualité, à la fois ses publications et ses interactions avec d’autres comptes du réseau social. Dans un mode de réalisation particulier, ces données sont récupérées par des API à partir de l’identifiant d’un compte, par exemple un pseudo. Des calculs sur les données sont susceptibles d’être réalisés pour obtenir des données plus complexes ou plus facilement exploitables. Les identifiants peuvent être envoyés individuellement ou sous forme de batch (liste).By way of example, and in a non-limiting way, the tables Table 1 and Table 2 respectively describe the variables User (User) and Timeline (Timeline, or antecronological wall) which can be taken into account by the neural network of the device of detection of bots on the Twitter social network. Thus, the neural network analysis module analyzes data from the account profile, its news feed, both its publications and its interactions with other social network accounts. In a particular embodiment, this data is retrieved by APIs from the identifier of an account, for example a nickname. Calculations on the data are likely to be performed to obtain more complex or more easily usable data. Credentials can be sent individually or as a batch (list).

Dans certains modes de réalisations, cet identifiant est envoyé au dispositif depuis une plateforme de requête client (6) qui comprend une interface (60) sur laquelle un client peut rentrer ledit identifiant et demander le statut de ce compte. La plateforme de requête client émet alors une requête de recherche comprenant l’identifiant du compte à vérifier. D’autres requêtes sont aussi possibles, telles que la vérification des comptes ayant publié sur une tendance particulière (un hashtag par exemple), avec ou sans critère de temps.In certain embodiments, this identifier is sent to the device from a customer request platform (6) which comprises an interface (60) on which a customer can enter said identifier and request the status of this account. The client request platform then issues a search request including the identifier of the account to be verified. Other requests are also possible, such as checking accounts that have published on a particular trend (a hashtag for example), with or without a time criterion.

La donnée peut par exemple être stockée en .csv dans le cloud.The data can for example be stored in .csv in the cloud.

La plateforme de requête (6) peut par exemple fonctionner avec Flask™ ou Shiny™, préférentiellement Shiny™.The request platform (6) can for example operate with Flask™ or Shiny™, preferably Shiny™.

Ainsi le dispositif et le procédé décrits se distinguent de l’art antérieur par le fait que les entrées et sorties (input – output) des algorithmes de l’art antérieur diffèrent du ou des algorithmes implémentés dans le réseau neuronal de la présente invention.Thus the device and the method described differ from the prior art in that the inputs and outputs (input – output) of the algorithms of the prior art differ from the algorithm or algorithms implemented in the neural network of the present invention.

En effet l’invention utilise les données suivantes:

  • Informations de création de compte
  • Informations basées sur la timeline / fil d’actualité
  • Des variables supplémentaires (par des calculs réalisés sur les données récupérées).
Indeed, the invention uses the following data:
  • Account creation information
  • Information based on the timeline / newsfeed
  • Additional variables (by calculations performed on the retrieved data).

Les différences de l’invention :
La base d’entrainement construite sur des bases existantes et des bases créées manuellement;
Les variables utilisées / créées (calculées);
La prise en compte des données de compte et données de fil d’actualité; L’agrégation de plusieurs algorithmes dans le réseau neuronal. En tout 8 algorithmes dans le dispositif ;
les sorties ou résultats spécifiques«Output»telles que : Humain, Robot, indéterminée et notamment permettant la lutte contre la désinformation.
The differences of the invention:
The training base built on existing bases and manually created bases;
The variables used / created (calculated);
Consideration of account data and newsfeed data; The aggregation of several algorithms in the neural network. In all 8 algorithms in the device;
the outputs or specific results "Output" such as: Human, Robot, indeterminate and in particular allowing the fight against misinformation.

La plus grande difficulté résolue par l’invention est d’avoir un modèle stable pour tous les bots (dans plusieurs domaines d’activité (marques de luxe, institutions françaises / européennes)) :
- marketing personnel
- vente de produits (vendors)
- diffusion des rumeurs, de désinformation
- diffusion de malwares
- spamming de contenus inappropriés
The biggest difficulty solved by the invention is to have a stable model for all bots (in several fields of activity (luxury brands, French / European institutions)):
- personal marketing
- sale of products (vendors)
- spreading rumours, misinformation
- distribution of malware
- spamming of inappropriate content

Ainsi quels que soit les domaines le dispositif a une architecture stable (sans latence, des milliers de comptes peuvent être récupéré en une seule fois) et permet de s’adapter à l’évolution technologique des bots par exemple en mettant à jour la base d’entraînement de façon régulière.Thus, whatever the domains, the device has a stable architecture (without latency, thousands of accounts can be recovered at once) and makes it possible to adapt to the technological evolution of bots, for example by updating the database. training on a regular basis.

On comprendra aisément à la lecture de la présente demande que les particularités de la présente invention, comme généralement décrits et illustrés dans les figures, puissent être arrangés et conçus selon une grande variété de configurations différentes. Ainsi, la description de la présente invention et les figures afférentes ne sont pas prévues pour limiter la portée de l'invention mais représentent simplement des modes de réalisation choisis.It will readily be understood from reading the present application that the features of the present invention, as generally described and illustrated in the figures, can be arranged and designed in a wide variety of different configurations. Thus, the description of the present invention and the accompanying figures are not intended to limit the scope of the invention but merely represent selected embodiments.

L’homme de métier comprendra que les caractéristiques techniques d’un mode de réalisation donné peuvent en fait être combinées avec des caractéristiques d’un autre mode de réalisation à moins que l’inverse ne soit explicitement mentionné ou qu’il ne soit évident que ces caractéristiques sont incompatibles. De plus, les caractéristiques techniques décrites dans un mode de réalisation donné peuvent être isolées des autres caractéristiques de ce mode à moins que l’inverse ne soit explicitement mentionné.Those skilled in the art will understand that the technical characteristics of a given embodiment can in fact be combined with characteristics of another embodiment unless the reverse is explicitly mentioned or it is obvious that these characteristics are incompatible. Moreover, the technical characteristics described in a given embodiment can be isolated from the other characteristics of this mode unless the reverse is explicitly mentioned.

Il doit être évident pour les personnes versées dans l’art que la présente invention permet des modes de réalisation sous de nombreuses autres formes spécifiques sans l’éloigner du domaine défini par la portée des revendications jointes, ils doivent être considérés à titre d'illustration et l’invention ne doit pas être limitée aux détails donnés ci-dessus.It should be apparent to those skilled in the art that the present invention permits embodiments in many other specific forms without departing from the scope defined by the scope of the appended claims, they should be considered by way of illustration and the invention should not be limited to the details given above.


1. Dispositif de détection de faux comptes
2. Module d’extraction
21. API d’extraction de données (profils et timelines)
3. Base de données en nuage (cloud)
4. Module de prédiction
41. Réseau neuronal artificiel
5. Module JSON
6. Plateforme de requête client
60. Interface
61. Module de requête
10.
11. Réseaux sociaux
12. Plateforme d’écoute sociale

1. Device for detecting fake accounts
2. Extraction module
21. Data extraction API (profiles and timelines)
3. Cloud database (cloud)
4. Prediction module
41. Artificial Neural Network
5. JSON module
6. Customer Query Platform
60. Interface
61. Query Module
10.
11. Social networks
12. Social Listening Platform

Claims (16)

Dispositif (1) de détection de faux comptes sur des réseaux sociaux (11), le dispositif (1) comprenant au moins des modules de codes exécutables sur un ou plusieurs composants hardware de traitement tels qu’un microprocesseur, et une base de données (3), le dispositif (1) étant caractérisée en ce qu’il comprend:
  • Un module d’extraction (2) connecté au réseau internet et comprenant, ou configuré pour faire appel à, des API (21) pour extraire des données desdits comptes à vérifier,
  • Un module de prédiction comprenant au moins un ensemble de codes formant un ou plusieurs programmes, le(s) programme(s) implémentant un réseau neuronal artificiel (4) constituant un modèle d’apprentissage automatique, de préférence par des modèles supervisés ou non supervisés, configuré pour analyser lesdites données extraites desdits comptes pour réaliser des prédictions pour fournir des informations sur la véracité d’un compte, une liste des faux comptes sur un hashtag / keyword ou une liste des faux followers, abonnés en français, d’un compte, le réseau neuronal artificiel (4) étant entrainé sur des données de faux comptes pour détecter des motifs, la prédiction étant basée sur les motifs détectés dans les données desdits faux comptes,
et en ce que les données extraites sont des données concernant le compte de l’utilisateur, ses publications, ses interactions avec d’autres membres du réseau social et/ou sa ligne de temps.
Device (1) for detecting fake accounts on social networks (11), the device (1) comprising at least code modules executable on one or more processing hardware components such as a microprocessor, and a database ( 3), the device (1) being characterized in that it comprises:
  • An extraction module (2) connected to the Internet network and comprising, or configured to call on, APIs (21) to extract data from said accounts to be verified ,
  • A module of prediction comprising at least one set of codes forming one or more programs, the program(s) implementing an artificial neural network (4) constituting an automatic learning model, preferably by supervised or unsupervised models, configured to analyze said data extracted from said accounts to make predictions to provide information on the veracity of an account, a list of fake accounts on a hashtag / keyword or a list of fake followers, subscribers in French, of an account, the network artificial neural (4) being trained on fake count data to detect patterns, the prediction being based on the detected patterns in said fake count data,
and in that the data extracted is data concerning the user's account, his publications, his interactions with other members of the social network and/or his timeline.
Dispositif (1) selon la revendication précédente, dans lequel le dispositif (1) comprend en outre un module de réception de coordonnées d’un compte à vérifier ou d’une liste de comptes à vérifier d’un ou plusieurs réseaux sociaux (11).Device (1) according to the preceding claim, in which the device (1) further comprises a module for receiving contact details of an account to be verified or of a list of accounts to be verified from one or more social networks (11) . Dispositif (1) selon l’une quelconque des revendications précédentes, dans lequel le réseau neuronal artificiel est entrainé, de façon automatisée, sur des données de faux comptes d’au moins une base de données, préférentiellement de la base de données (3) du dispositif (1), les données des faux comptes étant classées manuellement à partir de comptes déjà identifiés comme étant des faux comptes.Device (1) according to any one of the preceding claims, in which the artificial neural network is trained, in an automated manner, on data of false accounts from at least one database, preferably from the database (3) of the device (1), the data of the false accounts being classified manually from accounts already identified as being false accounts. Dispositif (1) selon l’une quelconque des revendications précédentes, comprenant en outre un module d’enregistrement pour conserver les données desdits comptes à vérifier et faux comptes dans la base de données (3) du dispositif (1).Device (1) according to any one of the preceding claims, further comprising a registration module for storing the data of said accounts to be verified and false accounts in the database (3) of the device (1). Dispositif (1) selon l’une quelconque des revendications précédentes, dans lequel le dispositif (1) comprend en outre une plateforme de requête client (6) comprenant une interface (60) et un module de requête (61) configuré pour émettre une requête de comptes à vérifier comprenant au moins un identifiant de compte à vérifier que le module d’extraction traite pour extraire les données dudit compte.Device (1) according to any one of the preceding claims, in which the device (1) further comprises a client request platform (6) comprising an interface (60) and a request module (61) configured to issue a request of accounts to be verified comprising at least one account identifier to be verified that the extraction module processes to extract the data from said account. Dispositif (1) selon l’une quelconque des revendications précédentes, dans lequel le module d’extraction (2) est apte à extraire des données envoyées d’une plateforme d’écoute sociale (12) à partir d’une liste de comptes à vérifier, de préférence en mode batch.Device (1) according to any one of the preceding claims, in which the extraction module (2) is able to extract data sent from a social listening platform (12) from a list of accounts to check, preferably in batch mode. Dispositif (1) selon l’une quelconque des revendications précédentes dans lequel le module prend en compte les données des faux comptes supplémentaires détectés et enregistrés dans la base de données (3) du dispositif (1), pour améliorer ses prédictions.Device (1) according to any one of the preceding claims, in which the module takes into account the data of the additional fake accounts detected and recorded in the database (3) of the device (1), to improve its predictions. Dispositif (1) selon l’une quelconque des revendications précédentes dans lequel le dispositif (1) comprend en outre un module statistique configuré pour extraire, trier et/ou présenter les données issues des comptes détectés.Device (1) according to any one of the preceding claims, in which the device (1) further comprises a statistics module configured to extract, sort and/or present the data from the detected accounts. Dispositif (1) selon l’une quelconque des revendications précédentes dans lequel le dispositif (1) comprend en outre un module émetteur configuré pour envoyer les résultats de l’analyse, la liste de comptes analysées ou des données liées aux comptes à vérifier à un destinataire à distance.Device (1) according to any one of the preceding claims, in which the device (1) further comprises a transmitter module configured to send the results of the analysis, the list of accounts analyzed or data related to the accounts to be verified to a remote recipient. Dispositif (1) selon l’une quelconque des revendications précédentes dans lequel les prédictions du module de prédiction sont réalisées au moins en partie en fonction des résultats issus des données déjà présentes dans la base de données (3).Device (1) according to any one of the preceding claims, in which the predictions of the prediction module are made at least in part according to the results from the data already present in the database (3). Dispositif (1) selon l’une quelconque des revendications précédentes, dans lequel un générateur aléatoire d’identifiants de comptes à vérifier permet la réalisation de prédictions sur des comptes choisis aléatoirement sans que ledit module d’extraction (2) dispose d’une liste de comptes à vérifier.Device (1) according to any one of the preceding claims, in which a random generator of account identifiers to be verified allows predictions to be made on randomly chosen accounts without said extraction module (2) having a list accounts to verify. Plateforme d’écoute sociale (12), comprenant un logiciel d’écoute sociale (12) apte à réaliser des calculs sur des données du réseau social afin de mettre en évidence des tendances, ou de récupérer des résultats qualitatifs ou quantitatifs, la plateforme d’écoute sociale (12) étant caractérisée en ce qu’elle comprend ou communique en outre avec un module JSON (5) JavaScript Object Notation (JSON) traduisant le format internet en un format de données textuelles dérivé de la notation des objets du langage JavaScript adapté au dispositif (1) de détection de faux comptes sur des réseaux sociaux (11) selon l’une quelconque des revendications précédentes, la plateforme étant apte à faire abstraction ou à se concentrer sur des données des faux comptes présents dans la base de données (3) du dispositif (1).Social listening platform (12), comprising social listening software (12) capable of performing calculations on data from the social network in order to highlight trends, or to retrieve qualitative or quantitative results, the social listening (12) being characterized in that it further comprises or communicates with a JavaScript Object Notation (JSON) JSON (5) module translating the internet format into a textual data format derived from the JavaScript language object notation adapted to the device (1) for detecting false accounts on social networks (11) according to any one of the preceding claims, the platform being capable of disregarding or of concentrating on data from the false accounts present in the database (3) of the device (1). Procédé de détection de faux comptes sur des réseaux sociaux (11) par un dispositif (1) selon l’une quelconque des revendications 1 à 11, dans lequel le procédé comprend les étapes suivantes:
  • Extraction de données d’un compte à vérifier par le module d’extraction (2) à partir de coordonnées de compte à vérifier, d’une liste de comptes à vérifier ou de comptes choisis aléatoirement;
  • Pré-traitement des données et optionnellement calcul de variables supplémentaires,
  • Traitement des données par le réseau neuronal pré-entrainé du module de prédiction pour réaliser des prédictions pour fournir des informations sur la véracité d’un compte, une liste des faux comptes sur un hashtag / keyword ou une liste des faux followers, abonnés en français, d’un compte ;
  • Ajout de la prédiction du compte auxdites données et enregistrement et historisation des données dans la base de données (3) du dispositif (1) par le module d’enregistrement.
Method for detecting fake accounts on social networks (11) by a device (1) according to any one of claims 1 to 11, in which the method comprises the following steps:
  • Extraction of data from an account to be verified by the extraction module (2) from coordinates of account to be verified, from a list of accounts to be verified or from randomly chosen accounts;
  • Pre-processing of data and optional calculation of additional variables,
  • Data processing by the pre-trained neural network of the prediction module to make predictions to provide information on the veracity of an account, a list of fake accounts on a hashtag / keyword or a list of fake followers, subscribers in French , of an account;
  • Addition of the prediction of the account to said data and recording and archiving of the data in the database (3) of the device (1) by the recording module.
Procédé de détection de faux comptes selon la revendication précédente, dans lequel le procédé comprend une étape supplémentaired’analyse statistique, de tri et/ou de présentation desdites données analysées par le module statistique.Method for detecting false accounts according to the preceding claim, in which the method comprises an additional step of statistical analysis, sorting and/or presentation of said data analyzed by the statistics module. Procédé de détection de faux comptes selon l’une quelconque des revendications 13 ou 14, dans lequel le procédé comprend une étape supplémentaire:
  • Création d’une requête par un client sur une plateforme de requête client, par l’intermédiaire d’une interface (60) et d’un module de requête (61)
  • Envoi de ladite requête par le module de requête (61) au module de réception du dispositif de détection (1)
  • Réception par le module de réception, de coordonnées de compte à vérifier ou d’une liste de comptes à vérifier, puis envoi desdites coordonnées de compte à vérifier ou de ladite liste de comptes à vérifier au module d’extraction (2).
A method of detecting fake accounts according to any one of claims 13 or 14, wherein the method comprises an additional step:
  • Creation of a request by a customer on a customer request platform, via an interface (60) and a request module (61)
  • Sending of said request by the request module (61) to the reception module of the detection device (1)
  • Received by the module of receipt, account details to be verified or a list of accounts to be checked, then sending said account details to be checked or said list of accounts to be checked to the extraction module (2).
Procédé de détection de faux comptes selon l’une quelconque des revendications 13 à 15, dans lequel le procédé comprend en outre une étape d’entrainement sur la base de données (3) actualisée, suite à l’enregistrement des données du ou des nouveaux comptes analysés.Method for detecting false accounts according to any one of Claims 13 to 15, in which the method also comprises a step of training on the updated database (3), following the recording of the data of the new analyzed accounts.
FR1914568A 2019-12-17 2019-12-17 Device for detecting fake accounts on social networks Active FR3104781B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1914568A FR3104781B1 (en) 2019-12-17 2019-12-17 Device for detecting fake accounts on social networks

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1914568A FR3104781B1 (en) 2019-12-17 2019-12-17 Device for detecting fake accounts on social networks
FR1914568 2019-12-17

Publications (2)

Publication Number Publication Date
FR3104781A1 true FR3104781A1 (en) 2021-06-18
FR3104781B1 FR3104781B1 (en) 2023-04-07

Family

ID=70613928

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1914568A Active FR3104781B1 (en) 2019-12-17 2019-12-17 Device for detecting fake accounts on social networks

Country Status (1)

Country Link
FR (1) FR3104781B1 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010143152A2 (en) 2009-06-10 2010-12-16 Site Black Box Ltd Identifying bots
US20110131652A1 (en) 2009-05-29 2011-06-02 Autotrader.Com, Inc. Trained predictive services to interdict undesired website accesses
US20150082448A1 (en) * 2012-03-22 2015-03-19 Ben Gurion University Of The Negev Research & Development Authority Method for Detecting Spammers and Fake Profiles in Social Networks
US20180152465A1 (en) 2016-11-28 2018-05-31 Microsoft Technology Licensing, Llc. Detection of botnets using command-and-control access patterns
WO2019063389A1 (en) 2017-09-29 2019-04-04 Netacea Limited Method of processing web requests directed to a website
US10333964B1 (en) * 2015-05-29 2019-06-25 Microsoft Technology Licensing, Llc Fake account identification

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110131652A1 (en) 2009-05-29 2011-06-02 Autotrader.Com, Inc. Trained predictive services to interdict undesired website accesses
WO2010143152A2 (en) 2009-06-10 2010-12-16 Site Black Box Ltd Identifying bots
US20150082448A1 (en) * 2012-03-22 2015-03-19 Ben Gurion University Of The Negev Research & Development Authority Method for Detecting Spammers and Fake Profiles in Social Networks
US10333964B1 (en) * 2015-05-29 2019-06-25 Microsoft Technology Licensing, Llc Fake account identification
US20180152465A1 (en) 2016-11-28 2018-05-31 Microsoft Technology Licensing, Llc. Detection of botnets using command-and-control access patterns
WO2019063389A1 (en) 2017-09-29 2019-04-04 Netacea Limited Method of processing web requests directed to a website

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ESTEE VAN DER WALT ET AL: "Using Machine Learning to Detect Fake Identities: Bots vs Humans", IEEE ACCESS, vol. 6, 1 January 2018 (2018-01-01), USA, pages 6540 - 6549, XP055712496, ISSN: 2169-3536, DOI: 10.1109/ACCESS.2018.2796018 *

Also Published As

Publication number Publication date
FR3104781B1 (en) 2023-04-07

Similar Documents

Publication Publication Date Title
US10867221B2 (en) Computerized method and system for automated determination of high quality digital content
US20150120583A1 (en) Process and mechanism for identifying large scale misuse of social media networks
US9384258B1 (en) Identifying top fans
Sahoo et al. Fake profile detection in multimedia big data on online social networks
US20220198152A1 (en) Generating hypotheses in data sets
Bandaragoda et al. Automatic event detection in microblogs using incremental machine learning
CN103488947A (en) Method and device for identifying instant messaging client-side account number stealing Trojan horse program
US10185898B1 (en) Image processing including streaming image output
US20240056472A1 (en) System and method for risk evaluation and reputational scoring of social media accounts
US20150235138A1 (en) System, method, and storage medium for generating hypotheses in data sets
Wang et al. Detection of compromised accounts for online social networks based on a supervised analytical hierarchy process
Boparai et al. Detection of fake profiles in online social networks–a survey
CN116723005A (en) Method and system for tracking malicious code implicit information under polymorphic hiding
FR3104781A1 (en) Device for detecting fake accounts on social networks
Abdulrahman et al. Multi agent system for historical information retrieval from online social networks
WO2018015515A1 (en) Methods for opinion sharing, computer programs and hardware for implementing methods
Mukunthan et al. Spam detection and spammer behaviour analysis in Twitter using content based filtering approach
Yang et al. Characteristics and prevalence of fake social media profiles with AI-generated faces
Roshini et al. An efficient SecureU application to detect malicious applications in social media networks
Geeta et al. Big data analytics for detection of frauds in matrimonial websites
Lamba Modeling User Behavior on Socio-Technical Systems: Patterns and Anomalies
WO2024072457A1 (en) Technologies for privacy search and remediation
Sohrabi et al. A clustering based feature selection approach to detect spam in social networks
Takagiwa et al. Local Trend Detection from Network Traffic Using a Topic Model and Network Router
Fatema et al. Recent advances in artificial intelligence techniques for identifying fake accounts: a review

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20210618

PLFP Fee payment

Year of fee payment: 3

TP Transmission of property

Owner name: BULL SAS, FR

Effective date: 20220504

PLFP Fee payment

Year of fee payment: 4

PLFP Fee payment

Year of fee payment: 5