WO2014101706A1 - 一种用户生成内容提及的骚扰屏蔽方法、装置和系统 - Google Patents

一种用户生成内容提及的骚扰屏蔽方法、装置和系统 Download PDF

Info

Publication number
WO2014101706A1
WO2014101706A1 PCT/CN2013/089931 CN2013089931W WO2014101706A1 WO 2014101706 A1 WO2014101706 A1 WO 2014101706A1 CN 2013089931 W CN2013089931 W CN 2013089931W WO 2014101706 A1 WO2014101706 A1 WO 2014101706A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
generated content
publishing request
harassment
determine whether
Prior art date
Application number
PCT/CN2013/089931
Other languages
English (en)
French (fr)
Inventor
江兴才
黄利华
田明
Original Assignee
腾讯科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 腾讯科技(深圳)有限公司 filed Critical 腾讯科技(深圳)有限公司
Publication of WO2014101706A1 publication Critical patent/WO2014101706A1/zh
Priority to US14/750,663 priority Critical patent/US10320729B2/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Definitions

  • Embodiments of the present invention relate to the field of Internet application technologies, and more particularly, to a method, apparatus, and system for attenuation screening mentioned by a user-generated content. Background of the invention
  • UGC User-generated content
  • Microblog is a typical UGC application. It is a platform for information sharing, dissemination and acquisition based on user relationships. Users can use short words (usually 140 words) on Weibo through various terminals. Publish what people think, do, and share information instantly. Weibo is a new way for users to share and spread information on the Internet. Due to the characteristics of Weibo's weak relationship chain, Weibo's message transmission is very fast, which also attracts many users to post some news on Weibo that is not conducive to the ecological development of Weibo, such as broadcasting and commenting on celebrities. The message is accompanied by your own advertisement.
  • the action taken in the user-generated content service refers to the post-processing strategy, that is, only when the user complains that an account is maliciously mentioned, the audited person determines whether the account has caused other users. Harassment, if the confusation is confirmed, the harassment account number is banned or sealed according to the severity.
  • Embodiments of the present invention provide an interference rejection masking method mentioned by a user-generated content to improve processing efficiency of user-generated content referring to interference detection.
  • Embodiments of the present invention provide an interference rejection shielding device mentioned by a user-generated content to improve processing efficiency of user-generated content referring to interference.
  • the embodiment of the present invention proposes an interference rejection shielding system mentioned by the user generated content to improve the processing efficiency of the user generated content referring to the interference.
  • a method for harassing shielding mentioned by user-generated content comprising:
  • a disturbance masking device mentioned by a user-generated content comprising a user-generated content publication request receiving unit, a user-generated content analysis unit, and an interference detection processing unit, wherein: a user-generated content publication request receiving unit, configured to receive user-generated content a user-generated content reference processing unit, configured to parse the user-generated content publishing request to determine whether the reference object is included;
  • the interference processing unit is configured to: when the user-generated content analysis unit determines that the reference object is included, further determine whether the user-generated content publishing request satisfies a pre-set disturbance determination condition, and if not, generate the content publishing request for the user The message content is sent to the mentioned object.
  • An interference rejection shielding system mentioned in the user generated content comprising a terminal and a server, wherein: the terminal is configured to generate user generated content, and send a user generated content publishing request to the server;
  • a server configured to parse the user-generated content publishing request to determine whether the reference object is included, and when determining that the reference object is included, further determining whether the user-generated content publishing request satisfies a preset harassment determination condition, and if yes, The message content of the user-generated content publishing request is not sent to the referenced object.
  • a storage medium storing a computer program for performing the following method:
  • the receiving user generates And submitting the request; parsing the user-generated content publishing request to determine whether the reference object is included, and when determining that the reference object is included, further determining whether the user-generated content publishing request satisfies a preset interference determination determination condition, and if satisfied, Then, the content of the message of the user-generated content publishing request is not sent to the referenced object.
  • an intelligent screening strategy for user-generated content mentioning interference is implemented, and the reference to the interference can be intelligently shielded before the microblog is published.
  • the embodiment of the present invention overcomes the defects of the prior art after-the-fact processing, realizes the pre-processing for referring to the user-generated content, and improves the real-time processing of the user-generated content referring to the interference detection, and improves the user-generated content. And the processing efficiency of the interference.
  • the embodiment of the present invention implements automatic shielding for user-generated content mentioning interference, overcomes the defects of manual auditing in the prior art, and saves operating costs, and the embodiment of the present invention integrates message body content, user characteristics, and The three large dimensions of the relationship chain increase the accuracy of the composite score, and each score can be adjusted to adapt to the ever-changing malicious referral model, thereby improving the overall message of user-generated content (such as Weibo). Quality, and improved processing efficiency for user-generated content mentioning interference.
  • FIG. 1 is a schematic diagram of processing referred to in the prior art
  • FIG. 2 is a flow chart of a user-generated content reference disturbance masking method according to an embodiment of the present invention
  • FIG. 3 is a schematic diagram of message content evaluation according to an embodiment of the present invention.
  • FIG. 4 is a schematic diagram of initiating user feature evaluation according to an embodiment of the present invention.
  • FIG. 5 is a structural chain evaluation of an initiating user and a referenced object according to an embodiment of the present invention. Estimate the schematic;
  • FIG. 6 is a structural diagram of a user-generated content reference disturbance rejection device according to an embodiment of the present invention.
  • FIG. 7 is a structural diagram of a user-generated content-referencing disturbance masking system in accordance with an embodiment of the present invention. Mode for carrying out the invention
  • FIG. 1 is a schematic diagram of processing referred to in the prior art for interference detection.
  • the complaint review module determines whether the account B has caused an interference check on user A. If the interference is confirmed, the account is banned according to the severity or The title is processed.
  • this solution relies on user feedback, many users do not know or are unwilling to feedback.
  • the complaint review module is manually audited and has low work efficiency.
  • an account may be exchanged to continue the malicious referral operation, and the harassed user is forced to receive a lot of harassment. Not only that, the processing cycle of the prior art is very long, and after the malicious user B is banned, the user A can It has been tested for a long time, and the effect is not obvious.
  • a smart screening strategy in which user generated content refers to interference is proposed.
  • the embodiment of the present invention integrates multiple multi-dimensional message features and user features, and can accurately and accurately determine whether a message is harassing to a user in real time, and then actively block the message before it enters the user's inbox. .
  • FIG. 2 is a flow chart of a disturbance masking method referred to by user generated content in accordance with an embodiment of the present invention.
  • the method includes:
  • Step 201 Receive a user generated content publishing request.
  • the method of the present invention first receives the user generated content publishing request.
  • Users can issue various types of user-generated content publishing requests in a variety of ways.
  • users can make user-generated content publishing requests on terminals such as feature phones, smartphones, PDAs, personal computers (PCs), tablets, or personal digital assistants (PDAs).
  • Operating systems can be installed on these terminals, including but not limited to: Windows operating system, LINUX operating system, Android operating system, Symbian operating system, Windows mobile operating system, and i OS operating system.
  • the user-generated content publishing request may specifically include forwarding a user-generated content posting request, commenting a user-generated content posting request, an original user-generated content publishing request, and the like.
  • the user-generated content publishing request may specifically include, but is not limited to, a community network publishing request, a video sharing publishing request, a microblog publishing request, or a blog publishing request, and the like.
  • Step 202 Parsing the user-generated content publishing request to determine whether the reference object is included, and when determining that the reference object is included, further determining whether the user-generated content publishing request satisfies a preset interference determination condition, and if yes, The message content of the user-generated content publishing request is not sent to the referenced object.
  • the user-generated content posting request is first parsed to determine whether or not the referenced object is included. For example: In the content of the Weibo message body, the "@" symbol is sometimes used to follow the user's account name, and the user's account name is the reference object. Therefore, in the embodiment of the present invention, it can be judged whether or not there is a reference object by judging whether or not the "@" symbol is present. If the user-generated content posting request is not blocked, the specific content of the user-generated content publishing request will automatically enter the inbox of the referenced object.
  • the user-generated content posting request When it is determined that the referenced object is included, it is further determined whether the user-generated content posting request satisfies a pre-set disturbance determination condition, and if so, the message content of the user-generated content posting request is not transmitted to the referenced object.
  • multiple multi-dimensional message features and user features can be integrated to accurately determine whether a message poses harassment to a reference object in real time, and then actively before the message enters the inbox of the reference object. Block it.
  • the preset interference determination determination condition may be: an interference determination determination condition determined based on a message content feature.
  • the message content feature of the user-generated content publishing request is first parsed, and it is determined whether the message content feature of the user-generated content publishing request satisfies the preset interference detection determination condition.
  • the harassment determination condition determined based on the message content feature may specifically include at least one of the following: determining whether the message content of the user-generated content publishing request includes a uniform resource locator (URL); determining the message that the user generates the content publishing request Whether the content involves a topic; determining whether the message content of the user-generated content publishing request is forwarding or commenting; determining whether the message content of the user-generated content publishing request is original; determining that the user generates Whether the content of the message of the content publishing request includes a preset blacklist vocabulary; or whether the content of the message of the user-generated content publishing request is published in a third-party application, and the like.
  • FIG. 3 is a schematic diagram of message content evaluation according to an embodiment of the present invention. For example:
  • the message content of the user-generated content publishing request includes a URL
  • the message content is published in a third-party application
  • the message content is forwarded or commented
  • the message content of the user-generated content publishing request includes a preset blacklist vocabulary It is considered that the user-generated content posting request is more likely to be an interference check.
  • the scores may be respectively set for the plurality of the interference determination conditions determined based on the message content features, and then the total scores of all the disturbance determination conditions determined based on the message content characteristics are collectively summed, and based on the total scores and presets
  • the predetermined threshold value based on the message content feature is compared to determine whether the interference is formed, and when the disturbance is constituted, the message content of the user-generated content publishing request is not sent to the reference object.
  • the conditions are determined, and the score value of each of the disturbance determination conditions is preferably dynamically adjustable to be able to adapt to the ever-changing malicious reference to the disturbance model.
  • FIG. 4 is a schematic diagram of an evaluation of an initiating user feature in accordance with an embodiment of the present invention.
  • the preset interference determination determination condition may specifically be: based on the disturbance determination condition determined by the user feature.
  • the originating user feature of the user-generated content publishing request is first parsed, and it is determined whether the initiating user feature of the user-generated content publishing request satisfies the pre-set harassment determination condition.
  • the harassment determination condition includes: determining whether the originating user of the user-generated content publishing request has a message blocked within a predetermined time; and/or determining whether the number of references of the originating user of the user-generated content publishing request within a predetermined time is Exceeded the preset number of reference thresholds.
  • the originating user of the user-generated content publishing request When the originating user of the user-generated content publishing request has a message blocked within a predetermined time, the originating user of the user-generated content publishing request may be considered to have a greater possibility of harassing the user, so the current user-generated content publishing request has It may be the interference detection; when it is determined that the user refers to the threshold value, the originating user of the user-generated content publishing request may be considered to have a greater possibility of harassing the user, so the current user-generated content publishing request may be harassment. .
  • a score may be separately set for each of the plurality of interference determination determination conditions determined based on the initiating user feature, and then all the total scores based on the interference determination conditions determined by the initiating user feature are collectively summed, and based on the total score and the advance Set the threshold based on the characteristics of the initiating user
  • the comparison is to determine whether or not the interference is formed, and when the disturbance is constituted, the content of the message of the user-generated content posting request is not transmitted to the referenced object.
  • the disturbance determination conditions can be added and deleted, and the score value of each of the disturbance determination conditions is preferably dynamically adjustable, thereby being able to adapt to the ever-changing malicious reference to the disturbance model.
  • FIG. 5 is a schematic diagram of relationship chain feature evaluation of an initiating user and a reference object according to an embodiment of the present invention.
  • the pre-set interference determination conditions are: an interference determination decision condition determined based on initiating a user relationship chain feature and referring to an object relationship chain feature.
  • the originating user relationship chain feature and the reference object relationship chain feature of the user generated content publishing request are parsed, and it is determined whether the originating user relationship chain feature and the reference object relationship chain feature of the user generated content publishing request satisfy the advance Set the disturbance determination condition.
  • the interference determination determination condition includes: determining whether the referenced object listens to the originating user of the user-generated content publishing request; determining whether the originating user of the user-generated content publishing request listens to the referenced object; determining whether the referenced object is Authenticating the user; determining whether the listener of the referenced object exceeds a preset threshold number of listeners; determining whether the originating user of the user-generated content publishing request is an authenticated user; or determining that the user-generated content publishing request may be directed to A comprehensive determination of various factors is performed based on the interference determination conditions determined by initiating the user relationship chain feature and referring to the object relationship chain feature. For example:
  • the scores may be respectively set for the plurality of the interference determination determination conditions determined based on the initiating user relationship chain feature and the reference object relationship chain feature, and then the overall summation is determined based on the initiating user relationship chain feature and the reference object relationship chain feature.
  • the total score of the interference determination decision condition and based on the total score value compared with a preset threshold value based on the characteristics of the originating user relationship chain and the reference object relationship chain, to determine whether or not the interference is formed, and
  • the disturbance determination condition can be added and deleted, and the score value of each disturbance determination condition is preferably dynamically adjustable, thereby being able to adapt to the constantly changing malicious reference model.
  • the originating user of the user-generated content publishing request refers to the referring object, but the referring object listens to the originating user of the user-generated content publishing request, and the possibility that the message is harassment is low, therefore, And the decision condition of the originating user who listens to the user-generated content publishing request is set to a sufficiently large negative score to ensure that the final total score does not exceed the masking threshold.
  • the above is a detailed list of features based on the originating user relationship chain and the characteristics of the reference object relationship chain.
  • a specific example of the determined disturbance determination condition, and an exemplary description of whether or not the interference determination condition is determined based on the plurality of initiating user relationship chain characteristics and the reference object relationship chain characteristics, may constitute an exemplary description of whether the interference is performed, and those skilled in the art may It is to be understood that the examples are not intended to be limiting
  • the message content feature, the originating user feature and the initiating user relationship chain feature, and the reference object relationship chain feature may also be comprehensively determined, and the three major interference determination conditions are used to determine whether the interference is formed as a whole.
  • the pre-set interference determination determination condition may specifically include: weighting the determined disturbance determination condition based on at least two of the message content feature, the initiating user feature, and the initiating user relationship chain feature and referring to the object relationship chain feature.
  • the overall weight determines whether the overall weight meets the preset overall weight threshold.
  • the interference determination condition may be determined based on two weights of the message content feature and the initiating user feature; or the user relationship chain feature and the reference object relationship chain feature may be initiated based on the message content feature to determine the disturbance determination condition;
  • the disturbance determination condition may be determined based on two weights of the message content feature and the originating user relationship chain feature and the reference object relationship chain feature.
  • the interference determination condition based on the message content feature, the plurality of the adjacency determination conditions based on the initiating user feature, the plurality of initiating user relationship chain features, and the reference object relationship chain feature may be determined.
  • Each of the scores is separately set, and then the total score of the disturbance determination conditions determined by all of these features is summed as a whole, and based on the total score and the preset overall threshold value, to determine whether or not to constitute
  • the interference is detected, and when the disturbance is constituted, the content of the message of the user-generated content posting request is not transmitted to the referenced object.
  • the disturbance determination condition can be added and deleted, and the score value of each disturbance determination condition is preferably dynamically adjustable, so as to be able to adapt to the ever-changing malicious reference harassment mode. Type.
  • the embodiment of the present invention also proposes an interference rejection shielding device proposed by user generated content.
  • Figure 6 is a block diagram of a disturbance masking device referred to by user generated content in accordance with an embodiment of the present invention.
  • the apparatus includes a user generated content posting request receiving unit 601, a user generated content analyzing unit 602, and a disturbance processing unit 603, wherein:
  • a user-generated content publishing request receiving unit 601 configured to receive a user-generated content publishing request
  • a user-generated content parsing unit 602 configured to parse the user-generated content publishing request to determine whether the reference object is included;
  • the harassment processing unit 603 is configured to: when the user-generated content analysis unit determines that the reference object is included, further determine whether the user-generated content publishing request satisfies a pre-set spoofing determination condition, and if not, generate the content publishing request for the user The message content is sent to the mentioned object.
  • the preset interference determination determination condition is: an interference determination condition determined based on a message content feature
  • the harassment processing unit 603 is configured to parse the message content feature of the user-generated content publishing request, and determine whether the message content feature of the user-generated content publishing request satisfies the pre-set harassment determination condition.
  • the interference determination determination condition includes at least one of: determining whether the message content of the user-generated content publishing request includes a uniform resource locator; determining whether the message content of the user-generated content publishing request relates to a topic; determining the user-generated content Whether the content of the message of the published request is forwarded or commented; determining whether the content of the message of the user-generated content publishing request is original; determining whether the content of the message of the user-generated content publishing request includes a preset Blacklist vocabulary; or determine whether the message content of the user-generated content publishing request is published in a third-party application.
  • the preset interference determination determination condition is: an interference determination determination condition determined based on the initiating user feature;
  • the harassment processing unit 603 is configured to parse the originating user feature of the user-generated content publishing request, and determine whether the originating user feature of the user-generated content publishing request satisfies the pre-set harassment determination condition.
  • the interference determination decision condition includes at least one of the following: determining whether the originating user of the user-generated content posting request has a message blocked within a predetermined time; or determining the user-specified number of reference thresholds.
  • the preset interference determination determination condition is: an interference determination determination condition determined based on initiating a user relationship chain feature and referring to an object relationship chain feature;
  • the harassment processing unit 603 is configured to parse the originating user relationship chain feature and the reference object relationship chain feature of the user-generated content publishing request, and determine the originating user relationship chain feature and the reference object relationship chain feature of the user-generated content publishing request. Whether the pre-set disturbance determination condition is satisfied.
  • the disturbance determination condition includes at least one of the following:
  • Determining whether the referenced object listens to the originating user of the user-generated content publishing request determining whether the originating user of the user-generated content publishing request listens to the referenced object; determining whether the referenced object is an authenticated user; determining the referenced object Whether the audience exceeds a preset threshold number of listeners; determining whether the originating user of the user-generated content publishing request is an authenticated user; or determining whether the listener of the originating user of the user-generated content publishing request exceeds a predetermined number of listeners Limit.
  • the preset interference determination determination conditions include: based on message content characteristics, At least two of the user characteristics and the initiating user relationship chain characteristics and the reference object relationship chain characteristics, the weighted determination of the disturbance determination condition;
  • the interference detection processing unit 603 includes a message content feature evaluation sub-unit 6031, an initiation user feature evaluation sub-unit 6032, a relationship chain evaluation sub-unit 6033, and an overall evaluation sub-unit 6034.
  • the message content feature evaluation sub-unit 6031 is configured to calculate the user-generated content. Publish the message content feature value of the request;
  • An initiating user feature judging sub-unit 6032 configured to calculate an initiating user feature value of the user-generated content publishing request
  • a relationship chain evaluation sub-unit 6033 configured to calculate a feature value of the originating user relationship chain and referring to an object relationship chain;
  • the overall evaluation sub-unit 6034 is configured to perform weighted calculation on the at least two of the feature value of the originating user relationship chain and the reference object relationship chain, the message content feature value, and the initiating user feature value, to obtain an overall evaluation value, and determine Whether the overall weight meets the preset overall weight threshold, and when the overall weight threshold is exceeded, it is determined that the message constitutes a nuisance to the referring user.
  • the feature value of the evaluation subunit corresponding to the item may be set to 0.
  • the overall evaluation sub-unit 6034 determines that the user-generated content publishing request is a nuisance, the message content of the user-generated content publishing request is not sent to the referenced object.
  • the device shown in Figure 6 can be integrated into the hardware entities of various communication networks.
  • the harassment blocking device mentioned in the user-generated content can be integrated into: a feature phone, a smartphone, a PDA, a personal computer (PC), a tablet or a personal digital assistant (PDA), and the like.
  • FIG. 7 is a structure of a user-generated content reference disturbance masking system according to an embodiment of the present invention. Figure.
  • the system includes a terminal 701 and a server 702.
  • the terminal 701 and the server 702 have a communication connection, wherein:
  • the terminal 701 is configured to generate user generated content, and send a user generated content publishing request to the server 702.
  • the server 702 is configured to parse the user-generated content publishing request to determine whether the reference object is included, and when determining that the reference object is included, further determining whether the user-generated content publishing request satisfies a preset interference determination determination condition, if the content is satisfied , the message content of the user-generated content publishing request is not sent to the referenced object.
  • the preset interference determination determination condition is: an interference determination condition determined based on a message content feature
  • the server 702 is configured to parse the message content feature of the user-generated content publishing request, and determine whether the message content feature of the user-generated content publishing request satisfies the preset harassment determination condition.
  • the preset interference determination determination condition is: a disturbance determination condition determined based on the initiating user feature
  • the server 702 is configured to parse the originating user feature of the user-generated content publishing request, and determine whether the originating user feature of the user-generated content publishing request satisfies the preset harassment determination condition.
  • the preset interference determination determination condition is: an interference determination determination condition determined based on an initiating user relationship chain feature and a reference object relationship chain feature;
  • the server 702 is configured to parse the originating user relationship chain feature and the reference object relationship chain feature of the user generated content publishing request, and determine whether the initiated user relationship chain feature and the reference object relationship chain feature of the user generated content publishing request are satisfied.
  • the pre-set disturbance determination condition includes: an interference determination determination condition determined according to at least two weights of the message content feature, the initiating user feature, and the initiating user relationship chain feature and the reference object relationship chain feature;
  • the server 702 is configured to parse out at least two of a message content feature, an originating user feature, and an initiating user relationship chain feature and a reference object relationship chain feature of the user generated content publishing request, and calculate the weight based on a preset weighting algorithm.
  • the overall weight of at least two items determining whether the overall weight value satisfies a preset overall weight threshold.
  • the hardware modules in the various embodiments may be implemented mechanically or electronically.
  • a processor such as an FPGA or ASIC, is used to perform a specific operation.
  • Hardware modules may also include programmable logic devices or circuits (such as general purpose processors or other programmable processors) that are temporarily configured by software for performing particular operations.
  • the hardware module can be implemented by mechanical means, by using a dedicated permanent circuit, or by using a temporarily configured circuit (such as software configuration), which can be determined based on cost and time considerations.
  • the present invention also provides a machine readable storage medium storing instructions for causing a machine to perform a method as described herein.
  • a computer or CPU or MPU
  • the instructions of the sequence code cause an operating system or the like operating on the computer to perform some or all of the actual operations.
  • Storage medium embodiments for providing program code include floppy disks, hard disks, magneto-optical disks, optical disks (such as CD-ROM, CD-R, CD-RW, DVD-ROM, DVD-RAM, DVD-RW, DVD+RW), Tape, non-volatile memory card and ROM.
  • the program code can be downloaded from the server computer by the communication network.
  • a user-generated content publishing request is received; the user-generated content publishing request is parsed to determine whether the referenced object is included, and when it is determined that the referenced object is included, the user-generated content is further determined. Whether the publication request satisfies the pre-set interference determination condition, and if so, does not transmit the message content of the user-generated content publication request to the reference object. It can be seen that after applying the embodiment of the present invention, a smart screening policy for user-generated content mentioning harassment is implemented, and the mentioned harassment can be intelligently shielded before the microblog is published.
  • the embodiment of the present invention overcomes the defects of the prior art post-processing, and realizes the pre-processing for the user-generated content to mention the interference, thereby improving the real-time performance of the processing and improving the processing efficiency of the user-generated content referring to the interference.
  • the embodiment of the present invention implements automatic shielding for user-generated content mentioning interference, overcomes the defects of manual auditing in the prior art, and saves operating costs, and the embodiment of the present invention integrates message body content, user characteristics, and The three large dimensions of the relationship chain increase the accuracy of the composite score, and each score can be adjusted to adapt to the ever-changing malicious mention of the harassment model, thereby improving the overall message quality of Weibo and improving user-generated content. Mention the efficiency of harassment.
  • the above is only the preferred embodiment of the present invention and is not intended to limit the scope of the present invention. Any modifications, equivalent substitutions, improvements, etc. made within the spirit and scope of the present invention are intended to be included within the scope of the present invention.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施方式提出一种用户生成内容提及的骚扰屏蔽方法、装置和系统。方法包括:接收用户生成内容发表请求;解析用户生成内容发表请求以判断是否包含提及对象,并当判定包含提及对象时,进一步判断该用户生成内容发表请求是否满足预先设置的骚扰判定条件,如果满足,则不将该用户生成内容发表请求的消息内容发送给提及对象。本发明实施方式克服了现有技术中针对提及骚扰采用事后处理的缺陷,实现了针对用户生成内容提及骚扰的事先处理,提高了用户生成内容提及骚扰的处理效率,而且本发明实施方式实现了针对用户生成内容提及骚扰的自动屏蔽,克服了现有技术中人工审核的缺陷。

Description

一种用户生成内容提及的骚扰屏蔽方法、 装置和系统 相关文件
本申请要求于 2012 年 12 月 27 日提交中国专利局、 申请号为 2012105800201、 发明名称为"一种用户生成内容提及的验扰屏蔽方法和 装置"的中国专利申请的优先权, 其全部内容通过引用结合在本申请中。 技术领域
本发明实施方式涉及互联网应用技术领域, 更具体地, 涉及一种用 户生成内容提及的验扰屏蔽方法、 装置和系统。 发明背景
随着计算机技术和网络技术的飞速发展, 互联网 (Internet )在人们 的曰常生活、 学习和工作中发挥的作用也越来越大。 互联网上的各种应 用层出不穷。
用户生成内容(UGC )是一种用户使用互联网的新方式, 即由原来 的以下载为主变成下载和上传并重。 社区网络、 视频分享、 微博和博客 等都是 UGC的主要应用形式。 随着全球互联网业务的不断发展, UGC 业务正在日渐崛起, 引起了业界的广泛关注。
微博 ( MicroBlog )是一种典型的 UGC应用, 是一个基于用户关系 的信息分享、 传播以及获取的平台, 用户可以通过各种终端在微博上以 筒短的文字 (一般是 140个字)发布个人所想、 所做的信息, 实现信息 的即时分享。 微博是用户在互联网进行消息分享、 传播的一种新方式。 由于微博弱关系链的特点, 微博的消息传递非常快, 这也吸引^艮多用户 在微博上发表一些不利于微博生态发展的消息, 例如在转播、 点评名人 的消息时带上自己的广告, 这种与被提及用户无关的转播、 点评都会进 入被提及用户的收件箱, 对用户造成极大骚扰, 降低了微博的消息质量 和用户的创作积极性, 对整个微博的积极发展带来非常大的副作用。
在现有技术中, 对于用户生成内容业务中提及验扰行为采取的是事 后处理策略, 即只有当用户投诉某个账号恶意提及时, 审核的人员才会 判断该账号是否对其他用户造成了骚扰, 如果确认验扰, 则根据严重程 度对该骚扰账号进行禁言或者封号处理。
然而, 对于海量的用户生成内容数据而言, 人工审核并处理验扰提 及行为的处理效率偏低。 而且, 这种事后处理方式依赖于用户的反馈, 实际上 ^艮多用户不知道或者不愿意反馈, 因此验扰行为经常得不到及时 处理, 进一步降低了用户生成内容提及验扰的处理效率。 发明内容
本发明实施方式提出一种用户生成内容提及的验扰屏蔽方法, 以提 高用户生成内容提及验扰的处理效率。
本发明实施方式提出一种用户生成内容提及的验扰屏蔽装置, 以提 高用户生成内容提及验扰的处理效率。
本发明实施方式提出一种用户生成内容提及的验扰屏蔽系统, 以提 高用户生成内容提及验扰的处理效率。
本发明实施方式的技术方案如下:
一种用户生成内容提及的骚扰屏蔽方法, 该方法包括:
接收用户生成内容发表请求;
解析所述用户生成内容发表请求以判断是否包含提及对象, 并当判 定包含提及对象时, 进一步判断该用户生成内容发表请求是否满足预先 设置的骚扰判定条件, 如果满足, 则不将该用户生成内容发表请求的消 息内容发送给所述提及对象。
一种用户生成内容提及的骚扰屏蔽装置, 该装置包括用户生成内容 发表请求接收单元、 用户生成内容解析单元和验扰处理单元, 其中: 用户生成内容发表请求接收单元,用于接收用户生成内容发表请求; 用户生成内容提及处理单元, 用于解析所述用户生成内容发表请求 以判断是否包含提及对象;
验扰处理单元,用于当用户生成内容解析单元判定包含提及对象时, 进一步判断该用户生成内容发表请求是否满足预先设置的骚扰判定条 件, 如果满足, 则不将该用户生成内容发表请求的消息内容发送给所述 提及对象。
一种用户生成内容提及的验扰屏蔽系统, 包括终端和服务器,其中: 终端, 用于生成用户生成内容, 并向服务器发送用户生成内容发表 请求;
服务器, 用于解析所述用户生成内容发表请求以判断是否包含提及 对象, 并当判定包含提及对象时, 进一步判断该用户生成内容发表请求 是否满足预先设置的骚扰判定条件, 如果满足, 则不将该用户生成内容 发表请求的消息内容发送给所述提及对象。
一种存储介质, 其中存储有计算机程序, 该计算机程序用于执行如 下方法:
接收用户生成内容发表请求;
解析所述用户生成内容发表请求以判断是否包含提及对象, 并当判 定包含提及对象时, 进一步判断该用户生成内容发表请求是否满足预先 设置的骚扰判定条件, 如果满足, 则不将该用户生成内容发表请求的消 息内容发送给所述提及对象。
从上述技术方案可以看出, 在本发明实施方式中, 接收用户生成内 容发表请求; 解析所述用户生成内容发表请求以判断是否包含提及对 象, 并当判定包含提及对象时, 进一步判断该用户生成内容发表请求是 否满足预先设置的验扰判定条件, 如果满足, 则不将该用户生成内容发 表请求的消息内容发送给所述提及对象。 由此可见, 应用本发明实施方 式之后实现了一种用户生成内容提及验扰的智能屏蔽策略, 可以在微博 发表之前对提及验扰进行智能屏蔽。 本发明实施方式克服了现有技术的 事后处理的缺陷, 实现了针对用户生成内容提及验扰的事先处理, 提高 了针对用户生成内容提及验扰的处理实时性, 提高了用户生成内容提及 验扰的处理效率。
而且, 本发明实施方式实现了针对用户生成内容提及验扰的自动屏 蔽, 克服了现有技术中人工审核的缺陷, 节省了运营成本, 而且本发明 实施方式综合了消息体内容、 用户特征和关系链三个大维度的特征, 增 加了综合得分的准确性, 而且每个得分项可以调整, 能够适应不断变化 的恶意提及验扰模型, 从而提高用户生成内容(比如微博) 的整体消息 质量, 以及提高了用户生成内容提及验扰的处理效率。 附图简要说明
以下附图仅为本发明技术方案的一些例子, 本发明并不局限于图中 示出的特征。 以下附图中, 相似的标号表示相似的元素:
图 1为现有技术中验扰提及的处理示意图;
图 2为根据本发明实施方式的用户生成内容提及骚扰屏蔽方法流程 图;
图 3为根据本发明实施方式的消息内容评估示意图;
图 4为根据本发明实施方式的发起用户特征评估示意图;
图 5为根据本发明实施方式的发起用户与提及对象的关系链特征评 估示意图;
图 6为根据本发明实施方式的用户生成内容提及骚扰屏蔽装置结构 图;
图 7为根据本发明实施方式的用户生成内容提及骚扰屏蔽系统结构 图。 实施本发明的方式
为使本发明的目的、 技术方案和优点更加清楚, 下面结合附图对本 发明作进一步的详细描述。
为了描述上的筒洁和直观, 下文通过描述若干代表性的实施方式来 对本发明的方案进行阐述。 实施方式中大量的细节仅用于帮助理解本发 明的方案。 但是很明显, 本发明的技术方案实现时可以不局限于这些细 节。 为了避免不必要地模糊了本发明的方案, 一些实施方式没有进行细 致地描述, 而是仅给出了框架。 下文中, "包括"是指 "包括但不限于", "根据…… " 是指 "至少根据……, 但不限于仅根据…… "。 由于汉语 的语言习惯, 下文中没有特别指出一个成分的数量时, 意味着该成分可 以是一个也可以是多个, 或可理解为至少一个。
图 1为现有技术中验扰提及的处理示意图。
如图 1所示, 当有用户 A投诉用户 B恶意提及时, 由投诉审核模块 判断该账号 B是否对用户 A造成了验扰,如果确认验扰, 则根据严重程 度对该账号进行禁言或者封号处理。然而,这种方案依赖于用户的反馈, 很多用户不知道或者不愿意反馈。 而且投诉审核模块是由人工审核的, 工作效率低。 另外, 骚扰的主体(即用户 B )被禁言后可能换一个账号 继续进行恶意提及操作, 被骚扰用户还是被迫收到很多骚扰的提及。 不 仅于此, 现有技术的处理周期很长, 等恶意用户 B被禁言后, 用户 A可 能已经被验扰很久了, 起到的效果不明显。
在本发明实施方式中, 提出了一种用户生成内容提及验扰的智能屏 蔽策略。 本发明实施方式综合多个多维度的消息特征和用户特征, 能实 时准确地判断出某条消息对提及用户是否为骚扰, 进而在该消息进入提 及用户的收件箱之前主动将其屏蔽。
图 2为根据本发明实施方式的用户生成内容提及的骚扰屏蔽方法流 程图。
如图 2所示, 该方法包括:
步骤 201 : 接收用户生成内容发表请求。 求, 本发明实施方式首先接收该用户生成内容发表请求。
用户可以通过多种方式发出各种类型的用户生成内容发表请求。 比 如, 用户可以在功能手机、 智能手机、 掌上电脑、 个人电脑 (PC )、 平 板电脑或个人数字助理(PDA )等终端上发出用户生成内容发表请求。 这些终端上可以安装有操作系统, 包括但不限于: Windows操作系统、 LINUX操作系统、 Android操作系统、 Symbian操作系统、 Windows mobile 操作系统、 以及 i OS操作系统等等。
以上详细罗列了一些终端的具体类型和具体的操作系统类型, 但是 本领域技术人员可以意识到, 本发明实施方式并不局限于上述罗列的类 型, 而还可以适用于其他任意的终端类型和操作系统类型之中。
而且, 用户生成内容发表请求具体可以包括转发用户生成内容发表 请求、评论用户生成内容发表请求、原创用户生成内容发表请求, 等等。
在本发明实施方式中, 用户生成内容发表请求具体可以包括但是不 局限于: 社区网络发表请求、 视频分享发表请求、 微博发表请求或者博 客发表请求, 等等。 步骤 202: 解析所述用户生成内容发表请求以判断是否包含提及对 象, 并当判定包含提及对象时, 进一步判断该用户生成内容发表请求是 否满足预先设置的验扰判定条件, 如果满足, 则不将该用户生成内容发 表请求的消息内容发送给所述提及对象。
在这里,首先解析用户生成内容发表请求以判断是否包含提及对象。 比如: 在微博消息体内容中, 有时会使用 "@" 符号后面紧跟用户的账 号名, 该用户的账号名即为提及对象。 因此, 在本发明实施方式中可以 通过判断是否存在 "@" 符号来判断是否存在提及对象。 如果针对用户 生成内容发表请求不进行屏蔽的话, 用户生成内容发表请求的具体内容 都会自动进入提及对象的收件箱。
当判定包含提及对象时, 进一步判断该用户生成内容发表请求是否 满足预先设置的骚扰判定条件, 如果满足, 则不将该用户生成内容发表 请求的消息内容发送给提及对象。
在本发明实施方式中,可以综合多个多维度的消息特征和用户特征, 实时准确地判断出某条消息对提及对象是否构成骚扰, 进而在该消息进 入提及对象的收件箱之前主动将其屏蔽。
在一个实施方式中, 预先设置的验扰判定条件可以为: 基于消息内 容特征所确定的验扰判定条件。 此时, 首先解析出该用户生成内容发表 请求的消息内容特征, 再判断该用户生成内容发表请求的消息内容特征 是否满足该预先设置的验扰判定条件。
比如: 基于消息内容特征所确定的骚扰判定条件具体可以包括下列 中的至少一个: 判断该用户生成内容发表请求的消息内容是否包括统一 资源定位符 (URL ); 判断该用户生成内容发表请求的消息内容是否涉 及话题; 判断该用户生成内容发表请求的消息内容是否为转发或评论; 判断该用户生成内容发表请求的消息内容是否为原创; 判断该用户生成 内容发表请求的消息内容是否包含预先设定的黑名单词汇; 或判断该用 户生成内容发表请求的消息内容是否发表于第三方应用, 等等。
可以针对多个基于消息内容特征所确定的验扰判定条件进行各种因 素的综合判定, 图 3为根据本发明实施方式的消息内容评估示意图。 比 如:
( a )、 当用户生成内容发表请求的消息内容中包含 URL时,认为用 户生成内容发表请求有可能是骚扰;
( b )、 当用户生成内容发表请求为原创 (或有话题)且该用户生成 内容发表请求的消息内容包含预先设定的黑名单词汇时, 认为用户生成 内容发表请求有可能是骚扰;
( c )、当用户生成内容发表请求的消息内容中包含 URL以及该用户 生成内容发表请求的消息内容发表于第三方应用时, 认为用户生成内容 发表请求有较大可能是骚扰;
( d )、 当该用户生成内容发表请求的消息内容为转发或评论而且该 用户生成内容发表请求的消息内容包含预先设定的黑名单词汇时, 认为 用户生成内容发表请求有较大可能是骚扰。
( e )、 当用户生成内容发表请求的消息内容中包含 URL、 消息内容 发表于第三方应用、 消息内容为转发或评论而且该用户生成内容发表请 求的消息内容包含预先设定的黑名单词汇时, 认为用户生成内容发表请 求有较大可能是验扰。
可以针对上述多个基于消息内容特征所确定的验扰判定条件分别设 置分值, 然后整体求和所有基于消息内容特征所确定的骚扰判定条件的 总分值, 并基于该总分值与预先设定的基于消息内容特征的门限值进行 比较, 以判断是否构成验扰, 并当构成骚扰时, 不将该用户生成内容发 表请求的消息内容发送给所述提及对象。 其中, 可以增加和删除验扰判 定条件, 而且每个验扰判定条件的得分值优选是动态可调整的, 从而能 够适应不断变化的恶意提及骚扰模型。
以上详细罗列了基于消息内容特征所确定的骚扰判定条件的具体实 例, 以及基于多个基于消息内容特征所确定的骚扰判定条件来整体性综 合判定是否构成验扰的示范性说明, 本领域技术人员可以意识到, 这些 实例和示范性说明仅仅是阐述性的, 并不用于对本发明实施方式进行限 定。
图 4为根据本发明实施方式的发起用户特征评估示意图。
在一个实施方式中, 预先设置的验扰判定条件具体可以为: 基于发 起用户特征所确定的骚扰判定条件。 此时, 首先解析出该用户生成内容 发表请求的发起用户特征, 并判断该用户生成内容发表请求的发起用户 特征是否满足该预先设置的骚扰判定条件。
具体地, 骚扰判定条件包括: 判断该用户生成内容发表请求的发起 用户在预定时间内是否有消息被屏蔽;和 /或判断该用户生成内容发表请 求的发起用户在预定时间内的提及数是否超过预先设定的提及数门限 值。
当该用户生成内容发表请求的发起用户在预定时间内有消息被屏蔽 时, 可以认为该用户生成内容发表请求的发起用户有较大可能性为骚扰 用户, 因此本次的用户生成内容发表请求有可能是验扰; 当判定该用户 提及数门限值时, 可以认为该用户生成内容发表请求的发起用户有较大 可能性为骚扰用户, 因此本次的用户生成内容发表请求有可能是骚扰。
可以针对上述多个基于发起用户特征所确定的验扰判定条件分别设 置分值, 然后整体求和所有基于发起用户特征所确定的验扰判定条件的 总分值, 并基于该总分值与预先设定的基于发起用户特征的门限值进行 比较, 以判断是否构成验扰, 并当构成骚扰时, 不将该用户生成内容发 表请求的消息内容发送给所述提及对象。 其中, 可以增加和删除验扰判 定条件, 而且每个验扰判定条件的得分值优选是动态可调整的, 从而能 够适应不断变化的恶意提及骚扰模型。
以上详细罗列了基于发起用户特征所确定的骚扰判定条件的具体实 例, 以及基于多个发起用户特征所确定的验扰判定条件来整体性综合判 定是否构成验扰的示范性说明, 本领域技术人员可以意识到, 这些实例 和示范性说明仅仅是阐述性的, 并不用于对本发明实施方式进行限定。
图 5为根据本发明实施方式的发起用户与提及对象的关系链特征评 估示意图。
在一个实施方式中, 预先设置的验扰判定条件为: 基于发起用户关 系链特征和提及对象关系链特征所确定的验扰判定条件。
此时, 解析出该用户生成内容发表请求的发起用户关系链特征和提 及对象关系链特征, 并判断该用户生成内容发表请求的发起用户关系链 特征和提及对象关系链特征是否满足该预先设置的骚扰判定条件。
具体地, 验扰判定条件包括: 判断该提及对象是否收听该用户生成 内容发表请求的发起用户; 判断该用户生成内容发表请求的发起用户是 否收听该提及对象; 判断该提及对象是否是认证用户; 判断该提及对象 的听众是否超过预先设定的听众人数门限值; 判断该用户生成内容发表 请求的发起用户是否是认证用户; 或判断该用户生成内容发表请求的发 可以针对多个基于发起用户关系链特征和提及对象关系链特征所确 定的验扰判定条件进行各种因素的综合判定。 比如:
( a )、 当提及对象收听该用户生成内容发表请求的发起用户时, 则 认为用户生成内容发表请求有较大可能不是验扰。 ( b )、 当该用户生成内容发表请求的发起用户收听该提及对象时 , 则认为用户生成内容发表请求较大可能不是验扰。
( c )、 当该提及对象是认证用户时, 认为用户生成内容发表请求有 可能是骚扰。
( d )、 当该提及对象的听众超过预先设定的听众人数门限值, 认为 用户生成内容发表请求有可能是骚扰。
( e )、 当该用户生成内容发表请求的发起用户是认证用户时, 则认 为用户生成内容发表请求较大可能不是骚扰。
( f )、 当该用户生成内容发表请求的发起用户的听众超过预先设定 的听众人数门限值时, 则认为用户生成内容发表请求较大可能不是骚 扰。
可以针对上述多个基于发起用户关系链特征和提及对象关系链特征 所确定的验扰判定条件分别设置分值, 然后整体求和所有基于发起用户 关系链特征和提及对象关系链特征所确定的验扰判定条件的总分值, 并 基于该总分值与预先设定的基于发起用户关系链特征和提及对象关系 链特征的门限值进行比较, 以判断是否构成验扰, 并当构成骚扰时, 不 将该用户生成内容发表请求的消息内容发送给所述提及对象。 其中, 可 以增加和删除骚扰判定条件, 而且每个骚扰判定条件的得分值优选是动 态可调整的, 从而能够适应不断变化的恶意提及验扰模型。
其中, 例如用户生成内容发表请求的发起用户提及了提及对象, 但 是提及对象收听了用户生成内容发表请求的发起用户, 这时该消息为骚 扰的可能性很低, 因此, 可以给提及对象收听该用户生成内容发表请求 的发起用户这个判断条件设定为足够大的负数分, 以保证最后的总得分 不会超过屏蔽阈值。
以上详细罗列了基于发起用户关系链特征和提及对象关系链特征所 确定的骚扰判定条件的具体实例, 以及基于多个发起用户关系链特征和 提及对象关系链特征所确定的骚扰判定条件来整体性综合判定是否构 成验扰的示范性说明, 本领域技术人员可以意识到, 这些实例和示范性 说明仅仅是阐述性的, 并不用于对本发明实施方式进行限定。
在一个实施方式中, 还可以综合考虑消息内容特征、 发起用户特征 与发起用户关系链特征及提及对象关系链特征, 这三大验扰判定条件来 整体判断是否构成验扰。此时,预先设置的验扰判定条件具体可以包括: 基于消息内容特征、 发起用户特征和发起用户关系链特征及提及对象关 系链特征中至少两项, 所加权确定的骚扰判定条件。 然后解析出该用户 生成内容发表请求的消息内容特征、 发起用户特征和发起用户关系链特 征及提及对象关系链特征中的该至少两项, 并基于预先设置的加权算法 计算该至少两项的整体权值; 判断该整体权值是否满足预先设置的整体 权值门限值。 比如: 可以基于消息内容特征和发起用户特征这两项加权 确定验扰判定条件; 也可以基于消息内容特征, 发起用户关系链特征及 提及对象关系链特征这两项加权确定骚扰判定条件; 还可以基于消息内 容特征和发起用户关系链特征及提及对象关系链特征这两项加权确定 骚扰判定条件。
在这里, 可以针对多个基于消息内容特征的骚扰判定条件、 多个基 于发起用户特征的验扰判定条件、 多个基于发起用户关系链特征和提及 对象关系链特征所确定的验扰判定条件中的每一个分别设置分值, 然后 整体求和所有这些特征所确定的验扰判定条件的总分值, 并基于该总分 值与预先设定的整体门限值进行比较, 以判断是否构成验扰, 并当构成 骚扰时, 不将该用户生成内容发表请求的消息内容发送给所述提及对 象。 其中, 可以增加和删除骚扰判定条件, 而且每个骚扰判定条件的得 分值优选是动态可调整的, 从而能够适应不断变化的恶意提及骚扰模 型。
基于上述详细分析, 本发明实施方式还提出了一种用户生成内容提 及的验扰屏蔽装置。
图 6为根据本发明实施方式的用户生成内容提及的骚扰屏蔽装置结 构图。
如图 6所示, 该装置包括用户生成内容发表请求接收单元 601、 用 户生成内容解析单元 602和骚扰处理单元 603 , 其中:
用户生成内容发表请求接收单元 601 , 用于接收用户生成内容发表 请求;
用户生成内容解析单元 602, 用于解析所述用户生成内容发表请求 以判断是否包含提及对象;
骚扰处理单元 603 , 用于当用户生成内容解析单元判定包含提及对 象时, 进一步判断该用户生成内容发表请求是否满足预先设置的骚扰判 定条件, 如果满足, 则不将该用户生成内容发表请求的消息内容发送给 所述提及对象。
在一个实施方式中, 所述预先设置的验扰判定条件为: 基于消息内 容特征所确定的骚扰判定条件;
骚扰处理单元 603 , 用于解析出该用户生成内容发表请求的消息内 容特征, 并判断该用户生成内容发表请求的消息内容特征是否满足该预 先设置的骚扰判定条件。
具体地, 验扰判定条件包括下列中的至少一个: 判断该用户生成内 容发表请求的消息内容是否包括统一资源定位符; 判断该用户生成内容 发表请求的消息内容是否涉及话题; 判断该用户生成内容发表请求的消 息内容是否为转发或评论; 判断该用户生成内容发表请求的消息内容是 否为原创; 判断该用户生成内容发表请求的消息内容是否包含预先设定 的黑名单词汇; 或判断该用户生成内容发表请求的消息内容是否发表于 第三方应用。
在一个实施方式中, 预先设置的验扰判定条件为: 基于发起用户特 征所确定的验扰判定条件;
骚扰处理单元 603 , 用于解析出该用户生成内容发表请求的发起用 户特征, 并判断该用户生成内容发表请求的发起用户特征是否满足该预 先设置的骚扰判定条件。
具体地, 验扰判定条件包括下列中的至少一个: 判断该用户生成内 容发表请求的发起用户在预定时间内是否有消息被屏蔽; 或判断该用户 定的提及数门限值。
在一个实施方式中, 预先设置的验扰判定条件为: 基于发起用户关 系链特征和提及对象关系链特征所确定的验扰判定条件;
骚扰处理单元 603 , 用于解析出该用户生成内容发表请求的发起用 户关系链特征和提及对象关系链特征, 并判断该用户生成内容发表请求 的发起用户关系链特征和提及对象关系链特征是否满足该预先设置的 骚扰判定条件。
具体地, 骚扰判定条件包括下列中的至少一个:
判断该提及对象是否收听该用户生成内容发表请求的发起用户; 判 断该用户生成内容发表请求的发起用户是否收听该提及对象; 判断该提 及对象是否是认证用户; 判断该提及对象的听众是否超过预先设定的听 众人数门限值; 判断该用户生成内容发表请求的发起用户是否是认证用 户; 或判断该用户生成内容发表请求的发起用户的听众是否超过预先设 定的听众人数门限值。
更优选地, 预先设置的验扰判定条件包括: 基于消息内容特征、 发 起用户特征和发起用户关系链特征及提及对象关系链特征中至少两项, 所加权确定的骚扰判定条件; 此时:
验扰处理单元 603包括消息内容特征评判子单元 6031、发起用户特 征评判子单元 6032、 关系链评判子单元 6033和整体评判子单元 6034; 消息内容特征评判子单元 6031 , 用于计算该用户生成内容发表请求 的消息内容 特征值;
发起用户特征评判子单元 6032, 用于计算该用户生成内容发表请求 的发起用户特征值;
关系链评判子单元 6033 , 用于计算该发起用户关系链及提及对象关 系链的特征值;
整体评判子单元 6034, 用于对该发起用户关系链及提及对象关系链 的特征值、 消息内容特征值和发起用户特征值中的该至少两项进行加权 计算, 得到整体评判值, 并判断该整体权值是否满足预先设置的整体权 值门限值, 当超过整体权值门限值的时候, 则判定该条消息对提及用户 构成骚扰。
其中, 消息内容特征、 发起用户特征和发起用户关系链特征及提及 对象关系链特征中, 如果在验扰判定条件中没有涉及到, 可以将该项所 对应的评判子单元的特征值设置为 0。
其中,如果整体评判子单元 6034判断该用户生成内容发表请求为骚 扰, 则不将该用户生成内容发表请求的消息内容发送给提及对象。
可以将图 6所示装置集成到各种通信网络的硬件实体当中。 比如, 可以将用户生成内容提及的骚扰屏蔽装置集成到: 功能手机、智能手机、 掌上电脑、 个人电脑(PC )、 平板电脑或个人数字助理(PDA ), 等等设 备之中。
图 7为根据本发明实施方式的用户生成内容提及骚扰屏蔽系统结构 图。
如图 7所示, 该系统包括终端 701和服务器 702, 终端 701和服务 器 702之间具有通讯连接, 其中:
终端 701 , 用于生成用户生成内容, 并向服务器 702发送用户生成 内容发表请求;
服务器 702, 用于解析所述用户生成内容发表请求以判断是否包含 提及对象, 并当判定包含提及对象时, 进一步判断该用户生成内容发表 请求是否满足预先设置的验扰判定条件, 如果满足, 则不将该用户生成 内容发表请求的消息内容发送给所述提及对象。
在一个实施方式中, 所述预先设置的验扰判定条件为: 基于消息内 容特征所确定的骚扰判定条件;
服务器 702, 用于解析出该用户生成内容发表请求的消息内容特征, 并判断该用户生成内容发表请求的消息内容特征是否满足该预先设置 的骚扰判定条件。
在一个实施方式中, 所述预先设置的验扰判定条件为: 基于发起用 户特征所确定的骚扰判定条件;
服务器 702, 用于解析出该用户生成内容发表请求的发起用户特征, 并判断该用户生成内容发表请求的发起用户特征是否满足该预先设置 的骚扰判定条件。
在一个实施方式中, 所述预先设置的验扰判定条件为: 基于发起用 户关系链特征和提及对象关系链特征所确定的验扰判定条件;
服务器 702, 用于解析出该用户生成内容发表请求的发起用户关系 链特征和提及对象关系链特征, 并判断该用户生成内容发表请求的发起 用户关系链特征和提及对象关系链特征是否满足该预先设置的骚扰判 定条件。 在一个实施方式中, 所述预先设置的验扰判定条件包括: 基于消息 内容特征、 发起用户特征和发起用户关系链特征及提及对象关系链特征 中至少两项加权确定的验扰判定条件;
服务器 702, 用于解析出该用户生成内容发表请求的消息内容特征、 发起用户特征和发起用户关系链特征及提及对象关系链特征中的该至 少两项, 并基于预先设置的加权算法计算该至少两项的整体权值; 判断 该整体权值是否满足预先设置的整体权值门限值。
需要说明的是,上述各流程和各结构图中不是所有的步骤和模块 都是必须的, 可以根据实际的需要忽略某些步骤或模块。 各步骤的执 行顺序不是固定的, 可以根据需要进行调整。 各模块的划分仅仅是为 了便于描述采用的功能上的划分, 实际实现时, 一个模块可以分由多 个模块实现, 多个模块的功能也可以由同一个模块实现, 这些模块可 以位于同一个设备中, 也可以位于不同的设备中。
各实施例中的硬件模块可以以机械方式或电子方式实现。 例如, 理器, 如 FPGA或 ASIC ) 用于完成特定的操作。 硬件模块也可以包 括由软件临时配置的可编程逻辑器件或电路(如包括通用处理器或其 它可编程处理器)用于执行特定操作。 至于具体采用机械方式, 或是 采用专用的永久性电路, 或是采用临时配置的电路(如由软件进行配 置) 来实现硬件模块, 可以根据成本和时间上的考虑来决定。
本发明还提供了一种机器可读的存储介质,存储用于使一机器执 行如本文所述方法的指令。 具体地, 可以提供配有存储介质的系统或 者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能 的软件程序代码, 且使该系统或者装置的计算机(或 CPU或 MPU ) 读出并执行存储在存储介质中的程序代码。 此外, 还可以通过基于程 序代码的指令使计算机上操作的操作系统等来完成部分或者全部的 实际操作。还可以将从存储介质读出的程序代码写到插入计算机内的 扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中 设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展 单元上的 CPU等来执行部分和全部实际操作, 从而实现上述实施例 中任一实施例的功能。
用于提供程序代码的存储介质实施例包括软盘、 硬盘、 磁光盘、 光盘 (如 CD-ROM、 CD-R , CD-RW、 DVD-ROM、 DVD-RAM、 DVD-RW, DVD+RW )、 磁带、 非易失性存储卡和 ROM。 可选择地, 可以由通信网络从服务器计算机上下载程序代码。
综上所述, 在本发明实施方式中, 接收用户生成内容发表请求; 解 析所述用户生成内容发表请求以判断是否包含提及对象, 并当判定包含 提及对象时, 进一步判断该用户生成内容发表请求是否满足预先设置的 验扰判定条件, 如果满足, 则不将该用户生成内容发表请求的消息内容 发送给所述提及对象。 由此可见, 应用本发明实施方式之后实现了一种 用户生成内容提及骚扰的智能屏蔽策略, 可以在微博发表之前对提及骚 扰进行智能屏蔽。 本发明实施方式克服了现有技术的事后处理的缺陷, 实现了针对用户生成内容提及验扰的事先处理, 因此提高了处理的实时 性, 提高了用户生成内容提及验扰的处理效率。
而且, 本发明实施方式实现了针对用户生成内容提及验扰的自动屏 蔽, 克服了现有技术中人工审核的缺陷, 节省了运营成本, 而且本发明 实施方式综合了消息体内容、 用户特征和关系链三个大维度的特征, 增 加了综合得分的准确性, 而且每个得分项可以调整, 能够适应不断变化 的恶意提及骚扰模型, 从而提高微博的整体消息质量以及提高了用户生 成内容提及骚扰的处理效率。 以上所述, 仅为本发明的较佳实施例而已, 并非用于限定本发明的 保护范围。 凡在本发明的精神和原则之内, 所作的任何修改、等同替换、 改进等, 均应包含在本发明的保护范围之内。

Claims

权利要求书
1、 一种用户生成内容提及的验扰屏蔽方法, 其特征在于, 该方法包 括:
接收用户生成内容发表请求;
解析所述用户生成内容发表请求以判断是否包含提及对象, 并当判 定包含提及对象时, 进一步判断该用户生成内容发表请求是否满足预先 设置的骚扰判定条件, 如果满足, 则不将该用户生成内容发表请求的消 息内容发送给所述提及对象。
2、根据权利要求 1所述的用户生成内容提及的验扰屏蔽方法,其特 征在于, 所述预先设置的验扰判定条件为: 基于消息内容特征所确定的 骚扰判定条件;
所述判断该用户生成内容发表请求是否满足预先设置的验扰判定条 件为:
解析出该用户生成内容发表请求的消息内容特征, 并判断该用户生 成内容发表请求的消息内容特征是否满足该预先设置的骚扰判定条件。
3、根据权利要求 2所述的用户生成内容提及的验扰屏蔽方法,其特 征在于, 所述验扰判定条件包括下列中的至少一个:
判断该用户生成内容发表请求的消息内容是否包括统一资源定位 付;
判断该用户生成内容发表请求的消息内容是否涉及话题; 判断该用户生成内容发表请求的消息内容是否为转发或评论; 判断该用户生成内容发表请求的消息内容是否为原创;
判断该用户生成内容发表请求的消息内容是否包含预先设定的黑名 单词汇; 或
判断该用户生成内容发表请求的消息内容是否发表于第三方应用。
4、根据权利要求 1所述的用户生成内容提及的验扰屏蔽方法,其特 征在于, 所述预先设置的验扰判定条件为: 基于发起用户特征所确定的 骚扰判定条件;
所述判断该用户生成内容发表请求是否满足预先设置的验扰判定条 件为:
解析出该用户生成内容发表请求的发起用户特征, 并判断该用户生 成内容发表请求的发起用户特征是否满足该预先设置的骚扰判定条件。
5、根据权利要求 4所述的用户生成内容提及的验扰屏蔽方法,其特 征在于, 所述验扰判定条件包括下列中的至少一个:
判断该用户生成内容发表请求的发起用户在预定时间内是否有消息 被屏蔽; 或
判断该用户生成内容发表请求的发起用户在预定时间内的提及数是 否超过预先设定的提及数门限值。
6、根据权利要求 1所述的用户生成内容提及的验扰屏蔽方法,其特 征在于, 所述预先设置的验扰判定条件为: 基于发起用户关系链特征和 提及对象关系链特征所确定的骚扰判定条件;
所述判断该用户生成内容发表请求是否满足预先设置的验扰判定条 件为:
解析出该用户生成内容发表请求的发起用户关系链特征和提及对象 关系链特征, 并判断该用户生成内容发表请求的发起用户关系链特征和 提及对象关系链特征是否满足该预先设置的验扰判定条件。
7、根据权利要求 6所述的用户生成内容提及的验扰屏蔽方法,其特 征在于, 所述验扰判定条件包括下列中的至少一个:
判断该提及对象是否收听该用户生成内容发表请求的发起用户; 判断该用户生成内容发表请求的发起用户是否收听该提及对象; 判断该用户生成内容发表请求的发起用户是否是认证用户; 或 判断该用户生成内容发表请求的发起用户的听众是否超过预先设定 的听众人数门限值。
8、根据权利要求 1所述的用户生成内容提及的验扰屏蔽方法,其特 征在于, 所述预先设置的验扰判定条件包括: 基于消息内容特征、 发起 用户特征和发起用户关系链特征及提及对象关系链特征中至少两项加 权确定的骚扰判定条件;
所述判断该用户生成内容发表请求是否满足预先设置的验扰判定条 件为:
解析出该用户生成内容发表请求的消息内容特征、 发起用户特征和 发起用户关系链特征及提及对象关系链特征中的该至少两项, 并基于预 先设置的加权算法计算该至少两项的整体权值;
判断该整体权值是否满足预先设置的整体权值门限值。
9、 一种用户生成内容提及的验扰屏蔽装置, 其特征在于, 该装置包 括用户生成内容发表请求接收单元、 用户生成内容解析单元和验扰处理 单元, 其中:
用户生成内容发表请求接收单元,用于接收用户生成内容发表请求; 用户生成内容解析单元, 用于解析所述用户生成内容发表请求以判 断是否包含提及对象;
验扰处理单元,用于当用户生成内容解析单元判定包含提及对象时, 判断该用户生成内容发表请求是否满足预先设置的骚扰判定条件, 如果 满足, 则不将该用户生成内容发表请求的消息内容发送给所述提及对
10、 根据权利要求 9所述的用户生成内容提及的验扰屏蔽装置, 其 特征在于, 所述预先设置的验扰判定条件为: 基于消息内容特征所确定 的骚扰判定条件;
验扰处理单元, 用于解析出该用户生成内容发表请求的消息内容特 征, 并判断该用户生成内容发表请求的消息内容特征是否满足该预先设 置的验扰判定条件。
11、根据权利要求 10所述的用户生成内容提及的验扰屏蔽装置,其 特征在于, 所述验扰判定条件包括下列中的至少一个:
判断该用户生成内容发表请求的消息内容是否包括统一资源定位 付;
判断该用户生成内容发表请求的消息内容是否涉及话题; 判断该用户生成内容发表请求的消息内容是否为转发或评论; 判断该用户生成内容发表请求的消息内容是否为原创;
判断该用户生成内容发表请求的消息内容是否包含预先设定的黑名 单词汇; 或
判断该用户生成内容发表请求的消息内容是否发表于第三方应用。
12、 根据权利要求 9所述的用户生成内容提及的验扰屏蔽装置, 其 特征在于, 所述预先设置的验扰判定条件为: 基于发起用户特征所确定 的骚扰判定条件;
验扰处理单元, 用于解析出该用户生成内容发表请求的发起用户特 征, 并判断该用户生成内容发表请求的发起用户特征是否满足该预先设 置的验扰判定条件。
13、根据权利要求 12所述的用户生成内容提及的骚扰屏蔽装置,其 特征在于, 所述验扰判定条件包括下列中的至少一个:
判断该用户生成内容发表请求的发起用户在预定时间内是否有消息 被屏蔽; 或
判断该用户生成内容发表请求的发起用户在预定时间内的提及数是 否超过预先设定的提及数门限值。
14、 根据权利要求 9所述的用户生成内容提及的验扰屏蔽装置, 其 特征在于, 所述预先设置的验扰判定条件为: 基于发起用户关系链特征 和提及对象关系链特征所确定的骚扰判定条件;
验扰处理单元, 用于解析出该用户生成内容发表请求的发起用户关 系链特征和提及对象关系链特征, 并判断该用户生成内容发表请求的发 起用户关系链特征和提及对象关系链特征是否满足该预先设置的骚扰 判定条件。
15、根据权利要求 14所述的用户生成内容提及的骚扰屏蔽装置,其 特征在于, 所述验扰判定条件包括下列中的至少一个:
判断该提及对象是否收听该用户生成内容发表请求的发起用户; 判断该用户生成内容发表请求的发起用户是否收听该提及对象; 判断该提及对象是否是认证用户; 判断该用户生成内容发表请求的发起用户是否是认证用户; 或 判断该用户生成内容发表请求的发起用户的听众是否超过预先设定 的听众人数门限值。
16、 根据权利要求 9所述的用户生成内容提及的验扰屏蔽装置, 其 特征在于, 所述预先设置的骚扰判定条件包括: 基于消息内容特征、 发 起用户特征和发起用户关系链特征及提及对象关系链特征中至少两项 加权确定的骚扰判定条件;
验扰处理单元包括消息内容特征评判子单元、 发起用户特征评判子 单元、 关系链评判子单元和整体评判子单元; 其中: 消息内容特征评判子单元, 用于计算该用户生成内容发表请求的消 息内容特征值;
发起用户特征评判子单元, 用于计算该用户生成内容发表请求的发 起用户特征值;
关系链评判子单元, 用于计算该发起用户关系链及提及对象关系链 的特征值;
整体评判子单元, 用于对该发起用户关系链及提及对象关系链的特 征值、 消息内容特征值和发起用户特征值中的该至少两项进行加权计 算, 得到整体评判值, 并判断该整体权值是否满足预先设置的整体权值 门限值。
17、 一种用户生成内容提及的验扰屏蔽系统, 其特征在于, 包括终 端和服务器, 其中:
终端, 用于生成用户生成内容, 并向服务器发送用户生成内容发表 请求;
服务器, 用于解析所述用户生成内容发表请求以判断是否包含提及 对象, 并当判定包含提及对象时, 进一步判断该用户生成内容发表请求 是否满足预先设置的骚扰判定条件, 如果满足, 则不将该用户生成内容 发表请求的消息内容发送给所述提及对象。
18、根据权利要求 17所述的用户生成内容提及的骚扰屏蔽系统,其 特征在于, 所述预先设置的验扰判定条件为: 基于消息内容特征所确定 的骚扰判定条件;
服务器, 用于解析出该用户生成内容发表请求的消息内容特征, 并 判断该用户生成内容发表请求的消息内容特征是否满足该预先设置的 骚扰判定条件。
19、根据权利要求 17所述的用户生成内容提及的骚扰屏蔽系统,其 特征在于, 所述预先设置的验扰判定条件为: 基于发起用户特征所确定 的骚扰判定条件;
服务器, 用于解析出该用户生成内容发表请求的发起用户特征, 并 判断该用户生成内容发表请求的发起用户特征是否满足该预先设置的 骚扰判定条件。
20、根据权利要求 17所述的用户生成内容提及的骚扰屏蔽系统,其 特征在于, 所述预先设置的验扰判定条件为: 基于发起用户关系链特征 和提及对象关系链特征所确定的骚扰判定条件;
服务器, 用于解析出该用户生成内容发表请求的发起用户关系链特 征和提及对象关系链特征, 并判断该用户生成内容发表请求的发起用户 关系链特征和提及对象关系链特征是否满足该预先设置的骚扰判定条 件。
21、根据权利要求 17所述的用户生成内容提及的骚扰屏蔽系统,其 特征在于, 所述预先设置的骚扰判定条件包括: 基于消息内容特征、 发 起用户特征和发起用户关系链特征及提及对象关系链特征中至少两项 加权确定的骚扰判定条件;
服务器, 用于解析出该用户生成内容发表请求的消息内容特征、 发 起用户特征和发起用户关系链特征及提及对象关系链特征中的该至少 两项, 并基于预先设置的加权算法计算该至少两项的整体权值; 判断该 整体权值是否满足预先设置的整体权值门限值。
22、 一种存储介质, 其特征在于, 其中存储有计算机程序, 该计算 机程序用于执行如下方法:
接收用户生成内容发表请求;
解析所述用户生成内容发表请求以判断是否包含提及对象, 并当判 定包含提及对象时, 进一步判断该用户生成内容发表请求是否满足预先 设置的骚扰判定条件, 如果满足, 则不将该用户生成内容发表请求的消 息内容发送给所述提及对象。
PCT/CN2013/089931 2012-12-27 2013-12-19 一种用户生成内容提及的骚扰屏蔽方法、装置和系统 WO2014101706A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US14/750,663 US10320729B2 (en) 2012-12-27 2015-06-25 Method, apparatus, and system for shielding harassment by mention in user generated content

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210580020.1 2012-12-27
CN201210580020.1A CN103906066B (zh) 2012-12-27 2012-12-27 一种用户生成内容提及的骚扰屏蔽方法和装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US14/750,663 Continuation US10320729B2 (en) 2012-12-27 2015-06-25 Method, apparatus, and system for shielding harassment by mention in user generated content

Publications (1)

Publication Number Publication Date
WO2014101706A1 true WO2014101706A1 (zh) 2014-07-03

Family

ID=50997172

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2013/089931 WO2014101706A1 (zh) 2012-12-27 2013-12-19 一种用户生成内容提及的骚扰屏蔽方法、装置和系统

Country Status (3)

Country Link
US (1) US10320729B2 (zh)
CN (1) CN103906066B (zh)
WO (1) WO2014101706A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10042845B2 (en) * 2014-10-31 2018-08-07 Microsoft Technology Licensing, Llc Transfer learning for bilingual content classification
CN104954360B (zh) * 2015-04-17 2018-09-04 腾讯科技(深圳)有限公司 分享内容屏蔽方法及装置
CN107544852B (zh) * 2016-11-29 2020-08-11 腾讯科技(深圳)有限公司 页面信息显示方法和装置
CN108494796A (zh) * 2018-04-11 2018-09-04 广州虎牙信息科技有限公司 黑名单管理方法、装置、设备及存储介质
CN112446716B (zh) * 2019-08-27 2024-03-05 百度在线网络技术(北京)有限公司 Ugc处理方法、装置、电子设备和存储介质
WO2024159269A1 (en) * 2023-01-31 2024-08-08 Thomas Donaghey Data communications network and method for administering automated censorship of shared online content

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102419777A (zh) * 2012-01-10 2012-04-18 凤凰在线(北京)信息技术有限公司 一种互联网图片广告过滤系统及其过滤方法
CN102591983A (zh) * 2012-01-10 2012-07-18 凤凰在线(北京)信息技术有限公司 一种广告过滤系统及其过滤方法
CN102694673A (zh) * 2011-03-25 2012-09-26 腾讯科技(深圳)有限公司 一种网络言论监控方法、设备及系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6829635B1 (en) * 1998-07-01 2004-12-07 Brent Townshend System and method of automatically generating the criteria to identify bulk electronic mail
US20030135499A1 (en) * 2002-01-14 2003-07-17 Schirmer Andrew Lewis System and method for mining a user's electronic mail messages to determine the user's affinities
US7739289B2 (en) * 2006-05-15 2010-06-15 Microsoft Corporation Reviewing user-created content before website presentation
US8015581B2 (en) * 2007-01-05 2011-09-06 Verizon Patent And Licensing Inc. Resource data configuration for media content access systems and methods
US20110106784A1 (en) * 2008-04-04 2011-05-05 Merijn Camiel Terheggen System and method for publishing media objects
CN101996203A (zh) * 2009-08-13 2011-03-30 阿里巴巴集团控股有限公司 一种过滤网页信息的方法和系统
CN102111723B (zh) * 2009-12-24 2015-07-01 上海粱江通信系统股份有限公司 一种分析短信消息频次与内容识别垃圾短消息用户的方法
CN202003351U (zh) * 2011-01-18 2011-10-05 北京开心人信息技术有限公司 一种移动终端中快速搜索微博对象的系统
CN202503667U (zh) * 2012-03-28 2012-10-24 成都四方信息技术有限公司 一种垃圾短信拦截系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102694673A (zh) * 2011-03-25 2012-09-26 腾讯科技(深圳)有限公司 一种网络言论监控方法、设备及系统
CN102419777A (zh) * 2012-01-10 2012-04-18 凤凰在线(北京)信息技术有限公司 一种互联网图片广告过滤系统及其过滤方法
CN102591983A (zh) * 2012-01-10 2012-07-18 凤凰在线(北京)信息技术有限公司 一种广告过滤系统及其过滤方法

Also Published As

Publication number Publication date
CN103906066A (zh) 2014-07-02
CN103906066B (zh) 2016-03-23
US10320729B2 (en) 2019-06-11
US20150295870A1 (en) 2015-10-15

Similar Documents

Publication Publication Date Title
US10419464B2 (en) Systems and methods for targeted attack protection using predictive sandboxing
WO2014101706A1 (zh) 一种用户生成内容提及的骚扰屏蔽方法、装置和系统
Liu et al. Efficient DDoS attacks mitigation for stateful forwarding in Internet of Things
EP2666318B1 (en) Method, apparatus, and computer program product for managing unwanted traffic in a wireless network
EP3097661B1 (en) A method for scalable distributed network traffic analytics in telco
CN104468249B (zh) 一种账号异常的检测方法及装置
US9342692B2 (en) Neutralizing propagation of malicious information
US9794291B2 (en) Detecting and managing abnormal data behavior
CN109194680B (zh) 一种网络攻击识别方法、装置及设备
US20150229669A1 (en) Method and device for detecting distributed denial of service attack
Abdelrahman et al. Mobile network anomaly detection and mitigation: The NEMESYS approach
US20140344573A1 (en) Decrypting Files for Data Leakage Protection in an Enterprise Network
US11089039B2 (en) Network traffic spike detection and management
WO2014019465A1 (zh) 一种基于账号属性的异常消息检测方法、设备及存储介质
CN103533522A (zh) 短信稽核的方法及系统
CN103546449A (zh) 一种基于附件格式的邮件病毒检测方法和装置
CN110932960A (zh) 一种基于社交软件的防欺诈方法、服务器和系统
US20140259112A1 (en) Verificaiton Service
Wang et al. What you see predicts what you get—lightweight agent‐based malware detection
WO2015131561A1 (zh) 一种实现短信转发为即时消息的方法及装置
WO2015154416A1 (zh) 一种上网行为管理方法及装置
WO2016037489A1 (zh) Rcs垃圾消息的监控方法、装置及系统
CN102905236B (zh) 一种垃圾短消息监控方法、装置及系统
CN104270371A (zh) 一种基于模糊逻辑的cdn缓存服务器选择方法
Xuan et al. The Detection method for two-dimensional barcode malicious urls based on the hash function

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13867274

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 05-11-2015)

122 Ep: pct application non-entry in european phase

Ref document number: 13867274

Country of ref document: EP

Kind code of ref document: A1