CN104615585B - 处理文本信息的方法及装置 - Google Patents
处理文本信息的方法及装置 Download PDFInfo
- Publication number
- CN104615585B CN104615585B CN201410004140.6A CN201410004140A CN104615585B CN 104615585 B CN104615585 B CN 104615585B CN 201410004140 A CN201410004140 A CN 201410004140A CN 104615585 B CN104615585 B CN 104615585B
- Authority
- CN
- China
- Prior art keywords
- character
- text message
- preset
- text
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/328—Management therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/107—Computer-aided management of electronic mailing [e-mailing]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Computer Hardware Design (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请涉及一种处理文本信息的方法,包括:获取文本信息并提取文本信息内包括的文字字符;从文字字符中提取符合预定规则的目标字符;根据目标字符,计算文本信息的过滤指数;当过滤指数满足预定条件时,对文本信息执行与预定条件对应的操作。此外,本申请还涉及一种处理文本信息的装置。上述处理文本信息的方法及装置可提高垃圾文本信息过滤的准确性及效率。
Description
技术领域
本发明涉及计算机通讯技术,尤其涉及一种处理文本信息的方法及装置。
背景技术
随着计算机及网络通信技术的迅速发展,人们越来越多地通过网络进行文本信息交流。然而,由于文本信息可以非常容易到达用户手机等用户终端,因此常常被利用作为广告推广的渠道,某些不法者甚至利用文本信息发送诈骗、色情等垃圾信息,严重影响和骚扰用户的正常生活。
现有的垃圾文本信息过滤技术,主要是通过关键字过滤与黑白名单过滤的方法对垃圾文本信息进行过滤。然而,基于关键字的垃圾文本信息过滤方法,由于关键字很难包含所有非法信息,并且恶意用户可通过诸如:在文本信息内容中添加大量的字符、标点符号等干扰字符的方式来回避关键字,从而避免被过滤。而基于黑白名单过滤的方法,由于是根据用户来处理文本信息,假如文本信息来自白名单中的用户,则即使该文本信息内容中包含垃圾信息,也不会被过滤。
因此,现有的垃圾文本信息过滤技术的过滤准确性不高,缺乏效率。
发明内容
有鉴于此,本发明提供一种处理文本信息的方法及装置,可提高垃圾文本信息过滤的准确性及效率。
一种处理文本信息的方法,包括:获取文本信息并提取所述文本信息内包括的文字字符;从所述文字字符中提取符合预定规则的目标字符;根据所述目标字符,计算所述文本信息的过滤指数;以及当所述过滤指数满足预定条件时,对所述文本信息执行与所述预定条件对应的操作。
一种处理文本信息的装置,包括:文字字符提取模块,用于获取文本信息并提取所述文本信息内包括的文字字符;目标字符提取模块,用于从所述文字字符提取模块提取的所述文字字符中提取符合预定规则的目标字符;计算模块,用于根据所述目标字符提取模块提取的所述目标字符,计算所述文本信息的过滤指数;以及处理模块,用于当所述计算模块计算的所述过滤指数满足预定条件时,对所述文本信息执行与所述预定条件对应的操作。
本发明实施例提供的处理文本信息的方法及装置,通过提取文本信息内包括的文字字符,从文字字符中提取符合预定规则的目标字符,根据目标字符计算文本信息的过滤指数,当过滤指数满足预定条件时,对文本信息执行与预定条件对应的操作,由于是根据文本信息中符合预定规则的目标字符来计算过滤指数,因此可解决现有技术中因非法用户在文本信息中添加大量的目标字符而导致的垃圾文本信息无法被过滤的问题,从而可提高垃圾文本信息过滤的准确性及效率。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
图1为本发明实施例提供的在用户终端内进行处理文本信息的方法及装置的应用环境图。
图2示出了一种用户终端的结构框图。
图3为本发明第一实施例提供的在用户终端内进行处理文本信息的方法的流程图。
图4为本发明第二实施例提供的在用户终端内进行处理文本信息的方法的流程图。
图5为本发明第三实施例提供的处理文本信息的装置的结构示意图。
图6为图5的装置的存储环境示意图。
图7为本发明第四实施例提供的处理文本信息的装置的结构示意图。
图8为本发明第四实施例提供的处理文本信息的装置中部分模块的结构示意图。
图9为本发明第四实施例提供的处理文本信息的装置中部分模块的结构示意图。
具体实施方式
为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的具体实施方式、结构、特征及其功效,详细说明如后。
本发明实施例所提供的处理文本信息的方法及装置可应用于如图1所示的应用环境中,实现对垃圾文本信息的有效过滤。如图1所示,多个用户终端100之间可通过利用基站200转发短信的方式,完成文本信息的收发。可以理解的,基站200可替代的也可为服务器,多个用户终端100之间可以通过服务器完成文本信息的收发。
图2示出了一种用户终端的结构框图。用户终端可以包括移动电话(如:智能手机)以及其他具有用户终端功能的计算机,例如,可以是平板电脑、PDA(Personal DigitalAssistant,掌上电脑)等便携式、袖珍式、手持式、计算机内置的或车载的移动装置、以及台式计算机等非移动装置等等。
如图1所示,用户终端100包括存储器102、存储控制器104,一个或多个(图中仅示出一个)处理器106、外设接口108、射频模块110、定位模块112、图像采集设备114、音频模块116、触控屏幕118以及按键模块120。这些组件通过一条或多条通讯总线/信号线122相互通讯。
可以理解,图1所示的结构仅为示意,用户终端100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
存储器102可用于存储软件程序以及模块,如本发明实施例中的在用户终端内进行处理文本信息的方法及装置对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的在用户终端内进行处理文本信息的方法。
存储器102可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器102可进一步包括相对于处理器106远程设置的存储器,这些远程存储器可以通过网络连接至用户终端100。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。处理器106以及其他可能的组件对存储器102的访问可在存储控制器104的控制下进行。
外设接口108将各种输入/输入装置耦合至CPU以及存储器102。处理器106运行存储器102内的各种软件、指令以执行用户终端100的各种功能以及进行数据处理。
在一些实施例中,外设接口108,处理器106以及存储控制器104可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
射频模块110用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。射频模块110可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。射频模块110可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及技术,包括但并不限于全球移动通信系统(Global System for Mobile Communication,GSM)、增强型移动通信技术(Enhanced Data GSM Environment,EDGE),宽带码分多址技术(wideband code divisionmultiple access,W-CDMA),码分多址技术(Code division access,CDMA)、时分多址技术(time division multiple access,TDMA),蓝牙,无线保真技术(Wireless,Fidelity,WiFi)(如美国电气和电子工程师协会标准IEEE802.11a,IEEE802.11b,IEEE802.11g和/或IEEE802.11n)、网络电话(Voice over internet protocal,VoIP)、全球微波互联接入(Worldwide Interoperability for Microwave Access,Wi-Max)、其他用于邮件、即时通讯及短消息的协议,以及任何其他合适的通讯协议,甚至可包括那些当前仍未被开发出来的协议。
定位模块112用于获取用户终端100的当前位置。定位模块112的实例包括但不限于全球卫星定位系统(GPS)、基于无线局域网或者移动通信网的定位技术。
图像采集设备114用于拍摄照片或者视频。拍摄的照片或者视频可以存储至存储器102内,并可通过射频模块110发送。
音频模块116向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。音频电路从外设接口108处接收声音数据,将声音数据转换为电信息,将电信息传输至扬声器。扬声器将电信息转换为人耳能听到的声波。音频电路还从麦克风处接收电信息,将电信号转换为声音数据,并将声音数据传输至外设接口108中以进行进一步的处理。音频数据可以从存储器102处或者通过射频模块110获取。此外,音频数据也可以存储至存储器102中或者通过射频模块110进行发送。在一些实例中,音频模块116还可包括一个耳机播孔,用于向耳机或者其他设备提供音频接口。
触控屏幕118在用户终端100与用户之间同时提供一个输出及输入界面。具体地,触控屏幕118向用户显示视频输出,这些视频输出的内容可包括文字、图形、视频、及其任意组合。一些输出结果是对应于一些用户界面对象。触控屏幕118还接收用户的输入,例如用户的点击、滑动等手势操作,以便用户界面对象对这些用户的输入做出响应。检测用户输入的技术可以是基于电阻式、电容式或者其他任意可能的触控检测技术。触控屏幕118显示单元的具体实例包括但并不限于液晶显示器或发光聚合物显示器。
按键模块120同样提供用户向用户终端100进行输入的接口,用户可以通过按下不同的按键以使用户终端100执行不同的功能。
第一实施例
图3为本发明第一实施例提供的在用户终端内进行处理文本信息的方法的流程图。如图3所示,本实施例的处理文本信息的方法包括以下步骤:
步骤S11,获取文本信息并提取所述文本信息内包括的文字字符。
于本实施例一具体实施方式中,文本信息可以由短信中心以短信的形式获取,或通过即时通讯应用程序客户端获取,或通过邮件形式获取。于本实施例其他具体实施方式中,文本信息也可以是用户发布在网络论坛、空间或博客上的文本信息。文本信息中包含的文字字符可包括:汉字、英文字母、标点符号、数字、数学单位、制表符以及其他语言文字(例如俄文字母等)或其他特殊符号(例如“↗”等)中的一种或多种。
步骤S12,从所述文字字符中提取符合预定规则的目标字符。
于本实施例一具体实施方式中,用户终端可内置干扰字符字典表,该干扰字符字典表中记载有预置的干扰信息字符,其中干扰信息字符可包括:标点符号、数学单位、其他语言文字(例如俄文字母等)、制表符以及其他特殊符号(例如“↗”等)中的一种或多种。当然根据实际的情况,该干扰字符字典表中记载有预置的干扰信息字符也可以不同,本发明的具体实施方式并不以此为限。符合预订规则的目标字符可包括与内置干扰字符字典表中记载的预置的干扰信息字符相匹配的字符。
具体的,用户终端提取文本信息中包含的文字字符,将提取的文字字符逐一与预置的干扰字符字典表中所记载的干扰信息字符进行匹配,获取文字字符中与预置的干扰信息字符相匹配的字符,作为目标字符进行标记。
步骤S13,根据所述目标字符,计算所述文本信息的过滤指数。
于本实施例一具体实施方式中,文本信息的过滤指数可为:目标字符在除去目标字符外的文字字符中所占的比例,具体的计算请参照后面实施例中的相关描述。
步骤S14,当所述过滤指数满足预定条件时,对所述文本信息执行与所述预定条件对应的操作。
于本实施例一具体实施方式中,当过滤指数处于预置的数值区域内时,判定文本信息为垃圾文本信息,对文本信息执行与预定条件对应的操作。其中,预置的数值区域可为8%~25%。与预定条件对应的操作可包括:对文本信息进行拦截、删除、或按照预置提示方式向用户进行提示。当然,也可以设定为当过滤指数等于预置的数值时,例如14.7%,判定文本信息为垃圾文本信息,对文本信息执行与预定条件对应的操作。
进一步的,也可以根据所述过滤指数,对所述文本信息进行分级管理,例如,当所述过滤指数处于第一数值区域范围,例如过滤指数大于8%且小于等于10%,对所述文本信息进行标注(例如改变文字的颜色等);当所述过滤指数处于第二数值区域范围,例如过滤指数大于10%且小于等于15%,对所述文本信息按照预置提示方式(例如增加消息尾巴);当所述过滤指数处于第三数值区域范围,例如过滤指数大于15%且小于等于20%,可将该文本信息移动至预置的文件夹中,并通知用户从预置的文件夹中读取该文本信息以便对该文本信息进行确认;当所述过滤指数处于第四数值区域范围,例如过滤指数大于20%且小于等于25%,可将该文本信息直接删除。
本发明实施例提供的处理文本信息的方法,通过提取文本信息内包括的文字字符,从文字字符中提取符合预定规则的目标字符,根据目标字符计算文本信息的过滤指数,当过滤指数满足预定条件时,对文本信息执行与预定条件对应的操作,由于是根据文本信息中符合预定规则的目标字符来计算过滤指数,因此可解决现有技术中因非法用户在文本信息中添加大量的目标字符而导致的垃圾文本信息无法被过滤的问题,从而可提高垃圾文本信息过滤的准确性及效率。
第二实施例
图4为本发明第二实施例提供的在用户终端内进行处理文本信息的方法的流程图。如图4所示,本实施例的处理文本信息的方法包括以下步骤:
步骤S21,获取文本信息并提取所述文本信息内包括的文字字符,从所述文字字符中提取符合预定规则的目标字符。
步骤S21具体可参考第一实施例的相应内容,此处不再赘述。
步骤S22,分别将所述文字字符与所述目标字符转化为给定编码形式的字符,计算转化后的所述目标字符的总字节数与所述文字字符中去除所述目标字符后剩余字符的总字节数的比值,将所述比值作为所述文本信息的过滤指数。
以短信为例,假设文本信息为短信的内容,通常,用户终端以PDU(Protocol DataUnit,协议数据单元)模式收发短信,PDU模式下的文本信息内容可以使用以下3种编码形式:7-bit(比特)、8-bit和UCS2(Universal Character Set2,通用字符集2)编码形式,其中7-bit编码用于发送普通的ASCII(American Standard Code for InformationInterchange,美国信息互换标准代码)字符,8-bit编码通常用于发送数据消息,UCS2编码用于发送Unicode字符。其中,Unicode是一种计算机字符编码,也称“统一码”或“万国码”。Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
于本实施例一具体实施方式中,用户终端可将文本信息中所包含的以7-bit、8-bit和/或UCS2编码形式编码的文字字符与目标字符分别转化为UTF-8编码形式的字符。UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,UTF-8以字节为单位对Unicode进行编码,特点是对不同范围的字符使用不同长度的编码。
于本实施例其他具体实施方式中,给定编码形式也可以为GBK编码(ChineseInternal Code Specification,一种汉字编码标准)、ANSI(American NationalStandards Institute,美国国家标准学会的标准码)编码等编码形式。
可以理解的,由于UTF-8为国际通用的编码,优选地,将文本信息中所包含的文字字符与目标字符分别转化为UTF-8编码形式的字符,这样可避免信息的丢失,提高垃圾文本信息过滤结果的准确性。
用户终端100分别统计转化后的文本信息中所包含的文字字符的总字节数B1与转化后的目标字符的总字节数B2,将B1与B2做减法运算后获得文字字符中除去目标字符的剩余字符(也即有用信息字符)的总字节数B3,其中B3=(B1-B2),并计算取得B2与B3的比值R=B2/B3(也即该文本信息的信噪比R),也即文本信息中的目标字符(干扰信息字符)占有用信息字符的比例,作为文本信息的过滤指数。
步骤S23,判断所述过滤指数是否处于预置的数值区域内。
若所述过滤指数处于预置的数值区域内,则执行步骤S24:判定所述文本信息为垃圾文本信息,对所述文本信息执行与所述预定条件对应的操作。
具体的,若过滤指数R=B2/B3处于预置的数值区域内,则判定接收的文本信息为垃圾文本信息,并对该文本信息进行对应的操作,例如:对所述文本信息进行拦截、删除、或按照预置提示方式(例如增加消息尾巴)进行提示等等。具体的,可将该文本信息移动至预置的文件夹中,并通知用户从预置的文件夹中读取该文本信息以便对该文本信息进行确认,或者直接将该文本信息删除。可以理解的,用户终端还可在拦截该文本信息后,将该文本信息的主叫号码及内容信息上报给垃圾文本信息监控中心,以便用户终端以及其他用户终端通过垃圾文本信息监控中心,对此后来自该文本信息的主叫号码的其他文本信息进行监控。或者,用户终端还可对该文本信息进行标注以提醒用户该文本信息为垃圾信息。
由于是根据文本信息中符合预定规则的目标字符来计算过滤指数,因此可解决现有技术中因非法用户在文本信息中添加大量的目标字符而导致的垃圾文本信息无法被过滤的问题,从而可提高垃圾文本信息过滤的准确性及效率。
于本实施例中,若所述过滤指数不处于预置的数值区域内,则执行步骤S25:分析所述过滤指数是大于所述预置的数值区域的最大值,还是小于所述预置的数值区域的最小值,根据分析结果与预置的权重表,为所述过滤指数分配对应的权重值。
步骤S26:分析所述文字字符中是否包含与预置的目标关键字相匹配的字符以及所述文字字符中包含的所述与所述目标关键字相匹配的字符的情况,根据所述预置的权重表,为分析结果分配对应的权重值。
步骤S27:获取所述文本信息的发送方的用户标识,将所述用户标识与预置的黑白名单中的用户标识进行匹配,根据所述预置的权重表,为匹配结果分配对应的权重值。
具体的,若过滤指数R未处于预置的数值区域内,则用户终端将该过滤指数R与预置的数值区域进行分析,获得过滤指数分析结果。该过滤指数分析结果可包括:该文本信息的过滤指数R大于预置的数值区域的最大值,或该文本信息的过滤指数R小于预置的数值区域的最大值。
于本实施例一具体实施方式中,用户终端中可预置权重分配表,如下表1所示,该权重分配表中记载有获取的过滤指数分析结果及其对应的权重值。
表1
目标关键字可包括:与商业广告、欺诈有关的字、词,例如:贷款、发票、打折等及其谐音;与骚扰信息、政治有关的词,例如:交友、XX服务、XX功、XX教等及其谐音;预置长度的数字串,例如:由19位数字构成的农业银行卡的卡号。
于本实施例一具体实施方式中,用户终端中可预置黑白名单,并如上表1所示,分别为黑名单与白名单中的用户标识预置不同的权重值。黑白名单中的用户标识可根据用户的编辑操作进行管理。用户标识可包括:电话号码、用户帐号等等。
用户终端根据过滤指数分析结果查询上述表1获得对应的权重值M。
用户终端分析文字字符中是否包含与预置的目标关键字相匹配的字符,若包含,则统计所包含的数量,并判断包含的数量是否大于或等于预置的数值,获取目标关键字分析结果,并根据目标关键字分析结果,查询表1,获取对应的权重值K。
用户终端获取文本信息的发送方的用户标识,将该用户标识与预置的黑白名单中的用户标识进行匹配,根据上述表1为匹配结果分配对应的权重值L。
步骤S28:获取所述过滤指数、所述分析结果、所述匹配结果各自的基值,将所述各自的基值、所述过滤指数对应的权重值、所述分析结果对应的权重值以及所述匹配结果对应的权重值进行加权运算,当所述加权运算后获得的值大于预置的数值时,判定所述文本信息为所述垃圾文本信息,对所述文本信息执行对应的操作。
用户终端获取上述过滤指数R的预置基值A1,上述目标关键字分析结果的预置基值A2,以及发送方的用户标识与黑白名单的匹配结果的预置基值A3,将获取的上述基值A1、A2、A3,上述过滤指数R对应的权重值M,上述目标关键字分析结果对应的权重值K以及上述匹配结果对应的权重值L进行加权运算,若加权运算后获得的值S(S=A1*K+A2*M+A3*L)大于预置的数值,则判定接收的文本信息为垃圾文本信息,对该文本信息执行相应的操作。
当文本信息的过滤指数R未位于预置的数值区域内时,将过滤指数R与目标关键字以及黑白名单相结合,从多个维度对文本信息的内容进行分析过滤,可进一步提高垃圾文本信息过滤的准确度,进而提高垃圾文本信息过滤的效率。
于本实施例其他具体实施方式中,也可为过滤指数R位于预置的数值区域之内的情况设置对应的权重值M3,即使过滤指数R位于预置的数值区域之内,只有当将获取的上述基值A1、A2、A3,上述过滤指数R对应的权重值M,上述目标关键字分析结果对应的权重值K以及上述匹配结果对应的权重值L进行加权运算后获得的值S大于预置的数值时,才判定接收的文本信息为垃圾文本信息,并对该文本信息执行相应的操作。也就是将上述步骤S23至步骤S25合并为:分析所述过滤指数与预置的数值区域之间的大小关系,根据分析结果与预置的权重表,为所述过滤指数分配对应的权重值。
本发明实施例提供的处理文本信息的方法,通过提取文本信息内包括的文字字符,从文字字符中提取符合预定规则的目标字符,根据目标字符计算文本信息的过滤指数,当过滤指数满足预定条件时,对文本信息执行与预定条件对应的操作,由于是根据文本信息中符合预定规则的目标字符来计算过滤指数,因此可解决现有技术中因非法用户在文本信息中添加大量的目标字符而导致的垃圾文本信息无法被过滤的问题,从而可提高垃圾文本信息过滤的准确性及效率。此外,由于当该过滤指数未处于预置的数值区域内时,还通过将过滤指数与目标关键字以及黑白名单相结合的方式,从多个维度对文本信息内容进行过滤,实现对未包含大量干扰信息字符的垃圾文本信息的有效过滤,从而可进一步提高垃圾文本信息过滤的准确性及效率。
第三实施例
图5为本发明第三实施例提供的在用户终端内进行处理文本信息的装置的结构示意图。本实施例提供的处理文本信息的装置可以用于上述实施例中的处理文本信息的方法。如图5所示,处理文本信息的装置30包括:文字字符提取模块31、目标字符提取模块32、计算模块33以及处理模块34。
其中,文字字符提取模块31,用于获取文本信息并提取所述文本信息内包括的文字字符。
目标字符提取模块32,用于从所述文字字符提取模块31提取的所述文字字符中提取符合预定规则的目标字符。
计算模块33,用于根据所述目标字符提取模块32提取的所述目标字符,计算所述文本信息的过滤指数。
处理模块34,用于当所述计算模块33计算的所述过滤指数满足预定条件时,对所述文本信息执行与所述预定条件对应的操作。
以上各模块可以是由软件代码实现,此时,上述的各模块可存储于存储器102内,如图6所示。以上各模块同样可以由硬件例如集成电路芯片实现。
本实施例对处理文本信息的装置30的各功能模块实现各自功能的具体过程,请参见上述图1至图4所示实施例中描述的具体内容,此处不再赘述。
本发明实施例提供的处理文本信息的装置,通过提取文本信息内包括的文字字符,从文字字符中提取符合预定规则的目标字符,根据目标字符计算文本信息的过滤指数,当过滤指数满足预定条件时,对文本信息执行与预定条件对应的操作,由于是根据文本信息中符合预定规则的目标字符来计算过滤指数,因此可解决现有技术中因非法用户在文本信息中添加大量的目标字符而导致的垃圾文本信息无法被过滤的问题,从而可提高垃圾文本信息过滤的准确性及效率。
第四实施例
图7为本发明第四实施例提供的在用户终端内进行处理文本信息的装置的结构示意图。本实施例提供的处理文本信息的装置可以用于上述实施例中的处理文本信息的方法。如图7所示,处理文本信息的装置40包括:文字字符提取模块41、目标字符提取模块42、计算模块43、处理模块44。
其中,文字字符提取模块41,用于获取文本信息并提取所述文本信息内包括的文字字符。
目标字符提取模块42,用于从所述文字字符提取模块41提取的所述文字字符中提取符合预定规则的目标字符。
计算模块43,用于根据所述目标字符提取模块42提取的所述目标字符,计算所述文本信息的过滤指数。
具体的,所述目标字符提取模块用于将提取的所述文字字符逐一与预置的干扰字符字典表中所记载的干扰信息字符进行匹配,将所述文字字符中与所述干扰信息字符相匹配的字符作为所述目标字符。
如图8所示,所述计算模块43可以包括:转化单元431与计算单元432。其中,转化单元431,用于分别将所述文字字符与所述目标字符转化为给定编码形式的字符;计算单元432,用于计算转化后的所述目标字符的总字节数与所述文字字符中去除所述目标字符后剩余字符的总字节数的比值,将所述比值作为所述文本信息的过滤指数。
处理模块44,用于当所述计算模块43计算的所述过滤指数满足预定条件时,对所述文本信息执行与所述预定条件对应的操作。
所述处理模块44可包括:第一权重值分配单元441、第二权重值分配单元442、第三权重值分配单元443、运算单元444以及判定执行单元445。
于本发明的一种具体实施方式中,判定执行单元445用于当所述过滤指数处于预置的数值区域内时,判定所述文本信息为垃圾文本信息,对所述文本信息执行与所述预定条件对应的操作。第一权重值分配单元441,用于当所述过滤指数未处于预置的数值区域内时,分析所述过滤指数是大于所述预置的数值区域的最大值,还是小于所述预置的数值区域的最小值,根据分析结果与预置的权重表,为所述过滤指数分配对应的权重值;第二权重值分配单元442,用于分析所述文字字符中是否包含与预置的目标关键字相匹配的字符以及所述文字字符中包含的所述与所述目标关键字相匹配的字符的情况,根据所述预置的权重表,为分析结果分配对应的权重值;第三权重值分配单元443,用于获取所述文本信息的发送方的用户标识,将所述用户标识与预置的黑白名单中的用户标识进行匹配,根据所述预置的权重表,为匹配结果分配对应的权重值;以及运算单元444,用于获取所述过滤指数、所述分析结果、所述匹配结果各自的基值,将所述各自的基值、所述过滤指数对应的权重值、所述分析结果对应的权重值以及所述匹配结果对应的权重值进行加权运算;判定执行单元445,用于当所述加权运算后获得的值大于预置的数值时,判定所述文本信息为所述垃圾文本信息,对所述文本信息执行对应的操作。
于本发明的另一种具体实施方式中,第一权重值分配单元441,用于分析所述过滤指数与预置的数值区域之间的大小关系,根据分析结果与预置的权重表,为所述过滤指数分配对应的权重值;第二权重值分配单元442,用于分析所述文字字符中是否包含与预置的目标关键字相匹配的字符以及所述文字字符中包含的所述与所述目标关键字相匹配的字符的情况,根据所述预置的权重表,为分析结果分配对应的权重值;第三权重值分配单元443,用于获取所述文本信息的发送方的用户标识,将所述用户标识与预置的黑白名单中的用户标识进行匹配,根据所述预置的权重表,为匹配结果分配对应的权重值;以及运算单元444,用于获取所述过滤指数、所述分析结果、所述匹配结果各自的基值,将所述各自的基值、所述过滤指数对应的权重值、所述分析结果对应的权重值以及所述匹配结果对应的权重值进行加权运算;判定执行单元445,用于当所述加权运算后获得的值大于预置的数值时,判定所述文本信息为所述垃圾文本信息,对所述文本信息执行对应的操作。
优选地,所述与所述预定条件对应的操作包括:对所述文本信息进行拦截、删除、或按照预置提示方式进行提示。
优选地,所述给定编码形式为UTF-8编码形式。
本实施例对处理文本信息的装置40的各功能模块实现各自功能的具体过程,请参见上述图1至图4所示实施例中描述的具体内容,此处不再赘述。
本发明实施例提供的处理文本信息的装置,通过提取文本信息内包括的文字字符,从文字字符中提取符合预定规则的目标字符,根据目标字符计算文本信息的过滤指数,当过滤指数满足预定条件时,对文本信息执行与预定条件对应的操作,由于是根据文本信息中符合预定规则的目标字符来计算过滤指数,因此可解决现有技术中因非法用户在文本信息中添加大量的目标字符而导致的垃圾文本信息无法被过滤的问题,从而可提高垃圾文本信息过滤的准确性及效率。此外,由于当该过滤指数未处于预置的数值区域内时,还通过将过滤指数与目标关键字以及黑白名单相结合的方式,从多个维度对文本信息内容进行过滤,实现对未包含大量干扰信息字符的垃圾文本信息的有效过滤,从而可进一步提高垃圾文本信息过滤的准确性及效率。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者装置中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (12)
1.一种处理文本信息的方法,其特征在于,包括:
获取文本信息并提取所述文本信息内包括的文字字符;
从所述文字字符中提取符合预定规则的目标字符,所述目标字符为与预置的干扰字符字典表中所记载的干扰信息字符相匹配的字符;
根据所述目标字符,计算所述文本信息的过滤指数;以及判断所述过滤指数是否处于预置的数值区域,当所述过滤指数处于预置的数值区域内时,判定所述文本信息为垃圾文本信息,对所述文本信息执行与预定条件对应的操作;
当所述过滤指数未处于预置的数值区域内时,分析所述过滤指数是大于所述预置的数值区域的最大值,还是小于所述预置的数值区域的最小值,根据分析结果与预置的权重表,为所述过滤指数分配对应的权重值;
根据所述权重值加权运算,当所述加权运算结果,大于预置的数值时,判定所述文本信息为所述垃圾文本信息,对所述文本信息执行对应的操作。
2.根据权利要求1所述的方法,其特征在于,所述从所述文字字符中提取符合预定规则的目标字符的步骤,包括:
将提取的所述文字字符逐一与预置的干扰字符字典表中所记载的干扰信息字符进行匹配,将所述文字字符中与所述干扰信息字符相匹配的字符作为所述目标字符。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标字符,计算所述文本信息的过滤指数的步骤包括:
分别将所述文字字符与所述目标字符转化为给定编码形式的字符;
计算转化后的所述目标字符的总字节数与所述文字字符中去除所述目标字符后剩余字符的总字节数的比值,将所述比值作为所述文本信息的过滤指数。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述权重值加权运算,当所述加权运算结果,大于预置的数值时,判定所述文本信息为所述垃圾文本信息,对所述文本信息执行对应的操作包括:
分析所述文字字符中是否包含与预置的目标关键字相匹配的字符以及所述文字字符中包含的与所述目标关键字相匹配的字符的情况,根据所述预置的权重表,为分析结果分配对应的权重值;
获取所述文本信息的发送方的用户标识,将所述用户标识与预置的黑白名单中的用户标识进行匹配,根据所述预置的权重表,为匹配结果分配对应的权重值;以及
获取所述过滤指数、所述分析结果、所述匹配结果各自的基值,将所述各自的基值、所述过滤指数对应的权重值、所述分析结果对应的权重值以及所述匹配结果对应的权重值进行加权运算;
当所述加权运算后获得的值大于预置的数值时,判定所述文本信息为所述垃圾文本信息,对所述文本信息执行对应的操作。
5.根据权利要求1所述的方法,其特征在于,所述预定条件对应的操作包括:对所述文本信息进行拦截、删除、或按照预置提示方式进行提示。
6.根据权利要求3所述的方法,其特征在于,所述给定编码形式为UTF-8编码形式。
7.一种处理文本信息的装置,其特征在于,包括:
文字字符提取模块,用于获取文本信息并提取所述文本信息内包括的文字字符;
目标字符提取模块,用于从所述文字字符提取模块提取的所述文字字符中提取符合预定规则的目标字符,所述目标字符为与预置的干扰字符字典表中所记载的干扰信息字符相匹配的字符;
计算模块,用于根据所述目标字符提取模块提取的所述目标字符,计算所述文本信息的过滤指数;以及
处理模块,用于当所述计算模块计算的所述过滤指数满足预定条件时,对所述文本信息执行与所述预定条件对应的操作,其包括:
判定执行单元,用于当所述过滤指数处于预置的数值区域内时,判定所述文本信息为垃圾文本信息,对所述文本信息执行与所述预定条件对应的操作;
第一权重值分配单元,用于分析所述过滤指数与预置的数值区域之间的大小关系,根据分析结果与预置的权重表,为所述过滤指数分配对应的权重值;
运算单元,根据所述权重值加权运算,当所述加权运算结果,大于预置的数值时,判定所述文本信息为所述垃圾文本信息,对所述文本信息执行对应的操作;
判定执行单元,还用于当所述加权运算后获得的值大于预置的数值时,所述判定执行单元判定所述文本信息为所述垃圾文本信息,对所述文本信息执行对应的操作。
8.根据权利要求7所述的装置,其特征在于,所述目标字符提取模块用于将提取的所述文字字符逐一与预置的干扰字符字典表中所记载的干扰信息字符进行匹配,将所述文字字符中与所述干扰信息字符相匹配的字符作为所述目标字符。
9.根据权利要求7所述的装置,其特征在于,所述计算模块包括:
转化单元,用于分别将所述文字字符与所述目标字符转化为给定编码形式的字符;
计算单元,用于计算转化后的所述目标字符的总字节数与所述文字字符中去除所述目标字符后剩余字符的总字节数的比值,将所述比值作为所述文本信息的过滤指数。
10.根据权利要求7所述的装置,其特征在于,所述处理模块还包括:第二权重值分配单元,用于分析所述文字字符中是否包含与预置的目标关键字相匹配的字符以及所述文字字符中包含的与所述目标关键字相匹配的字符的情况,根据所述预置的权重表,为分析结果分配对应的权重值;
第三权重值分配单元,用于获取所述文本信息的发送方的用户标识,将所述用户标识与预置的黑白名单中的用户标识进行匹配,根据所述预置的权重表,为匹配结果分配对应的权重值;以及
运算单元,用于获取所述过滤指数、所述分析结果、所述匹配结果各自的基值,将所述各自的基值、所述过滤指数对应的权重值、所述分析结果对应的权重值以及所述匹配结果对应的权重值进行加权运算。
11.根据权利要求7的所述的装置,其特征在于,所述预定条件对应的操作包括:对所述文本信息进行拦截、删除、或按照预置提示方式进行提示。
12.根据权利要求9所述的装置,其特征在于,所述给定编码形式为UTF-8编码形式。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410004140.6A CN104615585B (zh) | 2014-01-06 | 2014-01-06 | 处理文本信息的方法及装置 |
PCT/CN2015/070148 WO2015101353A1 (en) | 2014-01-06 | 2015-01-06 | Method and apparatus for processing text information |
US15/176,364 US10387460B2 (en) | 2014-01-06 | 2016-06-08 | Method and apparatus for processing text information |
US16/456,306 US11151176B2 (en) | 2014-01-06 | 2019-06-28 | Method and apparatus for processing text information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410004140.6A CN104615585B (zh) | 2014-01-06 | 2014-01-06 | 处理文本信息的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104615585A CN104615585A (zh) | 2015-05-13 |
CN104615585B true CN104615585B (zh) | 2017-07-21 |
Family
ID=53150037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410004140.6A Active CN104615585B (zh) | 2014-01-06 | 2014-01-06 | 处理文本信息的方法及装置 |
Country Status (3)
Country | Link |
---|---|
US (2) | US10387460B2 (zh) |
CN (1) | CN104615585B (zh) |
WO (1) | WO2015101353A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10708418B2 (en) * | 2016-08-12 | 2020-07-07 | Interactive Intelligence Group, Inc. | System and method for contact identification |
CN111507068B (zh) * | 2016-10-27 | 2023-08-25 | 青岛海信移动通信技术有限公司 | 输入信息的处理方法、装置及移动终端 |
US11526554B2 (en) * | 2016-12-09 | 2022-12-13 | Google Llc | Preventing the distribution of forbidden network content using automatic variant detection |
CN111868805B (zh) * | 2018-03-19 | 2023-08-29 | 日本电信电话株式会社 | 参数设定装置、运算装置、它们的方法、以及记录介质 |
CN110222015B (zh) * | 2019-06-19 | 2021-07-09 | 北京泰迪熊移动科技有限公司 | 一种文件数据的读取、查询方法、装置及可读存储介质 |
CN110298041B (zh) * | 2019-06-24 | 2023-09-05 | 北京奇艺世纪科技有限公司 | 垃圾文本过滤方法、装置、电子设备及存储介质 |
CN111476037B (zh) * | 2020-04-14 | 2023-03-31 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、计算机设备和存储介质 |
CN112181414B (zh) * | 2020-09-28 | 2021-10-26 | 广州博冠信息科技有限公司 | 一种数据处理的方法及装置、电子设备、存储介质 |
CN114553564B (zh) * | 2022-02-25 | 2023-11-28 | 安徽华云安科技有限公司 | 弱密码检测方法、装置、电子设备及计算机可读存储介质 |
CN115374366B (zh) * | 2022-09-15 | 2023-04-07 | 中航信移动科技有限公司 | 一种匹配信息的生成方法、存储介质及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103037339A (zh) * | 2012-12-28 | 2013-04-10 | 深圳市彩讯科技有限公司 | 一种基于“用户信誉度和短信垃圾度”的短信息过滤方法 |
CN103336766A (zh) * | 2013-07-04 | 2013-10-02 | 微梦创科网络科技(中国)有限公司 | 短文本垃圾识别以及建模方法和装置 |
CN103336761A (zh) * | 2013-05-14 | 2013-10-02 | 成都网安科技发展有限公司 | 基于动态划分与语义加权的干扰过滤匹配算法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050060643A1 (en) * | 2003-08-25 | 2005-03-17 | Miavia, Inc. | Document similarity detection and classification system |
JP2005208780A (ja) * | 2004-01-21 | 2005-08-04 | Nec Corp | メールフィルタリングシステム及びそれに用いるurlブラックリスト動的構築方法 |
US20050204005A1 (en) * | 2004-03-12 | 2005-09-15 | Purcell Sean E. | Selective treatment of messages based on junk rating |
WO2007040353A1 (en) * | 2005-10-05 | 2007-04-12 | Lg Electronics Inc. | Method and apparatus for signal processing |
US8995776B2 (en) * | 2010-06-17 | 2015-03-31 | Sharp Kabushiki Kaisha | Image filter device, decoding apparatus, encoding apparatus, and data structure |
CN101977360B (zh) * | 2010-09-30 | 2013-07-03 | 北京新媒传信科技有限公司 | 垃圾短信过滤方法 |
US8782125B2 (en) * | 2011-06-17 | 2014-07-15 | Gregory A. Pearson, Inc. | Robust filters for social networking environments |
CN103324617A (zh) * | 2012-03-20 | 2013-09-25 | 腾讯科技(深圳)有限公司 | 一种历史垃圾消息的识别方法及系统 |
US8752178B2 (en) * | 2013-07-31 | 2014-06-10 | Splunk Inc. | Blacklisting and whitelisting of security-related events |
-
2014
- 2014-01-06 CN CN201410004140.6A patent/CN104615585B/zh active Active
-
2015
- 2015-01-06 WO PCT/CN2015/070148 patent/WO2015101353A1/en active Application Filing
-
2016
- 2016-06-08 US US15/176,364 patent/US10387460B2/en active Active
-
2019
- 2019-06-28 US US16/456,306 patent/US11151176B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103037339A (zh) * | 2012-12-28 | 2013-04-10 | 深圳市彩讯科技有限公司 | 一种基于“用户信誉度和短信垃圾度”的短信息过滤方法 |
CN103336761A (zh) * | 2013-05-14 | 2013-10-02 | 成都网安科技发展有限公司 | 基于动态划分与语义加权的干扰过滤匹配算法 |
CN103336766A (zh) * | 2013-07-04 | 2013-10-02 | 微梦创科网络科技(中国)有限公司 | 短文本垃圾识别以及建模方法和装置 |
Non-Patent Citations (1)
Title |
---|
"基于内容的垃圾邮件过滤技术研究";孙晶涛;《中国博士学位论文全文数据库 信息科技辑》;20120115(第1期);论文第53-55页 * |
Also Published As
Publication number | Publication date |
---|---|
US11151176B2 (en) | 2021-10-19 |
US10387460B2 (en) | 2019-08-20 |
CN104615585A (zh) | 2015-05-13 |
WO2015101353A1 (en) | 2015-07-09 |
US20160321353A1 (en) | 2016-11-03 |
US20190317954A1 (en) | 2019-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104615585B (zh) | 处理文本信息的方法及装置 | |
CN111027528B (zh) | 语种识别方法、装置、终端设备及计算机可读存储介质 | |
JP6535815B2 (ja) | 情報プッシュ方法、デバイス及びシステム並びにコンピュータ記憶媒体 | |
WO2016134630A1 (zh) | 一种识别恶意电话的方法和装置 | |
CN104935744A (zh) | 一种验证码显示方法、验证码显示装置及移动终端 | |
CN106657528A (zh) | 一种来电管理方法及装置 | |
CN107332757A (zh) | 删除推送消息的方法及相关产品 | |
CN106888495B (zh) | 一种网络接入方法及终端 | |
CN107608720A (zh) | 应用角标的显示方法、装置、移动终端及存储介质 | |
CN104717125A (zh) | 图形码保存方法和装置 | |
CN103246847B (zh) | 一种宏病毒查杀的方法和装置 | |
CN103369095A (zh) | 识别来电或短消息类型的方法和设备 | |
CN104426685B (zh) | 信息管理方法及装置 | |
CN105357398B (zh) | 通过拨号盘查找联系人的方法及装置 | |
CN105549836A (zh) | 在移动电子终端锁屏界面处理消息的方法及移动电子终端 | |
CN104869210B (zh) | 一种通信信息提取方法及信息提取终端 | |
CN109076317A (zh) | 验证消息合法性的方法和服务器 | |
CN105787323A (zh) | WiFi热点的安全保护方法及移动终端 | |
CN106851023B (zh) | 一种快速拨打电话的方法和设备以及移动终端 | |
CN107547716B (zh) | 一种信息处理方法、终端及计算机可读存储介质 | |
CN105574453A (zh) | 一种二维码的处理方法及移动终端 | |
CN108206775A (zh) | 即时消息推送方法、客户端、系统 | |
CN107332967A (zh) | 联系人显示方法、装置、移动终端及计算机可读存储介质 | |
CN109544170B (zh) | 一种交易快照验证方法、设备及计算机可读存储介质 | |
CN109168184B (zh) | 基于邻近感知网络nan的信息交互方法及相关产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |