CN110019992A - 一种数据处理方法和装置 - Google Patents
一种数据处理方法和装置 Download PDFInfo
- Publication number
- CN110019992A CN110019992A CN201710825174.5A CN201710825174A CN110019992A CN 110019992 A CN110019992 A CN 110019992A CN 201710825174 A CN201710825174 A CN 201710825174A CN 110019992 A CN110019992 A CN 110019992A
- Authority
- CN
- China
- Prior art keywords
- title
- identified
- message
- match
- participle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/70—Game security or game management aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/50—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers
- A63F2300/55—Details of game data or player data management
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种数据处理方法和装置,本发明实施例中,获取用户发送的消息,当检测到所述消息中存在预定的关键字时,从所述消息中选取第一待识别名称,然后将第一待识别名称与预定的多个标准名称进行匹配,若判断第一待识别名称与唯一的标准名称匹配成功,则将第一待识别名称确定为虚拟物品的名称,所述虚拟物品为匹配成功的标准名称所对应的虚拟物品,之后基于虚拟物品的名称的确定次数计算虚拟物品的热度,通过上述方式,可以提高虚拟物品的热度计算结果的准确性。
Description
技术领域
本发明涉及互联网技术领域,具体涉及一种数据处理方法和装置。
背景技术
随着网络技术的发展,在网络的虚拟世界中出现了各式各样的虚拟物品,例如网络游戏中的道具、宠物以及虚拟货币等等,通过虚拟物品,可以提高游戏的趣味性,吸引更多的游戏玩家。
以网络游戏中的道具为例,游戏玩家或者游戏玩家所控制的游戏角色可以通过各种方式获得道具,例如完成游戏任务、购买等,因而在网络游戏中会产生较多购买道具和出售道具等道具交易行为。游戏开发商为了吸引更多游戏玩家,通常会不断改善游戏的功能,例如根据道具的热度对热度较高的道具开发更多的功能。每个道具有其标准名称,道具热度的计算方式一般是根据道具的名称在游戏玩家的聊天信息中出现的次数进行计算,出现的次数越多说明该道具被玩家讨论的次数越多,从而说明该道具的热度越高,反之出现的次数越低则说明该道具的热度越低。
在对现有技术的研究和实践过程中,本发明的发明人发现,为了简化输入,游戏玩家在日常的文字沟通例如发布道具交易信息时,通常会对道具的名称进行简化,不同的玩家会根据个人习惯而对同一个道具的名称使用不同的简称,而现有的游戏系统一般只能识别玩家聊天信息中道具的标准名称,而无法识别玩家所使用的道具名简称以及道具名简称所对应的道具,因此当计算某个道具的热度时,通常只是根据道具的标准名称出现的次数进行计算,而无法将道具的简称出现的次数一并统计在内,造成计算结果误差较大。
发明内容
本发明实施例提供一种数据处理方法和装置,能够提高虚拟物品的热度计算结果的准确性。
为解决上述技术问题,本发明实施例提供一种数据处理方法,包括:
获取用户发送的消息;
当检测到所述消息中存在预定的关键字时,从所述消息中选取第一待识别名称,并将选取的第一待识别名称与预定的多个标准名称进行匹配;
当根据匹配结果判断第一待识别名称与唯一的标准名称匹配成功时,将第一待识别名称确定为虚拟物品的名称,所述虚拟物品为匹配成功的标准名称所对应的虚拟物品;
基于虚拟物品的名称的确定次数计算虚拟物品的热度。
相应地,本发明实施例还提供一种数据处理装置,包括:
获取模块,用于获取用户发送的消息;
选择与匹配模块,用于当检测到所述消息中存在预定的关键字时,从所述消息中选取第一待识别名称,并将选取的第一待识别名称与预定的多个标准名称进行匹配;
处理模块,用于当根据匹配结果判断第一待识别名称是与唯一的标准名称匹配成功时,将第一待识别名称确定为虚拟物品的名称,所述虚拟物品为匹配成功的标准名称所对应的虚拟物品,并基于虚拟物品的名称的确定次数计算虚拟物品的热度。
可选地,所述选择与匹配模块具体用于:
检测所述消息中是否存在标点符号;
若存在,则将所述消息中的标点符号删除,并对删除标点符号之后的消息按照预定的拆分规则进行语句拆分。
可选地,所述选择与匹配模块具体用于:
当第一待识别名称中的每个字符均包含在当前匹配的标准名称中时,判断第一待识别名称的字符总数是否大于或等于当前匹配的标准名称的字符总数的一半;
若大于或等于,则判断第一待识别名称与当前匹配的标准名称匹配成功,否则判断第一待识别名称与当前匹配的标准名称匹配失败;
当第一待识别名称中的其中一个字不包含在当前匹配的标准名称中时,判断第一待识别名称与当前匹配的标准名称匹配失败。
可选地,所述选择与匹配模块还用于当判断第一待识别名称的字符总数大于或等于当前匹配的标准名称的字符总数的一半之后,若第一待识别名称为2个字符,且当前匹配的标准名称为3个字符,则判断第一待识别名称与当前匹配的标准名称匹配失败。
可选地,所述选择与匹配模块具体用于:
检测所述消息中是否存在收、买、卖、购、出或售的关键字;
若存在,则判断消息中存在预定的关键字;
若不存在,则判断消息中不存在预定的关键字。
本发明实施例的数据处理方法中,当检测到消息中存在预定的关键字时,从消息中选取第一待识别名称,并将第一待识别名称与预定的多个标准名称进行匹配,当根据匹配结果判断第一待识别名称与唯一的标准名称匹配成功时,将第一待识别名称确定为虚拟物品的名称,该虚拟物品为匹配成功的标准名称所对应的虚拟物品,从而基于虚拟物品的名称的确定次数计算虚拟物品的热度,通过上述方式,当检测到消息中存在预定的关键字,例如买、卖等关键字,说明该消息中可能存在虚拟物品的名称,因此通过对该消息进行名称的匹配,以识别消息中的虚拟物品的简称,从而在根据虚拟物品的名称的确定次数计算虚拟物品的热度时能够将虚拟物品的简称出现的次数统计在内,可以提高计算结果的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本发明实施例提供的数据处理方法的框架图;
图1b是本发明实施例提供的数据处理方法的一流程图;
图1c是本发明实施例提供的数据处理方法中,匹配窗口与单元格序列对齐的示意图;
图1d是本发明实施例提供的数据处理方法中,匹配窗口向右移动一个单元格后的示意图;
图1e是本发明实施例提供的数据处理方法中,匹配窗口向右移动预定数量的单元格后的示意图;
图2是本发明实施例提供的数据处理方法一实施例中,当第一待识别名称与预定的多个标准名称均匹配失败之后的流程图;
图3a是本发明实施例提供的数据处理方法的一结构示意图;
图3b是本发明实施例提供的数据处理方法的另一结构示意图;
图4是本发明实施例提供的服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种数据处理方法和装置。
其中,该数据处理装置具体可以集成在服务器等设备中。
在网络的虚拟世界中,存在各式各样的虚拟物品,例如,在网络游戏中,各种游戏道具作为一种虚拟物品存在于游戏中。其中,当某个虚拟物品被用户讨论的次数越多,即在用户的聊天消息中虚拟物品的名称被提及的次数越多,说明该虚拟物品的热度越高,因此可以通过统计聊天消息中虚拟物品的名称数量来计算道具的热度。通过本发明实施例,可以识别用户聊天消息中的虚拟物品的简称,从而可以根据消息中虚拟物品的简称的出现次数计算虚拟物品的热度,提高热度计算的准确性。
例如,参阅图1a,在获取消息之前,该数据处理装置例如可以预先存储关键字和标准名称,这些关键字例如为收、买、卖、购、出或售,之后获取用户发送的消息,例如,以网络游戏为例,获取网络游戏中各玩家发出的消息,然后对各个消息进行关键字检测,当检测到消息中存在预定的关键字时,例如买、卖、收、购等等关键字,这些关键词后面通常都会携带游戏道具的名称,因此可以根据预定的选取规则从消息中选取第一待识别名称,并将第一待识别名称与预定的多个标准名称进行匹配,以识别第一待识别名称是否为虚拟物品的标准名称或者简称,若第一待识别名称与唯一的标准名称匹配成功,说明该第一待识别名称为虚拟物品的标准名称或者简称,因此将第一待识别名称确定为虚拟物品的名称,该虚拟物品为匹配成功的标准名称对应的虚拟物品,否则判断第一待识别名称识别失败,之后基于虚拟物品的名称的确定次数计算虚拟物品的热度,由此,可以识别消息中虚拟物品的简称,从而在通过统计虚拟物品的名称在消息中出现的次数以计算相应虚拟物品的热度时,能够将虚拟物品的简称出现的次数统计在内,由此可以提高热度计算的准确性。
本发明实施例提供一种数据处理方法和装置。以下分别进行详细说明。
参阅图1b,本实施例将从数据处理装置的角度进行描述,数据处理装置例如可以集成在服务器等设备中,该数据处理方法具体可以包括以下流程:
101、获取用户发送的消息。
本发明实施例可以用于计算各种虚拟环境中的虚拟物品的热度,虚拟环境例如可以是论坛、微博、即时通讯应用或游戏应用等,或者还可以是移动终端的短信应用,等等。比如,以游戏应用为例,游戏服务器可以获取用户通过游戏应用客户端发送的消息。其中,为了提高热度计算的准确性,可以通过获取一段时间内在游戏应用中产生的消息以进行计算,也可以获取预定数目(以条为单位)的消息以进行计算,其中,将一次发送事件所发送的消息定义为一条消息,例如,一次发送事件是指用户点击一次发送按键的操作事件,用户点击一次发送按键时所发送的消息为一条消息。
在步骤101中,例如,可以是获取至少一条消息。
102、当检测到消息中存在预定的关键字时,从消息中选取第一待识别名称,并将选取的第一待识别名称与预定的多个标准名称进行匹配。
预定的关键字可以根据实际需要进行设置,例如根据不同的应用设置为不同的关键字。例如,在游戏应用中,虚拟物品的交易行为可以反应其热度,当一个虚拟物品被收购、叫卖的次数越多,说明其热度越高,因此,本实施例中,预定的关键字例如可以包括收、买、卖、购、出、或售,等等。
当检测到消息中存在收、买、卖、购、收等关键字中的一个,则根据预定的选取规则从消息中选取第一待识别名称。其中,可以预先设置选取规则,以根据预设的选取规则从消息中选取第一待识别名称,预定的选取规则可以根据实际需要进行设定,例如可以按照词性进行选取,如选取消息中的名词作为第一待识别名称,或者还可以对整条消息进行语句拆分,将拆分得到的词作为第一待识别名称。
以对消息进行语句拆分的选取规则为例,“从消息中选取第一待识别名称,并将选取的第一待识别名称与预定的多个标准名称进行匹配”具体可以包括:对消息按照预定的拆分规则进行语句拆分,得到多个分词;从多个分词中按照消息的语义顺序依次选取预定数量的分词,得到至少一个第一待识别名称,并将每个第一待识别名称与预定的多个标准名称进行匹配。
其中,语句拆分的拆分规则可以根据实际需要进行设定,譬如有以下几种拆分规则:
基于字符串匹配的分词方法,该基于字符串的分词方法主要是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行匹配,若词条中找到某个字符串,则匹配成功(识别出一个词)。
基于理解的分词方法进行语句拆分,该方法又称基于人工智能的分词方法,主要是在分词的同时进行语法、语义分析,利用语句信息和语义信息来处理歧义现象。
基于语义的分词方法,该方法引入了语义分析,其又可以分为特征库法、语法分析法、后缀分词法等等。
或者,还可以根据名词、副词等词性对消息进行语句拆分,或者可以额按照主语、谓语、宾语等句子成分对消息进行语句拆分,对此不做具体限定。
可选地,对消息按照预定的拆分规则进行语句拆分例如可以包括:检测消息中是否存在标点符号,若存在,则将消息中的标点符号删除,并对删除标点符号之后的消息按照预定的拆分规则进行语句拆分。若不存在,则直接对消息按照预定的拆分规则进行语句拆分。
通过将标点符号除去,可以减少匹配过程中不必要的计算量,提高匹配效率。
例如,对于“收天尊勇士鞋,三级石头”的消息,检测到该信息中存在“收”的关键字,然后按照预定的拆分规则例如基于理解的分词方法进行语句拆分,其中,可以先去掉消息中的标点符号“,”,然后对去掉标点符号的句子“收天尊勇士鞋三级石头”进行语句拆分,拆分结果例如如下表所示:
收 | 天 | 尊 | 勇士 | 鞋 | 三级 | 石头 |
根据上述拆分结果,拆分得到七个分词,其中,从七个分词中依次选取预定数量的分词以得到多个第一待识别名称,预定数量可以根据实际需要进行设定,例如可以是三个、四个或五个等等,以四个为例,按照消息的语义顺序依次选取四个分词,以得到多个第一待识别名称,直至选完所有分词,即每四个分词组合成为一个第一待识别名称。
本实施例中,利用匹配窗口选取第一待识别名称。具体地,从多个分词中按照消息的语义顺序依次选取预定数量的分词,得到至少一个第一待识别名称,并将每个第一待识别名称与预定的多个标准名称进行匹配,具体包括以下子步骤:
子步骤1:将多个分词按照消息的语义顺序在单元格序列中依次排列,每个分词位于一个单元格内。
如图1c所示,有单元格序列10,单元格序列10也称为数组,单元格序列10有多个单元格,以上述“收天尊勇士鞋三级石头”的拆分结果为例,将七个分词“收”、“天”、“尊”、“勇士”、“鞋”、“三级”、“石头”按照消息的语义顺序依次放入单元格序列10中,每个分词占一个单元格。
子步骤2:设置与预定数量等长度的匹配窗口,使所述匹配窗口与单元格序列中预定数量的单元格对齐以确定与匹配窗口对齐的分词,从而得到一个第一待识别名称。
本实施例采用匹配窗口来选取第一待识别名称。具体而言,预定数量以四为例,即选取四个分词以组合得到一个第一待识别名称,匹配窗口的窗口长度(简称窗长)也为四,因此匹配窗口可以与四个单元格对齐,从而将匹配窗口所对齐的四个单元格中的四个分词组合为一个第一待识别名称,从而确定出一个第一待识别名称。例如,如图1c所示,使匹配窗口11与单元格序列10左对齐,从而匹配窗口11对齐单元格序列10中的前四个单元格,进而将前四个单元格中的分词组合为第一个第一待识别名称,从而得到第一个第一待识别名称:“收天尊勇士”。
子步骤3:将得到的一个第一待识别名称与预定的多个标准名称进行匹配。
标准名称是指虚拟物品的标准名称,即虚拟世界中对虚拟物品所规定的名称,例如,在游戏应用中,开发人员会对游戏应用中的各种道具进行命名,应用在投放市场时各种道具都有其规定的名称,所规定的名称即为道具的标准名称。
例如,可以预先存储多个标准名称,多个标准名称比如可以以列表的形式进行存储。标准名称及其数量可以根据不同的应用进行设置,例如对于游戏应用,若是需要计算道具的热度,则可以根据游戏应用中各种道具的标准名称进行设置。
获取一个第一待识别名称后,将第一待识别名称与多个标准名称逐一比对,以进行匹配。其中,可以预先设置匹配规则,以按照预设的匹配规则将第一待识别名称与多个标准名称进行匹配,匹配规则可以根据实际需要进行设置,例如,可以先判断第一待识别名称中的每个字符是否都包含在当前匹配的标准名称中,若是,再判断第一待识别名称的字符总数是否大于或等于当前匹配的标准名称的字符总数的一半。其中字符总数是指名称中字符的个数,一个字符以一个文字、符号、数字、字母为单位,换句话而言,若名称中存在文字、符号(例如“&”)、数字或字母等,则以一个文字、一个符号、一个数字或一个字符作为一个字符。当前匹配的标准名称是指正在进行匹配的标准名称。
因此,本实施例中,将得到的一个第一待识别名称与预定的多个标准名称按照预定的匹配规则进行匹配,具体可以包括:当第一待识别名称中的每个字符均包含在当前匹配的标准名称中时,判断第一待识别名称的字符总数是否大于或等于当前匹配的标准名称的字符总数的一半,若大于或等于,则判断第一待识别名称与当前匹配的标准名称匹配成功,否则判断第一待识别名称与当前匹配的标准名称匹配失败;当第一待识别名称中的其中一个字不包含在当前匹配的标准名称中时,判断第一待识别名称与当前匹配的标准名称匹配失败。
其中,若第一待识别名称中有至少一个字符不包含在当前匹配的标准名称中,则判断第一待识别名称与当前匹配的标准名称匹配失败。另外,若第一端待识别名称的字符总数小于当前匹配的标准名称的字符总数的一半,则判断第一待识别名称与当前匹配的标准名称匹配失败。
本实施例中,通过判断第一待识别名称的字符总数是否大于标准名称的字符总数的一半,若是,则判断第一待识别名称与标准名称匹配成功,可以提高识别的准确性,减少误判。
例如,在一个游戏应用中,存在一道具,其标准名称为:天尊勇士鞋,若从消息中得到的第一待识别名称为“天尊”,而“天尊”一词极有可能为游戏角色名称,而并非道具名称,因此在检测到第一待识别名称“天尊”的所有字符都包含在“天尊勇士鞋”的标准名称中时,如果直接判断“天尊”与“天尊勇士鞋”匹配成功,则误判的概率较大。在本实施例中,当检测到“天尊”的所有文字均包含在“天尊勇士鞋”的标准名称中时,根据“天尊”的字符总数小于“天尊勇士鞋”的字符总数的一半的判断结果,判断“天尊”和“天尊勇士鞋”匹配失败,以减少误判。
可选地,当判断第一待识别名称的字符总数大于或等于当前匹配的标准名称的字符总数的一半之后,还包括以下步骤:若第一待识别名称为2个字符,且当前匹配的标准名称为3个字符,则判断第一待识别名称与当前匹配的标准名称匹配失败,否则判断第一待识别名称与当前匹配的标准名称匹配成功。例如,当第一待识别名称的字符总数大于或等于当前匹配的标准名称的字符总数的一半,则当第一待识别名称为2个文字,当前匹配的标准名称为3个文字时,判断第一待识别名称与当前匹配的标准名称匹配失败。
例如,有标准名称“骑士锤”,获取的第一待识别名称为“骑士”,将“骑士”与“骑士锤”按照上述匹配规则进行匹配,其中“骑士”的所有文字均包含在“骑士锤”中,且“骑士”的字符总数大于“骑士锤”的字符总数的一半,但“骑士”一词为角色名称的概率更大,因此为了减少误判,判断“骑士”与“骑士锤”匹配失败。因此,对于只有2个字符的第一待识别名称与只有3个字符的标准名称之间的匹配,即使满足上述的匹配条件,也将判断匹配失败,以减少误判。
其中,当判断第一待识别名称的字符总数大于或等于当前匹配的标准名称的字符总数的一半之后,若第一待识别名称的字符不是2个且标准名称的字符不是3个,则判断第一待识别名称与当前匹配的标准名称匹配成功。
103、当根据匹配结果判断第一待识别名称与唯一的标准名称匹配成功时,将第一待识别名称确定为虚拟物品的名称,虚拟物品为匹配成功的标准名称所对应的虚拟物品。
其中,当按照上述匹配方式将第一待识别名称与多个标准名称逐一进行匹配后,可能会存在多个标准名称与第一待识别名称匹配,本实施例中,根据第一待识别名称与每个标准名称的匹配结果,判断第一待识别名称是否与唯一的标准名称匹配成功,即判断与第一待识别名称匹配成功的标准名称是否是唯一的。
当第一待识别名称与唯一的一个标准名称匹配成功时,判断第一待识别名称识别成功,将第一待识别名称识别为与匹配成功的标准名称对应的虚拟物品的名称。当第一待识别名称与多个(两个或两个以上)标准名称匹配成功时,说明该第一待识别名称代表的含义太多,为了减少误判,此种情况下同样判断第一待识别名称识别失败,另外,当第一待识别名称与所有的标准名称均匹配失败时,也判断第一待识别名称识别失败。
104、基于虚拟物品的名称的确定次数计算虚拟物品的热度。
确定次数是指将第一待识别名称确定为虚拟物品的名称的次数,其中,每将一个第一待识别名称确定为虚拟物品的名称,则确定次数累加1。
在计算虚拟物品的热度时,例如,可以识别一段时间内产生的多条消息中的第一待识别名称进行计算,进一步而言,获取一段时间内的多条消息,然后按照步骤101至103对每条消息进行处理,以识别每条消息中的第一待识别名称,然后统计确定为虚拟物品名称的第一待识别名称的数量,该数量也即虚拟物品的名称的确定次数,从而根据该数量计算虚拟物品的热度,其中确定为虚拟物品名称的第一待识别名称的数量越多,说明该虚拟物品的热度越高。
例如,在一个游戏应用中,计算A道具的热度时,可以对一段时间内的多条消息进行处理,例如检测关键字、获取第一待识别名称、将第一待识别名称与标准名称进行匹配等等,然后根据匹配结果统计确定为A道具的名称的第一待识别名称的数量,从而统计A道具的名称的确定次数,由此根据A道具的名称的确定次数计算A道具的热度。
通过本实施例,可以识别消息中虚拟物品的简称,从而在通过统计虚拟物品的名称在消息中出现的次数以计算相应虚拟物品的热度时,能够将虚拟物品的简称出现的次数统计在内,由此可以提高热度计算的准确性。
其中,上述步骤102给出了利用匹配窗口从消息中选取一个第一待识别名称的过程,将选取得到的一个第一待识别名称与多个标准名称进行匹配后,根据该第一待识别名称是否与唯一的标准名称匹配成功的判断结果,从消息中选取下一个第一待识别名称进行匹配。具体地,当根据匹配结果判断得到的一个第一待识别名称与唯一的标准名称匹配成功之后,还包括如下步骤:将匹配窗口向右移动预定数量个单元格,以更新与匹配窗口对齐的分词,并返回执行将得到的一个第一待识别名称与预定的多个标准名称进行匹配的步骤,直至匹配窗口移出多个分词所在的单元格序列;当根据匹配结果判断得到的一个第一待识别名称不是与唯一的标准名称匹配成功之后,还包括如下步骤:将匹配窗口向右移动一个单元格,以更新与匹配窗口对齐的分词,并返回执行将得到的一个第一待识别名称与预定的多个标准名称进行匹配的步骤,直至匹配窗口移出多个分词所在的单元格序列。
例如,如图1d所示,假如得到的第一个待识别名称“收天尊勇士”不是与唯一的标准名称匹配成功,即该第一待识别名称是与多个标准名称匹配成功,或者与所有标准名称均未匹配成功,此时将匹配窗口11向右移动一个单元格,移动一个单元格后的匹配窗口11与四个分词“天”、“尊”、“勇士”、“鞋”对齐,从而更新与匹配窗口11对齐的分词,得到下一个第一待识别名称“天尊勇士鞋”。之后,执行将第一待识别名称“天尊勇士鞋”与预定的多个标准名称进行匹配的步骤,例如,判断“天尊勇士鞋”中的每个字符是否都包含在当前匹配的标准名称中,若是,再判断“天尊勇士鞋”的字符总数是否大于或等于当前匹配的标准名称的字符总数的一半,若大于或等于,则当判断“天尊勇士鞋”不是2个字符且与当前匹配的标准名称不是3个字符之后,判断第一待识别名称“天尊勇士鞋”与当前匹配的标准名称匹配成功。当第一待识别名称“天尊勇士鞋”与多个标准名称逐一匹配之后,根据匹配结果再判断第一待识别名称“天尊勇士鞋”是否是与唯一的标准名称匹配成功,若是,则将该第一待识别名称“天尊勇士鞋”确定为虚拟物品的名称,该虚拟物品为与“天尊勇士鞋”唯一匹配成功的标准名称所对应的虚拟物品。
此外,当判断第一待识别名称“天尊勇士鞋”是与唯一的标准名称匹配成功之后,还将匹配窗口向右移动预定数量个单元格,该预定数量为四,如图1e所示,将匹配窗口11向右移动四个单元格,此时匹配窗口11与最后两个分词对齐。可以理解的是,当剩余的单元格数量不足以与匹配窗口11对齐时,可以将匹配窗口11减少至与剩余的单元格数量等长度的窗长,或者也可以采用空白单元格填补不足。比如,如图1e所示,将匹配窗口11向右移动四个单元格后,可以将匹配窗口11的窗长减小为2个单位,从而与剩余的两个单元格对齐,进而减小窗长后的匹配窗口与剩余的两个分词“三级”、“石头”对齐,由此得到下一个第一待识别名称“三级石头”,然后执行将得到的第一待识别名称“三级石头”与预定的多个标准名称进行匹配的步骤,以此类推下一个第一待识别名称的选取,直至匹配窗口移出多个分词所在的单元格序列。
通过上述方式,可以从消息中依次选取至少一个第一待识别名称进行匹配,以识别消息中的虚拟物品的名称,并且根据前一个第一待识别名称的匹配结果选取消息中的下一个第一待识别名称,可以对消息中可能存在的待识别名称进行全面的检测,使得各分词得到充分匹配,并且能够减少出现重复匹配的现象。
可选地,如图2所示,当根据匹配结果判断第一待识别名称不是与唯一的标准名称匹配成功后,即第一个待识别名称识别失败,还可以包括以下流程:
201、在预定的同义词库中查找第一待识别名称中每个分词的同义词。
预先建立一同义词库,用于记录与虚拟物品的名称相关的同义词,同义词库中的同义词列表可以根据实际进行设置,例如,在游戏应用中,可能存在鞋子、衣服、头盔等道具,同义词库中的同义词列表例如可以如下:
(鞋子、战靴、鞋、靴、靴子、配鞋、履)
(护腿、裤子、裤)
(护腰、腰带、配腰、腰)
(护腕、手镯)
(护手、手套、手)
(衣服、铠甲、护胸、胸甲、战衣、盔甲、胸、衣、袍、甲)
(头套、头盔、帽子、头、盔)
(+、加)
其中,在同义词库中,不同组的同义词之间的分隔符可以根据需要进行设置,例如可以以括号进行区分,或者也可以以换行符进行区分,等等,如在上述同义词列表中,每个括号内的同义词为同一组同义词。
第一待识别名称为从消息的多个分词中选取预定数量的分词组合得到,在第一待识别名称与预定的多个标准名称均匹配失败之后,从同义词库中查找第一待识别名称中每个分词的同义词,例如,以上述“收天尊勇士鞋三级石头”的拆分结果为例,选取四个分词“天”、“尊”、“勇士”、“鞋”以组合得到一个第一待识别名称:“天尊勇士鞋”,对于该第一待识别名称,在同义词库中分别查找四个分词“天”、“尊”、“勇士”、“鞋”的同义词,以分词“鞋”为例,在同义词库中查找是否存在“鞋”一词,若存在,说明同义词库中记录有“鞋”的同义词,此时确定“鞋”所在的一组同义词:(鞋子、战靴、鞋、靴、靴子、配鞋、履)。
202、根据查找到的分词的同义词生成第一待识别名称的同义词,得到第二待识别名称。
其中,当查找到其中一个分词的同义词,则根据该分词的一组同义词生成第一待识别名称的同义词。例如,对于“天尊勇士鞋”,经过查找得到分词“鞋”的一组同义词,根据该组同义词生成“天尊勇士鞋”的同义词,分别为:“天尊勇士鞋子”、“天尊勇士战靴”、“天尊勇士靴”、“天尊勇士靴子”、“天尊勇士配鞋”和“天尊勇士履”。
若第一待识别名称中有多个分词均查找到同义词,则根据多个分词的同义词生成第一待识别名称的同义词,例如,对于“天尊勇士鞋”,除了查找到分词“鞋”的同义词之外,还查找到分词“勇士”的同义词有“战士”,此时,第一待识别名称“天尊勇士鞋”的同义词有:“天尊勇士鞋子”、“天尊勇士战靴”、“天尊勇士靴”、“天尊勇士靴子”、“天尊勇士配鞋”、“天尊勇士履”、“天尊战士鞋子”、“天尊战士战靴”、“天尊战士靴”、“天尊战士靴子”、“天尊战士配鞋”、“天尊战士履”以及“天尊战士鞋”。以此类推,可以确定多个分词的同义词所生成的第一待识别名称的同义词。
203、将第二待识别名称与预定的多个标准名称进行匹配。
其中,第二待识别名称的数量可能为一个或多个,当第二待识别名称有多个时,例如,可以将每个第二待识别名称与预定的多个标准名称按照预定的匹配规则进行匹配。该预定的匹配规则和第一待识别名称与标准名称的匹配规则相类似,匹配规则譬如可以为:先判断第二待识别名称中的每个字符是否都包含在当前匹配的标准名称中,若是,再判断第二待识别名称的字符总数是否大于或等于当前匹配的标准名称的字符总数的一半,若大于或等于,则进一步判断第二待识别名称是否为2个字符且当前匹配的标准名称是否为3个字符,若第二待识别名称为2个字符且当前匹配的标准名称为3个字符,则判断第二待识别名称与当前匹配的标准名称匹配失败,若第二待识别名称不是2个字符且当前匹配的标准名称不是3个字符,则判断第二待识别名称与当前匹配的标准名称匹配成功,以减少误判的几率。其中,当第二待识别名称的字符总数小于当前匹配的标准名称的字符总数的一半,则判断第二待识别名称与当前匹配的标准名称匹配失败。此外,当第二待识别名称中的其中一个字符不包含在当前匹配的标准名称中,则判断第二待识别名称与当前匹配的标准名称匹配失败。
204、若存在多个第二待识别名称与唯一标准名称匹配成功,则确定多个第二待识别名称中字符总数最多的第二待识别名称。
其中,在将一个第二待识别名称与多个标准名称逐一进行匹配后,可能有多个标准名称与第二待识别名称匹配成功,也可能仅有唯一的一个标准名称与第二待识别名称匹配成功,或者多个标准名称均与第二待识别名称匹配失败。当仅有唯一的一个标准名称与第二待识别名称匹配成功时,判断第二待识别名称识别成功,否则判断第二待识别名称识别失败。本实施例中,根据所有第二待识别名称与标准名称的匹配结果,查找与唯一的标准名称匹配成功的第二待识别名称,若查找到多个该第二待识别名称,则确定该多个第二待识别名称中字符总数最多的第二待识别名称。
205、将与字符总数最多的第二待识别名称匹配成功的标准名称作为与第一待识别名称匹配成功的标准名称。
其中,与唯一的标准名称匹配成功的多个第二待识别名称中,不同第二待识别名称所匹配成功的标准名称可能相同也可能不同,因此,本实施例将该多个第二待识别名称中字符总数最多的第二待识别名称作为与第一待识别名称匹配成功的标准名称,可以提高待识别名称识别的准确性。另外,若该多个第二待识别名称中,字符总数最多的第二待识别名称的数量也为多个(即有多个字符总数并列第一的第二待识别名称),此时可以随机选取其中一个字符总数最多的第二待识别名称所对应的标准名称作为与第一待识别名称匹配成功的标准名称,或者也可以舍弃该字符总数最多并列第一的第二待识别名称,再从剩余的第二待识别名称中确定字符总数最多的第二待识别名称,并将与该重新确定的第二待识别名称匹配成功的标准名称作为第一待识别名称匹配成功的标准名称。
可以理解的是,若仅有一个第二待识别名称与唯一的标准名称匹配成功时,则将该第二待识别名称匹配成功的标准名称作为第一待识别名称匹配成功的标准名称。
206、若所有第二待识别名称中不存在与唯一的标准名称匹配成功的第二待识别名称,则判断第一待识别名称识别失败。
可以理解的是,所有第二待识别名称中不存在与唯一的标准名称匹配成功的第二待识别名称,也即所有第二待识别名称与标准名称均匹配失败,或者存在与标准名称匹配成功的第二待识别名称,但这些第二待识别名称与多个标准名称匹配成功,此时将判断第一待识别名称识别失败。
本实施例中,当判断第一待识别名称识别失败时,进一步查找第一待识别名称的同义词进行匹配,以将第一待识别名称的同义词的匹配结果作为第一待识别名称的匹配结果,可以进一步提高名称识别的准确性。
在其他实施例中,也可以是在根据预定的选取规则从消息中选取一个第一待识别名称后,即查找该第一待识别名称的同义词,然后将该第一待识别名称及其同义词依次与预定的多个标准名称按照预定的匹配规则进行匹配。其中,若第一待识别名称及其同义词中存在多个名称与唯一的标准名称匹配成功,则将与字符总数最多的一个名称(第一待识别名称或其中一个同义词)匹配成功的标准名称作为与第一待识别名称匹配成功的标准名称,其中若第一待识别名称及其同义词中存在多个字符总数并列第一的名称与唯一的标准名称匹配成功,则可以随机选取字符总数最多的一个名称所对应的标准名称作为与第一待识别名称匹配成功的标准名称。若第一待识别名称及其同义词中仅存在一个名称与唯一的标准名称匹配成功,则将该名称匹配成功的标准名称作为与第一待识别名称匹配成功的标准名称。另外,若第一待识别名称及其同义词中不存在与唯一的标准名称匹配成功的名称,则判断第一待识别名称识别失败。
其中,在步骤206中,当判断所有第二待识别名称中不存在与唯一的标准名称匹配成功的第二待识别名称之后,说明利用第一待识别名称的同义词也无法确定第一待识别名称为哪一种虚拟物品的名称,为了提高名称识别的准确性,进一步还可以包括:将第一待识别名称逐次去掉最后一个分词后与预定的多个标准名称进行匹配,直至分词减少后的第一待识别名称与唯一的标准名称匹配成功。也即,当判断所有第二待识别名称中不存在与唯一的标准名称匹配成功的第二待识别名称之后,将第一待识别名称从右至左逐次减少一个分词,其中,每减少一个分词则将减少分词后的第一待识别名称与预定的多个标准名称进行匹配,直至减少分词后的第一待识别名称与唯一的标准名称匹配成功,匹配成功的标准名称作为与未减少分词的第一待识别名称匹配成功的标准名称。若第一待识别名称剩余的最后一个分词也匹配失败或者与多个标准名称匹配成功,则判断第一待识别名称识别失败。通过上述方式,有利于提高名称识别的准确性。
举例而言,以上述“收天尊勇士鞋三级石头”的拆分结果为例对本实施例的匹配流程做进一步说明。具体地,从消息中选取四个分词“收”、“天”、“尊”、“勇士”以组合得到一个第一待识别名称:“收天尊勇士”。将“收天尊勇士”名称与预定的多个标准名称进行匹配,譬如,当“收天尊勇士”名称与一个标准名称(即当前匹配的标准名称)进行匹配时,判断“收天尊勇士”名称中的所有字符是否都包含在当前匹配的标准名称中,若是,再判断第一待识别名称的字符总数是否大于或等于当前匹配的标准名称的字符总数的一半,若是,则进一步再判断“收天尊勇士”名称的字符是否为2个且当前匹配的标准名称的字符是否为3个,若否,则判断“收天尊勇士”名称与当前匹配的标准名称匹配成功,否则判断“收天尊勇士”名称与当前匹配的标准名称匹配失败。
然后,根据“收天尊勇士”名称与每个标准名称的匹配结果,判断“收天尊勇士”名称是否是与唯一的一个标准名称匹配成功,若是,则将“收天尊勇士”名称确定为虚拟物品的名称,其中该虚拟物品为与“收天尊勇士”名称匹配成功的标准名称所对应的虚拟物品。若否,则进一步执行上述步骤201~206,即在同义词库中查找“收天尊勇士”名称中每个分词的同义词,然后根据这些同义词生成“收天尊勇士”名称的同义词,得到第二待识别名称,再将第二待识别名称与预定的多个标准名称进行匹配,具体的过程可参考上述描述进行,在此不做一一赘述。
进一步地,在步骤206中,当判断所有第二待识别名称中不存在与唯一的标准名称匹配成功的第二待识别名称之后,将“收天尊勇士”名称去掉最后一个分词“勇士”,得到去掉分词后的“收天尊”名称,再将“收天尊”名称与多个标准名称进行匹配,若与唯一的一个标准名称匹配成功,则将与“收天尊”名称匹配成功的标准名称作为与“收天尊勇士”匹配成功的标准名称,若“收天尊”与多个标准名称匹配成功或者与多个标准名称均匹配失败,则去掉最后一个分词“尊”,得到去掉分词后的“收天”名称,再与预定的多个标准名称进行匹配,以此类推,直至去掉分词后的“收天尊勇士”名称与唯一的标准名称匹配成功,则不再减少“收天尊勇士”的分词,此时将该去掉分词后的“收天尊勇士”名称确定为虚拟物品的名称,该虚拟物品为匹配成功的标准名称对应的虚拟物品。若“收天尊勇士”名称中剩余的最后一个分词也匹配失败或者与多个标准名称匹配成功,则判断“收天尊勇士”名称识别失败。
可以理解的是,在本发明的其他实施例中,当判断第一待识别名称不是与唯一的标准名称匹配成功后,也可以先执行将第一待识别名称逐次去掉最后一个分词后与预定的多个标准名称进行匹配的步骤,当判断第一待识别名称剩余的最后一个分词也匹配失败或者与多个标准名称匹配成功后,再进一步执行步骤201~206。
此外,在本发明备选实施例中,当判断第一待识别名称不是与唯一的标准名称匹配成功后,还可以仅是执行上述步骤201~206,或者也可以仅是执行将第一待识别名称逐次去掉最后一个分词后与预定的多个标准名称进行匹配的步骤,对此不做限定。
参阅图3a,本发明数据处理装置的一实施例中,数据处理装置例如可以集成在服务器等设备中,如图所示,本实施例的数据处理装置包括获取模块301、选择与匹配模块302以及处理模块303。
其中,获取模块301用于获取用户发送的消息。例如,以游戏应用为例,游戏服务器获取用户通过游戏应用客户端发送的消息。
选择与匹配模块302用于当检测到消息中存在预定的关键字时,从消息中选取第一待识别名称,并将选取的第一待识别名称与预定的多个标准名称进行匹配。
预定的关键字可以根据实际需要进行设置,例如根据不同的应用设置为不同的关键字,例如,预定的关键字可以包括收、买、卖、购、出、或售,等等。
其中,可以预先设置选取规则选取第一待识别名称,选取规则可以根据实际进行设定,例如可以按照词性进行选取,如选取消息中的名词作为第一待识别名称,或者还可以对整条消息进行语句拆分,将拆分得到的词作为第一待识别名称。
以对消息进行语句拆分的选取规则为例,选择与匹配模块302具体用于对消息按照预定的拆分规则进行语句拆分,得到多个分词,然后从多个分词中按照消息的语义顺序依次选取预定数量的分词,得到至少一个第一待识别名称,并将每个第一待识别名称与预定的多个标准名称进行匹配。
其中,语句拆分的拆分规则可以根据实际需要进行设定,例如可以是基于字符串匹配的分词方法、基于理解的分词方法进行语句拆分或者基于语义的分词方法等等,或者还可以根据名词、副词等词性对消息进行语句拆分,或者可以额按照主语、谓语、宾语等句子成分对消息进行语句拆分。
可选地,选择与匹配模块302用于检测消息中是否存在标点符号,若存在,则将消息中的标点符号删除,并对删除标点符号之后的消息按照预定的拆分规则进行语句拆分,其中若不存在,则直接对消息按照预定的拆分规则进行语句拆分。通过将标点符号除去,可以减少匹配过程中不必要的计算量,提高匹配效率。
例如,对于“收天尊勇士鞋,三级石头”的消息,可以先去掉消息中的标点符号“,”,然后对去掉标点符号的句子“收天尊勇士鞋三级石头”进行语句拆分,例如基于理解的分词方法进行语句拆分,拆分结果例如如下表所示:
收 | 天 | 尊 | 勇士 | 鞋 | 三级 | 石头 |
根据上述拆分结果,拆分得到七个分词,其中,从七个分词中依次选取预定数量的分词以得到多个第一待识别名称,预定数量可以根据实际需要进行设定,例如可以是三个、四个或五个等等,以四个为例,按照消息的语义顺序依次选取四个分词,以得到多个第一待识别名称,直至选完所有分词,即每四个分词组合成为一个第一待识别名称。
本实施例中,利用匹配窗口选取第一待识别名称。具体地,选择与匹配模块302具体用于将多个分词按照消息的语义顺序在单元格序列中依次排列,每个分词位于一个单元格内,然后设置与预定数量等长度的匹配窗口,使所述匹配窗口与单元格序列中预定数量的单元格对齐以确定与匹配窗口对齐的分词,从而得到一个第一待识别名称,并将得到的一个第一待识别名称与预定的多个标准名称进行匹配。
标准名称是指虚拟物品的标准名称,即虚拟世界中对虚拟物品所规定的名称。其中,可以预先存储多个标准名称,多个标准名称例如可以以列表的形式进行存储。
其中,选择与匹配模块302具体用于当第一待识别名称中的每个字符均包含在当前匹配的标准名称中时,判断第一待识别名称的字符总数是否大于或等于当前匹配的标准名称的字符总数的一半,若大于或等于,则判断第一待识别名称与当前匹配的标准名称匹配成功,否则判断第一待识别名称与当前匹配的标准名称匹配失败;当第一待识别名称中的其中一个字不包含在当前匹配的标准名称中时,判断第一待识别名称与当前匹配的标准名称匹配失败。
其中,当前匹配的标准名称是指正在进行匹配的标准名称。其中字符总数是指名称中字符的个数,一个字符以一个文字、符号、数字、字母为单位,换句话而言,若名称中存在文字、符号(例如“&”)、数字或字母等,则以一个文字、一个符号、一个数字或一个字符作为一个字符。
本实施例中,通过判断第一待识别名称的字符总数是否大于标准名称的字符总数的一半,若是,则判断第一待识别名称与标准名称匹配成功,可以提高识别的准确性,减少误判。
进一步地,选择与匹配模块302还用于当判断第一待识别名称的字符总数大于或等于当前匹配的标准名称的字符总数的一半之后,若第一待识别名称为2个字符,当前匹配的标准名称为3个字符,则判断第一待识别名称与当前匹配的标准名称匹配失败,否则判断第一待识别名称与标准名称匹配成功,由此可以减少误判。
处理模块303用于当根据匹配结果判断第一待识别名称与唯一的标准名称匹配成功时,将第一待识别名称确定为虚拟物品的名称,虚拟物品为匹配成功的标准名称所对应的虚拟物品,并基于虚拟物品的名称的确定次数计算虚拟物品的热度。当按照上述匹配方式将得到的一个第一待识别名称与多个标准名称逐一进行匹配后,可能会存在多个标准名称与第一待识别名称匹配,本实施例中,根据第一待识别名称与每个标准名称的匹配结果,判断第一待识别名称是否与唯一的标准名称匹配成功,即判断与第一待识别名称匹配成功的标准名称是否是唯一的。
处理模块304还用于当判断第一待识别名称不是与唯一的标准名称匹配成功,即第一待识别名称可能与多个标准名称匹配成功,或者第一待识别名称与所有标准名称均匹配失败时,判断第一待识别名称识别失败。
每将一个第一待识别名称确定为虚拟物品的名称,则确定次数累加1。在计算虚拟物品的热度时,例如,可以将一段时间内产生的多条消息中的第一待识别名称进行匹配,然后根据匹配结果统计确定为虚拟物品名称的第一待识别名称的数量,该数量也即虚拟物品的名称的确定次数,从而根据该数量计算虚拟物品的热度,其中确定为虚拟物品名称的第一待识别名称的数量越多,说明该虚拟物品的热度越高。
通过本实施例,可以识别消息中虚拟物品的简称,从而在通过统计虚拟物品的名称在消息中出现的次数以计算相应虚拟物品的热度时,能够将虚拟物品的简称出现的次数统计在内,由此可以提高热度计算的准确性。
此外,选择与匹配模块302还用于当处理模块303判断所得到的一个第一待识别名称与唯一的标准名称匹配成功后,将匹配窗口向右移动预定数量个单元格;以及当处理模块303判断所得到的一个第一待识别名称不是与唯一的标准名称匹配成功之后,将匹配窗口向右移动一个单元格,以更新与匹配窗口对齐的分词,并返回执行将得到的一个第一待识别名称与预定的多个标准名称进行匹配的步骤,直至匹配窗口移出多个分词所在的单元格序列。可以从消息中依次选取至少一个第一待识别名称进行匹配,以识别消息中的虚拟物品的名称,并且根据前一个第一待识别名称的匹配结果选取消息中的下一个第一待识别名称,可以对消息中可能存在的待识别名称进行全面的检测,使得各分词得到充分匹配,并且能够减少出现重复匹配的现象。
在本发明数据处理装置的另一实施例中,如图3b所示,数据处理装置进一步还可以包括同义词查找模块304和生成模块305。
其中,同义词查找模块304用于当处理模块303判断第一待识别名称不是与唯一的标准名称匹配成功之后,在预定的同义词库中查找第一待识别名称中每个分词的同义词。
第一待识别名称为从消息的多个分词中选取预定数量的分词组合得到,在第一待识别名称与预定的多个标准名称均匹配失败之后,从同义词库中查找第一待识别名称中每个分词的同义词。
生成模块305用于根据查找到的分词的同义词生成第一待识别名称的同义词,得到第二待识别名称。
其中,当只有一个分词存在同义词,则则根据该分词所在的一组同义词生成第一待识别名称的同义词。若有多个分词均查找到同义词,则根据多个分词的同义词所在的多组同义词生成第一待识别名称的同义词。例如,对于“天尊勇士鞋”,除了查找到分词“鞋”的同义词之外,还查找到分词“勇士”的同义词有“战士”,此时,第一待识别名称“天尊勇士鞋”的同义词有:“天尊勇士鞋子”、“天尊勇士战靴”、“天尊勇士靴”、“天尊勇士靴子”、“天尊勇士配鞋”、“天尊勇士履”、“天尊战士鞋子”、“天尊战士战靴”、“天尊战士靴”、“天尊战士靴子”、“天尊战士配鞋”、“天尊战士履”以及“天尊战士鞋”。以此类推,可以确定多个分词的同义词所生成的第一待识别名称的同义词。
其中,选择与匹配模块302还用于将第二待识别名称与预定的多个标准名称进行匹配。
其中,第二待识别名称的数量可能为一个或多个,当第二待识别名称有多个时,例如,可以将每个第二待识别名称与预定的多个标准名称按照预定的匹配规则进行匹配。
第二待识别名称与标准名称的匹配规则和第一待识别名称与标准名称的匹配规则相类似,在此不进行一一赘述。
处理模块303还用于当存在多个第二待识别名称与唯一的标准名称匹配成功时,确定多个第二待识别名称中字符总数最多的第二待识别名称,并将与字符总数最多的第二待识别名称匹配成功的标准名称作为与第一待识别名称匹配成功的标准名称,若所有第二待识别名称中不存在与唯一的标准名称匹配成功的第二待识别名称,则判断第一待识别名称识别失败。
其中,在将一个第二待识别名称与多个标准名称逐一进行匹配后,可能有多个标准名称与第二待识别名称匹配成功,也可能仅有唯一的一个标准名称与第二待识别名称匹配成功,或者多个标准名称均与第二待识别名称匹配失败。当仅有唯一的一个标准名称与第二待识别名称匹配成功时,判断第二待识别名称识别成功,否则判断第二待识别名称识别失败。本实施例中,根据所有第二待识别名称与标准名称的匹配结果,查找与唯一的标准名称匹配成功的第二待识别名称,若查找到多个该第二待识别名称,则确定该多个第二待识别名称中字符总数最多的第二待识别名称。本实施例通过将该多个第二待识别名称中字符总数最多的第二待识别名称作为与第一待识别名称匹配成功的标准名称,可以提高待识别名称识别的准确性。
此外,所有第二待识别名称中不存在与唯一的标准名称匹配成功的第二待识别名称,也即所有第二待识别名称与标准名称均匹配失败,或者存在与标准名称匹配成功的第二待识别名称,但这些第二待识别名称与多个标准名称匹配成功,此时将判断第一待识别名称识别失败。可以理解的是,若仅有一个第二待识别名称与唯一的标准名称匹配成功时,则将该第二待识别名称匹配成功的标准名称作为第一待识别名称匹配成功的标准名称。
本实施例中,当判断第一待识别名称识别失败时,进一步查找第一待识别名称的同义词进行匹配,以将第一待识别名称的同义词的匹配结果作为第一待识别名称的匹配结果,可以进一步提高名称识别的准确性。
可选地,选择与匹配模块302还用于当判断所有第二待识别名称中不存在与唯一的标准名称匹配成功的第二待识别名称之后,将第一待识别名称逐次去掉最后一个分词后与预定的多个标准名称进行匹配,直至分词减少后的第一待识别名称与唯一的标准名称匹配成功。
也即,当判断所有第二待识别名称中不存在与唯一的标准名称匹配成功的第二待识别名称之后,将第一待识别名称从右至左逐次减少一个分词,其中,每减少一个分词则将减少分词后的第一待识别名称与预定的多个标准名称进行匹配,直至减少分词后的第一待识别名称与唯一的标准名称匹配成功,匹配成功的标准名称作为与未减少分词的第一待识别名称匹配成功的标准名称。若第一待识别名称剩余的最后一个分词也匹配失败或者与多个标准名称匹配成功,则判断第一待识别名称识别失败。通过上述方式,有利于提高名称识别的准确性。
本发明实施例还提供一种服务器,如图4所示,其示出了本发明实施例所涉及的服务器的结构示意图,具体来讲:
该服务器可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图4中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
服务器还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该服务器还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,服务器还可以包括显示单元等,在此不再赘述。具体在本实施例中,服务器中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
获取用户发送的消息,例如获取用户通过游戏应用客户端发送的消息,当检测到消息中存在预定的关键字时,从消息中选取第一待识别名称,然后将第一待识别名称与预定的多个标准名进行匹配,当根据匹配结果判断第一待识别名称与唯一的标准名称匹配成功时,将第一待识别名称确定为虚拟物品的名称,该虚拟物品为匹配成功的标准名称所对应的虚拟物品,之后基于虚拟物品的名称的确定次数计算虚拟物品的热度。
其中,可以对所述消息按照预定的拆分规则进行语句拆分,得到多个分词,然后从多个分词中按照消息的词义顺序依次选取预定数量的分词,例如可以利用匹配窗口选取预定数量的分词,从而得到至少一个第一待识别名称,并将每个第一待识别名称与预定的多个标准名称进行匹配。
其中,若判断第一待识别名称不是与唯一的标准名称匹配成功,则还可以通过对第一待识别名称的同义词进行匹配,并根据第一待识别名称的同义词的匹配结果确定与第一待识别名称匹配成功的唯一的标准名称。或者,还可以将第一待识别名称逐次去掉最后一个分词后与预定的多个标准名称进行匹配,直至分词减少后的第一待识别名称与唯一的标准名称匹配成功。
其中,第一待识别名称和标准名称的匹配方式例如可以是先判断第一待识别名称中的每个字符是否均包含在当前匹配的标准名称中,若是,再判断第一待识别名称的字符总数是否大于或等于当前匹配的标准名称的字符总数的一半,若大于或等于,则判断第一待识别名称与当前匹配的标准名称匹配成功,否则判断第一待识别名称与当前匹配的标准名称匹配失败,其中,第一待识别名称中的其中一个字不包含在当前匹配的标准名称中时,判断第一待识别名称与当前匹配的标准名称匹配失败。
通过本发明实施例,当检测到消息中存在预定的关键字时,从消息中选取第一待识别名称,然后将第一待识别名称与预定的多个标准名称进行匹配,若第一待识别名称与唯一的标准名称匹配成功,则将第一待识别名称确定为虚拟物品的名称,该虚拟物品为匹配成功的标准名称所对应的虚拟物品,从而基于虚拟物品的名称的确定次数计算虚拟物品的热度,通过上述方式,可以识别出消息中的虚拟物品的简称,从而在根据虚拟物品的名称的确定次数计算虚拟物品的热度时能够将虚拟物品的简称出现的次数统计在内,可以提高计算结果的准确性。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例还提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种数据处理方法中的步骤。例如,该指令可以如下步骤:
获取用户发送的消息,例如获取用户通过游戏应用客户端发送的消息,当检测到消息中存在预定的关键字时,从消息中选取第一待识别名称,然后将第一待识别名称与预定的多个标准名进行匹配,当根据匹配结果判断第一待识别名称与唯一的标准名称匹配成功时,将第一待识别名称确定为虚拟物品的名称,该虚拟物品为匹配成功的标准名称所对应的虚拟物品,之后基于虚拟物品的名称的确定次数计算虚拟物品的热度。
其中,可以对所述消息按照预定的拆分规则进行语句拆分,得到多个分词,然后从多个分词中按照消息的词义顺序依次选取预定数量的分词,例如可以利用匹配窗口选取预定数量的分词,从而得到至少一个第一待识别名称,并将每个第一待识别名称与预定的多个标准名称进行匹配。
其中,若判断第一待识别名称不是与唯一的标准名称匹配成功,则还可以通过对第一待识别名称的同义词进行匹配,并根据第一待识别名称的同义词的匹配结果确定与第一待识别名称匹配成功的唯一的标准名称。或者,还可以将第一待识别名称逐次去掉最后一个分词后与预定的多个标准名称进行匹配,直至分词减少后的第一待识别名称与唯一的标准名称匹配成功。
其中,第一待识别名称和标准名称的匹配方式例如可以是先判断第一待识别名称中的每个字符是否均包含在当前匹配的标准名称中,若是,再判断第一待识别名称的字符总数是否大于或等于当前匹配的标准名称的字符总数的一半,若大于或等于,则判断第一待识别名称与当前匹配的标准名称匹配成功,否则判断第一待识别名称与当前匹配的标准名称匹配失败,其中,第一待识别名称中的其中一个字不包含在当前匹配的标准名称中时,判断第一待识别名称与当前匹配的标准名称匹配失败。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一种数据处理方法中的步骤,因此,可以实现本发明实施例所提供的任一种数据处理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本发明实施例所提供的一种数据处理方法和装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (15)
1.一种数据处理方法,其特征在于,包括:
获取用户发送的消息;
当检测到所述消息中存在预定的关键字时,从所述消息中选取第一待识别名称,并将选取的第一待识别名称与预定的多个标准名称进行匹配;
当根据匹配结果判断第一待识别名称与唯一的标准名称匹配成功时,将第一待识别名称确定为虚拟物品的名称,所述虚拟物品为匹配成功的标准名称所对应的虚拟物品;
基于虚拟物品的名称的确定次数计算虚拟物品的热度。
2.根据权利要求1所述的数据处理方法,其特征在于,所述从所述消息中选取第一待识别名称,并将选取的第一待识别名称与预定的多个标准名称进行匹配,包括:
对所述消息按照预定的拆分规则进行语句拆分,得到多个分词;
从所述多个分词中按照所述消息的语义顺序依次选取预定数量的分词,得到至少一个第一待识别名称,,并将每个第一待识别名称与预定的多个标准名称进行匹配。
3.根据权利要求2所述的数据处理方法,其特征在于,所述从所述多个分词中按照所述消息的语义顺序依次选取预定数量的分词,得到至少一个第一待识别名称,并将每个第一待识别名称与预定的多个标准名称进行匹配,包括:
将所述多个分词按照所述消息的语义顺序在单元格序列中依次排列,每个分词位于一个单元格内;
设置与预定数量等长度的匹配窗口,使所述匹配窗口与单元格序列中预定数量的单元格对齐以确定与匹配窗口对齐的分词,从而得到一个第一待识别名称;
将得到的一个第一待识别名称与预定的多个标准名称进行匹配;
当根据匹配结果判断所得到的一个第一待识别名称与唯一的标准名称匹配成功之后,还包括:将匹配窗口向右移动预定数量个单元格,以更新与匹配窗口对齐的分词,并返回执行将得到的一个第一待识别名称与预定的多个标准名称进行匹配的步骤,直至匹配窗口移出所述多个分词所在的单元格序列;
当根据匹配结果判断所得到的一个第一待识别名称不是与唯一的标准名称匹配成功之后,还包括:将匹配窗口向右移动一个单元格,以更新与匹配窗口对齐的分词,并返回执行将得到的一个第一待识别名称与预定的多个标准名称进行匹配的步骤,直至匹配窗口移出所述多个分词所在的单元格序列。
4.根据权利要求2所述的数据处理方法,其特征在于,当根据匹配结果判断第一待识别名称不是与唯一的标准名称匹配成功之后,还包括:
在预定的同义词库中查找第一待识别名称中每个分词的同义词;
根据查找到的分词的同义词生成第一待识别名称的同义词,得到第二待识别名称;
将第二待识别名称与预定的多个标准名称进行匹配;
若存在多个第二待识别名称与唯一的标准名称匹配成功,则确定所述多个第二待识别名称中字符总数最多的第二待识别名称;
将与所述字符总数最多的第二待识别名称匹配成功的标准名称作为与第一待识别名称匹配成功的标准名称;
若所有第二待识别名称中不存在与唯一的标准名称匹配成功的第二待识别名称,则判断第一待识别名称识别失败。
5.根据权利要求2所述的数据处理方法,其特征在于,当根据匹配结果判断第一待识别名称不是与唯一的标准名称匹配成功之后,还包括:
将第一待识别名称逐次去掉最后一个分词后与预定的多个标准名称进行匹配,直至分词减少后的第一待识别名称与唯一的标准名称匹配成功。
6.根据权利要求2所述的数据处理方法,其特征在于,所述对所述消息按照预定的拆分规则进行语句拆分,包括:
检测所述消息中是否存在标点符号;
若存在,则将所述消息中的标点符号删除,并对删除标点符号之后的消息按照预定的拆分规则进行语句拆分。
7.根据权利要求1所述的数据处理方法,其特征在于,所述将选取的第一待识别名称与预定的多个标准名称进行匹配,包括:
当第一待识别名称中的每个字符均包含在当前匹配的标准名称中时,判断第一待识别名称的字符总数是否大于或等于当前匹配的标准名称的字符总数的一半;
若大于或等于,则判断第一待识别名称与当前匹配的标准名称匹配成功,否则判断第一待识别名称与当前匹配的标准名称匹配失败;
当第一待识别名称中的其中一个字不包含在当前匹配的标准名称中时,判断第一待识别名称与当前匹配的标准名称匹配失败。
8.根据权利要求7所述的数据处理方法,其特征在于,当判断第一待识别名称的字符总数大于或等于当前匹配的标准名称的字符总数的一半之后,还包括:
若第一待识别名称为2个字符,且当前匹配的标准名称为3个字符,则判断第一待识别名称与当前匹配的标准名称匹配失败。
9.根据权利要求1-8任一项所述的数据处理方法,其特征在于,所述当检测到所述消息中存在预定的关键字时,从所述消息中选取第一待识别名称,包括:
检测所述消息中是否存在收、买、卖、购、出或售的关键字;
若存在,则判断消息中存在预定的关键字;
若不存在,则判断消息中不存在预定的关键字。
10.一种数据处理装置,其特征在于,包括:
获取模块,用于获取用户发送的消息;
选择与匹配模块,用于当检测到所述消息中存在预定的关键字时,从所述消息中选取第一待识别名称,并将选取的第一待识别名称与预定的多个标准名称进行匹配;
处理模块,用于当根据匹配结果判断第一待识别名称是与唯一的标准名称匹配成功时,将第一待识别名称确定为虚拟物品的名称,所述虚拟物品为匹配成功的标准名称所对应的虚拟物品,并基于虚拟物品的名称的确定次数计算虚拟物品的热度。
11.根据权利要求9所述的数据处理装置,其特征在于,所述选择与匹配模块具体用于:
对所述消息按照预定的拆分规则进行语句拆分,得到多个分词;
从所述多个分词中按照所述消息的语义顺序依次选取预定数量的分词,得到至少一个第一待识别名称,,并将每个第一待识别名称与预定的多个标准名称进行匹配。
12.根据权利要求11所述的数据处理装置,其特征在于,所述选择与匹配模块具体用于:
将所述多个分词按照所述消息的语义顺序在单元格序列中依次排列,每个分词位于一个单元格内;
设置与预定数量等长度的匹配窗口,使所述匹配窗口与单元格序列中预定数量的单元格对齐以确定与匹配窗口对齐的分词,从而得到一个第一待识别名称;
将得到的一个第一待识别名称与预定的多个标准名称进行匹配;
所述选择与匹配模块还用于当所述处理模块判断所得到的一个第一待识别名称与唯一的标准名称匹配成功之后,将匹配窗口向右移动预定数量个单元格,以更新与匹配窗口对齐的分词,并返回执行将得到的一个第一待识别名称与预定的多个标准名称进行匹配的步骤,直至匹配窗口移出所述多个分词所在的单元格序列,当所述处理模块判断所得到的一个第一待识别名称不是与唯一的标准名称匹配成功之后,将匹配窗口向右移动一个单元格,以更新与匹配窗口对齐的分词,并返回执行将得到的一个第一待识别名称与预定的多个标准名称进行匹配的步骤,直至匹配窗口移出所述多个分词所在的单元格序列。
13.根据权利要求11所述的数据处理装置,其特征在于,还包括同义词查找模块和生成模块;
所述同义词查找模块,用于当所述处理模块根据匹配结果判断第一待识别名称不是与唯一的标准名称匹配成功之后,在预定的同义词库中查找第一待识别名称中每个分词的同义词;
所述生成模块,用于根据查找到的分词的同义词生成第一待识别名称的同义词,得到第二待识别名称;
所述匹配模块还用于将第二待识别名称与预定的多个标准名称进行匹配;
所述处理模块还用于当存在多个第二待识别名称与唯一的标准名称匹配成功时,确定所述多个第二待识别名称中字符总数最多的第二待识别名称,并将与所述字符总数最多的第二待识别名称匹配成功的标准名称作为与第一待识别名称匹配成功的标准名称;若所有第二待识别名称中不存在与唯一的标准名称匹配成功的第二待识别名称,则判断第一待识别名称识别失败。
14.根据权利要求11所述的数据处理装置,其特征在于,
所述选择与匹配模块还用于当所述处理模块根据匹配结果判断第一待识别名称不是与唯一的标准名称匹配成功之后,将第一待识别名称逐次去掉最后一个分词后与预定的多个标准名称进行匹配,直至分词减少后的第一待识别名称与唯一的标准名称匹配成功。
15.一种存储介质,其特征在于,所述存储介质用于存储多条指令,所述指令适于处理器进行加载,以执行权利要求1-9任一项所述的数据处理方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710825174.5A CN110019992B (zh) | 2017-09-14 | 2017-09-14 | 一种数据处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710825174.5A CN110019992B (zh) | 2017-09-14 | 2017-09-14 | 一种数据处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110019992A true CN110019992A (zh) | 2019-07-16 |
CN110019992B CN110019992B (zh) | 2021-02-02 |
Family
ID=67186235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710825174.5A Active CN110019992B (zh) | 2017-09-14 | 2017-09-14 | 一种数据处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110019992B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113496117A (zh) * | 2020-04-02 | 2021-10-12 | 北京庖丁科技有限公司 | 交叉检查表格中单元格数字内容的方法和电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130173368A1 (en) * | 2011-09-29 | 2013-07-04 | Gregory Boutin | System and methods for popularity and influence indicators and commercial incentives based on object-related social network referrals |
CN103544167A (zh) * | 2012-07-13 | 2014-01-29 | 江苏新瑞峰信息科技有限公司 | 一种基于中文检索的逆向分词方法及装置 |
CN104077286A (zh) * | 2013-03-26 | 2014-10-01 | 北京京东尚科信息技术有限公司 | 商品信息的搜索方法及系统 |
CN106909600A (zh) * | 2016-07-07 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 用户背景信息的收集方法及装置 |
CN106951532A (zh) * | 2017-03-21 | 2017-07-14 | 深圳大学 | 商品流行度的演化分析方法及装置 |
-
2017
- 2017-09-14 CN CN201710825174.5A patent/CN110019992B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130173368A1 (en) * | 2011-09-29 | 2013-07-04 | Gregory Boutin | System and methods for popularity and influence indicators and commercial incentives based on object-related social network referrals |
CN103544167A (zh) * | 2012-07-13 | 2014-01-29 | 江苏新瑞峰信息科技有限公司 | 一种基于中文检索的逆向分词方法及装置 |
CN104077286A (zh) * | 2013-03-26 | 2014-10-01 | 北京京东尚科信息技术有限公司 | 商品信息的搜索方法及系统 |
CN106909600A (zh) * | 2016-07-07 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 用户背景信息的收集方法及装置 |
CN106951532A (zh) * | 2017-03-21 | 2017-07-14 | 深圳大学 | 商品流行度的演化分析方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113496117A (zh) * | 2020-04-02 | 2021-10-12 | 北京庖丁科技有限公司 | 交叉检查表格中单元格数字内容的方法和电子设备 |
CN113496117B (zh) * | 2020-04-02 | 2024-03-12 | 北京庖丁科技有限公司 | 交叉检查表格中单元格数字内容的方法和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110019992B (zh) | 2021-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9875309B2 (en) | Topical search system | |
Hasan et al. | Automatic keyphrase extraction: A survey of the state of the art | |
Meij et al. | Mapping queries to the Linking Open Data cloud: A case study using DBpedia | |
US7552112B2 (en) | Discovering associative intent queries from search web logs | |
CN101622618B (zh) | 具有基于概念的搜索和分级的信息检索系统、方法和软件 | |
WO2015093541A1 (ja) | シナリオ生成装置、及びそのためのコンピュータプログラム | |
KR101508260B1 (ko) | 문서 특징을 반영하는 요약문 생성 장치 및 방법 | |
KR20190038243A (ko) | 맥락을 이용하여 문서를 검색하는 시스템 및 방법 | |
JP2015121896A (ja) | フレーズペア収集装置、及びそのためのコンピュータプログラム | |
CN103038764A (zh) | 用于关键字提取的方法 | |
CN111611356A (zh) | 信息查找方法、装置、电子设备及可读存储介质 | |
WO2015093539A1 (ja) | 複雑述語テンプレート収集装置、及びそのためのコンピュータプログラム | |
CN107247743A (zh) | 一种司法类案检索方法及系统 | |
CN104050243B (zh) | 一种将搜索与社交相结合的网络搜索方法及其系统 | |
Rajagopal et al. | Commonsense-based topic modeling | |
JP3584848B2 (ja) | 文書処理装置、項目検索装置及び項目検索方法 | |
Mohasseb et al. | Domain specific syntax based approach for text classification in machine learning context | |
Liu et al. | Automatic keywords generation for contextual advertising | |
Krohn et al. | Concept lattices for knowledge management | |
CN110019992A (zh) | 一种数据处理方法和装置 | |
CN110457568A (zh) | 品牌词的识别方法及系统、对象推荐方法及系统 | |
Sunercan et al. | Wikipedia missing link discovery: A comparative study | |
Ramirez et al. | ACE: improving search engines via Automatic Concept Extraction | |
Wu et al. | Advertising keyword generation using active learning | |
Suanrnali et al. | Automatic text summarization using feature-based fuzzy extraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |