CN105472580B - 信息的处理方法、装置、终端及服务器 - Google Patents
信息的处理方法、装置、终端及服务器 Download PDFInfo
- Publication number
- CN105472580B CN105472580B CN201510792570.3A CN201510792570A CN105472580B CN 105472580 B CN105472580 B CN 105472580B CN 201510792570 A CN201510792570 A CN 201510792570A CN 105472580 B CN105472580 B CN 105472580B
- Authority
- CN
- China
- Prior art keywords
- information
- keyword
- template
- module
- source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/12—Messaging; Mailboxes; Announcements
- H04W4/14—Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/02—Reservations, e.g. for tickets, services or events
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/109—Time management, e.g. calendars, reminders, meetings or time accounting
- G06Q10/1093—Calendar-based scheduling for persons or groups
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
Abstract
本公开是关于信息的处理方法、装置、终端及服务器,该方法包括:当接收到信息时,判断所述信息是否为预定类别信息;在所述信息为所述预定类别信息时,将所述预定类别信息与关键词模板进行匹配;基于匹配成功的关键词模板提取所述信息中的关键信息。应用本公开实施例,能够从关键信息分布非常密集的票务信息中准确识别和抽取出诸如车次、坐席、出发/到达车站、出发/到达时间、订单号、乘车人等关键信息,以便基于关键信息对用户进行提醒,提高了用户体验。
Description
技术领域
本公开涉及移动通信技术领域,尤其涉及一种信息的处理方法、装置、终端及服务器。
背景技术
相关技术中,用户可以通过多种渠道购买火车票、飞机票等各种票务,当通过网点成功订票之后,通常会有订单通知短信发送给用户,该订单通知短信中通常包含乘车地点、时间、座号等内容,信息量非常大。
发明内容
为了克服相关技术中存在的问题,本公开提供了一种信息的处理方法、装置、终端及服务器。
根据本公开实施例的第一方面,提供一种信息的处理方法,包括:
当接收到信息时,判断所述信息是否为预定类别信息;
在所述信息为所述预定类别信息时,将所述预定类别信息与关键词模板进行匹配;
基于匹配成功的关键词模板提取所述信息中的关键信息。
可选的,所述关键词模板中包括独立存储的若干个关键词。
可选的,所述关键词模板中的各关键词采用预置标识符独立标识,以构建模板结构。
可选的,所述方法还包括:
提取所述关键词模板中的订票点名称;
将所述订票点名称相同的关键词模板存储到同一个模板集合中。
可选的,所述方法还包括:
对各所述模板集合,基于所述模板集合所包含的各关键词模板的匹配集合对各所述关键词模板进行优先级运算;
基于计算出的优先级对属于同一所述模板集合中的各所述关键词模板进行拓扑排序。
可选的,所述基于所述模板集合所包含的各关键词模板的匹配集合对各所述关键词模板进行优先级运算,包括:
确定所述模板集合中的各关键词模板所能够匹配的短信集合;
在一个短信集合是另一个短信集合的真子集时,确定所述一个短信集合对应的关键词模板的优先级高于所述另一个短信集合对应的关键词模板;
在一个短信集合与另一个短信集合相同时,确定所述一个短信集合对应的关键词模板与所述另一个短信集合对应的关键词模板的优先级相同;
将优先级相同的一个关键词模板保留,将优先级相同的其他关键词模板删除。
可选的,所述判断所述信息是否为预定类别信息,包括:
提取所述信息中的来源信息,所述来源信息包括订票点名称和/或来信号码;
判断所述来源信息是否为预定类别信息来源;
在判断为所述来源信息是所述预定类别信息来源时,确定所述信息为预定类别信息。
可选的,所述判断所述来源信息是否为预定类别信息来源,包括:
接收和存储服务器发送的来源信息;
将所述信息中的来源信息与存储的来源信息进行匹配;
在所述信息中的来源信息与存储的来源信息匹配成功时,确定所述信息中的来源信息为预定类别信息来源。
可选的,所述方法还包括:
当接收到所述服务器发送的来源更新信息,基于所述来源更新信息对所存储的来源信息进行更新。
可选的,所述判断所述来源信息是否为预定类别信息来源,包括:
读取预置的过滤条件;
基于所述过滤条件对所述信息中的来源信息进行过滤;
将匹配所述过滤条件的来源信息确定为预定类别信息来源。
可选的,所述方法还包括:
获取设定时间段内接收到的预定类别信息;
提取所述预定类别信息中的关键词;
基于所述关键词构建关键词模板。
可选的,所述方法还包括:
在第一次接收到符合所述过滤条件的信息,且没有存储与所述信息对应的关键词模板时,提取所述信息中的关键词;
基于所述关键词构建关键词模板。
可选的,所述方法还包括:
在后续接收到符合所述过滤条件的信息时,提取所接收到的信息中的关键词;
基于提取的关键词对所述关键词模板进行调整更新。
可选的,所述方法还包括:
在包含所述过滤条件的所述来源信息是未存储的来源信息时,将所述来源信息独立存储到所述关键词模板中。
可选的,所述基于匹配成功的关键词模板提取所述信息中的关键信息,包括:
基于匹配成功的关键词模板的模板结构,从所述信息中抽取所述预置标识符对应的关键信息。
可选的,所述方法还包括:
对所述关键信息进行应用。
可选的,所述对所述关键信息进行应用,包括:
以预设的显示格式对所述关键信息进行显示。
可选的,所述对所述关键信息进行应用,包括:
提取所述关键信息中的关键事件信息;
将所述关键事件信息记录在记事本/提醒时间中。
可选的,所述对所述关键信息进行应用,包括:
基于所述关键信息中的日期查询生活信息;
将所述生活信息发送给用户,
其中,所述生活信息包括天气信息、住宿信息、饮食信息、衣着信息、交通信息、购物信息及通讯信息中的一项或多项。
根据本公开实施例的第二方面,提供一种信息的处理方法,包括:
获取设定时间段内收到的信息;
基于所述信息中的关键词建立关键词模板;
将所述关键词模板发送至终端,以使所述终端在接收到预定类别信息时,基于匹配成功的关键词模板提取所述预定类别信息中的关键信息。
可选的,所述基于所述信息中的关键词建立关键词模板,包括:
提取所述信息中的关键词;
将各所述关键词采用预置标识符独立标识,并将各所述关键词独立存储在所构建的关键词模板中。
可选的,所述方法还包括:
提取所述关键词模板中的订票点名称;
将所述订票点名称相同的关键词模板存储到同一个模板集合中。
可选的,所述方法还包括:
对各所述模板集合,基于所述模板集合所包含的各关键词模板的匹配集合对各所述关键词模板进行优先级运算;
基于计算出的优先级对属于同一所述模板集合中的各所述关键词模板进行拓扑排序。
可选的,所述基于所述模板集合所包含的各关键词模板的匹配集合对各所述关键词模板进行优先级运算,包括:
确定所述模板集合中的各关键词模板所能够匹配的短信集合;
在一个短信集合是另一个短信集合的真子集时,确定所述一个短信集合对应的关键词模板的优先级高于所述另一个短信集合对应的关键词模板;
在一个短信集合与另一个短信集合相同时,确定所述一个短信集合对应的关键词模板与所述另一个短信集合对应的关键词模板的优先级相同;
将优先级相同的一个关键词模板保留,将优先级相同的其他关键词模板删除。
可选的,所述方法还包括:
在接收到的信息的信息排列格式与存储的信息排列格式不一致时,提取所述信息中的关键词;
基于所述关键词更新对应的关键词模板。
根据本公开实施例的第三方面,提供一种信息的处理装置,包括:
判断模块,被配置为当接收到信息时,判断所述信息是否为预定类别信息;
匹配模块,被配置为在所述判断模块判断所述信息为所述预定类别信息时,将所述预定类别信息与关键词模板进行匹配;
第一提取模块,被配置为基于所述匹配模块匹配成功的关键词模板提取所述信息中的关键信息。
可选的,所述匹配模块进行匹配的所述关键词模板中包括独立存储的若干个关键词。
可选的,所述匹配模块进行匹配的所述关键词模板中的各关键词采用预置标识符独立标识,以构建模板结构。
可选的,所述装置还包括:
第二提取模块,被配置为提取所述关键词模板中的订票点名称;
存储模块,被配置为将所述第二提取模块所提取的所述订票点名称相同的关键词模板存储到同一个模板集合中。
可选的,所述装置还包括:
第一运算模块,被配置为对各所述模板集合,基于所述模板集合所包含的各关键词模板的匹配集合对各所述关键词模板进行优先级运算;
第一排序模块,被配置为基于所述第一运算模块计算出的优先级对属于同一所述模板集合中的各所述关键词模板进行拓扑排序。
可选的,所述第一运算模块包括:
第一确定子模块,被配置为确定所述模板集合中的各关键词模板所能够匹配的短信集合;
第二确定子模块,被配置为在所述第一确定子模块确定为一个短信集合是另一个短信集合的真子集时,确定所述一个短信集合对应的关键词模板的优先级高于所述另一个短信集合对应的关键词模板;
第三确定子模块,被配置为在所述第二确定子模块确定为一个短信集合与另一个短信集合相同时,确定所述一个短信集合对应的关键词模板与所述另一个短信集合对应的关键词模板的优先级相同;
第一处理子模块,被配置为将所述第三确定子模块确定为优先级相同的一个关键词模板保留,将优先级相同的其他关键词模板删除。
可选的,所述判断模块包括:
第一提取子模块,被配置为提取所述信息中的来源信息,所述来源信息包括订票点名称和/或来信号码;
第一判断子模块,被配置为判断所述第一提取子模块提取的所述来源信息是否为预定类别信息来源;
第四确定子模块,被配置为在所述第一判断子模块判断为所述来源信息是所述预定类别信息来源时,确定所述信息为预定类别信息。
可选的,所述第一判断子模块包括:
第一存储子模块,被配置为接收和存储服务器发送的来源信息;
来源匹配子模块,被配置为将所述信息中的来源信息与所述第一存储子模块存储的来源信息进行匹配;
第一确定子模块,被配置为在所述来源匹配子模块将所述信息中的来源信息与存储的来源信息匹配成功时,确定所述信息中的来源信息为预定类别信息来源。
可选的,所述第一判断子模块还包括:
更新子模块,被配置为当接收到所述服务器发送的来源更新信息,基于所述来源更新信息对所存储的来源信息进行更新。
可选的,所述第一判断子模块包括:
读取子模块,被配置为读取预置的过滤条件;
过滤子模块,被配置为基于所述读取子模块读取的过滤条件对所述信息中的来源信息进行过滤;
第二确定子模块,被配置为将匹配所述过滤条件的来源信息确定为预定类别信息来源。
可选的,所述第一判断子模块还包括:
获取子模块,被配置为获取设定时间段内接收到的预定类别信息;
第一提取子模块,被配置为提取所述获取子模块所获取的所述预定类别信息中的关键词;
第一构建子模块,被配置为基于所述第一提取子模块提取的关键词构建关键词模板。
可选的,所述第一判断子模块还包括:
第二提取子模块,被配置为在第一次接收到符合所述过滤条件的信息,且没有存储与所述信息对应的关键词模板时,提取所述信息中的关键词;
第二构建子模块,被配置为基于所述第二提取子模块提取的所述关键词构建关键词模板。
可选的,所述第一判断子模块还包括:
第三提取子模块,被配置为在后续接收到符合所述过滤条件的信息时,提取所接收到的信息中的关键词;
更新子模块,被配置为基于所述第三提取子模块提取的关键词对所述关键词模板进行调整更新。
可选的,所述第一判断子模块还包括:
第二存储子模块,被配置为在包含所述过滤条件的所述来源信息是未存储的来源信息时,将所述来源信息独立存储到所述关键词模板中。
可选的,所述第一提取模块包括:
抽取子模块,被配置为基于匹配成功的关键词模板的模板结构,从所述信息中抽取所述预置标识符对应的关键信息。
可选的,所述装置还包括:
应用模块,被配置为对所述关键信息进行应用。
可选的,所述应用模块包括:
显示子模块,被配置为以预设的显示格式对所述关键信息进行显示。
可选的,所述应用模块包括:
第二提取子模块,被配置为提取所述关键信息中的关键事件信息;
记录子模块,被配置为将所述第二提取子模块提取的所述关键事件信息记录在记事本/提醒时间中。
可选的,所述应用模块包括:
查询子模块,被配置为基于所述关键信息中的日期查询生活信息;
发送子模块,被配置为将所述查询子模块查询的生活信息发送给用户,
其中,所述生活信息包括天气信息、住宿信息、饮食信息、衣着信息、交通信息、购物信息及通讯信息中的一项或多项。
根据本公开实施例的第四方面,提供一种信息的处理装置,包括:
获取模块,被配置为获取设定时间段内收到的信息;
建立模块,被配置为基于所述获取模块获取的信息中的关键词建立关键词模板;
发送模块,被配置为将所述建立模块建立的关键词模板发送至终端,以使所述终端在接收到预定类别信息时,基于匹配成功的关键词模板提取所述预定类别信息中的关键信息。
可选的,所述建立模块包括:
第三提取子模块,被配置为提取所述信息中的关键词;
第一存储子模块,被配置为将各所述第三提取子模块提取的关键词采用预置标识符独立标识,并将各所述关键词独立存储在所构建的关键词模板中。
可选的,所述建立模块还包括:
第四提取子模块,被配置为提取所述关键词模板中的订票点名称;
第二存储子模块,被配置为将所述第四提取子模块提取的所述订票点名称相同的关键词模板存储到同一个模板集合中。
可选的,所述建立模块还包括:
第二运算子模块,被配置为对各所述模板集合,基于所述模板集合所包含的各关键词模板的匹配集合对各所述关键词模板进行优先级运算;
第二排序子模块,被配置为基于所述第二运算模块计算出的优先级对属于同一所述模板集合中的各所述关键词模板进行拓扑排序。
可选的,所述第二运算子模块包括:
第五确定子模块,被配置为确定所述模板集合中的各关键词模板所能够匹配的短信集合;
第六确定子模块,被配置为在所述第五确定子模块确定一个短信集合是另一个短信集合的真子集时,确定所述一个短信集合对应的关键词模板的优先级高于所述另一个短信集合对应的关键词模板;
第七确定子模块,被配置为在所述第六确定子模块确定一个短信集合与另一个短信集合相同时,确定所述一个短信集合对应的关键词模板与所述另一个短信集合对应的关键词模板的优先级相同;
第二处理子模块,被配置为将所述第七确定子模块确定为优先级相同的一个关键词模板保留,将优先级相同的其他关键词模板删除。
可选的,所述建立模块还包括:
第五提取子模块,被配置为在接收到的信息的信息排列格式与存储的信息排列格式不一致时,提取所述信息中的关键词;
更新子模块,被配置为基于所述第五提取子模块提取的关键词更新对应的关键词模板。
根据本公开实施例的第五方面,提供一种终端,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:
当接收到信息时,判断所述信息是否为预定类别信息;
在所述信息为所述预定类别信息时,将所述预定类别信息与关键词模板进行匹配;
基于匹配成功的关键词模板提取所述信息中的关键信息。
根据本公开实施例的第六方面,提供一种服务器,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:
获取设定时间段内收到的信息;
基于所述信息中的关键词建立关键词模板;
将所述关键词模板发送至终端,以使所述终端在接收到预定类别信息时,基于匹配成功的关键词模板提取所述预定类别信息中的关键信息。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开中终端可以判断所接收到的信息是否为预定类别信息;在该信息为预定类别信息时,将预定类别信息与关键词模板进行匹配;然后基于匹配成功的关键词模板提取信息中的关键信息。本公开能够从关键信息分布非常密集的票务信息中准确识别和抽取出诸如车次、坐席、出发/到达车站、出发/到达时间、订单号、乘车人等关键信息,以便基于关键信息对用户进行提醒,提高了用户体验。
本公开中终端可以将属于同一订票点的关键词模板存储到同一模板集合中,以提高后续匹配模板的准确度和效率。
本公开中终端可以对属于同一模板集合中的关键词模板进行优先级运算,并基于优先级进行排序,从而在同一信息能够与多个关键词模板匹配成功时,匹配到最高优先级的关键词模板。
本公开中终端可以基于各关键词模板所能够匹配的短信集合确定优先级,对于相同优先级的关键词模板,只保留一个关键词模板,以避免冗余信息占用内存。
本公开中终端可以基于信息的来源信息,即信息中的公司名称或来信号码来确定该信息是否为预定类别信息,即票务信息,该方式能够准确的确定信息是否为预定类别信息。
本公开中终端可以接收和存储服务器发送的来源信息,并将接收到的信息中的来源信息与该存储的来源信息进行匹配。
本公开中终端可以在接收到服务器发送的来源更新信息时,对存储的来源信息进行更新,以便总能够存储最新的来源信息。
本公开中终端可以设置过滤条件,并将来源信息与过滤条件进行匹配,以便过滤到预定类别信息来源的信息。
本公开中终端可以基于后续接收到的符合过滤条件的信息对已构建的关键词模板进行调整更新,以提高该关键词模板的匹配准确率。
本公开中终端可以将未存储的包含过滤条件的来源信息独立存储到关键词模板,以充实关键词模板的内容,提高匹配的准确度。
本公开中终端可以词汇-句法模式的方法进行关键信息的抽取,从而实现对密集型知识的准确抽取。
本公开中终端可以以预设的显示格式、例如颜色、排布方式等对关键信息进行显示,以使用户能够快速获取到关键信息。
本公开中终端可以将关键信息中的关键事件信息记录在记事本或提醒时间中,以便于对用户进行提醒,以免用户忘记重要事件。
本公开中终端可以基于关键信息获取生活信息,从而方便了用户的出行,为用户提供多方位的便利,提高了用户体验。
本公开中服务器可以基于若干信息中的关键词建立关键词模板,并将构建的关键词模板发送给终端,以便终端在接收到预定类别信息时,基于匹配成功的关键词模板提取关键信息,便于基于关键信息对用户进行提醒,提高了用户体验。
本公开中服务器可以将关键词采用预置标识符独立标识,并将各关键词独立存储在所构建的关键词模板中。
本公开中服务器可以将同一家订票点的关键词模板存储到同一个模板集合中,以提高后续的模板匹配效率。
本公开中服务器可以对属于同一模板集合中的关键词模板进行优先级运算,并基于优先级进行排序,从而在同一信息能够与多个关键词模板匹配成功时,匹配到最高优先级的关键词模板。
本公开中服务器可以基于各关键词模板所能够匹配的短信集合确定优先级,对于相同优先级的关键词模板,只保留一个关键词模板,以避免冗余信息占用内存。
本公开中服务器可以在接收到的信息的排列格式与存储的排列格式不一致时,基于关键词更新对应的关键词模板,以保证关键词模板的准确度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本公开根据一示例性实施例示出的一种信息的处理方法流程图。
图2是本公开根据一示例性实施例示出的另一种信息的处理方法流程图。
图3是本公开根据一示例性实施例示出的另一种信息的处理方法流程图。
图4是本公开根据一示例性实施例示出的另一种信息的处理方法流程图。
图5是本公开根据一示例性实施例示出的另一种信息的处理方法流程图。
图6是本公开根据一示例性实施例示出的另一种信息的处理方法流程图。
图7是本公开根据一示例性实施例示出的信息的处理应用场景示意图。
图8是本公开根据一示例性实施例示出的一种信息的处理装置框图。
图9是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图10是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图11是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图12是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图13是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图14是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图15是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图16是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图17是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图18是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图19是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图20是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图21是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图22是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图23是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图24是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图25是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图26是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图27是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图28是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图29是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图30是本公开根据一示例性实施例示出的另一种信息的处理装置框图。
图31是本公开根据一示例性实施例示出的一种用于信息的处理装置的一结构示意图。
图32是本公开根据一示例性实施例示出的另一种用于信息的处理装置的一结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
如图1所示,图1是根据一示例性实施例示出的一种信息的处理方法流程图,该方法可以用于终端中,包括以下步骤:
步骤101、当接收到信息时,判断信息是否为预定类别信息。
本公开中的终端可以是任何具有上网功能的智能终端,例如,可以具体为手机、平板电脑、PDA(Personal Digital Assistant,个人数字助理)等。其中,终端可以通过无线局域网接入路由器,并通过路由器访问公网上的服务器。
其中,该信息可以为短信,预定类别可以为票务信息,票务类型包括火车票、飞机票、门票、电影票、演出票等中的一种或多种。本公开步骤中可以通过短信中的订票点名称、来信号码等来确定该信息是否为预定类别信息。
步骤102、在该信息为预定类别信息时,将预定类别信息与关键词模板进行匹配。
本公开实施例中,关键词模板为服务器针对票务信息构建的模板,该模板中包括独立存储的若干个关键词,而且关键词模板中的各关键词采用预置标识符独立标识。该关键词可以包括:订单号、乘坐人名字、出发日期、车次、列车或航班类型、席别、车厢号、坐席号、历时、出发车站、到达车站中的多项信息。
步骤103、基于匹配成功的关键词模板提取信息中的关键信息。
本公开步骤中,关键信息即与关键词模板中的关键词相匹配的信息。
上述实施例中,终端可以判断所接收到的信息是否为预定类别信息;在该信息为预定类别信息时,将预定类别信息与关键词模板进行匹配;然后基于匹配成功的关键词模板提取信息中的关键信息。本公开能够从关键信息分布非常密集的票务信息中准确识别和抽取出诸如车次、坐席、出发/到达车站、出发/到达时间、订单号、乘车人等关键信息,以便基于关键信息对用户进行提醒,提高了用户体验。
如图2所示,图2是根据一示例性实施例示出的另一种信息的处理方法流程图,该方法可以用于终端中,该方法还可以包括以下步骤:
步骤201、提取关键词模板中的订票点名称。
其中,订票点名称可以为火车站、旅行社、订票公司等订票点的名称,例如12306、阿里旅行·去啊等。
步骤202、将订票点名称相同的关键词模板存储到同一个模板集合中。
本公开实施例中,将同一家订票点的关键词模板存储到同一个模板集合中,以提高后续的模板匹配效率。由于同一家订票点的发送号码具有一定的规律,例如具有相同的号码前缀或是号码后缀,且所发送的信息中的内容一般包括一些特定的关键字,例如:公司名,因而可以根据发送号码规则和短信关键字构建模板映射关系,即从号码和关键字到模板集合的映射。
步骤203、对各模板集合,基于模板集合所包含的各关键词模板的匹配集合对各关键词模板进行优先级运算。
也就是说,本公开步骤中,计算同一模板集合中的各模板的优先级。在一种公开方式中,通过下述方式进行优先级运算:
确定模板集合中的各关键词模板所能够匹配的短信集合;在一个短信集合是另一个短信集合的真子集时,确定一个短信集合对应的关键词模板的优先级高于另一个短信集合对应的关键词模板;在一个短信集合与另一个短信集合相同时,确定一个短信集合对应的关键词模板与另一个短信集合对应的关键词模板的优先级相同;将优先级相同的一个关键词模板保留,将优先级相同的其他关键词模板删除。
下面以一个具体的例子进行说明:
短信“【铁路客服】(1/2)订单号XXXXXXXXXX,张女士您已购04月14日D8045次06车03A号、03B号,鞍山西11:09开。张无忌、赵敏请尽快换取纸质车票。”
可以分别被两条关键词模板匹配上。其中,
第一个关键词模板为:
“<?火车票订单模板>”的“<?坐席号>”匹配“03A”;“<?出发车站>”匹配“、03B号,鞍山西”;“<?乘车人>”匹配“张无忌、赵敏”。
第二个关键词模板为:
“<?火车票订单模板>”的“<?坐席号1>”匹配“03A”;“<?坐席号2>”匹配“03B”;“<?出发车站>”匹配“鞍山西”;“<?乘车人>”匹配“张无忌、赵敏”。
由于短信中订了两张票,而第二个关键词模板中包括两个坐席号信息,因而本公开更倾向于该短信能够优先被第二个关键词模板匹配。因此在这种情况下,需要预先对关键词模板进行优先级排序,希望越精准的关键词模板,优先级越高。
基于这个前提,对于关键词模板A和关键词模板B,假设能够与关键词模板A相匹配的短信集合为S_A,能够与关键词模板B相匹配的短信集合为S_B;如果短信集合S_A是短信集合S_B的真子集,即关键词模板A能匹配的短信,关键词模板B都能匹配,则关键词模板A的优先级高于关键词模板B的优先级。
如果短信集合S_B是短信集合S_A的真子集,即关键词模板B能匹配的短信,关键词模板A都能匹配,则关键词模板B的优先级高于关键词模板A的优先级。
如果短信集合S_B与短信集合S_A相等,则关键词模板A与关键词模板B等价,那么没必要存储两个相同优先级的关键词模板,可以删除关键词模板A或关键词模板B中的任意一个。
步骤204、基于计算出的优先级对属于同一模板集合中的各关键词模板进行拓扑排序。
通过上述步骤,根据关键词模板之间的优先级定义关系,可以对每家订票公司的模板集合中的所有关键词模板进行拓扑排序。例如,可以基于优先级从高到低的顺序对关键词模板进行排序。排序优先级高的关键词模板会被优先匹配。
如图3所示,图3是根据一示例性实施例示出的另一种信息的处理方法流程图,该方法可以用于终端中,并且在图1所示实施例的基础上,步骤101还可以包括以下步骤:
步骤301、提取信息中的来源信息。
本公开步骤中,该来源信息可以包括订票点(公司)名称和/或来信号码,对于票务信息,该来源信息为订票点名称或公司名称,或来信号码;对于信用卡账单信息,该来源信息为银行名称或来信号码。
步骤302、判断来源信息是否为预定类别信息来源。
本公开实施例中的预定类别信息来源指的是针对票务信息的订票点名称或来信号码。
步骤303、在判断为来源信息是预定类别信息来源时,确定信息为预定类别信息。
本公开实施例中,该预定类别信息来源可以为终端中预存储的预定类别信息来源,例如:接收和存储服务器发送的来源信息,那么可以将接收到的信息中的来源信息与存储的来源信息进行匹配;在接收到的信息中的来源信息与存储的来源信息匹配成功时,确定信息中的来源信息为预定类别信息来源。
在这种方式下,当服务器端的来源信息有更新时,还可以将来源更新信息发送给终端,终端基于该来源更新信息对存储的来源信息进行更新,以便更为准确的对接收到的信息中的来源信息进行匹配。
在另一种公开方式中,终端还可以设置过滤条件,那么在提取了接收到的信息中的来源信息之后,可以基于过滤条件对提取的来源信息进行过滤,然后将匹配过滤条件的来源信息确定为预定类别信息来源。其中,该过滤条件也可以包括订票点名称、订票点电话等信息。
在另一种公开方式中,终端在第一次接收到符合过滤条件的信息,且没有存储与该信息对应的关键词模板时,提取该信息中的关键词;基于该关键词构建关键词模板。那么在终端后续接收到符合过滤条件的信息时,可以提取所接收到的信息中的关键词;并基于提取的关键词对构建的关键词模板进行调整更新。
在另一种公开方式中,在包含过滤条件的来源信息是未存储的来源信息时,将来源信息独立存储到关键词模板中。
在另一种公开方式中,终端可以获取设定时间段内接收到的预定类别信息(票务信息),并提取预定类别信息中的关键词,然后基于关键词构建关键词模板。
如图4所示,图4是根据一示例性实施例示出的另一种信息的处理方法流程图,该方法可以用于终端中,并且在图1所示实施例的基础上,上述步骤103可以包括以下步骤:
步骤401、基于匹配成功的关键词模板的模板结构,从所接收的信息中抽取预置标识符对应的关键信息。
并且在步骤401之后还可以包括:
步骤402、对关键信息进行应用。
在一种公开方式中,对关键信息进行应用可以包括:以预设的显示格式对关键信息进行显示。例如,以特定的颜色对关键信息进行标识和显示。
在另一种公开方式中,对关键信息进行应用可以包括:提取关键信息中的关键事件信息,将关键事件信息记录在记事本/提醒时间中。通过这种方式能够实现对用户的及时提醒,例如在发车时间之前的设定时间对用户进行提醒,以便于用户合理安排时间,避免错过发车。
在另一种公开方式中,对关键信息进行应用可以包括:基于关键信息中的日期查询生活信息;将生活信息发送给用户,其中,该生活信息包括天气信息、住宿信息、饮食信息、衣着信息、交通信息及购物信息中的一项或多项。
例如用户去某地出差,通过票务信息中的关键词可以确定目的地以及到达日期,因而能够确定该目的地在到达日期的天气、酒店位置及价位、酒店周围的餐饮信息、目的地的温度及穿衣建议、目的地的出行建议、特产、购物等信息,因而可以提供给用户,方便用户出行,为用户提供了多方位的便利。
此外,终端还可以提取每次收到的订票短信的车次信息、到站信息,如果在提取的信息中属于同一车次和地点的行程的次数多于设定阈值,或在提取的信息中属于同一车次和地点的行程的次数高于设定比例;则将该车次和地点存储为用户的常用信息。从而基于该常用信息能够计算下一次乘车的可能时间,在下一次乘车的可能日期到达之前,可以向用户发送提醒信息,提醒用户买票;或者在乘车日期到来之前,预先将出发站点和到站点的天气情况发送给用户,或者提前自动订票,或者与12306合作,将订票信息发送给12306,定时订票,或者在春节期间,将亲情套餐的优惠信息发送给用户或自动开通,或推荐酒店折扣信息之类。基于订单信息对用户提醒的方式不限于上述列举的各种方式。
如图5所示,图5是根据一示例性实施例示出的另一种信息的处理方法流程图,该方法可以用于服务器中,该方法可以包括以下步骤:
步骤501、获取设定时间段内收到的信息。
本公开实施例中,服务器可以获取多个终端中收到的若干条信息。
步骤502、基于信息中的关键词建立关键词模板。
其中,该关键词可以为“车次”、“发车时间”、“座号”、“票号”等信息。
步骤503、将关键词模板发送至终端,以使终端在接收到预定类别信息时,基于匹配成功的关键词模板提取预定类别信息中的关键信息。
下面以具体的例子来说明关键词模板的建立过程。
例如,对于下述火车票订单短信:
“【铁路客服】订单号XXXXXXXXXX,张先生您已购06月26日G7566次05车10B号合肥南13:44开。张无忌请尽快换取纸质车票。”
通过提取关键词“订单号”、“乘车人”、“出发日期”等,可以得到下述关键词模板:
<?火车票订单模板>→“【铁路客服】订单号<?订单号>,<?称呼>您已购<?出发日期><?车次>次<?车厢号>车<?坐席号>号<?出发车站><?出发时间>开。<?乘车人>请尽快换取纸质车票。”
对于下述火车票订单短信:
“【铁路客服】订单号XXXXXXXXXX,张女士您已购04月14日D8045次06车03A号、03B号,鞍山西11:09开。张无忌、赵敏请尽快换取纸质车票。”
通过提取关键词“订单号”、“乘车人”、“出发日期”、“坐席号”等,可以得到下述关键词模板:
<?火车票订单模板>→“【铁路客服】订单号<?订单号>,<?称呼>您已购<?出发日期><?车次>次<?车厢号>车<?坐席号1>号、<?坐席号2>号,<?出发车站><?出发时间>开。<?乘车人>请尽快换取纸质车票。”
其中,关键词模板采用上下文无关文法表达如下:
<?订单号> →<#ENG><#NUM>
<?称呼> →<*>先生|<*>女士
<?出发日期> →MM月dd日
<?车次> →<#ENG><#NUM>|<#NUM>
<?车厢号> →<#NUM>
<?坐席号1> →<?坐席号>
<?坐席号2> →<?坐席号>
<?坐席号> →<#NUM><#ENG>|<#NUM>
<?出发车站> →<*>
<?出发时间> →HH:mm
<?乘车人> →<*>
其中,以“<?”开头的为非终结符;产生式右部的“|”表示“或者”;“<#ENG>”匹配一个英文字符串;“<#NUM>”匹配一个数字字符串;“MM”、“dd”、“HH”、“mm”分别匹配月、日、小时、分钟;“<*>”匹配任意字符串。
在上述关键词模板中,“<?火车票订单模板>”产生式右部以“<?”开头的非终结符作为本公开实施例中需要抽取的知识点。
由于火车票还包含很多其他信息,例如:坐席类型:卧铺、硬座、二等座、商务座等,因而本公开构建的关键词模板不限于上述列举的内容。
如图6所示,图6是根据一示例性实施例示出的另一种信息的处理方法流程图,该方法可以用于服务器中,并建立在上述图5所示实施例的基础上,步骤503可以包括以下步骤:
步骤601、提取信息中的关键词。
步骤602、将各关键词采用预置标识符独立标识,并将各关键词独立存储在所构建的关键词模板中。
步骤603、提取关键词模板中的订票点名称。
步骤604、将订票点名称相同的关键词模板存储到同一个模板集合中。
步骤605、对各模板集合,基于模板集合所包含的各关键词模板的匹配集合对各关键词模板进行优先级运算。
在一种公开方式中,本公开步骤中的优先级运算过程如下:
确定模板集合中的各关键词模板所能够匹配的短信集合;在一个短信集合是另一个短信集合的真子集时,确定一个短信集合对应的关键词模板的优先级高于另一个短信集合对应的关键词模板;在一个短信集合与另一个短信集合相同时,确定一个短信集合对应的关键词模板与另一个短信集合对应的关键词模板的优先级相同;将优先级相同的一个关键词模板保留,将优先级相同的其他关键词模板删除。
由于上述实例中的通配符“<*>”可以匹配任意字符串,因此会出现有的短信能被同一模板集合中的两个或多个关键词模板匹配上的情况,因而需要预先计算各关键词模板的优先级。
步骤606、基于计算出的优先级对属于同一模板集合中的各关键词模板进行拓扑排序。在一种公开方式中,还可以包括:
在接收到的信息的信息排列格式与存储的信息排列格式不一致时,提取信息中的关键词;基于该关键词更新对应的关键词模板。
如图7所示,图7是本公开根据一示例性实施例示出的一种信息额的处理方法的应用场景示意图。在图7所示的场景中,包括:作为终端的智能手机以及通过网络连接的服务器。
其中,服务器获取设定时间段内收到的信息;提取该信息中的关键词,建立关键词模板,将各关键词采用预置标识符独立标识,并将各关键词独立存储在所构建的关键词模板中,并提取关键词模板中的订票点名称;将订票点名称相同的关键词模板存储到同一个模板集合中,然后计算同一模板集合中的各关键词模板的优先级并基于优先级的大小进行排序,服务器将构建的关键词模板发送给终端。终端在接收到信息时,提取信息中的来信号码,基于该来信号码确定该信息为预定类别信息,即票务信息;然后终端将该信息与服务器发送的关键词模板进行匹配,如果匹配成功的关键词有两个以上,则读取关键词模板的优先级,取最高优先级的关键词模板,并基于该关键词模板提取信息中的关键信息。
在图7所示应用场景中,实现信息的处理的具体过程可以参见前述对图1-6中的描述,在此不再赘述。
与前述信息的处理方法实施例相对应,本公开还提供了信息的处理装置及其所应用的终端及服务器的实施例。
如图8所示,图8是本公开根据一示例性实施例示出的一种信息的处理装置框图,该装置可以包括:判断模块810、匹配模块820和第一提取模块830。
判断模块810,被配置为当接收到信息时,判断信息是否为预定类别信息;
匹配模块820,被配置为在判断模块810判断该信息为预定类别信息时,将预定类别信息与关键词模板进行匹配;
第一提取模块830,被配置为基于匹配模块820匹配成功的关键词模板提取信息中的关键信息。
其中,匹配模块820进行匹配的关键词模板中包括独立存储的若干个关键词。
匹配模块820进行匹配的关键词模板中的各关键词采用预置标识符独立标识,以构建模板结构。
上述实施例中,终端可以判断所接收到的信息是否为预定类别信息;在该信息为预定类别信息时,将预定类别信息与关键词模板进行匹配;然后基于匹配成功的关键词模板提取信息中的关键信息。本公开能够从关键信息分布非常密集的票务信息中准确识别和抽取出诸如车次、坐席、出发/到达车站、出发/到达时间、订单号、乘车人等关键信息,以便基于关键信息对用户进行提醒,提高了用户体验。
如图9所示,图9是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图8所示实施例的基础上,该装置还可以包括:第二提取模块840和存储模块850。
第二提取模块840,被配置为提取关键词模板中的订票点名称;
存储模块850,被配置为将第二提取模块840所提取的订票点名称相同的关键词模板存储到同一个模板集合中。
上述实施例中,终端可以将属于同一订票点的关键词模板存储到同一模板集合中,以提高后续匹配模板的准确度和效率。
如图10所示,图10是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图9所示实施例的基础上,该装置还可以包括:第一运算模块860和第一排序模块870。
第一运算模块860,被配置为对各模板集合,基于模板集合所包含的各关键词模板的匹配集合对各关键词模板进行优先级运算;
第一排序模块870,被配置为基于第一运算模块860计算出的优先级对属于同一模板集合中的各关键词模板进行拓扑排序。
上述实施例中,终端可以对属于同一模板集合中的关键词模板进行优先级运算,并基于优先级进行排序,从而在同一信息能够与多个关键词模板匹配成功时,匹配到最高优先级的关键词模板。
如图11所示,图11是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图9所示实施例的基础上,第一运算模块860可以包括:第一确定子模块861、第二确定子模块862、第三确定子模块863和第一处理子模块864。
第一确定子模块861,被配置为确定模板集合中的各关键词模板所能够匹配的短信集合;
第二确定子模块862,被配置为在第一确定子模块861确定为一个短信集合是另一个短信集合的真子集时,确定一个短信集合对应的关键词模板的优先级高于另一个短信集合对应的关键词模板;
第三确定子模块863,被配置为在第二确定子模块862确定为一个短信集合与另一个短信集合相同时,确定一个短信集合对应的关键词模板与另一个短信集合对应的关键词模板的优先级相同;
第一处理子模块864,被配置为将第三确定子模块863确定为优先级相同的一个关键词模板保留,将优先级相同的其他关键词模板删除。
上述实施例中,终端可以基于各关键词模板所能够匹配的短信集合确定优先级,对于相同优先级的关键词模板,只保留一个关键词模板,以避免冗余信息占用内存。
如图12所示,图12是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图8-11任一所示实施例的基础上,该判断模块810可以包括:第一提取子模块811、第一判断子模块812和第四确定子模块813。
第一提取子模块811,被配置为提取信息中的来源信息,该来源信息包括订票点名称和/或来信号码;
第一判断子模块812,被配置为判断第一提取子模块811提取的来源信息是否为预定类别信息来源;
第四确定子模块813,被配置为在第一判断子模块812判断为来源信息是预定类别信息来源时,确定该信息为预定类别信息。
上述实施例中,终端可以基于信息的来源信息,即信息中的公司名称或来信号码来确定该信息是否为预定类别信息,即票务信息,该方式能够准确的确定信息是否为预定类别信息。
如图13所示,图13是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图12所示实施例的基础上,第一判断子模块812可以包括:第一存储子模块8121、来源匹配子模块8122和第一确定子模块8123。
第一存储子模块8121,被配置为接收和存储服务器发送的来源信息;
来源匹配子模块8122,被配置为将信息中的来源信息与第一存储子模块8121存储的来源信息进行匹配;
第一确定子模块8123,被配置为在来源匹配子模块8122将信息中的来源信息与存储的来源信息匹配成功时,确定信息中的来源信息为预定类别信息来源。
上述实施例中,终端可以接收和存储服务器发送的来源信息,并将接收到的信息中的来源信息与该存储的来源信息进行匹配。
如图14所示,图14是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图13所示实施例的基础上,第一判断子模块812还包括:更新子模块8124。
更新子模块8124,被配置为当接收到服务器发送的来源更新信息,基于来源更新信息对所存储的来源信息进行更新。
上述实施例中,终端可以在接收到服务器发送的来源更新信息时,对存储的来源信息进行更新,以便总能够存储最新的来源信息。
如图15所示,图15是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图12所示实施例的基础上,第一判断子模块812还可以包括:读取子模块8125、过滤子模块8126和第二确定子模块8127。
读取子模块8125,被配置为读取预置的过滤条件;
过滤子模块8126,被配置为基于读取子模块8125读取的过滤条件对信息中的来源信息进行过滤;
第二确定子模块8127,被配置为将匹配过滤条件的来源信息确定为预定类别信息来源。
上述实施例中,终端可以设置过滤条件,并将来源信息与过滤条件进行匹配,以便过滤到预定类别信息来源的信息。
如图16所示,图16是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图15所示实施例的基础上,第一判断子模块812还可以包括:获取子模块8128、第一提取子模块8129和第一构建子模块81210。
获取子模块8128,被配置为获取设定时间段内接收到的预定类别信息;
第一提取子模块8129,被配置为提取获取子模块8128所获取的预定类别信息中的关键词;
第一构建子模块81210,被配置为基于第一提取子模块8129提取的关键词构建关键词模板。
上述实施例中,终端可以基于预定类别信息中的关键词构建关键词模板。
如图17所示,图17是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图15所示实施例的基础上,第一判断子模块812还可以包括:第二提取子模块81211和第二构建子模块81212。
第二提取子模块81211,被配置为在第一次接收到符合过滤条件的信息,且没有存储与信息对应的关键词模板时,提取信息中的关键词;
第二构建子模块81212,被配置为基于第二提取子模块81211提取的关键词构建关键词模板。
上述实施例中,终端可以在第一次接收到符合过滤条件的信息且并未存储该信息对应的关键词模板时,基于该信息中的关键词构建关键词模板。
如图18所示,图18是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图17所示实施例的基础上,第一判断子模块812还可以包括:第三提取子模块81213和更新子模块81214。
第三提取子模块81213,被配置为在后续接收到符合过滤条件的信息时,提取所接收到的信息中的关键词;
更新子模块81214,被配置为基于第三提取子模块81213提取的关键词对关键词模板进行调整更新。
上述实施例中,终端可以基于后续接收到的符合过滤条件的信息对已构建的关键词模板进行调整更新,以提高该关键词模板的匹配准确率。
如图19所示,图19是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图13或15所示实施例的基础上,第一判断子模块812还可以包括:第二存储子模块81216。
第二存储子模块81216,被配置为在包含过滤条件的来源信息是未存储的来源信息时,将来源信息独立存储到关键词模板中。
上述实施例中,终端可以将未存储的包含过滤条件的来源信息独立存储到关键词模板,以充实关键词模板的内容,提高匹配的准确度。
如图20所示,图20是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图8所示实施例的基础上,第一提取模块830可以包括:抽取子模块831。
抽取子模块831,被配置为基于匹配成功的关键词模板的模板结构,从信息中抽取预置标识符对应的关键信息。
上述实施例中,终端可以词汇-句法模式的方法进行关键信息的抽取,从而实现对密集型知识的准确抽取。
如图21所示,图21是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图8-11任一所示实施例的基础上,该装置还可以包括:应用模块880。
应用模块880,被配置为对关键信息进行应用。
如图22所示,图22是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图21所示实施例的基础上,该应用模块880可以包括:显示子模块881。
显示子模块881,被配置为以预设的显示格式对关键信息进行显示。
上述实施例中,终端可以以预设的显示格式、例如颜色、排布方式等对关键信息进行显示,以使用户能够快速获取到关键信息。
如图23所示,图23是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图21所示实施例的基础上,该应用模块880还可以包括:第二提取子模块882和记录子模块883。
第二提取子模块882,被配置为提取关键信息中的关键事件信息;
记录子模块883,被配置为将第二提取子模块882提取的关键事件信息记录在记事本/提醒时间中。
上述实施例中,终端可以将关键信息中的关键事件信息记录在记事本或提醒时间中,以便于对用户进行提醒,以免用户忘记重要事件。
如图24所示,图24是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图21所示实施例的基础上,该应用模块880还可以包括:查询子模块884和发送子模块885。
查询子模块884,被配置为基于关键信息中的日期查询生活信息;
发送子模块885,被配置为将查询子模块884查询的生活信息发送给用户,其中,该生活信息包括天气信息、住宿信息、饮食信息、衣着信息、交通信息、购物信息及通讯信息中的一项或多项。
上述实施例中,终端可以基于关键信息获取生活信息,从而方便了用户的出行,为用户提供多方位的便利,提高了用户体验。
上述图8至图24示出的信息的处理装置实施例可以应用在终端中。
如图25所示,图25是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该装置可以包括:获取模块910、建立模块920和发送模块930。
获取模块910,被配置为获取设定时间段内收到的信息;
建立模块920,被配置为基于获取模块910获取的信息中的关键词建立关键词模板;
发送模块930,被配置为将建立模块920建立的关键词模板发送至终端,以使终端在接收到预定类别信息时,基于匹配成功的关键词模板提取预定类别信息中的关键信息。
上述实施例中,服务器可以基于若干信息中的关键词建立关键词模板,并将构建的关键词模板发送给终端,以便终端在接收到预定类别信息时,基于匹配成功的关键词模板提取关键信息,便于基于关键信息对用户进行提醒,提高了用户体验。
如图26所示,图26是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图25所示实施例的基础上,该建立模块920可以包括:第三提取子模块921和第一存储子模块922。
第三提取子模块921,被配置为提取信息中的关键词;
第一存储子模块922,被配置为将各第三提取子模块921提取的关键词采用预置标识符独立标识,并将各关键词独立存储在所构建的关键词模板中。
上述实施例中,服务器可以将关键词采用预置标识符独立标识,并将各关键词独立存储在所构建的关键词模板中。
如图27所示,图27是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图26所示实施例的基础上,建立模块920还可以包括:第四提取子模块923和第二存储子模块924。
第四提取子模块923,被配置为提取关键词模板中的订票点名称;
第二存储子模块924,被配置为将第四提取子模块923提取的订票点名称相同的关键词模板存储到同一个模板集合中。
上述实施例中,服务器可以将同一家订票点的关键词模板存储到同一个模板集合中,以提高后续的模板匹配效率。
如图28所示,图28是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图27所示实施例的基础上,建立模块920还可以包括:第二运算子模块925和第二排序子模块926。
第二运算子模块925,被配置为对各模板集合,基于模板集合所包含的各关键词模板的匹配集合对各关键词模板进行优先级运算;
第二排序子模块926,被配置为基于第二运算子模块925计算出的优先级对属于同一模板集合中的各关键词模板进行拓扑排序。
上述实施例中,服务器可以对属于同一模板集合中的关键词模板进行优先级运算,并基于优先级进行排序,从而在同一信息能够与多个关键词模板匹配成功时,匹配到最高优先级的关键词模板。
如图29所示,图29是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图26所示实施例的基础上,第二运算子模块925可以包括:第五确定子模块9251、第六确定子模块9252、第七确定子模块9253和第二处理子模块9254。
第五确定子模块9251,被配置为确定模板集合中的各关键词模板所能够匹配的短信集合;
第六确定子模块9252,被配置为在第五确定子模块9251确定一个短信集合是另一个短信集合的真子集时,确定一个短信集合对应的关键词模板的优先级高于另一个短信集合对应的关键词模板;
第七确定子模块9253,被配置为在第六确定子模块9252确定一个短信集合与另一个短信集合相同时,确定一个短信集合对应的关键词模板与另一个短信集合对应的关键词模板的优先级相同;
第二处理子模块9254,被配置为将第七确定子模块9253确定为优先级相同的一个关键词模板保留,将优先级相同的其他关键词模板删除。
上述实施例中,服务器可以基于各关键词模板所能够匹配的短信集合确定优先级,对于相同优先级的关键词模板,只保留一个关键词模板,以避免冗余信息占用内存。
如图30所示,图30是本公开根据一示例性实施例示出的另一种信息的处理装置框图,该实施例在前述图25所示实施例的基础上,建立模块920还可以包括:第五提取子模块927和更新子模块928。
第五提取子模块927,被配置为在接收到的信息的信息排列格式与存储的信息排列格式不一致时,提取信息中的关键词;
更新子模块928,被配置为基于第五提取子模块927提取的关键词更新对应的关键词模板。
上述实施例中,服务器可以在接收到的信息的排列格式与存储的排列格式不一致时,基于关键词更新对应的关键词模板,以保证关键词模板的准确度。
上述图25-30示出的信息的处理装置实施例可以应用在用于构建关键词模板的服务器中。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
与图8相应的,本公开还提供一种终端,该终端包括有:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
当接收到信息时,判断所述信息是否为预定类别信息;
在所述信息为所述预定类别信息时,将所述预定类别信息与关键词模板进行匹配;
基于匹配成功的关键词模板提取所述信息中的关键信息。
与图25相应的,本公开还提供一种服务器,该服务器包括有:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取设定时间段内收到的信息;
基于所述信息中的关键词建立关键词模板;
将所述关键词模板发送至终端,以使所述终端在接收到预定类别信息时,基于匹配成功的关键词模板提取所述预定类别信息中的关键信息。
如图31所示,图31是本公开根据一示例性实施例示出的一种用于信息的处理装置3100的一结构示意图(终端设备侧)。例如,装置3100可以是具有路由功能的移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图31,装置3100可以包括以下一个或多个组件:处理组件3102,存储器3104,电源组件3106,多媒体组件3108,音频组件3110,输入/输出(I/O)的接口3112,传感器组件3114,以及通信组件3116。
处理组件3102通常控制装置3100的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件3102可以包括一个或多个处理器3120来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件3102可以包括一个或多个模块,便于处理组件3102和其他组件之间的交互。例如,处理组件3102可以包括多媒体模块,以方便多媒体组件3108和处理组件3102之间的交互。
存储器3104被配置为存储各种类型的数据以支持在装置3100的操作。这些数据的示例包括用于在装置3100上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器3104可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件3106为装置3100的各种组件提供电力。电源组件3106可以包括电源管理系统,一个或多个电源,及其他与为装置3100生成、管理和分配电力相关联的组件。
多媒体组件3108包括在所述装置3100和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件3108包括一个前置摄像头和/或后置摄像头。当装置3100处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件3110被配置为输出和/或输入音频信号。例如,音频组件3110包括一个麦克风(MIC),当装置3100处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器3104或经由通信组件3116发送。在一些实施例中,音频组件3110还包括一个扬声器,用于输出音频信号。
I/O接口3112为处理组件3102和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件3114包括一个或多个传感器,用于为装置3100提供各个方面的状态评估。例如,传感器组件3114可以检测到装置3100的打开/关闭状态,组件的相对定位,例如所述组件为装置3100的显示器和小键盘,传感器组件3114还可以检测装置3100或装置3100一个组件的位置改变,用户与装置3100接触的存在或不存在,装置3100方位或加速/减速和装置3100的温度变化。传感器组件3114可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件3114还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件3114还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器,微波传感器或温度传感器。
通信组件3116被配置为便于装置3100和其他设备之间有线或无线方式的通信。装置3100可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件3116经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件3116还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置3100可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器3104,上述指令可由装置3100的处理器3120执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
如图32所示,图32是根据一示例性实施例示出的一种用于信息的处理装置3200的一结构示意图(服务器侧)。例如,装置3200可以被提供为一路由设备。参照图32,装置3200包括处理组件3222,其进一步包括一个或多个处理器,以及由存储器3232所代表的存储器资源,用于存储可由处理部件3222的执行的指令,例如应用程序。存储器3232中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件3222被配置为执行指令,以执行上述访问网页的方法。
装置3200还可以包括一个电源组件3226被配置为执行装置3200的电源管理,一个有线或无线网络接口3250被配置为将装置3200连接到网络,和一个输入输出(I/O)接口3258。装置3200可以操作基于存储在存储器3232的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
以上所述仅为本公开的较佳实施例而已,并不用以限制本公开,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开保护的范围之内。
Claims (44)
1.一种信息的处理方法,其特征在于,包括:
当接收到信息时,判断所述信息是否为预定类别信息;
在所述信息为所述预定类别信息时,将所述预定类别信息与关键词模板进行匹配;
基于匹配成功的关键词模板提取所述信息中的关键信息;
所述方法还包括:
提取所述关键词模板中的订票点名称;
将所述订票点名称相同的关键词模板存储到同一个模板集合中;
对各所述模板集合,基于所述模板集合所包含的各关键词模板所匹配的短信集合对各所述关键词模板进行优先级运算;
基于计算出的优先级对属于同一所述模板集合中的各所述关键词模板进行拓扑排序。
2.根据权利要求1所述的方法,其特征在于,所述关键词模板中包括独立存储的若干个关键词。
3.根据权利要求1所述的方法,其特征在于,所述关键词模板中的各关键词采用预置标识符独立标识,以构建模板结构。
4.根据权利要求1所述的方法,其特征在于,所述基于所述模板集合所包含的各关键词模板所匹配的短信集合对各所述关键词模板进行优先级运算,包括:
确定所述模板集合中的各关键词模板所能够匹配的短信集合;
在一个短信集合是另一个短信集合的真子集时,确定所述一个短信集合对应的关键词模板的优先级高于所述另一个短信集合对应的关键词模板;
在一个短信集合与另一个短信集合相同时,确定所述一个短信集合对应的关键词模板与所述另一个短信集合对应的关键词模板的优先级相同;
将优先级相同的一个关键词模板保留,将优先级相同的其他关键词模板删除。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述判断所述信息是否为预定类别信息,包括:
提取所述信息中的来源信息,所述来源信息包括订票点名称和/或来信号码;
判断所述来源信息是否为预定类别信息来源;
在判断为所述来源信息是所述预定类别信息来源时,确定所述信息为预定类别信息。
6.根据权利要求5所述的方法,其特征在于,所述判断所述来源信息是否为预定类别信息来源,包括:
接收和存储服务器发送的来源信息;
将所述信息中的来源信息与存储的来源信息进行匹配;
在所述信息中的来源信息与存储的来源信息匹配成功时,确定所述信息中的来源信息为预定类别信息来源。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
当接收到所述服务器发送的来源更新信息,基于所述来源更新信息对所存储的来源信息进行更新。
8.根据权利要求5所述的方法,其特征在于,所述判断所述来源信息是否为预定类别信息来源,包括:
读取预置的过滤条件;
基于所述过滤条件对所述信息中的来源信息进行过滤;
将匹配所述过滤条件的来源信息确定为预定类别信息来源。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
获取设定时间段内接收到的预定类别信息;
提取所述预定类别信息中的关键词;
基于所述关键词构建关键词模板。
10.根据权利要求8所述的方法,其特征在于,所述方法还包括:
在第一次接收到符合所述过滤条件的信息,且没有存储与所述信息对应的关键词模板时,提取所述信息中的关键词;
基于所述关键词构建关键词模板。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
在后续接收到符合所述过滤条件的信息时,提取所接收到的信息中的关键词;
基于提取的关键词对所述关键词模板进行调整更新。
12.根据权利要求8所述的方法,其特征在于,所述方法还包括:
在包含所述过滤条件的所述来源信息是未存储的来源信息时,将所述来源信息独立存储到所述关键词模板中。
13.根据权利要求3所述的方法,其特征在于,所述基于匹配成功的关键词模板提取所述信息中的关键信息,包括:
基于匹配成功的关键词模板的模板结构,从所述信息中抽取所述预置标识符对应的关键信息。
14.根据权利要求1-4中任一项所述的方法,其特征在于,所述方法还包括:
对所述关键信息进行应用。
15.根据权利要求14所述的方法,其特征在于,所述对所述关键信息进行应用,包括:
以预设的显示格式对所述关键信息进行显示。
16.根据权利要求14所述的方法,其特征在于,所述对所述关键信息进行应用,包括:
提取所述关键信息中的关键事件信息;
将所述关键事件信息记录在记事本/提醒时间中。
17.根据权利要求14所述的方法,其特征在于,所述对所述关键信息进行应用,包括:
基于所述关键信息中的日期查询生活信息;
将所述生活信息发送给用户,
其中,所述生活信息包括天气信息、住宿信息、饮食信息、衣着信息、交通信息、购物信息及通讯信息中的一项或多项。
18.一种信息的处理方法,其特征在于,包括:
获取设定时间段内收到的信息;
基于所述信息中的关键词建立关键词模板;
将所述关键词模板发送至终端,以使所述终端在接收到预定类别信息时,基于匹配成功的关键词模板提取所述预定类别信息中的关键信息;
所述方法还包括:
提取所述关键词模板中的订票点名称;
将所述订票点名称相同的关键词模板存储到同一个模板集合中;
对各所述模板集合,基于所述模板集合所包含的各关键词模板所匹配的短信集合对各所述关键词模板进行优先级运算;
基于计算出的优先级对属于同一所述模板集合中的各所述关键词模板进行拓扑排序。
19.根据权利要求18所述的方法,其特征在于,所述基于所述信息中的关键词建立关键词模板,包括:
提取所述信息中的关键词;
将各所述关键词采用预置标识符独立标识,并将各所述关键词独立存储在所构建的关键词模板中。
20.根据权利要求18所述的方法,其特征在于,所述基于所述模板集合所包含的各关键词模板所匹配的短信集合对各所述关键词模板进行优先级运算,包括:
确定所述模板集合中的各关键词模板所能够匹配的短信集合;
在一个短信集合是另一个短信集合的真子集时,确定所述一个短信集合对应的关键词模板的优先级高于所述另一个短信集合对应的关键词模板;
在一个短信集合与另一个短信集合相同时,确定所述一个短信集合对应的关键词模板与所述另一个短信集合对应的关键词模板的优先级相同;
将优先级相同的一个关键词模板保留,将优先级相同的其他关键词模板删除。
21.根据权利要求19所述的方法,其特征在于,所述方法还包括:
在接收到的信息的信息排列格式与存储的信息排列格式不一致时,提取所述信息中的关键词;
基于所述关键词更新对应的关键词模板。
22.一种信息的处理装置,其特征在于,包括:
判断模块,被配置为当接收到信息时,判断所述信息是否为预定类别信息;
匹配模块,被配置为在所述判断模块判断所述信息为所述预定类别信息时,将所述预定类别信息与关键词模板进行匹配;
第一提取模块,被配置为基于所述匹配模块匹配成功的关键词模板提取所述信息中的关键信息;
第二提取模块,被配置为提取所述关键词模板中的订票点名称;
存储模块,被配置为将所述第二提取模块所提取的所述订票点名称相同的关键词模板存储到同一个模板集合中;
第一运算模块,被配置为对各所述模板集合,基于所述模板集合所包含的各关键词模板所匹配的短信集合对各所述关键词模板进行优先级运算;
第一排序模块,被配置为基于所述第一运算模块计算出的优先级对属于同一所述模板集合中的各所述关键词模板进行拓扑排序。
23.根据权利要求22所述的装置,其特征在于,所述匹配模块进行匹配的所述关键词模板中包括独立存储的若干个关键词。
24.根据权利要求22所述的装置,其特征在于,所述匹配模块进行匹配的所述关键词模板中的各关键词采用预置标识符独立标识,以构建模板结构。
25.根据权利要求22所述的装置,其特征在于,所述第一运算模块包括:
第一确定子模块,被配置为确定所述模板集合中的各关键词模板所能够匹配的短信集合;
第二确定子模块,被配置为在所述第一确定子模块确定为一个短信集合是另一个短信集合的真子集时,确定所述一个短信集合对应的关键词模板的优先级高于所述另一个短信集合对应的关键词模板;
第三确定子模块,被配置为在所述第二确定子模块确定为一个短信集合与另一个短信集合相同时,确定所述一个短信集合对应的关键词模板与所述另一个短信集合对应的关键词模板的优先级相同;
第一处理子模块,被配置为将所述第三确定子模块确定为优先级相同的一个关键词模板保留,将优先级相同的其他关键词模板删除。
26.根据权利要求22-25中任一项所述的装置,其特征在于,所述判断模块包括:
第一提取子模块,被配置为提取所述信息中的来源信息,所述来源信息包括订票点名称和/或来信号码;
第一判断子模块,被配置为判断所述第一提取子模块提取的所述来源信息是否为预定类别信息来源;
第四确定子模块,被配置为在所述第一判断子模块判断为所述来源信息是所述预定类别信息来源时,确定所述信息为预定类别信息。
27.根据权利要求26所述的装置,其特征在于,所述第一判断子模块包括:
第一存储子模块,被配置为接收和存储服务器发送的来源信息;
来源匹配子模块,被配置为将所述信息中的来源信息与所述第一存储子模块存储的来源信息进行匹配;
第一确定子模块,被配置为在所述来源匹配子模块将所述信息中的来源信息与存储的来源信息匹配成功时,确定所述信息中的来源信息为预定类别信息来源。
28.根据权利要求27所述的装置,其特征在于,所述第一判断子模块还包括:
更新子模块,被配置为当接收到所述服务器发送的来源更新信息,基于所述来源更新信息对所存储的来源信息进行更新。
29.根据权利要求26所述的装置,其特征在于,所述第一判断子模块包括:
读取子模块,被配置为读取预置的过滤条件;
过滤子模块,被配置为基于所述读取子模块读取的过滤条件对所述信息中的来源信息进行过滤;
第二确定子模块,被配置为将匹配所述过滤条件的来源信息确定为预定类别信息来源。
30.根据权利要求29所述的装置,其特征在于,所述第一判断子模块还包括:
获取子模块,被配置为获取设定时间段内接收到的预定类别信息;
第一提取子模块,被配置为提取所述获取子模块所获取的所述预定类别信息中的关键词;
第一构建子模块,被配置为基于所述第一提取子模块提取的关键词构建关键词模板。
31.根据权利要求29所述的装置,其特征在于,所述第一判断子模块还包括:
第二提取子模块,被配置为在第一次接收到符合所述过滤条件的信息,且没有存储与所述信息对应的关键词模板时,提取所述信息中的关键词;
第二构建子模块,被配置为基于所述第二提取子模块提取的所述关键词构建关键词模板。
32.根据权利要求31所述的装置,其特征在于,所述第一判断子模块还包括:
第三提取子模块,被配置为在后续接收到符合所述过滤条件的信息时,提取所接收到的信息中的关键词;
更新子模块,被配置为基于所述第三提取子模块提取的关键词对所述关键词模板进行调整更新。
33.根据权利要求29所述的装置,其特征在于,所述第一判断子模块还包括:
第二存储子模块,被配置为在包含所述过滤条件的所述来源信息是未存储的来源信息时,将所述来源信息独立存储到所述关键词模板中。
34.根据权利要求24所述的装置,其特征在于,所述第一提取模块包括:
抽取子模块,被配置为基于匹配成功的关键词模板的模板结构,从所述信息中抽取所述预置标识符对应的关键信息。
35.根据权利要求22-25中任一项所述的装置,其特征在于,所述装置还包括:
应用模块,被配置为对所述关键信息进行应用。
36.根据权利要求35所述的装置,其特征在于,所述应用模块包括:
显示子模块,被配置为以预设的显示格式对所述关键信息进行显示。
37.根据权利要求35所述的装置,其特征在于,所述应用模块包括:
第二提取子模块,被配置为提取所述关键信息中的关键事件信息;
记录子模块,被配置为将所述第二提取子模块提取的所述关键事件信息记录在记事本/提醒时间中。
38.根据权利要求35所述的装置,其特征在于,所述应用模块包括:
查询子模块,被配置为基于所述关键信息中的日期查询生活信息;
发送子模块,被配置为将所述查询子模块查询的生活信息发送给用户,其中,所述生活信息包括天气信息、住宿信息、饮食信息、衣着信息、交通信息、购物信息及通讯信息中的一项或多项。
39.一种信息的处理装置,其特征在于,包括:
获取模块,被配置为获取设定时间段内收到的信息;
建立模块,被配置为基于所述获取模块获取的信息中的关键词建立关键词模板;
发送模块,被配置为将所述建立模块建立的关键词模板发送至终端,以使所述终端在接收到预定类别信息时,基于匹配成功的关键词模板提取所述预定类别信息中的关键信息;
所述建立模块还包括:
第四提取子模块,被配置为提取所述关键词模板中的订票点名称;
第二存储子模块,被配置为将所述第四提取子模块提取的所述订票点名称相同的关键词模板存储到同一个模板集合中;
第二运算子模块,被配置为对各所述模板集合,基于所述模板集合所包含的各关键词模板所匹配的短信集合对各所述关键词模板进行优先级运算;
第二排序子模块,被配置为基于所述第二运算模块计算出的优先级对属于同一所述模板集合中的各所述关键词模板进行拓扑排序。
40.根据权利要求39所述的装置,其特征在于,所述建立模块包括:
第三提取子模块,被配置为提取所述信息中的关键词;
第一存储子模块,被配置为将各所述第三提取子模块提取的关键词采用预置标识符独立标识,并将各所述关键词独立存储在所构建的关键词模板中。
41.根据权利要求39所述的装置,其特征在于,所述第二运算子模块包括:
第五确定子模块,被配置为确定所述模板集合中的各关键词模板所能够匹配的短信集合;
第六确定子模块,被配置为在所述第五确定子模块确定一个短信集合是另一个短信集合的真子集时,确定所述一个短信集合对应的关键词模板的优先级高于所述另一个短信集合对应的关键词模板;
第七确定子模块,被配置为在所述第六确定子模块确定一个短信集合与另一个短信集合相同时,确定所述一个短信集合对应的关键词模板与所述另一个短信集合对应的关键词模板的优先级相同;
第二处理子模块,被配置为将所述第七确定子模块确定为优先级相同的一个关键词模板保留,将优先级相同的其他关键词模板删除。
42.根据权利要求40所述的装置,其特征在于,所述建立模块还包括:
第五提取子模块,被配置为在接收到的信息的信息排列格式与存储的信息排列格式不一致时,提取所述信息中的关键词;
更新子模块,被配置为基于所述第五提取子模块提取的关键词更新对应的关键词模板。
43.一种终端,其特征在于,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:
当接收到信息时,判断所述信息是否为预定类别信息;
在所述信息为所述预定类别信息时,将所述预定类别信息与关键词模板进行匹配;
基于匹配成功的关键词模板提取所述信息中的关键信息;
所述处理器还被配置为:
提取所述关键词模板中的订票点名称;
将所述订票点名称相同的关键词模板存储到同一个模板集合中;
对各所述模板集合,基于所述模板集合所包含的各关键词模板所匹配的短信集合对各所述关键词模板进行优先级运算;
基于计算出的优先级对属于同一所述模板集合中的各所述关键词模板进行拓扑排序。
44.一种服务器,其特征在于,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:
获取设定时间段内收到的信息;
基于所述信息中的关键词建立关键词模板;
将所述关键词模板发送至终端,以使所述终端在接收到预定类别信息时,基于匹配成功的关键词模板提取所述预定类别信息中的关键信息;
所述处理器还被配置为:
提取所述关键词模板中的订票点名称;
将所述订票点名称相同的关键词模板存储到同一个模板集合中;
对各所述模板集合,基于所述模板集合所包含的各关键词模板所匹配的短信集合对各所述关键词模板进行优先级运算;
基于计算出的优先级对属于同一所述模板集合中的各所述关键词模板进行拓扑排序。
Priority Applications (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510792570.3A CN105472580B (zh) | 2015-11-17 | 2015-11-17 | 信息的处理方法、装置、终端及服务器 |
KR1020167011187A KR20180072503A (ko) | 2015-11-17 | 2015-12-29 | 정보 처리 방법, 장치, 단말기 및 서버 |
JP2016520078A JP2018506751A (ja) | 2015-11-17 | 2015-12-29 | 情報の処理方法、装置、端末およびサーバ |
RU2016116718A RU2658164C2 (ru) | 2015-11-17 | 2015-12-29 | Способ (варианты) и устройство (варианты) обработки информации, терминал и сервер |
MX2016007017A MX2016007017A (es) | 2015-11-17 | 2015-12-29 | Metodo de procesamiento de informacion, aparato de procesamiento de informacion, terminal y servidor. |
PCT/CN2015/099604 WO2017084181A1 (zh) | 2015-11-17 | 2015-12-29 | 信息的处理方法、装置、终端及服务器 |
EP16174298.6A EP3171308A1 (en) | 2015-11-17 | 2016-08-10 | Information processing method, information processing apparatus, terminal, and server |
US15/354,783 US20170140048A1 (en) | 2015-11-17 | 2016-11-17 | Information processing method, apparatus, terminal and server |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510792570.3A CN105472580B (zh) | 2015-11-17 | 2015-11-17 | 信息的处理方法、装置、终端及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105472580A CN105472580A (zh) | 2016-04-06 |
CN105472580B true CN105472580B (zh) | 2019-08-06 |
Family
ID=55609771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510792570.3A Active CN105472580B (zh) | 2015-11-17 | 2015-11-17 | 信息的处理方法、装置、终端及服务器 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20170140048A1 (zh) |
EP (1) | EP3171308A1 (zh) |
JP (1) | JP2018506751A (zh) |
KR (1) | KR20180072503A (zh) |
CN (1) | CN105472580B (zh) |
MX (1) | MX2016007017A (zh) |
RU (1) | RU2658164C2 (zh) |
WO (1) | WO2017084181A1 (zh) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11356396B2 (en) * | 2016-12-30 | 2022-06-07 | Dropbox, Inc. | Content management system with integrated email service |
CN106791174B (zh) * | 2017-01-17 | 2020-06-23 | 北京安云世纪科技有限公司 | 一种闹钟调整方法、装置及移动终端 |
CN106997558A (zh) * | 2017-04-07 | 2017-08-01 | 携程旅游网络技术(上海)有限公司 | 订单信息的提醒系统及方法 |
CN107168948A (zh) * | 2017-04-19 | 2017-09-15 | 广州视源电子科技股份有限公司 | 一种语句识别方法与系统 |
CN109120497B (zh) * | 2017-06-22 | 2022-02-22 | 北京嘀嘀无限科技发展有限公司 | 即时消息推送方法及装置 |
CN107329945B (zh) * | 2017-07-21 | 2021-03-05 | 北京奇虎科技有限公司 | 短消息的展示处理方法、展示处理装置以及移动终端 |
CN107643879A (zh) * | 2017-09-27 | 2018-01-30 | 北京小米移动软件有限公司 | 信息清理方法、装置及终端 |
CN107645603A (zh) * | 2017-09-29 | 2018-01-30 | 努比亚技术有限公司 | 一种信息标示方法、设备及计算机可读存储介质 |
JP2019079224A (ja) * | 2017-10-24 | 2019-05-23 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
CN108182172A (zh) * | 2017-12-07 | 2018-06-19 | 中仁车汇科技发展(深圳)有限公司 | 一种信息提取的方法和设备以及计算机存储介质 |
US10958609B2 (en) * | 2017-12-08 | 2021-03-23 | Verizon Media Inc. | Controlling a graphical user interface based upon a prediction of a messaging action of a messaging account |
CN108600530A (zh) * | 2018-04-10 | 2018-09-28 | 维沃移动通信有限公司 | 出行提醒方法及装置 |
CN111149124A (zh) * | 2018-04-17 | 2020-05-12 | 华为技术有限公司 | 服务推荐方法及相关装置 |
US20190383623A1 (en) * | 2018-06-14 | 2019-12-19 | Ford Motor Company | Dynamic connection determinations |
CN108897728B (zh) * | 2018-06-27 | 2023-04-07 | 平安科技(深圳)有限公司 | 短信拼接处理方法、装置、计算机设备和存储介质 |
CN109190119B (zh) * | 2018-08-22 | 2020-11-10 | 腾讯科技(深圳)有限公司 | 时间提取方法和装置、存储介质及电子装置 |
US11138426B2 (en) * | 2018-08-24 | 2021-10-05 | Sap Se | Template matching, rules building and token extraction |
CN109614622A (zh) * | 2018-12-11 | 2019-04-12 | 北京锐安科技有限公司 | 有效数据提取方法、装置、存储介质及终端 |
CN109708657B (zh) * | 2019-01-30 | 2021-01-08 | 维沃移动通信有限公司 | 一种提醒方法及移动终端 |
CN110135861B (zh) * | 2019-04-24 | 2024-03-05 | 平安科技(深圳)有限公司 | 信息通知方法、装置、计算机设备及存储介质 |
CN110134775B (zh) * | 2019-05-10 | 2021-08-24 | 中国联合网络通信集团有限公司 | 问答数据生成方法及装置、存储介质 |
KR20220043135A (ko) | 2019-07-12 | 2022-04-05 | 삼성전자주식회사 | 텍스트 입력에 기초하여 구조화된 관계 정보를 생성하기 위한 방법과 장치 |
CN112445775B (zh) * | 2019-08-15 | 2024-04-19 | 上海微电子装备(集团)股份有限公司 | 一种光刻机的故障分析方法、装置、设备和存储介质 |
CN110889026A (zh) * | 2019-11-18 | 2020-03-17 | 中国民航信息网络股份有限公司 | 一种航班服务查询方法及装置 |
RU198651U1 (ru) * | 2020-03-26 | 2020-07-21 | Общество с ограниченной ответственностью «ЮТС» | Вычислительное устройство для информирования пассажиров |
CN113468368A (zh) * | 2020-04-28 | 2021-10-01 | 海信集团有限公司 | 一种语音记事方法、装置、设备及介质 |
CN111598545A (zh) * | 2020-05-19 | 2020-08-28 | 甬矽电子(宁波)股份有限公司 | 业务数据处理方法、装置、计算机设备和可读存储介质 |
CN111597817B (zh) * | 2020-05-27 | 2023-12-08 | 北京明略软件系统有限公司 | 一种事件信息抽取方法及装置 |
CN111860450A (zh) * | 2020-08-03 | 2020-10-30 | 理光图像技术(上海)有限公司 | 票证识别装置以及票证信息管理系统 |
CN112364022B (zh) * | 2020-11-11 | 2023-11-03 | 贵州新凯润信息技术服务有限公司 | 信息推导管理方法、装置、计算机设备及可读存储介质 |
CN112468934B (zh) * | 2020-11-16 | 2022-07-26 | 深圳康佳电子科技有限公司 | 一种麦克风控制方法、装置、智能终端及存储介质 |
CN112765372A (zh) * | 2021-01-20 | 2021-05-07 | 广州技象科技有限公司 | 基于模板简化的物联网网关数据处理方法及装置 |
CN115099212B (zh) * | 2022-08-02 | 2023-07-14 | 深圳市八方通科技开发有限公司 | 基于模板设计的归类方法、装置、介质及计算机设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102142127A (zh) * | 2010-07-30 | 2011-08-03 | 华为技术有限公司 | 对用户的消费明细进行管理的方法和装置 |
CN103078892A (zh) * | 2012-05-09 | 2013-05-01 | 腾讯科技(深圳)有限公司 | 短消息内容智能识别的方法、客户端、服务器及系统 |
JP2014085873A (ja) * | 2012-10-24 | 2014-05-12 | Ntt Docomo Inc | 情報処理装置、情報処理システム、及び質問回答方法 |
CN104038627A (zh) * | 2014-05-09 | 2014-09-10 | 北京奇虎科技有限公司 | 终端信息的提示方法和装置及终端 |
CN104281372A (zh) * | 2014-09-22 | 2015-01-14 | 小米科技有限责任公司 | 信息处理方法和装置 |
CN104378441A (zh) * | 2014-11-25 | 2015-02-25 | 小米科技有限责任公司 | 日程创建方法和装置 |
CN104468983A (zh) * | 2014-11-13 | 2015-03-25 | 重庆蓝岸通讯技术有限公司 | 一种移动终端基于短信票务出行信息的自动提醒方法 |
CN104601812A (zh) * | 2015-01-05 | 2015-05-06 | 小米科技有限责任公司 | 短信内容展示方法及短信展示确定方法、装置及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101621562A (zh) * | 2008-06-30 | 2010-01-06 | 深圳富泰宏精密工业有限公司 | 电子记帐系统及方法 |
RU2368008C1 (ru) * | 2008-08-11 | 2009-09-20 | Владимир Николаевич Мунякин | Информационная система |
CN102457817B (zh) * | 2010-10-15 | 2014-11-05 | 北大方正集团有限公司 | 一种手机报中新闻内容的抽取方法及系统 |
CN102663111A (zh) * | 2012-04-17 | 2012-09-12 | 电信科学技术研究院 | 一种信息获取方法和设备 |
CN104506715B (zh) * | 2014-12-05 | 2018-10-12 | 小米科技有限责任公司 | 通知消息显示方法及装置 |
-
2015
- 2015-11-17 CN CN201510792570.3A patent/CN105472580B/zh active Active
- 2015-12-29 RU RU2016116718A patent/RU2658164C2/ru active
- 2015-12-29 WO PCT/CN2015/099604 patent/WO2017084181A1/zh active Application Filing
- 2015-12-29 JP JP2016520078A patent/JP2018506751A/ja active Pending
- 2015-12-29 MX MX2016007017A patent/MX2016007017A/es unknown
- 2015-12-29 KR KR1020167011187A patent/KR20180072503A/ko not_active Application Discontinuation
-
2016
- 2016-08-10 EP EP16174298.6A patent/EP3171308A1/en not_active Withdrawn
- 2016-11-17 US US15/354,783 patent/US20170140048A1/en not_active Abandoned
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102142127A (zh) * | 2010-07-30 | 2011-08-03 | 华为技术有限公司 | 对用户的消费明细进行管理的方法和装置 |
CN103078892A (zh) * | 2012-05-09 | 2013-05-01 | 腾讯科技(深圳)有限公司 | 短消息内容智能识别的方法、客户端、服务器及系统 |
JP2014085873A (ja) * | 2012-10-24 | 2014-05-12 | Ntt Docomo Inc | 情報処理装置、情報処理システム、及び質問回答方法 |
CN104038627A (zh) * | 2014-05-09 | 2014-09-10 | 北京奇虎科技有限公司 | 终端信息的提示方法和装置及终端 |
CN104281372A (zh) * | 2014-09-22 | 2015-01-14 | 小米科技有限责任公司 | 信息处理方法和装置 |
CN104468983A (zh) * | 2014-11-13 | 2015-03-25 | 重庆蓝岸通讯技术有限公司 | 一种移动终端基于短信票务出行信息的自动提醒方法 |
CN104378441A (zh) * | 2014-11-25 | 2015-02-25 | 小米科技有限责任公司 | 日程创建方法和装置 |
CN104601812A (zh) * | 2015-01-05 | 2015-05-06 | 小米科技有限责任公司 | 短信内容展示方法及短信展示确定方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
KR20180072503A (ko) | 2018-06-29 |
MX2016007017A (es) | 2017-07-20 |
EP3171308A1 (en) | 2017-05-24 |
WO2017084181A1 (zh) | 2017-05-26 |
US20170140048A1 (en) | 2017-05-18 |
JP2018506751A (ja) | 2018-03-08 |
CN105472580A (zh) | 2016-04-06 |
RU2016116718A (ru) | 2017-12-05 |
RU2658164C2 (ru) | 2018-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105472580B (zh) | 信息的处理方法、装置、终端及服务器 | |
CN105488025B (zh) | 模板构建方法和装置、信息识别方法和装置 | |
CN106201161B (zh) | 电子设备的显示方法及系统 | |
CN106488037B (zh) | 日程提醒方法及装置 | |
CN105955618A (zh) | 信息显示方法及装置 | |
CN105117207B (zh) | 相册创建方法及装置 | |
CN110110026A (zh) | 一种智能提示出行帮助信息的方法、装置及介质 | |
CN105049627A (zh) | 卡片生成方法和装置 | |
CN104915114B (zh) | 信息记录方法和装置、智能终端 | |
CN105447750A (zh) | 信息识别方法、装置、终端及服务器 | |
CN104809158B (zh) | 网络内容过滤方法及装置 | |
CN104484349A (zh) | 进度查询方法、装置及终端 | |
CN107004020A (zh) | 终端设备及其数据处理方法 | |
CN104951470B (zh) | 电子券内容展示方法和装置 | |
CN105528403A (zh) | 目标数据识别方法及装置 | |
CN105872224A (zh) | 卡片式短信的生成方法及装置 | |
CN108574777A (zh) | 信息提醒方法及装置 | |
CN105975501A (zh) | 消息内容展示方法及装置 | |
CN105430194B (zh) | 用于拨打电话的方法、装置及终端 | |
CN105095213B (zh) | 信息关联方法及装置 | |
CN105243051A (zh) | 酒店订单短信模板的创建方法、提取方法及装置 | |
CN105530332B (zh) | 位置信息的处理方法及装置 | |
CN105183721B (zh) | 模板构建方法、信息提取方法及装置 | |
CN105577880B (zh) | 电话号码识别方法及装置 | |
US20180288579A1 (en) | Short message identification method and device, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |