CN104063458A - 一种对终端故障问题提供对应解决方案的方法及装置 - Google Patents

一种对终端故障问题提供对应解决方案的方法及装置 Download PDF

Info

Publication number
CN104063458A
CN104063458A CN201410293606.9A CN201410293606A CN104063458A CN 104063458 A CN104063458 A CN 104063458A CN 201410293606 A CN201410293606 A CN 201410293606A CN 104063458 A CN104063458 A CN 104063458A
Authority
CN
China
Prior art keywords
terminal fault
fault problem
solution
classification
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410293606.9A
Other languages
English (en)
Other versions
CN104063458B (zh
Inventor
李月雷
吕习彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201410293606.9A priority Critical patent/CN104063458B/zh
Publication of CN104063458A publication Critical patent/CN104063458A/zh
Application granted granted Critical
Publication of CN104063458B publication Critical patent/CN104063458B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种终端故障问题分类及解决方案提供方法及装置,该终端故障问题分类方法中提取方案数据库中用户提问的终端故障问题,每个终端故障问题进行分词,并进行特征提取,对每个终端故障问题进行训练,建立SVM分类模型,将同一解决方案解决的终端故障问题划分到一个类别中,并基于该SVM分类模型向用户提供解决方案。由于在本发明实施例中建立SVM分类模型,将同一解决方案解决的终端故障问题划分到了一个类别中,因此基于该SVM分类模型,当接收到用户提问的终端故障问题时,可以确定该终端故障问题归属的类别,从而向用户提供该类别的解决方案,提高了解决方案提供的效率,满足了向用户提供解决方案的实时性需求。

Description

一种对终端故障问题提供对应解决方案的方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种对终端故障问题提供对应解决方案的方法及装置。
背景技术
随着PC技术和互联网技术的不断发展,用户对互联网的依赖越来越大。当用户存在问题需要解决时,一般都会直接到互联网上进行搜索,获取相应的解决方案。例如,出现与电脑相关的问题时,一般用户会将终端故障问题提供给搜索引擎,在搜索引擎提供的搜索结果中逐一筛选,一一尝试解决终端故障问题。
现有的搜索引擎接收到用户提问的终端故障问题后,根据该终端故障问题作为查询关键词检索与之相关的网页作为搜索结果,
用户需要一一浏览网页内容或摘要来寻找能够解决问题的关键信息,其耗时长,无法满足用户对解决方案提供的实时性要求,效率低下且影响用户的体验。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种对终端故障问题提供对应解决方案的方法及装置。
本发明实施例提供了一种对终端故障问题提供对应解决方案的方法,该方法包括:
提取方案数据库中用户提问的多个终端故障问题;
对每个终端故障问题进行分词特征提取;
根据提取的特征,对SVM分类模型进行训练,建立方案数据库中解决方案及其解决的终端故障问题的SVM分类模型,并基于该SVM分类模型向用户提供对应的解决方案。
进一步地,所述对每个终端故障问题进行分词特征提取之前,所述方法还包括:
对提取的每个终端故障问题进行聚类,将同一解决方案解决的终端故障问题聚合到一个类别中。
进一步地,所述对每个终端故障问题进行分词特征提取之前,所述方法还包括:
过滤每个类别中的终端故障问题。
进一步地,所述对每个终端故障问题进行分词特征提取包括:
在每个类别中,根据每个终端故障问题分词后得到的基础词,确定每个类别中出现的基础词;
根据每个类别中出现的基础词,统计方案数据库中的每个基础词,将统计的每个基础词作为提取的特征。
进一步地,所述对每个终端故障问题进行分词特征提取后,所述方法还包括:
对提取的特征进行特征选择。
本发明实施例提供了一种解决方案提供方法,所述方法包括:
接收用户提出的终端故障问题;
对所述终端故障问题进行分词,得到该终端故障问题对应的每个基础词;
根据每个基础词使用SVM分类模型,确定该终端故障问题对应的类别;
将方案数据库中保存的该类别的解决方案提供给所述用户。
本发明实施例提供了一种对终端故障问题提供对应解决方案的装置,该装置包括:
方案数据库,用于存储用户提问的每个终端故障问题及其对应的解决方案;
第一提取模块,用于提取方案数据库中用户提问的多个终端故障问题;
第二提取模块,用于对每个终端故障问题进行分词特征提取;
建立模块,用于根据提取的特征,对SVM分类模型进行训练,建立方案数据库中解决方案及其解决的终端故障问题的SVM分类模型,并基于该SVM分类模型向用户提供对应的解决方案。
进一步地,所述装置还包括:
聚类模块,用于对提取的每个终端故障问题进行聚类,将同一解决方案解决的终端故障问题聚合到一个类别中。
进一步地,所述装置还包括:
过滤模块,用于过滤每个类别中的终端故障问题。
进一步地,所述第二提取模块,具体用于在每个类别中,根据每个终端故障问题分词后得到的基础词,确定每个类别中出现的基础词;根据每个类别中出现的基础词,统计方案数据库中的每个基础词,将统计的每个基础词作为提取的特征。
进一步地,所述第二提取模块,还用于对提取的特征进行特征选择。
本发明实施例提供了一种解决方案提供装置,所述装置包括:
接收模块,用于接收用户提出的终端故障问题;
分词模块,用于对所述终端故障问题进行分词,得到该终端故障问题对应的每个基础词;
类别确定模块,用于根据每个基础词使用SVM分类模型,确定该终端故障问题对应的类别;
方案数据库,用于存储多个类别,在每个类别中保存同一解决方案解决的终端故障问题;
提供模块,用于将方案数据库中保存的该类别的解决方案提供给所述用户。
本发明实施例提供了一种对终端故障问题提供对应解决方案的方法及装置,该终端故障问题分类方法中提取方案数据库中用户提问的终端故障问题,对每个终端故障问题进行分词特征提取,对SVM分类模型进行训练,建立SVM分类模型,并基于该SVM分类模型向用户提供对应的解决方案。由于在本发明实施例中建立SVM分类模型,将同一解决方案解决的终端故障问题划分到了一个类别中,因此基于该SVM分类模型,当接收到用户提问的终端故障问题时,可以确定该终端故障问题归属的类别,从而向用户提供该类别的解决方案,提高了解决方案提供的效率,满足了向用户提供解决方案的实时性需求。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例提供的一种对终端故障问题进行分类过程图;
图2为本发明实施例一提供的一种终端故障问题分类过程图;
图3为本发明实施例二提供的一种终端故障问题分类过程图;
图4A为本发明实施例提供的一种解决方案提供过程示意图;
图4B为本发明实施例提供的采用线下终端故障问题分类方法及线上解决方案提供方法的示意图;
图5为本发明实施例提供的一种对终端故障问题提供对应解决方案的装置结构示意图;
图6为本发明实施例提供的一种解决方案提供装置结构示意图。
具体实施方式
为了提高解决方案的提供效率,满足用户对解决方案的实时性需求,本发明实施例提供了一种对终端故障问题提供对应解决方案的方法及装置。
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
下面结合说明书附图,对本发明实施例进行详细说明。
图1为本发明实施例提供的一种对终端故障问题进行分类过程图,该过程包括以下步骤:
S101:提取方案数据库中用户提问的多个终端故障问题。
方案数据库中保存有历史上用户提问的每个终端故障问题,并针对每个终端故障问题保存有解决该终端故障问题的解决方案,该解决方案包括:工具包和URL文章,工具包是可以在用户本地设备运行的批处理文件,URL文章的该URL对应的网页描述了一系列的操作步骤。
终端故障问题包括终端可能出现的问题,或使用终端的过程中出现的问题,或者在终端上运行的应用程序出现的问题等等,该终端可以是PC、移动终端、IPAD等平板电脑等,该终端故障问题例如可以是,PC无法连接wifi、看视频卡、无法登陆邮箱、移动终端无法上网等等。
S102:对每个终端故障问题进行分词特征提取。
在本发明实施例的SVM分类模型的生成过程中,对每个终端故障问题进行分词,得到每个基础词,基于分词后得到的每个基础词进行特征提取。
并且进行特征提取后,还可以进行特征选择等操作。
对每个终端故障问题进行分词时可以采用多种方式,相信本领域技术人员可以需要确定相应的分词方式。
S103:根据提取的特征,对SVM分类模型进行训练,建立方案数据库中每个解决方案及其解决的终端故障问题的SVM分类模型,并基于该SVM分类模型向用户提供对应的解决方案。
由于在本发明实施例中建立SVM分类模型,将同一解决方案解决的终端故障问题划分到了一个类别中,因此基于该SVM分类模型,当接收到用户提问的终端故障问题时,可以确定该终端故障问题归属的类别,从而向用户提供该类别的解决方案,提高了解决方案提供的效率,满足了向用户提供解决方案的实时性需求。
具体的,在本发明实施例中在针对每个终端故障问题进行分词,并进行特征提取之前,还包括:对提取的每个终端故障问题进行聚类,将同一解决方案解决的终端故障问题聚合到一个类别中。
由于存在同一解决方案解决多个终端故障问题的情况,本发明实施例中,为了实现对解决方案的细粒度划分,针对每个终端故障问题进行聚类时,将同一解决方案解决的技术问题聚合到一个类别中。根据每个解决方案解决的终端故障问题,每个类别中可能包括一个或两个以上的终端故障问题。
本发明实施例中方案数据库中保存有历史上用户提出的终端故障问题,并针对每个终端故障问题保存有解决该终端故障问题的解决方案,即在方案数据库中保存有终端故障问题及其对应的解决方案。
根据每个解决方案,对方案数据库中保存的用户提问的终端故障问题进行聚类时,可以采用常用的聚类算法,例如Kmeans聚类算法或者Agnes聚类算法等。当采用Kmeans聚类算法对终端故障问题进行聚类时,可以根据每个解决方案设置中心点,根据每个终端故障问题与中心点的距离,将每个终端故障问题划分到相应的类别中,其中每个类别中包含的终端故障问题不重复,即每个终端故障问题只能位于一个类别中,每个类别中的终端故障问题都可以通过同一解决方案解决。
通过本发明的上述实施例,可以根据解决方案的数量,确定相应数量的类别,将同一解决方案解决的终端故障问题划分到一个类别中,每个类别中可能包括一个或两个以上的终端故障问题。
另外每个解决方案解决的终端故障问题的种类可能也包括多个,例如某一解决方案可以解决视频类问题,也可以解决浏览器类问题,因此为了实现细粒度的划分,在考虑解决方案的同时,还可以根据每个解决方案解决的终端故障问题的种类,划分每个类别。在具体实施时,用户可以根据需要灵活选择。
图2为本发明实施例一提供的一种终端故障问题分类过程图,该过程包括以下步骤:
S201:提取方案数据库中用户提问的多个终端故障问题。
S202:对提取的每个终端故障问题进行聚类,将同一解决方案解决的终端故障问题聚合到一个类别中。
S203:对每个类别中的终端故障问题进行分词,根据分词后得到的基础词进行特征提取。
S204:根据提取的特征,对SVM分类模型进行训练,建立方案数据库中解决方案及其解决的终端故障问题的SVM分类模型,并基于该SVM分类模型向用户提供解决方案。
本发明实施例中根据解决方案,将每个终端故障问题划分到不同的类别中后,为了提高生成的SVM分类模型的准确性,可以对每个类别中的终端故障问题进行过滤,例如针对每个类别,过滤掉划分到该类别,但该解决方案实际上不能解决的终端故障问题,或者,过滤掉该类别中表述错误的终端故障问题等等。
针对每个类别中过滤后的终端故障问题,对每个类别中的终端故障问题进行分词处理,得到每个基础词,根据每个类别得到的基础词,进行特征提取。
具体的对每个终端故障问题进行分词特征提取包括:
在每个类别中,根据每个终端故障问题分词后得到的基础词,确定每个类别中出现的基础词;
根据每个类别中出现的基础词,统计方案数据库中的每个基础词,将统计的每个基础词作为提取的特征。
在本发明实施例中,为了提高提取的特征的准确性,保证得到的SVM分类模型的准确性,当对终端故障问题进行分词,得到每个基础词后,对该每个基础词进行过滤,过滤后再进行特征提取。该过滤过程可以将基础词中的停止词过滤掉,其中停止词为无语义的词,例如“的”、“了”、“很”、“非常”等等词。
具体的,例如方案数据库中保存的两个用户提问的终端故障问题分别为“电脑很卡”和“电脑卡的不行了”,由于同一解决方案可以解决上述两个终端故障问题,该两个终端故障问题被划分到同一类别中。针对该两个终端故障问题进行分词,得到每个基础词。
其中“电脑很卡”进行分词后,得到基础词“电脑”、“很”和“卡”,对基础词进行过滤,去掉该基础词中作为停止词的“很”。“电脑卡的不行了”进行分词后,得到基础词“电脑”、“卡”、“的”、“不行”和“了”,去掉该基础词中作为停止词的“的”和“了”。确定该类别中出现的基础词包括:“电脑”、“卡”、“不行”。
确定了每个类别中出现的基础词后,根据该每个类别出现的基础词,统计方案数据库中的每个基础词。例如方案数据库中有4个类别,确定了每个类别中出现的基础词后,统计该4个类别中的基础词,将统计出的4个类别出现的基础词作为提取的特征。例如统计出的基础词为10个,分别为基础词1、基础词2、……、基础词10,则该10个基础词为提取到的特征。
统计得到每个类别出现的基础词后,如果预设的特征向量的维度与统计的基础词的数量不同时,一般为预设的特征向量的维度小于统计的基础词的数量,可以在得到的基础词中进行特征选择,使选择后得到的基础词的数量与预设的特征向量的维度相同。具体的在进行特征选择时可以基于信息增益、卡方检验等方法。
根据提取的每个特征,确定特征向量。根据确定的特征向量,对SVM分类模型进行训练,得到方案数据库中的每个解决方案及其解决的终端故障问题的SVM分类模型。
具体的,对解决方案数据库中的终端故障问题进行分类,确定SVM分类模型的过程可以以线下方式实现,当确定了解决方案数据库中每个解决方案及其解决的终端故障问题的SVM分类模型后,即可采用线上的方式向用户提供对应的解决方案。
图3为本发明实施例二提供的一种终端故障问题分类过程图,该过程包括以下步骤:
S301:提取方案数据库中用户提问的多个终端故障问题。
S302:对提取的每个终端故障问题进行聚类,将同一解决方案解决的终端故障问题聚合到一个类别中。
S303:对每个类别中的终端故障问题进行过滤。
S304:针对每个类别中过滤后的终端故障问题,对每个终端故障问题进行分词处理,得到每个基础词。
S305:对每个终端故障问题得到的每个基础词进行过滤。
S306:过滤后确定每个类别中出现的基础词,并统计方案数据库中的每个基础词,将统计的每个基础词作为提取的特征。
S307:根据提取的每个特征,确定特征向量。
S308:根据确定的特征向量,对SVM分类模型进行训练,得到方案数据库中的每个解决方案及其解决的终端故障问题的SVM分类模型,并基于该SVM分类模型向用户提供解决方案。
由于在本发明实施例中建立SVM分类模型,将同一解决方案解决的终端故障问题划分到了一个类别中,因此基于该SVM分类模型,当接收到用户提问的终端故障问题时,可以确定该终端故障问题归属的类别,从而向用户提供该类别的解决方案,提高了解决方案提供的效率,满足了向用户提供解决方案的实时性需求。
图4A为本发明实施例提供的一种解决方案提供过程示意图,该过程包括以下步骤:
S401:接收用户提出的终端故障问题。
S402:对所述终端故障问题进行分词,得到该终端故障问题对应的每个基础词。
S403:根据每个基础词使用SVM分类模型,确定该终端故障问题对应的类别。
接收到用户输入的终端故障问题后,对该终端故障问题进行分词处理,得到每个基础词。根据得到的基础词,采用该SVM分类模型对该终端故障问题进行预测,确定该终端故障问题对应的类别。
在对终端故障问题进行分词,得到每个基础词后,对每个基础词进行过滤,根据过滤后的基础词,采用该SVM分类模型对该终端故障问题进行预测,确定该终端故障问题对应的类别。该过滤过程可以将基础词中的停止词过滤掉,其中停止词为无语义的词,例如“的”、“了”、“很”、“非常”等等词。
S404:将方案数据库中保存的该类别的解决方案提供给所述用户。
下面通过一个具体的实施例,对本发明进行详细说明。
图4B为本发明实施例提供的采用线下终端故障问题分类方法及线上解决方案提供方法的示意图,在该图4B中上面的方框中是线上解决方案的提供过程,下面的方框是线下终端故障问题分类的过程。
具体的,方案数据库中保存有历史上用户提问的终端故障问题,采用线下方式针对终端故障问题进行分类时,首先提取方案数据库中历史上用户提问的多个终端故障问题,采用Kmeans聚类算法或者Agnes聚类算法,对终端故障问题进行聚类,将同一解决方案解决的终端故障问题划分到一个类别中。在本发明实施例中为了便于操作,每个解决方案赋予唯一的编号SID,并且每个类别也赋予唯一的编号TYPEID。
另外,如果同一解决方案解决的终端故障问题的种类也包括多个,则可以对类别进行细粒度划分,即同一解决方案解决的终端故障问题也可以划分到两个或多个不同的类别中。是否在每个类别中进行细粒度的划分,可以在每个类别中再进行聚类处理,根据聚类后的结果确定是否进行类别的细粒度划分。并且为了提高后续提供解决方案的准确性,在本发明实施例中还可以对分类后的每个类别对应的终端故障问题进行筛选,将表述有问题的终端故障问题,或者某一解决方案无法解决的终端故障问题删除等,为了提高准确性,一般该筛选工作是通过人工筛选的方式实现的。
经过聚类操作后,得到下表所示的每个类别及该类别包括的终端故障问题、终端故障问题的分类等信息:
如上表所示,SID为1169的解决方案,可以解决两个类别的终端故障问题,其中一个是视频类问题,另一个是浏览器类问题,因此在进行类别划分时,将该两类终端故障问题划分到两个类别,每个类别的对应的类别编号TYPEID分别为1和2,其中TYPEID为1的类别中包括终端故障问题:看视频卡慢和看视频无法最大化窗口,TYPEID为2的类别中包括终端故障问题:浏览器卡的不行、浏览器图标显示异常、浏览器占内存异常。
同样的,SID为202的解决方案,也可以解决两个类别的终端故障问题,分别为QQ登陆类问题和QQ空间类问题。因此在进行类别划分时,将该两类终端故障问题划分到两个类别,每个类别的对应的类别编号TYPEID分别为3和4,其中TYPEID为3的类别中包括终端故障问题:QQ无法正常登陆和QQ空间无法快捷登录,TYPEID为4的类别中包括终端故障问题:QQ空间打不开和QQ主面板空间失效。
针对划分后的每个类别,可以在每个类别中进行过滤,过滤掉划分到该类别中,但该解决方案无法解决的终端故障问题,或者表述不正确的终端故障问题等等。之后,对每个类别中的终端故障问题进行分词处理,得到每个基础词,并在基础词中进行过滤,将其中的停止词过滤掉后。例如过滤后确定TYPEID为1的类别中出现的基础词包括:看、视频、卡、慢、无法、最大化、窗口;过滤后TYPEID为2的类别中出现的基础词包括:浏览器、卡、不行、图标、显示、异常、占、内存、异常;过滤后TYPEID为3的类别中出现的基础词包括:QQ、正常、登陆、空间、快捷;过滤后TYPEID为4的类别中出现的基础词包括:QQ、空间、打、不开、主面板、失效。
根据确定的每个类别出现的基础词,统计该方案数据库中的每个基础词,将统计的每个基础词作为提取的特征。根据提取的每个特征,确定特征向量。统计出了多少基础词,则该特征向量的维度就是多少,即每个基础词作为该特征向量的一个维度。
采用特征向量对SVM分类模型进行训练时,该特征向量固定。根据该特征向量及每个终端故障问题分词并过滤后得到的每个基础词,对SVM分类模型进行训练,从而在方案数据库中建立每个解决方案及其解决的终端故障问题的SVM分类模型。
采用线下方式在方案数据库中建立了每个解决方案及其解决的终端故障问题的SVM分类模型的对应关系后,即可采用线上方式为用户提供终端故障问题的解决方案。
当接收到用户提问的终端故障问题后,对该终端故障问题进行分词,得到每个基础词,在基础词中进行过滤,将其中的停止词过滤掉后,采用SVM分类模型对该终端故障问题进行预测,确定该终端故障问题归属的类别。例如接收到用户提问的终端故障问题为“浏览器卡”,对该终端故障问题进行分类,得到基础词“浏览器”、“卡”,采用SVM分类模型对该终端故障问题进行预测,确定该终端故障问题归属的类别的TYPEID为2,即该类终端故障问题属于浏览器类问题,将该类别对应的SID为1169的解决方案提供给用户。
图5为本发明实施例提供的一种对终端故障问题提供对应解决方案的装置结构示意图,所述装置包括:
方案数据库51,用于存储用户提问的每个终端故障问题及其对应的解决方案;
第一提取模块52,用于提取方案数据库中用户提问的多个终端故障问题;
第二提取模块53,用于对每个终端故障问题进行分词特征提取;
建立模块54,用于根据提取的特征,对SVM分类模型进行训练,建立方案数据库中解决方案及其解决的终端故障问题的SVM分类模型,并基于该SVM分类模型向用户提供对应的解决方案。
所述装置还包括:
聚类模块55,用于对提取的每个终端故障问题进行聚类,将同一解决方案解决的终端故障问题聚合到一个类别中。
所述聚类模块55,具体用于采用Kmeans聚类算法或Agnes聚类算法,对提取的每个终端故障问题进行聚类。
所述装置还包括:
过滤模块56,用于过滤每个类别中的终端故障问题。
所述第二提取模块53,具体用于在每个类别中,根据每个终端故障问题分词后得到的基础词,确定每个类别中出现的基础词;根据每个类别中出现的基础词,统计方案数据库中的每个基础词,将统计的每个基础词作为提取的特征。
所述第二提取模块53,还用于对提取的特征进行特征选择。
图6为本发明实施例提供的一种解决方案提供装置结构示意图,所述装置包括:
接收模块61,用于接收用户提出的终端故障问题;
分词模块62,用于对所述终端故障问题进行分词,得到该终端故障问题对应的每个基础词;
类别确定模块63,用于根据每个基础词使用SVM分类模型,确定该终端故障问题对应的类别;
方案数据库64,用于存储多个类别,在每个类别中保存同一解决方案解决的终端故障问题;
提供模块65,用于将方案数据库中保存的该类别的解决方案提供给所述用户。
发明实施例提供了一种对终端故障问题提供对应解决方案的方法及装置,该终端故障问题分类方法中提取方案数据库中用户提问的终端故障问题,对每个终端故障问题进行分词特征提取,对SVM分类模型进行训练,建立SVM分类模型,并基于该SVM分类模型向用户提供对应的解决方案。由于在本发明实施例中建立SVM分类模型,将同一解决方案解决的终端故障问题划分到了一个类别中,因此基于该SVM分类模型,当接收到用户提问的终端故障问题时,可以确定该终端故障问题归属的类别,从而向用户提供该类别的解决方案,提高了解决方案提供的效率,满足了向用户提供解决方案的实时性需求。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的终端故障问题分类装置及解决方案提供装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种对终端故障问题提供对应解决方案的方法,其特征在于,该方法包括:
提取方案数据库中用户提问的多个终端故障问题;
对每个终端故障问题进行分词特征提取;
根据提取的特征,对SVM分类模型进行训练,建立方案数据库中解决方案及其解决的终端故障问题的SVM分类模型,并基于该SVM分类模型向用户提供对应的解决方案。
2.如权利要求1所述的方法,其特征在于,所述对每个终端故障问题进行分词特征提取之前,所述方法还包括:
对提取的每个终端故障问题进行聚类,将同一解决方案解决的终端故障问题聚合到一个类别中。
3.如权利要求1~2任一项所述的方法,其特征在于,所述对每个终端故障问题进行分词特征提取之前,所述方法还包括:
过滤每个类别中的终端故障问题。
4.如权利要求1~3任一项所述的方法,其特征在于,所述对每个终端故障问题进行分词特征提取包括:
在每个类别中,根据每个终端故障问题分词后得到的基础词,确定每个类别中出现的基础词;
根据每个类别中出现的基础词,统计方案数据库中的每个基础词,将统计的每个基础词作为提取的特征。
5.如权利要求1~4任一项所述的方法,其特征在于,所述对每个终端故障问题进行分词特征提取后,所述方法还包括:
对提取的特征进行特征选择。
6.一种解决方案提供方法,其特征在于,所述方法包括:
接收用户提出的终端故障问题;
对所述终端故障问题进行分词,得到该终端故障问题对应的每个基础词;
根据每个基础词使用SVM分类模型,确定该终端故障问题对应的类别;
将该类别的解决方案提供给所述用户。
7.一种对终端故障问题提供对应解决方案的装置,其特征在于,所述装置包括:
方案数据库,用于存储用户提问的每个终端故障问题及其对应的解决方案;
第一提取模块,用于提取方案数据库中用户提问的多个终端故障问题;
第二提取模块,用于对每个终端故障问题进行分词特征提取;
建立模块,用于根据提取的特征,对SVM分类模型进行训练,建立方案数据库中解决方案及其解决的终端故障问题的SVM分类模型,并基于该SVM分类模型向用户提供对应的解决方案。
8.如权利要求7所述的装置,其特征在于,所述装置还包括:
聚类模块,用于对提取的每个终端故障问题进行聚类,将同一解决方案解决的终端故障问题聚合到一个类别中。
9.如权利要求7~8任一项所述的装置,其特征在于,所述装置还包括:
过滤模块,用于过滤每个类别中的终端故障问题。
10.一种解决方案提供装置,其特征在于,所述装置包括:
接收模块,用于接收用户提出的终端故障问题;
分词模块,用于对所述终端故障问题进行分词,得到该终端故障问题对应的每个基础词;
类别确定模块,用于根据每个基础词使用SVM分类模型,确定该终端故障问题对应的类别;
方案数据库,用于存储多个类别,在每个类别中保存同一解决方案解决的终端故障问题;
提供模块,用于将方案数据库中保存的该类别的解决方案提供给所述用户。
CN201410293606.9A 2014-06-26 2014-06-26 一种对终端故障问题提供对应解决方案的方法及装置 Expired - Fee Related CN104063458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410293606.9A CN104063458B (zh) 2014-06-26 2014-06-26 一种对终端故障问题提供对应解决方案的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410293606.9A CN104063458B (zh) 2014-06-26 2014-06-26 一种对终端故障问题提供对应解决方案的方法及装置

Publications (2)

Publication Number Publication Date
CN104063458A true CN104063458A (zh) 2014-09-24
CN104063458B CN104063458B (zh) 2017-09-29

Family

ID=51551172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410293606.9A Expired - Fee Related CN104063458B (zh) 2014-06-26 2014-06-26 一种对终端故障问题提供对应解决方案的方法及装置

Country Status (1)

Country Link
CN (1) CN104063458B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294038A (zh) * 2015-05-25 2017-01-04 阿里巴巴集团控股有限公司 一种故障谱的生成、基于故障谱的检测方法和装置
CN106649303A (zh) * 2015-10-28 2017-05-10 英业达科技有限公司 解决方案搜寻系统的操作方法及解决方案搜寻系统
CN106933847A (zh) * 2015-12-30 2017-07-07 北京神州泰岳软件股份有限公司 一种建立数据分类模型的方法和装置
CN107180068A (zh) * 2016-03-09 2017-09-19 富士通株式会社 检索控制程序、检索控制设备和检索控制方法
CN108833172A (zh) * 2018-06-21 2018-11-16 中国联合网络通信集团有限公司 一种网络故障报警的处理方法、装置和网络系统
CN109299224A (zh) * 2018-10-23 2019-02-01 广州九乐维信息科技有限公司 基于Zabbix的解决方案查询方法、装置、计算机设备
CN110601904A (zh) * 2019-09-27 2019-12-20 苏州浪潮智能科技有限公司 一种电子邮件故障识别方法、装置和计算机可读存储介质
CN112637880A (zh) * 2020-12-23 2021-04-09 北京东土拓明科技有限公司 问题小区处理方法以及装置
CN113190372A (zh) * 2021-05-24 2021-07-30 平安国际智慧城市科技股份有限公司 多源数据的故障处理方法、装置、电子设备及存储介质
CN113837000A (zh) * 2021-08-16 2021-12-24 天津大学 一种基于任务排序元学习的小样本故障诊断方法
CN115660296A (zh) * 2022-12-27 2023-01-31 吉奥时空信息技术股份有限公司 一种基于机器学习的不合规项目建议方案自动出具方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090132446A1 (en) * 2003-08-29 2009-05-21 Milenova Boriana L Support Vector Machines Processing System
CN103605676A (zh) * 2013-10-30 2014-02-26 北京奇虎科技有限公司 一种基于搜索的终端故障解决方法、客户端和系统
CN103886092A (zh) * 2014-04-02 2014-06-25 北京奇虎科技有限公司 一种提供终端故障问题解决方案的方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090132446A1 (en) * 2003-08-29 2009-05-21 Milenova Boriana L Support Vector Machines Processing System
CN103605676A (zh) * 2013-10-30 2014-02-26 北京奇虎科技有限公司 一种基于搜索的终端故障解决方法、客户端和系统
CN103886092A (zh) * 2014-04-02 2014-06-25 北京奇虎科技有限公司 一种提供终端故障问题解决方案的方法及装置

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294038B (zh) * 2015-05-25 2019-10-18 阿里巴巴集团控股有限公司 一种故障谱的生成、基于故障谱的检测方法和装置
CN106294038A (zh) * 2015-05-25 2017-01-04 阿里巴巴集团控股有限公司 一种故障谱的生成、基于故障谱的检测方法和装置
CN106649303A (zh) * 2015-10-28 2017-05-10 英业达科技有限公司 解决方案搜寻系统的操作方法及解决方案搜寻系统
CN106933847A (zh) * 2015-12-30 2017-07-07 北京神州泰岳软件股份有限公司 一种建立数据分类模型的方法和装置
CN106933847B (zh) * 2015-12-30 2019-12-27 北京神州泰岳软件股份有限公司 一种建立数据分类模型的方法和装置
CN107180068A (zh) * 2016-03-09 2017-09-19 富士通株式会社 检索控制程序、检索控制设备和检索控制方法
CN108833172A (zh) * 2018-06-21 2018-11-16 中国联合网络通信集团有限公司 一种网络故障报警的处理方法、装置和网络系统
CN108833172B (zh) * 2018-06-21 2021-05-25 中国联合网络通信集团有限公司 一种网络故障报警的处理方法、装置和网络系统
CN109299224A (zh) * 2018-10-23 2019-02-01 广州九乐维信息科技有限公司 基于Zabbix的解决方案查询方法、装置、计算机设备
CN110601904A (zh) * 2019-09-27 2019-12-20 苏州浪潮智能科技有限公司 一种电子邮件故障识别方法、装置和计算机可读存储介质
CN112637880A (zh) * 2020-12-23 2021-04-09 北京东土拓明科技有限公司 问题小区处理方法以及装置
CN112637880B (zh) * 2020-12-23 2022-11-15 北京东土拓明科技有限公司 问题小区处理方法以及装置
CN113190372A (zh) * 2021-05-24 2021-07-30 平安国际智慧城市科技股份有限公司 多源数据的故障处理方法、装置、电子设备及存储介质
CN113190372B (zh) * 2021-05-24 2023-02-07 深圳赛安特技术服务有限公司 多源数据的故障处理方法、装置、电子设备及存储介质
CN113837000A (zh) * 2021-08-16 2021-12-24 天津大学 一种基于任务排序元学习的小样本故障诊断方法
CN115660296A (zh) * 2022-12-27 2023-01-31 吉奥时空信息技术股份有限公司 一种基于机器学习的不合规项目建议方案自动出具方法

Also Published As

Publication number Publication date
CN104063458B (zh) 2017-09-29

Similar Documents

Publication Publication Date Title
CN104063458A (zh) 一种对终端故障问题提供对应解决方案的方法及装置
CN102314460B (zh) 数据分析方法、系统及服务器
US20130290347A1 (en) Systems and methods for providing data-driven document suggestions
CN103473506A (zh) 用于识别恶意apk文件的方法和装置
CN103678494A (zh) 客户端同步服务端数据的方法及装置
CN103455758A (zh) 恶意网站的识别方法及装置
CN103078945B (zh) 对浏览器崩溃数据进行处理的方法与系统
CN104462508A (zh) 基于知识图谱的人物关系搜索方法和装置
CN103927338A (zh) 日志信息入库处理方法和装置
CN103886092A (zh) 一种提供终端故障问题解决方案的方法及装置
CN103164654A (zh) 一种在弹窗上进行信息提示的方法及用户界面显示装置
CN101673374B (zh) 一种单据处理方法和装置
CN103514282A (zh) 一种视频搜索结果展示方法及装置
CN105528454A (zh) 日志处理方法及分布式集群的计算设备
CN102982069A (zh) 推荐数据显示方法和装置
CN104636142A (zh) 一种信息处理方法及电子设备
US10423651B2 (en) Analysis of mobile application reviews based on content, reviewer credibility, and temporal and geographic clustering
CN106021418A (zh) 新闻事件的聚类方法及装置
CN102760096A (zh) 测试用数据的生成方法、单元测试方法以及单元测试系统
CN103870607A (zh) 多搜索引擎搜索结果的排序方法及装置
CN102982068A (zh) 一种显示推荐数据的方法和相应的浏览器
CN103593406A (zh) 一种静态资源标识处理方法及装置
CN103226574A (zh) 信息搜索方法及装置
CN104778159A (zh) 一种基于词权重进行分词的方法和装置
CN104462311A (zh) 一种信息的展示方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170929

Termination date: 20210626

CF01 Termination of patent right due to non-payment of annual fee