CN107729334A - 数据分类系统及数据分类方法 - Google Patents

数据分类系统及数据分类方法 Download PDF

Info

Publication number
CN107729334A
CN107729334A CN201610656940.5A CN201610656940A CN107729334A CN 107729334 A CN107729334 A CN 107729334A CN 201610656940 A CN201610656940 A CN 201610656940A CN 107729334 A CN107729334 A CN 107729334A
Authority
CN
China
Prior art keywords
processor
string
critical
data
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201610656940.5A
Other languages
English (en)
Inventor
洪序宗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Pudong Technology Corp
Inventec Corp
Original Assignee
Inventec Pudong Technology Corp
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Pudong Technology Corp, Inventec Corp filed Critical Inventec Pudong Technology Corp
Priority to CN201610656940.5A priority Critical patent/CN107729334A/zh
Publication of CN107729334A publication Critical patent/CN107729334A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种数据分类系统及数据分类方法,此数据分类系统包含储存器与处理器,且处理器电性连接至储存器。储存器用以存取多个关键词元,且每一关键词元分别对应其默认等级。处理器用以依据关键词元而对多个字符串数据依序进行检索,以取得字符串数据中的多个对应关键词元,再依据对应关键词元取得对应的默认等级而对字符串数据进行分类,从而产生分类结果。数据分类系统可以有效率地为字符串数据分类而进行后续分析,不仅大幅地加快字符串数据的分类速度,更提升字符串数据的分类精确度。

Description

数据分类系统及数据分类方法
技术领域
本发明关于一种数据处理系统及数据处理方法,特别关于一种数据分类系统及数据分类方法。
背景技术
随着数据分析技术的快速发展,大数据(big data)的分析逐渐为人们所重视。举例而言,对于电子装置的质量管理,数量庞大的客诉意见是重要的分析标的。一般而言,通过分析客诉意见不仅可以改善电子装置的质量,更可以作为未来功能扩充的参考依据。传统上,为了处理数量庞大且内容复杂的客诉意见,通常得依靠人力依序为每一笔客诉意见进行分析,从而判断并分类客诉意见的内容(如,电子装置内的零件或操作功能毁损)。然而,此种依靠人力而进行分析的作法不仅耗时,更耗费大量的人力资源。
因此,如何兼顾数据分类处理速度与精确度以进行数据分类系统的设计,可是一大挑战。
发明内容
本发明公开的一态样关于一种数据分类系统,此数据分类系统包含储存器与处理器,且处理器电性连接至储存器。储存器用以存取多个关键词元,且每一关键词元分别对应其默认等级。处理器依据关键词元而对多个字符串数据依序进行检索,以取得字符串数据中的多个对应关键词元,再依据对应关键词元取得对应的默认等级,对字符串数据进行分类,从而产生分类结果。
优选地,所述处理器依据每一这些关键词元的一字符数而对这些字符串数据依序进行检索。
优选地,所述关键词元中的一个比这些关键词元中的另一个具有较长的字符数时,该处理器先依据这些关键词元中具有较长字符数的一个对这些字符串数据依序进行检索,再依据这些关键词元中具有较短位数的另一个对这些字符串数据依序进行检索。
优选地,所述处理器依据这些对应关键词元取得对应的该默认等级而计算每一这些字符串数据所对应的一字符串等级,再依据该字符串等级而产生该分类结果。
优选地,所述处理器产生该分类结果后,该处理器再依据这些关键词元而对尚未被分类的这些字符串数据依序进行检索。
本发明公开的另一态样关于一种数据分类方法,此数据分类方法包含以下步骤:通过储存器存取多个关键词元,且每一关键词元分别对应其默认等级;通过处理器接收多个字符串数据并由储存器读取关键词元;通过处理器依据关键词元而对字符串数据依序进行检索,以取得字符串数据中的多个对应关键词元;以及通过处理器依据对应关键词元取得对应的默认等级而对字符串数据进行分类,从而产生分类结果。
优选地,通过所述处理器依据这些关键词元而对这些字符串数据依序进行检索包含:通过所述处理器依据每一这些关键词元的一字符数而对这些字符串数据依序进行检索。
优选地,通过所述处理器依据每一这些关键词元的该字符数而对这些字符串数据依序进行检索包含:当这些关键词元中的一个比这些关键词元中的另一个具有较长的字符数时,先通过该处理器依据这些关键词元中具有较长字符数的一个对这些字符串数据依序进行检索,再通过该处理器依据这些关键词元中具有较短位数的另一个对这些字符串数据依序进行检索。
优选地,通过所述处理器依据这些对应关键词元取得对应的该默认等级而对这些字符串数据进行分类,从而产生该分类结果包含:通过所述处理器依据这些对应关键词元取得对应的该默认等级而计算每一这些字符串数据所对应的一字符串等级,再依据该字符串等级而产生该分类结果。
优选地,通过所述处理器依据这些对应关键词元取得对应的该默认等级而对这些字符串数据进行分类,从而产生该分类结果包含:当通过所述处理器产生该分类结果后,再通过该处理器依据这些关键词元而对尚未被分类的这些字符串数据依序进行检索。
综上所述,本发明的技术方案与现有技术相比具有明显的优点和有益效果。通过由上述技术方案,可达到相当的技术进步,并具有产业上的广泛利用价值,本发明所揭示的数据分类系统与数据分类方法先通过处理器对字符串数据进行检索而取得字符串数据中的对应关键词元,再依据对应关键词元取得对应的默认等级而对字符串数据进行分类。如此,数据分类系统可以有效率地为字符串数据分类而进行后续分析,不仅大幅地加快字符串数据的分类速度,更提升字符串数据的分类精确度。
附图说明
图1为依据本发明揭示的实施例所绘制的数据分类系统的方块图;以及
图2为依据本发明揭示的实施例所绘制的数据分类方法的流程图。
100 数据分类系统
102 储存器
104 处理器
200 数据分类方法
Sin 字符串数据
Sword 关键词元
Sout 分类结果
具体实施方式
下文是举实施例配合所附图式作详细说明,以更好地理解本发明的态样,但所提供的实施例并并不是用以限制本揭示所涵盖的范围,而结构操作的描述并不是用以限制其执行的顺序,任何由组件重新组合的结构,所产生具有均等功效的装置,皆为本揭示所涵盖的范围。此外,根据业界的标准及惯常做法,图式仅以辅助说明为目的,并未依照原尺寸作图,实际上各种特征的尺寸可任意地增加或减少以便于说明。下述说明中相同组件将以相同的符号标示来进行说明以便于理解。
在全篇说明书与申请专利范围所使用的用词(terms),除有特别注明外,通常具有每个用词使用在此领域中、在此揭示的内容中与特殊内容中的平常意义。某些用以描述本发明揭示的用词将于下或在此说明书的别处讨论,以提供本领域技术人员在有关本发明揭示的描述上额外的引导。
此外,在本发明中所使用的用词“包含”、“包括”、“具有”、“含有”等等,均为开放性的用语,即意指“包含但不限于”。
在本发明中,当一组件被称为“连接”或“耦接”时,可指“电性连接”或“电性耦接”。“连接”或“耦接”也可用以表示二或多个组件间相互搭配操作或互动。此外,虽然本发明中使用“第一”、“第二”…等用语描述不同组件,该用语仅是用以区别以相同技术用语描述的组件或操作。除非上下文清楚指明,否则该用语并非特别指称或暗示次序或顺位,也并不是用以限定本发明。
图1为依据本发明揭示的实施例所绘制的数据分类系统100的方块示意图。如图1所示,数据分析系统100包含储存器102与处理器104。处理器104电性连接至储存器102。
储存器102用以存取多个关键词元Sword,且每一关键词元Sword分别对应其默认等级。举例而言,关键词元Sword的类型可以为对象名称、功能描述或状态用语,且不同类型的关键词元Sword分别通过默认的方式为其设置对应的默认等级,从而区别不同类型的关键词元Sword与执行后续操作。处理器104用以依据关键词元Sword而对多个字符串数据Sin依序进行检索,以取得字符串数据Sin中的对应关键词元,再依据对应关键词元取得对应的默认等级而对字符串数据Sin进行分类,从而产生分类结果Sout。
在一实施例中,处理器104依据每一关键词元Sword的字符数而对字符串数据Sin依序进行检索。在另一实施例中,当关键词元Sword中的一个比关键词元Sword中的另一个具有较长的字符数时,处理器104先依据关键词元Sword中具有较长字符数的一个对字符串数据Sin依序进行检索,处理器104再依据关键词元Sword中具有较短位数的另一个对字符串数据Sin依序进行检索。举例而言,关键词元Sword的类型可以为对象名称、功能描述或状态用语。换句话说,当第一关键词元为液晶显示器、第二关键词元为硬盘时,可以理解到第一关键词元(即,液晶显示器)的字符数长于第二关键词元(即,硬盘)的字符数。因此,处理器104会先以第一关键词元作为检索关键词而对字符串数据Sin依序进行检索,再以第二关键词元作为检索关键词而对字符串数据Sin依序进行检索,从而取得分别具有第一关键词元与第二关键词元的字符串数据Sin。由于关键词元Sword的字符数相关于检索关键词的限制,因此,当处理器104优先以具有较长字符数的关键词元Sword作为检索关键词时,可以有效地降低后续为字符串数据Sin进行分类而产生的误判。
在又一实施例中,处理器104可以将不同类型的关键词元Sword进行组合而对字符串数据Sin依序进行检索。举例而言,关键词元Sword的类型可以为对象名称、功能描述或状态用语。换句话说,当第一关键词元为对象名称(如,硬盘)、第二关键词元为状态用语(如,故障)时,处理器104可以先依据第一关键词元与第二关键词元的组合作为检索关键词而对字符串数据Sin依序进行检索,再分别以第一关键词元与第二关键词元作为检索关键词而对字符串数据Sin依序进行检索。由于不同的关键词元Sword的组合相关于检索关键词的限制,因此,当处理器104以不同的关键词元Sword的组合作为检索关键词时,可以有效地降低后续为字符串数据Sin进行分类而产生的误判。应了解到,上述关于不同的关键词元Sword的组合仅用以示范,并非用以限制本发明。举例而言,关键词元Sword的组合也可为相同类型但不同的对象名称、功能描述或状态用语的关键词元Sword所实施。
在又一实施例中,处理器104可以通过实施特殊字符为关键词元Sword进行限定而对字符串数据Sin依序进行检索。举例而言,处理器104先通过限定关键词元Sword的字符数或是英文表示的关键词元Sword的前缀大小写,再以符合上述限定条件的关键词元Sword作为检索关键词而对字符串数据Sin依序进行检索。应了解到,上述关于特殊字符的实施方式仅用以示范,并非用以限制本发明。
在一实施例中,当处理器104依据关键词元Sword而对字符串数据Sin依序进行检索,以取得字符串数据Sin中的对应关键词元后,处理器104还依据对应关键词元取得对应的默认等级而计算每一字符串数据Sin所对应的字符串等级,再依据字符串等级而产生分类结果Sout。举例而言,处理器104依据字符串数据Sin中具有的关键词元Sword与其默认等级而判断字符串数据Sin所对应的字符串等级,从而为字符串数据Sin进行分类。换句话说,当第一关键词元的默认等级高于第二关键词元的默认等级,且第一字符串数据具有第一关键词元、第二字符串数据具有第二关键词元时,处理器104判定第一字符串数据的字符串等级高于第二字符串数据的等级,并优先给予第一字符串数据对应其字符串等级的分类,而后再给予第二字符串数据对应其字符串等级的分类。应了解到,上述关于字符串等级的判定仅用以示范,并非用以限制本发明。举例而言,若字符串数据Sin同时具有复数关键词元Sword时,则此种字符串数据Sin的字符串等级可以高于仅具有单一关键词元Sword的字符串数据Sin。
在另一实施例中。当处理器104产生分类结果Sout后,处理器104再依据关键词元Sword而对尚未被分类的字符串数据Sin依序进行检索。举例而言,当处理器104以第一关键词元对字符串数据Sin依序进行检索而产生分类结果Sout后,处理器104更以第二关键词元对未具有第一关键词元的字符串数据Sin依序进行检索而产生另一分类结果Sout。
图2为依据本发明揭示的实施例所绘制的数据分类方法200的流程图。在一实施例中,数据分类方法200可由上述数据分类系统100执行,但本发明并不以此为限。为了易于理解数据分类方法200,后文将以数据分类系统100作为实施数据分类方法200的示范标的。
如图2所示,首先,在步骤S201中,通过储存器102存取多个关键词元Sword,且每一关键词元Sword分别对应其默认等级。举例而言,关键词元Sword的类型可以为对象名称、功能描述或状态用语,且不同类型的关键词元Sword分别通过默认的方式为其设置对应的默认等级,从而区别不同类型的关键词元Sword与执行后续操作。在步骤S202中,通过处理器104接收多个字符串数据Sin并由储存器102读取关键词元Sword。在步骤S203中,通过处理器104依据关键词元Sword而对字符串数据Sin依序进行检索,以取得字符串数据Sin中的对应关键词元。最后,在步骤S204中,通过处理器104依据对应关键词元取得对应的默认等级而对字符串数据Sin进行分类,从而产生分类结果Sout。
在一实施例中,当通过处理器104依据关键词元Sword而对字符串数据Sin依序进行检索时,通过处理器104依据每一关键词元Sword的字符数而对字符串数据Sin依序进行检索。在另一实施例中,当关键词元Sword中的一个比关键词元Sword中的另一个具有较长的字符数时,先通过处理器104依据关键词元Sword中具有较长字符数的一个对字符串数据Sin依序进行检索,再通过处理器104依据关键词元Sword中具有较短位数的另一个对字符串数据Sin依序进行检索。举例而言,关键词元Sword的类型可以为对象名称、功能描述或状态用语。换句话说,当第一关键词元为液晶显示器、第二关键词元为硬盘时,可以理解到第一关键词元(即,液晶显示器)的字符数长于第二关键词元(即,硬盘)的字符数。因此,先通过处理器104以第一关键词元作为检索关键词而对字符串数据Sin依序进行检索,再通过处理器104以第二关键词元作为检索关键词而对字符串数据Sin依序进行检索,从而取分别具有第一关键词元与第二关键词元的字符串数据Sin。由于关键词元Sword的字符数相关于检索关键词的限制,因此,当通过处理器104优先以具有较长字符数的关键词元Sword作为检索关键词时,可以有效地降低后续为字符串数据Sin进行分类而产生的误判。
在又一实施例中,可以通过处理器104将不同类型的关键词元Sword进行组合而对字符串数据Sin依序进行检索。举例而言,关键词元Sword的类型可以为对象名称、功能描述或状态用语。换句话说,当第一关键词元为对象名称(如,硬盘)、第二关键词元为状态用语(如,故障)时,可以先通过处理器104依据第一关键词元与第二关键词元的组合作为检索关键词而对字符串数据Sin依序进行检索,再分别以第一关键词元与第二关键词元作为检索关键词而对字符串数据Sin依序进行检索。由于不同的关键词元Sword的组合系相关于检索关键词的限制,因此,当通过处理器104以不同的关键词元Sword的组合作为检索关键词时,可以有效地降低后续为字符串数据Sin进行分类而产生的误判。应了解到,上述关于不同的关键词元Sword的组合仅用以示范,并非用以限制本发明。举例而言,关键词元Sword的组合也可为相同类型但不同的对象名称、功能描述或状态用语的关键词元Sword所实施。
在又一实施例中,可以通过处理器104实施特殊字符为关键词元Sword进行限定而对字符串数据Sin依序进行检索。举例而言,先通过处理器104限定关键词元Sword的字符数或是英文表示的关键词元Sword的前缀大小写,再以符合上述限定条件的关键词元Sword作为检索关键词而对字符串数据Sin依序进行检索。应了解到,上述关于特殊字符的实施方式仅用以示范,并非用以限制本发明。
在一实施例中,当通过处理器104依据对应关键词元取得对应的默认等级而对字符串数据Sin进行分类,从而产生分类结果Sout时,通过处理器104依据对应关键词元取得对应的默认等级而计算每一字符串数据Sin所对应的字符串等级,再依据字符串等级而产生分类结果Sout。举例而言,通过处理器104依据字符串数据Sin中具有的关键词元Sword与其默认等级而判断字符串数据Sin所对应的字符串等级,从而为字符串数据Sin进行分类。换句话说,当第一关键词元的默认等级高于第二关键词元的默认等级,且第一字符串数据具有第一关键词元、第二字符串数据具有第二关键词元时,通过处理器104判定第一字符串数据的字符串等级高于第二字符串数据,并优先给予第一字符串数据对应其字符串等级的分类,而后再给予第二字符串数据对应其字符串等级的分类。应了解到,上述关于字符串等级的判定仅用以示范,并非用以限制本发明。举例而言,若字符串数据Sin同时具有复数关键词元Sword时,则此种字符串数据Sin的字符串等级可以高于仅具有单一关键词元Sword的字符串数据Sin。
在另一实施例中。通过处理器104产生分类结果Sout后,再通过处理器104依据关键词元Sword而对尚未被分类的字符串数据Sin依序进行检索。举例而言,当通过处理器104以第一关键词元对字符串数据Sin依序进行检索而产生分类结果Sout后,通过处理器104以第二关键词元对未具有第一关键词元的字符串数据Sin依序进行检索而产生另一分类结果Sout。
在上述实施例中,本发明所揭示的数据分类系统与数据分类方法先通过处理器对字符串数据进行检索而取得字符串数据中的多个对应关键词元,再依据对应关键词元取得对应的默认等级而对字符串数据进行分类。如此,数据分类系统可以有效率地为字符串数据分类而进行后续分析,不仅大幅地加快字符串数据的分类速度,更提升字符串数据的分类精确度。另一方面,通过特殊字符的实施,本发明所揭示的数据分类系统与数据分类方法可以通过关键词元的组合与限定操作,从而减少为字符串数据进行分类而产生的误判。
技术领域通常知识者可以容易理解到揭示的实施例实现一或多个前述举例的优点。阅读前述说明书之后,技术领域通常知识者将有能力对如同此处揭示内容作多种类的更动、置换、等效物以及多种其他实施例。因此本发明的保护范围当视申请专利范围所界定者与其均等范围为主。

Claims (10)

1.一种数据分类系统,其特征在于,包含:
一储存器,用以存取复数关键词元,其中每一这些关键词元对应至一默认等级;以及
一处理器,电性连接至该储存器,用以依据这些关键词元而对复数字符串数据依序进行检索,以取得这些字符串数据中的复数对应关键词元,再依据这些对应关键词元取得对应的该默认等级而对这些字符串数据进行分类,从而产生一分类结果。
2.如权利要求1所述的数据分类系统,其特征在于,所述处理器依据每一这些关键词元的一字符数而对这些字符串数据依序进行检索。
3.如权利要求2所述的数据分类系统,其特征在于,所述关键词元中的一个比这些关键词元中的另一个具有较长的字符数时,该处理器先依据这些关键词元中具有较长字符数的一个对字符串数据依序进行检索,再依据这些关键词元中具有较短位数的另一个对这些字符串数据依序进行检索。
4.如权利要求1所述的数据分类系统,其特征在于,所述处理器依据这些对应关键词元取得对应的该默认等级而计算每一这些字符串数据所对应的一字符串等级,再依据该字符串等级而产生该分类结果。
5.如权利要求4所述的数据分类系统,其特征在于,所述处理器产生该分类结果后,该处理器再依据这些关键词元而对尚未被分类的这些字符串数据依序进行检索。
6.一种数据分类方法,其特征在于,包含以下步骤:
通过一储存器存取复数关键词元,其中每一这些关键词元对应至一默认等级;
通过一处理器接收复数字符串数据并由该储存器读取这些关键词元;
通过该处理器依据这些关键词元而对这些字符串数据依序进行检索,以取得这些字符串数据中的复数对应关键词元;
以及
通过该处理器依据这些对应关键词元取得对应的该默认等级而对这些字符串数据进行分类,从而产生一分类结果。
7.如权利要求6中所述的数据分类方法,其特征在于,通过所述处理器依据这些关键词元而对这些字符串数据依序进行检索包含:
通过所述处理器依据每一这些关键词元的一字符数而对这些字符串数据依序进行检索。
8.如权利要求7中所述的数据分类方法,其特征在于,通过所述处理器依据每一这些关键词元的该字符数而对这些字符串数据依序进行检索包含:
当这些关键词元中的一个比这些关键词元中的另一个具有较长的字符数时,先通过该处理器依据这些关键词元中具有较长字符数的一个对这些字符串数据依序进行检索,再通过该处理器依据这些关键词元中具有较短位数的另一个对这些字符串数据依序进行检索。
9.如权利要求6中所述的数据分类方法,其特征在于,通过所述处理器依据这些对应关键词元取得对应的该默认等级而对这些字符串数据进行分类,从而产生该分类结果包含:
通过所述处理器依据这些对应关键词元取得对应的该默认等级而计算每一这些字符串数据所对应的一字符串等级,再依据该字符串等级而产生该分类结果。
10.如权利要求9中所述的数据分类方法,其特征在于,通过所述处理器依据这些对应关键词元取得对应的该默认等级而对这些字符串数据进行分类,从而产生该分类结果包含:
当通过所述处理器产生该分类结果后,再通过该处理器依据这些关键词元而对尚未被分类的这些字符串数据依序进行检索。
CN201610656940.5A 2016-08-11 2016-08-11 数据分类系统及数据分类方法 Withdrawn CN107729334A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610656940.5A CN107729334A (zh) 2016-08-11 2016-08-11 数据分类系统及数据分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610656940.5A CN107729334A (zh) 2016-08-11 2016-08-11 数据分类系统及数据分类方法

Publications (1)

Publication Number Publication Date
CN107729334A true CN107729334A (zh) 2018-02-23

Family

ID=61200414

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610656940.5A Withdrawn CN107729334A (zh) 2016-08-11 2016-08-11 数据分类系统及数据分类方法

Country Status (1)

Country Link
CN (1) CN107729334A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109993235A (zh) * 2019-04-10 2019-07-09 苏州浪潮智能科技有限公司 一种多变量数据分类方法与装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933044A (zh) * 2014-03-17 2015-09-23 北京奇虎科技有限公司 应用卸载原因的分类方法及分类装置
CN105447161A (zh) * 2015-11-26 2016-03-30 广东工业大学 一种基于数据特征的智能信息分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933044A (zh) * 2014-03-17 2015-09-23 北京奇虎科技有限公司 应用卸载原因的分类方法及分类装置
CN105447161A (zh) * 2015-11-26 2016-03-30 广东工业大学 一种基于数据特征的智能信息分类方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109993235A (zh) * 2019-04-10 2019-07-09 苏州浪潮智能科技有限公司 一种多变量数据分类方法与装置

Similar Documents

Publication Publication Date Title
WO2022141861A1 (zh) 情感分类方法、装置、电子设备及存储介质
CN109614625B (zh) 标题正文相关度的确定方法、装置、设备及存储介质
WO2020073664A1 (zh) 指代消解方法、电子装置及计算机可读存储介质
JP7153004B2 (ja) コミュニティ質問応答データの検証方法、装置、コンピュータ機器、及び記憶媒体
US20150356174A1 (en) System and methods for capturing and analyzing documents to identify ideas in the documents
JP2015109068A (ja) 回答候補間の関係を識別および表示する機構、方法、コンピュータ・プログラム、ならびに装置
WO2015061046A2 (en) Method and apparatus for performing topic-relevance highlighting of electronic text
CN108550054B (zh) 一种内容质量评估方法、装置、设备和介质
Xu et al. Detecting sensitive information of unstructured text using convolutional neural network
WO2021174812A1 (zh) 用于画像的数据的清洗方法、装置、介质及电子设备
CN108280057A (zh) 一种基于blstm的微博谣言检测方法
US10210251B2 (en) System and method for creating labels for clusters
CN109492118A (zh) 一种数据检测方法及检测装置
CN115186015B (zh) 一种网络安全知识图谱构建方法及系统
KR101889007B1 (ko) 객체 속성을 이용한 도면관리 방법 및 도면관리 시스템
CN111680506A (zh) 数据库表的外键映射方法、装置、电子设备和存储介质
CN108073708A (zh) 信息输出方法和装置
US9558462B2 (en) Identifying and amalgamating conditional actions in business processes
Dhrangadhariya et al. Classification of noisy free-text prostate cancer pathology reports using natural language processing
Rahman et al. An efficient deep learning technique for bangla fake news detection
US20140006376A1 (en) Automated subject annotator creation using subject expansion, ontological mining, and natural language processing techniques
CN110347805A (zh) 石油行业安全隐患关键要素提取方法、装置、服务器及存储介质
US20240028828A1 (en) Machine learning model architecture and user interface to indicate impact of text ngrams
He et al. Bar charts detection and analysis in biomedical literature of PubMed Central
CN112989050A (zh) 一种表格分类方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20180223

WW01 Invention patent application withdrawn after publication