CN106682049B - 议题显示系统和议题显示方法 - Google Patents

议题显示系统和议题显示方法 Download PDF

Info

Publication number
CN106682049B
CN106682049B CN201510807429.6A CN201510807429A CN106682049B CN 106682049 B CN106682049 B CN 106682049B CN 201510807429 A CN201510807429 A CN 201510807429A CN 106682049 B CN106682049 B CN 106682049B
Authority
CN
China
Prior art keywords
issue
keyword
processing unit
current
topic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510807429.6A
Other languages
English (en)
Other versions
CN106682049A (zh
Inventor
郭台达
陈棅易
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute for Information Industry
Original Assignee
Institute for Information Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute for Information Industry filed Critical Institute for Information Industry
Publication of CN106682049A publication Critical patent/CN106682049A/zh
Application granted granted Critical
Publication of CN106682049B publication Critical patent/CN106682049B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种议题显示系统和议题显示方法,议题显示系统包括输入单元、显示单元及运算处理单元。输入单元接收使用者设定对应议题的初始关键词。显示单元基于时间特性显示议题在时间区间内的至少一衍生议题。运算处理单元耦接输入单元与显示单元,获得时间区间内的多个网页主题内容的多个标签,并根据标签共同出现的关联性获得网页主题内容的当期关键词组。当期关键词组包括至少一当期关键词。接着,运算处理单元分析当期关键词之间以社群声量为基础计算的关联强度,并将初始关键词的重复度与依社群声量计算所得的关联强度进行比较,以决定是否产生至少一衍生议题。当决定产生至少一衍生议题时,使显示单元显示议题和至少一衍生议题。

Description

议题显示系统和议题显示方法
技术领域
本发明涉及一种议题显示系统和议题显示方法,且特别是一种能够自动判断与产生出衍生议题的议题显示系统和议题显示方法。
背景技术
基于网络的普及,人们经常使用网络获得信息。当一件事件或社会现象正在发生时,网络上会出现相当多具有相关内容的网页,例如:当一件食品安全事件发生时,在新闻媒体或社群媒体上会大量出现食品安全的相关内容。不但如此,人们也基于网络上所发布的信息在网络上进行讨论,如此则形成网络舆论。
现有的网络舆论分析系统为搜索引擎式的,其以关键词组进行搜索,并根据搜索结果将有关键词组的各篇新闻文章列出,或者显示文字与文字关联图。然而,在网络社群舆情议题的观察期间,有时会出现讨论议题方向出现改变。然而,难以以关键词组来分析出议题与后续的衍生的议题及其变化。衍生议题的切分需利用人工方式,造成舆论分析的费时与低效率,且不具即时性。并且,以原设定关键词搜索网络文章,可能遗漏衍生议题文章,有涵盖性不足的缺点。
发明内容
本发明实施例提供了一种议题显示系统和议题显示方法,避免了以人工逐一辨识并汇整相关议题,有助于舆情分析结果的即时性与全面性的舆情观察。
本发明实施例提供了一种议题显示系统,包括输入单元、显示单元以及运算处理单元。输入单元接收使用者设定对应一议题的一初始关键词。显示单元基于时间特性显示议题在时间区间内的至少一衍生议题。运算处理单元耦接输入单元与显示单元,获得时间区间内的多个网页主题内容的多个标签,并根据所述标签共同出现的关联性获得所述网页主题内容的当期关键词组,其中,当期关键词组包括至少一当期关键词,接着运算处理单元分析当期关键词之间以社群声量为基础计算的关联强度,并将初始关键词的重复度与根据社群声量计算所得的关联强度进行比较,以决定是否产生至少一衍生议题,并且当决定产生至少一衍生议题时,运算处理单元使显示单元显示议题和至少一衍生议题。
本发明实施例提供了一种议题显示方法,执行于一议题显示系统,议题显示系统包括输入单元、显示单元以及运算处理单元。所述方法包括:使用者利用输入单元设定对应一议题的初始关键词;运算处理单元获得一时间区间内的多个网页主题内容的多个标签,并根据所述标签共同出现的关联性获得所述网页主题内容的当期关键词组,其中,当期关键词组包括至少一当期关键词,接着运算处理单元分析关键词之间以社群声量为基础计算的关联强度,并将初始关键词的重复度与根据社群声量计算所得的关联强度进行比较,以决定是否产生至少一衍生议题,并且当决定产生至少一衍生议题时,运算处理单元使显示单元显示议题和至少一衍生议题;以及运算处理单元利用显示单元基于时间特性显示议题和至少一衍生议题。
综上所述,本发明实施例提供一种议题显示系统和议题显示方法,由议题的初始关键词获得多个网页主题内容,并进一步获得网页主题内容的当期关键词组。接着,获得初始关键词与当期关键词组的社群声量,并计算初始关键词与当期关键词组之间的关联强度,由此判断是否产生衍生议题。据此,可以基于时间特性显示议题的演进。
为使能更进一步了解本发明的特征和技术内容,请参阅以下有关本发明的详细说明与附图,但是这些说明和附图仅用于说明本发明,而非对本发明的权利范围作任何的限制。
附图说明
图1是本发明实施例提供的议题显示系统的示意图。
图2是本发明实施例提供的议题显示分析的概念的流程图。
图3A是本发明实施例提供的议题显示系统显示一网页主题内容的示意图。
图3B是本发明实施例提供的设定追踪的议题的互动界面的示意图。
图4是本发明实施例提供的字词关系图的示意图。
图5A是本发明实施例提供的在时间区间T1的当期关键词的关联强度的示意图。
图5B是本发明实施例提供的在时间区间T2的关联强度的示意图。
图5C是本发明实施例提供的在时间区间T3的关联强度的示意图。
图6是本发明实施例提供的图形化显示议题以及衍生议题的示意图。
图7是本发明实施例提供的议题显示方法的流程图。
【符号说明】
1:议题显示系统
11:输入单元
12:运算处理单元
13:显示单元
2:使用者
3:网络
S101、S102、S103、S104、S105、S106、S107、S108、S109、S110、S210、S220、S230、S240:步骤流程
30:主题网页文章
31、34:网页按钮
32:议题
33:初始关键词
35:点赞
36:分享
37:评价
401、402、403、404、405、406、407、408、409、410、411、412、413、414:字词
T1、T2、T3:时间区间
501、502、503、504、505、506、507、508、509:关键词
A1:议题
A2、A3、A4、A5、A6、A7、A8、A9、A10、A11:衍生议题
具体实施方式
〔议题显示系统和议题显示方法的实施例〕
请参照图1,图1是本发明实施例提供的议题显示系统的示意图。议题显示系统1包括输入单元11、显示单元13以及运算处理单元12。输入单元11与显示单元13耦接运算处理单元12。此议题显示系统1可例如设置于一连接网络的网络服务器,但本发明并不因此限制。使用者2可操作输入单元11的人机互动界面或者利用终端装置通过网络连线此网络服务器的输入单元11。输入单元11可以网页方式或是特定的应用程序界面来呈现,但本发明并不因此限定。所述终端装置可以是个人电脑、智能手机、平板电脑等,但本发明并不限定终端装置的类型。运算处理单元12则与网络3连线,以搜集网络3上的多个网址的网页主题内容。显示单元13用以基于时间特性显示议题和时间区间内的至少一衍生议题。例如,显示单元13根据时间轴显示议题和至少一衍生议题之间的关联性。议题显示系统1的详细的运算处理细节将于下进一步说明。
以下将以网页呈现的人机互动界面作为输入单元11和显示单元的例子,以说明议题显示系统1的操作方式。请同时参照图1与图2,图2是本发明实施例提供的议题显示分析的概念的流程图。首先,使用者选取网页的议题(步骤S101)。当使用者利用议题显示系统1观看某一网页的网页主题内容时,如图3A的主题网页文章30,此议题显示系统1可提供并显示一个加入追踪的网页按钮31,参照图3A,用以提供使用者设定加入追踪的议题(S102)。议题显示系统1可将欲追踪的网页导引至设定追踪的议题的互动界面的网页,参照图3B。使用者可设定议题的初始关键词33。上述的初始关键词33并不限定为一个关键词,可以是多个关键词。根据使用者2设定对应议题32的初始关键词33,当使用者2按下新增的网页按钮34时,议题显示系统1则储存对应议题32的初始关键词33。或者,在另一实施例中,当使用者2按下新增的网页按钮34时,初始关键词33可通过输入单元11接收使用者设定的上述主题网页文章30,且运算处理单元13分析此主题网页文章30的内容而获得。然而,本发明并不限定议题显示系统1获得初始关键词的方式。
上述的步骤S101与步骤S102是使用者操作议题显示系统1的输入单元11。使用者2可以针对多个议题设定追踪。后续步骤S103至步骤S110是议题显示系统1自动进行运算处理。
接着,议题显示系统1设定议题关键词组(包括至少一个关键词)(步骤S103)。然后,议题显示系统1针对网络3上的网页资料进行过滤与获取(步骤S104)。接着,运算处理单元13可先根据当期关键词组读取的网页主题内容,根据标题、内容比对或文章连结追溯方式,将网页主题内容分群(步骤S105)。将网页主题内容分群可使有相同或类似主题的文章各自成群,以有助于简化后续分析的运算过程或缩短运算时间。议题显示系统1可根据议题的相关性建立追踪模型,以及提供过去相关主题既有分析信息。例如:议题显示系统1使显示的网页主题内容自动显示此网页主题内容被点赞35、分享36或评价37的次数,参照图3A。当使用者2后续浏览网页时,议题显示系统1也能自动显示每个网页主题内容相关的分析主题、点赞、分享、评价等评基本信息。
如果将网页主题内容分群,则可根据分群后每一群的网页主题内容来分析至少一当期关键词之间的社群声量,并将当期关键词组所包括的至少一当期关键词与初始关键词计算重复度(或重叠率),以及将至少一当期关键词的社群声量与初始关键词的社群声量做比较。然而,本发明并不因此限定,将网页主题内容分群的步骤S105也可以被省略。接下来将说明议题显示系统1的运算处理单元12针对所设定的议题进行运算处理的过程(步骤S106至步骤S110)。
步骤S106,建立网页主题内容的标签。详细的说,运算处理单元13获得一个可设定的(或者固定的)时间区间内的多个网页主题内容的多个标签(Tags)。所述时间区间例如是以一天、一周或一个月做为单位,但本发明并不因此限定。通常而言,网络3上的每一个网址可以对应至少一个网页主题内容。例如:某一个网址显示一则新闻,此新闻的网页主题内容就是新闻的全文。若此新闻已有设定标签(Tags),则直接使用已设定的标签。若标签尚未设定,则运算处理单元13通过关键词分群计算,分析此网页主题内容(新闻)的全文,以解析出多个字词,由此获取此新闻的一个或两个以上的主要概念,并将其作为标签。
在本实施例中,运算处理单元13根据已知的字词数据库或演算法,找出字词之间的关联性。所述字词可能是此网页主题内容的主要概念,也可能不是。例如:利用标准化谷歌距离(normalized google distance)工具找出字词之间的关联与关联强度。或者,利用字词数据库中的字词的共生性(co-occurrence),以作为定义关联强度的根据。然后,决定关联强度的阈值(threshold),在当某两个字词的关联强度在此阈值之上,则此两个字词被设定为有关连。当某两个字词的关联强度在此阈值之下,则此两个字词被设定为无关连。由此,形成字词之间的关系图。例如图4所示的字词关系图,此网页主题内容具有字词401、402、403、404、405、406、407、408、409、410、411、412、413、414,有关联的字词以连线表示。字词402、403为有关联。字词407、408为有关联。字词404与字词412有关联。字词410、411、412、413、414为有关联。
然后,运算处理单元13利用K-core演算法找出此网页主题内容的主要概念,以建立此网页主题内容的标签。K-core演算法是所属技术领域普通技术人员的公知常识,不在此赘述。以图4为例,当字词410-414代表网页主题内容的主要概念,因此经由字词410-414设定此网页主题内容的一个标签(Tags)。根据上述,运算处理单元13可针对多个网页主题内容设置对应的标签。因此,每一个网页主题内容被对应于一个或多个标签。运算处理单元13可以利用内部的资料储存部件(图未绘示)或者外部的储存单元,如挥发式存储器(如随机存取存储器(RAM))或者是非挥发式存储器(如硬盘),以储存这些标签。
接着,进行步骤S107,进行标签之间的关联强度计算。运算处理单元13根据所述标签共同出现的关联性获得所述网页主题内容的当期关键词组。其中,当期关键词组包括至少一当期关键词。详细的说,运算处理单元13判断所述网页主题内容各标签在所述网页主题内容中出现的次数超过一出现次数的阈值时,则将所述标签决定为至少一当期关键词。以台湾出现的黑心油(地沟油,gutter oil)事件为例,针对在一个初始时间区间T1内的所有有关于黑心油的网页的主题内容,运算处理单元13可分析所述网页主题内容,而发现标签如,黑心油、公司A、饲料油、公司B、公司C、消基会这些标签出现的次数超过出现次数的阈值时,则黑心油、公司A、饲料油、公司B、公司C、消基会这些标签就是当期关键词。所述出现次数的阈值可以根据实际应用而决定,本发明并不对此限制。
接着,进行步骤S108,判断是否产生衍生议题。运算处理单元13分别针对两个方面决定是否产生衍生议题。其一是比较当期关键词与初始关键词(重复度的评估),甚至是比较当期关键词组与前一期(或前两期)关键词组。其二是,基于社群声量进行当期关键词之间的关联强度的计算,以评估当期关键词组的网络声量是否高于前一期的关键词组的网络声量。上述两者是判断衍生议题的两个需同时存在的必要条件,根据上述两者则可决定原本的议题是否随着时间进程而产生至少一衍生议题。若没有产生衍生议题,则进行步骤S110,产生议题演进路径示意图。如果产生衍生议题,则进行步骤S109,判断是否要新增关键词组。也就是当获得新的标签,则判断是否要将新的标签新增到当期关键词组。如果要新增当期关键词组则回到步骤S103再次设定议题关键词。若不需新增当期关键词组,则进行步骤S110,以图形化显示议题演进路径。根据上述,议题显示系统1可以自动化搜索与判断衍生议题;其中,当期出现的衍生议题所产生的衍生关键词会加入当期关键词组并进行重复度和关联强度的计算,直到没有产生新衍生议题为止。
接下来将详细说明步骤S108的演算方式。在本实施例中,基于图5A、图5B与图5C显示的时间区间T1、T2、T3的关键词组与关联强度,来说明如何判断时间区间T1、时间区间T2与时间区间T3的当期关键词以及其关联强度的差异,以判断是否产生衍生议题。
关于关键词的重复度(或重叠率),利用比较图5A和图5B来说明。假设,初始关键词是黑心油(501)、公司A(502)。在时间区间T2,除了黑心油(501)、公司A(502)、饲料油(503)、公司B(504)、公司C(505)、消基会(506),当期关键词更包括抵制(507)。相较于时间区间T1,运算处理单元13可根据至少一当期关键词(501-507)与初始关键词(黑心油(501)、公司A(502))的重叠率,以判断时间区间T2内的网页主题内容是否已产生至少一衍生议题。
在一实施例中,将图5B与图5A的比较可知,在时间区间T1的当期关键词(501-506)与初始关键词(黑心油、公司A)的重叠率相近于在时间区间T2的当期关键词(501-507)与初始关键词(黑心油(501)、公司A(502))的重叠率。在另一实施例中,运算处理单元13也可判断当期关键词与前一期关键词的重叠率,例如将时间区间T2的当期关键词(501-507)与时间区间T1的当期关键词(501-506)做比较,发现只有一个当期关键词“抵制(507)”没有重叠,而另外六个关键词(501-506)都重叠。根据同样方法,比较图5B与图5C,在时间区间T3的当期关键词多了消基会(506)、抵制(507)、公司D(508)与公司E(509),也就是说,时间区间T3的当期关键词与时间区间T2的当期关键词彼此重叠的是黑心油(501)、公司A(502)、饲料油(503)、公司B(504)、公司C(505)、消基会(506)。
关于关联强度,以台湾出现的黑心油(地沟油,gutter oil)事件为例,若以黑心油(501)和公司A(502)做为所选议题的初始关键词,且得到在时间区间T1的黑心油(501)、公司A(502)、饲料油(503)、公司B(504)、公司C(505)、消基会(506)这些标签作为当期关键词。则黑心油(501)、公司A(502)、饲料油(503)、公司B(504)、公司C(505)、消基会(506)这些当期关键词之间的关联强度系分别根据这些当期关键词在时间区间T1内的网页主题内容中出现的次数以及这些当期关键词在同一个网页主题内容出现的次数,再加入这些网页主题内容对应的社群声量值来计算而得。所述社群声量值是人们对应于当期关键词产生在网络上的活动的评估,例如是以点赞的次数、分享的次数或者评价的次数来决定。例如:社群声量值可以根据点赞的次数、分享的次数或者评价的次数进行权重加总而得到。然而,本发明并不限定社群声量值的计算方式。
以图5A为例,关联强度以各个当期关键词之间的连线的粗细表示。例如黑心油(501)与公司A(502)这两个当期关键词在同一个网页主题内容中出现的次数越多则代表黑心油(501)与公司A(502)这两个当期关键词的关联强度越强。并且,当针对黑心油(501)与公司A(502)这两个当期关键词的社群声量越高,则黑心油(501)与公司A(502)这两个当期关键词的关联强度也越强。当黑心油(501)与公司A(502)之间的关联强度越强,黑心油(501)与公司A(502)之间的连线越粗。此外,在图5B中,针对时间区间T2,出现新的当期关键词(抵制507),且抵制(507)与消基会(506)具有强关联强度。在图5C中,针对时间区间T3,具有强关联强度的当期关键词是公司C(505)、消基会(506)、抵制(507)、公司D(508)与公司E(509)。而时间区间T3的其他当期关键词包括黑心油(501)、公司A(502)、饲料油(503)与公司B(504)的关联强度比较弱。
根据上述,运算处理单元1可分析当期关键词之间以社群声量为基础计算的关联强度,并与初始关键词的重复度以及依社群声量计算所得的关联强度做比较,以决定是否产生至少一衍生议题。以上述的图5A、图5B与图5C来说明,比较图5B与图5A可知,时间区间T1的当期关键词和时间区间T2的当期关键词重复度相当高,并且时间区间T1的当期关键词之间的关联强度与时间区间T2的当期关键词之间的关联强度类似,所以可决定在时间区间T2并没有产生衍生议题。比较图5C、图5B与图5A可知,时间区间T3的当期关键词和时间区间T2的当期关键词重复度降低(相较于时间区间T1),并且时间区间T3的当期关键词之间的关联强度与时间区间T1的当期关键词之间的关联强度明显不同,所以可决定在时间区间T3已产生衍生议题。代表所述衍生议题的衍生关键词就是公司C(505)、消基会(506)、抵制(507)、公司D(508)与公司E(509)。
在另一实施例中,判断是否产生衍生议题的详细方式可以是利用关键词的社群声量加总的差异决定,例如:当当期关键词组中所有当期关键词的社群声量加总高于初始关键词的社群声量加总时,运算处理单元13判断时间区间内的网页文章已产生至少一衍生议题且主要讨论议题已转变。
在又一实施例中,运算处理单元13可仅根据社群声量高的至少一当期关键词是否改变,以判断时间区间内的网页主题内容是否已产生至少一衍生议题。以图5B和图5C的比较为例,假设在时间区间T2内社群声量高的当期关键词是黑心油(501)、公司A(502)、饲料油(503)、公司B(504)、公司C(505)、消基会(506)与抵制(507)。然而,在时间区间T3,社群声量高的当期关键词已改变为公司C(505)、消基会(506)、抵制(507)、公司D(508)与公司E(509)。所以可决定已产生至少一衍生议题。最后,当运算处理单元13决定产生至少一衍生议题时,运算处理单元13使显示单元12显示议题和至少一衍生议题,如图6所示。初始设定的议题是A1,衍生议题是A2。衍生议题A2的衍生议题是A3、A4、A5。衍生议题A3的衍生议题是A5和A6。衍生议题A5的衍生议题是A6,依此类推至衍生议题A7、A8、A9、A10、A11。据此,可以图形化显示议题以及至少一衍生议题的演进过程。议题显示系统1也可以进一步提供互动界面让使用者点选议题(A1)和衍生议题(A2-A11)以查询相关细部信息。
接着,请参照图7,图2的概念可以归纳为图7的方法流程。本实施例的议题显示方法执行于图1的议题显示系统1,所述方法包括:使用者利用输入单元设定对应一议题的初始关键词(步骤S210);然后,运算处理单元(13)获得一时间区间内的多个网页主题内容的多个标签,并根据所述标签共同出现的关联性获得所述网页主题内容的当期关键词组,其中当期关键词组包括至少一当期关键词(步骤S220),接着分析关键词间以社群声量为基础计算的关联强度,并与初始关键词的重复度以及根据社群声量计算所得的关联强度做比较,以决定是否产生至少一衍生议题(步骤S230),以及当决定产生至少一衍生议题时,使显示单元(11)显示议题和至少一衍生议题;然后,运算处理单元(13)利用显示单元(11)基于时间特性显示议题和至少一衍生议题(步骤S240)。
设定初始关键词的步骤(S210),可对参照前述图2的步骤S101与步骤S102的说明。针对运算处理单元(13)的运算步骤S220,可参照图2的步骤S103至步骤S106的说明。步骤S230可参照图2的步骤S107与步骤S108的说明。步骤S240可参照前述对于图6的说明。
〔实施例的效果〕
综上所述,本发明实施例所提供的一种议题显示系统和议题显示方法,可由议题的初始关键词获得多个网页主题内容,并进一步获得网页主题内容的当期关键词组。接着,获得初始关键词与当期关键词组的社群声量,并计算初始关键词与当期关键词组之间的关联强度,由此判断是否产生衍生议题。因此,可以基于时间特性显示议题的演进。由此,对使用者而言可呈现一个以网页为基础的议题演进互动界面。另一个角度而言,本发明实施例所提供的一种议题显示系统和议题显示方法可以达到自动化搜索与判断衍生新议题,并自动加入衍生新议题关键词,以达到扩大议题搜索与判断的效果。
以上所述仅为本发明的实施例,其并非用以限制本发明的专利范围。

Claims (18)

1.一种议题显示系统,其特征在于,所述议题显示系统包括:
一输入单元,所述输入单元接收使用者设定的对应一议题的一初始关键词;
一显示单元,所述显示单元基于时间特性显示所述议题在一时间区间内的至少一衍生议题;以及
一运算处理单元,所述运算处理单元耦接所述输入单元与所述显示单元,获得所述时间区间内的多个网页主题内容的多个标签,并根据所述标签共同出现的关联性获得所述网页主题内容的一当期关键词组,其中,所述当期关键词组包括至少一当期关键词,接着所述运算处理单元分析所述当期关键词之间以社群声量值为基础计算的关联强度,并将所述初始关键词的重复度与根据社群声量值计算所得的关联强度进行比较,以决定是否产生所述至少一衍生议题,并且当决定产生所述至少一衍生议题时,所述运算处理单元使所述显示单元显示所述议题和所述至少一衍生议题。
2.根据权利要求1所述的议题显示系统,其中,所述初始关键词能通过所述输入单元接收使用者设定的一主题网页文章并通过所述运算处理单元分析所述主题网页文章的内容而获得。
3.根据权利要求1所述的议题显示系统,其中,所述运算处理单元首先根据所述当期关键词组读取的所述网页主题内容,通过标题、内容比对或文章连结追溯方式将所述网页主题内容分群,再根据分群后每一群的网页主题内容来分析所述至少一当期关键词之间的社群声量值,并将所述当期关键词组所包括的至少一当期关键词与所述初始关键词计算重叠率,以及将至少一当期关键词的社群声量值与所述初始关键词的社群声量值进行比较。
4.根据权利要求1所述的议题显示系统,其中,所述运算处理单元在分析所述至少一当期关键词之间的关联强度时,分别根据所述当期关键词在所述时间区间内所述网页主题内容中出现的次数以及所述当期关键词在同一所述网页主题内容出现的次数,再加入所述网页主题内容对应的社群声量值来进行计算。
5.根据权利要求1所述的议题显示系统,其中,所述运算处理单元根据所述标签共同出现的关联性获得所述网页主题内容的至少一当期关键词,在判断所述网页主题内容的各个标签在所述网页主题内容中出现的次数超过一出现次数的阈值时,所述运算处理单元将所述标签决定为至少一当期关键词。
6.根据权利要求1所述的议题显示系统,其中,所述运算处理单元利用K-core演算法建立每一所述网页主题内容的所述标签。
7.根据权利要求1或4所述的议题显示系统,其中,所述运算处理单元根据所述至少一当期关键词与所述初始关键词的重叠率,以判断所述时间区间内的所述网页主题内容是否已产生所述至少一衍生议题。
8.根据权利要求1或4所述的议题显示系统,其中,所述运算处理单元根据社群声量值高的所述至少一当期关键词是否改变,以判断所述时间区间内的所述网页主题内容是否已产生所述至少一衍生议题。
9.根据权利要求1所述的议题显示系统,其中,当所述当期关键词组中所有所述当期关键词的社群声量值加总高于所述初始关键词的社群声量值加总时,所述运算处理单元判断所述时间区间内的所述网页主题内容已产生所述至少一衍生议题且主要讨论议题已转变。
10.一种议题显示方法,其特征在于,执行于一议题显示系统,所述议题显示系统包括一输入单元、一显示单元以及一运算处理单元,所述议题显示方法包括:
使用者利用所述输入单元设定对应一议题的一初始关键词;
所述运算处理单元获得一时间区间内的多个网页主题内容的多个标签,并根据所述标签共同出现的关联性获得所述网页主题内容的一当期关键词组,其中,所述当期关键词组包括至少一当期关键词,接着所述运算处理单元分析所述关键词之间以社群声量值为基础计算的关联强度,并将所述初始关键词的重复度与根据社群声量值计算所得的关联强度进行比较,以决定是否产生至少一衍生议题,并且当决定产生所述至少一衍生议题时,所述运算处理单元使所述显示单元显示所述议题和所述至少一衍生议题;以及
所述运算处理单元利用所述显示单元基于时间特性显示所述议题和所述至少一衍生议题。
11.根据权利要求10所述的议题显示方法,其中,在设定所述初始关键词的步骤中,所述初始关键词能通过所述输入单元接收使用者设定的一主题网页文章并通过所述运算处理单元分析所述主题网页文章的内容而获得。
12.根据权利要求10所述的议题显示方法,其中,所述运算处理单元首先根据所述当期关键词组读取的所述网页主题内容,通过标题、内容比对或文章连结追溯方式将所述网页主题内容分群,再根据分群后每一群的网页主题内容来分析所述至少一当期关键词之间的社群声量值,并将所述当期关键词组所包括的至少一当期关键词与所述初始关键词计算重叠率,以及将至少一当期关键词的社群声量值与所述初始关键词的社群声量值进行比较。
13.根据权利要求10所述的议题显示方法,所述议题显示方法还包括:
所述运算处理单元在分析所述至少一当期关键词之间的关联强度时,分别根据所述当期关键词在所述时间区间内所述网页主题内容中出现的次数以及所述当期关键词在同一所述网页主题内容出现的次数,再加入所述网页主题内容对应的社群声量值来进行计算。
14.根据权利要求10所述的议题显示方法,所述议题显示方法还包括:
所述运算处理单元根据所述标签共同出现的关联性获得所述网页主题内容的至少一当期关键词,在判断所述网页主题内容的各个标签在所述网页主题内容中出现的次数超过一出现次数的阈值时,所述运算处理单元将所述标签决定为至少一当期关键词。
15.根据权利要求10所述的议题显示方法,所述议题显示方法还包括:
所述运算处理单元利用K-core演算法建立每一所述网页主题内容的所述标签。
16.根据权利要求10或13所述的议题显示方法,所述议题显示方法还包括:
所述运算处理单元根据所述至少一当期关键词与所述初始关键词的重叠率,以判断所述时间区间内的所述网页主题内容是否已产生所述至少一衍生议题。
17.根据权利要求10或13所述的议题显示方法,所述议题显示方法还包括:
所述运算处理单元根据具有高社群声量值的所述至少一当期关键词是否改变,以判断所述时间区间内的所述网页主题内容是否已产生所述至少一衍生议题。
18.根据权利要求10所述的议题显示方法,所述议题显示方法还包括:
当所述当期关键词组中所有所述当期关键词的社群声量值加总高于所述初始关键词的社群声量值加总时,所述运算处理单元判断所述时间区间内的所述网页主题内容已产生所述至少一衍生议题且主要讨论议题已转变。
CN201510807429.6A 2015-11-09 2015-11-19 议题显示系统和议题显示方法 Active CN106682049B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW104136867A TWI649663B (zh) 2015-11-09 2015-11-09 議題顯示系統、議題顯示方法以及電腦可讀取記錄媒體
TW104136867 2015-11-09

Publications (2)

Publication Number Publication Date
CN106682049A CN106682049A (zh) 2017-05-17
CN106682049B true CN106682049B (zh) 2020-04-14

Family

ID=58663372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510807429.6A Active CN106682049B (zh) 2015-11-09 2015-11-19 议题显示系统和议题显示方法

Country Status (3)

Country Link
US (1) US10459980B2 (zh)
CN (1) CN106682049B (zh)
TW (1) TWI649663B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095858A (zh) * 2016-06-02 2016-11-09 海信集团有限公司 一种音视频搜索方法、装置和终端
TWI621952B (zh) * 2016-12-02 2018-04-21 財團法人資訊工業策進會 比較表格自動產生方法、裝置及其電腦程式產品
US10579689B2 (en) 2017-02-08 2020-03-03 International Business Machines Corporation Visualization and augmentation of human knowledge construction during material consumption
CN109325115B (zh) * 2018-08-16 2021-03-09 中国传媒大学 一种角色分析方法及分析系统
CN111698101A (zh) * 2019-03-13 2020-09-22 集创园国际有限公司 即时意见交流系统
CN113220823B (zh) * 2020-01-21 2024-03-01 北京中科闻歌科技股份有限公司 一种面向社交媒体公共言论的情感、话题及观点分析方法和装置
CN114219002A (zh) * 2021-11-12 2022-03-22 国家电网有限公司客户服务中心 一种舆情智能识别系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101571853A (zh) * 2009-05-22 2009-11-04 哈尔滨工程大学 网络话题内容演化分析装置及分析方法
CN103177076A (zh) * 2012-12-28 2013-06-26 中联竞成(北京)科技有限公司 一种基于定点网站的舆情监测系统及方法
CN103218410A (zh) * 2013-03-26 2013-07-24 亿赞普(北京)科技有限公司 互联网事件分析方法与装置
TW201401202A (zh) * 2012-06-21 2014-01-01 li-zhen Yang 問卷統計分析系統與方法
JP2016040655A (ja) * 2014-08-12 2016-03-24 株式会社日本製鋼所 射出成形機とパスワード発行器の組み合わせ

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6629097B1 (en) * 1999-04-28 2003-09-30 Douglas K. Keith Displaying implicit associations among items in loosely-structured data sets
JP3562572B2 (ja) 2000-05-02 2004-09-08 インターナショナル・ビジネス・マシーンズ・コーポレーション データベースのドキュメントにおける新規な事項・新規クラスの検出及び追跡
US7894670B2 (en) * 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US7904461B2 (en) * 2007-05-01 2011-03-08 Google Inc. Advertiser and user association
US9842586B2 (en) * 2014-07-09 2017-12-12 Genesys Telecommunications Laboratories, Inc. System and method for semantically exploring concepts
US10120932B2 (en) * 2014-07-24 2018-11-06 Adobe Systems Incorporated Social capture rules
US9830386B2 (en) * 2014-12-30 2017-11-28 Facebook, Inc. Determining trending topics in social media
US9817893B2 (en) * 2015-02-18 2017-11-14 Adobe Systems Incorporated Tracking changes in user-generated textual content on social media computing platforms

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101571853A (zh) * 2009-05-22 2009-11-04 哈尔滨工程大学 网络话题内容演化分析装置及分析方法
TW201401202A (zh) * 2012-06-21 2014-01-01 li-zhen Yang 問卷統計分析系統與方法
CN103177076A (zh) * 2012-12-28 2013-06-26 中联竞成(北京)科技有限公司 一种基于定点网站的舆情监测系统及方法
CN103218410A (zh) * 2013-03-26 2013-07-24 亿赞普(北京)科技有限公司 互联网事件分析方法与装置
JP2016040655A (ja) * 2014-08-12 2016-03-24 株式会社日本製鋼所 射出成形機とパスワード発行器の組み合わせ

Also Published As

Publication number Publication date
CN106682049A (zh) 2017-05-17
TWI649663B (zh) 2019-02-01
US20170132237A1 (en) 2017-05-11
TW201717067A (zh) 2017-05-16
US10459980B2 (en) 2019-10-29

Similar Documents

Publication Publication Date Title
CN106682049B (zh) 议题显示系统和议题显示方法
CN109800352B (zh) 基于剪贴板进行信息推送的方法、系统及终端设备
US10268960B2 (en) Information recommendation method, apparatus, and server based on user data in an online forum
JP5778255B2 (ja) 垂直検索に基づいたクエリの方法、システム、および装置
EP3873065B1 (en) Content recommendation method, mobile terminal, and server
WO2020048084A1 (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
US10977317B2 (en) Search result displaying method and apparatus
TWI512506B (zh) Sorting method and device for search results
US9317550B2 (en) Query expansion
CN103294778B (zh) 一种推送资讯信息的方法及系统
US20150213042A1 (en) Search term obtaining method and server, and search term recommendation system
JP2015191655A (ja) 推奨ページを生成するための方法及び装置
CN110888990A (zh) 文本推荐方法、装置、设备及介质
CN112784141B (zh) 搜索结果质量确定方法、装置、存储介质和计算机设备
US20140379719A1 (en) System and method for tagging and searching documents
CN103365839A (zh) 一种搜索引擎的推荐搜索方法和装置
WO2014206151A1 (en) System and method for tagging and searching documents
CN112182351B (zh) 一种基于多特征融合的新闻推荐方法及装置
CN112579854A (zh) 信息处理方法、装置、设备和存储介质
CN111061954A (zh) 搜索结果排序方法、装置及存储介质
CN110347922B (zh) 基于相似度的推荐方法、装置、设备和存储介质
CN112597274A (zh) 基于bm25算法的文档确定方法、装置、设备及存储介质
CN108205545B (zh) 一种为用户提供推荐信息的方法与设备
CN110750707A (zh) 关键词推荐方法、装置和电子设备
EP2073131A1 (en) Method and apparatus for processing a search query for text content items

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant