CN104240107A - 社群数据筛选系统及其方法 - Google Patents

社群数据筛选系统及其方法 Download PDF

Info

Publication number
CN104240107A
CN104240107A CN201310359197.3A CN201310359197A CN104240107A CN 104240107 A CN104240107 A CN 104240107A CN 201310359197 A CN201310359197 A CN 201310359197A CN 104240107 A CN104240107 A CN 104240107A
Authority
CN
China
Prior art keywords
information
community
user
data
filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310359197.3A
Other languages
English (en)
Other versions
CN104240107B (zh
Inventor
吕俊宏
李宜勋
谢文泰
陈泰宏
张裕淇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute for Information Industry
Original Assignee
Institute for Information Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute for Information Industry filed Critical Institute for Information Industry
Publication of CN104240107A publication Critical patent/CN104240107A/zh
Application granted granted Critical
Publication of CN104240107B publication Critical patent/CN104240107B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明揭露一种社群数据筛选系统及其方法。社群数据筛选系统包含:数据库、撷取模块、过滤模块及判断模块。数据库储存人员数据及对应的识别信息。撷取模块自数据库撷取对应指定人员的人员数据及其识别信息,并产生搜寻信息,于社群数据源中,撷取使用者信息及其对应的社群互动信息。过滤模块依据人员数据,自使用者信息及社群互动信息进行过滤处理以撷取过滤信息。判断模块根据过滤信息,判断对应指定人员的至少一关键字词。

Description

社群数据筛选系统及其方法
技术领域
本发明是有关于一种社群数据处理筛选系统及方法的技术领域,且特别是有关于一种可根据数据库的人员数据及识别信息,快速地从社群数据源撷取使用者信息及社群互动信息进行分析与比对的社群数据筛选系统及其方法。
背景技术
企业在规划或推出产品时,需要紧密地掌握客户的需求与偏好,以了解市场趋势,并推出符合客户期待的产品。
在企业对客户进行产品的推销,或是欲得知客户需求以求产品的改进时,往往只能依靠客户过往与企业间的互动行为及记录来判断客户的偏好,进而依照这些旧有的信息进行客户关系管理(customer relationship management;CRM),以及规划未来将如何行销其产品。然而,一方面客户的详细需求可能并不会在既有的互动行为及记录中完全表现,另一方面客户的偏好可能随着时间变化,而使这些互动行为及记录过时且不适用于目前或未来的行销。
因此,如何设计一个新的社群数据筛选系统及其方法,通过社群数据来辅助企业对客户目前的需求与偏好可以达到更精准的估测,以解决上述的问题,乃为此一业界亟待解决的问题。
发明内容
本发明的目的在于提供一种社群数据筛选系统及其方法。
因此,本发明的一方面是在提供一种社群数据筛选系统,包含:数据库、撷取模块、过滤模块以及判断模块。数据库用以储存多个人员数据及其对应的多个识别信息。撷取模块链结数据库,用以自数据库的人员数据及其对应的多个识别信息中撷取对应指定人员的人员数据及其识别信息,并根据识别信息产生多个搜寻信息,其中搜寻信息是用于多个社群数据源中,撷取社群数据源的多个使用者信息及其对应的至少一社群互动信息。过滤模块链结撷取模块,用以依据指定人员的人员数据,自多个使用者信息及其对应的至少一社群互动信息中,进行过滤处理以撷取出至少一过滤信息,其中每一过滤信息为被判断对应指定人员的使用者信息及其对应的社群互动信息。判断模块链结过滤模块,用以根据过滤信息,判断对应指定人员的至少一关键字词。
因此,本发明的另一方面是在提供社群数据筛选方法,包含:通过撷取模块,自数据库的多个人员数据及其对应的多个识别信息中,撷取对应指定人员的人员数据及其识别信息;通过撷取模块,根据识别信息产生多个搜寻信息;通过撷取模块,根据搜寻信息,于多个社群数据源中,撷取社群数据源的多个使用者信息及其对应的至少一社群互动信息;通过过滤模块,依据指定人员的人员数据,自多个使用者信息及其对应的至少一社群互动信息中,进行过滤处理以撷取出至少一过滤信息,其中每一过滤信息为被判断对应指定人员的使用者信息及其对应的社群互动信息;以及通过判断模块,根据过滤信息,判断对应指定人员的至少一关键字词。
依据本发明一实施例,其中社群数据筛选系统及方法还包含储存所撷取出的使用者信息及其分别对应的至少一社群互动信息于社群数据库,且提供所储存的信息以进行过滤处理。
依据本发明另一实施例,其中所撷取的每一社群互动信息中还包括有对应每一社群互动数据的时间信息,判断至少一关键字词的步骤还包含根据过滤信息及指定时间信息,判断对应指定人员及对应指定时间的至少一关键字词。
依据本发明又一实施例,其中社群数据筛选系统及方法于撷取过滤信息、进行过滤处理时,通过语意分析及匹配单元,对使用者信息所对应的社群互动信息进行语意分析及匹配,分别产生每一使用者信息的社群互动信息间的行为性关联值,其中行为性关联值是依据社群互动信息间的时间性关联值、地域性关联值和字词性关联值而产生;依据社群互动信息的行为性关联值,找出其大于关联性门槛值者其社群互动信息所对应的使用者信息,以判断其是对应于候选人员;比对指定人员的人员数据和对应候选人员的所有使用者信息;以及决定对应候选人员的使用者信息及社群互动信息,是否为至少一过滤信息。
依据本发明又一实施例,其中社群数据筛选系统及方法于撷取过滤信息时,通过社群人际关系撷取单元,分别从每一使用者信息及其对应的社群互动信息撷取出社群人际关系信息,以对应每一使用者信息;依据使用者信息及其对应社群人际关系信息,找出至少二组的社群人际关系信息之间的相似度大于相似度门槛值者,判断至少二组的使用者信息为对应于候选人员;比对指定人员的人员数据和对应候选人员的使用者信息;以及决定对应候选人员的使用者信息及社群互动信息,是否为至少一过滤信息。撷取过滤信息的步骤还包含:在比对指定人员的人员数据和对应候选人员的使用者信息,以决定每一对应候选人员的使用者信息及社群互动信息是否为至少一过滤信息之前,通过过滤模块,进行数据分群及消岐处理,将经过数据分群及消岐处理后所得的候选人员的使用者信息及社群互动信息,决定为过滤信息。撷取过滤信息的步骤更包含:对撷取使用者信息中的使用者名称和指定人员的识别信息进行混合比对;撷取使用者信息中的个人数据;以及根据个人数据、行为性关联值及混合比对的结果,进行数据分群以及消岐处理。
应用本发明的优点在于通过社群数据筛选系统及其方法,根据数据库的人员数据及识别信息,快速地从社群数据源撷取使用者信息及社群互动信息进行分析与比对,判断相符的信息与关键字词,而轻易地达到上述的目的。
附图说明
图1A为本发明一实施例中,一种社群数据筛选系统的方块图;
图1B为本发明另一实施例中,一种社群数据筛选系统的方块图;
图2为本发明一实施例中,过滤模块更详细的方块图;
图3为本发明一实施例中,语意分析及匹配单元更详细的方块图;
图4为本发明一实施例中,一种社群数据筛选方法的流程图。
具体实施方式
请参照图1A。图1A为本发明一实施例中,一种社群数据筛选系统1的方块图。社群数据筛选系统1主要包含:数据库100、撷取模块102、过滤模块106、以及判断模块108。
数据库100用以储存多个人员数据101及其对应的多个识别信息103。数据库100于一实施例中,可例如但不限于为企业内部的客户数据库,以储存有与客户相关的人员数据101。其对应的识别信息103可包含例如但不限于中文姓名、英文姓名、电子邮件帐号、昵称、住址、职业、服务单位、毕业或正在就读的学校、生日、电话、消费记录等信息。
撷取模块102链结数据库100,用以自数据库100的人员数据101及其对应的多个识别信息中,撷取对应一指定人员(例如一个特定客户)的人员数据101及其识别信息103。举例来说,上述的指定人员可以是撷取模块102自行从数据库100选取,例如随机选择或依照一顺序来依序选取,又或者可以由社群数据筛选系统1自其选择性配置的输入模块或操作界面(未绘示)来接收一使用者的输入后以选择一个指定的人员,撷取模块102即可依据使用者的输入从数据库100中撷取出对应的相关信息。在一些实施例中,输入模块或操作界面,可以是键盘、鼠标、触控屏幕、麦克风、应用程序界面、人机界面等,或是其中两种以上组合。
撷取模块102进一步根据识别信息103产生多个搜寻信息105。搜寻信息105可用于多个社群数据源,例如图1A所绘示的社群数据源112中,以撷取社群数据源112中的多个使用者信息107及其对应的至少一社群互动信息109。社群数据源的数目可随不同实施例调整,社群数据源例如但不限于Facebook、Twitter、Plurk、Google+、Youtube等社群网站的服务器或数据库,亦或者是Yahoo、Sina、sohu等入口网站的网络购物、部落格、微网志、论坛、交友服务等信息等。
于不同实施例中,撷取模块102可利用前述的识别信息103(例如中文姓名、英文姓名、电子邮件帐号、绰号)中的部分或其组合等信息产生搜寻信息105,用以于社群数据源112中搜寻部分相符或完全相符的数据。依据搜寻信息105可从这些社群数据源112中撷取出的使用者信息107,例如社群平台所记录其用户的使用者数据如个人数据或登录数据等。在一些实施例中,所撷取的使用者信息107,其与识别信息103的中文姓名、英文姓名、昵称、住址、职业、服务单位、毕业或正在就读的学校、生日、电话等,可以是某种程度近似、部分相符或完全相符。社群互动信息109则可以是对应使用者信息107在各类社群平台或入口网站的发布信息、按赞、网络购物历史信息、网络浏览历史信息、社群人际关系信息、地区移动历史信息等。其中,社群互动信息109还可包含与这些信息相关的时间信息。举例来说,社群互动信息109可包含此使用者发布信息与浏览网络信息的时间。
举例来说,当数据库100所储存的人员数据101有一位使用者李爱国,且其对应识别信息103包含如生日为12月23日、英文姓名为Tom、地址为台北市、电子邮件帐号为leeguogmail.com等信息。而一般不同社群数据源中所储存的使用者数据并不完全相同,也就是说,每一社群数据源可能会记录不同种类、不同栏位的数据。撷取模块102可从数个社群数据源中撷取出所需要的多个使用者信息及每一使用者所分别对应的社群互动信息予以储存,例如撷取出的使用者信息的种类可包括数据源、名称、年龄、居住城市、毕业学校等,社群互动信息的种类可包括好友、发布信息、按赞信息等。储存方式可以有多种形式,例如将所有撷取数据全部储存在一表格中,或是分成数个不同的关联式表格来储存,或是储存成一记录文件。过滤模块106链结撷取模块102,用以依据指定人员的人员数据101,自使用者信息社群互动信息107中,进行过滤处理以撷取出至少一过滤信息111。
图1B为本发明另一实施例的社群数据筛选系统方块图,除了和图1A相同的元件之外,更进一步包含有社群数据库104以及客户筛选模块110。请参照图1B,社群数据筛选系统1可选择性地设置或可链结到外部的一个社群数据库104,以链结于撷取模块102及过滤模块106,并储存撷取模块102所撷取出的使用者信息107及其对应的社群互动信息109,以提供所储存的信息予过滤模块106进行处理。因此,过滤模块106可直接从撷取模块102获取使用者信息107及社群互动信息109,亦或间接地透过社群数据库104获取使用者信息107及社群互动信息109。
在图1A和图1B的实施例中,过滤模块106可通过过滤处理产生过滤信息111,过滤信息111为被判断对应指定人员的使用者信息107及社群互动信息109。关于过滤模块106更详细的元件结构与过滤处理更详细的进行方式,将于后续的段落有更细部的说明。更进一步地,于一实施例中,过滤模块106所产生的过滤信息111,可经由社群数据筛选系统1选择性配置的显示模块或操作界面(未绘示)显示,并接收确认输入的信息,此确认输入的信息可以是由一使用者来输入,或是经由社群数据筛选系统1将过滤信息111和其他可供比对确认的信息进行自动比对,比对结果相符时自动产生。过滤模块106可在接收到过滤信息111及确认输入信息的后,判断被确认的过滤信息11为相符的过滤信息111,以更为提高过滤信息111的准确性。
判断模块108链结过滤模块106,用以根据过滤信息111,判断对应指定人员的至少一关键字词113。此关键字词,可能是此指定人员的喜好、需求、消费倾向、关注议题、有兴趣物品等信息。因此,企业将可根据判断的关键字词来了解客户想得知的产品信息,进而规划行销方案或是选择是适当的客户来进行行销。
于另一实施例中,撷取模块102所撷取的每一笔社群互动信息107中,还可包括有对应的时间信息,例如每一笔社群互动信息107所发布的时间或是社群互动信息107中所提及的时间。判断模块108还可根据过滤信息111和一指定时间信息,判断对应指定人员及对应指定时间的关键字词113。例如,当指定时间信息为一年时,判断模块108将可从过滤信息111中,找出其中社群互动信息107所对应的时间信息(发布时间或内容提及时间)为搜寻当日起1年以内的社群互动信息107,再依据1年以内的社群互动信息107来判断对应指定人员及对应指定时间的关键字词,避免过久以前的信息影响判断的结果。
于又一实施例中,判断模块108亦可选择性地链结于数据库100,以将对应指定人员的关键字词113,储存于数据库100中作为对应指定人员的人员数据的对应关键字词113的数据,或是更新数据库100中原有的关键字词113数据。链结于数据库100的客户筛选模块110,将可用以透过例如社群数据筛选系统1选择性配置的输入模块接收客户筛选数据115,以依据数据库100的人员数据101及其对应的关键字词113的数据,筛选出对应客户筛选数据115的至少一目标人员117。
更进一步时,过滤模块更可经由语意分析技术、社群人际关系撷取技术、数据分群/消岐技术或混合比对技术等,来产生过滤信息111。请参照图2。图2为本发明又一实施例中,过滤模块106更详细的方块图。于本实施例中,过滤模块106可以进一步包含语意分析及匹配单元200、社群人际关系撷取单元202、使用者名称撷取单元204、个人数据撷取单元206、数据分群及消岐单元208以及比对单元210等其中任一单元,或其中任两种以上的组合。其中,语意分析及匹配单元200、社群人际关系撷取单元202、使用者名称撷取单元204以及个人数据撷取单元206分别接收人员数据101、识别信息103、使用者信息107及社群互动信息109,以进行各自的处理程序。
语意分析及匹配单元的相关技术说明说明如下,请参照图3。图3为本发明一实施例中,语意分析及匹配单元200更详细的方块图。语意分析及匹配单元200对使用者信息107所对应的社群互动信息109进行语意分析及匹配。于本实施例中,语意分析及匹配单元200包含信息形态偏好分析元件30、动态分析元件32以及断词分析元件34。
信息形态偏好分析元件30对社群互动信息109进行信息形态分析。举例来说,互动信息可被分析为是文字格式、影音格式或图片格式的信息。动态分析元件32对社群互动信息109进行时间分析以及地点分析。举例来说,动态分析元件32可根据信息发布的时间戳记与其发布的来源网络位址,判断此信息发布的时间与地点。
断词分析元件34可对社群互动信息109进行关联性分析以及关键字侦测。举例来说,断词分析元件34可将社群互动信息109的文字内容拆成多个单字或词汇,分析这些单字或词汇彼此间,或是与时间及地点信息的关联,以及单独或共同出现的频率,以进行关键字的侦测与字词间的关联性分析。根据上述的分析,语意分析及匹配单元200可产生时间性关联值、地域性关联值和字词性关联值,并根据这些关联值的统计计算产生每一个使用者信息107所对应的社群互动信息109间的行为性关联值201。
信息形态偏好分析元件30、动态分析元件32以及断词分析元件34可对前述所撷取出社群互动信息,例如使用者的发布信息内容进行分析,以辨识出文字格式、发布时间及侦测关键字。以关键字的侦测来举例说明,当以BMW为关键字时,可分析所有发布信息中的文字,找出包含有BMW的发布信息。当发布信息的时间较为久远时,可能被视为时效性不佳而不予撷取。
社群人际关系撷取单元202分别从每一使用者信息107及其对应的社群互动信息109中,撷取出社群人际关系信息203,以对应每一使用者信息107。社群人际关系信息203可为例如但不限于社群网站中,此使用者所加的好友或是曾通过发布信息沟通的对象相关的信息。
社群人际关系撷取单元202可从前述所撷取出的社群互动信息,例如使用者的好友数据行分析,以辨识出相关的社群人际关系信息203。于一实施例中,除使用者的好友数据外,社群人际关系撷取单元202亦可进一步地根据使用者好友的好友数据,即第二层的好友关系做为数据源,以达到更复杂的社群人际关系分析。
使用者名称撷取单元204撷取使用者信息107中的使用者名称,并将使用者名称和指定人员的识别信息103进行混合比对。使用者名称可例如但不限于为此使用者的中文姓名、英文姓名、昵称或电子邮件帐号的信息。其中上述的混合比对,是由使用者名称撷取单元204参考各种具身份识别性质的识别信息103,例如姓名、电话号码、电子邮件帐号等信息,对使用者名称进行字词拼音转换比对、部分比对、字首比对、字尾比对和代称比对其中之一,或其中二种以上的组合,以产生混合比对结果205。其中,指定人员的识别信息103亦可进行拆解与组合,取部分或全部的信息内容来与使用者名称进行混合比对。
个人数据撷取单元206撷取使用者信息中的个人数据207。个人数据207可包含例如但不限于使用者的住址、职业、服务单位、毕业或正在就读的学校、生日、电话等。
数据分群及消岐单元208根据个人数据207、行为性关联值201及混合比对205的结果,进行数据分群以及消岐处理。数据分群及消歧单元可采用一般习知的数据分群技术和数据消歧技术,例如数据分群技术可以是K-Means、Nelder-Mead搜寻法、粒子群体最佳化演等,数据消歧技术可以利用决策树、最大熵、消歧义数据、或其他等方法来判断数据之间是否为相同或相异。
比对单元210可综合上述的信息进行比对处理。举例来说,比对单元210可先通过个人数据207以及由使用者名称产生的混合比对结果205,先与指定人员的人员数据101比对,以筛选出可能的对应候选人员。接着,比对单元210可根据经过数据分群以及消岐处理过后的社群人际关系信息203,找出至少二组的社群人际关系信息203之间的相似度大于一个预设的相似度门槛值者,以判断至少二组的使用者信息107为对应于候选人员,再比对指定人员的人员数据101和对应候选人员的使用者信息107,以决定对应候选人员的使用者信息107及社群互动信息109,是否为过滤信息111。
并且,比对单元210还依据社群互动信息109的行为性关联值201,找出其大于预设的关联性门槛值者,其社群互动信息所对应的使用者信息107,以判断其是对应于候选人员,再比对指定人员的人员数据和对应候选人员的所有使用者信息107,以决定对应候选人员的使用者信息107及社群互动信息109,是否为过滤信息111。
比对单元210可对前述从社群数据源中所撷取出的多个使用者数据(例如包括李爱国、Tom Lee、AiKuoLee、AiGuoLee及Tom1223等多笔数据),与数据库100中的人员数据101(例如李爱国、Tom、leeguo及生日等)个人数据混合比对,并可因而排除掉所撷取多个使用者数据中差异性较大的使用者数据,例如AiKuoLee。比对单元210亦可判断如第1组及第6组数据间的社群人际关系信息203间的相似度大于预设的相似度门槛值,而判断此二组的使用者信息107为对应于候选人员。比对单元210更可根据张贴信息判断这些信息间的行为性关联值,例如第1、3及7组的张贴信息时间相近且关注相同的议题来判断这些社群互动信息109所对应的使用者信息107是对应于候选人员。比对单元210可进一步比对指定人员的人员数据101和对应候选人员的所有使用者信息107,以进一步确定哪些使用者信息107可为过滤信息111。
在产生过滤信息111后,判断模块108将可据以判断对应指定人员的关键字词113。以前述实施例为例关键字词113例如可以是BMW。
因此,本发明的通过社群数据筛选系统1可根据数据库的人员数据及识别信息,快速地从社群数据源撷取使用者信息及社群互动信息,并以多种方式进行分析与比对,进而判断相符的信息与关键字词,有效率且精确地获得人员的喜好与关注议题的相关信息。
请参照图4。图4为本发明一实施例中,一种社群数据筛选方法400的流程图。社群数据筛选方法400可应用于如图1A、图1B所示的社群数据筛选系统1中,或经由其他硬件元件如数据库、一般处理器、计算机、服务器、或其他具特定逻辑电路的独特硬件装置或具特定功能的设备来实作,如将程序码和处理器/芯片整合成独特硬件。此社群数据筛选方法400可实作为一计算机程序,并储存于一计算机可读取记录媒体中,而使计算机读取此记录媒体后执行即时地点推荐方法。计算机可读取记录媒体可为只读记忆体、快闪记忆体、软盘、硬盘、光盘、随身盘、磁带、可由网络存取的数据库或熟悉此技艺者可轻易思及具有相同功能的计算机可读取记录媒体。社群数据筛选方法400下列步骤(应了解到,在本实施方式中所提及的步骤,除特别叙明其顺序者外,均可依实际需要调整其前后顺序,甚至可同时或部分同时执行)。
于步骤401,撷取模块102自数据库100的人员数据101及其对应的识别信息103中,撷取对应指定人员的人员数据101及其识别信息103。
于步骤402,撷取模块102根据识别信息103产生搜寻信息105。
于步骤403,撷取模块102根据搜寻信息105,于社群数据源(如第1图中的社群数据源112)中,撷取社群数据源的使用者信息107及其对应的社群互动信息109。
于步骤404,过滤模块106依据指定人员的人员数据101,自使用者信息107及其对应的社群互动信息109中,进行过滤处理以撷取出过滤信息111,其中每一过滤信息111为被判断对应指定人员的使用者信息107及其对应的社群互动信息109
于步骤405,判断模块108根据过滤信息111,判断对应指定人员的关键字词113。
所述方法的其他细部技术或实施方式,可参考前述社群数据筛选系统1及其实施例的说明,不再重复赘述。
虽然本发明已以实施方式揭露如上,然其并非用以限定本发明,任何熟悉此技艺者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰,因此本发明的保护范围当视所附的权利要求书所界定的范围为准。

Claims (16)

1.一种社群数据筛选系统,其特征在于,包含:
一数据库,用以储存多个人员数据及其对应的多个识别信息;
一撷取模块,链结所述数据库,用以自所述数据库的所述多个人员数据及其对应的多个识别信息中撷取对应一指定人员的人员数据及其识别信息,并根据所述识别信息产生多个搜寻信息,其中所述多个搜寻信息是用于多个社群数据源中,撷取所述多个社群数据源的多个使用者信息及其对应的至少一社群互动信息;
一过滤模块,链结所述撷取模块,用以依据所述指定人员的人员数据,自所述多个使用者信息及其对应的所述至少一社群互动信息中,进行一过滤处理以撷取出至少一过滤信息,其中每一所述过滤信息为被判断对应所述指定人员的使用者信息及其对应的所述社群互动信息;以及
一判断模块,链结所述过滤模块,用以根据所述过滤信息,判断对应所述指定人员的至少一关键字词。
2.根据权利要求1所述的社群数据筛选系统,其特征在于,还包括一社群数据库,链结所述撷取模块及所述过滤模块,用以储存所述撷取模块所撷取出的所述使用者信息及其分别对应的所述至少一社群互动信息,且提供所储存的信息以供所述过滤模块进行所述过滤处理。
3.根据权利要求1所述的社群数据筛选系统,其特征在于,所撷取的每一所述社群互动信息中还包括有对应每一所述社群互动数据的一时间信息;以及所述判断模块还用以根据所述过滤信息及一指定时间信息,判断对应所述指定人员及对应所述指定时间的所述至少一关键字词。
4.根据权利要求1所述的社群数据筛选系统,其特征在于,所述过滤模块还包含一语意分析及匹配单元,用以于所述过滤模块进行所述过滤处理时,对所述使用者信息所对应的所述社群互动信息进行语意分析及匹配,分别产生每一使用者信息的所述社群互动信息间的一行为性关联值,其中所述行为性关联值是依据所述社群互动信息间的一时间性关联值、一地域性关联值和一字词性关联值而产生;以及所述过滤模块是依据所述社群互动信息的所述行为性关联值,找出其大于一关联性门槛值者其所述社群互动信息所对应的所述使用者信息,以判断其是对应于一候选人员,再比对所述指定人员的所述人员数据和对应所述候选人员的所有使用者信息,以决定对应所述候选人员的使用者信息及所述社群互动信息,是否为所述至少一过滤信息。
5.根据权利要求1所述的社群数据筛选系统,其特征在于,所述过滤模块还包含一社群人际关系撷取单元,用以分别从每一所述使用者信息及其对应的所述社群互动信息撷取出一社群人际关系信息,以对应每一所述使用者信息;以及
所述过滤模块还用以依据所述使用者信息及其对应社群人际关系信息,找出至少二组的所述社群人际关系信息之间的相似度大于一相似度门槛值者,判断所述至少二组的使用者信息为对应于一候选人员,再比对所述指定人员的所述人员数据和对应所述候选人员的使用者信息,以决定对应所述候选人员的使用者信息及所述社群互动信息,是否为所述至少一过滤信息。
6.根据权利要求5所述的社群数据筛选系统,其特征在于,所述过滤模块还于比对所述指定人员的所述人员数据和对应所述候选人员的使用者信息,以决定每一对应所述候选人员的使用者信息及所述社群互动信息是否为所述至少一过滤信息之前,进行一数据分群及消岐处理,将经过所述数据分群及消岐处理后所得的所述候选人员的使用者信息及所述社群互动信息,决定为所述过滤信息。
7.根据权利要求4所述的社群数据筛选系统,其特征在于,所述过滤模块还包含:
一使用者名称撷取单元,以撷取所述使用者信息中的一使用者名称,以和所述指定人员的识别信息进行一混合比对;
一个人数据撷取单元,以撷取所述使用者信息中的一个人数据;以及
一数据分群及消岐单元,以根据所述个人数据、所述行为性关联值及所述混合比对的结果,进行数据分群以及消岐处理。
8.根据权利要求4所述的社群数据筛选系统,其特征在于,所述语意分析及匹配单元还包含:
一信息形态偏好分析元件,用以对所述社群互动信息进行一信息形态分析;
一动态分析元件,用以对所述社群互动信息进行一时间分析以及一地点分析;以及
一断词分析元件,用以对所述社群互动信息进行一关联性分析以及一关键字侦测。
9.一种社群数据筛选方法,其特征在于,包含:
通过一撷取模块,自一数据库的多个人员数据及其对应的多个识别信息中,撷取对应一指定人员的一人员数据及其识别信息;
通过所述撷取模块,根据所述识别信息产生多个搜寻信息;
通过所述撷取模块,根据所述搜寻信息,于多个社群数据源中,撷取所述社群数据源的多个使用者信息及其对应的至少一社群互动信息;
通过一过滤模块,依据所述指定人员的人员数据,自所述多个使用者信息及其对应的所述至少一社群互动信息中,进行一过滤处理以撷取出至少一过滤信息,其中每一所述过滤信息为被判断对应所述指定人员的使用者信息及其对应的所述社群互动信息;以及
通过一判断模块,根据所述过滤信息,判断对应所述指定人员的至少一关键字词。
10.根据权利要求9所述的社群数据筛选方法,其特征在于,还包含储存所述撷取模块所撷取出的所述使用者信息及其分别对应的所述至少一社群互动信息于一社群数据库,且提供所储存的信息以进行所述过滤处理。
11.根据权利要求9所述的社群数据筛选方法,其特征在于,所撷取的每一所述社群互动信息中还包括有对应每一所述社群互动数据的一时间信息,判断所述至少一关键字词的步骤还包含根据所述过滤信息及一指定时间信息,判断对应所述指定人员及对应所述指定时间的所述至少一关键字词。
12.根据权利要求9所述的社群数据筛选方法,其特征在于,撷取所述过滤信息的步骤还包含:
于进行所述过滤处理时,通过一语意分析及匹配单元,对所述使用者信息所对应的所述社群互动信息进行语意分析及匹配,分别产生每一使用者信息的所述社群互动信息间的一行为性关联值,其中所述行为性关联值是依据所述社群互动信息间的一时间性关联值、一地域性关联值和一字词性关联值而产生;
依据所述社群互动信息的所述行为性关联值,找出其大于一关联性门槛值者其所述社群互动信息所对应的使用者信息,以判断其是对应于一候选人员;
比对所述指定人员的所述人员数据和对应所述候选人员的所有使用者信息;以及
决定对应所述候选人员的使用者信息及所述社群互动信息,是否为所述至少一过滤信息。
13.根据权利要求9所述的社群数据筛选方法,其特征在于,撷取所述过滤信息的步骤还包含:
通过一社群人际关系撷取单元,分别从每一所述使用者信息及其对应的所述社群互动信息撷取出一社群人际关系信息,以对应每一所述使用者信息;
依据所述使用者信息及其对应社群人际关系信息,找出至少二组的所述社群人际关系信息之间的相似度大于一相似度门槛值者,判断所述至少二组的使用者信息为对应于一候选人员;
比对所述指定人员的所述人员数据和对应所述候选人员的使用者信息;以及
决定对应所述候选人员的使用者信息及所述社群互动信息,是否为所述至少一过滤信息。
14.根据权利要求13所述的社群数据筛选方法,其特征在于,撷取所述过滤信息的步骤还包含:
在比对所述指定人员的所述人员数据和对应所述候选人员的使用者信息,以决定每一对应所述候选人员的使用者信息及所述社群互动信息是否为所述至少一过滤信息之前,通过所述过滤模块,进行一数据分群及消岐处理,将经过所述数据分群及消岐处理后所得的所述候选人员的使用者信息及所述社群互动信息,决定为所述过滤信息。
15.根据权利要求12所述的社群数据筛选方法,其特征在于,撷取所述过滤信息的步骤还包含:
通过一使用者名称撷取单元,对撷取所述使用者信息中的一使用者名称和所述指定人员的识别信息进行一混合比对;
通过一个人数据撷取单元,撷取所述使用者信息中的一个人数据;以及
通过一数据分群及消岐单元,根据所述个人数据、所述行为性关联值及所述混合比对的结果,进行数据分群以及消岐处理。
16.根据权利要求12所述的社群数据筛选方法,其特征在于,所述语意分析及匹配包含通过一断词分析元件进行一关联性分析以及一关键字侦测、通过一信息形态偏好分析元件进行一信息形态分析以及通过一动态分析元件进行一时间分析、一地点分析或其组合。
CN201310359197.3A 2013-06-18 2013-08-16 社群数据筛选系统及其方法 Active CN104240107B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW102121561A TWI575391B (zh) 2013-06-18 2013-06-18 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體
TW102121561 2013-06-18

Publications (2)

Publication Number Publication Date
CN104240107A true CN104240107A (zh) 2014-12-24
CN104240107B CN104240107B (zh) 2017-12-05

Family

ID=52020164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310359197.3A Active CN104240107B (zh) 2013-06-18 2013-08-16 社群数据筛选系统及其方法

Country Status (3)

Country Link
US (1) US9607031B2 (zh)
CN (1) CN104240107B (zh)
TW (1) TWI575391B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI649712B (zh) * 2017-12-08 2019-02-01 財團法人工業技術研究院 電子裝置、決策流程模組的呈現方法及電腦可讀式媒體
CN110020375A (zh) * 2017-12-28 2019-07-16 沈阳新松机器人自动化股份有限公司 一种社交网络用户影响力的评估方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016166664A1 (en) * 2015-04-13 2016-10-20 Telefonaktiebolaget L M Ericsson (Publ) Method for reducing serving cell interruption due to prose operation
TWI779311B (zh) * 2020-07-08 2022-10-01 合作金庫人壽保險股份有限公司 職業類別判斷系統和職業類別判斷方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6845345B1 (en) * 2001-02-06 2005-01-18 Advanced Micro Devices, Inc. System for monitoring and analyzing diagnostic data of spin tracks
TW201001179A (en) * 2008-06-27 2010-01-01 Ind Tech Res Inst System and method for establishing personal social network, trusted network and social networking system
TW201115371A (en) * 2009-10-28 2011-05-01 Ind Tech Res Inst Systems and methods for organizing collective social intelligence information using an organic object data model
CN102053979A (zh) * 2009-10-27 2011-05-11 华为技术有限公司 一种信息收集方法和系统
CN102117331A (zh) * 2011-03-07 2011-07-06 北京百度网讯科技有限公司 视频搜索方法及系统
CN102231188A (zh) * 2011-07-05 2011-11-02 上海合合信息科技发展有限公司 结合文字识别和图像匹配的名片识别方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6483523B1 (en) * 1998-05-08 2002-11-19 Institute For Information Industry Personalized interface browser and its browsing method
US6845354B1 (en) * 1999-09-09 2005-01-18 Institute For Information Industry Information retrieval system with a neuro-fuzzy structure
TWI337715B (en) * 2006-11-08 2011-02-21 Inst Information Industry Method and system for complex event processing
US9195752B2 (en) * 2007-12-20 2015-11-24 Yahoo! Inc. Recommendation system using social behavior analysis and vocabulary taxonomies
US10242104B2 (en) 2008-03-31 2019-03-26 Peekanalytics, Inc. Distributed personal information aggregator
US20110125770A1 (en) 2009-11-25 2011-05-26 Nokia Corporation Method and apparatus for facilitating identity resolution
US20110179161A1 (en) * 2010-01-21 2011-07-21 International Business Machines Corporation Aggregation of social network data
TWI482031B (zh) * 2012-11-14 2015-04-21 Inst Information Industry 在雲端儲存服務下提供以檔案為關聯之社群互動方法、系統以及儲存有此方法之電腦可讀取記錄媒體

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6845345B1 (en) * 2001-02-06 2005-01-18 Advanced Micro Devices, Inc. System for monitoring and analyzing diagnostic data of spin tracks
TW201001179A (en) * 2008-06-27 2010-01-01 Ind Tech Res Inst System and method for establishing personal social network, trusted network and social networking system
CN102053979A (zh) * 2009-10-27 2011-05-11 华为技术有限公司 一种信息收集方法和系统
TW201115371A (en) * 2009-10-28 2011-05-01 Ind Tech Res Inst Systems and methods for organizing collective social intelligence information using an organic object data model
CN102117331A (zh) * 2011-03-07 2011-07-06 北京百度网讯科技有限公司 视频搜索方法及系统
CN102231188A (zh) * 2011-07-05 2011-11-02 上海合合信息科技发展有限公司 结合文字识别和图像匹配的名片识别方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI649712B (zh) * 2017-12-08 2019-02-01 財團法人工業技術研究院 電子裝置、決策流程模組的呈現方法及電腦可讀式媒體
US11087218B2 (en) 2017-12-08 2021-08-10 Industrial Technology Research Institute Electronic device, presentation method for decision-making process module and computer readable medium
CN110020375A (zh) * 2017-12-28 2019-07-16 沈阳新松机器人自动化股份有限公司 一种社交网络用户影响力的评估方法

Also Published As

Publication number Publication date
TWI575391B (zh) 2017-03-21
CN104240107B (zh) 2017-12-05
US9607031B2 (en) 2017-03-28
TW201500941A (zh) 2015-01-01
US20140372459A1 (en) 2014-12-18

Similar Documents

Publication Publication Date Title
CN107657048B (zh) 用户识别方法及装置
US10146878B2 (en) Method and system for creating filters for social data topic creation
US8775423B2 (en) Data mining across multiple social platforms
CN110888990A (zh) 文本推荐方法、装置、设备及介质
US10878020B2 (en) Automated extraction tools and their use in social content tagging systems
CN106896932A (zh) 一种候选词推荐方法及装置
Sjöberg et al. Digital me: Controlling and making sense of my digital footprint
US10002187B2 (en) Method and system for performing topic creation for social data
CN107992523B (zh) 移动应用的功能选项查找方法及终端设备
CN113688288B (zh) 数据关联分析方法、装置、计算机设备和存储介质
CN103678362A (zh) 搜索方法及系统
US20150278248A1 (en) Personal Information Management Service System
US9996529B2 (en) Method and system for generating dynamic themes for social data
CN110941702A (zh) 一种法律法规和法条的检索方法及装置、可读存储介质
CN103500158A (zh) 批注电子文档的方法和装置
CN110147482B (zh) 用于获取突发热点主题的方法和装置
CN104240107A (zh) 社群数据筛选系统及其方法
CN107465797B (zh) 终端设备来电信息显示方法和装置
CN108255963A (zh) 一种基于互联网的新闻信息检索的控制方法及装置
CN113869063A (zh) 数据推荐方法、装置、电子设备及存储介质
KR20190109628A (ko) 개인화된 기사 컨텐츠 제공 방법 및 장치
KR102097912B1 (ko) 개인화 추천 컨텐츠를 제공하는 방법
US9286348B2 (en) Dynamic search system
CN112612817B (zh) 数据处理方法、装置、终端设备及计算机可读存储介质
CN113987134A (zh) 工单检索方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant