CN108628818A - 信息获取方法和装置 - Google Patents

信息获取方法和装置 Download PDF

Info

Publication number
CN108628818A
CN108628818A CN201710153870.6A CN201710153870A CN108628818A CN 108628818 A CN108628818 A CN 108628818A CN 201710153870 A CN201710153870 A CN 201710153870A CN 108628818 A CN108628818 A CN 108628818A
Authority
CN
China
Prior art keywords
information
related information
type
influence
entity object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710153870.6A
Other languages
English (en)
Other versions
CN108628818B (zh
Inventor
霍学媛
苏谦
段佳宁
杨晓静
赵鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710153870.6A priority Critical patent/CN108628818B/zh
Publication of CN108628818A publication Critical patent/CN108628818A/zh
Application granted granted Critical
Publication of CN108628818B publication Critical patent/CN108628818B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了信息获取方法和装置。该方法的一具体实施方式包括:获取实体对象的资讯信息;提取资讯信息中每一个资讯信息中的关键词,以及基于关键词,生成每一个资讯信息对应的关联信息,关联信息指示对实体对象的影响;确定关联信息中属于同一类型的关联信息,以及确定关联信息中每一个关联信息对应的权重,其中,权重指示对实体对象的影响的影响程度;基于确定出的每一个关联信息对应的权重,生成类型对应的影响度信息,影响度信息指示类型的关联信息对实体对象的影响。实现了对实体对象在各个方面的表现的评价的倾向进行较为精确地量化,全面地分析对实体对象的表现的评价的倾向,提升分析结果的准确率。

Description

信息获取方法和装置
技术领域
本申请涉及计算机领域,具体涉及数据分析领域,尤其涉及信息获取方法和装置。
背景技术
由于金融对象(例如股票)与其对应的实体对象(例如发行股票的公司)的运营情况的内在关联性,分析对实体对象的表现(例如分析师对发行股票的公司的各个方面的表现)的倾向是金融对象的投资决策中的必要环节。目前,通常采用的方式为:直接汇总诸如分析师的对金融对象的投资观点作为分析结果。
然而,由于无法对实体对象在各个方面的表现的评价的倾向进行较为精确地量化,导致无法全面地分析对实体对象的表现的评价的倾向,分析结果的准确率较低,进而无法为金融对象的投资决策提供较为准确地参考。
发明内容
本申请提供了信息获取方法和装置,用于解决上述背景技术部分存在的技术问题。
第一方面,本申请提供了信息获取方法,该方法包括:获取实体对象的资讯信息;提取资讯信息中每一个资讯信息中的关键词,以及基于关键词,生成每一个资讯信息对应的关联信息,关联信息指示对实体对象的影响;确定关联信息中属于同一类型的关联信息,以及确定关联信息中每一个关联信息对应的权重,其中,权重指示对实体对象的影响的影响程度;基于确定出的每一个关联信息对应的权重,生成类型对应的影响度信息,影响度信息指示类型的关联信息对实体对象的影响。
第二方面,本申请提供了信息获取装置,该装置包括:获取单元,配置用于获取实体对象的资讯信息;第一处理单元,配置用于提取资讯信息中每一个资讯信息中的关键词,以及基于关键词,生成每一个资讯信息对应的关联信息,关联信息指示对实体对象的影响;第二处理单元,配置用于确定关联信息中属于同一类型的关联信息,以及确定关联信息中每一个关联信息对应的权重,其中,权重指示对实体对象的影响的影响程度;生成单元,配置用于基于确定出的每一个关联信息对应的权重,生成类型对应的影响度信息,影响度信息指示类型的关联信息对实体对象的影响。
本申请提供的信息获取方法和装置,通过获取实体对象的资讯信息;提取资讯信息中每一个资讯信息中的关键词,以及基于关键词,生成每一个资讯信息对应的关联信息,关联信息指示对实体对象的影响;确定关联信息中属于同一类型的关联信息,以及确定关联信息中每一个关联信息对应的权重,其中,权重指示对实体对象的影响的影响程度;基于确定出的每一个关联信息对应的权重,生成类型对应的影响度信息,影响度信息指示类型的关联信息对实体对象的影响。实现了对实体对象在各个方面的表现的评价的倾向进行较为精确地量化,全面地分析对实体对象的表现的评价的倾向,提升分析结果的准确率,进而为金融对象的投资决策提供较为准确地参考。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是可以应用于本申请的信息获取方法或装置的示例性系统架构图;
图2示出了根据本申请的信息获取方法的一个实施例的流程图;
图3示出了类型和子类型的对应关系的示意图;
图4示出了从研报长句中提取出精炼短句的示意图;
图5示出了类型和子类型与精炼短句的对应关系的示意图;
图6示出了根据本申请的信息获取装置的一个实施例的结构示意图;
图7是适于用来实现本申请实施例的信息获取方法的服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用于本申请的信息获取方法或装置的示例性系统架构。
如图1所示,系统架构可以包括服务器101、网络102、服务器103。网络102用以在服务器101和服务器103之间提供传输链路的介质。服务器103可以为提供网络资源例如财经资讯的服务器。服务器101可以采用网络爬虫获取服务器103上的网络资源例如分析师发布的发行股票的公司的研报。
请参考图2,其示出了根据本申请的信息获取方法的一个实施例的流程。该方法可以由服务器例如图1中的服务器101执行,相应地,装置可以设置于服务器例如图1中的服务器101中。该方法包括以下步骤:
步骤201,获取实体对象的资讯信息。
在本实施例中,可以首先获取实体对象的资讯信息。例如,实体对象为发行股票的公司,可以获取股票分析师对该公司的研究报告(也成称之为研报),研报中包含多个语句,可以将研报中的语句(也可称之为研报中的长句)称之为资讯信息。
步骤202,提取资讯信息中每一个资讯信息中的关键词,以及基于关键词,生成每一个资讯信息对应的关联信息。
在本实施例中,在通过步骤201获取到资讯信息之后,可以提取每一个资讯信息中的关键词,以及基于关键词,生成每一个资讯信息对应的关联信息。
以实体对象为发行股票的公司,资讯信息为股票分析师对该公司的研报中的长句为例,研报中的长句包含与公司的运营状况相关联的关键词。可以提取出关键词,将关键词进行组合,得到指示对该公司产生的影响例如正面影响或负面影响的关联信息(也可称之为精炼短句)。
在本实施例的一些可选的实现方式中,可以以机器学习方式对资讯信息进行分词,得到分词结果,选取出分词结果作为关键词,对关键词进行组合,关联信息。
例如,以实体对象为发行股票的公司,资讯信息为分析师对股票的研报中的长句“这是中国电影公司第一次参与到从投资、拍摄到发行的好莱坞完整工业流程体系中,也是中国电影公司首次参与合作影片的全球票房分成”,可以采用RNN(Recurrent NeuralNetwork,循环神经网络)对资讯信息进行分词,得到分词结果,可以从分词结果中选取出首次、参与、全球、票房、分成作为关键词,可以将关键词进行组合,得到精炼短句“首次参与全球票房分成”。该精炼短句指示对发行股票的公司的正面影响,相应地,该精炼短句也可以反映出分析师对发行股票的公司在公司治理方面的表现的倾向为正向积极的。
步骤203,确定关联信息中属于同一类型的关联信息,以及确定类型的关联信息中每一个关联信息对应的权重。
在本实施例中,关联信息所属的类型可以包括但不限于:业绩、分析师预期、产销量、公司治理、产品服务、行业相关、管理层/股东等类型。每一个类型还可以包含多个子类型。
请参考图3,其示出了类型和子类型的对应关系的示意图。
在通过步骤202生成每一个资讯信息对应的关联信息之后,可以确定关关联信息中属于同一类型的关联信息。
例如,实体对象为发行股票的公司,资讯信息为股票分析师对该公司的研报中的长句,关联信息为精炼短句,研报中的长句“这是中国电影公司第一次参与到从投资、拍摄到发行的好莱坞完整工业流程体系中,也是中国电影公司首次参与合作影片的全球票房分成”对应的精炼短句为“首次参与全球票房分成”,该精炼短句的类型为公司治理类型的资本运作子类型。研报中的长句“娱乐消费热情高涨,电影市场持续快速扩容”对应的精炼短句为“电影市场快速扩容”,该精炼短句的类型为行业相关类型中的行业预期子类型。
在本实施例的一些可选的实现方式中,可以预先构建类型词库,每一个类型词库中包含类型词组合,类型词为会出现该类型的资讯信息中的词语。例如,业绩、分析师预期、产销量、公司治理、产品服务、行业相关、管理层/股东等类型对应的类型词库中,分别包含出现在业绩、分析师预期、产销量、公司治理、产品服务、行业相关、管理层/股东等资讯信息中的类型词的组合。在确定关联信息的类型时,可以从多个类型的类型词库中查找出具有与关联信息匹配的类型词组合的类型词库,将该类型词库的类型作为关联信息的类型。
在本实施例中,可以确定关联信息中属于同一类型的关联信息,以及确定属于同一类型的关联信息中每一个关联信息对应的权重。
例如,实体对象为发行股票的公司,关联信息为股票分析师对该公司的研报中的长句对应的精炼短句,可以确定出属于同一类型的精炼短句。从而,可以分别确定出属于业绩、分析师预期、产销量、公司治理、产品服务、行业相关、管理层/股东等类型的精炼短句。然后,可以进一步确定中每一个精炼短句对应的权重。可以将精炼短句中的表示对公司的正面影响或负面影响的关键词对应的权重作为精炼短句对应的权重。
请参考图4,其示出了从研报长句中提取出精炼短句的示意图。
在本实施例的一些可选的实现方式中,可以进一步确定关联信息所属的类型中的子类型。例如,关联信息为精炼短句“首次参与全球票房分成”,该精炼短句所属的类型为公司治理类型,可以进一步确定该精炼短句所属的子类型为公司治理类型中的资本运作子类型。可以而将关联信息与其所属的类型和子类型的标识对应存储。
请参考图5,其示出了类型和子类型与精炼短句的对应关系的示意图。
步骤204,基于确定出的每一个关联信息对应的权重,生成类型对应的影响度信息。
在本实施例中,在通过步骤203确定属于同一类型的关联信息中每一个关联信息对应的权重之后,可以基于确定出的每一个关联信息对应的权重,生成指示类型对应的影响度信息。
在本实施例中,每一个关联信息所属的类型可以分别对应一个影响度信息(也可称之为情绪值)。例如,实体对象为发行股票的公司,关联信息为股票分析师对该公司的研报中的长句对应的精炼短句,业绩、分析师预期、产销量、公司治理、产品服务、行业相关、管理层/股东等类型,每一个类型可以对应一个情绪值。情绪值可以表示分析师对业绩、分析师预期、产销量、公司治理、产品服务、行业相关、管理层/股东等方面的表现的倾向。例如,情绪值为0.5可以表示中性情绪,情绪值大于0.5可以表示正向偏积极的情绪,表明分析师看好公司在这个方面的表现,情绪值小于0.5的情绪值可以表示负向偏消极的情绪,表明分析师不看好公司在这个方面的表现。
以实体对象为发行股票的公司,关联信息为股票分析师对该公司的研报中的长句对应的精炼短句为例,可以分别根据属于业绩、分析师预期、产销量、公司治理、产品服务、行业相关、管理层/股东等类型的精炼短句的权重,计算出业绩、分析师预期、产销量、公司治理、产品服务、行业相关、管理层/股东等类型各自对应的情绪值。
在本实施例的一些可选的实现方式中,关联信息指示的对实体对象的影响可以为正面影响或负面影响,可以计算对应于正面影响的关联信息对应的权重之和与每一个关联信息对应的权重之和的比例,将该比例作为情绪值。在本实施例中,可以将关联信息中的表示对公司的正面影响或负面影响的关键词对应的权重作为精炼短句对应的权重。
例如,实体对象为发行股票的公司,关联信息为精炼短句,一个类型的所有精炼短句中有N1个表示正向影响的精炼语句和N2个表示负面影响的精炼语句。每一个表示正向影响的精炼语句中包含表示对公司有正面影响的关键词(也可称之为正向词),相应地,正向词也为N1个。每一个表示负面影响的精炼语句中包含表示对公司有负面影响的关键词(也可称之为负向词),相应地,负向词也为N2个。可以基于所有正向词对应的权重,得到该类型的表示正面影响的正向情绪值。正向情绪值P可以表示为Epi表示第i个正向词的情绪值,正向词情绪值均可以设置为1,wpi表示第i个正向词的权重(也可称之为程度加权值)。可以根据正向词对公司的正面影响的影响程度,对正向词设置不同的权重。例如,正向词“上涨”和“大幅上涨”,“大幅上涨”的程度加权值大于“上涨”的程度加权值。可以基于所有负向词对应的权重,得到该类型的表示负面影响的负向情绪值。负向情绪得分N可以表示为Eni表示第i个负向词的情绪值,负向词的情绪值均可以设置为1,wni表示第i个负向词的程度加权值。可以根据负向词对公司的负面影响的影响程度,对负向词设置不同的权重。例如,负向词“小幅亏损”的程度加权值小于“亏损”的程度加权值。该类型的情绪值Emo可以表示为:Emo=P/P+N。P为正向情绪值,N为负向情绪值。当P=N=0时,Emo=0.5。
在本实施例中,可以针对每一个金融对象,以预设时长为单位,计算出各个类型的情绪值。例如,金融对象为股票,实体对象为发行股票的公司,可以对于每只股票,以一周为单位,利用一周内股票所有分析师发布的研报中的长句对应的精炼短句和精炼短句中的正向词或负向词对应的权重,计算出多个不同类型的情绪值。从而,每只股票在每周具有多个类型的情绪值。多个类型的情绪值可以反映分析师对发行股票的公司在多个不同方面的表现的倾向。
此外,当有些周对应的股票研报数目为0时,研报情绪值为0。为了更加符合投资逻辑和情绪变动情况,可以对几周内的情绪值得分进行平滑处理,使得研报数目为0的周也有情绪值,并可以在一定程度上反映最近一次研报的衰减情绪。
请参考图6,其示出了本申请提供的信息获取装置的一个实施例的结构示意图,信息获取装置包括:获取单元601,第一处理单元602,第二处理单元603,生成单元604。其中,获取单元601配置用于获取实体对象的资讯信息;第一处理单元602配置用于提取资讯信息中每一个资讯信息中的关键词,以及基于关键词,生成每一个资讯信息对应的关联信息,关联信息指示对实体对象的影响;第二处理单元603配置用于确定关联信息中属于同一类型的关联信息,以及确定类型的关联信息中每一个关联信息对应的权重,其中,权重指示对实体对象的影响的影响程度;生成单元604配置用于基于确定出的每一个关联信息对应的权重,生成类型对应的影响度信息,影响度信息指示类型的关联信息对实体对象的影响。
在本实施例的一些可选的实现方式中,生成单元604包括:计算子单元(未示出),配置用于当影响为正面影响或负面影响时,计算对应于正面影响的关联信息对应的权重之和与每一个关联信息对应的权重之和的比例;将比例作为影响度信息。
本申请还提供了一种服务器,该服务器可以包括图6所描述的装置。该服务器可以配置有一个或多个处理器;存储器,用于存储一个或多个程序,一个或多个程序中可以包含用以执行上述步骤201-204中描述的操作的指令。当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行上述步骤201-204中描述的操作。
图7示出了适于用来实现本申请的实施例的信息获取方法的服务器的结构示意图。
如图7所示,包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。CPU 701、ROM702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:输入部分706;输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
本申请中的上述各个步骤描述的过程可以被实现为计算机程序。该计算机程序可以承载在计算机可读介质上,该计算机程序包括用于执行流程图所示的方法的指令。该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。
本申请还提供了一种计算机可读介质,该计算机可读介质可以是服务器中所包括的;也可以是单独存在,未装配入服务器中。该计算机可读介质承载有一个或者多个程序,当一个或者多个程序被该服务器执行时,使得该服务器:获取实体对象的资讯信息;提取资讯信息中每一个资讯信息中的关键词,以及基于关键词,生成每一个资讯信息对应的关联信息,关联信息指示对实体对象的影响;确定关联信息中属于同一类型的关联信息,以及确定类型的关联信息中每一个关联信息对应的权重,其中,权重指示对实体对象的影响的影响程度;基于确定出的每一个关联信息对应的权重,生成类型对应的影响度信息,影响度信息指示类型的关联信息对实体对象的影响。
需要说明的是,上述计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包括或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以为多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包括的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离本申请的构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种信息获取方法,其特征在于,所述方法包括:
获取实体对象的资讯信息;
提取所述资讯信息中每一个资讯信息中的关键词,以及基于关键词,生成每一个资讯信息对应的关联信息,关联信息指示对实体对象的影响;
确定关联信息中属于同一类型的关联信息,以及确定所述关联信息中每一个关联信息对应的权重,其中,权重指示对实体对象的影响的影响程度;
基于确定出的每一个关联信息对应的权重,生成所述类型对应的影响度信息,所述影响度信息指示所述类型的关联信息对实体对象的影响。
2.根据权利要求1所述的方法,其特征在于,所述影响为正面影响或负面影响;以及
基于确定出的每一个关联信息对应的权重,生成所述类型对应的影响度信息包括:
计算对应于正面影响的关联信息对应的权重之和与每一个关联信息对应的权重之和的比例;
将所述比例作为影响度信息。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
确定属于同一类型的关联信息中每一个关联信息所属的所述类型的子类型;
将所述关联信息、所述类型和所述子类型的标识对应存储。
4.根据权利要求3所述的方法,其特征在于,提取所述资讯信息中每一个资讯信息中的关键词,以及基于关键词,生成每一个资讯信息对应的关联信息包括:
以机器学习方式对所述资讯信息进行分词,得到分词结果;
选取出部分分词结果作为所述关键词,以及将关键词进行组合,得到资讯信息对应的关联信息。
5.根据权利要求4所述的方法,其特征在于,在获取实体对象的资讯信息之前,所述方法还包括:
构建多个类型的类型词库,每一个类型的类型词库包括:类型词组合,其中,类型词为与所述类型的资讯信息相关联的词语。
6.根据权利要求5所述的方法,其特征在于,确定关联信息中属于同一类型的关联信息包括:
从多个类型的类型词库中查找出包含与关联信息匹配的类型词组合的类型词库;
将所述类型词库的类型作为关联信息的类型;
确定关联信息中属于同一类型的关联信息。
7.一种信息获取装置,其特征在于,所述装置包括:
获取单元,配置用于获取实体对象的资讯信息;
第一处理单元,配置用于提取所述资讯信息中每一个资讯信息中的关键词,以及基于关键词,生成每一个资讯信息对应的关联信息,关联信息指示对实体对象的影响;
第二处理单元,配置用于确定关联信息中属于同一类型的关联信息,以及确定所述关联信息中每一个关联信息对应的权重,其中,权重指示对实体对象的影响的影响程度;
生成单元,配置用于基于确定出的每一个关联信息对应的权重,生成所述类型对应的影响度信息,所述影响度信息指示所述类型的关联信息对实体对象的影响。
8.根据权利要求7所述的装置,其特征在于,所述生成单元包括:
计算子单元,配置用于当所述影响为正面影响或负面影响时,计算对应于正面影响的关联信息对应的权重之和与每一个关联信息对应的权重之和的比例;将所述比例作为影响度信息。
9.一种服务器,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
10.一种可读计算机存储介质,其特征在于,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN201710153870.6A 2017-03-15 2017-03-15 信息获取方法和装置 Active CN108628818B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710153870.6A CN108628818B (zh) 2017-03-15 2017-03-15 信息获取方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710153870.6A CN108628818B (zh) 2017-03-15 2017-03-15 信息获取方法和装置

Publications (2)

Publication Number Publication Date
CN108628818A true CN108628818A (zh) 2018-10-09
CN108628818B CN108628818B (zh) 2021-10-26

Family

ID=63687466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710153870.6A Active CN108628818B (zh) 2017-03-15 2017-03-15 信息获取方法和装置

Country Status (1)

Country Link
CN (1) CN108628818B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113435193A (zh) * 2021-06-16 2021-09-24 深圳市世强元件网络有限公司 一种落地页面关键词投放方法、装置及计算机设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103176983A (zh) * 2011-12-20 2013-06-26 中国科学院计算机网络信息中心 一种基于互联网信息的事件预警方法
CN103870973A (zh) * 2012-12-13 2014-06-18 阿里巴巴集团控股有限公司 基于电子信息的关键词提取的信息推送、搜索方法及装置
US20140344130A1 (en) * 2001-01-30 2014-11-20 Goldman, Sachs & Co. Systems And Methods For Automated Political Risk Management
CN105069167A (zh) * 2015-08-28 2015-11-18 成都六四三六五科技有限公司 法律信息搜索方法及法律信息搜索装置
CN106294532A (zh) * 2016-05-18 2017-01-04 广东电网有限责任公司信息中心 基于微博情感分析的形象评价算法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140344130A1 (en) * 2001-01-30 2014-11-20 Goldman, Sachs & Co. Systems And Methods For Automated Political Risk Management
CN103176983A (zh) * 2011-12-20 2013-06-26 中国科学院计算机网络信息中心 一种基于互联网信息的事件预警方法
CN103870973A (zh) * 2012-12-13 2014-06-18 阿里巴巴集团控股有限公司 基于电子信息的关键词提取的信息推送、搜索方法及装置
CN105069167A (zh) * 2015-08-28 2015-11-18 成都六四三六五科技有限公司 法律信息搜索方法及法律信息搜索装置
CN106294532A (zh) * 2016-05-18 2017-01-04 广东电网有限责任公司信息中心 基于微博情感分析的形象评价算法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113435193A (zh) * 2021-06-16 2021-09-24 深圳市世强元件网络有限公司 一种落地页面关键词投放方法、装置及计算机设备

Also Published As

Publication number Publication date
CN108628818B (zh) 2021-10-26

Similar Documents

Publication Publication Date Title
CN110019782A (zh) 用于输出文本类别的方法和装置
CN109376361A (zh) 一种意图识别方法及装置
CN110543633B (zh) 语句意图识别方法、装置
CN111506729B (zh) 一种信息处理方法、装置及计算机可读存储介质
CN112463968B (zh) 文本分类方法、装置和电子设备
CN109726918A (zh) 基于生成式对抗网络和半监督学习的个人信用确定方法
CN113392920B (zh) 生成作弊预测模型的方法、装置、设备、介质及程序产品
CN115280353A (zh) 基于人工智能的基金组合更新方法、装置、设备及介质
CN111179055A (zh) 授信额度调整方法、装置和电子设备
CN112489628B (zh) 语音数据选择方法、装置、电子设备及存储介质
CN108628818A (zh) 信息获取方法和装置
CN111898528A (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN108628863A (zh) 信息获取方法和装置
Gu et al. Stock prediction based on news text analysis
CN115048487A (zh) 基于人工智能的舆情分析方法、装置、计算机设备及介质
CN115631748A (zh) 基于语音对话的情感识别方法、装置、电子设备及介质
CN113112299A (zh) 一种贵金属价格趋势预测方法及装置
CN114119972A (zh) 模型获取及对象处理方法、装置、电子设备及存储介质
CN106547736A (zh) 基于人工智能的文本信息术语重要度生成方法以及装置
CN114565030B (zh) 特征筛选方法、装置、电子设备和存储介质
CN113837764B (zh) 风险预警方法、装置、电子设备和存储介质
CN115146596B (zh) 召回文本的生成方法、装置、电子设备及存储介质
Gupta et al. A Modern Tool of Conversation: Chatbot
CN113901901A (zh) 图像处理模型的训练方法、装置、电子设备和介质
Aishwarya et al. A computationally efficient speech emotion recognition system employing machine learning classifiers and ensemble learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20181009

Assignee: SHANGHAI YOUYANG NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.

Assignor: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Contract record no.: X2020990000192

Denomination of invention: Network service description information acquisition method and network service description information acquisition device

License type: Common License

Record date: 20200417

EE01 Entry into force of recordation of patent licensing contract
GR01 Patent grant
GR01 Patent grant