CN111813948A - 信息处理方法、装置及电子设备 - Google Patents

信息处理方法、装置及电子设备 Download PDF

Info

Publication number
CN111813948A
CN111813948A CN201910289263.1A CN201910289263A CN111813948A CN 111813948 A CN111813948 A CN 111813948A CN 201910289263 A CN201910289263 A CN 201910289263A CN 111813948 A CN111813948 A CN 111813948A
Authority
CN
China
Prior art keywords
character
characters
map
target text
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910289263.1A
Other languages
English (en)
Inventor
苏云琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910289263.1A priority Critical patent/CN111813948A/zh
Publication of CN111813948A publication Critical patent/CN111813948A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种信息处理方法、装置、电子设备及计算机可读存储介质。该方法包括:根据目标文本的内容,获取所述目标文本中存在的人物及不同人物间的人物关系;生成展示所述人物及所述人物关系的图谱。该方法能够取代人工编辑人物关系图谱的方式,提高了图谱生成效率、降低了成本。

Description

信息处理方法、装置及电子设备
技术领域
本发明涉及数据处理领域,更具体地,涉及一种信息处理方法、一种信息处理装置、一种电子设备以及一种计算机可读存储介质。
背景技术
知识图谱可以用于以符号形式描述客观世界中的实体及其相互关系。知识图谱中的节点可以用来表示实体,节点之间的边可以用来表示对应实体之间的关系。节点的属性还可以用来表示对应实体的属性。
人物关系图谱可以看成是知识图谱中的一种,可以用来描述人物及其相互关系。通常来说,在文学作品尤其是在体量较大的文学作品中,人物数量较多、关系较为复杂,通过人物关系图谱可以帮助读者方便快速理解人物关系,获得更好的阅读体验。
现有的文学作品的人物关系图谱通常是由人工绘制,需要花费较多的人力,并且效率较低。
发明内容
本发明实施例的一个目的是提供一种信息处理的新的技术方案。
根据本发明的第一方面,提供了一种信息处理方法,包括:
根据目标文本的内容,获取所述目标文本中存在的人物及不同人物间的人物关系;
生成展示所述人物及所述人物关系的图谱。
可选地,所述生成展示所述人物及所述人物关系的图谱,包括:
以每一所述人物为节点,根据所述人物关系在不同节点之间建立关联边,以生成所述图谱,其中,所述图谱在所述关联边上标注有对应的人物关系。
可选地,所述方法还包括:
在获取到的所述人物中识别出主角人物;
在所述图谱中对所述主角人物进行区别于其他人物的突出显示。
可选地,所述突出显示包括位置上的突出显示、颜色上的突出显示、形状上的突出显示中的任意一种或者多种的组合。
可选地,所述生成展示所述人物及所述人物关系的图谱,包括:
确定每一所述其他人物与所述主角人物的人物关系的紧密度;
在所述图谱中,根据所述紧密度布置每一所述其他人物相对所述主角人物的位置。
可选地,所述在获取到的所述人物中识别出主角人物,包括:
获取每一所述人物在所述目标文本中出现的频次;
根据每一所述人物对应的所述频次,在获取到的所述人物中识别出主角人物。
可选地,所述方法还包括:
在所述目标文本的设定页面上加载所述图谱。
可选地,所述在所述目标文本的设定页面上加载所述图谱,包括:
响应于进入所述目标文本的设定页面的操作,在所述设定页面上加载显示所述图谱。
可选地,所述方法还包括:
提供用于修改所述目标文本的所述图谱的修改入口;
获取通过所述修改入口上传的图谱;
更新所述目标文本的所述图谱为所述上传的图谱。
可选地,所述方法还包括:
提供收集修改所述图谱的修改意见的收集入口;
展示通过所述收集入口提交的所述修改意见,并提供用于对所述修改意见进行投票的投票入口;
获取通过所述投票入口对所述修改意见投出的赞同票的投票数量;
在所述投票数量满足预设要求的情况下,向运营人员的账户发出根据所述修改意见修改所述图谱的通知。
根据本发明的第二方面,还提供一种信息处理装置,包括:
文本分析模块,用于根据目标文本的内容,获取所述目标文本中存在的人物及不同人物间的人物关系;以及,
图谱生成模块,用于生成展示所述人物及所述人物关系的图谱。
根据本发明的第三方面,还提供一种电子设备,包括本发明第二方面所述的信息处理装置;或者,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于在所述可执行指令的控制下,执行如本发明第一方面提供的任一项方法。
根据本发明第四方面,还提供一种计算机存储介质,存储有可执行指令,所述可执行指令被处理器执行时,执行如本发明第一方面提供的任一项方法。
本发明的一个有益效果在于,能够根据目标文本的内容自动获取目标文本中存在的人物及不同人物间的人物关系,据此生成展示人物和人物关系的图谱,无需人工整理人物关系图谱,提高了图谱生成效率、降低了成本。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1为可以应用根据本发明实施例的信息处理方法的一种信息处理系统的组成结构示意图。
图2为根据本发明实施例一的信息处理方法的示意性流程图。
图3为根据本发明实施例一的信息处理方法生成的人物关系图谱的示意图。
图4为根据本发明实施例二的信息处理方法生成的人物关系图谱的示意图。
图5为根据本申请实施例三的信息处理方法的目标文本介绍页的示意图。
图6为根据本申请实施例四的信息处理方法的修改入口页面的示意图。
图7为根据本申请实施例五的信息处理方法的意见收集页面的示意图。
图8为根据本申请实施例六的信息处理装置的组成结构的示意图。
图9为根据本申请实施例七的电子设备的组成结构的示意图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人物已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<总体构思>
本发明的思路是通过对目标文本的内容进行信息处理,例如,可以借助于NLP(Natural Language Processing,自然语言处理)技术处理目标文本,以从目标文本中自动获取人物及人物之间的关系,并据此生成展示人物及人物关系的图谱,取代人工绘制关系图谱的方式,提高信息处理效率、准确率、及降低成本。
<硬件配置>
图1为可以应用根据本发明实施例的信息处理方法的一种信息处理系统的组成结构示意图。
如图1所示,本实施例的信息处理系统1000包括服务器1100、终端设备1200以及网络1300。
服务器1100例如可以是刀片服务器、机架式服务器等。服务器1100还可以如图1所示,包括处理器1110、存储器1120、接口装置1130、通信装置1140、显示装置1150和输入装置1160。尽管服务器1100也可以包括扬声器、麦克风等等,但是,这些部件与本发明无关,故在此省略。其中,处理器1110例如可以是中央处理器CPU、微处理器MCU等。存储器1120例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1130例如包括USB接口、串行接口等。通信装置1140例如能够进行有线或无线通信。显示装置1150例如是液晶显示屏。输入装置1160例如可以包括触摸屏、键盘等。
在一个实施例中,服务器1100可以提供自然语言处理服务,例如词法与句法分析、语义分析、语篇分析等。
终端设备1200可以是智能手机、便携式电脑、台式计算机、平板电脑等。如图1所示,终端设备1200可以包括处理器1210、存储器1220、接口装置1230、通信装置1240、显示装置1250、输入装置1260、扬声器1270、麦克风1280,等等。其中,处理器1210可以是中央处理器CPU、微处理器MCU等。存储器1220例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1230例如包括USB接口、耳机接口等。通信装置1240例如能够进行有线或无线通信。显示装置1250例如是液晶显示屏、触摸显示屏等。输入装置1260例如可以包括触摸屏、键盘等。用户可以通过扬声器1270和麦克风1280输出/输入语音信息。
终端设备1200可用于用户在线阅读或离线阅读文学作品。
在一个实施例中,终端设备1200也可用于提供自然语言处理服务。
通信网络1300可以是无线网络也可以是有线网络,可以是局域网也可以是广域网。终端设备1200可以通过通信网络1300与服务器1100进行通信。
除非特别限定,否则图1中的终端设备1200可以是用户使用的用户终端,也可以是运营人员使用的运营终端。
图1所示的信息处理系统1000仅是解释性的,并且决不是为了要限制本发明、其应用或用途。例如,尽管图1仅示出一个服务器1100和一个终端设备1200,但不意味着限制各自的数量,信息处理系统1000中可以包含多个服务器1100和/或多个终端设备1200。
根据本发明任意实施例的信息处理方法可以由服务器1100实施,也可以由终端设备1200实施,还可以由服务器1100和终端设备1200共同实施,在此不做限定。
<实施例一>
图2为根据本发明实施例的信息处理方法的示意性流程图。
如图2所示,本实施例中的信息处理方法包括如下步骤S2100-S2200。
步骤S2100,根据目标文本的内容,获取目标文本中存在的人物及不同人物间的人物关系。
目标文本是包含了人物、人物关系等信息的文本,例如是小说类的文学作品。在处理体量较大的目标文本时,本实施例中信息处理方法的优势会得到更明显的体现。
目标文本的数据格式应当是计算机能够处理的形式,例如TXT等文本格式。对于图片中的文本内容,可以先利用文字识别技术将其转化为文本格式再进行处理。
目标文本可以存储在终端设备本地,也可以存储在服务器中。
在一个例子中,目标文本中的人物是指目标文本的内容中包含的人物实体,其具体表现形式可以是多样的,例如通过姓名、代号等形式表示该人物,又例如通过“你”“我”“他”等人称代词表示该人物。不同的人物表现形式可以指向同一个人物实体。
不同人物之间的人物关系是指不同人物之间的相互联系的类型,例如父子、师徒、朋友、同事等社会关系,又例如商家和消费者、司机和乘客等特定场景下的人物关系。
在步骤S2100中,可以利用自然语言处理技术获取目标文本中存在的人物及不同人物间的人物关系。
在一个例子中,可以通过词法分析从目标文本中抽取人物,例如,可以通过分词技术将目标文本切分为有意义的词汇,从中识别出人物姓名。
分词方法可以采用基于词典的最大匹配分词方法、全切分路径选择方法、基于字序列标注的方法、基于转移的分词方法、基于深度学习的分词方法等。
对人物姓名的识别可以采用基于规则的识别方法、基于统计的识别方法或者两者结合的识别方法。基于规则的识别方法依赖于专业的规则模板和实体字典,预先建立专门的规则模板和实体字典,然后根据规则模板对目标词汇和实体字典进行匹配。基于统计的命名实体识别方法利用标注好的语料对模型进行训练。通过语料库可以构建文字间关联关系的条件概率模型,在分词过程中通过这个概率模型对测试序列进行分析,从而提取出人物姓名。还可以将这两种方法结合起来,提高识别准确率。
对人物姓名的识别还可以采用机器学习的方法,例如采用最大熵模型、支持向量机、隐马尔可夫模型等数学模型,通过机器学习的方法识别人物姓名。
在目标文本中,人物的标识并非都是以人的姓名的形式出现,还存在通过人物指代词标识人物的情况,例如通过人称代词、姓、名、职位、别号等标识人物。因此,在一个例子中,还对人物指代词进行识别。在此基础上,可以基于“最近匹配原则”,将人物指代词和人物姓名进行关联。
在一个例子中,获取人物关系时,可以先进行句法分析,得到句子的句法结构(主谓宾结构)和词汇间的依存关系,在此基础上进行人物关系的抽取。
人物关系的抽取方法例如是基于模式匹配的关系抽取方法。该方法预先建立关系模板,并按照设定好的规则将目标文本中的实体关系与关系模板进行匹配。
人物关系的抽取方法还可以是基于机器学习的关系抽取方法,通过具有一定专业知识的人员对部分语料进行标注作为训练数据,然后用机器学习方法通过该训练数据来构造分类器,最后用该分类器进行关系抽取。该类方法可进一步分为基于特征向量的机器学习方法和基于核函数的机器学习方法。
在抽取人物关系时,可以预先对人物关系进行分类,例如可以将人物关系分为亲属关系和其他社会关系两大类,亲属关系包括了父母-子女、夫妻、祖孙、兄弟姐妹等,其他社会关系包括了同学、师生、同事、朋友等。
在通过步骤2100获取到了人物及人物关系后,可以执行以下步骤S2200:
步骤S2200,生成展示人物及人物关系的图谱。
展示人物及人物关系的图谱也就是人物关系图谱,其中包括了节点和节点之间的边。节点可以用于表示人物,节点之间的边可以用于表示人物之间的关系。
在本实施例一具体体现中,步骤S2200包括:
以每一人物为节点,根据人物关系在不同节点之间建立关联边,以生成图谱,其中,图谱在关联边上标注有对应的人物关系。
例如,在生成人物关系图谱时,可以先绘制出每一人物对应的节点,再根据人物关系挑选对应的节点连线,以建立关联边。在关联边上还对人物关系进行标注,以直观展现人物关系。
该节点上可以标注人物的姓名,和/或添加人物的头像。
当两个人物之间的关系有多重时,例如两个人物既是同学关系又是夫妻关系,可以在对应的关联边上同时标注出多重关系,也可以只标注出主要关系,例如只标注出夫妻关系。
根据本实施例中的信息处理方法生成的人物关系图谱如图3所示。其中,目标文本是题为《XX红楼》的小说,图谱中的圆形节点代表目标文本中存在的人物,例如“贾母”“贾宝玉”等。节点之间的关联边根据人物关系建立(其中省略了部分关联边),关联上表示出了对应的人物关系,例如“母子”“夫妻”等。
本实施例中的信息处理方法,能够根据目标文本的内容自动获取目标文本中存在的人物及不同人物间的人物关系,据此生成展示人物和人物关系的图谱,无需人工整理人物关系图谱,提高了图谱生成效率、降低了成本。
<实施例二>
本实施例提供一种信息处理方法,可以由图1中的终端设备1200实施,也可以由图1中的服务器1100实施,还可以由终端设备1200与服务器1100共同实施。
根据本申请实施例二提供的信息处理方法,包括以下步骤S3100-S400:
步骤S3100:根据目标文本的内容,获取目标文本中存在的人物及不同人物间的人物关系。
步骤S3200:生成展示人物及人物关系的图谱。
步骤S3100和步骤S3200的具体实施方式可参见实施例一中关于步骤S2100和步骤S2200的介绍和说明,这里不再赘述。
步骤S3300:在获取到的人物中识别出主角人物。
主角人物通常是小说、剧本等类型的目标文本中的中心人物,在本实施例的信息处理方法中,通过确定主角人物并对主角人物进行突出显示,能够更为清晰地展示人物关系。
目标文本中通常利用较多的内容对主角人物进行刻画,本实施例中可以选择合适的指标对与人物有关的文本内容进行量化,据此确定主角人物。
例如,可以根据人物在目标文本中出现的频次大小确定主角人物。先获取每一人物在目标文本中出现的频次,再根据每一人物对应的频次,在获取到的人物中识别出主角人物。人物出现的频次可以通过统计人物的名字、代号和指代词等在目标文本中出现的总次数来计算。
又例如,可以根据与人物有关的文本长度来确定主角人物,将涉及到的文本长度最大的人物作为主角人物。与人物有关的文本长度可以是该人物出现的句子的总长度,或者是该人物出现的段落的总长度。
主角人物的数量可以是一个,也可以是多个。当主角人物是多个,例如主角人物是四个时,可以将着墨最多的前四个人物作为主角人物。
在获取到了主角人物之后,可以执行以下步骤S3400:
步骤S3400:在图谱中对主角人物进行区别于其他人物的突出显示。
通过对主角人物进行突出显示,能够方便读者快速定位主角人物,并从主角人物入手理解目标文本的人物关系。
对主角人物突出显示的方式,例如是在图谱中直接标示出主角人物的节点,又例如是将主角人物节点在位置上突出显示、在颜色上突出显示、在形状上突出显示,或者采用多种突出显示的组合。
对主角人物在位置上突出显示,例如是将主角人物对应的节点布置在图谱的中心位置,并设置其他人物节点围绕主角人物节点分布。
对主角人物在颜色上突出显示,例如是使主角人物对应的节点颜色区别于其他人物对应的节点颜色,如将主角人物节点标黄、标红等。
对主角人物在形状上突出显示,例如是使主角人物对应的节点形状区别于其他人物对应的节点形状,如将主角人物对应的节点设置为圆形而将其他人物对用的节点设置为矩形。
对于主角之外的其他人物,可以根据其与主角人物的紧密度(紧密程度)来布置其节点位置,以便在图谱中反映出其他人物与主角人物的联系程度。实施步骤可以包括:确定每一其他人物与主角人物的人物关系的紧密度;以及,在图谱中,根据紧密度布置每一其他人物相对主角人物的位置。
其他人物和主角人物之间的紧密度可以通过选择合适的指标进行量化,例如可以根据其他人物与主角人物在社会关系上的亲疏程度确定紧密度。在一个例子中,通过家庭关系>朋友关系>工作关系的原则确定紧密度。
又例如,可以通过其他人物与主角人物在目标文本中共同出现的次数确定紧密度。这里的共同出现,例如是其他人物与主角人物在同一个句子中共同出现,或者是在同一个段落中共同出现。
其他人物相对主角人物的位置,例如是其他人物节点和主角人物节点的距离、方向等。
根据本实施例中的信息处理方法生成的人物关系图谱如图4所示。其中,目标文本是题为《XX三国》的小说。该小说中的主角人物为“刘备”,因此在本实施例的人物关系图谱中,对“刘备”对应的节点进行了突出显示,包括将该节点置于图谱的中心位置,并且将该节点的形状设置为正方形,以区别于其他圆形节点。对于其他人物,本实施例中按照与主角人物社会关系的亲疏布置了其他人物节点的位置,其中与主角人物关系为“父子”“夫妻”“结义兄弟”的人物节点位于最靠近主角人物节点的位置。可以看出,目标文明中的主角人物及人物关系在该人物关系图谱中得到了较为清晰直观的展示。
本实施例中的信息处理方法除了能够产生实施例一中的技术效果外,还能通过识别主角人物并在图谱中突出显示主角人物,更为清晰地展示人物关系。
<实施例三>
根据本实施例,可以将生成的图谱加载在目标文本的设定页面上。本实施例的方法可以由图1中的终端设备1200实施,也可以由图1中的服务器1100实施,还可以由终端设备1200与服务器1100共同实施。
进行加载的图谱例如是本申请实施例一或者实施例二中生成的人物关系图谱。
目标文本的设定页面例如是目标文本的介绍页、目标文本的内容页等。
本实施例的方法在有服务器参与实施的情况下,在目标文本的设定页面上加载所生成的图谱可以包括:由服务器在目标文件的设定页面上加载该图谱。或者,在目标文本的设定页面上加载所生成的图谱也可以包括:服务器将该图谱发送至终端设备,并配置终端设备在目标文件的设定页面上加载该图谱。
请参见图5,本例中针对实施例二中生成的人物关系图谱进行加载显示,目标文本是题为《XX三国》的小说。图5中展示的页面为该目标文本的介绍页,该介绍页中包括了小说标题、作者、章节目录等信息。本例中将人物关系图谱作为介绍页内容的一部分,在介绍页的中上部进行加载显示,以方便读者参看该人物关系图谱。
在本实施例一具体体现中,对目标文本进行加载的步骤包括:响应于进入目标文本的设定页面的操作,在设定页面上加载显示图谱。也就是说,对目标文本的加载显示可以是动态的。例如,终端设备响应于用户点击其他网页上的链接进入目标文本介绍页的操作,在该介绍页中加载显示人物关系图谱。又例如,终端设备响应于翻至一内容页的操作,在所翻至的该内容页上加载显示人物关系图谱。
人物关系图谱在设定页面上的加载显示方式,可以是弹窗形式、悬浮窗形式、内嵌形式等,也可以直接将图谱作为设定页面内容的一部分进行显示,在此不做限定。
本实施例中的信息处理方法除了能够产生实施例一、二中的技术效果外,还有利于读者在目标文本的设定页面方便快捷地获取目标文本中的人物关系。
<实施例四>
本实施例中,可以针对根据任意实施例生成的人物关系的图谱,提供修改入口,以供运营人员修改该图谱。本实施例的实施主体例如可以是图1中的终端设备1200,也可以是图1中的服务器1100,还可以是服务器1100和终端设备1200,其中,本实施例中使用的终端设备1200为运营人员使用的运营终端。
本实施例中的信息处理方法的实施步骤可以包括:提供用于修改目标文本的图谱的修改入口;获取通过修改入口上传的图谱;以及,更新目标文本的图谱为上传的图谱。
进行修改的图谱例如是实施例一或者实施例二中生成的图谱。
在本实施例的方法有服务器参与实施的情况下,该修改入口可以包括终端设备与服务器之间进行交互的接口。在本实施例的方法有终端设备参与实施的情况下,该修改入口可以包括人机交互接口。
请参见图6,本例中针对实施例二中生成的人物关系图谱提供修改入口。运营人员的终端设备提供图6所示的修改入口页面,该修改入口页面包括了人物关系图谱和“修改图谱”按钮。图谱的修改入口由该“修改图谱”按钮提供。运营人员可以通过点击“修改图谱按钮”进入图谱的修改界面(图中未示出)。在修改界面中,运营人员可以在线对图谱进行手动编辑,或者上传线下编辑的新的人物关系图谱,再通过点击上传、保存按钮等方式将修改后的图谱上传给服务器。之后,服务器将现有图谱更新为上传的图谱。
本实施例中的信息处理方法除了能够产生实施例一、二中的技术效果外,还能提供人工修改人物关系图谱的入口,使得运营人员能够灵活方便地修改人物关系图谱。
<实施例五>
本实施例中,可以针对根据任意实施例生成的人物关系的图谱,提供意见收集入口,以收集读者对于图谱的修改意见。本实施例的实施主体例如可以是图1中的终端设备1200,也可以是图1中的服务器1100,还可以是服务器1100和终端设备1200。
本实施例中的信息处理方法的实施步骤可以包括:提供收集修改图谱的修改意见的收集入口;展示通过收集入口提交的修改意见,并提供用于对修改意见进行投票的投票入口;获取通过投票入口对修改意见投出的赞同票的投票数量;以及,在投票数量满足预设要求的情况下,向运营人员的账户发出根据修改意见修改图谱的通知。
进行意见收集的图谱例如是实施例一或者实施例二中生成的图谱。
在本实施例的方法有服务器参与实施的情况下,该收集入口可以包括终端设备与服务器之间进行交互的接口。在本实施例的方法有终端设备参与实施的情况下,该收集入口可以包括人机交互接口。
请参见图7,本例中针对实施例二中生成的人物关系图谱提供意见收集入口。读者在阅读过程中,如果认为人物关系图谱存在需要修改的地方,可以在终端设备中通过点击该人物关系图谱等方式进入图7所示的修改意见收集页面。该意见收集页面的上方用于显示人物关系图谱。页面中部是用户意见填写区,读者可以在此处编辑留言内容并提交。页面下部是读者意见的展示区,用于展示收集到的修改意见,并且读者可以针对其他用户的意见通过点击“点赞”按钮等方式投出赞同票。本例中将赞同票的阈值设置为150票,在用户“Abby”的留言赞同票数量达到该阈值的情况下,服务器会通知运营人员根据该条修改意见对图谱进行修改。
本实施例中的信息处理方法除了能够产生实施例一、二中的技术效果外,还能使读者参与到人物关系图谱的纠错中。
<实施例六>
本实施例提供一种信息处理装置,可用于自动生成人物关系图谱。该信息处理装置例如是图8所示的信息处理装置8000,包括文本分析模块8100和图谱生成模块8200。
文本分析模块8100用于根据目标文本的内容,获取目标文本中存在的人物及不同人物间的人物关系。
图谱生成模块8200用于生成展示人物及人物关系的图谱。
文本分析模块8100和图谱生成模块8200的具体功能可以参见实施例一中对步骤S2100和步骤S2200的介绍和说明,这里不再赘述。
本实施例中的信息处理装置,通过文本分模块根据目标文本的内容自动获取目标文本中存在的人物及不同人物间的人物关系,通过图谱生成模块生成展示人物和人物关系的图谱,无需人工整理人物关系图谱,提高了图谱生成效率、降低了成本。
在一个实施例中,该图谱生成模块8200还可以用于:以每一人物为节点,根据人物关系在不同节点之间建立关联边,以生成图谱,其中,图谱在关联边上标注有对应的人物关系。
在一个实施例中,该文本分析模块8100还可以用于:在获取到的人物中识别出主角人物,图谱生成模块8200还用于在图谱中对主角人物进行区别于其他人物的突出显示。
在一个实施例中,该图谱生成模块8200还可以用于:在图谱中对主角人物进行区别于其他人物的突出显示时,突出显示包括位置上的突出显示、颜色上的突出显示、形状上的突出显示中的任意一种或者多种的组合。
在一个实施例中,该文本分析模块8100还可以用于:确定每一其他人物与主角人物的人物关系的紧密度,图谱生成模块8200还用于在图谱中,根据紧密度布置每一其他人物相对主角人物的位置。
在一个实施例中,该文本分析模块8100还可以用于:获取每一人物在目标文本中出现的频次;根据每一人物对应的频次,在获取到的人物中识别出主角人物。
在一个实施例中,该信息处理装置8000还可以包括加载模块(图中未示出),该显示模块用于在目标文本的设定页面上加载图谱。
在一个实施例中,前述显示模块还可以用于:响应于进入目标文本的设定页面的操作,在设定页面上加载显示图谱。
在一个实施例中,信息处理装置8000还可以包括修改模块(图中未示出),该修改模块用于:提供用于修改目标文本的图谱的修改入口;获取通过修改入口上传的图谱;更新目标文本的图谱为上传的图谱。
在一个实施例中,信息处理装置8000还可以包括意见收集模块(图中未示出),该意见收集模块用于:提供收集修改图谱的修改意见的收集入口;展示通过收集入口提交的修改意见,并提供用于对修改意见进行投票的投票入口;获取通过投票入口对修改意见投出的赞同票的投票数量;在投票数量满足预设要求的情况下,向运营人员的账户发出根据修改意见修改图谱的通知。
<实施例七>
本实施例提供了一种电子设备,该电子设备可以包括了本申请实施例六中的信息处理装置,具体可参见实施例六中关于信息处理装置的描述,这里不再赘述。此外,该电子设备还可以包括显示装置、输入装置、通信装置等。
本实施例中,该电子设备也可以为图9所示的电子设备9000,该电子设备9000包括存储器9100和处理器9200。
存储器9100用于存储可执行命令。
处理器9200用于在存储器9100存储的可执行命令的控制下,执行如实施例一至实施例五中的任一项信息处理方法,具体可参见实施例一至实施例五中关于信息处理方法的描述。
本实施例中,该电子设备可以是图1中的终端设备1200,也可以是图1中的服务器1100,还可以包括该终端设备1200和服务器1100。
<实施例八>
本实施例提供一种计算机可读存储介质,存储有可执行指令。该可执行指令被执行器执行时,执行如实施例一到实施例五中的任一项信息处理方法。具体可参见实施例一到实施例五中对信息处理方法的描述。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分相互参见即可,每个实施例重点说明的都是与其他实施例的不同之处,而且各个实施例可以根据需要单独使用或者相互结合使用,例如,本领域技术人员可以根据需要结合任意两个或者多个方法实施例来实施本发明的信息处理方法,在此不做限定。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人物来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人物来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人物能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

Claims (13)

1.一种信息处理方法,包括:
根据目标文本的内容,获取所述目标文本中存在的人物及不同人物间的人物关系;
生成展示所述人物及所述人物关系的图谱。
2.根据权利要求1所述的方法,其中,所述生成展示所述人物及所述人物关系的图谱,包括:
以每一所述人物为节点,根据所述人物关系在不同节点之间建立关联边,以生成所述图谱,其中,所述图谱在所述关联边上标注有对应的人物关系。
3.根据权利要求1所述的方法,其中,所述方法还包括:
在获取到的所述人物中识别出主角人物;
在所述图谱中对所述主角人物进行区别于其他人物的突出显示。
4.根据权利要求3所述的方法,其中,所述突出显示包括位置上的突出显示、颜色上的突出显示、形状上的突出显示中的任意一种或者多种的组合。
5.根据权利要求3所述的方法,其中,所述生成展示所述人物及所述人物关系的图谱,包括:
确定每一所述其他人物与所述主角人物的人物关系的紧密度;
在所述图谱中,根据所述紧密度布置每一所述其他人物相对所述主角人物的位置。
6.根据权利要求3所述的方法,其中,所述在获取到的所述人物中识别出主角人物,包括:
获取每一所述人物在所述目标文本中出现的频次;
根据每一所述人物对应的所述频次,在获取到的所述人物中识别出主角人物。
7.根据权利要求1至6中任一项所述的方法,其中,所述方法还包括:
在所述目标文本的设定页面上加载所述图谱。
8.根据权利要求7所述的方法,其中,所述在所述目标文本的设定页面上加载所述图谱,包括:
响应于进入所述目标文本的设定页面的操作,在所述设定页面上加载显示所述图谱。
9.根据权利要求7所述的方法,其中,所述方法还包括:
提供用于修改所述目标文本的所述图谱的修改入口;
获取通过所述修改入口上传的图谱;
更新所述目标文本的所述图谱为所述上传的图谱。
10.根据权利要求7所述的方法,其中,所述方法还包括:
提供收集修改所述图谱的修改意见的收集入口;
展示通过所述收集入口提交的所述修改意见,并提供用于对所述修改意见进行投票的投票入口;
获取通过所述投票入口对所述修改意见投出的赞同票的投票数量;
在所述投票数量满足预设要求的情况下,向运营人员的账户发出根据所述修改意见修改所述图谱的通知。
11.一种信息处理装置,包括:
文本分析模块,用于根据目标文本的内容,获取所述目标文本中存在的人物及不同人物间的人物关系;以及,
图谱生成模块,用于生成展示所述人物及所述人物关系的图谱。
12.一种电子设备,包括权利要求11所述的信息处理装置;或者,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于在所述可执行指令的控制下,执行如权利要求1-10任一项所述的方法。
13.一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时,执行如权利要求1-10任一项所述的方法。
CN201910289263.1A 2019-04-11 2019-04-11 信息处理方法、装置及电子设备 Pending CN111813948A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910289263.1A CN111813948A (zh) 2019-04-11 2019-04-11 信息处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910289263.1A CN111813948A (zh) 2019-04-11 2019-04-11 信息处理方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN111813948A true CN111813948A (zh) 2020-10-23

Family

ID=72844487

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910289263.1A Pending CN111813948A (zh) 2019-04-11 2019-04-11 信息处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111813948A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112380463A (zh) * 2020-11-09 2021-02-19 恒瑞通(福建)信息技术有限公司 一种人物关系图谱的快速生成系统及方法
CN113139033A (zh) * 2021-05-13 2021-07-20 平安国际智慧城市科技股份有限公司 文本处理方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008112432A (ja) * 2006-10-06 2008-05-15 Nippon Hoso Kyokai <Nhk> 人間関係グラフ生成装置及びコンテンツ検索装置、並びに、人間関係グラフ生成プログラム及びコンテンツ検索プログラム
US20090063481A1 (en) * 2007-08-31 2009-03-05 Faus Norman L Systems and methods for developing features for a product
CN105912579A (zh) * 2016-04-01 2016-08-31 东软集团股份有限公司 一种人物关系图谱的生成方法及装置
WO2018117906A1 (ru) * 2016-12-20 2018-06-28 Игорь Юрьевич СКВОРЦОВ Самонастраивающаяся интерактивная система обмена комментариями между пользователями
WO2018231097A1 (ru) * 2017-06-14 2018-12-20 Общество С Ограниченной Ответственностью "Центр Разработки И Внедрения Инновационных Технологий" Интерактивная система и способ представления рекламного контента

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008112432A (ja) * 2006-10-06 2008-05-15 Nippon Hoso Kyokai <Nhk> 人間関係グラフ生成装置及びコンテンツ検索装置、並びに、人間関係グラフ生成プログラム及びコンテンツ検索プログラム
US20090063481A1 (en) * 2007-08-31 2009-03-05 Faus Norman L Systems and methods for developing features for a product
CN105912579A (zh) * 2016-04-01 2016-08-31 东软集团股份有限公司 一种人物关系图谱的生成方法及装置
WO2018117906A1 (ru) * 2016-12-20 2018-06-28 Игорь Юрьевич СКВОРЦОВ Самонастраивающаяся интерактивная система обмена комментариями между пользователями
WO2018231097A1 (ru) * 2017-06-14 2018-12-20 Общество С Ограниченной Ответственностью "Центр Разработки И Внедрения Инновационных Технологий" Интерактивная система и способ представления рекламного контента

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邱秀连;康倩;王峥;: "人物关系的可视化研究", 计算机系统应用, no. 04, 15 April 2018 (2018-04-15) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112380463A (zh) * 2020-11-09 2021-02-19 恒瑞通(福建)信息技术有限公司 一种人物关系图谱的快速生成系统及方法
CN113139033A (zh) * 2021-05-13 2021-07-20 平安国际智慧城市科技股份有限公司 文本处理方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN113807098B (zh) 模型训练方法和装置、电子设备以及存储介质
Joshi et al. Towards sub-word level compositions for sentiment analysis of hindi-english code mixed text
US10572590B2 (en) Cognitive matching of narrative data
US10685186B2 (en) Semantic understanding based emoji input method and device
US11625681B2 (en) Conference support system, conference support method, and recording medium
US9348808B2 (en) Content-based automatic input protocol selection
KR102445519B1 (ko) 대화형 지능 서비스 제공 챗봇 제작 시스템 및 방법
US20180267955A1 (en) Cognitive lexicon learning and predictive text replacement
WO2016085409A1 (en) A method and system for sentiment classification and emotion classification
Prabhu et al. Towards sub-word level compositions for sentiment analysis of hindi-english code mixed text
Joty et al. Discourse analysis and its applications
CN110442868A (zh) 文本处理方法、装置及电子设备
US20200057798A1 (en) Cognitive clipboard
Ishikawa Global Englishes and ‘Japanese English’
CN111813948A (zh) 信息处理方法、装置及电子设备
US20190179895A1 (en) Intelligent content detection
US9436677B1 (en) Linguistic based determination of text creation date
Agrawal et al. Multimodal Persona Based Generation of Comic Dialogs
JP2018010532A (ja) 情報処理装置、プログラム及び情報処理方法
Ouyang Assessing meaning-dimension quality in consecutive interpreting training
Kharb et al. Embedding intelligence through cognitive services
Trakultaweekoon et al. Sensetag: A tagging tool for constructing thai sentiment lexicon
CN112149403A (zh) 一种确定涉密文本的方法和装置
US20150186363A1 (en) Search-Powered Language Usage Checks
Gonzalez Universidad Politécnica de Madrid

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination