CN112257386A

CN112257386A - 一种文景转换中场景空间关系信息布局生成的方法

Info

Publication number: CN112257386A
Application number: CN202011154871.0A
Authority: CN
Inventors: 杨富平; 冉文浩
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2020-10-26
Filing date: 2020-10-26
Publication date: 2021-01-22
Anticipated expiration: 2040-10-26
Also published as: CN112257386B

Abstract

本发明请求保护一种文景准换中场景空间信息布局生成的方法。该方法包括：构建空间关系词集和辅助空间关系词集；依靠依存语法关系和空间词集词向量相似度识别出初始文本中包含空间信息的文本集；依靠辅助空间关系词集提取每个分句的最小空间信息树；依靠依存语义分析和模式匹配抽取出空间关系构成初始场景空间关系集；匹配属性和比较可视化实体的相似度进行简单的指代消解；针对某一场景构建场景集，对其中的可视化实体名词进行统计分析；根据统计分析，分析某一场景名词特征；依据场景名词特征选取对应场景中空间关系集中的可视化实体作为锚实体；依靠对应场景集中空间关系和锚实体进行缺省空间关系推理，构造场景空间关系布局生成图。

Description

一种文景转换中场景空间关系信息布局生成的方法

技术领域

本发明属于文本可视化领域，尤其涉及一种文景转换中场景空间关系信息布局生成的方法。

背景技术

文景转换是指将自然语言的文本表达抽取出关键场景信息，进而将场景信息转换为相符可视化场景的过程。在教学知识、动画制作、事件重现等方面都有很好的应用前景，文景转换的过程可大致分为文本场景信息抽取、场景信息映射与场景构建三个阶段，其中实体与空间关系是文本场景信息抽取阶段和场景信息映射阶段的尤为关键，但也存在很多问题。

根据国内外对文景转换的相关研究，当前研究主流的方向有如下:一是在一般在场景中实体较单一，多使用方位，距离等方式进行定性与定量表述时，能比较简单的通过受限语法进行表示。当要表示场景中实体数量规模大从而导致复杂的空间关系时，但上述的方法将难以正确描述冗杂的相互空间关系，以一种更为高效的方式将冗杂的空间关系进行空间描述并将其较好的组织起来。

二是在一般的文本描述中经常会从中抽取出无参照、无方位、无距离描述的场景空间信息，一般做法是通过构成实体间依存的常识知识库，或构建大量场景描述数据，将其链接进入场景中或者直接丢弃掉，这需要大量的专业人士的人工参与。所以，这需要寻找出新的方法从已有的场景信息中挖掘出缺省或隐含的空间关系，使得所需场景的空间结构更为完善。

本文旨在解决上述场景对于实体相互之间的空间关系表示方法不完善的问题，拟基于现有的场景空间信息提取表达及推理方法，对场景空间信息进行分析，建立空间关系体系结构，推理隐含或缺省关键场景信息的空间关系，优化复杂冗余场景空间关系。

发明内容

本发明旨在解决以上现有技术的问题。提出了一种文景转换中场景空间关系信息布局生成的方法。本发明的技术方案如下：

一种文景转换中场景空间关系信息布局生成的方法，其包括以下步骤：

1)利用汉语字典和互联网收集文景转换相关语料，构建基础空间方位词及其合成词构成的空间关系词集和与空间关系词一起构成最短方位表达式所需要辅助词构成的辅助空间关系词集；

2)将初始文本分句后解析依存语法关系，并计算空间词集词向量相似度，对包含空间方位关系的分句进行识别；

3)针对步骤2)中的分句利用辅助空间关系词集的句式组合提取每个分句的最小空间信息集；

4)对步骤3)的的最小空间信息集合进行依存语义分析后抽取空间关系构成初始场景空间关系集；

5)对于步骤4)的集合中的实体匹配属性和比较可视化实体的相似度进行指代消解后构建若干个空间关系子图；

6)针对某一场景构建场景集在互联网上收集语料，预处理后对其中的可视化实体名词使用词频统计的方式获得统计指标；

7)根据步骤6)的统计指标，构建对应场景类别的特征词词集；

8)依据步骤7)选取对应场景中空间关系集中的可视化实体进行加权计算，选取权重大于设定值的作为步骤5)中空间关系子树的锚实体；

9)依靠步骤7)中的特征词词集和步骤8)的锚实体进行全局缺省空间关系推理，构造场景空间关系布局生成图。

进一步的，所述步骤1)利用汉语字典和互联网收集语料构建空间关系词集和辅助空间关系词集，具体包括：

初始方位词集{上，下，左，右，前，后，里，外，东，西，南，北}，在语言学中，方位词表示的方位既包含空间上的，又包含时间上；表示时间上方位的方位词，包含“以上”、“以下”，不需要抽取；既能表示空间上的，又能表示时间上的方位词；根据互联网收集语料，将初始方位词利用维基中文百科训练后获取词向量进行相似度判断，扩展添加每个初始方位词的衍生词后获得空间关系词集；在一般文本的空间关系表述中，除了可视化实体本身外，只需要抽取出关键的介词短语P、空间方位词N、空间谓词V和概括性空间词NN就可以比较完整的描述文本中包含的空间关系，剔除掉无效内容，只保留有效的空间关系词汇，利用互联网收集语料，构建常用辅助空间关系词集。

进一步的，所述步骤2)将初始文本分句后解析依存语法关系并计算空间词集词向量相似度，对包含空间方位关系的分句进行识别，具体包括：

将分句文本进行依存语法解析获取它的依存语法树，识别界标、射体和方位词，利用步骤1)中的空间关系词集进行余弦相似度计算后进行判断，将判断的方位词与地点、时间、无意义助词在内的干扰词区分，对是否包含空间方位关系的分句进行识别。

进一步的，所述步骤3)，针对步骤2)中的分句利用辅助空间关系词集的句式组合提取每个分句的最小空间信息集，具体包括：

根据从互联网获取的语料搭配上步骤1)的辅助空间关系词集得到基础模板PT，模板主要由一个三元组表示；

PT＝(W,L,D)

PT由W,L,D三部分构成，W主要是指步骤1)中收集空间关系词的词集，L是指W中空间关系词搭配上步骤1)中辅助空间关系词的最小构成包含空间关系的子树对应的短句的每个分词的词序，D是指W中步骤1)中空间关系词集和辅助空间关系词集任意相连分词之间的句法关系类型Dep(支配词，从属词)。

进一步的，所述步骤4)，对步骤3)的集合进行依存语义分析后抽取出类型为一对一的空间关系构成初始场景空间关系集，具体包括：

基于步骤3)获取的最小空间信息集，利用依存语义分析进行解析，对于一个界标对应一个射体的模式，采用通用模板和特殊模板抽取空间方位信息，对于一个界标对应多个射体的模式，无论是同一方向、差异方向还是范围距离，都可以转换成一个界标对应一个射体的模式进行多次抽取，对于多个界标对应一个射体的模式，将射体逆转化为界标，同理一个界标对应多个射体的模式的方式抽取空间方位信息后再次还原。

进一步的，步骤5)，对于步骤4)的集合中的实体匹配属性和比较可视化实体的相似度进行简单的指代消解后构建若干个空间关系图，具体包括：

对于步骤4)中获取的初始场景空间关系集，针对每个作为界标或者射体的可视化实体定位初始文本的位置获取它的属性，包括颜色、大小、数量、纹理和形状描述等等，分析属性的相似度判断是否为同一可视化实体，进行简易的指代消解，将集合中相互存在空间关系的可视化实体配对，构建若干空间关系树。

进一步的，所述步骤6)，针对某一场景构建场景集在互联网上收集语料，预处理后对其中的可视化实体名词使用词频统计的方式获得统计指标，具体包括：

通过统计大批量的同类型场景的文本，将其分词、去停用词和词性标注预处理后只剩下若干可视化实体组成的名词集对应它们的场景类型，采用传统的文本特征提取方法TF-IDF模型统计特征项的频率信息TF与反文档频率IDF，对于每一个类型的从互联网收集的场景文本预处理后统计n篇文本中出现可视化名词出现的频率大小；

在每个文档集N中，定义w_i在N中词频f_i为：

其中count(w_i,N)代表着词w_i在文档集N中的出现的次数，size(N)定义为文档集N中所有可视化实体的个数；

然后再采用反文档频率计算，设文档集N中一共拥有M篇文本，包含w_i的文本数量为m，具体公式为：

进一步的，所述步骤7)根据步骤6)的统计指标，构建对应场景类别的特征词词集，具体包括：

假设某一场景可以由多个可视化实体名词代表构成，对于每个可视化实体名词w_i的词向量，对应的场景类别可以由N个词的词集代表，若是p(w_i)代表可视化实体名词w_i出现的概率，则对应的场景类别的概率为

由此可以获得某一场景的对应的概率比较高的可视化实体的名词，选取前几项作为对对应场景影响最大的可视化实体的名词及其涉及的空间关系，统计从互联网中收集对应场景的对应场景影响最大的可视化实体的名词之间可能出现的空间关系概率。

进一步的，所述步骤8)依据步骤7)选取对应场景中空间关系集中的可视化实体进行加权计算后选取权重高于设定值的作为步骤5)中空间关系子图的锚实体，具体包括：

对初始文本进行场景分类，确定其对应的场景文本集，提取对应场景影响最大的可视化实体的名词与空间关系图中的实体进行对比解析，利用计算词向量的余弦相似度与词间的附属包含关系相似度加权计算权重最高的可视化实体名词，以其为主干构成一条锚实体链，确保每个空间关系子图都有一个锚实体链能连接两个端点。

进一步的，所述步骤9)，依靠步骤7)中的特征词词集和步骤8)的锚实体进行全局缺省空间关系推理，构造场景空间关系布局生成图，具体包括：

先遍历全部子图所有实体名词结点，根据步骤8)确定的锚实体组成的链的两端的端点进行子图之间的空间关系生成概率判断和常识库判断，融合两个子图成一个子图，以此类推，将所有的子图构成一个完全的场景空间关系布局生成图。

本发明的优点及有益效果如下：

本发明与现有技术相比，本发明的主要创新点是建立了场景空间布局推理模型，利用描述某一场景的文档集，获取该场景的常见场景空间关系的集合，在加权计算确定与该场景更相关的锚实体后推理文本场景中缺省的空间关系。本发明的有益效果是从更易收集的网络文本中获取某一场景的大量场景空间信息，利用和场景主题更相关的锚实体推理缺省的空间关系，减少了手工制作三维场景的工作量并优化了从文本中获取的场景空间布局信息，让相关工作者能更方便的获取场景空间布局信息。为文景转换中场景空间要素的分析提供了支持，从而实现生成的三维场景更符合人们的常识，增强场景的真实性。

附图说明

图1是本发明提供优选实施例一种文景转换中场景空间关系信息布局生成的方法的流程图。

图2为本申请中文景转换中场景空间关系信息布局生成的系统功能图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。

本发明解决上述技术问题的技术方案是：

一种文景转换中场景空间关系信息布局生成的方法，包括：

步骤一：利用汉语字典和互联网收集文景转换相关语料，构建基础空间方位词及其合成词构成的空间关系词集和与空间关系词一起构成最短方位表达式所需要辅助词构成的辅助空间关系词集；

步骤二：将初始文本分句后解析依存语法关系并计算空间词集词向量相似度，对包含空间方位关系的分句进行识别；

步骤三：针对步骤二中的分句利用辅助空间关系词集的句式组合提取每个分句的最小空间信息集；

步骤四：对步骤三的集合进行依存语义分析后抽取空间关系构成初始场景空间关系集；

步骤五：对于步骤四的集合中的实体匹配属性和比较可视化实体的相似度进行指代消解后构建若干个空间关系子图；

步骤六：针对某一场景构建场景集在互联网上收集语料，预处理后对其中的可视化实体名词使用词频统计的方式获得统计指标；

步骤七：根据步骤六的统计指标，构建对应场景类别的特征词词集；

步骤八：依据步骤七选取对应场景中空间关系集中的可视化实体进行加权计算后选取权重大于设定值的作为步骤5)中空间关系子树的锚实体；

步骤九：依靠步骤七中的特征词词集和步骤八的锚实体进行全局缺省空间关系推理，构造场景空间关系布局生成图。

所述的文景转换中中场景空间关系信息布局生成的方法，其中步骤一，包括：

初始方位词集{上，下，左，右，前，后，里，外，东，西，南，北}，根据互联网收集语料，将初始方位词利用维基中文百科训练后获取词向量进行相似度判断，扩展添加每个初始方位词的衍生词后获得空间关系词集。在一般文本的空间关系表述中，除了可视化实体本身外，只需要抽取出关键的介词短语P、空间方位词ND、空间谓词V和概括性空间词NN就可以比较完整的描述文本中包含的空间关系，利用互联网收集语料，构建常用辅助空间关系词集。

例如：将初始方位词中的“上”进行拓展可获得拓展方位词集(部分){上头，之上，上边，上面，上下，顶上，边上，上部，上端，左上头，右上头，左上部，右上部，左上方，右上方，前上方，左上角，右上角......}，其中还有和其他初始方位词有结合的词，除了一般性的方位词外，还有大量类似“周围”和“四周”类似的隐含方位词。

而常用辅助空间关系词集由分解收集的语料获得，如例句中“桌子/N的/U左上角/ND放/V着/U小汽车/N模样/N的/U文具盒/N。”，“桌子”和“文具盒”就是可视化命名实体名词N,“左上角”若是作为方位词拓展集合收集则会判断为空间方位词ND，否则会作为概括性空间词NN存在，“放”作为空间谓语V，而例如“小汽车模样”作为干扰项，本质上是文具盒的形容短语，一般“的”和“地”之类被标注为U在分析中去掉。

所述的文景转换中中场景空间关系信息布局生成的方法，其中步骤二，包括：

将分句文本进行依存语法解析获取它的依存语法树，识别界标、射体和方位词，利用步骤一中的空间关系词集进行余弦相似度计算后进行判断，将判断的方位词与地点、时间、无意义助词等等干扰词区分，对是否包含空间方位关系的分句进行识别。

例如例句中“桌子/N的/U左上角/ND放/V着/U小汽车/N模样/N的/U文具盒/N。”，依靠依存句法分析，识别出包含空间方位词的“左上角”，即包含空间关系。

对于不同的空间关系词和它们的词性采用不同的方法：

对于空间方位词，既有基础词又有合成词，一般可以依靠词性标注系统标注，在没有标注出来的时候，基础方位词数量有限可以枚举，合成词有2种情况：

一是在分词时被拆分，在处理时进行合成，例如“左上角”就被分开了成“左\ND”、“上\ND”、“角\N”，且两者之间都是以定中关系(ATT)存在,就可以合成成“左上角\ND”处理。

二是合成词，基础方位词可以通过枚举解决，但是合成词的数量太多而且随着时间的推移还有新的合成被造出来。

所述的文景转换中中场景空间关系信息布局生成的方法，其中步骤三，包括：

根据从互联网获取的语料搭配上步骤一的辅助空间关系词集得到基础模板PT，模板主要由一个三元组表示。

PT＝(W,L,D)

PT由W,L,D三部分构成，W主要是指步骤一中收集空间关系词的词集，L是指W中空间关系词搭配上步骤一中辅助空间关系词的最小构成包含空间关系的子树对应的短句的每个分词的词序，D是指W中步骤一中空间关系词集和辅助空间关系词集任意相连分词之间的句法关系类型Dep(支配词，从属词)。

例如例句“桌子/N的/U左上角/ND放/V着/U小汽车/N模样/N的/U文具盒/N。”可以修枝后“桌子/N左上角/ND放/V文具盒/N。”，W＝{桌子，文具盒}，L＝{3,2,1,4}，D＝{att,adv,root,vob}

所述的文景转换中中场景空间关系信息布局生成的方法，其中步骤四，包括：

基于步骤三获取的最小空间信息集，利用依存语义分析进行解析，对于一个界标对应一个射体的模式，采用通用模板和特殊模板抽取空间方位信息，对于一个界标对应多个射体的模式，无论是同一方向、差异方向还是范围距离，都可以转换成一个界标对应一个射体的模式进行多次抽取，对于多个界标对应一个射体的模式，将射体逆转化为界标，同理一个界标对应多个射体的模式的方式抽取空间方位信息后再次还原。

例如例句“桌子/N的/U左上角/ND放/V着/U小汽车/N模样/N的/U文具盒/N。”根据被判断为一个界标对应一个射体的的主动模式，经过依存分析后，使用主动通用模板(界标(ADV(N)or ADV(ND)-ATT(N)-ATT(NN)or ADV(NN))，空间方位词(ND)，射体(VOB))匹配，得到(桌子，左上角，文具盒)的空间关系式。

所述的文景转换中中场景空间关系信息布局生成的方法，其中步骤五，包括：

对于步骤四中获取的初始场景空间关系集，针对每个作为界标或者射体的可视化实体定位初始文本的位置获取它的属性，包括颜色、大小、数量、纹理和形状描述等等，分析属性的相似度判断是否为同一可视化实体，进行简易的指代消解，将集合中相互存在空间关系的可视化实体配对，构建若干空间关系图。

主要任务是分辨总类和分类的词汇，例如“桌子”和“书桌”，往往它们描述的是同一个事物，但一般识别为两个事物，需要依靠词向量余弦相似度和构建的本体库进行辨析，进行指代消解。

所述的文景转换中中场景空间关系信息布局生成的方法，其中步骤六，包括：

通过统计大批量的同类型场景的文本，将其分词、去停用词和词性标注预处理后只剩下若干可视化实体组成的名词集对应它们的场景类型，采用传统的文本特征提取方法TF-IDF模型统计特征项的频率信息TF与反文档频率IDF，对于每一个类型的从互联网收集的场景文本预处理后统计n篇文本中出现可视化名词出现的频率大小。

在每个文档集N中，定义w_i在N中词频f_i为：

其中count(w_i,N)代表着词w_i在文档集N中的出现的次数，size(N)定义为文档集N中所有可视化实体的个数。

例如：对于场景为卧室的文档集：

可视化实体名词	词频	文档数量	SIDF
				床	354	98	0.296
书桌	324	94	0.287
				书	291	83	0.262
窗户	110	90	0.27
				凳	98	70	0.23
杯子	71	41	0.149
				文具盒	52	23	0.089
台灯	48	45	0.161

表(一)

所述的文景转换中场景空间关系信息布局生成的方法，其中步骤七，包括：

例如在对于场景为卧室的文档集而言，桌作为影响最大的可视化实体，通过标注抽取文档集中以桌作为射体或者界标的空间关系式，获取的部分关系如下，此处的概率是任意方向和范围存在空间关系的概率之和：

表(二)

所述的文景转换中场景空间关系信息布局生成的方法，其中步骤八，包括：

例如“桌子的左上角放着我的小汽车模样的文具盒，右上角的老式台灯在晚上照亮了桌子，...。书桌上还摆着我今天的作业本等着我去完成。”可以抽取出(桌子，左上角，文具盒)，(null，右上角，台灯)，(书桌，上，作业本)，根据步骤五可以分析出null为桌子，而书桌实际上也指的是前文的桌子，由步骤七可以确定对应场景影响最大的可视化实体的名词是桌子，依靠上述的三对空间关系对可以得到以桌子为锚实体结点拓展出桌子-台灯的锚实体链。

所述的文景转换中场景空间关系信息布局生成的方法，其中步骤九，包括：

上述实施例阐明的方法，具体可以由计算机芯片或实体实现，一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后，技术人员可以对本发明作各种改动或修改，这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims

1.一种文景转换中场景空间关系信息布局生成的方法，其特征在于，包括以下步骤：

7)根据步骤6)的统计指标，构建对应场景类别的特征词词集；

2.根据权利要求1所述的一种文景转换中场景空间关系信息布局生成的方法，其特征在于，所述步骤1)利用汉语字典和互联网收集语料构建空间关系词集和辅助空间关系词集，具体包括：

3.根据权利要求1所述的一种文景转换中场景空间关系信息布局生成的方法，其特征在于，所述步骤2)将初始文本分句后解析依存语法关系并计算空间词集词向量相似度，对包含空间方位关系的分句进行识别，具体包括：

4.根据权利要求1所述的一种文景转换中场景空间关系信息布局生成的方法，其特征在于，所述步骤3)，针对步骤2)中的分句利用辅助空间关系词集的句式组合提取每个分句的最小空间信息集，具体包括：

PT＝(W,L,D)

5.根据权利要求4所述的一种文景转换中场景空间关系信息布局生成的方法，其特征在于，所述步骤4)，对步骤3)的集合进行依存语义分析后抽取出类型为一对一的空间关系构成初始场景空间关系集，具体包括：

6.根据权利要求5所述的一种文景转换中场景空间关系信息布局生成的方法，其特征在于，步骤5)，对于步骤4)的集合中的实体匹配属性和比较可视化实体的相似度进行简单的指代消解后构建若干个空间关系图，具体包括：

7.根据权利要求6所述的一种文景转换中场景空间关系信息布局生成的方法，其特征在于，所述步骤6)，针对某一场景构建场景集在互联网上收集语料，预处理后对其中的可视化实体名词使用词频统计的方式获得统计指标，具体包括：

在每个文档集N中，定义w_i在N中词频f_i为：

8.根据权利要求7所述的一种文景转换中场景空间关系信息布局生成的方法，其特征在于，所述步骤7)根据步骤6)的统计指标，构建对应场景类别的特征词词集，具体包括：

9.根据权利要求8所述的一种文景转换中场景空间关系信息布局生成的方法，其特征在于，所述步骤8)依据步骤7)选取对应场景中空间关系集中的可视化实体进行加权计算后选取权重高于设定值的作为步骤5)中空间关系子图的锚实体，具体包括：

10.根据权利要求9所述的一种文景转换中场景空间关系信息布局生成的方法，其特征在于，所述步骤9)，依靠步骤7)中的特征词词集和步骤8)的锚实体进行全局缺省空间关系推理，构造场景空间关系布局生成图，具体包括：