CN108885617B - 语句解析系统以及程序 - Google Patents

语句解析系统以及程序 Download PDF

Info

Publication number
CN108885617B
CN108885617B CN201680084010.5A CN201680084010A CN108885617B CN 108885617 B CN108885617 B CN 108885617B CN 201680084010 A CN201680084010 A CN 201680084010A CN 108885617 B CN108885617 B CN 108885617B
Authority
CN
China
Prior art keywords
perceptual
attribute
tag
type
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680084010.5A
Other languages
English (en)
Other versions
CN108885617A (zh
Inventor
大岛修
渡边绩央
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Publication of CN108885617A publication Critical patent/CN108885617A/zh
Application granted granted Critical
Publication of CN108885617B publication Critical patent/CN108885617B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

提供一种能从以自然语言记述的语句中有效抽出发言的意图、价值判断的技术。在输入语句的必要的词素,预先通过词素解析部12设定了意义候选标签、感性主题标签。另外,通过构式解析部13,编写记述有包含意义候选标签、感性主题标签的文节、各标签的种类的索引40。意义属性抽出部15通过参照此索引40,在识别包含意义候选标签的文节、标签的种类的基础上,应用意义属性规则,在必要的文节中设定意义属性标签的同时,更新索引40。感性分析部16通过参照此索引40,在识别包含感性主题标签的文节、包含意义属性标签的文节的基础上,应用感性分析规则,在必要的文节设定感性属性标签。

Description

语句解析系统以及程序
技术领域
本发明涉及语句解析系统以及程序,尤其是通过电子公告牌上的发言数据、调查问卷的回答数据等电子化文件数据,自动收集终端用户关于特定的商品、服务等的主观评价、意见的技术。
背景技术
终端用户对具体的商品、服务(以下“商品等”)的主观评价(感想)、发言意图,对于现行商品等的改良、下一代商品等的开发来说,是极为重要的指针。为此,各个企业从各种各样的观点出发,对从终端用户收集的调查问卷结果进行分析,或者访问网络上电子公告牌、查阅对自己公司商品等的评价。
另外,为了实现这种人工分析作业的高效化,通过使用电脑对电子化语句进行自动解析,抽出终端用户对于特定商品等的评价的技术已经被提出。
例如,专利文献1中公开了针对包含对于规定对象的情绪表达的语句,在实施词素处理、构式解析处理之后,参照注册了多种情绪表达的情感术语辞典,从该语句中抽出情绪表达的同时,统计各情绪表达的属性(消极/积极等),将其结果向外部输出的技术。其结果是,对于“口红”这一评价对象的色泽、气味、妆感、包装等多项评价轴的每一项,都可以提示否定评价与肯定评价的分布状况。
专利文献1:特开2003-248681号公报
但是,使用电脑对人类记述的自然语言所构成的语句进行解析时,一般会将语句分解成最小的构成单位——词素,在对词类等进行特定的词素解析、将各词素总结为多个文节的同时,对文节相互之间的联结关系实行确定的构式解析处理,以语法树的形式输出。
接着,对于此语法树,按照规定的顺序适用多项规则,由于具备抽出了各文的意义内容等的构造,因此,随着语句结构变得复杂,判定规则可否应用将需要庞大的处理时间。
对此,专利文献2中主张:对于无需参照语法树,即可通过词素的排列来判定可否应用的一部分规则,在词素解析的阶段应用规则,赋予意义属性,对于构式解析之后的语法树,仅应用剩余的规则,这样能够节约规则应用所需的判定时间。
专利文献2:特开2005-092254号公报
发明内容
发明所要解决的课题
然而,不参照语法树就能够判定其可否应用的规则的数量本身有限,即使在同一文献中,仅仅举例示出了意为“时间在前”的“~kara”和意为“理由”的“~kara”。
实际上,为了从以自然语言记述的复杂语句中准确抽出作成者的意图、评价等意义内容等,思考文节之间的联结结构是很重要的,省略这一步骤而能够确定的,属于例外,为此,不得不说,即使应用了专利文献2的技术,也无法期待处理速度的急速提高。
本发明的提出,是为了解决以往的此类问题,目的是提供可以从以自然语言记述的语句中有效抽出意义内容等的技术。
用于解决课题的方案
为了达成上述目的,权利要求1中记载的语句解析系统,其特征在于:具备将输入的语句以词素为单位进行分解的手段;参照规定了特定词素与属性种类之间的对应关系的属性辞典,对符合的词素设定事前标签的事前标签设定手段;对于将各词素之间的联结关系或者将各词素汇集起来的各文节之间的联结关系进行特定的构式解析手段、生成记录有包含事前标签的词素或文节的特定信息与该事前标签的种类形成的组合的索引的索引生成手段、储存了多项将至少指定包含特定种类的事前标签的词素或文节的应用条件与指定属性标签设定对象的词素或文节以及设定的属性标签的种类的应用效果组合起来所构成的判定规则的判定规则记忆手段、参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的词素或文节设定指定种类的属性标签的判定手段。
权利要求2中记载的语句解析系统是权利要求1中的系统,其特征在于:进而,上述属性辞典中的至少一个是规定了特定词素与意义属性的种类之间的对应关系的意义属性辞典,通过上述事前标签设定手段,对于符合的词素设定作为事前标签的意义候选标签,在上述索引,通过上述索引生成手段,记录下包含意义候选标签的文节的特定信息与该意义候选标签的种类形成的组合,在上述判定规则记忆手段中,储存有至少指定包含特定种类的意义候选标签的文节的应用条件与指定意义属性标签设定对象文节以及设定的意义属性标签的种类的应用效果组合起来所构成的判定规则,上述判定手段参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的意义属性标签。
权利要求3中记载的语句解析系统是权利要求2中的系统,其特征在于:进而,上述属性辞典中的至少一个是规定了特定词素与感性主题的种类之间的对应关系的感性主题辞典,通过上述事前标签设定手段,对于符合的词素设定作为事前标签的感性主题标签,在上述索引,通过上述索引生成手段,记录下包含感性主题标签的文节的特定信息与该感性主题标签的种类形成的组合,在上述判定规则记忆手段中,储存有指定包含特定种类的感性主题标签的文节、以及该文节或者其他文节中包含的意义属性标签的种类的应用条件、指定感性属性标签设定对象文节以及设定的感性属性标签的种类的应用效果组合起来所构成的判定规则,上述判定手段参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的感性属性标签。
权利要求4中记载的语句解析系统是权利要求1中的系统,其特征在于:进而,作为上述属性辞典,至少具备规定了特定词素与感性主题的种类之间的对应关系的感性主题辞典、规定了特定词素与大小表达的种类之间的对应关系的大小表达辞典,通过上述事前标签设定手段,对于符合的词素设定作为事前标签的感性主题标签以及大小表达标签,在上述索引,通过上述索引生成手段,记录下包含感性主题标签的文节的特定信息与该感性主题标签的种类形成的组合、包含大小表达标签的文节的特定信息与该大小表达的种类形成的组合,在上述判定规则记忆手段中,储存有指定包含特定种类的感性主题标签的文节、以及该文节或者其他文节中包含的大小表达标签的种类的应用条件、指定感性属性标签设定对象文节以及设定的感性属性标签的种类的应用效果组合起来所构成的判定规则,上述判定手段参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的感性属性标签。
权利要求5中记载的语句解析系统是权利要求1或权利要求4中的系统,其特征在于:进而,作为上述属性辞典,至少具备规定了特定词素与感性主题的种类之间的对应关系的感性主题辞典、规定了特定词素与感性表达的种类之间的对应关系的感性表达辞典,通过上述事前标签设定手段,对于符合的词素设定作为事前标签的感性主题标签以及感性表达标签,在上述索引,通过上述索引生成手段,记录下包含感性主题标签的文节的特定信息与该感性主题标签的种类形成的组合、包含感性表达标签的文节的特定信息与该感性表达标签的种类形成的组合,在上述判定规则记忆手段中,储存有指定包含特定种类的感性主题标签的文节、以及该文节或者其他文节中包含的感性表达标签的种类的应用条件、指定感性属性标签设定对象文节以及设定的感性属性标签的种类的应用效果组合起来所构成的判定规则,上述判定手段参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的感性属性标签。
权利要求6中记载的语句解析程序,其特征在于将电脑作为以下手段发挥功能:将输入的语句以词素为单位进行分解的手段;参照规定了特定词素与属性种类之间的对应关系的属性辞典,对符合的词素设定事前标签的事前标签设定手段;对于将各词素之间的联结关系或者将各词素汇集起来的文节之间的联结关系进行特定的构式解析手段;生成记录有包含事前标签的词素或文节的特定信息与该事前标签的种类形成的组合的索引的索引生成手段;储存了多项将至少指定包含特定种类的事前标签的词素或文节的应用条件与指定属性标签设定对象的词素或文节以及设定的属性标签的种类的应用效果组合起来所构成的判定规则的判定规则记忆手段;参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的词素或文节设定指定种类的属性标签的判定手段。
发明效果
在此发明所涉及的语句解析系统以及程序的情况下,为了从语句中抽出发言者的主观意图、对于感性主题的价值判断等,在各文节之间的联结关系(语法树)应用规定的规则本身与以往技术相比,并没有不同之处,但此时,通过参照基于属性辞典预先生成的索引,能够立即了解应该应用规则的文节的存在以及种类,为此,具备了以下优点:在语句比较长的情况下,即使构式结构复杂,也能够极为迅速地判断规则可否应用。
附图说明
图1表示此发明所涉及的语句解析系统的功能构成的框图。
图2表示意义属性辞典的注册例的图。
图3表示大小表达辞典以及感性表达辞典的注册例的图。
图4表示感性主题辞典的注册例的图。
图5举例示出来自词素解析部的输出数据的图。
图6举例示出在单词层面上能够确定感性主题与感性表达的情况的图。
图7举例示出在单词层面上能够确定感性主题与感性表达的情况的图。
图8举例示出来自构式解析部的输出数据的图。
图9示出构式解析部的输出数据作为语法树而表达的例子的图。
图10表示复合名词合并部的处理内容的图。
图11表示意义属性规则的应用例的图。
图12表示意义属性规则的应用效果的图。
图13表示感性属性规则的应用例的图。
图14表示感性属性规则的应用效果的图。
图15表示实施例1中的语法树的图。
图16表示实施例1中的意义属性规则的应用效果的图。
图17表示实施例2中的语法树的图。
图18表示实施例2中的意义属性规则的应用效果的图。
图19表示实施例2中的感性分析规则的应用效果的图。
图20表示实施例3中的语法树的图。
图21表示实施例3中的意义属性规则的应用效果的图。
图22表示实施例4中的语法树的图。
图23表示实施例4中的意义属性规则的应用效果的图。
图24表示实施例4中的感性分析规则的应用效果的图。
符号说明
10 语句解析系统
12 词素解析部
13 构式解析部
14 复合名词合并部
15 意义属性抽出部
16 感性分析部
17 设定文件
18 系统辞典记忆部
19 感性主题辞典记忆部
20 用户辞典记忆部
21 解析模型记忆部
22 意义属性规则记忆部
23 感性分析规则记忆部
24 单词辞典
25 意义属性辞典
26 大小表达辞典
27 感性表达辞典
28 文本文件
29 分析结果
40 索引
具体实施方式
图1是表示此发明所涉及的语句解析系统10的功能构成的框图:由词素解析(包含对输入的语句的词素·单词的分解、词类等的特定)部12、构式解析部13、复合名词合并部14、意义属性抽出部15、感性分析部16、设定文件17、系统辞典记忆部18、感性主题辞典记忆部19、用户辞典记忆部20、解析模型记忆部21、意义属性规则记忆部22、感性分析规则记忆部23而构成。
上述词素解析部12、构式解析部13、复合名词合并部14、意义属性抽出部15以及感性分析部16,由电脑的CPU随着OS以及APP应用程序实行必要处理而实现。
另外,上述设定文件17、系统辞典记忆部18、感性主题辞典记忆部19、用户辞典记忆部20、解析模型记忆部21、意义属性规则记忆部22以及感性分析规则记忆部23,设置在同一电脑的记忆装置内。
在系统辞典记忆部18中,除了词素解析所必要的一般性单词辞典24之外,还储存有通用意义属性辞典25、大小表达辞典26、感性表达辞典27等。
如图2所示,“意义属性辞典”规定了特定的表达模式、与该意义属性的种类(表示发言意图的否定/肯定/疑问/要求/预想之外/不满等类型)的对应关系。
另外如图3(a)所示,“大小表达辞典”规定了表示事物大小的表达模式、与大小表达的种类(大/小的区分)的对应关系。
另外如图3(b)所示,“感性表达辞典”规定了表示对于事物评价的表达模式、与感性表达的种类(积极/消极的类型)的对应关系。
感性主题辞典记忆部19中,储存有针对每个产品、服务领域,定义了多个感性主题(评价轴/观点)、各个关联语的感性主题辞典。
图4表示酒店、旅馆等住宿服务领域所涉及的感性主题辞典的注册例,关于“价格”这一评价轴,除了“价格”之外,还储存有“费用”、“价钱”、“住宿费用”、“住宿费”等近义词、关联语作为类似表达。这些类似表达,参照了一般性近义词辞典等,另外考虑到各个行业的特性,根据每个行业进行编纂。
为此,关于“价格”这一评价轴,除了“价格”“费用”“价钱”等一般性名称之外,还列出了“住宿费用”、“住宿费”这样的酒店·旅馆行业特有的名称。
另外,在为餐饮行业用户提供服务的情况下,列出了“餐饮费”“酒费”等类似表达来代替“住宿费用”“住宿费”,应用了餐饮行业用的评价轴类似表达辞典。
上述系统辞典记忆部18、感性主题辞典记忆部19是预先在系统一方准备的通用性词典,与此相对,在用户辞典记忆部20,储存有用户一方独自准备的各种辞典(独自的意义属性辞典、大小表达辞典、感性表达辞典、感性主题辞典)。
用户在使用此系统10时,在预先设定的文件17中提前指定应该应用何种辞典。
解析模型记忆部21中储存有对于大量文本(学习用语料库)实施统计性解析而生成的构式解析用统计模型。
在这里,将包含作为解析对象的多个语句的文本文件28输入系统10,通过词素解析部12实行词素解析处理。
文本文件24由例如列出多个从终端用户收集的调查问卷的回答文而构成。
例如,在文本文件24中包含语句“认为成效果是没有的”的情况下,如图5所示,词素解析部12将其分解为“效果”、“是”、“没有的”、“成”、“认为”这几个词素单位,并对于每一个的词类、读音等进行特定。
另外词素解析部12具有作为事前标签设定手段的功能,参照在设定文件17中指定的领域所涉及的感性主题辞典,在各词素中包含预先定义为作为表示感性主题的用语的情况下,将该词素与作为事前标签的感性主题标签关联起来。
在图5中,对于词素“效果”,赋予了“功效”这一感性主题标签。
另外词素解析部12,通过参照系统辞典记忆部18中的意义属性辞典25,将特定词素与作为表示其意义属性的种类的事前标签的意义候选标签关联起来。
正如上述,意义属性是表示该语句的作者的意图、评价、价值判断的词素类型,对应“否定”、“疑问”、“要求”、“预想之外”等种类的标签与符合的词素关联起来。
只不过,此时,构式解析尚未完成,因此只不过是暂定的“意义候选”,并不是确定的。
在图5中,对于词素“没有的”,赋予了“否定”的意义候选标签。
在图5中并未表示出,但词素解析部12参照系统辞典记忆部18中的大小表达辞典26、感性表达辞典27,在包含符合的词素的情况下,赋予作为对应“大/小”的种类的事前标签的大小表达标签、作为对应“积极/消极”的种类的事前标签的感性表达标签。
另外,大小表达、感性表达无需等待构式解析,根据其表达本身,内容不言自明,为此,并非是“大小候选”“感性候选”,而是在此时就确定了下来。
在词素中,存在通过一个词汇,同时确定感性主题和感性表达(积极/消极)的情况。
例如,“优雅的”这一词汇使用于特定商品领域的情况下,能够特定“感性主题=设计”、“感性表达的种类=积极”,为此,预先定义在感性主题辞典等中。
其结果是,如图6所示,输入语句“优雅的剪影”时,在“优雅的”的词素解析结果中,列出了“设计”的感性主题标签,被赋予“积极”的感性表达标签。
同样地,为了从“高质量”这一词汇中导出“感性主题=质量”、“感性表达的种类=积极”,预先在感性主题辞典等中进行定义。
其结果是,如图7所示,输入语句“高质量的产品”时,在“高质量”的词素解析结果中,列出了“质量”的感性主题标签,被赋予“积极”的感性表达标签。
完成词素解析之后的词素解析部12,向构式解析部13输出解析结果。
构式解析部13接收到此结果,将各词素以文节为单位进行结合之后,对各文节之间的联结关系进行特定。
此时,构式解析部13通过参照储存在解析模型记忆部21中的统计模型,能够进行高精度的构式解析。
在图8中,“效果”、“是”、“没有的”、“成”、“认为”这些各词素,汇集在“效果是(文节ID:0)”、“没有的成(文节ID:1)”、“认为(文节ID:2)”这3个文节中。另外,通过在各文节ID的右侧,一并记录联结对象文节ID,来表达文节之间的联结关系。具体来说,会导出“效果是”←“没有的成”←“认为”的联结关系。
另外构式解析部13具备作为索引生成手段的功能,抽出与各文节中的词素相关联起来的感性主题标签以及意义候选标签,将其作为索引,写出到记忆装置的其他领域。
在图8中,生成了索引40,索引40中包含:表示感性主题“功效”与Chunk0(文节0)相关联起来的信息、表示意义候选的“否定”与Chunk1(文节1)相关联起来的信息。
另外,在文节中包含赋予了大小表达标签、感性表达标签的词素的情况下,构式解析部13表示其存在的信息(设定了标签的文节以及标签的种类)也在索引40中进行记述。
图9是将构式解析部13的输出数据,通过应用规定的图表对象变换工具,以语法树的形式表达出来,各文节之间的联结关系以树形结构的形式来表达。
此时,在同一文节中连续存在多个名词的情况下,通过复合名词合并部14,连结为一个词素。
例如,如图10所示,在文节(Chunk0)的“野村综合研究所是”中,连续存在“野村”、“综合”、“研究”、“所”这4个名词,因此通过复合名词合并部14结合成为“野村综合研究所(Nomura sougoukenkyusho)”这一个词素。
接下来,通过意义属性抽出部15,实行意义属性抽出处理。
在这里“意义属性抽出处理”是指:对于包含设定了意义候选标签的词素的文节,通过应用意义属性规则,来确定“意义候选”是否真正等于“意义属性”。
如图11所示,首先,意义属性抽出部15参照索引40,对包含设定了意义候选标签的词素的文节以及意义候选的种类进行特定。
在这里,文节1(Chunk1)中设置有“否定”的意义候选标签。
接下来,意义属性抽出部15从意义属性规则记忆部22中,抽出意义候选“否定”用的意义属性规则,将其适用于符合的语法树(各文节以及文节之间的联结结构)。
即,按照“应用条件”与“应用效果”所组合起来的优先顺序,注册有多个意义属性规则,意义属性抽出部15,对于包含设定了意义候选标签的词素的文节与各意义属性规则的应用条件,按照从上至下的顺序进行比较,在匹配的时间点,对该意义属性规则的应用效果实行规定的处理。
在图中示出了匹配第1个意义属性规则的例子。
即,在此“NO.001”规则的情况下,应用条件为:“作为联结对象的文节,包含作为形容词的『没有的(基本形)』”,因此,与文节1(Chunk1)中的“没有的成”相匹配。
接着,“NO.001”规则的应用效果为:“为联结元的文节赋予‘否定’的意义属性”,因此,意义属性抽出部15随之如图12所示,为文节0(Chunk0)赋予“否定”的意义属性标签。
同时,意义属性抽出部15,在索引40也追加了在文节0赋予“否定”的意义属性标签的信息。
另外,在设定了意义候选标签的文节、该文节与其他文节之间的联结结构与任何意义属性规则均不匹配的情况下,以意义候选的原始形式残留下来。
另外,意义属性抽出部15,并不是正如上述参照索引40对设定了意义候选标签的文节进行特定的基础上,按照意义属性规则的顺序进行应用,而是对于每一项意义属性规则,参照索引40,对应该应用的文节进行特定,也能够对该规则的适合性进行判定。
意义属性规则,实际上遵照JSON格式而记述。
顺便说一下,在图11中的“NO.001”规则的情况下,从索引中检索基准组块(包含否定的意义候选标签的文节)、作为应用条件的基准组块中不包含作为形容词的“没有的”、作为应用效果在子组块(联结元的文节)中追加“否定”的意义属性标签,是遵照JSON格式而记述的。
另外,在图11中的“NO.002”规则的情况下,从索引中检索基准组块(包含否定的意义候选标签的文节)、作为应用条件的基准组块中包含作为接尾辞的“没有的”、作为应用效果在基准组块本身追加“否定”的意义属性标签,是遵照JSON格式而记述的。
意义属性抽出部15,并不是原封不动地按照JSON格式来应用意义属性规则,而是将JSON格式的规则通过规则生成器,变换为图表对象的操作逻辑之后,能够在将其通过编译器转化为可执行的二进制数据化的基础上进行适应。
像这样,通过将各规则转化为可执行的二进制数据,作为程序代码读入,这样能够实现规则适合性判定处理的高速化。
接下来,通过感性分析部16进行感性分析处理。
在这里“感性分析处理”是指,对于语法树中包含的各个文节或者文节之间的联结结构,通过应用感性分析规则,对于该语句的感性主题,对其积极(肯定的)或者消极(否定的)的感性属性进行特定的处理。
如图13所示,首先,感性分析部16参照索引40,对设定于该语法树的感性主题标签的种类、其文节进行特定。
在这里,在文节0(Chunk0)设定了“功效”的感性主题。
接下来,感性分析部16从感性分析规则记忆部23取出“功效”用的感性分析规则,将其适用于符合的语法树。
即,按照“应用条件”与“应用效果”的组合的优先顺序注册有多个感性分析规则。
作为“适应条件”,规定了对于在设定了感性主题标签的文节与其他文节设定有规定标签(感性表达标签、大小表达标签、意义属性标签)之间的联结关系进行指定的信息,或者对于在设定了感性主题标签的文节本身重复设定有规定标签(感性表达标签、大小表达标签、意义属性标签)进行指定的信息。
另外,作为“适应效果”,规定了指定应该赋予积极或者消极的感性属性标签的文节的信息。
感性分析部16,对于对象文节或者文节之间的联结结构与各感性分析规则,按照从上至下的顺序进行比较,在匹配的时间点,以该感性分析规则的应用效果实行指定的处理。
在图中示出了匹配了从上面数的第6项感性分析规则的例子。
即,在此“NO.006”规则的情况下,应用条件为“设定了功效的感性主题标签的同时,设定了否定的意义属性标签的文节”,因此匹配文节0(Chunk0)。
此“NO.006”规则的应用效果为“在同文节设定消极的感性属性标签”,因此,感性分析部16随之如图14所示,在文节0(Chunk0)赋予“消极”的感性属性标签。
同时,感性分析部16在索引40也追加了在文节0赋予“消极”的感性属性标签的信息。
感性分析部16,并不是正如上述参照索引40对设定了感性主题标签的文节、设定了感性表达标签等的文节进行特定的基础上,按照感性分析规则的顺序进行应用,而是对于每一项感性分析规则,参照索引40,对于对象文节进行特定,也能够对该规则是否适合进行判定。
此图14中表示的信息,即各词素的解析结果、文节之间的联结结构(语法树)、各文节被赋予的标签、索引40,成为根据本系统10得出的分析结果29。
即,文节0(Chunk0)包含具备“功效”的感性主题标签的词素,由于在该文节0设定了“消极”的感性属性标签,因此,对于语句“认为成效果是没有的”,显示出表示“关于功效,为消极意见的语句”的分析结果。
通过针对多个语句(调查问卷文等)实施这样的感性分析,使得对终端用户对于特定的商品、服务的意见、评价进行统计成为可能。
实施例1
图15表示,在输入了语句“怎样对于设定进行变更才好呢”的情况下,词素解析以及构式解析结果。
如图所示,索引40中记述有:在文节0(Chunk0)设定了“操作性”的感性主题标签、在文节2(Chunk2)设定了“疑问”这一意义候选标签。
对此,意义属性抽出部15从意义属性规则记忆部22取出疑问用的意义属性规则,按照各意义属性规则的应用条件的顺序,适用于该语句的语法树。接着,在合适的时间点,意义属性抽出部15在该意义属性规则的应用效果实行规定的处理。
图16表示某意义属性规则的应用结果,在文节2(Chunk2)设定“疑问”的意义属性标签的同时,在索引40也追加了此信息。
顺便说一下,此意义属性规则的应用条件以及应用效果,如下所示。
[应用条件]:
(1)在副词“怎样”设定“意义候选:疑问”。
(2)在“怎样”之后,接续动词的“进行(基本形)”。
[应用效果]:
为该文节赋予“疑问”的意义属性标签。
对于来自此意义属性抽出部15的输出,感性分析部16尝试了感性主题“操作性”所涉及的感性分析规则的应用,但由于不存在匹配的规则,感性属性标签(积极/消极)的设定被搁置。
为此,图16表示的是,对于语句“怎样对于设定进行变更才好呢”的最终分析结果。
在这种情况下,终端用户对于感性主题“操作性”的最终评价,即无法抽出“操作性良好/操作性不佳”,但至少能够抽出针对操作性的疑问,因此该输出能够用于探索操作性的改善点的目的。
实施例2
图17表示,在输入语句“操作是难以理解的”的情况下,词素解析以及构式解析结果。
如图所示,索引40中记述有:在文节0(Chunk0)设定了“感性主题:操作性”,在文节1(Chunk1)设定了“困难”的意义候选标签。
对此,意义属性抽出部15从意义属性规则记忆部22取出困难用的意义属性规则,按照各意义属性规则的应用条件的顺序,适用于该语句的语法树。接着,在合适的时间点,意义属性抽出部15在该意义属性规则的应用效果实行规定的处理。
图18表示某意义属性规则的应用结果,在文节1(Chunk1)设定“困难”的意义属性标签的同时,在索引40也追加了此信息。
此意义属性规则的应用条件以及应用效果,例如以下所示。
[应用条件]:
(1)存在动词词素。
(2)动词的后面接续有“难以(基本形的读音)”。
[应用效果]:
为该文节赋予“困难”的意义属性标签。
对于来自此意义属性抽出部15的输出,感性分析部16尝试感性主题“操作性”所涉及的感性分析规则的应用。
在这里,某感性分析规则的应用条件的匹配结果,如图19所示,根据该应用效果,在文节0(Chunk0)设定了“消极”的感性属性标签。
此感性分析规则的应用条件以及应用效果,例如以下所示。
[应用条件]:
存在“理解(基本形的读音)”这一词素。
[应用效果]:
在联结元的文节(child chunk)赋予“消极”的感性属性标签。
上述示出了将此系统10应用于以日文记述的语句分析的例子,但此系统10也可以应用于以英文、中文等除日文以外的语言记述的语句。
为此,预先准备各语言对应的词素解析(包含对输入的语句的词素·单词的分解、词类等的特定)部12、构式解析部13、复合名词合并部14、单词辞典24、意义属性辞典25、大小表达辞典26、感性表达辞典27、感性主题辞典、用户辞典、解析模型、意义属性规则、感性分析规则。
以下,示出以英文记述的语句的解析例。
实施例3
图20表示,在输入英文“How can I change the settings?”的情况下,词素解析以及构式解析的结果。
如图所示,索引(index)40记述了:“操作性(operability)”的感性主题(Sentimental theme)标签设定在文节3(Chunk3)、“疑问(question)”的意义候选(Meaning-candidate)标签设定在文节0(Chunk0)。
对此,意义属性抽出部15从意义属性规则记忆部22取出疑问用的意义属性规则,按照各意义属性规则的应用条件的顺序,适用于该语句的语法树。接着,在合适的时间点,意义属性抽出部15在该意义属性规则的应用效果实行规定的处理。
图21表示某意义属性规则的应用结果,在文节0(Chunk0)设定“疑问(question)”的意义属性标签的同时,在索引40也追加了此信息。
此意义属性规则的应用条件以及应用效果,例如以下所示。
[应用条件]:
Wh-adberb(pos:WRB)与Verb(Cat:V)相关。
[应用效果]:
为联结元赋予疑问的意义属性标签。
对于来自此意义属性抽出部15的输出,感性分析部16尝试了感性主题“操作性”所涉及的感性分析规则的应用,但由于不存在匹配的规则,感性属性标签(积极/消极)的设定被搁置。
为此,图21示出的是,对英文“How can I change the settings?”的最终分析结果。
实施例4
图22表示,在输入了英文“It is hard to operate.”的情况下,词素解析以及构式解析的结果。
如图所示,索引(index)40记述了:“操作性(operability)”的感性主题(Sentimental theme)标签设定在文节3(Chunk3)、“困难(difficult)”的意义候选(Meaning-candidate)标签设定在文节2(Chunk2)。
对此,意义属性抽出部15从意义属性规则记忆部22取出困难用的意义属性规则,按照各意义属性规则的应用条件的顺序,适用于该语句的语法树。接着,在合适的时间点,意义属性抽出部15在该意义属性规则的应用效果实行规定的处理。
图23表示某意义属性规则的应用结果,在文节2(Chunk2)设定了“困难(difficult)”的意义属性标签的同时,在索引40也追加了此信息。
此意义属性规则的应用条件以及应用效果,例如以下所示。
[应用条件]:
存在表示“困难”的形容词(JJ)。
[应用条件]:
在该组块赋予困难的意义属性标签。
对于来自此意义属性抽出部15的输出,感性分析部16尝试感性主题“操作性”所涉及的感性分析规则的应用。
在这里,某感性分析规则的应用条件的匹配结果,如图24所示,根据其应用效果,在文节3(Chunk3)设定“否定(Negative)”的感性属性标签的同时,在索引40也追加了此信息。
此感性分析规则的应用条件以及应用效果,例如以下所示。
[应用条件]:
(1)母Chunk存在困难(difficult)的意义属性标签。
(2)子Chunk存在To+动词(VB)。
[应用效果]:
为子Chunk赋予消极的感性属性标签。

Claims (6)

1.一种语句解析系统,其特征在于,具备:
将输入的语句以词素为单位进行分解的手段;
参照规定了特定词素与属性种类之间的对应关系的属性辞典,对符合的词素设定事前标签的事前标签设定手段;
对于将各词素之间的联结关系或者将各词素汇集起来的各文节之间的联结关系进行特定的构式解析手段;
生成记录有包含事前标签的词素或文节的特定信息与该事前标签的种类形成的组合的索引的索引生成手段;
储存了多项将至少指定包含特定种类的事前标签的词素或文节的应用条件与指定属性标签设定对象的词素或文节以及设定的属性标签的种类的应用效果组合起来所构成的判定规则的判定规则记忆手段;
参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的词素或文节设定指定种类的属性标签的判定手段。
2.如权利要求1所述的语句解析系统,其特征在于:上述属性辞典中的至少一个是规定了特定词素与意义属性的种类之间的对应关系的意义属性辞典,
通过上述事前标签设定手段,对于符合的词素设定作为事前标签的意义候选标签,
在上述索引,通过上述索引生成手段,记录下包含意义候选标签的文节的特定信息与该意义候选标签的种类形成的组合,
在上述判定规则记忆手段中,储存有至少指定包含特定种类的意义候选标签的文节的应用条件与指定意义属性标签设定对象文节以及设定的意义属性标签的种类的应用效果组合起来所构成的判定规则,
上述判定手段参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的意义属性标签。
3.如权利要求2所述的语句解析系统,其特征在于:上述属性辞典中的至少一个是规定了特定词素与感性主题的种类之间的对应关系的感性主题辞典,
通过上述事前标签设定手段,对于符合的词素设定作为事前标签的感性主题标签,
在上述索引,通过上述索引生成手段,记录下包含感性主题标签的文节的特定信息与该感性主题标签的种类形成的组合,
在上述判定规则记忆手段中,储存有指定包含特定种类的感性主题标签的文节、以及该文节或者其他文节中包含的意义属性标签的种类的应用条件、指定感性属性标签设定对象文节以及设定的感性属性标签的种类的应用效果组合起来所构成的判定规则,
上述判定手段参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的感性属性标签。
4.如权利要求1所述的语句解析系统,其特征在于:作为上述属性辞典,至少具备规定了特定词素与感性主题的种类之间的对应关系的感性主题辞典、规定了特定词素与大小表达的种类之间的对应关系的大小表达辞典,
通过上述事前标签设定手段,对于符合的词素设定作为事前标签的感性主题标签以及大小表达标签,
在上述索引,通过上述索引生成手段,记录下包含感性主题标签的文节的特定信息与该感性主题标签的种类形成的组合、包含大小表达标签的文节的特定信息与该大小表达的种类形成的组合,
在上述判定规则记忆手段中,储存有指定包含特定种类的感性主题标签的文节、以及该文节或者其他文节中包含的大小表达标签的种类的应用条件、指定感性属性标签设定对象文节以及设定的感性属性标签的种类的应用效果组合起来所构成的判定规则,
上述判定手段参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的感性属性标签。
5.如权利要求1或权利要求4中所述的语句解析系统,其特征在于:作为上述属性辞典,至少具备规定了特定词素与感性主题的种类之间的对应关系的感性主题辞典、规定了特定词素与感性表达的种类之间的对应关系的感性表达辞典,
通过上述事前标签设定手段,对于符合的词素设定作为事前标签的感性主题标签以及感性表达标签,
在上述索引,通过上述索引生成手段,记录下包含感性主题标签的文节的特定信息与该感性主题标签的种类形成的组合、包含感性表达标签的文节的特定信息与该感性表达标签的种类形成的组合,
在上述判定规则记忆手段中,储存有指定包含特定种类的感性主题标签的文节、以及该文节或者其他文节中包含的感性表达标签的种类的应用条件、指定感性属性标签设定对象文节以及设定的感性属性标签的种类的应用效果组合起来所构成的判定规则,
上述判定手段参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的文节设定指定种类的感性属性标签。
6.一种记忆介质,储存有语句解析程序,其特征在于所述语句解析程序将电脑作为以下手段发挥功能:
将输入的语句以词素为单位进行分解的手段;
参照规定了特定词素与属性种类之间的对应关系的属性辞典,对符合的词素设定事前标签的事前标签设定手段;
对于将各词素之间的联结关系或者将各词素汇集起来的文节之间的联结关系进行特定的构式解析手段;
生成记录有包含事前标签的词素或文节的特定信息与该事前标签的种类形成的组合的索引的索引生成手段;
储存了多项将至少指定包含特定种类的事前标签的词素或文节的应用条件与指定属性标签设定对象的词素或文节以及设定的属性标签的种类的应用效果组合起来所构成的判定规则的判定规则记忆手段;
参照上述索引以及上述判定规则记忆手段,在存在应用条件与该语句相匹配的判定规则的情况下,在该应用效果下,在指定的词素或文节设定指定种类的属性标签的判定手段。
CN201680084010.5A 2016-03-23 2016-03-23 语句解析系统以及程序 Active CN108885617B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/059241 WO2017163346A1 (ja) 2016-03-23 2016-03-23 文章解析システム及びプログラム

Publications (2)

Publication Number Publication Date
CN108885617A CN108885617A (zh) 2018-11-23
CN108885617B true CN108885617B (zh) 2022-05-31

Family

ID=59900062

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680084010.5A Active CN108885617B (zh) 2016-03-23 2016-03-23 语句解析系统以及程序

Country Status (4)

Country Link
US (1) US10839155B2 (zh)
JP (1) JP6675474B2 (zh)
CN (1) CN108885617B (zh)
WO (1) WO2017163346A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108280063B (zh) * 2018-01-19 2021-04-20 中国科学院软件研究所 基于半监督学习的语义分析方法及系统
CN109753651B (zh) * 2018-12-14 2022-05-17 昆明理工大学 一种针对体现用户意图的app软件用户评论挖掘方法
JP7464240B2 (ja) * 2019-04-26 2024-04-09 Necソリューションイノベータ株式会社 予測モデル生成装置、旅行適合度予測装置、予測モデル生産方法、旅行適合度予測方法、プログラム及び記録媒体
CN110349477B (zh) * 2019-07-16 2022-01-07 长沙酷得网络科技有限公司 一种基于历史学习行为的编程错误修复方法、系统及服务器
CN111177186B (zh) * 2019-12-20 2024-04-23 北京淇瑀信息科技有限公司 基于问题检索的单句意图识别方法、装置和系统
CN113254815B (zh) * 2020-02-08 2023-11-10 钉钉控股(开曼)有限公司 文档处理、页面处理方法及设备
JP2021149613A (ja) * 2020-03-19 2021-09-27 株式会社野村総合研究所 自然言語処理装置およびプログラム
US11487936B2 (en) * 2020-05-27 2022-11-01 Capital One Services, Llc System and method for electronic text analysis and contextual feedback
CN112100388B (zh) * 2020-11-18 2021-02-23 南京华苏科技有限公司 一种长文本新闻舆情的情感极性的分析方法
CN112908487B (zh) * 2021-04-19 2023-09-22 中国医学科学院医学信息研究所 一种临床指南更新内容的自动识别方法及系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5590039A (en) * 1989-10-14 1996-12-31 Canon Kabushiki Kaisha Natural language processing apparatus and method for performing processing to analyze the meaning of an input sentence entered in the form of a natural language
KR20050027298A (ko) * 2003-09-15 2005-03-21 한국전자통신연구원 규칙 기반 방식과 번역 패턴 방식을 혼합한 하이브리드자동 번역 장치 및 방법과 그 프로그램을 기록한 컴퓨터로읽을 수 있는 기록매체
CN1777888A (zh) * 2003-04-24 2006-05-24 禹蕣朝 基于移动结构概念的句子结构分析及使用其的自然语言搜索
JP2006331246A (ja) * 2005-05-30 2006-12-07 Nippon Telegr & Teleph Corp <Ntt> 意見分析処理方法、意見分析処理装置およびプログラム
CN102144229A (zh) * 2008-10-02 2011-08-03 国际商业机器公司 用于从具有文本段的文档中提取术语的系统
CN102460437A (zh) * 2009-06-26 2012-05-16 乐天株式会社 信息检索装置、信息检索方法、信息检索程序及记录了信息检索程序的记录介质
CN102866989A (zh) * 2012-08-30 2013-01-09 北京航空航天大学 基于词语依存关系的观点抽取方法
JP2013242781A (ja) * 2012-05-22 2013-12-05 Nippon Telegr & Teleph Corp <Ntt> 要望文抽出装置、方法、及びプログラム
CN103440252A (zh) * 2013-07-25 2013-12-11 北京师范大学 一种中文句子中并列信息提取方法及装置
CN103678476A (zh) * 2012-09-25 2014-03-26 株式会社东芝 文档处理装置以及文档处理方法
CN104685493A (zh) * 2012-09-27 2015-06-03 日本电气株式会社 用于监视文本信息的字典创建装置、用于监视文本信息的字典创建方法和用于监视文本信息的字典创建程序
JP2016035688A (ja) * 2014-08-04 2016-03-17 日本電気株式会社 テキスト分析装置、テキスト分析方法、テキスト分析プログラムおよび記録媒体

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03188566A (ja) * 1989-12-18 1991-08-16 Fujitsu Ltd 辞書連動テキストベース装置
US5418716A (en) * 1990-07-26 1995-05-23 Nec Corporation System for recognizing sentence patterns and a system for recognizing sentence patterns and grammatical cases
JP3009215B2 (ja) * 1990-11-30 2000-02-14 株式会社日立製作所 自然語処理方法および自然語処理システム
JP2765665B2 (ja) * 1991-08-01 1998-06-18 富士通株式会社 タイポグラフィカル情報付き文書の翻訳装置
US5774845A (en) * 1993-09-17 1998-06-30 Nec Corporation Information extraction processor
JP3738011B2 (ja) 2001-11-20 2006-01-25 株式会社ジャストシステム 情報処理装置、情報処理方法、及び情報処理プログラム
US20050256715A1 (en) * 2002-10-08 2005-11-17 Yoshiyuki Okimoto Language model generation and accumulation device, speech recognition device, language model creation method, and speech recognition method
WO2005010789A1 (ja) * 2003-07-24 2005-02-03 Csk Corporation 能力評価装置、能力評価方法および能力評価プログラム
JP4033088B2 (ja) 2003-09-11 2008-01-16 富士ゼロックス株式会社 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4654745B2 (ja) * 2005-04-13 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2007287134A (ja) * 2006-03-20 2007-11-01 Ricoh Co Ltd 情報抽出装置、及び情報抽出方法
JP2008287406A (ja) * 2007-05-16 2008-11-27 Sony Corp 情報処理装置および情報処理方法、プログラム、並びに、記録媒体
JP4359787B2 (ja) * 2007-07-02 2009-11-04 ソニー株式会社 情報処理装置、コンテンツの評判検索方法およびコンテンツの評判検索システム
JP5445787B2 (ja) * 2008-03-06 2014-03-19 日本電気株式会社 属性抽出方法、システム及びプログラム
KR101042515B1 (ko) * 2008-12-11 2011-06-17 주식회사 네오패드 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법
US8762131B1 (en) * 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates
JP2012003572A (ja) * 2010-06-18 2012-01-05 Nomura Research Institute Ltd 感性分析システム及びプログラム
KR101364321B1 (ko) * 2010-12-17 2014-02-18 라쿠텐 인코포레이티드 자연 언어 처리 장치, 방법 및 프로그램
KR20140078312A (ko) * 2012-12-17 2014-06-25 한국전자통신연구원 텍스트 기반 감성 분석 결과를 제공하기 위한 장치, 시스템 및 그 방법
US10339223B2 (en) * 2014-09-05 2019-07-02 Nec Corporation Text processing system, text processing method and storage medium storing computer program
US9767193B2 (en) * 2015-03-27 2017-09-19 Fujitsu Limited Generation apparatus and method
JP7139728B2 (ja) * 2018-06-29 2022-09-21 富士通株式会社 分類方法、装置、及びプログラム

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5590039A (en) * 1989-10-14 1996-12-31 Canon Kabushiki Kaisha Natural language processing apparatus and method for performing processing to analyze the meaning of an input sentence entered in the form of a natural language
CN1777888A (zh) * 2003-04-24 2006-05-24 禹蕣朝 基于移动结构概念的句子结构分析及使用其的自然语言搜索
KR20050027298A (ko) * 2003-09-15 2005-03-21 한국전자통신연구원 규칙 기반 방식과 번역 패턴 방식을 혼합한 하이브리드자동 번역 장치 및 방법과 그 프로그램을 기록한 컴퓨터로읽을 수 있는 기록매체
JP2006331246A (ja) * 2005-05-30 2006-12-07 Nippon Telegr & Teleph Corp <Ntt> 意見分析処理方法、意見分析処理装置およびプログラム
CN102144229A (zh) * 2008-10-02 2011-08-03 国际商业机器公司 用于从具有文本段的文档中提取术语的系统
CN102460437A (zh) * 2009-06-26 2012-05-16 乐天株式会社 信息检索装置、信息检索方法、信息检索程序及记录了信息检索程序的记录介质
JP2013242781A (ja) * 2012-05-22 2013-12-05 Nippon Telegr & Teleph Corp <Ntt> 要望文抽出装置、方法、及びプログラム
CN102866989A (zh) * 2012-08-30 2013-01-09 北京航空航天大学 基于词语依存关系的观点抽取方法
CN103678476A (zh) * 2012-09-25 2014-03-26 株式会社东芝 文档处理装置以及文档处理方法
CN104685493A (zh) * 2012-09-27 2015-06-03 日本电气株式会社 用于监视文本信息的字典创建装置、用于监视文本信息的字典创建方法和用于监视文本信息的字典创建程序
CN103440252A (zh) * 2013-07-25 2013-12-11 北京师范大学 一种中文句子中并列信息提取方法及装置
JP2016035688A (ja) * 2014-08-04 2016-03-17 日本電気株式会社 テキスト分析装置、テキスト分析方法、テキスト分析プログラムおよび記録媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Feature assembly method for extracting relations in Chinese;Yanping Chen 等;《Artificial Intelligence》;20151130;179-194 *
基于依存树到串模型的日汉统计机器翻译研究;吴培昊;《中国优秀硕士学位论文全文数据库 信息科技辑》;20151015;I138-578 *

Also Published As

Publication number Publication date
JPWO2017163346A1 (ja) 2018-11-22
US10839155B2 (en) 2020-11-17
US20190026264A1 (en) 2019-01-24
JP6675474B2 (ja) 2020-04-01
CN108885617A (zh) 2018-11-23
WO2017163346A1 (ja) 2017-09-28

Similar Documents

Publication Publication Date Title
CN108885617B (zh) 语句解析系统以及程序
KR101136007B1 (ko) 문서 감성 분석 시스템 및 그 방법
RU2011122784A (ru) Способ семантической обработки естественного языка с использованием графического языка-посредника
Sawalha Open-source resources and standards for Arabic word structure analysis: Fine grained morphological analysis of Arabic text corpora
KR102188739B1 (ko) 감정 온톨로지에 기반을 둔 이모티콘 추천 장치 및 방법
EP3401796A1 (en) Fault-tolerant information extraction
Sawalha et al. A standard tag set expounding traditional morphological features for Arabic language part-of-speech tagging
Xu et al. RIP emojis and words to contextualize mourning on Twitter
JP2013190985A (ja) 知識応答システム、方法およびコンピュータプログラム
JP4007413B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP4033011B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Wilson Toward automatic processing of English metalanguage
Seresangtakul et al. Thai-Isarn dialect parallel corpus construction for machine translation
Hodeghatta et al. Introduction to natural language processing
Oudah et al. Studying the impact of language-independent and language-specific features on hybrid Arabic Person name recognition
Gleßgen et al. Resources and tools for analyzing Old French texts
Jędrzejec et al. Automatically conducted learning from textually expressed vacationers’ opinions
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Mekki et al. TTK: A toolkit for Tunisian linguistic analysis
Wang et al. Cyrillic mongolian named entity recognition with rich features
Jadoulle L1 novice writing as a missing piece in the Learner Corpus Research puzzle: The case of hedging
Totade et al. Natural Language Processing (NLP): A Review
Rennes Improved Automatic Text Simplification by Manual Training
Amezian et al. Towards a large Biscript Moroccan Lexicon
Bumbulienė et al. RNNs for Lithuanian Multiword Expressions Identification.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant