CN112800760A - 权利要求书的元件名词及元件名词所属位置自动得出设备 - Google Patents

权利要求书的元件名词及元件名词所属位置自动得出设备 Download PDF

Info

Publication number
CN112800760A
CN112800760A CN202010207905.1A CN202010207905A CN112800760A CN 112800760 A CN112800760 A CN 112800760A CN 202010207905 A CN202010207905 A CN 202010207905A CN 112800760 A CN112800760 A CN 112800760A
Authority
CN
China
Prior art keywords
character
deletable
characters
excluded
basic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010207905.1A
Other languages
English (en)
Inventor
林志青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Integral Search International Ltd
Original Assignee
Integral Search International Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Integral Search International Ltd filed Critical Integral Search International Ltd
Publication of CN112800760A publication Critical patent/CN112800760A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种对于无字间空格语言文字权利要求书的元件名词及元件名词所属位置自动得出设备,其中,包括:基本排除文字纪录排除装置、可删文字纪录排除装置、单个文字纪录排除装置以及进阶排除文字纪录排除装置;无字间空格语言文字权利要求书文字C‑Text中经排除基本排除文字后的连续文字作为基本排除文字连续文字,该基本排除文字排除连续文字中经排除可删文字后的连续文字作为可删文字删去连续文字,经排除单个文字后的可删文字删去连续文字作为初步元件名词,该初步元件名词中经排除进阶排除文字后的连续文字作为该得出的元件名词。

Description

权利要求书的元件名词及元件名词所属位置自动得出设备
技术领域
本发明涉及一种元件名词及元件名词所属位置的自动得出设备,特别是涉及一种对于无字间空格语言文字权利要求书的元件名词及元件名词所属位置自动得出设备。
背景技术
专利说明书有其复杂性而并不容易阅读。通过人工智能辨识出专利权利要求中的元件名词为人工智能专利助读系统的基础。所谓元件名词,是指专利权利要求中构成元件的定义字,该元件名词并不只是名词,而是以名词字为最终字,而由包含形容词、动词、副词或名词所构成的定义字,例如,“接收天线”、“信号发送机构”等。通过得出专利权利要求的元件名词,可得出该元件名词的所属位置,因此而可更明确得出对应于该元件名词的动作特征、连接关系或位置关系的对应位置,以明确协助专利阅读者更了解该专利权利要求的技术特征。
然而,对于无字间空格语言文字,例如亚洲语言,包含中文、日文或韩文,由于字与字之间并无空格,因此相较于英文,该无字间空格语言文字较难辨识出字与字之间的组合,因此较难得出各种组合后的字词。在此困难下,难以实现自然语言的词性分析。虽然有人提出建立元件名词词库的设备,以词性进行元件名词的辨识,但是专利权利要求的元件名词有各种可能的变化,无法建立如此庞大数量的元件名词数据库,常常存在对动词、名词、形容词、副词等的误判。再者,即使可建立出此庞大数量的元件名词词库,进行如此巨大数据库的数据比对装置将非常费时,因此难以实施。
因此,关于如何以高效率、正确地自动得出权利要求书的元件名词;即如何以不需建立元件名词数据库的方式且不以词性进行元件名词的判断,而是根据专利权利要求的撰写格式以及特性,在不需花费庞大系统计算及储存资源的情况下,有效率的得出数量最多、准确度最高、得出速度最快的设备,成为一个课题。
发明内容
本发明的目的即在提供一种对于无字间空格语言文字权利要求书的元件名词及元件名词所属位置自动得出设备,不需建立元件名词数据库的方式且不以词性进行元件名词的判断,以不可能为元件名词的文字位置逐步排除的方式而最终得出元件名词,如此可有效率的得出数量最多、准确度最高、得出速度最快的权利要求书的元件名词及元件名词所属位置。
本发明为解决现有技术的问题所采用的技术手段为提供一种对于无字间空格语言文字权利要求书的元件名词及元件名词所属位置自动得出设备,其主要特点是,是对于以无字间空格语言文字构成的无字间空格语言文字权利要求书予以自动得出权利要求书的各个所得出元件名词及所得出元件名词所属位置,该元件名词及元件名词所属位置自动得出设备包含:基本排除文字纪录排除装置,自动读取该无字间空格语言文字权利要求书文字C-Text,并根据基本排除文字库中的数个基本排除文字而自该无字间空格语言文字权利要求书文字C-Text中将该基本排除文字予以记录为排除,而使该无字间空格语言文字权利要求书文字C-Text中经排除该基本排除文字后的连续文字作为基本排除文字连续文字;可删文字纪录排除装置,为自动读取多数个该基本排除文字连续文字,并根据可删文字删去规则而自各个该基本排除文字连续文字中将可删文字予以记录为排除,该可删文字删去规则为自基本排除文字连续文字中将该可删文字删去规则定义的特定排除文字予以作为该可删文字而予以记录为排除且/或将该特定排除文字的相邻文字或相邻连续文字予以作为该可删文字而予以记录为排除,而使该基本排除文字排除连续文字中经排除该可删文字后的连续文字作为可删文字删去连续文字;单个文字纪录排除装置,为自动读取多数个该可删文字删去连续文字,并将仅具有单个文字的可删文字删去连续文字予以记录为排除,使经排除该单个文字后的可删文字删去连续文字作为初步元件名词;以及进阶排除文字纪录排除装置,为自动读取多数个该初步元件名词,并根据进阶排除文字库中的数个进阶排除文字而自各个该初步元件名词中将该进阶排除文字予以记录为排除,而使该初步元件名词中经排除该进阶排除文字后的连续文字作为该所得出元件名词。
在本发明的一实施例中提供一种所述的元件名词及元件名词所属位置自动得出设备,其中该可删文字纪录排除装置还包括首部文字记录排除装置,该首部文字记录排除装置为自动读取多数个该基本排除文字连续文字,并根据首部删去规则定义的可删识别文字,以判断各个该基本排除文字连续文字的起始文字或起始连续文字是否具有该可删识别文字并予以作为对应可删识别文字,以将该对应可删识别文字和/或该对应可删识别文字之后的指定字数文字予以作为首部删去文字而记录为排除、或判断各个该基本排除文字连续文字的起始文字的相邻前文字或相邻前连续文字是否具有该可删识别文字并予以作为对应可删识别文字以将该起始文字之后的指定字数文字予以作为首部删去文字而记录为排除,由此使该基本排除文字排除连续文字中经排除该首部删去文字后的连续文字作为该可删文字删去连续文字。
在本发明的一实施例中提供一种所述的元件名词及元件名词所属位置自动得出设备,其中该可删文字纪录排除装置还包括尾部文字记录排除装置,该尾部文字记录排除装置自动读取多数个该基本排除文字连续文字,并根据尾部删去规则所定义之一可删识别文字,以判断各个该基本排除文字连续文字的最终文字或最终连续文字是否具有该可删识别文字并予以作为对应可删识别文字以将该对应可删识别文字和/或该对应可删识别文字之前的指定字数文字予以作为尾部删去文字而记录为排除、或判断各个该基本排除文字连续文字的最终文字的相邻后文字或相邻后连续文字是否具有该可删识别文字并予以作为对应可删识别文字以将该最终文字之前的指定字数文字予以作为尾部删去文字而记录为排除,由此而使该基本排除文字排除连续文字中经排除该首部删去文字后的连续文字作为该可删文字删去连续文字。
在本发明的一实施例中提供一种所述的元件名词及元件名词所属位置自动得出设备,该进阶排除文字纪录排除装置还包括细部元件名词得出装置,该细部元件名词得出装置将为与“一”后相邻的该所得出元件名词与为与“该”后相邻的该所得出元件名词比对,当比对吻合时,则确定与“该”后相邻的该所得出元件名词为细部元件名词而作为该所得出元件名词。
在本发明的一实施例中提供一种所述的元件名词及元件名词所属位置自动得出设备,根据各个所得出元件名词、各个所得出元件名词的所得出元件名词所属位置、标点符号及换行符号得出该无字间空格语言文字权利要求书的架构。
本发明为解决现有技术的问题所采用的另一技术手段涉及一种对于无字间空格语言文字权利要求书文字C-Text的元件名词及元件名词所属位置自动得出设备,其主要特征是,是对于以无字间空格语言文字构成的无字间空格语言文字权利要求书文字C-Text予以自动得出所得出元件名词及所得出元件名词所属位置,该元件名词及元件名词所属位置自动得出设备包含:元件对照表元件名词记录排除装置,该元件对照表元件名词记录排除装置为自动读取该无字间空格语言文字权利要求书文字C-Text,并根据元件名词对照表中的元件对照表元件名词,自该无字间空格语言文字权利要求书文字C-Text中将该元件对照表元件名词予以记录为排除,使该无字间空格语言文字权利要求书文字C-Text中经排除该元件对照表元件名词后的连续文字作为元件对照表元件名词排除连续文字;基本排除文字记录排除装置,为自动读取该元件对照表元件名词排除连续文字,并根据基本排除文字库中的数个基本排除文字,自该元件对照表元件名词排除连续文字中将该基本排除文字予以记录为排除,使该元件对照表元件名词排除连续文字中经排除该基本排除文字后的连续文字作为基本排除文字连续文字;可删文字记录排除装置,自动读取多数个该基本排除文字连续文字,并根据可删文字删去规则,自各个该基本排除文字连续文字中将可删文字予以记录为排除,该可删文字删去规则为自基本排除文字连续文字中将该可删文字删去规则定义的特定排除文字予以作为该可删文字,并予以记录为排除且/或将该特定排除文字的相邻文字或相邻连续文字予以作为该可删文字而予以记录为排除,使该基本排除文字排除连续文字中经排除该可删文字后的连续文字作为可删文字删去连续文字;单个文字记录排除装置,自动读取多数个该可删文字删去连续文字,并将仅具有单个文字的可删文字删去连续文字予以记录为排除,使经排除该单个文字后的可删文字删去连续文字作为初步元件名词;以及进阶排除文字记录排除装置,自动读取多数个该初步元件名词,并根据进阶排除文字库中的数个进阶排除文字,从各个该初步元件名词中将该进阶排除文字予以记录为排除,使该初步元件名词中经排除该进阶排除文字后的连续文字作为该所得出元件名词。
在本发明的另一实施例中提供另一种所述的元件名词及元件名词所属位置自动得出设备,该可删文字纪录排除装置还包括首部文字记录排除装置,该首部文字记录排除装置为自动读取多数个该基本排除文字连续文字,并根据首部删去规则定义的可删识别文字,以判断各个该基本排除文字连续文字的起始文字或起始连续文字是否具有该可删识别文字并予以作为对应可删识别文字以将该对应可删识别文字和/或该对应可删识别文字之后的指定字数文字予以作为首部删去文字而记录为排除、或判断各个该基本排除文字连续文字的起始文字的相邻前文字或相邻前连续文字是否具有该可删识别文字并予以作为对应可删识别文字以将该起始文字之后的指定字数文字予以作为首部删去文字而记录为排除,由此而使该基本排除文字排除连续文字中经排除该首部删去文字后的连续文字作为该可删文字删去连续文字。
在本发明的另一实施例中提供另一种所述的元件名词及元件名词所属位置自动得出设备,该可删文字纪录排除装置还包括尾部文字记录排除装置,该尾部文字记录排除装置自动读取多数个该基本排除文字连续文字,并根据尾部删去规则定义可删识别文字,以判断各个该基本排除文字连续文字的最终文字或最终连续文字是否具有该可删识别文字并予以作为对应可删识别文字以将该对应可删识别文字和/或该对应可删识别文字之前的指定字数文字予以作为尾部删去文字而记录为排除、或判断各个该基本排除文字连续文字的最终文字的相邻后文字或相邻后连续文字是否具有该可删识别文字并予以作为对应可删识别文字以将该最终文字之前的指定字数文字予以作为尾部删去文字而记录为排除,由此使该基本排除文字排除连续文字中经排除该尾部删去文字后的连续文字作为该可删文字删去连续文字。
在本发明的另一实施例中提供另一种所述的元件名词及元件名词所属位置自动得出设备,该进阶排除文字纪录排除装置还包括细部元件名词得出装置,该细部元件名词得出装置将为与“一”后相邻的该所得出元件名词与为与“该”后相邻的该所得出元件名词比对,当比对吻合时,则确定与“该”后相邻的该所得出元件名词为细部元件名词作为该所得出元件名词。
在本发明的另一实施例中为涉及另一种所述的元件名词及元件名词所属位置自动得出设备,根据各个所得出元件名词、各个所得出元件名词之所得出元件名词所属位置、标点符号及换行符号而得出该无字间空格语言文字权利要求书的架构。
采用本发明的对于无字间空格语言文字权利要求书的元件名词及元件名词所属位置自动得出设备,可对于权利要求书的元件名词及元件名词所属位置之自动得出,不需建立元件名词数据库的方式且不以词性进行元件名词的判断,而根据专利权利要求的撰写格式以及特性,以不可能为元件名词的文字位置逐步排除的方式最终得出元件名词,如此在不需花费庞大系统计算及储存资源的情况下,提供可有效率的得出数量多、准确度高、提供速度快的权利要求书的元件名词及元件名词所属位置的自动得出设备。
附图说明
图1为显示根据本发明的对于无字间空格语言文字权利要求书的元件名词及元件名词所属位置自动得出设备的一实施例的架构方块示意图。
图2为显示当基本排除文字连续文字的起始文字或起始连续文字具有该可删识别文字则将可删识别文字予以作为该对应可删识别文字的示意图。
图2b为显示当基本排除文字连续文字的起始文字或起始连续文字具有可删识别文字则将可删识别文字予以作为该对应可删识别文字的另一示意图。
图2c为显示判断各个基本排除文字连续文字的起始文字的相邻前文字或相邻前连续文字是否具有可删识别文字并予以作为一对应可删识别文字的示意图。
图3a为显示当基本排除文字连续文字的尾部文字或尾部连续文字具有可删识别文字则将可删识别文字予以作为对应可删识别文字的示意图。
图3b为显示当基本排除文字连续文字的最终文字或最终连续文字具有可删识别文字则将可删识别文字予以作为对应可删识别文字的示意图。
图3c为显示判断各个基本排除文字连续文字的最终文字的相邻前文字或相邻前连续文字是否具有可删识别文字并予以作为对应可删识别文字的示意图。
图4为显示根据本发明的对于无字间空格语言文字权利要求书的元件名词及元件名词所属位置自动得出设备的另一实施例的架构方块示意图。
附图标记
P 元件名词及元件名词所属位置自动得出设备
1A 元件对照表元件名词记录排除装置
1 基本排除文字记录排除装置
11 基本排除文字库
2 可删文字纪录排除装置
21 首部文字删去装置
22 对应前相邻字判断装置
3 单个文字纪录排除装置
4 进阶排除文字纪录排除装置
42 第二细部元件名词得出装置
B 基本排除文字
B-Text 基本排除文字连续文字
SD 特定排除文字
具体实施方式
以下根据图1至图4,说明本发明的实施方式。该说明并非为限制本发明的实施方式,而为本发明的实施例的一种。
如图1至图3c所示,该元件名词及元件名词所属位置自动得出设备P为对于以一无字间空格语言文字所构成的无字间空格语言文字权利要求书C-Text予以自动得出其具有的所得出元件名词EM及所得出元件名词所属位置EP,该元件名词及元件名词所属位置自动得出设备P包含:基本排除文字纪录排除装置1,自动读取该无字间空格语言文字权利要求书文字C-Text,并根据一基本排除文字库11中的数个基本排除文字B而自该无字间空格语言文字权利要求书文字C-Text中将该基本排除文字B予以记录为排除,使该无字间空格语言文字权利要求书文字C-Text中经排除该基本排除文字B后的连续文字作为一基本排除文字连续文字B-Text。
此处的无字间空格语言文字包含:中文、日文或韩文。但本发明并不限于此。
详细而言,在该基本排除文字纪录排除装置1中,该基本排除文字库11的基本排除文字B,可包含:“,”;“;”;“:”;“。”;“一”;“该”;“与”;“及”;“且”;“于”;“并”;“至”;“而”;“在”;“中”;“其”;“系”;“之”;“的”;“个”;“从”;“也”;“只”;“和”;“则”;“内,”;“中,”;“下,”;“处,”;“内;”;“中;”;“下;”;“处;”;“内。”;“中。”;“下。”;“处。”;“中之”;“下之”;“内之”;“处之”;“之间”;“时,”;“藉由”;“藉以”;“用以”;“用来”;“作为”;“涉及”;“根据”;“依据”;“包含”;“包括”;“其中”;“来自”;“用于”;“沿着”;“至少”;“具有”;“提供”;“以及”;“至少”;“一种”;“一个”;“复数”;“多个”;“每个”;“下述”;“大于”;“小于”;“等于”;“所述”;“特征”;“上述”;“进行”;“较大”;“较小”;“相同”;“之间,”;“不大于”;“不小于”;“不等于”;“且/或”;“及/或”;“一位于”;“相关的”;“相关的”;“之间的”;“之间的”;“形成在”;“接收到”;“经配置”;“用于提供”;“相关联的”;“特征在于”;“其特征在于”等文字。且该排除方式为:先排除字数较多的基本排除文字,再排除字数较少的基本排除文字。例如,先执行五个字的“其特征在于”基本排除文字,再依序四个字的“用于提供”、“相关联的”、“特征在于”,再执行三个字的“之间,”、“不大于”、“不小于”、“不等于”、“且/或”、“及/或”、“一位于”、“相关的”、“相关的”、“之间的”、“之间的”、「形成在”、“直接将”、“不需要”、“接收到”、“经配置”,之后再依序执行二个字,最后再执行一个字的基本排除文字。举例来说,无字间空格语言文字权利要求书C-Text如下:
一种缓冲元件,包含:多层材料,包含隔离层、被设置成与该隔离层邻接的聚合材料层,及被设置成与该隔离层邻接且与其对立的稳定层;多个柱状物,其被设置于该多层材料内,每个该多个柱状物包含厚度,上表面及侧壁,该侧壁为从该上表面并底切该上表面以形成位于该上表面和该侧壁之间的半径化的上缘;多个间隔物区域,其被设置于该多个柱状物之间,每个该多个间隔物区域包含间隔物区域厚度;其中该柱状物厚度大于该间隔物区域厚度。
经该基本排除文字纪录排除装置1执行后而为如下(含有下划线的文字为该基本排除文字B):
一种缓冲元件,包含:一多层材料,包含一隔离层、一被设置成与该隔离层邻接的聚合材料层,及一被设置成该隔离层邻接且与其对立稳定层;多个柱状物,其被设置该多层材料内,每个该多个柱状物包含一厚度,一上表面及侧壁该侧壁为从该上表面底切上表面形成一位于该上表面和该侧壁之间的半径化的上缘;多个间隔物区域其被设置于该多个柱状物之间,每个该多个间隔物区域包含一间隔物区域厚度;其中该柱状物厚度大于该间隔物区域厚度。
本发明为通过将不可能为元件名词的字词予以排除,逐步得出可能的元件名词,上述将该基本排除文字B予以排除即为将不可能为元件名词的字词予以排除的第一步,在本发明的其他装置中为继续对于不可能为元件名词的字词予以记录记录为排除。通过该基本排除文字纪录排除装置1对于该无字间空格语言文字权利要求书文字C-Text予以排除数个该基本排除文字B之后所得的结果为数个基本排除文字连续文字B-Text,也就是说通过数个该基本排除文字B之分隔而得出未被分隔的连续文字,而每组连续文字称为一组基本排除文字连续文字B-Text,因此而得出多组基本排除文字连续文字B-Text。以上述例子为例,得出如下的数个基本排除文字连续文字B-Text(亦即,不具有下划线的各别连续文字):“缓冲元件”、“多层材料”、“隔离层”、“被设置成”、“隔离层邻接”、“聚合材料层”、“被设置成”、“隔离层邻接”、“对立”、“稳定层”、“柱状物”、“被设置“、”该多层材料”、“柱状物”、“厚度”、”上表面”、“侧壁”、“侧壁”、“上表面”、“底切”、“上表面”、“形成”、“上表面”、“侧壁”、“半径化”、“上缘”、“间隔物区域”、“被设置”、“柱状物”、“间隔物区域”、“间隔物区域厚度”、“柱状物厚度”、“间隔物区域厚度”。
在本发明的一实施例中,为将该基本排除文字B给定特定标示元(例如,BD(Basicdeleting words))作为该基本排除文字的识别。例如,当该基本排除文字B的该特定标示元为BW,则将被识别出的该基本排除文字予以记录为具有“BW”的特定标示元。此外,并可标记该特定标示字在该无字间空格语言文字权利要求书的起始位置及结束位置,例如,“一种”这个基本排除文字的起始位置为0,结束位置为1。并将该特定标示元、该基本排除文字的内容、该特定标示字的起始位置及结束位置予以记录于内存中,例如记录为(BW,“一种”0,1)。但本发明并不限于上述方式,只要可明确标示该无字间空格语言文字权利要求书中的该基本排除文字及该基本排除文字连续文字的相互之间的位置关系、以及该基本排除文字及该基本排除文字连续文字的内容即可。
接着,说明与该基本排除文字纪录排除装置1连接的可删文字纪录排除装置2。该可删文字纪录排除装置2为自动读取数个该基本排除文字连续文字B-Text,并根据可删文字删去规则DR(Deletion Rule)自各个该基本排除文字连续文字B-Text中将可删文字D予以记录为排除,该可删文字删去规则DR为自基本排除文字连续文字B-Text中将该可删文字删去规则DR定义的特定排除文字SD予以作为该可删文字D而予以记录为排除且/或将该特定排除文字SD的相邻文字或相邻连续文字予以作为该可删文字D而予以记录为排除,使该基本排除文字排除连续文字B-Text中经排除该可删文字D后的连续文字作为可删文字删去连续文字D-Text。
即,如图2a、图2b、图2c、图3a、图3b及图3c所示(所记录为排除的文字以“XX”表示,经找到的该特定排除文字SD以圆圈表示),该可删文字删去规则DR为寻找该基本排除文字连续文字B-Text中是否具有该特定排除文字SD(如图2a、图2b、图3a及图3b所示)、或是在相邻于该基本排除文字连续文字B-Text的该基本排除文字B中是否具有该特定排除文字SD(如图2c及图3c所示),如果在该基本排除文字连续文字B-Text中具有该特定排除文字SD的话(如图2a、图2b、图3a及图3b所示),则将该基本排除文字连续文字B-Text中的该特定排除文字SD予以记录为排除(如图2a及图3a所示),或是将该特定排除文字SD连同该特定排除文字SD的相邻文字或相邻连续文字予以作为该可删文字D予以记录为排除(如图2b及图3b所示)。此外,如果在该基本排除文字B中具有该特定排除文字SD(如图2c及图3c所示),则将该基本排除文字连续文字B-Text的首部或尾部的特定字数的文字或连续文字予以作为该可删文字D,予以记录为排除。详细来说,该特定排除文字SD为存在于该基本排除文字连续文字B-Text之中,或是存在于该基本排除文字连续文字B-Text的相邻之外。所谓“存在于该基本排除文字连续文字B-Text的相邻之外的特定排除文字SD”是指:该特定排除文字SD并不存在于该基本排除文字连续文字B-Text之中,而是存在于该基本排除文字连续文字B-Text的前相邻基本排除文字B的尾部或后相邻基本排除文字B的首部中。进一步而言,本发明的该可删文字纪录排除装置2除了对于该基本排除文字连续文字B-Text找出该特定排除文字SD之外,并可找出该基本排除文字连续文字B-Text的前相邻基本排除文字B的尾部文字、后相邻基本排除文字B的尾部文字、前相邻基本排除文字B的尾部连续文字、或后相邻基本排除文字B的尾部连续文字是否为该特定排除文字SD,如果是的话,则将该基本排除文字连续文字B-Text的首部文字、尾部文字、首部连续文字、或尾部连续文字予以取出作为该可删文字D,予以记录排除。
以“被设置成该隔离层邻接聚合材料层”中的“被设置成”片段为例,其中“一”及“与”为该基本排除文字B,而“被设置成”为该基本排除文字连续文字B-Text。当该可删文字删去规则DR中“被设置”被指定为该特定排除文字SD,也就是,该特定排除文字SD为存在于该基本排除文字连续文字B-Text之中,因此,将该特定排除文字SD“被设置”予以作为该可删文字,将该可删文“被设置”予以自该基本排除文字连续文字“被设置成”中予以记录排除,形成经排除“被设置”的可删文字删去连续文字“成”。这为图2a的例子。
以“天线耦接于该隔离层信号发送器”中的“天线耦接”片段为例,其中“将”及“于”为该基本排除文字B,而“天线耦接”为该基本排除文字连续文字B-Text。当该可删文字删去规则DR中“于”被指定为该特定排除文字SD,也就是,该特定排除文字SD为存在于该基本排除文字连续文字B-Text「天线耦接”的外部(尾部)相邻基本排除文字B处(此处,“于”已经在该基本排除文字纪录排除装置1中被记录排除,作为该基本排除文字B),且由该可删文字删去规则DR规定为“将在该基本排除文字连续文字的尾部邻接字“于”的前二字予以记录排除”的规则,因此将“于”之前的位在该基本排除文字连续文字B-Text的尾部二字“耦接”予以自该基本排除文字连续文字B-Text中予以记录排除,而得出“将天线(耦接)于”,其中刮号中为该可删文字纪录排除装置2所记录排除部分(亦即,为该可删文字D),因此,而得出该可删文字删去连续文字D-Text“天线”。这为图3c的例子。
具体而言,本发明的该可删文字纪录排除装置2进一步具有首部文字记录排除装置21(亦即,如图2a、图2b及图2c所示),该首部文字记录排除装置21为自动读取数个该基本排除文字连续文字B-Text,并根据首部删去规则HR定义的可删识别文字IW(Identifyingword),判断各个该基本排除文字连续文字B-Text的起始文字或起始连续文字是否具有该可删识别文字IW并予以作为对应可删识别文字Found-IW以将该对应可删识别文字Found-IW和/或该对应可删识别文字Found-IW之后的指定字数文字予以作为一首部删去文字HD而记录为排除、或判断各个该基本排除文字连续文字B-Text的起始文字的相邻前文字或相邻前连续文字是否具有该可删识别文字IW并予以作为对应可删识别文字Found-IW以将该起始文字之后的指定字数文字予以作为首部删去文字HD而记录为排除,由此使该基本排除文字排除连续文字B-Text中经排除该首部删去文字HD后的连续文字作为该可删文字删去连续文字D-Text。
该可删文字纪录排除装置2进一步具有尾部文字记录排除装置22如图3a、图3b、图3c,该尾部文字记录排除装置22为自动读取数个该基本排除文字连续文字B-Text,并根据尾部删去规则TR所定义的可删识别文字IW,判断各个该基本排除文字连续文字B-Text的最终文字或最终连续文字是否具有该可删识别文字IW并予以作为对应可删识别文字Found-IW以将该对应可删识别文字Found-IW和/或该对应可删识别文字Found-IW之前的指定字数文字予以作为尾部删去文字TD而记录为排除、或判断各个该基本排除文字连续文字B-Text的最终文字的相邻后文字或相邻后连续文字是否具有该可删识别文字IW并予以作为对应可删识别文字Found-IW以将该最终文字之前的指定字数文字予以作为尾部删去文字TD而记录为排除,由此使该基本排除文字排除连续文字B-Text中经排除该尾部删去文字TD后的连续文字作为该可删文字删去连续文字D-Text。
以下说明该首部文字记录排除装置21的一实施例。该首部删去规则HR,如图2a、图2b及图2c所示。
在图2a中,是指当该基本排除文字连续文字B-Text的起始文字或起始连续文字具有该可删识别文字IW,则将可删识别文字IW予以作为该对应可删识别文字Found-IW,以将该对应可删识别文字Found-IW予以作为一首部删去文字HD记录为排除。例如,当该首部文字记录排除装置21的该首部删去规则HR定义的可删识别文字IW(Identifying word)为:“被设置”、“或”;“被”;“随”;“为”;“将”;“给”(以字数多先执行),则将该些可删识别文字IW自该基本排除文字连续文字B-Text的起始处予以记录为排除。
在图2b中,是指当该基本排除文字连续文字B-Text的起始文字或起始连续文字具有该可删识别文字IW,则将可删识别文字IW予以作为该对应可删识别文字Found-IW,以将该对应可删识别文字Found-IW以及该对应可删识别文字Found-IW之后的指定字数文字予以作为一首部删去文字HD而记录为排除。例如,当该可删识别文字IW为:“分别”;“当前”;“将经”;“使经”;“该经”;“且经”;“用以”;“用来”;“用于”;“得到”;“设置”;“配置”;“以上”;“以内”;“利用”;“处于”;“~在”;“~地~”;“未被~”;“可~”(以字数多先执行),则将该些文字暨该些文字之后两个文字予以记录为排除。
在图2c中,是判断各个该基本排除文字连续文字B-Text的起始文字的相邻前文字或相邻前连续文字(存在于相邻前基本排除文字B中)是否具有该可删识别文字IW并予以作为一对应可删识别文字Found-IW以将该起始文字之后的指定字数文字予以作为一首部删去文字HD而记录为排除,由此使该基本排除文字排除连续文字B-Text中经排除该首部删去文字HD后的连续文字作为该可删文字删去连续文字D-Text。例如,当该基本排除文字连续文字B-Text的相邻的前一个文字或相邻前连续文字(此些文字及连续文字已经被纪录为排除)为:用以、用以、用来、用于、彼此等可删识别文字IW,则将该基本排除文字连续文字B-Text的起始处后两个文字予以记录为排除。
以下说明该尾部文字记录排除装置22的一实施例。该尾部删去规则TR,如图3a、图3b及图3c所示。
在图3a,为指当该基本排除文字连续文字B-Text的尾部文字或尾部连续文字具有该可删识别文字IW,则将可删识别文字IW予以作为该对应可删识别文字Found-IW,以将该对应可删识别文字Found-IW予以作为一尾部删去文字TD而记录为排除。例如,当该尾部文字记录排除装置21的该尾部删去规则TR定义的可删识别文字IW(Identifying word)为:或、成、于、时、来、有、者、对应、相关、连同、之间、邻接、“元件名词+两个字”(以字数多先执行),则将该些可删识别文字IW自该基本排除文字连续文字B-Text的尾部处予以记录为排除。
在图3b中,为指当该基本排除文字连续文字B-Text的最终文字或最终连续文字具有该可删识别文字IW,则将可删识别文字IW予以作为该对应可删识别文字Found-IW,以将该对应可删识别文字Found-IW以及该对应可删识别文字Found-IW之前的指定字数文字予以作为尾部删去文字TD而记录为排除。例如,当该可删识别文字IW为:给、到(以字数多先执行)、为,则将该些文字暨该些文字之前两个文字予以记录为排除。
在图3c中,为判断各个该基本排除文字连续文字B-Text的最终文字的相邻后文字或相邻后连续文字(存在于相邻后基本排除文字B中)是否具有该可删识别文字IW并予以作为一对应可删识别文字Found-IW以将该最终文字之前的指定字数文字予以作为尾部删去文字TD而记录为排除,由此使该基本排除文字排除连续文字B-Text中经排除该尾部删去文字TD后的连续文字作为该可删文字删去连续文字D-Text。例如,当该基本排除文字连续文字B-Text的相邻的后一个文字或相邻后连续文字(此些文字及连续文字已经被纪录为排除)为:该、一、于、在,则将该基本排除文字连续文字B-Text的最终处前两个文字予以记录为排除。
因此前述例子成为以下,其中由该可删文字纪录排除装置2记录为排除的内容以黑底字表示。
一种缓冲元件,包含:一多层材料,包含一隔离层、一被设置成与该隔离层邻接的聚合材料层,及一被设置成与该隔离层邻接且与其对立的稳定层;多个柱状物,被设置该多层材料内,每个该多个柱状物包含一厚度,一上表面及一侧壁,该侧壁为从该上表面底切上表面形成一位于该上表面侧壁之间的半径化的上缘;多个间隔物区域,其被设置于该多个柱状物之间每个该多个间隔物区域包含一间隔物区域厚度;其中该柱状物厚度大于该间隔物区域厚度。”。
本发明的该元件名词及元件名词所属位置自动得出设备P进一步包含单个文字纪录排除装置3,该单个文字纪录排除装置3连接该可删文字纪录排除装置2,以自动读取数个该可删文字删去连续文字D-Text,并将仅具有单个文字SW的可删文字删去连续文字D-Text予以记录为排除,使经排除该单个文字SW后的可删文字删去连续文字D-Text作为一初步元件名词P-EN。
因此前述例子成为以下,其中由该单个文字纪录排除装置3记录为排除的内容以字框表示。“一种缓冲元件,包含:一多层材料,包含一隔离层、一被设置
Figure BDA0002421775640000121
与该隔离层邻接的聚合材料层,及一被设置
Figure BDA0002421775640000122
与该隔离层邻接且与其对立的稳定层;多个柱状物,被设置于该多层材料内,每个该多个柱状物包含一厚度,一上表面及侧壁,该侧壁为从该上表面底切上表面形成一位于该上表面和该侧壁之间的半径化上缘;多个间隔物区域 被设置于该多个柱状物之间每个该多个间隔物区域包含一间隔物区域厚度;其中该柱状物厚度大于该间隔物区域厚度。”。
本发明的该元件名词及元件名词所属位置自动得出设备P进一步包含一进阶排除文字纪录排除装置4,该进阶排除文字纪录排除装置4连接于该单个文字纪录排除装置3以自动读取数个该初步元件名词P-EN,并根据一进阶排除文字库AL中的数个进阶排除文字ED,从各个该初步元件名词P-EN中将该进阶排除文字ED予以记录为排除,使该初步元件名词中P-EN经排除该进阶排除文字ED后的连续文字作为该所得出元件名词R-EN。
详细而言,该进阶排除文字库AL中的数个进阶排除文字ED包含:初步元件名词为二个文字且该初步元件名词之前、之后为“于”、“成”、“至”、“在”、“用于”等,则将该初步元件名词予以删除;以及“经XX”(XX代表二个文字)、“为XX”(XX代表二个文字)、“待XX”(XX代表二个文字)、“之间”、“同时”、“实时”、“以上”、“被XX的”(XX代表二个文字)、“XX化”等文字,则将该初步元件名词予以删除。
因此前述例子成为以下,其中由该进阶排除文字纪录排除装置4记录为排除的内容以删除线表示。“一种缓冲元件,包含:一多层材料,包含一隔离层、一被设置
Figure BDA0002421775640000131
与该隔离层邻接聚合材料层,及一被设置
Figure BDA0002421775640000132
与该隔离层邻接且与其对立的稳定层;多个柱状物,被设置于该多层材料内,每个该多个柱状物包含一厚度,一上表面及一侧壁,该侧壁为从该上表面底切该上表面形成一位于该上表面和该侧壁之间的
Figure BDA0002421775640000133
的上缘;多个间隔物区域,其被设置于该多个柱状物之间每个该多个间隔物区域包含一间隔物区域厚度;其中 柱状物厚度大于该间隔物区域厚度。”。
以上未具有任何标号为所得出元件名词(即,本发明所要得出的元件名词),依序包含:缓冲元件多层材料隔离层、隔离层、聚合材料层隔离层、稳定层、柱状物、多层材料、柱状物、厚度、上表面、侧壁、侧壁、上表面、上表面、上表面、侧壁上缘、间隔物区域、柱状物、间隔物区域、间隔物区域厚度、柱状物厚度间隔物区域厚度。
如图1所示,进一步而言,依据本发明的一实施例的对于无字间空格语言文字权利要求书的元件名词及元件名词所属位置自动得出设备P,其中在该进阶排除文字纪录排除装置4进一步包含细部元件名词得出装置42,该细部元件名词得出装置42将为与“一”后相邻的该所得出元件名词予以为与“该”后相邻的该所得出元件名词比对,当比对吻合时,则确定与“该”后相邻的该所得出元件名词为细部元件名词而作为该所得出元件名词。通过该方式,确定该所得出元件名词,因此可再次执行该首部删去规则HR中的“元件名词+两个字”的记录为排除,增加元件名词之得出正确度。
如图1所示,依据本发明的实施例的对于无字间空格语言文字权利要求书的元件名词及元件名词所属位置自动得出设备P,为根据各个所得出元件名词、各个所得出元件名词的所得出元件名词所属位置、标点符号及换行符号得出该无字间空格语言文字权利要求书的架构。例如,可通过标点符号对于无字间空格语言文字权利要求书进行换行,且将所得出的该所得出元件名词予以标示为可点选,以在点选后可跳至该所得出元件名词位于说明书的位置,由此可更加了解该所得出元件名词的意义。
因此前述例子成为以下,其中并进一步将“;”所属区段予以对仗显示,所得出元件名词为以下划线表示。
一种缓冲元件,包含:
多层材料
包含一隔离层
一被设置成与该隔离层邻接的聚合材料层
及一被设置成与该隔离层邻接且与其对立的稳定层
多个柱状物
其被设置于该多层材料内,
每个该多个柱状物包含一厚度
上表面及一侧壁
侧壁为从该上表面并底切该上表面以形成一位于该上表面和该侧壁
之间的
Figure BDA0002421775640000141
上缘
多个间隔物区域
其被设置于该多个柱状物之间,
每个该多个间隔物区域包含一间隔物区域厚度
其中该柱状物厚度大于该间隔物区域厚度
本发明除了上述实施例之外,可通过先将元件对照表中所列出的元件名词予以先行于该对于无字间空格语言文字权利要求书文字C-Text中找出,再进行该基本排除文字纪录排除装置1中的该基本排除文字连续文字B-Text的得出,以增加整体指令周期以及正确性。如图4所示,在本发明的另一实施例,该对于无字间空格语言文字权利要求书文字C-Text的元件名词及元件名词所属位置自动得出设备P可另设置元件对照表元件名词记录排除装置1A,该元件对照表元件名词记录排除装置1A连接于该基本排除文字纪录排除装置1该元件对照表元件名词记录排除装置1A为自动读取该无字间空格语言文字权利要求书文字C-Text,并根据元件名词对照表EN-List中的一元件对照表元件名词List-EN而自该无字间空格语言文字权利要求书文字C-Text中将该元件对照表元件名词List-EN予以记录为排除,而使该无字间空格语言文字权利要求书文字C-Text中经排除该元件对照表元件名词List-EN后的连续文字作为元件对照表元件名词排除连续文字D-EN。得出的该元件对照表元件名词排除连续文字D-EN予以传送至该基本排除文字记录排除装置1,由该基本排除文字记录排除装置1为同样执行上述操作,以自该元件对照表元件名词排除连续文字D-EN中将该基本排除文字B予以记录为排除,使该元件对照表元件名词排除连续文字D-EN中经排除该基本排除文字B后的连续文字作为基本排除文字连续文字B-Text。
进一步而言,在先行得出该元件对照表元件名词List-EN之后,可在后续的可删文字纪录排除装置2(包含有该首部文字记录排除装置21及该首部文字记录排除装置22)的该可删文字删去规则DR中订定出关于该元件对照表元件名词List-EN的规则运算,可增加整体指令周期以及正确性。亦即,该可删文字纪录排除装置2中的该可删文字删去规则DR将该元件对照表元件名词List-EN予以纳入为该特定排除文字SD,以自基本排除文字连续文字B-Text中将该特定排除文字SD予以作为该可删文字D而予以记录为排除且/或将该特定排除文字SD的相邻文字或相邻连续文字予以作为该可删文字D而予以记录为排除,使该基本排除文字排除连续文字B-Text中经排除该可删文字D后的连续文字作为可删文字删去连续文字D-Text。
具体而言,该可删文字纪录排除装置2的首部文字记录排除装置21为自动读取数个该基本排除文字连续文字B-Text,并将该元件对照表元件名词List-EN予以纳入为该首部删去规则定义的可删识别文字IW,以除了第一实施例的判断之外,再根据该元件对照表元件名词List-EN,判断各个该基本排除文字连续文字B-Text的起始文字的相邻前文字或相邻前连续文字是否具有该元件对照表元件名词List-EN并予以作为对应可删识别文字Found-IW以将该起始文字之后的指定字数文字予以作为一首部删去文字而记录为排除(亦即,在将该元件对照表元件名词List-EN予以纳入为该首部删去规则HR定义的可删识别文字IW时,为图2c以及图3c的例子,其中该可删识别文字IW为在该基本排除文字连续文字B-Text的起始文字之外的相邻前文字或相邻前连续文字)。此时,该首部文字记录排除装置21为与第一实施例相同,对于其他非该元件对照表元件名词List-EN的可删识别文字IW仍为:判断各个该基本排除文字连续文字B-Text的起始文字或起始连续文字是否具有该可删识别文字IW并予以作为对应可删识别文字Found-IW以将该对应可删识别文字Found-IW且/或该对应可删识别文字Found-IW之后的指定字数文字予以作为一首部删去文字而记录为排除、或判断各个该基本排除文字连续文字的起始文字的相邻前文字或相邻前连续文字是否具有该可删识别文字并予以作为对应可删识别文字以将该起始文字之后的指定字数文字予以作为首部删去文字而记录为排除,由此使该基本排除文字排除连续文字中B-Text经排除该首部删去文字后的连续文字作为该可删文字删去连续文字D-Text。
详细而言,该首部文字记录排除装置21除了执行与第一实施例相同的对于该可删识别文字IW的判断之外,并会依据得知的该元件对照表元件名词List-EN对该基本排除文字排除连续文字B-Text进行以下之文字记录排除,以得到该可删文字删去连续文字D-Text。例如,该可删文字删去规则DR订定出:“将”+“List-EN”+“……至”(亦即,“将”以及“List-EN”为位在该基本排除文字排除连续文字B-Text“……至”之外且为前相邻,且“至”为在该基本排除文字排除连续文字B-Text的尾部)的情形,则将“至”及“至”之前的两个字予以记录为排除。又例如,该可删文字删去规则DR订定出:“把”+“List-EN”+“……至”(亦即,“把”以及“List-EN”为位在该基本排除文字排除连续文字B-Text“……至”之外且为前相邻,且“至”为在该基本排除文字排除连续文字B-Text的尾部)的情形,则将“至”及“至”之前的两个字予以记录为排除。又例如,该可删文字删去规则DR订定出:“把”+“List-EN”+“……以”(亦即,“把”以及“List-EN”为位在该基本排除文字排除连续文字B-Text“……以”之外且为前相邻,且“以”为在该基本排除文字排除连续文字B-Text的尾部)的情形,则将“以”及「以”之前的两个字予以记录为排除。
在具有先行得出该元件对照表元件名词List-EN的该元件对照表元件名词记录排除装置1A的无字间空格语言文字权利要求书文字C-Text的元件名词及元件名词所属位置自动得出设备P,该可删文字纪录排除装置2的该尾部文字记录排除装置22为自动读取数个该基本排除文字连续文字B-Text,并将该元件对照表元件名词List-EN予以纳入为该尾部删去规则TR所定义的可删识别文字IW,以除了第一实施例的判断之外,再根据该元件对照表元件名词List-EN,判断各个该基本排除文字连续文字B-Text的最终文字的相邻后文字或相邻后连续文字是否具有该元件对照表元件名词List-EN并予以作为对应可删识别文字Found-IW以将该最终文字之后的指定字数文字予以作为尾部删去文字而记录为排除(亦即,在将该元件对照表元件名词List-EN予以纳入为该尾部删去规则TR所定义的可删识别文字IW时,为图2c以及图3c的例子,其中该可删识别文字IW为在该基本排除文字连续文字B-Text的最终文字之外的相邻后文字或相邻后连续文字)。此时,该尾部文字记录排除装置22为与第一实施例相同,对于其他非该元件对照表元件名词List-EN的可删识别文字IW仍为:判断各个该基本排除文字连续文字B-Text的最终文字或最终连续文字是否具有该可删识别文字IW并予以作为一对应可删识别文字Found-IW以将该对应可删识别文字Found-IW和/或该对应可删识别文字Found-IW之前的指定字数文字予以作为一尾部删去文字TD而记录为排除、或判断各个该基本排除文字连续文字B-Text的最终文字的相邻后文字或相邻后连续文字是否具有该可删识别文字IW并予以作为一对应可删识别文字Found-IW以将该最终文字之前的指定字数文字予以作为一尾部删去文字TD而记录为排除,由此而使该基本排除文字排除连续文字B-Text中经排除该尾部删去文字TD后的连续文字作为该可删文字删去连续文字D-Text。
举例而言,该尾部文字记录排除装置22除了执行与第一实施例相同的对于该可删识别文字IW的判断之外,并会依据所得知之该元件对照表元件名词List-EN而对该基本排除文字排除连续文字B-Text进行以下的文字记录排除,以得到该可删文字删去连续文字D-Text。例如,该可删文字删去规则DR订定出:“至”+“List-EN,”(亦即,“List-EN,”为位在该基本排除文字B-Text“……至”之外且为后相邻,且“至”为在该基本排除文字排除连续文字B-Text的尾部)的情形,则将“至”及“至”之前的两个字予以记录为排除(直到标点符号,如“;”、“,”)。又例如,该可删文字删去规则DR订定出:“给”+“List-EN,”(亦即,“List-EN,”为位在该基本排除文字B-Text“……给”之外且为后相邻,且“给”为在该基本排除文字排除连续文字B-Text的尾部)的情形,则将“给”及“给”之前的两个字予以记录为排除(至标点符号,如“;”、“,”)。又例如,该可删文字删去规则DR订定出:“到”+“List-EN,”(亦即,“List-EN,”为位在该基本排除文字B-Text“……到”之外且为后相邻,且“到”为在该基本排除文字排除连续文字B-Text的尾部)的情形,则将“到”及“到”之前的两个字予以记录为排除(至标点符号,如“;”、“,”)。又例如,该可删文字删去规则DR订定出:“至”+“List-EN上,”(亦即,“List-EN上,”为位在该基本排除文字B-Text“……至”之外且为后相邻,且“至”为在该基本排除文字排除连续文字B-Text的尾部)的情形,则将“至”及“至”之前的两个字予以记录为排除。
采用本发明的对于无字间空格语言文字权利要求书的元件名词及元件名词所属位置自动得出设备,可对于权利要求书的元件名词及元件名词所属位置之自动得出,不需建立元件名词数据库的方式且不以词性进行元件名词的判断,而根据专利权利要求的撰写格式以及特性,以不可能为元件名词的文字位置逐步排除的方式最终得出元件名词,如此在不需花费庞大系统计算及储存资源的情况下,提供可有效率的得出数量多、准确度高、提供速度快的权利要求书的元件名词及元件名词所属位置的自动得出设备。
以上的叙述以及说明仅为本发明的较佳实施例的说明,本领域技术人员当可依据所界定的保护范围以及上述的说明而作其他的修改,同时,这些修改仍应是为本发明的创作精神而在本发明的保护范围中。

Claims (10)

1.一种对于无字间空格语言文字权利要求书的元件名词及元件名词所属位置自动得出设备,其特征在于,是对于以无字间空格语言文字构成的无字间空格语言文字权利要求书予以自动得出权利要求书的各个所得出元件名词及所得出元件名词所属位置,所述的元件名词及元件名词所属位置自动得出设备包含:
基本排除文字纪录排除装置,自动读取无字间空格语言文字权利要求书文字C-Text,并根据基本排除文字库中的数个基本排除文字而自所述的无字间空格语言文字权利要求书文字C-Text中将所述的基本排除文字予以记录为排除,使所述的无字间空格语言文字权利要求书文字C-Text中经排除所述的基本排除文字后的连续文字作为基本排除文字连续文字;
可删文字纪录排除装置,为自动读取多数个所述的基本排除文字连续文字,并根据可删文字删去规则而自各个所述的基本排除文字连续文字中将可删文字予以记录为排除,所述的可删文字删去规则为自基本排除文字连续文字中将所述的可删文字删去规则定义的特定排除文字予以作为所述的可删文字而予以记录为排除且/或将所述的特定排除文字的相邻文字或相邻连续文字予以作为所述的可删文字而予以记录为排除,而使所述的基本排除文字排除连续文字中经排除所述的可删文字后的连续文字作为可删文字删去连续文字;
单个文字纪录排除装置,为自动读取多数个所述的可删文字删去连续文字,并将仅具有单个文字的可删文字删去连续文字予以记录为排除,而使经排除所述的单个文字后的可删文字删去连续文字作为初步元件名词;以及
进阶排除文字纪录排除装置,为自动读取多数个所述的初步元件名词,并根据进阶排除文字库中的数个进阶排除文字而自各个所述的初步元件名词中将所述的进阶排除文字予以记录为排除,使所述的初步元件名词中经排除所述的进阶排除文字后的连续文字作为所述的所得出元件名词。
2.根据权利要求1所述的元件名词及元件名词所属位置自动得出设备,其特征在于,所述的可删文字纪录排除装置还包括首部文字记录排除装置,所述的首部文字记录排除装置为自动读取多数个所述的基本排除文字连续文字,并根据首部删去规则定义的可删识别文字,以判断各个所述的基本排除文字连续文字的起始文字或起始连续文字是否具有所述的可删识别文字并予以作为对应可删识别文字,以将所述的对应可删识别文字和/或所述的对应可删识别文字之后的指定字数文字予以作为首部删去文字而记录为排除、或判断各个所述的基本排除文字连续文字的起始文字的相邻前文字或相邻前连续文字是否具有所述的可删识别文字并予以作为对应可删识别文字以将所述的起始文字之后的指定字数文字予以作为首部删去文字而记录为排除,由此使所述的基本排除文字排除连续文字中经排除所述的首部删去文字后的连续文字作为所述的可删文字删去连续文字。
3.根据权利要求1所述的元件名词及元件名词所属位置自动得出设备,其特征在于,所述的可删文字纪录排除装置还包括尾部文字记录排除装置,所述的尾部文字记录排除装置自动读取多数个所述的基本排除文字连续文字,并根据尾部删去规则所定义之一可删识别文字,以判断各个所述的基本排除文字连续文字的最终文字或最终连续文字是否具有所述的可删识别文字并予以作为对应可删识别文字以将所述的对应可删识别文字和/或所述的对应可删识别文字之前的指定字数文字予以作为尾部删去文字而记录为排除、或判断各个所述的基本排除文字连续文字的最终文字的相邻后文字或相邻后连续文字是否具有所述的可删识别文字并予以作为对应可删识别文字以将所述的最终文字之前的指定字数文字予以作为尾部删去文字而记录为排除,由此使所述的基本排除文字排除连续文字中经排除所述的首部删去文字后的连续文字作为所述的可删文字删去连续文字。
4.根据权利要求1所述的元件名词及元件名词所属位置自动得出设备,其特征在于,所述的进阶排除文字纪录排除装置还包括细部元件名词得出装置,所述的细部元件名词得出装置将为与“一”后相邻的所得出元件名词与为与“该”后相邻的所述的所得出元件名词比对,当比对吻合时,则确定与“该”后相邻的所述的所得出元件名词为细部元件名词而作为所述的所得出元件名词。
5.根据权利要求1所述的元件名词及元件名词所属位置自动得出设备,其特征在于,根据各个所得出元件名词、各个所得出元件名词的所得出元件名词所属位置、标点符号及换行符号得出所述的无字间空格语言文字权利要求书的架构。
6.一种对于无字间空格语言文字权利要求书文字C-Text的元件名词及元件名词所属位置自动得出设备,其特征在于,是对于以无字间空格语言文字构成的无字间空格语言文字权利要求书文字C-Text予以自动得出所得出元件名词及所得出元件名词所属位置,所述的元件名词及元件名词所属位置自动得出设备包含:
元件对照表元件名词记录排除装置,所述的元件对照表元件名词记录排除装置自动读取所述的无字间空格语言文字权利要求书文字C-Text,并根据元件名词对照表中的元件对照表元件名词,自所述的无字间空格语言文字权利要求书文字C-Text中将所述的元件对照表元件名词予以记录为排除,使所述的无字间空格语言文字权利要求书文字C-Text中经排除所述的元件对照表元件名词后的连续文字作为元件对照表元件名词排除连续文字;
基本排除文字记录排除装置,自动读取所述的元件对照表元件名词排除连续文字,并根据基本排除文字库中的数个基本排除文字,自所述的元件对照表元件名词排除连续文字中将所述的基本排除文字予以记录为排除,使所述的元件对照表元件名词排除连续文字中经排除所述的基本排除文字后的连续文字作为基本排除文字连续文字;
可删文字记录排除装置,自动读取多数个所述的基本排除文字连续文字,并根据可删文字删去规则,自各个所述的基本排除文字连续文字中将可删文字予以记录为排除,所述的可删文字删去规则为自基本排除文字连续文字中将所述的可删文字删去规则定义的特定排除文字予以作为所述的可删文字,并予以记录为排除且/或将所述的特定排除文字的相邻文字或相邻连续文字予以作为所述的可删文字而予以记录为排除,使所述的基本排除文字排除连续文字中经排除所述的可删文字后的连续文字作为可删文字删去连续文字;
单个文字记录排除装置,自动读取多数个所述的可删文字删去连续文字,并将仅具有单个文字的可删文字删去连续文字予以记录为排除,使经排除所述的单个文字后的可删文字删去连续文字作为初步元件名词;以及
进阶排除文字记录排除装置,自动读取多数个所述的初步元件名词,并根据进阶排除文字库中的数个进阶排除文字,从各个所述的初步元件名词中将所述的进阶排除文字予以记录为排除,使所述的初步元件名词中经排除所述的进阶排除文字后的连续文字作为所述的所得出元件名词。
7.根据权利要求6所述的元件名词及元件名词所属位置自动得出设备,其特征在于,所述的可删文字纪录排除装置还包括首部文字记录排除装置,所述的首部文字记录排除装置为自动读取多数个所述的基本排除文字连续文字,并根据首部删去规则定义的可删识别文字,以判断各个所述的基本排除文字连续文字的起始文字或起始连续文字是否具有所述的可删识别文字并予以作为对应可删识别文字以将所述的对应可删识别文字和/或所述的对应可删识别文字之后的指定字数文字予以作为首部删去文字而记录为排除、或判断各个所述的基本排除文字连续文字的起始文字的相邻前文字或相邻前连续文字是否具有所述的可删识别文字并予以作为对应可删识别文字以将所述的起始文字之后的指定字数文字予以作为首部删去文字而记录为排除,由此使所述的基本排除文字排除连续文字中经排除所述的首部删去文字后的连续文字作为所述的可删文字删去连续文字。
8.根据权利要求6所述的元件名词及所属元件名词所属位置自动得出设备,其特征在于,所述的可删文字纪录排除装置还包括尾部文字记录排除装置,所述的尾部文字记录排除装置自动读取多数个所述的基本排除文字连续文字,并根据尾部删去规则定义可删识别文字,以判断各个所述的基本排除文字连续文字的最终文字或最终连续文字是否具有所述的可删识别文字并予以作为对应可删识别文字以将所述的对应可删识别文字和/或所述的对应可删识别文字之前的指定字数文字予以作为一尾部删去文字而记录为排除、或判断各个所述的基本排除文字连续文字的最终文字的相邻后文字或相邻后连续文字是否具有所述的可删识别文字并予以作为对应可删识别文字以将所述的最终文字之前的指定字数文字予以作为尾部删去文字而记录为排除,由此使所述的基本排除文字排除连续文字中经排除所述的尾部删去文字后的连续文字作为所述的可删文字删去连续文字。
9.根据权利要求6所述的元件名词及元件名词所属位置自动得出设备,其特征在于,所述的进阶排除文字纪录排除装置还包括细部元件名词得出装置,所述的细部元件名词得出装置将为与“一”后相邻的所得出元件名词与为与“该”后相邻的所述的所得出元件名词比对,当比对吻合时,则确定与“该”后相邻的所述的所得出元件名词为细部元件名词作为所述的所得出元件名词。
10.根据权利要求6所述的元件名词及元件名词所属位置自动得出设备,其特征在于,根据各个所得出元件名词、各个所得出元件名词的所得出元件名词所属位置、标点符号及换行符号而得出所述的无字间空格语言文字权利要求书的架构。
CN202010207905.1A 2019-11-14 2020-03-23 权利要求书的元件名词及元件名词所属位置自动得出设备 Pending CN112800760A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW108141435 2019-11-14
TW108141435A TWI772709B (zh) 2019-11-14 2019-11-14 對於無字間空格語言文字申請專利範圍之元件名詞及元件名詞所屬位置自動得出設備

Publications (1)

Publication Number Publication Date
CN112800760A true CN112800760A (zh) 2021-05-14

Family

ID=75806081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010207905.1A Pending CN112800760A (zh) 2019-11-14 2020-03-23 权利要求书的元件名词及元件名词所属位置自动得出设备

Country Status (3)

Country Link
JP (1) JP7105500B2 (zh)
CN (1) CN112800760A (zh)
TW (1) TWI772709B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001318792A (ja) * 2000-05-10 2001-11-16 Nippon Telegr & Teleph Corp <Ntt> 固有表現抽出規則生成システムと方法およびその処理プログラムを記録した記録媒体ならびに固有表現抽出装置
CN1337642A (zh) * 2000-08-04 2002-02-27 拓墣科技股份有限公司 数字文件关键特征的自动撷取方法
CN103235774A (zh) * 2013-04-27 2013-08-07 杭州电子科技大学 一种科技项目申请书特征词提取方法
TWI550422B (zh) * 2015-04-08 2016-09-21 雲拓科技有限公司 申請專利範圍之文字歸位方法
CN108268440A (zh) * 2017-01-04 2018-07-10 普天信息技术有限公司 一种未登录词识别方法
CN109829159A (zh) * 2019-01-29 2019-05-31 南京师范大学 一种古汉语文本的一体化自动词法分析方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667194A (zh) * 2009-09-29 2010-03-10 北京大学 基于用户评论文本特征的自动摘要方法及其自动摘要系统
CN103390004B (zh) * 2012-05-11 2018-03-02 北京百度网讯科技有限公司 一种语义冗余的确定方法和装置、对应的搜索方法和装置
CN102945228B (zh) * 2012-10-29 2016-07-06 广西科技大学 一种基于文本分割技术的多文档文摘方法
CN103559310A (zh) * 2013-11-18 2014-02-05 广东利为网络科技有限公司 一种从文章中提取关键词的方法
CN104915443B (zh) * 2015-06-29 2018-11-23 北京信息科技大学 一种中文微博评价对象的抽取方法
TWI639927B (zh) * 2016-05-27 2018-11-01 雲拓科技有限公司 將一申請專利範圍中的申請專利範圍元件名詞所屬元件名詞對應標號予以對應之對應方法
CN107622044A (zh) * 2016-07-13 2018-01-23 阿里巴巴集团控股有限公司 字符串的分词方法、装置及设备
TW201828103A (zh) * 2017-01-24 2018-08-01 雲拓科技有限公司 申請專利範圍之解構處理方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001318792A (ja) * 2000-05-10 2001-11-16 Nippon Telegr & Teleph Corp <Ntt> 固有表現抽出規則生成システムと方法およびその処理プログラムを記録した記録媒体ならびに固有表現抽出装置
CN1337642A (zh) * 2000-08-04 2002-02-27 拓墣科技股份有限公司 数字文件关键特征的自动撷取方法
CN103235774A (zh) * 2013-04-27 2013-08-07 杭州电子科技大学 一种科技项目申请书特征词提取方法
TWI550422B (zh) * 2015-04-08 2016-09-21 雲拓科技有限公司 申請專利範圍之文字歸位方法
CN108268440A (zh) * 2017-01-04 2018-07-10 普天信息技术有限公司 一种未登录词识别方法
CN109829159A (zh) * 2019-01-29 2019-05-31 南京师范大学 一种古汉语文本的一体化自动词法分析方法及系统

Also Published As

Publication number Publication date
JP7105500B2 (ja) 2022-07-25
JP2021082252A (ja) 2021-05-27
TW202119258A (zh) 2021-05-16
TWI772709B (zh) 2022-08-01

Similar Documents

Publication Publication Date Title
US6169999B1 (en) Dictionary and index creating system and document retrieval system
US5867597A (en) High-speed retrieval by example
JP3427692B2 (ja) 文字認識方法および文字認識装置
JP3952216B2 (ja) 翻訳装置及び辞書検索装置
CN100412861C (zh) 用于搜索数字墨水查询的设备和方法
JP3919617B2 (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
US10515105B2 (en) Computer automatically implemented element-noun reference numeral acquiring method for acquiring element-noun reference numeral of claim-element-noun
US20120041947A1 (en) Search apparatus, search method, and program
Tensmeyer et al. Training full-page handwritten text recognition models without annotated line breaks
CN103488752A (zh) 一种poi智能检索的检索方法
CN112800760A (zh) 权利要求书的元件名词及元件名词所属位置自动得出设备
JPH08320914A (ja) 表認識方法および装置
JPS60124782A (ja) 機械翻訳装置
CN108564086A (zh) 一种字符串的识别校验方法及装置
JP2000148788A (ja) 文書画像からのタイトル領域抽出装置およびタイトル領域抽出方法,並びに文書検索方法
JP2002063197A (ja) 検索装置、記録媒体およびプログラム
KR100910275B1 (ko) 이중언어 문서에서의 음차표기 대역쌍 자동 추출 방법 및장치
CN104346611A (zh) 信息处理设备以及信息处理方法
CN114222193B (zh) 一种视频字幕时间对齐模型训练方法及系统
JPS63136291A (ja) 単語読み取り方式
EP0469485B1 (en) Language processing system using an expanded LR parser
JP2006343932A (ja) 情報検索システム及び検索方法
US10515297B2 (en) Recognition device, recognition method, and computer program product
JPH0514952B2 (zh)
JPH01199263A (ja) キーワード抽出装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination