CN115668176A - 信息检索系统 - Google Patents
信息检索系统 Download PDFInfo
- Publication number
- CN115668176A CN115668176A CN202180036733.9A CN202180036733A CN115668176A CN 115668176 A CN115668176 A CN 115668176A CN 202180036733 A CN202180036733 A CN 202180036733A CN 115668176 A CN115668176 A CN 115668176A
- Authority
- CN
- China
- Prior art keywords
- information
- search
- keyword
- searcher
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Library & Information Science (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Liquid Crystal Substances (AREA)
Abstract
本发明提供能够高效地发现检索者想知道的信息的信息检索系统。信息检索系统具备:数据库(12),存储可进行文本检索的多个信息;提问语句受理部(26),受理自然语言形式的提问语句;输入检索关键词提取部(44),从提问语句提取输入检索关键词;检索执行部(40),使用输入检索关键词及与输入检索关键词关联的关键词来对数据库执行检索处理;以及关键词辞典(30),登记有与类别建立了对应关系的词,检索执行部从关键词辞典获取与由检索者选择出的一个类别建立了对应关系的词,并基于获取到的词来将在检索处理中检索出的信息排序而显示给检索者。
Description
技术领域
本公开涉及信息检索系统。
背景技术
以往,在制造业等的维护业务中的资料为记载在纸面的数据(纸数据)。在维护业务中的信息检索系统中,将这些纸数据电子化并汇总蓄积来数据库化是十分重要的。由于检索技术的进步,检索结果的精度提高,推进了纸数据的电子化与数据库化。
例如在制造业中,每次将装置等的故障、不良状况、原因及应对方法等数据库化,在发生了同样的故障、不良状况的情况下,作为过去的事例来进行参考,由此实现不良状况的规避、至修复为止的时间的短缩。另外,在数据库中还存储有作业标准、手册等信息。因此,存储于数据库的信息庞大。
作为从这样庞大的数据之中得到所需的信息的方法,以往有一种文本检索处理,将所赋予的字符串作为关键词,输出与其一致的词作为检索结果。例如专利文献1公开一种信息检索系统,即便是知识、经验少、难以输入恰当的关键词的人,也能够得到良好的检索结果。
专利文献1:日本特开2019-121392号公报
这里,在现有技术中,按照在信息检索系统确定的顺序来显示检索结果。例如,在针对装置的故障找寻存在可能性的原因的情况下,有时仅与代表性的原因相关的数据显示于检索结果的上位,而难以找到与非代表性的原因相关的数据。因此,存在对故障的应对长期化的情况。
发明内容
本公开是鉴于上述的课题而完成的,其目的在于提供一种能够高效地发现检索者想知道的信息的信息检索系统。
本公开的信息检索系统具备:
数据库,存储可进行文本检索的多个信息;
提问语句受理部,受理自然语言形式的提问语句;
输入检索关键词提取部,从上述提问语句提取输入检索关键词;
检索执行部,使用上述输入检索关键词及与上述输入检索关键词关联的关键词来对上述数据库执行检索处理;以及
关键词辞典,登记有与类别建立了对应关系的词,
上述检索执行部从上述关键词辞典获取与由检索者选择出的一个上述类别建立了对应关系的词,并基于获取到的词来将在上述检索处理中检索出的信息排序而显示给上述检索者。
根据本公开,能够提供一种能够高效地发现检索者想知道的信息的信息检索系统。
附图说明
图1是表示本公开的一个实施方式的信息检索系统的简要结构的框图。
图2是表示存储于关键词辞典的关键词的一个例子的图。
图3是表示存储于信息种类判断用辞典的信息种类判断用关键词的一个例子的图。
图4是例示显示的检索结果的图。
图5是用于对实施方式的信息检索系统的动作进行说明的流程图。
图6是接着图5的流程图。
图7是计算机的功能框图。
具体实施方式
在本实施方式中,信息检索系统将制造业中的设备维护作业信息数据库化为可进行文本检索的信息。以下,作为一个例子而对如下信息检索系统进行说明,即在发生了故障、不良状况的情况下,检索者将该状况作为语句输入,从而该信息检索系统能够从数据库检索成为参考的过去的事例的信息。检索者能够基于检索出的信息来进行设备的修复作业。这里,设备维护作业信息例如包括记载了装置等的故障、不良状况、原因及应对方法等的作业标准及手册等信息。另外,以下,有时将与故障或不良状况相关的事例称为“故障事例”。
本公开的信息检索系统的检索用途并不限定于上述。本公开的信息检索系统还能够在设备故障修复作业等设备维护作业的辅助以外使用。例如在营业领域中,本公开的信息检索系统能够应用于针对来自顾客的咨询内容检索过去的事例并提示最佳回答。例如在商品设计领域中,本公开的信息检索系统能够应用于针对来自顾客的询问检索类似的制造成果、技术论文等文献并提出最佳产品设计。
图1是表示本公开的一个实施方式的信息检索系统的简要结构的框图。信息检索系统构成为具备:执行检索处理的信息检索装置10、存储可进行文本检索的多个信息的数据库12、与信息检索装置10连接了的键盘、鼠标等输入装置14、与信息检索装置10连接了的显示器等显示装置16、以及经由网络18与信息检索装置10连接的检索者侧终端20。
网络18是LAN(Local Area Network)等通信网。但是并不局限于此,除了因特网等公共通信网之外,网络18也可以是WAN(Wide Area Network:广域网)或VPN(VirtualPrivate Network:虚拟专用网络)那样的局部介入了一般公共线路的通信网。信息检索装置10及检索者侧终端20分别通过计算机和程序来实现。检索者侧终端20的例子为个人计算机(PC)、平板型计算机等,并连接或者一体化有输入装置22及显示装置24。
这里,图1的信息检索系统的结构为一个例子,也可以不包含构成要素的一部分。另外,信息检索系统也可以具备其他构成要素。例如,信息检索系统也可以是不具备输入装置14及显示装置16、而使用检索者侧终端20来进行信息的输入输出的结构。
在数据库12内存储文档、图纸、照片等。语句不仅可以是最初文本输入的语句,也可以是使用语音识别引擎将声音文本化而成的语句,也可以是使用OCR(OpticalCharacter Reader:光学字符阅读器)将纸质媒介中的语句文本化而成的语句。在存储图纸、照片的情况下,能够对于填入至图纸的文字或文件名进行检索处理。存储于数据库12的信息包括装置等的故障、不良状况及其原因、还有其应对方法等作业标准、手册等信息。在本实施方式中,数据库12包括多个故障事例。
信息检索装置10构成为具备提问语句受理部26、自然语言处理部28、关键词辞典30、检索候选关键词读出部32、检索关键词存储部34、信息种类判断部36、信息种类判断用辞典38、检索执行部40、以及检索候选关键词变更请求受理部42。自然语言处理部28包括输入检索关键词提取部44及信息种类判断用关键词提取部46。这里,图1的信息检索装置10的结构为一个例子,也可以不包含构成要素的一部分。另外,信息检索装置10也可以具备其他构成要素。例如,信息检索装置10也可以是不具备关键词辞典30及信息种类判断用辞典38、而经由网络18访问在信息检索装置10的外部设置的上述辞典的结构。
上述的各功能模块大致具有如下功能。提问语句受理部26经由网络18依次受理由检索者经由检索者侧终端20的输入装置22所输入的自然语言形式的提问语句。例如,能够在检索者侧终端20依次输入“在○○设备发生××装置的故障。过去有类似例?”、“故障的种类为△△故障的情况是?”、“□□部件的更换步骤是?”、“逆变器跳闸的理由是?”之类的自然语言形式的提问语句。
自然语言处理部28对于由提问语句受理部26受理的提问语句进行已知的词素解析等自然语言处理,提取词。自然语言处理部28的输入检索关键词提取部44从所输入的提问语句提取在检索中使用的输入检索关键词。为了该提取,输入检索关键词提取部44例如能够参照后文详细说明的关键词辞典30来提取登记在关键词辞典30的词作为输入检索关键词。例如在输入了“在○○设备发生××装置的故障。过去有类似例?”提问语句的情况下,输入检索关键词提取部44提取“○○设备”及“××装置”的词作为输入检索关键词。例如在输入了“故障的种类为△△故障的情况是?”的提问语句的情况下,输入检索关键词提取部44提取“△△故障”的词作为输入检索关键词。例如在输入了“□□部件的更换步骤是?”的提问语句的情况下,输入检索关键词提取部44提取“□□部件”的词作为输入检索关键词。例如在输入了“逆变器跳闸的理由是?”的提问语句的情况下,输入检索关键词提取部44提取“逆变器”及“跳闸”的词作为输入检索关键词。
自然语言处理部28的信息种类判断用关键词提取部46从所输入的提问语句中提取在判断检索意图亦即信息种类中使用的信息种类判断用关键词。为了该提取,信息种类判断用关键词提取部46能够参照后文详细说明的信息种类判断用辞典38来提取登记在信息种类判断用辞典38的词作为信息种类判断用关键词。例如在输入了“在○○设备发生××装置的故障。过去有类似例?”的提问语句的情况下,信息种类判断用关键词提取部46提取“故障”及“类似例”的词作为信息种类判断用关键词。例如在输入了“故障的种类为△△故障的情况是?”的提问语句的情况下,信息种类判断用关键词提取部46提取“故障的种类”的词作为信息种类判断用关键词。例如在输入了“□□部件的更换步骤是?”的提问语句的情况下,信息种类判断用关键词提取部46提取“更换步骤”的词作为信息种类判断用关键词。例如在输入了“逆变器跳闸的理由是?”这样的提问语句的情况下,信息种类判断用关键词提取部46提取“原因”的词作为输入检索关键词。
将关联的关键词彼此相互建立对应关系地预先登记、存储于关键词辞典30。在本实施方式中,将相互同义的关键词彼此相互建立对应关系地登记于关键词辞典30。另外,将相互近义的关键词彼此相互建立对应关系地登记于关键词辞典30。但是,在关键词辞典30,可以仅登记相互同义的关键词,也可以仅登记相互近义的关键词。还能够取而代之或者在此基础上将认为相互关联性高的关键词彼此相互建立对应关系地预先登记。
图2表示预先登记于关键词辞典30的关键词的一个例子。属于相同行的关键词彼此是相互关联的关键词,相互建立了对应关系。这里,所登记的关键词(词)还与类别建立了对应关系。关于类别的详细将后述。
每当输入检索关键词提取部44提取输入检索关键词时,检索候选关键词读出部32参照关键词辞典30来读出与输入检索关键词关联的关键词作为检索候选关键词。例如在输入检索关键词为“○○设备”的情况下,检索候选关键词读出部32从关键词辞典30读出“AA设备”、“A′A′设备”、“A"A"”作为同义词,读出“aaa”、“a′a′a′”作为近义词。即,检索候选关键词读出部32读出“AA设备”、“A′A′设备”、“A"A"”、“aaa”及“a′a′a′”作为检索候选关键词。这里,检索候选关键词读出部32可以从关键词辞典30读出同义词及近义词的一部分而非全部,来作为检索候选关键词。作为一个例子,检索候选关键词读出部32可以仅读出同义词。
检索关键词存储部34存储如上述那样获得的输入检索关键词和检索候选关键词作为检索关键词。例如在追加输入了提问语句的情况下,检索关键词存储部34可以累积地存储追加的输入检索关键词和追加的检索候选关键词作为检索关键词。
信息种类判断部36基于从提问语句提取出的信息种类判断用关键词来判断检索意图。信息种类判断部36参照信息种类判断用辞典38,基于信息种类判断用关键词来判断应该检索的信息种类。图3表示存储于信息种类判断用辞典38的信息种类判断用关键词的一个例子。将能够从提问语句提取的信息种类判断用关键词和与信息种类判断用关键词对应的信息种类建立对应关系地登记于信息种类判断用辞典38。例如对于“故障”及“类似例”的信息种类判断用关键词,建立对应关系地登记有“故障事例”作为信息种类。另外,例如对于“故障的种类”及“更换步骤”的信息种类判断用关键词,建立对应关系地登记有“手册”作为信息种类。另外,存储于数据库12的信息按每个信息种类分成多个组来管理。例如,在数据库12中,可以将“故障事例”存储为位于一个文件夹之下,将“手册”存储为位于其他文件夹之下。
检索执行部40对存储于数据库12的信息进行使用存储于检索关键词存储部34的检索关键词的文本基础的检索处理。即,检索执行部40使用输入检索关键词及与输入检索关键词关联的关键词来对数据库12执行检索处理。检索执行部40对属于数据库12的多个组中的至少与由信息种类判断部36判断出的信息种类对应的组的信息进行检索处理。
检索执行部40从关键词辞典30获取与由检索者选择出的一个类别建立了对应关系的词。检索执行部40基于获取到的词来将在检索处理中检索出的信息排序而显示给检索者。即,检索执行部40根据检索者所指定的类别来将检索出的信息排序,例如使显示装置24显示检索结果。
在本实施方式中,检索者选择6个类别中的一个,使检索结果根据选择出的类别排序,能够高效地发现想知道的信息。6个类别为功能场所、设备、装置、部件、状态及原因。功能场所是区分表示功能场所的词的类别,更具体而言,是针对用于通过流水作业来大量制造产品的工序及工厂的类别。设备是区分表示设备的词的类别,更具体而言,是针对制造机械的类别。设备的类别所区分的制造机械例如包括像“厚板轧机”那样根据制造的产品来确定的机械。装置是区分表示装置的词的类别,更具体而言,特别是针对作为电气件的产品的类别。部件是区分表示部件的词的类别,更具体而言,是针对产品的部件、即单体不具备产品的功能的产品的构成要素的类别。状态是特别区分表示故障的状态的词的类别。原因是特别区分表示故障的原因的词的类别。在本实施方式的信息检索系统确定的多个类别并不限定于上述的6个。也可以不包含上述的6个类别中的一部分,也可以包含与上述的6个类别不同的类别。
如图2所示,在关键词辞典30中,与类别建立对应关系地登记包括检索中的关键词的词。例如“AA设备”和同义词及近义词一同被与设备的类别建立对应关系。例如“××装置”和同义词及近义词一同被与装置的类别建立对应关系。例如“CC故障”和同义词及近义词一同被与状态的类别建立对应关系。例如“DD部件”和同义词及近义词一同被与部件的类别建立对应关系。例如“基板不良”和同义词及近义词一同被与原因的类别建立对应关系。例如“第一工厂”和同义词一同被与功能场所的类别建立对应关系。这里,图2的同义词的最左侧的栏所记载的词被称为代表词。在各类别建立对应关系有多个代表词、它们的同义词及近义词。例如,在原因的类别不仅建立对应关系有基板不良,还建立对应关系有控制、成果、波形及负载等、以及它们的同义词及近义词。这里,在本实施方式中,关键词辞典30将代表词的同义词及近义词与类别的区分汇总管理,但也能够分别管理。
图4是例示在检索处理之后例如显示于显示装置24的检索结果的图。在图4的例子中,对于“逆变器跳闸的理由是?”的提问语句的输入,检索执行部40进行数据库12的检索处理,获取检索出的多个信息。以下,有时将检索出的多个信息称为“检测信息”。如图4所示,检索者能够通过记载为类别的下拉菜单来从6个类别中选择1个。在图4的例子中,检索者选择了“原因”。检索执行部40从关键词辞典30获取与由检索者选择出的类别亦即“原因”建立了对应关系的词(代表词、同义词及近义词)。在图4的例子中,控制、成果、波形、基板不良、负载、速度、破损、不明及指令与从关键词辞典30获取到的代表词对应。
检索执行部40基于获取到的词(代表词、同义词及近义词)来将检测信息排序。检索执行部40将检索信息根据获取到的词存在的频度或者与获取到的词的相关度来排序。获取到的词存在的频度为在检索信息中的这些信息之中出现该词的数量。在图4的例子中,基板不良以及其同义词及近义词包含在检索信息中的13件信息中。另外,在图4的例子中,检索执行部40根据与作为类别的“原因”建立了对应关系的词来按频度的顺序将检索信息排序而显示给检索者。检索者例如能够通过点击“基板不良”来使包含基板不良的故障事例等信息的详细显示。
与获取到的词的相关度表示与除检索信息以外的数据库12的多个信息相比,检索信息与该词关联得多强的尺度。相关度例如能够通过tf-idf等公知的方法来计算。但是,相关度的计算方法并不限定。检索执行部40也可以根据与由检索者选择出的一个类别建立了对应关系的词来按相关度的顺序将检索信息排序而显示给检索者。
在本实施方式中,关键词辞典30与作为类别之一的原因建立对应关系地登记有表示存储于数据库12的多个信息所记载的故障的原因的词。另外,关键词辞典30与作为类别之一的状态建立对应关系地登记有表示存储于数据库12的多个信息所记载的故障的状态的词。并且,检索执行部40从关键词辞典30获取与由检索者选择出的原因或状态建立了对应关系的词,并基于获取到的词来将检索信息排序而显示给检索者。在现有的检索系统中,例如按检索的命中数的降序来显示检索信息。因此,在想知道故障的原因或状态的情况下,将记载了常见原因或常见状态的信息显示于上位。因此,在检索者针对罕见原因或罕见状态的故障进行调查的情况下,在现有的检索系统中存在调查长期化的情况。在本实施方式的信息检索系统中,检索者能够按照类别选择根据检索信息想调查的内容。因此,如图4的例子那样,不仅是频度高的常见原因(例如控制及成果),罕见原因(例如波形、基板不良、负载、速度、破损及指令)也能够作为检索结果一览观看。因此,与现有的检索系统相比,能够高效地发现检索者想知道的故障的原因或状态。
在本实施方式中,关键词辞典30与作为类别之一的部件建立对应关系地登记有表示存储于数据库12的多个信息所记载的部件的词。另外,关键词辞典30与作为类别之一的装置建立对应关系地登记有表示存储于数据库12的多个信息所记载的装置的词。另外,关键词辞典30与作为类别之一的设备建立对应关系地登记有表示存储于数据库12的多个信息所记载的设备的词。另外,关键词辞典30与作为类别之一的功能场所建立对应关系地登记有表示存储于数据库12的多个信息所记载的功能场所的词。并且,检索执行部40从关键词辞典30获取与由检索者选择出的部件、装置、设备或功能场所建立了对应关系的词,并基于获取到的词来将检索信息排序而显示给检索者。在现有的检索系统中,例如按检索的命中数的降序来显示检索信息。因此,在想对部件的故障进行调查的情况下,若使用该部件的产品的信息的命中数较多,则产品的信息显示于上位。因此,在检索者对特定的对象进行调查的情况下,有时因埋没在不同的对象的信息中而导致调查长期化。在本实施方式的信息检索系统中,检索者能够按照类别来选择根据检索信息想调查的对象。检索者能够使用类别的选择来指定调查的对象为部件、产品、设备还是功能场所。因此,与现有的检索系统相比,能够高效地发现检索者想知道的对象的信息。
检索候选关键词变更请求受理部42受理由检索者登记于关键词辞典30的词的追加及删除。检索者例如追加新的近义词,由此能够使检索执行部40执行更加没有遗漏的检索处理。
另外,检索候选关键词变更请求受理部42受理与词建立对应关系的类别的追加、变更及删除。检索者例如将新的词与类别建立对应关系来进行追加,由此能够使检索执行部40执行更加没有遗漏的检索处理及排序的处理。
图5及图6是用于对信息检索系统的处理动作进行说明的流程图。
首先,信息检索装置10的提问语句受理部26受理检索者利用检索者侧终端20经由输入装置22而输入的提问语句(步骤S101)。
接下来,自然语言处理部28对由提问语句受理部26受理到的提问语句进行词素解析等自然语言处理,提取词(独立词)(步骤S102)。
接着,输入检索关键词提取部44从通过自然语言处理提取出的词提取(选择)输入检索关键词(步骤S103)。
接着,检索候选关键词读出部32参照关键词辞典30来读出与输入检索关键词关联的关键词作为检索候选关键词(步骤S104)。
检索关键词存储部34存储输入检索关键词以及由检索候选关键词读出部32读出的检索候选关键词(步骤S105)。
信息检索装置10能够使显示装置24显示检索关键词存储部34所存储的检索关键词,并根据需要来使检索者除去所显示的多个检索关键词中的检索者不期望的检索关键词(步骤S106)。
信息种类判断部36参照信息种类判断用辞典38,基于由信息种类判断用关键词提取部46提取出的信息种类判断用关键词来判断信息种类(检索意图)(步骤S107)。
检索执行部40利用选择出的检索关键词来对数据库12内的、存储在与信息种类判断部36判断出的信息种类或者由检索者手动选择出的信息种类对应的组的信息进行文本基础的检索处理(步骤S108)。
检索执行部40从关键词辞典30获取与由检索者选择出的类别建立了对应关系的词(步骤S109)。
检索执行部40基于获取到的词来将检索出的信息排序(步骤S110)。
信息检索装置10将执行了排序的检索结果显示于检索者侧的显示装置24(步骤S111)。
在由检索者选择了不同的类别的情况下(步骤S112的是),信息检索装置10返回至步骤S109的处理。在未由检索者选择不同的类别的情况下(步骤S112的“否”),信息检索装置10结束处理。
这里,信息检索装置10及检索者侧终端20分别可以是图7那样的计算机。计算机经由总线而连接有存储器(存储装置)、CPU(处理装置)、硬盘驱动器(HDD)、控制显示装置16或显示装置24的显示的显示控制部、用于与网络18连接的通信控制部等。操作系统(OS)及用于实施上述实施方式中的处理的应用程序能够存储于HDD,在由CPU执行时被从HDD读出至存储器。CPU根据需要来控制显示控制部、通信控制部等来使其进行所需的动作。另外,处理中途的数据存储于存储器,若有需要则存储于HDD。上述的各种功能通过使CPU、存储器等硬件与OS及所需的应用程序有机地配合来实现。
如以上那样,根据本实施方式的信息检索系统,具备上述的结构,从而能够高效地发现检索者想知道的信息。
以上,基于图示例进行了说明,但本公开并不限定于上述的实施方式,能够在不脱离主旨的范围内进行各种改进及变更。
工业上的可利用性
根据本公开,能够提供一种能够高效地发现检索者想知道的信息的信息检索系统。
附图标记说明
10…信息检索装置;12…数据库;14…输入装置;16…显示装置;18…网络;20…检索者侧终端;22…输入装置;24…显示装置;26…提问语句受理部;28…自然语言处理部;30…关键词辞典;32…检索候选关键词读出部;34…检索关键词存储部;36…信息种类判断部;38…信息种类判断用辞典;40…检索执行部;42…检索候选关键词变更请求受理部;44…输入检索关键词提取部;46…信息种类判断用关键词提取部。
Claims (8)
1.一种信息检索系统,其特征在于,具备:
数据库,存储可进行文本检索的多个信息;
提问语句受理部,受理自然语言形式的提问语句;
输入检索关键词提取部,从所述提问语句提取输入检索关键词;
检索执行部,使用所述输入检索关键词及与所述输入检索关键词关联的关键词来对所述数据库执行检索处理;以及
关键词辞典,登记有与类别建立了对应关系的词,
所述检索执行部从所述关键词辞典获取与由检索者选择出的一个所述类别建立了对应关系的词,并基于获取到的词来将在所述检索处理中检索出的信息排序而显示给所述检索者。
2.根据权利要求1所述的信息检索系统,其特征在于,
所述检索执行部将所述检索出的信息根据所述获取到的词存在的频度或者与所述获取到的词的相关度来排序。
3.根据权利要求1或2所述的信息检索系统,其特征在于,
所述关键词辞典与作为所述类别之一的原因建立对应关系地登记有表示所述多个信息所记载的故障的原因的词。
4.根据权利要求1~3中任一项所述的信息检索系统,其特征在于,
所述关键词辞典与作为所述类别之一的状态建立对应关系地登记有表示所述多个信息所记载的故障的状态的词。
5.根据权利要求1~4中任一项所述的信息检索系统,其特征在于,
所述关键词辞典与作为上述类别之一的部件建立对应关系地登记有表示所述多个信息所记载的部件的词。
6.根据权利要求1~5中任一项所述的信息检索系统,其特征在于,
所述关键词辞典与作为所述类别之一的装置建立对应关系地登记有表示所述多个信息所记载的装置的词。
7.根据权利要求1~6中任一项所述的信息检索系统,其特征在于,
所述关键词辞典与作为所述类别之一的设备建立对应关系地登记有表示所述多个信息所记载的设备的词。
8.根据权利要求1~7中任一项所述的信息检索系统,其特征在于,
所述关键词辞典与作为所述类别之一的功能场所建立对应关系地登记有表示所述多个信息所记载的功能场所的词。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020093682A JP7264115B2 (ja) | 2020-05-28 | 2020-05-28 | 情報検索システム |
JP2020-093682 | 2020-05-28 | ||
PCT/JP2021/019883 WO2021241601A1 (ja) | 2020-05-28 | 2021-05-25 | 情報検索システム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115668176A true CN115668176A (zh) | 2023-01-31 |
Family
ID=78723365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180036733.9A Pending CN115668176A (zh) | 2020-05-28 | 2021-05-25 | 信息检索系统 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20230222146A1 (zh) |
EP (1) | EP4141698A4 (zh) |
JP (1) | JP7264115B2 (zh) |
KR (1) | KR20230003184A (zh) |
CN (1) | CN115668176A (zh) |
BR (1) | BR112022023806A2 (zh) |
MX (1) | MX2022014972A (zh) |
TW (1) | TWI823091B (zh) |
WO (1) | WO2021241601A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102649918B1 (ko) * | 2023-06-05 | 2024-03-20 | (주)복지이십사 | 대규모 언어 모델 기반 맞춤형 복지 정책 추천 시스템 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002342376A (ja) | 2001-05-18 | 2002-11-29 | Nikon Corp | サイト検索方法 |
JP2004118476A (ja) | 2002-09-26 | 2004-04-15 | Sharp Corp | 電子辞書装置、電子辞書の検索結果表示方法、プログラムおよび記録媒体 |
JP2005182280A (ja) | 2003-12-17 | 2005-07-07 | Ibm Japan Ltd | 情報検索システム、検索結果加工システム及び情報検索方法並びにプログラム |
TWI226560B (en) * | 2003-12-31 | 2005-01-11 | Lin Guei Mei | Information system with natural language parsing ability and processing method thereof |
JP2009087009A (ja) | 2007-09-28 | 2009-04-23 | Kobe Steel Ltd | 文検索装置,文検索プログラム,文検索方法 |
JP4724701B2 (ja) | 2007-10-30 | 2011-07-13 | 日本電信電話株式会社 | 文章検索サーバコンピュータ,文章検索方法,文章検索プログラム,そのプログラムを記録した記録媒体 |
US8631019B1 (en) | 2011-09-09 | 2014-01-14 | Google Inc. | Restricted-locality synonyms |
JP5885689B2 (ja) | 2012-03-06 | 2016-03-15 | 株式会社オウケイウェイヴ | Q&aシステム |
TWI578175B (zh) * | 2012-12-31 | 2017-04-11 | 威盛電子股份有限公司 | 檢索方法、檢索系統以及自然語言理解系統 |
TWI553491B (zh) * | 2014-11-21 | 2016-10-11 | 財團法人工業技術研究院 | 問句處理系統及其方法 |
JP6897140B2 (ja) | 2017-02-14 | 2021-06-30 | 富士フイルムビジネスイノベーション株式会社 | 設計支援システムおよびプログラム |
JP6947155B2 (ja) | 2018-01-05 | 2021-10-13 | Jfeスチール株式会社 | 情報検索システム |
TWI674530B (zh) * | 2018-02-13 | 2019-10-11 | 鼎新電腦股份有限公司 | 操作虛擬助理的方法及系統 |
JP7251168B2 (ja) | 2019-01-28 | 2023-04-04 | 富士フイルムビジネスイノベーション株式会社 | 設計支援システムおよびプログラム |
-
2020
- 2020-05-28 JP JP2020093682A patent/JP7264115B2/ja active Active
-
2021
- 2021-05-25 CN CN202180036733.9A patent/CN115668176A/zh active Pending
- 2021-05-25 MX MX2022014972A patent/MX2022014972A/es unknown
- 2021-05-25 EP EP21812955.9A patent/EP4141698A4/en active Pending
- 2021-05-25 US US17/999,853 patent/US20230222146A1/en active Pending
- 2021-05-25 WO PCT/JP2021/019883 patent/WO2021241601A1/ja unknown
- 2021-05-25 KR KR1020227041838A patent/KR20230003184A/ko unknown
- 2021-05-25 BR BR112022023806A patent/BR112022023806A2/pt unknown
- 2021-05-27 TW TW110119151A patent/TWI823091B/zh active
Also Published As
Publication number | Publication date |
---|---|
TW202145027A (zh) | 2021-12-01 |
US20230222146A1 (en) | 2023-07-13 |
BR112022023806A2 (pt) | 2022-12-20 |
JP2021189694A (ja) | 2021-12-13 |
EP4141698A4 (en) | 2023-09-20 |
TWI823091B (zh) | 2023-11-21 |
WO2021241601A1 (ja) | 2021-12-02 |
KR20230003184A (ko) | 2023-01-05 |
MX2022014972A (es) | 2023-01-11 |
JP7264115B2 (ja) | 2023-04-25 |
EP4141698A1 (en) | 2023-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8239189B2 (en) | Method and system for estimating a sentiment for an entity | |
US7359896B2 (en) | Information retrieving system, information retrieving method, and information retrieving program | |
TW201421414A (zh) | 文件管理系統及文件管理方法以及文件管理程式 | |
JP2019121392A (ja) | 情報検索システム | |
CN110941702A (zh) | 一种法律法规和法条的检索方法及装置、可读存储介质 | |
TW201415402A (zh) | 取證系統、取證方法及取證程式 | |
CN115668176A (zh) | 信息检索系统 | |
CN107480126B (zh) | 一种工程材料类别智能识别方法 | |
CN111753547A (zh) | 一种用于敏感数据泄露检测的关键词提取方法及系统 | |
US20170061228A1 (en) | Text parsing in complex graphical images | |
CN110888977B (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
KR100849690B1 (ko) | 특허분류 체계를 활용한 정보 검색 시스템 및 그에 따른검색 방법 | |
JP2008003656A (ja) | 概念辞書生成装置、文書分類装置、概念辞書生成方法および文書分類方法 | |
EP1850246A1 (en) | Data retrieval system, method and program | |
EP4141699A1 (en) | Information retrieval system | |
CN112818005A (zh) | 结构化数据的搜索方法、装置、设备及存储介质 | |
CN112559739A (zh) | 电力设备绝缘状态数据处理方法 | |
CN113342931B (zh) | 基于大数据的用户需求分析方法、装置、设备及存储介质 | |
EP4145302A1 (en) | Information search system | |
US20230359826A1 (en) | Computer-implemented system and method to perform natural language processing entity research and resolution | |
CN115757754A (zh) | 数据治理中申请人一致性匹配方法、系统及存储介质 | |
Shi et al. | Retrieve information from construction documents with BERT and unsupervised learning | |
Lee et al. | Business specific online information extraction from german websites | |
JP2023057658A (ja) | 情報処理装置、情報を提供するためにコンピューターによって実行される方法、および、プログラム | |
CN117877039A (zh) | 一种炼油化工设备定期检验报告的数据识别与数据治理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |