WO2020079748A1 - 事例検索方法および事例検索システム - Google Patents

事例検索方法および事例検索システム Download PDF

Info

Publication number
WO2020079748A1
WO2020079748A1 PCT/JP2018/038473 JP2018038473W WO2020079748A1 WO 2020079748 A1 WO2020079748 A1 WO 2020079748A1 JP 2018038473 W JP2018038473 W JP 2018038473W WO 2020079748 A1 WO2020079748 A1 WO 2020079748A1
Authority
WO
WIPO (PCT)
Prior art keywords
analysis
case
search
sample
user
Prior art date
Application number
PCT/JP2018/038473
Other languages
English (en)
French (fr)
Inventor
健太郎 森本
Original Assignee
株式会社島津製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社島津製作所 filed Critical 株式会社島津製作所
Priority to PCT/JP2018/038473 priority Critical patent/WO2020079748A1/ja
Priority to PCT/JP2019/040537 priority patent/WO2020080376A1/ja
Priority to JP2020553210A priority patent/JP7320526B2/ja
Priority to US17/285,804 priority patent/US20220035846A1/en
Publication of WO2020079748A1 publication Critical patent/WO2020079748A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Definitions

  • the present invention relates to a case search method and a case search system for acquiring a case related to sample analysis via a communication network.
  • sales departments and agents When responding to inquiries from customers before and after selling products etc. to customers, sales departments and agents are usually the point of contact, but in today's complicated and diversified and specialized products etc. There may be a limit to what can be done by the sales department or agency, such as the need for specialized knowledge.
  • the analyzer models and measurable samples cover a wide range of industries including life sciences, agriculture, etc. It is difficult to analyze and interpret the results unless you are a person who specializes in the equipment.
  • a customer who intends to purchase an analyzer usually has a sample to be measured by the device, and is demanding a specific device, a pretreatment, and a measuring method capable of measuring the sample.
  • Patent Document 1 For each explainer of a product or the like, information about product knowledge acquired by the explainer is recorded and managed in a knowledge information database, and when a visitor makes an inquiry, A product that explains a product or the like to be provided to a visitor by extracting a explainer suitable for the explanation and enabling mutual communication between the extracted explainer's terminal and the terminal used by the customer through a communication network.
  • the explanation support system such as is described.
  • Patent Document 2 relates to a technology for searching information regarding medicines, medical devices, etc., to a specific user such as a medical personnel such as a doctor, a nurse, etc. from a manufacturer, a dealer, an agent, etc. to the Internet, an electronic mail. It discloses a medical device sales system that provides information through such means.
  • a searcher inputs a search word (keyword) that most expresses the content to be searched, and then a search process (matching process with an index word) for a database is executed and a specific condition is satisfied.
  • the search target that matches is output as the search result.
  • the keyword search as described above only causes the pages that are evaluated to be highly relevant to the user to be ranked high.
  • the entered keyword is only the sample name, it will not be an appropriate search keyword when the customer wants to know the measurement method, so what kind of analyzer should be used? , A customer needs a window to consult with the equipment manufacturer.
  • the medical device sales system of Patent Document 2 also has a configuration in which a system on the manufacturer side that sells medical devices and a user system on the hospital side, which is a medical device purchaser, are connected via a wide area network (Internet). Since the product file having the input keyword is searched and the product information corresponding to the keyword is created and the product information is provided to the member user, it is impossible to perform the search beyond the matching / mismatching of the keywords. For example, when the product information is a compound name, there is a problem that the analysis method cannot be returned even if the keywords match the compound name.
  • the present invention has been made in view of the above-described problems, and an object thereof is to provide a case search method and a case search system which provide a case such as an analysis device corresponding to a sample to be analyzed by a user or the like, pretreatment, and the like. Is to provide.
  • the present invention is a case retrieval method for retrieving an analysis case for a sample presented by a user, comprising the step of receiving a retrieval character string input by the user, An interpretation step of interpreting the meaning content of the search character string regarding the sample analysis case, and based on the result of the interpretation, the analysis case stored in advance in the storage unit matches or is similar to the presented sample. It is characterized by comprising a search step of searching for an analysis case of a sample and a step of outputting the searched analysis case.
  • the interpretation step performs a semantic search for the received search string.
  • the storage unit is a database including a set of word vectors, sentence vectors, and document vectors for analysis cases.
  • a feature vector obtained by morphological analysis of the search character string is compared with a word vector, a sentence vector, and a document vector in the database in a multidimensional space.
  • the searched analysis case includes at least one of information regarding pretreatment, an analysis device, and installation of the analysis device for a sample corresponding to the analysis case or a sample similar to the sample. .
  • the method further comprises a step of newly storing in the storage unit an analysis case different from a past analysis case among the searched analysis cases.
  • the search step searches for at least one analysis case of a compound name or a similar compound name, an analysis method or a similar analysis method, an analysis target or a similar analysis target included in the search character string.
  • the method further includes: a step of analyzing a predetermined tendency indicated by the received search character string based on the interpretation in the interpretation step; and a step of outputting a result of the analysis.
  • the present invention is a case retrieval system for retrieving an analysis case of a sample presented by a user, wherein a database in which the analysis cases are accumulated and a search entered by the user
  • the present invention is characterized by further comprising: a searching unit that searches the analysis case for an analysis case of a sample that matches or is similar to the presented sample, and a unit that outputs the searched analysis case.
  • the case search system preferably comprises a user terminal connected via a communication line and a server device for searching the analysis case.
  • the present invention even if the input search character string does not completely match the analysis case in the database, it is possible to judge whether or not the analysis can be performed by a similar analysis case and reply as the analysis case.
  • FIG. 1 is a block diagram showing an example of the configuration of a case search system according to an embodiment of the present invention.
  • the case search system 1 shown in FIG. 1 is a system in which a device manufacturer serves as an information provider in the Internet environment and provides case information in response to a request from an information searcher (user).
  • a server device 2 installed by a device maker and a plurality of user terminals 3a to 3n are connected to each other via a network (NW) 10 so that information can be exchanged between them.
  • NW network
  • the server device 2 executes a process for providing an analysis device corresponding to the sample, a pretreatment, an interpretation method of the result, an analysis case, etc., regarding the analysis of the sample presented by the user.
  • the user terminals 3a to 3n configuring the search system 1 are not particularly limited, but are information terminals having a communication function such as a desktop personal computer (PC), a notebook PC, a mobile terminal (tablet terminal, smartphone), and the like. is there.
  • the server device 2 includes a control unit 20 that controls and controls the entire search system, a communication unit (communication interface) 21 that performs connection control with the network (NW) 10 and communication control, and an analysis unit that analyzes input information from a user. 23, a characteristic extraction unit 27, a search unit 29, a user information storage unit 25 in which information about registered users is stored, and a display unit 31 for displaying search results and the like.
  • the server device 2 also includes an input unit 33 that inputs various data.
  • the display unit 31 is a display device such as a liquid crystal display.
  • the input unit 33 includes, for example, an input device such as a keyboard and a mouse, and a search character string is input using the input screen displayed on the display unit 31.
  • the server device 2 stores a database A (41) in which a large number of cases (for example, analysis devices, pretreatments, analysis-related papers, analysis-related patent documents, etc.) to be searched are stored, and analysis case reports.
  • the connected database B (43) is connected.
  • the analysis case report here includes an analysis report.
  • the analysis report is, for example, a report of analysis cases such as “a residual pesticide of sample ⁇ was analyzed by using the apparatus XX” and analysis results, and application news and application notes are also included in the analysis report.
  • the case in the database A (41) may be a public analysis case
  • the analysis case report in the database B (43) may include a part that cannot be disclosed, and may be treated as confidential so that only a specific user can access it.
  • a search character string (search keyword) representing a search target in a natural language such as a character or a sentence is input to the analysis unit 23 from the user terminals 3a to 3n via the network (NW) 10.
  • the analysis unit 23 performs morphological analysis on the input search keyword based on a predefined search dictionary, and divides it into minimum unit words. Then, a vector (word vector or characteristic vector) that characterizes the search keyword is calculated.
  • the feature extracting unit 27 receives the result of the morphological analysis and extracts the feature of the search keyword.
  • the search unit 29 searches for the case (document data) stored in the database based on the characteristics of the search keyword acquired from the characteristic extraction unit 27.
  • the search target is application notes, patent documents, papers, etc. that collect analysis cases, etc., but the search service provided by the search unit 29 is not a keyword search that returns a report matching the search keyword, but a search from the search keyword. Perform a semantic search that interprets the content of the desired analysis case.
  • FIG. 2 is a flowchart showing a processing procedure for acquiring a required case using the case search system.
  • the user inputs a search character string (search keyword) from the user terminal (for example, the user terminal 3a) that has moved to the initial screen display (login screen).
  • FIG. 3 is an example of a login screen.
  • the user is prompted to input the usage right of the search system 1, the member (user) ID 53 such as a registration number indicating the permission state, and the password 54.
  • the user inputs, for example, "I would like to know about the sample analysis method, pretreatment, and analysis device of ⁇ " in the input field 55 as a request item for the search regarding the sample analysis and the content of the inquiry. I want to identify and quantify the type. " Then, by pressing the send button 56, the search request is sent to the server device 2. A cancel button 57 for canceling the search request is also provided.
  • step S13 the search keyword is divided into the minimum units of morphemes (word vectors) by morphological analysis. That is, the input search keyword is subjected to morphological analysis based on a previously defined search dictionary and divided into the minimum unit words. Then, a vector (word vector or characteristic vector) that characterizes the search keyword is calculated.
  • step S15 the result of the morphological analysis is received, and the meaning content corresponding to the relation with the search target is interpreted as the feature of the search keyword from the syntax of the search keyword.
  • the meaning of the search content of the sample presented by the customer is interpreted.
  • a semantic search process for searching document data such as analysis reports in the databases A and B is performed.
  • Semantic search is a technology that specifies the search target that matches the search character string based on the semantic expression of the input search character string, the intention to request the search, the purpose, etc. In other words, this is a technique in which the search character string is not regarded as a simple character string but as a character string having a meaning including a search request.
  • semantic search understanding of synonyms and synonyms by natural language processing and interpretation of structured data are presented, and, for example, an analysis method corresponding to the corresponding analysis case, an analysis device necessary for the analysis are presented.
  • Natural language processing is a series of technologies that causes a computer to process the natural language that humans use on a daily basis, and is a field of artificial intelligence and linguistics. For example, as a method for searching for a desired document from a large amount of document data, searching for document data utilizing natural language processing has been conventionally performed.
  • “Morphological analysis” used in natural language processing is a process that divides a sentence or phrase into the smallest units (words) that have meaning and determines the part of speech. Machine learning is to iteratively learn from data, find patterns (features) hidden therein, and classify the data. It is possible to apply the learned results to new data and make predictions. In machine learning in natural language processing, a large amount of sentence information is learned, and a vector space representing a certain word is created from the distribution of words that appear before and after.
  • Analysis cases such as analysis reports and application notes in databases A and B are stored as vectorized and characterized document data. Specifically, words, documents, and sentences in documents related to cases are vectorized (distributed representation) in space and accumulated. This makes it possible to calculate the distance between the vectors and the calculation between the vectors.
  • Analyzed data of samples requested by users in the past are accumulated in databases A and B as examples. Therefore, by developing a search service using these cases as a database, the user can obtain an answer that the presented samples can be analyzed in general.
  • step S19 a search target that matches the search keyword is searched. If there is a search target that matches the search keyword (for example, the distance between the vectors is short) in the databases A and B, the search result is transmitted to the user terminal 3a via the network (NW) 10 (step S27). ).
  • step S21 when there is no search target that matches the search keyword in the databases A and B, in step S21, the presence or absence of a search target similar to the search target (for example, an analysis example of a sample similar to the sample presented by the user). Search). If there is an analysis example of a similar sample, it is determined in step S23 whether or not the analysis is possible. For example, if the presented sample is a compound, determine whether or not it is possible to reply with the names of similar compounds, similar analysis methods, the presence of past analysis cases for similar analytes, the analyzer used, the pretreatment, etc. To do. At that time, if the analysis case includes confidential internal data, it is also determined whether the analysis case omitting the internal data is used as the search result.
  • the search result (analysis case, preprocessing, etc.) is output in step S27 after determining whether it is possible in step S23.
  • the search result is output in step S27 after determining whether it is possible in step S23.
  • the search keyword is obtained. Extract the results of past poison analysis of "tap water,” which is a subordinate concept of "water”, as a similar case, and give a response to that effect.
  • Information regarding the installation of the analyzer may be added as a response to the search result.
  • step S21 If it is determined in step S21 that a search target similar to the search target is not in the databases A and B, it is determined in step S25 that there is no case, and that is output in step S27.
  • FIG. 4 is an example of the search results display.
  • the inquiry content input by the user is displayed in the upper column 62 of the display 61, and the search result is displayed below it.
  • FIG. 4 is a display example when there are two search results (analysis cases).
  • a compound name, an analysis method, an analysis device, a pretreatment, etc. are displayed (indicated by reference numerals 63a and 63b), and regarding the interpretation method of the search result, select the “View in detail” buttons 64 and 65. Then, the content is displayed on another screen.
  • sample ⁇ is composed of compound AA and can be analyzed by using the analysis device CC by the analysis method called BB method.
  • pretreatment DD is effective. There is.
  • the analysis request content presented by the user is semantically searched based on the search keyword, so that the name keyword of the analysis target (compound) presented by the user is stored in the database. Even if the keyword does not completely match the compound keyword in the analysis example, it is possible to judge whether or not the analysis is possible based on the analysis example of the similar compound and reply as the analysis example.
  • the user has a wide range of analysis request contents, such as detailed analysis cases of the analysis target (compound) or analysis cases of similar compounds, information necessary for analyzing the sample held by the user, information on pretreatment, etc. To get answers quickly and reliably. Further, through such a search service, it becomes possible to quickly receive an order without going through an agent or a sales department.
  • search system 1 case search system 2 server devices 3a to 3n user terminal 10 network (NW) 20 control unit 23 analysis unit 25 user information storage unit 27 feature extraction unit 29 search unit 31 display unit 33 input unit 41 database A 43 Database B 51 Login screen 61 Display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

ユーザ等の分析したい試料に対応した分析装置、前処理等の事例を提供する事例検索方法および事例検索システムを提供するため、提示された試料の分析事例について、検索部29において、ユーザが入力した検索文字列の持つ意味内容を解釈し、その解釈の結果をもとに、あらかじめデータベースA,Bに蓄積された分析事例より、提示された試料と一致あるいは類似する試料についての分析事例を検索し、検索された分析事例を出力する。

Description

事例検索方法および事例検索システム
 本発明は、例えば通信網(ネットワーク)を介して試料分析に関する事例を取得する事例検索方法および事例検索システムに関する。
 顧客への商品等の販売前後において顧客からの問い合わせに対応する場合、通常、営業部門や代理店が窓口となるが、商品等が複雑化、多様化、専門化する今日においては、特定の分野に特化した知識が必要となる等、営業部門や代理店での対応に限界が生じることがある。
 例えば、液体クロマトグラフや質量分析計のような分析装置を製造、販売する場合、分析装置の機種、測定可能な試料は、ライフサイエンスをはじめとして工業、農業等と多岐にわたっており、前処理や実際の分析、結果の解釈は、その装置を専門に扱う者でなくては難しいという側面がある。分析装置の購入を予定している顧客は、通常、その装置で測定したい試料を持っており、その試料を測定できる具体的な装置や前処理、測定方法を求めている。
 一方、近年における通信技術の進展に伴い、インターネット等の通信網を介して様々な情報を容易に取得可能となった。このような情報は、通常、コンピュータ、各種の端末機器等を用いて所定の手順に従った検索をすることで取得できる。
 例えば、特許文献1には、商品等の説明者ごとにその説明者が修得している商品知識の情報を知識情報データベースに記録、管理し、来客から問合せがあった場合、求められた商品の説明に適した説明者を抽出して、抽出された説明者の端末と客の使用する端末とを通信ネットワークを介して相互通信可能にすることで、来客に提供する商品等の説明を行う商品等の説明支援システムが記載されている。
 また、例えば特許文献2は、医薬品、医療機器等に関する情報検索を行う技術に関し、メーカー、ディーラ、代理店等から医師、看護師等の医療関係者といった特定のユーザに対して、インターネット、電子メール等により情報を提供する医療機器販売システムを開示している。
特開2003-115010号公報 特開2002-83223号公報
 従来より行われている、試料の分析を望む顧客による依頼から、分析装置の受注に至るまでの一般的な工程は、
(1)顧客から代理店や営業、コールセンターへのアクセスによる分析、見積もり等の依頼
(2)装置アプリケーション担当者への分析依頼への回答および顧客へのヒアリング
(3)装置アプリケーション担当者による分析方法の提案
(4)装置の受注
となるが、顧客による依頼が装置担当者に降りるまで時間を要し、依頼に対して迅速に対応できないという問題がある。
 また、分析装置等については、通常、代理店やメーカーの営業担当は、装置ラインナップについては熟知しているが、具体的な分析内容にまで踏み込んだ知識は持ち合わせていない。
 一般的な情報検索システムでは、検索者が検索したい内容を最もよく表している検索語(キーワード)を入力することで、データベースに対する検索処理(索引語とのマッチング処理)が実行され、特定の条件に合致する検索対象が検索結果として出力される。
 一方、Google(登録商標)が提供する検索エンジンのようなサービスでは、顧客が持つ試料をどの装置で、どのような前処理で測定すればいいか、という情報が得られない。このようなサービスにおいて、上記のようなキーワード検索により、ユーザにとって関連度が高いと評価されるページが上位に来るのみである。
 したがって、従来の情報検索システムでは、入力されたキーワードが試料名だけの場合、顧客が測定方法等を知りたい場合の適切な検索キーワードとならないため、どのような分析装置を使えばよいか等を、顧客が装置メーカーに相談する窓口が必要となる。
 特許文献1の説明支援システムは、商品知識を有する説明者と問合せ客とが、直接の対面ではなく、通信ネットワークを介して対面しているに過ぎず、従来の営業部門、代理店での顧客対応と変わるところはない。
 特許文献2の医療機器販売システムも、医療機器の販売を行うメーカー側のシステムと、医療機器購入者である病院側のユーザシステムとが広域ネットワーク(インターネット)を介して接続された構成を有するが、入力されたキーワードを有する製品ファイルを検索し、そのキーワードに応じた製品情報を作成して、会員ユーザへ製品情報を提供しているため、キーワードの一致/不一致を超えた検索ができない。例えば、その製品情報が化合物名であった場合、化合物名についてキーワードが一致しても、その分析方法を返せないという問題がある。
 本発明は、上述した課題に鑑みなされたものであり、その目的とするところは、ユーザ等の分析したい試料に対応した分析装置、前処理等の事例を提供する事例検索方法および事例検索システムを提供することである。
 上述した課題を解決する一手段として、本発明は、ユーザより提示された試料に対する分析事例を検索する事例検索方法であって、ユーザが入力した検索文字列を受信する工程と、前記提示された試料の分析事例についての前記検索文字列の持つ意味内容を解釈する解釈工程と、前記解釈の結果をもとに、あらかじめ記憶部に蓄積された分析事例より前記提示された試料と一致あるいは類似する試料についての分析事例を検索する検索工程と、前記検索された分析事例を出力する工程とを備えることを特徴とする。
 上記の事例検索方法において、好ましくは、前記解釈工程は、前記受信した検索文字列についてセマンティック検索を行う。また、好ましくは、前記記憶部は、分析事例についての単語ベクトル、文章ベクトル、および文書ベクトルの集合からなるデータベースである。また、好ましくは、前記検索工程は、前記検索文字列を形態素解析して得た特徴ベクトルと、前記データベース中の単語ベクトル、文章ベクトル、および文書ベクトルとを多次元空間内で対比する。また、好ましくは、前記検索された分析事例には、該分析事例に対応する試料あるいは該試料と類似する試料についての前処理、分析装置、該分析装置の据え付けに関する情報のうち少なくとも1つが含まれる。また、好ましくは、前記検索された分析事例のうち過去の分析事例と異なる分析事例を新たに前記記憶部に蓄積する工程をさらに備える。また、好ましくは、前記検索工程は、前記検索文字列に含まれる化合物名あるいは類似化合物名、分析方法あるいは類似分析方法、分析対象物あるいは類似分析対象物のうち少なくとも1つの分析事例を検索する。また、好ましくは、前記解釈工程での解釈をもとに、前記受信した検索文字列が示す所定の傾向を解析する工程と、前記解析の結果を出力する工程とをさらに備える。
 また、上述した課題を解決する一手段として、本発明は、ユーザより提示された試料の分析事例を検索する事例検索システムであって、前記分析事例が蓄積されたデータベースと、ユーザが入力した検索文字列を受信する手段と、前記提示された試料の分析事例についての前記受信した検索文字列の持つ意味内容を解釈する解釈手段と、前記解釈の結果をもとに、前記データベースに蓄積された分析事例より前記提示された試料と一致あるいは類似する試料についての分析事例を検索する検索手段と、前記検索された分析事例を出力する手段とを備えることを特徴とする。
 上記事例検索システムは、好ましくは、通信回線を介して接続されたユーザ端末と、前記分析事例を検索するサーバ装置とからなる。
 本発明によれば、入力された検索文字列がデータベース中の分析事例と完全に一致しない場合でも、類似の分析事例により分析の可否を判断し、分析事例として回答することが可能となる。
本発明の実施形態に係る事例検索システムの構成の一例を示すブロック図である。 事例検索システムを使用して必要な事例を取得する処理手順を示すフローチャートである。 ユーザ端末におけるログイン画面の一例を示す図である。 検索結果の表示例を示す図である。
 以下、本発明の実施形態について添付図面を参照して詳細に説明する。図1は、本発明の実施形態に係る事例検索システムの構成の一例を示すブロック図である。図1に示す事例検索システム1は、インターネット環境において装置メーカーが情報提供者となって、情報検索者(ユーザ)からの要求に応じて事例情報を提供するシステムである。
 図1に示す事例検索システム1は、装置メーカーが設置したサーバ装置2と、複数のユーザ端末3a~3nとが、ネットワーク(NW)10を介して相互に情報の送受信が可能となるように接続された構成を有する。サーバ装置2は、ユーザから提示された試料の分析に関し、その試料に対応した分析装置、前処理、結果の解釈方法、分析事例の提供等を行うための処理を実行する。
 検索システム1を構成するユーザ端末3a~3nは、特に限定されないが、例えばデスクトップ型のパーソナルコンピュータ(PC)、ノート型PC、携帯端末(タブレット端末、スマートフォン)等、通信機能を備えた情報端末である。
 サーバ装置2は、検索システム全体を制御・統括する制御部20、ネットワーク(NW)10との接続制御、通信制御等を行う通信部(通信インターフェイス)21、ユーザからの入力情報を解析する解析部23、特徴抽出部27、検索部29、登録ユーザに関する情報が格納されたユーザ情報格納部25、検索結果等を表示する表示部31を備える。また、サーバ装置2は、各種データの入力等を行う入力部33を有する。
 表示部31は、例えば液晶ディスプレイ等の表示装置である。入力部33は、例えば、キーボード、マウス等の入力デバイスからなり、表示部31に表示される入力画面を使用して検索文字列が入力される。
 さらにサーバ装置2には、検索対象である大量の事例(例えば、分析装置、前処置、分析関連論文、分析関連特許文献等)が蓄積されたデータベースA(41)と、分析事例報告書が蓄積されたデータベースB(43)とが接続されている。
 ここでの分析事例報告書には、分析レポートが含まれる。分析レポートとは、例えば、「試料△△の残留農薬を装置〇〇を使用して分析した。」等の分析事例、分析結果のレポートであり、アプリケーションニュース、アプリケーションノートも分析レポートに含まれる。なお、データベースA(41)中の事例を公開分析事例とし、データベースB(43)中の分析事例報告書は、開示できない部分を含むため秘密扱いとして特定のユーザのみがアクセスできる構成としてもよい。
 解析部23には、ユーザ端末3a~3nより、ネットワーク(NW)10を介して、検索対象を文字、文章等の自然言語で表した検索文字列(検索キーワード)が入力される。解析部23は、入力された検索キーワードに対して、あらかじめ定義された検索辞書をもとに形態素解析を行って、最小単位の単語に分割する。そして、検索キーワードを特徴づけるベクトル(単語べクトル、あるいは特徴べクトル)を算出する。特徴抽出部27は、形態素解析の結果を受けて、検索キーワードの特徴を抽出する。
 検索部29は、特徴抽出部27より取得した検索キーワードの特徴をもとに、データベースに格納された事例(文書データ)を検索する。検索対象は、分析事例等を収集したアプリケーションノート、特許文献、論文等であるが、検索部29が提供する検索サービスは、検索キーワードに一致するレポートを返すキーワード検索ではなく、検索キーワードから、調べたい分析事例についての内容を解釈するセマンティック検索を行う。
 次に、本実施形態の事例検索システムにおける検索処理、すなわち、ユーザ等が事例検索システムを使用して必要な事例を取得する処理について説明する。
 図2は、事例検索システムを使用して必要な事例を取得する処理手順を示すフローチャートである。図2のステップS11において、ユーザは、初期画面表示(ログイン画面)に移行させたユーザ端末(例えば、ユーザ端末3a)より検索文字列(検索キーワード)を入力する。図3は、ログイン画面の一例である。ログイン画面51において、ユーザに対して検索システム1の使用権、許可状態を示す登録番号等の会員(ユーザ)ID53、およびパスワード54を入力させる。
 その後ユーザは、試料の分析等に関する検索の依頼事項、問合せ内容として、入力欄55に、例えば「△△という試料の分析方法、前処理、分析装置について知りたい。」、「水道水中の不純物の種類を同定して定量化したい。」等の検索文字列を入力する。そして、送信ボタン56を押すことで、検索依頼がサーバ装置2に送信される。また、検索依頼を取り消すための取消しボタン57が設けられている。
 ステップS13で、形態素解析により検索キーワードを最小単位の形態素(単語ベクトル)に分割する。すなわち、入力された検索キーワードに対して、あらかじめ定義された検索辞書をもとに形態素解析を行って、最小単位の単語に分割する。そして、検索キーワードを特徴づけるベクトル(単語べクトル、あるいは特徴べクトル)を算出する。
 ステップS15では、形態素解析の結果を受けて、検索キーワードの構文等から、検索キーワードの特徴として検索対象との関連に対応する意味内容を解釈する。ここでは、例えば顧客から提示された試料の検索内容の意味を解釈する。そして、続くステップS17において、データベースA,B中の分析レポート等の文書データを検索するセマンティック検索処理を行う。
 セマンティック検索は、入力された検索文字列の意味表現、検索を求める意図、目的等に基づいて、検索文字列に合致する検索対象を特定する技術である。すなわち、検索文字列を単なる文字列として捉えるのではなく、検索要求を含めた意味を持つ文字列として捉える技術である。セマンティック検索として、自然言語処理による同義語や類義語の理解、構造化データを解釈し、例えば、対応する分析事例から分析方法、その分析に必要となる分析装置等を提示する。
 なお、自然言語処理(NLP:Natural Language Processing)は、人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術であり、人工知能と言語学の一分野である。例えば、大量の文書データから所望の文書を検索する方法として、従来より自然言語処理を活用した文書データの検索が行われている。
 自然言語処理で用いられる「形態素解析」は、文章やフレーズを、意味を持つ最小限の単位(単語)に分割し、品詞等を判別する処理である。機械学習とは、データから反復的に学習し、そこに潜むパターン(特徴)を見つけ出して、そのデータを分類することである。学習した結果を新たなデータに当てはめて予測することが可能になる。自然言語処理における機械学習では、大量の文章情報を学習し、前後に出現する単語の分布からある単語を表すベクトル空間を作成する。
 データベースA,B中の分析レポート、アプリケーションノート等の分析事例は、ベクトル化されて特徴づけられた文書データとして蓄積されている。具体的には、事例に係る単語、文書、文書中の文章が空間内でベクトル化(分散表現化)されて蓄積されている。こうすることで、ベクトル間の距離の算出、ベクトル間の演算が可能となる。
 データベースA,B中には、過去にユーザから依頼された試料の分析データが事例として積み上がっている。そのため、これらの事例をデータベースとして検索サービスを展開することで、ユーザは、提示された試料はあまねく分析できるという回答が得られる。
 そこで、ステップS19において、検索キーワードに合致する検索対象を検索する。データベースA,B中に検索キーワードに合致する(例えば、ベクトル間の距離が近い)検索対象があれば、その検索結果を、ネットワーク(NW)10を介して、ユーザ端末3aに送信する(ステップS27)。
 一方、データベースA,B中に検索キーワードに合致する検索対象がない場合には、ステップS21で、その検索対象と類似する検索対象の有無(例えば、ユーザが提示した試料と類似する試料の分析事例の有無)を検索する。類似試料の分析事例があれば、ステップS23において、その分析についての可否判断をする。例えば、提示された試料が化合物であれば、類似化合物名、類似分析方法、類似分析対象物等についての過去の分析事例の有無、使用する分析装置、前処理等を回答可能か否かを判断する。その際、分析事例に秘密扱いされた社内データが含まれている場合には、その社内データを割愛した分析事例を検索結果とするか否かも判断する。
 よって、類似する検索対象について過去の分析事例があれば、ステップS23での可否判断を経て、ステップS27において検索結果(分析事例、前処理等)を出力する。例えばユーザより、上記のステップS11で「生活排水中の毒物を分析したい。」との提示(自然文(検索キーワード)による入力)があった場合、その文字列に対する意味解釈をした結果、検索キーワード中の「水」の下位概念である「水道水」について過去に行った毒物の分析結果を類似事例として抽出し、その旨の回答をする。検索結果の回答として、分析装置の据え付けに関する情報を付加してもよい。
 ステップS21において、検索対象と類似する検索対象がデータベースA,B中にないと判断された場合には、ステップS25で、事例なしと判断して、ステップS27でその旨を出力する。
 図4は、検索結果の表示例である。図4の例では、ディスプレイ61の上段の欄62にユーザが入力した問合せ内容が表示され、その下側に検索結果が表示される。図4は、検索結果(分析事例)が2例あったときの表示例である。
 分析事例として、例えば、化合物名、分析方法、分析装置、前処理等が表示され(符号63a,63bで示す)、検索結果の解釈方法については、「詳しく見る」ボタン64,65を選択することで、その内容が別画面に表示される。
 例えば分析事例1は、「試料△△は化合物AAで構成され、BB法という分析方法によって、分析装置CCを使用することで分析が可能である。そのための前処理として、前処理DDが有効である。」ことを意味している。
 以上説明したように本実施形態によれば、ユーザより提示された分析依頼内容を、その検索キーワードをもとにセマンティック検索することで、ユーザが提示した分析対象(化合物)の名称キーワードが、データベース中の分析事例にある化合物キーワードと完全一致しない場合であっても、類似化合物の分析事例により分析可否を判断し、分析事例として回答することが可能となる。
 その結果、ユーザは、分析対象(化合物)の詳細な分析事例、あるいは類似化合物の分析事例、ユーザが保有する試料を分析するために必要な装置、前処理等に関する情報等、多岐にわたる分析依頼内容に対する回答を迅速かつ確実に入手できる。また、このような検索サービスを通じて、代理店や営業部門を介さない速やかな受注につなげることが可能となる。
 さらには、検索に使用された検索キーワードの傾向を解析することにより、ユーザの分析ニーズの把握、製品の改良、アプリケーションの拡充方針の決定等が可能となる。加えて、分析のニーズがある対象物をもとに分析報告書を作成し、分析報告書という形式で分析結果、測定結果を蓄積できる。
1 事例検索システム
2 サーバ装置
3a~3n ユーザ端末
10 ネットワーク(NW)
20 制御部
23 解析部
25 ユーザ情報格納部
27 特徴抽出部
29 検索部
31 表示部
33 入力部
41 データベースA
43 データベースB
51 ログイン画面
61 ディスプレイ

Claims (10)

  1.  ユーザより提示された試料に対する分析事例を検索する事例検索方法であって、
     ユーザが入力した検索文字列を受信する工程と、
     前記提示された試料の分析事例についての前記検索文字列の持つ意味内容を解釈する解釈工程と、
     前記解釈の結果をもとに、あらかじめ記憶部に蓄積された分析事例より前記提示された試料と一致あるいは類似する試料についての分析事例を検索する検索工程と、
     前記検索された分析事例を出力する工程と、
    を備えることを特徴とする事例検索方法。
  2.  前記解釈工程は、前記受信した検索文字列についてセマンティック検索を行うことを特徴とする請求項1に記載の事例検索方法。
  3.  前記記憶部は、分析事例についての単語ベクトル、文章ベクトル、および文書ベクトルの集合からなるデータベースであることを特徴とする請求項1に記載の事例検索方法。
  4.  前記検索工程は、前記検索文字列を形態素解析して得た特徴ベクトルと、前記データベース中の単語ベクトル、文章ベクトル、および文書ベクトルとを多次元空間内で対比することを特徴とする請求項3に記載の事例検索方法。
  5.  前記検索された分析事例には、該分析事例に対応する試料あるいは該試料と類似する試料についての前処理、分析装置、該分析装置の据え付けに関する情報のうち少なくとも1つが含まれることを特徴とする請求項1に記載の事例検索方法。
  6.  前記検索された分析事例のうち過去の分析事例と異なる分析事例を新たに前記記憶部に蓄積する工程をさらに備えることを特徴とする請求項1~5のいずれか1項に記載の事例検索方法。
  7.  前記検索工程は、前記検索文字列に含まれる化合物名あるいは類似化合物名、分析方法あるいは類似分析方法、分析対象物あるいは類似分析対象物のうち少なくとも1つの分析事例を検索することを特徴とする請求項1~6のいずれか1項に記載の事例検索方法。
  8.  前記解釈工程での解釈をもとに、前記受信した検索文字列が示す所定の傾向を解析する工程と、
     前記解析の結果を出力する工程と、
    をさらに備えることを特徴とする請求項1に記載の事例検索方法。
  9.  ユーザより提示された試料の分析事例を検索する事例検索システムであって、
     前記分析事例が蓄積されたデータベースと、
     ユーザが入力した検索文字列を受信する手段と、
     前記提示された試料の分析事例についての前記受信した検索文字列の持つ意味内容を解釈する解釈手段と、
     前記解釈の結果をもとに、前記データベースに蓄積された分析事例より前記提示された試料と一致あるいは類似する試料についての分析事例を検索する検索手段と、
     前記検索された分析事例を出力する手段と、
    を備えることを特徴とする事例検索システム。
  10.  通信回線を介して接続されたユーザ端末と、前記分析事例を検索するサーバ装置とからなることを特徴とする請求項9に記載の事例検索システム。
     
PCT/JP2018/038473 2018-10-16 2018-10-16 事例検索方法および事例検索システム WO2020079748A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
PCT/JP2018/038473 WO2020079748A1 (ja) 2018-10-16 2018-10-16 事例検索方法および事例検索システム
PCT/JP2019/040537 WO2020080376A1 (ja) 2018-10-16 2019-10-15 事例検索方法および事例検索システム
JP2020553210A JP7320526B2 (ja) 2018-10-16 2019-10-15 事例検索方法および事例検索システム
US17/285,804 US20220035846A1 (en) 2018-10-16 2019-10-15 Case search method and case search system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/038473 WO2020079748A1 (ja) 2018-10-16 2018-10-16 事例検索方法および事例検索システム

Publications (1)

Publication Number Publication Date
WO2020079748A1 true WO2020079748A1 (ja) 2020-04-23

Family

ID=70283748

Family Applications (2)

Application Number Title Priority Date Filing Date
PCT/JP2018/038473 WO2020079748A1 (ja) 2018-10-16 2018-10-16 事例検索方法および事例検索システム
PCT/JP2019/040537 WO2020080376A1 (ja) 2018-10-16 2019-10-15 事例検索方法および事例検索システム

Family Applications After (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/040537 WO2020080376A1 (ja) 2018-10-16 2019-10-15 事例検索方法および事例検索システム

Country Status (3)

Country Link
US (1) US20220035846A1 (ja)
JP (1) JP7320526B2 (ja)
WO (2) WO2020079748A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230244705A1 (en) * 2020-06-11 2023-08-03 Shimadzu Corporation Method, System, and Device for Evaluating Performance of Document Search

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003173340A (ja) * 2001-12-05 2003-06-20 Shimadzu Corp 機器分析用データ管理装置
JP2006146621A (ja) * 2004-11-19 2006-06-08 Nec Corp 情報管理装置及び方法並びに情報管理用プログラム
JP2012059182A (ja) * 2010-09-13 2012-03-22 Nippon Telegr & Teleph Corp <Ntt> 検索クエリ推薦方法、検索クエリ推薦装置、検索クエリ推薦プログラム
JP2017528842A (ja) * 2014-09-22 2017-09-28 オラクル・インターナショナル・コーポレイション セマンティックテキスト検索

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004295396A (ja) * 2003-03-26 2004-10-21 Osaka Gas Co Ltd 受付処理支援装置
US9684683B2 (en) * 2010-02-09 2017-06-20 Siemens Aktiengesellschaft Semantic search tool for document tagging, indexing and search
US20150127634A1 (en) * 2013-11-07 2015-05-07 Ricoh Company, Ltd. Electronic document retrieval and reporting
US20170177712A1 (en) * 2015-12-21 2017-06-22 Ebay Inc. Single step cross-linguistic search using semantic meaning vectors
JP6824062B2 (ja) * 2017-02-14 2021-02-03 日本電子株式会社 イオン化法選択支援装置及び方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003173340A (ja) * 2001-12-05 2003-06-20 Shimadzu Corp 機器分析用データ管理装置
JP2006146621A (ja) * 2004-11-19 2006-06-08 Nec Corp 情報管理装置及び方法並びに情報管理用プログラム
JP2012059182A (ja) * 2010-09-13 2012-03-22 Nippon Telegr & Teleph Corp <Ntt> 検索クエリ推薦方法、検索クエリ推薦装置、検索クエリ推薦プログラム
JP2017528842A (ja) * 2014-09-22 2017-09-28 オラクル・インターナショナル・コーポレイション セマンティックテキスト検索

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
S. ZHOU ET AL.: "Supervised Approaches for Japanese Wikification", JOURNAL OF INFORMATION PROCESSING VOL. 25 , INFORMATION PROCESSING SOCIETY OF JAPAN, vol. 25, April 2017 (2017-04-01), pages 341 - 350, XP055693522, DOI: 10.2197/ipsjjip.25.341 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230244705A1 (en) * 2020-06-11 2023-08-03 Shimadzu Corporation Method, System, and Device for Evaluating Performance of Document Search

Also Published As

Publication number Publication date
WO2020080376A1 (ja) 2020-04-23
US20220035846A1 (en) 2022-02-03
JP7320526B2 (ja) 2023-08-03
JPWO2020080376A1 (ja) 2021-11-04

Similar Documents

Publication Publication Date Title
US9092789B2 (en) Method and system for semantic analysis of unstructured data
Hadj Taieb et al. A survey of semantic relatedness evaluation datasets and procedures
Rodríguez-García et al. Creating a semantically-enhanced cloud services environment through ontology evolution
US11281678B2 (en) Continuous evaluation and adjustment of search engine results
Bizer et al. Using the semantic web as a source of training data
KR20160103470A (ko) 네트워크를 통해 상품에 대한 기존 사용자들의 반응정보를 제공하기 위한 시스템 및 방법
Rizk et al. Investigating mobile applications' requirements evolution through sentiment analysis of users' reviews
Bachchhav Information retrieval: search process, techniques and strategies
JP7320526B2 (ja) 事例検索方法および事例検索システム
JP7167997B2 (ja) 文献検索方法および文献検索システム
Sottovia et al. Finding synonymous attributes in evolving wikipedia infoboxes
JP2020067864A (ja) 知識検索装置、知識検索方法、および、知識検索プログラム
AU2018214042A1 (en) Information displaying method and apparatus
Krishna et al. User interface for customizing patents search: an exploratory study
JP2018063610A (ja) 文章検索システム、q&a検索システム、クライアントステム及びサーバ
Eldin et al. Cross-language semantic web service discovery to improve the selection mechanism by using data mining techniques
García-Sánchez et al. Financial knowledge instantiation from semi-structured, heterogeneous data sources
EP3308296A1 (en) A method and system for locating regulatory information
Jones et al. A probabilistic model of information retrieval: Develepment and STatus
Guessoum et al. Natural language why-question in Business Intelligence applications: model and recommendation approach
Sattar Chaudhry Assessment of taxonomy building tools
Khvalchik et al. Question Answering for Link Prediction and Verification
Ponnusamy et al. A user-adaptive self-proclamative multi-agent based recommendation system design for e-learning digital libraries
WO2021210210A1 (ja) 文書検索装置、文書検索システムおよび文書検索方法
WO2021049485A1 (ja) 法律分析装置、及び法律分析方法

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

NENP Non-entry into the national phase

Ref country code: JP

122 Ep: pct application non-entry in european phase

Ref document number: 18937159

Country of ref document: EP

Kind code of ref document: A1