JP7167996B2 - 事例検索方法 - Google Patents
事例検索方法 Download PDFInfo
- Publication number
- JP7167996B2 JP7167996B2 JP2020551629A JP2020551629A JP7167996B2 JP 7167996 B2 JP7167996 B2 JP 7167996B2 JP 2020551629 A JP2020551629 A JP 2020551629A JP 2020551629 A JP2020551629 A JP 2020551629A JP 7167996 B2 JP7167996 B2 JP 7167996B2
- Authority
- JP
- Japan
- Prior art keywords
- case
- search
- words
- analysis
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
3 事例検索部
5 出力部
10 事例検索システム
11 解析部
13 特徴抽出部
15 事例判定部
17 事例抽出部
20 同義語統合部
23 形態素解析部
25 ゆらぎ判定部
27 言語変換部
29 訳語コーパス
30 事例データベース
31 コーパス
33 シソーラス格納部
35 統合処理部
60a…60n ユーザ端末
65 制御部
67 メモリ
70 情報通信ネットワーク
Claims (8)
- データベースに蓄積された検索対象事例の中から所定の事例を検索する事例検索方法であって、
前記検索対象事例を構成する文章を形態素解析により複数の単語に分割する工程と、
前記複数の単語間の関係から前記文章中より所定の単語群を抽出する工程と、
前記所定の単語群を該単語群と同義語関係にある他言語からなる単一の単語に変換する変換工程と、
前記変換により同義語に統一された前記単一の単語をコーパスに蓄積する工程と、
前記文章中の前記所定の単語群を前記コーパスに蓄積された単語で置換して該文章を統合する工程と、
前記統合された文章からなる検索対象事例を学習によってベクトル化する工程と、
ユーザが入力した検索キーワードを受信する工程と、
前記検索キーワードを特徴付ける特徴ベクトルを算出する工程と、
前記ベクトル化された検索対象事例と前記特徴ベクトルで示される前記検索キーワードとの類似度に基づいて、前記検索キーワードと類似する検索対象事例を抽出する工程と、
を備えることを特徴とする事例検索方法。 - 前記所定の単語群は相互の表記あるいは綴りは異なるが同義の単語からなり、前記統合された文章は前記表記あるいは前記綴りの異なる単語が一意の単語に統一された文章であることを特徴とする請求項1に記載の事例検索方法。
- 前記同義語に統一された前記単一の単語の単語ベクトルと該単語ベクトルを含んでなる文章ベクトルを前記データベースに蓄積する工程をさらに備えることを特徴とする請求項1に記載の事例検索方法。
- 前記データベースには同義語関係で対応する複数の異なる言語による単語ベクトルが蓄積されていることを特徴とする請求項3に記載の事例検索方法。
- 前記変換工程は、前記所定の単語群に対する他言語の訳語を、あらかじめ用意したシソーラスから取得することを特徴とする請求項1に記載の事例検索方法。
- 前記所定の事例を検索するための検索文字列に対して形態素解析する工程をさらに備えることを特徴とする請求項1に記載の事例検索方法。
- 前記検索対象事例、前記文章、および前記検索文字列は、所定の試料についての分析レポート、分析関連論文、分析関連特許文献、分析関連検索キーワード、分析関連化合物名、分析関連分析対象物名のうち少なくとも1つを含むことを特徴とする請求項1~6のいずれか1項に記載の事例検索方法。
- データベースに蓄積された検索対象事例の中から所定の事例を検索する事例検索方法であって、
前記検索対象事例を構成する文章を形態素解析により複数の単語に分割する工程と、
前記複数の単語間の関係から前記文章中より所定の単語群を抽出する工程と、
前記所定の単語群を該単語群と同義語関係にある他言語からなる単一の単語に変換する変換工程と、
前記変換により同義語に統一された前記単一の単語をコーパスに蓄積する工程と、
前記文章中の前記所定の単語群を前記コーパスに蓄積された単語で置換して該文章を統合する工程と、
前記統合された文章からなる検索対象事例を学習によってベクトル化する工程と、
を備え、前記ベクトル化された検索対象事例を前記所定の事例の検索対象とすることを特徴とする事例検索方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/038474 WO2020079749A1 (ja) | 2018-10-16 | 2018-10-16 | 事例検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020079749A1 JPWO2020079749A1 (ja) | 2021-11-18 |
JP7167996B2 true JP7167996B2 (ja) | 2022-11-09 |
Family
ID=70283419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020551629A Active JP7167996B2 (ja) | 2018-10-16 | 2018-10-16 | 事例検索方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220027397A1 (ja) |
JP (1) | JP7167996B2 (ja) |
WO (1) | WO2020079749A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002257757A (ja) | 2001-03-05 | 2002-09-11 | Rigaku Industrial Co | 蛍光x線分析装置 |
JP2002259445A (ja) | 2001-03-02 | 2002-09-13 | Fuji Xerox Co Ltd | 対応カテゴリ検索システムおよび方法 |
JP2006331245A (ja) | 2005-05-30 | 2006-12-07 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置、情報検索方法およびプログラム |
JP2010170306A (ja) | 2009-01-22 | 2010-08-05 | Toshiba Corp | 対訳可逆性適性判断システムおよび機械翻訳システム |
JP2011175306A (ja) | 2008-05-13 | 2011-09-08 | Nec Corp | 情報処理装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020004786A1 (en) * | 2000-06-21 | 2002-01-10 | Olympus Optical Co Ltd | Information offering system |
JP2002269136A (ja) * | 2001-03-14 | 2002-09-20 | Ricoh Co Ltd | 文書検索システム及びプログラム |
NO316480B1 (no) * | 2001-11-15 | 2004-01-26 | Forinnova As | Fremgangsmåte og system for tekstuell granskning og oppdagelse |
US7319949B2 (en) * | 2003-05-27 | 2008-01-15 | Microsoft Corporation | Unilingual translator |
US7289983B2 (en) * | 2003-06-19 | 2007-10-30 | International Business Machines Corporation | Personalized indexing and searching for information in a distributed data processing system |
US20040260680A1 (en) * | 2003-06-19 | 2004-12-23 | International Business Machines Corporation | Personalized indexing and searching for information in a distributed data processing system |
US8027876B2 (en) * | 2005-08-08 | 2011-09-27 | Yoogli, Inc. | Online advertising valuation apparatus and method |
US9684683B2 (en) * | 2010-02-09 | 2017-06-20 | Siemens Aktiengesellschaft | Semantic search tool for document tagging, indexing and search |
US9235806B2 (en) * | 2010-06-22 | 2016-01-12 | Primal Fusion Inc. | Methods and devices for customizing knowledge representation systems |
US20160048936A1 (en) * | 2013-03-15 | 2016-02-18 | Search For Yeti, LLC | Computer-Implemented Methods of and Systems for Analyzing Patent Claims |
KR20140121580A (ko) * | 2013-04-08 | 2014-10-16 | 한국전자통신연구원 | 자동 번역 및 통역 장치 및 그 방법 |
US20150127634A1 (en) * | 2013-11-07 | 2015-05-07 | Ricoh Company, Ltd. | Electronic document retrieval and reporting |
US9836529B2 (en) * | 2014-09-22 | 2017-12-05 | Oracle International Corporation | Semantic text search |
US20170075877A1 (en) * | 2015-09-16 | 2017-03-16 | Marie-Therese LEPELTIER | Methods and systems of handling patent claims |
JP6824062B2 (ja) * | 2017-02-14 | 2021-02-03 | 日本電子株式会社 | イオン化法選択支援装置及び方法 |
US11256803B2 (en) * | 2017-03-03 | 2022-02-22 | Nippon Telegraph And Telephone Corporation | Malware detection: selection apparatus, selection method, and selection program |
-
2018
- 2018-10-16 US US17/285,790 patent/US20220027397A1/en active Pending
- 2018-10-16 WO PCT/JP2018/038474 patent/WO2020079749A1/ja active Application Filing
- 2018-10-16 JP JP2020551629A patent/JP7167996B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002259445A (ja) | 2001-03-02 | 2002-09-13 | Fuji Xerox Co Ltd | 対応カテゴリ検索システムおよび方法 |
JP2002257757A (ja) | 2001-03-05 | 2002-09-11 | Rigaku Industrial Co | 蛍光x線分析装置 |
JP2006331245A (ja) | 2005-05-30 | 2006-12-07 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置、情報検索方法およびプログラム |
JP2011175306A (ja) | 2008-05-13 | 2011-09-08 | Nec Corp | 情報処理装置 |
JP2010170306A (ja) | 2009-01-22 | 2010-08-05 | Toshiba Corp | 対訳可逆性適性判断システムおよび機械翻訳システム |
Also Published As
Publication number | Publication date |
---|---|
WO2020079749A1 (ja) | 2020-04-23 |
JPWO2020079749A1 (ja) | 2021-11-18 |
US20220027397A1 (en) | 2022-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115186050B (zh) | 基于自然语言处理的选题推荐方法、系统及相关设备 | |
JP2011118689A (ja) | 検索方法及びシステム | |
Hazman et al. | Ontology learning from domain specific web documents | |
Abdurakhmonova et al. | Uzbek electronic corpus as a tool for linguistic analysis | |
JP7167997B2 (ja) | 文献検索方法および文献検索システム | |
Ahmad et al. | Semantic-based ontology for Malay Qur'an reader | |
RU2563148C2 (ru) | Система и метод семантического поиска | |
JP7167996B2 (ja) | 事例検索方法 | |
Mahajani et al. | Ranking-based sentence retrieval for text summarization | |
El Idrissi et al. | HCHIRSIMEX: An extended method for domain ontology learning based on conditional mutual information | |
Baisa et al. | Turkic language support in Sketch Engine | |
Elmenshawy et al. | Automatic arabic text summarization (AATS): A survey | |
JP7312841B2 (ja) | 法律分析装置、及び法律分析方法 | |
Ferilli et al. | On Frequency-Based Approaches to Learning Stopwords and the Reliability of Existing Resources—A Study on Italian Language | |
Terekhov et al. | Semantic Search System with Metagraph Knowledge Base and Natural Language Processing | |
JP7078126B2 (ja) | 事例検索方法 | |
Turenne et al. | Exploration of a balanced reference corpus with a wide variety of text mining tools | |
Mezghanni et al. | Information retrieval from unstructured Arabic legal data | |
Princy et al. | The process of converting natural language to SQLQuery. | |
Kim et al. | Translation Memory Retrieval Using Lucene | |
ISLAM | QUESTION ANSWERING SYSTEM FROM UNSTRUCTURED DOCUMENTS FOR BANGLA LANGUAGE | |
Audeh et al. | Comparative Study of Unsupervised Keyword Extraction Methods for Job Recommendation in an Industrial Environment | |
Ajit et al. | The Process Of Converting Natural Language To Sqlquery | |
El idrissi esserhrouchni et al. | OntologyLine: A New Framework for Learning Non-taxonomic Relations of Domain Ontology | |
Kahlawi | An ontology-driven DBpedia quality enhancement to support Entity Annotation for Arabic Text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210415 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210415 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210728 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220909 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220927 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221010 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7167996 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |