JP7100542B2 - 検索支援装置および検索支援方法 - Google Patents
検索支援装置および検索支援方法 Download PDFInfo
- Publication number
- JP7100542B2 JP7100542B2 JP2018162141A JP2018162141A JP7100542B2 JP 7100542 B2 JP7100542 B2 JP 7100542B2 JP 2018162141 A JP2018162141 A JP 2018162141A JP 2018162141 A JP2018162141 A JP 2018162141A JP 7100542 B2 JP7100542 B2 JP 7100542B2
- Authority
- JP
- Japan
- Prior art keywords
- sentences
- annotation
- sentence
- search
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
索効率は明らかに高くなる。
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、本実施形態の検索支援装置100を含むネットワーク構成図である。図1に示す検索支援装置100は、効率的なアノテーションおよび当該アノテーションの結果を用いた精度良好な文章検索を可能とするコンピュータ装置である。
図2に、本実施形態の検索支援装置100のハードウェア構成例を示す。また、本実施形態の検索支援装置100のハードウェア構成は以下の如くとなる。
続いて、本実施形態の検索支援装置100が用いるテーブル類について説明する。図3に、本実施形態における検索対象文書125の一例を示す。
以下、本実施形態における検索支援方法の実際手順について図に基づき説明する。以下で説明する検索支援方法に対応する各種動作は、検索支援装置100がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
Rule1-1-1 S(n1)、V(v1)
Rule1-1-2 S(n2)、V(v1)
2文型(S+V+C)・・・全6パターン→重複削除で4パターン
Rule1-2-1 S(n1)、V(v1)・・・「Rule1-1-1」と重複
Rule1-2-2 S(n2)、V(v1)・・・「Rule1-1-2」と重複
Rule1-2-3 C(n1)、V(v1)
Rule1-2-4 C(n2)、V(v1)
Rule1-2-5 S(n1)、V(v1)、C(n2)
Rule1-2-6 S(n2)、V(v1)、C(n1)
3文型(S+V+O)・・・全6パターン→重複削除で4パターン
Rule1-3-1 S(n1)、V(v1)・・・「Rule1-1-1」と重複
Rule1-3-2 S(n2)、V(v1)・・・「Rule1-1-2」と重複
Rule1-3-3 O(n1)、V(v1)
Rule1-3-4 O(n2)、V(v1)
Rule1-3-5 S(n1)、V(v1)、O(n2)
Rule1-3-6 S(n2)、V(v1)、O(n1)
4文型(S+V+IO+DO)・・・12パターン → 重複削除で10パターン
Rule1-4-1 S(n1)、V(v1)・・・「Rule1-1-1」と重複
Rule1-4-2 S(n2)、V(v1)・・・「Rule1-1-2」と重複
Rule1-4-3 IO(n1)、V(v1)
Rule1-4-4 IO(n2)、V(v1)
Rule1-4-5 DO(n1)、V(v1)
Rule1-4-6 DO(n2)、V(v1)
Rule1-4-7 S(n1)、V(v1)、IO(n2)
Rule1-4-8 S(n2)、V(v1)、IO(n1)
Rule1-4-9 S(n1)、V(v1)、DO(n2)
Rule1-4-10 S(n2)、V(v1)、DO(n1)
Rule1-4-11 V(v1)、IO(n1)、DO(n2)
Rule1-4-12 V(v1)、IO(n2)、DO(n1)
5文型(S+V+O+C)・・・12パターン→重複削除で2パターン
Rule1-5-1 S(n1)、V(v1)・・・「Rule1-1-1」と重複
Rule1-5-2 S(n2)、V(v1)・・・「Rule1-1-2」と重複
Rule1-5-3 O(n1)、V(v1)・・・「Rule1-3-3」と重複
Rule1-5-4 O(n2)、V(v1)・・・「Rule1-3-4」と重複
Rule1-5-5 C(n1)、V(v1)・・・「Rule1-2-3」と重複
Rule1-5-6 C(n2)、V(v1)・・・「Rule1-2-4」と重複
Rule1-5-7 S(n1)、V(v1)、O(n2)・・・「Rule1-3-5」と重複
Rule1-5-8 S(n2)、V(v1)、O(n1)・・・「Rule1-3-6」と重複
Rule1-5-9 S(n1)、V(v1)、C(n2)・・・「Rule1-2-5」と重複
Rule1-5-10 S(n2)、V(v1)、C(n1)・・・「Rule1-2-6」と重複
Rule1-5-11 V(v1)、O(n1)、C(n2)
Rule1-5-12 V(v1)、O(n2)、C(n1)
続いて、検索支援装置100は、上述のs12で得たアノテーションルール候補に基づき、各文章を対象にしたアノテーションの試行を行う(s13)。
該当 Rule1-1-1 S(n1)、V(v1)
非該当 Rule1-1-2 S(n2)、V(v1)・・・「魚」は主語ではない。
非該当 Rule1-2-3 C(n1)、V(v1)・・・「私」は補語ではない。
非該当 Rule1-3-3 O(n1)、V(v1)・・・「私」は目的語ではない。
該当 Rule1-3-5 S(n1)、V(v1)、O(n2)
非該当 Rule1-3-6 S(n2)、V(v1)、O(n1)・・・「魚」は主語ではない。
非該当 Rule1-4-3 IO(n1)、V(v1)・・・「私」は目的語ではない。
非該当 Rule1-4-5 DO(n1)、V(v1)・・・「私」は目的語ではない。
該当 Rule1-4-7 S(n1)、V(v1)、IO(n2)
非該当 Rule1-4-8 S(n2)、V(v1)、IO(n1)・・・「私」は目的語ではない。
非該当 Rule1-4-10 S(n2)、V(v1)、DO(n1)・・・「私」は目的語ではない。
非該当 Rule1-5-11 V(v1)、O(n1)、C(n2)・・・「私」は目的語ではない。
・Rule1-3-4・・・O(n2)、V(v1)
・Rule1-3-5・・・S(n1)、V(v1)、O(n2)
・Rule1-4-4・・・IO(n2)、V(v1)
・Rule1-4-6・・・DO(n2)、V(v1)
・Rule1-4-7・・・S(n1)、V(v1)、IO(n2)
・Rule1-4-9・・・S(n1)、V(v1)、DO(n2)
続いて、検索支援装置100は、検索対象文書125の各文書の文章に関して、適用出
来るアノテーションルールの選定処理を行う(s14)。ここで選定したアノテーションルールは、記憶部101のアノテーションルール127に格納される。
」、「Rule2」、および「Rule3」を、また、文の要素別集計の値が、主語(S)および目的語(O)の各要素に存在して「要素数」が「2」の「魚」の単語を使用している、「Rule1」および「Rule2」を、アノテーションルールとして選定することとなる。
100 検索支援装置
101 記憶部
102 プログラム
103 メモリ
104 演算部
105 入力部
106 出力部
107 通信部
125 情報
126 情報
127 情報
200 ユーザ端末
Claims (2)
- 検索対象の母集団を成す文章各々の品詞分析結果を記憶する記憶部と、
前記文章各々に関し、前記品詞分析結果が示す各単語の品詞に基づき、生成しうる文型パターンを特定する処理と、前記文章各々に対し前記文型パターン各々を照合し、当該文章の構成に該当する複数の文型パターンをアノテーションルールの候補として特定する処理と、前記特定したアノテーションルールの候補に基づき、前記文章各々を対象にしたアノテーションの試行を行って、前記文章各々に該当するアノテーションルール候補の絞り込みを行う処理と、前記文章各々に関して、前記絞り込みを経たアノテーションルールの候補のうち、該当文章数が所定基準よりも多いもの又は所定数以上の要素に使用されている単語が使われているものを、前記文章各々に関して適用出来るアノテーションルールとして選定する処理と、前記選定したアノテーションルールを、前記照合に際して対象となった文章に適用してアノテーションを行い、複数のアノテーション済み文章を生成する処理と、所定装置から受けた検索要求に対し、前記選定したアノテーションルールの一覧を提示し、前記一覧の中でユーザ指定を受けたアノテーションルールに基づき、前記アノテーション済み文章から該当文章を検索結果として抽出し、当該検索結果を前記装置に出力する処理と、を実行する演算部と、
を含むことを特徴とする検索支援装置。 - 検索対象の母集団を成す文章各々の品詞分析結果を記憶する記憶部を備える情報処理装置が、
前記文章各々に関し、前記品詞分析結果が示す各単語の品詞に基づき、生成しうる文型パターンを特定する処理と、前記文章各々に対し前記文型パターン各々を照合し、当該文章の構成に該当する複数の文型パターンをアノテーションルールの候補として特定する処理と、前記特定したアノテーションルールの候補に基づき、前記文章各々を対象にしたアノテーションの試行を行って、前記文章各々に該当するアノテーションルール候補の絞り込みを行う処理と、前記文章各々に関して、前記絞り込みを経たアノテーションルールの候補のうち、該当文章数が所定基準よりも多いもの又は所定数以上の要素に使用されている単語が使われているものを、前記文章各々に関して適用出来るアノテーションルールとして選定する処理と、前記選定したアノテーションルールを、前記照合に際して対象となった文章に適用してアノテーションを行い、複数のアノテーション済み文章を生成する処理と、所定装置から受けた検索要求に対し、前記選定したアノテーションルールの一覧を提示し、前記一覧の中でユーザ指定を受けたアノテーションルールに基づき、前記アノテーション済み文章から該当文章を検索結果として抽出し、当該検索結果を前記装置に出力する処理と、
を実行することを特徴とする検索支援方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018162141A JP7100542B2 (ja) | 2018-08-30 | 2018-08-30 | 検索支援装置および検索支援方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018162141A JP7100542B2 (ja) | 2018-08-30 | 2018-08-30 | 検索支援装置および検索支援方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020035236A JP2020035236A (ja) | 2020-03-05 |
JP7100542B2 true JP7100542B2 (ja) | 2022-07-13 |
Family
ID=69668301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018162141A Active JP7100542B2 (ja) | 2018-08-30 | 2018-08-30 | 検索支援装置および検索支援方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7100542B2 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3617096B2 (ja) * | 1994-05-25 | 2005-02-02 | 富士ゼロックス株式会社 | 関係表現抽出装置および関係表現検索装置、関係表現抽出方法、関係表現検索方法 |
-
2018
- 2018-08-30 JP JP2018162141A patent/JP7100542B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020035236A (ja) | 2020-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hu et al. | Improved lexically constrained decoding for translation and monolingual rewriting | |
US11222167B2 (en) | Generating structured text summaries of digital documents using interactive collaboration | |
KR101004515B1 (ko) | 문장 데이터베이스로부터 문장들을 사용자에게 제공하는 컴퓨터 구현 방법 및 이 방법을 수행하기 위한 컴퓨터 실행가능 명령어가 저장되어 있는 유형의 컴퓨터 판독가능 기록 매체, 문장 데이터베이스로부터 확인 문장들을 검색하는 시스템이 저장되어 있는 컴퓨터 판독가능 기록 매체 | |
US11468238B2 (en) | Data processing systems and methods | |
US11481417B2 (en) | Generation and utilization of vector indexes for data processing systems and methods | |
JP5998194B2 (ja) | 対話型検索方法および装置 | |
US20040117352A1 (en) | System for answering natural language questions | |
US20160292153A1 (en) | Identification of examples in documents | |
CN111984851B (zh) | 医学资料搜索方法、装置、电子装置及存储介质 | |
US11455357B2 (en) | Data processing systems and methods | |
JPH11102374A (ja) | データベースの文書表示方法およびその装置 | |
US11681732B2 (en) | Tuning query generation patterns | |
US6535873B1 (en) | System and method for indexing electronic text | |
JPWO2003034279A1 (ja) | 情報検索方法、情報検索プログラム、情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
KR102559806B1 (ko) | 기계학습 기반의 지능형 법률 판례 검색 및 통합형 법률 서비스 방법 및 장치 | |
US20140358522A1 (en) | Information search apparatus and information search method | |
JP7100542B2 (ja) | 検索支援装置および検索支援方法 | |
KR101835994B1 (ko) | 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치 | |
JP4435144B2 (ja) | データ検索システム及びプログラム | |
US10783330B2 (en) | Understanding natural language using tumbling-frequency phrase chain parsing | |
JPH06215035A (ja) | テキスト検索装置 | |
Gonçalo Oliveira et al. | Using Lucene for Developing a Question-Answering Agent in Portuguese | |
JP2004318381A (ja) | 類義性計算方法、類義性計算プログラム、類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
Tanaka et al. | Acquiring and generalizing causal inference rules from deverbal noun constructions | |
JP2006163645A (ja) | 情報検索方法、情報検索装置、情報検索プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220628 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220701 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7100542 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |