JP2020123134A - 抽出方法,情報処理装置および抽出プログラム - Google Patents
抽出方法,情報処理装置および抽出プログラム Download PDFInfo
- Publication number
- JP2020123134A JP2020123134A JP2019014459A JP2019014459A JP2020123134A JP 2020123134 A JP2020123134 A JP 2020123134A JP 2019014459 A JP2019014459 A JP 2019014459A JP 2019014459 A JP2019014459 A JP 2019014459A JP 2020123134 A JP2020123134 A JP 2020123134A
- Authority
- JP
- Japan
- Prior art keywords
- faq
- sentence
- words
- extracted
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 28
- 230000010365 information processing Effects 0.000 title claims description 80
- 238000012545 processing Methods 0.000 claims description 151
- 238000000034 method Methods 0.000 claims description 56
- 239000000284 extract Substances 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 description 97
- 230000004044 response Effects 0.000 description 35
- 230000006870 function Effects 0.000 description 23
- 238000004891 communication Methods 0.000 description 13
- 238000012986 modification Methods 0.000 description 12
- 230000004048 modification Effects 0.000 description 12
- 238000012790 confirmation Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 8
- 230000010485 coping Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 239000000470 constituent Substances 0.000 description 3
- 241000008357 Okapia johnstoni Species 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Abstract
Description
(A)構成
図1は第1実施形態の一例としての情報処理装置1aの機能構成を模式的に示す図、図2はそのハードウェア構成を例示する図である。
上述の如く構成された第1実施形態の一例としての情報処理装置1aにおけるFAQ検索方法を、図3に示すフローチャート(ステップA1〜A8)に従って説明する。
このように、第1実施形態の一例としての情報処理装置1aによれば、FAQ第1処理部120において、ユーザ質問文から抽出した特徴単語に基づき、FAQ検索部121がFAQデータ群210に対して転置インデックスで検索を行なう。そして、FAQ第2処理部130aにおいて、絞込処理部132が、FAQ検索部121によって抽出された複数のFAQ候補の中から、ユーザ質問文から抽出された特徴単語が、同一センテンス(文)内にあるFAQ候補をユーザに提供するFAQとして抽出(選択)する絞り込みを行なう。
(A)構成
図4は本発明の第2実施形態の一例としての情報処理装置1bの機能構成を模式的に示す図である。
以下、図中、既述の符号と同一の符号は同様の部分を示しているので、その詳細な説明は省略する。
上述の如く構成された第2実施形態の一例としての情報処理装置1bにおけるFAQ検索方法を、図6に示すフローチャート(ステップB1〜B13)に従って説明する。なお、図6に示すフローチャート中において、ステップB1〜B6においては、図3に示したフローチャートのステップA1〜A6と同様の処理が行なわれる。
このように、第2実施形態の一例としての情報処理装置1bによれば、FAQ第1処理部120において、ユーザ質問文から抽出した特徴単語に基づき、FAQ検索部121がFAQデータ群210に対して転置インデックスで検索を行なうことで複数のFAQ候補を検索する。
(A)構成
第3実施形態の情報処理装置1cは、第1実施形態の情報処理装置1aの制御部100aと、第2実施形態の情報処理装置1bの制御部100bとの両方の機能を兼ね備える。また、本第3実施形態の情報処理装置1cは、第1実施形態の情報処理装置1aと同様のハードウェア構成(図2参照)を備える。
上述の如く構成された第3実施形態の一例としての情報処理装置1cにおけるFAQ検索方法を、図5および図8〜図12を参照しながら、図7に示すフローチャート(ステップB1〜B9,A7,B10〜B13)に従って説明する。
回答候補2の特徴単語: Linux、スケジュールサーバ、Windows、実行サーバ、ネットワークジョブ
回答候補3の特徴単語:ネットワークジョブ、対処方法
第1センテンス中の特徴単語:Windows、スケジュールサーバ、Linux、実行サーバ、ネットワークジョブ
第2センテンス中の特徴単語:対処方法
第1センテンス中:Windows、スケジュールサーバ、Linux、実行サーバ、ネットワークジョブ
第1センテンス中:Linux、スケジュールサーバ、Windows、実行サーバ、ネットワークジョブ
第1センテンス中:ネットワークジョブ
第2センテンス中:対処方法
第1センテンス中:スケジュールサーバ、クラスタ環境、実行サーバ、シングルサーバ
第2センテンス中:実行サーバ
第3センテンス中:対処方法
第1センテンス中:スケジュールサーバ、クラスタ構成、ネットワークジョブ
第3実施形態の一例としての情報処理装置1cによれば、上述した第1実施形態および第2実施形態と同様の作用効果を得ることができる。
開示の技術は上述した実施形態に限定されるものではなく、各実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。
以上の実施形態に関し、さらに以下の付記を開示する。
複数のセンテンスを含む検索クエリを受け付け、
受け付けた前記検索クエリより複数の単語を抽出し、
それぞれが複数のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれる複数のセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれる前記複数のセンテンスでの出現状況との関係性を特定し、
特定した前記関係性に基づき、前記複数の文書より少なくともいずれかの文書を抽出する、
処理をコンピュータが実行することを特徴とする抽出方法。
複数の単語を含む検索クエリを受け付け、
受け付けた前記検索クエリから前記複数の単語を抽出し、
それぞれが1つ以上のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれるセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれるセンテンスでの出現状況との関係性を特定し、
特定した前記関係性に基づき、前記複数の文書の中から少なくともいずれかの文書を抽出する、
処理をコンピュータが実行することを特徴とする抽出方法。
前記検索クエリから抽出した前記複数の単語に基づき、前記複数の文書に対する検索を行なうことで、複数の候補文書を抽出し、
抽出した前記複数の候補文書の中から、前記特定した前記関係性に基づき前記文書を抽出する、
処理を前記コンピュータが実行することを特徴とする、付記1または2記載の抽出方法。
抽出した前記複数の候補文書の中から、前記検索クエリに含まれる一のセンテンスから抽出した前記複数の単語と同一の複数の単語を有するセンテンスを含む前記候補文書を前記文書として抽出する、
処理を前記コンピュータが実行することを特徴とする、付記3記載の抽出方法。
抽出した前記複数の候補文書の中から、前記検索クエリに含まれる単語の属性および係り受けと同一の単語の属性および係り受けを含む前記候補文書を前記文書として抽出する、
処理を前記コンピュータが実行することを特徴とする、付記3または4記載の抽出方法。
複数の単語を含む検索クエリを受け付ける受付部と、
受け付けた前記検索クエリから前記複数の単語を抽出する単語抽出部と、
それぞれが1つ以上のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれるセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれるセンテンスでの出現状況との関係性を特定する特定部と、
特定した前記関係性に基づき、前記複数の文書の中から少なくともいずれかの文書を抽出する文書抽出部と
を備えることを特徴とする、情報処理装置。
前記検索クエリから抽出した前記複数の単語に基づき、前記複数の文書に対する検索を行なうことで、複数の候補文書を抽出する検索部を備え、
前記文書抽出部が、
抽出した前記複数の候補文書の中から、前記特定した前記関係性に基づき前記文書を抽出する、
ことを特徴とする、付記6記載の情報処理装置。
前記文書抽出部が、
前記検索部が抽出した前記複数の候補文書の中から、前記検索クエリに含まれる一のセンテンスから抽出した前記複数の単語と同一の複数の単語を有するセンテンスを含む前記候補文書を前記文書として抽出する、
ことを特徴とする、付記7記載の情報処理装置。
前記文書抽出部が、
前記検索部が抽出した前記複数の候補文書の中から、前記検索クエリに含まれる単語の属性および係り受けと同一の単語の属性および係り受けを含む前記候補文書を前記文書として抽出する、
ことを特徴とする、付記7または8記載の情報処理装置。
複数の単語を含む検索クエリを受け付け、
受け付けた前記検索クエリから前記複数の単語を抽出し、
それぞれが1つ以上のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれるセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれるセンテンスでの出現状況との関係性を特定し、
特定した前記関係性に基づき、前記複数の文書の中から少なくともいずれかの文書を抽出する、
処理をコンピュータに実行させることを特徴とする抽出プログラム。
前記検索クエリから抽出した前記複数の単語に基づき、前記複数の文書に対する検索を行なうことで、複数の候補文書を抽出し、
抽出した前記複数の候補文書の中から、前記特定した前記関係性に基づき前記文書を抽出する、
処理を前記コンピュータに実行させることを特徴とする、付記10記載の抽出プログラム。
抽出した前記複数の候補文書の中から、前記検索クエリに含まれる一のセンテンスから抽出した前記複数の単語と同一の複数の単語を有するセンテンスを含む前記候補文書を前記文書として抽出する、
処理を前記コンピュータに実行させることを特徴とする、付記11記載の抽出プログラム。
抽出した前記複数の候補文書の中から、前記検索クエリに含まれる単語の属性および係り受けと同一の単語の属性および係り受けを含む前記候補文書を前記文書として抽出する、
処理を前記コンピュータに実行させることを特徴とする、付記11または12記載の抽出プログラム。
100a,100b,100c 制御部
110 質問文処理部
111 受付部
112 質問文第1処理部(単語抽出部)
113 質問文解析部
120 FAQ第1処理部
121 FAQ検索部(検索部)
130 FAQ第2処理部
131 FAQテキスト処理部(特定部)
132 絞込処理部(文書抽出部)
133 FAQ解析部
200 記憶部
210 FAQデータ群(複数の単語)
220 FAQ検索プログラム
301 入力部
302 出力部
303 通信部
15 入力インタフェース
15a キーボード(入力部)
15b マウス(入力部)
16 光学ドライブ装置
16a 光ディスク
17 機器接続インタフェース
17a メモリ装置
17b メモリリーダライタ
17c メモリカード
18 ネットワークインタフェース
19 バス
Claims (7)
- 複数のセンテンスを含む検索クエリを受け付け、
受け付けた前記検索クエリより複数の単語を抽出し、
それぞれが複数のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれる複数のセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれる前記複数のセンテンスでの出現状況との関係性を特定し、
特定した前記関係性に基づき、前記複数の文書より少なくともいずれかの文書を抽出する、
処理をコンピュータが実行することを特徴とする抽出方法。 - 複数の単語を含む検索クエリを受け付け、
受け付けた前記検索クエリから前記複数の単語を抽出し、
それぞれが1つ以上のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれるセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれるセンテンスでの出現状況との関係性を特定し、
特定した前記関係性に基づき、前記複数の文書の中から少なくともいずれかの文書を抽出する、
処理をコンピュータが実行することを特徴とする抽出方法。 - 前記検索クエリから抽出した前記複数の単語に基づき、前記複数の文書に対する検索を行なうことで、複数の候補文書を抽出し、
抽出した前記複数の候補文書の中から、前記特定した前記関係性に基づき前記文書を抽出する、
処理を前記コンピュータが実行することを特徴とする、請求項1または2記載の抽出方法。 - 抽出した前記複数の候補文書の中から、前記検索クエリに含まれる一のセンテンスから抽出した前記複数の単語と同一の複数の単語を有するセンテンスを含む前記候補文書を前記文書として抽出する、
処理を前記コンピュータが実行することを特徴とする、請求項3記載の抽出方法。 - 抽出した前記複数の候補文書の中から、前記検索クエリに含まれる単語の属性および係り受けと同一の単語の属性および係り受けを含む前記候補文書を前記文書として抽出する、
処理を前記コンピュータが実行することを特徴とする、請求項3または4記載の抽出方法。 - 複数の単語を含む検索クエリを受け付ける受付部と、
受け付けた前記検索クエリから前記複数の単語を抽出する単語抽出部と、
それぞれが1つ以上のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれるセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれるセンテンスでの出現状況との関係性を特定する特定部と、
特定した前記関係性に基づき、前記複数の文書の中から少なくともいずれかの文書を抽出する文書抽出部と
を備えることを特徴とする、情報処理装置。 - 複数の単語を含む検索クエリを受け付け、
受け付けた前記検索クエリから前記複数の単語を抽出し、
それぞれが1つ以上のセンテンスを含む複数の文書を記憶する記憶部を参照して、前記複数の文書に含まれる各文書について、抽出した前記複数の単語の、前記各文書に含まれるセンテンスでの出現状況と、抽出した前記複数の単語の、前記検索クエリに含まれるセンテンスでの出現状況との関係性を特定し、
特定した前記関係性に基づき、前記複数の文書の中から少なくともいずれかの文書を抽出する、
処理をコンピュータに実行させることを特徴とする抽出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019014459A JP2020123134A (ja) | 2019-01-30 | 2019-01-30 | 抽出方法,情報処理装置および抽出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019014459A JP2020123134A (ja) | 2019-01-30 | 2019-01-30 | 抽出方法,情報処理装置および抽出プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020123134A true JP2020123134A (ja) | 2020-08-13 |
Family
ID=71992707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019014459A Pending JP2020123134A (ja) | 2019-01-30 | 2019-01-30 | 抽出方法,情報処理装置および抽出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020123134A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022209313A1 (ja) * | 2021-03-29 | 2022-10-06 | ソニーグループ株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08129546A (ja) * | 1994-10-31 | 1996-05-21 | Toshiba Corp | 文書作成装置及び方法 |
JPH09218881A (ja) * | 1996-02-09 | 1997-08-19 | Nippon Telegr & Teleph Corp <Ntt> | 追加検索語候補提示方法、文書検索方法およびそれらの装置 |
JP2006195756A (ja) * | 2005-01-13 | 2006-07-27 | Just Syst Corp | 情報検索装置、情報検索サイトの改善方法提示装置 |
JP2006338457A (ja) * | 2005-06-03 | 2006-12-14 | Fuji Xerox Co Ltd | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
JP2009175826A (ja) * | 2008-01-22 | 2009-08-06 | Nippon Telegr & Teleph Corp <Ntt> | テキスト検索装置、テキスト検索方法、テキスト検索プログラムおよびそのプログラムを記録した記録媒体 |
JP2016053782A (ja) * | 2014-09-03 | 2016-04-14 | カシオ計算機株式会社 | 質問応答装置、質問応答方法、プログラム |
-
2019
- 2019-01-30 JP JP2019014459A patent/JP2020123134A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08129546A (ja) * | 1994-10-31 | 1996-05-21 | Toshiba Corp | 文書作成装置及び方法 |
JPH09218881A (ja) * | 1996-02-09 | 1997-08-19 | Nippon Telegr & Teleph Corp <Ntt> | 追加検索語候補提示方法、文書検索方法およびそれらの装置 |
JP2006195756A (ja) * | 2005-01-13 | 2006-07-27 | Just Syst Corp | 情報検索装置、情報検索サイトの改善方法提示装置 |
JP2006338457A (ja) * | 2005-06-03 | 2006-12-14 | Fuji Xerox Co Ltd | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
JP2009175826A (ja) * | 2008-01-22 | 2009-08-06 | Nippon Telegr & Teleph Corp <Ntt> | テキスト検索装置、テキスト検索方法、テキスト検索プログラムおよびそのプログラムを記録した記録媒体 |
JP2016053782A (ja) * | 2014-09-03 | 2016-04-14 | カシオ計算機株式会社 | 質問応答装置、質問応答方法、プログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022209313A1 (ja) * | 2021-03-29 | 2022-10-06 | ソニーグループ株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10162885B2 (en) | Automated self-service user support based on ontology analysis | |
US10303683B2 (en) | Translation of natural language questions and requests to a structured query format | |
US20200285638A1 (en) | Systems And Methods For Translating Natural Language Sentences Into Database Queries | |
US9639601B2 (en) | Question answering system adapted to style of user requests | |
US9740685B2 (en) | Generation of natural language processing model for an information domain | |
AU2012235939B2 (en) | Real-time automated interpretation of clinical narratives | |
US10754886B2 (en) | Using multiple natural language classifier to associate a generic query with a structured question type | |
US9734238B2 (en) | Context based passage retreival and scoring in a question answering system | |
KR102285142B1 (ko) | 챗봇을 위한 학습 데이터 추천 장치 및 방법 | |
US9684726B2 (en) | Realtime ingestion via multi-corpus knowledge base with weighting | |
RU2544739C1 (ru) | Способ преобразования структурированного массива данных | |
US20190155912A1 (en) | Multi-dimensional query based extraction of polarity-aware content | |
US8996357B2 (en) | Method for generating diagrams, and information processing apparatus for same | |
US10534788B2 (en) | Automatically determining a recommended set of actions from operational data | |
JP2020123134A (ja) | 抽出方法,情報処理装置および抽出プログラム | |
JP2009128967A (ja) | 文書検索装置 | |
US11017172B2 (en) | Proposition identification in natural language and usage thereof for search and retrieval | |
US11971887B2 (en) | Identifying and replacing logically neutral phrases in natural language queries for query processing | |
US20230306022A1 (en) | Identifying and replacing logically neutral phrases in natural language queries for query processing | |
WO2022123716A1 (ja) | 述語項構造修正プログラム、述語項構造修正方法、および情報処理装置 | |
EP4273738A1 (en) | Semantic representation generation method, semantic representation generation device, and semantic representation generation program | |
US20220405488A1 (en) | Providing a well-formed alternate phrase as a suggestion in lieu of a not well-formed phrase | |
US10268674B2 (en) | Linguistic intelligence using language validator |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190607 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211007 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220819 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221121 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20221121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230307 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230905 |