JP7256357B2 - 情報処理装置、制御方法、プログラム - Google Patents
情報処理装置、制御方法、プログラム Download PDFInfo
- Publication number
- JP7256357B2 JP7256357B2 JP2018205385A JP2018205385A JP7256357B2 JP 7256357 B2 JP7256357 B2 JP 7256357B2 JP 2018205385 A JP2018205385 A JP 2018205385A JP 2018205385 A JP2018205385 A JP 2018205385A JP 7256357 B2 JP7256357 B2 JP 7256357B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- search
- text
- target document
- search target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明の目的は、情報検索における順位学習において、学習データを効果的に使うことで精度向上の効果を高め、また学習時間が短縮を可能とする技術を提供することである。
図5は、本発明の実施形態に係る生成された素性ベクトルの一例である。本発明における類似検索は、“学習時”および実際にユーザなどがFAQを閲覧する“問合せ時”がある。何れの場合も素性ベクトルを生成する。
まず各FAQを正解とする学習データの数により適切な学習データを選択する方法を提示する。設定パラメータ1100(図11)にある学習実行件数に10とある記載に基づき、1つのFAQに対応する学習データが10件以上ある場合だけ、それらの学習データを適切な学習データとして、順位学習に利用する方法を提示する。
その他の方法を記載する。学習データに含まれるクエリが適切なものであれば、学習をしていない状態であっても(すなわち情報検索部131による検索であっても)、正解となるFAQは比較的上位に来る。そのため、例えば50位を閾値として、学習データのクエリで検索した結果、対応づけられる正解のFAQが50位以内に入っている場合は、その学習データはよい学習データである、と見なす。
実施形態2と類似の方法として、閾値として順位ではなく、クエリとFAQの検索結果の類似度(検索スコア)を用いる。すなわち、類似度が一定の値以上であれば、よい学習データであると見なす。
実施形態4として、実施形態3,4を合わせて順位と類似度の両方を閾値とする方法もある。その他、学習データと検索結果の中の正解に対し、類似度と関連する数値的な情報、内部に含まれる単語など言語的な情報、また単一の学習データではなく他の学習データと正解FAQから得られる統計値などを用いて分類できるのであれば、如何なる方法であってもよいことはいうまでもない。
101 学習データ前処理部
102 学習時検索部
103 情報検索部
104 学習用素性ベクトル生成部
105 学習用素性ベクトルマッピング部
106 学習モデル生成部
111 ユーザ条件受付部
112 ユーザ条件検索部
113 再ランク付け用素性ベクトル生成部
114 再ランク付け用素性ベクトルマッピング部
115 再ランク付け部
121 学習データ記憶部
122 設定記憶部
123 学習言語情報記憶部
124 検索対象文書記憶部
125 学習モデル記憶部
Claims (8)
- 検索テキストにより検索対象文書を検索する検索手段と、検索対象文書に係る情報と当該検索対象文書に対応する学習用検索テキストとを記憶する記憶手段とを備える情報処理装置であって、
前記検索対象文書に対応する学習用検索テキストに基づき、前記検索対象文書に対する付加テキスト情報を作成する作成手段と、
前記学習用検索テキストと、当該学習用検索テキストに対応する検索対象文書に対する付加テキスト情報とに基づく数値を少なくとも含む素性ベクトルを、対応する次元の座標空間にマッピングすることにより、前記検索手段による検索結果を順位付けるための学習モデルを生成する学習手段と
を備えることを特徴とする情報処理装置。 - 前記学習手段は、前記学習用検索テキストと、当該学習用検索テキストに対応する検索対象文書に対する付加テキスト情報とに基づく数値より成る素性ベクトルを、対応する次元の座標空間にマッピングすることにより前記学習モデルを生成することを特徴とする請求項1に記載の情報処理装置。
- 前記素性ベクトルに、前記学習用検索テキストにより前記検索対象文書が検索された場合の検索スコアを追加することを特徴とする請求項1または2に記載の情報処理装置。
- 前記付加テキスト情報は、前記学習用検索テキストから抽出された特徴語を含むことを特徴とする請求項1~3のいずれか1項に記載の情報処理装置。
- 前記付加テキスト情報に含まれる特徴語の数が所定の値に従って制限されることを特徴とする請求項4に記載の情報処理装置。
- 前記付加テキスト情報は、前記検索対象文書に対応する学習用検索テキストを含むことを特徴とする請求項1~5のいずれか1項に記載の情報処理装置。
- 検索テキストにより検索対象文書を検索する検索手段と、検索対象文書に係る情報と当該検索対象文書に対応する学習用検索テキストとを記憶する記憶手段とを備える情報処理装置の制御方法であって、
作成手段が、前記検索対象文書に対応する学習用検索テキストに基づき、前記検索対象文書に対する付加テキスト情報を作成する作成ステップと、
学習手段が、前記学習用検索テキストと、当該学習用検索テキストに対応する検索対象文書に対する付加テキスト情報とに基づく数値を少なくとも含む素性ベクトルを、対応する次元の座標空間にマッピングすることにより、前記検索手段による検索結果を順位付けるための学習モデルを生成する学習ステップと
を備える情報処理装置の制御方法。 - 検索テキストにより検索対象文書を検索する検索手段と、検索対象文書に係る情報と当該検索対象文書に対応する学習用検索テキストとを記憶する記憶手段とを備える情報処理装置において実行可能なプログラムであって、
前記情報処理装置を、
前記検索対象文書に対応する学習用検索テキストに基づき、前記検索対象文書に対する付加テキスト情報を作成する作成手段と、
前記学習用検索テキストと、当該学習用検索テキストに対応する検索対象文書に対する付加テキスト情報に基づく数値を少なくとも含む素性ベクトルを、対応する次元の座標空間にマッピングすることにより、前記検索手段による検索結果を順位付けるための学習モデルを生成する学習手段
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018205385A JP7256357B2 (ja) | 2018-10-31 | 2018-10-31 | 情報処理装置、制御方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018205385A JP7256357B2 (ja) | 2018-10-31 | 2018-10-31 | 情報処理装置、制御方法、プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020071678A JP2020071678A (ja) | 2020-05-07 |
JP2020071678A5 JP2020071678A5 (ja) | 2022-08-30 |
JP7256357B2 true JP7256357B2 (ja) | 2023-04-12 |
Family
ID=70549581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018205385A Active JP7256357B2 (ja) | 2018-10-31 | 2018-10-31 | 情報処理装置、制御方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7256357B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6886738B1 (ja) * | 2020-05-11 | 2021-06-16 | Jeインターナショナル株式会社 | オペレーション支援装置、オペレーション支援方法、およびプログラム |
JP7030296B1 (ja) * | 2021-05-26 | 2022-03-07 | 株式会社エス・ケイ通信 | プログラム、方法、情報処理装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006338457A (ja) | 2005-06-03 | 2006-12-14 | Fuji Xerox Co Ltd | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
JP2011141838A (ja) | 2010-01-08 | 2011-07-21 | Fujitsu Ltd | 情報処理装置、情報処理プログラム、及び、情報処理方法 |
JP2013061718A (ja) | 2011-09-12 | 2013-04-04 | Nippon Telegr & Teleph Corp <Ntt> | サポートベクタ選択装置、方法、及びプログラム |
JP2013161330A (ja) | 2012-02-07 | 2013-08-19 | Nippon Telegr & Teleph Corp <Ntt> | 学習データ生成装置、検索装置、学習データ生成方法、検索方法及びそのプログラム |
JP2013254420A (ja) | 2012-06-08 | 2013-12-19 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答装置、モデル学習装置、方法、及びプログラム |
-
2018
- 2018-10-31 JP JP2018205385A patent/JP7256357B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006338457A (ja) | 2005-06-03 | 2006-12-14 | Fuji Xerox Co Ltd | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
JP2011141838A (ja) | 2010-01-08 | 2011-07-21 | Fujitsu Ltd | 情報処理装置、情報処理プログラム、及び、情報処理方法 |
JP2013061718A (ja) | 2011-09-12 | 2013-04-04 | Nippon Telegr & Teleph Corp <Ntt> | サポートベクタ選択装置、方法、及びプログラム |
JP2013161330A (ja) | 2012-02-07 | 2013-08-19 | Nippon Telegr & Teleph Corp <Ntt> | 学習データ生成装置、検索装置、学習データ生成方法、検索方法及びそのプログラム |
JP2013254420A (ja) | 2012-06-08 | 2013-12-19 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答装置、モデル学習装置、方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020071678A (ja) | 2020-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10896214B2 (en) | Artificial intelligence based-document processing | |
CN102193973B (zh) | 呈现回答 | |
US7769771B2 (en) | Searching a document using relevance feedback | |
US7089226B1 (en) | System, representation, and method providing multilevel information retrieval with clarification dialog | |
US8326842B2 (en) | Semantic table of contents for search results | |
US9767144B2 (en) | Search system with query refinement | |
US8150822B2 (en) | On-line iterative multistage search engine with text categorization and supervised learning | |
US20060095852A1 (en) | Information storage and retrieval | |
US20170103439A1 (en) | Searching Evidence to Recommend Organizations | |
JP7451747B2 (ja) | コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体 | |
JP2009104630A (ja) | 大規模な電子的なドキュメントのコレクション(集まり)を探索するためのドキュメント関連性の決定に対する機械学習アプローチ | |
US20100042610A1 (en) | Rank documents based on popularity of key metadata | |
CN110737756B (zh) | 确定针对用户输入数据的应答的方法、装置、设备和介质 | |
GB2395807A (en) | Information retrieval | |
CN111813930B (zh) | 相似文档检索方法及装置 | |
US20050138079A1 (en) | Processing, browsing and classifying an electronic document | |
US20120095997A1 (en) | Providing contextual hints associated with a user session | |
JP7256357B2 (ja) | 情報処理装置、制御方法、プログラム | |
Hurtado Martín et al. | An exploratory study on content-based filtering of call for papers | |
JP2019200582A (ja) | 検索装置、検索方法及び検索プログラム | |
JP2002251412A (ja) | 文書検索装置および方法ならびに記憶媒体 | |
JP7427510B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP5310196B2 (ja) | 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法 | |
CN112905752A (zh) | 一种智能交互方法、装置、设备以及存储介质 | |
JP7273293B2 (ja) | 情報処理装置、制御方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190115 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211029 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230228 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230313 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7256357 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |