JP2022061606A - 文書検索装置、方法、プログラムおよび学習装置 - Google Patents
文書検索装置、方法、プログラムおよび学習装置 Download PDFInfo
- Publication number
- JP2022061606A JP2022061606A JP2020169641A JP2020169641A JP2022061606A JP 2022061606 A JP2022061606 A JP 2022061606A JP 2020169641 A JP2020169641 A JP 2020169641A JP 2020169641 A JP2020169641 A JP 2020169641A JP 2022061606 A JP2022061606 A JP 2022061606A
- Authority
- JP
- Japan
- Prior art keywords
- document
- documents
- topic
- model
- display order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 239000000284 extract Substances 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 241000711573 Coronaviridae Species 0.000 description 7
- 238000013500 data storage Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 208000035473 Communicable disease Diseases 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000037213 diet Effects 0.000 description 3
- 235000005911 diet Nutrition 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000004397 blinking Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000003350 kerosene Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000013106 supervised machine learning method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
- G06F16/337—Profile generation, learning or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
第1の実施形態に係る文書検索装置について図1のブロック図を参照して説明する。
第1の実施形態に係る文書検索装置10は、検索部101と、抽出部102と、決定部103と、生成部104と、表示制御部105とを含む。
決定部103は、抽出部102からトピックに関する情報を受け取り、順序付けおよび文書の要約を生成する学習済みモデルを用いて、関連文書の表示順序を決定する。
表示制御部105は、生成部104からトピックごとの関連文書の要約を受け取り、トピックごとに、またはトピックグループごとに、関連文書の要約をグルーピングして、外部のディスプレイなどに表示するように制御する。
ステップS201では、検索部101が、クエリを取得する。
具体的に、適合性スコアは、以下の(1)式により算出される。
ステップS203では、検索部101が、検索結果として得られた関連文書のうち、関連性スコアが高い上位の文書から所定数の関連文書を取得する。例えば、検索部101が、所定数としてクエリに対する文書の関連度を算出し、関連性スコアの高い順に上位100件を処理対象の関連文書として取得する。なお、検索結果が所定数未満であれば、そのまま全ての関連文書について以降のステップの処理を実行すればよい。
ステップS205では、決定部103が、トピックが抽出された関連文書について、分散表現を生成する。例えば、文書中の単語をword2vecなどの処理により、ベクトル表現化することにより、関連文書をベクトル表記する。
ステップS207では、生成部104が、学習済みモデルを用いて、ステップS206で決定した表示順序に基づき、表示順序が上位であると決定された関連文書の要約を生成する。
図3は、一定期間の関連文書群におけるトピックの抽出およびグルーピングの例である。縦軸は文書リソースの種別を示し、横軸は時間を示す。
図4は、図3と同様に縦軸が文書リソースの種別を示し、横軸は時間を示す。図4の例では、1つの文書リソースを対象とし、時系列に起因するトピックの遷移の差分を吸収した類似トピック(または類似トピックグループ)を示す。
各分割単位の文書群41の間において、トピックに含まれる単語の分散表現ベクトルを算出し、当該分散表現ベクトル間の距離としてトピック同士の類似度を、例えばコサイン類似度などを計算することで、時系列にまたがって紐付けられる類似トピックを抽出できる。
図5は、トピックの特異性を算出する場合を示し、図5上図は、図3および図4と同様の図である。図5下図は、時系列に沿ったトピックのKL divergenceにより算出されるKL値のグラフである。
本実施形態における特異性とは、文書全体における出現単語の平均的な頻度分布と比較して、特定のトピックを含む関連文書と特定の時間幅に限定した場合に、当該文書中の出現単語の頻度分布から偏りがある場合をいう。KL divergenceによるKL値は、例えば(2)式で算出できる。
図6に示す学習済みモデルは、関連文書間の順序付けを行う順序付けモデル60と、要約を生成する要約生成モデル65とを含む混合モデルを学習させたモデルである。混合モデルは、多層ニューラルネットワークの構造を想定するが、これに限らず順序付けおよび要約生成を実行できるモデルであれば、どのようなものでもよい。
さらに、学習済みモデルは、順序付けモデル60と要約生成モデル65との間で、一部の層を共有する。具体的には、順序付けモデル60の隠れ層602と、要約生成モデル65のエンコーダ652との間で少なくとも一部の層を共有する。
なお、要約生成モデル65は、本実施形態では、いわゆるTransformerと呼ばれるエンコーダ-デコーダモデルを想定するが、Transformerを利用した、BERT(Bidirectional Encoder Representations from Transformers)、T5(Text-to-Text Transfer Transformer)といった他のモデルでもよい。または、Transformerに限らず、RNN(Recuurent Neural Network)、LSTM(Long short-term memory)といったモデルでもよく、自然言語処理(NLP)の機械学習で一般的に用いられるモデルであれば、どのようなモデルを用いてもよい。
2つの入力層601のそれぞれに対し、順序付けの比較対象となる関連文書が入力される。入力される文書は、ここでは、質疑応答が記録された議事録を想定しており、質問文に相当する文書が入力されることを想定する。なお、質問文および回答文の組の文書が入力されてもよい。入力される文書は、例えば決定部103により、Word2Vecなどの処理が施されており、分散表現化(ベクトル表現化)されていることを想定する。
順序付けネットワーク603により、抽象化された2つの文書のどちらが上位に位置づけられるか、例えば表示順序を上位にする文書であるかが出力される。ここでは、ユーザが入力文書の詳細を確認した場合に、詳細を確認した文書の方が上位となるように順序付けモデル60が学習されていることを想定する。よって、詳細を確認した文書の方が上位となるように2つの文書間の関係が出力される。
2つの入力層651のそれぞれに対し、要約のための文書が入力される。入力層651-1には、順序付けモデル60において上位と判定された文書が入力される。図6の例では、文書Aが文書Bよりも上位であると判定された場合を想定するため、入力層651-1には、文書Aが入力される。入力層651-2には、文書Aの対となる回答文であり、かつ要約対象である文書が文書A’として入力される。なお、要約対象は回答文に限らず、質問文である文書Aでもよい。この場合、入力層651-2に文書Aが入力される。もちろん、文書Aと文書A’との組が入力層651-2に入力され、文書Aおよび文書A’の両方の要約が出力されてもよい。
デコーダ653には、入力層651から文書Bが、エンコーダ652から中間データがそれぞれ入力され、文書A’がデコードされる。
出力層654には、デコードされた文書A’が入力され、文書A’の要約が出力される。すなわち、出力層654からは、つまり質問文の内容をふまえた回答文が出力される。
図7は、ディスプレイなどに表示されるトピックグループごとの要約の表示例である。なお、ここではトピックグループごとの例を示すが、トピックごとにまとめて要約を表示してもよい。
表示制御部105は、検索結果のトピックの出現頻度に応じて、トピックグループにラベルを付与して表示する。
ラベルの例としては、安全、品質のスローガンとして用いられる4H(初めて、久しぶり、頻繁、引き継ぎ)から抜粋することが挙げられる。
第2の実施形態では、学習済みモデルを学習するための学習装置について、図9を参照して説明する。
第2の実施形態に係る学習装置90は、モデル格納部901と、学習データ格納部902と、学習部903とを含む。
一方、要約生成を実行するモデルに対しては、質問文と回答文とを入力データとし、回答文の要約を正解データとした学習データを複数用意する。要約は、既存のアルゴリズムを用いて、入力された回答文から生成されればよい。既存の要約アルゴリズムとは、例えば、TFIDF-max、LexRankおよびEmbRankが挙げられる。
なお、学習装置90は、学習データ格納部902を含まず、学習データを格納する外部サーバなどから学習データを取得するようにしてもよい。
順序付けモデル60に対して、関心情報がある文書である文書Aと、関心情報がない文書である文書Bとを入力データを入力し、関心情報がある文書Aが文書Bよりも上位である結果を正解データとして入力することで、順序付けモデル60の学習を実施する。当該学習を通じて、ユーザが詳細を確認した文書は、詳細が確認されていない文書よりも順位が上位になるように順序付けモデル60を学習することができる。
また、要約生成モデル65の正解データの第2の変形例として、回答文の要約に加えて、質問文の要約も併せて正解データとして学習させてもよい。これにより、推論時には、質問文および回答文のそれぞれの要約を出力できる。
さらに、要約生成モデル65に対して、質問文を含む複数の文書を束ねたトピック文書群を入力データとし、トピック文書群の要約を正解データとして与え、学習させることで、文単位や質問文と回答文との対の単位ではなく、より大きな単位であるトピック単位での要約を出力できる。
文書検索装置10および学習装置90は、CPU(Central Processing Unit)51と、RAM(Random Access Memory)52と、ROM(Read Only Memory)53と、ストレージ54と、表示装置55と、入力装置56と、通信装置57とにより実現され、それぞれバスにより接続される。
入力装置56は、マウスおよびキーボード等の入力デバイスである。入力装置56は、ユーザから操作入力された情報を指示信号として受け付け、指示信号をCPU51に出力する。
通信装置57は、CPU51からの制御に応じて外部機器とネットワークを介して通信する。
図12に従来例となるユーザからのクエリに関する検索結果の表示例を示す。
図12に示すように、全文検索による検索結果が表示され、ユーザが入力したクエリに対して一致する質問文および回答文の全文が表示される。よって、比較例では、全文を表示するための領域が必要であるために表示領域に表示される質問文および回答文の総数が少なく、さらに全文記載されるため要点が把握しずらい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
Claims (11)
- 複数の文書からクエリに関連する1以上の関連文書を検索する検索部と、
前記関連文書のトピックを抽出する抽出部と、
表示順序および文書の要約を生成する学習済みモデルを用いて、前記関連文書の表示順序を決定する決定部と、
前記表示順序の決定結果と前記学習済みモデルとを用いて、前記トピックごとに前記関連文書の要約を生成する生成部と、
を具備する文書検索装置。 - 前記トピックごとに前記関連文書の要約をグルーピングして表示する表示制御部をさらに具備する、請求項1に記載の文書検索装置。
- 前記表示制御部は、関連文書の数が多いトピックから順に表示する、請求項2に記載の文書検索装置。
- 前記表示制御部は、前記トピックに対して、時系列に沿った前記トピックの出現頻度に基づくラベルを付与する請求項2または請求項3に記載の文書検索装置。
- 前記関連文書は、第1文書と前記第1文書に関連する第2文書とが対となる構造を有する文書である、請求項1から請求項4のいずれか1項に記載の文書検索装置。
- 前記生成部は、少なくとも前記第2文書の要約を生成する、請求項5に記載の文書検索装置。
- 前記関連文書は、第1文書と前記第1文書に関連する第2文書とが対となる構造を有する文書であり、
前記表示制御部は、同一のトピックを含むとしてグルーピングされた関連文書群において、前記第1文書と前記第2文書の要約とを1組として表示する、請求項2から請求項4のいずれか1項に記載の文書検索装置。 - 前記第1文書は質問文であり、前記第2文書は前記質問文に対する回答文である、請求項5から請求項7のいずれか1項に記載の文書検索装置。
- 複数の文書からクエリに関連する1以上の関連文書を検索し、
前記関連文書のトピックを抽出し、
表示順序および文書の要約を生成する学習済みモデルを用いて、前記関連文書の表示順序を決定し、
前記表示順序の決定結果と前記学習済みモデルを用いて、前記トピックごとに前記関連文書の要約を生成する、文書検索方法。 - コンピュータを、
複数の文書からクエリに関連する1以上の関連文書を検索する検索手段と、
前記関連文書のトピックを抽出する抽出手段と、
表示順序および文書の要約を生成する学習済みモデルを用いて、前記関連文書の表示順序を決定する決定手段と、
前記表示順序の決定結果と前記学習済みモデルを用いて、前記トピックごとに前記関連文書の要約を生成する生成手段として機能させるための文書検索プログラム。 - 比較対象となる複数の文書を入力データとし、ユーザが前記複数の文書のうちの1つに関心があることを示す関心情報を正解データとして第1モデルを学習することで、入力された文書のうち関心情報が付与される第1文書が上位となるように表示順序を決定する順序付けモデルを生成し、
前記第1モデルと一部の層を共有する第2モデルに対し、前記第1文書と、前記第1文書と対となる第2文書とを入力データとし、前記第2文書の要約を正解データとして学習させることで、前記第2文書の要約を生成する要約生成モデルを生成する学習部を具備する、学習装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020169641A JP7512159B2 (ja) | 2020-10-07 | 2020-10-07 | 文書検索装置、方法、プログラムおよび学習装置 |
US17/462,144 US20220107972A1 (en) | 2020-10-07 | 2021-08-31 | Document search apparatus, method and learning apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020169641A JP7512159B2 (ja) | 2020-10-07 | 2020-10-07 | 文書検索装置、方法、プログラムおよび学習装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022061606A true JP2022061606A (ja) | 2022-04-19 |
JP7512159B2 JP7512159B2 (ja) | 2024-07-08 |
Family
ID=80931398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020169641A Active JP7512159B2 (ja) | 2020-10-07 | 2020-10-07 | 文書検索装置、方法、プログラムおよび学習装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20220107972A1 (ja) |
JP (1) | JP7512159B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7546831B1 (ja) | 2023-12-14 | 2024-09-09 | 株式会社エクサウィザーズ | 情報処理方法、プログラム及び情報処理システム |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006134183A (ja) * | 2004-11-08 | 2006-05-25 | Nippon Telegr & Teleph Corp <Ntt> | 情報分類方法及び装置及びプログラム及びプログラムを格納した記憶媒体 |
JP2009238115A (ja) * | 2008-03-28 | 2009-10-15 | Toshiba Corp | 情報推薦装置および情報推薦方法 |
JP2015088064A (ja) * | 2013-10-31 | 2015-05-07 | 日本電信電話株式会社 | テキスト要約装置、方法、及びプログラム |
US20160041985A1 (en) * | 2014-08-08 | 2016-02-11 | Yahoo! Inc. | Systems and methods for suggesting headlines |
WO2019106965A1 (ja) * | 2017-12-01 | 2019-06-06 | 日本電信電話株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP2019160259A (ja) * | 2018-03-16 | 2019-09-19 | 株式会社リコー | 情報提示装置、情報提示システム、情報提示方法及びプログラム |
US20200073953A1 (en) * | 2018-08-30 | 2020-03-05 | Salesforce.Com, Inc. | Ranking Entity Based Search Results Using User Clusters |
JP2020047246A (ja) * | 2018-09-13 | 2020-03-26 | シャープ株式会社 | 情報処理装置、ユーザ端末装置、制御方法および制御プログラム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1629834A (zh) * | 2003-12-17 | 2005-06-22 | 国际商业机器公司 | 计算机辅助写作、电子文档的浏览、检索和预订发布 |
JP4810466B2 (ja) * | 2007-02-28 | 2011-11-09 | 株式会社東芝 | 情報提示装置、プログラム及び情報提示方法 |
US20080300872A1 (en) * | 2007-05-31 | 2008-12-04 | Microsoft Corporation | Scalable summaries of audio or visual content |
US8296176B1 (en) * | 2010-01-15 | 2012-10-23 | Adchemy, Inc. | Matching visitors as leads to lead buyers |
CN102903008B (zh) * | 2011-07-29 | 2016-05-18 | 国际商业机器公司 | 用于计算机问答的方法及系统 |
US9842585B2 (en) * | 2013-03-11 | 2017-12-12 | Microsoft Technology Licensing, Llc | Multilingual deep neural network |
JP2015060581A (ja) * | 2013-09-20 | 2015-03-30 | 株式会社東芝 | キーワード抽出装置、方法およびプログラム |
JP6517718B2 (ja) * | 2016-03-11 | 2019-05-22 | 株式会社東芝 | 会議支援装置、会議支援方法、及び会議支援プログラム |
CN109964224A (zh) * | 2016-09-22 | 2019-07-02 | 恩芙润斯公司 | 用于语义信息可视化和指示生命科学实体之间显著关联的时间信号推断的系统、方法和计算机可读介质 |
US10261954B2 (en) * | 2016-12-30 | 2019-04-16 | Dropbox, Inc. | Optimizing search result snippet selection |
US10972299B2 (en) | 2017-09-06 | 2021-04-06 | Cisco Technology, Inc. | Organizing and aggregating meetings into threaded representations |
US20200320894A1 (en) * | 2019-04-05 | 2020-10-08 | Financial Finesse, Inc. | Interactive coaching interface |
CN111125335B (zh) * | 2019-12-27 | 2021-04-06 | 北京百度网讯科技有限公司 | 问答处理方法、装置、电子设备和存储介质 |
-
2020
- 2020-10-07 JP JP2020169641A patent/JP7512159B2/ja active Active
-
2021
- 2021-08-31 US US17/462,144 patent/US20220107972A1/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006134183A (ja) * | 2004-11-08 | 2006-05-25 | Nippon Telegr & Teleph Corp <Ntt> | 情報分類方法及び装置及びプログラム及びプログラムを格納した記憶媒体 |
JP2009238115A (ja) * | 2008-03-28 | 2009-10-15 | Toshiba Corp | 情報推薦装置および情報推薦方法 |
JP2015088064A (ja) * | 2013-10-31 | 2015-05-07 | 日本電信電話株式会社 | テキスト要約装置、方法、及びプログラム |
US20160041985A1 (en) * | 2014-08-08 | 2016-02-11 | Yahoo! Inc. | Systems and methods for suggesting headlines |
WO2019106965A1 (ja) * | 2017-12-01 | 2019-06-06 | 日本電信電話株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP2019160259A (ja) * | 2018-03-16 | 2019-09-19 | 株式会社リコー | 情報提示装置、情報提示システム、情報提示方法及びプログラム |
US20200073953A1 (en) * | 2018-08-30 | 2020-03-05 | Salesforce.Com, Inc. | Ranking Entity Based Search Results Using User Clusters |
JP2020047246A (ja) * | 2018-09-13 | 2020-03-26 | シャープ株式会社 | 情報処理装置、ユーザ端末装置、制御方法および制御プログラム |
Non-Patent Citations (1)
Title |
---|
佐々木 拓郎: "情報利得比に基づく語の重要度とMMRの統合による複数文書要約", 情報処理学会研究報告, vol. 第2002巻, 第104号, JPN6023049420, 13 November 2002 (2002-11-13), pages 63 - 70, ISSN: 0005210593 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7546831B1 (ja) | 2023-12-14 | 2024-09-09 | 株式会社エクサウィザーズ | 情報処理方法、プログラム及び情報処理システム |
Also Published As
Publication number | Publication date |
---|---|
US20220107972A1 (en) | 2022-04-07 |
JP7512159B2 (ja) | 2024-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11132370B2 (en) | Generating answer variants based on tables of a corpus | |
Golder et al. | Usage patterns of collaborative tagging systems | |
US10366107B2 (en) | Categorizing questions in a question answering system | |
US9996604B2 (en) | Generating usage report in a question answering system based on question categorization | |
US20190370397A1 (en) | Artificial intelligence based-document processing | |
US10095740B2 (en) | Selective fact generation from table data in a cognitive system | |
US10783179B2 (en) | Automated article summarization, visualization and analysis using cognitive services | |
Strohmaier et al. | Acquiring knowledge about human goals from search query logs | |
Bellot et al. | INEX Tweet Contextualization task: Evaluation, results and lesson learned | |
US20160239740A1 (en) | Question Answering with Time-Based Weighting | |
Cheng et al. | Exploring contextual factors from consumer reviews affecting movie sales: an opinion mining approach | |
Shani et al. | Mining recommendations from the web | |
US11397731B2 (en) | Method and system for interactive keyword optimization for opaque search engines | |
Pera et al. | Analyzing book-related features to recommend books for emergent readers | |
Völske et al. | What users ask a search engine: Analyzing one billion russian question queries | |
Panja | Information Retrieval Systems in Healthcare: Understanding Medical Data Through Text Analysis | |
JP2017068862A (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
Uçar et al. | A novel algorithm for extracting the user reviews from web pages | |
Itani | Sentiment analysis and resources for informal Arabic text on social media | |
JP7512159B2 (ja) | 文書検索装置、方法、プログラムおよび学習装置 | |
Zhang | A personalized recommendation algorithm based on text mining | |
Alagarsamy et al. | A fuzzy content recommendation system using similarity analysis, content ranking and clustering | |
Qin | A framework and practical implementation for sentiment analysis and aspect exploration | |
Bao | [Retracted] Analysis of Music Retrieval Based on Emotional Tags Environment | |
Al-Abdullatif et al. | Using online hotel customer reviews to improve the booking process |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20230105 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240528 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240626 |