JP2021096761A - 検索支援装置 - Google Patents

検索支援装置 Download PDF

Info

Publication number
JP2021096761A
JP2021096761A JP2019229225A JP2019229225A JP2021096761A JP 2021096761 A JP2021096761 A JP 2021096761A JP 2019229225 A JP2019229225 A JP 2019229225A JP 2019229225 A JP2019229225 A JP 2019229225A JP 2021096761 A JP2021096761 A JP 2021096761A
Authority
JP
Japan
Prior art keywords
search
document data
keyword
unit
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019229225A
Other languages
English (en)
Other versions
JP7339148B2 (ja
Inventor
阿部 憲幸
Noriyuki Abe
憲幸 阿部
可奈子 大西
Kanako Onishi
可奈子 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2019229225A priority Critical patent/JP7339148B2/ja
Publication of JP2021096761A publication Critical patent/JP2021096761A/ja
Application granted granted Critical
Publication of JP7339148B2 publication Critical patent/JP7339148B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数のパートに分かれた文書の検索効率を向上させることができる検索支援装置を提供する。【解決手段】検索支援装置10は、互いに関連付けられた質問文と回答文とをそれぞれ含む複数の文書データの検索を支援する検索支援装置である。検索支援装置10は、ユーザにより入力された検索キーワードを取得する取得部12と、質問文及び回答文の両方を検索対象として、検索キーワードを用いて複数の文書データを検索することにより、検索キーワードに関連する文書データである一以上の関連文書を取得する検索部13と、一以上の関連文書の質問文から、一以上の関連文書を特徴付ける特徴語を抽出する抽出部14と、抽出部14により抽出された特徴語をユーザに提示する提示部15と、を備える。【選択図】図1

Description

本発明の一側面は、検索支援装置に関する。
従来、ユーザにより入力された検索キーワードに基づいて検索を行い、検索によりヒットした文書をユーザに提示する検索システムが知られている。このような検索システムにおいてユーザの所望する文書が検索によりヒットするためには、ユーザが適切な検索キーワードを入力する必要がある。しかし、必ずしもユーザが適切な検索キーワード(例えば、専門用語等)を知っているとは限らない。
特許文献1には、ユーザにより入力された検索キーワードに関連する関連キーワードをユーザに提示する仕組みが開示されている。特許文献1に記載の手法は、ユーザが入力した検索キーワードによる文書データベースの検索結果として得られた文書を第一のグループとし、検索結果として得られなかった文書を第二グループとする。そして、第一のグループの文書中から任意のキーワードが抽出され、当該キーワードを含む第一のグループの文書数が多く、当該キーワードを含む第二のグループの文書数が少ない程、当該キーワードに対してより高い評価が与えられる。そして、評価の高いキーワードが、関連キーワードとしてユーザに提示される。
特開2009−217406号公報
上述した検索システムの一形態として、複数のパートに分かれた文書を検索するシステムが存在する。例えば質問文と回答文とがペアになった文書からユーザの所望する文書を検索するFAQ検索システム等が存在する。このようなFAQ検索システムに対して、特許文献1に開示された仕組みを適用することは可能である。しかし、特許文献1に開示された仕組みは、FAQ検索システムのように検索対象となる文書データが複数のパートに分かれている点に着目した工夫を施したものではなく、ユーザの検索効率を高める観点において改善の余地がある。
そこで、本発明の一側面は、複数のパートに分かれた文書の検索効率を向上させることができる検索支援装置を提供することを目的とする。
本発明の一側面に係る検索支援装置は、互いに関連付けられた第1文字列情報と第2文字列情報とをそれぞれ含む複数の文書データの検索を支援する検索支援装置であって、ユーザにより入力された検索キーワードを取得する取得部と、第1文字列情報及び第2文字列情報の両方を検索対象として、検索キーワードを用いて複数の文書データを検索することにより、検索キーワードに関連する文書データである一以上の関連文書を取得する検索部と、一以上の関連文書の第1文字列情報から、一以上の関連文書を特徴付ける特徴語を抽出する抽出部と、抽出部により抽出された特徴語をユーザに提示する提示部と、を備える。
本発明の一側面に係る検索支援装置では、文書データの全体(第1文字列情報及び第2文字列情報)を検索範囲とすることにより、文書データの一部を検索範囲とする場合と比較して、多くの関連文書を検索により取得することができる。一方、特徴語を抽出する際には、文書データの一部(第1文字列情報)を抽出範囲とすることにより、限定された特徴語を抽出することができる。すなわち、関連文書を検索する際にはカバレッジを重視してより多くの関連文書を取得する一方で、特徴語を抽出する際には検索範囲を限定的にすることによって、より精度の高い特徴語をユーザに提示することが可能となる。そして、ユーザは、このような特徴語を新たな検索キーワード(又は追加の検索キーワード)として用いて検索を行うことにより、ユーザが所望する文書データを見つけるための検索処理を効率良く行うことができる。従って、上記検索支援装置によれば、複数のパートに分かれた文書の検索効率を向上させることができる。
本発明の一側面によれば、複数のパートに分かれた文書の検索効率を向上させることができる検索支援装置を提供することができる。
実施形態に係る検索支援装置の機能構成を示す図である。 検索支援装置によるサジェスト機能の一例を示す図である。 文書DBに記憶された文書データ及び前処理部により抽出されたキーワードの一例を示す図である。 検索支援装置の動作の一例を示すフローチャートである。 検索支援装置のハードウェア構成の一例を示す図である。
以下、添付図面を参照して、本発明の一実施形態について詳細に説明する。なお、図面の説明において同一又は相当要素には同一符号を付し、重複する説明を省略する。
図1は、一実施形態に係る検索支援装置10の機能構成を示す図である。検索支援装置10は、互いに関連付けられた第1文字列情報と第2文字列情報とをそれぞれ含む複数の文書データの検索を支援する装置である。本実施形態では一例として、第1文字列情報は、質問文を示す情報である。また、第2文字列情報は、当該質問文に対する回答文を示す情報である。すなわち、検索支援装置10は、質問文と回答文とのペアからなる文書データを検索するFAQ検索システムにおいて、ユーザの検索処理を支援する装置である。より具体的には、本実施形態では一例として、検索支援装置10は、ユーザが入力中の検索キーワードを取得し、当該検索キーワードに応じた特徴語を追加の検索キーワードとしてユーザに提示するサジェスト機能を提供する。
図2は、検索支援装置10によるサジェスト機能の一例を示す図である。図2は、例えばウェブページ等に表示された検索ウィンドウW1及びサジェストウィンドウW2を示している。検索ウィンドウW1は、ユーザによって検索キーワードが入力される領域である。この例では、検索ウィンドウW1に検索キーワード「回線契約」が入力されている。サジェストウィンドウW2は、検索支援装置10(後述する提示部15)によりユーザに提示される一以上の特徴語が表示される領域である。一例として、サジェストウィンドウW2は、ユーザにより検索キーワードが入力されたことに応じて、検索ウィンドウW1の真下に表示される。
図2の例では、サジェストウィンドウW2に、2つの特徴語「ファミリー割引」及び「家族」のそれぞれが、追加の検索キーワード(すなわち、元の検索キーワード「回線契約」と共に用いる検索キーワード)としてユーザに提示されている。仮にユーザが入力した検索キーワードのみを用いて検索を行った場合、ユーザが所望する文書データ以外の文書データを含む多くの文書データがヒットしてしまい、その中からユーザが所望する文書データを発見するために多くの手間がかかる場合がある。そこで、検索支援装置10は、適切に絞り込みを行うための追加のキーワード(すなわち、特徴語)を用いた検索をユーザに提案することにより、ユーザの検索効率を向上させる。
検索支援装置10は、一以上のコンピュータ装置によって構成される。検索支援装置10の形態は特定の形態に限定されない。例えば、検索支援装置10は、ユーザが所持するスマートフォン、タブレット端末、パーソナルコンピュータ等の端末であってもよいし、上述したような端末(クライアント端末)と通信可能に構成され、当該端末からの検索要求を処理するように構成されたサーバ装置であってもよい。
図1に示されるように、文書DB10aと、検索支援装置10は、前処理部11と、取得部12と、検索部13と、抽出部14と、提示部15と、を備えている。
文書DB10aは、検索対象となる複数の文書データを記憶するデータベースである。上述したように、各文書データは、互いに関連付けられた質問文と回答文とを含む文字列情報である。図3の上部は、文書データの一例を示している。図3に例示される文書データは、質問文「ファミリー割引を申込みできる家族の範囲は、どこまでですか?」と当該質問文に対する回答文「主回線の契約者から三親等以内の方です。」とを含んでいる。
前処理部11は、複数の文書データの各々について、文書データの質問文に含まれる一以上のキーワードを抽出し、抽出された一以上のキーワードを当該文書データに関連付ける前処理を実行する。ここで、キーワードは、一以上の単語からなる文字列である。キーワードは、後述する抽出部14により抽出される特徴語の候補となる文字列である。前処理部11は、例えば形態素解析等の公知のテキスト解析技術を用いることにより、文書データの質問文に含まれるキーワードを抽出する。
本実施形態では一例として、前処理部11は、名詞又は名詞列を上記キーワードとして抽出する。図3の例では、前処理部11によって、文書データの質問文から、それぞれ名詞である「家族」、「範囲」、及び「どこ」と、連続する2つの名詞「ファミリー」及び「割引」を結合した名詞列である「ファミリー割引」と、がキーワードとして抽出されている。特定のサービス名称等の専門用語は、「ファミリー割引」のように複数(ここでは一例として2つ)の名詞を結合した名称である場合がある。よって、上記のように名詞列をキーワードとして抽出することにより、意味のある単語のまとまりを1つのキーワードとして抽出することができる。
前処理部11は、ある文書データから上記処理により抽出された一以上のキーワードを、当該文書データに関連付ける。例えば、前処理部11は、文書DB10aに記憶されている文書データのレコード(質問文を格納する質問文フィールドと回答文を格納する回答文フィールドとを有するデータ構造)に対して、上記処理により抽出された一以上のキーワードを格納するキーワードフィールドを追加する。すなわち、前処理部11は、各文書データに対して、図3に示される質問文、回答文、及びキーワードが相互に関連付けられたデータ構造を生成する。
取得部12は、ユーザにより入力された検索キーワードを取得する。本実施形態では、取得部12は、図2に示される検索ウィンドウW1に入力された(入力途中の)検索キーワード(ここでは「回線契約」)をリアルタイムに取得するように構成されている。ここで、「入力途中の検索キーワード」とは、ユーザが検索ウィンドウW等に対する検索キーワードの入力を開始してから、検索キーワードを確定するまで(すなわち、検索キーワードを用いた検索実行を指示する操作を行うまで)の間に入力済みの検索キーワードである。
検索部13は、取得部12により取得された検索キーワードを用いて文書DB10aに記憶された複数の文書データを検索することにより、当該検索キーワードに関連する文書データである一以上の関連文書を取得する。検索部13は、各文書データの質問文及び回答文の両方を検索対象として、上記検索を実行する。このような検索処理により、例えば、質問文又は回答文に検索キーワードが含まれている文書データが、関連文書として取得される。なお、検索部13が実行する検索アルゴリズムとしては、公知の任意の検索アルゴリムを用い得る。検索部13は、カバレッジを重視して、文書データに含まれる全ての文字列を検索対象として検索を行うことにより、なるべく多くの関連文書を取得するように構成されている。
抽出部14は、検索部13により取得された一以上の関連文書の質問文から、特徴語を抽出する。本実施形態では、抽出部14は、一以上の関連文書に関連付けられた一以上のキーワード(すなわち、前処理部11によって抽出されたキーワード(図2参照))のうちから一以上の特徴語を抽出する。
本実施形態では、上述したように、前処理部11が、各文書データの質問文から、特徴語の候補である一以上のキーワードを予め抽出している。この場合、抽出部14は、当該一以上のキーワードのうちから特徴語を抽出することができる。すなわち、抽出部14は、特徴語を抽出する処理を実行する際に、その準備処理として、関連文書の質問文に含まれるキーワード(特徴語の候補)を抽出する必要がない。すなわち、前処理部11が前処理を予め実行していることにより、上記準備処理を省略することができる。その結果、抽出部14による特徴語の抽出処理が高速化される。
特徴語は、検索部13により取得された一以上の関連文書を特徴付けるキーワード(一以上の単語からなる文字列)である。例えば、特徴語は、上記一以上の関連文書において特に出現し易いキーワードである。抽出部14は、公知の任意のアルゴリズムを実行することにより、このような特徴語を抽出することができる。本実施形態では一例として、抽出部14は、関連文書におけるキーワードの出現割合(第1出現割合)と、文書DB10aに記憶された複数の文書データ全体におけるキーワードの出現割合(第2出現割合)と、に基づく評価値を算出する。そして、抽出部14は、キーワード毎の評価値に基づいて、上記一以上のキーワードのうちから特徴語を抽出する。
キーワードの第1出現割合は、一以上の関連文書のうち当該キーワードを含む関連文書の数「N1」を、検索部13により取得された一以上の関連文書の総数「Nr」で割った値「N1/Nr」である。また、キーワードの第2出現割合は、複数の文書データのうち当該キーワードを含む文書データの数「N2」を、文書DB10aに格納されている複数の文書データの総数「Na」で割った値「N2/Na」である。第1出現割合又は第2出現割合の計算において、文書データにキーワードが含まれるか否かは、文書データの質問文のみを対象として判断されてもよいし、文書データの質問文及び回答文の両方を対象として判断されてもよい。前者の場合には、質問文にキーワードを含む文書データのみが、当該キーワードを含む文書データとしてカウントされる。一方、後者の場合には、質問文及び回答文の少なくとも一方にキーワードを含む文書データが、当該キーワードを含む文書データとしてカウントされる。
上述した第1出現割合及び第2出現割合に基づく評価値の算出方法は特定の方法に限定されないが、一例として、抽出部14は、キーワード毎に、JLHスコアを上記評価値として算出する。JLHスコアは、下記式(1)〜(3)により求まるスコアである。
式(1):JLHスコア=絶対割合変化×相対割合変化
式(2):絶対割合変化=第1出現割合−第2出現割合
式(3):相対割合変化=第1出現割合/第2出現割合
具体例として、以下の状況について考える。
・検索部13により取得された関連文書の総数(Nr)=84
・文書DB10aに格納された文書データの総数(Na)=2403
・84個の関連文書のうち「ファミリー割引」を含む文書数(N1)=10
・2403個の文書データのうち「ファミリー割引」を含む文書数(N2)=23
この場合、第1出現割合「N1/Nr」は「0.1190(=10/84)」であり、第2出現割合「N2/Na」は「0.009571(=23/2403)」である。従って、絶対割合変化は、上記式(2)により、「0.1095(=0.1190−0.009571)」と算出される。また、相対割合変化は、上記式(3)により、「12.43(=0.1190/0.009571)」と算出される。よって、キーワード「ファミリー割引」の評価値(JLHスコア)は、上記式(1)により、「1.361(=0.1095×12.43)」と算出される。
提示部15は、抽出部14により抽出された特徴語をユーザに提示する。図2に示したように、本実施形態では一例として、提示部15は、サジェストウィンドウW2を介して、ユーザが入力した検索キーワードと共に使用する追加の検索キーワード(効率良く検索絞り込みを行うためのキーワード)として、特徴語をユーザに提示する。
図4に示されるフローチャートを参照して、検索支援装置10の処理の一例について説明する。
ステップS1において、前処理部11は、複数の文書データの各々について、文書データの質問文に含まれる一以上のキーワードを抽出し、抽出された一以上のキーワードを当該文書データに関連付ける前処理を実行する。
ステップS2において、取得部12は、ユーザにより入力された検索キーワードを取得する。本実施形態では、取得部12は、図2に示される検索ウィンドウW1に入力された(入力途中の)検索キーワード(ここでは「回線契約」)をリアルタイムに取得する。
ステップS3において、検索部13は、ステップS2において取得部12により取得された検索キーワードを用いて文書DB10aに記憶された複数の文書データを検索することにより、当該検索キーワードに関連する文書データである一以上の関連文書を取得する。検索部13は、各文書データの質問文及び回答文の両方を検索対象として、上記検索を実行する。
ステップS4において、抽出部14は、ステップS3において検索部13により取得された一以上の関連文書の質問文から、特徴語を抽出する。具体的には、抽出部14は、一以上の関連文書に関連付けられた一以上のキーワード(すなわち、ステップS1において前処理部11によって抽出されたキーワード)のうちから一以上の特徴語を抽出する。
ステップS5において、提示部15は、抽出部14により抽出された特徴語をユーザに提示する。
提示部15によって特徴語がユーザに提示された後、検索支援装置10は以下のように動作してもよい。すなわち、提示部15によってサジェストウィンドウW2に提示された提示キーワード(例えば、「回線契約 ファミリー割引」)がユーザによって選択されると、取得部12が、当該提示キーワードを取得する。そして、検索部13が、質問文及び回答文の両方を検索対象として、当該提示キーワードを用いて、文書DB10aに格納された複数の文書データを検索する。続いて、検索部13は、検索によりヒットした文書データを検索スコア(検索部13が使用する検索アルゴリズムに応じて付与されるスコア)順にソートし、上位N個(Nは予め定められた数)の文書データを検索結果としてユーザに提示する。以上により、ユーザは、所望の文書データを得るための適切な検索キーワード(専門用語等)を知らない場合であっても、検索支援装置10から提供される追加の検索キーワード(特徴語)を用いた検索を実行することにより、所望の文書データを効率良く発見することが可能となる。
以上説明した検索支援装置10では、検索部13が、文書データの全体(質問文及び回答文)を検索範囲とすることにより、文書データの一部を検索範囲とする場合と比較して、多くの関連文書を検索により取得することができる。一方、抽出部14が特徴語を抽出する際には、文書データの一部(第1文字列情報)を抽出範囲とすることにより、限定された特徴語を抽出することができる。すなわち、関連文書を検索する際にはカバレッジを重視してより多くの関連文書を取得する一方で、特徴語を抽出する際には検索範囲を限定的にすることによって、より精度の高い特徴語をユーザに提示することが可能となる。そして、ユーザは、このような特徴語を新たな検索キーワード(又は追加の検索キーワード)として用いて検索を行うことにより、ユーザが所望する文書データを見つけるための検索処理を効率良く行うことができる。従って、検索支援装置10によれば、複数のパートに分かれた文書の検索効率を向上させることができる。
一般に、質問文と回答文とがペアになった文書においては、回答文よりも質問文の方が短く、コンパクトにまとまっていることが多い。さらに、回答文よりも質問文にユーザが検索したい内容(知りたい内容)に関するキーワード(特徴語)が含まれていることが多い。このような性質を利用して特徴語の抽出範囲を質問文に限定することにより、ユーザが検索したい内容に関する特徴語を精度良く抽出することができる。言い換えれば、回答文を特徴語の抽出範囲から除外することにより、ユーザが検索したい内容とは無関係の特徴語が抽出される可能性を低減できる。
また、検索支援装置10は、前処理部11を備えている。そして、抽出部14は、一以上の関連文書に関連付けられた一以上のキーワード(すなわち、前処理部11により予め抽出されたキーワード)のうちから特徴語を抽出する。前処理部11によって予め上記前処理を実行しておくことにより、抽出部14による特徴語の抽出処理を簡略化することができ、当該抽出処理を高速化することができる。その結果、ユーザに対して高速に特徴語を提示することができる。より具体的には、図2に例示したサジェスト機能等のように、ユーザが検索キーワードを入力している途中の段階で、タイムリーにユーザに追加のキーワード(特徴語)を提示すること等が可能となる。
また、取得部12は、ユーザが入力途中の検索キーワードを取得し、提示部15は、上記検索キーワードと共に検索に用いる追加の検索キーワードとして、特徴語をユーザに提示する。本実施形態では、取得部12は、検索ウィンドウW1に入力された検索キーワードを、当該検索キーワードによる検索実行を指示する操作がされる前の段階で取得する。そして、提示部15は、サジェストウィンドウW2に、当該検索キーワードと共に用いる追加の検索キーワードとして特徴語を提示する。上記構成によれば、検索精度を向上させるための追加の検索キーワードをユーザにタイムリーに提示するサジェスト機能を提供することができる。
なお、上記実施形態において、前処理部11は省略されてもよい。すなわち、図4に示されるフローチャートにおけるステップS1は省略されてもよい。この場合、ステップS4において、抽出部14は、一以上の関連文書の質問文から特徴語を抽出するための準備処理として、当該一以上の関連文書に対して、上述した前処理部11による前処理に相当する処理を実行すればよい。ただし、上述したように、前処理部11により特徴語の候補であるキーワードを予め抽出しておくことにより、抽出部14の準備処理を省略することができる。その結果、サジェストウィンドウW2に特徴語が提示されるまでの時間を短縮することができ、ユーザの利便性を向上させることができる。
また、上記実施形態では、検索対象となる文書データは、質問文と回答文とを含んでいたが、検索支援装置10は、質問文及び回答文以外のペア(第1文字列情報及び第2文字列情報)を含む文書データを検索対象とする場合に適用されてもよい。
なお、上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した1つの装置を用いて実現されてもよいし、物理的又は論理的に分離した2つ以上の装置を直接的又は間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。
機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知(broadcasting)、通知(notifying)、通信(communicating)、転送(forwarding)、構成(configuring)、再構成(reconfiguring)、割り当て(allocating、mapping)、割り振り(assigning)などがあるが、これらに限られない。
例えば、本開示の一実施の形態における検索支援装置10は、本開示の通信制御方法を行うコンピュータとして機能してもよい。図5は、本開示の一実施の形態に係る検索支援装置10のハードウェア構成の一例を示す図である。上述の検索支援装置10は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。検索支援装置10のハードウェア構成は、図1に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
検索支援装置10における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002及びストレージ1003におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003及び通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、抽出部14は、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001によって実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係る通信制御方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD−ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu−ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及びストレージ1003の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。
通信装置1004は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
また、プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバス1007によって接続される。バス1007は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。
また、検索支援装置10は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。
以上、本実施形態について詳細に説明したが、当業者にとっては、本実施形態が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本実施形態は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。
本開示において説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)及び無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。
本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。
上述したパラメータに使用する名称はいかなる点においても限定的な名称ではない。さらに、これらのパラメータを使用する数式等は、本開示で明示的に開示したものと異なる場合もある。様々な情報要素は、あらゆる好適な名称によって識別できるので、これらの様々な情報要素に割り当てている様々な名称は、いかなる点においても限定的な名称ではない。
本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
本開示において使用する「第1の」、「第2の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定しない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本開示において使用され得る。したがって、第1及び第2の要素への参照は、2つの要素のみが採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。
本開示において、「含む(include)」、「含んでいる(including)」及びそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。
本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。
本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。
10…検索支援装置、10a…文書DB、11…前処理部、12…取得部、13…検索部、14…抽出部、15…提示部。

Claims (4)

  1. 互いに関連付けられた第1文字列情報と第2文字列情報とをそれぞれ含む複数の文書データの検索を支援する検索支援装置であって、
    ユーザにより入力された検索キーワードを取得する取得部と、
    前記第1文字列情報及び前記第2文字列情報の両方を検索対象として、前記検索キーワードを用いて前記複数の文書データを検索することにより、前記検索キーワードに関連する前記文書データである一以上の関連文書を取得する検索部と、
    前記一以上の関連文書の前記第1文字列情報から、前記一以上の関連文書を特徴付ける特徴語を抽出する抽出部と、
    前記抽出部により抽出された前記特徴語を前記ユーザに提示する提示部と、
    を備える検索支援装置。
  2. 前記第1文字列情報は、質問文を示す情報であり、
    前記第2文字列情報は、前記質問文に対する回答文を示す情報である、請求項1に記載の検索支援装置。
  3. 前記複数の文書データの各々について、前記文書データの前記第1文字列情報に含まれる、一以上の単語からなる一以上のキーワードを抽出し、抽出された前記一以上のキーワードを前記文書データに関連付ける前処理を実行する前処理部を更に備え、
    前記抽出部は、前記一以上の関連文書に関連付けられた前記一以上のキーワードのうちから前記特徴語を抽出する、請求項1又は2に記載の検索支援装置。
  4. 前記取得部は、前記ユーザが入力途中の前記検索キーワードを取得し、
    前記提示部は、前記検索キーワードと共に検索に用いる追加の検索キーワードとして、前記特徴語を前記ユーザに提示する、請求項1〜3のいずれか一項に記載の検索支援装置。
JP2019229225A 2019-12-19 2019-12-19 検索支援装置 Active JP7339148B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019229225A JP7339148B2 (ja) 2019-12-19 2019-12-19 検索支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019229225A JP7339148B2 (ja) 2019-12-19 2019-12-19 検索支援装置

Publications (2)

Publication Number Publication Date
JP2021096761A true JP2021096761A (ja) 2021-06-24
JP7339148B2 JP7339148B2 (ja) 2023-09-05

Family

ID=76431506

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019229225A Active JP7339148B2 (ja) 2019-12-19 2019-12-19 検索支援装置

Country Status (1)

Country Link
JP (1) JP7339148B2 (ja)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232877A (ja) * 1997-02-18 1998-09-02 Dainippon Printing Co Ltd 文字列の照合装置およびデータベースシステム
JPH11232298A (ja) * 1998-02-18 1999-08-27 Sharp Corp データ検索装置及びコンピュータ読み取り可能な記録媒体
JP2005107793A (ja) * 2003-09-30 2005-04-21 Sony Corp キーワード抽出装置、およびキーワード抽出方法、並びにコンピュータ・プログラム
JP2009009461A (ja) * 2007-06-29 2009-01-15 Fujifilm Corp キーワードの入力支援システム、コンテンツ検索システム、コンテンツ登録システム、コンテンツ検索・登録システム、およびこれらの方法、並びにプログラム
WO2015132970A1 (ja) * 2014-03-07 2015-09-11 楽天株式会社 検索装置、検索方法、プログラム及び記憶媒体
JP2016024765A (ja) * 2014-07-24 2016-02-08 ソフトバンク株式会社 情報検索装置及び情報検索プログラム
JP2016192067A (ja) * 2015-03-31 2016-11-10 株式会社日立ソリューションズ 検索装置
JP2019008367A (ja) * 2017-06-20 2019-01-17 日本電信電話株式会社 質問単語重み算出装置、質問回答検索装置、質問単語重み算出方法、質問回答検索方法、プログラム、及び記憶媒体
JP2019082860A (ja) * 2017-10-30 2019-05-30 富士通株式会社 生成プログラム、生成方法及び生成装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232877A (ja) * 1997-02-18 1998-09-02 Dainippon Printing Co Ltd 文字列の照合装置およびデータベースシステム
JPH11232298A (ja) * 1998-02-18 1999-08-27 Sharp Corp データ検索装置及びコンピュータ読み取り可能な記録媒体
JP2005107793A (ja) * 2003-09-30 2005-04-21 Sony Corp キーワード抽出装置、およびキーワード抽出方法、並びにコンピュータ・プログラム
JP2009009461A (ja) * 2007-06-29 2009-01-15 Fujifilm Corp キーワードの入力支援システム、コンテンツ検索システム、コンテンツ登録システム、コンテンツ検索・登録システム、およびこれらの方法、並びにプログラム
WO2015132970A1 (ja) * 2014-03-07 2015-09-11 楽天株式会社 検索装置、検索方法、プログラム及び記憶媒体
JP2016024765A (ja) * 2014-07-24 2016-02-08 ソフトバンク株式会社 情報検索装置及び情報検索プログラム
JP2016192067A (ja) * 2015-03-31 2016-11-10 株式会社日立ソリューションズ 検索装置
JP2019008367A (ja) * 2017-06-20 2019-01-17 日本電信電話株式会社 質問単語重み算出装置、質問回答検索装置、質問単語重み算出方法、質問回答検索方法、プログラム、及び記憶媒体
JP2019082860A (ja) * 2017-10-30 2019-05-30 富士通株式会社 生成プログラム、生成方法及び生成装置

Also Published As

Publication number Publication date
JP7339148B2 (ja) 2023-09-05

Similar Documents

Publication Publication Date Title
KR101224421B1 (ko) 바이트-바이-바이트 비교를 사용한 오브젝트의 검색 및제공
US7769771B2 (en) Searching a document using relevance feedback
JP6517352B2 (ja) 翻訳情報の提供方法及びシステム
US9519703B2 (en) Refining search results for a compound search query
JP2020135891A (ja) 検索提案を提供する方法、装置、機器及び媒体
JP2022069790A (ja) 情報処理装置、情報処理方法、プログラム
JP5398663B2 (ja) データ処理装置及びデータ処理方法及びプログラム
JP6690828B2 (ja) キーワードに基づくテキスト検索の方法及び装置
US20120254209A1 (en) Searching method, searching device and recording medium recording a computer program
JP2020123321A (ja) クリップボードデータに基づく検索処理方法および装置
JP7339148B2 (ja) 検索支援装置
JP6549173B2 (ja) 計算機システム及び文章データの検索方法
JP2019148859A (ja) フローダイアグラムを用いたモデル開発環境におけるデザインパターンの発見を支援する装置および方法
JPWO2016001991A1 (ja) 検索方法
WO2020235135A1 (ja) 対話システム
JP2012043258A (ja) 検索システム、検索装置、検索プログラム、記録媒体及び検索方法
WO2022044923A1 (ja) 情報処理装置
JP2939841B2 (ja) データベース検索装置
WO2021111769A1 (ja) 検索装置
JP7490670B2 (ja) 検索装置
JP2009003731A (ja) 特許検索システム
JP6221593B2 (ja) データ管理方法、データ管理プログラム及びデータ管理装置
JP6884172B2 (ja) 計算機システム及び文書の評価方法
JP5505207B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラム
JP6695766B2 (ja) 検索システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230613

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230824

R150 Certificate of patent or registration of utility model

Ref document number: 7339148

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150