JP2018063610A - 文章検索システム、q&a検索システム、クライアントステム及びサーバ - Google Patents
文章検索システム、q&a検索システム、クライアントステム及びサーバ Download PDFInfo
- Publication number
- JP2018063610A JP2018063610A JP2016202147A JP2016202147A JP2018063610A JP 2018063610 A JP2018063610 A JP 2018063610A JP 2016202147 A JP2016202147 A JP 2016202147A JP 2016202147 A JP2016202147 A JP 2016202147A JP 2018063610 A JP2018063610 A JP 2018063610A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- information
- question
- answer
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】回答文の検索精度が向上した文章検索システム、Q&A検索システム、クライアントステム及びサーバを提供する。【解決手段】Q&Aサイトによって蓄積された質問文や回答文について、公知の概念化理論に基づいて、予め設定された複数の概念に分類する。検索者が入力した検索文に基づいて、各質問文や各回答文に設定された概念を検索することによって、キーワード検索では、漏れてしまうような有効回答文を抽出する。【選択図】図18
Description
この発明は、文章検索システム、Q&A検索システム、クライアントステム及びサーバに係り、詳しくは質問に対して的確な回答を抽出できるQ&Aシステム、クライアントステム及びサーバに関するものである。
従来、利用者が質問を公開し、回答を募って疑問を解消する仕組みを提供するQ&Aサイトが知られている。このようなQ&Aサイトで投稿された質問や回答は蓄積され、質問と回答に関するQ&Aデータベースが構築される。
このようなQ&Aデータベースでは、データの蓄積量が膨大であることから、既述のQ&Aサイトに質問を投稿し、サイト上で他人から回答を得ずとも、回答を欲する質問に対して、既にその質問に対応する回答がデータベース内に存在する可能性がある。つまり、他人からの回答を待つよりも、データベース内から回答を検索した方が、より迅速に回答が得られることとなる。
しかしながら、Q&Aデータベースから所望の文章情報を抽出する検索処理において、従来では、検索キーワードとして複数の単語を設定する手法が一般的である。しかし、このような検索手法では、以下のような問題が生じていた。
例えば、回答文として該当するべき文章の概念に対して、同じ概念に属するものではあるが、使用されている単語が異なるために、検索結果から漏れてしまう回答が生じる。逆に、使用されている単語は同じであるが、文章の内容は異なる概念に属する回答が検索結果に含まれてしまう。また、検索を掛ける利用者がキーワードとして選択する単語の内容に、検索結果が大きく依存してしまうため、質問者の意図に合致した回答文を抽出できない場合がある。
例えば、回答文として該当するべき文章の概念に対して、同じ概念に属するものではあるが、使用されている単語が異なるために、検索結果から漏れてしまう回答が生じる。逆に、使用されている単語は同じであるが、文章の内容は異なる概念に属する回答が検索結果に含まれてしまう。また、検索を掛ける利用者がキーワードとして選択する単語の内容に、検索結果が大きく依存してしまうため、質問者の意図に合致した回答文を抽出できない場合がある。
さらに、キーワード検索の他、質問文を入力し、この質問文に基づいて検索を行う処理においても、十分な検索結果を得ることは困難であった。特に、質問文が曖昧な内容である場合には、単純に単語が一致する文章を抽出することとなり、検索結果が不正確となる確率が高くなるといった欠点があった。
この発明は、回答文の検索精度が向上した文章検索システム、Q&A検索システム、クライアントステム及びサーバを提供することを目的とするものである。
以上のような問題を解決する本発明は、以下のような構成を有する。
[1]第1文章情報を記憶した第1データベースと、
第1文章情報に関連した第2文章情報を記憶した第2データベースと、
第1文章情報に含まれる複数の単語に基づいて、その文章情報が表す概念を1又は2以上設定して記憶する第1概念情報記憶手段と、
第2文章情報に含まれる複数の単語に基づいて、その文章情報が表す概念を1又は2以上設定して記憶する第2概念情報記憶手段と、
第1文章情報と、該第1文章情報に関連付けられた第2文章情報の双方に含まれる複数の単語に基づいて、その第1文章情報と第2文章情報が対となって表す概念を1又は2以上設定して記憶する第3概念情報記憶手段と、
検索文章情報を取得する検索情報取得手段と、
前記検索文章情報取得手段によって取得された検索文章情報に含まれる複数の単語に基づいて検索情報を設定する検索情報設定手段と、
前記検索情報設定手段によって設定された検索情報が、前記第1概念情報記憶手段、前記第2概念情報記憶手段及び前記第3概念情報記憶手段の内、少なくとも何れか2つの記憶手段に記憶されている複数の概念のいずれに属するか判定する概念抽出手段と、
概念抽出手段によって抽出された概念に対応する文章情報を、前記第1データベースまたは前記第2データベースから抽出する文章情報抽出手段と、
前記文章情報抽出手段によって抽出された文章情報から、抽出された文章情報に設定されている概念が、複数の前記概念情報記憶手段に記憶されている文章情報を選別する文章情報選別手段とを有する文章検索システム。
[1]第1文章情報を記憶した第1データベースと、
第1文章情報に関連した第2文章情報を記憶した第2データベースと、
第1文章情報に含まれる複数の単語に基づいて、その文章情報が表す概念を1又は2以上設定して記憶する第1概念情報記憶手段と、
第2文章情報に含まれる複数の単語に基づいて、その文章情報が表す概念を1又は2以上設定して記憶する第2概念情報記憶手段と、
第1文章情報と、該第1文章情報に関連付けられた第2文章情報の双方に含まれる複数の単語に基づいて、その第1文章情報と第2文章情報が対となって表す概念を1又は2以上設定して記憶する第3概念情報記憶手段と、
検索文章情報を取得する検索情報取得手段と、
前記検索文章情報取得手段によって取得された検索文章情報に含まれる複数の単語に基づいて検索情報を設定する検索情報設定手段と、
前記検索情報設定手段によって設定された検索情報が、前記第1概念情報記憶手段、前記第2概念情報記憶手段及び前記第3概念情報記憶手段の内、少なくとも何れか2つの記憶手段に記憶されている複数の概念のいずれに属するか判定する概念抽出手段と、
概念抽出手段によって抽出された概念に対応する文章情報を、前記第1データベースまたは前記第2データベースから抽出する文章情報抽出手段と、
前記文章情報抽出手段によって抽出された文章情報から、抽出された文章情報に設定されている概念が、複数の前記概念情報記憶手段に記憶されている文章情報を選別する文章情報選別手段とを有する文章検索システム。
[2]質問文に関する情報を記憶した質問データベースと、
質問文に対する回答文に関する情報を記憶した回答データベースと、
質問文に含まれる複数の単語に基づいて、その質問文が表す概念を1又は2以上設定して記憶する質問概念情報記憶手段と、
回答文に含まれる複数の単語に基づいて、その回答文が表す概念を1又は2以上設定して記憶する回答概念情報記憶手段と、
質問文と、該質問文に対する回答文の双方の文章を結合させて、その結合された文章に含まれる複数の単語に基づいて、その質問文と回答文の結合文が表す概念を1又は2以上設定して記憶する質問回答概念情報記憶手段と、
検索文章情報を取得する検索情報取得手段と、
前記検索文章情報取得手段によって取得された検索文章情報に含まれる複数の単語に基づいて検索情報を設定する検索情報設定手段と、
前記検索情報設定手段によって設定された検索情報が、前記質問概念情報記憶手段、前記回答概念情報記憶手段及び前記質問回答概念情報記憶手段の内、少なくとも何れか2つの記憶手段に記憶されている複数の概念のいずれに属するか判定する概念抽出手段と、
概念抽出手段によって抽出された概念に対応する文章を、前記質問データベースまたは前記回答データベースから抽出する文章情報抽出手段と、
前記文章情報抽出手段によって抽出された文章から、抽出された文章に設定されている概念が、複数の前記概念情報記憶手段に記憶されている文章を選別する文章情報選別手段とを有するQ&A検索システム。
質問文に対する回答文に関する情報を記憶した回答データベースと、
質問文に含まれる複数の単語に基づいて、その質問文が表す概念を1又は2以上設定して記憶する質問概念情報記憶手段と、
回答文に含まれる複数の単語に基づいて、その回答文が表す概念を1又は2以上設定して記憶する回答概念情報記憶手段と、
質問文と、該質問文に対する回答文の双方の文章を結合させて、その結合された文章に含まれる複数の単語に基づいて、その質問文と回答文の結合文が表す概念を1又は2以上設定して記憶する質問回答概念情報記憶手段と、
検索文章情報を取得する検索情報取得手段と、
前記検索文章情報取得手段によって取得された検索文章情報に含まれる複数の単語に基づいて検索情報を設定する検索情報設定手段と、
前記検索情報設定手段によって設定された検索情報が、前記質問概念情報記憶手段、前記回答概念情報記憶手段及び前記質問回答概念情報記憶手段の内、少なくとも何れか2つの記憶手段に記憶されている複数の概念のいずれに属するか判定する概念抽出手段と、
概念抽出手段によって抽出された概念に対応する文章を、前記質問データベースまたは前記回答データベースから抽出する文章情報抽出手段と、
前記文章情報抽出手段によって抽出された文章から、抽出された文章に設定されている概念が、複数の前記概念情報記憶手段に記憶されている文章を選別する文章情報選別手段とを有するQ&A検索システム。
[3]更に、質問文を投稿した質問者の属性情報を蓄積した質問者属性情報データベースと、
回答文を投稿した回答者の属性情報を蓄積した回答者属性情報データベースと、
検索文を投稿した投稿者の属性を取得する検索者属性取得手段と、
前記文章情報選別手段によって抽出された文章に係る質問文及び/又は回答者の属性情報と、前記検索者属性情報取得手段で取得された検索者属性情報とによって、前記文章情報選別手段によって抽出された文章から、さらに特定の文章を選定する文章情報選定手段を有する上記[2]に記載のQ&A検索システム。
回答文を投稿した回答者の属性情報を蓄積した回答者属性情報データベースと、
検索文を投稿した投稿者の属性を取得する検索者属性取得手段と、
前記文章情報選別手段によって抽出された文章に係る質問文及び/又は回答者の属性情報と、前記検索者属性情報取得手段で取得された検索者属性情報とによって、前記文章情報選別手段によって抽出された文章から、さらに特定の文章を選定する文章情報選定手段を有する上記[2]に記載のQ&A検索システム。
[4]通信ネットワークを介して接続されるサーバに接続された複数のクライアントシステムを介して、ユーザ間で質問と、該質問に対する回答を送受信するQ&Aシステムにおけるクライアントシステムであって、
画面上に画像を表示する表示手段と、
情報を入力する入力手段と、
前記入力手段によりユーザが入力した質問文を取得する質問文取得手段と、
前記質問文取得手段によって取得した質問文に基づいて質問情報を生成する質問情報生成手段と、
前記質問情報生成手段で生成された質問情報を前記サーバに送信する質問情報送信手段と、
送信された質問文に基づいて概念検索された回答文を前記サーバから受信する回答文を取得する回答文受信手段と、
前記回答文受信手段で受信した回答文を、対応する質問文と関連つけて、前記表示手段に表示する回答文表示手段とを有することを特徴とするクライアントシステム。
画面上に画像を表示する表示手段と、
情報を入力する入力手段と、
前記入力手段によりユーザが入力した質問文を取得する質問文取得手段と、
前記質問文取得手段によって取得した質問文に基づいて質問情報を生成する質問情報生成手段と、
前記質問情報生成手段で生成された質問情報を前記サーバに送信する質問情報送信手段と、
送信された質問文に基づいて概念検索された回答文を前記サーバから受信する回答文を取得する回答文受信手段と、
前記回答文受信手段で受信した回答文を、対応する質問文と関連つけて、前記表示手段に表示する回答文表示手段とを有することを特徴とするクライアントシステム。
[5]通信ネットワークを介して接続されるサーバに接続された複数のクライアントシステムを介して、ユーザ間で質問と、該質問に対する回答を送受信するQ&Aシステムにおけるサーバであって、
前記クライアントシステムから検索文章情報を取得する検索文章情報受信手段と、
質問文に関する情報を記憶した質問データベースと、
質問文に対する回答文に関する情報を記憶した第2データベースと、
質問文に含まれる複数の単語に基づいて、その質問文が表す概念を1又は2以上設定して記憶する質問概念情報記憶手段と、
回答文に含まれる複数の単語に基づいて、その回答文が表す概念を1又は2以上設定して記憶する回答概念情報記憶手段と、
質問文と、該質問文に対する回答文の双方の文章を結合させて、その結合された文章に含まれる複数の単語に基づいて、その質問文と回答文の結合文が表す概念を1又は2以上設定して記憶する質問回答概念情報記憶手段と、
前記検索文章情報受信手段によって受信した検索文章情報に含まれる複数の単語に基づいて検索情報を設定する検索情報設定手段と、
前記検索情報設定手段によって設定された検索情報が、前記質問概念情報記憶手段、前記回答概念情報記憶手段及び前記質問回答概念情報記憶手段の内、少なくとも何れか2つの記憶手段に記憶されている複数の概念のいずれに属するか判定する概念抽出手段と、
概念抽出手段によって抽出された概念に対応する文章を、前記質問データベースまたは前記回答データベースから抽出する文章情報抽出手段と、
前記文章情報抽出手段によって抽出された文章から、抽出された文章に設定されている概念が、複数の前記概念情報記憶手段に記憶されている文章を選別する文章情報選別手段と
前記文章情報選別手段によって選別された文章を、検索文章情報を取得したクライアントシステムへ送信する選別文章情報送信手段とを有するサーバ。
前記クライアントシステムから検索文章情報を取得する検索文章情報受信手段と、
質問文に関する情報を記憶した質問データベースと、
質問文に対する回答文に関する情報を記憶した第2データベースと、
質問文に含まれる複数の単語に基づいて、その質問文が表す概念を1又は2以上設定して記憶する質問概念情報記憶手段と、
回答文に含まれる複数の単語に基づいて、その回答文が表す概念を1又は2以上設定して記憶する回答概念情報記憶手段と、
質問文と、該質問文に対する回答文の双方の文章を結合させて、その結合された文章に含まれる複数の単語に基づいて、その質問文と回答文の結合文が表す概念を1又は2以上設定して記憶する質問回答概念情報記憶手段と、
前記検索文章情報受信手段によって受信した検索文章情報に含まれる複数の単語に基づいて検索情報を設定する検索情報設定手段と、
前記検索情報設定手段によって設定された検索情報が、前記質問概念情報記憶手段、前記回答概念情報記憶手段及び前記質問回答概念情報記憶手段の内、少なくとも何れか2つの記憶手段に記憶されている複数の概念のいずれに属するか判定する概念抽出手段と、
概念抽出手段によって抽出された概念に対応する文章を、前記質問データベースまたは前記回答データベースから抽出する文章情報抽出手段と、
前記文章情報抽出手段によって抽出された文章から、抽出された文章に設定されている概念が、複数の前記概念情報記憶手段に記憶されている文章を選別する文章情報選別手段と
前記文章情報選別手段によって選別された文章を、検索文章情報を取得したクライアントシステムへ送信する選別文章情報送信手段とを有するサーバ。
[6]更に、質問文を投稿した質問者の属性情報を蓄積した質問者属性情報データベースと、
回答文を投稿した回答者の属性情報を蓄積した回答者属性情報データベースと、
検索文を投稿した投稿者の属性をクライアントシステムから受信する検索者属性受信手段と、
前記文章情報選別手段によって抽出された文章に係る質問文及び/又は回答者の属性情報と、前記検索者属性情報受信手段で取得された検索者属性情報とによって、前記文章情報選別手段によって抽出された文章から、さらに特定の文章を選定する文章情報選定手段を有する上記[5]に記載のサーバ。
回答文を投稿した回答者の属性情報を蓄積した回答者属性情報データベースと、
検索文を投稿した投稿者の属性をクライアントシステムから受信する検索者属性受信手段と、
前記文章情報選別手段によって抽出された文章に係る質問文及び/又は回答者の属性情報と、前記検索者属性情報受信手段で取得された検索者属性情報とによって、前記文章情報選別手段によって抽出された文章から、さらに特定の文章を選定する文章情報選定手段を有する上記[5]に記載のサーバ。
請求項1に記載の発明によれば、検索文によって、文章を検索するに際して、検索対象データベースに蓄積されている文章について、それぞれ概念が設定され、検索情報と設定された概念との間で検索処理が行われるので、漏れの少ない検索が可能となる。さらに、検索された文章情報については、抽出された文章情報に設定されている概念が、複数の前記概念情報記憶手段に記憶されている文章情報を選別するので、精度の高い検索結果を得ることができる。
請求項2及び5に記載の発明によれば、蓄積されている質問文や回答文について、それぞれ概念が設定されており、その概念と検索情報とに基づいて、検索が行われるので、キーワードによる従来の検索手法よりも、漏れの少ない検索結果を得ることが可能となる。さらに、質問文、回答文、対となっている質問文と回答文のそれぞれについて設定された概念に、重複して含まれる質問文及び/又は回答文を選別することで、検索の意図により合致した検索結果に近づけることが可能となる。
請求項3及び6に記載の発明によれば、質問者や回答者の属性と、検索者の属性を用いて、さらに検索結果から特定の文章を抽出するので、検索者の意図に沿った検索結果を得ることができる。
請求項4に記載の発明によれば、概念検索によって抽出された検索結果を検索者の使用するクライアントシステムで得ることができる。
請求項4に記載の発明によれば、概念検索によって抽出された検索結果を検索者の使用するクライアントシステムで得ることができる。
以下本発明のQ&Aシステム100の好適実施形態について、添付図面に基づいて詳細に説明する。図1は、Q&Aシステム100のシステム構成を示す概念図である。Q&Aシステムは、予め会員登録された会員間において、サイト上において質問を募集し、集められた質問に対する回答を、会員から募集し、質問とそれに対する回答をデータベース化するQ&Aシステムであって、さらに、検索操作することによって、既に蓄積されている質問と回答のデータベースから、所望の回答を抽出できるQ&Aシステムである。 図1に示すように、Q&Aシステム100は、ユーザ端末1a〜1d、及びサーバ2とが、ネットワークNeを介して接続されることにより構成されている。
ネットワークNeは、電話回線網、ISDN(Integrated ServicesDigital Network)回線網、ADSL通信網、光通信網、専用線、移動体通信網、通信衛星回線、CATV回線網等の各種通信回線と、それらを接続するインターネットサービスプロバイダ基地局等を含む。また、ネットワークNeは、限られたエリア内におけるネットワークであるイントラネットであってもよい。ここで、イントラネットは、サーバと、複数のクライアントとを接続して構成され、接続されたサーバ、及び複数のクライアント間で情報や資源を共有するための、限られたエリア内におけるネットワークである。なお、ネットワークNeは、任意な時に接続が可能であればよく、常時接続されている必要はない。各端末間の接続回線を有線回線として図示したが、これらは無線回線であっても良い。
ユーザ端末1a〜dは、例えば、汎用のパーソナルコンピュータ(PC)1a、ノート型PC1b、PDA(Personal Digital Assistant)1c、携帯電話1d、その他タブレット型式の端末等の多機能携帯端末などにより構成され、Q&Aシステム100を利用する会員或いはシステム管理者により管理される端末である。なお、ユーザ端末1a〜dを統括して示す場合は、「ユーザ端末1」と記す。
ユーザ端末1は、Webサイトを閲覧するためのアプリケーションソフトであるブラウザを搭載し、このブラウザによりサーバ2が開設するHP(ホームページ(以下、Q&A検索サイトという))にアクセスする。そして、サーバ2が提供するQ&A検索サイトを介して、情報の送受信を行うことにより、質問、回答、コメントの投稿又は閲覧、質問や回答に対する評価の表明、検索文又はキーワードの入力、検索結果等の閲覧、Q&A検索等のサービスの提供を受ける。
なお、ユーザは、ユーザ端末1を介して、Q&A検索サイトを閲覧できるが、更に、会員登録することができる。会員登録のためには、特定ユーザである会員となろうとするユーザは、ユーザ端末1を介して、Q&A検索サイトにおける会員登録画面を利用して、ユーザ情報として、ユーザID、パスワード、氏名、会員番号、年齢、職業、年収、性別、役職、メールアドレス、電話番号、専門分野、職種、得意分野、趣味、居住地域(住所、又は職場の住所)、飲食の嗜好(甘いもの好き、辛いもの好き等)、回答者評価値等をサーバ2に送信する。サーバ2は、会員情報であるユーザ情報を登録し、サーバ2の備える記憶手段としての記憶部(26、図2参照)の会員データベースに、当該ユーザ情報を記憶する。そして、会員登録を行った後は、会員は、Q&A検索サイトを利用するにあたっては、ユーザID及びパスワードを含むログイン情報をサーバ2に送信して、ログイン認証を行うことにより、Q&A検索サイトを利用可能となる。
また、ログイン情報は、ユーザID及びパスワードに限らず、例えば、メールアドレス、又は氏名及び会員番号であってもよく、上述したユーザ情報に含まれる情報によりログイン認証が行える構成であれば良い。
或いは、予めユーザ登録を行わずに、質問、回答又はコメントを投稿する際に、ユーザを特定可能な情報(例えば、氏名、住所、年齢[生年月日]、職業、年収、性別、役職、メールアドレス、電話番号等)を質問、回答又はコメントと同時に入力させることにより、Q&Aシステム100の利用権限を許諾する構成であっても良い。
或いは、予めユーザ登録を行わずに、質問、回答又はコメントを投稿する際に、ユーザを特定可能な情報(例えば、氏名、住所、年齢[生年月日]、職業、年収、性別、役職、メールアドレス、電話番号等)を質問、回答又はコメントと同時に入力させることにより、Q&Aシステム100の利用権限を許諾する構成であっても良い。
図2を参照して、ユーザ端末1の内部構成の一例を説明する。図2は、通信端末としてのユーザ端末1の要部構成を示すブロック図である。図2に示すように、ユーザ端末1は、制御手段としてのCPU(Central Processing Unit)11、入力部12、表示手段としての表示部13、送信手段及び受信手段としての通信部14、RAM15、記憶部16等から構成され、各部はバス17により接続されている。CPU11は、記憶部16に格納されているシステムプログラム、Webブラウザなどの各種アプリケーションプログラムの中から指定されたプログラムをRAM内の図示しないワークエリアに展開し、入力部12から入力されるデータに応じて、プログラムに従った各種処理を実行し、処理結果をRAM15内のワークメモリに格納する。また、処理結果を表示するための表示情報を生成して表示部13へ出力する。CPU11は、記憶部16からブラウザのプログラムを読み出し起動し、サーバ2にアクセスして、Q&A検索サイトから、Q&A検索サイトの後述する画面データを受信して、RAM15に記録すると共に、表示部13にQ&A検索サイトの画面(図3参照)を表示させる。
図3は、表示部13に表示された上記画面例を示す図である。図3に示されているように、画面131には、メニューバー131A、アドレスバー131B、Q&A・検索ツールバー131C、表示領域131Dが設けられている。メニューバー131Aには、頻繁に利用する機能をアイコン化したボタンが並べて表示されており、それぞれのアイコンを操作することにより、各アイコンに対応した機能が実現される。アドレスバー131Bには、Q&A検索サイトのアドレスが表示される。
Q&A・検索ツールバー131Cには、質問入力ボタン131d、Q&A表示・コメント入力ボタン131e、回答入力ボタン131g、質問検索ボタン131h、会員登録ボタン131iが設けられている。
Q&A・検索ツールバー131Cには、質問入力ボタン131d、Q&A表示・コメント入力ボタン131e、回答入力ボタン131g、質問検索ボタン131h、会員登録ボタン131iが設けられている。
質問入力ボタン131dは、表示領域131Dに質問の入力用の画面の表示を指示するボタンである。Q&A表示・コメント入力ボタン131eは、表示領域131Dに、質問と回答の表示と、それに対するコメント投稿用の画面の表示を指示するボタンである。回答入力ボタン131gは、表示領域131Dに質問に対する回答の入力用の画面の表示を指示するボタンである。質問検索ボタン131hは、表示領域131Dに、検索キーワード又は検索文を入力する入力用の画面を表示するボタンである。
表示領域131Dに表示される情報は、例えば、HTML形式で記述されており、ブラウザを介してダウンロードした文書や画像が表示される。上記各画面データはサーバ2から受信する。
表示領域131Dに表示される情報は、例えば、HTML形式で記述されており、ブラウザを介してダウンロードした文書や画像が表示される。上記各画面データはサーバ2から受信する。
入力部12は、かな/英数字入力キー、カーソルキー及び各種機能キー等を備えたキーボード(入力手段)と、画面に表示された所定の領域を指定するポインティングデバイスであるマウス(指定手段)とを備えて構成され、キーボードで押下操作されたキーの押下信号とマウスによる操作信号とを、入力信号としてCPU11へ出力する。また、ユーザ端末1がPDA、携帯端末等である場合、入力部12は、カーソルキー、数字キー及び各種機能キー等を備えて構成され、タッチパネル等のポインティングデバイスや、その他の入力装置を備えるものとしてもよい。
表示部13は、CRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)等により構成され、CPU11から入力される表示信号の指示に従って各種表示データの画面表示を行う。例えば、表示部13は、CPU11の制御に応じて、Q&A・検索ツールバーを備えるブラウザ画面131に後述する各種画像を画面に表示する。
通信部14は、LAN(Local Area Network)、WAN(Wide Area Network)、あるいはインターネット等の各種ネットワークに接続された伝送媒体に接続可能なインターフェイスである。具体的には、ネットワークインターフェースカード、モデム(MODEM:MOdulator/DEModulator)又はターミナルアダプタ(TA:Terminal Adapter)等によって構成され、既述の通信回線を介して外部機器との通信を行うための制御を行う。 RAM(Random Access Memory)15は、CPU11によって実行される各種プログラムやこれら各種プログラムによって処理されたデータ等を一時的に記憶するワークエリアを形成する。上記のように、サーバ2からダウンロードした画面データが記憶される。
記憶部16は、プログラムやデータ等があらかじめ記憶されている記憶媒体(図示せず)を有しており、この記憶媒体は磁気的、光学的記録媒体、若しくは半導体メモリで構成されている。この記憶媒体は記憶部16に固定的に設けられるもの、若しくは着脱自在に装着するものであり、この記憶媒体には、システムプログラム、当該システムに対応する各種処理プログラム、及び各種処理プログラムで処理されたデータ等を記憶する。また、記録媒体に記憶するプログラム、データ等は、その一部若しくは全部をサーバやクライアント等の他の機器からWAN、LAN等のネットワーク回線の伝送媒体を介して通信部14から受信して記憶する構成にしてもよく、さらに、記録媒体はネットワーク上に構築されたサーバの記録媒体であってもよい。また、前記プログラムをネットワーク回線等の伝送媒体を介してサーバやクライアントへ伝送してこれらの機器にインストールするように構成してもよい。
具体的に記憶部16は、オペレーティングシステム、ブラウザのプログラム等を記憶している。或いは、CD−R、メモリ等の記録媒体からQ&A・検索ツールバープログラムをインストールする構成であっても良い。
具体的に記憶部16は、オペレーティングシステム、ブラウザのプログラム等を記憶している。或いは、CD−R、メモリ等の記録媒体からQ&A・検索ツールバープログラムをインストールする構成であっても良い。
次に、Q&Aコミュニティーサーバ2について説明する。なお、サーバ2の要部構成については、上述したユーザ端末1の要部構成と略同一とするため、各構成部分には同列の符号を付し(図2参照)、その構成の図示及び説明は省略する。以下では、サーバ2に特徴的な機能、及びサーバ2に備えるデータベースについて詳細に説明する。
サーバ2は、処理手段としてのCPU21、入力部22、表示部23、送受信手段としての通信部24、RAM25、記憶手段としての記憶部26等を備えて構成され、各部はバス27により接続されている。サーバ2は、会員同士の間で、特定の事象に関する質疑応答を行うQ&Aサイト、及び検索サイトをインターネット上に開設する。そして、上述したサイトにおいて、ユーザ端末1から質問、回答、コメント、質問や回答に対する評価の表明、検索に係る情報を受信し、受信した情報に基づいて後述する検索処理(図15及び図17)等を実行する。
記憶部26は、システムプログラム、当該システムに対応する各種処理プログラム、後述する画面データ、及び各種処理プログラムで処理されたデータ等を記憶する各種データベースを備える。この他、記憶部26は、図4に示されているように、Q&Aシステム100において蓄積・使用されるデータを格納するデータベースDB2を有する。データベースDB2は複数の記憶エリアを備え、ログデータ領域、質問データベース領域、回答データベース領域、会員データベース領域、Q&Aデータベース領域、検索データ領域が含まれている。
ログデータ領域に記憶されているログデータ201aは、上記Q&A検索サイトを閲覧したユーザのユーザID、閲覧日時、閲覧回数、ポイント付与の有無、ユーザがサイト内のどのカテゴリを訪れたか、或いは、上記サイトからどのサイトへ遷移したか等のデータである。なお、閲覧日時、閲覧回数等のデータはユーザIDに対応して記憶されている。
ログデータ領域に記憶されているログデータ201aは、上記Q&A検索サイトを閲覧したユーザのユーザID、閲覧日時、閲覧回数、ポイント付与の有無、ユーザがサイト内のどのカテゴリを訪れたか、或いは、上記サイトからどのサイトへ遷移したか等のデータである。なお、閲覧日時、閲覧回数等のデータはユーザIDに対応して記憶されている。
図5及び図6に示されているように、質問データベース領域に格納されている質問データ202aは、投稿された質問文、各質問文に割り付けられた質問番号、その質問文を投稿した質問者のID、質問文に設定された概念1〜3、等のデータである。質問データベースにおいて、概念1〜3の記憶されている領域が、質問概念情報記憶手段として機能する。
図7及び図8に示されていように、回答データベース領域に格納されている回答データ203aは、投稿された回答文、各回答文に割り付けられた回答番号、その回答文を投稿した回答者のID、回答文に設定された概念1〜3、回答文に対応する質問文等のデータである。回答データベースにおいて、概念1〜3の記憶されている領域が、回答概念情報記憶手段として機能する。
図9に示されているように、会員データ204aは、上記Q&A検索サイトに会員として登録されているユーザ(特定ユーザ)のユーザ情報(属性情報(登録される会員に備わっている固有の性質・特徴)等)であり、ユーザIDに対応して記憶されている。具体的に、ユーザ情報には、ユーザIDに対応して記憶された、パスワード、氏名、生年月日、職業、年収、性別、役職、メールアドレス、電話番号、配偶者の有無、子供の有無、専門分野、職種、得意分野、趣味、居住地域(住所、又は職場の住所)、飲食の嗜好(甘いもの好き、辛いもの好き等)、回答専門分野として登録されているカテゴリ、獲得したポイント等を含んでいる。また、会員データ204aには、会員登録されていないユーザに関するデータも記憶される。この一般ユーザのデータは、例えば、質問を投稿した者、回答を投稿した者について、ユーザデータを記憶する領域が設けられ、アクセスしたIPアドレスなどを識別情報として登録し、質問又は回答の投稿時に入力した属性データも記憶される。
図10に示されているように、Q&Aデータ205aは、質問番号と、該質問に対して投稿された回答番号と、該質問番号の質問文と、該回答番号の回答文とを、一対一で対応させて、質問文と回答文を結合し、該結合した文に基づいて設定された複数の概念をデータとして含んでいる。この結合させられた質問文の質問者IDと、回答文の回答者IDも関連付けられて記憶されている。また、質問文と回答文もデータとして記憶していてもよい。このQ&Aデータの記憶領域が、質問回答概念情報記憶手段として機能する。
検索データ206aは、検索文、検索キーワード、入力した日時、場所(IP)、検索者情報、検索それた回答文の回答Noなどが、ユーザ情報に関連付けられて記憶される。
検索データ206aには、概念検索で抽出された回答群を、検索データとして一時的に記憶される。例えば、質問文に対する概念検索で検索された回答候補群A、質問文回答文に対する概念検索で検索された回答候補群B、回答文に対する概念検索で検索された回答候補群Cである。
上記説明したデータベースDBに記憶されている各種データは、必要に応じて適宜ユーザ端末1に送られ、又ユーザ端末1からのデータの供給によって適宜更新される。
検索データ206aには、概念検索で抽出された回答群を、検索データとして一時的に記憶される。例えば、質問文に対する概念検索で検索された回答候補群A、質問文回答文に対する概念検索で検索された回答候補群B、回答文に対する概念検索で検索された回答候補群Cである。
上記説明したデータベースDBに記憶されている各種データは、必要に応じて適宜ユーザ端末1に送られ、又ユーザ端末1からのデータの供給によって適宜更新される。
次に、質問データ202a、回答データ203a、Q&Aデータ205aにおいて、記憶されている概念について説明する。概念とは、元となる文の内容が、どのようなカテゴリ(話題)に含まるのか、を端的に示すものである。この概念は、多数の概念が予め設定されており、上位から下位へかけて、複数の階層に分けて設けられている。
図11には、ある文章について、その文章がどのような分野の内容を含んでいるのか、その内容の概念を特定する手法を説明するための図である。この実施形態では、潜在的ディリクレ配分法(Latent Dirichlet Allocation)を用いて、文章に対する概念(トピック)を設定する。
既に、多数の概念が予め設定されており、各設定された概念には、その概念について共起すると予想される単語群が、予め設定されている。例えば、「遺伝学」では、「表現型、遺伝子、DNA、受精卵、多胚化、染色体・・・」といった単語で構成された集合が、設定されている。
そして、概念を設定しようとする文章について、その文章を構成する単語を分解し、出現頻度の高い単語から優先して、いずれの概念の単語群に含まれるのか判定する。最も多くの単語が単語群に含まれている概念が、その文章が表す内容を示す概念と判定される。
既に、多数の概念が予め設定されており、各設定された概念には、その概念について共起すると予想される単語群が、予め設定されている。例えば、「遺伝学」では、「表現型、遺伝子、DNA、受精卵、多胚化、染色体・・・」といった単語で構成された集合が、設定されている。
そして、概念を設定しようとする文章について、その文章を構成する単語を分解し、出現頻度の高い単語から優先して、いずれの概念の単語群に含まれるのか判定する。最も多くの単語が単語群に含まれている概念が、その文章が表す内容を示す概念と判定される。
図示の例では、「一卵性双生児、遺伝子、双生児、遺伝、生物学的、あり方、両方、決まって」といった単語が含まれている。また、概念として設定された「研究」の単語群に含まれる「教授、研究、調査、半分、方法、的問題、考え方、質問、結果、違い、統計的分析、環境、影響、条件、組み合わせ」といった単語が多く抽出され、この文章には、「遺伝学」と「研究」という概念が設定される。この例では、概念「社会」については、出現単語数が少ないので、概念として設定されない。
同様な処理を、質問文、回答文及び質問文と回答文を結合した文章について、それぞれ概念を設定する。設定する概念の数は、元となる文章の長さに応じて、任意に設定することができる。
次に、本実施の形態の動作を説明する。
以下に示す図12及び図13のフローチャートに記述されている各機能を実現するためのプログラムは、読み取り可能なプログラムコードの形態でサーバ2の記憶部26に格納されており、CPU21は、このプログラムコードに従った動作を逐次実行する。また、図示しないCD−ROM、DVD―ROM等から外部供給されるプログラム/データを利用してこの実施の形態特有の動作を実行することも可能である。
以下に示す図12及び図13のフローチャートに記述されている各機能を実現するためのプログラムは、読み取り可能なプログラムコードの形態でサーバ2の記憶部26に格納されており、CPU21は、このプログラムコードに従った動作を逐次実行する。また、図示しないCD−ROM、DVD―ROM等から外部供給されるプログラム/データを利用してこの実施の形態特有の動作を実行することも可能である。
ユーザ端末1側の手順を、図12を参照して説明する。以下に説明するのは、ユーザ端末1を、会員が質問を検索する検索者として使用する場合であり、検索者端末として機能する。ブラウザによりアクセスしたQ&Aサイトから受信したID入力画面を表示する(ステップS101)。ID入力画面の所定の欄に入力された検索者のユーザIDとパスワードを取得し、サーバ2へ送信する(ステップS103)。サーバ2は、会員を特定するユーザIDを取得することによって、検索者の属性情報を特定することができる。
サーバ2から、承認する旨の回答と、質問カテゴリ選択画面(図3)に表示する各種のカテゴリのデータ(サーバ2の記憶部26に記憶されている)と、を受信した後、質問カテゴリ選択画面(図3)に、受信した質問カテゴリを表示する(ステップS105)。図3に示されている例では、表示領域131Dに検索する質問の内容が含まれると予想される複数のカテゴリが表示される。カテゴリは、大まかに分類された複数の第1カテゴリと、各第1カテゴリを細分化した第2カテゴリに分けられている。各第1カテゴリを選択すると、複数の第2カテゴリが表示され、最終的に第2カテゴリを選択する。
この実施形態では、第1カテゴリとして[旅行・レジャー・生活]を選択し、更に[旅行・レジャー・生活]の中の第2カテゴリである[車]のカテゴリを選択したものとして、説明を進める。 ここで選択されたカテゴリは、入力される検索情報としての質問文について、抽出される概念、或いは検索キーワードとして加えることもできる。
Q&Aツールバー131Cの質問検索アイコン131hにカーソルを重ねてクリックすることで(以下、この操作を「押す」と称する)、図13に示されているような検索キーワード入力画面の画面データを、サーバ2から受信して当該質問入力画面が表示される(ステップS106)。質問入力画面131Dには、検索文入力ボックス131D2が設けられており、ここに検索情報としての[検索文]を入力するよう促す。検索文は、キーワードであってもよい。例えば、「車」「家族」「維持費」「レジャー」と入力する。
なお、ステップS105を省略してもよい。
送信ボタン131D3を押すことで、検索情報と選択されたカテゴリの情報をサーバ2に送信する(ステップS109)。
なお、ステップS105を省略してもよい。
送信ボタン131D3を押すことで、検索情報と選択されたカテゴリの情報をサーバ2に送信する(ステップS109)。
サーバ2では、ステップS103で送られたユーザIDで特定された検索者(ユーザ(会員))の固有情報(属性情報)と、ステップS109で送られた検索情報を、コンテンツデータ203aとしてユーザIDに対応して記憶する。また、検索情報は、検索データ206aとして記憶される。以上で、質問者端末としてのユーザ端末1の質問入力処理を終了する。
次に、サーバ2の動作について説明する。図14は、ユーザ端末1から、検索情報が供給されるサーバ2の処理動作を示すフローチャートである。ユーザ端末1から検索者のユーザIDとパスワードを受信し(ステップS201)、会員であることを認証した(ステップS203)後、ユーザIDによって特定された検索者の情報を会員データベースDB2(204a)から抽出しておく(ステップS205)。抽出される検索者の情報には、属性情報(性別、生年月日、職種、専門分野、得意分野、配偶者の有無、子供の有無等)が含まれる。
次に、ユーザ端末1から検索者が発した検索情報(検索文)と、検索者が選択した質問カテゴリ(検索情報に含まれる)を取得する(ステップS207)。検索情報は、検索データ206a(図4参照)として記憶される。ステップS205とステップS207で取得した情報に基づいて、検索処理(ステップS209)が実行される。この処理は、サーバ2が、記憶している質問データ202a、回答データ203a、Q&Aデータ205a対して実行される。
次に、サーバ2の検索処理について説明する。図15に示されているフローチャートに基づいて説明する。ステップS205で抽出した検索者情報から、検索ワードを特定する(ステップS301)。検索情報が、質問文である場合には、その質問文で使われている単語の中から、質問の内容を最も表していると予想される重要単語を検索ワードとして、抽出する。例えば、出現頻度の多い単語、主語として使用される単語等を検索ワードとして複数個特定する。検索者が質問文ではなく、キーワードとして入力している場合には、そのキーワードを検索ワードとして使用する。抽出された複数の検索ワードは、文章中に出現する位置や、出現頻度に基づいて、重み付けされて、順位が付けられる(ステップS303)。例えば、図13において、入力された検索文の場合には、「車」「乗る」「購入」「軽自動車」「維持費」が検索ワードとして特定され、「車」→「乗る」→「購入」→「軽自動車」→「維持費」の順で順位付される。
次に、質問データとして蓄積されている各質問文の概念に、ステップS301で特定された検索ワードが含まれるか判断する(ステップS305)。検索に使用する検索ワードは、順位の高い(重み付けの重いワードから)ものから、順に質問文の概念との照合が行われる。サーバにおいて既に設定されている概念は、上位概念から下位概念に向けて、順に細かく細分化されて設定されている。予め設定さている概念には、概念番号が付され、例えば、最上位概念がn個ある場合には、一番目〜n番目の概念について、概念1〜概念nが付される。一段下位の概念には、概念番号が、概念1−1〜m、概念2−1〜m・・・概念n−1〜m付される。例えば、上位概念について、5番目の概念5の概念の一段下位の概念については、概念番号は、概念5の6番目の概念という意味で、概念5−6とされる。さらにその下位の4番目の概念の概念番号は、概念5−6−4となる。
図16は、概念が上位概念から下位概念に向けて階層分けして設定されている例を示すものである。例えば、検索ワードが「映画」「オススメ」「教える」である場合、最初に「映画」が含まれる上位概念を検索すると、概念3「娯楽」が抽出される。さらに、「娯楽」を細分化された概念(一段下の階層)から映画が含まれる概念を抽出すると、概念3−3「映画」が抽出され、検索ワードと同じ概念が抽出される。
更に下の階層の概念を抽出するには、検索ワード「映画」は使用できないので、次の検索ワード「オススメ」を用いて、「オススメ」が含まれる下位概念を抽出すると、概念3−3−2「オススメ」が抽出され、該概念が、設定された回答文を回答データ203aから抽出すると候補が3つとなり、最終的に候補が3つに絞られることとなる。
検索対象が質問データ202aである場合には、最終的に概念3−3−2「オススメ」が設定されている質問文が複数個抽出されたとすると、各質問文に対して投稿された回答文のすべてが、回答文候補となる。
検索対象が質問データ202aである場合には、最終的に概念3−3−2「オススメ」が設定されている質問文が複数個抽出されたとすると、各質問文に対して投稿された回答文のすべてが、回答文候補となる。
以上のように、下位の概念を抽出できるように、複数の検索ワードを順に用いて、検索対象の質問文を絞り込み、抽出する。検索ワードを用いて下位の階層への絞り込みが出来ない場合で、候補となる文章の数が十分に絞り込まれていない場合には、再度、検索者に対して詳しい検索情報を要求する処理が行われる。
本実施形態の例では、最初の検索対象として質問文に付与されている概念群(質問データ202a)とする。上位概念から「車」で検索し(ステップS305)、該当する概念番号[概念24]が付与された質問が検索され、ヒット数は、例えば、4,893個となり、この質問に対する回答が18,679個抽出される。さらに下位の概念について、検索ワード「車」で再検索する場合、下層の概念に「車」を含むのがない場合、「車」では、検索できないので(ステップS309)、次の順位の検索ワードが存在するか否か判断する(ステップS311)。この実施形態では、次の順位の検索ワード「乗る」が存在するので、「乗る」に変更し(ステップS313)、下層の概念検索を試行する(ステップS307)。
さらに検索不可である場合には、ステップS311、S313を再度実行する。ここで、変更できる検索ワードが存在しない場合には、ユーザ端末1に、再度質問を送信する(ステップS315)。ユーザ端末1では、サーバ2から、再度検索情報の入力を促す画面が送られた場合には(ステップS111)、再入力画面を表示する(ステップS113)。再入力画面は、例えば、図13に示されている入力画面と同様であり、入力画面には、「もう少し詳しく説明して頂けますか?」といった文章を、検索文の入力領域131D2に沿って表示する。或いは、一つ前のステップで、下層への検索が困難となった検索ワードZを用いて、質問文を構成してもよい。例えば、「(検索ワードZ)は、どのような使い方をしますか?」といった内容としてもよい。
検索文が入力され、送信ボタン131D3が押された場合には(ステップS115)、検索文(検索情報)をサーバ2に送信する(ステップS117)。
検索文が入力され、送信ボタン131D3が押された場合には(ステップS115)、検索文(検索情報)をサーバ2に送信する(ステップS117)。
サーバ2では、質問に対する回答(検索情報の補てん)が受信された(ステップS317)後、その入力文から検索ワードをステップS301と同じ手法で特定し(ステップS319)、更に、ステップS303と同じ手法で検索ワードの順位付けを行う(ステップS321)。そして、ステップS307から、概念検索を再開する。
検索ワードを「乗る」に変更して一段下層の概念検索を行うと(ステップS307)、
概念番号[概念24−19]が付与された質問が検索され、ヒット数は、例えば、763個となり、この質問に対する回答が3,681個抽出される。
更に、ステップS309、S311、S313の処理をして、検索ワード「購入」で検索すると(ステップS307)、概念番号[概念24−19−5]が付与された質問が検索され、ヒット数は、例えば、163個となり、この質問に対する回答が839個抽出される。
検索ワードを「乗る」に変更して一段下層の概念検索を行うと(ステップS307)、
概念番号[概念24−19]が付与された質問が検索され、ヒット数は、例えば、763個となり、この質問に対する回答が3,681個抽出される。
更に、ステップS309、S311、S313の処理をして、検索ワード「購入」で検索すると(ステップS307)、概念番号[概念24−19−5]が付与された質問が検索され、ヒット数は、例えば、163個となり、この質問に対する回答が839個抽出される。
階層化された概念の最下層まで検索が行われたか判断し(ステップS325)、最下層でない場合には、ステップS307からの処理を繰り返す。最下層まで検索された場合には、最下層で抽出された回答文候補(回答文群A)を、検索データ206aとして記憶する。次に、検索対象を変更する(ステップS329)。次の検索対象は、Q&Aデータ205aとして記憶されている、質問文と回答文を結合し、該結合した文に基づいて設定された複数の概念群である。この検索対象について、ステップS305からS329までの処理を行う。この処理で、最終的に検索された回答文の候補は、例えば、227個抽出される。この227個の回答文候補は、回答文群Bに検索データ206aとして記憶される(ステップS327)。同様に、ステップS329で、検索対象を変更すれば、回答データ203aの各回答文に設定された概念についても、ステップS305〜S329の処理を行うこともでき、その際抽出された回答文候補は、回答文群Cに検索データ206aとして記憶される。
次に、回答文群A、回答文群B、回答文群Cに記憶されている回答文候補を重ね合わせ、上記いずれの回答文群にも含まれている回答文候補を抽出する(ステップS331)。この絞り込みは、回答文群A、回答文群B、回答文群Cの内、いずれか2つ群の間で行ってもよい。この場合に、重ね合わせられない回答文群の検索対象となるデータベースについては、検索処理を行わなくともよい。
これによって、例えば、回答文群Aと回答文群Bを重ね合わせることにより、回答文群Aと回答文群Bの双方に含まれる回答文候補は、上記の例では46候補となる。
さらに、候補を絞り込むために、検索者の属性に基づく絞り込み処理を行う(ステップS333)。図17は、属性による絞り込み処理の処理フローチャートである。ステップS331で抽出された回答候補から、回答番号を特定し、該回答番号から回答者IDを特定し、さらに回答者IDから、その回答文の回答者属性を特定する(ステップS401)。
さらに、候補を絞り込むために、検索者の属性に基づく絞り込み処理を行う(ステップS333)。図17は、属性による絞り込み処理の処理フローチャートである。ステップS331で抽出された回答候補から、回答番号を特定し、該回答番号から回答者IDを特定し、さらに回答者IDから、その回答文の回答者属性を特定する(ステップS401)。
次に、ステップS205で取得した検索者の属性情報を取得する(ステップS403)。また、回答文に付与されている回答属性も回答候補の回答番号から回答データ203aに基づき取得する。この回答属性とは、回答文に関する情報として蓄積されている「いいね数」(評価値)、優良回答であるか否か、である。
検索者の属性情報と回答者の属性情報とを比較して、共通する属性項目について、属性の内容が近似する回答候補を、ステップS331で絞り込まれた回答候補から抽出する(ステップS407)。ここで、用いられる属性は、年齢、性別、趣味、職業、得意分野、専門分野、居所等である。
検索者の属性情報と回答者の属性情報とを比較して、共通する属性項目について、属性の内容が近似する回答候補を、ステップS331で絞り込まれた回答候補から抽出する(ステップS407)。ここで、用いられる属性は、年齢、性別、趣味、職業、得意分野、専門分野、居所等である。
ここで、属性が近似するとは、以下のように定義される。1)予め属性が近似しているものと推測されるものと予め設定されているもの。2)属性を規定する数値が近い属性 例えば、例えば、属性が年齢等の数値で表されるものであれば、一例として、年齢が2歳以内を属性が近似するものと判断する。3)属性が空間を規定するものであれば、位置が近い属性を近似するものとする。属性が空間を規定するものの例としては、住所が東京であれば、隣接県が住所である者を属性が近似するものと設定する。4)属性を表す概念に対して、上位概念となるもの、又は、上位概念に含まれる下位概念となるものを近似する属性とする。例えば、属性である趣味がバイオリンの演奏で有る場合、バイオリンの上位概念である弦楽器の演奏を趣味とする者を近似する属性にふくめる。又は、チェロは、弦楽器に含まれるので、チェロの演奏も、バイオリンの演奏に近似するものとする。職業が弁護士である場合、法律系の職業の者、例えば、司法書士、行政書士等は、近似する属性を有するものとして扱ってもよい。5)あるいは、予め所定のグループを定義し、同じグループに属する者を、近似する属性としてもよい。例えば、団塊の世代に含まれる年齢の者は、年齢としては、近似する属性には含まれなくとも(既述の例では、年齢差が3歳以上)、世代としては同じグループに属するので近似する属性として扱ってもよい。
次に、回答属性に基づいて絞り込み処理を行う(ステップS409)。各回答候補について、評価値が高い(いいね数が多い)或いは、優良回答であるものを優先して抽出する。以上のように絞り込み処理によって、残った回答候補を上位として、回答候補のリストを決定する(ステップS411)。
検索処理フローチャートに戻り、ステップS411で作成したリストの最上位の回答候補を最終的に回答する回答文として決定する(ステップS335)。さらに、メインルーチンに戻り、ステップS335で決定した回答文を、回答データ203aから取得して、該回答文を含んだ検索結果画面をユーザ端末1へ送信する(ステップS211)。
検索処理フローチャートに戻り、ステップS411で作成したリストの最上位の回答候補を最終的に回答する回答文として決定する(ステップS335)。さらに、メインルーチンに戻り、ステップS335で決定した回答文を、回答データ203aから取得して、該回答文を含んだ検索結果画面をユーザ端末1へ送信する(ステップS211)。
ユーザ端末1では、検索回答結果を受信すると(ステップS119)、図18に示されているように、検索回答画面を表示する(ステップS121)。検索回答画面は、検索文表示領域131D4と、その下側に配置された、回答文表示領域131D5とを有し、回答文表示利用域131D5には、ステップS335で決定された回答文が表示される。この回答文には、検索文に含まれる「車」「家族」「維持費」といった単語は含まれていないが、検索者の意図に沿った内容が抽出されている。回答文表示領域131D5の近傍には、「もっと見る」ボタン131D6が表示されている。
「もっと見る」ボタン131D6を押したことが検出されると(ステップS123)、ユーザ端末1は、サーバ2に回答リスト要求を行う(ステップS125)。このリスト要求があった場合には(ステップS213)、ステップS411で決定した順位に基づいて回答候補のリストを作成し(ステップS215)、リスト画面を生成する(ステップS217)。そして、リスト情報を含んだリスト画面情報がユーザ端末1に送信される(ステップS219)。ユーザ端末1は、リスト画面を受信すると(ステップS127)、リスト画面を表示する(ステップS129)。
図19は、ステップS129で表示されるリスト画面である。リスト画面は、検索文表示領域131D4の下側に、リスト表示領域131D7が設けられ、該領域内には、回答文のリストが、ステップS411で決められた順序に従って、上から下へ順番に配置されている。従って、最も上に位置する回答文が、検索者の検索意図に近いと予測される回答文となる。リスト表示領域131D7内には、回答文が個別に表示された回答候補表示領域131D71〜131D76が表示され、更に下側に続く回答文のリストを、順に下へ繰ってリストを閲覧できる構成となっている。リストには、回答文の冒頭部分のみが表示される。検索者が回答文の全文を読みたい場合には、所望の回答候補表示領域にカーソルPdを重ねて押すことによって、全文要求リクエストが実行される(ステップS131)。このリクエストが行われると、ユーザ端末1は、サーバ2に指定された回答文の送信を要求する(ステップS133)。
サーバ2は、ステップS133の要求があった場合には(ステップS221)、対応する回答文を、回答データ203aから抽出し(ステップS223)、ユーザ端末1に送信する(ステップS225)。ユーザ端末1は、回答文を受信すると(ステップS135)、回答文を画面に表示する(ステップS137)。表示方法は、例えば、図18において、回答文表示領域131D5内に、「他の回答」といったコメントを付けて表示される。
以上の説明した、本発明は、Q&Aシステムにおいて、回答を検索する実施形態として説明したが、Q&Aシステムの中で投稿されるコメント文についても、同様に検索対象としてもよい。或いは、文書による意見交換が行われる議事録から、所望の文書を検索するシステムとしても用いることができる。
1 ユーザ端末
2 サーバ
131D 表示領域
131D2 検索文入力ボックス(検索文入力領域)
2 サーバ
131D 表示領域
131D2 検索文入力ボックス(検索文入力領域)
Claims (6)
- 第1文章情報を記憶した第1データベースと、
第1文章情報に関連した第2文章情報を記憶した第2データベースと、
第1文章情報に含まれる複数の単語に基づいて、その文章情報が表す概念を1又は2以上設定して記憶する第1概念情報記憶手段と、
第2文章情報に含まれる複数の単語に基づいて、その文章情報が表す概念を1又は2以上設定して記憶する第2概念情報記憶手段と、
第1文章情報と、該第1文章情報に関連付けられた第2文章情報の双方に含まれる複数の単語に基づいて、その第1文章情報と第2文章情報が対となって表す概念を1又は2以上設定して記憶する第3概念情報記憶手段と、
検索文章情報を取得する検索情報取得手段と、
前記検索文章情報取得手段によって取得された検索文章情報に含まれる複数の単語に基づいて検索情報を設定する検索情報設定手段と、
前記検索情報設定手段によって設定された検索情報が、前記第1概念情報記憶手段、前記第2概念情報記憶手段及び前記第3概念情報記憶手段の内、少なくとも何れか2つの記憶手段に記憶されている複数の概念のいずれに属するか判定する概念抽出手段と、
概念抽出手段によって抽出された概念に対応する文章情報を、前記第1データベースまたは前記第2データベースから抽出する文章情報抽出手段と、
前記文章情報抽出手段によって抽出された文章情報から、抽出された文章情報に設定されている概念が、複数の前記概念情報記憶手段に記憶されている文章情報を選別する文章情報選別手段とを有する文章検索システム。 - 質問文に関する情報を記憶した質問データベースと、
質問文に対する回答文に関する情報を記憶した回答データベースと、
質問文に含まれる複数の単語に基づいて、その質問文が表す概念を1又は2以上設定して記憶する質問概念情報記憶手段と、
回答文に含まれる複数の単語に基づいて、その回答文が表す概念を1又は2以上設定して記憶する回答概念情報記憶手段と、
質問文と、該質問文に対する回答文の双方の文章を結合させて、その結合された文章に含まれる複数の単語に基づいて、その質問文と回答文の結合文が表す概念を1又は2以上設定して記憶する質問回答概念情報記憶手段と、
検索文章情報を取得する検索情報取得手段と、
前記検索文章情報取得手段によって取得された検索文章情報に含まれる複数の単語に基づいて検索情報を設定する検索情報設定手段と、
前記検索情報設定手段によって設定された検索情報が、前記質問概念情報記憶手段、前記回答概念情報記憶手段及び前記質問回答概念情報記憶手段の内、少なくとも何れか2つの記憶手段に記憶されている複数の概念のいずれに属するか判定する概念抽出手段と、
概念抽出手段によって抽出された概念に対応する文章を、前記質問データベースまたは前記回答データベースから抽出する文章情報抽出手段と、
前記文章情報抽出手段によって抽出された文章から、抽出された文章に設定されている概念が、複数の前記概念情報記憶手段に記憶されている文章を選別する文章情報選別手段とを有するQ&A検索システム。 - 更に、質問文を投稿した質問者の属性情報を蓄積した質問者属性情報データベースと、
回答文を投稿した回答者の属性情報を蓄積した回答者属性情報データベースと、
検索文を投稿した投稿者の属性を取得する検索者属性取得手段と、
前記文章情報選別手段によって抽出された文章に係る質問文及び/又は回答者の属性情報と、前記検索者属性情報取得手段で取得された検索者属性情報とによって、前記文章情報選別手段によって抽出された文章から、さらに特定の文章を選定する文章情報選定手段を有する請求項2に記載のQ&A検索システム。 - 通信ネットワークを介して接続されるサーバに接続された複数のクライアントシステムを介して、ユーザ間で質問と、該質問に対する回答を送受信するQ&Aシステムにおけるクライアントシステムであって、
画面上に画像を表示する表示手段と、
情報を入力する入力手段と、
前記入力手段によりユーザが入力した質問文を取得する質問文取得手段と、
前記質問文取得手段によって取得した質問文に基づいて質問情報を生成する質問情報生成手段と、
前記質問情報生成手段で生成された質問情報を前記サーバに送信する質問情報送信手段と、
送信された質問文に基づいて概念検索された回答文を前記サーバから受信する回答文を取得する回答文受信手段と、
前記回答文受信手段で受信した回答文を、対応する質問文と関連つけて、前記表示手段に表示する回答文表示手段とを有することを特徴とするクライアントシステム。 - 通信ネットワークを介して接続されるサーバに接続された複数のクライアントシステムを介して、ユーザ間で質問と、該質問に対する回答を送受信するQ&Aシステムにおけるサーバであって、
前記クライアントシステムから検索文章情報を取得する検索文章情報受信手段と、
質問文に関する情報を記憶した質問データベースと、
質問文に対する回答文に関する情報を記憶した第2データベースと、
質問文に含まれる複数の単語に基づいて、その質問文が表す概念を1又は2以上設定して記憶する質問概念情報記憶手段と、
回答文に含まれる複数の単語に基づいて、その回答文が表す概念を1又は2以上設定して記憶する回答概念情報記憶手段と、
質問文と、該質問文に対する回答文の双方の文章を結合させて、その結合された文章に含まれる複数の単語に基づいて、その質問文と回答文の結合文が表す概念を1又は2以上設定して記憶する質問回答概念情報記憶手段と、
前記検索文章情報受信手段によって受信した検索文章情報に含まれる複数の単語に基づいて検索情報を設定する検索情報設定手段と、
前記検索情報設定手段によって設定された検索情報が、前記質問概念情報記憶手段、前記回答概念情報記憶手段及び前記質問回答概念情報記憶手段の内、少なくとも何れか2つの記憶手段に記憶されている複数の概念のいずれに属するか判定する概念抽出手段と、
概念抽出手段によって抽出された概念に対応する文章を、前記質問データベースまたは前記回答データベースから抽出する文章情報抽出手段と、
前記文章情報抽出手段によって抽出された文章から、抽出された文章に設定されている概念が、複数の前記概念情報記憶手段に記憶されている文章を選別する文章情報選別手段と
前記文章情報選別手段によって選別された文章を、検索文章情報を取得したクライアントシステムへ送信する選別文章情報送信手段とを有するサーバ。 - 更に、質問文を投稿した質問者の属性情報を蓄積した質問者属性情報データベースと、
回答文を投稿した回答者の属性情報を蓄積した回答者属性情報データベースと、
検索文を投稿した投稿者の属性をクライアントシステムから受信する検索者属性受信手段と、
前記文章情報選別手段によって抽出された文章に係る質問文及び/又は回答者の属性情報と、前記検索者属性情報受信手段で取得された検索者属性情報とによって、前記文章情報選別手段によって抽出された文章から、さらに特定の文章を選定する文章情報選定手段を有する請求項5に記載のサーバ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016202147A JP2018063610A (ja) | 2016-10-13 | 2016-10-13 | 文章検索システム、q&a検索システム、クライアントステム及びサーバ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016202147A JP2018063610A (ja) | 2016-10-13 | 2016-10-13 | 文章検索システム、q&a検索システム、クライアントステム及びサーバ |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018063610A true JP2018063610A (ja) | 2018-04-19 |
Family
ID=61967925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016202147A Pending JP2018063610A (ja) | 2016-10-13 | 2016-10-13 | 文章検索システム、q&a検索システム、クライアントステム及びサーバ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018063610A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020166762A (ja) * | 2019-03-29 | 2020-10-08 | シャープ株式会社 | 情報処理装置、および、情報処理方法 |
JP7351944B2 (ja) | 2022-01-20 | 2023-09-27 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002312375A (ja) * | 2001-04-18 | 2002-10-25 | Lealcom Kk | 知識転換・共有促進方法およびシステム |
JP2009080559A (ja) * | 2007-09-25 | 2009-04-16 | Fujitsu Ltd | 検索システム、方法およびプログラム |
JP2016058101A (ja) * | 2012-03-06 | 2016-04-21 | 株式会社オウケイウェイヴ | クライアントシステム及びサーバ |
-
2016
- 2016-10-13 JP JP2016202147A patent/JP2018063610A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002312375A (ja) * | 2001-04-18 | 2002-10-25 | Lealcom Kk | 知識転換・共有促進方法およびシステム |
JP2009080559A (ja) * | 2007-09-25 | 2009-04-16 | Fujitsu Ltd | 検索システム、方法およびプログラム |
JP2016058101A (ja) * | 2012-03-06 | 2016-04-21 | 株式会社オウケイウェイヴ | クライアントシステム及びサーバ |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020166762A (ja) * | 2019-03-29 | 2020-10-08 | シャープ株式会社 | 情報処理装置、および、情報処理方法 |
JP7234010B2 (ja) | 2019-03-29 | 2023-03-07 | シャープ株式会社 | 情報処理装置、および、情報処理方法 |
JP7351944B2 (ja) | 2022-01-20 | 2023-09-27 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6199947B2 (ja) | サーバ | |
US8886645B2 (en) | Method and system of managing and using profile information | |
KR100802511B1 (ko) | 토픽 기반의 검색 서비스 제공 시스템 및 그 방법 | |
Jones et al. | Improving web search on small screen devices | |
JP2019028647A (ja) | 研修情報提供装置、方法およびプログラム | |
US20090271374A1 (en) | Social network powered query refinement and recommendations | |
US20070020602A1 (en) | Collecting User Responses over a Network | |
KR20080075748A (ko) | 네트워크상의 대화로봇을 이용한 지혜획득 및 제공방법과그 시스템 | |
Kalra et al. | Evaluation indicators of library websites of selected research institutions in India | |
Palanisamy | Evaluation of search engines: a conceptual model and research issues | |
JP2018063610A (ja) | 文章検索システム、q&a検索システム、クライアントステム及びサーバ | |
JP2002236839A (ja) | 情報提供装置および情報提供装置におけるポイント付与方法 | |
KR100503779B1 (ko) | 질문자 답변자 매칭 방법 및 시스템 | |
KR100361773B1 (ko) | 인터넷 웹사이트 검색엔진의 구축방법 | |
JP5774320B2 (ja) | サーバ | |
JP2017097534A (ja) | クライアントシステム及びサーバ | |
JP5498309B2 (ja) | Q&aサイトの会員募集システム | |
KR20090000279A (ko) | 유무선 네트워크를 통한 지혜 획득 및 제공 방법과 그시스템 | |
WO2001098919A1 (en) | Locating information in a network based on user's evaluation | |
KR100890253B1 (ko) | 네트워크상의 휴먼에이전트를 이용한 차세대 지식 획득 및제공 방법과 그 시스템 | |
JP6211337B2 (ja) | データ送信装置、データ記憶装置、データ表示装置、データ検索装置、データ送信方法、データ記憶方法、データ表示方法及びデータ検索方法 | |
KR20150078998A (ko) | 사용자 입력 텍스트 기반의 질문-답변 처리 시스템 및 방법 | |
Kimball | The GeoRef database: A detailed comparison and analysis of three platforms | |
JP2006221443A (ja) | 地図情報システム連動サーチエンジンサーバーシステム。 | |
KR20040087850A (ko) | 질문자 답변자 매칭 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190930 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201110 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210525 |