JP5880350B2 - 情報検索プログラム及び情報検索装置 - Google Patents

情報検索プログラム及び情報検索装置 Download PDF

Info

Publication number
JP5880350B2
JP5880350B2 JP2012184994A JP2012184994A JP5880350B2 JP 5880350 B2 JP5880350 B2 JP 5880350B2 JP 2012184994 A JP2012184994 A JP 2012184994A JP 2012184994 A JP2012184994 A JP 2012184994A JP 5880350 B2 JP5880350 B2 JP 5880350B2
Authority
JP
Japan
Prior art keywords
search
character information
data
information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012184994A
Other languages
English (en)
Other versions
JP2014044484A (ja
Inventor
圭悟 服部
圭悟 服部
康秀 三浦
康秀 三浦
大熊 智子
智子 大熊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2012184994A priority Critical patent/JP5880350B2/ja
Priority to US13/752,746 priority patent/US20140059070A1/en
Priority to AU2013201012A priority patent/AU2013201012B2/en
Publication of JP2014044484A publication Critical patent/JP2014044484A/ja
Application granted granted Critical
Publication of JP5880350B2 publication Critical patent/JP5880350B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報検索プログラム及び情報検索装置に関する。
従来の技術として、利用者が投稿した文字情報に関連する情報を検索する情報検索装置が提案されている(例えば、特許文献1参照)。
特許文献1に開示された情報検索装置は、Twitter(登録商標)等のように投稿された文章等の複数の文字情報が時系列表示されるマイクロブログにおいて、ある利用者によって投稿された文字情報を取得し、当該文字情報に含まれる1以上の用語を抽出して、抽出された用語が類似する他の利用者が投稿した文字情報を検索して提示する。
特開2009−193133号公報
本発明の目的は、時系列で管理された複数の文字情報から検索用語を含まないが検索用語に関連のある可能性の高い文字情報を検索して提示する情報検索プログラム及び情報検索装置を提供することにある。
本発明の一態様は、上記目的を達成するため、以下の情報検索プログラム及び情報検索装置を提供する。
[1]コンピュータを、
複数の検索キーワードの入力を受け付ける受付手段と、
複数の利用者の複数の文字情報が時系列管理されるストリーミングデータから前記受付手段が受け付けた前記複数の検索キーワードの一を含む文字情報を検索する第1の検索手段と、
前記第1の検索手段が検索した前記検索キーワードの一を含む文字情報の利用者の他の文字情報のうち、当該検索キーワードの一を含む文字情報を基準として予め定めた時系列の範囲に属する文字情報を利用者データとして取得する取得手段と、
前記一のキーワード以外の前記複数の検索キーワードを含む文字情報を前記取得手段が取得した前記利用者データから検索する第2の検索手段と、
前記利用者データのうち、前記第2の検索手段の検索結果を基準として予め定めた時系列の範囲に属する文字情報を出力データとして出力する出力手段として機能させるための情報検索プログラム。
[2]前記取得手段は、前記検索キーワードを含む文字情報を基準として予め定めた範囲に属する文字情報を取得する際、前記検索キーワードの一を含む文字情報の利用者に予め関連付けられた他の利用者の前記予め定めた範囲に属する文字情報も取得する前記[1]に記載の情報検索プログラム。
[3]前記出力手段は、前記出力データが複数存在する場合は、出力データに含まれる文字情報が文字情報以外の情報を参照するための情報を含むものを優先して並べ替えて出力する前記[1]又は[2]に記載の情報検索プログラム。
[4]複数の検索キーワードの入力を受け付ける受付手段と、
複数の利用者の複数の文字情報が時系列管理されるストリーミングデータから前記受付手段が受け付けた前記複数の検索キーワードの一を含む文字情報を検索する第1の検索手段と、
前記第1の検索手段が検索した前記検索キーワードの一を含む文字情報の利用者の他の文字情報のうち、当該検索キーワードの一を含む文字情報を基準として予め定めた時系列の範囲に属する文字情報を利用者データとして取得する取得手段と、
前記一のキーワード以外の前記複数の検索キーワードを含む文字情報を前記取得手段が取得した前記利用者データから検索する第2の検索手段と、
前記利用者データのうち、前記第2の検索手段の検索結果を基準として予め定めた時系列の範囲に属する文字情報を出力データとして出力する出力手段とを有する情報検索装置。
請求項1又は4に係る発明によれば、時系列で管理された複数の文字情報から検索用語を含まないが検索用語に関連のある可能性の高い文字情報を検索して提示することができる。
請求項2に係る発明によれば、他の利用者の文字情報であって、時系列で管理された複数の文字情報から検索用語を含まないが検索用語に関連のある可能性の高い文字情報を検索して提示することができる。
請求項3に係る発明によれば、文字情報以外の情報を参照するための出力データを優先して提示することができる。
図1は、情報検索装置の構成の一例を示すブロック図である。 図2(a)及び(b)は、検索キーワードの入力を受け付ける検索キーワード入力画面の一例を示す概略図である。 図3は、ストリーミングデータの構成の一例を示す概略図である。 図4は、ユーザデータの構成の一例を示す概略図である。 図5は、データ範囲情報とユーザデータとの関係の一例を示す概略図である。 図6は、ユーザデータにおけるキーワード検索の動作を説明するための概略図である。 図7は、データ範囲情報を更新する動作を説明するための概略図である。 図8は、データ出力手段が出力する出力データの一例を示す概略図である。 図9は、情報検索装置の動作の一例を示すフローチャートである。 図10は、第2の実施の形態に係る情報検索装置の構成の一例を示すブロック図である。 図11は、関連ユーザデータ取得手段の動作を説明するための概略図である。 図12は、情報検索装置の動作の他の例を示すフローチャートである。
[第1の実施の形態]
(情報検索装置の構成)
図1は、情報検索装置1の構成の一例を示すブロック図である。
この情報検索装置1は、CPU等から構成され各部を制御するとともに各種のプログラムを実行する制御部10と、HDD(Hard Disk Drive)やフラッシュメモリ等の記録媒体から構成され情報を記憶する記憶装置の一例としての記憶部11と、LCD(Liquid Crystal Display)等の表示部12と、タッチパッド又は複数の操作キーからなる操作部13とを備える。
制御部10は、後述する情報検索プログラム110を実行することで、検索キーワード受付手段100、ストリーミングデータ検索手段101、ユーザデータ取得手段102、データ範囲登録手段103、ユーザデータ検索手段104、データ範囲更新手段105及びデータ出力手段106等として機能する。
検索キーワード受付手段100は、操作部13に対する利用者の操作に応じて複数の検索キーワードの入力を受け付けて検索キーワード情報112として記憶部11に格納する。
ストリーミングデータ検索手段101は、検索キーワード受付手段100が受け付けた検索キーワードのうち最初に入力されたキーワードを含むデータを後述するストリーミングデータ111から検索する。なお、必ずしも最初に入力されたキーワードを含むデータを検索するものに限らない。例えば、2つ目、3つ目…のキーワードを含むデータを検索してもよい。ここで、「ストリーミングデータ」とは、複数の文字情報(投稿)が時系列管理されたデータのことをいう。また、本実施の形態では、文字情報は入力した利用者の情報(ユーザ)も保持するものとする。
ユーザデータ取得手段102は、ストリーミングデータ検索手段101が検索した検索キーワードを含む文字情報(投稿)のユーザのストリーミングデータのうち、当該検索キーワードを含む文字情報(投稿)を基準として一定の時間範囲に属する文字情報(投稿)をユーザデータとして取得する。
このとき、同じユーザの異なる時間帯の当該検索キーワードを含む文字情報(投稿)、つまり、「一定の時間範囲」に含まれない投稿であって、検索キーワードを含む文字情報は、別のユーザデータとして保持する。例えば、あるユーザが2012年8月25日の夕方と8月26日の朝に検索キーワードを含む文字情報を投稿していた場合に、8月25日の夕方の投稿を基準として、一定時間範囲に属する投稿をユーザデータとして保持するとともに、8月16日の午前の投稿を基準として、一定時間範囲に属する投稿を、別のユーザデータとして保持することとなる。
データ範囲登録手段103は、ユーザデータ取得手段102が取得したユーザデータをデータの範囲として後述するデータ範囲情報113に登録する。
ユーザデータ検索手段104は、ストリーミングデータ検索手段101が検索に用いたキーワード以外のキーワードを含むデータをユーザデータ取得手段102が取得したユーザデータから検索する。
データ範囲更新手段105は、ユーザデータ検索手段104の検索結果に基づいてデータ範囲情報113のデータの範囲を更新する。
データ出力手段106は、データ範囲更新手段105が更新したデータ範囲情報113に基づいて出力データを出力する。
記憶部11は、情報検索プログラム110、ストリーミングデータ111、検索キーワード情報112及びデータ範囲情報113等を格納する。
情報検索プログラム110は、制御部10で実行することにより制御部10を上記した各手段100〜106として機能させるプログラムである。
ストリーミングデータ111は、一例として、複数の利用者によって文字情報が投稿されたマイクロブログ(Microblog)等である。ここで、マイクロブログとは、投稿(送信)された複数の文字情報等が時系列表示されるものである。以下において、マイクロブログに投稿された文字情報の単位を説明のため「投稿情報」と呼び、投稿情報には文字情報及び外部リンクのURL、文字情報のみ、外部リンクのURLのみが含まれる場合があるものとする。つまり、マイクロブログ情報は複数の投稿情報を有する。
なお、ストリーミングデータ111は、マイクロブログ以外であってもよく、時系列で管理されるテキスト情報であればよい。他の例については後述する。また、ストリーミングデータ111は、外部から取得する構成であってもよい。
検索キーワード情報112は、検索キーワード受付手段100が受け付けた複数のキーワードを有する。
データ範囲情報113は、時系列で管理されたストリーミングデータ111の投稿情報のうち、データ範囲登録手段103によって登録される又はデータ範囲更新手段105によって更新される投稿情報の時系列の範囲を定義する情報である。
なお、情報検索装置1は、例えば、サーバ装置やパーソナルコンピュータであり、携帯電話等や携帯情報処理端末を用いることができる。
(情報検索装置の動作)
次に、本実施の形態の作用を、(1)検索キーワード受付動作、(2)ストリーミングデータ検索動作、(3)ユーザデータ取得動作、(4)データ範囲登録動作、(5)ユーザデータ検索動作、(6)データ範囲更新動作、(7)データ出力動作に分けて説明する。
図9は、情報検索装置1の動作の一例を示すフローチャートである。
(1)検索キーワード受付動作
まず、検索キーワード受付手段100は、以下の図2(a)において示すように、検索キーワード入力画面120Aにおいて、操作部13に対する利用者の操作に応じて複数の検索キーワードの入力を受け付けて検索キーワード情報112として記憶部11に格納する(S1)。
図2(a)及び(b)は、検索キーワードの入力を受け付ける検索キーワード入力画面の一例を示す概略図である。
図2(a)に示すように、検索キーワード入力画面120Aは、表示部12に表示され、検索キーワードを入力する入力欄120aと、検索を実行するための検索ボタン120bとを有する。
図2(b)に示すように、上記入力欄120aに入力されたキーワードは、「長良川花火大会」、「おすすめ」、「場所」のように検索キーワード情報112aとして格納される。
(2)ストリーミングデータ検索動作
次に、ストリーミングデータ検索手段101は、検索キーワード受付手段100が受け付けた検索キーワードのうち最初に入力されたキーワード「長良川花火大会」を含むデータを(S2;Yes)、以下の図3において示すように、ストリーミングデータ111aから検索する(S3)。
図3は、ストリーミングデータの構成の一例を示す概略図である。
図3に示すように、ストリーミングデータ111aは、投稿した利用者(ユーザ)を識別するためのユーザID111と、投稿された時刻を示す投稿情報111と、投稿情報として入力された文章、画像(静止画又は動画)が格納された図示しない他のサーバのURL又は文章とURLとからなる内容を示す内容111とを有する。なお、内容111のURLに代えて静止画や動画に関する情報を直接含むものであってもよい。また、図3においては単一のユーザ「Hoge1」の投稿のみ示しているが、実際は複数のユーザの投稿が時刻順に並んで含まれる。
ストリーミングデータ検索手段101は、図3に示す例において、「長良川花火大会」を内容111に含む投稿101aを検索結果として得る。なお、実際には単数又は複数のユーザの投稿が検索結果として得られる。
また、ストリーミングデータ検索手段101は、最初に入力されたキーワード以外の「おすすめ」、「場所」によってステップS3を実行してもよい。また、すべてのキーワード中で検索結果の数が多いものを採用してもよい。
(3)ユーザデータ取得動作
次に、ユーザデータ取得手段102は、ストリーミングデータ検索手段101が検索した検索キーワード「長良川花火大会」を含む投稿101aのユーザ「Hoge1」のストリーミングデータのうち、当該検索キーワード「長良川花火大会」を含む投稿101aを基準として一定の時間範囲に属する投稿をユーザデータとして取得する(S4)。なお、ステップS3において複数のユーザの1又は複数の投稿が検索結果として得られた場合には、ステップS4及び以降のステップS5〜S8は各ユーザデータについて行われる。
図4は、ユーザデータの構成の一例を示す概略図である。
図4に示すように、ユーザデータ102aは、ストリーミングデータ111aの「長良川花火大会」を含む投稿101aから予め定めた時間範囲、例えば、前後3時間の投稿を有する。
ユーザデータ取得手段102は、図4の時刻「2012/7/5 16:32:19」から前後3時間以内の投稿である時刻「2012/7/5 16:30:21」〜「2012/7/5 16:42:53」の投稿をユーザデータ102aとして取得する。
なお、ユーザデータ取得手段102は、投稿101aの前後の予め定めた数の投稿を取得してもよい。例えば、前後2つの投稿を取得するようにしてもよい。また、投稿が連鎖しているもの、つまり、投稿101aを基準として前後の各投稿の時間間隔が予め定めた時間内であるものを取得するようにしてもよい。例えば、投稿101aと次の投稿との間隔が10分以内であれば取得し、次の投稿と2つ先の投稿との間隔が10分以内であれば取得し、2つ先の投稿と3つ先の投稿との間隔が10分より大きい場合は以降の投稿は取得しない。
また、ユーザデータ取得手段102は、ストリーミングデータ検索手段101が検索結果として同一ユーザの投稿において複数の投稿を検索した場合には、当該複数の投稿をすべて含む範囲をユーザデータ102aとして取得してもよい。
(4)データ範囲登録動作
次に、データ範囲登録手段103は、ユーザデータ取得手段102が取得したユーザデータ102aをデータ範囲情報113に登録する(S5)。
図5は、データ範囲情報とユーザデータとの関係の一例を示す概略図である。
図5に示すように、ユーザデータ102aは、ユーザデータ配列「D[j][V]」(j;j番目のユーザデータ、V;ユーザデータに含まれる投稿の時間順の番号)の表示方法によってデータ範囲情報113a、「D[0][0]」〜「D[0][4]」と登録される。
(5)ユーザデータ検索動作
次に、ユーザデータ検索手段104は、2つ目以降のキーワード「おすすめ」、「場所」のそれぞれを含む投稿をユーザデータ取得手段102が取得したユーザデータ102aから検索する(S6)。
図6は、ユーザデータにおけるキーワード検索の動作を説明するための概略図である。
図6に示すように、ユーザデータ検索手段104は、ユーザデータ102aを検索し、2つ目のキーワード「おすすめ」を含む投稿104aを検索結果として得る。
(6)データ範囲更新動作
次に、データ範囲更新手段105は、ユーザデータ検索手段104の検索結果である投稿104aに基づいてデータ範囲情報113のデータの範囲を更新する(S7)。
図7は、データ範囲情報を更新する動作を説明するための概略図である。
図7に示すように、データ範囲更新手段105は、「長良川花火大会」を含む投稿101aと「おすすめ」を含む投稿104aとの間に含まれるデータ105aのデータ範囲情報113b、「D[0][1]」〜「D[0][3]」によりデータ範囲情報113を更新する。
なお、「(6)データ範囲更新動作」は、2番目以降のすべてのキーワードについて実行される(S8)。
(7)データ出力動作
次に、データ出力手段106は、データ範囲更新手段105が更新したデータ範囲情報113に基づいて出力データを出力する(S9)。
図8は、データ出力手段106が出力する出力データの一例を示す概略図である。
出力データ106、106、106は、それぞれ0番目、3番目、9番目のユーザデータについて得られた出力データである。
(実施の形態の効果)
上記した第1の実施の形態によると、1つ目のキーワードで検索された投稿のユーザについて、当該ユーザの一連の投稿から2つ目以降のキーワードで検索を行い、当該検索結果に基づいて出力データとしての一連の投稿の範囲を決定したため、ストリーミングデータ111のように時系列管理された複数の文字情報が含まれるものから、検索用語を含まないが検索用語に関連のある可能性の高い投稿を検索して提示することができる。
上記効果を具体的に説明すると、図8に示すように、出力データ106は「長良川花火大会」及び「おすすめ」という検索キーワードによって検索された情報であるが、2つ目の投稿が「金華山」という検索キーワードではないが検索キーワードに関連性がある確率の高いキーワードを含み、利用者は当該出力データ106から「金華山」という情報が得られるうえ、2つ目の投稿に記載されたURLからストリーミングデータ111以外の情報を得ることができる。
[第2の実施の形態]
図10は、第2の実施の形態に係る情報検索装置の構成の一例を示すブロック図である。なお、第1の実施の形態と同一の構成については、同一の符号を付している。
情報検索装置1Aは、第1の実施の形態の情報検索装置1の制御部10にさらにキーワード並換・拡張手段107、関連ユーザデータ取得手段108及び出力データ並換手段109を有する。
キーワード並換・拡張手段107は、検索キーワード受付手段100が受け付けた複数のキーワードをTF−IDFの降順、文字長降順、名詞優先、品詞の係り受け順等に基づいて並び替える。ここで、「TF−IDF」とは、ある単語の出現頻度(TF)と、逆文書頻度(IDF)の2つの指標に基づいて計算される値であり、出現頻度が高く、かつ、珍しい語ほど値が大きくなるものである。
また、キーワード並換・拡張手段107は、検索キーワード受付手段100が受け付けたキーワードを後述するオントロジー情報114を用いて同義語、類義語、反意語、上位語、下位語、短縮形、漢字−ひらがな−カタカナ−英語の相互変換形、音韻による多言語への変換形等に拡張する。例えば、「長良川花火大会」を「長花」、「長良川」(短縮形)、「Nagaragawa River Fire Flower Festival」(相互変換形)、「Chohana」(短縮形の相互変換形)等に拡張する。
関連ユーザデータ取得手段108は、ユーザデータを取得する対象となるユーザが管理する任意のリストに登録された他のユーザの投稿を取得してユーザデータに追加する。「ユーザが管理する任意のリストに登録された他のユーザ」とは、例えば、Twitterでは「フォロワー」と呼ばれるユーザや「リスト」に登録されたユーザであり、Facebook(登録商標)では「フレンド」と呼ばれるユーザである。
出力データ並換手段109は、データ出力手段106が出力する出力データを、例えば、出力データに含まれる投稿の投稿時刻順、URLを含む投稿を含む出力データを優先した順、検索キーワードとの類似度順等で並べ替えて出力する。なお、検索キーワードと出力データとの類似度は、一例として、それぞれを文書とみなし、当該文書を形態素解析して単語ベクトルとし、単語ベクトルどうしのcosine類似度により算出するものである。
また、情報検索装置1Aは、第1の実施の形態の情報検索装置1の記憶部11にさらにオントロジー情報114を有する。なお、オントロジー情報114は外部から取得される構成であってもよい。
オントロジー情報114は、キーワード並換・拡張手段107において用いられ、キーワードを同義語、類義語、反意語、上位語、下位語、短縮形、漢字−ひらがな−カタカナ−英語の相互変換形、音韻による多言語への変換形等に拡張するための辞書である。
(第2の実施の形態の動作)
第2の実施の形態の動作は、以下に示す動作以外については第1の実施の形態の動作と同様であるため、説明を省略する。
図12は、情報検索装置1の動作の他の例を示すフローチャートである。
ステップS21において、キーワード並換・拡張手段107は、検索キーワード受付手段100が受け付けた複数のキーワードをTF−IDFの降順、文字長降順、名詞優先、品詞の係り受け順等に基づいて並び替える(S21)。
また、ステップS22において、キーワード並換・拡張手段107は、検索キーワード受付手段100が受け付けたキーワードをオントロジー情報114を用いて拡張する(S22)。なお、拡張したキーワードはストリーミングデータ検索手段101及びユーザデータ検索手段104が使用するものである。
また、ステップS26において、関連ユーザデータ取得手段108は、ユーザデータを取得する対象となるユーザが管理する任意のリストに登録された他のユーザの投稿を取得してユーザデータに追加する(S28)。
図11は、関連ユーザデータ取得手段108の動作を説明するための概略図である。
ストリーミングデータ111bにおいて、ユーザID111が「Hoge1」の投稿101bがストリーミングデータ検索手段101の検索結果として検索された場合であって、ユーザ「Hoge1」に関連するユーザとしてユーザ「Hige37」が登録されている場合、関連ユーザデータ取得手段108は、投稿101bから前後3時間以内の「Hige37」の投稿108a及び108bを取得して、ユーザデータ取得手段102が取得した投稿に追加してユーザデータ102bとする。
また、ステップS32において、出力データ並換手段109は、データ出力手段106が出力する出力データを、例えば、投稿日順、URLを含む投稿を含む出力データを優先した順、検索キーワードとの類似度順等で並べ替えて出力する(S32)。
(第2の実施の形態の効果)
上記した第2の実施の形態によると、ユーザデータに関連ユーザデータ取得手段108が取得した投稿108a及び108bを追加したため、ストリーミングデータ111のように文字情報が含まれる投稿であって時系列情報を有する複数の投稿から検索用語を含まないが検索用語に関連のある可能性の高い投稿を関連する他のユーザの投稿からも検索して提示することができる。
また、複数の検索キーワードを並び替えて1つ目のキーワードを予め定めた条件に基づいて変更することにより、当該条件に合致したユーザの投稿を検索することができる。また、検索キーワードを拡張することにより、より多くの検索結果を得ることができる。
また、出力データ並換手段109が出力データを予め定めた条件に基づいて変更することにより、条件に合致した順で出力データを表示することができる。一例として、ストリーミングデータ111以外の情報を得ることができるURLを含む投稿を有する出力データを優先的に表示することで、利用者により多くの情報を提示することができる。
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で種々な変形が可能である。例えば、マイクロブログとしてはTwitterに限らず、Facebook(登録商標)等のように比較的短い文章が投稿されるものであって、文字情報と画像情報(静止画、動画やこれらの情報のリンク先情報も含む)が混在し、それらが時系列で大量に表示されるようなものであれば種類を問わない。また、メールのメッセージ等を対象としてもよい。
また、例えば、複数の人物が登場して会話する動画等に対して本発明を適用した検索を行ってもよい。具体的には当該動画等の音声を音声解析等して人物毎に音声を時系列に沿ってテキスト化し、当該テキストに対して検索キーワードによる検索を行う。これにより、検索結果としてキーワードを含むテキストの範囲が出力データとして出力される。つまり、テキストの範囲から動画の一定の範囲のシーンが抽出され、当該シーンにはキーワード以外のキーワードに関連性の高い音声又は画像が含まれることとなる。
また、動画内の任意のフレームから画像解析(OCR等)してホワイトボードやプレゼンテーションスライドに含まれる文字をテキスト化し、当該テキストに対して検索キーワードによる検索を行ってもよい。これにより、検索結果としてキーワードを含むテキストの範囲が出力データとして出力される。つまり、テキストの範囲から動画の一定の範囲のシーンが抽出され、当該シーンにはキーワード以外のキーワードに関連性の高い音声又は画像が含まれることとなる。
上記実施の形態では制御部10内の各手段100−109の機能をプログラムで実現したが、各手段の全て又は一部をASIC等のハードウエアによって実現してもよい。また、上記実施の形態で用いたプログラムをCD−ROM等の記録媒体に記憶して提供することもできる。また、上記実施の形態で説明した上記ステップの入れ替え、削除、追加等は本発明の要旨を変更しない範囲内で可能である。
1、1A 情報検索装置
10 制御部
11 記憶部
12 表示部
13 操作部
100 検索キーワード受付手段
101 ストリーミングデータ検索手段
102 ユーザデータ取得手段
103 データ範囲登録手段
104 ユーザデータ検索手段
105 データ範囲更新手段
106 データ出力手段
107 キーワード並換・拡張手段
108 関連ユーザデータ取得手段
109 出力データ並換手段
110 情報検索プログラム
111 ストリーミングデータ
112 検索キーワード情報
113 データ範囲情報
114 オントロジー情報
120A 検索キーワード入力画面

Claims (4)

  1. コンピュータを、
    複数の検索キーワードの入力を受け付ける受付手段と、
    複数の利用者の複数の文字情報が時系列管理されるストリーミングデータから前記受付手段が受け付けた前記複数の検索キーワードの一を含む文字情報を検索する第1の検索手段と、
    前記第1の検索手段が検索した前記検索キーワードの一を含む文字情報の利用者の他の文字情報のうち、当該検索キーワードの一を含む文字情報を基準として予め定めた時系列の範囲に属する文字情報を利用者データとして取得する取得手段と、
    前記一のキーワード以外の前記複数の検索キーワードを含む文字情報を前記取得手段が取得した前記利用者データから検索する第2の検索手段と、
    前記利用者データのうち、前記第2の検索手段の検索結果を基準として予め定めた時系列の範囲に属する文字情報を出力データとして出力する出力手段として機能させるための情報検索プログラム。
  2. 前記取得手段は、前記検索キーワードを含む文字情報を基準として予め定めた範囲に属する文字情報を取得する際、前記検索キーワードの一を含む文字情報の利用者に予め関連付けられた他の利用者の前記予め定めた範囲に属する文字情報も取得する請求項1に記載の情報検索プログラム。
  3. 前記出力手段は、前記出力データが複数存在する場合は、出力データに含まれる文字情報が文字情報以外の情報を参照するための情報を含むものを優先して並べ替えて出力する請求項1又は2に記載の情報検索プログラム。
  4. 複数の検索キーワードの入力を受け付ける受付手段と、
    複数の利用者の複数の文字情報が時系列管理されるストリーミングデータから前記受付手段が受け付けた前記複数の検索キーワードの一を含む文字情報を検索する第1の検索手段と、
    前記第1の検索手段が検索した前記検索キーワードの一を含む文字情報の利用者の他の文字情報のうち、当該検索キーワードの一を含む文字情報を基準として予め定めた時系列の範囲に属する文字情報を利用者データとして取得する取得手段と、
    前記一のキーワード以外の前記複数の検索キーワードを含む文字情報を前記取得手段が取得した前記利用者データから検索する第2の検索手段と、
    前記利用者データのうち、前記第2の検索手段の検索結果を基準として予め定めた時系列の範囲に属する文字情報を出力データとして出力する出力手段とを有する情報検索装置。
JP2012184994A 2012-08-24 2012-08-24 情報検索プログラム及び情報検索装置 Active JP5880350B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012184994A JP5880350B2 (ja) 2012-08-24 2012-08-24 情報検索プログラム及び情報検索装置
US13/752,746 US20140059070A1 (en) 2012-08-24 2013-01-29 Non-transitory computer readable medium, information search apparatus, and information search method
AU2013201012A AU2013201012B2 (en) 2012-08-24 2013-02-22 Information search program, information search apparatus, and information search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012184994A JP5880350B2 (ja) 2012-08-24 2012-08-24 情報検索プログラム及び情報検索装置

Publications (2)

Publication Number Publication Date
JP2014044484A JP2014044484A (ja) 2014-03-13
JP5880350B2 true JP5880350B2 (ja) 2016-03-09

Family

ID=50148972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012184994A Active JP5880350B2 (ja) 2012-08-24 2012-08-24 情報検索プログラム及び情報検索装置

Country Status (3)

Country Link
US (1) US20140059070A1 (ja)
JP (1) JP5880350B2 (ja)
AU (1) AU2013201012B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9628986B2 (en) 2013-11-11 2017-04-18 At&T Intellectual Property I, L.P. Method and apparatus for providing directional participant based image and video sharing
CN103995880B (zh) * 2014-05-27 2019-03-12 百度在线网络技术(北京)有限公司 交互式搜索方法和装置
JP6623698B2 (ja) * 2015-11-10 2019-12-25 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理方法、プログラム
JP7451917B2 (ja) * 2019-09-26 2024-03-19 株式会社Jvcケンウッド 情報提供装置、情報提供方法及びプログラム
JP7393923B2 (ja) * 2019-11-18 2023-12-07 日本放送協会 情報収集装置およびそのプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006228132A (ja) * 2005-02-21 2006-08-31 Fuji Xerox Co Ltd 文書データ検索装置、文書データ検索方法、及び文書データ検索プログラム
US20070143300A1 (en) * 2005-12-20 2007-06-21 Ask Jeeves, Inc. System and method for monitoring evolution over time of temporal content
CN101641674B (zh) * 2006-10-05 2012-10-10 斯普兰克公司 时间序列搜索引擎
JP2010020518A (ja) * 2008-07-10 2010-01-28 Hitachi Software Eng Co Ltd 電子掲示板システム
US8527496B2 (en) * 2010-02-11 2013-09-03 Facebook, Inc. Real time content searching in social network
US20120030018A1 (en) * 2010-07-28 2012-02-02 Aol Inc. Systems And Methods For Managing Electronic Content
KR101174213B1 (ko) * 2010-09-30 2012-08-14 엔에이치엔(주) 인맥에 기초한 검색 결과 제공 시스템 및 방법
JP5633343B2 (ja) * 2010-12-01 2014-12-03 富士通株式会社 検索支援装置、プログラム
US8909641B2 (en) * 2011-11-16 2014-12-09 Ptc Inc. Method for analyzing time series activity streams and devices thereof

Also Published As

Publication number Publication date
US20140059070A1 (en) 2014-02-27
JP2014044484A (ja) 2014-03-13
AU2013201012A1 (en) 2014-03-13
AU2013201012B2 (en) 2014-09-11

Similar Documents

Publication Publication Date Title
US10902076B2 (en) Ranking and recommending hashtags
JP6388988B2 (ja) オンライン・ソーシャル・ネットワークにおける検索クエリのための静的ランク付け
US10102245B2 (en) Variable search query vertical access
JP5837723B2 (ja) ソーシャルグラフ情報に基づく構造化検索クエリ
JP6151450B2 (ja) オンライン・ソーシャル・ネットワークにおける検索クエリの書き換え
JP2018501584A (ja) オンライン・ソーシャル・ネットワーク上でニュース関連のコンテンツを検索するための提案キーワード
US20110219299A1 (en) Method and system of providing completion suggestion to a partial linguistic element
JP5880350B2 (ja) 情報検索プログラム及び情報検索装置
US20190026281A1 (en) Method and apparatus for providing information by using degree of association between reserved word and attribute language
JP5895777B2 (ja) 情報分類プログラム及び情報処理装置
US20200043074A1 (en) Apparatus and method of recommending items based on areas
JP5895756B2 (ja) 情報分類プログラム及び情報処理装置
US20150193444A1 (en) System and method to determine social relevance of Internet content
JP2007148741A (ja) Web検索支援サーバ
JP5827449B2 (ja) オンラインソーシャルネットワークのためのパーソナライズされた構造化検索クエリ
JP2011180901A (ja) 経験情報の再利用性評価装置及び方法及びプログラム
JP2015005050A (ja) 検索支援装置及び検索支援プログラム
WO2014073233A1 (ja) 情報検索プログラム及び情報検索装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150306

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151225

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160118

R150 Certificate of patent or registration of utility model

Ref document number: 5880350

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350