JP7485029B2 - 情報推薦システム、情報検索装置、情報推薦方法、及びプログラム - Google Patents

情報推薦システム、情報検索装置、情報推薦方法、及びプログラム Download PDF

Info

Publication number
JP7485029B2
JP7485029B2 JP2022530444A JP2022530444A JP7485029B2 JP 7485029 B2 JP7485029 B2 JP 7485029B2 JP 2022530444 A JP2022530444 A JP 2022530444A JP 2022530444 A JP2022530444 A JP 2022530444A JP 7485029 B2 JP7485029 B2 JP 7485029B2
Authority
JP
Japan
Prior art keywords
keywords
information
context
communication
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022530444A
Other languages
English (en)
Other versions
JPWO2021250833A1 (ja
Inventor
健司 釘本
修 鎌谷
高弘 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2021250833A1 publication Critical patent/JPWO2021250833A1/ja
Application granted granted Critical
Publication of JP7485029B2 publication Critical patent/JP7485029B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24575Query processing with adaptation to user needs using context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • G06Q30/015Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示は、コミュニケーション、情報通信、及びデータベース操作命令に関する。
近年のICTのめざましい進展により、電話等による音声通話のみを対象としていた通信ネットワークは、動画、画像、テキストメッセージなどの様々なメディアを扱えるようになった。特に、スマートフォンの普及によって、コミュニケーションのあり方が大きく変化し、相手に関する様々な情報をお互いに共有し、リアルタイムでコミュニケーションを図ることが可能となっている。さらに、ネットワーク上に流通する膨大なコンテンツの中から、利用者は自分の興味あるコンテンツを取捨選択し、相手にも興味を持ってもらえそうなコンテンツの情報についてソーシャルネットワークサービス等を通じてお互いに共有している。
客観的な情報がテキストメッセージを主体として交換される一方で、対人コミュニケーションの質を向上させるために、主観的な情報や感情を共有することの重要性が高まっている。お互いの考えや感情についての共有を通じて、共感を示し合うことで精神的な満足感を得ることができる。主観的な情報や感情は、会議のような明確な目的を持ったコミュニケーションでなく、雑談のようにはっきりとした目的を持たないコミュニケーションを通じて共有されることが多い。雑談は非目的指向のコミュニケーションであるため、会話の話題の選択は話者の自由である。しかし、適切な話題がすぐに思いつかない場合や、話題の選択によってはお互いの対話が活性化しないことがある。このような観点から、対人コミュニケーションにおいて、適切な話題や情報を提供し、コミュニケーションを活性化する手法が必要とされている。例えば、テキストメッセージを介したコミュニケーションにおいては、対話中の内容に適した知識、ニュース、話題、動画コンテンツなどの情報を提供し、コミュニケーションを促進する手法が必要とされている。
膨大なコンテンツから適切な情報を検索、提供する手段として、情報推薦システム(非特許文献1)があり、1990年代の登場以来、種々の情報推薦システムが検討、実用化されている。例として、オンラインショッピング、音楽配信、映画、動画配信などのコンテンツ配信サービス等において、情報推薦システムが利用されている。情報推薦システムにおいては、協調型推薦、内容ベース型推薦、知識ベース型推薦などの手法が従来技術として知られており、より的確な推薦を行うために、各種の手法を結合させて用いたハイブリッド型アプローチが有効とされている。また、推薦システムが使用される状況(コンテキスト)や利用者の状況(コンテキスト)に適応して情報を推薦するシステムも検討が進んでおり、コンテキストアウェア推薦システムと呼ばれる。ここでコンテキストとは、システムにより取得でき、かつ、推薦情報(レコメンドアイテム)の選択やランキングに影響を及ぼしそうな状況パラメータのことである。コンテキストの例として、位置情報、時刻、天気、照明、騒音レベル、株式相場、スポーツのスコア、健康状態、感情、スケジュール、活動状態、グループ活動、同じ部屋に在室中の人物情報、ネットワークトラフィック、プリンタの状態などがある。
「情報推薦システム入門」,田中克己・角谷和俊 監訳,共立出版,2012年 RDF 1.1 Concepts and Abstract Syntax, W3C Recommendation 25 February 2014, https://www.w3.org/TR/rdf11-concepts/.(2020年5月24日検索) OWL 2 Web Ontology Language Document Overview (Second Edition), W3C Recommendation 11 December 2012, https://www.w3.org/TR/owl2-overview/.(2020年5月24日検索) SPARQL Query Language for RDF. W3C Recommendation, Jan. 2008, https://www.w3.org/TR/rdf-sparql-query/.(2020年5月24日検索) SPIN (SPARQL Inference Notation), http://spinrdf.org/.(2020年5月24日検索)
しかしながら、主として購買への誘導を目的として開発されている従来の情報推薦技術は、対人コミュニケーションにおいて、適切な話題や情報を提供し、コミュニケーションを活性化する手法に対して適用することは困難であった。また、購買や音楽などを対象とする従来の情報推薦技術において、複数の手法を組合せたハイブリッド処理を行うことが知られているが、対人コミュニケーションにおける話題や情報提供に対してどのように適用すれば良いのか、複数の手法をどのように組合せて使用するかについては、十分に開示されていない。
計算機が人対人のコミュニケーションに介入し、会話の内容に沿った適切な情報提供をすることは容易ではない。その理由の一つとして、計算機が会話文の意味を的確に把握することが困難であることが挙げられる。人対人のコミュニケーションにおいては、何の話題について話しているのかが会話中に明確に示されることは少ない。そこでテキストマイニング等の技術を用いて、会話文の意味に立ち入らずに計算機が会話を解析し、どのようなカテゴリーの話をしているのか、あるいは話の流れを代表するキーワードが何かを推定する。会話のカテゴリーやキーワードを正確に把握できれば、それらを用いて推薦情報データベースを検索することにより的確な情報提供が可能となる。
しかし、現状の話題抽出技術の多くでは、話題カテゴリーはあまり詳細に分類されておらず、カテゴリー情報を用いても推薦すべき情報を精度良く検索できない。もちろん、カテゴリー情報がまったく役に立たないわけではなく、様々な種類の推薦情報データベースの中から利用すべきデータベースを選択する場合や、検索結果の絞り込みの用途に役立てることはできる。また、キーワード抽出技術を用いることにより、会話中に含まれている名詞等のうち、話題を的確に表しているものが得られる。
しかし、上記のキーワード抽出技術を利用して得られたものと同じキーワードが、情報推薦データベースのインデックス中に存在していない場合には、検索結果を得ることが困難であるという第1の課題がある。
また、一般的に会話においては一回あたりのメッセージが短いことが多く、メッセージから十分な情報量が得られないことがある。このような場合、情報検索の手がかりとなるキーワードがまったく得られないこともある。つまり、上記のキーワード抽出技術には、会話が短い場合には検索結果を得ることが困難であるという第2の課題がある。
そこで、本発明は、上記課題を解決するために、利用者の会話から直接的にキーワードが得られない場合でも情報検索が可能である情報推薦システム、情報検索装置、情報推薦方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明に係る情報推薦システムは、会話に含まれるキーワードから当該キーワードの同義語・類義語・関連語・上位語・下位語・連想語などを含むシノニムを生成し、これらを含むキーワード群で情報検索することとした。なお、本明細書で記載する「シノニム」ないし「シノニム等」は、同義語・類義語・関連語・上位語・下位語・連想語などを含むものとする。
具体的には、本発明に係る情報推薦システムは、
キーワードを含むコミュニケーションコンテキストが紐付けられているレコメンドアイテムを格納しているナレッジベースと、
利用者の会話から話題となっているキーワードを抽出するとともに、当該キーワードをシソーラスデータベースで検索し、当該キーワードのシノニムを含むキーワード群を生成するコンテキスト抽出モジュールと、
前記キーワード群に含まれるキーワードを前記ナレッジベースに照会し、前記キーワード群に含まれるキーワードに紐付けられているレコメンドアイテム及びコミュニケーションコンテキストを抽出し、抽出されたコミュニケーションコンテキストのなかから前記話題に類似するコミュニケーションコンテキストを選択する、類似性判断モジュールと、
選択されたコミュニケーションコンテキストに紐付けられているレコメンドアイテムを前記ナレッジベースから取得する情報検索モジュールと、
を備える。
また、本発明に係る情報検索装置は、
利用者の会話から話題となっているキーワードを抽出するとともに、当該キーワードをシソーラスデータベースで検索し、当該キーワードのシノニムを含むキーワード群を生成するコンテキスト抽出モジュールと、
キーワードを含むコミュニケーションコンテキストが紐付けられているレコメンドアイテムを格納しているナレッジベースに、前記キーワード群に含まれるキーワードを照会し、前記キーワード群に含まれるキーワードに紐付けられているレコメンドアイテム及びコミュニケーションコンテキストを抽出し、抽出されたコミュニケーションコンテキストのなかから前記話題に類似するコミュニケーションコンテキストを選択する、類似性判断モジュールと、
選択されたコミュニケーションコンテキストに紐付けられているレコメンドアイテムを前記ナレッジベースから取得する情報検索モジュールと、
を備える。
さらに、本発明に係る情報推薦方法は、
ナレッジベースに、キーワードを含むコミュニケーションコンテキストが紐付けられているレコメンドアイテムを格納すること、
利用者の会話から話題となっているキーワードを抽出するとともに、当該キーワードをシソーラスデータベースで検索し、当該キーワードのシノニムを含むキーワード群を生成すること、
前記キーワード群に含まれるキーワードを前記ナレッジベースに照会し、前記キーワード群に含まれるキーワードに紐付けられているレコメンドアイテム及びコミュニケーションコンテキストを抽出し、抽出されたコミュニケーションコンテキストのなかから前記話題に類似するコミュニケーションコンテキストを選択すること、並びに
選択されたコミュニケーションコンテキストに紐付けられているレコメンドアイテムを前記ナレッジベースから取得すること、
を行う。
会話の中から抽出したキーワードが情報推薦データベースのインデックスに含まれていない場合であっても、そのシノニム等が情報推薦データベースのインデックスに含まれていれば情報検索が可能となる。従って、本発明は、前記第1の課題を解決でき、利用者の会話から直接的にキーワードが得られない場合でも情報検索が可能である情報推薦システム、情報検索装置、及び情報推薦方法を提供することができる。
さらに、本発明に係る情報推薦システムの前記コンテキスト抽出モジュールは、当該キーワードのシノニムから一部の語を排除した上で前記キーワード群を生成することが好ましい。一般的な語は、検索結果の範囲を広げてしまい、情報検索の精度を低下させることになる。従って、シソーラスの中から一般的な語を除外しておくことで情報検索の精度を高めることができる。
さらに、本発明に係る情報推薦システムは、所定の期間、前記利用者の会話を蓄積するストレージをさらに備え、前記コンテキスト抽出モジュールは、前記ストレージが蓄積する前記利用者の会話からも前記話題となっているキーワードを抽出することが好ましい。
会話が短い場合であっても、過去の会話を含めることで情報推薦データベースのインデックスに含まれているキーワードを抽出することができる。従って、本発明は、前記第2の課題を解決できる。
本発明は、前記情報推薦装置としてコンピュータを機能させるためのプログラムである。本発明の情報推薦装置はコンピュータとプログラムによっても実現でき、プログラムを記録媒体に記録することも、ネットワークを通して提供することも可能である。
なお、上記各発明は、可能な限り組み合わせることができる。
本発明は、利用者の会話から直接的にキーワードが得られない場合でも、間接的に(マルチワード検索技術、連想検索技術、過去の会話の参照等により)キーワードを得て、情報検索が可能である情報推薦システム、情報検索装置、情報推薦方法、及びプログラムを提供することができる。
本発明に係る情報推薦システムのモジュール構成の一例である。 本発明に係る情報推薦システムのモジュール構成の一例である。 コンテキストとレコメンドアイテムの処理手法の一例である。 レコメンドアイテム生成処理手順例の第1例である。 レコメンドアイテム生成処理手順例の第2例である。 レコメンドアイテムとコンテキストの処理例を示す。 レコメンドアイテムとコンテキストデータの構造例を示す。 レコメンドアイテムとコンテキストデータのインスタンス図の一例である。 レコメンドアイテムのインスタンス表現の一例である。 レコメンドアイテム検索ルールの記述例を示す。 キーワードのインスタンス表現の一例である。 キーワード連携検索ルールの記述例を示す。 本発明に係る情報推薦システムのモジュール構成の一例である。 本発明に係る情報推薦方法の一例である。 本発明に係る情報推薦システムのハードウェア構成の一例である。
添付の図面を参照して本発明の実施形態を説明する。以下に説明する実施形態は本発明の実施例であり、本発明は、以下の実施形態に制限されるものではない。なお、本明細書及び図面において符号が同じ構成要素は、相互に同一のものを示すものとする。
(モジュール構成)
図1に、本開示に係る第1のシステムのモジュール構成図を示す。本開示のシステムは、ナレッジベース13、コンテキスト抽出モジュール24、類似性判断モジュール31、情報検索モジュール32を備える。
図2に、本開示に係る第2のシステムのモジュール構成図を示す。本開示の第2のシステムは、第1のシステムに加え、更にレコメンドアイテム収集モジュール11及びコミュニケーションコンテキストラベル抽出モジュール12を備える。また、コンテキスト抽出モジュール24が、汎用コンテキスト抽出モジュール22及び話題コンテキスト抽出モジュール23を備える。以下、本開示の各構成について説明する。
ナレッジベース13は、予め用意されているデータベースであり、利用者94に対するレコメンドアイテムとコンテキストのセットが格納されている。本開示は、コンテキスト抽出モジュール24が話題となっているキーワードを抽出し、類似性判断モジュール31がキーワードを用いて話題に適したコミュニケーションコンテキストをナレッジベース13から抽出し、情報検索モジュール32が抽出したコミュニケーションコンテキストを用いて情報検索を行う。
ここで、コンテキスト抽出モジュール24の抽出するキーワードは、感情などの会話中の状況を表すキーワードを含んでいてもよい。これにより、類似性判断モジュール31は、会話中の状況に適したコミュニケーションコンテキストを抽出することができる。コミュニケーションコンテキストの抽出は、会話のキーワードからに限らない。例えば、図2に示す汎用コンテキスト抽出モジュール22を用意することで、任意のセンサ91からの情報を用いることができる。以下、図2に示すシステム構成を参照しながら、本開示のシステムについて説明する。
レコメンドアイテムは、会話の参加者の少なくとも一人に対するものであり、2以上の利用者で共用していてもよい。2以上の利用者で共用している場合、ナレッジベース13は、利用者94を識別するためのユーザプロファイルをさらに格納していてもよい。これにより、利用者94に適したレコメンドアイテムを提供することができる。
本開示のシステムは、ナレッジベース13にレコメンドアイテムとコミュニケーションコンテキストのセットを格納するために、レコメンドアイテム収集モジュール11及びコミュニケーションコンテキストラベル抽出モジュール12を備える。レコメンドアイテム収集モジュール11は、レコメンドアイテムとなり得るコンテンツをインターネットなどから自動的に収集する。レコメンドアイテムは、ネットワーク95から取得可能な任意のコンテンツであり、例えば、ニュース又は動画、或いはこれらにリンクされたアドレスである。収集したレコメンドアイテムは、コミュニケーションコンテキストラベル抽出モジュール12に送られる。コミュニケーションコンテキストラベル抽出モジュール12は、レコメンドアイテムのコミュニケーションコンテキストを判定し、レコメンドアイテムに関連付けられたコンテキストラベルと共に、レコメンドアイテムをナレッジベース(Knowledge Base;KB)13に格納する。
ここで、コミュニケーションコンテキストラベル抽出モジュール12における、レコメンドアイテムへのコンテキストラベルは、任意の方法を用いることができる。例えば、RDF(Resource Description Framework)とOWL(Web Ontology Language)に基づくオントロジに従った、構造化データを用いることができる。(非特許文献4、5)また、ナレッジベース13では、SPIN(SPARQL Inferencing Notation)に基づいたコンテキストルールを合わせて格納してもよい。(非特許文献6、7)
システム利用者94の周辺にはセンサ91、ディスプレイなどの表示デバイス93、スマートフォン等の利用者端末92等が配置されている。センサ91は、1以上の任意のセンサであり、マイク、カメラ、時計、温度計を含む。センサ入出力モジュール21は、センサ91からの情報を取得し、必要な情報を汎用コンテキスト抽出モジュール22及び話題コンテキスト抽出モジュール23へ送出する。
例えば、センサ91がシステム利用者94の音声データを取得するマイクである場合、センサ入出力モジュール21は、音声データをテキストデータに変換して話題コンテキスト抽出モジュール23に出力する。このとき、センサ入出力モジュール21は、音声データを音量、音質、周波数成分といった特徴量に変換し、汎用コンテキスト抽出モジュール22に出力してもよい。センサ91がシステム利用者94の表情を撮像するカメラである場合、センサ入出力モジュール21は、画像データを汎用コンテキスト抽出モジュール22に出力する。
汎用コンテキスト抽出モジュール22は、センサ入出力モジュール21で得たセンサ情報から時刻情報、環境情報、利用者の位置情報、利用者の表情や視聴メディアなどの映像情報、感情分析カテゴリ、感情分析スコア等の汎用コンテキストを抽出する。例えば、汎用コンテキスト抽出モジュール22は、音量、音質及び周波数成分を含む音声データから得られる特徴量、並びに画像に含まれるユーザの表情、の少なくともいずれかを用いて、汎用コンテキストの一つである感情カテゴリ及び感情分析スコアを抽出する。話題コンテキスト抽出モジュール23は、利用者の会話から、現在の会話の話題を表す話題コンテキストを抽出する。汎用コンテキスト抽出モジュール22及び話題コンテキスト抽出モジュール23によって得られたコンテキストは、類似性判断モジュール31に送出される。
類似性判断モジュール31は、受信した話題コンテキストに含まれる複数のキーワードから話題に適したキーワードを抽出し、ナレッジベース13へ照会し、キーワードが含まれているコミュニケーションコンテキストのなかから話題コンテキストに類似したコミュニケーションコンテキストのリストである類似コンテキストを取得することができる。類似性判断モジュール31は、ナレッジベース13から取得した類似コンテキストを判別し、必要であると判断された類似コンテキストをコンテキストラベルに有するレコメンドアイテムの取得要求を、情報検索モジュール32に対して行う。
例えば、昨日見に行った映画の話をユーザAがユーザBにしている場合、「昨日の夜、渋谷に映画を見に行って、スター・ウォーズなんだけどね。。」との会話文には、「昨日」「渋谷」「映画」「スター・ウォーズ(映画のタイトル)」といった4つのキーワードが含まれる。「昨日」は「日時」の下位コンテキストに属し、「渋谷」は「地名」の下位コンテキストに属し、「スター・ウォーズ(映画のタイトル)」は「映画」の下位コンテキストに属する。この場合、類似性判断モジュール31は、いつどこで映画を見たか、については現在の話題の中心ではないと推察し、「昨日」「渋谷」という日時と地名に属するキーワードは現在のコミュニケーションコンテキストとしては類似性が低いものと判断する。その結果、類似性判断モジュール31は、「映画」「スター・ウォーズ(映画のタイトル)」の2つを現在のコミュニケーションコンテキストとの類似性が高いものと判断し、ナレッジベース13に対してこれらの類似コンテキストの検索を要求する。
その後、ユーザAとユーザBとが映画に関する話題で会話を続けた後、話題が転換し、ユーザBが、「渋谷と言えば、マークシティに7月オープン予定のカフェがあって、そこに今度行きたいと思っているんだけど。。」といった会話に話題が移った場合、この会話文から、「渋谷」「マークシティ」「7月」「カフェ」といった4つのキーワードが抽出される。「渋谷」は「地名」の下位コンテキストに属し、「マークシティ」「カフェ」は「場所」の下位コンテキストに属し、「7月」は「日時」の下位コンテキストに属する。この場合、類似性判断モジュール31は、日時については現在の話題の中心ではないと推察し、「7月」という日時に属するキーワードは現在のコミュニケーションコンテキストとしては類似性が低いものと判断する。その結果、類似性判断モジュール31は、「地名」と「場所」を上位コンテキストとして有する「渋谷」「マークシティ」「カフェ」の3つを現在のコミュニケーションコンテキストとの類似性が高いものと判断し、ナレッジベース13に対してこれらの類似コンテキストの検索を要求する。
情報検索モジュール32は、取得要求に適合したレコメンドアイテムを検索するため、ナレッジベース13、及びネットワーク95の少なくともいずれかへ照会する。情報検索モジュール32は、検索結果として得られたレコメンドアイテムを、レコメンドアイテム出力モジュール33へ送出する。レコメンドアイテム出力モジュール33は、情報検索モジュール32から得られたレコメンドアイテムを、表示デバイス93や利用者端末92等を介して利用者94へ提示する。
ここで、類似性判断モジュール31における、キーワード又はコンテキストの抽出又は選択は、コンテキスト階層、上位コンテキスト又は下位コンテキストの類似度を用いて行う。例えば、上位コンテキスト及び下位コンテキストの類似度を表すスコアを算出し、類似度の高いスコアを有するコンテキストを抽出又は選択する。抽出又は選択は、スコアが一定以上のコンテキストを抽出又は選択してもよいし、スコアが上位の順に予め定められた数のコンテキストを抽出又は選択してもよい。
スコアの算出は、一般的なコサイン類似度を用いることができ、ナレッジベース13に格納されているユーザによるアイテム評価を用いてもよい。本実施形態では、アイテムキーワードとコンテキストキーワードのセットを準備しておくが、必ずしも全く同じキーワードがヒットするとは限らない。そのため、類似の単語のセットをナレッジベース13に格納しておき、類似性判断モジュール31はこれを参照してもよい。この場合、類似性判断モジュール31は、類似の単語のセットにおける意味的な類似度をスコアに用いることができる。
スコアの算出においては、現在のユーザの会話で得られた話題コンテキストに加え、過去のユーザの会話から得られるコンテキストを用いてもよい。また、スコアの算出においては、過去のユーザと現在の他のユーザ間の類似度を用いてもよい。これらの場合、過去のユーザの会話から得られるコンテキストをナレッジベース13に格納しておく。
スコアの算出において過去のユーザの会話から得られるコンテキストを用いる場合、レコメンドアイテム収集モジュール11及びコミュニケーションコンテキストラベル抽出モジュール12は、レコメンドアイテムと同様に、ユーザの会話に対しても、コミュニケーションコンテキストを判定し、レコメンドアイテム/コミュニケーションコンテキストラベルナレッジベース13に格納する。
(第1の実施形態)
本実施形態では、コミュニケーションコンテキストとレコメンドアイテムの処理手法について説明する。図3に、コミュニケーションコンテキストとレコメンドアイテムの処理手法の説明図を示す。レコメンドアイテムの取得S111、コンテキストラベルの付与S112及びナレッジベースへの格納S113は、S114~S118よりも前に実行される。
レコメンドアイテムの取得S111では、レコメンドアイテム収集モジュール11が、レコメンドアイテムの候補となり得るコンテンツを、事前にインターネットやコンテンツサービスから取得する。コミュニケーションコンテキストラベルの付与S112では、コミュニケーションコンテキストラベル抽出モジュール12が、それぞれのレコメンドアイテムに対してキーワード抽出、感情分析等を行うことで、レコメンドアイテムのコミュニケーションコンテキストを抽出し、抽出したコミュニケーションコンテキストのラベルをレコメンドアイテムに付与する。これにより、レコメンドアイテムと、それに対応するコミュニケーションコンテキストのデータのセットが、ナレッジベース13に格納される。
対人コミュニケーションの会話シーンS114において、コンテキストの取得S115及びレコメンドアイテムの検索S116を行う。コンテキストの取得S115では、話題コンテキスト抽出モジュール23が、どのような話題の会話を行っているかについてテキストデータを解析し、キーワード抽出を行う。これによって、話題がキーワードとして抽出される。会話の内容については、マイクなどのセンサ91を利用し、音声データをテキストデータに変換し、得られたテキストデータに対してキーワードを抽出する。
またコンテキストの取得S115では、汎用コンテキスト抽出モジュール22が、会話中の人の表情、音声の特徴量などから、感情を分析し、感情分析カテゴリ及び感情分析スコアを取得する。人の表情については、カメラなどのセンサ91を利用し、人の表情の画像認識から感情を分析する。
類似コンテキストの検索S116では、類似性判断モジュール31が、このようにして得られたキーワード、感情分析カテゴリ及び感情分析スコアをコンテキストとして利用し、コンテキストに対応したレコメンドアイテムとコンテキストのセットを検索する。これにより、類似コンテキストが得られる。ここでの類似コンテキストには、汎用の時刻情報、環境情報、利用者の位置情報、利用者の表情や視聴メディアなどの映像情報等の汎用コンテキストが含まれていてもよい。
レコメンドアイテムの検索S117では、情報検索モジュール32が、類似コンテキストを用い、インターネット等のコンテンツ検索、あるいは、ナレッジベース13への検索により、レコメンドアイテムの検索結果を得る。検索結果により得られたレコメンドアイテムは、会話中の利用者94へ提示される(S118)。
(第2の実施形態)
図4に、本実施形態に係るシステムにおけるシーケンス図を示す。本実施形態のシステムは、ナレッジベース13へのコンテンツ検索を行う。
話題コンテキスト抽出モジュール23は、利用者の会話から、現在の会話の話題を表す話題コンテキストを抽出し、類似性判断モジュール31に送信する(S101)。これにより、類似性判断モジュール31における話題コンテキストが更新される。
類似性判断モジュール31は、話題コンテキストに類似した類似コンテキストについて、ナレッジベース13へ照会する(S102)。これにより、類似性判断モジュール31は、類似コンテキストのリスト応答を得る。
類似性判断モジュール31は、得られた類似コンテキストのリストを用いてレコメンドアイテムの検索に用いる検索キーワードを生成し、情報検索モジュール32へ送信する(S103)。検索キーワードの生成は、コンテキスト階層、上位コンテキスト又は下位コンテキストの類似度を用いて行う。
情報検索モジュール32は、受信した検索キーワードをナレッジベース13へレコメンドアイテムの検索要求として送信する(S104)。ナレッジベース13は、検索要求に対する検索応答として、検索キーワードに一致するレコメンドアイテムを情報検索モジュール32へ返信する(S104)。
情報検索モジュール32は、得られたレコメンドアイテムをレコメンドアイテム出力モジュール33に送信し(S105)、レコメンドアイテム出力モジュール33は利用者94へレコメンドアイテムを提示する(S106)。
汎用コンテキスト抽出モジュール22からの汎用コンテキストについても、話題コンテキスト抽出モジュール23からの話題コンテキストと同様に、類似性判断モジュール31に送出される(S101)。この場合、類似性判断モジュール31は、話題コンテキスト及び汎用コンテキストの両方と一致する類似コンテキストを取得する(S102)。
(第3の実施形態)
図5に、本実施形態に係るシステムにおけるシーケンス図を示す。本実施形態のシステムは、インターネット等のコンテンツ検索を行う。
図4に示した手順との違いは、情報検索モジュール32がインターネットコンテンツや地図情報などを保有するネットワーク95に対してレコメンドアイテムの検索要求を送信する点にある。固有名詞や地名、場所などの位置情報が話題コンテキストに含まれている場合、ナレッジベース13ではなく、ネットワーク95に対して検索をかけることが望ましい場合がある。そこで、情報検索モジュール32は、類似性判断モジュール31からの検索キーワードを分析することにより、ネットワーク95に対して検索をかけるか否かの判定を行う(S201)。
ネットワーク95に対して検索を行う場合、情報検索モジュール32は、固有名詞や地名、場所などを抽出する既定の検索ルールを利用し、ネットワーク95への検索要求を行う(S202)。この場合、情報検索モジュール32は、検索に望ましいものか否かの判断を行い、適切なコンテンツを保持する可能性の高いネットワーク95に対して、検索要求を送信する。
なお、ネットワーク95に対して検索要求を行う場合、情報検索モジュール32は、コンテンツを保持したネットワーク95への検索要求(S202)だけでなく、ナレッジベース13への検索要求(S104)の両方を行ってもよい。このように、本開示は、ナレッジベース13及びコンテンツを保持したネットワーク95のどちらに検索要求を送信してもよく、あるいは、双方に検索要求をかけてもよい。
(第4の実施形態)
図6に、ナレッジベースに格納されるレコメンドアイテムとコンテキストの処理例を示す。本実施形態では、レコメンドアイテム収集モジュール11は、レコメンドアイテムとなり得るニュースコンテンツを提供するニュースサイトから、ニュースのURLとヘッドラインを取得する。
コミュニケーションコンテキストラベル抽出モジュール12は、取得したヘッドラインに対して、キーワード抽出と感情分析を行う。コミュニケーションコンテキストラベル抽出モジュール12は、ニュースのURL、ヘッドライン、抽出キーワード、感情分析カテゴリ、感情分析スコアを構造化RDFデータとして、ナレッジベース13に格納する。これにより、レコメンドアイテムであるニュースコンテンツがキーワード、感情分析カテゴリ及び感情分析スコアを含むコンテキストラベルと紐付けされたセットがナレッジベース13に格納される。
ここで、感情分析カテゴリは、レコメンドアイテムの内容が、“Positive”(P:楽観的)、“Negative”(Ng:悲観的),“Neutral”(N:中立的)のどのカテゴリに分類されるかを示すものである。本実施形態では、取得したヘッドラインを自然言語処理によって分析することで、ニュースコンテンツの感情析カテゴリを判定することができる。感情分析スコアは、得られた感情分析カテゴリに対して、感情分析結果の度合を0から1までの数値で評価したスコアである。
ナレッジベース13へのデータ格納は、HTTP等のプロトコルを使用することができる。ナレッジベース13に対して、レコメンドアイテムを検索したい場合には、レコメンドアイテムに応じた特定の検索キーワードを入力して検索し、それに適合したレコメンドアイテムを検索結果として得ることができる。
同様に、汎用コンテキスト抽出モジュール22が会話中の人の表情などを用いて現在の感情を分析し、これによって暗い表情の人に対してNegativeカテゴリの感情分析結果が得られた場合、情報検索モジュール32は、会話を活性化するために、逆の感情分析カテゴリに分類されている“Positive”カテゴリのレコメンドアイテムを検索する。これにより、本実施形態は、会話を活性化させるレコメンドアイテムを、スコアの高いものから順に提示することができる。
また、情報検索モジュール32は、汎用コンテキスト抽出モジュール22の取得した時刻情報、環境情報、利用者の位置情報、利用者の表情や視聴メディアなどの映像情報などをコンテキストとして利用し、適切なレコメンドアイテムを検索結果として得ることもできる。ナレッジベース13へのレコメンドアイテム検索は、HTTP等のプロトコル、SPARQLクエリを使用することができる。
(第5の実施形態)
本実施形態では、ナレッジベースのデータ構造例と検索ルールの記述例について説明する。図7に、図6に示したレコメンドアイテムとコンテキストデータの構造例を示す。レコメンドアイテムのURLに対して、ヘッドライン、感情分析カテゴリ、感情分析スコア、キーワードを格納する。キーワードは、例えば、ヘッドラインから抽出されたキーワードである。キーワードに対しては、それに関連するコンテキストキーワードを格納してもよい。
図8に、図7のデータ構造に基づいて生成したインスタンスの例を示す。図9に、図8に示したレコメンドアイテム1に対するインスタンス表現を示す。このインスタンスの名称はitem_i1_urlとしている。図9のインスタンス表現では、図8のインスタンスがowlによって表現されている。
図10にレコメンドアイテムを検索する際のルール記述例を示す。この検索ルールでは、格納されたレコメンドアイテムから、感情分析カテゴリが”Positive”であり、感情分析スコアが0.7以上となるものについて、そのレコメンドアイテムのURLとヘッドラインのリストを得るものである。これによって得られたリストから、話題のキーワードと整合するものを検索すれば、特定の会話に適したレコメンドアイテムを提示することが可能となる。ここで示したデータ構造、インスタンス、インスタンス表現、検索ルールの記述は例であり、他にも同様の別のルール記述とすることが可能となる。
図11に、キーワードに対するインスタンス表現を示す。このインスタンス表現においては、キーワードインスタンスi1_key1が、コンテキストキーインスタンス、i1_key1_ckey1、i1_key1_ckey2、i1_key1_ckey3を有することを示す。キーワードインスタントとコンテキストキーインスタンスは、事前にそれらの関連性を考慮して、ナレッジベース13に格納しておくものとする。
例として、i1_key1は「旅行」、i1_key1_ckey1は「国内」、i1_key1_ckey2は「海」、i1_key1_ckey3は「沖縄」、といったものが想定される。前述の手順に示した通り、現在の会話の話題、トピックに関する話題コンテキスト情報は、会話内容のキーワード抽出により得ることができる。
利用者が「旅行」に関する会話を行っていると、話題コンテキスト抽出モジュール23が、「国内」、「海」といったキーワードを抽出する。このキーワードが話題コンテキストに相当する。類似性判断モジュール31は、「国内」及び「海」を話題コンテキストに用い、ナレッジベース13に対して類似コンテキストの検索を行う。これにより、「沖縄」をキーワードに含むレコメンドアイテム1が抽出される。類似性判断モジュール31は、「沖縄」をキーワードに含むレコメンドアイテムの取得要求を情報検索モジュール32に出力する。情報検索モジュール32は、「沖縄」を検索キーワードに用いてレコメンドアイテムを検索することとなる。
図12に、キーワード連携検索ルールを示す。このルールによって、キーワードインスタンスi1_key1が、コンテキストキーインスタンス、i1_key1_ckey1、i1_key1_ckey2、i1_key1_ckey3を有する場合、すでに会話中にi1_key1_ckey1:「国内」、i1_key1_ckey2:「海」が抽出されていた場合、情報検索モジュール32は、類似コンテキストとして、ナレッジベース13からi1_key1_ckey3:「沖縄」を検索結果として得ることが可能となる。
類似性判断モジュール31で得られた類似コンテキストのキーワードは、前述の通りレコメンドアイテムの検索要求に用いられる。本例では、コミュニケーションにおける話題を話題コンテキストとしているが、各種センサからの環境情報をセンサ入出力モジュール21を用いて送受し、必要な情報を汎用コンテキスト抽出モジュール22へ送出する。これにより、汎用コンテキスト抽出モジュール22がセンサ情報から時刻情報、環境情報、利用者の位置情報、利用者の表情や視聴メディアなどの映像情報、感情分析カテゴリ等の汎用コンテキスト情報を抽出し、情報検索モジュール32がそれらも勘案してレコメンドアイテムを検索することも可能となる。ここで示したデータ構造、インスタンス、インスタンス表現、検索ルールの記述は例であり、他にも同様の別のルール記述とすることが可能となる。
(第6の実施形態)
会話シーンでは、コミュニケーション参加者の関係性を考慮して、提示するレコメンドアイテムを検索することが考えられる。そこで、本実施形態では、コミュニケーションにおける参加者の関係性と、それに基づく感情分析結果を考慮した話題の提供を行う。
本実施形態では、コミュニケーション参加者の基本情報や趣味嗜好、関係性は、あらかじめユーザプロファイルとして、RDF等の記述によってナレッジベース13に格納しておく。また、参加者を特定可能な利用者情報も、ユーザプロファイルとしてナレッジベース13に登録する。参加者の特定は、あらかじめ顔画像をナレッジベース13に登録することによる画像認識や、あらかじめ参加者の音声データや特徴量をナレッジベース13に登録しておくことによる、コミュニケーション時の音声認識によって、ユーザプロファイルと関連付けることができる。このように、類似性判断モジュール31は、ナレッジベース13に登録されているユーザプロファイルを参照することで、参加者とその関係性を特定する。
例として、類似性判断モジュール31は、初対面の人同士の会話であると判定すると、感情分析カテゴリが“Positive”となるレコメンドアイテムの取得要求を情報検索モジュール32に出力する。夫婦の会話であれば、類似性判断モジュール31は、感情分析カテゴリが“Negative”となるレコメンドアイテムについても合わせた取得要求を情報検索モジュール32に出力する、といったケースがある。
図10に示したレコメンドアイテムを検索する際のルール記述例を用いれば、情報検索モジュール32は、コミュニケーション参加者の関係性によって、感情分析カテゴリが“Positive”で感情分析スコアが0.7以上となるものについて、そのレコメンドアイテムのURLとヘッドラインのリストを提示したり、感情分析カテゴリが“Negative”で感情分析スコアが0.8以上となるものについて、そのレコメンドアイテムのURLとヘッドラインのリストを提示したりすることが可能となる。
本例では、コミュニケーションにおける参加者の関係性を汎用コンテキスト情報としているが、センサ91からの環境情報をセンサ入出力モジュール21によって送受し、必要な情報を汎用コンテキスト抽出モジュール22へ送出することができる。これにより、汎用コンテキスト抽出モジュール22がセンサ情報から時刻情報、環境情報、利用者の位置情報、利用者の表情や視聴メディアなどの映像情報等の汎用コンテキスト情報を抽出し、情報検索モジュール32がそれらも勘案してレコメンドアイテムを検索することも可能となる。ここで示したデータ構造、インスタンス、インスタンス表現、検索ルールの記述は例であり、他にも同様の別のルール記述とすることが可能となる。
(第7の実施形態)
図13は、本実施形態の情報推薦システム101を説明するモジュール構成図である。情報推薦システム101は、推薦情報データベース部41、情報検索部42、コンテクスト抽出モジュール24、センサ入出力モジュール21、及びレコメンドアイテム出力モジュール33を備える。
詳細には、情報推薦システム101は、
キーワードを含むコミュニケーションコンテキストが紐付けられているレコメンドアイテムを格納しているナレッジベース13と、
利用者の会話から話題となっているキーワードを抽出するとともに、当該キーワードをシソーラスデータベースで検索し、当該キーワードのシノニムを含むキーワード群を生成するコンテキスト抽出モジュール24と、
前記キーワード群に含まれるキーワードをナレッジベース13に照会し、前記キーワード群に含まれるキーワードに紐付けられているレコメンドアイテム及びコミュニケーションコンテキストを抽出し、抽出されたコミュニケーションコンテキストのなかから前記話題に類似するコミュニケーションコンテキストを選択する、類似性判断モジュール31と、
選択されたコミュニケーションコンテキストに紐付けられているレコメンドアイテムをナレッジベース13から取得する情報検索モジュール32と、
を備える。
情報推薦システム101と実施形態1から6で説明した情報推薦システム100との相違点は、情報推薦システム101が話題コンテキスト抽出モジュール23の代替として話題カテゴリー・キーワード抽出モジュール23aを有することである。
なお、前述した情報推薦装置は、情報検索部42及びコンテクスト抽出モジュール24から構成される。
レコメンドアイテム収集モジュール11は、レコメンドアイテムとなり得るコンテンツをインターネット95などから自動的に収集する。収集したコンテンツアイテムは、コミュニケーションコンテキストラベル抽出モジュール12に送られ、アイテムに関連付けられたコンテキストラベルと共に、レコメンドアイテム/コミュニケーションコンテキストラベルナレッジベース(KB)13に格納する。KB13はRDF(Resource Description Framework)とOWL(Web Ontology Language)に基づくオントロジに従った、構造化データとして構成される(非特許文献2、3)。また、KB13では、SPIN(SPARQL Inferencing Notation)に基づいたコンテキストルールを合わせて格納する(非特許文献4、5)。
システム利用者94の周辺には各種センサ、ディスプレイなどの表示デバイス、スマートフォン等の利用者端末等が配置される。各種センサからの環境情報をセンサ入出力モジュール21によって送受し、必要な情報をコンテクスト抽出モジュール24へ送出する。コンテクスト抽出モジュール24は、汎用コンテキスト抽出モジュール22及び話題カテゴリー・キーワード抽出モジュール23aを有する。汎用コンテキスト抽出モジュール22は、センサ情報から時刻情報、環境情報、利用者の位置情報等の汎用コンテキスト情報を抽出する。話題カテゴリー・キーワード抽出モジュール23aは、利用者の会話から、現在の会話の話題カテゴリー、キーワードに関するコンテキスト情報を抽出する。汎用コンテキスト抽出モジュール22及び話題カテゴリー・キーワード抽出モジュール23aによって得られたコンテキスト情報は、類似性判断モジュール31に送出される。
類似性判断モジュール31は、受信した複数のコンテキスト情報から必要なコンテキスト情報のみを抽出する。なお、「必要なコンテキスト情報」とはレコメンドアイテム/コミュニケーションコンテキストラベルKB13に予め登録されているコンテキスト情報を意味する。たとえば、類似性判断モジュール31は、予めレコメンドアイテム/コミュニケーションコンテキストラベルKB13から「必要なコンテキスト情報」について取得しておき、コンテクスト抽出モジュールから通知されたコンテキスト情報から「必要なコンテキスト情報」以外の情報を削除しておく。
類似性判断モジュール31は、当該必要なコンテキスト情報をレコメンドアイテム/コミュニケーションコンテキストラベルKB13へ照会し、当該コンテキスト情報に類似した、情報アイテムと、類似コンテキストのリストを取得する。さらに、類似性判断モジュール31は、取得した類似コンテキストを判別し、必要であると判断された情報アイテムを情報検索モジュール32へ送信する。なお、「必要であると判断された情報アイテム」とは、レコメンドアイテム/コミュニケーションコンテキストラベルKB13で「類似コンテキスト」をキーとして登録されている情報アイテム、つまり前記必要なコンテキスト情報に対応している情報アイテムである。
情報検索モジュール32は、取得要求に適合した情報を検索するため、レコメンドアイテム/コミュニケーションコンテキストラベルKB13、あるいはネットワーク95へ照会する。検索結果として得られたレコメンドアイテムは、レコメンドアイテム出力モジュール33へ送出される。レコメンドアイテム出力モジュール33は、当該レコメンドアイテムを、表示デバイスや利用者端末等を介してシステム利用者94へ提示する。
本実施形態では、実施形態1から6で説明した情報推薦システム100と異なる次の2つの動作を説明する。
(1)検索語の拡大
話題カテゴリ・キーワード抽出モジュール23aでは、会話の内容を解析してキーワードを抽出する。一般的なキーワード抽出方法としては、形態素解析器を用いる方法がある。テキストとして与えられた会話文を単語あるいは複合語に分解して出現頻度順のリストを作り。出現頻度の高い順番に数語をキーワードとする。
しかし、このようにして得られたキーワードは、推薦情報データベース部41への検索語としては必ずしも適さないことがある。例えば、推薦情報データベース部41のインデックスに検索語が含まれていない場合は検索結果が得られないし、検索語が一般的すぎると会話に沿った的確な推薦情報が得られない。そこで、話題カテゴリ・キーワード抽出モジュール23aは、シソーラスを使って検索語の範囲を広げる。話題カテゴリ・キーワード抽出モジュール23aは、前述のように会話の解析によって得られたキーワードをインターネット95ないし図示していないシソーラスデータベースで検索し、類義語・同義語・関連語(シノニム等)のリストを作る。話題カテゴリ・キーワード抽出モジュール23aは、それらから一般的な語(一部の語)を排除したうえで検索語として類似性判断モジュール31へ通知する。類似性判断モジュール31は、通知された検索語(コンテクスト情報)でレコメンドアイテム/コミュニケーションコンテキストラベルKB13を検索し、類似コンテクストを得る。このように、検索語を拡大することで、推薦結果を得やすくなる。
なお、上記の「一般的な語」とは、コミュニケーションの内容(話題)を特定することが困難である語であり、例えば「本」や「犬」のような普通名詞である。逆に、「一般的でない語」とは、例えば、「正則行列」とか「量子井戸」のような専門用語である。前者は数学か情報工学を話題として特定でき、後者は物理学か半導体工学の話題として特定できる。また、「一般的な語」は、固有名詞であってもよい。
ただし、一般的な語を組み合わせて話題を特定し、検索語(コンテクスト情報)を抽出することもできる。例えば、話題カテゴリ・キーワード抽出モジュール23aは、コミュニケーション中に「山」、「ルート」、「ロープ」という語があれば登山の話題であろうと推定できる(マルチキーワード検索技術や連想検索技術等を用いる)。このような場合、話題カテゴリ・キーワード抽出モジュール23aは、「一般的な語」を排除しないこととする。
(2)会話テキスト長の調整
情報推薦システム101は、所定の期間、前記利用者の会話を蓄積するストレージ(不図示)をさらに備える。コンテキスト抽出モジュール24は、前記ストレージが蓄積する利用者94の会話からも前記話題となっているキーワードを抽出することを特徴とする。
一般的に会話においては、話者の一回あたりのメッセージが短いことが多く、会話の解析に十分な情報量が得られないために、情報検索の手がかりとなるべきキーワードがまったく得られないこともある。そこで過去に話者が発したメッセージをセンサ入出力モジュール21が備えるストレージあるいはセンサ入出力モジュール21に接続されたストレージに蓄積しておく。そして、話題カテゴリー・キーワード抽出モジュール23aは、現在の会話と前記ストレージに蓄積された会話をあわせたものからキーワードや話題を抽出する。
キーワードの抽出手法には、あらかじめ定めた時間を遡り、現在までの会話データをまとめてキーワード抽出する方法と、十分なキーワードが得られるまで段階的に時刻を遡ってキーワード抽出する方法の二つが考えられる。語の出現頻度の高さにより抽出されるキーワードが決定されるため、前者のほうが的確なキーワードを得やすい。しかし、話題は時間とともに変化していくことがあり、あまり過去に遡りすぎると的確なキーワードが得られなくなるため、過度に会話の取得範囲を広げるのは好ましくない。
なお、「十分なキーワードが得られるまで」とは次の2つの意味である。
一つは「最低一つのキーワードを得るためのメッセージ量に到達するまで」という意味である。一つもキーワードが得られない場合、類似性判断モジュール13はナレッジベース13を検索できず、結果、情報検索モジュール32は情報の推薦ができない。そこで、話題カテゴリー・キーワード抽出モジュール23aは、キーワードが最低一つ得られるまで過去へ向かってメッセージの取得をインクリメンタルに継続する。ただし、話題カテゴリー・キーワード抽出モジュール23aは、ストレージ内のメッセージとメッセージの間に大きな時間差がある場合(例えば半日)、異なる話題に変わっていると判断し、キーワードを得るための対象に含めないようにする。このようにキーワードが得られない場合、情報推薦システム101は情報推薦をしない。
もう一つは、すでに一つ以上のキーワードが得られていても、さらに「精度の高いキーワードが得られるまで過去のメッセージを取得して解析対象とする」という意味である。キーワードの精度は、例えば、TF-IDFのような手法で計算することができる。話題カテゴリー・キーワード抽出モジュール23aは、あらかじめ設定した精度のキーワードが得られたこと、あるいは話題が転換したこと(ストレージ内のメッセージとメッセージの間に大きな時間差がある)により過去のメッセージの取得を打ち切る。
図14は、情報推薦システム101が行う情報推薦方法を説明する処理フローである。当該情報推薦方法は、
ナレッジベース13に、キーワードを含むコミュニケーションコンテキストが紐付けられているレコメンドアイテムを格納すること、
利用者94の会話から話題となっているキーワードを抽出するとともに、当該キーワードをシソーラスデータベースで検索し、当該キーワードのシノニムを含むキーワード群を生成すること、
前記キーワード群に含まれるキーワードをナレッジベース13に照会し、前記キーワード群に含まれるキーワードに紐付けられているレコメンドアイテム及びコミュニケーションコンテキストを抽出し、抽出されたコミュニケーションコンテキストのなかから前記話題に類似するコミュニケーションコンテキストを選択すること、並びに
選択されたコミュニケーションコンテキストに紐付けられているレコメンドアイテムをナレッジベース13から取得すること、
を行う。
基本的な動作は図3で説明した情報推薦方法と同じであるが、会話から検索語を生成する作業(太破線部)が異なっている。会話(ステップS114)から前述した形態素解析器を用いてキーワードを抽出し(ステップT2)、話題のカテゴリーを決定する。図3で説明したように、このキーワードをこのまま使って、ナレッジベース13やインターネット95上の情報検索用WebAPIを利用して検索することもできる(ステップS113、S117a)。しかし、情報推薦システム101は、ステップS115やS116において、より的確な情報推薦のために、シソーラスやストレージに蓄積されていた過去の会話も使って検索語の範囲を広げる(ステップT1、T3)。得られた検索語を使い、ナレッジベース13やインターネットコンテンツのデータベースを検索し(ステップS113、S117a)、検索結果を推薦情報として提示する(ステップS118)。
情報推薦システム101は、このように検索語を生成することで、必ずしも情報量の多くない利用者の会話からカテゴリーやキーワードを的確に抽出できるようになり、情報推薦の精度をあげることが可能となる。
(第9の実施形態)
図15は、システム100のハードウェア構成の一例を示している。システム100は、本開示に係る情報推薦装置として機能するコンピュータ96を含む。コンピュータ96は、ネットワーク95へと接続されていてもよい。ネットワーク95は、データ通信ネットワークである。通信は、ネットワーク95を介して電子信号及び光信号によって行われる。
コンピュータ96は、プロセッサ110、及びプロセッサ110に接続されたメモリ120を含む。プロセッサ110は、命令に応答し且つ命令を実行する論理回路で構成される電子デバイスである。メモリ120は、コンピュータプログラムがエンコードされた有形のコンピュータ96にとって読み取り可能な記憶媒体である。この点に関し、メモリ120は、プロセッサ110の動作を制御するためにプロセッサ110によって読み取り可能及び実行可能なデータ及び命令、すなわちプログラムコードを記憶する。メモリ120の構成要素の1つは、プログラムモジュール121である。
プログラムモジュール121は、本実施形態に備わる任意のモジュールを含む。例えば、プログラムモジュール121は、センサ入出力モジュール21、汎用コンテキスト抽出モジュール22、話題コンテキスト抽出モジュール23、コンテキスト抽出モジュール24、類似性判断モジュール31、情報検索モジュール32、レコメンドアイテム出力モジュール33、レコメンドアイテム収集モジュール11、コミュニケーションコンテキストラベル抽出モジュール12を含む。
プログラムモジュール121は、本明細書に記載のプロセスを実行するようにプロセッサ110を制御するための命令を含む。プログラムモジュール121は、すでにメモリ120へとロードされているものとして示されているが、メモリ120へと後にロードされるように記憶装置140上に位置するように構成されてもよい。記憶装置140は、プログラムモジュール121を記憶する有形のコンピュータにとって読み取り可能な記憶媒体である。あるいは、記憶装置140は、ネットワーク95を介してコンピュータ96へと接続される他の種類の電子記憶デバイスであってもよい。
[付記]
以下は、本実施形態の情報推薦システムを説明したものである。
(課題)
第1の課題は、利用者の会話から抽出したキーワードを同義語、類義語、関連語(シノニム等)に変換し、それらを推薦情報データベース検索語として用いることにより、より的確な推薦情報を得ることである。
第2の課題は、利用者の会話において、話者の一回の発言のメッセージ長が短く、キーワード解析に十分な情報量が得られない場合に、過去に話者が発したメッセージを解析対象に含めることで、精度良くキーワードや話題を抽出することである。
(解決手段)
本情報推薦システムでは、推薦情報データベースに対する検索語の範囲を広げるために、シソーラスのデータベースを用いる。シソーラスは類義語辞典の一種であり、同義関係や類義関係、上位概念・下位概念などによって語を体系的に分類づけたものである。シソーラスにより、キーワードの上位・下位概念や類義語・同義語が得られる。これらから会話の内容を代表しない一般的な語を除いたのち、推薦情報データベースに対する検索語とすることで、元のキーワードだけ検索語として用いるよりも的確な多くの検索結果が得られる。
話者のメッセージ長が短すぎてキーワード解析が困難となる場合には、過去に話者が発したメッセージも含めてキーワードや話題を抽出する。あらかじめ定めた時間を遡り、現在までの会話データをまとめてキーワード抽出する方法と、キーワードが得られるまで段階的に時刻を遡ってキーワード抽出する方法の二つが考えられる。
(効果)
本発明は、必ずしも情報量の多くない利用者の会話からカテゴリーやキーワードを的確に抽出できるようになり、情報推薦の精度をあげることが可能となる。
11:レコメンドアイテム収集モジュール
12:コミュニケーションコンテキストラベル抽出モジュール
13:ナレッジベース
21:センサ入出力モジュール
22:汎用コンテキスト抽出モジュール
23:話題コンテキスト抽出モジュール
23a:話題カテゴリー・キーワード抽出モジュール
24:コンテキスト抽出モジュール
31:類似性判断モジュール
32:情報検索モジュール
33:レコメンドアイテム出力モジュール
41:推薦情報データベース部
42:情報検索装置
91:センサ
92:利用者端末
93:表示デバイス
94:利用者
95:ネットワーク(インターネット)

Claims (6)

  1. キーワードを含むコミュニケーションコンテキストが紐付けられているレコメンドアイテムを格納しているナレッジベースと、
    利用者の会話から話題となっているキーワードを抽出するとともに、当該キーワードをシソーラスデータベースで検索し、当該キーワードのシノニムを含むキーワード群を生成するコンテキスト抽出モジュールと、
    前記キーワード群に含まれるキーワードを前記ナレッジベースに照会し、前記キーワード群に含まれるキーワードに紐付けられているレコメンドアイテム及びコミュニケーションコンテキストを抽出し、抽出されたコミュニケーションコンテキストのなかから前記話題に類似するコミュニケーションコンテキストを選択する、類似性判断モジュールと、
    選択されたコミュニケーションコンテキストに紐付けられているレコメンドアイテムを前記ナレッジベースから取得する情報検索モジュールと、
    を備える情報推薦システム。
  2. 前記コンテキスト抽出モジュールは、当該キーワードのシノニムから一部の語を排除した上で前記キーワード群を生成することを特徴とする請求項1に記載の情報推薦システム。
  3. 所定の期間、前記利用者の会話を蓄積するストレージをさらに備え、
    前記コンテキスト抽出モジュールは、前記ストレージが蓄積する前記利用者の会話からも前記話題となっているキーワードを抽出すること
    を特徴とする請求項1又は2に記載の情報推薦システム。
  4. 利用者の会話から話題となっているキーワードを抽出するとともに、当該キーワードをシソーラスデータベースで検索し、当該キーワードのシノニムを含むキーワード群を生成するコンテキスト抽出モジュールと、
    キーワードを含むコミュニケーションコンテキストが紐付けられているレコメンドアイテムを格納しているナレッジベースに、前記キーワード群に含まれるキーワードを照会し、前記キーワード群に含まれるキーワードに紐付けられているレコメンドアイテム及びコミュニケーションコンテキストを抽出し、抽出されたコミュニケーションコンテキストのなかから前記話題に類似するコミュニケーションコンテキストを選択する、類似性判断モジュールと、
    選択されたコミュニケーションコンテキストに紐付けられているレコメンドアイテムを前記ナレッジベースから取得する情報検索モジュールと、
    を備える情報推薦装置。
  5. 請求項4に記載の情報推薦装置が実行する情報推薦方法であって、
    前記ナレッジベースに、キーワードを含むコミュニケーションコンテキストが紐付けられているレコメンドアイテムを格納すること、
    利用者の会話から話題となっているキーワードを抽出するとともに、当該キーワードをシソーラスデータベースで検索し、当該キーワードのシノニムを含む前記キーワード群を生成すること、
    前記キーワード群に含まれるキーワードを前記ナレッジベースに照会し、前記キーワード群に含まれるキーワードに紐付けられているレコメンドアイテム及びコミュニケーションコンテキストを抽出し、抽出されたコミュニケーションコンテキストのなかから前記話題に類似するコミュニケーションコンテキストを選択すること、並びに
    選択されたコミュニケーションコンテキストに紐付けられているレコメンドアイテムを前記ナレッジベースから取得すること、
    を行う情報推薦方法。
  6. 請求項4に記載の情報推薦装置としてコンピュータを機能させるためのプログラム。
JP2022530444A 2020-06-11 2020-06-11 情報推薦システム、情報検索装置、情報推薦方法、及びプログラム Active JP7485029B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/022960 WO2021250833A1 (ja) 2020-06-11 2020-06-11 情報推薦システム、情報検索装置、情報推薦方法、及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2021250833A1 JPWO2021250833A1 (ja) 2021-12-16
JP7485029B2 true JP7485029B2 (ja) 2024-05-16

Family

ID=78847085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022530444A Active JP7485029B2 (ja) 2020-06-11 2020-06-11 情報推薦システム、情報検索装置、情報推薦方法、及びプログラム

Country Status (3)

Country Link
US (1) US20230214413A1 (ja)
JP (1) JP7485029B2 (ja)
WO (1) WO2021250833A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004341672A (ja) 2003-05-14 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> 情報提示方法及び情報提示装置
JP2006195637A (ja) 2005-01-12 2006-07-27 Toyota Motor Corp 車両用音声対話システム
JP2009064268A (ja) 2007-09-06 2009-03-26 Ascii Corp 検索装置、検索システム、検索方法ならびにそのプログラムと記録媒体

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7734641B2 (en) * 2007-05-25 2010-06-08 Peerset, Inc. Recommendation systems and methods using interest correlation
US20100235313A1 (en) * 2009-03-16 2010-09-16 Tim Rea Media information analysis and recommendation platform
US8798995B1 (en) * 2011-09-23 2014-08-05 Amazon Technologies, Inc. Key word determinations from voice data
US20150186514A1 (en) * 2013-12-26 2015-07-02 Iac Search & Media, Inc. Central aggregator architechture for question and answer search engine
US20170017635A1 (en) * 2015-07-17 2017-01-19 Fido Labs Inc. Natural language processing system and method
US10541952B2 (en) * 2017-04-26 2020-01-21 International Business Machines Corporation Recommendation generator responsive to messaging content

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004341672A (ja) 2003-05-14 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> 情報提示方法及び情報提示装置
JP2006195637A (ja) 2005-01-12 2006-07-27 Toyota Motor Corp 車両用音声対話システム
JP2009064268A (ja) 2007-09-06 2009-03-26 Ascii Corp 検索装置、検索システム、検索方法ならびにそのプログラムと記録媒体

Also Published As

Publication number Publication date
US20230214413A1 (en) 2023-07-06
JPWO2021250833A1 (ja) 2021-12-16
WO2021250833A1 (ja) 2021-12-16

Similar Documents

Publication Publication Date Title
CN106227815B (zh) 一种多模态线索的个性化应用程序功能推荐方法及其系统
US8909624B2 (en) System and method for evaluating results of a search query in a network environment
JP6502965B2 (ja) コミュニケーション提供システム及びコミュニケーション提供方法
US9965776B2 (en) Digital content recommendations based on user comments
US20090106307A1 (en) System of a knowledge management and networking environment and method for providing advanced functions therefor
US20120030228A1 (en) Method and system for need fulfillment
US20120036137A1 (en) Method and system for providing actionable relevant recommendations
KR20160055930A (ko) 연속적인 소셜 커뮤니케이션에 사용되는 콘텐츠를 능동적으로 구성하기 위한 시스템 및 방법
US11003720B1 (en) Relevance-ordered message search
KR20090100430A (ko) 질문에 대한 답변 얻기
US11514907B2 (en) Activation of remote devices in a networked system
US20240062749A1 (en) Multi-modal interface in a voice-activated network
JP7096172B2 (ja) キャラクタ性に応じた形容発話を含む対話シナリオを生成する装置、プログラム及び方法
Balduini et al. Recommending venues using continuous predictive social media analytics
Stan et al. Semantic user interaction profiles for better people recommendation
JP7207543B2 (ja) 情報推薦装置、情報推薦システム、情報推薦方法及び情報推薦プログラム
JP7485029B2 (ja) 情報推薦システム、情報検索装置、情報推薦方法、及びプログラム
KR20110129713A (ko) 온오프라인 통합 정보 제공 에이전트, 이를 이용한 시스템 및 방법
Krauss et al. Social preference ontologies for enriching user and item data in recommendation systems
Jose et al. A semantic graph based approach on interest extraction from user generated texts in social media
JP5740272B2 (ja) 対話システム、対話方法およびプログラム
Thanos et al. wayGoo recommender system: personalized recommendations for events scheduling, based on static and real-time information
US20240185847A1 (en) Bit Vector-Based Content Matching for Third-Party Digital Assistant Actions
Hu et al. PQMPMS: a preference-enabled querying mechanism for personalized mobile search
Harrando et al. Combining semantic and linguistic representations for media recommendation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240415

R150 Certificate of patent or registration of utility model

Ref document number: 7485029

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150