JP2009064187A - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP2009064187A
JP2009064187A JP2007230622A JP2007230622A JP2009064187A JP 2009064187 A JP2009064187 A JP 2009064187A JP 2007230622 A JP2007230622 A JP 2007230622A JP 2007230622 A JP2007230622 A JP 2007230622A JP 2009064187 A JP2009064187 A JP 2009064187A
Authority
JP
Japan
Prior art keywords
phrase
speech
morpheme
content
connection pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007230622A
Other languages
English (en)
Other versions
JP2009064187A5 (ja
Inventor
Mitsuhiro Miyazaki
充弘 宮嵜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007230622A priority Critical patent/JP2009064187A/ja
Priority to US12/203,461 priority patent/US8332208B2/en
Priority to CNA200810147584XA priority patent/CN101382946A/zh
Publication of JP2009064187A publication Critical patent/JP2009064187A/ja
Publication of JP2009064187A5 publication Critical patent/JP2009064187A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users

Abstract

【課題】コンテンツの推薦理由として用いることができるようなフレーズを抽出することができるようにする。
【解決手段】コンテンツ推薦サーバ1において管理される品詞連結パターンは「Start=名詞−一般、Connect=*、End=名詞−一般」のように指定することができ、これは、「名詞−一般」に分類される形態素から1フレーズの連結が開始されて、任意の品詞の形態素で1フレーズの連結が継続されて、「名詞−一般」に分類される形態素で1フレーズの連結が終了する形態素の連結関係を表す。品詞連結パターンにより表される連結関係と同じ連結関係を有する形態素からなるフレーズが、推薦するコンテンツに関するテキスト文書から抽出され、抽出されたフレーズが推薦理由としてユーザに提示される。本発明はパーソナルコンピュータに適用することができる。
【選択図】図1

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関し、例えばコンテンツの推薦理由として用いることができるようなフレーズを抽出することができるようにした情報処理装置、情報処理方法、およびプログラムに関する。
従来の重要語・フレーズ抽出技術は、一般的に、自然言語処理によって実現されている(特許文献1)。
従来商品化されてきたテキストマイニングツールやWebアプリケーションにおける重要語・フレーズ抽出機能は、テキスト文書の要約やクエリに対する質問応答を目的としている(特許文献2)。
近年、Webサイト上、あるいはAV(Audio Visual)機器上においてコンテンツ推薦システムが実現されている(特許文献3)。このシステムの中には、コンテンツを推薦するとともに、コンテンツの推薦理由として、コンテンツに関する情報が記述されたテキスト文書から抽出された単語レベルのキーワード、あるいは文章全体を提示する機能を有するものがある。
特開2006−209173号公報 特開2006−344102号公報 特開2006−309751号公報
特許文献1に開示されているように自然言語処理によって重要語・フレーズ抽出技術を実現した場合、テキスト文書の文節・係り受け抽出などの構文解析技術が必要不可欠であり、構文解析アルゴリズムの最適化には大規模のコーパスデータによる学習が必要となることから、時間的なコスト、システム的なコストが大きい。
特許文献2に開示されているような重要語・フレーズ抽出機能の目的は、コンテンツに対する評論・評判が記述されているテキスト文書から特徴的なフレーズを抽出することとは目的が異なる。
特許文献3に開示されているように単語を用いて、あるいは文章全体を用いて推薦理由を提示する機能によっては、ユーザがコンテンツの特徴を瞬時に把握することは困難である。
本発明はこのような状況に鑑みてなされたものであり、例えばコンテンツの推薦理由として用いることができるようなフレーズを抽出することができるようにするものである。
本発明の一側面の情報処理装置は、テキスト文書を対象として形態素解析を行う形態素解析手段と、所定の品詞の形態素の連結関係を表す連結パターンを管理する管理手段と、前記形態素解析手段により形態素解析が行われることによって得られた形態素の列から、前記管理手段により管理されている前記連結パターンにより表される連結関係と同じ連結関係を有する複数の形態素からなるフレーズを抽出する抽出手段とを備える。
前記管理手段には、さらに、前記連結パターン毎に重みを管理させ、前記抽出手段には、抽出したフレーズに対して、そのフレーズを構成する形態素の連結関係を表す前記連結パターンに応じた重みを設定させることができる。
ユーザに推薦するコンテンツを選択する推薦手段と、前記推薦手段により選択されたコンテンツの情報を、前記ユーザにより用いられている情報処理端末に表示させる表示制御手段とをさらに設けることができる。この場合、前記形態素解析手段には、前記推薦手段により選択されたコンテンツに関するテキスト文書を対象として形態素解析を行わせ、前記抽出手段には、前記推薦手段により選択されたコンテンツに関するテキスト文書を対象として前記形態素解析手段により形態素解析が行われることによって得られた形態素の列からフレーズを抽出させ、前記表示制御手段には、さらに、前記抽出手段により抽出されたフレーズをコンテンツの推薦理由として表示させることができる。
前記表示制御手段には、コンテンツの推薦理由として表示させるフレーズを、それぞれのフレーズに対して前記抽出手段により設定されている重みに基づいて選択させることができる。
前記管理手段には、前記表示制御手段によりコンテンツの推薦理由として表示されたフレーズを確認したユーザによる評価に応じて、前記連結パターン毎の重みを更新して管理させることができる。
本発明の一側面の情報処理方法またはプログラムは、テキスト文書を対象として形態素解析を行い、所定の品詞の形態素の連結関係を表す連結パターンを管理し、形態素解析を行うことによって得られた形態素の列から、管理している前記連結パターンにより表される連結関係と同じ連結関係を有する複数の形態素からなるフレーズを抽出するステップを含む。
本発明の一側面においては、テキスト文書を対象として形態素解析が行われ、所定の品詞の形態素の連結関係を表す連結パターンが管理され、形態素解析を行うことによって得られた形態素の列から、管理されている前記連結パターンにより表される連結関係と同じ連結関係を有する複数の形態素からなるフレーズが抽出される。
本発明の一側面によれば、例えばコンテンツの推薦理由として用いることができるようなフレーズを抽出することができる。
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書又は図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書又は図面に記載されていることを確認するためのものである。従って、明細書又は図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が発明に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外には対応しないものであることを意味するものでもない。
本発明の一側面の情報処理装置(例えば、図1のコンテンツ推薦サーバ1)は、テキスト文書を対象として形態素解析を行う形態素解析手段(例えば、図4の形態素解析部42)と、所定の品詞の形態素の連結関係を表す連結パターンを管理する管理手段(例えば、図4のパラメータ管理部43)と、前記形態素解析手段により形態素解析が行われることによって得られた形態素の列から、前記管理手段により管理されている前記連結パターンにより表される連結関係と同じ連結関係を有する複数の形態素からなるフレーズを抽出する抽出手段(例えば、図4のフレーズ抽出部44)とを備える。
この情報処理装置には、ユーザに推薦するコンテンツを選択する推薦手段(例えば、図3のコンテンツ推薦部32)と、前記推薦手段により選択されたコンテンツの情報を、前記ユーザにより用いられている情報処理端末に表示させる表示制御手段(例えば、図3の表示データ生成部34)とをさらに設けることができる。
本発明の一側面の情報処理方法またはプログラムは、テキスト文書を対象として形態素解析を行い、所定の品詞の形態素の連結関係を表す連結パターンを管理し、形態素解析を行うことによって得られた形態素の列から、管理している前記連結パターンにより表される連結関係と同じ連結関係を有する複数の形態素からなるフレーズを抽出するステップ(例えば、図6のステップS15)を含む。
以下、本発明の実施の形態について図を参照して説明する。
図1は、本発明の一実施形態に係るコンテンツ推薦システムの構成例を示す図である。
このコンテンツ推薦システムは、コンテンツ推薦サーバ1とユーザ端末2がインターネット3を介して接続されることによって構成される。図1にはコンテンツ推薦サーバ1と通信可能な端末として1つの端末しか示されていないが、実際には、複数の端末がインターネット3に接続され、コンテンツ推薦サーバ1と通信可能とされる。
コンテンツ推薦サーバ1は、テレビジョン番組などのコンテンツに関する情報を管理しており、情報を管理しているコンテンツの中から所定のコンテンツを推薦コンテンツとして選択し、推薦コンテンツに関する情報をインターネット3を介してユーザ端末2に提供する。推薦コンテンツとして、例えば、ユーザ端末2のユーザの嗜好にあうコンテンツが選択される。単に、世間で注目されている話題を扱っているコンテンツや、放送局側が一押しするコンテンツが選択されるようにしてもよい。
ユーザ端末2においては、コンテンツ推薦サーバ1から送信されてきた情報に基づいて、コンテンツの推薦画面が表示される。推薦画面には、タイトルや概要などの、推薦コンテンツに関する情報だけでなく、推薦理由も表示される。推薦理由は、推薦コンテンツに関するテキスト文書から抽出されたフレーズによって提示される。
ここで、フレーズとは、テキスト文書中において並べて配置される複数の形態素から構成される文字列であり、ある位置の句読点から次の句読点までの文字列から構成される文章より短く、かつ、1つの形態素から構成される単語より長い範囲の文字列をいう。
文章全体を読む時間とフレーズだけを読む時間とでは後者の時間の方が短くて済むことから、推薦理由がフレーズによって提示されることにより、ユーザは、文章によって推薦理由が提示される場合に較べて、推薦理由を早く確認することができる。
また、単語だけよりもフレーズの方が説得力のある表現が可能であることから、ユーザは、単語だけが表示され、それによって推薦理由が提示される場合に較べて、推薦理由の意味を容易に確認することができる。
以上のような推薦理由をユーザに提示するコンテンツ推薦サーバ1の一連の処理についてはフローチャートを参照して後述する。
図2は、図1のコンテンツ推薦サーバ1のハードウエア構成例を示すブロック図である。
CPU(Central Processing Unit)11は、ROM(Read Only Memory)12に記憶されているプログラム、または、記憶部18からRAM(Random Access Memory)13にロードされたプログラムに従って各種の処理を実行する。RAM13にはまた、CPU11が各種の処理を実行する上において必要なデータなどが適宜記憶される。
CPU11、ROM12、およびRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インタフェース15も接続されている。
入出力インタフェース15には、キーボード、マウスなどより構成される入力部16、LCD(Liquid Crystal Display)などのディスプレイより構成される出力部17、ハードディスクなどより構成される記憶部18、インターネット3を介してユーザ端末2と通信を行う通信部19が接続されている。
入出力インタフェース15にはまた、ドライブ20が接続される。ドライブ20には、光ディスク、半導体メモリなどよりなるリムーバブルメディア21が適宜装着され、リムーバブルメディア21から読み出されたコンピュータプログラムが必要に応じて記憶部18にインストールされる。
図3は、コンテンツ推薦サーバ1の機能構成例を示すブロック図である。図3に示す機能部のうちの少なくとも一部は、図2のCPU11により所定のプログラムが実行されることによって実現される。
図3に示されるように、コンテンツ推薦サーバ1においては、コンテンツ情報記憶部31、コンテンツ推薦部32、推薦理由生成部33、および表示データ生成部34が実現される。
コンテンツ情報記憶部31は、コンテンツに関連する情報を記憶する。コンテンツ情報記憶部31に記憶されている情報は、推薦するコンテンツの選択にコンテンツ推薦部32により参照される。
例えば、コンテンツ情報記憶部31には、テレビジョン放送やインターネット3を介した放送によって放送される各コンテンツについて、コンテンツのタイトル、コンテンツのジャンル、概要、放送日時、チャンネル番号、コンテンツの詳細を表す情報が記憶される。
コンテンツ推薦部32は、コンテンツ情報記憶部31に記憶されている情報を参照し、推薦コンテンツを選択する。例えば、コンテンツ推薦部32は、ユーザの視聴履歴、録画履歴をユーザ端末2から取得し、ユーザがよく視聴、録画するコンテンツのジャンルと同じジャンルのコンテンツ、ユーザがよく視聴、録画するコンテンツの出演者と同じ出演者が出演しているコンテンツを選択するといったように、ユーザ端末2のユーザの嗜好に基づいて推薦コンテンツを選択する。コンテンツを推薦するアルゴリズムとして、特開2005−176404号公報に開示されている技術を採用することも可能である。
コンテンツ推薦部32は、選択した推薦コンテンツの情報を推薦理由生成部33と表示データ生成部34に出力する。例えば、推薦コンテンツのタイトル(Title)、サブタイトル(Subtitle)、出演者の名前(Summary)、詳細(Detail)の各項目の情報が推薦理由生成部33と表示データ生成部34に供給される。これらの各項目の情報は文字列を含む情報である。
推薦理由生成部33は、コンテンツ推薦部32から供給された文字列により構成されるテキスト文書から所定の数のフレーズを抽出し、抽出したフレーズを推薦理由として表示データ生成部34に出力する。
表示データ生成部34は、コンテンツ推薦部32から供給されたテキスト文書と、推薦理由生成部33から供給された推薦理由に基づいて、推薦画面を表示するためのデータを生成する。表示データ生成部34は、生成したデータを通信部19を制御してユーザ端末2に送信し、推薦画面をユーザ端末2に表示させる。推薦画面に表示される情報のうち、タイトルや概要などの、推薦コンテンツに関する情報はコンテンツ推薦部32から供給されたテキスト文書に基づいて表示され、推薦理由は推薦理由生成部33から供給されたフレーズに基づいて表示される。
図4は、推薦理由生成部33の構成例を示すブロック図である。
図4に示されるように、推薦理由生成部33は、テキスト文書取得部41、形態素解析部42、パラメータ管理部43、およびフレーズ抽出部44から構成される。
テキスト文書取得部41は、コンテンツ推薦部32から供給された各項目の文字列を取得し、取得した文字列により構成されるテキスト文書を形態素解析の対象の文書として設定する。
形態素解析部42は、テキスト文書取得部41により設定されたテキスト文書をパラメータ管理部43により設定されたテキスト整形ルールに従って整形し、整形して得られたテキスト文書を対象として形態素解析を行う。形態素解析部42は、形態素解析を行うことによって得られた形態素の列をフレーズ抽出部44に出力する。形態素解析ツールとしては、例えば、奈良先端科学技術大学が開発したフリーソフト茶筅(http://chasen.naist.jp/hiki/ChaSen/)を用いることができる。
パラメータ管理部43は、形態素解析部42により行われる形態素解析とフレーズ抽出部44により行われるフレーズ抽出において用いられるパラメータを設定する。例えば、パラメータ管理部43は、品詞連結パターン(開始、継続、終了)、品詞連結パターン別重み、文節区切り品詞、テキスト整形ルール、フレーズ禁止パターンの5つのパラメータを設定する。
品詞連結パターンは、抽出すべきフレーズを構成する品詞(形態素)の連結関係を表す。
例えば、品詞連結パターンは「Start=名詞−一般、Connect=*、End=名詞−一般」のように指定することができ、これは、「名詞−一般」に分類される形態素から1フレーズの連結が開始されて、任意の品詞の形態素で1フレーズの連結が継続されて、「名詞−一般」に分類される形態素で1フレーズの連結が終了する形態素の連結関係を表す。具体的には、この品詞連結パターンが注目されている場合において、フレーズ抽出の対象になっているテキスト文書に「〜地球的規模の災害を前にした〜」の文字列が含まれているとき、「名詞−一般」の品詞に分類される形態素である「規模」、「助詞−連体化」の品詞に分類される形態素である「の」、「名詞−一般」の品詞に分類される形態素である「災害」からなる「規模の災害」がフレーズとして抽出される。
品詞連結パターンは、「Start=名詞−一般、Connect=*、End=名詞−一般」のパターン以外にも、「Start=名詞−一般、Connect=名詞−形容動詞語幹、End=名詞−接尾−サ変接続」のパターン、「Start=名詞−固有名詞−一般、Connect=助詞−格助詞−一般、End=名詞−サ変接続」のパターンといったように複数設定される。「*」(アスタリスク)以外にも、「and」、「or」、「not」を使って品詞連結パターンを指定することもできる。また、品詞連結パターン自体を複数組み合わせることもできる。
品詞連結パターン別重みは、品詞連結パターン毎に設定される重みである。品詞連結パターン別重みとして、コンテンツ推薦サーバ1側により固定値が設定されるようにしてもよいし、後述するように、あらかじめ設定された値が、推薦理由のフレーズを確認したユーザの評価によって最適化されるようにしてもよい。
ある品詞連結パターンにより表される連結関係と同じ連結関係を有している形態素からなるフレーズに対しては、その品詞連結パターンに設定されている品詞連結パターン別重みと同じ重みが設定される。フレーズの重みは、推薦理由として表示するフレーズの選択や、フレーズの表示の仕方を決定することなどに用いられる。
文節区切り品詞は、全ての品詞連結パターンに共通な連結の終了を意味する品詞である。文節区切り品詞として、通常、句点や読点が設定される。
テキスト整形ルールは、形態素解析の目的に応じた、形態素解析に関するルールである。テキスト整形ルールとして、形態素解析の対象となるテキスト文書に含まれる括弧()内の文字列を解析対象から除外するルールなどが設定される。
フレーズ禁止パターンは、目的に応じて設定されるものであり、最終的に抽出するフレーズとして相応しくない品詞連結パターンを表す。品詞連結パターンにより表される連結関係と同じ連結関係を有する形態素であるとして抽出されたフレーズのうち、空白文字や記号などを含むフレーズがフレーズ禁止パターンに従って除外される。
このようなパラメータがパラメータ管理部43により管理されており、これらのパラメータのうち、テキスト整形ルールは形態素解析部42に設定され、品詞連結パターン(開始、継続、終了)、品詞連結パターン別重み、文節区切り品詞、フレーズ禁止パターンはフレーズ抽出部44に設定される。
フレーズ抽出部44は、形態素解析部42により形態素解析が行われることによって得られた形態素の列から、フレーズ抽出部44により設定されたパラメータに従って推薦理由として用いられるフレーズを抽出し、抽出したフレーズを表示データ生成部34に出力する。
次に、以上のような構成を有するコンテンツ推薦サーバ1の処理について説明する。
はじめに、図5のフローチャートを参照して、コンテンツの推薦を行うコンテンツ推薦サーバ1の処理について説明する。この処理は、コンテンツの推薦がユーザ端末2から要求されたときに開始される。
ステップS1において、コンテンツ推薦部32は、コンテンツ情報記憶部31に記憶されている情報を参照し、推薦コンテンツを選択する。コンテンツ推薦部32は、選択した推薦コンテンツのTitle、Subtitle、Summary、Detailの各項目の情報を推薦理由生成部33と表示データ生成部34に出力する。
ステップS2において、推薦理由生成部33はテキスト文書解析処理を行い、テキスト文書解析処理を行うことによって抽出されたフレーズを推薦理由として表示データ生成部34に出力する。テキスト文書解析処理の詳細については図6のフローチャートを参照して後述する。
ステップS3において、表示データ生成部34は、コンテンツ推薦部32から供給されたテキスト文書と、推薦理由生成部33から供給された推薦理由に基づいて推薦画面をユーザ端末2に表示させ、処理を終了させる。
次に、図6のフローチャートを参照して、図5のステップS2において行われるテキスト文書解析処理について説明する。
ステップS11において、テキスト文書取得部41は、コンテンツ推薦部32から供給された各項目の文字列を取得し、取得したTitle、Subtitle、Summary、Detailの各項目の文字列により構成されるテキスト文書を形態素解析の対象の文書として設定する。
図7は、テキスト文書取得部41により取得されるテキスト文書の例を示す図である。
図7の例においては、「草野球日本一決定戦」がTitleの項目の文字列とされており、「亀有トータス×兎道ラビッツ」がSubtitleの項目の文字列とされている。すなわち、図7は、「草野球日本一決定戦」というタイトルのコンテンツが推薦コンテンツとして選択された場合の例を示している。
また、図7の例においては、「〜亀有ドーム解説・岩木真実山田太郎▽“亀旋風・最終ステージ”亀有、悲願の日本一成るか?最速男・ダルシムVS アジアの大砲・大三元、宿命の対決!(試合終了まで延長、以降の番組に繰り下げあるいは変更の場合あり)」がSummaryの項目の文字列とされ、「江戸・亀有ドームで行われる〜注目したい。」がDetailの項目の文字列とされている。
このようなテキスト文書から推薦理由のフレーズが抽出される。なお、推薦理由生成部33において解析対象となるテキスト文書は、コンテンツの内容説明、評論、解説等が記された文章群、および、インターネットや出版物上で公開されている一般ユーザによるコンテンツに対するコメント、批評、評判などが記された文章群であり、記述上の形式は問わない。
図6の説明に戻り、ステップS12において、パラメータ管理部43は、テキスト整形ルールのパラメータを形態素解析部42に設定し、品詞連結パターン(開始、継続、終了)、品詞連結パターン別重み、文節区切り品詞、フレーズ禁止パターンのパラメータをフレーズ抽出部44に設定する。
ステップS13において、形態素解析部42は、テキスト文書取得部41により設定されたテキスト文書をパラメータ管理部43により設定されたテキスト整形ルールに従って整形し、整形して得られたテキスト文書を対象として形態素解析を行う。形態素解析部42は、形態素解析を行うことによって得られた形態素の列をフレーズ抽出部44に出力する。
図8および図9は、図7のテキスト文書を対象とした形態素解析の結果を示す図である。
図8および図9は、Title、Subtitle、Summary、Detailの各項目において文字列が句点で終了していない場合は句点を追加した上で形態素解析を行った場合の結果を示している。形態素解析の結果、テキスト文書は形態素に分割され、それぞれの形態素に、読み仮名、品詞、原形、活用形などの情報が付与される。図8、図9の左側に示される数字と「:」は説明の便宜上付しているものであり、形態素解析の結果として得られるものではない。
図8の1行目乃至5行目は、図7のTitleの項目の文字列である「草野球日本一決定戦」の解析結果を表しており、この例においては、「草野球」、「日本一」、「決定」、「戦」の形態素に分けられている。「草野球」と「日本一」は「名詞−一般」の品詞の形態素として分類され、「決定」は「名詞-サ変接続」の品詞の形態素として分類されている。「戦」は「名詞-接尾-一般」の品詞の形態素として分類されている。
図8の6行目乃至12行目は、図7のSubtitleの項目の文字列である「亀有トータス×兎道ラビッツ」の解析結果を表しており、この例においては、「亀有」、「トータス」、「×」、「兎」、「道」、「ラビッツ」の形態素に分けられている。「亀有」は「名詞−固有名詞−地域−一般」の品詞の形態素として分類され、「トータス」は「名詞-固有名詞-組織」の品詞の形態素として分類されている。また、「×」は「記号−一般」の品詞の形態素として分類され、「兎」は「名詞−一般」の品詞の形態素として分類されている。「道」は「名詞−一般」の品詞の形態素として分類され、「ラビッツ」は「未知語」の品詞の形態素として分類されている。
同様に、図8の13行目乃至図9の10行目は、図7のSummaryの項目の文字列である「〜亀有ドーム解説・岩木真実山田太郎▽“亀旋風・最終ステージ”亀有、悲願の日本一成るか?最速男・ダルシムVS アジアの大砲・大三元、宿命の対決!」の解析結果を表しており、図9の11行目以降は、図7のDetailの項目の文字列である「江戸・亀有ドームで行われる〜注目したい。」の解析結果を表している。
形態素解析が行われることによって得られたこのような形態素の列が、形態素解析部42からフレーズ抽出部44に供給され、フレーズの抽出に用いられる。
図6の説明に戻り、ステップS14において、フレーズ抽出部44は、形態素解析部42から供給された形態素の中に、フレーズを構成する形態素であるかについて未解析の形態素があるか否かを判定する。
未解析の形態素があるとステップS14において判定した場合、ステップS15において、フレーズ抽出部44は、未解析の1つの形態素に注目し、品詞連結フレーズ解析処理を行う。品詞連結フレーズ解析処理の詳細については図10のフローチャートを参照して後述する。品詞連結フレーズ解析処理が全ての形態素に注目して行われることにより、フレーズ抽出部44が管理するバッファには表示データ生成部34に出力される所定の数の確定フレーズが格納される。
一方、未解析の形態素がないとステップS14において判定した場合、ステップS16において、フレーズ抽出部44は、バッファに格納している確定フレーズを表示データ生成部34に出力する。その後、図5のステップS2に戻り、それ以降の処理が行われる。
次に、図10のフローチャートを参照して、図6のステップS15において行われる品詞連結フレーズ解析処理について説明する。図10の処理が、出現順にそれぞれの形態素に注目して行われる。
ステップS31において、フレーズ抽出部44は、品詞連結パターンのインデックス値を例えば0に設定し、初期化する。後述する処理において、現在のインデックス値に該当する品詞連結パターンと品詞連結パターン別重みがフレーズ抽出部44により読み込まれる。
図11は、品詞連結パターンのインデックス値の例を示す図である。
パラメータ管理部43により設定されるパラメータに含まれる品詞連結パターンにはそれぞれインデックス値が設定されている。図11の例においては、品詞連結パターン1のインデックス値は「1」とされ、品詞連結パターン2のインデックス値は「2」とされている。他の品詞連結パターンにも同様にインデックス値が設定されている。
ステップS32において、フレーズ抽出部44は、品詞連結パターンのインデックス値を1だけインクリメントする。
ステップS33において、フレーズ抽出部44は、現在のインデックス値に該当する品詞連結パターンが存在するか否かを判定する。例えば、図11の品詞連結パターン1から、100のインデックス値が設定される品詞連結パターン100まで用意されている場合、現在のインデックス値が100以下である場合には現在のインデックス値に該当する品詞連結パターンが存在するとして判定され、100を超えた場合には現在のインデックス値に該当する品詞連結パターンが存在しないとして判定される。
現在のインデックス値に該当する品詞連結パターンが存在するとステップS33において判定した場合、ステップS34において、フレーズ抽出部44は、現在のインデックス値に該当する品詞連結パターンのパラメータ、すなわち、品詞連結パターンを指定する形態素の連結関係の情報と、品詞連結パターン別重みを読み込む。フレーズ抽出部44においては、インデックス値の小さいものから順に、品詞連結パターン毎に注目されてフレーズの解析が進められる。
図12は、品詞連結パターン別重みの例を示す図である。
図12の例においては、「Start=名詞−一般、Connect=*、End=名詞−一般」により指定される品詞連結パターンには「0.332」の品詞連結パターン別重みが設定されており、「Start=名詞−一般、Connect=*、End=名詞−形容動詞語幹」により指定される品詞連結パターンには「0.139」の品詞連結パターン別重みが設定されている。また、「Start=名詞−一般、Connect=助詞−連体化、End=名詞−一般」により指定される品詞連結パターンには「0.239」の品詞連結パターン別重みが設定されている。
例えば、現在のインデックス値に該当する品詞連結パターンが図12の一番上に示される品詞連結パターンである場合、「Start=名詞−一般、Connect=*、End=名詞−一般」の形態素の連結関係を表す情報と、「0.332」の品詞連結パターン別重みが読み込まれる。
ステップS35において、フレーズ抽出部44は、注目している形態素の品詞が文節区切り品詞であるか否かを判定する。
注目している形態素の品詞が、句点や読点などの文節区切り品詞であるとステップS35において判定した場合、フレーズ抽出部44は、それまでにバッファに格納しておいた形態素をクリアして、ステップS32以降の処理を繰り返し行う。すなわち、インデックス値が1だけインクリメントされ、それまで注目していた品詞連結パターンの次の品詞連結パターンが注目されて同様の解析が繰り返される。
一方、注目している形態素の品詞が文節区切り品詞ではないとステップS35において判定した場合、ステップS36において、フレーズ抽出部44は、注目している形態素の品詞が、現在のインデックス値に該当する品詞連結パターンによって指定される1フレーズの開始の形態素の品詞と同じ品詞であるか否かを判定する。
例えば、現在のインデックス値に該当する品詞連結パターンが「Start=名詞−一般、Connect=助詞−連体化、End=名詞−一般」により指定されるものである場合、注目している形態素が「名詞−一般」に分類される形態素であるときには、注目している形態素の品詞が、現在のインデックス値に該当する品詞連結パターンによって指定される1フレーズの開始の形態素の品詞と同じ品詞であるとして判定される。
注目している形態素の品詞が、現在のインデックス値に該当する品詞連結パターンによって指定される1フレーズの開始の形態素の品詞と同じ品詞であるとステップS36において判定した場合、ステップS37において、フレーズ抽出部44は品詞連結開始処理を実行する。品詞連結開始処理においては、注目している形態素が、新たな候補フレーズを構成する先頭の形態素としてバッファに格納される。
注目している形態素の品詞が、現在のインデックス値に該当する品詞連結パターンによって指定される1フレーズの開始の形態素の品詞と同じ品詞ではないとステップS36において判定された場合、ステップS37の処理はスキップされる。
ステップS38において、フレーズ抽出部44は、注目している形態素の品詞が、現在のインデックス値に該当する品詞連結パターンによって指定される1フレーズの継続の形態素の品詞と同じ品詞であるか否かを判定する。
例えば、現在のインデックス値に該当する品詞連結パターンが「Start=名詞−一般、Connect=助詞−連体化、End=名詞−一般」により指定されるものである場合、注目している形態素が「助詞−連体化」に分類される形態素であるときには、注目している形態素の品詞が、現在のインデックス値に該当する品詞連結パターンによって指定される1フレーズの継続の形態素の品詞と同じ品詞であるとして判定される。
注目している形態素の品詞が、現在のインデックス値に該当する品詞連結パターンによって指定される1フレーズの継続の形態素の品詞と同じ品詞であるとステップS38において判定した場合、ステップS39において、フレーズ抽出部44は品詞連結継続処理を実行する。品詞連結継続処理においては、注目している形態素が、品詞連結開始処理によってバッファに既に格納されている形態素に連結して格納される。
注目している形態素の品詞が、現在のインデックス値に該当する品詞連結パターンによって指定される1フレーズの継続の形態素の品詞と同じ品詞ではないとステップS38において判定された場合、ステップS39の処理はスキップされる。
ステップS40において、フレーズ抽出部44は、注目している形態素の品詞が、現在のインデックス値に該当する品詞連結パターンによって指定される1フレーズの終了の形態素の品詞と同じ品詞であるか否かを判定する。
例えば、現在のインデックス値に該当する品詞連結パターンが「Start=名詞−一般、Connect=助詞−連体化、End=名詞−一般」により指定されるものである場合、注目している形態素が「名詞−一般」に分類される形態素であるときには、注目している形態素の品詞が、現在のインデックス値に該当する品詞連結パターンによって指定される1フレーズの終了の形態素の品詞と同じ品詞であるとして判定される。
注目している形態素の品詞が、現在のインデックス値に該当する品詞連結パターンによって指定される1フレーズの終了の形態素の品詞と同じ品詞であるとステップS40において判定した場合、ステップS41において、フレーズ抽出部44は品詞連結終了処理を実行する。品詞連結終了処理においては、注目している形態素が、品詞連結継続処理においてバッファに既に格納されている形態素に連結して格納された上でバッファから一度抽出され、抽出された形態素の品詞連結パターンが、フレーズ禁止パターンによって除外されていないパターンである場合に限って、確定フレーズとしてバッファに格納される。
ステップS41において品詞連結終了処理が行われた場合、または、注目している形態素の品詞が、現在のインデックス値に該当する品詞連結パターンによって指定される1フレーズの終了の形態素の品詞と同じ品詞ではないとステップS40において判定された場合、ステップS32以降の処理が繰り返し行われる。
全ての品詞連結パターンについて解析を行ったことから、現在のインデックス値に該当する品詞連結パターンが存在しないとステップS33において判定された場合、図6のステップS15に戻り、それ以降の処理が繰り返される。すなわち、未解析の形態素が存在する場合、出現順で次の形態素が注目され、以上のような図10の処理が行われる。
全ての形態素に注目して図10の処理が行われたとき、バッファに格納されていた確定フレーズがフレーズ抽出部44から表示データ生成部34に出力される。
図13は、確定フレーズの例を示す図である。
図13の例においては、「アジア草野球本塁打記録」、「リーグ制覇」、「草野球本塁打記録」、「軍監督」、「知将対決」、「草野球界制覇」、・・・、「1997年以来」の確定フレーズが示されている。
例えば、「草野球界制覇」は、「名詞-一般」に分類される形態素である「草野球」と、「名詞-接尾-一般」に分類される形態素である「界」と、「名詞-サ変接続」に分類される形態素である「制覇」から構成される確定フレーズであり、このフレーズには、「Start=名詞-一般、Connect=名詞-接尾-一般、End=名詞-サ変接続」の品詞連結パターンに設定されている品詞連結パターン別重みと同じ「0.375」の重みが設定されている。他の確定フレーズについても、それを構成する形態素の連結関係に応じて同様に重みが設定されている。
このような重みが設定された確定フレーズを取得した表示データ生成部34においては、例えば、閾値以上の重みが設定されている確定フレーズだけが推薦理由として選択されたり、設定されている重みが大きいものから順に、所定の数の確定フレーズだけが推薦理由として選択されたりする。選択された推薦理由は、推薦コンテンツの情報とともに推薦画面に表示される。
図14は、以上の処理がコンテンツ推薦サーバ1において行われることによってユーザ端末2に表示される推薦画面の例を示す図である。
ユーザ端末2がPC(Personal Computer)や携帯電話機などのディスプレイが設けられる装置である場合、推薦画面は、コンテンツ推薦サーバ1から送信されてきた情報に基づいてそのディスプレイに表示される。一方、ユーザ端末2がハードディスクレコーダなどの、ディスプレイに接続される装置である場合、推薦画面は、コンテンツ推薦サーバ1から送信されてきた情報に基づいて、装置に接続されるディスプレイに表示される。
上述したようにして「草野球日本一決定戦」というタイトルのコンテンツが推薦コンテンツとして選択された場合、図14に示されるように、推薦画面には、「草野球日本一決定戦」の推薦コンテンツのタイトルが表示され、その下に、「亀有トータス×兎道ラビッツ」のサブタイトルが表示される。
サブタイトルの下には、「〜亀有ドーム解説・岩木真実山田太郎▽“亀旋風・最終ステージ”亀有、悲願の日本一成るか?最速男・ダルシムVS アジアの大砲・大三元、宿命の対決!(試合終了まで延長、以降の番組に繰り下げあるいは変更の場合あり)」の解説者の名前などが表示され、その下には、番組内容として、「江戸・亀有ドームで行われる〜注目したい。」が表示される。
「草野球日本一決定戦」は、コンテンツ推薦部32から表示データ生成部34に供給されたTitleの項目の文字列に基づいて表示されるものであり、「亀有トータス×兎道ラビッツ」は、コンテンツ推薦部32から表示データ生成部34に供給されたSubtitleの項目の文字列に基づいて表示されるものである。
「〜亀有ドーム解説・岩木真実山田太郎▽“亀旋風・最終ステージ”亀有、悲願の日本一成るか?最速男・ダルシムVS アジアの大砲・大三元、宿命の対決!(試合終了まで延長、以降の番組に繰り下げあるいは変更の場合あり)」は、コンテンツ推薦部32から表示データ生成部34に供給されたSummaryの項目の文字列に基づいて表示されるものであり、「江戸・亀有ドームで行われる〜注目したい。」は、コンテンツ推薦部32から表示データ生成部34に供給されたDetailの項目の文字列に基づいて表示されるものである。
番組内容の下には、「草野球日本一決定戦」のコンテンツの推薦理由として、左側の列に「アジア草野球本塁打記録」、「リーグ制覇」、「草野球本塁打記録」、・・・、「球界最速男」のフレーズが表示され、右側の列に「最終ステージ」、「最速男」、「亀有トータス」、・・・、「悲願の日本一」のフレーズが表示されている。
この推薦理由は、推薦理由生成部33から表示データ生成部34に供給された確定フレーズに基づいて表示されるものである。
推薦コンテンツがユーザの嗜好を考慮して選択されたものである場合、その推薦コンテンツに関するテキスト文書から選択された特徴的な表現や言い回しのフレーズはユーザの嗜好に関係のあるフレーズといえることから、そのようなフレーズは推薦理由として用いることが可能である。
なお、図14の例においては、推薦理由として表示されているフレーズの中に、大きな文字で表示されているものと小さな文字で表示されているものがあるが、これはフレーズの重みの違いによるものである。設定されている重みが大きいフレーズほど、重要なフレーズとしてユーザの目に付きやすいように大きく表示される。
以上のように、コンテンツ推薦サーバ1においてはフレーズを抽出することができる。また、抽出したフレーズを推薦理由として付与してコンテンツの推薦を行うことができるため、システムに対するユーザの受容度が増すと共に、より多くのコンテンツに興味を持つきっかけをユーザに対して与えることができる。
さらに、品詞の連結関係を元にしてテキスト文書の解析が行われ、フレーズが抽出されるため、自然言語処理によってフレーズの抽出が行われる場合に較べて、時間的なコスト、およびシステム的なコストを抑えることが可能となり、マシンスペックの劣るPCやCE(Consumer Electronics)機器上にフレーズ抽出の機能を実装することができる。
ここで、推薦理由のフレーズを確認したユーザによる評価に応じた重みの最適化について説明する。例えば、推薦理由のフレーズを確認したユーザは、形態素の区切りの適切さと、推薦理由としての適切さなどをそれぞれのフレーズに対して評価することができる。
ユーザの評価は、フレーズの重み、すなわち、そのフレーズの品詞連結パターンの重みに反映され、積極的な評価がされたフレーズの品詞連結パターンに対してはより大きな品詞連結パターン別重みが設定され、反対に、消極的な評価がされたフレーズの品詞連結パターンに対してはより小さな品詞連結パターン別重みが設定される。ユーザの評価が反映された後、より大きな重みが設定された品詞連結パターンのフレーズは推薦理由として選択されやすくなり、より小さな重みが設定された品詞連結パターンのフレーズは推薦理由として選択されにくくなる。
図15は、フレーズの評価画面の例を示す図である。
推薦画面が表示されている状態で所定の操作がユーザにより行われたとき、ユーザ端末2においては図15に示されるような評価画面が表示される。
図15の評価画面においては、それぞれの行に番号が設定されており、それぞれの列にアルファベットが設定されている。アルファベットFの列の番号1886以降の行のそれぞれの欄には、推薦理由として用いられたフレーズが表示されており、それぞれのフレーズに対して、右側の欄に、区切りが妥当である場合には1などの所定の評価値を、推薦理由として妥当である場合には1などの所定の評価値をそれぞれ入力してフレーズの評価を行うことができるようになされている。
図15に示されるような評価画面を用いて入力されたユーザの評価は、コンテンツ推薦サーバ1に対してユーザ端末2から送信され、フレーズの重みの最適化に用いられる。
コンテンツ推薦サーバ1においては、多数のテキスト文書から抽出されたフレーズに対する多数のユーザによる評価を集計することによって、フレーズの重みを統計的尺度によって算出することが可能になる。例えば、情報抽出の分野で用いられる適合率、再現率、F値を使って、以下のようにして重みが決定される。
あるフレーズの適合率(品詞連結パターンの適合率)は次のようにして求められる。
ある品詞連結パターンの適合率=(その品詞連結パターンで抽出されたフレーズが妥当であると評価された回数)/(その品詞連結パターンで抽出されたフレーズの総数)
あるフレーズの再現率(品詞連結パターンの再現率R)は次のようにして求められる。
ある品詞連結パターンの再現率=(その品詞連結パターンで抽出されたフレーズが妥当であると評価された回数)/(テキスト文書全体で妥当であると評価されたフレーズの総数)
あるフレーズのF値(品詞連結パターンのF値)は次のようにして求められる。
ある品詞連結パターンのF値=適合率と再現率の調和平均
調和平均は、適合率をP、再現率をRとすると2PB/(P+R)によって求められる。
このような尺度を用いることにより、フレーズの重みを動的に更新することが可能になる。更新されたフレーズの重み(品詞連結パターン別重み)はパラメータ管理部43により管理される。
また、多数のユーザからの評価を用いて更新するのではなく、それぞれのユーザからの評価を用いて更新することにより、ユーザ毎に、推薦理由として表示されやすくなるフレーズの品詞連結パターンをカスタマイズすることが可能になる。
なお、コンテンツのカテゴリに応じてフレーズの重みの設定を精緻化することも可能である。
また、ユーザによる評価は、図15に示されるような評価画面を用いて行われるのではなく、図14に示されるような推薦画面において、ユーザが気に入ったフレーズをクリックすることに応じて内部的に行われるようにすることも可能である。
以上においては、テレビジョン番組を推薦する場合について説明したが、音楽コンテンツや静止画コンテンツなどの他のコンテンツを推薦する場合にも上述した処理を適用することができる。
また、抽出されたフレーズから、そのフレーズに関連する全く別のコンテンツの推薦ができるようにしてもよい。
以上においては、推薦コンテンツの選択や推薦理由のフレーズの抽出がコンテンツ推薦サーバ1によって実現されるものとしたが、ユーザ端末2などの、ユーザにより用いられる端末によって実現されるようにしてもよい。この場合、推薦理由となるフレーズの抽出は、インターネット3上の所定のサーバからダウンロードされた、推薦コンテンツに関するテキスト文書を対象として行われる。
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な汎用のパーソナルコンピュータなどにインストールされる。
インストールされるプログラムは、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等)や半導体メモリなどよりなる図2に示されるリムーバブルメディア21に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。プログラムは、ROM12や記憶部18に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
本発明の一実施形態に係るコンテンツ推薦システムの構成例を示す図である。 コンテンツ推薦サーバのハードウエア構成例を示すブロック図である。 コンテンツ推薦サーバの機能構成例を示すブロック図である。 図3の推薦理由生成部の構成例を示すブロック図である。 コンテンツ推薦サーバのコンテンツ推薦処理について説明するフローチャートである。 図5のステップS2において行われるテキスト文書解析処理について説明するフローチャートである。 テキスト文書の例を示す図である。 形態素解析の結果を示す図である。 形態素解析の結果を示す図8に続く図である。 図6のステップS15において行われる品詞連結フレーズ解析処理について説明するフローチャートである。 品詞連結パターンのインデックス値の例を示す図である。 品詞連結パターン別重みの例を示す図である。 確定フレーズの例を示す図である。 推薦画面の表示例を示す図である。 評価画面の表示例を示す図である。
符号の説明
1 コンテンツ推薦サーバ, 2 ユーザ端末, 3 インターネット, 31 コンテンツ情報記憶部, 32 コンテンツ推薦部, 33 推薦理由生成部, 34 表示データ生成部, 41 テキスト文書取得部, 42 形態素解析部, 43 パラメータ管理部, 44 フレーズ抽出部

Claims (7)

  1. テキスト文書を対象として形態素解析を行う形態素解析手段と、
    所定の品詞の形態素の連結関係を表す連結パターンを管理する管理手段と、
    前記形態素解析手段により形態素解析が行われることによって得られた形態素の列から、前記管理手段により管理されている前記連結パターンにより表される連結関係と同じ連結関係を有する複数の形態素からなるフレーズを抽出する抽出手段と
    を備える情報処理装置。
  2. 前記管理手段は、さらに、前記連結パターン毎に重みを管理し、
    前記抽出手段は、抽出したフレーズに対して、そのフレーズを構成する形態素の連結関係を表す前記連結パターンに応じた重みを設定する
    請求項1に記載の情報処理装置。
  3. ユーザに推薦するコンテンツを選択する推薦手段と、
    前記推薦手段により選択されたコンテンツの情報を、前記ユーザにより用いられている情報処理端末に表示させる表示制御手段と
    をさらに備え、
    前記形態素解析手段は、前記推薦手段により選択されたコンテンツに関するテキスト文書を対象として形態素解析を行い、
    前記抽出手段は、前記推薦手段により選択されたコンテンツに関するテキスト文書を対象として前記形態素解析手段により形態素解析が行われることによって得られた形態素の列からフレーズを抽出し、
    前記表示制御手段は、さらに、前記抽出手段により抽出されたフレーズをコンテンツの推薦理由として表示させる
    請求項2に記載の情報処理装置。
  4. 前記表示制御手段は、コンテンツの推薦理由として表示させるフレーズを、それぞれのフレーズに対して前記抽出手段により設定されている重みに基づいて選択する
    請求項3に記載の情報処理装置。
  5. 前記管理手段は、前記表示制御手段によりコンテンツの推薦理由として表示されたフレーズを確認したユーザによる評価に応じて、前記連結パターン毎の重みを更新して管理する
    請求項3に記載の情報処理装置。
  6. テキスト文書を対象として形態素解析を行い、
    所定の品詞の形態素の連結関係を表す連結パターンを管理し、
    形態素解析を行うことによって得られた形態素の列から、管理している前記連結パターンにより表される連結関係と同じ連結関係を有する複数の形態素からなるフレーズを抽出する
    ステップを含む情報処理方法。
  7. テキスト文書を対象として形態素解析を行い、
    所定の品詞の形態素の連結関係を表す連結パターンを管理し、
    形態素解析を行うことによって得られた形態素の列から、管理している前記連結パターンにより表される連結関係と同じ連結関係を有する複数の形態素からなるフレーズを抽出する
    ステップを含む処理をコンピュータに実行させるプログラム。
JP2007230622A 2007-09-05 2007-09-05 情報処理装置、情報処理方法、およびプログラム Pending JP2009064187A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007230622A JP2009064187A (ja) 2007-09-05 2007-09-05 情報処理装置、情報処理方法、およびプログラム
US12/203,461 US8332208B2 (en) 2007-09-05 2008-09-03 Information processing apparatus, information processing method, and program
CNA200810147584XA CN101382946A (zh) 2007-09-05 2008-09-03 信息处理设备、信息处理方法和程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007230622A JP2009064187A (ja) 2007-09-05 2007-09-05 情報処理装置、情報処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2009064187A true JP2009064187A (ja) 2009-03-26
JP2009064187A5 JP2009064187A5 (ja) 2009-05-07

Family

ID=40408830

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007230622A Pending JP2009064187A (ja) 2007-09-05 2007-09-05 情報処理装置、情報処理方法、およびプログラム

Country Status (3)

Country Link
US (1) US8332208B2 (ja)
JP (1) JP2009064187A (ja)
CN (1) CN101382946A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013171462A (ja) * 2012-02-21 2013-09-02 Nippon Hoso Kyokai <Nhk> フレーズ検出装置およびそのプログラム
JP2015179441A (ja) * 2014-03-19 2015-10-08 株式会社東芝 情報提示装置、情報提示方法およびプログラム
WO2016181475A1 (ja) * 2015-05-11 2016-11-17 株式会社東芝 情報提示装置、情報提示方法およびプログラム

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010067175A (ja) * 2008-09-12 2010-03-25 Toshiba Corp ハイブリッド型コンテンツ推薦サーバ、推薦システムおよび推薦方法
KR20110006004A (ko) * 2009-07-13 2011-01-20 삼성전자주식회사 결합인식단위 최적화 장치 및 그 방법
EP2488963A1 (en) * 2009-10-15 2012-08-22 Rogers Communications Inc. System and method for phrase identification
US8401709B2 (en) * 2009-11-03 2013-03-19 Spirae, Inc. Dynamic distributed power grid control system
CN101882128A (zh) * 2010-06-11 2010-11-10 宇龙计算机通信科技(深圳)有限公司 一种信息常用语生成方法及移动终端
EP2599183B1 (en) 2010-07-29 2016-11-30 Spirae Inc. Dynamic distributed power grid control system
JP5639417B2 (ja) * 2010-08-31 2014-12-10 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
US9230014B1 (en) * 2011-09-13 2016-01-05 Sri International Method and apparatus for recommending work artifacts based on collaboration events
CN104216885B (zh) * 2013-05-29 2022-07-26 上海连尚网络科技有限公司 静态和动态推荐理由自动结合的推荐系统及方法
US10949909B2 (en) * 2017-02-24 2021-03-16 Sap Se Optimized recommendation engine
DK201770428A1 (en) * 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1125092A (ja) 1997-07-09 1999-01-29 Just Syst Corp 文書管理支援装置およびその装置としてコンピュータを機能させるためのコンピュータ読み取り可能な記録媒体
JP3937118B2 (ja) 1999-03-02 2007-06-27 富士ゼロックス株式会社 要約作成装置及び要約作成方法
JP3882414B2 (ja) 1999-09-01 2007-02-14 富士ゼロックス株式会社 文書要約装置、文書要約方法及び記録媒体
JP2003248676A (ja) 2002-02-22 2003-09-05 Communication Research Laboratory 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法
JP2003256449A (ja) 2002-03-05 2003-09-12 Ricoh Co Ltd 重要情報抽出システムおよび重要情報抽出方法
JP2005135113A (ja) 2003-10-29 2005-05-26 Sony Corp 電子機器装置、関連語抽出方法及びプログラム
JP2006209173A (ja) 2005-01-25 2006-08-10 Advanced Telecommunication Research Institute International 係り受け構造解析装置及びコンピュータプログラム
WO2006107032A1 (ja) 2005-04-01 2006-10-12 Sony Corporation 情報処理システムおよび方法、並びにプログラム
JP4654780B2 (ja) 2005-06-10 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
JP2007128401A (ja) 2005-11-07 2007-05-24 Fuji Xerox Co Ltd 文書要約装置および方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013171462A (ja) * 2012-02-21 2013-09-02 Nippon Hoso Kyokai <Nhk> フレーズ検出装置およびそのプログラム
JP2015179441A (ja) * 2014-03-19 2015-10-08 株式会社東芝 情報提示装置、情報提示方法およびプログラム
WO2016181475A1 (ja) * 2015-05-11 2016-11-17 株式会社東芝 情報提示装置、情報提示方法およびプログラム

Also Published As

Publication number Publication date
CN101382946A (zh) 2009-03-11
US8332208B2 (en) 2012-12-11
US20090063132A1 (en) 2009-03-05

Similar Documents

Publication Publication Date Title
JP2009064187A (ja) 情報処理装置、情報処理方法、およびプログラム
JP6515624B2 (ja) 講義ビデオのトピックスを特定する方法及び非一時的なコンピュータ可読媒体
US9569541B2 (en) Evaluating preferences of content on a webpage
JP5647508B2 (ja) ショートテキスト通信のトピックを識別するためのシステムおよび方法
TWI472720B (zh) 興趣點資訊地圖呈現系統、方法及其記錄媒體
US20120323905A1 (en) Ranking data utilizing attributes associated with semantic sub-keys
US20090313572A1 (en) Phrase builder
JP2008217333A (ja) 検索支援装置、プログラム及び検索支援システム
CN103092923A (zh) 搜索引擎的基于菜单的登广告
CN104102720A (zh) 高效输入的预测方法和装置
US10783192B1 (en) System, method, and user interface for a search engine based on multi-document summarization
JP5768492B2 (ja) 情報処理装置、情報処理方法、およびプログラム
WO2020026366A1 (ja) 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム
US20120317141A1 (en) System and method for ordering of semantic sub-keys
JP5302614B2 (ja) 施設関連情報の検索データベース形成方法および施設関連情報検索システム
US9875298B2 (en) Automatic generation of a search query
JP5012083B2 (ja) 学習支援装置及び学習支援プログラム
JP2012141681A (ja) クエリセグメント位置決定装置
US20120317103A1 (en) Ranking data utilizing multiple semantic keys in a search query
JP5332128B2 (ja) 情報検索装置、情報検索方法およびそのプログラム
JP5877775B2 (ja) コンテンツ管理装置、コンテンツ管理システム、コンテンツ管理方法、プログラム、及び記憶媒体
KR101421819B1 (ko) 온라인 환경에서의 벌룬을 이용한 키워드 검색 결과 제공 방법
JP7084003B1 (ja) 英作文添削結果分析システム
JP5727970B2 (ja) 感覚推定装置、感覚推定方法及び感覚推定プログラム
JP6911983B2 (ja) 情報処理装置、プログラム及び情報処理方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090116

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090414

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090610

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090707