JP2005301584A - 要約記事配信サーバ及び要約記事配信方法及び要約記事配信プログラム - Google Patents

要約記事配信サーバ及び要約記事配信方法及び要約記事配信プログラム Download PDF

Info

Publication number
JP2005301584A
JP2005301584A JP2004115632A JP2004115632A JP2005301584A JP 2005301584 A JP2005301584 A JP 2005301584A JP 2004115632 A JP2004115632 A JP 2004115632A JP 2004115632 A JP2004115632 A JP 2004115632A JP 2005301584 A JP2005301584 A JP 2005301584A
Authority
JP
Japan
Prior art keywords
article
weight
user
target
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004115632A
Other languages
English (en)
Inventor
Tomoya Fujino
友也 藤野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2004115632A priority Critical patent/JP2005301584A/ja
Publication of JP2005301584A publication Critical patent/JP2005301584A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 要約記事の配信を利用する利用者が、自らの嗜好を登録する必要なく、利用者の嗜好に適合する記事を選択し、選択した記事について利用者の嗜好に適合する要約を作成する。
【解決手段】 サーバ100において、利用者履歴格納部5は利用者が過去に選択した記事を構成する記事構成要素の出現頻度情報を格納する。記事選択部62は記事格納部7から複数の記事を取得し、取得した記事を構成する記事構成要素を利用者嗜好計算部61に通知する。利用者嗜好計算部61は通知された記事構成要素について利用者履歴格納部5の出現頻度情報を用いて記事構成要素の重みを算定し、この重みを要約作成部8、記事選択部62へ出力する。記事選択部62は入力した記事構成要素の重みに基づき記事を選択して要約作成部8に出力する。要約作成部8は、記事選択部62の出力した記事について記事構成要素の重みを用いて要約を作成する。
【選択図】 図1

Description

本発明は、記事の要約の配信を利用する利用者の端末に、記事の要約を配信する要約記事配信サーバ、要約記事配信方法、要約記事配信プログラムに関する。例えば、利用者の嗜好に適合した記事を選択し、選択した記事について利用者の嗜好に適合した要約を作成して配信する要約記事配信サーバに関する。
従来の情報提供システムは、利用者が過去に閲覧した記事のジャンルの傾向をもとに、同じ閲覧傾向を持つ他の利用者がよく閲覧するジャンルの記事を、優先して推薦するということを行っていた(例えば、特許文献1)。従来の情報提供システムの動作の流れは、以下の通りである。最初に、利用者乙は端末よりネットワークを介して、利用者IDで個人認証を行いサーバに接続する。サーバでは、利用者乙の利用者IDを元に過去の情報閲覧履歴を取得し、ジャンルに関する利用者間の類似度を計算する。その結果、利用者乙と類似度の強い利用者が嗜好するジャンルを求め、そのジャンルに属する情報の中から、登録日時が新しいものを選択する。
また、従来の要約文提供システムでは、ユーザが要約率を指定し、その指定に応じた要約を作成し提供する技術も提案されている(例えば、特許文献2)。この技術の流れは、以下の通りである。入力に応じて、電子文書の要約を表示する表示部の表示領域の全表示領域内における大きさを設定し、対象となる上記電子文書の全表示領域内における大きさを設定し、設定された表示領域の大きさに基づいて要約の長さを決定し、表示領域内に収まるよう上記電子文書の要約を作成し、表示部の領域に表示させるように制御する。
本発明は、利用者の記事の選択履歴を元に、記事の各構成要素の重要度を算出し、その重要度にしたがって記事の要約文を作成するというものである。単純に従来の情報提供システムと従来の要約文提供システムを組み合わせて上記の発明と同じ機能を実現しようとした場合、次のような問題が生じる。
(1)記事提供システムは利用者の嗜好を内部で計算しているにもかかわらず、表に現れる情報としては記事の優先順位のみで、出力から利用者の嗜好情報を取得することができない。したがって、その情報のみを受け取った要約文提供システムは、利用者の嗜好を反映させることができず、画一的な要約を提供せざるを得ない。
(2)また、個々の技術を見てみると、従来の情報提供システムでは、利用者の嗜好を判別する単位は主に記事のジャンルであり、したがって従来手法では記事作成者は作成した記事のジャンルを設定する作業が必要であった。また、ジャンルというカテゴリに記事をまとめてしまうことで、その記事が持つ特性に関する情報量が減少するため、推薦の精度は低いものとなる。
(3)また、従来の要約文提供システムにおいては、各単語の重要度は事前に何らかの形式で保持しておく必要があったため、各利用者に応じて別の重要度を割り当てるためには、事前に利用者毎に重要度情報を算出し、入力し、保持しておかなければならなかった。そのため、重要度設定の負担が大きいという問題点があった。
利用者をカテゴリ分けし、それに応じた重要度を用意する手法も存在するが、その際利用者はカテゴリ分けのための情報を明示的に提供する必要があり、また個々の利用者の嗜好に応じているとは言いがたい。
特開2000−112972号公報 特開平11−345233号公報
この発明は、上記のような問題点を解決するためになされたものである。要約文の記事選択の傾向から、傾向の良く似た他の利用者の重要度情報を参考にしてシステムが自動的に重要度を決定することにより、各利用者の嗜好を色濃く反映しつつ、利用者が意識することなく要約の際の重要度を各個人に向け個別に設定することを目的とする。
本発明は、従来技術の単純な結合では実現に煩雑な処理が必要になる各利用者向け要約記事配信システムを、利用者が意識することなく利用者の嗜好解釈を自動的に形成することで、ストレス無く記事を配信するとともに、過剰に短文を強いられる要約文において、利用者が頻繁に利用する単語を使用することにより、短い文章においても早い解釈と深い理解を実現することを目的とする。
この発明の要約記事配信サーバは、
記事の要約の配信を利用する利用者の端末からの要求に応答して、記事の要約を作成して利用者へ配信する要約記事配信サーバにおいて、
過去に利用者へ配信した要約の作成の対象である記事を構成する複数の記事構成要素のそれぞれについて、記事構成要素が記事に出現する出現頻度を示す出現頻度情報を格納する出現頻度情報格納部と、
利用者に配信する要約の作成の対象となる対象記事を格納する記事格納部と、
記事格納部の格納する対象記事を取得し、取得した対象記事を構成する複数の記事構成要素のそれぞれに対して出現頻度情報格納部の格納する出現頻度情報に基づいてそれぞれの記事構成要素の重みを算定し、算定したそれぞれの記事構成要素の重みと取得した対象記事とを出力する取得算定部と、
取得算定部の出力したそれぞれの記事構成要素の重みと対象記事とを入力し、入力したそれぞれの記事構成要素の重みを用いて、入力した対象記事の要約を作成する要約作成部と、
要約作成部の作成した要約を配信する配信部と
を備えたことを特徴とする。
本発明によって、利用者が明示的に自らの嗜好を登録する作業を必要とせず、利用者の嗜好に適合する記事の選択し、および選択した記事について利用者の嗜好に適合する要約を作成することができる。
実施の形態1.
図1は、実施の形態1に係る要約記事配信システム1000の構成を示す図である。要約記事配信システム1000は、複数の端末1a、1b,1cがネットワーク2を介してサーバ100と接続される。なお、端末は端末1a、1b,1cの3台を示しているが、説明のためであり、端末の数は限定しない。
実施の形態1は、記事の要約(以下、要約を要約記事ともいう)を自動選択する場合の実施形態である。ここで、要約の「自動選択」とは、利用者甲、乙等が記事のジャンルを指定する必要なく、記事の要約を取得できるシステムをいう。例えば、利用者乙は、単に記事の「要約の配信」をサーバ100に要求するだけである。乙から要約の配信要求を受信したサーバ100は、利用者乙の嗜好に合致する記事を選択し、その選択した記事の要約を作成して利用者乙の端末1bに送信する。
次に、図1に示す端末について説明する。複数の端末1a、1b,1cは、パーソナルコンピュータ、または、その他の演算処理装置である。端末1a、1b,1cのそれぞれは、ネットワーク2を介して通信部31と通信を行う端末側通信手段(図示していない)と、サーバの認証部32と共同で端末1a、1b,1c等の利用者である甲、乙、丙の個人認証を行う手段(図示していない)と、ディスプレイやプリンタなどによる出力手段(図示していない)を持つ。
ネットワーク2は、LAN(Local Area Network)などの情報伝達網である。
次に、サーバ100について説明する。サーバ100は、制御部3、利用者情報格納部4、利用者履歴格納部5、取得算定部6、記事格納部7、要約作成部8とを備える。また、制御部3は、通信部31(配信部の一例)、認証部32とを備える。取得算定部6は、利用者嗜好計算部61、記事選択部62とを備える。
制御部3は、例えば、大規模演算処理装置である。制御部3は、前記のように、ネットワーク2を介する通信手段を提供する通信部31と、利用者情報格納部4のデータを元に、通信相手の端末利用者の個人認証を、パスワード認証や指紋・声紋識別、あるいは、それに類する個人識別手段を用いて行う認証部32を有する。制御部3は、サーバ100全体の制御を行う。
利用者情報格納部4は、制御部3の通信先の利用者を特定し個人認証を行う。図2は、利用者情報格納部4の格納する利用者情報の一例である。利用者甲、乙等の利用者情報は、このような形式で記録格納および更新される。
利用者履歴格納部5(出現頻度情報格納部の一例)は、認証された利用者が過去に選択した記事に出現する、単語や複合語などの「記事構成要素」の出現頻度を出現頻度情報として記録格納および更新を行う。図3は、記事を構成する「記事構成要素」の出現頻度情報を示す図である。図3において、「健康」、「くじ」、「走る」、「東京」、「海」等が記事を構成する記事構成要素である。また、利用者ID1の者について、1、0、2,5等の数字が記事構成要素の出現頻度情報を示している。例えば、利用者ID3を利用者乙とすれば、図3から、利用者乙は「健康」、「走る」を嗜好することがわかる。
取得算定部6は、利用者嗜好計算部61と記事選択部62により構成される。利用者嗜好計算部61(算定部の一例)は、上記端末利用者に対する記事構成要素の閲覧頻度(出現頻度情報)の傾向と似た傾向を持つ他の利用者の記事構成要素の閲覧頻度(出現頻度情報)を利用者履歴格納部5より参照する。そして、記事選択部62から提供される複数の記事本文のそれぞれを構成する記事構成要素について、「記事構成要素の重み」(第1の重み)を算定する。そして、算定した「記事構成要素の重み」を記事選択部62へ提供する。なお、記事選択部62は、「記事構成要素の重み」を用いて、それぞれの記事について「記事の重み」(第2の重み)を算定する。記事選択部62は後述する。ここで、「重み」は、「重要度」、あるいは「嗜好度」という場合がある。「重み」は、数値演算上の概念を想定し、「重要度」は、利用者から「重み」をみた場合を想定し、「嗜好度」はシステムから「重み」をみた場合を想定している。
記事格納部7は、新聞社などの情報提供機関から提供された情報(記事)、または任意の情報取得手段によって得た情報(記事)を記録格納および更新を行う。図4は、記事格納部7の格納する情報(記事)の格納形式の一例を示している。
記事選択部62(取得部の一例)は、記事格納部7より新規の記事を取得し、利用者嗜好計算部61より提供された、利用者の「記事構成要素の重み」を用いて、取得した記事のそれぞれについての「記事の重み」(第2の重み)を算定する。また、取得した記事を要約作成部8に提供する。
要約作成部8は、記事選択部62より提供された記事全文に対し、利用者嗜好計算部61から提供された、利用者の「記事構成要素の重み」(記事選択部62に提供されたものと同じ)を元に、要約の作成を行い、通信部31を介して上記端末利用者へ要約記事を提供する。
次に動作について説明する。図5は、動作を示すフローチャートである。また、図6は、図5におけるS(ステップ)50の詳細を示すフローチャートである。これらを参照して、要約記事の自動選択の場合を説明する。利用者乙が取得する場合を想定する。
この自動選択により、利用者乙は記事選択の際の作業を省くことができ、簡便に自らの好む要約記事を取得することができる。利用者乙は、例えば、端末1bのディスプレイに表示された「要約の自動選択」というボタンをマウスでクリックすることにより「要約の自動選択」というモードを指定するだけで、特に記事のジャンルなどの指定をすることなく、「乙の嗜好に合った記事」の要約がサーバ100から配信されてくる。モードには「要約の自動選択」の他に「要約の逐一選択」がある。「要約の逐一選択」は実施の形態2で述べる。
図5のS10、S20において、まず端末1bを用いて利用者乙がネットワーク2を通して接続を行う。
S30において、制御部3は、通信部31により利用者乙(端末1b)の接続を検出すると、利用者情報格納部4に照会する。そして、制御部3は、認証部32を用いて利用者乙の個人認証を行う。利用者乙の認証が得られない場合は、制御部3は、端末1bにエラーコードを送信する(S40)。個人認証の結果、乙が正規の利用者と認められた場合には、次の過程(S50以降)を経る。
S50において、利用者嗜好計算部61は、「記事構成要素の重み」を算定する。このS50の過程について、図6を参照して説明する。先ず、S51において、記事選択部62は、記事格納部7から、複数の新規な記事全部を取得する。次に、S52において、記事選択部62は、記事格納部7から取得した複数の記事のそれぞれに登場する記事構成要素を利用者嗜計算部61に通知する。S53において、利用者嗜計算部61は、通知を受けた記事構成要素のそれぞれについて、「記事構成要素の重み」の算定を開始する。算定した「記事構成要素の重み」は記事選択部62、要約作成部8へ出力する。
「記事構成要素の重み」の算定については、利用者履歴格納部5の格納する出現頻度情報を用いる。利用者嗜好計算部61は、利用者乙の出現頻度情報から利用者乙が過去に選択した記事に登場する「記事構成要素の出現頻度」の傾向を確認する。そして、この傾向に基づいて、利用者嗜好計算部61は、「協調フィルタリング」を行って、記事選択部62から通知された記事構成要素についての「記事構成要素の重み」を算定する。「協調フィルタリング」とは、「記事構成要素の出現頻度」の傾向が利用者乙と似た傾向を持つ他の利用者についての「記事構成要素の出現頻度」を元に、利用者乙がいまだ取得していない記事構成要素に対して、似た傾向を持つ他の利用者がどれほどの頻度で取得したかを、傾向の類似度を考慮して算出する手法である。
手法自体は公知であるので、以下簡単に説明する。利用者乙が取得していない記事構成要素であっても、傾向の似た人が使っていれば、それを利用者乙の記事構成要素として使う。例えば、出現頻度情報において、記事構成要素[宇宙]が54回、[政治]が2回、[技術]が32回という利用者乙が[環境]にどれほど興味を持つかを判定する場合を想定する。ここで、例えば出現頻度情報において、[宇宙]が約50回、[政治]が数回、[技術]が約30回である他の利用者の大半は、[環境]の頻度が30回前後であるとする。この場合、利用者乙の[環境]の頻度も30回程度であろうと推測できる。これにより、利用者乙の出現頻度情報に[環境]が存在しない場合に、利用者乙の[環境]の頻度も30回程度と推測する。このように協調フィルタリングを用いて、未だ取得していない記事構成要素に対して、潜在的需要の推測を行うことができる。すでに頻度を取得しているが協調フィルタリングの結果よりも頻度の少ない記事構成要素については、協調フィルタリングの推定値を用いる。例えば、利用者乙の出現頻度情報において前記の[環境]の頻度数が2回程度の場合は、協調フィルタリングによる30回を用いる。一方利用者乙の出現頻度情報において[環境]の頻度数30回を超える場合は、その頻度を用いる。従って、記事選択部62から通知を受けた記事構成要素のうち、利用者履歴格納部5の格納する利用者乙の出現頻度情報に、通知を受けた記事構成要素が存在するかどうかで次のように分かれる。
(1)出現頻度情報に記事構成要素が存在しない場合(頻度がゼロの場合)は、協調フィルタリングで推定した頻度を「記事構成要素の重み」として用いる。(2)存在する場合は、協調フィルタリングで推定した頻度と、出現頻度情報に示されている実際の頻度のうち、大きいほうの頻度を、その「記事構成要素の重み」として用いる。
利用者嗜好計算部61は、それぞれの記事構成要素について算定した「記事構成要素の重み」を記事選択部62、及び、要約作成部8に出力する。
S90において、記事選択部62は、利用者嗜好計算部61から提供された「記事構成要素の重み」(第1の重み)を用いて、複数の記事のそれぞれについて「記事の重み」(第2の重み)を算定する。なお算定方法については、実施の形態2の最後の部分で説明する。記事選択部62は、複数の記事本文のうち、ある設定された閾値以上の「記事の重み」を持つ記事本文のみを要約作成部8へ出力する。これにより利用者の嗜好に適合した記事本文を自動選択することが可能となる。また、要約作成部8への記事本文の出力の際には、当該記事の「記事の重み」も出力する。後述のように「記事の重み」は要約作成部8が要約率を決定する場合に用いる。
S150において、要約作成部8は、記事選択部62から得た所定の閾値以上の「記事の重み」を有する複数の記事本文に対して、利用者嗜好計算部61から提供された「記事構成要素の重み」を用いて、それぞれの記事の要約を作成する。要約の作成においては、「記事構成要素の重み」が小さい記事構成要素ほど削除するようにして要約を作成する。これにより、利用者乙の嗜好に適合した要約を作成することができる。要約を作成する場合には、記事選択部62が提供した「記事の重み」に応じて、要約率を変更しても良い。「要約率」とは、要約を作成する対象となる記事本文の文章の長さと、この記事について作成しようとしている要約の文章の長さとの比を示す。要約率が「小さい」場合は、要約の文章が長く、要約率が「大きい」場合は、要約の文章が短い。すなわち、「記事の重み」が大きい記事は、利用者の嗜好により合致している重要な記事と考えられる。このため、「記事の重み」が大きい場合は、要約率を小さくし、要約を詳しく(文章を長く)する。要約作成部8は、得られた要約記事を、制御部3へ提供(出力)する。
S170において、端末1bは、制御部3の通信部31より提供(S160)された要約記事を受け取り、任意の出力手段を用いて出力を行う。以上で自動選択の動作が終了する。
実施の形態1のサーバは、利用者履歴格納部、取得算定部、要約作成部を備えたので、利用者の嗜好に適合した要約を作成することができる。
実施の形態1のサーバは、取得算定部が他の利用者の出現頻度情報を用いて「記事構成要素の重み」を算定するので、より利用者の嗜好に適合した要約を作成することができる。
実施の形態1のサーバは、記事選択部が「記事の重み」を算定するので、利用者の嗜好に適合した記事を選択することができる。
実施の形態1のサーバは、要約作成部が「記事の重み」に基づいて要約率を決定するので、利用者にとってより重要な記事の要約ほど詳しく作成するので、利用者にとって利用性を向上することができる。
実施の形態1の要約記事配信システムは、記事の要約を配信するサーバと、記事の要約を表示する端末がネットワークを介して接続している記事配信システムにおいて、上記端末は、サーバの通信部と通信する端末側通信手段と、サーバの認証部と通信を行うことにより個人認証を得る個人認証取得手段と、受け取った記事情報を出力する出力手段とを少なくとも有し、上記サーバは、他の端末との通信を行う通信部と、端末からの通信により利用者情報格納部の情報を元に個人認証を行う認証部と、通信部と認証部とを備えサーバの各構成要素の制御を行う制御部と、利用者の個人認証に必要な情報を格納する利用者情報格納部と、利用者のこれまでの選択記事の記事構成要素の出現頻度を格納した利用者履歴格納部と、利用者履歴格納部に格納された利用履歴のうち、傾向の似た他の利用者の利用履歴を用いて、上記利用者の記事構成要素に対する嗜好度(記事構成要素の重み)を算定する利用者嗜好計算部と、記事情報を格納する記事格納部と、記事格納部から新規な記事を取得して、利用者嗜好計算部が算出した記事構成要素の嗜好度を用いて、取得した記事のうち上記利用者の嗜好に合った記事を選択する記事選択部と、前記記事選択部が選択した記事に対して、利用者嗜好計算部が算定した嗜好度を用いて要約を作成する要約作成部とを少なくとも有することを特徴とする。
これにより、上記利用者が意識することなく利用者の嗜好を自動的に算出し、上記利用者の嗜好に適合した記事を選択し、および嗜好に適合した要約を作成して、利用者に提供することができる。
実施の形態1のサーバは、記事選択部が算出した各記事に対する嗜好度(記事の重み)に応じ、要約作成部の作成する要約記事の要約率を調整することを特徴とする。
実施の形態1のサーバは、利用者嗜好計算部の算定した上記利用者における「記事構成要素の重み」を、記事選択部と要約作成部とに提供し、記事の選択および記事の要約を行うことを特徴とする。
実施の形態1の要約記事配信システムは、利用者の端末は、サーバの通信部と通信する通信手段と、サーバの認証部と通信を行うことにより個人認証を得る個人認証取得手段と、受け取った記事情報を出力する出力手段とを少なくとも有し、上記サーバは、利用者の端末との通信を行う通信部と、端末からの通信により利用者情報格納部の情報を元に個人認証を行う認証部と、前記通信部と前記認証部とを備えサーバの各構成要素の制御を行う制御部と、利用者の個人認証に必要な情報を格納する利用者情報格納部と、利用者のこれまでの選択記事における記事構成要素の出現頻度を格納した利用者履歴格納部と、利用者履歴格納部に格納された利用履歴のうち、傾向の似た他の利用者の利用履歴を用いて、上記利用者の記事構成要素記事に対する嗜好度を算定する利用者嗜好計算部とを少なくとも有し、上記利用者が意識することなく、上記利用者に対する「記事構成要素の重み」の算定を行うことを特徴とする。
実施の形態2.
実施の形態2は、逐一選択の場合について説明する。ここで「逐一選択」とは、次の選択形式をいう。すなわち、端末からの要求に応答して、サーバ100が新規記事の全てについて新規記事からタイトルを作成し、作成したタイトルを利用者の端末に送信する。この場合、サーバ100は、「記事の重み」の順にタイトルを並べて送信する。タイトルを受信した利用者は、自分の好むタイトルの記事を選択する。サーバ100は、選択された記事(タイトル)の要約を作成して、利用者に配信する。実施の形態1における自動選択の場合は、利用者は何ら選択する必要はなかった。実施の形態2では、利用者が好みの記事タイトルを選択する点が特徴である。
システムの構成は実施の形態1と同様である。
次に、利用者乙が、記事を逐一選択する場合の動作を図5のフローチャートを参照して説明する。本実施形態によって、利用者乙に対する嗜好情報が追加され(後述のS130)、より高い精度の嗜好判定を行うことができる。S10〜S60までは実施の形態1における自動選択の場合と同様である。図5のS70から説明する。
S70において、記事選択部62は、利用者嗜好計算部61より提供された「記事構成要素の重み」を用いて、複数の記事につてそれぞれの記事ごとに「記事の重み」を算定する。S51で記事格納部から取得した「新規の記事の全部」と、本ステップ70(S70)においてそれぞれの記事について算定した「記事の重み」とを要約作成部8へ提供する。自動選択の場合は、「記事の重み」は提供しなかったのに対して、この逐一選択の場合は、「記事の重み」を記事選択部62から要約作成部8へ提供する点が異なる。なお、「記事の重み」の算定方法は、実施の形態1と同様であり、後述する。
S80において、要約作成部8は、利用者嗜好計算部61から提供された「記事構成要素の重み」を用いて(S50で提供されている)、記事選択部62から得た複数の「記事本文」を、「記事構成要素の重み」の大きい記事構成要素を用いて、非常に短い要約文章(短文)を作成する。そして、作成した短文を、その記事の利用者乙向けのタイトルとする。要約作成部8は、それぞれの記事についてのタイトルを、記事選択部62から入力した「記事の重み」を用いて、「記事の重み」の大きい順番に並べる。この順番を順位情報とする。そして、要約作成部8は、これらのタイトルと順位情報とを制御部3へ提供する。
S100において、制御部3は、要約作成部8から提供された記事のタイトルと順位情報とを、通信部31を用いて端末1へ送信する。
S110において、利用者乙は、端末1bにて受け取った「記事の重み」が高い順に並んだタイトルから、要約記事を求めたい記事を一つ、あるいは複数選択し、制御部3へ送信する(S120)。
S130において、制御部3(更新部の一例)は、利用者履歴格納部5へ利用者乙の選択した記事に関して更新を行う。すなわち、制御部3は、利用者乙の選択した記事を構成する記事構成要素に対して、利用者履歴格納部5に保持している出現頻度情報について出現頻度を増やすという更新を行う。
S140において、記事選択部62は、利用者乙が端末1bによって選択した記事を再度、要約作成部8へ提供する。以下S150〜S170へと続くが、これらのステップは自動選択の場合と同様である。
S150において、要約作成部8は、記事選択部62から提供された記事本文を、利用者嗜好計算部61より提供された「記事構成要素の重み」を用いて、「記事構成要素の重み」が小さい記事構成要素ほど削除するように要約を作成する。この際、記事選択部62が提供した「記事の重み」に応じて、要約率を変更しても良い。その結果、得られた要約記事を制御部3へ提供する。S150は、自動選択の場合と同様である。
S160において、端末1は、制御部3の通信部31より提供された要約記事を受け取り、任意の出力手段を用いて出力を行う(S170)。なお、逐一選択の場合には、記事のタイトルに関して、S80で作成する新規記事の全てについてのタイトルを記事格納部7に最初から格納しておき、利用者乙の選択時にそのタイトルを使用してもよい。これにより、計算コストを低減することができる。
次に、自動選択のS90、逐一選択のS70における、「記事の重み」の算定について、具体的な動作の説明をする。
「記事の重要度」算定の際には、次のような処理を行う。
記事構成要素iの重み係数、つまり上述の嗜好度をwiとし、対象記事jにおける記事構成要素iの出現数をnijとする。このとき、対象記事jの重みWjは、重み付け関数f(x)を用いて次のように設定する。
j=Σiif(nij
ここで、重み付け関数はf(x)=xや、f(x)=logxなど、単調増加関数ならば任意の関数をとってよい。また、wiの設定時に、記事格納部7に格納されている記事全体における記事構成要素iの出現割合の逆数を掛け合わせるなど、記事構成要素の重み係数に対して、精度向上のための修正を加えても構わない。
記事の自動選択においては、以上の各記事jの重みWjの大きい順に、重みの累積が設定された閾値以上になるまで記事を選択する。利用者乙が選択を行う際は、上述のWjの大きい順に記事を整列し、利用者乙の端末1bへ記事一覧を提供する。
また記事格納部7の記事全体に対するそれぞれの記事構成要素の出現頻度割合と、利用者乙の選択記事における各構成要素の出現頻度割合を比較し、その差異について統計的手法(例えば適合度のカイ二乗検定やLog−Likelihoodなど)を用いて、有意差ありの判定が得られた記事構成要素のみの嗜好度を有効にすることにより、嗜好判定の精度を向上させることなどが考えられる。なお、前述のLog−likelihoodは、以下の文献にて紹介されている手法である。
P. Rayson and R. Garside, “Comparing corpora using frequency profiling,” in proceedings of the workshop on Comparing Corpora, held in conjunction with the 38th annual meeting of the Association for Computational Linguistics (ACL 2000), 1−8 October 2000, Hong Kong, pp. 1−−6.
要約作成部8の動作については、利用者嗜好計算部61によって導出した「記事構成要素の重み」を用いるならば、要約率が指定可能な任意の要約作成アルゴリズムを用いてよい。例えば、意味を通すための必須要素以外の情報を構成する記事構成要素のうち、利用者乙の嗜好度の低いものから順に削除して、要約文を得るというような方針のアルゴリズムがなじみやすい。このようなアルゴリズムの例として、以下の文献にて紹介されているものなどがある。
小黒玲,尾関和彦,張玉潔,高木一幸,“文節重要度と係り受け整合度に基づく文要約アルゴリズム,”言語処理学会第6回年次大会発表論文集,pp.133〜136,2000.
もちろん、ここで具体例として説明した実施の形態は本発明を限定するものではなく、本発明にかかる技術的思想を逸脱しない範囲であれば、種々の変更が可能であることはもちろんである。
実施の形態2のサーバは、記事選択部が記事の重みを算定するので、利用者の嗜好に適合した記事を選択することができる。
実施の形態2のサーバは、要約作成部が記事のタイトルを作成し、配信部がタイトルと順位情報とを利用者の端末に配信するので、利用者は記事の重み順に並んだタイトルから、容易に自己の嗜好に適合する記事を選択し要約の配信を要求することができる。
実施の形態2のサーバは、制御部が利用者履歴格納部に格納されている出現頻度情報を更新するので、利用者の嗜好により適合した要約を提供することができる。
実施の形態2のサーバは、要約作成部が記事の重みに基づいて要約率を決定し、利用者にとってより重要な記事の要約ほど詳しく作成するので、利用者にとっての利用性を向上することができる。
実施の形態3.
次に、図7、図8を用いて実施の形態3を説明する。実施の形態3は、実施の形態1、及び実施の形態2におけるサーバ100の機能を、方法、プログラムで実現する実施形態である。
前記の実施の形態1、実施の形態2においては、サーバ100の各構成要素の動作は、互いに関連しており、動作の関連を考慮しながら、一連の動作として置き換えることができる。そして、このように構成要素の動作を一連の動作に置き換えることにより、方法の実施形態とすることができる。
図7は、サーバ100における利用者履歴格納部5(出現頻度情報格納部)、記事格納部7、取得算定部6、要約作成部8、通信部31(配信部)のそれぞれの動作を、一連の動作に置き換えて、要約記事配信方法の実施形態としたフローチャートを示す。
S301において、過去に利用者へ配信した要約の作成の対象である記事を構成する複数の記事構成要素のそれぞれについて、記事構成要素が記事に出現する出現頻度を示す出現頻度情報を格納する。
S302において、利用者に配信する要約の作成の対象となる対象記事を格納する。
S303において、格納した対象記事を取得し、取得した対象記事を構成する複数の記事構成要素のそれぞれに対して格納した出現頻度情報に基づいてそれぞれの記事構成要素の重みを算定し、算定したそれぞれの記事構成要素の重みと取得した対象記事とを出力する。
S304において、出力したそれぞれの記事構成要素の重みと対象記事とを入力し、入力したそれぞれの記事構成要素の重みを用いて、入力した対象記事の要約を作成する。
S305において、作成した要約を配信する。
また、上記各構成要素の一連の動作を、各構成要素の処理と置き換えることにより、プログラムの実施形態とすることができる。すなわち、上記S301〜S305の一連の動作を「処理」と置き換えることにより、要約記事配信プログラムの実施形態とすることができる。また、要約記事配信プログラムを、コンピュータ読み取り可能な記録媒体に記録させることで、プログラムを記録したコンピュータ読み取り可能な記録媒体の実施の形態とすることができる。
プログラムの実施の形態及びプログラムを記録したコンピュータ読み取り可能な記録媒体の実施の形態は、すべてコンピュータで動作可能なプログラムにより構成することができる。
図8は、サーバ100の動作をプログラムにより実行する場合のコンピュータのハードウェア構成を示す。
CPU90(Central Processing Unit)には、バス95を介して、磁気記憶装置96、モニタ91、キーボード92、マウス93、通信ポート94等が接続されている。また、磁気記憶装置96には、オペレーティングシステムであるOS97、プログラム群98、ファイル群99が記憶されている。通信部ポート94はネットワーク2と接続している。
図1のサーバ100と、図8のコンピュータのハード構成との対応関係を説明する。
制御部3の機能は、プログラムを実行することで実現される。プログラムは磁気記憶装置96のプログラム群に格納される。
利用者情報格納部4には、ファイル群99が対応する。
利用者履歴格納部5には、ファイル群99が対応する。
取得算定部6の機能は、プログラムを実行することで実現される。プログラムは磁気記憶装置96のプログラム群に格納される。
記事格納部7には、ファイル群99が対応する。
要約作成部8の機能は、プログラムを実行することで実現される。プログラムは磁気記憶装置96のプログラム群に格納される。
プログラムの実施の形態及びプログラムを記録したコンピュータ読み取り可能な記録媒体の実施の形態における各処理は、プログラムで実行されるが、このプログラムは、前述のように磁気記憶装置96に記憶されている。そして、磁気記憶装置96からCPU90に読み込まれ、CPU90によって、プログラムの各処理が実行される。
また、ソフトウェア、あるいはプログラムは、ROM(Read Only Memory)(図示していない)に記憶されたファームウェアで実行されても構わない。あるいは、ソフトウェアとファームウェアとハードウェアの組み合わせで実行されても構わない。
実施の形態3の要約記事配信方法により、利用者の嗜好に適合した要約を作成することができる。
実施の形態3の要約記事配信プログラムにより、専用装置を必要とすることなく、汎用のコンピュータを用いて、利用者の嗜好に適合した要約を作成することができる。
実施の形態1の要約記事配信システムを示す図である。 利用者情報を示す図である。 出現頻度情報を示す図である。 記事格納部における記事の格納形式を示す図である。 要約記事配信システムの動作を示すフローチャートである。 S50の詳細を説明するフローチャートである。 方法の実施形態の工程を示すフローチャートである。 サーバ100の動作をプログラムにより実行する場合のコンピュータのハードウェア構成を示す図である。
符号の説明
1a,1b,1c 端末、100 サーバ、1000 要約記事配信システム、2 ネットワーク、3 制御部、31 通信部、32 認証部、4 利用者情報格納部、5 利用者履歴格納部、6 取得算定部、61 利用者嗜好計算部、62 記事選択部、7 記事格納部、8 要約作成部、90 CPU、91 モニタ、92 キーボード、93 マウス、94 通信ポート、95 バス、96 磁気記憶装置、97 OS、98 プログラム群、99 ファイル群。

Claims (10)

  1. 記事の要約の配信を利用する利用者の端末からの要求に応答して、記事の要約を作成して利用者へ配信する要約記事配信サーバにおいて、
    過去に利用者へ配信した要約の作成の対象である記事を構成する複数の記事構成要素のそれぞれについて、記事構成要素が記事に出現する出現頻度を示す出現頻度情報を格納する出現頻度情報格納部と、
    利用者に配信する要約の作成の対象となる対象記事を格納する記事格納部と、
    記事格納部の格納する対象記事を取得し、取得した対象記事を構成する複数の記事構成要素のそれぞれに対して出現頻度情報格納部の格納する出現頻度情報に基づいてそれぞれの記事構成要素の重みを算定し、算定したそれぞれの記事構成要素の重みと取得した対象記事とを出力する取得算定部と、
    取得算定部の出力したそれぞれの記事構成要素の重みと対象記事とを入力し、入力したそれぞれの記事構成要素の重みを用いて、入力した対象記事の要約を作成する要約作成部と、
    要約作成部の作成した要約を配信する配信部と
    を備えたことを特徴とする要約記事配信サーバ。
  2. 出現頻度情報格納部は、
    過去に複数の利用者のそれぞれへ配信した要約の作成の対象である記事を構成する複数の記事構成要素のそれぞれについて、記事構成要素が記事に出現する出現頻度を示す出現頻度情報を、利用者ごとに格納し、
    取得算定部は、
    出現頻度情報の類似する他の利用者の出現頻度情報を用いて、それぞれの記事構成要素の重みを算定することを特徴とする請求項1記載の要約記事配信サーバ。
  3. 記事格納部は、
    複数の対象記事を格納し、
    取得算定部は、
    記事格納部から複数の対象記事を取得する取得部と、
    取得部が取得した複数の対象記事を構成する複数の記事構成要素のそれぞれに対して出現頻度格納部の格納する出現頻度情報に基づいてそれぞれの記事構成要素の重みを第1の重みとして算定し、算定した第1の重みを要約作成部に出力する算定部とを備え、
    取得部は、
    算定部の算定した第1の重みを用いて、記事格納部から取得した複数の対象記事のそれぞれについての重みを第2の重みとして算定し、取得した対象記事のうち第2の重みが所定の値以上の対象記事を要約作成部に出力することを特徴とする請求項1記載の要約記事配信サーバ。
  4. 記事格納部は、
    複数の対象記事を格納し、
    取得算定部は、
    記事格納部から複数の対象記事を取得する取得部と、
    取得部が取得した複数の対象記事を構成する複数の記事構成要素のそれぞれに対して出現頻度格納部の格納する出現頻度情報に基づいてそれぞれの記事構成要素の重みを第1の重みとして算定し、算定した第1の重みを要約作成部に出力する算定部とを備え、
    取得部は、
    算定部の算定した第1の重みを用いて、記事格納部から取得した複数の対象記事のそれぞれについての重みを第2の重みとして算定し、
    算定した第2の重みと記事格納部から取得した複数の対象記事とを要約作成部に出力し、
    要約作成部は、
    算定部の出力した第1の重みと、取得部の出力した第2の重みと複数の対象記事とを入力し、第1の重みと第2の重みとに基づいて、複数の対象記事の要約を作成することを特徴とする請求項1記載の要約記事配信サーバ。
  5. 要約作成部は、
    複数の対象記事の要約として対象記事のそれぞれのタイトルを作成するとともに、作成したそれぞれのタイトルについて、第2の重みを用いて順位付けした順位情報を生成し、
    配信部は、
    要約作成部の作成したそれぞれのタイトルと順位情報とを配信することを特徴とする請求項4記載の要約記事配信サーバ。
  6. 配信部は、
    それぞれのタイトルと順位情報との配信を受けた利用者の端末から、タイトルに対応する記事についてタイトルを指定して要約の配信を要求する配信要求を受信し、
    要約記事配信サーバは、さらに、
    配信部が前記配信要求を受信した場合に、タイトルに対応する記事を構成する記事構成要素に基づいて、出現頻度情報格納部の格納する出現頻度情報を更新する更新部を備えたことを特徴とする請求項5記載の要約記事配信サーバ。
  7. 取得部は、
    第2の重みを要約作成部に出力し、
    要約作成部は、
    取得部の出力した第2の重みを入力し、入力した第2の重みに基づいて対象記事の文章の長さと前記対象記事について作成するべき要約の文章の長さとの比を示す要約率を決定し、決定した要約率に従って要約を作成することを特徴とする請求項3記載の要約記事配信サーバ。
  8. 要約作成部は、
    第2の重みに基づいて対象記事の文章の長さと前記対象記事について作成するべき要約の文章の長さとの比を示す要約率を決定し、決定した要約率に従って要約を作成することを特徴とする請求項4記載の要約記事配信サーバ。
  9. 記事の要約の配信を利用する利用者の端末からの要求に応答して、記事の要約を作成して利用者へ配信する要約記事配信方法において、
    過去に利用者へ配信した要約の作成の対象である記事を構成する複数の記事構成要素のそれぞれについて、記事構成要素が記事に出現する出現頻度を示す出現頻度情報を格納する工程と、
    利用者に配信する要約の作成の対象となる対象記事を格納する工程と、
    格納した対象記事を取得し、取得した対象記事を構成する複数の記事構成要素のそれぞれに対して格納した出現頻度情報に基づいてそれぞれの記事構成要素の重みを算定し、算定したそれぞれの記事構成要素の重みと取得した対象記事とを出力する工程と、
    出力したそれぞれの記事構成要素の重みと対象記事とを入力し、入力したそれぞれの記事構成要素の重みを用いて、入力した対象記事の要約を作成する工程と、
    作成した要約を配信する工程と
    を備えたことを特徴とする要約記事配信方法。
  10. 記事の要約の配信を利用する利用者の端末からの要求に応答して、記事の要約を作成して利用者へ配信する要約記事配信プログラムにおいて、
    過去に利用者へ配信した要約の作成の対象である記事を構成する複数の記事構成要素のそれぞれについて、記事構成要素が記事に出現する出現頻度を示す出現頻度情報を格納する処理と、
    利用者に配信する要約の作成の対象となる対象記事を格納する処理と、
    格納した対象記事を取得し、取得した対象記事を構成する複数の記事構成要素のそれぞれに対して格納した出現頻度情報に基づいてそれぞれの記事構成要素の重みを算定し、算定したそれぞれの記事構成要素の重みと取得した対象記事とを出力する処理と、
    出力したそれぞれの記事構成要素の重みと対象記事とを入力し、入力したそれぞれの記事構成要素の重みを用いて、入力した対象記事の要約を作成する処理と、
    作成した要約を配信する処理と
    をコンピュータに実行させることを特徴とする要約記事配信プログラム。

JP2004115632A 2004-04-09 2004-04-09 要約記事配信サーバ及び要約記事配信方法及び要約記事配信プログラム Pending JP2005301584A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004115632A JP2005301584A (ja) 2004-04-09 2004-04-09 要約記事配信サーバ及び要約記事配信方法及び要約記事配信プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004115632A JP2005301584A (ja) 2004-04-09 2004-04-09 要約記事配信サーバ及び要約記事配信方法及び要約記事配信プログラム

Publications (1)

Publication Number Publication Date
JP2005301584A true JP2005301584A (ja) 2005-10-27

Family

ID=35333053

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004115632A Pending JP2005301584A (ja) 2004-04-09 2004-04-09 要約記事配信サーバ及び要約記事配信方法及び要約記事配信プログラム

Country Status (1)

Country Link
JP (1) JP2005301584A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007148948A (ja) * 2005-11-30 2007-06-14 Hitachi Ltd 文書検索プログラム
JP2009530722A (ja) * 2006-03-16 2009-08-27 デイリーミー,インコーポレイテッド カスタマイズされたニュース抄録作成方法ならびにそのシステム
JP2010020678A (ja) * 2008-07-14 2010-01-28 Nippon Telegr & Teleph Corp <Ntt> 文書要約装置、文書要約方法、プログラムおよび記録媒体
JP2012221293A (ja) * 2011-04-11 2012-11-12 Nippon Telegr & Teleph Corp <Ntt> 文書要約装置、文書要約方法、及びプログラム
WO2013187555A1 (ko) * 2012-06-11 2013-12-19 에스케이플래닛 주식회사 데이터 공유 서비스 시스템, 데이터 공유 서비스를 위한 장치 및 방법
JP6152199B1 (ja) * 2016-06-28 2017-06-21 ヤフー株式会社 生成装置、生成方法、及び生成プログラム
JP2018081702A (ja) * 2015-09-09 2018-05-24 ウバープル カンパニー リミテッド 文抽出方法及びシステム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007148948A (ja) * 2005-11-30 2007-06-14 Hitachi Ltd 文書検索プログラム
JP2009530722A (ja) * 2006-03-16 2009-08-27 デイリーミー,インコーポレイテッド カスタマイズされたニュース抄録作成方法ならびにそのシステム
JP2010020678A (ja) * 2008-07-14 2010-01-28 Nippon Telegr & Teleph Corp <Ntt> 文書要約装置、文書要約方法、プログラムおよび記録媒体
JP2012221293A (ja) * 2011-04-11 2012-11-12 Nippon Telegr & Teleph Corp <Ntt> 文書要約装置、文書要約方法、及びプログラム
WO2013187555A1 (ko) * 2012-06-11 2013-12-19 에스케이플래닛 주식회사 데이터 공유 서비스 시스템, 데이터 공유 서비스를 위한 장치 및 방법
KR20130138597A (ko) * 2012-06-11 2013-12-19 에스케이플래닛 주식회사 데이터 공유 서비스 시스템, 데이터 공유 서비스를 위한 장치 및 방법
KR101978297B1 (ko) * 2012-06-11 2019-08-28 에스케이플래닛 주식회사 데이터 공유 서비스 시스템, 데이터 공유 서비스를 위한 장치 및 방법
US11023660B2 (en) 2012-06-11 2021-06-01 Sk Planet Co., Ltd. Terminal device for data sharing service using instant messenger
JP2018081702A (ja) * 2015-09-09 2018-05-24 ウバープル カンパニー リミテッド 文抽出方法及びシステム
JP6152199B1 (ja) * 2016-06-28 2017-06-21 ヤフー株式会社 生成装置、生成方法、及び生成プログラム
JP2018005324A (ja) * 2016-06-28 2018-01-11 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Similar Documents

Publication Publication Date Title
Deshpande et al. Selective markov models for predicting web page accesses
KR102233805B1 (ko) 미인지된 및 새로운 유저들에 대한 향상된 유저 경험
JP4950448B2 (ja) 探知されたユーザの選好に基づいて検索結果をランク付けするシステムおよび方法
US7882056B2 (en) Method and system to predict and recommend future goal-oriented activity
US20100332842A1 (en) Determining a mood of a user based on biometric characteristic(s) of the user in an online system
US20060173828A1 (en) Methods and apparatus for using personal background data to improve the organization of documents retrieved in response to a search query
US9794268B2 (en) Privacy policy management method for a user device
JP6596592B2 (ja) プレイリストのリスト決定方法、装置、電子機器及び記憶媒体
JP5384452B2 (ja) 配信サーバ及び推薦方法
US20060235859A1 (en) Prescriptive architecutre recommendations
JP2006309660A (ja) 推薦順位選定装置及び推薦順位選定プログラム推薦順位選定装置及び推薦順位選定プログラム
BRPI0714327A2 (pt) classificaÇço de resultados de busca
US20100017709A1 (en) List display method and list display apparatus
US10380121B2 (en) System and method for query temporality analysis
JP2009265754A (ja) 情報提供装置、情報提供方法及び情報提供プログラム
JP2005301584A (ja) 要約記事配信サーバ及び要約記事配信方法及び要約記事配信プログラム
JP6570978B2 (ja) クラスタ選択装置
US8856110B2 (en) Method and apparatus for providing a response to a query
JP2009258826A (ja) アクセス制限情報出力装置及びアクセス制限情報提示システム等
JP2000285127A (ja) 情報提供システム及び情報提供方法
JP2019185620A (ja) メッセージ処理装置及びプログラム
JP5408658B2 (ja) 情報整合性判別装置、その方法及びプログラム
JP2008046770A (ja) 情報提供装置及び方法
Pomerantz et al. Context dependent movie recommendations using a hierarchical bayesian model
KR101583073B1 (ko) 기사 요약 서비스 서버 및 방법