JP6533354B1 - 情報処理装置、情報処理方法、プログラム、記憶媒体 - Google Patents

情報処理装置、情報処理方法、プログラム、記憶媒体 Download PDF

Info

Publication number
JP6533354B1
JP6533354B1 JP2019506537A JP2019506537A JP6533354B1 JP 6533354 B1 JP6533354 B1 JP 6533354B1 JP 2019506537 A JP2019506537 A JP 2019506537A JP 2019506537 A JP2019506537 A JP 2019506537A JP 6533354 B1 JP6533354 B1 JP 6533354B1
Authority
JP
Japan
Prior art keywords
article
keyword
information
headline
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019506537A
Other languages
English (en)
Other versions
JPWO2020012595A1 (ja
Inventor
愼吾 原澤
愼吾 原澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Application granted granted Critical
Publication of JP6533354B1 publication Critical patent/JP6533354B1/ja
Publication of JPWO2020012595A1 publication Critical patent/JPWO2020012595A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

ユーザごとに適した記事見出し文を生成するための環境を提供することを目的とする。そのために、情報処理装置は、配信記事を受信し新着記事として管理する記事管理部と、前記新着記事を記事クラスタに分類する分類処理部と、記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて前記人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理部と、ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理部と、前記新着記事の記事クラスタと前記新着記事の記事内容と前記制約情報と前記注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定部と、前記個人キーワードを用いて前記新着記事の記事見出し文生成のための提示情報を生成する提示情報生成部と、を備えるものとした。

Description

本発明は情報処理装置、情報処理方法、プログラム、記憶媒体に関し、特にニュース掲載サイトに掲載される記事の記事見出し文の生成を支援する技術に関する。
ニュース記事を閲覧可能なウェブサイト(以降、ニュース掲載サイト)には、多数の記事群の中から閲覧者に優先的に閲覧させたい記事を提供するための特定の記事掲載場所が設けられている。
特定の記事掲載場所は、例えば、ニュース掲載サイトのトップページに設けられている。このような特定の記事掲載場所には、記事内容を端的に説明するための記事見出し文が掲載されることがある。これは、記事全文を載せるだけのスペースが確保できないことや、多くの記事をユーザ(閲覧者)に提供することに起因する。
ところで、このようなニュース記事ごとに記事内容を端的に表す記事見出し文を作成することは、多大なコストを要するものである。
例えば、以下に示す特許文献1では、ウェブページの内容の要約を生成する構成が開示されている。
特開2011−100350号公報
特許文献1に示した構成を利用すれば、ニュース記事の内容を端的に表す記事見出し文を生成することは可能かもしれない。
しかし、このようにして生成された記事見出し文は、ユーザ(閲覧者)によらず同じ文言であり、必ずしもユーザにとって最適な文章とは限らない。
本発明は、このような事情を鑑みてなされたものであり、ユーザごとに適した記事見出し文を生成するための環境を提供することを目的とする。
本発明に係る情報処理装置は、配信記事を受信し新着記事として管理する記事管理部と、前記新着記事を記事クラスタに分類する分類処理部と、記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて前記人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理部と、ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理部と、前記新着記事の記事クラスタと前記新着記事の記事内容と前記制約情報と前記注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定部と、前記個人キーワードを用いて前記新着記事の記事見出し文生成のための提示情報を生成する提示情報生成部と、を備えたものである。
記事内容に即した見出し文を手動で作成することは、非常に大きな工数が必要となる。本構成によれば、記事クラスタごとに注目キーワードが管理されると共に、注目キーワードを用いて記事内容に即した提示情報が生成される。提示情報としては、例えば、記事見出し文に使えそうなキーワードの候補や、記事見出し文の候補などである。
上述した情報処理装置の前記キーワード決定部は、前記注目キーワードから前記記事クラスタに応じた第1キーワードを選択する第1選択処理と、前記第1キーワードから前記新着記事の記事内容に応じて第2キーワードを選択する第2選択処理と、前記第2キーワードから前記制約情報に応じて前記個人キーワードを選択する第3選択処理と、を行ってもよい。
即ち、新着記事に応じた適切な記事クラスタの注目キーワードを第1キーワードとして選択し、その中から、新着記事の記事内容に応じた適切なキーワードを第2キーワードとして選択し、更にその中から、記事を閲覧するユーザごとの制約情報に応じて適切なキーワードを個人キーワードとして選択し決定する。従って、決定された個人キーワードは、新着記事の記事クラスタに適切であり、且つ記事内容に沿ったものであり、更に、ユーザの制約情報を加味したものとなる。
上述した情報処理装置の前記キーワード決定部は、前記新着記事における一部の記事について前記個人キーワードの決定を行い、前記提示情報生成部は、前記一部の記事についての提示情報を生成するものであってもよい。
即ち、新着記事全てについて提示情報が生成されるのではなく、一部の新着記事について提示情報が生成される。
上述した情報処理装置においては、記事見出し文を生成するための操作が可能な状態で前記提示情報を提示する提示部を備えたものでもよい。
例えば、いくつかの記事見出し文の候補が掲載されると共に、候補から一つを選択することができるインタフェースを備えたウェブページが作業者に提示される。また、選択した一つの記事見出し文候補を編集できるようなインタフェースも設けられ、作業者は簡易的な操作で、記事見出し文を作成することができる。
上述した情報処理装置の前記提示情報生成部は、前記提示情報として所定以内の文字数で構成された記事見出し文を生成してもよい。
これにより、記事見出し文を決定する作業者は、自動で生成された記事見出し文の候補から一つを選択するだけでよい。
上述した情報処理装置においては、直近の所定期間内に掲載された記事見出し文と前記提示情報生成部が生成した記事見出し文との類似を判定する類似判定部を備え、前記提示情報生成部は、前記類似判定部が類似と判定した場合に、前記提示情報としての記事見出し文を再生成してもよい。
類似判定部が設けられることにより、記事見出し文同士の類似/非類似が判定可能とされる。
上述した情報処理装置において、前記制約情報は、ユーザの言語能力に関する情報とされてもよい。
例えば日本語の能力が高い人と低い人について、同じ記事見出し文を用いてしまうと、記事見出し文を目にしたユーザが推定した記事内容に相違が出てしまう場合や、そもそも記事内容の推定ができない場合が生じる。この構成によれば、そういった事態に対応するために、言語能力の高低に応じた注目キーワードが個人キーワードとして決定される。
上述した情報処理装置において、前記制約情報は、ユーザの視覚障害に関する情報とされてもよい。
例えば、全盲である視覚障害者は、記事見出し文や記事本文の情報を音声で取得することが考えられる。そのような状況で相応しくない注目キーワードとして、例えば同音異義語がある。本構成によれば、同音異義語のような適していない語句以外の注目キーワードを用いて提示情報が生成される。
情報処理装置は、端末装置からのウェブページ要求を受信する要求受信部と、記事が属する記事クラスタと、前記記事の記事内容と、前記端末装置を使用するユーザの制約情報と、に基づいて設定されたユーザごとの記事見出し文を取得し、前記ユーザごとの記事見出し文が掲載されるウェブページの情報を生成するウェブページ生成部と、前記生成されたウェブページの情報を前記端末装置に送信する送信部と、を備えたものでもよい。
ユーザが記事見出し文が掲載されたウェブページを閲覧した場合に、ユーザの制約情報(例えば、低語学ユーザであるか否かの情報や視覚障害を有したユーザであるか否かを示す情報)に基づいて設定されたユーザに特化した記事見出し文がユーザに提示される。
上述した情報処理装置においては、前記制約情報に基づいて、前記注目キーワードの置換処理を行う置換処理部を備え、前記キーワード決定部は、前記置換処理によって得られたキーワードを前記個人キーワードとして決定してもよい。
注目キーワードが一部のユーザにとって適切でない場合、そのユーザに対しては他の注目キーワードが個人キーワードとして決定されてもよいが、本構成によれば、それ以外の手段を用いて当該ユーザに適切な記事見出し文生成のための提示情報が生成される。
本発明に係る情報処理方法は、配信記事を受信し新着記事として管理する記事管理ステップと、前記新着記事を記事クラスタに分類する分類処理ステップと、記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて前記人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理ステップと、ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理ステップと、前記新着記事の記事クラスタと前記新着記事の記事内容と前記制約情報と前記注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定ステップと、前記個人キーワードを用いて前記新着記事の記事見出し文生成のための提示情報を生成する提示情報生成ステップと、を情報処理装置が実行するものである。
また、本発明に係る情報処理方法は、端末装置からのウェブページ要求を受信する要求受信ステップと、記事が属する記事クラスタと、前記記事の記事内容と、前記端末装置を使用するユーザの制約情報と、に基づいて設定されたユーザごとの記事見出し文を取得し、前記ユーザごとの記事見出し文が掲載されるウェブページの情報を生成するウェブページ生成ステップと、前記生成されたウェブページの情報を前記端末装置に送信する送信ステップと、を情報処理装置が実行するものである。
この情報処理方法により、ユーザごとに適した記事見出し文を生成するための環境を提供することができる。
本発明に係るプログラムは、上記各ステップに相当する手順を情報処理装置に実行させるプログラムである。本発明に係る記憶媒体は、上記プログラムを記憶したものである。これらにより上述の情報処理装置の処理を実現する。
本発明によれば、ユーザごとに適した記事見出し文を生成するための環境を提供することができる。
本発明の実施の形態のサイト管理端末を含むネットワークの説明図である。 実施の形態で利用できるコンピュータ装置のブロック図である。 実施の形態のサイト管理端末の機能構成の説明図である。 ニュース掲載サイトのトップページの例を説明するための図である。 クラスタDBに記憶される情報の一例を示した図である。 キーワードDBに記憶される情報の一例を示した図である。 置換ワードDBに記憶される情報の一例を示した図である。 注目キーワード設定処理のフローチャートである。 置換キーワード設定処理のフローチャートである。 新着記事受信処理のフローチャートである。 個人キーワード設定処理のフローチャートである。 設定された個人キーワードの例を示す説明図である。 ウェブページ情報要求受信処理のフローチャートである。 新着記事受信処理の変形例についてのフローチャートである。 新着記事受信処理の別の変形例についてのフローチャートである。
以下、実施の形態を次の順序で説明する。
<1.システム構成>
<2.コンピュータ装置のハードウェア構成>
<3.サイト管理端末の機能構成及びDB>
<4.各処理例>
<4−1.注目キーワード設定処理>
[4−2.置換キーワード設定処理]
[4−3.新着記事受信処理]
[4−4.ウェブページ情報要求受信処理]
<5.変形例>
[5−1.変形例1]
[5−2.変形例2]
[5−3.変形例3]
<6.まとめ>
<7.プログラム及び記憶媒体>
<1.システム構成>

本実施の形態としてのニュース掲載サイトを管理するサイト管理端末1を含むネットワークシステム全体の構成について、図1を用いて説明する。
サイト管理端末1は、例えばインターネット等の通信ネットワーク2を介して、配信社端末3,3,・・・ユーザ端末4,4,・・・と互いに通信可能とされている。
なお、図1に示した通信ネットワーク2の構成は特に限定されるものではなく、上記したインターネット以外にも、例えばイントラネット、エキストラネット、LAN(Local Area Network)、CATV(Community Antenna TeleVision)通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網などが想定される。
また、通信ネットワーク2の全部又は一部を構成する伝送媒体についても多様な例が想定される。例えばIEEE(Institute of Electrical and Electronics Engineers)1394、USB(Universal Serial Bus)、電力線搬送、電話線などの有線でも、IrDA(Infrared Data Association)のような赤外線、ブルートゥース(登録商標)、802.11無線、携帯電話網、衛星回線、地上波デジタル網などの無線でも利用可能である。
サイト管理端末1は、それぞれコンピュータ装置で構成された記事DB(Database)50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54等を備えている。これらの各装置は、例えばLAN等のネットワークを介して互いに通信可能とされており、このようなネットワークは通信ネットワーク2と同様に特に限定されるものではない。
サイト管理端末1は、各種のニュース記事(以降単に「記事」と記載することもある)をウェブページ上でユーザに閲覧可能な状態で提供するための各種の機能を備えている。
例えば、サイト管理端末1は、配信社が所有する配信社端末3からネットワーク2を介して配信される配信記事の管理や、記事に付与するラベル情報(ジャンル情報など)の管理や、ニュース掲載サイトを閲覧するユーザのユーザID(Identification)やパスワードや閲覧履歴情報を管理するユーザ管理のための各種処理を行う。
サイト管理端末1は、配信社端末3から配信されてくる配信記事についての各種処理を行う情報処理装置である。また、ニュース掲載サイトとしてのウェブページに関する各処理を実行する。例えば、ユーザ端末4からのHTTP(Hypertext Transfer Protocol)リクエストに基づいて、該当のウェブページデータの生成処理や送信処理を行う。
ウェブページデータは、例えば、HTML(Hypertext Markup Language)やXHTML(Extensible Hypertext Markup Language)などの構造化文書ファイルである。構造化文書ファイルには、ニュースタイトルや記事本文などのテキストデータやニュースごとに用意された画像などの画像データと、それらの配置や表示態様(文字色やフォントや大きさや装飾など)が記述されている。
ウェブページとしては、例えば、ニュース掲載サイトのトップページや、各記事の詳細が掲載された記事個別ページや、ニュースに対して投稿されたコメントを閲覧可能なコメントページなどである。
配信社端末3は、記事を配信する配信社に所属する社員等が使用する情報処理装置である。配信社端末3は、サイト管理端末1に対して新たな記事を配信するための送受信処理や、既に配信済みの記事を修正するための処理が行われる。
なお、配信社は企業である必要はなく、記事の配信を行う記者であってもよい。従って、配信社端末3は記事の配信を行う配信者が使用する配信者端末であってもよい。
ユーザ端末4は、ニュース掲載サイトを管理するサイト管理端末1が提供する各種のサービスを受けるためにユーザが使用する情報処理装置である。具体的には、ニュース掲載サイト上のニュース記事を閲覧する場合などに用いられる。
配信社端末3やユーザ端末4は、例えば、通信機能を備えたPC(Personal Computer)やフィーチャーフォンやPDA(Personal Digital Assistants)、或いは、スマートフォンやタブレット端末などのスマートデバイスなどである。
<2.コンピュータ装置のハードウェア構成>

サイト管理端末1をはじめとした各装置(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54、配信社端末3及びユーザ端末4)を構成するコンピュータ装置のハードウェア構成を図2に示す。各コンピュータ装置のCPU(Central Processing Unit)101は、ROM( Read Only Memory)102に記憶されているプログラム、または記憶部108からRAM( Random Access Memory )103にロードされたプログラムに従って各種の処理を実行する。RAM103にはまた、CPU101が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU101、ROM102、およびRAM103は、バス104を介して相互に接続されている。このバス104には、入出力インタフェース105も接続されている。
入出力インタフェース105には、入力部106、出力部107、記憶部108、通信部109が接続されている。
入力部106はキーボード、マウス、タッチパネルなどにより構成される。
出力部107はLCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、有機EL(Electroluminescence)パネルなどよりなるディスプレイ、並びにスピーカなどにより構成される。
記憶部108はHDD(Hard Disk Drive)やフラッシュメモリ装置などにより構成される。
通信部109はネットワーク2を介しての通信処理や機器間通信を行う。
入出力インタフェース105にはまた、必要に応じてメディアドライブ110が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111が適宜装着され、リムーバブルメディア111に対する情報の書込や読出が行われる。
このようなコンピュータ装置では、通信部109による通信によりデータやプログラムのアップロード、ダウンロードが行われる。またリムーバブルメディア111を介したデータやプログラムの受け渡しが可能である。
CPU101が各種のプログラムに基づいて処理動作を行うことで、サイト管理端末1などの各装置(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54、配信社端末3及びユーザ端末4)としての必要な情報処理や通信が実行される。
なお、サイト管理端末1などの各装置(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54、配信社端末3及びユーザ端末4)を構成する情報処理装置は、図2のようなコンピュータ装置が単一で構成されることに限らず、複数のコンピュータ装置がシステム化されて構成されてもよい。複数のコンピュータ装置は、LAN等によりシステム化されていてもよいし、インターネット等を利用したVPN等により遠隔地に配置されたものでもよい。複数の情報処理装置には、クラウドコンピューティングサービスによって利用可能なサーバ群(クラウド)としての情報処理装置が含まれてもよい。
情報処理装置の各機能は、情報処理装置においてCPU101でプログラムに応じて実行される処理により実現される機能である。但し以下説明する全部または一部の各構成の処理をハードウェアにより実現してもよい。
また各機能をソフトウェアで実現する場合に、各機能がそれぞれ独立したプログラムで実現される必要はない。一つのプログラムにより複数の機能の処理が実行されてもよいし、一つの機能が複数のプログラムモジュールの連携で実現されてもよい。
また各機能は複数の情報処理装置に分散されていてもよい。更に機能の一つが、複数の情報処理装置によって実現されてもよい。
<3.サイト管理端末の機能構成及びDB>

サイト管理端末1の具体的な構成について、図3を参照して説明する。
サイト管理端末1は、記事管理部1a、ユーザ情報管理部1b、分類処理部1c、注目キーワード管理部1d、キーワード決定部1e、置換処理部1f、提示情報生成部1g、類似判定部1h、提示部1i、ウェブページ生成部1j、要求受信部1k、送信部1mを備えている。
記事管理部1aは、配信社によって配信された各ニュース記事(以降、単に「記事」ともいう)を管理するための各種処理を行う。
例えば、配信社から配信された記事を新着記事として受信するための処理や、記事ごとの公開期限に基づく公開制御などの管理処理などを行う。
記事の公開期限は、配信社とニュース掲載サイトの運営者の間の契約等により設定され得るものであり、公開期限を過ぎると記事の閲覧が不能とされる。
ユーザ情報管理部1bは、サイト管理端末1によって運営されるニュース掲載サイトを利用するユーザの登録処理やユーザ登録の解除処理などのユーザ管理処理を行う。
詳細は後述するが、本実施の形態におけるユーザ情報には、制約情報が含まれる。制約情報とは、ユーザに適した記事見出し文SPを生成するために用いられる情報であり、ユーザの言語能力情報や視覚障害情報などである。
分類処理部1cは、新着記事を記事クラスタACに分類する処理を実行する。特に、本実施の形態では、記事クラスタACはジャンルではなく、記事詳細に含まれるキーワードに基づいて分類される。即ち、例えば、「オリンピックによる経済効果」の記事はジャンルで分類すると「経済ジャンル」とされ、「オリンピック競技の結果」の記事はジャンルで分類すると「スポーツジャンル」とされる可能性がある。しかし、「オリンピック」というキーワードを元に記事クラスタACを生成することにより、上記二つの配信記事は同一の記事クラスタACに属することが可能となる。この場合には、複数のジャンルを横断したクラスタリングが行われる。
なお、勿論、ジャンルと記事クラスタACが略同一のものとされていてもよい。
注目キーワード管理部1dは、記事クラスタACごとに注目キーワードKnを管理する。
注目キーワードKnは、記事クラスタACに属する記事の中で人気が高い(例えば閲覧数が多い)記事に共通しがちなキーワードである。具体的には、人気記事の記事見出し文SPに採用されることの多いキーワードである。
キーワード決定部1eは、配信記事の記事見出し文SPに用いるキーワードとして適切なキーワードを各ユーザの制約情報を考慮して決定する。該決定されたキーワードは、個人キーワードKiとされる。注目キーワードKnをそのまま個人キーワードKiとして採用してもよいし、注目キーワードKnに基づいて別のキーワードを個人キーワードKiとして採用してもよい。具体的には後述する。
置換処理部1fは、注目キーワードKnに基づいて個人キーワードKiを決定する際に、注目キーワードKnの置換処理を行う。即ち、注目キーワードKnを置換処理によって同じ意味の別のキーワード(置換キーワードKr)に置き換える。
置換キーワードKrは、キーワード決定部1eによって、適宜、個人キーワードKiとして採用される。
提示情報生成部1gは、個人キーワードKiを用いて、記事見出し文SPを作成するための提示情報を生成する。提示情報は、例えば、複数の個人キーワードKiとされていてもよい。複数の個人キーワードKiを提示情報として提示された作業者は、個人キーワードKiを用いて記事見出し文SPを作成することができる。即ち、記事見出し文SPの作成を補助するための情報として提示情報を受け取る。
また、提示情報は、個人キーワードKiを用いた記事見出し文SPの候補であってもよい。記事見出し文SPの候補を複数提示された作業者は、その中から一つの記事見出し文SPを選択することにより、記事見出し文SPの作成を完了してもよい。即ち、記事見出し文SPの作成の作業コストの低減が図られる。なお、提示された記事見出し文SPの候補を作業者が編集することにより、記事見出し文SPの作成を行ってもよい。これによっても、作業コストの低減を図ることができる。
類似判定部1hは、提示情報生成部1gが生成した記事見出し文SPの候補について、直近の所定期間(例えば1週間や1ヶ月、或いは1年など)に既にニュース掲載サイトに掲載された記事見出し文SPとの類似判定を行う。類似と判定された場合は、提示情報生成部1gにその旨を通知し、再度提示情報の生成を行うように促す。
また、類似判定部1hは、提示情報生成部1gが生成した記事見出し文SPの候補だけでなく、作業者が作成した記事見出し文SPについて同様の処理を行ってもよい。即ち、作業者が作成した記事見出し文SPについて、直近の所定期間に既にニュース掲載サイトに掲載された記事見出し文SPとの類似判定を行い、類似と判定された場合に作業者に再作成を促す通知を行うようにしてもよい。
提示部1iは、提示情報生成部1gが生成した提示情報を作業者に対して提示する処理を行う。具体的には、提示情報が含まれるウェブページ情報などを生成して作業者が使用する情報処理端末上に表示させる処理などを行う。
ウェブページ生成部1jは、ニュース掲載サイトのトップページや、各記事の詳細が掲載された記事個別ページなどのウェブページ情報を生成する処理を行う。
本実施の形態では、個人キーワードKiを含む記事見出し文SPが掲載されたウェブページ情報を生成する。
図4に記事見出し文SPが掲載されたウェブページの一つとされたニュース掲載サイトの一例を示す。
図4は、ニュース掲載サイトのトップページ(ウェブページ)の一例を示したものである。
ニュース掲載サイトのトップページ(以降、単にトップページと記載)は、ユーザ端末4上で動作するウェブブラウザ20を用いて閲覧可能である。ウェブブラウザ20には、ウェブページ表示欄21が設けられ、その上部や側部には各種の操作子(ボタンや入力欄)22,22,22・・・が設けられている。
トップページが表示されるウェブページ表示欄21には、検索を行うための入力欄や検索ボタンと共に、いくつかのニュース記事の記事見出し文SPが掲載される記事見出し文掲載場所23が設けられている。
記事見出し文掲載場所23の周辺には、ログイン情報表示欄や広告表示欄、天候表示欄、他サービスへの導線部が配置されている。
記事見出し文掲載場所23は、例えば「総合」、「経済」、「社会」、「国際」、「芸能」などの複数のタブを有して構成されている。
要求受信部1kは、ユーザ端末4などの情報処理装置からウェブページの要求を受信する処理を行う。要求を受信することにより、ウェブページデータの生成や後述する記事見出し文SPを生成するための各処理が実行される。
送信部1mは、ウェブページの要求があった情報処理端末に対して、生成したウェブページデータを送信する処理を実行する。この処理により、ウェブページ要求を行った情報処理端末上にウェブページが表示される。
サイト管理端末1には、他にも、記事検索などの各種サービスを提供するための処理を行うために必要な各部が設けられている。
このような各部は、サイト管理端末1とは異なる情報処理装置に設けられていてもよいし、サイト管理端末1に設けられていてもよい。また、複数の情報処理装置を利用して各部の実現が可能とされていてもよい。
尚、サイト管理端末1としての各機能は、情報処理装置におけるCPU101でプログラムに応じて実行される処理により実現される機能である。但し上記の全部又は一部の各構成の処理をハードウェアにより実現してもよい。
また各機能をソフトウェアで実現する場合に、各機能がそれぞれ独立したプログラムで実現される必要はない。一つのプログラムにより複数の機能の処理が実行されてもよいし、一つの機能が複数のプログラムモジュールの連携で実現されてもよい。
また、各機能は複数の情報処理装置に分散されていてもよい。更に、機能の一つが複数の情報処理装置によって実現されていてもよい。
サイト管理端末1が上記の各種機能を実現するために、サイト管理端末1は、記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54を備えている。
記事DB50には、配信社から配信されるニュース記事が記憶されている。例えば、配信記事ごとに記事を一意に特定可能な記事IDが付与され、該記事IDごとに配信日時、配信社(配信社ID)、公開期限、ジャンルID(複数可)、画像情報(もしくは画像ID)等が紐付けられている。
画像情報は、画像データがそのまま記憶されていてもよいし、別の記憶領域に保存された画像を特定可能な画像IDなどの状態で記憶されていてもよい。
ユーザDB51には、サイト管理端末1が提供する各種サービスを利用するユーザの情報が記憶される。例えば、一人のユーザを特定可能な一つのユーザIDに対して、ユーザ名、ログインパスワード、氏名、年齢、性別、年収、住所、メールアドレス、趣味などの個人的な情報が紐付けられて記憶される。
更に、ユーザDB51には、ユーザごとの制約情報が記憶される。制約情報とは、例えば「低語学力」ユーザであるか否かを示す情報や「視覚障害者」であるか否かを示す情報などである。
勿論、これらの情報の全てが記憶されていなくてもよく、記憶された情報量がユーザごとに異なっていてもよい。
クラスタDB52には、記事クラスタACを一意に特定可能な記事クラスタIDに対して、「共通ワード」情報と一つ以上の「記事ID」情報が紐付けられて記憶されている(図5参照)。
「共通ワード」情報は、各記事クラスタACに属するニュース記事を判定するためのキーワードである。記事本文に共通キーワードが含まれたニュース記事は、該記事クラスタACに分類される。
なお、共通ワードは記事クラスタACごとに一つとされていてもよいし、複数とされていてもよい。例えば記事クラスタIDがAC00001とされた記事クラスタAC00001に10個の共通ワードが設定されており、記事クラスタAC00001に属する各記事は、10個の共通ワードのうち少なくとも4個以上の共通ワードを記事本文に含むものとされている。
「記事ID」情報は、記事クラスタACに属する各記事を特定するための情報として記事のIDが記憶されている。
キーワードDB53には、一つの注目キーワードKnを特定可能な注目キーワードIDに対して、語句の情報と所属記事クラスタの情報が紐付けられて記憶されている(図6参照)。
語句とは、注目キーワードKnとして登録されているキーワードの文字列を指している。例えば、「東京オリンピック」という共通ワードが含まれることにより記事クラスタAC00001に属する各記事(記事ID=AID000001,AID000002,AID000003,・・・)において、該記事群の記事見出し文SPに頻繁に登場する「世界新記録」というキーワードがある場合、「世界新記録」というキーワードは記事クラスタAC00001における注目キーワードKnとして登録されることが考えられる。
その場合には、「語句」の情報として「世界新記録」が登録される。
「所属記事クラスタ」情報は、注目キーワードKnが何れの記事クラスタACのものであるかを示す情報である。上記の例では、「世界新記録」の注目キーワードKnは記事クラスタAC00001における注目キーワードKnであるため、「所属記事クラスタ」情報として記事クラスタAC00001のIDである「AC00001」が記憶される。
なお、共通キーワードは、記事クラスタACに属する多くの記事に共通するキーワードであるため、注目キーワードKnである可能性も考えられる。即ち、記事クラスタAC00001にとって「東京オリンピック」という語句は、共通キーワードであると共に、記事クラスタAC00001の注目キーワードKnとされていてもよい。
置換ワードDB54には、注目キーワードとの置き換えが可能な置換キーワードKrが記憶されている(図7参照)。
具体的には、注目キーワードIDに対して、「置換キーワードKr」の情報と「置換条件」の情報が紐付けられている。
「置換キーワードKr」の情報は、注目キーワードIDによって特定される注目キーワードKnとの置換が可能な語句が置換キーワードKrのIDと共に記憶されている。「置換条件」の情報は、注目キーワードKnを置換キーワードKrに置き換える置換処理が実行される条件を示している。換言すれば、所定の条件以外では、記事の記事見出し文SPに使用される文言として注目キーワードKnが選択されるが、所定の条件下においては注目キーワードKnが置換キーワードKrに置き換えられて記事見出し文SPに使用される。
置換条件の一例としては、例えば、ユーザの語学力が低い場合やユーザが視覚障害を有している場合などである。
ニュース掲載サイトに掲載される情報が母国語でないユーザ(即ち外国人)や読解力の低いユーザ(例えば子供)など、低語学力ユーザである場合には、注目キーワードKnと同じ意味の平易な言葉である置換キーワードKrが記事見出し文SPに採用される。
また、ユーザが全盲の視覚障害者(以降、全盲ユーザと記載)である場合には、同音異義語が存在する注目キーワードKnを同音異義語が存在しない置換キーワードKrに置き換えることが考えられる。これは、記事見出し文SPや記事本文を音声出力することにより、ユーザが情報を得ることが考えられるからである。
他にも、ユーザが弱視の視覚障害者(以降、弱視ユーザと記載)である場合には、画数の多い注目キーワードKnを画数の少ない同じ意味の置換キーワードKrに置き換えてもよい。画数による置き換えは、例えば日本語や中国語など、漢字を用いる言語で行われることが考えられる。
もちろん、全ての注目キーワードKnに対して置換キーワードKrが用意されていなくてもよい。また、一つの注目キーワードKnに対して複数の置換キーワードKrが用意されていてもよい。
注目キーワードKnに対応した置換キーワードKrの取得(或いは選択)は、例えば、類義語情報を集積したDBなどを用いることにより実現可能である。
これらの各DB(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54)は、サイト管理端末1を構成する各情報処理装置が必要に応じてアクセス可能とされていればどのような形態で実現されていてもよい。例えばサイト管理端末1と同一システム内の記憶部に各DB(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54)のすべてが形成されていてもよいし、各DB(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54)の一部又は全部が別体、遠隔地等のコンピュータシステムに設けられていてもよい。もちろん各DB(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54)が一つの装置(例えば一つのHDD等)内に形成されている必要はない。また各DB(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54)のそれぞれが、それぞれ1つのDBとして構成される必要もない。例えばユーザDB51に記憶される情報が、複数のユーザDB(例えばログイン用のユーザDBと制約情報が記憶されるユーザDBなど)により記憶管理されてもよい。以下説明する各DB(記事DB50、ユーザDB51、クラスタDB52、キーワードDB53、置換ワードDB54)は、実施の形態の処理に関連する情報の記憶部を、それぞれ1つのDBの形態で例示したものに過ぎない。
<4.各処理例>

サイト管理端末1が実行する各種の処理の一例について、各図を参照しながら説明する。
<4−1.注目キーワード設定処理>
注目キーワード設定処理は、記事クラスタごとに注目されるキーワードとしての注目キーワードKnを設定する処理である。この処理は、例えば、サイト管理端末1が注目キーワード管理部1dの機能を用いて実行する処理である。図8を参照して説明する。
サイト管理端末1は、ステップS101で、一つの記事クラスタACを選択する処理を実行する。
続いて、サイト管理端末1はステップS102で、人気記事特定処理を実行する。この処理では、選択された記事クラスタACに属する各記事の中から閲覧数が多い記事を特定する。閲覧数が多い記事は、記事が配信されてから現在までの総閲覧数から判定してもよいし、単位時間あたりの閲覧数に正規化してもよい。また、直近の所定時間における閲覧数とすることにより、最近話題の記事を特定してもよい。更には、記事掲載ページの記事見出し文掲載場所23に記事が掲載されていた間の閲覧数から判定してもよい。記事見出し文掲載場所23に記事見出し文SPが掲載されている間に多くの閲覧があった記事は、記事見出し文SPがユーザを引きつける要素を含んでいることが考えられる。従って、記事見出し文SPが掲載されていた期間に限定して閲覧数を取得し、その閲覧数が多い記事を人気記事と特定することにより、後述の注目キーワード選定処理において効果的な注目キーワードKnを選定することができる。
サイト管理端末1はステップS103で、記事見出し文SPを取得する処理を実行する。
次に、サイト管理端末1はステップS104で、キーワード抽出処理を実行する。この処理では、取得した記事見出し文SPを構成する語句からキーワードと思われる単語を抽出する。キーワードとしては、例えば、名詞や動詞などである。この処理は、例えば、形態素解析を用いることにより実現可能である。
サイト管理端末1はステップS105で、注目キーワード選定処理を実行する。
この処理では、ステップS104で抽出したキーワードの中から、記事の閲覧数の増加に寄与し得るキーワードを注目キーワードKnとして選定する処理である。例えば、より多くの人気記事に共通するキーワードなどを注目キーワードKnとして選定する。
なお、注目キーワードKnは一つに限らず複数個選定されてもよい。
サイト管理端末1はステップS106で、注目キーワードKnをキーワードDB53に記憶する処理を実行する。この処理により、記事クラスタACごとの注目キーワードKnが記憶される。
サイト管理端末1はステップS107で、未処理の記事クラスタACがあるか否かに応じて分岐する。
未処理の記事クラスタACがある場合、サイト管理端末1はステップS101乃至S107の各処理を実行する。
一方、未処理の記事クラスタACがない場合、サイト管理端末1は図8に示す一連の処理を終了させる。
なお、図8の処理を行った場合に、全ての記事クラスタACについての注目キーワードKnが選定されなくてもよい。即ち、注目キーワードKnの更新が必要となった記事クラスタACを処理対象として、ステップS101乃至S107の各処理を実行してもよい。
[4−2.置換キーワード設定処理]
注目キーワードKnの代替のキーワードとなりうる置換キーワードKrを設定する置換キーワード設定処理について、図9を参照して説明する。
なお、置換キーワード設定処理は、例えば、サイト管理端末1が置換処理部1fの機能を用いて実行する。
サイト管理端末1はステップS201で、注目キーワードKnを一つ取得する処理を実行する。
続いて、サイト管理端末1はステップS202で、注目キーワードKnと同じ意味を持つ語句を記憶する処理を行う。
同じ意味を持つ語句は、例えば全盲ユーザのために同音異義語を避けるために用いられる語句である。例えば、全盲ユーザに対して注目キーワードKnの意味を伝達したい場合に、音声によって注目キーワードKn(或いは注目キーワードKnを含む文章)を伝達することが考えられる。このとき、注目キーワードKnが同音異義語である場合には複数の意味が連想され得るため、音声出力に適さない場合がある。そこで、同音異義語である注目キーワードKnの代替となり得る置換キーワードKrの設定がステップS202で行われる。
即ち、ステップS202の処理は、同音異義語を避けるための代替キーワードを設定するものであるため、置換キーワードKrは同音異義語を有さないキーワードであることが望ましい。
なお、注目キーワードKnが同音異義語を有さない場合は、ステップS202の処理を行わなくてもよい。
他にも、注目キーワードKnが同音異義語を有さない場合であってもステップS202を実行することに意味がある場合もある。
例えば言語が「日本語」である場合に、文字を視認可能なユーザにとっては、注目キーワードKnが容易に理解できるキーワードだったとしても、文字を視認できないユーザにとっては音声だけでは理解しにくいキーワードとなってしまう可能性がある。具体的には、日常会話で余り使用されないキーワードが注目キーワードKnであった場合、漢字を視認できるユーザにとっては注目キーワードKnに含まれる漢字からおおよその意味を把握できるが、漢字を視認できず音声に頼らざるを得ない全盲ユーザなどにとっては意味の把握に時間を要することが考えられる。そのような場合に、ステップS202の処理を行うことにより、同じ意味の別のキーワードを注目キーワードKnの置換キーワードKrとして記憶してもよい。
サイト管理端末1はステップS203で、注目キーワードKnを置き換えるための平易な語句を記憶する処理を行う。
例えば、注目キーワードKnがその言語における初学者にとっては理解しにくいことがある。注目キーワードKnが難読文字を含む場合や高い読解力を要するものである場合にステップS203を実行することが望ましい。
換言すれば、注目キーワードKnが難読文字を含まず平易なキーワードである場合は、ステップS203の処理を行わなくてもよい。勿論、注目キーワードKnを言い換えるための適切な別のキーワードが見つからない場合は、平易な語句情報の記憶処理は行われない。
なお、ステップS202では、文字の視認の可否で意味の把握の容易さが変わる場合などに、置換キーワードKrを記憶してもよい旨を記載したが、このような処理は、ステップS203の処理を行うことにより実現してもよい。
注目キーワードKnが平易な語句のみで構成されている場合には、ステップS203の処理を行わなくてもよい。
サイト管理端末1はステップS204で、注目キーワードKnの置換キーワードKrとして見やすい語句情報を記憶する処理を行う。
文字が完全に見えないわけではなくある程度は見える弱視ユーザにとっては、例えば、注目キーワードKnが込み入った文字を含んでいる場合に注目キーワードKnの理解ができないことが考えられる。
込み入った文字とは、画数の多い文字や線と線の間隔が他の語句と比べて狭い文字などである。このような文字は、例えば「日本語」や「中国語」などに多く見られるものである。
ステップS204の処理では、込み入った文字を含む注目キーワードKnの代替となり得る置換キーワードKrとして、見やすいキーワードの情報が記憶される。
注目キーワードKnが既に見やすい語句のみで構成されている場合には、ステップS204の処理は行わなくてもよい。これは、例えば、注目キーワードKnに所定数以上の画数とされた文字が含まれているか否かによって判定することが考えられる。
サイト管理端末1はステップS205で、未処理の注目キーワードKnがあるか否かを判定する。未処理の注目キーワードKnがある場合、サイト管理端末1はステップS201の処理に戻る。
未処理の注目キーワードKnがない場合、サイト管理端末1は図9に示す置換キーワード設定処理を終了する。
図9に示す置換キーワード設定処理を実行することにより、注目キーワードKn一つ一つに対して同じ意味の語句や平易な語句、或いは見やすい語句の情報が置換キーワード設定としてキーワードDB53に記憶される。
勿論、注目キーワードKnによっては、同じ意味の語句、平易な語句、見やすい語句の全てが記憶される場合もあれば、その何れか二つが記憶される場合、何れか一つが記憶される場合もある。また、置換キーワードKrが設定されない注目キーワードKnもある。
[4−3.新着記事受信処理]
新着記事受信処理は、配信者端末3から通信ネットワーク2を介して配信されてくる新着記事NAを受信したことに応じて、該新着記事NAをユーザに提示するための処理を行う。この処理は、例えば、サイト管理端末1が記事管理部1aや分類処理部1cやキーワード決定部1eや置換処理部1fや提示情報生成部1gや提示部1iの機能を用いて実行するものである。
以下、図10及び図11を参照しながら説明する。
新着記事NAを受信したサイト管理端末1は、先ず図10に示すステップS301において、記事内容を解析する処理を行う。そして、サイト管理端末1はステップS302で新着記事NAの分類処理を行う。
記事内容解析処理は、新着記事NAを分類するための解析を行う処理である。例えば、新着記事の記事内容を形態素解析することにより、記事内容に含まれるキーワード等を抽出する。また、記事クラスタACごとに基本モデルを生成し、基本モデルと類似しているか否かを判定してもよい。基本モデルは、例えば、同じ記事クラスタACに属する記事の記事内容を教師データとしたディープラーニング(Deep Learning)を行うことによって生成することが可能である。
新着記事NAの分類処理では、解析内容に応じて新着記事NAを記事クラスタACに分類する処理である。新着記事NAに応じた適切な記事クラスタACがない場合には、分類処理において新たな記事クラスタACを生成してもよい。
サイト管理端末1は、ステップS303で、新着記事NAが属する記事クラスタACの注目キーワードKnを取得し、ステップS304で、新着記事NAの記事内容にそぐわない注目キーワードKnを除く処理を行う。
記事クラスタACには、多様なキーワードが注目キーワードKnとして設定されている。その中には、記事クラスタACに属する全ての記事に関連する注目キーワードKnもあれば、記事クラスタACに属する一部の記事に関連する注目キーワードKnもある。ステップS304の処理では、ステップS303で取得した注目キーワードKnから新着記事NAとは無関係の注目キーワードKnを除き、新着記事NAに関係のある注目キーワードKnのみを残す処理である。
サイト管理端末1はステップS305で、個人キーワード設定を行う。個人キーワード設定とは、個人個人のユーザが持っている制約情報の種別(制約条件)に応じた注目キーワードKnを設定する処理である。なお、個人キーワード設定処理では、注目キーワードKnから一つの注目キーワードKnを選択して個人キーワードKiとして設定するだけでなく、注目キーワードKnに基づいて他のキーワードを個人キーワードKiとして設定することもある。
具体的に、図11を参照して説明する。
個人キーワード設定処理において、サイト管理端末1はステップS401で、残った注目キーワードKnの優先順位を決定する処理を行う。
残った注目キーワードKnとは前述の処理で新着記事NAとは無関係の注目キーワードKnを除いた結果残った注目キーワードKnである。
優先順位は、例えば、新着記事NAの記事本文に出現する出現回数に応じて決定する。なお、これはあくまで一例であり、他の例も考えられる。例えば、同じ記事クラスタACに属する他の記事における出現頻度も考慮して優先順位を付けてもよい。また、新着記事NAの記事本文の結論部分に用いられた注目キーワードKnに高い優先度を付与してもよい。更には、関連記事が多く検索できるような注目キーワードKnに高い優先度を付与してもよい。他にも各種の例が考えられる。
サイト管理端末1はステップS402で、全ての制約条件についての対応済フラグを「OFF」に設定する処理を行う。
以降の処理では、制約情報の種別(「全盲」、「弱視」、「低語学力」など)に応じて注目キーワードKnや関連語を個人キーワードKiとして設定する処理を行う。「対応済フラグ」の情報は、制約条件ごとに個人キーワードKiの設定が行われたか否かを示すフラグ情報として用いられる。ここでは、全ての制約条件について個人キーワードKiの設定がまだ行われていないため、OFFとするものである。
サイト管理端末1はステップS403で、優先度の高い未処理の注目キーワードKnを一つ選択する。
サイト管理端末1はステップS404で、対応済フラグがOFFとされた制約条件を一つ選択し、ステップS405で、制約条件への対応が必要か否かを判定する処理を実行する。
例えば、ステップS404で選択した制約条件が「低語学力」であり、ステップS403で選択した注目キーワードKnが容易な語句のみで構成されている場合、「低語学力」という制約条件については対応不要と判定する。
選択した制約条件への対応が不要である場合、サイト管理端末1はステップS406で当該制約条件についての対応済フラグをONに設定する。
一方、対応が必要である場合、サイト管理端末1はステップS407で制約条件に対応する置換キーワードKrの有無を判定する。即ち、置換ワードDB54を検索し、制約条件及び注目キーワードKnに対応した置換キーワードKrの有無を判定する。
選択した制約条件及び注目キーワードKnに対応した置換キーワードKrが置換ワードDB54に記憶されている場合、サイト管理端末1はステップS408で置換キーワード取得処理を実行し、ステップS409で置換キーワードKrを該当の制約条件についての個人キーワードKiとして設定する。換言すれば、取得した置換キーワードKrを制約条件に該当するユーザの個人キーワードKiとして設定する。
サイト管理端末1はステップS410で当該制約条件についての対応済フラグをONに設定する。
一方、選択した制約条件及び注目キーワードKnに対応する置換キーワードKrが置換ワードDB54に記憶されていない場合、対応済フラグはOFFのままとし、サイト管理端末1は次の処理(ステップS411)へと遷移する。
ステップS411では、サイト管理端末1は未選択の制約条件があるか否かに応じて分岐する。未選択の制約条件がある場合、サイト管理端末1は再びステップS404の処理を実行する。即ち、制約情報の種類の数だけステップS404乃至ステップS410の各処理を実行する。
未選択の制約条件がない場合、サイト管理端末1はステップS412の処理へと進む。
ステップS412の処理を実行する段階においては、個人キーワードKiとしての置換キーワードKrが決定した制約条件と、置換キーワードKrが決定していない制約条件が共存した状態とされている場合がある。また、置換キーワードKrが決定していない制約条件には、置換キーワードKrが不要なもの(ステップS405で「N」と判定されたもの)と必要なものがある。置換キーワードKrが必要であるにも関わらず個人キーワードKiとしての置換キーワードKrが決定していない制約条件は、対応済フラグがOFF(未対応を意味する)とされている。
このような制約条件については、他の注目キーワードKnを用いて個人キーワードKiを設定することを考える。
ステップS412では、サイト管理端末1はステップS404乃至ステップS410の各処理で処理対象となった注目キーワードKnを処理済みに設定し、ステップS413の処理へ遷移する。
サイト管理端末1はステップS413で、全ての制約条件についての対応済フラグがONであるか否かを判定する。
全ての制約条件についての対応済みフラグがONである場合、制約情報を備えたそれぞれのユーザごとに適切な個人キーワード設定が行われたと見なし、図11に示す個人キーワード設定処理を終了する。
一方、対応済みフラグがOFFとされた制約条件がある場合、サイト管理端末1はステップS403の処理へ戻り未処理とされた注目キーワードKnのうち、優先度の高いものを更に一つ取得し、ステップS404乃至ステップS412の各処理を再度実行する。
図11の処理を実行することにより、制約条件ごとに個人キーワードKiが設定される。具体的な例を図12に示す。
制約条件がないユーザ(即ち制約情報が記憶されていないユーザ)には、注目キーワードKn00001が個人キーワードKiとして設定されている。また、「低語学力」であることが制約情報として記憶されたユーザについては、注目キーワードKn00001を置換した置換キーワードKr00001が個人キーワードKiとして設定されている。
また、「弱視」であることが制約情報として記憶されたユーザについては、注目キーワードKn00001では適切な個人キーワードKiが設定されず、次に優先度の高かった注目キーワードKn00003の置換キーワードKr00004が個人キーワードKiとして設定されている。
更に、「全盲」であることが制約情報として記憶されたユーザについては、注目キーワードKn00003が個人キーワードKiとして設定されている。
なお、ステップS401で注目キーワードKnごとに優先度を付与する例を説明したが、優先度を用いずに図11に示す個人キーワード設定処理を実行してもよい。例えば、ステップS403で注目キーワードKnからランダムに一つのキーワードを取得し、ステップS404以降の処理を行ってもよい。
これにより、同じような注目キーワードKnが個人キーワードKiとして設定されてしまうことを防止することができる。
図10の説明に戻る。
制約条件に応じた個人キーワードKiを設定した後、サイト管理端末1はステップS306で個人キーワードKiごとの提示情報を生成する。
提示情報としては、ステップS305で設定した個人キーワードKiそのものであってもよいし、個人キーワードKiに加えて、新着記事NAの記事内容の趣旨の情報(例えば人や会社など主語となり得る情報と、動詞などの述語となりうる情報)を提示情報として生成してもよい。
また、個人キーワードKiを含む記事見出し文SPを生成し、提示情報としてもよい。
サイト管理端末1はステップS307で提示情報の提示処理を行う。これにより、例えば記事見出し文SPを作成する作業者などに提示情報が提示される。
提示情報を提示された作業者は、記事見出し文SPを作成する作業を行う。具体的には、制約情報の種別ごとに記事見出し文SPを作成する。個人キーワードKiが提示情報として提示された場合には、個人キーワードKiを用いた記事見出し文SPを作成する。また、個人キーワードKiと主語述語が提示された場合には、それらの情報を用いて記事見出し文SPを作成する。更に、記事見出し文SPの候補が提示された場合には、その中から採用する記事見出し文SPを選択する作業を行う。なお、提示された記事見出し文SPを採用せずに作業者が一から記事見出し文SPを作成してもよい。
この場合であっても、新着記事NAの一部について提示された記事見出し文SPのうちの一つを選択するだけで済むことから、作業者の作業工数の削減が図られる。
なお、上述したように、制約情報の種別ごとに異なる記事見出し文SPを作成する必要はない。例えば、制約情報がないユーザに提示するために作成した記事見出し文SPが、他の制約情報を有したユーザに対しても適切である場合には、新着記事NAの記事見出し文SPはユーザによらず一つとなる。
なお、作業者に提示情報を提示する処理においては、作業者が提示情報に基づいて記事見出し文SPを生成する作業を行いやすいように、各種操作子や入力欄が設けられたウェブページ情報が提示されるように構成してもよい。
具体的には、提示情報(記事見出し文SPの候補や個人キーワードKiや記事内容の趣旨の情報など)が掲載されたウェブページ情報であって、編集を開始するためのボタンや、複数の記事見出し文SPの候補から一つを選択するためのラジオボタンや、個人キーワードKiを用いて記事見出し文SPを作成するための文章入力欄や、最終的に記事見出し文SPを決定するための編集完了ボタン等が設けられたウェブページ情報が作業者に提示される。
これにより、作業者の作業工数を削減することができる。
図10及び図11に示した処理と、作業者による記事見出し文SPの作成作業は、例えば、新着記事NAを受信してからユーザに記事を提示するまでに実行される。具体的には、ユーザ端末4から新着記事NAの記事見出し文SPが掲載されたウェブページの要求を受信する前に行われる。これによって、ユーザ端末4からウェブページ要求を受信した場合に、ユーザの制約情報に応じて既に用意されているいくつかの記事見出し文SPから一つを選択するだけで、ユーザ毎に適したウェブページが提供される。
[4−4.ウェブページ情報要求受信処理]
ユーザ端末4からウェブページ情報要求を受信した際にサイト管理端末1が実行する処理について、図13を参照して説明する。特に、ニュース掲載サイトにおける記事見出し文SPが掲載されたウェブページ情報の要求を受信した場合の例について説明する。
なお、この処理は、例えば、サイト管理端末1が記事管理部1aやウェブページ生成部1j、或いは、要求受信部1kや送信部1mの各機能を用いることにより実行される。
記事見出し文SPが掲載されたウェブページ情報の要求を受信したサイト管理端末1はステップS501で、ユーザ情報を取得する処理を行う。ここで取得するユーザ情報は、制約情報を含む。他にも、ユーザに適した広告情報を取得するためにユーザの閲覧履歴や購買履歴、或いは趣味嗜好の情報を取得してもよい。
サイト管理端末1はステップS502で、記事情報(記事IDや記事本文)と共に記事見出し文SPの情報を一つ取得する。
サイト管理端末1はステップS503で、記事見出し文SPに用いられる注目キーワードKnに関して、置換キーワードKrを使用するか否かを判定する。この判定は、ユーザの制約情報と記事見出し文SPに含まれる注目キーワードKnに基づいて行われる。
具体的には、ユーザ情報に制約情報がない場合には置換キーワードKrを使用しないとし、制約情報がある場合には置換キーワードKrを使用すると判定する。但し、制約情報を有したユーザであっても、注目キーワードKnを用いても問題がない場合には置換キーワードKrを使用しないと判定する。
例えば、「低語学力」とされたユーザについては注目キーワードKnの代わりに置換キーワードKrを用いるが、「全盲」や「弱視」とされたユーザについては注目キーワードKnをそのまま用いる場合などである。
サイト管理端末1はステップS504で、判定結果に応じた分岐処理を行う。置換キーワードKrを使用しない場合は、サイト管理端末1はステップS505で置換キーワードKrを用いずに注目キーワードKnをそのまま用いて作成された記事見出し文を選択する。この記事見出し文SPは、制約情報がないユーザ用に作成されたものであるが、前述のように、制約情報を有するユーザであっても注目キーワードKnをそのまま用いて問題がないユーザについても用いられる。
一方、置換キーワードKrを使用する場合は、サイト管理端末1はステップS506で置換キーワードKrを用いて作成された記事見出し文SPを選択する。このとき、ユーザの制約情報の種別に応じて適切な記事見出し文SPを選択する。
サイト管理端末1はステップS507で、未処理の記事見出し文SPの有無によって分岐する。
記事見出し文SPは、同じウェブページ上に複数設けられることが考えられる。例えば、10件分の新着記事NAの記事見出し文SPが掲載されるウェブページなどである。
そのような場合には、掲載される記事見出し文SPの数だけステップS502乃至ステップS506の各処理を行う必要がある。
ステップS507の分岐処理は、そのために実行されるものである。
未処理の記事見出し文SPがある場合、サイト管理端末1はステップS502の処理を再度実行する。
一方、未処理の記事見出し文SPがない場合、即ち、全ての記事見出し文SPについての処理を完了した場合、サイト管理端末1はステップS508でウェブページ生成処理を実行する。この処理では、これまでに選択した各記事見出し文SPをウェブページ上の所定位置に配置したウェブページ情報(HTMLなど)を生成する。
最後に、サイト管理端末1はステップS509で、ウェブページ情報の提示処理を行う。この処理に応じて、ウェブページ情報要求を行ったユーザ端末4の表示部(モニタ等)に記事見出し文SPが掲載されたウェブページが表示される。
<5.変形例>

[5−1.変形例1]
変形例1では、サイト管理端末1が記事見出し文SPの候補を作成すると共に、作成した記事見出し文SPが過去に掲載された記事見出し文SPと似ていないかを判定する処理を実行する。
記事の内容が異なるにも関わらず、記事見出し文SPが同じ(若しくは似ている)場合、ユーザは既に読んだことのある記事と誤認してしまい、新たな情報を得るための機会を損失してしまう虞がある。
そのために、新着記事NAの記事見出し文SPと過去に掲載済みの記事見出し文SPの類似判定を行うものである。
具体的に図14を参照して説明する。なお、図14に示す各処理のうち、図10を参照して説明した処理については、適宜説明を省略する。
サイト管理端末1は、ステップS301乃至S306を実行することにより、新着記事NAの記事内容に基づいた分類を行うと共に、分類された記事クラスタACに設定された注目キーワードの中から新着記事NAの記事内容に沿った注目キーワードKnを特定する。そして、該特定した注目キーワードKnに基づいて個人キーワードKiを設定する。個人キーワードKiは、前述のように、ユーザの制約情報の種別ごとに設定され得る。
個人キーワード設定処理を終えたサイト管理端末1は、ステップS320で、個人キーワードKiごとの記事見出し文を生成する。この処理では、個人キーワードKiを用いると共に、ステップS301で実行した記事内容解析処理によって取得した記事の主体(主語となり得るもの)や述語となり得る動詞などの語句を用いて記事見出し文SPを生成する。
サイト管理端末1はステップS321で、類似判定処理を行う。類似判定処理では、例えば、直近の所定期間(例えば1日や3日、或いは1週間や1ヶ月など)にウェブページに掲載された記事見出し文SPと、今回生成した新着記事NAの記事見出し文SPの比較を行い、似ているか否か(類似度の高低)を判定する。
サイト管理端末1はステップS322で、類似判定処理の処理結果に応じた分岐を行う。即ち、似ている(類似度が高い)と判定した場合は、サイト管理端末1はステップS320で再度記事見出し文の生成を行う。
一方、似ていない(類似度が低い)と判定した場合は、サイト管理端末1はステップS307へと進み記事見出し文SPを作業者に提示する処理を行う。
提示処理によって新着記事NAの記事見出し文SPの候補を提示された作業者は、例えば文章の微調整を行うのみで記事見出し文SPを完成させることができるため、作業工数の削減が図られる。特に、直近の所定期間に同じような記事見出し文SPを作成していないか確認する手間を削減できる。
なお、新着記事NAが他の記事の続報であるような一連の記事群に属している場合には、該一連の記事群の記事見出し文SPとの類似判定を行わなくてもよい。即ち、ステップS321の類似判定処理においては、一連の記事群以外の他の記事についての記事見出し文SPとの類似を判定すればよい。
なお、ステップS320乃至ステップS322の処理を何度か行ったにも関わらず、生成した記事見出し文SPが直近の所定期間の間に提示された記事見出し文SPと類似してしまった場合には、ステップS307で個人キーワードKiと記事内容の趣旨の情報(例えば人や会社など主語となり得る情報と、動詞などの述語となりうる情報)を提示する処理に切り換えてもよい。その場合には、記事見出し文SPを作成する作業者が提示情報を用いて記事作成を行う。この場合であっても、作業者は個人キーワードKiや記事内容の趣旨の情報が提示されるため、記事見出し文SPの作成工数の削減を図ることができる。
[5−2.変形例2]
ウェブページの特定の場所に掲載される記事見出し文SPには、文字数制限が設けられている場合がある。そのような場合にサイト管理端末1が行う処理について、図15を参照して説明する。
なお、図15に示すステップS301乃至ステップS305の各処理については、既述のため説明を省略する。
ユーザの制約情報の種別ごとに個人キーワードKiを設定した後、サイト管理端末1はステップS340で個人キーワードKiごとの記事見出し文SPを生成する処理を行う。この処理についても既述のため説明を省略する。
続いて、サイト管理端末1はステップS341で、新着記事NAの記事見出し文SPの文字数が所定文字数よりも大きいか否かを判定する。所定文字数よりも大きい場合には、サイト管理端末1はステップS340の記事見出し文生成処理を再度実行する。
一方、新着記事NAの記事見出し文SPの文字数が所定文字数以下である場合、サイト管理端末1はステップS307の処理へと進む。
ステップS341の判定処理は、ステップS340で生成した記事見出し文SPの数だけ実行される。これによって、所定文字数以下の記事見出し文SPが少なくとも一つは生成され、記事見出し文SPの作成作業の効率化が図られる。
なお、ステップS340及びステップS341の処理を何度か行ったにも関わらず、所定文字数以下の記事見出し文SPが生成できなかった場合には、ステップS307で個人キーワードKiと記事内容の趣旨の情報(例えば人や会社など主語となり得る情報と、動詞などの述語となりうる情報)を提示する処理に切り換えてもよい。その場合には、記事見出し文SPを作成する作業者が提示情報を用いて記事作成を行う。この場合であっても、作業者は個人キーワードKiや記事内容の趣旨の情報が提示されるため、記事見出し文SPの作成工数の削減を図ることができる。
なお、ユーザが全盲ユーザであり、音声出力によって記事見出し文SPをユーザに伝達する場合には、文字数制限の閾値である所定文字数を緩和することが考えられる。所定文字数は、ウェブページに配置される各コンテンツの所定の配置態様を守るための制限である。即ち、所定文字数よりも多い記事見出し文SPがウェブページに掲載されてしまうと、ウェブページ情報のレイアウトが崩れてしまい、掲載された各種の情報が見にくくなってしまう虞がある。そのために所定文字数の制限が設けられるものである。
しかし、ウェブページのレイアウトを認識できないユーザに対して音声出力で記事見出し文SPを伝達することを考えると、レイアウトの崩壊は考慮しなくていい場合が考えられる。そのような場合には、例えば所定文字数が15文字であるところを20文字や倍の30文字に緩和してもよい。但し、過度に長すぎる文章(例えば100文字の文章)を記事見出し文SPとして音声出力してしまうと、複数の記事見出し文SPの情報をユーザが獲得するために要する時間が長くなってしまうため、これも好ましくない。
[5−3.変形例3]
上述した各例では、サイト管理端末1が記事見出し文SPの候補を生成して提示するケースと、記事見出し文SPを作成するための個人キーワードKiを提示するケースの二つのパターンを説明した。
ここでは、その双方を組み合わせた場合について説明する。
例えば、日中の時間帯においては、サイト管理端末1は個人キーワードKiと記事内容の趣旨の情報を提示情報として作業者に提示する構成とし、記事見出し文SPは作業者が作成するようにする。そして、夜間の時間帯においては、サイト管理端末1は記事見出し文SPの候補を生成して提示情報として作業者に提示する構成とし、作業者はその中から選択するだけで済むようにする。
これにより、日中の時間帯は、作業者の工数を多少消費して、記事見出し文SPの作成を行うと共に、夜間の時間帯は、作業者の工数を極力削減して、記事見出し文SPの作成を行うことができる。
また、日中の時間帯に作業者の工数を消費して作成した記事見出し文SPに基づいてサイト管理端末1が機械学習を行うことにより、注目キーワードKnの設定や個人キーワードKiの設定に作業者の方針を反映させることができる。
なお、一部の記事見出し文SPの作成においては、サイト管理端末1が提示情報の作成を行わず、完全な手動による記事見出し文SPの作成を行ってもよい。このようにして手動で作成された記事見出し文SPに基づいて機械学習を行うことにより、作業者の記事見出し文SPの方針をより反映させることが可能となる。
<6.まとめ>

上記の各例で説明したように、サイト管理端末1としての情報処理装置は、配信記事を受信し新着記事NAとして管理する記事管理部1aと、新着記事NAを記事クラスタACに分類する分類処理部1cと、記事クラスタACに属する閲覧数の多い人気記事の記事見出し文SPから取得したキーワードに基づいて人気記事が属する記事クラスタACの注目キーワードKnを管理する注目キーワード管理部1dと、ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理部1bと、新着記事NAの記事クラスタACと新着記事NAの記事内容と制約情報と注目キーワードKnに基づいてユーザごとに適切な個人キーワードKiを決定するキーワード決定部1eと、個人キーワードKiを用いて新着記事NAの記事見出し文SP生成のための提示情報を生成する提示情報生成部1gと、を備えている。
記事内容に即した記事見出し文SPを手動で作成することは、非常に大きな工数が必要となる。本構成によれば、記事クラスタACごとに注目キーワードKnが管理されると共に、注目キーワードKnを用いて記事内容に即した提示情報が生成される。提示情報としては、例えば、記事見出し文SPに使えそうなキーワードの候補や、記事見出し文SPの候補などである。
これによって、記事見出し文SPの作成に要する工数の大幅な削減を図ることができる。特に、記事クラスタACごとの注目キーワードKnを用いることで、ユーザに興味を持たせることが可能なクリック誘因性の高い記事見出し文を作成するための提示情報を生成することができる。
図10を参照して説明したように、キーワード決定部1eは、注目キーワードKnから記事クラスタACに応じた第1キーワード(記事クラスタACに設定された注目キーワードKn)を選択する第1選択処理(ステップ303)と、第1キーワードから新着記事ACの記事内容に応じて第2キーワード(記事内容にそぐわない注目キーワードKnを排除したもの)を選択する第2選択処理(ステップS304)と、第2キーワードから制約情報に応じて個人キーワードKiを選択する第3選択処理(ステップS305)と、を行うものである。
即ち、新着記事NAに応じた適切な記事クラスタACの注目キーワードKnを第1キーワードとして選択し、その中から、新着記事NAの記事内容に応じた適切なキーワードを第2キーワードとして選択し、更にその中から、記事を閲覧するユーザごとの制約情報に応じて適切なキーワードを個人キーワードKiとして選択し決定する。従って、決定された個人キーワードKiは、新着記事NAの記事クラスタACに適切であり、且つ記事内容に沿ったものであり、更に、ユーザの制約情報を加味したものとなる。
以上のような具体的な処理を実行することにより、ユーザの状況・環境に応じた適切な記事見出し文SPを提供することができる。
変形例3で説明したように、キーワード決定部1eは、新着記事NAにおける一部の記事について個人キーワードKiの決定を行い、提示情報生成部1gは、一部の記事についての提示情報を生成してもよい。
即ち、新着記事NA全てについて提示情報が生成されるのではなく、一部の新着記事NAについて提示情報が生成される。
即ち、他の一部の新着記事NAについては、作業者による手動の記事見出し文作成が行われる。情報処理装置(サイト管理端末1)は、この手動の記事見出し文SPを学習することにより、記事見出し文SPに使われやすい注目キーワードKnを継続的にアップデートすることができる。従って、最近話題のキーワードや流行のキーワードが注目キーワードKnとして加えられ、自動で記事見出し文生成のための提示情報を生成する場合に、人の目を引きやすいクリック誘因性の高い提示情報を生成することができる。
新着記事受信処理で説明したように、記事見出し文SPを生成するための操作が可能な状態で提示情報を提示する提示部1iを備えていてもよい。
例えば、いくつかの記事見出し文SPの候補が掲載されると共に、候補から一つを選択することができるインタフェースを備えたウェブページが作業者に提示される。また、選択した一つの記事見出し文候補を編集できるようなインタフェースも設けられ、作業者は簡易的な操作で、記事見出し文SPを完成させることができる。
従って、記事見出し文SPの作成に係る作業工数の削減に寄与することができる。
また、記事見出し文SPを生成するためのパーツとして、新着記事NAに適したいくつかの注目キーワードKnが掲載されたウェブページであって、それらのキーワードを元に記事見出し文SPを作成できるような編集が可能なインタフェースが設けられたウェブページが作業者に提示されてもよい。
変形例2などで説明したように、提示情報生成部1gは、提示情報として所定以内の文字数で構成された記事見出し文SPを生成してもよい。
これにより、記事見出し文SPを決定する作業者は、自動で生成された記事見出し文SPの候補から一つを選択するだけでよい。
従って、作業効率の著しい向上が図られる。
また、記事見出し文SPの候補が一つである場合には、一つを選択する作業すら不要となり、更なる作業効率の改善が図られる。
なお、上述したように、記事見出し文SPの候補から選択した一つの記事見出し文SPの編集が可能とされていてもよい。これによって、作業効率の向上と適切な記事見出し文SPの生成の両立が図られる。
変形例1などで説明したように、直近の所定期間内に掲載された記事見出し文SPと提示情報生成部1gが生成した記事見出し文SPとの類似を判定する類似判定部1hを備え、提示情報生成部1gは、類似判定部1hが類似と判定した場合に、提示情報としての記事見出し文SPを再生成するように構成してもよい。
類似判定部1hが設けられることにより、記事見出し文SP同士の類似/非類似が判定可能とされる。
即ち、異なる記事で既に使われた記事見出し文SPと似たような記事見出し文SPが生成されてしまうことを防止することができる。これにより、記事が既に見た事がある記事であると誤認されてしまい記事が閲覧されない虞を排除し、記事の閲覧可能性を高めることができる。
ユーザDB51の説明において触れたように、制約情報は、ユーザの言語能力に関する情報とされていてもよい。
例えば日本語の能力が高い人と低い人について、同じ記事見出し文SPを用いてしまうと、記事見出し文SPを目にしたユーザが推定した記事内容に相違が出てしまう場合や、そもそも記事内容の推定ができない場合が生じる。この構成によれば、そういった事態に対応するために、言語能力の高低(即ち低語学力ユーザであるか否か)に応じた注目キーワードKnが個人キーワードKiとして決定される。
従って、言語能力に応じた記事見出し文SPを生成することが可能となる。
ユーザDB51の説明において触れたように、制約情報は、ユーザの視覚障害に関する情報とされていてもよい。
例えば、全盲である視覚障害者は、記事見出し文SPや記事本文の情報を音声で取得することが考えられる。そのような状況で相応しくない注目キーワードKnとして、例えば同音異義語がある。本構成によれば、同音異義語のような適していない語句を避け、他の語句を用いて提示情報が生成される。
従って、視覚障害者にとっても利便性の高い記事見出し文SP生成のための環境を提供することができる。また、様々な人々に利用可能とされることで、公益性の高いシステムを提供することができる。
新着記事受信処理で説明したように、制約情報に基づいて、注目キーワードKnの置換処理(ステップS407及びステップS408の処理)を行う置換処理部1fを備え、キーワード決定部1eは、置換処理によって得られたキーワードを個人キーワードKiとして決定してもよい。
注目キーワードKnが一部のユーザにとって適切でない場合、そのユーザに対しては他の注目キーワードKnが個人キーワードKiとして決定されてもよいが、本構成によれば、それ以外の手段を用いて当該ユーザに適切な記事見出し文生成のための提示情報が生成される。
即ち、選択された注目キーワードKn(個人キーワード)と同じ意味を持つ他の代替キーワード(置換キーワードKr)が個人キーワードKiとして設定され、該個人キーワードKiを用いて提示情報生成が行われる。従って、当該一部のユーザにとっても最適な記事見出し文Spの生成を行うことができる。
ウェブページ情報要求受信処理(図13)の例で説明したように、端末装置(ユーザ端末4)からのウェブページ要求を受信する要求受信部1kと、記事が属する記事クラスタACと、記事の記事内容と、端末装置(ユーザ端末4)を使用するユーザの制約情報と、に基づいて設定されたユーザごとの記事見出し文SPを取得し、ユーザごとの記事見出し文SPが掲載されるウェブページの情報を生成するウェブページ生成部1jと、生成されたウェブページの情報を端末装置(ユーザ端末4)に送信する送信部1mと、を備えていてもよい。
ユーザが記事見出し文SPが掲載されたウェブページを閲覧した場合に、ユーザの制約情報(例えば、低語学ユーザであるか否かの情報や視覚障害を有したユーザであるか否かを示す情報)に基づいて設定されたユーザに特化した記事見出し文SPがユーザに提示される。これによって、ユーザは、自身の制約情報に基づいて設定された適切な記事見出し文SPを閲覧(或いは視聴、聴取も含むが、ここではそれらを含めて「閲覧」と記載する)することができるため、記事見出し文SPを適切に理解することができると共に、記事本文の内容を適切に予測することが可能となる。即ち、誤った予測によって閲覧したくない記事詳細の情報を閲覧してしまう可能性を低減させることができる。これによって、ユーザが無為に時間を浪費してしまうことを防止し、効率のよい情報収集が可能となる。
上記した各種の構成及び処理は、それぞれ適宜組み合わせることが可能である。
<7.プログラム及び記憶媒体>

実施の形態のプログラムは、サイト管理端末1の演算処理装置(CPU等)に各種の処理を実行させるプログラムである。
実施の形態のプログラムは、配信記事を受信し新着記事として管理する記事管理機能を演算処理装置に実行させる。
また、新着記事を記事クラスタに分類する分類処理機能を演算処理装置に実行させる。
更に、記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理機能を演算処理装置に実行させる。
更にまた、ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理機能を演算処理装置に実行させる。
加えて、新着記事の記事クラスタと新着記事の記事内容と制約情報と注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定機能を演算処理装置に実行させる。
そして、個人キーワードを用いて新着記事の記事見出し文生成のための提示情報を生成する提示情報生成機能を演算処理装置に実行させる。
即ちこのプログラムは、情報処理装置の演算処理装置に対して図8乃至図11、図13乃至図15の各図に示す処理を実行させるプログラムである。
また、実施温形態のプログラムは、端末装置からのウェブページ要求を受信する要求受信機能を演算処理装置に実行させる。
更に、記事が属する記事クラスタと、前記記事の記事内容と、前記端末装置を使用するユーザの制約情報と、に基づいて設定されたユーザごとの記事見出し文を取得し、前記ユーザごとの記事見出し文が掲載されるウェブページの情報を生成するウェブページ生成機能を演算処理装置に実行させる。
そして、前記生成されたウェブページの情報を前記端末装置に送信する送信機能を演算処理装置に実行させる。
即ちこのプログラムは、情報処理装置の演算処理装置に対して図13に示す処理を実行させるプログラムである。
このようなプログラムにより、上述したサイト管理端末1としての1または複数の情報処理装置を実現できる。
そしてこのようなプログラムはコンピュータ装置等の機器に内蔵されている記憶媒体としてのHDDや、CPUを有するマイクロコンピュータ内のROM等に予め記憶しておくことができる。あるいはまた、半導体メモリ、メモリカード、光ディスク、光磁気ディスク、磁気ディスクなどのリムーバブル記憶媒体に、一時的あるいは永続的に格納(記憶)しておくことができる。またこのようなリムーバブル記憶媒体は、いわゆるパッケージソフトウェアとして提供することができる。
また、このようなプログラムは、リムーバブル記憶媒体からパーソナルコンピュータ等にインストールする他、ダウンロードサイトから、LAN、インターネットなどのネットワークを介してダウンロードすることもできる。
1 サイト管理端末、1a 記事管理部、1b ユーザ情報管理部、1c 分類処理部、1d 注目キーワード管理部、1e キーワード決定部、1f 置換処理部、1g 提示情報生成部、1h 類似判定部、1i 提示部、1j ウェブページ生成部、2 通信ネットワーク、3 配信社端末、4 ユーザ端末、50 記事DB、51 ユーザDB、52 クラスタDB、53 キーワードDB、54 置換ワードDB

Claims (16)

  1. 配信記事を受信し新着記事として管理する記事管理部と、
    前記新着記事を記事クラスタに分類する分類処理部と、
    記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて前記人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理部と、
    ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理部と、
    前記新着記事の記事クラスタと前記新着記事の記事内容と前記制約情報と前記注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定部と、
    前記個人キーワードを用いて前記新着記事の記事見出し文生成のための提示情報を生成する提示情報生成部と、を備えた
    情報処理装置。
  2. 前記キーワード決定部は、
    前記注目キーワードから前記記事クラスタに応じた第1キーワードを選択する第1選択処理と、前記第1キーワードから前記新着記事の記事内容に応じて第2キーワードを選択する第2選択処理と、前記第2キーワードから前記制約情報に応じて前記個人キーワードを選択する第3選択処理と、を行う
    請求項1に記載の情報処理装置。
  3. 前記キーワード決定部は、前記新着記事における一部の記事について前記個人キーワードの決定を行い、
    前記提示情報生成部は、前記一部の記事についての提示情報を生成する
    請求項1に記載の情報処理装置。
  4. 記事見出し文を生成するための操作が可能な状態で前記提示情報を提示する提示部を備えた
    請求項1に記載の情報処理装置。
  5. 前記提示情報生成部は、前記提示情報として所定以内の文字数で構成された記事見出し文を生成する
    請求項1に記載の情報処理装置。
  6. 直近の所定期間内に掲載された記事見出し文と前記提示情報生成部が生成した記事見出し文との類似を判定する類似判定部を備え、
    前記提示情報生成部は、前記類似判定部が類似と判定した場合に、前記提示情報としての記事見出し文を再生成する
    請求項5に記載の情報処理装置。
  7. 前記制約情報は、ユーザの言語能力に関する情報とされた
    請求項1に記載の情報処理装置。
  8. 前記制約情報は、ユーザの視覚障害に関する情報とされた
    請求項1に記載の情報処理装置。
  9. 前記制約情報に基づいて、前記注目キーワードの置換処理を行う置換処理部を備え、
    前記キーワード決定部は、前記置換処理によって得られたキーワードを前記個人キーワードとして決定する
    請求項1に記載の情報処理装置。
  10. 配信記事を受信し新着記事として管理する記事管理ステップと、
    前記新着記事を記事クラスタに分類する分類処理ステップと、
    記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて前記人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理ステップと、
    ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理ステップと、
    前記新着記事の記事クラスタと前記新着記事の記事内容と前記制約情報と前記注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定ステップと、
    前記個人キーワードを用いて前記新着記事の記事見出し文生成のための提示情報を生成する提示情報生成ステップと、を
    情報処理装置が実行する情報処理方法。
  11. 配信記事を受信し新着記事として管理する記事管理機能と、
    前記新着記事を記事クラスタに分類する分類処理機能と、
    記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて前記人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理機能と、
    ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理機能と、
    前記新着記事の記事クラスタと前記新着記事の記事内容と前記制約情報と前記注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定機能と、
    前記個人キーワードを用いて前記新着記事の記事見出し文生成のための提示情報を生成する提示情報生成機能と、を
    コンピュータに実行させるプログラム。
  12. 配信記事を受信し新着記事として管理する記事管理機能と、
    前記新着記事を記事クラスタに分類する分類処理機能と、
    記事クラスタに属する閲覧数の多い人気記事の記事見出し文から取得したキーワードに基づいて前記人気記事が属する記事クラスタの注目キーワードを管理する注目キーワード管理機能と、
    ユーザについての制約情報を含むユーザ情報を管理するユーザ情報管理機能と、
    前記新着記事の記事クラスタと前記新着記事の記事内容と前記制約情報と前記注目キーワードに基づいてユーザごとに適切な個人キーワードを決定するキーワード決定機能と、
    前記個人キーワードを用いて前記新着記事の記事見出し文生成のための提示情報を生成する提示情報生成機能と、を
    コンピュータに実行させるプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
  13. 端末装置からのウェブページ要求を受信する要求受信部と、
    一つの記事について、記事内容と該記事が属する記事クラスタとに基づく注目キーワードの設定と、前記注目キーワードに対する置換キーワードが設定され、前記注目キーワードを含む第1の記事見出し文及び前記置換キーワードを含む第2の記事見出し文が生成されている場合に、前記要求を行ったユーザの制約条件に基づいて前記第1の記事見出し文及び前記第2の記事見出し文の何れを使用するかが選択され、選択された記事見出し文が掲載されるウェブページの情報を生成するウェブページ生成部と、
    前記生成されたウェブページの情報を前記端末装置に送信する送信部と、を備えた
    情報処理装置。
  14. 端末装置からのウェブページ要求を受信する要求受信ステップと、
    一つの記事について、記事内容と該記事が属する記事クラスタとに基づく注目キーワードの設定と、前記注目キーワードに対する置換キーワードが設定され、前記注目キーワードを含む第1の記事見出し文及び前記置換キーワードを含む第2の記事見出し文が生成されている場合に、前記要求を行ったユーザの制約条件に基づいて前記第1の記事見出し文及び前記第2の記事見出し文の何れを使用するかが選択され、選択された記事見出し文が掲載されるウェブページの情報を生成するウェブページ生成ステップと、
    前記生成されたウェブページの情報を前記端末装置に送信する送信ステップと、を
    情報処理装置が実行する情報処理方法。
  15. 端末装置からのウェブページ要求を受信する要求受信機能と、
    一つの記事について、記事内容と該記事が属する記事クラスタとに基づく注目キーワードの設定と、前記注目キーワードに対する置換キーワードが設定され、前記注目キーワードを含む第1の記事見出し文及び前記置換キーワードを含む第2の記事見出し文が生成されている場合に、前記要求を行ったユーザの制約条件に基づいて前記第1の記事見出し文及び前記第2の記事見出し文の何れを使用するかが選択され、選択された記事見出し文が掲載されるウェブページの情報を生成するウェブページ生成機能と、
    前記生成されたウェブページの情報を前記端末装置に送信する送信機能と、を
    コンピュータに実行させるプログラム。
  16. 端末装置からのウェブページ要求を受信する要求受信機能と、
    一つの記事について、記事内容と該記事が属する記事クラスタとに基づく注目キーワードの設定と、前記注目キーワードに対する置換キーワードが設定され、前記注目キーワードを含む第1の記事見出し文及び前記置換キーワードを含む第2の記事見出し文が生成されている場合に、前記要求を行ったユーザの制約条件に基づいて前記第1の記事見出し文及び前記第2の記事見出し文の何れを使用するかが選択され、選択された記事見出し文が掲載されるウェブページの情報を生成するウェブページ生成機能と、
    前記生成されたウェブページの情報を前記端末装置に送信する送信機能と、を
    コンピュータに実行させるプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
JP2019506537A 2018-07-12 2018-07-12 情報処理装置、情報処理方法、プログラム、記憶媒体 Active JP6533354B1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/026306 WO2020012595A1 (ja) 2018-07-12 2018-07-12 情報処理装置、情報処理方法、プログラム、記憶媒体

Publications (2)

Publication Number Publication Date
JP6533354B1 true JP6533354B1 (ja) 2019-06-19
JPWO2020012595A1 JPWO2020012595A1 (ja) 2020-07-16

Family

ID=66934350

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019506537A Active JP6533354B1 (ja) 2018-07-12 2018-07-12 情報処理装置、情報処理方法、プログラム、記憶媒体

Country Status (2)

Country Link
JP (1) JP6533354B1 (ja)
WO (1) WO2020012595A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112417149B (zh) * 2020-11-11 2024-03-19 北京工业大学 一种基于多任务学习的标题生成方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109743A (ja) * 1999-08-26 2001-04-20 Internatl Business Mach Corp <Ibm> フォーマット駆動の構文的文書トランスコーディング・フレームワークに意味的特性を組み込むためのシステムおよび方法
JP2006031476A (ja) * 2004-07-16 2006-02-02 Sony Corp 電子機器装置、サーバ装置、Webページ処理方法及びそのプログラム
JP2008234338A (ja) * 2007-03-20 2008-10-02 Nec Corp 旬度解析システム、旬度解析方法、及び旬度解析プログラム
JP2018013876A (ja) * 2016-07-19 2018-01-25 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109743A (ja) * 1999-08-26 2001-04-20 Internatl Business Mach Corp <Ibm> フォーマット駆動の構文的文書トランスコーディング・フレームワークに意味的特性を組み込むためのシステムおよび方法
JP2006031476A (ja) * 2004-07-16 2006-02-02 Sony Corp 電子機器装置、サーバ装置、Webページ処理方法及びそのプログラム
JP2008234338A (ja) * 2007-03-20 2008-10-02 Nec Corp 旬度解析システム、旬度解析方法、及び旬度解析プログラム
JP2018013876A (ja) * 2016-07-19 2018-01-25 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Also Published As

Publication number Publication date
WO2020012595A1 (ja) 2020-01-16
JPWO2020012595A1 (ja) 2020-07-16

Similar Documents

Publication Publication Date Title
US11106744B2 (en) Search engine
US11042590B2 (en) Methods, systems and techniques for personalized search query suggestions
US9183515B2 (en) Share box for endorsements
US20170300535A1 (en) Systems and methods for suggesting content to a writer based on contents of a document
US20150193502A1 (en) Generating activities based upon social data
US20170351778A1 (en) Methods and systems for managing bookmarks
US10402479B2 (en) Method, server, browser, and system for recommending text information
EP2955686A9 (en) Automatic article enrichment by social media trends
US20160004774A1 (en) Information recommendation method and apparatus and information recommendation system
US11080287B2 (en) Methods, systems and techniques for ranking blended content retrieved from multiple disparate content sources
US20130144869A1 (en) Trending
US11899728B2 (en) Methods, systems and techniques for ranking personalized and generic search query suggestions
JPWO2011138830A1 (ja) 電子書籍システムおよびコンテンツサーバ
US20190378428A1 (en) Programmable interface for automated learning refreshers
US11048771B1 (en) Method and system for providing organized content
CN101176052A (zh) 将信息与电子文档关联
JP2014026614A (ja) 検索・情報表示システム
Sundaramoorthy et al. Newsone—an aggregation system for news using web scraping method
US11836169B2 (en) Methods, systems and techniques for providing search query suggestions based on non-personal data and user personal data according to availability of user personal data
US20170098283A1 (en) Methods, systems and techniques for blending online content from multiple disparate content sources including a personal content source or a semi-personal content source
WO2016162843A1 (en) Processing a search query and retrieving targeted records from a networked database system
US11651039B1 (en) System, method, and user interface for a search engine based on multi-document summarization
CN103927381A (zh) 一种是非问题的处理方法及装置
US20170098144A1 (en) Method and system for generating a card based on intent
WO2017062245A1 (en) Method and system for dynamically generating a card

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190206

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190206

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190319

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190523

R150 Certificate of patent or registration of utility model

Ref document number: 6533354

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250