JP2012256204A - 記事配信システム、記事配信方法、サーバ及びプログラム - Google Patents

記事配信システム、記事配信方法、サーバ及びプログラム Download PDF

Info

Publication number
JP2012256204A
JP2012256204A JP2011128890A JP2011128890A JP2012256204A JP 2012256204 A JP2012256204 A JP 2012256204A JP 2011128890 A JP2011128890 A JP 2011128890A JP 2011128890 A JP2011128890 A JP 2011128890A JP 2012256204 A JP2012256204 A JP 2012256204A
Authority
JP
Japan
Prior art keywords
article
search
character
priority
search word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011128890A
Other languages
English (en)
Other versions
JP5793976B2 (ja
Inventor
Nagisa Fuchigami
なぎさ 渕上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2011128890A priority Critical patent/JP5793976B2/ja
Publication of JP2012256204A publication Critical patent/JP2012256204A/ja
Application granted granted Critical
Publication of JP5793976B2 publication Critical patent/JP5793976B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】電子雑誌に適した検索が可能な記事配信システム等を提供する。
【解決手段】ユーザが、事検索の為の検索語を入力すると(S11)、サーバ3は、検索語を含む見開きページを検索する(S12)。また、サーバ3は、検索語を含む見開きページを1つずつ特定し(S13)、文字デザイン情報に基づき、見開きページ単位で合算ポイントを算出する(S14)。そして、サーバ3は、合算ポイントに基づいて記事単位の優先度を算出し(S16)、優先度に従って検索語を含む記事の提示順序を決定し、記事の検索結果を提示する(S17)。
【選択図】図11

Description

本発明は、電子雑誌を記事単位に配信する記事配信システム等に関するものである。
現在、PC、携帯電話端末、タブレット端末などによって閲覧可能な電子書籍が普及し始めている。市販されている電子書籍は、コミックや文芸書の他に、雑誌も増え始めている。雑誌は、複数の記事で構成されていることから、電子雑誌として販売する場合、これまで1冊単位だった販売単位を記事単位で販売することも考えられる。更に、記事単位の配信を行う場合、膨大な記事の集合から、ユーザに興味のある記事のみをピックアップさせて、パッケージ化して配信する仕組みなどが必要になる。
従来の文書検索の仕組みとしては、例えば、非特許文献1、特許文献1〜3などが挙げられる。
非特許文献1では、検索対象を新聞記事とし、単語の共起情報を用いて、tf-idf(Term Frequency - Inverse Document Frequency)法の重み付けを行い、テキスト検索の精度を上げることが記載されている。
特許文献1では、検索対象を一般文書とし、tf-idf(Term Frequency - Inverse Document Frequency)法のチューニングの仕組みが記載されている。
特許文献2では、検索対象を取扱説明書とし、操作手順などの説明情報の情報タイプや出現位置に基づいて、ユーザの質問に対して適切な箇所を提示する仕組みが記載されている。
特許文献3では、検索対象を一般文書とし、単語の種類や、文書内における出現順序を示す出現パターンに基づき、入力された検索キーワードの関連キーワードを提示する仕組みが記載されている。
特許文献4では、検索対象を一般文書とし、文字列の外見的な特徴(太字、下線など)の有無に基づいて、検索対象に含まれるキーワードを抽出する仕組みが記載されている。
特許文献5では、検索対象を一般文書とし、太字、斜め文字、下線、背景色等の強調属性の有無に基づいて、検索対象に含まれる重要語を決定する仕組みが記載されている。
特開2004−206631号公報 特開2006−48605号公報 特開2009−169651号公報 特開平06−274551号公報 特開2003−196294号公報
清田 陽司, 黒橋 禎夫 ,中村 順一, 工藤 拓,「単語の共起情報による重みづけを用いたテキスト検索システム」, IREXワークショップ予稿集, IREX実行委員会, pp. 53-56, September, 1999.
しかしながら、非特許文献1や特許文献1〜3を含めた従来技術のように、単語の出現位置、出現回数、種別に基づく検索では、雑誌の記事に対して高い検索精度を得ることができない。なぜなら、例えば女性のファッション雑誌などは、画像を中心とした紙面作りがなされ、キャッチコピーのようなタイトルや文章が多い為、新聞記事、取扱説明書、専門書などの文書とは異なる性質があるからである。
また、特許文献4、5を含めた従来技術のように、外見的な特徴や強調属性の有無から自動的にキーワードなどを抽出しても、キーワードを含む文書同士の優先順位を付けることができず、雑誌の記事検索においては問題となる。なぜなら、記事検索では検索結果が膨大となり、ユーザは検索結果の全てを確認することができない為、検索結果の提示順序が重要となるからである。
つまり、雑誌の記事検索では、前述した雑誌の特徴を考慮して、検索語を含む記事の優先順位を決めることが重要となる。
検索精度を上げる為に、記事の特徴をメタデータとして付与し、メタデータを検索することも考えられる。しかし、人間が1つずつ記事の内容を理解したうえでメタデータを付与する必要があり、人的負荷が高い。尚、メタデータを付与する作業を自動化すると、従来技術と同様、検索精度は上がらない。
本発明は、前述した問題点に鑑みてなされたもので、その目的とすることは、人的負荷をかけることなく、電子雑誌に適した検索が可能な記事配信システム等を提供することである。
前述した目的を達成するために第1の発明は、ユーザ端末とサーバとから構成され、電子雑誌を記事単位に配信する記事配信システムであって、前記ユーザ端末は、検索語を入力する入力手段、を具備し、前記サーバは、前記電子雑誌を記事単位に記憶する記憶手段と、前記検索語を含む記事について、前記検索語の文字デザイン情報に基づいて、優先度を算出する算出手段と、前記優先度に従って前記検索語を含む記事の提示順序を決定し、検索結果を提示する提示手段と、を具備することを特徴とする記事配信システムである。第1の発明によって、人的負荷をかけることなく、電子雑誌に適した検索が可能となる。
第1の発明における前記算出手段は、前記文字デザイン情報ごとのポイントが定められたポイント表を予め有し、前記検索語を含む単一ページ及び/又は見開きページを検索し、前記検索語を含む単一ページ及び/又は見開きページごとに、前記ポイント表に基づいて、前記検索語の文字デザイン情報に対する前記ポイントを加減算することによって、前記検索語を含む単一ページ及び/又は見開きページごとの合算ポイントを算出し、前記合算ポイントに基づいて、前記優先度を算出する。これによって、優先度を自動的に算出することが可能となる。
また、例えば、第1の発明における前記算出手段は、前記検索語を含む記事が複数の前記検索語を含む単一ページ及び/又は見開きページを有する場合、前記合算ポイントの最大値を、前記優先度とする。この算出手段によれば、ある単一のテーマの記事の中に、見開きページ(又は単一ページ)ごとにサブテーマがあるような雑誌の場合、高い検索精度が得られる。
また、例えば、第1の発明における前記算出手段は、前記検索語を含む記事が複数の前記検索語を含む単一ページ及び/又は見開きページを有する場合、前記合算ポイントの合計値を、前記優先度とする。この算出手段によれば、ある単一のテーマの記事の中に含まれる複数の見開きページ(又は単一ページ)の内容が一貫している雑誌の場合、高い検索精度が得られる。
また、第1の発明における前記文字デザイン情報は、文字サイズを含み、前記記憶手段は、記事の本文の前記文字サイズを記憶し、前記算出手段は、前記検索語の前記文字サイズと、前記検索語を含む記事の本文の前記文字サイズとを比較することによって、前記優先度を算出する。これによって、検索語を含む文字列が、製作者が強調したい情報を示している場合には優先度を高く算出し、製作者が強調したい情報を示していない場合には優先度を低く算出することができる。特に、文字サイズは定量的な情報であることから、記事の提示順序を決める為の指標に向いていると言える。
また、第1の発明における前記文字デザイン情報は、文字色及び/又は文字スタイルを含み、前記算出手段は、前記文字色及び/又は前記文字スタイルに基づいて、前記優先度を算出する。これによって、検索語を含む文字列が、製作者が強調したい情報を示している場合には優先度を高く算出し、製作者が強調したい情報を示していない場合には優先度を低く算出することができる。特に、文字色や文字スタイルは、製作者が意図的に変更することが多いので、製作者の意図を優先度に反映させることができると言える。
第2の発明は、ユーザ端末と、前記電子雑誌を記事単位に記憶する記憶手段を具備するサーバとから構成され、電子雑誌を記事単位に配信する記事配信システムにおける記事配信方法であって、前記ユーザ端末が、検索語を入力するステップと、前記サーバが、前記検索語を含む記事について、前記検索語の文字デザイン情報に基づいて、優先度を算出するステップと、前記優先度に従って前記検索語を含む記事の提示順序を決定し、検索結果を提示するステップと、を含むことを特徴とする記事配信方法である。これによって、人的負荷をかけることなく、電子雑誌に適した検索が可能となる。
第3の発明は、ユーザ端末と接続され、電子雑誌を記事単位に配信する記事配信サーバであって、前記電子雑誌を記事単位に記憶する記憶手段と、前記ユーザ端末から受信する検索語を含む記事について、前記検索語の文字デザイン情報に基づいて、優先度を算出する算出手段と、前記優先度に従って前記検索語を含む記事の提示順序を決定し、検索結果を提示する提示手段と、具備することを特徴とする記事配信サーバである。これによって、第1の発明の記事配信システムを構築し、第2の発明の記事配信方法を実行することができる。
第4の発明は、コンピュータを、電子雑誌を記事単位に記憶する記憶手段と、ユーザ端末から受信する検索語を含む記事について、前記検索語の文字デザイン情報に基づいて、優先度を算出する算出手段と、前記優先度に従って前記検索語を含む記事の提示順序を決定し、検索結果を提示する提示手段と、して機能させるためのプログラムである。第4の発明のプログラムを汎用のコンピュータにインストールすることによって、第3の発明の記事配信サーバを得ることができる。
本発明により、人的負荷をかけることなく、電子雑誌に適した検索が可能な記事配信システム等を提供することができる。
記事Aを示す模式図 記事Bを示す模式図 記事Cを示す模式図 記事配信システムの概要図 サーバのハードウエア構成図 記事Aに含まれるオブジェクトのデザイン情報を示す図 記事Bに含まれるオブジェクトのデザイン情報を示す図 記事Cに含まれるオブジェクトのデザイン情報を示す図 記事データベースの構築処理を示すフローチャート 記事データベースの1例を示す図 記事配信処理を示すフローチャート 記事検索画面の1例を示す模式図 ポイント表の1例を示す図
以下図面に基づいて、本発明の実施形態を詳細に説明する。最初に、図1〜図3を参照しながら、本発明の実施形態が解決しようとしている技術的課題の具体例について説明する。
図1〜図3は、いずれも、女性向けファッション雑誌に含まれる記事の1例である。図1〜図3に示すように、女性向けファッション雑誌などの記事は、見開きページによって構成されることが多い。各見開きページのDTP(DeskTop Publishing)データは、画像やテキストなどのオブジェクトが複数配置されることによって、構成されている。DTPデータは複数のレイヤから構成されており、一部のオブジェクトは重ねて配置されることもある。図1〜図3に示す記事A〜記事Cは、あるテーマに絞った特集記事である。
図1に示す記事Aは、カジュアル服のシャツの特集記事である。A4及びA9は画像のオブジェクトであり、それ以外はテキストのオブジェクトである。A1は記事のタイトルであり、具体的な文字列は“「カジュアル」を着こなす術”である。図1には示していないが、A4及びA9の画像は、例えば、屋外にて撮影されたものであり、画像の構図は、シャツを着こなしたモデルの全身である。テキストオブジェクト(A1〜A3、A5〜A8)は、画像オブジェクト(A4、A9)に重ねて配置されている。
記事Aのように、女性向けのファッション雑誌などは、読者の注意を引くように、訴求性のある文章をタイトルとすることが多い。その為、シャツの特集であるにも関わらず、シャツの単語が含まれていないことがある。例えば、検索語「シャツ」に対して、検索語が記事のタイトルに含まれているか否かを判定指標(出現位置を判定指標)として検索結果を提示する場合、記事Aが検索結果に含まれないことになってしまう。しかし、前述の通り、記事Aはカジュアル服のシャツを集めた特集記事であるから、記事Aが検索結果に含まれる方が正しい。
図2に示す記事Bは、ウエストラインの特集記事である。B3、B5、B8、B10、B12及びB14は画像のオブジェクトであり、それ以外はテキストのオブジェクトである。B1は記事のタイトルであり、具体的な文字列は“「ウエストマークでアピールするXライン&Yライン”である。図2には示していないが、B3、B5、B8、B10、B12及びB14の画像は、例えば、ブルーバックを用いてスタジオにて撮影されたものであり、画像の構図は、シャツ、スカート、ベルトなどを着こなしたモデルの全身となっており、特に、モデルのウエスト周辺が強調されている。テキストオブジェクト(B1、B2、B4、B6、B7、B9、B11、B13、B15)は、画像オブジェクト(B3、B5、B8、B10、B12、B14)に重ねて配置されていない。
記事Bの場合、シャツを着ているモデルが多く、テキストオブジェクト内に「シャツ」の文字列が多くなっている(B4、B6、B11、B15の4箇所)。例えば、検索語「シャツ」に対して、記事のタイトル、本文など全てのテキストを対象とした検索語の出現回数を判定指標として検索結果を提示する場合、記事Bが検索結果の上位になってしまう。しかし、前述の通り、記事Bはウエストラインの特集記事であるから、検索結果に含まれないことが正しい。
図3に示す記事Cは、夏服の特集記事である。C3、C6、C8、C9、C12、C14、C15及びC18は画像のオブジェクトであり、それ以外はテキストのオブジェクトである。C1は記事のタイトルであり、具体的な文字列は“必勝夏スタイル”である。図3には示していないが、C3、C6及びC8の画像は、例えば、屋外にて撮影され、背景と共に切り抜かれたものであり、画像の構図は、ロンパース、シャツなどを着こなしたモデルの全身である。また、C9、C10、C12、C14、C15及びC18の画像は、例えば、スタジオや店舗にて撮影されたものであり、画像の構図は、ロンパース、シャツなどの衣服のみである。C2のテキストオブジェクトは、C6及びC8の画像オブジェクトに重ねて配置されている。
記事Cの場合、夏服として、シャツの画像がいくつか含まれている(C6、C14、C16の3箇所)。例えば、検索語「シャツ」に対して、検索語が記事のタイトルに含まれているか否かを判定指標(出現位置を判定指標)として検索結果を提示する場合、記事Cが検索結果に含まれないことになってしまう。また、例えば、検索語「シャツ」に対して、記事のタイトル、本文など全てのテキストを対象とした検索語の出現回数を判定指標として検索結果を提示する場合、記事Cが検索結果の上位になってしまう。しかし、前述の通り、記事Cは夏服の特集記事であることから、検索結果の中位〜下位となることが正しい。
このように、女性向けのファッション雑誌などは、従来と同じように、検索語の出現位置、出現回数等に基づく文字列検索を行うだけでは、記事のテーマを正しく判定することができず、的外れの検索結果となってしまう。そこで、本発明の実施形態では、後述するように、検索語の文字デザイン情報を判定指標として検索結果を提示する。文字デザイン情報とは、文字サイズ、文字色、文字スタイルなどである。更に、文字スタイルは、文字フォント(ゴシック体、明朝体など)、文字バリエーション(太字、斜字、標準など)、文字装飾(網掛、下線、傍点など)の有無などである。
次に、図4〜図13を参照しながら、本発明の実施形態について説明する。図4は、記事配信システムの概要図である。記事配信システム1は、例えば、サーバ3、ユーザ端末5及び製作者端末7が、ネットワーク9を介して接続されることによって構成される。尚、製作者端末7は必須ではなく、製作者がサーバ3を直接操作しても良い。
サーバ3は、電子雑誌を記事単位に記憶する。また、サーバ3は、ユーザ端末5から受信する検索語を含む記事について、検索語の文字デザイン情報に基づいて優先度を算出する。そして、サーバ3は、優先度に従って検索語を含む記事の提示順序を決定し、ユーザ端末5に検索結果を提示する。
ユーザ端末5は、ユーザの指示に従って、検索語を入力し、サーバ3に送信する。また、ユーザ端末5は、サーバ3から検索結果を受信し、表示する。
製作者端末7は、サーバ3に電子雑誌を記憶させる際、製作者の指示に従って、必要な情報を入力する。また、製作者端末7は、サーバ3の保守作業(設定ファイルの変更など)にも用いられる。
図5は、サーバ3を実現するコンピュータのハードウエア構成図である。尚、図5のハードウエア構成は一例であり、用途、目的に応じて様々な構成を採ることが可能である。
サーバ3を実現するコンピュータは、制御部11、記憶部12、メディア入出力部13、通信制御部14、入力部15、表示部16、周辺機器I/F部17等が、バス18を介して接続される。
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等で構成される。CPUは、記憶部12、ROM、記録媒体等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス18を介して接続された各装置を駆動制御し、サーバ3が行う後述する処理を実現する。ROMは、不揮発性メモリであり、コンピュータのブートプログラムやBIOS等のプログラム、データ等を恒久的に保持している。RAMは、揮発性メモリであり、記憶部12、ROM、記録媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部11が各種処理を行う為に使用するワークエリアを備える。
記憶部12は、例えば、HDD(Hard Disk Drive)であり、制御部11が実行するプログラム、プログラム実行に必要なデータ、OS(Operating System)等が格納される。プログラムに関しては、OSに相当する制御プログラムや、後述する処理をコンピュータに実行させるためのアプリケーションプログラムが格納されている。これらの各プログラムコードは、制御部11により必要に応じて読み出されてRAMに移され、CPUに読み出されて各種の手段として実行される。
メディア入出力部13(ドライブ装置)は、データの入出力を行い、例えば、CDドライブ(−ROM、−R、−RW等)、DVDドライブ(−ROM、−R、−RW等)等のメディア入出力装置を有する。通信制御部14は、通信制御装置、通信ポート等を有し、コンピュータとネットワーク9間の通信を媒介する通信インタフェースであり、ネットワーク9を介して、他のコンピュータ間との通信制御を行う。ネットワーク9は、有線、無線を問わない。
入力部15は、データの入力を行い、例えば、キーボード、マウス等のポインティングデバイス、テンキー等の入力装置を有する。入力部15を介して、コンピュータに対して、操作指示、動作指示、データ入力等を行うことができる。表示部16は、CRTモニタ、液晶パネル等のディスプレイ装置、ディスプレイ装置と連携してコンピュータのビデオ機能を実現するための論理回路等(ビデオアダプタ等)を有する。尚、入力部15及び表示部16は、タッチパネルディスプレイのように、一体となっていても良い。
周辺機器I/F(インタフェース)部17は、コンピュータに周辺機器を接続させるためのポートであり、周辺機器I/F部17を介してコンピュータは周辺機器(イメージスキャナ、複合機等)とのデータの送受信を行う。周辺機器I/F部17は、USBやIEEE1394やRS−232C等で構成されており、通常複数の周辺機器I/Fを有する。周辺機器との接続形態は有線、無線を問わない。バス18は、各装置間の制御信号、データ信号等の授受を媒介する経路である。
ユーザ端末5及び製作者端末7のハードウエア構成も、サーバ3のハードウエア構成と同様である。また、コンピュータは、いわゆるPC(Personal Computer)に限らず、携帯電話端末、タブレット端末なども含む。
図6〜図8は、記事A〜記事Cに含まれるオブジェクトのデザイン情報を示す図である。本発明の実施形態では、電子雑誌に対応する紙雑誌のDTPデータ、又は電子雑誌自体のDTPデータを有することを前提とする。図6〜図8に示すように、DTPデータには、オブジェクトの種類や、オブジェクトがテキストの場合には文字サイズ、文字色、文字装飾などの情報が含まれている。尚、図6〜図8には示していないが、DTPデータには、オブジェクトの配置位置に関する情報も含まれている。
例えば、図6では、図1の記事Aに含まれるオブジェクトA1〜A9の情報が図示されている。オブジェクトA1の種類は「タイトル(題号)」、文字サイズは「24pt」、文字色は「赤」、文字装飾は「Bold(太字)、Gothic(ゴシック)」である。また、オブジェクトA2の種類は「キャプション(画像の説明文)」、文字サイズは「20pt」、文字色は「黒」、文字装飾は「Bold(太字)」である。また、オブジェクトA3の種類は「本文」、文字サイズは「8pt」、文字色は「黒」、文字装飾は「なし」である。また、オブジェクトA4の種類は「画像」である。
オブジェクトの種類に関する情報は内部的なデータである。そして、電子雑誌の製作者に内部的なデータを正確に入力させることは、雑誌デザインと無関係の作業に時間を費やすことになり、好ましくない。そこで、本発明の実施形態では、後述するように、オブジェクトの種類に関する情報を利用することはない。図6〜図8にオブジェクトの種類を図示した理由は、図1〜図3を補足して説明する為である。
以下では、図1〜図3及び図6〜図8に示す具体的な例を参照しながら、本発明の実施形態の動作について説明する。
図9は、記事データベースの構築処理を示すフローチャートである。記事データベースの構築処理は、後述する図11の記事配信処理に対する前処理である。記事データベースの構築処理では、サーバ3と製作者端末7とが対話的に処理を行う。
図9に示すように、サーバ3の制御部11は、例えば、製作者が製作者端末7の入力部15を介して指定した紙雑誌のDTPデータを入力し(S1)、DTPデータから記事ごとの電子雑誌データに変換する(S2)。サーバ3の制御部11は、S2において記事単位の電子雑誌データを生成し、生成された電子雑誌データごとに(記事ごとに)、後述するS3〜S6の処理を実行する。
DTPデータは、例えば、InDesign(登録商標)のソフトウエアを利用して作成されたデータ等である。また、電子雑誌データは、例えば、PDF(Portable Document Format)データ、EPUB(内部的にはXHTML(Extensible HyperText Markup Language)ファイルとCSS(Cascading Style Sheets)ファイル等を含む。)データ、XMDF(ever-eXtending
Mobile Eocument Format)データ等である。例えば、InDesign(登録商標)には、紙雑誌のDTPデータからEPUBデータを作成する「EPUBフォーマット変換機能」がある。また、本発明の実施形態では、後述するように、オブジェクトの位置情報を利用しないことから、ウエブにおけるXHTMLファイルとCSSファイルなどの組合せにも適用することができる。
次に、サーバ3の制御部11は、記事を1つ特定し(S3)、記事の本文の文字サイズを特定し(S4)、1件分の記事を記事データベースに登録する(S5)。そして、サーバ3の制御部11は、全ての記事について登録処理が終了したか否かを判定し(S6)、終了していない場合(S6のNo)にはS3から処理を繰返し、全て終了している場合(S6のYes)には処理を終了する。
本文の文字サイズの特定処理は、製作者が製作者端末7の入力部15等を介して入力するか、サーバ3の制御部11が所定条件に従って本文の文字サイズを決定するか、のいずれかである。
サーバ3の制御部11が決定する場合の所定条件は、例えば、以下が挙げられる。
・S3において特定された記事において、採用されている文字の数が最も多い文字サイズ
・S3において特定された記事において、最小の文字サイズ
・雑誌ごとに予め定められた文字サイズ(例えば、雑誌Xは「10pt」、雑誌Yは「12pt」など。)
図10は、記事データベースの1例を示す図である。図10に示すように、記事データベース21には、記事ごとに書誌情報や本文の文字サイズなどが登録される。図10に示す例では、記事を一意に識別する為の記事IDと、雑誌名、号、出版社などの書誌情報と、本文の文字サイズと、電子雑誌データのファイル名とが示されている。書誌情報や電子雑誌データのファイル形式については、図10に示す例に限られるものではない。
例えば、記事IDが「A」のデータは、図1に示す記事Aに対応しており、雑誌名が「雑誌D」、号が「2011年5月」、出版社が「○○社」、本文の文字サイズが「8pt」、ファイル名が「A.epub」である。同様に、記事IDが「B」、「C」のデータは、それぞれ、図2、図3に示す記事B、記事Cに対応している。
図11は、記事配信処理を示すフローチャートである。記事配信処理は、ユーザがピックアップした記事をパッケージ化して配信する処理である。記事配信処理では、サーバ3とユーザ端末5とが対話的に処理を行う。
以下では、電子雑誌の記事が全て見開きページによって構成されているものとして説明するが、当然ながら、電子雑誌の記事の一部又は全部が単一ページによって構成されている場合についても同様に適用することができる。
ユーザが、ユーザ端末5の入力部15を介して、記事検索の為の検索語を入力すると(S11)、ユーザ端末5の制御部11は、入力された検索語をサーバ3に送信する。サーバ3の制御部11は、検索語を受信すると、検索語を含む見開きページを検索する(S12)。
図12は、記事検索画面の1例を示す模式図である。図12に示すように、記事検索画面23は、例えば、以下の画面項目が含まれる。
・検索語を入力する為のテキストボックス
・検索処理の実行を指示する為の検索ボタン
・検索結果のリスト表示
・検索結果を選択する為のチェックボックス
・購入処理の実行を指示する為の購入ボタン
・処理の終了を指示する為のキャンセルボタン
図12に示す例では、S12において、ユーザが、ユーザ端末5の入力部15を介して、テキストボックスに検索語「シャツ」を入力し、検索ボタンを押下したことを示している。これに対して、サーバ3の制御部11は、ユーザ端末5から検索語を受信し、検索処理を開始する。
図11の説明に戻る。次に、サーバ3の制御部11は、検索語を含む見開きページを1つ特定し(S13)、文字デザイン情報と出現状況に基づき、見開きページ単位でポイント、サブポイントを算出する(S14)。
サブポイントは、ポイントの合算ポイントが同一となった場合、どちらの優先度を高くするかを判定する為に用いられる。尚、出現状況に基づくポイントや、サブポイントの算出は、必須ではない。
図13は、ポイント表の1例を示す図である。図13に示すように、ポイント表25は、文字デザイン情報ごとのポイントが定められたものであり、例えば、以下の項目が含まれる。
・文字サイズ
記事データベース21に登録されている本文の文字サイズと、検索語の文字サイズとを比較する。本文より小さい場合、−(マイナス){検索語のサイズ/本文のサイズ}p(ポイント)とする。本文と同じ場合、0pとする。本文より大きい場合、+(プラス){検索語のサイズ/本文のサイズ}pとする。
一般に、本文の文字サイズよりも大きい文字は、製作者が強調したい情報を示すことが多い為、上記のようにポイントを加算する。一方、本文の文字サイズよりも小さい文字は、注意書きや参考情報など、製作者が強調したい情報を示していないことが多い為、上記のようにポイントを減算する。
・文字色、文字装飾
検索語の文字色が白又は黒、かつ、網掛なしの場合、0pとする。検索語の文字色が白又は黒、かつ、網掛ありの場合、+1pとする。検索語の文字色が白及び黒以外の場合、+1pとする。或いは、検索語の文字色が白及び黒以外の場合、各色によって異なるポイントを設定しても良い。
一般に、文字色が白や黒などの文字は、製作者が強調したい情報を示していないことが多い為、上記のようにポイントを加算しない。但し、網掛などの文字装飾が付されている場合、上記のようにポイントを加算する。一方、文字色が白及び黒以外の文字は、製作者が強調したい情報を示すことが多い為、上記のようにポイントを加算する。
・文字フォント(Gothic)
検索語の文字フォントがGothic(ゴシック体)の場合、+1pとする。検索語の文字フォントがGothic以外の場合、0pとする。或いは、検索語の文字フォントによって異なるポイントを設定しても良い。
一般に、Gothicは読み易く、かつ、存在感があることから、Gothicの文字は、製作者が強調したい情報を示すことが多い為、上記のようにポイントを加算する。一方、Gothic以外の文字は、製作者が強調したい情報を示していないことが多い為、上記のようにポイントを加算しない。
・文字バリエーション(Bold)
検索語の文字バリエーションがBold(太字)の場合、+1pとする。検索語の文字バリエーションがBold以外の場合、0pとする。
一般に、Boldの文字は、製作者が強調したい情報を示すことが多い為、上記のようにポイントを加算する。一方、Bold以外の文字は、製作者が強調したい情報を示していないことが多い為、上記のようにポイントを加算しない。
・文字バリエーション(Italic)
検索語の文字バリエーションがItalic(斜字)の場合、−1pとする。検索語の文字バリエーションがItalic以外の場合、0pとする。
一般に、Italicの文字は、注意書きや参考情報など、記事のテーマと直接関係がない情報を示すことが多い為、上記のようにポイントを減算する。一方、Italic以外の文字は、上記のようにポイントを減算しない。
・出現状況
1回だけ出現する文字の文字色が白及び黒以外の場合、+1pとする。1回だけ出現する文字の文字色が白又は黒の場合、ポイントを0p、サブポイントを+1pとする。複数回出現する文字の文字色が白及び黒以外の場合、ポイントを0P、サブポイントを+{出現回数}pとする。複数回出現する文字の文字色が白又は黒の場合、ポイントを0pとする。
白及び黒以外の文字が1回だけ出現する場合、製作者が強調したい情報を示すことが多い為、上記のようにポイントを加算する。一方、白及び黒以外の文字が複数回出現する場合、製作者が強調したい情報を示していないことが多い為、上記のようにポイントを加算しない。サブポイントについては、従来の技術と同様、出現回数に応じて加算する。
検索語を「シャツ」とし、図1〜図3、図6〜図8、図10に示した記事A〜記事Cの例について、図13に示すポイント表25に従って、ポイント、サブポイントを算出すると、以下の通りとなる。
<記事A>
(1)「シャツ」を含むオブジェクト・・・A2、A5、A7(図1参照)
(2)本文の文字サイズ・・・8pt(図10参照)
(3)A2について
・文字サイズ・・・A2の文字サイズは20ptであり(図6参照)、本文より大きいことから、+20/8=+2.5p
・文字色、文字装飾・・・A2の文字色は黒であり、網掛なしであることから(図6参照)、0p
・文字フォント(Gothic)・・・A2の文字フォントはGothicではないことから(図6参照)、0p
・文字バリエーション(Bold)・・・A2の文字バリエーションはBoldであることから(図6参照)、+1p
・文字バリエーション(Italic)・・・A2の文字バリエーションはItalicではないことから(図6参照)、0p
(4)A5について(結果のみ記載する。)
・文字サイズ・・・+15/8≒+1.9p(小数第2位を四捨五入)
・文字色、文字装飾・・・+1p
・文字フォント(Gothic)・・・0p
・文字バリエーション(Bold)・・・+1p
・文字バリエーション(Italic)・・・0p
(5)A7について(結果のみ記載する。)
・文字サイズ・・・+20/8=+2.5p
・文字色、文字装飾・・・+0p
・文字フォント(Gothic)・・・0p
・文字バリエーション(Bold)・・・+1p
・文字バリエーション(Italic)・・・0p
(6)出現状況について
・A2の文字色は黒であり、白又は黒の文字が1回だけ出現する場合に該当するから、ポイントが0p、サブポイントが+1p
・A5の文字色は赤であり、白及び黒以外の文字が1回だけ出現する場合に該当するから、ポイントが+1p
・A7の文字色は白であり、白又は黒の文字が1回だけ出現する場合に該当するから、ポイントが0p、サブポイントが+1p
(7)ポイント、サブポイントの合算ポイント
・ポイントの合算ポイント・・・2.5+1+1.9+1+1+2.5+1+1=+11.9p
・サブポイントの合算ポイント・・・+2p
<記事B>(結果のみ記載する。)
(1)「シャツ」を含むオブジェクト・・・B4、B6、B11、B15(図2参照)
(2)本文の文字サイズ・・・8pt(図10参照)
(3)B4のポイント・・・0p
(4)B6のポイント・・・0p
(5)B11のポイント・・・0p
(6)B15のポイント・・・0p
(7)出現状況のポイント、サブポイント・・・+0p、+4p
(8)ポイント、サブポイントの合算ポイント・・・+0p、+4p
<記事C>(結果のみ記載する。)
(1)「シャツ」を含むオブジェクト・・・C5、C13、C16(図3参照)
(2)本文の文字サイズ・・・8pt(図10参照)
(3)C5のポイント・・・1.5+1+1=3.5p
(4)C13のポイント・・・1.5+1+1=3.5p
(5)C16のポイント・・・1.5+1+1=3.5p
(6)出現状況のポイント、サブポイント・・・0p、+3p
(7)ポイント、サブポイントの合算ポイント・・・+10.5p、+3p
尚、図13に示すポイント表25は1例であり、様々な変形例が考えられる。ポイント表25は、検索語の文字デザイン情報ごとにポイントが設定されるものであれば良く、例えば、ジャンル、出版社、雑誌などに区別して、それぞれ異なるポイント表25をサーバ3の記憶部12に記憶させても良い。また、ポイント表25は、例えば、設定ファイルとして、プログラムから独立させ、製作者やシステム管理者などが容易に変更可能に構成することが望ましい。
図11の説明に戻る。次に、サーバ3の制御部11は、検索語を含む全ての見開きページについて算出処理が終了したか否か確認する(S15)。サーバ3の制御部11は、終了していない場合(S15のNo)、S13から処理を繰返し、全て終了している場合(S15のYes)、S16に進む。
次に、サーバ3の制御部11は、記事単位の優先度を算出する(S16)。
図1〜図3、図6〜図8、図10に示した記事A〜記事Cの例について、優先度を算出すると、以下の通りとなる。
・優先度1位・・・記事A(+11.9p)
・優先度2位・・・記事C(+10.5p)
・優先度3位・・・記事B(+0p)
ところで、一般に、記事は複数の見開きページ(又は単一ページ)を有する。複数の見開きページ(又は単一ページ)ごとに算出されたポイントの合算ポイントに基づいて、記事単位の優先度を算出する方法は、例えば、以下の2通りが考えられる。
(1)検索語を含む見開きページ(又は単一ページ)ごとの合算ポイントの最大値を、優先度とする。
(1)の算出方法では、ある単一のテーマの記事の中に、見開きページ(又は単一ページ)ごとにサブテーマがあるような雑誌の場合、高い検索精度が得られる。例えば、女性向けのファッション雑誌であれば、記事のテーマが「カジュアル」、1つ目の見開きページのサブテーマが「シャツ」、2つ目の見開きページのサブテーマが「バッグ」、3つ目の見開きページのサブテーマが「靴」などのような紙面構成が考えられる。
(2)検索語を含む見開きページ(又は単一ページ)ごとの合算ポイントの合計値を、優先度とする。
(2)の算出方法では、ある単一のテーマの記事の中に含まれる複数の見開きページ(又は単一ページ)の内容が一貫している雑誌の場合、高い検索精度が得られる。例えば、車やカメラなどの専門雑誌であれば、ある単一のテーマ(例えば、「電気自動車」、「一眼レフカメラ」など)の記事の中に含まれる全ての見開きページを一貫して同一の内容とする紙面構成が考えられる。
(1)、(2)の算出方法のどちらを採用するかについては、ポイント表25と同様、例えば、ジャンル、出版社、雑誌などによって変更しても良い。また、ユーザが、ユーザ端末5の入力部15を介して指定できるように構成しても良い。
次に、サーバ3の制御部11は、優先度に従って検索語を含む記事の提示順序を決定し、記事の検索結果を提示する(S17)。具体的には、サーバ3の制御部11は、例えば、優先度の順位の通り、記事の提示順序を決定し、所定の順位までの記事を検索結果として、ユーザ端末5に送信する。これに対して、ユーザ端末5の制御部11は、検索結果を表示部16に表示する。
図12に示す例では、S17において、ユーザ端末5が、検索結果として以下の4つの記事を表示したことを示している。
・雑誌D 2011年5月 「カジュアル」を着こなす術
・雑誌E 2011年4月 必勝夏スタイル
・雑誌F 2011年×月 ○○○○○○○
・雑誌G 2011年×月 ○○○○○○○
図11の説明に戻る。次に、ユーザが、ユーザ端末5の入力部15を介して、所望する記事を選択すると(S18)、サーバ3の制御部11は、課金処理を行い、選択された記事をパッケージ化して配信する(S19)。
図12に示す例では、S18において、ユーザが、上位2つの記事を選択したことを示している。更に、ユーザが、購入ボタンを押下すると、サーバ3は、課金処理を行い、選択された2つの記事をパッケージ化して、ユーザ端末5に送信する。
以上、本発明の実施の形態では、サーバ3は、ユーザによって入力される検索語の文字デザイン情報に基づいて優先度を算出し、優先度に従って検索語を含む記事の提示順序を決定し、検索結果を提示する。これによって、人的負荷をかけることなく、電子雑誌に適した検索が可能となる。
以上、添付図面を参照しながら、本発明に係る記事配信システム等の好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
1………記事配信システム
3………サーバ
5………ユーザ端末
7………製作者端末
9………ネットワーク
21………記事データベース
23………記事検索画面
25………ポイント表

Claims (9)

  1. ユーザ端末とサーバとから構成され、電子雑誌を記事単位に配信する記事配信システムであって、
    前記ユーザ端末は、
    検索語を入力する入力手段、
    を具備し、
    前記サーバは、
    前記電子雑誌を記事単位に記憶する記憶手段と、
    前記検索語を含む記事について、前記検索語の文字デザイン情報に基づいて、優先度を算出する算出手段と、
    前記優先度に従って前記検索語を含む記事の提示順序を決定し、検索結果を提示する提示手段と、
    を具備することを特徴とする記事配信システム。
  2. 前記算出手段は、
    前記文字デザイン情報ごとのポイントが定められたポイント表を予め有し、
    前記検索語を含む単一ページ及び/又は見開きページを検索し、
    前記検索語を含む単一ページ及び/又は見開きページごとに、前記ポイント表に基づいて、前記検索語の文字デザイン情報に対する前記ポイントを加減算することによって、前記検索語を含む単一ページ及び/又は見開きページごとの合算ポイントを算出し、
    前記合算ポイントに基づいて、前記優先度を算出する
    ことを特徴とする請求項1に記載の記事配信システム。
  3. 前記算出手段は、前記検索語を含む記事が複数の前記検索語を含む単一ページ及び/又は見開きページを有する場合、前記合算ポイントの最大値を、前記優先度とする
    ことを特徴とする請求項2に記載の記事配信システム。
  4. 前記算出手段は、前記検索語を含む記事が複数の前記検索語を含む単一ページ及び/又は見開きページを有する場合、前記合算ポイントの合計値を、前記優先度とする
    ことを特徴とする請求項2に記載の記事配信システム。
  5. 前記文字デザイン情報は、文字サイズを含み、
    前記記憶手段は、記事の本文の前記文字サイズを記憶し、
    前記算出手段は、前記検索語の前記文字サイズと、前記検索語を含む記事の本文の前記文字サイズとを比較することによって、前記優先度を算出する
    ことを特徴とする請求項1乃至請求項4のいずれかに記載の記事配信システム。
  6. 前記文字デザイン情報は、文字色及び/又は文字スタイルを含み、
    前記算出手段は、前記文字色及び/又は前記文字スタイルに基づいて、前記優先度を算出する
    ことを特徴とする請求項1乃至請求項5のいずれかに記載の記事配信システム。
  7. ユーザ端末と、前記電子雑誌を記事単位に記憶する記憶手段を具備するサーバとから構成され、電子雑誌を記事単位に配信する記事配信システムにおける記事配信方法であって、
    前記ユーザ端末が、検索語を入力するステップと、
    前記サーバが、前記検索語を含む記事について、前記検索語の文字デザイン情報に基づいて、優先度を算出するステップと、
    前記優先度に従って前記検索語を含む記事の提示順序を決定し、検索結果を提示するステップと、
    を含むことを特徴とする記事配信方法。
  8. ユーザ端末と接続され、電子雑誌を記事単位に配信する記事配信サーバであって、
    前記電子雑誌を記事単位に記憶する記憶手段と、
    前記ユーザ端末から受信する検索語を含む記事について、前記検索語の文字デザイン情報に基づいて、優先度を算出する算出手段と、
    前記優先度に従って前記検索語を含む記事の提示順序を決定し、検索結果を提示する提示手段と、
    を具備することを特徴とする記事配信サーバ。
  9. コンピュータを、
    電子雑誌を記事単位に記憶する記憶手段と、
    ユーザ端末から受信する検索語を含む記事について、前記検索語の文字デザイン情報に基づいて、優先度を算出する算出手段と、
    前記優先度に従って前記検索語を含む記事の提示順序を決定し、検索結果を提示する提示手段と、
    して機能させるためのプログラム。
JP2011128890A 2011-06-09 2011-06-09 記事配信システム、記事配信方法、サーバ及びプログラム Expired - Fee Related JP5793976B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011128890A JP5793976B2 (ja) 2011-06-09 2011-06-09 記事配信システム、記事配信方法、サーバ及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011128890A JP5793976B2 (ja) 2011-06-09 2011-06-09 記事配信システム、記事配信方法、サーバ及びプログラム

Publications (2)

Publication Number Publication Date
JP2012256204A true JP2012256204A (ja) 2012-12-27
JP5793976B2 JP5793976B2 (ja) 2015-10-14

Family

ID=47527711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011128890A Expired - Fee Related JP5793976B2 (ja) 2011-06-09 2011-06-09 記事配信システム、記事配信方法、サーバ及びプログラム

Country Status (1)

Country Link
JP (1) JP5793976B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018200721A (ja) * 2018-08-28 2018-12-20 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09114860A (ja) * 1995-10-20 1997-05-02 Fuji Xerox Co Ltd データ検索方法及び装置
JP2001060165A (ja) * 1999-08-20 2001-03-06 Nec Corp 情報セット重要度判定システム及びその判定方法、及び情報セット重要度判定プログラムを記録した記録媒体
JP2002117068A (ja) * 2000-10-12 2002-04-19 Hideki Sakakino 雑誌情報提供システム
US6449616B1 (en) * 1996-10-11 2002-09-10 Walker Digital, Llc Methods and apparatus for distributing supplemental information related to printed articles
JP2004265097A (ja) * 2003-02-28 2004-09-24 Tokyo Inst Of Technol プレゼンテーション資料検索システムおよびその方法並びにプログラム
JP2007080014A (ja) * 2005-09-15 2007-03-29 Fujifilm Corp 画像評価装置および方法並びにプログラム
JP2008171302A (ja) * 2007-01-15 2008-07-24 Nippon Telegr & Teleph Corp <Ntt> アウトライン生成装置、アウトライン生成方法およびアウトライン生成プログラム
JP2010152862A (ja) * 2008-11-27 2010-07-08 I Business Center:Kk 文章体特定装置およびコンピュータに文章体を特定させるためのプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09114860A (ja) * 1995-10-20 1997-05-02 Fuji Xerox Co Ltd データ検索方法及び装置
US6449616B1 (en) * 1996-10-11 2002-09-10 Walker Digital, Llc Methods and apparatus for distributing supplemental information related to printed articles
JP2001060165A (ja) * 1999-08-20 2001-03-06 Nec Corp 情報セット重要度判定システム及びその判定方法、及び情報セット重要度判定プログラムを記録した記録媒体
JP2002117068A (ja) * 2000-10-12 2002-04-19 Hideki Sakakino 雑誌情報提供システム
JP2004265097A (ja) * 2003-02-28 2004-09-24 Tokyo Inst Of Technol プレゼンテーション資料検索システムおよびその方法並びにプログラム
JP2007080014A (ja) * 2005-09-15 2007-03-29 Fujifilm Corp 画像評価装置および方法並びにプログラム
JP2008171302A (ja) * 2007-01-15 2008-07-24 Nippon Telegr & Teleph Corp <Ntt> アウトライン生成装置、アウトライン生成方法およびアウトライン生成プログラム
JP2010152862A (ja) * 2008-11-27 2010-07-08 I Business Center:Kk 文章体特定装置およびコンピュータに文章体を特定させるためのプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018200721A (ja) * 2018-08-28 2018-12-20 ヤフー株式会社 生成装置、生成方法、及び生成プログラム
JP7044665B2 (ja) 2018-08-28 2022-03-30 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Also Published As

Publication number Publication date
JP5793976B2 (ja) 2015-10-14

Similar Documents

Publication Publication Date Title
US8356248B1 (en) Generating context-based timelines
US8862574B2 (en) Providing a search-result filters toolbar
US7203675B1 (en) Methods, systems and data structures to construct, submit, and process multi-attributal searches
US20090070321A1 (en) User search interface
US9069826B2 (en) Information provision system, information provision system control method, information provision device, program, and information recording medium
US20130262968A1 (en) Apparatus and method for efficiently reviewing patent documents
WO2019226312A1 (en) Ai model canvas
US9245045B2 (en) Aggregating missing bibliographic information in a collaborative environment
US10885488B2 (en) System for accessing business metadata within a distributed network
JP5424798B2 (ja) メタデータ設定方法及びメタデータ設定システム、並びにプログラム
JP2007265031A (ja) 辞書コンテンツ処理装置、コンテンツ表示システムおよびコンテンツ表示方法
Anderson et al. Pro business applications with silverlight 4
Hearst et al. Sewing the seams of sensemaking: A practical interface for tagging and organizing saved search results
Willman Beginning PyQt
Khalili et al. WYSIWYM–Integrated visualization, exploration and authoring of semantically enriched un-structured content
Nguyen et al. VideoCLIP: an interactive CLIP-based video retrieval system at VBS2023
US20140289247A1 (en) Annotation search apparatus and method
JP5793976B2 (ja) 記事配信システム、記事配信方法、サーバ及びプログラム
JP2000112962A (ja) 電子情報表示装置及び電子情報閲覧方法
CA2758363A1 (en) Machine and method for modifying, extracting and displaying cad drawing block attributes in an intuitive workflow
US20050256785A1 (en) Animated virtual catalog with dynamic creation and update
AU2014101081A4 (en) System, method and graphical user interface for facilitating a search
US10915599B2 (en) System and method for producing transferable, modular web pages
JP6287192B2 (ja) 情報処理装置、情報処理方法、プログラム
Ng et al. A 3D content cloud: Sharing, trading and customizing 3D print-ready objects

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140417

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150616

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150727

R150 Certificate of patent or registration of utility model

Ref document number: 5793976

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees