JP2012256204A - 記事配信システム、記事配信方法、サーバ及びプログラム - Google Patents
記事配信システム、記事配信方法、サーバ及びプログラム Download PDFInfo
- Publication number
- JP2012256204A JP2012256204A JP2011128890A JP2011128890A JP2012256204A JP 2012256204 A JP2012256204 A JP 2012256204A JP 2011128890 A JP2011128890 A JP 2011128890A JP 2011128890 A JP2011128890 A JP 2011128890A JP 2012256204 A JP2012256204 A JP 2012256204A
- Authority
- JP
- Japan
- Prior art keywords
- article
- search
- character
- priority
- search word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】ユーザが、事検索の為の検索語を入力すると(S11)、サーバ3は、検索語を含む見開きページを検索する(S12)。また、サーバ3は、検索語を含む見開きページを1つずつ特定し(S13)、文字デザイン情報に基づき、見開きページ単位で合算ポイントを算出する(S14)。そして、サーバ3は、合算ポイントに基づいて記事単位の優先度を算出し(S16)、優先度に従って検索語を含む記事の提示順序を決定し、記事の検索結果を提示する(S17)。
【選択図】図11
Description
非特許文献1では、検索対象を新聞記事とし、単語の共起情報を用いて、tf-idf(Term Frequency - Inverse Document Frequency)法の重み付けを行い、テキスト検索の精度を上げることが記載されている。
特許文献1では、検索対象を一般文書とし、tf-idf(Term Frequency - Inverse Document Frequency)法のチューニングの仕組みが記載されている。
特許文献2では、検索対象を取扱説明書とし、操作手順などの説明情報の情報タイプや出現位置に基づいて、ユーザの質問に対して適切な箇所を提示する仕組みが記載されている。
特許文献3では、検索対象を一般文書とし、単語の種類や、文書内における出現順序を示す出現パターンに基づき、入力された検索キーワードの関連キーワードを提示する仕組みが記載されている。
特許文献4では、検索対象を一般文書とし、文字列の外見的な特徴(太字、下線など)の有無に基づいて、検索対象に含まれるキーワードを抽出する仕組みが記載されている。
特許文献5では、検索対象を一般文書とし、太字、斜め文字、下線、背景色等の強調属性の有無に基づいて、検索対象に含まれる重要語を決定する仕組みが記載されている。
また、特許文献4、5を含めた従来技術のように、外見的な特徴や強調属性の有無から自動的にキーワードなどを抽出しても、キーワードを含む文書同士の優先順位を付けることができず、雑誌の記事検索においては問題となる。なぜなら、記事検索では検索結果が膨大となり、ユーザは検索結果の全てを確認することができない為、検索結果の提示順序が重要となるからである。
つまり、雑誌の記事検索では、前述した雑誌の特徴を考慮して、検索語を含む記事の優先順位を決めることが重要となる。
製作者端末7は、サーバ3に電子雑誌を記憶させる際、製作者の指示に従って、必要な情報を入力する。また、製作者端末7は、サーバ3の保守作業(設定ファイルの変更など)にも用いられる。
Mobile Eocument Format)データ等である。例えば、InDesign(登録商標)には、紙雑誌のDTPデータからEPUBデータを作成する「EPUBフォーマット変換機能」がある。また、本発明の実施形態では、後述するように、オブジェクトの位置情報を利用しないことから、ウエブにおけるXHTMLファイルとCSSファイルなどの組合せにも適用することができる。
・S3において特定された記事において、採用されている文字の数が最も多い文字サイズ
・S3において特定された記事において、最小の文字サイズ
・雑誌ごとに予め定められた文字サイズ(例えば、雑誌Xは「10pt」、雑誌Yは「12pt」など。)
・検索語を入力する為のテキストボックス
・検索処理の実行を指示する為の検索ボタン
・検索結果のリスト表示
・検索結果を選択する為のチェックボックス
・購入処理の実行を指示する為の購入ボタン
・処理の終了を指示する為のキャンセルボタン
サブポイントは、ポイントの合算ポイントが同一となった場合、どちらの優先度を高くするかを判定する為に用いられる。尚、出現状況に基づくポイントや、サブポイントの算出は、必須ではない。
記事データベース21に登録されている本文の文字サイズと、検索語の文字サイズとを比較する。本文より小さい場合、−(マイナス){検索語のサイズ/本文のサイズ}p(ポイント)とする。本文と同じ場合、0pとする。本文より大きい場合、+(プラス){検索語のサイズ/本文のサイズ}pとする。
一般に、本文の文字サイズよりも大きい文字は、製作者が強調したい情報を示すことが多い為、上記のようにポイントを加算する。一方、本文の文字サイズよりも小さい文字は、注意書きや参考情報など、製作者が強調したい情報を示していないことが多い為、上記のようにポイントを減算する。
検索語の文字色が白又は黒、かつ、網掛なしの場合、0pとする。検索語の文字色が白又は黒、かつ、網掛ありの場合、+1pとする。検索語の文字色が白及び黒以外の場合、+1pとする。或いは、検索語の文字色が白及び黒以外の場合、各色によって異なるポイントを設定しても良い。
一般に、文字色が白や黒などの文字は、製作者が強調したい情報を示していないことが多い為、上記のようにポイントを加算しない。但し、網掛などの文字装飾が付されている場合、上記のようにポイントを加算する。一方、文字色が白及び黒以外の文字は、製作者が強調したい情報を示すことが多い為、上記のようにポイントを加算する。
検索語の文字フォントがGothic(ゴシック体)の場合、+1pとする。検索語の文字フォントがGothic以外の場合、0pとする。或いは、検索語の文字フォントによって異なるポイントを設定しても良い。
一般に、Gothicは読み易く、かつ、存在感があることから、Gothicの文字は、製作者が強調したい情報を示すことが多い為、上記のようにポイントを加算する。一方、Gothic以外の文字は、製作者が強調したい情報を示していないことが多い為、上記のようにポイントを加算しない。
検索語の文字バリエーションがBold(太字)の場合、+1pとする。検索語の文字バリエーションがBold以外の場合、0pとする。
一般に、Boldの文字は、製作者が強調したい情報を示すことが多い為、上記のようにポイントを加算する。一方、Bold以外の文字は、製作者が強調したい情報を示していないことが多い為、上記のようにポイントを加算しない。
検索語の文字バリエーションがItalic(斜字)の場合、−1pとする。検索語の文字バリエーションがItalic以外の場合、0pとする。
一般に、Italicの文字は、注意書きや参考情報など、記事のテーマと直接関係がない情報を示すことが多い為、上記のようにポイントを減算する。一方、Italic以外の文字は、上記のようにポイントを減算しない。
1回だけ出現する文字の文字色が白及び黒以外の場合、+1pとする。1回だけ出現する文字の文字色が白又は黒の場合、ポイントを0p、サブポイントを+1pとする。複数回出現する文字の文字色が白及び黒以外の場合、ポイントを0P、サブポイントを+{出現回数}pとする。複数回出現する文字の文字色が白又は黒の場合、ポイントを0pとする。
白及び黒以外の文字が1回だけ出現する場合、製作者が強調したい情報を示すことが多い為、上記のようにポイントを加算する。一方、白及び黒以外の文字が複数回出現する場合、製作者が強調したい情報を示していないことが多い為、上記のようにポイントを加算しない。サブポイントについては、従来の技術と同様、出現回数に応じて加算する。
(1)「シャツ」を含むオブジェクト・・・A2、A5、A7(図1参照)
(2)本文の文字サイズ・・・8pt(図10参照)
(3)A2について
・文字サイズ・・・A2の文字サイズは20ptであり(図6参照)、本文より大きいことから、+20/8=+2.5p
・文字色、文字装飾・・・A2の文字色は黒であり、網掛なしであることから(図6参照)、0p
・文字フォント(Gothic)・・・A2の文字フォントはGothicではないことから(図6参照)、0p
・文字バリエーション(Bold)・・・A2の文字バリエーションはBoldであることから(図6参照)、+1p
・文字バリエーション(Italic)・・・A2の文字バリエーションはItalicではないことから(図6参照)、0p
(4)A5について(結果のみ記載する。)
・文字サイズ・・・+15/8≒+1.9p(小数第2位を四捨五入)
・文字色、文字装飾・・・+1p
・文字フォント(Gothic)・・・0p
・文字バリエーション(Bold)・・・+1p
・文字バリエーション(Italic)・・・0p
(5)A7について(結果のみ記載する。)
・文字サイズ・・・+20/8=+2.5p
・文字色、文字装飾・・・+0p
・文字フォント(Gothic)・・・0p
・文字バリエーション(Bold)・・・+1p
・文字バリエーション(Italic)・・・0p
(6)出現状況について
・A2の文字色は黒であり、白又は黒の文字が1回だけ出現する場合に該当するから、ポイントが0p、サブポイントが+1p
・A5の文字色は赤であり、白及び黒以外の文字が1回だけ出現する場合に該当するから、ポイントが+1p
・A7の文字色は白であり、白又は黒の文字が1回だけ出現する場合に該当するから、ポイントが0p、サブポイントが+1p
(7)ポイント、サブポイントの合算ポイント
・ポイントの合算ポイント・・・2.5+1+1.9+1+1+2.5+1+1=+11.9p
・サブポイントの合算ポイント・・・+2p
(1)「シャツ」を含むオブジェクト・・・B4、B6、B11、B15(図2参照)
(2)本文の文字サイズ・・・8pt(図10参照)
(3)B4のポイント・・・0p
(4)B6のポイント・・・0p
(5)B11のポイント・・・0p
(6)B15のポイント・・・0p
(7)出現状況のポイント、サブポイント・・・+0p、+4p
(8)ポイント、サブポイントの合算ポイント・・・+0p、+4p
(1)「シャツ」を含むオブジェクト・・・C5、C13、C16(図3参照)
(2)本文の文字サイズ・・・8pt(図10参照)
(3)C5のポイント・・・1.5+1+1=3.5p
(4)C13のポイント・・・1.5+1+1=3.5p
(5)C16のポイント・・・1.5+1+1=3.5p
(6)出現状況のポイント、サブポイント・・・0p、+3p
(7)ポイント、サブポイントの合算ポイント・・・+10.5p、+3p
図1〜図3、図6〜図8、図10に示した記事A〜記事Cの例について、優先度を算出すると、以下の通りとなる。
・優先度1位・・・記事A(+11.9p)
・優先度2位・・・記事C(+10.5p)
・優先度3位・・・記事B(+0p)
(1)の算出方法では、ある単一のテーマの記事の中に、見開きページ(又は単一ページ)ごとにサブテーマがあるような雑誌の場合、高い検索精度が得られる。例えば、女性向けのファッション雑誌であれば、記事のテーマが「カジュアル」、1つ目の見開きページのサブテーマが「シャツ」、2つ目の見開きページのサブテーマが「バッグ」、3つ目の見開きページのサブテーマが「靴」などのような紙面構成が考えられる。
(2)の算出方法では、ある単一のテーマの記事の中に含まれる複数の見開きページ(又は単一ページ)の内容が一貫している雑誌の場合、高い検索精度が得られる。例えば、車やカメラなどの専門雑誌であれば、ある単一のテーマ(例えば、「電気自動車」、「一眼レフカメラ」など)の記事の中に含まれる全ての見開きページを一貫して同一の内容とする紙面構成が考えられる。
・雑誌D 2011年5月 「カジュアル」を着こなす術
・雑誌E 2011年4月 必勝夏スタイル
・雑誌F 2011年×月 ○○○○○○○
・雑誌G 2011年×月 ○○○○○○○
3………サーバ
5………ユーザ端末
7………製作者端末
9………ネットワーク
21………記事データベース
23………記事検索画面
25………ポイント表
Claims (9)
- ユーザ端末とサーバとから構成され、電子雑誌を記事単位に配信する記事配信システムであって、
前記ユーザ端末は、
検索語を入力する入力手段、
を具備し、
前記サーバは、
前記電子雑誌を記事単位に記憶する記憶手段と、
前記検索語を含む記事について、前記検索語の文字デザイン情報に基づいて、優先度を算出する算出手段と、
前記優先度に従って前記検索語を含む記事の提示順序を決定し、検索結果を提示する提示手段と、
を具備することを特徴とする記事配信システム。 - 前記算出手段は、
前記文字デザイン情報ごとのポイントが定められたポイント表を予め有し、
前記検索語を含む単一ページ及び/又は見開きページを検索し、
前記検索語を含む単一ページ及び/又は見開きページごとに、前記ポイント表に基づいて、前記検索語の文字デザイン情報に対する前記ポイントを加減算することによって、前記検索語を含む単一ページ及び/又は見開きページごとの合算ポイントを算出し、
前記合算ポイントに基づいて、前記優先度を算出する
ことを特徴とする請求項1に記載の記事配信システム。 - 前記算出手段は、前記検索語を含む記事が複数の前記検索語を含む単一ページ及び/又は見開きページを有する場合、前記合算ポイントの最大値を、前記優先度とする
ことを特徴とする請求項2に記載の記事配信システム。 - 前記算出手段は、前記検索語を含む記事が複数の前記検索語を含む単一ページ及び/又は見開きページを有する場合、前記合算ポイントの合計値を、前記優先度とする
ことを特徴とする請求項2に記載の記事配信システム。 - 前記文字デザイン情報は、文字サイズを含み、
前記記憶手段は、記事の本文の前記文字サイズを記憶し、
前記算出手段は、前記検索語の前記文字サイズと、前記検索語を含む記事の本文の前記文字サイズとを比較することによって、前記優先度を算出する
ことを特徴とする請求項1乃至請求項4のいずれかに記載の記事配信システム。 - 前記文字デザイン情報は、文字色及び/又は文字スタイルを含み、
前記算出手段は、前記文字色及び/又は前記文字スタイルに基づいて、前記優先度を算出する
ことを特徴とする請求項1乃至請求項5のいずれかに記載の記事配信システム。 - ユーザ端末と、前記電子雑誌を記事単位に記憶する記憶手段を具備するサーバとから構成され、電子雑誌を記事単位に配信する記事配信システムにおける記事配信方法であって、
前記ユーザ端末が、検索語を入力するステップと、
前記サーバが、前記検索語を含む記事について、前記検索語の文字デザイン情報に基づいて、優先度を算出するステップと、
前記優先度に従って前記検索語を含む記事の提示順序を決定し、検索結果を提示するステップと、
を含むことを特徴とする記事配信方法。 - ユーザ端末と接続され、電子雑誌を記事単位に配信する記事配信サーバであって、
前記電子雑誌を記事単位に記憶する記憶手段と、
前記ユーザ端末から受信する検索語を含む記事について、前記検索語の文字デザイン情報に基づいて、優先度を算出する算出手段と、
前記優先度に従って前記検索語を含む記事の提示順序を決定し、検索結果を提示する提示手段と、
を具備することを特徴とする記事配信サーバ。 - コンピュータを、
電子雑誌を記事単位に記憶する記憶手段と、
ユーザ端末から受信する検索語を含む記事について、前記検索語の文字デザイン情報に基づいて、優先度を算出する算出手段と、
前記優先度に従って前記検索語を含む記事の提示順序を決定し、検索結果を提示する提示手段と、
して機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011128890A JP5793976B2 (ja) | 2011-06-09 | 2011-06-09 | 記事配信システム、記事配信方法、サーバ及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011128890A JP5793976B2 (ja) | 2011-06-09 | 2011-06-09 | 記事配信システム、記事配信方法、サーバ及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012256204A true JP2012256204A (ja) | 2012-12-27 |
JP5793976B2 JP5793976B2 (ja) | 2015-10-14 |
Family
ID=47527711
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011128890A Expired - Fee Related JP5793976B2 (ja) | 2011-06-09 | 2011-06-09 | 記事配信システム、記事配信方法、サーバ及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5793976B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018200721A (ja) * | 2018-08-28 | 2018-12-20 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09114860A (ja) * | 1995-10-20 | 1997-05-02 | Fuji Xerox Co Ltd | データ検索方法及び装置 |
JP2001060165A (ja) * | 1999-08-20 | 2001-03-06 | Nec Corp | 情報セット重要度判定システム及びその判定方法、及び情報セット重要度判定プログラムを記録した記録媒体 |
JP2002117068A (ja) * | 2000-10-12 | 2002-04-19 | Hideki Sakakino | 雑誌情報提供システム |
US6449616B1 (en) * | 1996-10-11 | 2002-09-10 | Walker Digital, Llc | Methods and apparatus for distributing supplemental information related to printed articles |
JP2004265097A (ja) * | 2003-02-28 | 2004-09-24 | Tokyo Inst Of Technol | プレゼンテーション資料検索システムおよびその方法並びにプログラム |
JP2007080014A (ja) * | 2005-09-15 | 2007-03-29 | Fujifilm Corp | 画像評価装置および方法並びにプログラム |
JP2008171302A (ja) * | 2007-01-15 | 2008-07-24 | Nippon Telegr & Teleph Corp <Ntt> | アウトライン生成装置、アウトライン生成方法およびアウトライン生成プログラム |
JP2010152862A (ja) * | 2008-11-27 | 2010-07-08 | I Business Center:Kk | 文章体特定装置およびコンピュータに文章体を特定させるためのプログラム |
-
2011
- 2011-06-09 JP JP2011128890A patent/JP5793976B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09114860A (ja) * | 1995-10-20 | 1997-05-02 | Fuji Xerox Co Ltd | データ検索方法及び装置 |
US6449616B1 (en) * | 1996-10-11 | 2002-09-10 | Walker Digital, Llc | Methods and apparatus for distributing supplemental information related to printed articles |
JP2001060165A (ja) * | 1999-08-20 | 2001-03-06 | Nec Corp | 情報セット重要度判定システム及びその判定方法、及び情報セット重要度判定プログラムを記録した記録媒体 |
JP2002117068A (ja) * | 2000-10-12 | 2002-04-19 | Hideki Sakakino | 雑誌情報提供システム |
JP2004265097A (ja) * | 2003-02-28 | 2004-09-24 | Tokyo Inst Of Technol | プレゼンテーション資料検索システムおよびその方法並びにプログラム |
JP2007080014A (ja) * | 2005-09-15 | 2007-03-29 | Fujifilm Corp | 画像評価装置および方法並びにプログラム |
JP2008171302A (ja) * | 2007-01-15 | 2008-07-24 | Nippon Telegr & Teleph Corp <Ntt> | アウトライン生成装置、アウトライン生成方法およびアウトライン生成プログラム |
JP2010152862A (ja) * | 2008-11-27 | 2010-07-08 | I Business Center:Kk | 文章体特定装置およびコンピュータに文章体を特定させるためのプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018200721A (ja) * | 2018-08-28 | 2018-12-20 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
JP7044665B2 (ja) | 2018-08-28 | 2022-03-30 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5793976B2 (ja) | 2015-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8356248B1 (en) | Generating context-based timelines | |
US8862574B2 (en) | Providing a search-result filters toolbar | |
US7203675B1 (en) | Methods, systems and data structures to construct, submit, and process multi-attributal searches | |
US20090070321A1 (en) | User search interface | |
US9069826B2 (en) | Information provision system, information provision system control method, information provision device, program, and information recording medium | |
US20130262968A1 (en) | Apparatus and method for efficiently reviewing patent documents | |
WO2019226312A1 (en) | Ai model canvas | |
US9245045B2 (en) | Aggregating missing bibliographic information in a collaborative environment | |
US10885488B2 (en) | System for accessing business metadata within a distributed network | |
JP5424798B2 (ja) | メタデータ設定方法及びメタデータ設定システム、並びにプログラム | |
JP2007265031A (ja) | 辞書コンテンツ処理装置、コンテンツ表示システムおよびコンテンツ表示方法 | |
Anderson et al. | Pro business applications with silverlight 4 | |
Hearst et al. | Sewing the seams of sensemaking: A practical interface for tagging and organizing saved search results | |
Willman | Beginning PyQt | |
Khalili et al. | WYSIWYM–Integrated visualization, exploration and authoring of semantically enriched un-structured content | |
Nguyen et al. | VideoCLIP: an interactive CLIP-based video retrieval system at VBS2023 | |
US20140289247A1 (en) | Annotation search apparatus and method | |
JP5793976B2 (ja) | 記事配信システム、記事配信方法、サーバ及びプログラム | |
JP2000112962A (ja) | 電子情報表示装置及び電子情報閲覧方法 | |
CA2758363A1 (en) | Machine and method for modifying, extracting and displaying cad drawing block attributes in an intuitive workflow | |
US20050256785A1 (en) | Animated virtual catalog with dynamic creation and update | |
AU2014101081A4 (en) | System, method and graphical user interface for facilitating a search | |
US10915599B2 (en) | System and method for producing transferable, modular web pages | |
JP6287192B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
Ng et al. | A 3D content cloud: Sharing, trading and customizing 3D print-ready objects |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140417 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141029 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141118 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150616 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150625 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150714 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150727 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5793976 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |