JP2015064623A - ページコンテンツについて注目箇所を直ぐに表示するページサイトサーバ、プログラム及び方法 - Google Patents

ページコンテンツについて注目箇所を直ぐに表示するページサイトサーバ、プログラム及び方法 Download PDF

Info

Publication number
JP2015064623A
JP2015064623A JP2013196454A JP2013196454A JP2015064623A JP 2015064623 A JP2015064623 A JP 2015064623A JP 2013196454 A JP2013196454 A JP 2013196454A JP 2013196454 A JP2013196454 A JP 2013196454A JP 2015064623 A JP2015064623 A JP 2015064623A
Authority
JP
Japan
Prior art keywords
page
page content
server
comment
feature word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013196454A
Other languages
English (en)
Other versions
JP6147629B2 (ja
Inventor
池田 和史
Kazufumi Ikeda
和史 池田
服部 元
Hajime Hattori
元 服部
滝嶋 康弘
Yasuhiro Takishima
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2013196454A priority Critical patent/JP6147629B2/ja
Priority to US14/917,747 priority patent/US20160203147A1/en
Priority to PCT/JP2014/074803 priority patent/WO2015046035A1/ja
Publication of JP2015064623A publication Critical patent/JP2015064623A/ja
Application granted granted Critical
Publication of JP6147629B2 publication Critical patent/JP6147629B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/216Handling conversation history, e.g. grouping of messages in sessions or threads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Abstract

【課題】ページコンテンツについて誰もが興味を持つ注目箇所を直ぐに表示することができるページサイトサーバ等を提供する。【解決手段】ページサイトサーバは、コメントサーバと通信可能であり、端末からのページ取得要求に応じて、テキストを含むページコンテンツを応答する。本発明のページサイトサーバは、ページコンテンツに関するコメント集合を、コメントサーバから検索するコメント集合検索手段と、ページコンテンツに関するコメント集合から、所定条件で出現頻度が多く、且つ、ページコンテンツのテキストに記述されている特徴語を抽出する特徴語抽出手段と、ページコンテンツにおける特徴語の出現箇所を検索する特徴語検索手段と、端末に表示すべき当該ページコンテンツについて、特徴語の出現箇所がユーザに閲覧されるように表示する閲覧箇所表示手段とを有する。【選択図】図2

Description

本発明は、Webページを公開するページサイトサーバの技術に関する。
近年、インターネットを介して、ページサイトサーバから大量なWebページコンテンツが公開されている。ページコンテンツは、不特定多数の第三者からアクセス可能なページであって、テキスト文章を含む。また、端末は、そのページサイトサーバへアクセスし、ブラウザにそのページコンテンツの一部(可能であれば全部)を表示する。ユーザは、ブラウザに表示されたページを閲覧しながら、その表示範囲をスクロール(ページダウン/ページアップ)させることができる。
一方で、インターネットを介して、SNS(Social Networking Service)や、ブログ(Web log)、ミニブログ(mini Web log)(例えばtwitter(登録商標))のようなサイトサーバに対して、不特定多数のユーザから大量のコメントが投稿されている。このようなコメントは、共通の話題に対して議論されている場合も多い。例えば、前述したようなページコンテンツを共通の話題として、多数のコメントが投稿されることも多い。
従来、ネットワーク上に存在する情報サイトを、ユーザに閲覧しやすくする技術がある。例えば、多数の情報サイトの中から、ユーザにとって必要となる確率の高い情報を自動的に抽出して表示する技術がある(例えば特許文献1参照)。この技術によれば、予め登録した各情報サイトからタイトルや記事情報を抽出し、複数の情報サイトの中で、類似した記事が掲載されている情報を優先的に提示する。所望の情報(タイトル)にフォーカスを合わせると、その本文テキストが読み出されポップアップ表示される。
また、ブログサイトのHTML(HyperText Markup Language)中のタグを解析することによって、ブログサイト中のユーザが記述した本文部分のみを抽出する技術もある(例えば特許文献2参照)。更に、Webニュースの文章構造を解析することで、未来に関する記述を抽出し、抽出した情報を年表形式で自動的にまとめる技術もある(例えば非特許文献1参照)。
特開2011−150591号公報 特許第5068356号
吉田光男、乾孝司、山本幹雄、「Webニュースを用いた未来情報年表の自動構築」、筑波大学大学院システム情報工学研究科、[online]、[平成25年9月16日検索]、インターネット<URL:http://rit.rakuten.co.jp/conf/rrds3/papers/RRDS3-P-14.pdf> 「EDRコーパス」、 [online]、[平成25年9月16日検索]、インターネット<URL:http://www2.nict.go.jp/out-promotion/techtransfer/EDR/JPN/Struct/Struct-CPS.html>
特許文献1に記載の技術によれば、複数の情報サイトに掲載されている重要なニュース記事全体を、端末に表示しようとする。また、特許文献2に記載の技術によれば、Webページから広告やバナー等を除いた本文部分のみを、端末に表示しようとする。更に、非特許文献1に記載の技術によれば、ニュース記事中における所定観点の記述箇所を抜粋してまとめた要約文を、端末に表示しようとする。
いずれの従来技術も、ユーザは、端末のブラウザに表示されたページコンテンツの一部を閲覧しながら、表示範囲をスクロールさせて、注目記述文章を探す必要がある。例えば、注目記述文章がページコンテンツの末尾にある場合、ユーザは、ページコンテンツの先頭から末尾までスクロールさせなければならない。
ここで、発明者らは、ページコンテンツについて誰もが興味を持つ注目箇所を直ぐに表示することができないか?と考えた。前述した従来技術によれば、スマートフォンやタブレットのような端末のディスプレイにページコンテンツを表示する場合、画面サイズの制約によって、ユーザは、注目箇所を更に閲覧しにくいという課題もある。
そこで、本発明は、ページコンテンツについて誰もが興味を持つ注目箇所を直ぐに表示することができるページサイトサーバ、プログラム及び方法を提供することを目的とする。
本発明によれば、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能であり、端末からのページ取得要求に応じて、テキストを含むページコンテンツを応答するページサイトサーバにおいて、
ページコンテンツに関するコメント集合を、コメントサーバから検索するコメント集合検索手段と、
ページコンテンツに関するコメント集合から、所定条件で出現頻度が多く、且つ、ページコンテンツのテキストに記述されている特徴語を抽出する特徴語抽出手段と、
ページコンテンツにおける特徴語の出現箇所を検索する特徴語検索手段と、
端末に表示すべき当該ページコンテンツについて、特徴語の出現箇所がユーザに閲覧されるように表示する閲覧箇所表示手段と
を有することを特徴とする。
本発明のページサイトサーバにおける他の実施形態によれば、
特徴語抽出手段は、ページコンテンツに関するコメント集合から、TF−IDF(Term Frequency - Inverse Document Frequency)を用いて、他のページコンテンツに対して当該ページコンテンツを特徴付ける1つ以上の特徴語を抽出することも好ましい。
本発明のページサイトサーバにおける他の実施形態によれば、
閲覧箇所表示手段は、ページコンテンツにおける特徴語を含むページ部分を、端末の表示領域の先頭(頭出し)又は中央に表示することも好ましい。
本発明のページサイトサーバにおける他の実施形態によれば、
閲覧箇所表示手段は、ページコンテンツにおける特徴語を強調して表示することも好ましい。
本発明のページサイトサーバにおける他の実施形態によれば、
入力された語に対して汎化語(上位概念語)を出力する、概念体系を記述した概念辞書手段を更に有し、
特徴語抽出手段は、複数の特徴語を抽出した後、それら特徴語から概念辞書手段を用いて汎化語に変換し、出現頻度の多い汎化語を特徴語として出力する
ことも好ましい。
本発明のページサイトサーバにおける他の実施形態によれば、
ページコンテンツは、ニュース記事コンテンツであり、
コメントは、SNS(Social Networking Service)サーバ、ブログ(Web-log)サーバ、掲示板サーバ又はレビューサイトサーバから発信されたものである
ことも好ましい。
本発明によれば、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと、テキストを含むページコンテンツを公開するページ公開サーバと通信可能であり、端末から受信したページ取得要求をページ公開サーバへ転送し、該ページ公開サーバから受信したページ個テンツを端末へ転送するプロキシサーバにおいて、
ページコンテンツに関するコメント集合を、コメントサーバから検索するコメント集合検索手段と、
ページコンテンツに関するコメント集合から、所定条件で出現頻度が多く、且つ、ページコンテンツのテキストに記述されている特徴語を抽出する特徴語抽出手段と、
ページコンテンツにおける特徴語の出現箇所を検索する特徴語検索手段と、
端末に表示すべき当該ページコンテンツについて、特徴語の出現箇所がユーザに閲覧されるように表示する閲覧箇所表示手段と
を有することを特徴とする。
本発明によれば、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能であり、端末からのページ取得要求に応じて、テキストを含むページコンテンツを応答するページサイトサーバに搭載されたコンピュータを機能させるプログラムにおいて、
ページコンテンツに関するコメント集合を、コメントサーバから検索するコメント集合検索手段と、
ページコンテンツに関するコメント集合から、所定条件で出現頻度が多く、且つ、ページコンテンツのテキストに記述されている特徴語を抽出する特徴語抽出手段と、
ページコンテンツにおける特徴語の出現箇所を検索する特徴語検索手段と、
端末に表示すべき当該ページコンテンツについて、特徴語の出現箇所がユーザに閲覧されるように表示する閲覧箇所表示手段と
してコンピュータを機能させることを特徴とする。
本発明によれば、ページコンテンツを配信するページサイトサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能なページサイトサーバのページ公開方法であって、
ページコンテンツに関するコメント集合を、コメントサーバから検索する第1のステップと、
ページコンテンツに関するコメント集合から、所定条件で出現頻度が多く、且つ、ページコンテンツのテキストに記述されている特徴語を抽出する第2のステップと、
ページコンテンツにおける特徴語の出現箇所を検索する第3のステップと、
端末に表示すべき当該ページコンテンツについて、特徴語の出現箇所がユーザに閲覧されるように表示する第4のステップと
を有することを特徴とする。
本発明のページサイトサーバ、プログラム及び方法によれば、ページコンテンツについて誰もが興味を持つ注目箇所を直ぐに表示することができる。特にスマートフォンやタブレットのような端末のディスプレイにページコンテンツを表示する場合であっても、画面サイズの制約の影響を受けることなく、ユーザは注目箇所を閲覧しやすくなる。
本発明におけるシステム構成図である。 本発明におけるページサイトサーバの機能構成図である。 ページコンテンツの例である。 図3のページコンテンツに対して取得されたコメント集合の例である。 本発明におけるページコンテンツの第1の表示例である。 本発明におけるページコンテンツの第2の表示例である。 本発明におけるプロキシサーバの機能構成図である。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
図1は、本発明におけるシステム構成図である。
図1によれば、ページサイトサーバ1と、コメントサーバ2と、ページ公開サーバ3(オプション的)と、端末4とが、インターネットを介して接続されている。
ページサイトサーバ1は、注目箇所を直ぐに表示することができるようにスクロールさせたページコンテンツを配信する。ページコンテンツは、例えばニュース記事のようなテキストを含むものであって、不特定多数のユーザからアクセス可能なものである。
コメントサーバ2は、複数の投稿者間でテキストのコメントを発信し合うことができるサイトサーバである。例えばSNS(Social Networking Service)サーバ、ブログ(Web-log)サーバ、掲示板サーバ又はレビューサイトサーバであってもよい。コメントサーバ2が公開するコメントは、例えばtwitter(登録商標)サイトで公開されるツィートのようなものである。
ページサイトサーバをプロキシサーバ1として、別途、ページ公開サーバ3が、インターネットに更に接続されていてもよい。プロキシサーバ1は、端末4とページ公開サーバ3との間でプロキシとして機能し、ページ公開サーバ3から配信されるページコンテンツを端末4へ送信する。このとき、プロキシサーバ1は、そのページコンテンツに、注目箇所を直ぐに表示するスクロール制御コードを添付する。
端末4は、例えばスマートフォンやタブレット、携帯電話機、パーソナルコンピュータ、テレビ等であって、ブラウザによって閲覧可能なものである。端末4は、ページサイトサーバ1へアクセスすることによって、ページコンテンツの一部(又は可能であれば全部)をブラウザに表示する。本発明によれば、そのページコンテンツは、誰もが興味を持つ注目箇所にスクロールした状態で表示される。
尚、以下では、ページサイトサーバ1とコメントサーバ2とが別々にインターネットに設置されているものとして説明する(図1参照)が、これら機能が一体となったサイトサーバであってもよい。このようなサイトサーバの場合、ページコンテンツ毎に、多数のコメントが対応付けて公開されている。例えばYouTube(登録商標)のようなサイトサーバがある。
図2は、本発明におけるページサイトサーバの機能構成図である。
図2によれば、ページサイトサーバ1は、インターネットに接続する通信インタフェースと共に、ページコンテンツ蓄積部10と、コメント集合検索部11と、特徴語抽出部12と、概念辞書部13と、特徴語検索部14と、閲覧箇所表示部15と、ページコンテンツ検索部16とを有する。これら機能構成部は、サーバに搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、これら機能構成部の処理の流れは、コメント公開方法としても理解できる。
[ページコンテンツ蓄積部10]
ページコンテンツ蓄積部10は、ページコンテンツを予め記憶したものである。ページコンテンツ蓄積部10は、例えばRSS(Really Simple Syndication/Rich Site Summary)を用いて、最新のページコンテンツ(URL(Uniform Resource Locator))を収集されたものであってもよい。
図3は、ページコンテンツの例である。
図3によれば、タイトル「a社から、新しい携帯端末Xが発売!」について、テキスト及び画像からなるページが表されている。
[コメント集合検索部11]
コメント集合検索部11は、ページコンテンツに関するコメント集合を、コメントサーバ2から検索する。ページコンテンツは、ページコンテンツ蓄積部10に蓄積されており、ページコンテンツ検索部16によって端末4から要求されたものであってもよい。コメント集合検索部11は、例えばページコンテンツのURLやタイトル、又はハッシュタグを検索キーとして、コメントサーバ2によって公開される検索用API(Application Programing Interface)を用いて検索する。例えばページコンテンツがニュース記事である場合、そのニュース記事に関する不特定多数の第三者のコメント集合を収集することができる。検索されたコメント集合は、特徴語抽出部12へ出力される。
図4は、図3のページコンテンツに対して取得されたコメント集合の例である。
図4によれば、図3のページコンテンツに対して、以下のようなコメント集合が取得されたとする。
ページコンテンツ「a社から携帯端末Xが発売!」 http://www.a.com/X.html
コメント集合
[なんだこの機能性の高さは・・・]
[値段がちょっと高いな。]
[2万円台で買えるなら考えてもいい。]
[これは買わない。]
[無駄に高機能なんだがwww]
[a社は、こういう価格帯なのね]
[高いけど、コスパならお得かも]
[すごい、a社の新端末、めっちゃ高機能(*^○^*)]
[なにこれ、欲しい。]
[これ欲しい、値段も安いし、明日買おうかな。]
[おいおいwwwwwwwwww]
[もうちょっと安かったらなぁ]
[特徴語抽出部12]
特徴語抽出部12は、ページコンテンツに関するコメント集合から、所定条件で出現頻度が多く、且つ、ページコンテンツのテキストに記述されている「特徴語」を抽出する。ここで、所定条件として例えば、ページコンテンツに関するコメント集合から、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)を用いて、他のページコンテンツに対して当該ページコンテンツを特徴付ける1つ以上の特徴語を抽出するものであってもよい。
特徴語抽出部12は、コメント集合に含まれるテキストから形態素解析によって単語を抽出する。「形態素解析」とは、文章を、意味のある単語に区切り、辞書を利用して品詞や内容を判別する技術をいう。「形態素」とは、文章の要素のうち、意味を持つ最小の単位を意味する。そして、形態素解析によって抽出された単語から、TF−IDFによって特徴的な単語を抽出する。TF−IDFとは、各単語に重みを付けて、クエリから文章をベクトル空間で表し、文章とクエリの類似度でランク付けをする技術である。ランク付けられた値が高いほど、特徴語と認識される。例えば、TFには、各ニュース記事のタイトル又は記事本文中の各単語の出現頻度を設定し、IDFには、全ニュース記事における各単語の出現頻度を設定する。
図4によれば、例えば以下のような「特徴語」及びその「出現頻度」が検出される。
[特徴語] [出現頻度]
”機能” 3回
”値段” 2回
”万円” 1回
”価格” 1回
”コスパ” 1回
”安” 1回
ここでは、最も出現頻度が高い特徴語「機能」が、特徴語検索部14へ出力される。尚、最も出現頻度が高い特徴語が、ページコンテンツに記述されていない語である場合、次に出現頻度が高い特徴語が出力される。
[概念辞書部13]
概念辞書部13は、入力された語に対して汎化語(上位概念語)を出力する、概念体系を記述したものである。概念辞書部13は、例えばEDRコーパスであってもよい(例えば非特許文献2参照)。EDRコーパスは、コーパスレコードの集合であって、各コーパスレコードは、「見出し情報」「文構成要素情報」「形態素情報」「構文情報」「意味情報」から構成される。ここで、意味情報には、フレームやグラフによって、概念間の関係を記した概念関係表現のデータが記述されている。
前述した特徴語抽出部12は、他の実施形態として、複数の特徴語を抽出した後、それら特徴語から概念辞書部13を用いて汎化語に変換し、出現頻度の多い汎化語を特徴語として出力するものであってもよい。
前述の例によれば、複数の特徴語は、例えば以下のように汎化語に変換される。
[特徴語] -> [汎化語]
”機能” ”機能”
”値段” ”価格”
”万円” ”価格”
”価格” ”価格”
”コスパ” ”価格”
”安” ”安”
この場合、各汎化語について、出現頻度が算出される。
[汎化語] -> [出現頻度]
”価格” 5回
”機能” 3回
”安” 1回
ここでは、最も出現頻度が高い汎化語「価格」(及び特徴語「値段」「万円」「コスパ」を含む)が、特徴語検索部14へ出力される。
[特徴語検索部14]
特徴語検索部14は、ページコンテンツにおける特徴語の出現箇所を検索する。
特徴語「機能」の場合、図3のページコンテンツによれば、以下の文章箇所が検索される。
「最高の"機能"!」
また、特徴語「価格」の場合、図3のページコンテンツによれば、以下の文章箇所が検索される。
「お"値段"は、税込み3,150円です。」
[閲覧箇所表示部15]
閲覧箇所表示部15は、端末に表示すべき当該ページコンテンツについて、特徴語の出現箇所がユーザに閲覧されるように表示する。具体的には、そのページコンテンツに、注目箇所が直ぐに表示されるスクロール制御コードを添付する。
具体的には、以下の2つ方法のいずれか又は両方で表示される。
(表示方法1)ページコンテンツにおける特徴語を含むページ部分が、端末の表示領域の先頭(頭出し)又は中央に(スクロールされた状態で)表示される。
(表示方法2)ページコンテンツにおける特徴語が、強調して表示される。特徴語が蛍光色でマークされて表示されるものであってもよい。
図5は、本発明におけるページコンテンツの第1の表示例である。
特徴語「機能」の場合、図3のページコンテンツによれば、以下の文章箇所が中央に表示される。
「最高の"機能"!
CPUに64bit採用、OSにバーション5.1を採用
テレビと同じ解像度、カメラは高速シャッター、
しかも、スマートフォン同士で充電できる、充電ケーブル付き。」
前述の特徴語「機能」を含む文章箇所について、HTMLコードは、例えば以下のように記述される。
「 ・・・・・
最高の<DEFANGED_span id="highlight" style="background-color: #ffff00">機能
</DEFANGED_span>!<br/>
CPUに64bit採用、OSにバーション5.1を採用<br/>
テレビと同じ解像度、カメラは高速シャッター、<br/>
しかも、スマートフォン同士で充電できる、充電ケーブル付き。<br/>
・・・・・ 」
id="highlight":頭出し用の目印("highlight"は、任意の文字列)
style="background-color: #ffff00":文字の背景色を黄色にハイライトする
そして、例えば以下のようなURLで参照することによって、「最高の機能!」の行が頭出しされる。
http://サーバ/test.html#highlight
図6は、本発明におけるページコンテンツの第2の表示例である。
特徴語「価格」の場合、図3のページコンテンツによれば、以下の文章箇所が中央に表示される。
「お"値段"は、税込み3,150円です。
ご購入は、以下の場所で。
オンラインショップ->
最寄りのa社ショップ-> 」
[ページコンテンツ検索部16]
ページコンテンツ検索部16は、端末4からページ取得要求を受信し、その要求に応じたページコンテンツを検索し、そのページコンテンツを端末4へ応答する。尚、ページコンテンツ検索部16は、ページコンテンツに加えて、コメント集合自体も、端末4へ送信するものであってもよい。端末4を閲覧するユーザにとっては、コメント集合も閲覧することによって、どのようなコメントが投稿されているかを知ることもできる。このときm、表示対象となった「特徴語」を含むコメント集合のみを表示することも好ましい。
図7は、本発明におけるプロキシサーバの機能構成図である。
図7によれば、図2と比較して、ページサイトサーバがプロキシサーバとして機能する。そのために、図2のページコンテンツ蓄積部10に対して、図7には、ページコンテンツ取得部17が備えられている。ページコンテンツ取得部17は、ページ公開サーバ3へページ取得要求を送信し、応答のページコンテンツを受信する。プロキシサーバ1は、そのページコンテンツに、注目箇所を直ぐに表示するスクロール制御コードを添付して、端末4へ更に応答する。
以上、詳細に説明したように、本発明のページサイトサーバ、プログラム及び方法によれば、ページコンテンツについて誰もが興味を持つ注目箇所を直ぐに表示することができる。特にスマートフォンやタブレットのような端末のディスプレイにページコンテンツを表示する場合であっても、画面サイズの制約の影響を受けることなく、ユーザは、注目箇所を閲覧しやすくなる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 ページサイトサーバ
10 ページコンテンツ蓄積部
11 コメント集合検索部
12 特徴語抽出部
13 概念辞書部
14 特徴語検索部
15 閲覧箇所表示部
16 ページコンテンツ検索部
17 ページコンテンツ取得部
2 コメントサーバ
3 ページ公開サーバ
4 端末

Claims (9)

  1. 複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能であり、端末からのページ取得要求に応じて、テキストを含むページコンテンツを応答するページサイトサーバにおいて、
    前記ページコンテンツに関するコメント集合を、前記コメントサーバから検索するコメント集合検索手段と、
    前記ページコンテンツに関する前記コメント集合から、所定条件で出現頻度が多く、且つ、前記ページコンテンツのテキストに記述されている特徴語を抽出する特徴語抽出手段と、
    前記ページコンテンツにおける前記特徴語の出現箇所を検索する特徴語検索手段と、
    前記端末に表示すべき当該ページコンテンツについて、前記特徴語の出現箇所がユーザに閲覧されるように表示する閲覧箇所表示手段と
    を有することを特徴とするページサイトサーバ。
  2. 前記特徴語抽出手段は、前記ページコンテンツに関する前記コメント集合から、TF−IDF(Term Frequency - Inverse Document Frequency)を用いて、他のページコンテンツに対して当該ページコンテンツを特徴付ける1つ以上の特徴語を抽出する
    ことを特徴とする請求項1に記載のページサイトサーバ。
  3. 前記閲覧箇所表示手段は、前記ページコンテンツにおける前記特徴語を含むページ部分を、前記端末の表示領域の先頭(頭出し)又は中央に表示する
    ことを特徴とする請求項1又は2に記載のページサイトサーバ。
  4. 前記閲覧箇所表示手段は、前記ページコンテンツにおける前記特徴語を強調して表示する
    ことを特徴とする請求項1から3のいずれか1項に記載のページサイトサーバ。
  5. 入力された語に対して汎化語(上位概念語)を出力する、概念体系を記述した概念辞書手段を更に有し、
    前記特徴語抽出手段は、複数の特徴語を抽出した後、それら特徴語から前記概念辞書手段を用いて汎化語に変換し、出現頻度の多い汎化語を特徴語として出力する
    ことを特徴とする請求項1から4のいずれか1項に記載のページサイトサーバ。
  6. 前記ページコンテンツは、ニュース記事コンテンツであり、
    前記コメントは、SNS(Social Networking Service)サーバ、ブログ(Web-log)サーバ、掲示板サーバ又はレビューサイトサーバから発信されたものである
    ことを特徴とする請求項1から5のいずれか1項に記載のページサイトサーバ。
  7. 複数の投稿者間でテキストのコメントを発信し合うコメントサーバと、テキストを含むページコンテンツを公開するページ公開サーバと通信可能であり、端末から受信したページ取得要求を前記ページ公開サーバへ転送し、該ページ公開サーバから受信したページ個テンツを前記端末へ転送するプロキシサーバにおいて、
    前記ページコンテンツに関するコメント集合を、前記コメントサーバから検索するコメント集合検索手段と、
    前記ページコンテンツに関する前記コメント集合から、所定条件で出現頻度が多く、且つ、前記ページコンテンツのテキストに記述されている特徴語を抽出する特徴語抽出手段と、
    前記ページコンテンツにおける前記特徴語の出現箇所を検索する特徴語検索手段と、
    前記端末に表示すべき当該ページコンテンツについて、前記特徴語の出現箇所がユーザに閲覧されるように表示する閲覧箇所表示手段と
    を有することを特徴とするプロキシサーバ。
  8. 複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能であり、端末からのページ取得要求に応じて、テキストを含むページコンテンツを応答するページサイトサーバに搭載されたコンピュータを機能させるプログラムにおいて、
    前記ページコンテンツに関するコメント集合を、前記コメントサーバから検索するコメント集合検索手段と、
    前記ページコンテンツに関する前記コメント集合から、所定条件で出現頻度が多く、且つ、前記ページコンテンツのテキストに記述されている特徴語を抽出する特徴語抽出手段と、
    前記ページコンテンツにおける前記特徴語の出現箇所を検索する特徴語検索手段と、
    前記端末に表示すべき当該ページコンテンツについて、前記特徴語の出現箇所がユーザに閲覧されるように表示する閲覧箇所表示手段と
    してコンピュータを機能させることを特徴とするプログラム。
  9. ページコンテンツを配信するページサイトサーバと、複数の投稿者間でテキストのコメントを発信し合うコメントサーバと通信可能なページサイトサーバのページ公開方法であって、
    前記ページコンテンツに関するコメント集合を、前記コメントサーバから検索する第1のステップと、
    前記ページコンテンツに関する前記コメント集合から、所定条件で出現頻度が多く、且つ、前記ページコンテンツのテキストに記述されている特徴語を抽出する第2のステップと、
    前記ページコンテンツにおける前記特徴語の出現箇所を検索する第3のステップと、
    前記端末に表示すべき当該ページコンテンツについて、前記特徴語の出現箇所がユーザに閲覧されるように表示する第4のステップと
    を有することを特徴とするページサイトサーバのページ公開方法。
JP2013196454A 2013-09-24 2013-09-24 ページコンテンツについて注目箇所を直ぐに表示するページサイトサーバ、プログラム及び方法 Expired - Fee Related JP6147629B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013196454A JP6147629B2 (ja) 2013-09-24 2013-09-24 ページコンテンツについて注目箇所を直ぐに表示するページサイトサーバ、プログラム及び方法
US14/917,747 US20160203147A1 (en) 2013-09-24 2014-09-19 Page/site server, program and method for immediately displaying noteworthy place in page content
PCT/JP2014/074803 WO2015046035A1 (ja) 2013-09-24 2014-09-19 ページコンテンツの注目箇所を直ちに表示するページサイトサーバ、プログラム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013196454A JP6147629B2 (ja) 2013-09-24 2013-09-24 ページコンテンツについて注目箇所を直ぐに表示するページサイトサーバ、プログラム及び方法

Publications (2)

Publication Number Publication Date
JP2015064623A true JP2015064623A (ja) 2015-04-09
JP6147629B2 JP6147629B2 (ja) 2017-06-14

Family

ID=52743172

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013196454A Expired - Fee Related JP6147629B2 (ja) 2013-09-24 2013-09-24 ページコンテンツについて注目箇所を直ぐに表示するページサイトサーバ、プログラム及び方法

Country Status (3)

Country Link
US (1) US20160203147A1 (ja)
JP (1) JP6147629B2 (ja)
WO (1) WO2015046035A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766321A (zh) * 2016-08-22 2018-03-06 富士施乐株式会社 信息处理设备、信息处理系统和信息处理方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016153081A1 (en) * 2015-03-20 2016-09-29 Lg Electronics Inc. Electronic device and method for controlling the same
US11507743B2 (en) * 2017-02-28 2022-11-22 Nice Ltd. System and method for automatic key phrase extraction rule generation
KR102019756B1 (ko) * 2017-03-14 2019-09-10 한국전자통신연구원 신조어 자동 인식을 위한 언어 분석에 기반한 온라인 문맥 광고 지능화 장치 및 그 방법
CN108334533B (zh) * 2017-10-20 2021-12-24 腾讯科技(深圳)有限公司 关键词提取方法和装置、存储介质及电子装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002014994A (ja) * 2000-06-30 2002-01-18 Just Syst Corp ウェブページ属性管理装置およびウェブページ属性管理方法
JP2006209553A (ja) * 2005-01-28 2006-08-10 Kyocera Corp 表示装置
JP2007041869A (ja) * 2005-08-03 2007-02-15 Digital Garage Inc 投資支援システム及び方法
JP2009003888A (ja) * 2007-06-25 2009-01-08 Toshiba Corp キーワード提示のための装置、方法、及びプログラム
JP2009230536A (ja) * 2008-03-24 2009-10-08 Fujitsu Ltd 表示制御装置、表示制御方法及び表示制御プログラム
US20110145219A1 (en) * 2009-08-12 2011-06-16 Google Inc. Objective and subjective ranking of comments
JP2013011967A (ja) * 2011-06-28 2013-01-17 Kddi Corp 公開コンテンツのキーワードに基づく関連情報を配信する関連情報配信プログラム、サーバ及び方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6012090A (en) * 1997-03-14 2000-01-04 At&T Corp. Client-side parallel requests for network services using group name association
US7962461B2 (en) * 2004-12-14 2011-06-14 Google Inc. Method and system for finding and aggregating reviews for a product
US7627565B2 (en) * 2006-01-31 2009-12-01 Northwestern University Organizing context-sensitive search results
US20080114748A1 (en) * 2006-11-13 2008-05-15 Richard Varner Peer review system and method therefor
US20090210444A1 (en) * 2007-10-17 2009-08-20 Bailey Christopher T M System and method for collecting bonafide reviews of ratable objects
US20090282002A1 (en) * 2008-03-10 2009-11-12 Travis Reeder Methods and systems for integrating data from social networks
US20100095198A1 (en) * 2008-10-15 2010-04-15 Apple Inc. Shared comments for online document collaboration
US9008489B2 (en) * 2012-02-17 2015-04-14 Kddi Corporation Keyword-tagging of scenes of interest within video content

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002014994A (ja) * 2000-06-30 2002-01-18 Just Syst Corp ウェブページ属性管理装置およびウェブページ属性管理方法
JP2006209553A (ja) * 2005-01-28 2006-08-10 Kyocera Corp 表示装置
JP2007041869A (ja) * 2005-08-03 2007-02-15 Digital Garage Inc 投資支援システム及び方法
JP2009003888A (ja) * 2007-06-25 2009-01-08 Toshiba Corp キーワード提示のための装置、方法、及びプログラム
JP2009230536A (ja) * 2008-03-24 2009-10-08 Fujitsu Ltd 表示制御装置、表示制御方法及び表示制御プログラム
US20110145219A1 (en) * 2009-08-12 2011-06-16 Google Inc. Objective and subjective ranking of comments
JP2013011967A (ja) * 2011-06-28 2013-01-17 Kddi Corp 公開コンテンツのキーワードに基づく関連情報を配信する関連情報配信プログラム、サーバ及び方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
西山 真司: "パソコン、タブレット、スマホ、何でも使える! 驚きのGoogleその操作と裏ワザ", アスキーPC, vol. 第16巻,第6号, JPN6016036087, 23 February 2013 (2013-02-23), JP, pages 34 - 35, ISSN: 0003401699 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766321A (zh) * 2016-08-22 2018-03-06 富士施乐株式会社 信息处理设备、信息处理系统和信息处理方法
US10629087B2 (en) 2016-08-22 2020-04-21 Fuji Xerox Co., Ltd. Information processing apparatus, information processing system, and non-transitory computer readable medium
US11017684B2 (en) 2016-08-22 2021-05-25 Fuji Xerox Co., Ltd. Information processing apparatus, information processing system, and non-transitory computer readable medium
US11869384B2 (en) 2016-08-22 2024-01-09 Fujifilm Business Innovation Corp. Information processing apparatus, information processing system, and non-transitory computer readable medium

Also Published As

Publication number Publication date
WO2015046035A1 (ja) 2015-04-02
JP6147629B2 (ja) 2017-06-14
US20160203147A1 (en) 2016-07-14

Similar Documents

Publication Publication Date Title
US10796076B2 (en) Method and system for providing suggested tags associated with a target web page for manipulation by a useroptimal rendering engine
US9721018B2 (en) System and method for displaying of most relevant vertical search results
US8898583B2 (en) Systems and methods for providing information regarding semantic entities included in a page of content
CN102708174B (zh) 一种浏览器中的富媒体信息的展示方法和装置
US9910932B2 (en) System and method for completing a user query and for providing a query response
US9223895B2 (en) System and method for contextual commands in a search results page
US8572118B2 (en) Computer method and apparatus of information management and navigation
US20090271388A1 (en) Annotations of third party content
US10152521B2 (en) Resource recommendations for a displayed resource
JP6147629B2 (ja) ページコンテンツについて注目箇所を直ぐに表示するページサイトサーバ、プログラム及び方法
Sundaramoorthy et al. Newsone—an aggregation system for news using web scraping method
CN106471497B (zh) 使用上下文的辅助浏览
JP5725619B2 (ja) 多数のコメント文章に基づいて位置情報にキーワードをタグ付けする装置、プログラム及び方法
US20220292160A1 (en) Automated system and method for creating structured data objects for a media-based electronic document
CN104090923A (zh) 一种浏览器中的富媒体信息的展示方法和装置
US8782078B2 (en) Systematic process for creating large numbers of relevant, contextual marginal comments based on existing discussions of quotations and links
RU2632126C1 (ru) Способ и система предоставления контекстуальной информации
US9990425B1 (en) Presenting secondary music search result links
EP2458515A1 (en) Method and apparatus for searching contents in a communication system
US20130179832A1 (en) Method and apparatus for displaying suggestions to a user of a software application
JP6152333B2 (ja) メディアコンテンツに対応する要約語を明示する装置、サーバ、プログラム及び方法
JP5836902B2 (ja) イベントに関するコメント文章のみ検出するイベントコメント文章検出装置、プログラム及び方法
KR100998815B1 (ko) Url을 이용하여 검색 광고를 제공하는 방법 및 그 방법을 채용한 시스템
Veeraiah et al. A novel approach for extraction and representation of main data from web pages to android application
KR20100076726A (ko) 검색 서비스 시스템 및 이를 이용한 검색 서비스 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160915

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170508

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170517

R150 Certificate of patent or registration of utility model

Ref document number: 6147629

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees