JP2012083914A - Electronic book analyzer, method, and program - Google Patents
Electronic book analyzer, method, and program Download PDFInfo
- Publication number
- JP2012083914A JP2012083914A JP2010228876A JP2010228876A JP2012083914A JP 2012083914 A JP2012083914 A JP 2012083914A JP 2010228876 A JP2010228876 A JP 2010228876A JP 2010228876 A JP2010228876 A JP 2010228876A JP 2012083914 A JP2012083914 A JP 2012083914A
- Authority
- JP
- Japan
- Prior art keywords
- page
- importance
- electronic book
- length
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、電子書籍分析装置及び方法及びプログラムに係り、特に、電子書籍を構成する各ページの重要度を判定するための電子書籍分析装置及び方法及びプログラムに関する。 The present invention relates to an electronic book analysis apparatus, method, and program, and more particularly, to an electronic book analysis apparatus, method, and program for determining the importance of each page constituting an electronic book.
電子書籍を構成する各ページの重要度を判定する必要がある場合は多い。 In many cases, it is necessary to determine the importance of each page constituting an electronic book.
例えば、ある事柄を調査していて、その事柄に関する電子書籍を見つけたとき、その電子書籍をすべて読むことなく重要なページを把握できれば、調査は効率的に進む。あるいは、電子書籍内で重要なページが判明すれば、時間の無い読者のために、電子書籍内の重要なページのみを提示する電子書籍速読支援サービスを実現できる。 For example, if a certain matter is being investigated and an electronic book related to the matter is found, if the important page can be grasped without reading all the electronic books, the investigation proceeds efficiently. Alternatively, if an important page is found in the electronic book, it is possible to realize an electronic book speed reading support service that presents only the important page in the electronic book for readers who do not have time.
これらの場合、電子書籍を構成する各ページの重要度を判定する必要があり、これは文書の重要度判定の問題とみなすことができる。 In these cases, it is necessary to determine the importance of each page constituting the electronic book, which can be regarded as a problem of document importance determination.
従来、文書の重要度判定にはTDIDF値がよく用いられる。TFとは文書dにおける単語tの頻度、IDFとは単語tが現れる相対文書頻度の逆数の対数である。ある単語tを含む文書dにおける単語tのTFIDF値は下記のように表される。
TFIDF値=(文書dにおける単語tの出現回数) × log{(総文書数)/(単語tを含む文書数)}
TFIDF値を計算することで、ある単語tを含む文書群の中で、単語tに関する文書として重要である可能性が高い文書を特定することができる。
Conventionally, the TDIDF value is often used to determine the importance of a document. TF is the frequency of word t in document d, and IDF is the logarithm of the reciprocal of the relative document frequency at which word t appears. The TFIDF value of word t in document d containing a certain word t is expressed as follows.
TFIDF value = (number of occurrences of word t in document d) × log {(total number of documents) / (number of documents including word t)}
By calculating the TFIDF value, it is possible to identify a document that is highly likely to be important as a document related to the word t in a document group including the certain word t.
また、ページ毎の重要度判定ではないが、学術論文は他論文を引用する機会が多く、他論文からの引用が多い論文を重要とみなすことができる(例えば、非特許文献1参照)。 In addition, although the degree of importance is not determined for each page, academic papers have many opportunities to cite other papers, and papers with many citations from other papers can be regarded as important (see, for example, Non-Patent Document 1).
しかしながら、膨大な量の電子書籍の各ページの重要度を、ユーザ、あるいは、電子書籍販売業者が人手で判定するのは人的・時間コストがかかりすぎて現実的ではない。 However, it is not practical for a user or an e-book seller to manually determine the importance of each page of a huge amount of e-books because it takes too much human and time costs.
一方で、前述のTFIDF値を用いることで、特定の単語tを含む文書群の中で、重要である可能性が高い文書を自動的に特定することができる。しかし、この方法は特定の単語tが与えられたときに、単語tに関する文書として重要であるかどうか判定できるだけである。すなわち、単語tへの関連を前提としない場合、電子書籍内のどのページが重要なのか判定することができない。 On the other hand, by using the above-described TFIDF value, it is possible to automatically specify a document that is highly likely to be important in a document group including a specific word t. However, this method can only determine whether it is important as a document for the word t given a specific word t. That is, if the relation to the word t is not assumed, it is not possible to determine which page in the electronic book is important.
また、非特許文献1のように引用関係に着目することで重要な電子書籍、電子書籍内のページを特定できる場合もあるが、学術論文や技術書以外では引用が頻繁に行われることは少ない。
In addition, there are cases where important electronic books and pages within electronic books can be identified by focusing on citation relationships as in Non-Patent
本発明は、上記の点に鑑みなされたもので、多くの電子書籍の各ページの重要度を効率的に判定することが可能な電子書籍分析装置及び方法及びプログラムを提供することを目的とする。 The present invention has been made in view of the above points, and an object thereof is to provide an electronic book analysis apparatus, method, and program capable of efficiently determining the importance of each page of many electronic books. .
上記の課題を解決するために、本発明(請求項1)は、電子書籍端末を含む、電子書籍が閲覧可能なコンピュータ機器で閲覧可能な電子書籍内の各ページの重要度を判定する電子書籍分析装置であって、
電子書籍閲覧者による閲覧行動情報を収集し、ページ情報記憶手段に格納する閲覧行動収集手段と、
前記ページ情報記憶手段の前記閲覧行動情報を集計して、各ページが閲覧されていた時間の長さに基づいて該ページの重要度を判定し、ページ重要度記憶手段に格納する重要度判定手段と、
前記ページ重要度記憶手段に格納されている重要度判定結果を出力する重要度出力手段と、を有する。
In order to solve the above problems, the present invention (Claim 1) is an electronic book that determines the importance of each page in an electronic book that can be browsed by a computer device that can browse the electronic book, including an electronic book terminal. An analyzer,
Browsing behavior collecting means for collecting browsing behavior information by an e-book reader and storing it in the page information storage means;
Importance determination means for counting the browsing behavior information of the page information storage means, determining the importance of the page based on the length of time each page has been browsed, and storing the importance in the page importance storage means When,
Importance level output means for outputting the importance level determination result stored in the page importance level storage means.
また、本発明(請求項2)は、前記閲覧行動情報に、各ページが閲覧されていた時間の長さ、該ページの文書長を含み、
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む。
Further, the present invention (Claim 2) includes, in the browsing behavior information, the length of time each page has been browsed, the document length of the page,
The importance determination means includes
Means for determining the importance of the page based on a normalization of the length of time each page of the browsing behavior information is browsed by the document length of the page;
また、本発明(請求項3)は、前記閲覧行動情報に、各ページが閲覧されていた時間の長さ、該ページの文書長を含み、
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む。
Further, according to the present invention (Claim 3), the browsing behavior information includes the length of time each page has been browsed, the document length of the page,
The importance determination means includes
Means for normalizing the length of time each page of the browsing behavior information was browsed within each viewer and determining the importance of the page based on the normalized page length. .
また、本発明(請求項4)は、前記閲覧行動情報に、各ページが閲覧されていた時間の長さ、該ページの文書長、各閲覧者の知識量を含み、
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記各閲覧者の知識量に応じた重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む。
Further, the present invention (Claim 4) includes, in the browsing behavior information, the length of time each page was browsed, the document length of the page, and the knowledge amount of each viewer,
The importance determination means includes
Normalized the length of time each page of the browsing behavior information was viewed within each viewer, weighted according to the amount of knowledge of each viewer, and normalized by the document length of the page Means for determining the importance of the page based on.
また、本発明(請求項5)は、前記閲覧行動情報に、各ページが閲覧されていた時間の長さ、該ページの文書長、各閲覧者の知識量、閲覧回数を含み、
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前期各閲覧者の知識量に応じた重みをかけ、同一閲覧者が複数回閲覧したものに重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む。
Further, the present invention (Claim 5) includes, in the browsing behavior information, the length of time each page has been browsed, the document length of the page, the knowledge amount of each viewer, and the number of browsing times,
The importance determination means includes
Normalize the length of time each page of the browsing behavior information has been viewed within each viewer, apply weight according to the amount of knowledge of each viewer in the previous term, and the same viewer viewed multiple times Means for determining the importance of the page based on weighted and normalized by the document length of the page;
また、本発明(請求項6)は、電子書籍端末を含む、電子書籍が閲覧可能なコンピュータ機器で閲覧可能な電子書籍内の各ページの重要度を判定する電子書籍分析方法であって、
ページ情報記憶手段、ページ重要度記憶手段、閲覧行動収集手段、重要度判定手段、重要度出力手段を有する装置において、
前記閲覧行動収集手段が、電子書籍閲覧者による閲覧行動情報を収集し、前記ページ情報記憶手段に格納する閲覧行動収集ステップと、
前記重要度判定手段が、前記ページ情報記憶手段の前記閲覧行動情報を集計して、各ページが閲覧されていた時間の長さに基づいて該ページの重要度を判定し、前記ページ重要度記憶手段に格納する重要度判定ステップと、
前記重要度出力手段が、前記ページ重要度記憶手段に格納されている重要度判定結果を出力する重要度出力ステップと、を行う。
The present invention (Claim 6) is an electronic book analysis method for determining the importance of each page in an electronic book that can be browsed by a computer device that can browse the electronic book, including an electronic book terminal,
In an apparatus having page information storage means, page importance storage means, browsing behavior collection means, importance determination means, importance output means,
The browsing behavior collection means collects browsing behavior information by an electronic book reader and stores it in the page information storage means;
The importance level determination unit aggregates the browsing behavior information of the page information storage unit, determines the importance level of the page based on the length of time each page has been browsed, and stores the page importance level storage An importance determination step to be stored in the means;
The importance output means performs an importance output step of outputting an importance determination result stored in the page importance storage means.
また、本発明(請求項7)は、前記ページ情報記憶手段において、
前記閲覧行動情報として、各ページが閲覧されていた時間の長さ、該ページの文書長、各閲覧者の知識量、閲覧回数を含み、
前記重要度判定ステップにおいて、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記各閲覧者の知識量に応じた重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前期各閲覧者の知識量に応じた重みをかけ、同一閲覧者が複数回閲覧したものに重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、のいずれかを行う。
The present invention (Claim 7) provides the page information storage means,
As the browsing behavior information, including the length of time each page was browsed, the document length of the page, the knowledge amount of each viewer, the number of browsing,
In the importance determination step,
Determining the importance of the page based on a normalization of the length of time each page of the browsing behavior information was browsed by the document length of the page;
Normalizing within each viewer the length of time each page of the browsing behavior information has been browsed, and determining the importance of the page based on what is normalized by the document length of the page;
Normalized the length of time each page of the browsing behavior information was viewed within each viewer, weighted according to the amount of knowledge of each viewer, and normalized by the document length of the page Determining the importance of the page based on
Normalize the length of time each page of the browsing behavior information has been viewed within each viewer, apply weight according to the amount of knowledge of each viewer in the previous term, and the same viewer viewed multiple times One of the steps of determining the importance of the page based on the weighted and normalized by the document length of the page is performed.
また、本発明(請求項8)は、請求項1乃至5のいずれか1項に記載の電子書籍分析装置を構成する各手段としてコンピュータを機能させるための電子書籍分析プログラムである。
Moreover, this invention (Claim 8) is an electronic book analysis program for functioning a computer as each means which comprises the electronic book analysis apparatus of any one of
上記のように、本発明では、ページの閲覧履歴により、閲覧された回数、表示時間の総和、表示時間の総和を文字数で除した値のいずれかをページ重要度とすることが可能であるため、ユーザや電子書籍販売業者の人手をかけなくても、ユーザが電子書籍を読むだけで自動的に膨大な量の電子書籍の各ページの重要度を自動的に判定することができる。 As described above, according to the present invention, the page importance can be any of the number of times viewed, the total display time, and the value obtained by dividing the total display time by the number of characters according to the page browsing history. The importance of each page of a huge amount of electronic books can be automatically determined only by the user reading the electronic book, without the need for the user or the electronic book seller.
以下図面と共に、本発明の実施の形態を説明する。 Embodiments of the present invention will be described below with reference to the drawings.
[第1の実施の形態]
本実施の形態では、電子書籍を構成する各ページ単位の重要度を判定する際に、ページ閲覧履歴により、閲覧された回数をページ重要度とする例を説明する。なお、ページとは電子書籍端末の表示単位でもよい。
[First Embodiment]
In the present embodiment, an example will be described in which when the importance level of each page constituting an electronic book is determined, the number of times of browsing is set as the page importance level based on the page browsing history. The page may be a display unit of the electronic book terminal.
図1は、本発明の第1の実施の形態におけるシステム構成を示す。 FIG. 1 shows a system configuration according to the first embodiment of the present invention.
同図に示すシステムは、サーバ部20、クライアント端末10、当該クライアント端末10に接続される電子書籍端末18から構成される。
The system shown in FIG. 1 includes a
図2は、本発明の第1の実施の形態におけるクライアント端末の構成を示す。 FIG. 2 shows the configuration of the client terminal according to the first embodiment of the present invention.
クライアント端末10は、端末情報判定部13、端末情報記憶部14、表示ページ判定部15、表示ページ情報記憶部16、クライアント側データ送受信部17からなり、例えば、汎用電子書籍端末に専用ソフトウェアをインストールすることで実現できる。
The
電子書籍端末18は、電子書籍記憶部11と電子書籍表示部12からなり、クライアント端末10に接続されている。
The
図3は、本発明の第1の実施の形態におけるサーバ部の構成を示す。 FIG. 3 shows the configuration of the server unit in the first embodiment of the present invention.
サーバ部20は、サーバ側データ送受信部21、ページ情報記憶部22、ページ重要度判定部23、ページ重要度記憶部24、ページ重要度出力部25からなり、例えば汎用サーバ機等で実現できる。
The
以下に、クライアント端末10の動作を説明する。
Hereinafter, the operation of the
図4は、本発明の第1の実施の形態におけるクライアント端末の動作のフローチャートである。 FIG. 4 is a flowchart of the operation of the client terminal according to the first embodiment of the present invention.
ステップ101) クライアント端末10の端末情報判定部13は、電子書籍端末18の端末情報を取得する。ここでは、端末情報として端末IDを取得するものとする。端末IDとは、電子書籍端末18を一意に特定できる情報であり、ここでは、電子書籍端末18の製造番号とする。取得した端末情報は図5の形式で端末情報記憶部14に格納する。
Step 101) The terminal
ステップ102) 電子書籍端末18の電子書籍記憶部11に格納されている電子書籍が読み込まれて電子書籍表示部12に表示されると、表示ページ情報判定部15は、電子書籍表示部12に表示されているページの表示ページ情報を取得する。表示されているページの情報は電子書籍端末18のシステムが把握していることが通常であり、ここでは、この情報を利用できるものとする。具体的には、書籍名、ページ、ページ内文字数、ページ表示時刻が表示ページ情報として取得するものとする。取得した表示ページ情報を図6の形式で表示ページ情報記憶部16に格納する。
Step 102) When the electronic book stored in the electronic book storage unit 11 of the
ステップ103) 電子書籍表示部12に表示されているページが、ステップ102の状態から他のページに変わった場合、あるいは、電子書籍の閲覧が終了した場合、表示ページ情報判定部15は、ステップ102で表示されていたページの表示が終了したと判定し、この時点の時刻をページ表示終了時刻とする。次に、表示ページ情報判定部15は、表示ページ情報記憶部16から該ページの表示開始時刻を取得し、ページの表示終了時刻との差を計算して、これをページ表示時間とする。
Step 103) When the page displayed on the electronic
表示ページ情報判定部15は、ページ表示終了時刻とページ表示時間を図7の形式でページ情報記憶部16に追記する。
The display page
ステップ104) クライアント側データ送受信部17は、既定条件が満たされると、端末情報記憶部14、表示ページ情報記憶部16に格納されている情報を結合してサーバ部20に送信し、表示ページ情報記憶部16の中身を消去する。なお、既定条件をここでは、「前回ステップ104終了時から10ページが読まれた場合か、あるいは、電子書籍の閲覧が終了した場合」とする。
Step 104) When the predetermined condition is satisfied, the client-side data transmitting / receiving
ステップ104が実施される直前のページ情報記憶部16の状態が図8であった場合、サーバ部に送信されるデータは図9のようになる。
When the state of the page
次に、サーバ部20の動作を説明する。
Next, the operation of the
図10は、本発明の第1の実施の形態におけるサーバ部の動作のフローチャートである。 FIG. 10 is a flowchart of the operation of the server unit in the first embodiment of the present invention.
ステップ201) サーバ部20のサーバ側データ送受信部21は、クライアント部10のクライアント側データ送受信部17から図9の形式で受信したデータを、同じ形式でページ情報記憶部22に格納する。
Step 201) The server-side data transmission /
ステップ202) 既定条件が満たされると、ページ重要度判定部23は、ページ情報記憶部22に格納されている情報を用いてページ毎にページ重要度を判定する。既定条件を、ここでは、前回ステップ203終了時から1時間経過した場合とする。各ページのページ重要度は、各電子書籍端末に該ページが表示された回数とする。すなわち、図11の情報がページ情報記憶部22に格納されているとき、ページ重要度判定部23は図12のように各ページのページ重要度を判定し、各ページ重要度を図13の形式でページ重要度記憶部24に格納する。ここで、ページ重要度はページが表示された回数が多いほど、ページ重要度が高くなるように設定する。
Step 202) When the predetermined condition is satisfied, the page
ステップ203) ページ重要度出力部26は、ページ重要度記憶部25に格納されている各ページのページ重要度を走査し、電子書籍毎にページ重要度が高い順に上位N件を抽出し、図14に示すように出力する。図14では、上位3件について、書籍名とページ、当該ページの重要度を出力する例を示している。
Step 203) The page importance output unit 26 scans the page importance of each page stored in the page
[第2の実施の形態]
重要なページはユーザがじっくりと長い時間をかけて読む場合が多い。しかし、前述の第1の実施の形態では、各ページが読まれていた時間が考慮されていない。
[Second Embodiment]
Important pages are often read by users over time. However, in the above-described first embodiment, the time during which each page has been read is not taken into consideration.
本実施の形態は、第1の実施の形態を一部改良し、各ページが読まれていた時間を考慮する。 In the present embodiment, the first embodiment is partially improved, and the time when each page is read is taken into consideration.
クライアント部、サーバ部の構成、及び、ステップ101〜201,203の処理は第1の実施の形態と同様であるので、その説明を省略する。
Since the configuration of the client unit and the server unit and the processing of
以下では、第1の実施の形態と異なるステップ202に対応する処理について説明する。 Hereinafter, a process corresponding to step 202 different from the first embodiment will be described.
ページ重要度判定部23は、既定条件が満たされると、ページ情報記憶部22に格納されている情報を用いてページ毎にページ重要度を判定する。ここでは、既定条件を、前回ステップ203終了時から1時間経過した場合とする。各ページのページ重要度は、各電子書籍端末における該ページのページ表示時間(秒数)の総和とする。すなわち、図11の情報がページ情報記憶部22に格納されているとき、ページ重要度判定部23は図15のように、ページ表示時間の総和に基づいて各ページのページ重要度を判定し、各ページ重要度を図16の形式でページ重要度記憶部24に格納する。
When the predetermined condition is satisfied, the page
[第3の実施の形態]
ページ内文字数が多ければ読むのには時間がかかる。これはページの内容の重要さとは独立である。しかし、前述の第2の実施の形態では、各ページが読まれていた時間のみを考慮し、ページ内文字数は考慮していない。本実施の形態は、第2の実施の形態を一部改良し、各ページのページ内文字数も考慮する。
[Third Embodiment]
It takes time to read if there are many characters on the page. This is independent of the importance of the page content. However, in the above-described second embodiment, only the time during which each page is read is considered, and the number of characters in the page is not considered. This embodiment is a partial improvement of the second embodiment, and considers the number of characters in each page.
クライアント部、サーバ部の構成、及び、ステップ101〜201,203の処理は第1の実施の形態と同様であるので、その説明を省略する。
Since the configuration of the client unit and the server unit and the processing of
以下では、第1の実施の形態と異なるステップ202に対応する処理について説明する。 Hereinafter, a process corresponding to step 202 different from the first embodiment will be described.
ページ重要度判定部23は、既定条件が満たされると、ページ情報記憶部22に格納されている情報を用いてページ毎にページ重要度を判定する。ここでは、既定条件を、前回ステップ203終了時から1時間経過した場合とする。
When the predetermined condition is satisfied, the page
ページ重要度判定部23は、重要度として、各ページのページ重要度は、各電子書籍端末に該ページのページ表示時間(秒数)の総和を、ページ内文字数で割ったものを採用する。すなわち、図11の情報がページ情報記憶部22に格納されているとき、ページ重要度判定部23は、図17のように、各ページのページ内文字数に基づいて、各ページのページ重要度を判定し、各ページ重要度を図18の形式でページ重要度記憶部24に格納する。
As the importance level, the page importance
[第4の実施の形態]
各ユーザが電子書籍を読む速度には個人差がある。しかし、第3の実施の形態では、各ページが読まれていた時間、ページ内文字数のみを考慮し、各ユーザの読む速度の個人差は考慮していない。
[Fourth Embodiment]
There are individual differences in the speed at which each user reads an electronic book. However, in the third embodiment, only the time during which each page is read and the number of characters in the page are considered, and individual differences in the reading speed of each user are not considered.
本実施の形態は、第3の実施の形態を一部改良し、各ユーザの読む速度の個人差も考慮する。なお、ここでは1台の電子書籍端末は1人のユーザが用いる場合が多いため、ユーザを端末IDで識別するが、電子書籍端末使用時のユーザID等、より各ユーザを高精度に特定できる情報が取得可能であればこれを用いても構わない。 This embodiment partially improves the third embodiment, and considers individual differences in the reading speed of each user. In this case, since one electronic book terminal is often used by one user, the user is identified by the terminal ID. However, each user can be identified with higher accuracy such as a user ID when using the electronic book terminal. If information can be acquired, this may be used.
クライアント部、サーバ部の構成、及び、ステップ101〜201,203の処理は第1の実施の形態と同様であるので、その説明を省略する。
Since the configuration of the client unit and the server unit and the processing of
以下では、第1の実施の形態と異なるステップ202に対応する処理について説明する。 Hereinafter, a process corresponding to step 202 different from the first embodiment will be described.
ページ重要度判定部23は、既定条件が満たされると、ページ情報記憶部22に格納されている情報を用いてページ毎にページ重要度を判定する。ここでは、既定条件を、前回ステップ203終了時から1時間経過した場合とする。各ページのページ重要度は、各電子書籍端末に該ページのページ表示時間(秒数)を、各端末ID内で正規化したものの総和を、ページ内文字数で割ったものとする。
When the predetermined condition is satisfied, the page
すなわち、図11の情報がページ情報記憶部22に格納されているとき、ページ重要度判定部23は図19のように、ページ表示時間が各端末ID内で最大1、最小0となるように正規化し、メモリ(図示せず)に格納する。
That is, when the information of FIG. 11 is stored in the page
例えば、ページ情報記憶部22内の全データの中で、端末IDがABC-1234567890であるデータのページ表示時間が44sec、54sec、49sec、74secであった場合、正規化すると順に0、0.33、0.17、1となる。
For example, among all data in the page
そして、ページ重要度判定部23は、メモリ(図示せず)に格納されているページ情報の端末ID内で正規化したページ表示時間に基づいて、図20のように各ページのページ重要度を判定し、各ページ重要度を図21の形式でページ重要度記憶部24に格納する。
Then, the page importance
[第5の実施の形態]
各ユーザの知識には個人差がある。例えば、知識のある人が読んだページは重要である場合が多い。しかし、第4の実施の形態では、各ページが読まれていた時間、各ユーザの読む速度の個人差、ページ内文字数のみを考慮し、各ユーザの知識の個人差は考慮していない。
[Fifth Embodiment]
There are individual differences in the knowledge of each user. For example, pages read by knowledgeable people are often important. However, in the fourth embodiment, only the time during which each page is read, the individual difference in the reading speed of each user, and the number of characters in the page are considered, and the individual difference in knowledge of each user is not considered.
本実施の形態は、第4の実施の形態を一部改良し、各ユーザの知識の個人差も考慮する。なお、ここでは多くの電子書籍のページを読んだユーザが知識が高いと判定しているが、各ユーザの職業等、各ユーザの知識をより高精度に特定できる情報が取得可能であればこれを用いても構わない。 This embodiment is a partial improvement of the fourth embodiment and takes into account individual differences in the knowledge of each user. Here, it is determined that a user who has read many electronic book pages has high knowledge. However, if information that can specify each user's knowledge with high accuracy can be acquired, such as the occupation of each user, this can be obtained. May be used.
クライアント部、サーバ部の構成、及び、ステップ101〜201,203の処理は第1の実施の形態と同様であるので、その説明を省略する。
Since the configuration of the client unit and the server unit and the processing of
以下では、第1の実施の形態と異なるステップ202に対応する処理について説明する。 Hereinafter, a process corresponding to step 202 different from the first embodiment will be described.
ページ重要度判定部23は、既定条件が満たされると、ページ情報記憶部22に格納されている情報を用いてページ毎にページ重要度を判定する。ここでは、既定条件を、前回ステップ203終了時から1時間経過した場合とする。
When the predetermined condition is satisfied, the page
本実施の形態では、各ページのページ重要度は、各電子書籍端末に該ページのページ表示時間(秒数)を、各端末ID内で正規化し、端末ID内で表示された全ページ数をかけたものの総和を、ページ内文字数で割ったものとする。 In the present embodiment, the page importance of each page is obtained by normalizing the page display time (seconds) of each page to each electronic book terminal within each terminal ID, and calculating the total number of pages displayed within the terminal ID. Let the sum of the multiplied items be divided by the number of characters in the page.
すなわち、図11の情報がページ情報記憶部22に格納されているとき、ページ重要度判定部23は図22のように、ページ表示時間が各端末ID内で最大1、最小0となるように正規化すると同時に、各端末ID内で表示された全ページ数も集計し、メモリ(図示せず)に格納する。そして、ページ重要度判定部23は、メモリ(図示せず)に格納されたデータから、端末ID内で正規化したページ表示時間に各端末ID内で表示された全ページ数を掛けたものの総和に基づいて、図23のように各ページのページ重要度を判定し、各ページ重要度を図24の形式でページ重要度記憶部24に格納する。
That is, when the information of FIG. 11 is stored in the page
[第6の実施の形態]
同一ユーザが繰り返し閲覧するページは該ユーザが重要とみなしている場合が多い。しかし、第5の実施の形態では、各ページが読まれていた時間、各ユーザの読む速度の個人差、各ユーザの知識の個人差、ページ内文字数のみを考慮し、同一ユーザの繰り返し閲覧回数は考慮していない。例えば、図11において、書籍Bの100ページは端末ID JKL-4567890123によって2回閲覧されているが、この点が考慮されていない。
[Sixth Embodiment]
In many cases, pages that are repeatedly viewed by the same user are considered important by the user. However, in the fifth embodiment, the number of repeated viewings of the same user is considered in consideration of only the time during which each page is read, individual differences in reading speed of each user, individual differences in knowledge of each user, and the number of characters in the page. Is not considered. For example, in FIG. 11,
本実施の形態は、第5の実施の形態を一部改良し、同一ユーザの繰り返し閲覧回数も考慮する。 This embodiment is a partial improvement of the fifth embodiment, and considers the number of repeated viewings of the same user.
クライアント部、サーバ部の構成、及び、ステップ101〜201,203の処理は第1の実施の形態と同様であるので、その説明を省略する。
Since the configuration of the client unit and the server unit and the processing of
以下では、第1の実施の形態と異なるステップ202に対応する処理について説明する。 Hereinafter, a process corresponding to step 202 different from the first embodiment will be described.
ページ重要度判定部23は、既定条件が満たされると、ページ情報記憶部22に格納されている情報を用いてページ毎にページ重要度を判定する。ここでは、既定条件を、前回ステップ203終了時から1時間経過した場合とする。
When the predetermined condition is satisfied, the page
本実施の形態では、各ページのページ重要度は、各電子書籍端末に該ページのページ表示時間(秒数)を、各端末ID内で正規化し、各端末ID内で表示された全ページ数をかけ、各端末IDで表示された回数をかけたものの総和を、ページ内文字数で割ったものとする。 In this embodiment, the page importance of each page is obtained by normalizing the page display time (seconds) of each page to each electronic book terminal within each terminal ID, and displaying the total number of pages displayed within each terminal ID. Multiplied by the number of times displayed by each terminal ID is divided by the number of characters in the page.
すなわち、図11の情報がページ情報記憶部22に格納されているとき、ページ重要度判定部23は、図25のように、ページ表示時間が各端末ID内で最大1、最小0となるように正規化し、各端末ID内で表示された全ページ数を集計すると同時に、ページ表示終了時刻と端末IDに基づいてそのページが各端末ID内で何回目に表示されたか集計し、メモリ(図示せず)に格納する。
That is, when the information of FIG. 11 is stored in the page
そして、ページ重要度判定部23は、メモリ(図示せず)に格納されたデータから、図26のように、端末ID内で正規化されたページ表示時間に各端末ID内で表示されたページ数を掛け、各端末ID内で表示された回数を掛けたものの総和に基づいて、各ページのページ重要度を判定し、各ページ重要度を図27の形式でページ重要度記憶部24に格納する。
Then, the page
上記の第1〜第6の実施の形態におけるサーバ部20の構成要素の動作をプログラムとして構築し、電子書籍分析装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
The operation of the components of the
また、構築されたプログラムをハードディスク、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。 Further, the constructed program can be stored in a portable storage medium such as a hard disk, a flexible disk, or a CD-ROM, and can be installed or distributed in a computer.
なお、本発明は上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.
10 クライアント端末
11 電子書籍記憶部
12 電子書籍表示部
13 端末情報判定部
14 端末情報記憶部
15 表示ページ情報判定部
16 表示ページ情報記憶部
17 クライアント側データ送受信部
18 電子書籍端末
20 サーバ部
21 サーバ側データ送受信部
22 ページ情報記憶部
23 ページ重要度判定部
24 ページ重要度記憶部
25 ページ重要度出力部
DESCRIPTION OF
Claims (8)
電子書籍閲覧者による閲覧行動情報を収集し、ページ情報記憶手段に格納する閲覧行動収集手段と、
前記ページ情報記憶手段の前記閲覧行動情報を集計して、各ページが閲覧されていた時間の長さに基づいて該ページの重要度を判定し、ページ重要度記憶手段に格納する重要度判定手段と、
前記ページ重要度記憶手段に格納されている重要度判定結果を出力する重要度出力手段と、
を有することを特徴とする電子書籍分析装置。 An electronic book analyzer that determines the importance of each page in an electronic book that can be browsed by a computer device that can browse an electronic book, including an electronic book terminal,
Browsing behavior collecting means for collecting browsing behavior information by an e-book reader and storing it in the page information storage means;
Importance determination means for counting the browsing behavior information of the page information storage means, determining the importance of the page based on the length of time each page has been browsed, and storing the importance in the page importance storage means When,
Importance output means for outputting importance determination results stored in the page importance storage means;
The electronic book analyzer characterized by having.
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む
請求項1記載の電子書籍分析装置。 The browsing behavior information includes the length of time each page has been browsed, the document length of the page,
The importance determination means includes
2. The electronic book analysis according to claim 1, further comprising means for determining the importance of the page based on a normalization of a length of time during which each page of the browsing behavior information is browsed by a document length of the page. apparatus.
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む
請求項1記載の電子書籍分析装置。 The browsing behavior information includes the length of time each page has been browsed, the document length of the page,
The importance determination means includes
Means for normalizing the length of time each page of the browsing behavior information was browsed within each viewer and determining the importance of the page based on the normalized page length. The electronic book analysis apparatus according to claim 1.
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記各閲覧者の知識量に応じた重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む、
請求項1記載の電子書籍分析装置。 The browsing behavior information includes the length of time each page has been browsed, the document length of the page, the knowledge amount of each viewer,
The importance determination means includes
Normalized the length of time each page of the browsing behavior information was viewed within each viewer, weighted according to the amount of knowledge of each viewer, and normalized by the document length of the page Including means for determining the importance of the page based on
The electronic book analysis apparatus according to claim 1.
前記重要度判定手段は、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前期各閲覧者の知識量に応じた重みをかけ、同一閲覧者が複数回閲覧したものに重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定する手段を含む
請求項1記載の電子書籍分析装置。 The browsing behavior information includes the length of time each page has been browsed, the document length of the page, the knowledge amount of each viewer, the number of browsing times,
The importance determination means includes
Normalize the length of time each page of the browsing behavior information has been viewed within each viewer, apply weight according to the amount of knowledge of each viewer in the previous term, and the same viewer viewed multiple times 2. The electronic book analyzing apparatus according to claim 1, further comprising means for determining the importance of the page based on a weighted value normalized by the document length of the page.
ページ情報記憶手段、ページ重要度記憶手段、閲覧行動収集手段、重要度判定手段、重要度出力手段を有する装置において、
前記閲覧行動収集手段が、電子書籍閲覧者による閲覧行動情報を収集し、前記ページ情報記憶手段に格納する閲覧行動収集ステップと、
前記重要度判定手段が、前記ページ情報記憶手段の前記閲覧行動情報を集計して、各ページが閲覧されていた時間の長さに基づいて該ページの重要度を判定し、前記ページ重要度記憶手段に格納する重要度判定ステップと、
前記重要度出力手段が、前記ページ重要度記憶手段に格納されている重要度判定結果を出力する重要度出力ステップと、
を行うことを特徴とする電子書籍分析方法。 An electronic book analysis method for determining the importance of each page in an electronic book that can be browsed by a computer device that can browse an electronic book, including an electronic book terminal,
In an apparatus having page information storage means, page importance storage means, browsing behavior collection means, importance determination means, importance output means,
The browsing behavior collection means collects browsing behavior information by an electronic book reader and stores it in the page information storage means;
The importance level determination unit aggregates the browsing behavior information of the page information storage unit, determines the importance level of the page based on the length of time each page has been browsed, and stores the page importance level storage An importance determination step to be stored in the means;
The importance output means for outputting the importance determination result stored in the page importance storage means;
The electronic book analysis method characterized by performing.
前記閲覧行動情報として、各ページが閲覧されていた時間の長さ、該ページの文書長、各閲覧者の知識量、閲覧回数を含み、
前記重要度判定ステップにおいて、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前記各閲覧者の知識量に応じた重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、
前記閲覧行動情報の前記各ページが閲覧されていた時間の長さを各閲覧者内で正規化し、前期各閲覧者の知識量に応じた重みをかけ、同一閲覧者が複数回閲覧したものに重みをかけ、前記ページの文書長で正規化したものに基づいて該ページの重要度を判定するステップ、
のいずれかを行う
請求項6記載の電子書籍分析方法。 The page information storage means
As the browsing behavior information, including the length of time each page was browsed, the document length of the page, the knowledge amount of each viewer, the number of browsing,
In the importance determination step,
Determining the importance of the page based on a normalization of the length of time each page of the browsing behavior information was browsed by the document length of the page;
Normalizing within each viewer the length of time each page of the browsing behavior information has been browsed, and determining the importance of the page based on what is normalized by the document length of the page;
Normalized the length of time each page of the browsing behavior information was viewed within each viewer, weighted according to the amount of knowledge of each viewer, and normalized by the document length of the page Determining the importance of the page based on
Normalize the length of time each page of the browsing behavior information has been viewed within each viewer, apply weight according to the amount of knowledge of each viewer in the previous term, and the same viewer viewed multiple times Determining the importance of the page based on weighted and normalized by the document length of the page;
The electronic book analysis method of Claim 6 which performs any of these.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010228876A JP5469036B2 (en) | 2010-10-08 | 2010-10-08 | Electronic book analyzing apparatus, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010228876A JP5469036B2 (en) | 2010-10-08 | 2010-10-08 | Electronic book analyzing apparatus, method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012083914A true JP2012083914A (en) | 2012-04-26 |
JP5469036B2 JP5469036B2 (en) | 2014-04-09 |
Family
ID=46242722
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010228876A Expired - Fee Related JP5469036B2 (en) | 2010-10-08 | 2010-10-08 | Electronic book analyzing apparatus, method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5469036B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014160414A (en) * | 2013-02-20 | 2014-09-04 | Fuji Xerox Co Ltd | Data processing device, data processing system and program |
JP2015148990A (en) * | 2014-02-07 | 2015-08-20 | Necフィールディング株式会社 | Management system, terminal apparatus, information management method and information management program |
JP2016024586A (en) * | 2014-07-18 | 2016-02-08 | ヤフー株式会社 | Information processing device, information processing method, and program |
KR101612782B1 (en) * | 2014-03-18 | 2016-04-15 | 홍익대학교 산학협력단 | System and method to manage user reading |
JP2020135541A (en) * | 2019-02-21 | 2020-08-31 | デジタル・アドバタイジング・コンソーシアム株式会社 | program |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000353170A (en) * | 1999-06-10 | 2000-12-19 | Sony Corp | Electronic book display device and display method therefor |
JP2007316934A (en) * | 2006-05-25 | 2007-12-06 | Fujitsu Ltd | Information processor, information processing method and program |
-
2010
- 2010-10-08 JP JP2010228876A patent/JP5469036B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000353170A (en) * | 1999-06-10 | 2000-12-19 | Sony Corp | Electronic book display device and display method therefor |
JP2007316934A (en) * | 2006-05-25 | 2007-12-06 | Fujitsu Ltd | Information processor, information processing method and program |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014160414A (en) * | 2013-02-20 | 2014-09-04 | Fuji Xerox Co Ltd | Data processing device, data processing system and program |
JP2015148990A (en) * | 2014-02-07 | 2015-08-20 | Necフィールディング株式会社 | Management system, terminal apparatus, information management method and information management program |
KR101612782B1 (en) * | 2014-03-18 | 2016-04-15 | 홍익대학교 산학협력단 | System and method to manage user reading |
JP2016024586A (en) * | 2014-07-18 | 2016-02-08 | ヤフー株式会社 | Information processing device, information processing method, and program |
JP2020135541A (en) * | 2019-02-21 | 2020-08-31 | デジタル・アドバタイジング・コンソーシアム株式会社 | program |
Also Published As
Publication number | Publication date |
---|---|
JP5469036B2 (en) | 2014-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5218544B2 (en) | E-book trial reading data creation device and creation method | |
JP5469036B2 (en) | Electronic book analyzing apparatus, method and program | |
JP6310539B1 (en) | Information processing system, information processing method, and information processing program | |
JP2011154467A (en) | Retrieval result ranking method and system | |
CN108228906A (en) | For generating the method and apparatus of information | |
JP2008152606A (en) | Information recommendation system | |
US8346799B1 (en) | Recent content rank adjustment with inverted decay | |
JP2011186795A (en) | Information system, program, and information processing method | |
JP2005107688A (en) | Information display method and system and information display program | |
JP6055567B1 (en) | Information processing apparatus, information processing method, and information processing program | |
JP2012141683A (en) | Advertisement information providing device | |
CN110852794A (en) | Novel recommendation method and device | |
JP5411226B2 (en) | Information providing system, list generation device, program, and user management device | |
CN108694174A (en) | Content launches the analysis method and device of data | |
CN111797349B (en) | Method and equipment for recommending books based on target content collection operation of reading pages | |
JP6693912B2 (en) | Information processing apparatus, information processing method, and information processing program | |
JP5439678B1 (en) | Personality analyzer and personality analysis program | |
US20060106875A1 (en) | Information collection system, information collection device, terminal device management program, information collection management program, information collection management method, and terminal device management method | |
US20140089525A1 (en) | Compressed analytics data for multiple recurring time periods | |
JP4490029B2 (en) | Information analysis apparatus, control method therefor, information analysis system, and program | |
CN110796453A (en) | E-commerce club member grade processing method and device | |
JP2012118705A (en) | Display device and display method | |
CN107256251B (en) | Application software searching method and device and server | |
JP2002298015A (en) | Advertisement evaluation system, advertisement evaluation method, and advertisement evaluation program | |
JP2008186431A (en) | Information retrieval system, information retrieval device, information retrieval result output method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130123 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20131001 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131112 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5469036 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |