JP6492889B2 - Server apparatus, program, and information providing method - Google Patents
Server apparatus, program, and information providing method Download PDFInfo
- Publication number
- JP6492889B2 JP6492889B2 JP2015074071A JP2015074071A JP6492889B2 JP 6492889 B2 JP6492889 B2 JP 6492889B2 JP 2015074071 A JP2015074071 A JP 2015074071A JP 2015074071 A JP2015074071 A JP 2015074071A JP 6492889 B2 JP6492889 B2 JP 6492889B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- content
- user
- sentence
- content information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、通信端末装置に情報を提供するサーバ装置、そのプログラム、及び情報提供方法に関する。 The present invention relates to a server device that provides information to a communication terminal device, a program thereof, and an information providing method.
近年、インターネットなどのネットワーク及びパーソナルコンピュータなどの通信端末装置の発達に伴って、書籍、ニュース等の記事、及び、商品またはサービス等の広告(以下、まとめて「コンテンツ」という。)を、ネットワークまたは記録媒体を介して電子的に閲覧することが一般化している。また、最近では、通信機能を有する携帯ゲーム機器、タブレット型携帯端末装置、携帯用電話機などの携帯可能な携帯用通信端末装置を介して電子書籍を閲覧させることも多く行われている。 In recent years, with the development of networks such as the Internet and communication terminal devices such as personal computers, articles such as books, news, etc., and advertisements of goods or services (hereinafter collectively referred to as “contents”) are transmitted to the network or the network. Electronic browsing through recording media has become common. Recently, electronic books are often browsed through portable portable communication terminal devices such as portable game devices having a communication function, tablet portable terminal devices, and portable telephones.
このような状況下において、ネットワークを用いて書籍などのコンテンツを購入したユーザに対し、購入したコンテンツとは別のコンテンツのコンテンツ情報を提供するサービスが行われるようになってきた。 Under such circumstances, services for providing content information of content different from the purchased content to users who have purchased content such as books using a network have been provided.
例えば、ユーザが過去に購入した各書籍のキーワード・ベクトルをカテゴリ別に合成してユーザプロファイルを生成するとともに、書籍データベースを基にして、各書籍にキーワード・ベクトルを生成し、ユーザプロファイルのキーワード・ベクトルと未購入の各書籍のキーワード・ベクトルの類似度を計算することによって、類似度の高い未購入書籍を推奨する技術が知られている(例えば、特許文献1)。 For example, a user profile is generated by synthesizing a keyword vector of each book previously purchased by the user by category, and a keyword vector is generated for each book based on the book database. And a technique for recommending unpurchased books with a high degree of similarity by calculating the similarity of the keyword vector of each unpurchased book (for example, Patent Document 1).
しかしながら、上記特許文献により開示された技術を用いたシステムは、キーワードを用いてベクトルを生成して類似度を算出するに過ぎないため、算出される類似度は、キーワードに拘束される。その結果、推奨する情報は次第に目新しさが失われ、ユーザは、意外性を有する情報を入手することができなくなる。 However, since the system using the technique disclosed in the above-mentioned patent document only calculates a similarity by generating a vector using a keyword, the calculated similarity is constrained by the keyword. As a result, the novelty of the recommended information is gradually lost, and the user cannot obtain unexpected information.
本発明は、上記課題を解決するためになされたものであり、その目的は、ユーザにとって有益性と意外性の両方を兼ね備えたコンテンツ情報を提供することが可能なサーバ装置等を提供することにある。 The present invention has been made to solve the above-described problems, and an object of the present invention is to provide a server device and the like that can provide content information having both usefulness and unexpectedness for the user. is there.
(1)上述した課題を解決するための本発明のサーバ装置は、通信端末装置とネットワークを介して接続され、文章を含むコンテンツに関するコンテンツ情報を提供するサーバ装置であって、前記コンテンツ情報が登録されたコンテンツ情報データベース及びユーザに関するユーザ情報が登録されたユーザ管理データベースを管理するデータベース管理手段と、前記コンテンツの文章内における文字の配列の特性を数値化した文章筆致特徴量を含むコンテンツ情報を取得するコンテンツ情報取得手段と、前記コンテンツを解析し、該コンテンツの文章筆致特徴量を含むコンテンツ情報を抽出するコンテンツ情報抽出手段と、前記コンテンツ情報取得手段により取得された前記文章筆致特徴量と、前記コンテンツ情報抽出手段が前記コンテンツ情報データベースに登録された各コンテンツから抽出した文章筆致特徴量と、を比較することによって、類似度を算出する類似度算出手段と、算出された前記類似度に基づいて推薦情報を生成する推薦情報生成手段と、生成された推薦情報をユーザに提供する情報提供手段と、を備える構成を有している。 (1) A server device of the present invention for solving the above-described problem is a server device that is connected to a communication terminal device via a network and provides content information regarding content including text, and the content information is registered. A database management means for managing the content information database and a user management database in which user information related to the user is registered, and content information including a sentence stroke characteristic amount obtained by quantifying the character arrangement characteristic in the sentence of the content Content information acquisition means, content information extraction means for analyzing the content and extracting content information including the text stroke feature quantity of the content, the text stroke feature quantity acquired by the content information acquisition means, Content information extraction means is the content Similarity calculation means for calculating similarity by comparing sentence stroke feature amounts extracted from each content registered in the information database, and recommendation information for generating recommendation information based on the calculated similarity It has a configuration comprising generation means and information provision means for providing the generated recommendation information to the user.
この構成を有する本発明のサーバ装置は、ユーザのコンテンツに対する嗜好性とコンテンツとの類似度を算出することによってコンテンツに関する情報をユーザに提供するので、ユーザにとって有益性を有する情報を提供することができる。 Since the server device of the present invention having this configuration provides the user with information related to the content by calculating the user's preference for the content and the similarity between the content, the server device can provide information that is beneficial to the user. it can.
特に、コンテンツの文章筆致特徴量に基づいて類似度を算出するので、ジャンルや著作者などのカテゴリに限定されずに広範囲にわたるコンテンツとの間で類似度を算出することができ、ユーザにとって新たな知識などを取得させることが可能な有益性及びユーザが予想しなかった意外性を有する情報をユーザに提供することができる。 In particular, since the similarity is calculated based on the content stroke characteristic amount of the content, it is possible to calculate the similarity with a wide range of content without being limited to categories such as genre and author, which is new to the user. It is possible to provide the user with information that has the benefit of being able to acquire knowledge and the like and the unexpectedness that the user did not expect.
(2)また、本発明に係るサーバ装置は、前記データベース管理手段が、前記ユーザによって購入された前記コンテンツの文章筆致特徴量に基づいて算出された平均文章筆致特徴量を含むコンテンツ情報を前記ユーザ毎に前記ユーザ管理データベースに登録し、前記コンテンツ情報取得手段が、所定の前記ユーザの前記平均文章筆致特徴量を前記文章筆致特徴量として前記ユーザ情報データベースから取得する構成を有している。 (2) Further, in the server device according to the present invention, the database management unit stores content information including an average sentence writing feature amount calculated based on a sentence writing feature amount of the content purchased by the user. Each content is registered in the user management database, and the content information acquisition unit acquires the average sentence stroke feature amount of a predetermined user from the user information database as the sentence stroke feature amount.
この構成を有する本発明のサーバ装置は、これまでにユーザが購入したコンテンツに関する情報を利用することによって、ユーザの嗜好性に合致したコンテンツに関する情報を提供することができる。 The server device of the present invention having this configuration can provide information on content that matches the user's preference by using information on content that has been purchased by the user so far.
(3)また、本発明に係るサーバ装置は、前記文章筆致特徴量が、前記コンテンツにおける文章全体に占める仮名の割合を含む構成を有している。 (3) Moreover, the server apparatus according to the present invention has a configuration in which the sentence stroke feature amount includes a ratio of kana to the entire sentence in the content.
仮名が占める割合は、コンテンツを構成する文章の文字密度ともいうべき特性を有しており、文章全体に占める仮名の割合が大きな文章は文字密度が低い印象を与え、仮名の占める割合が小さな文章は文字密度が高い印象を与える。 The proportion of kana has a characteristic that can be called the character density of the sentences that make up the content.Sentences with a high percentage of kana in the whole sentence give the impression that the character density is low, and sentences with a small percentage of kana Gives the impression of high character density.
この構成を有する本発明のサーバ装置は、仮名比率を含む文章筆致特徴量を利用して類似度を算出するので、コンテンツを構成する文章の文字密度についてユーザの好みに合致した情報を提供することができる。 Since the server device of the present invention having this configuration calculates the similarity by using the text writing feature amount including the kana ratio, it provides information that matches the user's preference regarding the character density of the text constituting the content. Can do.
(4)また、本発明に係るサーバ装置は、前記文章筆致特徴量が、前記コンテンツにおける文章を構成する各段落に含まれる文字数の平均値を含む構成を有している。 (4) Moreover, the server apparatus which concerns on this invention has the structure in which the said text stroke feature-value contains the average value of the number of characters contained in each paragraph which comprises the text in the said content.
段落に含まれる文字数は、文章のリズムに影響を与える。 The number of characters included in a paragraph affects the rhythm of the sentence.
この構成を有する本発明のサーバ装置では、文章筆致特徴量が各段落に含まれる文字数の平均値を含むので、ユーザの好みに合致したリズム感を有するコンテンツの情報を提供することができる。 In the server device of the present invention having this configuration, the sentence stroke feature amount includes the average value of the number of characters included in each paragraph, so that it is possible to provide information on content having a rhythm feeling that matches the user's preference.
(5)また、本発明に係るサーバ装置は、前記文章筆致特徴量は、鉤括弧により表される会話文が、前記コンテンツにおける文章に対して占める割合を含む構成を有している。 (5) Further, the server device according to the present invention has a configuration in which the sentence stroke feature amount includes a ratio of a conversation sentence represented by brackets to a sentence in the content.
文章に含まれる会話文は、当該文章に対するリズム感やイメージに影響を与える。 The conversational sentence included in the sentence affects the rhythm and image of the sentence.
この構成を有する本発明のサーバ装置は、文章筆致特徴量が会話文の前記コンテンツにおける文章に対して占める割合を含むので、ユーザの好みに合致したリズム感等を有するコンテンツの情報を提供することができる。 The server device of the present invention having this configuration includes the ratio of the sentence stroke feature amount to the sentence in the content of the conversation sentence, and therefore provides information on the content having a rhythm feeling that matches the user's preference. Can do.
(6)また、本発明に係るサーバ装置は、前記データベース管理手段は、前記コンテンツが属するカテゴリを含む前記コンテンツ情報を当該コンテンツ毎に前記コンテンツ情報データベースに登録するとともに、前記ユーザによって購入された前記コンテンツのカテゴリを示すカテゴリ情報を含む前記コンテンツ情報をユーザ情報データベースに登録し、前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に基づいて、前記カテゴリ毎に推薦情報を生成する構成を有している。 (6) In the server device according to the present invention, the database management unit registers the content information including the category to which the content belongs in the content information database for each content, and the purchase by the user. The content information including category information indicating a content category is registered in a user information database, and the recommendation information generation unit generates recommendation information for each category based on the content information acquired by the content information acquisition unit. It has the composition to do.
この構成を有する本発明のサーバ装置は、コンテンツが属するカテゴリ毎に推薦情報を生成して提供するので、コンテンツが属するカテゴリの特性に合致した情報をユーザに提供することができる。 Since the server apparatus of the present invention having this configuration generates and provides recommendation information for each category to which the content belongs, it is possible to provide information that matches the characteristics of the category to which the content belongs to the user.
(7)また、本発明に係るサーバ装置は、前記コンテンツ情報登録手段が、前記ユーザによって購入された前記コンテンツのカテゴリを示すカテゴリ情報をさらに含む前記コンテンツ情報をユーザ情報データベースに登録し、前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に含まれるカテゴリ情報に基づいて、該カテゴリ情報と同一のカテゴリ情報を有するコンテンツのみ、又は、該カテゴリ情報とは異なるカテゴリ情報を有するコンテンツのみを選択する構成を有している。 (7) In the server device according to the present invention, the content information registration unit registers the content information further including category information indicating a category of the content purchased by the user in a user information database, and the recommendation The information generation means has only the content having the same category information as the category information or category information different from the category information based on the category information included in the content information acquired by the content information acquisition means. It has a configuration for selecting only content.
この構成を有する本発明のサーバ装置によれば、例えば、ユーザがこれまでに購入したコンテンツと同じカテゴリに属するコンテンツについての情報を生成することにより、ユーザの好みに合致した情報を提供することができる一方で、異なるカテゴリに属するコンテンツに関する情報を生成することによって、ユーザにとって意外性を有する情報を提供することができる。 According to the server device of the present invention having this configuration, for example, by generating information on content that belongs to the same category as the content that the user has purchased so far, it is possible to provide information that matches the user's preference. On the other hand, it is possible to provide information that is surprising to the user by generating information on content belonging to different categories.
(8)また、本発明に係るサーバ装置は、前記データベース管理手段が、前記ユーザによって購入された前記コンテンツの著作者を特定する著作者情報をさらに含む前記コンテンツ情報をユーザ情報データベースに登録し、前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に含まれる著作者情報に基づいて、該著作者情報と同一の著作者情報を有するコンテンツのみ、又は、該著作者情報とは異なる著作者情報を有するコンテンツのみを選択する構成を有している。 (8) Further, in the server device according to the present invention, the database management unit registers the content information further including author information specifying the author of the content purchased by the user in a user information database, The recommendation information generation means is based on the author information included in the content information acquired by the content information acquisition means, only the content having the same author information as the author information, or the author information Has a configuration in which only content having different author information is selected.
この構成を有する本発明のサーバ装置によれば、例えば、ユーザがこれまでに購入したコンテンツの著作者と同じ著作者に関するコンテンツの情報を生成することによって、ユーザの好みに合致した情報を提供することができる一方で、異なる著作者に関するコンテンツの情報を提供することによって、ユーザに意外性を与えることができる。 According to the server device of the present invention having this configuration, for example, information that matches the user's preference is provided by generating content information about the same author as the author of the content that the user has purchased so far. On the other hand, by providing content information about different authors, the user can be surprised.
(9)また、本発明に係るサーバ装置は、前記データベース管理手段は、前記通信端末装置から送信された、当該コンテンツが既読であることを示す既読情報をさらに含む前記コンテンツ情報をユーザ情報データベースに登録し、前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に含まれる前記既読情報を有するコンテンツのみを選択する構成を有している。 (9) Further, in the server device according to the present invention, the database management unit may include the content information further including read information transmitted from the communication terminal device and indicating that the content has been read. The recommendation information generation unit is registered in the database, and has a configuration in which only the content having the read information included in the content information acquired by the content information acquisition unit is selected.
ユーザは、購入したコンテンツのすべてを最後まで読み切るとは限らない。すなわち、たとえ、コンテンツを購入した場合でも、そのコンテンツがユーザの好みに合わない場合、ユーザは、そのコンテンツを読むことを途中でやめてしまうことがある。逆に最後まで読み切った場合、ユーザは当該コンテンツが気に入ったと推測することができる。 The user does not always read through all of the purchased content. That is, even if the content is purchased, if the content does not meet the user's preference, the user may stop reading the content halfway. On the other hand, if the user has read all the way to the end, the user can guess that he / she likes the content.
この構成を有する本発明のサーバ装置は、既読であることを示す既読情報を利用することによって、ユーザが気に入ったと推測することができるコンテンツに類似するコンテンツに関する情報をユーザに提供することができる。 The server device of the present invention having this configuration can provide the user with information related to content similar to the content that can be presumed to be liked by the user by using already-read information indicating that it has been read. it can.
(10)また、本発明に係るサーバ装置は、前記コンテンツ情報取得手段が、前記通信端末装置から送信された、前記コンテンツに関するコンテンツ情報に基づいて特定された文章筆致特徴量を含むコンテンツ情報を取得する構成を有している。 (10) In the server device according to the present invention, the content information acquisition unit acquires content information including a sentence writing feature amount specified based on the content information related to the content transmitted from the communication terminal device. It has the composition to do.
この構成を有する本発明のサーバ装置は、上記のように通信端末装置から送信された、コンテンツに関するコンテンツ情報に基づいて特定された文章筆致特徴量を含むコンテンツ情報を利用するので、ユーザがそのときに希望する内容の情報を提供することができる。 Since the server device of the present invention having this configuration uses content information including text writing feature quantities specified based on content information related to content transmitted from the communication terminal device as described above, the user then Can provide information on the desired content.
(11)また、上述した課題を解決するための本発明に係るプログラムは、通信端末装置とネットワークを介して接続され、文章を含むコンテンツに関するコンテンツ情報を提供するサーバ装置を、前記コンテンツ情報が登録されたコンテンツ情報データベース及びユーザに関するユーザ情報が登録されたユーザ管理データベースを管理するデータベース管理手段、前記コンテンツの文章内における文字の配列の特性を数値化した文章筆致特徴量を含むコンテンツ情報を取得するコンテンツ情報取得手段、前記コンテンツを解析し、該コンテンツの文章筆致特徴量を含むコンテンツ情報を抽出するコンテンツ情報抽出手段、前記コンテンツ情報取得手段により取得された前記文章筆致特徴量と、前記コンテンツ情報抽出手段が前記コンテンツ情報データベースに登録された各コンテンツから抽出した文章筆致特徴量と、を比較することによって、類似度を算出する類似度算出手段、算出された前記類似度に基づいて推薦情報を生成する推薦情報生成手段、生成された推薦情報をユーザに提供する情報提供手段、として機能させる構成を有している。 (11) A program according to the present invention for solving the above-described problem is registered in a server device that is connected to a communication terminal device via a network and provides content information related to content including text. Database management means for managing the prepared content information database and a user management database in which user information related to the user is registered, and acquiring content information including a sentence writing feature value obtained by quantifying the character arrangement characteristic in the sentence of the content Content information acquisition means, content information extraction means for analyzing the content and extracting content information including the text stroke feature quantity of the content, the text stroke feature quantity acquired by the content information acquisition means, and the content information extraction Means said content Similarity calculation means for calculating similarity by comparing sentence stroke feature amounts extracted from each content registered in the information database, and recommendation information generation for generating recommendation information based on the calculated similarity And an information providing means for providing the generated recommendation information to the user.
この構成を有する本発明のプログラムは、ユーザのコンテンツに対する嗜好性とコンテンツとの類似度を算出することによってコンテンツに関する情報をユーザに提供するので、ユーザにとって有益性を有する情報を提供することができる。 Since the program of the present invention having this configuration provides the user with information related to the content by calculating the user's preference for the content and the similarity between the content, it is possible to provide information that is beneficial to the user. .
特に、コンテンツの文章筆致特徴量に基づいて類似度を算出するので、ジャンルや著作者などのカテゴリに限定されずに広範囲にわたるコンテンツとの間で類似度を算出することができ、ユーザにとって新たな知識などを取得させることが可能な有益性及びユーザが予想しなかった意外性を有する情報をユーザに提供することができる。
In particular, since the similarity is calculated based on the content stroke characteristic amount of the content, it is possible to calculate the similarity with a wide range of content without being limited to categories such as genre and author, which is new to the user. It is possible to provide the user with information that has the benefit of being able to acquire knowledge and the like and the unexpectedness that the user did not expect.
(12)また、上述した課題を解決するための本発明に係る情報提供方法は、サーバ装置から該サーバ装置とネットワークを介して接続された通信端末装置に、文章を含むコンテンツに関するコンテンツ情報を提供する情報提供方法であって、前記コンテンツ情報が登録されたコンテンツ情報データベース及びユーザに関するユーザ情報が登録されたユーザ管理データベースを管理するデータベース管理工程と、前記コンテンツの文章筆致特徴量を含むコンテンツ情報を取得するコンテンツ情報取得工程と、前記コンテンツを解析し、該コンテンツの文章内における文字の配列の特性を数値化した文章筆致特徴量を含むコンテンツ情報を抽出するコンテンツ情報抽出工程と、前記コンテンツ情報取得手段により取得された前記文章筆致特徴量と、前記コンテンツ情報抽出手段が前記コンテンツ情報データベースに登録された各コンテンツから抽出した文章筆致特徴量と、を比較することによって、類似度を算出する類似度算出工程と、算出された前記類似度に基づいて推薦情報を生成する推薦情報生成工程と、生成された推薦情報をユーザに提供する情報提供工程と、を含む工程を有している。 (12) Further, an information providing method according to the present invention for solving the above-described problem provides content information related to content including text from a server device to a communication terminal device connected to the server device via a network. A database management step for managing a content information database in which the content information is registered and a user management database in which user information about the user is registered; and content information including a sentence writing feature amount of the content A content information acquisition step for acquiring, a content information extraction step for analyzing the content, and extracting content information including a sentence stroke characteristic amount obtained by quantifying the character arrangement characteristic in the text of the content, and the content information acquisition The sentence stroke characteristic amount acquired by the means The similarity calculation step of calculating the similarity by comparing the content stroke extraction feature amount extracted from each content registered in the content information database by the content information extraction means, and the calculated similarity A recommendation information generating step for generating recommendation information based on the information, and an information providing step for providing the generated recommendation information to the user.
この構成を有する本発明の方法提供方法は、ユーザのコンテンツに対する嗜好性とコンテンツとの類似度を算出することによってコンテンツに関する情報をユーザに提供するので、ユーザにとって有益性を有する情報を提供することができる。 The method providing method of the present invention having this configuration provides the user with information related to the content by calculating the user's preference for the content and the similarity between the content, and thus provides information that is beneficial to the user. Can do.
特に、コンテンツの文章筆致特徴量に基づいて類似度を算出するので、ジャンルや著作者などのカテゴリに限定されずに広範囲にわたるコンテンツとの間で類似度を算出することができ、ユーザにとって新たな知識などを取得させることが可能な有益性及びユーザが予想しなかった意外性を有する情報をユーザに提供することができる。 In particular, since the similarity is calculated based on the content stroke characteristic amount of the content, it is possible to calculate the similarity with a wide range of content without being limited to categories such as genre and author, which is new to the user. It is possible to provide the user with information that has the benefit of being able to acquire knowledge and the like and the unexpectedness that the user did not expect.
本発明は、ユーザにとって有益性を有するだけでなく、ユーザにとって意外性をも備えたコンテンツ情報を提供することが可能である。 The present invention can provide content information that is not only useful to the user but also surprising to the user.
以下、図面を参照しつつ、本発明の実施形態について説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
なお、以下の実施形態は、通信端末装置と、当該通信端末装置とネットワークを介して接続される情報提供サーバ装置と、を有する通信システムに対し、本発明に係る、サーバ装置、プログラム及び情報提供方法を適用した場合の実施形態である。 In the following embodiments, a server device, a program, and information provision according to the present invention are provided for a communication system having a communication terminal device and an information providing server device connected to the communication terminal device via a network. It is embodiment at the time of applying a method.
また、本発明の「コンテンツ」としては、書籍、パンフレット、及び広告等、紙媒体の文書、並びに電子書籍、及び電子広告等のデジタルコンテンツを含む。ただし、以下では、本発明のコンテンツの代表例として電子書籍を用いて本実施形態を説明する。 In addition, the “content” of the present invention includes paper media documents such as books, pamphlets, and advertisements, and digital contents such as electronic books and electronic advertisements. However, hereinafter, the present embodiment will be described using an electronic book as a representative example of the content of the present invention.
[1]通信システムの概要
まず、図1及び図2を用いて本実施形態における通信システム1の概要について説明する。なお、図1は、本実施形態における通信システム1の構成を示すシステム構成図であり、図2は、本実施形態における通信システム1の動作概要を示す概念図である。また、図が煩雑になることを防止するために、図1及び図2においては、一部のユーザのみを示している。すなわち、実際の通信システム1においては、表示するよりも多数のユーザ、及び、通信端末装置10が存在している。
[1] Overview of Communication System First, an overview of the communication system 1 according to the present embodiment will be described with reference to FIGS. 1 and 2. FIG. 1 is a system configuration diagram showing a configuration of the communication system 1 in the present embodiment, and FIG. 2 is a conceptual diagram showing an operation outline of the communication system 1 in the present embodiment. Further, in order to prevent the figure from becoming complicated, only some users are shown in FIGS. 1 and 2. That is, in the actual communication system 1, there are a larger number of users and communication terminal devices 10 than displayed.
本実施形態の通信システム1は、デジタルコンテンツである電子書籍を配信するとともに、各電子書籍の文字の配列の特性を示す文章筆致を数値化した文章筆致特徴量を算出し、当該算出した文章筆致特徴量に基づいてユーザに電子書籍を推薦する情報を配信するシステムである。 The communication system 1 according to the present embodiment distributes electronic books that are digital contents, calculates a sentence writing feature amount that quantifies a sentence writing characteristic indicating the character arrangement characteristics of each electronic book, and calculates the calculated sentence writing match. This is a system for distributing information recommending an electronic book to a user based on a feature amount.
なお、本実施形態においては、各ユーザは、電子書籍を配信するネットワークサービス(以下、「電子書籍配信サービス」という。)に会員として登録されているものとして以下の説明を行う。 In the present embodiment, each user is described as being registered as a member in a network service that distributes electronic books (hereinafter referred to as “electronic book distribution service”).
本実施形態の通信システム1は、このような機能を実現するために、図1に示すように、各ユーザによって所持される複数の通信端末装置10と、ネットワーク20と、電子書籍配信サービスを提供する情報提供サーバ装置30と、を有している。
In order to realize such a function, the communication system 1 according to the present embodiment provides a plurality of communication terminal devices 10 possessed by each user, a
なお、各通信端末装置10は、基地局50を介してネットワーク20に接続される。また、ネットワーク20は、例えば、携帯電話網を含む公衆電話網と、IP(Internet Protocol)ネットワークが相互接続されて構成される。ただし、当該ネットワーク20の構成は、これに限られない。
Each communication terminal apparatus 10 is connected to the
通信端末装置10は、電子書籍リーダの機能を有し、例えば、携帯型音楽プレーヤー、携帯型ゲーム機、タブレット型情報端末装置、スマートフォン、携帯用電話機、又はパーソナルコンピュータ等、ユーザによって携帯可能な通信端末装置である。 The communication terminal device 10 has a function of an electronic book reader. For example, a portable music player, a portable game machine, a tablet information terminal device, a smartphone, a portable telephone, a personal computer, or the like that can be carried by a user It is a terminal device.
特に、通信端末装置10は、XML(eXtensible Markup Language)等のマークアップ言語によって記述されているWWWシステム用のリソースデータと、当該リソースデータのネットワークアドレスを示す固有のURL(Uniform Resource Locator)とを用いつつ、情報提供サーバ装置30とのデータ通信を行うブラウジング機能を有している。 In particular, the communication terminal apparatus 10 receives resource data for the WWW system described in a markup language such as XML (extensible Markup Language) and a unique URL (Uniform Resource Locator) indicating a network address of the resource data. While using, it has a browsing function for performing data communication with the information providing server device 30.
また、通信端末装置10は、当該ブラウジング機能を用いて、情報提供サーバ装置30からリソースデータを受信し、当該リソースデータによって構成されるコンテンツをユーザが閲覧可能に表示する。 Moreover, the communication terminal device 10 receives the resource data from the information providing server device 30 using the browsing function, and displays the content configured by the resource data so that the user can browse.
そして、通信端末装置10は、基地局50及びネットワーク20を介して情報提供サーバ装置30と通信接続し、かつ、ユーザの操作に基づき電子書籍配信サービスにログインし、当該ログインしたユーザ(以下、「ログインユーザ」という。)として、情報提供サーバ装置30から種々のデータを授受して電子書籍配信サービスの提供を受けることができるように構成されている。
Then, the communication terminal device 10 is connected to the information providing server device 30 via the base station 50 and the
特に、通信端末装置10は、ユーザが当該通信システム1を利用してこれまでに電子書籍を購入したことがある場合、電子書籍の購入履歴に基づいて、ユーザにとって有益性を有するとともに意外性を有する電子書籍に関するコンテンツ情報の提供を受け取ることができるように構成されている。 In particular, when the user has purchased an e-book using the communication system 1 so far, the communication terminal device 10 is beneficial to the user and has unexpectedness based on the purchase history of the e-book. It is configured to be able to receive provision of content information related to an electronic book.
また、通信端末装置10は、ユーザ自らが所定のコンテンツ情報を情報提供サーバ装置30に配信することにより、当該コンテンツ情報に基づいて選択された電子書籍に関するコンテンツ情報を入手することができるように構成されている。 Further, the communication terminal device 10 is configured such that the user himself / herself distributes predetermined content information to the information providing server device 30 to obtain content information related to the electronic book selected based on the content information. Has been.
情報提供サーバ装置30は、電子書籍配信サービスを提供するために用いられるシステムであり、電子書籍配信サービスを提供するため、各種のデータベース(以下、「DB」ともいう。)を有している。そして、情報提供サーバ装置30は、ユーザにとって有益性と意外性とを有する電子書籍に関するコンテンツ情報を配信するための各種の処理を実行する。 The information providing server device 30 is a system used for providing an electronic book distribution service, and has various databases (hereinafter also referred to as “DB”) in order to provide the electronic book distribution service. And the information provision server apparatus 30 performs the various processes for delivering the content information regarding the electronic book which has usefulness and unexpectedness for a user.
そして、この情報提供サーバ装置30は、
(1)電子書籍等のコンテンツに関するコンテンツ情報が登録されたコンテンツ情報データベースを管理するための構成、
(2)コンテンツの文章筆致特徴量を含むコンテンツ情報を取得するための構成、
(3)コンテンツを解析し、当該コンテンツの文章筆致特徴量を含むコンテンツ情報を抽出するための構成、
(4)コンテンツ情報を取得する構成により取得された文章筆致特徴量と、コンテンツの文章筆致特徴量を含むコンテンツ情報を抽出する構成がコンテンツ情報データベースに登録された各コンテンツから抽出した文章筆致特徴量と、を比較することによって、類似度を算出するための構成、
(5)算出された類似度に基づいて、ユーザにコンテンツ情報を推薦するための推薦情報を生成するための構成、
(6)生成された推薦情報をユーザに提供するための構成と、
を有している。
And this information provision server apparatus 30 is:
(1) Configuration for managing a content information database in which content information related to content such as electronic books is registered;
(2) A configuration for acquiring content information including a sentence stroke characteristic amount of content,
(3) Configuration for analyzing content and extracting content information including sentence stroke feature amount of the content,
(4) Sentence writing feature amount extracted from each content registered in the content information database with a configuration for extracting content information including the sentence writing feature amount acquired by the configuration for acquiring content information and the content writing stroke feature amount of the content And a configuration for calculating the similarity by comparing
(5) A configuration for generating recommendation information for recommending content information to the user based on the calculated similarity,
(6) a configuration for providing the generated recommendation information to the user;
have.
すなわち、情報提供サーバ装置30は、コンテンツ情報データベースに登録された電子書籍等のコンテンツの文章筆致特徴量と、ユーザが既に購入した電子書籍等のコンテンツの文章筆致特徴量の平均値とを比較し、両者の類似度を算出する。 That is, the information providing server device 30 compares the text stroke feature amount of the content such as the electronic book registered in the content information database with the average value of the text stroke feature amount of the content such as the electronic book that the user has already purchased. The similarity between the two is calculated.
ただし、情報提供サーバ装置30は、通信端末装置10から送信されたコンテンツ情報に基づいて、文章筆致特徴量を抽出し、抽出された文章筆致特徴量と、コンテンツ情報データベースに登録された電子書籍等のコンテンツの文章筆致特徴量とを比較し、両者の類似度を算出することも可能である。 However, the information providing server device 30 extracts the text stroke feature amount based on the content information transmitted from the communication terminal device 10, and the extracted text stroke feature amount and an electronic book registered in the content information database, etc. It is also possible to compare the writing stroke feature amount of the content of the content and calculate the similarity between the two.
そして、情報提供サーバ装置30は、算出された類似度に基づいて、ユーザにとって有益性と意外性の両方を有する電子書籍に関する情報を生成し、生成された情報をユーザに提供できるようになっている。 And the information provision server apparatus 30 can generate | occur | produce the information regarding the electronic book which has both usefulness and unexpectedness for a user based on the calculated similarity degree, and can provide the produced | generated information to a user now. Yes.
なお、本実施形態において、「文章筆致」とは、コンテンツを構成する文章のリズム等を表す「文章の書きっぷり」や「文章の形態」を意味する。本実施形態において、「文章筆致」は、筆づかいや筆の運び等を意味するものではない。また、文章筆致特徴量とは、コンテンツを構成する文章の特徴を表す文章筆致の特徴を定量的に表した値である。 In the present embodiment, “sentence writing” means “sentence writing” or “sentence form” representing the rhythm of the sentences constituting the content. In the present embodiment, “sentence writing” does not mean writing or carrying a brush. The sentence stroke feature amount is a value that quantitatively represents the feature of the sentence stroke that represents the feature of the sentence constituting the content.
本実施形態において、文章筆致特徴量としては、例えば、
(1)電子書籍の文章の全体に占める仮名の割合、
(2)電子書籍の文章を構成する各段落に含まれる文字数の平均値、
(3)鉤括弧により表される会話文が、電子書籍の文章に対して占める割合、
等の文章における文字の配列を数値化したものを挙げることができる。
In this embodiment, as the text stroke feature amount, for example,
(1) The ratio of kana to the entire text of the electronic book,
(2) The average number of characters included in each paragraph constituting the text of the electronic book,
(3) The ratio of the conversation sentence represented by the brackets to the text of the electronic book,
The numerical arrangement of the character arrangement in a sentence such as
以上の構成を有することによって、本実施形態の通信システム1は、ユーザの過去の電子書籍に対する購入履歴やユーザから提案されたコンテンツ情報に基づいてデータベースに登録された電子書籍の中からユーザにとって有益な電子書籍に関する情報を提供することが可能である。 By having the above configuration, the communication system 1 of the present embodiment is beneficial to the user from among electronic books registered in the database based on the purchase history of the user's past electronic books and the content information proposed by the user. It is possible to provide information on various electronic books.
特に、本実施形態の通信システム1は、文章筆致特徴量に基づいて類似度を算出しているので、ユーザに提供する情報のマンネリ化を防ぐことができ、ユーザに意外性を有する情報を提供することができるようになっている。 In particular, since the communication system 1 according to the present embodiment calculates the similarity based on the text stroke feature amount, it is possible to prevent the information provided to the user from being ruined and provide the user with unexpected information. Be able to.
[2]情報提供サーバ装置
[2.1]構成
次に、図2を参照しながら本実施形態の情報提供サーバ装置30の構成について説明する。なお、図2は、本実施形態の情報提供サーバ装置30の構成を示すブロック図である。
[2] Information Providing Server Device [2.1] Configuration Next, the configuration of the information providing server device 30 of the present embodiment will be described with reference to FIG. FIG. 2 is a block diagram showing the configuration of the information providing server device 30 of this embodiment.
本実施形態の情報提供サーバ装置30は、図2に示すように、ネットワーク20に接続される通信制御部310と、各種のメモリとして機能するROM/RAM320と、各種のデータベース(以下、「DB」と略す。)を有する記録装置330と、装置全体を制御するサーバ管理制御部340と、電子書籍データの配信、電子書籍の履歴情報の収集、コメント情報の登録、及び、当該コメント情報の提供するデータ処理部350と、を有する。
As shown in FIG. 2, the information providing server device 30 of the present embodiment includes a
なお、上記の各部は、バスBによって相互に接続され、各構成要素間におけるデータの転送が実行される。 The above-described units are connected to each other by a bus B, and data transfer is performed between the components.
通信制御部310は、所定のネットワークインターフェースであり、通信端末装置10と通信チャネルを構築し、各種データの授受を行う。
The
ROM/RAM320には、情報提供サーバ装置30の駆動に必要な各種のプログラムが記録されている。また、ROM/RAM320は、各種の処理が実行される際のワークエリアとして用いられる。
Various programs necessary for driving the information providing server device 30 are recorded in the ROM /
記録装置330は、HDD、又は、SSD(Solid State Drive)により構成される。そして、記録装置330は、ユーザが電子書籍配信サービスの提供受けるために必要な情報が記憶されるユーザ管理DB331と、配信する電子書籍に関するコンテンツ情報が記憶されるコンテンツ情報DB332と、を有している。
The
なお、本実施形態のユーザ管理DB331は、本発明の所定のデータベースを構成し、コンテンツ情報DB332は、本発明のコンテンツ情報データベースを構成する。本実施形態の記録装置330の詳細は後述する。
Note that the
サーバ管理制御部340は、主に中央演算処理装置(CPU)によって構成され、プログラムを実行することによって、情報提供サーバ装置30の各部を統合制御する。
The server
データ処理部350は、サーバ管理制御部340の制御の下、記録装置330と連動し、ユーザの指示に基づくログイン要求を通信端末装置10から取得した場合に、当該要求に基づいて各ユーザの電子書籍配信サービスへのログイン処理を実行する。
When the
そして、データ処理部350は、
(1)ユーザ情報が登録されたユーザ管理DB331及び電子書籍等のコンテンツ情報が登録されたコンテンツ情報DB332を管理するための処理、
(2)ユーザ毎の平均文章筆致特徴量又はユーザから配信された情報に基づき得られた文章筆致特徴量を含むコンテンツ情報を取得する取得処理、
(3)電子書籍等のコンテンツを解析し、当該コンテンツの文章筆致特徴量を含むコンテンツ情報の文章情報を抽出する抽出処理、
(4)取得された文章筆致特徴量と抽出した文章筆致特徴量とを比較することによって、類似度を算出する算出処理、
(5)算出された類似度に基づいて、電子書籍に関する推薦情報を生成する生成処理及び、
(6)生成された推薦情報をユーザに提供する提供処理、
を行っている。
Then, the
(1) Processing for managing the
(2) Acquisition processing for acquiring content information including an average sentence writing feature amount for each user or a sentence writing feature amount obtained based on information distributed from the user;
(3) An extraction process of analyzing content such as an electronic book and extracting text information of content information including a text stroke feature amount of the content,
(4) A calculation process for calculating the similarity by comparing the acquired sentence writing feature quantity with the extracted sentence writing feature quantity;
(5) Generation processing for generating recommendation information related to an electronic book based on the calculated similarity, and
(6) Providing processing for providing the generated recommendation information to the user,
It is carried out.
データ処理部350は、さらに、
(7)ユーザによって購読されたコンテンツの文章筆致特徴量に基づいて算出された平均文章筆致特徴量を含む電子書籍に関するコンテンツ情報をユーザ毎に所定のデータベースに登録する、
処理を行っている。
The
(7) Register content information regarding an electronic book including an average sentence writing feature amount calculated based on a sentence writing feature amount of content subscribed by a user in a predetermined database for each user.
Processing is in progress.
具体的には、データ処理部350は、アプリケーションを実行することによって、各DBを管理するDB管理部351と、コンテンツ情報から文章情報抽出する抽出処理を実行するコンテンツ情報抽出部353と、コンテンツ情報を取得する取得処理を実行するコンテンツ情報取得部352と、類似度を算出する算出処理を実行する類似度算出部354と、推薦情報を生成する生成処理を実行する推薦情報生成部355と、当該推薦情報を提供する情報提供部356と、を実現する。
Specifically, the
[2.2]各種のDB
次に、図3及び図4を用いて本実施形態の各DBについて説明する。なお、図3及び図4は、それぞれ、情報提供サーバ装置30内に設けられたユーザ管理DB331、コンテンツ情報DB332に記録されるデータの一例を示す図である。
[2.2] Various DBs
Next, each DB of this embodiment will be described with reference to FIGS. 3 and 4. 3 and 4 are diagrams illustrating examples of data recorded in the
本実施形態のユーザ管理DB331は、電子書籍配信サービスに利用登録をした各ユーザを管理するための各種情報がデータとして格納されるデータベースである。例えば、ユーザ管理DB331には、図3に示すように、登録されたユーザ毎に、
(1)ユーザIDと、
(2)ログイン情報(ログインID、パスワード)と、
(3)購入済み書籍リスト(書籍ID)の情報と、
(4)購入済み書籍の平均文章筆致特徴量(仮名比率、平均段落文字数、会話文比率)の情報と、
が対応付けて登録(記録)される。
The
(1) a user ID;
(2) login information (login ID, password);
(3) Information on the purchased book list (book ID);
(4) Information on the average sentence stroke feature amount (a kana ratio, average number of paragraph characters, conversation sentence ratio) of a purchased book;
Are registered (recorded) in association with each other.
なお、例えば、図3において、ユーザ管理DB331に、ユーザID「user101」のユーザに対応するログイン情報として、「ログインID:○△×・・・/パスワード:123abc・・」が登録され、購入済み電子書籍としてその書籍ID「DC001」、「DC003」、「DC004」、及び「DC010」が登録され、購入済み書籍の平均文章筆致特徴量として、仮名比率「0.43」、平均段落文字数「36」及び会話文比率「0.21」が登録されていることが示されている。
For example, in FIG. 3, “login ID: ○ Δ ×... / Password: 123abc...” Is registered and purchased in the
コンテンツ情報DB332は、通信端末装置10を介してユーザに提供される電子書籍等のコンテンツ情報が記録されるDBである。例えば、コンテンツ情報DB332には、図4に示すように、電子書籍(コンテンツ)毎に
(1)電子書籍IDと、
(2)電子書籍のタイトルと、
(3)電子書籍の本文データ(画像データ、テキストデータ及び電子書籍リーダにおける制御データ)と、
(4)表紙などの画像データと、
(5)著作者名及び著作者IDと、
(6)カテゴリ名及びカテゴリIDと、
(7)文章筆致特徴量(仮名比率、平均段落文字数、会話文比率)と、
が対応付けて登録される。
The
(2) the title of the electronic book;
(3) Body data of the electronic book (image data, text data, and control data in the electronic book reader),
(4) Image data such as a cover,
(5) Author name and author ID;
(6) Category name and category ID;
(7) Sentence writing features (kana ratio, average number of paragraph characters, conversation sentence ratio),
Are registered in association with each other.
なお、例えば、図4においては、コンテンツ情報DB332に、電子書籍ID「DC001」と対応付けられて、「○○法入門」の電子書籍のタイトルと、「DB001」の本文データと、「画像データ1」の画像データと、「木○○○:AT001」の著作者名及び著作者IDと、「法律書:CT010」のカテゴリ名及びカテゴリIDと、文章筆致特徴量である仮名比率「0.12」、平均段落文字数「56」及び会話文比率「0.08」と、が記録されていることが示されている。また、電子書籍ID、著作者ID及びカテゴリIDは、電子書籍データが新規にコンテンツ情報DB332に登録された際に情報提供サーバ装置30によって自動的に又は既に登録された電子書籍データに基づいて割り当てられるようになっている。
For example, in FIG. 4, the
[2.3]データ処理部の詳細
[2.3.1]DB管理部
まず、本実施形態のデータ処理部350のDB管理部351の詳細について説明する。
[2.3] Details of Data Processing Unit [2.3.1] DB Management Unit First, details of the
本実施形態におけるDB管理部351は、本発明におけるデータベース管理手段を構成し、ユーザ管理DB331への情報の書き込みや読み出し、コンテンツ情報DBからの情報の読み出し等の処理を行っている。
The
具体的に、DB管理部351は、予め、コンテンツ情報DB332に対し、電子書籍に関するコンテンツ情報を登録する処理を実行する。その際、DB管理部351は、電子書籍毎に、例えば、図4に示したように、「書籍ID」、「タイトル」、「本文データ」、「表紙画像」、「著作者/著作者ID」、「カテゴリ/カテゴリID」、及び文章筆致特徴量(仮名比率、平均段落文字数、会話文比率)をコンテンツ情報DB332にコンテンツ情報として登録する。
Specifically, the
また、DB管理部351は、電子書籍に関するコンテンツ情報を追加的に登録する処理も実行する。
The
一方、DB管理部351は、ユーザが電子書籍を購入したときに、ユーザ毎に、当該電子書籍に関するコンテンツ情報をユーザ管理DB331に登録する処理を実行する。その際、DB管理部351は、それまでに各ユーザが購入した電子書籍の文章筆致特徴量と今回購入した電子書籍の文章筆致特徴量とに基づいて算出された平均文章筆致特徴量をユーザ毎に登録する。
On the other hand, when the user purchases an electronic book, the
また、DB管理部351は、ユーザ管理DB331に登録された平均文章筆致特徴量を含むコンテンツ情報を読み出し、後述するコンテンツ情報取得部に受け渡す処理を実行する。
In addition, the
[2.3.2]コンテンツ情報取得部
次に、本実施形態のデータ処理部350のコンテンツ情報取得部352の詳細について説明する。
[2.3.2] Content Information Acquisition Unit Next, details of the content
本実施形態のコンテンツ情報取得部352は、本発明のコンテンツ情報取得手段を構成し、ユーザ管理DB331から所定のユーザにおけるコンテンツ情報を取得すること、及び通信端末装置10を介してユーザから送信された情報に基づいて得られたコンテンツ情報を取得する処理を実行する。
The content
特に、コンテンツ情報取得部352は、ユーザ管理DB331に登録された情報の中から、仮名比率、平均段落文字数及び会話文比率を含むユーザに固有の平均文章筆致特徴量を取得する処理を行っている。
In particular, the content
なお、コンテンツ情報取得部352は通信端末装置10を介してユーザから送信された情報に基づいて、コンテンツ情報を取得する処理も行っている。その場合、後述するコンテンツ情報抽出部353がユーザから送信された情報(例えば、電子書籍のタイトル等)に基づいて、仮名比率、平均段落文字数及び会話文比率を含む文章筆致特徴量を抽出し、コンテンツ情報取得部352は、コンテンツ情報抽出部353によって抽出された文章筆致特徴量を取得する。
Note that the content
ただし、通信端末装置10を介してユーザから送信された情報が仮名比率、平均段落文字数及び会話文比率を含む文章筆致特徴量である場合、コンテンツ情報取得部352は通信端末装置10を介してユーザから送信された情報をそのまま取得する。
However, when the information transmitted from the user via the communication terminal device 10 is a sentence writing feature amount including the kana ratio, the average number of paragraph characters, and the conversation sentence ratio, the content
[2.3.3]コンテンツ情報抽出部
次に、本実施形態のデータ処理部350のコンテンツ情報抽出部353の詳細について説明する。
[2.3.3] Content Information Extraction Unit Next, details of the content
コンテンツ情報抽出部353は、本発明のコンテンツ情報抽出手段を構成し、電子書籍等のコンテンツを解析することによって、文章筆致特徴量を抽出する処理を実行する。このコンテンツ情報抽出部353によって抽出された文章筆致特徴量は、本実施形態における情報提供サーバ装置30が実行する処理において、コンテンツ情報の中核をなす情報である。
The content
具体的に、コンテンツ情報抽出部353は、各電子書籍等のコンテンツを構成する文章を解析することによって、
(1)仮名が文章全体にどの程度占めているかという、仮名の文章全体に対する割合を抽出すること、
(2)文章を構成する各段落に含まれる文字数の平均値を抽出すること、
(3)鉤括弧により表される会話文が、文章全体に対して占める割合を抽出すること
という各処理を実行している。なお、各処理の詳細は後述する。
Specifically, the content
(1) extracting the ratio of kana to the whole sentence, such as how much the kana occupies in the whole sentence;
(2) extracting an average value of the number of characters included in each paragraph constituting the sentence;
(3) Each process of extracting the ratio of the conversation sentence represented by the brackets to the whole sentence is executed. Details of each process will be described later.
このコンテンツ情報抽出部353によって抽出された文章筆致特徴量は、DB管理部351によって、電子書籍毎に、コンテンツ情報DB332に登録される(図4参照)。
The sentence stroke feature amount extracted by the content
[2.3.4]類似度算出部
次に、本実施形態のデータ処理部350の類似度算出部354の詳細について説明する。
[2.3.4] Similarity Calculation Unit Next, details of the
類似度算出部354は、本発明の類似度算出手段を構成する。この類似度算出部354は、コンテンツ情報取得部352が取得したコンテンツ情報に含まれる文章筆致特徴量と、コンテンツ情報DB332に登録された各電子書籍の情報に含まれる文章筆致特徴量とを比較して、両者の間における文章筆致特徴量の類似度を算出する処理を実行する。
The
類似度算出部354は、コサイン類似度、ユークリッド距離を用いた算出法等を用いることによって、コンテンツ情報取得部352が取得したコンテンツ情報に含まれる文章筆致特徴量と、コンテンツ情報DB332に登録された各電子書籍の情報に含まれる文章筆致特徴量との間の類似度を算出する。なお、類似度算出部354による類似度の詳細は後述する。
The
[2.3.5]推薦情報生成部
次に、本実施形態のデータ処理部350の推薦情報生成部355の詳細について説明する。
[2.3.5] Recommendation Information Generation Unit Next, details of the recommendation
推薦情報生成部355は、本発明のコンテンツ推薦情報生成手段を構成し、類似度算出部354により算出された類似度に基づいて、所定の電子書籍を選択し、選択された電子書籍に関する種々の情報性を生成する処理を実行する。例えば、類似度に予め閾値を設けておき、この閾値よりも算出された類似度が高い値を示す電子書籍のみを選択する。或いは、算出された類似度を比較し、類似度が高い上位N番目(例えば上位3番目)までの電子書籍を選択する。
The recommendation
なお、類似度に予め閾値を設けておき、この閾値よりも算出された類似度が高い値を示す電子書籍を選択する場合において、選択された電子書籍が多数ある場合、選択された電子書籍の中から類似度が高い上位N番目(例えば上位3番目)までの電子書籍を選択するように構成することもできる。 In addition, when a threshold value is set in advance for the degree of similarity and an electronic book having a higher degree of similarity calculated than the threshold value is selected, if there are a large number of selected electronic books, It can also be configured to select the top Nth (for example, top 3) electronic books with the highest similarity.
そして、推薦情報生成部355は、選択された電子書籍に関する推薦情報を生成する。例えば、推薦情報に含まれる情報としては、電子書籍のタイトル、表紙画像、著作者、カテゴリを挙げることができる。なお、推薦情報に、ユーザの平均文章筆致特徴量を含めることもできる。
And the recommendation
[2.3.6]情報提供部
次に、本実施形態のデータ処理部350の情報提供部356について説明する。
[2.3.6] Information Providing Unit Next, the
情報提供部356は、本発明の情報提供手段を構成している。この情報提供部356は、推薦情報生成部355によって生成された電子書籍に関する推薦情報を、ネットワーク20を介して通信端末装置10に提供している。
The
情報提供部356が通信端末装置10に対して情報を提供するための手段は、特に限定がなく、例えば、電子メールを利用して推薦情報を配することを一例として挙げることができる。ただし、情報の提供は、電子メールを利用することには限定されず、電子書店のシステムや通信端末装置10が備える書籍閲覧ようのアプリケーションを用いることや、SNSの諸機能を用いて実行するように構成することもできる。
The means for the
[2.4]コンテンツ情報抽出部の処理内容の詳細
次に、コンテンツ情報抽出部353が実行する処理の詳細を説明する。
[2.4] Details of Processing Contents of Content Information Extraction Unit Next, details of processing executed by the content
コンテンツ情報抽出部353は、電子書籍について一冊単位で文章筆致特徴量を抽出する。具体的には、上述したように、
(1)仮名が文章全体にどの程度占めているかという、仮名の文章全体に対する割合を抽出する処理(以下、「仮名比率の抽出処理」という。)、
(2)文章を構成する各段落に含まれる文字数の平均値を抽出する処理(以下、「平均段落文字数の抽出処理」という。)、及び
(3)鉤括弧により表される会話文が、文章全体に対して占める割合を抽出する処理(以下、「会話文比率の抽出処理」という。)、
という各処理を実行している。
The content
(1) A process of extracting the ratio of the kana to the entire sentence as to how much the kana occupies the entire sentence (hereinafter referred to as “a kana ratio extraction process”);
(2) A process for extracting the average value of the number of characters included in each paragraph constituting the sentence (hereinafter referred to as “average paragraph number of characters extraction process”), and (3) a conversation sentence represented by brackets is a sentence. A process of extracting the proportion of the total (hereinafter referred to as “conversation sentence ratio extraction process”),
Each process is executed.
[2.4.1]仮名比率の抽出処理について
コンテンツ情報抽出部353は、仮名比率の抽出処理として、仮名が電子書籍を構成する文章全体にどの程度占めているのかを抽出する処理である。この仮名比率の抽出処理は、電子書籍を構成する文章全体の文字密度ともいうべき文章筆致の特徴量を抽出し、電子書籍の文章全体に占める仮名の割合を、ユーザに提供する情報に反映させてユーザの好みに合致した情報を抽出する。
[2.4.1] Kana Ratio Extraction Process The content
すなわち、仮名比率の抽出処理は、文章全体に占める仮名の比率が大きい文字密度が低い文章を好むユーザには、文字密度の低い文章で構成された電子書籍に関する情報を提供するために、仮名の比率が小さい文字密度が高い文章を好むユーザには、文字密度の高い文章で構成された電子書籍に関する情報を提供するために用いる情報を抽出する処理である。 That is, in the kana ratio extraction process, in order to provide a user who prefers a sentence with a low character density and a large ratio of kana to the whole sentence, in order to provide information about an electronic book composed of sentences with a low character density, This is a process of extracting information used to provide information related to an electronic book composed of sentences having a high character density to a user who prefers sentences having a low character density and a high character density.
コンテンツ情報抽出部353が予め用意されている仮名の辞書(以下、「仮名辞書」という。)を利用し、電子書籍を構成する文章全体について、仮名と仮名以外の文字とに選別する。なお、本実施形態では、仮名以外の文字は、漢字、カタカナ、アルファベット及び記号等、ひらがな以外の文字を意味する。
The content
そして、コンテンツ情報抽出部353は、仮名と仮名以外の文字とに選別された文字数をそれぞれカウントし、仮名と仮名以外の文字とに選別された各文字を電子書籍の文章を構成する全体の文字数で除し、仮名が全体に占める割合と仮名以外の文字が全体に占める割合とを算出する。
Then, the content
また、コンテンツ情報抽出部353は、算出された仮名が全体に占める割合の値をDB管理部351に受け渡し、DB管理部351がコンテンツ情報DB332に登録する。コンテンツ情報DB332に登録される情報は、図4に示すように、例えば、「0.43」等の数値である。
In addition, the content
[2.4.2]平均段落文字数の抽出処理について
コンテンツ情報抽出部353は、平均段落文字数の抽出処理として、電子書籍の文章において、一段落当たりに占める文字数の平均値を抽出する。この平均段落文字数の抽出処理は、リズム感ともいうべき文章筆致の特徴量を抽出し、文章の持つリズム感をユーザに提供する情報に反映させて、ユーザの好みに合致した情報を提供するために用いる情報を抽出する処理である。
[2.4.2] Extraction process of average number of paragraph characters The content
具体的に、コンテンツ情報抽出部353は、電子書籍を構成する文章に設けられた改行を利用することによって、文章全体を段落毎に分解する。
Specifically, the content
そして、コンテンツ情報抽出部353は、分解された各段落を構成する文字の数をそれぞれカウントするとともに、分解された段落の数をカウントする。
Then, the content
また、コンテンツ情報抽出部353は、各段落を構成する文字の数を全段落分だけ足し合わせ、電子書籍の文章全体を構成する総文字数を求め、この総文字数を段落の数で除すことによって1段落当たりの平均段落文字数を算出する。
In addition, the content
さらに、コンテンツ情報抽出部353は、算出された平均段落文字数をDB管理部351に受け渡し、DB管理部351がコンテンツ情報DB332に登録する。コンテンツ情報DB332に登録される情報は、図4に示すように、例えば、「36」等の数値である。
Further, the content
[2.4.3]会話文比率の抽出処理について
コンテンツ情報抽出部353は、会話文比率の抽出処理として、会話文が電子書籍を構成する文章全体にどの程度占めているのかを抽出する。この会話文比率の抽出処理は、会話文が電子書籍を構成する文章全体に占める割合をユーザに提供する情報に反映させることによって、ユーザの好みに合致した情報を提供するために用いる情報を抽出する処理である。
[2.4.3] Conversation Sentence Ratio Extraction Process The content
具体的には、コンテンツ情報抽出部353は、電子書籍を構成する文章をサーチし、文章の中から鉤括弧を選択し、鉤括弧の中に含まれる文字を抽出する。
Specifically, the content
そして、コンテンツ情報抽出部353は、抽出されたすべての文字の文字数をカウントする。
Then, the content
また、コンテンツ情報抽出部353は、抽出されたすべての文字の文字数を、電子書籍の文章を構成する文字の全文字数で除すことによって会話文比率を算出する。
Further, the content
さらに、コンテンツ情報抽出部353は、算出された会話文比率をDB管理部351に受け渡し、DB管理部351がコンテンツ情報DB332に「会話文比率」として登録する。コンテンツ情報DB332に登録される情報は、図4に示すように、例えば、「0.21」等の数値である。
Furthermore, the content
[2.4.4]平均文章筆致特徴量の算出処理について
コンテンツ情報抽出部353は、各ユーザの平均文章筆致特徴量の算出処理も実行する。
[2.4.4] Calculation process of average sentence stroke feature amount The content
平均文章筆致特徴量は、上述したように、各ユーザがこれまでに購入した電子書籍の文章筆致特徴量の平均値をユーザ毎に算出した値である。そこで、コンテンツ情報抽出部353は、ユーザが電子書籍を購入するたびに、それまでに、ユーザ管理DB331に登録されていた平均文章筆致特徴量と、今回購入した電子書籍の文章筆致特徴量とに基づいて、新たな平均文章筆致特徴量を算出する。
As described above, the average sentence writing feature amount is a value obtained by calculating, for each user, an average value of sentence writing feature amounts of electronic books purchased by each user so far. Therefore, each time the user purchases an electronic book, the content
また、コンテンツ情報抽出部353は、新たに算出された平均文章筆致特徴量をDB管理部351に受け渡し、DB管理部351がユーザ管理DBB331の登録内容を更新する。
In addition, the content
[2.5]類似度算出部の処理内容の詳細
次に、類似度算出処理部354の処理内容の詳細を説明する。
[2.5] Details of Processing Content of Similarity Calculation Unit Next, details of processing content of the similarity
類似度算出部354は、所定のユーザにおける平均文章筆致特徴量と、各電子書籍におけるそれぞれの文章筆致特徴量とに基づいて、所定のユーザの電子書籍に対する嗜好性と各電子書籍との間の類似度を算出する。
The
例えば、類似度算出部354は、コサイン類似度の手法を用いた類似度の算出においては、
(1)ユーザについては、所定のユーザの平均文章筆致特徴量である、「仮名比率」、「平均段落文字数」及び「会話文比率」に基づいて、(式1)に示すベクトル「UX」を生成し、
(2)電子書籍については、各電子書籍の文章筆致特徴量である、「仮名比率」、「平均段落文字数」及び「会話文比率」に基づいて、(式2)に示すベクトル「Di」を生成し、
(3)所定のユーザのベクトル「UX」と各電子書籍のベクトル「Di」とのベクトル空間モデルを用いて、電子書籍毎に、所定のユーザとの類似度(sim)を(式3)に示すように、ベクトル「UX」とベクトル「Di」との内積を、ベクトル「UX」の大きさとベクトル「Di」の大きさとの積で除すことによって求める。
For example, the
(1) For the user, the vector “UX” shown in (Equation 1) is calculated based on the “Kana ratio”, “Average number of paragraph characters”, and “Conversation sentence ratio”, which are the average sentence stroke feature quantities of a predetermined user. Generate
(2) For electronic books, the vector “Di” shown in (Equation 2) is calculated based on the “sentence ratio”, “average number of paragraph characters”, and “conversation sentence ratio”, which are the sentence stroke feature quantities of each electronic book. Generate
(3) Using a vector space model of the vector “UX” of the predetermined user and the vector “Di” of each electronic book, the similarity (sim) with the predetermined user is expressed by (Equation 3) for each electronic book. As shown, the inner product of the vector “UX” and the vector “Di” is obtained by dividing by the product of the vector “UX” and the vector “Di”.
なお、(式1)において、「X」は、ユーザA、ユーザBなどのユーザを表し、(式2において、「i」は、電子書籍のID番号を表している。 In (Expression 1), “X” represents a user such as user A or user B (in Expression 2, “i” represents an ID number of an electronic book).
類似度算出部354が、コサイン類似度の手法を用いて類似度を算出する処理について、図5を参照して具体的に説明する。なお、図5は、コサイン類似度の手法を用いて類似度を算出する処理を説明するための説明図である。
A process in which the
図5に示すように、ユーザAと電子書籍との類似度を算出する場合を考える。 As shown in FIG. 5, consider a case where the similarity between the user A and the electronic book is calculated.
ユーザAの平均文章筆致特徴量は、仮名比率が「0.33」、平均段落文字数が「54」、会話文比率が「0.53」である。なお、ユーザAの平均文章筆致特徴量は、これまでにユーザAが購入した電子書籍の文章筆致特徴量を仮名比率、平均段落文字数及び、会話文比率の項目毎に平均した値である。 As for the average sentence stroke feature amount of the user A, the kana ratio is “0.33”, the average number of paragraph characters is “54”, and the conversation sentence ratio is “0.53”. Note that the average sentence writing feature amount of the user A is a value obtained by averaging the sentence writing feature amounts of the electronic books that the user A has purchased so far for each item of the kana ratio, the average number of paragraph characters, and the conversation sentence ratio.
一方、コンテンツ情報DBに登録されている各電子書籍の文章筆致特徴量は、書籍Aにあっては、仮名比率が「0.43」、平均段落文字数が「36.00」、会話文比率が「0.21」であり、書籍Bにあっては、仮名比率が「0.32」、平均段落文字数が「50.00」、会話文比率が「0.60」であり、書籍Cにあっては、仮名比率が「0.80」、平均段落文字数が「21.00」、会話文比率が「0.55」である。 On the other hand, the text stroke feature amount of each electronic book registered in the content information DB is that the book A has a kana ratio “0.43”, an average number of paragraph characters “36.00”, and a conversation sentence ratio. In book B, the kana ratio is “0.32”, the average number of paragraph characters is “50.00”, and the conversation sentence ratio is “0.60”. In other words, the kana ratio is “0.80”, the average number of paragraph characters is “21.00”, and the conversation sentence ratio is “0.55”.
これらの値に基づき、(式3)によってユーザAの各電子書籍に対するコサイン類似度を求める。その結果、書籍Aに対するコサイン類度が「0.905490442」、書籍Bに対するコサイン類似度が「0.995511003」、書籍Cに対するコサイン類度が「0.815811036」である。この図5に示す例では、ユーザAは、書籍Bに対する類似度が最も高いことになる。 Based on these values, the cosine similarity with respect to each electronic book of user A is obtained by (Equation 3). As a result, the cosine similarity with respect to the book A is “0.905490442”, the cosine similarity with respect to the book B is “0.999511003”, and the cosine similarity with respect to the book C is “0.815811036”. In the example shown in FIG. 5, the user A has the highest similarity to the book B.
[3]通信システムの動作
次に、図6を用いて本実施形態の情報提供サーバ装置30において実行される処理について説明する。図6は、本実施形態の情報提供サーバ装置30において実行される処理を示すフローチャートである。
[3] Operation of Communication System Next, processing executed in the information providing server device 30 of the present embodiment will be described using FIG. FIG. 6 is a flowchart showing processing executed in the information providing server device 30 of the present embodiment.
なお、本動作において、ユーザ管理DB331には、各ユーザに関する情報が既に登録されているとともに、コンテンツ情報DB332には、電子書籍等のコンテンツに関する情報が既に登録されているものとして説明する。また、通信端末装置20には、所定の電子書籍データが記憶され、かつ、当該通信端末装置20を用いて所定のユーザによって電子書籍配信サービスにログインしているものとする。
In this operation, it is assumed that information regarding each user is already registered in the
まず、情報提供サーバ装置30は、本動作を実行するための条件を満たしているか否かを判断する(S101)。本動作を実行するための条件は、例えば、ユーザにコンテンツ情報を数日毎に提供する場合において、本動作を実行するタイミングであるかどうかを判断する。 First, the information providing server device 30 determines whether or not a condition for executing this operation is satisfied (S101). For example, in the case where the content information is provided to the user every several days, the condition for executing this operation is determined as to whether or not it is the timing for executing this operation.
また、本動作を実行するタイミングであるかどうかに関わらず、所定のユーザがから通信端末装置10を介してコンテンツ情報が送信された場合、ユーザからの配信を検知し、本動作を実行する。 In addition, regardless of whether or not it is the timing to execute this operation, when content information is transmitted from a predetermined user via the communication terminal device 10, the distribution from the user is detected and this operation is executed.
次いで、情報提供サーバ装置30は、本動作を実行するための条件がユーザからの配信であるかどうかを判断する(S102)。 Next, the information providing server device 30 determines whether or not the condition for executing this operation is distribution from the user (S102).
本動作を実行するための条件がユーザからの配信である場合、情報提供サーバ装置30のコンテンツ情報取得部352は、配信された情報に基づいて得られた筆致特徴量を取得する(S103)。例えば、配信された情報が電子書籍のタイトルである場合、DB管理部351が、配信されたタイトルに基づきコンテンツ情報DB332を検索して電子書籍の文章を読み出し、コンテンツ情報抽出部353は、仮名比率、平均段落文字数及び会話文比率を含む文章筆致特徴量を抽出する。コンテンツ情報取得部352は、抽出された文章筆致特徴量を取得する。
When the condition for executing this operation is distribution from the user, the content
ただし、送信された情報が仮名比率、平均段落文字数及び会話文比率を含む文章筆致特徴量である場合、コンテンツ情報取得部352は、送信された情報をそのまま取得する。
However, when the transmitted information is a sentence writing feature amount including the kana ratio, the average number of paragraph characters, and the conversation sentence ratio, the content
一方、本動作を実行するための条件が予め設定された本動作を実行するタイミングの到来である場合、DB管理部351が、ユーザ管理DB331から所定のユーザの仮名比率、平均段落文字数及び会話文比率を含む平均文章筆致特徴量を読み出して、コンテンツ情報取得部が読み出された平均文章筆致特徴量を取得する(S104)。
On the other hand, when the condition for executing this operation is the timing for executing this operation set in advance, the
次いで、情報提供サーバ装置30は、コンテンツ情報DB332から各電子書籍の文章筆致特徴量を読み出す(S105)。 Next, the information providing server device 30 reads the sentence stroke feature amount of each electronic book from the content information DB 332 (S105).
次いで、類似度算出部354は、所定のユーザの電子書籍に対する嗜好性と各電子書籍との類似度を算出する。
Next, the
すなわち、類似度算出部354は、ユーザから配信された情報から得られた文章筆致特徴量と、コンテンツ情報DB332に登録された各電子書籍の文章筆致特徴量とに基づいて類似度を算出する。或いは、類似度算出部354は、ユーザ管理DB331から読み出された平均文章筆致特徴量と、コンテンツ情報DB332に登録された各電子書籍の文章筆致特徴量とに基づいて類似度を算出する。
That is, the
次いで、推薦情報生成部355が算出された類似度に基づいて推薦情報を生成する(S107)。例えば、類似度について予め閾値を設定しておき、算出された類似度がこの閾値を超える電子書籍を選択し、選択された電子書籍のタイトル、表紙画像及びカテゴリ等を推薦情報として生成する。或いは、類似度が高い上位3番目までの電子書籍を選択し、選択された電子書籍のタイトル、表紙画像及びカテゴリ等を推薦情報として生成する。
Next, the recommendation
次いで、情報提供部356は、生成された推薦情報を所定のユーザに提供し(S108)、本動作を終了させる。
Next, the
以上、本実施形態にでは、電子書籍等のコンテンツに関する情報、特に、仮名比率、平均段落文字数及び会話文比率を含む文章筆致特徴量を用いてユーザにコンテンツに関する推薦情報を提供するので、ユーザにとって有益性があるだけでなく、意外性がある情報を提供することができる。 As described above, in the present embodiment, information regarding content such as an electronic book, in particular, recommended information regarding the content is provided to the user using the sentence stroke feature amount including the kana ratio, the average number of paragraph characters, and the conversation sentence ratio. Not only is it beneficial, it can provide surprising information.
[4]変形例
次に、上記の実施形態における変形例を説明する。
[4] Modified Example Next, a modified example in the above embodiment will be described.
[4.1]変形例1
上記実施形態の情報提供サーバ装置30では、カテゴリに関係なく文章筆致特徴量を利用してユーザに推薦情報を提供している。しかしながら、仮名比率、平均段落文字数及び会話文比率といった文章筆致特徴量は、電子書籍が属するカテゴリにより異なる。例えば、文学作品と実用書では、文章筆致特徴量の特性は大きく異なる。
[4.1] Modification 1
In the information providing server device 30 of the above embodiment, the recommended information is provided to the user by using the text writing feature amount regardless of the category. However, sentence writing feature amounts such as the kana ratio, the average number of paragraph characters, and the conversation sentence ratio vary depending on the category to which the electronic book belongs. For example, literary works and utility books have greatly different characteristics of writing stroke feature quantities.
そこで、電子書籍が属するカテゴリを利用してユーザに推薦情報を提供するようにしてもよい。 Therefore, recommendation information may be provided to the user using a category to which the electronic book belongs.
具体的に、ユーザ管理DB331に平均文章筆致特徴量を登録する際に、カテゴリ毎に平均文章筆致特徴量を登録しておく。
Specifically, when registering the average sentence writing feature amount in the
類似度を算出する際には、コンテンツ情報取得部352が、カテゴリ毎にユーザ管理DB331から平均文章筆致特徴量を取得する一方で、コンテンツ情報DB332から文章筆致特徴量をカテゴリ毎に読み出すことによって、出類似度算出部354は、両者の値を利用して類似度を算出する。
When calculating the similarity, the content
そして、推薦情報生成部355は、カテゴリ毎に推薦情報を生成し、情報提供部356は生成されたカテゴリ毎の推薦情報をユーザに提供する。
The recommendation
以上のように、推薦情報をカテゴリ毎に提供することによって、推薦情報の精度を高めることができ、ユーザに高い価値の情報を提供することができる。 As described above, by providing the recommendation information for each category, the accuracy of the recommendation information can be improved, and high-value information can be provided to the user.
なお、カテゴリを利用して推薦情報を提供する場合、対象としている電子書籍が所属するカテゴリと同一のカテゴリに所属する文章筆致特徴量を利用して類似度を算出するだけでなく、電子書籍とは異なるカテゴリに所属する電子書籍の文章筆致特徴量を利用して類似度を算出することもできる。例えば、純文学のカテゴリに属する電子書籍を対象としている場合に、異なるカテゴリに属するSF小説の文章筆致特徴量を利用して類似度を算出する。 In addition, when providing recommendation information using a category, not only the similarity is calculated using the text stroke feature quantity belonging to the same category as the category to which the target electronic book belongs, The similarity can also be calculated by using the text writing feature amount of the electronic book belonging to a different category. For example, when an electronic book belonging to a pure literature category is targeted, the similarity is calculated using the sentence writing feature amount of an SF novel belonging to a different category.
同一のカテゴリに属する電子書籍の文章筆致特徴量を利用して類似度を算出して推薦情報を提供することによって、情報提供サーバ装置30は、ユーザの好みに合致した情報を提供することができる一方で、異なるカテゴリに属する電子書籍の文章筆致特徴量を利用して類似度を算出して推薦情報を提供することによって、情報提供サーバ装置30は、ユーザに意外性を有する情報を提供することができる。 The information providing server device 30 can provide information that matches the user's preference by calculating the degree of similarity using the writing stroke feature amount of the electronic book belonging to the same category and providing the recommended information. On the other hand, the information providing server device 30 provides unexpected information to the user by calculating the degree of similarity using the writing stroke feature amounts of electronic books belonging to different categories and providing recommendation information. Can do.
[4.2]変形例2
電子書籍の著作者を利用してユーザに推薦情報を提供するようにしてもよい。
[4.2] Modification 2
You may make it provide recommendation information to a user using the author of an electronic book.
例えば、推薦情報を生成する際に、所定のユーザによってこれまでに購入され、ユーザ管理DB331に登録されている電子書籍の著作者と同一の著作者の電子書籍の情報を生成する。この場合、情報提供サーバ装置30は、ユーザの好みに合致した情報を提供することができる。
For example, when generating recommendation information, information on an electronic book of the same author as the author of the electronic book that has been purchased so far by a predetermined user and registered in the
一方、推薦情報を生成する際に、所定のユーザによってこれまでに購入され、ユーザ管理DB331に登録されている電子書籍の著作者をあえて除外して推薦情報を生成する。これまでに、所定のユーザにより購入された電子書籍の著作者をあえて除外することによって、情報提供サーバ装置30は、当該ユーザに意外性を有する情報を提供することができる。
On the other hand, when generating the recommendation information, the recommendation information is generated excluding the author of the electronic book that has been purchased by a predetermined user and registered in the
[4.3]変形例3
上記実施形態の情報提供サーバ装置30では、ユーザによって購入された電子書籍の情報を利用して推薦情報を提供している。しかし、情報提供サーバ装置30は、ユーザの既読書籍の情報を利用して推薦情報を提供してもよい。
[4.3] Modification 3
In the information providing server device 30 of the above embodiment, recommendation information is provided using information on an electronic book purchased by a user. However, the information provision server device 30 may provide recommendation information using information of the user's already read books.
ユーザの既読書籍の情報を利用して推薦情報を提供する場合、通信端末装置10は、電子書籍リーダとして機能するアプリケーション(以下、「リーダアプリ」という。)を用いて配信された電子書籍(具体的には、電子書籍データ)を表示する機能を有しているとともに、読書中の電子書籍の最後のページが表示された場合に、当該電子書籍を読み終えた旨を示す既読通知情報を情報提供サーバ装置30に配信するように構成する。一方、情報提供サーバ装置30では、ユーザ管理DB331に既読書籍を登録する。
When providing recommendation information using information of a user's already read book, the communication terminal device 10 uses an electronic book (hereinafter referred to as a “reader application”) that functions as an electronic book reader. Specifically, the read notification information indicating that the electronic book has been read when the last page of the electronic book being read is displayed, as well as a function of displaying the electronic book data) Is delivered to the information providing server device 30. On the other hand, the information providing server device 30 registers the read book in the
通信端末装置10から既読通知情報が配信された電子書籍は、ユーザが当該電子書籍を最後まで読み終えているので、通信端末装置10から既読通知情報が配信されない電子書籍に比べて、ユーザの好みの電子書籍である蓋然性が高い。 Since the electronic book to which the read notification information is distributed from the communication terminal device 10 has been read by the user to the end, the user is compared with the electronic book to which the read notification information is not distributed from the communication terminal device 10. There is a high probability that it is a favorite e-book.
ユーザの既読書籍の情報を利用して推薦情報を提供することによって、情報提供サーバ装置30は、ユーザが好む情報を提供することが可能である。 By providing recommendation information using information of the user's already read books, the information providing server device 30 can provide information that the user likes.
[4.4]変形例4
上記実施形態においては、仮名比率を算出する際に、ひらがなとひらがな以外の文字とに区分して仮名比率を算出している。仮名比率を算出する際に、ひらがなに加えてカタカナ、アルファベット、数字、記号を区分の要素に組み入れることもできる。
[4.4] Modification 4
In the above embodiment, when calculating the kana ratio, the kana ratio is calculated by dividing into hiragana and characters other than hiragana. In calculating the kana ratio, in addition to hiragana, katakana, alphabets, numbers, and symbols can be incorporated into the elements of the category.
ひらがなに加えてカタカナ、アルファベット、数字、及び記号を区分の要素に組み入れる場合、情報提供サーバ装置30には、各要素の辞書を用意し、各要素が電子書籍の文章全体に占める割合を算出して保持しておく。 When incorporating katakana, alphabets, numbers, and symbols in addition to hiragana into the elements of the category, the information providing server device 30 prepares a dictionary for each element, and calculates the ratio of each element to the entire text of the electronic book. Hold it.
なお、ひらがなに加えてカタカナ、アルファベット、数字、及び記号を区分の要素に組み入れる場合、各要素の1つだけが文章全体に占める割合を仮名比率とするだけでなく、ひらがな、カタカナ、アルファベット、数字、及び記号から任意に組み合わせた2つ以上の要素が文章全体に占める割合を仮名比率とすることもできる。 In addition to hiragana, katakana, alphabets, numbers, and symbols are incorporated into the elements of the category, not only the ratio of only one of the elements in the whole sentence is the kana ratio, but also hiragana, katakana, alphabets, numbers. The ratio of two or more elements arbitrarily combined from the symbols to the entire sentence can be set as the kana ratio.
例えば、横書きの書籍では、縦書きの書籍に比べて、アルファベット、数字及び記号が多く用いられる。ひらがなの他にカタカナ、アルファベット、数字、及び記号を考慮して仮名比率を算出して所定のユーザが購入した電子書籍を解析した結果、当該ユーザは、アルファベットや数字の占める割合が極端に少ない電子書籍しか購入していないことが判明したとする。このユーザは、縦書きの電子書籍を好むと考えられるので、このユーザには、縦書きの電子書籍に関する情報を推薦情報として提供する。 For example, alphabets, numbers, and symbols are used more frequently in horizontally written books than in vertically written books. In addition to hiragana, katakana, alphabets, numbers, and symbols are taken into account to calculate the kana ratio and analyze e-books purchased by a given user. Suppose that it turns out that only books are purchased. Since this user is considered to prefer the vertically written electronic book, the user is provided with information related to the vertically written electronic book as recommendation information.
このように、ひらがなに加えてカタカナ、アルファベット、数字、及び記号を区分の要素に組み入れることによって、ユーザの嗜好性をより詳細に分析することができ、ユーザにとって有益性の高い情報を提供することができる。 In this way, by incorporating katakana, alphabets, numbers, and symbols in addition to hiragana, it is possible to analyze user preferences in more detail and provide information that is highly beneficial to users. Can do.
[4.5]
情報提供サーバ装置30においては、ユーザに提供する推薦情報に各品詞の特徴を利用することもできる。
[4.5]
In the information providing server device 30, the feature of each part of speech can be used for recommendation information provided to the user.
具体的に、電子書籍の文章全体に対して形態要素解析を実行し、電子書籍を構成する文章を品詞、句等に分類する。そして、例えば、名詞句に含まれるひらがな、カタカナ及び英数字の割合を求め保持しておく。 Specifically, the morphological element analysis is performed on the entire sentence of the electronic book, and the sentences constituting the electronic book are classified into parts of speech and phrases. Then, for example, the ratio of hiragana, katakana and alphanumeric characters included in the noun phrase is obtained and held.
この結果を利用してユーザに提供する推薦情報を生成することによって、ユーザの嗜好性に合致した情報を提供することが可能になる。例えば、電子書籍が海外を舞台にした小説である場合、相対的に多くのカタカナや英数字を含む名詞句が多く用いられる。これまでに、相対的に多くのカタカナや英数字を含む名詞句が多く用いられている電子書籍を多く購入したユーザは、海外を舞台にした小説を好んで購入していたと考えられる。情報提供サーバ装置30は、各品詞の特徴を利用することによって、このようなユーザに、海外を舞台にした小説に関する情報を提供することができる。 By generating recommendation information to be provided to the user using this result, it is possible to provide information that matches the user's preference. For example, when an electronic book is a novel set in overseas, a relatively large number of noun phrases including katakana and alphanumeric characters are often used. Up to now, it is considered that users who have purchased many e-books that use a relatively large number of katakana and noun phrases including alphanumeric characters prefer to purchase novels set in overseas. The information providing server device 30 can provide such users with information on novels set in overseas by using the characteristics of each part of speech.
[4.6]変形例6
上記実施形態においては、情報提供サーバ装置30内に各DBを設け、これらのDBを情報提供サーバ装置30のみにおいて管理及び制御する構成としたが、各DBの管理、制御主体は、各々、別個なコンピュータシステムを用いるようにしてもよい。
[4.6] Modification 6
In the above embodiment, each DB is provided in the information providing server device 30, and these DBs are managed and controlled only by the information providing server device 30. However, each DB management and control entity is separately provided. A simple computer system may be used.
1 … 通信システム
10 … 通信端末装置
30 … 情報提供サーバ装置
310 … 通信制御部
320 … ROM/RAM
330 … 記録装置
331 … ユーザ管理DB
332 … コンテンツ情報DB
340 … サーバ管理制御部
350 … データ処理部
351 … DB管理部
352 … コンテンツ情報取得部
353 … コンテンツ情報抽出部
354 … 類似度算出部
355 … 推薦情報生成部
356 … 情報提供部
DESCRIPTION OF SYMBOLS 1 ... Communication system 10 ... Communication terminal device 30 ... Information
330 ...
332 ... Content information DB
340 ... Server
Claims (12)
前記コンテンツ情報が登録されたコンテンツ情報データベース及びユーザに関するユーザ情報が登録されたユーザ管理データベースを管理するデータベース管理手段と、
前記コンテンツの文章内における文字の配列の特性を数値化した文章筆致特徴量を含むコンテンツ情報を取得するコンテンツ情報取得手段と、
前記コンテンツを解析し、該コンテンツの文章筆致特徴量を含むコンテンツ情報を抽出するコンテンツ情報抽出手段と、
前記コンテンツ情報取得手段により取得された前記文章筆致特徴量と、前記コンテンツ情報抽出手段が前記コンテンツ情報データベースに登録された各コンテンツから抽出した文章筆致特徴量と、を比較することによって、類似度を算出する類似度算出手段と、
算出された前記類似度に基づいて推薦情報を生成する推薦情報生成手段と、
生成された推薦情報をユーザに提供する情報提供手段と、
を備えることを特徴とするサーバ装置。 A server device connected to a communication terminal device via a network and providing content information related to content including text,
Database management means for managing a content information database in which the content information is registered and a user management database in which user information about the user is registered;
Content information acquisition means for acquiring content information including a sentence stroke feature amount obtained by quantifying the character arrangement characteristics in the content sentence;
Content information extraction means for analyzing the content and extracting content information including a sentence stroke feature amount of the content;
By comparing the sentence stroke feature amount acquired by the content information acquisition unit with the sentence stroke feature amount extracted from each content registered in the content information database by the content information extraction unit, similarity is obtained. Similarity calculating means for calculating;
Recommendation information generating means for generating recommendation information based on the calculated similarity;
An information providing means for providing the generated recommendation information to the user;
A server device comprising:
前記データベース管理手段が、前記ユーザによって購入された前記コンテンツの文章筆致特徴量に基づいて算出された平均文章筆致特徴量を含むコンテンツ情報を前記ユーザ毎に前記ユーザ管理データベースに登録し、
前記コンテンツ情報取得手段が、所定の前記ユーザの前記平均文章筆致特徴量を前記文章筆致特徴量として前記ユーザ情報データベースから取得するサーバ装置。 The server device according to claim 1,
The database management means registers content information including an average sentence writing feature amount calculated based on a sentence writing feature amount of the content purchased by the user in the user management database for each user,
The server apparatus in which the content information acquisition unit acquires the average sentence stroke feature amount of a predetermined user as the sentence stroke feature amount from the user information database.
前記文章筆致特徴量が、前記コンテンツにおける文章全体に占める仮名の割合であるサーバ装置。 In the server apparatus according to claim 1 or 2,
The server device, wherein the sentence writing feature amount is a ratio of kana to the entire sentence in the content.
前記文章筆致特徴量が、前記コンテンツにおける文章を構成する各段落に含まれる文字数の平均値であるサーバ装置。 In the server apparatus in any one of Claims 1-3,
The server device, wherein the sentence writing feature amount is an average value of the number of characters included in each paragraph constituting the sentence in the content.
前記文章筆致特徴量は、鉤括弧により表される会話文が、前記コンテンツにおける文章に対して占める割合であるサーバ装置。 In the server apparatus in any one of Claims 1-4,
The server device, wherein the sentence writing feature amount is a ratio of a conversation sentence represented by brackets to a sentence in the content.
前記データベース管理手段は、前記コンテンツが属するカテゴリを含む前記コンテンツ情報を当該コンテンツ毎に前記コンテンツ情報データベースに登録するとともに、前記ユーザによって購入された前記コンテンツのカテゴリを示すカテゴリ情報を含む前記コンテンツ情報をユーザ情報データベースに登録し、
前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に基づいて、前記カテゴリ毎に推薦情報を生成するサーバ装置。 In the server apparatus in any one of Claims 1-5,
The database management means registers the content information including the category to which the content belongs in the content information database for each content, and the content information including category information indicating the category of the content purchased by the user. Register in the user information database,
The recommendation information generation unit is a server device that generates recommendation information for each category based on the content information acquired by the content information acquisition unit.
前記コンテンツ情報登録手段が、前記ユーザによって購入された前記コンテンツのカテゴリを示すカテゴリ情報をさらに含む前記コンテンツ情報をユーザ情報データベースに登録し、
前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に含まれるカテゴリ情報に基づいて、該カテゴリ情報と同一のカテゴリ情報を有するコンテンツのみ、又は、該カテゴリ情報とは異なるカテゴリ情報を有するコンテンツのみを選択するサーバ装置。 In the server apparatus in any one of Claims 1-5,
The content information registration means registers the content information further including category information indicating a category of the content purchased by the user in a user information database;
The recommendation information generation means is based on the category information included in the content information acquired by the content information acquisition means, only content having the same category information as the category information, or category information different from the category information Server device that selects only content having
前記データベース管理手段が、前記ユーザによって購入された前記コンテンツの著作者を特定する著作者情報をさらに含む前記コンテンツ情報をユーザ情報データベースに登録し、
前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に含まれる著作者情報に基づいて、該著作者情報と同一の著作者情報を有するコンテンツのみ、又は、該著作者情報とは異なる著作者情報を有するコンテンツのみを選択するサーバ装置。 In the server apparatus in any one of Claims 1-7,
The database management means registers the content information further including author information for identifying an author of the content purchased by the user in a user information database;
The recommendation information generation means is based on the author information included in the content information acquired by the content information acquisition means, only the content having the same author information as the author information, or the author information Is a server device that selects only content having different author information.
前記データベース管理手段は、前記通信端末装置から送信された、当該コンテンツが既読であることを示す既読情報をさらに含む前記コンテンツ情報をユーザ情報データベースに登録し、
前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に含まれる前記既読情報を有するコンテンツのみを選択するサーバ装置。 In the server apparatus in any one of Claims 1-8,
The database management means registers the content information further including read information transmitted from the communication terminal device and indicating that the content has been read, in a user information database,
The recommended information generation unit is a server device that selects only content having the read information included in the content information acquired by the content information acquisition unit.
前記コンテンツ情報取得手段が、前記通信端末装置から送信された、前記コンテンツに関するコンテンツ情報に基づいて特定された文章筆致特徴量を含むコンテンツ情報を取得するサーバ装置。 In the server apparatus according to any one of claims 1 to 9,
A server device, wherein the content information acquisition unit acquires content information including a sentence writing feature amount specified based on content information related to the content transmitted from the communication terminal device.
前記コンテンツ情報が登録されたコンテンツ情報データベース及びユーザに関するユーザ情報が登録されたユーザ管理データベースを管理するデータベース管理手段、
前記コンテンツの文章内における文字の配列の特性を数値化した文章筆致特徴量を含むコンテンツ情報を取得するコンテンツ情報取得手段、
前記コンテンツを解析し、該コンテンツの文章筆致特徴量を含むコンテンツ情報を抽出するコンテンツ情報抽出手段、
前記コンテンツ情報取得手段により取得された前記文章筆致特徴量と、前記コンテンツ情報抽出手段が前記コンテンツ情報データベースに登録された各コンテンツから抽出した文章筆致特徴量と、を比較することによって、類似度を算出する類似度算出手段、
算出された前記類似度に基づいて推薦情報を生成する推薦情報生成手段、
生成された推薦情報をユーザに提供する情報提供手段、
として機能させることを特徴とするプログラム。 A server device connected to a communication terminal device via a network and providing content information related to content including text,
Database management means for managing a content information database in which the content information is registered and a user management database in which user information about the user is registered;
Content information acquisition means for acquiring content information including a sentence stroke characteristic amount obtained by quantifying the character arrangement characteristics in the content sentence;
Content information extraction means for analyzing the content and extracting content information including a sentence stroke feature amount of the content;
By comparing the sentence stroke feature amount acquired by the content information acquisition unit with the sentence stroke feature amount extracted from each content registered in the content information database by the content information extraction unit, similarity is obtained. Similarity calculation means for calculating,
Recommendation information generating means for generating recommendation information based on the calculated similarity,
Information providing means for providing the generated recommendation information to the user;
A program characterized by functioning as
前記コンテンツ情報が登録されたコンテンツ情報データベース及びユーザに関するユーザ情報が登録されたユーザ管理データベースを管理するデータベース管理工程と、
前記コンテンツの文章内における文字の配列の特性を数値化した文章筆致特徴量を含むコンテンツ情報を取得するコンテンツ情報取得工程と、
前記コンテンツを解析し、該コンテンツの文章筆致特徴量を含むコンテンツ情報を抽出するコンテンツ情報抽出工程と、
前記コンテンツ情報取得手段により取得された前記文章筆致特徴量と、前記コンテンツ情報抽出手段が前記コンテンツ情報データベースに登録された各コンテンツから抽出した文章筆致特徴量と、を比較することによって、類似度を算出する類似度算出工程と、
算出された前記類似度に基づいて推薦情報を生成する推薦情報生成工程と、
生成された推薦情報をユーザに提供する情報提供工程と、
を含むことを特徴とする情報提供方法。
An information providing method for providing content information relating to content including text from a server device to a communication terminal device connected to the server device via a network,
A database management process for managing a content information database in which the content information is registered and a user management database in which user information about the user is registered;
A content information acquisition step for acquiring content information including a sentence stroke feature value obtained by quantifying the character array characteristics in the content sentence;
A content information extraction step of analyzing the content and extracting content information including a sentence stroke feature amount of the content;
By comparing the sentence stroke feature amount acquired by the content information acquisition unit with the sentence stroke feature amount extracted from each content registered in the content information database by the content information extraction unit, similarity is obtained. A similarity calculation step to calculate,
A recommendation information generating step of generating recommendation information based on the calculated similarity;
An information providing step of providing the generated recommendation information to the user;
An information providing method comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015074071A JP6492889B2 (en) | 2015-03-31 | 2015-03-31 | Server apparatus, program, and information providing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015074071A JP6492889B2 (en) | 2015-03-31 | 2015-03-31 | Server apparatus, program, and information providing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016194790A JP2016194790A (en) | 2016-11-17 |
JP6492889B2 true JP6492889B2 (en) | 2019-04-03 |
Family
ID=57323563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015074071A Expired - Fee Related JP6492889B2 (en) | 2015-03-31 | 2015-03-31 | Server apparatus, program, and information providing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6492889B2 (en) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7149804B2 (en) * | 2001-04-30 | 2006-12-12 | Sony Computer Entertainment America Inc. | Method and system for providing evaluation of text-based products |
JP4142669B2 (en) * | 2004-05-11 | 2008-09-03 | 松下電器産業株式会社 | Electronic book apparatus and display method in electronic book apparatus |
JP2005352923A (en) * | 2004-06-11 | 2005-12-22 | Sony Corp | Device and method for storing information |
JP5831187B2 (en) * | 2011-12-08 | 2015-12-09 | 大日本印刷株式会社 | Content information distribution apparatus and content information distribution method |
-
2015
- 2015-03-31 JP JP2015074071A patent/JP6492889B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2016194790A (en) | 2016-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9361291B2 (en) | Custom dictionaries for E-books | |
JP5281405B2 (en) | Selecting high-quality reviews for display | |
US8725717B2 (en) | System and method for identifying topics for short text communications | |
US20140122990A1 (en) | Customized e-books | |
JP5541049B2 (en) | DATA GENERATION DEVICE, DATA GENERATION METHOD, AND DATA GENERATION PROGRAM | |
JP6033697B2 (en) | Image evaluation device | |
US20130041898A1 (en) | Image processing system, image processing method, program, and non-transitory information storage medium | |
CN107798622B (en) | Method and device for identifying user intention | |
CN111221940A (en) | Text generation method and device, electronic equipment and storage medium | |
CN108470289B (en) | Virtual article issuing method and equipment based on E-commerce shopping platform | |
CN109981712B (en) | Method and device for pushing information | |
EP2915067A1 (en) | Text analysis | |
US20180046683A1 (en) | Search word list providing device and method using same | |
CN111737607A (en) | Data processing method, data processing device, electronic equipment and storage medium | |
CN106708932A (en) | Abstract extraction method and apparatus for reply of question and answer website | |
JP6960838B2 (en) | Information providing equipment, information providing method, and program | |
JP7188879B2 (en) | Provision device, provision method and provision program | |
JP6492889B2 (en) | Server apparatus, program, and information providing method | |
JP2012256268A (en) | Advertisement distribution device and advertisement distribution program | |
JP2017091436A (en) | Feature word selection device | |
JP6696270B2 (en) | Information providing server device, program and information providing method | |
JP6680472B2 (en) | Information processing apparatus, information processing method, and information processing program | |
CN109978645B (en) | Data recommendation method and device | |
CN113111259A (en) | Subscription number content pushing method, device, equipment and storage medium | |
JP2007052693A (en) | Webpage information display apparatus, processing method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6492889 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |