JP6492889B2 - Server apparatus, program, and information providing method - Google Patents

Server apparatus, program, and information providing method Download PDF

Info

Publication number
JP6492889B2
JP6492889B2 JP2015074071A JP2015074071A JP6492889B2 JP 6492889 B2 JP6492889 B2 JP 6492889B2 JP 2015074071 A JP2015074071 A JP 2015074071A JP 2015074071 A JP2015074071 A JP 2015074071A JP 6492889 B2 JP6492889 B2 JP 6492889B2
Authority
JP
Japan
Prior art keywords
information
content
user
sentence
content information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015074071A
Other languages
Japanese (ja)
Other versions
JP2016194790A (en
Inventor
明生 大門
明生 大門
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2015074071A priority Critical patent/JP6492889B2/en
Publication of JP2016194790A publication Critical patent/JP2016194790A/en
Application granted granted Critical
Publication of JP6492889B2 publication Critical patent/JP6492889B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、通信端末装置に情報を提供するサーバ装置、そのプログラム、及び情報提供方法に関する。   The present invention relates to a server device that provides information to a communication terminal device, a program thereof, and an information providing method.

近年、インターネットなどのネットワーク及びパーソナルコンピュータなどの通信端末装置の発達に伴って、書籍、ニュース等の記事、及び、商品またはサービス等の広告(以下、まとめて「コンテンツ」という。)を、ネットワークまたは記録媒体を介して電子的に閲覧することが一般化している。また、最近では、通信機能を有する携帯ゲーム機器、タブレット型携帯端末装置、携帯用電話機などの携帯可能な携帯用通信端末装置を介して電子書籍を閲覧させることも多く行われている。   In recent years, with the development of networks such as the Internet and communication terminal devices such as personal computers, articles such as books, news, etc., and advertisements of goods or services (hereinafter collectively referred to as “contents”) are transmitted to the network or the network. Electronic browsing through recording media has become common. Recently, electronic books are often browsed through portable portable communication terminal devices such as portable game devices having a communication function, tablet portable terminal devices, and portable telephones.

このような状況下において、ネットワークを用いて書籍などのコンテンツを購入したユーザに対し、購入したコンテンツとは別のコンテンツのコンテンツ情報を提供するサービスが行われるようになってきた。   Under such circumstances, services for providing content information of content different from the purchased content to users who have purchased content such as books using a network have been provided.

例えば、ユーザが過去に購入した各書籍のキーワード・ベクトルをカテゴリ別に合成してユーザプロファイルを生成するとともに、書籍データベースを基にして、各書籍にキーワード・ベクトルを生成し、ユーザプロファイルのキーワード・ベクトルと未購入の各書籍のキーワード・ベクトルの類似度を計算することによって、類似度の高い未購入書籍を推奨する技術が知られている(例えば、特許文献1)。   For example, a user profile is generated by synthesizing a keyword vector of each book previously purchased by the user by category, and a keyword vector is generated for each book based on the book database. And a technique for recommending unpurchased books with a high degree of similarity by calculating the similarity of the keyword vector of each unpurchased book (for example, Patent Document 1).

特開2001−265808号公報JP 2001-265808 A

しかしながら、上記特許文献により開示された技術を用いたシステムは、キーワードを用いてベクトルを生成して類似度を算出するに過ぎないため、算出される類似度は、キーワードに拘束される。その結果、推奨する情報は次第に目新しさが失われ、ユーザは、意外性を有する情報を入手することができなくなる。   However, since the system using the technique disclosed in the above-mentioned patent document only calculates a similarity by generating a vector using a keyword, the calculated similarity is constrained by the keyword. As a result, the novelty of the recommended information is gradually lost, and the user cannot obtain unexpected information.

本発明は、上記課題を解決するためになされたものであり、その目的は、ユーザにとって有益性と意外性の両方を兼ね備えたコンテンツ情報を提供することが可能なサーバ装置等を提供することにある。   The present invention has been made to solve the above-described problems, and an object of the present invention is to provide a server device and the like that can provide content information having both usefulness and unexpectedness for the user. is there.

(1)上述した課題を解決するための本発明のサーバ装置は、通信端末装置とネットワークを介して接続され、文章を含むコンテンツに関するコンテンツ情報を提供するサーバ装置であって、前記コンテンツ情報が登録されたコンテンツ情報データベース及びユーザに関するユーザ情報が登録されたユーザ管理データベースを管理するデータベース管理手段と、前記コンテンツの文章内における文字の配列の特性を数値化した文章筆致特徴量を含むコンテンツ情報を取得するコンテンツ情報取得手段と、前記コンテンツを解析し、該コンテンツの文章筆致特徴量を含むコンテンツ情報を抽出するコンテンツ情報抽出手段と、前記コンテンツ情報取得手段により取得された前記文章筆致特徴量と、前記コンテンツ情報抽出手段が前記コンテンツ情報データベースに登録された各コンテンツから抽出した文章筆致特徴量と、を比較することによって、類似度を算出する類似度算出手段と、算出された前記類似度に基づいて推薦情報を生成する推薦情報生成手段と、生成された推薦情報をユーザに提供する情報提供手段と、を備える構成を有している。 (1) A server device of the present invention for solving the above-described problem is a server device that is connected to a communication terminal device via a network and provides content information regarding content including text, and the content information is registered. A database management means for managing the content information database and a user management database in which user information related to the user is registered, and content information including a sentence stroke characteristic amount obtained by quantifying the character arrangement characteristic in the sentence of the content Content information acquisition means, content information extraction means for analyzing the content and extracting content information including the text stroke feature quantity of the content, the text stroke feature quantity acquired by the content information acquisition means, Content information extraction means is the content Similarity calculation means for calculating similarity by comparing sentence stroke feature amounts extracted from each content registered in the information database, and recommendation information for generating recommendation information based on the calculated similarity It has a configuration comprising generation means and information provision means for providing the generated recommendation information to the user.

この構成を有する本発明のサーバ装置は、ユーザのコンテンツに対する嗜好性とコンテンツとの類似度を算出することによってコンテンツに関する情報をユーザに提供するので、ユーザにとって有益性を有する情報を提供することができる。   Since the server device of the present invention having this configuration provides the user with information related to the content by calculating the user's preference for the content and the similarity between the content, the server device can provide information that is beneficial to the user. it can.

特に、コンテンツの文章筆致特徴量に基づいて類似度を算出するので、ジャンルや著作者などのカテゴリに限定されずに広範囲にわたるコンテンツとの間で類似度を算出することができ、ユーザにとって新たな知識などを取得させることが可能な有益性及びユーザが予想しなかった意外性を有する情報をユーザに提供することができる。   In particular, since the similarity is calculated based on the content stroke characteristic amount of the content, it is possible to calculate the similarity with a wide range of content without being limited to categories such as genre and author, which is new to the user. It is possible to provide the user with information that has the benefit of being able to acquire knowledge and the like and the unexpectedness that the user did not expect.

(2)また、本発明に係るサーバ装置は、前記データベース管理手段が、前記ユーザによって購入された前記コンテンツの文章筆致特徴量に基づいて算出された平均文章筆致特徴量を含むコンテンツ情報を前記ユーザ毎に前記ユーザ管理データベースに登録し、前記コンテンツ情報取得手段が、所定の前記ユーザの前記平均文章筆致特徴量を前記文章筆致特徴量として前記ユーザ情報データベースから取得する構成を有している。 (2) Further, in the server device according to the present invention, the database management unit stores content information including an average sentence writing feature amount calculated based on a sentence writing feature amount of the content purchased by the user. Each content is registered in the user management database, and the content information acquisition unit acquires the average sentence stroke feature amount of a predetermined user from the user information database as the sentence stroke feature amount.

この構成を有する本発明のサーバ装置は、これまでにユーザが購入したコンテンツに関する情報を利用することによって、ユーザの嗜好性に合致したコンテンツに関する情報を提供することができる。   The server device of the present invention having this configuration can provide information on content that matches the user's preference by using information on content that has been purchased by the user so far.

(3)また、本発明に係るサーバ装置は、前記文章筆致特徴量が、前記コンテンツにおける文章全体に占める仮名の割合を含む構成を有している。 (3) Moreover, the server apparatus according to the present invention has a configuration in which the sentence stroke feature amount includes a ratio of kana to the entire sentence in the content.

仮名が占める割合は、コンテンツを構成する文章の文字密度ともいうべき特性を有しており、文章全体に占める仮名の割合が大きな文章は文字密度が低い印象を与え、仮名の占める割合が小さな文章は文字密度が高い印象を与える。   The proportion of kana has a characteristic that can be called the character density of the sentences that make up the content.Sentences with a high percentage of kana in the whole sentence give the impression that the character density is low, and sentences with a small percentage of kana Gives the impression of high character density.

この構成を有する本発明のサーバ装置は、仮名比率を含む文章筆致特徴量を利用して類似度を算出するので、コンテンツを構成する文章の文字密度についてユーザの好みに合致した情報を提供することができる。   Since the server device of the present invention having this configuration calculates the similarity by using the text writing feature amount including the kana ratio, it provides information that matches the user's preference regarding the character density of the text constituting the content. Can do.

(4)また、本発明に係るサーバ装置は、前記文章筆致特徴量が、前記コンテンツにおける文章を構成する各段落に含まれる文字数の平均値を含む構成を有している。 (4) Moreover, the server apparatus which concerns on this invention has the structure in which the said text stroke feature-value contains the average value of the number of characters contained in each paragraph which comprises the text in the said content.

段落に含まれる文字数は、文章のリズムに影響を与える。   The number of characters included in a paragraph affects the rhythm of the sentence.

この構成を有する本発明のサーバ装置では、文章筆致特徴量が各段落に含まれる文字数の平均値を含むので、ユーザの好みに合致したリズム感を有するコンテンツの情報を提供することができる。   In the server device of the present invention having this configuration, the sentence stroke feature amount includes the average value of the number of characters included in each paragraph, so that it is possible to provide information on content having a rhythm feeling that matches the user's preference.

(5)また、本発明に係るサーバ装置は、前記文章筆致特徴量は、鉤括弧により表される会話文が、前記コンテンツにおける文章に対して占める割合を含む構成を有している。 (5) Further, the server device according to the present invention has a configuration in which the sentence stroke feature amount includes a ratio of a conversation sentence represented by brackets to a sentence in the content.

文章に含まれる会話文は、当該文章に対するリズム感やイメージに影響を与える。   The conversational sentence included in the sentence affects the rhythm and image of the sentence.

この構成を有する本発明のサーバ装置は、文章筆致特徴量が会話文の前記コンテンツにおける文章に対して占める割合を含むので、ユーザの好みに合致したリズム感等を有するコンテンツの情報を提供することができる。   The server device of the present invention having this configuration includes the ratio of the sentence stroke feature amount to the sentence in the content of the conversation sentence, and therefore provides information on the content having a rhythm feeling that matches the user's preference. Can do.

(6)また、本発明に係るサーバ装置は、前記データベース管理手段は、前記コンテンツが属するカテゴリを含む前記コンテンツ情報を当該コンテンツ毎に前記コンテンツ情報データベースに登録するとともに、前記ユーザによって購入された前記コンテンツのカテゴリを示すカテゴリ情報を含む前記コンテンツ情報をユーザ情報データベースに登録し、前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に基づいて、前記カテゴリ毎に推薦情報を生成する構成を有している。 (6) In the server device according to the present invention, the database management unit registers the content information including the category to which the content belongs in the content information database for each content, and the purchase by the user. The content information including category information indicating a content category is registered in a user information database, and the recommendation information generation unit generates recommendation information for each category based on the content information acquired by the content information acquisition unit. It has the composition to do.

この構成を有する本発明のサーバ装置は、コンテンツが属するカテゴリ毎に推薦情報を生成して提供するので、コンテンツが属するカテゴリの特性に合致した情報をユーザに提供することができる。   Since the server apparatus of the present invention having this configuration generates and provides recommendation information for each category to which the content belongs, it is possible to provide information that matches the characteristics of the category to which the content belongs to the user.

(7)また、本発明に係るサーバ装置は、前記コンテンツ情報登録手段が、前記ユーザによって購入された前記コンテンツのカテゴリを示すカテゴリ情報をさらに含む前記コンテンツ情報をユーザ情報データベースに登録し、前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に含まれるカテゴリ情報に基づいて、該カテゴリ情報と同一のカテゴリ情報を有するコンテンツのみ、又は、該カテゴリ情報とは異なるカテゴリ情報を有するコンテンツのみを選択する構成を有している。 (7) In the server device according to the present invention, the content information registration unit registers the content information further including category information indicating a category of the content purchased by the user in a user information database, and the recommendation The information generation means has only the content having the same category information as the category information or category information different from the category information based on the category information included in the content information acquired by the content information acquisition means. It has a configuration for selecting only content.

この構成を有する本発明のサーバ装置によれば、例えば、ユーザがこれまでに購入したコンテンツと同じカテゴリに属するコンテンツについての情報を生成することにより、ユーザの好みに合致した情報を提供することができる一方で、異なるカテゴリに属するコンテンツに関する情報を生成することによって、ユーザにとって意外性を有する情報を提供することができる。   According to the server device of the present invention having this configuration, for example, by generating information on content that belongs to the same category as the content that the user has purchased so far, it is possible to provide information that matches the user's preference. On the other hand, it is possible to provide information that is surprising to the user by generating information on content belonging to different categories.

(8)また、本発明に係るサーバ装置は、前記データベース管理手段が、前記ユーザによって購入された前記コンテンツの著作者を特定する著作者情報をさらに含む前記コンテンツ情報をユーザ情報データベースに登録し、前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に含まれる著作者情報に基づいて、該著作者情報と同一の著作者情報を有するコンテンツのみ、又は、該著作者情報とは異なる著作者情報を有するコンテンツのみを選択する構成を有している。 (8) Further, in the server device according to the present invention, the database management unit registers the content information further including author information specifying the author of the content purchased by the user in a user information database, The recommendation information generation means is based on the author information included in the content information acquired by the content information acquisition means, only the content having the same author information as the author information, or the author information Has a configuration in which only content having different author information is selected.

この構成を有する本発明のサーバ装置によれば、例えば、ユーザがこれまでに購入したコンテンツの著作者と同じ著作者に関するコンテンツの情報を生成することによって、ユーザの好みに合致した情報を提供することができる一方で、異なる著作者に関するコンテンツの情報を提供することによって、ユーザに意外性を与えることができる。   According to the server device of the present invention having this configuration, for example, information that matches the user's preference is provided by generating content information about the same author as the author of the content that the user has purchased so far. On the other hand, by providing content information about different authors, the user can be surprised.

(9)また、本発明に係るサーバ装置は、前記データベース管理手段は、前記通信端末装置から送信された、当該コンテンツが既読であることを示す既読情報をさらに含む前記コンテンツ情報をユーザ情報データベースに登録し、前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に含まれる前記既読情報を有するコンテンツのみを選択する構成を有している。 (9) Further, in the server device according to the present invention, the database management unit may include the content information further including read information transmitted from the communication terminal device and indicating that the content has been read. The recommendation information generation unit is registered in the database, and has a configuration in which only the content having the read information included in the content information acquired by the content information acquisition unit is selected.

ユーザは、購入したコンテンツのすべてを最後まで読み切るとは限らない。すなわち、たとえ、コンテンツを購入した場合でも、そのコンテンツがユーザの好みに合わない場合、ユーザは、そのコンテンツを読むことを途中でやめてしまうことがある。逆に最後まで読み切った場合、ユーザは当該コンテンツが気に入ったと推測することができる。   The user does not always read through all of the purchased content. That is, even if the content is purchased, if the content does not meet the user's preference, the user may stop reading the content halfway. On the other hand, if the user has read all the way to the end, the user can guess that he / she likes the content.

この構成を有する本発明のサーバ装置は、既読であることを示す既読情報を利用することによって、ユーザが気に入ったと推測することができるコンテンツに類似するコンテンツに関する情報をユーザに提供することができる。   The server device of the present invention having this configuration can provide the user with information related to content similar to the content that can be presumed to be liked by the user by using already-read information indicating that it has been read. it can.

(10)また、本発明に係るサーバ装置は、前記コンテンツ情報取得手段が、前記通信端末装置から送信された、前記コンテンツに関するコンテンツ情報に基づいて特定された文章筆致特徴量を含むコンテンツ情報を取得する構成を有している。 (10) In the server device according to the present invention, the content information acquisition unit acquires content information including a sentence writing feature amount specified based on the content information related to the content transmitted from the communication terminal device. It has the composition to do.

この構成を有する本発明のサーバ装置は、上記のように通信端末装置から送信された、コンテンツに関するコンテンツ情報に基づいて特定された文章筆致特徴量を含むコンテンツ情報を利用するので、ユーザがそのときに希望する内容の情報を提供することができる。   Since the server device of the present invention having this configuration uses content information including text writing feature quantities specified based on content information related to content transmitted from the communication terminal device as described above, the user then Can provide information on the desired content.

(11)また、上述した課題を解決するための本発明に係るプログラムは、通信端末装置とネットワークを介して接続され、文章を含むコンテンツに関するコンテンツ情報を提供するサーバ装置を、前記コンテンツ情報が登録されたコンテンツ情報データベース及びユーザに関するユーザ情報が登録されたユーザ管理データベースを管理するデータベース管理手段、前記コンテンツの文章内における文字の配列の特性を数値化した文章筆致特徴量を含むコンテンツ情報を取得するコンテンツ情報取得手段、前記コンテンツを解析し、該コンテンツの文章筆致特徴量を含むコンテンツ情報を抽出するコンテンツ情報抽出手段、前記コンテンツ情報取得手段により取得された前記文章筆致特徴量と、前記コンテンツ情報抽出手段が前記コンテンツ情報データベースに登録された各コンテンツから抽出した文章筆致特徴量と、を比較することによって、類似度を算出する類似度算出手段、算出された前記類似度に基づいて推薦情報を生成する推薦情報生成手段、生成された推薦情報をユーザに提供する情報提供手段、として機能させる構成を有している。 (11) A program according to the present invention for solving the above-described problem is registered in a server device that is connected to a communication terminal device via a network and provides content information related to content including text. Database management means for managing the prepared content information database and a user management database in which user information related to the user is registered, and acquiring content information including a sentence writing feature value obtained by quantifying the character arrangement characteristic in the sentence of the content Content information acquisition means, content information extraction means for analyzing the content and extracting content information including the text stroke feature quantity of the content, the text stroke feature quantity acquired by the content information acquisition means, and the content information extraction Means said content Similarity calculation means for calculating similarity by comparing sentence stroke feature amounts extracted from each content registered in the information database, and recommendation information generation for generating recommendation information based on the calculated similarity And an information providing means for providing the generated recommendation information to the user.

この構成を有する本発明のプログラムは、ユーザのコンテンツに対する嗜好性とコンテンツとの類似度を算出することによってコンテンツに関する情報をユーザに提供するので、ユーザにとって有益性を有する情報を提供することができる。   Since the program of the present invention having this configuration provides the user with information related to the content by calculating the user's preference for the content and the similarity between the content, it is possible to provide information that is beneficial to the user. .

特に、コンテンツの文章筆致特徴量に基づいて類似度を算出するので、ジャンルや著作者などのカテゴリに限定されずに広範囲にわたるコンテンツとの間で類似度を算出することができ、ユーザにとって新たな知識などを取得させることが可能な有益性及びユーザが予想しなかった意外性を有する情報をユーザに提供することができる。
In particular, since the similarity is calculated based on the content stroke characteristic amount of the content, it is possible to calculate the similarity with a wide range of content without being limited to categories such as genre and author, which is new to the user. It is possible to provide the user with information that has the benefit of being able to acquire knowledge and the like and the unexpectedness that the user did not expect.

(12)また、上述した課題を解決するための本発明に係る情報提供方法は、サーバ装置から該サーバ装置とネットワークを介して接続された通信端末装置に、文章を含むコンテンツに関するコンテンツ情報を提供する情報提供方法であって、前記コンテンツ情報が登録されたコンテンツ情報データベース及びユーザに関するユーザ情報が登録されたユーザ管理データベースを管理するデータベース管理工程と、前記コンテンツの文章筆致特徴量を含むコンテンツ情報を取得するコンテンツ情報取得工程と、前記コンテンツを解析し、該コンテンツの文章内における文字の配列の特性を数値化した文章筆致特徴量を含むコンテンツ情報を抽出するコンテンツ情報抽出工程と、前記コンテンツ情報取得手段により取得された前記文章筆致特徴量と、前記コンテンツ情報抽出手段が前記コンテンツ情報データベースに登録された各コンテンツから抽出した文章筆致特徴量と、を比較することによって、類似度を算出する類似度算出工程と、算出された前記類似度に基づいて推薦情報を生成する推薦情報生成工程と、生成された推薦情報をユーザに提供する情報提供工程と、を含む工程を有している。 (12) Further, an information providing method according to the present invention for solving the above-described problem provides content information related to content including text from a server device to a communication terminal device connected to the server device via a network. A database management step for managing a content information database in which the content information is registered and a user management database in which user information about the user is registered; and content information including a sentence writing feature amount of the content A content information acquisition step for acquiring, a content information extraction step for analyzing the content, and extracting content information including a sentence stroke characteristic amount obtained by quantifying the character arrangement characteristic in the text of the content, and the content information acquisition The sentence stroke characteristic amount acquired by the means The similarity calculation step of calculating the similarity by comparing the content stroke extraction feature amount extracted from each content registered in the content information database by the content information extraction means, and the calculated similarity A recommendation information generating step for generating recommendation information based on the information, and an information providing step for providing the generated recommendation information to the user.

この構成を有する本発明の方法提供方法は、ユーザのコンテンツに対する嗜好性とコンテンツとの類似度を算出することによってコンテンツに関する情報をユーザに提供するので、ユーザにとって有益性を有する情報を提供することができる。   The method providing method of the present invention having this configuration provides the user with information related to the content by calculating the user's preference for the content and the similarity between the content, and thus provides information that is beneficial to the user. Can do.

特に、コンテンツの文章筆致特徴量に基づいて類似度を算出するので、ジャンルや著作者などのカテゴリに限定されずに広範囲にわたるコンテンツとの間で類似度を算出することができ、ユーザにとって新たな知識などを取得させることが可能な有益性及びユーザが予想しなかった意外性を有する情報をユーザに提供することができる。   In particular, since the similarity is calculated based on the content stroke characteristic amount of the content, it is possible to calculate the similarity with a wide range of content without being limited to categories such as genre and author, which is new to the user. It is possible to provide the user with information that has the benefit of being able to acquire knowledge and the like and the unexpectedness that the user did not expect.

本発明は、ユーザにとって有益性を有するだけでなく、ユーザにとって意外性をも備えたコンテンツ情報を提供することが可能である。   The present invention can provide content information that is not only useful to the user but also surprising to the user.

本発明の一実施形態における通信システムの構成を示すシステム構成図である。1 is a system configuration diagram showing a configuration of a communication system in an embodiment of the present invention. 一実施形態における情報提供サーバ装置の構成を示すブロック図である。It is a block diagram which shows the structure of the information provision server apparatus in one Embodiment. 一実施形態における情報提供サーバ装置内のユーザ管理データベースに記録されるデータの一例を示す図である。It is a figure which shows an example of the data recorded on the user management database in the information provision server apparatus in one Embodiment. 一実施形態における情報提供サーバ装置内の電子書籍データベースに記録されるデータの一例を示す図である。It is a figure which shows an example of the data recorded on the electronic book database in the information provision server apparatus in one Embodiment. 一実施形態の類似度算出部において、各ユーザのコンテンツに対する嗜好性とコンテンツとの類似度の算出を説明するための説明図である。It is explanatory drawing for demonstrating the preference of each user's content with respect to a content, and the calculation of the similarity with a content in the similarity calculation part of one Embodiment. 一実施形態のサーバ装置において実行される処理の動作を示すフローチャートである。It is a flowchart which shows the operation | movement of the process performed in the server apparatus of one Embodiment.

以下、図面を参照しつつ、本発明の実施形態について説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

なお、以下の実施形態は、通信端末装置と、当該通信端末装置とネットワークを介して接続される情報提供サーバ装置と、を有する通信システムに対し、本発明に係る、サーバ装置、プログラム及び情報提供方法を適用した場合の実施形態である。   In the following embodiments, a server device, a program, and information provision according to the present invention are provided for a communication system having a communication terminal device and an information providing server device connected to the communication terminal device via a network. It is embodiment at the time of applying a method.

また、本発明の「コンテンツ」としては、書籍、パンフレット、及び広告等、紙媒体の文書、並びに電子書籍、及び電子広告等のデジタルコンテンツを含む。ただし、以下では、本発明のコンテンツの代表例として電子書籍を用いて本実施形態を説明する。   In addition, the “content” of the present invention includes paper media documents such as books, pamphlets, and advertisements, and digital contents such as electronic books and electronic advertisements. However, hereinafter, the present embodiment will be described using an electronic book as a representative example of the content of the present invention.

[1]通信システムの概要
まず、図1及び図2を用いて本実施形態における通信システム1の概要について説明する。なお、図1は、本実施形態における通信システム1の構成を示すシステム構成図であり、図2は、本実施形態における通信システム1の動作概要を示す概念図である。また、図が煩雑になることを防止するために、図1及び図2においては、一部のユーザのみを示している。すなわち、実際の通信システム1においては、表示するよりも多数のユーザ、及び、通信端末装置10が存在している。
[1] Overview of Communication System First, an overview of the communication system 1 according to the present embodiment will be described with reference to FIGS. 1 and 2. FIG. 1 is a system configuration diagram showing a configuration of the communication system 1 in the present embodiment, and FIG. 2 is a conceptual diagram showing an operation outline of the communication system 1 in the present embodiment. Further, in order to prevent the figure from becoming complicated, only some users are shown in FIGS. 1 and 2. That is, in the actual communication system 1, there are a larger number of users and communication terminal devices 10 than displayed.

本実施形態の通信システム1は、デジタルコンテンツである電子書籍を配信するとともに、各電子書籍の文字の配列の特性を示す文章筆致を数値化した文章筆致特徴量を算出し、当該算出した文章筆致特徴量に基づいてユーザに電子書籍を推薦する情報を配信するシステムである。   The communication system 1 according to the present embodiment distributes electronic books that are digital contents, calculates a sentence writing feature amount that quantifies a sentence writing characteristic indicating the character arrangement characteristics of each electronic book, and calculates the calculated sentence writing match. This is a system for distributing information recommending an electronic book to a user based on a feature amount.

なお、本実施形態においては、各ユーザは、電子書籍を配信するネットワークサービス(以下、「電子書籍配信サービス」という。)に会員として登録されているものとして以下の説明を行う。   In the present embodiment, each user is described as being registered as a member in a network service that distributes electronic books (hereinafter referred to as “electronic book distribution service”).

本実施形態の通信システム1は、このような機能を実現するために、図1に示すように、各ユーザによって所持される複数の通信端末装置10と、ネットワーク20と、電子書籍配信サービスを提供する情報提供サーバ装置30と、を有している。   In order to realize such a function, the communication system 1 according to the present embodiment provides a plurality of communication terminal devices 10 possessed by each user, a network 20, and an electronic book distribution service, as shown in FIG. Information providing server device 30.

なお、各通信端末装置10は、基地局50を介してネットワーク20に接続される。また、ネットワーク20は、例えば、携帯電話網を含む公衆電話網と、IP(Internet Protocol)ネットワークが相互接続されて構成される。ただし、当該ネットワーク20の構成は、これに限られない。   Each communication terminal apparatus 10 is connected to the network 20 via the base station 50. The network 20 is configured by interconnecting a public telephone network including a mobile telephone network and an IP (Internet Protocol) network, for example. However, the configuration of the network 20 is not limited to this.

通信端末装置10は、電子書籍リーダの機能を有し、例えば、携帯型音楽プレーヤー、携帯型ゲーム機、タブレット型情報端末装置、スマートフォン、携帯用電話機、又はパーソナルコンピュータ等、ユーザによって携帯可能な通信端末装置である。   The communication terminal device 10 has a function of an electronic book reader. For example, a portable music player, a portable game machine, a tablet information terminal device, a smartphone, a portable telephone, a personal computer, or the like that can be carried by a user It is a terminal device.

特に、通信端末装置10は、XML(eXtensible Markup Language)等のマークアップ言語によって記述されているWWWシステム用のリソースデータと、当該リソースデータのネットワークアドレスを示す固有のURL(Uniform Resource Locator)とを用いつつ、情報提供サーバ装置30とのデータ通信を行うブラウジング機能を有している。   In particular, the communication terminal apparatus 10 receives resource data for the WWW system described in a markup language such as XML (extensible Markup Language) and a unique URL (Uniform Resource Locator) indicating a network address of the resource data. While using, it has a browsing function for performing data communication with the information providing server device 30.

また、通信端末装置10は、当該ブラウジング機能を用いて、情報提供サーバ装置30からリソースデータを受信し、当該リソースデータによって構成されるコンテンツをユーザが閲覧可能に表示する。   Moreover, the communication terminal device 10 receives the resource data from the information providing server device 30 using the browsing function, and displays the content configured by the resource data so that the user can browse.

そして、通信端末装置10は、基地局50及びネットワーク20を介して情報提供サーバ装置30と通信接続し、かつ、ユーザの操作に基づき電子書籍配信サービスにログインし、当該ログインしたユーザ(以下、「ログインユーザ」という。)として、情報提供サーバ装置30から種々のデータを授受して電子書籍配信サービスの提供を受けることができるように構成されている。   Then, the communication terminal device 10 is connected to the information providing server device 30 via the base station 50 and the network 20, and logs into the electronic book distribution service based on the user's operation. As a “logged-in user”), it is configured to receive various data from the information providing server device 30 and receive provision of an electronic book distribution service.

特に、通信端末装置10は、ユーザが当該通信システム1を利用してこれまでに電子書籍を購入したことがある場合、電子書籍の購入履歴に基づいて、ユーザにとって有益性を有するとともに意外性を有する電子書籍に関するコンテンツ情報の提供を受け取ることができるように構成されている。   In particular, when the user has purchased an e-book using the communication system 1 so far, the communication terminal device 10 is beneficial to the user and has unexpectedness based on the purchase history of the e-book. It is configured to be able to receive provision of content information related to an electronic book.

また、通信端末装置10は、ユーザ自らが所定のコンテンツ情報を情報提供サーバ装置30に配信することにより、当該コンテンツ情報に基づいて選択された電子書籍に関するコンテンツ情報を入手することができるように構成されている。   Further, the communication terminal device 10 is configured such that the user himself / herself distributes predetermined content information to the information providing server device 30 to obtain content information related to the electronic book selected based on the content information. Has been.

情報提供サーバ装置30は、電子書籍配信サービスを提供するために用いられるシステムであり、電子書籍配信サービスを提供するため、各種のデータベース(以下、「DB」ともいう。)を有している。そして、情報提供サーバ装置30は、ユーザにとって有益性と意外性とを有する電子書籍に関するコンテンツ情報を配信するための各種の処理を実行する。   The information providing server device 30 is a system used for providing an electronic book distribution service, and has various databases (hereinafter also referred to as “DB”) in order to provide the electronic book distribution service. And the information provision server apparatus 30 performs the various processes for delivering the content information regarding the electronic book which has usefulness and unexpectedness for a user.

そして、この情報提供サーバ装置30は、
(1)電子書籍等のコンテンツに関するコンテンツ情報が登録されたコンテンツ情報データベースを管理するための構成、
(2)コンテンツの文章筆致特徴量を含むコンテンツ情報を取得するための構成、
(3)コンテンツを解析し、当該コンテンツの文章筆致特徴量を含むコンテンツ情報を抽出するための構成、
(4)コンテンツ情報を取得する構成により取得された文章筆致特徴量と、コンテンツの文章筆致特徴量を含むコンテンツ情報を抽出する構成がコンテンツ情報データベースに登録された各コンテンツから抽出した文章筆致特徴量と、を比較することによって、類似度を算出するための構成、
(5)算出された類似度に基づいて、ユーザにコンテンツ情報を推薦するための推薦情報を生成するための構成、
(6)生成された推薦情報をユーザに提供するための構成と、
を有している。
And this information provision server apparatus 30 is:
(1) Configuration for managing a content information database in which content information related to content such as electronic books is registered;
(2) A configuration for acquiring content information including a sentence stroke characteristic amount of content,
(3) Configuration for analyzing content and extracting content information including sentence stroke feature amount of the content,
(4) Sentence writing feature amount extracted from each content registered in the content information database with a configuration for extracting content information including the sentence writing feature amount acquired by the configuration for acquiring content information and the content writing stroke feature amount of the content And a configuration for calculating the similarity by comparing
(5) A configuration for generating recommendation information for recommending content information to the user based on the calculated similarity,
(6) a configuration for providing the generated recommendation information to the user;
have.

すなわち、情報提供サーバ装置30は、コンテンツ情報データベースに登録された電子書籍等のコンテンツの文章筆致特徴量と、ユーザが既に購入した電子書籍等のコンテンツの文章筆致特徴量の平均値とを比較し、両者の類似度を算出する。   That is, the information providing server device 30 compares the text stroke feature amount of the content such as the electronic book registered in the content information database with the average value of the text stroke feature amount of the content such as the electronic book that the user has already purchased. The similarity between the two is calculated.

ただし、情報提供サーバ装置30は、通信端末装置10から送信されたコンテンツ情報に基づいて、文章筆致特徴量を抽出し、抽出された文章筆致特徴量と、コンテンツ情報データベースに登録された電子書籍等のコンテンツの文章筆致特徴量とを比較し、両者の類似度を算出することも可能である。   However, the information providing server device 30 extracts the text stroke feature amount based on the content information transmitted from the communication terminal device 10, and the extracted text stroke feature amount and an electronic book registered in the content information database, etc. It is also possible to compare the writing stroke feature amount of the content of the content and calculate the similarity between the two.

そして、情報提供サーバ装置30は、算出された類似度に基づいて、ユーザにとって有益性と意外性の両方を有する電子書籍に関する情報を生成し、生成された情報をユーザに提供できるようになっている。   And the information provision server apparatus 30 can generate | occur | produce the information regarding the electronic book which has both usefulness and unexpectedness for a user based on the calculated similarity degree, and can provide the produced | generated information to a user now. Yes.

なお、本実施形態において、「文章筆致」とは、コンテンツを構成する文章のリズム等を表す「文章の書きっぷり」や「文章の形態」を意味する。本実施形態において、「文章筆致」は、筆づかいや筆の運び等を意味するものではない。また、文章筆致特徴量とは、コンテンツを構成する文章の特徴を表す文章筆致の特徴を定量的に表した値である。   In the present embodiment, “sentence writing” means “sentence writing” or “sentence form” representing the rhythm of the sentences constituting the content. In the present embodiment, “sentence writing” does not mean writing or carrying a brush. The sentence stroke feature amount is a value that quantitatively represents the feature of the sentence stroke that represents the feature of the sentence constituting the content.

本実施形態において、文章筆致特徴量としては、例えば、
(1)電子書籍の文章の全体に占める仮名の割合、
(2)電子書籍の文章を構成する各段落に含まれる文字数の平均値、
(3)鉤括弧により表される会話文が、電子書籍の文章に対して占める割合、
等の文章における文字の配列を数値化したものを挙げることができる。
In this embodiment, as the text stroke feature amount, for example,
(1) The ratio of kana to the entire text of the electronic book,
(2) The average number of characters included in each paragraph constituting the text of the electronic book,
(3) The ratio of the conversation sentence represented by the brackets to the text of the electronic book,
The numerical arrangement of the character arrangement in a sentence such as

以上の構成を有することによって、本実施形態の通信システム1は、ユーザの過去の電子書籍に対する購入履歴やユーザから提案されたコンテンツ情報に基づいてデータベースに登録された電子書籍の中からユーザにとって有益な電子書籍に関する情報を提供することが可能である。   By having the above configuration, the communication system 1 of the present embodiment is beneficial to the user from among electronic books registered in the database based on the purchase history of the user's past electronic books and the content information proposed by the user. It is possible to provide information on various electronic books.

特に、本実施形態の通信システム1は、文章筆致特徴量に基づいて類似度を算出しているので、ユーザに提供する情報のマンネリ化を防ぐことができ、ユーザに意外性を有する情報を提供することができるようになっている。   In particular, since the communication system 1 according to the present embodiment calculates the similarity based on the text stroke feature amount, it is possible to prevent the information provided to the user from being ruined and provide the user with unexpected information. Be able to.

[2]情報提供サーバ装置
[2.1]構成
次に、図2を参照しながら本実施形態の情報提供サーバ装置30の構成について説明する。なお、図2は、本実施形態の情報提供サーバ装置30の構成を示すブロック図である。
[2] Information Providing Server Device [2.1] Configuration Next, the configuration of the information providing server device 30 of the present embodiment will be described with reference to FIG. FIG. 2 is a block diagram showing the configuration of the information providing server device 30 of this embodiment.

本実施形態の情報提供サーバ装置30は、図2に示すように、ネットワーク20に接続される通信制御部310と、各種のメモリとして機能するROM/RAM320と、各種のデータベース(以下、「DB」と略す。)を有する記録装置330と、装置全体を制御するサーバ管理制御部340と、電子書籍データの配信、電子書籍の履歴情報の収集、コメント情報の登録、及び、当該コメント情報の提供するデータ処理部350と、を有する。   As shown in FIG. 2, the information providing server device 30 of the present embodiment includes a communication control unit 310 connected to the network 20, a ROM / RAM 320 functioning as various memories, and various databases (hereinafter, “DB”). And a server management control unit 340 for controlling the entire apparatus, distribution of electronic book data, collection of electronic book history information, registration of comment information, and provision of the comment information A data processing unit 350.

なお、上記の各部は、バスBによって相互に接続され、各構成要素間におけるデータの転送が実行される。   The above-described units are connected to each other by a bus B, and data transfer is performed between the components.

通信制御部310は、所定のネットワークインターフェースであり、通信端末装置10と通信チャネルを構築し、各種データの授受を行う。   The communication control unit 310 is a predetermined network interface, establishes a communication channel with the communication terminal device 10, and exchanges various data.

ROM/RAM320には、情報提供サーバ装置30の駆動に必要な各種のプログラムが記録されている。また、ROM/RAM320は、各種の処理が実行される際のワークエリアとして用いられる。   Various programs necessary for driving the information providing server device 30 are recorded in the ROM / RAM 320. The ROM / RAM 320 is used as a work area when various processes are executed.

記録装置330は、HDD、又は、SSD(Solid State Drive)により構成される。そして、記録装置330は、ユーザが電子書籍配信サービスの提供受けるために必要な情報が記憶されるユーザ管理DB331と、配信する電子書籍に関するコンテンツ情報が記憶されるコンテンツ情報DB332と、を有している。   The recording device 330 is configured by an HDD or an SSD (Solid State Drive). The recording device 330 includes a user management DB 331 that stores information necessary for the user to receive the electronic book distribution service, and a content information DB 332 that stores content information about the electronic book to be distributed. Yes.

なお、本実施形態のユーザ管理DB331は、本発明の所定のデータベースを構成し、コンテンツ情報DB332は、本発明のコンテンツ情報データベースを構成する。本実施形態の記録装置330の詳細は後述する。   Note that the user management DB 331 of this embodiment constitutes a predetermined database of the present invention, and the content information DB 332 constitutes a content information database of the present invention. Details of the recording apparatus 330 of this embodiment will be described later.

サーバ管理制御部340は、主に中央演算処理装置(CPU)によって構成され、プログラムを実行することによって、情報提供サーバ装置30の各部を統合制御する。   The server management control unit 340 is mainly configured by a central processing unit (CPU), and integrally controls each unit of the information providing server device 30 by executing a program.

データ処理部350は、サーバ管理制御部340の制御の下、記録装置330と連動し、ユーザの指示に基づくログイン要求を通信端末装置10から取得した場合に、当該要求に基づいて各ユーザの電子書籍配信サービスへのログイン処理を実行する。   When the data processing unit 350 obtains a login request based on a user instruction from the communication terminal device 10 in conjunction with the recording device 330 under the control of the server management control unit 340, the data processing unit 350 receives the electronic information of each user based on the request. Log in to the book distribution service.

そして、データ処理部350は、
(1)ユーザ情報が登録されたユーザ管理DB331及び電子書籍等のコンテンツ情報が登録されたコンテンツ情報DB332を管理するための処理、
(2)ユーザ毎の平均文章筆致特徴量又はユーザから配信された情報に基づき得られた文章筆致特徴量を含むコンテンツ情報を取得する取得処理、
(3)電子書籍等のコンテンツを解析し、当該コンテンツの文章筆致特徴量を含むコンテンツ情報の文章情報を抽出する抽出処理、
(4)取得された文章筆致特徴量と抽出した文章筆致特徴量とを比較することによって、類似度を算出する算出処理、
(5)算出された類似度に基づいて、電子書籍に関する推薦情報を生成する生成処理及び、
(6)生成された推薦情報をユーザに提供する提供処理、
を行っている。
Then, the data processing unit 350
(1) Processing for managing the user management DB 331 in which user information is registered and the content information DB 332 in which content information such as electronic books is registered;
(2) Acquisition processing for acquiring content information including an average sentence writing feature amount for each user or a sentence writing feature amount obtained based on information distributed from the user;
(3) An extraction process of analyzing content such as an electronic book and extracting text information of content information including a text stroke feature amount of the content,
(4) A calculation process for calculating the similarity by comparing the acquired sentence writing feature quantity with the extracted sentence writing feature quantity;
(5) Generation processing for generating recommendation information related to an electronic book based on the calculated similarity, and
(6) Providing processing for providing the generated recommendation information to the user,
It is carried out.

データ処理部350は、さらに、
(7)ユーザによって購読されたコンテンツの文章筆致特徴量に基づいて算出された平均文章筆致特徴量を含む電子書籍に関するコンテンツ情報をユーザ毎に所定のデータベースに登録する、
処理を行っている。
The data processing unit 350 further includes
(7) Register content information regarding an electronic book including an average sentence writing feature amount calculated based on a sentence writing feature amount of content subscribed by a user in a predetermined database for each user.
Processing is in progress.

具体的には、データ処理部350は、アプリケーションを実行することによって、各DBを管理するDB管理部351と、コンテンツ情報から文章情報抽出する抽出処理を実行するコンテンツ情報抽出部353と、コンテンツ情報を取得する取得処理を実行するコンテンツ情報取得部352と、類似度を算出する算出処理を実行する類似度算出部354と、推薦情報を生成する生成処理を実行する推薦情報生成部355と、当該推薦情報を提供する情報提供部356と、を実現する。   Specifically, the data processing unit 350, by executing an application, a DB management unit 351 that manages each DB, a content information extraction unit 353 that executes an extraction process that extracts text information from content information, and content information A content information acquisition unit 352 that executes an acquisition process for acquiring a similarity, a similarity calculation unit 354 that executes a calculation process that calculates a similarity, a recommendation information generation unit 355 that executes a generation process that generates recommendation information, And an information providing unit 356 that provides recommendation information.

[2.2]各種のDB
次に、図3及び図4を用いて本実施形態の各DBについて説明する。なお、図3及び図4は、それぞれ、情報提供サーバ装置30内に設けられたユーザ管理DB331、コンテンツ情報DB332に記録されるデータの一例を示す図である。
[2.2] Various DBs
Next, each DB of this embodiment will be described with reference to FIGS. 3 and 4. 3 and 4 are diagrams illustrating examples of data recorded in the user management DB 331 and the content information DB 332 provided in the information providing server device 30, respectively.

本実施形態のユーザ管理DB331は、電子書籍配信サービスに利用登録をした各ユーザを管理するための各種情報がデータとして格納されるデータベースである。例えば、ユーザ管理DB331には、図3に示すように、登録されたユーザ毎に、
(1)ユーザIDと、
(2)ログイン情報(ログインID、パスワード)と、
(3)購入済み書籍リスト(書籍ID)の情報と、
(4)購入済み書籍の平均文章筆致特徴量(仮名比率、平均段落文字数、会話文比率)の情報と、
が対応付けて登録(記録)される。
The user management DB 331 of this embodiment is a database in which various types of information for managing each user registered for use in the electronic book distribution service is stored as data. For example, in the user management DB 331, as shown in FIG.
(1) a user ID;
(2) login information (login ID, password);
(3) Information on the purchased book list (book ID);
(4) Information on the average sentence stroke feature amount (a kana ratio, average number of paragraph characters, conversation sentence ratio) of a purchased book;
Are registered (recorded) in association with each other.

なお、例えば、図3において、ユーザ管理DB331に、ユーザID「user101」のユーザに対応するログイン情報として、「ログインID:○△×・・・/パスワード:123abc・・」が登録され、購入済み電子書籍としてその書籍ID「DC001」、「DC003」、「DC004」、及び「DC010」が登録され、購入済み書籍の平均文章筆致特徴量として、仮名比率「0.43」、平均段落文字数「36」及び会話文比率「0.21」が登録されていることが示されている。   For example, in FIG. 3, “login ID: ○ Δ ×... / Password: 123abc...” Is registered and purchased in the user management DB 331 as login information corresponding to the user with the user ID “user101”. The book IDs “DC001”, “DC003”, “DC004”, and “DC010” are registered as electronic books, and the kana ratio “0.43”, the average number of paragraph characters “36” as the average sentence stroke feature amount of the purchased books. "And the conversational sentence ratio" 0.21 "are registered.

コンテンツ情報DB332は、通信端末装置10を介してユーザに提供される電子書籍等のコンテンツ情報が記録されるDBである。例えば、コンテンツ情報DB332には、図4に示すように、電子書籍(コンテンツ)毎に
(1)電子書籍IDと、
(2)電子書籍のタイトルと、
(3)電子書籍の本文データ(画像データ、テキストデータ及び電子書籍リーダにおける制御データ)と、
(4)表紙などの画像データと、
(5)著作者名及び著作者IDと、
(6)カテゴリ名及びカテゴリIDと、
(7)文章筆致特徴量(仮名比率、平均段落文字数、会話文比率)と、
が対応付けて登録される。
The content information DB 332 is a DB in which content information such as an electronic book provided to the user via the communication terminal device 10 is recorded. For example, in the content information DB 332, as shown in FIG. 4, for each electronic book (content), (1) an electronic book ID and
(2) the title of the electronic book;
(3) Body data of the electronic book (image data, text data, and control data in the electronic book reader),
(4) Image data such as a cover,
(5) Author name and author ID;
(6) Category name and category ID;
(7) Sentence writing features (kana ratio, average number of paragraph characters, conversation sentence ratio),
Are registered in association with each other.

なお、例えば、図4においては、コンテンツ情報DB332に、電子書籍ID「DC001」と対応付けられて、「○○法入門」の電子書籍のタイトルと、「DB001」の本文データと、「画像データ1」の画像データと、「木○○○:AT001」の著作者名及び著作者IDと、「法律書:CT010」のカテゴリ名及びカテゴリIDと、文章筆致特徴量である仮名比率「0.12」、平均段落文字数「56」及び会話文比率「0.08」と、が記録されていることが示されている。また、電子書籍ID、著作者ID及びカテゴリIDは、電子書籍データが新規にコンテンツ情報DB332に登録された際に情報提供サーバ装置30によって自動的に又は既に登録された電子書籍データに基づいて割り当てられるようになっている。   For example, in FIG. 4, the content information DB 332 is associated with the electronic book ID “DC001”, the title of the electronic book “Introduction to XX Law”, the body data of “DB001”, and the “image data” Image data of “1”, the author name and author ID of “Thu XX: AT001”, the category name and category ID of “law document: CT010”, and the kana ratio “0. 12 ”, the average number of paragraph characters“ 56 ”, and the conversation sentence ratio“ 0.08 ”are recorded. The electronic book ID, author ID, and category ID are assigned automatically by the information providing server device 30 when electronic book data is newly registered in the content information DB 332 or based on electronic book data already registered. It is supposed to be.

[2.3]データ処理部の詳細
[2.3.1]DB管理部
まず、本実施形態のデータ処理部350のDB管理部351の詳細について説明する。
[2.3] Details of Data Processing Unit [2.3.1] DB Management Unit First, details of the DB management unit 351 of the data processing unit 350 of this embodiment will be described.

本実施形態におけるDB管理部351は、本発明におけるデータベース管理手段を構成し、ユーザ管理DB331への情報の書き込みや読み出し、コンテンツ情報DBからの情報の読み出し等の処理を行っている。   The DB management unit 351 in the present embodiment constitutes a database management unit in the present invention, and performs processing such as writing and reading information to the user management DB 331 and reading information from the content information DB.

具体的に、DB管理部351は、予め、コンテンツ情報DB332に対し、電子書籍に関するコンテンツ情報を登録する処理を実行する。その際、DB管理部351は、電子書籍毎に、例えば、図4に示したように、「書籍ID」、「タイトル」、「本文データ」、「表紙画像」、「著作者/著作者ID」、「カテゴリ/カテゴリID」、及び文章筆致特徴量(仮名比率、平均段落文字数、会話文比率)をコンテンツ情報DB332にコンテンツ情報として登録する。   Specifically, the DB management unit 351 executes processing for registering content information related to the electronic book in the content information DB 332 in advance. At that time, the DB management unit 351, for each electronic book, for example, as shown in FIG. 4, “book ID”, “title”, “text data”, “cover image”, “author / author ID”. ”,“ Category / Category ID ”, and sentence writing feature amount (kana ratio, average number of paragraph characters, conversation sentence ratio) are registered as content information in the content information DB 332.

また、DB管理部351は、電子書籍に関するコンテンツ情報を追加的に登録する処理も実行する。   The DB management unit 351 also executes processing for additionally registering content information related to the electronic book.

一方、DB管理部351は、ユーザが電子書籍を購入したときに、ユーザ毎に、当該電子書籍に関するコンテンツ情報をユーザ管理DB331に登録する処理を実行する。その際、DB管理部351は、それまでに各ユーザが購入した電子書籍の文章筆致特徴量と今回購入した電子書籍の文章筆致特徴量とに基づいて算出された平均文章筆致特徴量をユーザ毎に登録する。   On the other hand, when the user purchases an electronic book, the DB management unit 351 executes processing for registering content information regarding the electronic book in the user management DB 331 for each user. At that time, the DB management unit 351 determines, for each user, the average sentence stroke feature amount calculated based on the sentence stroke feature amount of the electronic book purchased by each user and the sentence stroke feature amount of the electronic book purchased this time. Register with.

また、DB管理部351は、ユーザ管理DB331に登録された平均文章筆致特徴量を含むコンテンツ情報を読み出し、後述するコンテンツ情報取得部に受け渡す処理を実行する。   In addition, the DB management unit 351 executes processing for reading content information including the average sentence writing feature amount registered in the user management DB 331 and delivering the content information to a content information acquisition unit described later.

[2.3.2]コンテンツ情報取得部
次に、本実施形態のデータ処理部350のコンテンツ情報取得部352の詳細について説明する。
[2.3.2] Content Information Acquisition Unit Next, details of the content information acquisition unit 352 of the data processing unit 350 of the present embodiment will be described.

本実施形態のコンテンツ情報取得部352は、本発明のコンテンツ情報取得手段を構成し、ユーザ管理DB331から所定のユーザにおけるコンテンツ情報を取得すること、及び通信端末装置10を介してユーザから送信された情報に基づいて得られたコンテンツ情報を取得する処理を実行する。   The content information acquisition unit 352 of the present embodiment constitutes content information acquisition means of the present invention, acquires content information for a predetermined user from the user management DB 331, and is transmitted from the user via the communication terminal device 10. A process of acquiring content information obtained based on the information is executed.

特に、コンテンツ情報取得部352は、ユーザ管理DB331に登録された情報の中から、仮名比率、平均段落文字数及び会話文比率を含むユーザに固有の平均文章筆致特徴量を取得する処理を行っている。   In particular, the content information acquisition unit 352 performs processing for acquiring, from information registered in the user management DB 331, an average sentence writing feature amount unique to the user including a kana ratio, an average number of paragraph characters, and a conversation sentence ratio. .

なお、コンテンツ情報取得部352は通信端末装置10を介してユーザから送信された情報に基づいて、コンテンツ情報を取得する処理も行っている。その場合、後述するコンテンツ情報抽出部353がユーザから送信された情報(例えば、電子書籍のタイトル等)に基づいて、仮名比率、平均段落文字数及び会話文比率を含む文章筆致特徴量を抽出し、コンテンツ情報取得部352は、コンテンツ情報抽出部353によって抽出された文章筆致特徴量を取得する。   Note that the content information acquisition unit 352 also performs processing for acquiring content information based on information transmitted from the user via the communication terminal device 10. In that case, based on information (for example, the title of the electronic book) transmitted from the user, the content information extraction unit 353 described later extracts sentence stroke feature quantities including a kana ratio, an average number of paragraph characters, and a conversation sentence ratio. The content information acquisition unit 352 acquires the sentence stroke feature amount extracted by the content information extraction unit 353.

ただし、通信端末装置10を介してユーザから送信された情報が仮名比率、平均段落文字数及び会話文比率を含む文章筆致特徴量である場合、コンテンツ情報取得部352は通信端末装置10を介してユーザから送信された情報をそのまま取得する。   However, when the information transmitted from the user via the communication terminal device 10 is a sentence writing feature amount including the kana ratio, the average number of paragraph characters, and the conversation sentence ratio, the content information acquisition unit 352 is connected to the user via the communication terminal device 10. The information sent from is acquired as it is.

[2.3.3]コンテンツ情報抽出部
次に、本実施形態のデータ処理部350のコンテンツ情報抽出部353の詳細について説明する。
[2.3.3] Content Information Extraction Unit Next, details of the content information extraction unit 353 of the data processing unit 350 of the present embodiment will be described.

コンテンツ情報抽出部353は、本発明のコンテンツ情報抽出手段を構成し、電子書籍等のコンテンツを解析することによって、文章筆致特徴量を抽出する処理を実行する。このコンテンツ情報抽出部353によって抽出された文章筆致特徴量は、本実施形態における情報提供サーバ装置30が実行する処理において、コンテンツ情報の中核をなす情報である。   The content information extraction unit 353 constitutes content information extraction means of the present invention, and executes a process of extracting sentence writing feature amounts by analyzing content such as an electronic book. The sentence stroke feature amount extracted by the content information extraction unit 353 is information that forms the core of the content information in the process executed by the information providing server device 30 in the present embodiment.

具体的に、コンテンツ情報抽出部353は、各電子書籍等のコンテンツを構成する文章を解析することによって、
(1)仮名が文章全体にどの程度占めているかという、仮名の文章全体に対する割合を抽出すること、
(2)文章を構成する各段落に含まれる文字数の平均値を抽出すること、
(3)鉤括弧により表される会話文が、文章全体に対して占める割合を抽出すること
という各処理を実行している。なお、各処理の詳細は後述する。
Specifically, the content information extraction unit 353 analyzes sentences constituting content such as each electronic book,
(1) extracting the ratio of kana to the whole sentence, such as how much the kana occupies in the whole sentence;
(2) extracting an average value of the number of characters included in each paragraph constituting the sentence;
(3) Each process of extracting the ratio of the conversation sentence represented by the brackets to the whole sentence is executed. Details of each process will be described later.

このコンテンツ情報抽出部353によって抽出された文章筆致特徴量は、DB管理部351によって、電子書籍毎に、コンテンツ情報DB332に登録される(図4参照)。   The sentence stroke feature amount extracted by the content information extraction unit 353 is registered in the content information DB 332 for each electronic book by the DB management unit 351 (see FIG. 4).

[2.3.4]類似度算出部
次に、本実施形態のデータ処理部350の類似度算出部354の詳細について説明する。
[2.3.4] Similarity Calculation Unit Next, details of the similarity calculation unit 354 of the data processing unit 350 of the present embodiment will be described.

類似度算出部354は、本発明の類似度算出手段を構成する。この類似度算出部354は、コンテンツ情報取得部352が取得したコンテンツ情報に含まれる文章筆致特徴量と、コンテンツ情報DB332に登録された各電子書籍の情報に含まれる文章筆致特徴量とを比較して、両者の間における文章筆致特徴量の類似度を算出する処理を実行する。   The similarity calculation unit 354 constitutes similarity calculation means of the present invention. The similarity calculation unit 354 compares the text stroke feature amount included in the content information acquired by the content information acquisition unit 352 with the text stroke feature amount included in the information of each electronic book registered in the content information DB 332. Then, a process of calculating the similarity of the sentence stroke feature amount between the two is executed.

類似度算出部354は、コサイン類似度、ユークリッド距離を用いた算出法等を用いることによって、コンテンツ情報取得部352が取得したコンテンツ情報に含まれる文章筆致特徴量と、コンテンツ情報DB332に登録された各電子書籍の情報に含まれる文章筆致特徴量との間の類似度を算出する。なお、類似度算出部354による類似度の詳細は後述する。   The similarity calculation unit 354 uses the cosine similarity, the calculation method using the Euclidean distance, and the like, and the sentence stroke feature amount included in the content information acquired by the content information acquisition unit 352 and the content information DB 332 are registered. The degree of similarity between the text stroke feature amount included in the information of each electronic book is calculated. Details of the similarity by the similarity calculator 354 will be described later.

[2.3.5]推薦情報生成部
次に、本実施形態のデータ処理部350の推薦情報生成部355の詳細について説明する。
[2.3.5] Recommendation Information Generation Unit Next, details of the recommendation information generation unit 355 of the data processing unit 350 of the present embodiment will be described.

推薦情報生成部355は、本発明のコンテンツ推薦情報生成手段を構成し、類似度算出部354により算出された類似度に基づいて、所定の電子書籍を選択し、選択された電子書籍に関する種々の情報性を生成する処理を実行する。例えば、類似度に予め閾値を設けておき、この閾値よりも算出された類似度が高い値を示す電子書籍のみを選択する。或いは、算出された類似度を比較し、類似度が高い上位N番目(例えば上位3番目)までの電子書籍を選択する。   The recommendation information generation unit 355 constitutes content recommendation information generation means of the present invention, selects a predetermined electronic book based on the similarity calculated by the similarity calculation unit 354, and performs various types of information related to the selected electronic book. Executes processing to generate information. For example, a threshold is set in advance for the similarity, and only an electronic book showing a value with a higher similarity calculated than the threshold is selected. Alternatively, the calculated similarities are compared, and electronic books up to the top Nth (for example, the top third) having a high similarity are selected.

なお、類似度に予め閾値を設けておき、この閾値よりも算出された類似度が高い値を示す電子書籍を選択する場合において、選択された電子書籍が多数ある場合、選択された電子書籍の中から類似度が高い上位N番目(例えば上位3番目)までの電子書籍を選択するように構成することもできる。   In addition, when a threshold value is set in advance for the degree of similarity and an electronic book having a higher degree of similarity calculated than the threshold value is selected, if there are a large number of selected electronic books, It can also be configured to select the top Nth (for example, top 3) electronic books with the highest similarity.

そして、推薦情報生成部355は、選択された電子書籍に関する推薦情報を生成する。例えば、推薦情報に含まれる情報としては、電子書籍のタイトル、表紙画像、著作者、カテゴリを挙げることができる。なお、推薦情報に、ユーザの平均文章筆致特徴量を含めることもできる。   And the recommendation information generation part 355 produces | generates the recommendation information regarding the selected electronic book. For example, the information included in the recommendation information can include the title, cover image, author, and category of the electronic book. The recommendation information may include the user's average sentence stroke feature amount.

[2.3.6]情報提供部
次に、本実施形態のデータ処理部350の情報提供部356について説明する。
[2.3.6] Information Providing Unit Next, the information providing unit 356 of the data processing unit 350 of the present embodiment will be described.

情報提供部356は、本発明の情報提供手段を構成している。この情報提供部356は、推薦情報生成部355によって生成された電子書籍に関する推薦情報を、ネットワーク20を介して通信端末装置10に提供している。   The information providing unit 356 constitutes information providing means of the present invention. The information providing unit 356 provides the communication terminal device 10 with recommendation information regarding the electronic book generated by the recommendation information generating unit 355 via the network 20.

情報提供部356が通信端末装置10に対して情報を提供するための手段は、特に限定がなく、例えば、電子メールを利用して推薦情報を配することを一例として挙げることができる。ただし、情報の提供は、電子メールを利用することには限定されず、電子書店のシステムや通信端末装置10が備える書籍閲覧ようのアプリケーションを用いることや、SNSの諸機能を用いて実行するように構成することもできる。   The means for the information providing unit 356 to provide information to the communication terminal device 10 is not particularly limited, and for example, the recommendation information can be distributed using e-mail. However, the provision of information is not limited to the use of e-mail, but is performed using an application for browsing books provided in the system of the electronic bookstore or the communication terminal device 10 or using various functions of the SNS. It can also be configured.

[2.4]コンテンツ情報抽出部の処理内容の詳細
次に、コンテンツ情報抽出部353が実行する処理の詳細を説明する。
[2.4] Details of Processing Contents of Content Information Extraction Unit Next, details of processing executed by the content information extraction unit 353 will be described.

コンテンツ情報抽出部353は、電子書籍について一冊単位で文章筆致特徴量を抽出する。具体的には、上述したように、
(1)仮名が文章全体にどの程度占めているかという、仮名の文章全体に対する割合を抽出する処理(以下、「仮名比率の抽出処理」という。)、
(2)文章を構成する各段落に含まれる文字数の平均値を抽出する処理(以下、「平均段落文字数の抽出処理」という。)、及び
(3)鉤括弧により表される会話文が、文章全体に対して占める割合を抽出する処理(以下、「会話文比率の抽出処理」という。)、
という各処理を実行している。
The content information extraction unit 353 extracts a sentence stroke feature amount for each electronic book. Specifically, as described above,
(1) A process of extracting the ratio of the kana to the entire sentence as to how much the kana occupies the entire sentence (hereinafter referred to as “a kana ratio extraction process”);
(2) A process for extracting the average value of the number of characters included in each paragraph constituting the sentence (hereinafter referred to as “average paragraph number of characters extraction process”), and (3) a conversation sentence represented by brackets is a sentence. A process of extracting the proportion of the total (hereinafter referred to as “conversation sentence ratio extraction process”),
Each process is executed.

[2.4.1]仮名比率の抽出処理について
コンテンツ情報抽出部353は、仮名比率の抽出処理として、仮名が電子書籍を構成する文章全体にどの程度占めているのかを抽出する処理である。この仮名比率の抽出処理は、電子書籍を構成する文章全体の文字密度ともいうべき文章筆致の特徴量を抽出し、電子書籍の文章全体に占める仮名の割合を、ユーザに提供する情報に反映させてユーザの好みに合致した情報を抽出する。
[2.4.1] Kana Ratio Extraction Process The content information extraction unit 353 is a process for extracting how much the kana occupies in the entire sentence constituting the electronic book as the kana ratio extraction process. This kana ratio extraction process extracts the feature quantity of sentence writing that should be referred to as the character density of the entire sentence constituting the electronic book, and reflects the ratio of kana in the entire sentence of the electronic book in the information provided to the user. Information that matches user preferences.

すなわち、仮名比率の抽出処理は、文章全体に占める仮名の比率が大きい文字密度が低い文章を好むユーザには、文字密度の低い文章で構成された電子書籍に関する情報を提供するために、仮名の比率が小さい文字密度が高い文章を好むユーザには、文字密度の高い文章で構成された電子書籍に関する情報を提供するために用いる情報を抽出する処理である。   That is, in the kana ratio extraction process, in order to provide a user who prefers a sentence with a low character density and a large ratio of kana to the whole sentence, in order to provide information about an electronic book composed of sentences with a low character density, This is a process of extracting information used to provide information related to an electronic book composed of sentences having a high character density to a user who prefers sentences having a low character density and a high character density.

コンテンツ情報抽出部353が予め用意されている仮名の辞書(以下、「仮名辞書」という。)を利用し、電子書籍を構成する文章全体について、仮名と仮名以外の文字とに選別する。なお、本実施形態では、仮名以外の文字は、漢字、カタカナ、アルファベット及び記号等、ひらがな以外の文字を意味する。   The content information extraction unit 353 uses a kana dictionary (hereinafter referred to as “kana dictionary”) prepared in advance, and sorts the entire sentence constituting the electronic book into kana and characters other than kana. In the present embodiment, characters other than kana mean characters other than hiragana, such as kanji, katakana, alphabets, and symbols.

そして、コンテンツ情報抽出部353は、仮名と仮名以外の文字とに選別された文字数をそれぞれカウントし、仮名と仮名以外の文字とに選別された各文字を電子書籍の文章を構成する全体の文字数で除し、仮名が全体に占める割合と仮名以外の文字が全体に占める割合とを算出する。   Then, the content information extraction unit 353 counts the number of characters selected for the kana and the characters other than the kana, respectively, and the total number of characters constituting the text of the electronic book for each character selected for the kana and the characters other than the kana The ratio of the kana to the whole and the ratio of the characters other than the kana to the whole are calculated.

また、コンテンツ情報抽出部353は、算出された仮名が全体に占める割合の値をDB管理部351に受け渡し、DB管理部351がコンテンツ情報DB332に登録する。コンテンツ情報DB332に登録される情報は、図4に示すように、例えば、「0.43」等の数値である。   In addition, the content information extraction unit 353 transfers the value of the ratio of the calculated pseudonym to the whole to the DB management unit 351, and the DB management unit 351 registers it in the content information DB 332. The information registered in the content information DB 332 is a numerical value such as “0.43” as shown in FIG.

[2.4.2]平均段落文字数の抽出処理について
コンテンツ情報抽出部353は、平均段落文字数の抽出処理として、電子書籍の文章において、一段落当たりに占める文字数の平均値を抽出する。この平均段落文字数の抽出処理は、リズム感ともいうべき文章筆致の特徴量を抽出し、文章の持つリズム感をユーザに提供する情報に反映させて、ユーザの好みに合致した情報を提供するために用いる情報を抽出する処理である。
[2.4.2] Extraction process of average number of paragraph characters The content information extraction unit 353 extracts an average value of the number of characters per paragraph in the text of the electronic book as the extraction process of the average number of paragraph characters. This process of extracting the average number of paragraph characters is to extract the feature amount of sentence writing, which should be called rhythm, and to reflect the rhythm feeling of the sentence in the information provided to the user to provide information that matches the user's preference This is a process for extracting information used in the process.

具体的に、コンテンツ情報抽出部353は、電子書籍を構成する文章に設けられた改行を利用することによって、文章全体を段落毎に分解する。   Specifically, the content information extraction unit 353 decomposes the entire sentence into paragraphs by using line breaks provided in the sentences constituting the electronic book.

そして、コンテンツ情報抽出部353は、分解された各段落を構成する文字の数をそれぞれカウントするとともに、分解された段落の数をカウントする。   Then, the content information extraction unit 353 counts the number of characters constituting each decomposed paragraph, and counts the number of decomposed paragraphs.

また、コンテンツ情報抽出部353は、各段落を構成する文字の数を全段落分だけ足し合わせ、電子書籍の文章全体を構成する総文字数を求め、この総文字数を段落の数で除すことによって1段落当たりの平均段落文字数を算出する。   In addition, the content information extraction unit 353 adds the number of characters constituting each paragraph by all the paragraphs, obtains the total number of characters constituting the entire sentence of the electronic book, and divides the total number of characters by the number of paragraphs. Calculate the average number of paragraph characters per paragraph.

さらに、コンテンツ情報抽出部353は、算出された平均段落文字数をDB管理部351に受け渡し、DB管理部351がコンテンツ情報DB332に登録する。コンテンツ情報DB332に登録される情報は、図4に示すように、例えば、「36」等の数値である。   Further, the content information extraction unit 353 delivers the calculated average number of paragraph characters to the DB management unit 351, and the DB management unit 351 registers it in the content information DB 332. The information registered in the content information DB 332 is a numerical value such as “36”, for example, as shown in FIG.

[2.4.3]会話文比率の抽出処理について
コンテンツ情報抽出部353は、会話文比率の抽出処理として、会話文が電子書籍を構成する文章全体にどの程度占めているのかを抽出する。この会話文比率の抽出処理は、会話文が電子書籍を構成する文章全体に占める割合をユーザに提供する情報に反映させることによって、ユーザの好みに合致した情報を提供するために用いる情報を抽出する処理である。
[2.4.3] Conversation Sentence Ratio Extraction Process The content information extraction unit 353 extracts, as a conversational sentence ratio extraction process, how much a conversational sentence occupies in the entire sentence constituting the electronic book. In this conversation sentence ratio extraction process, information used to provide information that matches the user's preference is reflected by reflecting in the information provided to the user the ratio that the conversation sentence occupies in the entire sentence constituting the electronic book. It is processing to do.

具体的には、コンテンツ情報抽出部353は、電子書籍を構成する文章をサーチし、文章の中から鉤括弧を選択し、鉤括弧の中に含まれる文字を抽出する。   Specifically, the content information extraction unit 353 searches for sentences constituting the electronic book, selects brackets from the sentences, and extracts characters included in the brackets.

そして、コンテンツ情報抽出部353は、抽出されたすべての文字の文字数をカウントする。   Then, the content information extraction unit 353 counts the number of characters of all extracted characters.

また、コンテンツ情報抽出部353は、抽出されたすべての文字の文字数を、電子書籍の文章を構成する文字の全文字数で除すことによって会話文比率を算出する。   Further, the content information extraction unit 353 calculates the conversational sentence ratio by dividing the number of characters of all the extracted characters by the total number of characters constituting the text of the electronic book.

さらに、コンテンツ情報抽出部353は、算出された会話文比率をDB管理部351に受け渡し、DB管理部351がコンテンツ情報DB332に「会話文比率」として登録する。コンテンツ情報DB332に登録される情報は、図4に示すように、例えば、「0.21」等の数値である。   Furthermore, the content information extraction unit 353 delivers the calculated conversation sentence ratio to the DB management unit 351, and the DB management unit 351 registers the content information DB 332 as “conversation sentence ratio”. The information registered in the content information DB 332 is a numerical value such as “0.21” as shown in FIG.

[2.4.4]平均文章筆致特徴量の算出処理について
コンテンツ情報抽出部353は、各ユーザの平均文章筆致特徴量の算出処理も実行する。
[2.4.4] Calculation process of average sentence stroke feature amount The content information extraction unit 353 also executes an average sentence stroke feature amount calculation process of each user.

平均文章筆致特徴量は、上述したように、各ユーザがこれまでに購入した電子書籍の文章筆致特徴量の平均値をユーザ毎に算出した値である。そこで、コンテンツ情報抽出部353は、ユーザが電子書籍を購入するたびに、それまでに、ユーザ管理DB331に登録されていた平均文章筆致特徴量と、今回購入した電子書籍の文章筆致特徴量とに基づいて、新たな平均文章筆致特徴量を算出する。   As described above, the average sentence writing feature amount is a value obtained by calculating, for each user, an average value of sentence writing feature amounts of electronic books purchased by each user so far. Therefore, each time the user purchases an electronic book, the content information extraction unit 353 converts the average sentence writing feature amount registered in the user management DB 331 and the sentence writing feature amount of the electronic book purchased this time. Based on this, a new average sentence stroke feature amount is calculated.

また、コンテンツ情報抽出部353は、新たに算出された平均文章筆致特徴量をDB管理部351に受け渡し、DB管理部351がユーザ管理DBB331の登録内容を更新する。   In addition, the content information extraction unit 353 passes the newly calculated average text stroke feature amount to the DB management unit 351, and the DB management unit 351 updates the registration content of the user management DBB 331.

[2.5]類似度算出部の処理内容の詳細
次に、類似度算出処理部354の処理内容の詳細を説明する。
[2.5] Details of Processing Content of Similarity Calculation Unit Next, details of processing content of the similarity calculation processing unit 354 will be described.

類似度算出部354は、所定のユーザにおける平均文章筆致特徴量と、各電子書籍におけるそれぞれの文章筆致特徴量とに基づいて、所定のユーザの電子書籍に対する嗜好性と各電子書籍との間の類似度を算出する。   The similarity calculation unit 354 determines whether the predetermined user's preference for the electronic book and each electronic book based on the average sentence writing feature amount of the predetermined user and each sentence writing feature amount of each electronic book. Calculate similarity.

例えば、類似度算出部354は、コサイン類似度の手法を用いた類似度の算出においては、
(1)ユーザについては、所定のユーザの平均文章筆致特徴量である、「仮名比率」、「平均段落文字数」及び「会話文比率」に基づいて、(式1)に示すベクトル「UX」を生成し、
(2)電子書籍については、各電子書籍の文章筆致特徴量である、「仮名比率」、「平均段落文字数」及び「会話文比率」に基づいて、(式2)に示すベクトル「Di」を生成し、
(3)所定のユーザのベクトル「UX」と各電子書籍のベクトル「Di」とのベクトル空間モデルを用いて、電子書籍毎に、所定のユーザとの類似度(sim)を(式3)に示すように、ベクトル「UX」とベクトル「Di」との内積を、ベクトル「UX」の大きさとベクトル「Di」の大きさとの積で除すことによって求める。
For example, the similarity calculation unit 354 calculates the similarity using the cosine similarity method.
(1) For the user, the vector “UX” shown in (Equation 1) is calculated based on the “Kana ratio”, “Average number of paragraph characters”, and “Conversation sentence ratio”, which are the average sentence stroke feature quantities of a predetermined user. Generate
(2) For electronic books, the vector “Di” shown in (Equation 2) is calculated based on the “sentence ratio”, “average number of paragraph characters”, and “conversation sentence ratio”, which are the sentence stroke feature quantities of each electronic book. Generate
(3) Using a vector space model of the vector “UX” of the predetermined user and the vector “Di” of each electronic book, the similarity (sim) with the predetermined user is expressed by (Equation 3) for each electronic book. As shown, the inner product of the vector “UX” and the vector “Di” is obtained by dividing by the product of the vector “UX” and the vector “Di”.

Figure 0006492889
Figure 0006492889

Figure 0006492889
Figure 0006492889

Figure 0006492889
Figure 0006492889

なお、(式1)において、「X」は、ユーザA、ユーザBなどのユーザを表し、(式2において、「i」は、電子書籍のID番号を表している。   In (Expression 1), “X” represents a user such as user A or user B (in Expression 2, “i” represents an ID number of an electronic book).

類似度算出部354が、コサイン類似度の手法を用いて類似度を算出する処理について、図5を参照して具体的に説明する。なお、図5は、コサイン類似度の手法を用いて類似度を算出する処理を説明するための説明図である。   A process in which the similarity calculation unit 354 calculates the similarity using the cosine similarity method will be specifically described with reference to FIG. FIG. 5 is an explanatory diagram for explaining processing for calculating similarity using a cosine similarity method.

図5に示すように、ユーザAと電子書籍との類似度を算出する場合を考える。   As shown in FIG. 5, consider a case where the similarity between the user A and the electronic book is calculated.

ユーザAの平均文章筆致特徴量は、仮名比率が「0.33」、平均段落文字数が「54」、会話文比率が「0.53」である。なお、ユーザAの平均文章筆致特徴量は、これまでにユーザAが購入した電子書籍の文章筆致特徴量を仮名比率、平均段落文字数及び、会話文比率の項目毎に平均した値である。   As for the average sentence stroke feature amount of the user A, the kana ratio is “0.33”, the average number of paragraph characters is “54”, and the conversation sentence ratio is “0.53”. Note that the average sentence writing feature amount of the user A is a value obtained by averaging the sentence writing feature amounts of the electronic books that the user A has purchased so far for each item of the kana ratio, the average number of paragraph characters, and the conversation sentence ratio.

一方、コンテンツ情報DBに登録されている各電子書籍の文章筆致特徴量は、書籍Aにあっては、仮名比率が「0.43」、平均段落文字数が「36.00」、会話文比率が「0.21」であり、書籍Bにあっては、仮名比率が「0.32」、平均段落文字数が「50.00」、会話文比率が「0.60」であり、書籍Cにあっては、仮名比率が「0.80」、平均段落文字数が「21.00」、会話文比率が「0.55」である。   On the other hand, the text stroke feature amount of each electronic book registered in the content information DB is that the book A has a kana ratio “0.43”, an average number of paragraph characters “36.00”, and a conversation sentence ratio. In book B, the kana ratio is “0.32”, the average number of paragraph characters is “50.00”, and the conversation sentence ratio is “0.60”. In other words, the kana ratio is “0.80”, the average number of paragraph characters is “21.00”, and the conversation sentence ratio is “0.55”.

これらの値に基づき、(式3)によってユーザAの各電子書籍に対するコサイン類似度を求める。その結果、書籍Aに対するコサイン類度が「0.905490442」、書籍Bに対するコサイン類似度が「0.995511003」、書籍Cに対するコサイン類度が「0.815811036」である。この図5に示す例では、ユーザAは、書籍Bに対する類似度が最も高いことになる。   Based on these values, the cosine similarity with respect to each electronic book of user A is obtained by (Equation 3). As a result, the cosine similarity with respect to the book A is “0.905490442”, the cosine similarity with respect to the book B is “0.999511003”, and the cosine similarity with respect to the book C is “0.815811036”. In the example shown in FIG. 5, the user A has the highest similarity to the book B.

[3]通信システムの動作
次に、図6を用いて本実施形態の情報提供サーバ装置30において実行される処理について説明する。図6は、本実施形態の情報提供サーバ装置30において実行される処理を示すフローチャートである。
[3] Operation of Communication System Next, processing executed in the information providing server device 30 of the present embodiment will be described using FIG. FIG. 6 is a flowchart showing processing executed in the information providing server device 30 of the present embodiment.

なお、本動作において、ユーザ管理DB331には、各ユーザに関する情報が既に登録されているとともに、コンテンツ情報DB332には、電子書籍等のコンテンツに関する情報が既に登録されているものとして説明する。また、通信端末装置20には、所定の電子書籍データが記憶され、かつ、当該通信端末装置20を用いて所定のユーザによって電子書籍配信サービスにログインしているものとする。   In this operation, it is assumed that information regarding each user is already registered in the user management DB 331 and information regarding content such as an electronic book is already registered in the content information DB 332. Further, it is assumed that predetermined electronic book data is stored in the communication terminal device 20 and that a predetermined user logs in to the electronic book distribution service using the communication terminal device 20.

まず、情報提供サーバ装置30は、本動作を実行するための条件を満たしているか否かを判断する(S101)。本動作を実行するための条件は、例えば、ユーザにコンテンツ情報を数日毎に提供する場合において、本動作を実行するタイミングであるかどうかを判断する。   First, the information providing server device 30 determines whether or not a condition for executing this operation is satisfied (S101). For example, in the case where the content information is provided to the user every several days, the condition for executing this operation is determined as to whether or not it is the timing for executing this operation.

また、本動作を実行するタイミングであるかどうかに関わらず、所定のユーザがから通信端末装置10を介してコンテンツ情報が送信された場合、ユーザからの配信を検知し、本動作を実行する。   In addition, regardless of whether or not it is the timing to execute this operation, when content information is transmitted from a predetermined user via the communication terminal device 10, the distribution from the user is detected and this operation is executed.

次いで、情報提供サーバ装置30は、本動作を実行するための条件がユーザからの配信であるかどうかを判断する(S102)。   Next, the information providing server device 30 determines whether or not the condition for executing this operation is distribution from the user (S102).

本動作を実行するための条件がユーザからの配信である場合、情報提供サーバ装置30のコンテンツ情報取得部352は、配信された情報に基づいて得られた筆致特徴量を取得する(S103)。例えば、配信された情報が電子書籍のタイトルである場合、DB管理部351が、配信されたタイトルに基づきコンテンツ情報DB332を検索して電子書籍の文章を読み出し、コンテンツ情報抽出部353は、仮名比率、平均段落文字数及び会話文比率を含む文章筆致特徴量を抽出する。コンテンツ情報取得部352は、抽出された文章筆致特徴量を取得する。   When the condition for executing this operation is distribution from the user, the content information acquisition unit 352 of the information providing server device 30 acquires the stroke feature amount obtained based on the distributed information (S103). For example, when the distributed information is the title of the electronic book, the DB management unit 351 searches the content information DB 332 based on the distributed title to read the text of the electronic book, and the content information extraction unit 353 Then, the sentence stroke feature amount including the average number of paragraph characters and the conversation sentence ratio is extracted. The content information acquisition unit 352 acquires the extracted text stroke feature amount.

ただし、送信された情報が仮名比率、平均段落文字数及び会話文比率を含む文章筆致特徴量である場合、コンテンツ情報取得部352は、送信された情報をそのまま取得する。   However, when the transmitted information is a sentence writing feature amount including the kana ratio, the average number of paragraph characters, and the conversation sentence ratio, the content information acquisition unit 352 acquires the transmitted information as it is.

一方、本動作を実行するための条件が予め設定された本動作を実行するタイミングの到来である場合、DB管理部351が、ユーザ管理DB331から所定のユーザの仮名比率、平均段落文字数及び会話文比率を含む平均文章筆致特徴量を読み出して、コンテンツ情報取得部が読み出された平均文章筆致特徴量を取得する(S104)。   On the other hand, when the condition for executing this operation is the timing for executing this operation set in advance, the DB management unit 351 determines the kana ratio, the average number of paragraph characters, and the conversation sentence of a predetermined user from the user management DB 331. The average sentence writing feature amount including the ratio is read, and the content information acquisition unit acquires the read average sentence writing feature amount (S104).

次いで、情報提供サーバ装置30は、コンテンツ情報DB332から各電子書籍の文章筆致特徴量を読み出す(S105)。   Next, the information providing server device 30 reads the sentence stroke feature amount of each electronic book from the content information DB 332 (S105).

次いで、類似度算出部354は、所定のユーザの電子書籍に対する嗜好性と各電子書籍との類似度を算出する。   Next, the similarity calculation unit 354 calculates the preference between the predetermined user's electronic book and the similarity between each electronic book.

すなわち、類似度算出部354は、ユーザから配信された情報から得られた文章筆致特徴量と、コンテンツ情報DB332に登録された各電子書籍の文章筆致特徴量とに基づいて類似度を算出する。或いは、類似度算出部354は、ユーザ管理DB331から読み出された平均文章筆致特徴量と、コンテンツ情報DB332に登録された各電子書籍の文章筆致特徴量とに基づいて類似度を算出する。   That is, the similarity calculation unit 354 calculates the similarity based on the text stroke feature amount obtained from the information distributed from the user and the text stroke feature amount of each electronic book registered in the content information DB 332. Alternatively, the similarity calculation unit 354 calculates the similarity based on the average sentence stroke feature amount read from the user management DB 331 and the sentence stroke feature amount of each electronic book registered in the content information DB 332.

次いで、推薦情報生成部355が算出された類似度に基づいて推薦情報を生成する(S107)。例えば、類似度について予め閾値を設定しておき、算出された類似度がこの閾値を超える電子書籍を選択し、選択された電子書籍のタイトル、表紙画像及びカテゴリ等を推薦情報として生成する。或いは、類似度が高い上位3番目までの電子書籍を選択し、選択された電子書籍のタイトル、表紙画像及びカテゴリ等を推薦情報として生成する。   Next, the recommendation information generation unit 355 generates recommendation information based on the calculated similarity (S107). For example, a threshold is set in advance for the similarity, an electronic book whose calculated similarity exceeds the threshold is selected, and a title, a cover image, a category, and the like of the selected electronic book are generated as recommendation information. Alternatively, the top three electronic books with high similarity are selected, and the title, cover image, category, and the like of the selected electronic book are generated as recommendation information.

次いで、情報提供部356は、生成された推薦情報を所定のユーザに提供し(S108)、本動作を終了させる。   Next, the information providing unit 356 provides the generated recommendation information to a predetermined user (S108), and ends this operation.

以上、本実施形態にでは、電子書籍等のコンテンツに関する情報、特に、仮名比率、平均段落文字数及び会話文比率を含む文章筆致特徴量を用いてユーザにコンテンツに関する推薦情報を提供するので、ユーザにとって有益性があるだけでなく、意外性がある情報を提供することができる。   As described above, in the present embodiment, information regarding content such as an electronic book, in particular, recommended information regarding the content is provided to the user using the sentence stroke feature amount including the kana ratio, the average number of paragraph characters, and the conversation sentence ratio. Not only is it beneficial, it can provide surprising information.

[4]変形例
次に、上記の実施形態における変形例を説明する。
[4] Modified Example Next, a modified example in the above embodiment will be described.

[4.1]変形例1
上記実施形態の情報提供サーバ装置30では、カテゴリに関係なく文章筆致特徴量を利用してユーザに推薦情報を提供している。しかしながら、仮名比率、平均段落文字数及び会話文比率といった文章筆致特徴量は、電子書籍が属するカテゴリにより異なる。例えば、文学作品と実用書では、文章筆致特徴量の特性は大きく異なる。
[4.1] Modification 1
In the information providing server device 30 of the above embodiment, the recommended information is provided to the user by using the text writing feature amount regardless of the category. However, sentence writing feature amounts such as the kana ratio, the average number of paragraph characters, and the conversation sentence ratio vary depending on the category to which the electronic book belongs. For example, literary works and utility books have greatly different characteristics of writing stroke feature quantities.

そこで、電子書籍が属するカテゴリを利用してユーザに推薦情報を提供するようにしてもよい。   Therefore, recommendation information may be provided to the user using a category to which the electronic book belongs.

具体的に、ユーザ管理DB331に平均文章筆致特徴量を登録する際に、カテゴリ毎に平均文章筆致特徴量を登録しておく。   Specifically, when registering the average sentence writing feature amount in the user management DB 331, the average sentence writing feature amount is registered for each category.

類似度を算出する際には、コンテンツ情報取得部352が、カテゴリ毎にユーザ管理DB331から平均文章筆致特徴量を取得する一方で、コンテンツ情報DB332から文章筆致特徴量をカテゴリ毎に読み出すことによって、出類似度算出部354は、両者の値を利用して類似度を算出する。   When calculating the similarity, the content information acquisition unit 352 acquires the average text stroke feature amount from the user management DB 331 for each category, while reading the text stroke feature amount for each category from the content information DB 332, The outgoing similarity calculation unit 354 calculates the similarity using both values.

そして、推薦情報生成部355は、カテゴリ毎に推薦情報を生成し、情報提供部356は生成されたカテゴリ毎の推薦情報をユーザに提供する。   The recommendation information generation unit 355 generates recommendation information for each category, and the information providing unit 356 provides the generated recommendation information for each category to the user.

以上のように、推薦情報をカテゴリ毎に提供することによって、推薦情報の精度を高めることができ、ユーザに高い価値の情報を提供することができる。   As described above, by providing the recommendation information for each category, the accuracy of the recommendation information can be improved, and high-value information can be provided to the user.

なお、カテゴリを利用して推薦情報を提供する場合、対象としている電子書籍が所属するカテゴリと同一のカテゴリに所属する文章筆致特徴量を利用して類似度を算出するだけでなく、電子書籍とは異なるカテゴリに所属する電子書籍の文章筆致特徴量を利用して類似度を算出することもできる。例えば、純文学のカテゴリに属する電子書籍を対象としている場合に、異なるカテゴリに属するSF小説の文章筆致特徴量を利用して類似度を算出する。   In addition, when providing recommendation information using a category, not only the similarity is calculated using the text stroke feature quantity belonging to the same category as the category to which the target electronic book belongs, The similarity can also be calculated by using the text writing feature amount of the electronic book belonging to a different category. For example, when an electronic book belonging to a pure literature category is targeted, the similarity is calculated using the sentence writing feature amount of an SF novel belonging to a different category.

同一のカテゴリに属する電子書籍の文章筆致特徴量を利用して類似度を算出して推薦情報を提供することによって、情報提供サーバ装置30は、ユーザの好みに合致した情報を提供することができる一方で、異なるカテゴリに属する電子書籍の文章筆致特徴量を利用して類似度を算出して推薦情報を提供することによって、情報提供サーバ装置30は、ユーザに意外性を有する情報を提供することができる。   The information providing server device 30 can provide information that matches the user's preference by calculating the degree of similarity using the writing stroke feature amount of the electronic book belonging to the same category and providing the recommended information. On the other hand, the information providing server device 30 provides unexpected information to the user by calculating the degree of similarity using the writing stroke feature amounts of electronic books belonging to different categories and providing recommendation information. Can do.

[4.2]変形例2
電子書籍の著作者を利用してユーザに推薦情報を提供するようにしてもよい。
[4.2] Modification 2
You may make it provide recommendation information to a user using the author of an electronic book.

例えば、推薦情報を生成する際に、所定のユーザによってこれまでに購入され、ユーザ管理DB331に登録されている電子書籍の著作者と同一の著作者の電子書籍の情報を生成する。この場合、情報提供サーバ装置30は、ユーザの好みに合致した情報を提供することができる。   For example, when generating recommendation information, information on an electronic book of the same author as the author of the electronic book that has been purchased so far by a predetermined user and registered in the user management DB 331 is generated. In this case, the information providing server device 30 can provide information that matches the user's preference.

一方、推薦情報を生成する際に、所定のユーザによってこれまでに購入され、ユーザ管理DB331に登録されている電子書籍の著作者をあえて除外して推薦情報を生成する。これまでに、所定のユーザにより購入された電子書籍の著作者をあえて除外することによって、情報提供サーバ装置30は、当該ユーザに意外性を有する情報を提供することができる。   On the other hand, when generating the recommendation information, the recommendation information is generated excluding the author of the electronic book that has been purchased by a predetermined user and registered in the user management DB 331. Until now, the information providing server device 30 can provide unexpected information to the user by intentionally excluding the author of the electronic book purchased by the predetermined user.

[4.3]変形例3
上記実施形態の情報提供サーバ装置30では、ユーザによって購入された電子書籍の情報を利用して推薦情報を提供している。しかし、情報提供サーバ装置30は、ユーザの既読書籍の情報を利用して推薦情報を提供してもよい。
[4.3] Modification 3
In the information providing server device 30 of the above embodiment, recommendation information is provided using information on an electronic book purchased by a user. However, the information provision server device 30 may provide recommendation information using information of the user's already read books.

ユーザの既読書籍の情報を利用して推薦情報を提供する場合、通信端末装置10は、電子書籍リーダとして機能するアプリケーション(以下、「リーダアプリ」という。)を用いて配信された電子書籍(具体的には、電子書籍データ)を表示する機能を有しているとともに、読書中の電子書籍の最後のページが表示された場合に、当該電子書籍を読み終えた旨を示す既読通知情報を情報提供サーバ装置30に配信するように構成する。一方、情報提供サーバ装置30では、ユーザ管理DB331に既読書籍を登録する。   When providing recommendation information using information of a user's already read book, the communication terminal device 10 uses an electronic book (hereinafter referred to as a “reader application”) that functions as an electronic book reader. Specifically, the read notification information indicating that the electronic book has been read when the last page of the electronic book being read is displayed, as well as a function of displaying the electronic book data) Is delivered to the information providing server device 30. On the other hand, the information providing server device 30 registers the read book in the user management DB 331.

通信端末装置10から既読通知情報が配信された電子書籍は、ユーザが当該電子書籍を最後まで読み終えているので、通信端末装置10から既読通知情報が配信されない電子書籍に比べて、ユーザの好みの電子書籍である蓋然性が高い。   Since the electronic book to which the read notification information is distributed from the communication terminal device 10 has been read by the user to the end, the user is compared with the electronic book to which the read notification information is not distributed from the communication terminal device 10. There is a high probability that it is a favorite e-book.

ユーザの既読書籍の情報を利用して推薦情報を提供することによって、情報提供サーバ装置30は、ユーザが好む情報を提供することが可能である。   By providing recommendation information using information of the user's already read books, the information providing server device 30 can provide information that the user likes.

[4.4]変形例4
上記実施形態においては、仮名比率を算出する際に、ひらがなとひらがな以外の文字とに区分して仮名比率を算出している。仮名比率を算出する際に、ひらがなに加えてカタカナ、アルファベット、数字、記号を区分の要素に組み入れることもできる。
[4.4] Modification 4
In the above embodiment, when calculating the kana ratio, the kana ratio is calculated by dividing into hiragana and characters other than hiragana. In calculating the kana ratio, in addition to hiragana, katakana, alphabets, numbers, and symbols can be incorporated into the elements of the category.

ひらがなに加えてカタカナ、アルファベット、数字、及び記号を区分の要素に組み入れる場合、情報提供サーバ装置30には、各要素の辞書を用意し、各要素が電子書籍の文章全体に占める割合を算出して保持しておく。   When incorporating katakana, alphabets, numbers, and symbols in addition to hiragana into the elements of the category, the information providing server device 30 prepares a dictionary for each element, and calculates the ratio of each element to the entire text of the electronic book. Hold it.

なお、ひらがなに加えてカタカナ、アルファベット、数字、及び記号を区分の要素に組み入れる場合、各要素の1つだけが文章全体に占める割合を仮名比率とするだけでなく、ひらがな、カタカナ、アルファベット、数字、及び記号から任意に組み合わせた2つ以上の要素が文章全体に占める割合を仮名比率とすることもできる。   In addition to hiragana, katakana, alphabets, numbers, and symbols are incorporated into the elements of the category, not only the ratio of only one of the elements in the whole sentence is the kana ratio, but also hiragana, katakana, alphabets, numbers. The ratio of two or more elements arbitrarily combined from the symbols to the entire sentence can be set as the kana ratio.

例えば、横書きの書籍では、縦書きの書籍に比べて、アルファベット、数字及び記号が多く用いられる。ひらがなの他にカタカナ、アルファベット、数字、及び記号を考慮して仮名比率を算出して所定のユーザが購入した電子書籍を解析した結果、当該ユーザは、アルファベットや数字の占める割合が極端に少ない電子書籍しか購入していないことが判明したとする。このユーザは、縦書きの電子書籍を好むと考えられるので、このユーザには、縦書きの電子書籍に関する情報を推薦情報として提供する。   For example, alphabets, numbers, and symbols are used more frequently in horizontally written books than in vertically written books. In addition to hiragana, katakana, alphabets, numbers, and symbols are taken into account to calculate the kana ratio and analyze e-books purchased by a given user. Suppose that it turns out that only books are purchased. Since this user is considered to prefer the vertically written electronic book, the user is provided with information related to the vertically written electronic book as recommendation information.

このように、ひらがなに加えてカタカナ、アルファベット、数字、及び記号を区分の要素に組み入れることによって、ユーザの嗜好性をより詳細に分析することができ、ユーザにとって有益性の高い情報を提供することができる。   In this way, by incorporating katakana, alphabets, numbers, and symbols in addition to hiragana, it is possible to analyze user preferences in more detail and provide information that is highly beneficial to users. Can do.

[4.5]
情報提供サーバ装置30においては、ユーザに提供する推薦情報に各品詞の特徴を利用することもできる。
[4.5]
In the information providing server device 30, the feature of each part of speech can be used for recommendation information provided to the user.

具体的に、電子書籍の文章全体に対して形態要素解析を実行し、電子書籍を構成する文章を品詞、句等に分類する。そして、例えば、名詞句に含まれるひらがな、カタカナ及び英数字の割合を求め保持しておく。   Specifically, the morphological element analysis is performed on the entire sentence of the electronic book, and the sentences constituting the electronic book are classified into parts of speech and phrases. Then, for example, the ratio of hiragana, katakana and alphanumeric characters included in the noun phrase is obtained and held.

この結果を利用してユーザに提供する推薦情報を生成することによって、ユーザの嗜好性に合致した情報を提供することが可能になる。例えば、電子書籍が海外を舞台にした小説である場合、相対的に多くのカタカナや英数字を含む名詞句が多く用いられる。これまでに、相対的に多くのカタカナや英数字を含む名詞句が多く用いられている電子書籍を多く購入したユーザは、海外を舞台にした小説を好んで購入していたと考えられる。情報提供サーバ装置30は、各品詞の特徴を利用することによって、このようなユーザに、海外を舞台にした小説に関する情報を提供することができる。   By generating recommendation information to be provided to the user using this result, it is possible to provide information that matches the user's preference. For example, when an electronic book is a novel set in overseas, a relatively large number of noun phrases including katakana and alphanumeric characters are often used. Up to now, it is considered that users who have purchased many e-books that use a relatively large number of katakana and noun phrases including alphanumeric characters prefer to purchase novels set in overseas. The information providing server device 30 can provide such users with information on novels set in overseas by using the characteristics of each part of speech.

[4.6]変形例6
上記実施形態においては、情報提供サーバ装置30内に各DBを設け、これらのDBを情報提供サーバ装置30のみにおいて管理及び制御する構成としたが、各DBの管理、制御主体は、各々、別個なコンピュータシステムを用いるようにしてもよい。
[4.6] Modification 6
In the above embodiment, each DB is provided in the information providing server device 30, and these DBs are managed and controlled only by the information providing server device 30. However, each DB management and control entity is separately provided. A simple computer system may be used.

1 … 通信システム
10 … 通信端末装置
30 … 情報提供サーバ装置
310 … 通信制御部
320 … ROM/RAM
330 … 記録装置
331 … ユーザ管理DB
332 … コンテンツ情報DB
340 … サーバ管理制御部
350 … データ処理部
351 … DB管理部
352 … コンテンツ情報取得部
353 … コンテンツ情報抽出部
354 … 類似度算出部
355 … 推薦情報生成部
356 … 情報提供部
DESCRIPTION OF SYMBOLS 1 ... Communication system 10 ... Communication terminal device 30 ... Information provision server device 310 ... Communication control part 320 ... ROM / RAM
330 ... Recording device 331 ... User management DB
332 ... Content information DB
340 ... Server management control unit 350 ... Data processing unit 351 ... DB management unit 352 ... Content information acquisition unit 353 ... Content information extraction unit 354 ... Similarity calculation unit 355 ... Recommended information generation unit 356 ... Information provision unit

Claims (12)

通信端末装置とネットワークを介して接続され、文章を含むコンテンツに関するコンテンツ情報を提供するサーバ装置であって、
前記コンテンツ情報が登録されたコンテンツ情報データベース及びユーザに関するユーザ情報が登録されたユーザ管理データベースを管理するデータベース管理手段と、
前記コンテンツの文章内における文字の配列の特性を数値化した文章筆致特徴量を含むコンテンツ情報を取得するコンテンツ情報取得手段と、
前記コンテンツを解析し、該コンテンツの文章筆致特徴量を含むコンテンツ情報を抽出するコンテンツ情報抽出手段と、
前記コンテンツ情報取得手段により取得された前記文章筆致特徴量と、前記コンテンツ情報抽出手段が前記コンテンツ情報データベースに登録された各コンテンツから抽出した文章筆致特徴量と、を比較することによって、類似度を算出する類似度算出手段と、
算出された前記類似度に基づいて推薦情報を生成する推薦情報生成手段と、
生成された推薦情報をユーザに提供する情報提供手段と、
を備えることを特徴とするサーバ装置。
A server device connected to a communication terminal device via a network and providing content information related to content including text,
Database management means for managing a content information database in which the content information is registered and a user management database in which user information about the user is registered;
Content information acquisition means for acquiring content information including a sentence stroke feature amount obtained by quantifying the character arrangement characteristics in the content sentence;
Content information extraction means for analyzing the content and extracting content information including a sentence stroke feature amount of the content;
By comparing the sentence stroke feature amount acquired by the content information acquisition unit with the sentence stroke feature amount extracted from each content registered in the content information database by the content information extraction unit, similarity is obtained. Similarity calculating means for calculating;
Recommendation information generating means for generating recommendation information based on the calculated similarity;
An information providing means for providing the generated recommendation information to the user;
A server device comprising:
請求項1に記載のサーバ装置において、
前記データベース管理手段が、前記ユーザによって購入された前記コンテンツの文章筆致特徴量に基づいて算出された平均文章筆致特徴量を含むコンテンツ情報を前記ユーザ毎に前記ユーザ管理データベースに登録し、
前記コンテンツ情報取得手段が、所定の前記ユーザの前記平均文章筆致特徴量を前記文章筆致特徴量として前記ユーザ情報データベースから取得するサーバ装置。
The server device according to claim 1,
The database management means registers content information including an average sentence writing feature amount calculated based on a sentence writing feature amount of the content purchased by the user in the user management database for each user,
The server apparatus in which the content information acquisition unit acquires the average sentence stroke feature amount of a predetermined user as the sentence stroke feature amount from the user information database.
請求項1又は2に記載のサーバ装置において、
前記文章筆致特徴量が、前記コンテンツにおける文章全体に占める仮名の割合であるサーバ装置。
In the server apparatus according to claim 1 or 2,
The server device, wherein the sentence writing feature amount is a ratio of kana to the entire sentence in the content.
請求項1〜3のいずれかに記載のサーバ装置において、
前記文章筆致特徴量が、前記コンテンツにおける文章を構成する各段落に含まれる文字数の平均値であるサーバ装置。
In the server apparatus in any one of Claims 1-3,
The server device, wherein the sentence writing feature amount is an average value of the number of characters included in each paragraph constituting the sentence in the content.
請求項1〜4のいずれかに記載のサーバ装置において、
前記文章筆致特徴量は、鉤括弧により表される会話文が、前記コンテンツにおける文章に対して占める割合であるサーバ装置。
In the server apparatus in any one of Claims 1-4,
The server device, wherein the sentence writing feature amount is a ratio of a conversation sentence represented by brackets to a sentence in the content.
請求項1〜5のいずれかに記載のサーバ装置において、
前記データベース管理手段は、前記コンテンツが属するカテゴリを含む前記コンテンツ情報を当該コンテンツ毎に前記コンテンツ情報データベースに登録するとともに、前記ユーザによって購入された前記コンテンツのカテゴリを示すカテゴリ情報を含む前記コンテンツ情報をユーザ情報データベースに登録し、
前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に基づいて、前記カテゴリ毎に推薦情報を生成するサーバ装置。
In the server apparatus in any one of Claims 1-5,
The database management means registers the content information including the category to which the content belongs in the content information database for each content, and the content information including category information indicating the category of the content purchased by the user. Register in the user information database,
The recommendation information generation unit is a server device that generates recommendation information for each category based on the content information acquired by the content information acquisition unit.
請求項1〜5のいずれかに記載のサーバ装置において、
前記コンテンツ情報登録手段が、前記ユーザによって購入された前記コンテンツのカテゴリを示すカテゴリ情報をさらに含む前記コンテンツ情報をユーザ情報データベースに登録し、
前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に含まれるカテゴリ情報に基づいて、該カテゴリ情報と同一のカテゴリ情報を有するコンテンツのみ、又は、該カテゴリ情報とは異なるカテゴリ情報を有するコンテンツのみを選択するサーバ装置。
In the server apparatus in any one of Claims 1-5,
The content information registration means registers the content information further including category information indicating a category of the content purchased by the user in a user information database;
The recommendation information generation means is based on the category information included in the content information acquired by the content information acquisition means, only content having the same category information as the category information, or category information different from the category information Server device that selects only content having
請求項1〜7のいずれかに記載のサーバ装置において、
前記データベース管理手段が、前記ユーザによって購入された前記コンテンツの著作者を特定する著作者情報をさらに含む前記コンテンツ情報をユーザ情報データベースに登録し、
前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に含まれる著作者情報に基づいて、該著作者情報と同一の著作者情報を有するコンテンツのみ、又は、該著作者情報とは異なる著作者情報を有するコンテンツのみを選択するサーバ装置。
In the server apparatus in any one of Claims 1-7,
The database management means registers the content information further including author information for identifying an author of the content purchased by the user in a user information database;
The recommendation information generation means is based on the author information included in the content information acquired by the content information acquisition means, only the content having the same author information as the author information, or the author information Is a server device that selects only content having different author information.
請求項1〜8のいずれかに記載のサーバ装置において、
前記データベース管理手段は、前記通信端末装置から送信された、当該コンテンツが既読であることを示す既読情報をさらに含む前記コンテンツ情報をユーザ情報データベースに登録し、
前記推薦情報生成手段は、前記コンテンツ情報取得手段が取得した前記コンテンツ情報に含まれる前記既読情報を有するコンテンツのみを選択するサーバ装置。
In the server apparatus in any one of Claims 1-8,
The database management means registers the content information further including read information transmitted from the communication terminal device and indicating that the content has been read, in a user information database,
The recommended information generation unit is a server device that selects only content having the read information included in the content information acquired by the content information acquisition unit.
請求項1〜9のいずれか1項に記載のサーバ装置において、
前記コンテンツ情報取得手段が、前記通信端末装置から送信された、前記コンテンツに関するコンテンツ情報に基づいて特定された文章筆致特徴量を含むコンテンツ情報を取得するサーバ装置。
In the server apparatus according to any one of claims 1 to 9,
A server device, wherein the content information acquisition unit acquires content information including a sentence writing feature amount specified based on content information related to the content transmitted from the communication terminal device.
通信端末装置とネットワークを介して接続され、文章を含むコンテンツに関するコンテンツ情報を提供するサーバ装置を、
前記コンテンツ情報が登録されたコンテンツ情報データベース及びユーザに関するユーザ情報が登録されたユーザ管理データベースを管理するデータベース管理手段、
前記コンテンツの文章内における文字の配列の特性を数値化した文章筆致特徴量を含むコンテンツ情報を取得するコンテンツ情報取得手段、
前記コンテンツを解析し、該コンテンツの文章筆致特徴量を含むコンテンツ情報を抽出するコンテンツ情報抽出手段、
前記コンテンツ情報取得手段により取得された前記文章筆致特徴量と、前記コンテンツ情報抽出手段が前記コンテンツ情報データベースに登録された各コンテンツから抽出した文章筆致特徴量と、を比較することによって、類似度を算出する類似度算出手段、
算出された前記類似度に基づいて推薦情報を生成する推薦情報生成手段、
生成された推薦情報をユーザに提供する情報提供手段、
として機能させることを特徴とするプログラム。
A server device connected to a communication terminal device via a network and providing content information related to content including text,
Database management means for managing a content information database in which the content information is registered and a user management database in which user information about the user is registered;
Content information acquisition means for acquiring content information including a sentence stroke characteristic amount obtained by quantifying the character arrangement characteristics in the content sentence;
Content information extraction means for analyzing the content and extracting content information including a sentence stroke feature amount of the content;
By comparing the sentence stroke feature amount acquired by the content information acquisition unit with the sentence stroke feature amount extracted from each content registered in the content information database by the content information extraction unit, similarity is obtained. Similarity calculation means for calculating,
Recommendation information generating means for generating recommendation information based on the calculated similarity,
Information providing means for providing the generated recommendation information to the user;
A program characterized by functioning as
サーバ装置から該サーバ装置とネットワークを介して接続された通信端末装置に、文章を含むコンテンツに関するコンテンツ情報を提供する情報提供方法であって、
前記コンテンツ情報が登録されたコンテンツ情報データベース及びユーザに関するユーザ情報が登録されたユーザ管理データベースを管理するデータベース管理工程と、
前記コンテンツの文章内における文字の配列の特性を数値化した文章筆致特徴量を含むコンテンツ情報を取得するコンテンツ情報取得工程と、
前記コンテンツを解析し、該コンテンツの文章筆致特徴量を含むコンテンツ情報を抽出するコンテンツ情報抽出工程と、
前記コンテンツ情報取得手段により取得された前記文章筆致特徴量と、前記コンテンツ情報抽出手段が前記コンテンツ情報データベースに登録された各コンテンツから抽出した文章筆致特徴量と、を比較することによって、類似度を算出する類似度算出工程と、
算出された前記類似度に基づいて推薦情報を生成する推薦情報生成工程と、
生成された推薦情報をユーザに提供する情報提供工程と、
を含むことを特徴とする情報提供方法。
An information providing method for providing content information relating to content including text from a server device to a communication terminal device connected to the server device via a network,
A database management process for managing a content information database in which the content information is registered and a user management database in which user information about the user is registered;
A content information acquisition step for acquiring content information including a sentence stroke feature value obtained by quantifying the character array characteristics in the content sentence;
A content information extraction step of analyzing the content and extracting content information including a sentence stroke feature amount of the content;
By comparing the sentence stroke feature amount acquired by the content information acquisition unit with the sentence stroke feature amount extracted from each content registered in the content information database by the content information extraction unit, similarity is obtained. A similarity calculation step to calculate,
A recommendation information generating step of generating recommendation information based on the calculated similarity;
An information providing step of providing the generated recommendation information to the user;
An information providing method comprising:
JP2015074071A 2015-03-31 2015-03-31 Server apparatus, program, and information providing method Expired - Fee Related JP6492889B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015074071A JP6492889B2 (en) 2015-03-31 2015-03-31 Server apparatus, program, and information providing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015074071A JP6492889B2 (en) 2015-03-31 2015-03-31 Server apparatus, program, and information providing method

Publications (2)

Publication Number Publication Date
JP2016194790A JP2016194790A (en) 2016-11-17
JP6492889B2 true JP6492889B2 (en) 2019-04-03

Family

ID=57323563

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015074071A Expired - Fee Related JP6492889B2 (en) 2015-03-31 2015-03-31 Server apparatus, program, and information providing method

Country Status (1)

Country Link
JP (1) JP6492889B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7149804B2 (en) * 2001-04-30 2006-12-12 Sony Computer Entertainment America Inc. Method and system for providing evaluation of text-based products
JP4142669B2 (en) * 2004-05-11 2008-09-03 松下電器産業株式会社 Electronic book apparatus and display method in electronic book apparatus
JP2005352923A (en) * 2004-06-11 2005-12-22 Sony Corp Device and method for storing information
JP5831187B2 (en) * 2011-12-08 2015-12-09 大日本印刷株式会社 Content information distribution apparatus and content information distribution method

Also Published As

Publication number Publication date
JP2016194790A (en) 2016-11-17

Similar Documents

Publication Publication Date Title
US9361291B2 (en) Custom dictionaries for E-books
JP5281405B2 (en) Selecting high-quality reviews for display
US8725717B2 (en) System and method for identifying topics for short text communications
US20140122990A1 (en) Customized e-books
JP5541049B2 (en) DATA GENERATION DEVICE, DATA GENERATION METHOD, AND DATA GENERATION PROGRAM
JP6033697B2 (en) Image evaluation device
US20130041898A1 (en) Image processing system, image processing method, program, and non-transitory information storage medium
CN107798622B (en) Method and device for identifying user intention
CN111221940A (en) Text generation method and device, electronic equipment and storage medium
CN108470289B (en) Virtual article issuing method and equipment based on E-commerce shopping platform
CN109981712B (en) Method and device for pushing information
EP2915067A1 (en) Text analysis
US20180046683A1 (en) Search word list providing device and method using same
CN111737607A (en) Data processing method, data processing device, electronic equipment and storage medium
CN106708932A (en) Abstract extraction method and apparatus for reply of question and answer website
JP6960838B2 (en) Information providing equipment, information providing method, and program
JP7188879B2 (en) Provision device, provision method and provision program
JP6492889B2 (en) Server apparatus, program, and information providing method
JP2012256268A (en) Advertisement distribution device and advertisement distribution program
JP2017091436A (en) Feature word selection device
JP6696270B2 (en) Information providing server device, program and information providing method
JP6680472B2 (en) Information processing apparatus, information processing method, and information processing program
CN109978645B (en) Data recommendation method and device
CN113111259A (en) Subscription number content pushing method, device, equipment and storage medium
JP2007052693A (en) Webpage information display apparatus, processing method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190218

R150 Certificate of patent or registration of utility model

Ref document number: 6492889

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees