JP2014232494A - Document creation assist device and operation method thereof - Google Patents

Document creation assist device and operation method thereof Download PDF

Info

Publication number
JP2014232494A
JP2014232494A JP2013114093A JP2013114093A JP2014232494A JP 2014232494 A JP2014232494 A JP 2014232494A JP 2013114093 A JP2013114093 A JP 2013114093A JP 2013114093 A JP2013114093 A JP 2013114093A JP 2014232494 A JP2014232494 A JP 2014232494A
Authority
JP
Japan
Prior art keywords
document
reaction
period
response
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013114093A
Other languages
Japanese (ja)
Inventor
遼 山下
Ryo Yamashita
遼 山下
千尋 高山
Chihiro Takayama
千尋 高山
大野 健彦
Takehiko Ono
健彦 大野
陽子 浅野
Yoko Asano
陽子 浅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013114093A priority Critical patent/JP2014232494A/en
Publication of JP2014232494A publication Critical patent/JP2014232494A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To obtain a prediction value of a response to a document.SOLUTION: A response prediction acquisition unit 4 searches a response history DB for a record fulfilling (condition 1) that a difference between a time of day 202 and the current time of day is within a prescribed range, (condition 2) that a situation of whether or not the day in question is a holiday matches a holiday flag 203, (condition 3) that the number of characters in a document concerned matches the number of characters 206, and (condition 4) that a category of the document concerned and category information 204 match (S2071). The response prediction acquisition unit 4 reads out a first period response count 211, a second period response count 212, a third period response count 213, a fourth period response count 214, and a fifth period response count 215, respectively as a first period response prediction value, a second period response prediction value, a third period response prediction value, a fourth period response prediction value, and a fifth period response prediction value (S2077), and then terminates the process. A response prediction output unit 5 outputs the first period response prediction value, the second period response prediction value, the third period response prediction value, the fourth period response prediction value, and the fifth period response prediction value.

Description

本発明は、文書作成支援装置およびその動作方法に関するものである。   The present invention relates to a document creation support apparatus and an operation method thereof.

従来においては、文書は作成者自身が考えて作成される、または、所定のルールを基に作成者の手間を省く補助を得て作成される。   Conventionally, a document is created by the creator himself / herself, or with the assistance of saving the creator's effort based on a predetermined rule.

特開平02−297124号公報Japanese Patent Laid-Open No. 02-297124 特開平02−116956号公報JP 02-116956 A

作成者が自身で文書を作成する場合、その文書を投稿して人に見てもらい、反応を得るなどし、こうして、反応を得やすい文書の作成に熟達する必要がある。   When a creator creates a document by himself / herself, he / she needs to be proficient in creating a document that easily obtains a reaction by posting the document and having a person see it and getting a response.

一方、補助を得て文書を作成する場合、作成時間は短縮されるが、反応を得やすい文書であるかは、実際に反応を得るまでわからない。   On the other hand, when a document is created with assistance, the creation time is shortened, but it is not known whether the document is easy to get a response until the response is actually obtained.

いずれにしても、作成者が文書作成に慣れていない場合、反応を得やすい文書を作成できなかったり、反応を予測できないことから、投稿時の心理的負担が大きい。   In any case, if the creator is not accustomed to document creation, a document that easily obtains a response cannot be created or a response cannot be predicted.

本発明は、上記の課題に鑑みてなされたものであり、その目的とするところは、文書への反応の予測値を得ることが可能な文書作成支援装置およびその動作方法を提供することにある。   The present invention has been made in view of the above problems, and an object of the present invention is to provide a document creation support apparatus capable of obtaining a predicted value of reaction to a document and an operation method thereof. .

上記の課題を解決するために、第1の本発明に係る文書作成支援装置は、文書作成の支援対象である対象文書の特徴量を求め、前記対象文書への反応の予測値である反応予測値を前記特徴量に基づいて求める反応予測取得部を備えることを特徴とする。   In order to solve the above-described problem, a document creation support apparatus according to a first aspect of the present invention obtains a feature quantity of a target document that is a support target of document creation, and a reaction prediction that is a predicted value of a response to the target document. A reaction prediction acquisition unit for obtaining a value based on the feature amount is provided.

例えば、文書作成支援装置は、前記対象文書でない文書について複数のレコードを有し、且つ、当該各レコードは該当の文書の特徴量と当該文書への反応数を含むデータベースを備え、前記反応予測取得部は、前記データベースから、前記対象文書の特徴量に対応するレコードを検索し、当該レコードに含まれる反応数に基づいて前記反応予測値を求める。   For example, the document creation support apparatus includes a plurality of records for a document that is not the target document, and each record includes a database that includes a feature amount of the document and the number of responses to the document, and the response prediction acquisition The unit searches the database for a record corresponding to the feature quantity of the target document, and obtains the predicted response value based on the number of reactions included in the record.

例えば、前記特徴量は、前記対象文書から不要な文字を削除した後の文字数を含む。   For example, the feature amount includes the number of characters after unnecessary characters are deleted from the target document.

例えば、前記特徴量は、前記対象文書から不要な文字を削除した後の文字数、前記対象文書のカテゴリおよび前記対象文書のサブカテゴリを含む。   For example, the feature amount includes the number of characters after unnecessary characters are deleted from the target document, the category of the target document, and the subcategory of the target document.

例えば、文書作成支援装置は、カテゴリとサブカテゴリが共通する複数の文書で構成されるグループ毎のレコードを有し、且つ、当該レコードは当該グループの特徴を示す要素を備える文書分類データベースを備え、前記反応予測取得部は、前記対象文書の特徴を示す特徴ベクトルを生成し、前記文書分類データベースから前記対象文書カテゴリに対応するレコードを検索し、検索された各レコードにつき、該レコードに含まれる要素からなる代表点ベクトルを生成し、前記特徴ベクトルと前記各代表点ベクトルとの間の距離を求め、最小の距離に対応するサブカテゴリを前記対象文書のサブカテゴリとする。   For example, the document creation support apparatus includes a record for each group including a plurality of documents having a common category and subcategory, and the record includes a document classification database including elements indicating characteristics of the group, The reaction prediction acquisition unit generates a feature vector indicating the feature of the target document, searches a record corresponding to the target document category from the document classification database, and for each searched record, from an element included in the record The representative point vector is generated, the distance between the feature vector and each representative point vector is obtained, and the subcategory corresponding to the minimum distance is set as the subcategory of the target document.

第2の本発明に係る文書作成支援装置は、対象文書を入力する文書入力部と、前記対象文書の特徴量を求め、前記対象文書への反応の予測値である反応予測値を前記特徴量に基づいて求める反応予測取得部と、前記反応予測値を出力する反応予測出力部とを備えることを特徴とする。   A document creation support apparatus according to a second aspect of the present invention provides a document input unit for inputting a target document, a feature amount of the target document, and a predicted response value that is a predicted value of a response to the target document. And a reaction prediction output unit for outputting the predicted reaction value.

第3の本発明に係る文書作成支援装置の動作方法は、文書作成支援装置の反応予測取得部が、対象文書の特徴量を求めるステップと、前記反応予測取得部が、前記対象文書への反応の予測値である反応予測値を前記特徴量に基づいて求めるステップとを備えることを特徴とする。   According to a third aspect of the present invention, there is provided a method for operating a document creation support apparatus, in which a response prediction acquisition unit of a document creation support apparatus obtains a feature amount of a target document, and the reaction prediction acquisition unit responds to the target document. And a step of obtaining a predicted reaction value, which is a predicted value of the above, based on the feature amount.

第4の本発明に係る文書作成支援装置の動作方法は、文書作成支援装置の文書入力部が、文書作成の支援対象である対象文書を入力するステップと、前記文書作成支援装置の反応予測取得部が、前記対象文書の特徴量を求めるステップと、前記反応予測取得部が、前記対象文書への反応の予測値である反応予測値を前記特徴量に基づいて求めるステップと、前記文書作成支援装置の反応予測出力部が、前記反応予測値を出力するステップとを備えることを特徴とする。   According to a fourth aspect of the present invention, there is provided a document creation support apparatus operating method in which a document input unit of a document creation support apparatus inputs a target document that is a document creation support target, and a response prediction acquisition of the document creation support apparatus. A step of obtaining a feature amount of the target document; a step of obtaining a response prediction value that is a predicted value of a response to the target document based on the feature amount; and the document creation support. The reaction prediction output unit of the apparatus includes a step of outputting the reaction prediction value.

本発明によれば、文書への反応の予測値である反応予測値を得ることが可能となる。   According to the present invention, a predicted response value that is a predicted value of a response to a document can be obtained.

第1の実施の形態に係る文書作成支援装置の構成を示す図である。It is a figure which shows the structure of the document preparation assistance apparatus which concerns on 1st Embodiment. 反応履歴DB2のデータ構成の一例を示す図である。It is a figure which shows an example of a data structure of reaction log | history DB2. 文書作成支援装置に接続された表示装置の画面例を示す図である。It is a figure which shows the example of a screen of the display apparatus connected to the document preparation assistance apparatus. 文書入力部1の処理の流れを示すフローチャートである。4 is a flowchart showing a process flow of a document input unit 1. 反応予測取得部4と反応予測出力部5の処理の流れを示す全体フローチャートである。4 is an overall flowchart showing a flow of processing of a reaction prediction acquisition unit 4 and a reaction prediction output unit 5. 反応予測取得部4による反応予測値の取得(S207)のフローチャートである。It is a flowchart of acquisition of a reaction predicted value by the reaction prediction acquisition unit 4 (S207). 反応履歴DB2から反応予測取得部4により検索されたレコードの一例を示す図である。It is a figure which shows an example of the record searched by the reaction prediction acquisition part 4 from reaction history DB2. 文書作成支援装置に接続された表示装置の別な画面例を示す図である。It is a figure which shows another example of a screen of the display apparatus connected to the document preparation assistance apparatus. 第2の実施の形態に係る文書作成支援装置の構成を示す図である。It is a figure which shows the structure of the document preparation assistance apparatus which concerns on 2nd Embodiment. 、反応予測DB6のデータ構成の一例を示す図である。It is a figure which shows an example of a data structure of reaction prediction DB6. 文書分類DB7のデータ構成の一例を示す図である。It is a figure which shows an example of a data structure of document classification DB7. トピックDB8のデータ構成の一例を示す図である。It is a figure which shows an example of a data structure of topic DB8. 反応予測取得部4による文書分類DB7の生成処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the production | generation process of document classification DB7 by the reaction prediction acquisition part. 過去文書ベクトルの例を示す図である。It is a figure which shows the example of the past document vector. 反応予測取得部4と反応予測出力部5の処理の流れを示す全体フローチャートである。4 is an overall flowchart showing a flow of processing of a reaction prediction acquisition unit 4 and a reaction prediction output unit 5. 反応予測取得部4による対象文書サブカテゴリ検出(S205)のフローチャートである。It is a flowchart of target document subcategory detection (S205) by the reaction prediction acquisition unit 4. 反応予測取得部4による反応予測値の取得(S208)のフローチャートである。It is a flowchart of acquisition (S208) of the reaction predicted value by the reaction prediction acquisition part 4. FIG.

以下、本発明の実施の形態について図面を参照して説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

[第1の実施の形態]
図1は、第1の実施の形態に係る文書作成支援装置の構成を示す図である。
[First Embodiment]
FIG. 1 is a diagram illustrating a configuration of a document creation support apparatus according to the first embodiment.

文書作成支援装置は、文書作成の支援対象である文書(対象文書)を入力する文書入力部1と、過去に作成された文書(過去文書)への反応の履歴が記憶される反応履歴データベース(以下、データベースをDBと略記する)DB2と、文書への反応を取得する反応取得部3と、対象文書の特徴量を求め、対象文書への反応の予測値である反応予測値を特徴量に基づいて求める反応予測取得部4と、反応予測値を出力する反応予測出力部5とを備える。   The document creation support apparatus includes a document input unit 1 that inputs a document (target document) that is a document creation support target, and a reaction history database (a history of reactions to documents created in the past (past documents)). (Hereinafter, the database is abbreviated as DB) DB2, the reaction acquisition unit 3 that acquires the response to the document, the feature quantity of the target document is obtained, and the response predicted value that is the predicted value of the response to the target document is used as the feature quantity. The reaction prediction acquisition part 4 calculated | required based on and the reaction prediction output part 5 which outputs a reaction prediction value are provided.

図2は、反応履歴DB2のデータ構成の一例を示す図であり、カテゴリ「邦画」の部分を示す。   FIG. 2 is a diagram showing an example of the data structure of the reaction history DB 2 and shows a portion of the category “Japanese movie”.

反応履歴DB2は、過去に生成された文書(以下、過去文書という)毎のレコードを有する。   The reaction history DB 2 has a record for each document generated in the past (hereinafter referred to as a past document).

各レコードは、過去文書の文書番号201、過去文書が生成された時刻202、過去文書が生成された日が休日か否かを示す休日フラグ203、過去文書のカテゴリ情報204、過去文書のタイトル205、過去文書の文字数206、過去文書自体である過去文書207、過去文書作成後において順次に到来する第1期間、第2期間、第3期間、第4期間、第5期間のうちの第1期間での反応数である第1期間反応数211、第2期間での反応数である第2期間反応数212、第3期間での反応数である第3期間反応数213、第4期間での反応数である第4期間反応数214、第5期間での反応数である第5期間反応数215を備える。   Each record includes a document number 201 of the past document, a time 202 when the past document was generated, a holiday flag 203 indicating whether or not the date when the past document was generated, a category information 204 of the past document, and a title 205 of the past document. , The number of characters 206 of the past document, the past document 207 that is the past document itself, the first period of the first period, the second period, the third period, the fourth period, and the fifth period that sequentially arrive after the past document is created The number of reactions in the first period 211, the number of reactions in the second period 212, the number of reactions in the second period 212, the number of reactions in the third period 213, the number of reactions in the third period 213, the number of reactions in the fourth period A fourth period reaction number 214, which is the number of reactions, and a fifth period reaction number 215, which is the number of reactions in the fifth period, are provided.

第1期間は、例えば作成時から10分後まで、第2期間は10分後から1時間後まで、第3期間は1時間後から2時間後まで、第4期間は2時間後から5時間後まで、第5期間は5時間後から10時間後までのように定められる。期間はさらに設けてもよい。   The first period is, for example, 10 minutes after the creation, the second period is 10 minutes to 1 hour later, the third period is 1 hour to 2 hours later, the fourth period is 2 hours to 5 hours later Until later, the fifth period is defined as from 5 hours to 10 hours later. A period may be further provided.

なお、反応履歴DB2のレコードに記憶させる項目としては、これに限らず、文書における漢字やひらがなの割合、予め作成した単語の専門度の辞書を元に文書の専門度を計算し数値化したもの、予め作成した語尾の辞書を元に文書の丁寧度を数値化したもの、予め作成した単語の注目度辞書を元に計算した文書の注目度を数値化したもの、などを用いてもよい。   Note that the items to be stored in the record of the reaction history DB 2 are not limited to this, and the degree of specialization of the document is calculated and digitized based on the kanji and hiragana ratio in the document and the dictionary of word specialities created in advance. Alternatively, the document politeness based on a pre-created ending dictionary or the document attention calculated on the basis of a pre-created word attention dictionary may be used.

反応取得部3は、実際の文書(過去文書)のそれぞれにつき、文書作成後において順次に到来する第1期間、第2期間、第3期間、第4期間、第5期間のそれぞれにおける反応の数を取得し、反応履歴DB2における該当レコードの第1期間反応数211、第2期間反応数212、第3期間反応数213、第4期間反応数214、第5期間反応数215にそれぞれ記憶させる。反応取得部3は、例えば、新たな反応を得るごとに反応履歴DB2を更新する。   For each actual document (past document), the response acquisition unit 3 counts the number of responses in each of the first, second, third, fourth, and fifth periods that arrive sequentially after the document is created. Are stored in the first period reaction number 211, the second period reaction number 212, the third period reaction number 213, the fourth period reaction number 214, and the fifth period reaction number 215 of the corresponding record in the reaction history DB2. For example, the reaction acquisition unit 3 updates the reaction history DB 2 every time a new reaction is obtained.

文書への反応としては、数値で表現される以下のような指標を用いることができる。すなわち、反応の数は、(1)文書が質問掲示板の質問文なら、例えば取得回答数であり、(2)文書がメールなら、例えば返信数であり、(3)文書がソーシャル・ネットワーキング・サービス(social networking service、SNS)の投稿記事なら、例えば評価ボタン押下数、コメント数であり、(4)文書がウェブページの投稿記事なら、例えば閲覧数、評価ボタン押印数、コメント数である。   As a response to a document, the following indices expressed numerically can be used. That is, the number of responses is (1) if the document is a question message on a question board, for example, the number of obtained answers, (2) if the document is an email, for example, the number of replies, and (3) the document is a social networking service. If it is a posted article of (social networking service, SNS), for example, it is the number of evaluation button presses and the number of comments. (4) If the document is a posted article on a web page, for example, it is the number of browsing, the number of evaluation button stamps, and the number of comments.

例えば、文書が作者の友人が使用するコンピュータ画面に表示され、友人が画面の評価ボタンを押すと、反応取得部3は、押した回数を反応の数として取得し、反応取得部3を更新する。   For example, when a document is displayed on a computer screen used by a friend of the author and the friend presses the evaluation button on the screen, the reaction acquisition unit 3 acquires the number of times of pressing as the number of reactions, and updates the reaction acquisition unit 3 .

図3は、文書作成支援装置に接続された表示装置の画面例を示す図である。   FIG. 3 is a diagram illustrating a screen example of the display device connected to the document creation support device.

文書入力部1は、表示装置に文書入力画面100を表示し、反応予測出力部5は、反応予測画面200を表示する。文書入力画面100に文書が入力されると、反応予測出力部5は反応予測画面200に反応予測値を表示する。投稿ボタン300が押されると文書が外部に送信(投稿)される。   The document input unit 1 displays the document input screen 100 on the display device, and the reaction prediction output unit 5 displays the reaction prediction screen 200. When a document is input to the document input screen 100, the reaction prediction output unit 5 displays a reaction prediction value on the reaction prediction screen 200. When the posting button 300 is pressed, the document is transmitted (posted) to the outside.

このように作成終了した文書、すなわち過去文書については、反応履歴DB2に当該文書に関するレコードが生成される。   For a document that has been created in this way, that is, a past document, a record relating to the document is generated in the reaction history DB 2.

なお、反応予測画面200の表示内容については後述する。   The display contents of the reaction prediction screen 200 will be described later.

図4は、文書入力部1の処理の流れを示すフローチャートである。   FIG. 4 is a flowchart showing a process flow of the document input unit 1.

文書入力部1は、文書入力画面100への文書が入力されたか、または、文書の内容が変化したかを判定し(S101)、文書が入力された、または、文書の内容が変化したなら(S101:YES)、反応予測取得部4と反応予測出力部5を呼び出し(S103)、ステップS101に戻る。なお、文書の作成者は、例えば、複数のカテゴリから、文書のカテゴリを選択し、文書入力部1には、当該カテゴリが与えられ、文書入力部1は、反応予測取得部4を呼び出す時点における文書入力画面100内の文書(以下、対象文書という)ならびに当該カテゴリ(以下、対象文書カテゴリという)を反応予測取得部4に与える。   The document input unit 1 determines whether a document has been input to the document input screen 100 or whether the content of the document has changed (S101). If the document has been input or the content of the document has changed (S101) (S101: YES), the reaction prediction acquisition unit 4 and the reaction prediction output unit 5 are called (S103), and the process returns to step S101. The document creator selects, for example, a document category from a plurality of categories, the category is given to the document input unit 1, and the document input unit 1 calls the reaction prediction acquisition unit 4. A document in the document input screen 100 (hereinafter referred to as a target document) and the category (hereinafter referred to as a target document category) are given to the reaction prediction acquisition unit 4.

図5は、反応予測取得部4と反応予測出力部5の処理の流れを示す全体フローチャートである。   FIG. 5 is an overall flowchart showing a processing flow of the reaction prediction acquisition unit 4 and the reaction prediction output unit 5.

反応予測取得部4は、対象文書を単語に分解し(S201)、不要な単語を削除し(S203)、残った全ての単語(以下、単語群という)の文字数を検出し(S204)、反応予測値を取得する(S207)。   The reaction prediction acquisition unit 4 decomposes the target document into words (S201), deletes unnecessary words (S203), detects the number of characters of all remaining words (hereinafter referred to as word groups) (S204), and reacts. A predicted value is acquired (S207).

次に、反応予測出力部5は、反応予測値を反応予測画面200に表示し(S209)、制御は、S101に戻る。   Next, the reaction prediction output unit 5 displays the reaction prediction value on the reaction prediction screen 200 (S209), and the control returns to S101.

なお、反応予測値は表示に限らず、印刷(プリント)してもよい。   The predicted response value is not limited to display, and may be printed.

反応予測取得部4は、例えば、不要な単語を網羅した不要語リストを予め保持し、S203では、対象文書から、不要語リストの単語に一致する単語や句読点を検索し、削除する。   For example, the reaction prediction acquisition unit 4 holds in advance an unnecessary word list that covers unnecessary words, and in S203, searches the target document for words and punctuation marks that match the words in the unnecessary word list and deletes them.

反応予測取得部4は、例えば、S204では、文字数の最後の桁を四捨五入し、これを対象文書の文字数とする。これは、後述する反応履歴DB2の検索において、該当レコード数が少なくなるのを防ぐためである。   For example, in S204, the reaction prediction acquisition unit 4 rounds off the last digit of the number of characters, and sets this as the number of characters of the target document. This is to prevent the number of corresponding records from decreasing in the search of the reaction history DB 2 described later.

図6は、反応予測取得部4による反応予測値の取得(S207)のフローチャートである。   FIG. 6 is a flowchart of obtaining a predicted reaction value (S207) by the reaction prediction obtaining unit 4.

反応予測取得部4は、反応履歴DB2から、(条件1)時刻202と現在時刻の差が所定範囲内にある、(条件2)当日が休日であるか否かの状況が休日フラグ203に一致する、(条件3)対象文書の文字数が文字数206に一致する、(条件4)対象文書カテゴリとカテゴリ情報204が一致する、を充足するレコードを検索する(S2071)。   The reaction prediction acquisition unit 4 matches the holiday flag 203 with whether or not the difference between the (time 1) time 202 and the current time is within a predetermined range from the reaction history DB 2 (condition 2) whether the current day is a holiday. A record satisfying (condition 3) that the number of characters of the target document matches the number of characters 206 and (condition 4) that the target document category matches the category information 204 is searched (S2071).

図7は、反応履歴DB2から反応予測取得部4により検索されたレコードの一例を示す図である。   FIG. 7 is a diagram illustrating an example of a record retrieved from the reaction history DB 2 by the reaction prediction acquisition unit 4.

例えば、現在時刻が「10:01」、当日が休日でない、対象文書の文字数が「200」、対象文書のカテゴリが「邦画」である場合、例えば、時刻202「10:00」、休日フラグ203「0」、文字数206「200」、カテゴリ情報204「邦画」を含む3レコードが検索される。   For example, when the current time is “10:01”, the current day is not a holiday, the number of characters of the target document is “200”, and the category of the target document is “Japanese movie”, for example, time 202 “10:00”, holiday flag 203 Three records including “0”, the number of characters 206 “200”, and the category information 204 “Japanese movie” are searched.

図6に戻り、反応予測取得部4は、レコード数が2以上なら(S2073:YES)、第1期間反応数211の平均、第2期間反応数212の平均、第3期間反応数213の平均、第4期間反応数214の平均、第5期間反応数215の平均を計算し、第1期間反応数211の平均を第1期間における反応予測値(以下、第1期間反応予測値)とし、第2期間反応数212の平均を第2期間における反応予測値(以下、第2期間反応予測値)とし、第3期間反応数213の平均を第3期間における反応予測値(以下、第3期間反応予測値)とし、第4期間反応数214の平均を第4期間における反応予測値(以下、第4期間反応予測値)とし、第5期間反応数215の平均を第5期間における反応予測値(以下、第5期間反応予測値)とし(S2075)、それぞれを読み出して、処理を終える。   Returning to FIG. 6, if the number of records is 2 or more (S2073: YES), the reaction prediction acquisition unit 4 averages the first period reaction number 211, the second period reaction number 212, and the third period reaction number 213. The average of the fourth period reaction number 214 and the average of the fifth period reaction number 215 is calculated, and the average of the first period reaction number 211 is defined as a predicted reaction value in the first period (hereinafter referred to as the first period response prediction value). The average of the second period response number 212 is defined as a predicted response value in the second period (hereinafter referred to as second period response predicted value), and the average of the third period response number 213 is defined as a predicted response value in the third period (hereinafter referred to as the third period). Reaction predicted value), the average of the fourth period response number 214 is the response predicted value in the fourth period (hereinafter referred to as fourth period response predicted value), and the average of the fifth period response number 215 is the predicted response value in the fifth period. (Hereinafter, the fifth period response prediction value) ( 2075), reads out respectively, the process ends.

図7を例とすれば、第1期間反応予測値は「2」、第2期間反応予測値は「1」、第3期間反応予測値は「1」、第4期間反応予測値は「1」、第5期間反応予測値は「0.66」となる。   Taking FIG. 7 as an example, the first period response predicted value is “2”, the second period response predicted value is “1”, the third period response predicted value is “1”, and the fourth period response predicted value is “1”. ”, The fifth period response prediction value is“ 0.66 ”.

反応予測取得部4は、レコード数が1なら(S2073:NO)、第1期間反応数211を第1期間反応予測値、第2期間反応数212を第2期間反応予測値、第3期間反応数213を第3期間反応予測値、第4期間反応数214を第4期間反応予測値、第5期間反応数215を第5期間反応予測値とし(S2077)、それぞれを読み出して、処理を終える。   If the number of records is 1 (S2073: NO), the reaction prediction acquisition unit 4 sets the first period reaction number 211 as the first period reaction prediction value, the second period reaction number 212 as the second period reaction prediction value, and the third period reaction. The number 213 is the third period response predicted value, the fourth period response number 214 is the fourth period response predicted value, and the fifth period response number 215 is the fifth period response predicted value (S2077). .

反応予測出力部5は、図3の反応予測画面200において、横軸に時刻、縦軸に反応予測値をとり、第1期間反応予測値と第1期間終了時刻とに対応する点P1、第1期間反応予測値および第2期間反応予測値の和と第2期間終了時刻とに対応する点P2、第1期間反応予測値、第2期間反応予測値および第3期間反応予測値の和と第3期間終了時刻とに対応する点P3、第1期間反応予測値、第2期間反応予測値、第3期間反応予測値および第4期間反応予測値の和と第4期間終了時刻とに対応する点P4、第1期間反応予測値、第2期間反応予測値、第3期間反応予測値、第4期間反応予測値および第5期間反応予測値の和と第5期間終了時刻とに対応する点P5を結んだ折れ線グラフを表示する。   The reaction prediction output unit 5 takes the time P on the horizontal axis and the reaction prediction value on the vertical axis on the reaction prediction screen 200 in FIG. 3, and points P1 and P1 corresponding to the first period reaction prediction value and the first period end time. The point P2, corresponding to the sum of the 1-period response prediction value and the second-period response prediction value and the second period end time, the sum of the first-period response prediction value, the second-period response prediction value, and the third-period response prediction value Corresponds to point P3 corresponding to the third period end time, first period response predicted value, second period response predicted value, third period response predicted value, and sum of fourth period response predicted value and fourth period end time Corresponding to the sum of the point P4, the first period response predicted value, the second period response predicted value, the third period response predicted value, the fourth period response predicted value and the fifth period response predicted value, and the fifth period end time. A line graph connecting the points P5 is displayed.

これにより、対象文書の作者は、現在の文書が投稿された場合における累積反応数の推移を知ることができる。なお、反応予測値は数字などで表示してもよい。また、反応予測値は印刷してもよい。   Thereby, the author of the target document can know the transition of the cumulative reaction number when the current document is posted. In addition, you may display a reaction predicted value with a number etc. The predicted reaction value may be printed.

(変形例)
または、本実施の形態では、以下のような態様を採用してもよい。
(Modification)
Or in this Embodiment, you may employ | adopt the following aspects.

反応予測取得部4は、ステップS2071では、対象文書の文字数を仮に50、100、150、200、250とする。   In step S2071, the reaction prediction acquisition unit 4 temporarily sets the number of characters of the target document to 50, 100, 150, 200, 250.

反応予測出力部5は、図8に示すように、横軸に文字数、縦軸に反応予測値(例えば、第1期間反応予測値)をとり、文字数を50とした場合の反応予測値と文字数「50」とに対応する点P11、文字数を100とした場合の反応予測値と文字数「100」とに対応する点P12、文字数を150とした場合の反応予測値と文字数「150」とに対応する点P13、文字数を200とした場合の反応予測値と文字数「200」とに対応する点P14、文字数を250とした場合の反応予測値と文字数「250」とに対応する点P15、を結んだ折れ線グラフを表示し、対象文書の文字数、例えば、文字数「100」に対応する点P12を強調表示する。   As shown in FIG. 8, the reaction prediction output unit 5 takes the number of characters on the horizontal axis, the reaction prediction value (for example, the first period reaction prediction value) on the vertical axis, and the reaction prediction value and the number of characters when the number of characters is 50. Corresponds to the point P11 corresponding to “50”, the response predicted value when the number of characters is 100 and the point P12 corresponding to the number of characters “100”, the predicted response value and the number of characters “150” when the number of characters is 150 A point P13 corresponding to the response predicted value when the number of characters is 200 and the number of characters “200” and a point P15 corresponding to the response predicted value and the number of characters “250” when the number of characters is 250 are connected. A broken line graph is displayed, and a point P12 corresponding to the number of characters of the target document, for example, the number of characters “100” is highlighted.

これにより、対象文書の作者は、現在の文書の文字数をどの程度増やせば、または減らせば反応数を上げられるとの知見を得ることができる。   As a result, the author of the target document can obtain knowledge that how much the number of characters in the current document can be increased or decreased to increase the number of responses.

なお、反応予測値が最も高くなる文字数(最適文字数)を求め、現在の文字数と最適文字数を数字などで表示してもよい。反応予測値は印刷してもよい。   In addition, the number of characters (optimum number of characters) having the highest response predicted value may be obtained, and the current number of characters and the optimum number of characters may be displayed as numbers. The predicted reaction value may be printed.

[第2の実施の形態]
次に、本発明の第2の実施の形態について説明する。第2の実施の形態では、第1の実施の形態に同一または類似の装置および装置構成を用い、同一または類似のものについては第1の実施の形態で使用した符号を使用して重複説明を略し、第1の実施の形態とは異なる事項を中心に説明を行う。
[Second Embodiment]
Next, a second embodiment of the present invention will be described. In the second embodiment, the same or similar apparatus and apparatus configuration as those in the first embodiment are used, and the same or similar elements are redundantly described by using the reference numerals used in the first embodiment. For brevity, the description will focus on matters different from the first embodiment.

図9は、第2の実施の形態に係る文書作成支援装置の構成を示す図である。   FIG. 9 is a diagram illustrating a configuration of a document creation support apparatus according to the second embodiment.

文書作成支援装置は、文書入力部1と、反応履歴DB2と、反応取得部3と、反応予測取得部4と、反応予測出力部5と、反応予測のためのデータが記憶される反応予測DB6と、文書を分類したデータが記憶される文書分類DB7と、文書のトピックに関するデータが記憶されるトピックDB8とを備える。   The document creation support apparatus includes a document input unit 1, a reaction history DB 2, a reaction acquisition unit 3, a reaction prediction acquisition unit 4, a reaction prediction output unit 5, and a reaction prediction DB 6 in which data for reaction prediction is stored. And a document classification DB 7 for storing data obtained by classifying documents, and a topic DB 8 for storing data related to the topic of the document.

図10は、反応予測DB6のデータ構成の一例を示す図である。   FIG. 10 is a diagram illustrating an example of a data configuration of the reaction prediction DB 6.

反応予測DB6は、反応履歴DB2の時刻202、休日フラグ203、カテゴリ情報204、文字数206のそれぞれについて共通な値を有し、且つ、カテゴリ情報204を更に細分化したサブカテゴリについても共通な1以上の文書(グループという)が複数ある場合に、グループ毎のレコードを有する。   The reaction prediction DB 6 has a common value for each of the time 202, holiday flag 203, category information 204, and number of characters 206 in the reaction history DB 2, and one or more common sub-categories of the category information 204 are further subdivided. When there are a plurality of documents (referred to as groups), each group has a record.

各レコードは、該当の時刻202と同じ時刻601、該当の休日フラグ203と同じ休日フラグ602、該当のカテゴリ情報204と同じカテゴリ情報603、該当のサブカテゴリを示すサブカテゴリ情報604、該当の文字数206と同じ文字数605、該当の第1期間反応数211から計算される第1期間反応数611、該当の第2期間反応数212から計算される第2期間反応数612、該当の第3期間反応数213から計算される第3期間反応数613、該当の第4期間反応数214から計算される第4期間反応数614、該当の第5期間反応数215から計算される第5期間反応数615を備える。   Each record has the same time 601 as the corresponding time 202, the same holiday flag 602 as the corresponding holiday flag 203, the same category information 603 as the corresponding category information 204, the subcategory information 604 indicating the corresponding subcategory, and the same number of characters 206. From the number of characters 605, the first period reaction number 611 calculated from the corresponding first period reaction number 211, the second period reaction number 612 calculated from the corresponding second period reaction number 212, and the corresponding third period reaction number 213 A third period reaction number 613 calculated, a fourth period reaction number 614 calculated from the corresponding fourth period reaction number 214, and a fifth period reaction number 615 calculated from the corresponding fifth period reaction number 215 are provided.

図11は、文書分類DB7のデータ構成の一例を示す図であり、カテゴリ「邦画」且つサブカテゴリ「1」の部分を示す。   FIG. 11 is a diagram showing an example of the data structure of the document classification DB 7 and shows a portion of the category “Japanese movie” and the subcategory “1”.

文書分類DB7は、反応履歴DB2のカテゴリ情報204について共通な値を有し、且つ、サブカテゴリについても共通な1以上の文書(グループという)が複数ある場合に、グループ毎のレコードを有する。   The document classification DB 7 has a common value for the category information 204 of the reaction history DB 2 and a record for each group when there are a plurality of one or more documents (referred to as groups) that are also common for the subcategories.

レコードは、該当のカテゴリ情報204と同じカテゴリ情報701、該当のサブカテゴリを示すサブカテゴリ情報702、該当の文書において所定のトピック(第1トピック)に関する単語が占める割合であるトピック割合711、該当の文書において別なトピック(第2トピック)に関する単語が占める割合であるトピック割合712、該当の文書において別なトピック(第3トピック)に関する単語が占める割合であるトピック割合713、該当の文書において別なトピック(第4トピック)に関する単語が占める割合であるトピック割合714を備える。   The record includes the same category information 701 as the corresponding category information 204, the subcategory information 702 indicating the corresponding subcategory, the topic ratio 711 that is the ratio of words related to a predetermined topic (first topic) in the corresponding document, Topic ratio 712, which is the ratio of words related to another topic (second topic), topic ratio 713, which is the ratio of words related to another topic (third topic) in the document, and another topic ( A topic ratio 714 that is a ratio of words related to the fourth topic).

図12は、トピックDB8のデータ構成の一例を示す図であり、カテゴリ「邦画」の部分を示す。   FIG. 12 is a diagram showing an example of the data configuration of the topic DB 8 and shows a portion of the category “Japanese movie”.

トピックDB8は、カテゴリとトピックの組み合わせ(組という)が複数ある場合に、組毎のレコードを有する。   The topic DB 8 has a record for each group when there are a plurality of combinations (referred to as groups) of categories and topics.

レコードは、該当のカテゴリを示すカテゴリ情報801、該当のトピックを示すトピック番号802、該当の文書における該当のトピックに関する第1、第2、第3の単語をそれぞれ示す単語情報811、単語情報812、単語情報813を備える。   The record includes category information 801 indicating the corresponding category, topic number 802 indicating the corresponding topic, word information 811 indicating the first, second, and third words related to the topic in the corresponding document, word information 812, Word information 813 is provided.

なお、単語情報(単語情報811等)の数は、3以下であってもよく、最大で3とし、トピック数は、4とした。   The number of word information (word information 811 and the like) may be 3 or less, 3 at the maximum, and 4 topics.

このようなトピックDB8は、トピック数を4として、図2に示す反応履歴DB2の部分にLDA(Latend Dirichlet Allocation), LSA(Latent Semantic Analysis), pLSA(Probabilistic Latent Semantic Analysis)などを適用することで生成できる。   Such a topic DB 8 has four topics, and applies LDA (Latend Dirichlet Allocation), LSA (Latent Semantic Analysis), pLSA (Probabilistic Latent Semantic Analysis), etc. to the part of the reaction history DB 2 shown in FIG. Can be generated.

図13は、反応予測取得部4による文書分類DB7の生成処理の流れを示すフローチャートである。   FIG. 13 is a flowchart showing a flow of processing for generating the document classification DB 7 by the reaction prediction acquisition unit 4.

ここでは、1つのカテゴリ(以下、対象カテゴリという)につき、対象カテゴリに一致するカテゴリ情報701を含むレコードの生成方法を説明する。他の対象カテゴリに一致するカテゴリ情報701を含むレコードも同様に生成される。   Here, a method for generating a record including category information 701 matching the target category for one category (hereinafter referred to as a target category) will be described. A record including category information 701 that matches another target category is generated in the same manner.

反応予測取得部4は、反応履歴DB2から対象カテゴリに一致するカテゴリ情報204を含むレコードを検索し、過去文書207(以下、過去文書という)を取り出す(S601)。   The reaction prediction acquisition unit 4 searches the reaction history DB 2 for a record including the category information 204 that matches the target category, and extracts a past document 207 (hereinafter referred to as a past document) (S601).

反応予測取得部4は、トピックDB8から対象カテゴリに一致するカテゴリ情報801を含むレコードを検索し、トピック番号802を取り出す(S603)。   The reaction prediction acquisition unit 4 searches the topic DB 8 for a record including the category information 801 that matches the target category, and extracts the topic number 802 (S603).

ここで、4つのトピック番号(以下、トピック番号8021、8022、8023、8024という)が取り出されたこととする。   Here, it is assumed that four topic numbers (hereinafter referred to as topic numbers 8021, 8022, 8023, and 8024) are extracted.

反応予測取得部4は、過去文書とトピック番号の組ごとに、当該過去文書にあり且つ当該トピック番号を含むトピックDB8のレコード内の単語情報811、単語情報812、単語情報813のいずれかに一致する単語の数を求める(S605)。   For each pair of past document and topic number, the reaction prediction acquisition unit 4 matches one of the word information 811, word information 812, and word information 813 in the record of the topic DB 8 that is in the past document and includes the topic number. The number of words to be calculated is obtained (S605).

反応予測取得部4は、過去文書に関係なくトピック番号8021について求めた単語数の総和(以下、総和80210)、過去文書に関係なくトピック番号8022について求めた単語数の総和(以下、総和80220)、過去文書に関係なくトピック番号8023について求めた単語数の総和(以下、総和80230)を求める(S607)。   The reaction prediction acquisition unit 4 sums the number of words obtained for the topic number 8021 regardless of the past document (hereinafter, sum 80210), and sums of the number of words obtained for the topic number 8022 regardless of the past document (hereinafter, sum 80220). Then, the sum of the number of words obtained for the topic number 8023 regardless of the past document (hereinafter, sum 80230) is obtained (S607).

反応予測取得部4は、過去文書ごとに、当該過去文書とトピック番号8021について求めた単語数の総和80210に占める割合(以下、トピック割合901という)、トピック番号8022について求めた単語数の総和80220に占める割合(以下、トピック割合902という)、トピック番号8023について求めた単語数の総和80230に占める割合(以下、トピック割合903という)、トピック番号8024について求めた単語数の総和に占める割合(以下、トピック割合904という)、を要素とする過去文書ベクトルを生成する(S609)。   For each past document, the response prediction acquisition unit 4 occupies a ratio (hereinafter referred to as a topic ratio 901) of the total number of words 80210 calculated for the past document and the topic number 8021, and a total number of words 80220 calculated for the topic number 8022. Occupying ratio (hereinafter referred to as topic ratio 902), ratio occupying the total number of words calculated for topic number 8023 (hereinafter referred to as topic ratio 903), and ratio occupying the total number of words calculated regarding topic number 8024 (hereinafter referred to as topic ratio 902). , A topic ratio 904) is generated (S609).

図14は、図2に示す反応履歴DB2の各レコードに対応する文書の過去文書ベクトルの例を示す図である。   FIG. 14 is a diagram illustrating an example of a past document vector of a document corresponding to each record of the reaction history DB 2 illustrated in FIG.

文書番号「1」の過去文書については、過去文書ベクトルのトピック割合901は0.7であり、トピック割合902は0であり、トピック割合903は0であり、トピック割合904は0.3である。   For the past document with the document number “1”, the topic ratio 901 of the past document vector is 0.7, the topic ratio 902 is 0, the topic ratio 903 is 0, and the topic ratio 904 is 0.3. .

文書番号「2」の過去文書については、過去文書ベクトルのトピック割合901は0.1であり、トピック割合902は0.5であり、トピック割合903は0であり、トピック割合904は0.4である。   For the past document with the document number “2”, the topic ratio 901 of the past document vector is 0.1, the topic ratio 902 is 0.5, the topic ratio 903 is 0, and the topic ratio 904 is 0.4. It is.

文書番号「3」の過去文書については、過去文書ベクトルのトピック割合901は0.1であり、トピック割合902は0であり、トピック割合903は0.5であり、トピック割合904は0.4である。   For the past document with the document number “3”, the topic ratio 901 of the past document vector is 0.1, the topic ratio 902 is 0, the topic ratio 903 is 0.5, and the topic ratio 904 is 0.4. It is.

文書番号「4」の過去文書については、過去文書ベクトルのトピック割合901は0.6であり、トピック割合902は0であり、トピック割合903は0.1であり、トピック割合904は0.3である。   For the past document with the document number “4”, the topic ratio 901 of the past document vector is 0.6, the topic ratio 902 is 0, the topic ratio 903 is 0.1, and the topic ratio 904 is 0.3. It is.

図13に戻り、反応予測取得部4は、2つの過去文書ベクトルi,jからなる組ごとに、以下の式により、当該過去文書ベクトル間の距離dを計算する(S611)。

Figure 2014232494
Returning to FIG. 13, the reaction prediction acquisition unit 4 calculates the distance d between the past document vectors for each set of the two past document vectors i and j by the following formula (S611).
Figure 2014232494

上記例では、要素数は4なので、zmは4で計算される。   In the above example, since the number of elements is 4, zm is calculated as 4.

反応予測取得部4は、距離dに基づき、所定の分類技術(例えば、k-meansクラスタリング)を用い、各過去文書にサブカテゴリ情報を付与し、且つ、同一のサブカテゴリ情報を付与された2つの過去文書についての距離dは、異なるサブカテゴリ情報を付与された2つの過去文書についての距離dより短くなるようにする(S613)。   Based on the distance d, the reaction prediction acquisition unit 4 uses a predetermined classification technique (for example, k-means clustering) to give subcategory information to each past document, and two past data to which the same subcategory information is given. The distance d for the document is made shorter than the distance d for the two past documents to which different subcategory information is assigned (S613).

例えば、図14に示す文書番号「1」、「4」の過去文書には、サブカテゴリ(サブカテゴリ情報「1」)が付与され、文書番号「2」の過去文書には、サブカテゴリ(サブカテゴリ情報「2」)が付与され、文書番号「3」の過去文書には、サブカテゴリ(サブカテゴリ情報「3」)が付与される。   For example, the past documents with document numbers “1” and “4” shown in FIG. 14 are assigned a subcategory (subcategory information “1”), and the past document with document number “2” is assigned a subcategory (subcategory information “2”). )) And a past category with document number “3” is given a subcategory (subcategory information “3”).

つまり、4つの過去文書が3つにクラスタリングされる。   That is, four past documents are clustered into three.

反応予測取得部4は、各サブカテゴリ情報につき、当該サブカテゴリ情報を付与された過去文書についてのトピック割合901の平均値、トピック割合902の平均値、トピック割合903の平均値、トピック割合904の平均値を計算する(S615)。   For each subcategory information, the reaction prediction acquisition unit 4 obtains the average value of the topic ratio 901, the average value of the topic ratio 902, the average value of the topic ratio 903, and the average value of the topic ratio 904 for the past document to which the subcategory information is assigned. Is calculated (S615).

反応予測取得部4は、各サブカテゴリ情報につき、文書分類DB7から、当該サブカテゴリ情報に一致するサブカテゴリ情報702を含むレコードを検索し、トピック割合901の平均値をトピック割合711、トピック割合902の平均値をトピック割合712、トピック割合903の平均値をトピック割合713、トピック割合904の平均値をトピック割合714として記憶させ(S617)、処理を終える。   The reaction prediction acquisition unit 4 searches the document classification DB 7 for each subcategory information for a record including the subcategory information 702 that matches the subcategory information, and sets the average value of the topic ratio 901 as the average value of the topic ratio 711 and the topic ratio 902. Are stored as the topic ratio 713, the average value of the topic ratio 903 as the topic ratio 713, and the average value of the topic ratio 904 as the topic ratio 714 (S617), and the process ends.

文書入力部1の処理については、第1の実施の形態と同様なので説明を省略する。   Since the processing of the document input unit 1 is the same as that of the first embodiment, description thereof is omitted.

図15は、反応予測取得部4と反応予測出力部5の処理の流れを示す全体フローチャートである。   FIG. 15 is an overall flowchart showing a processing flow of the reaction prediction acquisition unit 4 and the reaction prediction output unit 5.

反応予測取得部4は、対象文書を単語に分解し(S201)、不要な単語を削除し(S203)、残った単語群の文字数を検出し(S204)、単語群と対象文書カテゴリを基に対象文書のサブカテゴリ(以下、対象文書サブカテゴリという)を検出し(S205)、反応予測値を取得する(S208)。   The reaction prediction acquisition unit 4 decomposes the target document into words (S201), deletes unnecessary words (S203), detects the number of characters in the remaining word group (S204), and based on the word group and the target document category A subcategory of the target document (hereinafter referred to as a target document subcategory) is detected (S205), and a predicted reaction value is acquired (S208).

次に、反応予測出力部5は、反応予測値を反応予測画面200に表示し(S209)、制御は、S101に戻る。   Next, the reaction prediction output unit 5 displays the reaction prediction value on the reaction prediction screen 200 (S209), and the control returns to S101.

図16は、反応予測取得部4による対象文書サブカテゴリ検出(S205)のフローチャートである。   FIG. 16 is a flowchart of target document subcategory detection (S205) by the reaction prediction acquisition unit 4.

反応予測取得部4は、トピックDB8から対象文書カテゴリに一致するカテゴリ情報801を含むレコードを検索する(S2051)。   The reaction prediction acquisition unit 4 searches the topic DB 8 for a record including category information 801 that matches the target document category (S2051).

反応予測取得部4は、検索された各レコードにつき、例えば、図12に示す各レコードにつき、単語群にあり且つ単語情報811、812、813のいずれかに一致する単語の数を求める(S2053)。   The reaction prediction acquisition unit 4 obtains the number of words that are in the word group and match any one of the word information 811, 812, and 813 for each searched record, for example, for each record shown in FIG. 12 (S 2053). .

反応予測取得部4は、各単語数の総和(各単語数の総和)に占める割合を要素とする特徴ベクトルを生成する(S2055)。例えば、反応予測取得部4は、例えば、図12のサブカテゴリ情報「1」、「2」、「3」、「4」のそれぞれに対応する割合を要素とする特徴ベクトルを生成する。   The reaction prediction acquisition unit 4 generates a feature vector whose element is a ratio of the total number of words (total number of words) (S2055). For example, the reaction prediction acquisition unit 4 generates a feature vector whose elements are ratios corresponding to the subcategory information “1”, “2”, “3”, and “4” in FIG. 12, for example.

反応予測取得部4は、文書分類DB7から対象文書カテゴリに一致するカテゴリ情報701を含むレコードを検索する(S2057)。   The reaction prediction acquisition unit 4 searches the document classification DB 7 for records including the category information 701 that matches the target document category (S2057).

反応予測取得部4は、検索された各レコードにつき、トピック割合711、トピック割合712、トピック割合713、トピック割合714を要素とする代表点ベクトルを生成する(S2059)。   The reaction prediction acquisition unit 4 generates a representative point vector having the topic ratio 711, the topic ratio 712, the topic ratio 713, and the topic ratio 714 as elements for each retrieved record (S2059).

反応予測取得部4は、特徴ベクトルmと代表点ベクトルnの組ごとに、以下の式により、特徴ベクトルmと代表点ベクトルnの間の距離Dを計算する(S2061)。

Figure 2014232494
The reaction prediction acquisition unit 4 calculates the distance D between the feature vector m and the representative point vector n by the following formula for each set of the feature vector m and the representative point vector n (S2061).
Figure 2014232494

上記例では、要素数は4なので、zmは4で計算される。   In the above example, since the number of elements is 4, zm is calculated as 4.

反応予測取得部4は、最小の距離Dに対応する文書分類DB7のレコードからサブカテゴリ情報702、すなわち、対象文書サブカテゴリを取り出し(S2063)、処理を終える。   The reaction prediction acquisition unit 4 extracts the subcategory information 702, that is, the target document subcategory from the record of the document classification DB 7 corresponding to the minimum distance D (S2063), and ends the process.

図17は、反応予測取得部4による反応予測値の取得(S208)のフローチャートである。   FIG. 17 is a flowchart of the reaction prediction value acquisition (S208) by the reaction prediction acquisition unit 4.

反応予測取得部4は、反応予測DB6から、(条件1)時刻601と現在時刻の差が所定範囲内にある、(条件2)当日が休日であるか否かの状況が休日フラグ602に一致する、(条件3)対象文書の文字数が文字数605に一致する、(条件4)対象文書カテゴリとカテゴリ情報603が一致し且つ対象文書サブカテゴリとサブカテゴリ情報604が一致する、を充足するレコードを検索する(S2081)。   The reaction prediction acquisition unit 4 determines from the reaction prediction DB 6 that (condition 1) the difference between the time 601 and the current time is within a predetermined range, (condition 2) whether the current day is a holiday or not matches the holiday flag 602. Search for records satisfying (Condition 3) The number of characters of the target document matches the number of characters 605, (Condition 4) The target document category and category information 603 match, and the target document subcategory and subcategory information 604 match. (S2081).

反応予測取得部4は、第1期間反応数611を第1期間反応予測値、第2期間反応数612を第2期間反応予測値、第3期間反応数613を第3期間反応予測値、第4期間反応数614を第4期間反応予測値、第5期間反応数615を第5期間反応予測値とし(S2087)、それぞれを読み出して、処理を終える。   The reaction prediction acquisition unit 4 sets the first period reaction number 611 as the first period reaction prediction value, the second period reaction number 612 as the second period reaction prediction value, the third period reaction number 613 as the third period reaction prediction value, The 4-period response number 614 is set as the fourth-period response predicted value, and the fifth-period response number 615 is set as the fifth-period response predicted value (S2087).

このように、予め反応予測DB6を設け、反応予測DB6から対象文書に応じた反応予測値を取り出すことで、反応予測値を迅速に得ることができる。   Thus, by providing reaction prediction DB6 beforehand and taking out the reaction prediction value according to the object document from reaction prediction DB6, a reaction prediction value can be obtained rapidly.

反応予測出力部5の処理は第1の実施の形態と同様である。   The process of the reaction prediction output unit 5 is the same as that in the first embodiment.

例えば、対象文書が、「あなたが過去に見た作品の中で一番おすすめする、面白いと思った邦画のタイトルを教えてください。私はアクションとホラーがとても好きなので、出来ればアクションかホラーの映画で教えていただけると嬉しいです。」とする。   For example, the target document is “Please tell me the title of the most interesting Japanese movie you have seen in the past. I really like action and horror. I would be happy if you could tell me in the movie. "

対象文書は単語に分解され(図15:S201)、不要な単語を削除され(図15:S203)、残った単語群には、「おすすめ」「面白い」「邦画」「タイトル」「映画」が含まれることとなる。   The target document is decomposed into words (FIG. 15: S201), unnecessary words are deleted (FIG. 15: S203), and “recommended”, “interesting”, “Japanese film”, “title”, “movie” are included in the remaining word group. Will be included.

例えば、上記5単語のうち、図12のカテゴリ情報701「邦画」とサブカテゴリ情報「1」の組に対応する単語は「おすすめ」「面白い」である。   For example, among the above five words, the words corresponding to the set of category information 701 “Japanese movie” and subcategory information “1” in FIG. 12 are “recommended” and “interesting”.

カテゴリ情報701「邦画」とサブカテゴリ情報「2」の組に対応する単語は「名前」である。カテゴリ情報701「邦画」とサブカテゴリ情報「3」の組に対応する単語は無い。カテゴリ情報701「邦画」とサブカテゴリ情報「4」の組に対応する単語は「映画」「邦画」である。   The word corresponding to the set of category information 701 “Japanese film” and subcategory information “2” is “name”. There is no word corresponding to the set of the category information 701 “Japanese movie” and the subcategory information “3”. The words corresponding to the set of category information 701 “Japanese movie” and subcategory information “4” are “movie” and “Japanese movie”.

よって、特徴ベクトルは、{2/5, 1/5, 0, 2/5}={0.40, 0.20, 0, 0.40}となる。   Therefore, the feature vector is {2/5, 1/5, 0, 2/5} = {0.40, 0.20, 0, 0.40}.

ここでは、有効数字2桁で計算した。   Here, the calculation was made with two significant figures.

例えば、図11に示すカテゴリ情報701「1」に対応する代表点ベクトルと上記特徴ベクトル{0.40, 0.20, 0, 0.40}の距離Dは、0.339である。カテゴリ情報701「2」に対応する代表点ベクトルと上記特徴ベクトルの距離Dは、0.424である。カテゴリ情報701「3」に対応する代表点ベクトルと上記特徴ベクトルの距離Dは、0.616である。   For example, the distance D between the representative point vector corresponding to the category information 701 “1” shown in FIG. 11 and the feature vector {0.40, 0.20, 0, 0.40} is 0.339. The distance D between the representative point vector corresponding to the category information 701 “2” and the feature vector is 0.424. The distance D between the representative point vector corresponding to the category information 701 “3” and the feature vector is 0.616.

よって、カテゴリ情報701「1」に対応する代表点ベクトルが選択され、すなわち、対象文書サブカテゴリは、「1」となる。   Therefore, the representative point vector corresponding to the category information 701 “1” is selected, that is, the target document subcategory is “1”.

また、対象文書の文字数は99文字であるため、最後の桁を四捨五入すると、文字数は100となる。   Further, since the number of characters of the target document is 99, the number of characters becomes 100 when the last digit is rounded off.

図10においては、時刻601と現在時刻の差が所定範囲内にあり、当日が休日であるか否かの状況が休日フラグ602に一致すると仮定すると、最も上にあるレコードについては、対象文書の文字数「100」が文字数605に一致し、対象文書カテゴリとカテゴリ情報603が一致し且つ対象文書サブカテゴリとサブカテゴリ情報604が一致するので、第1期間反応数611「6」(第1期間反応予測値)、第2期間反応数612「4」(第2期間反応予測値)、第3期間反応数613「1」(第3期間反応予測値)、第4期間反応数614「1」(第4期間反応予測値)、第5期間反応数615「0」(第5期間反応予測値)が得られる。   In FIG. 10, assuming that the difference between the time 601 and the current time is within a predetermined range, and the status of whether or not the current day is a holiday is the same as the holiday flag 602, the uppermost record is Since the number of characters “100” matches the number of characters 605, the target document category and category information 603 match, and the target document subcategory and subcategory information 604 match, the first period response number 611 “6” (first period response prediction value) ), Second period response number 612 “4” (second period response predicted value), third period response number 613 “1” (third period response predicted value), fourth period response number 614 “1” (fourth) (Period response predicted value), 5th period response number 615 “0” (5th period response predicted value) is obtained.

これにより、例えば、図3に示すような反応予測値の表示がなされる。   Thereby, for example, a reaction predicted value as shown in FIG. 3 is displayed.

第2の実施の形態によれば、対象文書サブカテゴリ、つまり、対象文書に内在するカテゴリを求め、これを基に反応予測値を取得するので、反応予測の精度向上を図ることができる。   According to the second embodiment, the target document subcategory, that is, the category inherent in the target document is obtained, and the reaction prediction value is acquired based on this, so that the accuracy of the reaction prediction can be improved.

ところで、ソーシャル・ネットワーキング・サービス(SNS)ではユーザ毎に異なるコミュニティが築かれており、挙動が異なる可能性がある。この場合、新規ユーザの文書について適切な反応予測値が得られないことが想定される。   By the way, in the social networking service (SNS), different communities are established for each user, and the behavior may be different. In this case, it is assumed that an appropriate response prediction value cannot be obtained for the new user's document.

そこで、文書を閲覧するユーザ毎に反応予測値を分類し、閲覧するユーザが文書の作成者に対して過去に見せた反応に基づいて、新規ユーザの文書に対する反応予測値を計算し、全ての閲覧するユーザに対して計算が終わった後に、反応予測値の総和を計算し、画面に表示する方法も考えられる。   Therefore, the predicted response value is classified for each user who views the document, and the predicted response value for the new user's document is calculated based on the response that the browsing user has shown to the creator of the document in the past. A method is also conceivable in which, after the calculation is completed for the user who browses, the sum of the predicted reaction values is calculated and displayed on the screen.

以上のように、本実施の形態に係る文書作成支援装置によれば、対象文書の特徴量を求め、対象文書への反応の予測値である反応予測値を特徴量に基づいて求める反応予測取得部を備えるので、対象文書の作成者は、反応予測値に基づいて対象文書への反応を予め知ることができ、すなわち、より良い対象文書の作成を支援することができる。   As described above, according to the document creation support apparatus according to the present embodiment, the response prediction acquisition for obtaining the feature amount of the target document and obtaining the reaction predicted value that is the predicted value of the response to the target document based on the feature amount is obtained. Therefore, the creator of the target document can know in advance the reaction to the target document based on the predicted response value, that is, can assist in creating a better target document.

また、過去の履歴を利用することで、例えば、文書の対象であるコミュニティの性質を考慮した反応予測値を得ることができる。例えば、主婦の多いコミュニティへ文書を投稿した場合には、平日の昼に最も多く反応が得られ、休日には反応が少ないなどという知見を得ることが期待できる。また、上記トピックを用いた方法(潜在トピック推定法)を用いて文書分類を行うことで反応予測値の推定精度が向上する。また、文書を投稿する前に反応者の反応の推定値(反応予測値)が表示されることで、文書投稿時の心理的負荷が低減される。   Further, by using the past history, for example, it is possible to obtain a predicted response value in consideration of the nature of the community that is the object of the document. For example, when a document is posted to a community with many housewives, it can be expected to obtain the knowledge that the most reaction is obtained at noon on weekdays and the reaction is less on holidays. In addition, the accuracy of estimation of reaction prediction values is improved by performing document classification using the above-described method using topics (latent topic estimation method). In addition, since the estimated value of the reaction of the responder (reaction predicted value) is displayed before the document is posted, the psychological load at the time of document posting is reduced.

また、文書作成支援装置は、対象文書でない文書について複数のレコードを有し、且つ、当該各レコードは該当の文書の特徴量と当該文書への反応数を含むデータベース(反応履歴DB2や反応予測DB6)を備え、反応予測取得部は、データベースから、対象文書の特徴量に対応するレコードを検索し、当該レコードに含まれる反応数に基づいて反応予測値を求めることで、対象文書の作成を支援することができる。   The document creation support apparatus has a plurality of records for a document that is not a target document, and each record includes a database (reaction history DB2 or reaction prediction DB6) that includes the feature amount of the corresponding document and the number of reactions to the document. ), And the reaction prediction acquisition unit searches the record corresponding to the feature quantity of the target document from the database and obtains the predicted response value based on the number of reactions included in the record, thereby supporting the creation of the target document. can do.

また、特徴量は、対象文書の文字数を含むので、文字数に基づいて求めた反応予測値により対象文書の作成を支援することができる。   In addition, since the feature amount includes the number of characters of the target document, creation of the target document can be supported by a predicted response value obtained based on the number of characters.

また、特徴量は、対象文書の文字数、対象文書のカテゴリおよび対象文書のサブカテゴリを含むので、反応予測値の精度向上が期待できる。   Further, since the feature amount includes the number of characters of the target document, the category of the target document, and the subcategory of the target document, it can be expected to improve the accuracy of the predicted response value.

また、カテゴリとサブカテゴリが共通する複数の文書で構成されるグループ毎のレコードを有し、且つ、当該レコードは当該グループの特徴を示す要素を備える文書分類DBを備え、反応予測取得部は、対象文書の特徴を示す特徴ベクトルを生成し、文書分類データベースから対象文書カテゴリに対応するレコードを検索し、検索された各レコードにつき、該レコードに含まれる要素からなる代表点ベクトルを生成し、特徴ベクトルと各代表点ベクトルとの間の距離を求め、最小の距離に対応するサブカテゴリを対象文書のサブカテゴリとするので、反応予測値の精度向上が期待できる。   In addition, a record for each group including a plurality of documents having a common category and subcategory is included, and the record includes a document classification DB including elements indicating characteristics of the group. Generate a feature vector indicating the feature of the document, search a record corresponding to the target document category from the document classification database, generate a representative point vector composed of elements included in the record for each searched record, Since the subcategory corresponding to the minimum distance is determined as the subcategory of the target document, the accuracy of the reaction predicted value can be expected to be improved.

なお、文書作成支援装置としてコンピュータを機能させるためのコンピュータプログラムは、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク、磁気テープなどのコンピュータ読み取り可能な記録媒体に記録でき、また、インターネットなどの通信網を介して伝送させて、広く流通させることができる。   A computer program for causing a computer to function as a document creation support apparatus can be recorded on a computer-readable recording medium such as a semiconductor memory, a magnetic disk, an optical disk, a magneto-optical disk, a magnetic tape, or a communication network such as the Internet And can be widely distributed.

1…文書入力部
2…反応履歴DB
3…反応取得部
4…反応予測取得部
5…反応予測出力部
6…反応予測DB
7…文書分類DB
8…トピックDB
100…文書入力画面
200…反応予測画面
201…文書番号
202、601…時刻
203、602…休日フラグ
204、603、701、801…カテゴリ情報
205…タイトル
206、605…文字数
207…過去文書
211、611…第1期間反応数
212、612…第2期間反応数
213、613…第3期間反応数
214、614…第4期間反応数
215、615…第5期間反応数
300…投稿ボタン
604、702…サブカテゴリ情報
711、712、713、714、911、912、913、914…トピック割合
802、8021、8022、8023、8024…トピック番号
811、812、813…単語情報
80210、80220、80230…総和
d、D…距離
i,j…過去文書ベクトル
m…特徴ベクトル
n…代表点ベクトル
1 ... Document input part 2 ... Reaction history DB
3 ... Reaction acquisition unit 4 ... Reaction prediction acquisition unit 5 ... Reaction prediction output unit 6 ... Reaction prediction DB
7 ... Document classification DB
8 ... Topic DB
DESCRIPTION OF SYMBOLS 100 ... Document input screen 200 ... Reaction prediction screen 201 ... Document number 202, 601 ... Time 203, 602 ... Holiday flag 204, 603, 701, 801 ... Category information 205 ... Title 206, 605 ... Number of characters 207 ... Past document 211, 611 ... Number of first period reactions 212, 612 ... Number of second period reactions 213, 613 ... Number of third period reactions 214, 614 ... Number of fourth period reactions 215, 615 ... Number of fifth period reactions 300 ... Post button 604, 702 ... Subcategory information 711, 712, 713, 714, 911, 912, 913, 914 ... Topic ratio 802, 8021, 8022, 8023, 8024 ... Topic number 811, 812, 813 ... Word information 80210, 80220, 80230 ... Sum d, D ... distance i, j ... past document vector m ... features Vector n ... representative point vector

Claims (10)

文書作成の支援対象である対象文書の特徴量を求め、前記対象文書への反応の予測値である反応予測値を前記特徴量に基づいて求める反応予測取得部
を備えることを特徴とする文書作成支援装置。
A document creation comprising: a reaction prediction acquisition unit that obtains a feature amount of a target document that is a document creation support target and obtains a reaction prediction value that is a predicted value of a response to the target document based on the feature amount Support device.
前記対象文書でない文書について複数のレコードを有し、且つ、当該各レコードは該当の文書の特徴量と当該文書への反応数を含むデータベースを備え、
前記反応予測取得部は、
前記データベースから、前記対象文書の特徴量に対応するレコードを検索し、当該レコードに含まれる反応数に基づいて前記反応予測値を求める
ことを特徴とする請求項1記載の文書作成支援装置。
The document that is not the target document has a plurality of records, and each record includes a database that includes the feature amount of the corresponding document and the number of reactions to the document,
The reaction prediction acquisition unit
The document creation support apparatus according to claim 1, wherein a record corresponding to the feature amount of the target document is searched from the database, and the predicted response value is obtained based on the number of reactions included in the record.
前記特徴量は、前記対象文書から不要な文字を削除した後の文字数を含む
ことを特徴とする請求項1または2記載の文書作成支援装置。
The document creation support apparatus according to claim 1, wherein the feature amount includes a number of characters after unnecessary characters are deleted from the target document.
前記特徴量は、前記対象文書から不要な文字を削除した後の文字数、前記対象文書のカテゴリおよび前記対象文書のサブカテゴリを含む
ことを特徴とする請求項1または2記載の文書作成支援装置。
The document creation support apparatus according to claim 1, wherein the feature amount includes a number of characters after unnecessary characters are deleted from the target document, a category of the target document, and a subcategory of the target document.
カテゴリとサブカテゴリが共通する複数の文書で構成されるグループ毎のレコードを有し、且つ、当該レコードは当該グループの特徴を示す要素を備える文書分類データベースを備え、
前記反応予測取得部は、
前記対象文書の特徴を示す特徴ベクトルを生成し、
前記文書分類データベースから前記対象文書カテゴリに対応するレコードを検索し、検索された各レコードにつき、該レコードに含まれる要素からなる代表点ベクトルを生成し、
前記特徴ベクトルと前記各代表点ベクトルとの間の距離を求め、
最小の距離に対応するサブカテゴリを前記対象文書のサブカテゴリとする
ことを特徴とする請求項4記載の文書作成支援装置。
A record for each group including a plurality of documents having a common category and subcategory, and the record includes a document classification database including elements indicating characteristics of the group;
The reaction prediction acquisition unit
Generating a feature vector indicating features of the target document;
A record corresponding to the target document category is searched from the document classification database, and a representative point vector including elements included in the record is generated for each searched record.
Obtaining a distance between the feature vector and each representative point vector;
The document creation support apparatus according to claim 4, wherein a subcategory corresponding to a minimum distance is a subcategory of the target document.
対象文書を入力する文書入力部と、
前記対象文書の特徴量を求め、前記対象文書への反応の予測値である反応予測値を前記特徴量に基づいて求める反応予測取得部と、
前記反応予測値を出力する反応予測出力部と
を備えることを特徴とする文書作成支援装置。
A document input part for inputting the target document;
A reaction prediction acquisition unit that obtains a feature amount of the target document and obtains a reaction prediction value that is a predicted value of a response to the target document based on the feature amount;
A document creation support apparatus comprising: a reaction prediction output unit that outputs the reaction prediction value.
文書作成支援装置の反応予測取得部が、対象文書の特徴量を求めるステップと、
前記反応予測取得部が、前記対象文書への反応の予測値である反応予測値を前記特徴量に基づいて求めるステップと
を備えることを特徴とする文書作成支援装置の動作方法。
A step of obtaining a feature amount of the target document by the reaction prediction acquisition unit of the document creation support apparatus;
The operation method of the document creation support apparatus, characterized in that the reaction prediction acquisition unit includes a step of obtaining a reaction predicted value that is a predicted value of a response to the target document based on the feature amount.
文書作成支援装置の文書入力部が、文書作成の支援対象である対象文書を入力するステップと、
前記文書作成支援装置の反応予測取得部が、前記対象文書の特徴量を求めるステップと、
前記反応予測取得部が、前記対象文書への反応の予測値である反応予測値を前記特徴量に基づいて求めるステップと、
前記文書作成支援装置の反応予測出力部が、前記反応予測値を出力するステップと
を備えることを特徴とする文書作成支援装置の動作方法。
A document input unit of the document creation support apparatus inputting a target document that is a document creation support target;
A step of obtaining a feature amount of the target document by a reaction prediction acquisition unit of the document creation support apparatus;
The reaction prediction acquisition unit obtains a reaction predicted value that is a predicted value of a response to the target document based on the feature amount;
A response prediction output unit of the document creation support apparatus includes a step of outputting the reaction predicted value.
請求項1ないし5のいずれかに記載の文書作成支援装置としてコンピュータを機能させるためのコンピュータプログラム。   A computer program for causing a computer to function as the document creation support apparatus according to claim 1. 請求項6記載の文書作成支援装置としてコンピュータを機能させるためのコンピュータプログラム。   A computer program for causing a computer to function as the document creation support apparatus according to claim 6.
JP2013114093A 2013-05-30 2013-05-30 Document creation assist device and operation method thereof Pending JP2014232494A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013114093A JP2014232494A (en) 2013-05-30 2013-05-30 Document creation assist device and operation method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013114093A JP2014232494A (en) 2013-05-30 2013-05-30 Document creation assist device and operation method thereof

Publications (1)

Publication Number Publication Date
JP2014232494A true JP2014232494A (en) 2014-12-11

Family

ID=52125814

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013114093A Pending JP2014232494A (en) 2013-05-30 2013-05-30 Document creation assist device and operation method thereof

Country Status (1)

Country Link
JP (1) JP2014232494A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021079445A1 (en) * 2019-10-23 2021-04-29 富士通株式会社 Display method, display program, and information processing device
JPWO2021079444A1 (en) * 2019-10-23 2021-04-29
JPWO2021079447A1 (en) * 2019-10-23 2021-04-29

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026782A (en) * 2008-07-18 2010-02-04 Nippon Telegr & Teleph Corp <Ntt> Document classification device, document classification method, program, and recording medium

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026782A (en) * 2008-07-18 2010-02-04 Nippon Telegr & Teleph Corp <Ntt> Document classification device, document classification method, program, and recording medium

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6016019467; 池田和史 他3名: '投稿傾向に着目したWebニュースへのコメント数予測手法' 電子情報通信学会2013年総合大会講演論文集 情報・システム1 , 20130305, 36頁, 一般社団法人電子情報通信学会 *
JPN6016019469; 山崎高弘 他1名: '評判情報分析のための評価表現の特徴量に関する一考察' 第31回情報理論とその応用シンポジウム予稿集[CD-ROM] , 20080930 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021079445A1 (en) * 2019-10-23 2021-04-29 富士通株式会社 Display method, display program, and information processing device
JPWO2021079444A1 (en) * 2019-10-23 2021-04-29
JPWO2021079447A1 (en) * 2019-10-23 2021-04-29
WO2021079447A1 (en) * 2019-10-23 2021-04-29 富士通株式会社 Display method, display program, and information processing device
WO2021079444A1 (en) * 2019-10-23 2021-04-29 富士通株式会社 Display method, display program, and information processing device
JPWO2021079445A1 (en) * 2019-10-23 2021-04-29
JP7363912B2 (en) 2019-10-23 2023-10-18 富士通株式会社 Display method, display program and information processing device
JP7363911B2 (en) 2019-10-23 2023-10-18 富士通株式会社 Display method, display program and information processing device
JP7363910B2 (en) 2019-10-23 2023-10-18 富士通株式会社 Display method, display program and information processing device

Similar Documents

Publication Publication Date Title
US11409777B2 (en) Entity-centric knowledge discovery
Zucco et al. Sentiment analysis for mining texts and social networks data: Methods and tools
US10699202B2 (en) Inferential-based communications method and system
US9582569B2 (en) Targeted content distribution based on a strength metric
Teso et al. Application of text mining techniques to the analysis of discourse in eWOM communications from a gender perspective
US8682830B2 (en) Information processing apparatus, information processing method, and program
CN112486917A (en) Method and system for automatically generating information-rich content from multiple microblogs
US20170097966A1 (en) Method and system for updating an intent space and estimating intent based on an intent space
Mukherjee et al. Gender classification of microblog text based on authorial style
US10176265B2 (en) Awareness engine
Bauer et al. # MeTooMaastricht: Building a chatbot to assist survivors of sexual harassment
KR20150086441A (en) Connecting people based on content and relational distance
EP2613275B1 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
Najadat et al. Detecting Arabic spam reviews in social networks based on classification algorithms
JP2009187077A (en) Recommendation information providing apparatus, recommendation information providing method, recommendation information providing system, and recommendation information providing program
JP2014232494A (en) Document creation assist device and operation method thereof
Saraswat et al. Enriching topic coherence on reviews for cross-domain recommendation
Coelho et al. Semantic similarity for mobile application recommendation under scarce user data
Tessore et al. Distant Supervised Construction and Evaluation of a Novel Dataset of Emotion-Tagged Social Media Comments in Spanish
JP5841108B2 (en) Information processing apparatus, article information generation method and program
Preotiuc-Pietro Temporal models of streaming social media data
US11907508B1 (en) Content analytics as part of content creation
Jain et al. Hybrid context aware recommender systems
CN110837740B (en) Comment aspect opinion level mining method based on dictionary improvement LDA model
Patankar et al. Event Detection from Social Media Using Machine Learning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160531

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20161129