JP2010286997A - Device and method for evaluating value of article, and program - Google Patents

Device and method for evaluating value of article, and program Download PDF

Info

Publication number
JP2010286997A
JP2010286997A JP2009139590A JP2009139590A JP2010286997A JP 2010286997 A JP2010286997 A JP 2010286997A JP 2009139590 A JP2009139590 A JP 2009139590A JP 2009139590 A JP2009139590 A JP 2009139590A JP 2010286997 A JP2010286997 A JP 2010286997A
Authority
JP
Japan
Prior art keywords
article
value
evaluation
words
evaluation target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009139590A
Other languages
Japanese (ja)
Other versions
JP4921523B2 (en
Inventor
Tsunehiro Okumura
倫弘 奥村
Kyoko Tsuboi
今日子 坪井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2009139590A priority Critical patent/JP4921523B2/en
Publication of JP2010286997A publication Critical patent/JP2010286997A/en
Application granted granted Critical
Publication of JP4921523B2 publication Critical patent/JP4921523B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a device and method for automatically evaluating the value of an article, and for extracting a useful article, and a program. <P>SOLUTION: An evaluation server 10 is provided with: a pattern DB22 for storing one or more normalized pattern configured by including the combination of items included in the past article; an article pattern classification part 13 for classifying an evaluation object article and the past article into any of the normalized patterns; a word/phrase extraction part 14 for extracting words/phrases in the evaluation object article and the past article corresponding to one or more items included in the classified normalized pattern; an appearance frequency DB23 for storing statistical data associating the appearance frequencies for each of the extracted words and phrases; and a value evaluation part 15 for calculating an evaluation value showing the value of the evaluation object article on the basis of the deviation of the appearance frequency of the words and phrases included in the evaluation object article, in the stored statistical data. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、記事の価値を評価する装置、方法、およびプログラムに関する。   The present invention relates to an apparatus, a method, and a program for evaluating the value of an article.

従来、インターネットのWebページにおいて、新聞社や通信社等から発信される大量のニュース記事を取捨選択して掲載するサービスが行われている。このようなサービスでは、多くのユーザにとって関心が高く有用である、すなわち価値の高い記事を、目に留まりやすく簡潔に一覧表示することが望ましい。   2. Description of the Related Art Conventionally, a service has been provided in which a large number of news articles transmitted from newspaper companies, communication companies, etc. are selected and posted on Internet Web pages. In such a service, it is desirable to display a concise and easy-to-read list of articles that are interesting and useful for many users, that is, high-value articles.

そこで、記事から自動的に要約文を生成する技術が提案されている。例えば、特許文献1には、パターン情報と記事とを照合により記事から単語情報を抽出し、テンプレートにより要約文を生成する装置が示されている。   Therefore, a technique for automatically generating a summary sentence from an article has been proposed. For example, Patent Document 1 discloses an apparatus that extracts word information from an article by collating pattern information with an article and generates a summary sentence using a template.

特開2002−197097号公報Japanese Patent Laid-Open No. 2002-197097

しかしながら、特許文献1の装置は、記事の要約文を生成することで一覧表示等に使用できる可能性はあるが、大量に存在する記事の中から、ユーザに提供すべき有用な記事を抽出することは難しかった。   However, although the apparatus of Patent Literature 1 may be used for list display by generating a summary sentence of articles, it extracts useful articles to be provided to the user from a large number of articles. That was difficult.

本発明は、記事の価値を自動的に評価し、有用な記事を抽出することができる装置、方法、およびプログラムを提供することを目的とする。   An object of the present invention is to provide an apparatus, a method, and a program capable of automatically evaluating the value of an article and extracting a useful article.

本発明では、以下のような解決手段を提供する。   The present invention provides the following solutions.

(1) 記事の価値を評価する装置であって、
過去の記事に含まれる項目の組合せを含んで構成する正規化された1以上の正規化パターンを記憶するパターン記憶手段と、
評価対象記事および前記過去の記事を、前記パターン記憶手段が記憶した正規化パターンのいずれかに分類する分類手段と、
前記分類手段により分類された正規化パターンに含まれる1以上の項目に対応する、当該評価対象記事中および前記過去の記事中の語句を抽出する抽出手段と、
前記抽出手段により抽出された語句のそれぞれについて、前記評価対象記事および前記過去の記事の中の出現回数と関連付けた統計データを記憶する出現回数記憶手段と、
前記出現回数記憶手段により記憶された統計データにおいて、当該評価対象記事に含まれる語句の前記出現回数の偏差に基づいて、前記評価対象記事の価値を示す評価値を算出する算出手段と、を備える装置。
(1) A device for evaluating the value of an article,
Pattern storage means for storing one or more normalized patterns that include a combination of items included in past articles;
Classification means for classifying the article to be evaluated and the past article into any of the normalized patterns stored by the pattern storage means;
Extraction means for extracting words in the evaluation target article and the past article corresponding to one or more items included in the normalized pattern classified by the classification means;
For each of the phrases extracted by the extraction means, an appearance count storage means for storing statistical data associated with the appearance count in the evaluation target article and the past article;
In the statistical data stored by the appearance count storage means, a calculation means for calculating an evaluation value indicating the value of the evaluation target article based on a deviation of the appearance count of the words included in the evaluation target article. apparatus.

このような構成によれば、当該装置は、過去の記事に含まれる項目の組合せを含んで構成する正規化された1以上の正規化パターンを記憶し、評価対象記事および前記過去の記事を、正規化パターンのいずれかに分類し、分類された正規化パターンに含まれる1以上の項目に対応する、当該評価対象記事中および前記過去の記事中の語句を抽出する。また、当該装置は、抽出された語句のそれぞれについて、評価対象記事および過去の記事の中の出現回数と関連付けた統計データを記憶し、記憶された統計データにおいて、評価対象記事に含まれる語句の出現回数の偏差に基づいて、評価対象記事の価値を示す評価値を算出する。   According to such a configuration, the apparatus stores one or more normalized patterns that include a combination of items included in past articles, stores the evaluation target article and the past article, Classification into any one of the normalization patterns, and words in the evaluation target article and the past article corresponding to one or more items included in the classified normalization pattern are extracted. Further, the apparatus stores statistical data associated with the number of appearances in the evaluation target article and the past article for each of the extracted words and phrases, and in the stored statistical data, the phrase included in the evaluation target article is stored. An evaluation value indicating the value of the evaluation target article is calculated based on the deviation of the number of appearances.

したがって、当該装置は、正規化パターンと照合することにより項目ごとの語句を抽出することができる。そして、当該装置は、抽出された語句について統計処理することにより得られる出現回数と語句数との関係に基づく出現回数の偏差、具体的には偏差値により、評価対象記事の評価値を算出することができる。例えば、出現回数が平均から離れるほど注目すべき重要な語句である可能性が高いので、偏差値により重要度を測ることができる。その結果、当該装置は、項目ごとの語句の重要度に基づいて、評価対象記事全体の価値を自動的に評価し、有用な記事を抽出できる可能性がある。   Therefore, the apparatus can extract a phrase for each item by collating with the normalization pattern. Then, the apparatus calculates the evaluation value of the article to be evaluated based on the deviation of the number of appearances based on the relationship between the number of appearances and the number of phrases obtained by performing statistical processing on the extracted words, specifically, the deviation value. be able to. For example, since there is a high possibility that the number of appearances is an important word that should be noticed as the number of appearances deviates from the average, the degree of importance can be measured by the deviation value. As a result, the device may automatically evaluate the value of the entire evaluation target article based on the importance of the phrase for each item, and extract a useful article.

(2) 前記出現回数の偏差に対する語句の重要度を規定する価値基準の入力を受け付ける価値基準受付手段をさらに備え、
前記算出手段は、前記評価対象記事に含まれる前記項目ごとの語句の重要度を総合して前記評価値を算出することを特徴とする(1)に記載の装置。
(2) further comprising value criterion accepting means for accepting an input of a value criterion that defines the importance of the phrase with respect to the deviation of the number of appearances;
The apparatus according to (1), wherein the calculation unit calculates the evaluation value by combining the importance of words for each item included in the article to be evaluated.

このような構成によれば、当該装置は、出現回数の偏差に対する語句の重要度を規定する価値基準の入力を受け付け、評価対象記事に含まれる項目ごとの語句の重要度を総合して評価値を算出する。   According to such a configuration, the apparatus receives an input of a value standard that defines the importance of the phrase with respect to the deviation in the number of appearances, and evaluates the importance of the phrase for each item included in the article to be evaluated. Is calculated.

したがって、当該装置は、予め入力を受け付けた価値基準に基づいて、出現回数の偏差から語句の重要度を算出することができる。これにより、当該装置は、項目ごとの語句の重要度を総合して、評価対象記事の価値を、具体的な指標である評価値として算出することができる。なお、語句の重要度を総合した評価値は、重要度の合計や平均等、所定の演算により算出することができる。   Therefore, the device can calculate the importance of the phrase from the deviation of the number of appearances based on the value criterion for which the input has been received in advance. Thereby, the apparatus can calculate the value of the evaluation target article as an evaluation value that is a specific index by integrating the importance of words for each item. Note that an evaluation value obtained by combining the importance levels of words can be calculated by a predetermined calculation such as a total or average of the importance levels.

(3) 前記評価対象記事に含まれる前記項目ごとの語句の重要度を互いに比較し、当該重要度が相対的に高い語句を選択する選択手段と、
前記選択手段により選択された語句からなるタイトルデータを生成する生成手段と、をさらに備える(2)に記載の装置。
(3) selection means for comparing the importance of the words for each item included in the article to be evaluated, and selecting a word with a relatively high importance;
(2) The apparatus according to (2), further comprising generation means for generating title data composed of the words selected by the selection means.

このような構成によれば、当該装置は、評価対象記事に含まれる項目ごとの語句の重要度を互いに比較し、当該重要度が相対的に高い語句を選択し、選択された語句からなるタイトルデータを生成する。   According to such a configuration, the apparatus compares the importance of words for each item included in the evaluation target article, selects a word with a relatively high importance, and a title including the selected word Generate data.

したがって、当該装置は、重要度が高くユーザに注目される語句を選択することができる。そして、当該装置は、このような注目語句によりタイトルを構成するので、特に、文字数が限られている等の条件の下で、報知効果を向上することができる。   Therefore, the device can select a word that is highly important and attracts attention from the user. And since the said apparatus comprises a title by such attention words and phrases, the notification effect can be improved especially on conditions, such as the number of characters being limited.

(4) 前記選択手段は、予め設定されている所定量の語句を選択し、
前記生成手段は、前記選択手段により選択された語句を、前記重要度の高い順に並べることにより前記タイトルデータを生成することを特徴とする(3)に記載の装置。
(4) The selection means selects a predetermined amount of words / phrases set in advance,
The apparatus according to (3), wherein the generation unit generates the title data by arranging the words selected by the selection unit in order of the importance.

このような構成によれば、当該装置は、予め設定されている所定量の語句を選択し、選択された語句を、重要度の高い順に並べることにより前記タイトルデータを生成する。   According to such a configuration, the apparatus selects a predetermined amount of words / phrases set in advance, and generates the title data by arranging the selected words / phrases in descending order of importance.

したがって、当該装置は、より重要度が高い語句を優先的にタイトルとして表示させることができる。その結果、タイトルの注目度が高まり、報知効果の向上が期待できる。   Therefore, the device can preferentially display words with higher importance as titles. As a result, the degree of attention of the title increases, and an improvement in notification effect can be expected.

(5) 前記価値基準受付手段は、前記価値基準として、前記項目ごとに異なる前記重要度の重み付けの入力を受け付けることを特徴とする(2)から(4)のいずれかに記載の装置。   (5) The apparatus according to any one of (2) to (4), wherein the value criterion accepting unit accepts an input of weighting of the importance level that is different for each item as the value criterion.

このような構成によれば、当該装置は、管理者からの価値基準の入力に基づいて、項目ごとに異なる重要度の重み付けを設定することができる。したがって、当該装置は、価値基準を柔軟に調整し、高価値となる記事の種類を適宜設定することができる。   According to such a configuration, the device can set different importance weights for each item based on the input of the value criterion from the administrator. Therefore, the apparatus can adjust the value criteria flexibly and appropriately set the type of article that has high value.

(6) 前記価値基準受付手段は、前記価値基準として、前記評価対象記事の取得元ごとに異なる前記重要度の重み付けの入力を受け付けることを特徴とする(2)から(5)のいずれかに記載の装置。   (6) In any one of (2) to (5), the value criterion accepting unit accepts, as the value criterion, an input of the weighting of the importance level that differs for each acquisition source of the evaluation target article. The device described.

このような構成によれば、当該装置は、管理者からの価値基準の入力に基づいて、評価対象記事の取得元、すなわち新聞社や通信社等ごとに異なる重要度の重み付けを設定することができる。したがって、当該装置は、記事の発信源により信頼性や重要度を設定し、高価値となる記事の種類を適宜設定することができる。   According to such a configuration, the apparatus can set different importance weights for each acquisition source of the evaluation target article, that is, for each newspaper company, news agency, etc., based on the input of the value criterion from the administrator. it can. Therefore, the apparatus can set the reliability and the importance according to the source of the article, and appropriately set the type of the article that has a high value.

(7) 前記価値基準受付手段は、前記価値基準として、前記正規化パターンごとに異なる前記重要度の重み付けの入力を受け付けることを特徴とする(2)から(6)のいずれかに記載の装置。   (7) The apparatus according to any one of (2) to (6), wherein the value criterion accepting unit accepts, as the value criterion, an input of weighting of the importance level that is different for each normalization pattern. .

このような構成によれば、当該装置は、管理者からの価値基準の入力に基づいて、正規化パターンごとに異なる重要度の重み付けを設定することができる。したがって、当該装置は、重要な記事の種類(正規化パターン)を予め設定し、優先的に抽出することができる。   According to such a configuration, the apparatus can set different importance weights for each normalization pattern based on the input of the value criterion from the administrator. Therefore, the apparatus can preliminarily extract important article types (normalization patterns) in advance.

(8) 同一の前記項目に対応する複数の語句の優先順位を規定する順位基準の入力を受け付ける順位基準受付手段と、
前記順位基準に基づいて、前記評価値が等しい複数の記事の順位を判断する判断手段と、をさらに備える(1)から(7)のいずれかに記載の装置。
(8) rank criterion receiving means for receiving an input of a rank criterion that defines the priority of a plurality of words corresponding to the same item;
The apparatus according to any one of (1) to (7), further comprising: a determination unit that determines the rank of a plurality of articles having the same evaluation value based on the rank criterion.

このような構成によれば、当該装置は、同一の項目に対応する複数の語句の優先順位を規定する順位基準の入力を受け付け、順位基準に基づいて、評価値が等しい複数の記事の順位を判断する。   According to such a configuration, the apparatus receives an input of a rank criterion that defines the priority of a plurality of words corresponding to the same item, and based on the rank criterion, ranks a plurality of articles having the same evaluation value. to decide.

したがって、当該装置は、管理者からの順位基準の入力に基づいて、評価値が等しい複数の記事に対して、順位付けを行うことができる。すなわち、当該装置は、優先度の高い語句を含んだ記事を優先的に抽出することができる。   Therefore, the apparatus can rank a plurality of articles having the same evaluation value based on the ranking criteria input from the administrator. That is, the apparatus can preferentially extract articles including words with high priority.

(9) 記事の価値をコンピュータが評価する方法であって、
過去の記事に含まれる項目の組合せを含んで構成する正規化された1以上の正規化パターンを記憶するパターン記憶ステップと、
評価対象記事および前記過去の記事を、前記パターン記憶ステップにより記憶した正規化パターンのいずれかに分類する分類ステップと、
前記分類ステップにより分類された正規化パターンに含まれる1以上の項目に対応する、当該評価対象記事中および前記過去の記事中の語句を抽出する抽出ステップと、
前記抽出ステップにより抽出された語句のそれぞれについて、前記評価対象記事および前記過去の記事の中の出現回数と関連付けた統計データを記憶する出現回数記憶ステップと、
前記出現回数記憶ステップにより記憶された統計データにおいて、前記評価対象記事に含まれる語句の前記出現回数の偏差に基づいて、当該評価対象記事の価値を示す評価値を算出する算出ステップと、を含む方法。
(9) A method by which a computer evaluates the value of an article,
A pattern storage step of storing one or more normalized patterns that are configured to include combinations of items included in past articles;
A classification step of classifying the article to be evaluated and the past article into any of the normalized patterns stored in the pattern storage step;
An extraction step of extracting words in the evaluation target article and the past article corresponding to one or more items included in the normalized pattern classified by the classification step;
For each of the phrases extracted in the extraction step, an appearance count storage step for storing statistical data associated with the appearance count in the evaluation target article and the past article;
In the statistical data stored in the appearance count storage step, a calculation step of calculating an evaluation value indicating the value of the evaluation target article based on a deviation of the appearance count of the words included in the evaluation target article is included. Method.

このような構成によれば、当該方法を実行することにより、(1)と同様の効果が期待できる。   According to such a configuration, the same effect as in (1) can be expected by executing the method.

(10) (9)に記載の方法をコンピュータに実行させるプログラム。   (10) A program that causes a computer to execute the method according to (9).

このような構成によれば、当該プログラムをコンピュータに実行させることにより、(1)と同様の効果が期待できる。   According to such a configuration, the same effect as in (1) can be expected by causing the computer to execute the program.

本発明によれば、記事の価値を自動的に評価し、有用な記事を抽出することができる。   According to the present invention, it is possible to automatically evaluate the value of articles and extract useful articles.

本発明の実施形態に係るシステムの全体構成を示す図である。1 is a diagram illustrating an overall configuration of a system according to an embodiment of the present invention. 本発明の実施形態に係る評価サーバのハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of the evaluation server which concerns on embodiment of this invention. 本発明の実施形態に係る評価サーバの機能構成を示す図である。It is a figure which shows the function structure of the evaluation server which concerns on embodiment of this invention. 本発明の実施形態に係る正規化パターンの一例を示す図である。It is a figure which shows an example of the normalization pattern which concerns on embodiment of this invention. 本発明の実施形態に係る統計データの一例を示す図である。It is a figure which shows an example of the statistical data which concern on embodiment of this invention. 本発明の実施形態に係る出現回数の分布の一例について、その形状を模式的に示した図である。It is the figure which showed typically the shape about an example of distribution of the appearance frequency which concerns on embodiment of this invention. 本発明の実施形態に係る価値基準テーブルの一例を示す図である。It is a figure which shows an example of the value reference | standard table which concerns on embodiment of this invention. 本発明の実施形態に係る処理例を示すフローチャートである。It is a flowchart which shows the process example which concerns on embodiment of this invention.

以下、本発明の実施形態の一例について図を参照しながら説明する。   Hereinafter, an example of an embodiment of the present invention will be described with reference to the drawings.

[システム全体構成]
図1は、本実施形態に係る評価サーバ10と関連要素とを含んだシステムの全体構成を示す図である。このシステムでは、評価サーバ10と、記事データを発信する複数のコンテンツサーバ20と、Webサーバ30と、ユーザ端末40と、が互いにインターネット等の所定のネットワークを介して接続されている。
[Entire system configuration]
FIG. 1 is a diagram showing an overall configuration of a system including an evaluation server 10 and related elements according to the present embodiment. In this system, an evaluation server 10, a plurality of content servers 20 that transmit article data, a Web server 30, and a user terminal 40 are connected to each other via a predetermined network such as the Internet.

評価サーバ10は、コンテンツサーバ20から、配信候補であるニュース記事を受信する。評価サーバ10は、統計処理により、過去の記事の正規化パターンを生成すると共に、項目ごとの語句の出現回数に関する統計データを記憶する。そして、評価サーバ10は、この統計データを参照し、語句の出現回数に関する偏差値に対応する重要度に基づいて、受信した記事の価値を評価する。   The evaluation server 10 receives news articles that are distribution candidates from the content server 20. The evaluation server 10 generates a normalization pattern of past articles by statistical processing, and stores statistical data related to the number of appearances of words for each item. Then, the evaluation server 10 refers to this statistical data, and evaluates the value of the received article based on the importance corresponding to the deviation value related to the number of occurrences of the phrase.

評価サーバ10から、評価値の高い記事が選択されてWebサーバ30へ送信されると、Webサーバ30は、Webページの所定領域に記事の一覧表示(トピックス表示)を行う。これにより、ユーザ端末40がWebサーバ30へアクセスすることにより、所定のWebページを表示すると、ユーザは、評価サーバ10により自動的に抽出された注目記事を閲覧することができる。   When an article with a high evaluation value is selected from the evaluation server 10 and transmitted to the Web server 30, the Web server 30 displays a list of articles (topics display) in a predetermined area of the Web page. Thereby, when the user terminal 40 accesses the Web server 30 to display a predetermined Web page, the user can browse the article of interest automatically extracted by the evaluation server 10.

[ハードウェア構成]
図2は、本実施形態に係る評価サーバ10のハードウェア構成を示す図である。評価サーバ10は、制御部300を構成するCPU(Central Processing Unit)310(マルチプロセッサ構成ではCPU320等複数のCPUが追加されてもよい)、バスライン200、通信I/F(I/F:インタフェース)330、メインメモリ340、BIOS(Basic Input Output System)350、I/Oコントローラ360、ハードディスク370、光ディスクドライブ380、並びに半導体メモリ390を備える。尚、ハードディスク370、光ディスクドライブ380、並びに、半導体メモリ390はまとめて記憶装置410と呼ばれる。
[Hardware configuration]
FIG. 2 is a diagram illustrating a hardware configuration of the evaluation server 10 according to the present embodiment. The evaluation server 10 includes a CPU (Central Processing Unit) 310 (a plurality of CPUs such as a CPU 320 may be added in a multiprocessor configuration), a bus line 200, and a communication I / F (I / F: interface) that configure the control unit 300. ) 330, a main memory 340, a BIOS (Basic Input Output System) 350, an I / O controller 360, a hard disk 370, an optical disk drive 380, and a semiconductor memory 390. The hard disk 370, the optical disk drive 380, and the semiconductor memory 390 are collectively referred to as a storage device 410.

制御部300は、評価サーバ10を統括的に制御する部分であり、ハードディスク370(後述)に記憶された各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。   The control unit 300 is a part that controls the evaluation server 10 in an integrated manner. By appropriately reading and executing various programs stored in the hard disk 370 (described later), the control unit 300 cooperates with the hardware described above, and Various functions are realized.

通信I/F330は、評価サーバ10が、ネットワークを介して図1のコンテンツサーバ20やWebサーバ30、他の情報端末等と情報を送受信する場合のネットワーク・アダプタである。通信I/F330は、モデム、ケーブル・モデムおよびイーサネット(登録商標)・アダプタを含んでよい。   The communication I / F 330 is a network adapter when the evaluation server 10 transmits / receives information to / from the content server 20, the web server 30, and other information terminals in FIG. 1 via the network. The communication I / F 330 may include a modem, a cable modem, and an Ethernet (registered trademark) adapter.

BIOS350は、評価サーバ10の起動時にCPU310が実行するブートプログラムや、評価サーバ10のハードウェアに依存するプログラム等を記録する。   The BIOS 350 records a boot program executed by the CPU 310 when the evaluation server 10 is started up, a program depending on the hardware of the evaluation server 10, and the like.

I/Oコントローラ360には、ハードディスク370、光ディスクドライブ380、および半導体メモリ390等の記憶装置410を接続することができる。   A storage device 410 such as a hard disk 370, an optical disk drive 380, and a semiconductor memory 390 can be connected to the I / O controller 360.

ハードディスク370は、本ハードウェアを評価サーバ10として機能させるための各種プログラムや、本発明の機能を実行するプログラム等を記憶する。なお、評価サーバ10は、外部に別途設けたハードディスク(図示せず)を外部記憶装置として利用することもできる。   The hard disk 370 stores various programs for causing the hardware to function as the evaluation server 10 and programs for executing the functions of the present invention. Note that the evaluation server 10 can also use an external hard disk (not shown) as an external storage device.

光ディスクドライブ380としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブを使用することができる。この場合は各ドライブに対応した光ディスク400を使用する。光ディスク400から光ディスクドライブ380によりプログラムまたはデータを読み取り、I/Oコントローラ360を介してメインメモリ340またはハードディスク370に提供することもできる。   As the optical disk drive 380, for example, a DVD-ROM drive, a CD-ROM drive, a DVD-RAM drive, or a CD-RAM drive can be used. In this case, the optical disk 400 corresponding to each drive is used. A program or data can be read from the optical disk 400 by the optical disk drive 380 and provided to the main memory 340 or the hard disk 370 via the I / O controller 360.

なお、本発明でいうコンピュータとは、記憶装置、制御部等を備えた情報処理装置をいい、評価サーバ10は、記憶装置410、制御部300等を備えた情報処理装置により構成され、この情報処理装置は、本発明のコンピュータの概念に含まれる。   The computer referred to in the present invention refers to an information processing device including a storage device, a control unit, and the like. The evaluation server 10 includes an information processing device including a storage device 410, a control unit 300, and the like. The processing device is included in the concept of the computer of the present invention.

[機能構成]
図3は、本実施形態に係る評価サーバ10の機能構成を示す図である。評価サーバ10の制御部300は、記事パターン生成部11と、記事受付部12と、記事パターン分類部13(分類手段)と、語句抽出部14(抽出手段)と、価値評価部15(算出手段、判断手段)と、注目語句選択部16(選択手段)と、タイトル生成部17(生成手段)と、価値基準受付部18(価値基準受付手段)と、順位基準受付部19(順位基準受付手段)と、を備える。また、評価サーバ10の記憶装置410は、記事DB21と、パターンDB22(パターン記憶手段)と、出現回数DB23(出現回数記憶手段)と、評価基準DB24と、を備える。
[Function configuration]
FIG. 3 is a diagram illustrating a functional configuration of the evaluation server 10 according to the present embodiment. The control unit 300 of the evaluation server 10 includes an article pattern generation unit 11, an article reception unit 12, an article pattern classification unit 13 (classification unit), a phrase extraction unit 14 (extraction unit), and a value evaluation unit 15 (calculation unit). Determination means), attention phrase selection unit 16 (selection unit), title generation unit 17 (generation unit), value standard reception unit 18 (value standard reception unit), and rank reference reception unit 19 (rank standard reception unit). And). The storage device 410 of the evaluation server 10 includes an article DB 21, a pattern DB 22 (pattern storage unit), an appearance count DB 23 (appearance count storage unit), and an evaluation criterion DB 24.

以下、各機能部は、評価サーバ10が備えることとして説明するが、構成はこれには限られない。例えば、複数のサーバに各機能部を分散させてもよい。また、Webサーバ30等、他のサーバと統合されていてもよい。   Hereinafter, each functional unit will be described as being included in the evaluation server 10, but the configuration is not limited thereto. For example, each functional unit may be distributed to a plurality of servers. Moreover, you may integrate with other servers, such as Web server 30. FIG.

記事パターン生成部11は、記事DB21に記憶されている過去の記事データを、評価対象項目の組合せにより正規化し、正規化パターンを生成する。なお、生成方法には、上述の既存技術等が利用できる。これにより、例えば、「交通事故」、「ファイナンス」、「天気予報」、「スポーツ」等、複数の正規化パターンを記憶することができる。   The article pattern generation unit 11 normalizes past article data stored in the article DB 21 with a combination of evaluation target items, and generates a normalized pattern. In addition, the above-mentioned existing technique etc. can be utilized for a production | generation method. Thereby, for example, a plurality of normalization patterns such as “traffic accident”, “finance”, “weather forecast”, “sports”, etc. can be stored.

図4は、本実施形態に係る正規化パターンの一例を示す図である。
この例では、正規化パターン「交通事故1」に含まれる評価対象項目を示している。各記事データは、この評価対象項目と対応付けられる語句を1つ以上有している。この例では、例えば、評価対象項目「当事者−年齢」の語句は「102歳」であり、評価対象項目「捜査内容−職業」の語句は「プロ野球選手」である。
FIG. 4 is a diagram illustrating an example of a normalization pattern according to the present embodiment.
In this example, the evaluation target items included in the normalization pattern “traffic accident 1” are shown. Each article data has one or more words / phrases associated with the evaluation target item. In this example, for example, the phrase of the evaluation target item “party-age” is “102 years old”, and the phrase of the evaluation target item “search content—profession” is “professional baseball player”.

記事受付部12は、評価対象記事の入力を受け付ける。なお、この評価対象記事は、新たな記事としてコンテンツサーバ20から受信するものとして説明するが、これには限られない。例えば、記事DB21から選択されてもよい。   The article receiving unit 12 receives an input of an evaluation target article. In addition, although this evaluation object article is demonstrated as what is received from the content server 20 as a new article, it is not restricted to this. For example, you may select from article DB21.

記事パターン分類部13は、記事受付部12により受け付けた評価対象記事を、正規化パターンのいずれかに分類する。具体的には、評価対象記事をパターンDB22と照合し、一致または類似する度合いが最も高い正規化パターンに分類する。   The article pattern classification unit 13 classifies the evaluation target article received by the article reception unit 12 into one of the normalization patterns. Specifically, the evaluation target article is collated with the pattern DB 22 and classified into a normalized pattern having the highest degree of matching or similarity.

語句抽出部14は、記事パターン分類部13により分類された正規化パターンに含まれる評価対象項目のそれぞれに対して、対応する評価対象記事中の語句を抽出する。   The phrase extraction unit 14 extracts a phrase in the corresponding evaluation target article for each of the evaluation target items included in the normalized pattern classified by the article pattern classification unit 13.

また、語句抽出部14は、図4に示す評価対象項目ごとに、対応する語句の出現回数を統計データとして出現回数DB23に記憶する。このとき、統計データの対象とする記事は、記事DB21に記憶されている過去の記事も含め、予め設定された所定量や所定期間の記事としてよい。   Moreover, the phrase extraction part 14 memorize | stores the frequency | count of appearance of a corresponding phrase as statistical data in appearance frequency DB23 for every evaluation object item shown in FIG. At this time, the article that is the target of statistical data may be an article of a predetermined amount or a predetermined period that is set in advance, including past articles stored in the article DB 21.

図5は、本実施形態に係る出現回数DB23に記憶される統計データの一例を示す図である。この例では、評価対象項目を「年齢」とし、横軸に出現回数、縦軸に語句(年齢の数字)の数をグラフで示している。   FIG. 5 is a diagram illustrating an example of statistical data stored in the appearance count DB 23 according to the present embodiment. In this example, the evaluation target item is “age”, the number of appearances is plotted on the horizontal axis, and the number of phrases (age numbers) is plotted on the vertical axis.

統計データでは、評価対象項目のそれぞれについて、出現回数が同一の語句の数が、この出現回数と関連付けられている。例えば、年齢が「2歳」および「101歳」は、統計の対象とされた記事の中でそれぞれ1回だけ出現したので、出現回数が「1回」として記録され、出現回数が「1回」である語句の数は「2」となる。同様に、出現回数が「50回」である語句の数は「6」となり、他の出現回数に比べて多くなっている。   In the statistical data, the number of words having the same appearance number is associated with the number of appearances for each of the evaluation target items. For example, the ages “2 years old” and “101 years old” each appear only once in the articles targeted for statistics, so the number of appearances is recorded as “1 time”, and the number of appearances is “1 time”. The number of phrases “” is “2”. Similarly, the number of words with the number of appearances “50” is “6”, which is larger than the number of other appearances.

このように、出現回数ごとに語句の数が積みあげられ、評価対象項目それぞれについて、出現回数の分布が形成される。   In this way, the number of words is accumulated for each number of appearances, and a distribution of the number of appearances is formed for each evaluation target item.

図6は、本実施形態に係る出現回数の分布の一例について、その形状を模式的に示した図である。
この例では、同一の出現回数となる語句の数が少ない部分は、偏差値が平均から大きく離れており、特別な語句である可能性が高い。すなわち、このような特別な語句は、記事を特徴付ける重要度が高い語句であり、さらには、記事の価値も高いと考えられる。
FIG. 6 is a diagram schematically showing the shape of an example of the appearance frequency distribution according to the present embodiment.
In this example, a portion with a small number of words / phrases having the same number of appearances has a large deviation value from the average and is likely to be a special word / phrase. That is, such a special word / phrase is a word / phrase with high importance that characterizes the article, and further, the value of the article is considered high.

なお、出現回数の分布の形状は、評価対象項目ごとに異なるが、出現回数の偏差値を指標として、語句の重要度を相対的に判断することができる。すなわち、偏差値が平均から大きく離れている出現回数の付近は、語句の数が少なく、これらの語句の重要度が高いと考えられる。   The shape of the distribution of the number of appearances differs for each evaluation target item, but the importance of the phrase can be relatively determined using the deviation value of the number of appearances as an index. That is, in the vicinity of the number of appearances where the deviation value is far from the average, the number of phrases is small, and the importance of these phrases is considered high.

価値評価部15は、語句抽出部14により抽出された語句について、出現回数DB23および評価基準DB24を参照して、語句の重要度を算出する。さらに、価値評価部15は、複数の語句の重要度を総合し、評価対象記事全体の価値を示す評価値を算出する。具体的には、語句の重要度に対して平均や合計等、所定の統計処理を行って評価値を算出する。   The value evaluation unit 15 refers to the appearance count DB 23 and the evaluation criterion DB 24 for the phrase extracted by the phrase extraction unit 14 and calculates the importance of the phrase. Further, the value evaluation unit 15 combines the importance levels of a plurality of words and calculates an evaluation value indicating the value of the entire evaluation target article. Specifically, the evaluation value is calculated by performing predetermined statistical processing such as averaging and summing on the importance of the phrase.

ここで、評価基準DB24は、出現回数DB23により得られる語句の出現回数の偏差値に対して、この語句の重要度を規定したDBである。   Here, the evaluation criterion DB 24 is a DB that defines the importance of the word with respect to the deviation value of the number of appearances of the word obtained by the appearance number DB 23.

図7は、本実施形態に係る評価基準DB24に記憶される価値基準テーブルの一例を示す図である。
この例では、評価対象項目ごとに偏差値と重要度とを関連付けて記憶している。具体的には、偏差値が平均(偏差値=50)よりも小さいほど、あるいは平均よりも大きいほど、語句の重要度を高く設定している。これにより、出現回数が通常と大きく異なる語句の重要度を高め、評価対象記事の価値の評価へ反映させることができる。
FIG. 7 is a diagram illustrating an example of the value criterion table stored in the evaluation criterion DB 24 according to the present embodiment.
In this example, the deviation value and the importance are stored in association with each evaluation target item. Specifically, the importance of the word is set higher as the deviation value is smaller than the average (deviation value = 50) or larger than the average. As a result, the importance of words with a frequency of appearance that is significantly different from the usual can be increased and reflected in the evaluation of the value of the evaluation target article.

なお、偏差値と重要度との関係は、これには限られず、出現回数の分布形状に応じて、適宜設定することとしてよい。   Note that the relationship between the deviation value and the importance is not limited to this, and may be appropriately set according to the distribution shape of the number of appearances.

注目語句選択部16は、語句抽出部14により抽出された語句のうち、重要度が相対的に高い語句を選択する。このとき、所定量、例えば所定の文字数以内で重要度の上位から選択することとする。   The attention phrase selecting unit 16 selects a phrase having a relatively high importance from the phrases extracted by the phrase extracting unit 14. At this time, it is assumed that selection is made from the highest importance within a predetermined amount, for example, a predetermined number of characters.

タイトル生成部17は、注目語句選択部16により選択された重要度の高い語句で構成されるタイトルデータを生成する。具体的には、タイトルデータは、重要度の高い順に区切り文字(例えば、空白)で連結させたものでよい。このとき、注目語句選択部16により所定量の語句が抽出されるので、文字数等の制限がある場合に、効率的にタイトルデータを生成することができる。   The title generation unit 17 generates title data including words with high importance selected by the attention word / phrase selection unit 16. Specifically, the title data may be concatenated with delimiters (for example, blanks) in descending order of importance. At this time, since a predetermined amount of words / phrases are extracted by the attention word / phrase selector 16, title data can be generated efficiently when there is a restriction on the number of characters or the like.

価値基準受付部18は、評価サーバ10の管理者より、価値基準の入力を受け付け、評価基準DB24に記憶する。価値基準は、上述の偏差値と重要度とを関連付けた価値基準テーブル(図7)の他、評価対象項目ごとに異なる重み付け、評価対象記事の取得元ごとに異なる重み付け、正規化パターンごとに異なる重み付け等を含んでよい。価値基準受付部18は、これらの重み付けの入力を受け付けて記憶しておくことにより、価値評価部15により算出される語句の重要度および評価対象記事の価値を柔軟に調整し、高価値となる記事の種類を適宜設定することができる。   The value criterion receiving unit 18 receives an input of a value criterion from the administrator of the evaluation server 10 and stores it in the evaluation criterion DB 24. In addition to the above-described value standard table (FIG. 7) in which the deviation value and the importance are associated, the value standard is different for each evaluation target item, different weights for each acquisition source of the evaluation target article, and is different for each normalization pattern. Weighting etc. may be included. The value reference receiving unit 18 receives and stores these weighted inputs, thereby flexibly adjusting the importance of the word and the value of the article to be evaluated calculated by the value evaluating unit 15 to become high value. Article types can be set as appropriate.

順位基準受付部19は、評価サーバ10の管理者より、順位基準の入力を受け付け、評価基準DB24に記憶する。順位基準は、評価対象項目に対応する複数の語句の優先順位を規定するものである。複数の評価対象記事の評価値が等しい場合に、価値評価部15は、この順位基準に基づいて優先順位を判断する。   The ranking reference receiving unit 19 receives an input of ranking criteria from the administrator of the evaluation server 10 and stores it in the evaluation criteria DB 24. The rank criterion specifies the priority of a plurality of words / phrases corresponding to the evaluation target item. When the evaluation values of the plurality of articles to be evaluated are equal, the value evaluation unit 15 determines the priority order based on the rank criterion.

[処理フロー]
図8は、本実施形態に係る評価サーバ10における制御部300の処理例を示すフローチャートである。この例では、制御部300は、複数の評価対象記事の中から、価値の高い記事を選択して提示する。なお、パターンDB22の正規化パターンと、出現回数DB23の統計データ、さらに評価基準DBの価値基準および順位基準は既に生成されているものとする。
[Processing flow]
FIG. 8 is a flowchart illustrating a processing example of the control unit 300 in the evaluation server 10 according to the present embodiment. In this example, the control unit 300 selects and presents a high-value article from among a plurality of evaluation target articles. It is assumed that the normalization pattern of the pattern DB 22, the statistical data of the appearance count DB 23, and the value criterion and rank criterion of the evaluation criterion DB have already been generated.

ステップS1では、制御部300は、評価対象記事の入力を受け付ける。ここでは、複数の評価対象記事を受け付け、後続の処理にてユーザ端末40へ提示すべき記事を選別する。   In step S <b> 1, the control unit 300 receives an input of an evaluation target article. Here, a plurality of articles to be evaluated are received, and articles to be presented to the user terminal 40 are selected in subsequent processing.

ステップS2では、制御部300は、ステップS1で受け付けた評価対象記事の1つを、パターンDB22に記憶されている正規化パターンのいずれかに分類する。   In step S2, the control unit 300 classifies one of the evaluation target articles received in step S1 as one of the normalized patterns stored in the pattern DB 22.

ステップS3では、制御部300は、ステップS2で分類された正規化パターンに含まれる評価対象項目について、対応する語句を評価対象記事から抽出する。   In step S3, the control unit 300 extracts a corresponding phrase from the evaluation target article for the evaluation target items included in the normalization pattern classified in step S2.

ステップS4では、制御部300は、ステップS3で抽出された語句について、出現回数DB23に記憶された統計データを参照し、出現回数の偏差値を算出する。さらに、制御部300は、評価基準DB24に記憶されている価値基準を参照し、この語句の重要度を算出する。   In step S4, the control unit 300 refers to statistical data stored in the appearance count DB 23 for the phrase extracted in step S3, and calculates a deviation value of the appearance count. Further, the control unit 300 refers to the value standard stored in the evaluation standard DB 24 and calculates the importance of the word / phrase.

ステップS5では、制御部300は、ステップS4で算出された語句の重要度について、評価基準DB24に記憶されている価値基準に基づいて、さらに重み付けを行い、評価対象記事全体の総合点として、評価値を算出する。   In step S5, the control unit 300 further weights the importance of the phrase calculated in step S4 based on the value criterion stored in the evaluation criterion DB 24, and evaluates it as an overall score of the entire evaluation target article. Calculate the value.

ステップS6では、制御部300は、次の評価対象記事があるか否か、すなわちステップS1で受け付けた評価対象記事のうち評価値を算出していないものが存在するか否かを判定する。この判定がYESの場合はステップS7に移り、判定がNOの場合はステップS2に戻って次の評価対象記事について処理を継続する。   In step S6, the control unit 300 determines whether there is a next evaluation target article, that is, whether there is an evaluation target article that has not been calculated in the evaluation target article received in step S1. If this determination is YES, the process proceeds to step S7, and if the determination is NO, the process returns to step S2 to continue the process for the next evaluation target article.

ステップS7では、制御部300は、ステップS1で受け付けた評価対象記事のうち、ステップS5で算出した評価値が上位である所定数の記事を選択する。なお、評価値が所定値に満たない記事を対象外としてもよい。この場合、選択される記事は所定数よりも少なくなるが、価値の低い記事が選択されるのを抑制することができる。   In step S7, the control unit 300 selects a predetermined number of articles whose evaluation values calculated in step S5 are higher than the evaluation target articles received in step S1. Note that articles whose evaluation value is less than the predetermined value may be excluded. In this case, the number of articles to be selected is less than a predetermined number, but it is possible to suppress the selection of articles with low value.

ステップS8では、制御部300は、ステップS7で選択された記事を評価値の高い順に順位付けする。このとき、評価値が互いに等しい記事がある場合には、評価基準DB24に記憶されている順位基準に基づいて、より重要な語句を含む記事の順位を上げる。   In step S8, the control unit 300 ranks the articles selected in step S7 in descending order of evaluation value. At this time, if there are articles having the same evaluation value, the rank of articles including more important words is raised based on the rank criterion stored in the evaluation criterion DB 24.

ステップS9では、制御部300は、ステップS7で選択された記事に関して、タイトルデータに用いるための注目語句を選択する。具体的には、重み付けされた後の語句の重要度が高い順に所定量の語句を選択する。   In step S9, the control unit 300 selects a word / phrase to be used for title data for the article selected in step S7. Specifically, a predetermined amount of phrases are selected in descending order of importance of the weighted phrases.

ステップS10では、制御部300は、ステップS9で選択された語句を連結し、記事のタイトルデータを生成する。制御部300は、このタイトルデータと共に記事データをWebサーバ30へ提供する。これにより、Webサーバ30にて管理されるWebページへアクセスしたユーザ端末40にて、価値の高い記事がタイトルと共に表示される。   In step S10, the control unit 300 connects the phrases selected in step S9 to generate article title data. The control unit 300 provides the article data together with the title data to the Web server 30. Thereby, the high-value article is displayed together with the title on the user terminal 40 that has accessed the Web page managed by the Web server 30.

以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。   As mentioned above, although embodiment of this invention was described, this invention is not restricted to embodiment mentioned above. The effects described in the embodiments of the present invention are only the most preferable effects resulting from the present invention, and the effects of the present invention are limited to those described in the embodiments of the present invention. is not.

10 評価サーバ
11 記事パターン生成部
12 記事受付部
13 記事パターン分類部
14 語句抽出部
15 価値評価部
16 注目語句選択部
17 タイトル生成部
18 価値基準受付部
19 順位基準受付部
20 コンテンツサーバ
21 記事DB
22 パターンDB
23 出現回数DB
24 評価基準DB
30 Webサーバ
40 ユーザ端末
300 制御部
410 記憶装置
DESCRIPTION OF SYMBOLS 10 Evaluation server 11 Article pattern production | generation part 12 Article reception part 13 Article pattern classification | category part 14 Phrase extraction part 15 Value evaluation part 16 Attention phrase selection part 17 Title generation part 18 Value reference | standard reception part 19 Ranking reference | standard reception part 20 Content server 21 Article DB
22 Pattern DB
23 Appearance count DB
24 Evaluation DB
30 Web server 40 User terminal 300 Control unit 410 Storage device

Claims (10)

記事の価値を評価する装置であって、
過去の記事に含まれる項目の組合せを含んで構成する正規化された1以上の正規化パターンを記憶するパターン記憶手段と、
評価対象記事および前記過去の記事を、前記パターン記憶手段が記憶した正規化パターンのいずれかに分類する分類手段と、
前記分類手段により分類された正規化パターンに含まれる1以上の項目に対応する、当該評価対象記事中および前記過去の記事中の語句を抽出する抽出手段と、
前記抽出手段により抽出された語句のそれぞれについて、前記評価対象記事および前記過去の記事の中の出現回数と関連付けた統計データを記憶する出現回数記憶手段と、
前記出現回数記憶手段により記憶された統計データにおいて、当該評価対象記事に含まれる語句の前記出現回数の偏差に基づいて、前記評価対象記事の価値を示す評価値を算出する算出手段と、を備える装置。
An apparatus for evaluating the value of an article,
Pattern storage means for storing one or more normalized patterns that include a combination of items included in past articles;
Classification means for classifying the article to be evaluated and the past article into any of the normalized patterns stored by the pattern storage means;
Extraction means for extracting words in the evaluation target article and the past article corresponding to one or more items included in the normalized pattern classified by the classification means;
For each of the phrases extracted by the extraction means, an appearance count storage means for storing statistical data associated with the appearance count in the evaluation target article and the past article;
In the statistical data stored by the appearance count storage means, a calculation means for calculating an evaluation value indicating the value of the evaluation target article based on a deviation of the appearance count of the words included in the evaluation target article. apparatus.
前記出現回数の偏差に対する語句の重要度を規定する価値基準の入力を受け付ける価値基準受付手段をさらに備え、
前記算出手段は、前記評価対象記事に含まれる前記項目ごとの語句の重要度を総合して前記評価値を算出することを特徴とする請求項1に記載の装置。
A value criterion accepting unit that accepts an input of a value criterion that defines the importance of the phrase with respect to the deviation of the number of appearances;
The apparatus according to claim 1, wherein the calculation unit calculates the evaluation value by combining the importance of words for each item included in the evaluation target article.
前記評価対象記事に含まれる前記項目ごとの語句の重要度を互いに比較し、当該重要度が相対的に高い語句を選択する選択手段と、
前記選択手段により選択された語句からなるタイトルデータを生成する生成手段と、をさらに備える請求項2に記載の装置。
Selection means for comparing the importance of words for each item included in the article to be evaluated, and for selecting words with relatively high importance;
The apparatus according to claim 2, further comprising: generation means for generating title data composed of words selected by the selection means.
前記選択手段は、予め設定されている所定量の語句を選択し、
前記生成手段は、前記選択手段により選択された語句を、前記重要度の高い順に並べることにより前記タイトルデータを生成することを特徴とする請求項3に記載の装置。
The selecting means selects a predetermined amount of words / phrases set in advance,
The apparatus according to claim 3, wherein the generation unit generates the title data by arranging words selected by the selection unit in order of the importance.
前記価値基準受付手段は、前記価値基準として、前記項目ごとに異なる前記重要度の重み付けの入力を受け付けることを特徴とする請求項2から請求項4のいずれかに記載の装置。   The apparatus according to any one of claims 2 to 4, wherein the value criterion accepting unit accepts an input of weighting of the importance level that is different for each item as the value criterion. 前記価値基準受付手段は、前記価値基準として、前記評価対象記事の取得元ごとに異なる前記重要度の重み付けの入力を受け付けることを特徴とする請求項2から請求項5のいずれかに記載の装置。   6. The apparatus according to claim 2, wherein the value criterion accepting unit accepts, as the value criterion, an input of the weighting of the importance level that is different for each acquisition source of the evaluation target article. . 前記価値基準受付手段は、前記価値基準として、前記正規化パターンごとに異なる前記重要度の重み付けの入力を受け付けることを特徴とする請求項2から請求項6のいずれかに記載の装置。   The apparatus according to any one of claims 2 to 6, wherein the value criterion accepting unit accepts an input of the weight of the importance level that is different for each normalization pattern as the value criterion. 同一の前記項目に対応する複数の語句の優先順位を規定する順位基準の入力を受け付ける順位基準受付手段と、
前記順位基準に基づいて、前記評価値が等しい複数の記事の順位を判断する判断手段と、をさらに備える請求項1から請求項7のいずれかに記載の装置。
A rank reference receiving means for receiving an input of a rank reference that defines the priority of a plurality of words corresponding to the same item;
The apparatus according to claim 1, further comprising: a determination unit that determines the ranks of a plurality of articles having the same evaluation value based on the rank criterion.
記事の価値をコンピュータが評価する方法であって、
過去の記事に含まれる項目の組合せを含んで構成する正規化された1以上の正規化パターンを記憶するパターン記憶ステップと、
評価対象記事および前記過去の記事を、前記パターン記憶ステップにより記憶した正規化パターンのいずれかに分類する分類ステップと、
前記分類ステップにより分類された正規化パターンに含まれる1以上の項目に対応する、当該評価対象記事中および前記過去の記事中の語句を抽出する抽出ステップと、
前記抽出ステップにより抽出された語句のそれぞれについて、前記評価対象記事および前記過去の記事の中の出現回数と関連付けた統計データを記憶する出現回数記憶ステップと、
前記出現回数記憶ステップにより記憶された統計データにおいて、前記評価対象記事に含まれる語句の前記出現回数の偏差に基づいて、当該評価対象記事の価値を示す評価値を算出する算出ステップと、を含む方法。
A method by which a computer evaluates the value of an article,
A pattern storage step of storing one or more normalized patterns that are configured to include combinations of items included in past articles;
A classification step of classifying the article to be evaluated and the past article into any of the normalized patterns stored in the pattern storage step;
An extraction step of extracting words in the evaluation target article and the past article corresponding to one or more items included in the normalized pattern classified by the classification step;
For each of the phrases extracted in the extraction step, an appearance count storage step for storing statistical data associated with the appearance count in the evaluation target article and the past article;
In the statistical data stored in the appearance count storage step, a calculation step of calculating an evaluation value indicating the value of the evaluation target article based on a deviation of the appearance count of the words included in the evaluation target article is included. Method.
請求項9に記載の方法をコンピュータに実行させるプログラム。   The program which makes a computer perform the method of Claim 9.
JP2009139590A 2009-06-10 2009-06-10 Apparatus, method, and program for evaluating article value Active JP4921523B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009139590A JP4921523B2 (en) 2009-06-10 2009-06-10 Apparatus, method, and program for evaluating article value

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009139590A JP4921523B2 (en) 2009-06-10 2009-06-10 Apparatus, method, and program for evaluating article value

Publications (2)

Publication Number Publication Date
JP2010286997A true JP2010286997A (en) 2010-12-24
JP4921523B2 JP4921523B2 (en) 2012-04-25

Family

ID=43542654

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009139590A Active JP4921523B2 (en) 2009-06-10 2009-06-10 Apparatus, method, and program for evaluating article value

Country Status (1)

Country Link
JP (1) JP4921523B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018081394A (en) * 2016-11-15 2018-05-24 ヤフー株式会社 Information processing apparatus, information processing method, and program
WO2022269994A1 (en) * 2021-06-22 2022-12-29 シャープ株式会社 Information assessment device, information assessment method, and program

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259666A (en) * 1999-03-11 2000-09-22 Nippon Hoso Kyokai <Nhk> Topic extraction device
JP2001331529A (en) * 2000-03-17 2001-11-30 Fujitsu Ltd Device and method for presenting news information
JP2002108916A (en) * 2000-10-02 2002-04-12 Nippon Hoso Kyokai <Nhk> Device for extracting titles of topics of news and device for applying indexes of manuscripts of news
JP2002334106A (en) * 2001-05-11 2002-11-22 Fujitsu Ltd Device, method, program for extracting topic and recording medium to record the same program
JP2003141134A (en) * 2001-11-07 2003-05-16 Hitachi Ltd Text mining processing method and device for implementing the same
JP2004258723A (en) * 2003-02-24 2004-09-16 Nippon Telegr & Teleph Corp <Ntt> Topic extraction device, topic extraction method and program
JP2006338086A (en) * 2005-05-31 2006-12-14 Nomura Research Institute Ltd Topic scale management device

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259666A (en) * 1999-03-11 2000-09-22 Nippon Hoso Kyokai <Nhk> Topic extraction device
JP2001331529A (en) * 2000-03-17 2001-11-30 Fujitsu Ltd Device and method for presenting news information
JP2002108916A (en) * 2000-10-02 2002-04-12 Nippon Hoso Kyokai <Nhk> Device for extracting titles of topics of news and device for applying indexes of manuscripts of news
JP2002334106A (en) * 2001-05-11 2002-11-22 Fujitsu Ltd Device, method, program for extracting topic and recording medium to record the same program
JP2003141134A (en) * 2001-11-07 2003-05-16 Hitachi Ltd Text mining processing method and device for implementing the same
JP2004258723A (en) * 2003-02-24 2004-09-16 Nippon Telegr & Teleph Corp <Ntt> Topic extraction device, topic extraction method and program
JP2006338086A (en) * 2005-05-31 2006-12-14 Nomura Research Institute Ltd Topic scale management device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018081394A (en) * 2016-11-15 2018-05-24 ヤフー株式会社 Information processing apparatus, information processing method, and program
WO2022269994A1 (en) * 2021-06-22 2022-12-29 シャープ株式会社 Information assessment device, information assessment method, and program

Also Published As

Publication number Publication date
JP4921523B2 (en) 2012-04-25

Similar Documents

Publication Publication Date Title
US8145623B1 (en) Query ranking based on query clustering and categorization
US7711735B2 (en) User segment suggestion for online advertising
US20190114668A1 (en) Application recommendation method and server
JP5329900B2 (en) Digital information disclosure method in target area
US9152722B2 (en) Augmenting online content with additional content relevant to user interest
CN106708817B (en) Information searching method and device
US9031944B2 (en) System and method for providing multi-core and multi-level topical organization in social indexes
US10152478B2 (en) Apparatus, system and method for string disambiguation and entity ranking
US20150019951A1 (en) Method, apparatus, and computer storage medium for automatically adding tags to document
US20230177360A1 (en) Surfacing unique facts for entities
US20100082628A1 (en) Classifying A Data Item With Respect To A Hierarchy Of Categories
JP2010055159A (en) Information retrieval device, information retrieval method, and program
JP6056610B2 (en) Text information processing apparatus, text information processing method, and text information processing program
CN113934941A (en) User recommendation system and method based on multi-dimensional information
JP5281104B2 (en) Advertisement management apparatus, advertisement selection apparatus, advertisement management method, advertisement management program, and recording medium recording advertisement management program
JP2012243033A (en) Information processor, information processing method, and program
CN112579854A (en) Information processing method, device, equipment and storage medium
JP4921523B2 (en) Apparatus, method, and program for evaluating article value
JP4869292B2 (en) Server, method, and program for recommending search keywords
US20130332275A1 (en) Advertisement management device, advertisement selection device, advertisement management method, advertisement management program and storage medium storing advertisement management program
JP6260678B2 (en) Information processing apparatus, information processing method, and information processing program
KR101758555B1 (en) Method and system for extracting topic expression
JP5942981B2 (en) Summary creation device, summary creation method, and program
JP2011100191A (en) Device, method, and program for retrieving document
JP2010055164A (en) Sentence retrieval device, sentence retrieval method, sentence retrieval program and its storage medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120202

R150 Certificate of patent or registration of utility model

Ref document number: 4921523

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150210

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350