JP2001134582A - Estimating device for genre of topic of news and topic presenting device for individual - Google Patents

Estimating device for genre of topic of news and topic presenting device for individual

Info

Publication number
JP2001134582A
JP2001134582A JP31271699A JP31271699A JP2001134582A JP 2001134582 A JP2001134582 A JP 2001134582A JP 31271699 A JP31271699 A JP 31271699A JP 31271699 A JP31271699 A JP 31271699A JP 2001134582 A JP2001134582 A JP 2001134582A
Authority
JP
Japan
Prior art keywords
genre
topic
news
contribution
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP31271699A
Other languages
Japanese (ja)
Inventor
Ichiro Yamada
一郎 山田
Enbai Kin
淵培 金
Masahiro Shibata
正啓 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP31271699A priority Critical patent/JP2001134582A/en
Publication of JP2001134582A publication Critical patent/JP2001134582A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a estimating device for genre of topic of news which accurately estimate how much a topic of news is concerned in plural genres and a topic presenting device for an individual which can effectively present the topic of news so that it matches the taste of the individual. SOLUTION: According to information obtained from words included in a news original constituting a topic, how much the topic of the news is concerned in plural genres is estimated (3(3a, 3b)).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、ニュース話題が属
するジャンルを推定するニュース話題ジャンル推定装置
及びニュース話題を個人の嗜好に合うように提示する個
人用話題提示装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a news topic genre estimating apparatus for estimating a genre to which a news topic belongs, and a personal topic presenting apparatus for presenting a news topic in accordance with personal preference.

【0002】[発明の概要]本発明は、ニュースに含ま
れる情報と個人嗜好情報とを利用した情報分類・検索に
関するものである。即ち、本発明は、話題を構成するニ
ュース原稿に含まれる単語から得られる情報を利用する
ことにより、ニュースの話題が複数のジャンル(例え
ば、政治・経済・社会・国際・スポーツの5つのジャン
ル)に属する割合を推定する。その推定結果と政治・経
済・社会・国際・スポーツの5つのジャンルで入力され
る個人の嗜好とを利用して、ニュースの話題を個人の嗜
好に合うように効果的に提示するようにしたものであ
る。
[Summary of the Invention] The present invention relates to information classification and retrieval using information included in news and personal preference information. That is, the present invention uses information obtained from words included in news manuscripts constituting a topic, so that the topic of the news is divided into a plurality of genres (for example, five genres of politics, economy, society, international, and sports). Is estimated. Using the estimation results and personal preferences input in the five genres of politics, economy, society, international and sports, news topics are presented effectively to match personal preferences. It is.

【0003】[0003]

【従来の技術】ニュース話題のジャンル分類では、従
来、既存のどのジャンルに属しているかを一意に決定す
る手法が提案されている。
2. Description of the Related Art In the category of news topics, conventionally, a method for uniquely determining which genre the user belongs to has been proposed.

【0004】また、個人用のテレビ番組選択手法では、
従来、手動で検索対象となるデータにジャンルやキーワ
ードを付加し、その付加したジャンルやキーワードと個
人嗜好情報に含まれるキーワードとのパターンマッチに
より、個人用ニュースを選択する手法が提案されてい
る。この手法では、個人の嗜好情報とのマッチングは、
完全一致によるパターンマッチングが用いられる。
[0004] In a personal TV program selection method,
Conventionally, a method has been proposed in which a genre or keyword is manually added to data to be searched, and personal news is selected by pattern matching between the added genre or keyword and a keyword included in personal preference information. In this method, matching with personal preference information
Pattern matching by perfect matching is used.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、ニュー
ス話題のジャンル分類をニュースが既存のどのジャンル
に属しているかを一意に決定する従来の手法で行う場
合、実際のニュースは複数のジャンルに属することがあ
るので、そのニュース話題がどれくらいの割合で、ある
ジャンルに関わりを持っているかを的確に表現すること
が難しいという問題がある。
However, when the genre of a news topic is classified by a conventional method of uniquely determining to which genre the news belongs, the actual news may belong to a plurality of genres. There is a problem in that it is difficult to accurately express how much of the news topic is related to a certain genre.

【0006】また、従来提案されている個人用のテレビ
番組選択手法では、各番組にキーワードやジャンルを手
動で付加しなければならなず、操作が煩雑である。加え
て、個人の嗜好情報とのマッチングは、完全一致による
パターンマッチングに依っているので、番組選択の優先
順位を明確に表現できない。したがって、従来の手法に
よる個人用ニュース話題の提示では、個人の嗜好に合う
ような提示が困難である。
[0006] Further, in the conventionally proposed personal television program selection method, a keyword or genre must be manually added to each program, and the operation is complicated. In addition, since matching with personal preference information is based on pattern matching based on perfect matching, the priority of program selection cannot be clearly expressed. Therefore, it is difficult to present a personal news topic by a conventional method so as to match personal preferences.

【0007】本発明は上記事情に鑑みてなされたもの
で、ニュース話題が複数のジャンルにどれくらい関わっ
ているかを的確に推定できるニュース話題ジャンル推定
装置を提供することを目的としている。
The present invention has been made in view of the above circumstances, and has as its object to provide a news topic genre estimating apparatus capable of accurately estimating how much a news topic relates to a plurality of genres.

【0008】また、ニュースの話題を個人の嗜好に合う
ように効果的に提示できる個人用話題提示装置を提供す
ることを目的としている。
It is another object of the present invention to provide a personal topic presenting apparatus capable of effectively presenting news topics in accordance with personal preferences.

【0009】[0009]

【課題を解決するための手段】上記目的を達成するため
に本発明は、請求項1のニュース話題ジャンル推定装置
では、話題を構成するニュース原稿に含まれる単語の複
数ジャンルへの寄与度を算出する出現単語のジャンル別
寄与度計算手段と、前記算出された単語別ジャンル寄与
度とニュース原稿から抽出された話題とに基づき、ニュ
ースの話題が前記複数のジャンルのどれに属するかを抽
出するジャンル抽出手段とを備えることを特徴としてい
る。
In order to achieve the above object, according to the present invention, a news topic genre estimating apparatus according to claim 1 calculates a contribution degree of a word included in a news manuscript constituting a topic to a plurality of genres. A genre for extracting to which of the plurality of genres a news topic belongs based on the genre contribution calculating means for each of the appearing words and the calculated genre contribution for each word and the topics extracted from the news manuscript. Extraction means.

【0010】請求項2では、請求項1に記載のニュース
話題ジャンル推定装置において、前記出現単語のジャン
ル別寄与度計算手段は、話題を構成するニュース原稿に
含まれる単語から出現頻度が所定回数以上の単語を抽出
する手段と、前記抽出された単語についてジャンル別の
寄与度を算出する手段とを備えることを特徴としてい
る。
According to a second aspect of the present invention, in the news topic genre estimating apparatus according to the first aspect, the genre-specific contribution calculating means for the appearing word, the appearance frequency of the word included in the news manuscript constituting the topic is a predetermined number of times or more. And a means for calculating the genre-related contribution of the extracted words.

【0011】請求項3では、請求項2に記載のニュース
話題ジャンル推定装置において、前記ニュース話題のジ
ャンル抽出手段は、前記ニュース原稿から抽出された話
題からその話題を表現するデータの要素となる単語を抽
出する手段と、前記抽出した単語の中から前記出現単語
のジャンル別寄与度計算手段でジャンル別寄与度が算出
された単語を選択する手段と、前記選択された単語のジ
ャンル別寄与度を用いて話題のジャンル別得点を算出す
る手段と、前記算出された話題のジャンル別得点を用い
て話題のジャンル別の寄与度を算出する手段とを備える
ことを特徴としている。
According to a third aspect of the present invention, in the news topic genre estimating apparatus according to the second aspect, the news topic genre extracting means includes a word serving as an element of data expressing the topic from a topic extracted from the news manuscript. Means for extracting the words for which the genre contributions are calculated by the genre contribution calculation means for the appearing words from the extracted words, and genre contributions for the selected words. And a means for calculating a topic-specific genre score by using the calculated topic-specific genre score.

【0012】かかる請求項1乃至3に記載の発明によれ
ば、ニュース話題のジャンルを的確に表現するために、
属するジャンルを一意に決めることは行わず、話題を構
成するニュース原稿に含まれる単語から得られる情報を
利用することにより、ニュースの話題が複数のジャンル
(例えば、政治・経済・社会・国際・スポーツの5つの
ジャンル)にどれくらい関わっているかが推定される。
According to the present invention, in order to accurately represent a genre of a news topic,
The genre to which the news belongs is not determined uniquely, and information obtained from words included in the news manuscript constituting the topic is used, so that the topic of the news is divided into a plurality of genres (for example, politics, economy, society, international, sports) The five genres are estimated.

【0013】請求項4では、請求項1乃至3の何れかに
記載のニュース話題ジャンル推定装置と、個人の嗜好を
複数のジャンル毎に入力する個人嗜好入力インタフェー
スと、前記ニュース話題ジャンル推定装置で得られたジ
ャンル推定結果と、前記個人嗜好入力インタフェースの
入力情報とに基づきニュースの話題を個人の嗜好に合う
ように提示する個人用ニュース話題提示手段とを備える
ことを特徴としている。
According to a fourth aspect of the present invention, there is provided the news topic genre estimating apparatus according to any one of the first to third aspects, an individual preference input interface for inputting personal preferences for each of a plurality of genres, and the news topic genre estimating apparatus. It is characterized by comprising personal news topic presenting means for presenting a news topic so as to match personal preferences based on the obtained genre estimation result and the input information of the personal preference input interface.

【0014】かかる請求項4に記載の発明によれば、個
人嗜好入力インタフェースを利用して個人の嗜好を、例
えば政治・経済・社会・国際・スポーツの5つのジャン
ルで入力し、この個人情報と話題のジャンル推定結果と
を利用することにより、ニュースの話題が個人の嗜好に
合うように効果的に提示される。
According to the fourth aspect of the present invention, personal preferences are input using, for example, five genres of politics, economy, society, international and sports using the personal preference input interface, and the personal information and By using the topic genre estimation result, a news topic can be effectively presented so as to match personal preferences.

【0015】[0015]

【発明の実施の形態】図1は、本発明の実施形態に係る
ニュース話題ジャンル推定装置及び個人用話題提示装置
の構成ブロック図である。
FIG. 1 is a block diagram showing a configuration of a news topic genre estimating apparatus and a personal topic presenting apparatus according to an embodiment of the present invention.

【0016】図1において、本実施形態の個人用話題提
示装置1は、電子化されたニュース原稿が入力され、そ
れに含まれる記事を似た項目に分類して話題を抽出する
ニュース話題抽出部2と、過去のニュース原稿とニュー
ス話題抽出部2の出力(特定期間内の話題(話題の重心
ベクトル))とを受けて、話題が複数のジャンル(例え
ば政治・経済・社会・国際・スポーツの5つのジャン
ル)にどれくらい関わっているかを、一つの話題を形成
するニュース群を時期ごとに変化する重要度で重み付け
された単語を利用して推定するニュース話題のジャンル
抽出部3と、視聴者個人の嗜好を、例えば政治・経済・
社会・国際・スポーツの5つのジャンルで入力する個人
嗜好入力インタフェース4(図8参照)と、ニュース話
題のジャンル推定の結果と、個人嗜好入力インターフェ
ース4から入力された個人の嗜好とを利用して、ニュー
スの話題を個人の嗜好に合うように効果的に提示する個
人用ニュース話題提示部5とを備える。
In FIG. 1, a personalized topic presenting apparatus 1 of this embodiment receives a digitized news manuscript, classifies articles included therein into similar items, and extracts a topic by extracting a topic. And the past news manuscript and the output of the news topic extraction unit 2 (topics within a specific period (topic center of gravity vector)), the topic is divided into a plurality of genres (for example, five categories of politics, economy, society, international, and sports). A news topic genre extraction unit 3 for estimating the degree of involvement in each news genre using a word weighted by a degree of importance that changes with time, and Tastes, such as politics, economy,
Using the personal preference input interface 4 (see FIG. 8) for inputting in five genres of social, international, and sports, the result of the genre estimation of the news topic, and the personal preference input from the personal preference input interface 4 And a personalized news topic presenting unit 5 that effectively presents news topics so as to match personal preferences.

【0017】また、実施形態のニュース話題ジャンル推
定装置3は、過去のニュース原稿に含まれる単語毎にジ
ャンル別寄与度を算出する出現単語のジャンル別寄与度
計算部3aと、出現単語のジャンル別寄与度計算部3a
が出力する単語別ジャンル寄与度と特定期間の話題(重
心ベクトル)とを利用してニュース話題のジャンルを抽
出するニュース話題のジャンル抽出部3bとを備える。
The news topic genre estimating apparatus 3 of the embodiment includes a genre-specific contribution calculator 3a for calculating a genre-specific contribution for each word included in a past news manuscript; Contribution calculator 3a
And a news topic genre extraction unit 3b that extracts a news topic genre using the word-based genre contribution degree output by the term and a topic (center-of-gravity vector) in a specific period.

【0018】以下、本実施形態のニュース話題ジャンル
推定装置及び個人用話題提示装置の動作を図1〜図10
を参照して説明する。なお、図2は、話題の抽出例であ
る。図3は、ニュース話題抽出部で得られた重心ベクト
ルの例である。図4は、出現単語のジャンル別寄与度計
算処理のフローチャートである。図5は、ニュース話題
のジャンル抽出処理のフローチャートである。図6は、
話題の各ジャンルへの寄与度の出力結果の例である。図
7は、ニュース話題「北朝鮮・朝鮮民主主義人民共和国
のミサイル発射」の各ジャンルへの寄与度の従来法との
比較結果である。図8は、個人嗜好入力インタフェース
の例である。図9、図10は、個人用ニュース話題提示
の結果の例である。
Hereinafter, the operation of the news topic genre estimating apparatus and the personal topic presenting apparatus of the present embodiment will be described with reference to FIGS.
This will be described with reference to FIG. FIG. 2 is an example of topic extraction. FIG. 3 is an example of a centroid vector obtained by the news topic extraction unit. FIG. 4 is a flowchart of a genre-based contribution calculation process for appearing words. FIG. 5 is a flowchart of the news topic genre extraction process. FIG.
It is an example of the output result of the contribution to each genre of a topic. FIG. 7 shows a comparison result of the contribution degree of each news topic “missile launches of North Korea and the Democratic People's Republic of Korea” to each genre, compared with the conventional method. FIG. 8 is an example of the personal preference input interface. FIG. 9 and FIG. 10 are examples of results of personal news topic presentation.

【0019】まず、ニュース話題抽出部2により、ニュ
ースの話題を抽出する。即ち、ニュース話題抽出部2
は、入力する電子化されたニュース原稿から、そのニュ
ース原稿に含まれる単語の例えば月単位の重要度Weight
(W)を次の式(1)によって求め、それに基づきニュー
ス原稿に含まれる記事を似た項目に分類し、話題を抽出
する。
First, a news topic extraction unit 2 extracts a news topic. That is, the news topic extraction unit 2
Is the weight of the words contained in the news manuscript, for example, the monthly importance Weight
(W) is obtained by the following equation (1), and articles included in the news manuscript are classified into similar items based on the equation (1), and topics are extracted.

【0020】[0020]

【数1】 (Equation 1)

【0021】なお、式(1)おいて、nは、単語Wがあ
る月に出現した頻度、eは、期待値である。また、N
は、対象月のニュース原稿の総数、df(W)は、その中の
単語Wが出現する原稿の数である。
In the equation (1), n is the frequency at which the word W appears in a certain month, and e is the expected value. Also, N
Is the total number of news manuscripts in the target month, and df (W) is the number of manuscripts in which the word W appears.

【0022】この抽出された特定期間の話題がその話題
の重心ベクトルとともにニュースのジャンル推定装置3
に対し出力される。話題の抽出例を示す図2では、19
98年9月における8つの話題を示してあるが、その中
の「北朝鮮・朝鮮民主主義人民共和国のミサイル発射」
という話題の重心ベクトルの例を図3に示してある。
The extracted topic in a specific period is a news genre estimating device 3 together with the center of gravity vector of the topic.
Is output to In FIG. 2 showing an example of topic extraction, 19
Eight topics in September 1998 are shown, including "Missile launches of North Korea and the Democratic People's Republic of Korea."
FIG. 3 shows an example of the centroid vector of the topic.

【0023】そして、ニュースのジャンル推定装置3で
は、このように抽出された話題が、1つのジャンルでは
なく複数のジャンルにどれくらい関わっているかを、時
期ごとに変化する重要度で重み付けされた単語を利用し
て推定する。ここでは、複数のジャンルとして、例え
ば、政治・経済・社会・国際・スポーツの5つのジャン
ルを取り上げる。
The news genre estimating apparatus 3 determines how much the topic extracted in this way relates to a plurality of genres, not a single genre. Use and estimate. Here, for example, five genres of politics, economy, society, international, and sports are taken as a plurality of genres.

【0024】この推定処理では、複数のジャンルにどれ
くらいの割合で属しているかを数値で抽出している。そ
のため、出現単語のジャンル別寄与度計算部3aで単語
別ジャンル寄与度を求め、この単語別ジャンル寄与度を
利用してニュース話題のジャンル抽出部3bで話題のジ
ャンルを決定するようにしてある。
In this estimating process, a numerical value is extracted as to how much the genre belongs to a plurality of genres. Therefore, the genre contribution of each word is calculated by the genre contribution calculation unit 3a of the appearing word, and the topic genre is determined by the news topic genre extraction unit 3b using the genre contribution of each word.

【0025】出現単語のジャンル別寄与度計算部3aで
は、図4に示す手順で単語別ジャンル寄与度を求め、単
語テーブルを生成する。図4において、過去のニュース
原稿から単語を抽出するが(ステップST1)、過去に
生成されたニュース原稿には、そのニュースを作成した
部署名(政治部・経済部・社会部・国際部・スポーツ
部)の情報が付いている。ここでは、1997年1年間
のニュース原稿を学習データとし、出現頻度が一定回以
上(例えば20回以上)である全ての単語に対して(ス
テップST2)、どの部署が作成したニュースにどれく
らいの割合で含まれるかを次の式(2)により計算し
(ステップST3)、単語テーブルに登録する(ステッ
プST4)。
The genre contribution calculating section 3a of the appearing word obtains the genre contribution by word according to the procedure shown in FIG. 4 and generates a word table. In FIG. 4, words are extracted from past news manuscripts (step ST1), and the news manuscripts generated in the past are identified by the name of the department that created the news (political, economic, social, international, sports). Department) information. Here, a news manuscript for one year in 1997 is used as learning data, and for every word whose appearance frequency is a certain number of times or more (for example, 20 times or more) (step ST2), Is calculated by the following equation (2) (step ST3) and registered in the word table (step ST4).

【0026】単語wが各ジャンルにどれくらい寄与して
いるかを表す単語のジャンル別寄与度は、ある単語wが
「政治」に出現した頻度をr1、「経済」に出現した頻度
をr2、「社会」に出現した頻度をr3、「国際」に出現し
た頻度をr4、「スポーツ」に出現した頻度をr5とする
と、
The genre contribution of words indicating how much the word w contributes to each genre is represented by r1 as the frequency at which a word w appears in "politics", r2 as the frequency at which a word w appears in "economy", , The frequency of occurrences in "international" is r4, and the frequency of occurrences in "sports" is r5.

【0027】[0027]

【数2】 寄与度(w,政治)=r1/(rl+r2+r3+r4+r5) 寄与度(w、経済)=r2/(rl+r2+r3+r4+r5) 寄与度(w、社会)=r3/(rl+r2+r3+r4+r5) 寄与度(w、国際)=r4/(rl+r2+r3+r4+r5) 寄与度(w、スポーツ)=r5/(rl+r2+r3+r4+r5) ・・・・(2) とする。## EQU2 ## Contribution (w, politics) = r1 / (rl + r2 + r3 + r4 + r5) Contribution (w, economy) = r2 / (rl + r2 + r3 + r4 + r5) Contribution (w, society) = r3 / (rl + r2 + r3 + r4 + r5) Contribution (w, international) = R4 / (rl + r2 + r3 + r4 + r5) Contribution (w, sports) = r5 / (rl + r2 + r3 + r4 + r5) (2)

【0028】この処理により、1997年のニュース原
稿に出現した単語の出現頻度が一定回以上の全ての単語
毎にジャンル別寄与度が計算でき、単語毎にジャンル別
寄与度が登録された単語テーブルを完成できる(ステッ
プST5、ステップST6)。
By this processing, the genre-based contribution can be calculated for every word in which the frequency of appearance of the word that appeared in the 1997 news manuscript is equal to or more than a certain number of times, and the genre-based contribution is registered for each word. Can be completed (step ST5, step ST6).

【0029】次いで、ニュース話題のジャンル抽出部3
bでは、この1997年のニュース原稿において出現頻
度がある一定回以上(例えば20回以上)の単語のジャ
ンル別寄与度を利用して、ニュース話題抽出部2で得ら
れた話題に対して、図5に示す手順で各ジャンルヘの寄
与度を計算する。
Next, a news topic genre extraction unit 3
In FIG. 2B, a topic obtained by the news topic extraction unit 2 is used for the topic obtained by the news topic extraction unit 2 by using the genre-based contribution degree of a certain number of times or more (for example, 20 times or more) in the 1997 news manuscript. The degree of contribution to each genre is calculated by the procedure shown in FIG.

【0030】図5において、ニュース話題抽出部2から
特定期間の話題を取得し(ステップST11)、その話
題を構成する重心ベクトルの要素となる単語を抽出する
(ステップST12、図3参照)。
In FIG. 5, a topic for a specific period is acquired from the news topic extraction unit 2 (step ST11), and words which are elements of a center-of-gravity vector constituting the topic are extracted (step ST12, see FIG. 3).

【0031】そして、抽出した「重心ベクトルの要素と
なる単語」が上記単語テーブルに存在する場合には(ス
テップST13:Yes)、その単語のジャンル別寄与
度 寄与度(Wi、政治)、寄与度(Wi、経済)、寄与度
(Wi、社会)、寄与度(Wi、国際)、寄与度(W
i、スポーツ) を次の式(3)に適用し、話題の政治、経済、社会、国
際、スポーツに対する得点Trl、Tr2、Tr3、Tr4、Tr5を
計算する(ステップST14)。なお、式(3)は、一
つの話題Tの重心ベクトルの要素となる単語をwl〜Wnと
して定義したものである。
If the extracted "word as an element of the center-of-gravity vector" exists in the word table (step ST13: Yes), the genre contribution degree (Wi, politics), contribution degree of the word (Wi, economy), contribution (Wi, society), contribution (Wi, international), contribution (W
i, sports) is applied to the following equation (3) to calculate scores Trl, Tr2, Tr3, Tr4, Tr5 for topics of politics, economy, society, international and sports (step ST14). Equation (3) defines words that are elements of the barycenter vector of one topic T as wl to Wn.

【0032】[0032]

【数3】 (Equation 3)

【0033】全ての重心ベクトルの要素となる単語につ
いて、式(3)によるジャンル別得点の算出処理を終え
ると(ステップST15:Yes)、そのジャンル別得
点Trl、Tr2、Tr3、Tr4、Tr5を次の式(4)に適用し
て、話題Tの政治、経済、社会、国際、スポーツに対す
る寄与度Tを算出する。
When the process of calculating the genre-based scores by the equation (3) is completed for all the words that are the elements of the center-of-gravity vector (step ST15: Yes), the genre-based scores Trl, Tr2, Tr3, Tr4, and Tr5 are set as follows. The contribution T of the topic T to the politics, economy, society, international, and sports is calculated by applying the formula (4).

【0034】[0034]

【数4】 寄与度(T,政治)=Trl/(Tr1+Tr2+Tr3+Tr4+Tr5) 寄与度(T,経済)=Tr2/(Tr1+Tr2+Tr3+Tr4+Tr5) 寄与度(T、社会)=Tr3/(Tr1+Tr2+Tr3+TI4+Tr5) 寄与度(T,国際)=Tr4/(Tr1+Tr2+Tr3+Tr4+Tr5) 寄与度(T,スポーツ)=Tr5/(Trl+Tr2+Tr3十Tr4+Tr5) ・・・・・・(4)[Equation 4] Contribution (T, politics) = Trl / (Tr1 + Tr2 + Tr3 + Tr4 + Tr5) Contribution (T, economy) = Tr2 / (Tr1 + Tr2 + Tr3 + Tr4 + Tr5) Contribution (T, society) = Tr3 / (Tr1 + Tr2 + Tr3 + TI4 + Tr5) Contribution (T, international) = Tr4 / (Tr1 + Tr2 + Tr3 + Tr4 + Tr5) Contribution (T, sports) = Tr5 / (Trl + Tr2 + Tr3 + Tr4 + Tr5) (4)

【0035】図6は、図2に示した1998年9月にお
ける話題の各ジャンルヘの寄与度の出力結果の例であ
る。また、図7は、その中の5番目の話題「北朝鮮・朝
鮮民主主義人民共和国のミサイル発射」について従来法
と比較した結果である。
FIG. 6 is an example of an output result of the contribution of each topic to each genre in September 1998 shown in FIG. FIG. 7 shows a result of comparing the fifth topic “missile launching of North Korea and the Democratic People's Republic of Korea” with the conventional method.

【0036】従来法では、一つのニュースに含まれる単
語が過去の学習データにより各ジャンルヘどのくらい属
しているかを計算し、その合計の割合でジャンルを推定
している。したがって、図7(b)に示すように、全く
関連のない「スポーツ」や「経済」にも属しており、的
確にジャンルを推定するのが困難である。
In the conventional method, how much a word included in one news belongs to each genre is calculated based on past learning data, and the genre is estimated by the total ratio. Therefore, as shown in FIG. 7B, it belongs to "sports" and "economics" which have no relation at all, and it is difficult to accurately estimate the genre.

【0037】それに対し、図7(a)に示すように、本
実施形態による手法では、「スポーツ」、「経済」に属
する割合は従来手法と比べて低く、的確な度合いで「政
治」、「経済」、「国際」、「社会」に属する割合を推
定できる。このように、本実施形態による手法では、従
来の手法に比べ、的確にジャンルを推定できることがわ
かる。
On the other hand, as shown in FIG. 7A, in the method according to the present embodiment, the ratios belonging to “sports” and “economy” are lower than those of the conventional method, and “politics” and “ You can estimate the percentages belonging to "economy", "international" and "society". Thus, it can be seen that the genre can be more accurately estimated by the method according to the present embodiment than by the conventional method.

【0038】次に、個人嗜好入力インタフェース4にて
視聴者個人の嗜好の入力を行う。個人の嗜好は、例えば
政治・経済・社会・国際・スポーツの5つのジャンルで
入力する。嗜好を、例えば、0から100までの数値で
入力する。図8では、5つのジャンルの嗜好をそれぞれ
値30と入力した場合の各ジャンルの割合が示されてい
る。
Next, the personal preference input interface 4 is used to input personal preferences of the viewer. Personal preferences are input in five genres, for example, politics, economy, society, international, and sports. The preference is input as a numerical value from 0 to 100, for example. FIG. 8 shows the ratio of each genre when the preference of each of the five genres is input as a value of 30.

【0039】そして、個人用ニュース話題提示部5で
は、この入力された個人の嗜好と、ニュース話題のジャ
ンル抽出部3bが抽出したジャンルを利用して、個人の
嗜好に合ったニュースの検索を行う。
The personal news topic presenting section 5 searches for news that matches the personal preferences by using the input personal preferences and the genre extracted by the news topic genre extraction section 3b. .

【0040】まず、個人Aの嗜好に対する話題Tに付け
る点数Score(A,T)を、次の式(5)に従って求め
る。式(5)において、値polは、政治に対する個人A
の嗜好の値である。値ecoは、経済に対する個人Aの嗜
好の値である。値socは、社会に対する個人Aの嗜好の
値である。値intは、国際に対する個人Aの嗜好の値で
ある。値spoは、スポーツに対する個人Aの嗜好の値で
ある。
First, a score Score (A, T) assigned to the topic T for the taste of the individual A is obtained according to the following equation (5). In equation (5), the value pol is the individual A for politics.
Is the value of the preference. The value eco is a value of the individual A's preference for the economy. The value soc is a value of individual A's preference for society. The value int is a value of the preference of the individual A for the international. The value spo is a value of personal A's preference for sports.

【0041】[0041]

【数5】 (Equation 5)

【0042】なお、式(5)では、個人の嗜好を強調す
るため2乗した値を使っているが、話題の重要度を強調
するときは、例えば次の式(6)とする。式(6)の例
えば対数関数(log)をとることにより、さらに話題の
重要度を強調できる。
In equation (5), the squared value is used in order to emphasize individual preference, but when emphasizing the importance of a topic, the following equation (6) is used, for example. By taking, for example, a logarithmic function (log) of equation (6), the importance of the topic can be further emphasized.

【0043】[0043]

【数6】 (Equation 6)

【0044】式(5)や式(6)の値が大きい話題か
ら、個人の嗜好に合った話題と判断できる。図9と図1
0には、式(5)により計算した個人用ニュース話題提
示の結果を示してある。
A topic having a large value in the equations (5) and (6) can be determined to be a topic suited to individual tastes. 9 and 1
0 shows the result of personal news topic presentation calculated by equation (5).

【0045】図9では、視聴者Aの嗜好のジャンルは、
国際に大きな値が付けられているので、外国の話題が主
に提示されることが示されている。また、図10では、
視聴者Bの嗜好のジャンルは、スポーツと社会に大きな
値が付けられているので、国内のスポーツと社会の話題
が主に提示されることが示されている。
In FIG. 9, the genre of the taste of the viewer A is
It is shown that international topics are mainly presented because of the high international prices. Also, in FIG.
Since the genre of the taste of the viewer B is given a large value for sports and society, it is shown that topics of domestic sports and society are mainly presented.

【0046】なお、以上説明した実施形態では、ジャン
ルとして、政治・経済・社会・国際・スポーツの5つの
ジャンルを取り上げたが、本発明はこれに限定されない
ことは言うまでもなく、ジャンルの数・範囲は任意であ
る。
In the embodiment described above, five genres of politics, economy, society, international and sports are taken as genres, but it is needless to say that the present invention is not limited to these, and the number and range of genres are not limited to these. Is optional.

【0047】[0047]

【発明の効果】以上から明らかなように、請求項1乃至
3に記載の発明によれば、話題を構成するニュース原稿
に含まれる単語から得られる情報を利用することによ
り、ニュースの話題が複数のジャンルにどれくらい関わ
っているかを推定することが可能となる。
As is clear from the above, according to the first to third aspects of the present invention, a plurality of news topics are obtained by utilizing information obtained from words included in a news manuscript constituting a topic. It is possible to estimate how much the genre is involved.

【0048】また、請求項4に記載の発明によれば、個
人嗜好入力インタフェースを利用して個人の嗜好を複数
のジャンルに数値で入力し、この個人情報と話題のジャ
ンル推定結果とを利用することにより、ニュースの話題
が個人の嗜好に合うように効果的に提示することが可能
となる。
According to the fourth aspect of the present invention, a personal preference is input into a plurality of genres by using the personal preference input interface, and the personal information and the topic genre estimation result are used. Thereby, it is possible to effectively present the topic of the news so as to match the personal preference.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実勢形態に係るニュース話題ジャンル
推定装置及び個人用話題提示装置の構成ブロック図であ
る。
FIG. 1 is a configuration block diagram of a news topic genre estimation device and a personal topic presentation device according to a prevailing mode of the present invention.

【図2】話題の抽出例を示す説明図である。FIG. 2 is an explanatory diagram illustrating an example of topic extraction.

【図3】ニュース話題抽出部で得られた重心ベクトルを
例示する説明図である。
FIG. 3 is an explanatory diagram illustrating a center-of-gravity vector obtained by a news topic extraction unit.

【図4】出現単語のジャンル別寄与度計算処理のフロー
チャートである。
FIG. 4 is a flowchart of a genre-based contribution calculation process for appearing words.

【図5】ニュース話題のジャンル抽出処理のフローチャ
ートである。
FIG. 5 is a flowchart of a news topic genre extraction process.

【図6】話題の各ジャンルへの寄与度の出力結果を例示
する説明図である。
FIG. 6 is an explanatory diagram illustrating an output result of a degree of contribution to each genre of a topic;

【図7】ニュース話題「北朝鮮・朝鮮民主主義人民共和
国のミサイル発射」の各ジャンルへの寄与度の従来法と
の比較結果を示す説明図である。
FIG. 7 is an explanatory diagram showing a comparison result of the contribution degree to the respective genres of the news topic “missile launches of North Korea and the Democratic People's Republic of Korea” with the conventional method.

【図8】個人嗜好入力インタフェースを例示する説明図
である。
FIG. 8 is an explanatory diagram illustrating a personal preference input interface.

【図9】個人用ニュース話題提示の結果を例示する説明
図である。
FIG. 9 is an explanatory diagram exemplifying a result of personal news topic presentation.

【図10】個人用ニュース話題提示の結果を例示する説
明図である。
FIG. 10 is an explanatory diagram exemplifying a result of personal news topic presentation.

【符号の説明】[Explanation of symbols]

1 個人用話題提示装置 2 ニュース話題抽出部 3 ニュース話題のジャンル抽出部 3a 出現単語のジャンル別寄与度計算部 3b ニュース話題のジャンル抽出部 4 個人嗜好入力インタフェース 5 個人用ニュース話題提示部 1 Personal Topic Presentation Device 2 News Topic Extraction Unit 3 News Topic Genre Extraction Unit 3a Contribution Calculation Unit for Appearance Words by Genre 3b News Topic Genre Extraction Unit 4 Personal Preference Input Interface 5 Personal News Topic Presentation Unit

─────────────────────────────────────────────────────
────────────────────────────────────────────────── ───

【手続補正書】[Procedure amendment]

【提出日】平成11年11月11日(1999.11.
11)
[Submission date] November 11, 1999 (1999.11.
11)

【手続補正1】[Procedure amendment 1]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0037[Correction target item name] 0037

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【0037】それに対し、図7(a)に示すように、本
実施形態による手法では、「スポーツ」、「経済」に属
する割合は従来手法と比べて低く、的確な度合いで「政
治」、「国際」、「社会」に属する割合を推定できる。
このように、本実施形態による手法では、従来の手法に
比べ、的確にジャンルを推定できることがわかる。
On the other hand, as shown in FIG. 7A, in the method according to the present embodiment, the ratios belonging to “sports” and “economy” are lower than those of the conventional method, and “politics” and “ It can estimate the ratio of "international" and "society".
Thus, it can be seen that the genre can be more accurately estimated by the method according to the present embodiment than by the conventional method.

フロントページの続き (72)発明者 柴田 正啓 東京都世田谷区砧一丁目10番11号 日本放 送協会放送技術研究所内 Fターム(参考) 5B075 ND03 NR12 PR04 Continuation of the front page (72) Inventor Masahiro Shibata F-term (Reference) 5B075 ND03 NR12 PR04 in the Japan Broadcasting Corporation Broadcasting Research Institute, 1-10-11 Kinuta, Setagaya-ku, Tokyo

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 話題を構成するニュース原稿に含まれる
単語の複数ジャンルへの寄与度を算出する出現単語のジ
ャンル別寄与度計算手段と、 前記算出された単語別ジャンル寄与度とニュース原稿か
ら抽出された話題とに基づき、ニュースの話題が前記複
数のジャンルのどれに属するかを抽出するジャンル抽出
手段と、 を備えることを特徴とするニュース話題ジャンル推定装
置。
1. A genre-contribution calculating unit that calculates the contribution of a word included in a news manuscript constituting a topic to a plurality of genres, and an extracted word-based genre contribution and extraction from the news manuscript. A news topic genre estimating apparatus, comprising: genre extracting means for extracting which of the plurality of genres the news topic belongs to, based on the performed topic.
【請求項2】 請求項1に記載のニュース話題ジャンル
推定装置において、 前記出現単語のジャンル別寄与度計算手段は、 話題を構成するニュース原稿に含まれる単語から出現頻
度が所定回数以上の単語を抽出する手段と、 前記抽出された単語についてジャンル別の寄与度を算出
する手段と、 を備えることを特徴とするニュース話題ジャンル推定装
置。
2. The news topic genre estimating apparatus according to claim 1, wherein the genre-specific contribution calculating means for the appearing words includes words whose appearance frequency is equal to or more than a predetermined number of times from words included in news manuscripts constituting the topic. A news topic genre estimating apparatus, comprising: means for extracting; and means for calculating a degree of contribution of each genre for the extracted word.
【請求項3】 請求項2に記載のニュース話題ジャンル
推定装置において、 前記ニュース話題のジャンル抽出手段は、 前記ニュース原稿から抽出された話題からその話題を表
現するデータの要素となる単語を抽出する手段と、 前記抽出した単語の中から前記出現単語のジャンル別寄
与度計算手段でジャンル別寄与度が算出された単語を選
択する手段と、 前記選択された単語のジャンル別寄与度を用いて話題の
ジャンル別得点を算出する手段と、 前記算出された話題のジャンル別得点を用いて話題のジ
ャンル別の寄与度を算出する手段と、 を備えることを特徴とするニュース話題ジャンル推定装
置。
3. The news topic genre estimating apparatus according to claim 2, wherein the news topic genre extracting means extracts words which are elements of data expressing the topic from the topics extracted from the news manuscript. Means for selecting words whose genre contributions are calculated by the genre contribution calculation means for the appearing words from the extracted words; and topics using the genre contributions of the selected words. A news topic genre estimating apparatus, comprising: means for calculating a genre score for each topic; and means for calculating a contribution rate for each genre of the topic using the calculated score for each topic genre.
【請求項4】 請求項1乃至3の何れかに記載のニュー
ス話題ジャンル推定装置と、 個人の嗜好を複数のジャンル毎に入力する個人嗜好入力
インタフェースと、 前記ニュース話題ジャンル推定装置で得られたジャンル
推定結果と、前記個人嗜好入力インタフェースの入力情
報とに基づきニュースの話題を個人の嗜好に合うように
提示する個人用ニュース話題提示手段と、 を備えることを特徴とする個人用話題提示装置。
4. A news topic genre estimating apparatus according to claim 1, a personal preference input interface for inputting personal preferences for each of a plurality of genres, and a news topic genre estimating apparatus. Personal news topic presenting means for presenting a news topic so as to match personal preferences based on a genre estimation result and input information of the personal preference input interface.
JP31271699A 1999-11-02 1999-11-02 Estimating device for genre of topic of news and topic presenting device for individual Pending JP2001134582A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31271699A JP2001134582A (en) 1999-11-02 1999-11-02 Estimating device for genre of topic of news and topic presenting device for individual

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31271699A JP2001134582A (en) 1999-11-02 1999-11-02 Estimating device for genre of topic of news and topic presenting device for individual

Publications (1)

Publication Number Publication Date
JP2001134582A true JP2001134582A (en) 2001-05-18

Family

ID=18032572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31271699A Pending JP2001134582A (en) 1999-11-02 1999-11-02 Estimating device for genre of topic of news and topic presenting device for individual

Country Status (1)

Country Link
JP (1) JP2001134582A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1355241A2 (en) * 2002-04-16 2003-10-22 Microsoft Corporation Media content descriptions
EP1357746A2 (en) * 2002-04-16 2003-10-29 Microsoft Corporation Describing media content in terms of degrees
JP2007535048A (en) * 2004-04-28 2007-11-29 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Method and apparatus for information reproduction
JP2008243127A (en) * 2007-03-29 2008-10-09 Chuden Cti Co Ltd Input information analyzing device
US7617511B2 (en) 2002-05-31 2009-11-10 Microsoft Corporation Entering programming preferences while browsing an electronic programming guide
US7836466B2 (en) 2002-06-06 2010-11-16 Microsoft Corporation Methods and systems for generating electronic program guides

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7363649B2 (en) 2002-04-16 2008-04-22 Microsoft Corporation Media content descriptions
EP1357746A2 (en) * 2002-04-16 2003-10-29 Microsoft Corporation Describing media content in terms of degrees
EP1357746A3 (en) * 2002-04-16 2005-02-02 Microsoft Corporation Describing media content in terms of degrees
EP1355241A3 (en) * 2002-04-16 2005-02-09 Microsoft Corporation Media content descriptions
US7073193B2 (en) 2002-04-16 2006-07-04 Microsoft Corporation Media content descriptions
EP1355241A2 (en) * 2002-04-16 2003-10-22 Microsoft Corporation Media content descriptions
US7467164B2 (en) 2002-04-16 2008-12-16 Microsoft Corporation Media content descriptions
US7640563B2 (en) 2002-04-16 2009-12-29 Microsoft Corporation Describing media content in terms of degrees
US7617511B2 (en) 2002-05-31 2009-11-10 Microsoft Corporation Entering programming preferences while browsing an electronic programming guide
US7836466B2 (en) 2002-06-06 2010-11-16 Microsoft Corporation Methods and systems for generating electronic program guides
US7885971B2 (en) 2002-06-06 2011-02-08 Microsoft Corporation Methods and systems for generating electronic program guides
JP2007535048A (en) * 2004-04-28 2007-11-29 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Method and apparatus for information reproduction
JP2008243127A (en) * 2007-03-29 2008-10-09 Chuden Cti Co Ltd Input information analyzing device

Similar Documents

Publication Publication Date Title
CN109408665B (en) Information recommendation method and device and storage medium
US10255353B2 (en) Individualized detailed program recommendations with active updating of viewer preferences
JP2800769B2 (en) Information filtering method
CN102360358B (en) keyword recommendation method and system
US7483885B2 (en) System and method for query refinement to enable improved searching based on identifying and utilizing popular concepts related to users' queries
US6446083B1 (en) System and method for classifying media items
US9384233B2 (en) Product synthesis from multiple sources
JP4008954B2 (en) Information retrieval device
WO1999063458A1 (en) Experience favorite information providing system
JP2009104450A (en) Product recommendation system based on web chat observation
JP2002014964A (en) Information providing system and method
US6760730B1 (en) Receiving device
JP2008210010A (en) Content delivery method and system
JP2950222B2 (en) Information retrieval method
JP2004362019A (en) Information recommendation device, information recommendation method, information recommendation program and recording medium
JP2001134582A (en) Estimating device for genre of topic of news and topic presenting device for individual
JP4900915B2 (en) Content delivery method and apparatus
JP2004272355A (en) Information presentation method, information presentation system, and information presentation processing program
JP2006094018A (en) Program recommending apparatus, program recommending method, program, and recoding medium with the program recorded
JPH10228482A (en) Taste estimating method, information extracting method and information supplying method
JP2000285127A (en) System and method for providing information
JPH08335265A (en) Document processor and its method
JP2003223406A (en) Method, device and program for providing topic information, and recording medium wherein the program is stored
US20050234975A1 (en) Related content linking managing system, method and recording medium
JP3547338B2 (en) Information retrieval method and device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080701

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081028