JP2001134582A - Estimating device for genre of topic of news and topic presenting device for individual - Google Patents

Estimating device for genre of topic of news and topic presenting device for individual

Info

Publication number
JP2001134582A
JP2001134582A JP31271699A JP31271699A JP2001134582A JP 2001134582 A JP2001134582 A JP 2001134582A JP 31271699 A JP31271699 A JP 31271699A JP 31271699 A JP31271699 A JP 31271699A JP 2001134582 A JP2001134582 A JP 2001134582A
Authority
JP
Japan
Prior art keywords
genre
news
topic
contribution
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP31271699A
Other languages
Japanese (ja)
Inventor
Enbai Kin
Masahiro Shibata
Ichiro Yamada
一郎 山田
正啓 柴田
淵培 金
Original Assignee
Nippon Hoso Kyokai <Nhk>
日本放送協会
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai <Nhk>, 日本放送協会 filed Critical Nippon Hoso Kyokai <Nhk>
Priority to JP31271699A priority Critical patent/JP2001134582A/en
Publication of JP2001134582A publication Critical patent/JP2001134582A/en
Application status is Pending legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To provide a estimating device for genre of topic of news which accurately estimate how much a topic of news is concerned in plural genres and a topic presenting device for an individual which can effectively present the topic of news so that it matches the taste of the individual.
SOLUTION: According to information obtained from words included in a news original constituting a topic, how much the topic of the news is concerned in plural genres is estimated (3(3a, 3b)).
COPYRIGHT: (C)2001,JPO

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【発明の属する技術分野】本発明は、ニュース話題が属するジャンルを推定するニュース話題ジャンル推定装置及びニュース話題を個人の嗜好に合うように提示する個人用話題提示装置に関する。 The present invention relates to relates to a personal topic presentation device for presenting to suit the preference of the individual news topic genre estimation apparatus and news topic to estimate the genre news topic belongs.

【0002】[発明の概要]本発明は、ニュースに含まれる情報と個人嗜好情報とを利用した情報分類・検索に関するものである。 [0002] SUMMARY OF THE INVENTION The present invention relates to an information classification and search using the information and personal preference information that is included in the news. 即ち、本発明は、話題を構成するニュース原稿に含まれる単語から得られる情報を利用することにより、ニュースの話題が複数のジャンル(例えば、政治・経済・社会・国際・スポーツの5つのジャンル)に属する割合を推定する。 That is, the present invention is, by using the information obtained from the word that is included in the news manuscripts that make up the topic, news topic is multiple genres (for example, five of the genre of political, economic, social and international sports) to estimate the proportion belong to. その推定結果と政治・経済・社会・国際・スポーツの5つのジャンルで入力される個人の嗜好とを利用して、ニュースの話題を個人の嗜好に合うように効果的に提示するようにしたものである。 Using and the estimation results of the individual that is entered in the political, economic, social and international sports five of genre preference, which was to be effectively presented to suit the preference of the individual topics of the news it is.

【0003】 [0003]

【従来の技術】ニュース話題のジャンル分類では、従来、既存のどのジャンルに属しているかを一意に決定する手法が提案されている。 BACKGROUND OF THE INVENTION In a news topic of genre classification, conventional, approach to uniquely determine whether they belong to any existing genre has been proposed.

【0004】また、個人用のテレビ番組選択手法では、 [0004] In addition, in the television program selection method of personal will,
従来、手動で検索対象となるデータにジャンルやキーワードを付加し、その付加したジャンルやキーワードと個人嗜好情報に含まれるキーワードとのパターンマッチにより、個人用ニュースを選択する手法が提案されている。 Conventional, by adding a genre or keyword in the data to be manually searched for, by the pattern match of a keyword that is included in the additional genre or keyword and personal preference information, method of selecting a personal news has been proposed. この手法では、個人の嗜好情報とのマッチングは、 In this technique, matching with the personal preference information,
完全一致によるパターンマッチングが用いられる。 Pattern matching using exact match is used.

【0005】 [0005]

【発明が解決しようとする課題】しかしながら、ニュース話題のジャンル分類をニュースが既存のどのジャンルに属しているかを一意に決定する従来の手法で行う場合、実際のニュースは複数のジャンルに属することがあるので、そのニュース話題がどれくらいの割合で、あるジャンルに関わりを持っているかを的確に表現することが難しいという問題がある。 The object of the invention is to be Solved However, in the case of performing in a conventional manner to uniquely determine whether the news the news topic of genre classification belongs to which of the existing genres, actual news can belong to more than one genre because, at the rate of the news topic is how much, there is a problem that it is difficult to express precisely what have involved in a certain genre.

【0006】また、従来提案されている個人用のテレビ番組選択手法では、各番組にキーワードやジャンルを手動で付加しなければならなず、操作が煩雑である。 [0006] In addition, in the television program selection method for individuals that have been proposed in the past, without such must be added the keyword or genre manually in each program, the operation is complicated. 加えて、個人の嗜好情報とのマッチングは、完全一致によるパターンマッチングに依っているので、番組選択の優先順位を明確に表現できない。 In addition, matching with the personal preference information, since depending on the pattern matching by exact match can not be clearly expressed priority program selection. したがって、従来の手法による個人用ニュース話題の提示では、個人の嗜好に合うような提示が困難である。 Therefore, in the presentation of personal news topic according to the conventional technique, it is difficult to come to fit the preferences of the individual.

【0007】本発明は上記事情に鑑みてなされたもので、ニュース話題が複数のジャンルにどれくらい関わっているかを的確に推定できるニュース話題ジャンル推定装置を提供することを目的としている。 [0007] The present invention has been made in view of the above circumstances, and an object of the present invention to provide a news topic genre estimation device that can accurately estimate the news topic is involved much in multiple genres.

【0008】また、ニュースの話題を個人の嗜好に合うように効果的に提示できる個人用話題提示装置を提供することを目的としている。 [0008] In addition, it has been an object of the present invention to provide a personal topic presentation device that can be effectively presented to suit the preference of the individual topics of the news.

【0009】 [0009]

【課題を解決するための手段】上記目的を達成するために本発明は、請求項1のニュース話題ジャンル推定装置では、話題を構成するニュース原稿に含まれる単語の複数ジャンルへの寄与度を算出する出現単語のジャンル別寄与度計算手段と、前記算出された単語別ジャンル寄与度とニュース原稿から抽出された話題とに基づき、ニュースの話題が前記複数のジャンルのどれに属するかを抽出するジャンル抽出手段とを備えることを特徴としている。 Means for Solving the Problems The present invention to achieve the above object, the news topic genre estimating apparatus according to claim 1, the calculating the contribution to the multiple genres of words included in the news manuscripts constituting the topic genre extracts the genre contribution computing means appearing words, based on the topics extracted from the calculated word genre contribution and news manuscript, or news topics belongs to which of the plurality of genres It is characterized in that it comprises an extraction unit.

【0010】請求項2では、請求項1に記載のニュース話題ジャンル推定装置において、前記出現単語のジャンル別寄与度計算手段は、話題を構成するニュース原稿に含まれる単語から出現頻度が所定回数以上の単語を抽出する手段と、前記抽出された単語についてジャンル別の寄与度を算出する手段とを備えることを特徴としている。 [0010] According to claim 2, in news topics genre estimation device according to claim 1, Genre contribution calculating unit of the occurrence word, frequency from the word contained in the news manuscripts constituting the topic than the predetermined number of times means for extracting words, is characterized by comprising means for calculating the genre contribution for word the extracted.

【0011】請求項3では、請求項2に記載のニュース話題ジャンル推定装置において、前記ニュース話題のジャンル抽出手段は、前記ニュース原稿から抽出された話題からその話題を表現するデータの要素となる単語を抽出する手段と、前記抽出した単語の中から前記出現単語のジャンル別寄与度計算手段でジャンル別寄与度が算出された単語を選択する手段と、前記選択された単語のジャンル別寄与度を用いて話題のジャンル別得点を算出する手段と、前記算出された話題のジャンル別得点を用いて話題のジャンル別の寄与度を算出する手段とを備えることを特徴としている。 [0011] According to claim 3, in news topics genre estimating apparatus according to claim 2, genre extraction means of the news topics, word is an element of data representing the topic from the topics extracted from the news manuscripts means for extracting and means for selecting a word genre contribution is calculated by genre contribution calculating unit of the occurrence word from among the words that the extracted, the genre contribution of words said selected means for calculating a genre score topic used, it is characterized in that it comprises means for calculating the genre contribution topics using genre score of topics the calculated.

【0012】かかる請求項1乃至3に記載の発明によれば、ニュース話題のジャンルを的確に表現するために、 According to the invention described in [0012] accordance claims 1 to 3, in order to accurately represent the genre of news topics,
属するジャンルを一意に決めることは行わず、話題を構成するニュース原稿に含まれる単語から得られる情報を利用することにより、ニュースの話題が複数のジャンル(例えば、政治・経済・社会・国際・スポーツの5つのジャンル)にどれくらい関わっているかが推定される。 It is not carried out to determine the belonging genre uniquely, by using the information obtained from the word that is included in the news manuscripts that make up the topic, news topic is multiple genres (for example, political, economic, social and international sports five of the genre), or you are involved how much of it is estimated.

【0013】請求項4では、請求項1乃至3の何れかに記載のニュース話題ジャンル推定装置と、個人の嗜好を複数のジャンル毎に入力する個人嗜好入力インタフェースと、前記ニュース話題ジャンル推定装置で得られたジャンル推定結果と、前記個人嗜好入力インタフェースの入力情報とに基づきニュースの話題を個人の嗜好に合うように提示する個人用ニュース話題提示手段とを備えることを特徴としている。 [0013] According to claim 4, and news topics genre estimating apparatus according to any one of claims 1 to 3, and personal preference input interface for inputting personal preferences for each of a plurality of genres, in the news topic genre estimator genre estimation result obtained is characterized by comprising a personal news topic presentation means presenting to suit personal preferences topic news based on the input information of said personal preference input interface.

【0014】かかる請求項4に記載の発明によれば、個人嗜好入力インタフェースを利用して個人の嗜好を、例えば政治・経済・社会・国際・スポーツの5つのジャンルで入力し、この個人情報と話題のジャンル推定結果とを利用することにより、ニュースの話題が個人の嗜好に合うように効果的に提示される。 [0014] According to the invention described in such claims 4, the preference of the individual using the personal preference input interface, for example, entered in the political, economic, social and international sports five of the genre, and this personal information by utilizing the topic of the genre estimation results, news of the topic is effectively presented to suit the preference of the individual.

【0015】 [0015]

【発明の実施の形態】図1は、本発明の実施形態に係るニュース話題ジャンル推定装置及び個人用話題提示装置の構成ブロック図である。 Figure 1 DETAILED DESCRIPTION OF THE INVENTION is a block diagram of a news topic genre estimation apparatus and a personal topic presentation device according to an embodiment of the present invention.

【0016】図1において、本実施形態の個人用話題提示装置1は、電子化されたニュース原稿が入力され、それに含まれる記事を似た項目に分類して話題を抽出するニュース話題抽出部2と、過去のニュース原稿とニュース話題抽出部2の出力(特定期間内の話題(話題の重心ベクトル))とを受けて、話題が複数のジャンル(例えば政治・経済・社会・国際・スポーツの5つのジャンル)にどれくらい関わっているかを、一つの話題を形成するニュース群を時期ごとに変化する重要度で重み付けされた単語を利用して推定するニュース話題のジャンル抽出部3と、視聴者個人の嗜好を、例えば政治・経済・ [0016] In FIG. 1, a personal topic presentation device 1 of this embodiment, news manuscript that has been digitized is input, news topic extraction unit 2 for extracting the topic by classifying the items similar articles contained therein When, in response to the (topic within a specific period of time (center of gravity vector of the topic)) past output of news original and the news topic extraction unit 2, topic of multiple genres (for example, political, economic, social and international sports 5 one of the genre), or you are involved how much, and the news topic of the genre extraction unit 3 be estimated by use of the words that have been weighted by importance to change the news group to form one topic for each period, the viewer's personal a preference, for example, political, economic and
社会・国際・スポーツの5つのジャンルで入力する個人嗜好入力インタフェース4(図8参照)と、ニュース話題のジャンル推定の結果と、個人嗜好入力インターフェース4から入力された個人の嗜好とを利用して、ニュースの話題を個人の嗜好に合うように効果的に提示する個人用ニュース話題提示部5とを備える。 Personal preference input interface 4 to enter in five genres of social, international, sports (see FIG. 8), using the result of the news topic of the genre estimation, and the personal input from the personal preferences input interface 4 preferences , and a personal news topic presentation unit 5 to effectively presented to suit the preference of the individual topics of the news.

【0017】また、実施形態のニュース話題ジャンル推定装置3は、過去のニュース原稿に含まれる単語毎にジャンル別寄与度を算出する出現単語のジャンル別寄与度計算部3aと、出現単語のジャンル別寄与度計算部3a Further, the news topic genre estimating apparatus 3 embodiment, a genre contribution calculation portion 3a of the occurrence word calculating the genre contribution for each word included in past news manuscript, genre occurrence word contribution calculation unit 3a
が出力する単語別ジャンル寄与度と特定期間の話題(重心ベクトル)とを利用してニュース話題のジャンルを抽出するニュース話題のジャンル抽出部3bとを備える。 There and a genre extraction portion 3b of the news topics that extracts the genre of news topics using the topic of a specific period and the word genre contribution to output (centroid vector).

【0018】以下、本実施形態のニュース話題ジャンル推定装置及び個人用話題提示装置の動作を図1〜図10 [0018] Hereinafter, the operation of the news topics genre estimation apparatus and a personal topic presentation device of the present embodiment FIGS. 1-10
を参照して説明する。 With reference to the description. なお、図2は、話題の抽出例である。 Incidentally, FIG. 2 is a topic of Extract Example. 図3は、ニュース話題抽出部で得られた重心ベクトルの例である。 Figure 3 is an example of centroid vectors obtained by the news topic extraction unit. 図4は、出現単語のジャンル別寄与度計算処理のフローチャートである。 Figure 4 is a flow chart of a genre contribution calculation process written words. 図5は、ニュース話題のジャンル抽出処理のフローチャートである。 FIG. 5 is a flow chart of the genre extraction process of the news topic. 図6は、 Figure 6,
話題の各ジャンルへの寄与度の出力結果の例である。 It is an example of the output result of the contribution to each genre of the topic. 図7は、ニュース話題「北朝鮮・朝鮮民主主義人民共和国のミサイル発射」の各ジャンルへの寄与度の従来法との比較結果である。 FIG. 7 is a result of comparison with the conventional method of contribution to the genre of news topic "missile launch of North Korea, the Democratic People's Republic of Korea". 図8は、個人嗜好入力インタフェースの例である。 Figure 8 shows an example of personal preference input interface. 図9、図10は、個人用ニュース話題提示の結果の例である。 9, FIG. 10 is an example of the result of personal news topics presented.

【0019】まず、ニュース話題抽出部2により、ニュースの話題を抽出する。 [0019] First, the news topic extraction unit 2, to extract the topic of the news. 即ち、ニュース話題抽出部2 In other words, the news topic extraction unit 2
は、入力する電子化されたニュース原稿から、そのニュース原稿に含まれる単語の例えば月単位の重要度Weight Is, from the news manuscript that has been digitized for input, the importance Weight of, for example, monthly of the words contained in the news manuscripts
(W)を次の式(1)によって求め、それに基づきニュース原稿に含まれる記事を似た項目に分類し、話題を抽出する。 (W) is calculated by the following equation (1), classified in item that resembles an article to be included in the news manuscript on the basis of it, to extract the topic.

【0020】 [0020]

【数1】 [Number 1]

【0021】なお、式(1)おいて、nは、単語Wがある月に出現した頻度、eは、期待値である。 [0021] It should be noted that the formula (1) Oite, n is the frequency with which appeared in the month there is a word W, e is the expected value. また、N In addition, N
は、対象月のニュース原稿の総数、df(W)は、その中の単語Wが出現する原稿の数である。 The total number of news manuscript of the subject month, df (W) is the number of the original word W in its occurrence.

【0022】この抽出された特定期間の話題がその話題の重心ベクトルとともにニュースのジャンル推定装置3 [0022] The topic of this extracted specific period news of the genre estimation device 3 along with the center of gravity vector of the topic
に対し出力される。 It is output to. 話題の抽出例を示す図2では、19 In Figure 2 shows an example of extraction of topic 19
98年9月における8つの話題を示してあるが、その中の「北朝鮮・朝鮮民主主義人民共和国のミサイル発射」 It is shown the eight topic in September 1998, but the "missile launch of North Korea, the Democratic People's Republic of Korea" in the
という話題の重心ベクトルの例を図3に示してある。 It is shown in Figure 3 an example of a gravity center vector of the topic of.

【0023】そして、ニュースのジャンル推定装置3では、このように抽出された話題が、1つのジャンルではなく複数のジャンルにどれくらい関わっているかを、時期ごとに変化する重要度で重み付けされた単語を利用して推定する。 [0023] Then, in the news of the genre estimation device 3, thus extracted topics, one of whether it involved how much to more than one genre rather than a genre, a word that has been weighted by the importance that changes every time It is estimated using. ここでは、複数のジャンルとして、例えば、政治・経済・社会・国際・スポーツの5つのジャンルを取り上げる。 In this case, as multiple genres, for example, take up five of the genre of political, economic, social and international sports.

【0024】この推定処理では、複数のジャンルにどれくらいの割合で属しているかを数値で抽出している。 [0024] In this estimation process, it is extracted they belong at a rate of how much to multiple genres in numerical value. そのため、出現単語のジャンル別寄与度計算部3aで単語別ジャンル寄与度を求め、この単語別ジャンル寄与度を利用してニュース話題のジャンル抽出部3bで話題のジャンルを決定するようにしてある。 Therefore, seeking a word genre contribution by Genre contribution calculation portion 3a of the occurrence word, it is so as to determine the genre of the topic in the genre extraction portion 3b of the news topics using this word genre contribution.

【0025】出現単語のジャンル別寄与度計算部3aでは、図4に示す手順で単語別ジャンル寄与度を求め、単語テーブルを生成する。 [0025] In appearance words Genre contribution calculating unit 3a, determine the word genre contribution in the procedure shown in FIG. 4, to generate a word table. 図4において、過去のニュース原稿から単語を抽出するが(ステップST1)、過去に生成されたニュース原稿には、そのニュースを作成した部署名(政治部・経済部・社会部・国際部・スポーツ部)の情報が付いている。 In FIG. 4, but to extract a word from the past of news manuscript (step ST1), the news manuscript that has been generated in the past, department name that created the news (Political Department, Ministry of Economic Affairs and Social portion and the international section Sports information parts) are marked. ここでは、1997年1年間のニュース原稿を学習データとし、出現頻度が一定回以上(例えば20回以上)である全ての単語に対して(ステップST2)、どの部署が作成したニュースにどれくらいの割合で含まれるかを次の式(2)により計算し(ステップST3)、単語テーブルに登録する(ステップST4)。 Here, the news manuscript of 1997, one year as training data, the proportion of how much the frequency of occurrence is equal to or greater than a predetermined times (for example, more than 20 times) for all of the words that are (step ST2), which department has created news calculated by equation (2) or the following are included in (step ST3), and registers the word table (step ST4).

【0026】単語wが各ジャンルにどれくらい寄与しているかを表す単語のジャンル別寄与度は、ある単語wが「政治」に出現した頻度をr1、「経済」に出現した頻度をr2、「社会」に出現した頻度をr3、「国際」に出現した頻度をr4、「スポーツ」に出現した頻度をr5とすると、 [0026] genre contribution of words indicating whether the word w has contributed much to each genre, the frequency that appeared a word w is in the "politics" r1, the frequency with which appeared in the "economy" r2, "society the frequency with which appeared in the "r3, the frequency with which appeared in the" international "r4, and the r5 the frequency with which appeared in the" sports ",

【0027】 [0027]

【数2】 寄与度(w,政治)=r1/(rl+r2+r3+r4+r5) 寄与度(w、経済)=r2/(rl+r2+r3+r4+r5) 寄与度(w、社会)=r3/(rl+r2+r3+r4+r5) 寄与度(w、国際)=r4/(rl+r2+r3+r4+r5) 寄与度(w、スポーツ)=r5/(rl+r2+r3+r4+r5) ・・・・(2) とする。 [Number 2] contribution (w, politics) = r1 / (rl + r2 + r3 + r4 + r5) contribution (w, economy) = r2 / (rl + r2 + r3 + r4 + r5) contribution (w, society) = r3 / (rl + r2 + r3 + r4 + r5) contribution (w, international) = r4 / (rl + r2 + r3 + r4 + r5) contribution (w, sports) = r5 / (rl + r2 + r3 + r4 + r5) and ... (2).

【0028】この処理により、1997年のニュース原稿に出現した単語の出現頻度が一定回以上の全ての単語毎にジャンル別寄与度が計算でき、単語毎にジャンル別寄与度が登録された単語テーブルを完成できる(ステップST5、ステップST6)。 [0028] By this process, the word table that the frequency of occurrence of words that appeared in the 1997 news document can be calculated by genre contribution to every word of all of more than a certain times, genre-specific contribution to each word has been registered It can be completed (step ST5, step ST6).

【0029】次いで、ニュース話題のジャンル抽出部3 [0029] Then, the genre of news topic extraction unit 3
bでは、この1997年のニュース原稿において出現頻度がある一定回以上(例えば20回以上)の単語のジャンル別寄与度を利用して、ニュース話題抽出部2で得られた話題に対して、図5に示す手順で各ジャンルヘの寄与度を計算する。 In b, by using a predetermined times or more (e.g., more than 20 times) the words Genre contribution of that occurrence frequency in the news manuscript of this 1997, with respect to the topic obtained by the news topic extraction unit 2, FIG. in the procedure shown in 5 to calculate the contribution of each genre f.

【0030】図5において、ニュース話題抽出部2から特定期間の話題を取得し(ステップST11)、その話題を構成する重心ベクトルの要素となる単語を抽出する(ステップST12、図3参照)。 [0030] In FIG. 5, to get the topic of a particular period from the news topic extraction section 2 (step ST11), and extracts the word that is an element of the centroid vectors constituting the topic (see step ST12, Fig. 3).

【0031】そして、抽出した「重心ベクトルの要素となる単語」が上記単語テーブルに存在する場合には(ステップST13:Yes)、その単語のジャンル別寄与度 寄与度(Wi、政治)、寄与度(Wi、経済)、寄与度(Wi、社会)、寄与度(Wi、国際)、寄与度(W [0031] When the extracted "word is an element of the centroid vector" is present in the word table (step ST13: Yes), genre contribution contribution of the word (Wi, politics), the contribution (Wi, economy), the contribution (Wi, social), the contribution (Wi, international), the contribution (W
i、スポーツ) を次の式(3)に適用し、話題の政治、経済、社会、国際、スポーツに対する得点Trl、Tr2、Tr3、Tr4、Tr5を計算する(ステップST14)。 i, to apply the sport) to the following equation (3), the topic of politics, economy, society, international, score for sports Trl, Tr2, Tr3, Tr4, to calculate the Tr5 (step ST14). なお、式(3)は、一つの話題Tの重心ベクトルの要素となる単語をwl〜Wnとして定義したものである。 Incidentally, Equation (3) is obtained by defining the word as a component of the centroid vector of one topic T as Wl~Wn.

【0032】 [0032]

【数3】 [Number 3]

【0033】全ての重心ベクトルの要素となる単語について、式(3)によるジャンル別得点の算出処理を終えると(ステップST15:Yes)、そのジャンル別得点Trl、Tr2、Tr3、Tr4、Tr5を次の式(4)に適用して、話題Tの政治、経済、社会、国際、スポーツに対する寄与度Tを算出する。 [0033] for the word to be elements of all centroid vectors Upon completion of calculation of the genre score according to equation (3) (step ST15: Yes), the genre score Trl, Tr2, Tr3, Tr4, Tr5 following is applied to the equation (4), to calculate the topic T of political, economic, social, international, the contribution T with respect to sports.

【0034】 [0034]

【数4】 寄与度(T,政治)=Trl/(Tr1+Tr2+Tr3+Tr4+Tr5) 寄与度(T,経済)=Tr2/(Tr1+Tr2+Tr3+Tr4+Tr5) 寄与度(T、社会)=Tr3/(Tr1+Tr2+Tr3+TI4+Tr5) 寄与度(T,国際)=Tr4/(Tr1+Tr2+Tr3+Tr4+Tr5) 寄与度(T,スポーツ)=Tr5/(Trl+Tr2+Tr3十Tr4+Tr5) ・・・・・・(4) [Number 4] contribution (T, politics) = Trl / (Tr1 + Tr2 + Tr3 + Tr4 + Tr5) contribution (T, economy) = Tr2 / (Tr1 + Tr2 + Tr3 + Tr4 + Tr5) contribution (T, society) = Tr3 / (Tr1 + Tr2 + Tr3 + TI4 + Tr5) contribution (T, International) = Tr4 / (Tr1 + Tr2 + Tr3 + Tr4 + Tr5) contribution (T, Sports) = Tr5 / (Trl + Tr2 + Tr3 ten Tr4 + Tr5) ······ (4)

【0035】図6は、図2に示した1998年9月における話題の各ジャンルヘの寄与度の出力結果の例である。 [0035] FIG. 6 is an example of an output result of the contribution of each genre F topic in September 1998 shown in FIG. また、図7は、その中の5番目の話題「北朝鮮・朝鮮民主主義人民共和国のミサイル発射」について従来法と比較した結果である。 In addition, FIG. 7 is a result of a comparison with the conventional method for the fifth topic in the "missile launch of North Korea, the Democratic People's Republic of Korea".

【0036】従来法では、一つのニュースに含まれる単語が過去の学習データにより各ジャンルヘどのくらい属しているかを計算し、その合計の割合でジャンルを推定している。 [0036] In the conventional method, words that are included in one of the news is to calculate whether they belong how much each genre F in the past of the learning data, and to estimate the genre as a percentage of the total. したがって、図7(b)に示すように、全く関連のない「スポーツ」や「経済」にも属しており、的確にジャンルを推定するのが困難である。 Therefore, as shown in FIG. 7 (b), also belongs to a completely unrelated "sports" and "economy", it is difficult to estimate accurately genre.

【0037】それに対し、図7(a)に示すように、本実施形態による手法では、「スポーツ」、「経済」に属する割合は従来手法と比べて低く、的確な度合いで「政治」、「経済」、「国際」、「社会」に属する割合を推定できる。 [0037] In contrast, as shown in FIG. 7 (a), the technique according to the present embodiment, "sports", the proportion belonging to the "economy" is lower than the conventional method, "politics" in exact degree " economy "," international ", it is possible to estimate the proportion belonging to the" society ". このように、本実施形態による手法では、従来の手法に比べ、的確にジャンルを推定できることがわかる。 Thus, in the method according to the present embodiment, compared with the conventional method, it can be seen that accurately estimate the genre.

【0038】次に、個人嗜好入力インタフェース4にて視聴者個人の嗜好の入力を行う。 [0038] Next, the input of individual viewers of preferences in individual preferences input interface 4. 個人の嗜好は、例えば政治・経済・社会・国際・スポーツの5つのジャンルで入力する。 Preferences of individuals, for example, be entered in five of the genre of political, economic, social and international sports. 嗜好を、例えば、0から100までの数値で入力する。 A preference, for example, to enter a number from 0 to 100. 図8では、5つのジャンルの嗜好をそれぞれ値30と入力した場合の各ジャンルの割合が示されている。 In Figure 8, the proportion of each genre when five genres preferences you enter each value 30 is shown.

【0039】そして、個人用ニュース話題提示部5では、この入力された個人の嗜好と、ニュース話題のジャンル抽出部3bが抽出したジャンルを利用して、個人の嗜好に合ったニュースの検索を行う。 [0039] Then, the in personal news topic presentation unit 5, and the preference of the input individual, using the genre to genre extraction portion 3b was extracted news topic, the search of news that match the preferences of the individual .

【0040】まず、個人Aの嗜好に対する話題Tに付ける点数Score(A,T)を、次の式(5)に従って求める。 [0040] First, the score Score (A, T) to be given to the topic T with respect to the preference of the individual A, and determined according to the following equation (5). 式(5)において、値polは、政治に対する個人A In the formula (5), the value pol is personal in politics A
の嗜好の値である。 Is the value of the preference. 値ecoは、経済に対する個人Aの嗜好の値である。 Value eco is the value of the preference of the individual A for the economy. 値socは、社会に対する個人Aの嗜好の値である。 Value soc is the value of the preference of the individual A to society. 値intは、国際に対する個人Aの嗜好の値である。 Value int is the value of the preference of the individual A for international. 値spoは、スポーツに対する個人Aの嗜好の値である。 Value spo is the value of the preference of the individual A for the sport.

【0041】 [0041]

【数5】 [Number 5]

【0042】なお、式(5)では、個人の嗜好を強調するため2乗した値を使っているが、話題の重要度を強調するときは、例えば次の式(6)とする。 [0042] In Equation (5), but using squared value to emphasize the preference of the individual, when emphasizing the topics of importance, for example, the following equation (6). 式(6)の例えば対数関数(log)をとることにより、さらに話題の重要度を強調できる。 By taking the example logarithmic function (log) of the formula (6), can be further emphasized the importance of the topic.

【0043】 [0043]

【数6】 [6]

【0044】式(5)や式(6)の値が大きい話題から、個人の嗜好に合った話題と判断できる。 [0044] from the topic value is greater of the formula (5) and (6), it can be determined that the topic that matches the preference of the individual. 図9と図1 Figure 9 and Figure 1
0には、式(5)により計算した個人用ニュース話題提示の結果を示してある。 The 0, are shown the results of the personal news topics presented were calculated by the equation (5).

【0045】図9では、視聴者Aの嗜好のジャンルは、 [0045] In FIG. 9, the genre of the preferences of the viewer A is,
国際に大きな値が付けられているので、外国の話題が主に提示されることが示されている。 Because it is a large value attached to international, it has been shown that foreign topic is mainly presented. また、図10では、 In addition, in FIG. 10,
視聴者Bの嗜好のジャンルは、スポーツと社会に大きな値が付けられているので、国内のスポーツと社会の話題が主に提示されることが示されている。 Genre of preference of the viewer B, since the large value in sports and society are attached, the topic of domestic sport and society has been shown to be mainly presented.

【0046】なお、以上説明した実施形態では、ジャンルとして、政治・経済・社会・国際・スポーツの5つのジャンルを取り上げたが、本発明はこれに限定されないことは言うまでもなく、ジャンルの数・範囲は任意である。 [0046] It should be noted that, in the embodiment described above, as a genre, but took up five of the genre of political, economic, social and international sports, the present invention it is of course not limited to this, and the number-range of genres it is optional.

【0047】 [0047]

【発明の効果】以上から明らかなように、請求項1乃至3に記載の発明によれば、話題を構成するニュース原稿に含まれる単語から得られる情報を利用することにより、ニュースの話題が複数のジャンルにどれくらい関わっているかを推定することが可能となる。 As apparent from the foregoing description, according to the invention described in claims 1 to 3, by using the information obtained from the word contained in the news manuscripts constituting the topic, news topic plurality it is possible to estimate whether the involved much in the genre.

【0048】また、請求項4に記載の発明によれば、個人嗜好入力インタフェースを利用して個人の嗜好を複数のジャンルに数値で入力し、この個人情報と話題のジャンル推定結果とを利用することにより、ニュースの話題が個人の嗜好に合うように効果的に提示することが可能となる。 [0048] According to the invention described in claim 4, enter a numeric value personal preferences into multiple genres by using a personal preference input interface utilizes a genre estimation result of the personal information and the topic it makes it possible to news of the topic is effectively presented to suit the preference of the individual.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】本発明の実勢形態に係るニュース話題ジャンル推定装置及び個人用話題提示装置の構成ブロック図である。 1 is a block diagram of a news topic genre estimation apparatus and a personal topic presentation device according to prevailing embodiment of the present invention.

【図2】話題の抽出例を示す説明図である。 FIG. 2 is an explanatory diagram showing an example of extraction of a topic.

【図3】ニュース話題抽出部で得られた重心ベクトルを例示する説明図である。 3 is an explanatory view illustrating a centroid vector obtained by the news topic extraction unit.

【図4】出現単語のジャンル別寄与度計算処理のフローチャートである。 4 is a flowchart of a genre contribution calculation process written words.

【図5】ニュース話題のジャンル抽出処理のフローチャートである。 FIG. 5 is a flow chart of the genre extraction process of the news topic.

【図6】話題の各ジャンルへの寄与度の出力結果を例示する説明図である。 6 is an explanatory diagram illustrating the output result of contribution to the genre of the topic.

【図7】ニュース話題「北朝鮮・朝鮮民主主義人民共和国のミサイル発射」の各ジャンルへの寄与度の従来法との比較結果を示す説明図である。 FIG. 7 is an explanatory view showing a result of comparison between the conventional method of contribution to the genre of news topic "missile launch of North Korea, the Democratic People's Republic of Korea".

【図8】個人嗜好入力インタフェースを例示する説明図である。 8 is an explanatory view illustrating a personal preference input interface.

【図9】個人用ニュース話題提示の結果を例示する説明図である。 FIG. 9 is an explanatory diagram illustrating the result of personal news topics presented.

【図10】個人用ニュース話題提示の結果を例示する説明図である。 FIG. 10 is an explanatory diagram illustrating the result of personal news topics presented.

【符号の説明】 DESCRIPTION OF SYMBOLS

1 個人用話題提示装置 2 ニュース話題抽出部 3 ニュース話題のジャンル抽出部 3a 出現単語のジャンル別寄与度計算部 3b ニュース話題のジャンル抽出部 4 個人嗜好入力インタフェース 5 個人用ニュース話題提示部 1 personal topic presentation device 2 news topic extraction unit 3 news topics genre extraction portion 3a appearing words Genre contribution calculating unit 3b news topic of genre extraction section 4 personal preference input interface 5 personal news topic presentation unit

───────────────────────────────────────────────────── ────────────────────────────────────────────────── ───

【手続補正書】 [Procedure amendment]

【提出日】平成11年11月11日(1999.11. [Filing date] 1999 November 11 (1999.11.
11) 11)

【手続補正1】 [Amendment 1]

【補正対象書類名】明細書 [Correction target document name] specification

【補正対象項目名】0037 [Correction target item name] 0037

【補正方法】変更 [Correction method] change

【補正内容】 [Correction contents]

【0037】それに対し、図7(a)に示すように、本実施形態による手法では、「スポーツ」、「経済」に属する割合は従来手法と比べて低く、的確な度合いで「政治」、「国際」、「社会」に属する割合を推定できる。 [0037] In contrast, as shown in FIG. 7 (a), the technique according to the present embodiment, "sports", the proportion belonging to the "economy" is lower than the conventional method, "politics" in exact degree " international ", it is possible to estimate the proportion belonging to the" society ".
このように、本実施形態による手法では、従来の手法に比べ、的確にジャンルを推定できることがわかる。 Thus, in the method according to the present embodiment, compared with the conventional method, it can be seen that accurately estimate the genre.

フロントページの続き (72)発明者 柴田 正啓 東京都世田谷区砧一丁目10番11号 日本放 送協会放送技術研究所内 Fターム(参考) 5B075 ND03 NR12 PR04 Front page of the continuation (72) inventor Shibata Masahiro Setagaya-ku, Tokyo Kinuta chome No. 10, No. 11, Japan Broadcasting Association of Broadcasting Technology Institute in the F-term (reference) 5B075 ND03 NR12 PR04

Claims (4)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】 話題を構成するニュース原稿に含まれる単語の複数ジャンルへの寄与度を算出する出現単語のジャンル別寄与度計算手段と、 前記算出された単語別ジャンル寄与度とニュース原稿から抽出された話題とに基づき、ニュースの話題が前記複数のジャンルのどれに属するかを抽出するジャンル抽出手段と、 を備えることを特徴とするニュース話題ジャンル推定装置。 Extracted from claim 1. A genre contribution computing means appearing word for calculating a contribution to a plurality genre of words included in the news manuscripts constituting the topic word genre contribution to the calculated and news manuscripts has been based on the topic, news topic genre estimation apparatus news topic, characterized in that it comprises, a genre extraction means for extracting belongs to which of the plurality of genres.
  2. 【請求項2】 請求項1に記載のニュース話題ジャンル推定装置において、 前記出現単語のジャンル別寄与度計算手段は、 話題を構成するニュース原稿に含まれる単語から出現頻度が所定回数以上の単語を抽出する手段と、 前記抽出された単語についてジャンル別の寄与度を算出する手段と、 を備えることを特徴とするニュース話題ジャンル推定装置。 2. A news topics genre estimation device according to claim 1, Genre contribution calculating unit of the occurrence word, a term frequency from the word is more than the predetermined number of times contained in the news manuscripts constituting the topic means for extracting, news topics genre estimation device characterized by comprising a means for calculating the genre contribution for word the extracted.
  3. 【請求項3】 請求項2に記載のニュース話題ジャンル推定装置において、 前記ニュース話題のジャンル抽出手段は、 前記ニュース原稿から抽出された話題からその話題を表現するデータの要素となる単語を抽出する手段と、 前記抽出した単語の中から前記出現単語のジャンル別寄与度計算手段でジャンル別寄与度が算出された単語を選択する手段と、 前記選択された単語のジャンル別寄与度を用いて話題のジャンル別得点を算出する手段と、 前記算出された話題のジャンル別得点を用いて話題のジャンル別の寄与度を算出する手段と、 を備えることを特徴とするニュース話題ジャンル推定装置。 3. A news topics genre estimating apparatus according to claim 2, genre extraction means of the news topics, extracts a word to be an element of data representing the topic from the topics extracted from the news manuscripts topic by using the means, means for selecting a word genre contribution is calculated by genre contribution calculating unit of the occurrence word from among the words that the extracted, the genre contribution of words said selected It means for calculating a genre score, news topics genre estimation device characterized by comprising: means for calculating a genre contribution of topics, the using genre score of topics the calculated.
  4. 【請求項4】 請求項1乃至3の何れかに記載のニュース話題ジャンル推定装置と、 個人の嗜好を複数のジャンル毎に入力する個人嗜好入力インタフェースと、 前記ニュース話題ジャンル推定装置で得られたジャンル推定結果と、前記個人嗜好入力インタフェースの入力情報とに基づきニュースの話題を個人の嗜好に合うように提示する個人用ニュース話題提示手段と、 を備えることを特徴とする個人用話題提示装置。 And news topics genre estimating apparatus according to any one of 4. The method of claim 1 to 3, and personal preference input interface for inputting personal preferences for each of a plurality of genres, obtained in the news topic genre estimator Genres estimation results and personal topic presentation device characterized by and a personal news topic presentation means for presenting to suit personal preferences topic news based on the input information of said personal preference input interface.
JP31271699A 1999-11-02 1999-11-02 Estimating device for genre of topic of news and topic presenting device for individual Pending JP2001134582A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31271699A JP2001134582A (en) 1999-11-02 1999-11-02 Estimating device for genre of topic of news and topic presenting device for individual

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31271699A JP2001134582A (en) 1999-11-02 1999-11-02 Estimating device for genre of topic of news and topic presenting device for individual

Publications (1)

Publication Number Publication Date
JP2001134582A true JP2001134582A (en) 2001-05-18

Family

ID=18032572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31271699A Pending JP2001134582A (en) 1999-11-02 1999-11-02 Estimating device for genre of topic of news and topic presenting device for individual

Country Status (1)

Country Link
JP (1) JP2001134582A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1355241A2 (en) * 2002-04-16 2003-10-22 Microsoft Corporation Media content descriptions
EP1357746A2 (en) * 2002-04-16 2003-10-29 Microsoft Corporation Describing media content in terms of degrees
JP2007535048A (en) * 2004-04-28 2007-11-29 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Method and apparatus for reproducing information
JP2008243127A (en) * 2007-03-29 2008-10-09 Chubu Electric Power Co Inc Input information analyzing device
US7617511B2 (en) 2002-05-31 2009-11-10 Microsoft Corporation Entering programming preferences while browsing an electronic programming guide
US7836466B2 (en) 2002-06-06 2010-11-16 Microsoft Corporation Methods and systems for generating electronic program guides

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7467164B2 (en) 2002-04-16 2008-12-16 Microsoft Corporation Media content descriptions
EP1357746A2 (en) * 2002-04-16 2003-10-29 Microsoft Corporation Describing media content in terms of degrees
EP1357746A3 (en) * 2002-04-16 2005-02-02 Microsoft Corporation Describing media content in terms of degrees
EP1355241A3 (en) * 2002-04-16 2005-02-09 Microsoft Corporation Media content descriptions
US7073193B2 (en) 2002-04-16 2006-07-04 Microsoft Corporation Media content descriptions
US7640563B2 (en) 2002-04-16 2009-12-29 Microsoft Corporation Describing media content in terms of degrees
US7363649B2 (en) 2002-04-16 2008-04-22 Microsoft Corporation Media content descriptions
EP1355241A2 (en) * 2002-04-16 2003-10-22 Microsoft Corporation Media content descriptions
US7617511B2 (en) 2002-05-31 2009-11-10 Microsoft Corporation Entering programming preferences while browsing an electronic programming guide
US7836466B2 (en) 2002-06-06 2010-11-16 Microsoft Corporation Methods and systems for generating electronic program guides
US7885971B2 (en) 2002-06-06 2011-02-08 Microsoft Corporation Methods and systems for generating electronic program guides
JP2007535048A (en) * 2004-04-28 2007-11-29 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Method and apparatus for reproducing information
JP2008243127A (en) * 2007-03-29 2008-10-09 Chubu Electric Power Co Inc Input information analyzing device

Similar Documents

Publication Publication Date Title
Sogge Fourier integrals in classical analysis
JP2940501B2 (en) Document classification apparatus and method
US8527506B2 (en) Media discovery and playlist generation
JP4850845B2 (en) Method, system and memory device
US9535911B2 (en) Processing a content item with regard to an event
US20060122991A1 (en) System and method for query refinement to enable improved searching based on identifying and utilizing popular concepts related to users&#39; queries
CN102007492B (en) Searching a plurality of digital images stored in the apparatus and method
EP2232746B1 (en) Image record trend identification for user profiles
CN102947850B (en) Content output means, content output method
CN101496002B (en) The use of online conversation content selecting advertising content and / or other relevant systems and methods for information displayed
US20020013729A1 (en) Advertisement presentation system
US6446083B1 (en) System and method for classifying media items
JP5344715B2 (en) Content retrieval device and the content search program
JP3116851B2 (en) Information filtering method and apparatus
US8107689B2 (en) Apparatus, method and computer program for processing information
JP5639065B2 (en) Proposal of action based on social relations, which is estimated
AU2011242753B2 (en) Product synthesis from multiple sources
US9026543B2 (en) System and method for generating a relationship network
JP2011227922A (en) Personalization for sequencing of braced content within search result
US8655889B2 (en) Autonomous mobile blogging
US7657514B2 (en) Content identification expansion
US9922050B2 (en) Identifying data from keyword searches of color palettes and color palette trends
JP3547073B2 (en) Information retrieval method, apparatus and recording medium
JP2015528956A5 (en)
US8000504B2 (en) Multimodal classification of adult content

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080701

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081028