JP4619915B2 - PROGRAM DATA PROCESSING DEVICE, PROGRAM DATA PROCESSING METHOD, CONTROL PROGRAM, RECORDING MEDIUM, RECORDING DEVICE, REPRODUCTION DEVICE, AND INFORMATION DISPLAY DEVICE EQUIPPED WITH PROGRAM DATA PROCESSING DEVICE - Google Patents

PROGRAM DATA PROCESSING DEVICE, PROGRAM DATA PROCESSING METHOD, CONTROL PROGRAM, RECORDING MEDIUM, RECORDING DEVICE, REPRODUCTION DEVICE, AND INFORMATION DISPLAY DEVICE EQUIPPED WITH PROGRAM DATA PROCESSING DEVICE Download PDF

Info

Publication number
JP4619915B2
JP4619915B2 JP2005291539A JP2005291539A JP4619915B2 JP 4619915 B2 JP4619915 B2 JP 4619915B2 JP 2005291539 A JP2005291539 A JP 2005291539A JP 2005291539 A JP2005291539 A JP 2005291539A JP 4619915 B2 JP4619915 B2 JP 4619915B2
Authority
JP
Japan
Prior art keywords
program
title
recorded
distance
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005291539A
Other languages
Japanese (ja)
Other versions
JP2007102489A (en
Inventor
彰 鶴田
慶子 蛭川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2005291539A priority Critical patent/JP4619915B2/en
Publication of JP2007102489A publication Critical patent/JP2007102489A/en
Application granted granted Critical
Publication of JP4619915B2 publication Critical patent/JP4619915B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、例えば、EPG(Electronic Program Guide)の番組情報に含まれる番組タイトルなどのマッチングを行う番組データ処理装置、番組データ処理方法、制御プログラム、記録媒体、ならびに、番組データ処理装置を備えた録画装置、再生装置、および、情報表示装置に関するものである。   The present invention includes, for example, a program data processing device, a program data processing method, a control program, a recording medium, and a program data processing device for matching a program title included in program information of an EPG (Electronic Program Guide). The present invention relates to a recording device, a playback device, and an information display device.

近年、デジタルテレビ放送などのように、放送の分野におけるデジタル化が進み、映像や音声を、デジタルデータで通信網を介して受信し、視聴することが可能なテレビ放送受信装置や、記録再生装置などの視聴覚機器が普及している。例えば、テレビジョン放送番組を記録(録画)する機器として、ハードディスクを記録媒体とした、ハードディスク記録再生装置が実用化されている。このハードディスク記録再生装置の場合には、例えば数百Gバイトの記憶容量で、数百時間のテレビジョン放送信号を記録することが可能である。記録可能な時間については、ハードディスクなどの記録媒体の記憶密度の向上や、放送データの圧縮技術の向上に伴って増大が予想される。   In recent years, digital broadcasting in the field of broadcasting, such as digital television broadcasting, has progressed, and television broadcast receivers and recording / playback devices that can receive and view video and audio via a communication network as digital data Audiovisual equipment such as For example, as a device for recording (recording) a television broadcast program, a hard disk recording / reproducing apparatus using a hard disk as a recording medium has been put into practical use. In the case of this hard disk recording / reproducing apparatus, it is possible to record a television broadcast signal of several hundred hours with a storage capacity of, for example, several hundred Gbytes. The recordable time is expected to increase with the improvement of the storage density of a recording medium such as a hard disk and the improvement of the broadcast data compression technique.

このような、視聴覚機器の中には、テレビ番組の視聴や録画の操作を簡単に行えるようにするために、EPG(電子番組表)と称される電子番組案内情報を受信し、それを処理する機能を備えたものがある。   Some of these audiovisual devices receive electronic program guide information called EPG (Electronic Program Guide) and process it so that television programs can be viewed and recorded easily. Some have the function to do.

EPGは、各放送局から送信される番組関連情報に基づいて作成される。この番組関連情報は、映像情報や音声情報と同様、各視聴覚機器が、それを送信している放送局へ選局を行うことで取得できる。例えば、EPGは、デジタル放送などの放送システムの場合には、各放送局が送信する放送データに付加されるようにしてあり、またアナログ放送の場合には、特定のチャンネルの映像信号のブランキング期間などに、特定の時間帯だけ付加して送られるようになっている。あるいは、放送局からのみではなく、インターネットなどの伝送手段を介して、EPGデータを有する他の情報処理装置から、視聴者の視聴覚機器に配信されるような形態もある。   The EPG is created based on program-related information transmitted from each broadcast station. This program-related information can be acquired by selecting each broadcasting / audio device to the broadcasting station that transmits it, as in the case of video information and audio information. For example, EPG is added to broadcast data transmitted by each broadcast station in the case of a broadcasting system such as digital broadcasting, and blanking of a video signal of a specific channel in the case of analog broadcasting. A specific time slot is added to a period or the like. Alternatively, there is a mode in which the information is distributed not only from the broadcasting station but also from other information processing apparatuses having EPG data to the viewer's audiovisual apparatus via transmission means such as the Internet.

各放送局から送信される、EPGを作成するために必要な情報は、例えば、CS・BS・地上デジタルテレビ放送など放送メディアごとに作成された運用規定で規定されており、どの放送局からも共通の項目を有する番組情報を入手できる。番組情報の項目は、例えば、番組タイトル、番組内容、放送日、番組開始時間、番組終了時間などを始め、コピーコントロール情報、ジャンル、視聴年齢制限、有料番組情報など、種々多様である。   Information necessary for creating an EPG transmitted from each broadcasting station is stipulated in, for example, operational regulations created for each broadcasting medium such as CS, BS, and terrestrial digital television broadcasting. Program information having common items can be obtained. The items of program information include various items such as program title, program content, broadcast date, program start time, program end time, copy control information, genre, viewing age limit, pay program information, and the like.

視聴覚機器は、取得したEPGデータに基づいて、現在新聞などで見られるテレビ放送の番組欄のように電子的に一覧にして、上述した内容を含む番組情報を表示する。このEPGを利用することにより、ユーザは、番組情報を現在新聞などで見られるテレビ放送の番組欄のように、簡単に閲覧することができ、見たい番組を選択したり、視聴予約や録画予約を行ったりすることができる。   The audiovisual device displays the program information including the above-mentioned contents in an electronic list like the TV broadcast program column currently available in newspapers based on the acquired EPG data. By using this EPG, the user can easily browse program information like a TV broadcast program column currently available in newspapers, etc., and can select a program to watch, reserve viewing or recording reservation Can be done.

このようにEPGデータを利用して各種処理を行う視聴覚装置の例として、特許文献1には、番組の録画予約をした際、番組タイトルを用いて、放送時間帯の変更に自動追従する録画予約機能を有する番組予約記録装置が開示されている。より具体的には、録画予約時に、電子番組表(EPG)の番組名(番組タイトル)に基づいて、放送日時、チャンネルなどの録画に必要な情報をEPGより取得し、番組名を基に、録画目的の番組を検出し、検出された番組の開始時刻および終了時刻を得て、録画予約を実行する。   As an example of an audiovisual apparatus that performs various processes using EPG data as described above, Patent Document 1 discloses a recording reservation that automatically follows a change in a broadcast time zone using a program title when a recording reservation is made for a program. A program reservation recording device having a function is disclosed. More specifically, at the time of recording reservation, based on the program name (program title) in the electronic program guide (EPG), information necessary for recording such as broadcast date and time and channel is acquired from the EPG, and based on the program name, The recording target program is detected, the start time and end time of the detected program are obtained, and the recording reservation is executed.

このとき、EPGに含まれている番組タイトルは、省略されて格納されていることも多く、このような省略に対応するため、特許文献1では、番組タイトルのマッチングに曖昧検索の手法が採用されている。
特開2003−46921号(2003年2月14日公開) 特開平8−106474号(1996年4月23日公開)
At this time, the program title included in the EPG is often omitted and stored, and in order to cope with such omission, Patent Document 1 employs an ambiguous search technique for matching program titles. ing.
JP 2003-46921 A (released on February 14, 2003) JP-A-8-106474 (released on April 23, 1996)

しかしながら、特許文献1の曖昧検索手法を用いたマッチング方法では、以下の問題を生じる。具体的には、曖昧検索では、番組タイトルを構成するある文字列と、少なくとも一部の文字列が同一である番組タイトルがあれば、それらを同じ番組であると判定する。しかし、単なる文字列の一致によってのみ、番組の同一性を判定する方法では、一致させる文字列数を少なくすれば、同一番組の見落としは減るが、同一でない番組を同一と誤って判定する確率が高くなる。一方、文字列数を多くすれば、同一番組であっても一致する文字列数が至らず、同一でないと誤って判定される確率が高くなる。   However, the matching method using the fuzzy search method of Patent Document 1 causes the following problems. Specifically, in the fuzzy search, if there is a program title in which at least a part of the character string and a certain character string constituting the program title are the same, it is determined that they are the same program. However, in the method of determining the identity of a program only by matching a character string, if the number of matched character strings is reduced, the oversight of the same program is reduced, but there is a probability that a program that is not the same is erroneously determined to be the same. Get higher. On the other hand, if the number of character strings is increased, the number of matching character strings is not reached even in the same program, and the probability that it is erroneously determined that they are not the same increases.

例えば、「一致する文字列数が4文字以上」であることを同一番組と判定する条件とすれば、正式番組名「出勤!ミニスカポリス」と省略番組名「ミニスカ」との関係のように、省略番組名「ミニスカ」は、「ミニスカ」の4文字が正式番組名の中に完全に含まれていることから、上記両番組名は同一番組と判断される。しかし、正式名「冬のソナタ」なる番組が「冬ソナ」として省略されるような場合には、「一致する文字列数が4文字以上」という条件を満たしておらず、同一番組と判断されない。しかし、「一致する文字列数が2文字」にまで条件を緩めてしまうと、その同一性の判定の精度は著しく低下するという問題がある。   For example, if it is a condition for determining that the number of matching character strings is 4 or more as the same program, the relationship between the official program name “Attend! Miniskirt Police” and the abbreviated program name “Miniska” The abbreviated program name “Miniska” includes the four characters “Miniska” completely in the official program name, so that both program names are determined to be the same program. However, when the program with the official name “Winter Sonata” is omitted as “Winter Sona”, it does not satisfy the condition that “the number of matching character strings is 4 characters or more” and is not determined to be the same program. . However, if the condition is relaxed to “the number of matching character strings is two characters”, there is a problem that the accuracy of determining the identity is remarkably lowered.

本発明は、上記の問題点に鑑みてなされたものであり、その目的は、EPGなどの番組情報データベースに含まれる番組タイトルを利用して番組の同一性を判定して、各種処理を行う番組データ処理装置において、番組タイトルの表記の揺らぎ(特に省略表記など)に対応し、番組の同一性の判定における精度を向上させる番組データ処理装置、番組データ処理方法、制御プログラム、記録媒体、ならびに、番組データ処理装置を備えた録画装置、再生装置、および、情報表示装置を実現することにある。   The present invention has been made in view of the above problems, and an object of the present invention is to determine the identity of a program using a program title included in a program information database such as an EPG and perform various processes. In a data processing apparatus, a program data processing apparatus, a program data processing method, a control program, a recording medium, and a program data processing apparatus that cope with fluctuations in program title notation (especially abbreviated notation, etc.) It is to realize a recording device, a reproducing device, and an information display device provided with a program data processing device.

本発明に係る番組データ処理装置は、上記課題を解決するために、番組に関する情報を示す番組情報から、番組の番組タイトルを抽出するタイトル抽出手段と、上記タイトル抽出手段によって抽出された、ユーザにより選択された番組の選択番組タイトルと、上記タイトル抽出手段によって抽出され、複数の番組情報からなる番組情報データベースにあらかじめ記録されている、番組の記録番組タイトルとを文字ごとに比較し、上記選択番組タイトルと上記記録番組タイトルとの間で文字が一致する部分と、一致する文字の配列とを評価することにより、両番組タイトル間の類似性を示す評価値を算出する評価値算出手段と、上記評価値が、所定の条件を満たす場合に、上記選択番組タイトルと上記記録番組タイトルとは同一番組のタイトルであると判定する判定手段とを備えていることを特徴としている。   In order to solve the above-described problem, the program data processing apparatus according to the present invention includes a title extraction unit that extracts a program title of a program from program information indicating information about the program, and a user extracted by the title extraction unit. The selected program title of the selected program is compared with the recorded program title of the program extracted by the title extraction means and recorded in advance in the program information database composed of a plurality of program information for each character, and the selected program An evaluation value calculating means for calculating an evaluation value indicating similarity between both program titles by evaluating a portion where characters match between the title and the recorded program title, and an array of matching characters; When the evaluation value satisfies a predetermined condition, the selected program title and the recorded program title are the same program title. It is characterized by comprising a certain and determining means.

上記構成によれば、タイトル抽出手段は、ユーザにより入力された番組の番組タイトルを「選択番組タイトル」として、また、複数の番組情報を格納する番組情報データベースから、あらかじめ記録されている番組の番組タイトルを「記録番組タイトル」として抽出する。   According to the above configuration, the title extracting means sets the program title of the program input by the user as the “selected program title”, and the program program recorded in advance from the program information database storing a plurality of program information. The title is extracted as “recorded program title”.

次に、評価値算出手段は、上記両番組タイトルを、文字ごとに比較し、文字が一致する部分と、一致する文字の配列があることを、類似性が高いと評価することによって、両番組タイトル間の類似性を示す評価値を算出する。   Next, the evaluation value calculation means compares the two program titles for each character, and evaluates that there is a portion with matching characters and an array of matching characters, so that both programs have high similarity. An evaluation value indicating similarity between titles is calculated.

最後に、判定手段は、上記評価値算出手段によって算出された評価値を検証し、該評価値があらかじめ定められた条件を満たしている場合に、上記選択番組タイトルと上記記録番組タイトルとは同一番組のタイトルであると判定する。   Finally, the judging means verifies the evaluation value calculated by the evaluation value calculating means, and when the evaluation value satisfies a predetermined condition, the selected program title and the recorded program title are the same. It is determined that the title is a program title.

評価値算出手段における評価値は、文字ごとの一致/不一致と、文字列の並びの一致/不一致との両方に基づいて算出されるので、連続して一致する文字列数の制限を受けずに、同一性の判定を行える。したがって、番組タイトルの表記の揺らぎ(特に省略表記など)に対応し、番組の同一性の判定における精度を向上させることが可能となる。   Since the evaluation value in the evaluation value calculation means is calculated based on both the match / mismatch for each character and the match / mismatch of the character string sequence, there is no limitation on the number of character strings that match continuously. , Identity can be determined. Accordingly, it is possible to cope with fluctuations in the notation of program titles (particularly, abbreviated notation) and to improve the accuracy in determining the identity of programs.

なお、評価値は、例えば、DPマッチング法を用いて、類似性距離として算出されるとすると、上記類似性距離は、距離が短いほど類似性が高いことを意味している。よって、判定手段が行う判定方法の具体例としては、例えば、あらかじめ閾値を定めておき、算出された類似性距離が閾値以下である場合に、両番組タイトルを同一であると判定することが可能となる。   If the evaluation value is calculated as the similarity distance using, for example, the DP matching method, the similarity distance means that the similarity is higher as the distance is shorter. Therefore, as a specific example of the determination method performed by the determination unit, for example, it is possible to determine that both program titles are the same when a threshold value is set in advance and the calculated similarity distance is equal to or less than the threshold value. It becomes.

上記番組データ処理装置は、上記選択番組タイトルと上記記録番組タイトルとの間で一致する文字列から、一方の番組タイトルに施された省略パターンを検出し、あらかじめ定められた番組タイトルの典型省略パターンとの照合を行うパターン照合手段をさらに備え、上記パターン照合手段は、検出した省略パターンが、上記典型省略パターンに合わない場合に、上記選択番組タイトルと上記記録番組タイトルとは同一番組のタイトルでないと判定してもよい。   The program data processing device detects an abbreviation pattern applied to one program title from a character string that matches between the selected program title and the recorded program title, and a typical abbreviation pattern of a predetermined program title A pattern matching unit that compares the selected program title with the recorded program title when the detected omitted pattern does not match the typical omitted pattern. May be determined.

上記構成によれば、パターン照合手段は、両番組タイトルにおける省略パターンを検出し、あらかじめ定められた典型省略パターンとの照合を行う。典型省略パターンとの照合が成功しなかった場合は、省略表記としては不自然な形で省略が行われていることになり、同一番組である可能性が低い。例えば、具体的には、1文字おきに省略されているような省略パターンなどが考えられる。したがって、照合が失敗した場合は、当該両番組タイトルにおいて、条件を満たす評価値が算出されたとしても、同一番組のタイトルではないと判定することができる。   According to the above configuration, the pattern matching means detects the omitted pattern in both program titles and compares it with a predetermined typical omitted pattern. If collation with the typical omission pattern is not successful, omission is performed in an unnatural manner as an abbreviation notation, and the possibility of the same program being low. For example, specifically, an abbreviated pattern that is omitted every other character is conceivable. Therefore, if the collation fails, even if an evaluation value that satisfies the condition is calculated for both program titles, it can be determined that they are not the titles of the same program.

これにより、番組同一性の判定の精度を向上させることができる。   Thereby, the accuracy of determination of program identity can be improved.

上記番組データ処理装置のタイトル抽出手段は、番組タイトルに含まれる、番組タイトルを表していない文字列を除去する不要語除去手段をさらに備えていてもよい。   The title extraction unit of the program data processing apparatus may further include an unnecessary word removal unit that removes a character string that does not represent the program title included in the program title.

これにより、番組タイトルに含まれる、番組タイトルを意味していない余分な文字列を除去することができるので、上述の評価値算出の精度が向上し、結果として、番組同一性の判定の精度を向上させることができる。   As a result, an extra character string that does not mean the program title included in the program title can be removed, so that the accuracy of the above-described evaluation value calculation is improved, and as a result, the accuracy of the program identity determination is improved. Can be improved.

上記番組データ処理装置のタイトル抽出手段は、番組タイトルに含まれる半角文字を全角文字に変換する全角変換手段をさらに備えていてもよい。   The title extraction means of the program data processing apparatus may further comprise full-width conversion means for converting half-width characters included in the program title into full-width characters.

これにより、評価値算出手段が、半角と全角の違いのみによって、異なる文字列であると判定することを防ぐことができ、評価値算出の精度が向上する。結果として、番組同一性の判定の精度を向上させることができる。   Thereby, it is possible to prevent the evaluation value calculation means from determining that the character string is different only by the difference between half-width and full-width, and the accuracy of evaluation value calculation is improved. As a result, the accuracy of program identity determination can be improved.

上記番組データ処理装置の上記タイトル抽出手段は、番組タイトルを構成する文字列をかな文字に変換し、どの文字種からかな文字へ変換したかを示す変換履歴情報を、文字ごとに記録するかな文字変換手段をさらに備えていてもよい。   The title extraction means of the program data processing device converts a character string constituting the program title into kana characters and records conversion history information indicating which character type is converted into kana characters for each character. Means may be further provided.

上記構成によれば、かな文字変換が、番組タイトルをかな文字列に統一する。評価値算出手段は、かな文字に統一された文字列を用いて、評価値を算出するので、番組情報データベースに記録されている番組タイトルとの同一性を判断する上で、文字種の違いを吸収し、番組の同一性の判定をより高い精度で行うことが可能となる。   According to the above configuration, kana character conversion unifies program titles into kana character strings. Since the evaluation value calculation means calculates the evaluation value using a character string that is unified with kana characters, the difference in character type is absorbed in determining the identity with the program title recorded in the program information database. In addition, it becomes possible to determine the identity of programs with higher accuracy.

さらに、かな文字変換は、文字列をひらがなに変換する際に、変換前の文字種を記録しておくので、評価値算出手段は、変換前の文字種の一致/不一致を加味して、評価値を算出することができる。これにより、表記の揺らぎ(特に漢字/カタカナ、ひらがなといった文字種の異なる表記など)に対応して、番組の同一性の判定における精度をさらに向上させることが可能となる。   Furthermore, since Kana character conversion records the character type before conversion when converting a character string into hiragana, the evaluation value calculation means takes the evaluation value into consideration by matching / non-matching of the character type before conversion. Can be calculated. Accordingly, it is possible to further improve the accuracy in determining the identity of a program in response to fluctuations in notation (particularly notation of different character types such as kanji / katakana and hiragana).

上記番組データ処理装置の上記タイトル抽出手段は、番組タイトルを構成する文字列の形態素解析を行って形態素(言語で意味を持つ最小単位)の列に分割し、分割した形態素に割り当てられた品詞と、形態素間の境界位置とを示す形態素解析結果を記録する形態素解析手段をさらに備えていてもよい。   The title extraction unit of the program data processing device performs morphological analysis of a character string constituting a program title and divides it into a string of morphemes (the smallest unit having meaning in language), and a part of speech assigned to the divided morphemes Further, morpheme analysis means for recording a morpheme analysis result indicating a boundary position between morphemes may be further provided.

これにより、評価値算出手段は、文字ごとの比較に加えて、形態素の品詞の一致/不一致、および/または形態素間の境界位置を加味して評価値を算出することができる。結果として、番組の同一性の判定における精度をさらに向上させることが可能となる。   Thereby, the evaluation value calculation means can calculate the evaluation value in consideration of the match / mismatch of the morpheme parts of speech and / or the boundary position between the morphemes in addition to the comparison for each character. As a result, it is possible to further improve the accuracy in determining the identity of programs.

上記番組データ処理装置の上記評価値算出手段は、上記形態素解析結果を参照し、形態素の品詞が一致する部分を評価することにより、評価値を算出する品詞間評価値算出手段をさらに備えていてもよい。   The evaluation value calculation means of the program data processing apparatus further includes an inter-part-of-speech evaluation value calculation means for calculating an evaluation value by referring to the morpheme analysis result and evaluating a part where the morpheme parts of speech match. Also good.

上記構成によれば、評価値算出手段は、形態素の品詞の一致/不一致を加味するので、より精度の高い評価値を算出することが可能となる。結果として、番組の同一性の判定における精度をさらに向上させることができる。   According to the above configuration, since the evaluation value calculation means takes into account the morpheme part of speech match / mismatch, it is possible to calculate a more accurate evaluation value. As a result, the accuracy in determining the identity of programs can be further improved.

上記番組データ処理装置の上記評価値算出手段は、上記形態素解析結果を参照し、上記選択番組タイトルと上記記録番組タイトルとにおける、形態素間の境界位置の一致を評価することにより、評価値を算出する境界位置評価値算出手段をさらに備えていてもよい。   The evaluation value calculation means of the program data processing apparatus calculates an evaluation value by referring to the morpheme analysis result and evaluating the coincidence of boundary positions between morphemes in the selected program title and the recorded program title. Further, a boundary position evaluation value calculating means may be provided.

上記構成によれば、評価値算出手段は、形態素間の境界位置の一致/不一致を加味するので、より精度の高い評価値を算出することが可能となる。結果として、番組の同一性の判定における精度をさらに向上させることができる。   According to the above configuration, since the evaluation value calculation means takes into account the coincidence / mismatch of the boundary positions between morphemes, it is possible to calculate a more accurate evaluation value. As a result, the accuracy in determining the identity of programs can be further improved.

上記番組データ処理装置の上記評価値算出手段は、上記変換履歴情報を参照し、文字種が一致する部分を評価することにより、評価値を算出する文字種間評価値算出手段をさらに備えていてもよい。   The evaluation value calculating means of the program data processing apparatus may further comprise an inter-character-type evaluation value calculating means for calculating an evaluation value by referring to the conversion history information and evaluating a portion where the character types match. .

上記構成によれば、評価値算出手段は、変換前の文字種の一致/不一致を加味して、評価値を算出することができる。これにより、表記の揺らぎ(特に漢字/カタカナ、ひらがなといった文字種の異なる表記など)に対応して、番組の同一性の判定における精度をさらに向上させることが可能となる。   According to the above configuration, the evaluation value calculation means can calculate the evaluation value in consideration of the match / mismatch of the character type before conversion. Accordingly, it is possible to further improve the accuracy in determining the identity of a program in response to fluctuations in notation (particularly notation of different character types such as kanji / katakana and hiragana).

上記番組データ処理装置の上記評価値算出手段は、上記選択番組タイトルの比較対象となる上記記録番組タイトルを、所定の条件に基づき、番組情報データベースから選定してもよい。   The evaluation value calculation means of the program data processing device may select the recorded program title to be compared with the selected program title from a program information database based on a predetermined condition.

所定の条件を、例えば、番組情報に含まれる、放送局情報、ジャンル情報、または、放送日時情報が同一のものとすれば、番組情報データベースからそれらの番組情報が共通する、記録番組タイトルのみを比較対象として絞り込むことができる。   If the predetermined condition is, for example, that the broadcast station information, genre information, or broadcast date / time information included in the program information is the same, only the recorded program titles that have the same program information from the program information database are obtained. It can narrow down as a comparison object.

例えば、連続番組やシリーズ番組などは、同一の放送局、同一の番組ジャンルで、毎日または毎週ほぼ決まった時間帯に放送されるので、これらの情報を用いて、同一と判定される候補としての、比較対象となる番組タイトルを絞り込めば、上述の評価値の算出の処理をより効率的に行うことが可能となる。   For example, continuous programs and series programs are broadcast on the same broadcasting station and the same program genre every day or almost every week, so these information can be used as candidates to be determined to be the same. If the program titles to be compared are narrowed down, the evaluation value calculation process described above can be performed more efficiently.

本発明に係る録画装置は、上記課題を解決するために、上述の番組データ処理装置を備え、ユーザが所望する番組の番組タイトルを、操作部を介して受信し、該番組タイトルを選択番組タイトルとして上記番組データ処理装置に供給する操作受付手段と、上記番組データ処理装置が、上記選択番組タイトルと同一と判定した記録番組タイトルに対応付けられた番組情報を、番組情報データベースから取得するデータ取得手段と、上記取得された番組情報に含まれる放送日時情報に基づいて、当該番組を録画する録画処理手段とを備えていることを特徴としている。   In order to solve the above problems, a recording apparatus according to the present invention includes the above-described program data processing apparatus, receives a program title of a program desired by a user via an operation unit, and selects the program title as a selected program title. Operation receiving means for supplying to the program data processing device and data acquisition for acquiring from the program information database program information associated with the recorded program title determined to be the same as the selected program title by the program data processing device And recording processing means for recording the program based on broadcast date and time information included in the acquired program information.

これにより、番組情報の番組タイトルを用いて、録画予約を受け付けることが可能な録画装置を実現することが可能となる。   This makes it possible to realize a recording apparatus that can accept a recording reservation using the program title of the program information.

本発明に係る再生装置は、上記課題を解決するために、上述の番組データ処理装置を備え、録画番組と、該録画番組の録画番組タイトルとを対応付けて記録する録画番組記録部と、ユーザが所望する番組の番組タイトルを操作部を介して受信し、該番組タイトルを選択番組タイトルとして上記番組データ処理装置に供給する操作受付手段と、上記番組データ処理装置が、上記選択番組タイトルと同一と判定した録画番組タイトルの録画番組のデータを、上記録画番組記録部から取得するデータ取得手段と、上記データ取得手段により取得された録画番組のデータを出力する出力部とを備えていることを特徴としている。   In order to solve the above problems, a playback apparatus according to the present invention includes the above-described program data processing apparatus, a recorded program recording unit that records a recorded program and a recorded program title of the recorded program in association with each other, and a user Receives the program title of the desired program via the operation unit, and supplies the program title as the selected program title to the program data processing device, and the program data processing device is identical to the selected program title. A data acquisition unit that acquires the data of the recorded program of the recorded program title determined from the recorded program recording unit, and an output unit that outputs the data of the recorded program acquired by the data acquisition unit. It is a feature.

これにより、番組情報の番組タイトルを用いて、ユーザが指定する、録画された番組を特定して再生する再生装置を実現することが可能となる。   Accordingly, it is possible to realize a playback device that uses a program title of program information to specify and play back a recorded program specified by the user.

さらに、上記再生装置は、上記番組データ処理装置が、上記選択番組タイトルと同一と判定した録画番組タイトルを有する複数の録画番組を、1つのフォルダで管理する録画番組管理手段をさらに備えていてもよい。   Furthermore, the playback apparatus may further include recorded program management means for managing a plurality of recorded programs having a recorded program title determined to be the same as the selected program title by a single folder by the program data processing apparatus. Good.

これにより、番組タイトルごとに録画番組を整理することが可能な再生装置を実現することが可能となる。   This makes it possible to realize a playback device that can organize recorded programs for each program title.

本発明に係る情報表示装置は、上記課題を解決するために、上述の番組データ処理装置を備え、ユーザからの視聴開始指示を、ユーザが所望する番組の番組タイトルとともに操作部を介して受信し、上記所望の番組タイトルを選択番組タイトルとして上記番組データ処理装置に供給する操作受付手段と、上記視聴開始指示に応じて、上記所望の番組のデータを出力するよう出力部を制御する出力制御手段と、上記番組データ処理装置が、上記選択番組タイトルと同一と判定した番組タイトルを有する番組の番組情報を番組情報データベースから取得するデータ取得手段とを備え、上記出力制御手段は、上記所望の番組のデータを出力するとき、上記データ取得手段により取得された番組情報を出力するよう上記出力部を制御するようにしてもよい。   In order to solve the above problems, an information display device according to the present invention includes the above-described program data processing device, and receives a viewing start instruction from a user together with a program title of a program desired by the user via an operation unit. An operation receiving means for supplying the desired program title as the selected program title to the program data processing apparatus, and an output control means for controlling the output unit to output the desired program data in response to the viewing start instruction. And a data acquisition means for acquiring program information of a program having a program title determined to be the same as the selected program title from a program information database, wherein the output control means includes the desired program. When outputting the data, the output unit may be controlled to output the program information acquired by the data acquisition means. There.

これにより、視聴中の番組と同一番組の、以降の情報(例えば、今後の放送予定など)をユーザに提示することが可能な情報表示装置を実現することが可能となる。   As a result, it is possible to realize an information display device capable of presenting subsequent information (for example, a future broadcast schedule) of the same program as the program being viewed to the user.

本発明に係る番組データ処理方法は、上記課題を解決するために、番組に関する情報を示す番組情報から、番組の番組タイトルを抽出する抽出ステップと、上記抽出ステップによって抽出された、ユーザにより選択された番組の選択番組タイトルと、上記抽出ステップによって抽出され、複数の番組情報からなる番組情報データベースにあらかじめ記録されている、番組の記録番組タイトルとを文字ごとに比較し、上記選択番組タイトルと上記記録番組タイトルとの間で文字が一致する部分と、一致する文字の配列とを評価することにより、両番組タイトル間の類似性を示す評価値を算出する評価値算出ステップと、上記評価値が、所定の条件を満たす場合に、上記選択番組タイトルと上記記録番組タイトルとは同一番組のタイトルであると判定する判定ステップとを含むことを特徴している。   In order to solve the above problems, a program data processing method according to the present invention includes an extraction step of extracting a program title of a program from program information indicating information related to the program, and a user's selection extracted by the extraction step. The selected program title of the selected program is compared with the recorded program title of the program, which is extracted by the extracting step and recorded in advance in the program information database including a plurality of program information, for each character. An evaluation value calculating step for calculating an evaluation value indicating similarity between both program titles by evaluating a portion where characters match with a recorded program title and an arrangement of matching characters, and the evaluation value When the predetermined condition is satisfied, the selected program title and the recorded program title are the same program title. It is characterized by comprising a determination step of constant to.

上記方法によれば、評価値算出ステップにて、両番組タイトル間の評価値を算出し、判定ステップにて、算出された距離に基づき、両番組タイトル間の同一性を判定する。評価値算出ステップにおける評価値は、文字ごとの一致/不一致と、文字列の並びの一致/不一致との両方に基づいて算出されるので、連続して一致する文字列数の制限を受けずに、同一性の判定を行える。したがって、番組タイトルの表記の揺らぎ(特に省略表記など)に対応し、番組の同一性の判定における精度を向上させることが可能となる。   According to the above method, the evaluation value between the two program titles is calculated in the evaluation value calculating step, and the identity between the two program titles is determined based on the calculated distance in the determining step. Since the evaluation value in the evaluation value calculation step is calculated based on both the match / mismatch for each character and the match / mismatch of the character string sequence, there is no limitation on the number of character strings that are continuously matched. , Identity can be determined. Accordingly, it is possible to cope with fluctuations in the notation of program titles (particularly, abbreviated notation) and to improve the accuracy in determining the identity of programs.

なお、上記番組データ処理装置、録画装置、再生装置、または、情報表示装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各手段として動作させることにより上記番組データ処理装置、録画装置、再生装置、または、情報表示装置をコンピュータにて実現させる上記番組データ処理装置、録画装置、再生装置、または、情報表示装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。   The program data processing device, the recording device, the playback device, or the information display device may be realized by a computer. In this case, the program data processing device, The program data processing device, the recording device, the playback device, or the control program for the information display device for realizing the recording device, the playback device, or the information display device by a computer, and a computer-readable recording medium on which the control program is recorded Falls within the scope of the present invention.

本発明に係る番組データ処理装置は、番組に関する情報を示す番組情報から、番組の番組タイトルを抽出するタイトル抽出手段と、上記タイトル抽出手段によって抽出された、ユーザにより選択された番組の選択番組タイトルと、上記タイトル抽出手段によって抽出され、複数の番組情報からなる番組情報データベースにあらかじめ記録されている、番組の記録番組タイトルとを文字ごとに比較し、上記選択番組タイトルと上記記録番組タイトルとの間で文字が一致する部分と、一致する文字の配列とを評価することにより、両番組タイトル間の類似性を示す評価値を算出する評価値算出手段と、上記評価値が、所定の条件を満たす場合に、上記選択番組タイトルと上記記録番組タイトルとは同一番組のタイトルであると判定する判定手段とを備えている。したがって、番組タイトルの表記の揺らぎ(特に省略表記など)に対応し、番組の同一性の判定における精度を向上させることができるという効果を奏する。   The program data processing apparatus according to the present invention includes a title extraction unit that extracts a program title of a program from program information indicating information related to the program, and a selected program title of the program selected by the user extracted by the title extraction unit. And the recorded program title of the program, which is extracted by the title extracting means and recorded in advance in the program information database including a plurality of program information, for each character, the selected program title and the recorded program title Evaluation value calculating means for calculating an evaluation value indicating the similarity between both program titles by evaluating a portion where the characters match between each other and an arrangement of the matching characters, and the evaluation value satisfies a predetermined condition A determination means for determining that the selected program title and the recorded program title are the titles of the same program when they are satisfied; It is provided. Therefore, it is possible to cope with fluctuations in the notation of program titles (particularly, abbreviated notation) and to improve the accuracy in determining the identity of programs.

本発明の一実施形態について図面に基づいて説明すると以下の通りである。なお、本実施形態では、本発明の番組データ処理装置を、録画機能を有するデジタルテレビ放送受信装置(以下単に、デジタルテレビと称する)に適用した場合について説明する。   An embodiment of the present invention is described below with reference to the drawings. In the present embodiment, the case where the program data processing apparatus of the present invention is applied to a digital television broadcast receiving apparatus (hereinafter simply referred to as digital television) having a recording function will be described.

〔デジタルテレビの構成〕
図2は、本実施形態に係るデジタルテレビ100の概略構成を示すブロック図である。
[Configuration of digital TV]
FIG. 2 is a block diagram showing a schematic configuration of the digital television 100 according to the present embodiment.

図2に示すように、本実施形態に係るデジタルテレビ100は、操作部8、制御部10、デジタル放送用のチューナおよび復調部11、TS(トランスポートストリーム)デコーダ12、AV(オーディオビジュアル)デコーダ13、録画処理部14、グラフィックス生成部15、画像重畳部16、インターフェース17、音声出力部18、映像出力部19、および、記録部20を備えた構成となっている。   As shown in FIG. 2, the digital television 100 according to this embodiment includes an operation unit 8, a control unit 10, a digital broadcasting tuner and demodulation unit 11, a TS (transport stream) decoder 12, and an AV (audio visual) decoder. 13, a recording processing unit 14, a graphics generation unit 15, an image superposition unit 16, an interface 17, an audio output unit 18, a video output unit 19, and a recording unit 20.

なお、音声出力部18と映像出力部19とで、出力部9を構成している。以下、音声出力部18と映像出力部19とを特に区別する必要がない場合には、出力部9と称する。   The audio output unit 18 and the video output unit 19 constitute an output unit 9. Hereinafter, the audio output unit 18 and the video output unit 19 are referred to as the output unit 9 when it is not necessary to distinguish between them.

制御部10は、デジタルテレビ100を統括制御するものである。制御部10は、内部に、EPG処理部1、録画制御部2、操作受付部3、放送データ取得部4、EPG取得部5、出力制御部6、および、録画番組管理部7を有する。   The control unit 10 performs overall control of the digital television 100. The control unit 10 includes an EPG processing unit 1, a recording control unit 2, an operation receiving unit 3, a broadcast data acquisition unit 4, an EPG acquisition unit 5, an output control unit 6, and a recorded program management unit 7.

EPG処理部1は、デジタルテレビ100が取得したEPGデータを用いて、各種処理を行う。なお、このEPG処理部1と記録部20とで、本発明に係る番組データ処理装置を実現しているが、このEPG処理部1および記録部20の詳細については後述する。   The EPG processing unit 1 performs various processes using the EPG data acquired by the digital television 100. The EPG processing unit 1 and the recording unit 20 realize a program data processing apparatus according to the present invention. Details of the EPG processing unit 1 and the recording unit 20 will be described later.

操作受付部3は、ユーザから操作部8を介してデジタルテレビ100に送られる指示信号を受け付け、指示信号を制御部10の各部に供給する。例えば、特定の番組を録画する指示信号や、ユーザが視聴するために、特定の放送局に選局を行う指示信号などを受け付ける。録画制御部2は、操作受付部3から供給される指示信号に応じて、受信した番組の録画処理を行う。放送データ取得部4は、テレビジョン放送の番組を放送する各番組放送局200から、映像や音声などからなる番組の放送データを取得する。EPG取得部5は、上記各番組放送局200から、各番組放送局200が放送する各番組についての詳細情報を示す番組情報を取得し、EPG(電子番組表)(番組情報データベース)として、記録部20に記録する。出力制御部6は、取得した上記放送データや、EPGとして記録した番組情報を、出力部9を制御してユーザに提示する。録画番組管理部7は、録画制御部2の制御により、記録部20に記録された録画番組のデータを管理し、操作部8からのユーザの指示に応じて、記録部20のデータを読み出して、記録されている録画番組データを整理したり、録画番組データの一覧をユーザに提示したりするなどの処理を行う。   The operation reception unit 3 receives an instruction signal sent from the user to the digital television 100 via the operation unit 8 and supplies the instruction signal to each unit of the control unit 10. For example, an instruction signal for recording a specific program or an instruction signal for selecting a specific broadcast station for viewing by a user is received. The recording control unit 2 performs recording processing for the received program in response to the instruction signal supplied from the operation receiving unit 3. The broadcast data acquisition unit 4 acquires broadcast data of a program composed of video and audio from each program broadcast station 200 that broadcasts a television broadcast program. The EPG acquisition unit 5 acquires program information indicating detailed information about each program broadcast by each program broadcast station 200 from each program broadcast station 200 and records it as an EPG (electronic program guide) (program information database). Part 20 is recorded. The output control unit 6 controls the output unit 9 to present the acquired broadcast data and program information recorded as EPG to the user. The recorded program management unit 7 manages the data of the recorded program recorded in the recording unit 20 under the control of the recording control unit 2, and reads out the data in the recording unit 20 in accordance with a user instruction from the operation unit 8. Then, processing such as organizing the recorded program data recorded or presenting a list of recorded program data to the user is performed.

なお、EPG取得部5は、番組放送局200の他にも、上記番組情報を提供するEPG提供装置300から番組情報を取得してEPGを記録部20に記録することもできる。本実施形態では、上記EPG提供装置300として、例えば、インターネットやLAN(Local Area Network)を介してEPGデータをクライアント端末に配信するサーバ装置や、EPGデータを記録した外部記録装置などが考えられる。この場合、EPG取得部5は、インターフェース17を介して、外部との通信の処理を行って、番組情報を取得する。   In addition to the program broadcast station 200, the EPG acquisition unit 5 can also acquire program information from the EPG providing apparatus 300 that provides the program information and record the EPG in the recording unit 20. In the present embodiment, as the EPG providing apparatus 300, for example, a server apparatus that distributes EPG data to client terminals via the Internet or a LAN (Local Area Network), an external recording apparatus that records EPG data, and the like are conceivable. In this case, the EPG acquisition unit 5 performs communication processing with the outside via the interface 17 and acquires program information.

なお、制御部10内部の上記各部材(1〜7)は、CPUまたはMPUなどの演算手段(コンピュータ)が記憶装置に格納されたプログラムを実行し、図示しない入出力回路などの周辺回路を制御することによって実現される機能ブロックである。   In addition, each said member (1-7) inside the control part 10 performs the program stored in the memory | storage device by arithmetic means (computer), such as CPU or MPU, and controls peripheral circuits, such as an input / output circuit which is not shown in figure. It is a functional block realized by doing.

出力部9を構成する音声出力部18は、デジタルテレビ100が有する音声信号を音声として出力するものであり、例えば、スピーカなどで実現される。映像出力部19は、デジタルテレビ100が有する映像、および/または、画像信号を、映像および/または画像として表示する表示手段であり、例えば、LCD(液晶ディスプレイ)、PDP(プラズマディスプレイパネル)、またはCRT(cathode-ray tube)ディスプレイなどの表示装置で実現される。   The audio output unit 18 constituting the output unit 9 outputs an audio signal of the digital television 100 as audio, and is realized by, for example, a speaker. The video output unit 19 is display means for displaying video and / or image signals of the digital television 100 as video and / or images. For example, an LCD (liquid crystal display), a PDP (plasma display panel), or This is realized by a display device such as a CRT (cathode-ray tube) display.

操作部8は、デジタルテレビ100を動作させるための信号を入力する信号入力手段である。本実施形態では、例えば、デジタルテレビ100自体に設けられた第1操作部8aと、デジタルテレビ100外部でリモート操作するためのリモートコントローラ(リモコン)等を用いる第2操作部8bとで構成されている。   The operation unit 8 is a signal input unit that inputs a signal for operating the digital television 100. In the present embodiment, for example, a first operation unit 8 a provided in the digital TV 100 itself and a second operation unit 8 b using a remote controller (remote controller) for remote operation outside the digital TV 100 are included. Yes.

リモコンとしての第2操作部8bの正面図の例を図3に示す。図3に示すとおり、上記第2操作部8bには、例えば、送信側(リモコン側)において、カーソルを動かすための十字キー81、指示を確定させるための決定キー82、チャンネル番号の入力を行うためのテンキー83、チャンネルおよび音量の増減を指示するための上下ボタン84、電源のON/OFF指示を入力するための電源ボタン85など、種々の指示を受け付けるボタンが設けられている。受信側(受光部側)において、リモコン側の各キー操作による指示信号(例えば赤外線による信号)を受光する受光手段(図示せず)を有しており、受光手段によって受光された指示信号は、制御部10の操作受付部3に送られる。   An example of a front view of the second operation unit 8b as a remote controller is shown in FIG. As shown in FIG. 3, for example, on the transmission side (remote control side), the cross key 81 for moving the cursor, the enter key 82 for confirming the instruction, and the channel number are input to the second operation unit 8b. There are provided buttons for receiving various instructions such as a numeric keypad 83, an up / down button 84 for instructing increase / decrease in channel and volume, and a power button 85 for inputting a power ON / OFF instruction. The receiving side (light receiving unit side) has a light receiving means (not shown) that receives an instruction signal (for example, an infrared signal) by each key operation on the remote control side, and the instruction signal received by the light receiving means is: It is sent to the operation reception unit 3 of the control unit 10.

なお、本実施形態に係る第2操作部8bでは、携帯電話などと同様に、番号を入力するためのボタンが、文字を入力するためのボタンと兼用されている。ユーザは、第2操作部8bを用いて、文字を入力するためのモードに切り換えられている状態で、番号のボタンを決められた回数押すことによって、所望のひらがなや記号を入力できる。また、入力されたひらがなや記号を、十字キー81および決定キー82を押下して変換することによって、漢字の入力を行うこともできる。   In the second operation unit 8b according to the present embodiment, a button for inputting a number is also used as a button for inputting characters, as in the case of a mobile phone or the like. The user can input a desired hiragana or symbol by pressing the number button a predetermined number of times while the mode is switched to the mode for inputting characters using the second operation unit 8b. In addition, the input hiragana and symbols can be converted by pressing the cross key 81 and the enter key 82 to input kanji.

次に、本実施形態に係るデジタルテレビ100において、番組放送局200から送信される、放送データや番組情報などを含むデジタル放送信号が受信されてから出力されるまでの流れとともに、デジタルテレビ100の残りの各構成要素について説明する。なお、本発明に係るデジタルテレビ100は、以下の各構成要素に限定されない。   Next, in the digital television 100 according to the present embodiment, along with the flow from reception to output of a digital broadcast signal including broadcast data and program information transmitted from the program broadcast station 200, the digital television 100 The remaining components will be described. The digital television 100 according to the present invention is not limited to the following components.

上記デジタル放送用のチューナおよび復調部11は、アンテナ(図示せず)を通じてデジタル放送信号が供給されると、受信信号の選局を行った後、その信号形態に従った復調および誤り訂正を行い、多重化デジタルデータを形成し、この多重化デジタルデータをTSデコーダ12に出力する。   When a digital broadcast signal is supplied through an antenna (not shown), the digital broadcast tuner and demodulator 11 selects a received signal and then performs demodulation and error correction according to the signal form. Then, multiplexed digital data is formed, and this multiplexed digital data is output to the TS decoder 12.

TSデコーダ12は、チューナおよび復調部11より出力された多重化デジタルデータをデコードしてTSを抽出し、目的別のTSパケットに分離して後段のAVデコーダ13および制御部10に出力する。ここで、TSとは固定長のTSパケットが連続した信号列のことであり、各TSパケットは、映像・音声信号以外に番組情報や選局に必要な情報などのデータ信号を含むことがある。ここでは、抽出したTSを、AVデコーダ13への出力用の、映像・音声信号を含むTSパケット(放送データ)と、制御部10への出力用の、番組情報関連のデータ信号を含むTSパケット(番組情報)とに分離する。   The TS decoder 12 decodes the multiplexed digital data output from the tuner and demodulator 11 to extract a TS, separates the TS into purpose-specific TS packets, and outputs them to the AV decoder 13 and the controller 10 at the subsequent stage. Here, TS is a signal sequence of continuous fixed-length TS packets, and each TS packet may include data signals such as program information and information necessary for channel selection in addition to video / audio signals. . Here, the extracted TS includes TS packets (broadcast data) including video / audio signals for output to the AV decoder 13 and TS packets including data signals related to program information for output to the control unit 10. (Program information).

AVデコーダ13は、TSデコーダ12からのTSパケット(放送データ)をデコードし、音声信号および映像信号を形成する。   The AV decoder 13 decodes the TS packet (broadcast data) from the TS decoder 12 to form an audio signal and a video signal.

なお、本実施形態では、デジタルテレビ100は、テレビ放送番組の録画機能を有しているので、さらに、録画処理部14を備えている。録画処理部14は、録画制御部2より番組の録画指示を受け付けると、指示された期間、AVデコーダ13から供給された、指定されたチャンネルの番組を、例えば、記録部20や、インターフェース17を介して接続可能な外部記憶装置400などを構成する記録媒体に記録する。なお、記録媒体としては、番組を録画できるものであれば、どのような記録媒体であってもよく、例えば、ビデオテープのようなテープ状記録媒体、例えば、DVD(Digital Video Disc)、あるいは、ハードディスクのようなディスク状記録媒体、例えば、フラッシュメモリのような半導体メモリなどが好適に使用される。また、録画処理部14は、ネットワークなどの通信経路を経由して、他の装置に設けられた記録媒体に記録してもよい。   In the present embodiment, the digital television 100 has a recording function for a television broadcast program, and thus further includes a recording processing unit 14. When the recording processing unit 14 receives an instruction to record a program from the recording control unit 2, the recording channel unit 14 supplies the program of the designated channel supplied from the AV decoder 13 for the specified period, for example, through the recording unit 20 or the interface 17. To an external storage device 400 that can be connected via the recording medium. The recording medium may be any recording medium as long as it can record a program, for example, a tape-shaped recording medium such as a video tape, such as a DVD (Digital Video Disc), or A disk-shaped recording medium such as a hard disk, for example, a semiconductor memory such as a flash memory is preferably used. Further, the recording processing unit 14 may record on a recording medium provided in another device via a communication path such as a network.

なお、録画処理部14が非アクティブの状態である場合には、AVデコーダ13は、音声信号であれば音声出力部18へ、映像信号であれば画像重畳部16へ、それぞれ直接出力する。   When the recording processing unit 14 is in an inactive state, the AV decoder 13 directly outputs the audio signal to the audio output unit 18 and the video signal to the image superimposing unit 16 respectively.

グラフィックス生成部15は、画像重畳部16へ出力するための、OSD(On Screen Display)情報を形成する。このOSD情報は、記録部20に記憶された各種情報、例えば、複数の番組情報から作成されるEPG(電子番組表)、ユーザがデジタルテレビ100を操作するためのメニュー画面(GUI)などである。ユーザが、録画を指示するための操作画面や、録画番組リストからの検索結果などもOSD情報に含まれる。   The graphics generating unit 15 forms OSD (On Screen Display) information to be output to the image superimposing unit 16. This OSD information is various information stored in the recording unit 20, for example, an EPG (electronic program guide) created from a plurality of program information, a menu screen (GUI) for the user to operate the digital television 100, and the like. . The OSD information includes an operation screen for the user to instruct recording, a search result from the recorded program list, and the like.

より詳細には、例えば、EPGを映像出力部19に表示させる場合、チューナおよび復調部11と、TSデコーダ12とにより抽出された、番組情報関連のデータ信号を含むTSパケット(番組情報)は、EPG取得部5によって取得され、EPGとして記録部20に記録される。EPG処理部1は、操作部8からのユーザの指示に応じて、この記録部20に記録されたEPGを加工し、出力制御部6は、グラフィックス生成部15を制御して、該EPGを重畳させるためのOSD画像を生成する。   More specifically, for example, when displaying an EPG on the video output unit 19, a TS packet (program information) including a data signal related to program information extracted by the tuner and demodulator 11 and the TS decoder 12 is: Acquired by the EPG acquisition unit 5 and recorded in the recording unit 20 as an EPG. The EPG processing unit 1 processes the EPG recorded in the recording unit 20 in accordance with a user instruction from the operation unit 8, and the output control unit 6 controls the graphics generation unit 15 to convert the EPG. An OSD image to be superimposed is generated.

画像重畳部16は、AVデコーダ13にてデコードされた映像信号と、EPGなどの上記OSD画像とを重ね合わせ映像出力部19に送る。これにより、上述の放送データによる映像信号と、EPGなどのOSD情報とを1つの表示画面に重ねて表示させることが可能となる。   The image superimposing unit 16 sends the video signal decoded by the AV decoder 13 and the OSD image such as EPG to the superimposed video output unit 19. As a result, the video signal based on the broadcast data and OSD information such as EPG can be displayed on one display screen.

なお、本実施形態では、番組は、複数のチャンネルのいずれかで放送されており、チューナおよび復調部11は、これら複数チャンネルのうち、所望のチャンネルの番組を受信できる。放送データ取得部4は、チューナおよび復調部11、TSデコーダ12、および、AVデコーダ13を制御することによって、ユーザが指定した、視聴したい番組の放送データを取得する機能を実現し、録画制御部2は、録画処理部14の制御をして、ユーザが所望する番組を録画する。   In the present embodiment, the program is broadcast on one of a plurality of channels, and the tuner and demodulator 11 can receive a program on a desired channel among the plurality of channels. The broadcast data acquisition unit 4 controls the tuner and demodulation unit 11, the TS decoder 12, and the AV decoder 13, thereby realizing a function of acquiring broadcast data of a program that the user wants to view and a recording control unit. 2 controls the recording processing unit 14 to record a program desired by the user.

以上のことから、デジタルテレビ100は、操作受付部3が、操作部8を介して、選局(番組の視聴)指示を受け付けると、指定されたチャンネルの番組の映像信号および音声信号を、出力部9に出力させて、ユーザに、当該チャンネルの番組を視聴させることができる。また、ユーザから録画指示を受け付けると、指定されたチャンネルの番組の映像信号および音声信号を、記録部20などに録画(記録)させることができる。   From the above, when the operation reception unit 3 receives a channel selection (program viewing) instruction via the operation unit 8, the digital television 100 outputs the video signal and audio signal of the program of the designated channel. It is possible to cause the user to view the program of the channel by outputting to the unit 9. When a recording instruction is received from the user, the video signal and audio signal of the program of the designated channel can be recorded (recorded) in the recording unit 20 or the like.

本発明のデジタルテレビ100は、上述の選局指示や、録画指示に基づく各種処理を実行する際に、記録部20に記録されたEPGの番組情報に含まれる、放送番組の番組名(以下、番組タイトルと称する)を用いる。デジタルテレビ100に適用された番組データ処理装置により、上記番組タイトルを用いて、ユーザが指定する番組を特定し、特定した番組に対する各種処理を実行することが可能となる。より具体的には、ある特定の番組の番組情報と他の番組の番組情報との照合を行うことにより、それらが、同一番組か否かの判定を行う。これにより、例えば、デジタルテレビ100は、ユーザが指定した番組と同一と判断した他の番組を、一度の指定によって、連続番組またはシリーズ番組として連続で、自動で録画することができる。また、すでに録画している番組の番組情報を使って録画番組を自動分類して整理することもできる。   When the digital television 100 of the present invention executes the above-described channel selection instruction and various processes based on the recording instruction, the program name of the broadcast program (hereinafter referred to as “program name”) included in the EPG program information recorded in the recording unit 20 is described below. Called program title). The program data processing apparatus applied to the digital television 100 can specify a program designated by the user using the program title and execute various processes on the specified program. More specifically, by comparing the program information of a specific program with the program information of another program, it is determined whether or not they are the same program. Thereby, for example, the digital television 100 can automatically and continuously record other programs determined to be the same as the program designated by the user as a continuous program or a series program by one designation. It is also possible to automatically classify and organize recorded programs using program information of programs already recorded.

以下、本発明に係る番組データ処理装置を実現する、EPG処理部1および記録部20の詳細について説明する。   Details of the EPG processing unit 1 and the recording unit 20 that implement the program data processing apparatus according to the present invention will be described below.

〔番組データ処理装置の構成〕
図1は、本実施形態に係るデジタルテレビ100に適用した、EPG処理装置101の要部構成を示すブロック図である。
[Configuration of program data processing apparatus]
FIG. 1 is a block diagram showing a main configuration of an EPG processing apparatus 101 applied to the digital television 100 according to the present embodiment.

EPG処理装置101は、図1に示すとおり、EPG処理部1と、EPG処理部1が読み出しおよび書き込みを行う記録部20とを備えた構成となっており、EPG処理部1は、さらに、タイトル抽出部30、類似性距離算出部40、省略パターン照合部50、同一番組判定部60、および、データ取得部70を有している。また、記録部20は、さらに、EPG記録部21、辞書記録部22、抽出タイトル一時保持部23、距離テーブル記録部24、および、録画番組記録部25を有している。   As shown in FIG. 1, the EPG processing apparatus 101 includes an EPG processing unit 1 and a recording unit 20 that the EPG processing unit 1 reads and writes. The EPG processing unit 1 further includes a title. It has an extraction unit 30, a similarity distance calculation unit 40, an abbreviated pattern matching unit 50, an identical program determination unit 60, and a data acquisition unit 70. The recording unit 20 further includes an EPG recording unit 21, a dictionary recording unit 22, an extracted title temporary storage unit 23, a distance table recording unit 24, and a recorded program recording unit 25.

まず、記録部20に記録される各記録部について詳細に説明する。   First, each recording unit recorded in the recording unit 20 will be described in detail.

EPG記録部21は、EPG取得部5により、番組放送局200またはEPG提供装置300から取得された複数の番組情報からなるEPGを記録するものである。図4(a)は、EPG取得部5が取得する、1つの番組の番組情報を示す図であり、(b)は、1つの番組情報を1レコードとして、複数の番組情報をデータベース化したEPGテーブル(番組情報データベース)を示す図である。番組情報は、番組ごとに図4(b)に示すEPGテーブルに追加(あるいは、更新)される。   The EPG recording unit 21 records an EPG composed of a plurality of program information acquired by the EPG acquisition unit 5 from the program broadcast station 200 or the EPG providing device 300. 4A is a diagram showing program information of one program acquired by the EPG acquisition unit 5, and FIG. 4B is an EPG in which a plurality of program information is converted into a database with one program information as one record. It is a figure which shows a table (program information database). Program information is added (or updated) to the EPG table shown in FIG. 4B for each program.

ユーザが番組欄を、映像出力部19(図2)表示させる指示をデジタルテレビ100に対して送信したときは、図4(b)のEPGテーブルのデータに基づいて、番組欄のOSD画像が生成される。   When the user transmits an instruction to display the program column to the video output unit 19 (FIG. 2) to the digital television 100, an OSD image of the program column is generated based on the data of the EPG table of FIG. Is done.

なお、本実施形態では、EPG取得部5が取得する番組情報の項目は、「放送局(名)」、「放送開始時間」、「放送終了時間」、「ジャンル」、「番組タイトル」、および、「番組内容」としたが、上記に限定されない。EPG取得部5は、番組放送局200またはEPG提供装置300が提供する、番組に関する他のいずれの項目を取得し、EPGテーブルに格納してもよい。   In the present embodiment, the items of the program information acquired by the EPG acquisition unit 5 are “broadcast station (name)”, “broadcast start time”, “broadcast end time”, “genre”, “program title”, and “Program contents” is not limited to the above. The EPG acquisition unit 5 may acquire any other item related to the program provided by the program broadcast station 200 or the EPG providing apparatus 300 and store it in the EPG table.

さらに、本実施形態では、上記EPGテーブルには、上記の項目に加えて、項目「番組タイトル」に格納されている情報から、タイトル抽出部30が、番組のタイトルを示す部分のみを抽出したものを格納するための項目「変換タイトル」が設けられている。ここに記録されている番組タイトルは、「記録番組タイトル」として、同一番組を判定する際の、比較対象として取り扱われる。なお、タイトル抽出部30が、項目「番組タイトル」から、項目「変換タイトル」を抽出する方法については、後述する。   Further, in the present embodiment, in addition to the above items, in the EPG table, the title extraction unit 30 extracts only the portion indicating the title of the program from the information stored in the item “program title”. The item “conversion title” is stored. The program title recorded here is handled as a “recorded program title” as a comparison target when determining the same program. A method in which the title extraction unit 30 extracts the item “converted title” from the item “program title” will be described later.

辞書記録部22は、タイトル抽出部30が、漢字−かな変換を行う際に参照する辞書を記録するものである。辞書記録部22を用いて、タイトル抽出部30は、抽出した文字列に含まれる漢字をひらがなに変換したり、文字列の形態素解析を行ったりすることが可能となる。   The dictionary recording unit 22 records a dictionary that the title extraction unit 30 refers to when performing kanji-kana conversion. Using the dictionary recording unit 22, the title extraction unit 30 can convert kanji included in the extracted character string into hiragana or perform morphological analysis of the character string.

抽出タイトル一時保持部23は、操作受付部3(図2)が、操作部8を介して受け付けた、ユーザからの選局指示や、録画指示などが指定する番組(つまり、ユーザが選択した番組)の番組タイトルを一時的に記憶するものである。なお、タイトル抽出部30が、選局指示や、録画指示などに含まれるユーザが選択した番組の番組タイトルから抽出する「選択番組タイトル」は、ここに記憶され、同一番組を判定する際に用いられる。   The extracted title temporary storage unit 23 is a program specified by a user's channel selection instruction or recording instruction received by the operation reception unit 3 (FIG. 2) via the operation unit 8 (that is, a program selected by the user). ) Is temporarily stored. Note that the “selected program title” extracted from the program title of the program selected by the user included in the channel selection instruction, the recording instruction, etc., is stored here and used when determining the same program. It is done.

距離テーブル記録部24は、類似性距離算出部40が、番組タイトル間の類似性距離(評価値)を算出する際に参照する各種距離テーブルを記録するものである。番組タイトル間の類似性距離とは、EPG処理部1が実行するマッチング処理において、比較を行う両番組タイトルの類似性を数値化したものである。距離が小さければ小さいほど、両者の類似性は高いと判断され、本実施形態では、一定の閾値(ここでは、0.5)を下回れば、両者は同一番組のタイトルであるとみなされる。   The distance table recording unit 24 records various distance tables that the similarity distance calculating unit 40 refers to when calculating the similarity distance (evaluation value) between program titles. The similarity distance between program titles is obtained by quantifying the similarity between both program titles to be compared in the matching process executed by the EPG processing unit 1. It is determined that the smaller the distance is, the higher the similarity between the two is. In this embodiment, if the distance is below a certain threshold (here, 0.5), both are regarded as the titles of the same program.

したがって、距離テーブルとは、類似性距離算出部40の各部が、両番組タイトルの比較を行う際に、番組タイトルの文字の種々の属性(文字コード、文字種、品詞など)が一致するか否かでどれだけの距離が加算されるのかを示したテーブルのことである。図5(a)〜(d)は、類似性距離算出部40が参照する距離テーブルの例を示した図である。例えば、図5(a)において、横の各項目51を、上記「記録番組タイトル」を形成する文字の属性、縦の各項目52を、上記「選択番組タイトル」を形成する文字の属性であるとする。両番組タイトルのある文字について比較を行った結果、両文字ともに「あ」を示すと判定された場合、一致していると評価されて、距離は加算されない。反対に、一方の文字が「い」を示すと判定された場合、文字は不一致と評価され、加算するべき距離として「1」が導出される。距離の算出に加味する、比較するべき文字の属性の数だけ、距離テーブル記録部24に記録しておく。   Therefore, the distance table indicates whether or not the various attributes (character code, character type, part of speech, etc.) of the characters of the program title match when each unit of the similarity distance calculation unit 40 compares both program titles. This is a table showing how much distance is added. 5A to 5D are diagrams illustrating examples of distance tables referred to by the similarity distance calculation unit 40. FIG. For example, in FIG. 5A, each horizontal item 51 is an attribute of a character forming the “recorded program title”, and each vertical item 52 is an attribute of a character forming the “selected program title”. And As a result of comparison of certain characters in both program titles, if it is determined that both characters indicate “A”, they are evaluated as matching and the distance is not added. On the other hand, if it is determined that one character indicates “yes”, the character is evaluated as a mismatch and “1” is derived as the distance to be added. The distance table recording unit 24 records the number of character attributes to be compared in consideration of the distance calculation.

本実施形態では、(1)文字コード(文字自体の一致不一致)、(2)文字種(漢字、ひらがな、カタカナ、数字、記号など)、(3)品詞(名詞、動詞、形容詞、形容動詞など)、および、(4)文字列を形態素ごとに区切ったときの形態素間の境界線の有無、4つの属性の一致/不一致を加味して両番組タイトル間の距離を算出するので、距離テーブルを4種類用意し、それぞれを距離テーブル記録部24に記録しておく。   In this embodiment, (1) character codes (characters do not match), (2) character types (kanji, hiragana, katakana, numbers, symbols, etc.), (3) parts of speech (nouns, verbs, adjectives, adjective verbs, etc.) (4) Since the distance between the two program titles is calculated taking into account the presence / absence of a boundary line between the morphemes when the character string is divided for each morpheme, and matching / mismatching of the four attributes, the distance table is 4 Types are prepared and recorded in the distance table recording unit 24.

録画番組記録部25は、録画処理部14(図2)が録画した、録画番組のデータを、該録画した番組の番組タイトル(以下、録画番組タイトルと称す)に対応付けて記録するものである。なお、この録画番組タイトルは、タイトル抽出部30によって、録画番組の元の番組名から抽出されたものである。ユーザは、操作部8を用いて、録画番組の番組タイトルを選択することにより、所望の録画番組を再生することが可能となる。   The recorded program recording unit 25 records the recorded program data recorded by the recording processing unit 14 (FIG. 2) in association with the program title of the recorded program (hereinafter referred to as a recorded program title). . The recorded program title is extracted from the original program name of the recorded program by the title extraction unit 30. The user can play back a desired recorded program by selecting a program title of the recorded program using the operation unit 8.

なお、録画番組タイトルとともに、放送日時(録画日時)も対応付けて記録しておけば、ユーザが録画番組を検索する際の利便性が向上する。   If the broadcast date and time (recording date and time) are recorded in association with the recorded program title, the convenience when the user searches for the recorded program is improved.

省略パターン記録部26は、省略パターン照合部50が参照する、番組タイトルの典型的な省略のパターンを記録するものである。2つの番組タイトルにおいて、一方の番組タイトルが、もう一方の番組タイトルの省略表記である場合、どのように省略されているのか、その省略のパターンを典型省略パターンと照合することによって、両番組タイトルが、本当に同一番組の正式表記、省略表記の関係にあるのか否かを判定することが可能となる。典型省略パターンの詳細については後述する。   The omitted pattern recording unit 26 records a typical omitted pattern of the program title referred to by the omitted pattern matching unit 50. In two program titles, if one program title is an abbreviation notation for the other program title, both program titles are checked by comparing the omitted pattern with the typical omitted pattern. However, it is possible to determine whether or not the same program is in a formal notation or abbreviated notation. Details of the typical omission pattern will be described later.

上記のEPG記録部21、辞書記録部22、距離テーブル記録部24、録画番組記録部25、および、省略パターン記録部26は、例えばハードディスク装置などの不揮発性の記録媒体によって実現される。また、抽出タイトル一時保持部23は、例えばRAM(Random Access Memory)などのワークメモリによって実現される。   The EPG recording unit 21, the dictionary recording unit 22, the distance table recording unit 24, the recorded program recording unit 25, and the omitted pattern recording unit 26 are realized by a non-volatile recording medium such as a hard disk device. The extracted title temporary storage unit 23 is realized by a work memory such as a RAM (Random Access Memory).

なお、上記複数の番組情報を記録するEPGテーブル(あるいは、距離テーブル)のデータ構造としては、テーブル構造を採用したが、これに限定されず、1つの番組タイトルからその他の番組情報の項目を読み出せるように(文字(文字列)の属性から加算すべき距離が導き出せるように)構成されたデータ構造であればなんでもよい。   Note that the data structure of the EPG table (or distance table) that records the plurality of program information is a table structure, but is not limited to this, and other program information items are read from one program title. Any data structure may be used as long as it is structured so that the distance to be added can be derived from the attribute of the character (character string).

次に、EPG処理部1が有する各部の機能について、図1に基づき詳細に説明する。   Next, the function of each unit included in the EPG processing unit 1 will be described in detail with reference to FIG.

(番組タイトル抽出機能)
タイトル抽出部30は、図4(b)のEPGテーブルのような、各番組情報に含まれる番組タイトルから「記録番組タイトル」を、また、操作部8を介して入力された、ユーザが指定する番組の番組タイトルから「選択番組タイトル」を抽出するものである。タイトル抽出部30は、不要語除去部31、全角変換部32、かな文字変換部33、および、形態素解析部34を有している。
(Program title extraction function)
The title extraction unit 30 designates a “recorded program title” from program titles included in each program information, such as the EPG table of FIG. 4B, and is designated by the user input via the operation unit 8. The “selected program title” is extracted from the program title of the program. The title extraction unit 30 includes an unnecessary word removal unit 31, a full-width conversion unit 32, a kana character conversion unit 33, and a morpheme analysis unit 34.

不要語除去部31は、番組タイトルに含まれている不要語を除去するものである。不要語とは、図6に示すような番組タイトルに付属している記号のことを指す。より具体的には、例えば、本来の番組名に放送属性として付与された記号、番組の前後で放送されるニュースや天気予報などを表す記号や文字列などである。不要語除去部31は、このような不要語を、特定して除去し、番組名を示す文字列のみを番組タイトルとして抽出する。図6の「除去後」のカラムは、不要語としての放送属性を表す記号が除去された、本来の番組名を形成する文字列からなる番組タイトルを示す。   The unnecessary word removing unit 31 removes unnecessary words included in the program title. The unnecessary word refers to a symbol attached to the program title as shown in FIG. More specifically, for example, a symbol assigned to the original program name as a broadcast attribute, a symbol or a character string representing news or weather forecasts broadcast before and after the program, and the like. The unnecessary word removing unit 31 identifies and removes such unnecessary words, and extracts only the character string indicating the program name as the program title. The “post-removal” column in FIG. 6 shows a program title made up of a character string forming the original program name from which symbols representing broadcast attributes as unnecessary words have been removed.

全角変換部32は、不要語を除去したのちの番組タイトルに、英数や記号などの半角文字が含まれる場合、その半角文字を全角文字に変換し、文字列を全角に統一する。半角文字は、文字の表示領域(容量)が限られている場合によく使用される。同じ番組に対して、半角文字列で番組タイトルを表す場合と、全角文字列で表す場合があるので、これを類似性距離算出部40が、異なる文字であると判断しないように、ここで、全半角による不一致を吸収する。   The full-width conversion unit 32 converts a half-width character into a full-width character and unifies the character string into a full-width character when the program title after removing unnecessary words includes a half-width character such as an alphanumeric or a symbol. Single-byte characters are often used when the character display area (capacity) is limited. Since the program title may be represented by a single-byte character string and a full-width character string for the same program, the similarity distance calculation unit 40 does not determine that it is a different character. Absorb inconsistencies due to full-width characters.

かな文字変換部33は、番組タイトルを形成する文字列に漢字、カタカナなどのひらがな以外の文字が含まれている場合に、それらをかな文字列(ひらがな)に変換するものである。   When the character string forming the program title includes characters other than hiragana such as kanji and katakana, the kana character conversion unit 33 converts them into a kana character string (hiragana).

例えば、上述の特許文献2には、DPマッチング手法(動的計画法)を使って、類似文例をグルーピングする方法が記載されている。しかし、特許文献2に記載の方法は、単に文字コードの一致だけで文例間の距離を求め、類似性を判定しているため、以下の問題を生じる。すなわち、例えば、正式名「ためしてガッテン」なる番組が「合点」と省略される場合、番組タイトルに含まれる文字列を文字コードに基づきそのままマッチングしたのでは、一致する文字列が一字もないことになり、これらを同一番組と判断することができない。かな文字変換部33により、表記の揺らぎ(特に漢字/カタカナ、ひらがなといった文字種の異なる表記など)に対応して、番組の同一性の判定における精度をさらに向上させることが可能となる。   For example, Patent Document 2 described above describes a method of grouping similar sentence examples using a DP matching method (dynamic programming). However, since the method described in Patent Document 2 determines the similarity by determining the distance between sentence examples simply by matching the character codes, the following problem occurs. That is, for example, if a program with the official name “Take Gaten” is abbreviated as “going point”, if the character string included in the program title is matched as it is based on the character code, there is no matching character string. Therefore, these cannot be determined as the same program. The kana character conversion unit 33 can further improve the accuracy in determining the identity of a program in response to fluctuations in notation (particularly notation with different character types such as kanji / katakana and hiragana).

かな文字変換部33は、辞書記録部22を参照して、番組タイトルに含まれる、漢字またはカタカナをひらがなに変換する。図7に番組タイトルをかな文字列に変換した例を示す。すべてひらがなに変換された番組タイトルは、それが、EPG記録部21のEPGテーブルの項目「番組タイトル」から抽出されたものであれば、「記録番組タイトル」として、EPGテーブルの項目「変換タイトル」へ格納される。また、それが、ユーザによって操作部8から入力された指示信号から抽出されたものであれば、「選択番組タイトル」として、抽出タイトル一時保持部23へ格納される。このとき、かな文字変換部33は、各文字の文字種がどのように変わったかの情報も保持しておく。例えば、図7に示すとおり、「がってん」の4文字は、元は「ガッテン」のカタカナ4文字であったことを示す変換履歴情報を、EPG記録部21あるいは、抽出タイトル一時保持部23に記録しておく。   The kana character conversion unit 33 refers to the dictionary recording unit 22 and converts kanji or katakana included in the program title into hiragana. FIG. 7 shows an example in which the program title is converted into a kana character string. If the program title converted into all hiragana is extracted from the item “program title” in the EPG table of the EPG recording unit 21, the item “converted title” in the EPG table is used as “recorded program title”. Stored in If it is extracted from the instruction signal input from the operation unit 8 by the user, it is stored in the extracted title temporary storage unit 23 as “selected program title”. At this time, the kana character conversion unit 33 also retains information on how the character type of each character has changed. For example, as shown in FIG. 7, the conversion history information indicating that the four characters “Gatten” were originally four characters of “Gatten” is recorded in the EPG recording unit 21 or the extracted title temporary storage unit 23. Keep it.

形態素解析部34は、辞書記録部22を参照して、両番組タイトル(すなわち、上記EPG記録部21に格納されている「記録番組タイトル」と抽出タイトル一時保持部23に格納されている「選択番組タイトル」とを形態素解析するものである。形態素解析部34も、かな文字変換部33と同様、番組タイトルを形成する文字列の形態素解析を行った結果を、形態素間の境界位置とともに、形態素ごとに品詞を対応付けて記録する。   The morphological analysis unit 34 refers to the dictionary recording unit 22, and selects both program titles (ie, “recorded program title” stored in the EPG recording unit 21 and “selected title temporary storage unit 23”). The morpheme analysis unit 34, like the kana character conversion unit 33, analyzes the result of the morpheme analysis of the character string forming the program title along with the boundary position between the morphemes. Each part of speech is associated and recorded.

上述のようにして、全角・ひらがなに変換され、形態素解析が行われた「記録番組タイトル」および「選択番組タイトル」は、変換履歴情報および形態素解析結果とともに、類似性距離算出部40によって、類似性を表す類似性距離を算出するために用いられる。変換履歴情報および形態素解析結果を用いることにより、類似性距離を算出する精度は向上し、結果として、番組同一性の判定の精度を向上させることが可能となる。   As described above, the “recorded program title” and the “selected program title” that have been converted into full-width and hiragana and subjected to morpheme analysis are similar by the similarity distance calculation unit 40 together with the conversion history information and the morpheme analysis result. It is used to calculate the similarity distance representing the sex. By using the conversion history information and the morphological analysis result, the accuracy of calculating the similarity distance is improved, and as a result, the accuracy of the program identity determination can be improved.

(マッチング機能)
類似性距離算出部40は、タイトル抽出部30が抽出した番組タイトル同士の類似性距離を算出するものである。類似性距離算出部40は、さらに、文字コード間距離算出部41、文字種間距離算出部42、品詞間距離算出部43、および、境界位置距離算出部44を有している。また、同一番組判定部60は、類似性距離算出部40が算出した番組タイトル間の類似性距離に基づき、両番組タイトルが同一の番組を示しているか否かを判定するものである。
(Matching function)
The similarity distance calculation unit 40 calculates the similarity distance between program titles extracted by the title extraction unit 30. The similarity distance calculation unit 40 further includes a character code distance calculation unit 41, a character type distance calculation unit 42, a part-of-speech distance calculation unit 43, and a boundary position distance calculation unit 44. The same program determination unit 60 determines whether or not both program titles indicate the same program based on the similarity distance between program titles calculated by the similarity distance calculation unit 40.

上述したとおり、類似性距離とは、比較を行う両番組タイトルの類似性を数値化したものであり、距離が小さければ小さいほど、両者の類似性は高いと判断される。本実施形態では、同一番組判定部60は、一定の閾値(0.5)を下回れば、両者は同一番組のタイトルであると判定する。   As described above, the similarity distance is a numerical value of the similarity between both program titles to be compared, and the smaller the distance, the higher the similarity between both. In this embodiment, if the same program determination part 60 is less than a fixed threshold value (0.5), it will determine with both being the title of the same program.

文字コード間距離算出部41は、EPG記録部21に格納された「記録番組タイトル」と、抽出タイトル一時保持部23に格納された「選択番組タイトル」とを文字ごとに照合し、両番組タイトル間で文字コードが一致する文字同士、および、一致する文字の配列の同一性とを、類似性が高いと評価することにより、両番組タイトルの類似性距離を算出するものである。文字コード間距離算出部41は、文字コード間の距離d1(in,jm)を、例えば、図5(a)に示す、距離テーブル記録部24に記録された、文字コード間距離テーブルを用いて求める。   The character code distance calculation unit 41 collates the “recorded program title” stored in the EPG recording unit 21 with the “selected program title” stored in the extracted title temporary storage unit 23 for each character, The similarity distance between the program titles is calculated by evaluating that the characters having the same character code and the identity of the matching character sequences are highly similar. The inter-character code distance calculation unit 41 uses the inter-character code distance table recorded in the distance table recording unit 24 shown in FIG. 5A, for example, as the distance d1 (in, jm) between the character codes. Ask.

なお、上記d1(in,jm)の「in」,「jm」はそれぞれ、i個の文字からなる「記録番組タイトル」のn番目の文字、j個の文字からなる「選択番組タイトル」のm番目の文字を示す。   It should be noted that “in” and “jm” in the above d1 (in, jm) are the nth character of the “record program title” composed of i characters and the m of the “selected program title” composed of j characters, respectively. Indicates the second character.

文字種間距離算出部42は、両番組タイトルを形成する文字同士の変換履歴情報を比較し、両番組タイトル間で、ひらがなに変換される前の文字種が一致することを、類似性が高いと評価することにより、両番組タイトルの類似性距離を算出するものである。文字種間距離算出部42は、文字種間の距離d2(in,jm)を、例えば、図5(b)に示す、距離テーブル記録部24に記録された、文字種間距離テーブルを用いて求める。   The character type distance calculation unit 42 compares the conversion history information between the characters forming both program titles, and evaluates that the character types before the hiragana conversion match between the two program titles as having high similarity. By doing so, the similarity distance between the program titles is calculated. The inter-character-type distance calculation unit 42 obtains the inter-character-type distance d2 (in, jm) using, for example, the inter-character-type distance table recorded in the distance table recording unit 24 shown in FIG.

品詞間距離算出部43は、上記形態素解析結果を用いて、両番組タイトルを形成する文字同士の比較を行い、その文字が属する形態素の品詞が一致することを、類似性が高いと評価することにより、両番組タイトルの類似性距離を算出するものである。品詞間距離算出部43は、品詞間の距離d3(in,jm)を、例えば、図5(c)に示す、距離テーブル記録部24に記録された、品詞間距離テーブルを用いて求める。   The part-of-speech distance calculation unit 43 compares the characters that form both program titles using the morpheme analysis result, and evaluates that the part-of-speech of the morpheme to which the characters belong matches is highly similar. Thus, the similarity distance between the program titles is calculated. The part-of-speech distance calculation unit 43 obtains the part-of-speech distance d3 (in, jm) using, for example, the part-of-speech distance table recorded in the distance table recording unit 24 shown in FIG.

境界位置距離算出部44は、上記形態素解析結果を用いて、文字コードが一致した文字列同士の形態素間の境界位置を照合し、上記文字列において境界位置(あるいは、境界位置の有無)が一致することを、類似性が高いと評価することにより、両番組タイトルの類似性距離を算出するものである。上記形態素解析結果には、文字ごとに、当該文字の前(および後)に境界があるか否かを示す情報が記録されている。境界位置距離算出部44は、境界位置の距離d4(in,jm)を、例えば、図5(d)に示す、距離テーブル記録部24に記録された、境界位置距離テーブルを用いて求める。   The boundary position distance calculation unit 44 uses the morpheme analysis result to collate the boundary positions between the morphemes of the character strings having the matched character codes, and the boundary positions (or the presence / absence of the boundary positions) match in the character strings. The similarity distance between both program titles is calculated by evaluating that the similarity is high. In the morphological analysis result, information indicating whether or not there is a boundary before (and after) the character is recorded for each character. The boundary position distance calculation unit 44 obtains the boundary position distance d4 (in, jm) using, for example, a boundary position distance table recorded in the distance table recording unit 24 shown in FIG.

なお、図5(a)〜(d)に示す、文字属性ごとの全距離テーブルには、その属性が一致すれば「0」(すなわち、類似性距離を加算しない)、一致しなければ、累積された類似性距離にさらに「1」を加算するよう、数値が設定されているが、本発明の距離テーブルは、図5(a)〜(d)に示す例に限定されない。例えば、文字種が一致することよりも、品詞が一致することの方が、同一性を評価する上で重要であると考えられる場合には、品詞間距離テーブルにおいて、一致しない場合に加算される類似性距離がもっと大きくなるように、「2」や「3」などの、文字種間距離テーブルに設定されている数値よりも大きい数値を設定することも可能である。   Note that the total distance table for each character attribute shown in FIGS. 5A to 5D is “0” (that is, the similarity distance is not added) if the attribute matches, and is accumulated if the attribute does not match. Although a numerical value is set so that “1” is further added to the similarity distance, the distance table of the present invention is not limited to the examples shown in FIGS. For example, if it is considered that matching part-of-speech is more important for evaluating the identity than matching character types, the similarity that is added when there is no match in the part-of-speech distance table It is also possible to set a numerical value larger than the numerical value set in the character type distance table, such as “2” or “3”, so that the sex distance becomes larger.

以下、「記録番組タイトル」=「ためしてがってん(抽出前タイトル;ためしてガッテン)」(以下、単にタイトルXと称す)と、「選択番組タイトル」=「がってん(抽出前タイトル;合点)」(以下、単にタイトルYと称す)との類似性距離を算出する場合を例にあげ、より詳細に説明する。   In the following, “record program title” = “testing title (pre-extraction title; trial title)” (hereinafter simply referred to as title X) and “selected program title” = “gaten (pre-extraction title; combined point)” (hereinafter simply referred to as “title”). The case of calculating the similarity distance with the title Y) will be described in detail as an example.

類似性距離の算出は、例えば、DPマッチング法(Dynamic programming matching method;動的計画法)と呼ばれる方式を用いて行う。番組タイトル間の類似性距離(Dt)は、番組タイトルを形成する文字間の類似性距離(d(in,jm))の累積(D(i,j))を、両番組タイトルの文字数の和によって、割る(正規化する)ことにより算出される。   The similarity distance is calculated using, for example, a method called a DP matching method (Dynamic programming matching method). The similarity distance (Dt) between program titles is the sum (D (i, j)) of similarity distances (d (in, jm)) between characters forming the program title, the sum of the numbers of characters of both program titles. Is calculated by dividing (normalizing).

すなわち、   That is,

Figure 0004619915
Figure 0004619915

となる。
ここで、D(i,j)は、文字数iのタイトルXと、文字数jのタイトルYとの累積類似性距離を表す。
It becomes.
Here, D (i, j) represents the cumulative similarity distance between the title X with the number of characters i and the title Y with the number of characters j.

次に、上記累積類似性距離D(i,j)の求め方について説明する。   Next, how to determine the cumulative similarity distance D (i, j) will be described.

DPマッチング法では、類似性距離算出部40は、累積類似性距離を算出するために、上記2つの番組タイトルを形成する文字列を1文字ずつ比較した2次元のテーブルを作成する。図8(a)、(b)は、類似性距離算出部40が作成する2次元テーブルの例を示す図である。図8には、横軸にタイトルX(ためしてがってん)を、縦軸にタイトルY(がってん)とを配置した例を示す。ここで、タイトルXの文字数は8、タイトルYの文字数は4であるので、8(i)×4(j)=32マスからなる2次元テーブルを作成する。   In the DP matching method, the similarity distance calculation unit 40 creates a two-dimensional table that compares the character strings forming the two program titles one by one in order to calculate the cumulative similarity distance. FIGS. 8A and 8B are diagrams illustrating an example of a two-dimensional table created by the similarity distance calculation unit 40. FIG. 8 shows an example in which a title X is placed on the horizontal axis and a title Y is placed on the vertical axis. Here, since the number of characters of title X is 8 and the number of characters of title Y is 4, a two-dimensional table consisting of 8 (i) × 4 (j) = 32 squares is created.

図8(a)の2次元テーブルのマスに表示されている数値は、その文字同士までの累積類似性距離を示している。例えば、マス目61に表示されている数値は、タイトルXの「ためして」の4文字と、タイトルYの「がって」の3文字までをマッチングした段階での累積類似性距離が格納されている。つまり、マス目61の数値をみれば、「ためして」と「がって」の累積類似性距離(D(4,3))は、5と算出されていることが分かる。   The numerical value displayed in the square of the two-dimensional table in FIG. 8A indicates the cumulative similarity distance between the characters. For example, the numerical value displayed in the grid 61 stores the accumulated similarity distance at the stage of matching up to 4 characters of “test” of title X and 3 characters of “gatte” of title Y. Yes. That is, from the numerical value of the grid 61, it can be seen that the cumulative similarity distance (D (4,3)) of “try” and “gatte” is calculated as 5.

図8(b)の2次元テーブルのマスに表示されている矢印は、最後の文字同士の類似性距離が算出され、最終的な累積類似性距離が算出される際に、その累積類似性距離(ここでは、D(8,4))が最小の値をとるように選択された径路(最短パス)を示している。したがって、最後の文字同士の比較結果が反映される、マス目62に表示されている数値が、文字数8のタイトルXと、文字数4のタイトルYとの累積類似性距離となる。   The arrows displayed in the squares of the two-dimensional table in FIG. 8B indicate the accumulated similarity distance when the similarity distance between the last characters is calculated and the final accumulated similarity distance is calculated. A path (shortest path) selected so that (here, D (8, 4)) takes the minimum value is shown. Therefore, the numerical value displayed in the grid 62, which reflects the comparison result between the last characters, is the cumulative similarity distance between the title X with 8 characters and the title Y with 4 characters.

上記の累積類似性距離D(i,j)、すなわち、最短パスは、例えば、以下の式によって求められる。   The cumulative similarity distance D (i, j), that is, the shortest path is obtained by the following equation, for example.

すなわち、   That is,

Figure 0004619915
Figure 0004619915

となる。
ここで、d(i,j)は、文字数iのタイトルXのi(最終)番目の文字と、文字数jのタイトルYのj(最終)番目の文字との間の類似性距離を表す。
It becomes.
Here, d (i, j) represents the similarity distance between the i (final) th character of the title X having the number of characters i and the j (final) th character of the title Y having the number of characters j.

つまり、マス目62に表示される、「ためしてがってん」(タイトルX)と「がってん」(タイトルY)との間の累積類似性距離は、マス目62の1つ前のマス目(マス目63〜65のうちいずれか1つ)における累積類似性距離に、当該文字間(タイトルXの8番目の文字「ん」と、タイトルYの4番目の文字「ん」との間の類似性距離)を加算したものである。   In other words, the cumulative similarity distance between “Tarete Gaten” (title X) and “Gaten” (title Y) displayed in the cell 62 is the cell immediately before the cell 62 (the cells 63 to 63). 65 (according to any one of 65) between the characters (similarity distance between the eighth character “n” of title X and the fourth character “n” of title Y) It is an addition.

最短パスの候補としては、マス目63からマス目62に到達した場合(式1)、マス目64からマス目62に到達した場合(式2)、および、マス目65からマス目62に到達した場合(式3)の3つが考えられるので、上記3つの式のうち、算出された値が最小の値をとるものが、タイトルXとタイトルYとの間の累積類似性距離として算出される。   As shortest path candidates, when reaching the grid 62 from the grid 63 (Formula 1), when reaching the grid 62 from the grid 64 (Formula 2), and reaching the grid 62 from the grid 65 In this case, since the three equations (Equation 3) can be considered, the one that has the smallest calculated value among the above three equations is calculated as the cumulative similarity distance between the title X and the title Y. .

なお、数2に示す、式2における「2×」は、パスの重みを示す。例えば、本実施形態においては、図8(a)の2次元テーブルにおいて、マス目64からマス目62に直接進む場合と、マス目63を経てマス目62に進む場合とで、加算される距離が最終的に同じになるよう、「2×」の重みが設定されている。しかしこの重みの値は上記に限定されない。   Note that “2 ×” in Equation 2 shown in Equation 2 indicates the weight of the path. For example, in the present embodiment, in the two-dimensional table of FIG. 8A, the distance that is added when the cell advances directly from the cell 64 to the cell 62 and when the cell advances through the cell 63 to the cell 62. Is set to a weight of “2 ×” so that the two finally become the same. However, the value of this weight is not limited to the above.

また、本実施形態では、上記最短パスを対称型のパスによって求めるために、上記累積類似性距離D(i,j)を、数2に示す式を用いて求めることとしたが、これに限定されない。例えば、上記最短パスを非対称型のパスによって求める構成であっても、それに合わせて上記累積類似性距離D(i,j)を求める式を用意し、累積類似性距離D(i,j)を算出ことができる。   In the present embodiment, the cumulative similarity distance D (i, j) is obtained using the equation shown in Equation 2 in order to obtain the shortest path using a symmetric path. However, the present invention is not limited to this. Not. For example, even if the shortest path is obtained by an asymmetric path, an equation for obtaining the cumulative similarity distance D (i, j) is prepared accordingly, and the cumulative similarity distance D (i, j) is calculated as follows. Can be calculated.

上記各式1〜3のd(i,j)は、直前までの累積類似性距離に対して加算するべき文字間の類似性距離を表す。文字間の類似性距離は、以下の式によって求められる。
d(in,jm)=d1(in,jm)・・・式4
ここで、d(in,jm)は、文字数iのタイトルXのn番目の文字と、文字数jのタイトルYのm番目の文字との間の類似性距離を表すものとする。
D (i, j) in the above equations 1 to 3 represents the similarity distance between characters to be added to the cumulative similarity distance up to immediately before. The similarity distance between characters is obtained by the following equation.
d (in, jm) = d1 (in, jm) Equation 4
Here, d (in, jm) represents the similarity distance between the nth character of the title X having the number of characters i and the mth character of the title Y having the number of characters j.

上記式4に示される、d1(in,jm)は、上述したとおり、文字コード間距離算出部41が、距離テーブル記録部24の文字コード間距離テーブルを参照して求めた、文字コード間の距離である。   As described above, d1 (in, jm) shown in the above equation 4 is the character code distance calculation unit 41 obtained by referring to the character code distance table of the distance table recording unit 24 as described above. Distance.

文字間の類似性距離の算出方法は、上記に限定されない。本実施形態では、(1)文字コード(文字自体の一致不一致)に加え、さらに、(2)文字種(漢字、ひらがな、カタカナ、数字、記号など)、(3)品詞(名詞、動詞、形容詞、形容動詞など)、および、(4)文字列を形態素ごとに区切ったときの形態素間の境界位置の有無、4つの属性の一致/不一致を加味して文字間の距離を算出する。   The method for calculating the similarity distance between characters is not limited to the above. In this embodiment, in addition to (1) the character code (matching / mismatching of the character itself), (2) character type (kanji, hiragana, katakana, numbers, symbols, etc.), (3) part of speech (noun, verb, adjective, (4) The distance between characters is calculated by taking into account the presence / absence of a boundary position between morphemes when a character string is divided for each morpheme, and matching / mismatching of four attributes.

この場合、文字間の類似性距離は、以下の式によって求められる。
d(in,jm)=α×d1(in,jm)+β×d2(in,jm)+γ×d3(in,jm)+δ×d4(in,jm)・・・式5
ここで、d2(in,jm)は、文字種間距離算出部42が算出した文字種間の距離を示し、d3(in,jm)は、品詞間距離算出部43が算出した品詞間の距離を示し、d4(in,jm)は、境界位置距離算出部44が算出した、境界位置の有無に係る距離を示している。
In this case, the similarity distance between characters is obtained by the following equation.
d (in, jm) = α × d1 (in, jm) + β × d2 (in, jm) + γ × d3 (in, jm) + δ × d4 (in, jm) Equation 5
Here, d2 (in, jm) represents the distance between character types calculated by the character type distance calculation unit 42, and d3 (in, jm) represents the distance between parts of speech calculated by the inter-part of speech distance calculation unit 43. , D4 (in, jm) indicates the distance related to the presence or absence of the boundary position calculated by the boundary position distance calculation unit 44.

なお、上記式5のα、β、γ、および、δのように、算出される各距離に重み付けを設けてもよい。つまり、文字の属性ごとに、その一致/不一致が、両番組タイトルの同一性を判定する上で、どの程度重要であるかによって、重みを設定することができる。   It should be noted that each calculated distance may be weighted like α, β, γ, and δ in Equation 5 above. That is, for each character attribute, a weight can be set depending on how important the match / mismatch is in determining the identity of both program titles.

例えば、図5に示すように、各距離テーブルにおいて、不一致の場合に加算される類似性距離が一様に「1」だった場合に、品詞間の一致に重みを与えたいときは、上記式5において、「γ」の値を他の重み付け値に比べて大きくなるように設定すればよい。これにより、より精度の高い類似性距離(および、累積類似性距離)を算出することができ、番組タイトルの同一性を判定する精度を向上させることが可能となる。   For example, as shown in FIG. 5, in each distance table, when the similarity distance added in the case of mismatch is uniformly “1”, when it is desired to give a weight to the match between parts of speech, the above formula 5, the value of “γ” may be set so as to be larger than other weighting values. Thereby, it is possible to calculate the similarity distance (and the cumulative similarity distance) with higher accuracy, and to improve the accuracy of determining the identity of the program title.

図9(a)〜(c)は、上述した方法に基づいて、タイトルXとタイトルYとの間の類似性距離Dtを算出した例を示す図である。なお、図9に示す例では、説明を簡略化するために、文字コード間距離算出部41が、距離テーブル記録部24の文字コード間距離テーブルを参照して求めた、文字コード間の距離d1(in,jm)のみによって、両番組タイトル間の類似性距離を算出した場合について説明する。   FIGS. 9A to 9C are diagrams illustrating an example in which the similarity distance Dt between the title X and the title Y is calculated based on the above-described method. In the example shown in FIG. 9, the character code distance calculation unit 41 refers to the character code distance table of the distance table recording unit 24 to simplify the description, and the distance d1 between character codes. The case where the similarity distance between both program titles is calculated only by (in, jm) will be described.

図9(a)に示すとおり、「ためしてガッテン」と「合点」のマッチングを行う場合、タイトル抽出部30が、「ためしてがってん(タイトルX)」と「がってん(タイトルY)」とを抽出し、類似性距離算出部40が、両番組タイトル間の類似性距離(Dt)を以下のとおり算出する。   As shown in FIG. 9A, when performing “matching gatten” and “matching point” matching, the title extraction unit 30 extracts “testing (title X)” and “gaten (title Y)”, and similar. The sex distance calculation unit 40 calculates the similarity distance (Dt) between the program titles as follows.

Figure 0004619915
Figure 0004619915

なお、本実施形態では、小数点第4位を四捨五入して類似性距離(Dt)を求めているがこれに限定されない。 In this embodiment, the similarity distance (Dt) is obtained by rounding off the fourth decimal place, but the present invention is not limited to this.

同様に、図9(b)の例では、「冬のソナタ」と「冬ソナ」とのマッチングを行っている。「ふゆのそなた(タイトルX)」と「ふゆそな(タイトルY)」との間の類似性距離(Dt)は、Dt=2/(6+4)より「0.2」と算出される。図9(c)の例では、「ためしてガッテン」と「冬ソナ」とのマッチングを行っている。両番組タイトル間の類似性距離(Dt)は、Dt=12/(8+4)より「1.0」と算出される。   Similarly, in the example of FIG. 9B, matching between “winter sonata” and “winter sonata” is performed. The similarity distance (Dt) between “Fuyu sona (title X)” and “Fuyu sona (title Y)” is calculated as “0.2” from Dt = 2 / (6 + 4). In the example of FIG. 9C, matching is performed between “try Gatten” and “winter sona”. The similarity distance (Dt) between both program titles is calculated as “1.0” from Dt = 12 / (8 + 4).

同一番組判定部60は、上述のとおり算出された番組タイトル間の類似性距離(Dt)が所定の閾値より小さい場合、両番組タイトルを有する番組を同一番組と判定する。上述したとおり、閾値を「0.5」とすると、同一番組判定部60は、図9(a)のケース(「ためしてガッテン」と「合点」との類似性距離:0.417)と、図9(b)のケース(「冬のソナタ」と「冬ソナ」との類似性距離:0.2)とを、同一番組と判定する。   When the similarity distance (Dt) between program titles calculated as described above is smaller than a predetermined threshold, the same program determination unit 60 determines that programs having both program titles are the same program. As described above, when the threshold value is set to “0.5”, the same program determination unit 60 displays the case of FIG. 9A (similarity distance between “That Gatten” and “Point”: 0.417), FIG. The case of 9 (b) (similarity distance between “Winter Sonata” and “Winter Sonata”: 0.2) is determined as the same program.

上記構成によれば、類似性距離算出部40がDPマッチング法を用いて、両番組タイトル間の類似性距離を算出し、同一番組判定部60が、算出された距離に基づき、両番組タイトル間の同一性を判定する。連続して一致する文字列数の制限を受けずに、同一性の判定を行えるので、番組タイトルの表記の揺らぎ(特に省略表記など)に対応し、番組の同一性の判定における精度を向上させることが可能となる。   According to the above configuration, the similarity distance calculation unit 40 calculates the similarity distance between the two program titles using the DP matching method, and the same program determination unit 60 determines whether the two program titles are based on the calculated distance. Determine the identity of. Since it is possible to determine identity without being limited by the number of consecutively matched character strings, it is possible to cope with fluctuations in the notation of program titles (especially abbreviations etc.) and improve accuracy in determining the identity of programs. It becomes possible.

さらに、本実施形態では、タイトル抽出部30のかな文字変換部33が、番組タイトルをかな文字列に統一してマッチングを行い、距離を算出するので、EPGに記録されている番組タイトルとの同一性を判断する上で、文字種の違いを吸収し、番組の同一性の判定をより高い精度で行うことが可能となる。   Furthermore, in this embodiment, the kana character conversion unit 33 of the title extraction unit 30 unifies the program title into a kana character string and performs matching to calculate the distance, so that the same as the program title recorded in the EPG. In determining the sex, it is possible to absorb the difference in the character type and to determine the identity of the program with higher accuracy.

さらに、かな文字変換部33は、文字列をひらがなに変換する際に、変換前の文字種を記録しておくので、文字種間距離算出部42は、変換前の文字種の一致/不一致を加味して、類似性距離を算出することができる。これにより、表記の揺らぎ(特に漢字/カタカナ、ひらがなといった文字種の異なる表記など)に対応して、番組の同一性の判定における精度をさらに向上させることが可能となる。   Furthermore, since the kana character conversion unit 33 records the character type before conversion when converting the character string to hiragana, the inter-character type distance calculation unit 42 takes into account the match / mismatch of the character type before conversion. The similarity distance can be calculated. Accordingly, it is possible to further improve the accuracy in determining the identity of a program in response to fluctuations in notation (particularly notation of different character types such as kanji / katakana and hiragana).

なお、本実施形態では、番組タイトル間の類似性距離を算出するときに、「番組タイトル」以外の番組情報(放送局名、番組ジャンル、放送時間など)を用いていないが、これらの情報を用いて、番組タイトルの同一性判定を行うことが可能である。あらかじめEPG記録部21に格納されている、全番組のタイトル情報(項目「番組タイトル」や「変換タイトル」(図4参照))のうち、「選択番組タイトル」との比較対象となる、「記録番組タイトル」を絞り込むようにしてもよい。   In the present embodiment, when calculating the similarity distance between program titles, program information other than the “program title” (broadcast station name, program genre, broadcast time, etc.) is not used. It is possible to determine the identity of program titles. Among the title information (items “program title” and “conversion title” (see FIG. 4)) of all programs stored in the EPG recording unit 21 in advance, “recording target” to be compared with “selected program title” You may make it narrow down "program title".

例えば、連続番組やシリーズ番組などは、同一の放送局、同一の番組ジャンルで、毎日または毎週ほぼ決まった時間帯に放送されるので、これらの情報を用いて、同一と判定される候補としての、比較対象となる番組タイトルを絞り込めば、上述の類似性距離の算出の処理をより効率的に行うことが可能となる。この場合、類似性距離算出部40が、EPG記録部21を参照し、例えば、「同一の放送局」という条件を満たすレコードのみを抽出して、抽出したレコードに含まれる「記録番組タイトル」のみを、比較対象として持ちいればよい。   For example, continuous programs and series programs are broadcast on the same broadcasting station and the same program genre every day or almost every week, so these information can be used as candidates to be determined to be the same. If the program titles to be compared are narrowed down, the similarity distance calculation process described above can be performed more efficiently. In this case, the similarity distance calculation unit 40 refers to the EPG recording unit 21 and extracts, for example, only the record that satisfies the condition “same broadcast station”, and only the “record program title” included in the extracted record. As a comparison target.

なお、同一番組判定部60が、番組同一性の判定を行うときに用いる閾値は、例えば、記録部20の閾値保持部(図示せず)に格納されている。この閾値は、番組の同一性を判定する上で適切な閾値があらかじめ定められているものとする。本実施形態では、「距離0.5」が閾値として定められ、0.5以下であれば、同一、0.5を越えれば同一でないと判定するものとするが、閾値は上記限定されず、また、任意に設定を変更することができるような構成としてもよい。   Note that the threshold used when the same program determination unit 60 determines the program identity is stored in, for example, a threshold holding unit (not shown) of the recording unit 20. It is assumed that an appropriate threshold is determined in advance for determining the identity of a program. In the present embodiment, “distance 0.5” is defined as a threshold value. If the distance is 0.5 or less, it is determined that the distance is the same, and if it exceeds 0.5, the threshold value is not limited. Moreover, it is good also as a structure which can change a setting arbitrarily.

(省略ターン照合機能)
省略パターン照合部50は、番組タイトルが、省略表記されるときの典型的な省略パターンと、類似性距離算出部40が類似性距離を算出した両番組タイトル間の省略パターンとを照合するものである。省略パターン照合部50は、省略パターン記録部26に記録される典型省略パターンとの照合の結果、両番組タイトル間でなされた省略パターンが、上記各典型省略パターンから外れると判定した場合に、当該両番組タイトルは同一でないとみなす。
(Optional pattern matching function)
The abbreviated pattern collation unit 50 collates a typical abbreviated pattern when a program title is abbreviated with an abbreviated pattern between both program titles calculated by the similarity distance calculation unit 40. is there. When the omission pattern collation unit 50 determines that the omission pattern made between the program titles deviates from each of the typical omission patterns as a result of collation with the typical omission pattern recorded in the omission pattern recording unit 26, Both program titles are considered not identical.

これにより、類似性距離算出部40において、本来は異なる番組の番組タイトルであるのに、算出された類似性距離から同一と判定されてしまう番組タイトル対を同一でないとみなして、同一番組候補からふるい落とすことができる。結果として、番組の同一性判定の精度を向上させることができる。   As a result, the similarity distance calculation unit 40 regards the program title pairs that are originally determined to be the same from the calculated similarity distance, although they are originally program titles of different programs, from the same program candidate. Can be eliminated. As a result, the accuracy of program identity determination can be improved.

図10は、省略パターン記録部26に記録される、典型省略パターンの例を示す図である。番組タイトルの省略は、図10に示すように、例えば、以下の5つに分類することができる。
省略パターン(1)
正式番組タイトルを構成する、単語のうち、先頭の単語で代用するパターン。例えば、「福祉ネットワーク」を「福祉」と省略する。
省略パターン(2)
正式番組タイトルを構成する、単語のうち、最後尾の単語で代用するパターン。例えば、「ためしてガッテン」を「ガッテン」や「合点」と省略する。
省略パターン(3)
正式番組タイトルを構成する、単語のうち、特徴的な中間部の単語で代用するパターン。例えば、「出動!ミニスカポリス」を「ミニスカ」と省略する。
省略パターン(4)
正式番組タイトルに含まれる助詞を省くパターン。例えば、「冬のソナタ」を「冬ソナ」と省略するとき、助詞「の」が省かれている。
省略パターン(5)
正式番組タイトルを構成する、1つの単語の一部を省略するパターン。例えば、「冬のソナタ」を「冬ソナ」と省略するとき、名詞「ソナタ」の「タ」が省略されている。
FIG. 10 is a diagram illustrating an example of a typical omitted pattern recorded in the omitted pattern recording unit 26. The omission of the program title can be classified into, for example, the following five as shown in FIG.
Omission pattern (1)
A pattern that substitutes the first word among the words that make up the official program title. For example, “welfare network” is abbreviated as “welfare”.
Omission pattern (2)
A pattern that substitutes the last word of the words that make up the official program title. For example, “try and gatten” is abbreviated as “gatten” and “joining point”.
Omission pattern (3)
Of the words that make up the official program title, a pattern that is substituted with a characteristic middle word. For example, “Departure! Miniskapolis” is abbreviated as “Miniska”.
Omission pattern (4)
A pattern that omits particles included in the official program title. For example, when “winter sonata” is omitted as “winter sonata”, the particle “no” is omitted.
Omission pattern (5)
A pattern in which a part of one word constituting the official program title is omitted. For example, when “winter sonata” is abbreviated as “winter sonata”, the noun “sonata” “ta” is omitted.

なお、省略パターン記録部26に記録されている省略パターンは上記に限定されない。どのような省略パターンを、ふるい落とすかによって、典型省略パターンを任意に作成し記録することができる。   Note that the omitted patterns recorded in the omitted pattern recording unit 26 are not limited to the above. Depending on what abbreviation pattern is eliminated, a typical abbreviated pattern can be arbitrarily created and recorded.

本実施形態では、以上の省略パターンを記録しておき、省略パターン照合部50が、適宜読み出す。上記各典型省略パターンによれば、省略時にタイトルの一部として残る文字列は、少なくとも2字以上からなっている。   In the present embodiment, the above omitted patterns are recorded, and the omitted pattern matching unit 50 reads them as appropriate. According to each of the typical omission patterns, the character string remaining as a part of the title when omitted is composed of at least two characters.

したがって、閾値以下の類似性距離が算出された両番組タイトルにおいて、1文字だけが残されるような省略パターンが検出されたときは、当該両番組タイトルは、同一番組のタイトルではないとみなす。さらに、形態素解析時の形態素の品詞情報や境界位置を利用することにより、同一単語内の文字が、断続的に同一と対応付けられるような省略パターンをふるい落とすことが可能である。より具体的には、例えば、仮に「そなた」と「そた」が類似性距離に基づき同一と判定されたとしても、同一単語内で、一文字おきに断続的に対応付けられる省略パターンは無効として、「そなた」と「そた」とを同一とした判定を棄却することができる。   Therefore, when an abbreviated pattern in which only one character is left is detected in both program titles for which the similarity distance equal to or less than the threshold is calculated, the program titles are regarded as not being the titles of the same program. Furthermore, by using the part-of-speech information and the boundary position of the morpheme at the time of morpheme analysis, it is possible to filter out an abbreviated pattern in which characters in the same word are intermittently associated with the same. More specifically, for example, even if “sona” and “sota” are determined to be the same based on the similarity distance, an abbreviated pattern that is intermittently associated with every other character in the same word is It is possible to reject the determination that “you” and “you” are the same as invalid.

上述の例に基づき、類似性距離算出部40と同一番組判定部60によって、同一番組であると判定されたが、省略パターン照合部50によって、それが棄却された例について、図11に基づき具体的に説明する。   Based on the above example, the similarity distance calculation unit 40 and the same program determination unit 60 determine that the program is the same, but an example in which the omitted pattern matching unit 50 rejects it is based on FIG. I will explain it.

図11(a)、(b)は、タイトルXとタイトルYとに対して、DPマッチングを適用する際に、類似性距離算出部40が作成した2次元テーブル(および、文字ごとの類似性距離と、最短パス)を示す図であり、図11(c)、(d)は、DPマッチングによる、文字の対応付けの例を示す図である。   11A and 11B show two-dimensional tables (and similarity distances for each character) created by the similarity distance calculation unit 40 when DP matching is applied to the title X and the title Y. 11 (c) and 11 (d) are diagrams showing examples of character matching by DP matching.

類似性距離算出部40が、両番組タイトル間の類似性距離を算出した後、省略パターン照合部50は、マッチングパス(すなわち、図11(a)、(b)において、矢印により示した最短パスのこと)に基づいて、文字の対応付け(図11(c)、(d))を検証し、タイトルXとタイトルYとの間で実施された推測される省略パターンを検出する。   After the similarity distance calculation unit 40 calculates the similarity distance between the program titles, the abbreviated pattern matching unit 50 calculates the matching path (that is, the shortest path indicated by the arrow in FIGS. 11A and 11B). Based on the above, the character association (FIGS. 11C and 11D) is verified, and an estimated omission pattern performed between the title X and the title Y is detected.

省略パターン照合部50は、図11(c)に示される文字の対応付けに基づいて、「がってん」は、正式名「ためしてがってん」の前部「ためして」が省略されたと判定する。したがって、省略パターン照合部50は、上記の省略パターンを、省略パターン記録部26の各典型省略パターンと照合して、省略パターン(1)に該当することを検出し、両番組タイトルは、類似性距離に基づく判定結果と同様、同一であると判定する。   The abbreviated pattern collation unit 50 determines that the front part “trial” of “official” is omitted for “gaten” based on the character association shown in FIG. Therefore, the abbreviated pattern collation unit 50 collates the abbreviated pattern with each typical abbreviated pattern in the abbreviated pattern recording unit 26 and detects that it corresponds to the abbreviated pattern (1). Similar to the determination result based on the distance, it is determined that they are the same.

一方、省略パターン照合部50は、図11(d)に示される省略パターンに基づいて、「めがてん」は、正式名「ためしてがってん」の1番目、3番目、4番目、6番目の文字が省略されたと判定する。したがって、省略パターン照合部50は、上記の省略パターンを、省略パターン記録部26の各典型省略パターンと照合して、いずれの典型省略パターンにも該当しないことを検出し、両番組タイトルは、類似性距離に基づく判定結果とは逆に、同一でないと判定する。   On the other hand, the abbreviated pattern collation unit 50 determines that the first, third, fourth, and sixth characters of the official name “Tarete-ten” are “Gameten” based on the abbreviated pattern shown in FIG. It is determined that it is omitted. Therefore, the abbreviated pattern collation unit 50 collates the abbreviated pattern with each typical abbreviated pattern in the abbreviated pattern recording unit 26 to detect that it does not correspond to any typical abbreviated pattern, and both program titles are similar. Contrary to the determination result based on the sex distance, it is determined that they are not the same.

なお、省略パターン照合部50の照合処理は、同一番組判定部60の判定の前に実行されても、後に実行されてもよい。同一番組判定部60の同一性判定処理の前に実行される場合は、類似性距離算出部40から出力された番組タイトル対について、省略パターンの照合を行い、典型省略パターンとの照合が成功した番組タイトル対の類似性距離のみ、同一番組判定部60に供給すればよい。   In addition, the collation process of the omission pattern collation part 50 may be performed before the determination of the same program determination part 60, or may be performed after it. When executed before the identity determination process of the same program determination unit 60, the program title pair output from the similarity distance calculation unit 40 is collated with an abbreviated pattern, and the collation with the typical abbreviated pattern is successful. Only the similarity distance of the program title pair may be supplied to the same program determination unit 60.

同一番組判定部60の同一性判定処理の後に実行される場合は、同一番組判定部60によって、同一と判定された番組タイトル対についてのみ、省略パターンの照合を行い、典型省略パターンとの照合が成功した番組タイトル対のみ、データ取得部70に供給すればよい。   When executed after the identity determination process of the same program determination unit 60, only the program title pair determined to be the same by the same program determination unit 60 is compared with the omitted pattern, and the comparison with the typical omitted pattern is performed. Only successful program title pairs need be supplied to the data acquisition unit 70.

上記構成によれば、本来は異なる番組のタイトルである「ためしてがってん」と「めがてん」とが、類似性距離の算出結果から、同一番組と判定されるような場合においても、省略パターン照合部50が、典型省略パターンとの照合を行うことにより、同一番組ではないと判定する。結果として、番組の同一性判定の精度をより向上させることが可能となる。   According to the above-described configuration, even when the titles of different programs, “Tarete-ten” and “Gameten”, are determined to be the same program from the similarity distance calculation result, the omitted pattern matching unit 50 determines that it is not the same program by collating with a typical omission pattern. As a result, it is possible to further improve the accuracy of the program identity determination.

データ取得部70は、EPG処理部1における番組タイトルの同一性判定結果に基づいて、「番組タイトル」に関連付けられた種々のデータ(放送日時などの番組情報のその他の項目、録画番組の録画データなど)をEPG記録部21や、録画番組記録部25などから取得するものである。データ取得部70が取得するデータは、操作部8(図2)を介して入力される、ユーザからの指示信号に応じて変化する。   The data acquisition unit 70 performs various data associated with the “program title” (other items of program information such as broadcast date and time, recorded data of the recorded program based on the identity determination result of the program title in the EPG processing unit 1. Or the like) from the EPG recording unit 21, the recorded program recording unit 25, or the like. The data acquired by the data acquisition unit 70 changes according to an instruction signal from the user input via the operation unit 8 (FIG. 2).

上述した、図1に示すEPG処理装置101の処理の流れを、図12に基づき説明すると以下のとおりである。   The process flow of the EPG processing apparatus 101 shown in FIG. 1 described above will be described with reference to FIG.

ユーザからの選局(録画)指示などにより、EPG処理装置101に、ユーザが選択した「選択番組タイトル」が入力されると(S101においてYES)、EPG処理部1のタイトル抽出部30内部の不要語除去部31は、当該「選択番組タイトル」の不要語を除去する(S102)。次に、全角変換部32は、当該「選択番組タイトル」に含まれる半角文字を全角に変換する(S103)。形態素解析部34は、当該「選択番組タイトル」の形態素解析を行い、解析結果を記録する(S104)。続いて、かな文字変換部33は、当該「選択番組タイトル」を形成する文字をひらがなに統一する(S105)。なお記号などについては、記号のまま残すか、当該記号の通称などをひらがな表記したものへと変換してもよい。なお、タイトル抽出部30における、S102〜S105までの処理は、いずれの順番で実行されてもよい。タイトル抽出部30から出力された「選択番組タイトル」は、抽出タイトル一時保持部23に格納される。   When the “selected program title” selected by the user is input to the EPG processing device 101 in response to a channel selection (recording) instruction from the user (YES in S101), it is unnecessary in the title extraction unit 30 of the EPG processing unit 1 The word removal unit 31 removes unnecessary words of the “selected program title” (S102). Next, the full-width conversion unit 32 converts the half-width characters included in the “selected program title” into full-width characters (S103). The morpheme analysis unit 34 performs morpheme analysis on the “selected program title” and records the analysis result (S104). Subsequently, the kana character conversion unit 33 unifies the characters forming the “selected program title” in hiragana (S105). In addition, about a symbol etc., you may leave as a symbol, or you may convert into the hiragana notation of the common name of the said symbol. Note that the processing from S102 to S105 in the title extraction unit 30 may be executed in any order. The “selected program title” output from the title extraction unit 30 is stored in the extracted title temporary storage unit 23.

次に、類似性距離算出部40は、EPG記録部21から、比較対象となる「記録番組タイトル」を取得する(S106)。このとき、取得される「記録番組タイトル」は、所定の条件を満たすものだけに絞り込まれてもよい。   Next, the similarity distance calculation unit 40 acquires the “record program title” to be compared from the EPG recording unit 21 (S106). At this time, the acquired “record program titles” may be narrowed down to only those satisfying a predetermined condition.

ここで、類似性距離算出部40の各部(文字コード間距離算出部41、文字種間距離算出部42、品詞間距離算出部43、境界位置距離算出部44)によって、文字間の類似性距離、番組タイトル間の累積類似性距離が算出され、それに基づき、類似性距離算出部40は、番組タイトル間の類似性距離(Dt)を算出する(S107)。   Here, the similarity distance between characters is determined by each part of the similarity distance calculation unit 40 (character code distance calculation unit 41, character type distance calculation unit 42, part-of-speech distance calculation unit 43, boundary position distance calculation unit 44). The cumulative similarity distance between program titles is calculated, and based on this, the similarity distance calculation unit 40 calculates the similarity distance (Dt) between program titles (S107).

続いて、同一番組判定部60は、類似性距離の閾値と比較し、上記類似性距離(Dt)が、閾値以下の場合には(S108においてYES)、両番組タイトルは同一であると判定して、この番組タイトル対を、省略パターン照合部50に供給する。省略パターン照合部50は、上記番組タイトル対の省略パターンと、省略パターン記録部26に記録された典型省略パターンとの照合を行い(S109)、省略パターンが一致した場合は(S110においてYES)、上記入力された「選択番組タイトル」と、取得された「記録番組タイトル」とは同一であると判定する(S111)。続いて、同一であると判定された「記録番組タイトル」を、データ取得部70に供給する(S112)。最後に、比較対象となる「記録番組タイトル」が未処理で残っている場合には(S113においてYES)、S106からの番組同一性判定処理を繰り返す。   Subsequently, the same program determining unit 60 compares the similarity distance with a threshold value, and when the similarity distance (Dt) is equal to or smaller than the threshold value (YES in S108), it determines that both program titles are the same. Then, this program title pair is supplied to the omitted pattern matching unit 50. The abbreviated pattern collation unit 50 collates the abbreviated pattern of the program title pair with the typical abbreviated pattern recorded in the abbreviated pattern recording unit 26 (S109). If the abbreviated pattern matches (YES in S110), It is determined that the input “selected program title” and the acquired “recorded program title” are the same (S111). Subsequently, the “recorded program title” determined to be the same is supplied to the data acquisition unit 70 (S112). Finally, when the “recorded program title” to be compared remains unprocessed (YES in S113), the program identity determination process from S106 is repeated.

一方、類似性距離(Dt)が、閾値を上回ると判定された(S108においてNO)場合、あるいは、省略パターン照合に失敗した(S110においてNO)場合は、同一番組判定部60、省略パターン照合部50のそれぞれは、上記入力された「選択番組タイトル」と、取得された「記録番組タイトル」とは同一でないと判定する(S114)。   On the other hand, if it is determined that the similarity distance (Dt) exceeds the threshold (NO in S108), or if the omitted pattern matching fails (NO in S110), the same program determining unit 60, the omitted pattern matching unit Each of 50 determines that the inputted “selected program title” and the acquired “recorded program title” are not the same (S114).

上記方法によれば、類似性距離算出部40がDPマッチング法を用いて、両番組タイトル間の類似性距離を算出し、同一番組判定部60が、算出された距離に基づき、両番組タイトル間の同一性を判定する。連続して一致する文字列数の制限を受けずに、同一性の判定を行えるので、番組タイトルの表記の揺らぎ(特に省略表記など)に対応し、番組の同一性の判定における精度を向上させることが可能となる。   According to the above method, the similarity distance calculation unit 40 calculates the similarity distance between the two program titles using the DP matching method, and the same program determination unit 60 determines whether the two program titles are based on the calculated distance. Determine the identity of. Since it is possible to determine identity without being limited by the number of consecutively matched character strings, it is possible to cope with fluctuations in the notation of program titles (especially abbreviations etc.) and improve accuracy in determining the identity of programs. It becomes possible.

さらに、本実施形態では、タイトル抽出部30のかな文字変換部33が、番組タイトルをかな文字列に統一してマッチングを行い、距離を算出するので、EPGに記録されている番組タイトルとの同一性を判断する上で、文字種の違いを吸収し、番組の同一性の判定をより高い精度で行うことが可能となる。   Furthermore, in this embodiment, the kana character conversion unit 33 of the title extraction unit 30 unifies the program title into a kana character string and performs matching to calculate the distance, so that the same as the program title recorded in the EPG. In determining the sex, it is possible to absorb the difference in the character type and to determine the identity of the program with higher accuracy.

さらに、かな文字変換部33は、文字列をひらがなに変換する際に、変換前の文字種を記録しておくので、文字種間距離算出部42は、変換前の文字種の一致/不一致を加味して、類似性距離を算出することができる。これにより、表記の揺らぎ(特に漢字/カタカナ、ひらがなといった文字種の異なる表記など)に対応して、番組の同一性の判定における精度をさらに向上させることが可能となる。   Furthermore, since the kana character conversion unit 33 records the character type before conversion when converting the character string to hiragana, the inter-character type distance calculation unit 42 takes into account the match / mismatch of the character type before conversion. The similarity distance can be calculated. Accordingly, it is possible to further improve the accuracy in determining the identity of a program in response to fluctuations in notation (particularly notation of different character types such as kanji / katakana and hiragana).

以下、ユーザからの指示信号に応じて、上述のEPG処理装置101を適用したデジタルテレビ100(図2)が実現する機能の一例を、図13〜図17に基づき説明する。   Hereinafter, an example of functions realized by the digital television 100 (FIG. 2) to which the above-described EPG processing device 101 is applied according to an instruction signal from the user will be described with reference to FIGS.

(連続番組又はシリーズ番組予約処理)
次に、EPG処理装置101の同一番組判定機能を用いた、連続番組またはシリーズ番組の録画予約処理について、図13に基づき説明すると以下のとおりである。
(Continuous program or series program reservation processing)
Next, recording reservation processing for a continuous program or series program using the same program determination function of the EPG processing device 101 will be described with reference to FIG.

まず、S201において、ユーザは、録画予約を行うために、例えば、図14(a)のような番組欄(EPG記録部21のEPGテーブルに基づき作成された電子番組表)から、所望の番組を選択することで、録画したい番組の指定を行う。これにより、デジタルテレビ100は、S202以降の録画予約処理を開始する。ここでは、図14(a)において、MHKの25時35分からの「ためしてガッテン」を録画予約するとともに、シリーズ予約するように指定したとして以後の説明を行う。   First, in S201, in order to make a recording reservation, the user selects a desired program from a program column (an electronic program guide created based on the EPG table of the EPG recording unit 21) as shown in FIG. By selecting, the program to be recorded is designated. Thereby, the digital television 100 starts the recording reservation process after S202. Here, in FIG. 14 (a), the following description will be given assuming that the recording reservation is made for “That Gatten” from 25:35 of MHK and that the series reservation is designated.

デジタルテレビ100の録画制御部2は、操作部8を介して、ユーザからの録画指示を受け付けると、EPG記録部21から、指定された番組の番組タイトル「ためしてガッテン」を、指定された日時とともに録画予約リストに追加する(S202)。続いて、録画制御部2は、シリーズ予約が指定されているか否かを判断し(S203)、シリーズ予約が指定されていない場合(S203においてNO)は、他に録画すべき番組はないとして、番組の情報を録画予約処理を終了する。一方、シリーズ予約が指定されている場合(S203においてYES)は、S204にて、EPG処理部1が、上述した番組の同一性判定の処理を行い、他に録画予約リストに追加するべき番組がないか否かを検出する。   When the recording control unit 2 of the digital television 100 receives a recording instruction from the user via the operation unit 8, the recording title of the specified program “Try Gatten” from the EPG recording unit 21 together with the specified date and time. It adds to a recording reservation list (S202). Subsequently, the recording control unit 2 determines whether or not the series reservation is specified (S203). If the series reservation is not specified (NO in S203), it is determined that there is no other program to be recorded. The recording reservation process for the program information ends. On the other hand, when the series reservation is designated (YES in S203), in S204, the EPG processing unit 1 performs the above-described program identity determination process, and there is another program to be added to the recording reservation list. Detect whether there is no.

具体的には、例えば、録画制御部2は、MHKの毎日または1週間先の24時35分前後(例えば、前後2時間)の時間帯の番組情報に対して、上記同一番組判定機能を使って、番組タイトルが同一であると判定した番組が存在するか否かを検出する。EPG処理部1(図1)が、EPG記録部21から同一番組を検出できた場合は、データ取得部70が、その番組タイトルに基づいて、EPG記録部21からその番組の番組情報(放送日時など)を取得し、録画制御部2に供給する。録画制御部2は、データ取得部70が取得したデータを、録画予約リストに追加する(S205)。同一番組が検出できなかった場合、録画予約リストへの追加を行わず、録画予約処理を終了する。   Specifically, for example, the recording control unit 2 uses the same program determination function for program information in a time zone around 24:35 (for example, two hours before and after) of MHK every day or one week ahead. Thus, it is detected whether there is a program determined to have the same program title. When the EPG processing unit 1 (FIG. 1) can detect the same program from the EPG recording unit 21, the data acquisition unit 70 determines the program information (broadcast date and time) from the EPG recording unit 21 based on the program title. And the like are supplied to the recording control unit 2. The recording control unit 2 adds the data acquired by the data acquisition unit 70 to the recording reservation list (S205). If the same program cannot be detected, the recording reservation process is terminated without adding to the recording reservation list.

このように、録画予約時に、連続番組又はシリーズ番組の予約を指定することにより、タイトル名が省略されていたり、放送開始時間がずれたりしていても(図14(b))、録画制御部2は、正しく連続番組又はシリーズ番組の録画予約を行うことができるよう、録画処理部14を制御することが可能となる。   As described above, by specifying reservation of a continuous program or series program at the time of recording reservation, even if the title name is omitted or the broadcast start time is deviated (FIG. 14B), the recording control unit 2 makes it possible to control the recording processing unit 14 so that a recording reservation of a continuous program or a series program can be performed correctly.

(録画番組のフォルダ整理処理)
次に、この同一番組判定機能を使った、録画番組のフォルダ整理処理について、図15に基づき説明すると以下のとおりである。
(Recorded program folder organization process)
Next, a folder arrangement process of recorded programs using the same program determination function will be described with reference to FIG.

まず、S301において、ユーザが録画番組を整理するために、例えば図16のように録画番組のタイトルリストの1つを選択して、「自動整理」のメニューを実行したとして以後の説明を行う。フォルダ整理処理(S303、S304)は、録画されている番組の番組タイトルのデータがなくなるまでの間(S302にて、YESになるまでの間)繰り返される。   First, in S301, for the purpose of organizing the recorded programs, for example, as shown in FIG. 16, one of the recorded program title lists is selected and the “automatic organizing” menu is executed. The folder organization process (S303, S304) is repeated until the program title data of the recorded program runs out (until YES in S302).

具体的には、デジタルテレビ100の録画番組管理部7は、上記同一番組判定機能を利用して、ユーザに指定された番組タイトル(「選択番組タイトル」)と同一の録画番組の番組タイトル(「録画番組タイトル」)を検出する(S303)。EPG処理部1が、「選択番組タイトル」と「録画番組タイトル」とが同一番組と判定した場合(S303においてYES)、データ取得部70は、上記「選択番組タイトル」と同一と判定した「録画番組タイトル」を有する番組の番組情報を取得し、録画番組管理部7に供給する。録画番組管理部7は、同一と判定された録画番組のデータを整理用番組リストに追加する(S304)。   Specifically, the recorded program management unit 7 of the digital television 100 uses the same program determination function to program the program title (““ selected program title ”) that is the same as the program title designated by the user (“ selected program title ”). Recorded program title ") is detected (S303). When the EPG processing unit 1 determines that the “selected program title” and the “recorded program title” are the same program (YES in S303), the data acquisition unit 70 determines that the “recorded program title” is the same as the “selected program title”. The program information of the program having “program title” is acquired and supplied to the recorded program management unit 7. The recorded program management unit 7 adds recorded program data determined to be the same to the organizing program list (S304).

すべての録画されている番組の番組タイトルとの比較が終わると(S302においてYES)、録画番組管理部7は、整理用番組リストに追加されている番組の番組タイトルから共通する文字列を抽出し(S305)、それを当該整理用番組リストに含まれている番組をまとめるフォルダのフォルダ名とする。   When the comparison with the program titles of all the recorded programs is completed (YES in S302), the recorded program management unit 7 extracts a common character string from the program titles of the programs added to the organizing program list. (S305), it is set as the folder name of a folder for collecting programs included in the organizing program list.

続いて、出力制御部6は、録画番組管理部7によって抽出された上記フォルダ名、および、上記整理用番組リストに集約された録画番組のリストをユーザに提示する(S306)。   Subsequently, the output control unit 6 presents the folder name extracted by the recorded program management unit 7 and the list of recorded programs aggregated in the organizing program list to the user (S306).

このとき、ユーザは、同一フォルダに整理したくない番組が含まれていた場合、その番組のタイトルを指定して、削除するようにしてもよい(S307)。   At this time, if a program that the user does not want to organize is included in the same folder, the user may specify the title of the program and delete it (S307).

ユーザがフォルダ整理処理の実行を指示すると(S308)、録画番組管理部7は、上記抽出したフォルダ名のフォルダを作成し、該フォルダに整理用番組リストに含まれる録画番組を格納する(S309)。ユーザがフォルダ整理処理の実行をキャンセルした場合(S308においてNO)、録画番組管理部7は、当該フォルダ整理処理をそのまま終了する。   When the user instructs execution of the folder organization process (S308), the recorded program management unit 7 creates a folder with the extracted folder name, and stores the recorded program included in the organization program list in the folder (S309). . When the user cancels the execution of the folder organization process (NO in S308), the recorded program management unit 7 ends the folder organization process as it is.

このように、録画番組をフォルダに整理する際に、整理してまとめたい番組の1つを指定することにより、番組タイトルから同一番組を検索しユーザに提示してくれるので、ユーザは1つ1つ録画番組を指定してフォルダに移動することなく、簡単な操作で録画番組を整理することができる。   Thus, when organizing recorded programs into folders, by designating one of the programs to be organized and collected, the same program is searched from the program title and presented to the user. It is possible to organize recorded programs by a simple operation without specifying one recorded program and moving to a folder.

(繰り返し放送番組の情報提示処理)
次に、この同一番組判定機能を使った、繰り返し放送番組の情報提示処理について、図17に基づき説明すると以下のとおりである。
(Repeated broadcast program information presentation process)
Next, repetitive broadcast program information presentation processing using the same program determination function will be described with reference to FIG.

まず、デジタルテレビ100の操作受付部3が、ユーザの所望番組の選局(番組の視聴)指示を受け付けると、図2に示す、出力制御部6が、指定された番組をユーザに提示する。このとき出力制御部6は、提示した番組(すなわち、ユーザが現在視聴中の番組)の放送開始時間をEPG記録部21から取得し、番組を放送途中から視聴し始めたのか否かを判定する。番組の途中から視聴していると判断された場合(S401において、YES)、出力制御部6は、S402以下の、情報提示処理を行う。   First, when the operation receiving unit 3 of the digital television 100 receives a user's instruction for selecting a desired program (viewing a program), the output control unit 6 shown in FIG. 2 presents the designated program to the user. At this time, the output control unit 6 acquires the broadcast start time of the presented program (that is, the program that the user is currently viewing) from the EPG recording unit 21, and determines whether or not the program has started to be viewed during the broadcast. . When it is determined that the program is viewed from the middle of the program (YES in S401), the output control unit 6 performs the information presentation process from S402 onward.

具体的には、出力制御部6は、同一の放送局、同日の現在以降の時間帯の番組情報に対して、上記同一番組判定機能を用いて、番組タイトルが同一と判定できる番組が存在するか検出する。同一番組が検出できた場合(S402においてYES)、出力制御部6は、EPG処理部1のデータ取得部70(図1)が、同一番組の番組タイトルに基づき、EPG記録部21から取得した、視聴中の番組と同一と判定された番組の番組情報を、ユーザに提示する。同一番組が検出できなかった場合、情報の提示を実行することなく、情報提示処理をそのまま終了する。   Specifically, the output control unit 6 uses the same program determination function for the same broadcast station and program information in the time zone after the current day, and there is a program that can determine that the program title is the same. To detect. When the same program can be detected (YES in S402), the output control unit 6 acquires the data acquisition unit 70 (FIG. 1) of the EPG processing unit 1 from the EPG recording unit 21 based on the program title of the same program. Program information of a program determined to be the same as the program being viewed is presented to the user. If the same program cannot be detected, the information presentation process is terminated without executing the information presentation.

このように、デジタル放送などにおいて、同一の番組が繰り返し放送される場合、ユーザが番組の途中から視聴し始めた場合、同一番組が何時から放送されるかを知らせてくれるので、最初から視聴したい場合に、次にその番組を視聴できる機会を知るために、番組を検索する必要がなくなり、ユーザにとっての利便性が向上する。   In this way, when the same program is repeatedly broadcast in digital broadcasting, etc., if the user starts watching from the middle of the program, it will notify the time from which the same program will be broadcast. In this case, it is not necessary to search for the program in order to know the next opportunity to view the program, which improves convenience for the user.

なお、上記では、番組が放送される場合について説明したが、これに限るものではなく、通信によって特定の相手のみに番組を配信するシステムにも適用できる。また、番組は、スケジュールに沿って伝送されるものであれば、映像、音声、あるいは、それらの組み合わせたものに限るものではなく、例えば、データ配信など、任意の情報を伝送するシステムに広く適用できる。   In addition, although the case where a program was broadcast was demonstrated above, it is not restricted to this, It can apply also to the system which distributes a program only to a specific other party by communication. In addition, as long as the program can be transmitted according to the schedule, it is not limited to video, audio, or a combination thereof. For example, the program is widely applied to a system that transmits arbitrary information such as data distribution. it can.

また、本発明に係るデジタルテレビ100に録画あるいは情報表示を指示可能であり、しかも、デジタルテレビ100への操作(指示信号入力)を検出できる装置であれば、EPG処理装置101(図1)の各部材は、デジタルテレビ100とは別の装置に設けられていてもよい。   In addition, any device capable of instructing the digital television 100 according to the present invention to record or display information and detect an operation (instruction signal input) to the digital television 100 can be used as the EPG processing device 101 (FIG. 1). Each member may be provided in a device different from the digital television 100.

なお、上記実施形態では、EPG処理装置101を構成する各部材が、「CPUなどの演算手段がROMやRAMなどの記録媒体に格納されたプログラムコードを実行することで実現される機能ブロックである」場合を例にして説明したが、同様の処理を行うハードウェアで実現してもよい。また、処理の一部を行うハードウェアと、当該ハードウェアの制御や残余の処理を行うプログラムコードを実行する上記演算手段とを組み合わせても実現することもできる。さらに、上記各部材のうち、ハードウェアとして説明した部材であっても、処理の一部を行うハードウェアと、当該ハードウェアの制御や残余の処理を行うプログラムコードを実行する上記演算手段とを組み合わせても実現することもできる。なお、上記演算手段は、単体であってもよいし、装置内部のバスや種々の通信路を介して接続された複数の演算手段が共同してプログラムコードを実行してもよい。また、上記各部材のうちの記憶部(記録部20)は、メモリなどの記憶装置自体であってもよい。   In the above embodiment, each member constituting the EPG processing device 101 is “a functional block realized by a calculation means such as a CPU executing a program code stored in a recording medium such as a ROM or a RAM. The case has been described by way of example, but may be realized by hardware that performs the same processing. Further, it can also be realized by combining hardware that performs a part of the processing and the above-described calculation means that executes the program code for controlling the hardware and the remaining processing. Further, even among the members described above as hardware, the hardware for performing a part of the processing and the arithmetic means for executing the program code for performing the control of the hardware and the remaining processing It can also be realized by combining them. The arithmetic means may be a single unit, or a plurality of arithmetic means connected via a bus inside the apparatus or various communication paths may execute the program code jointly. The storage unit (recording unit 20) among the above members may be a storage device such as a memory.

上記演算手段によって直接実行可能なプログラムコード自体、または、後述する解凍などの処理によってプログラムコードを生成可能なデータとしてのプログラムは、当該プログラム(プログラムコードまたは上記データ)を記録媒体に格納し、当該記録媒体を配付したり、あるいは、上記プログラムを、有線または無線の通信路を介して伝送するための通信手段で送信したりして、デジタルテレビ100(あるいは、EPG処理装置101)に配付され、上記演算手段が記録媒体に格納されたプログラムまたは受信したプログラムを実行することによって、本発明のデジタルテレビ100(あるいは、EPG処理装置101)が実現される。   The program code itself that can be directly executed by the computing means, or a program as data that can be generated by a process such as decompression described later, stores the program (program code or the data) in a recording medium, Distributing the recording medium, or transmitting the program by a communication means for transmitting via a wired or wireless communication path, distributed to the digital television 100 (or EPG processing apparatus 101), The arithmetic means executes the program stored in the recording medium or the received program, thereby realizing the digital television 100 (or the EPG processing apparatus 101) of the present invention.

通信路を介して伝送する場合、通信路を構成する各伝送媒体が、プログラムを示す信号列を伝搬し合うことによって、当該通信路を介して、上記プログラムが伝送される。この場合、プログラムは、上記伝送媒体または通信経路を構成する装置において、流動的に坦持される。また、信号列を伝送する際、送信装置が、プログラムを示す信号列により搬送波を変調することによって、上記信号列を搬送波に重畳してもよい。この場合、受信装置が搬送波を復調することによって信号列が復元される。一方、上記信号列を伝送する際、送信装置が、デジタルデータ列としての信号列をパケット分割して伝送してもよい。この場合、受信装置は、受信したパケット群を連結して、上記信号列を復元する。また、送信装置が、信号列を送信する際、時分割/周波数分割/符号分割などの方法で、信号列を他の信号列と多重化して伝送してもよい。この場合、受信装置は、多重化された信号列から、個々の信号列を抽出して復元する。いずれの場合であっても、通信路を介してプログラムを伝送できれば、同様の効果が得られる。   When transmitting via a communication path, each transmission medium which comprises a communication path propagates the signal sequence which shows a program, and thereby the said program is transmitted via the said communication path. In this case, the program is fluidly carried in the transmission medium or the apparatus constituting the communication path. Further, when transmitting the signal sequence, the transmission device may superimpose the signal sequence on the carrier by modulating the carrier with the signal sequence indicating the program. In this case, the signal sequence is restored by the receiving apparatus demodulating the carrier wave. On the other hand, when transmitting the signal sequence, the transmission device may divide and transmit the signal sequence as a digital data sequence. In this case, the receiving apparatus concatenates the received packet groups and restores the signal sequence. Further, when the transmission apparatus transmits a signal sequence, the signal sequence may be multiplexed with another signal sequence and transmitted by a method such as time division / frequency division / code division. In this case, the receiving apparatus extracts and restores individual signal sequences from the multiplexed signal sequence. In any case, the same effect can be obtained if the program can be transmitted via the communication path.

なお、コンピュータが、モデムを備えてインターネットを含む通信ネットワークと接続できる場合、上記通信ネットワークからダウンロードするためのダウンロードプログラムは、あらかじめデジタルテレビ100(あるいは、EPG処理装置101)に格納されていてもよいし、あるいは、別の記録媒体からインストールされてもよい。   If the computer is equipped with a modem and can be connected to a communication network including the Internet, a download program for downloading from the communication network may be stored in advance in the digital television 100 (or the EPG processing device 101). Alternatively, it may be installed from another recording medium.

ここで、プログラムを配付する際の記録媒体は、取外し可能である方が好ましいが、プログラムを配付した後の記録媒体は、取外し可能か否かを問わない。また、上記記録媒体は、プログラムが記憶されていれば、書換え(書き込み)可能か否か、揮発性か否か、記録方法および形状を問わない。記録媒体の一例として、磁気テープやカセットテープなどのテープ、あるいは、フロッピー(登録商標)ディスクやハードディスクなどの磁気ディスク、または、CD−ROM、CD−Rや光磁気ディスク(MO)、ミニディスク(MD)やデジタルビデオディスク(デジタル多用途ディスク)などのディスクが挙げられる。また、記録媒体は、IC(集積回路)カードや光カードのようなカード、あるいは、マスクROMやEPROM(紫外線消去型ROM)、EEPROM(電気的消去型ROM)またはフラッシュROMなどのような半導体メモリであってもよい。あるいは、CPUなどの演算手段内に形成されたメモリであってもよい。また、上記記録媒体には、上記プログラムだけではなく、当該プログラムによってアクセスされるデータや他の任意のデータを記憶していてもよい。   Here, it is preferable that the recording medium for distributing the program is removable, but it does not matter whether the recording medium after distributing the program is removable. In addition, the recording medium can be rewritten (written), volatile, or the recording method and shape as long as a program is stored. As an example of the recording medium, a tape such as a magnetic tape or a cassette tape, a magnetic disk such as a floppy (registered trademark) disk or a hard disk, a CD-ROM, a CD-R, a magneto-optical disk (MO), a mini disk ( MD) and digital video disc (digital versatile disc). The recording medium is a card such as an IC (integrated circuit) card or an optical card, or a semiconductor memory such as a mask ROM, EPROM (ultraviolet erasable ROM), EEPROM (electrically erasable ROM), or flash ROM. It may be. Or the memory formed in calculating means, such as CPU, may be sufficient. The recording medium may store not only the program but also data accessed by the program and other arbitrary data.

なお、上記プログラムコードは、上記各処理の全手順を上記演算手段へ指示するコードであってもよいし、所定の手順で呼び出すことで、上記各処理の一部または全部を実行可能な基本プログラム(例えば、オペレーティングシステムやライブラリなど)が既に存在していれば、当該基本プログラムの呼び出しを上記演算手段へ指示するコードやポインタなどで、上記全手順の一部または全部を置き換えてもよい。   The program code may be a code for instructing the arithmetic means of all the procedures of the processes, or a basic program capable of executing a part or all of the processes by calling according to a predetermined procedure. If (for example, an operating system or a library) already exists, a part or all of the entire procedure may be replaced with a code or a pointer that instructs the arithmetic means to call the basic program.

また、上記記録媒体にプログラムを格納する際の形式は、例えば、実メモリに配置した状態のように、演算手段がアクセスして実行可能な格納形式であってもよいし、実メモリに配置する前で、演算手段が常時アクセス可能なローカルな記録媒体(例えば、実メモリやハードディスクなど)にインストールした後の格納形式、あるいは、ネットワークや搬送可能な記録媒体などから上記ローカルな記録媒体にインストールする前の格納形式などであってもよい。また、プログラムは、コンパイル後のオブジェクトコードに限るものではなく、ソースコードや、インタプリトまたはコンパイルの途中で生成される中間コードとして格納されていてもよい。いずれの場合であっても、圧縮された情報の解凍、符号化された情報の復号、インタプリト、コンパイル、リンク、または、実メモリへの配置などの処理、あるいは、各処理の組み合わせによって、上記演算手段が実行可能な形式に変換可能であれば、プログラムを記録媒体に格納する際の形式に拘わらず、同様の効果を得ることができる。   The format for storing the program in the recording medium may be a storage format that can be accessed and executed by the arithmetic means, for example, as in a state where the program is stored in the real memory, or is stored in the real memory. Installed in the local recording medium from the storage format after being installed in a local recording medium (for example, real memory or hard disk) that is always accessible by the computing means, or from a network or a transportable recording medium The previous storage format may be used. Further, the program is not limited to the compiled object code, but may be stored as source code or intermediate code generated during interpretation or compilation. In any case, the above calculation is performed by a process such as decompression of compressed information, decoding of encoded information, interpretation, compilation, linking, allocation to real memory, or a combination of processes. If the means can be converted into an executable format, the same effect can be obtained regardless of the format in which the program is stored in the recording medium.

一例として、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどの演算手段が実際の処理の一部または全部を行い、その処理によって、上述した実施の形態の各機能を実現してもよい。   As an example, after the program code read from the recording medium is written in a memory provided in a function expansion board inserted in the computer or a function expansion unit connected to the computer, the function is based on the instruction of the program code. An arithmetic unit such as a CPU provided in the expansion board or the function expansion unit may perform part or all of the actual processing, and the functions of the above-described embodiments may be realized by the processing.

本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。   The present invention is not limited to the above-described embodiments, and various modifications can be made within the scope shown in the claims. That is, embodiments obtained by combining technical means appropriately changed within the scope of the claims are also included in the technical scope of the present invention.

最後に、EPG処理装置101の各ブロック、特にタイトル抽出部30、類似性距離算出部40、省略パターン照合部50および同一番組判定部60は、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。   Finally, each block of the EPG processing apparatus 101, in particular, the title extraction unit 30, the similarity distance calculation unit 40, the omitted pattern matching unit 50, and the same program determination unit 60 may be configured by hardware logic. Thus, it may be realized by software using a CPU.

すなわち、EPG処理装置101は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアであるEPG処理装置101の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記EPG処理装置101に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。   That is, the EPG processing device 101 includes a CPU (central processing unit) that executes instructions of a control program that realizes each function, a ROM (read only memory) that stores the program, and a RAM (random access memory) that expands the program. And a storage device (recording medium) such as a memory for storing the program and various data. An object of the present invention is to provide a recording medium on which a program code (execution format program, intermediate code program, source program) of a control program of the EPG processing apparatus 101, which is software that realizes the functions described above, is recorded so as to be readable by a computer. This can also be achieved by supplying the program to the EPG processing apparatus 101 and reading and executing the program code recorded on the recording medium by the computer (or CPU or MPU).

上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。   Examples of the recording medium include a tape system such as a magnetic tape and a cassette tape, a magnetic disk such as a floppy (registered trademark) disk / hard disk, and an optical disk such as a CD-ROM / MO / MD / DVD / CD-R. Card system such as IC card, IC card (including memory card) / optical card, or semiconductor memory system such as mask ROM / EPROM / EEPROM / flash ROM.

また、EPG処理装置101を通信ネットワークと接続可能に構成し、上記プログラムコードを、通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。   Further, the EPG processing apparatus 101 may be configured to be connectable to a communication network, and the program code may be supplied via the communication network. The communication network is not particularly limited. For example, the Internet, intranet, extranet, LAN, ISDN, VAN, CATV communication network, virtual private network, telephone line network, mobile communication network, satellite communication. A net or the like is available. Further, the transmission medium constituting the communication network is not particularly limited. For example, even in the case of wired such as IEEE 1394, USB, power line carrier, cable TV line, telephone line, ADSL line, etc., infrared rays such as IrDA and remote control, Bluetooth ( (Registered trademark), 802.11 wireless, HDR, mobile phone network, satellite line, terrestrial digital network, and the like can also be used. The present invention can also be realized in the form of a computer data signal embedded in a carrier wave in which the program code is embodied by electronic transmission.

本発明によれば、番組タイトル名の表記の揺らぎ(特に省略表記や漢字と仮名といった文字種の異なる表記など)に対応することができる同一番組の判定方法を備えた番組データ処理装置を実現できるので、番組視聴システムや番組録画システムをはじめとする種々のシステムに広く好適に使用できる。   According to the present invention, it is possible to realize a program data processing apparatus equipped with a method for determining the same program that can cope with fluctuations in the notation of program title names (particularly, notation, different notations such as kanji and kana). The present invention can be widely used in various systems including a program viewing system and a program recording system.

また、EPGデータに基づいた番組表を利用することで、例えば毎日決まった時間に放送される連続ドラマのようなシリーズ番組の予約を一括して行うようなことも可能である。また、あらかじめ設定したキーワードで番組を検索して、その検索で見つかった番組の予約を自動で行うようなことも可能である。   In addition, by using a program guide based on EPG data, it is possible to make a reservation for a series program such as a series drama broadcast at a fixed time every day. It is also possible to search for a program with a preset keyword and automatically reserve a program found by the search.

本実施形態に係るデジタルテレビに適用した、番組データ処理装置の要部構成を示すブロック図である。It is a block diagram which shows the principal part structure of the program data processing apparatus applied to the digital television which concerns on this embodiment. 本実施形態に係るデジタルテレビの概略構成を示すブロック図である。It is a block diagram which shows schematic structure of the digital television concerning this embodiment. 本実施形態に係るデジタルテレビのリモコンとしての第2操作部の正面図である。It is a front view of the 2nd operation part as a remote control of the digital television concerning this embodiment. (a)は、1つの番組の番組情報を示す図であり、(b)は、1つの番組情報を1レコードとして、複数の番組情報をデータベース化したEPGテーブル(電子番組表)を示す図である。(A) is a figure which shows the program information of one program, (b) is a figure which shows the EPG table (electronic program guide) which made one program information 1 record and made several program information into the database. is there. (a)〜(d)は、本実施形態に係る番組データ処理装置の類似性距離算出部が参照する距離テーブルの例を示した図である。(A)-(d) is the figure which showed the example of the distance table which the similarity distance calculation part of the program data processing apparatus concerning this embodiment refers. 本実施形態に係る番組タイトルに付属している不要語の例を示す表である。It is a table | surface which shows the example of the unnecessary word attached to the program title which concerns on this embodiment. 本実施形態に係る番組データ処理装置のタイトル抽出部が、番組タイトルを抽出した例を示す図である。It is a figure which shows the example which the title extraction part of the program data processing apparatus which concerns on this embodiment extracted the program title. (a)および(b)は、類似性距離算出部が作成する2次元テーブルの例を示す図である。(A) And (b) is a figure which shows the example of the two-dimensional table which a similarity distance calculation part produces. (a)〜(c)は、上述した方法に基づいて、2つの番組タイトル間の類似性距離Dtを算出した例を示す図である。(A)-(c) is a figure which shows the example which computed the similarity distance Dt between two program titles based on the method mentioned above. 図1に示す、省略パターン記録部26に記録される、典型省略パターンの例を示す図である。It is a figure which shows the example of the typical omission pattern recorded on the omission pattern recording part 26 shown in FIG. (a)、(b)は、2つの番組タイトルに対して、DPマッチングを適用する際に、類似性距離算出部が作成した2次元テーブル(および、文字ごとの類似性距離と、最短パス)の例を示す図であり、(c)、(d)は、DPマッチングによる、文字の対応付けの例を示す図である。(A) and (b) are two-dimensional tables created by the similarity distance calculation unit (and the similarity distance for each character and the shortest path) when DP matching is applied to two program titles. (C), (d) is a figure which shows the example of character matching by DP matching. 本発明に係る番組データ処理装置の処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a process of the program data processing apparatus which concerns on this invention. 本発明に係る番組データ処理装置を備えたデジタルテレビの録画予約処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the recording reservation process of a digital television provided with the program data processing apparatus which concerns on this invention. (a)および(b)は、図1に示す映像出力部に表示される、番組欄の例を示す図である。(A) And (b) is a figure which shows the example of the program column displayed on the video output part shown in FIG. 本発明に係る番組データ処理装置を備えたデジタルテレビのフォルダ整理処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the folder rearrangement process of the digital television provided with the program data processing apparatus which concerns on this invention. 図1に示す映像出力部に表示される、録画番組のタイトルリストの例を示す図である。It is a figure which shows the example of the title list of the video recording program displayed on the video output part shown in FIG. 本発明に係る番組データ処理装置を備えたデジタルテレビの情報提示処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the information presentation process of the digital television provided with the program data processing apparatus which concerns on this invention.

符号の説明Explanation of symbols

1 EPG処理部
2 録画制御部(録画処理手段)
3 操作受付部(操作受付手段)
4 放送データ取得部
5 EPG取得部
6 出力制御部(出力制御手段)
7 録画番組管理部(録画番組管理手段)
8 操作部
9 出力部
10 制御部
11 チューナおよび復調部
12 TSデコーダ
13 AVデコーダ
14 録画処理部
15 グラフィックス生成部
16 画像重畳部
17 インターフェース
18 音声出力部
19 映像出力部
20 記録部
21 EPG記録部
22 辞書記録部
23 抽出タイトル一時保持部
24 距離テーブル記録部
25 録画番組記録部
26 省略パターン記録部
30 タイトル抽出部(タイトル抽出手段)
31 不要語除去部(不要語除去手段)
32 全角変換部(全角変換手段)
33 かな文字変換部(かな文字変換手段)
34 形態素解析部(形態素解析手段)
40 類似性距離算出部(評価値算出手段)
41 文字コード間距離算出部
42 文字種間距離算出部(文字種間評価値算出手段)
43 品詞間距離算出部(品詞間評価値算出手段)
44 境界位置距離算出部(境界位置評価値算出手段)
50 省略パターン照合部(パターン照合手段)
60 同一番組判定部(判定手段)
70 データ取得部(データ取得手段)
100 デジタルテレビ(録画装置/再生装置/情報表示装置)
101 EPG処理装置(番組データ処理装置)
1 EPG processing unit 2 Recording control unit (recording processing means)
3 Operation reception part (operation reception means)
4 Broadcast data acquisition unit 5 EPG acquisition unit 6 Output control unit (output control means)
7 Recorded program management section (recorded program management means)
8 Operation unit 9 Output unit 10 Control unit 11 Tuner and demodulation unit 12 TS decoder 13 AV decoder 14 Recording processing unit 15 Graphics generation unit 16 Image superposition unit 17 Interface 18 Audio output unit 19 Video output unit 20 Recording unit 21 EPG recording unit 22 Dictionary recording unit 23 Extracted title temporary storage unit 24 Distance table recording unit 25 Recorded program recording unit 26 Omitted pattern recording unit 30 Title extraction unit (title extraction means)
31 Unnecessary word removal unit (unnecessary word removal means)
32 Full-width conversion unit (Full-width conversion means)
33 Kana character conversion part (kana character conversion means)
34 Morphological analyzer (morphological analyzer)
40 Similarity distance calculation unit (evaluation value calculation means)
41 Character code distance calculation unit 42 Character type distance calculation unit (character type evaluation value calculation means)
43 Part-of-speech distance calculation unit (inter-part-of-speech evaluation value calculation means)
44 Boundary position distance calculation unit (Boundary position evaluation value calculation means)
50 Omitted pattern matching unit (pattern matching means)
60 Same program determination unit (determination means)
70 Data acquisition unit (data acquisition means)
100 Digital TV (recording device / playback device / information display device)
101 EPG processing device (program data processing device)

Claims (19)

番組に関する情報を示す番組情報から、番組の番組タイトルを抽出するタイトル抽出手段と、
上記タイトル抽出手段によって抽出された、ユーザにより選択された番組の選択番組タイトルと、上記タイトル抽出手段によって抽出され、複数の番組情報からなる番組情報データベースにあらかじめ記録されている、番組の記録番組タイトルとを、文字単位に分解し、両番組タイトルの分解した文字同士を比較し、文字同士の属性の不一致を、文字間の非同一性の度合いを示す文字間の距離として累積し、該累積した距離を、両番組タイトル間の非同一性の度合いを示す番組タイトル間の距離として算出する距離算出手段と、
上記番組タイトル間の距離を所定の閾値と比較した結果に基づいて、上記選択番組タイトルと上記記録番組タイトルとが同一番組のタイトルであるか否かを判定する判定手段と
上記判定手段が、同一であると判定した上記選択番組タイトルと上記記録番組タイトルとの間で一致する文字列から、一方の番組タイトルに施された省略パターンを検出し、あらかじめ定められた番組タイトルの典型省略パターンとの照合を行うパターン照合手段と備え、
上記パターン照合手段は、検出した省略パターンが、上記典型省略パターンに合わない場合に、上記判定手段による判定を棄却して、上記選択番組タイトルと上記記録番組タイトルとは同一番組のタイトルでないと判定することを特徴とする番組データ処理装置。
Title extraction means for extracting a program title of a program from program information indicating information about the program,
The selected program title of the program selected by the user extracted by the title extraction means, and the recorded program title of the program extracted by the title extraction means and recorded in advance in a program information database consisting of a plurality of program information Is divided into character units, the characters separated from both program titles are compared, and the attribute mismatch between the characters is accumulated as the distance between characters indicating the degree of non-identity between characters. Distance calculating means for calculating the distance as a distance between program titles indicating the degree of non-identity between both program titles;
Determination means for determining whether or not the selected program title and the recorded program title are the titles of the same program based on a result of comparing the distance between the program titles with a predetermined threshold ;
An abbreviation pattern applied to one program title is detected from a character string that matches between the selected program title and the recorded program title determined by the determination means to be the same, and a predetermined program title Pattern matching means for matching with the typical omitted pattern of
The pattern matching means rejects the determination by the determining means when the detected omitted pattern does not match the typical omitted pattern, and determines that the selected program title and the recorded program title are not the same program title. A program data processing apparatus.
上記タイトル抽出手段は、番組タイトルに含まれる、番組タイトルを表していない文字列を除去する不要語除去手段をさらに備えていることを特徴とする請求項1に記載の番組データ処理装置。  2. The program data processing apparatus according to claim 1, wherein the title extracting unit further includes an unnecessary word removing unit that removes a character string that does not represent the program title included in the program title. 上記タイトル抽出手段は、番組タイトルに含まれる半角文字を全角文字に変換する全角変換手段をさらに備えていることを特徴とする請求項1または2に記載の番組データ処理装置。  3. The program data processing apparatus according to claim 1, wherein the title extracting means further comprises full-width conversion means for converting half-width characters included in the program title into full-width characters. 上記距離算出手段は、複数種類の属性を比較することにより、文字間の距離を累積することを特徴とする請求項1から3までのいずれか1項に記載の番組データ処理装置。  4. The program data processing apparatus according to claim 1, wherein the distance calculation unit accumulates distances between characters by comparing a plurality of types of attributes. 5. 文字の属性の不一致に応じて上記距離算出手段が加算するべき距離の値を示す距離テーブルを、属性の種類ごとに記録する距離テーブル記録部を備えていることを特徴とする請求項1から4までのいずれか1項に記載の番組データ処理装置。  5. A distance table recording unit that records a distance table indicating a distance value to be added by the distance calculating means according to a mismatch of character attributes for each attribute type. The program data processing device according to any one of the above. 上記タイトル抽出手段は、番組タイトルを構成する文字列をかな文字に変換し、どの文字種からかな文字へ変換したかを示す変換履歴情報を、文字ごとに記録するかな文字変換手段をさらに備え、  The title extraction means further includes kana character conversion means for converting the character string constituting the program title into kana characters and recording conversion history information indicating which character type is converted into kana characters for each character,
上記距離算出手段は、上記かな文字変換手段が記録した上記変換履歴情報を参照し、文字同士の文字種の不一致を、文字間の距離として累積することにより、番組タイトル間の距離を算出することを特徴とする請求項1から5までのいずれか1項に記載の番組データ処理装置。  The distance calculation means refers to the conversion history information recorded by the kana character conversion means, and calculates the distance between program titles by accumulating the character type mismatches between characters as the distance between characters. 6. The program data processing apparatus according to claim 1, wherein the program data processing apparatus is characterized in that:
上記距離算出手段は、上記選択番組タイトルの比較対象となる上記記録番組タイトルを、所定の条件に基づき、番組情報データベースから選定することを特徴とする請求項1に記載の番組データ処理装置。  2. The program data processing apparatus according to claim 1, wherein the distance calculating means selects the recorded program title to be compared with the selected program title from a program information database based on a predetermined condition. 上記距離算出手段は、比較対象となる上記記録番組タイトルを、放送局情報に基づき、番組情報データベースから選定することを特徴とする請求項7に記載の番組データ処理装置。  8. The program data processing apparatus according to claim 7, wherein the distance calculation means selects the recorded program title to be compared from a program information database based on broadcast station information. 上記距離算出手段は、比較対象となる上記記録番組タイトルを、ジャンル情報に基づき、番組情報データベースから選定することを特徴とする請求項7に記載の番組データ処理装置。  8. The program data processing apparatus according to claim 7, wherein the distance calculation means selects the recorded program title to be compared from a program information database based on genre information. 上記距離算出手段は、比較対象となる上記記録番組タイトルを、放送日時情報に基づき、番組情報データベースから選定することを特徴とする請求項7に記載の番組データ処理装置。  8. The program data processing apparatus according to claim 7, wherein the distance calculation means selects the recorded program title to be compared from a program information database based on broadcast date and time information. 番組に関する情報を示す番組情報から、番組の番組タイトルを抽出するタイトル抽出手段と、  Title extraction means for extracting a program title of a program from program information indicating information about the program,
上記タイトル抽出手段によって抽出された、ユーザにより選択された番組の選択番組タイトルと、上記タイトル抽出手段によって抽出され、複数の番組情報からなる番組情報データベースにあらかじめ記録されている、番組の記録番組タイトルとを、文字単位に分解し、両番組タイトルの分解した文字同士を比較し、文字同士の属性の不一致を、文字間の非同一性の度合いを示す文字間の距離として累積し、該累積した距離を、両番組タイトル間の非同一性の度合いを示す番組タイトル間の距離として算出する距離算出手段と、  The selected program title of the program selected by the user extracted by the title extraction means, and the recorded program title of the program extracted by the title extraction means and recorded in advance in a program information database consisting of a plurality of program information Is divided into character units, the characters separated from both program titles are compared, and the attribute mismatch between the characters is accumulated as the distance between characters indicating the degree of non-identity between characters. Distance calculating means for calculating the distance as a distance between program titles indicating the degree of non-identity between both program titles;
上記番組タイトル間の距離を所定の閾値と比較した結果に基づいて、上記選択番組タイトルと上記記録番組タイトルとが同一番組のタイトルであるか否かを判定する判定手段とを備え、  Determination means for determining whether the selected program title and the recorded program title are the titles of the same program based on the result of comparing the distance between the program titles with a predetermined threshold;
上記タイトル抽出手段は、番組タイトルを構成する文字列の形態素解析を行って形態素の列に分割し、分割した各形態素に割り当てられた品詞を含む形態素解析結果を記録する形態素解析手段をさらに備え、  The title extraction means further includes morpheme analysis means for performing a morpheme analysis of a character string constituting a program title and dividing it into a morpheme string, and recording a morpheme analysis result including a part of speech assigned to each divided morpheme,
上記距離算出手段は、上記形態素解析手段が記録した上記形態素解析結果を参照し、各文字が属する形態素の品詞の不一致を、文字間の距離として累積することにより、番組タイトル間の距離を算出することを特徴とする番組データ処理装置。  The distance calculation means refers to the morpheme analysis result recorded by the morpheme analysis means, and calculates the distance between program titles by accumulating the dissimilarity of the part of speech of the morpheme to which each character belongs as the distance between characters. A program data processing apparatus.
番組に関する情報を示す番組情報から、番組の番組タイトルを抽出するタイトル抽出手段と、  Title extraction means for extracting a program title of a program from program information indicating information about the program,
上記タイトル抽出手段によって抽出された、ユーザにより選択された番組の選択番組タイトルと、上記タイトル抽出手段によって抽出され、複数の番組情報からなる番組情報データベースにあらかじめ記録されている、番組の記録番組タイトルとを、文字単位に分解し、両番組タイトルの分解した文字同士を比較し、文字同士の属性の不一致を、文字間の非同一性の度合いを示す文字間の距離として累積し、該累積した距離を、両番組タイトル間の非同一性の度合いを示す番組タイトル間の距離として算出する距離算出手段と、  The selected program title of the program selected by the user extracted by the title extraction means, and the recorded program title of the program extracted by the title extraction means and recorded in advance in a program information database consisting of a plurality of program information Is divided into character units, the characters separated from both program titles are compared, and the attribute mismatch between the characters is accumulated as the distance between characters indicating the degree of non-identity between characters. Distance calculating means for calculating the distance as a distance between program titles indicating the degree of non-identity between both program titles;
上記番組タイトル間の距離を所定の閾値と比較した結果に基づいて、上記選択番組タイトルと上記記録番組タイトルとが同一番組のタイトルであるか否かを判定する判定手段とを備え、  Determination means for determining whether the selected program title and the recorded program title are the titles of the same program based on the result of comparing the distance between the program titles with a predetermined threshold;
上記タイトル抽出手段は、番組タイトルを構成する文字列の形態素解析を行って形態素の列に分割し、分割した各形態素間の境界位置を含む形態素解析結果を記録する形態素解析手段をさらに備え、  The title extraction means further includes morpheme analysis means for performing a morpheme analysis of a character string constituting a program title and dividing it into a morpheme string, and recording a morpheme analysis result including a boundary position between each divided morpheme,
上記距離算出手段は、上記形態素解析手段が記録した上記形態素解析結果を参照し、各文字が属する形態素間の境界位置の不一致を、文字間の距離として累積することにより、番組タイトル間の距離を算出することを特徴とする番組データ処理装置。  The distance calculation means refers to the morpheme analysis result recorded by the morpheme analysis means, and accumulates the disagreement of the boundary position between the morphemes to which each character belongs as the distance between characters, thereby calculating the distance between program titles. A program data processing apparatus characterized by calculating.
請求項1から12までのいずれか1項に記載の番組データ処理装置と、  The program data processing device according to any one of claims 1 to 12,
ユーザが所望する番組の番組タイトルを、操作部を介して受信し、該番組タイトルを選択番組タイトルとして上記番組データ処理装置に供給する操作受付手段と、  Operation accepting means for receiving a program title of a program desired by a user via the operation unit and supplying the program title as a selected program title to the program data processing device;
上記番組データ処理装置が、上記選択番組タイトルと同一と判定した記録番組タイトルに対応付けられた番組情報を、番組情報データベースから取得するデータ取得手段と、  Data acquisition means for acquiring, from the program information database, program information associated with a recorded program title that is determined to be the same as the selected program title by the program data processing device;
上記取得された番組情報に含まれる放送日時情報に基づいて、当該番組を録画する録画処理手段とを備えていることを特徴とする録画装置。  A recording apparatus comprising recording processing means for recording the program based on broadcast date and time information included in the acquired program information.
請求項1から12までのいずれか1項に記載の番組データ処理装置と、  The program data processing device according to any one of claims 1 to 12,
録画番組と、該録画番組の録画番組タイトルとを対応付けて記録する録画番組記録部と、  A recorded program recording unit that records a recorded program and a recorded program title of the recorded program in association with each other;
ユーザが所望する番組の番組タイトルを操作部を介して受信し、該番組タイトルを選択番組タイトルとして上記番組データ処理装置に供給する操作受付手段と、  Operation receiving means for receiving a program title of a program desired by a user via the operation unit, and supplying the program title as a selected program title to the program data processing device;
上記番組データ処理装置が、上記選択番組タイトルと同一と判定した録画番組タイトルの録画番組のデータを、上記録画番組記録部から取得するデータ取得手段と、  Data acquisition means for acquiring data of a recorded program of a recorded program title determined to be the same as the selected program title by the program data processing device from the recorded program recording unit;
上記データ取得手段により取得された録画番組のデータを出力する出力部とを備えていることを特徴とする再生装置。  A playback apparatus comprising: an output unit that outputs data of a recorded program acquired by the data acquisition means.
上記番組データ処理装置が、上記選択番組タイトルと同一と判定した録画番組タイトルを有する複数の録画番組を、1つのフォルダで管理する録画番組管理手段をさらに備えていることを特徴とする請求項14に記載の再生装置。  15. The program data processing apparatus further comprises recorded program management means for managing a plurality of recorded programs having a recorded program title determined to be the same as the selected program title in one folder. The playback device described in 1. 請求項1から12までのいずれか1項に記載の番組データ処理装置と、  The program data processing device according to any one of claims 1 to 12,
ユーザからの視聴開始指示を、ユーザが所望する番組の番組タイトルとともに操作部を介して受信し、上記所望の番組タイトルを選択番組タイトルとして上記番組データ処理装置に供給する操作受付手段と、  An operation receiving means for receiving a viewing start instruction from the user together with a program title of the program desired by the user via the operation unit, and supplying the desired program title as the selected program title to the program data processing device;
上記視聴開始指示に応じて、上記所望の番組のデータを出力するよう出力部を制御する出力制御手段と、  Output control means for controlling an output unit to output data of the desired program in response to the viewing start instruction;
上記番組データ処理装置が、上記選択番組タイトルと同一と判定した番組タイトルを有する番組の番組情報を番組情報データベースから取得するデータ取得手段とを備え、  The program data processing device comprises data acquisition means for acquiring program information of a program having a program title determined to be the same as the selected program title from a program information database,
上記出力制御手段は、上記所望の番組のデータを出力するとき、上記データ取得手段により取得された番組情報を出力するよう上記出力部を制御することを特徴とする情報表示装置。  The output control means controls the output section to output program information acquired by the data acquisition means when outputting data of the desired program.
番組データ処理装置のタイトル抽出手段が、番組に関する情報を示す番組情報から、番組の番組タイトルを抽出する抽出ステップと、
上記番組データ処理装置の距離算出手段が、上記抽出ステップによって抽出された、ユーザにより選択された番組の選択番組タイトルと、上記抽出ステップによって抽出され、複数の番組情報からなる番組情報データベースにあらかじめ記録されている、番組の記録番組タイトルとを、文字単位に分解し、両番組タイトルの分解した文字同士を比較し、文字同士の属性の不一致を、文字間の非同一性の度合いを示す文字間の距離として累積し、該累積した距離を、両番組タイトル間の非同一性の度合いを示す番組タイトル間の距離として算出する距離算出ステップと、
上記番組データ処理装置の判定手段が、上記番組タイトル間の距離を所定の閾値と比較した結果に基づいて、上記選択番組タイトルと上記記録番組タイトルとが同一番組のタイトルであるか否かを判定する判定ステップと、
上記番組データ処理装置のパターン照合手段が、上記判定ステップにて、同一であると判定された上記選択番組タイトルと上記記録番組タイトルとの間で一致する文字列から、一方の番組タイトルに施された省略パターンを検出し、あらかじめ定められた番組タイトルの典型省略パターンとの照合を行うパターン照合ステップとを含み、
上記パターン照合ステップでは、検出した省略パターンが、上記典型省略パターンに合わない場合に、上記判定ステップにおける判定を棄却して、上記選択番組タイトルと上記記録番組タイトルとは同一番組のタイトルでないと判定することを特徴とする番組データ処理方法。
An extraction step in which the title extraction means of the program data processing device extracts the program title of the program from the program information indicating the information about the program;
The distance calculation means of the program data processing device records the selected program title of the program selected by the user extracted by the extraction step and the program information database including a plurality of program information extracted by the extraction step. The recorded program title of the program is decomposed into character units, the decomposed characters of both program titles are compared, and the attribute mismatch between the characters is indicated between characters indicating the degree of non-identity between characters. A distance calculation step of calculating the accumulated distance as a distance between program titles indicating a degree of non-identity between both program titles;
The determination means of the program data processing apparatus determines whether the selected program title and the recorded program title are the titles of the same program based on the result of comparing the distance between the program titles with a predetermined threshold. A determination step to:
The pattern matching means of the program data processing device is applied to one program title from a character string that matches between the selected program title and the recorded program title determined to be the same in the determination step. A pattern matching step for detecting a omitted pattern and comparing with a typical omitted pattern of a predetermined program title,
In the pattern matching step, if the detected omitted pattern does not match the typical omitted pattern, the determination in the determining step is rejected, and the selected program title and the recorded program title are not the same program title. program data processing method characterized by.
請求項1から12までのいずれか1項に記載の番組データ処理装置、請求項13に記載の録画装置、請求項14または15に記載の再生装置、または、請求項16に記載の情報表示装置を動作させる制御プログラムであって、コンピュータを上記の各手段として機能させるための制御プログラム。  The program data processing device according to any one of claims 1 to 12, the recording device according to claim 13, the playback device according to claim 14 or 15, or the information display device according to claim 16. A control program for causing the computer to function as each of the above-described means. 請求項18に記載の制御プログラムを記録したコンピュータ読み取り可能な記録媒体。  The computer-readable recording medium which recorded the control program of Claim 18.
JP2005291539A 2005-10-04 2005-10-04 PROGRAM DATA PROCESSING DEVICE, PROGRAM DATA PROCESSING METHOD, CONTROL PROGRAM, RECORDING MEDIUM, RECORDING DEVICE, REPRODUCTION DEVICE, AND INFORMATION DISPLAY DEVICE EQUIPPED WITH PROGRAM DATA PROCESSING DEVICE Expired - Fee Related JP4619915B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005291539A JP4619915B2 (en) 2005-10-04 2005-10-04 PROGRAM DATA PROCESSING DEVICE, PROGRAM DATA PROCESSING METHOD, CONTROL PROGRAM, RECORDING MEDIUM, RECORDING DEVICE, REPRODUCTION DEVICE, AND INFORMATION DISPLAY DEVICE EQUIPPED WITH PROGRAM DATA PROCESSING DEVICE

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005291539A JP4619915B2 (en) 2005-10-04 2005-10-04 PROGRAM DATA PROCESSING DEVICE, PROGRAM DATA PROCESSING METHOD, CONTROL PROGRAM, RECORDING MEDIUM, RECORDING DEVICE, REPRODUCTION DEVICE, AND INFORMATION DISPLAY DEVICE EQUIPPED WITH PROGRAM DATA PROCESSING DEVICE

Publications (2)

Publication Number Publication Date
JP2007102489A JP2007102489A (en) 2007-04-19
JP4619915B2 true JP4619915B2 (en) 2011-01-26

Family

ID=38029369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005291539A Expired - Fee Related JP4619915B2 (en) 2005-10-04 2005-10-04 PROGRAM DATA PROCESSING DEVICE, PROGRAM DATA PROCESSING METHOD, CONTROL PROGRAM, RECORDING MEDIUM, RECORDING DEVICE, REPRODUCTION DEVICE, AND INFORMATION DISPLAY DEVICE EQUIPPED WITH PROGRAM DATA PROCESSING DEVICE

Country Status (1)

Country Link
JP (1) JP4619915B2 (en)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4862140B2 (en) * 2007-04-19 2012-01-25 株式会社Jvcケンウッド Program recording device
JP2009049516A (en) * 2007-08-14 2009-03-05 Sony Corp Recording and reproducing apparatus, recording and reproducing method, and program
JP2009276988A (en) * 2008-05-14 2009-11-26 Funai Electric Co Ltd Information processor
JP4922252B2 (en) * 2008-06-27 2012-04-25 ヤフー株式会社 Effect expression presentation apparatus and method
JP5156594B2 (en) * 2008-11-19 2013-03-06 キヤノン株式会社 Reproducing apparatus and control method thereof
JP5332847B2 (en) * 2009-04-10 2013-11-06 ソニー株式会社 Content processing apparatus and method, program, and recording medium
WO2011033671A1 (en) * 2009-09-18 2011-03-24 株式会社 東芝 Title judgmet device
JP5479134B2 (en) * 2010-01-29 2014-04-23 株式会社東芝 Digital broadcast receiver and recorded program control method
JP2012151686A (en) * 2011-01-19 2012-08-09 Sharp Corp Program recorder, television receiver, program recorder control method, control program, and recording medium
US9681187B2 (en) * 2014-06-24 2017-06-13 Lg Electronics Inc. Method for controlling broadcast receiving device
JP6828480B2 (en) * 2017-02-07 2021-02-10 株式会社Jvcケンウッド List display device, list display method and list display program

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04160473A (en) * 1990-10-24 1992-06-03 Hitachi Ltd Method and device for example reuse type translation
JPH0589181A (en) * 1991-08-07 1993-04-09 Res Puro:Kk Trademark retrieving device
JPH0844771A (en) * 1994-05-25 1996-02-16 Fuji Xerox Co Ltd Information retrieval device
JPH0877196A (en) * 1994-09-08 1996-03-22 Fujitsu Ltd Extracting device for document information
JPH08123821A (en) * 1994-10-27 1996-05-17 Ee I Sofuto Kk Data input device
JPH0916616A (en) * 1995-06-30 1997-01-17 Toyo Joho Syst:Kk Device for generating/retrieving index data
JPH0983888A (en) * 1995-09-12 1997-03-28 Toshiba Corp Program display device
JPH1097545A (en) * 1996-09-20 1998-04-14 Sharp Corp Information processor
JP2000090192A (en) * 1998-09-16 2000-03-31 Sharp Corp Character string correcting method for address and zip code
JP2000092400A (en) * 1998-09-16 2000-03-31 Funai Electric Co Ltd Broadcast program reception reservation device
JP2001036846A (en) * 1999-07-23 2001-02-09 Toshiba Corp Electronic program guide reception device and recording medium recording user operation support program for the device
JP2001257961A (en) * 2000-03-14 2001-09-21 Yamaha Corp Digital broadcasting receiver and program retrieving method for the same
JP2003046921A (en) * 2001-08-03 2003-02-14 Victor Co Of Japan Ltd Program reservation-recording method and apparatus thereof, and program therefor
JP2005251175A (en) * 2004-02-04 2005-09-15 Canon Inc Classification information setting method, and television set

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04160473A (en) * 1990-10-24 1992-06-03 Hitachi Ltd Method and device for example reuse type translation
JPH0589181A (en) * 1991-08-07 1993-04-09 Res Puro:Kk Trademark retrieving device
JPH0844771A (en) * 1994-05-25 1996-02-16 Fuji Xerox Co Ltd Information retrieval device
JPH0877196A (en) * 1994-09-08 1996-03-22 Fujitsu Ltd Extracting device for document information
JPH08123821A (en) * 1994-10-27 1996-05-17 Ee I Sofuto Kk Data input device
JPH0916616A (en) * 1995-06-30 1997-01-17 Toyo Joho Syst:Kk Device for generating/retrieving index data
JPH0983888A (en) * 1995-09-12 1997-03-28 Toshiba Corp Program display device
JPH1097545A (en) * 1996-09-20 1998-04-14 Sharp Corp Information processor
JP2000090192A (en) * 1998-09-16 2000-03-31 Sharp Corp Character string correcting method for address and zip code
JP2000092400A (en) * 1998-09-16 2000-03-31 Funai Electric Co Ltd Broadcast program reception reservation device
JP2001036846A (en) * 1999-07-23 2001-02-09 Toshiba Corp Electronic program guide reception device and recording medium recording user operation support program for the device
JP2001257961A (en) * 2000-03-14 2001-09-21 Yamaha Corp Digital broadcasting receiver and program retrieving method for the same
JP2003046921A (en) * 2001-08-03 2003-02-14 Victor Co Of Japan Ltd Program reservation-recording method and apparatus thereof, and program therefor
JP2005251175A (en) * 2004-02-04 2005-09-15 Canon Inc Classification information setting method, and television set

Also Published As

Publication number Publication date
JP2007102489A (en) 2007-04-19

Similar Documents

Publication Publication Date Title
JP4619915B2 (en) PROGRAM DATA PROCESSING DEVICE, PROGRAM DATA PROCESSING METHOD, CONTROL PROGRAM, RECORDING MEDIUM, RECORDING DEVICE, REPRODUCTION DEVICE, AND INFORMATION DISPLAY DEVICE EQUIPPED WITH PROGRAM DATA PROCESSING DEVICE
US9495438B2 (en) Information processing apparatus and method, program, and recording medium
CA2458300C (en) Free text and attribute searching of electronic program guide (epg) data
KR100489151B1 (en) Method of and system for recommending programs
US8112420B2 (en) Information search system, information processing apparatus and method, and information search apparatus and method
US9582582B2 (en) Electronic apparatus, content recommendation method, and storage medium for updating recommendation display information containing a content list
US20120017239A1 (en) Method and apparatus for providing information related to broadcast programs
US20060167859A1 (en) System and method for personalized searching of television content using a reduced keypad
CN103069414A (en) Information processing device, information processing method, and program
US7487164B2 (en) Information processing apparatus capable of properly reflecting a change in a user's preference or interest
US7080395B2 (en) Information processor, information processing method as well as broadcasting system and broadcasting method
US8332891B2 (en) Information processing apparatus and method, and program
JP4601306B2 (en) Information search apparatus, information search method, and program
US8264727B2 (en) Data processing apparatus, method, program, and storage medium for setting identification information based on metadata, and advantageously displaying print data
EP1463059A2 (en) Recording and reproduction apparatus
JP3909673B2 (en) Program search method, digital television, digital broadcast receiving system, and digital broadcast tuner
WO2011033671A1 (en) Title judgmet device
KR101220080B1 (en) Method and system for providing reprsentation words of real-time popular keyword
JP4731288B2 (en) PROGRAM RECOMMENDATION DEVICE, PROGRAM RECOMMENDATION METHOD, PROGRAM RECOMMENDATION PROGRAM, AND RECORDING MEDIUM CONTAINING PROGRAM RECOMMENDATION PROGRAM
JP2010009355A (en) Electronic device, morphological element compounding method, and its program
JP4709919B2 (en) Candidate presentation device, candidate presentation method, candidate presentation program
JP2007201573A (en) Information processing apparatus, information processing method, and program
JP2002175298A (en) Data management system, data management method and program
US20080189231A1 (en) Information Processing Device, Classification Reference Information Database, Information Generation Device, Information Processing Method, Information Generation Method, Information Processing Program, and Recording Medium Having Information Processing Program Recorded Therein
JP2006106451A (en) Speech input method of television broadcast receiver

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100427

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100727

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100917

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101026

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101027

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131105

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees