KR100993957B1 - 키워드의 자동 추출 장치 및 방법, 및 기록 매체 - Google Patents
키워드의 자동 추출 장치 및 방법, 및 기록 매체 Download PDFInfo
- Publication number
- KR100993957B1 KR100993957B1 KR1020057001427A KR20057001427A KR100993957B1 KR 100993957 B1 KR100993957 B1 KR 100993957B1 KR 1020057001427 A KR1020057001427 A KR 1020057001427A KR 20057001427 A KR20057001427 A KR 20057001427A KR 100993957 B1 KR100993957 B1 KR 100993957B1
- Authority
- KR
- South Korea
- Prior art keywords
- keyword
- character string
- dictionary
- registered
- extracting
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/35—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
- H04H60/48—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for recognising items expressed in broadcast information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/56—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/482—End-user interface for program selection
- H04N21/4828—End-user interface for program selection for searching program descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
- H04N21/8405—Generation or processing of descriptive data, e.g. content descriptors represented by keywords
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
Claims (14)
- 컨텐츠의 타이틀 문자열 정보로부터, 서브장르를 나타내는 문자열이 등록되어 있는 제 1의 키워드 사전을 이용하여 키워드의 추출을 행하는 제 1의 추출 수단과,상기 컨텐츠의 상세 문자열 정보로부터, 인명이 등록되어 있는 제 2의 키워드 사전을 이용한 키워드의 추출과, 자종 끊는 법을 이용한 키워드의 추출을 행하는 제 2의 추출 수단을 구비한 것을 특징으로 하는 키워드 자동 추출 장치.
- 제 1항에 있어서,상기 제 1의 추출 수단은, 제 1의 키워드 사전에 등록되어 있는 문자열을 포함하는 타이틀 문자열중, 소정의 제외 문자열 사전에 등록되어 있는 문자열을 제외한 부분에서 키워드를 추출하는 것을 특징으로 하는 키워드 자동 추출 장치.
- 제 1항에 있어서,상기 제 1의 추출 수단은, 제 1의 키워드 사전에 등록되어 있는 문자열을 포함하는 타이틀 문자열중, 히라가나, 가타카나, 한자, 숫자, 알파벳 이외의 특수 문자로 구획되어 있는 문자열을 키워드로서 추출하는 것을 특징으로 하는 키워드 자동 추출 장치.
- 제 1항에 있어서,상기 제 2의 추출 수단은, 상기 제 2의 키워드 사전을 이용하여 키워드를 추출한 상기 상세 문자열 정보의 나머지 부분중, 소정의 제외 문자열 사전에 등록되어 있는 문자열을 제외한 부분에서, 자종 끊는 법을 이용한 키워드의 추출을 행하는 것을 특징으로 하는 키워드 자동 추출 장치.
- 제 1항에 있어서,상기 제 2의 추출 수단은, 자종 끊는 법을 이용하면서, 가타카나와 알파벳을 동일 자종으로서 취급함과 함께, '·'(중점)은, 그 직전의 문자가 가타카나, 알파벳인 경우에는 각각 가타카나, 알파벳으로서 취급하는 것을 특징으로 하는 키워드 자동 추출 장치.
- 제 1항에 있어서,상기 제 2의 키워드 사전을 네트워크 경유로 다운로드하는 수단을 또한 구비하고, 상기 제 2의 추출 수단은 상기 다운로드된 제 2의 키워드 사전을 이용하는 것을 특징으로 하는 키워드 자동 추출 장치.
- 컨텐츠의 타이틀 문자열 정보로부터, 서브장르를 나타내는 문자열이 등록되어 있는 제 1의 키워드 사전을 이용하여 키워드의 추출을 행하는 제 1의 스텝과,상기 컨텐츠의 상세 문자열 정보로부터, 인명이 등록되어 있는 제 2의 키워 드 사전을 이용한 키워드의 추출과, 자종 끊는 법을 이용한 키워드의 추출을 행하는 제 2의 스텝을 갖는 것을 특징으로 하는 키워드 자동 추출 방법.
- 제 7항에 있어서,상기 제 1의 스텝에서, 제 1의 키워드 사전에 등록되어 있는 문자열을 포함하는 타이틀 문자열중, 소정의 제외 문자열 사전에 등록되어 있는 문자열을 제외한 부분에서 키워드를 추출하는 것을 특징으로 하는 키워드 자동 추출 방법.
- 제 7항에 있어서,상기 제 1의 스텝에서, 제 1의 키워드 사전에 등록되어 있는 문자열을 포함하는 타이틀 문자열중, 히라가나, 가타카나, 한자, 숫자, 알파벳 이외의 특수 문자로 구획되어 있는 문자열을 키워드로서 추출하는 것을 특징으로 하는 키워드 자동 추출 방법.
- 제 7항에 있어서,상기 제 2의 스텝에서, 상기 제 2의 키워드 사전을 이용하여 키워드를 추출한 상기 상세 문자열 정보의 나머지 부분중, 소정의 제외 문자열 사전에 등록되어 있는 문자열을 제외한 부분에서, 자종 끊는 법을 이용한 키워드의 추출을 행하는 것을 특징으로 하는 키워드 자동 추출 방법.
- 제 7항에 있어서,상기 제 2의 스텝에서, 자종 끊는 법을 이용하면서, 가타카나와 알파벳을 동일 자종으로서 취급함과 함께, '·'(중점)은, 그 직전의 문자가 가타카나, 알파벳인 경우에는 각각 가타카나, 알파벳으로서 취급하는 것을 특징으로 하는 키워드 자동 추출 방법.
- 제 7항에 있어서,상기 제 2의 키워드 사전을 네트워크 경유로 다운로드하는 스텝을 또한 가지며, 상기 제 2의 스텝에서는 상기 다운로드한 제 2의 키워드 사전을 이용하는 것을 특징으로 하는 키워드 자동 추출 방법.
- 키워드 자동 추출 장치의 프로그램으로서,컨텐츠의 타이틀 문자열 정보로부터, 서브장르를 나타내는 문자열이 등록되어 있는 제 1의 키워드 사전을 이용하여 키워드의 추출을 행하는 제 1의 추출 스텝과,상기 컨텐츠의 상세 문자열 정보로부터, 인명이 등록되어 있는 제 2의 키워드 사전을 이용한 키워드의 추출과, 자종 끊는 법을 이용한 키워드의 추출을 행하는 제 2의 추출 스텝을 포함하는 것을 특징으로 하는 컴퓨터가 판독 가능한 프로그램이 기록되어 있는 기록 매체.
- 삭제
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002221698A JP4040382B2 (ja) | 2002-07-30 | 2002-07-30 | キーワードの自動抽出装置及び方法、記録媒体、並びにプログラム |
JPJP-P-2002-00221698 | 2002-07-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050025999A KR20050025999A (ko) | 2005-03-14 |
KR100993957B1 true KR100993957B1 (ko) | 2010-11-11 |
Family
ID=31184873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020057001427A KR100993957B1 (ko) | 2002-07-30 | 2003-07-30 | 키워드의 자동 추출 장치 및 방법, 및 기록 매체 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7577972B2 (ko) |
EP (1) | EP1544751A4 (ko) |
JP (1) | JP4040382B2 (ko) |
KR (1) | KR100993957B1 (ko) |
CN (1) | CN100530174C (ko) |
WO (1) | WO2004012101A1 (ko) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006013619A (ja) | 2004-06-22 | 2006-01-12 | Pioneer Electronic Corp | データ処理装置、その方法、そのプログラム、および、そのプログラムを記録した記録媒体 |
JP2006041978A (ja) * | 2004-07-28 | 2006-02-09 | Matsushita Electric Ind Co Ltd | 放送受信装置 |
JP4498903B2 (ja) * | 2004-11-30 | 2010-07-07 | シャープ株式会社 | 番組情報抽出装置、番組情報表示装置、番組情報抽出方法、プログラム、および、プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2007074169A (ja) * | 2005-09-05 | 2007-03-22 | Sharp Corp | 番組抽出装置 |
US7461093B2 (en) | 2005-09-12 | 2008-12-02 | Sharp Kabushiki Kaisha | Network connecting device, server device, terminal device, system, receiving method, character input method, transmission method, program, and computer-readable storage medium |
JP2007079745A (ja) * | 2005-09-12 | 2007-03-29 | Sharp Corp | ネットワーク接続装置、サーバ装置、端末装置、システム、受信方法、文字入力方法、送信方法、プログラムおよびコンピュータ読み取り可能な記録媒体 |
CN100444591C (zh) * | 2006-08-18 | 2008-12-17 | 北京金山软件有限公司 | 获取网页关键字的方法及其应用系统 |
EP1901187A3 (de) | 2006-09-16 | 2009-02-04 | LOEWE OPTA GmbH | Verfahren zur Suche nach Nutzdaten in Datenbanken von unterhaltungselektronischen Geräten |
TW200836564A (en) * | 2007-02-16 | 2008-09-01 | Mstar Semiconductor Inc | Control circuit of a display with program searching function, and method for controlling the display to receive program information and select program |
JP5178109B2 (ja) * | 2007-09-25 | 2013-04-10 | 株式会社東芝 | 検索装置、方法及びプログラム |
JP2009094658A (ja) * | 2007-10-05 | 2009-04-30 | Hitachi Ltd | 関連情報提供装置、及び関連情報提供方法 |
JP2010003383A (ja) * | 2008-06-23 | 2010-01-07 | Victor Co Of Japan Ltd | 放送番組記録再生装置 |
JP5392227B2 (ja) * | 2010-10-14 | 2014-01-22 | 株式会社Jvcケンウッド | フィルタリング装置およびフィルタリング方法 |
US8606788B2 (en) * | 2011-06-15 | 2013-12-10 | Microsoft Corporation | Dictionary for hierarchical attributes from catalog items |
JP5516641B2 (ja) * | 2012-04-27 | 2014-06-11 | 株式会社Jvcケンウッド | 放送番組記録再生装置 |
CN105554519B (zh) * | 2015-12-24 | 2019-02-22 | 北京酷云互动科技有限公司 | Epg信息解析方法及系统 |
CN106933799A (zh) * | 2015-12-31 | 2017-07-07 | 北京四维图新科技股份有限公司 | 一种兴趣点poi名称的中文分词方法及装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0810452B2 (ja) * | 1988-04-18 | 1996-01-31 | 日本電信電話株式会社 | 日本語対象文固有用語抽出処理装置 |
US9286294B2 (en) * | 1992-12-09 | 2016-03-15 | Comcast Ip Holdings I, Llc | Video and digital multimedia aggregator content suggestion engine |
US5870084A (en) * | 1996-11-12 | 1999-02-09 | Thomson Consumer Electronics, Inc. | System and method for efficiently storing and quickly retrieving glyphs for large character set languages in a set top box |
JP3880116B2 (ja) * | 1996-12-27 | 2007-02-14 | キヤノン株式会社 | 電子ファイリングシステム、電子ファイリング方法及び記録媒体 |
JPH10198667A (ja) * | 1996-12-28 | 1998-07-31 | Casio Comput Co Ltd | 文字列変換装置およびそのプログラム記録媒体 |
JP4287054B2 (ja) * | 1998-05-22 | 2009-07-01 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | キーワード検出手段を有する記録装置 |
JP3645720B2 (ja) * | 1998-10-02 | 2005-05-11 | 松下電器産業株式会社 | Epg情報表示方法、及びプログラム記録媒体 |
US7209942B1 (en) * | 1998-12-28 | 2007-04-24 | Kabushiki Kaisha Toshiba | Information providing method and apparatus, and information reception apparatus |
JP2001075959A (ja) * | 1999-08-31 | 2001-03-23 | Matsushita Electric Ind Co Ltd | 文書処理装置 |
US6449766B1 (en) * | 1999-12-23 | 2002-09-10 | Webtv Networks, Inc. | System and method for consolidating television rating systems |
JP4253152B2 (ja) * | 2000-01-05 | 2009-04-08 | 三菱電機株式会社 | キーワード抽出装置 |
US6463428B1 (en) * | 2000-03-29 | 2002-10-08 | Koninklijke Philips Electronics N.V. | User interface providing automatic generation and ergonomic presentation of keyword search criteria |
JP2001337980A (ja) * | 2000-05-29 | 2001-12-07 | Sony Corp | 電子番組ガイド検索方法及び電子番組ガイド検索装置 |
US6925650B1 (en) * | 2000-08-21 | 2005-08-02 | Hughes Electronics Corporation | Method and apparatus for automated creation of linking information |
-
2002
- 2002-07-30 JP JP2002221698A patent/JP4040382B2/ja not_active Expired - Lifetime
-
2003
- 2003-07-30 WO PCT/JP2003/009678 patent/WO2004012101A1/ja active Application Filing
- 2003-07-30 CN CNB038223856A patent/CN100530174C/zh not_active Expired - Lifetime
- 2003-07-30 EP EP03771430A patent/EP1544751A4/en not_active Ceased
- 2003-07-30 KR KR1020057001427A patent/KR100993957B1/ko active IP Right Grant
- 2003-07-30 US US10/523,332 patent/US7577972B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US7577972B2 (en) | 2009-08-18 |
KR20050025999A (ko) | 2005-03-14 |
CN1682220A (zh) | 2005-10-12 |
JP4040382B2 (ja) | 2008-01-30 |
EP1544751A4 (en) | 2007-12-26 |
JP2004062639A (ja) | 2004-02-26 |
WO2004012101A1 (ja) | 2004-02-05 |
CN100530174C (zh) | 2009-08-19 |
US20060116869A1 (en) | 2006-06-01 |
EP1544751A1 (en) | 2005-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100993957B1 (ko) | 키워드의 자동 추출 장치 및 방법, 및 기록 매체 | |
US8826131B2 (en) | Information processing apparatus, information processing method, and information processing program for generating content lists | |
JP4198786B2 (ja) | 情報フィルタリングシステム、情報フィルタリング装置、映像機器および情報フィルタリング方法 | |
US8250623B2 (en) | Preference extracting apparatus, preference extracting method and preference extracting program | |
JP3844901B2 (ja) | 電子番組ガイド受信システム | |
JP4623985B2 (ja) | 電子番組ガイド(epg)データのフリーテキスト検索および属性検索 | |
KR101484633B1 (ko) | 영상 녹화 재생장치 및 영상 녹화 재생 방법 | |
JPH1169253A (ja) | 統合番組ガイドを有する放送受信装置 | |
US20060282407A1 (en) | Display method | |
KR100988255B1 (ko) | 정보 처리 장치 및 방법, 및 프로그램이 기록된 컴퓨터로 판독가능한 매체 | |
JP2009118168A (ja) | 番組録画再生装置、および、番組録画再生方法 | |
JPWO2008078717A1 (ja) | 番組データ管理サーバ、識別子割当装置、番組データ管理方法及びプログラム | |
JP2006217215A (ja) | 番組検索装置、番組検索方法、プログラムおよび記録媒体ならびに受信装置 | |
JP5225418B2 (ja) | 情報処理装置及び方法 | |
KR101573331B1 (ko) | 방송 수신장치 및 그 키워드 검색 방법 | |
JP2001028717A (ja) | 情報表示装置及び情報受信装置並びにそれらの方法 | |
JP3772449B2 (ja) | テレビジョン番組の記録再生装置および方法 | |
JP3225020B2 (ja) | 番組表表示システムおよび番組表表示装置 | |
EP1463059A2 (en) | Recording and reproduction apparatus | |
CN101605011B (zh) | 信息处理装置、信息处理方法 | |
JP2008027186A (ja) | 情報検索装置および情報検索方法 | |
JP6028505B2 (ja) | 録画再生装置および番組検索方法 | |
KR100694423B1 (ko) | 디지털 방송 수신기에 있어서 키워드 인덱스를 이용한전자프로그램가이드 정보 검색 방법 및 장치 | |
JP2011035628A (ja) | キーワード検索システム、デジタル放送受信機及びキーワード検索方法 | |
CN112866793B (zh) | 一种媒体模式切换方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20131025 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20141024 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20151023 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20161019 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20171018 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20181031 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20191023 Year of fee payment: 10 |