RU2015129559A - Система и способ поиска помеченного преимущественно нетекстового элемента - Google Patents

Система и способ поиска помеченного преимущественно нетекстового элемента Download PDF

Info

Publication number
RU2015129559A
RU2015129559A RU2015129559A RU2015129559A RU2015129559A RU 2015129559 A RU2015129559 A RU 2015129559A RU 2015129559 A RU2015129559 A RU 2015129559A RU 2015129559 A RU2015129559 A RU 2015129559A RU 2015129559 A RU2015129559 A RU 2015129559A
Authority
RU
Russia
Prior art keywords
lpnt
metadata
elements
relevance
terms
Prior art date
Application number
RU2015129559A
Other languages
English (en)
Inventor
Мауро БАРБЬЕРИ
Йоханнес Хенрикус Мария КОРСТ
Сервериус Петрус Паулус ПРОНК
Рамон Антуан Виро КЛАУТ
Original Assignee
Конинклейке Филипс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Конинклейке Филипс Н.В. filed Critical Конинклейке Филипс Н.В.
Publication of RU2015129559A publication Critical patent/RU2015129559A/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Claims (41)

1. Система базы данных для хранения метаданных о помеченных преимущественно нетекстовых элементах в наборе помеченных преимущественно нетекстовых элементов (элементов lpnt), содержащая:
средство (10) памяти, на котором хранятся соответствующие метаданные для элементов lpnt в пределах упомянутого набора, причем упомянутые метаданные содержат по меньшей мере одну метку элемента lpnt, выбранную из набора меток, и описание элемента lpnt, причем упомянутый набор меток определяет классы, причем объем данных, необходимых для кодирования текста, появляющегося в элементе lpnt в кодировке ascii, составляет не более чем 1% от общего объема данных, используемых для кодирования элемента lpnt,
средство (20) формирования ключевого слова для формирования данных ключевого слова для соответствующих классов, содержащий модуль определения релевантности термов для назначения релевантности извлеченных термов для упомянутых классов, для выбора термов из упомянутых извлеченных термов на основании их назначенной релевантности и обеспечения этих выбранных термов в качестве ключевых слов-кандидатов,
средство (30) обогащения метаданных,
отличающаяся тем, что средство (20) формирования ключевых слов содержит модуль извлечения для извлечения извлеченных термов из описаний элементов lpnt элементов lpnt, связанных с упомянутыми соответствующими классами, и тем, что средство (30) обогащения метаданных обеспечено для добавления соответствующих подмножеств ключевых слов-кандидатов, сформированных для класса, в качестве выбранных ключевых слов к метаданным элементов lpnt класса.
2. Система базы данных по п. 1, в которой элементы lpnt являются элементами воспроизведения для воспроизведения посредством устройства воспроизведения мультимедиа.
3. Система базы данных по п. 1, в которой упомянутый модуль определения релевантности термов содержит блок анализа частоты термов для обеспечения указания частоты, указывающего частоту термов для элементов lpnt, имеющих соответствующий класс в соответствии с упомянутой классификацией, причем упомянутое устройство формирования ключевого слова дополнительно содержит опорный блок для обеспечения опорного указания, указывающего частоту терма в наборе элементов lpnt, и блок нормализации для определения релевантности терма в соответствии с упомянутым указанием частоты и упомянутым опорным указанием.
4. Система базы данных по любому из пп. 1, 2 или 3, в которой упомянутое средство обогащения метаданных содержит средство выдачи запроса для выдачи первого запроса (q1) и второго запроса (q2) общему механизму поиска, причем упомянутый первый запрос (q1) выполняется на основании заголовка элемента lpnt и ключевого слова-кандидата, обеспеченного средством (wk) формирования ключевого слова, а второй запрос (q2) выполняется на основании заголовка элемента lpnt без указания обеспеченного ключевого слова-кандидата, и в которой средство обогащения метаданных дополнительно содержит дополнительное средство указания релевантности для определения релевантности, зависящей от элемента lpnt, ключевого слова-кандидата, с использованием числа оцененных совпадений для упомянутого первого запроса (q1) и числа оцененных совпадений для упомянутого второго запроса (q2), и в которой средство обогащения метаданных дополнительно содержит средство блокировки для предотвращения того, что обеспеченное ключевое слово-кандидат назначается метаданным элемента lpnt, если релевантность, зависящая от элемента lpnt, ключевого слова-кандидата для этого элемента lpnt является меньшей, чем заранее определенное значение.
5. Система базы данных по п. 4, в которой упомянутое средство выдачи запроса дополнительно выполнено с возможностью выдачи третьего запроса (q3) общему механизму поиска, причем упомянутый третий запрос выполняется на основании ключевого слова-кандидата без указания заголовка элемента lpnt, и в которой релевантность, зависящая от элемента lpnt, определенная для ключевого слова-кандидата, дополнительно зависит от числа оцененных совпадений для упомянутого третьего запроса (q3).
6. Система базы данных по п. 4, в которой средство (30) обогащения метаданных выполнено с возможностью добавления выбранных ключевых слов к упомянутым метаданным в записи, отдельной от записи для хранения описания.
7. Система базы данных по п. 4, дополнительно содержащая:
средство (40) связи для приема пользовательского запроса (USR) на поиск, включающего в себя набор (Ku) из одного или нескольких ключевых слов, указанных пользователем,
средство (50) поиска для выполнения запроса в упомянутых обогащенных метаданных на основании набора из одного или нескольких ключевых слов, указанных пользователем.
8. Система базы данных по п. 7, дополнительно содержащая:
средство (60) ввода для приема метаданных о новом элементе lpnt,
средство (70) обновления для хранения упомянутых метаданных в средстве хранения и для обновления метаданных элементов lpnt в наборе.
9. Система базы данных по п. 8, дополнительно содержащая:
средство (80) хранения профиля пользователя для хранения профилей пользователей, причем профиль пользователя содержит по меньшей мере ключевые слова, указанные пользователем,
средство (90) рекомендаций для, при приеме метаданных о новом элементе lpnt и после обновления метаданных об упомянутом новом элементе lpnt, сравнения обновленных метаданных нового элемента lpnt с соответствующими ключевыми словами, указанными пользователем, для каждого пользователя и для рекомендации нового элемента lpnt тем пользователям, для которых ключевые слова, указанные пользователем, совпадают с обновленными метаданными нового элемента lpnt.
10. Способ хранения метаданных о помеченных преимущественно нетекстовых элементах в наборе помеченных преимущественно нетекстовых элементов (элементов lpnt), содержащий этапы, на которых:
хранят (S1) соответствующие метаданные для элементов lpnt в пределах упомянутого набора, причем упомянутые метаданные содержат по меньшей мере одну метку элемента lpnt, выбранную из набора меток, и описание элемента lpnt, причем упомянутый набор меток определяет классы, причем объем данных, необходимых для кодирования текста, появляющегося в элементе lpnt в кодировке ascii, составляет не более чем 1% от общего объема данных, используемых для кодирования элемента lpnt,
назначают (S3) релевантность извлеченных термов для упомянутых соответствующих классов,
выбирают (S4) термы из упомянутых извлеченных термов на основании их назначенной релевантности и обеспечивают эти выбранные термы в качестве ключевых слов-кандидатов,
отличающийся тем, что
извлекают (S2) упомянутые извлеченные термы для соответствующих классов из описаний элементов lpnt элементов lpnt, связанных с упомянутыми соответствующими классами, и тем, что
добавляют (S5) подмножество обеспеченных ключевых слов-кандидатов в качестве ключевых слов к метаданным элементов lpnt класса.
11. Способ по п. 10, в которой элементы lpnt являются элементами воспроизведения для воспроизведения посредством устройства воспроизведения мультимедиа.
12. Способ по п. 10 или 11, в котором этап, на котором назначают релевантность термов, содержит этап, на котором обеспечивают указание частоты, указывающее частоту термов для элементов lpnt, имеющих соответствующий класс в соответствии с упомянутой классификацией, обеспечивают опорное указание, указывающее частоту терма в наборе элементов lpnt, и определяют релевантность терма в соответствии с упомянутым указанием частоты и упомянутым опорным указанием.
13. Способ по п. 11, дополнительно содержащий этапы, на которых выдают первый запрос (q1) и второй запрос (q2) общему механизму поиска, причем упомянутый первый запрос (q1) выполняется на основании заголовка элемента lpnt и ключевого слова-кандидата, обеспеченного средством (wk) формирования ключевого слова-кандидата, и второй запрос (q2) выполняется на основании заголовка элемента lpnt без указания обеспеченного ключевого слова-кандидата, и определяют релевантность, зависящую от элемента lpnt, ключевого слова-кандидата, с использованием числа оцененных совпадений для упомянутого первого запроса (q1) и числа оцененных совпадений для упомянутого второго запроса (q2), и предотвращают то, что обеспеченное ключевое слово-кандидат назначается в качестве ключевого слова метаданным элемента lpnt, если релевантность, зависящая от элемента lpnt, ключевого слова-кандидата является меньшей, чем заранее определенное значение.
14. Способ по п. 13, дополнительно содержащий этапы, на которых выдают третий запрос (q3) общему механизму поиска, причем упомянутый третий запрос (q3) выполняется на основании ключевого слова-кандидата без указания заголовка элемента lpnt и в котором релевантность, зависящая от элемента lpnt, определенная для ключевого слова-кандидата, дополнительно зависит от числа оцененных совпадений для упомянутого третьего запроса (q3).
15. Способ по п. 11, в котором подмножество, которое выбрано из ключевых слов-кандидатов, добавляется к упомянутым метаданным в записи, отдельной от записи для хранения описания.
16. Способ по п. 11, дополнительно содержащий этапы, на которых:
принимают пользовательский запрос (USR) на поиск, включающий в себя набор (Ku) из одного или нескольких ключевых слов, указанных пользователем,
выполняют запрос в упомянутых обогащенных метаданных на основании набора из одного или нескольких ключевых слов, указанных пользователем.
17. Компьютерный программный продукт, содержащий команды для предписывания устройству обработки данных выполнять этапы, на которых:
хранят соответствующие метаданные для помеченных преимущественно нетекстовых элементов в наборе помеченных преимущественно нетекстовых элементов (элементов lpnt), причем метаданные содержат по меньшей мере одну метку элемента lpnt и описание элемента lpnt, упомянутый набор меток определяет классы, причем объем данных, необходимых для кодирования текста, появляющегося в элементе lpnt в кодировке ascii, составляет не более чем 1% от общего объема данных, используемых для кодирования элемента lpnt,
назначают релевантность извлеченных термов для упомянутых соответствующих классов,
выбирают термы из упомянутых извлеченных термов на основании их назначенной релевантности и обеспечивают эти выбранные термы в качестве ключевых слов-кандидатов,
отличающийся тем, что
извлекают упомянутые извлеченные термы для соответствующих классов из описаний элементов lpnt элементов lpnt, связанных с упомянутыми классами, и тем, что
добавляют подмножество обеспеченных ключевых слов-кандидатов в качестве ключевых слов к метаданным элементов lpnt класса.
RU2015129559A 2012-12-20 2013-09-29 Система и способ поиска помеченного преимущественно нетекстового элемента RU2015129559A (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261739819P 2012-12-20 2012-12-20
US61/739,819 2012-12-20
PCT/IB2013/058974 WO2014097000A1 (en) 2012-12-20 2013-09-29 System and method for searching a labeled predominantly non-textual item

Publications (1)

Publication Number Publication Date
RU2015129559A true RU2015129559A (ru) 2017-01-26

Family

ID=49920363

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015129559A RU2015129559A (ru) 2012-12-20 2013-09-29 Система и способ поиска помеченного преимущественно нетекстового элемента

Country Status (7)

Country Link
US (1) US9940382B2 (ru)
EP (1) EP2936348A1 (ru)
JP (1) JP6219967B2 (ru)
CN (1) CN104854588B (ru)
BR (1) BR112015014319A2 (ru)
RU (1) RU2015129559A (ru)
WO (1) WO2014097000A1 (ru)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150317572A1 (en) * 2014-05-05 2015-11-05 Sap Ag On-Demand Enrichment of Business Data
US10489410B2 (en) 2016-04-18 2019-11-26 Google Llc Mapping images to search queries
CN109635277B (zh) * 2018-11-13 2023-05-26 北京合享智慧科技有限公司 一种获取实体信息的方法及相关装置
CN111709229A (zh) * 2020-06-16 2020-09-25 平安科技(深圳)有限公司 基于人工智能的文本生成方法、装置、计算机设备和介质
CN114697748B (zh) * 2020-12-25 2024-05-03 深圳Tcl新技术有限公司 一种基于语音识别的视频推荐方法和计算机设备
CN114328389B (zh) * 2021-12-31 2022-06-17 浙江汇鼎华链科技有限公司 一种云计算环境下的大数据文件分析处理系统及方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6850971B1 (en) * 1997-02-18 2005-02-01 Pioneer Electronic Corporation System for processing information which reads address information
JP4953496B2 (ja) * 2000-05-15 2012-06-13 ソニー株式会社 コンテンツ検索・提示システム及び方法、並びに、ソフトウェア記憶媒体
JP3627715B2 (ja) 2002-03-27 2005-03-09 ソニー株式会社 情報処理装置および方法、記録媒体、プログラム、並びに情報処理システム
JP4299683B2 (ja) 2004-01-08 2009-07-22 日本電信電話株式会社 メタデータ管理方法、メタデータ管理装置、メタデータ管理プログラム及びメタデータ管理プログラムを記録した記録媒体
US8098976B1 (en) 2011-09-26 2012-01-17 Limelight Networks, Inc. Methods and systems for performing top concepts extraction
JP2008139942A (ja) 2006-11-30 2008-06-19 Seiko Epson Corp 情報処理装置、情報処理方法、および、プログラム
WO2008124536A1 (en) * 2007-04-04 2008-10-16 Seeqpod, Inc. Discovering and scoring relationships extracted from human generated lists
JP2009163600A (ja) 2008-01-09 2009-07-23 Hitachi Ltd メタデータ共有システム、サーバ装置、クライアント装置及びメタデータ共有方法
US8407216B2 (en) * 2008-09-25 2013-03-26 Yahoo! Inc. Automated tagging of objects in databases
NO329897B1 (no) * 2008-12-19 2011-01-24 Tandberg Telecom As Fremgangsmate for raskere ansiktsdeteksjon
US20100226582A1 (en) * 2009-03-03 2010-09-09 Jiebo Luo Assigning labels to images in a collection
ITTO20090704A1 (it) * 2009-09-16 2011-03-17 Intellisemantic Srl Sistema e metodo per la classificazione di contenuti
JP2013534333A (ja) * 2010-07-21 2013-09-02 スペクトラルマインド ゲーエムベーハー メディアアイテムを編成して視覚化する方法およびシステム
US8577938B2 (en) * 2011-08-23 2013-11-05 Accenture Global Services Limited Data mapping acceleration

Also Published As

Publication number Publication date
CN104854588A (zh) 2015-08-19
CN104854588B (zh) 2019-06-04
WO2014097000A1 (en) 2014-06-26
BR112015014319A2 (pt) 2017-07-11
JP6219967B2 (ja) 2017-10-25
EP2936348A1 (en) 2015-10-28
US9940382B2 (en) 2018-04-10
JP2016509703A (ja) 2016-03-31
US20150324446A1 (en) 2015-11-12

Similar Documents

Publication Publication Date Title
US8775442B2 (en) Semantic search using a single-source semantic model
CN102725759B (zh) 用于搜索结果的语义目录
US9600533B2 (en) Matching and recommending relevant videos and media to individual search engine results
US8117185B2 (en) Media discovery and playlist generation
US9104979B2 (en) Entity recognition using probabilities for out-of-collection data
RU2015129559A (ru) Система и способ поиска помеченного преимущественно нетекстового элемента
US20120117051A1 (en) Multi-modal approach to search query input
CN109145110B (zh) 标签查询方法和装置
US20120002884A1 (en) Method and apparatus for managing video content
US20100010984A1 (en) Method and system for dynamically generating a search result
CN106708929B (zh) 视频节目的搜索方法和装置
RU2014113565A (ru) Способ и устройство для автоматического генерирования рекомендаций
CN110866018B (zh) 一种基于标签及标识解析的汽摩行业数据录入及检索方法
JP6056610B2 (ja) テキスト情報処理装置、テキスト情報処理方法、及びテキスト情報処理プログラム
CN114911917B (zh) 资产元信息搜索方法、装置、计算机设备及可读存储介质
KR20090065130A (ko) 시그니처 파일을 이용한 고차원 데이터 색인 및 검색방법과 그 시스템
MX2012011923A (es) Asignacion de atributis aplicables para datos que describen la identidad personal.
CN101350027A (zh) 内容检索设备和内容检索方法
CN104657376A (zh) 基于节目关系的视频节目的搜索方法和装置
CN106372123B (zh) 一种基于标签的相关内容推荐方法和系统
JP6260678B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
Swe Intelligent information retrieval within digital library using domain ontology
CN110806861B (zh) 一种结合用户反馈信息的api推荐方法及终端
JP2009104475A (ja) 類似文書検索装置、類似文書検索方法およびプログラム
JP2009223679A (ja) 電子文書検索装置、及び電子文書検索プログラム

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20180215