RU2015129559A - Система и способ поиска помеченного преимущественно нетекстового элемента - Google Patents
Система и способ поиска помеченного преимущественно нетекстового элемента Download PDFInfo
- Publication number
- RU2015129559A RU2015129559A RU2015129559A RU2015129559A RU2015129559A RU 2015129559 A RU2015129559 A RU 2015129559A RU 2015129559 A RU2015129559 A RU 2015129559A RU 2015129559 A RU2015129559 A RU 2015129559A RU 2015129559 A RU2015129559 A RU 2015129559A
- Authority
- RU
- Russia
- Prior art keywords
- lpnt
- metadata
- elements
- relevance
- terms
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Claims (41)
1. Система базы данных для хранения метаданных о помеченных преимущественно нетекстовых элементах в наборе помеченных преимущественно нетекстовых элементов (элементов lpnt), содержащая:
средство (10) памяти, на котором хранятся соответствующие метаданные для элементов lpnt в пределах упомянутого набора, причем упомянутые метаданные содержат по меньшей мере одну метку элемента lpnt, выбранную из набора меток, и описание элемента lpnt, причем упомянутый набор меток определяет классы, причем объем данных, необходимых для кодирования текста, появляющегося в элементе lpnt в кодировке ascii, составляет не более чем 1% от общего объема данных, используемых для кодирования элемента lpnt,
средство (20) формирования ключевого слова для формирования данных ключевого слова для соответствующих классов, содержащий модуль определения релевантности термов для назначения релевантности извлеченных термов для упомянутых классов, для выбора термов из упомянутых извлеченных термов на основании их назначенной релевантности и обеспечения этих выбранных термов в качестве ключевых слов-кандидатов,
средство (30) обогащения метаданных,
отличающаяся тем, что средство (20) формирования ключевых слов содержит модуль извлечения для извлечения извлеченных термов из описаний элементов lpnt элементов lpnt, связанных с упомянутыми соответствующими классами, и тем, что средство (30) обогащения метаданных обеспечено для добавления соответствующих подмножеств ключевых слов-кандидатов, сформированных для класса, в качестве выбранных ключевых слов к метаданным элементов lpnt класса.
2. Система базы данных по п. 1, в которой элементы lpnt являются элементами воспроизведения для воспроизведения посредством устройства воспроизведения мультимедиа.
3. Система базы данных по п. 1, в которой упомянутый модуль определения релевантности термов содержит блок анализа частоты термов для обеспечения указания частоты, указывающего частоту термов для элементов lpnt, имеющих соответствующий класс в соответствии с упомянутой классификацией, причем упомянутое устройство формирования ключевого слова дополнительно содержит опорный блок для обеспечения опорного указания, указывающего частоту терма в наборе элементов lpnt, и блок нормализации для определения релевантности терма в соответствии с упомянутым указанием частоты и упомянутым опорным указанием.
4. Система базы данных по любому из пп. 1, 2 или 3, в которой упомянутое средство обогащения метаданных содержит средство выдачи запроса для выдачи первого запроса (q1) и второго запроса (q2) общему механизму поиска, причем упомянутый первый запрос (q1) выполняется на основании заголовка элемента lpnt и ключевого слова-кандидата, обеспеченного средством (wk) формирования ключевого слова, а второй запрос (q2) выполняется на основании заголовка элемента lpnt без указания обеспеченного ключевого слова-кандидата, и в которой средство обогащения метаданных дополнительно содержит дополнительное средство указания релевантности для определения релевантности, зависящей от элемента lpnt, ключевого слова-кандидата, с использованием числа оцененных совпадений для упомянутого первого запроса (q1) и числа оцененных совпадений для упомянутого второго запроса (q2), и в которой средство обогащения метаданных дополнительно содержит средство блокировки для предотвращения того, что обеспеченное ключевое слово-кандидат назначается метаданным элемента lpnt, если релевантность, зависящая от элемента lpnt, ключевого слова-кандидата для этого элемента lpnt является меньшей, чем заранее определенное значение.
5. Система базы данных по п. 4, в которой упомянутое средство выдачи запроса дополнительно выполнено с возможностью выдачи третьего запроса (q3) общему механизму поиска, причем упомянутый третий запрос выполняется на основании ключевого слова-кандидата без указания заголовка элемента lpnt, и в которой релевантность, зависящая от элемента lpnt, определенная для ключевого слова-кандидата, дополнительно зависит от числа оцененных совпадений для упомянутого третьего запроса (q3).
6. Система базы данных по п. 4, в которой средство (30) обогащения метаданных выполнено с возможностью добавления выбранных ключевых слов к упомянутым метаданным в записи, отдельной от записи для хранения описания.
7. Система базы данных по п. 4, дополнительно содержащая:
средство (40) связи для приема пользовательского запроса (USR) на поиск, включающего в себя набор (Ku) из одного или нескольких ключевых слов, указанных пользователем,
средство (50) поиска для выполнения запроса в упомянутых обогащенных метаданных на основании набора из одного или нескольких ключевых слов, указанных пользователем.
8. Система базы данных по п. 7, дополнительно содержащая:
средство (60) ввода для приема метаданных о новом элементе lpnt,
средство (70) обновления для хранения упомянутых метаданных в средстве хранения и для обновления метаданных элементов lpnt в наборе.
9. Система базы данных по п. 8, дополнительно содержащая:
средство (80) хранения профиля пользователя для хранения профилей пользователей, причем профиль пользователя содержит по меньшей мере ключевые слова, указанные пользователем,
средство (90) рекомендаций для, при приеме метаданных о новом элементе lpnt и после обновления метаданных об упомянутом новом элементе lpnt, сравнения обновленных метаданных нового элемента lpnt с соответствующими ключевыми словами, указанными пользователем, для каждого пользователя и для рекомендации нового элемента lpnt тем пользователям, для которых ключевые слова, указанные пользователем, совпадают с обновленными метаданными нового элемента lpnt.
10. Способ хранения метаданных о помеченных преимущественно нетекстовых элементах в наборе помеченных преимущественно нетекстовых элементов (элементов lpnt), содержащий этапы, на которых:
хранят (S1) соответствующие метаданные для элементов lpnt в пределах упомянутого набора, причем упомянутые метаданные содержат по меньшей мере одну метку элемента lpnt, выбранную из набора меток, и описание элемента lpnt, причем упомянутый набор меток определяет классы, причем объем данных, необходимых для кодирования текста, появляющегося в элементе lpnt в кодировке ascii, составляет не более чем 1% от общего объема данных, используемых для кодирования элемента lpnt,
назначают (S3) релевантность извлеченных термов для упомянутых соответствующих классов,
выбирают (S4) термы из упомянутых извлеченных термов на основании их назначенной релевантности и обеспечивают эти выбранные термы в качестве ключевых слов-кандидатов,
отличающийся тем, что
извлекают (S2) упомянутые извлеченные термы для соответствующих классов из описаний элементов lpnt элементов lpnt, связанных с упомянутыми соответствующими классами, и тем, что
добавляют (S5) подмножество обеспеченных ключевых слов-кандидатов в качестве ключевых слов к метаданным элементов lpnt класса.
11. Способ по п. 10, в которой элементы lpnt являются элементами воспроизведения для воспроизведения посредством устройства воспроизведения мультимедиа.
12. Способ по п. 10 или 11, в котором этап, на котором назначают релевантность термов, содержит этап, на котором обеспечивают указание частоты, указывающее частоту термов для элементов lpnt, имеющих соответствующий класс в соответствии с упомянутой классификацией, обеспечивают опорное указание, указывающее частоту терма в наборе элементов lpnt, и определяют релевантность терма в соответствии с упомянутым указанием частоты и упомянутым опорным указанием.
13. Способ по п. 11, дополнительно содержащий этапы, на которых выдают первый запрос (q1) и второй запрос (q2) общему механизму поиска, причем упомянутый первый запрос (q1) выполняется на основании заголовка элемента lpnt и ключевого слова-кандидата, обеспеченного средством (wk) формирования ключевого слова-кандидата, и второй запрос (q2) выполняется на основании заголовка элемента lpnt без указания обеспеченного ключевого слова-кандидата, и определяют релевантность, зависящую от элемента lpnt, ключевого слова-кандидата, с использованием числа оцененных совпадений для упомянутого первого запроса (q1) и числа оцененных совпадений для упомянутого второго запроса (q2), и предотвращают то, что обеспеченное ключевое слово-кандидат назначается в качестве ключевого слова метаданным элемента lpnt, если релевантность, зависящая от элемента lpnt, ключевого слова-кандидата является меньшей, чем заранее определенное значение.
14. Способ по п. 13, дополнительно содержащий этапы, на которых выдают третий запрос (q3) общему механизму поиска, причем упомянутый третий запрос (q3) выполняется на основании ключевого слова-кандидата без указания заголовка элемента lpnt и в котором релевантность, зависящая от элемента lpnt, определенная для ключевого слова-кандидата, дополнительно зависит от числа оцененных совпадений для упомянутого третьего запроса (q3).
15. Способ по п. 11, в котором подмножество, которое выбрано из ключевых слов-кандидатов, добавляется к упомянутым метаданным в записи, отдельной от записи для хранения описания.
16. Способ по п. 11, дополнительно содержащий этапы, на которых:
принимают пользовательский запрос (USR) на поиск, включающий в себя набор (Ku) из одного или нескольких ключевых слов, указанных пользователем,
выполняют запрос в упомянутых обогащенных метаданных на основании набора из одного или нескольких ключевых слов, указанных пользователем.
17. Компьютерный программный продукт, содержащий команды для предписывания устройству обработки данных выполнять этапы, на которых:
хранят соответствующие метаданные для помеченных преимущественно нетекстовых элементов в наборе помеченных преимущественно нетекстовых элементов (элементов lpnt), причем метаданные содержат по меньшей мере одну метку элемента lpnt и описание элемента lpnt, упомянутый набор меток определяет классы, причем объем данных, необходимых для кодирования текста, появляющегося в элементе lpnt в кодировке ascii, составляет не более чем 1% от общего объема данных, используемых для кодирования элемента lpnt,
назначают релевантность извлеченных термов для упомянутых соответствующих классов,
выбирают термы из упомянутых извлеченных термов на основании их назначенной релевантности и обеспечивают эти выбранные термы в качестве ключевых слов-кандидатов,
отличающийся тем, что
извлекают упомянутые извлеченные термы для соответствующих классов из описаний элементов lpnt элементов lpnt, связанных с упомянутыми классами, и тем, что
добавляют подмножество обеспеченных ключевых слов-кандидатов в качестве ключевых слов к метаданным элементов lpnt класса.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261739819P | 2012-12-20 | 2012-12-20 | |
US61/739,819 | 2012-12-20 | ||
PCT/IB2013/058974 WO2014097000A1 (en) | 2012-12-20 | 2013-09-29 | System and method for searching a labeled predominantly non-textual item |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2015129559A true RU2015129559A (ru) | 2017-01-26 |
Family
ID=49920363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015129559A RU2015129559A (ru) | 2012-12-20 | 2013-09-29 | Система и способ поиска помеченного преимущественно нетекстового элемента |
Country Status (7)
Country | Link |
---|---|
US (1) | US9940382B2 (ru) |
EP (1) | EP2936348A1 (ru) |
JP (1) | JP6219967B2 (ru) |
CN (1) | CN104854588B (ru) |
BR (1) | BR112015014319A2 (ru) |
RU (1) | RU2015129559A (ru) |
WO (1) | WO2014097000A1 (ru) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150317572A1 (en) * | 2014-05-05 | 2015-11-05 | Sap Ag | On-Demand Enrichment of Business Data |
US10489410B2 (en) | 2016-04-18 | 2019-11-26 | Google Llc | Mapping images to search queries |
CN109635277B (zh) * | 2018-11-13 | 2023-05-26 | 北京合享智慧科技有限公司 | 一种获取实体信息的方法及相关装置 |
CN111709229A (zh) * | 2020-06-16 | 2020-09-25 | 平安科技(深圳)有限公司 | 基于人工智能的文本生成方法、装置、计算机设备和介质 |
CN114697748B (zh) * | 2020-12-25 | 2024-05-03 | 深圳Tcl新技术有限公司 | 一种基于语音识别的视频推荐方法和计算机设备 |
CN114328389B (zh) * | 2021-12-31 | 2022-06-17 | 浙江汇鼎华链科技有限公司 | 一种云计算环境下的大数据文件分析处理系统及方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6850971B1 (en) * | 1997-02-18 | 2005-02-01 | Pioneer Electronic Corporation | System for processing information which reads address information |
JP4953496B2 (ja) * | 2000-05-15 | 2012-06-13 | ソニー株式会社 | コンテンツ検索・提示システム及び方法、並びに、ソフトウェア記憶媒体 |
JP3627715B2 (ja) | 2002-03-27 | 2005-03-09 | ソニー株式会社 | 情報処理装置および方法、記録媒体、プログラム、並びに情報処理システム |
JP4299683B2 (ja) | 2004-01-08 | 2009-07-22 | 日本電信電話株式会社 | メタデータ管理方法、メタデータ管理装置、メタデータ管理プログラム及びメタデータ管理プログラムを記録した記録媒体 |
US8098976B1 (en) | 2011-09-26 | 2012-01-17 | Limelight Networks, Inc. | Methods and systems for performing top concepts extraction |
JP2008139942A (ja) | 2006-11-30 | 2008-06-19 | Seiko Epson Corp | 情報処理装置、情報処理方法、および、プログラム |
WO2008124536A1 (en) * | 2007-04-04 | 2008-10-16 | Seeqpod, Inc. | Discovering and scoring relationships extracted from human generated lists |
JP2009163600A (ja) | 2008-01-09 | 2009-07-23 | Hitachi Ltd | メタデータ共有システム、サーバ装置、クライアント装置及びメタデータ共有方法 |
US8407216B2 (en) * | 2008-09-25 | 2013-03-26 | Yahoo! Inc. | Automated tagging of objects in databases |
NO329897B1 (no) * | 2008-12-19 | 2011-01-24 | Tandberg Telecom As | Fremgangsmate for raskere ansiktsdeteksjon |
US20100226582A1 (en) * | 2009-03-03 | 2010-09-09 | Jiebo Luo | Assigning labels to images in a collection |
ITTO20090704A1 (it) * | 2009-09-16 | 2011-03-17 | Intellisemantic Srl | Sistema e metodo per la classificazione di contenuti |
JP2013534333A (ja) * | 2010-07-21 | 2013-09-02 | スペクトラルマインド ゲーエムベーハー | メディアアイテムを編成して視覚化する方法およびシステム |
US8577938B2 (en) * | 2011-08-23 | 2013-11-05 | Accenture Global Services Limited | Data mapping acceleration |
-
2013
- 2013-09-29 JP JP2015548797A patent/JP6219967B2/ja not_active Expired - Fee Related
- 2013-09-29 WO PCT/IB2013/058974 patent/WO2014097000A1/en active Application Filing
- 2013-09-29 EP EP13818375.1A patent/EP2936348A1/en not_active Ceased
- 2013-09-29 RU RU2015129559A patent/RU2015129559A/ru not_active Application Discontinuation
- 2013-09-29 CN CN201380067494.9A patent/CN104854588B/zh not_active Expired - Fee Related
- 2013-09-29 BR BR112015014319A patent/BR112015014319A2/pt not_active IP Right Cessation
- 2013-09-29 US US14/653,277 patent/US9940382B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN104854588A (zh) | 2015-08-19 |
CN104854588B (zh) | 2019-06-04 |
WO2014097000A1 (en) | 2014-06-26 |
BR112015014319A2 (pt) | 2017-07-11 |
JP6219967B2 (ja) | 2017-10-25 |
EP2936348A1 (en) | 2015-10-28 |
US9940382B2 (en) | 2018-04-10 |
JP2016509703A (ja) | 2016-03-31 |
US20150324446A1 (en) | 2015-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8775442B2 (en) | Semantic search using a single-source semantic model | |
CN102725759B (zh) | 用于搜索结果的语义目录 | |
US9600533B2 (en) | Matching and recommending relevant videos and media to individual search engine results | |
US8117185B2 (en) | Media discovery and playlist generation | |
US9104979B2 (en) | Entity recognition using probabilities for out-of-collection data | |
RU2015129559A (ru) | Система и способ поиска помеченного преимущественно нетекстового элемента | |
US20120117051A1 (en) | Multi-modal approach to search query input | |
CN109145110B (zh) | 标签查询方法和装置 | |
US20120002884A1 (en) | Method and apparatus for managing video content | |
US20100010984A1 (en) | Method and system for dynamically generating a search result | |
CN106708929B (zh) | 视频节目的搜索方法和装置 | |
RU2014113565A (ru) | Способ и устройство для автоматического генерирования рекомендаций | |
CN110866018B (zh) | 一种基于标签及标识解析的汽摩行业数据录入及检索方法 | |
JP6056610B2 (ja) | テキスト情報処理装置、テキスト情報処理方法、及びテキスト情報処理プログラム | |
CN114911917B (zh) | 资产元信息搜索方法、装置、计算机设备及可读存储介质 | |
KR20090065130A (ko) | 시그니처 파일을 이용한 고차원 데이터 색인 및 검색방법과 그 시스템 | |
MX2012011923A (es) | Asignacion de atributis aplicables para datos que describen la identidad personal. | |
CN101350027A (zh) | 内容检索设备和内容检索方法 | |
CN104657376A (zh) | 基于节目关系的视频节目的搜索方法和装置 | |
CN106372123B (zh) | 一种基于标签的相关内容推荐方法和系统 | |
JP6260678B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
Swe | Intelligent information retrieval within digital library using domain ontology | |
CN110806861B (zh) | 一种结合用户反馈信息的api推荐方法及终端 | |
JP2009104475A (ja) | 類似文書検索装置、類似文書検索方法およびプログラム | |
JP2009223679A (ja) | 電子文書検索装置、及び電子文書検索プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA92 | Acknowledgement of application withdrawn (lack of supplementary materials submitted) |
Effective date: 20180215 |