JP6219967B2 - ラベル付非テキスト系アイテムを検索するためのシステム及び方法 - Google Patents
ラベル付非テキスト系アイテムを検索するためのシステム及び方法 Download PDFInfo
- Publication number
- JP6219967B2 JP6219967B2 JP2015548797A JP2015548797A JP6219967B2 JP 6219967 B2 JP6219967 B2 JP 6219967B2 JP 2015548797 A JP2015548797 A JP 2015548797A JP 2015548797 A JP2015548797 A JP 2015548797A JP 6219967 B2 JP6219967 B2 JP 6219967B2
- Authority
- JP
- Japan
- Prior art keywords
- lpnt
- item
- metadata
- class
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Description
− 用語リストは、lpntアイテムの説明(例えば、表題)において生じる用語を有するlpntアイテムinewに対して決定される。
− 用語頻度リストは、前記用語リストの用語が発生する頻度のための指標を有するlpntアイテムに対して決定される。
− 用語頻度リストに基づいて、関連したクラス/複数のクラスのための用語頻度Ftcが更新される。即ち、新たなlpntアイテムinewが属している各クラスに関して、用語頻度Ftcは、用語頻度リストにおいて示された頻度によりカウントをインクリメントすることにより更新される。
− また、この情報に基づいて、用語のための基準頻度FRijが更新されてもよい。代わりに、各用語のためのそれぞれの固定された基準頻度が推定されてもよい。しかしながら、新たな用語が経時的に取り込まれるので、基準頻度は、新たな用語のために経時的に追加されるべきである。加えて、幾つかの用語に関して頻度が経時的に増大し、他のものに関しては頻度が経時的に減少するので、基準頻度を経時的に更新することは、1年につき数回行われるのが恐らく好ましいだろう。
− その後、正規化された周波数は、用語統計が新たなlpntアイテムの加算により変更されるクラス(即ち、新たなlpntアイテムが属しているクラス)に対して更新される。基準頻度がまた更新された場合、新たなlpntアイテムから取り出された用語リストにおいて1又はそれ以上の用語を含む他のクラスも更新される。
− lpntアイテムのメタデータは、新たなlpntアイテムが属しているクラスのための手順において以前に選択したキーワードのセットKwに基づいて強化される。
− 他のキーワードが1又はそれ以上のクラスに関連しているように見える正規化された頻度を更新するステップから続く場合、その後、全てのlpntアイテムのメタデータが適宜更新され得る。
Claims (17)
- ラベル付非テキスト系アイテム(lpnt(labeled predominantly non-textual)アイテム)のコレクションにおけるラベル付非テキスト系アイテムについてのメタデータを格納するためのデータベースシステムであって、
前記コレクションの範囲内でlpntアイテムに対するそれぞれのメタデータを格納している格納部であって、前記メタデータは、lpntアイテム説明及びラベルのセットから選択される少なくとも1つのlpntアイテムラベルを有し、前記ラベルのセットはクラスを規定し、asciiコードにおける前記lpntアイテムにおいて生じているテキストをエンコードするのに必要なデータの量は、前記lpntアイテムをエンコードするために使用されるデータの全体量の多くても1%である、格納部と、
それぞれのクラスに対するキーワードデータを生成するためのキーワード生成部であって、前記キーワード生成部は、前記クラスと関連付けられるlpntアイテムのlpntアイテム説明から用語を取り出すための検索モジュールと、前記クラスに対する前記用語の関連性を割り当て、これらの割り当てられた関連性に基づいて前記の取り出された用語から用語を選択し、これらの選択された用語を候補キーワードとして供給するための用語関連性決定モジュールとを有する、キーワード生成部と、
クラスに対して生成された候補キーワードのそれぞれのサブセットを選択されたキーワードとしてクラスのlpntアイテムのメタデータに追加するためのメタデータ強化部とを有する、データベースシステム。 - 前記lpntアイテムは、メディア再生デバイスによる再生のための再生アイテムである、請求項1に記載のデータベースシステム。
- 前記用語関連性決定モジュールは、前記クラスを規定する分類に応じてそれぞれのクラスを有するlpntアイテムに対する用語の頻度を示す頻度指標を供給するための用語頻度解析ユニットを有し、
前記キーワード生成部は、lpntアイテムのコレクションにおける前記用語の頻度を示す基準指標を供給するための基準ユニットと、前記頻度指標及び前記基準指標に従って前記用語の関連性を決定するための正規化ユニットとを更に有する、請求項1に記載のデータベースシステム。 - 前記メタデータ強化部は、第1のクエリ及び第2のクエリを汎用検索エンジンに発行するためのクエリ発行部を有し、前記第1のクエリは、lpntアイテムの表題及び前記キーワード生成部により供給された候補キーワードに基づいて実行され、前記第2のクエリは、供給された候補キーワードを特定することなく、前記lpntアイテムの表題に基づいて実行され、
前記メタデータ強化部は、前記第1のクエリに対して推定されたヒットの数と前記第2のクエリに対して推定されたヒットの数とを用いて前記候補キーワードのlpntアイテム特有の関連性を決定するための追加の関連性指示部を更に有し、
前記メタデータ強化部は、lpntアイテムに対する前記候補キーワードの前記lpntアイテム特有の関連性が予め決められた値より小さい場合に、供給された候補キーワードが前記lpntアイテムの前記メタデータに割り当てられるのを阻止するためのブロッキング部を更に有する、請求項1〜3のうちいずれか一項に記載のデータベースシステム。 - 前記クエリ発行部は、第3のクエリを前記汎用検索エンジンに発行するように更に構成され、前記第3のクエリは、前記lpntアイテムの表題を特定することなく前記候補キーワードに基づいて実行され、
前記候補キーワードに対して決定された前記lpntアイテム特有の関連性は、前記第3のクエリに対して推定されたヒットの数に更に依存する、請求項4に記載のデータベースシステム。 - 前記メタデータ強化部は、選択されたキーワードを、前記説明を格納するための入力とは別個の入力における前記メタデータに追加するように構成される、請求項1〜5のうちいずれか一項に記載のデータベースシステム。
- 1又はそれ以上のユーザ指定されたキーワードのセットを含むユーザ検索要求を受信するための通信部と、
前記1又はそれ以上のユーザ指定されたキーワードのセットに基づいて、強化されたメタデータにおけるクエリを実行するための検索部とを更に有する、請求項1〜6のうちいずれか一項に記載のデータベースシステム。 - 新たなlpntアイテムについてのメタデータを受信するための入力部と、
受信される当該メタデータを前記格納部に格納し、前記コレクションにおける前記lpntアイテムの前記メタデータを更新するための更新部とを更に有する、請求項7に記載のデータベースシステム。 - ユーザプロファイルを格納するためのユーザプロファイル格納部であって、ユーザプロファイルは、少なくともユーザ指定されたキーワードを有する、ユーザプロファイル格納部と、
新たなlpntアイテムについてのメタデータを受信すると、及び、前記新たなlpntアイテムの前記メタデータを更新した後に、前記新たなlpntアイテムの更新されたメタデータを、各ユーザに対するそれぞれのユーザ指定されたキーワードと比較し、前記ユーザ指定されたキーワードが前記新たなlpntアイテムの前記更新されたメタデータにマッチするユーザに前記新たなlpntアイテムを推薦するための推薦部とを更に有する、請求項8に記載のデータベースシステム。 - ラベル付非テキスト系アイテム(lpnt(labeled predominantly non-textual)アイテム)のコレクションにおけるラベル付非テキスト系アイテムについてのメタデータを格納するためのデータベースシステムの作動方法であって、
前記データベースシステムの格納部が、前記コレクションの範囲内でlpntアイテムに対するそれぞれのメタデータを格納するステップであって、前記メタデータは、lpntアイテム説明及びラベルのセットから選択される少なくとも1つのlpntアイテムラベルを有し、前記ラベルのセットはクラスを規定し、asciiコードにおける前記lpntアイテムにおいて生じているテキストをエンコードするのに必要なデータの量は、前記lpntアイテムをエンコードするために使用されるデータの全体量の多くても1%である、ステップと、
前記データベースシステムのキーワード生成部が、前記クラスと関連付けられるlpntアイテムのlpntアイテム説明からそれぞれのクラスに対する用語を取り出すステップと、
前記キーワード生成部が、前記それぞれのクラスに対する前記用語の関連性を割り当てるステップと、
前記キーワード生成部が、これらの割り当てられた関連性に基づいて前記の取り出された用語から用語を選択し、これらの選択された用語を候補キーワードとして供給するステップと、
前記データベースシステムのメタデータ強化部が、供給された候補キーワードのサブセットをキーワードとしてクラスのlpntアイテムのメタデータに追加するステップとを有する、方法。 - 前記lpntアイテムは、メディア再生デバイスによる再生のための再生アイテムである、請求項10に記載の方法。
- 前記用語の関連性を割り当てるステップは、前記クラスを規定する分類に応じてそれぞれのクラスを有するlpntアイテムに対する用語の頻度を示す頻度指標を供給し、lpntアイテムのコレクションにおける前記用語の頻度を示す基準指標を供給し、前記頻度指標及び前記基準指標に従って前記用語の関連性を決定する、請求項11に記載の方法。
- 前記メタデータ強化部が、
第1のクエリ及び第2のクエリを汎用検索エンジンに発行するステップであって、前記第1のクエリは、lpntアイテムの表題及び供給された候補キーワードに基づいて実行され、前記第2のクエリは、供給された候補キーワードを特定することなく、前記lpntアイテムの表題に基づいて実行される、ステップと、
前記第1のクエリに対して推定されたヒットの数と前記第2のクエリに対して推定されたヒットの数とを用いて前記候補キーワードのlpntアイテム特有の関連性を決定するステップと、
前記候補キーワードの前記lpntアイテム特有の関連性が予め決められた値より小さい場合に、供給された候補キーワードが前記lpntアイテムの前記メタデータにキーワードとして割り当てられるのを阻止するステップとを更に有する、請求項11又は請求項12に記載の方法。 - 前記メタデータ強化部が、第3のクエリを前記汎用検索エンジンに発行するステップであって、前記第3のクエリは、前記lpntアイテムの表題を特定することなく前記候補キーワードに基づいて実行され、前記候補キーワードに対して決定された前記lpntアイテム特有の関連性は、前記第3のクエリに対して推定されたヒットの数に更に依存する、ステップを更に有する、請求項13に記載の方法。
- 前記候補キーワードから選択されるサブセットは、前記説明を格納するための入力とは別個の入力における前記メタデータに追加される、請求項11に記載の方法。
- 前記データベースシステムの通信部が、1又はそれ以上のユーザ指定されたキーワードのセットを含むユーザ検索要求を受信するステップと、
前記データベースシステムの検索部が、前記1又はそれ以上のユーザ指定されたキーワードのセットに基づいて、強化されたメタデータにおけるクエリを実行するステップとを更に有する、請求項11に記載の方法。 - ラベル付非テキスト系アイテム(lpnt(labeled predominantly non-textual)アイテム)のコレクションの範囲内でlpntアイテムに対するそれぞれのメタデータを格納するステップであって、前記メタデータは、少なくとも1つのlpntアイテムラベル及びlpntアイテム説明を有し、前記ラベルのセットはクラスを規定し、asciiコードにおける前記lpntアイテムにおいて生じているテキストをエンコードするのに必要なデータの量は、前記lpntアイテムをエンコードするために使用されるデータの全体量の多くても1%である、ステップと、
前記クラスと関連付けられるlpntアイテムのlpntアイテム説明からそれぞれのクラスに対する用語を取り出すステップと、
前記それぞれのクラスに対する取り出された用語の関連性を割り当てるステップと、
これらの割り当てられた関連性に基づいて前記取り出された用語から用語を選択し、これらの選択された用語を候補キーワードとして供給するステップと、
供給された候補キーワードのサブセットをキーワードとしてクラスのlpntアイテムのメタデータに追加するステップとを、
データ処理デバイスに実行させるための命令を有する、コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261739819P | 2012-12-20 | 2012-12-20 | |
US61/739,819 | 2012-12-20 | ||
PCT/IB2013/058974 WO2014097000A1 (en) | 2012-12-20 | 2013-09-29 | System and method for searching a labeled predominantly non-textual item |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016509703A JP2016509703A (ja) | 2016-03-31 |
JP6219967B2 true JP6219967B2 (ja) | 2017-10-25 |
Family
ID=49920363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015548797A Expired - Fee Related JP6219967B2 (ja) | 2012-12-20 | 2013-09-29 | ラベル付非テキスト系アイテムを検索するためのシステム及び方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US9940382B2 (ja) |
EP (1) | EP2936348A1 (ja) |
JP (1) | JP6219967B2 (ja) |
CN (1) | CN104854588B (ja) |
BR (1) | BR112015014319A2 (ja) |
RU (1) | RU2015129559A (ja) |
WO (1) | WO2014097000A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150317572A1 (en) * | 2014-05-05 | 2015-11-05 | Sap Ag | On-Demand Enrichment of Business Data |
US10489410B2 (en) | 2016-04-18 | 2019-11-26 | Google Llc | Mapping images to search queries |
CN109635277B (zh) * | 2018-11-13 | 2023-05-26 | 北京合享智慧科技有限公司 | 一种获取实体信息的方法及相关装置 |
CN111709229A (zh) * | 2020-06-16 | 2020-09-25 | 平安科技(深圳)有限公司 | 基于人工智能的文本生成方法、装置、计算机设备和介质 |
CN114697748A (zh) * | 2020-12-25 | 2022-07-01 | 深圳Tcl新技术有限公司 | 一种基于语音识别的视频推荐方法和计算机设备 |
CN114328389B (zh) * | 2021-12-31 | 2022-06-17 | 浙江汇鼎华链科技有限公司 | 一种云计算环境下的大数据文件分析处理系统及方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6850971B1 (en) * | 1997-02-18 | 2005-02-01 | Pioneer Electronic Corporation | System for processing information which reads address information |
JP4953496B2 (ja) * | 2000-05-15 | 2012-06-13 | ソニー株式会社 | コンテンツ検索・提示システム及び方法、並びに、ソフトウェア記憶媒体 |
JP3627715B2 (ja) | 2002-03-27 | 2005-03-09 | ソニー株式会社 | 情報処理装置および方法、記録媒体、プログラム、並びに情報処理システム |
JP4299683B2 (ja) | 2004-01-08 | 2009-07-22 | 日本電信電話株式会社 | メタデータ管理方法、メタデータ管理装置、メタデータ管理プログラム及びメタデータ管理プログラムを記録した記録媒体 |
US8098976B1 (en) | 2011-09-26 | 2012-01-17 | Limelight Networks, Inc. | Methods and systems for performing top concepts extraction |
JP2008139942A (ja) | 2006-11-30 | 2008-06-19 | Seiko Epson Corp | 情報処理装置、情報処理方法、および、プログラム |
US8108417B2 (en) * | 2007-04-04 | 2012-01-31 | Intertrust Technologies Corporation | Discovering and scoring relationships extracted from human generated lists |
JP2009163600A (ja) | 2008-01-09 | 2009-07-23 | Hitachi Ltd | メタデータ共有システム、サーバ装置、クライアント装置及びメタデータ共有方法 |
US8407216B2 (en) * | 2008-09-25 | 2013-03-26 | Yahoo! Inc. | Automated tagging of objects in databases |
NO329897B1 (no) * | 2008-12-19 | 2011-01-24 | Tandberg Telecom As | Fremgangsmate for raskere ansiktsdeteksjon |
US20100226582A1 (en) * | 2009-03-03 | 2010-09-09 | Jiebo Luo | Assigning labels to images in a collection |
ITTO20090704A1 (it) | 2009-09-16 | 2011-03-17 | Intellisemantic Srl | Sistema e metodo per la classificazione di contenuti |
WO2012010510A1 (en) * | 2010-07-21 | 2012-01-26 | Spectralmind Gmbh | Method and system to organize and visualize media items |
US8577938B2 (en) * | 2011-08-23 | 2013-11-05 | Accenture Global Services Limited | Data mapping acceleration |
-
2013
- 2013-09-29 BR BR112015014319A patent/BR112015014319A2/pt not_active IP Right Cessation
- 2013-09-29 US US14/653,277 patent/US9940382B2/en not_active Expired - Fee Related
- 2013-09-29 RU RU2015129559A patent/RU2015129559A/ru not_active Application Discontinuation
- 2013-09-29 JP JP2015548797A patent/JP6219967B2/ja not_active Expired - Fee Related
- 2013-09-29 CN CN201380067494.9A patent/CN104854588B/zh not_active Expired - Fee Related
- 2013-09-29 WO PCT/IB2013/058974 patent/WO2014097000A1/en active Application Filing
- 2013-09-29 EP EP13818375.1A patent/EP2936348A1/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
WO2014097000A1 (en) | 2014-06-26 |
EP2936348A1 (en) | 2015-10-28 |
US9940382B2 (en) | 2018-04-10 |
JP2016509703A (ja) | 2016-03-31 |
BR112015014319A2 (pt) | 2017-07-11 |
CN104854588A (zh) | 2015-08-19 |
CN104854588B (zh) | 2019-06-04 |
RU2015129559A (ru) | 2017-01-26 |
US20150324446A1 (en) | 2015-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220035827A1 (en) | Tag selection and recommendation to a user of a content hosting service | |
US7725486B2 (en) | Information retrieval apparatus | |
JP4436894B2 (ja) | コンテンツ検索装置 | |
JP6219967B2 (ja) | ラベル付非テキスト系アイテムを検索するためのシステム及び方法 | |
Skoutas et al. | Ranking and clustering web services using multicriteria dominance relationships | |
KR101994987B1 (ko) | 관련 엔티티들 | |
US9846744B2 (en) | Media discovery and playlist generation | |
US8613021B2 (en) | Providing suggestions of related videos | |
US7801887B2 (en) | Method for re-ranking documents retrieved from a document database | |
US20110270818A1 (en) | Domain expert search | |
US20100131563A1 (en) | System and methods for automatic clustering of ranked and categorized search objects | |
JP4331257B2 (ja) | 情報検索装置 | |
JP2010067175A (ja) | ハイブリッド型コンテンツ推薦サーバ、推薦システムおよび推薦方法 | |
US20100217755A1 (en) | Classifying a set of content items | |
CN101847158A (zh) | 基于上下文的视频查找器 | |
JP2011175362A (ja) | 情報処理装置、重要度算出方法及びプログラム | |
JP2003132085A5 (ja) | ||
WO2008056570A1 (fr) | Dispositif de recherche de contenu | |
JP2004145879A (ja) | 所望の特性の組合せに最も適合する材料を選択するためのシステム及び方法 | |
Garcia et al. | Access-ordered indexes | |
US8005827B2 (en) | System and method for accessing preferred provider of audio content | |
CN106294784B (zh) | 资源搜索方法及装置 | |
JP2002032394A (ja) | 関連語情報作成装置、関連語提示装置、文書検索装置、関連語情報作成方法、関連語提示方法、文書検索方法および記憶媒体 | |
JPH09319752A (ja) | 検索支援装置 | |
Iijima et al. | Implementing an image search system with integrating social tags and DBpedia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160916 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20170214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170615 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170912 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170928 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6219967 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |