ES2524789T3 - Aprendizaje de imagen, anotación automática, método de recuperación y dispositivo - Google Patents
Aprendizaje de imagen, anotación automática, método de recuperación y dispositivo Download PDFInfo
- Publication number
- ES2524789T3 ES2524789T3 ES09251342.3T ES09251342T ES2524789T3 ES 2524789 T3 ES2524789 T3 ES 2524789T3 ES 09251342 T ES09251342 T ES 09251342T ES 2524789 T3 ES2524789 T3 ES 2524789T3
- Authority
- ES
- Spain
- Prior art keywords
- image
- links
- annotations
- regions
- annotation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/587—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
Abstract
Un método de anotación automática de imagen para hacer una anotación en una segunda imagen de entrada, comprendiendo el método de anotación automática de imagen una etapa de aprendizaje, una etapa de procesamiento preliminar, una etapa de actualización de gráfico y una etapa de anotación; en el que la etapa de aprendizaje incluye: realizar una operación de segmentación en una primera imagen que tiene anotaciones para segmentar la primera imagen en una o más primeras regiones de imagen; extraer primeros vectores característicos de imagen a partir de todas las primeras regiones de imagen para obtener una primera matriz característica de imagen; establecer primeros enlaces entre las primeras regiones de imagen; establecer segundos enlaces entre la primera imagen y las primeras regiones de imagen basándose en un resultado de la operación de segmentación; establecer terceros enlaces entre la primera imagen y las anotaciones basándose en la primera imagen que tiene las anotaciones; calcular pesos de todos los enlaces; y obtener un gráfico que muestra una realización triangular entre la primera imagen, las primeras regiones de imagen y las anotaciones basándose en todos los enlaces y los pesos de los enlaces que corresponden a los enlaces; en el que la etapa de procesamiento preliminar incluye: recibir la segunda imagen; realizar la operación de segmentación en la segunda imagen para segmentar la segunda imagen en una o más segundas regiones de imagen; y extraer segundos vectores característicos de imagen a partir de todas las segundas regiones de imagen para obtener una segunda matriz característica de imagen de la segunda imagen; en el que la etapa de actualización de gráfico incluye: establecer quintos enlaces entre los segundos nodos de región de imagen de la segunda imagen y los primeros nodos de región de imagen en el gráfico; establecer sextos enlaces entre la segunda imagen y los segundos nodos de región de imagen basándose en un resultado de la operación de segmentación; determinar pesos de los enlaces de los quintos enlaces y los sextos enlaces; y actualizar el gráfico basándose en los quintos enlaces y los sextos enlaces y los pesos de los enlaces que corresponden a los quintos enlaces y a los sextos enlaces, y en el que la etapa de anotación incluye: generar un vector de reinicio que corresponde a la segunda imagen; obtener un número predeterminado de anotaciones más estrechamente relacionadas con la segunda imagen con un recorrido aleatorio con reinicio; y hacer las anotaciones en la segunda imagen usando palabras clave que corresponden al número predeterminado de anotaciones.
Description
Claims (1)
-
imagen1 imagen2 imagen3
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101007214A CN101587478B (zh) | 2008-05-20 | 2008-05-20 | 图像训练、自动标注、检索方法及装置 |
CN200810100721 | 2008-05-20 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2524789T3 true ES2524789T3 (es) | 2014-12-12 |
Family
ID=41051102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES09251342.3T Active ES2524789T3 (es) | 2008-05-20 | 2009-05-20 | Aprendizaje de imagen, anotación automática, método de recuperación y dispositivo |
Country Status (5)
Country | Link |
---|---|
US (1) | US8232996B2 (es) |
EP (1) | EP2124159B8 (es) |
JP (1) | JP5282658B2 (es) |
CN (1) | CN101587478B (es) |
ES (1) | ES2524789T3 (es) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8429176B2 (en) * | 2008-03-28 | 2013-04-23 | Yahoo! Inc. | Extending media annotations using collective knowledge |
US8463053B1 (en) | 2008-08-08 | 2013-06-11 | The Research Foundation Of State University Of New York | Enhanced max margin learning on multimodal data mining in a multimedia database |
WO2011094757A1 (en) * | 2010-02-01 | 2011-08-04 | Google Inc. | Joint embedding for item association |
US9792368B1 (en) * | 2010-03-04 | 2017-10-17 | A9.Com, Inc. | Dynamic map synchronization |
CN102193946A (zh) * | 2010-03-18 | 2011-09-21 | 株式会社理光 | 为媒体文件添加标签方法和使用该方法的系统 |
CN102298606B (zh) * | 2011-06-01 | 2013-07-17 | 清华大学 | 基于标签图模型随机游走的图像自动标注方法及装置 |
US8625887B2 (en) | 2011-07-13 | 2014-01-07 | Google Inc. | Systems and methods for matching visual object components |
CN102495865B (zh) * | 2011-11-28 | 2013-08-07 | 南京大学 | 结合图像内部空间关系及视觉共生关系的图像标注方法 |
US9239848B2 (en) * | 2012-02-06 | 2016-01-19 | Microsoft Technology Licensing, Llc | System and method for semantically annotating images |
JP2014026455A (ja) * | 2012-07-26 | 2014-02-06 | Nippon Telegr & Teleph Corp <Ntt> | メディアデータ解析装置、方法、及びプログラム |
US8935246B2 (en) * | 2012-08-08 | 2015-01-13 | Google Inc. | Identifying textual terms in response to a visual query |
CN103853797B (zh) * | 2012-12-07 | 2017-10-17 | 中兴通讯股份有限公司 | 一种基于n元图片索引结构的图片检索方法与系统 |
CN103345481B (zh) * | 2013-06-19 | 2016-08-24 | 新疆大学 | 一种维吾尔文图像文件的标注方法 |
US9754177B2 (en) * | 2013-06-21 | 2017-09-05 | Microsoft Technology Licensing, Llc | Identifying objects within an image |
US10319035B2 (en) | 2013-10-11 | 2019-06-11 | Ccc Information Services | Image capturing and automatic labeling system |
CN103714178B (zh) * | 2014-01-08 | 2017-01-25 | 北京京东尚科信息技术有限公司 | 一种基于词间相关性的图像自动标注方法 |
JP6796060B2 (ja) * | 2014-09-10 | 2020-12-02 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 画像レポート注釈同定 |
US10223728B2 (en) * | 2014-12-09 | 2019-03-05 | Google Llc | Systems and methods of providing recommendations by generating transition probability data with directed consumption |
JP6607263B2 (ja) * | 2016-02-15 | 2019-11-20 | 富士通株式会社 | 情報処理装置、情報処理方法、および情報処理プログラム |
CN107391505B (zh) * | 2016-05-16 | 2020-10-23 | 腾讯科技(深圳)有限公司 | 一种图像处理方法及系统 |
US11195313B2 (en) * | 2016-10-14 | 2021-12-07 | International Business Machines Corporation | Cross-modality neural network transform for semi-automatic medical image annotation |
CN108268510B (zh) * | 2016-12-30 | 2022-01-28 | 华为技术有限公司 | 一种图像标注方法和装置 |
CN107480711B (zh) * | 2017-08-04 | 2020-09-01 | 合肥美的智能科技有限公司 | 图像识别方法、装置、计算机设备和可读存储介质 |
CN109492549A (zh) * | 2018-10-24 | 2019-03-19 | 杭州睿琪软件有限公司 | 一种训练样本集处理、模型训练方法及系统 |
CN109933790B (zh) * | 2019-03-01 | 2020-06-26 | 武汉达梦数据库有限公司 | 一种文本特征提取方法及系统 |
CN111080614A (zh) * | 2019-12-12 | 2020-04-28 | 哈尔滨市科佳通用机电股份有限公司 | 铁路货车轮轮辋及踏面的破损识别方法 |
WO2023101679A1 (en) * | 2021-12-02 | 2023-06-08 | Innopeak Technology, Inc. | Text-image cross-modal retrieval based on virtual word expansion |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101061509B (zh) * | 2004-11-19 | 2010-10-27 | 皇家飞利浦电子股份有限公司 | 用于医疗成像数据内的肿瘤边界的自动检测和分割的系统和方法 |
CN101061490A (zh) * | 2004-11-19 | 2007-10-24 | 皇家飞利浦电子股份有限公司 | 利用支持向量机(svm)在计算机辅助检测(cad)中进行假阳性降低的系统和方法 |
US7698332B2 (en) * | 2006-03-13 | 2010-04-13 | Microsoft Corporation | Projecting queries and images into a similarity space |
-
2008
- 2008-05-20 CN CN2008101007214A patent/CN101587478B/zh not_active Expired - Fee Related
-
2009
- 2009-05-19 US US12/468,423 patent/US8232996B2/en not_active Expired - Fee Related
- 2009-05-19 JP JP2009121359A patent/JP5282658B2/ja not_active Expired - Fee Related
- 2009-05-20 ES ES09251342.3T patent/ES2524789T3/es active Active
- 2009-05-20 EP EP09251342.3A patent/EP2124159B8/en not_active Not-in-force
Also Published As
Publication number | Publication date |
---|---|
EP2124159A1 (en) | 2009-11-25 |
EP2124159B1 (en) | 2014-09-03 |
JP5282658B2 (ja) | 2013-09-04 |
US8232996B2 (en) | 2012-07-31 |
CN101587478A (zh) | 2009-11-25 |
JP2009282980A (ja) | 2009-12-03 |
US20090289942A1 (en) | 2009-11-26 |
CN101587478B (zh) | 2013-07-24 |
EP2124159B8 (en) | 2014-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2524789T3 (es) | Aprendizaje de imagen, anotación automática, método de recuperación y dispositivo | |
EA201891827A1 (ru) | Реестр и способ автоматизированного администрирования смарт-контрактов, использующих блокчейн | |
AR116476A1 (es) | Método y sistema para ejecutar algoritmos de aprendizaje automático | |
CO2017009675A2 (es) | Derivación del vector de movimiento en la codificación de video | |
CO2017007032A2 (es) | Actualización de modelos de clasificador de entendimiento de lenguaje para un asistente digital personal basándose en externalización masiva | |
GB2559055A (en) | Identifying errors in medical data | |
CL2017002847A1 (es) | Sistema y método para extraer y compartir datos de usuario relacionados con la aplicación. | |
BR112016014223A2 (pt) | Sistemas, métodos e aparelho para recuperação de imagem | |
US10580182B2 (en) | Facial feature adding method, facial feature adding apparatus, and facial feature adding device | |
JP2014096164A5 (es) | ||
GB2429554A (en) | Method and apparatus to vectorize multiple input instructions | |
US20180137343A1 (en) | Facial image generating method, facial image generating apparatus, and facial image generating device | |
CN105094836B (zh) | 一种生成说明文档的方法和装置 | |
JP2009514036A5 (es) | ||
JP2016535335A5 (es) | ||
WO2009035108A1 (ja) | 対応関係学習装置および方法ならびに対応関係学習用プログラム、アノテーション装置および方法ならびにアノテーション用プログラム、および、リトリーバル装置および方法ならびにリトリーバル用プログラム | |
EP2581893A3 (en) | Methods and systems for integrating runway status and layout | |
CN105095160A (zh) | 一种文档转换阅读方法与系统 | |
CN110516233B (zh) | 数据处理的方法、装置、终端设备以及存储介质 | |
AR103955A1 (es) | Dispositivo de detección de objetos, método de detección de objetos y medio de registro | |
GB2552598A (en) | Images for query answers | |
EP2819026A3 (en) | Method and apparatus for generating a journal | |
Vilariño et al. | Lexical-syntactic and graph-based features for authorship verification | |
CN110457224B (zh) | 生成测试数据的方法及装置 | |
AR107826A1 (es) | Sistema de modelado |