JP2020149686A - 画像処理方法、装置、サーバ及び記憶媒体 - Google Patents
画像処理方法、装置、サーバ及び記憶媒体 Download PDFInfo
- Publication number
- JP2020149686A JP2020149686A JP2020042089A JP2020042089A JP2020149686A JP 2020149686 A JP2020149686 A JP 2020149686A JP 2020042089 A JP2020042089 A JP 2020042089A JP 2020042089 A JP2020042089 A JP 2020042089A JP 2020149686 A JP2020149686 A JP 2020149686A
- Authority
- JP
- Japan
- Prior art keywords
- image
- entity
- processed
- processing target
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/74—Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
図1は、本願の実施例1の画像処理方法のフローチャートである。本実施例が提供する画像処理方法は、画像に対して深層を理解して画像ラベルを決定する場合に適用される。該方法は画像処理装置で実行でき、該装置はソフトウェア及び/またはハードウェアの方式で実現でき、またサーバに集合することができる。図1を参照して、本実施態様の方法には、S110〜S120を含んでいる。
S110では、処理対象画像に含まれる物体のタイプに基づいて、処理対象画像における物体の特徴表現を決定する。
図2は、本願の実施例2の画像処理方法のフローチャートである。本実施例では、前記実施例に基づいて最適化し、本実施例において詳細に説明していない内容は上述の実施例を参照する。図2を参照して、本実施例が提供する画像処理方法は、S210〜S270を含んでいる。
図4は、本願の実施例3の画像処理装置の構造概略図である。この装置は、画像を深層理解し、さらに画像ラベルを決定する場合に適用される。この装置は、ソフトウェア及び/またはハードウェアの方式で実現でき、またサーバに集合することができる。図4を参照して、この装置は、処理対象画像に含まれた物体のタイプに基づいて、処理対象画像における物体の特徴表現を決定するための特徴表現決定モジュール310と、処理対象画像における物体の特徴表現と知識グラフにおけるエンティティの特徴表現とに基づいて処理を行い、処理対象画像における物体に関連付けられたエンティティを決定するための関連エンティティ決定モジュール320と、を含む。
図5は、本願の実施例4のサーバの構造概略図である。図5は本発明の実施態様を実現する例示的なサーバ412のブロック図を示す。図5に示すサーバ412は一の例に過ぎず、本発明の実施例の機能と使用範囲を制限するものではない。
本発明実施例5は、コンピュータの実行可能な指令を含む記憶媒体を提供する。前記コンピュータ実行可能な指令は、コンピュータプロセッサによって実行される場合に、画像処理方法を実行する。
Claims (10)
- 処理対象画像に含まれる物体のタイプにより、処理対象画像における物体の特徴表現を決定するステップと、
処理対象画像における物体の特徴表現と知識グラフにおけるエンティティの特徴表現とに基づいて処理を行い、処理対象画像における物体に関連付けられたエンティティを決定するステップと、を含むことを特徴とする、画像処理方法。 - 処理対象画像に含まれる物体のタイプにより、処理対象画像における物体の特徴表現を決定するステップは、
処理対象画像に含まれる物体のタイプと物体の画像領域とに基づいて、処理対象画像における物体の特徴表現を決定するステップを含むことを特徴とする、請求項1に記載の方法。 - 処理対象画像における物体の特徴表現と知識グラフにおけるエンティティの特徴表現とに基づいて処理を行い、処理対象画像における物体に関連付けられたエンティティを決定するステップは、
処理対象画像における物体の特徴表現、処理対象画像の特徴表現、処理対象画像に関連付けられたテキスト特徴表現、及び知識グラフにおけるエンティティの特徴表現とエンティティ属性情報に基づいて、処理対象画像における物体に関連付けられたエンティティを決定するステップを含むことを特徴とする、請求項1に記載の方法。 - 処理対象画像における物体の特徴表現と知識グラフにおけるエンティティの特徴表現とに基づいて処理を行い、処理対象画像における物体に関連付けられたエンティティを決定した後、
処理対象画像が属する文章に含まれたエンティティに基づいて、文章の特徴表現を決定するステップと、
前記文章の特徴表現と処理対象画像における物体に関連付けられたエンティティとに基づいて、画像と文章との関連度を決定するステップと、をさらに含むことを特徴とする、請求項1に記載の方法。 - 処理対象画像における物体に関連付けられたエンティティを決定した後、
第1のリコール方式をエンティティのリコール方式として決定するステップと、
少なくとも1つの補助リコール方式により、処理対象画像における物体に関連付けられたエンティティを決定するステップと、
各エンティティのリコール方式とリコール頻度とに基づいて、処理対象画像における物体に関連付けられたエンティティを再決定するステップと、をさらに含むことを特徴とする、請求項1から4のいずれかに記載の方法。 - 少なくとも1つの補助リコール方式により、処理対象画像における物体に関連付けられたエンティティを決定するステップは、
処理対象画像と候補エンティティの画像とをマッチングさせ、処理対象画像に関連付けられたエンティティを決定するステップ、及び/または、
処理対象画像が属するテキストと知識グラフとをマッチングさせ、処理対象画像に関連付けられたエンティティを決定するステップと、を含むことを特徴とする、請求項5に記載の方法。 - 処理対象画像における物体に関連付けられたエンティティを決定した後、
知識グラフから、物体に関連付けられたエンティティとエッジ関係を持つ新たなエンティティを引き出すステップと、
引き出された新たなエンティティ間の相互関係に基づいて、新たなエンティティから画像に関連付けられた新たなエンティティを選択するステップと、をさらに含むことを特徴とする、請求項6に記載の装置。 - 処理対象画像における物体のタイプに基づいて、処理対象画像における物体の特徴表現を決定するための特徴表現決定モジュールと、
処理対象画像における物体特定表示と知識グラフにおけるエンティティの特徴表現とに基づいて処理を行い、処理対象画像における物体に関連付けられたエンティティを決定するための関連エンティティ決定モジュールと、を含むことを特徴とする、画像処理装置。 - 一つまたは複数のプロセッサと、
一つまたは複数のプログラムを記憶するためのメモリと、を含み、
前記一つまたは複数のプログラムが前記一つまたは複数のプロセッサにより実行される場合に、前記一つまたは複数のプロセッサが請求項1から7のいずれかに記載の画像処理方法を実現することを特徴とする、サーバ。 - コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、
前記プログラムがプロセッサにより実行される場合に、請求項1から7のいずれかに記載の画像処理方法が実現されることを特徴とする、コンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910184113.4 | 2019-03-12 | ||
CN201910184113.4A CN109918513B (zh) | 2019-03-12 | 2019-03-12 | 图像处理方法、装置、服务器及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020149686A true JP2020149686A (ja) | 2020-09-17 |
JP7132962B2 JP7132962B2 (ja) | 2022-09-07 |
Family
ID=66964354
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020042089A Active JP7132962B2 (ja) | 2019-03-12 | 2020-03-11 | 画像処理方法、装置、サーバ及び記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11475588B2 (ja) |
EP (1) | EP3709212A1 (ja) |
JP (1) | JP7132962B2 (ja) |
KR (1) | KR102459123B1 (ja) |
CN (1) | CN109918513B (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110704650B (zh) * | 2019-09-29 | 2023-04-25 | 携程计算机技术(上海)有限公司 | Ota图片标签的识别方法、电子设备和介质 |
US11127135B1 (en) * | 2020-03-23 | 2021-09-21 | Caterpillar Paving Products Inc. | System and method for correcting paving mat defects |
WO2021237731A1 (zh) * | 2020-05-29 | 2021-12-02 | 西门子股份公司 | 一种目标检测方法、装置和计算机可读介质 |
CN111949814A (zh) * | 2020-06-24 | 2020-11-17 | 百度在线网络技术(北京)有限公司 | 搜索方法、装置、电子设备和存储介质 |
CN111930964B (zh) * | 2020-09-17 | 2021-02-12 | 腾讯科技(深圳)有限公司 | 内容处理方法、装置、设备及存储介质 |
US20220147843A1 (en) * | 2020-11-12 | 2022-05-12 | Samsung Electronics Co., Ltd. | On-device knowledge extraction from visually rich documents |
CN112883735B (zh) * | 2021-02-10 | 2024-01-12 | 卡奥斯数字科技(上海)有限公司 | 一种表单图像的结构化处理方法、装置、设备及存储介质 |
CN113486195A (zh) * | 2021-08-17 | 2021-10-08 | 深圳华声医疗技术股份有限公司 | 超声图像处理方法、装置、超声设备及存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106331466B (zh) | 2015-06-30 | 2019-06-07 | 芋头科技(杭州)有限公司 | 一种通过语音指令快速定位拍照的方法及拍照系统 |
US20170076222A1 (en) * | 2015-09-14 | 2017-03-16 | International Business Machines Corporation | System and method to cognitively process and answer questions regarding content in images |
US20170185670A1 (en) * | 2015-12-28 | 2017-06-29 | Google Inc. | Generating labels for images associated with a user |
CN107169535B (zh) * | 2017-07-06 | 2023-11-03 | 谈宜勇 | 生物多光谱图像的深度学习分类方法及装置 |
CN107833082B (zh) * | 2017-09-15 | 2022-04-12 | 唯品会(海南)电子商务有限公司 | 一种商品图片的推荐方法和装置 |
CN108256307B (zh) * | 2018-01-12 | 2021-04-02 | 重庆邮电大学 | 一种智能商务旅居房车的混合增强智能认知方法 |
US10157226B1 (en) * | 2018-01-16 | 2018-12-18 | Accenture Global Solutions Limited | Predicting links in knowledge graphs using ontological knowledge |
CN108171213A (zh) * | 2018-01-22 | 2018-06-15 | 北京邮电大学 | 一种适用图文知识图谱的关系抽取方法 |
CN109271542A (zh) * | 2018-09-28 | 2019-01-25 | 百度在线网络技术(北京)有限公司 | 封面确定方法、装置、设备及可读存储介质 |
US10949718B2 (en) * | 2019-05-08 | 2021-03-16 | Accenture Global Solutions Limited | Multi-modal visual question answering system |
-
2019
- 2019-03-12 CN CN201910184113.4A patent/CN109918513B/zh active Active
-
2020
- 2020-01-08 KR KR1020200002708A patent/KR102459123B1/ko active IP Right Grant
- 2020-01-09 EP EP20150891.8A patent/EP3709212A1/en not_active Withdrawn
- 2020-01-23 US US16/751,011 patent/US11475588B2/en active Active
- 2020-03-11 JP JP2020042089A patent/JP7132962B2/ja active Active
Non-Patent Citations (2)
Title |
---|
FANG YUAN, ZHE WANG, JIE LIN, LUIS FERNANDO D’HARO, KIM JUNG JAE, ZENG ZENG, VIJAY CHANDRASEKHAR: "End-to-End Video Classification with Knowledge Graphs", ARXIVLABS [ONLINE], vol. arXiv:1711.01714v1, JPN6021051117, 6 November 2017 (2017-11-06), US, ISSN: 0004671452 * |
S ADITYA, Y YANG, C BARAL, Y ALOIMONOS, C FERMULLER: "Image understanding using vision and reasoning through scene description graph", COMPUTER VISION AND IMAGE UNDERSTANDING, vol. 173, JPN6021018031, 2017, US, pages 33 - 45, ISSN: 0004671453 * |
Also Published As
Publication number | Publication date |
---|---|
KR102459123B1 (ko) | 2022-10-26 |
CN109918513B (zh) | 2023-04-28 |
JP7132962B2 (ja) | 2022-09-07 |
KR20200109239A (ko) | 2020-09-22 |
US20200294267A1 (en) | 2020-09-17 |
CN109918513A (zh) | 2019-06-21 |
EP3709212A1 (en) | 2020-09-16 |
US11475588B2 (en) | 2022-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2020149686A (ja) | 画像処理方法、装置、サーバ及び記憶媒体 | |
US10977486B2 (en) | Blockwise extraction of document metadata | |
US20190197119A1 (en) | Language-agnostic understanding | |
CN111666766B (zh) | 数据处理方法、装置和设备 | |
US20150339616A1 (en) | System for real-time suggestion of a subject matter expert in an authoring environment | |
US11436446B2 (en) | Image analysis enhanced related item decision | |
CN107861948B (zh) | 一种标签提取方法、装置、设备和介质 | |
CN112703495A (zh) | 利用实体链接和本体数据推断主题 | |
US11423219B2 (en) | Generation and population of new application document utilizing historical application documents | |
US20150339310A1 (en) | System for recommending related-content analysis in an authoring environment | |
CN110532449B (zh) | 一种业务文档的处理方法、装置、设备和存储介质 | |
CN111738009B (zh) | 实体词标签生成方法、装置、计算机设备和可读存储介质 | |
US10229156B2 (en) | Using priority scores for iterative precision reduction in structured lookups for questions | |
CN117011581A (zh) | 图像识别方法、介质、装置和计算设备 | |
CN116030375A (zh) | 视频特征提取、模型训练方法、装置、设备及存储介质 | |
US20210342642A1 (en) | Machine learning training dataset optimization | |
CN111723177B (zh) | 信息提取模型的建模方法、装置及电子设备 | |
CN111552780B (zh) | 医用场景的搜索处理方法、装置、存储介质及电子设备 | |
CN108092875B (zh) | 一种表情提供方法、介质、装置和计算设备 | |
US20180307669A1 (en) | Information processing apparatus | |
CN115392389B (zh) | 跨模态信息匹配、处理方法、装置、电子设备及存储介质 | |
US20220156529A1 (en) | Anomaly detection by ranking from algorithm | |
US20240111951A1 (en) | Generating a personal corpus | |
US20240152494A1 (en) | Optimizing metadata enrichment of data assets | |
US11688193B2 (en) | Interactive structure annotation with artificial intelligence |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200311 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210525 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220323 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220823 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220826 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7132962 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |