JP7669162B2 - 画像内の文字色と背景色を抽出して提供する方法、システム、およびコンピュータプログラム - Google Patents
画像内の文字色と背景色を抽出して提供する方法、システム、およびコンピュータプログラム Download PDFInfo
- Publication number
- JP7669162B2 JP7669162B2 JP2021040014A JP2021040014A JP7669162B2 JP 7669162 B2 JP7669162 B2 JP 7669162B2 JP 2021040014 A JP2021040014 A JP 2021040014A JP 2021040014 A JP2021040014 A JP 2021040014A JP 7669162 B2 JP7669162 B2 JP 7669162B2
- Authority
- JP
- Japan
- Prior art keywords
- color
- character
- region
- background
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G06T11/10—
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Machine Translation (AREA)
- Controls And Circuits For Display Device (AREA)
- Character Input (AREA)
- User Interface Of Digital Computer (AREA)
Description
310:文字検出部
320:色抽出部
330:翻訳結果提供部
Claims (20)
- コンピュータシステムが実行する方法であって、
前記コンピュータシステムは、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、
前記方法は、
前記少なくとも1つのプロセッサが、与えられた画像内で文字が含まれた第1領域を検出する段階、
前記少なくとも1つのプロセッサが、前記第1領域で前記文字を代表する文字代表色と前記第1領域の背景を代表する背景代表色を抽出する段階、および
前記少なくとも1つのプロセッサが、前記文字に対する翻訳結果が含まれた第2領域を前記画像の上にオーバーレイさせるが、このとき、前記第2領域の文字色と背景色として前記文字代表色と前記背景代表色を適用する段階
を含み、
前記抽出する段階は、
前記第1領域の各ピクセルに対するヒストグラムを抽出する段階、
前記第1領域の色分布に基づき文字基本色を抽出する段階、および
前記第1領域の各ピクセルに対する前記ヒストグラムと前記文字基本色との距離値に基づき前記文字代表色を選定する段階、
を含む、方法。 - 前記検出する段階は、
OCRを利用して前記第1領域を検出する、請求項1に記載の方法。 - 前記第1領域で前記文字を代表する前記文字代表色と前記第1領域の背景を代表する前記背景代表色を抽出する段階は、
前記第1領域の前記色分布に基づき背景基本色を抽出する段階、および
前記第1領域の各ピクセルに対する前記ヒストグラムと前記背景基本色との距離値に基づき前記背景代表色を選定する段階
を含む、請求項1に記載の方法。 - 前記第1領域で前記文字を代表する前記文字代表色と前記第1領域の背景を代表する前記背景代表色を抽出する段階は、
画像透視変換アルゴリズムを利用して前記第1領域を一定の形態に変換する段階
をさらに含む、請求項1に記載の方法。 - 前記第1領域で前記文字を代表する前記文字代表色と前記第1領域の背景を代表する前記背景代表色を抽出する段階は、
前記ヒストグラムを大きさ順に整列する段階
をさらに含む、請求項1に記載の方法。 - 前記ヒストグラムを抽出する段階は、
前記第1領域の各ピクセルに対して色成分の組み合わせによる3Dヒストグラムを抽出する段階
を含む、請求項1に記載の方法。 - 前記ヒストグラムを抽出する段階は、
前記第1領域のすべてのピクセル値を特定の倍数に量子化する段階
を含む、請求項1に記載の方法。 - 前記文字基本色を抽出する段階と前記背景基本色を抽出する段階は、
K-平均アルゴリズムを利用して前記第1領域の前記色分布を2つの色にクラスタリングする段階、
前記第1領域のフレーム領域を対象に前記2つの色の色ごとにピクセルの数を合算する段階、および
前記2つの色のうちでピクセルの数が多い色を前記背景基本色として選定し、残りの色を前記文字基本色として選定する段階
を含む、請求項3に記載の方法。 - 前記文字代表色を選定する段階と前記背景代表色を選定する段階は、
前記文字基本色との距離値が閾値以下のピクセルの色を前記文字代表色として選定する段階、および
前記背景基本色との距離値が前記閾値以下のピクセルの色を前記背景代表色として選定する段階
を含む、請求項3に記載の方法。 - 前記文字代表色を選定する段階と前記背景代表色を選定する段階は、
前記閾値以下のピクセルが存在しない場合、前記閾値を増加させる段階
を含む、請求項9に記載の方法。 - 前記方法は、
前記少なくとも1つのプロセッサが、画像オブジェクトの代表色を抽出し、前記画像オブジェクトと関連するUIを構成する色として適用する段階
をさらに含む、請求項1に記載の方法。 - 前記方法は、
前記少なくとも1つのプロセッサが、アイコンの代表色を抽出し、背景テーマ色として適用する段階
をさらに含む、請求項1に記載の方法。 - 前記方法は、
前記少なくとも1つのプロセッサが、動画に対して以前フレームと現在フレームそれぞれから代表色を抽出し、前記以前フレームの代表色と前記現在フレームの代表色との差によって場面の変わり目を感知する段階
をさらに含む、請求項1に記載の方法。 - 請求項1~13のうちのいずれか一項に記載の方法を前記コンピュータシステムに実行させる、コンピュータプログラム。
- コンピュータシステムであって、
メモリに含まれるコンピュータ読み取り可能な命令を実行するように実現される少なくとも1つのプロセッサ
を含み、
前記少なくとも1つのプロセッサは、
与えられた画像内で文字が含まれた第1領域を検出する文字検出部、
前記第1領域で前記文字を代表する文字代表色と前記第1領域の背景を代表する背景代表色を抽出する色抽出部、および
前記文字に対する翻訳結果が含まれた第2領域を前記画像の上にオーバーレイさせるが、このとき、前記第2領域の文字色と背景色として前記文字代表色と前記背景代表色を適用して提供する翻訳結果提供部
を含み、
前記色抽出部は、
前記第1領域の各ピクセルに対するヒストグラムを抽出し、
前記第1領域の色分布に基づき文字基本色を抽出し、
前記第1領域の各ピクセルに対する前記ヒストグラムと前記文字基本色との距離値に基づき前記文字代表色を選定する、
コンピュータシステム。 - 前記色抽出部は、
前記第1領域の前記色分布に基づき背景基本色を抽出し、
前記第1領域の各ピクセルに対する前記ヒストグラムと前記背景基本色との距離値に基づき前記背景代表色を選定する
請求項15に記載のコンピュータシステム。 - 前記色抽出部は、
前記第1領域の各ピクセルに対して色成分の組み合わせによる3Dヒストグラムを抽出する
請求項15に記載のコンピュータシステム。 - 前記色抽出部は、
前記第1領域のすべてのピクセル値を特定の倍数に量子化する
請求項15に記載のコンピュータシステム。 - 前記色抽出部は、
K-平均アルゴリズムを利用して前記第1領域の色分布を2つの色にクラスタリングし、
前記第1領域のフレーム領域を対象に前記2つの色の色ごとにピクセルの数を合算し、
前記2つの色のうちでピクセルの数が多い色を前記背景基本色として選定し、残りの色を前記文字基本色として選定する
請求項16に記載のコンピュータシステム。 - 前記色抽出部は、
前記文字基本色との距離値が閾値以下のピクセルの色を前記文字代表色として選定し、
前記背景基本色との距離値が前記閾値以下のピクセルの色を前記背景代表色として選定する
請求項16に記載のコンピュータシステム。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020200038295A KR102422221B1 (ko) | 2020-03-30 | 2020-03-30 | 이미지 내 텍스트 색상과 배경 색상을 추출하여 제공하는 방법, 시스템, 및 컴퓨터 프로그램 |
| KR10-2020-0038295 | 2020-03-30 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021163482A JP2021163482A (ja) | 2021-10-11 |
| JP7669162B2 true JP7669162B2 (ja) | 2025-04-28 |
Family
ID=77854628
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021040014A Active JP7669162B2 (ja) | 2020-03-30 | 2021-03-12 | 画像内の文字色と背景色を抽出して提供する方法、システム、およびコンピュータプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US11568631B2 (ja) |
| JP (1) | JP7669162B2 (ja) |
| KR (1) | KR102422221B1 (ja) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN115543495A (zh) * | 2021-06-30 | 2022-12-30 | 腾讯科技(深圳)有限公司 | 界面管理方法、装置、设备及可读存储介质 |
| CN114519754B (zh) * | 2022-02-16 | 2025-01-03 | 中国平安人寿保险股份有限公司 | 画报生成方法、装置、设备及存储介质 |
| CN114817630B (zh) * | 2022-03-29 | 2025-06-10 | 北京字跳网络技术有限公司 | 卡片的显示方法、装置、电子设备、存储介质和程序产品 |
| CN114998903A (zh) * | 2022-05-24 | 2022-09-02 | 北京百度网讯科技有限公司 | 文本遮挡区域检测方法、装置、电子设备及存储介质 |
| CN114862720A (zh) * | 2022-05-25 | 2022-08-05 | 南京数睿数据科技有限公司 | 画布还原方法、装置、电子设备和计算机可读介质 |
| JP2024029617A (ja) * | 2022-08-22 | 2024-03-06 | キヤノン株式会社 | 画像処理装置、画像処理装置の制御方法、及びプログラム |
| US20240257397A1 (en) * | 2023-01-27 | 2024-08-01 | Target Brands, Inc. | Method for improving aesthetic appearance of retailer graphical user interface |
| KR102640350B1 (ko) * | 2023-09-26 | 2024-02-28 | 주식회사 아이스크림아트 | 색채분석모듈을 이용한 사용자의 정서 분석 방법 |
| US12443791B2 (en) * | 2023-10-03 | 2025-10-14 | Open Text Holdings, Inc. | Visual analysis for document import |
| KR20250077725A (ko) | 2023-11-24 | 2025-06-02 | 박기범 | 개인 맞춤형 스마트폰 어플 분류 시스템 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008065803A (ja) | 2006-08-08 | 2008-03-21 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
| JP2012018490A (ja) | 2010-07-06 | 2012-01-26 | Canon Inc | 画像処理方法、画像処理装置、およびプログラム |
| JP2012173785A (ja) | 2011-02-17 | 2012-09-10 | Nec Corp | 翻訳結果表示方法、翻訳結果表示システム、翻訳結果生成装置および翻訳結果表示プログラム |
| JP2015069234A (ja) | 2013-09-26 | 2015-04-13 | シャープ株式会社 | 表示処理装置、並びにその制御方法および制御プログラム |
| US20180018795A1 (en) | 2015-11-18 | 2018-01-18 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for processing tab in graphical interface |
| US20190266432A1 (en) | 2018-02-23 | 2019-08-29 | Samsung Electronics Co., Ltd. | Method for providing text translation managing data related to application, and electronic device thereof |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6014183A (en) * | 1997-08-06 | 2000-01-11 | Imagine Products, Inc. | Method and apparatus for detecting scene changes in a digital video stream |
| JP4735148B2 (ja) * | 2005-09-14 | 2011-07-27 | 富士ゼロックス株式会社 | 表示装置及び翻訳結果表示方法 |
| KR101793653B1 (ko) * | 2016-06-20 | 2017-11-03 | (주)핑거플러스 | 영상 컨텐츠의 화면전환 인식 방법 및 이를 운용하는 서버 |
| KR102171327B1 (ko) | 2018-07-18 | 2020-10-29 | 네이버 주식회사 | 번역 서비스 제공 방법 및 이를 이용하는 단말장치 |
-
2020
- 2020-03-30 KR KR1020200038295A patent/KR102422221B1/ko active Active
-
2021
- 2021-03-12 JP JP2021040014A patent/JP7669162B2/ja active Active
- 2021-03-17 US US17/204,472 patent/US11568631B2/en active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008065803A (ja) | 2006-08-08 | 2008-03-21 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
| JP2012018490A (ja) | 2010-07-06 | 2012-01-26 | Canon Inc | 画像処理方法、画像処理装置、およびプログラム |
| JP2012173785A (ja) | 2011-02-17 | 2012-09-10 | Nec Corp | 翻訳結果表示方法、翻訳結果表示システム、翻訳結果生成装置および翻訳結果表示プログラム |
| JP2015069234A (ja) | 2013-09-26 | 2015-04-13 | シャープ株式会社 | 表示処理装置、並びにその制御方法および制御プログラム |
| US20180018795A1 (en) | 2015-11-18 | 2018-01-18 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for processing tab in graphical interface |
| US20190266432A1 (en) | 2018-02-23 | 2019-08-29 | Samsung Electronics Co., Ltd. | Method for providing text translation managing data related to application, and electronic device thereof |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2021163482A (ja) | 2021-10-11 |
| KR20210121515A (ko) | 2021-10-08 |
| US11568631B2 (en) | 2023-01-31 |
| US20210303905A1 (en) | 2021-09-30 |
| KR102422221B1 (ko) | 2022-07-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7669162B2 (ja) | 画像内の文字色と背景色を抽出して提供する方法、システム、およびコンピュータプログラム | |
| KR102211650B1 (ko) | 인공지능 기반 상품 추천 방법 및 그 시스템 | |
| CN112163577B (zh) | 游戏画面中的文字识别方法、装置、电子设备和存储介质 | |
| US20200074672A1 (en) | Determining a pose of an object from rgb-d images | |
| KR101989089B1 (ko) | 클라우드 소싱 기반의 ar 컨텐츠 템플릿을 수집하여 ar 컨텐츠를 자동으로 생성하는 방법 및 시스템 | |
| CN110276349A (zh) | 视频处理方法、装置、电子设备及存储介质 | |
| CN110196917B (zh) | 个性化logo版式定制方法、系统和存储介质 | |
| KR101833943B1 (ko) | 동영상의 주요 장면을 추출 및 탐색하는 방법 및 시스템 | |
| KR102468309B1 (ko) | 영상 기반 건물 검색 방법 및 장치 | |
| KR102664791B1 (ko) | 이미지를 위치 데이터로 변환하여 제공하는 방법과 시스템 및 비-일시적인 컴퓨터 판독 가능한 기록 매체 | |
| KR20250172494A (ko) | 제품의 공통된 특징을 비교하여 비교 결과를 제공하는 방법, 시스템, 및 컴퓨터 프로그램 | |
| KR20190020281A (ko) | 시각적 입력의 처리 | |
| CN111744197A (zh) | 一种数据处理方法、装置、设备及可读存储介质 | |
| CN115129911A (zh) | 图标检索方法、特征提取网络的训练方法、电子设备、存储介质 | |
| KR102427723B1 (ko) | 인공지능 기반 상품 추천 방법 및 그 시스템 | |
| KR102143031B1 (ko) | 정지 영상에서 객체의 미래 움직임을 예측하는 방법 및 시스템 | |
| CN115455227B (zh) | 图形界面的元素搜索方法及电子设备、存储介质 | |
| KR102502034B1 (ko) | 영상의 비 식별 처리 객체를 검색하는 방법 및 시스템 | |
| US12197883B2 (en) | Method and system for image translation | |
| KR102872409B1 (ko) | 모바일 환경에서 실시간 트래킹을 위한 키포인트 선택 방법 | |
| KR101170490B1 (ko) | 마커리스 환경에서 증강 현실 오브젝트 인식 장치 및 방법 | |
| KR102172611B1 (ko) | 정지영상 또는 동영상 인식을 이용한 증강현실 서비스 제공 방법 및 그 시스템 | |
| Neiva et al. | A dynamic gesture recognition system to translate between sign languages in complex backgrounds | |
| KR102831452B1 (ko) | 인공지능 모델을 위한 트레이닝 샘플을 자동 생성하는 방법, 컴퓨터 장치, 및 컴퓨터 프로그램 | |
| KR102384177B1 (ko) | 전방위 화상정보 기반의 자동위상 매핑 처리 방법 및 그 시스템 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240305 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20241213 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241224 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250228 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250318 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250416 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7669162 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |