JP6749519B1 - 多角形検出装置、多角形検出方法、及び多角形検出プログラム - Google Patents
多角形検出装置、多角形検出方法、及び多角形検出プログラム Download PDFInfo
- Publication number
- JP6749519B1 JP6749519B1 JP2020508415A JP2020508415A JP6749519B1 JP 6749519 B1 JP6749519 B1 JP 6749519B1 JP 2020508415 A JP2020508415 A JP 2020508415A JP 2020508415 A JP2020508415 A JP 2020508415A JP 6749519 B1 JP6749519 B1 JP 6749519B1
- Authority
- JP
- Japan
- Prior art keywords
- polygon
- line segment
- forming
- image
- ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 claims description 12
- 239000000470 constituent Substances 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000001815 facial effect Effects 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/457—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by analysing connectivity, e.g. edge linking, connected component analysis or slices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18019—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18076—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by analysing connectivity, e.g. edge linking, connected component analysis or slices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/184—Extraction of features or characteristics of the image by analysing segments intersecting the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
- G06V30/19013—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
- G06V30/1902—Shifting or otherwise transforming the patterns to accommodate for positional errors
- G06V30/19027—Matching of contours
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
Description
また、辺の長さの比の類似度合いが重み付けされることによって、所定対象に対する撮影角度に応じて基準多角形に対応する多角形の辺の長さの比が変化しても、基準の多角形に対応する多角形の検出精度を高めることができる。
また、形成された多角形と、形成に用いられる線分の全てを含む多角形との重複度合いに基づいて、類似度合いを示す値が重み付けされる。この重複度合いが高いほど、形成された多角形が所定対象の外観において実存する蓋然性が高い。従って、実存する蓋然性が高い多角形の重みを大きくすることができる。
先ず、多角形検出装置1の構成について、図1を用いて説明する。図1は、本実施形態に係る多角形検出装置1の概要構成の一例を示すブロック図である。図1に示すように、多角形検出装置1は、システム制御部11と、システムバス12と、入出力インターフェース13と、記憶部14と、通信部15と、入力部16と、表示部17とを備えている。システム制御部11と入出力インターフェース13とは、システムバス12を介して接続されている。多角形検出装置1は、例えばサーバ装置であってもよいし、パーソナルコンピュータであってもよい。
次に、図2乃至図14を用いて、システム制御部11の機能概要について説明する。図2は、本実施形態に係る多角形検出装置1のシステム制御部11の機能ブロックの一例を示す図である。システム制御部11は、CPU11aが、記憶部14に記憶されているプログラムに含まれる各種コード等を読み出し実行することにより、図2に示すように、基準比率取得部111、写真画像取得部112、線分検出部113、多角形形成部114,対応多角形特定部115、画像処理部116等として機能する。
次に、多角形検出装置1の動作について、図16を用いて説明する。図16は、多角形検出装置1のシステム制御部11による多角形検出処理の一例を示すフローチャートである。多角形検出用のプログラムに含まれるプログラムコードに従って、システム制御部11は多角形検出処理を実行する。
11 システム制御部
12 システムバス
13 入出力インターフェース
14 記憶部
15 通信部
16 入力部
17 表示部
111 基準比率取得部
112 写真画像取得部
113 線分検出部
114 多角形形成部
115 対応多角形特定部
116 画像処理部
2 サーバ
3 ユーザ端末
Claims (16)
- 所定対象の外観に含まれる基準多角形の辺の長さの比を取得する比取得手段と、
前記所定対象の写真画像を取得する画像取得手段と、
前記取得された写真画像から線分を検出する検出手段と、
前記検出された線分を基に少なくとも一の多角形を形成する形成手段であって、前記多角形の形成に用いられる線分を含む直線同士が交差する点を頂点として有する前記多角形を形成する形成手段と、
前記形成された多角形で囲まれる領域と、前記多角形の形成に用いられる線分の全てを含む多角形で囲まれる領域との重複度合いに基づいて、前記形成された多角形の辺の長さの比と、前記取得された基準多角形の辺の長さの比との間の類似度合いを示す値に重み付けし、該重み付けされた値に基づいて、前記形成された多角形から、前記基準多角形に対応する多角形を特定する特定手段と、
を備えることを特徴とする多角形検出装置。 - 前記形成手段は、前記検出された線分のうち相対的に長い線分から、前記多角形の形成に用いる線分を特定することを特徴とする請求項1に記載の多角形検出装置。
- 前記検出手段は、前記検出された線分のうち少なくとも幾つかの線分を、前記基準多角形を構成する辺間の関係に基づいて定められた複数のグループに分け、
前記形成手段は、前記複数のグループのそれぞれから前記多角形の形成に用いられる線分を特定することを特徴とする請求項1又は2に記載の多角形検出装置。 - 前記検出手段は、前記検出された線分のうち少なくとも幾つかの線分を、該線分の角度に基づいて複数のグループに分け、
前記形成手段は、前記複数のグループのそれぞれから前記多角形の形成に用いられる線分を特定することを特徴とする請求項1乃至3の何れか一項に記載の多角形検出装置。 - 前記基準多角形及び前記形成される多角形は四角形であり、
前記検出手段は、前記少なくとも幾つかの線分を、前記少なくとも幾つかの線分のうち所定線分との間の角度が所定値よりも大きい線分のグループと、前記所定線分との間の角度が前記所定値以下である線分のグループとに分けることを特徴とする請求項4に記載の
多角形検出装置。 - 前記特定手段は、前記形成された多角形のうち、該多角形の構成要素が所定条件を満たす多角形から、前記対応する多角形を特定することを特徴とする請求項1乃至5の何れか一項に記載の多角形検出装置。
- 前記所定条件は、前記多角形の全頂点が前記写真画像内に位置することを特徴とする請求項6に記載の多角形検出装置。
- 前記所定条件は、前記多角形を構成する各辺のそれぞれの少なくとも一部が、該多角形の形成に用いられた線分のうち何れかの線分の少なくとも一部と重複することを特徴とする請求項6又は7に記載の多角形検出装置。
- 前記特定手段は、前記形成された多角形の辺と、前記多角形の形成に用いられる線分との重複度合いに基づいて、前記値を重み付けすることを特徴とする請求項1乃至8の何れか一項に記載の多角形検出装置。
- 前記写真画像内において、前記特定された多角形の辺で囲まれる領域の画像に対して所定処理を実行する処理手段を更に備えることを特徴とする請求項1乃至9の何れか一項に記載の多角形検出装置。
- 前記処理手段は、前記特定された多角形の辺で囲まれる領域の画像を、該領域の形状が前記基準多角形と相似するように変換することを特徴とする請求項10に記載の多角形検出装置。
- 前記処理手段は、前記特定された多角形の辺で囲まれる領域の画像から、所定種類の情報を認識することを特徴とする請求項10又は11に記載の多角形検出装置。
- 前記所定種類の情報は文字であることを特徴とする請求項12に記載の多角形検出装置。
- コンピュータにより実行される多角形検出方法において、
所定対象の外観に含まれる基準多角形の辺の長さの比を取得する比取得ステップと、
前記所定対象の写真画像を取得する画像取得ステップと、
前記取得された写真画像から線分を検出する検出ステップと、
前記検出された線分を基に少なくとも一の多角形を形成する形成ステップであって、前記多角形の形成に用いられる線分を含む直線同士が交差する点を頂点として有する前記多角形を形成する形成ステップと、
前記形成された多角形で囲まれる領域と、前記多角形の形成に用いられる線分の全てを含む多角形で囲まれる領域との重複度合いに基づいて、前記形成された多角形の辺の長さの比と、前記取得された基準多角形の辺の長さの比との間の類似度合いを示す値に重み付けし、該重み付けされた値に基づいて、前記形成された多角形から、前記基準多角形に対応する多角形を特定する特定ステップと、
を含むことを特徴とする多角形検出方法。 - 前記画像取得ステップは、前記写真画像をメモリにロードし、
前記検出ステップは、前記メモリにロードされた前記写真画像から線分を検出することを特徴とする請求項14に記載の多角形検出方法。 - コンピュータを、
所定対象の外観に含まれる基準多角形の辺の長さの比を取得する比取得手段と、
前記所定対象の写真画像を取得する画像取得手段と、
前記取得された写真画像から線分を検出する検出手段と、
前記検出された線分を基に少なくとも一の多角形を形成する形成手段であって、前記多角形の形成に用いられる線分を含む直線同士が交差する点を頂点として有する前記多角形を形成する形成手段と、
前記形成された多角形で囲まれる領域と、前記多角形の形成に用いられる線分の全てを含む多角形で囲まれる領域との重複度合いに基づいて、前記形成された多角形の辺の長さの比と、前記取得された基準多角形の辺の長さの比との間の類似度合いを示す値に重み付けし、該重み付けされた値に基づいて、前記形成された多角形から、前記基準多角形に対応する多角形を特定する特定手段と、
として機能させることを特徴とする多角形検出プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/015617 WO2020208742A1 (ja) | 2019-04-10 | 2019-04-10 | 多角形検出装置、多角形検出方法、及び多角形検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6749519B1 true JP6749519B1 (ja) | 2020-09-02 |
JPWO2020208742A1 JPWO2020208742A1 (ja) | 2021-04-30 |
Family
ID=72240826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020508415A Active JP6749519B1 (ja) | 2019-04-10 | 2019-04-10 | 多角形検出装置、多角形検出方法、及び多角形検出プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11557108B2 (ja) |
JP (1) | JP6749519B1 (ja) |
WO (1) | WO2020208742A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20240257546A1 (en) * | 2021-07-28 | 2024-08-01 | Rakuten Group, Inc. | Image processing system, image processing method, and program |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008117228A (ja) * | 2006-11-06 | 2008-05-22 | Nippon Telegr & Teleph Corp <Ntt> | 矩形追跡方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
JP2010062722A (ja) * | 2008-09-02 | 2010-03-18 | Casio Comput Co Ltd | 画像処理装置及びコンピュータプログラム |
JP2012114665A (ja) * | 2010-11-24 | 2012-06-14 | Nippon Telegr & Teleph Corp <Ntt> | 特徴図形付加方法、特徴図形検出方法、特徴図形付加装置、特徴図形検出装置、およびプログラム |
JP2012221118A (ja) * | 2011-04-06 | 2012-11-12 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
JP2016062123A (ja) * | 2014-09-12 | 2016-04-25 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
JP2017162218A (ja) * | 2016-03-10 | 2017-09-14 | 富士通株式会社 | 管理プログラム、管理装置および管理方法 |
US20180211107A1 (en) * | 2015-06-22 | 2018-07-26 | Photomyne Ltd. | System and Method for Detecting Objects in an Image |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0731733B2 (ja) | 1986-05-30 | 1995-04-10 | 富士通株式会社 | 矩形検出装置 |
US8125544B2 (en) * | 2008-09-02 | 2012-02-28 | Casio Computer Co., Ltd. | Image processing apparatus for extracting quadrangle area in image |
US20150042791A1 (en) * | 2013-08-09 | 2015-02-12 | Postea, Inc. | Apparatus, systems and methods for enrollment of irregular shaped objects |
CN107845068B (zh) * | 2016-09-18 | 2021-05-11 | 富士通株式会社 | 图像视角变换装置以及方法 |
JP7030425B2 (ja) * | 2017-05-22 | 2022-03-07 | キヤノン株式会社 | 画像処理装置、画像処理方法、プログラム |
-
2019
- 2019-04-10 WO PCT/JP2019/015617 patent/WO2020208742A1/ja active Application Filing
- 2019-04-10 JP JP2020508415A patent/JP6749519B1/ja active Active
- 2019-04-10 US US16/649,776 patent/US11557108B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008117228A (ja) * | 2006-11-06 | 2008-05-22 | Nippon Telegr & Teleph Corp <Ntt> | 矩形追跡方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
JP2010062722A (ja) * | 2008-09-02 | 2010-03-18 | Casio Comput Co Ltd | 画像処理装置及びコンピュータプログラム |
JP2012114665A (ja) * | 2010-11-24 | 2012-06-14 | Nippon Telegr & Teleph Corp <Ntt> | 特徴図形付加方法、特徴図形検出方法、特徴図形付加装置、特徴図形検出装置、およびプログラム |
JP2012221118A (ja) * | 2011-04-06 | 2012-11-12 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
JP2016062123A (ja) * | 2014-09-12 | 2016-04-25 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
US20180211107A1 (en) * | 2015-06-22 | 2018-07-26 | Photomyne Ltd. | System and Method for Detecting Objects in an Image |
JP2017162218A (ja) * | 2016-03-10 | 2017-09-14 | 富士通株式会社 | 管理プログラム、管理装置および管理方法 |
Also Published As
Publication number | Publication date |
---|---|
US20210142098A1 (en) | 2021-05-13 |
JPWO2020208742A1 (ja) | 2021-04-30 |
US11557108B2 (en) | 2023-01-17 |
WO2020208742A1 (ja) | 2020-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7564962B2 (ja) | 画像処理方法、画像処理装置及び非一時的な記憶媒体 | |
US7376270B2 (en) | Detecting human faces and detecting red eyes | |
US9436883B2 (en) | Collaborative text detection and recognition | |
KR102173123B1 (ko) | 전자장치에서 이미지 내의 특정 객체를 인식하기 위한 방법 및 장치 | |
KR100580626B1 (ko) | 얼굴검출방법 및 장치와 이를 적용한 보안 감시시스템 | |
CN103971400A (zh) | 一种基于标识码的三维交互的方法和系统 | |
JP2006350704A (ja) | 判別器の学習方法、顔判別方法および装置並びにプログラム | |
KR20190098858A (ko) | 딥러닝 기반의 포즈 변화에 강인한 얼굴 인식 방법 및 장치 | |
US8923610B2 (en) | Image processing apparatus, image processing method, and computer readable medium | |
CN110598703B (zh) | 一种基于深度神经网络的ocr识别方法及装置 | |
CN110852311A (zh) | 一种三维人手关键点定位方法及装置 | |
JP2005242640A (ja) | 対象物検出方法および装置並びにプログラム | |
JP2007108990A (ja) | 顔検出方法および装置並びにプログラム | |
JP6749519B1 (ja) | 多角形検出装置、多角形検出方法、及び多角形検出プログラム | |
CN117911668A (zh) | 药品信息识别方法及装置 | |
JP2006293720A (ja) | 顔検出装置、顔検出方法、及び顔検出プログラム | |
CN111274602A (zh) | 一种图像特征信息替换方法、装置、设备及介质 | |
JP4550768B2 (ja) | 画像検出方法および画像検出装置 | |
CN112541506B (zh) | 文本图像的矫正方法及装置、设备和介质 | |
JP6609181B2 (ja) | 文字属性推定装置、及び文字属性推定プログラム | |
JP2024501444A (ja) | メディアコンテンツのオーバーレイに適した画像スペースの検出 | |
WO2012044335A1 (en) | Recognizing a feature of an image independently of the orientation or scale of the image | |
AU2014277851A1 (en) | Detecting a gap between text columns from text line fragments | |
JP2001331804A (ja) | 画像領域検出装置及び方法 | |
US20240153126A1 (en) | Automatic image cropping using a reference feature |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200213 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200213 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200213 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200303 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200512 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200811 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6749519 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |