BR112020010087A2 - detecção de região poligonal - Google Patents

detecção de região poligonal Download PDF

Info

Publication number
BR112020010087A2
BR112020010087A2 BR112020010087-0A BR112020010087A BR112020010087A2 BR 112020010087 A2 BR112020010087 A2 BR 112020010087A2 BR 112020010087 A BR112020010087 A BR 112020010087A BR 112020010087 A2 BR112020010087 A2 BR 112020010087A2
Authority
BR
Brazil
Prior art keywords
line segment
polygonal
line segments
image
point
Prior art date
Application number
BR112020010087-0A
Other languages
English (en)
Inventor
Beier ZHU
Rui Zhang
Original Assignee
Beijing Sankuai Online Technology Co., Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co., Ltd filed Critical Beijing Sankuai Online Technology Co., Ltd
Publication of BR112020010087A2 publication Critical patent/BR112020010087A2/pt

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/543Depth or shape recovery from line drawings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/457Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by analysing connectivity, e.g. edge linking, connected component analysis or slices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20061Hough transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20068Projection on vertical or horizontal image axis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

A presente invenção refere-se a um método e aparelho de detecção de região poligonal, um meio de armazenamento legível por computador e um dispositivo eletrônico. O método inclui: obter uma imagem a ser detectada; calcular uma pluralidade de segmentos de linha na imagem baseada num algoritmo de detecção; mesclar a pluralidade de segmentos de linha que satisfazem uma condição de mescla num segmento de linha; calcular pontos de cruzamento dos segmentos de linha mesclados em pares de acordo com os segmentos de linha na imagem; e gera uma região poligonal com os vértices de pontos de cruzamento da região poligonal na imagem.

Description

"DETECÇÃO DE REGIÃO POLIGONAL". REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS
[0001] Esse pedido de patente reivindica prioridade ao Pedido de Patente Chinesa Nº 201810108373.9, depositado em 2 de fevereiro de 2018, e intitulado “MÉTODO E APARELHO DE DETECÇÃO DE REGIÃO POLIGONAL”, cuja totalidade dos conteúdos é incorporada neste documento por referência.
CAMPO TÉCNICO DA INVENÇÃO
[0002] O presente pedido está relacionado ao campo da Internet, em particular a um método e aparelho de detecção de região poligonal, um meio de armazenamento legível por computador e um dispositivo eletrônico.
ANTECEDENTES DA INVENÇÃO
[0003] Com o desenvolvimento contínuo de tecnologias de processamento de imagem, há mais e mais cenas em que as regiões poligonais em imagens são detectadas. Por exemplo, em um processo de autenticação de nome real, um usuário pode enviar uma foto de si mesmo e uma carteira de identidade no mesmo quadro e um sistema de autenticação precisa detectar uma região quadrangular onde a carteira de identidade na foto está localizada, dessa forma, identificando as informações da carteira de identidade.
[0004] Em tecnologias relacionadas, a detecção de regiões poligonais em uma imagem utiliza principalmente um algoritmo de detector de segmento de linha (LSD). Segmentos de linha reta na imagem podem ser calculados através do algoritmo LSD e então as regiões poligonais são construídas de acordo com esses segmentos de linha retos. No entanto, um segmento de linha completo é propenso a ser quebrado para se tornar muitos segmentos de linha curtos devido a muitos fatores de interferência, como ruído de fundo, leve flexão de segmentos de linha e interseção de segmentos de linha, existentes na imagem. Para aprimorar a eficiência do processamento, na técnica anterior, segmentos de linha curtos mais curtos que um limite serão excluídos. Esses segmentos de linha curtos são provavelmente uma parte de lados das regiões poligonais, e, portanto, essa forma de processamento afetará a precisão da detecção de região poligonal.
SUMÁRIO
[0005] Por esse motivo, o presente pedido fornece um método e aparelho de detecção de região poligonal, um meio de armazenamento de computador e um dispositivo eletrônico, que são configurados para resolver o problema acima de baixa precisão de detecção de região poligonal.
[0006] Especificamente, o presente pedido é implementado pela seguinte solução técnica:
[0007] De acordo com um primeiro aspecto de modalidades do presente relatório descritivo, um método de detecção de região poligonal é fornecido e o método inclui:
[0008] obter uma imagem a ser detectada;
[0009] calcular segmentos de linha na imagem com base num algoritmo de detecção de linha;
[0010] mesclar uma pluralidade de segmentos de linha que satisfazem uma condição de mescla em um segmento de linha;
[0011] determinar um ponto de cruzamento de segmentos de linha mesclados em par de acordo com os segmentos de linha mesclados na imagem; e
[0012] gerar uma região poligonal com os pontos de cruzamento como vértices da região poligonal na imagem.
[0013] Opcionalmente, mesclar uma pluralidade de segmentos de linha que satisfazem a condição de mescla em um segmento de linha inclui:
[0014] obter quaisquer dois segmentos de linha adjacentes;
[0015] calcular comprimentos de projeção dos dois segmentos de linha no mesmo eixo de coordenadas; e
[0016] mesclar os dois segmentos de linha em um segmento de linha quando as distâncias verticais entre dois pontos finais do segmento de linha com o comprimento de projeção mais curto e o outro segmento de linha são menos que um limite.
[0017] Opcionalmente, mesclar os dois segmentos de linha em um segmento de linha inclui:
[0018] obter dois pontos finais mais distantes dos dois segmentos de linha; e
[0019] conectar os dois pontos finais para obter o segmento de linha mesclado.
[0020] Opcionalmente, determinar os pontos de cruzamento de segmentos de linha mesclados em pares de acordo com os segmentos de linha mesclados na imagem inclui:
[0021] definir uma direção de cada segmento de linha mesclado no sentido horário ou anti-horário com um centro da imagem como uma origem para obter um vetor de segmento de linha;
[0022] obter um ponto de interseção entre cada dois vetores de segmentos de linha; e
[0023] determinar o ponto de interseção a ser o ponto de cruzamento quando o ponto de interseção satisfaz uma condição de ponto de cruzamento.
[0024] Opcionalmente, gerar a região poligonal com os pontos de cruzamento com os vértices da região poligonal na imagem quando a região poligonal é uma região quadrangular inclui:
[0025] gerar a região quadrangular com os quatro pontos de cruzamento com os vértices da região quadrangular na imagem quando quaisquer quatro pontos de cruzamento satisfazem uma condição de geração da região quadrangular.
[0026] Opcionalmente, a condição de geração da região quadrangular inclui:
[0027] obter um ponto de cruzamento A com um valor de coordenada sendo maior que 0 e um ponto de cruzamento B com um valor de coordenada sendo menor que 0 sob o mesmo eixo de coordenadas com um ponto central da imagem como uma origem das coordenadas;
[0028] Obter um ponto de interseção C constituído por um vetor de segmento de linha incidental do ponto de cruzamento A e um vetor de segmento de linha emergente do ponto de cruzamento B;
[0029] obter um ponto de interseção D constituído por um vetor de segmento de linha emergente do ponto de cruzamento A e um vetor de segmento de linha incidente do ponto de cruzamento B; e
[0030] determinar que os pontos A, B, C e D satisfazem a condição de geração da região quadrangular quando os pontos de interseção C e D satisfizerem uma condição de ponto de cruzamento.
[0031] O vetor de segmento de linha incidental é um vetor de segmento de linha apontando para o ponto de cruzamento; e o vetor de segmento de linha emergente é um vetor de segmento de linha começando a partir do ponto de cruzamento.
[0032] Opcionalmente, a condição de ponto de cruzamento inclui o seguinte:
[0033] o ponto de cruzamento dos vetores dos dois segmentos de linha está localizado na imagem;
[0034] um dos vetores dos dois segmentos de linha pega o ponto de cruzamento como um ponto terminal e o outro dos vetores do segmento de linha pega o ponto de cruzamento como um ponto inicial; e
[0035] Um ângulo interior constituído pelos vetores dos dois segmentos de linha encontra um intervalo de ângulo definido.
[0036] Opcionalmente, o método inclui ainda:
[0037] calcular uma razão de trabalho de cada lado da região poligonal, em que a razão de trabalho de cada lado da região poligonal é uma razão de um comprimento de linha sólida do lado a um comprimento do lado; e
[0038] Excluir a região poligonal quando a razão de trabalho de cada lado da região poligonal não satisfaz uma condição de razão de trabalho.
[0039] Opcionalmente, a condição de razão de trabalho inclui pelo menos um dos seguintes:
[0040] uma soma de razões de trabalho de qualquer lado i é maior do que uma iª razão de trabalho predefinida; ou
[0041] uma soma de razões de trabalho de N lados é maior do que uma Nª razão de trabalho predefinida.
[0042] i é um número inteiro positivo de [1,N] e N é o número de lados de uma região poligonal. A iª razão de trabalho é maior do que um razão de trabalho (i-1)ª predefinida. A razão de trabalho é um valor maior do que 0 e menor do que ou igual a 1.
[0043] Opcionalmente, o método inclui ainda:
[0044] calcular um vetor de parâmetro de recurso de cada região poligonal quando uma pluralidade de regiões poligonais é gerada, em que o vetor de parâmetro de recurso inclui pelo menos um parâmetro de recurso;
[0045] classificar a pluralidade de regiões poligonais de acordo com o vetor de parâmetro de recurso de cada região poligonal; e
[0046] determinar o número predefinido de um regiões poligonais classificadas principais como regiões poligonais ideais.
[0047] Opcionalmente, classificar a pluralidade de regiões poligonais de acordo com o vetor de parâmetro de recurso de cada região poligonal inclui:
[0048] calcular um valor de diferença entre os vetores de parâmetro de recurso de cada duas regiões poligonais; e
[0049] determinar uma sequência das duas regiões poligonais de acordo com uma relação de mapeamento entre o valor da diferença e uma função de classificação.
[0050] Opcionalmente, cada parâmetro de recurso corresponde ainda a um coeficiente quando há uma pluralidade de parâmetros de recurso nos vetores de parâmetro de recurso.
[0051] Opcionalmente, o parâmetro de recurso inclui pelo menos um dos seguintes:
[0052] um primeiro parâmetro de recurso denotando uma razão de trabalho total de todos os lados da região poligonal;
[0053] um segundo parâmetro de recurso denotando uma soma de razões de um comprimento de projeção de cada lado da região poligonal numa direção principal a um comprimento de imagem na direção principal;
[0054] um terceiro parâmetro de recurso denotando um grau de similaridade entre ângulos interiores da região poligonal e ângulos interiores de um polígono regular; ou
[0055] um quarto parâmetro de recurso denotando uma divergência KL entre um cinza interno e um cinza externo da região poligonal.
[0056] De acordo com um segundo aspecto das modalidades do presente relatório descritivo, um aparelho de detecção de região poligonal é fornecido e o aparelho inclui:
[0057] uma unidade de obtenção, obtendo uma imagem a ser detectada;
[0058] uma unidade de cálculo, calculando uma pluralidade de segmentos de linha na imagem com base num algoritmo de detecção de linha;
[0059] uma unidade de mescla, mesclando uma pluralidade de segmentos de linha que satisfazem uma condição de mescla em um segmento de linha;
[0060] uma unidade de determinação, determinando pontos de cruzamento de segmentos de linha mesclados em pares de acordo com os segmentos de linha mesclados na imagem; e
[0061] uma unidade de geração, gerando uma região poligonal com os pontos de cruzamento como vértices da região poligonal na imagem.
[0062] De acordo com um terceiro aspecto das modalidades do presente relatório descritivo, um meio de armazenamento legível por computador é fornecido. O meio de armazenamento armazena um programa de computador. O programa de computador é configurado para realizar o método de detecção de região poligonal de acordo com qualquer uma das modalidades acima.
[0063] De acordo com um quarto aspecto das modalidades do presente relatório descritivo, um dispositivo eletrônico é fornecido, incluindo:
[0064] um processador; e
[0065] uma memória configurada para armazenar uma instrução executável do processador.
[0066] O processador está disposto para implementar o método de detecção de região poligonal de acordo com qualquer uma das modalidades acima.
[0067] As modalidades do presente relatório descritivo fornecem uma solução de detecção de região poligonal, que pode mesclar muitos segmentos de linha curtos que satisfazem uma condição de mescla em um segmento de linha. O número de segmentos de linha é reduzido e assim a eficácia de processamento subsequente é aprimorada. Os segmentos de linha curtos não são excluídos, portanto, as informações de segmento de linha em uma imagem são reservadas o máximo possível, o que pode aprimorar ainda mais eficazmente a precisão da detecção de região poligonal.
BREVE DESCRIÇÃO DAS FIGURAS
[0068] FIG. 1 ilustra um diagrama de fluxo de um método de detecção de região poligonal de acordo com uma modalidade exemplificativa do presente pedido;
[0069] FIG. 2 ilustra diagramas esquemáticos de uma imagem a ser detectada e segmentos de linha calculados de acordo com uma modalidade exemplificativa do presente pedido;
[0070] FIG. 3 ilustra um diagrama esquemático de comprimentos de projeção de acordo com uma modalidade exemplificativa do presente pedido;
[0071] FIG. 4 ilustra um diagrama esquemático dos segmentos de linha A e B na FIG. 3 após a mescla;
[0072] FIG. 5 ilustra um diagrama esquemático de segmento de linha definindo direções de acordo com uma modalidade exemplificativa do presente pedido;
[0073] FIG. 6 ilustra um diagrama esquemático da interseção de vetor de segmento de linha de acordo com uma modalidade exemplificativa do presente pedido;
[0074] FIG. 7 ilustra um diagrama esquemático de quatro pontos de interseção de acordo com uma modalidade exemplificativa do presente pedido;
[0075] FIG. 8 ilustra um diagrama esquemático de outros quatro pontos de interseção de acordo com uma modalidade exemplificativa do presente pedido;
[0076] FIG. 9 ilustra um diagrama esquemático de regiões poligonais obtidas ao detectar a imagem a ser detectada mostrada na FIG. 2.
[0077] FIG. 10 ilustra um diagrama esquemático de uma região poligonal finalmente determinada como primeira na ordem após a imagem a ser detectada mostrada na FIG. 2 ser processada;
[0078] FIG. 11 ilustra um diagrama estrutural de hardware de um aparelho de detecção de região poligonal de acordo com uma modalidade exemplificativa do presente pedido;
[0079] FIG. 12 ilustra um diagrama esquemático de módulos de um aparelho de detecção de região poligonal de acordo com uma modalidade exemplificativa do presente pedido.
DESCRIÇÃO DETALHADA DAS MODALIDADES
[0080] Modalidades exemplificativas são descritas em detalhes neste documento e exemplos das modalidades exemplificativas são mostrados nos desenhos anexos. Quando as descrições a seguir se referem aos desenhos anexos, a menos que indicado de outra forma, os mesmos números em diferentes desenhos anexos representam os mesmos elementos ou elementos semelhantes. As implementações a seguir descritas nas modalidades exemplificativas a seguir não representam todas as implementações que são consistentes com o presente pedido. Pelo contrário, as implementações são meros exemplos de aparatos e métodos que são descritos em detalhes nas reivindicações anexas e que são consistentes com alguns aspectos deste pedido.
[0081] Os termos usados neste pedido são meramente para descrever modalidades específicas e não pretendem limitar esse pedido. Os termos “um”, “referido” e “o” nas formas singulares usados neste pedido e nas reivindicações anexas também pretendem incluir formas plurais, a menos que especificado de outra forma claramente no contexto. Também deve ser entendido que, o termo “e/ou” usado neste documento indica e inclui qualquer ou todas as combinações possíveis de um ou mais itens associados listados.
[0082] Deve ser entendido que embora os termos como primeiro, segundo e terceiro possam ser usados neste documento para descrever diversas informações, tais informações não devem ser limitadas a esses termos. Esses termos são meramente usados para distinguir informações do mesmo tipo uma das outras. Por exemplo, dentro do escopo desse pedido, as informações de primeiro também podem ser referidas como informações de segundo, e de forma semelhante, informações de segundo podem também ser referidas como informações de primeiro. Dependendo do contexto, o termo “se” conforme usado neste documento podem ser interpretado como “quando...” ou “após...” ou “em resposta à determinação”.
[0083] FIG. 1 ilustra um diagrama de fluxo de um método de detecção de região poligonal de acordo com uma modalidade exemplificativa do presente pedido. O método pode ser aplicado a um servidor de detecção de região poligonal (servidor em forma curta abaixo). O método pode incluir as seguintes etapas:
[0084] Etapa 110: uma imagem a ser detectada é obtida.
[0085] Na modalidade do presente pedido, o servidor pode obter a imagem a ser detectada.
[0086] Etapa 120: uma pluralidade de segmentos de linha na imagem é calculada de acordo com um algoritmo de detecção de linha.
[0087] A modalidade do presente pedido fornece o algoritmo de detecção de linha a ser configurado para calcular a pluralidade de segmentos de linha na imagem a ser detectada. Os segmentos de linha podem geralmente ser segmentos de linha retos. O algoritmo de detecção de linha é um método de detecção que pode detectar rapidamente segmentos de linha retos em uma imagem em tempo linear. O algoritmo de detecção de linha pode incluir, mas não está limitado a um algoritmo LSD, um algoritmo Hough, etc.
[0088] Por exemplo, uma parte direita da FIG. 2 mostra um diagrama esquemático de segmentos de linha calculados pelo algoritmo de detecção de linha. O exemplo é uma foto (um diagrama esquemático em um lado esquerdo na FIG. 2) de uma carteira de identidade segurada por uma mão (informações específicas na carteira de identidade foram escondidas na figura porque envolvem informações privadas) enviada por um usuário em um cenário de autenticação de nome real. Após obter a foto enviada pelo usuário, o servidor pode calcular o diagrama esquemático dos segmentos de linha mostrado no lado direito na FIG. 2 de acordo com o algoritmo de detecção de linha. Pode ser visto que há muitos segmentos de linha curtos nos segmentos de linha calculados. A modalidade do presente pedido não exclui os segmentos de linha curtos neste, enquanto mescla os segmentos de linha curtos de acordo com a etapa 130 como se segue.
[0089] Etapa 130: a pluralidade de segmentos de linha que satisfazem uma condição de mescla são mesclados em um segmento de linha.
[0090] As modalidades do presente pedido fornecem uma solução de mescla de segmentos de linha, que pode mesclar muitos segmentos de linha curtos que satisfazem uma condição de mescla em um segmento de linha. Dessa forma, o número de segmentos de linha é reduzido, o que aprimora, dessa forma, a eficácia de processamento subsequente. Além disso, os segmentos de linha curtos não são excluídos, portanto, as informações de segmento de linha em uma imagem são reservadas o máximo possível, e, dessa forma, regiões poligonais na imagem podem ser detectadas o máximo possível.
[0091] Numa modalidade, a etapa 130, pode incluir:
[0092] A1: quaisquer dois segmentos de linha adjacentes são obtidos.
[0093] A2: calcular comprimentos de projeção dos dois segmentos de linha no mesmo eixo de coordenadas são calculados.
[0094] A3: os dois segmentos de linha são mesclados em um segmento de linha quando as distâncias verticais entre dois pontos finais do segmento de linha com o comprimento de projeção mais curto nos dois segmentos de linha e o outro segmento de linha nos dois segmentos de linha são menos que um limite.
[0095] A4: o processamento de mescla não é feito quando não são ambas as distâncias verticais entre dois pontos finais do segmento de linha com o comprimento de projeção mais curto nos dois segmentos de linha e o outro segmento de linha nos dois segmentos de linha são menos que um limite.
[0096] O comprimento de projeção pode ser um comprimento de um segmento projetado no eixo de coordenadas. Tomando um sistema de coordenada retangular como um exemplo, o eixo de coordenadas pode ser um eixo de abcissa (eixo X) e pode ser um eixo de ordenada (eixo Y) e um eixo de coordenadas usado pode ser predefinido. Como um diagrama esquemático de comprimento de projeção ilustrado na FIG. 3, comprimentos dos segmentos de linha A e B com o mesmo comprimento projetado no eixo X são respectivamente a e b. Como a é maior que b, as distâncias verticais entre os pontos finais B1 e B2 do segmento de linha B com o comprimento de projeção mais curto e o segmento de linha A precisam ser calculadas. Em algumas modalidades, as distâncias verticais podem ser calculadas usando uma fórmula para calcular uma distância de um ponto a uma linha em geometria analítica. A distância vertical entre o ponto final B1 e o segmento de linha A mostrado na FIG. 3, é c; e a distância vertical entre o ponto final B2 e o segmento de linha A é d. Quando as distâncias verticais c e d são menos do que o limite, os dois segmentos de linha A e B podem ser mesclados em um segmento de linha.
[0097] Noutra modalidade, a etapa 130, pode incluir:
[0098] A5: um ângulo de cada segmento de linha em um sistema de coordenada polar é calculado e os segmentos de linha são classificados de pequeno a grande de acordo com os valores de ângulo.
[0099] A6: o primeiro segmento de linha após a classificação é determinado como um segmento de linha inicialmente mesclado.
[0100] A7: comprimentos de projeção do segmento de linha inicialmente mesclado e outros segmentos de linha são calculados.
[0101] A etapa é semelhante à etapa A2 acima e a descrição desta é omitida neste documento.
[0102] A3: os dois segmentos de linha são mesclados em um segmento de linha quando as distâncias verticais entre dois pontos finais do segmento de linha com o comprimento de projeção mais curto e o outro segmento de linha são menos que um limite.
[0103] Na modalidade, os segmentos de linha são classificados através de um sistema de coordenadas polar e o primeiro segmento de linha após a classificação é usado como o segmento de linha inicialmente mesclado para fazer com que o segmento de linha inicialmente mesclado seja sequencialmente comparado com outros segmentos de linha (realizando a etapa A7), para que os segmentos de linha que satisfazem a condição de mescla sejam continuamente mesclados (realizando a etapa A3). Quando não há segmento de linha capaz de ser mesclado com o segmento de linha inicialmente mesclado, as etapas acima A5, A6, A7 e A3, são realizadas novamente no resto dos segmentos de linha até que nenhum segmento de linha possa ser mesclado.
[0104] Numa modalidade, a etapa A3, pode incluir:
[0105] A31: dois pontos finais mais distantes dos dois segmentos de linha são obtidos.
[0106] A32: dois pontos finais são conectados para obter um segmento de linha mesclado.
[0107] A33: quaisquer dois segmentos de linha originais são excluídos.
[0108] Em algumas modalidades, um método para calcular os dois pontos finais mais distantes dos dois segmentos de linha na A31 pode ser o de obter coordenadas de todos os pontos finais dos dois segmentos de linha e encontrar o ponto final correspondente ao valor mínimo de coordenada do eixo X e o ponto final correspondente ao valor máximo de coordenada do eixo X, em que os dois pontos finais são os pontos finais mais distantes. O método também pode ser o de encontrar o ponto final correspondente ao valor mínimo de coordenada do eixo Y e o ponto final correspondente ao valor máximo de coordenada do eixo Y, em que os dois pontos finais também podem estar relacionados aos pontos finais mais distantes. Certamente, uma distância de vetor entre dois pontos finais também pode ser calculada para obter pontos finais mais distantes. A presente divulgação não está limitada a isso.
[0109] FIG. 4 ilustra um diagrama esquemático dos segmentos de linha A e B (denotadas pelas linhas imaginárias) na FIG. 3 após a mescla. Na figura, uma maneira de mesclar os segmentos de linha é: conectar dois pontos finais mais distantes, sendo A1 e B2 dos segmentos de linha A e B para obter um segmento de linha mesclado C (denotado por uma linha sólida); e então excluir os segmentos de linha originais A e B.
[0110] Etapa 140: pontos de cruzamento de segmentos de linha mesclados em pares são determinados de acordo com os segmentos de linha mesclados na imagem.
[0111] Na modalidade do presente pedido, uma solução para determinar pontos de cruzamento entre dois segmentos de linha é fornecido ainda e configurado para calcular para obter pontos de cruzamento configurados para construir uma região poligonal. Em algumas modalidades, uma pluralidade de segmentos de linha também podem ter o mesmo ponto de cruzamento, e nesse momento, a pluralidade de segmentos de linha pode ser considerada como uma pluralidade de grupos de dois segmentos de linha cruzando no ponto. Então é realizada uma análise de acordo com esse método.
[0112] Numa modalidade, a etapa 140, pode incluir:
[0113] B1: uma direção de cada segmento de linha mesclado é definida no sentido horário ou anti-horário com um centro da imagem como uma origem para obter um vetor de segmento de linha.
[0114] B2: um ponto de interseção entre cada dois vetores de segmentos de linha é obtido.
[0115] B3: o ponto de interseção é determinado como o ponto de cruzamento quando o ponto de interseção satisfaz uma condição de ponto de cruzamento.
[0116] FIG. 5 ilustra um diagrama esquemático dos segmentos de linha definindo direções. Na FIG. 5, primeiro, uma origem 106 de um centro de uma imagem é determinada e então, direções de todos os segmentos de linha são definidos no sentido anti-horário para obter vetores de segmento de linha. Todos os vetores de segmento de linha envolvem a origem 106 e uma direção anti-horária.
[0117] Numa modalidade, uma forma de determinar a origem pode incluir determinar duas linhas diagonais de acordo com 4 vértices da imagem; e determinar um ponto de interseção das duas linhas diagonais como a origem.
[0118] Numa modalidade, a condição de ponto de cruzamento pode incluir:
[0119] (1) um ponto de cruzamento dos vetores dos dois segmentos de linha está localizado na imagem;
[0120] (2) um dos vetores dos dois segmentos de linha pega o ponto de cruzamento como um ponto terminal e o outro vetor do segmento de linha pega o ponto de cruzamento como um ponto inicial; e
[0121] (3) um ângulo interior constituído pelos vetores dos dois segmentos de linha encontra um intervalo de ângulo definido.
[0122] Numa modalidade, os pontos de interseção dos vetores de segmento de linha podem ser determinados como pontos de cruzamento na situação de satisfazer todos os (1), (2) e (3O na condição de ponto de cruzamento acima.
[0123] FIG. 6 ilustra um diagrama esquemático dos da interseção do vetor de segmento de linha. Na figura, os vetores de segmento de linha 1, 2 e 3 são incluídos. Os vetores de segmento de linha 1 e 2 fazem uma interseção no ponto A e os vetores de segmento de linha 2 e 3 também fazem uma interseção no ponto A. Um ponto inicial do vetor 1 de segmento de linha é um ponto B e um ponto terminal deste é o ponto A. Os pontos de iniciais dos vetores 2 e 3 de segmento de linha são o ponto A e os pontos terminais destes são respectivamente os pontos C e D.
[0124] Se o ponto A é um ponto de cruzamento dos vetores 1 e 2 do segmento de linha ou um ponto de cruzamento dos vetores 2 e 3 de segmento de linha é descrito em detalhes abaixo.
[0125] 1. Para um ponto de interseção A dos vetores 1 e 2 de segmento de linha:
[0126] Primeiro, o ponto A é localizado na imagem, o que satisfaz a condição (1).
[0127] ሬሬሬሬሬԦ" toma o ponto Segundo, o vetor 1 de segmento de linha "‫ܣܤ‬ ሬሬሬሬሬԦ " toma A como um ponto terminal e o vetor 2 de segmento de linha "‫ܥܣ‬ o ponto A como um ponto inicial, o que satisfaz a condição (2).
[0128] Finalmente, presume-se que os ângulos interiores α dos vetores 1 e 2 de segmento de linha estão localizados em uma faixa de ângulo definida, o que satisfaz a condição (3).
[0129] Portanto, o ponto de interseção A dos vetores 1 e 2 de segmento de linha pode ser determinado como o ponto de cruzamento dos vetores 1 e 2 de segmento de linha.
[0130] 2. Para um ponto de interseção A dos vetores 2 e 3 de segmento de linha:
[0131] Primeiro, o ponto A é localizado na imagem, o que satisfaz a condição (1).
[0132] ሬሬሬሬሬԦ " e o vetor 2 de Segundo, o vetor 3 de segmento de linha "‫ܦܣ‬ ሬሬሬሬሬԦ " tomam o ponto A como um ponto inicial, o que segmento de linha "‫ܥܣ‬ não satisfaz a condição (2).
[0133] Mesmo assim, presume-se que os ângulos interiores β dos vetores 2 e 3 de segmento de linha estão localizados na faixa de ângulo definida, o que satisfaz a condição (3).
[0134] Portanto, o ponto de interseção A não é o ponto de cruzamento dos vetores 2 e 3 de segmento de linha uma vez que a condição (2) não é satisfeita.
[0135] Numa modalidade, a faixa de ângulo pode estar entre 45 graus e 135 graus. Certamente, esse é um mero exemplo. Na aplicação real, a faixa de ângulo pode ser definida conforme necessário.
[0136] Etapa 150: uma região poligonal é gerada com os pontos de cruzamento como vértices da região poligonal na imagem.
[0137] Na aplicação real, uma região de polígono N pode ser determinada de acordo com N pontos de cruzamento. Portanto, uma região de polígono N pode ser determinada de acordo com N pontos de cruzamento.
[0138] Isso é ainda ilustrado com uma região quadrangular como um exemplo. Etapa 150 pode incluir: a região quadrangular é gerada com quatro pontos de cruzamento com os vértices da região quadrangular na imagem quando quaisquer quatro pontos de cruzamento satisfazem uma condição de geração de um quadrângulo.
[0139] Na aplicação real, um quadrângulo pode ser gerado de acordo com 4 pontos. Na modalidade do presente pedido, um servidor gera a região quadrangular com os quatro pontos de cruzamento com os vértices da região quadrangular na imagem ao determinar que os quaisquer quatro pontos de cruzamento satisfazem uma condição de geração da região quadrangular.
[0140] Numa modalidade, a condição de geração do quadrângulo inclui:
[0141] um ponto de cruzamento A com um valor de coordenada sendo maior que 0 e um ponto de cruzamento B com um valor de coordenada sendo menor que 0 sob um certo eixo de coordenadas com um ponto central da imagem como uma origem do sistema de coordenadas;
[0142] um ponto de interseção C de um vetor de segmento de linha incidental do ponto A e um vetor de segmento de linha emergente do ponto B;
[0143] um ponto de interseção D de um vetor de segmento de linha emergente do ponto A e um vetor de segmento de linha incidental do ponto B; e
[0144] os pontos A, B, C e D são determinados a satisfazerem a condição de geração do quadrângulo quando os pontos de interseção C e D satisfizerem uma condição de ponto de cruzamento;
[0145] O vetor de segmento de linha incidental do certo ponto é um vetor de segmento de linha apontando para o ponto, ou seja, o vetor de segmento de linha toma o ponto como um ponto terminal. O vetor de segmento de linha incidental do certo ponto é um vetor de segmento de linha começando do ponto, ou seja, o vetor de segmento de linha toma o ponto como um ponto inicial.
[0146] Na presente modalidade, o ponto central da imagem pode ser presumido como uma parte de uma região quadrangular a ser detectada. Portanto, sob o certo eixo de coordenadas do sistema de coordenas, deve haver um vértice com coordenadas sendo maiores que 0 e um vértice com coordenadas sendo menores que 0 na região quadrangular a ser detectada. O eixo de coordenadas pode selecionar um eixo de ordenadas do sistema de coordenadas e pode também selecionar um eixo de abcissas do sistema de coordenadas. Por exemplo, num sistema de coordenadas retangular construído ao tomar o ponto central de uma imagem como uma origem, deve haver um vértice com um valor de ordenada sendo maior que 0 e um vértice com um valor de ordenada sendo menor que 0 em um quadrângulo se o ponto central da imagem está localizado numa região quadrangular.
[0147] Por exemplo, FIG. 7 ilustra um diagrama esquemático de quatro pontos de interseção. Um ponto de cruzamento A com um valor de ordenada sendo maior que 0 e um ponto de cruzamento B com um valor de ordenada sendo menor que 0 pode ser obtido com um ponto central 106 da imagem como uma origem das coordenadas; O ponto de cruzamento A corresponde a um vetor 1 de segmento de linha incidental e um vetor 2 de segmento de linha emergente. O ponto de cruzamento B corresponde a um vetor 3 de segmento de linha incidental e um vetor 4 de segmento de linha emergente. Na FIG. 7 pode ser visto que um ponto de interseção de um vetor 1 de segmento de linha incidental do ponto de cruzamento A e o vetor 4 de segmento de linha emergente do ponto de cruzamento B é um ponto C; e um ponto de interseção do vetor 2 de segmento de linha emergente do ponto de cruzamento A e o vetor 3 de segmento de linha incidental do ponto de cruzamento B é um ponto D.
[0148] Uma vez que o ponto de interseção C satisfaz todos os (1), (2) e (3) na condição de ponto de cruzamento acima, o ponto de interseção C é também um ponto de cruzamento.
[0149] Uma vez que o ponto de interseção D satisfaz todos os (1), (2) e (3) na condição de ponto de cruzamento acima, o ponto de interseção D é também um ponto de cruzamento.
[0150] Com base no que foi mencionado acima, já que todos os pontos C e D satisfazem a condição de ponto de cruzamento, os pontos A, B, C e D podem ser determinados a satisfazerem a condição de geração do quadrângulo; e a região quadrangular pode ser gerada com os pontos A, B, C e D com os vértices da região quadrangular na imagem.
[0151] FIG. 8 ilustra um diagrama esquemático de outros quatro pontos de interseção. Da mesma forma, um ponto de cruzamento A com um valor de ordenada sendo maior que 0 e um ponto de cruzamento B com um valor de ordenada sendo menor que 0 pode ser obtido com um ponto central 106 de uma imagem como uma origem de coordenadas. O ponto de cruzamento A corresponde a um vetor 1 de segmento de linha incidental e um vetor 2 de segmento de linha emergente. O ponto de cruzamento B corresponde a um vetor 3 de segmento de linha incidental e um vetor 4 de segmento de linha emergente. Na FIG. 8 pode ser visto que um ponto de interseção de um vetor 1 de segmento de linha incidental do ponto de cruzamento A e o vetor 4 de segmento de linha emergente do ponto de cruzamento B é um ponto D (não mostrado na figura); e um ponto de interseção do vetor 2 de segmento de linha emergente do ponto de cruzamento A e o vetor 3 de segmento de linha incidental do ponto de cruzamento B é um ponto C.
[0152] Uma vez que os pontos de interseção C e D excedem uma faixa da imagem, os pontos de interseção C e D não satisfazem a condição de ponto de cruzamento, ou seja, os pontos A, B, C e D não satisfazem a condição de geração do quadrângulo.
[0153] A modalidade do presente pedido fornece uma solução de detecção de região poligonal, que mescla muitos segmentos de linha curtos que satisfazem a condição de mescla em um segmento de linha. O número dos segmentos de linha é reduzido e assim a eficácia de processamento subsequente é aprimorada. Os segmentos de linha curtos não são excluídos, e, portanto, as informações de segmento de linha na imagem são reservadas o máximo possível, o que pode aprimorar ainda mais a precisão da detecção de região poligonal.
[0154] Na aplicação real, o número de regiões poligonais detectadas é grande devido a presença de fatores de interferência de fundo de uma imagem. Geralmente, quanto mais complexo uma imagem de fundo é, maior é o número de regiões poligonais detectadas. FIG. 9 ilustra um diagrama esquemático de regiões poligonais obtidas ao detectar a imagem a ser detectada mostrada na FIG. 2. Pode ser visto que há muitas regiões poligonais e regiões poligonais ideais precisam ser triadas a partir daí.
[0155] Para resolver o problema acima, com base na modalidade mostrada na FIG. 1 mencionada acima, o método pode incluir ainda:
[0156] Uma razão de trabalho de cada lado constituindo a região poligonal é calculada; além disso, a região poligonal é excluída quando a razão de trabalho de cada lado da região poligonal não satisfaz a condição de razão de trabalho.
[0157] A razão de trabalho reflete um grau saliente de arestas da região poligonal. Geralmente, quanto maior for a razão de trabalho, mais salientes são as arestas e de outro modo, quanto menor for a razão de trabalho, menos salientes são as arestas. Portanto, as regiões poligonais com arestas não salientes e obviamente sem razão de ser precisam ser excluídas.
[0158] Numa modalidade, a condição de razão de trabalho inclui pelo menos um dos seguintes:
[0159] uma soma de razões de trabalho de qualquer lado i é maior do que uma iª razão de trabalho predefinida; ou
[0160] uma soma de razões de trabalho de N lados é maior do que uma Nª razão de trabalho predefinida.
[0161] i é um número inteiro positivo de [1,N] e N é o número de lados de uma região poligonal. A razão de trabalho de cada lado da região poligonal é uma razão de um comprimento de linha sólida do lado a um comprimento do lado. A iª razão de trabalho é maior do que um razão de trabalho (i-1)ª predefinida. A razão de trabalho é um valor maior do que 0 e menor do que ou igual a 1.
[0162] O comprimento de linha sólida é uma soma de comprimentos reais de uma pluralidade de segmentos de linha antes do lado ser mesclado na etapa 130 acima. Dado que lados de um polígono podem ser mesclados a partir de uma pluralidade de segmentos de linha curtos, um comprimento de linha sólida de cada lado do polígono é geralmente menor ou igual a um comprimento do lado.
[0163] Isso é ainda ilustrado abaixo com uma região quadrangular como um exemplo. A condição de razão de trabalho da região quadrangular pode incluir pelo menos um dos seguintes:
[0164] uma razão de trabalho de qualquer lado é maior do que uma razão de trabalho predefinida;
[0165] uma soma de razões de trabalho de quaisquer dois lados é maior do que uma segunda razão de trabalho predefinida;
[0166] uma soma de razões de trabalho de quaisquer três lados é maior do que uma terceira razão de trabalho predefinida;
[0167] uma soma de razões de trabalho de quatro lados é maior do que uma quarta razão de trabalho predefinida.
[0168] A quarta razão de trabalho predefinida é maior do que uma terceira razão de trabalho predefinida. A terceira razão de trabalho é maior do que a segunda razão de trabalho predefinida. A segunda razão de trabalho predefinida é maior do que uma primeira razão de trabalho predefinida.
[0169] Num exemplo, a condição de razão de trabalho da região quadrangular é a de que todas as 4 sub-condições acima precisam ser satisfeitas. Presume-se que a primeira razão de trabalho predefinida pode ser 0,125, a segunda razão de trabalho predefinida pode ser 0,25, a terceira razão de trabalho predefinida pode ser 0,333 e a quarta razão de trabalho predefinida pode ser 0,45. Ou seja, essa região quadrangular pode ser reservada apenas na situação de satisfazer todas as 4 sub-condições de que a razão de trabalho de qualquer lado da região quadrangular é maior do que 0,125, a soma das razões de trabalho de quaisquer dois lados é maior do que 0,25, a soma das razões de trabalho de quaisquer três lados é maior do que 0,333, assim como a soma das razões de trabalho de quatro lados é maior do que 0,45. No entanto, essa região quadrangular será excluída na situação de não satisfazer qualquer condição.
[0170] Numa modalidade, qualquer uma das sub-condições da condição de razão de trabalho acima pode ser selecionada como uma condição de triagem. Noutra modalidade, qualquer uma das múltiplas sub-condições da condição de razão de trabalho acima pode ser selecionada como uma condição de triagem. Por exemplo, um quadrângulo é apenas reservado ao satisfazer as 4 sub-condições acima. Ou, o quadrângulo pode ser reservado assim como satisfazer a primeira sub-condição acima. Em geral, quanto mais sub-condições de razão de trabalho precisarem ser satisfeitas, mais quadrângulos serão excluídos. A presente divulgação não limita a seleção da condição de razão de trabalho.
[0171] Através da presente modalidade, um servidor pode triar regiões poligonais obtidas por detecção uma vez para excluir algumas regiões poligonais sem razão de ser.
[0172] Há possivelmente uma pluralidade de regiões poligonais detectadas, enquanto regiões poligonais realmente necessárias para o servidor são geralmente a ideal ou diversas destas, e, portanto, regiões poligonais ideais ainda precisam ser selecionadas a partir da pluralidade de regiões poligonais detectadas. Portanto, com base na modalidade mostrada na FIG. 1 mencionada acima, o método pode incluir ainda:
[0173] C1: um vetor de parâmetro de recurso de cada região poligonal é calculado quando uma pluralidade de regiões poligonais é gerada, em que o vetor de parâmetro de recurso inclui pelo menos um parâmetro de recurso;
[0174] C2: a pluralidade de regiões poligonais é classificada de acordo com os vetores de parâmetros de recurso das regiões poligonais; e
[0175] C3: o número predefinido de regiões poligonais classificadas principais é determinado como regiões poligonais ideais.
[0176] Numa modalidade, a etapa C2: a pluralidade de regiões poligonais é classificada de acordo com os vetores de parâmetros recurso das regiões poligonais, pode incluir: um valor de diferença entre vetores de parâmetros de recurso de duas regiões poligonais é calculado; e uma sequência das duas regiões poligonais é determinada de acordo com uma relação de mapeamento entre o valor de diferença e uma função de classificação.
[0177] Por exemplo, uma sequência de uma região poligonal A pode ser determinada a ser maior do que uma região poligonal B quando o valor de diferença entre um vetor de parâmetro de recurso da região poligonal A e um vetor de parâmetro de recurso da região poligonal B é maior do que 0. A sequência da região poligonal A pode ser determinada a ser menor do que a região poligonal B quando o valor de diferença entre o vetor de parâmetro de recurso da região poligonal A e o vetor de parâmetro de recurso da região poligonal B é menor do que 0.
[0178] Numa modalidade, uma lei ou relação entre os parâmetros de recurso das regiões poligonais e resultados de classificação podem ser encontrados ao definir funções com razão de ser em combinação com tecnologias de aprendizagem de máquina existentes. Por exemplo, uma máquina de vetor de suporte de classificação (RankSVM) pode ser adotada como uma função de classificação, treinamento de modelo é realizado através de conjuntos de amostra de treinamento marcados manualmente (como imagens 100 assim como regiões poligonais correspondentes, um vetor de parâmetro de recurso de cada região poligonal e resultados de classificação de diferentes regiões poligonais) e assim, coeficiente necessários por um modelo são obtidos. Quando o vetor de parâmetro de recurso inclui uma pluralidade de parâmetros de recurso, cada parâmetro de recurso corresponde a um coeficiente e valores desses coeficientes podem ser obtidos pelo treinamento de modelo. O RankSVM é adequado para resolver um problema de classificação. Uma amostra de treinamento i pode incluir vetores de parâmetro de recurso šଵ୧ ǡ š୧ଶ de duas regiões poligonais e um resultado de classificação ›୧ . Por exemplo, quando ‫ݔ‬௜ଵ é maior do que ‫ݔ‬௜ଶ em ordem, um resultado de classificação sendo 1 podendo ser a saída, de outro modo, -1 é a saída.
[0179] Numa modalidade, um modelo é essencialmente um fórmula. O modelo treinado acima pode ser uma fórmula (1): › ൌ ‫ ݔ ۦ‬ଵ െ ‫ ݔ‬ଶ ۧ (1), em que šଵ ǡ š ଶ são respectivamente vetores de parâmetro de recursos de duas regiões poligonais. Quando › ൐ Ͳ, é denotado que ‫ ݔ‬ଵ é maior do que ‫ ݔ‬ଶ em ordem. Quando › ൏ Ͳ ^_________________‫ ݔ‬ଶ é maior do que ‫ ݔ‬ଵ em ordem, e ‫ ۄ ۃ‬denota qualquer função de classificação.
[0180] Numa modalidade, ‫ ۄ ۃ‬pode ser qualquer função. Pode-se presumir ser uma função linear por uma questão de simplicidade. Correspondentemente, o modelo treinado acima pode ser uma fórmula (2): › ൌ ‫ ݔ ۦ‬ଵ െ ‫ ݔ‬ଶ ǡ ߱ۧ (2),
[0181] em que ɘ é um coeficiente de peso de um vetor de parâmetro de recurso e o coeficiente de peso pode ser obtido ao aplicar as fórmulas (3) a (6) para treinar conjuntos de amostra de treinamento: ଵ ݉݅݊ఠǡక ԡ߱ԡଶ ൅ ‫ ܥ‬σே ௜ୀଵ ߦ௜ (3), ଶ •Ǥ – ‫ݕ‬௜ ‫ݔۦ‬௜ଵ െ ‫ݔ‬௜ଶ ǡ ߱ۧ ൒ ͳ െߦ௜ (4), ߦ௜ ൒ Ͳ (5), ‹ ൌ ͳǡ ǥ ǡ (6).
[0182] Em que ‫ݔ‬௜ଵ ǡ ‫ݔ‬௜ଶ são vetores de parâmetros de recursos de duas regiões poligonais em uma iª amostra de treinamento. ‫ݕ‬௜ ൐ Ͳ denota ‫ݔ‬௜ଵ é maior do que ‫ݔ‬௜ଶ em ordem, ‫ݕ‬௜ ൏ Ͳ denota ‫ݔ‬௜ଵ é menor do que ‫ݔ‬௜ଶ em ordem e ߦ é uma variável slack. ||‫ ||ڄ‬denota uma norma L2. N denota o número de amostras de treinamento. C>0 é um coeficiente de penalidade. i denota um número de série de uma amostra de treinamento.
[0183] A fórmula (3) é um objeto ideal de um modelo, em que ɘǡ Ɍ precisa satisfazer as fórmulas (4) a (6).
[0184] O vetor de parâmetro de recurso inclui pelo menos um dos seguintes parâmetros de recurso:
[0185] um primeiro parâmetro de recurso denotando uma razão de trabalho total de todos os lados de um polígono;
[0186] um segundo parâmetro de recurso denotando uma soma de razões de um comprimento de projeção de cada lado do polígono numa direção principal a um comprimento de imagem na direção principal;
[0187] um terceiro parâmetro de recurso denotando um grau de similaridade entre ângulos interiores do polígono e ângulos interiores de um polígono regular; ou
[0188] um quarto parâmetro de recurso denotando uma divergência Kullback-Leibler (KL) entre um cinza interno e um cinza externo do polígono.
[0189] Por uma questão da simplicidade, o cálculo dos parâmetros de recurso é ilustrado abaixo com um quadrângulo como um exemplo. Numa modalidade, o primeiro parâmetro de recurso pode ser configurado para indicar um grau saliente de arestas do quadrângulo e a razão de trabalho total pode ser calculada de acordo com a fórmula (7): ୳୫ ୡ୭୫୮୰୧୫ୣ୬୲୭ ୢୣ ୪୧୬୦ୟ ୱ×୪୧ୢୟ ୢୣ ୳୫ ୧͑ ୪ୟୢ୭ σସ୧ୀଵ (7), ୳୫ ୡ୭୫୮୰୧୫ୣ୬୲୭ ୢୣ ୧͑ ୪ୟୢ୭ em que o comprimento de linha sólida é uma soma de comprimentos reais de uma pluralidade de segmentos de linha antes do lado ser mesclado. Dado que lados de um quadrângulo podem ser mesclados a partir de uma pluralidade de segmentos de linha curtos, um comprimento de linha sólida de cada lado do quadrângulo é geralmente menor ou igual a um comprimento do lado.
[0190] Numa modalidade, o segundo parâmetro de recurso pode ser calculado de acordo com a fórmula (8): ୳୫ ୡ୭୫୮୰୧୫ୣ୬୲୭ ୢୣ ୮୰୭୨ୣ­ ୭ ୢୣ ୳୫ ୧͑ ୪ୟୢ୭ ୣ୫ ୳୫ୟ ୢ୧୰ୣ­ ୭ ୮୰୧୬ୡ୧୮ୟ୪ ୢୣୱ୲ୣ σସ௜ୀଵ ୳୫ ୡ୭୫୮୰୧୫ୣ୬୲୭ ୢୣ ୧୫ୟ୥ୣ୫ ୡ୭୰୰ୣୱ୮୭୬ୢୣ୬୲ୣ ୢୣ ୳୫ ୧͑ ୪ୟୢ୭ ୣ୫ ୳୫ୟ ୢ୧୰ୣ­ ୭ ୮୰୧୬ୡ୧୮ୟ୪ (8), em que a direção principal é uma direção de um comprimento de projeção relativamente longa dos comprimentos de lado projetados em um eixo X ou um eixo Y. Cada lado do quadrângulo tem um direção principal (uma direção de eixo X ou uma direção de eixo Y). Geralmente, um comprimento de imagem correspondente à direção do eixo X é uma largura de uma imagem e um comprimento de imagem correspondente à direção do eixo Y é uma altura da imagem.
[0191] Numa modalidade, o terceiro parâmetro de recurso pode ser calculado de acordo com a fórmula (9): ȁ୳୫ Ÿ୬୥୳୪୭ ୢୣ ୳୫ ୧͑ Ÿ୬୥୳୪୭ ୧୬୲ୣ୰୧୭୰ Ȅ ଽ଴ȁ σସ୧ୀଵ (9). ଽ଴
[0192] O parâmetro de recurso é configurado para denotar um grau de similaridade entre o quadrângulo e um retângulo.
[0193] Numa modalidade, o quarto parâmetro de recurso, chamado de divergência KL pode ser calculado de acordo com a fórmula (10): ଵ ୮ሺ୶ሻ ୯ሺ୶ሻ ୏୐ሺ’ȁȁ“ሻ ൌ σ୶ሺ’ሺšሻ Ž‘‰ ൅ “ሺšሻŽ‘‰ ሻ (10), ଶ ୯ሺ୶ሻ ୮ሺ୶ሻ em que p denota uma distribuição de frequência de valor de cor dentro do quadrângulo. q denota uma distribuição de frequência de valor de cor fora do quadrângulo. x denota um fator de distribuição de uma distribuição de frequência de valor de cor. ‫ܦ‬௄௅ ሺ‫݌‬ȁȁ‫ ݍ‬ሻ Denota uma divergência KL da distribuição de frequência interna p à distribuição de frequência externa q. A distribuição de frequência de valor de cor pode ser uma distribuição de frequência de valor de cor RGB e pode também ser uma distribuição de frequência de valor cinza. Tomando a distribuição de frequência de valor de cinza como um exemplo, x é 0, 1, 2, ..., 255, quando um valor de cinza da imagem é 0 a 255 e as distribuições de frequência de valor de cinza p e q são os números de pixels tomando cada valor de cinza. A divergência KL pode ser considerada com o um grau de dissimilaridade entre as distribuições de frequência p e q. A divergência KL é 0 quando as duas distribuições de frequência são as mesmas. A divergência KL também aumenta quando a diferença entre as duas distribuições de frequência aumenta.
[0194] Presume-se que há 3 regiões quadrangulares em uma imagem, isto é, a região quadrangular mais interna 1, a região quadrangular média 2 e a região quadrangular mais externa 3, em que uma distribuição de frequência de valor de cinza dentro da região quadrangular 1 é p, uma distribuição de frequência de valor de cinza entre as regiões quadrangulares 1 e 2 é q e uma distribuição de frequência de valor de cinza entre as regiões quadrangulares 2 e 3 é r. Divergências KL entre as regiões quadrangulares 1, 2 e 3 são calculadas para obter:
[0195] A divergência KL da região quadrangular 1 para a região quadrangular 2: ୏୐ሺ’ȁȁ“ሻ;
[0196] A divergência KL da região quadrangular 2 para a região quadrangular 3: ୏୐ሺ“ȁȁ”ሻ; e
[0197] A divergência KL da região quadrangular 1 para a região quadrangular 3: ୏୐ሺ’ȁȁ”ሻ.
[0198] Numa modalidade, uma pluralidade de regiões poligonais detectadas pode ser classificada com base em um modelo de treino. Resultados de classificação podem ser obtidos simplesmente inserindo vetores de parâmetros de recurso da pluralidade de regiões poligonais no modelo. Além disso, o modelo pode ainda ser treinado com esses resultados de classificação como uma nova amostra de treinamento, dessa forma, coeficientes melhores são obtido continuamente e a precisão de classificação de modelo é aprimorada continuamente.
[0199] Numa modalidade, um servidor pode determinar o número predefinido de regiões poligonais com classificação superior a serem regiões poligonais ideais após classificar as regiões poligonais.
[0200] Numa modalidade, o número predefinido pode ser definido de acordo com as demandas. Por exemplo, o número predefinido pode ser definido para ser 1 se uma região poligonal precisamente meramente ser determinada, o número predefinido pode ser definido para ser 10 se 10 regiões poligonais ideais são necessárias, e assim por diante.
[0201] FIG. 10 ilustra um diagrama esquemático de uma região poligonal finalmente determinada como primeira na ordem após a imagem a ser detectada mostrada na FIG. 2 ser processada acima.
[0202] A modalidade do presente pedido não considera somente índices de cores (o quarto parâmetro de recurso) das arestas das regiões poligonais, mas também considera graus salientes (o primeiro parâmetro de recurso) das arestas das regiões poligonais, formas (o segundo parâmetro de recurso e o terceiro parâmetro de recurso) das regiões poligonais, etc, ao triar as regiões poligonais, dessa forma, tornando a precisão das regiões poligonais otimizadas maior. Embora as regiões poligonais possam ser classificadas de acordo com um vetor de parâmetro de recurso constituído por um certo parâmetro de recurso, resultados melhores podem ser obtidos ao usar o vetor de parâmetro de recurso constituído pelos quatro parâmetros de recurso acima para classificar as regiões poligonais.
[0203] Correspondendo às modalidades do método de detecção da região poligonal mencionada acima, o presente pedido fornece ainda uma modalidade de um aparato de detecção de região poligonal.
[0204] O aparelho de detecção de região poligonal de acordo com a modalidade do presente pedido pode ser aplicado a um servidor. A modalidade do aparelho pode ser implementada por software e pode também ser implementada por hardware ou de uma forma de combinação de software e hardware. Tomando a implementação de software como um exemplo, o aparelho, com um aparelho lógico, é formado pela leitura de uma instrução de programa de computador correspondente em uma memória não volátil em um armazenamento interno para operação por um processador nesta. A partir de um aspecto do hardware, a FIG. 11 ilustra um diagrama estrutural de hardware onde o aparelho de detecção de região poligonal do presente pedido está localizado, o que inclui um processador 111, um barramento interno 114, uma interface de rede 115, um armazenamento interno 112 e uma memória não volátil 113. O processador 111 lê um programa de detecção de região poligonal 200 correspondente a partir da memória não volátil 113 no armazenamento interno 112 e então opera o programa. Além do processador 111, o armazenamento interno 112, a interface de rede 115, o barramento interno 114 e a memória não volátil 113 ilustrada na FIG. 11, outro hardware pode ainda ser geralmente incluído na modalidade de acordo com funções reais da detecção de região poligonal e as descrições destes são omitidas.
[0205] Em referência à FIG. 12, numa implementação de software, o aparelho de detecção de região poligonal pode incluir:
[0206] uma unidade de obtenção 210, obtendo uma imagem a ser detectada;
[0207] uma unidade de cálculo 220, calculando uma pluralidade de segmentos de linha na imagem com base num algoritmo de detecção de linha;
[0208] uma unidade de mescla 230, mesclando uma pluralidade de segmentos de linha que satisfazem uma condição de mescla em um segmento de linha;
[0209] uma unidade de determinação 240, determinando pontos de cruzamento de segmentos de linha mesclados em pares de acordo com os segmentos de linha mesclados na imagem; e
[0210] uma unidade de geração 250, gerando uma região poligonal com os pontos de cruzamento como vértices da região poligonal na imagem.
[0211] Opcionalmente, a unidade de mescla 230 inclui:
[0212] uma primeira subunidade de obtenção, obtendo quaisquer dois segmentos de linha adjacentes;
[0213] uma primeira subunidade de cálculo, calculando comprimentos de projeção dos dois segmentos de linha no mesmo eixo de coordenadas; e
[0214] uma subunidade de mescla, mesclando os dois segmentos de linha em um segmento de linha quando as distâncias verticais entre dois pontos finais do segmento de linha com o comprimento de projeção mais curto e o outro segmento de linha são menos que um limite.
[0215] Opcionalmente, a subunidade de mescla inclui:
[0216] uma segunda subunidade de obtenção, obtendo dois pontos finais mais distantes dos dois segmentos de linha; e
[0217] uma subunidade de conexão, conectando os dois pontos finais para obter um segmento de linha mesclado.
[0218] Opcionalmente, a unidade de determinação 240 inclui:
[0219] uma subunidade de definição, definindo uma direção de cada segmento de linha mesclado no sentido horário ou anti-horário com um centro da imagem como uma origem para obter um vetor de segmento de linha;
[0220] uma terceira subunidade de obtenção, obtendo um ponto de interseção entre cada dois vetores de segmentos de linha; e
[0221] uma segunda subunidade de cálculo, determinando o ponto de interseção como um ponto de cruzamento quando o ponto de interseção satisfaz uma condição de ponto de cruzamento.
[0222] Opcionalmente, quando a região poligonal é uma região quadrangular, a unidade de geração 250 inclui:
[0223] uma subunidade de geração, gerando a região quadrangular com quatro pontos de cruzamento com os vértices da região quadrangular na imagem quando quaisquer quatro pontos de cruzamento satisfazem uma condição de geração da região quadrangular.
[0224] Opcionalmente, a condição de geração da região quadrangular inclui:
[0225] um ponto de cruzamento A com um valor de coordenada sendo maior que 0 e um ponto de cruzamento B com um valor de coordenada sendo menor que 0 sob o mesmo eixo de coordenadas com um ponto central da imagem como uma origem das coordenadas;
[0226] um ponto de interseção C constituído por um vetor de segmento de linha incidental do ponto de cruzamento A e um vetor de segmento de linha emergente do ponto de cruzamento B é obtido;
[0227] um ponto de interseção D constituído por um vetor de segmento de linha emergente do ponto de cruzamento A e um vetor de segmento de linha incidental do ponto de cruzamento B é obtido; e
[0228] os pontos A, B, C e D são determinados a satisfazerem a condição de geração da região quadrangular quando os pontos de interseção C e D satisfizerem uma condição de ponto de cruzamento;
[0229] O vetor de segmento de linha incidental é um vetor de segmento de linha apontando para o ponto de cruzamento; e o vetor de segmento de linha emergente é um vetor de segmento de linha começando a partir do ponto de cruzamento.
[0230] Opcionalmente, a condição de ponto de cruzamento inclui os seguintes:
[0231] o ponto de cruzamento dos vetores dos dois segmentos de linha está localizado na imagem;
[0232] um dos vetores dos dois segmentos de linha pega o ponto de cruzamento como um ponto terminal e o outro dos dois vetores do segmento de linha pega o ponto de cruzamento como um ponto inicial; e
[0233] Um ângulo interior constituído pelos vetores dos dois segmentos de linha encontra um intervalo de ângulo definido.
[0234] Opcionalmente, o aparelho inclui ainda:
[0235] uma terceira unidade de cálculo, calculando uma razão de trabalho de cada lado da região poligonal, em que a razão de trabalho de cada lado da região poligonal é uma razão de um comprimento de um comprimento de linha sólida do lado a um comprimento do lado; e
[0236] uma unidade de exclusão, excluindo a região poligonal quando a razão de trabalho de cada lado da região poligonal não satisfaz uma condição de razão de trabalho.
[0237] Opcionalmente, a condição de razão de trabalho inclui pelo menos um dos seguintes:
[0238] uma soma de razões de trabalho de qualquer lado i é maior do que uma iª razão de trabalho predefinida; ou
[0239] uma soma de razões de trabalho de N lados é maior do que uma Nª razão de trabalho predefinida.
[0240] i é um número inteiro positivo de [1,N] e N é o número de lados de uma região poligonal; a iª razão de trabalho é maior do que uma (i-1)ª razão de trabalho predefinida; e a razão de trabalho é um valor maior do que 0 e menor do que ou igual a 1.
[0241] Opcionalmente, o aparelho inclui ainda:
[0242] uma quarta subunidade de cálculo, calculando um vetor de parâmetro de recurso de cada região poligonal quando uma pluralidade de regiões poligonais é gerada, em que o vetor de parâmetro de recurso inclui pelo menos um parâmetro de recurso;
[0243] uma subunidade de classificação, classificando a pluralidade de regiões poligonais de acordo com o vetor de parâmetro de recurso de cada região poligonal; e
[0244] uma subunidade de determinação, determinando o número predefinido de um regiões poligonais classificadas principais como regiões poligonais ideais.
[0245] Opcionalmente, a subunidade de classificação inclui:
[0246] uma quinta subunidade de cálculo, calculando um valor de diferença entre os vetores de parâmetro de recurso das duas regiões poligonais; e
[0247] uma segunda subunidade de determinação, determinando uma sequência das duas regiões poligonais de acordo com uma relação de mapeamento entre o valor da diferença e uma função de classificação.
[0248] Opcionalmente, cada parâmetro de recurso corresponde ainda a um coeficiente quando há uma pluralidade de parâmetros de recurso no vetor de parâmetro de recurso.
[0249] Opcionalmente, o parâmetro de recurso inclui pelo menos um dos seguintes:
[0250] um primeiro parâmetro de recurso, denotando uma razão de trabalho total de todos os lados da região poligonal;
[0251] um segundo parâmetro de recurso, denotando uma soma de razões de um comprimento de projeção de cada lado da região poligonal numa direção principal a um comprimento de imagem na direção principal;
[0252] um terceiro parâmetro de recurso, denotando um grau de similaridade entre ângulos interiores da região poligonal e ângulos interiores de um polígono regular; ou
[0253] um quarto parâmetro de recurso, denotando uma divergência KL entre um cinza interno e um cinza externo da região poligonal.
[0254] O processo de implementação de funções e efeitos de cada unidade no aparelho acima é especificado em detalhes no processo de implementação de etapas correspondentes no método acima e as descrições deste são omitidos neste documento.
[0255] Para modalidade do aparelho, ele basicamente corresponde às modalidades do método e, portanto, descrições relacionadas referem-se a partes de descrições das modalidades do método. A modalidade do aparelho descrita acima é meramente esquemática, em que as unidades ilustradas como componentes separados podem ser ou podem não ser fisicamente separados e componentes exibidos como unidades podem ser ou podem não ser unidades físicas, ou seja, podem estar localizados no mesmo lugar ou podem também ser distribuídos em uma pluralidade de unidades de rede. Partes ou todos os módulos neste podem ser selecionados de acordo com as necessidades reais para implementar o objetivo da solução do presente pedido. Os versados na técnica podem entender e implementar sem realizar atividade inventiva.
[0256] A FIG. 12 acima descreve os módulos internos funcionais e um esquema estrutural de um aparelho de monitoramento comercial e um corpo de execução real deste pode ser um dispositivo eletrônico, incluindo:
[0257] um processador; e
[0258] uma memória configurada para armazenar uma instrução executável do processador.
[0259] O processador está arranjado para:
[0260] obter uma imagem a ser detectada;
[0261] calcular uma pluralidade de segmentos de linha na imagem com base num algoritmo de detecção de linha;
[0262] mesclar a pluralidade de segmentos de linha que satisfazem uma condição de mescla em um segmento de linha;
[0263] determinar pontos de cruzamento entre os segmentos de linha mesclados de acordo com os segmentos de linha mesclados; e
[0264] gerar uma região poligonal com os pontos de cruzamento como vértices da região poligonal na imagem.
[0265] Opcionalmente, mesclar uma pluralidade de segmentos de linha que satisfazem a condição de mescla em um segmento de linha inclui:
[0266] quaisquer dois segmentos de linha adjacentes são obtidos;
[0267] comprimentos de projeção dos dois segmentos de linha no mesmo eixo de coordenadas são calculados; e
[0268] os dois segmentos de linha são mesclados em um segmento de linha quando as distâncias verticais entre dois pontos finais do segmento de linha com o comprimento de projeção mais curto e o outro segmento de linha são menos que um limite.
[0269] Opcionalmente, mesclar os dois segmentos de linha em um segmento de linha inclui:
[0270] dois pontos finais mais distantes dos dois segmentos de linha; e
[0271] os dois pontos finais são conectados para obter um segmento de linha mesclado.
[0272] Opcionalmente, determinar os pontos de cruzamento de segmentos de linha mesclados em pares de acordo com os segmentos de linha mesclados na imagem inclui:
[0273] uma direção de cada segmento de linha mesclado é definida no sentido horário ou anti-horário com um centro da imagem como uma origem para obter um vetor de segmento de linha;
[0274] um ponto de interseção entre cada dois vetores de segmentos de linha é obtido;
[0275] o ponto de interseção é determinado como o ponto de cruzamento quando o ponto de interseção satisfaz uma condição de ponto de cruzamento.
[0276] Opcionalmente, gerar a região poligonal com os pontos de cruzamento com os vértices da região poligonal na imagem quando a região poligonal é uma região quadrangular inclui:
[0277] a região quadrangular é gerada com quatro pontos de cruzamento com os vértices da região quadrangular na imagem quando quaisquer quatro pontos de cruzamento satisfazem uma condição de geração da região quadrangular.
[0278] Opcionalmente, a condição de geração da região quadrangular inclui:
[0279] um ponto de cruzamento A com um valor de coordenada sendo maior que 0 e um ponto de cruzamento B com um valor de coordenada sendo menor que 0 sob o mesmo eixo de coordenadas com um ponto central da imagem como uma origem das coordenadas;
[0280] um ponto de interseção C constituído por um vetor de segmento de linha incidental do ponto de cruzamento A e um vetor de segmento de linha emergente do ponto de cruzamento B é obtido;
[0281] um ponto de interseção D constituído por um vetor de segmento de linha emergente do ponto de cruzamento A e um vetor de segmento de linha incidental do ponto de cruzamento B é obtido; e
[0282] os pontos A, B, C e D são determinados a satisfazerem a condição de geração da região quadrangular quando os pontos de interseção C e D satisfizerem uma condição de ponto de cruzamento;
[0283] O vetor de segmento de linha incidental é um vetor de segmento de linha apontando para o ponto de cruzamento; e o vetor de segmento de linha emergente é um vetor de segmento de linha começando a partir do ponto de cruzamento.
[0284] Opcionalmente, a condição de ponto de cruzamento inclui os seguintes:
[0285] o ponto de cruzamento dos vetores dos dois segmentos de linha está localizado na imagem;
[0286] um dos vetores dos dois segmentos de linha pega o ponto de cruzamento como um ponto terminal e o outro dos dois vetores do segmento de linha pega o ponto de cruzamento como um ponto inicial; e
[0287] Um ângulo interior constituído pelos vetores dos dois segmentos de linha encontra um intervalo de ângulo definido.
[0288] Opcionalmente, incluindo ainda:
[0289] uma razão de trabalho de cada lado da região poligonal é calculada, em que a razão de trabalho de cada lado da região poligonal é uma razão de um comprimento de linha sólida do lado a um comprimento do lado; e
[0290] a região poligonal é excluída quando a razão de trabalho de cada lado da região poligonal não satisfaz uma condição de razão de trabalho.
[0291] Opcionalmente, a condição de razão de trabalho inclui pelo menos um dos seguintes:
[0292] uma soma de razões de trabalho de qualquer lado i é maior do que uma iª razão de trabalho predefinida; ou
[0293] uma soma de razões de trabalho de N lados é maior do que uma Nª razão de trabalho predefinida.
[0294] i é um número inteiro positivo de [1,N] e N é o número de lados de uma região poligonal; a iª razão de trabalho é maior do que uma (i-1)ª razão de trabalho predefinida; e a razão de trabalho é um valor maior do que 0 e menor do que ou igual a 1.
[0295] Opcionalmente, incluindo ainda:
[0296] um vetor de parâmetro de recurso de cada região poligonal é calculado quando uma pluralidade de regiões poligonais é gerada, em que o vetor de parâmetro de recurso inclui pelo menos um parâmetro de recurso;
[0297] a pluralidade de regiões poligonais é classificada de acordo com o vetor de parâmetro de recurso das regiões poligonais; e
[0298] o número predefinido de regiões poligonais classificadas principais é determinado como regiões poligonais ideais.
[0299] Opcionalmente, classificar a pluralidade de regiões poligonais de acordo com o vetor de parâmetro de recurso de cada região poligonal inclui:
[0300] é calculado um valor de diferença entre os vetores de parâmetro de recurso das duas regiões poligonais; e
[0301] uma sequência das duas regiões poligonais é determinada de acordo com uma relação de mapeamento entre o valor da diferença e uma função de classificação.
[0302] Opcionalmente, cada parâmetro de recurso corresponde ainda a um coeficiente quando há uma pluralidade de parâmetros de recurso no vetor de parâmetro de recurso.
[0303] Opcionalmente, o parâmetro de recurso inclui pelo menos um dos seguintes:
[0304] um primeiro parâmetro de recurso, denotando uma razão de trabalho total de todos os lados da região poligonal;
[0305] um segundo parâmetro de recurso, denotando uma soma de razões de um comprimento de projeção de cada lado da região poligonal numa direção principal a um comprimento de imagem na direção principal;
[0306] um terceiro parâmetro de recurso, denotando um grau de similaridade entre ângulos interiores da região poligonal e ângulos interiores de um polígono regular; ou
[0307] um quarto parâmetro de recurso, denotando uma divergência KL entre um cinza interno e um cinza externo da região poligonal.
[0308] Nas modalidades do dispositivo eletrônico mencionadas acima, deve ser entendido que, o processador pode ser uma unidade de processamento central (CPU) ou outro processador de propósito geral, um processador de sinal digital (DSP), um circuito integrado de aplicação específica (ASIC), ou semelhantes. O processador de propósito geral pode ser um microprocessador ou qualquer processador convencional ou semelhantes. A memória mencionada acima pode ser uma memória só de leitura (ROM), uma memória de acesso aleatório, uma memória flash ou um disco de estado sólido. As etapas dos métodos divulgados nas modalidades da presente invenção podem ser diretamente incorporadas como sendo executadas por um processador de hardware ou por uma combinação de hardware em módulos de processador e software.
[0309] As modalidades nesse pedido são todas descritas de uma maneira progressiva, para as mesmas partes ou partes semelhantes nas modalidades, consultar essas modalidades e descrições de cada modalidade se focam numa diferença de outras modalidades. Especialmente, uma modalidade de dispositivo eletrônico é basicamente semelhante a uma modalidade do método e, portanto, é descrita com brevidade; para partes relacionadas, pode ser feita referência a descrições parciais na modalidade do método.
[0310] As descrições mencionadas acima são modalidades meramente exemplificativa desse pedido, mas não pretendem limitar esse pedido. Qualquer modificação, substituição equivalente ou melhoria feita sem se afastar do espírito e princípio desse pedido devem entrar no escopo de proteção desse pedido.

Claims (16)

REIVINDICAÇÕES
1. Método de detecção de região poligonal, caracterizado pelo fato de que compreende: obter uma imagem a ser detectada; calcular segmentos de linha na imagem com base num algoritmo de detecção de linha; mesclar uma pluralidade de segmentos de linha que satisfazem uma condição de mescla em um segmento de linha; determinar um ponto de cruzamento de segmentos de linha mesclados em par de acordo com os segmentos de linha mesclados na imagem; e gerar uma região poligonal com os pontos de cruzamento como vértices da região poligonal na imagem.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que mesclar a pluralidade de segmentos de linha que satisfazem uma condição de mescla no segmento de linha compreende: obter quaisquer dois segmentos de linha adjacentes; calcular comprimentos de projeção dos dois segmentos de linha no mesmo eixo de coordenadas; e mesclar os dois segmentos de linha no segmento de linha quando as distâncias verticais entre dois pontos finais do segmento de linha com o comprimento de projeção mais curto e o outro segmento de linha são menos que um limite.
3. Método de acordo com a reivindicação 2, caracterizado pelo fato de que mesclar os dois segmentos de linha no segmento de linha compreende: obter dois pontos finais mais distantes dos dois segmentos de linha; e conectar os dois pontos finais para obter um segmento de linha mesclado.
4. Método de acordo com a reivindicação 1, caracterizado pelo fato de que os pontos de cruzamento dos segmentos de linha mesclados em par de acordo com os segmentos de linha mesclados na imagem compreendem: definir uma direção de cada segmento de linha mesclado no sentido horário ou anti-horário com um centro da imagem como uma origem para obter um vetor de segmento de linha; obter um ponto de interseção entre cada dois vetores de segmentos de linha; determinar o ponto de interseção como o ponto de cruzamento quando o ponto de interseção satisfaz uma condição de ponto de cruzamento.
5. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a região poligonal com os pontos de cruzamento com os vértices da região poligonal na imagem quando a região poligonal é uma região quadrangular compreende: gerar a região quadrangular com quatro pontos de cruzamento com os vértices da região quadrangular na imagem quando quaisquer quatro pontos de cruzamento satisfazem uma condição de geração da região quadrangular.
6. Método de acordo com a reivindicação 5, caracterizado pelo fato de que a condição de geração a região quadrangular compreende: obter um ponto de cruzamento A com um valor de coordenada sendo maior que 0 e um ponto de cruzamento B com um valor de coordenada sendo menor que 0 sob o mesmo eixo de coordenadas com um ponto central da imagem como uma origem das coordenadas; obter um ponto de interseção C constituído por um vetor de segmento de linha incidental do ponto de cruzamento A e um vetor de segmento de linha emergente do ponto de cruzamento B; obter um ponto de interseção D constituído por um vetor de segmento de linha emergente do ponto de cruzamento A e um vetor de segmento de linha incidente do ponto de cruzamento B; e determinar os pontos A, B, C e D a satisfazerem a condição de geração da região quadrangular quando os pontos de interseção C e D satisfizerem uma condição de ponto de cruzamento; em que o vetor de segmento de linha incidental é um vetor de segmento de linha apontando para o ponto de cruzamento; e o vetor de segmento de linha emergente é um vetor de segmento de linha começando a partir do ponto de cruzamento.
7. Método de acordo com a reivindicação 4, caracterizado pelo fato de que a condição do ponto de cruzamento compreende o seguinte: o ponto de cruzamento dos vetores dos dois segmentos de linha está localizado na imagem; Um dos vetores dos dois segmentos de linha pega o ponto de cruzamento como um ponto terminal e o outro dos vetores do segmento de linha pega o ponto de cruzamento como um ponto inicial; e Um ângulo interior constituído pelos vetores dos dois segmentos de linha encontra um intervalo de ângulo definido.
8. Método de acordo com a reivindicação 1, caracterizado pelo fato de que o método compreende ainda: calcular uma razão de trabalho de cada lado da região poligonal, em que a razão de trabalho de cada lado da região poligonal é uma razão de um comprimento de linha sólida do lado a um comprimento do lado; e Excluir a região poligonal quando a razão de trabalho de cada lado da região poligonal não satisfaz uma condição de razão de trabalho.
9. Método de acordo com a reivindicação 8, caracterizado pelo fato de que a condição da razão de trabalho compreende o seguinte: uma soma de razões de trabalho de qualquer lado i é maior do que uma iª razão de trabalho predefinida; ou uma soma de razões de trabalho de N lados é maior do que uma Nª razão de trabalho predefinida; em que i é um número inteiro positivo de [1,N] e N é o número de lados da região poligonal; a iª razão de trabalho é maior do que uma (i-1)ª razão de trabalho predefinida; e a razão de trabalho é um valor maior do que 0 e menor do que ou igual a 1.
10. Método de acordo com a reivindicação 1, caracterizado pelo fato de que o método compreende ainda: calcular um vetor de parâmetro de recurso de cada região poligonal quando uma pluralidade de regiões poligonais é gerada, em que o vetor de parâmetro de recurso compreende pelo menos um parâmetro de recurso; classificar a pluralidade de regiões poligonais de acordo com o vetor de parâmetro de recurso de cada região poligonal; e determinar o número predefinido de regiões poligonais classificadas principais como regiões poligonais ideais.
11. Método de acordo com a reivindicação 10, caracterizado pelo fato de que a pluralidade de regiões poligonais de acordo com o vetor de parâmetro de recurso de cada região poligonal compreende: calcular um valor de diferença entre os vetores de parâmetro de recurso das duas regiões poligonais; e determinar uma sequência das duas regiões poligonais de acordo com uma relação de mapeamento entre o valor da diferença e uma função de classificação.
12. Método de acordo com a reivindicação 11, caracterizado pelo fato de que cada parâmetro de recurso corresponde ainda a um coeficiente quando há uma pluralidade de parâmetros de recurso no vetor de parâmetro de recurso.
13. Método de acordo com qualquer uma das reivindicações 10 a 12, caracterizado pelo fato de que os parâmetros de recurso compreendem pelo menos um dos seguintes: um primeiro parâmetro de recurso, denotando uma razão de trabalho total de todos os lados da região poligonal; um segundo parâmetro de recurso, denotando uma soma de razões de um comprimento de projeção de cada lado da região poligonal numa direção principal a um comprimento de imagem na direção principal; um terceiro parâmetro de recurso, denotando um grau de similaridade entre ângulos interiores da região poligonal e ângulos interiores de um polígono regular; ou um quarto parâmetro de recurso, denotando uma divergência KL entre um cinza interno e um cinza externo da região poligonal.
14. Aparelho de detecção de região poligonal, caracterizado pelo fato de que compreende: uma unidade de obtenção, obtendo uma imagem a ser detectada; uma unidade de cálculo, calculando uma pluralidade de segmentos de linha na imagem com base num algoritmo de detecção de linha; uma unidade de mescla, mesclando uma pluralidade de segmentos de linha que satisfazem uma condição de mescla em um segmento de linha; uma unidade de determinação, determinando pontos de cruzamento das linhas de segmento mescladas em pares de acordo com a pluralidade de segmentos de linha mesclados; e uma unidade de geração, gerando uma região poligonal com os pontos de cruzamento como vértices da região poligonal na imagem.
15. Meio de armazenamento legível por computador, caracterizado pelo fato de que armazena um programa de computador e o programa de computador é configurado para implementar o método como definido em qualquer uma das reivindicações1 a 13.
16. Dispositivo eletrônico, caracterizado pelo fato de que compreende: um processador; e uma memória configurada para armazenar uma instrução executável do processador; em que o processador é configurado para realizar o método como definido em qualquer uma das reivindicações 1 a 13.
BR112020010087-0A 2018-02-02 2018-10-24 detecção de região poligonal BR112020010087A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201810108373.9A CN110136156B (zh) 2018-02-02 2018-02-02 一种多边形区域检测方法及装置
CN201810108373.9 2018-02-02
PCT/CN2018/111675 WO2019148902A1 (zh) 2018-02-02 2018-10-24 多边形区域检测

Publications (1)

Publication Number Publication Date
BR112020010087A2 true BR112020010087A2 (pt) 2020-11-03

Family

ID=67479593

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020010087-0A BR112020010087A2 (pt) 2018-02-02 2018-10-24 detecção de região poligonal

Country Status (4)

Country Link
US (1) US11308710B2 (pt)
CN (1) CN110136156B (pt)
BR (1) BR112020010087A2 (pt)
WO (1) WO2019148902A1 (pt)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11087469B2 (en) * 2018-07-12 2021-08-10 Here Global B.V. Method, apparatus, and system for constructing a polyline from line segments
CN110929738A (zh) * 2019-11-19 2020-03-27 上海眼控科技股份有限公司 证卡边缘检测方法、装置、设备及可读存储介质
CN111192324B (zh) * 2019-12-26 2023-05-09 广东星舆科技有限公司 线段交点位置的确定方法、装置及可读存储介质
CN111611726B (zh) * 2020-06-22 2021-03-23 广州极点三维信息科技有限公司 一种室内场景自动布光方法和相关装置
CN112150496B (zh) * 2020-09-24 2023-06-02 平安科技(深圳)有限公司 照片处理方法、装置、电子设备及可读存储介质
CN115885314A (zh) * 2020-10-27 2023-03-31 Oppo广东移动通信有限公司 图像的处理方法、装置、设备以及存储介质
CN112581468B (zh) * 2020-12-29 2023-09-22 二十一世纪空间技术应用股份有限公司 一种面向遥感影像提取信息的处理方法及装置
CN113781846B (zh) * 2021-09-28 2022-12-16 中国人民解放军空军工程大学 一种水平维度空域冲突检测方法
CN116894939B (zh) * 2023-09-11 2024-01-09 深圳精智达技术股份有限公司 一种异形屏的区域定位方法、装置、电子设备和存储介质
CN116993804B (zh) * 2023-09-26 2023-12-05 中国铁路设计集团有限公司 一种基于lsm算法的箍筋尺寸检测方法及系统

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8542207B1 (en) * 2011-09-27 2013-09-24 Cosmin Truta Pencil eraser gesture and gesture recognition method for touch-enabled user interfaces
CN103425984B (zh) * 2013-08-15 2016-09-07 京北方信息技术股份有限公司 一种检测票据中正多边形印章的方法和装置
CN104835133A (zh) * 2014-02-10 2015-08-12 成都理想境界科技有限公司 图像中四边形区域的提取方法
CN104915672B (zh) * 2014-03-13 2018-08-03 北京大学 一种基于高分辨率遥感图像的矩形建筑物提取方法及系统
CN105096299B (zh) * 2014-05-08 2019-02-26 北京大学 多边形检测方法和多边形检测装置
CN106663207A (zh) * 2014-10-29 2017-05-10 微软技术许可有限责任公司 白板和文档图像检测方法和系统
CN105654097B (zh) * 2015-12-29 2019-04-16 上海珍岛信息技术有限公司 图像中四边形标记物的检测方法
US20170206430A1 (en) * 2016-01-19 2017-07-20 Pablo Abad Method and system for object detection
CN105740871A (zh) * 2016-02-01 2016-07-06 福建师范大学 一种利用线段空间关系检测多边行地物的方法
CN106056659B (zh) * 2016-05-27 2018-09-21 山东科技大学 车载激光扫描点云中建筑物角点空间位置自动提取方法
CN106127211A (zh) * 2016-06-22 2016-11-16 北京小米移动软件有限公司 白板检测方法和装置
CN106570507B (zh) * 2016-10-26 2019-12-27 北京航空航天大学 单目视频场景三维结构的多视角一致的平面检测解析方法
CN106548479B (zh) * 2016-12-06 2019-01-18 武汉大学 一种多层次激光点云建筑物边界规则化方法

Also Published As

Publication number Publication date
CN110136156B (zh) 2020-12-01
WO2019148902A1 (zh) 2019-08-08
CN110136156A (zh) 2019-08-16
US20200356800A1 (en) 2020-11-12
US11308710B2 (en) 2022-04-19

Similar Documents

Publication Publication Date Title
BR112020010087A2 (pt) detecção de região poligonal
TWI554824B (zh) 用於熱點偵測之電腦實施方法及非暫時性電腦可讀媒體
Brazil et al. Optimal interconnection trees in the plane
Liang et al. Video supervoxels using partially absorbing random walks
US9305396B2 (en) Identifying features in polygonal meshes
CN105654548A (zh) 一种基于大规模无序图像的多起点增量式三维重建方法
KR20160075738A (ko) 얼굴 인식 시스템 및 방법
US11205024B2 (en) Techniques for measuring productive congestion within an architectural space
BR102015004240A2 (pt) aparelho de processamento de imagem e método para controlar o mesmo
JP2023065515A (ja) 勾配方向ヒストグラムの演算のためのハードウェアアクセレレータ
Brauer-Burchardt et al. Robust vanishing point determination in noisy images
CN112597662B (zh) 一种建筑模型正误校验方法和系统
Hossain et al. Monotone grid drawings of planar graphs
Jerripothula et al. QCCE: Quality constrained co-saliency estimation for common object detection
US20170124431A1 (en) Method and apparatus for rendering target fluid
US20180150584A1 (en) Placement clustering-based white space reservation
Couch et al. Computing space-filling curves
Szymczak Stable Morse decompositions for piecewise constant vector fields on surfaces
Bouts et al. Clustered edge routing
US9922444B2 (en) Image processing apparatus and method
CN112733624B (zh) 室内密集场景的人流密度检测方法、系统存储介质及终端
Wang et al. Real-time recognition of transmission line insulators under complex backgrounds: A YOLOV5s approach
JP2020165920A (ja) 飛跡検出装置、飛跡検出方法、及び飛跡検出プログラム
US20170371996A1 (en) Sharing global route topologies in detailed routing
Ochmann et al. Automatic normal orientation in point clouds of building interiors

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 5A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2745 DE 15-08-2023 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.