BR112021011247A2 - Aumento de dados para sistemas e métodos de interpretação sísmica - Google Patents

Aumento de dados para sistemas e métodos de interpretação sísmica Download PDF

Info

Publication number
BR112021011247A2
BR112021011247A2 BR112021011247-2A BR112021011247A BR112021011247A2 BR 112021011247 A2 BR112021011247 A2 BR 112021011247A2 BR 112021011247 A BR112021011247 A BR 112021011247A BR 112021011247 A2 BR112021011247 A2 BR 112021011247A2
Authority
BR
Brazil
Prior art keywords
data
transformation
training
seismic
geophysical
Prior art date
Application number
BR112021011247-2A
Other languages
English (en)
Inventor
Wei D. LIU
Huseyin Denli
Kuang-Hung Liu
Cody J. Macdonald
Original Assignee
Exxonmobil Upstream Research Company
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Exxonmobil Upstream Research Company filed Critical Exxonmobil Upstream Research Company
Publication of BR112021011247A2 publication Critical patent/BR112021011247A2/pt

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/28Processing seismic data, e.g. for interpretation or for event detection
    • G01V1/32Transforming one recording into another or one representation into another
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/28Processing seismic data, e.g. for interpretation or for event detection
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/28Processing seismic data, e.g. for interpretation or for event detection
    • G01V1/30Analysis
    • G01V1/303Analysis for determining velocity profiles or travel times
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/28Processing seismic data, e.g. for interpretation or for event detection
    • G01V1/30Analysis
    • G01V1/306Analysis for determining physical properties of the subsurface, e.g. impedance, porosity or attenuation profiles
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/28Processing seismic data, e.g. for interpretation or for event detection
    • G01V1/34Displaying seismic recordings or visualisation of seismic data or attributes
    • G01V1/345Visualisation of seismic data or attributes, e.g. in 3D cubes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/28Processing seismic data, e.g. for interpretation or for event detection
    • G01V1/36Effecting static or dynamic corrections on records, e.g. correcting spread; Correlating seismic signals; Eliminating effects of unwanted energy
    • G01V1/364Seismic filtering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V20/00Geomodelling in general
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V2210/00Details of seismic processing or analysis
    • G01V2210/60Analysis
    • G01V2210/64Geostructures, e.g. in 3D data cubes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Remote Sensing (AREA)
  • General Physics & Mathematics (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Geophysics (AREA)
  • Acoustics & Sound (AREA)
  • Environmental & Geological Engineering (AREA)
  • Geology (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

aumento de dados para sistemas e métodos de interpretação sísmica. um método e aparelho para aprendizado de máquina para uso com interpretação sísmica automatizada incluem: obter dados de entrada; extrair patches de um conjunto de dados de pré-extração com base nos dados de entrada; transformar dados de um conjunto de dados de pré-transformação com base nos dados de entrada e conhecimento de domínio geológico e / ou conhecimento de domínio geofísico; e gerar dados aumentados a partir dos patches extraídos e dos dados transformados. um método e aparelho para aprendizado de máquina para uso com interpretação sísmica automatizada incluem: um módulo de entrada de dados configurado para obter dados de entrada; um módulo de extração de patch configurado para extrair patches de um conjunto de dados de pré-extração que é baseado nos dados de entrada; um módulo de transformação de dados configurado para transformar dados de um conjunto de dados de pré-transformação que é baseado nos dados de entrada e conhecimento de domínio geológico e / ou conhecimento de domínio geofísico; e um módulo de aumento de dados configurado para aumentar os dados dos patches extraídos e os dados transformados.

Description

“AUMENTO DE DADOS PARA SISTEMAS E MÉTODOS DE INTERPRETAÇÃO SÍSMICA” REFERÊNCIA CRUZADA A PEDIDOS S RELACIONADOS
[0001] Este pedido reivindica o benefício do Pedido Provisório dos EUA 62/826095, depositado em 29 de março de 2019, intitulado “Data Augmentation for Seismic Interpretation Systems and Methods", e do Pedido Provisório dos EUA 62/777941, depositado em 11 de dezembro de 2018, intitulado “Automated Seismic Interpretation-Guided Inversion”, cuja totalidade dos quais é aqui incorporada por referência.
CAMPO
[0002] Esta divulgação se refere geralmente ao campo da prospecção geofísica e, mais particularmente, à prospecção sísmica para gerenciamento de hidrocarbonetos e processamento de dados relacionados. Especificamente, modalidades exemplares se referem a métodos e aparelhos para melhorar a eficiência computacional usando aumento de dados para melhorar sistemas e métodos de interpretação sísmica.
ANTECEDENTES
[0003] Esta seção se destina a apresentar vários aspectos da técnica, que podem ser associados a modalidades exemplares da presente divulgação. Acredita-se que esta discussão auxilie no fornecimento de uma estrutura para facilitar uma melhor compreensão de aspectos particulares da presente divulgação. Consequentemente, deve ser entendido que esta seção deve ser lida sob esta luz, e não necessariamente como admissões do estado da técnica.
[0004] Um objetivo importante da prospecção de hidrocarbonetos é modelar com precisão as estruturas geológicas do subsolo. Por exemplo, os dados sísmicos podem ser coletados e processados para gerar modelos de subsuperfície que revelam a estrutura geológica. A prospecção sísmica é facilitada pela aquisição de dados sísmicos brutos durante a realização de uma pesquisa sísmica. Durante uma pesquisa sísmica, uma ou mais fontes sísmicas geram energia sísmica (por exemplo, uma explosão controlada ou “tiro”) que é lançada na terra. As ondas sísmicas são refletidas de estruturas de subsuperfície e são recebidas por uma série de sensores sísmicos ou “receptores” (por exemplo, geofones). Os dados sísmicos recebidos pelos sensores sísmicos são processados em um esforço para criar um mapeamento preciso (incluindo imagens de mapas, como imagens 2-D ou 3-D apresentadas em uma tela) da região do subsolo. Os dados processados são então examinados (por exemplo, análise de imagens do mapeamento) com o objetivo de identificar estruturas de subsuperfície que podem conter hidrocarbonetos.
[0005] Os dados geofísicos (por exemplo, dados sísmicos adquiridos, dados de vigilância do reservatório, etc.) podem ser analisados para desenvolver modelos de subsuperfície. Por exemplo, um ou mais procedimentos de inversão podem ser utilizados para analisar os dados geofísicos e produzir modelos de propriedades de rocha e/ou propriedades de fluido. Geralmente, a inversão é um procedimento que encontra um modelo de parâmetro geofísico (por exemplo, um modelo de velocidade, em que cada unidade ou célula dentro do modelo tem um valor que indica a velocidade com a qual as ondas sísmicas viajariam através de uma porção da subsuperfície correspondente a essa célula), ou uma coleção de modelos, que, por meio da simulação de alguma resposta física a esses parâmetros, pode reproduzir até um determinado grau de fidelidade um conjunto de dados medidos. A inversão pode ser realizada, por exemplo, em dados sísmicos para derivar um modelo da distribuição de velocidades de ondas elásticas dentro da subsuperfície da terra. Por exemplo, Full Wavefield Inversion (FWI) simula ondas sísmicas induzidas no campo e tenta corresponder à resposta sísmica medida. FWI tende a ser um problema computacional muito desafiador porque a quantidade de dados a serem simulados é grande (compreendendo uma aquisição sísmica tridimensional completa de uma região subsuperficial) e as ondas sísmicas simuladas são sensíveis não apenas a um grande volume da Terra, mas para variações de escala relativamente fina nas propriedades dentro daquele volume. Portanto, a parametrização ingênua (naive) de um modelo de subsuperfície (por exemplo, por discretização uniforme) pode exigir muitos elementos de volume (voxels) de velocidades elásticas uniformes para combinar os dados simulados com os dados sísmicos observados.
[0006] A interpretação sísmica busca inferir geologia (por exemplo, estruturas de subsuperfície) de dados geofísicos, de preferência e frequentemente uma vez que os dados foram invertidos ou de outra forma transformados em um modelo de subsuperfície (por exemplo, os modelos de velocidade ou propriedades físicas observados acima, que, como também observado, podem levar a forma de uma imagem da subsuperfície). Por exemplo, a interpretação estrutural geralmente envolve a interpretação de horizontes de subsuperfície, geocorpos (por exemplo, anomalia de sal) e/ou falhas de modelos de subsuperfície (incluindo, por exemplo, imagens sísmicas). A interpretação estrutural é atualmente um processo trabalhoso que normalmente leva meses do tempo dos intérpretes. Como tal, a interpretação estrutural é um dos principais gargalos no fluxo de trabalho de interpretação.
[0007] A interpretação sísmica automatizada (ASI) em geral, e mais especificamente a interpretação sísmica aumentada por máquina (MASI), podem potencialmente aliviar esses gargalos. Por exemplo, o ASI pode utilizar um sistema de aprendizado de máquina (ML) com dados de treinamento, como dados que representam um amplo conjunto de ambientes geofísicos e geológicos. O sistema de ML pode gerar modelos treinados com base nos dados de treinamento. O sistema de ML pode então aplicar os modelos treinados para gerar uma interpretação sísmica de um conjunto de dados de teste e/ou inferir características geológicas a partir dele.
[0008] Uma suposição fundamental de um modelo de ML é que os dados de treinamento e os dados de teste são da mesma distribuição estatística. No entanto, muitas características de treinamento sísmico e conjuntos de dados de teste podem ser diferentes devido às disparidades nas técnicas de aquisição e processamento sísmicas usadas para produzir as imagens, disparidades no ruído (por exemplo, múltiplos ou ruído de ondulação) e/ou disparidades nas configurações geológicas. Por exemplo, a qualidade das imagens sísmicas pode ser afetada por fatores de aquisição sísmica, como tipos de levantamento (por exemplo, cabo do fundo do oceano, streamer ou aquisição nodal em sísmica marinha), cobertura azimutal, espectro de frequência de dados (por exemplo, dados de banda larga versus banda estreita), e/ou taxas de amostragem espaço-temporal. A escolha de métodos de processamento sísmico também pode afetar a fidelidade dos modelos geofísicos, criando várias imprecisões em, por exemplo, modelos de velocidade e imagens. As configurações geológicas podem variar consideravelmente de bacia para bacia (por exemplo, presença de sal levando a estruturas enigmáticas). Quando a diversidade de dados de treinamento é limitada a uma única bacia geológica, um modelo de ML pode ter dificuldade em generalizar para outro conjunto de dados com estruturas geológicas diferentes daquelas retratadas nos dados de treinamento. De acordo com os sistemas e métodos atuais, dado um novo conjunto de dados de aplicativo, um intérprete seleciona manualmente a partir de um conjunto de modelos treinados variadamente (por exemplo, treinados com dados de treinamento diferentes).
[0009] Em uma tarefa de interpretação típica baseada em ML, o modelo de ML é apresentado com exemplos de valores de entrada (por exemplo, imagem sísmica, os modelos geofísicos descritos acima, incluindo modelos de velocidade ou volumes de atributos, como imagens derivadas deles) e valores de saída de destino correspondentes (por exemplo, rótulos de características geológicas, como rótulos de falhas ou sal). Um modelo de ML com parâmetros de modelo desconhecidos é treinado para mapear os valores de entrada para os valores de saída de destino. O objetivo do treinamento é determinar os parâmetros de modelo desconhecidos a partir dos exemplos de treinamento, de modo que o modelo de ML possa prever com precisão um valor de saída quando valores de entrada novos ou não vistos estiverem presentes. A capacidade do modelo de ML de ter um bom desempenho em dados de entrada novos ou não vistos é conhecida como "generalização do modelo" ou simplesmente "generalização". Normalmente, uma quantidade significativa de dados de treinamento está envolvida no treinamento de um modelo de ML que pode generalizar bem, especialmente quando o modelo de ML é baseado em redes neurais, como redes neurais profundas. A falta de uma quantidade suficiente de dados de treinamento pode levar a modelos de ML que apenas memorizam as relações de entrada-saída disponíveis nos dados de treinamento, mas que apresentam desempenho insatisfatório em novos dados de teste. Este problema é conhecido como "overfitting".
[0010] Uma abordagem para resolver os problemas de overfitting é aumentar os dados de treinamento (por exemplo, dimensionamento, translação, rotação e/ou redimensionamento de imagens). No entanto, estratégias de aumento de dados padrão desenvolvidas para aplicativos de processamento de imagem podem produzir amostras alternativas plausíveis limitadas e/ou podem levar a amostras alternativas geológica ou geofisicamente inviáveis ou implausíveis, resultando em treinamentos ineficazes e falta de generalização. Por exemplo, uma maneira de aumentar uma imagem bidimensional usando uma estratégia de aumento de dados padrão é virar a imagem ao longo de um eixo. A imagem espelhada, em teoria, é realizável nas imagens do mundo real, dependendo da localização e orientação das câmeras. No entanto, para aumento de dados geofísicos, uma nova amostra pode não ser geologicamente realizável (por exemplo, volume sísmico de cabeça para baixo).
[0011] Os métodos de aumento de dados padrão também podem ser um gargalo para o treinamento eficiente de modelos de ML para o aprendizado da interpretação sísmica, particularmente quando dados aumentados são gerados em tempo real durante o treinamento. As rotinas de aumento padrão para imagens tridimensionais geralmente levam mais tempo do que o próprio treinamento.
[0012] As abordagens atuais de aumento de imagens tridimensionais são baseadas nas desenvolvidas para imagens bidimensionais e normalmente tratam uma imagem tridimensional como múltiplas fatias bidimensionais independentes empilhadas ao longo de uma terceira dimensão. O processo de aumento extrai fatias bidimensionais de um volume tridimensional e as manipula usando uma técnica de transformação de imagem (por exemplo, rotação, translação, reamostragem e/ou dimensionamento), conforme realizado nos processos de aumento bidimensional padrão, e os empilha em um volume. Como resultado, o aumento tridimensional convencional pode ser considerado como várias etapas de aumentos bidimensionais repetidos para o número de fatias. Esta forma de realizar o aumento pode levar a uma grande quantidade de complexidades e custos computacionais.
[0013] A escolha do aumento de dados pode ser determinada pela natureza do aplicativo de ML e/ou tipo de dados de treinamento. As estratégias de aumento padrão podem não levar a amostras geofisicamente ou geologicamente significativas. Por exemplo, os métodos de aumento existentes podem assumir uma representação de dados isotrópica e aumentar os dados de imagem bidimensional ao longo de cada um dos três eixos isotropicamente. Tais métodos de aumento podem ignorar o fato de que imagens sísmicas tridimensionais de diferentes conjuntos de dados podem ser amostradas de forma diferente ao longo do tempo/profundidade e/ou dimensões em linha e linha cruzada (por exemplo, contexto de frequência diferente em profundidade/tempo versus em linha ou direções de linha cruzada). As imagens sísmicas também diferem de outros tipos de conjuntos de dados, pois os recursos podem variar em escala anisotropicamente. Por exemplo, uma falha estreita pode se estender verticalmente por uma grande distância. Assim, ao aumentar uma amostra de uma imagem sísmica, a aplicação de um único fator de escala em todas as direções pode falhar.
[0014] Os algoritmos de ML para processamento e/ou interpretação sísmica podem exigir recursos de computador extensos (por exemplo, grande número de CPUs, GPUs e/ou processadores paralelos, grandes quantidades de memória e/ou espaços de armazenamento). Deve ser apreciado que os tamanhos das imagens sísmicas tridimensionais são frequentemente duas a quatro ordens de magnitude maiores do que os tamanhos de imagens naturais típicos e uma a duas ordens de magnitude maiores do que os tamanhos de imagens médicas. Os métodos de aumento padrão têm dificuldade de escalar para conjuntos de dados grandes e/ou ambientes de computação paralelos.
[0015] Equipamentos e técnicas mais eficientes para gerar modelos de subsuperfície seriam benéficos.
SUMÁRIO
[0016] Uma ou mais modalidades aqui divulgadas se aplicam a sistemas de aumento de dados e métodos para treinar modelos de aprendizado de máquina para aprender efetivamente características geológicas de subsuperfície a partir de conjuntos de dados sísmicos. Uma ou mais modalidades aqui divulgadas podem fornecer generalização de modelo através de conjuntos de dados de treinamento sísmico, conjuntos de dados de validação, conjuntos de dados de teste e/ou conjuntos de dados de inferência, por exemplo, quando os dados de treinamento são escassos para o aprendizado da interpretação sísmica e/ou quando recursos computacionais (por exemplo, CPU, GPU, memória e armazenamento) são limitados. Uma ou mais modalidades aqui divulgadas podem usar diretamente o conhecimento da geofísica e/ou geologia para aumento de dados eficaz ou para automatizar processos de aumento, por exemplo, usando técnicas de adaptação de domínio e/ou uma abordagem de aprendizado de reforço. Uma ou mais modalidades aqui divulgadas podem fornecer abordagens de aumento automatizadas que aprendem a sintetizar novas amostras de dados a partir de dados de treinamento. Uma ou mais modalidades aqui divulgadas podem fornecer novas amostras de dados que representam desafios de interpretação nos conjuntos de dados de teste e/ou conjuntos de dados de inferência.
BREVE DESCRIÇÃO DOS DESENHOS
[0017] De modo que a maneira pela qual as características recitadas da presente divulgação possam ser entendidas em detalhes, uma descrição mais particular da divulgação, resumida brevemente acima, pode ser feita por referência às modalidades, algumas das quais são ilustradas nos desenhos anexos. Deve-se notar, no entanto, que os desenhos anexos ilustram apenas modalidades exemplares e, portanto, não devem ser considerados limitantes do escopo, pois a divulgação pode admitir outras modalidades e aplicações igualmente eficazes.
[0018] A FIG. 1 ilustra um método exemplar de aumento offline para um sistema de aprendizado de máquina (ML).
[0019] A FIG. 2 ilustra um método exemplar de aumento online para um sistema de ML, onde o aumento de dados ocorre após a extração de patch.
[0020] A FIG. 3 ilustra um método exemplar de aumento online para um sistema de ML, onde o aumento de dados ocorre antes da extração de patch.
[0021] A FIG. 4 ilustra um método exemplar de treinamento de um sistema de ML para aprender métodos de aumento e transformações.
[0022] As FIGs. 5A-5B ilustram exemplos de deformação de imagem baseada em geologia para aumento de falha sísmica. A FIG. 5A ilustra um exemplo de deformação de falha aplicada a uma imagem quadriculada e a FIG. 5B ilustra uma deformação de falha aplicada a uma imagem sísmica real.
[0023] As FIGs. 6A-6B ilustram campos de deformação não linear aplicados a imagens sísmicas bidimensionais.
[0024] A FIG. 7 ilustra um diagrama de blocos de um sistema de análise de dados sísmicos no qual o presente avanço tecnológico pode ser incorporado.
DESCRIÇÃO DETALHADA
[0025] Deve ser entendido que a presente divulgação não está limitada a dispositivos ou métodos específicos, que podem, é claro, variar. Também deve ser entendido que a terminologia usada no presente documento tem a finalidade de descrever modalidades particulares apenas e não se destina a ser limitante. Conforme usado no presente documento, as formas singulares "um", "uma" e "o" incluem referentes singulares e plurais, a menos que o conteúdo dite claramente o contrário. Além disso, a palavra “pode” é usada em todo este pedido em um sentido permissivo (ou seja, tendo o potencial para, sendo capaz de), não em um sentido obrigatório (ou seja, deve). O termo "inclui" e suas derivações significam "incluindo, mas não limitado a". O termo "acoplado" significa conectado direta ou indiretamente. A palavra "exemplar" é usada no presente documento para significar "servindo como um exemplo, instância ou ilustração". Qualquer aspecto aqui descrito como "exemplar" não deve ser necessariamente interpretado como preferido ou vantajoso em relação a outros aspectos. O termo "uniforme" significa substancialmente igual para cada subelemento, dentro de uma variação de cerca de ± 10%. O termo “escasso” refere- se a uma distribuição estatística limitada. Quando usado no contexto de conjuntos de dados de treinamento, um conjunto de dados escasso cobre uma parte limitada da distribuição estatística dos conjuntos de dados de teste/inferência. Em outras palavras, um conjunto de dados de treinamento escasso cobre estatisticamente uma porção limitada de cenários plausíveis de todos os casos de interpretação.
[0026] O termo "dados sísmicos", tal como aqui utilizado, significa amplamente quaisquer dados recebidos e/ou registrados como parte do processo de pesquisa sísmica, incluindo deslocamento de partículas, velocidade e/ou aceleração, pressão e/ou rotação, reflexão de onda e/ou dados de refração. "Dados sísmicos" também se destinam a incluir quaisquer dados ou propriedades, incluindo propriedades geofísicas, tais como uma ou mais de: propriedades elásticas (por exemplo, velocidade da onda P e/ou S, impedância P, impedância S, densidade, atenuação, anisotropia e similar); e porosidade, permeabilidade ou semelhante, que o perito ordinariamente versado na técnica no momento desta divulgação reconhecerá pode ser inferida ou de outra forma derivada de tais dados recebidos e/ou registrados como parte do processo de levantamento sísmico. Assim, esta divulgação pode, às vezes, referir-se a "dados sísmicos e/ou dados derivados dos mesmos" ou, de forma equivalente, simplesmente a "dados sísmicos". Ambos os termos se destinam a incluir dados sísmicos medidos/registrados e tais dados derivados, a menos que o contexto indique claramente que apenas um ou outro é pretendido. “Dados sísmicos” também podem incluir dados derivados de conjuntos de dados sísmicos tradicionais (ou seja, acústicos) em conjunto com outros dados geofísicos, incluindo, por exemplo, gravidade mais sísmica; gravidade mais dados eletromagnéticos mais sísmicos, etc. Por exemplo, a inversão conjunta utiliza vários tipos de dados geofísicos.
[0027] Conforme usado no presente documento, construção de modelo geofísico (por exemplo, construção de modelo de velocidade), inversão em geral e, mais especificamente, Full Wavefield Inversion (FWI), referem-se a métodos geofísicos que são usados para estimar propriedades de subsuperfície (como velocidade ou densidade). Os componentes fundamentais da inversão podem ser descritos como segue: usando um modelo inicial de propriedades físicas de subsuperfície, os dados sísmicos sintéticos são gerados resolvendo uma equação de onda (por exemplo, equação de onda acústica ou elástica) usando um esquema numérico (por exemplo, diferença finita, elementos finitos, etc.). Os dados sísmicos sintéticos são comparados com os dados sísmicos de campo e, usando as diferenças entre os dois, o valor de uma função objetivo é calculado. Para minimizar a função objetivo, um modelo de subsuperfície modificado é gerado, o qual é usado para simular um novo conjunto de dados sísmicos sintéticos. Este novo conjunto de dados sísmicos sintéticos é comparado com os dados de campo para recalcular o valor da função objetivo. Um procedimento de otimização de função objetivo é iterado usando o novo modelo atualizado como o modelo inicial para encontrar outra direção de pesquisa, que então será usado para perturbar o modelo a fim de explicar melhor os dados observados. O processo continua até que seja encontrado um modelo atualizado que explique satisfatoriamente os dados observados. Um método de otimização global ou local pode ser usado para minimizar a função objetivo e atualizar o modelo de subsuperfície. Métodos de otimização de função objetivo local adequados incluem, mas não estão limitados a, pesquisa de gradiente, gradientes conjugados, quasi- Newton, Gauss-Newton e método de Newton. Métodos globais adequados incluem, mas não estão limitados a, Monte Carlo ou pesquisa de grade. A inversão também pode se referir à inversão conjunta com vários tipos de dados usados em conjunto.
[0028] Os termos "modelo de velocidade", "modelo de densidade", "modelo geofísico", "modelo de propriedade física" ou outros termos semelhantes, como aqui utilizados, referem-se a uma representação numérica de parâmetros para regiões de subsuperfície. Geralmente, a representação numérica inclui uma matriz de números, normalmente uma matriz 2-D ou 3-D, onde cada número, que pode ser chamado de "parâmetro de modelo", é um valor de velocidade, densidade ou outra propriedade física em uma célula, onde uma região subsuperficial foi conceitualmente dividida em células discretas para fins computacionais. Por exemplo, a distribuição espacial da velocidade pode ser modelada usando unidades de velocidade constante (camadas) através das quais os caminhos dos raios que obedecem à lei de Snell podem ser traçados. Um modelo geológico 3-D (particularmente um modelo representado na forma de imagem) pode ser representado em elementos de volume (voxels), de forma semelhante que uma fotografia (ou modelo geológico 2-D) é representado por elementos de imagem (pixels). Essas representações numéricas podem ser baseadas em forma ou formas funcionais além de, ou no lugar de, representações numéricas baseadas em células ou voxel.
[0029] Conforme usado no presente documento, "gerenciamento de hidrocarbonetos" ou "gerenciamento de hidrocarbonetos" inclui qualquer um ou mais dos seguintes: extração de hidrocarbonetos; produção de hidrocarbonetos (por exemplo, perfuração de um poço e prospecção e/ou produção de hidrocarbonetos usando o poço; e/ou, fazendo com que um poço seja perfurado, por exemplo, para prospecção de hidrocarbonetos); exploração de hidrocarbonetos; identificar potenciais formações contendo hidrocarbonetos; caracterizar formações contendo hidrocarbonetos; identificar locais de poços; determinar taxas de injeção de poço; determinar taxas de extração de poço; identificar a conectividade do reservatório; adquirir, dispor e/ou abandonar recursos de hidrocarbonetos; revisão de decisões anteriores de gestão de hidrocarbonetos; e quaisquer outros atos ou atividades relacionados a hidrocarbonetos, tais atividades ocorrendo normalmente com respeito a uma formação subterrânea. O referido amplamente inclui não apenas os próprios atos (por exemplo, extração, produção, perfuração de um poço, etc.), mas também ou em vez da direção e/ou causa de tais atos (por exemplo, fazendo com que hidrocarbonetos sejam extraídos, fazendo com que os hidrocarbonetos sejam produzidos, provocando a perfuração de um poço, provocando a prospecção de hidrocarbonetos, etc.). A gestão de hidrocarbonetos pode incluir vigilância de reservatório e/ou otimização geofísica. Por exemplo, os dados de vigilância do reservatório podem incluir, taxas de produção de poço (quanta água, óleo ou gás é extraído ao longo do tempo), taxas de injeção de poço (quanta água ou CO 2 é injetado ao longo do tempo), histórico de pressão de poço e tempo dados geofísicos de lapso. Como outro exemplo, a otimização geofísica pode incluir uma variedade de métodos voltados para encontrar um modelo ideal (e/ou uma série de modelos que orbitam o modelo ideal) que seja consistente com dados geofísicos observados/medidos e experiência geológica, processo, expectativas e/ou observação.
[0030] Conforme usado no presente documento, "obter" dados geralmente se refere a qualquer método ou combinação de métodos de aquisição, coleta ou acesso de dados, incluindo, por exemplo, medir ou detectar diretamente uma propriedade física, receber dados transmitidos, selecionar dados de um grupo de dados físicos sensores, identificando dados em um registro de dados e recuperando dados de uma ou mais bibliotecas de dados.
[0031] Conforme usado no presente documento, "em linha" se refere a uma direção paralela ao eixo entre uma fonte e um receptor. “Linha cruzada” refere-se a uma direção perpendicular ao eixo entre uma fonte e um receptor. “Deslocamento” refere-se a uma distância entre uma fonte e um receptor. “Ponto médio” refere-se a uma localização no eixo entre uma fonte e um receptor que está aproximadamente a meio caminho entre a fonte e o receptor.
[0032] Conforme usado no presente documento, uma "coleta" se refere a uma exibição de traços sísmicos que compartilham um parâmetro de aquisição. Por exemplo, uma coleta de ponto médio comum contém traços com um ponto médio comum, enquanto uma coleta de tiro comum contém traços com um tiro comum.
[0033] Conforme usado no presente documento, termos como "contínuo" geralmente se referem a processos que ocorrem repetidamente ao longo do tempo, independentemente de um gatilho externo para instigar repetições subsequentes. Em alguns casos, os processos contínuos podem se repetir em tempo real, com períodos mínimos de inatividade entre as repetições. Em alguns casos, os períodos de inatividade podem ser inerentes ao processo contínuo.
[0034] O termo "patch" geralmente se refere a qualquer conjunto ou subconjunto de dados geofísicos (seja em 1-D, 2-D, 3-D ou 4-D) constituindo um agrupamento de uma ou mais células, pixels, voxels ou outras formas de unidades de divisão (por exemplo, discretização) de tais dados. Em alguns casos, os limites de um patch podem ser segmentados, desgastados, perfurados ou de outra forma sujeitos a concavidades e/ou um patch pode compreender unidades contíguas ou não contíguas. Um patch pode compreender tão pequeno quanto uma única unidade de divisão ou tão grande quanto todo o conjunto de dados.
[0035] O termo “rótulo” geralmente se refere a identificações e/ou avaliações de resultados corretos ou verdadeiros fornecidos para um determinado conjunto de entradas. Os rótulos podem ser de uma variedade de formatos, incluindo rótulos de texto, tags de dados (por exemplo, tags de valor binário), ajustes de atributos de pixel (por exemplo, realce de cor), rótulo de n-tupla (por exemplo, concatenação e/ou matriz de dois ou mais rótulos), etc.
[0036] O termo "tempo real" geralmente se refere ao atraso de tempo resultante da detecção, detecção, coleta, filtragem, amplificação, modulação, processamento e/ou transmissão de dados ou atributos relevantes de um ponto (por exemplo, um local de detecção/detecção de evento) para outro (por exemplo, um local de monitoramento de dados). Em algumas situações, um atraso de tempo desde a detecção de um evento físico até a observância dos dados que representam o evento físico é insignificante ou imperceptível, de modo que o tempo real se aproxima da ação instantânea. O tempo real também pode se referir a atrasos mais longos que ainda são curtos o suficiente para permitir o uso oportuno dos dados para monitorar, controlar, ajustar ou de outra forma impactar as detecções subsequentes de tais eventos físicos.
[0037] O termo “simultâneo” não significa necessariamente que dois ou mais eventos ocorrem precisamente ao mesmo tempo ou exatamente no mesmo período de tempo. Em vez disso, tal como aqui utilizado, "simultâneo" significa que os dois ou mais eventos ocorrem próximo no tempo ou durante períodos de tempo sobrepostos. Por exemplo, os dois ou mais eventos podem ser separados por um curto intervalo de tempo que é pequeno em comparação com a duração da operação geral. Como outro exemplo, os dois ou mais eventos podem ocorrer durante períodos de tempo que se sobrepõem em cerca de 40% a cerca de 100% de qualquer período.
[0038] Os modelos de aprendizado de máquina (ML) discutidos no presente documento podem incluir uma ou mais redes neurais. Essas redes podem ser treinadas com exemplos nos quais os rótulos (por exemplo, avaliações de resultados) são fornecidos para um determinado conjunto de entradas. Em algumas modalidades, o treinamento inclui um processo de otimização pelo qual os parâmetros da rede (por exemplo, peso dos filtros usados em cada camada de rede) são determinados. A otimização pode procurar minimizar, ou pelo menos reduzir, uma função objetivo representativa do erro entre a previsão de rede e os valores de rótulo.
[0039] Se houver qualquer conflito no uso de uma palavra ou termo neste relatório descritivo e uma ou mais patentes ou outros documentos que possam ser incorporados aqui por referência, as definições que são consistentes com este relatório descritivo devem ser adotadas para fins de compreensão desta divulgação.
[0040] Uma das muitas vantagens potenciais das modalidades da presente divulgação é que modelos de aprendizado de máquina (ML) para Interpretação Sísmica Automatizada (ASI) podem ser treinados para aprender com eficiência padrões sísmicos, segmentos e/ou estruturas geológicas, indicadores diretos de hidrocarbonetos, reservatório e/ou delineamentos de contato de fluido. Outras vantagens potenciais incluem um ou mais dos seguintes, entre outros que serão evidentes para o versado na técnica com o benefício desta divulgação: geração de conjuntos plausíveis de dados aumentados para imagens sísmicas; um modelo generativo que aprende a aumentar imagens sísmicas e/ou anotações para treinar modelos de ML para reconhecer características geológicas de imagens sísmicas e/ou imagens de atributos (por exemplo, imagem de variação sísmica); melhor generalização de modelo (incluindo mais eficiente computacionalmente) em todo o treinamento, validação, teste e inferência com conjuntos de dados sísmicos, por exemplo, ampliando os dados de treinamento sísmico, especialmente em ambientes de computação com recursos limitados (CPU, GPU, memória e/ou armazenamento). Ao contrário dos métodos convencionais de aumento de dados, os métodos de aumento de dados geofísicos divulgados no presente documento podem fornecer amostras geologicamente realizáveis. Tais estratégias de aumento de dados para aprender tarefas de interpretação sísmica podem ser determinadas considerando variedades plausíveis na aquisição sísmica, técnicas de processamento usadas para produzir as imagens, ruído e/ou configurações geológicas. As modalidades da presente divulgação podem, assim, ser úteis no gerenciamento de hidrocarbonetos, incluindo na prospecção, descoberta e/ou extração de hidrocarbonetos de formações subterrâneas.
[0041] As modalidades divulgadas no presente documento propõem sistemas de aumento de dados e métodos projetados para alcançar uma melhor generalização de modelo em treinamento, validação, teste e inferência com conjuntos de dados geofísicos (por exemplo, conjuntos de dados sísmicos, conjuntos de dados eletromagnéticos, conjuntos de dados de gravidade, imagens sísmicas 4-D (lapso de tempo), imagens eletromagnéticas, imagens de polarização induzida, imagens de gravidade e combinações e/ou seus derivados). Por exemplo, sistemas e métodos de aumento podem usar diretamente o conhecimento da geofísica e/ou geologia para aumento de dados eficaz ou para automatizar processos de aumento usando técnicas de adaptação de domínio e/ou abordagens de aprendizagem de reforço. Em algumas modalidades, amostras alternativas geológica e geofisicamente viáveis podem ser baseadas em características em comum nos conjuntos de dados de teste e treinamento sísmico. Em algumas modalidades, mais recursos abstratos dos conjuntos de dados podem ser mais propensos a serem compartilhados entre os conjuntos de dados obtidos a partir de diferentes configurações geológicas e/ou aquisição geofísica diferente e/ou métodos de processamento. Em algumas modalidades, o ASI pode utilizar sistemas e métodos de aumento de dados sísmicos para melhorar os dados de treinamento, eficiência de treinamento de ML e/ou precisão de inferência de ML. Por exemplo, sistemas e métodos ASI podem ser usados para treinar modelos de ML para aprender e/ou inferir recursos de subsuperfície para um ou mais cenários geológicos a partir de imagens sísmicas. Os sistemas e métodos ASI adequados são descritos adicionalmente a seguir, e também são descritos no pedido co-pendente US Ser. No. 16/059.567 (Publicação US No. 2019/0064378), intitulada “Automated Seismic Interpretation with Fully Convolutional Neural Networks,” que é aqui incorporado por referência.
[0042] As modalidades aqui divulgadas incluem sistemas de aumento de dados e métodos para treinamento de ML. Em algumas modalidades, o aumento de dados pode ser realizado antes do treinamento de ML, referido no presente documento como "aumento off-line". Em algumas modalidades, o aumento de dados pode ser realizado durante o treinamento de ML (por exemplo, em tempo real), referido no presente documento como "aumento online". Em algumas modalidades, a disponibilidade de recursos computacionais (por exemplo, unidades de processamento, armazenamento, memória e/ou rendimento de I/O) pode indicar a aplicabilidade de aumento offline ou aumento online.
AUMENTO OFFLINE
[0043] A FIG. 1 ilustra um método exemplar 100 de aumento offline para um sistema de ML. O método 100 começa com a obtenção de informações de entrada, tais como dados de treinamento (por exemplo, dados sísmicos representativos de um volume de subsuperfície e rótulos correspondentes de características geológicas para o volume de subsuperfície), no bloco 112, e fator (es) de transformação, no bloco 113. As ações dos blocos 112 e 113 podem ocorrer em paralelo, sequencialmente e/ou em qualquer ordem.
[0044] Em algumas modalidades, uma pesquisa sísmica pode ser conduzida para adquirir os dados de treinamento inicial (observando que estas e outras modalidades podem também ou, em vez disso, incluir a obtenção de outros dados geofísicos além ou, ou em vez de, dados sísmicos - como a obtenção de dados eletromagnéticos, elétricos resistividade, medições de gravidade). Nessas e em outras modalidades, modelos de simulação podem ser utilizados para gerar dados de treinamento inicial sintéticos (por exemplo, simulação de computador). Em algumas modalidades, os dados de treinamento inicial podem ser obtidos de uma biblioteca de dados de levantamentos sísmicos anteriores ou simulações de computador anteriores. Em algumas modalidades, a obtenção de dados de treinamento inclui o processamento de dados adquiridos e/ou dados simulados (por exemplo, geração de imagens, identificação e/ou rotulagem de recursos, anotação manual e/ou automática de elementos de dados). Em algumas modalidades, uma combinação de quaisquer dois ou mais desses métodos pode ser utilizada para gerar os dados de treinamento inicial. Em algumas modalidades, o (s) fator (es) de transformação podem ser obtidos selecionando a partir de intervalos (por exemplo, predefinidos e/ou calculados comparando os dados de treinamento (obtidos no bloco 112) e os dados de teste esperados (por exemplo, dados de teste a serem usados com o ML sistema após o treinamento)).
[0045] A obtenção de fatores de transformação pode incluir, por exemplo, gerar fatores de transformação (como rotações de ângulo, seleções de frequência, fatores de escala (fatores para alongamento ou compressão de imagem ou elementos de uma imagem) e semelhantes). Fatores de transformação podem ser gerados aleatoriamente e/ou em intervalos regulares ou semirregulares.
Em modalidades alternativas, os fatores de transformação podem ser atualizados automaticamente como parte de um processo de aprendizado de máquina, particularmente um processo de aprendizado por reforço.
Por exemplo, os fatores de transformação podem ser inicializados com um valor padrão, uma estimativa e/ou uma estimativa informada e, em seguida, os fatores de transformação podem ser atualizados iterativamente para determinar um conjunto ideal de fatores de transformação (por exemplo, como novo treinamento de entrada ou outro os dados são fornecidos a um sistema de ML com um modelo que compreende tais fatores de transformação e o modelo de saída do modelo de ML fornece previsões ou outros resultados, os fatores de transformação do modelo também são atualizados iterativamente com a emissão de resultados). Em modalidades particulares, o (s) fator (es) de transformação podem ser determinados com base, pelo menos em parte, no conhecimento do domínio geológico e/ou geofísico.
Isso pode incluir a determinação de faixas para fatores de transformação adequados (por exemplo, uma faixa dentro da qual um fator de transformação gerado aleatoriamente deve cair; ou um conjunto de regras para geração de fatores de transformação). Por exemplo, o conhecimento geológico pode indicar que não seria realista girar um patch contendo uma característica de falha em mais de 30 graus (ou em alguns casos em mais de, por exemplo, 33, 35, 37 ou 40 graus; e/ou em outros casos por mais de 22, 25 ou 28 graus), uma vez que as características da falha são geralmente de inclinação acentuada.
Por conseguinte, um fator de transformação gerado aleatoriamente que corresponde a um ângulo de rotação pode ser gerado aleatoriamente ou semi aleatoriamente, mas restringido pelo parâmetro de que o ângulo de rotação gerado deve estar entre 1 e, por exemplo, 20, 22, 25, 28, 30, 33, 35, 37 ou 40 graus.
Da mesma forma, também pode ser irrealista inverter um patch (ou outro conjunto de dados correspondente a uma imagem de dados sísmicos ou parte de tal conjunto de dados) ao longo de um eixo vertical para a maioria, senão todas, as características geológicas de interesse.
Assim, qualquer fator de transformação que é gerado e que corresponde à inversão pode ser restringido pela regra de que tal fator de inversão gerado não pode incluir inversão em torno do eixo vertical (embora tal fator de inversão possa ser gerado aleatoriamente).
[0046] Como outro exemplo, o conhecimento do domínio geofísico pode indicar que as transformações da grade espacial de um patch (ou outro conjunto de dados correspondente a uma imagem de dados sísmicos, ou parte de tal conjunto de dados) deve resultar apenas em intervalos laterais que são comuns aos conjuntos de dados que existem em um base de dados. Um exemplo de uma faixa comum que existe em imagens sísmicas abrange de 6,25 ma 25 m. Limitar os fatores de transformação a intervalos razoáveis para a maioria dos dados permitirá que os esquemas de aprendizagem convirjam a uma taxa razoável, ao mesmo tempo que permite uma ampla generalização para a maioria dos dados invisíveis. Por exemplo, de acordo com algumas modalidades, a transformação da grade espacial de um fragmento pode ser limitada de modo que a transformação resulte em intervalos laterais da grade espacial dentro de uma faixa aceitável determinada por referência ao conhecimento geológico e/ou geofísico (por exemplo, 6,25 m a 25 m, 5 m a 30 m, 7 m a 20 m, com intervalos de qualquer um dos mínimos anteriores a qualquer um dos altos anteriores também contemplados em várias modalidades).
[0047] Como outro exemplo, o conhecimento de domínio geofísico pode incluir fatores de transformação de largura de banda de frequência limitados ao que é comum na maioria dos conjuntos de dados. Para muitas imagens sísmicas, a largura de banda fica entre 4 Hz e 100 Hz (embora outras faixas possam ser aplicáveis, como entre 3 Hz e 110 Hz, 2 Hz e 120 Hz, ou 5 Hz e 90 Hz, com faixas de qualquer uma das baixas anteriores para qualquer uma das altas anteriores também contempladas em várias modalidades), embora deva ser reconhecido que limitações de frequência específicas não são necessárias para a prática de muitas modalidades da presente divulgação. De forma mais geral, o conteúdo de frequência dos conjuntos de dados pode ser avaliado usando transformações de Fourier em janelas para ajudar a determinar se esse intervalo deve ser atualizado. As transformações podem incluir filtragem baseada em wavelet, que utiliza fatores de transformação como frequências centrais, frequências de ponto de canto e taxas de decaimento dessas frequências de ponto de canto, filtros de frequência comuns (Butterworth, Hann, Ormsby, etc.) e filtros de modelagem, que são projetados para combinar um conjunto de dados de entrada com outro espectro de frequência.
[0048] O método 100 continua no bloco 170, onde um ou mais patches são extraídos dos dados de treinamento. Por exemplo, um patch 3-D (por exemplo, 100 pixels x 100 pixels x 100 pixels) pode ser extraído de um volume (por exemplo, 1000 pixels x 1000 pixels x 1000 pixels) representado nos dados de treinamento (incluindo quaisquer dados geofísicos e rótulos de recursos geológicos no mesmo). Em algumas modalidades, como parte da extração do patch 170, o patch 3-D pode ser armazenado, por exemplo, em um disco ou em um armazenamento eletrônico, como um banco de dados. Em algumas modalidades, no bloco 170, o patch 3-D pode ser retido na memória temporária, por exemplo, na memória temporária associada a um processador (por exemplo, cache de CPU ou GPU, RAM ou semelhantes). Em algumas modalidades, os patches podem ser extraídos aleatoriamente do volume de dados. Em algumas modalidades, os patches podem ser extraídos sobrepondo uma janela deslizante para cobrir todo o volume de dados. Em algumas modalidades, os patches podem ser extraídos não simetricamente e/ou não isometricamente em todo o volume. Por exemplo, algumas estratégias de extração podem resolver desequilíbrios de classe. Onde se sabe ou se espera que uma parte do volume de dados tenha poucos recursos significativos (por exemplo, poucos ou nenhum rótulo), os patches podem ser extraídos esparsamente dessa parte e de forma mais robusta em outros locais. As estratégias de extração podem resolver os desequilíbrios de classe devido à natureza das características geológicas de interesse. Por exemplo, a natureza esparsa de planos de falha em imagens sísmicas 3-D pode resultar em tais características geológicas e seus rótulos correspondentes ocupando uma porção relativamente pequena do volume de qualquer imagem sísmica 3-D dada. A amostragem regular potencialmente resultaria em uma grande quantidade de patches sem rótulos correspondentes de falhas, o que pode impactar negativamente o treinamento de um sistema de aprendizado profundo destinado a detectar tais recursos. Em algumas modalidades, uma política de rejeição de amostra pode ser imposta, de modo que a proporção de rótulos geológicos de pixels em qualquer patch deve atender a um determinado critério, caso contrário, o patch é desconsiderado.
[0049] O método 100 continua no bloco 174, onde um ou mais patches extraídos (por exemplo, ambos os dados geofísicos e marcação associada) são transformados. As transformações apropriadas podem incluir operações lineares e não lineares em uma variedade de domínios (por exemplo, espacial, temporal, frequência, etc.). Por exemplo, uma transformação simples pode ser uma transformação de identidade que retorna o patch de entrada. Uma transformação de identidade pode ser desejada para incluir o caráter original dos dados, ou se o patch for aumentado após a extração. As transformações apropriadas podem ser baseadas em um ou mais fatores de transformação obtidos no bloco 113. Em algumas modalidades, tais transformações podem estar de acordo com qualquer uma ou mais das várias estratégias de aumento de ASI descritas posteriormente neste relatório descritivo. Em algumas modalidades, os dados geofísicos e os rótulos de recursos geológicos são transformados no bloco
174.
[0050] Em algumas modalidades, as transformações de patch no bloco 174 podem também ou em vez disso incluir transformação espacial (por exemplo, os patches podem ser espelhados, girados, transladados, reamostrados, dimensionados, elasticamente deformados, não linearmente deformados, manipulados no espectro de frequência, intensidade de pixel alterada, etc.). Por exemplo, o patch 3-D pode ser espelhado ao longo dos eixos x e y (direções em linha e linha cruzada). Como outro exemplo, além ou no lugar do espelhamento, o patch 3-D pode ser girado ao longo dos eixos x, y e z separadamente. A rotação pode ser diferente ao longo do eixo z (vertical) do que ao longo dos eixos x e y. Por exemplo, o patch 3-D pode ser girado entre cerca de ± 20 graus ao longo dos eixos x e y e entre cerca de 0 graus e cerca de 360 graus ao longo do eixo z. Em algumas modalidades, os ângulos de rotação podem ser selecionados em intervalos regulares dentro das faixas de alcance. Como outro exemplo, além de ou em vez do espelhamento e/ou rotações, o patch 3-D pode ser dimensionado ao longo dos eixos x, y e z separadamente. Um fator de escala para cada eixo pode ser escolhido a partir de uma faixa em conjunto ou independentemente, tal como entre cerca de 0,8 e cerca de 1,2. Em algumas modalidades, o (s) fator (es) de escala podem ser calculados comparando imagens de treinamento e teste. Permitir o dimensionamento de forma independente ao longo dos eixos pode ajudar a contabilizar quedas variáveis, relações de aspecto diferentes de certas características geológicas, como sistemas de canais, e taxas de amostragem diferentes em volumes sísmicos.
[0051] Como outro exemplo de transformação de patch no bloco 174, o patch 3-D pode ser amostrado/reamostrado ao longo dos eixos de tempo, por exemplo, de acordo com um fator de reamostragem e/ou com o uso de uma operação de interpolação. Como outro exemplo, a transformação pode incluir formação espectral (por exemplo, de acordo com uma estratégia de normalização de amplitude dependente de frequência). Os sistemas e métodos de modelagem espectral adequados são descritos adicionalmente a seguir, e também são descritos no pedido copendente US Ser. No. 15/941.474 (Publicação US No. 2018/0306940), intitulada "Method for Generating Optimized Seismic Target Spectrum", depositado em 30 de março de 2018, que é aqui incorporado por referência. Como outro exemplo, em conjunto com a rotação e/ou dimensionamento, o patch girado e/ou dimensionado pode ser redimensionado para corresponder ao tamanho original do patch 2-D ou 3- D. Por exemplo, se o patch girado e/ou dimensionado for maior do que o patch original, o patch girado e/ou dimensionado pode ser cortado para corresponder ao tamanho do patch original. Como outro exemplo, se o patch girado e/ou dimensionado for menor do que o patch original, o patch girado e/ou dimensionado pode ser preenchido com zeros para corresponder ao tamanho do patch original. Deve-se observar que o preenchimento com zeros não terá efeito no treinamento ML posterior, porque o valor da função objetivo para a área preenchida com zero é zero. Como outro exemplo, o aumento da grade espacial dos patches pode ser alcançado por interpolação e dizimação. Como outro exemplo, a transformação do patch pode incluir dimensionamento de amplitude. A distribuição de amplitude entre os volumes sísmicos pode ser diferente devido a diferentes fluxos de processamento e/ou a estrutura de impedância da porção da subsuperfície que é gerada por imagem. Devido a essa propriedade, uma escala de amplitude simples, como escala de média zero e variação de unidade, que é comum no pré-processamento de aprendizado profundo, é insuficiente. Para ajudar a generalizar as redes neurais profundas, diferentes estratégias de escala podem ser aplicadas aos patches. Alguns exemplos de estratégias de escala de amplitude podem incluir: alongamento e compressão do contraste até algum quantil da distribuição original do patch, equalização do histograma, equalização adaptativa do histograma, controle automático de ganho, etc.
[0052] Em algumas modalidades, como parte da transformação do patch no bloco 174, o (s) patch (es) transformado (s) podem ser armazenados, por exemplo, em um disco ou em um armazenamento eletrônico, como um banco de dados. Em algumas modalidades, no bloco 174, o (s) patch (es) transformado (s) pode (m) ser retido (s) na memória temporária, por exemplo, na memória temporária associada a um processador (por exemplo, CPU ou cache de GPU, RAM ou semelhantes).
[0053] O método 100 continua no bloco 178, onde o (s) patch (s) transformado (s) é/são armazenados como dados aumentados para uso posterior no treinamento de ML. Por exemplo, o (s) patch (es) transformado (s) podem ser armazenados como dados aumentados em formato padrão em um disco ou em um armazenamento eletrônico, como um banco de dados. Em algumas modalidades, o método 100 continua extraindo iterativamente os patches (no bloco 170), transformando os patches (no bloco 174) e armazenando os patches transformados como dados aumentados (no bloco 178). Em algumas modalidades, no bloco 178, os dados aumentados são armazenados em uma estrutura de dados que promove o acesso eficiente e/ou seletivo aos vários patches transformados durante o treinamento de ML posterior.
[0054] Uma vez que um número suficiente de patches foi extraído, transformado e armazenado como dados aumentados, o método 100 completa e transfere o controle para uma rotina de treinamento de ML posterior no bloco 180. Em algumas modalidades, a suficiência do patch pode ser baseada no espaço de armazenamento de dados disponível. Em algumas modalidades, a suficiência do patch pode ser baseada na estratégia de extração acima mencionada. Deve ser apreciado que,
devido ao grande número de combinações de parâmetros de transformação de imagem possíveis, os dados aumentados sob o método 100 ocupam um espaço de armazenamento de computador muito maior do que os dados de treinamento originais. O método de aumento de dados offline 100 pode permitir um treinamento mais rápido, uma vez que o aumento ocorre antes, em vez de durante, o treinamento. No entanto, a eficiência do método 100 pode ser afetada pela taxa de transferência de I/O do sistema de armazenamento.
[0055] Em algumas modalidades, um sistema de computação distribuído pode ser utilizado para melhorar a eficiência do aumento offline do método 100. Por exemplo, as tarefas de extração do (s) patch (es) no bloco 170 e/ou de armazenamento dos patches no bloco 174 podem ser melhoradas (por exemplo, maior rendimento) com entrada/saída paralela (IO). AUMENTO ONLINE - EXTRAÇÃO PÓS-PATCH
[0056] A FIG. 2 ilustra um método exemplar 200 de aumento online para um sistema de ML, onde o aumento de dados ocorre após a extração do patch (portanto, referido como "extração pós-patch"). O método 200 começa, semelhante ao método 100, com a obtenção de informações de entrada, como dados de treinamento, no bloco 212, e fator (es) de transformação, no bloco 213. Tal como acontece com o método 100, as ações dos blocos 212 e 213 podem ocorrer em paralelo, sequencialmente e/ou em qualquer ordem.
[0057] Tal como acontece com o método 100, o método 200 continua no bloco 270, onde um ou mais patches são extraídos dos dados de treinamento.
[0058] Tal como acontece com o método 100, o método 200 continua no bloco 274, onde um ou mais patches extraídos são transformados.
[0059] Ao contrário do método 100, o método 200 continua no bloco 280, onde o (s) patch (es) transformado (s) são fornecidos (como dados aumentados) para uma rotina de treinamento de ML. Em algumas modalidades, o método 200 continua extraindo iterativamente os patches (no bloco 270), transformando os patches extraídos (no bloco 274) e fornecendo os patches transformados como dados aumentados para o treinamento de ML (no bloco 280).
[0060] O método 200 não armazena permanentemente dados aumentados em um disco ou uma estrutura de armazenamento. Em vez disso, ele gera novos patches a partir de patches existentes (por exemplo, patches extraídos e/ou patches extraídos e transformados) durante o treinamento de ML. Deve ser apreciado que o método 200 é tipicamente intensivo em CPU (mais do que o método 100) devido aos cálculos de transformação de imagem. No entanto, a eficiência de treinamento do método 200 não é afetada pela taxa de transferência de I/O do sistema de armazenamento, porque os dados aumentados residem na memória do processador. Uma vez que o aumento online sob o método 200 pode render muitos (teoricamente um número infinito) de amostras de treinamento, extraindo patch (es) de locais selecionados aleatoriamente dos dados, é improvável que o treinamento de ML no bloco 280 sofra de sobreajuste.
[0061] Em algumas modalidades, um sistema de computação distribuído pode ser utilizado para melhorar a eficiência do aumento online pós-extração do patch do método 200. Por exemplo, as tarefas de transformar o (s) patch (es) no bloco 274 podem ser distribuídas em paralelo usando um cluster de CPUs. Em um cluster de nós com processadores GPU e CPU, um nó principal com GPU pode ser considerado o nó mestre. Como tal, o nó mestre pode ser usado para as tarefas de treinamento de ML do bloco 280. Além disso, vários nós do cluster de nós podem ser considerados nós de trabalho, dedicados às tarefas de transformação de patch do bloco 274. Durante o treinamento de ML, o nó mestre pode carregar a imagem do volume sísmico original e rótulos em sua memória principal (no bloco 212). O nó mestre pode extrair aleatoriamente alguns patches 3-D (no bloco 270). O nó mestre pode colocar os patches em um sistema de fila. Cada um dos patches na fila pode ser despachado para um dos nós de trabalho para realizar a transformação (no bloco 274). Em algumas modalidades, um mecanismo de balanceamento de carga pode decidir qual nó de trabalho é atribuído a qual (is) patch (es). Depois que um nó de trabalho recebe os patches atribuídos, ele executa a rotina de transformação e retorna os dados aumentados para o sistema de enfileiramento do nó mestre. O nó mestre pode então usar os dados aumentados para treinamento de ML. Em algumas modalidades, o método 200 pode ser projetado em um fluxo de trabalho distribuído e assíncrono, de modo que o processo de treinamento de ML no nó mestre não espere por cada transformação dos nós de trabalho para usar os dados de treinamento. AUMENTO ONLINE - EXTRAÇÃO PRÉ-PATCH
[0062] A FIG. 3 ilustra um método exemplar 300 de aumento online para um sistema de ML, onde o aumento de dados ocorre antes da extração de patch (portanto, referido como "extração de pré-patch"). O método 300 começa, semelhante aos métodos 100, 200, com a obtenção de informações de entrada, como dados de treinamento, no bloco 312, e fator (es) de transformação, no bloco 313. Tal como acontece com os métodos 100, 200, as ações dos blocos 312 e 313 podem ocorrer em paralelo, sequencialmente e/ou em qualquer ordem.
[0063] Ao contrário dos métodos 100, 200, o método 300 continua no bloco 375, onde os dados de treinamento são transformados antes da extração do patch. Por exemplo, os dados de treinamento podem ser dados sísmicos e rótulos de recursos geológicos representativos de um volume de subsuperfície. No bloco 375, a totalidade (ou uma grande parte) dos dados de treinamento podem ser transformados. Em algumas modalidades, uma operação de transformação (por exemplo, operação de matriz, operação de kernel) pode ser definida para incluir múltiplas transformações. Por exemplo, uma matriz de transformação pode ser definida para incluir múltiplas transformações geométricas, como espelhamento, rotação, translação, reamostragem, dimensionamento, deformação elástica, deformação não linear, manipulação de espectro de frequência, mudança de intensidade de pixel, etc. A operação de transformação pode ser aplicada aos dados de treinamento para gerar dados aumentados. As transformações (por exemplo, transformações geométricas) podem ser geradas aleatoriamente (por exemplo, geração aleatória de ângulos de rotação e/ou fatores de escala ao longo de um, dois e/ou três eixos da imagem). As transformações podem estar de acordo com as transformações discutidas em conexão com o bloco 174 acima (e da mesma forma, a geração de fatores de transformação pode estar de acordo com a discussão do bloco 113 acima).
[0064] Ao contrário dos métodos 100, 200, o método 300 continua no bloco 370, onde um ou mais patches são extraídos dos dados aumentados (em vez dos dados de treinamento). Por exemplo, um patch 3-D pode ser extraído aleatoriamente do volume de dados sísmicos e rótulos de recursos geológicos.
[0065] Semelhante ao método 200, o método 300 continua no bloco 380, onde os fragmentos de dados aumentados são fornecidos para uma rotina de treinamento de ML. Em algumas modalidades, o método 300 continua extraindo iterativamente os patches dos dados aumentados (no bloco 370) e fornecendo os patches para o treinamento de ML (no bloco 380). Em algumas modalidades, após um certo número de patches serem extraídos (no bloco 370), o método 300 continua definindo iterativamente um novo operador de transformação (por exemplo, matriz) para transformar os dados de treinamento (no bloco 375), extraindo patches (no bloco 370), e fornecer os patches para o treinamento de ML (no bloco 380). Por exemplo, uma nova matriz de transformação pode ser definida por um conjunto de parâmetros de transformação (por exemplo, por amostragem aleatória dentro das faixas de fator de transformação que são consistentes com o conhecimento geológico ou geofísico e/ou geração de fatores de transformação, como geração aleatória de ângulos de rotação e/ou fatores de escala e semelhantes). O número de amostras de patch extraídas antes de definir iterativamente uma nova matriz de transformação pode depender do tamanho do volume dos dados de treinamento. Normalmente, o número de extrações de patch é da ordem de centenas a milhares. Em algumas modalidades, o número de extrações de patch pode ser baseado na probabilidade (por exemplo, maior que 90% de probabilidade, maior que 95% de probabilidade, etc.) de cada parte do volume de treinamento original a ser extraído como um patch de imagem, pelo menos uma vez.
[0066] O aumento de dados online com extração de pré-patch sob o método 300 pode melhorar a eficiência do aumento de dados e do treinamento de ML. Por exemplo, o método 200 (extração pós-patch de aumento) pode ser mais intensivo em CPU do que o método 300 (extração pré-patch de aumento) devido às múltiplas transformações de patch separadas do método 200 para as várias etapas de reamostragem (extrações de patch). O método 300 melhora isso definindo uma única matriz de transformação e apenas transformando o volume uma vez. Por exemplo, em vez de seis operações de reamostragem para rotação e dimensionamento em todas as três dimensões, o método 300 pode envolver apenas uma operação de reamostragem. Além disso, no estágio de treinamento de ML (no bloco 380), o método 300 não utiliza etapas de aumento em cada etapa de extração de patch. Além disso, ao transformar o volume de entrada sísmica original, o método 300 é eficiente para ambientes multi-threading e implementações otimizadas. Por exemplo, múltiplos processadores podem ser utilizados em paralelo para transformação de dados (no bloco 375), extração de patch (no bloco 370) e/ou treinamento de ML (no bloco 380). No entanto, deve ser entendido que o método 300 pode utilizar significativamente mais memória da CPU para reamostrar o volume de entrada original para converter o formato de uma imagem nativa para a estrutura de dados específica da transformação.
AUMENTO DURANTE A INFERÊNCIA
[0067] Com cada um dos métodos 100, 200, 300, o treinamento de ML (nos blocos 180, 280, 380) utiliza conjuntos de dados de treinamento aumentados que ampliam os dados de treinamento originais por um múltiplo relacionado ao número de iterações de transformações (por exemplo, transformações nos blocos 174, 274 e 375). Cada uma dessas várias transformações pode ser aplicada de forma semelhante durante a inferência de dados de teste com o modelo de ML treinado. Por exemplo, um modelo de ML treinado pode ser usado para prever (inferir) padrões geológicos de um conjunto de dados de teste. Um modelo de ML que foi treinado com conjuntos de dados aumentados pode ter uma função objetivo (por exemplo, função de perda, entropia cruzada binária, soma dos valores de perda provenientes de cada conjunto de dados aumentado) que é definida para otimizar os vários conjuntos de dados de treinamento aumentados, em vez de no conjunto de dados de treinamento original. Esse modelo de ML treinado pode ser usado para inferir padrões geológicos de vários conjuntos de dados de teste aumentados. O uso de aumento de dados durante a inferência pode melhorar a precisão da previsão do modelo de ML. Por exemplo, se o método 300 for usado para extração de pré-patch de aumento online de dados de treinamento para treinar um modelo de ML (gerando assim uma série de matrizes de transformação), as mesmas matrizes de transformação podem ser usadas para aumentar os dados de teste durante a inferência com o ML modelo. Vários volumes de predição podem resultar dos vários conjuntos de dados de teste aumentados. Os múltiplos volumes de previsão resultantes podem ser combinados (por exemplo, calculando uma média) para obter um mapa de probabilidade dos padrões geológicos previstos. Dependendo da ponderação entre predições falso-positivas e falso- negativas, os múltiplos volumes de predição resultantes podem ser combinados com uma operação de otimização, operação de maximização e/ou operação de minimização.
[0068] O uso de aumento durante a inferência pode permitir que um sistema de ML que é treinado em dados de um primeiro tipo (por exemplo, de um primeiro tipo de levantamento sísmico) seja usado para inferência com dados de teste de um tipo diferente (por exemplo, de um segundo tipo de levantamento sísmico, diferente do primeiro tipo). Os métodos de aumento podem permitir que o sistema de ML se adapte melhor aos novos dados de teste. Observe que as múltiplas previsões resultantes podem ser aplicadas de maneira semelhante às aplicações de múltiplas previsões de um ou mais intérpretes humanos. Em algumas modalidades, os métodos de aumento podem tornar uma característica sísmica a ser identificada mais aparente (por exemplo, assinaturas sísmicas para detecção de falha podem ser mais fáceis de identificar de uma direção normal ao plano de falha). Em algumas modalidades, os dados de teste podem ser transformados de forma semelhante à transformação dos dados de treinamento (por exemplo, transformações nos blocos 174, 274, 375), então o modelo de ML treinado pode ser aplicado para gerar uma imagem de predição e, em seguida, um inverso do as transformações podem levar a imagem de previsão de volta ao espaço da imagem original.
AUMENTO AUTOMATIZADO
[0069] A discussão acima assume que os métodos de aumento (por exemplo, métodos 100, 200, 300) e/ou as várias transformações (por exemplo, transformações nos blocos 174, 274 e 375) são selecionados manualmente (por exemplo, predefinidos no sistema de ML ou entrada do usuário ao sistema de ML). Em algumas modalidades, o sistema de ML pode ainda aprender a selecionar métodos de aumento e/ou transformações a serem utilizados com conjuntos de dados de treinamento e/ou teste. Por exemplo, o sistema de ML pode utilizar uma abordagem de aprendizado por reforço para aprender métodos de aumento e/ou transformações que são geologicamente plausíveis (por exemplo, recursos de falhas podem girar no máximo 50 graus). A FIG. 4 ilustra um método exemplar 400 de treinamento de um sistema de ML para aprender métodos de aumento e transformações. O método 400 começa com a obtenção de informações de entrada. Por exemplo, dados de entrada (por exemplo, dados sísmicos representativos de um volume de subsuperfície e rótulos correspondentes de características geológicas para o volume de subsuperfície) podem ser obtidos no bloco 414. Como outro exemplo, uma biblioteca de métodos de aumento (por exemplo, métodos 100, 200, 300) e/ou transformações geologicamente plausíveis (por exemplo, transformações nos blocos 174, 274 e 375) pode ser obtida no bloco 415. As ações dos blocos 414 e 415 podem ocorrer em paralelo, sequencialmente e/ou em qualquer ordem. Em algumas modalidades, uma pesquisa sísmica pode ser realizada para adquirir os dados de entrada (observando que estas e outras modalidades podem também ou, em vez disso, incluir a obtenção de outros dados geofísicos além de, ou em vez de, dados sísmicos - como a obtenção de medições de resistividade elétrica). Nessas e em outras modalidades, os modelos podem ser utilizados para gerar dados de treinamento iniciais sintéticos (por exemplo, simulação de computador). Em algumas modalidades, os dados de treinamento inicial podem ser obtidos de uma biblioteca de dados de levantamentos sísmicos anteriores ou simulações de computador anteriores. Em algumas modalidades, uma combinação de quaisquer dois ou mais desses métodos pode ser utilizada para gerar os dados de treinamento inicial.
[0070] O método 400 continua no bloco 486, onde o sistema de ML é treinado de acordo com um ou mais métodos de aumento de dados (por exemplo, métodos 100, 200, 300). Por exemplo, como parte do treinamento de ML no bloco 486, os dados de treinamento (por exemplo, dados de treinamento nos blocos 112, 212 e 312) podem ser obtidos a partir dos dados de entrada (do bloco 414). Em algumas modalidades, os dados de treinamento podem ser uma seleção aleatória dos dados de entrada, a fim de evitar o viés de amostragem de um ponto de vista estatístico. Como parte do treinamento de ML no bloco 486, um conjunto de transformações (por exemplo, transformações nos blocos 174, 274 e 375) pode ser selecionado a partir da biblioteca de métodos de aumento/transformações plausíveis (no bloco 415). As transformações selecionadas podem ser usadas de acordo com um ou mais métodos de aumento de dados para treinar o sistema de ML. O treinamento de ML no bloco 486 resulta em um ou mais modelos de ML treinados.
[0071] O método 400 continua no bloco 490, onde o treinamento de um ou mais modelos de ML treinados (do bloco 486) é validado. Por exemplo, como parte da validação no bloco 490, os dados de validação podem ser obtidos no bloco 494. Os dados de validação podem ser um subconjunto dos dados de entrada (do bloco 414). Observe que os dados de validação podem ser obtidos antes, depois ou simultaneamente com a obtenção dos dados de treinamento. Além disso, observe que os dados de treinamento e os dados de validação, de preferência, são conjuntos de dados substancialmente independentes. Por exemplo, em algumas modalidades, não mais do que 50% dos dados de validação devem ser comuns aos dados de treinamento. A eficiência do método 400 pode melhorar quando o conjunto de dados de validação é totalmente independente do conjunto de dados de treinamento.
[0072] Como parte da validação no bloco 490, um ou mais métodos de aumento e conjunto selecionado de transformações do bloco 486 podem ser obtidos no bloco
495.
[0073] Como parte da validação no bloco 490, as transformações selecionadas podem ser usadas de acordo com um ou mais métodos de aumento de dados para fazer inferências com o sistema de ML sobre os dados de validação (como discutido acima). As inferências de ML no bloco 496 resultam em múltiplos volumes de predição e/ou um mapa de probabilidade.
[0074] Como parte da validação no bloco 490, a qualidade da inferência de ML, conforme representada pelos volumes de predição múltiplos resultantes e/ou mapa de probabilidade, pode ser avaliada no bloco 497. Por exemplo, um ou mais intérpretes podem revisar os volumes de predição e/ou mapa de probabilidade para rotular, classificar, categorizar ou de outra forma identificar a qualidade da inferência de ML (no bloco 496). A avaliação pode então ser utilizada como feedback para atualizar a biblioteca de aumento/transformação. Por exemplo, a biblioteca de aumento/transformação pode incluir uma ou mais políticas sobre a seleção apropriada e/ou aplicação de vários métodos de aumento e/ou transformações. O método 400 pode treinar iterativamente o sistema de ML (no bloco 486) e validar o treinamento ML (no bloco 490) até que os resultados sejam considerados satisfatórios. O método 400 pode, assim, aprender uma política para biblioteca de aumento/transformação que pode ser usada para identificar automaticamente métodos de aumento e/ou transformações para treinar outros sistemas de ML com o conjunto de dados de entrada e/ou para treinar o sistema de ML com outros conjuntos de dados de entrada.
[0075] Em algumas modalidades, uma abordagem de aprendizado de reforço pode ser adotada para aprender a selecionar estratégia de aumento de dados e/ou determinar fatores de transformação ideais. Por exemplo, um agente de aprendizagem por reforço pode receber o estado do treinamento ML, bem como uma recompensa que indica o quão bem o treinamento ML progride. O estado pode incluir os dados de entrada, dados aumentados, resultados de testes (inferências ou previsões), etc. A recompensa pode ser baseada no progresso (a quantidade de redução) associada ao erro de treinamento e/ou erro de validação. O agente de aprendizagem por reforço aprende uma política de seleção de um método de aumento de dados e seus fatores para que o treinamento de ML seja otimizado em termos de minimizar o erro de validação e/ou erro de treinamento. Em uma modalidade, um método de aprendizado de máquina para uso com interpretação sísmica automatizada inclui: obtenção de dados de treinamento; extrair patches de um conjunto de dados de pré-extração com base nos dados de treinamento; transformar dados de um conjunto de dados de pré-transformação com base nos dados de treinamento e pelo menos um de conhecimento de domínio geológico e conhecimento de domínio geofísico; gerar dados aumentados a partir dos patches extraídos e os dados transformados; treinar um sistema de aprendizado de máquina com os dados aumentados; antes de treinar o sistema de aprendizado de máquina, gerar uma série de operações de transformação; e subsequente ao treinamento do sistema de aprendizado de máquina, usar o sistema de aprendizado de máquina com a série de operações de transformação e dados de validação para gerar vários volumes de predição. Em uma modalidade, o método de aprendizado de máquina para uso com interpretação sísmica automatizada também inclui: aprender uma política para determinar fatores de transformação ideais por: obtenção da série de operações de transformação de uma biblioteca; treinar o sistema de aprendizado de máquina usando os dados de treinamento; testar o sistema de aprendizado de máquina treinado com os dados de validação; obter um estado do sistema de aprendizado de máquina treinado compreendendo resultados de treinamento e teste; e obter uma recompensa que mede o desempenho dos resultados do treinamento e dos testes. AUMENTO ASI-ESPECÍFICO
[0076] A escolha do método de aumento de dados pode ser determinada pela natureza da aplicação de ML e pelo tipo de dados de treinamento. Até agora, as estratégias de aumento padrão podem não ter levado a patches aumentados geofisicamente ou geologicamente significativos para aplicações de ML sísmicas. Para fins de ASI, os métodos de aumento de dados podem incorporar conhecimentos de geologia e geofísica para produzir resultados significativos.
[0077] Um tipo de aumento de dados que incorpora conhecimentos de geologia e geofísica é o aumento de frequência/número de onda. Por exemplo, imagens sísmicas podem representar migrações de série temporal de coordenadas de aquisição para coordenadas de subsuperfície. Em tais imagens sísmicas, o eixo de profundidade pode ser representado com um eixo de tempo de viagem equivalente. A resolução de tais imagens sísmicas pode ser determinada pelo conteúdo de frequência/número de onda. Dependendo do levantamento sísmico, das características geológicas da subsuperfície e/ou das técnicas de processamento de dados utilizadas, a resolução das imagens sísmicas pode variar significativamente de uma imagem para outra. A resolução dentro de uma imagem também pode variar com a profundidade devido ao aumento inerente da rapidez das velocidades das ondas com a profundidade. Se essas diferenças de resolução existirem entre as imagens de treinamento e as imagens de teste, o modelo de ML pode ter dificuldade e/ou ser incapaz de generalizar para os dados de teste.
[0078] O conteúdo de frequência/número de onda dos dados de treinamento pode ser aumentado para mitigar a disparidade de resolução entre os conjuntos de dados de treinamento e teste. Por exemplo, o conteúdo de frequência/número de onda dos dados de treinamento pode ser aumentado para cobrir faixas de frequência plausíveis em todos os conjuntos de dados. Uma maneira de obter aumento de frequência/número de onda é aplicar filtros passa-alta, passa-baixa e/ou passa-banda nos volumes de treinamento. Para promover a generalização dos modelos de ML para uma ampla gama de resoluções, vários filtros podem ser aplicados ao mesmo conjunto de dados separadamente para obter vários conjuntos de dados de frequência/número de onda aumentada. Observe que aumentar o conteúdo de frequência/número de onda das imagens sísmicas não aumenta os rótulos correspondentes no volume sísmico.
[0079] Outro tipo de aumento de dados que incorpora conhecimentos de geologia e geofísica é baseado em manipulações de modelos de velocidade para gerar novas imagens sísmicas e estruturas geológicas. As imagens sísmicas são construídas pela migração de coletas de tiros usando modelos geofísicos invertidos (por exemplo, modelo de velocidade). Deve ser apreciado que imprecisões na inversão podem levar à geração de imagens distorcidas e características geológicas. Um conjunto de imagens plausíveis pode ser gerado pela manipulação dos modelos geofísicos e/ou patches de modelos geofísicos. Por exemplo, um modelo de velocidade invertida pode ser suavizado para facilitar a geração de novas imagens sísmicas. Tais métodos de aumento podem ser particularmente úteis quando ASI é incorporado na construção de modelo de inversão e/ou velocidade.
[0080] Outro tipo de aumento de dados que incorpora conhecimentos de geologia e geofísica é o aumento por adaptação de domínio. Por exemplo, diferenças no projeto de levantamento, técnicas de processamento de dados e/ou características geológicas da subsuperfície podem levar a diferenças nas distribuições estatísticas (por exemplo, mudança de domínio na visão computacional) das imagens de treinamento e do teste sísmico. Como as técnicas de ML padrão assumem que os dados de treinamento e os dados de teste são da mesma distribuição, a mudança de domínio pode apresentar dificuldades para generalização por um modelo de ML. O aumento por adaptação de domínio pode mitigar problemas de mudança de domínio. Por exemplo, o aumento por adaptação de domínio pode transformar novos dados de teste para o domínio dos dados de treinamento, de modo que o modelo treinado possa ter um bom desempenho nos dados de teste transformados. O aumento por adaptação de domínio pode ser alcançado de forma automatizada, usando uma rede neural treinada para aprender essas transformações de domínio.
[0081] Em algumas modalidades, o aumento por adaptação de domínio usa dois sistemas de ML (por exemplo, redes neurais): um para a tarefa de segmentação e/ou classificação de ML para um problema de reconhecimento de padrão sísmico e o outro para aprender a (s) transformação (ões) de adaptação de domínio para mapear dados entre domínios. Dividir as tarefas de reconhecimento de padrão das tarefas de transformação de adaptação de domínio pode permitir que os sistemas de ML aprendam mais facilmente de uma forma modular. Em algumas modalidades, o modelo de reconhecimento de padrão ML pode ser treinado de uma forma supervisionada com dados geofísicos de treinamento e rótulos. Em algumas modalidades, o modelo de adaptação de domínio pode ser treinado com uma função de custo definida para minimizar a incompatibilidade entre as distribuições de treinamento e teste de dados geofísicos. Quando um conjunto de dados de teste é fornecido em um domínio diferente daquele que é usado para treinar o modelo, o modelo de adaptação de domínio ML pode ser aplicado primeiro aos novos dados a fim de mapear os dados de teste para o domínio do modelo treinado. Em seguida, um processo de inferência pode ser realizado com o modelo de reconhecimento de padrão ML para produzir previsões.
[0082] Em algumas modalidades, os métodos de transferência de estilo podem ser aproveitados para adaptação de domínio. Por exemplo, o mapeamento do espectro de frequência de dados de origem para dados de destino pode ser aprendido usando um método de transferência de estilo baseado em redes generativas profundas. A rede projetada para transferência de estilo pode ser treinada incorporando conteúdo e estilo à função de perda. A rede tenta manter o conteúdo dos dados originais, ao mesmo tempo que respeita a variante de estilo que está sendo aplicada aos dados.
[0083] Em algumas modalidades, a adaptação de domínio pode ser alcançada usando métodos de tradução de imagem para imagem. Os métodos de tradução de imagem para imagem podem ser baseados em redes gerativas-adversárias profundas (GANs). GANs são modelos generativos que aprendem o mapeamento de um ruído z para uma saída y ,G:z→y , por meio de um processo de treinamento adversarial. Neste processo de treinamento, dois modelos são treinados simultaneamente, um modelo gerador G e um modelo discriminante D que aprende a distinguir uma saída de treinamento de uma saída de G . Por outro lado, o gerador G é treinado para produzir saídas que não podem ser distinguidas das saídas de referência pelo discriminante D. GANs condicionais aprendem um mapeamento de ruído e entrada x fornecendo condições para produzir y,G:〈x,z〉→y . Os GANs condicionais são treinados com os dados de entrada de origem e destino emparelhados. Em métodos de aumento geofísico ou geológico, o treinamento emparelhado e os dados alvo que podem ter as mesmas estruturas podem não estar disponíveis. O aprendizado da tradução de imagem para imagem a partir de amostras desemparelhadas pode ser realizado por GANs consistentes com ciclo. Essa abordagem aprende dois mapeamentos: mapeamento direto de um domínio de origem para o domínio de destino e seu mapeamento inverso de um domínio de destino para o domínio de origem. Os dois mapeamentos podem ser combinados para percorrer a origem e o destino, de volta aos domínios de origem. Outro ciclo seria do destino à origem e de volta aos domínios de destino. Através desses ciclos, um modelo gerador profundo aprende a traduzir uma imagem de um domínio de origem para um domínio de destino na ausência de exemplos emparelhados. Os modelos generativos usados nos GANs podem ser baseados em autoencoders (AE), autoencoders variacionais (VAE) ou arquiteturas U- net que podem aceitar patches de imagem como entradas e saídas de patches de imagem. O modelo discriminador pode ser baseado em uma arquitetura de rede de classificação profunda que pegaria um patch de imagem e produziria um desempenho de medição escalar dos modelos generativos em comparação com os patches de imagem de referência.
[0084] Outro tipo de aumento de dados que incorpora conhecimentos de geologia e geofísica é a deformação de imagens com base na geologia. Por exemplo, devido ao tempo e custo associado à aquisição sísmica, muitas vezes há a falta de amostras de treinamento cobrindo uma ampla gama de padrões geológicos e geofísicos (por exemplo, geologia e sua expressão geofísica onde grandes depósitos de sais estão presentes na subsuperfície). Até agora, os métodos de aumento padrão podem tratar imagens sísmicas de forma semelhante a imagens naturais, perdendo o contexto geológico e geofísico.
[0085] Em algumas modalidades, a deformação de imagem baseada em geologia pode usar uma abordagem de "aumento por síntese", a fim de adicionar padrões geológicos mais diversificados (com conhecimento de domínio) aos dados de treinamento existentes. Por exemplo, as FIGs. 5A-5B ilustram um exemplo de deformação de imagem baseada em geologia para aumento de falha sísmica. A FIG. 5A ilustra uma deformação de falha aplicada a uma imagem quadriculada e a FIG. 5B ilustra uma deformação de falha aplicada a uma imagem sísmica real. Em algumas modalidades, porções significativas dos dados de treinamento sísmico podem não ter superfícies de falha. O método de "aumento por síntese" pode começar pela obtenção de dados de treinamento com poucas ou nenhuma superfície de falha. O método pode então definir um campo de deformação que transforma as imagens sísmicas dos dados de treinamento de acordo com os princípios geofísicos. As imagens sísmicas podem então ser deformadas de forma semelhante à maneira que as superfícies de falha são geradas sob a força física real.
[0086] Em algumas modalidades, o campo de deformação pode ser definido de acordo com as características das falhas nas quais o modelo de ML será treinado. Por exemplo, o campo de deformação pode ser um campo de transformação que translada localmente (transformação de translação), dilata (transformação de dilatação (por exemplo, alongamento de imagem)) e/ou cisalha (transformação de desvio) as imagens sísmicas. Por exemplo, uma transformação de desvio distorce a imagem enquanto mantém seu volume (ou área em 2-D) fixo. O campo de transformação pode ser espacialmente elástico ou inelástico. A FIG. 6 ilustra campos de deformação não linear aplicados em imagens sísmicas bidimensionais. Os campos de transformação são baseados apenas em translações. Os campos de transformação são amostrados aleatoriamente em cada pixel. Essa abordagem pode gerar um número infinito de novas amostras. Por exemplo, para cada uma das três amostras de entrada da FIG. 6A, duas imagens deformadas diferentes são geradas, como ilustrado na FIG. 6B.
[0087] Em algumas modalidades, o método de aumento de deformação de imagem com base em geologia pode combinar a síntese de imagem com a simulação de processos geológicos (por exemplo, falha/não falha, sedimentação). Em algumas modalidades, o aumento de deformação de imagem com base em geologia pode modelar explicitamente o ruído estruturado. Por exemplo, imagens aumentadas podem ter tanto ruído realista quanto padrões de falha.
USO DE MODELOS DE ML TREINADOS POR DADOS DE TREINAMENTO AUMENTADOS
[0088] Qualquer um dos vários métodos de aumento descritos acima resulta preferencialmente na obtenção de um modelo de ML treinado. Esse modelo de ML treinado pode então ser usado na gestão de hidrocarbonetos.
[0089] Por exemplo, métodos de acordo com algumas modalidades podem incluir: (a) aquisição de dados sísmicos ou outros dados geofísicos de uma região de subsuperfície de interesse (por exemplo, através de aquisição sísmica utilizando "tiros" sísmicos para obter "coletas" como é conhecido na técnica); (b) fornecer os dados sísmicos ou outros dados geofísicos adquiridos para o modelo de ML treinado (onde o modelo de ML foi treinado de acordo com qualquer um dos processos de treinamento aumentado descritos acima); e (c) usando o modelo de ML treinado, obter uma interpretação prevista de uma ou mais características geológicas representadas pelos dados sísmicos ou outros dados geofísicos adquiridos. Métodos de acordo com algumas modalidades podem ainda incluir opcionalmente (d) exibir a interpretação prevista (isto pode assumir a forma, por exemplo, de rótulos gerados pelo modelo de ML treinado sendo sobrepostos em uma imagem sísmica da subsuperfície; ou, em outras modalidades, uma listagem de recursos identificados; etc.). Alguns métodos podem incluir, além disso, (e) o gerenciamento de hidrocarbonetos associados à subsuperfície usando a interpretação prevista obtida e/ou a interpretação prevista exibida. O gerenciamento de hidrocarbonetos pode incluir qualquer uma das várias atividades descritas anteriormente no presente documento, como (por exemplo, entre outras) fazer com que um poço seja perfurado na subsuperfície e/ou posicionar um furo de poço na subsuperfície com base, pelo menos em parte, na interpretação prevista obtida e/ou interpretação prevista exibida.
[0090] Em aplicações práticas, o presente avanço tecnológico deve, em muitas modalidades, ser usado em conjunto com um sistema de análise de dados sísmicos (por exemplo, um computador de alta velocidade) programado de acordo com as divulgações no presente documento. De preferência, a fim de realizar de forma eficiente o aumento de dados de acordo com várias modalidades do presente documento, o sistema de análise de dados sísmicos é um computador de alto desempenho (HPC), como conhecido por aqueles versados na técnica. Esses computadores de alto desempenho geralmente envolvem clusters de nós, cada nó com várias CPUs e memória de computador que permite computação paralela. Os modelos podem ser visualizados e editados usando qualquer programa de visualização interativa e hardware associado, como monitores e projetores. A arquitetura do sistema pode variar e pode ser composta por qualquer número de estruturas de hardware adequadas, capazes de executar operações lógicas e exibir a saída de acordo com o presente avanço tecnológico. Os versados na técnica estão cientes dos supercomputadores adequados disponíveis na Cray ou IBM.
[0091] Como será apreciado a partir da discussão acima, em certas modalidades da presente abordagem, as entradas de especialistas são obtidas que terão o maior impacto na eficácia de um algoritmo de aprendizagem empregado na análise, tal como um algoritmo de classificação ou ordenação, e que pode envolvem a obtenção de um julgamento ou avaliação de classificação ou ordem (por exemplo, certo ou errado, bom ou ruim) pelo revisor com relação a uma consulta apresentada. Tais entradas podem ser incorporadas em tempo real na análise de dados sísmicos, seja em uma estrutura de computação distribuída ou não distribuída. Em certas implementações, as consultas para obter tal entrada são geradas com base em um conjunto de dados sísmicos em avaliação automatizada e as consultas são enviadas para uma estação de trabalho para um especialista revisar.
[0092] A FIG. 7 ilustra um diagrama de blocos de um sistema de análise de dados sísmicos 9900 no qual o presente avanço tecnológico pode ser incorporado. Uma unidade de processamento central (CPU) 9902 é acoplada ao barramento de sistema
9904. A CPU 9902 pode ser qualquer CPU de uso geral, embora outros tipos de arquiteturas de CPU 9902 (ou outros componentes do sistema 9900 exemplar) possam ser usados, desde que a CPU 9902 (e outros componentes do sistema 9900) suporte as operações aqui descritas. Aqueles versados na técnica apreciarão que, embora apenas uma única CPU 9902 seja mostrada na FIG. 7, CPUs adicionais podem estar presentes. Além disso, o sistema 9900 pode compreender um sistema de computador multiprocessador em rede que pode incluir um sistema híbrido de CPU/GPU paralelo. A CPU 9902 pode executar as várias instruções lógicas de acordo com vários ensinamentos aqui divulgados. Por exemplo, a CPU 9902 pode executar instruções de nível de máquina para realizar o processamento de acordo com o fluxo operacional descrito.
[0093] O sistema de análise de dados sísmicos 9900 também pode incluir componentes de computador, como mídia legível por computador não transitória. Exemplos de mídia legível por computador incluem uma memória de acesso aleatório (RAM) 9906, que pode ser SRAM, DRAM, SDRAM ou semelhantes. O sistema 9900 também pode incluir mídia legível por computador não transitória adicional, como uma memória somente leitura (ROM) 9908, que pode ser PROM, EPROM, EEPROM ou semelhantes. A RAM 9906 e a ROM 9908 contêm dados e programas do usuário e do sistema, como é conhecido na técnica. O sistema 9900 também pode incluir um adaptador de entrada/saída (I/O) 9910, um adaptador de comunicações 9922, um adaptador de interface de usuário 9924 e um adaptador de exibição 9918; o sistema
9900 também pode incluir potencialmente uma ou mais unidades de processador gráfico (GPUs) 9914 e um ou mais drivers de vídeo 9916.
[0094] O adaptador de I/O 9910 pode conectar mídia legível por computador não transitória adicional, como dispositivo (s) de armazenamento 9912, incluindo, por exemplo, um disco rígido, uma unidade de disco compacto (CD), uma unidade de disquete, uma unidade de fita e semelhantes para o sistema de análise de dados sísmicos 9900. O (s) dispositivo (s) de armazenamento podem ser usados quando a RAM 9906 é insuficiente para os requisitos de memória associados ao armazenamento de dados para operações das técnicas presentes. O armazenamento de dados do sistema 9900 pode ser usado para armazenar informações e/ou outros dados usados ou gerados conforme divulgado no presente documento. Por exemplo, o (s) dispositivo (s) de armazenamento 9912 podem ser usados para armazenar informações de configuração ou plug-ins adicionais de acordo com as presentes técnicas. Além disso, o adaptador de interface de usuário 9924 acopla dispositivos de entrada de usuário, como um teclado 9928, um dispositivo apontador 9926 e/ou dispositivos de saída para o sistema 9900. O adaptador de exibição 9918 é acionado pela CPU 9902 para controlar a exibição em um dispositivo de exibição 9920 para, por exemplo, apresentar informações ao usuário. Por exemplo, o dispositivo de exibição pode ser configurado para exibir representações visuais ou gráficas de qualquer ou todos os modelos e representações de dados aqui discutidos (por exemplo, imagens sísmicas, mapas de probabilidade de recursos, objetos de recursos, rótulos previstos de recursos geológicos em dados sísmicos, etc.). Como os próprios modelos são representações de dados geofísicos, tal dispositivo de exibição também pode ser dito mais genericamente para ser configurado para exibir representações gráficas de um conjunto de dados geofísicos, cujo conjunto de dados geofísicos pode incluir os modelos e representações de dados (incluindo modelos e representações rotulados com recursos previstos por um modelo de ML treinado) discutidos no presente documento, bem como qualquer outro conjunto de dados geofísicos que os versados na técnica reconhecerão e apreciarão com o benefício desta divulgação.
[0095] A arquitetura do sistema de análise de dados sísmicos 9900 pode ser variada conforme desejado. Por exemplo, qualquer dispositivo baseado em processador adequado pode ser usado, incluindo, sem limitação, computadores pessoais, laptops, estações de trabalho de computador e servidores com vários processadores. Além disso, o presente avanço tecnológico pode ser implementado em circuitos integrados de aplicativos específicos (ASICs) ou circuitos integrados de escala muito grande (VLSI). Na verdade, os versados na técnica podem usar qualquer número de estruturas de hardware adequadas, capazes de executar operações lógicas de acordo com o presente avanço tecnológico. O termo "circuito de processamento" abrange um processador de hardware (como aqueles encontrados nos dispositivos de hardware mencionados acima), ASICs e circuitos VLSI. Os dados de entrada para o sistema 9900 podem incluir vários plug-ins e arquivos de biblioteca. Os dados de entrada também podem incluir informações de configuração.
[0096] O sistema de análise de dados sísmicos 9900 pode incluir uma ou mais arquiteturas de aprendizado de máquina, como modelos de aprendizado profundo, redes neurais, redes neurais convolucionais, arquiteturas U-net totalmente convolucionais, etc. As arquiteturas de aprendizado de máquina podem ser treinadas em vários conjuntos de dados de treinamento, por exemplo, conforme descrito em conexão com vários métodos no presente documento. As arquiteturas de aprendizado de máquina podem ser aplicadas à análise e/ou resolução de problemas relacionados a vários conjuntos de dados não analisados (por exemplo, dados de teste, como dados sísmicos adquiridos ou outros dados geofísicos, conforme descrito no presente documento). Deve ser apreciado que as arquiteturas de aprendizado de máquina realizam treinamentos e/ou análises que excedem as capacidades humanas e processos mentais. As arquiteturas de aprendizado de máquina, em muitos casos, funcionam fora de quaisquer rotinas pré-programadas (por exemplo, funcionamento variável dependente de fatores dinâmicos, como tempo de entrada de dados, tempo de processamento de dados, entrada de conjunto de dados ou ordem de processamento e/ou uma semente de número aleatório). Assim, o treinamento e/ou análise realizada por arquiteturas de aprendizado de máquina não é realizada por algoritmos de computador predefinidos e se estende muito além de processos mentais e ideias abstratas.
[0097] As técnicas acima descritas e/ou sistemas que implementam tais técnicas podem ainda incluir gerenciamento de hidrocarbonetos com base, pelo menos em parte, nas técnicas acima. Por exemplo, os métodos de acordo com várias modalidades podem incluir o gerenciamento de hidrocarbonetos com base, pelo menos em parte, em modelos e representações de dados (por exemplo, imagens sísmicas, mapas de probabilidade de características, objetos de características, etc.) construídos de acordo com os métodos descritos acima. Em particular, tais métodos podem incluir a perfuração de um poço e/ou fazer com que um poço seja perfurado, com base, pelo menos em parte, nos modelos e representações de dados aqui discutidos (por exemplo, de modo que o poço esteja localizado com base, pelo menos em parte, em um localização determinada a partir dos modelos e/ou representações de dados, cuja localização pode, opcionalmente, ser informada por outras entradas, dados e/ou análises, também) e prospecção adicional e/ou produção de hidrocarbonetos usando o poço.
[0098] A descrição anterior é direcionada a modalidades exemplares particulares do presente avanço tecnológico. Será evidente, no entanto, para um versado na técnica, que muitas modificações e variações das modalidades aqui descritas são possíveis. Todas essas modificações e variações se destinam a estar dentro do escopo da presente divulgação, conforme definido nas reivindicações anexas.

Claims (15)

REIVINDICAÇÕES
1. Método de aprendizado de máquina para uso com interpretação sísmica automatizada, caracterizado pelo fato de que compreende: obter dados de entrada; obter um ou mais fatores de transformação, em que um ou mais fatores de transformação são baseados, pelo menos em parte, em pelo menos um dentre o conhecimento do domínio geológico e o conhecimento do domínio geofísico extrair patches de um conjunto de dados de pré-extração com base nos dados de entrada; transformar os patches extraídos com base em um ou mais fatores de transformação; e gerar dados aumentados a partir dos patches extraídos e dos dados transformados.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a obtenção de dados de entrada compreende pelo menos um de: (a) conduzir uma pesquisa geofísico de uma região de subsuperfície para adquirir dados sísmicos, em que os dados de entrada compreendem os dados sísmicos; e (b) gerar imagens, exibir as imagens e rotular características geológicas nas imagens, em que os dados de entrada compreendem as imagens rotuladas.
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que os dados de entrada compreendem dados geofísicos e rótulos de recursos geológicos.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que cada patch compreende dados geofísicos e pelo menos alguns dos patches compreendem rótulos de características geológicas.
5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a transformação dos dados compreende uma transformação espacial e os fatores de transformação compreendem fatores de escala.
6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que os fatores de escala compreendem valores diferentes no plano horizontal e no plano vertical.
7. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que compreende ainda treinar um sistema de aprendizado de máquina com os dados aumentados.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que: obter dados de entrada compreende a realização de um levantamento geofísico de uma região de subsuperfície para adquirir dados geofísicos, os dados de entrada compreendem os dados geofísicos, treinar o sistema de aprendizado de máquina resulta em um modelo treinado configurado para gerar interpretações previstas dos dados geofísicos, e o método compreende ainda usar as interpretações previstas para gerenciar hidrocarbonetos na região de subsuperfície.
9. Método, de acordo com a reivindicação 7 ou 8, caracterizado pelo fato de que compreende ainda: antes de treinar o sistema de aprendizado de máquina, gerar uma série de operações de transformação; e subsequente ao treinamento do sistema de aprendizado de máquina, usar o sistema de aprendizado de máquina com a série de operações de transformação e dados de teste para gerar múltiplos volumes de predição.
10. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que a transformação dos dados compreende uma transformação linear e as operações de transformação compreendem matrizes.
11. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que: os dados de entrada compreendem dados de treinamento; os dados de teste incluem dados de validação; os dados de treinamento são substancialmente independentes dos dados de validação; e o método compreende ainda:
obter a série de operações de transformação de uma biblioteca; avaliar a qualidade dos múltiplos volumes de predição; e atualizar a biblioteca com atualizações de políticas com base na avaliação.
12. Método, de acordo com a reivindicação 11, caracterizado pelo fato de que compreende ainda de forma iterativa: obter operações de transformação e políticas associadas da biblioteca; treinar o sistema de aprendizado de máquina com as operações de transformação obtidas e políticas associadas; usar o sistema de aprendizado de máquina com as operações de transformação obtidas, políticas associadas e os dados de validação para gerar múltiplos volumes de predição; avaliar a qualidade dos múltiplos volumes de predição; e atualizar a biblioteca com base na avaliação.
13. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que: os dados de entrada compreendem dados de treinamento; os dados de teste incluem dados de validação; o método compreende ainda aprender uma política para determinar os fatores de transformação ideais por: obter a série de operações de transformação de uma biblioteca; treinar o sistema de aprendizado de máquina usando os dados de treinamento; testar o sistema de aprendizado de máquina treinado com os dados de teste; obter um estado do sistema de aprendizado de máquina treinado compreendendo resultados de treinamento e teste; e obter uma recompensa que mede o desempenho dos resultados do treinamento e do teste.
14. Método, de acordo com qualquer uma das reivindicações 1 a 13, caracterizado pelo fato de que a transformação compreende pelo menos um de:
uma transformação de identidade; um filtro espacial; um filtro temporal; uma escala de amplitude; uma transformação rotacional; uma transformação dilatacional; uma transformação desviante; uma reamostragem usando interpolação ou extrapolação; uma modulação de frequência espacial e temporal; um filtro de modelagem espectral; uma transformação elástica; uma transformação inelástica; e uma transformação do modelo geofísico.
15. Sistema de aprendizado de máquina para uso com interpretação sísmica automatizada, caracterizado pelo fato de que compreende: um módulo de entrada de dados configurado para obter dados de entrada; um módulo de extração de patch configurado para extrair patches de um conjunto de dados de pré-extração que é baseado nos dados de entrada; um módulo de transformação de dados configurado para transformar os patches extraídos usando um ou mais fatores de transformação, em que um ou mais fatores de transformação são baseados, pelo menos em parte, em pelo menos um dentre conhecimento de domínio geológico e conhecimento de domínio geofísico; e um módulo de aumento de dados configurado para aumentar os dados dos patches extraídos e os dados transformados.
BR112021011247-2A 2018-12-11 2019-11-15 Aumento de dados para sistemas e métodos de interpretação sísmica BR112021011247A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862777941P 2018-12-11 2018-12-11
US62/777,941 2018-12-11
US201962826095P 2019-03-29 2019-03-29
US62/826,095 2019-03-29
PCT/US2019/061781 WO2020123098A1 (en) 2018-12-11 2019-11-15 Data augmentation for seismic interpretation systems and methods

Publications (1)

Publication Number Publication Date
BR112021011247A2 true BR112021011247A2 (pt) 2021-09-28

Family

ID=68841222

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021011247-2A BR112021011247A2 (pt) 2018-12-11 2019-11-15 Aumento de dados para sistemas e métodos de interpretação sísmica

Country Status (5)

Country Link
US (1) US11397272B2 (pt)
EP (1) EP3894904B1 (pt)
BR (1) BR112021011247A2 (pt)
CA (1) CA3122684C (pt)
WO (1) WO2020123098A1 (pt)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220283329A1 (en) * 2021-03-05 2022-09-08 Aramco Overseas Company B.V. Method and system for faster seismic imaging using machine learning

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11397272B2 (en) * 2018-12-11 2022-07-26 Exxonmobil Upstream Research Company Data augmentation for seismic interpretation systems and methods
US11507781B2 (en) * 2018-12-17 2022-11-22 Bodygram, Inc. Methods and systems for automatic generation of massive training data sets from 3D models for training deep learning networks
US10997208B2 (en) 2019-02-13 2021-05-04 Sap Se In-memory database-managed container volume replication
US11403320B2 (en) 2019-03-06 2022-08-02 Sap Se Elastic in-memory database provisioning on database-as-a-service
US11422973B2 (en) * 2019-03-06 2022-08-23 Sap Se Peer-to-peer delta image dispatch system
CA3149677A1 (en) * 2019-08-06 2021-02-11 Exxonmobil Upstream Research Company Petrophysical inversion with machine learning-based geologic priors
US11403495B2 (en) * 2019-11-26 2022-08-02 Board Of Regents, The University Of Texas System Using synthetic data sets to train a neural network for three-dimensional seismic fault segmentation
US11366981B1 (en) * 2019-12-03 2022-06-21 Apple Inc. Data augmentation for local feature detector and descriptor learning using appearance transform
US11429812B2 (en) * 2020-01-03 2022-08-30 Mayachitra, Inc. Detecting digital image manipulations
US11734603B2 (en) * 2020-03-26 2023-08-22 Saudi Arabian Oil Company Method and system for enhancing artificial intelligence predictions using well data augmentation
US20230213671A1 (en) * 2020-06-19 2023-07-06 Exxonmobil Upstream Research Company Classifying geologic features in seismic data through image analysis
US11232550B2 (en) * 2020-06-29 2022-01-25 Applied Materials Israel Ltd. Generating a training set usable for examination of a semiconductor specimen
US20220018566A1 (en) * 2020-07-20 2022-01-20 Brain4Energy Inc. Method of safe commissioning and operation of an additional building hvac control system
US11670073B2 (en) 2020-08-25 2023-06-06 Saudi Arabian Oil Company System and method for detection of carbonate core features from core images
US20220084173A1 (en) * 2020-09-17 2022-03-17 Arizona Board of Regents on behalf on Arizona State University Systems, methods, and apparatuses for implementing fixed-point image-to-image translation using improved generative adversarial networks (gans)
US12092783B2 (en) 2020-09-22 2024-09-17 Chevron U.S.A. Inc. Systems and methods for generating subsurface property data as a function of position and time in a subsurface volume of interest
US20220091290A1 (en) * 2020-09-22 2022-03-24 Chevron U.S.A. Inc. Systems and methods for generating elastic property data as a function of position and time in a subsurface volume of interest
US11898435B2 (en) * 2020-09-25 2024-02-13 Halliburton Energy Services, Inc. Correcting borehole images using machine-learning models
US11802984B2 (en) 2020-10-27 2023-10-31 Shell Usa, Inc. Method for identifying subsurface features
CN112364911B (zh) * 2020-11-06 2022-11-11 东北石油大学 电阻率成像的反演方法、装置及存储介质
US20220172101A1 (en) * 2020-11-27 2022-06-02 Amazon Technologies, Inc. Capturing feature attribution in machine learning pipelines
US11887356B2 (en) * 2020-12-03 2024-01-30 Huawei Technologies Co., Ltd. System, method and apparatus for training a machine learning model
US11675100B2 (en) 2020-12-23 2023-06-13 Halliburton Energy Services, Inc. Mitigation of fiber optic cable coupling for distributed acoustic sensing
CN112712003B (zh) * 2020-12-25 2022-07-26 华南理工大学 一种用于骨骼动作序列识别的联合标签数据增强方法
CA3215790A1 (en) 2021-05-06 2022-11-10 Ruichao YE Multi-task neural network for salt model building
CN113514881A (zh) * 2021-06-01 2021-10-19 中国科学技术大学 一种基于二维或三维vsp数据预测速度模型的方法
US11867856B2 (en) 2021-06-03 2024-01-09 Saudi Arabian Oil Company Method and system for reflection-based travel time inversion using segment dynamic image warping
EP4105839A1 (en) * 2021-06-16 2022-12-21 Robert Bosch GmbH Device and method to adapt a pretrained machine learning system to target data that has different distribution than the training data without the necessity of human annotations on target data
US20240264323A1 (en) 2021-06-29 2024-08-08 Shell Usa, Inc. Method for capturing long-range dependencies in seismic images
US12013507B2 (en) 2021-12-20 2024-06-18 Chevron U.S.A. Inc. Increasing resolution of subsurface inversion
WO2023140841A1 (en) * 2022-01-20 2023-07-27 Visa International Service Association System, method, and computer program product for time-based ensemble learning using supervised and unsupervised machine learning models
WO2023168196A1 (en) 2022-03-01 2023-09-07 Shell Usa, Inc. Method for capturing long-range dependencies in geophysical data sets
WO2024100220A1 (en) 2022-11-10 2024-05-16 Shell Internationale Research Maatschappij B.V. Method for predicting fault seal behaviour
CN116821642A (zh) * 2023-06-13 2023-09-29 北京建筑大学 基于数据增广和深度学习的建筑震害快速评估方法及系统
CN117077897B (zh) * 2023-09-21 2024-03-19 四川省华地建设工程有限责任公司 一种地震灾害破坏推演方法及系统

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5251286A (en) 1992-03-16 1993-10-05 Texaco, Inc. Method for estimating formation permeability from wireline logs using neural networks
US5444619A (en) 1993-09-27 1995-08-22 Schlumberger Technology Corporation System and method of predicting reservoir properties
FR2738920B1 (fr) 1995-09-19 1997-11-14 Elf Aquitaine Methode de reconnaissance automatique de facies sismiques
GB9819910D0 (en) 1998-09-11 1998-11-04 Norske Stats Oljeselskap Method of seismic signal processing
US6374185B1 (en) 2000-02-18 2002-04-16 Rdsp I, L.P. Method for generating an estimate of lithological characteristics of a region of the earth's subsurface
US7415401B2 (en) * 2000-08-31 2008-08-19 Exxonmobil Upstream Research Company Method for constructing 3-D geologic models by combining multiple frequency passbands
US6438493B1 (en) 2000-09-29 2002-08-20 Exxonmobil Upstream Research Co. Method for seismic facies interpretation using textural analysis and neural networks
US7203342B2 (en) 2001-03-07 2007-04-10 Schlumberger Technology Corporation Image feature extraction
US6662112B2 (en) 2001-08-31 2003-12-09 Exxonmobil Upstream Research Company Method for classifying AVO data using an interpreter-trained neural network
US7844402B2 (en) 2004-11-24 2010-11-30 Paradigm Geophysical Ltd. System and method for fault identification
US8213261B2 (en) * 2008-05-22 2012-07-03 Exxonmobil Upstream Research Company Method for geophysical and geological interpretation of seismic volumes in the domains of depth, time, and age
RU2540092C2 (ru) 2009-02-18 2015-01-27 Ролик Аг Рельефные микроструктуры поверхности, соответствующие устройства и способ их изготовления
WO2011056347A1 (en) 2009-11-05 2011-05-12 Exxonmobil Upstream Research Company Method for creating a hierarchically layered earth model
AR097365A1 (es) 2013-08-16 2016-03-09 Landmark Graphics Corp Identificación y extracción de capas de fluido y reservorios de fluido en uno o más cuerpos que representan una estructura geológica
US9804282B2 (en) 2014-02-17 2017-10-31 General Electric Company Computer-assisted fault interpretation of seismic data
WO2017188858A1 (en) 2016-04-28 2017-11-02 Schlumberger Canada Limited Reservoir performance system
US10430725B2 (en) 2016-06-15 2019-10-01 Akw Analytics Inc. Petroleum analytics learning machine system with machine learning analytics applications for upstream and midstream oil and gas industry
EP3494284B1 (en) 2016-08-03 2023-11-08 Services Pétroliers Schlumberger Multi-scale deep network for fault detection
WO2018031051A1 (en) 2016-08-08 2018-02-15 Schlumberger Technology Corporation Machine learning training set generation
CA3038714A1 (en) 2016-10-14 2018-04-19 Chevron U.S.A. Inc. System and method for seismic facies identification using machine learning
EP3529639B1 (en) 2016-10-18 2022-03-30 Services Pétroliers Schlumberger Determining subsurface layers using machine learning
US10768325B2 (en) 2016-10-27 2020-09-08 Exxonmobil Upstream Research Company Method to estimate 4D seismic acquisition repeatability specifications from high-resolution near-water-bottom seismic images
EP3535607B1 (en) 2016-11-07 2022-04-20 Services Pétroliers Schlumberger Seismic data processing artificial intelligence
AU2018219304A1 (en) * 2017-02-09 2019-08-29 Geoquest Systems B.V. Geophysical deep learning
US10895654B2 (en) 2017-04-20 2021-01-19 Exxonmobil Upstream Research Company Method for generating optimized seismic target spectrum
BR112020001110B1 (pt) 2017-08-25 2023-10-24 ExxonMobil Technology and Engineering Company Método para interpretar automaticamente uma característica de subsuperfície dentro de dados geofísicos
US10996372B2 (en) * 2017-08-25 2021-05-04 Exxonmobil Upstream Research Company Geophysical inversion with convolutional neural networks
JP2019215475A (ja) 2018-06-14 2019-12-19 スタンレー電気株式会社 表示装置
BR112021011253A2 (pt) * 2018-12-11 2021-08-24 Exxonmobil Upstream Research Company Treinamento de sistemas de aprendizado de máquina para interpretação sísmica
US11397272B2 (en) * 2018-12-11 2022-07-26 Exxonmobil Upstream Research Company Data augmentation for seismic interpretation systems and methods
BR112021011248A2 (pt) * 2018-12-11 2021-08-24 Exxonmobil Upstream Research Company Sistemas automatizados de interpretação sísmica e métodos para aprendizagem contínua e inferência de características geológicas
CN109765615A (zh) * 2019-01-10 2019-05-17 中国石油天然气股份有限公司 一种地层品质因子反演方法及装置
US11403495B2 (en) * 2019-11-26 2022-08-02 Board Of Regents, The University Of Texas System Using synthetic data sets to train a neural network for three-dimensional seismic fault segmentation
GB2592203B (en) * 2020-02-18 2024-03-27 Foster Findlay Ass Ltd A System and method for improved geophysical data interpretation
US11079509B1 (en) * 2021-01-19 2021-08-03 Emerson Paradigm Holding Llc. Building accurate training images for automatic seismic interpretation

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220283329A1 (en) * 2021-03-05 2022-09-08 Aramco Overseas Company B.V. Method and system for faster seismic imaging using machine learning
US12032111B2 (en) * 2021-03-05 2024-07-09 Saudi Arabian Oil Company Method and system for faster seismic imaging using machine learning

Also Published As

Publication number Publication date
CA3122684C (en) 2023-12-19
WO2020123098A1 (en) 2020-06-18
EP3894904B1 (en) 2024-01-17
CA3122684A1 (en) 2020-06-18
EP3894904A1 (en) 2021-10-20
US11397272B2 (en) 2022-07-26
US20200183035A1 (en) 2020-06-11

Similar Documents

Publication Publication Date Title
US11397272B2 (en) Data augmentation for seismic interpretation systems and methods
CA3122685C (en) Automated seismic interpretation systems and methods for continual learning and inference of geological features
US11609352B2 (en) Machine learning-augmented geophysical inversion
US11668853B2 (en) Petrophysical inversion with machine learning-based geologic priors
US11320551B2 (en) Training machine learning systems for seismic interpretation
US11693139B2 (en) Automated seismic interpretation-guided inversion
US10996372B2 (en) Geophysical inversion with convolutional neural networks
BR112021011254A2 (pt) Modelos subsuperficiais com quantificação de incerteza
US20200041692A1 (en) Detecting Fluid Types Using Petrophysical Inversion
US12060781B2 (en) Method for generating initial models for least squares migration using deep neural networks
US12124949B2 (en) Methodology for learning a similarity measure between geophysical objects
US20210374465A1 (en) Methodology for learning a similarity measure between geophysical objects
EP4214551B1 (en) Detection of hydrocarbon presence in subsurface from seismic images using relational learning

Legal Events

Date Code Title Description
B25A Requested transfer of rights approved

Owner name: EXXONMOBIL TECHNOLOGY AND ENGINEERING COMPANY (US)

B06W Patent application suspended after preliminary examination (for patents with searches from other patent authorities) chapter 6.23 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 15/11/2019, OBSERVADAS AS CONDICOES LEGAIS