BR112021014734A2 - Identificação de riscos em ambiente 3d utilizando aprendizagem por reforço - Google Patents

Identificação de riscos em ambiente 3d utilizando aprendizagem por reforço Download PDF

Info

Publication number
BR112021014734A2
BR112021014734A2 BR112021014734-9A BR112021014734A BR112021014734A2 BR 112021014734 A2 BR112021014734 A2 BR 112021014734A2 BR 112021014734 A BR112021014734 A BR 112021014734A BR 112021014734 A2 BR112021014734 A2 BR 112021014734A2
Authority
BR
Brazil
Prior art keywords
agent
environment
fact
dimensional environment
dimensional
Prior art date
Application number
BR112021014734-9A
Other languages
English (en)
Inventor
Bryan John Chasko
Original Assignee
Electronic Caregiver, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronic Caregiver, Inc. filed Critical Electronic Caregiver, Inc.
Publication of BR112021014734A2 publication Critical patent/BR112021014734A2/pt

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/20Instruments for performing navigational calculations
    • G01C21/206Instruments for performing navigational calculations specially adapted for indoor navigation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/38Electronic maps specially adapted for navigation; Updating thereof
    • G01C21/3804Creation or updating of map data
    • G01C21/3833Creation or updating of map data characterised by the source of data
    • G01C21/3837Data obtained from a single source
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/008Artificial life, i.e. computing arrangements simulating life based on physical entities controlled by simulated intelligence so as to replicate intelligent life forms, e.g. based on robots replicating pets or humans in their appearance or behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/38Electronic maps specially adapted for navigation; Updating thereof
    • G01C21/3804Creation or updating of map data
    • G01C21/3807Creation or updating of map data characterised by the type of data
    • G01C21/383Indoor data

Abstract

identificação de riscos em ambiente 3d utilizando aprendizagem por reforço. trata-se de métodos exemplificadores para proporcionar avaliação de um risco de lesão, incluindo implantar um agente em um ambiente, detectar um primeiro objeto em um primeiro estado pelo agente, tomar uma ação para interagir com o primeiro objeto usando aprendizagem por reforço pelo agente, sendo a ação tomada a fim de maximizar uma recompensa, mapear o primeiro objeto a um ambiente tridimensional, e identificar riscos potenciais dentro do ambiente tridimensional. trata-se, também, de sistemas exemplificadores para proporcionar avaliação de um risco de lesão, incluindo um agente comunicativamente acoplado a um dispositivo de captação, uma rede de comunicações comunicativamente acoplada ao agente, um módulo de avaliação de riscos em modelo tridimensional comunicativamente acoplado à rede de comunicações, um dispositivo de usuário comunicativamente acoplado ao módulo de avaliação de riscos em modelo tridimensional, e um sistema para identificar riscos ambientes comunicativamente acoplados à rede de comunicações.

Description

“IDENTIFICAÇÃO DE RISCOS EM AMBIENTE 3D UTILIZANDO APRENDIZAGEM POR REFORÇO”
REFERÊNCIA CRUZADA AOS PEDIDOS RELACIONADOS
[001] O presente pedido reivindica o benefício de prioridade do Pedido de Patente Provisório com Número de Série U.S. 62/801.525 depositado em 5 de fevereiro de 2019, intitulado “3D Environment Risks Identification Utilizing Reinforced Learning,” que se encontra incorporado ao presente documento em sua totalidade a título de referência.
CAMPO DA INVENÇÃO
[002] A presente matéria refere-se à identificação de riscos ambientais. Em particular, mas sem limitação, a presente matéria proporciona sistemas e métodos para identificar riscos ambientes em um ambiente simulado usando aprendizagem de máquina tal como aprendizagem por reforço e aprendizagem profunda.
SUMÁRIO
[003] Proporcionam-se métodos exemplificadores para fornecer avaliação de um risco de lesão, que inclui implantar um agente em um ambiente, detectar um primeiro objeto em um primeiro estado pelo agente, tomar uma ação para interagir com o primeiro objeto usando aprendizagem por reforço pelo agente, a ação tomada a fim de maximizar uma recompensa, mapear o primeiro objeto a um ambiente tridimensional e identificar riscos potenciais dentro do ambiente tridimensional.
[004] Métodos adicionais incluem o agente continuando a tomar outra ação no ambiente para interagir com um segundo objeto usando aprendizagem por reforço pelo agente, a ação tomada a fim de maximizar uma recompensa cumulativa, o agente mapeando o segundo objeto ao ambiente tridimensional e continuando a identificar riscos potenciais dentro do ambiente tridimensional. O agente também pode mapear os locais relativos do primeiro e segundo objetos no ambiente tridimensional e mapear uma trajetória para evitar contato com o primeiro e segundo objetos no ambiente tridimensional.
[005] Métodos exemplificadores podem incluir simular um usuário no ambiente tridimensional e o agente usando aprendizagem por reforço em um processo de construção de simulação pelo movimento e interação através do ambiente para aperfeiçoar o ambiente tridimensional. Um novo ambiente tridimensional pode ser gerado com cada sequência e/ou interação de movimento pelo agente. Ademais, o mapa pode identificar riscos potenciais no ambiente e categorizar os riscos potenciais como risco baixo a ausente ou risco médio a alto.
[006] No presente documento, proporcionam-se, também, sistemas exemplificadores para proporcionar uma avaliação de um risco de lesão, incluindo um agente comunicativamente acoplado a um dispositivo de captação, uma rede de comunicações comunicativamente acoplada ao agente, um módulo de avaliação de riscos em modelo tridimensional comunicativamente acoplado à rede de comunicações, um dispositivo de usuário comunicativamente acoplado ao módulo de avaliação de riscos em modelo tridimensional, e um sistema para identificar riscos ambientais comunicativamente acoplado à rede de comunicações. Sistemas exemplificadores também podem incluir um banco de dados opcional. O agente pode ser configurado para implantar em um ambiente e detectar um primeiro objeto em um primeiro estado e configurado para tomar uma ação para interagir com o primeiro objeto usando aprendizagem por reforço. O agente também pode ser configurado para mapear o primeiro objeto a um ambiente tridimensional e configurado para identificar riscos potenciais dentro do ambiente tridimensional.
BREVE DESCRIÇÃO DOS DESENHOS
[007] Os desenhos anexos, onde referências numéricas similares se referem a elementos idênticos ou funcionalmente similares nas vistas separadas, junto à descrição detalhada abaixo, são incorporados e formam parte do relatório descritivo, e servem para ilustrar adicionalmente as modalidades de conceitos que incluem a revelação reivindicada, e explicam vários princípios e vantagens dessas modalidades.
[008] Os métodos e sistemas revelados no presente documento foram representados, onde apropriado nos desenhos, por símbolos convencionais, mostrando apenas os detalhes específicos que sejam pertinentes para s compreensão das modalidades da presente revelação, com o intuito de não ocultar a revelação com detalhes que serão prontamente aparentes aos técnicos no assunto, tendo o benefício da descrição do presente documento.
[009] A Figura 1 ilustra um diagrama de um sistema exemplificador configurado para proporcionar uma avaliação compreensiva de riscos de lesões em um ambiente 3D, de acordo com várias modalidades exemplificadoras.
[0010] A Figura 2 é uma vista esquemática do processo de simulação implementado para construir o ambiente 3D por um agente que usa Aprendizagem por Reforço (RL).
[0011] A Figura 3 ilustra um método exemplificador para proporcionar uma avaliação compreensiva de riscos de lesões em um ambiente 3D, de acordo com várias modalidades exemplificadoras.
[0012] A Figura 4 ilustra um agente que usa RL no processo de construção de simulação movendo-se através um ambiente.
[0013] A Figura 5 tem os resultados de riscos associados representados no ambiente para riscos baixos a ausentes por sinais de visto (✓) e para riscos médios a altos por sinais de cruz (✗).
[0014] A Figura 6 ilustra uma representação diagramática de uma máquina exemplificadora sob a forma de um sistema computacional no qual um conjunto de instruções para induzir a máquina a realizar qualquer uma ou mais das metodologias discutidas no presente documento é executado.
DESCRIÇÃO DETALHADA
[0015] A descrição detalhada a seguir inclui referências aos desenhos anexos, que formam uma parte da descrição detalhada. Os desenhos mostram ilustrações de acordo com modalidades exemplificadoras. Essas modalidades exemplificadoras, que também são referidas no presente documento como “exemplos,” são descritas em detalhes suficientes para permitir que os técnicos no assunto pratiquem a presente matéria. As modalidades podem ser combinadas, outras modalidades podem ser utilizadas, ou estruturas, lógicas e alterações podem ser feitas sem divergir do escopo do que se reivindica. Portanto, a descrição detalhada a seguir não deve ser tomada em um sentido limitante, e o escopo é definido pelas reivindicações anexas e seus equivalentes.
[0016] As técnicas das modalidades reveladas no presente documento podem ser implementadas usando uma variedade de tecnologias. Por exemplo, os métodos descritos no presente documento podem ser implementados em software executando em um sistema computacional ou em hardware utilizando uma combinação de microprocessadores ou outros circuitos integrados para aplicação específica especialmente projetados, dispositivos lógicos programáveis, ou várias combinações dos mesmos. Em particular, os métodos descritos no presente documento podem ser implementados por uma série de instruções executáveis por computador que residem em uma mídia de armazenamento, tal como uma unidade de disco ou mídia legível por computador. Deve-se notar que os métodos revelados no presente documento podem ser implementados por um computador (por exemplo, um computador desktop, um computador tablet, um computador laptop, e assim por diante), um console de jogos, um dispositivo de jogos de mão, um telefone celular, um smartphone, um sistema de televisão inteligente, e assim por diante. Diferentes arquiteturas de implantação incluem servidores em nuvem, internos ou híbridos.
[0017] Ambientes, como a casa de uma pessoa, podem ter o potencial para riscos de lesões dependendo do posicionamento das mobílias, tais como mesas, cadeiras, luminárias, ou quaisquer itens adicionais fora ou dentro da linha de visão de um indivíduo. Por exemplo, pessoas de todas as idades, incluindo idosos a crianças pequenas, indivíduos com transtornos, condições crônicas e deficiências funcionais podem potencialmente se lesionar por mobílias mal posicionadas ou outros itens que não estejam prontamente visíveis.
[0018] Uma avaliação de riscos de lesões se tornou uma parte integral da provisão de assistência médica à população idosa que tem grande desejo de manter independência. Tradicionalmente, a identificação de objetos dentro de uma casa que possuem risco de causar lesões é realizada por uma pessoa ou terapeuta ocupacional por inspeção visual à medida em que a pessoa anda por um espaço durante uma visita à casa. Durante uma inspeção visual, o terapeuta ocupacional examina áreas usadas e suas limitações com base em uma combinação de fatores, como as qualidades de uma pessoa e o ambiente, e pode, ou não, usar analítica de dados para modelar estratificação de riscos. No entanto, exigir que uma pessoa inspecione manualmente um espaço para determinação de riscos de lesões coloca essa pessoa em risco de lesões durante a inspeção, é demorado, trabalhoso para escalonar problemas de identificar riscos ambientes predominantemente devido a sistemas de informações de saúde insuficientes e analítica de dados, pode ser limitado a um local fixo, pode não ser acessível para pacientes, por exemplo, em terapia ocupacional, e pode apenas ocorrer após uma lesão já ter ocorrido.
[0019] Várias modalidades exemplificadoras descritas e ilustradas no presente documento se referem a sistemas e métodos para proporcionar um ambiente 3D de um espaço e um método para avaliação compreensiva de riscos de lesões dentro do espaço utilizando aprendizagem de máquina tal como aprendizagem por reforço e aprendizagem profunda. De acordo com as modalidades exemplificadoras, os sistemas e métodos mapeiam ambientes 3D de uma casa ou espaço de convivência e coloca os modelos 3D em um ambiente de simulação. Então, usando uma versão simulada do usuário, trajetórias podem ser seguidas através da casa virtual usando aprendizagem por reforço para encontrar as trajetórias mais seguras para evitar e estar ciente de riscos. Essa solução fornece o serviço de avaliação de riscos a usuários para permitir que eles vivam de modo independente de modo que não fiquem limitados a um local fixo como uma casa de repouso, a casa de um membro da família, ou uma instalação ou casa que possa buscar por riscos e consertá-los. Para algumas pessoas, os custos de assistência domiciliar agendada os induzem a terem que recorrer a serem colocados em uma casa. Automatizando-se a identificação de riscos de lesão e prevenção de acidentes, todos os riscos possíveis podem ser detectados sem expor qualquer pessoa aos riscos, e a população idosa será capaz de viver de modo independente por um período de tempo maior.
[0020] A Figura 1 ilustra um ambiente 100 no qual sistemas e métodos para identificar riscos ambientais em um ambiente simulado usando aprendizagem de máquina tal como aprendizagem por reforço e aprendizagem profunda podem ser implementados, de acordo com algumas modalidades. O ambiente 100 pode incluir um agente 110, uma rede de comunicações 130 (por exemplo, a Internet ou uma nuvem computacional), um sistema para identificar riscos ambientais 140 (também referido no presente documento como sistema 140), usuário(s) 170, dispositivo(s) de usuário 180, e, opcionalmente, um banco de dados 150. O agente 110, o sistema 140, dispositivo(s) de usuário 180 e o banco de dados 150 podem ser conectados através da rede de comunicações
130.
[0021] O agente 110 pode incluir, ou ser acoplado a uma ou mais câmaras 120, um ou mais sensores de profundidade integrados, rodas, um ou mais motores elétricos, fonte de alimentação, dispositivos integrados adicionais, e conexão sem fio (isto é, Bluetooth, Wi-Fi, etc.). Em algumas modalidades, o agente 110 pode ser implantado no assoalho de um espaço, e o agente 110 se desloca no espaço coletando dados sobre itens posicionados no espaço de modo que o sistema 140 crie um mapa 3D do espaço. Em outra modalidade, o agente 110 pode ser manualmente controlado pelo dispositivo de usuário 180 operado pelo usuário 170 para coletar dados sobre objetos posicionados no espaço. O dispositivo de usuário 180 pode incluir um telefone móvel, um computador pessoal (PC), um laptop, um smartphone, um PC tablet, e assim por diante. Em algumas modalidades, o agente 110 pode ser substituído por, ou assumir a forma de, qualquer dispositivo computacional, tais como aqueles descritos em relação à Figura 6.
[0022] O sistema 140 pode ser baseado em nuvem, ou compreender um ou mais servidores remotos. Através de uma avaliação usando o sistema 140, uma avaliação de risco em modelo 3D 160 é proporcionada ao usuário 170 através do dispositivo de usuário 180 que pode incluir um mapa 3D que descreve áreas de riscos de lesões conforme descrito na modalidade exemplificadora da Figura 5.
[0023] A rede de comunicações 130 pode incluir uma rede com ou sem fio, ou uma combinação das mesmas. Por exemplo, a rede pode incluir um ou mais dos seguintes: a Internet, uma intranet local, PAN (Rede de Área Pessoal), LAN (Rede de Área Local), WAN (Rede de Área Ampliada), MAN (Rede de Área Metropolitana), rede privada virtual (VPN), rede de área de armazenamento (SAN), conexão de retransmissão de quadros, conexão de Rede Inteligente Avançada (AIN), conexão de rede óptica síncrona (SONET), linha T1, T3, E1 ou E3 digital, conexão de Serviço de Dados Digitais (DDS), conexão DSL (Linha Assinante Digital), conexão Ethernet, linha ISDN (Rede Digital de Serviços Integrados), porta de discagem como conexão por modem analógico V.90, V.34 ou V.34bis, modem a cabo, conexão ATM (Modo de Transferência Assíncrona), ou uma FDDI (Interface de Dados Distribuídos por Fibra) ou conexão CDDI (Interface de Dados Distribuídos por Cobre). Adicionalmente, as comunicações também podem incluir enlaces a qualquer dentre uma variedade de redes sem fio incluindo, WAP (Protocolo de Aplicação Sem Fio), GPRS (Serviços Gerais de Pacotes por Rádio), GSM (Sistema Global para Comunicações Móveis), CDMA (Acesso Múltiplo por Divisão de Código) ou TDMA (Acesso Múltiplo por Divisão de Tempo), redes de telefone celular, GPS, CDPD (dados de pacote digital celular), rede de paginação por duplexação RIM (Pesquisa em Movimento, Limitada), rádio Bluetooth, ou uma rede de radiofrequência baseada em IEEE 802.11. A rede pode incluir, ainda, ou fazer interface com qualquer um ou mais dos seguintes: conexão serial RS-232, conexão IEEE-1394 (Firewire), conexão de Canal de Fibra, porta IrDA (infravermelha), conexão SCSI (Interface de Sistemas Computacionais Pequenos), conexão USB (Barramento Serial Universal), ou outra interface ou conexão digital ou analógica com ou sem fio, malha ou rede Digi®.
[0024] Um banco de dados opcional 150 pode armazenar os dados coletados pelo agente 110 a fim de gerar uma avaliação de risco em modelo 3D 160 e informações adicionais sobre o usuário 170.
[0025] A Figura 2 é uma vista esquemática do processo de simulação implementado para construir o ambiente 3D por um agente usando Aprendizagem por Reforço (RL). Começa com o agente tomando o estado ambiente como informações de entrada a partir da medição de um objeto no ambiente. Com base no que o agente detecta, o mesmo toma uma ação usando RL‡ para continuar a detecção do objeto. Na Figura 2, a RL que é implementada durante o processo de simulação é representada em vista esquemática por caixas fora da caixa de “processo de simulação”. As linhas tracejadas representam entrada e as linhas contínuas representam saída. À medida que o agente se move no ambiente detectando objetos, conforme mostrado na Figura 4, o mesmo constrói o mapa 3D e estabelece o risco potencial para acidentes mapeando-se objetos na casa, conforme mostrado nas trajetórias da Figura 5, seus locais relativos, e simula o usuário nesse ambiente, respectivamente.
[0026] O agente determina uma ação baseada em seu estado atual empregando-se uma política, π, que depende de uma observação, feita pelo agente, do estado. É uma distribuição por ações para cada estado, π(a|s) = P [Ai = a , Si = s]. Por exemplo, na Figura 2, a sequência inicial, i = 0, começa com Si +1= 1 (estado ambiental captado por agente). Nesse caso para i = 0, a política pode depender do estado s estando em observação de mais partes de mobílias, por exemplo, π(s) = se não puder determinar se a entrada é um ou múltiplos objetos, a = então o agente se aproxima e obtém uma tomada melhor.
[0027] O agente agora tem entrada desse primeiro estado, S1, e devido à sua política, toma a ação, a, chega em i = 1 e obtém retroinformações da função de recompensa, R (s, a). É uma função de pares de ação de estado; a Rs = E ([Ri +1│Si =s, Ai = a]; onde s, a ∊ ℝ & E é a expectativa. Então, a função de probabilidade de transição é uma distribuição de probabilidade pelo próximo estado possível dado o estado atual, que produz um próximo estado provável, si+1., é Pss’ a = P[ Si+1 = s’ | Si = s, Ai = a]; onde Si = estado particular, s = estado atual, e Si+1 = s’ está ajustando o próximo estado sequencial para s’, que é o próximo estado previsto. O agente aprende um valor Q com base na ação tomada a partir de outra política, que é atualizada calculando-a de acordo com uma função de valor de Q nova (isto é, atualizar a função de política de acordo com a função de valor Q). O agente agora tem uma compreensão refinada de S1 e entrada para S2. Em outras palavras:
[0028] S1 = entrada de estado, então, política e ação, π (s) = a implementado e realizado. Função de recompensa recebida, R (s, a), probabilidade de transição pelo próximo estado possível, P(s, a), e função de valor Q refina o conceito de um estado prévio enquanto atualiza a política, Qπ(s).
[0029] Em i = 1, S2, a função de valor Q atualizada atualizou o valor de estado prévio a partir da nova entrada que recebeu a partir de i = 1 (onde i = 1, no estado S2, e por causa disso atualiza valores de i = 0, para estado S1 e funções correspondentes que reagiram a isso). Por exemplo, em geral, a função de valor Q, Q (si, ai) + α [ri+1 + γ maxa Q (Si+1, a) - Q(si, ai)] → Q (si, ai) para, até aqui, na sequência seria: Q (s1, a1) + α [r1 + γ maxa Q (s1, a) - Q(s0, a0)] → Q (s0, a0), e combina isso com a avaliação comparada ao estado atual e emite um estado novo (isto é, uma nova compreensão do estado atual), que é, então, a nova entrada a começar o mesmo processo como antes. Aqui γ é o fator de desconto, ou fator de descontinuidade de recompensa, que diz ao agente quanta recompensa esperar se tomar uma ação particular em um estado particular. Da mesma forma, no presente documento é α, a taxa de aprendizagem. Tem estado e política atualizada (entrada), agora em i =1 por exemplo;
[0030] π(x) = se tiver determinado uma razão de aspecto prévia correta,
[0031] a = usar isso para novos objetos que fazem parte da entrada para i = 1 etapa em sequência a avançar e interagir com novos objetos detectados. Agora na seta sólida levando de volta ao “processo de simulação,” com processo similar como antes, chegando i = 2, S3, com uma compreensão melhor de objetos e seus locais uns em relação aos outros, isto é, uma trajetória. Na Figura 2 isso é mostrado pela segunda caixa de equações, onde as equações mudaram de Rsa, Pss’a, Q(s0,a0) àquelas atualizadas (Rsπ, Pss’π, Q(s’,a)), que é explicado a seguir.
[0032] Novamente, a função de recompensa é imposta, e a distribuição de probabilidade pelo próximo estado possível dado o estado atual com P(s,a), e a função de valor Q é calculada de acordo com a atualização de política, mas agora com π a
[0033] Rs = ∑ [a∈A] π (a│s) R s : πθ(s, a) = P[a | (s, θ)] , onde θ são parâmetros ajustáveis, ou pesos, leva a uma distribuição de π probabilidade de transição atualizada, Pss’ = ∑ [a∈A] π (a│s) Pss’ a , e a função de valor Q se torna: Qπ(s) = (1 – α) ⦁ Q (s, a) + α [r + γ maxa’ Q (s’, a’)] → Q (s’, a) ; onde s’ e a’ são estado e ação futuros (usar par atualizar funções). Ação seguinte de advertência a’ é ajustada para maximizar a próxima função de valor Q, é assim que se mantém a função de valor Q atualizada com uma política atualizada (isto é, ao invés de usar uma política atual).
[0034] A Figura 3 ilustra um método exemplificador (e sumário) para proporcionar uma avaliação de riscos de lesão em um ambiente 3D, de acordo com várias modalidades exemplificadoras.
[0035] O método 300 inclui:
[0036] Na etapa 301, implantar um agente em um ambiente. Por exemplo, vide a Figura 2.
[0037] Na etapa 302, detectar um primeiro objeto em um primeiro estado pelo agente. Por exemplo, vide a Figura 2.
[0038] Na etapa 303, tomar uma ação para interagir com o primeiro objeto usando aprendizagem por reforço pelo agente, a ação tomada a fim de maximizar uma recompensa. Por exemplo, vide a Figura 2.
[0039] Na etapa 304, mapear o primeiro objeto a um ambiente tridimensional. Por exemplo, vide a Figura 4.
[0040] Na etapa 305, identificar riscos potenciais dentro do ambiente tridimensional. Por exemplo, vide a Figura 5.
[0041] A Figura 4 ilustra o agente usando RL no processo de construção de simulação movendo-se pelo ambiente. Nessa imagem, o agente começa na esquerda pela porta da frente [Figura 4a], vai em direção ao sofá [Figura 4b], então, entre as mesas [Figura 4c], e adiante pela casa.
[0042] Referindo-se à Figura 5a para a trajetória completa, após estar entre as mesas (descrito pela Figura 4c), o agente atravessa o corredor para o quarto, então, ao redor do quarto, e volta pelo corredor para a cozinha, e termina onde começou pela porta da frente.
[0043] À medida que se move e interage, aperfeiçoa o modelo 3D com cada sequências. As linhas contínuas (pontilhadas) representam um modelo acabado (não acabado) de um objeto. Nessa figura, o agente reconhece cadeiras (linhas brancas) e mesas (linhas pretas) como objetos por propósitos ilustrativos – não é limitado a cadeiras e mesas.
[0044] Considera-se o ponto inicial com linhas brancas pontilhadas à cadeira e sofá como a sequência inicial (i=0). Esses objetos são entradas do estado Si+1 = S0+1 = S1 com R1 e A1, recompensa e ação, para iniciar o processo de simulação. No próximo ponto sequencial (i=1) o agente interagiu com esses objetos, os detectou para serem incluídos no próximo estado ambiente S2, os mapeou adequadamente no ambiente (reapresentado pelas linhas brancas sólidas), e identificou um risco potencial (Figura 5). Nota-se que as linhas pontilhadas também se apresentam nessa sequência (i=1) e como elas se solidificam pela próxima sequência (i=2) similarmente.
[0045] A Figura 5 tem as saídas de risco associadas representadas para risco baixo a ausente por sinais de visto (✓) e para riscos médios a altos por sinais de cruz (✗). Na Figura 5b fica evidente que à medida que cada sequência progride, o mapa 3D e riscos de acidente no mesmo se tornam mais bem definidos, otimizando as capacidades do método no presente documento para a simulação de modelo 3D. Na Figura 5b, a casa se desvanece para descrever como a certeza do mapa 3D e simulação, com riscos correspondentes, são aperfeiçoados com funções atualizadas com cada sequência. Portanto, na Figura 5c, a casa inteira é sólida porque o agente finalizou e terminou pela porta da frente.
[0046] A Figura 6 ilustra um sistema computacional exemplificador 600 que pode ser usado para implementar as modalidades descritas no presente documento. O sistema computacional 600 da Figura 6 pode incluir um ou mais processadores 610 e memória 620. A memória 620 armazena, em parte, instruções e dados para execução por um ou mais processadores 610. A memória 620 pode armazenar o código executável quando o sistema computacional 600 estiver em operação. O sistema computacional 600 da Figura 6 pode incluir, ainda, um armazenamento em massa 630, um armazenamento portátil 640, um ou mais dispositivos de saída 650, um ou mais dispositivos de entrada 660, uma interface de rede 670, e um ou mais dispositivos periféricos
680.
[0047] Os componentes mostrados na Figura 6 são descritos como estando conectados através de um único barramento 690. Os componentes podem ser conectados através de um ou mais meios de transporte de dados. Um ou mais processadores 610 e memória 620 podem ser conectados através de um barramento de microprocessador local, e o armazenamento em massa 630, um ou mais dispositivos periféricos 680, armazenamento portátil 640, e interface de rede 670 podem ser conectados através de um ou mais barramentos de entrada/saída (I/O).
[0048] O armazenamento em massa 630, que pode ser implementado com uma unidade de disco magnético ou uma unidade de disco óptico, é um dispositivo de armazenamento não volátil para armazenar dados e instruções para uso por um disco magnético ou uma unidade de disco óptico, que, sucessivamente, pode ser usado por um ou mais processadores 610. O armazenamento em massa 630 pode armazenar o software de sistema para implementar as modalidades descritas no presente documento para propósitos de carregar esse software na memória 620.
[0049] O armazenamento portátil 340 opera em conjunto com uma mídia de armazenamento não volátil portátil, tal como um disco compacto (CD) ou disco de vídeo digital (DVD), para dados de entrada e saída e código a partir do sistema computacional 600 da Figura 6. O software de sistema para implementar as modalidades descritas no presente documento pode ser armazenado nessa mídia portátil e inserido ao sistema computacional 600 através do armazenamento portátil 640.
[0050] Um ou mais dispositivos de entrada 660 proporcionam uma porção de uma interface de usuário. Um ou mais dispositivos de entrada 660 podem incluir um teclado alfanumérico, tal como um teclado, para inserir informações alfanuméricas e outras informações, ou um dispositivo de apontamento, tal como um mouse, um trackball, uma caneta stylus, ou teclas de direção de cursor. Adicionalmente, o sistema computacional 600 conforme mostrado na Figura 6 inclui um ou mais dispositivos de saída 650. Um ou mais dispositivos de saída 650 adequados incluem alto-falantes, impressoras, interfaces de rede e monitores.
[0051] A interface de rede 670 pode ser utilizada para se comunicar com dispositivos externos, dispositivos computacionais externos, servidores e sistemas em rede através de uma ou mais redes de comunicações como uma ou mais redes com fio, sem fio ou ópticas que incluem, por exemplo, a Internet, uma intranet, LAN, WAN, redes de telefonia celular (por exemplo, Sistema Global para Rede de Comunicações Móveis, rede de comunicações por comutação de pacotes, rede de comunicações por comutação de circuitos), rádio Bluetooth, e uma rede de radiofrequência baseada em IEEE 802.11, dentre outras. As interface de rede 670 podem ser um cartão de interface de rede, tal como um cartão Ethernet, transceptor ótico, transceptor de radiofrequência, ou qualquer outro tipo de dispositivo que possa enviar e receber informações. Outros exemplos dessas interfaces de rede podem incluir Bluetooth®, 3G, 4G, e rádios WiFi® em dispositivos computacionais móveis bem como um USB.
[0052] Um ou mais dispositivos periféricos 680 podem incluir qualquer tipo de dispositivo de suporte computacional para agregar uma funcionalidade adicional ao sistema computacional 600. Um ou mais dispositivos periféricos 680 podem incluir um modem ou um roteador.
[0053] Os componentes contidos no sistema computacional 600 da Figura 6 são aqueles tipicamente encontrados em sistemas computacionais que podem ser adequados para uso com as modalidades descritas no presente documento e são destinados a representar uma categoria ampla desses componentes computacionais que são bem conhecidos na técnica. Logo, o sistema computacional 600 da Figura 6 pode ser um PC, um dispositivo computacional de mão, um telefone, um dispositivo computacional móvel, uma estação de trabalho, um servidor, um minicomputador, um computador mainframe, ou qualquer outro dispositivo computacional. O computador também pode incluir diferentes configurações de barramento, plataformas em rede, plataformas de multiprocessador, e assim por diante. Vários sistemas operacionais (OS) podem ser usados incluindo UNIX, Linux, Windows, Macintosh OS, Palm OS, e outros sistemas operacionais adequados.
[0054] Algumas das funções descritas anteriormente podem ser compostas por instruções que são armazenadas em mídias de armazenamento (por exemplo, mídia legível por computador). As instruções podem ser recuperadas e executadas pelo processador. Alguns exemplos de mídias de armazenamento são dispositivos de memória, fitas, discos, e similares. As instruções são operacionais quando executadas pelo processador para direcionar o processador a operar de acordo com as modalidades exemplificadoras. Os indivíduos versados na técnica estão familiarizados com instruções, processador(es) e mídias de armazenamento.
[0055] Convém destacar que qualquer plataforma de hardware adequada para realizar o processamento descrito no presente documento é adequada para uso com as modalidades exemplificadoras. Os termos “mídia de armazenamento legível por computador” e “mídias de armazenamento legíveis por computador” conforme o uso em questão se referem a qualquer mídia ou mídias que participem em fornecer instruções a uma unidade de processamento central (CPU) para execução. Essas mídias podem assumir muitas formas, incluindo, sem limitação, mídias não voláteis, mídias voláteis e mídias de transmissão. Mídias não voláteis incluem, por exemplo, discos ópticos ou magnéticos, tal como um disco fixo. Mídias voláteis incluem memória dinâmica, como Memória de Acesso Aleatório (RAM). Mídias de transmissão incluem cabos coaxiais, fios de cobre e fibras ópticas, dentre outras, incluindo os fios que incluem uma modalidade de um barramento. As mídias de transmissão também podem assumir a forma de ondas acústicas ou leves, tais como aquelas geradas durante comunicações de dados por radiofrequência e infravermelha. Formas comuns de mídias legíveis por computador incluem, por exemplo, um disquete, um disco flexível, um disco rígido, uma fita magnética, qualquer mídia magnética, um disco CD de memória somente para leitura (ROM), DVD, qualquer outra mídia óptica, qualquer outra mídia física com padrões de marcas ou furos, uma RAM, uma PROM, uma EPROM, uma EEPROM, uma FLASHEPROM, qualquer outro chip ou cartucho de memória, uma onda portadora, ou qualquer outra mídia a partir da qual um computador pode ler.
[0056] Várias formas de mídias legíveis por computador podem ser envolvidas em transportar uma ou mais sequências de uma ou mais instruções a uma CPU para execução. Um barramento transporta os dados a RAM do sistema, a partir do qual uma CPU recupera e executa as instruções. As instruções recebidas pela RAM do sistema podem ser opcionalmente armazenadas em um disco fixo seja antes ou após a execução por uma CPU.
[0057] Em algumas modalidades, o sistema computacional 600 pode ser implementado como um ambiente computacional baseado em nuvem, tal como uma máquina virtual que opera em uma nuvem computacional. Em outras modalidades, o sistema computacional 600 pode, ele mesmo, incluir um ambiente computacional baseado em nuvem, onde as funcionalidades do sistema computacional 600 são executadas em uma maneira distribuída. Logo, o sistema computacional 600, quando configurado como uma nuvem computacional, pode incluir pluralidades de dispositivos computacionais em várias formas, conforme será descrito em maiores detalhes abaixo.
[0058] Em geral, um ambiente computacional baseado em nuvem é um recurso que combina tipicamente a potência computacional de um agrupamento grande de processadores (como em servidores da web) e/ou que combina a capacidade de armazenamento de um agrupamento grande de memórias computacionais ou dispositivos de armazenamento. Sistemas que proporcionam recursos baseados em nuvem podem ser utilizados exclusivamente por seus próprios proprietários ou esses sistemas podem ser acessíveis a usuários externos que instalam aplicativos na infraestrutura computacional para obter o benefício de grandes recursos computacionais ou de armazenamento.
[0059] A nuvem pode ser formada, por exemplo, por uma rede de servidores da web que compreendem uma pluralidade de dispositivos computacionais, tal como o sistema computacional 600, com cada servidor (ou pelo menos uma pluralidade dos mesmos) proporcionando recursos de processador e/ou armazenamento. Esses servidores gerenciam cargas úteis proporcionadas por múltiplos usuários (por exemplo, consumidores de recursos de nuvem ou outros usuários). Tipicamente, cada usuário solicita demandas de carga útil pela nuvem que varia em tempo real, algumas vezes dramaticamente. A natureza e extensão dessas variações tipicamente dependem do tipo de negócio associado ao usuário.
[0060] As estruturas, materiais, ações e equivalentes correspondentes de todos os elementos de função means-or-step-plus nas reivindicações abaixo são destinados a incluir qualquer estrutura, material ou ação para realizar a função em combinação com outros elementos reivindicados conforme especificamente reivindicado. A descrição da presente tecnologia foi apresentada por propósitos de ilustração e descrição, mas não é destinada a ser exaustiva nem limitada à invenção na forma revelada. Muitas modificações e variações se tornarão aparentes aos técnicos no assunto sem divergir do escopo e âmbito da invenção. Modalidades exemplificadoras foram escolhidas e descritas a fim de explicar melhor os princípios da presente tecnologia e sua aplicação prática, e permitir que outros técnicos no assunto compreendam a invenção para várias modalidades com várias modificações conforme são adequadas ao uso particular contemplado.
[0061] Os aspectos da presente tecnologia são descritos acima com referência às ilustrações de fluxograma e/ou diagramas de bloco de métodos, aparelho (sistemas) e produtos de programa de computador de acordo com as modalidades da invenção. Compreende-se que cada bloco das ilustrações de fluxograma e/ou diagramas de bloco, e combinações de blocos nas ilustrações de fluxograma e/ou diagramas de bloco, pode ser implementado por instruções de programa de computador. Essas instruções de programa de computador podem ser proporcionadas a um processador de um computador para propósitos gerais, computador para propósitos especiais, ou outro aparelho de processamento de dados programáveis para produzir uma máquina, de modo que as instruções, que executam através do processador do computador ou outro aparelho de processamento de dados programáveis, criam meios para implementar as funções/ações especificadas no bloco ou blocos de fluxograma e/ou diagrama de blocos.
[0062] Essas instruções de programa de computador também podem ser armazenadas em uma mídia legível por computador que pode direcionar um computador, outro aparelho de processamento de dados programáveis, ou outros dispositivos para funcionar em uma maneira particular,
de modo que as instruções armazenadas na mídia legível por computador produzam um artigo de manufatura incluindo instruções que implementam a função/ação especificada no bloco ou blocos de fluxograma e/ou diagrama de blocos.
[0063] As instruções de programa de computador também podem ser carregadas em um computador, outro aparelho de processamento de dados programáveis, ou outros dispositivos para induzir que uma série de etapas operacionais seja realizada no computador, outro aparelho programável ou outros dispositivos para produzir um processo implementado por computador de modo que as instruções que executam no computador ou outro aparelho programável proporcionem processos para implementar as funções/ações especificadas no bloco ou blocos de fluxograma e/ou diagrama de blocos.
[0064] O fluxograma e diagramas de blocos ilustram a arquitetura, funcionalidade e operação de implementações possíveis de sistemas, métodos e produtos de programa de computador de acordo com várias modalidades da presente tecnologia. Nesse sentido, cada bloco no fluxograma ou diagramas de blocos pode representar um módulo, segmento ou porção de código, que compreende uma ou mais instruções executáveis para implementar as funções lógicas especificadas. Deve-se notar que, em algumas implementações alternativas, as funções notadas no bloco podem ocorrer fora da ordem notada nas figuras. Por exemplo, dois blocos mostrados em sucessão podem, de fato, ser executados de modo substancialmente concorrente, ou os blocos podem, algumas vezes, ser executados em ordem reversa, dependendo da funcionalidade envolvida. Deve-se notar, também, que cada bloco da ilustração de diagramas de blocos e/ou fluxogramas, e combinações de blocos na ilustração de diagramas de blocos e/ou fluxogramas, pode ser implementado por sistemas baseados em hardware para propósitos especiais que realizam as funções ou ações especificadas, ou combinações de instruções de hardware para propósitos especiais e computacionais.
[0065] Logo, descreveram-se sistemas e métodos para identificar riscos ambientes em um ambiente simulado usando aprendizagem de máquina como aprendizagem por reforço e aprendizagem profunda. Embora as modalidades tenham sido descritas com referência a modalidades exemplificadoras específicas, ficará evidente que várias modificações e alterações podem ser feitas a essas modalidades exemplificadoras sem divergir do âmbito e escopo mais abrangente do presente pedido.
De modo correspondente, o relatório descritivo e os desenhos devem ser considerados em um sentido ilustrativo ao invés de restritivo.
Existem muitas formas alternativas de implementar a presente tecnologia.
Os exemplos revelados são ilustrativos e não restritivos.

Claims (17)

REIVINDICAÇÕES
1. Método para proporcionar avaliação de um risco de lesão, o método sendo CARACTERIZADO pelo fato de compreender: implantar um agente em um ambiente; detectar um primeiro objeto em um primeiro estado pelo agente; tomar uma ação para interagir com o primeiro objeto usando aprendizagem por reforço pelo agente, a ação tomada a fim de maximizar uma recompensa; mapear o primeiro objeto a um ambiente tridimensional; e identificar riscos potenciais dentro do ambiente tridimensional.
2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de compreender, ainda, o agente continuando a tomar outra ação no ambiente para interagir com um segundo objeto usando aprendizagem por reforço pelo agente, a ação tomada a fim de maximizar uma recompensa cumulativa.
3. Método, de acordo com a reivindicação 2, CARACTERIZADO pelo fato de compreender, ainda, o agente mapeando o segundo objeto ao ambiente tridimensional e continuando a identificar riscos potenciais dentro do ambiente tridimensional.
4. Método, de acordo com a reivindicação 3, CARACTERIZADO pelo fato de compreender, ainda, o agente mapeando os locais relativos do primeiro e segundo objetos no ambiente tridimensional.
5. Método, de acordo com a reivindicação 4, CARACTERIZADO pelo fato de compreender, ainda, o agente mapeando uma trajetória para evitar o contato com o primeiro e segundo objetos no ambiente tridimensional.
6. Método, de acordo com a reivindicação 5, CARACTERIZADO pelo fato de compreender, ainda, simular um usuário no ambiente tridimensional.
7. Método, de acordo com a reivindicação 6, CARACTERIZADO pelo fato de compreender, ainda, o agente usando aprendizagem por reforço em um processo de construção de simulação movendo-se e interagindo através do ambiente para aperfeiçoar o ambiente tridimensional.
8. Método, de acordo com a reivindicação 7, CARACTERIZADO pelo fato de compreender, ainda, gerar um novo ambiente tridimensional com cada sequência de movimento pelo agente.
9. Método, de acordo com a reivindicação 8, CARACTERIZADO pelo fato de compreender, ainda, gerar um novo ambiente tridimensional com cada interação pelo agente.
10. Método, de acordo com a reivindicação 9, CARACTERIZADO pelo fato de compreender, ainda, gerar um mapa de simulação tridimensional identificando riscos potenciais no ambiente.
11. Método, de acordo com a reivindicação 10, CARACTERIZADO pelo fato de compreender, ainda, categorizar os riscos potenciais seja como risco baixo a ausente ou risco médio a alto.
12. Sistema para proporcionar avaliação de risco de lesão, o sistema sendo CARACTERIZADO pelo fato de compreender: um agente comunicativamente acoplado a um dispositivo de captação; uma rede de comunicações comunicativamente acoplada ao agente; um módulo de avaliação de riscos em modelo tridimensional comunicativamente acoplado à rede de comunicações; um dispositivo de usuário comunicativamente acoplado ao módulo de avaliação de riscos em modelo tridimensional; e um sistema para identificar riscos ambientes comunicativamente acoplado à rede de comunicações.
13. Sistema, de acordo com a reivindicação 12, CARACTERIZADO pelo fato de compreender, ainda, um banco de dados.
14. Sistema, de acordo com a reivindicação 12, CARACTERIZADO pelo fato de compreender, ainda, o agente configurado para implantar um ambiente e detectar um primeiro objeto em um primeiro estado.
15. Sistema, de acordo com a reivindicação 14, CARACTERIZADO pelo fato de compreender, ainda, o agente configurado para tomar uma ação para interagir com o primeiro objeto usando aprendizagem por reforço.
16. Sistema, de acordo com a reivindicação 15, CARACTERIZADO pelo fato de compreender, ainda, o agente configurado para mapear o primeiro objeto a um ambiente tridimensional.
17. Sistema, de acordo com a reivindicação 16, CARACTERIZADO pelo fato de compreender, ainda, o agente configurado para identificar riscos potenciais dentro do ambiente tridimensional.
Petição 870210068149, de 27/07/2021, pág. 105/111 180 100
AVALIAÇÃO DE
RISCO DE MODELO 3D 160 1/6
REDE DE SISTEMA PARA
AGENTE IDENTIFICAR RISCOS
CÂMERA COMUNICAÇÕES 110 AMBIENTES 140 120 130
BANCO DE
DADOS 150
Sequência inicial (i = 0): S1 (s) = a R (s, a) = Rsa = E ([Ri +1 i = s, Ai = a] P(s, a) = P ss’ a = P[ Si+1 = s’ | Si = s, Ai = a] Q (s0, a 0) Leva à sequência i = 1, atualizar funções acima.
Processo de simulação S1 Detecção de RL Detecção de objeto objeto i + 1 e trajetória Com compreensão aperfeiçoada de estado prévio, Si-1,variáveis
RL RL RL atualizadas aperfeiçoaram a previsão para o próximo Si+1 Mapa 3D, Trajetórias wrt usuário em de objeto i + 1 Risco simulação RL e objetos (s, a) = P[a | (s Rs [a A] ) R sa P ss’ = [a A] ) P ss’ a Mapa 3D aperfeiçoando Q(s, a, R, P) com Q (s Q (s’, a) cada etapa sequencial através do loop
300 INÍCIO
IMPLANTAR UM AGENTE EM UM AMBIENTE 301
DETECTAR UM PRIMEIRO OBJETO PELO AGENTE EM UM 302
PRIMEIRO ESTADO
TOMAR UMA AÇÃO PARA INTERAGIR COM O
PRIMEIRO OBJETO USANDO APRENDIZAGEM POR REFORÇO PELO AGENTE, SENDO A AÇÃO 303
TOMADA A FIM DE MAXIMIZAR UMA
RECOMPENSA
MAPEAR O PRIMEIRO OBJETO A UM AMBIENTE TRIDIMENSIONAL 304
IDENTIFICAR RISCOS POTENCIAIS DENTRO DO AMBIENTE TRIDIMENSIONAL 305
TÉRMINO i = 0, S1 i = 1, S 2 i = 2, S3
Trajetória completa do agente i =0 i =1 i =2
Atualizar a saída com nova entrada i =0 i =1 i =2
Estado final i = n
UM OU MAIS 650
UM OU MAIS DISPOSITIVOS DE 610 PROCESSADORES SAÍDA UM OU MAIS 660
DISPOSITIVOS
MEMÓRIA DE ENTRADA 620 INTERFACE 670
ARMAZENAMENTO DE REDE 630 EM MASSA UM OU MAIS 680
ARMAZENAMENTO DISPOSITIVOS 640 PORTÁTIL PERIFÉRICOS 690
BR112021014734-9A 2019-02-05 2020-01-31 Identificação de riscos em ambiente 3d utilizando aprendizagem por reforço BR112021014734A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962801525P 2019-02-05 2019-02-05
US62/801,525 2019-02-05
PCT/US2020/016248 WO2020163180A1 (en) 2019-02-05 2020-01-31 3d environment risks identification utilizing reinforced learning

Publications (1)

Publication Number Publication Date
BR112021014734A2 true BR112021014734A2 (pt) 2021-09-28

Family

ID=71836668

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021014734-9A BR112021014734A2 (pt) 2019-02-05 2020-01-31 Identificação de riscos em ambiente 3d utilizando aprendizagem por reforço

Country Status (9)

Country Link
US (1) US11791050B2 (pt)
EP (1) EP3920797A4 (pt)
JP (1) JP2022519283A (pt)
KR (1) KR20210133228A (pt)
AU (1) AU2020218172B2 (pt)
BR (1) BR112021014734A2 (pt)
CA (1) CA3126844A1 (pt)
SG (1) SG11202107882TA (pt)
WO (1) WO2020163180A1 (pt)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10813572B2 (en) 2015-12-11 2020-10-27 Electronic Caregiver, Inc. Intelligent system for multi-function electronic caregiving to facilitate advanced health diagnosis, health monitoring, fall and injury prediction, health maintenance and support, and emergency response
US11213224B2 (en) 2018-03-19 2022-01-04 Electronic Caregiver, Inc. Consumer application for mobile assessment of functional capacity and falls risk
US11923058B2 (en) 2018-04-10 2024-03-05 Electronic Caregiver, Inc. Mobile system for the assessment of consumer medication compliance and provision of mobile caregiving
US11488724B2 (en) 2018-06-18 2022-11-01 Electronic Caregiver, Inc. Systems and methods for a virtual, intelligent and customizable personal medical assistant
EP3920797A4 (en) 2019-02-05 2022-11-02 Electronic Caregiver, Inc. IDENTIFYING THE RISKS OF A 3D ENVIRONMENT USING REINFORCED LEARNING
US11955209B2 (en) * 2019-04-29 2024-04-09 International Business Machines Corporation Cohort selection for agile processes
US11113943B2 (en) 2019-05-07 2021-09-07 Electronic Caregiver, Inc. Systems and methods for predictive environmental fall risk identification

Family Cites Families (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5211642A (en) 1991-10-28 1993-05-18 Clendenning Beverly F Chambers drainage system
US5475953A (en) 1994-09-29 1995-12-19 Powerflor, Inc. 2-shaped edge molding strip
US6665647B1 (en) 1997-11-24 2003-12-16 Chris A. Haudenschild Enterprise healthcare management system and method of using same
AU5770599A (en) 1998-07-21 2000-02-14 Originet Method and system for providing an avatar interactive computer guide system
US20020062342A1 (en) 2000-11-22 2002-05-23 Sidles Charles S. Method and system for completing forms on wide area networks such as the internet
DK1360567T3 (da) 2001-02-16 2005-10-10 United Parcel Service Inc System og fremgangsmåde til selektiv aktivering og deaktivering af adgang til softwareapplikationer over et netværk
JP4744715B2 (ja) 2001-04-06 2011-08-10 株式会社ブロードリーフ 情報開示方法
US7242306B2 (en) 2001-05-08 2007-07-10 Hill-Rom Services, Inc. Article locating and tracking apparatus and method
US8108488B2 (en) 2002-11-18 2012-01-31 Jackbe Corporation System and method for reducing bandwidth requirements for remote applications by utilizing client processing power
JP2004264060A (ja) 2003-02-14 2004-09-24 Akebono Brake Ind Co Ltd 姿勢の検出装置における誤差補正方法及びそれを利用した動作計測装置
US20050055942A1 (en) 2003-08-26 2005-03-17 M & M Flooring Method for manufacturing and installing a prefabricated hardwood floor
JP2005228305A (ja) 2004-01-15 2005-08-25 Tokyoto Koreisha Kenkyu Fukushi Shinko Zaidan 老年症候群の危険性の判定方法
US20110145018A1 (en) 2005-03-21 2011-06-16 Fotsch Edward J Drug and medical device safety and support information reporting system, processing device and method
US8919066B2 (en) 2006-02-09 2014-12-30 University Of Notre Dame Du Lac Flooring apparatus for reducing impact energy during a fall
US20070238936A1 (en) 2006-04-10 2007-10-11 Shirley Ann Becker Portable Electronic Medical Assistant
US7558622B2 (en) 2006-05-24 2009-07-07 Bao Tran Mesh network stroke monitoring appliance
US20080010293A1 (en) 2006-07-10 2008-01-10 Christopher Zpevak Service level agreement tracking system
US7971141B1 (en) 2006-10-31 2011-06-28 Intuit Inc. Method and system for populating a form based on an existing format
US7445086B1 (en) 2007-01-16 2008-11-04 Daniel Sizemore Ladder lock
US7612681B2 (en) 2007-02-06 2009-11-03 General Electric Company System and method for predicting fall risk for a resident
US20090094285A1 (en) 2007-10-03 2009-04-09 Mackle Edward G Recommendation apparatus
US8206325B1 (en) 2007-10-12 2012-06-26 Biosensics, L.L.C. Ambulatory system for measuring and monitoring physical activity and risk of falling and for automatic fall detection
US10438496B2 (en) 2008-11-18 2019-10-08 Victoria Panzer Method and system for fall prevention in older adults
US20150019250A1 (en) 2009-05-22 2015-01-15 A-Vu Media Corp. Manager-controllable integrated user content and services system
US20110126197A1 (en) 2009-11-25 2011-05-26 Novell, Inc. System and method for controlling cloud and virtualized data centers in an intelligent workload management system
US20130204545A1 (en) 2009-12-17 2013-08-08 James C. Solinsky Systems and methods for sensing balanced-action for improving mammal work-track efficiency
US20110232708A1 (en) 2010-03-24 2011-09-29 James Martin Kemp Walker and wheel assembly
US8427324B2 (en) 2010-07-30 2013-04-23 General Electric Company Method and system for detecting a fallen person using a range imaging device
DE102010033232A1 (de) 2010-08-03 2012-02-09 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Bereitstellen eines Einmalpasswortes
AU2011291640B2 (en) 2010-08-18 2015-11-12 Security First Corp. Systems and methods for securing virtual machine computing environments
US9785744B2 (en) 2010-09-14 2017-10-10 General Electric Company System and method for protocol adherence
US9934427B2 (en) 2010-09-23 2018-04-03 Stryker Corporation Video monitoring system
EP2619724A2 (en) 2010-09-23 2013-07-31 Stryker Corporation Video monitoring system
JP2012101729A (ja) 2010-11-12 2012-05-31 Suminoe Textile Co Ltd 防滑性に優れた自動車用マット。
US8730297B2 (en) 2010-11-15 2014-05-20 Cisco Technology, Inc. System and method for providing camera functions in a video environment
WO2012075268A2 (en) 2010-12-01 2012-06-07 University Of Utah Research Foundation Faint and fall assessment
US20120165618A1 (en) 2010-12-22 2012-06-28 Richard Algoo Method and apparatus for health avatar
US8827930B2 (en) 2011-01-10 2014-09-09 Bioguidance Llc System and method for patient monitoring
CA2770933C (en) 2011-03-11 2021-05-25 Intellacare Inc. A method and system for monitoring the activity of a subject within spatial temporal and/or behavioral parameters
US20120253233A1 (en) 2011-03-31 2012-10-04 Greene Barry Algorithm for quantitative standing balance assessment
US20130127620A1 (en) 2011-06-20 2013-05-23 Cerner Innovation, Inc. Management of patient fall risk
US9355393B2 (en) 2011-08-18 2016-05-31 Visa International Service Association Multi-directional wallet connector apparatuses, methods and systems
CA2839141C (en) 2011-07-08 2018-11-20 Global Nutrition & Health Inc. Personalized nutritional and wellness assistant
US8771206B2 (en) 2011-08-19 2014-07-08 Accenture Global Services Limited Interactive virtual care
WO2013058985A1 (en) 2011-10-17 2013-04-25 Kimmel Zebadiah M Method and apparatus for detecting deterioration of health status
WO2013071285A1 (en) 2011-11-11 2013-05-16 Rutgers, The State University Of New Jersey Methods for the diagnosis and treatment of neurological disorders
US20130303860A1 (en) 2011-11-21 2013-11-14 Robert Bender Systems and methods for use in fall risk assessment
EP2610724B1 (en) 2011-12-27 2022-01-05 Tata Consultancy Services Limited A system and method for online user assistance
US20130212501A1 (en) 2012-02-10 2013-08-15 Glen J. Anderson Perceptual computing with conversational agent
GB2500058B (en) 2012-03-09 2014-04-02 Kari Hjelt A dynamically configurable balancing board
US9372252B2 (en) 2012-03-21 2016-06-21 Secure Care Products, Llc Outdoor object location system and method thereof
US9408561B2 (en) 2012-04-27 2016-08-09 The Curators Of The University Of Missouri Activity analysis, fall detection and risk assessment systems and methods
US9597016B2 (en) 2012-04-27 2017-03-21 The Curators Of The University Of Missouri Activity analysis, fall detection and risk assessment systems and methods
US10265028B2 (en) 2012-08-16 2019-04-23 Ginger.io, Inc. Method and system for modeling behavior and heart disease state
US9536049B2 (en) 2012-09-07 2017-01-03 Next It Corporation Conversational virtual healthcare assistant
WO2014043757A1 (en) 2012-09-20 2014-03-27 National Ict Australia Limited Stride detection
US9208676B2 (en) 2013-03-14 2015-12-08 Google Inc. Devices, methods, and associated information processing for security in a smart-sensored home
US9338622B2 (en) 2012-10-04 2016-05-10 Bernt Erik Bjontegard Contextually intelligent communication systems and processes
US20140171834A1 (en) 2012-10-20 2014-06-19 Elizabethtown College Electronic-Movement Analysis Tool for Motor Control Rehabilitation and Method of Using the Same
CA2834877A1 (en) 2012-11-28 2014-05-28 Henry Leung System and method for event monitoring and detection
US9706949B2 (en) 2013-02-27 2017-07-18 The Board Of Trustees Of The University Of Alabama, For And On Behalf Of The University Of Alabama In Huntsville Systems and methods for automatically quantifying mobility
US20140257851A1 (en) 2013-03-05 2014-09-11 Clinton Colin Graham Walker Automated interactive health care application for patient care
US9258522B2 (en) 2013-03-15 2016-02-09 Stryker Corporation Privacy setting for medical communications systems
US10726461B2 (en) 2013-03-15 2020-07-28 Ncr Corporation System and method of completing an activity via an agent
US9317916B1 (en) 2013-04-12 2016-04-19 Aic Innovations Group, Inc. Apparatus and method for recognition of medication administration indicator
CA2947936C (en) 2013-05-04 2023-02-21 Christopher Decharms Mobile security technology
US20140358828A1 (en) 2013-05-29 2014-12-04 Purepredictive, Inc. Machine learning generated action plan
CN105263411B (zh) 2013-06-06 2019-11-01 皇家飞利浦有限公司 跌倒检测系统及方法
US9591996B2 (en) 2013-06-07 2017-03-14 Lumo BodyTech, Inc System and method for detecting transitions between sitting and standing states
DE102013017264A1 (de) 2013-10-17 2015-04-23 Dräger Medical GmbH Verfahren für die Überwachung eines Patienten innerhalb eines medizinischen Überwachungsbereichs
US10733866B2 (en) 2013-10-29 2020-08-04 The Sheba Fund For Health Services And Research Walker-assist device
US10475141B2 (en) 2014-02-06 2019-11-12 Empoweryu, Inc. System and method for adaptive indirect monitoring of subject for well-being in unattended setting
KR101700217B1 (ko) 2014-10-02 2017-01-26 (주)직토 웨어러블 디바이스와 휴대용 전자기기를 사용한 생체인증 방법
US10360349B2 (en) 2014-10-27 2019-07-23 MolecularMatch, Inc. Personalized medicine service
CN104361321B (zh) 2014-11-13 2018-02-09 侯振杰 一种判断老年人摔倒行为及身体平衡能力的方法
US10289868B2 (en) 2014-11-27 2019-05-14 Siemens Aktiengesellschaft Transmitting medical datasets
US10019553B2 (en) 2015-01-27 2018-07-10 Catholic Health Initiatives Systems and methods for virtually integrated care delivery
US10896756B2 (en) 2015-04-21 2021-01-19 Washington State University Environmental sensor-based cognitive assessment
US10307084B2 (en) 2015-06-30 2019-06-04 Zibrio Inc. Identifying fall risk using machine learning algorithms
US20180182472A1 (en) 2015-06-30 2018-06-28 Kenzie L. Preston Method and system for a mobile health platform
CA2936876A1 (en) 2015-07-22 2017-01-22 Radicalogic Technologies, Inc. Dba Rl Solutions Systems and methods for near-real or real-time contact tracing
US10206630B2 (en) 2015-08-28 2019-02-19 Foresite Healthcare, Llc Systems for automatic assessment of fall risk
US11170626B2 (en) 2015-09-17 2021-11-09 Luvozo Pbc Automated environment hazard detection
US10387963B1 (en) 2015-09-24 2019-08-20 State Farm Mutual Automobile Insurance Company Method and system of generating a call agent avatar using artificial intelligence
US10768772B2 (en) 2015-11-19 2020-09-08 Microsoft Technology Licensing, Llc Context-aware recommendations of relevant presentation content displayed in mixed environments
US20190220727A1 (en) 2018-01-17 2019-07-18 SameDay Security, Inc. Computing Devices with Improved Interactive Animated Conversational Interface Systems
US10813572B2 (en) 2015-12-11 2020-10-27 Electronic Caregiver, Inc. Intelligent system for multi-function electronic caregiving to facilitate advanced health diagnosis, health monitoring, fall and injury prediction, health maintenance and support, and emergency response
US20170193163A1 (en) 2015-12-30 2017-07-06 Accenture Global Solutions Limited User device platform for interacting with cloud-based platform
US10460024B2 (en) 2016-01-05 2019-10-29 Adobe Inc. Interactive electronic form workflow assistant that guides interactions with electronic forms in a conversational manner
US10376739B2 (en) 2016-01-08 2019-08-13 Balance4Good, Ltd. Balance testing and training system and method
US10692011B2 (en) 2016-01-21 2020-06-23 Verily Life Sciences Llc Adaptive model-based system to automatically quantify fall risk
ITUB20160119A1 (it) 2016-02-04 2017-08-04 Teseo Srl Sistema di monitoraggio ed assistenza private di persone, in particolare di anziani o di persone con problemi speciali o di carattere cognitivo
JP6687039B2 (ja) * 2016-02-05 2020-04-22 株式会社リコー 物体検出装置、機器制御システム、撮像装置、物体検出方法、及びプログラム
US20170273601A1 (en) 2016-03-28 2017-09-28 Lumo BodyTech, Inc System and method for applying biomechanical characterizations to patient care
CN106056035A (zh) 2016-04-06 2016-10-26 南京华捷艾米软件科技有限公司 一种基于体感技术的幼儿园智能监控方法
US10795947B2 (en) 2016-05-17 2020-10-06 Google Llc Unified message search
US11259742B2 (en) 2016-08-19 2022-03-01 Curiato Inc. System, method, and computer readable medium for dynamic pressure damage risk assessment and response
US20180075220A1 (en) 2016-09-12 2018-03-15 National Health Coalition, Inc. Methods for Processing Submission and Fulfillment of Pharmaceutical Prescriptions in Real Time
US9972187B1 (en) 2016-11-13 2018-05-15 Agility4Life Biomechanical parameter determination for emergency alerting and health assessment
JP6812772B2 (ja) * 2016-12-09 2021-01-13 富士ゼロックス株式会社 監視装置及びプログラム
US10748061B2 (en) * 2016-12-19 2020-08-18 Futurewei Technologies, Inc. Simultaneous localization and mapping with reinforcement learning
US10628635B1 (en) 2017-03-29 2020-04-21 Valyant AI, Inc. Artificially intelligent hologram
CN107411515A (zh) 2017-07-27 2017-12-01 胡彦 产妇跌倒保护装置
US10561549B2 (en) 2017-07-28 2020-02-18 Hill-Rom Services, Inc. Bed-based safety protocol control
US20190042700A1 (en) 2017-08-02 2019-02-07 Imam Abdulrahman Bin Faisal University Apparatus and method for real-time assessment, mapping, and building databases of quality of life indicators
US11694109B2 (en) 2017-08-16 2023-07-04 ODH, Inc. Data processing apparatus for accessing shared memory in processing structured data for modifying a parameter vector data structure
KR102481883B1 (ko) 2017-09-27 2022-12-27 삼성전자주식회사 위험 상황을 감지하는 방법 및 장치
US11032337B2 (en) 2017-10-16 2021-06-08 Vincent Paul Spinella-Mamo Contextual and collaborative media
US10657259B2 (en) 2017-11-01 2020-05-19 International Business Machines Corporation Protecting cognitive systems from gradient based attacks through the use of deceiving gradients
WO2019108603A1 (en) 2017-11-28 2019-06-06 Sigma Ratings, Inc. Machine learning techniques for evaluating entities
US10650338B2 (en) 2017-12-27 2020-05-12 Pearson Education, Inc. Automated registration and greeting process—custom queueing (security)
US20190259475A1 (en) 2018-02-20 2019-08-22 SameDay Security, Inc. Connected Kiosk for the Real-Time Assessment of Falls Risk
US10922585B2 (en) 2018-03-13 2021-02-16 Recogni Inc. Deterministic labeled data generation and artificial intelligence training pipeline
US11213224B2 (en) 2018-03-19 2022-01-04 Electronic Caregiver, Inc. Consumer application for mobile assessment of functional capacity and falls risk
US11923058B2 (en) 2018-04-10 2024-03-05 Electronic Caregiver, Inc. Mobile system for the assessment of consumer medication compliance and provision of mobile caregiving
US11093747B2 (en) 2018-04-16 2021-08-17 Peerwell, Inc. Hazard recognition
US11488724B2 (en) 2018-06-18 2022-11-01 Electronic Caregiver, Inc. Systems and methods for a virtual, intelligent and customizable personal medical assistant
US11040714B2 (en) 2018-09-28 2021-06-22 Intel Corporation Vehicle controller and method for controlling a vehicle
EP3920797A4 (en) 2019-02-05 2022-11-02 Electronic Caregiver, Inc. IDENTIFYING THE RISKS OF A 3D ENVIRONMENT USING REINFORCED LEARNING
US11113943B2 (en) 2019-05-07 2021-09-07 Electronic Caregiver, Inc. Systems and methods for predictive environmental fall risk identification
US20210273962A1 (en) 2020-02-28 2021-09-02 Electronic Caregiver, Inc. Intelligent platform for real-time precision care plan support during remote care management
US20210358202A1 (en) 2020-05-13 2021-11-18 Electronic Caregiver, Inc. Room Labeling Drawing Interface for Activity Tracking and Detection

Also Published As

Publication number Publication date
US20200251220A1 (en) 2020-08-06
EP3920797A1 (en) 2021-12-15
AU2020218172B2 (en) 2023-01-12
US11791050B2 (en) 2023-10-17
KR20210133228A (ko) 2021-11-05
CA3126844A1 (en) 2020-08-13
SG11202107882TA (en) 2021-08-30
WO2020163180A1 (en) 2020-08-13
JP2022519283A (ja) 2022-03-22
AU2020218172A1 (en) 2021-08-12
EP3920797A4 (en) 2022-11-02

Similar Documents

Publication Publication Date Title
BR112021014734A2 (pt) Identificação de riscos em ambiente 3d utilizando aprendizagem por reforço
US11521067B2 (en) Decentralized distributed deep learning
CN110580197A (zh) 大型模型深度学习的分布式计算架构
CN111260774B (zh) 生成3d关节点回归模型的方法和装置
US10642875B2 (en) Accurate relationship extraction with word embeddings using minimal training data
CN109740167B (zh) 用于生成信息的方法和装置
CN106132341B (zh) 形状的预测
JP2020077343A (ja) ルール生成装置、ルール生成方法及びルール生成プログラム
US11854674B2 (en) Determining rate of recruitment information concerning a clinical trial
US10769866B2 (en) Generating estimates of failure risk for a vehicular component
CN105308553A (zh) 动态提供存储
EP3336796A1 (en) Simulation program, simulation method, and simulation device
BR112019004945B1 (pt) Conversão de serviço de integração de dados
CN113924560A (zh) 利用半监督深度学习理解对医学人工智能系统的查询意图
EP3336778A1 (en) Policy introduced effect prediction apparatus, policy introduced effect prediction program, and policy introduced effect prediction method
CN110732137A (zh) 对深度学习网络的注意力的持续控制
Seekhao et al. In situ visualization for 3D agent-based vocal fold inflammation and repair simulation
Rahman et al. Machine learning and deep learning-based approach in smart healthcare: Recent advances, applications, challenges and opportunities
Proficz et al. Performance and power-aware modeling of MPI applications for cluster computing
US11514318B2 (en) Multi-source transfer learning from pre-trained networks
US10839936B2 (en) Evidence boosting in rational drug design and indication expansion by leveraging disease association
CN113034428A (zh) 用于在头部ct平扫图像中检测急性颅内出血的深度学习系统
US20150142709A1 (en) Automatic learning of bayesian networks
US20170103182A1 (en) Modelling Disease Progression and Intervention Effects Using Non-Clinical Information Proxies for Clinical Information
US20220141196A1 (en) Patterned and correlated electrical activity

Legal Events

Date Code Title Description
B11A Dismissal acc. art.33 of ipl - examination not requested within 36 months of filing
B11Y Definitive dismissal - extension of time limit for request of examination expired [chapter 11.1.1 patent gazette]