BR102021026038A2 - USE OF MACHINE LEARNING ALGORITHMS FOR THE DETECTION AND SCREENING OF BREAST CANCER - Google Patents

USE OF MACHINE LEARNING ALGORITHMS FOR THE DETECTION AND SCREENING OF BREAST CANCER Download PDF

Info

Publication number
BR102021026038A2
BR102021026038A2 BR102021026038-6A BR102021026038A BR102021026038A2 BR 102021026038 A2 BR102021026038 A2 BR 102021026038A2 BR 102021026038 A BR102021026038 A BR 102021026038A BR 102021026038 A2 BR102021026038 A2 BR 102021026038A2
Authority
BR
Brazil
Prior art keywords
breast cancer
machine learning
screening
detection
learning algorithms
Prior art date
Application number
BR102021026038-6A
Other languages
Portuguese (pt)
Inventor
Yara Cristina De Paiva Maia
Alinne Tatiane Faria Silva
Izabella Cristina Costa Ferreira
Mário Machado Martins
Donizeti Willian Santos
Marcelo De Almeida Maia
Robinson Sabino Da Silva
Paula Philbert Lajolo Canto
Juliana Carvalho Penha Pereira
Lara De Andrade Marques
Leticia Lopes Dantas Santos
Larissa Tannús Goulart
Original Assignee
Universidade Federal de Uberlândia
Imunoscan Engenharia Molecular Ltda
Filing date
Publication date
Application filed by Universidade Federal de Uberlândia, Imunoscan Engenharia Molecular Ltda filed Critical Universidade Federal de Uberlândia
Publication of BR102021026038A2 publication Critical patent/BR102021026038A2/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Abstract

A presente invenção se refere ao uso de algoritmo de aprendizado de máquina para triagem de pacientes com câncer de mama compreendendo a seleção de algoritmo de aprendizado de máquina para analisar dados obtidos por espectroscopia de infravermelho da saliva e utilização deste modelo de detecção para a discriminação do câncer de mama da doença benigna da mama. Especificamente, a invenção compreende um método para discriminar câncer de mama da doença benigna da mama baseado em: i) amostra biológica, mais especificamente, saliva; ii) espectroscopia de infravermelho com transformada de Fourier modo refletância total atenuada (ATR-FTIR); e iii) algoritmo de aprendizado de máquina. A aplicação do modelo seguirá as etapas: 1º) preparação da amostra 2º) classificação utilizando o algoritmo Neural Network. Essa metodologia não utiliza reagentes, otimizando o processo para ser executado em minutos, tendo o potencial de ser utilizado como ferramenta complementar na triagem do câncer de mama.

Figure 102021026038-6-abs
The present invention relates to the use of a machine learning algorithm for screening patients with breast cancer comprising the selection of a machine learning algorithm to analyze data obtained by infrared spectroscopy of saliva and the use of this detection model for the discrimination of the breast cancer from benign breast disease. Specifically, the invention comprises a method to discriminate breast cancer from benign breast disease based on: i) biological sample, more specifically, saliva; ii) attenuated total reflectance Fourier transform infrared spectroscopy (ATR-FTIR); and iii) machine learning algorithm. The application of the model will follow these steps: 1st) sample preparation 2nd) classification using the Neural Network algorithm. This methodology does not use reagents, optimizing the process to be performed in minutes, having the potential to be used as a complementary tool in breast cancer screening.
Figure 102021026038-6-abs

Description

USO DE ALGORITMOS DE APRENDIZADO DE MÁQUINA PARA A DETECÇÃO E TRIAGEM DO CÂNCER DE MAMAUSE OF MACHINE LEARNING ALGORITHMS FOR THE DETECTION AND SCREENING OF BREAST CANCER CAMPO DA INVENÇÃOFIELD OF THE INVENTION

[001] O presente pedido de patente se refere ao uso de algoritmos de aprendizagem de máquina para triagem do câncer de mama. Mais particularmente, a invenção se refere à seleção de um modelo de detecção baseado em algoritmo de aprendizado de máquina para a análise de dados obtidos por espectroscopia de infravermelho da saliva e utilização deste modelo de detecção para a discriminação do câncer de mama da doença benigna da mama.[001] This patent application refers to the use of machine learning algorithms for breast cancer screening. More particularly, the invention relates to the selection of a detection model based on a machine learning algorithm for the analysis of data obtained by infrared spectroscopy of saliva and the use of this detection model for the discrimination of breast cancer from benign breast disease. breast.

DESCRIÇÃO DO ESTADO DA TÉNCICASTATE OF ART DESCRIPTION

[002] O câncer é a primeira causa de mortalidade prematura (ou seja, mortes entre 30 a 69 anos) em mais de 90 países (WHO,2018). O câncer de mama é o câncer mais comumente diagnosticado e o mais letal em mulheres (BRAY et al.,2018). Considerando que o câncer de mama é uma doença heterogênea com ampla variação na morfologia tumoral, características moleculares e resposta clínica (WILD et al.,2020), a busca por um método eficaz para a detecção não só em estádios iniciais da doença, mas que seja aplicado em amplas faixas etárias, é de suma importância.[002] Cancer is the leading cause of premature mortality (i.e. deaths aged 30 to 69 years) in more than 90 countries (WHO, 2018). Breast cancer is the most commonly diagnosed and the most lethal cancer in women (BRAY et al., 2018). Considering that breast cancer is a heterogeneous disease with wide variation in tumor morphology, molecular characteristics and clinical response (WILD et al., 2020), the search for an effective method for detection not only in early stages of the disease, but which be applied in broad age groups, is of paramount importance.

[003] Apesar dos dados alarmantes, o câncer de mama será detectado em apenas 3% a 6% das mulheres com sintomas clínicos e quando este sintomas são investigados, a maioria dos diagnósticos é doença benigna da mama (STACHS et al., 2019). Dessa forma, métodos que possibilitem distinguir o câncer de mama da doença benigna da mama são necessários na rotina clínica.[003] Despite the alarming data, breast cancer will be detected in only 3% to 6% of women with clinical symptoms and when these symptoms are investigated, most diagnoses are benign breast disease (STACHS et al., 2019) . Thus, methods that make it possible to distinguish breast cancer from benign breast disease are necessary in the clinical routine.

[004] O diagnóstico do tumor inclui várias etapas, tais como, análise de imagens, biópsia tecidual, testes sanguíneos e genéticos (ZANG et al.,2013). Nenhuma dessas técnicas isoladamente é suficiente para obtenção do diagnóstico e, essas técnicas, podem ser bastante invasivas. Por exemplo, a mamografia, padrão ouro para a triagem, apresenta dados não necessariamente convergentes no que se refere à eficácia e custo-efetividade (WHO,2014). Mais de 50% das mulheres que realizam o rastreamento mamográfico para o câncer de mama, em um período de 10 anos, recebem pelo menos um laudo falso positivo (HUBBARD et al.,2011), o que ressalta a necessidade de novos métodos.[004] Tumor diagnosis includes several steps, such as image analysis, tissue biopsy, blood and genetic tests (ZANG et al., 2013). None of these techniques alone is sufficient to obtain the diagnosis, and these techniques can be quite invasive. For example, mammography, the gold standard for screening, presents data that are not necessarily convergent with regard to efficacy and cost-effectiveness (WHO, 2014). More than 50% of women who undergo mammographic screening for breast cancer, over a period of 10 years, receive at least one false positive report (HUBBARD et al., 2011), which highlights the need for new methods.

[005] Um modelo ideal para detecção e triagem do câncer de mama deve ser altamente preciso, precisa utilizar amostras coletadas de forma não invasiva e de forma rápida e, o teste precisa ter reprodutibilidade (ZHANG et al., 2010). Considerando o meio de detecção, a saliva oferece tais vantagens em relação ao sangue. Além disso, os biomarcadores presentes na circulação sanguínea podem infiltrar em ácinos e, eventualmente, serem secretados na saliva (ZHANG et al., 2016). Portanto, a saliva reflete o estado fisiológico e/ou patológico do organismo, de forma que amostras salivares podem ser utilizadas para monitorar o estado clínico e prever doenças sistêmicas (SUGIMOTO et al.,2010).[005] An ideal model for detection and screening of breast cancer should be highly accurate, use samples collected non-invasively and quickly, and the test needs to be reproducible (ZHANG et al., 2010). Considering the means of detection, saliva offers such advantages over blood. In addition, biomarkers present in the bloodstream can infiltrate acini and eventually be secreted in saliva (ZHANG et al., 2016). Therefore, saliva reflects the physiological and/or pathological state of the organism, so saliva samples can be used to monitor the clinical state and predict systemic diseases (SUGIMOTO et al., 2010).

[006] A espectroscopia de infravermelho com transformada de Fourier (FTIR) tem sido amplamente aplicada para melhorar a detecção do câncer (SALA et al.,2020). O uso dessa técnica é atrativo, pois apresenta baixo custo, rapidez, alta sensibilidade e especificidade, reprodutibilidade, não necessita de reagentes para a sua execução e por fim precisa de pequenos volumes de amostra (FINLAYSON et al.,2019; TALARI et al., 2016). Os espectros resultantes são fortemente influenciados por uma série de fenômenos físicos e para minimizar tais efeitos, utiliza-se o modo Reflexão Total Atenuada (ATR)(ELMER, 2007). Os picos de ATR-FTIR podem ser atribuídos à vibrações específicas de ligações químicas ou grupos funcionais dentro da molécula e fornecem, portanto, informações sobre a possível composição da amostra (MITCHELL et al.,2014).[006] Fourier transform infrared spectroscopy (FTIR) has been widely applied to improve cancer detection (SALA et al., 2020). The use of this technique is attractive because it has low cost, speed, high sensitivity and specificity, reproducibility, does not require reagents for its execution and finally requires small sample volumes (FINLAYSON et al., 2019; TALARI et al. , 2016). The resulting spectra are strongly influenced by a series of physical phenomena and to minimize such effects, the Attenuated Total Reflection (ATR) mode is used (ELMER, 2007). ATR-FTIR peaks can be attributed to specific vibrations of chemical bonds or functional groups within the molecule and therefore provide information about the possible composition of the sample (MITCHELL et al., 2014).

[007] Uma ferramenta notável que auxilia a análise do imenso conjunto de dados gerados pelo ATR-FTIR é o aprendizado de máquina, uma subárea robusta da inteligência artificial, que permite o rápido processamento e identificação dos modelos mais relevantes para obtenção de alta sensibilidade e especificidade para diferenciação de grupos de amostras(GOLDENBERG et al., 2019).[007] A notable tool that helps the analysis of the immense data set generated by ATR-FTIR is machine learning, a robust subarea of artificial intelligence, which allows the rapid processing and identification of the most relevant models to obtain high sensitivity and specificity for differentiating sample groups(GOLDENBERG et al., 2019).

[008] O Requerente concebeu, testou e incorporou a presente invenção de forma a superar as deficiências do estado da técnica e obter os propósitos e vantagens acima mencionados e abaixo explicitados.[008] The Applicant conceived, tested and incorporated the present invention in order to overcome the deficiencies of the state of the art and obtain the purposes and advantages mentioned above and explained below.

[009] O documento de patente BR1020180153080A2 apresenta um método para detecção baseado em modos vibracionais (a área média do espectro original entre 1433 cm-1 e 1302,9 cm-1 e (ii) na média do vetor de intensidade do vale da segunda derivada do espectro em 1041 cm-1) detectados por espectroscopia ATR-FTIR na saliva para ser utilizado como biomarcador para o câncer de mama. Porém, ao comparamos a metodologia e o método de detecção propostos pela patente BR1020180153080A2 com o presente pedido de patente, verificamos diferenças significativas, principalmente pelo fato de que o presente pedido de patente se utiliza de uma ferramenta poderosa (inteligência artificial – aprendizado de máquina) para garantir a acurácia do método.[009] The patent document BR1020180153080A2 presents a method for detection based on vibrational modes (the average area of the original spectrum between 1433 cm-1 and 1302.9 cm-1 and (ii) the average of the intensity vector of the valley of the second derived spectrum at 1041 cm-1) detected by ATR-FTIR spectroscopy in saliva to be used as a biomarker for breast cancer. However, when we compare the methodology and detection method proposed by patent BR1020180153080A2 with the present patent application, we find significant differences, mainly due to the fact that the present patent application uses a powerful tool (artificial intelligence - machine learning) to ensure the accuracy of the method.

[010] Os documentos de patente US6841388, CN110136108, US20040089809, US2012/0082362A1, WO2017/042579A1 e US20140236021A1 utilizam a espectroscopia de infravermelho para detecção do câncer de mama por meio de amostras de tecido. Por utilizarem tecido, torna-se uma técnica invasiva e por não utilizarem algoritmos para análise dos resultados, dificulta-se a replicação do método.[010] Patent documents US6841388, CN110136108, US20040089809, US2012/0082362A1, WO2017/042579A1 and US20140236021A1 use infrared spectroscopy to detect breast cancer through tissue samples. Because they use tissue, it becomes an invasive technique and because they do not use algorithms to analyze the results, it is difficult to replicate the method.

[011] Os documentos de patente US20130089248A1, US20170343548A1, US2014270457A1, IN2020410388156, IN202141027587 e US20080015448 descrevem a utilização de aprendizado de máquina para diagnóstico do câncer de mama através, principalmente, da análise de imagens de tecidos. Dessa forma, apesar de utilizarem algoritmos para otimizar o processo, a obtenção das imagens pode ser prejudicada por diversas condições da mulher, como mamas densas.[011] The patent documents US20130089248A1, US20170343548A1, US2014270457A1, IN2020410388156, IN202141027587 and US20080015448 describe the use of machine learning for the diagnosis of breast cancer, mainly through the analysis of tissue images. Thus, despite using algorithms to optimize the process, obtaining images can be hampered by various conditions of the woman, such as dense breasts.

[012] Os documentos de patente US20180214/05A1, US20160283658A1 e US20050049497A1 utilizam as imagens geradas por raio-X para a análise do tecido e detecção do câncer mama. Apesar de ser uma técnica menos invasiva do que a biópsia, as mulheres ainda são submetidas à radiação para obtenção das imagens.[012] Patent documents US20180214/05A1, US20160283658A1 and US20050049497A1 use images generated by X-rays for tissue analysis and detection of breast cancer. Despite being a less invasive technique than biopsy, women are still subjected to radiation to obtain images.

[013] O documento de patente US6855554 separa proteínas do aspirado do mamilo por eletroforese e por meio de comparação das imagens dos géis e com o auxílio de algoritmos de aprendizado de máquina discrimina câncer de mama de controle. Ao utilizar imagens de géis e eletroforese, além do tempo ser uma importante restrição, a demanda por profissionais especializados, para realizar tal técnica, torna-se uma importante limitação. Nesta patente, utiliza-se um método que pode ser realizado rapidamente e sem a necessidade de profissionais altamente especializados.[013] The patent document US6855554 separates proteins from the nipple aspirate by electrophoresis and by comparing the images of the gels and with the aid of machine learning algorithms discriminates control breast cancer. When using gel images and electrophoresis, in addition to time being an important constraint, the demand for specialized professionals to perform such a technique becomes an important limitation. In this patent, a method is used that can be performed quickly and without the need for highly specialized professionals.

[014] O documento de patente US9678059B2 utiliza sensores e algoritmos de aprendizado de máquina para fornecer um método de diagnóstico, monitoramento, prognóstico ou estadiamento de vários tipos de câncer por meio de soro, urina, fezes, suor, corrimento vaginal, saliva e esperma. A necessidade de sensores construídos por meio de nanopartículas torna esse método com custo mais elevado e pelo fato de ser utilizado para vários tipos de câncer pode não proporcionar alta especificidade para o câncer de mama, como é o caso do método aqui apresentado.[014] Patent document US9678059B2 uses sensors and machine learning algorithms to provide a method of diagnosing, monitoring, prognosticating or staging various types of cancer through serum, urine, feces, sweat, vaginal discharge, saliva and sperm . The need for sensors built using nanoparticles makes this method more expensive and, because it is used for several types of cancer, it may not provide high specificity for breast cancer, as is the case with the method presented here.

[015] Os documentos de patente US2004/0206905A1 e WO2012/153326A1 disponibilizam métodos de diagnóstico rápido para detectar o estado patológico comparando a presença ou ausência de características do espectro no infravermelho (FTIR) entre sangue de indivíduos doentes e saudáveis. No entanto, o sangue é um fluído complexo contendo um número desconcertante de componentes, levando a grandes variações de amostras e, portanto, a confiabilidade e especificidade questionáveis.[015] Patent documents US2004/0206905A1 and WO2012/153326A1 provide rapid diagnostic methods to detect the pathological state by comparing the presence or absence of infrared spectrum characteristics (FTIR) between blood from sick and healthy individuals. However, blood is a complex fluid containing a bewildering number of components, leading to large sample variations and therefore questionable reliability and specificity.

[016] Os documentos de patente US20190041324A1 e US6620621 disponibilizam métodos de diagnóstico rápido para detectar o estado patológico comparando a presença ou ausência de características do espectro no infravermelho (FTIR) entre células cancerosas, pré-cancerosas ou células “normais”. Este método utiliza como amostra biológica o tecido e sua obtenção é altamente invasivo e gera altas taxas de morbidade.[016] The patent documents US20190041324A1 and US6620621 provide rapid diagnostic methods to detect the pathological state by comparing the presence or absence of infrared spectrum characteristics (FTIR) between cancer cells, pre-cancerous cells or “normal” cells. This method uses tissue as a biological sample and obtaining it is highly invasive and generates high morbidity rates.

[017] O documento de patente US20170130275A1 utiliza ácido nucleico capazes de se ligar ao miRNA presente em amostra de soro ou plasma de pacientes com câncer de mama e para detectar está ligação pode-se utilizar PCR, Northen ou Sourthen blot e hibridização in situ. Porém, são técnicas de alto custo e necessitam de profissionais especializados.[017] The patent document US20170130275A1 uses nucleic acid capable of binding to the miRNA present in a sample of serum or plasma from patients with breast cancer and to detect this connection, PCR, Northen or Sourthen blot and in situ hybridization can be used. However, they are expensive techniques and require specialized professionals.

[018] O documento de patente US2007/0003921A1 visa identificar o grau de inflamação sistêmica utilizando FTIR e dessa forma correlacionar com o grau de agressividade do tumor pela razão ácido nucléico/proteína. Este método não detecta diretamente o câncer, mas uma inflamação que pode estar relacionada à várias condições patológicas e não somente o câncer.[018] The patent document US2007/0003921A1 aims to identify the degree of systemic inflammation using FTIR and thus correlate with the degree of aggressiveness of the tumor by the nucleic acid/protein ratio. This method does not directly detect cancer, but an inflammation that can be related to several pathological conditions and not just cancer.

[019] O documento de patente W099/00660 apresenta um método de triagem para tumores baseado na caracterização de DNA presente no tecido para distinguir câncer primário de metastático. Porém, este método utiliza uma molécula altamente instável e para sua análise são necessários equipamentos e reagentes de alto custo e profissionais altamente qualificados.[019] The patent document W099/00660 presents a screening method for tumors based on the characterization of DNA present in the tissue to distinguish primary from metastatic cancer. However, this method uses a highly unstable molecule and its analysis requires expensive equipment and reagents and highly qualified professionals.

[020] O documento de patente WO2014/191980A1 disponibiliza um método que compreende a obtenção de um espectro infravermelho de células mononucleares de sangue periférico e sua análise para indicar presença de tumor benigno. A identificação de tumores benignos é de suma importância para redução de cirurgias desnecessárias, mas neste método não há comparação com câncer, o que pode ser uma lacuna quando transposto para a rotina clínica.[020] The patent document WO2014/191980A1 provides a method that comprises obtaining an infrared spectrum of peripheral blood mononuclear cells and analyzing it to indicate the presence of a benign tumor. The identification of benign tumors is of paramount importance to reduce unnecessary surgeries, but this method does not compare with cancer, which can be a gap when transposed into the clinical routine.

[021] O documento de patente WO2016/097996A1 disponibiliza um método de análise de vesículas extracelulares isoladas de fluídos biológicos por ATR-FTIR e através dessa análise obter o diagnóstico, prognóstico e monitorar estados fisiopatológicos. Porém, a necessidade de passos adicionais na metodologia para isolar vesículas extracelulares, torna essa técnica mais demorada e a demanda por equipamentos mais robustos para sua execução, torna o presente pedido mais simples e fácil de ser implementado em diferentes locais sem alto custo.[021] The patent document WO2016/097996A1 provides a method of analysis of extracellular vesicles isolated from biological fluids by ATR-FTIR and through this analysis obtain the diagnosis, prognosis and monitor pathophysiological states. However, the need for additional steps in the methodology to isolate extracellular vesicles, makes this technique more time consuming and the demand for more robust equipment for its execution, makes the present application simpler and easier to be implemented in different places without high cost.

[022] Os documentos de patente CA2525725A1 e EP1477803A1 provem biomoléculas que discriminam o câncer de mama de outras alterações da mama por meio de espectrometria iônica de fase gasosa. Por este método utilizar a espectrometria, um equipamento robusto e com alto custo, torna sua utilização em vários locais difícil e ainda demanda profissionais altamente qualificados.[022] The patent documents CA2525725A1 and EP1477803A1 provide biomolecules that discriminate breast cancer from other breast changes by means of gas phase ion spectrometry. Because this method uses spectrometry, a robust and expensive equipment, it is difficult to use it in several places and still demands highly qualified professionals.

[023] O documento de patente US20110212851A1 apresenta biomarcadores salivares relacionados ao câncer de mama e estes criam a base para um ensaio de detecção para o câncer de mama por PCR, espectrometria de massa, hibridização de microarray e/ou sequenciamento. Porém, além do tempo ser uma importante restrição, a demanda por profissionais especializados, para realizar tais técnicas, torna-se essencial. Neste presente documento de patente, utiliza-se um método que pode ser realizado rapidamente e sem necessidade de alta especialização.[023] The patent document US20110212851A1 presents salivary biomarkers related to breast cancer and these create the basis for a detection assay for breast cancer by PCR, mass spectrometry, microarray hybridization and/or sequencing. However, in addition to time being an important constraint, the demand for specialized professionals to perform such techniques becomes essential. In this present patent document, a method is used that can be carried out quickly and without the need for high expertise.

[024] O documento de patente BR1020200109928 utiliza FTIR e inteligência artificial para diagnóstico de COVID-19 na saliva. Entretanto, para garantirmos que o método aqui apresentado não possui validade clínica para o COVID-19, ressaltando que validade clínica é definida como a habilidade do método ter acurácia para identificar pacientes com um estado patológico alvo, realizamos o teste do modelo aqui desenvolvido em 15 amostras positivas para COVID-19 e 15 amostras negativas para COVID-19. O modelo desenvolvido e treinado em amostras de câncer de mama e doença benigna da mama utilizando o algoritmo Neural Network, nos números de onda entre 1675.7 cm-1-1461.1 cm-1 apresentou uma sensibilidade de 0%, especificidade de 93% e acurácia de 47%, sendo que 15 amostras positivas para COVID-19 de um total de 15 foram erroneamente classificadas como negativas pelo método aqui apresentado, confirmando assim a validade clínica do método de triagem apenas para o câncer de mama.[024] The patent document BR1020200109928 uses FTIR and artificial intelligence for the diagnosis of COVID-19 in saliva. However, to ensure that the method presented here does not have clinical validity for COVID-19, emphasizing that clinical validity is defined as the ability of the method to be accurate in identifying patients with a target pathological state, we performed the test of the model developed here in 15 positive samples for COVID-19 and 15 negative samples for COVID-19. The model developed and trained on samples of breast cancer and benign breast disease using the Neural Network algorithm, at wave numbers between 1675.7 cm-1-1461.1 cm-1, showed a sensitivity of 0%, specificity of 93% and accuracy of 47%, and 15 positive samples for COVID-19 out of a total of 15 were mistakenly classified as negative by the method presented here, thus confirming the clinical validity of the screening method only for breast cancer.

[025] Nenhum dos ensinamentos do estado da técnica demonstram ou sugerem um método que utiliza algoritmos de aprendizado de máquina para auxiliar na análise de dados de saliva obtidos por ATR-FTIR para distinguir câncer de mama da doença benigna da mama.[025] None of the teachings of the prior art demonstrate or suggest a method that uses machine learning algorithms to aid in the analysis of saliva data obtained by ATR-FTIR to distinguish breast cancer from benign breast disease.

[026] Dessa forma, o presente pedido de patente une as vantagens de a amostra biológica ser a saliva, com a rapidez e custo-efetividade do ATR-FTIR e o poder de análise do algoritmo. Além disso, não há restrições em relação a idade ou constituição das mamas, o que possibilita a ampla triagem de todas as faixas etárias em busca da detecção do câncer de mama.[026] Thus, the present patent application combines the advantages of the biological sample being saliva, with the speed and cost-effectiveness of ATR-FTIR and the analysis power of the algorithm. In addition, there are no restrictions regarding age or breast structure, which makes possible the wide screening of all age groups in search of detection of breast cancer.

SUMÁRIO DA INVENÇÃOSUMMARY OF THE INVENTION

[027] A presente invenção é apresentada e caracterizada nas reivindicações independentes, enquanto as reivindicações dependentes descrevem outras características da invenção ou modalidades relativas à ideia inventiva principal.[027] The present invention is presented and characterized in the independent claims, while the dependent claims describe other characteristics of the invention or modalities related to the main inventive idea.

[028] Em um primeiro aspecto, a presente invenção provê o uso de algoritmos de aprendizado de máquina para detecção e triagem do câncer de mama, compreendendo as etapas de: (i)obtenção da amostra biológica; (ii)aquecimento da amostra para retirar o excesso de água; (iii) obtenção do espectro por ATR-FTIR; (iv)pré processamento dos espectros; (v) classificação dos pacientes utilizando o algoritmo de aprendizado de máquina.[028] In a first aspect, the present invention provides the use of machine learning algorithms for detection and screening of breast cancer, comprising the steps of: (i) obtaining the biological sample; (ii) heating the sample to remove excess water; (iii) obtaining the spectrum by ATR-FTIR; (iv) pre-processing of the spectra; (v) classification of patients using the machine learning algorithm.

[029] Em um segundo aspecto, a presente invenção provê o uso de saliva como amostra biológica.[029] In a second aspect, the present invention provides the use of saliva as a biological sample.

[030] Em um terceiro aspecto, a presente invenção provê que o pré-processamento dos espectros envolve o Gaussian Smoothing (SM) com desvio padrão de 5, correção quanto a linha de base por meio da Rubberband (RB) positiva, normalização pelo mínimo e máximo (MM) e aplicação da terceira derivada, através do filtro de Savitzky-Golay.[030] In a third aspect, the present invention provides that the pre-processing of the spectra involves Gaussian Smoothing (SM) with a standard deviation of 5, baseline correction through the positive Rubberband (RB), normalization by the minimum and maximum (MM) and application of the third derivative, through the Savitzky-Golay filter.

[031] Em um quarto aspecto, a presente invenção provê que o algoritmo de aprendizado de máquina é o Neural Network nos números de onda entre 1675.7 cm-1-1461.1 cm-1.[031] In a fourth aspect, the present invention provides that the machine learning algorithm is the Neural Network in wavenumbers between 1675.7 cm-1-1461.1 cm-1.

[032] Em um quinto aspecto, a presente invenção provê que a classificação dos pacientes ocorre de uma maneira automatizada, discriminando câncer de mama de doença benigna da mama.[032] In a fifth aspect, the present invention provides that the classification of patients occurs in an automated manner, discriminating breast cancer from benign breast disease.

BREVE DESCRIÇÃO DAS FIGURASBRIEF DESCRIPTION OF THE FIGURES

[033] A Figura 1 apresenta espectros originais ATR-FTIR médios representativos (4000cm-1–650 cm-1) na saliva de pacientes com doença benigna da mama (negativo) e câncer de mama (positivo).[033] Figure 1 presents original mean representative ATR-FTIR spectra (4000cm-1–650 cm-1) in the saliva of patients with benign breast disease (negative) and breast cancer (positive).

[034] A Figura 2 apresenta espectros ATR-FTIR médios representativos (4000 cm-1 –650 cm-1) aplicados a terceira derivada na saliva de pacientes com doença benigna da mama (negativo) e câncer de mama (positivo).[034] Figure 2 shows representative mean ATR-FTIR spectra (4000 cm-1 –650 cm-1) applied to the third derivative in the saliva of patients with benign breast disease (negative) and breast cancer (positive).

DESCRIÇÃO DETALHADA DA INVENÇÃODETAILED DESCRIPTION OF THE INVENTION

[035] Vamos agora nos referir em detalhes às várias modalidades da presente invenção, e entende-se que os exemplos aqui especificados não devem ser lidos como restritivos do escopo de proteção do presente pedido, mas sim apenas como uma exemplificação da aplicação da invenção pleiteada neste pedido de patente.[035] We will now refer in detail to the various modalities of the present invention, and it is understood that the examples specified herein should not be read as restrictive of the scope of protection of the present application, but only as an exemplification of the application of the claimed invention in this patent application.

[036] Os inventores do presente pedido de patente, por meio de experimentos utilizando amostras biológicas de saliva de pacientes com doença benigna da mama ou com câncer de mama, foram capazes de diferenciar os dois grupos.[036] The inventors of this patent application, through experiments using biological samples of saliva from patients with benign breast disease or breast cancer, were able to differentiate the two groups.

[037] A metodologia utilizada na presente invenção é baseada em três componentes principais, que são combinados para alcançar o resultado desejado: i) amostra biológica, mais especificamente saliva; ii) espectroscopia de infravermelho com transformada de Fourier modo refletância total atenuada (ATR-FTIR); e iii) algoritmos de aprendizado de máquina.[037] The methodology used in the present invention is based on three main components, which are combined to achieve the desired result: i) biological sample, more specifically saliva; ii) attenuated total reflectance Fourier transform infrared spectroscopy (ATR-FTIR); and iii) machine learning algorithms.

[038] Frente a estes fatos, o presente pedido de patente propõe a discriminação do câncer de mama da doença benigna da mama, por meio de um modelo de detecção, isento de reagentes, executado em minutos e sem necessidade de profissionais especializados.[038] In view of these facts, this patent application proposes the discrimination of breast cancer from benign breast disease, through a detection model, free of reagents, performed in minutes and without the need for specialized professionals.

[039] Mais particularmente, sugere-se a utilização desse modelo de detecção para a triagem de pacientes com câncer de mama.[039] More particularly, it is suggested the use of this detection model for the screening of patients with breast cancer.

[040] Assim, a presente invenção propõe a utilização de ATRFTIR para análise da saliva e por meio de algoritmo de aprendizado de máquina classificar a amostra em câncer de mama ou doença benigna da mama de uma maneira automatizada.[040] Thus, the present invention proposes the use of ATRFTIR for saliva analysis and through machine learning algorithm classify the sample in breast cancer or benign breast disease in an automated way.

[041] Especificamente, o algoritmo de aprendizado de máquina é Neural Network, nos números de onda entre 1675.7 cm-1- 1461.1 cm-1, apresentando uma sensibilidade de 84%, especificidade de 78% e acurácia de 81%.[041] Specifically, the machine learning algorithm is Neural Network, in wavenumbers between 1675.7 cm-1- 1461.1 cm-1, with a sensitivity of 84%, specificity of 78% and accuracy of 81%.

[042] Assim, o presente pedido de patente propõe mais particularmente um método para triagem do câncer de mama, por um modelo de detecção em que compreende as etapas de:[042] Thus, the present patent application more particularly proposes a method for screening breast cancer, by means of a detection model comprising the steps of:

[043] Etapa de preparação da amostra:

  • - Obtenção da amostra biológica, preferencialmente uma amostra de fluído biológico, preferencialmente saliva;
  • - Aquecimento da amostra para retirar excesso de água;
  • - Obtenção do espectro por ATR-FTIR;
  • - Pré-processamento dos espectros;
[043] Sample preparation step:
  • - Obtaining the biological sample, preferably a sample of biological fluid, preferably saliva;
  • - Sample heating to remove excess water;
  • - Obtaining the spectrum by ATR-FTIR;
  • - Pre-processing of spectra;

[044] Etapa de classificação da amostra:

  • -Utilizando o algoritmo Neural Network, nos números de onda entre 1675.7 cm-1-1461.1 cm-1, detectar os pacientes com câncer de mama.
[044] Sample classification step:
  • -Using Neural Network algorithm, at wave numbers between 1675.7 cm-1-1461.1 cm-1, detect breast cancer patients.

[045] A presente invenção será ainda melhor compreendida por meio da descrição dos resultados obtidos. Os procedimentos experimentais envolvidos estão detalhados no final desse relatório descritivo.[045] The present invention will be even better understood through the description of the results obtained. The experimental procedures involved are detailed at the end of this descriptive report.

Exemplo 1Example 1

[046] Esse exemplo refere-se às características dos sujeitos do estudo diagnosticados com câncer de mama.[046] This example refers to the characteristics of the study subjects diagnosed with breast cancer.

[047] A Tabela 1 apresenta as características clínicas e hormonais de pacientes com câncer de mama.

Figure img0001
Figure img0002
[047] Table 1 presents the clinical and hormonal characteristics of patients with breast cancer.
Figure img0001
Figure img0002

Exemplo 2Example 2

[048] Esse exemplo refere-se a análise do espectro ATR-FTIR médio na saliva de pacientes com doença benigna da mama ou câncer de mama.[048] This example refers to the analysis of the average ATR-FTIR spectrum in the saliva of patients with benign breast disease or breast cancer.

[049] A Figura 1 apresenta o espectro original ATR-FTIR médio representativo (4000cm-1–650cm-1) na saliva de pacientes com doença benigna da mama ou câncer de mama.[049] Figure 1 shows the representative mean original ATR-FTIR spectrum (4000cm-1–650cm-1) in the saliva of patients with benign breast disease or breast cancer.

[050] A Figura 2 apresenta o espectro ATR-FTIR, com a terceira derivada, médio representativo (4000cm-1 –650cm-1) na saliva de pacientes com doença benigna da mama ou câncer de mama.[050] Figure 2 shows the ATR-FTIR spectrum, with the third derivative, representative mean (4000cm-1 –650cm-1) in the saliva of patients with benign breast disease or breast cancer.

Exemplo 3Example 3

[051] Esse exemplo refere-se a análise pelos principais algoritmos de aprendizado de máquina para números de onda relevantes.[051] This example refers to analysis by leading machine learning algorithms for relevant wavenumbers.

[052] A Tabela 2 apresenta as especificações de algoritmos de aprendizado de máquina aplicados para classificar câncer de mama e doença benigna da mama.

Figure img0003
Figure img0004
E=Especificidade, S=Sensibilidade, A=Acurácia, MM= normalização pelo mínimo e máximo, RB= Rubberband, SM = Gaussian Smoothing.[052] Table 2 presents the specifications of machine learning algorithms applied to classify breast cancer and benign breast disease.
Figure img0003
Figure img0004
E=Specificity, S=Sensitivity, A=Accuracy, MM= Normalization by minimum and maximum, RB= Rubberband, SM = Gaussian Smoothing.

[053] Para a discriminação entre câncer de mama e doença benigna da mama, o algoritmo de aprendizado de máquina Neural Network, nos números de onda entre 1675.7 cm-1-1461.1 cm-1, com uma sensibilidade de 84%, especificidade de 78% e acurácia de 81%.[053] For discrimination between breast cancer and benign breast disease, the Neural Network machine learning algorithm, at wave numbers between 1675.7 cm-1-1461.1 cm-1, with a sensitivity of 84%, specificity of 78 % and accuracy of 81%.

[054] Os demais algoritmos de aprendizado de máquina testados foram descritos na tabela 2.[054] The other machine learning algorithms tested were described in table 2.

[055] Os resultados mais expressivos utilizaram do préprocessamento com a terceira derivada.[055] The most expressive results used pre-processing with the third derivative.

[056] O algoritmo Neural Network apresentou maior sensibilidade, para discriminar câncer de mama da doença benigna da mama, em comparação com a mamografia que apresenta uma sensibilidade geral de 80% (HOLLINGSWORTH, 2019) e para mulheres jovens ou com mamas densas a sensibilidade diminui para 50% (HOLLINGSWORTH, 2019).[056] The Neural Network algorithm showed greater sensitivity, to discriminate breast cancer from benign breast disease, compared to mammography which has an overall sensitivity of 80% (HOLLINGSWORTH, 2019) and for young women or women with dense breasts the sensitivity decreases to 50% (HOLLINGSWORTH, 2019).

Metodologia EmpregadaMethodology Employed

[057] A seguir, é descrita a metodologia para o desenvolvimento do método de discriminação do câncer de mama da doença benigna da mama através da saliva por meio de ATRFTIR e com auxílio de algoritmos de aprendizado de máquina.[057] Next, the methodology for developing the method of discrimination of breast cancer from benign breast disease through saliva using ATRFTIR and with the aid of machine learning algorithms is described.

Aspectos éticos e participantes do estudoEthical aspects and study participants

[058] A presente invenção foi conduzida no Hospital de Clínicas da Universidade Federal de Uberlândia e o projeto foi aprovado pelo Comitê de Ética em Pesquisa com Seres Humanos (número do parecer: 4.047.065/2020) e baseado na Declaração de Helsinque. Termo de Consentimento Livre e Esclarecido foi obtido de todas as participantes. Os critérios de exclusão foram idade inferior a 18 anos, sítio do tumor primário diferente da mama, apresentar metástases detectáveis a distância, histórico de tratamentos prévios para o câncer de mama, histórico de outro tipo de câncer e incapacidade física ou mental para responder o questionário.[058] The present invention was conducted at the Clinical Hospital of the Federal University of Uberlândia and the project was approved by the Ethics Committee for Research with Human Beings (opinion number: 4,047,065/2020) and based on the Declaration of Helsinki. Free and Informed Consent Term was obtained from all participants. Exclusion criteria were age less than 18 years, primary tumor site other than the breast, having distant detectable metastases, history of previous treatments for breast cancer, history of another type of cancer and physical or mental inability to answer the questionnaire. .

[059] A amostra biológica foi coletada das pacientes que recorreram ao Hospital de Clínicas da Universidade Federal de Uberlândia. Todas as pacientes que realizaram corembiopsy ou cirurgia para fins de diagnóstico foram incluídas neste estudo.[059] The biological sample was collected from patients who attended the Hospital de Clínicas of the Federal University of Uberlândia. All patients who underwent core biopsy or surgery for diagnostic purposes were included in this study.

[060] Cada grupo, doença benigna da mama e câncer de mama, foi composto por 32 pacientes.[060] Each group, benign breast disease and breast cancer, consisted of 32 patients.

Coleta da amostra e processamentoSample collection and processing

[061] A saliva foi coletada em Salivette®, centrifugada a 3000 r.p.m por 15 minutos e armazenadas a -20ºC.[061] Saliva was collected in Salivette®, centrifuged at 3000 r.p.m for 15 minutes and stored at -20ºC.

[062] A espectroscopia de infravermelho por transformada de Fourier foi realizada no equipamento Cary 630 (Agilent Technologies) acoplado ao sensor de diamante, que funciona como um elemento de reflexão interno, para uma refletância total atenuada. Para captura dos dados utilizou-se o software MicroLab (Agilent Technologies).[062] The Fourier transform infrared spectroscopy was performed in the Cary 630 equipment (Agilent Technologies) coupled to the diamond sensor, which works as an internal reflection element, for an attenuated total reflectance. For data capture, the MicroLab software (Agilent Technologies) was used.

[063] As amostras foram aplicadas no volume total de 80uL em pastilhas de alumínio e aquecidas a 80ºC em banho seco.[063] The samples were applied in a total volume of 80uL in aluminum tablets and heated to 80ºC in a dry bath.

[064] O espectro do ar foi utilizado como background antes da análise de cada amostra. Os espectros foram analisados na região de número de onda de 4000 cm-1 a 650 cm-1, com 32 varreduras e resolução de 4 cm-1.[064] The air spectrum was used as a background before the analysis of each sample. Spectra were analyzed in the wavenumber region from 4000 cm-1 to 650 cm-1, with 32 scans and 4 cm-1 resolution.

Pré-processamento dos dados espectraisPre-processing of spectral data

[065] Os espectros originais foram submetidos a Gaussian Smoothing (SM) com desvio padrão de 5, corrigidos quanto a linha de base por meio da Rubberband (RB) positiva e normalizadas pelo mínimo e máximo (MM)usando o software Orange data mining versão 3.26. Este software também foi utilizado para aplicar a terceira derivada, quando necessário, através do filtro de Savitzky-Golay.[065] The original spectra were subjected to Gaussian Smoothing (SM) with a standard deviation of 5, corrected for the baseline using the positive Rubberband (RB) and normalized by the minimum and maximum (MM) using the Orange data mining software version 3.26. This software was also used to apply the third derivative, when necessary, through the Savitzky-Golay filter.

Análise EstatísticaStatistical analysis

[066] Após o pré-processamento espectral, os valores originais e derivados foram utilizados na análise estatística usando o software Orange data mining versão 3.26. A análise da diferença entre câncer de mama e doença benigna da mama foi realizado pelo teste t de Student, onde todos os números de onda, que apresentaram p<0.05, foram selecionados para serem testados no algoritmo.[066] After spectral pre-processing, the original and derived values were used in statistical analysis using Orange data mining software version 3.26. The analysis of the difference between breast cancer and benign breast disease was performed by Student's t test, where all wave numbers, which presented p<0.05, were selected to be tested in the algorithm.

Seleção dos Algoritmos de Aprendizado de MáquinaSelection of Machine Learning Algorithms

[067] O algoritmo de aprendizado de máquina foi escolhido de acordo com o melhor desempenho para distinguir câncer de mama da doença benigna da mama.[067] The machine learning algorithm was chosen according to the best performance to distinguish breast cancer from benign breast disease.

[068] Para analisar o desempenho preditivo diferenciado dos algoritmos de aprendizado de máquina, foi utilizada a validação cruzada, com dez combinações diferentes de dados.[068] To analyze the differentiated predictive performance of machine learning algorithms, cross-validation was used, with ten different combinations of data.

[069] Para mensurar os resultados obtidos, através de matriz de confusão, foram utilizadas três medidas de desempenho consolidadas na literatura: sensibilidade, especificidade e acurácia.
Almejando elaborar o melhor método de triagem foi selecionado o algoritmo Neural Network, configurado da seguinte forma: número de neurônios escondidos de 1000, ativação do tipo logística, otimizador L-BFGS-B, α=0.06, número máximo de interações de 500 e com replicação do treinamento.
[069] To measure the results obtained, through a confusion matrix, three performance measures consolidated in the literature were used: sensitivity, specificity and accuracy.
Aiming to elaborate the best screening method, the Neural Network algorithm was selected, configured as follows: number of hidden neurons of 1000, logistic type activation, L-BFGS-B optimizer, α=0.06, maximum number of interactions of 500 and with training replication.

ReferênciasReferences

[070] BRAY, F.; FERLAY, J.; SOERJOMATARAM, I.; SIEGEL, R.L.; TORRE, L.A.; JEMAL, A. Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA Cancer J Clin., v.68, n.6 p.394–424, 2018. Disponível em: https://doi.org/10.3322/caac.21492 PMID:30207593. Acesso em: 25 de outubro de 2021.[070] BRAY, F.; FERLAY, J.; SOERJOMATARAM, I.; SIEGEL, R. L.; TORRE, L.A.; JEMAL, A. Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. CA Cancer J Clin., v.68, n.6 p.394–424, 2018. Available at: https://doi.org/10.3322/caac.21492 PMID:30207593. Accessed on: October 25, 2021.

[071] FINLAYSON, D.; RINALDI, C.; BAKER, M. J. Is infrared spectroscopy ready for the clinic? Anal. Chem., v.91, p.12117-12128, 2019. Disponível em: https://doi.org/10.1021/acs.analchem.9b02280. Acesso em: 25 de outubro de 2021.[071] FINLAYSON, D.; RINALDI, C.; BAKER, M. J. Is infrared spectroscopy ready for the clinic? Anal. Chem., v.91, p.12117-12128, 2019. Available at: https://doi.org/10.1021/acs.analchem.9b02280. Accessed on: October 25, 2021.

[072] GOLDENBERG, L.; NIR, G.; SALCUDEAN, S. A new era: artificial intelligence and machine learning in prostate cancer. Nature Reviews Urology, v.16.,2019. DOI: 1. 10.1038/s41585-019-0193-3.[072] GOLDENBERG, L.; NIR, G.; SALCUDEAN, S. A new era: artificial intelligence and machine learning in prostate cancer. Nature Reviews Urology, v.16.,2019. DOI: 1. 10.1038/s41585-019-0193-3.

[073] HOLLINGSWORTH, A. Redefining the Sensitivity of Screening Mammography: a Review. The American Journal of Surgery., v.218, 2019. DOI: 10.1016/j.amjsurg.2019.01.039.[073] HOLLINGSWORTH, A. Redefining the Sensitivity of Screening Mammography: a Review. The American Journal of Surgery., v.218, 2019. DOI: 10.1016/j.amjsurg.2019.01.039.

[074] HUBBARD, R.A.; KERLIKOWSKE, K.; FLOWERS, C.I.; YANKASKAS, B.C.; ZHU, W.; MIGLIORETTI, D.L. Cumulative probability of false-positive recall or biopsy recommendation after 10 years of screening mammography: a cohort study. Ann Intern Med., v.155, n. 8, p.481-92, 2011.[074] HUBBARD, R.A.; KERLIKOWSKE, K.; FLOWERS, C.I.; YANKASKAS, B.C.; ZHU, W.; MIGLIORETTI, D.L. Cumulative probability of false-positive recall or biopsy recommendation after 10 years of screening mammography: a cohort study. Ann Intern Med., v.155, n. 8, p.481-92, 2011.

[075] MITCHELL, A.; GAJJAR, K.; THEOPHILOU, G.; MARTIN, F.; MARTIN-HIRSCH, P. Vibrational spectroscopy of biofluids for disease screening or diagnosis: Translation from the laboratory to a clinical setting. Journal of biophotonics, v.7, 2014. DOI:10.1002/jbio.201400018.[075] MITCHELL, A.; GAJJAR, K.; THEOPHILOU, G.; MARTIN, F.; MARTIN-HIRSCH, P. Vibrational spectroscopy of biofluids for disease screening or diagnosis: Translation from the laboratory to a clinical setting. Journal of biophotonics, v.7, 2014. DOI:10.1002/jbio.201400018.

[076] PERKIN, E. FT-IR spectroscopy: attenuated total reflectance (ATR). Disponível em: (n.d.),https://web.archive.org/web/20070216065646/http:/las .perkinelmer.com/content/TechnicalInfo/TCH_FTIRATR.pdf Acesso em: 25 de outubro de 2021.[076] PERKIN, E. FT-IR spectroscopy: attenuated total reflectance (ATR). Available from: (n.d.),https://web.archive.org/web/20070216065646/http:/las .perkinelmer.com/content/TechnicalInfo/TCH_FTIRATR.pdf Accessed: October 25, 2021.

[077] STACHS, A.; STUBERT, J.; REIMER, T.; HARTMANN, S. Benign Breast Disease in Women. Dtsch Arztebl Int., v.9; n.116, p.565-574, 2019. DOI: 10.3238/arztebl.2019.0565.[077] STACHS, A.; STUBERT, J.; REIMER, T.; HARTMANN, S. Benign Breast Disease in Women. Dtsch Arztebl Int., v.9; n.116, p.565-574, 2019. DOI: 10.3238/arztebl.2019.0565.

[078] SUGIMOTO, M., WONG, D.T., HIRAYAMA, A., SOGA, T., TOMITA, M. Capillaryelectrophoresis mass spectrometry-based saliva metabolomics identified oral,breast and pancreatic cancer-specific profiles. Metabolomics,0.1007/s11306-009- 0178-y Acesso em: 25 de outubro de 2021.[078] SUGIMOTO, M., WONG, D.T., HIRAYAMA, A., SOGA, T., TOMITA, M. Capillaryelectrophoresis mass spectrometry-based saliva metabolomics identified oral,breast and pancreatic cancer-specific profiles. Metabolomics,0.1007/s11306-009-0178-y Accessed: October 25, 2021.

[079] TALARI, A.C.S.; MARTINEZ, M.A.G.; MOVASAGHI, Z.; REHMAN, S.; REHMAN, I.U. Advances in Fourier transform infrared (FTIR) spectroscopy of biological tissues. Appl.Spectrosc.Rev., v.52,p.456-506,2017. Disponível em: https://doi.org/10.1080/05704928.2016.1230863. Acesso em: 25 de outubro de 2021.[079] TALARI, A.C.S.; MARTINEZ, M.A.G.; MOVASAGHI, Z.; REHMAN, S.; REHMAN, I.U. Advances in Fourier transform infrared (FTIR) spectroscopy of biological tissues. Appl.Spectrosc.Rev., v.52,p.456-506,2017. Available at: https://doi.org/10.1080/05704928.2016.1230863. Accessed on: October 25, 2021.

[080] WORLD HEALTH ORGANIZATION. WHO position paper on mammography screening. Geneva, Switzerland, 2014. Disponível em: https://www.who.int/cancer/publications/mammography_screeni ng/en/. Acesso em: 25 de outubro de 2021.[080] WORLD HEALTH ORGANIZATION. WHO position paper on mammography screening. Geneva, Switzerland, 2014. Available at: https://www.who.int/cancer/publications/mammography_screening/en/. Accessed on: October 25, 2021.

[081] WORLD HEALTH ORGANIZATION . Global health estimates 2016: deaths by cause, age, sex, by country and by region, 2000–2016. Geneva, Switzerland, 2018. Disponível em: https://www.who.int/healthinfo/global_burden_disease/en/. Acesso em: 25 de outubro de 2021.[081] WORLD HEALTH ORGANIZATION . Global health estimates 2016: deaths by cause, age, sex, by country and by region, 2000–2016. Geneva, Switzerland, 2018. Available at: https://www.who.int/healthinfo/global_burden_disease/en/. Accessed on: October 25, 2021.

[082] WILD, C.P., WEIDERPASS, E., STEWART, B.W., editors. World Cancer Report: Cancer Research for Cancer Prevention. International Agency for Research on Cancer. Lyon, France, 2020. Disponível em: http://publications.iarc.fr/586. Acesso em: 25 de outubro de 2021.[082] WILD, C.P., WEIDERPASS, E., STEWART, B.W., editors. World Cancer Report: Cancer Research for Cancer Prevention. International Agency for Research on Cancer. Lyon, France, 2020. Available at: http://publications.iarc.fr/586. Accessed on: October 25, 2021.

[083] ZHANG, Y.J.; WEI, L.; LI, J.; ZHENG, Y.Q.; LI, X.R. Status quo and developmenttrend of breast biopsy technology. Gland Surg., v.2, p.15–24, 2013. Disponível em: http://dx.doi.org/10.3978/j.issn.2227-684X.2013.02.01. Acesso em: 25 de outubro de 2021.[083] ZHANG, Y.J.; WEI, L.; LI, J.; ZHENG, Y.Q.; LI, X.R. Status quo and development trend of breast biopsy technology. Gland Surg., v.2, p.15–24, 2013. Available at: http://dx.doi.org/10.3978/j.issn.2227-684X.2013.02.01. Accessed on: October 25, 2021.

[084] ZHANG, L.; XIAO, H.; KARLAN, S.; ZHOU, H.; GROSS, J.; ELASHOFF, D.; et al. Discoveryand preclinical validation of salivary transcriptomic and proteomic biomarkersfor the noninvasive detection of breast cancer. PLoS One, v.5, p.e15573,2010. Disponível em: http://dx.doi.org/10.1371/journal.pone.0015573. Acesso em: 25 de outubro de 2021.[084] ZHANG, L.; XIAO, H.; KARLAN, S.; ZHOU, H.; GROSS, J.; ELASHOFF, D.; et al. Discovery and preclinical validation of salivary transcriptomic and proteomic biomarkers for the noninvasive detection of breast cancer. PLoS One, v.5, p.e15573,2010. Available at: http://dx.doi.org/10.1371/journal.pone.0015573. Accessed on: October 25, 2021.

[085] ZHANG, C.; CHENG, X.; LI, J.; ZHANG, P.; YI, P.; XU, X.; ZHOU, X. Saliva in the diagnosis of diseases. International journal of oral science, v.8, 2016. Disponível em: 10.1038/ijos.2016.38. Acesso em: 25 de outubro de 2021.[085] ZHANG, C.; CHENG, X.; LI, J.; ZHANG, P.; YI, P.; XU, X.; ZHOU, X. Saliva in the diagnosis of diseases. International journal of oral science, v.8, 2016. Available at: 10.1038/ijos.2016.38. Accessed on: October 25, 2021.

Claims (5)

Uso de algoritmos de aprendizado de máquina para detecção e triagem do câncer de mama caracterizado pelo fato de que compreende as etapas de:
  • - obtenção da amostra biológica,
  • - aquecimento da amostra para retirar excesso de água;
  • - obtenção do espectro por ATR-FTIR;
  • - pré-processamento dos espectros;
  • - classificação dos pacientes utilizando o algoritmo de aprendizado de máquina.
Use of machine learning algorithms for detection and screening of breast cancer characterized by the fact that it comprises the steps of:
  • - obtaining the biological sample,
  • - heating the sample to remove excess water;
  • - obtaining the spectrum by ATR-FTIR;
  • - spectra pre-processing;
  • - classification of patients using machine learning algorithm.
Uso de algoritmos de aprendizado de máquina para detecção e triagem do câncer de mama, de acordo com a reivindicação 1, caracterizado pelo fato de que a amostra biológica é uma amostra de saliva.Use of machine learning algorithms for breast cancer detection and screening, according to claim 1, characterized by the fact that the biological sample is a saliva sample. Uso de algoritmos de aprendizado de máquina para detecção e triagem do câncer de mama, de acordo com a reivindicação 1, caracterizado pelo fato de o préprocessamento dos espectros envolver o Gaussian Smoothing (SM) com desvio padrão de 5, correção quanto a linha de base por meio da Rubberband (RB) positiva, normalização pelo mínimo e máximo (MM) e aplicação da terceira derivada, através do filtro de Savitzky-Golay.Use of machine learning algorithms for detection and screening of breast cancer, according to claim 1, characterized in that the pre-processing of the spectra involves Gaussian Smoothing (SM) with a standard deviation of 5, baseline correction through the positive Rubberband (RB), normalization by the minimum and maximum (MM) and application of the third derivative, through the Savitzky-Golay filter. Uso de algoritmos de aprendizado de máquina para detecção e triagem do câncer de mama, de acordo com a reivindicação 1, caracterizado pelo fato de que o algoritmo de aprendizado de máquina é Neural Network nos números de onda entre 1675.7 cm-1-1461.1 cm-1.Use of machine learning algorithms for detection and screening of breast cancer, according to claim 1, characterized by the fact that the machine learning algorithm is Neural Network in wavenumbers between 1675.7 cm-1-1461.1 cm- 1. Uso de algoritmos de aprendizado de máquina para detecção e triagem do câncer de mama, de acordo com a reivindicação 1, caracterizado pelo fato de que a classificação dos pacientes ocorre de uma maneira automatizada, discriminando câncer de mama de doença benigna da mama.Use of machine learning algorithms for detection and screening of breast cancer, according to claim 1, characterized by the fact that the classification of patients occurs in an automated way, discriminating breast cancer from benign breast disease.
BR102021026038-6A 2021-12-22 USE OF MACHINE LEARNING ALGORITHMS FOR THE DETECTION AND SCREENING OF BREAST CANCER BR102021026038A2 (en)

Publications (1)

Publication Number Publication Date
BR102021026038A2 true BR102021026038A2 (en) 2023-07-04

Family

ID=

Similar Documents

Publication Publication Date Title
JP6851096B2 (en) A saliva biomarker for detecting breast cancer and a method for identifying breast cancer patients using the biomarker from healthy subjects.
JP5823505B2 (en) Method for assessing colorectal cancer and colorectal polyps by measuring urinary metabolites
González-Solís et al. Type 2 diabetes detection based on serum sample Raman spectroscopy
Stefancu et al. SERS-based quantification of albuminuria in the normal-to-mildly increased range
Dawuti et al. Urine surface-enhanced Raman spectroscopy combined with SVM algorithm for rapid diagnosis of liver cirrhosis and hepatocellular carcinoma
JP2019168319A (en) Marker for metabolite in urine for inspecting childhood cancer
Liang et al. Filter-membrane-based ultrafiltration coupled with surface-enhanced raman spectroscopy for potential differentiation of benign and malignant thyroid tumors from blood plasma
Visser et al. Liquid biopsy-based decision support algorithms for diagnosis and subtyping of lung cancer
Dou et al. Rapid detection of serological biomarkers in gallbladder carcinoma using fourier transform infrared spectroscopy combined with machine learning
Chen et al. Rapid and sensitive detection of esophageal cancer by FTIR spectroscopy of serum and plasma
Rodriguez-Lopez et al. Impaired immune reaction and increased lactate and C-reactive protein for early prediction of severe morbidity and pancreatic fistula after pancreatoduodenectomy
CN111965240A (en) Product, application and method for thyroid cancer related screening and assessment
Chen et al. The accuracy of Raman spectroscopy in the diagnosis of lung cancer: a systematic review and meta-analysis
Li et al. Accuracy of Raman spectroscopy in discrimination of nasopharyngeal carcinoma from normal samples: a systematic review and meta-analysis
BR102021026038A2 (en) USE OF MACHINE LEARNING ALGORITHMS FOR THE DETECTION AND SCREENING OF BREAST CANCER
US10234382B2 (en) Method for diagnosing lung diseases
US20220236274A1 (en) A method to assist in the early diagnosis of pancreatic adenocarcinoma
JP7323971B2 (en) Methods and devices for use in diagnosing and monitoring colon cancer
Chen et al. Early differential diagnosis of pancytopenia related diseases based on serum surface-enhanced Raman spectroscopy
Bunaciu et al. Early diseases diagnosis in body fluids (serum and saliva) using infrared spectroscopy
BR102018015308A2 (en) method for detecting breast cancer based on salivary components
Chi et al. Application of breathomics in pediatric asthma: a review
JP6613526B2 (en) How to predict glioblastoma
Buchan et al. Review–Vibrational spectroscopy‐aided diagnosis, prognosis and treatment of inflammatory bowel disease
Magno et al. Blood-Based FTIR Spectroscopy as a Minimally Invasive Diagnostic Method for Colorectal Cancer: A Meta-Analysis