BR112019028294A2 - variantes genéticas associadas a comportamento hipersocial direcionado a humanos em cães domésticos - Google Patents

variantes genéticas associadas a comportamento hipersocial direcionado a humanos em cães domésticos Download PDF

Info

Publication number
BR112019028294A2
BR112019028294A2 BR112019028294-7A BR112019028294A BR112019028294A2 BR 112019028294 A2 BR112019028294 A2 BR 112019028294A2 BR 112019028294 A BR112019028294 A BR 112019028294A BR 112019028294 A2 BR112019028294 A2 BR 112019028294A2
Authority
BR
Brazil
Prior art keywords
seq
fact
dog
locus
wbs
Prior art date
Application number
BR112019028294-7A
Other languages
English (en)
Inventor
Bridgett Vonholt
Monique UDELL
Janet Sinsheimer
Original Assignee
The Trustees Of Princeton University
The Regents Of The University Of California
Oregon State University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by The Trustees Of Princeton University, The Regents Of The University Of California, Oregon State University filed Critical The Trustees Of Princeton University
Publication of BR112019028294A2 publication Critical patent/BR112019028294A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/124Animal traits, i.e. production traits, including athletic performance or the like
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

  São reveladas no presente documento variantes estruturais no lócus da síndrome de Williams-Beuren do genoma canino que são associadas a comportamento hipersocial em cães em relação a lobos, e que são informativos sobre a natureza do comportamento social em cães. Também é divulgado um teste comercial com esses loci como indicadores ao longo do espectro da socialidade. Métodos de criação de cães para selecionar cães com maior sociabilidade também são divulgados.

Description

“VARIANTES GENÉTICAS ASSOCIADAS A COMPORTAMENTO HIPERSOCIAL DIRECIONADO A HUMANOS EM CÃES DOMÉSTICOS” DECLARAÇÃO RELATIVA A PESQUISA OU DESENVOLVIMENTO PATROCINADO FEDERALMENTE
[0001] Esta invenção foi realizada com suporte governamental sob a concessão de nº GM086887 concedida pela National Institute of Health, e sob as concessões nos DEB-1245373 e DMS-1264153 concedidas pela National Science Foundation. O governo detém certos direitos sobre esta invenção.
REFERÊNCIAS CRUZADAS A PEDIDOS RELACIONADOS
[0002] Este pedido reivindica a prioridade do Pedido de Patente Provisório de Número de Série US 62/527.653, depositado em 30 de junho de 2017, cujo conteúdo do mesmo está aqui incorporado por referência em sua totalidade.
ANTECEDENTES
[0003] Embora tenha sido realizado um progresso considerável na compreensão da base genética de características morfológicas (por exemplo, tamanho corporal, cor da pelagem) em cães e lobos, as bases genéticas de sua divergência comportamental são insatisfatoriamente compreendidas. Embora décadas de pesquisa têm focado no relacionamento único entre humanos e cães domésticos, o papel da genética na formação da evolução comportamental canina ainda precisa ser elucidado. As hipóteses existentes sobre a divergência comportamental entre cães e lobos postula que cães são mais adeptos a solucionar problemas sociais (7) devido a uma cognição social evoluída semelhante a humana (2, 3). No entanto, crescentes evidencias sugerem que lobos humano-socializados podem igualar ou exceder o desempenho de cães domésticos nesses domínios sociocognitivos (4). Demonstrações empíricas permanecem robustas pelo fato de que cães demonstram comportamento gregário exagerado, referido como hipersociabilidade, que é uma maior propensão a iniciar contato social que geralmente é estendido a membros de outras espécies, quando comparado com lobos em idade adulta. Hipersociabilidade, uma faceta da síndrome de domesticação (5), é um fenótipo multifacetada que que pode incluir busca e observação de proximidade estendidas (6, 7), níveis elevados de oxitocinas (6), e inibição do comportamento de resolução de problemas independente na presença de seres humanos (8). Este comportamento provavelmente é causado pela neotenia comportamental, que é a extensão do comportamento juvenil na idade adulta e aumenta a capacidade de os cães formarem vínculos primários com companheiros sociais (4).
[0004] Devido às regras estritas de criação seletiva, raças distintas de cães estão em conformidade com um fenótipo previsível. É essa estrutura e isolamento populacional que apresenta o cão como um modelo poderoso para explorar os fundamentos genéticos de características complexas, como o comportamento (9). Muitas raças de cães foram classificadas coletivamente usando testes padronizados para traços de personalidade comportamentais centrais à sua natureza domesticada (por exemplo, capacidade de brincar, sociabilidade, agressividade, treinabilidade, curiosidade e arrojo) e função específica da raça (por exemplo, pastoreio, apontamento, caça, trabalho) (9, 10-17). Embora tenha havido uma forte seleção para a conformação da raça, contribuições da variação interindividual para a estimativa de herdabilidade sugerem que a genética desempenha um papel detectável na formação do comportamento social canino (18).
[0005] A evolução do fenótipo no genoma canino durante o processo de divergência entre cães e lobos durante a domesticação foi investigada através de uma varredura associada em todo o genoma de mais de 48.000 genótipos SNP de 701 cães de 85 raças, e 92 lobos cinzas com distribuição holártica (19). Usando divergência, o primeiro sítio discrepante de classificação foi localizado dentro de SLC24A4, um gene conhecido por conter um polimorfismo relacionado a variação da cor dos olhos e cabelos em humanos (19). O segundo sítio na classificação foi localizado dentro de
WBSCR17, um gene implicado na síndrome de Williams-Beuren (WBS) em humanos. WBS é um distúrbio do desenvolvimento neurológico causado por uma deleção homozigótica de 1,5 a 1,8 Mb no cromossomo humano 7q11.23 abrangendo aproximadamente 28 genes (20). Esta síndrome é caracterizada por atraso no desenvolvimento, comprometimento cognitivo, anormalidades comportamentais, e hipersociabilidade (21-23). Vários outros estudos adotaram uma abordagem diferente e direcionaram genes ligados ao comportamento social em outras taxas. Por exemplo, a variação-alvo foi examinada no receptor da dopamina D4 e tirosina hidroxilase, ambos os genes foram extensivamente estudados pelos seus papéis no sistema de recompensa do cérebro de primatas (24). O estudo encontrou uma associação entre polimorfismos de repetições mais longas com atividade e impulsividade reduzida em uma pesquisa limitada de raças. Em uma abordagem similar, uma variação pesquisada em um SNP regulatório no gene do receptor da ocitocina, também conhecida por influenciar a ligação de pares humanos, foi constato que está associada com a procura por proximidade e simpatia em duas raças de cães (25). Todavia, estudos genéticos comportamentais ainda sofrem com o desafio de entender a arquitetura genética de quase todas as facetas de um comportamento complexo.
SUMÁRIO
[0006] São revelados no presente documentos métodos para identificar cães ou lobos com predisposição para comportamento hipersocial, por exemplo, comportamento hipersocial direcionado a humanos. O método envolve a identificação de variantes estruturais de um locus genético específico da síndrome de Williams-Beuren (WBS) no cromossomo 6 dos cães e lobos. Em algumas modalidades, as variantes estruturais incluem pelo menos um de Cfa6.6, Cfa6.7, Cfa6.66 ou Cfa6.83. Em algumas modalidades, as variantes estruturais incluem pelo menos um dos genes GTF2I, GTF2IRD1 e WBSCR17.
[0007] Por conseguinte, é divulgado aqui um método para predição da probabilidade de um cão ou lobo apresentar um comportamento social compreendendo: (a) genotipar uma amostra biológica de um cão ou lobo; (b) contar o número de variantes estruturais no locus da Síndrome de Williams-Beuren (WBS) no cromossomo canino 6; e (c) prever a probabilidade de o cão ou lobo exibir um comportamento sociável com base no número de variantes estruturais.
[0008] A divulgação no presente documento permite métodos aprimorados de classificação de cães ou lobos de acordo com sua sociabilidade. Assim, é revelado no presente documento um método de classificar cães e lobos de acordo com a probabilidade de apresentarem comportamento sociável que compreende: (a) obter uma amostra biológica do primeiro cão ou lobo; (b) determinar o número de variantes estruturais no locus da Síndrome de Williams-Beuren (WBS) no cromossomo 6 do primeiro cão ou lobo; (c) obter uma amostra biológica do segundo cão ou lobo; (d) determinar o número de variantes estruturais no locus da síndrome de Williams-Beuren (WBS) no cromossomo 6 do segundo cão ou; e (e) classificar o primeiro cão como tendo maior probabilidade de exibir um comportamento sociável que o segundo cão se o número de variantes estruturais determinadas na etapa (b) for maior que o número de variantes estruturais determinados na etapa (d); ou (f) classificar o segundo cão como tendo maior probabilidade de exibir um comportamento sociável que o primeiro cão se o número de variantes estruturais determinadas na etapa (d) for maior que o número de variantes estruturais determinadas na etapa (b).
[0009] Em algumas modalidades, a amostra biológica é sangue, saliva, líquido cefalorraquidiano, pele ou urina.
[0010] Em algumas modalidades, genotipar a amostra biológica inclui amplificação por PCR e eletroforese em gel de agarose. Em algumas modalidades, a genotipagem utiliza pelo menos um iniciador selecionado do grupo que consiste em:
[0011] CCCCTTCAGCCAGCATATAA (SEQ ID NO: 1),
[0012] TTCTCTGGGCTGTCTGGACT (SEQ ID NO: 2),
[0013] AAGTTTCTCTGATGGAAAACACA (SEQ ID NO: 3),
[0014] GGTGGCTGGAAATTTCAGTAG (SEQ ID NO: 4),
[0015] TGGAGCCATGATTAGGAAGG (SEQ ID NO: 5),
[0016] TAAGGAAGGACCCCATTTCC (SEQ ID NO: 6),
[0017] TGCTGCTTCATGTTCTGTGA (SEQ ID NO: 7),
[0018] TGGTGCATTAGCTTTGGTTG (SEQ ID NO: 8),
[0019] AACCACAGGAACAAAACCTCA (SEQ ID NO: 9), e
[0020] CCTCCTGTTGGACATTTGGA (SEQ ID NO: 10).
[0021] Em algumas modalidades, a variante estrutural é um elemento transponível que interrompe o gene no locus WBS. Em algumas modalidades, o elemento transponível e um retrotransposon. Em algumas modalidades, o retrotransposon é um elemento nuclear intercalado curto (SINE) ou um elemento nuclear longo intercalado (LINE).
[0022] Em algumas modalidades, o método identifica pelo menos uma variante estrutural que ocorre dentro de pelo menos um gene selecionado do grupo que consiste em GTF2I, GTF2IRD1 e WBSCR17.
[0023] Em algumas modalidades, o comportamento social é selecionado do grupo que consiste em predisposição a atenção a estímulos sociais (ABS), hipersociabilidade (HYP) e interesse social em estranhos (SIS).
[0024] Em algumas modalidades, os métodos aqui divulgados incluem a contagem de variantes estruturais encontradas em Cfa6.6, Cfa6.7, Cfa6.66 e Cfa6.83.
[0025] É divulgado aqui um método de triagem de uma biblioteca de cães ou lobos que compreende: (a) obter uma biblioteca genômica de um cão ou lobo que contém o locus da Síndrome de Williams-Beuren (WBS) no cromossomo canino 6; (b) determinar o número de variantes estruturais no locus WBS.
[0026] Em algumas modalidades, a localização das variantes estruturais também é determinada.
[0027] Em algumas modalidades, a etapa (b) compreende determinar o número de variantes estruturais em pelo menos um dos GTF2I, GTF2IRD1 e WBSCR17. Em algumas modalidades, a etapa (b) compreende determinar o número de variantes estruturais em todos os GTF2I, GTF2IRD1 e WBSCR17.
[0028] Em algumas modalidades, a etapa (b) compreende a utilização da reação em cadeia de polimerase (PCR) para amplificar pelo menos um fragmento de DNA do locus WBS. Em algumas modalidades, o fragmento de DNA compreende ao menos um dos loci Cfa6.6, Cfa6.7, Cfa6.66 ou Cfa6.83.
[0029] Em algumas modalidades, a etapa (b) compreende o uso de PCR para amplificar o locus Cfa6.6 usando os iniciadores CCCCTTCAGCCAGCATATAA (SEQ ID NO: 1) (direto) e TTCTCTGGGCTGTCTGGACT (SEQ ID NO: 2) (reverso).
[0030] Em algumas modalidades, a etapa (b) compreende o uso de PCR para amplificar o locus Cfa6.6 usando os iniciadores AAGTTTCTCTGATGGAAAACACA (SEQ ID NO: 3) (direto) e GGTGGCTGGAAATTTCAGTAG (SEQ ID NO: 4) (reverso).
[0031] Em algumas modalidades, a etapa (b) compreende o uso de PCR para amplificar o locus Cfa6.7 usando os iniciadores TGGAGCCATGATTAGGAAGG (SEQ ID NO: 5) (direto) e TAAGGAAGGACCCCATTTCC (SEQ ID NO: 6) (reverso).
[0032] Em algumas modalidades, a etapa (b) compreende o uso de PCR para amplificar o locus Cfa6.66 usando os iniciadores TGCTGCTTCATGTTCTGTGA (SEQ ID NO: 7) (direto) e TGGTGCATTAGCTTTGGTTG (SEQ ID NO: 8) (reverso).
[0033] Em algumas modalidades, a etapa (b) compreende o uso de PCR para amplificar o locus Cfa6.83 usando os iniciadores AACCACAGGAACAAAACCTCA (SEQ ID NO: 9) (direto) e CCTCCTGTTGGACATTTGGA (SEQ ID NO: 10) (reverso).
[0034] Em algumas modalidades, a etapa (b) compreende o uso de eletroforese em gel de agarose para identificar fragmentos de DNA do locus WBS que alteraram a mobilidade em comparação com os fragmentos correspondentes do genoma de referência do cão e que são indicativas de variantes estruturais no locus WBS da biblioteca.
[0035] Em algumas modalidades, a etapa (b) compreende a etapa de hibridização usando ao menos usando pelo menos uma sonda do locus WBS que identifica variantes estruturais no locus WBS.
Em algumas modalidades, a etapa de hibridização compreende hibridização in situ por fluorescência (FISH).
[0036] Também são divulgados aqui métodos de reprodução canina. O método divulgado no presente documento que permite a predição da característica de sociabilidade dos caninos permite que os criadores selecionem os caninos para reprodução que possuem características de sociabilidade desejada. Ou seja, escolhendo caninos para reprodução que contenham variantes estruturais apropriadas do locus WBS, e ao não escolher para reprodução aqueles caninos que não contenham essas variantes, os criadores podem aumentar a probabilidade de que os descendentes exibam características desejáveis de sociabilidade, como predisposição atencional a estímulos sociais (ABS), hipersociabilidade (HYP), e interesse social em estranhos (SIS).
[0037] Com o tempo, isso pode levar ao desenvolvimento de linhas de reprodução de cães mais adequados para determinadas funções; por exemplo, caninos que são melhores animais de estimação da família, porque eles são mais apegados aos seus donos. De modo semelhante, traços indesejáveis como indiferença ou agressividade excessiva podem ser eliminados ou reduzidos.
[0038] Por conseguinte, um aspecto adicional da divulgação deste documento é um método de produção de cães com maior probabilidade de exibir um comportamento sociável compreendendo: (a) selecionar um cão e uma cadela para reproduzir que se sabe que cada um tem pelo menos uma variante estrutural dentro Cfa6.6, Cfa6.7, Cfa6.66 ou Cfa6.83 no locus da síndrome de Williams-Beuren (WBS); e (b) cruzar os cães da etapa (a) para produzir descendentes.
[0039] É também divulgado no presente documento um método de produção de cães com maior probabilidade de exibir comportamento social compreendendo:
(a) genotipar cães e cadelas para a presença de variantes estruturais no locus da síndrome de Williams-Beuren (WBS); (b) selecionar um cão e uma cadela que tenham ao menos uma variante estrutural em Cfa6.6, Cfa6.7, Cfa6.66 ou Cfa6.83 no locus WBS; e (c) acasalando os cães da etapa (b) para produzir descendentes.
[0040] Em algumas modalidades, a variante estrutural está em Cfa6.6, Cfa6.7, Cfa6.66 e Cfa6.83. Em algumas modalidades, a variante estrutural ocorre em pelo menos um gene selecionado do grupo consistindo em GTF2I, GTF2IRD1 e WBSCR17.
[0041] É descrito no presente documento um método de edição do genoma de um cão que compreende: (a) obter um cão; (b) usar repetições palindrômicas curtas agrupadas e regularmente interespaçadas (CRISPRs)/CRISPR-associada (Cas) 9 para inativar um gene no locus da síndrome de Williams-Beuren (WBS) no cromossomo 6 canino.
[0042] Consultar, Zou et al., Journal of Molecular Cell Biology (2015), 7(6), 580-58.
[0043] Em algumas modalidades, o cão é obtido porque é desejado aumentar a sociabilidade do cão.
[0044] Em algumas modalidades, o gene é GTF2I, GTF2IRD1 ou WBSCR17.
[0045] Outro aspecto divulgado no presente documento é um kit para detectar a presença de variantes estruturais dentro do locus canino da síndrome de Williams-Beuren (WBS). O kit pode compreender um ou mais iniciadores adequados para o uso em processos baseados em PCR para detectar as variantes estruturais. Estes iniciadores incluem:
[0046] CCCCTTCAGCCAGCATATAA (SEQ ID NO: 1),
[0047] TTCTCTGGGCTGTCTGGACT (SEQ ID NO: 2),
[0048] AAGTTTCTCTGATGGAAAACACA (SEQ ID NO: 3),
[0049] GGTGGCTGGAAATTTCAGTAG (SEQ ID NO: 4),
[0050] TGGAGCCATGATTAGGAAGG (SEQ ID NO: 5),
[0051] TAAGGAAGGACCCCATTTCC (SEQ ID NO: 6),
[0052] TGCTGCTTCATGTTCTGTGA (SEQ ID NO: 7),
[0053] TGGTGCATTAGCTTTGGTTG (SEQ ID NO: 8),
[0054] AACCACAGGAACAAAACCTCA (SEQ ID NO: 9), e
[0055] CCTCCTGTTGGACATTTGGA (SEQ ID NO: 10).
[0056] Em algumas modalidades, o kit compreende os iniciadores CCCCTTCAGCCAGCATATAA (SEQ ID NO: 1) e TTCTCTGGGCTGTCTGGACT (SEQ ID NO: 2).
[0057] Em algumas modalidades, o kit compreende os iniciadores AAGTTTCTCTGATGGAAAACACA (SEQ ID NO: 3) e GGTGGCTGGAAATTTCAGTAG (SEQ ID NO: 4).
[0058] Em algumas modalidades, o kit compreende os iniciadores TGGAGCCATGATTAGGAAGG (SEQ ID NO: 5) e TAAGGAAGGACCCCATTTCC (SEQ ID NO: 6).
[0059] Em algumas modalidades, o kit compreende os iniciadores TGCTGCTTCATGTTCTGTGA (SEQ ID NO: 7) e TGGTGCATTAGCTTTGGTTG (SEQ ID NO: 8).
[0060] Em algumas modalidades, o kit compreende os iniciadores AACCACAGGAACAAAACCTCA (SEQ ID NO: 9) e C CTC CTGTTGGAC ATTTGGA (SEQ ID NO: 10).
[0061] Em algumas modalidades, o kit compreende ainda instruções para o uso. Em outra modalidade, os iniciadores são classificados usando um marcador detectável. O kit ainda pode compreender ao menos um reagente adicional como um tampão, dNTPs, DNA polimerases, DNA ligases e enzimas de restrição.
BREVE DESCRIÇÃO DAS FIGURAS
[0062] O arquivo de patente ou pedido contém ao menos um desenho executado em cores. Cópias desta patente ou publicação de pedido de patente com desenhos a cores serão fornecidas pelo escritório mediante solicitação e pagamento da taxa necessária.
[0063] Figura 1. Associação de estruturas variantes com índices de comportamento direcionado a humanos. A) Associação com ABS, B) associação com HYP, e C) associação com SIS. Os gráficos Manhattan mostram a significância estatística de cada variante em função da posição na região-alvo. A linha horizontal azul indica significância estatística para o nível corrigido de Bonferroni (p=2,38x10-3). As variantes dos genes são verdes; variantes intergênicas são vermelhas.
[0064] Figura 2. Associação de variantes estruturais com comportamento social direcionado a humanos em regressões multivariadas. A) Associação no modelo de índice comportamental e B) Associação em modelo PC. Os gráficos Manhattan mostram a significância estatística de cada variante em função da posição na região-alvo. A linha horizontal azul indica significância estatística para o nível corrigido de Bonferroni (p=2,38x10-3); linha roxa tracejada indica significância sugestiva
(p=0,01). As variantes dos genes são verdes; variantes intergênicas são vermelhas.
[0065] Figura 3. Distância entre cães e lobos a partir de três índices comportamentais utilizados para predizer o fenótipo de WBS. Estrelas indicam diferenças significativas aos pares (p<0,05).
[0066] Figura 4. Gráfico de autovalores dos principais componentes do comportamento social direcionado a humanos. O gráfico mostra variação no conjunto de dados original (Tabela 16) explicado por cada PC.
[0067] Figura 5. Varredura de uma seleção positiva usando uma pontuação percentil bivariada (XP-EHH e FST) para identificar valores atípicos (linha tracejada; pontuação bivariada >2) indicou auxiliares no percentil 97,5º. Os genes anotados são indicados acima do gráfico como barras pretas e cinza, rotuladas com nomes de genes.
[0068] Figura 6. Padrões de bandas de eletroforese em gel para três genótipos de SV associados à hipersociabilidade.
[0069] Figura 7. Gráfico de pontos representando o A) número total de inserção por populações de espécies, e por cada locus atípico B) Cfa6.6, C) Cfa6.7, D) Cfa6.66 e E) Cfa6.83. As raças sublinhadas têm o estereótipo comportamental “procura atenção”. (Abreviações: Bernese da montanha, BMD; Border collie, BORD; Boxer, BOX; Basenji, BSNJ; Cairn terrier, CAIRN; Cães de estudo da WBS, Dog; Golden retriever, GOLD; Cão da montanha dos pirineus, GPYR; Jack Russell terrier, JACK; Malamute do alasca, MALA; Poodle miniatura, MPOO; Schnauzer miniatura, MSCHN; Cão- cantor-da-Nova-Guiné, NGSD; Cão-de-taiwan, PARIAH, Saluki, SALU; Cão de aldeia, Village; Cão de aldeia de Porto Rico, Village_PR; Oriente médio, ME; América do Norte, NA).
[0070] Figura 8. Gráficos da ANOVA do número total de inserções de SV em quatro loci atípicos dependem da participação da população para A) resíduo versus ajustado, B) gráfico Q-Q, C) localização da escala, e D) resíduos versus ponto de alavanca.
[0071] Figura 9. PCA de 25.510 SNPs não vinculados em todo o genoma da matriz Affymetrix K9HDSNP para seis lobos e cinco cães.
[0072] Figura 10. Pipeline de constatação de SV. Os números representam etapas dentro do pipeline da seguinte maneira: 1) Deplexação e controle de qualidade, 2) Alinhamento para referência, 3) Chamada de variante, 4) Constatação de SV por SoftSearch, 5) Constatação de SV por SVMerge, 6) Constatação de SV de inGAP-SV, 7) Filtragem de SV e 8) Mescla de SVs filtrados.
[0073] Figura 11. Sobreposição no número de SVs identificados pelo SVMerge, SoftSearch e inGAP-sv.
DESCRIÇÃO DETALHADA
[0074] “Marcador detectável” se refere a uma porção fixada a uma entidade (como uma sonda) para tornar a entidade detectável. A porção em si não precisa ser detectável; pode tornar-se detectável após a reação com outra porção. Marcadores detectáveis incluem fluoróforos, cromóforos, isótopos radioativos, agentes quimioluminescentes, haptenos e partículas magnéticas.
[0075] “Genotipagem” refere-se à análise estrutural do locus da Síndrome de Williams-Beuren no cromossomo canino 6, que fornece informações sobre a presença de variantes estruturais no locus WBS. A genotipagem pode ser realizada por qualquer meio conhecido na técnica, por exemplo, sequenciamento de DNA, uso de PCR seguido de eletroforese em gel de agarose ou ensaios de hibridação.
[0076] “Hipersociabilidade” refere-se a uma maior propensão a iniciar contato social que geralmente é estendido a membros de outra espécie.
[0077] Os presentes inventores determinaram que variantes estruturais nos genes associados à Síndrome de Williams-Beuren humana estão subjacentes à hipersociabilidade estereotipada em cães domésticos. Por conseguinte, aqui divulgadas são variantes genéticas associadas ao comportamento hipersocial direcionado a humanos em cães domésticos e um método para detectar o mesmo.
[0078] Um locus candidato associado à WBS em humanos e conhecido por estar sob seleção positiva no genoma do cão doméstico (19) foi identificado e reequilibrado. Verificou-se que essa região também abriga um grande número de variantes estruturais altamente polimórficas (SVs) em caninos, algumas das quais são particulares a um cão ou raça individual. Esse achado é concordante com a heterogeneidade genética da WBS em humanos, onde as deleções variam de 100Kb a 1,8Mb de tamanho com pontos de interrupção variáveis, atribuídos à instabilidade cromossômica (42-44). Foram identificadas SVs encontradas em vários indivíduos que estavam significativamente associadas a uma ou mais características comportamentais quantificadas, informativas sobre hipersociabilidade e cognição.
[0079] Cães domésticos apresentam algumas das principais características comportamentais quantificadas em indivíduos com WBS, principalmente hipersociabilidade na ausência de cognição social superior. Uma região genômica de 5 Mb no cromossomo 6 anteriormente encontrada sob seleção positiva em raças de cães domésticos foi analisada pelos presentes inventores. A exclusão dessa região em humanos está ligada à síndrome de Williams-Beuren (WBS), um distúrbio congênito de vários sistemas caracterizado por comportamento hipersocial. Dados quantitativos sobre fenótipos comportamentais sintomáticos da WBS em humanos foram associados a alterações estruturais no local da WBS em cães. Verificou-se que a hipersociabilidade, uma característica central da WBS, também é um elemento central da domesticação que distingue cães de lobos. São fornecidas evidências de que variantes estruturais no GTF2I e GTF2IRD1, genes previamente implicados no fenótipo comportamental de pacientes com WBS e contidos no locus WBS, contribuem para a extrema sociabilidade em cães. Esta constatação sugere que existem semelhanças na arquitetura genética da WBS e doçura canina, e que a seleção direcional pode ter como alvo um conjunto único de genes comportamentais vinculados, de grande efeito fenotípico, permitindo rápida divergência comportamental de cães e lobos, facilitando a coexistência com humanos.
[0080] Um terceiro gene descrito, WBSCR17, não foi previamente associado à sociabilidade. No entanto, esse gene é regulado ascendentemente em células tratadas com N-acetilglucosamina, um derivado da glicose, sugerindo um papel no metabolismo de carboidratos (54). As SVs no WBSCR17 podem representar uma adaptação a uma dieta rica em amido típica de vivência em assentamentos humanos, uma especulação concordante com um estudo anterior (55).
[0081] Dois dos SVs mais associados à hipersociabilidade, uma característica exibida exclusivamente em cães domésticos entre os canídeos, foram os elementos transponíveis SINE e LINE, subtipos de retrotransposons que apresentam altas taxas de inserção (por exemplo, 1 em 108 nascimentos humanos tem uma inserção de novo LI; 56). Com grandes consequências fenotípicas devido à amplificação de alguns loci, esses elementos móveis foram implicados na evolução do genoma canídeo (por exemplo, 57,58), bem como em doenças, síndromes e morfologia canina (por exemplo, 59-64).
[0082] Esses TEs foram pesquisados em uma amostragem extensa de caninos domésticos e selvagens e considerados extremamente raros em coiotes, enquanto outras inserções foram derivadas e encontradas apenas segregadas em cães domésticos. Com um tamanho amostral maior e alavancando fenótipos comportamentais de estereótipos de raças, foi encontrada uma associação significativa entre o número de cópias do
TE e o comportamento. Portanto, é concebível que a seleção que atue nos TEs associados à hipersociabilidade possa ter ajudado a moldar a evolução da família dos canídeos. Os SVs ligados à WBS canina provavelmente contribuem para o atraso no desenvolvimento que facilita a formação de vínculos entre espécies e a hipersociabilidade juvenil exibida em relação a esses companheiros sociais na idade adulta. Esse acoplamento apresenta um paralelo intrigante aos mesmos processos observados nos indivíduos afetados pela WBS (20). As variantes genéticas aqui divulgadas estão associadas ao comportamento hipersocial em cães e lobos domésticos e permitirão um teste para identificar cães domésticos com predisposições para distúrbios ou características comportamentais que os tornam mais ou menos adequados para a colocação em determinados lares ou funções de trabalho. Da mesma forma, esse teste pode ser usado em lobos em cativeiro para informar as práticas de criação. A abordagem divulgada permite um teste comercial para genotipar cães quanto à presença (ou ausência) dessas variantes genéticas. Em algumas modalidades, o teste divulgado é um teste baseado em PCR de locais genéticos específicos que são informativos sobre a influência genética para o comportamento.
[0083] Um teste genético comercial que emprega a abordagem divulgada pode genotipar e contar o número de variantes genéticas transportadas por cada cão individualmente. A presença ou ausência de cada variante pode ser avaliada para uma probabilidade de quanto mais (ou menos) social o cão é como resultado direto do genótipo, conhecido como efeito alélico.
[0084] Algumas modalidades dos métodos aqui divulgados utilizam iniciadores ou sondas. Iniciadores e sondas podem ser oligonucleotídeos de pelo menos 15 nucleotídeos de comprimento. Os iniciadores têm geralmente 15 pares de bases a 100 pares de bases e, de preferência, 17 pares de bases a 30 pares de bases. O iniciador não é particularmente limitado desde que seja capaz de amplificar pelo menos uma parte de um DNA compreendendo o locus canino da Síndrome de Williams- Beuren no cromossomo 6. O comprimento do DNA que os iniciadores amplificam é geralmente de 15 a 1000 pares de bases, de preferência 20 a 500 pares de bases e mais preferencialmente 20 a 200 pares de bases. Quando o oligonucleotídeo é utilizado como sonda, o seu comprimento é geralmente de 5 pares de bases a 200 pares de bases, preferencialmente 7 pares de bases a 100 pares de bases, mais preferencialmente 7 pares de bases a 50 pares de bases. A sonda não é particularmente limitada, desde que seja capaz de hibridar com um DNA que compreende o locus canino da Síndrome de Williams-Beuren no cromossomo 6.
[0085] Em modalidades preferenciais, os iniciadores são utilizados em pares que juntos amplificam uma região do locus da Síndrome de Williams-Beuren canina no cromossomo 6 que inclui uma variante estrutural. Em modalidades preferidas, a região é uma região de pelo menos um de GTF2I, GTF2IRD1 e WBSCR17.
[0086] Em algumas modalidades, as sondas hibridam com o locus canino da Síndrome de Williams-Beuren no cromossomo 6 no qual pelo menos um dos GTF2I, GTF2IRD1 e WBSCR17 não contém uma variante estrutural, mas não hibridizam com o locus canino da Síndrome de Williams-Beuren no cromossomo 6, em que pelo menos um dos GTF2I, GTF2IRD1 e WBSCR17 contém uma variante estrutural. Em algumas modalidades, as condições de hibridação são condições rigorosas de hibridação (ver, por exemplo, as condições divulgadas em Sambrook et al., Molecular Cloning, Cold Spring Harbor Laboratory Press, Nova York, EUA, 2ª edição, 1989).
[0087] Uma pessoa versada na técnica seria capaz de projetar iniciadores e sondas apropriados para os métodos aqui divulgados, com base nos ensinamentos aqui mencionados, em relação a GTF2I, GTF2IRD1 e WBSCR17 e o genoma de referência de cães.
[0088] Em algumas modalidades, as sondas são imobilizadas em uma fase sólida. Exemplos de fases sólidas incluem, entre outros, poços de microplacas, contas de plástico, membranas de nylon e partículas magnéticas.
EXEMPLOS
[0089] Exemplo 1 - Tarefas solucionáveis e medidas de sociabilidade
[0090] A sociabilidade direcionada a humanos de 18 cães domésticos e dez lobos cinzentos socializados pelo homem em cativeiro foi avaliada usando sociabilidade padrão (26,27) e tarefas de solução de problemas (2,8,28) comumente usadas para avaliar a sociabilidade direcionada a humanos em cães. Três métricas de sociabilidade foram construídas para avaliar comportamentos indicativos da WBS (22): predisposição atencional a estímulos sociais (ABS), hipersociabilidade (HYP) e interesse social por estranhos (SIS) (Tabelas 1, 2).
Tabela 1. Dados comportamentais brutos.
A linha tracejada separa os cães (acima) dos lobos (abaixo).
Tabela 2. Dados para índices de comportamento social direcionado a humanos. As linhas tracejadas separam os cães (acima) dos lobos (abaixo). ID do ABS HYP SIS PC1 PC2 PC3 Animal 2769 0,864 362,40 122,4 -1,321 0,456 -0,764 2771 0,823 311,40 84,96 -1,041 -0,211 -1,030 2772 0,326 415,20 198 -0,944 2,244 -0,936 2773 0,424 223,44 10,2 0,214 -1,634 -1,214 2774 0,000 180,84 7,92 1,289 -1,681 -1,083 2775 0,548 376,80 150 -1,412 0,645 -0,802 2776 1,246 390,36 161,4 -1,973 0,638 -0,001 2777 1,031 239,40 80,76 -0,520 -0,470 0,089 2778 0,995 344,40 147,6 -1,320 0,367 -0,106 2779 1,188 308,16 126,48 -1,920 -0,739 1,395 2780 1,067 324,36 135,12 -1,518 -0,156 0,563 2781 0,704 230,40 63,12 -0,423 -1,059 -0,032 2782 0,863 267,96 79,2 -0,983 -0,987 0,278 2783 0,585 289,08 141,24 -0,416 0,239 0,397 2784 0,538 420,36 181,08 -1,330 1,498 -0,984 2785 1,393 306,24 127,08 -2,545 -1,124 2,356 2786 0,167 332,28 168,36 -0,174 1,155 -0,108 2787 0,000 222,60 83,76 1,250 -0,689 -0,187 2788 0,000 87,12 44,76 3,086 0,020 0,532 2789 0,000 111,48 36,36 2,687 -0,496 0,131 2790 0,000 262,08 179,52 2,404 2,168 0,415 2791 0,000 166,32 164,52 2,690 1,662 1,815 2792 0,000 168,60 48,84 2,224 -0,400 -0,474 2793 0,000 140,40 25,2 1,995 -1,442 -0,249
[0091] O desempenho da tarefa solucionável foi utilizado para avaliar a predisposição atencional em relação aos estímulos sociais e ao desempenho independente de resolução de problemas (cognição física independente). Os sujeitos foram dedicados até dois minutos para abrir uma caixa de quebra-cabeça solucionável (8) que continha metade de um pedaço de linguiça de verão com 2,5 cm de espessura, tanto sozinho quanto com um presente humano neutro. O julgamento foi considerado completo após o preenchimento de uma das seguintes condições: a tampa da caixa do quebra-cabeça foi completamente removida, os alimentos obtidos ou dois minutos decorridos. Todos os ensaios foram gravados em vídeo e codificados para determinar se a caixa do quebra-cabeça foi resolvida e o tempo para resolvê-la. Para comparar a atenção em relação à caixa de quebra-cabeça versus estímulos sociais na condição presente no ser humano, foi registrada a porcentagem de tempo gasto olhando para a caixa de quebra-cabeça, tocando na caixa de quebra-cabeça e olhando para o ser humano (8), pesquisador independente cego ao objetivo deste estudo, codificou 30% dos vídeos e descobriu que a confiabilidade interexaminadores era muito forte (kappa de Cohen ponderado, κ=0,98; intervalo de confiança de 95%: 0,97-0,99). Os cães domésticos passaram uma proporção significativamente maior do tempo de teste olhando para o humano quando comparados aos lobos quando um humano estava presente durante a tarefa solucionável (olhar médio para o humano: cão=21%, lobo=0%; Mann-Whitney bicaudal, ncão= 18, nlobo=10, U=6, p˂0,0001). Os cães também passaram uma proporção significativamente menor do tempo de teste olhando para a caixa do quebra-cabeça (olhar médio para a caixa: cão=10%, lobo=100%; Mann-Whitney bicaudal, ncão=18, nlobo=10, U=175, p˂0,0001) e uma proporção significativamente menor de tempo de teste para resolver o quebra-cabeça (cão mediano=6%, lobo=98%; Mann- Whitney bicaudal, ncão= 18 nlobo=10, U= 175, p˂0,0001) comparado aos lobos, uma constatação que foi equiparada à inibição social do comportamento problemático da solvina, tanto na literatura canina (9) quanto na WBS humana (22). Significativamente mais lobos resolveram a tarefa com sucesso quando comparados a cães nas condições humanas presentes e sozinhas (Presente humano: 2/18 cães bem-sucedidos, 8/10 lobos bem-sucedidos, teste exato de Fisher bicaudal, p=0,0005; Sozinho: 2/18 cães bem-sucedidos, 9/10 lobos bem- sucedidos, teste exato de Fisher bicaudal, p=0,0001). No geral, de acordo com a WBS, os cães apresentaram maior ABS que os lobos, correspondendo a uma redução no sucesso da solução de problemas independentes (Figura 3).
[0092] O teste de sociabilidade mediu o comportamento de busca por proximidade direcionada ao homem e foi avaliado comparando as pontuações totais de sociabilidade em todas as condições de sociabilidade. Cada fase ocorreu duas vezes, uma vez com um humano desconhecido e uma vez com um humano familiar, totalizando quatro fases executadas em oito minutos consecutivos. Em todas as fases, o pesquisador sentou-se em uma cadeira familiar (cães) ou balde (lobos) dentro de um círculo marcado de uma circunferência, indicando proximidade. Durante a fase passiva, o pesquisador sentou-se em silêncio na cadeira ou no balde e ignorou o assunto olhando para o chão. Se o animal buscava contato físico, o pesquisador tocou o sujeito duas vezes, mas não falou nem fez contato visual com o animal. Durante a fase ativa, os pesquisadores chamaram os animais pelo nome e incentivaram ativamente o contato enquanto permaneciam no local designado. Os cães passaram mais tempo dentro de 1 m na proximidade com estranhos do que os lobos (porcentagem mediana do tempo gasto dentro de um milhão de seres humanos: cães=65%, lobos=35%; Mann-Whitney bicaudal, ncão= 18, nlobo= 9, U=30, p<0,005). A sociabilidade de cães e lobos em relação a um humano desconhecido foi usada para avaliar o interesse social de estranhos. Os cães passaram mais tempo dentro de um metro de um estranho quando comparados aos lobos (cães medianos=53%, lobos=28%), no entanto, essa diferença não foi estatisticamente significativa (Mann-Whitney bicaudal, ncão=18, nlobo= 9, U=76, p=0,51). Em resumo, os cães eram hipersociais em comparação aos lobos, embora não houvesse diferença significativa em seu interesse social por estranhos (Figura 3).
[0093] A dimensionalidade de seis características comportamentais (Tabela 3) foi reduzida para três componentes ortogonais e não correlacionados entre si, enquanto que ABS, HYP e SIS estão correlacionados.
Tabela 3. Cargas dos três primeiros componentes principais do comportamento social direcionado a humanos. Comportamento PC1 PC2 PC3 Porção de tempo de observação de -0,386 -0,269 0,631 humano Porção de tempo de observação de 0,536 -0,153 -0,066 objeto Proximidade não familiar passiva 0,153 0,782 -0,061 Proximidade não familiar passiva -0,400 0,490 0,339 Proximidade familiar passiva -0,444 0,084 -0,554 Proximidade familiar ativa -0,429 -0,213 -0,414
[0094] Os componentes principais 1, 2 e 3 representaram 50%, 22% e 14% da variação comportamental total, respectivamente. Foram calculados KMO (KMO=0,62, com valores >0,6 recomendados como informativo) e o teste de Bartlett, que foi significativo (X2(15)=60,42, p=2,13x10-07). A análise das cargas dos comportamentos constituintes (Tabela 3; Figura 3) indicou que a PC1 representa um fenótipo autônomo ou independente, pois esse componente está correlacionado negativamente com todos os comportamentos associados à sociabilidade direcionada ao homem, com exceção da proximidade passiva não familiar. A PC1 também teve cargas positivas a partir do tempo em que o objeto é visto, uma medida que indica falta de predisposição de atenção a estímulos sociais (Figura 4). As cargas de cada comportamento eram aproximadamente iguais, com exceção da proximidade passiva desconhecida, que carregava aproximadamente um terço da magnitude média das demais. As cargas da PC2 foram fortemente influenciadas e positivamente associadas às medidas de proximidade de uma pessoa desconhecida (carga média de 0,64, em comparação com uma carga média de -0,14 para as demais cargas), sugerindo que a PC2 reflete ousadia. O significado biológico da PC3 é mais difícil de interpretar, mas, dado que é forte e positivamente carregado pelo comportamento, o tempo parece humano (carga de 0,63 em comparação com uma carga média para todos os outros fatores de -0,15), reflete predominantemente a dependência de seres humanos no teste de tarefa solucionável. Como esperado, dada a interpretação da PC1 como fenótipo socialmente inibido, os cães apresentaram valores mais baixos de PC1 que os lobos (teste U de Mann-Whitney: U=3, p<0,00005, mediana: cães=-1,18, lobos=2,31). Cães e lobos não apresentaram valores significativamente diferentes para PC2 (teste U de Mann-Whitney: U=54, p=0,51, mediana: cães=- 0,18, lobos=-0,19) ou para PC3 (teste U de Mann-Whitney: U=48, p=0,35, mediana: cães=-0,069 lobos=0,011).
[0095] Exemplo 2 - Anotação novamente de variantes estruturais
[0096] Em um subconjunto de animais com dados comportamentais quantitativos (ncão=16; nlobo= 8), foram coletados dados de sequência 2x67nt de extremidade pareada de 5 Mb abrangendo o locus WBS canino candidato no cromossomo canino 6 (2.031.491-7.215.670 bp), que contém 46 genes anotados, 27 dos quais estão no locus WBS humano (Tabelas 4, 5). A região-alvo teve uma média de cobertura de sequência de 15,5 vezes (cães: 15,2; lobos: 16,0) (Tabela 4). Tabela 4. Informações de amostra e o número total de leituras brutas em comparação com o número de leituras processadas após o uso de cutadapt para aparar/recortar sequências finais emparelhadas. ID de Membros da Raça Idade Sexo Nº de Nº de leituras Prop de Tamanho Cobertura amostra espécie leituras pós- leituras de média + brutas processamento descartadas inserto de biblioteca médio (bp) 2769 cão Misturada 4 F 20127088 20066328 0,003 304 15,4 doméstico 2771 cão Misturada 2 F 18501656 18448868 0,003 271 14,5 doméstico 2772 cão Russian 5 F 17305060 17251544 0,003 304 12,6 doméstico Terrier 2773 cão Dachshund 6 F 21494600 21434496 0,003 281 17,7 doméstico 2774 cão Weimaraner 6 M 20697840 20634212 0,003 256 15,6 doméstico 2775 cão Misturada 6 M 19885276 19821756 0,003 275 16,2 doméstico 2776 cão Golden 10 F 19847944 19847944 0,003 279 14,3 doméstico Retriever 2777 cão Labrador 3 M 29994680 29994680 0,003 259 19,2 doméstico Retriever 2778 cão Misturada 2 M 24854488 24854488 0,003 274 18,5 doméstico 2779 cão Misturada 1 M 19227644 19227644 0,003 282 13,8 doméstico 2780 cão Misturada 11 F 18928344 18928344 0,003 272 12,2 doméstico 2781 cão Misturada 6 M 22140600 22140900 0,003 269 18,4 doméstico 2782 cão Saluki 2 M 20066328 20066328 0,003 304 15,4 doméstico 2783 cão Misturada 3 M 18448868 18448868 0,003 271 14,5 doméstico 2784 cão Misturada 2 M 18238376 18238376 0,003 261 11,7 doméstico 2785 cão Misturada 4 F 19086720 19034004 0,003 261 15,1 doméstico 2786 Lobo cinza NA 8 F 19333428 19275892 0,003 264 13,9 2787 Lobo cinza NA 3 M 21307104 21243032 0,003 262 16,0 2788 Lobo cinza NA 7 M 20928148 20866492 0,003 263 13,8 2789 Lobo cinza NA 3 F 22880760 22818112 0,003 270 17,5 2790 Lobo cinza NA 14 F 1983744 19779788 0,003 264 16,6 2791 Lobo cinza NA 8 F 20472512 20415648 0,003 276 14,5 2792 Lobo cinza NA 2 F 23652336 23652336 0,003 267 18,2 2793 Lobo cinza NA 3 M 21776192 21776192 0,004 258 17,3 *Após PCR, duplicações foram removidas
[0097] A cobertura média da sequência é para o cromossomo 6 da região-alvo (2.031.491-7.215.670 pb). (Abreviações: feminino, F; América do Norte, NA; masculino, M)
[0098] Foram obtidos genótipos para 26.296 SNPs, que foram posteriormente filtrados para reter 4.844 SNPs com dados polimórficos ausentes (densidade média de 1 SNP a cada 14,4 Kb). Para confirmar esta região como contendo variação específica da espécie, foi determinado se essa região exibe sinais de seleção positiva no genoma do cão, um esforço para validar independentemente o achado original (19). A pontuação percentil bivariada composta foi calculada e confirmou que o gene candidato, Região do Cromossomo 17 de WBS (WBSCR17), está sob seleção positiva como candidato à domesticação e estava significativamente empobrecido de heterozigosidade no cão (Ho: cão=0,01, lobo=0,37; Teste t unicaudal com variação desigual, p=7,4x10-38) (Figura 5; Tabela 5). Tabela 5. Agrupamentos externos no cromossomo 6 (canfam3.1) mostrando sinais de seleção positiva de XP-EHH. Abreviações: pontuação percentil bivariada, BPS; heterozigosidade observada, Ho). Os valores p de um teste t unicaudal de variação desigual são fornecidos entre parênteses.
ID Início Parada BVS Nº SNPs Média Sinal Genes agrupament Médi extremo H0 em de WBSC o a s cão/lobo seleção R 17 (teste t no de valor- genom p) a de: 6,1 2.226.37 2.352.13 7,34 54 0,01/0,3 Cão 1 6 7 (7,4x10- 38 ) 6,2 3.769.52 3.858.53 2,27 3 0,40/0,0 Lobo 9 0 0 (1,4x10- 3 ) 6,3 4.064.79 4.215.64 2,89 36 0,24/0,0 Lobo 1 9 0 (5,8x10- 6 ) 6,4 4.439.46 4.766.31 3,96 7 0,11/0,2 Cão CLIP2 2 3 5 BAZ1B (1,3x10- FKBP6 2 ) NSUN5 6,5 5.023.33 5.102.01 2,58 8 0,04/0,4 Cão 5 9 7 (3,4x10- 4 ) 6,6 5.351.68 5.351.68 2,17 8 0,03/0,5 Cão 2 2 9 (7,9x10- 8 ) 6,7 6.085.55 6.085.55 2,96 3 0,25/0,0 Lobo 8 8 (0,012) 6,8 6.728.73 6.728.73 3,62 5 0,00/0,3 Cão 1 1 8 (7,4x10- 8 ) 6,9 6.866.31 6.955.31 2,74 35 0,43/0,1 Lobo 5 5 0 (7,4x10- 8 )
[0099] Como esta região candidata mostra variação estrutural (SV) ligada à WBS em humanos (20), e é conhecida por variar amplamente em suas consequências funcionais (por exemplo, doenças do neurodesenvolvimento [29]; distúrbios do espectro do autismo [30]), anotação
SV in silico no genoma de cães e lobos foi concluída usando três programas - SVMerge (31), SoftSearch (32) e inGAP-SV (33), que juntos utilizam todos os algoritmos de detecção de SV disponíveis: par de leitura (RP), leituras curtas (SR), profundidade de leitura (RD) e com base em montagem (AS). Foram anotadas 38 deleções, 30 inserções, 13 duplicações, seis transposições, uma única inversão e uma variante complexa em relação ao genoma do cão de referência (Tabelas 6, 7). Tabela 6. Resumo das variantes estruturais anotadas de novo no cromossomo canino 6. Programas de Detecção SVMerge SoftSearch InGAP-sv Total de SV Substituinte: Número de Bruta 120 126 112 358 Variantes Pós- 96 111 70 277 Estruturais Filtragem Mesclada 89
Tabela 7. Variantes estruturais anotadas de novo no cromossomo canino 6 (coordenadas baseadas na montagem canfam3.1). Abreviações: D_I, exclusão-inserção; DEL, exclusão; DUP, duplicação; INS, inserção; INV, inversão; TRA, translocação; SV, variante estrutural; f, frequência.
ID Locus Tipo Inicio Tamanho f(Cães) f(Lobos) Gene (bp) Cfa6. 1 DEL 2.095.386 638.909 0,06 0,00 WBSCR17, GLNT, AUTS2 Cfa6. 2 INS 2.140.817 341 0,00 0,13 WBSCR17 Cfa6. 3 INS 2.171.493 76 0,25 0,38 WBSCR17 Cfa6. 4 INS 2.205.140 11 0,06 0,00 WBSCR17 Cfa6. 5 DEL 2.432.140 1.800.342 0,06 0,00 WBSCR17, AUTS2 Cfa6. 6 DEL 2.521.650 198 0,00 0,88 WBSCR17 Cfa6. 7 DEL 2.546.359 235 0,06 0,38 WBSCR17 Cfa6. 8 INS 2.583.455 58 0,00 0,88 Cfa6. 9 DEL 2.625.969 218 0,06 0,63 Cfa6. 10 INS 2.689.902 7 0,00 0,13 Cfa6. 11 DUP 2.734.984 2.347.334 0,00 0,13 AUTS2 Cfa6. 12 DEL 3.009.985 627.053 0,00 0,13 AUTS2
Cfa6. 13 DUP 3.010.060 626.977 0,00 0,13 AUTS2 Cfa6. 14 DUP 3.010.100 2.121.751 0,00 0,13 AUTS2 Cfa6. 15 DUP 3.012.589 2.239.167 0,00 0,13 AUTS2 Cfa6. 16 DEL 3.018.553 687 0,06 0,00 AUTS2 Cfa6. 17 DEL 3.209.048 1.279 0,25 0,00 AUTS2 Cfa6. 18 DEL 3.241.300 694 0,06 0,00 AUTS2 Cfa6. 19 DEL 3.452.567 715 0,06 0,00 AUTS2 Cfa6. 20 DEL 3.452.997 294 0,31 0,25 AUTS2 Cfa6. 21 INS 3.589.775 0 0,06 0,00 AUTS2 Cfa6. 22 DUP 3.633.739 1.338.749 0,25 0,13 AUTS2 Cfa6. 23 INS 3.875.594 351 0,06 0,00 AUTS2 Cfa6. 24 DEL 3.976.412 223 0,31 0,00 Cfa6. 25 TRA 3.986.929 513 0,56 0,88 Cfa6. 26 DEL 3.986.940 536 0,88 0,63 Cfa6. 27 INS 4.194.480 22 0,00 0,38 Cfa6. 28 INS 4.231.965 3 0,31 0,13 Cfa6. 29 DEL 4.232.120 351 0,50 0,38 Cfa6. 30 INS 4.272.655 13 0,13 0,00 Cfa6. 31 DUP 4.3112.149 638 0,13 0,00 Cfa6. 32 INS 4.358.450 368 0,81 0,75 Cfa6. 33 DUP 4.369.908 888 0,13 0,00 Cfa6. 34 DEL 4.370.055 448 0,00 0,13 Cfa6. 35 DEL 4.370.264 246 0,25 0,63 Cfa6. 36 DUP 4.377.190 859 0,13 0,00 Cfa6. 37 DEL 4.486.820 470 0,00 0,13 Cfa6. 38 DUP 4.514.366 1.067 0,13 0,00 Cfa6. 39 DEL 4.514.624 551 0,06 0,13 Cfa6. 40 TRA 4.514.643 573 0,31 0,50 Cfa6. 41 DEL 4.691.721 216 0,00 0,25 Cfa6. 42 INS 4.766.960 73 0,13 0,50 Cfa6. 43 INS 4.767.241 65 0,06 0,00 Cfa6. 44 INS 4.767.367 363 0,88 1,00 Cfa6. 45 DUP 4.792.086 646 0,13 0,00 Cfa6. 46 INV 4.839.392 3.328 0,00 0,13 Cfa6. 47 DEL 4.842.442 225 0,25 0,88 Cfa6. 48 DUP 4.858.013 622 0,13 0,00 Cfa6. 49 DUP 4.910.429 578 0,13 0,00 Cfa6. 50 INS 5.042.932 366 0,38 0,88 Cfa6. 51 DEL 5.065.830 14.796 0,06 0,00 Cfa6. 52 DEL 5.089.612 213 0,00 0,13 Cfa6. 53 DUP 5.213.911 810 0,13 0,00 Cfa6. 54 DEL 5.124.176 381 0,44 0,63 Cfa6. 55 DEL 5.277.159 2.053 0,00 0,25 Cfa6. 56 INS 5.318.593 30 0,31 0,50 Cfa6. 57 DEL 5.337.423 226 0,00 0,75 Cfa6. 58 INS 5.346.453 17 0,00 0,13 Cfa6. 59 INS 5.634.780 456 0,94 0,88 CBX3 Cfa6. 60 D_I 5.646.194 118 0,44 0,38
Cfa6. 61 INS 5.646.321 294 0,13 0,00 Cfa6. 62 INS 5.646.326 21 0,06 0,00 Cfa6. 63 INS 5.646.624 3 0,00 0,13 Cfa6. 64 INS 5.652.383 4 0,06 0,13 Cfa6. 65 TRA 5.686.203 226 0,00 0,13 GTF2IRD2 Cfa6. 66 DEL 5.753.703 290 0,69 0,13 GTF2I Cfa6. 67 TRA 5.753.734 265 0,13 0,00 GTF2I Cfa6. 68 DEL 5.820.166 231 0,38 0,63 GTF2I Cfa6. 69 INS 5.844.759 49 0,311 0,50 Cfa6. 70 INS 5.845.117 3 0,00 0,13 Cfa6. 71 INS 5.859.196 3 0,06 0,00 Cfa6. 72 DEL 5.902.332 715 0,19 0,13 GTF2IRD Cfa6. 73 DEL 6.016.951 254 0,06 0,00 Cfa6. 74 TRA 6.016.969 207 0,06 0,00 Cfa6. 75 INS 6.289.609 345 0,13 0,25 Cfa6. 76 DEL 6.399.238 266 0,00 0,13 Cfa6. 77 DEL 6.400.822 216 0,31 0,75 Cfa6. 78 DEL 6.522.286 234 0,25 0,38 Cfa6. 79 DEL 6.718.197 263 0,25 0,38 BAZIB Cfa6. 80 DEL 6.718.220 10.206 0,00 0,13 BAZIB Cfa6. 81 INS 6.795.640 0 0,06 0,00 Cfa6. 82 INS 6.889.833 10 0,00 0,38 NSUN5 Cfa6. 83 DEL 6.914.106 22 0,19 0,50 POM121 Cfa6. 84 TRA 6.947.879 260 0,06 0,00 Cfa6. 85 DEL 6.947.889 247 0,00 0,13 Cfa6. 86 INS 7.156.514 336 0,25 0,13 Cfa6. 87 DEL 7.194.197 174 0,00 0,13 Cfa6. 88 DEL 7.378.268 479 0,13 0,00 STYXLI Cfa6.89 INS 7.378.904 2 0,06 0,00 STYXL1
[0100] Houve uma variação privada considerável, com 31 SVs anotados encontrados apenas em cães, 26 encontrados apenas em lobos, e um nível de heterogeneidade observado em lobos que é comparável ao encontrado na WBS humana (34) (média n: lobo=21, cão=15, teste t bicaudal p=0,026) (Tabela 8). Tabela 8. Estatísticas resumidas das variantes estruturais por indivíduo. ID da Amostra Membros da nº SVs # Nucleotídeos % de região- Espécie afetados por alvo afetada SVs por SVs 2769 Cão doméstico 20 9,853 0,19% 2771 Cão doméstico 10 2,949 0,06% 2772 Cão doméstico 9 1,339,332 25,83%
2773 Cão doméstico 16 3,287 0,06% 2774 Cão doméstico 18 641,634 12,38% 2775 Cão doméstico 15 3,330 0,06% 2776 Cão doméstico 13 2,939 0,06% 2777 Cão doméstico 14 4,264 0,08% 2778 Cão doméstico 16 1,339,843 25,84% 2779 Cão doméstico 12 3128 0,06% 2780 Cão doméstico 7 1,801,588 34,75% 2781 Cão doméstico 22 1341938 25,89% 2782 Cão doméstico 20 9,853 0,19% 2783 Cão doméstico 9 2,709 0,05% 2784 Cão doméstico 13 4,178 0,08% 2785 Cão doméstico 18 1,356,209 26,16% Média entre cães 15 491,690 9,48% 2786 Lobo cinza 17 3,089 0,06% 2787 Lobo cinza 19 633,662 12,22% 2788 Lobo cinza 9 1,349,796 26,04% 2789 Lobo cinza 31 6,642 0,13% 2790 Lobo cinza 27 2,351,751 45,36% 2791 Lobo cinza 20 2,240,258 43,21% 2792 Lobo cinza 23 2,124,153 40,97% 2793 Lobo cinza 25 6,491 0,13% Média entre lobos 21 1,089,478 21,02% Média entre todos os animais 17 690,952 13,33
[0101] Exemplo 3 - Teste de associação da região candidata
[0102] Modelos mistos lineares foram usados para determinar a associação de SVs com a sociabilidade dirigida ao homem. Três modelos univariados foram testados quanto à associação com cada um dos três índices comportamentais (ABS, HYP, SIS) (Figura 1). Além disso, foi testada coletivamente a associação de SVs com os três índices comportamentais, referido como modelo de índice comportamental, e separadamente com um modelo que incluía os três primeiros componentes principais (modelo PC) descrevendo o comportamento sociável direcionado a humanos (Figura 2) Quatro SVs gênicos foram significativamente associados ao comportamento social direcionado a humanos (ajustado p<2,38x10-3): um SV dentro do GTF2I (Cfa6.66); um SV dentro do GTF2IRD1 (Cfa6.72); e dois dentro do WBSCR17 associado ao ABS (Cfa6.3 e Cfa6.7) (Tabela 9).
Tabela 9. Loci gênicos associados a índices de comportamento social direcionado a humanos entre cães e lobos. Fenótipo ID Locus Tipo de Posição β (se)+ % Valor-pb Gene SV (Mb)ª Variação Candidato explicada ABS Cfa6.66 Deleção 5,75 0,23 4,45 1,38x10-4 GTF21 (0,09) Cfa6.3 Inserção 2,14 0,11 0,56 8,12x10-4 WBSCR17 (0,07) Cfa6.7 Deleção 2,54 0,11 0,62 8,89x10-4 WBSCR17 (0,07) SIS Cfa6.66 Deleção 5,75 -27,0 11,45 1,95x10-4 GTF21 (24,80) Os três Cfa6.72 Deleção 5,90 0,04 NA 4,98x10-4 GTF21RDI principais (0,052), - componentes 0,96 (modelo PC) (0,57), 1,11 (0,63) a Consultar tabela 6 para detalhes do locus. b Valor-p teste de razão de verossimilhança (ajuste do limiar de significância p=2,38x10-3). Ɨβ, tamanho do efeito; se, erro padrão. NA, não aplicável.
[0103] Além disso, dois SVs intergênicos foram significativamente associados ao ABS (Cfa6.69, p=1,56x10-4; Cfa6.27, p=3,31x10-4) e Cfa6.27 também foi associado às PCs. No entanto, as análises foram focadas em SVs gênicos para inferir qualquer potencial impacto funcional. O Cfa6.66 foi associado a múltiplas métricas de sociabilidade (ABS e SIS) e apresentou os dois sinais de associação mais fortes (p=1,38x10-4 e p=1,95x10-4, respectivamente) (Tabela 9). GTF2I e GTF2IRD1 são membros da família de fatores de transcrição TFII-I, um conjunto de genes paralógicos que foram repetidamente vinculados à expressão de hipersociabilidade em camundongos (35, 36) e estão especificamente implicados no fenótipo hipersociável de pessoas com WBS (37,38).
[0104] Para separar a associação de SVs com o comportamento de uma associação com a associação de espécies, as espécies foram incorporadas como covariáveis (Tabela 10).
Tabela 10. Loci gênicos associados a índices de comportamento social direcionado a humanos entre cães e lobos após a inclusão de espécies como covariável. Fenótipo ID de Tipo de Posição β (se)+ % de valor p Gene locus SV (Mb) variação Candidato explicada ABS Cfa6.66 Deleção 5,75 0,23 5,76 2,33x10- GTF21 4 (0,091) Cfa6.7 Deleção 2,54 0,10 0,58 9,56x10- WBSCR17 4 (0,081) Cfa6.3 Inserção 2,14 0,081 0,50 1,06x10- WBSCR17 3 (0,076) SIS Cfa6.66 Deleção 5,75 -9,7 1,80 1,67x10- GTF21 3 (32)
[0105] Essas análises foram consistentes com os achados iniciais de Cfa6.66, Cfa6.3 e Cfa6.7. O locus Cfa6.66 permaneceu significativamente associado a várias métricas de sociabilidade (ABS, p=2,33x10-4; SIS, p=1,67x10-3) e mostrou a associação mais forte de qualquer SV gênico. Cfa6.3 e Cfa6.7 mantiveram suas associações com o ABS (p=1,06x10-3 e p= 9,56x10-4, respectivamente), assim como os SVs intergênicos Cfa6.69 (p=1,36x10-4) e Cfa6.27 (p=5,56x10-4). Além disso, o tamanho do efeito ABS (β) permaneceu estável para os modelos de associação com e sem associação de espécies como covariável (ABS β sem covariáveis: Cfa6.3=0,11, Cfa6.7=0,12, Cfa6.27=-0,15, Cfa6.66=0,23, Cfa6.69=-0,15; ABS β com covariáveis: Cfa6.3=0,081, Cfa6.7=0,10; Cfa6.27=-0,13; Cfa6.66=0,23; Cfa6.69=-0,14), indicando que os efeitos observados na sociabilidade não são um artefato de espécies diferentes. Um teste de associação de cada locus com a associação de espécies apoia ainda mais essa interpretação, pois nenhum dos SVs associados ao comportamento associou-se significativamente à associação de espécies apenas (Tabela 11). Tabela 11. Associação à participação de espécies. ID Locus ꭓ2 Valor-p Razão de probabilidade Cfa6.3 0,3345 0,563 1,615
Cfa6.6 16,39 0,00005155 NA Cfa6.7 3,409 0,06484 7,154 Cfa6.8 16,39 0,00005155 NA Cfa6.9 7,714 0,005479 14,09 Cfa6.17 2,182 0,1396 0 Cfa6.20 0,08362 0,7724 0,7714 Cfa6.22 0,4465 0,504 0,4667 Cfa6.24 2,791 0,09481 0 Cfa6.25 1,172 0,279 1,988 Cfa6.26 0,6969 0,4038 0,5844 Cfa6.27 6,4 0,01141 NA Cfa6.28 0,8571 0,3545 0,36 Cfa6.29 0,2359 0,6272 0,6923 Cfa6.32 0,04356 0,8347 0,8769 Cfa6.35 2,462 0,1167 3,182 Cfa6.40 0,6154 0,4328 1,8 Cfa6.42 3,429 0,06408 5 Cfa6.44 0,1678 0,682 1,286 Cfa6.47 5,897 0,01517 5,444 Cfa6.50 3,376 0,06616 3,37 Cfa6.54 0,65 0,4795 1,623 Cfa6.56 0,6154 0,4328 1,8 Cfa6.57 13,71 0,0002128 NA Cfa6.59 0,04196 0,8377 0,8815 Cfa6.60 0,06316 0,8016 0,8242 Cfa6.66 4,5 0,03389 0,1273 Cfa6.68 0,9435 0,3314 1,97 Cfa6.69 0,6154 0,4328 1,8 Cfa6.72 0,1364 0,7119 0,6444 Cfa6.75 0,5455 0,4602 2,143 Cfa6.77 2,889 0,089616 3,24 Cfa6.78 0,3345 0,563 1,615 Cfa6.79 0,3345 0,563 1,615 Cfa6.82 6,4 0,01141 NA Cfa6.83 2,091 0,1482 3,222 Cfa6.86 0,4465 0,504 0,4667
[0106] Exemplo 4 - Impacto funcional das variantes estruturais anotadas
[0107] Em seguida, foi determinado se esses SVs associados ao comportamento teriam um impacto funcional. O preditor do efeito da variante Ensembl (VEP) v84 (39) foi usado com os transcritos do Ensembl para o genoma de referência CanFam 3.1 para atribuir consequências funcionais putativas a todas as inserções, exclusões e duplicações no conjunto filtrado de SVs. Devido a uma limitação de software que o VEP é incapaz de atribuir consequências para transições, inversões e SV complexos, sete sites (6 TRA, 1 INV, 1 D_I) no navegador do genoma UCSC foram inspecionados manualmente com os modelos de genes Ensembl (40). Foram encontradas três ablações de transcrição, sete códons com perda de início e cinco amplificações de transcrição (Tabela 12). Tabela 12. Consequências funcionais previstas dos SVs. Consequências previstas usando o preditor do efeito da variante Ensembl. Consequência Descrição Classificação de nº de SVs
IMPACT Ablação de Região deletada Alta 3 transcripto inclui um recurso de transcripto Perda de início Altera pelo menos Alta 7 uma base de códon de partida Amplificação de Amplificação de Alta 5 transcripto região contendo um transcripto Variante de Altera a Modificadora 10 sequência de sequênmcia de codificação codificação de um gene Truncamento de Reduz recursos Modificadora 16 recurso genômicos em relação à referência Alongamento de Localizado dentro Modificadora 12 recurso de uma região reguladora Variante de Variante de Modificadora 3 transcripto de não transcripto de um codificação gene RNA de não codificação Variante intrônica Localizada em um Modificadora 32 íntron Variante 5’ UTR Localizada em 5’ Modificadora 8
UTR Variante 3’ UTR Localizada em 3’ Modificadora 1
UTR Variante a Localizada em 5’ Modificadora 9 montante de um gene Variante a jusante Localizada em 3’ Modificadora 4 de um gene Variante Localizada >5 kb a Modificadora 40 intergênica de um gene
[0108] Todos os SVs significativamente associados ao comportamento social direcionado a humanos foram “truncamentos de recursos”, exceto o Cfa6.3, que era um “alongamento de recursos” que provavelmente se deve a um códon de parada perdido ou ao alongamento de um recurso de sequência interna em relação à referência. As anotações de Cfa6.3, Cfa6.7, Cfa6.66 e Cfa6.72 como modificadores da função gênica sugerem uma associação direta entre essas variantes e o comportamento social direcionado a humanos, quantificado por medidas comportamentais, mediadas por possível interferência em WBSCR17, GTF2I e GTF2IRD1.
[0109] Exemplo 5 - Validação de PCR e análise de variantes estruturais
[0110] Os algoritmos de detecção in silico de SV aplicados aos dados de sequenciamento direcionados podem identificar a presença ou ausência de um SV, mas não podem prever o genótipo subjacente de um indivíduo para um determinado SV. Para corroborar os achados in silico e investigar a possibilidade de outros modelos genéticos, a amplificação por PCR e a eletroforese em gel de agarose foram usadas para determinar os genótipos codominantes nos quatro primeiros loci (Cfa6.6, Cfa6.7, Cfa6.66 e Cfa6.83) (Figura 6). Esses quatro SVs se sobrepuseram a elementos transponíveis nucleares (TEs) intercalados curtos com alta identidade de sequência com a referência (182 a 259 pb, 91-96% de identidade pareada acima de 193 pb). A variação de inserção em 298 canídeos consistindo de coiotes, lobos cinzentos (representando populações da Europa, Ásia e América do Norte), raças registradas pelo AKC e populações de cães semidomésticos (ver Métodos) foram pesquisadas. A análise foi repetida com os genótipos de SV codominantes para determinar se havia um associado à associação de espécies. Os coiotes foram excluídos desta análise e os cães semidomésticos foram agrupados com cães domésticos.
[0111] Todos os SVs extremos, agora com genótipos codominantes, foram significativamente associados à associação de espécies (Cfa6,6 χ2=23,91, p=1,01x10-6, OR=0,33; Cfa6.7 χ2=57,63, p=3,16x10-14, OR=13,83; Cfa6,66 χ2=35,12, p=3,1x10-9, OR=0,25; Cfa6.83 χ2=17,11, p=3,53x10-5, OR=NA), confirmando a identificação original dessa região (19). Resultados semelhantes foram obtidos se apenas raças “modernas” fossem incluídas, conforme o método original que localizava essa região (19) (Cfa6.6 χ2=11,9, p=0,0006, OR=0,45; Cfa6.7 χ2=40,87, p=1,63x10-10, OR=10,35; Cfa6.66 χ2=41,97, p=9,25χ10-11, OR=0,20; Cfa6.83 χ2=20,41, p=6,24x10-6, OR=NA), com padrões específicos do local (frequência de inserção do TE em cães e lobos modernos, respectivamente: Cfa6.6=0,52 e 0,32; Cfa6.7=0,39 e 0,06; Cfa6.66=0,10 e 0,37; Cfa6.83=0,17 e 0,00).
[0112] A frequência de inserções por locus por população ou associação de espécies foi calculada. Os TEs segregaram em baixas frequências em coiotes e foram variáveis entre populações de lobos e raças de cães (Figura 7). Apenas um coiote realizou uma única inserção do TE no locus Cfa6.6, com Cfa6.6 e Cfa6.7 altamente polimórficos entre cães domésticos (Figuras 7B, C). O locus Cfa6.66 é encontrado em lobos da China, Europa, Oriente Médio e WBS, mas apenas em seis raças de cães (Boxer, Basenji, Cairn terrier, golden retriever, Jack Russell terrier e Saluki), os cães WBS, dois NGSDs e um único cão Pariah (Figura 7D). Cfa6.83 parece ser uma inserção de novo em cães domésticos, pois está ausente inteiramente nos canídeos selvagens (Figura 7E), com uma frequência baixa a moderada nas populações de cães semidomésticos pesquisados (n, cão Pariah=1; n, Cães da vila: África=1, Porto Rico=5). Com base nos cães e lobos WBS com dados comportamentais, as tendências por locus foram observadas como: mais inserções no Cfa6.6 foram correlacionadas com aumento do ABS e HYP (r=0,50 e 0,42, respectivamente), com relações mais fracas para o SIS
(r=0,11); mais inserções em Cfa6.7 correlacionaram-se com o aumento do ABS e da HYP, com uma relação inversa com o SIS (r=0,13, 0,11 e -0,17, respectivamente); menos inserções em Cfa6.66 estão correlacionadas com valores mais altos de características (r=-0,59, -0,56 e -0,27, para ABS, HYP e SIS, respectivamente); mais inserções em Cfa6.83 aumentaram todos os valores de características comportamentais (r=0,36, 0,44 e 0,40, para ABS, HYP e SIS, respectivamente).
[0113] A ANOVA unidirecional foi conduzida usando a designação de população ou espécie como um preditor do número total de inserções em quatro locais extremos. O número total de inserções depende significativamente da população (F(23.274)=19,54; p<2x10-16), com 103 de 276 comparações médias da população em pares contribuindo para a significância da ANOVA (cão/cão=46, lobo/cão=28, coiote/cão=11, semidoméstico/cão=8, semidoméstico/coiote=3, semidoméstico/lobo=3, lobo/coiote=2 e lobo/lobo=2; Tukey HSD, p<0,05) (Figura 8).
[0114] Como o método de genotipagem baseado em gel agora revela um genótipo codominante comparado ao status in silico, foi realizada uma varredura de associação para cada um dos quatro loci extremos de SV com o fenótipo binário para cada raça AKC (4), cães da vila e cães Pariah como “busca atenção” ou “evita atenção” usando dois modelos de regressão logística em R, um modelo aditivo e dominante, com o sexo como covariável. O uso de estereótipos baseados em raças é apoiado pelo rigoroso isolamento genético e esforços seletivos de reprodução que mantêm as raças. Como tal, muitas características fortemente determinadas por variação genética (incluindo comportamentais) podem ser previstas com alta precisão. O fundamento central e a vantagem da domesticação e formação de raças é que a seleção para muitas características, incluindo o comportamento, tem sido muito forte e, portanto, o número de genes subjacentes pode ser pequeno. Como prova de diretor, Jones et al. mapeou com sucesso uma variedade de características associadas à raça em um estudo de associação em todo o genoma, usando “estereótipos” de cães (9). Eles pontuaram raças para apontar, pastorear, ousadia e treinabilidade, e identificaram um locus associado a apontar, três para pastoreio e um para treinabilidade. Mais importante, eles encontraram cinco por ousadia. Esses locais contêm genes candidatos prováveis, muitos dos quais importantes na esquizofrenia, receptores de dopamina e proteínas ligadas a junções sinápticas. Vaysse et al. (76) também utilizaram estereótipos de raças para mapear comportamentos como ousadia, sociabilidade, curiosidade, diversão, perseguição e agressividade. Eles mapearam a ousadia a um íntron de HMGA2, e a sociabilidade, definida como a “atitude do cão em relação a pessoas desconhecidas”, a um gene no cromossomo X, depois de excluir cães machos da análise para comparar com precisão os padrões de variação genética autossômica e cromossômica sexual.
[0115] Foi encontrado suporte significativo para uma associação entre três dos quatro loci e a característica comportamental binária de procurar ou evitar a atenção (modelo aditivo: Cfa6.6 OR=0,303 p=2,79x10- 10 , Cfa6.7 OR=0,398 p=4,66x10-7, Cfa6.83 OR=2,95 p=2,83x10-4; modelo dominante: Cfa6.6 OR=0,184 p=8,22x10-7, Cfa6.7 OR=0,287 p=4,31x10-5, Cfa6.83 OR=5,04 p=6,50x10-4; sexo não foi um preditor significativo em nenhum desses modelos). SV Cfa6.66 não foi significante (modelo aditivo: OR=0,852 p=0,496; modelo dominante: OR=0,573 p=0,124). Além disso, a regressão logística constatou que o número de cópias de TE poderia prever significativamente o comportamento do estereótipo de raça binária de busca ou evitação de atenção (OR=0,676 por inserção, p=1,13x10-5 sem evidência de efeito sexual).
[0116] Exemplo 6 - Pesquisa SNP em todo o genoma
[0117] Para identificar loci candidatos adicionais, os genótipos SNP em todo o genoma foram coletados usando as matrizes Affymetrix Axiom K9HDSNPA (643.641 loci) e Axiom K9HDSNPB (625.577 loci). Um PCA foi conduzido em genótipos de SNP de 544K em todo o genoma para garantir o padrão de agrupamento espacial esperado das amostras.
Com um subconjunto de 25.510 SNPs não correlacionados e desvinculados, um PCA confirmou a separação espacial distinta das duas espécies (PC1, 29,9%; PC2, 11,8%) (Figura 9). Esse achado foi apoiado ainda pela alta diferenciação média em todo o genoma (FST=0,194), um nível comparável ao achado original (19). Em seguida, foi realizado um teste de associação binária sobre a associação de espécies no GEMMA e encontrou suporte para o locus candidato WBSCR17 como contendo variação específica da espécie (p<3x10- 6 ). Além disso, cada um dos índices quantitativos de comportamento (ABS, HYP, SIS) foi testado em uma análise de regressão univariada no conjunto de 544K SNP e identificou 222 SNPs adicionais na região-alvo de 5 Mb associados a duas características comportamentais (HYP: nSNPs=84, média p=0,002; SIS: nSNPs=138, média p=0,001). O teste quantitativo de associação identificou 77.889 SNPs fora da região ressequenciada associada a cada característica comportamental (nSNPs: ABS=874, HYP=19373, SIS = 57642, p˃0,005), implicando 221 genes associados ao ABS, 3520 genes com HYP e 3118 genes com SIS.
Destes, apenas um termo de ontologia de gene único associado ao ABS (atividade da hidrolase do éster fosfórico), 30 termos com HYP e 26 com SIS (Tabelas 13, 14). Tabela 13. O termo ontologia do gene significativamente enriquecido (ajustado/0,05) de um teste quantitativo de associação com cada característica comportamental e 544K SNPs em todo o genoma.
Abreviações: processo biológico, BP; número de genes de referência na categoria C; número esperado na categoria, E; função molecular, MF; número de genes no conjunto e categoria de genes, O; razão de enriquecimento, R.
Traço Base Nome C O E R Valor- Valor- comporta- de p p ajus- mental da- tado dos ABS MF Atividade da 203 10 2,58 3,87 0,0003 0,0483 hidrolase do éster fosfórico
HYP BP Desenvolvimento 899 208 136 1,53 1,47-11 5,61-8 celular BP Geração de 575 144 87 1,66 9,84-11 1,25-7 neurônios BP Processo de 1679 342 254 1,36 8,42-11 1,27-7 desenvolvimento celular BP Desenvolvimento 2098 410 317,4 1,29 2,27-10 1,44-7 de sistema BP Diferenciação 1556 319 235,4 1,36 2,16-10 1,44-7 celular BP Desenvolvimento 2445 467 369,9 1,26 2,22-10 1,44-7 da estrutura anatômica BP Diferenciação 506 129 77 1,68 4,46-10 2,13-7 neural BP Desenvolvimento 892 201 134,9 1,49 4,14-10 2,13-7 do sistema nervoso BP Neurogênese 626 151 94,7 1,59 6,25-10 2,65-7 MF Desenvolvimento 2298 439 347,6 1,26 1,11-9 4,24-7 do organismo multicelular MF Atividade 167 51 25,14 2,03 2,49-7 6,71-5 reguladora de GTPase MF Atividade 123 41 18,5 2,21 2,83-7 6,71-5 regulatória de GTPase pequena MF Ligação proteica 5688 948 856,4 1,11 1,10-7 6,71-5 MF Atividade da 203 58 30,6 1,9 4,78-7 8,5-5 hidrolase do éster fosfórico MF Atividade 172 51 25,9 1,97 6,85-7 9,74-5 reguladora de nucleosídeo- trifosfatase MF Atividade do 77 27 11,6 2,33 1,04-5 0,0009 fator de troca de guanil- nucleotídeo MF Atividade dos 242 62 36,43 1,7 1,05-5 0,0009 canais iônicos MF Ligação 225 59 33,9 1,74 7,92-6 0,0009 fosfolipídica MF Atividade de 246 62 37 1,67 1,81-5 0,0013 canal específica do substrato CC Ligação 7867 1244 1184,4 1,05 1,86-5 0,0013 CC Sinapse 180 60 27,1 2,21 5,04-10 2,22-7 CC Periferia celular 1588 314 239,1 1,31 1,32-8 1,94- CC Projeção celular 569 135 85,7 1,58 1,27-8 1,94-6 CC Membrana 1512 298 227,7 1,31 5,01-8 5,51-6 plasmática CC Projeção 246 68 37 1,84 1,96-7 1,72-5 neuronal CC Matriz 169 51 25,5 2 3,72-7 2,73-5 extracelular proteica CC Axonio 123 38 18,5 2,05 6,09-6 0,0003 CC Matriz 243 63 36,7 1,72 5,80-6 0,0003 extracelular CC Membrana basal 65 24 9,8 2,45 1,17-5 0,0006 CC Dendrito 99 31 14,9 2,08 3,19-5 0,014 SIS BP Desenvolvimento 899 215 150,8 1,43 4,72-9 1,80-5 celular BP Adesão celular 429 113 72 1,57 1,99-7 0,0003 BP Adesão biológica 460 113 74,1 1,57 2,27-7 0,0003 BP Transmissão de 266 76 44,6 1,7 7,74-7 0,0004 impulso nervoso BP Sinalização 269 77 45,1 1,71 6,04-7 0,0004 organismal multicelular BP Comportamento 229 68 38,4 1,77 6,44-7 0,0004 de organismo único BP Desenvolvimento 892 203 149,6 1,36 7,46-7 0,0004 do sistema nervoso BP Neurogenese 626 147 105 1,4 5,02-6 0,0021 BP Processo de 1679 345 281,7 1,22 4,31-6 0,0021 desenvolvimento celular BP Diferenciação 509 123 58,4 1,44 7,32-6 0,0026 neural MF Ligação proteica 5688 1086 977,7 1,11 3,16-9 2,42-6 MF Ligação 7867 1432 1352,3 1,06 7,2-8 2,76-5 MF Atividade 396 96 68 1,41 0,0002 0,0383 quinase MF Ligação de 7 6 1,2 4,99 0,0002 0,0383 hormônio peptídeo MF Atividade da 81 27 13,9 1,94 0,0003 0,0383 proteína tirosina quinase
MF Atividade do 10 7 1,7 4,07 0,0003 0,0383 canal liberação de cálcio CC Projeção 246 77 41,2 1,87 8,93-9 4,07-9 Neuronal CC Projeção celular 569 141 95,3 1,48 2,97-7 6,77-5 CC Sinapse 180 57 30,1 1,89 4,99-7 7,58-5 CC Membrana basal 65 27 10,9 2,48 1,88-6 0,0002 CC Matriz 169 51 28,3 1,8 9,27-6 0,0008 extracelular proteica CC Axonio 123 40 20,6 1,94 1,22-5 0,0009 CC Dendrito 99 33 16,6 1,99 3,94-5 0,0026 CC Periferia celular 1588 320 265,9 1,2 5,25-5 0,003 CC Matriz 243 62 40,7 1,52 0,0003 0,0152 extracelular CC Membrana 1512 299 253,2 1,18 0,0003 0,0182 plasmática
Tabela 14. O termo de ontologia do gene significativamente enriquecido (ajustado p<0,05) a partir da análise de regressão univariada realizada no GEMMA com cada característica comportamental e 544K SNPs em todo o genoma.
O HYP não teve categorias significativas de GO enriquecidas.
Abreviações: processo biológico, BP; número de genes de referência na categoria C; número esperado na categoria, E; função molecular, MF; número de genes no conjunto e categoria de genes, O; razão de enriquecimento, R.
Traço Base Nome C O E R valor p valor p comportamental de ajustado dados ABS BP Regulação 2 2 0,02 91,14 0,0001 0,0377 de maturação de neurônio BP Regulação 2 2 0,02 97,14 0,0001 0,0377 negativa de neurônio CC Sinapse 180 8 1,79 4,47 0,0004 0,0400 SIS CC Periferia 1588 30 15,10 1,99 8,88-5 0,0090 celular
CC Membrana 1512 28 14,38 1,95 0,0002 0,0101 plasmática CC Junção 309 10 2,94 3,40 0,0007 0,0236 celular
[0118] Exemplo 7 - Dados Comportamentais
[0119] Cães e lobos foram garantidos para estar no mesmo estágio de desenvolvimento, incluindo apenas indivíduos com mais de um ano de idade, muito além da janela específica da espécie para socialização primária. Todos os cães e lobos foram socializados para os seres humanos como filhotes, receberam contato diário de cuidadores humanos e experimentaram interações regulares de contato livre com seres humanos desconhecidos desde a infância até o momento deste estudo. Para garantir que os lobos utilizados neste estudo tivessem sido socializados de acordo com os padrões aceitos e fossem o mais familiar possível com seus cuidadores, os lobos só eram incluídos se tivessem sido criados por humanos antes de 10 a 14 dias de idade, seguindo os procedimentos estabelecidos por Klinghammer & Goodman (70), e ainda viviam na mesma instalação em que foram criados. Os lobos experimentaram contato de 24 horas com cuidadores humanos durante pelo menos as primeiras seis semanas de vida, seguidos de contato durante o dia até os quatro meses de idade e, depois, interação humana diária com cuidadores e outros seres humanos. Portanto, no presente estudo, o menor nível de sociabilidade exibido para os indivíduos familiares pelos lobos em comparação aos cães de estimação não pode ser explicado pela falta de formação inicial de vínculo (socialização) ou falta de familiaridade com seus cuidadores. De fato, os lobos demonstraram interesse social em seus cuidadores, aproximando-se deles para cumprimentos quando entraram durante o teste de sociabilidade neste estudo. No entanto, eles retornaram para outras atividades. Esse padrão de comportamento pode ser considerado um cumprimento social “típico” para animais adultos ligados, enquanto o cumprimento prolongado de cães de estimação, às vezes com duração de dois minutos, seria considerado exagerado ou hipersocial (7).
[0120] Para garantir condições equivalentes de teste, cada espécie foi testada em um ambiente controlado mais constante com o ambiente doméstico (77). Os cães foram testados individualmente em um local coberto em Corvallis Oregon, EUA; lobos foram testados em um recinto ao ar livre familiar em Wolf Park, Battle Ground Indiana, EUA. Os procedimentos de teste foram os mesmos para as duas espécies. Cada sujeito foi avaliado usando dois testes projetados para investigar quantitativamente sua sociabilidade dirigida ao homem ao longo de índices relevantes para a apresentação clínica da WBS: um teste de tarefa solucionável e um teste de sociabilidade (7, 8). Os dados do teste de tarefa solucionável e do teste de sociabilidade foram utilizados para calcular três índices relevantes para comportamentos que tipificam a WBS em seres humanos: predisposição de atenção a estímulos sociais (ABS), hipersociabilidade (HYP) e interesse social em estranhos (SIS) (Tabela 15). Tabela 15. Dados comportamentais e descrição relativos à WBS. Comportamento Tarefa quantificada Cálculo Referência e informações sobre a WBS Predisposição à Maior proporção A razão da 22 atenção em de tempo proporção de relação a referenciando tempo gasto estímulos sociais seres humanos olhando para o (ABS) familiares experimentador e a Menor proporção soma da proporção de tempo olhando de tempo gasto para o objeto olhando para a Menor proporção caixa de quebra- de tempo em cabeça no teste de contato físico com tarefa solucionável. o objeto Hipersociabilidade Maior proporção Soma do tempo 22, 37 (HYP) de tempo gasto na gasto nas proximidade de proximidades do seres humanos pesquisador em familiares ou não cada fase do teste familiares de sociabilidade. Interesse social em Maior proporção Soma do tempo 22, 37 estranhos (SIS) de tempo na gasto nas proximidade de proximidades do humanos não pesquisador nas familiares duas fases não familiares do teste de sociabilidade.
[0121] Esses testes são descritos em detalhes nas seções a seguir.
[0122] Tarefas solucionáveis e medidas de sociabilidade. O teste de tarefa solucionável foi usado para medir o desempenho individual de solução de problemas, a atenção aos seres humanos e o grau em que a presença de um ser humano familiar interferia no comportamento independente de solução de problemas. Embora essa tarefa de solução de problemas seja considerada desafiadora, ela já foi validada como fisicamente solucionável por lobos, cães pequenos e cães grandes (8). Todos os indivíduos foram ingênuos ao problema antes do teste e os seres humanos foram instruídos a permanecerem passivos e neutros após colocar o recipiente no chão.
[0123] O teste de sociabilidade consistiu de uma fase passiva e uma ativa, cada uma com duração de dois minutos. Um lobo (ID 2794) não estava disponível para testes de sociabilidade, portanto, a análise de sociabilidade foi realizada em todos os 18 cães e 9 lobos. O pesquisador falou e tocou no assunto se o animal chegasse perto o suficiente para alcançá-lo enquanto permanecia no balde ou na cadeira. Se o animal se afastar, o pesquisador chama seu nome novamente para recuperar a atenção do sujeito. Todos os ensaios foram gravados em vídeo. Para cada condição, os vídeos foram codificados para o tempo gasto próximo ao experimentador e o tempo gasto tocando no experimentador (27). Um codificador independente, cego para o objetivo deste estudo, codificou duas vezes 42% desses vídeos; a confiabilidade interexaminadores foi determinada como forte usando um kappa de Cohen ponderado, K=0,75 (intervalo de confiança de 95%: 0,64-0,86) (72).
[0124] Deve-se notar que muitos dos lobos do presente estudo participaram e tiveram um desempenho melhor ou melhor do que os cães domésticos em tarefas relacionadas à cognição social (usando pistas humanas para resolver problemas) (26). No estudo atual, eles rapidamente se aproximaram dos humanos para iniciar uma saudação ou receber a caixa do quebra-cabeça. A principal diferença observada foi que os cães adultos eram mais propensos a entrar em contato prolongado ou exagerado com os seres humanos do que os lobos adultos.
[0125] Índices comportamentais relevantes para a WBS em humanos. Os dados do teste de tarefa solucionável e do teste de sociabilidade foram usados para quantificar o comportamento canino ao longo de índices relevantes para o fenótipo sociável da WBS, incluindo: 1) tempo gasto olhando a caixa do quebra-cabeça no teste de tarefa solucionável (“tempo olhando a caixa”), 2 ) tempo gasto olhando para o humano no teste de tarefa solucionável (“tempo olhando o humano”), tempo gasto próximo a um experimentador familiar nas fases 3) ativa e 4) passiva do teste de sociabilidade “proximidade familiar ativa” e “proximidade familiar passiva”) e tempo gasto nas proximidades de um pesquisador desconhecido nas 5) fases ativas e 6) passivas do teste de sociabilidade (“proximidade de desconhecido ativa'' e “proximidade de desconhecido passiva”).
[0126] Os dados do teste de tarefa solucionável e do teste de sociabilidade foram utilizados para calcular três índices relevantes para o comportamento selecionado durante a domesticação de cães e análogos aos comportamentos que tipificam a WBS em humanos: predisposição de atenção a estímulos sociais (ABS), hipersociabilidade (HYP), e interesse social em estranhos (SIS). O ABS foi calculado como a razão entre o tempo gasto olhando para o experimentador e a soma do tempo gasto olhando para o experimentador e o tempo gasto olhando para a caixa do quebra-cabeça no teste de tarefa solucionável e tinha como objetivo quantificar a proporção de atenção do animal direcionada em direção ao experimentador. O HYP foi calculado como a soma do tempo gasto próximo ao pesquisador em cada fase do teste de sociabilidade e teve como objetivo quantificar o envolvimento com seres humanos em cenários sociais. O SIS foi calculado como a soma do tempo gasto na proximidade do pesquisador nas duas fases desconhecidas do teste de sociabilidade e teve como objetivo quantificar o envolvimento com pessoas desconhecidas (Tabelas 2, 15).
[0127] Análise de componentes principais de índices comportamentais. O comportamento do cão e do lobo também foi caracterizado pela análise de componentes principais, usando os dados dos testes Tarefa Solucionável (8) e Teste de Sociabilidade (73) (Tabela 2) com a função prcomp em R (http://www.r-project.org/).
[0128] A inclusão de PCs foi avaliada com o pacote nFactors em R (74). A maioria das análises de retenção de componentes indicou a inclusão dos dois principais componentes principais (Regra de Kaiser: 2, análise paralela de Horn: 2, fator de aceleração: 2, coordenadas ideais: 1). No entanto, verificou-se que uma porcentagem relativamente baixa de variação comportamental foi explicada pelos dois primeiros componentes principais (cumulativamente, 72%) e a falta de um ponto de inflexão óbvio no gráfico de autovalores (Figura 4). Além disso, pesquisas anteriores mostraram que a inclusão de um maior número de componentes principais fenotípicos aumenta significativamente o poder das associações em todo o genoma (75). Portanto, as três principais PCs foram selecionadas para uso como fenótipos nas análises de regressão.
[0129] Exemplo 8 - Coleta de amostras genéticas e enriquecimento genômico
[0130] Após testes comportamentais, foram coletados 2-3 ml de sangue de cada cão e lobo da veia cefálica, safena ou jugular, dependendo do indivíduo, temperamento e acessibilidade da veia. O sangue foi depositado em um tubo de coleta de sangue estéril, rotulado e imediatamente colocado em um freezer mantido abaixo de -18 graus Celsius até ser enviado durante a noite em gelo para análise. 24 das 28 amostras foram escolhidas para sequenciar (n, cães=16, lobos=8). Dois dos 18 cães originais foram removidos do sequenciamento devido ao seu baixo rendimento de DNA; dois dos 10 lobos originais foram excluídos do sequenciamento devido à falta de uma oportunidade de redesenhar amostras de sangue desses indivíduos, seja devido aos nossos protocolos institucionais ou devido à indisponibilidade do indivíduo (Tabelas 1, 4). O DNA genômico foi preparado a partir de amostras de sangue usando mini kits QIAamp DNA (Qiagen, DNeasy blood e Tissue kit). O DNA foi quantificado usando um fluorômetro Qubit 2.0 e verificado em um gel de agarose a 2% quanto à degradação.
Seguiu-se uma região sob seleção positiva no genoma do cão doméstico no cromossomo 6, identificada a partir de uma varredura em todo o genoma de 48.036 SNPs (19), por meio do ressequenciamento direcionado de um bloco contíguo de ~5 Mb (2.031.491-7.215, 670 bp) que continha 46 genes anotados por Ensembl (40, 76), 27 dos quais foram descritos na WBS (Tabela 16). Tabela 16. Genes na região-alvo no cromossomo canino 6 (CFA6). As posições são da construção do genoma canfam3.1. Gene inicial (bp) Gene terminal (bp) Nome do gene Referência 2132919 2563654 WBSCR17 19 2749188 2831960 AUTS2 19 5606042 5632471 WBSCR16 105 5700832 5719439 NCF1 105 5722967 5811965 GTF21 105 5885985 5963867 GTF21RD1 105 6028219 6090774 CLIP2 105 6136604 6159026 RFC2 105 6164647 6171316 LAT2 105 6180064 6192330 EIF4H 105 6264548 6285910 LIMK1 105 6304623 6321742 ELN 105 6472520 6474969 WBSCR28 105 6488348 6492871 WBSCR27 105 6493513 6494145 CLDN4 105 6534229 6535239 CLDN3 105
6550966 6556271 ABHD11 105 6574691 6581692 STX1A 105 6595294 6595674 DNAJC30 105 6602419 6606916 VPS37D 105 6633050 6652557 MLX1PL 105 6656046 6674950 TBL2 105 6680478 6701631 BCL7B 105 6709697 6778186 BAZ1B 105 6782774 6784558 FZD9 105 6836043 6868433 FKBP6 105 6887596 6899406 NSUN5 105
[0131] Foi utilizada uma opção de serviço completo oferecida pelo MYcroarray para enriquecimento de DNA e preparação da biblioteca genômica. Foram projetadas sondas de isca de 80 mer para atingir a região de interesse (design do kit MYbaits). O DNA genômico foi sonicado com tamanhos de fragmento de aproximadamente 300 pb, dos quais 500 ng foram usados para construir bibliotecas de sequenciamento Illumina TruSeq. Cada biblioteca foi amplificada por índice duplo por oito ciclos de PCR, produzindo entre 590 ng e 1744 ng da biblioteca de sequenciação. Deste, 500 ng foram usados para o enriquecimento do alvo com um kit MYbaits personalizado. Após o enriquecimento, as bibliotecas foram amplificadas por seis ciclos, produzindo entre 6,7 ng e 14,7 ng de biblioteca. As bibliotecas foram padronizadas através da associação de 5 ng de cada biblioteca a um volume de 30 ul a 4 ng/ul para sequenciamento 2x67nt de extremidade pareada em uma única faixa do Illumina HiSeq2500. Consulte a Tabela 5 para estatísticas resumidas do enriquecimento.
[0132] Exemplo 9 - Processamento de dados de sequência e bioinformática
[0133] Para deplexagem estrita, as sequências com combinações perfeitas entre as tags de sequência de índice observadas e esperadas foram mantidas. As leituras foram cortadas e cortadas com cutadapt-1.8.1 (77) para descartar leituras com comprimento <20 pb, excluir sites de baixa qualidade (<20) e remover a sequência do adaptador TruSeq remanescente. Os desvios médios e padrão dos tamanhos das inserções da biblioteca foram calculados individualmente para cada animal com um script python personalizado (https://gist.github.com/davidliwei/2323462). Todas as leituras foram mapeadas para o cromossomo de cão de referência não mascarado 6 (CanFam3.1, Ensembl) gerado a partir de um indivíduo da raça boxer com BWA-0. 7.12 (78). As duplicatas de PCR foram marcadas e removidas com picard-tools-1.138 (http://picard.sourceforge.net). Os arquivos BAM foram então indexados, classificados e os arquivos VCF produzidos a partir do SAMtools (79), a partir dos quais as estatísticas descritivas de sequenciamento foram calculadas. A partir dos arquivos BAM classificados, ANGSD (80) foi usado para chamar genótipos SNP com profundidade mínima de 10X de cobertura de sequência, qualidade mínima de mapeamento 30, SNP p<0,00001 e probabilidade posterior >0,95 e qualidade variante mínima de 20. Pontuações também foram ajustadas em torno de inserções/exclusões com o sinalizador --baq. Sítios monomórficos foram excluídos.
[0134] Os genótipos SNP foram faseados com SHAPEIT (81). A região foi pesquisada quanto a sinais de seleção positiva no genoma do cão, usando a homozigose do haplótipo estendido entre populações (XP-EHH [82]) de 4.844 SNPs dentro da região ressequenciada. O FST por SNP foi calculado com um script personalizado (19). Ambas as pontuações do FST e XP-EHH foram normalizadas em uma pontuação z para ter uma média de zero e desvio padrão de 1. O produto de suas pontuações z representava sua “pontuação percentil bivariada” composta. A regra empírica foi usada para identificar loci extremos no percentil 97,5 ou maior (pontuação z >2). Os picos de seleção tinham que conter pelo menos três loci extremos a serem considerados.
[0135] Exemplo 10 - Anotação de novo e chamada de genótipo de variantes estruturais
[0136] Resumidamente, o SVMerge é uma plataforma de detecção de SV que implementa o algoritmo RP BreakDancer
(83), o algoritmo RP e SR Pindel (84) e um algoritmo que agrupa leituras mapeadas de extremidade única para detectar inserções (85). O pipeline SVMerge implementa seus chamadores SV constituintes, filtra e mescla as chamadas variantes e valida computacionalmente os pontos de interrupção pelo conjunto Velvet de novo (85). O Softsearch é um algoritmo RP e SR que também é a única plataforma de detecção de SV disponível, que foi validada experimentalmente para alto desempenho com dados de sequenciamento personalizados (86,87). O InGAP-SV é um algoritmo RD e RP que usa assinaturas de profundidade de cobertura para identificar SVs putativos, depois refina e categoriza as variantes com base nos sinais RP (88). Ao integrar a saída desses três programas, os pontos fortes de todos os algoritmos de detecção de SV disponíveis foram aproveitados e incorporados o melhor método disponível para dados de sequenciamento personalizados (Figuras 10, 11).
[0137] Os parâmetros padrão foram usados para cada plataforma de chamada de SV, exceto onde uma cobertura de sequência mínima de 25x em todas as plataformas foi usada para chamar um SV e no mínimo cinco leituras para formar um cluster de extremidade única (Tabela 17). Tabela 17. Parâmetros para anotação in silico de variantes estruturais para A) SVMerge, B) SoftSearch e C) InGAP-SV. A.
Sinalizador de parâmetro Definição de Parâmetro Valor Valor Padrão Usado BDconfParams -c O número de desvios padrão 4 4 em relação ao tamanho médio do inserto para o mapeamento de pares de leitura deve ser considerado discordante; Passado para o Breakdancer -n Número de observações 10000 10000 necessárias para estimar a média e o desvio padrão do tamanho do inserto; Passado para BreakDancer -c O número de desvios padrão 3 3 em relação ao tamanho médio do inserto para o mapeamento de pares de leitura deve ser considerado discordante; Passado para o Breakdancer BDparams -m Tamanho máximo de SV 5000000 5000000 exigível; Passado para o Breakdancer -q Qualidade mínima de 25 25 mapeamento usada na determinação de SV; Passado para o Breakdancer BD Copy num Ploidia de Organismo; 2 2 Passado para o Breakdancer PDoptParams -x Nota: 5 corresponde a 32.368 5 5 pb Tamanho mínimo de inversão 1000 1000 exigível; Passado para Pindel.
SECqual -v Qualidade mínima de 20 25 mapeamento usada na determinação de SV; Passado para o SECluster SECmin Número mínimo de leituras no 5 5 agrupamento direto ou reverso, quando os agrupamentos são analisados.
SECminCluste Número mínimo de leituras 3 5 r para formar um agrupamento de encaminhamento ou reversão de parte única.
SECmax Número máximo de leituras 500 500 permitido em um agrupamento.
Etapa de BDscore Limite de pontuação para 25 25 filtragem dados do Breakdancer BDrs Número mínimo de pares de 2 2 leitura de suporte para dados do BreakDancer PDscore Pontuação para os dados de 30 30 Pindel PDsupports Número mínimo de pares de 10 10 leitura de suporte para dados de Pindel Hashlen Comprimento Hash para 29 29 montagem; Passado para Velvet Tamanho de Tamanho médio de inserto NA Consulta Inserto de r Tabela biblioteca S2 B. Parâmetro Definição de Parâmetro Tamanho Valor Padrão Usado q Qualidade mínima de mapeamento usada 20 25 na determinação de SV l Comprimento mínimo do segmento 10 10 clipado suave usado na determinação de
SV r Profundidade de leitura mínima de corte 10 10 suave usada na determinação de SV m Número mínimo de pares de leitura 10 10 discordantes para suportar eventos com recorte suave s Número de desvios padrão em relação ao 4 4 tamanho médio da pastilha para que o mapeamento de pares de leitura seja considerado discordante d Distância mínima entre segmentos com 300 300 recorte suave e pares de leitura discordantes C. Parâmetro Definição de Parâmetro Valor Valor Padrão Usado Min quality Qualidade mínima de mapeamento 10 25 usada na determinação de SV Min PE support Número mínimo de pares de leitura 4 4 mapeados discordantemente para suportar SV Min SE support Número mínimo de pares de leitura 4 4 mapeados individualmente para suportar
SV Max SV size Tamanho máximo de SV exigível 100000 100000 X of std dev Número de desvios padrão em relação 3 3 ao tamanho médio da pastilha para que o mapeamento de pares de leitura seja considerado discordante
[0138] Como as lacunas nas regiões altamente repetitivas do genoma de referência representam a principal fonte de falsos positivos na constatação de SV (89,90), as chamadas de SV de todas as plataformas foram filtradas com um script personalizado que removeu todas as chamadas de variantes com pontos de interrupção que caíam dentro de lacunas, microssatélites e repetições em tandem no genoma de referência anotado pelo UCSC Table Browser (91). Os conjuntos filtrados de saída SV de cada programa foram mesclados em uma tabela final e, em seguida, agrupados em um único evento se ambos os pontos de interrupção se situarem a 200 pares de bases um do outro (92) (Figura 5). As plataformas de detecção de SV usadas na tubulação preveem a presença ou ausência de SVs, mas não se um animal é homozigoto ou heterozigoto para um determinado SV.
É mais biologicamente plausível que um determinado SV seja heterozigoto devido ao cruzamento desigual que medeia a variação estrutural no WBSCR17 em humanos que resulta em alterações hemizigotas (20), e que grandes deleções homozigóticas são frequentemente fatais (50). Assim, os loci SV positivos foram codificados como heterozigotos.
Os genótipos foram atribuídos com um script personalizado (Tabela 18). Tabela 18. Genótipo de variante estrutural por indivíduo.
ID do 2769 2771 2772 2773 2774 2775 2776 2777 2778 2779 2780 2781 2782 2783 2784 2785 2786 2787 2788 2789 2790 2791 2792 2793 Animal : Cfa.1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Cfa.2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 Cfa.3 0 0 0 1 1 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 0 1 1 Cfa.4 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Cfa.5 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 Cfa.6 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 1 1 1 Cfa.7 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 0 0 1 Cfa.8 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0 1 1 1 Cfa.9 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 1 1 1 0 1 Cfa.10 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 Cfa.11 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 Cfa.12 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 Cfa.13 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 Cfa.14 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 Cfa.15 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 Cfa.16 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 Cfa.17 1 0 0 0 0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0
Cfa.18 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 Cfa.19 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Cfa.20 1 0 0 0 0 1 0 1 1 0 0 0 1 0 0 0 0 0 0 1 1 0 0 0 Cfa.21 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 Cfa.22 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 1 0 0 1 0 0 0 0 0 Cfa.23 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Cfa.24 1 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 Cfa.25 0 1 0 1 0 1 1 0 1 1 0 1 0 1 1 0 1 1 0 1 1 1 1 1 Cfa.26 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 0 0 0 0 1 1 1 1 1 Cfa.27 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 Cfa.28 0 0 0 1 1 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 Cfa.29 0 0 1 1 1 0 0 1 1 1 0 1 0 0 1 0 0 1 0 1 1 0 0 0 Cfa.30 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Cfa.31 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 Cfa.32 0 1 1 1 1 1 1 1 1 1 1 1 0 1 0 1 0 1 0 1 1 1 1 1 Cfa.33 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 Cfa.34 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 Cfa.35 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 1 0 1 0 1 1 1 0 1 Cfa.36 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 Cfa.37 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 Cfa.38 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 Cfa.39 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 Cfa.40 0 1 0 1 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 1 0 1 1 1 Cfa.41 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 Cfa.42 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 1 Cfa.43 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Cfa.44 1 1 0 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Cfa.45 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 Cfa.46 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 Cfa.47 0 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 1 0 1 1 1 1 1 1 Cfa.48 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 Cfa.49 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 Cfa.50 0 0 0 1 1 1 0 1 0 0 0 1 0 0 1 0 1 1 0 1 1 1 1 1 Cfa.51 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 Cfa.52 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 Cfa.53 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 Cfa.54 0 1 0 0 1 0 0 1 0 0 0 1 0 1 1 1 0 1 1 1 0 0 1 1 Cfa.55 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 Cfa.56 1 0 0 0 0 0 1 0 1 0 0 0 1 0 0 1 1 1 0 1 0 0 0 1 Cfa.57 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 1 1 0 Cfa.58 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 Cfa.59 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 0 1 1 1 1 1 Cfa.60 0 0 1 0 0 0 1 1 1 1 0 1 0 0 0 1 0 0 0 1 0 0 1 1 Cfa.61 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
Cfa.62 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Cfa.63 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 Cfa.64 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 Cfa.65 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 Cfa.66 1 1 1 1 0 1 1 1 1 0 1 1 1 0 0 0 0 0 0 0 1 0 0 0 Cfa.67 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 Cfa.68 0 0 0 0 1 0 1 0 1 1 0 1 0 0 0 1 1 1 0 1 1 1 0 0 Cfa.69 1 0 0 0 0 1 0 0 0 1 0 1 1 0 0 0 0 1 0 1 0 1 1 0 Cfa.70 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 Cfa.71 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 Cfa.72 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 1 0 0 0 1 0 0 0 0 Cfa.73 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 Cfa.74 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Cfa.75 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 1 0 Cfa.76 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 Cfa.77 1 0 0 0 0 0 0 0 0 1 0 1 1 0 0 1 1 1 0 1 1 1 1 0 Cfa.78 0 0 0 0 0 0 0 0 1 0 1 1 0 0 1 0 0 0 0 1 0 0 1 1 Cfa.79 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 1 1 Cfa.80 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 Cfa.81 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 Cfa.82 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 1 Cfa.83 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 Cfa.84 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Cfa.85 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 Cfa.86 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 1 0 0 0 0 1 0 0 0 Cfa.87 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 Cfa.88 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 Cfa.89 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[0139] Exemplo 11 - Teste de associação da região candidata
[0140] O modelo misto linear univariado implementado no programa GEMMA (93) foi utilizado para testar associações entre SVs e cada um dos três índices comportamentais. O módulo univariado do GEMMA se encaixa em um conjunto de genótipos e fenótipos correspondentes para se ajustar a um modelo misto linear univariado que responde por efeitos fixos, estratificação populacional e estrutura da amostra. Para cada variante, o modelo univariado testa a hipótese alternativa Hl: β≠0 contra a hipótese nula H0: β=0, usando as estatísticas de Wald, razão de verossimilhança e pontuação, em que β é o tamanho do efeito de cada variante no fenótipo de interesse.
A estratificação populacional é contabilizada usando- se uma matriz de relação centralizada ou padronizada como efeito aleatório, onde os autores recomendam uma matriz centralizada para organismos não humanos.
Três modelos univariados foram implementados: a primeira estimando associações entre SVs e predisposição atencional a estímulos sociais (modelo ABS), o segundo entre SVs e hipersociabilidade (modelo HYP) e o terceiro entre SVs e interesse social em estranhos (modelo SIS). Para cada modelo univariado, a matriz de relação centrada foi estimada a partir dos genótipos SNP na região-alvo pelo GEMMA, e incorporada para dar conta da relação e estrutura populacional entre as amostras.
Os genótipos SNP foram utilizados no cálculo da matriz de parentesco no lugar dos genótipos de SV, pois havia mais do que uma ordem de magnitude mais genótipos de SNP do que os genótipos de SV (4844 vs. 89) nos quais basear a estimativa.
Valores negativos na matriz de parentesco, indicando que havia menos parentesco entre um determinado par de indivíduos do que seria esperado entre dois indivíduos escolhidos aleatoriamente, foram definidos como 0 na matriz resultante (94,95). Sexo e idade foram utilizados como covariáveis.
Apenas SV com frequência alélica menor (MAF) >0,025 foi testada (96). A correção de Bonferroni para comparações múltiplas foi usada em conjunto com o método simpleM para contabilizar o desequilíbrio de ligação entre as variantes (97) para estabelecer limites de significância.
Com simpleM (http://simplem.sourceforge.net/), o número efetivo de testes independentes foi estimado como Meff=21, correspondendo a um limiar de significância de p=2,38x10-3 (ponto de corte de Bonferroni=0,05 para 21 independentemente) SVs testados). O teste da razão de verossimilhança foi utilizado para determinar os valores p.
Como o fenótipo ABS foi calculado como proporção, a transformação arcsin foi aplicada antes de todas as análises; todos os outros fenótipos não foram transformados.
[0141] Os modelos mistos lineares multivariados do GEMMA estimam a associação entre uma dada variante e todos os fenótipos de interesse simultaneamente, respondendo pela correlação entre os fenótipos e geralmente exibindo maior poder estatístico do que os modelos mistos lineares univariados. Especificamente, o módulo multivariado do GEMMA ajusta um conjunto de genótipos e fenótipos correspondentes a um modelo misto linear multivariado que responde por efeitos fixos, estratificação populacional e estrutura da amostra. Para cada variante, o GEMMA testa a hipótese alternativa Hl: β≠0 contra a hipótese nula Ho: β=0, usando as estatísticas de Wald, razão de verossimilhança e pontuação, onde β é o tamanho do efeito de cada variante para todos os fenótipos. Além dos modelos univariados implementados para cada fenótipo individualmente, o modelo misto linear multivariado do GEMMA foi usado para estimar associações entre SVs e vários fenótipos comportamentais simultaneamente. Dois modelos multivariados foram implementados com os mesmos parâmetros e transformação de dados utilizados nos modelos univariados: um estimando associações entre SVs e os índices de sociabilidade dirigida por humanos (modelo de índice comportamental) e os outros estimando associações entre SVs e as três primeiras PCs de comportamento social (modelo PC).
[0142] Para investigar a possibilidade de os SVs estarem associados à associação de espécies (cão versus lobo), uma varredura de associação de cada locus de SV à associação de espécies foi realizada com PLINK (98) (Tabela 11). Variantes fortemente associadas ao comportamento social, mas não à participação de espécies, são candidatas particularmente robustas a mediadores do comportamento social.
[0143] Exemplo 12 - Validação e análise PCR de variantes estruturais
[0144] Foi feita uma tentativa de projetar os iniciadores que flanqueavam todos os SVs significativamente associados ao comportamento social direcionado a humanos (Tabela 9), bem como outros dois SVs que sugeriam uma associação, mas não ultrapassavam o limite de significância (modelo univariado: HYP e Cfa6.6, β±se=138,8±33,62, p=5,75x10- 3 ; ABS e Cfa6.83, β±se=-0,064±0,09, p=6,90x10-3). Os iniciadores foram projetados com base no genoma de referência para cães (Canfam3.1) com o Iniciador 3 (99) (Tabela 19). Tabela 19. Sequências de iniciadores usadas para PCR e validação baseada em gel de variantes estruturais. Tamanho de amplicon (bp): Inserção Tipo Locus Sequência iniciadora selvagem Cfa6.6 Direto: CCCCTTCAGCCAGCATATAA 555 357 Reverso: TTCTCTGGGCTGTCTGGAT Cfa6.6 Direto: AAGTTTCTCTGATGGAAAACACA 278 90 (interno) Reverso: GGTGGCTGGAAATTTCAGTAG Cfa6.7 Direto: TGGAGCCATGATTAGGAAGG 504 269 Reverso: TAAGGAAGGACCCCATTTCC Cfa6.66 Direto: TGCTGCTTCATGTTCTGTGA 505 215 Reverso: TGGTGCATTAGCTTTGGTTG Cfa6.83 Direto: AACCACAGGAACAAAACCTCA 400 184 Reverso: CCTCCTGTTGGACATTTGGA
[0145] Os iniciadores que amplificaram Cfa6.3 e Cfa6.72 não puderam ser projetados e, portanto, genótipos codominantes de alta confiança só foram obtidos para Cfa6.6, Cfa6.7, Cfa6.66 e Cfa6.83. Cfa6.3 é ~40 bp a jusante de um gap de 300 bp no genoma de referência. É possível que esse intervalo tenha causado um falso positivo durante a anotação in silico desse locus, pois qualquer sequência no intervalo não seria mapeada para a referência e, em vez disso, poderia ser interpretada como uma inserção pelos algoritmos de anotação SV.
[0146] Para os 24 cães e lobos no estudo de sequenciamento direcionado, juntamente com uma amostragem mais ampla de canídeos selvagens e raças de cães, cada locus SV foi amplificado por PCR e os genótipos foram chamados com base nos padrões de bandas na eletroforese em gel de agarose (Figura 8). As condições de PCR foram as seguintes: dNTPs 0,2 mM, MgCl2 2,5 mM, 0,1 mg/ml de albumina de soro bovino, 0,2 uM de cada iniciador, 0,75 unidade de Amplitaq Gold (Thermo Fisher Scientific), tampão 1x Gold e ~10 ng de DNA genômico. As condições de ciclismo foram: 10 m a 95 °C, seguidas por 30 ciclos de 30 s a 95 °C, 30 s a 60 °C (30 s a 55 °C para Cfa6.83) e 45 s a 72 °C, e uma extensão final de 10 m a 72 °C. Dez a 15 ul de produto de PCR foram executados em gel de agarose a 1,8% e fotografados para identificação de genótipo (Figura 6). Para confirmar que os SVs consistem em elementos transponíveis (TEs), produtos de PCR para três indivíduos por genótipo homozigoto foram sequenciados por Sanger, montados e alinhados ao CanFam3.1 em Geneious. As regiões de baixa complexidade no TE nos três locais resultaram em baixa qualidade da sequência, e o locus Cfa6.6 exigiu iniciadores internos adicionais para sequenciar o TE. O alinhamento com o genoma de referência do cão mostra que os comprimentos de SV são muito semelhantes às estimativas in silico e que, em cada caso, os TEs estão totalmente contidos no SV. Cfa6.6 é 196 pb (inclui 188 pb TE); Cfa6.7 é 229 pb (193 pb TE); Cfa6.66 é 259 pb (187 pb TE) e Cfa6.83 é 216 pb (182 bp TE).
[0147] A PCR foi usada para amplificar e eletroforese os métodos para genotipar quatro SVs em um painel de canídeos selvagens (n, lobos cinzentos: Europa=12, Índia/Irã=7, China=3, Oriente Médio=14, América do Norte=15; coiotes n=13), os 16 cães domésticos dos esforços iniciais de sequenciamento e 201 cães domésticos de 13 raças registradas no AKC (n, cães: Malamute do Alasca=13, cão de Bernese Mountain=20, Border Collie=20, Border Collie=20, Boxer=13, Basenji=7, Cairn Terrier=18, Golden Retriever=16, Grandes Pirineus=17, Jack Russell Terrier=17, Poodle miniatura=10, Schnauzer miniatura=16, Pug=19, Saluki=15). 17 populações semidomésticas também foram genotipadas, representando cães da Nova Guiné (NGSD, n=3), cães Pariah da Arábia Saudita (n=4) e cães da aldeia de dois locais (África, n=5; Porto Rico, n=5). Embora um projeto ideal inclua uma grande amostragem de indivíduos de um cruzamento experimental de cão-lobo (por exemplo, híbridos Fl e retrocruzamentos), isso não é possível construir nos Estados Unidos, pois seria necessário gerar uma colônia de animais com anos de criação selecionada. Um método alternativo seria explorar a edição do genoma com o CRISPR/Cas9, que apenas recentemente demonstrou funcionar em cães (100).
[0148] Foram selecionadas raças de vários tipos de raças, representando diferentes ancestrais e funções comportamentais. Cada raça foi fenotipada de acordo com os estereótipos comportamentais do AKC (41) em uma categoria que busca ou evita a atenção (busca atenção: cão da montanha Bernese, Border collie, Boxer, Golden retriever, Jack Russell terrier, Poodle miniatura, Pug; Evita atenção: Alasca malamute, Basenji, Cairn terrier, Grandes Pirineus, schnauzer miniatura, Saluki e todos os cães semidomésticos). As raças que foram classificadas como “procuram atenção” foram aquelas que tipicamente tentavam se envolver com seres humanos, familiares ou não (41). Não era necessário que essas raças fossem gregárias ou hipersociais, pois buscavam ativamente qualquer atenção humana; pelo contrário, demonstram preferência por trabalhar com seres humanos, passar tempo, receber afeto ou oferecer comportamentos a colegas humanos. Por outro lado, as raças que “evitam a atenção” são aquelas classicamente classificadas como “distantes” ou “independentes”, criadas para existir na periferia da vida humana ou tendem a optar por atividades individuais.
[0149] Exemplo 13 - Pesquisa SNP em todo o genoma
[0150] Os genótipos SNP em todo o genoma foram coletados usando as matrizes Affymetrix Axiom K9HDSNPA (643.641 loci) e Axiom K9HDSNPB (625.577 loci) com uma concentração média de 26,5 ng/ul para 11 dos 24 indivíduos com fenótipos comportamentais (ncão=5; nlobo=6). As amostras com um valor de QC de prato ≥0,82 e taxa de chamada >97% foram retidas. O controle e o processamento da qualidade do genótipo SNP identificaram que 794.665 SNPs, 56,3% do K9HDSNPA (250.545 loci) e 87% do K9HDSNPB (544.120 loci) passaram nas métricas de filtragem. A Affymetrix recomendou que um subconjunto de 544.120 loci (conhecido como 544K SNPs) fosse incluído em todas as análises posteriores. O PLINK foi usado para obter um conjunto podado de 25.510 SNPs não correlacionados e desvinculados com o argumento -indep-pairwise 50 5 0.2, depois conduziu um PCA com o programa flashPCA (101) (Figura 9). Também foi realizado um teste de associação binária no PLINK sobre o fenótipo binário de associação de espécies. Além disso, um teste quantitativo de associação foi realizado usando os traços comportamentais quantitativos e um limiar de significância de p<0,005, testando cada um dos comportamentos (ABS, HYP, SIS) de forma independente e depois em conjunto. De maneira semelhante à regressão dos dados de ressequenciamento direcionados descritos acima, uma análise de regressão univariada foi concluída com o GEMMA no conjunto SNP 544K e os fenótipos comportamentais quantitativos de ABS, HYP e SIS. As informações de parentesco foram incorporadas através de uma matriz de parentesco. O limiar de significância do teste da razão de verossimilhança foi ajustado para p<1º percentil para identificar regiões candidatas. A análise de enriquecimento da ontologia genética (GO) foi conduzida em WebGestalt (102, 103), usando o genoma de referência como o conjunto de genes de referência, o teste hipergeométrico para avaliar o nível de enriquecimento de termos e ajustado o limiar de significância devido a testes múltiplos usando o Benjamini & Método de Hochberg (104). Um termo foi considerado significativo se o valor ajustado fosse p˂0,05.
[0151] Exemplo 14 - Ética
[0152] Todos os sujeitos foram voluntários pelos seus donos/cuidadores e permaneceram sob seus cuidados durante todo o estudo. Os procedimentos experimentais foram avaliados e aprovados pela Oregon State University IACUC, protocolo nº 4444. Os métodos laboratoriais foram conduzidos sob o protocolo IACUC aprovado nº 2008A-14 da
Universidade de Princeton. As diretrizes institucionais da IACUC foram seguidas com animais.
REFERÊNCIAS
1. Frank, H., Evolution of canine information processing under conditions of natural and artificial selection. Zeitschrift fur Tierpsychologie 53, 389-399 (1980).
2. Miklosi, A., Topal, J., Csanyi, V., Comparative social cognition: what can dogs teach us? Anim. Behav. 67, 995-1004 (2004).
3. Hare, B., Tomasello, M., Human-like social skills in dogs? Trends. Cogn. Sci. 9, 439-444 (2005).
4. Udell, M.A., Dorey, N.R., Wynne, CD., What did domestication do to dogs? A new account of dogs' sensitivity to human actions. Biol. Rev. 85, 327-345 (2010).
5. Trut, L., Oskina, I., Kharlamova, A., Animal evolution during domestication: the domesticated fox as a model. Bioessays 31(3), 349- 360 (2009).
6. Nagasawa, M., Mitsui, S., En, S., Ohtani, N., Ohta, M., Sakuma, Y., Onaka, T., Mogi, K., Kikusui, T., Oxytocin-gaze positive loop and the coevolution of human-dog bonds. Science 348, 333-336 (2015).
7. Bentosela, M., Wynne, CD., D'Orazio, M., Elgier, A., Udell, M.A.R., Sociability and gazing toward humans in dogs and wolves: Simple behaviors with broad implications. J. Exp. Anal. Behav. 105, 68-75 (2016).
8. Udell, M.A., When dogs look back: inhibition of independent problem-solving behaviour in domestic dogs (Canis lupus familiaris) compared with wolves (Canis lupus). Biol. Letters 11, 20150489 (2015).
9. Jones, P., Chase, K., Martin, A., Davem, P., Ostrander, E.A., Lark, K.G., Single- nucleotide-polymorphism-based association mapping of dog stereotypes. Genetics 179(2), 1033-1044 (2008).
10. Parker, H.G, Kim, L.V., Sutter, N.B. Carlson, S., Lorentzen, T.D., Malek, T.B., Johnson, G.S., DeFrance, H.B., Ostrander, E.A., Kruglyak, L., Genetic structure of the purebred domestic dog. Science 304, 1160-1164 (2004).
11. Serpell, J.A., Hsu, Y., Effects of breed, sex, and neuter status on trainability in dogs. Anthrozoos 18, 196-207 (2005).
12. Svartberg, K., Breed-typical behavior in dogs— historical remnants or recent constructs? Appl. Anim. Behav. Sci. 96, 293-313 (2006).
13. Duffy, D.L., Hsu, Y., Serpell, J.A., Breed differences in canine aggression. Appl. Anim. Behav. Sci. 114, 441-460 (2008).
14. Ley, J.M., Bennett, P.M., Coleman, G.J., A refinement and validation of the Monash Canine Personality Questionnaire (MCVQ). Appl. Anim. Behav. Sci.116, 220-227 (2009).
15. Turcsan, B., Kubinyi, E., Miklosi, A., Trainability and boldness traits differ between dog breed clusters based on conventional breed categories and genetic relatedness. Appl. Anim. Behav. Sci. 132, 61-70 (2011).
16. Vaysse, A., Ratnakumar, A., Derrien, T., Axelsson, E., Rosengren Pielberg, G., Sigurdsson, S., Fall, T., Seppala, E.H., Hansen, M.S.T., Lawley, C.T., Karlsson, E.K., The LUPA Consortium, Bannasch, D., Vila, C, Lohi, H., Galibert, F., Fredholm, M., Haggstrom, J., Hedhammar, A., Andre, C, Lindblad-Toh, K., Hitte, C, Webster, M.T., Identification of genomic regions associated with phenotypic variation between dog breeds using selection mapping. PLoS Genet. 7(10), el002316 (2011).
17. Serpell, J.A., Duffy, D.L., Dog breeds and their behavior. A. Horowitz (ed.), Cão doméstico Cognition and Behavior, Springer p31-57 (2014).
18. Persson, M.E., Roth, L.S.V., Johnson, M., Wright, D., Jensen, P., Human-directed social behavior in dogs shows significant heritability. Genes Brain Behav. 14, 337-344 (2015).
19. vonHoldt, B.M., Pollinger, J.P., Lohmueller, K.E., Han, E., Parker, H.G., Quignon, P., Degenhardt, J.D., Boyko, A.R., Earl, D.A., Auton, A., Reynolds, A., Bryc, K., Brisbin, A., Knowles, J.C., Mosher, D.S., Spady, T. C, Elkahloun, A., Geffen, E., Pilot, M., Jedrzejewski, W., Greco, C, Randi, E., Bannasch, D., Wilton, A., Shearman, J., Musiani, M., Cargill, M., Jones, P.G, Qian, Z., Huang, W., Ding, Z.-L., Zhang, Y.P., Bustamante, CD., Ostrander, E.A., Novembre, J., Wayne, R.K., Genome-wide SNP and haplotype analyses reveal a rich history underlying dog domestication. Nature 464, 898-902 (2010).
20. Schubert, C, The genomic basis of the Williams- Beuren syndrome. Cell. Mol. Life Sci. 66, 1178-1197 (2009).
21. Meyer-Lindenberg, A., Mervis, C.B., Berman, K.F., Neural mechanisms in Williams syndrome: a unique window to genetic influences on cognition and behaviour. Nat. Rev. Neurosci. 7, 380-393 (2006).
22. Jones, W., Bellugi, U., Lai, Z., Chiles, M., Reilly, J., Lincoln, A., Adolphs, R, II. Hypersociability in Williams syndrome. J. Cognitive Neurosci. 12, 30-46 (2000).
23. Ewart, A.K., Morris, C.A., Atkinson, D., Jin, W., Stemes, K., Spallone, P., Stock, A.D., Leppert, M., Hemizygosity at the elastin locus in a developmental disorder, Williams syndrome. Nat. Genet. 5, 11-16 (1993).
24. Wan, M., Hejjas, K., Ronai, Z., Elek, Z., Sasvari- Szekely, M., Champagne, F.A., Miklosi, A., Kubinyi, E., DrD4 and TH gene polymorphisms are associated with activity, impulsivity and inattention in Siberian Husky dogs. Anim. Genet. 44, 717-727 (2013).
25. Kis, A., Bence, M., Lakatos, G, Pergel, E., Turcsan, B., Pluijmakers, J., Vas, J., Elek, Z., Bruder, I., Foldi, L., Sasvari-Szekely, M., Miklosi, A., Ronai, Z., Kubinyi, E., Oxytocin receptor gene polymorphisms are associated with human directed social behavior in dogs (Canis familiaris). PLoS One 9(1): e83993. doi:10.1371/journal.pone.0083993 (2014).
26. Jakovcevic, A., Mustaca, A., Bentosela, M., Do more sociable dogs gaze longer to the human face than less sociable ones? Behav. Process. 90, 217-222 (2012).
27. Bentosela, M., Wynne, CD., D'Orazio, M., Elgier, A., Udell, M.A., Sociability and gazing toward humans in dogs and wolves: Simple behaviors with broad implications. J. Exp. Anal. Behav. 105, 68-75 (2016).
28. Brubaker, L., Dasgupta, S., Bhattachaq ee, D., Bhadra, A., Udell, M.A.R., Differences in problem-solving between canid populations: Do domestication and lifetime experience affect persistence? Anim. Cogn. https://doi.org/10.1007/s10071-017-1093-7 (2017).
29. Walsh, T., McClellan, J.M., McCarthy, S.E., Addington, A.M., Pierce, S.B., Cooper, G.M., Nord, A.S., Kusenda, M., Malhotra, D., Bhandari, A., Stray, S.M., Rippey, C.F., Roccanova, P., Makarov, V., Lakshmi, B., Findling, R.L., Sikich, L., Stromberg, T., Merriman, B., Gogtay, N., Butler, P., Eckstrand, K., Noory, L., Gochman, P., Long, R., Chen, Z., Davis, S., Baker, C, Eichler, E.E., Meltzer, P.S., Nelson, S.F., Rare structural variants disrupt multiple genes in neurodevelopmental pathways in schizophrenia. Science 320, 539-543 (2008).
30. Cusco, I., Corominas, R., Bayes, M., Flores, R., Rivera-Brugues, N., Campuzano, V., Perez-Jurado, L.A., Copy number variation at the 7ql 1. 23 segmental duplications is a susceptibility factor for the Williams-Beuren syndrome deletion. Genome Res. 18, 683- 694 (2008).
31. Wong, K., Keane, T.M., Stalker, J., Adams, D.J., Enhanced structural variant and breakpoint detection using SVMerge by integration of multiple detection methods and local assembly. Genome Biol. 11, R128 (2010).
32. Hart, S.N., Sarangi, V., Moore, R, Baheti, S., Bhavsar, J.D., Couch, F.J., Koher, J.-P.A., SoftSearch: integration of multiple sequence features to identify breakpoints of structural variations. PLoS One 8, e83356 (2013).
33. Qi, J., Zhao, F., inGAP-sv: a novel scheme to identify and visualize structural variation from paired end mapping data. Nucleic Acids Res. 39, W567-W575 (2011).
34. Korenberg, J.R., Chen, X.-N., Hirota, H., VI. Genome structure and cognitive map of Williams Syndrome. J. Cognitive Neuroci. 12(1), 89-107 (2000).
35. Young, E.J., Lipina, T., Tarn, E., Mandel, A., S. Clapcote, J., Bechard, A.R., Chambers, J., Mount, H.T.J., Fletcher, P. J., Roder, J.C., Osborne, L.R., Reduced fear and aggression and altered serotonin metabolism in Gtf2irdl -tagged mice. Genes Brain Behav. 7, 224- 234 (2008).
36. Li, H.H., Roy, M., Kuscuoglu, U., Spencer, CM., Halm, B., Harrison, K.C., Bayle, J.H., Splendore, A., Ding, F., Meltzer, L.A., Wright, E., Paylor, R., Deisseroth, K., Francke, U., Induced chromosome deletions cause hypersociability and other features of Williams- Beuren syndrome in mice. Mol. Med. 1, 50-65 (2009).
37. Doyle, T.F., Bellugi, U., Korenberg, J.R., Graham, J., “Everybody in the world is my friend” hypersociability in young children with Williams syndrome. Am. J. Med. Genet. A 124, 263-273 (2004).
38. Edelmann, L., Prosnitz, A., Pardo, S., Bhatt, J., Cohen, N., Lauriat, T., Ouchanov, L., Gonzalez, P.J., Manghi, E.R., Bondy, P., Esquivel, M., Monge, S., Delgado, M.F., Splendore, A., Francke, U., Burton, B.K, Mclnnes, L.A., An atypical deletion of the Williams-Beuren syndrome interval implicates genes associated with defective visuospatial processing and autism. J. Med. Genet. 44, 136-143 (2007).
39. McLaren, W., Pritchard, B., Rios, D., Chen, Y., Flicek, P., Cunningham, F., Deriving the consequences of genomic variants with the Ensembl API and SNP Effect Predictor. Bioinformatics 26, 2069-2070 (2010).
40. Hubbard, T., Barker, D., Bimey, E., Cameron, G, Chen, Y., Clark, L., Cox, T., Cuff, J., Curwen, V., Down, T., Durbin, R., Eyras, E., Gilbert, J., M Hammond, Huminiecki, L., Kasprzyk, A., Lehvaslaiho, H.,
Lijnzaad, P., Melsopp, C, Mongin, E., Pettett, R., Pocock, M., Potter, S., Rust, A., Schmidt, E., Searle, S., Slater, G, Smith, J., Spooner, W., Stabenau, A., Stalker, J., Stupka, E., Ureta-Vidal, A., Vastrik, I., Clamp, M., The Ensembl genome database project. Nucleic Acids Res. 30, 38-41 (2002).
41. American Kennel Club, The New Complete Dog Book: Official Breed Standards and All- New Profiles for 200 Breeds (21st Edition). Irvine, CA: Lumina Media (2014).
42. Bayes, M., Magano, L. F., Rivera, N., Flores, R., Perez Jurado, L. A., Mutational mechanisms of Williams-Beuren syndrome deletions. Am. J. Hum. Genet. 73, 131-151 (2003).
43. Reymond, A., Henrichsen, C.N., Harewood, L., Merla, G., Side effects of genome structural changes. Curr. Opin. Genet. Dev. 17, 381- 386 (2007).
44. Merla, G., Micale, L., Fusco, C, Loviglio, M. N., Molecular Genetics of Williams- Beuren Syndrome. In: eLS. John Wiley & Sons, Ltd: Chichester (2012).
45. Bayarsaihan, D., Ruddle, F.H., Isolation and characterization of BEN, a member of the TFII-I family of DNA-binding proteins containing distinct helix-loop-helix domains. Proc. Natl. Acad. Sci. USA 97(13), 7342-7347 (2000).
46. Tipney, H.J., Hinsley, T.A., Brass, A., Metcalfe, K., Donnai, D., Tassabehji, M., Isolation and characterization of GTF2IRD2, a novel fusion gene and member of the TFII-I family of transcription factors, deleted in William-Beuren syndrome. Eur. J. Hum. Genet. 12, 551-560 (2004).
47. Tassabehji, M., Hammond, P., Karmiloff-Smith, A., Thompson, P., Thorgeirsson, S.S., Durkin, M.E., Popescu, N.C., Hutton, T., Metcalfe, K., Rucka, A., Stewart, H., Read, A.P., Maconochie, M., Donnai, D., GTF2IRD1 in craniofacial development of humans and mice. Science 310(5751), 1184-1187 (2005).
48. Chimge, N.O., Makeyev, A.V., Ruddle, F.H., Bayarsaihan, D., Identification of the TFII-I family target genes in the vertebrate genome. Proc. Natl. Acad. Sci. USA 105(26), 9006- 9010 (2008).
49. Porter, M.A., Dobson-Stone, C, Kwok, J.B., Schofield, P.R, Beckett, W., Tassabehji, M., A role for transcription factor GTF2IRD2 in executive function in Williams-Beuren Syndrome. PLoS One 7(10), e47457 (2012).
50. Sakurai, T., Dorr, N.P., Takahash., N., Mclnnes, L.A., Elder, G.A., Buxbaum, J.D., Haploinsufficiency of Gtf2i, a gene deleted in Williams Syndrome, leads to increases in social interactions. Autism Res. 4, 28- 39 (2011).
51. Procyshyn, T.L., Spence, J., Read, S., Watson, N.V., Crespi, B.J., The Williams syndrome prosociality gene GTF2I mediates oxytocin reactivity and social anxiety in a healthy population. Biol. Letters 13(4), http://dx.doi.Org/l 0.1098/rsbl.2017.0051 (2017).
52. Merla, G., Howald, C, Henrichsen, C.N., Lyle, R, Wyss, C, Zabot, M.T., Antonarakis, S.E., Reymond, A., Submicroscopic deletion in patients with Williams-Beuren syndrome influences expression levels of the nonhemizygous flanking genes. Am. J. Hum. Genet. 79(2), 332-341 (2006).
53. Li, H.H., Roy, M., Kuscuoglu, U., Spencer, CM., Halm, B., Harrison, K.C., Joseph H Bayle, Alessandra Splendore, Feng Ding, Leslie A Meltzer, Elena Wright, Richard Paylor, Karl Deisseroth, and Uta Francke. Induced chromosome deletions cause hypersociability and other features of Williams-Beuren syndrome in mice. Embo Mol. Med. 1(1), 50-65 (2009).
54. Lau, K.S., Khan, S., Dennis, J.W., Genome-scale identification of UDP-GlcNAc- dependent pathways. Proteomics 8(16), 3294- 3302 (2008).
55. Axelsson, E., Ratnakumar, A., Arendt, M.-L., Maqbool, K, Webster, M.T., Perloski, M., Liberg, O., Arnemo, J.M., Hedhammar, A.,
Lindblad-Toh, K., The genomic signature of dog domestication reveals adaptation to a starch-rich diet. Nature 495(7441), 360-364 (2013).
56. Cowley, M., Oakey, R. J., Transposable elements re- wire and fine-tune the transcriptome. PLOS Genet. 9(1), el003234 (2013).
57. Wang, W., Kirkness, E.F., Short interspersed elements (SINEs) are a major source of canine genomic diversity. Genome Res. 15, 1798-1808 (2005).
58. Janowitz Koch, I., Clark, M.M., Thompson, M.J., Deere-Machemer, K.A., Wang, I, Duarte, L., Gnanadesikan, G.E., McCoy, E.L., Rubbi, L., Stahler, D R., Pellegrini, M., Ostrander, E.A., Wayne, R.K., Sinsheimer, J.S, vonHoldt, B.M., The concerted impact of domestication and transposon insertions on methylation patterns between dogs and grey wolves. Mol. Ecol. 25(8), 1838-1855 (2016)
59. Lin, L., Faraco, J., Li, R. Kadotani, H., Rogers, W., Lin, X., Qiu, X., de Jong, P. J., Nishino, S., Mignot, E., The sleep disorder canine narcolepsy is caused by a mutation in the hypocretin (orexin) receptor 2 gene. Cell 98, 365-376 (1999).
60. Pele, M., Tiret, L., Kessler, J.L., Blot, S., Panthier, J.J., SINE exonic insertion in the PTPLA gene leads to multiple splicing defects and segregates with the autosomal recessive centronuclear myopathy in dogs. Hum. Mol. Genet. 14, 1417-1427 (2005).
61. Clark, L.A., Wahl, J.M., Rees, C.A., Murphy, K.E., Retrotransposon insertion in SILV is responsible for merle patterning of the domestic dog. Proc. Natl. Acad. Sci. USA 103, 1376-1381 (2006).
62. Sutter, N.B., Bustamante, CD., Chase, K., Gray, M.M., Zhao, K., Zhu, L., Padhukasahasram, B., Karlins, E., Davis, S., Jones, P. G, Quignon, P., Johnson, G.S., Parker, H.G, Fretwell, N., Mosher, D.S., Lawler, D.F., Satyaraj, E., Nordborg, M., Lark, K.G., Wayne, R.K., Ostrander, E.A., A single IGFl allele is a major determinant of small size in dogs. Science 316(5821), 112-115 (2007).
63. Parker, H.G, vonHoldt, B.M., Quignon, P., Margulies, E.H., Shao, S., Mosher, D.S., Spady, T.C., Elkahloun, A., Cargill, M., Jones, P.G, Maslen, C.L. Acland, G.M., Sutter, N.B., Kuroki, K., Bustamante, CD., Wayne, R.K., Ostrander, E.A., An expressed fgf4 retrogene is associated with breed-defining chondrodysplasia in domestic dogs. Science 325(5943), 995-998 (2009).
64. Gray, M.M. Sutter, N.B., Ostrander, E.A., Wayne, R.K., The IGFl small dog haplotype is derived from Middle Eastern grey wolves. BMC Biology 8, 16 (2010).
65. Karlsson, E.K., Lindblad-Toh, K., Leader of the pack: gene mapping in dogs and other model organisms. Nat. Rev. Genet. 9, 713-725 (2008).
66. Boyko, A.R., The domestic dog: man's best friend in the genomic era. Genome Biology 12, 216 (2011).
67. Anderson, T.M., vonHoldt, B.M., Candille, S.I., Musiani, M., Greco, C, Stahler, D.R., Smith, D.W., Padhukasahasram, B., Randi, E., Leonard, J.A., Bustamante, CD., Ostrander, E.A., Tang, H., Wayne, R.K., Barsh, G.S., Molecular and evolutionary history of melanism in North American gray wolves. Science 323(5919), 1339-1343 (2009).
68. Frank, H., Frank, M. G., On the effects of domestication on canine social development and behavior. Appl. Anim. Ethol. 8, 507-525 (1982).
69. Udell, M.A.R., Dorey, N.R., Wynne, C.D.L., The performance of stray dogs (Canis familiaris) living in a shelter on human-guided object-choice tasks. Anim. Behav. 79, 717- 725 (2010).
70. Klinghammer, E., Goodman, P., Socialization and management of wolves in captivity. In H. Frank (Ed.), Man and Wolf: Advances, Issues, and Problems in Captive Wolf Research. Springer (1987).
71. Udell, M.A., Dorey, N.R., Wynne, CD., Wolves outperform dogs in following human social cues. Anim. Behav. 76, 1767-1773 (2008).
72. McHugh, M.L., Interrater reliability: the kappa statistic. Biochem. medica 22, 276-282 (2012).
73. Udell, M.A.R., Dorey, N.R., Wynne, C.D.L., Wolves outperform dogs in following human social cues. Anim. Behav. 76, 1767-1773 (2008).
74. Raiche, G., nFactors: An R package for parallel analysis and non graphical solutions to the Cattell scree test. R package version 2 (2010).
75. Aschard, H., Vilhjalmsson, B.J., Greliche, N., Morange, P.E., Tregouet, D.A., Maximizing the power of principal-component analysis of correlated phenotypes in genome-wide association studies. Am. J. Hum. Genet. 94, 662-676 (2014).
76. Cunningham, F., Amode, M.R., Barrell, D., Beal, K., Billis, K., Brent, S., Carvalho-Silva, D., Clapham, P., Coates, G., Fitzgerald, S., Gil, L., C. Giron, Garci., Gordon, L., Hourlier, T., Hunt, S.E., Janacek, S.H., Johnson, N., Juettemann, T., Kahari, A.K., Keenan, S., Martin, F.J., Maurel, T., McLaren, W., Murphy, D.N., Nag, R, Overduin, B., Parker, A., Patricio, M., Perry, E., Pignatelli, M., Riat, H.S., Sheppard, D., Taylor, K., Thormann, A., Vullo, A., Wilder, S.P., Zadissa, A., Aken, B.L., Birney, E., Harrow, J., Kinsella, R., Muffato, M., Ruffier, M., Searle, S.M.J., Spudich, G, Trevanion, S.J., Yates, A., Zerbino, D R., Flicek, P., Ensembl 2015. Nucleic Acids Res. 43, D662-D669 (2015).
77. Martin, M., Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet Journal 17, pp. 10-12 (2011).
78. Li, H., Durbin, R., Fast and accurate short read alignment with Burrows-Wheeler Transform. Bioinformatics 25,1754-1760 (2009).
79. Li, H., Handsaker, B., Wysoker, A., Fennell, T., Ruan, J., Homer, N., Marth, G, Abecasis, G, Durbin, R., 1000 Geome Project Data Processing Subgroup, The sequence alignment/map format and SAMtools. Bioinformatics 25, 2078-2079 (2009).
80. Korneliussen, T.S., Albrechtsen, A., Nielsen, R., ANGSD: analysis of next generation sequencing data. BMC Bioinformatics 15, 356 (2014).
81. Delaneau, O., Marchini, J., Zagury, J.-F., A linear complexity phasing method for thousands of genomes. Nat. Methods 9, 179- 181 (2012).
82. Sabeti, P.C., Varilly, P., Fry, B., Lohmueller, J., Hostetter, E., Cotsapas, C, Xie, X., Byrne, E.H., McCarroll, S.A., Gaudet, R., Schaffner, S.F., Lander, E.S., The International HapMap Consortium, Genome- wide detection and characterization of positive selection in human populations. Nature 449, 913-918 (2007).
83. Chen, K., Wallis, J.W., McLellan, M.D., Larson, D.E., Kalicki, J.., Pohl, C.S., McGrath, S.D., Wendl, M.C., Zhang, Q., Locke, D.P., Shi, X., Fulton, R.S., Ley, T.J., Wilson, R.K., Ding, L., Mardis, E.R., BreakDancer: an algorithm for high-resolution mapping of genomic structural variation. Nat. Methods 6, 677-681 (2009).
84. Ye, K., Schulz, M.H., Long, Q., Apweiler, R., Ning, Z., Pindel: a partem growth approach to detect break points of large deletions and medium sized insertions from paired-end short reads. Bioinformatics 25, 2865- 2871 (2009).
85. Wong, K., Keane, T.M., Stalker, J., Adams, D.J., Enhanced structural variant and breakpoint detection using SVMerge by integration of multiple detection methods and local assembly. Genome Biol. 11, R128 (2010).
86. Hart, S.N., Sarangi, V., Moore, R., Baheti, S., Bhavsar, J.D., SoftSearch: integration of multiple sequence features to identify breakpoints of structural variations. PLoS One 8, e83356 (2013).
87. Tattini, L., D'Aurizio, R., Magi, A., Detection of genomic structural variants from next- generation sequencing data. Frontiers Bioeng. Biotechnol. 3 (2015).
88. Qi, J., Zhao, F., inGAP-sv: a novel scheme to identify and visualize structural variation from paired end mapping data. Nucleic Acids Res. 39, W567-W575 (2011).
89. Hollox, E.J., “The challenges of studying complex and dynamic regions of the human genome” in Genomic Structural Variants (Spring, New York), pp. 187-207 (2012).
90. Quinlan, A.R., Hall I.M., Characterizing complex structural variation in germline and somatic genomes. Trends Genet. 28, 43-53 (2012).
91. Kent, W.J., Sugnet, C.W., Furey, T.S., Roskin, K.M., Pringle, T.H., Zahler, A.M., Haussler, D., The human genome browser at UCSC. Genome Res. 12, 996-1006 (2002).
92. Decker B., Davis, B.W., Rimbault, M., Long, A.H., Karlins, E., Jagannathan, V., Reiman, R., Parker, H.G., Drogmueller, C, Corneveaux, J.J., Chapman, E.S., Trent, J.M., Leeb, T., Huentelman, M.J., Wayne, R.K., Karyali, D.M., Ostrander, E.A., Comparison against 186 canid whole-genome sequences reveals survival strategies of an ancient clonally transmissible canine tumor. Genome Res. 25, 1646-1655 (2015).
93. Zhou, X., Stephens, M., Genome-wide efficient mixed- model analysis for association studies. Nat. Genet. 44, 821-824 (2012).
94. Stich, B., Mohring, J., Piepho, H.-P., Heckenberger, M., Buckler, E.D., Melchinger, A.E., Comparison of mixed-model approaches for association mapping. Genetics 178, 1745- 1754 (2008).
95. Mandel, J.R., Nambeesan, S., Bowers, J.E., Marek, L.F., Ebert, D., Rieseberg, L.H., Knapp, S.J., Burke, J., Association mapping and the genomic consequences of selection in sunflower. PLoS Genet. 9, el003378 (2013).
96. Tabangin, M.E., Woo, J.G., Martin, L.J., The effect of minor allele frequency on the likelihood of obtaining false positives. BMC Proceedings 3, S41 (2009).
97. Gao, X., Starmer, J., Martin, E.R., A multiple testing correction method for genetic association studies using correlated single nucleotide polymorphisms. Genet. Epidemiol. 32, 361-369 (2008).
98. Purcell, S., Neale, B., Todd-Brown, K, Thomas, L., Ferreira, M.A., Bender, D., Mailer, J., Sklar, P., P.I. Bakker, d., Daly, M.J., Sham, P.C., PLINK: a tool set for whole-genome association and population- based linkage analyses. Am. J. Hum. Genet. 81, 559-575 (2007).
99. Untergasser, A., Cutcutache, I., Koressaar, T., Ye, J., Faircloth, B.C., Remm, M., Rozen, S.G, Primer3 - New capabilities and interfaces. Nucleic Acids Res. 40(15), el l5 (2012).
100. Zou, Q., Wang, X, Liu, Y., Ouyang, Z., Long, H., Wei, S., Xin, J., Zhao, B., Lai, S., Shen, J., Ni, Q., Yang, H., Zhong, H., Li, L., Hu, M., Zhang, Q., Zhou, Z., He, J., Yan, Q., Fan, N., Zhao, Y., Liu, Z., Guo, L., Huang, J., Zhang, G, Ying, J., Lai, L., Gao, X., Generation of gene-target dogs using CRISPR/Cas9 system. J. Mol. Cell. Biol. 7(6), 580- 583 (2015).
101. Abraham, G, Inouye, M., Fast principal component analysis of large-scale genome- wide data. PLoS One 9, e93766 (2014).
102. Zhang, B., Kirov, S.A., Snoddy, J.R., WebGestalt: an integrated system for exploring gene sets in various biolgoical contexts. Nucleic Acids Res. 33 (Web Server Issue), W741-748 (2005).
103. Wang, J., Duncan, D., Shi, Z., Zhang, B., WEB-based GEne SeT AnaLysis Toolkit (WebGestalt): update 2013. Nucleic Acids Res. 41 (Web Server Issue), W77-83 (2013).
104. Benjamini, Y., Hochberg, Y., Controlling the false discovery rate: a practical and powerful approach to multiple testing. J. R. Stat. Soc. Ser. B Met. 57, 289-300 (1995).
105. Fusco, C, Micale, L., Augello, B., Pellico, T., Menghini, D., Alferi, P., Digilio, M.C., Mandriani, B., Carella, M., Palumbo, O., Vicari, S., Merla, G., Smaller and larger deletions of the Williams Beuren syndrome region implicate genes involved in mild facial phenotype, epilepsy and autistic traits. Eur. J. Hum. Genet. 22, 64-70 (2014).

Claims (38)

REIVINDICAÇÕES
1. Método para prever a probabilidade de uma exibição canina de um comportamento sociável caracterizado pelo fato de que compreende: (a) genotipar uma amostra biológica de um canino; (b) contar o número de variantes estruturais dentro do lócus da síndrome de Williams-Beuren (WBS) no cromossomo 6 canino; e (c) prever a probabilidade da exibição canina de um comportamento sociável com base no número de variantes estruturais.
2. Método de classificação de cães ou lobos de acordo com seu nível de probabilidade de exibição de um comportamento sociável caracterizado pelo fato de que compreende: (a) obter uma amostra biológica de um primeiro cão ou lobo; (b) determinar o número de variantes estruturais dentro do lócus da síndrome de Williams-Beuren (WBS) no cromossomo 6 do primeiro cão ou lobo; (c) obter uma amostra biológica de um segundo cão ou lobo; (d) determinar o número de variantes estruturais lócus da síndrome de Williams-Beuren (WBS) no cromossomo 6 do segundo cão ou lobo; e (e) classificar o primeiro cão como sendo mais provável de exibir um comportamento sociável do que o segundo cão, se o número de variantes estruturais determinado na etapa (b) for maior que o número de variantes estruturais determinado na etapa (d); ou (f) classificar o segundo cão como sendo mais provável de exibir um comportamento sociável do que o primeiro cão, se o número de variantes estruturais determinado na etapa (d) for maior que o número de variantes estruturais determinado na etapa (b).
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a amostra biológica é sangue, saliva, líquido cefalorraquidiano, pele ou urina.
4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a genotipagem da amostra biológica inclui amplificação por PCR e eletroforese em gel de agarose.
5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a genotipagem da amostra biológica utiliza pelo menos um iniciador selecionado a partir do grupo que consiste em: CCCCTTCAGCCAGCATATAA (SEQ ID NO: 1), TTCTCTGGGCTGTCTGGACT (SEQ ID NO: 2), AAGTTTCTCTGATGGAAAACACA (SEQ ID NO: 3), GGTGGCTGGAAATTTCAGTAG (SEQ ID NO: 4), TGGAGCCATGATTAGGAAGG (SEQ ID NO: 5), TAAGGAAGGACCCCATTTCC (SEQ ID NO: 6), TGCTGCTTCATGTTCTGTGA (SEQ ID NO: 7), TGGTGCATTAGCTTTGGTTG (SEQ ID NO: 8), AACCACAGGAACAAAACCTCA (SEQ ID NO: 9), e CCTCCTGTTGGACATTTGGA (SEQ ID NO: 10).
6. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que as variantes estruturais são elementos transponíveis que interrompem um gene no lócus da WBS.
7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que os elementos transponíveis são retrotransposons.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que os retrotransposons são elementos nucleares intercalados curtos (SINEs) ou elementos nucleares intercalados longos (LINEs).
9. Método, de acordo com a reivindicação 1 ou 2,
caracterizado pelo fato de que pelo menos uma variante estrutural ocorre dentro de pelo menos um gene selecionado a partir do grupo que consiste em GTF2I, GTF2IRD1 e WBSCR17.
10. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que o comportamento social é selecionado a partir do grupo que consiste em viés atencional a estímulos sociais (ABS), hipersociabilidade (HYP) e interesse social em estranhos (SIS).
11. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que pelo menos uma variante estrutural é encontrada em Cfa6.6, Cfa6.7, Cfa6.66 ou Cfa6.83.
12. Método de triagem de uma biblioteca de cão ou lobo caracterizado pelo fato de que compreende: (a) obter uma biblioteca genômica de um cão ou lobo que contém o lócus da síndrome de Williams-Beuren (WBS) no cromossomo 6 canino; (b) determinar o número de variantes estruturais no lócus da WBS.
13. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que os locais das variantes estruturais também são determinados.
14. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a etapa (b) compreende determinar o número de variantes estruturais em pelo menos um de GTF2I, GTF2IRD1 e WBSCR17.
15. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a etapa (b) compreende determinar o número de variantes estruturais em todos de GTF2I, GTF2IRD1 e WBSCR17.
16. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a etapa (b) compreende o uso da reação em cadeia da polimerase (PCR) para amplificar pelo menos um fragmento de DNA do lócus da WBS.
17. Método, de acordo com a reivindicação 16, caracterizado pelo fato de que o fragmento de DNA compreende pelo menos um dos loci Cfa6.6, Cfa6.7, Cfa6.66 ou Cfa6.83.
18. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a etapa (b) compreende o uso de PCR para amplificar o lócus Cfa6.6 usando os iniciadores CCCCTTCAGCCAGCATATAA (SEQ ID NO: 1) (direto) e TTCTCTGGGCTGTCTGGACT (SEQ ID NO: 2) (reverso).
19. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a etapa (b) compreende o uso de PCR para amplificar o lócus Cfa6.6 usando os iniciadores AAGTTTCTCTGATGGAAAACACA (SEQ ID NO: 3) (direto) e GGTGGCTGGAAATTTCAGTAG (SEQ ID NO: 4) (reverso).
20. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a etapa (b) compreende o uso de PCR para amplificar o lócus Cfa6.7 usando os iniciadores TGGAGCCATGATTAGGAAGG (SEQ ID NO: 5) (direto) e TAAGGAAGGACCCCATTTCC (SEQ ID NO: 6) (reverso).
21. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a etapa (b) compreende o uso de PCR para amplificar o lócus Cfa6.66 usando os iniciadores TGCTGCTTCATGTTCTGTGA (SEQ ID NO: 7) (direto) e TGGTGCATTAGCTTTGGTTG (SEQ ID NO: 8) (reverso).
22. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a etapa (b) compreende o uso de PCR para amplificar o lócus Cfa6.83 usando os iniciadores AACCACAGGAACAAAACCTCA (SEQ ID NO: 9) (direto) e CCTCCTGTTGGACATTTGGA (SEQ ID NO: 10) (reverso).
23. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a etapa (b) compreende o uso de eletroforese em gel de agarose para identificar fragmentos de DNA do lócus da WBS que têm mobilidade alterada em comparação com os fragmentos correspondentes do genoma de referência canino e que são indicativos de variantes estruturais no lócus da WBS da biblioteca.
24. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a etapa (b) compreende uma etapa de hibridização que usa pelo menos uma sonda do lócus da WBS que identifica variantes estruturais no lócus da WBS. Em algumas modalidades, a etapa de hibridização compreende hibridização in situ por fluorescência (FISH).
25. Método de produção de cães que têm maior probabilidade de exibir um comportamento sociável caracterizado pelo fato de que compreende: (a) selecionar um cão macho e fêmea para reprodução que sejam conhecidos, cada um, por ter pelo menos uma variante estrutural em Cfa6.6, Cfa6.7, Cfa6.66 ou Cfa6.83 no lócus da síndrome de Williams-Beuren (WBS); e (b) acasalar os cães da etapa (a) para produzir descendentes.
26. Método, de acordo com a reivindicação 25, caracterizado pelo fato de que os cães macho e fêmea são genotipados para a presença de variantes estruturais no lócus da síndrome de Williams-Beuren (WBS).
27. Método, de acordo com a reivindicação 25, caracterizado pelo fato de que a pelo menos uma variante estrutural ocorre em pelo menos um gene selecionado a partir do grupo que consiste em GTF2I, GTF2IRD1 e WBSCR17.
28. Método de edição do genoma de um cão caracterizado pelo fato de que compreende: (a) obter um cão; (b) usar repetições palindrômicas curtas,
regularmente espaçadas e agrupadas (CRISPRs)/associadas a CRISPR (Cas) 9, para desativar um gene no lócus da síndrome de Williams-Beuren (WBS) no cromossomo 6 canino.
29. Método, de acordo com a reivindicação 28, caracterizado pelo fato de que o gene é GTF2I, GTF2IRD1 ou WBSCR17.
30. Kit para detectar a presença de variantes estruturais no lócus da síndrome de Williams-Beuren (WBS) de caninos caracterizado pelo fato de que compreende um ou mais iniciadores selecionados a partir do grupo que consiste em: CCCCTTCAGCCAGCATATAA (SEQ ID NO: 1), TTCTCTGGGCTGTCTGGACT (SEQ ID NO: 2), AAGTTTCTCTGATGGAAAACACA (SEQ ID NO: 3), GGTGGCTGGAAATTTCAGTAG (SEQ ID NO: 4), TGGAGCCATGATTAGGAAGG (SEQ ID NO: 5), TAAGGAAGGACCCCATTTCC (SEQ ID NO: 6), TGCTGCTTCATGTTCTGTGA (SEQ ID NO: 7), TGGTGCATTAGCTTTGGTTG (SEQ ID NO: 8), AACCACAGGAACAAAACCTCA (SEQ ID NO: 9), e CCTCCTGTTGGACATTTGGA (SEQ ID NO: 10).
31. Kit, de acordo com a reivindicação 30, caracterizado pelo fato de que compreende os iniciadores CCCCTTCAGCCAGCATATAA (SEQ ID NO: 1) e TTCTCTGGGCTGTCTGGACT (SEQ ID NO: 2).
32. Kit, de acordo com a reivindicação 30, caracterizado pelo fato de que compreende os iniciadores AAGTTTCTCTGATGGAAAACACA (SEQ ID NO: 3) e GGTGGCTGGAAATTTCAGTAG (SEQ ID NO: 4).
33. Kit, de acordo com a reivindicação 30, caracterizado pelo fato de que compreende os iniciadores TGGAGC C ATGATT AGGAAGG (SEQ ID NO: 5) e TAAGGAAGGACCCCATTTCC (SEQ ID NO: 6).
34. Kit, de acordo com a reivindicação 30, caracterizado pelo fato de que compreende os iniciadores TGCTGCTTCATGTTCTGTGA
(SEQ ID NO: 7) e TGGTGCATTAGCTTTGGTTG (SEQ ID NO: 8).
35. Kit, de acordo com a reivindicação 30, caracterizado pelo fato de que compreende os iniciadores AACCACAGGAACAAAACCTCA (SEQ ID NO: 9) e CCTCCTGTTGGACATTTGGA (SEQ ID NO: 10).
36. Kit, de acordo com qualquer uma das reivindicações 30 a 35, caracterizado pelo fato de que compreende instruções para uso.
37. Kit, de acordo com qualquer uma das reivindicações 30 a 35, caracterizado pelo fato de que os iniciadores são etiquetados usando um marcador detectável.
38. Kit, de acordo com qualquer uma das reivindicações 30 a 35, caracterizado pelo fato de que compreende pelo menos um dentre um tampão, dNTPs, uma DNA polimerase, uma DNA ligase ou uma enzima de restrição.
BR112019028294-7A 2017-06-30 2018-06-29 variantes genéticas associadas a comportamento hipersocial direcionado a humanos em cães domésticos BR112019028294A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762527653P 2017-06-30 2017-06-30
US62/527.653 2017-06-30
PCT/US2018/040344 WO2019006337A2 (en) 2017-06-30 2018-06-29 GENETIC VARIANTS ASSOCIATED WITH HYPER-SOCIAL BEHAVIOR DIRECTED TO HUMAN BEING IN DOMESTIC DOGS

Publications (1)

Publication Number Publication Date
BR112019028294A2 true BR112019028294A2 (pt) 2020-09-01

Family

ID=64741882

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112019028294-7A BR112019028294A2 (pt) 2017-06-30 2018-06-29 variantes genéticas associadas a comportamento hipersocial direcionado a humanos em cães domésticos

Country Status (6)

Country Link
US (1) US20200131573A1 (pt)
EP (1) EP3645748A4 (pt)
AU (1) AU2018291368A1 (pt)
BR (1) BR112019028294A2 (pt)
CA (1) CA3068312A1 (pt)
WO (1) WO2019006337A2 (pt)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210047699A1 (en) * 2019-08-16 2021-02-18 The Trustees Of Princeton University Early genetic screening to aid in the selection of dogs for assistance training programs
CN113667763B (zh) * 2020-09-02 2022-08-02 北京中科昆朋生物技术有限公司 鉴别具有衔取行为犬的生物标记物、试剂盒和方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2305812A3 (en) * 2002-11-14 2012-06-06 Dharmacon, Inc. Fuctional and hyperfunctional sirna
US7250289B2 (en) * 2002-11-20 2007-07-31 Affymetrix, Inc. Methods of genetic analysis of mouse

Also Published As

Publication number Publication date
AU2018291368A1 (en) 2020-02-13
WO2019006337A3 (en) 2019-03-14
EP3645748A4 (en) 2021-03-17
CA3068312A1 (en) 2019-01-03
WO2019006337A2 (en) 2019-01-03
US20200131573A1 (en) 2020-04-30
EP3645748A2 (en) 2020-05-06

Similar Documents

Publication Publication Date Title
VonHoldt et al. Structural variants in genes associated with human Williams-Beuren syndrome underlie stereotypical hypersociability in domestic dogs
Werling et al. An analytical framework for whole-genome sequence association studies and its implications for autism spectrum disorder
Holm et al. A rare variant in MYH6 is associated with high risk of sick sinus syndrome
Good et al. A complex genetic basis to X-linked hybrid male sterility between two species of house mice
Fritz et al. Detection of haplotypes associated with prenatal death in dairy cattle and identification of deleterious mutations in GART, SHBG and SLC37A2
Janowitz Koch et al. The concerted impact of domestication and transposon insertions on methylation patterns between dogs and grey wolves
Heyne et al. Genetic influences on brain gene expression in rats selected for tameness and aggression
Philipp et al. Multiple loci are associated with dilated cardiomyopathy in Irish wolfhounds
Kukekova et al. Sequence comparison of prefrontal cortical brain transcriptome from a tame and an aggressive silver fox (Vulpes vulpes)
Gandolfi et al. First WNK4-hypokalemia animal model identified by genome-wide association in Burmese cats
Gore-Panter et al. Atrial Fibrillation associated chromosome 4q25 variants are not associated with PITX2c expression in human adult left atrial appendages
Hersh et al. SOX5 is a candidate gene for chronic obstructive pulmonary disease susceptibility and is necessary for lung development
Esparza-Gordillo et al. Maternal filaggrin mutations increase the risk of atopic dermatitis in children: an effect independent of mutation inheritance
Yan et al. Genome-wide characterization of insertion and deletion variation in chicken using next generation sequencing
Morgenthaler et al. A missense variant in the coil1A domain of the keratin 25 gene is associated with the dominant curly hair coat trait (Crd) in horse
Huang et al. Genome-wide association study on chicken carcass traits using sequence data imputed from SNP array
Li et al. The first sheep graph-based pan-genome reveals the spectrum of structural variations and their effects on tail phenotypes
BR112019028294A2 (pt) variantes genéticas associadas a comportamento hipersocial direcionado a humanos em cães domésticos
Andrade et al. Molecular parallelisms between pigmentation in the avian iris and the integument of ectothermic vertebrates
Im et al. A population-specific low-frequency variant of SLC22A12 (p. W258*) explains nearby genome-wide association signals for serum uric acid concentrations among Koreans
US20240182982A1 (en) Fragmentomics in urine and plasma
US11473146B2 (en) Genetic testing for inherited peripheral neuropathy
Hogan et al. Structural variants in genes associated with human Williams-Beuren syndrome underlie stereotypical hypersociability in domestic dogs
Dong Genomic Analysis of Rare Human Diseases
US10724098B2 (en) Method to predict likelihood of inherited peripheral neuropathy in mammals

Legal Events

Date Code Title Description
B11A Dismissal acc. art.33 of ipl - examination not requested within 36 months of filing
B350 Update of information on the portal [chapter 15.35 patent gazette]
B11Y Definitive dismissal - extension of time limit for request of examination expired [chapter 11.1.1 patent gazette]