RU2012103024A - Применение способов машинного обучения для извлечения правил ассоциации в наборах данных растений и животных, содержащих в себе молекулярные генетические маркеры, сопровождаемое классификацией или прогнозированием с использованием признаков, созданных по этим правилам ассоциации - Google Patents

Применение способов машинного обучения для извлечения правил ассоциации в наборах данных растений и животных, содержащих в себе молекулярные генетические маркеры, сопровождаемое классификацией или прогнозированием с использованием признаков, созданных по этим правилам ассоциации Download PDF

Info

Publication number
RU2012103024A
RU2012103024A RU2012103024/08A RU2012103024A RU2012103024A RU 2012103024 A RU2012103024 A RU 2012103024A RU 2012103024/08 A RU2012103024/08 A RU 2012103024/08A RU 2012103024 A RU2012103024 A RU 2012103024A RU 2012103024 A RU2012103024 A RU 2012103024A
Authority
RU
Russia
Prior art keywords
algorithm
features
plant
algorithms
association
Prior art date
Application number
RU2012103024/08A
Other languages
English (en)
Other versions
RU2607999C2 (ru
Inventor
Даниэль КАРАВИЕЛЛО
Ринкал ПАТЕЛ
Ритал ПАЙ
Original Assignee
ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=42685709&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RU2012103024(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи filed Critical ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи
Publication of RU2012103024A publication Critical patent/RU2012103024A/ru
Application granted granted Critical
Publication of RU2607999C2 publication Critical patent/RU2607999C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/04Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Environmental Sciences (AREA)
  • Developmental Biology & Embryology (AREA)
  • Botany (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)

Abstract

1. Способ извлечения набора данных, который содержит, по меньшей мере, один признак, созданный из, по меньшей мере, одного основанного на растении молекулярного генетического маркера, для нахождения, по меньшей мере, одного правила ассоциации и использования одного или более признаков, созданных по этим правилам ассоциации, для классификации или прогнозирования касательно одного или более целевых признаков.2. Способ по п.1, в котором правила ассоциации включают в себя пространственные и временные правила ассоциации, которые определяют самоорганизующимися картами.3. Способ по п.1, в котором набор данных выбирают из группы, состоящей из данных окружающей среды, данных о фенотипе, данных последовательности ДНК, данных микроматрицы, биохимических данных, метаболических данных или их комбинации.4. Способ по п.1, в котором одно или более правил ассоциации, определенных одним или более алгоритмами извлечения правил ассоциации, используют для классификации или прогнозирования с одним или более алгоритмами машинного обучения, выбранными из группы, состоящей из алгоритмов оценки признаков, алгоритмов отбора поднабора признаков, байесовских сетей, алгоритмов, основанных на примерах, машин опорных векторов, алгоритма голосования, чувствительного к стоимости классификатора, алгоритма укладки, правил классификации и деревьев решений.5. Способ по п.4, в котором один или более алгоритмов извлечения правил ассоциации выбирают из группы, состоящей из алгоритма APriori, алгоритма FP-growth, алгоритмов извлечения правил ассоциации, которые могут обрабатывать большое количество признаков, алгоритмов извлечения огромных шаблонов, алго

Claims (57)

1. Способ извлечения набора данных, который содержит, по меньшей мере, один признак, созданный из, по меньшей мере, одного основанного на растении молекулярного генетического маркера, для нахождения, по меньшей мере, одного правила ассоциации и использования одного или более признаков, созданных по этим правилам ассоциации, для классификации или прогнозирования касательно одного или более целевых признаков.
2. Способ по п.1, в котором правила ассоциации включают в себя пространственные и временные правила ассоциации, которые определяют самоорганизующимися картами.
3. Способ по п.1, в котором набор данных выбирают из группы, состоящей из данных окружающей среды, данных о фенотипе, данных последовательности ДНК, данных микроматрицы, биохимических данных, метаболических данных или их комбинации.
4. Способ по п.1, в котором одно или более правил ассоциации, определенных одним или более алгоритмами извлечения правил ассоциации, используют для классификации или прогнозирования с одним или более алгоритмами машинного обучения, выбранными из группы, состоящей из алгоритмов оценки признаков, алгоритмов отбора поднабора признаков, байесовских сетей, алгоритмов, основанных на примерах, машин опорных векторов, алгоритма голосования, чувствительного к стоимости классификатора, алгоритма укладки, правил классификации и деревьев решений.
5. Способ по п.4, в котором один или более алгоритмов извлечения правил ассоциации выбирают из группы, состоящей из алгоритма APriori, алгоритма FP-growth, алгоритмов извлечения правил ассоциации, которые могут обрабатывать большое количество признаков, алгоритмов извлечения огромных шаблонов, алгоритма извлечения прямых различительных шаблонов, деревьев решений, неточных множеств.
6. Способ по п.4, в котором алгоритм извлечения правил ассоциации является алгоритмом самоорганизующейся карты (SOM).
7. Способ по п.5, в котором алгоритмы извлечения правил ассоциации, которые могут обрабатывать большое количество признаков, включают в себя, но не в качестве ограничения, CLOSET+, CHARM, CARPENTER и COBBLER.
8. Способ по п.5, в котором алгоритмы, которые могут находить прямые различительные шаблоны, включают в себя, но не в качестве ограничения, DDPM, HARMONY, RCBT, CAR и PATCLASS.
9. Способ по п.5, в котором алгоритмы, которые могут находить огромные шаблоны, включают в себя, но не в качестве ограничения, алгоритм слияния шаблонов.
10. Способ по п.4, в котором алгоритм оценки признаков, выбранный из группы, состоящей из алгоритма прироста информации, алгоритма Relief, алгоритма ReliefF, алгоритма RReliefF, алгоритма симметричной неопределенности, алгоритма отношений прироста и алгоритма ранжировщика.
11. Способ по п.4, в котором алгоритм отбора поднабора признаков выбирают из группы, состоящей из алгоритма основанного на корреляции отбора признаков (CFS) и алгоритма упаковки в ассоциации с любым другим алгоритмом машинного обучения.
12. Способ по п.4, в котором алгоритм машинного обучения является алгоритмом байесовской сети, включающим в себя наивный алгоритм Байеса.
13. Способ по п.4, в котором основанный на примерах алгоритм выбирают из группы, состоящей из основанного на примерах алгоритма 1 (IB1), основанного на примерах алгоритма k ближайших соседей (IBK), KStar, алгоритма облегченных правил Байеса (LBR) и алгоритма локально взвешенного обучения (LWL).
14. Способ по п.4, в котором алгоритм машинного обучения является алгоритмом машины опорных векторов.
15. Способ по п.14, в котором алгоритм машины опорных векторов является алгоритмом регрессии по методу опорных векторов (SVR).
16. Способ по п.14, в котором алгоритм машины опорных векторов использует алгоритм последовательной минимальной оптимизации (SMO).
17. Способ по п.14, в котором алгоритм машины опорных векторов использует алгоритм последовательной минимальной оптимизации для регрессии (SMOReg).
18. Способ по п.4, в котором дерево решений выбирается из группы, состоящей из алгоритма дерева логистической модели (LMT), алгоритма дерева переменных решений (ADTree), алгоритма M5P и алгоритма REPTree.
19. Способ по п.1, в котором один или более целевых признаков выбирают из группы, состоящей из непрерывного целевого признака и дискретного целевого признака.
20. Способ по п.1, в котором дискретный целевой признак является двоичным целевым признаком.
21. Способ по п.1, в котором, по меньшей мере, один основанный на растениях молекулярный генетический маркер происходит из популяции растений.
22. Способ по п.21, в котором популяция растений является структурированной или неструктурированной популяцией растений.
23. Способ по п.21, в котором популяция растений содержит инбредные растения.
24. Способ по п.21, в котором популяция растений содержит гибридные растения.
25. Способ по п.21, в котором популяцию растений выбирают из группы, состоящей из кукурузы, сои, сахарного тростника, сорго, пшеницы, подсолнечника, риса, канола, хлопка и просо.
26. Способ по п.21, в котором популяция растений содержит от приблизительно 2 до приблизительно 1000000 членов.
27. Способ по п.1, в котором количество молекулярных генетических маркеров находится в диапазоне от приблизительно 1 до приблизительно 1000000 маркеров.
28. Способ по п.1, в котором признаки содержат один или более из простой повторяющейся последовательности (SSR), расщепленных амплифицированных полиморфных последовательностей (CAPS), полиморфизма длин простой последовательности (SSLP), полиморфизма длин рестрикционных фрагментов (RFLP), маркера произвольной амплифицированной полиморфной ДНК (RAPD), полиморфизма одиночных нуклеотидов (SNP), полиморфизма длины произвольного фрагмента (AFLP), вставки, удаления или любого другого типа молекулярного генетического маркера, выведенного из ДНК, РНК, белка или метаболита, гаплотипа, созданного из двух или более из описанных выше молекулярных генетических маркеров, выведенных из ДНК, и их комбинации.
29. Способ по п.1, в котором признаки содержат один или более из простой повторяющейся последовательности (SSR), расщепленных амплифицированных полиморфных последовательностей (CAPS), полиморфизма длин простой последовательности (SSLP), полиморфизма длин рестрикционных фрагментов (RFLP), маркера произвольно амплифицированной полиморфной ДНК (RAPD), полиморфизма одиночных нуклеотидов (SNP), полиморфизма длины произвольного фрагмента (AFLP), вставки, удаления или любого другого типа молекулярного генетического маркера, выведенного из ДНК, РНК, белка или метаболита, гаплотипа, созданного из двух или более из описанных выше молекулярных генетических маркеров, выведенных из ДНК, их комбинацию в соединении с одним или более измерений фенотипа, данных микроматрицы, аналитических измерений, биохимических измерений или относящихся к окружающей среде измерений в качестве признаков.
30. Способ по п.1, в котором один или более целевых признаков являются численно представимыми особенностями фенотипа, включающими в себя устойчивость к болезням, урожайность, зерновой выход, прочность пряжи, белковый состав, содержание белка, устойчивость к насекомым, влагосодержание зерна, содержание масла в зерне, качество зерновых масел, засухоустойчивость, устойчивость к корневому полеганию, высота растения, высота колоса, содержание белка в зерне, содержание аминокислот в зерне, цвет зерна и устойчивость к стеблевому полеганию.
31. Способ по п.1, в котором один или более целевых признаков являются численно представимыми особенностями фенотипа, включающими в себя устойчивость к болезням, урожайность, зерновой выход, прочность пряжи, белковый состав, содержание белка, устойчивость к насекомым, влагосодержание зерна, содержание масла в зерне, качество зерновых масел, засухоустойчивость, устойчивость к корневому полеганию, высота растения, высота колоса, содержание белка в зерне, содержание аминокислот в зерне, цвет зерна и устойчивость к стеблевому полеганию, установленные с использованием статистических способов, способов машинного обучения или любой их комбинации.
32. Способ по п.1, в котором генотип выборочной популяции растений для одного или более маркеров определяют экспериментально прямым секвенированием ДНК.
33. Способ извлечения набора данных с, по меньшей мере, одним признаком, созданным из, по меньшей мере, одного основанного на растении молекулярного генетического маркера, для нахождения, по меньшей мере, одного правила ассоциации и использования признаков, созданных из этих правил ассоциации, для классификации или прогнозирования касательно одного или более целевых признаков, причем способ содержит этапы, на которых:
(a) выявляют правила ассоциации;
(b) создают новые признаки на основании выводов этапа (a), и добавляют новые признаки в набор данных;
(c) выполняют оценку признаков;
(d) выбирают поднабор признаков из признаков в наборе данных; и
(e) разрабатывают модель для прогнозирования или классификации касательно одного или более целевых признаков с, по меньшей мере, одним признаком, созданным по правилам ассоциации, выявленным на этапе (a).
34. Применение способа по п.33 для отбора инбредных линий, отбора гибридов, ранжирования гибридов, ранжирования гибридов для определенной географии, отбора родителей новых инбредных популяций, нахождения участков для интрогрессии в элитные инбредные линии или любой их комбинации.
35. Способ по п.33, в котором, по меньшей мере, один из перечисленных этапов (a)-(e) выполняется с использованием алгоритма машинного обучения.
36. Способ по п.33, в котором этап (a) заключается в том, что выявляют правила ассоциации, пространственные и временные ассоциации с использованием самоорганизующихся карт.
37. Способ по п.33, в котором, по меньшей мере, один признак по этапу (e) является поднабором признаков, выбранных на этапе (d).
38. Способ по п.33, в котором перекрестную проверку используют для сравнения алгоритмов и наборов значений параметров.
39. Способ по п.33, дополнительно содержащий использование кривых рабочих характеристик приемника (ROC) для сравнения алгоритмов и наборов значений параметров.
40. Способ по п.33, в котором один или более признаков выводят математически или вычислительным образом из других признаков.
41. Способ извлечения набора данных с, по меньшей мере, одним признаком, созданным из, по меньшей мере, одного основанного на растении молекулярного генетического маркера, для нахождения, по меньшей мере, одного правила ассоциации и использования признаков, созданных из этих правил ассоциации, для классификации или прогнозирования касательно одного или более целевых признаков, причем способ содержит этапы, на которых:
(a) выявляют правила ассоциации;
(b) создают новые признаки на основании этапа (a), и добавляют эти новые признаки в набор данных;
(c) разрабатывают модель для прогнозирования или классификации касательно одного или более целевых признаков с, по меньшей мере, одним признаком, созданным на этапе (b).
42. Способ по п.41, в котором этапы по п.41 предваряют этапом, на котором:
(a) выбирают поднабор признаков из признаков в наборе данных.
43. Способ извлечения набора данных с одним или более признаками, причем способ содержит этапы, на которых извлекают набор данных с, по меньшей мере, одним основанным на растениях молекулярным генетическим маркером для нахождения, по меньшей мере, одного правила ассоциации и используют признаки, созданные по этим правилам ассоциации, для классификации или прогнозирования, причем способ содержит этапы, на которых:
(a) выявляют правила ассоциации;
(b) создают новые признаки на основании выводов этапа (a), и добавляют эти признаки в набор данных;
(c) выбирают поднабор признаков из признаков в наборе данных.
44. Способ по п.41, в котором этап (a) включает в себя этап, на котором выявляют пространственные и временные ассоциации с использованием самоорганизующихся карт.
45. Применение способа по пп.1, 33 или 41 для прогнозирования характеристик гибрида.
46. Применение способа по пп.1, 33 или 41 для прогнозирования характеристик гибрида по различным географическим местоположениям.
47. Способ по пп.1, 33 или 41, в котором априорные знания учитывают на, по меньшей мере, одном из этапов.
48. Применение способа по пп.1, 33 или 41 для отбора инбредных линий, отбора гибридов, ранжирования гибридов, ранжирования гибридов для определенной географии, подбора родителей новых инбредных популяций, нахождения участков для интрогрессии в элитные инбредные линии или любой их комбинации.
49. Способ отбора, по меньшей мере, одного растения для одного или более интересующих целевых признаков из популяции растений, причем способ содержит этапы, на которых:
извлекают набор данных с, по меньшей мере, одним основанным на растении молекулярным генетическим маркером, для нахождения, по меньшей мере, одного правила ассоциации и используют признаки, созданные из этих правил ассоциации, для классификации или прогнозирования касательно одного или более целевых признаков; и
выбирают, по меньшей мере, одно растение из популяции растений для одного или более интересующих целевых признаков на основании классификации или прогнозирования по правилам ассоциации.
50. Способ отбора родительских растений новых популяций растений, причем способ содержит этапы, на которых:
извлекают набор данных с, по меньшей мере, одним основанным на растении молекулярным генетическим маркером, для нахождения, по меньшей мере, одного правила ассоциации и используют признаки, созданные из этих правил ассоциации, для классификации или прогнозирования касательно одного или более целевых признаков; и
выбирают, по меньшей мере, два растения из популяции растений, чтобы быть родителями новой популяции, на основании классификации или прогнозирования по правилам ассоциации.
51. Способ отбора участков ДНК из популяции растений, которые улучшают один или более особей из популяции растений, причем способ содержит этапы, на которых:
извлекают набор данных с, по меньшей мере, одним основанным на растении молекулярным генетическим маркером, для нахождения, по меньшей мере, одного правила ассоциации и используют признаки, созданные из этих правил ассоциации, для классификации или прогнозирования касательно одного или более целевых признаков; и
выбирают участок ДНК из популяции растений, который улучшает одну или более особей популяции растений, на основании классификации или прогнозирования по правилам ассоциации.
52. Способ по п.43, в котором результаты применяются для выявления одного или более локусов количественных признаков, присвоения важности одному или более локусам количественных признаков, положения одного или более локусов количественных признаков или любой их комбинации.
53. Способ по п.29, в котором относящиеся к окружающей среде измерения включают в себя, но не в качестве ограничения, климатические и почвенные характеристики поля, где культивируются растения.
54. Способ по пп.1, 33 или 42, в котором, по меньшей мере, один признак создают, по меньшей мере, из одного основанного на животном молекулярного генетического маркера.
55. Способ по пп.1, 33 или 42, в котором априорные знания составляют из предварительного исследования, количественных изучений генетики растения, генных сетей, анализов последовательностей или любой их комбинации.
56. Способ по пп.1, 33 или 42, дополнительно содержащий этапы, на которых:
(a) понижают размерности заменой исходных признаков комбинацией одного или более признаков, включенных в одно или более из правил ассоциации;
(b) извлечения различительных и присущих часто встречающихся шаблонов посредством основанного на модели дерева поиска.
57. Способ по пп.1, 33, 41, 43, 49-51, который выполняют с использованием компьютера и программного обеспечения.
RU2012103024A 2009-06-30 2010-06-03 Применение способов машинного обучения для извлечения правил ассоциации в наборах данных растений и животных, содержащих в себе молекулярные генетические маркеры, сопровождаемое классификацией или прогнозированием с использованием признаков, созданных по этим правилам ассоциации RU2607999C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US22180409P 2009-06-30 2009-06-30
US61/221,804 2009-06-30
PCT/US2010/037211 WO2011008361A1 (en) 2009-06-30 2010-06-03 Application of machine learning methods for mining association rules in plant and animal data sets containing molecular genetic markers, followed by classification or prediction utilizing features created from these association rules

Publications (2)

Publication Number Publication Date
RU2012103024A true RU2012103024A (ru) 2013-08-10
RU2607999C2 RU2607999C2 (ru) 2017-01-11

Family

ID=42685709

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012103024A RU2607999C2 (ru) 2009-06-30 2010-06-03 Применение способов машинного обучения для извлечения правил ассоциации в наборах данных растений и животных, содержащих в себе молекулярные генетические маркеры, сопровождаемое классификацией или прогнозированием с использованием признаков, созданных по этим правилам ассоциации

Country Status (15)

Country Link
US (1) US10102476B2 (ru)
EP (1) EP2449510B2 (ru)
CN (1) CN102473247B (ru)
AR (2) AR077103A1 (ru)
AU (2) AU2010274044B2 (ru)
BR (1) BRPI1015129A2 (ru)
CA (1) CA2766914C (ru)
CL (1) CL2011003328A1 (ru)
CO (1) CO6430492A2 (ru)
MX (1) MX2011014020A (ru)
NZ (1) NZ596478A (ru)
PH (1) PH12016501806A1 (ru)
RU (1) RU2607999C2 (ru)
WO (1) WO2011008361A1 (ru)
ZA (1) ZA201108579B (ru)

Families Citing this family (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8190647B1 (en) * 2009-09-15 2012-05-29 Symantec Corporation Decision tree induction that is sensitive to attribute computational complexity
US8593277B2 (en) 2011-03-17 2013-11-26 Kaarya, LLC. System and method for proximity detection
US8819065B2 (en) * 2011-07-08 2014-08-26 International Business Machines Corporation Mining generalized spatial association rule
US8217945B1 (en) 2011-09-02 2012-07-10 Metric Insights, Inc. Social annotation of a single evolving visual representation of a changing dataset
US9275334B2 (en) * 2012-04-06 2016-03-01 Applied Materials, Inc. Increasing signal to noise ratio for creation of generalized and robust prediction models
US9563669B2 (en) 2012-06-12 2017-02-07 International Business Machines Corporation Closed itemset mining using difference update
US9373087B2 (en) 2012-10-25 2016-06-21 Microsoft Technology Licensing, Llc Decision tree training in machine learning
US9754015B2 (en) * 2012-11-26 2017-09-05 Excalibur Ip, Llc Feature rich view of an entity subgraph
CN103884806B (zh) * 2012-12-21 2016-01-27 中国科学院大连化学物理研究所 结合二级质谱和机器学习算法的蛋白质组无标记定量方法
US9471881B2 (en) 2013-01-21 2016-10-18 International Business Machines Corporation Transductive feature selection with maximum-relevancy and minimum-redundancy criteria
US20140207799A1 (en) * 2013-01-21 2014-07-24 International Business Machines Corporation Hill-climbing feature selection with max-relevancy and minimum redundancy criteria
US10102333B2 (en) * 2013-01-21 2018-10-16 International Business Machines Corporation Feature selection for efficient epistasis modeling for phenotype prediction
RU2543315C2 (ru) * 2013-03-22 2015-02-27 Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики" Способ отбора эффективных вариантов в поисковых и рекомендательных системах (варианты)
AU2014287234A1 (en) * 2013-07-10 2016-02-25 Daniel M. Rice Consistent ordinal reduced error logistic regression machine
US9524510B2 (en) 2013-10-02 2016-12-20 Turn Inc. Adaptive fuzzy fallback stratified sampling for fast reporting and forecasting
WO2015143393A1 (en) * 2014-03-20 2015-09-24 The Regents Of The University Of California Unsupervised high-dimensional behavioral data classifier
US9940343B2 (en) 2014-05-07 2018-04-10 Sas Institute Inc. Data structure supporting contingency table generation
CN104765810B (zh) * 2015-04-02 2018-03-06 西安电子科技大学 基于布尔矩阵的诊疗规则挖掘方法
WO2016168464A1 (en) * 2015-04-14 2016-10-20 Ptc Inc. Scoring a population of examples using a model
US10037361B2 (en) 2015-07-07 2018-07-31 Sap Se Frequent item-set mining based on item absence
CN105160087B (zh) * 2015-08-26 2018-03-13 中国人民解放军军事医学科学院放射与辐射医学研究所 一种关联规则最优曲线模型的构建方法
US11972336B2 (en) 2015-12-18 2024-04-30 Cognoa, Inc. Machine learning platform and system for data analysis
CN105827603A (zh) * 2016-03-14 2016-08-03 中国人民解放军信息工程大学 未明协议特征库建立方法、未明报文分类方法及相关装置
CN107516022A (zh) * 2016-06-17 2017-12-26 北京光大隆泰科技有限责任公司 基于离散关联决策树的表型‑基因型的数据处理方法和系统
CN106202883A (zh) * 2016-06-28 2016-12-07 成都中医药大学 一种基于大数据分析建立疾病云图的方法
US11030673B2 (en) * 2016-07-28 2021-06-08 International Business Machines Corporation Using learned application flow to assist users in network business transaction based apps
US11222270B2 (en) 2016-07-28 2022-01-11 International Business Machiness Corporation Using learned application flow to predict outcomes and identify trouble spots in network business transactions
RU2649792C2 (ru) * 2016-09-09 2018-04-04 Общество С Ограниченной Ответственностью "Яндекс" Способ и система обучения алгоритма машинного обучения
US10210283B2 (en) 2016-09-28 2019-02-19 International Business Machines Corporation Accessibility detection and resolution
CN106407711A (zh) * 2016-10-10 2017-02-15 重庆科技学院 基于云数据的宠物喂养推荐方法及系统
CN106472332B (zh) * 2016-10-10 2019-05-10 重庆科技学院 基于动态智能算法的宠物喂养方法及系统
CN110050092B (zh) * 2016-12-08 2023-01-03 中国种子集团有限公司 水稻全基因组育种芯片及其应用
EP3340130A1 (en) * 2016-12-23 2018-06-27 Hexagon Technology Center GmbH Method for prediction of soil and/or plant condition
CN106709998A (zh) * 2016-12-24 2017-05-24 郑州大学 一种农作物叶面属性数字化重建的自组织映射建模方法
US20190355473A1 (en) * 2017-01-08 2019-11-21 Henry M. Jackson Foundation For The Advancement Of Military Medicine Systems and methods for using supervised learning to predict subject-specific pneumonia outcomes
WO2018129413A1 (en) * 2017-01-08 2018-07-12 The Henry M. Jackson Foundation For The Advancement Of Military Medicine, Inc. Systems and methods for using supervised learning to predict subject-specific bacteremia outcomes
CN106803209B (zh) * 2017-01-13 2020-09-18 浙江求是人工环境有限公司 实时数据库和先进控制算法的作物培育模式分析优化方法
CN106886792B (zh) * 2017-01-22 2020-01-17 北京工业大学 一种基于分层机制构建多分类器融合模型的脑电情感识别方法
US20180239866A1 (en) * 2017-02-21 2018-08-23 International Business Machines Corporation Prediction of genetic trait expression using data analytics
CN108733966A (zh) * 2017-04-14 2018-11-02 国网重庆市电力公司 一种基于决策树群的多维电能表现场状态检验方法
RU2672394C1 (ru) * 2017-07-26 2018-11-14 Общество С Ограниченной Ответственностью "Яндекс" Способы и системы для оценки обучающих объектов посредством алгоритма машинного обучения
US11263707B2 (en) 2017-08-08 2022-03-01 Indigo Ag, Inc. Machine learning in agricultural planting, growing, and harvesting contexts
CA3073713A1 (en) 2017-08-25 2019-02-28 The Board Of Trustees Of The University Of Illinois Apparatus and method for agricultural data collection and agricultural operations
CN107679368A (zh) * 2017-09-11 2018-02-09 宁夏医科大学 基于遗传算法和变精度粗糙集的pet/ct高维特征级选择方法
CN107844602B (zh) * 2017-11-24 2021-03-16 重庆邮电大学 一种基于时空属性关联规则的预测方法
US11574153B2 (en) * 2017-12-01 2023-02-07 Zymergen Inc. Identifying organisms for production using unsupervised parameter learning for outlier detection
CN108280289B (zh) * 2018-01-22 2021-10-08 辽宁工程技术大学 基于局部加权c4.5算法的冲击地压危险等级预测方法
CN108307231B (zh) * 2018-02-14 2021-01-08 南京邮电大学 基于遗传算法的网络视频流特征选择与分类方法
US20190325466A1 (en) 2018-04-24 2019-10-24 Indigo Ag, Inc. Satellite-based agricultural modeling
US11367093B2 (en) 2018-04-24 2022-06-21 Indigo Ag, Inc. Satellite-based agricultural modeling
US11531934B2 (en) * 2018-05-31 2022-12-20 Kyndryl, Inc. Machine learning (ML) modeling by DNA computing
CN109308936B (zh) * 2018-08-24 2020-09-01 黑龙江省稻无疆农业科技有限责任公司 一种粮食作物产地的识别方法、识别装置及终端识别设备
CN109300502A (zh) * 2018-10-10 2019-02-01 汕头大学医学院 一种从多组学数据中分析关联变化模式的系统和方法
CN109918708B (zh) * 2019-01-21 2022-07-26 昆明理工大学 一种基于异质集成学习的材料性能预测模型构建方法
BR112021017998A2 (pt) 2019-03-11 2021-11-16 Pioneer Hi Bred Int Métodos para a produção de plantas clonais
CN113519028B (zh) * 2019-03-11 2023-08-04 先锋国际良种公司 用于估算或预测基因型和表型的方法和组成
TWI759586B (zh) * 2019-03-18 2022-04-01 崑山科技大學 農田澆灌建議方法
WO2020214699A1 (en) * 2019-04-15 2020-10-22 Sports Data Labs, Inc. Animal data prediction system
CN110119551B (zh) * 2019-04-29 2022-12-06 西安电子科技大学 基于机器学习的盾构机刀具磨损退化关联特征分析方法
US10515715B1 (en) 2019-06-25 2019-12-24 Colgate-Palmolive Company Systems and methods for evaluating compositions
EP3997546A4 (en) * 2019-07-08 2023-07-12 Indigo AG, Inc. CROP YIELD FORECAST MODELS
CN110777214B (zh) * 2019-07-11 2022-05-27 东北农业大学 与玉米种子耐储性紧密连锁的ssr标记及其在分子标记辅助育种中的应用
CN110334133B (zh) * 2019-07-11 2020-11-20 北京京东智能城市大数据研究院 规则挖掘方法和装置、电子设备和计算机可读存储介质
US20210110298A1 (en) * 2019-10-15 2021-04-15 Kinaxis Inc. Interactive machine learning
US11526899B2 (en) 2019-10-11 2022-12-13 Kinaxis Inc. Systems and methods for dynamic demand sensing
US11886514B2 (en) 2019-10-11 2024-01-30 Kinaxis Inc. Machine learning segmentation methods and systems
CN111103157A (zh) * 2019-11-26 2020-05-05 通鼎互联信息股份有限公司 一种基于生物启发频繁项集挖掘的工业设备状态监测方法
US11544593B2 (en) * 2020-01-07 2023-01-03 International Business Machines Corporation Data analysis and rule generation for providing a recommendation
US11176924B2 (en) 2020-01-09 2021-11-16 International Business Machines Corporation Reduced miss rate in sound to text conversion using banach spaces
US11669794B2 (en) * 2020-04-06 2023-06-06 Johnson Controls Tyco IP Holdings LLP Building risk analysis system with geographic risk scoring
CN111540408B (zh) * 2020-05-12 2023-06-02 西藏自治区农牧科学院水产科学研究所 一种全基因组多态性ssr分子标记的筛选方法
CN111738138B (zh) * 2020-06-19 2024-02-02 安徽大学 一种耦合气象特征区域尺度的小麦条绣病严重度遥感监测方法
CN111784071B (zh) * 2020-07-14 2024-05-07 北京月新时代科技股份有限公司 一种基于Stacking集成的许可占用与预测方法及系统
CN111984646A (zh) * 2020-08-12 2020-11-24 中国科学院昆明植物研究所 一种基于二叉树的植物数据存储、鉴定方法及系统
CN112182497B (zh) * 2020-09-25 2021-04-27 齐鲁工业大学 一种基于生物序列的负序列模式的相似性分析方法、实现系统及介质
CN112446509B (zh) * 2020-11-10 2023-05-26 中国电子科技集团公司第三十八研究所 一种复杂电子装备预测维护方法
WO2022157872A1 (ja) * 2021-01-21 2022-07-28 日本電気株式会社 情報処理装置、特徴量選択方法、教師データ生成方法、推定モデル生成方法、ストレス度の推定方法、およびプログラム
CN113053459A (zh) * 2021-03-17 2021-06-29 扬州大学 一种基于贝叶斯模型整合亲本表型的杂交种预测方法
CN113381973B (zh) * 2021-04-26 2023-02-28 深圳市任子行科技开发有限公司 一种识别ssr流量的方法、系统以及计算机可读存储介质
US11748384B2 (en) 2021-05-28 2023-09-05 International Business Machines Corporation Determining an association rule
CN113535694A (zh) * 2021-06-18 2021-10-22 北方民族大学 一种基于Stacking框架的特征选择方法
WO2023034118A1 (en) 2021-08-30 2023-03-09 Indigo Ag, Inc. Systems for management of location-aware market data
CA3230474A1 (en) 2021-08-31 2023-03-09 Eleanor Elizabeth Campbell Systems and methods for ecosystem credit recommendations
CN114780599A (zh) * 2022-04-06 2022-07-22 四川农业大学 基于小麦品比试验数据的综合分析系统
CN116189907B (zh) * 2022-12-05 2023-09-05 广州盛安医学检验有限公司 一种适用于新生儿的遗传代谢病智能筛查系统
CN117461500B (zh) * 2023-12-27 2024-04-02 北京市农林科学院智能装备技术研究中心 加速作物育种的植物工厂系统、方法、装置、设备及介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2547678A1 (en) 1996-07-03 1998-01-04 Cargill, Incorporated Canola oil having increased oleic acid and decreased linolenic acid content
US20030130991A1 (en) * 2001-03-28 2003-07-10 Fidel Reijerse Knowledge discovery from data sets
EP1449108A4 (en) 2001-11-07 2006-11-22 Health Discovery Corp CLASSIFICATION OF CHARACTERISTICS PRETRATED FOR A SUPPORT VECTOR MACHINE
RU2215406C2 (ru) 2002-01-03 2003-11-10 Государстенное научное учреждение РАСХН - Всероссийский научно-исследовательский институт масличных культур им. В.С. Пустовойта Способ создания форм сои с измененным жирно-кислотным составом масла
US20050144664A1 (en) 2003-05-28 2005-06-30 Pioneer Hi-Bred International, Inc. Plant breeding method
JP2008537821A (ja) * 2005-03-31 2008-09-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 生体分子及び疾患の間の関係に関する証拠を収集するシステム及び方法
US7836004B2 (en) 2006-12-11 2010-11-16 International Business Machines Corporation Using data mining algorithms including association rules and tree classifications to discover data rules
CA2691156A1 (en) 2007-06-20 2008-12-24 International Flower Developments Proprietary Limited Rose containing flavone and delphinidin, and method for production thereof

Also Published As

Publication number Publication date
CN102473247A (zh) 2012-05-23
CO6430492A2 (es) 2012-04-30
US10102476B2 (en) 2018-10-16
AU2015243031A1 (en) 2015-11-05
MX2011014020A (es) 2012-02-28
BRPI1015129A2 (pt) 2016-07-12
US20100332430A1 (en) 2010-12-30
EP2449510A1 (en) 2012-05-09
AU2010274044B2 (en) 2015-08-13
AR107503A2 (es) 2018-05-09
CA2766914C (en) 2019-02-26
WO2011008361A1 (en) 2011-01-20
CA2766914A1 (en) 2011-01-20
EP2449510B2 (en) 2022-12-21
NZ596478A (en) 2014-04-30
RU2607999C2 (ru) 2017-01-11
CL2011003328A1 (es) 2012-08-31
PH12016501806A1 (en) 2018-06-11
AR077103A1 (es) 2011-08-03
ZA201108579B (en) 2013-01-30
AU2010274044A1 (en) 2012-01-19
CN102473247B (zh) 2017-02-08
EP2449510B1 (en) 2019-07-31
AU2015243031B2 (en) 2016-12-22

Similar Documents

Publication Publication Date Title
RU2012103024A (ru) Применение способов машинного обучения для извлечения правил ассоциации в наборах данных растений и животных, содержащих в себе молекулярные генетические маркеры, сопровождаемое классификацией или прогнозированием с использованием признаков, созданных по этим правилам ассоциации
Vikram et al. Unlocking the genetic diversity of Creole wheats
US20220301658A1 (en) Machine learning driven gene discovery and gene editing in plants
Marra et al. Genetic relationships, structure and parentage simulation among the olive tree (Olea europaea L. subsp. europaea) cultivated in Southern Italy revealed by SSR markers
El Bakkali et al. Characterization of Worldwide Olive Germplasm Banks of Marrakech (Morocco) and Córdoba (Spain): Towards management and use of olive germplasm in breeding programs
Kaya et al. Genome wide association study of 5 agronomic traits in olive (Olea europaea L.)
Beiki et al. A new avenue for classification and prediction of olive cultivars using supervised and unsupervised algorithms
CN112232413A (zh) 基于图神经网络与谱聚类的高维数据特征选择方法
Fonseca et al. Phylogeographic model selection using convolutional neural networks
Panahi et al. Characterization of Iranian grapevine cultivars using machine learning models
Sant’Anna et al. Genetic diversity associated with natural rubber quality in elite genotypes of the rubber tree
Torkzaban et al. Machine learning based classification of microsatellite variation: an effective approach for phylogeographic characterization of olive populations
Diaz et al. Lung cancer classification using genetic algorithm to optimize prediction models
de Bem Oliveira et al. Research and partnership in studies of sugarcane using molecular markers: a scientometric approach
Yan et al. Identification of new marker genes from plant single‐cell RNA‐seq data using interpretable machine learning methods
Zinati et al. Mining transcriptome data to identify genes and pathways related to lemon taste using supervised and unsupervised data learning methods
Amundsen et al. Species relationships in the genus Agrostis based on flow cytometry and MITE‐display molecular markers
Rathasamuth et al. Selection of a Minimal Number of Significant Porcine SNPs by an Information Gain and Genetic Algorithm Hybrid Model
Nasiri et al. Precision assessment of some supervised and unsupervised algorithms for genotype discrimination in the genus pisum using SSR molecular data
Gauthier et al. Hybrids and phylogenetics revisited: a statistical test of hybridization using quartets
Hodel et al. Linking genome signatures of selection and adaptation in non-model plants: exploring potential and limitations in the angiosperm Amborella
Stegmayer et al. Neural network model for integration and visualization of introgressed genome and metabolite data
Vasantha et al. Machine Learning-Based Breeding Values Prediction System (ML-BVPS)
CN108182347B (zh) 一种大规模跨平台基因表达数据分类方法
CN112102880A (zh) 品种鉴定的方法、其预测模型的构建方法和装置

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20190604