RU2012103024A - Применение способов машинного обучения для извлечения правил ассоциации в наборах данных растений и животных, содержащих в себе молекулярные генетические маркеры, сопровождаемое классификацией или прогнозированием с использованием признаков, созданных по этим правилам ассоциации - Google Patents
Применение способов машинного обучения для извлечения правил ассоциации в наборах данных растений и животных, содержащих в себе молекулярные генетические маркеры, сопровождаемое классификацией или прогнозированием с использованием признаков, созданных по этим правилам ассоциации Download PDFInfo
- Publication number
- RU2012103024A RU2012103024A RU2012103024/08A RU2012103024A RU2012103024A RU 2012103024 A RU2012103024 A RU 2012103024A RU 2012103024/08 A RU2012103024/08 A RU 2012103024/08A RU 2012103024 A RU2012103024 A RU 2012103024A RU 2012103024 A RU2012103024 A RU 2012103024A
- Authority
- RU
- Russia
- Prior art keywords
- algorithm
- features
- plant
- algorithms
- association
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/04—Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Environmental Sciences (AREA)
- Developmental Biology & Embryology (AREA)
- Botany (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
1. Способ извлечения набора данных, который содержит, по меньшей мере, один признак, созданный из, по меньшей мере, одного основанного на растении молекулярного генетического маркера, для нахождения, по меньшей мере, одного правила ассоциации и использования одного или более признаков, созданных по этим правилам ассоциации, для классификации или прогнозирования касательно одного или более целевых признаков.2. Способ по п.1, в котором правила ассоциации включают в себя пространственные и временные правила ассоциации, которые определяют самоорганизующимися картами.3. Способ по п.1, в котором набор данных выбирают из группы, состоящей из данных окружающей среды, данных о фенотипе, данных последовательности ДНК, данных микроматрицы, биохимических данных, метаболических данных или их комбинации.4. Способ по п.1, в котором одно или более правил ассоциации, определенных одним или более алгоритмами извлечения правил ассоциации, используют для классификации или прогнозирования с одним или более алгоритмами машинного обучения, выбранными из группы, состоящей из алгоритмов оценки признаков, алгоритмов отбора поднабора признаков, байесовских сетей, алгоритмов, основанных на примерах, машин опорных векторов, алгоритма голосования, чувствительного к стоимости классификатора, алгоритма укладки, правил классификации и деревьев решений.5. Способ по п.4, в котором один или более алгоритмов извлечения правил ассоциации выбирают из группы, состоящей из алгоритма APriori, алгоритма FP-growth, алгоритмов извлечения правил ассоциации, которые могут обрабатывать большое количество признаков, алгоритмов извлечения огромных шаблонов, алго
Claims (57)
1. Способ извлечения набора данных, который содержит, по меньшей мере, один признак, созданный из, по меньшей мере, одного основанного на растении молекулярного генетического маркера, для нахождения, по меньшей мере, одного правила ассоциации и использования одного или более признаков, созданных по этим правилам ассоциации, для классификации или прогнозирования касательно одного или более целевых признаков.
2. Способ по п.1, в котором правила ассоциации включают в себя пространственные и временные правила ассоциации, которые определяют самоорганизующимися картами.
3. Способ по п.1, в котором набор данных выбирают из группы, состоящей из данных окружающей среды, данных о фенотипе, данных последовательности ДНК, данных микроматрицы, биохимических данных, метаболических данных или их комбинации.
4. Способ по п.1, в котором одно или более правил ассоциации, определенных одним или более алгоритмами извлечения правил ассоциации, используют для классификации или прогнозирования с одним или более алгоритмами машинного обучения, выбранными из группы, состоящей из алгоритмов оценки признаков, алгоритмов отбора поднабора признаков, байесовских сетей, алгоритмов, основанных на примерах, машин опорных векторов, алгоритма голосования, чувствительного к стоимости классификатора, алгоритма укладки, правил классификации и деревьев решений.
5. Способ по п.4, в котором один или более алгоритмов извлечения правил ассоциации выбирают из группы, состоящей из алгоритма APriori, алгоритма FP-growth, алгоритмов извлечения правил ассоциации, которые могут обрабатывать большое количество признаков, алгоритмов извлечения огромных шаблонов, алгоритма извлечения прямых различительных шаблонов, деревьев решений, неточных множеств.
6. Способ по п.4, в котором алгоритм извлечения правил ассоциации является алгоритмом самоорганизующейся карты (SOM).
7. Способ по п.5, в котором алгоритмы извлечения правил ассоциации, которые могут обрабатывать большое количество признаков, включают в себя, но не в качестве ограничения, CLOSET+, CHARM, CARPENTER и COBBLER.
8. Способ по п.5, в котором алгоритмы, которые могут находить прямые различительные шаблоны, включают в себя, но не в качестве ограничения, DDPM, HARMONY, RCBT, CAR и PATCLASS.
9. Способ по п.5, в котором алгоритмы, которые могут находить огромные шаблоны, включают в себя, но не в качестве ограничения, алгоритм слияния шаблонов.
10. Способ по п.4, в котором алгоритм оценки признаков, выбранный из группы, состоящей из алгоритма прироста информации, алгоритма Relief, алгоритма ReliefF, алгоритма RReliefF, алгоритма симметричной неопределенности, алгоритма отношений прироста и алгоритма ранжировщика.
11. Способ по п.4, в котором алгоритм отбора поднабора признаков выбирают из группы, состоящей из алгоритма основанного на корреляции отбора признаков (CFS) и алгоритма упаковки в ассоциации с любым другим алгоритмом машинного обучения.
12. Способ по п.4, в котором алгоритм машинного обучения является алгоритмом байесовской сети, включающим в себя наивный алгоритм Байеса.
13. Способ по п.4, в котором основанный на примерах алгоритм выбирают из группы, состоящей из основанного на примерах алгоритма 1 (IB1), основанного на примерах алгоритма k ближайших соседей (IBK), KStar, алгоритма облегченных правил Байеса (LBR) и алгоритма локально взвешенного обучения (LWL).
14. Способ по п.4, в котором алгоритм машинного обучения является алгоритмом машины опорных векторов.
15. Способ по п.14, в котором алгоритм машины опорных векторов является алгоритмом регрессии по методу опорных векторов (SVR).
16. Способ по п.14, в котором алгоритм машины опорных векторов использует алгоритм последовательной минимальной оптимизации (SMO).
17. Способ по п.14, в котором алгоритм машины опорных векторов использует алгоритм последовательной минимальной оптимизации для регрессии (SMOReg).
18. Способ по п.4, в котором дерево решений выбирается из группы, состоящей из алгоритма дерева логистической модели (LMT), алгоритма дерева переменных решений (ADTree), алгоритма M5P и алгоритма REPTree.
19. Способ по п.1, в котором один или более целевых признаков выбирают из группы, состоящей из непрерывного целевого признака и дискретного целевого признака.
20. Способ по п.1, в котором дискретный целевой признак является двоичным целевым признаком.
21. Способ по п.1, в котором, по меньшей мере, один основанный на растениях молекулярный генетический маркер происходит из популяции растений.
22. Способ по п.21, в котором популяция растений является структурированной или неструктурированной популяцией растений.
23. Способ по п.21, в котором популяция растений содержит инбредные растения.
24. Способ по п.21, в котором популяция растений содержит гибридные растения.
25. Способ по п.21, в котором популяцию растений выбирают из группы, состоящей из кукурузы, сои, сахарного тростника, сорго, пшеницы, подсолнечника, риса, канола, хлопка и просо.
26. Способ по п.21, в котором популяция растений содержит от приблизительно 2 до приблизительно 1000000 членов.
27. Способ по п.1, в котором количество молекулярных генетических маркеров находится в диапазоне от приблизительно 1 до приблизительно 1000000 маркеров.
28. Способ по п.1, в котором признаки содержат один или более из простой повторяющейся последовательности (SSR), расщепленных амплифицированных полиморфных последовательностей (CAPS), полиморфизма длин простой последовательности (SSLP), полиморфизма длин рестрикционных фрагментов (RFLP), маркера произвольной амплифицированной полиморфной ДНК (RAPD), полиморфизма одиночных нуклеотидов (SNP), полиморфизма длины произвольного фрагмента (AFLP), вставки, удаления или любого другого типа молекулярного генетического маркера, выведенного из ДНК, РНК, белка или метаболита, гаплотипа, созданного из двух или более из описанных выше молекулярных генетических маркеров, выведенных из ДНК, и их комбинации.
29. Способ по п.1, в котором признаки содержат один или более из простой повторяющейся последовательности (SSR), расщепленных амплифицированных полиморфных последовательностей (CAPS), полиморфизма длин простой последовательности (SSLP), полиморфизма длин рестрикционных фрагментов (RFLP), маркера произвольно амплифицированной полиморфной ДНК (RAPD), полиморфизма одиночных нуклеотидов (SNP), полиморфизма длины произвольного фрагмента (AFLP), вставки, удаления или любого другого типа молекулярного генетического маркера, выведенного из ДНК, РНК, белка или метаболита, гаплотипа, созданного из двух или более из описанных выше молекулярных генетических маркеров, выведенных из ДНК, их комбинацию в соединении с одним или более измерений фенотипа, данных микроматрицы, аналитических измерений, биохимических измерений или относящихся к окружающей среде измерений в качестве признаков.
30. Способ по п.1, в котором один или более целевых признаков являются численно представимыми особенностями фенотипа, включающими в себя устойчивость к болезням, урожайность, зерновой выход, прочность пряжи, белковый состав, содержание белка, устойчивость к насекомым, влагосодержание зерна, содержание масла в зерне, качество зерновых масел, засухоустойчивость, устойчивость к корневому полеганию, высота растения, высота колоса, содержание белка в зерне, содержание аминокислот в зерне, цвет зерна и устойчивость к стеблевому полеганию.
31. Способ по п.1, в котором один или более целевых признаков являются численно представимыми особенностями фенотипа, включающими в себя устойчивость к болезням, урожайность, зерновой выход, прочность пряжи, белковый состав, содержание белка, устойчивость к насекомым, влагосодержание зерна, содержание масла в зерне, качество зерновых масел, засухоустойчивость, устойчивость к корневому полеганию, высота растения, высота колоса, содержание белка в зерне, содержание аминокислот в зерне, цвет зерна и устойчивость к стеблевому полеганию, установленные с использованием статистических способов, способов машинного обучения или любой их комбинации.
32. Способ по п.1, в котором генотип выборочной популяции растений для одного или более маркеров определяют экспериментально прямым секвенированием ДНК.
33. Способ извлечения набора данных с, по меньшей мере, одним признаком, созданным из, по меньшей мере, одного основанного на растении молекулярного генетического маркера, для нахождения, по меньшей мере, одного правила ассоциации и использования признаков, созданных из этих правил ассоциации, для классификации или прогнозирования касательно одного или более целевых признаков, причем способ содержит этапы, на которых:
(a) выявляют правила ассоциации;
(b) создают новые признаки на основании выводов этапа (a), и добавляют новые признаки в набор данных;
(c) выполняют оценку признаков;
(d) выбирают поднабор признаков из признаков в наборе данных; и
(e) разрабатывают модель для прогнозирования или классификации касательно одного или более целевых признаков с, по меньшей мере, одним признаком, созданным по правилам ассоциации, выявленным на этапе (a).
34. Применение способа по п.33 для отбора инбредных линий, отбора гибридов, ранжирования гибридов, ранжирования гибридов для определенной географии, отбора родителей новых инбредных популяций, нахождения участков для интрогрессии в элитные инбредные линии или любой их комбинации.
35. Способ по п.33, в котором, по меньшей мере, один из перечисленных этапов (a)-(e) выполняется с использованием алгоритма машинного обучения.
36. Способ по п.33, в котором этап (a) заключается в том, что выявляют правила ассоциации, пространственные и временные ассоциации с использованием самоорганизующихся карт.
37. Способ по п.33, в котором, по меньшей мере, один признак по этапу (e) является поднабором признаков, выбранных на этапе (d).
38. Способ по п.33, в котором перекрестную проверку используют для сравнения алгоритмов и наборов значений параметров.
39. Способ по п.33, дополнительно содержащий использование кривых рабочих характеристик приемника (ROC) для сравнения алгоритмов и наборов значений параметров.
40. Способ по п.33, в котором один или более признаков выводят математически или вычислительным образом из других признаков.
41. Способ извлечения набора данных с, по меньшей мере, одним признаком, созданным из, по меньшей мере, одного основанного на растении молекулярного генетического маркера, для нахождения, по меньшей мере, одного правила ассоциации и использования признаков, созданных из этих правил ассоциации, для классификации или прогнозирования касательно одного или более целевых признаков, причем способ содержит этапы, на которых:
(a) выявляют правила ассоциации;
(b) создают новые признаки на основании этапа (a), и добавляют эти новые признаки в набор данных;
(c) разрабатывают модель для прогнозирования или классификации касательно одного или более целевых признаков с, по меньшей мере, одним признаком, созданным на этапе (b).
42. Способ по п.41, в котором этапы по п.41 предваряют этапом, на котором:
(a) выбирают поднабор признаков из признаков в наборе данных.
43. Способ извлечения набора данных с одним или более признаками, причем способ содержит этапы, на которых извлекают набор данных с, по меньшей мере, одним основанным на растениях молекулярным генетическим маркером для нахождения, по меньшей мере, одного правила ассоциации и используют признаки, созданные по этим правилам ассоциации, для классификации или прогнозирования, причем способ содержит этапы, на которых:
(a) выявляют правила ассоциации;
(b) создают новые признаки на основании выводов этапа (a), и добавляют эти признаки в набор данных;
(c) выбирают поднабор признаков из признаков в наборе данных.
44. Способ по п.41, в котором этап (a) включает в себя этап, на котором выявляют пространственные и временные ассоциации с использованием самоорганизующихся карт.
45. Применение способа по пп.1, 33 или 41 для прогнозирования характеристик гибрида.
46. Применение способа по пп.1, 33 или 41 для прогнозирования характеристик гибрида по различным географическим местоположениям.
47. Способ по пп.1, 33 или 41, в котором априорные знания учитывают на, по меньшей мере, одном из этапов.
48. Применение способа по пп.1, 33 или 41 для отбора инбредных линий, отбора гибридов, ранжирования гибридов, ранжирования гибридов для определенной географии, подбора родителей новых инбредных популяций, нахождения участков для интрогрессии в элитные инбредные линии или любой их комбинации.
49. Способ отбора, по меньшей мере, одного растения для одного или более интересующих целевых признаков из популяции растений, причем способ содержит этапы, на которых:
извлекают набор данных с, по меньшей мере, одним основанным на растении молекулярным генетическим маркером, для нахождения, по меньшей мере, одного правила ассоциации и используют признаки, созданные из этих правил ассоциации, для классификации или прогнозирования касательно одного или более целевых признаков; и
выбирают, по меньшей мере, одно растение из популяции растений для одного или более интересующих целевых признаков на основании классификации или прогнозирования по правилам ассоциации.
50. Способ отбора родительских растений новых популяций растений, причем способ содержит этапы, на которых:
извлекают набор данных с, по меньшей мере, одним основанным на растении молекулярным генетическим маркером, для нахождения, по меньшей мере, одного правила ассоциации и используют признаки, созданные из этих правил ассоциации, для классификации или прогнозирования касательно одного или более целевых признаков; и
выбирают, по меньшей мере, два растения из популяции растений, чтобы быть родителями новой популяции, на основании классификации или прогнозирования по правилам ассоциации.
51. Способ отбора участков ДНК из популяции растений, которые улучшают один или более особей из популяции растений, причем способ содержит этапы, на которых:
извлекают набор данных с, по меньшей мере, одним основанным на растении молекулярным генетическим маркером, для нахождения, по меньшей мере, одного правила ассоциации и используют признаки, созданные из этих правил ассоциации, для классификации или прогнозирования касательно одного или более целевых признаков; и
выбирают участок ДНК из популяции растений, который улучшает одну или более особей популяции растений, на основании классификации или прогнозирования по правилам ассоциации.
52. Способ по п.43, в котором результаты применяются для выявления одного или более локусов количественных признаков, присвоения важности одному или более локусам количественных признаков, положения одного или более локусов количественных признаков или любой их комбинации.
53. Способ по п.29, в котором относящиеся к окружающей среде измерения включают в себя, но не в качестве ограничения, климатические и почвенные характеристики поля, где культивируются растения.
54. Способ по пп.1, 33 или 42, в котором, по меньшей мере, один признак создают, по меньшей мере, из одного основанного на животном молекулярного генетического маркера.
55. Способ по пп.1, 33 или 42, в котором априорные знания составляют из предварительного исследования, количественных изучений генетики растения, генных сетей, анализов последовательностей или любой их комбинации.
56. Способ по пп.1, 33 или 42, дополнительно содержащий этапы, на которых:
(a) понижают размерности заменой исходных признаков комбинацией одного или более признаков, включенных в одно или более из правил ассоциации;
(b) извлечения различительных и присущих часто встречающихся шаблонов посредством основанного на модели дерева поиска.
57. Способ по пп.1, 33, 41, 43, 49-51, который выполняют с использованием компьютера и программного обеспечения.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US22180409P | 2009-06-30 | 2009-06-30 | |
US61/221,804 | 2009-06-30 | ||
PCT/US2010/037211 WO2011008361A1 (en) | 2009-06-30 | 2010-06-03 | Application of machine learning methods for mining association rules in plant and animal data sets containing molecular genetic markers, followed by classification or prediction utilizing features created from these association rules |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2012103024A true RU2012103024A (ru) | 2013-08-10 |
RU2607999C2 RU2607999C2 (ru) | 2017-01-11 |
Family
ID=42685709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2012103024A RU2607999C2 (ru) | 2009-06-30 | 2010-06-03 | Применение способов машинного обучения для извлечения правил ассоциации в наборах данных растений и животных, содержащих в себе молекулярные генетические маркеры, сопровождаемое классификацией или прогнозированием с использованием признаков, созданных по этим правилам ассоциации |
Country Status (15)
Country | Link |
---|---|
US (1) | US10102476B2 (ru) |
EP (1) | EP2449510B2 (ru) |
CN (1) | CN102473247B (ru) |
AR (2) | AR077103A1 (ru) |
AU (2) | AU2010274044B2 (ru) |
BR (1) | BRPI1015129A2 (ru) |
CA (1) | CA2766914C (ru) |
CL (1) | CL2011003328A1 (ru) |
CO (1) | CO6430492A2 (ru) |
MX (1) | MX2011014020A (ru) |
NZ (1) | NZ596478A (ru) |
PH (1) | PH12016501806A1 (ru) |
RU (1) | RU2607999C2 (ru) |
WO (1) | WO2011008361A1 (ru) |
ZA (1) | ZA201108579B (ru) |
Families Citing this family (86)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8190647B1 (en) * | 2009-09-15 | 2012-05-29 | Symantec Corporation | Decision tree induction that is sensitive to attribute computational complexity |
US8593277B2 (en) | 2011-03-17 | 2013-11-26 | Kaarya, LLC. | System and method for proximity detection |
US8819065B2 (en) * | 2011-07-08 | 2014-08-26 | International Business Machines Corporation | Mining generalized spatial association rule |
US8217945B1 (en) | 2011-09-02 | 2012-07-10 | Metric Insights, Inc. | Social annotation of a single evolving visual representation of a changing dataset |
US9275334B2 (en) * | 2012-04-06 | 2016-03-01 | Applied Materials, Inc. | Increasing signal to noise ratio for creation of generalized and robust prediction models |
US9563669B2 (en) | 2012-06-12 | 2017-02-07 | International Business Machines Corporation | Closed itemset mining using difference update |
US9373087B2 (en) | 2012-10-25 | 2016-06-21 | Microsoft Technology Licensing, Llc | Decision tree training in machine learning |
US9754015B2 (en) * | 2012-11-26 | 2017-09-05 | Excalibur Ip, Llc | Feature rich view of an entity subgraph |
CN103884806B (zh) * | 2012-12-21 | 2016-01-27 | 中国科学院大连化学物理研究所 | 结合二级质谱和机器学习算法的蛋白质组无标记定量方法 |
US9471881B2 (en) | 2013-01-21 | 2016-10-18 | International Business Machines Corporation | Transductive feature selection with maximum-relevancy and minimum-redundancy criteria |
US20140207799A1 (en) * | 2013-01-21 | 2014-07-24 | International Business Machines Corporation | Hill-climbing feature selection with max-relevancy and minimum redundancy criteria |
US10102333B2 (en) * | 2013-01-21 | 2018-10-16 | International Business Machines Corporation | Feature selection for efficient epistasis modeling for phenotype prediction |
RU2543315C2 (ru) * | 2013-03-22 | 2015-02-27 | Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики" | Способ отбора эффективных вариантов в поисковых и рекомендательных системах (варианты) |
AU2014287234A1 (en) * | 2013-07-10 | 2016-02-25 | Daniel M. Rice | Consistent ordinal reduced error logistic regression machine |
US9524510B2 (en) | 2013-10-02 | 2016-12-20 | Turn Inc. | Adaptive fuzzy fallback stratified sampling for fast reporting and forecasting |
WO2015143393A1 (en) * | 2014-03-20 | 2015-09-24 | The Regents Of The University Of California | Unsupervised high-dimensional behavioral data classifier |
US9940343B2 (en) | 2014-05-07 | 2018-04-10 | Sas Institute Inc. | Data structure supporting contingency table generation |
CN104765810B (zh) * | 2015-04-02 | 2018-03-06 | 西安电子科技大学 | 基于布尔矩阵的诊疗规则挖掘方法 |
WO2016168464A1 (en) * | 2015-04-14 | 2016-10-20 | Ptc Inc. | Scoring a population of examples using a model |
US10037361B2 (en) | 2015-07-07 | 2018-07-31 | Sap Se | Frequent item-set mining based on item absence |
CN105160087B (zh) * | 2015-08-26 | 2018-03-13 | 中国人民解放军军事医学科学院放射与辐射医学研究所 | 一种关联规则最优曲线模型的构建方法 |
US11972336B2 (en) | 2015-12-18 | 2024-04-30 | Cognoa, Inc. | Machine learning platform and system for data analysis |
CN105827603A (zh) * | 2016-03-14 | 2016-08-03 | 中国人民解放军信息工程大学 | 未明协议特征库建立方法、未明报文分类方法及相关装置 |
CN107516022A (zh) * | 2016-06-17 | 2017-12-26 | 北京光大隆泰科技有限责任公司 | 基于离散关联决策树的表型‑基因型的数据处理方法和系统 |
CN106202883A (zh) * | 2016-06-28 | 2016-12-07 | 成都中医药大学 | 一种基于大数据分析建立疾病云图的方法 |
US11030673B2 (en) * | 2016-07-28 | 2021-06-08 | International Business Machines Corporation | Using learned application flow to assist users in network business transaction based apps |
US11222270B2 (en) | 2016-07-28 | 2022-01-11 | International Business Machiness Corporation | Using learned application flow to predict outcomes and identify trouble spots in network business transactions |
RU2649792C2 (ru) * | 2016-09-09 | 2018-04-04 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система обучения алгоритма машинного обучения |
US10210283B2 (en) | 2016-09-28 | 2019-02-19 | International Business Machines Corporation | Accessibility detection and resolution |
CN106407711A (zh) * | 2016-10-10 | 2017-02-15 | 重庆科技学院 | 基于云数据的宠物喂养推荐方法及系统 |
CN106472332B (zh) * | 2016-10-10 | 2019-05-10 | 重庆科技学院 | 基于动态智能算法的宠物喂养方法及系统 |
CN110050092B (zh) * | 2016-12-08 | 2023-01-03 | 中国种子集团有限公司 | 水稻全基因组育种芯片及其应用 |
EP3340130A1 (en) * | 2016-12-23 | 2018-06-27 | Hexagon Technology Center GmbH | Method for prediction of soil and/or plant condition |
CN106709998A (zh) * | 2016-12-24 | 2017-05-24 | 郑州大学 | 一种农作物叶面属性数字化重建的自组织映射建模方法 |
US20190355473A1 (en) * | 2017-01-08 | 2019-11-21 | Henry M. Jackson Foundation For The Advancement Of Military Medicine | Systems and methods for using supervised learning to predict subject-specific pneumonia outcomes |
WO2018129413A1 (en) * | 2017-01-08 | 2018-07-12 | The Henry M. Jackson Foundation For The Advancement Of Military Medicine, Inc. | Systems and methods for using supervised learning to predict subject-specific bacteremia outcomes |
CN106803209B (zh) * | 2017-01-13 | 2020-09-18 | 浙江求是人工环境有限公司 | 实时数据库和先进控制算法的作物培育模式分析优化方法 |
CN106886792B (zh) * | 2017-01-22 | 2020-01-17 | 北京工业大学 | 一种基于分层机制构建多分类器融合模型的脑电情感识别方法 |
US20180239866A1 (en) * | 2017-02-21 | 2018-08-23 | International Business Machines Corporation | Prediction of genetic trait expression using data analytics |
CN108733966A (zh) * | 2017-04-14 | 2018-11-02 | 国网重庆市电力公司 | 一种基于决策树群的多维电能表现场状态检验方法 |
RU2672394C1 (ru) * | 2017-07-26 | 2018-11-14 | Общество С Ограниченной Ответственностью "Яндекс" | Способы и системы для оценки обучающих объектов посредством алгоритма машинного обучения |
US11263707B2 (en) | 2017-08-08 | 2022-03-01 | Indigo Ag, Inc. | Machine learning in agricultural planting, growing, and harvesting contexts |
CA3073713A1 (en) | 2017-08-25 | 2019-02-28 | The Board Of Trustees Of The University Of Illinois | Apparatus and method for agricultural data collection and agricultural operations |
CN107679368A (zh) * | 2017-09-11 | 2018-02-09 | 宁夏医科大学 | 基于遗传算法和变精度粗糙集的pet/ct高维特征级选择方法 |
CN107844602B (zh) * | 2017-11-24 | 2021-03-16 | 重庆邮电大学 | 一种基于时空属性关联规则的预测方法 |
US11574153B2 (en) * | 2017-12-01 | 2023-02-07 | Zymergen Inc. | Identifying organisms for production using unsupervised parameter learning for outlier detection |
CN108280289B (zh) * | 2018-01-22 | 2021-10-08 | 辽宁工程技术大学 | 基于局部加权c4.5算法的冲击地压危险等级预测方法 |
CN108307231B (zh) * | 2018-02-14 | 2021-01-08 | 南京邮电大学 | 基于遗传算法的网络视频流特征选择与分类方法 |
US20190325466A1 (en) | 2018-04-24 | 2019-10-24 | Indigo Ag, Inc. | Satellite-based agricultural modeling |
US11367093B2 (en) | 2018-04-24 | 2022-06-21 | Indigo Ag, Inc. | Satellite-based agricultural modeling |
US11531934B2 (en) * | 2018-05-31 | 2022-12-20 | Kyndryl, Inc. | Machine learning (ML) modeling by DNA computing |
CN109308936B (zh) * | 2018-08-24 | 2020-09-01 | 黑龙江省稻无疆农业科技有限责任公司 | 一种粮食作物产地的识别方法、识别装置及终端识别设备 |
CN109300502A (zh) * | 2018-10-10 | 2019-02-01 | 汕头大学医学院 | 一种从多组学数据中分析关联变化模式的系统和方法 |
CN109918708B (zh) * | 2019-01-21 | 2022-07-26 | 昆明理工大学 | 一种基于异质集成学习的材料性能预测模型构建方法 |
BR112021017998A2 (pt) | 2019-03-11 | 2021-11-16 | Pioneer Hi Bred Int | Métodos para a produção de plantas clonais |
CN113519028B (zh) * | 2019-03-11 | 2023-08-04 | 先锋国际良种公司 | 用于估算或预测基因型和表型的方法和组成 |
TWI759586B (zh) * | 2019-03-18 | 2022-04-01 | 崑山科技大學 | 農田澆灌建議方法 |
WO2020214699A1 (en) * | 2019-04-15 | 2020-10-22 | Sports Data Labs, Inc. | Animal data prediction system |
CN110119551B (zh) * | 2019-04-29 | 2022-12-06 | 西安电子科技大学 | 基于机器学习的盾构机刀具磨损退化关联特征分析方法 |
US10515715B1 (en) | 2019-06-25 | 2019-12-24 | Colgate-Palmolive Company | Systems and methods for evaluating compositions |
EP3997546A4 (en) * | 2019-07-08 | 2023-07-12 | Indigo AG, Inc. | CROP YIELD FORECAST MODELS |
CN110777214B (zh) * | 2019-07-11 | 2022-05-27 | 东北农业大学 | 与玉米种子耐储性紧密连锁的ssr标记及其在分子标记辅助育种中的应用 |
CN110334133B (zh) * | 2019-07-11 | 2020-11-20 | 北京京东智能城市大数据研究院 | 规则挖掘方法和装置、电子设备和计算机可读存储介质 |
US20210110298A1 (en) * | 2019-10-15 | 2021-04-15 | Kinaxis Inc. | Interactive machine learning |
US11526899B2 (en) | 2019-10-11 | 2022-12-13 | Kinaxis Inc. | Systems and methods for dynamic demand sensing |
US11886514B2 (en) | 2019-10-11 | 2024-01-30 | Kinaxis Inc. | Machine learning segmentation methods and systems |
CN111103157A (zh) * | 2019-11-26 | 2020-05-05 | 通鼎互联信息股份有限公司 | 一种基于生物启发频繁项集挖掘的工业设备状态监测方法 |
US11544593B2 (en) * | 2020-01-07 | 2023-01-03 | International Business Machines Corporation | Data analysis and rule generation for providing a recommendation |
US11176924B2 (en) | 2020-01-09 | 2021-11-16 | International Business Machines Corporation | Reduced miss rate in sound to text conversion using banach spaces |
US11669794B2 (en) * | 2020-04-06 | 2023-06-06 | Johnson Controls Tyco IP Holdings LLP | Building risk analysis system with geographic risk scoring |
CN111540408B (zh) * | 2020-05-12 | 2023-06-02 | 西藏自治区农牧科学院水产科学研究所 | 一种全基因组多态性ssr分子标记的筛选方法 |
CN111738138B (zh) * | 2020-06-19 | 2024-02-02 | 安徽大学 | 一种耦合气象特征区域尺度的小麦条绣病严重度遥感监测方法 |
CN111784071B (zh) * | 2020-07-14 | 2024-05-07 | 北京月新时代科技股份有限公司 | 一种基于Stacking集成的许可占用与预测方法及系统 |
CN111984646A (zh) * | 2020-08-12 | 2020-11-24 | 中国科学院昆明植物研究所 | 一种基于二叉树的植物数据存储、鉴定方法及系统 |
CN112182497B (zh) * | 2020-09-25 | 2021-04-27 | 齐鲁工业大学 | 一种基于生物序列的负序列模式的相似性分析方法、实现系统及介质 |
CN112446509B (zh) * | 2020-11-10 | 2023-05-26 | 中国电子科技集团公司第三十八研究所 | 一种复杂电子装备预测维护方法 |
WO2022157872A1 (ja) * | 2021-01-21 | 2022-07-28 | 日本電気株式会社 | 情報処理装置、特徴量選択方法、教師データ生成方法、推定モデル生成方法、ストレス度の推定方法、およびプログラム |
CN113053459A (zh) * | 2021-03-17 | 2021-06-29 | 扬州大学 | 一种基于贝叶斯模型整合亲本表型的杂交种预测方法 |
CN113381973B (zh) * | 2021-04-26 | 2023-02-28 | 深圳市任子行科技开发有限公司 | 一种识别ssr流量的方法、系统以及计算机可读存储介质 |
US11748384B2 (en) | 2021-05-28 | 2023-09-05 | International Business Machines Corporation | Determining an association rule |
CN113535694A (zh) * | 2021-06-18 | 2021-10-22 | 北方民族大学 | 一种基于Stacking框架的特征选择方法 |
WO2023034118A1 (en) | 2021-08-30 | 2023-03-09 | Indigo Ag, Inc. | Systems for management of location-aware market data |
CA3230474A1 (en) | 2021-08-31 | 2023-03-09 | Eleanor Elizabeth Campbell | Systems and methods for ecosystem credit recommendations |
CN114780599A (zh) * | 2022-04-06 | 2022-07-22 | 四川农业大学 | 基于小麦品比试验数据的综合分析系统 |
CN116189907B (zh) * | 2022-12-05 | 2023-09-05 | 广州盛安医学检验有限公司 | 一种适用于新生儿的遗传代谢病智能筛查系统 |
CN117461500B (zh) * | 2023-12-27 | 2024-04-02 | 北京市农林科学院智能装备技术研究中心 | 加速作物育种的植物工厂系统、方法、装置、设备及介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2547678A1 (en) | 1996-07-03 | 1998-01-04 | Cargill, Incorporated | Canola oil having increased oleic acid and decreased linolenic acid content |
US20030130991A1 (en) * | 2001-03-28 | 2003-07-10 | Fidel Reijerse | Knowledge discovery from data sets |
EP1449108A4 (en) | 2001-11-07 | 2006-11-22 | Health Discovery Corp | CLASSIFICATION OF CHARACTERISTICS PRETRATED FOR A SUPPORT VECTOR MACHINE |
RU2215406C2 (ru) | 2002-01-03 | 2003-11-10 | Государстенное научное учреждение РАСХН - Всероссийский научно-исследовательский институт масличных культур им. В.С. Пустовойта | Способ создания форм сои с измененным жирно-кислотным составом масла |
US20050144664A1 (en) | 2003-05-28 | 2005-06-30 | Pioneer Hi-Bred International, Inc. | Plant breeding method |
JP2008537821A (ja) * | 2005-03-31 | 2008-09-25 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 生体分子及び疾患の間の関係に関する証拠を収集するシステム及び方法 |
US7836004B2 (en) | 2006-12-11 | 2010-11-16 | International Business Machines Corporation | Using data mining algorithms including association rules and tree classifications to discover data rules |
CA2691156A1 (en) | 2007-06-20 | 2008-12-24 | International Flower Developments Proprietary Limited | Rose containing flavone and delphinidin, and method for production thereof |
-
2010
- 2010-06-03 WO PCT/US2010/037211 patent/WO2011008361A1/en active Application Filing
- 2010-06-03 CA CA2766914A patent/CA2766914C/en active Active
- 2010-06-03 RU RU2012103024A patent/RU2607999C2/ru not_active IP Right Cessation
- 2010-06-03 EP EP10728031.5A patent/EP2449510B2/en active Active
- 2010-06-03 CN CN201080029509.9A patent/CN102473247B/zh not_active Expired - Fee Related
- 2010-06-03 BR BRPI1015129A patent/BRPI1015129A2/pt not_active IP Right Cessation
- 2010-06-03 US US12/793,138 patent/US10102476B2/en active Active
- 2010-06-03 MX MX2011014020A patent/MX2011014020A/es unknown
- 2010-06-03 NZ NZ596478A patent/NZ596478A/en not_active IP Right Cessation
- 2010-06-03 AU AU2010274044A patent/AU2010274044B2/en not_active Ceased
- 2010-06-15 AR ARP100102116A patent/AR077103A1/es not_active Application Discontinuation
-
2011
- 2011-11-22 ZA ZA2011/08579A patent/ZA201108579B/en unknown
- 2011-12-28 CL CL2011003328A patent/CL2011003328A1/es unknown
-
2012
- 2012-01-20 CO CO12008137A patent/CO6430492A2/es active IP Right Grant
-
2015
- 2015-10-15 AU AU2015243031A patent/AU2015243031B2/en not_active Ceased
-
2016
- 2016-09-15 PH PH12016501806A patent/PH12016501806A1/en unknown
- 2016-11-24 AR ARP160103598A patent/AR107503A2/es unknown
Also Published As
Publication number | Publication date |
---|---|
CN102473247A (zh) | 2012-05-23 |
CO6430492A2 (es) | 2012-04-30 |
US10102476B2 (en) | 2018-10-16 |
AU2015243031A1 (en) | 2015-11-05 |
MX2011014020A (es) | 2012-02-28 |
BRPI1015129A2 (pt) | 2016-07-12 |
US20100332430A1 (en) | 2010-12-30 |
EP2449510A1 (en) | 2012-05-09 |
AU2010274044B2 (en) | 2015-08-13 |
AR107503A2 (es) | 2018-05-09 |
CA2766914C (en) | 2019-02-26 |
WO2011008361A1 (en) | 2011-01-20 |
CA2766914A1 (en) | 2011-01-20 |
EP2449510B2 (en) | 2022-12-21 |
NZ596478A (en) | 2014-04-30 |
RU2607999C2 (ru) | 2017-01-11 |
CL2011003328A1 (es) | 2012-08-31 |
PH12016501806A1 (en) | 2018-06-11 |
AR077103A1 (es) | 2011-08-03 |
ZA201108579B (en) | 2013-01-30 |
AU2010274044A1 (en) | 2012-01-19 |
CN102473247B (zh) | 2017-02-08 |
EP2449510B1 (en) | 2019-07-31 |
AU2015243031B2 (en) | 2016-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2012103024A (ru) | Применение способов машинного обучения для извлечения правил ассоциации в наборах данных растений и животных, содержащих в себе молекулярные генетические маркеры, сопровождаемое классификацией или прогнозированием с использованием признаков, созданных по этим правилам ассоциации | |
Vikram et al. | Unlocking the genetic diversity of Creole wheats | |
US20220301658A1 (en) | Machine learning driven gene discovery and gene editing in plants | |
Marra et al. | Genetic relationships, structure and parentage simulation among the olive tree (Olea europaea L. subsp. europaea) cultivated in Southern Italy revealed by SSR markers | |
El Bakkali et al. | Characterization of Worldwide Olive Germplasm Banks of Marrakech (Morocco) and Córdoba (Spain): Towards management and use of olive germplasm in breeding programs | |
Kaya et al. | Genome wide association study of 5 agronomic traits in olive (Olea europaea L.) | |
Beiki et al. | A new avenue for classification and prediction of olive cultivars using supervised and unsupervised algorithms | |
CN112232413A (zh) | 基于图神经网络与谱聚类的高维数据特征选择方法 | |
Fonseca et al. | Phylogeographic model selection using convolutional neural networks | |
Panahi et al. | Characterization of Iranian grapevine cultivars using machine learning models | |
Sant’Anna et al. | Genetic diversity associated with natural rubber quality in elite genotypes of the rubber tree | |
Torkzaban et al. | Machine learning based classification of microsatellite variation: an effective approach for phylogeographic characterization of olive populations | |
Diaz et al. | Lung cancer classification using genetic algorithm to optimize prediction models | |
de Bem Oliveira et al. | Research and partnership in studies of sugarcane using molecular markers: a scientometric approach | |
Yan et al. | Identification of new marker genes from plant single‐cell RNA‐seq data using interpretable machine learning methods | |
Zinati et al. | Mining transcriptome data to identify genes and pathways related to lemon taste using supervised and unsupervised data learning methods | |
Amundsen et al. | Species relationships in the genus Agrostis based on flow cytometry and MITE‐display molecular markers | |
Rathasamuth et al. | Selection of a Minimal Number of Significant Porcine SNPs by an Information Gain and Genetic Algorithm Hybrid Model | |
Nasiri et al. | Precision assessment of some supervised and unsupervised algorithms for genotype discrimination in the genus pisum using SSR molecular data | |
Gauthier et al. | Hybrids and phylogenetics revisited: a statistical test of hybridization using quartets | |
Hodel et al. | Linking genome signatures of selection and adaptation in non-model plants: exploring potential and limitations in the angiosperm Amborella | |
Stegmayer et al. | Neural network model for integration and visualization of introgressed genome and metabolite data | |
Vasantha et al. | Machine Learning-Based Breeding Values Prediction System (ML-BVPS) | |
CN108182347B (zh) | 一种大规模跨平台基因表达数据分类方法 | |
CN112102880A (zh) | 品种鉴定的方法、其预测模型的构建方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20190604 |