RU2017140973A - Способ и сервер для переобразования значения категориального фактора в его числовое представление и для создания разделяющего значения категориольного фактора - Google Patents
Способ и сервер для переобразования значения категориального фактора в его числовое представление и для создания разделяющего значения категориольного фактора Download PDFInfo
- Publication number
- RU2017140973A RU2017140973A RU2017140973A RU2017140973A RU2017140973A RU 2017140973 A RU2017140973 A RU 2017140973A RU 2017140973 A RU2017140973 A RU 2017140973A RU 2017140973 A RU2017140973 A RU 2017140973A RU 2017140973 A RU2017140973 A RU 2017140973A
- Authority
- RU
- Russia
- Prior art keywords
- value
- learning
- decision tree
- objects
- server
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 34
- 230000001131 transforming effect Effects 0.000 title 1
- 238000003066 decision tree Methods 0.000 claims 45
- 238000010801 machine learning Methods 0.000 claims 8
- 230000002123 temporal effect Effects 0.000 claims 8
- 230000008520 organization Effects 0.000 claims 6
- 238000004364 calculation method Methods 0.000 claims 4
- 238000000926 separation method Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9027—Trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/045—Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Claims (77)
1. Способ преобразования в числовое представление значения категориального фактора, который связан с обучающим объектом для обучения алгоритма машинного обучения (MLA), причем MLA использует модель, основанную на дерева решений, обладающую деревом решений, причем обучающий объект обрабатывается на узле данного уровня дерева решений, причем дерево решений обладает по меньшей мере одним предыдущим уровнем дерева решений, причем на по меньшей мере одном предыдущем уровне значение по меньшей мере одного категориального фактора - преобразовано в свое предыдущее числовое представление для по меньшей мере одного предыдущего уровня дерева решений,
причем алгоритм машинного обучения выполняется электронным устройством для прогнозирования объекта фазы использования, способ включает в себя
получение доступа со стороны постоянного машиночитаемого носителя системы машинного обучения к набору обучающих объектов,
причем каждый обучающий объект из набора обучающих объектов содержит документ и индикатор события, связанный с документом, причем каждый документ связан с категориальным фактором;
создание числового представления для значения категориального фактора путем:
извлечения предыдущего числового представления по меньшей мере одного значения категориального фактора для данного объекта из набора обучающих объектов на по меньшей мере одном предыдущем уровне дерева решений;
создания, для каждой комбинации из по меньшей мере одного предыдущего значения категориального фактора на по меньшей мере одном предыдущем уровне дерева решений и по меньшей мере некоторых значений категориальных факторов из набора обучающих объектов, текущего числового представления для данного уровня дерева решений,
создание осуществляется в процессе создания дерева решений.
2. Способ по п. 1, в котором набор обучающих объектов организован в упорядоченный список таким образом, что
для каждого обучающего объекта в упорядоченном списке обучающих объектов существует по меньшей мере одно из
(i) предыдущий обучающий объект, который находится до данного обучающего объекта и
(ii) последующий обучающий объект, который находится после данного обучающего объекта, и при этом
по меньшей мере некоторые из значений категориальных факторов являются значениями категориальных факторов, которые связаны с обучающими объектами, находящимися раньше в упорядоченном списке обучающих объектов.
3. Способ по п. 1, в котором создание выполняется только для тех предыдущих значений категориальных факторов, которые были созданы по меньшей мере на одном предыдущем уровне дерева решений.
4. Способ по п. 1, в котором создание выполняется только для тех предыдущих значений категориальных факторов, которые были созданы по меньшей мере на одном предыдущем уровне дерева решений и по меньшей мере на предыдущей итерации дерева решений.
5. Способ по п. 1, в котором индикатор события обладает заранее определенным значением, и это заранее определенное значение является одним из положительного результата или отрицательного результата.
6. Способ по п. 2, который далее включает в себя организацию набора обучающих объектов в упорядоченный список обучающих объектов.
7. Способ по п. 6, в котором организация набора обучающих объектов в упорядоченный список обучающих объектов выполняется в момент времени до создания числового значения.
8. Способ по п. 6, в котором организация набора обучающих объектов в упорядоченный список обучающих объектов включает в себя организацию множества наборов упорядоченных списков, и в котором способ далее включает в себя, до этапа создания числового значения, выбор одного из множества наборов упорядоченного списка.
9. Способ по п. 6, в котором обучающие объекты связаны с присущим им временным порядком, и причем организация набора обучающих объектов в упорядоченный список обучающих объектов включает в себя организацию обучающих объектов в соответствии с временным порядком.
10. Способ по п. 6, в котором обучающие объекты не связаны с присущим им временным порядком, и причем организация набора обучающих объектов в упорядоченный список обучающих объектов включает в себя организацию обучающих объектов в соответствии с заранее определенным правилом.
11. Способ по п. 6, в котором обучающие объекты не связаны с присущим им временным порядком, и причем организация набора обучающих объектов в упорядоченный список обучающих объектов включает в себя создание случайного порядка обучающих объектов, который будет использован в качестве упорядоченного списка.
12. Сервер выполнен с возможностью выполнять алгоритм машинного обучения, который основан на прогностической модели дерева решений на основе дерева решений, причем дерево решений выполнено с возможностью обрабатывать значение категориального фактора путем преобразования его в его числовое представление, причем категориальный фактор связан с обучающим объектом, используемым для обучения алгоритма машинного обучения, причем обучающий объект обрабатывается в узле данного уровня дерева решений, причем дерево решений обладает по меньшей мере одним предыдущим уровнем дерева решений, причем на по меньшей мере одном предыдущем уровне значение по меньшей мере одного категориального фактора - преобразовано в свое предыдущее числовое представление для по меньшей мере одного предыдущего уровня дерева решений, сервер включающий в себя
постоянный носитель компьютерной информации;
процессор, связанный постоянным машиночитаемым носителем, процессор выполнен с возможностью осуществлять:
получение доступа со стороны постоянного машиночитаемого носителя системы машинного обучения к набору обучающих объектов,
причем каждый обучающий объект из набора обучающих объектов содержит документ и индикатор события, связанный с документом, причем каждый документ связан с категориальным фактором;
создание числового представления для значения категориального фактора путем:
извлечения предыдущего числового представления по меньшей мере одного значения категориального фактора для данного объекта из набора обучающих объектов на по меньшей мере одном предыдущем уровне дерева решений;
создания, для каждой комбинации из по меньшей мере одного предыдущего значения категориального фактора на по меньшей мере одном предыдущем уровне дерева решений и по меньшей мере некоторых значений категориальных факторов из набора обучающих объектов, текущего числового представления для данного уровня дерева решений,
создание осуществляется в процессе создания дерева решений.
13. Сервер по п. 12, в котором набор обучающих объектов организован в упорядоченный список таким образом, что
для каждого обучающего объекта в упорядоченном списке обучающих объектов существует по меньшей мере одно из
(i) предыдущий обучающий объект, который находится до данного обучающего объекта и
(ii) последующий обучающий объект, который находится после данного обучающего объекта, и при этом
по меньшей мере некоторые из значений категориальных факторов являются значениями категориальных факторов, которые связаны с обучающими объектами, находящимися раньше в упорядоченном списке обучающих объектов.
14. Сервер по п. 12, в котором для создания числового представления значений категориальных факторов, процессор выполнен с возможностью выполнять создание только для тех предыдущих значений категориальных факторов, которые были созданы по меньшей мере на одном предыдущем уровне дерева решений.
15. Сервер по п. 13, в котором для создания числового представления значения категориальных факторов, процессор выполнен с возможностью выполнять создание только для тех предыдущих значений категориальных факторов, которые были созданы по меньшей мере на одном предыдущем уровне дерева решений и по меньшей мере на предыдущей итерации дерева решений.
16. Сервер по п. 12, в котором индикатор события обладает заранее определенным значением, и это заранее определенное значение является одним из положительного результата или отрицательного результата.
17. Сервер по п. 13, в котором процессор выполнен с возможностью осуществлять организацию набора обучающих объектов в упорядоченный список обучающих объектов.
18. Сервер по п. 17, в котором для организации обучающих объектов в упорядоченный список обучающих объектов, процессор выполнен с возможностью осуществлять организацию набора обучающих объектов в упорядоченный список обучающих объектов в момент времени до создания числового значения.
19. Сервер по п. 17, в котором для организации обучающих объектов в упорядоченный список обучающих объектов, процессор выполнен с возможностью осуществлять организацию множества из набора упорядоченных списков, и в котором способ далее включает в себя, до создания числового значения, выбор данного одного из набора упорядоченного списка.
20. Сервер по п. 17, в котором обучающие объекты связаны с присущим им временным порядком, и в котором для организации набора обучающих объектов в упорядоченный список, процессор выполнен с возможностью осуществлять организацию набора обучающих объектов в соответствии с временным порядком.
21. Сервер по п. 17, в котором обучающие объекты не связаны с присущим им временным порядком, и в котором для организации набора обучающих объектов в упорядоченный список, процессор выполнен с возможностью осуществлять организацию набора обучающих объектов в соответствии с заранее определенным правилом.
22. Сервер по п. 17, в котором обучающие объекты не связаны с присущим им временным порядком, и в котором для организации набора обучающих объектов в упорядоченный список обучающих объектов процессор выполнен с возможностью осуществлять создание случайного порядка обучающих объектов, который будет использован в качестве упорядоченного списка.
23. Способ создания разделяющего значения для узла дерева решений в модели дерева решений, используемой алгоритмом машинного обучения (MLA), причем разделяющее значение относится к узлу на конкретном уровне дерева решений, причем узел предназначен для классификации объекта, обладающего значением категориального фактора, которое необходимо преобразовать в представляющее его числовое значение, причем разделение позволяет классифицировать объект в один из дочерних узлов на основе числового значения и разделяющего значения, причем алгоритм машинного обучения выполняется электронным устройством для прогнозирования значения для объекта фазы использования, способ включающий в себя
создание диапазона всех возможных значений категориальных факторов;
применение сетки к диапазону для разделения диапазона на области, каждая область обладает границей;
использование границы как разделяющего значения;
этапы создания и применения выполняются до того, как значение категориального фактора было преобразовано в его числовое представление.
24. Способ по п. 21, в котором сетка обладает заранее определенным форматом.
25. Способ по п. 22, в котором сетка представляет собой сетку с постоянным интервалом.
26. Способ по п. 22, в котором сетка представляет собой сетку с непостоянным интервалом.
27. Способ по п. 21, в котором диапазон находится между нулем и единицей.
28. Способ по п. 21, в котором числовые представления значений категориальных факторов вычисляются с помощью Rconstant, и в котором диапазон находится между Rconstant и 1+(Rconstant).
29. Способ по п. 21, в котором способ далее включает в себя, во время фазы использования, для данного значения счетчика, представляющего категориальный фактор, определение того, в какую часть, определенную сеткой, попадает данное значение счетчика, и использование соответствующих границ как значений для разделения.
30. Способ по п. 21, в котором использование границы как разделяющего значения выполняется для каждого уровня дерева решений, и причем способ далее включает в себя, после обучения данного уровня дерева решений, новое вычисление разделяющего значения.
31. Способ по п. 21, в котором использование границы как разделяющего значения выполняется для каждого дерева решений, и причем способ далее включает в себя, после обучения данного дерева решений, новое вычисление разделяющего значения.
32. Способ по п. 21, в котором использование границы как разделяющего значения выполняется во время этапа обучения MLA, и в котором обучение MLA во время текущей итерации одного из: (i) данного уровня дерева решения (ii) данной итерации дерева решений - включает в себя:
выбор лучшего значения, которое будет установлено на данной итерации, и лучшего значения разделяющего значения, связанного с ним.
33. Сервер выполнен с возможностью выполнять MLA, причем MLA основан на дереве решений, относящегося к модели дерева решений, причем дерево решений обладает узлом с разделяющим значением, причем узел представляет собой данный уровень дерева решений и предназначен для классификации объекта, обладающего категориальным фактором, который необходимо преобразовать в представляющее его числовое значение, причем разделение позволяет классифицировать объект в один из дочерних узлов на основе числового значения и разделяющего значения, сервер, включающий в себя
постоянный носитель компьютерной информации;
процессор, связанный постоянным машиночитаемым носителем, процессор выполнен с возможностью осуществлять:
создание диапазона всех возможных значений категориальных факторов;
применение сетки к диапазону для разделения диапазона на области, каждая область обладает границей;
использование границы как разделяющего значения;
этапы создания и применения выполняются до того, как категориальный фактор был преобразован в свое числовое представление.
34. Сервер по п. 31, в котором сетка обладает заранее определенным форматом.
35. Сервер по п. 32, в котором сетка представляет собой сетку с постоянным интервалом.
36. Сервер по п. 32, в котором сетка представляет собой сетку с непостоянным интервалом.
37. Сервер по п. 31, в котором диапазон находится между нулем и единицей.
38. Сервер по п. 31, в котором числовое представление значений категориальных факторов вычисляется с помощью Rconstant, и в котором диапазон находится между Rconstant и 1+(Rconstant).
39. Сервер по п. 31, в котором процессор далее выполнен с возможностью, во время фазы использования, способ далее включает в себя, во время фазы использования, для данного значения счетчика, представляющего собой категориальный фактор, осуществлять определение того, в какую часть, определенную сеткой, попадает данное значение счетчика, и использование соответствующих границ как значений для разделения.
40. Сервер по п. 31, в котором для использования границы как разделяющего значения, процессор выполнен с возможностью использовать границу как разделяющее значение для каждого уровня дерева решений, и причем процессор далее выполнен с возможностью, после обучения данного уровня дерева решений, осуществлять новое вычисление разделяющего значения.
41. Сервер по п. 31, в котором использование границы как разделяющего значения выполняется для каждой итерации дерева решений, и причем способ далее включает в себя, после обучения данной итерации дерева решений, новое вычисление разделяющего значения.
42. Сервер по п. 31, в котором для использования границы как разделяющего значения, процессор выполнен с возможностью осуществлять использование границы как разделяющего значения во время фазы обучения MLA, и в котором для обучения MLA во время текущей итерации одного из: (i) данного уровня решения (ii) данной итерации дерева решений - процессор далее выполнен с возможностью осуществлять
выбор лучшего значения, которое будет установлено на данной итерации и лучшего значения разделяющего значения, связанного с ним.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2017140973A RU2692048C2 (ru) | 2017-11-24 | 2017-11-24 | Способ и сервер для преобразования значения категориального фактора в его числовое представление и для создания разделяющего значения категориального фактора |
US16/000,977 US11995519B2 (en) | 2017-11-24 | 2018-06-06 | Method of and server for converting categorical feature value into a numeric representation thereof and for generating a split value for the categorical feature |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2017140973A RU2692048C2 (ru) | 2017-11-24 | 2017-11-24 | Способ и сервер для преобразования значения категориального фактора в его числовое представление и для создания разделяющего значения категориального фактора |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2017140973A true RU2017140973A (ru) | 2019-05-24 |
RU2017140973A3 RU2017140973A3 (ru) | 2019-05-24 |
RU2692048C2 RU2692048C2 (ru) | 2019-06-19 |
Family
ID=66633311
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2017140973A RU2692048C2 (ru) | 2017-11-24 | 2017-11-24 | Способ и сервер для преобразования значения категориального фактора в его числовое представление и для создания разделяющего значения категориального фактора |
Country Status (2)
Country | Link |
---|---|
US (1) | US11995519B2 (ru) |
RU (1) | RU2692048C2 (ru) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11016983B2 (en) * | 2018-08-23 | 2021-05-25 | Microsoft Technology Licensing, Llc | Entity-level search models with tree interaction features |
US11568317B2 (en) * | 2020-05-21 | 2023-01-31 | Paypal, Inc. | Enhanced gradient boosting tree for risk and fraud modeling |
CN114202350A (zh) * | 2020-08-31 | 2022-03-18 | 中移动信息技术有限公司 | 用户消费行为分类方法、装置、设备及计算机存储介质 |
US20220129795A1 (en) * | 2020-10-23 | 2022-04-28 | Larsen & Toubro Infotech Ltd | Systems and methods for cognitive information mining |
Family Cites Families (122)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5652829A (en) | 1994-07-26 | 1997-07-29 | International Business Machines Corporation | Feature merit generator |
US5978497A (en) | 1994-09-20 | 1999-11-02 | Neopath, Inc. | Apparatus for the identification of free-lying cells |
US6115802A (en) | 1995-10-13 | 2000-09-05 | Sun Mircrosystems, Inc. | Efficient hash table for use in multi-threaded environments |
US5657424A (en) * | 1995-10-31 | 1997-08-12 | Dictaphone Corporation | Isolated word recognition using decision tree classifiers and time-indexed feature vectors |
US6360220B1 (en) | 1998-08-04 | 2002-03-19 | Microsoft Corporation | Lock-free methods and systems for accessing and storing information in an indexed computer data structure having modifiable entries |
US6247016B1 (en) * | 1998-08-24 | 2001-06-12 | Lucent Technologies, Inc. | Decision tree classifier with integrated building and pruning phases |
US6279004B1 (en) | 1998-12-22 | 2001-08-21 | International Business Machines Corporation | Database index key versioning |
US6523015B1 (en) | 1999-10-14 | 2003-02-18 | Kxen | Robust modeling |
CN1241135C (zh) | 1999-10-21 | 2006-02-08 | 国际商业机器公司 | 用于排序分类属性以更好地可视化多维数据的系统和方法 |
US7113932B2 (en) * | 2001-02-07 | 2006-09-26 | Mci, Llc | Artificial intelligence trending system |
US20020143787A1 (en) | 2001-03-31 | 2002-10-03 | Simon Knee | Fast classless inter-domain routing (CIDR) lookups |
US20030030637A1 (en) | 2001-04-20 | 2003-02-13 | Grinstein Georges G. | Method and system for data analysis |
US20030014405A1 (en) | 2001-07-09 | 2003-01-16 | Jacob Shapiro | Search engine designed for handling long queries |
US6871201B2 (en) | 2001-07-31 | 2005-03-22 | International Business Machines Corporation | Method for building space-splitting decision tree |
US6748401B2 (en) | 2001-10-11 | 2004-06-08 | International Business Machines Corporation | Method and system for dynamically managing hash pool data structures |
JP3791908B2 (ja) | 2002-02-22 | 2006-06-28 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 検索システム、システム、検索方法およびプログラム |
US7451065B2 (en) | 2002-03-11 | 2008-11-11 | International Business Machines Corporation | Method for constructing segmentation-based predictive models |
JP2005523533A (ja) | 2002-04-19 | 2005-08-04 | コンピュータ アソシエイツ シンク,インコーポレイテッド | 混合型数字及び/又は非数字データの処理 |
US7272590B2 (en) | 2002-04-26 | 2007-09-18 | International Business Machines Corporation | System and method for determining numerical representations for categorical data fields |
US7349917B2 (en) * | 2002-10-01 | 2008-03-25 | Hewlett-Packard Development Company, L.P. | Hierarchical categorization method and system with automatic local selection of classifiers |
US7020593B2 (en) * | 2002-12-04 | 2006-03-28 | International Business Machines Corporation | Method for ensemble predictive modeling by multiplicative adjustment of class probability: APM (adjusted probability model) |
US7606714B2 (en) * | 2003-02-11 | 2009-10-20 | Microsoft Corporation | Natural language classification within an automated response system |
US7197497B2 (en) | 2003-04-25 | 2007-03-27 | Overture Services, Inc. | Method and apparatus for machine learning a document relevance function |
US8136025B1 (en) | 2003-07-03 | 2012-03-13 | Google Inc. | Assigning document identification tags |
US7409587B2 (en) | 2004-08-24 | 2008-08-05 | Symantec Operating Corporation | Recovering from storage transaction failures using checkpoints |
US7702628B1 (en) | 2003-09-29 | 2010-04-20 | Sun Microsystems, Inc. | Implementing a fully dynamic lock-free hash table without dummy nodes |
US6988180B2 (en) | 2003-09-29 | 2006-01-17 | Microsoft Corporation | Method and apparatus for lock-free, non-blocking hash table |
US7287012B2 (en) | 2004-01-09 | 2007-10-23 | Microsoft Corporation | Machine-learned approach to determining document relevance for search over large electronic collections of documents |
US20060026138A1 (en) | 2004-01-09 | 2006-02-02 | Gavin Robertson | Real-time indexes |
CA2938561C (en) * | 2004-02-27 | 2019-09-03 | Accenture Global Services Limited | System for individualized customer interaction |
US7349926B2 (en) | 2004-03-30 | 2008-03-25 | International Business Machines Corporation | Atomic renaming and moving of data files while permitting lock-free look-ups |
US7574409B2 (en) | 2004-11-04 | 2009-08-11 | Vericept Corporation | Method, apparatus, and system for clustering and classification |
US20060112121A1 (en) | 2004-11-23 | 2006-05-25 | Mckenney Paul E | Atomically moving list elements between lists using read-copy update |
US7613701B2 (en) | 2004-12-22 | 2009-11-03 | International Business Machines Corporation | Matching of complex nested objects by multilevel hashing |
WO2006072011A2 (en) | 2004-12-30 | 2006-07-06 | Proventys, Inc. | Methods, systems, and computer program products for developing and using predictive models for predicting a plurality of medical outcomes, for evaluating intervention strategies, and for simultaneously validating biomarker causality |
US7451166B2 (en) | 2005-01-13 | 2008-11-11 | International Business Machines Corporation | System and method for maintaining checkpoints of a keyed data structure using a sequential log |
US7328218B2 (en) | 2005-03-22 | 2008-02-05 | Salford Systems | Constrained tree structure method and system |
US20070005646A1 (en) | 2005-06-30 | 2007-01-04 | Microsoft Corporation | Analysis of topic dynamics of web search |
US7930353B2 (en) | 2005-07-29 | 2011-04-19 | Microsoft Corporation | Trees of classifiers for detecting email spam |
US7673233B2 (en) | 2005-09-08 | 2010-03-02 | Microsoft Corporation | Browser tab management |
US8341158B2 (en) | 2005-11-21 | 2012-12-25 | Sony Corporation | User's preference prediction from collective rating data |
US20070208730A1 (en) | 2006-03-02 | 2007-09-06 | Microsoft Corporation | Mining web search user behavior to enhance web search relevance |
US7949186B2 (en) | 2006-03-15 | 2011-05-24 | Massachusetts Institute Of Technology | Pyramid match kernel and related techniques |
WO2007117423A2 (en) | 2006-03-31 | 2007-10-18 | Cira Discovery Sciences, Inc. | Method and apparatus for representing multidimensional data |
US20070244747A1 (en) | 2006-04-14 | 2007-10-18 | Nikovski Daniel N | Method and system for recommending products to consumers by induction of decision trees |
US8694318B2 (en) | 2006-09-19 | 2014-04-08 | At&T Intellectual Property I, L. P. | Methods, systems, and products for indexing content |
US7801836B2 (en) | 2006-09-27 | 2010-09-21 | Infosys Technologies Ltd. | Automated predictive data mining model selection using a genetic algorithm |
US8661029B1 (en) | 2006-11-02 | 2014-02-25 | Google Inc. | Modifying search result ranking based on implicit user feedback |
US7668851B2 (en) | 2006-11-29 | 2010-02-23 | International Business Machines Corporation | Lockless hash table lookups while performing key update on hash table element |
US8250075B2 (en) | 2006-12-22 | 2012-08-21 | Palo Alto Research Center Incorporated | System and method for generation of computer index files |
US7743003B1 (en) | 2007-05-16 | 2010-06-22 | Google Inc. | Scaling machine learning using approximate counting that uses feature hashing |
FR2917259B1 (fr) | 2007-06-08 | 2009-08-21 | Alcatel Lucent Sas | Utilisation d'un arbre de hachage a prefixes (pht) pour la localisation des services au sein d'un reseau de communication poste-a-poste |
US8287639B2 (en) | 2007-07-31 | 2012-10-16 | Cognis Ip Management Gmbh | Methods and compositions for improving air entrainment in cementitious mixtures |
US7916728B1 (en) | 2007-09-28 | 2011-03-29 | F5 Networks, Inc. | Lockless atomic table update |
NO327653B1 (no) | 2007-12-20 | 2009-09-07 | Fast Search & Transfer As | Fremgangsmate for dynamisk oppdatering av en indeks og en sokemotor som implementerer samme |
US20090182723A1 (en) | 2008-01-10 | 2009-07-16 | Microsoft Corporation | Ranking search results using author extraction |
US8584233B1 (en) | 2008-05-05 | 2013-11-12 | Trend Micro Inc. | Providing malware-free web content to end users using dynamic templates |
US20090319481A1 (en) | 2008-06-18 | 2009-12-24 | Yahoo! Inc. | Framework for aggregating information of web pages from a website |
US8972410B2 (en) | 2008-07-30 | 2015-03-03 | Hewlett-Packard Development Company, L.P. | Identifying related objects in a computer database |
US8965881B2 (en) | 2008-08-15 | 2015-02-24 | Athena A. Smyros | Systems and methods for searching an index |
US8738436B2 (en) | 2008-09-30 | 2014-05-27 | Yahoo! Inc. | Click through rate prediction system and method |
NZ572036A (en) | 2008-10-15 | 2010-03-26 | Nikola Kirilov Kasabov | Data analysis and predictive systems and related methodologies |
US8190537B1 (en) | 2008-10-31 | 2012-05-29 | Google Inc. | Feature selection for large scale models |
US20100161385A1 (en) | 2008-12-19 | 2010-06-24 | Nxn Tech, Llc | Method and System for Content Based Demographics Prediction for Websites |
US8572071B2 (en) * | 2008-12-19 | 2013-10-29 | Rutgers, The State University Of New Jersey | Systems and methods for data transformation using higher order learning |
US8150723B2 (en) | 2009-01-09 | 2012-04-03 | Yahoo! Inc. | Large-scale behavioral targeting for advertising over a network |
US8537832B2 (en) | 2010-03-12 | 2013-09-17 | Lsi Corporation | Exception detection and thread rescheduling in a multi-core, multi-thread network processor |
US8935483B2 (en) | 2009-04-27 | 2015-01-13 | Lsi Corporation | Concurrent, coherent cache access for multiple threads in a multi-core, multi-thread network processor |
US8032551B2 (en) | 2009-05-11 | 2011-10-04 | Red Hat, Inc. | Searching documents for successive hashed keywords |
US8032550B2 (en) | 2009-05-11 | 2011-10-04 | Red Hat, Inc. | Federated document search by keywords |
US8396287B2 (en) | 2009-05-15 | 2013-03-12 | Google Inc. | Landmarks from digital photo collections |
US8611592B2 (en) | 2009-08-26 | 2013-12-17 | Apple Inc. | Landmark identification using metadata |
US10528972B2 (en) | 2009-08-27 | 2020-01-07 | Micro Focus Llc | Predicting email responses |
US20110153611A1 (en) | 2009-12-22 | 2011-06-23 | Anil Babu Ankisettipalli | Extracting data from a report document |
US20110188715A1 (en) | 2010-02-01 | 2011-08-04 | Microsoft Corporation | Automatic Identification of Image Features |
US8738608B2 (en) | 2010-04-06 | 2014-05-27 | Justone Database, Inc. | Apparatus, systems and methods for data storage and/or retrieval based on a database model-agnostic, schema-agnostic and workload-agnostic data storage and access models |
US8370337B2 (en) | 2010-04-19 | 2013-02-05 | Microsoft Corporation | Ranking search results using click-based data |
US8510236B1 (en) | 2010-05-07 | 2013-08-13 | Google Inc. | Semi-supervised and unsupervised generation of hash functions |
US8521664B1 (en) | 2010-05-14 | 2013-08-27 | Google Inc. | Predictive analytical model matching |
US8438122B1 (en) | 2010-05-14 | 2013-05-07 | Google Inc. | Predictive analytic modeling platform |
US8473431B1 (en) | 2010-05-14 | 2013-06-25 | Google Inc. | Predictive analytic modeling platform |
US8543517B2 (en) | 2010-06-09 | 2013-09-24 | Microsoft Corporation | Distributed decision tree training |
US20120079212A1 (en) | 2010-09-23 | 2012-03-29 | International Business Machines Corporation | Architecture for sharing caches among multiple processes |
US8949158B2 (en) | 2010-10-25 | 2015-02-03 | Intelius Inc. | Cost-sensitive alternating decision trees for record linkage |
US8543586B2 (en) | 2010-11-24 | 2013-09-24 | International Business Machines Corporation | Determining points of interest using intelligent agents and semantic data |
US8595154B2 (en) | 2011-01-26 | 2013-11-26 | Google Inc. | Dynamic predictive modeling platform |
US8533222B2 (en) | 2011-01-26 | 2013-09-10 | Google Inc. | Updateable predictive analytical modeling |
US8924365B2 (en) | 2011-02-08 | 2014-12-30 | Wavemarket, Inc. | System and method for range search over distributive storage systems |
BR112013022900A2 (pt) | 2011-03-11 | 2017-11-14 | Koninklijke Philips Nv | aparelho, método e programa de computador de monitoramento para monitorar sinais fisiológicos |
US8533224B2 (en) | 2011-05-04 | 2013-09-10 | Google Inc. | Assessing accuracy of trained predictive models |
US9038172B2 (en) | 2011-05-06 | 2015-05-19 | The Penn State Research Foundation | Robust anomaly detection and regularized domain adaptation of classifiers with application to internet packet-flows |
US20120316981A1 (en) | 2011-06-08 | 2012-12-13 | Accenture Global Services Limited | High-risk procurement analytics and scoring system |
US8868472B1 (en) | 2011-06-15 | 2014-10-21 | Google Inc. | Confidence scoring in predictive modeling |
US8909564B1 (en) | 2011-06-21 | 2014-12-09 | Google Inc. | Predictive model evaluation and training based on utility |
US8762299B1 (en) | 2011-06-27 | 2014-06-24 | Google Inc. | Customized predictive analytical model training |
EP2724269B1 (en) | 2011-06-27 | 2020-02-19 | Jethrodata Ltd. | System, method and data structure for fast loading, storing and access to huge data sets in real time |
US8489632B1 (en) | 2011-06-28 | 2013-07-16 | Google Inc. | Predictive model training management |
US8843427B1 (en) | 2011-07-01 | 2014-09-23 | Google Inc. | Predictive modeling accuracy |
US20130117684A1 (en) | 2011-11-03 | 2013-05-09 | Microsoft Corporation | Dynamically generated icons for graphical user interface on client |
US9355095B2 (en) | 2011-12-30 | 2016-05-31 | Microsoft Technology Licensing, Llc | Click noise characterization model |
RU2491622C1 (ru) | 2012-01-25 | 2013-08-27 | Общество С Ограниченной Ответственностью "Центр Инноваций Натальи Касперской" | Способ классификации документов по категориям |
US8965829B2 (en) | 2012-02-09 | 2015-02-24 | Jeffrey L. Pattillo | System and method for making decisions using network-guided decision trees with multivariate splits |
US8655029B2 (en) | 2012-04-10 | 2014-02-18 | Seiko Epson Corporation | Hash-based face recognition system |
US8694444B2 (en) | 2012-04-20 | 2014-04-08 | Xerox Corporation | Learning multiple tasks with boosted decision trees |
US9955965B2 (en) | 2012-07-09 | 2018-05-01 | Covidien Lp | Switch block control assembly of a medical device |
JP5943762B2 (ja) | 2012-07-30 | 2016-07-05 | キヤノン株式会社 | シート搬送装置及び画像形成装置 |
WO2014056093A1 (en) | 2012-10-11 | 2014-04-17 | Orboros, Inc. | Method and system for visualizing complex data via a multi-agent query engine |
US9373087B2 (en) | 2012-10-25 | 2016-06-21 | Microsoft Technology Licensing, Llc | Decision tree training in machine learning |
US8880446B2 (en) | 2012-11-15 | 2014-11-04 | Purepredictive, Inc. | Predictive analytics factory |
US10262330B2 (en) * | 2013-01-04 | 2019-04-16 | PlaceIQ, Inc. | Location-based analytic platform and methods |
US20140195972A1 (en) | 2013-01-07 | 2014-07-10 | Electronics And Telecommunications Research Institute | Method and apparatus for managing programs or icons |
KR101822463B1 (ko) | 2013-01-21 | 2018-01-26 | 삼성전자주식회사 | 복수 개의 아이콘들을 화면상에 배치하는 장치 및 이의 운용 방법 |
US9324040B2 (en) * | 2013-01-30 | 2016-04-26 | Technion Research & Development Foundation Limited | Training ensembles of randomized decision trees |
US9547830B2 (en) | 2013-05-07 | 2017-01-17 | Wise.Io, Inc. | Scalable, memory-efficient machine learning and prediction for ensembles of decision trees for homogeneous and heterogeneous datasets |
US9633311B2 (en) | 2013-07-03 | 2017-04-25 | Sas Institute Inc. | Decision tree learning |
US9639807B2 (en) | 2014-06-10 | 2017-05-02 | Jose Oriol Lopez Berengueres | Method and system for forecasting future events |
US9886670B2 (en) | 2014-06-30 | 2018-02-06 | Amazon Technologies, Inc. | Feature processing recipes for machine learning |
US10339465B2 (en) | 2014-06-30 | 2019-07-02 | Amazon Technologies, Inc. | Optimized decision tree based models |
US9348920B1 (en) | 2014-12-22 | 2016-05-24 | Palantir Technologies Inc. | Concept indexing among database of documents using machine learning techniques |
RU2632133C2 (ru) | 2015-09-29 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ (варианты) и система (варианты) создания модели прогнозирования и определения точности модели прогнозирования |
RU2015141339A (ru) | 2015-09-29 | 2017-04-04 | Общество С Ограниченной Ответственностью "Яндекс" | Способ (варианты) и система (варианты) создания модели прогнозирования и определения точности модели прогнозирования |
US10380127B2 (en) * | 2017-02-13 | 2019-08-13 | Microsoft Technology Licensing, Llc | Candidate search result generation |
-
2017
- 2017-11-24 RU RU2017140973A patent/RU2692048C2/ru active
-
2018
- 2018-06-06 US US16/000,977 patent/US11995519B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
RU2692048C2 (ru) | 2019-06-19 |
RU2017140973A3 (ru) | 2019-05-24 |
US20190164085A1 (en) | 2019-05-30 |
US11995519B2 (en) | 2024-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2017140973A (ru) | Способ и сервер для переобразования значения категориального фактора в его числовое представление и для создания разделяющего значения категориольного фактора | |
RU2017140969A (ru) | Способ и система создания параметра качества прогноза для прогностической модели, выполняемой в алгоритме машинного обучения | |
RU2017140974A (ru) | Способ и сервер преобразования значения категориального фактора в его числовое представление | |
CN104536953B (zh) | 一种文本情绪极性的识别方法及装置 | |
US20180018391A1 (en) | Data classification device, data classification method, and non-transitory computer readable storage medium | |
RU2015141340A (ru) | Способ (варианты) и система (варианты) создания модели прогнозирования и определения точности модели прогнозирования | |
JP5738358B2 (ja) | 移動パターンマイニング装置及び方法 | |
CN108133279B (zh) | 风电功率概率预测方法、存储介质及设备 | |
US20180075324A1 (en) | Information processing apparatus, information processing method, and computer readable storage medium | |
CN111147459A (zh) | 一种基于dns请求数据的c&c域名检测方法及装置 | |
CN105608075A (zh) | 一种相关知识点的获取方法及系统 | |
JP2008077403A5 (ru) | ||
CN113360350B (zh) | 定位网络设备根因告警的方法、装置、设备和存储介质 | |
CN109978624A (zh) | 信息处理方法、电子设备及计算机可读存储介质 | |
Szénási et al. | Clustering algorithm in order to find accident black spots identified by GPS coordinates | |
JP2021507398A5 (ru) | ||
Choetkiertikul et al. | Predicting components for issue reports using deep learning with information retrieval | |
JP6271379B2 (ja) | 気象予測誤差解析装置および気象予測誤差解析方法 | |
JP2017211785A (ja) | 質問応答生成装置、方法、及びプログラム | |
CN112766288B (zh) | 图像处理模型构建方法、装置、电子设备和可读存储介质 | |
CN106909894B (zh) | 车辆品牌型号识别方法和系统 | |
JP2011154469A (ja) | パターン抽出装置、パターン抽出方法及びプログラム | |
CN111199153A (zh) | 一种词向量的生成方法及相关设备 | |
Rahul et al. | Hilbert Huang transform and type-1 fuzzy based recognition and classification of power signal disturbances | |
JP5824429B2 (ja) | スパムアカウントスコア算出装置、スパムアカウントスコア算出方法、及びプログラム |