train
Описание
Выполняет обучение модели на входных данных. Результатом команды является идентификатор модели, который можно использовать в команде predict.
Синтаксис
| train <algorithm> [<params>] <input_fields>
Обязательные аргументы
к сведению
Поддерживаемые алгоритмы для обучения и параметры для них доступны в документации хранилища.
| Параметр | Синтаксис | Описание |
|---|---|---|
<algorithm> | <algorithm_name> | Название алгоритма для обучения, который поддерживают внутренние механизмы хранилища. |
<params> | <param> = <value> [<param> = <value>] | Параметры, необходимые для данного алгоритма. |
Опциональные аргументы
| Параметр | Синтаксис | Описание |
|---|---|---|
<input_fields> | fields = "field1, field2, ... | Список полей из входных данных, которые нужно передать в функцию train для обучения модели. |
<model_id> | model_id = "model_id" | Идентификатор, с которым модель сохранится в системе. |
<overwrite> | overwrite = true | Флаг, указывающий команде, нужно ли перезаписывать модель с переданным идентификатором, если такая уже существует. |
Примеры запросов
Пример 1
В данном примере модель kmeans обучается на заранее подготовленных бинарных признаках без явного указания model_id.
source user_operations_train
| peval operation_type_ssh=if(operation_type.keyword == "ssh_connect", 1, 0), operation_type_1c=if(operation_type.keyword == "1с_connect", 1, 0), operation_type_view_dashboard=if(operation_type.keyword == "view_dashboard", 1, 0), operation_type_gitlab=if(operation_type.keyword == "gitlab_connect", 1, 0)
| fields operation_type_ssh, operation_type_1c, operation_type_view_dashboard, operation_type_gitlab
| train kmeans centroids=4 distance_type=L1
Пример 2
В данном примере команда обучает ту же модель, но дополнительно сохраняет ее под явным идентификатором operations_type_model и передает список полей через fields.
source user_operations_train
| peval operation_type_ssh=if(operation_type.keyword == "ssh_connect", 1, 0), operation_type_1c=if(operation_type.keyword == "1с_connect", 1, 0), operation_type_view_dashboard=if(operation_type.keyword == "view_dashboard", 1, 0), operation_type_gitlab=if(operation_type.keyword == "gitlab_connect", 1, 0)
| train kmeans model_id = "operations_type_model" centroids=4 distance_type=L1 fields="operation_type_ssh, operation_type_1c, operation_type_view_dashboard, operation_type_gitlab"