Документация Engee

Перекрестная проверка

Перекрестная проверка в ScikitLearn.jl аналогична проверке в scikit-learn:

julia> using ScikitLearn.CrossValidation: cross_val_score


julia> cross_val_score(LogisticRegression(max_iter=150), X, y; cv=5)  # 5-кратная
5-element Array{Float64,1}:
 0.9666666666666667
 1.0
 0.9333333333333333
 0.9666666666666667
 1.0

Подробные сведения см. в описании ?cross_val_score и руководстве пользователя.

Мы поддерживаем все итераторы перекрестной проверки scikit-learn (KFold, StratifiedKFold и т. д.) Например:

julia> ScikitLearn.CrossValidation.KFold(10, n_folds=3)
3-element Array{Tuple{Array{Int64,1},Array{Int64,1}},1}:
 ([5, 6, 7, 8, 9, 10], [1, 2, 3, 4])
 ([1, 2, 3, 4, 8, 9, 10], [5, 6, 7])
 ([1, 2, 3, 4, 5, 6, 7], [8, 9, 10])

Эти итераторы могут быть переданы аргументу cv функции cross_val_score.

Примечание. Наиболее распространенные итераторы были переведены на язык Julia. Для использования остальных по-прежнему требуется установить scikit-learn (python).

Прогнозы, прошедшие перекрестную проверку

cross_val_predict выполняет перекрестную проверку и возвращает спрогнозированные значения тестового набора. Документацию см. здесь.

Примеры