Перекрестная проверка
Перекрестная проверка в ScikitLearn.jl аналогична проверке в scikit-learn:
julia> using ScikitLearn.CrossValidation: cross_val_score
julia> cross_val_score(LogisticRegression(max_iter=150), X, y; cv=5) # 5-кратная
5-element Array{Float64,1}:
0.9666666666666667
1.0
0.9333333333333333
0.9666666666666667
1.0
Подробные сведения см. в описании ?cross_val_score
и руководстве пользователя.
Мы поддерживаем все итераторы перекрестной проверки scikit-learn (KFold, StratifiedKFold и т. д.) Например:
julia> ScikitLearn.CrossValidation.KFold(10, n_folds=3)
3-element Array{Tuple{Array{Int64,1},Array{Int64,1}},1}:
([5, 6, 7, 8, 9, 10], [1, 2, 3, 4])
([1, 2, 3, 4, 8, 9, 10], [5, 6, 7])
([1, 2, 3, 4, 5, 6, 7], [8, 9, 10])
Эти итераторы могут быть переданы аргументу cv
функции cross_val_score
.
Примечание. Наиболее распространенные итераторы были переведены на язык Julia. Для использования остальных по-прежнему требуется установить scikit-learn (python).
Прогнозы, прошедшие перекрестную проверку
cross_val_predict
выполняет перекрестную проверку и возвращает спрогнозированные значения тестового набора. Документацию см. здесь.