Робастная статистика
#
StatsBase.trim
— Function
trim(x::AbstractVector; prop=0.0, count=0)
Возвращает итератор всех элементов в x
, в котором пропускается либо число count
, либо доля prop
наибольших и наименьших элементов.
Количество усекаемых элементов может быть меньше указанного, если сразу несколько элементов равны нижней или верхней границе.
Для вычисления усеченного среднего для x
используйте вызов mean(trim(x))
; для вычисления дисперсии используйте trimvar(x)
(см. описание trimvar
).
Пример
julia> collect(trim([5,2,4,3,1], prop=0.2))
3-element Array{Int64,1}:
2
4
3
#
StatsBase.winsor
— Function
winsor(x::AbstractVector; prop=0.0, count=0)
Возвращает итератор всех элементов в x
, в котором либо число count
, либо доля prop
наибольших элементов заменена предыдущим по величине элементом и равное количество наименьших элементов — предыдущим наименьшим элементом. Количество заменяемых элементов может быть меньше указанного, если сразу несколько элементов равны нижней или верхней границе. Для вычисления винсоризованного среднего для x
используйте вызов mean(winsor(x))
.
Пример
julia> collect(winsor([5,2,3,4,1], prop=0.2))
5-element Array{Int64,1}:
4
2
3
4
2
#
StatsBase.trimvar
— Function
trimvar(x; prop=0.0, count=0)
Вычисляет дисперсию усеченного среднего для x
. Эта функция использует винсоризованную дисперсию, как описано в работе Уилкокса (2010).