Вычисляет взвешенную сумму массива A с весами w по измерению dim и сохраняет результат в R. При init=false сумма прибавляется к уже имеющемуся в R значению, а не к нулю.
Вычисляет взвешенную сумму массива A с весами w по измерению dim и сохраняет результат в R. При init=false сумма прибавляется к уже имеющемуся в R значению, а не к нулю.
Вычисляет взвешенное среднее значение для массива A с весовым вектором w (типа AbstractWeights). Если задан аргумент dim, вычисляет взвешенное среднее значение по измерению dims.
Примеры
n = 20
x = rand(n)
w = rand(n)
mean(x, weights(w))
Возвращает обобщенное/степенное среднее значение с экспонентой p для массива вещественных значений, то есть , где n = length(a). Оно считается геометрическим средним значением при p == 0.
Вычисляет дисперсию массива вещественных значений x по измерению dim (необязательно). Наблюдения x взвешиваются с использованием весового вектора w. Некорректированная (при corrected=false) выборочная дисперсия определяется следующим образом:
где — длина входных данных, а — среднее значение. Несмещенная оценка (при corrected=true) дисперсии генеральной совокупности вычисляется путем замены на коэффициент, зависящий от типа используемых весов:
AnalyticWeights:
FrequencyWeights:
ProbabilityWeights: , где равно count(!iszero, w)
Weights: ArgumentError (коррекция смещения не поддерживается)
Вычисляет среднеквадратичное отклонение для массива вещественных значений x по измерению dim (необязательно). Наблюдения x взвешиваются с использованием весового вектора w. Некорректированное (при corrected=false) выборочное среднеквадратичное отклонение определяется следующим образом:
где — длина входных данных, а — среднее значение. Несмещенная оценка (при corrected=true) среднеквадратичного отклонения генеральной совокупности вычисляется путем замены коэффициентом, зависящим от типа используемых весов:
AnalyticWeights:
FrequencyWeights:
ProbabilityWeights: , где равно count(!iszero, w)
Weights: ArgumentError (коррекция смещения не поддерживается)
Возвращает среднее значение и дисперсию для коллекции x. Если x является AbstractArray, в dim можно передать кортеж измерений, по которым необходимо вычислить статистику. Можно указать весовой вектор w для расчета взвешенных оценок. Наконец, при вычислении дисперсии применяется коррекция смещения, если corrected=true. Дополнительные сведения см. в описании функции var.
Возвращает среднее значение и среднеквадратичное отклонение для коллекции x. Если x является AbstractArray, в dim можно передать кортеж измерений, по которым необходимо вычислить статистику. Можно указать весовой вектор w для расчета взвешенных оценок. Наконец, при вычислении среднеквадратичного отклонения применяется коррекция смещения, если corrected=true. Дополнительные сведения см. в описании функции std.
Возвращает кумулянт порядка k для массива вещественных значений v; при необходимости можно указать весовой вектор wv и предварительно вычисленное среднее значение m.
Если k — это диапазон значений типа Integer, возвращаются все кумулянты порядков в этом диапазоне в виде вектора.
Это количество вычисляется с использованием рекурсивного определения на основе кумулянтов и центральных моментов более низких порядков.
Справочные материалы: Smith, P. J. 1995. A Recursive Formulation of the Old Problem of Obtaining Moments from Cumulants and Vice Versa. The American Statistician, 49(2), 217—218. https://doi.org/10.2307/2684642
Возвращает интервал коллекции, то есть диапазон minimum(x):maximum(x). Минимальное и максимальное значения x вычисляются за один проход с помощью extrema.
Возвращает коэффициент вариации для коллекции x; при необходимости можно указать предварительно вычисленное среднее значение m. Коэффициент вариации — это отношение среднеквадратичного отклонения к среднему значению.
Возвращает среднеквадратичную погрешность среднего значения для коллекции x. Можно указать предварительно вычисленное значение mean.
Если веса не используются, это (выборочное) среднеквадратичное отклонение, деленное на размер выборки. Если веса используются, дисперсия среднего значения выборки вычисляется следующим образом:
AnalyticWeights: не реализовано.
FrequencyWeights:
ProbabilityWeights:
Среднеквадратичная погрешность равна корню квадратному из приведенных выше величин.
Справочные материалы
Carl-Erik Särndal, Bengt Swensson, Jan Wretman (1992). Model Assisted Survey Sampling. New York: Springer, стр. 51—53.
Вычисляет медианное абсолютное отклонение (MAD) для коллекции x относительно center (по умолчанию относительно медианы).
Если аргумент normalize имеет значение true, MAD умножается на 1 / quantile(Normal(), 3/4) ≈ 1.4826 с целью получения согласованной статистической оценки среднеквадратичного отклонения с тем предположением, что данные имеют нормальное распределение.
Вычисляет медианное абсолютное отклонение (MAD) для массива x относительно center (по умолчанию относительно медианы), перезаписывая x в ходе выполнения. В массиве x должны помещаться значения, генерируемые в результате вызова middle для его элементов (например, целочисленный вектор не подходит, так как middle может возвращать нецелочисленные значения).
Если аргумент normalize имеет значение true, MAD умножается на 1 / quantile(Normal(), 3/4) ≈ 1.4826 с целью получения согласованной статистической оценки среднеквадратичного отклонения с тем предположением, что данные имеют нормальное распределение.
Вычисляет Z-оценки для X; при необходимости можно указать предварительно вычисленное среднее значение μ и среднеквадратичное отклонение σ. Z-оценка — это количество (со знаком) среднеквадратичных отклонений выше среднего значения для наблюдения, то есть .
μ и σ должны быть одновременно либо скалярами, либо массивами. Вычисление транслируется. В частности, если μ и σ — массивы, они должны быть одного размера и для каждого измерения должно выполняться условие size(μ, i) == 1 || size(μ, i) == size(X, i).
Вычисляет Z-оценки для массива X со средним значением μ и среднеквадратичным отклонением σ. Z-оценка — это количество (со знаком) среднеквадратичных отклонений выше среднего значения для наблюдения, то есть .
Если задан конечный массив Z, оценки будут сохраняться в Z и он должен иметь ту же форму, что и X. В противном случае X перезаписывается.
Вычисляет энтропию для коллекции вероятностей p; при необходимости можно указать вещественное число b, чтобы масштабировать энтропию на 1/log(b). Элементы с вероятностью 0 или 1 прибавляют 0 к энтропии.
Вычисляет расстояние Кульбака-Лейблера от q до p, которое также называется относительной энтропией p по отношению к q, то есть сумму pᵢ * log(pᵢ / qᵢ). При необходимости можно указать вещественное число b, чтобы масштабировать расстояние на 1/log(b).
Вычисляет взвешенные квантили вектора v с указанным множеством значений вероятности p с использованием весов, заданных в весовом векторе w (типа AbstractWeights). Веса не должны быть отрицательными. Векторы весов и данных должны быть одинаковой длины. Если x содержит хотя бы одно значение NaN, возвращается NaN. Ошибка выдается в случае, если w содержит хотя бы одно значение NaN.
При использовании FrequencyWeights функция возвращает тот же результат, что и quantile для вектора с повторяющимися значениями. Веса должны быть целыми числами.
При использовании типа, отличного от FrequencyWeights, обозначает длину вектора, — вектор весов, — суммарный вес, соответствующий вероятности , — суммарный вес для каждого наблюдения, а определяет наименьший элемент v такой, что строго выше . Взвешенный квантиль задается как с . В частности, когда все веса равны, функция возвращает тот же результат, что и невзвешенная функция quantile.
Вычисляет позицию квантиля в интервале [0, 1] для value относительно коллекции itr.
С помощью именованного аргумента method можно выбрать одно из нескольких определений. Допустим, count_less — это количество элементов в itr со значением меньше value, count_equal — количество элементов в itr со значением, равным value, n — длина itr, greatest_smaller — наибольшее значение меньше value, а smallest_greater — наименьшее значение больше value. Тогда method поддерживает следующие определения.
:inc (по умолчанию): возвращает значение в диапазоне от 0 до 1 включительно.
Возвращает count_less / (n - 1), если value ∈ itr; в противном случае применяет интерполяцию на основе определения 7 квантиля из классификации Хиндмана-Фана (1996) (эквивалентно PERCENTRANK и PERCENTRANK.INC в Excel). Это определение соответствует нижнему полунепрерывному обращению quantile с параметрами по умолчанию.
:exc: возвращает значение в диапазоне от 0 до 1 не включительно.
Возвращает (count_less + 1) / (n + 1), если value ∈ itr; в противном случае применяет интерполяцию на основе определения 6 квантиля из классификации Хиндмана-Фана (1996) (эквивалентно PERCENTRANK.EXC в Excel).
:compete: возвращает count_less / (n - 1), если value ∈ itr; в противном случае
возвращает (count_less - 1) / (n - 1) без интерполяции (эквивалентно PERCENT_RANK в MariaDB, percent_rank в dplyr).
:tied: возвращает (count_less + count_equal/2) / n без интерполяции
на основе определения из работы Роскоу Дж. Т. (1975) (эквивалентно виду "mean" функции percentileofscore в SciPy).
:strict: возвращает count_less / n без интерполяции
(эквивалентно виду "strict" функции percentileofscore в SciPy).
:weak: возвращает (count_less + count_equal) / n без интерполяции
(эквивалентно виду "weak" функции percentileofscore в SciPy).
Ошибка ArgumentError происходит в случае, если itr содержит значения NaN или missing либо если itr содержит меньше двух элементов.
Возвращает моду (наиболее часто встречающееся число) массива; при необходимости можно указать диапазон r или весовой вектор wv. Если мод несколько, возвращается первая встретившаяся.
Вычисляет сводную статистику для массива вещественных значений a. Возвращает объект SummaryStats, содержащий среднее значение, минимальное значение, 25-й перцентиль, медиану, 75-й перцентиль и максимальное значение.