Перейти к основному содержимому
Перейти к основному содержимому

kolmogorovSmirnovTest

Применяет тест Колмогорова-Смирнова к выборкам из двух популяций.

Синтаксис

Значения обеих выборок находятся в колонке sample_data. Если sample_index равен 0, то значение в этой строке принадлежит выборке из первой популяции. В противном случае оно принадлежит выборке из второй популяции. Выборки должны принадлежать непрерывным одноразмерным вероятностным распределениям.

Аргументы

Параметры

  • alternative — альтернативная гипотеза. (Необязательный, по умолчанию: 'two-sided'.) Строка. Пусть F(x) и G(x) — это функции распределения первых и вторых распределений соответственно.
    • 'two-sided' Нулевая гипотеза заключается в том, что выборки происходят из одного и того же распределения, например, F(x) = G(x) для всех x. Альтернативная гипотеза заключается в том, что распределения не идентичны.
    • 'greater' Нулевая гипотеза заключается в том, что значения в первой выборке стохастически меньше, чем в второй, например, функция распределения первого распределения находится выше и, следовательно, левее второго. Это на самом деле означает, что F(x) >= G(x) для всех x. Альтернативная гипотеза в этом случае заключается в том, что F(x) < G(x) для по крайней мере одного x.
    • 'less'. Нулевая гипотеза заключается в том, что значения в первой выборке стохастически больше, чем во второй, например, функция распределения первого распределения находится ниже и, следовательно, правее второго. Это на самом деле означает, что F(x) <= G(x) для всех x. Альтернативная гипотеза в этом случае заключается в том, что F(x) > G(x) для по крайней мере одного x.
  • computation_method — метод, используемый для вычисления p-значения. (Необязательный, по умолчанию: 'auto'.) Строка.
    • 'exact' - вычисление выполняется с использованием точного распределения вероятностей статистики теста. Вычислительно интенсивно и неэффективно, за исключением небольших выборок.
    • 'asymp' ('asymptotic') - вычисление выполняется с использованием аппроксимации. Для больших размеров выборок точные и асимптотические p-значения очень схожи.
    • 'auto' - используется метод 'exact', когда максимальное количество выборок меньше 10'000.

Возвращаемые значения

Кортеж с двумя элементами:

  • вычисленная статистика. Float64.
  • вычисленное p-значение. Float64.

Пример

Запрос:

Результат:

Примечание: p-значение больше 0.05 (для уровня доверия 95%), поэтому нулевая гипотеза не отклоняется.

Запрос:

Результат:

Примечание: p-значение меньше 0.05 (для уровня доверия 95%), поэтому нулевая гипотеза отклоняется.

См. также