Обработка данных методами непараметрической статистики требует тщательной подготовки исследователя в области использования математических методов. Для выбора конкретного метода статистического анализа и правильной интерпретации полученных результатов необходимо четкое понимание различий выборок с точки зрения нормальности распределения.
Для проверки нормальности распределения используются данные асимметрии, эксцесса, которые должны быть не более единицы, либо критерий Колмогорова-Смирнова, либо критерий Шапиро-Уилкса.
Любое исследование начинается с четкого формулирования проблемы и гипотезы, которая должна быть адресована ко всей генеральной совокупности. При этом научно обоснованный результат можно получить только при анализе выборочной совокупности, которая должна отвечать требованию репрезентативности, т.е. аналогичным образом повторять данные генеральной совокупности.
Математические модели в структуре научного исследования могут быть подразделены на три типа: измерительные математические модели, описательные математические модели и модели статистического вывода. При этом измерительные модели могут быть классифицированы в зависимости от типа шкал: номинальные, порядковые и количественные. Каждому типу данных соответствует своя группа аналитических методов, наибольшее разнообразие которых приходится на данные, измеренные в метрической (количественной) шкале.
Важно отметить, что в случае социологических исследований чаще всего используются номинальные данные, что резко сокращает возможность использования статистических методов. Данном случае для анализа данных применимы таблицы сопряженности, хи-квадрат, коэффициент сопряженности, коэффициенты Крамера, анализ частот и соответствия.
В случае количественных данных разнообразие типов описательных математических моделей и коэффициентов гораздо шире. Среди них можно упомянуть и анализ частот, и корреляционный анализ, и сравнительный анализ. Также приобретает смысл использования многомерных моделей. В случае небольшой выборки или нарушения требования нормальности распределения к метрическим данным могут быть применены непарамтерические критерии анализа, которые были перечислены выше.
При этом критерий U-Манна-Уитни и Н-Краскала-Уоллеса используется для сравнения выборок: первый в случае сравнения двух выборок, второй в случае сравнения выборок количеством больше двух. Коэффициенты корреляции Спирмена и тау-Кендалла позволяют выявить совместную изменчивость данных, распределение в которых не отвечает нормальному.
Преимуществом коэффициента тау-Кендалла является то, что совместную изменчивость признаков можно определить с точки зрения вероятности их появления, а не доли дисперсии. Критерии МакНемара и Т-Вилкоксона используются для сравнения двух зависимых выборок, которые не отвечают требованиям нормальности распределения. При этом критерий МакНемара действует для таблицы 2х2. Во всех случаях пороговое значение, которое разделяет статистически достоверные различия от статистически недостоверных, устанавливается на отметке 0,05.
С наилучшими пожеланиями, CEO&Founder Ольга Игнатьева